大模型Agent(Deepseek)理论与工业落地实战-本课程长期更新
社区首页 (3643)
请编写您的帖子内容
社区频道(2)
显示侧栏
卡片版式
AIGC大模型理论与工业落地实战
AIGC大模型高级进阶和工业落地(本课程持续更新)
最新发布
最新回复
标题
阅读量
内容评分
精选

1379
评分
3
大模型Agent(Deepseek)理论与工业落地实战-本课程长期更新
课程名称适应人群大模型Agent(Deepseek)理论与工业落地实战-本课程长期更新有意从事大模型开发的朋友有意从事人工智能领域工作的朋友算法从业者、研究者本课程根据目前主流大模型、Deepseek以及Agent算法前沿和工业落地的需要,由浅入深讲
复制链接 扫一扫
分享

25
评分
回复
MTP3-Deepseek-MTP的代码讲解
课时名称课时知识点MTP3-Deepseek-MTP的代码讲解MTP3-Deepseek-MTP的代码讲解MTP3-Deepseek-MTP的代码讲解
复制链接 扫一扫
分享

39
评分
回复
MTP2-Deepseek-MTP的原理讲解
课时名称课时知识点MTP2-Deepseek-MTP的原理讲解MTP2-Deepseek-MTP的原理讲解MTP2-Deepseek-MTP的原理讲解MTP2-Deepseek-MTP的原理讲解
复制链接 扫一扫
分享

36
评分
回复
MTP1-Multi-Token-Predict算法的起源和思想
课时名称课时知识点MTP1-Multi-Token-Predict算法的起源和思想MTP1-Multi-Token-Predict算法的起源和思想MTP1-Multi-Token-Predict算法的起源和思想
复制链接 扫一扫
分享

32
评分
回复
MLA5-代码逐行解析3-公式代码推演如何巧妙节省显存
课时名称课时知识点MLA5-代码逐行解析3-公式代码推演如何巧妙节省显存MLA5-代码逐行解析3-公式代码推演如何巧妙节省显存MLA5-代码逐行解析3-公式代码推演如何巧妙节省显存
复制链接 扫一扫
分享

29
评分
回复
MLA4-代码逐行解析2-低秩核心代码逐行解析
课时名称课时知识点MLA4-代码逐行解析2-低秩核心代码逐行解析MLA4-代码逐行解析2-低秩核心代码逐行解析MLA4-代码逐行解析2-低秩核心代码逐行解析
复制链接 扫一扫
分享

29
评分
回复
MLA3-代码逐行解析1-MHA和MLA的本质区别
课时名称课时知识点MLA3-代码逐行解析1-MHA和MLA的本质区别MLA3-代码逐行解析1-MHA和MLA的本质区别MLA3-代码逐行解析1-MHA和MLA的本质区别
复制链接 扫一扫
分享

36
评分
回复
MLA2-MHA,MQA,GQA简介和显存占用机制
课时名称课时知识点MLA2-MHA,MQA,GQA简介和显存占用机制MLA2-MHA,MQA,GQA简介和显存占用机制MLA2-MHA,MQA,GQA简介和显存占用机制MLA2-MHA,MQA,GQA简介和显存占用机制
复制链接 扫一扫
分享

28
评分
回复
MLA1-KV-Cache和模型推理访存占用
课时名称课时知识点MLA1-KV-Cache和模型推理访存占用MLA1-KV-Cache和模型推理访存占用MLA1-KV-Cache和模型推理访存占用MLA1-KV-Cache和模型推理访存占用
复制链接 扫一扫
分享

22
评分
回复
理论-Deepseek-V3技术报告解读
课时名称课时知识点理论-Deepseek-V3技术报告解读Deepseek-V3技术报告解读,详细介绍Deepseek系列模型涉及到的相关技术和算法
复制链接 扫一扫
分享

50
评分
回复
2-致敬:BERT的思考总结和收获展望
课时名称课时知识点2-致敬:BERT的思考总结和收获展望本章共两个课时,介绍bert的发展历史和实际应用,介绍bert的优缺点和展望
复制链接 扫一扫
分享

74
评分
回复
LLM-高阶Attention3-线性Attention数学表达
课时名称课时知识点LLM-高阶Attention3-线性Attention数学表达LLM-高阶Attention3-线性Attention数学表达123
复制链接 扫一扫
分享

61
评分
回复
Mxitral-MOE理论-论文解读与公式推导
课时名称课时知识点Mxitral-MOE理论-论文解读与公式推导Mxitral-MOE理论-论文解读与公式推导1
复制链接 扫一扫
分享
830
评分
回复
Mixtral-MOE工业落地4-基于llama-cpp的API部署
课时名称课时知识点Mixtral-MOE工业落地4-基于llama-cpp的API部署Mixtral-MOE工业落地4-基于llama-cpp的API部署1
复制链接 扫一扫
分享
34
评分
回复
Mixtral-MOE工业落地3-微调后llama-cpp编译和量化
课时名称课时知识点Mixtral-MOE工业落地3-微调后llama-cpp编译和量化Mixtral-MOE工业落地3-微调后llama-cpp编译和量化1
复制链接 扫一扫
分享

265
评分
回复
Mixtral-MOE工业落地2-LORA参数融合和API部署调用
课时名称课时知识点Mixtral-MOE工业落地2-LORA参数融合和API部署调用Mixtral-MOE工业落地2-LORA参数融合和API部署调用1
复制链接 扫一扫
分享

48
评分
回复
Mixtral-MOE工业落地1-AutoDL平台使用和专家模型训练
课时名称课时知识点Mixtral-MOE工业落地1-AutoDL平台使用和专家模型训练Mixtral-MOE工业落地1-AutoDL平台使用和专家模型训练1
复制链接 扫一扫
分享

44
评分
回复
Mixtral-MOE代码逐行调试4-专家自注意力机制+专家loss
课时名称课时知识点Mixtral-MOE代码逐行调试4-专家自注意力机制+专家lossMixtral-MOE代码逐行调试4-专家自注意力机制+专家loss1
复制链接 扫一扫
分享

43
评分
回复
Mixtral-MOE代码逐行调试3-专家赋值+专家能力+专家处理
课时名称课时知识点Mixtral-MOE代码逐行调试3-专家赋值+专家能力+专家处理Mixtral-MOE代码逐行调试3-专家赋值+专家能力+专家处理1
复制链接 扫一扫
分享

442
评分
回复
Mixtral-MOE代码逐行调试2-门控机制+张量流动+路径变换
课时名称课时知识点Mixtral-MOE代码逐行调试2-门控机制+张量流动+路径变换Mixtral-MOE代码逐行调试2-门控机制+张量流动+路径变换1
复制链接 扫一扫
分享

50
评分
回复
Mixtral-MOE代码逐行调试1-专家模型介绍+调试思路
课时名称课时知识点Mixtral-MOE代码逐行调试1-专家模型介绍+调试思路Mixtral-MOE代码逐行调试1-专家模型介绍+调试思路1
复制链接 扫一扫
分享
为您搜索到以下结果: