社区
CSDN技术会议的课程社区_NO_3
2025 4月全球机器学习技术大会-上海站
帖子详情
冯张驰-LLaMA Factory多模态LLM高效微调原理与实践
m0_74120090
2025-04-23 14:55:07
课时名称
课时知识点
冯张驰-LLaMA Factory多模态LLM高效微调原理与实践
LLaMA Factory核心开发者 LLaMA Factory 是一个统一的大模型微调框架,旨在简化和加速对 100 多种LLM的微调过程。我们将介绍其与多模态相关的核心功能、技术栈、以及在实际应用中的表现,帮助与会者理解如何利用这一框架提升多模态LLM的训练效率与推理性能。
...全文
29
回复
打赏
收藏
冯张驰-LLaMA Factory多模态LLM高效微调原理与实践
课时名称课时知识点冯张驰-LLaMA Factory多模态LLM高效微调原理与实践LLaMA Factory核心开发者 LLaMA Factory 是一个统一的大模型微调框架,旨在简化和加速对 100 多种LLM的微调过程。我们将介绍其与多模态相关的
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
杨强院士领衔,2025 全球机器学习技术大会正式官宣!
肖涵,Jina AI 创始人及 CEO 高性能视觉语言模型的训练及其在文档搜索中的应用
冯张
驰
,
LLaMA
Factory
核心开发者、北京航空航天大学硕士
LLaMA
Factory
多模态
LLM
高效
微调
原理
与
实践
宋欢,快手大模型算法专家 ...
Agent、DeepSeek、
多模态
热点炸场!60+重磅嘉宾共探AI未来,2025全球机器学习技术大会完美收官!
在这一背景下,本次大会以全球视角聚焦 AI 最前沿的发展趋势,围绕大语言模型技术演进、AI Agent
实践
、具身智能、
多模态
生成、DeepSeek 技术解析等 12 大专题展开深入探讨,与海内外一线科技公司与高校机构的专家...
51c大模型~合集92
值得注意的是,由于选择了重要的层进行更新,插件的性能可以超过直接在
LLM
上进行
微调
的性能,这得益于稀疏训练带来的更好收敛性。因此,研究团队选择了对仿真器中的 MHSA 层进行秩压缩的策略。
51c大模型~合集12
本文探讨了新颖的基于
LLM
的多智能体框架中潜在的知识传播风险。为此,本文针对
LLM
对世界知识认知的脆弱性提出了一种两阶段的攻击框架,通过说服性植入和编造知识植入,使得被操纵的智能体在没有外部提示的情况下能够...
51c大模型~合集139
该研究的主要贡献是一组名为 PixMo 的新数据集,其中包括一个用于预训练的高精度图像字幕数据集、一个用于
微调
的自由格式图像问答数据集以及一个创新的 2D 指向数据集,所有这些数据集均无需使用外部 VLM 即可收集。...
CSDN技术会议的课程社区_NO_3
1
社区成员
59
社区内容
发帖
与我相关
我的任务
CSDN技术会议的课程社区_NO_3
复制链接
扫一扫
分享
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章