Qwen2.5-7B-Instruct的权重在何处下载

weixin_38817016 2026-01-21 11:18:47

请问  https://aihub.qualcomm.com/models/qwen2_5_7b_instruct?tags=generative-ai   

Qwen2.5-7B-Instruct的权重在何处下载,还是只能自行导出?

...全文
37 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
  • 打赏
  • 举报
回复

目前没有直接可以使用的Qwen2.5-7B-Instruct。遵循一下示例进行转换
https://github.com/quic/ai-hub-apps/tree/main/tutorials/llm_on_genie

资源下载链接为: https://pan.xunlei.com/s/VOZ0nlL9YELBYi0pJT1h_1DiA1?pwd=q3xt 一个月前,我们发布了Qwen系列首款数学大模型Qwen2-Math,如今已完成升级并开源Qwen2.5-Math系列,包含基础模型Qwen2.5-Math-1.5B/7B/72B、指令微调模型Qwen2.5-Math-1.5B/7B/72B-Instruct,以及数学奖励模型Qwen2.5-Math-RM-72B。 不同于仅支持用思维链(CoT)解决英文数学题的Qwen2-Math,Qwen2.5-Math系列新增工具集成推理(TIR)能力,且支持中英双语解题。在中英数学基准测试中,该系列用CoT解题的表现较前代显著提升,具体性能可参考相关博客。需注意,Qwen2.5-Math主要用于通过CoT和TIR解决中英数学问题,不建议用于其他任务,且需使用推荐的最新版本(因已集成Qwen2代码),其GPU内存与吞吐量要求可参考Qwen2的类似数据。 快速上手方面,Qwen2.5-Math-72B-Instruct为对话用指令模型,Qwen2.5-Math-72B为基础模型,适用于少样本推理及作为微调起点。它可按Qwen2.5的方式通过Hugging Face Transformers部署推理,数学奖励模型Qwen2.5-Math-RM-72B也可借此工具轻松推理。需注意,Qwen2.5-Math-Instruct的maj@8和RM@8采样参数,与Qwen2-Math-Instruct不同。此外,国内用户推荐用ModelScope以解决模型权重下载问题,还可通过Qwen-Agent本地演示体验TIR功能。 性能上,基础模型在GSM8K、Math等英文基准及CMATH、高考数学填空等中文基准的少样本CoT测试中,较前代均有提升;指令微调模型在更多高
资源下载链接为: https://pan.xunlei.com/s/VOZ1fA4H2BUXgI8p41Sm5aLqA1?pwd=jzjm Smoothie Qwen 是一款轻量级调整工具,可平滑 Qwen 及同类模型的令牌概率,增强平衡的多语言生成能力,避免对特定语言过度倾斜。目前已上传预先调整的模型,涵盖 Smoothie Qwen3 系列(如 dnotitia/Smoothie-Qwen3-0.6B、1.7B、4B 等,最高至 235B 参数模型)与 Smoothie Qwen2.5 系列(如 Smoothe-Qwen2.5-3B-指导动态、7B 等,最高至 72B 参数模型),可直接集成到项目中。 权重平滑按公式计算缩放因子 S(结合 min_scale、平滑度、目标语言生成概率),再乘以原始令牌权重。实验用 Qwen2.5-Coder-14B-Instruct 验证,以自定义中文启发数据集(测中文抑制率)和 KMMLU 韩语基准(测中文抑制率与任务准确性)评估,结果显示:调整 min_scale 可提升抑制率(低至 95% 中文抑制且性能稳定),提高平滑度能增强抑制效果(平滑度=10.0 即可达标);定性示例中,平滑模型面对中文生成提示,多数情况能抑制中文输出,且代码生成等核心功能无明显退化。 结论是,Smoothie Qwen 能减少 95% 以上意外中文生成并保留核心功能,推荐配置为基础 N-gram 分析(n=2),用户可按需调整窗口大小至 3-4。需注意,修改模型权重后建议验证性能,Unicode 范围可自定义以抑制其他语言,未来或支持更多分析方法。

6,677

社区成员

发帖
与我相关
我的任务
社区描述
本论坛以AI、WoS 、XR、IoT、Auto、生成式AI等核心板块组成,为开发者提供便捷及高效的学习和交流平台。 高通开发者专区主页:https://qualcomm.csdn.net/
人工智能物联网机器学习 技术论坛(原bbs) 北京·东城区
社区管理员
  • csdnsqst0050
  • chipseeker
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧