高通针对大模型的量化方法适配性

chenfeng0232 2025-03-12 14:56:48

请问,针对目前大模型(qwen系列)量化方法,目前高通支持的情况如何了呢,如想在高通平台上,快速验证某一种新的量化方法,是否可以通过生成encoding文件来验证呢。或者说,能否不借助AIMET来生成,自定义encoding文件也能搞定。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

...全文
419 2 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
  • 打赏
  • 举报
回复

高通平台支持qwen的量化方法。
理论上不用AIMET来量化,用Encoding来量化也是可以的。

  • 举报
回复
@weixin_38498942 非常感谢你的回答,请问一下,现在若高通AIMET集成的gptq量化方法,导出encoding,在应用的时候, snpe-dlc-quantizer 需要注意配置那些参数吗?目前我用的是snpe-dlc-quantize --input_dlc /Qwen2.5-0.5B-Instruct-old/dlc/qwen-0.5.dlc --output_dlc /Qwen2.5-0.5B-Instruct-old/dlc/qwen-0.5-quant.dlc --input_list /Qwen2.5-0.5B-Instruct-old/raw_input.txt --enable_htp --act_bitwidth 16 --enable_htp --htp_socs qcs6490 --override_params 导出encoding 文件中包括 "quantizer_args": { "activation_bitwidth": 8, "dtype": "int", "is_symmetric": true, "param_bitwidth": 4, "per_channel_quantization": true, "quant_scheme": "post_training_tf_enhanced"

3,012

社区成员

发帖
与我相关
我的任务
社区描述
本论坛以AI、WoS 、XR、IoT、Auto、生成式AI等核心板块组成,为开发者提供便捷及高效的学习和交流平台。 高通开发者专区主页:https://qualcomm.csdn.net/
人工智能物联网机器学习 技术论坛(原bbs) 北京·东城区
社区管理员
  • csdnsqst0050
  • chipseeker
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧