请问,针对目前大模型(qwen系列)量化方法,目前高通支持的情况如何了呢,如想在高通平台上,快速验证某一种新的量化方法,是否可以通过生成encoding文件来验证呢。或者说,能否不借助AIMET来生成,自定义encoding文件也能搞定。
高通平台支持qwen的量化方法。理论上不用AIMET来量化,用Encoding来量化也是可以的。
3,012
社区成员
5,791
社区内容
加载中
试试用AI创作助手写篇文章吧