3,773
社区成员




您好,请问一下,我在用aimet的gptq,导出qwen系列的encoding,在模型转换后,在高通芯片DSP运行,效果很差,输出都是乱码,请问用aimet进行量化,是否能够用于大语言模型。针对用AIMET量化,请问在针对大模型量化时,有什么好实现方式吗?
aimet可以用在LLM上,高通官网有个notebook,里面就是用aimet进行量化的,但是效果确实不太好,但是也能正常吐字。
AIMET的主要作用是用于量化感知训练, 相当于你有对应的语料对模型进行重新的训练, 如果准确性下降了, 看一下训练的结果是否已经收敛了.