2,861
社区成员




请问一下,采用AIMET量化大语言模型,采用其GPTQ,只能导出param_encodings,和部分的activation_encodings算子。比如Mul_output_0,Add_output_0,但是softmax,Sub,Concat_output_0等算子并没有相应的量化因子。
在使用AIMET的GPTQ方法量化大语言模型时,部分算子(如softmax
、Sub
、Concat_output_0
)没有相应的量化因子,可能由以下几种原因导致,下面为你分析并给出对应的解决办法:
softmax
)在数值计算和功能上存在特殊性,使得直接量化可能会对模型的性能造成显著影响,所以这些算子可能不在默认的量化范围内。