3,447
社区成员




在使用qnn-onnx-converter进行量化操作时,input_list.txt中的raw文件,是否与模型推理时的输入一致的呢?
layout是NCHW还是NHWC?是否需要进行归一化操作?模型量化后,精度与f32的模型相差很大,找不到具体的原因在哪里
qnn-onnx-converter默认输入是fp32,默认会帮你做nchw->nhwc
input_list.txt中的raw文件, 他的排列(NCHW/NHWC) 是需要和原始模型是一致的, 另外如果原模型推理的时候需要进行归一化, 那么我们需要对raw文件先进行归一化.
可以找到具体哪一层的输出不一致, 找到量化和非量化模型输出的差异.