949
社区成员
发帖
与我相关
我的任务
分享
我正在使用 QuantSim API 从 pytorch 转换模型。当我导出模型时,我看到量化工件文件(例如正在生成的编码)。然而,有很多警告表明某些 pytorch 层未映射到 AIMET。我们是否有一个 API 可以让我们检查给定的模型哪些层可以/不能量化?
我建议尝试使用最新版本的 AIMET - 例如发布版本 1.16.1 · quic/aimet · GitHub 1
我们最近更改了 PyTorch 层名称映射到 ONNX 的方式,这可能对您的场景有所帮助。
除此之外,当 sim 是 QuantizationSimModel 类的实例时,您可以只执行“print(sim)”。这将为您提供一个很好的报告,显示哪些层分配了量化包装器以及启用/禁用了哪些量化器等。