2,853
社区成员




我想知道AIMET量化修剪模型的最佳策略是什么?或者也许执行模型压缩和量化的正确程序将创建具有最佳精度的模型(是否可以使用 AIMET API 修剪量化模型?)
您应该在剪枝后首先对模型进行微调,在剪枝移除过滤器后模型会发生什么情况,其中特征图被移除以及模型被破坏,您需要对它们进行微调 10-15 个时期,它可以更新量化所需的统计信息。 使用张量分解“svd here”,您可以增加模型的深度,这就是您的推理时间增加的原因,解决这个问题的方法看起来更深入到您要为其部署模型的硬件,并且您可以简单地通过以下方式改进推理时间了解从计算图生成的 IR 是如何编译的,并且很容易解决。