3,770
社区成员




若不能,是必须借助qualcomm提供的量化工具,进行量化后,才能实现模型转换和部署吗
是的, 目前从huggingface 下载的模型大部分都是fp32的, 然后需要高通的工具进行量化. 方法是在QPM的"AI stack"中有个"Qualcomm Genrative AI Tutorials" 有对应的模型量化代码, 目前llama2/3 和stable diffusion都是可以转的, 其他的模型的量化需要改这个代码来实现其他模型的量化, 可以量化为int8/int4之后可以放到高通DSP上运行.