高通的DSP Hexagon V75 中的什么限制,导致 Llama v2 7B 量化模型需要拆分成 8 个 Bin 文件?
这与Hexagon的DSP中的地址空间限制有关。未来我们希望将来能从用户那里抽象出来,但现在我们必须手动管理这些拆分。
1,100
社区成员
5,502
社区内容
加载中
试试用AI创作助手写篇文章吧