Whisper模型QNN推理安卓实现

_方落落_ 2025-05-20 15:46:02

按照官方开源实现了 https://github.com/quic/qidk/tree/master/Solutions/NLPSolution3-AutomaticSpeechRecognition-Whisper

测试高通whisper模型snpe加载在QCS6490上延迟还比较高，一次推理需要耗时250ms左右。高通github社区是否可以提供whisper 模型在qnn推理实现的apk demo?

另外目前whisper decode模型没有在TfLite delegate上启用推理加速，TfLite delegate是否可以在QCS6490上支持HTP加速，是否提供示例？

...全文

275 3 打赏收藏转发到动态举报

写回复

3 条回复

切换为时间正序

请发表友善的回复…

发表回复

weixin_38498942 05-22

打赏
举报

回复

我做过whisper 转成qnn，在8550 htp上跑过，6490不确定

_方落落_ 05-22

举报

回复

@weixin_38498942 感谢回复！请问是否可以更新下demo到qidk的solution。6490关于whisper qnn native的支持我也向formus论坛提出相关的讨论，但是高通目前似乎没有计划提供whisper qnn实现参考，请问下您这边有什么建议？

weixin_38498942 08-06

举报

回复

@_方落落_ 可以等高通官方后续更新

对于在windows与cpu下，对whisper语音模型进行微调，并进行评估，推理。针对在微调与推理过程中出现的错误，已经在本文中有相关解决方法。按照文件中所给数据集的形式，可以根据自身需求对自己的数据进行处理，放到...

OpenAI的Whisper自动语音识别（ASR）模型的高性能推理：无依赖关系的纯C/C++实现 Apple Silicon一流公民-通过ARM NEON、Accelerate框架、Metal和Core ML进行优化对x86体系结构的AVX内部支持对POWER体系结构...

Faster-Whisper使用CTranslate2重新实现了OpenAI的Whisper模型，CTranslate2是Transformer模型的快速推理引擎。这种实现比openai/whisper在使用更少内存的情况下达到相同精度的4倍。对于需要高效Transformer模型推理...

infer_tfs.py：使用transformers直接调用微调后的模型或者Whisper原模型预测，只适合推理短音频。 infer_ct2.py：使用转换为CTranslate2的模型预测，主要参考这个程序用法。 infer_gui.py：有GUI界面操作，使用转换...

ggml-tiny.bin 是 Whisper 语音识别模型的一个轻量级版本，基于 GGML 格式（一种为 CPU 优化的量化模型格式）。以下是详细说明： 1. 模型背景 Whisper 是 OpenAI 开源的自动语音识别（ASR）系统，支持多语言转录和...

高通开发者论坛

5,380

社区成员

5,923

社区内容

发帖

与我相关

我的任务

人工智能物联网机器学习技术论坛（原bbs）北京·东城区

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章