WoS平台可以使用微软的onnxruntime进行模型推理吗？能通过SNPE或QNN SDK使用NPU进行加速吗？

阿斯兰查拉 2024-10-28 10:13:03

WoS平台可以使用微软的onnxruntime进行模型推理吗？能通过SNPE或QNN SDK使用NPU进行加速吗？

...全文

859 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

weixin_38498942 2024-10-29

打赏
举报

回复

WoS平台是可以使用微软的onnxruntime来进行模型推理的，并且onnxruntime提供了C/C和python接口。通常情况下，使用onnxruntime进行的模型推理是在CPU上进行的。目前，onnxruntime不支持通过SNPE SDK使用底层硬件（通常为DSP/NPU等）进行加速，但支持通过QNN SDK使用底层硬件进行加速。
onnxruntime中有一个抽象模块（亦可称之为抽象层）叫ExecutionProvider，硬件平台要想加速模型的推理，就需要在硬件平台对应的Runtime SDK的基础上实现对应的ExecutionProvider。onnxruntime本身已在高通的QNN SDK的基础上实现了QNNExecutionProvider，通过它模型的推理就可以在相关的硬件上进行加速。
集成有QNNExecutionProvider的onnxruntime库既可以直接从官方网上下载——进入微软网站（ORT-Nightly - Azure Artifacts (visualstudio.com）并搜索关键字Microsoft.ML.OnnxRuntime.QNN，点击其进入下载页面下载即可，注意它是个NuGet包需要安装，并且其已经携带了相应版本的QNN SDK的库文件；另外，也可以自己下载onnxruntiem源码，并使用本机上已经安装了的QNN SDK进行编译，包括C/C++动态库的编译及相应python接口的编译。

DirectML作为Windows Copilot Runtime的一个关键基础组件，简化了开发人员如何通过一个跨硬件的DirectX API来扩展其AI创新，该API提供安全、一致和高性能，适用于各种硬件架构。通过此开发者预览版本，DirectML针对新的Snapdragon X系列设备的NPU，并运行为NPU加速优化的机器学习模型。Qualcomm Hexagon NPU在DirectML中的支持仍在进行中，我们渴望听取您的反馈，并从您的经验中学习。这些是错误消息，将在未来的版本中修复。

基于YOLOV5模型的目标检测DEMO是一个基于SNPE SDK/QNN SDK+QAI AppBuilder开发的、使用了NPU模块加速yolov5模型（yolov5l.pt）推理的、能够对本地图片文件和USB摄像头实时视频进行80分类目标检测的AI应用程序。其中使用SNPE SDK开发的DEMO使用是C++语言，使用QNN SDK/QAI AppBuilder开发的DEMO使用的是python语言。

ONNX Runtime (ORT) 是一款跨平台机器学习模型加速器，具有灵活的接口，可集成特定于硬件的库（称为执行提供程序 (EP)）。Snapdragon X 平台允许将 NPU 加速为 QNN-EP、将 GPU 加速为 DML-EP、将 CPU 加速为 CPU-EP。此外，ONNX Runtime 可与 PyTorch、TensorFlow/Keras、TensorFlow Lite、scikit-learn 和其他框架中的模型一起使用。以下资源提供了后续步骤的详细信息。

本节演示了如何使用ONNX Runtime (ORT) 和QNN作为执行提供者(EP)来加速在专门设计用于处理神经网络的Hexagon Tensor Processor (HTP)上的工作负载。QNN EP还提供了一个CPU后端，可用于在Qualcomm® Oryon™ CPU上以FP32精度运行AI工作负载。

DirectML EP 是一款功能强大且用途广泛的工具，旨在加速各种硬件平台上的机器学习工作负载。通过利用 DirectML 的功能，开发人员可以优化他们的机器学习模型，使其在不同类型的处理单元（包括 GPU、NPU 以及通过 WebNN 实现的基于 Web 的应用程序）上高效运行。这种灵活性可确保机器学习应用程序能够实现高性能和可扩展性，而不管底层硬件如何。DirectML EP 与流行的机器学习框架无缝集成，提供一致且高性能的执行环境。它抽象了硬件特定优化的复杂性，使开发人员可以专注于模型开发和部署。

高通开发者论坛

4,819

社区成员

5,889

社区内容

发帖

与我相关

我的任务

人工智能物联网机器学习技术论坛（原bbs）北京·东城区

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章