在 AI Edge Box 上跑视频结构化分析，如何把 Qualcomm 硬件解码后的帧直接送入 NPU，不经过 CPU 内存拷贝？

少年阿炳哥 2026-03-19 15:42:38

在 AI Edge Box 上跑视频结构化分析，如何把 Qualcomm 硬件解码后的帧直接送入 NPU，不经过 CPU 内存拷贝？

...全文

32 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

weixin_38498942 03-19 16:05

打赏
举报

回复

利用高通平台的 ION/DMA-BUF 共享内存机制实现零拷贝：
1）视频解码器（如 V4L2 或 GStreamer qtivdec）输出的帧存储在 DMA-BUF fd 中；
2）将该 fd 直接传给 QNN API 作为输入 tensor 的 backing memory，NPU 通过 SMMU 直接访问；
3）在 GStreamer 管线中可用 appsink 获取 DMA-BUF 引用后调用推理，全程不触发 CPU 侧的 memcpy。需确保解码输出格式（如 NV12）与模型输入预期一致，否则需在 GPU 上做轻量格式转换。

关注+星标公众号，不错过精彩内容直接来源 | 电子工程世界2024年上半年，PC市场迎来了难得的回暖。根据IDC的数据，包括台式机、笔记本电脑和工作站在内的设备，第二季度总出货量达到了6490万台，同比增长3%，增速为第一季度的两倍，实现回暖的其中一个关键因素就是AI PC的大热。何为AI PC？英特尔CEO帕特基辛格给出的答案是：能够玩转AI功能的PC，可通过云与PC的紧密协作，或在电脑端独立...

CPU,GPU,TPU,NPU都是什么？什么是CPU? 中央处理器（CPU），是电子计算机的主要设备之一，电脑中的核心配件。其功能主要是解释计算机指令以及处理计算机软件中的数据。CPU是计算机中负责读取指令，对指令译码并执行指令的核心部件。中央处理器主要包括两个部分，即控制器、运算器，其中还包括高速及实现它们缓冲处理器之间联系的数据、控制的总线。电子计算机三大核心部件就是CPU、内部存储...

随着AI的广泛应用，深度学习已成为当前AI研究和运用的主流方式。面对海量数据的并行运算，AI对于算力的要求不断提升，对硬件的运算速度及功耗提出了更高的要求。目前，除通用CPU外，作为硬件加速的GPU、NPU、FPGA等一些芯片处理器在深度学习的不同应用中发挥着各自的优势，但孰优孰劣？以人脸识别为例，其处理基本流程及对应功能模块所需的算力分布如下：为什么会有这样的应用区分？意义在哪里？想...

AI硬件全景解析：CPU、GPU、NPU、TPU的差异化之路，一文看懂！

深度解析AI核心硬件：CPU、GPU、NPU与TPU的技术特性与应用场景

高通开发者论坛

7,156

社区成员

6,214

社区内容

发帖

与我相关

我的任务

人工智能物联网机器学习技术论坛（原bbs）北京·东城区

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章