7,636
社区成员
发帖
与我相关
我的任务
分享近期在评估把一部分 CV 模型部署到骁龙平台的 NPU 上,主要关注的是实时视频处理能力。
目前模型类型以常见的 CV 任务为主(比如检测、分割、跟踪这类),视频输入是连续流,不是单帧推理。现在比较关心几个实际问题:
在 NPU 上跑 CV 模型,实时性一般能做到什么水平?
在比较常见的分辨率(如 720p / 1080p)下,是否有机会稳定跑到实时视频处理的帧率(比如 25–30 FPS)?
实际项目中,帧率瓶颈更多是在模型本身,还是前后处理、数据搬运这块?
我们这边还在做技术选型,希望在方案阶段对 NPU 的能力边界有个更清晰的预期,避免后面在性能目标上判断失误。
CV 模型在 NPU 上的实时性表现优异,多数场景可满足实时视频处理。轻量 CV 模型(如 BEiT 分类、MobileNet 适配版)帧率可达 60fps+;目标检测(YOLO 轻量版)30-45fps。骁龙 PC / 新一代手机 NPU(如 X Elite)支持 Burst 模式和多图并行优化,1080p 分辨率下,主流 CV 任务(分类、检测、分割)可稳定达到 30fps 以上的实时标准。
复杂模型经量化优化后,仍能平衡精度与帧率,完全适配实时视频处理需求。