企业级场景下，CV 模型跑在 NPU 上的实时性一般能到什么水平？

weixin_52674051 2025-12-22 16:50:49

近期在评估把一部分 CV 模型部署到骁龙平台的 NPU 上，主要关注的是实时视频处理能力。

目前模型类型以常见的 CV 任务为主（比如检测、分割、跟踪这类），视频输入是连续流，不是单帧推理。现在比较关心几个实际问题：

在 NPU 上跑 CV 模型，实时性一般能做到什么水平？
在比较常见的分辨率（如 720p / 1080p）下，是否有机会稳定跑到实时视频处理的帧率（比如 25–30 FPS）？
实际项目中，帧率瓶颈更多是在模型本身，还是前后处理、数据搬运这块？

我们这边还在做技术选型，希望在方案阶段对 NPU 的能力边界有个更清晰的预期，避免后面在性能目标上判断失误。

...全文

76 1 打赏收藏转发到动态举报

写回复

用AI写文章

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

极市平台 2025-12-22

打赏
举报

CV 模型在 NPU 上的实时性表现优异，多数场景可满足实时视频处理。轻量 CV 模型（如 BEiT 分类、MobileNet 适配版）帧率可达 60fps+；目标检测（YOLO 轻量版）30-45fps。骁龙 PC / 新一代手机 NPU（如 X Elite）支持 Burst 模式和多图并行优化，1080p 分辨率下，主流 CV 任务（分类、检测、分割）可稳定达到 30fps 以上的实时标准。
复杂模型经量化优化后，仍能平衡精度与帧率，完全适配实时视频处理需求。

一个人工智能芯片的研究报告，可以了解当前的芯片动态和技术概述；一·概述篇二·技术篇三·产业篇四·人物篇五·应用趋势篇六·趋势篇

三星将为特斯拉设计并代工自动驾驶专用芯片.pdf

摘要：本文详细记录了在昇腾NPU上部署测试DeepSeek-OCR模型的全过程。作者从OCR技术发展历程切入，介绍了从传统模板匹配到深度学习驱动的技术演进，重点评估了DeepSeek-OCR在多语种识别、复杂场景适应性的表现。通过在GitCode Notebook的昇腾910B环境中完成模型部署，测试了包括印刷体、手写体、多语种混合等5种典型场景，结果显示该模型平均推理时间1.23秒/张，显存占用1.28GB/张，识别精度显著优于传统OCR工具。文章还总结了环境适配、性能优化等实用建议。

随着2024年被业界誉为“AI PC元年”，各大笔记本电脑厂商纷纷推出搭载NPU的全新AI PC，而在介绍产品性能时，“NPU”一词频频被提及。但NPU和我们所熟知的GPU之间的区别究竟是什么？我们今天为大家分享的这篇文章将和大家一起初探NPU vs GPU。简而言之，NPU专为加速AI任务而设计，包括深度学习和推理，能够高效地处理大量数据，并利用专用存储器快速执行复杂的AI算法。与GPU相比，NPU体积更小、成本更低、能耗更小，且在特定AI任务中表现更优。