CUDA+OPENCV对尺寸较大的图片进行处理的时候 GPU无法实现并行计算

Eric_Huuuui 2020-08-03 07:37:45
各位大佬!
我用CUDA的OPENCV库对图像进行计算,图像尺寸较大(2000万像素),同时需要处理8张图片,此时GPU无法实现并行计算,现在计算时间差不多要十几秒。但是当我以实现并行使用小图片时,GPU便可实现并行计算。。。请问这怎么解决呢???
此致
敬礼!
...全文
840 1 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
s.feng 2020-09-04
  • 打赏
  • 举报
回复 1
GPU能不能实现并行计算和图大小没关系,主要跟你kernel设置的grid和block的值有关,还有的memory有关系,你可以自己来写kernel解决以上问题
OpenCV(开源计算机视觉库)是计算机视觉和机器学习领域广泛应用的一个强大工具,它提供了丰富的图像处理、特征检测、模式识别等功能。在这个“OpenCV4.12.0 + CUDA + 扩展模块Contrib+VS2019编译库”项目中,我们将深入探讨如何在Visual Studio 2019环境下,利用CUDA技术来加速OpenCV的计算,并集成OpenCV的扩展模块Contrib。 OpenCV 4.12.0是这个库的最新稳定版本,它包含了许多性能优化和新功能。例如,更新的算法、改进的接口以及对新硬件的支持。CUDA是NVIDIA提供的并行计算平台,通过GPU进行高性能计算,可以显著提升图像处理和计算机视觉任务的速度。将OpenCVCUDA结合,可以充分利用现代GPU并行计算能力,加快计算密集型操作,如图像金字塔构建、特征匹配和物体检测等。 在编译OpenCV时,需要确保安装了CUDA Toolkit,这是CUDA编程所必需的。安装后,你需要配置OpenCV的CMake构建系统,指定CUDA支持,并设置相应的编译选项。在CMake中,你可以通过设置WITH_CUDA标志为ON来启用CUDA支持。同时,你还需要确保设置正确的CUDA版本和对应的NVIDIA驱动程序。 接下来,OpenCV的扩展模块Contrib包含了更多实验性和专有功能,这些功能可能尚未被纳入OpenCV的主要库中。例如,深度学习模块(DNN)、图像超分辨率模块(SuperRes)和增强现实模块(aruco)等。要集成这些模块,你需要在CMake配置阶段设置WITH_CONTRIB标志为ON。这些额外的模块可以提供更广泛的算法选择,满足更专业或特定的需求。

357

社区成员

发帖
与我相关
我的任务
社区描述
CUDA高性能计算讨论
社区管理员
  • CUDA高性能计算讨论社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧