CUDA+OPENCV对尺寸较大的图片进行处理的时候 GPU无法实现并行计算

Eric_Huuuui 2020-08-03 07:37:45

各位大佬！
我用CUDA的OPENCV库对图像进行计算，图像尺寸较大（2000万像素），同时需要处理8张图片，此时GPU无法实现并行计算，现在计算时间差不多要十几秒。但是当我以实现并行使用小图片时，GPU便可实现并行计算。。。请问这怎么解决呢？？？

此致
敬礼！

...全文

875 1 打赏收藏转发到动态举报

写回复

用AI写文章

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

s.feng 2020-09-04

打赏
举报

GPU能不能实现并行计算和图大小没关系，主要跟你kernel设置的grid和block的值有关，还有的memory有关系，你可以自己来写kernel解决以上问题

CUDA加速+VS+opencv

通过opencv的dnn模块加速实现深度学习的目标识别。

opencv_cuda_opencvcuda_cuda+opencv_opencv_cudaopencv_cuda_源码.zip

使用NVIDIA的CUDA并行架构下的模板匹配，效率比openCV的有很大提升

OpenCV（开源计算机视觉库）是计算机视觉和机器学习领域广泛应用的一个强大工具，它提供了丰富的图像处理、特征检测、模式识别等功能。在这个“OpenCV4.12.0 + CUDA + 扩展模块Contrib+VS2019编译库”项目中，我们将深入探讨如何在Visual Studio 2019环境下，利用CUDA技术来加速OpenCV的计算，并集成OpenCV的扩展模块Contrib。 OpenCV 4.12.0是这个库的最新稳定版本，它包含了许多性能优化和新功能。例如，更新的算法、改进的接口以及对新硬件的支持。CUDA是NVIDIA提供的并行计算平台，通过GPU进行高性能计算，可以显著提升图像处理和计算机视觉任务的速度。将OpenCV与CUDA结合，可以充分利用现代GPU的并行计算能力，加快计算密集型操作，如图像金字塔构建、特征匹配和物体检测等。在编译OpenCV时，需要确保安装了CUDA Toolkit，这是CUDA编程所必需的。安装后，你需要配置OpenCV的CMake构建系统，指定CUDA支持，并设置相应的编译选项。在CMake中，你可以通过设置WITH_CUDA标志为ON来启用CUDA支持。同时，你还需要确保设置正确的CUDA版本和对应的NVIDIA驱动程序。接下来，OpenCV的扩展模块Contrib包含了更多实验性和专有功能，这些功能可能尚未被纳入OpenCV的主要库中。例如，深度学习模块（DNN）、图像超分辨率模块（SuperRes）和增强现实模块（aruco）等。要集成这些模块，你需要在CMake配置阶段设置WITH_CONTRIB标志为ON。这些额外的模块可以提供更广泛的算法选择，满足更专业或特定的需求。

CUDA高性能计算讨论

357

社区成员

615

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章