社区
工具平台和程序库
帖子详情
OpenCV GPU加速cuda初始化耗时太长
lingdu320
2018-02-27 11:42:15
在做OpenCV的GPU加速模块,执行 cudaSetDevice(0);
cudaFree(0);这两句其实是进行cuda初始化,但是耗时长达40多秒,在 http://answers.opencv.org/question/1670/huge-time-to-upload-data-to-gpu/#1676 中看到cuda初始化确实耗时,但是不至于那么长,有大神知道可能是哪儿问题了吗?
...全文
1194
4
打赏
收藏
OpenCV GPU加速cuda初始化耗时太长
在做OpenCV的GPU加速模块,执行 cudaSetDevice(0); cudaFree(0);这两句其实是进行cuda初始化,但是耗时长达40多秒,在 http://answers.opencv.org/question/1670/huge-time-to-upload-data-to-gpu/#1676 中看到cuda初始化确实耗时,但是不至于那么长,有大神知道可能是哪儿问题了吗?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
ClouddRenn
2020-04-09
打赏
举报
回复
int InitCudaLib(int iGpu = 0)
{
ck(cuInit(0));
int nGpu = 0; // 总的GPU的数目
ck(cuDeviceGetCount(&nGpu));
if (iGpu < 0 || iGpu >= nGpu)
{
std::cout << "GPU ordinal out of range. Should be within [" << 0 << ", " << nGpu - 1 << "]" << std::endl;
return -1;
}
CUdevice cuDevice = 0;
ck(cuDeviceGet(&cuDevice, iGpu));
char szDeviceName[80];
ck(cuDeviceGetName(szDeviceName, sizeof(szDeviceName), cuDevice));
std::cout << szDeviceName << std::endl; //打印设备名称测试
for (auto &cuContext : cuContextArr)
{
ck(cuCtxCreate(&cuContext, 0, cuDevice)); //创建当前主机线程的上下文
}
return 0;
}
1、这个是我写的初始化部分代码
2、性能测试可以使用nvprof、nvvp等工具
赵4老师
2018-02-27
打赏
举报
回复
1
初始化时间再长,这辈子做一次不就好了。 就不能初始化好之后,就再也不关闭Device和exe和电脑吗?
赵4老师
2018-02-27
打赏
举报
回复
试试使用驱动精灵软件升级能升级的显卡驱动。
lingdu320
2018-02-27
打赏
举报
回复
是只初始化一次,但是做个应用,因为这个启动就要接近1分钟,有点受不了,在http://www.it1352.com/491157.html 这儿看到人家是毫秒级,我的直接就50秒了
C++集成指南:高性能调用mPLUG视觉问答模型
本文面向工业AI场景,详解如何通过C++原生接口调用、显存池化、零拷贝预处理、异步推理、多会话并发及
OpenCV
GPU
桥接等关键技术,显著提升mPLUG多模态视觉问答模型的推理性能。重点涵盖内存生命周期精准控制、CPU-
GPU
流水线设计与工业级低延迟落地实践,实测单次推理从2.3秒降至0.7秒,吞吐量达7.2 FPS。
Qwen3-0.6B-FP8惊艳案例:用思考模式推导‘鸡兔同笼’问题的完整过程
本文介绍BSHM人像抠图模型镜像升级后的性能提升,实测处理速度提高约60%,尤其在高分辨率图像上优势明显。升级核心包括
CUDA
11.3与cuDNN 8.2适配、TensorFlow 1.15针对性编译优化(支持AVX2/FMA及Ampere架构)、推理代码本地化改进(如
OpenCV
替代PIL、启用AMP、精简预处理)。适用于电商运营、内容创作及AI开发者等场景,显著降低延迟与显存占用。
B站直播间的弹幕AI机器人.zip
B 站(bilibili)自动任务工具,支持docker、青龙、k8s等多种部署方式。全面拥抱AI。敏感肌也能用。
技嘉Z77-D3H nvme bios 直接刷 速度杠杠的
技嘉Z77-D3H nvme bios 直接刷 速度杠杠的
【SCI一区复现】基于配电网韧性提升的应急移动电源预配置和动态调度(上)-MPS预配置(Matlab代码实现)
内容概要:本文聚焦于“基于配电网韧性提升的应急移动电源预配置和动态调度”研究中的MPS预配置部分,属于SCI一区高水平论文的复现工作。通过Matlab编程实现,构建了面向极端事件下配电网快速恢复能力提升的优化模型,重点解决应急移动电源(MPS)在灾前的科学预配置问题。研究系统阐述了问题背景、建模逻辑与求解方法,强调科研过程中逻辑严谨性、借力高水平成果的重要性,并倡导在扎实基础上追求创新突破。资源包包含完整代码、数据及论文资料,支持读者复现结果并进一步开展动态调度等后续研究,对提升电力系统抗灾韧性具有重要的理论与实践价值。; 适合人群:具备电力系统分析、优化建模及Matlab编程基础的科研人员,特别适用于从事电网韧性、应急调度、微电网规划、综合能源系统等方向的硕士、博士研究生及高校研究人员。; 使用场景及目标:① 复现并深入理解SCI一区论文中关于MPS预配置的数学模型与算法实现;② 掌握利用Matlab进行电力系统应急优化仿真与韧性评估的技术方法;③ 探究应急电源空间配置与电网恢复性能间的量化关系,为实际电力系统防灾规划与调度决策提供理论依据和技术支撑。; 阅读建议:建议读者结合提供的网盘资源,按照文档结构循序渐进地学习,重点关注模型构建的物理意义、约束条件设定及Matlab代码的实现细节,务必动手运行与调试代码以加深理解。同时可参考团队发布的其他相关研究,拓展在智能优化算法、鲁棒调度等领域的综合应用能力。
工具平台和程序库
24,852
社区成员
27,330
社区内容
发帖
与我相关
我的任务
工具平台和程序库
C/C++ 工具平台和程序库
复制链接
扫一扫
分享
社区描述
C/C++ 工具平台和程序库
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章