CUDA初级开发者 CPU端开pthread_create四线程并行执行GPU端代码所用时间与该GPU端代码执行时间乘4相差无几

u010596756 2016-06-02 03:58:02
在CUDA开发中,GPU端代码所占用的存储空间较小,大概200M左右,因此设想在CPU端开多线程来尽可能多的利用GPU的资源。因此,在CPU端使用了pthread_create开了一个四线程并行执行这一段GPU代码。可是在统计时间时,发现总的执行时间与单个GPU代码执行时间乘4所差无几。请问论坛内各位大神,问题出在什么地方,解决办法是什么
...全文
709 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
tianfang 2016-06-07
  • 打赏
  • 举报
回复
没问题啊 总时间就是应该差不多,但是并发执行任务完成时间短啊

2,408

社区成员

发帖
与我相关
我的任务
社区描述
高性能计算
社区管理员
  • 高性能计算社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧