分流多了为什么时间变长?

ycth8 2014-03-18 03:18:28
求教高手,用了两个stream的时候程序时间有所减少,但分了四个流或是八个流,时间一下长了100多倍,这是什么原因?
...全文
598 17 打赏 收藏 转发到动态 举报
写回复
用AI写文章
17 条回复
切换为时间正序
请发表友善的回复…
发表回复
_梦魇花葬 2014-07-15
  • 打赏
  • 举报
回复
并不是流分的越多,速度就会越快的! 你要合理的去分流,适合自己的硬件设备的分流才是最好的,才能发挥硬件的优势!LZ要看好!
w_shesheng 2014-06-23
  • 打赏
  • 举报
回复
很高声,学习学习。
新生水军Vs糖 2014-06-23
  • 打赏
  • 举报
回复
学习学习 各位的经验
qq_16797221 2014-06-23
  • 打赏
  • 举报
回复
dhgsdfhgG 2014-06-21
  • 打赏
  • 举报
回复
有點瘋的人 2014-06-21
  • 打赏
  • 举报
回复
上网百度,答案多得是
qq_16722185 2014-06-20
  • 打赏
  • 举报
回复
这个还真有点儿关系啊
sinat_16718093 2014-06-20
  • 打赏
  • 举报
回复
wxy_125 2014-06-20
  • 打赏
  • 举报
回复
学习学习 ,CUDA
lsclove14 2014-06-18
  • 打赏
  • 举报
回复
20014 6 18
ainaohu 2014-06-18
  • 打赏
  • 举报
回复
2014-06-18 20:29:36
mumuximumuxi 2014-06-18
  • 打赏
  • 举报
回复
0.0haibucuo a
qq_15386193 2014-06-18
  • 打赏
  • 举报
回复
学习学习 各位的经验
qq_16652613 2014-06-18
  • 打赏
  • 举报
回复
但是如果你的数据并不能满足这样的要求,那就另当别论了,这其中需要考虑内核的创建以及其他初始化,以及内存到显存间的双向数据传输等等,在众多的因素中,数据传输的速度是远远低于gpu的处理速度的,说到这里,你应该就知道了。
yuanwcj 2014-04-10
  • 打赏
  • 举报
回复
GPU处理数据最显著的特点是处理密集型数据和并行数据计算,因此CUDA非常适合需要大规模并行计算以及对运算实时性要求很高的领域。 但是如果你的数据并不能满足这样的要求,那就另当别论了,这其中需要考虑内核的创建以及其他初始化,以及内存到显存间的双向数据传输等等,在众多的因素中,数据传输的速度是远远低于gpu的处理速度的,说到这里,你应该就知道了。 如果是低数据传输,但是需要使用高密度运算的话,多线程运算速度肯定是远远好于单线程的

353

社区成员

发帖
与我相关
我的任务
社区描述
CUDA高性能计算讨论
社区管理员
  • CUDA高性能计算讨论社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧