CUDA stream并行不支持fermi?

wszlb1987 2012-09-03 11:29:01
本人GTX460, deviceOverlap属性显示为1, 运行SDK中的simpleStream程序, stream完全并行不起来,使用CUDA profile分析过,所有stream都是串行。

而使用tesla 的C2075测试,deviceOverlap为2,并行拷贝比不用stream快了一倍左右。

文档中说,只要deviceOverlap为1就可以执行内存块拷贝和kernel的并行了,然而在许多fermi GTX460机器上测试都执行不起来,结果是串行。
请问有没有做过这方面测试的,大家一起讨论一下吧!
...全文
343 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
skago 2012-09-05
  • 打赏
  • 举报
回复
GT640显卡,也是遇到同样的问题,求回复

353

社区成员

发帖
与我相关
我的任务
社区描述
CUDA高性能计算讨论
社区管理员
  • CUDA高性能计算讨论社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧