请教:TESLA K20到底比C2050快多少?

ukyolei 2013-06-19 01:53:53
在服务器上用相同的代码,一个在C2050上用CUDA4.0跑,一个在K20上用CUDA5.0跑,实际效率K20比C2050仅仅提高了15%左右。有没有哪位兄弟有类似经验的交流一下?
...全文
2026 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
yuanwcj 2014-04-14
  • 打赏
  • 举报
回复
比较两块卡的处理效率,应该是让两块卡的资源利用率都达到最高的时候,你使用相同的代码来做比较,根本不能反映两块卡的真实处理能力。 如果确实需要比较的话,可以针对两块卡设计与之硬件匹配的代码,使其效率达到最高,之后再做比较,需要注意的是,gpu最适合处理密集型数据和并行运算数据,如果你的代码并不能这种要求,那也同样不能使gpu发挥出最佳性能。 另外,不晓得你的“实际效率”是怎么算出来的,还有是采用什么计算方法,计算GPU运算时间的最佳方法是使用event,其他方法计算时间会有很大的误差;再者,这个时间是一个综合时间,包括host到device的双向数据传输,各种初始化,之后才是真正用于数据处理的时间。
woshixiaomage 2014-04-14
  • 打赏
  • 举报
回复
我认为应该简单的修改下代码,以更好的使用K20卡的新特性,使之发挥的更好,利用率更高
u014349300 2014-03-25
  • 打赏
  • 举报
回复
Nvidia Tesla C2050 "CUDA核心频率:1.15 GHz CUDA核心数量:448 双精度浮点性能(峰值):515 Gflops 单精度浮点性能(峰值):1.03 Tflops 专用存储器总容量:3GB GDDR5 功耗:238W热设计功耗 主动散热 显示器最大分辨率@ 60Hz:2560x1600" Nvidia Tesla K20C "GPU 的数量和类型:1 Kepler GK110 CUDA核心数量:2496 双精度浮点性能:1.17 Tflops 单精度浮点性能:3.52 Tflops 专用存储器总容量:5GB 功耗:225W热设计功耗 主动散热" 更多关于GPU情况 可与我私聊 Q 1455 948 719
leonlix 2013-11-15
  • 打赏
  • 举报
回复
实际运行起来,和理论值是有出入的。

353

社区成员

发帖
与我相关
我的任务
社区描述
CUDA高性能计算讨论
社区管理员
  • CUDA高性能计算讨论社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧