社区
CUDA高性能计算讨论
帖子详情
请教:TESLA K20到底比C2050快多少?
ukyolei
2013-06-19 01:53:53
在服务器上用相同的代码,一个在C2050上用CUDA4.0跑,一个在K20上用CUDA5.0跑,实际效率K20比C2050仅仅提高了15%左右。有没有哪位兄弟有类似经验的交流一下?
...全文
2027
5
打赏
收藏
请教:TESLA K20到底比C2050快多少?
在服务器上用相同的代码,一个在C2050上用CUDA4.0跑,一个在K20上用CUDA5.0跑,实际效率K20比C2050仅仅提高了15%左右。有没有哪位兄弟有类似经验的交流一下?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
5 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
yuanwcj
2014-04-14
打赏
举报
回复
比较两块卡的处理效率,应该是让两块卡的资源利用率都达到最高的时候,你使用相同的代码来做比较,根本不能反映两块卡的真实处理能力。 如果确实需要比较的话,可以针对两块卡设计与之硬件匹配的代码,使其效率达到最高,之后再做比较,需要注意的是,gpu最适合处理密集型数据和并行运算数据,如果你的代码并不能这种要求,那也同样不能使gpu发挥出最佳性能。 另外,不晓得你的“实际效率”是怎么算出来的,还有是采用什么计算方法,计算GPU运算时间的最佳方法是使用event,其他方法计算时间会有很大的误差;再者,这个时间是一个综合时间,包括host到device的双向数据传输,各种初始化,之后才是真正用于数据处理的时间。
woshixiaomage
2014-04-14
打赏
举报
回复
我认为应该简单的修改下代码,以更好的使用K20卡的新特性,使之发挥的更好,利用率更高
u014349300
2014-03-25
打赏
举报
回复
Nvidia Tesla C2050
"CUDA核心频率:1.15 GHz CUDA核心数量:448 双精度浮点性能(峰值):515 Gflops 单精度浮点性能(峰值):1.03 Tflops 专用存储器总容量:3GB GDDR5 功耗:238W热设计功耗 主动散热 显示器最大分辨率@ 60Hz:2560x1600"
Nvidia Tesla K20C
"GPU 的数量和类型:1 Kepler GK110 CUDA核心数量:2496 双精度浮点性能:1.17 Tflops 单精度浮点性能:3.52 Tflops 专用存储器总容量:5GB 功耗:225W热设计功耗 主动散热" 更多关于GPU情况 可与我私聊 Q 1455 948 719
leonlix
2013-11-15
打赏
举报
回复
实际运行起来,和理论值是有出入的。
Telsa GPU架构分析1
Tesla
K2
0 GPU是
Tesla
GPU系列产品中的旗舰,专为计算量最密集的HPC环境而设计,NVIDIA预计
Tesla
K2
0将成为全球最高性能和最节能
H-BLAST:异构BLAST(H-BLAST),一种用于将CPU和GPU耦合的异构计算机的
快
速并行搜索工具,以加速BLASTX和BLASTP – NCBI-BLAST的基本工具
异构BLAST(H-BLAST) 异构BLAST(H-BLAST)是用于将CPU和GPU耦合在一起的异构计算机的
快
速并行搜索工具,以加速BLASTX和BLASTP-NCBI-BLAST的基本模块。 H-BLAST采用局部解耦的种子扩展算法来利用GPU的优势,并提供了一种性能调整机制,可在各种CPU和GPU组合之间实现更高的效率。 H-BLAST产生的对齐结果与NCBI-BLAST相同,并且其计算速度比NCBI-BLAST
快
得多。 H-BLAST已在不同的软件和硬件设置上进行了测试。 例如,CentOS Linux(v5.4,v6.0和v7.1)和Ubuntu Linux(v11.04)被用作H-BLAST的基准软件平台。 NVIDIA
Tesla
C2050
GPU卡,NVIDIA
Tesla
K2
0 / K40 GPU卡和NVIDIA Geforce GTX 560 GPU卡被用作H
gpu_cpu_math_comparison:BLAS 和 LAPACK 库中一些 GPU 和 CPU 数学例程的比较
gpu_cpu_math_comparison BLAS 和 LAPACK 库中少数 GPU 和 CPU 数学例程的比较。 这个简单的项目专注于在 GPU (cublas,cula) 和 CPU (blas, lapack) 领域测试 BLAS 和 LAPACK 函数。 例子: 比较 DGEMM、CPU_CUDA 与 CPU_BLAS、矩阵大小 2000x2000、
Tesla
K2
0m gpu-cpu-comparison.x dgemm_cuda 2000 . . . cuda_dgemm GPU vs CPU test Routine
spent runtime: 0.05900000 seconds. aver. sum of diag: 2001.0000000000000 1,1: 2.00000
高性能计算卡
Tesla
K2
0简介
esla
K2
0是由NVIDIA公司研发,用于服务器高性能计算的一款GPU,是
Tesla
品牌下的一个产品。NVIDIA研发的高性能计算产品
Tesla
K2
0,基于开普勒(Kepler)架构,核心芯片GK110、拥有71亿个晶体管,而且还有更高端的
Tesla
K2
0X兄弟产品、K40、K80等升级产品。
GK110强势到来!
Tesla
K2
0X/
K2
0正式发布
新一届超级计算大会SC12今天开幕了,除了公布新的TOP500超算榜单,各大相关厂商也是一股脑地发布或者宣布了多款高性能计算产品。先来看NVIDIA这边,基于开普勒大核心GK110、拥有71亿个晶体管的
Tesla
K2
0终于正式发布了,而且还有更高端的
Tesla
K2
0X。
Tesla
K2
0X拥有十四组SMX、2688个流处理器,屏蔽了一组192个,但同时启用完整的384-bit显存位宽和
CUDA高性能计算讨论
353
社区成员
615
社区内容
发帖
与我相关
我的任务
CUDA高性能计算讨论
CUDA高性能计算讨论
复制链接
扫一扫
分享
社区描述
CUDA高性能计算讨论
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章