社区
CUDA高性能计算讨论
帖子详情
多GPU并行,采用多种模式,效果都不明显,有哪位高手可以指点的
luck4917
2012-10-16 03:54:13
MPI+CUDA
Pthread or OpenMP + CUDA
streams+ CUDA
几种模式都试过,效果不明显,甚至比用单核更慢,SDK的例子也没效果,
是否有需要特殊处理的.
...全文
700
7
打赏
收藏
多GPU并行,采用多种模式,效果都不明显,有哪位高手可以指点的
MPI+CUDA Pthread or OpenMP + CUDA streams+ CUDA 几种模式都试过,效果不明显,甚至比用单核更慢,SDK的例子也没效果, 是否有需要特殊处理的.
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
7 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
xuezt
2013-04-24
打赏
举报
回复
感觉用GPU作视频数据decode也没什么效果啊。主要是gpu decode后,数据要做转换花费CPU更高。
alpha.5
2013-03-27
打赏
举报
回复
增加你的计算量,计算量级大,而又不怎么需要交换的; 然后分成两份,每份分给一个GPU,让它死算.. 就能看到效果了.
linxxx3
2012-10-23
打赏
举报
回复
工程上的东西,完成了马上还要做别的,确实没有系统总结过。提高并行效率的优化点都太细了,大的方向ls我已经讲了,具体的手法非常依赖底层平台的微架构。优化的步骤每一步都需要结合profiling来做,特别是要做横向对比的时候,一定要拿充分优化的程序去比较,直接拿一个程序,在两个平台上一跑,然后就下结论,这样很不科学。
luck4917
2012-10-22
打赏
举报
回复
请问,有没用做过对比过,多块显卡并行计算的实际运用
以及用多GPU的显卡进行过对比测试,对各种并行构架
计算能力进行分析, 提高并行效能的技巧有哪些?
luck4917
2012-10-17
打赏
举报
回复
有没具体应用的实例,能否把你的数据处理细节的方式及
kernal函数的大概任务量借鉴一下,是否有相关多GPU与
使用单GPU 的性能对比数据,我现在都快没信心了.~~
linxxx3
2012-10-17
打赏
举报
回复
[Quote=引用 2 楼 的回复:]
有没具体应用的实例,能否把你的数据处理细节的方式及
kernal函数的大概任务量借鉴一下,是否有相关多GPU与
使用单GPU 的性能对比数据,我现在都快没信心了.~~
[/Quote]
以前做的东西了,处理数据就是分块,运算结果是各写各的,基本没有数据传输的问题。
lz现在缺少细致的profiling,你说多GPU不好,但是只有整体的结果,确没对每个过程统计过时间。
比如kernel执行几十ms,数据传输上百ms之类的;或者一个运算任务,算完一行做一次多设备的同步,这样都是不行的,我只举个例子。
linxxx3
2012-10-16
打赏
举报
回复
注意计算粒度,每个GPU的任务量要足够大,数据交换尽量少,避免分散的小数据量传输
如何学好游戏编程
这篇文章写完能快半年了,当时只是发到学校BBS上,不敢写到空间里,怕
高手
见笑,但工作了2个月,发现自己写很多还是对的,于是斗胆拿来出来,给新手一些
指点
,也希望
高手
给我些
指点
。 现在天天忙工作,没事时忙着...
OpenGL播放视频的技术
它是一种类似于C语言的专门为
GPU
设计的语言,它可以放在
GPU
里面被
并行
运行。 OpenGL的着色器有.fsh和.vsh两个文件。这两个文件在被编译和链接后就可以产生可执行程序与
GPU
交互。.vsh 是Vertex Shader(顶点着色器...
视频和音频播放的演示最简单的例子6:OpenGL广播YUV420P(T经exture,
采用
Shader)...
它是一种相似于C语言的专门为
GPU
设计的语言,它能够放在
GPU
里面被
并行
运行。 OpenGL的着色器有.fsh和.vsh两个文件。 这两个文件在被编译和链接后就能够产生可运行程序与
GPU
交互。.vsh 是Vertex Shader(顶点着色器)...
编程珠玑番外篇
1.Plan 9 的八卦在 Windows 下喜欢用 FTP 的同学抱怨 Linux 下面没有如 LeapFTP ... 其实一点都不麻烦, 因为在 LINUX 系统上压根就不需要用 FTP. 为什么呢? 因为一行简单的配置之后, 你就可以像使用本机文件一样使用
电脑硬件故障维护小全
下面,我们就一起来看看主板在使用过程中最常见的故障有哪些。 常见故障一:开机无显示 电脑开机无显示,首先我们要检查的就是是BIOS。主板的BIOS中储存着重要的硬件数据,同时BIOS也是主板中比较脆弱的部分,...
CUDA高性能计算讨论
353
社区成员
615
社区内容
发帖
与我相关
我的任务
CUDA高性能计算讨论
CUDA高性能计算讨论
复制链接
扫一扫
分享
社区描述
CUDA高性能计算讨论
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章