社区
CUDA
帖子详情
cudaThreadSynchronize函数的CPU占有率
无心人_过过小日子
2009-05-19 12:42:38
加精
在启动一个计算时间较长的内核后,执行cudaThreadSynchronize()等待内核结束.
在等待中发现CPU的占用率一直是100%(双核CPU为50%).
平台:vista, SDK2.2.
大家的情况如何?是否也一样?说下情况及其平台吧.谢谢.
...全文
610
11
打赏
收藏
cudaThreadSynchronize函数的CPU占有率
在启动一个计算时间较长的内核后,执行cudaThreadSynchronize()等待内核结束. 在等待中发现CPU的占用率一直是100%(双核CPU为50%). 平台:vista, SDK2.2. 大家的情况如何?是否也一样?说下情况及其平台吧.谢谢.
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
11 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
无心人_过过小日子
2010-04-10
打赏
举报
回复
[Quote=引用 8 楼 naughty_iori 的回复:]
NV没有公布细节,不过大概是这样的。这个问题很久以前就被提出来了,只不过一直没有解决。如果用driver API的话,在create context的时候有个参数可以设置等待的方式,大概是auto,pinned,yield,blocking几种方式,比如yield就是如果CPU需要进行其他计算,则sync就不会占用CPU,如果没有,则一直占用。blocking似乎是2.2才出来的,NV说可以在sy……
[/Quote]
这两天尝试了一下,使用sync效果不明显.而blocking有一定效果.代价是慢0.05ms左右.
henrynus
2010-01-27
打赏
举报
回复
原来如此,长见识了!谢谢
彭令鹏
2009-12-30
打赏
举报
回复
这个想不到会是这样结果啊,nvidia太赶时间了。。
[Quote=引用楼主 l7331014 的回复:]
在启动一个计算时间较长的内核后,执行cudaThreadSynchronize()等待内核结束.
在等待中发现CPU的占用率一直是100%(双核CPU为50%).
平台:vista, SDK2.2.
大家的情况如何?是否也一样?说下情况及其平台吧.谢谢.
[/Quote]
naughty_iori
2009-05-23
打赏
举报
回复
NV没有公布细节,不过大概是这样的。这个问题很久以前就被提出来了,只不过一直没有解决。如果用driver API的话,在create context的时候有个参数可以设置等待的方式,大概是auto,pinned,yield,blocking几种方式,比如yield就是如果CPU需要进行其他计算,则sync就不会占用CPU,如果没有,则一直占用。blocking似乎是2.2才出来的,NV说可以在sync的时候降低CPU LOADING,不过我们试过有一些效果,但效果不大。
无心人_过过小日子
2009-05-22
打赏
举报
回复
[Quote=引用 6 楼 qin_y_j 的回复:]
一般应该是这样的!
cudaThreadSynchronize()
{
while(!bGpuAllThreadJoined)
{
}
}
[/Quote]
就是在疑问是否是死循环等待结束(所以CPU是100%).呵呵.
qin_y_j
2009-05-21
打赏
举报
回复
一般应该是这样的!
cudaThreadSynchronize()
{
while(!bGpuAllThreadJoined)
{
}
}
无心人_过过小日子
2009-05-21
打赏
举报
回复
谢谢Cyrosly提供的情况.
有其他不同的情况吗?
redhat4
2009-05-19
打赏
举报
回复
关注
.
人力资源
ssjja
2009-05-19
打赏
举报
回复
顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶的
支持下。。。。。。。。。。。。
7k7k.com射击小游戏
快打旋风
炸弹人
神奇小妖怪
ssjja
2009-05-19
打赏
举报
回复
支持下。。。。。。。
拳皇97小游戏
大鱼吃小鱼
花花连连看
7k7k.com拳皇小游戏
Cyrosly
2009-05-19
打赏
举报
回复
CPU[0]:%100
CPU[1]:%1~%6
数据总量(128x128x64x42)*sizeof(float)
CUDA
编程入门文章
一、
CPU
和GPU计算性能对比 首先看一下
CPU
和GPU的微架构和计算能力对比。例如我的笔记本lenovo Y480,4核
CPU
,NVIDIA GT650M显卡384个
CUDA
核。 计算能力对比:
CPU
: 4 * 2.5=10GFLOPS GPU: 384 * 0.88= 337.92GFLOPS 显卡计算性能是4核i5
CPU
的33.792倍,因此我们可...
CUDA
编程入门
一 首先看一下
CPU
和GPU的微架构和计算能力对比。例如我的笔记本lenovo Y480,4核
CPU
,NVIDIA GT650M显卡384个
CUDA
核。 计算能力对比:
CPU
: 4 * 2.5=10GFLOPS GPU: 384 * 0.88= 337.92GFLOPS 显卡计算性能是4核i5
CPU
的33.792倍,因此我们可以充分利用这
CUDA
从入门到精通
CUDA
从入门到精通(零):写在前面 在老板的要求下,本博主从2012年上高性能计算课程开始接触
CUDA
编程,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择。还有不到一年毕业,怕是毕业后这些技术也就随毕业而去,准备这个暑假开辟一个
CUDA
专栏,从入门到精通,步步为营,顺便分享设计的一些经验教训,希望能给学习
CUDA
的童
CUDA
从入门到精通(大神之作)膜拜
CUDA
从入门到精通(零):写在前面 在老板的要求下,本博主从2012年上高性能计算课程开始接触
CUDA
编程,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择。还有不到一年毕业,怕是毕业后这些技术也就随毕业而去,准备这个暑假开辟一个
CUDA
专栏,从入门到精通,步步为营,顺便分享设计的一些经验教训,希望能给学习CU...
2020-10-21
CUDA
从入门到精通
CUDA
从入门到精通(零):写在前面 在老板的要求下,本博主从2012年上高性能计算课程开始接触
CUDA
编程,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择。还有不到一年毕业,怕是毕业后这些技术也就随毕业而去,准备这个暑假开辟一个
CUDA
专栏,从入门到精通,步步为营,顺便分享设计的一些经验教训,希望能给学习
CUDA
的童鞋提供一定指导。个人能力所及,错误难免,欢迎讨论。 PS:申请专栏好像需要先发原创帖超过15篇。..
CUDA
580
社区成员
2,919
社区内容
发帖
与我相关
我的任务
CUDA
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
复制链接
扫一扫
分享
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章