社区
CUDA on Windows XP
帖子详情
cubin文件里的bar是指什么
full0house
2010-03-03 04:16:27
差不多的两个核函数,一个bar为1,一个为0,这个值指什么?
CUDA里面有没相关的文档?
...全文
69
6
打赏
收藏
cubin文件里的bar是指什么
差不多的两个核函数,一个bar为1,一个为0,这个值指什么? CUDA里面有没相关的文档?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
6 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
full0house
2010-03-04
打赏
举报
回复
把两个global都删成只有相同的一个device函数,慢的lmen大小差不多是快的两倍
例如
__global__ fun1()
{
cal();
}
__global__ fun2()
{
cal();
}
为什么这样lmen都会不同?
full0house
2010-03-04
打赏
举报
回复
看了下它们的CUBIN文件,慢的那个lmem要比快的大,但是我把慢的那个数据定义都删除,只剩下device函数,还是会比快的那个大,不知道NVCC是怎么处理的.
full0house
2010-03-04
打赏
举报
回复
device函数是完全相同的,执行步骤也是一样的.
无心人_过过小日子
2010-03-03
打赏
举报
回复
看device函数中是否有判断.而且是根据值来转移的判断.if是很费时间的.
full0house
2010-03-03
打赏
举报
回复
哦
再问你个问题,我测试两个__global__,它们调用同一个__device__函数,只有__global__中一点点数据准备的不同,但是速度却差两倍以上,时间主要花在__device__函数,不知道为什么差这么多
无心人_过过小日子
2010-03-03
打赏
举报
回复
应该是同步指令数吧.
CU
DA基础介绍
(6)、线程束:在
CU
DA架构中,线程束是
指
一个包含32个线程的集合,这个线程集合被”编织在一起”并且”步调一致”的形式执行,在程序中的每一行, 线程束中的每个线程都将在不同数据上执行相同的命令 。 (7)、核函数...
GPU
指
令集技术分析
o FMA, MUL, ADD 系列 o IMAD, LEA, IADD3 o LOP3 o MUFU o FSETP o LDG/STG, LDS/STS, LDL/STL o BAR • 结语 二.
CU
DA微架构与
指
令集-
指
令发射与warp调度
CU
DA
指
令的发射和warp调度问题。
指
令发射的基本逻辑,...
GPU和
CU
DA基础介绍
显卡作为电脑主机
里
的一个重要组成部分,承担输出显示图形的任务。显卡的处理器称为图形处理器 (GPU) ,它是显卡的 ” 心脏 ” ,与 CPU 类似,只不过 GPU 是专为执行复杂的数学和几何计算而设计的,这些计算是图形...
Cu
da异步计算并行编程原理和存储管理
为了使这种切换非常快,调度器管理的所有warp在寄存器
文件
中都有自己的寄存器。这
里
就会有个矛盾产生,shader需要越多的寄存器,就会给warp留下越少的空间,就会产生越少的warp,这时候在碰到内存延迟的时候就会只是...
GPU入门
显卡作为电脑主机
里
的一个重要组成部分,承担输出显示图形的任务。显卡的处理器称为图形处理器(GPU),它是显卡的”心脏”,与CPU类似,只不过GPU是专为执行复杂的数学和几何计算而设计的,这些计算是图形渲染所必需...
CUDA on Windows XP
231
社区成员
424
社区内容
发帖
与我相关
我的任务
CUDA on Windows XP
CUDA on Windows XP
复制链接
扫一扫
分享
社区描述
CUDA on Windows XP
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章