社区
CUDA on Windows XP
帖子详情
cubin文件里的bar是指什么
full0house
2010-03-03 04:16:27
差不多的两个核函数,一个bar为1,一个为0,这个值指什么?
CUDA里面有没相关的文档?
...全文
80
6
打赏
收藏
cubin文件里的bar是指什么
差不多的两个核函数,一个bar为1,一个为0,这个值指什么? CUDA里面有没相关的文档?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
6 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
full0house
2010-03-04
打赏
举报
回复
把两个global都删成只有相同的一个device函数,慢的lmen大小差不多是快的两倍
例如
__global__ fun1()
{
cal();
}
__global__ fun2()
{
cal();
}
为什么这样lmen都会不同?
full0house
2010-03-04
打赏
举报
回复
看了下它们的CUBIN文件,慢的那个lmem要比快的大,但是我把慢的那个数据定义都删除,只剩下device函数,还是会比快的那个大,不知道NVCC是怎么处理的.
full0house
2010-03-04
打赏
举报
回复
device函数是完全相同的,执行步骤也是一样的.
无心人_过过小日子
2010-03-03
打赏
举报
回复
看device函数中是否有判断.而且是根据值来转移的判断.if是很费时间的.
full0house
2010-03-03
打赏
举报
回复
哦
再问你个问题,我测试两个__global__,它们调用同一个__device__函数,只有__global__中一点点数据准备的不同,但是速度却差两倍以上,时间主要花在__device__函数,不知道为什么差这么多
无心人_过过小日子
2010-03-03
打赏
举报
回复
应该是同步指令数吧.
CU
DA基础介绍
(6)、线程束:在
CU
DA架构中,线程束是
指
一个包含32个线程的集合,这个线程集合被”编织在一起”并且”步调一致”的形式执行,在程序中的每一行, 线程束中的每个线程都将在不同数据上执行相同的命令 。 (7)、核函数...
GPU
指
令集技术分析
o FMA, MUL, ADD 系列 o IMAD, LEA, IADD3 o LOP3 o MUFU o FSETP o LDG/STG, LDS/STS, LDL/STL o BAR • 结语 二.
CU
DA微架构与
指
令集-
指
令发射与warp调度
CU
DA
指
令的发射和warp调度问题。
指
令发射的基本逻辑,...
GPU和
CU
DA基础介绍
显卡作为电脑主机
里
的一个重要组成部分,承担输出显示图形的任务。显卡的处理器称为图形处理器 (GPU) ,它是显卡的 ” 心脏 ” ,与 CPU 类似,只不过 GPU 是专为执行复杂的数学和几何计算而设计的,这些计算是图形...
GPU入门
显卡作为电脑主机
里
的一个重要组成部分,承担输出显示图形的任务。显卡的处理器称为图形处理器(GPU),它是显卡的”心脏”,与CPU类似,只不过GPU是专为执行复杂的数学和几何计算而设计的,这些计算是图形渲染所必需...
LLM生成的
CU
DA C++ Programming Guide 摘要
例如,为计算能力X.y生成的
cu
bin
对象仅能在计算能力X.z(z≥y)的设备上执行。 PTX兼容性:某些PTX
指
令仅支持较高计算能力的设备。PTX代码针对特定计算能力生成后,可编译为不小于该计算能力的二进制代码,但基于较...
CUDA on Windows XP
231
社区成员
423
社区内容
发帖
与我相关
我的任务
CUDA on Windows XP
CUDA on Windows XP
复制链接
扫一扫
分享
社区描述
CUDA on Windows XP
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章