社区
CUDA
帖子详情
ptx
yhs1003
2009-11-08 01:29:46
怎么通过ptx代码看哪些变量放在register里, 或哪些运算放在register里?
...全文
111
6
打赏
收藏
ptx
怎么通过ptx代码看哪些变量放在register里, 或哪些运算放在register里?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
6 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
rolyluo
2009-11-12
打赏
举报
回复
thanks
rolyluo
2009-11-11
打赏
举报
回复
请问smem是共享内存吗?好像没用共享内存这个smem也不是0啊
还有用-ptx时有这个
.loc 15 65 0
这指的是.local的吗?
还有像
ld.global.f32 $f1, [$rd4+0]; // id:74
这种,怎么看对应的是什么变量啊?
无心人_过过小日子
2009-11-11
打赏
举报
回复
[Quote=引用 3 楼 rolyluo 的回复:]
请问smem是共享内存吗?好像没用共享内存这个smem也不是0啊
还有用-ptx时有这个
.loc 15 65 0
这指的是.local的吗?
还有像
ld.global.f32 $f1, [$rd4+0]; // id:74
这种,怎么看对应的是什么变量啊?
[/Quote]
函数参数也在sharememory中.所以不为0,就是没有参数,好像驱动也要用28字节.
.loc不是好像只是label.
ld.global.f32 $f1, [$rd4+0]; 是从globalmemory上读32位的浮点数到f1,gmem的地址在rd4中,具体是哪个内容,要看前面rd4的计算了.呵呵.
如果ld.local.f32,就是从local(其实也是gmem)上读取了.
spy_j
2009-11-11
打赏
举报
回复
smem是共享内存。好像是因为函数参数也放在shared memory中,所以没用共享内存也不是0。
spy_j
2009-11-10
打赏
举报
回复
cubin文件里面也有统计,如:
lmem = 0
smem = 3120
reg = 14
无心人_过过小日子
2009-11-08
打赏
举报
回复
.local的在gmem上.
变量的对应检查要照着程序一行一行看的.
MOTOROLA\
PTX
760&MCX760; 写频软件
PTX
700+ Waterproof Minnow No Display English 330-400MHZ H38PDC9CK3 PMUD2247A
PTX
760+ Waterproof Minnow Full keypad Chinese 330-400MHZ H38PDH9CK6 PMUD2248A MCX760 330-400MHZ M25PHF9CK5 PMUD2096A ====...
摩托罗拉
PTX
760手台使用简要
摩托罗拉
PTX
760手台使用简要的使用说明
点云
ptx
格式导入与提取
可实现点云
ptx
和txt文件导入,框选,提取截面线功能
ptx
格式的点云数据
鉴于网上搜到一些号称读写
ptx
点云数据的程序,其实是错误的,
ptx
格式没那么简单。我提供一个
ptx
点云数据给大家测试一下,这个模型解码出来后是一个房屋的外壳,可以用现有的meshlab打开。希望对大家有所帮助!
Juniper路由器产品介绍-Juniper
PTX
5000和
PTX
3000分组传输路由器.pdf
Juniper路由器产品介绍-Juniper
PTX
5000和
PTX
3000分组传输路由器.pdf 学习资料 复习资料 教学资源
CUDA
579
社区成员
2,918
社区内容
发帖
与我相关
我的任务
CUDA
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
复制链接
扫一扫
分享
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章