社区
CUDA
帖子详情
当-deviceemu, cuda-gdb都fail的时候,我们该怎么办?
richardingding
2010-04-08 06:33:20
最近一直在调试cuda code。数据机构比较麻烦一点,是pointer inside struct。kernel逻辑本身并不复杂。我是在Linux下写的cuda code。使用cuda-gdb时候报错,连main函数都进不去。使用emulation模式说invalid argument。我想请问一下,除了这些外,还有什么好的cuda调试方式么???
...全文
116
3
打赏
收藏
当-deviceemu, cuda-gdb都fail的时候,我们该怎么办?
最近一直在调试cuda code。数据机构比较麻烦一点,是pointer inside struct。kernel逻辑本身并不复杂。我是在Linux下写的cuda code。使用cuda-gdb时候报错,连main函数都进不去。使用emulation模式说invalid argument。我想请问一下,除了这些外,还有什么好的cuda调试方式么???
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
无心人_过过小日子
2010-04-08
打赏
举报
回复
可能是强制类型转换,编译器不能正确转换类型造成的.
拆成两个语句(赋值+累加)试试.
richardingding
2010-04-08
打赏
举报
回复
程序全部运行的话有问题,我一行一点的释放,找到了出错的地方竟然是
accumData += (int_least40_t)tmpData; // int_least40_t 自己声明的类型,
这样一句简单的语句,只有copy出来看看了。还有什么其他的方法么?希望能够交流一下。
无心人_过过小日子
2010-04-08
打赏
举报
回复
1)程序本身还能运行结束吗?不能的话,先code review.至少让他能运行起来再说.
2)看不清楚的话,把程序全注释掉(空程序肯定能运行吧,呵呵),然后一点一点"放"出来.
3)运行起来了,结果不正确的话.开一辅助空间.在想debug的地方,把值赋到辅助空间中,kernel结束后把辅助空间cudamemcpy到主机空间,printf.
cuda
-
gdb
调试
CUDA
程序
cuda
-
gdb
调试
CUDA
程序 调试
CUDA
程序与调试C/C++程序基本相同,
gdb
也可调试
CUDA
程序,但不能进入核函数。
cuda
-
gdb
比
gdb
多了进入
CUDA
核并调试的能力。所以
gdb
的命令
cuda
-
gdb
都继承了,命令详见:
gdb
调试C/C++程序。 本篇谈一下
cuda
-
gdb
独有的命令: 可以通过help
cuda
查看可调试的命令:
cuda
thread lane warp...
arm-linux下如何安装
GDB
?pc-linux下如何升级
GDB
?
http://www.gnu.org/software/
gdb
/ 文章目录下载
gdb
将
gdb
压缩包拷贝到arm-linux系统的/userdata/arnold_software路径下解压
gdb
压缩包编译arm-linux-
gdb
下载
gdb
将
gdb
压缩包拷贝到arm-linux系统的/userdata/arnold_software路径下 原文是拷贝到/usr/local路径下,我用xftp拷不进去,报错,查看磁盘空间发现空间不足了,所以只能拷贝到/userdata/arnold_software
安装了
cuda
_7.5.18_win10.exe之后,没有看到
cuda
-
gdb
,我该怎么办??
安装了
cuda
_7.5.18_win10.exe之后,没有看到
cuda
-
gdb
,我该怎么
llm.c调试工具:
GDB
与
CUDA
-
GDB
使用技巧
在大型语言模型(LLM)训练过程中,调试是确保代码正确性和性能优化的关键环节。llm.c项目作为纯C/
CUDA
实现的LLM训练框架,其调试工作涉及CPU和GPU两个层面的复杂问题。本文将深入探讨
GDB
(GNU调试器)和
CUDA
-
GDB
在llm.c项目中的专业使用技巧,帮助开发者高效定位和解决各类问题。 ## 调试环境准备 ### 编译选项配置 在llm.c项目中,正确的编译选项是调试的基础。...
cuda
-
gdb
调试方法:
cuda
gdb
中的可调参数
cuda
gdb
中存在一些可调的参数,可以通过 set
cuda
< tunable-name> <value>命令进行测试,例如: (
cuda
-
gdb
) set
cuda
api_
fail
ures ignore 其中具体的tunalbe-name 参考下图 ...
CUDA
590
社区成员
2,925
社区内容
发帖
与我相关
我的任务
CUDA
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
复制链接
扫一扫
分享
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章