CUDA程序LINUX下无法调试

Safari_Al_Star 2014-04-14 07:50:55

程序在win8/gt 720M/visual studio 2012/CUDA 5.5下是能够正常运行的.

移植到linux服务器下出现了问题, RHEL 5.3/tesla C1060/cuda 2.3.

于是想要用cuda-gdb调试, 用nvcc编译

nvcc -arch=sm_13 -o my_prog my_prog.cu, 这样程序运行结果错误, 但是编译没有debug信息, 无法debug

于是

nvcc -arch=sm_13 -g -G -o my_prog my_prog.cu, 这样带debug信息, 可是直接运行结果是正确的.

可能的原因是什么呢?

...全文

339 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

linxxx3 2014-04-16

打赏
举报

回复

debug编译的程序，跟正常生成的程序毕竟有些不一样的地方，比如使用未初始化的内存，debug得到的值会是0，正常程序是未定义值；写内存越界，debug程序里也不容易写坏其他的数据，其他的区别应该还有吧，想不太起来。能够正常运行的程序，不一定就是正确的，可能bug没暴露出来而已。lz仔细查查吧。

这两个例子程序都是已经调试好的，大家可以直接编译运行了。配置好VS之后就可以运行了

cuda-gdb的cuda9.0官方使用文档，对于Linux下调试基于cuda的程序，例如实现卷积神经网络深度学习框架，不可或缺的调试帮助文档。

＃概述C ++和CUDA开发所需的常见操作库 #Libraries ## C ++ ## Threading pthread周围的包装器提供消息传递接口，而不是基于锁定的接口。 ## Argument Parser命令行参数的解析器。 ## B-tree替代std :: map，使用依赖于映射页面的Btree来实现完整的ISO / IEC 14882：2003标准。 ## Debugging条件调试消息以及assert（assert.h）的更多信息版本。 ## Timer与x86处理器上的高精度linux计时器以及rdtsc计时器的接口。 ## Active Timer一个围绕pthread的包装器，提供了一个异步分裂阶段接口而不是锁定接口。 ## Serialization一个接口，用于将类序列化为连续的数组并解压缩它们。 ## XML解析器XML的基本解析器。 #CUD

Optix SDK 下载 4.1 . 1 Optix 4 现在自由使用在任何应用，包括商业和教育应用。为下载你必须 NVIDIA 这些显影剂 - 。通过点击 "Agree & Download"按钮，确认您已阅读并同意遵守软件开发者套件、采样工具和许可协议用于封装的 SDK 使用。下载将开始后立即点击 "Agree & Download"按钮下方。 Windows 7 和更高、 64 位同意 & 下载 Linux 接受 & 下载 Mac OSX 10.9 或更高接受 & 下载版本说明（ 615kB ， PDF ）版本说明 Optix NVIDIA ® ™ 4.1 . 1 ( 2017 年 8 月 ) 欢迎来到的第一个重大更新的 Optix 4 SDK 。 Optix 4 是发展中的一个重要里程碑 Optix ，完全重新实现的核心组件，包括一个全新的基于 LLVM 编译流水线。重新设计内部已经酝酿了几年，人们对更好的总体性能、多 GPU 缩放，调试和配置、以及其他特性。 4 版本保持向后兼容现有的 Optix 应用提供的 API ，易于使用 Optix 是已知的。 Optix 4 现在自由使用在任何应用中，它是私人或商业性质，而无需任何额外许可或批文。 4.1 版本是一个维护版本，提供性能和鲁棒性的改进以及最近支持 CUDA 和 Visual Studio 版本。改进 4.1 . 1 主机存储器使用量减少场景的几何形状的大量实例。固定一臭虫 , 其原始索引偏移被忽略，如果一个仅包含单个 geometrygroup geometryinstance 。把一臭虫固定在有 Optix 素数的最小有效位的浮点数可以命中距离确定性的三角形中的一些场景，根据其位置在 BVH 中。所有样品使用 Optix CUDA SDK 主要通过默认上下文。固定的场景时许多材料共享 geometryinstances 。固定内存泄漏在 GL Interop 破坏缓冲器修正当 CUDA 计算高速缓存有时没有踢中，导致长的编译时间。架构更新安装程序以在安装时避免安全问题的 SDK 。改进到 4.1 . 0 支持 CUDA 8.0 支持 Visual Studio 2015 年建立自己的 SDK 各种错误修复，包括更坚固的节点处理复杂图形的变化在某些情况下，内核性能更好 Optix 头现在 nvrtc 兼容，与运输带运行时编译库（ CUDA 阅读更多 ) 改进 4.0 . 2 新的 EULA ，现在允许不受约束的在商业应用中使用 Optix &bra; 黄金 &ket; Optix 和几个固定的问题，导致使用时故障 trbvh 大场面修正了一个问题，可能导致不必要的呼叫重建或 BVH 时 rtcontextsetentrypointcount rtcontextsetraytypecount 但不改变表达式的值修正了一个问题，可能会导致编译错误时使用的不同原子类型的单个节目降低的存储器要求 trbvh 当使用多个改进鲁棒性 Optix 上下文 &bra; 黄金 &ket; 修正了一些在内存不足的情况下 RT _ 返回 ERROR _ UNKNOWN _ ERROR 代替 RTP 存储器分配失败 _ _ _ 改进 4.0 . 1 固定 “ 无效设备 ” 错误，当运行在某些情况下，在 GPU 帕斯卡修正了某些修改可以触发断言节点图修正了 CPU 回退的 trbvh 修正了一个问题，可能导致损坏输出当使用 3D 展开当使用固定的性能问题的实例主要对 Windows Optix 改进编译时启用 Optix 例外各种改进错误消息格式的半添加处理 rtugetsizeforrtfo

【资源说明】 1、该资源包括项目的全部源码，下载可以直接使用！ 2、本项目适合作为计算机、数学、电子信息等专业的课程设计、期末大作业和毕设项目，作为参考资料学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能，需要能看懂代码，并且热爱钻研，自行调试。分析网站的反爬虫策略进行反反爬虫项目python源码+项目说明+模型.zip ### 使用方法 1.开始训练样本前，修改conf/config.json 2.将预处理过的数据集分成验证集和训练集，放到sample目录下 3.运行train_model.py开始训练，训练完成的模型保存至model_result中 4.将训练好的模型放置model_result，运行cnn_models/recognition.py，选定验证码，即可看到模型效果 ### 环境配置 TensorFlow CPU版本安装：`pip install tensorflow==1.9.0` TensorFlow GPU版本安装：`pip install tensorflow-gpu==1.9.0` GUP版本的安装比较麻烦，需要安装CUDA和cuDNN才能使tensorflow调动GPU 下图为TensorFlow，Python，CUDA与cuDNN之间的版本对应关系： ![](./src/README_IMG0.PNG) CUDA与cuDNN安装过程主要有两步： 1. 到官网下载CUDA并安装 2. 将cuDNN解压，复制到CUDA安装目录下这里提供两个文件的链接： CUDA：`https://developer.nvidia.com/cuda-toolkit-archive` cuDNN：`https://developer.nvidia.com/rdp/cudnn-archive` 更具体的安装过程度娘可帮你轻松解决(linux,windows这两步的操作方法各不相同) ### 项目结构 ``` ├─cnn_models │ ├─cnn_model.py # CNN网络类 │ └─recognition.py # 验证训练结果 ├─conf │ └─config.json # 配置文件 ├─logs # 模型训练日志 ├─model_result # 模型保存地址 │ └─1040 # 一套训练完成的验证码训练集及对应模型 ├─sample │ ├─test # 训练集（训练集与验证集一般是对总数据集9:1分割） │ └─train # 验证集 ├─src # 配置环境所需的工具，可根据自身情况到网上下载 ├─train_model.py # 训练程序 └─verify_sample.py # 制作数据集（打标签加图片预处理） ``` ### 图片预处理 + 为验证码图片打上标签，如： ![](./src/1040_2019-10-13_10_1092.jpg) 命名为1040_2019-10-13_10_1092.jpg，1092为标签，其余为附加信息，可根据自己需要更改，用`_`分割即可 + 由于模型输入要求输入必须为227*227，所有需要调整图片形状，verify_sample.py中提供有工具函数 ### 注意事项 alexnet输入必须为227*227的图片，所有图片预处理时可通过PIL中的函数线性转换图片形状，或者缩放后粘贴到227*227的背景中。

374

社区成员

345

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章