新手，CUDA求教

zjr448948193 2016-09-01 04:29:14

本人初学CUDA，想请教一下cudaMalloc、cudaMemcpy里各个参数是什么，有什么注意事项，下面这段代码希望可以分析讲解一下



cudaMalloc((void**) &gpudata, sizeof(int) * DATA_SIZE)；/分配内存

cudaMalloc((void**) &result, sizeof(int) * THREAD_NUM* BLOCK_NUM);

cudaMalloc((void**) &time, sizeof(clock_t)* BLOCK_NUM * 2);

cudaMemcpy(gpudata, data, sizeof(int) * DATA_SIZE,cudaMemcpyHostToDevice);



sumOfSquares<<<BLOCK_NUM, THREAD_NUM, 0>>>(gpudata, result, time);

...全文

230 2 打赏收藏转发到动态举报

写回复

用AI写文章

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

zhangzhongke007 2016-09-05

打赏
举报

cudaMalloc()和cudaMemcpy()的作用其实和C语言里面的malloc()和memcpy()一样，就是用来分配内存的，但是分配的是GPU里面的显存。cudaMemcpyDeviceToHost和cudaMemcpyHostToDevice说明了内存操作源和目标地址：是从显卡内存复制到主机内存，还是从主机内存复制到显卡内存！这些API的参数含义请参考CUDA编程手册！

zjr448948193 2016-09-01

打赏
举报

还有这个


cudaMemcpy(&sum, result, sizeof(int) * THREAD_NUM* BLOCK_NUM, cudaMemcpyDeviceToHost);
cudaMemcpy(&time_used, time, sizeof(clock_t)* BLOCK_NUM * 2,cudaMemcpyDeviceToHost);

我安装的是linux 5.4 32位的系统，安装系统时默认安装的声卡驱动可以用，就是声音好小，我从华硕官网下了linux的主板驱动，安装的声卡驱动，我是新手，直接安装的，结果没装上去，以前的驱动也没有了，现在没有声卡...

目录一、深度学习框架概述： ...3.CUDA 10.0 4.TensorFlow 安装： 5.Pycharm 一、深度学习框架概述： Theano Theano最初诞生于蒙特利尔大学 LISA 实验室，于2008年开始开发，是第一个有较大影响...

与Google的Tensorflow类似，Facebook的支持足以确保PyTorch获得持续的开发更新不错的的文档，PyTorch作者亲自维护的论坛供用户交流和求教问题入门简单 2、Pytorch环境搭建 PyTorch的安装十分简单，根据PyTorch官网...

当用户想要实现一个新的层时，需要用C++实现它的前向传播和反向传播代码，而如果想要新层运行在GPU之上，则需要同时使用CUDA实现这一层的前向传播和反向传播。 Caffe2出自Facebook人工智能实验室与应用机器学习团队...