一个CUDA二维数组相加的例子,请大牛们看看错在哪里

JH_kanwairen 2012-06-29 11:10:07
#include "book.h"
__global__ void ADD(int *A,int *B,int *C)
{
int i=threadIdx.x;
int j=threadIdx.y;
while ( i<4 && j<4)
{
C[i][j]=A[i][j]+B[i][j];
}
}
int main( void ) {

a = (int*)malloc( 16 * sizeof(int) );
b = (int*)malloc( 16 * sizeof(int) );
c = (int*)malloc( 16 * sizeof(int) );

int a[4][4]={{1,1,1,1},{1,1,1,1},{1,1,1,1},{1,1,1,1}};
int b[4][4]={{1,1,1,1},{1,1,1,1},{1,1,1,1},{1,1,1,1}};
int *A,*B,*C;
cudaMalloc((void**) &A,sizeof(int)*16);
cudaMalloc((void**) &B,sizeof(int)*16);
cudaMalloc((void**) &C,sizeof(int)*16);
cudaMemcpy(A,a,sizeof(int)*16,cudaMemcpyHostToDevice);
cudaMemcpy(B,b,sizeof(int)*16,cudaMemcpyHostToDevice);

dim3 threadsPerBlock(4,4);

ADD<<<1,threadsPerBlock>>>(A,B,C);

int c[4][4];
cudaMemcpy(c,C,sizeof(int)*16,cudaMemcpyHostToDevice);
printf( "c\n" );

cudaFree(A);
cudaFree(B);
cudaFree(C);
return 0;
}
...全文
476 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
JH_kanwairen 2012-08-16
  • 打赏
  • 举报
回复
问题解决,谢谢楼上各位
xubinxuxinyu 2012-07-26
  • 打赏
  • 举报
回复
要用cudamalloc2D 和cudamemcpypitch两个函数,具体的上网度一度就ok
rainliuyu 2012-07-05
  • 打赏
  • 举报
回复
你的函数声明是这样的void ADD(int *A,int *B,int *C)
参数里没说明A B C的围数,或者说不知道他们是几行几列的
因此你用
A[x][y]这样的方式是无法正确定位到你要操作的元素的
所以应该把二维数组指针在这里当作一维的去处理

通过x*Col+y的方式明确告诉这段代码,你要操作的地址相比起始地址的偏移量是多少
JH_kanwairen 2012-06-29
  • 打赏
  • 举报
回复
c[j*4+i] = a[j*4+i] + b[j*4+i] 这样改了不就是一维数组了,这里不是很清楚,还是初学者,请不吝教教我吧!我怎样可以在网格中用二维索引呢?有例子的话可以看看 ,真心谢谢
cc19851 2012-06-29
  • 打赏
  • 举报
回复
C[i][j]=A[i][j]+B[i][j];
你传入的不是 **,并且最好不要使用 **,要多一个间接的global访问,并且host端处理地址映射容易出错
c[j*4+i] = a[j*4+i] + b[j*4+i]

579

社区成员

发帖
与我相关
我的任务
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
  • CUDA编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧