//将大小为10000的数组整个传递到GPU global memory中 cudaMemcpy(d_a, h_a, sizeof(int)*10000); //大小为10000数组a,分为4份, 分别调用核函数 for(int i=0; i<4; i++) { //... kernel<<<grid, block>>>(ai) }
579
社区成员
2,918
社区内容
加载中
试试用AI创作助手写篇文章吧