关于cudaError_t的返回值为77，怎么解决？

帅气的小王子 2015-02-08 09:43:45

代码如下所示，

	

	cudaMalloc((unsigned char **)&dev_bdecoded, CodeLength * sizeof(unsigned char));

	cudaMalloc((int **)&dev_jc, (n + 1) * sizeof(int));

	cudaMalloc((double **)&dev_LLR_extrinsic, nzmax * sizeof(double));

	cudaMalloc((double **)&dev_LLR_intrinsic, CodeLength * sizeof(double));



	cudaMemcpy(dev_bdecoded, bdecoded, CodeLength * sizeof(unsigned char), cudaMemcpyHostToDevice);

	cudaMemcpy(dev_jc, jc, (n + 1) * sizeof(int), cudaMemcpyHostToDevice);

	cudaMemcpy(dev_LLR_intrinsic, LLR_intrinsic, CodeLength * sizeof(double), cudaMemcpyHostToDevice);



        threadsPerBlock = 256;

	blocksPerGrid = (n + threadsPerBlock - 1) / threadsPerBlock;

	Kernel1<<<blocksPerGrid,threadsPerBlock>>>(dev_bdecoded, dev_jc, dev_LLR_extrinsic, dev_LLR_intrinsic);

	cudaStatus = cudaDeviceSynchronize();

	if (cudaStatus != cudaSuccess) {

		fprintf(stderr, "cudaDeviceSynchronize returned error code %d after launching addKernel!\n", cudaStatus);

	}

其中bdecoded,jc,LLR_intrinsic是作为参数传递进来的指针。
内核函数如下



__global__ void Kernel1(unsigned char *dev_bdecoded, int *dev_jc, double *dev_LLR_extrinsic, double *dev_LLR_intrinsic)

{

	int i = blockDim.x * blockIdx.x + threadIdx.x;

	int j;

	dev_bdecoded[i] = 0;

	for (j = dev_jc[i]; j < dev_jc[i + 1]; j++)

		dev_LLR_extrinsic[j] = dev_LLR_intrinsic[i];

}

在上面cudaStatus的返回值为77，



    /**

     * The device encountered a load or store instruction on an invalid memory address.

     * The context cannot be used, so it must be destroyed (and a new one should be created).

     * All existing device memory allocations from this context are invalid

     * and must be reconstructed if the program is to continue using CUDA.

     */

    cudaErrorIllegalAddress               =     77,

去查了下解释说是内存问题，如上面所示，我想知道该如何解决这个问题？

...全文

4179 5 打赏收藏转发到动态举报

写回复

用AI写文章

5 条回复

切换为时间正序

请发表友善的回复…

发表回复

wishkind 2016-02-21

打赏
举报

还没有开始cuda编程，先看看

帅气的小王子 2015-02-10

打赏
举报

找到问题了，内核函数中dev_jc[i]，i的取值超过了dev_jc的范围，数组越界了。

YCMyTot 2015-02-08

打赏
举报

cudaMalloc( (void**)&d_Mat_A , size ) ; 应该是这样的形式。内存分配出错。

帅气的小王子 2015-02-08

打赏
举报

引用 2 楼 u010333076 的回复:

[quote=引用 1 楼 u014693181 的回复:] cudaMalloc( (void**)&d_Mat_A , size ) ; 应该是这样的形式。内存分配出错。

改过之后依然不行。[/quote]

cudaMalloc((void **)&dev_jc, (n + 1) * sizeof(int));

这样子改的

帅气的小王子 2015-02-08

打赏
举报

引用 1 楼 u014693181 的回复:

cudaMalloc( (void**)&d_Mat_A , size ) ; 应该是这样的形式。内存分配出错。

改过之后依然不行。

柔性电力系统中油浸式变压器的最佳老化极限研究（Matlab代码实现）

李兰系统预算调整及POR申请关联问题点整理-5.21.csv 的副本.xlsx

机械毕业设计二级展开式圆柱齿轮减速器设计【设计说明书+CAD图纸+SW三维+STEP】.rar

已经博主授权,源码转载自 https://pan.quark.cn/s/e6d2e9b5b6fa ### C# 通过 videoSourcePlayer 控件达成拍照与录像操作指南#### 一、视频源控件（videoSourcePlayer）概述在 C# 编程环境中，`videoSourcePlayer` 控件是一种用于捕捉视频流的强效组件，它使得开发者能够借助简洁的代码对摄像头进行操作，涵盖视频的播放、暂停以及静态图像的获取等操作。该控件基于 DirectShow 技术，适用于多种视频输入设备，包括 USB 摄像头、网络摄像头等。#### 二、核心代码阐释与功能达成在所提供的代码段中，主要达成了以下几个功能：1. **摄像头的初始化**：在窗体加载时暂停视频播放，并重新配置摄像头。2. **摄像头设备的选取**：提供用户选择不同视频输入设备的机会，并将其设定为视频源。3. **拍照操作**：当用户点击拍照按钮时，捕获当前的视频帧并将其转化为图片格式存储。##### 1. 摄像头的初始化```csharpprivate void frmjs_hjAdd_Load(object sender, EventArgs e){ videoSourcePlayer1.Pause(); btn_getdevice_Click(null, null); // ...}private void frmjs_hjAdd_FormClosed(object sender, FormClosedEventArgs e){ videoSourcePlayer1.Pause(); videoSourcePlayer1.ReleaseResources();}```**阐释**：- `videoSo...

CUDA

590

社区成员

2,925

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章