cublas函数使用问题

FB1024 2016-07-23 08:02:36
使用cublas库函数cublasSgetrfBatched返回的结果为:CUBLAS_STATUS_EXECUTION_FAILED,改怎样解决呢?
注:头文件添加的“cublas_v2.h”,库链接正常。
部分代码:

float ** mat = new float *[num];//待求逆的矩阵组
float ** invMat = new float *[num];//存放逆矩阵的矩阵组
for(int i = 0; i< num; i++){
cudaMalloc((void **) & mat[i], sizeof(float) * nrcoeffs * nrcoeffs);
cudaMalloc((void **) & invMat[i], sizeof(float) * nrcoeffs * nrcoeffs);
// 这里将矩阵的数据载入mat[i]中,这里假设矩阵的数据在内存中是连续存放的
mat[i]=tmp1->dptr;
invMat[i]=tmp2->dptr;
}
float ** gpuMat;
cudaMalloc((void **) & gpuMat, sizeof(float *) * num);
cudaStatus=cudaMemcpy(gpuMat, mat, sizeof(float *) * num, cudaMemcpyHostToDevice);
if (cudaStatus != cudaSuccess) {
printf ("device mat memory cpy is failed");
}
cubStatus=cublasSgetrfBatched(cubHandle, tmp1->size1, gpuMat, tmp1->size1 , pivo, info, num);
if (cubStatus != CUBLAS_STATUS_SUCCESS) {
fprintf (stderr,"CUBLAS use cublasSgetrfBatched is failed and cubStatus is %ld\n",cubStatus);
if(cubStatus==CUBLAS_STATUS_EXECUTION_FAILED)
fprintf(stderr,"execution faile---------\n");
}
...全文
555 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

581

社区成员

发帖
与我相关
我的任务
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
  • CUDA编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧