CUDA多张图像进行列卷积出错

xmzzp 2014-09-04 08:34:52
昨天发的代码可读性太差,所以今天改了重新发帖,问题描述如下:
计算的图片的大小为48×48,用CUDA计算单张图片与长度为33的高斯核的列卷积时,结果没错。但是,计算1000张图片与高斯核的列卷积时,结果出错。测试时,共享内存传入的数据没错,卷积后结果出错。错误形式大概是这样的:每一张图卷积后,前16行的数据应该是不同的,但是输出的前16行和后16行相同,本来应该在第一张图第二行的数据,跑到了第二张图片的前16行,错误以此类推。
下面是CUDA里的核函数,求助各位大侠,是什么原因的错。
...全文
126 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
xmzzp 2014-09-10
  • 打赏
  • 举报
回复
问题已经解决

579

社区成员

发帖
与我相关
我的任务
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
  • CUDA编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧