社区
CUDA
帖子详情
CUDA多张图像进行列卷积出错
xmzzp
2014-09-04 08:34:52
昨天发的代码可读性太差,所以今天改了重新发帖,问题描述如下:
计算的图片的大小为48×48,用CUDA计算单张图片与长度为33的高斯核的列卷积时,结果没错。但是,计算1000张图片与高斯核的列卷积时,结果出错。测试时,共享内存传入的数据没错,卷积后结果出错。错误形式大概是这样的:每一张图卷积后,前16行的数据应该是不同的,但是输出的前16行和后16行相同,本来应该在第一张图第二行的数据,跑到了第二张图片的前16行,错误以此类推。
下面是CUDA里的核函数,求助各位大侠,是什么原因的错。
...全文
126
1
打赏
收藏
CUDA多张图像进行列卷积出错
昨天发的代码可读性太差,所以今天改了重新发帖,问题描述如下: 计算的图片的大小为48×48,用CUDA计算单张图片与长度为33的高斯核的列卷积时,结果没错。但是,计算1000张图片与高斯核的列卷积时,结果出错。测试时,共享内存传入的数据没错,卷积后结果出错。错误形式大概是这样的:每一张图卷积后,前16行的数据应该是不同的,但是输出的前16行和后16行相同,本来应该在第一张图第二行的数据,跑到了第二张图片的前16行,错误以此类推。 下面是CUDA里的核函数,求助各位大侠,是什么原因的错。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
1 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
xmzzp
2014-09-10
打赏
举报
回复
问题已经解决
CUDA
实战 |
CUDA
卷积
算子手写详细实现流程!
作者|Pegessi 编辑| 极市平台原文链接:https://zhuanlan.zhihu.com/p/613538649点击下方卡片,关注“自动驾驶之心”公众号ADAS巨卷干货,即可获取点击进入→自动驾驶之心【模型部署】技术交流群后台回复【
CUDA
】获取
CUDA
实战书籍!导读本篇文章主要介绍如何利用
CUDA
实现一个2D
卷积
算子,实现过程较为简单,最终的实现效果可以在较小的尺寸下取得比c...
万字长文 | 详解
CUDA
卷积
算子手写实现
作者|Pegessi 编辑| 极市平台原文链接:https://zhuanlan.zhihu.com/p/613538649点击下方卡片,关注“自动驾驶之心”公众号ADAS巨卷干货,即可获取点击进入→自动驾驶之心【模型部署】技术交流群导读本篇文章主要介绍如何利用
CUDA
实现一个2D
卷积
算子,实现过程较为简单,最终的实现效果可以在较小的尺寸下取得比cudnn快较大的性能。实测在以下参数配置下...
CUDA
卷积
算子手写详细实现
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者丨Pegessi@知乎(已授权)来源丨https://zhuanlan.zhihu.com/p/613538649导读本篇文章主要介绍如何利用
CUDA
实现一个2D
卷积
算子,实现过程较为简单,最终的实现效果可以在较小的尺寸下取得比cudnn快较大的性能。实测在以下参数配置下可以达到平均1.2倍cudnn的性能。前言
CUDA
介...
CUDA
~手写
卷积
算子
卷积
操作主要针对
图像
进行
运算,我们常见的RGB即为三通道的二维
图像
,那么就可以通过一个一维数组存储所有的数据,再按照不同的布局去索引对应的数据,现在主要使用nchw和nhwc两种数据布局,其中n - batch size 也可以理解为"
图像
"数量c - channel num 即我们说的通道数量h - height
图像
高度,每个通道的高度宽度是一致的w - width
图像
宽度那么显然nchw就是逐个通道的读取
图像
,nhwc即对所有通道的同样位置读取数据后,再切换到下一个为止。whaosoft aiot
[
CUDA
手搓]从零开始用C++
CUDA
搭建一个
卷积
神经网络(LeNet),了解神经网络各个层背后算法原理
用C++
CUDA
实现CNN神经网络LeNet教程
CUDA
579
社区成员
2,918
社区内容
发帖
与我相关
我的任务
CUDA
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
复制链接
扫一扫
分享
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章