CUDA 图像卷积加速程度

熊猫视觉 2015-07-15 12:55:45
我在for循环里面调用不同的cuda的卷积核,最后查看时间只提速了三别,请问三倍正常吗?如何继续优化呢?
...全文
798 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
beidia 2016-09-20
  • 打赏
  • 举报
回复
你好,您快了三倍,我还慢了一倍呢
tengwl 2015-09-01
  • 打赏
  • 举报
回复
是cuda版本和C++版本的性能比较只快了三倍吗?
熊猫视觉 2015-07-15
  • 打赏
  • 举报
回复
使用共享内存吗?有人指点吗?

580

社区成员

发帖
与我相关
我的任务
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
  • CUDA编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧