opencl并行求和求助啊

diaodijiu8312 2017-01-12 07:57:06
小白一枚,主要还是没有明白内存这一块,我想写个并行求和的函数,核函数如下最后最大值应该是存放在pd【0】里面,为什么输出后的结果总是不对呢?求大神指点!
...全文
2051 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
fisherTHW 2017-04-13
  • 打赏
  • 举报
回复
try pd[local_id] += pd[local_id + s] and out[group_id] = pd[0]
diaodijiu8312 2017-01-21
  • 打赏
  • 举报
回复
引用 2 楼 u011637732 的回复:
__local int3* pd;改成__local int3 pd[nSize];试试?还有建议你尽量少在kernel里用if,你可以试试async_work_group_copy()
async_work_group_copy()是用来代替前面将全局内存复制到局部内存的吗?
diaodijiu8312 2017-01-12
  • 打赏
  • 举报
回复
求大神解释一下啊

602

社区成员

发帖
与我相关
我的任务
社区描述
异构开发技术
社区管理员
  • OpenCL和异构编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧