新手求教opencl计算work group size和local size的问题
这两天在学习opencl,不理解里面的groupsize的概念,
kernelInfo.kernelWorkGroupSize和自己规定的groupsize是什么关系?前者如何得到的
我是学图像处理的,举个例子,如果我想算计算一个目标区域与搜索的区域的相关系数,
总共需要计算M*N个相关系数,那么NDRang定义的索引空间应该是M*N,那么work group size呢?
是和目标区域col*row大小一样吗?
[size=18px]
By the way,我看到有的文章上推荐计算相关系数时,把整个搜索区域的数据放到共享内存中
这种做法能够减少传送数据时间,那么如何让不同item的Kernel函数同时访问这块内存