关于clEnqueueNDRangeKernel时访问冲突

winner201105 2014-04-25 08:43:47

各位兄弟们，clEnqueueNDRangeKernel时访问冲突，检查了几遍了还没有发现问题。
已经尝试过把kernel放到 AMD APP KernelAnalyzer里边，也没有发现语法错误等。
请问大家还可能是什么原因呢？

...全文

207 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

在10年前，随着CUDA与OpenCL的纷纷出炉，GPGPU也着实热了一把。而现今，不少公司更是将GPGPU作为挖矿、搞机器学习的计算利器。于是乎，有许多言论声称GPU将很快取代CPU！那么现代化的GPGPU是否具有如此强大的威力甚至于能取代CPU呢？本文将会以GPGPU的任务级并行能力来看看这些尖端GPU的性能。

在上述代码中，get_global_id(0) 是在内核函数 vectorAdd 中使用的，表示获取当前工作项在全局范围的第一个维度（维度编号为0）上的索引。例如，如果在执行内核函数时将全局执行范围设置为 128，那么在第一个维度上，工作项的索引值将从 0 到 127，总共有 128 个唯一的索引值。例如，如果在执行内核函数时使用了 128 个工作项并且当前工作项的全局索引是 10，那么 get_global_id(0) 会返回 10，表示当前工作项在全局范围的第一个维度上的索引是 10。

内存优化是最关键且有效的OpenCL性能技术。许多应用程序受限于内存而非计算能力。因此，精通内存优化对于OpenCL优化至关重要。

目录 OpenCL 2.0 异构计算 [第三版] （Heterogeneous Computing with OpenCL 2.0） Intel opencl sdk下载安装 OpenCL较大的改变第1章异构计算简介异构计算：串行处理、并行处理加速的方法 CMOS 并发与并行线程共享内存模型瓶颈消息通讯机制并行计算的粒度细粒度并行粗粒度并行粗细粒度选择将数据视为向量数据共享的用途 OpenCL2.0的三种共享虚拟内存 OpenCL2.0新特

AMD OpenCL大学课程是非常好的入门级OpenCL教程，通过看教程中的PPT，我们能够很快的了解OpenCL机制以及编程方法。下载地址：http://developer.amd.com/zones/OpenCLZone/universities/Pages/default.aspx 教程中的英文很简单，我相信学OpenCL的人都能看得懂，而且看原汁原味的英文表述，更有利于我们了解各种

OpenCL和异构编程

602

社区成员

575

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章