社区
高通开发者论坛
帖子详情
Adreno平台,寄存器数目和work group size关系
amuxie1899
2016-11-11 09:35:51
hi,大家好:
最近在qualcomm Adreno 平台开发opencl应用,现在有一个疑问,就是如何通过编译选项来控制opencl使用的寄存器数目,来达到device支持的最大work group size。
多谢多谢!
...全文
2035
回复
打赏
收藏
Adreno平台,寄存器数目和work group size关系
hi,大家好: 最近在qualcomm Adreno 平台开发opencl应用,现在有一个疑问,就是如何通过编译选项来控制opencl使用的寄存器数目,来达到device支持的最大work group size。 多谢多谢!
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
weixin_38498942
2019-06-17
打赏
举报
回复
可以去看下编译脚本或者尝试使用 “编译命令 --help” 查看下编译提示,看是否可以通过命令行的方式修改opencl使用的寄存器数目。
OpenCL工作组大小性能优化
OpenCL工作组大小性能优化6 OpenCL工作组大小性能优化6.1 获得最大的工作组规模6.2 所需和首选的工作组大小6.3 影响最大工作组规模的因素6.4 无障碍的内核6.5 工作组大小调整6.5.1 避免使用默认工作组大小6.5.2 工作组规模较大,性能更好吗?6.5.3 固定与动态工作组大小6.5.4 一,二和三(1D / 2D / 3D)工作组6.6 有关工作组规模的其他主题6.6.1 全局工作规模和填充6.6.2 暴力搜索6.6.3 避免跨工作组的工作量不均6.6.4 工作组同步 6 Open
OpenCL 通用编程与优化(7)
OpenCL 通用编程与优化(7)
Qualcomm_Mobile_OpenCL.pdf 翻译-6-工作组尺寸的性能优化
对于许多kernels来说,工作组大小的调整会是一种简单有效的方法。这章将会介绍基于工作组大小的基础知识,比如如何获取工作组大小,为什么工作组大小非常重要,同时也会讨论关于最优工作组大小的选择和调整的一般方法。 6.1 获取最大的工作组尺寸 在运行完clBuildProgram后,使用下面的API函数可以查询设备的最大工作组尺寸。
size
_t...
ad
reno源码系列(四)注册platform_driver
static struct platform_driver
ad
reno_platform_driver = { // kgsl probe函数[见第2节] .probe =
ad
reno_probe, .remove =
ad
reno_remove, // device_driver .driver = { .name = "kgsl-3d", // .pm = &
ad
reno_pm_ops, .of_match_table = of_match_ptr
Ad
reno OpenCL Application Optimizations(1)
一、性能优化概述 OpenCL通常在不同的架构中没有良好的性能可移植性。在其他
平台
上优化过OpenCL应用程序,特别是在离散GPU上,不太可能在
Ad
reno GPU上运行良好。为一个
Ad
reno GPU优化的OpenCL应用程序,可能需要额外的调整或优化以在其它
Ad
reno GPU上实现最佳性能。 OpenCL应用程序的优化可以从上到下大致分为以下三个层次: 1)、应用与算法 2)、API函数 ...
高通开发者论坛
2,851
社区成员
5,755
社区内容
发帖
与我相关
我的任务
高通开发者论坛
本论坛以AI、WoS 、XR、IoT、Auto、生成式AI等核心板块组成,为开发者提供便捷及高效的学习和交流平台。 高通开发者专区主页:https://qualcomm.csdn.net/
复制链接
扫一扫
分享
社区描述
本论坛以AI、WoS 、XR、IoT、Auto、生成式AI等核心板块组成,为开发者提供便捷及高效的学习和交流平台。 高通开发者专区主页:https://qualcomm.csdn.net/
人工智能
物联网
机器学习
技术论坛(原bbs)
北京·东城区
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章