社区
Qualcomm 开发者论坛
帖子详情
Adreno平台,寄存器数目和work group size关系
amuxie1899
2016-11-11 09:35:51
hi,大家好:
最近在qualcomm Adreno 平台开发opencl应用,现在有一个疑问,就是如何通过编译选项来控制opencl使用的寄存器数目,来达到device支持的最大work group size。
多谢多谢!
...全文
826
回复
打赏
收藏
Adreno平台,寄存器数目和work group size关系
hi,大家好: 最近在qualcomm Adreno 平台开发opencl应用,现在有一个疑问,就是如何通过编译选项来控制opencl使用的寄存器数目,来达到device支持的最大work group size。 多谢多谢!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
weixin_38498942
2019-06-17
打赏
举报
回复
可以去看下编译脚本或者尝试使用 “编译命令 --help” 查看下编译提示,看是否可以通过命令行的方式修改opencl使用的寄存器数目。
Ad
reno OpenCL Application Optimizations(1)
一、性能优化概述 OpenCL通常在不同的架构中没有良好的性能可移植性。在其他
平台
上优化过OpenCL应用程序,特别是在离散GPU上,不太可能在
Ad
reno GPU上运行良好。为一个
Ad
reno GPU优化的OpenCL应用程序,可能需要额外的调整或优化以在其它
Ad
reno GPU上实现最佳性能。 OpenCL应用程序的优化可以从上到下大致分为以下三个层次: 1)、应用与算法 2)、API函数 ...
OpenCL 通用编程与优化(7)
OpenCL 通用编程与优化(7)
Qualcomm_Mobile_OpenCL.pdf 翻译-6-工作组尺寸的性能优化
对于许多kernels来说,工作组大小的调整会是一种简单有效的方法。这章将会介绍基于工作组大小的基础知识,比如如何获取工作组大小,为什么工作组大小非常重要,同时也会讨论关于最优工作组大小的选择和调整的一般方法。 6.1 获取最大的工作组尺寸 在运行完clBuildProgram后,使用下面的API函数可以查询设备的最大工作组尺寸。
size
_t...
OpenCL工作组大小性能优化
OpenCL工作组大小性能优化6 OpenCL工作组大小性能优化6.1 获得最大的工作组规模6.2 所需和首选的工作组大小6.3 影响最大工作组规模的因素6.4 无障碍的内核6.5 工作组大小调整6.5.1 避免使用默认工作组大小6.5.2 工作组规模较大,性能更好吗?6.5.3 固定与动态工作组大小6.5.4 一,二和三(1D / 2D / 3D)工作组6.6 有关工作组规模的其他主题6.6.1 全局工作规模和填充6.6.2 暴力搜索6.6.3 避免跨工作组的工作量不均6.6.4 工作组同步 6 Open
ad
reno源码系列(四)注册platform_driver
static struct platform_driver
ad
reno_platform_driver = { // kgsl probe函数[见第2节] .probe =
ad
reno_probe, .remove =
ad
reno_remove, // device_driver .driver = { .name = "kgsl-3d", // .pm = &
ad
reno_pm_ops, .of_match_table = of_match_ptr
Qualcomm 开发者论坛
949
社区成员
5,228
社区内容
发帖
与我相关
我的任务
Qualcomm 开发者论坛
为开发者提供高通丰富的解决方案及全面技术下载内容。本版以AI人工智能、WoS移动笔记本、XR、IoT 物联网、Auto 汽车、生成式AI等核心板块组成,为开发者提供一个便捷及高效的学习交流平台。
复制链接
扫一扫
分享
社区描述
为开发者提供高通丰富的解决方案及全面技术下载内容。本版以AI人工智能、WoS移动笔记本、XR、IoT 物联网、Auto 汽车、生成式AI等核心板块组成,为开发者提供一个便捷及高效的学习交流平台。
人工智能
物联网
机器学习
企业社区
北京·东城区
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章