社区
OpenCL和异构编程
帖子详情
Opencl中local memory和cache
commando_s
2015-09-25 09:23:36
我是小菜一枚,想问下各位大神:
Opencl中的Local Memory和GPU中的cache有什么关系?物理上是指同一片内存么?
...全文
497
5
打赏
收藏
Opencl中local memory和cache
我是小菜一枚,想问下各位大神: Opencl中的Local Memory和GPU中的cache有什么关系?物理上是指同一片内存么?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
5 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
commando_s
2015-09-30
打赏
举报
回复
多谢大神指点~
bluewanderer
2015-09-28
打赏
举报
回复
引用 3 楼 commando_s 的回复:
明白了。。。 那local memory的大小怎么判断?有人通过性能变化进行估计,那有没有可以得到准确大小的方法呢?
用api可以获取啊。或者命令行clinfo直接把所有的都列出来看。
commando_s
2015-09-28
打赏
举报
回复
明白了。。。 那local memory的大小怎么判断?有人通过性能变化进行估计,那有没有可以得到准确大小的方法呢?
commando_s
2015-09-28
打赏
举报
回复
明白了。。。 那local memory的大小这么判断?有人通过性能变化进行估计,那有没有可以到底准确大小的方法呢?
bluewanderer
2015-09-25
打赏
举报
回复
local memory和cache是两样东西。GPU上local memory可以理解成一种由kernel主动管理的类似cache的东西。L1 cache是不受你的直接控制的,你只能做到让逻辑对cache友好。而且local memory可能会比cache快。AMD显卡上local memory速度是L1 cache的两倍。 CPU上没有真正的local memory。
并行程序设计基础知识
OpenCL
是异构计算时代为典型的编程语言和编程模型,
OpenCL
编程需要一定的基础知识和特定的编程环境。
OpenCL
Memory
优化
Memory
的访问效率往往决定着整个kernel的性能,最小化global
memory
访问次数在优化
OpenCL
代码时是非常有效的。
Memory
主要有以下几种:global, constant,
local
以及private。互联拓扑结构将共享的global内存,constant内存,
local
内存系统连接到他们的基础内存下,同时互联也包含对
memory
端口的访问仲裁。
Memory
的访问会争夺共享内存资源,如果kernel
中
执行大俩个的内存访问,那么必须生成负责的仲裁逻辑处理内存访问请求,会导致fMax
OpenCL
设备存储形式
OpenCL
设备存储形式 版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u011028771/article/details/78712830 一、渊源 在硕士期间,由于实验室项目需求,本人在GPU上完成了一些医疗成像算法的加速。由于人工智能的爆发,笔者顺利找到了一份GPU优化的工作。如今即将毕业,笔者经过一年多的学习...
OpenCL
Synchronization Functions (同步函数)
OpenCL
Synchronization Functions (同步函数)
OpenCL
3.0 Reference Pages ->
OpenCL
Compiler -> Built-in Functions -> Sync Functions 对于一个内核函数,会有多个 work-groups 参与计算。每个 work-group
中
会有多个 work-items 参与计算。在
OpenCL
中
定义了一个相对宽松的同步机制,多个 work-groups 之间没办法同步;而在同一个
AMD
OpenCL
Programming Guide -
OpenCL
Architecture
AMD
OpenCL
Programming Guide -
OpenCL
Architecture https://rocmdocs.amd.com/en/latest/Programming_Guides/
Opencl
-programming-guide.html 5.
Memory
Architecture and Access - 内存架构和访问
OpenCL
has four
memory
domains: private,
local
, global, and constant; the AMD
OpenCL和异构编程
604
社区成员
575
社区内容
发帖
与我相关
我的任务
OpenCL和异构编程
异构开发技术
复制链接
扫一扫
分享
社区描述
异构开发技术
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章