社区
OpenCL和异构编程
帖子详情
对于n卡 有没有工具可以分析我的opencl程序的利用率
youxia000
2013-11-07 05:29:07
学了几个月的opencl,也编写出了kernel,amd提供了个codex在vs2010里的插件可以看看gpu的利用率等等信息,想问下n卡有没有类似的,
或者说n卡怎么来优化呢
用opencl是想优化原来cpu版本的光线投射算法,移植之后的gpu速度提升不是特别理想,用codex分析才利用了10%的计算能力,调了下可以用到个50%,请教下高手对gpu的优化有哪些指导性意见
拜谢。
...全文
887
6
打赏
收藏
对于n卡 有没有工具可以分析我的opencl程序的利用率
学了几个月的opencl,也编写出了kernel,amd提供了个codex在vs2010里的插件可以看看gpu的利用率等等信息,想问下n卡有没有类似的, 或者说n卡怎么来优化呢 用opencl是想优化原来cpu版本的光线投射算法,移植之后的gpu速度提升不是特别理想,用codex分析才利用了10%的计算能力,调了下可以用到个50%,请教下高手对gpu的优化有哪些指导性意见 拜谢。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
6 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
longshen_ljj
2016-03-24
打赏
举报
回复
问下楼主研究的怎么样了,visual profiler能不能分析opencl程序?最近同样被N卡opencl程序分析搞的很蛋疼
youxia000
2013-11-24
打赏
举报
回复
好 我试试减少vector的计算,感谢版主 lcwyylcwyy。结贴吧 。免的忘记了
lcwyylcwyy
2013-11-18
打赏
举报
回复
N卡和A在最小并行粒度上是不同,而且其local存储器的可用空间好像也不一样
outstander
2013-11-18
打赏
举报
回复
从这个图来看,主要是因为vector寄存器使用过多,可尝试减少vector运算来进一步加速。
youxia000
2013-11-15
打赏
举报
回复
感谢关注 这是codexl给出的结果,我加上了个__attribute__((reqd_work_group_size(128, 8, 1))) 对a卡从10%提升到50% 但是n卡加上之后运行到clEnqueueNDRangeKernel报出-54 CL_INVALID_WORK_GROUP_SIZE的错误。不理解为什么。
我研究下cuda的profile。
outstander
2013-11-14
打赏
举报
回复
请贴出性能分析结果,否则很难给出意见。 印象中,cuda的profile不仅能给出cuda的分析也能分析opencl的,用法一样用profile运行即可。楼主可以试试
GDB 调试 Linux C / C++
# 论 调试能力在开发
程序
中的重要性 调试是开发流程中一个非常重要的环境,每个
程序
员都应具备调试代码的能力,尤其对于从事 Linux C/C++ 开发的用户,必须具备熟练使用 GDB 调试器的能力。俗话说你有十分技能,那么其中包含了六分开发能力和四分调试能力。这套 GDB 入门视频教程能够做到深入浅出,让同学们能够快速学会使用 GDB 调试
程序
。# GDB 简介 GNU symbolic debugger,简称GDB 调试器,是 Linux 平台下最常用的一款
程序
调试器。GDB 编译器通常以 gdb 命令的形式在终端(Shell)中使用,它有很多选项,这是我们要重点学习的。 发展至今,GDB 调试器已经对 C、C++、Go、Objective-C、
OpenCL
、Ada 等多种编程语言提供了支持。实际场景中,GDB 更常用来调试 C 和 C++
程序
,虽然 Linux 平台下有很多能编写 C、C++ 代码的集成开发
工具
(IDE),但它们调试代码的能力往往都源自 GDB 调试器。
OpenCL
与 CUDA
根据网站资料,简单地汇编一下CUDA与
OpenCL
的区别。如有错误请指出。 题外话: 美国Sandia国家实验室一项模拟测试证明:由于存储机制和内存带宽的限制,16核、32核甚至64核处理器对于超级计算机来说,不仅不能带来性能提升,甚至可能导致效率的大幅度下降。 什么是
OpenCL
? 是由苹果(Apple)公司发起,业界众多著名厂商共同制作的面向异构系统通用目的并行编程的开放式、免费标准
Chart 4 Adreno
OpenCL
应用
程序
开发
Adreno GPUs 调试
性能优化-一文宏观理解
OpenCL
OpenCL
概述
OpenCL
架构与原理
OpenCL
开发环境搭建
OpenCL
数据类型与运算
OpenCL
并行计算优化
OpenCL
图像处理应用
OpenCL
性能
分析
与调试
OpenCL
Workshop 1 —— 数字音频滤波
Introduction 这两年深度学习大火,Cuda跟着吃红利,
OpenCL
发展也很快。虽然
OpenCL
不是事实上的标准,但是作为开放标准,适应性是很强的,除了显
卡
之外,CPU/FPGA上都可以执行。 第一个
OpenCL
Workshop的具体目标就是编写一个音频文件升频
工具
,用来给PCM编码的WAV文件四倍频,把升频结果写到一个新的WAV文件里面。 用于升频的主要方法,数字滤波,可以广泛...
OpenCL和异构编程
602
社区成员
575
社区内容
发帖
与我相关
我的任务
OpenCL和异构编程
异构开发技术
复制链接
扫一扫
分享
社区描述
异构开发技术
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章