如何在kernel中调用blas库函数处理矩阵，动态并行

zhang360896270 2014-12-13 08:37:26

各位路过大神好，我想在CUDA的global kernel 函数中调用cublas函数做矩阵计算，但是编译时提示在global函数中无法调用host函数，我知道blas也是利用kernel进行的矩阵运算的处理，因此需要在kernel里面调用kernel，我用的CUDA版本是最新的6.5，照理来讲应该kernel支持动态并行呀，请问有没有什么方式能够处理？
我已经查找了一些资料，但是还是没能找到特别有用的，万不得以当一次伸手党，望各位神牛帮助！！！谢谢

...全文

312 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

深度学习计算的利器：BLAS和GEMM GPU的CUDA编程方法及在Darknet的应用 YOLOv3的程序流程及各层的源码解析本课程将提供注释后的Darknet的源码程序文件。除本课程《YOLOv3目标检测：原理与源码...

Intel visual Fortran 调用 MKLMKL 是 BLAS， LAPACK 和 ScalLAPACK 等函数库集成的数学例程。其中，Lapack 包含了求解科学与工程计算中最常见的数值线性代数问题。 1）关于调用MKL IVF的设置 a)项目——属性——...

　我们都知道，GPU的并行运算性能是极为强悍的，如此丰富的计算资源如果浪费着不用，就用来跑跑游戏是远远不行的。而传统的图形API又单单的只提供了图形操作的功能，没有提供类似于CPU那样通用计算的接口，所以说...

它提供了一个简单易用的接口，使用者可以方便地调用cuBLAS库中的函数，而不需要关注底层的实现细节。此外，cuBLAS还支持多GPU环境，可以在多个GPU之间进行分布式计算，从而加速大规模的计算任务。使用CUDA流编写代码...

不同类型的代码由于其运行的物理位置不同，能够访问到的资源不同，因此对应的运行期组件也分为公共组件、宿主组件和设备组件三个部分，基本上囊括了所有在GPGPU开发中所需要的功能和能够使用到的资源接口，开发人员...

CUDA on Windows XP

231

社区成员

424

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章