社区
高性能计算
帖子详情
基于多GPU的BLAS3开发,完全超越商业版NVIDIA cuBLAS-XT
github_32284901
2015-10-24 11:08:26
最终试验数据证明,我们比商业版的cuBLAS-XT快20%, 而且少200%的通信。应用有很多,比如把MATLAB变成超级计算机,R,还有Mathmatica。做图的最短距离,材料结构等等等等。具体可以看论文的应用章节。如果有问题,大家可以在github下给我留言。
源代码:https://github.com/linnanwang
论文地址:http://arxiv.org/pdf/1510.05041v1.pdf
...全文
508
1
打赏
收藏
基于多GPU的BLAS3开发,完全超越商业版NVIDIA cuBLAS-XT
最终试验数据证明,我们比商业版的cuBLAS-XT快20%, 而且少200%的通信。应用有很多,比如把MATLAB变成超级计算机,R,还有Mathmatica。做图的最短距离,材料结构等等等等。具体可以看论文的应用章节。如果有问题,大家可以在github下给我留言。 源代码:https://github.com/linnanwang 论文地址:http://arxiv.org/pdf/1510.05041v1.pdf
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
1 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
ljb1672
2015-12-02
打赏
举报
回复
拽!有QR求特征值的算法?
1.
cu
BLAS
开发
指南中文版--简介
cu
BLAS
库是
BLAS
(基本线性代数子程序)在
NVIDIA
®
CU
DA™ 运行时之上的实现。它允许用户访问
NVIDIA
图形处理单元 (
GPU
) 的计算资源。
cu
BLAS
API,在本文档中简称为
cu
BLAS
API(从
CU
DA 6.0 开始),(从
CU
DA 6.0 开始),以及(从
CU
DA 10.1 开始)......
3.
cu
BLAS
开发
指南中文版--
cu
BLAS
数据类型引用
它的值对应于 Fortran 字符“N”或“n”(非转置)、“T”或“t”(转置)和“C”或“c”(共轭转置),这些字符通常用作传统
BLAS
的参数 实施。它的值对应于 Fortran 字符“N”或“n”(非单位)和“U”或“u”(单位),这些字符通常用作传统
BLAS
实现的参数。它的值对应于 Fortran 字符“L”或“l”(下)和“U”或“u”(上),这些字符通常用作传统
BLAS
实现的参数。这是 16 位半精度浮点和所有至少具有 16 位半精度的计算和中间存储精度的默认和最高性能模式。....
GPU
计算加速-
cu
blas
加速
前言: 因为要对一个矩阵进行优化加速,原有的open
blas
矩阵计算方法只是适合在做CPU端的加速,如果在线上有了
GPU
,这就使得使用
GPU
加速成为可能,并且也许会获得比较不错的性能结果。所以进行了尝试,进行矩阵的加速运算。 第一部分: 相关背景和硬件信息介绍;使用的
GPU
为1080Ti,使用的
cu
da版本是8.0版本;驱动版本是384.111;相较于open
blas
需要自...
CU
DA:
CU
BLAS
- hello
cu
blas
/*=======================================================================* 度假中,在青岛这块曾经应该很熟悉的土地上,另一半在围着病人们转悠* 所以自己在酒店里,也不想出去,听听歌,写写文章。===================================================================
关于
BLAS
的简单介绍
BLAS
(Basic Linear Algebra Subprograms基础线性代数程序集)是进行向量和矩阵等基本线性代数操作的事实上的数值库。这些程序最早在1979年发布,是LAPACK(Linear Algebra PACKage)的一部分,便于建立功能更强的数值程序包。
BLAS
库在高性能计算中被广泛应用,由此衍生出大量优化版本,如Intel 的Intel MKL,AMD的ACML,Goto
BLAS
和ATLAS等非硬件厂商优化版本,以及利用
GPU
计算技术实现的
CU
BLAS
等。
BLAS
的构成 BL
高性能计算
2,408
社区成员
1,024
社区内容
发帖
与我相关
我的任务
高性能计算
高性能计算
复制链接
扫一扫
分享
社区描述
高性能计算
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章