基于多GPU的BLAS3开发,完全超越商业版NVIDIA cuBLAS-XT

github_32284901 2015-10-24 11:08:26
最终试验数据证明,我们比商业版的cuBLAS-XT快20%, 而且少200%的通信。应用有很多,比如把MATLAB变成超级计算机,R,还有Mathmatica。做图的最短距离,材料结构等等等等。具体可以看论文的应用章节。如果有问题,大家可以在github下给我留言。

源代码:https://github.com/linnanwang
论文地址:http://arxiv.org/pdf/1510.05041v1.pdf
...全文
508 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
ljb1672 2015-12-02
  • 打赏
  • 举报
回复
拽!有QR求特征值的算法?

2,408

社区成员

发帖
与我相关
我的任务
社区描述
高性能计算
社区管理员
  • 高性能计算社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧