用CUDA做稀疏矩阵的LU分解

tigerroses 2009-08-02 03:29:46
我在做毕业论文,导师让我用CUDA实现大型稀疏矩阵的LU分解。
我在NUMERICAL RECIPES in C里看到过LU分解可以用Crout或者Doolittle算法,但这都是顺序的,没法并行处理。
在一些英文网站上看到可以把稀疏矩阵化成块对角镶边阵(BDB),之后再对每一块LU分解,最后一步在host里顺序来做。但是没有看到具体的步骤或者算法,只有个介绍。
希望大家对以下问题有所帮助:
1,如何将一个稀疏矩阵化为块对角镶边阵(BDB)
2,在BDB或者原始稀疏矩阵的条件下,如何进行并行LU分解,具体步骤?
望大家出谋划策,提供相关算法的名字,或者代码。
如果有哪位好心人能够帮忙写出全部程序,愿以重金酬谢,联系本人QQ:315630328,注明CUDA。先谢过了
...全文
1072 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
caoshuhong 2011-08-09
  • 打赏
  • 举报
回复
你好,你的毕业设计结果如何啊?实现了gpu上的lu分解吗?最近我导师也是让我用cuda实现lu分解,感觉难度很大啊!我qq:568497060
fdxln 2011-07-12
  • 打赏
  • 举报
回复
你好,你有没有解复系数稀疏矩阵线性方程组的程序呀,或者实系数稀疏矩阵线性方程组的程序,据说LU分解可以,您不能给我发一下程序呀,我QQ283844879,感激不尽。
Maschinenwissen 2010-03-05
  • 打赏
  • 举报
回复
这个,我有完整的设计和代码,呵呵。但是比CULA速度稍微慢了一点点,有些地方优化的不够。
cuda2010 2010-03-04
  • 打赏
  • 举报
回复
有没有做过详细的性能测试?如果以DGEMM做参照物的话,目前GPU性能仅和CPU相当。而稀疏矩阵对GPU来说更优化更困难一些,双精度性能要超过CPU也许会比较困难啊。
xin_200 2010-03-04
  • 打赏
  • 举报
回复
GSS is the first sparse solver that supports CUDA.
lyhwinon 2009-12-02
  • 打赏
  • 举报
回复
用CULA吧。里边有。
Cyrosly 2009-08-03
  • 打赏
  • 举报
回复
呵呵,如果有酬金,这个项目我接了
  • 打赏
  • 举报
回复
找Cyrosly吧.

357

社区成员

发帖
与我相关
我的任务
社区描述
CUDA高性能计算讨论
社区管理员
  • CUDA高性能计算讨论社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧