社区
CUDA
帖子详情
Cyrosly:Red-Black SOR迭代与解并行三角矩阵谁快?
chinecuda
2009-08-18 10:59:57
Cyrosly:
对于PDE问题,例如Poisson方程,CUDA并行求解,分块求解三对角矩阵(例如你Blog上的)与多重网格迭代(例如 Red-Black SOR)谁更快一些?您是否做过类似的对比?Red-Black SOR是否效率很低?
小可在此先谢过!
...全文
310
3
打赏
收藏
Cyrosly:Red-Black SOR迭代与解并行三角矩阵谁快?
Cyrosly: 对于PDE问题,例如Poisson方程,CUDA并行求解,分块求解三对角矩阵(例如你Blog上的)与多重网格迭代(例如 Red-Black SOR)谁更快一些?您是否做过类似的对比?Red-Black SOR是否效率很低? 小可在此先谢过!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Cyrosly
2009-08-19
打赏
举报
回复
首先我那个求解三角矩阵方程方法一般配合LU,ILU或者cholesky,incomplete cholesky分解使用解线性方程组的直接解法,直接解法通常更快,但有时候受到有限的数据精度的限制而出现数值不稳定。但是处理对称正定或不定的问题时,使用用cholesky分解(LLT,LDLT)做预处理的PCG方法是个很有效的方法,因为cholesky数值稳定。Multigrid方法是理论上迭代法中收敛最快的方法(实际中也往往如此,但理论深度要求也是最高的)。MG方法一般用GS,weight-jacobi,SOR等迭代方法作为内迭代子,也就是说MG方法其实不是一种迭代方法,而只是经典迭代法加速收敛的手段。MG方法也可以用做PCG方法的预处理子,这方面的资料貌似很少,记得以前见过,如果找到就贴上来。另外MG方法分为AMG(代数多重网格方法)和GMG方法(几何多重网格),这2种方法各有优劣,但对于2维椭圆边值问题一样的有效。
最后你的问题:没有比较过,但是Red-black SOR的单步迭代消耗肯定比MG小.
依照我个人的看法,Red-black可以认为是一种“伪二重MG”方法(细网格隐藏在数据层,而粗网格则是由跨格计算确定),因为MG的实质是在不同的频域减弱各个频段的误差(细网格消除高频误差,粗网格消除低频误差,而在以往的迭代法中高频误差一般小时的很快,而低频误差则很慢(也即为什么收敛慢的原因),因此MG使用粗网格快速消除低频误差以达到快速收敛的目的),而RB方法每一步相当于在比原始细网格大一倍的尺寸的粗网格上进行迭代,而数据则是细致的密度分布,但是
每一步的迭代都是在粗网格上单向迭代(没有从粗网多细网的延拓过程),因此认为是一种不完全的“伪二重MG”方法更为符合逻辑和直觉(纯属个人愚见)
chinecuda
2009-08-18
打赏
举报
回复
另:有些资料上把Red-Black SOR归为多重网格,有的归为多重着色,还有直接归为经典迭代,看得头晕,小可没有系统学过并行计算程序设计,理论上讲Red-Black SOR究竟属于什么算法?
Z782282738
2009-08-18
打赏
举报
回复
Black SOR
SOR
迭代
法
解
大型稀疏矩阵
用于求
解
大型稀疏矩阵,用非零法存贮矩阵,
iteration.rar_gauss-seidel
sor
_正定矩阵_雅克比矩阵_雅克比
迭代
_高斯
迭代
高斯
迭代
,雅克比
迭代
,
sor
迭代
,通过判断矩阵是否正定再进行各个操作
SOR
_
SOR
迭代
_
针对形如y=Hx+b线性方程组的
解
,此处特选H为hilbert矩阵,使用时只需选定阶数n,初始值x_0和
SOR
迭代
中的\omega值
Jacobi
迭代
Seidel
迭代
SOR
迭代
输入系数矩阵A,b,初始矩阵Y,可限定最大
迭代
次数M,和精度e. 关于
SOR
迭代
则需要输入松弛因子w.
SOR
超松弛
迭代
算法求
解
Ax=b方程组MATLAB源码
该MATLAB文件,以三阶实对称正定的系数矩阵为例,实现了
SOR
超松弛
迭代
算法求
解
方程组数值
解
。可扩展至任意维数。 【注】 如果发现中文乱码,请在购买后私信我
解
决。
CUDA
581
社区成员
2,919
社区内容
发帖
与我相关
我的任务
CUDA
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
复制链接
扫一扫
分享
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章