社区
CUDA
帖子详情
Cyrosly:Red-Black SOR迭代与解并行三角矩阵谁快?
chinecuda
2009-08-18 10:59:57
Cyrosly:
对于PDE问题,例如Poisson方程,CUDA并行求解,分块求解三对角矩阵(例如你Blog上的)与多重网格迭代(例如 Red-Black SOR)谁更快一些?您是否做过类似的对比?Red-Black SOR是否效率很低?
小可在此先谢过!
...全文
372
3
打赏
收藏
Cyrosly:Red-Black SOR迭代与解并行三角矩阵谁快?
Cyrosly: 对于PDE问题,例如Poisson方程,CUDA并行求解,分块求解三对角矩阵(例如你Blog上的)与多重网格迭代(例如 Red-Black SOR)谁更快一些?您是否做过类似的对比?Red-Black SOR是否效率很低? 小可在此先谢过!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Cyrosly
2009-08-19
打赏
举报
回复
首先我那个求解三角矩阵方程方法一般配合LU,ILU或者cholesky,incomplete cholesky分解使用解线性方程组的直接解法,直接解法通常更快,但有时候受到有限的数据精度的限制而出现数值不稳定。但是处理对称正定或不定的问题时,使用用cholesky分解(LLT,LDLT)做预处理的PCG方法是个很有效的方法,因为cholesky数值稳定。Multigrid方法是理论上迭代法中收敛最快的方法(实际中也往往如此,但理论深度要求也是最高的)。MG方法一般用GS,weight-jacobi,SOR等迭代方法作为内迭代子,也就是说MG方法其实不是一种迭代方法,而只是经典迭代法加速收敛的手段。MG方法也可以用做PCG方法的预处理子,这方面的资料貌似很少,记得以前见过,如果找到就贴上来。另外MG方法分为AMG(代数多重网格方法)和GMG方法(几何多重网格),这2种方法各有优劣,但对于2维椭圆边值问题一样的有效。
最后你的问题:没有比较过,但是Red-black SOR的单步迭代消耗肯定比MG小.
依照我个人的看法,Red-black可以认为是一种“伪二重MG”方法(细网格隐藏在数据层,而粗网格则是由跨格计算确定),因为MG的实质是在不同的频域减弱各个频段的误差(细网格消除高频误差,粗网格消除低频误差,而在以往的迭代法中高频误差一般小时的很快,而低频误差则很慢(也即为什么收敛慢的原因),因此MG使用粗网格快速消除低频误差以达到快速收敛的目的),而RB方法每一步相当于在比原始细网格大一倍的尺寸的粗网格上进行迭代,而数据则是细致的密度分布,但是
每一步的迭代都是在粗网格上单向迭代(没有从粗网多细网的延拓过程),因此认为是一种不完全的“伪二重MG”方法更为符合逻辑和直觉(纯属个人愚见)
chinecuda
2009-08-18
打赏
举报
回复
另:有些资料上把Red-Black SOR归为多重网格,有的归为多重着色,还有直接归为经典迭代,看得头晕,小可没有系统学过并行计算程序设计,理论上讲Red-Black SOR究竟属于什么算法?
Z782282738
2009-08-18
打赏
举报
回复
Black SOR
45、线性系统
迭代
方法的
并行
实现
本文详细探讨了线性方程组
迭代
方法的
并行
实现,涵盖高斯-赛德尔
迭代
、逐次超松弛(
SOR
)和红黑排序等技术。针对密集与稀疏矩阵,分析了不同数据分布策略下的
并行
性来源、通信开销与收敛速度,并提供了基于MPI的代码示例。结合性能分析与实际应用考虑,给出了方法选择建议与优化策略,适用于科学计算中大规模线性系统的高效求
解
。
58、线性方程组求
解
算法:从
迭代
法到共轭梯度法
本文介绍了线性方程组求
解
的两种主要算法:基于红黑排序的
迭代
法(包括高斯-赛德尔和
SOR
方法)以及共轭梯度法。详细探讨了它们的数学原理、
迭代
公式和
并行
实现策略,包括数据分布、同步与通信等关键问题。通过对比分析,帮助读者根据问题特性选择合适的求
解
方法,并在
并行
环境下实现高效计算。
解
线性方程组
迭代
法详
解
与实战
高斯消元法是一种经典的直接求
解
方法,其基本思想是通过初等行变换将增广矩阵 $ [A|\mathbf{b}] $ 化为阶梯形矩阵,再回代求
解
。例如,考虑如下线性方程组:对应的增广矩阵为:通过初等行变换,将其化为上
三角矩阵
,例如:A = [1 2 1;3 8 1;0 4 1];b = [2;12;2];Ab = [A b];% 第一步:消去第二行第一个元素% 第二步:消去第三行第二个元素最终得到阶梯形矩阵,再通过回代即可求得
解
。
46、线性方程组求
解
算法:从共轭梯度法到稀疏矩阵的Cholesky分
解
本文系统介绍了求
解
线性方程组的多种高效算法,包括适用于红黑排序离散泊松方程的
并行
SOR
方法、用于对称正定矩阵的共轭梯度法,以及针对稀疏矩阵的Cholesky分
解
技术。文章详细分析了各算法的原理、
并行
实现策略、数据依赖关系及优化方法,并对比了不同算法的适用场景与性能特点。通过结合
并行
计算与结构优化,这些方法在科学计算与工程应用中展现出强大的求
解
能力,未来可进一步拓展至GPU加速、预条件优化与跨领域应用。
46、线性方程组的求
解
算法:共轭梯度法与稀疏矩阵的Cholesky分
解
本文探讨了求
解
线性方程组的几种关键算法,重点包括
并行
SOR
方法、共轭梯度法和稀疏矩阵的Cholesky分
解
。分析了共轭梯度法在对称正定矩阵中的应用及其
并行
实现,同时详细描述了稀疏矩阵Cholesky分
解
的顺序算法、左看与右看策略以及超节点优化方法。这些方法适用于不同类型的矩阵,旨在提高求
解
效率和
并行
性能。
CUDA
589
社区成员
2,925
社区内容
发帖
与我相关
我的任务
CUDA
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
复制链接
扫一扫
分享
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章