3D高斯泼溅去雾重建:两阶段框架解决多视角一致性难题

3D高斯泼溅多视角一致性去雾
于 2026-05-29 03:02:44 修改
·本内容遵循CC 4.0 BY-SA版权协议

1. 项目概述与核心挑战

在计算机视觉与图形学领域,从一组多视角图像中重建出高质量的3D场景并合成任意新视角的逼真画面,一直是研究的热点。3D高斯泼溅(3D Gaussian Splatting, 3DGS)技术的出现,以其出色的渲染质量和实时性能,为这一目标带来了新的突破。然而,当输入图像被现实世界中的烟雾、雾霾等大气散射效应所污染时,重建任务就变得异常棘手。烟雾不仅降低了图像的对比度和色彩保真度,更关键的是,它破坏了不同视角之间本应存在的几何与光度一致性。想象一下,你试图用几张在不同时间、不同烟雾浓度下拍摄的模糊照片,去拼凑出一个清晰、连贯的3D模型,这几乎是不可能的任务。

传统的解决方案通常遵循两条路径:一是先对每张图进行独立的2D去雾处理,再将“干净”的图片喂给3D重建模型;二是尝试构建一个端到端的、能够同时建模场景几何与烟雾散射的3D模型。但我们在实践中发现,这两条路都存在根本性的矛盾。单帧去雾模型,比如目前效果拔群的生成式模型,确实能把单张图处理得清晰亮丽,但它们“各自为政”,处理不同视角时会产生随机的颜色偏移、纹理细节差异甚至“脑补”出不一致的内容。把这些不一致的“伪干净”图像用于3DGS训练,模型会陷入混乱:它不知道该相信哪个视角的“事实”,最终只能通过模糊化、平均化来妥协,导致合成的新视图一片模糊,或者产生漂浮的伪影。而端到端的3D去雾方法,虽然天生保证了多视角一致性,但在缺乏强先验约束的情况下,模型很容易“偷懒”,直接忽略烟雾成分,把退化图像当作干净场景来重建,结果就是去雾失败。

因此,我们工作的核心,就是直面并解决这个“去雾质量”与“多视角一致性”之间的根本矛盾。我们提出了 Dehaze-then-Splat 这一两阶段框架。第一阶段,我们毫不妥协地追求极致的单帧去雾质量,利用强大的生成式模型为每张图生成“伪干净”图像。第二阶段,我们承认并正视第一阶段引入的不一致性,在3DGS的训练过程中,巧妙地引入一系列基于物理先验的辅助损失函数,作为隐式的多视角一致性正则器,引导模型穿越噪声,学习到背后真正干净、一致的3D场景。最终,在NTIRE 2026挑战赛的Akikaze烟雾场景上,我们的方法将新视图合成的PSNR提升至20.98 dB,比不加正则化的基线提高了整整1.50 dB。这不仅仅是数字的提升,更是对“先修复再重建”这一经典范式的一次深刻反思与有效增强。

2. 核心思路:两阶段框架的深度解构

我们的 Dehaze-then-Splat 框架之所以有效,在于它没有试图用一个“银弹”模型解决所有问题,而是将复杂的任务解耦,并在每个阶段注入针对性的先验知识。下面,我将详细拆解这两个阶段的设计哲学与内在逻辑。

2.1 第一阶段:生成式去雾与数据预处理

第一阶段的目标非常明确:为后续的3D重建提供质量尽可能高的输入图像。这里,“质量高”有两个层面的含义:一是单张图的去雾效果要好,二是要尽量减少不同图片之间的不一致性。

生成式模型的选择:为什么是Nano Banana Pro? 在众多去雾方法中,我们选择了基于Gemini API的Nano Banana Pro图像生成能力。这背后有几点考量:

  1. 卓越的恢复能力:与传统的基于物理模型的方法(如暗通道先验DCP)或早期的深度学习模型相比,生成式模型具备强大的“内容理解”与“信息补全”能力。对于被浓雾严重遮挡的区域,判别式模型往往只能做平滑或产生伪影,而生成式模型可以基于对场景的语义理解,“幻觉”出合理的细节,这对于后续重建出完整的几何结构至关重要。
  2. 保真度与可控性:通过精心设计的提示词(Prompt),我们可以精确控制生成过程。我们的实践表明,一个结构化的6点提示词(明确指定去除烟雾、保留场景构图、几何结构和真实感外观)比简单的4句描述平均能带来0.44 dB的PSNR提升。这让我们能够引导模型朝着有利于3D重建的方向进行修复。
  3. 性能天花板:如表4所示,经过亮度归一化后,Nano Banana Pro在Akikaze训练集上达到了20.07 dB的单帧PSNR,显著优于MB-TaylorFormer(17.00 dB)和DCP(约11.9 dB)。这为整个流程的性能设定了一个理论上限。

亮度归一化:解决最显眼的不一致 生成式模型独立处理每一帧,带来的最直接问题就是帧间亮度不一致。我们的测量显示,相邻帧之间的最大亮度偏移可达0.12。如果不加处理,3DGS在优化时会接收到关于同一3D点颜色的矛盾信号,它只能学习一个折中的、模糊的颜色值。为此,我们实施了逐通道的均值/标准差归一化。在有真实干净图像(GT)的场景(如Akikaze),我们直接将伪干净图像对齐到GT的亮度统计量上,这带来了+0.8 dB的显著提升。对于没有GT的场景,则采用所有帧的中值统计量进行自归一化,成功将最大亮度跳跃从0.12降低到0.001。

注意:亮度归一化只解决了全局的、零阶的光度不一致。更棘手的局部纹理差异、生成内容的随机性以及颜色渲染的细微差别,依然存在。这正是第二阶段需要攻克的核心难题。

2.2 第二阶段:物理先验引导的3DGS训练

第二阶段是整个框架的灵魂。我们不再幻想输入数据是完美的,而是将第一阶段输出的、带有不一致性的“伪干净”图像视为含噪观测,通过设计巧妙的损失函数,让3DGS模型在优化过程中“去伪存真”。

核心矛盾与观察 我们通过实验观察到一个关键现象:当使用这些不一致的图像训练3DGS时,模型的最佳检查点往往出现在训练早期(例如第2000步,此时高斯点数量约10.4万)。随着训练继续,高斯点数量爆炸式增长(可达93.3万),但新视图合成的质量却急剧下降,出现严重的漂浮伪影、颜色渗出和结构坍塌。这说明,模型在后期拥有了足够的容量去“记忆”每一张输入视图特有的噪声和伪影,而不是学习

最低 0.47元/天 开通会员,解锁全文
left
成为会员后, 你将解锁
right
benefits 下载资源随意下
benefits 优质VIP博文免费学
benefits 优质文库回答免费看
benefits 付费资源9折优惠
3D高斯泼溅技术解析[项目源码]
得益于这些优势,3D高斯泼溅技术在新视角合成、场景重建、虚拟现实等多个领域中得到了广泛的应用。
24
3D高斯泼溅技术[项目源码]
在学术界和工业界,3D高斯泼溅技术的研究和开发正在不断推进,未来有望进一步解决其局限性问题,提升技术的实用性和广泛应用性。随着技术的发展,预计将有更多创新成果涌现,带动三维重建技术和相关领域的进步。
17
3d高斯泼溅 转换模型怎么分开
本文探讨了如何将3D高斯泼溅模型进行分离处理,核心在于场景分解和局部高斯编辑。通过高斯分组技术将场景分解为独立对象组,并对每个组进行独立操作,如删除、替换或风格转换。最后,通过动态重组和渲染优化,将编辑后的高斯组重新合成一个完整的场景,同时保持实时渲染性能和光照一致性
LQmyq
3D高斯泼溅模型部署
本文详细介绍了部署3D高斯泼溅模型的全过程,包括环境搭建、数据收集与预处理、模型训练以及渲染引擎对接等关键步骤。文中提供了具体的代码示例和操作指导,旨在帮助开发者高效地实现模型部署。
m0_65160493
3D高斯泼溅技术综述[代码]
三维高斯泼溅技术是三维重建和表示领域的一项重要技术,它通过数百万个可学习的3D高斯实现实时渲染和高度的可编辑性。这种技术被称为3D GS,是一种显式场景表示技术。
失眠邮局
19
高斯泼溅建筑模型
高斯泼溅技术是一种三维场景表示和渲染技术,通过3D高斯点替代传统几何结构来表达复杂视觉细节。该技术适用于大规模场景建模,如城市景观和建筑设计。文章介绍了高斯泼溅的核心原理、在建筑模型中的应用场景,以及实现步骤和推荐工具。
fight2346
反向高斯泼溅
反向高斯泼溅是一种计算机图形学和图像处理领域的高效渲染和重建技术。它通过逆向映射和高斯核函数权重分配,优化求解过程,以实现高质量的表面重建。本文通过代码示例展示了该技术的基本框架
WL__1006
3d高斯泼溅Windows部署
本文介绍了在Windows平台上部署3D高斯泼溅效果的步骤和方法。首先,利用虚幻引擎强大的工具链,通过材质编辑器创建自定义着色器和使用Niagara粒子系统模拟高斯分布。其次,讨论了数据预处理和模型导入的重要性,以及网格资产格式转换的未来趋势。最后,通过C++代码片段展示了如何设置Niagara发射器模块内的变量值。
weixin_57400449
3d高斯泼溅的深度信息在哪里
本文详细介绍了3D高斯泼溅效果中深度信息的实现原理、关键步骤、优化方法以及相关资源。首先解释了深度信息的实现原理,包括点云预处理、协方差矩阵优化和渲染管线中的深度排序。接着提供了关键实现步骤的代码示例,并阐述了深度优化方法,如深度正则化、多视图一致性和深度边缘增强。最后,列出了官方代码库、相关论文和社区资源,以供进一步学习和参考。
m0_62991671
3D高斯泼溅结合NeRF
本文探讨了将3D高斯泼溅(3DGS)与神经辐射场(NeRF)技术相结合的方法。首先比较了两种技术的渲染方式,然后分析了协方差矩阵转换的重要性,接着提出了几种融合策略,包括使用3DGS作为NeRF的基础几何结构、动态流矢量学习以及分层渲染架构。最后,通过伪代码示例展示了实现过程,并讨论了面临的挑战与未来发展方向。
weixin_48227877
3D高斯泼溅3D Gaussian Splatting)介绍--论文解析及使用以及在自定义数据集上的训练
本文深入解析3D高斯泼溅3D Gaussian Splatting)的技术原理,涵盖其与摄影测量、NeRF的对比,投影机制、协方差变换、自适应密度控制及基于瓦片的光栅化流程。文章还介绍了如何使用gSplat在自定义数据集上训练模型,并讨论了该方法在实时渲染和三维重建中的优势与局限。
搬砖者(视觉算法工程师)
2352
高斯泼溅】3DGS三维重建实战
本文介绍基于高斯泼溅3D重建技术,利用点云和多视角图像实现实时、高效渲染。相比传统NeRF方法,该技术具备训练时间短、支持动态场景与高FPS渲染优势,适用于室内三维建模及实景三维应用。
智慧空间实验室
1416
3D高斯泼溅3D Gaussian Splatting, 3DGS) 的核心原理
本文详细介绍了3D高斯泼溅(3DGS)的核心原理,包括其数学基础、关键技术步骤及与NeRF的区别。3DGS通过显式建模将场景表示为大量可学习的3D高斯椭球,并利用可微分光栅化实现高效实时渲染。该方法具有良好的可编辑性和优化能力,在实时渲染和场景编辑中表现出显著优势。
写代码的橘子n
2417
SpatialGen如何用3D高斯重建技术突破AI视频生成的时空一致性瓶颈
SpatialGen通过多视角扩散生成一致性的2D图像集,再利用3D高斯泼溅(3DGS)重建物理准确的可微分3D场景,从根本上解决AI视频生成中的时空不一致问题。该方法兼顾高效渲染、可编辑性与强几何约束,显著提升视频中物体位置、遮挡及光影的跨帧一致性,适用于室内设计、虚拟制片、机器人仿真等需严谨空间建模的领域。
字节杂耍者
979
3D高斯泼溅:实时高质量场景重建的技术革命
3D高斯泼溅技术通过将场景表示为各向异性高斯分布的集合,结合可微渲染与梯度优化,实现了实时高性能的3D场景重建。该技术在渲染质量、训练速度和内存效率方面显著优于传统方法,已在多个行业展开应用,并具备良好的硬件适配性和未来发展潜力。
荣杏姣Samantha
847
3D高斯泼溅技术革命重塑实时渲染与场景重建的未来图景
3D高斯泼溅技术通过各向异性高斯分布建模与可微渲染管线,实现高质量、实时的3D场景重建。其在计算效率、视觉保真度和多设备兼容性方面显著优于传统方法,广泛应用于智慧城市、虚拟现实与医疗影像等领域。
颜钥杉Harriet
897
IROS 2025 | 清华等提出CRUISE高斯泼溅打造可编辑的V2X数字孪生世界
本文介绍IROS 2025收录的CRUISE框架,该框架基于分解式高斯泼溅技术,实现车路协同场景的高保真重建与灵活编辑。结合GPT-4o生成合理交通行为,支持动态目标注入与多视角数据合成,有效提升V2X感知模型训练效果,解决了稀缺corner case数据生成难题
我爱计算机视觉
1126
高斯泼溅(Gaussian Splatting)技术浅析
高斯泼溅技术是通过高斯分布光栅化实现从图像样本实时渲染逼真场景的技术,利用3D高斯点表达场景。它有实时性能好、渲染质量高、显存效率高、可编辑等优势,但也存在动态场景处理弱等局限。常见于数字孪生、增强现实、自动驾驶等领域。
4657
3D高斯泼溅实战5分钟用COLMAP+SfM搭建你的第一个3D场景(附避坑指南)
本文介绍如何利用COLMAP与运动恢复结构(SfM)技术,在5分钟内完成从多视角图像到3D高斯泼溅场景的端到端重建。涵盖环境配置、图像采集规范、稀疏点云转高斯表示、模型训练优化(含分裂/修剪/参数更新)、可视化及导出,并提供CUDA内存不足、特征匹配失败等常见问题的规避方案。
vv45678
706
3D高斯泼溅技术在数字孪生与自动驾驶仿真中的应用
本文介绍基于3D高斯泼溅(3DGS)的纯视觉数字孪生重建技术,解决几何精度与材质真实性协同建模难题。核心技术包括混合高斯表示策略、材质-几何联合优化、双阶段材质分割网络及物理材质映射,支持照片级渲染与物理一致的LiDAR反射率仿真。已在自动驾驶仿真(CARLA/Prescan)和工业数字孪生(西门子Xcelerator)落地验证,重建效率提升73%,反射率误差控制在±8%内。
weixin_30873847
585
3D高斯泼溅技术实战全解析从入门到精通
本文深入讲解3D高斯泼溅技术的原理与实现,涵盖可微分渲染、CUDA加速、批量处理与分布式训练等核心技术。详细介绍了环境搭建、性能调优及视觉质量提升方法,并分析其适用场景与技术局限性,为3D场景重建提供高效解决方案。
尹田凌Luke
1158
3D高斯泼溅技术从混沌到有序的实时渲染革命
3D高斯泼溅技术通过可学习的高斯分布实现高质量、实时的3D场景重建,克服了传统方法在渲染质量、训练效率和几何适应性方面的局限。该技术融合深度学习与图形学,适用于文化遗产数字化、工业检测和自动驾驶等领域,并支持高效训练与多GPU加速。
裴驰欣Fitzgerald
1111
3D高斯泼溅实战宝典从零开始打造惊艳3D场景
本文介绍如何使用开源工具gsplat实现3D高斯泼溅技术,从安装配置到场景重建全流程指导。涵盖照片生成3D模型、训练优化技巧及实时预览功能,帮助用户快速构建高质量、逼真的3D场景,适用于VR、AR和数字孪生等领域。
凌爱芝Sherard
830
5步精通3D高斯泼溅:从零到专家的完整攻略
本文系统讲解3D高斯泼溅技术的核心原理与实战应用,涵盖从环境搭建、数据处理到性能优化的全流程。重点分析其可微渲染管线与高斯分布学习机制,并介绍在文化遗产数字化、工业检测和自动驾驶等领域的落地案例,帮助读者掌握这一高性能3D重建前沿技术。
蒋闯中Errol
641
3D高斯泼溅与曲率变形实现面部卡通化
本文提出一种融合3D高斯泼溅与曲率变形的面部卡通化方法,在三维空间直接操作高斯点云,利用自适应协方差建模和基于主曲率的形变场生成,兼顾几何保真与风格表达。关键技术包括多视角点云重建、MLS曲率估计、锚定约束下的动态形变及WebGL实时渲染优化,有效解决2D方法失真与纯3D拓扑破坏问题。
weixin_33696106
648
面向数字孪生中3D世界重建的材料感知高斯泼溅
本文提出一种仅使用相机的数字孪生3D重建方法,结合3D高斯泼溅与语义材料分割,实现高质量几何重建和基于物理的材料属性分配。通过将2D材料掩码投影到3D网格表面,支持精确的传感器模拟,在无激光雷达情况下达到与激光雷达-相机融合相当的反射率仿真精度,适用于ADAS开发。
1126
3D高斯泼溅技术在火焰动态重建中的应用与优化
本文提出基于3D高斯泼溅(3DGS)的火焰三维动态重建方法,解决其透明性、高频动态及湍流建模难题。核心技术包括光流引导的高斯初始化、FreeTimeGS时空参数化(含中心时间、生命周期与线性速度)、微秒级硬件同步及滚动快门补偿。在400fps三视角GoPro数据上验证了优于4DGS等基线的效果,并给出稀疏视角重建、体素粒度调优与HSV光流鲁棒增强等工程实践要点。
weixin_30566111
595
3D高斯泼溅技术实战指南从零构建高质量3D场景重建
本文深入讲解3D高斯泼溅技术的原理与实战部署,涵盖环境配置、数据处理、训练优化及性能提升策略。该技术通过可学习的高斯分布实现高质量、实时3D场景重建,在文化遗产保护、工业检测和自动驾驶等领域具有广泛应用前景。
章雍宇
670
深度解析3D高斯泼溅技术从原理到实战的完整指南
本文深入解析3D高斯泼溅技术的原理与应用,涵盖可微渲染、高斯分布优化及多GPU训练等核心技术。该技术通过数百万可学习高斯实现高质量实时3D重建,在建筑数字化、工业检测等领域具有广泛应用前景。
萧俭亚Ida
1049
动态高斯泼溅技术:3D重建与冻结时间效果解析
本文深入解析动态高斯泼溅技术,重点阐述其通过引入时间维度与变形网络实现动态场景3D重建的原理;提出Splannequin方法,包含问题高斯检测(隐藏/缺陷高斯)、时间锚定正则化及分阶段训练策略;在Mannequin Challenge等真实视频上验证了其在冻结时间效果下的高质量多视角渲染能力,显著抑制鬼影与模糊,兼顾实时性(280FPS)与精度。
weixin_30800807
384