11
社区成员
发帖
与我相关
我的任务
分享在生成式AI领域,扩散模型凭借高质量的生成效果成为核心技术之一,其核心逻辑源于“渐进式加噪与反向去噪”的简单思路。不同于GAN的对抗训练,扩散模型通过模拟“墨滴扩散”的自然过程构建生成链路。
前向扩散过程中,模型会逐步向清晰样本(如图像)添加微小高斯噪声,经过数百甚至上千步迭代,最终将样本转化为完全随机的噪声。这一过程遵循马尔可夫链特性,每个时刻的样本状态仅依赖于上一时刻,保证了过程的可计算性。当迭代步数足够多时,最终噪声会趋近于标准正态分布,为反向生成奠定基础。
反向扩散过程则是前向过程的逆运算,模型通过学习去除噪声的规律,从纯噪声中逐步还原出清晰样本。关键在于模型并非直接预测清晰样本,而是预测每一步添加的噪声,通过不断消除噪声实现生成。这种“化整为零”的设计,将复杂的生成任务拆解为无数简单的去噪任务,既提升了训练稳定性,又保证了生成样本的细节丰富度。如今,这一原理已成为Stable Diffusion等主流生成工具的技术底座。