Generative AI 新世界 | 走进文生图（Text-to-Image）领域

还记得在 2022 年 4 月，第一次读完 DALL-E-2 论文《Hierarchical Text-Conditional Image Generation with CLIP Latents》，那时的感觉是：惊为天人。只不过没想到在之后的一年里，这个文生图（Text-to-Image）领域发展得如此之快。DALL-E-2 论文我们下集再展开分析，这次先带大家看这篇论文里结构图里面的名词，是不是有些术语我们有些熟悉呢？是的，就是 CLIP。Source:上图是 DALL-E-2 模型主要架构。