视觉目标的矢量化表征与内容生成技术

m0_74120090 2024-05-20 16:41:28

课时名称	课时知识点
视觉目标的矢量化表征与内容生成技术	Stable diffusion、SORA等新框架的问世，极大地提升了生成式人工智能（包括图像、图形、视频等）的视觉质量。然而，以概率分布拟合为目标的黑盒式深度网络模型的难以本质上消除语义结构错误、细节内容不精确不真实的难题，并且用户难以在各颗粒度上精确控制生成结果。此外，视觉模态数据维度极高，而目前生成式模型所采用的数据表征形式无法兼顾表征效率、计算密度、渲染质量、以及操控灵活性。针对上述挑战，我们提出了视觉目标的矢量化表征与内容生成新框架，通过将视觉内容（图像、视频、2D/3D图形等）进行语义分层解构，形成不同颗粒度实例化视觉对象；对于各对象实例的内部形状空间，构建语义部件引导下的分布式

课时名称

课时知识点

Stable diffusion、SORA等新框架的问世，极大地提升了生成式人工智能（包括图像、图形、视频等）的视觉质量。然而，以概率分布拟合为目标的黑盒式深度网络模型的难以本质上消除语义结构错误、细节内容不精确不真实的难题，并且用户难以在各颗粒度上精确控制生成结果。此外，视觉模态数据维度极高，而目前生成式模型所采用的数据表征形式无法兼顾表征效率、计算密度、渲染质量、以及操控灵活性。针对上述挑战，我们提出了视觉目标的矢量化表征与内容生成新框架，通过将视觉内容（图像、视频、2D/3D图形等）进行语义分层解构，形成不同颗粒度实例化视觉对象；对于各对象实例的内部形状空间，构建语义部件引导下的分布式

...全文