视觉目标的矢量化表征与内容生成技术

m0_74120090 2024-05-20 16:41:28

课时名称课时知识点
视觉目标的矢量化表征与内容生成技术Stable diffusion、SORA等新框架的问世,极大地提升了生成式人工智能(包括图像、图形、视频等)的视觉质量。然而,以概率分布拟合为目标的黑盒式深度网络模型的难以本质上消除语义结构错误、细节内容不精确不真实的难题,并且用户难以在各颗粒度上精确控制生成结果。此外,视觉模态数据维度极高,而目前生成式模型所采用的数据表征形式无法兼顾表征效率、计算密度、渲染质量、以及操控灵活性。 针对上述挑战,我们提出了视觉目标的矢量化表征与内容生成新框架,通过将视觉内容(图像、视频、2D/3D图形等)进行语义分层解构,形成不同颗粒度实例化视觉对象;对于各对象实例的内部形状空间,构建语义部件引导下的分布式
...全文
34 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

2

社区成员

发帖
与我相关
我的任务
社区管理员
  • m0_74120090
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧