社区
今天深度学习了吗
论文
帖子详情
CogVideoX - 大规模基于扩散Transformer的文字到视频生成模型
码流怪侠
优质创作者: 编程框架技术领域
领域专家: C/C++技术领域
2024-10-14 10:09:44
CogVideoX - 大规模基于扩散Transformer的文字到视频生成模型
...全文
37
回复
打赏
收藏
CogVideoX - 大规模基于扩散Transformer的文字到视频生成模型
CogVideoX - 大规模基于扩散Transformer的文字到视频生成模型
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
【论文阅读】
Cog
Video
X: Text-to-
Video
Diffusion Models with An Exp
er
t
Transform
er
Cog
Video
X是一种基于Diffusion
Transform
er
的新型文生
视频
系统,通过3DVAE编码器、专家
Transform
er
和渐进式训练等创新技术,实现了高质量的长
视频
生成
(10秒/16fps/768×1360分辨率)。该系统解决了现有
模型
在运动...
Cog
Video
X高级应用:图像到
视频
生成
Cog
Video
X的图像到
视频
(I2V)
生成
模型
采用了先进的
扩散
模型
架构,结合了3D卷积、时空注意力机制和条件编码技术,能够将静态图像转换为高质量的
视频
序列。该
模型
基于DiT(Diffusion
Transform
er
)架构,包含图像编码...
Cog
Video
X:Text-to-
Video
Diffusion Models with An Exp
er
t
Transform
er
我们介绍了
Cog
Video
X,这是一种
大规模
的
扩散
变压器
模型
,旨在基于文本提示
生成
视频
。为了高效地建模
视频
数据,我们提出利用三维变分自编码器(VAE)来压缩
视频
的空间和时间维度。为了提高文本与
视频
的对齐性,我们...
4GB显存玩转
视频
生成
:
Cog
Video
X-5b-I2V的"非共识"革命与隐藏成本
你是否还在为
视频
生成
模型
动辄需要24GB显存而苦恼?是否因高昂的硬件成本望而却步?现在,一个"非共识"的机会来了!THUDM开源的
Cog
Video
X-5b-I2V
模型
,以其革命性的优化技术,让仅拥有4GB显存的GPU也能流畅运行高...
在线可玩!智谱开源图生
视频
模型
,网友直呼Amazing!
叨乐 发自 凹非寺量子位 | 公众号 QbitAI刚刚,智谱把清影背后的图生
视频
模型
Cog
Video
X-5B-I2V给开源了!(在线可玩)一起开源的还有它的标注
模型
cog
vlm2-llama3-caption。在实际应用中,
Cog
Video
X-5B-I2V支持「一张...
今天深度学习了吗
32,092
社区成员
152
社区内容
发帖
与我相关
我的任务
今天深度学习了吗
深度学习相关博客和资源~
复制链接
扫一扫
分享
社区描述
深度学习相关博客和资源~
人工智能
图像处理
深度学习
个人社区
浙江省·杭州市
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章