【大模型评测基准】视频生成模型权威评测基准VBench

司南评测 2025-02-27 14:17:31

VBench,视频生成模型权威评测基准,用于评估多模态大模型的视频生成质量,包含 16 个视频生成维度及 1 个人类偏好注释数据集。

 

亮点一览:

  • 包含16个分层和解耦的评测维度

  • 评测方案与人类的观感与评价对齐

  • 代码及提示词体系全面开源

  • 简单部署,一键安装

 

最新发布的 VBench++ 支持更广泛的视频生成任务,包括文本生成视频和图像生成视频,并配有一套自适应的图像套件,以便在不同的设置下进行公平评估。不仅评估技术质量,还评估生成模型的可信度,从而提供对模型性能的全面评估。

 

司南评测集社区已收录VBench,感兴趣的友友欢迎下载使用!

https://hub.opencompass.org.cn/dataset-detail/VBench

 

 

 

...全文
73 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

12,013

社区成员

发帖
与我相关
我的任务
社区描述
有大数据和AI的故事
大数据人工智能开源 个人社区 天津·武清区
社区管理员
  • 李孟聊人工智能
  • Somnus_小凯
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧