12,013
社区成员




VBench,视频生成模型权威评测基准,用于评估多模态大模型的视频生成质量,包含 16 个视频生成维度及 1 个人类偏好注释数据集。
亮点一览:
包含16个分层和解耦的评测维度
评测方案与人类的观感与评价对齐
代码及提示词体系全面开源
简单部署,一键安装
最新发布的 VBench++ 支持更广泛的视频生成任务,包括文本生成视频和图像生成视频,并配有一套自适应的图像套件,以便在不同的设置下进行公平评估。不仅评估技术质量,还评估生成模型的可信度,从而提供对模型性能的全面评估。
司南评测集社区已收录VBench,感兴趣的友友欢迎下载使用!
https://hub.opencompass.org.cn/dataset-detail/VBench