209
社区成员
发帖
与我相关
我的任务
分享
信息发布:[SpeechIO leaderboard]model zoo 中新加入基于Kaldi框架的开源中文识别模型,model_id 为speechio_kaldi_multicn,可以在 leaderboard 中公开引用或者下载使用。
该模型由 Kaldi multicn recipe 的作者那兴宇于2020年中基于 multicn recipe 优化训练完成,由 SpeechIO 近日整理进 leaderboard model zoo,该模型基本代表了现有纯开源领域的最好性能。时至今日,开源模型无论在音频、文本语料的数据量,还是在模型尺寸上,仍与工业级系统存在数量级上的差距。
下图通过 SpeechIO 评测,展示了头部厂商中,性能较好的依图、性能较差的百度智能云、以及[SOTA]指标,和 Kaldi multicn 开源模型进行对比。
文章来源:语音之家