ASR任务需要多少数据量?(有文字标注的数据)
目前一般会从Librispeech数据集开始,960 hours;Timit数据集相当于CV领域的mnist,有些小的想法可以在这上面先进行验证,看是否work;imagenet换算成语音大概是4096 hours;google和facebook在文献中公布的使用语音数据量是1.3w hours,但实际上使用的应该是这个数字的10倍-20倍
2,852
社区成员
5,758
社区内容
加载中
试试用AI创作助手写篇文章吧