有做过说话人识别、确认的大神不?

rainsbaby 2013-01-03 02:56:53
最近在做基于MFCC UBM-GMM的说话人确认系统,结果有问题,不知道训练UBM需要什么样的数据比较好。有没有人可以指点一下喔~~
...全文
161 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
低调的杉菜 2013-08-11
  • 打赏
  • 举报
回复
你好,我也刚刚开始做说话人识别的东西,有些东西不太懂,想跟你交流交流
ibillxia 2013-05-14
  • 打赏
  • 举报
回复
引用 2 楼 zhangguixian5 的回复:
[quote=引用 1 楼 ibillxia 的回复:] 我能想到的两点是: 训练UBM的数据中包含的说话人要尽量的多! 同一个说话人的数据要尽量的包含他/她不同状态(如情感、健康状况等)下的语音!
所有人的语音是放在一个文件中训练,还是分别训练然后组合到一起呢?[/quote] 当然使放到一起训练啦,多个说话人的语音训练一个UBM,也可一按照说话人性别/通道类型等分别训练多个UBM,比如男性电话通道的所有语句训练一个UBM,所有女性麦克风通道的语句训练一个UBM,等等。。。
lx870221 2013-01-21
  • 打赏
  • 举报
回复
GMM需要很多的数据咯。。。我做过别的识别,效果不错,就是途中差的坑死。 好像语音识别用隐马尔科夫函数比较多。 参考1楼,最好是放到一起训练。 可以交流
rainsbaby 2013-01-05
  • 打赏
  • 举报
回复
引用 1 楼 ibillxia 的回复:
我能想到的两点是: 训练UBM的数据中包含的说话人要尽量的多! 同一个说话人的数据要尽量的包含他/她不同状态(如情感、健康状况等)下的语音!
所有人的语音是放在一个文件中训练,还是分别训练然后组合到一起呢?
ibillxia 2013-01-05
  • 打赏
  • 举报
回复
我能想到的两点是: 训练UBM的数据中包含的说话人要尽量的多! 同一个说话人的数据要尽量的包含他/她不同状态(如情感、健康状况等)下的语音!

4,449

社区成员

发帖
与我相关
我的任务
社区描述
图形图像/机器视觉
社区管理员
  • 机器视觉
  • 迪菲赫尔曼
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧