有做过说话人识别、确认的大神不？

rainsbaby 2013-01-03 02:56:53

最近在做基于MFCC UBM-GMM的说话人确认系统，结果有问题，不知道训练UBM需要什么样的数据比较好。有没有人可以指点一下喔~~

...全文

161 5 打赏收藏转发到动态举报

写回复

用AI写文章

5 条回复

切换为时间正序

请发表友善的回复…

发表回复

低调的杉菜 2013-08-11

打赏
举报

你好，我也刚刚开始做说话人识别的东西，有些东西不太懂，想跟你交流交流

ibillxia 2013-05-14

打赏
举报

引用 2 楼 zhangguixian5 的回复:

[quote=引用 1 楼 ibillxia 的回复:] 我能想到的两点是：训练UBM的数据中包含的说话人要尽量的多！同一个说话人的数据要尽量的包含他/她不同状态（如情感、健康状况等）下的语音！

所有人的语音是放在一个文件中训练，还是分别训练然后组合到一起呢？[/quote] 当然使放到一起训练啦，多个说话人的语音训练一个UBM，也可一按照说话人性别/通道类型等分别训练多个UBM，比如男性电话通道的所有语句训练一个UBM，所有女性麦克风通道的语句训练一个UBM，等等。。。

lx870221 2013-01-21

打赏
举报

GMM需要很多的数据咯。。。我做过别的识别，效果不错，就是途中差的坑死。好像语音识别用隐马尔科夫函数比较多。参考1楼，最好是放到一起训练。可以交流

rainsbaby 2013-01-05

打赏
举报

引用 1 楼 ibillxia 的回复:

我能想到的两点是：训练UBM的数据中包含的说话人要尽量的多！同一个说话人的数据要尽量的包含他/她不同状态（如情感、健康状况等）下的语音！

所有人的语音是放在一个文件中训练，还是分别训练然后组合到一起呢？

ibillxia 2013-01-05

打赏
举报

我能想到的两点是：训练UBM的数据中包含的说话人要尽量的多！同一个说话人的数据要尽量的包含他/她不同状态（如情感、健康状况等）下的语音！

通常有三个步骤来识别回头客：服务器脚本发送一系列 cookie 至浏览器。比如名字，年龄，ID 号码等等。浏览器在本地机中存储这些信息，以备不时之需。当下一次浏览器发送任何请求至服务器时，它会同时将这些 ...

1、先用一部分训练集（包含多个说话人），通过EM期望最大化算法，训练UBM通用背景模型；通常我们会先训练一个协方差对角矩阵，再训练全矩阵，理由如下： 1、M阶高斯的稠密全矩阵UBM效果等同于一个更大高斯分量的...

声纹识别，也称作说话人识别，是一种通过声音判别说话人身份的技术。从直觉上来说，声纹虽然不像人脸、指纹的个体差异那样直观可见，但由于每个人的声道、口腔和鼻腔也具有个体的差异性，因此反映到声音上也具有差异...

声纹识别技术简介——化繁为简的艺术2017年11月26日 14:20:20 阅读数：1406 最近一直在看说话人识别的文章，个人觉得写的比较全面，逻辑比较清晰的，腾讯优图的声纹识别技术简介综述写的很好，推荐给...

这是我4月份在BitTiger公开课听的王赟大牛《语音识别的前世今生》整理的笔记，本来打算整理通畅再发的...这个就是前面讲过的打补丁，各种说话人适应的那一页（如下图）这一页上的这三种方法就是历史上，其实也包...

机器视觉

4,449

社区成员

15,336

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章