语音的相似度的识别与分析?

ruan1978 2011-03-24 01:33:36

我现在要做这样的处理，有一段录音的声音,有点象卡拉OK那样，声音播放，然后人照样发音跟读,看匹配和吻合程度,这种应该怎么处理?需要看什么书?

...全文

334 3 打赏收藏转发到动态举报

写回复

3 条回复

切换为时间正序

请发表友善的回复…

发表回复

rxngzq 2011-12-25

打赏
举报

回复

我也做语音相似度的研究，要不探讨一下，我qq 619116901

ruan1978 2011-03-24

打赏
举报

回复

用波型分析?

shenyi0106 2011-03-24

打赏
举报

回复

计算波形？
不懂这个……

论坛签名======================================================================

ruan1978:你好!
截至 2011-03-24 13:33:36 前:
你已发帖 266 个, 未结贴 22 个;
结贴率为： 91.73%

当您的问题得到解答后请及时结贴.
http://topic.csdn.net/u/20090501/15/7548d251-aec2-4975-a9bf-ca09a5551ba5.html
http://topic.csdn.net/u/20100428/09/BC9E0908-F250-42A6-8765-B50A82FE186A.html
http://topic.csdn.net/u/20100626/09/f35a4763-4b59-49c3-8061-d48fdbc29561.html

如何给分和结贴？
http://community.csdn.net/Help/HelpCenter.htm#结帖

如何给自己的回帖中也加上签名？
http://blog.csdn.net/q107770540/archive/2011/03/15/6250007.aspx

实验最终在MATLAB平台的基础上基本实现了0到9的特定人语音识别，识别率为100%，达到了预定的目的。基于DTW模型的语音识别简单的说就是通过MATLAB的程序段，将待识别的语音信号与数据库中的模板进行相似度对比，将相似度最高者最为识别结果输出，同时DTW的识别效率取决于参考模板的清晰度以及广泛度，如果能够建立一个范围庞大而且清晰的特定人语音库，将能够大大提高语音识别的效率。

一个语音识别模糊匹配的demo，主要工作流程如下： 1，将目标字符集转换为拼音； 2，获取科大讯飞语音识别的结果； 3，将识别结果转换为拼音； 4，在目标拼音集中进行拼音的匹配查找； 5，对于查找不到的，进行易混拼音的替换，再次与目标集合匹配查找； 6，对于还没有查找到的，去掉音调，再次与目标集合匹配查找； 7，将模糊匹配后的结果展现出来；

本文主要介绍了语音识别系统的基础知识，包括语音识别系统的应用、结构以及算法。重点阐述了语音识别系统的原理以及相关算法，通过参考查阅资料，借助 MATLAB工具，设计基于VQ 码本训练程序和识别程序，识别特定人的语音。系统主要包括训练和识别两个阶段。实现过程包括对原始语音进行预加重、分帧、加窗等处理，提取语音对应的特征参数。在得到了特征参数的基础上，采用模式识别理论的模板匹配技术进行相似度度量，来进行训练和识别。在进行相似度度量时，采用 VQ 算法对特征参数序列重新进行时间的对准。 VQ 在孤立词语音识别系统中得到很好的应用，特别是有限状态矢量量化技术，对于语音识别更为有效。基于 VQ 的孤立词语音识别系统具有分类准确，存储数据少，实时响应速度快等综合性能好的特点。

matlab图像处理基于 MATLAB 的 DTW（动态时间规整）的语音识别是一种利用 MATLAB 软件和 DTW 算法来实现语音识别的方法。下面是该方法的介绍：动态时间规整（DTW）： DTW 是一种用于比较两个序列之间的相似度的方法，尤其适用于时间序列数据，如语音信号、手写笔迹等。 DTW 能够在两个序列长度不同或速度不同的情况下，找到它们之间最佳的匹配路径，从而量化它们之间的相似度。系统组成：特征提取：从语音信号中提取特征向量，常用的特征包括 MFCC（梅尔频率倒谱系数）、LPCC（线性预测倒谱系数）等。训练模型：利用已知的语音样本进行模型训练，通常采用高斯混合模型（GMM）或者隐马尔可夫模型（HMM）等。语音识别：将待识别的语音信号与训练好的模型进行匹配，得到最佳匹配路径。后处理：对识别结果进行后处理，如语言模型的应用、错误修正等。工作原理：首先，从语音信号中提取特征向量，例如MFCC。然后，利用 DTW 算法比较待识别的语音特征向量序列与训练样本的语音特征向量序列之间的相似度。最后，根据 DTW 算法得到的最佳匹配路径，识别出最有可能的语音单词

语音控制信号识别系统的设计与实现，王永和，，介绍了由LabVIEW 编程系统设计的语音控制信号识别系统的设计和实现，该系统的比较简便的相似度比较方式，以及该系统在多个控制领�

图形处理/算法

19,469

社区成员

50,697

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章