社区
图形处理/算法
帖子详情
语音的相似度的识别与分析?
ruan1978
2011-03-24 01:33:36
我现在要做这样的处理,有一段录音的声音,有点象卡拉OK那样,声音播放,然后人照样发音跟读,看匹配和吻合程度,这种应该怎么处理?需要看什么书?
...全文
334
3
打赏
收藏
语音的相似度的识别与分析?
我现在要做这样的处理,有一段录音的声音,有点象卡拉OK那样,声音播放,然后人照样发音跟读,看匹配和吻合程度,这种应该怎么处理?需要看什么书?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
rxngzq
2011-12-25
打赏
举报
回复
我也做语音相似度的研究,要不探讨一下,我qq 619116901
ruan1978
2011-03-24
打赏
举报
回复
用波型分析?
shenyi0106
2011-03-24
打赏
举报
回复
计算波形?
不懂这个……
论坛签名======================================================================
ruan1978:你好!
截至 2011-03-24 13:33:36 前:
你已发帖 266 个, 未结贴
22
个;
结贴率为:
91.73%
当您的问题得到解答后请及时结贴.
http://topic.csdn.net/u/20090501/15/7548d251-aec2-4975-a9bf-ca09a5551ba5.html
http://topic.csdn.net/u/20100428/09/BC9E0908-F250-42A6-8765-B50A82FE186A.html
http://topic.csdn.net/u/20100626/09/f35a4763-4b59-49c3-8061-d48fdbc29561.html
如何给分和结贴?
http://community.csdn.net/Help/HelpCenter.htm#结帖
如何给自己的回帖中也加上签名?
http://blog.csdn.net/q107770540/archive/2011/03/15/6250007.aspx
基于DTW
语音
识别
matlab代码
实验最终在MATLAB平台的基础上基本实现了0到9的特定人
语音
识别
,
识别
率为100%,达到了预定的目的。基于DTW模型的
语音
识别
简单的说就是通过MATLAB的程序段,将待
识别
的
语音
信号与数据库中的模板进行
相似度
对比,将
相似度
最高者最为
识别
结果输出,同时DTW的
识别
效率取决于参考模板的清晰度以及广泛度,如果能够建立一个范围庞大而且清晰的特定人
语音
库,将能够大大提高
语音
识别
的效率。
Android
语音
识别
模糊匹配demo
一个
语音
识别
模糊匹配的demo,主要工作流程如下: 1,将目标字符集转换为拼音; 2,获取科大讯飞
语音
识别
的结果; 3,将
识别
结果转换为拼音; 4,在目标拼音集中进行拼音的匹配查找; 5,对于查找不到的,进行易混拼音的替换,再次与目标集合匹配查找; 6,对于还没有查找到的,去掉音调,再次与目标集合匹配查找; 7,将模糊匹配后的结果展现出来;
毕业论文《
语音
识别
系统的设计与实现》
本文主要介绍了
语音
识别
系统的基础知识,包括
语音
识别
系统的应用、结构以及 算法。重点阐述了
语音
识别
系统的原理以及相关算法,通过参考查阅资料,借助 MATLAB工具,设计基于VQ 码本训练程序和
识别
程序,
识别
特定人的
语音
。 系统主要包括训练和
识别
两个阶段。 实现过程包括对原始
语音
进行预加重、 分帧、 加窗等处理,提取
语音
对应的特征参数。在得到了特征参数的基础上,采用模式
识别
理论的模板匹配技术进行
相似度
度量,来进行训练和
识别
。在进行
相似度
度量时,采 用 VQ 算法对特征参数序列重新进行时间的对准。 VQ 在孤立词
语音
识别
系统中得到很好的应用,特别是有限状态矢量量化技术, 对于
语音
识别
更为有效。基于 VQ 的孤立词
语音
识别
系统具有分类准确,存储数据少, 实时响应速度快等综合性能好的特点。
基于matlab-dtw的
语音
识别
matlab图像处理 基于 MATLAB 的 DTW(动态时间规整)的
语音
识别
是一种利用 MATLAB 软件和 DTW 算法来实现
语音
识别
的方法。下面是该方法的介绍: 动态时间规整(DTW): DTW 是一种用于比较两个序列之间的
相似度
的方法,尤其适用于时间序列数据,如
语音
信号、手写笔迹等。 DTW 能够在两个序列长度不同或速度不同的情况下,找到它们之间最佳的匹配路径,从而量化它们之间的
相似度
。 系统组成: 特征提取:从
语音
信号中提取特征向量,常用的特征包括 MFCC(梅尔频率倒谱系数)、LPCC(线性预测倒谱系数)等。 训练模型:利用已知的
语音
样本进行模型训练,通常采用高斯混合模型(GMM)或者隐马尔可夫模型(HMM)等。
语音
识别
:将待
识别
的
语音
信号与训练好的模型进行匹配,得到最佳匹配路径。 后处理:对
识别
结果进行后处理,如语言模型的应用、错误修正等。 工作原理: 首先,从
语音
信号中提取特征向量,例如MFCC。 然后,利用 DTW 算法比较待
识别
的
语音
特征向量序列与训练样本的
语音
特征向量序列之间的
相似度
。 最后,根据 DTW 算法得到的最佳匹配路径,
识别
出最有可能的
语音
单词
语音
控制信号
识别
系统的设计与实现
语音
控制信号
识别
系统的设计与实现,王永和,,介绍了由LabVIEW 编程系统设计的
语音
控制信号
识别
系统的设计和实现,该 系统的比较简便的
相似度
比较方式,以及该系统在多个控制领�
图形处理/算法
19,469
社区成员
50,697
社区内容
发帖
与我相关
我的任务
图形处理/算法
VC/MFC 图形处理/算法
复制链接
扫一扫
分享
社区描述
VC/MFC 图形处理/算法
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章