一不小心,闯入了一个高深技术讨论。 这个技术的名字叫做:声纹识别。目前也是各国智能识别领域在做的课题, 声纹自动识别模型目前可以使用的特征包括: 声学特征(倒频谱); 词法特征(说话人相关的词n-gram,音素n-gram); 韵律特征(利用n-gram描述的基音和能量“姿势”); 语种、方言和口音信息;(5)通道信息(使用何种通道);等等。 在现实应用中,倒谱系数(MFCC)作为特征参数进行声纹识别,已经有不少成功应用。 一个典型的例子是这样的: 采样特定对象的N组音频文件作为样本,对这些样本先进行语音信号的预处理,分别进行预加重、加窗、FIR滤波、分帧,做出了波形图和频谱图,建立了代表说话人身份的语音特征模型,然后通过程序从语音数据中提取说话人的MFCC特征参数。MFCC数字化分析,度娘上应该可以找到。
频谱分析可以找出不同,也可以找出相同 可以识别不同的人说同样的内容 也可以识别说相同的内容的人是谁 不同的人应该从细节上说差异极大 不过会有统计规律存在
27,375
社区成员
28,769
社区内容
加载中
试试用AI创作助手写篇文章吧