请问,如何找到一个pcm或wave音频文件中的静音时间,文件中只有两种情况,静音和嘟的声音,up送分!
我要从pcm或wave文件中,找出静音时间,这个文件中的声音是有规律的,比如打电话是的嘟嘟声,闹钟声,上小学的下课铃声等,就是一会有声音,然后间隔一会在响。
从网上收集的资料:
只进行静音检测很简单,基本原理如下:
1.将语音样本归一化到[-1,1]之间。
2.计算各帧语音的能量,平方和、绝对值和均可。
3.能量低于某个阈值的帧即为静音帧。
注:阈值通过实际测试来确定的话效果好一些,比如有轻微背景噪声时阈值就要大一些。
第1步的归一化也可不做,也可以归一化到[-a,a]之间,归一化的目的是使计算出来的能量具有某种相对性,同时保证能量计算不会溢出。
但还是不知道如何下手, 请大虾帮忙。