用c#做.wav文件信息分析遇到的困难,求高手指点指点!
本人最近照着论坛上的一个画.wav文件波形的源码,继续深入做了一个画.wav文件的波形图、平均幅度图、平均过零率、短时能量图和频谱图的绘制,但是遇到一些困惑:
1.在平均幅度图和短时能量图的绘制方面,一个波形文件的这两个图,基本是一样的,唯一的差别貌似就是:短时能量图是平均幅度图在Y轴方向上的平移而已。
2.频谱图绘制感觉不对,因为我用的网上源码来进行FFT中,得到幅度值后,再画图,横坐标是用的像素为单位,也就是这样:point[i].x=i;
point[i].y=decibel[i];//decibel[i]就是经过FFt处理后的保存的频谱幅度。
所以感觉是不是横坐标用基频来表示是不是好一点。
不知道有没有高手也做过这样的东西,能指点指点小弟。
另外,如果想要进行一些简单的语音识别,如特定人、小词汇量的识别,或者语音信号中的情感特征识别的话,基本上要用到哪些算法。