关于语音处理的问题

sunnyhjj 2011-03-29 01:31:01

问题1：混音技术。即将多路语音信号进行叠加，从一条路输出。最近在网上看了不少关于混音的算法和资料，有的介绍用directsound来做，也有直接用这个公式：Z = A + B – A•B / 256（两路的情况下）。那么那种是比较简单易行的呢？或者有更好的方法？
问题2：提取三路语音信号中说话声音最大的那一路话音。我的思路是，求出每路信号能量的大小并进行比较，然后输出能量最大的那一路。
以上两个问题我只有部分思路，不知是否正确。希望各位大虾能够帮忙解决！若有与我做的相关的可以互相讨论。答对必定给分！

...全文

215 4 打赏收藏转发到动态举报

写回复

用AI写文章

4 条回复

切换为时间正序

请发表友善的回复…

发表回复

sunnyhjj 2011-03-29

打赏
举报

没人回答了么？第一个我已经搞定了，再努力解决第二个！

sunnyhjj 2011-03-29

打赏
举报

你说的也是我没接触过的，哎，真是仁者见仁智者见智，大家能不能提供个简单点的方法？如果直接用c来实现，最好的算法应该是什么呢？
[Quote=引用 2 楼 pathuang68 的回复:]
关于混音，可以考虑用ffmpeg。
如果没有记错，理由有一个addStream这样的函数，这个函数的参数可以是视频流，也可以是音频流。
比如：

多媒体对象.addStream(音频流1)；
多媒体对象.addStream(音频流2)；
多媒体对象.addStream(音频流3)；
...

具体函数名称记不清楚了，但是满足这个功能的函数肯定在ffmpeg中存在。
[/Quote]

sunnyhjj 2011-03-29

打赏
举报

你说的这个是个什么东东？不了解哦，能具体说下吗？
[Quote=引用 1 楼 zhao4zhong1 的回复:]
推荐使用NCTAudioStudio控件
[/Quote]

pathuang68 2011-03-29

打赏
举报

关于混音，可以考虑用ffmpeg。
如果没有记错，理由有一个addStream这样的函数，这个函数的参数可以是视频流，也可以是音频流。
比如：

多媒体对象.addStream(音频流1)；
多媒体对象.addStream(音频流2)；
多媒体对象.addStream(音频流3)；
...

具体函数名称记不清楚了，但是满足这个功能的函数肯定在ffmpeg中存在。