关于语音处理的问题

sunnyhjj 2011-03-29 01:31:01
问题1:混音技术。即将多路语音信号进行叠加,从一条路输出。最近在网上看了不少关于混音的算法和资料,有的介绍用directsound来做,也有直接用这个公式:Z = A + B – A•B / 256(两路的情况下)。那么那种是比较简单易行的呢?或者有更好的方法?
问题2:提取三路语音信号中说话声音最大的那一路话音。我的思路是,求出每路信号能量的大小并进行比较,然后输出能量最大的那一路。
以上两个问题我只有部分思路,不知是否正确。希望各位大虾能够帮忙解决!若有与我做的相关的可以互相讨论。答对必定给分!
...全文
215 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
sunnyhjj 2011-03-29
  • 打赏
  • 举报
回复
没人回答了么?第一个我已经搞定了,再努力解决第二个!
sunnyhjj 2011-03-29
  • 打赏
  • 举报
回复
你说的也是我没接触过的,哎,真是仁者见仁智者见智,大家能不能提供个简单点的方法?如果直接用c来实现,最好的算法应该是什么呢?
[Quote=引用 2 楼 pathuang68 的回复:]
关于混音,可以考虑用ffmpeg。
如果没有记错,理由有一个addStream这样的函数,这个函数的参数可以是视频流,也可以是音频流。
比如:

多媒体对象.addStream(音频流1);
多媒体对象.addStream(音频流2);
多媒体对象.addStream(音频流3);
...

具体函数名称记不清楚了,但是满足这个功能的函数肯定在ffmpeg中存在。
[/Quote]
sunnyhjj 2011-03-29
  • 打赏
  • 举报
回复
你说的这个是个什么东东?不了解哦,能具体说下吗?
[Quote=引用 1 楼 zhao4zhong1 的回复:]
推荐使用NCTAudioStudio控件
[/Quote]
pathuang68 2011-03-29
  • 打赏
  • 举报
回复
关于混音,可以考虑用ffmpeg。
如果没有记错,理由有一个addStream这样的函数,这个函数的参数可以是视频流,也可以是音频流。
比如:

多媒体对象.addStream(音频流1);
多媒体对象.addStream(音频流2);
多媒体对象.addStream(音频流3);
...

具体函数名称记不清楚了,但是满足这个功能的函数肯定在ffmpeg中存在。
赵4老师 2011-03-29
  • 打赏
  • 举报
回复
推荐使用NCTAudioStudio控件

69,373

社区成员

发帖
与我相关
我的任务
社区描述
C语言相关问题讨论
社区管理员
  • C语言
  • 花神庙码农
  • 架构师李肯
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧