如何进行语音探测!

debug9999 2004-06-29 03:44:38
请教各位兄弟:在进行实时音频通讯的过程中,如何判断一个人在“说话”?小弟现在的做法大致思路是:对一段实时的音频数据进行快速傅立叶变换,转换成频率空间,然后对频率进行计算。不说话时,一般都是环境噪音,频率较低,说话时频率明显增大,这里有个“临界值”。根据这个临界值来判断。不知这种做法对不对?请高手们对这个思路指点一下,并能做细化!

欢迎在线讨论:msn:cailiang_cn@hotmail.com

分数不够可以再加!只要问题解决就好!!
...全文
128 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
hehewa 2004-08-04
  • 打赏
  • 举报
回复
It's very easy to detect the silence by calculating the energy of a voice segment.

The silence-threshold can be selected according to experienced arguments or by testing yourself.
xiaohaige 2004-08-04
  • 打赏
  • 举报
回复
to hehewa:
how to calculate the energy of one voice segment? could you give me a formula please?
xiaohaige 2004-06-30
  • 打赏
  • 举报
回复
mark
debug9999 2004-06-30
  • 打赏
  • 举报
回复
还没试验出来。变换后的数据都出来了,如何根据变换后的数据来进行判断,目前还在测试中。
happydeer 2004-06-29
  • 打赏
  • 举报
回复
效果如何?
xwmhn 2004-06-29
  • 打赏
  • 举报
回复
关注中。。。学习!

2,543

社区成员

发帖
与我相关
我的任务
社区描述
专题开发/技术/项目 多媒体/流媒体开发
社区管理员
  • 多媒体/流媒体开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧