如何进行语音合成?

烤火的鱼 2014-04-13 11:30:01
有一个项目需求,需要根据情况播放通知,但又不完全是文本朗读,需要将现有的录好音的部分和部分动态的内容进行组合,然后输出,比如:

前往XXX的旅客请注意,您乘坐的XXXX次班车现在开始检票,请携带好随声行李物品到XXX号检票口排队检票上车,谢谢!

其中,XXX部分是临时取出来的,其它汉字部分是录音录好的(完全电脑朗读让人受不了),这种方式用什么方法实现比较好,网上基本都是推荐使用微软的Speech Application SDK,但不知道如何将已经录制好的内容和动态生成的合成一个语音文件,然后播放出来。
...全文
432 11 打赏 收藏 转发到动态 举报
写回复
用AI写文章
11 条回复
切换为时间正序
请发表友善的回复…
发表回复
sz0268 2016-07-01
  • 打赏
  • 举报
回复
这个解决了吗?现在做这一块的公司很多,像讯飞,百度都可以,jar包也都是曼菲使用的,http://blog.csdn.net/sz0268/article/details/51695426这个就是基于讯飞的语音合成,里面有代码实现,可以参考
拜一刀 2016-01-08
  • 打赏
  • 举报
回复
引用 楼主 gatr 的回复:
有一个项目需求,需要根据情况播放通知,但又不完全是文本朗读,需要将现有的录好音的部分和部分动态的内容进行组合,然后输出,比如: 前往XXX的旅客请注意,您乘坐的XXXX次班车现在开始检票,请携带好随声行李物品到XXX号检票口排队检票上车,谢谢! 其中,XXX部分是临时取出来的,其它汉字部分是录音录好的(完全电脑朗读让人受不了),这种方式用什么方法实现比较好,网上基本都是推荐使用微软的Speech Application SDK,但不知道如何将已经录制好的内容和动态生成的合成一个语音文件,然后播放出来。
这是分成几段播的吧...播个"前往",然后播个"XXX",再播个"的旅客请注意....."不是合并成一个文件再播的吧?每次查找下要动态改变的部分该播哪个文件呗 这些其实可以都录好,像公交报站一样.如果要现场做文字转语音的话,玩过能说会道,好像就是楼上说的tts做的.或者去utau或vocaloid相关社区看看有没有合适的合成工具啊音源啊接口啊之类的
一修法师 2016-01-08
  • 打赏
  • 举报
回复
科大讯飞 语音助手
md5e 2014-04-18
  • 打赏
  • 举报
回复
百度TTS语音合成
霜寒月冷 2014-04-18
  • 打赏
  • 举报
回复
做个播放顺序表,应该不难实现把 ,然后自动播放。现在音乐播放器许多播放歌单,类似的原则啊。
烤火的鱼 2014-04-18
  • 打赏
  • 举报
回复
引用 5 楼 devmiao 的回复:
[quote=引用 3 楼 gatr 的回复:] [quote=引用 1 楼 devmiao 的回复:] 那更简单了,直接连续播放这几个音频就可以了。注意用音频编辑软件裁剪好音频开头结束的空白。
显然不能使用编辑软件,而是自动组合出来,因为内容是临时取出的,要自动组合并播放出来[/quote] 我是说,用编辑软件将空白裁剪掉,这样放起来更自然。你理解错我说的意思了。[/quote] 原来如此,理解错误,见谅,该方法貌似可行
shawn_yang 2014-04-15
  • 打赏
  • 举报
回复
也遇到过类似情况,我觉得可以这样,姓名部分用speech转成wav文件,然后用播放控件将姓名部分和固定音频文件按顺序播放
烤火的鱼 2014-04-15
  • 打赏
  • 举报
回复
引用 1 楼 devmiao 的回复:
那更简单了,直接连续播放这几个音频就可以了。注意用音频编辑软件裁剪好音频开头结束的空白。
显然不能使用编辑软件,而是自动组合出来,因为内容是临时取出的,要自动组合并播放出来
devmiao 2014-04-15
  • 打赏
  • 举报
回复
引用 3 楼 gatr 的回复:
[quote=引用 1 楼 devmiao 的回复:] 那更简单了,直接连续播放这几个音频就可以了。注意用音频编辑软件裁剪好音频开头结束的空白。
显然不能使用编辑软件,而是自动组合出来,因为内容是临时取出的,要自动组合并播放出来[/quote] 我是说,用编辑软件将空白裁剪掉,这样放起来更自然。你理解错我说的意思了。
本拉灯 2014-04-13
  • 打赏
  • 举报
回复
引用 楼主 gatr 的回复:
有一个项目需求,需要根据情况播放通知,但又不完全是文本朗读,需要将现有的录好音的部分和部分动态的内容进行组合,然后输出,比如: 前往XXX的旅客请注意,您乘坐的XXXX次班车现在开始检票,请携带好随声行李物品到XXX号检票口排队检票上车,谢谢! 其中,XXX部分是临时取出来的,其它汉字部分是录音录好的(完全电脑朗读让人受不了),这种方式用什么方法实现比较好,网上基本都是推荐使用微软的Speech Application SDK,但不知道如何将已经录制好的内容和动态生成的合成一个语音文件,然后播放出来。
Speech SDK还可以拉,你不能用MS的语音包,要用第三方的语音包,就能说的很标准的。这个Neospeech 语音库就非常好
devmiao 2014-04-13
  • 打赏
  • 举报
回复
那更简单了,直接连续播放这几个音频就可以了。注意用音频编辑软件裁剪好音频开头结束的空白。

110,526

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧