如何进行语音合成？

烤火的鱼 2014-04-13 11:30:01

有一个项目需求，需要根据情况播放通知，但又不完全是文本朗读，需要将现有的录好音的部分和部分动态的内容进行组合，然后输出，比如：

前往XXX的旅客请注意，您乘坐的XXXX次班车现在开始检票，请携带好随声行李物品到XXX号检票口排队检票上车，谢谢！

其中，XXX部分是临时取出来的，其它汉字部分是录音录好的（完全电脑朗读让人受不了），这种方式用什么方法实现比较好，网上基本都是推荐使用微软的Speech Application SDK，但不知道如何将已经录制好的内容和动态生成的合成一个语音文件，然后播放出来。

...全文

432 11 打赏收藏转发到动态举报

写回复

用AI写文章

11 条回复

切换为时间正序

请发表友善的回复…

发表回复

sz0268 2016-07-01

打赏
举报

这个解决了吗？现在做这一块的公司很多，像讯飞，百度都可以，jar包也都是曼菲使用的，http://blog.csdn.net/sz0268/article/details/51695426这个就是基于讯飞的语音合成，里面有代码实现，可以参考

拜一刀 2016-01-08

打赏
举报

引用楼主 gatr 的回复:

有一个项目需求，需要根据情况播放通知，但又不完全是文本朗读，需要将现有的录好音的部分和部分动态的内容进行组合，然后输出，比如：前往XXX的旅客请注意，您乘坐的XXXX次班车现在开始检票，请携带好随声行李物品到XXX号检票口排队检票上车，谢谢！其中，XXX部分是临时取出来的，其它汉字部分是录音录好的（完全电脑朗读让人受不了），这种方式用什么方法实现比较好，网上基本都是推荐使用微软的Speech Application SDK，但不知道如何将已经录制好的内容和动态生成的合成一个语音文件，然后播放出来。

这是分成几段播的吧...播个"前往",然后播个"XXX",再播个"的旅客请注意....."不是合并成一个文件再播的吧?每次查找下要动态改变的部分该播哪个文件呗这些其实可以都录好,像公交报站一样.如果要现场做文字转语音的话,玩过能说会道,好像就是楼上说的tts做的.或者去utau或vocaloid相关社区看看有没有合适的合成工具啊音源啊接口啊之类的

一修法师 2016-01-08

打赏
举报

科大讯飞语音助手

md5e 2014-04-18

打赏
举报

百度TTS语音合成

霜寒月冷 2014-04-18

打赏
举报

做个播放顺序表，应该不难实现把，然后自动播放。现在音乐播放器许多播放歌单，类似的原则啊。

烤火的鱼 2014-04-18

打赏
举报

引用 5 楼 devmiao 的回复:

[quote=引用 3 楼 gatr 的回复:] [quote=引用 1 楼 devmiao 的回复:] 那更简单了，直接连续播放这几个音频就可以了。注意用音频编辑软件裁剪好音频开头结束的空白。

显然不能使用编辑软件,而是自动组合出来,因为内容是临时取出的,要自动组合并播放出来[/quote] 我是说，用编辑软件将空白裁剪掉，这样放起来更自然。你理解错我说的意思了。[/quote] 原来如此,理解错误,见谅,该方法貌似可行

shawn_yang 2014-04-15

打赏
举报

也遇到过类似情况，我觉得可以这样，姓名部分用speech转成wav文件，然后用播放控件将姓名部分和固定音频文件按顺序播放

烤火的鱼 2014-04-15

打赏
举报

引用 1 楼 devmiao 的回复:

那更简单了，直接连续播放这几个音频就可以了。注意用音频编辑软件裁剪好音频开头结束的空白。

显然不能使用编辑软件,而是自动组合出来,因为内容是临时取出的,要自动组合并播放出来

devmiao 2014-04-15

打赏
举报

引用 3 楼 gatr 的回复:

[quote=引用 1 楼 devmiao 的回复:] 那更简单了，直接连续播放这几个音频就可以了。注意用音频编辑软件裁剪好音频开头结束的空白。

显然不能使用编辑软件,而是自动组合出来,因为内容是临时取出的,要自动组合并播放出来[/quote] 我是说，用编辑软件将空白裁剪掉，这样放起来更自然。你理解错我说的意思了。

本拉灯 2014-04-13

打赏
举报

引用楼主 gatr 的回复:

有一个项目需求，需要根据情况播放通知，但又不完全是文本朗读，需要将现有的录好音的部分和部分动态的内容进行组合，然后输出，比如：前往XXX的旅客请注意，您乘坐的XXXX次班车现在开始检票，请携带好随声行李物品到XXX号检票口排队检票上车，谢谢！其中，XXX部分是临时取出来的，其它汉字部分是录音录好的（完全电脑朗读让人受不了），这种方式用什么方法实现比较好，网上基本都是推荐使用微软的Speech Application SDK，但不知道如何将已经录制好的内容和动态生成的合成一个语音文件，然后播放出来。

Speech SDK还可以拉，你不能用MS的语音包，要用第三方的语音包，就能说的很标准的。这个Neospeech 语音库就非常好

devmiao 2014-04-13