使用 NEMO 让您的文字会说话

nvdev 2022-01-12 16:40:12

语音合成技术可以将任何文字信息转换成标准流畅的语音且进行朗读,相当于给机器装了一张人工合成的“嘴巴”。它是涉及多个学科,如声学、语言学、数字信号处理和计算机科学的一个交叉学科。

NeMo 是一个用于构建先进的对话式 AI 模型的工具包,它内置集成了自动语音识别 (ASR)、自然语言处理 (NLP) 和语音合成 (TTS) 的模型及方法,方便调用先进的预训练模型快速完成对话式 AI 中各类子任务。我们通过 NeMo 可以快速方便的实现文字与语音之间的转换,让你的文字会说话!本在线研讨会主要面向对会话式人工智能感兴趣的零基础编程爱好者。

通过本次在线研讨会,您可以获得以下内容:

  • 语音合成技术简介
  • 语音合成技术的工作流程与原理
  • 语音合成技术中的深度学习模型
  • 代码实战:使用 NeMo 快速完成自然语音生成任务

观看回放 | 下载PPT

...全文
216 回复 打赏 收藏 举报
写回复
回复
切换为时间正序
请发表友善的回复…
发表回复
相关推荐
发帖
NVIDIA 企业开发者社区
加入

11

社区成员

NVIDIA 开发者技术交流
帖子事件
创建了帖子
2022-01-12 16:40
社区公告
暂无公告