使用 NEMO 让您的文字会说话

nvdev 2022-01-12 16:40:12

语音合成技术可以将任何文字信息转换成标准流畅的语音且进行朗读,相当于给机器装了一张人工合成的“嘴巴”。它是涉及多个学科,如声学、语言学、数字信号处理和计算机科学的一个交叉学科。

NeMo 是一个用于构建先进的对话式 AI 模型的工具包,它内置集成了自动语音识别 (ASR)、自然语言处理 (NLP) 和语音合成 (TTS) 的模型及方法,方便调用先进的预训练模型快速完成对话式 AI 中各类子任务。我们通过 NeMo 可以快速方便的实现文字与语音之间的转换,让你的文字会说话!本在线研讨会主要面向对会话式人工智能感兴趣的零基础编程爱好者。

通过本次在线研讨会,您可以获得以下内容:

  • 语音合成技术简介
  • 语音合成技术的工作流程与原理
  • 语音合成技术中的深度学习模型
  • 代码实战:使用 NeMo 快速完成自然语音生成任务

观看回放 | 下载PPT

...全文
366 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

1,337

社区成员

发帖
与我相关
我的任务
社区描述
NVIDIA 开发者技术交流
人工智能 企业社区
社区管理员
  • nvdev
  • 活动通知
  • AI_CUDA_Training
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧