1,337
社区成员




语音合成技术可以将任何文字信息转换成标准流畅的语音且进行朗读,相当于给机器装了一张人工合成的“嘴巴”。它是涉及多个学科,如声学、语言学、数字信号处理和计算机科学的一个交叉学科。
NeMo 是一个用于构建先进的对话式 AI 模型的工具包,它内置集成了自动语音识别 (ASR)、自然语言处理 (NLP) 和语音合成 (TTS) 的模型及方法,方便调用先进的预训练模型快速完成对话式 AI 中各类子任务。我们通过 NeMo 可以快速方便的实现文字与语音之间的转换,让你的文字会说话!本在线研讨会主要面向对会话式人工智能感兴趣的零基础编程爱好者。
通过本次在线研讨会,您可以获得以下内容: