1
社区成员




课时名称 | 课时知识点 |
---|---|
解奉龙-FireRed-基于大模型的语音/音乐技术综合实践 | 小红书音频技术负责人 本次报告涵盖小红书技术团队研发了一系列语音/音乐大模型的技术详情及应用落地如FireRedASR:开源中文语音识别新sota,综合极致的精度和高效的推理需分别打造FireRed-LLM及FireRed-AED,对比此前sota Seed-ASR,中文字错率相对降低8.4%。FireRedTTS2.0: 开源中文语音合成新sota,支持zero-shot的语音克隆及human-like具有副语言想象及情感控制的自然语音生成。FireRedChat:超低延时且具有人感的大模型语音实时对话系统方案。FireRedmusic:小红书风格音乐生成的方案等。 |