解奉龙-FireRed-基于大模型的语音/音乐技术综合实践

m0_74120090 2025-04-23 14:55:06

课时名称课时知识点
解奉龙-FireRed-基于大模型的语音/音乐技术综合实践小红书音频技术负责人 本次报告涵盖小红书技术团队研发了一系列语音/音乐大模型的技术详情及应用落地如FireRedASR:开源中文语音识别新sota,综合极致的精度和高效的推理需分别打造FireRed-LLM及FireRed-AED,对比此前sota Seed-ASR,中文字错率相对降低8.4%。FireRedTTS2.0: 开源中文语音合成新sota,支持zero-shot的语音克隆及human-like具有副语言想象及情感控制的自然语音生成。FireRedChat:超低延时且具有人感的大模型语音实时对话系统方案。FireRedmusic:小红书风格音乐生成的方案等。
...全文
17 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

1

社区成员

发帖
与我相关
我的任务
社区管理员
  • m0_74120090
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧