229
社区成员




由CCF语音对话与听觉专委会 、中国人工智能产业发展联盟(AIIA)评估组、语音之家、北京希尔贝壳科技有限公司共同主办的【语音之家】AI产业沙龙—视频译制场景中的语音翻译、语音合成和唇形生成技术,将于2022年8月30日19:00-20:00线上直播。
参会嘉宾
谭旭
嘉宾简介:谭旭,微软亚洲研究院主管研究员,研究领域包括深度学习、自然语言/语音/音乐、AI内容生成等。研发的机器翻译和语音合成系统获得多项比赛冠军并在学术评测集上达到人类水平,研究工作如预训练语言模型MASS、语音合成系统FastSpeech/NaturalSpeech、AI音乐项目Muzic受到业界广泛关注,多项研究成果应用于微软产品。个人主页:https://tan-xu.github.io/
分享主题:视频译制场景中的语音翻译、语音合成和唇形生成技术
摘要:视频译制是将视频中的讲话内容翻译到目标语言的文字和声音,需要考虑以下几个要求:1)翻译得到的目标语音时长需要匹配对应视频的长度;2)目标语音的音色和韵律需要尽可能的和原语音一致;3)翻译得到的说话人唇形尽可能和目标语言一致。本次报告将简要介绍语音翻译、语音合成、唇形生成技术,然后探讨在视频译制场景中,如何构建机器翻译、语音合成和唇形生成系统,以满足上述要求。最后,浅谈以语音为基础的多模态生成技术面临的挑战和机遇。
沙龙议程
参加方式
点击链接,即可预约直播
AI产业沙龙—视频译制场景中的语音翻译、语音合成和唇形生成技术
讨论群
扫码添加语音小管家,进入语音之家讨论群
沙龙联系人
闫亮
电话:18611344096
邮箱:jack@speechhome.com