【语音之家】AI产业沙龙——腾讯会议背后的语音技术

语音之家 2021-10-12 14:26:53
加精

由CCF语音对话与听觉专委会 、中国人工智能产业发展联盟(AIIA)评估组 、腾讯会议天籁实验室、语音之家(北京)科技有限公司、北京希尔贝壳科技有限公司共同主办的【语音之家】AI产业沙龙-腾讯会议背后的语音技术,将于2021年10月12日 20:00通过语音之家微信视频号直播。

参会嘉宾

商世东

腾讯会议天籁实验室主任

通信学会人工智能专委会委员

CCF语音对话与听觉专委会委员

 

嘉宾简介:商世东,腾讯会议天籁实验室主任,通信学会人工智能专委会委员,CCF语音对话与听觉专委会委员。2019年年初回国加入腾讯,担任腾讯会议天籁实验室负责人,带领团队负责腾讯会议,腾讯云TRTC,手Q等产品中全链路,多场景的实时音频分析,处理和评估等业界领先技术的研究和产品化落地,拥有20余年音视频领域相关经验,先后工作过摩托罗拉和杜比实验室,负责创建杜比北京的研发团队。加入腾讯前,担任杜比中国和澳大利亚研发团队高级总监。

 

分享内容:腾讯会议天籁实验室介绍

摘要:腾讯会议天籁实验室成立于2020年,前身是腾讯多媒体实验室的音频团队,专注音视频通信技术的前瞻性探索,研究,应用和落地,致力于云会议等场景,打造下一代实时音频通信端到端解决方案。作为腾讯旗下顶尖的音频通信和处理研发团队,腾讯天籁的解决方案,以心理听觉的发音和感知模型为基础,融合感知编码、声学硬件设计、经典语音信号处理和深度学习技术,可以适应不同应用场景和终端设备,为用户提供高清、纯净、流畅和智能的音频通信体验。

饶为

腾讯会议天籁实验室高级研究员

香港理工大学博士

深圳市海外高层次人才

 

嘉宾简介:饶为,腾讯会议天籁实验室高级研究员,香港理工大学博士,深圳市海外高层次人才。2020年回国加入腾讯,负责说话人提取,语音分离,语音增强,声纹识别等方向的研究和产品化落地。饶为博士在加入腾讯前,曾在新加坡南洋理工大学担任研究科学家和新加坡国立大学担任研究员,并于2018年获得新加坡南洋理工大学淡马锡实验室颁发的最佳科技奖。其在音频领域国际顶级期刊及会议上发表30多篇文章,曾担任国际语音会议ASRU 2019组织委员会成员,同时也是多个国际顶级期刊和会议的受邀审稿人。其作为组织者之一,成功举办了针对视频会议场景的远场多通道语音增强国际竞赛(ConferencingSpeech 2021)和远场多通道声纹识别国际竞赛(FFSVC2020)。

 

分享内容:ConferencingSpeech 2021:面向视频会议的远场多通道语音增强挑战赛

摘要:随着视频会议技术的进步,人与人之间的距离障碍逐渐被打破,我们能够随时随地与他人开展无缝连接。但是,在视频会议期间,语音质量仍会受到背景噪声、混响、录音麦克风数量、麦克风阵列布局、麦克风阵列的声学和电路设计等因素的显著影响,复杂会议场景下的语音增强仍然有许多难点值得探索。为了提供一个通用的数据集以及公平的测试平台,促进真实视频会议场景中远场多通道语音增强技术的研究,腾讯会议旗下腾讯会议天籁实验室联合西北工业大学、卡内基梅隆大学(CMU)、约翰霍普金斯大学(JHU)、 丹麦奥尔堡大学(Aalborg Univ.)、北京希尔贝壳科技有限公司,在国际语音顶级会议INTERSPEECH2021上组织发起了针对真实视频会议场景的远场多通道语音增强挑战赛(ConferencingSpeech 2021)。本报告将介绍ConferencingSpeech 2021挑战赛的相关情况,数据,竞赛任务设置,竞赛评估标准和竞赛结果。

余涛

腾讯会议天籁实验室技术研发专家

 

嘉宾简介:余涛,腾讯会议天籁实验室技术研发专家,深耕实时语音通信和智能语音交互行业10多年,有着丰富的超大规模应用产品研发,以及引领性技术探索并落地经验,取得近百项国际专利和行业顶会专著。加入腾讯前,就职于高通和阿里达摩院。

 

分享内容:面向会议室复杂环境的天籁模组方案

摘要:会议室远场语音实时处理问题,是长期制约会议通信体验的难点问题。腾讯天籁语音模组,基于软硬一体的声学硬件设计,通过麦克风阵列和深度学习技术相融合,实现在远场复杂物理空间下的拾音能力的突破性提升,能够帮助硬件生态合作伙伴快速形成会议音频能力,大幅提升硬件产品的音频体验。

肖玮

腾讯会议天籁实验室专家研究员

 

嘉宾简介:肖玮,腾讯会议天籁实验室专家研究员,16年音频技术研究,曾参与ITU-T、3GPP、MPEG、AVS等标准组织下多个标准化工作,包括音频压缩、感知质量评估等方向。有50+篇专利(部分已授权)和50+篇标准提案,相关技术曾被多个标准和产品采纳。目前主要研究方向包括:语音通信、语音增强、心理听觉建模、语音质量评估等。他于2018年加入腾讯,负责新一代语音引擎相关技术研究;此外,负责将RTC和AI技术,通过腾讯天籁行动的推广,提升听障用户的听觉体验。

 

分享内容:面向弱网实时通信的体验保障技术

摘要:疫情等客观因素助推了实时音视频(Real-Time Communication)技术的落地应用,业务和访问量的井喷,对服务质量的保障提出新的挑战。本次报告从远程音视频会议场景切入,分享腾讯会议中针对弱网场景下的QoE保障的技术方案。特别地,在算法创新上,提出了结合经典信号处理和深度学习技术的方法论,并在多个方向上获得应用,以求在低复杂度、低时延的约束下,提升弱网环境下的通话质量。

 

沙龙议程


参加方式

扫码进入视频号观看直播

讨论群

扫码进入讨论群,可以与嘉宾直接互动

 

沙龙联系人

闫亮

电话:18611344096

邮箱:jack@speechhome.com

...全文
3352 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

229

社区成员

发帖
与我相关
我的任务
社区描述
助力AI语音开发者的社区
语音识别人工智能自然语言处理 企业社区 北京·昌平区
社区管理员
  • 语音之家
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧