社区
中国开发者大调查2022
活动介绍
帖子详情
cpongo123
荣誉创作者
测试
业界专家认证
2021-02-02 19:58:41
客家话客家话客家话客家话客家话客家话看
...全文
213
回复
打赏
收藏
客家话客家话客家话客家话客家话客家话看
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
如何使得SenseVoiceSmall具备识别方言的能力 | SenseVoiceSmall方言模型训练 | SenseVoiceSmall
客家话
模型 |
客家话
ASR模型
在虚拟数字人对话场景中,因用户使用方言沟通,而开源模型缺乏方言识别能力,故有必要训练方言ASR模型。本文基于阿里开源的SenseVoiceSmall模型,用2231条
客家话
数据集,训练出可识别梅州、惠州和粤西
客家话
的模型,还展示了训练效果及loss曲线。
客家话
ASR模型训练 | 如何让FunASR可以识别方言 | SenseVoice方言模型 | SenseVoice
客家话
模型 | Hakka ASR
本文介绍了
客家话
ASR模型的训练过程。基于SenseVoiceSmall,使用2231条
客家话
数据在3090Ti中训练。数据来自视频平台及自录,经ocr工具生成字幕并切分。统一音频格式为单声道、16k采样率、pcm_s16le的wav格式,生成jsonl文件后进行训练,还可查看loss曲线。
客家话
朗读!文字转语音的AI在线合成技术TTS
本文介绍了一种能将输入的汉字转换为
客家话
语音的在线AI技术HakkaTTS,支持繁体字输入,并允许用户根据拼音调整声韵调。源自B站阅读原文。,
客家话
文化传承语音档案建设
借助VoxCPM-1.5-TTS-WEB-UI这一低门槛、高保真语音合成工具,
客家话
等濒危方言得以高效数字化保存。系统通过44.1kHz高清音频输出、声音克隆与网页化操作,让非技术人员也能参与构建方言语音档案,推动文化传承从专家主导走向大众参与,为地方语言的活态延续提供可持续路径。
中文方言挑战:四川话、
客家话
识别效果最新实测
本文基于真实方言录音,在RTX 4090硬件环境下,对Speech Seaco Paraformer、SenseVoiceSmall和Fun-ASR-Nano三大模型进行四川话与
客家话
语音识别实测。结果显示:Paraformer在四川话识别中表现稳健,支持热词与批量处理;而
客家话
因训练数据缺失导致识别困难,需依赖专用微调模型。文中还总结了提升方言识别率的实用技巧及适用场景边界。
中国开发者大调查2022
52
社区成员
678
社区内容
发帖
与我相关
我的任务
中国开发者大调查2022
为计算领域的专业人士服务777
复制链接
扫一扫
分享
社区描述
为计算领域的专业人士服务777
金融
教育电商
企业社区
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
公告显示,什么情况,哈哈哈哈哈
试试用AI创作助手写篇文章吧
+ 用AI写文章