社区
CSDN创作者社区
活动频道
帖子详情
lancy112
2025-06-26 19:31:55
AI初创公司寻**移动端开发工程师**,具备**语音AI(ASR+TTS)集成能力**,熟悉**实时语音流处理和说话人区分技术**,最好有**嵌入式或智能硬件对接经验**,并且能够**快速落地App产品**。他/她需要理解语音识别的核心技术和API调用流程,能独立完成从录音、上传、转写到播放的完整闭环,5-10年相关领域工作经验。 坐标:广东深圳 薪资待遇: 30K*14薪+期权。 联系方式:4672895@qq.com或加微信lancy6699
...全文
114
回复
打赏
收藏
AI初创公司寻**移动端开发工程师**,具备**语音AI(ASR+TTS)集成能力**,熟悉**实时语音流处理和说话人区分技术**,最好有**嵌入式或智能硬件对接经验**,并且能够**快速落地App产品**。他/她需要理解语音识别的核心技术和API调
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Android
开发
实战:如何免费
集成
第三方
TTS
SDK实现高效
语音
合成
基于火山引擎豆包大模型,从零搭建一个
实时
语音
通话应用。它不是简单的问答,而是
需要
你亲手打通
ASR
(
语音
识别
)→ LLM(大脑思考)→
TTS
(
语音
合成)的完整 WebSocket 链路。对于想要掌握
AI
原生应用架构的同学来说,这是个绝佳的练手项目。架构
理解
:掌握
实时
语音
应用的完整
技术
链路(
ASR
→LLM→
TTS
)技能提升:学会申请、配置与
调
用火山引擎
AI
服务定制
能力
:通过代码修改自定义角色性格与音色,实现“从使用到创造”从0到1构建生产级别应用,脱离Demo,点击打开。
国内最值得关注的10家人工
智能
语音
识别
公司
在谈人工
智能
的时候,一定不能不谈
语音
识别
,
语音
识别
是人机交互的入口,是指机器/程序接收、解释声音,或
理解
和执行口头命令的
能力
。目前国内外都有
公司
在
语音
领域有所投入,其中包括才成立几年的
初创
企业,也包括中途入局的巨头企业,电子发烧友梳理了国内10家在
语音
领域影响较大的企业如下,排名不分先后,如有任何纰漏,欢迎留言指正。 科大讯飞 成立于1999年,具有
语音
合成、
语音
识别
、口语评测、语言翻译、声纹识别、人脸识别、自然语言
处理
等
智能
语音
与人工
智能
核心
技术
。 主要
产品
介绍: 讯飞输入法,支持
语音
输入..
Dify平台支持的
语音
识别
与合成
集成
方案
通过Dify平台,
开发
者可高效
集成
ASR
与
TTS
能力
,实现
语音
识别
与合成的可视化编排。支持主
流
及开源模型插件,结合SSML
语音
控制与全链路
调
试,显著降低
开发
与协作成本,适用于
智能
客服、
语音
助手等场景。
Dify平台支持的
语音
识别
与合成
集成
路径
通过Dify平台实现
ASR
与
TTS
的高效
集成
,利用可视化
流
程编排连接
语音
识别
、大语言模型和
语音
合成服务,降低多模态
AI
系统的
开发
复杂度。支持云
API
与本地模型部署,提升
语音
处理
准确率与自然度,适用于
智能
助手、客服等场景。
Qwen3-8B
语音
对话系统搭建指南(搭配
TTS
/
ASR
)
本文介绍如何基于Qwen3-8B大模型,结合
ASR
与
TTS
技术
,构建可在消费级GPU上运行的本地
语音
对话系统。涵盖模型部署、
语音
识别
、合成及系统优化等关键步骤,实现低延迟、有记忆的自然交互体验。
CSDN创作者社区
1,388
社区成员
219
社区内容
发帖
与我相关
我的任务
CSDN创作者社区
每月CSDN创作评奖活动由CSDN联合多家科技企业共同发起,旨在鼓励和扶持原创作者为IT技术人交流平台创作出更多高质量的内容,社区将根据内容质量进行每月评选,与企业共同为获奖者颁奖。从学习交流成长
复制链接
扫一扫
分享
社区描述
每月CSDN创作评奖活动由CSDN联合多家科技企业共同发起,旨在鼓励和扶持原创作者为IT技术人交流平台创作出更多高质量的内容,社区将根据内容质量进行每月评选,与企业共同为获奖者颁奖。从学习交流成长
其他
其他
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章