音频文件转文字

慷慨的蒜苗 2016-11-09 04:12:54
我公司现在提一需求,需求为音频文件转文字功能。
具体需求就是,有一视频文件,初步设想,是通过代码,提取出音频文件,然后根据,现有开源库,或者收费库,做到音频文件转文字功能。
我想问下,现在是否有这种开源库。
科大讯飞的C++版本好像不支持这种功能。
问题:
能否告知这种开源库的名称。
是否可以直接视频文件,转出文字。
谢谢。
...全文
844 17 打赏 收藏 转发到动态 举报
写回复
用AI写文章
17 条回复
切换为时间正序
请发表友善的回复…
发表回复
勤奋的小游侠 2016-11-10
  • 打赏
  • 举报
回复
引用 11 楼 shihengzhen101 的回复:
[quote=引用 10 楼 lovesmiles 的回复:] 1视频文件有音频信道,这个看你什么格式,提取音频并不难 2音频转文字,直接用科大讯飞的SDK,没有开源的,或者开源的根本不够好。 科大讯飞的SDK ,强烈推荐!!!
你是不是个托[/quote] 我只是用了讯大的语音输入法。觉得他们的识别率做得确实很高。 反正爱用不用
AlbertS 2016-11-10
  • 打赏
  • 举报
回复
引用 10 楼 lovesmiles 的回复:
1视频文件有音频信道,这个看你什么格式,提取音频并不难 2音频转文字,直接用科大讯飞的SDK,没有开源的,或者开源的根本不够好。 科大讯飞的SDK ,强烈推荐!!!
你是不是个托
慷慨的蒜苗 2016-11-10
  • 打赏
  • 举报
回复
引用 9 楼 u010165006 的回复:
IBM ViaVoice类似产品,提取它的DLL可行否?
我去试试去。谢谢
慷慨的蒜苗 2016-11-10
  • 打赏
  • 举报
回复
引用 4 楼 u010370871 的回复:
你去问问产品经理怎么不上天
甭提了,今天用讯飞sdk 做了一下,只能识别一分钟,音频差不多标准普通话吧,效果不是太好啊。。。经理告诉,先不考虑识别路,我心头一万头草泥马奔腾而过啊。。。
慷慨的蒜苗 2016-11-10
  • 打赏
  • 举报
回复
引用 2 楼 zhao4zhong1 的回复:
目前还没有相关成熟技术。 口语、俗语、俚语、方言、呻吟、外星语、梦呓、鹦鹉、…… 都够你喝一壶的了。
赵四老师说的很有道理。。。 我们是视频监控,提取的好多都是新闻联播,今天弄明白讯飞的sdk了,使用格式工厂,cooledit各种转换啊,终于转换成讯飞的 16k,16bit,单声道的视频了,然后使用讯飞的sdk试试,几乎标准普通话,错误率也不少。。。
赵4老师 2016-11-10
  • 打赏
  • 举报
回复
赵4老师 2016-11-10
  • 打赏
  • 举报
回复
刚接了个电话:“你好!方便面是吗?” …… “你打错电话了!我是火腿肠!!” …… …… …… (好象说的是“方便面试吗?”) 请使用科大讯飞的SDK将这段音频转文字试试看。
勤奋的小游侠 2016-11-09
  • 打赏
  • 举报
回复
1视频文件有音频信道,这个看你什么格式,提取音频并不难 2音频转文字,直接用科大讯飞的SDK,没有开源的,或者开源的根本不够好。 科大讯飞的SDK ,强烈推荐!!!
ooolinux 2016-11-09
  • 打赏
  • 举报
回复
IBM ViaVoice类似产品,提取它的DLL可行否?
yeeeex 2016-11-09
  • 打赏
  • 举报
回复
说呻吟的太6
AlbertS 2016-11-09
  • 打赏
  • 举报
回复
手游一般也是转音频,很少转视频
AlbertS 2016-11-09
  • 打赏
  • 举报
回复
上天上天,哈哈哈哈,可以参考一下手游的
赵4老师 2016-11-09
  • 打赏
  • 举报
回复
引用 3 楼 lzhui1987 的回复:
[quote=引用 2 楼 zhao4zhong1 的回复:] 目前还没有相关成熟技术。 口语、俗语、俚语、方言、呻吟、外星语、梦呓、鹦鹉、…… 都够你喝一壶的了。
呻吟。。赞一个[/quote]
张小飞Official 2016-11-09
  • 打赏
  • 举报
回复
你去问问产品经理怎么不上天
HymanLiuTS 2016-11-09
  • 打赏
  • 举报
回复
引用 2 楼 zhao4zhong1 的回复:
目前还没有相关成熟技术。 口语、俗语、俚语、方言、呻吟、外星语、梦呓、鹦鹉、…… 都够你喝一壶的了。
呻吟。。赞一个
赵4老师 2016-11-09
  • 打赏
  • 举报
回复
目前还没有相关成熟技术。 口语、俗语、俚语、方言、呻吟、外星语、梦呓、鹦鹉、…… 都够你喝一壶的了。
慷慨的蒜苗 2016-11-09
  • 打赏
  • 举报
回复
手动置顶,谢谢。
目 录 第一章 开发环境 1.1 Qt 简介5 1.2 下载安装 Qt Creator 6 1.3 第一个程序 Hello World 7 第二章 窗体应用 1.1 窗体基类说明 12 1.2 控制窗体大小 13 1.3 窗体初始位置及背景色 13 1.4 修改标题栏图标 14 1.5 移动无边框窗体 16 1.6 去掉标题栏中最大化、最小化按钮 17 1.7 多窗体调用 18 1.8 字体形状窗体 20 第三章 控件应用 1.1 QPushButton按钮 23 1.2 QLabel标签 23 1.3 QLineEdit单行文本 24 1.4 QTextEdit多行文本 25 1.5 QPlainTextEdit多行文本 26 1.6 QComboBox下拉列表框 26 1.7 QFontComboBox字体下拉列表框 27 1.8 QSpinBox控件 28 1.9 QTimeEdit时间控件 29 1.10 QDateEdit日期控件 30 1.11 QScrollBar控件 30 1.12 QRadioButton单选按钮 31 1.13 QCheckBox复选框 32 1.14 QListView 列表控件 34 1.15 QTreeView树控件 34 1.16 QTableView表格控件 35 1.17 QHBoxLayout横向布局 36 1.18 QGridLayout网格布局 37 1.19 QGroupBox控件 38 1.20 QTabWidget控件 39 1.21 QMenu、QToolBar控件 41 1.22 任务栏托盘菜单 43 第四章 组件应用 1.1日历组件 47 1.2登录窗口 48 1.3文件浏览对话框 50 1.4颜色选择对话框 51 1.5进度条实例53 1.6Timer实时更新时间 54 第五章 文件操作 1.1创建文件夹 57 1.2写入文件 58 1.3修改文件内容 60 1.4删除文件 62 1.5修改文件名 63 1.6 INI文件写入操作 65 1.7 INI文件读取操作 68 1.8创建XML文件 71 1.9读取XML文件 72 第六章 图形图像操作 1.1绘制文字 75 1.2绘制线条 75 1.3绘制椭圆 77 1.4显示静态图像 78 1.5显示动态图像 78 1.6图片水平移动 79 1.7图片翻 80 1.8图片缩放 82 1.9图片中加文字 84 1.10图像扭曲 85 1.11模糊效果 85 1.12着色效果 86 1.13阴影效果 87 1.14透明效果 87 第七章 多媒体应用 1.1音频、视频播放器 90 1.2播放Flash动画 94 1.3播放图片动画 95 第八章 系统操作 1.1获取屏幕分辨率 98 1.2获取本机名、IP地址 98 1.3根据网址获取IP地址 99 1.4判断键盘按下键值 100 1.5获取系统环境变量 101 1.6执行系统命令 102 第九章 注册表 1.0简要说明注册表 105 1.1写入注册表 105 1.2查找注册表 106 1.3修改IE浏览器的默认主页 107 第十章 数据库基础 1.1查询数据库驱动 109 1.2Qodbc连接Access数据库 109 1.3插入数据 111 1.4数据列表 112 1.5操作SQLite数据库 113 1.6SQLite数据库视图管理器 115 第十一章 网络开发 1.1点对点聊天服务端 119 1.2点对点聊天客户端 123 1.3局域网广播聊天 128 1.4SMTP协议发送邮件 148 1.5调用系统DLL判断网络连接状态 152 第十二章 进程与线程 1.1进程管理器 155 1.2线程QThread应用 158 1.3线程QRunnable应用 159 第十三章 数据安全 1.1 QByteArray加密数据 163 1.2 AES加密数据 164 1.3 MD5 加密数据 165 1.4 生成随机数 166 第十四章 打包部署 1.1 FilePacker 打包 169 1.2 Inno Setup 打包 174

64,654

社区成员

发帖
与我相关
我的任务
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++ 技术论坛(原bbs)
社区管理员
  • C++ 语言社区
  • encoderlee
  • paschen
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  1. 请不要发布与C++技术无关的贴子
  2. 请不要发布与技术无关的招聘、广告的帖子
  3. 请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下

试试用AI创作助手写篇文章吧