社区
多媒体/流媒体开发
帖子详情
如何通过摄像头读取并识别唇语,进而处理转化为文字?
EricTangHL
2004-07-04 09:10:31
rt
...全文
698
20
打赏
收藏
如何通过摄像头读取并识别唇语,进而处理转化为文字?
rt
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
20 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
China200878
2004-08-10
打赏
举报
回复
UP
AlwaysS
2004-08-10
打赏
举报
回复
我觉得这是不可能的,因为人类语言的发音除了唇部的动作以外,还要口腔内的舌、齿、颚以及声带的配合来一起完成,而这些器官的动作你是没有办法看到的,那怎么识别呢???
luckyzlcat
2004-08-06
打赏
举报
回复
唉,光是想想可能涉及到的技术都觉得自己快被淹死了。谁要是单枪匹马做出来,那就…………
可惜俺是普通人啊!
showphon
2004-08-05
打赏
举报
回复
嘿嘿,恐怖
Mycro
2004-08-03
打赏
举报
回复
我问了同事,20年
之内你做不出来。。
showphon
2004-07-30
打赏
举报
回复
本人觉得有两套方案,都很难。
1.将唇形视频序列(唇形动作)转化为语音,然后进行语音识别。因为是合成语音,所以比较好识别。关键是怎样把视频序列转化为语音,怎样定义一个音的单位。因为语音单位很多,想象一下汉语,数据库可能很大。
2.根据不同语系,直接将唇形动作转化为词汇集合,通过语法进行校正。
happydeer
2004-07-30
打赏
举报
回复
哈哈,技术啊!
longwen8000
2004-07-30
打赏
举报
回复
该天咱开发个会看眼色的东东!
apogeecsj
2004-07-29
打赏
举报
回复
很高深
Geo_Cra
2004-07-29
打赏
举报
回复
OpenCV上似乎有个人刷了个这样的程序上去,但是我还没有调试成功
xixi790802
2004-07-29
打赏
举报
回复
有挑战性
xdspower
2004-07-08
打赏
举报
回复
这个有几个关键问题,就是焦点定位,然后是标准比较,然后是转换,这涉及到模式识别,人工智能和数据库等等,而且每个语言特性不同不一定能转换所有的技术能简单转移,即几乎要从头开发许多版本。而这个只可能用于一些间谍领域...。
knightR
2004-07-07
打赏
举报
回复
语音识别都是未来几年挠头的问题
唇语识别的目前可行方案--------招个懂唇语而且会打字的人...
coolhuaer
2004-07-06
打赏
举报
回复
一个人做?几乎不可能
cctvchen
2004-07-06
打赏
举报
回复
大哥,你做吧,做出来给我一份代码,我给你RMB200报酬
ChenYongThread
2004-07-06
打赏
举报
回复
牛!
学习中!
black_fox
2004-07-04
打赏
举报
回复
这是应该人工智能的领域了。。
我觉得很难实现,如果能够做出来,我估计能够拿图灵奖了。。
always_rick
2004-07-04
打赏
举报
回复
不知道
wbel
2004-07-04
打赏
举报
回复
太难了
初学者
2004-07-04
打赏
举报
回复
这里应该没这牛人。
lip_
唇语
识别
_Eclipse_
唇语
识别
数据
论文研究-高安全性人脸
识别
系统中的
唇语
识别
算法研究.pdf
针对目前人脸
识别
系统面临的图片和视频攻击,构建了一种将人脸
识别
与口令密码相结合,并采用
唇语
识别
技术进行活体检测的高安全性身份认证系统。首先由于汉语
唇语
数据的缺少,建立了CNLIP1和CNLIP2两个较大的汉语
唇语
数据库;其次,为了保留
唇语
的时序性,采用堆叠卷积独立子空间分析(ISA)深度神经网络模型来实现唇动时序特征的提取;最后提出使用迁移学习算法来训练特定人
唇语
识别
模型。实验证明,唇动时序特征能更好地表征出数字串
唇语
,迁移学习训练的特定人
唇语
模型能够满足活体检测的需要,所构建的高安全性人脸
识别
系统具有较好的防攻击效果。
基于深度学习的
唇语
识别
研究_吴伟(好).caj
本文在深度学习技术基础上对
唇语
进行
识别
研究,其具体流程及章节安排 如下: 1. 主要介绍了
唇语
识别
技术的相关内容,给出了传统的
唇语
识别
方法与基 于深度学习的
唇语
识别
方法的区别与联系,并针对国内外研究状况进行了分析 介绍。 2. 对
唇语
识别
技术的一些相关理论技术进行了介绍,并且利用
唇语
识别
研 究中的人脸检测,唇部定位,视觉特征和时序特征的提取以及最后的唇动
识别
这几个方面来展开介绍,同时也介绍了深度学习方面相关模型与算法。 3. 首先对
唇语
识别
的实现过程做了简要叙述;其次,通过检测人脸与脸部 关键点来对唇部进行检测做了详细介绍;最后,介绍了通过手工设计特征 HOG 特征以及采用 LSTM 网络来对
唇语
进行
识别
,并在公开的 GRID 数据集上进行 验证。
5.毕业论文 _钟东昌_《面向
唇语
识别
的数据采集系统设计与实现》.pdf
近年来
唇语
识别
成为了人机交互的黑科技,融合了机器视觉与自然语言处 理技术,在语音
识别
、人机智能交互、安防和公益等领域有着重要的实用价值 和理论意义,发展前景十分广阔。
唇语
识别
的研究离不开数据集,而国内目前还没有可用的中文
唇语
数据集, 因此,设计实现一个面向
唇语
识别
的数据采集系统将会具有重要的实用价值。本 文首创性地设计实现了一个面向中文
唇语
识别
的数据采集系统,用语音
识别
提取 视频的
文字
和对应的时间戳信息,再按词语进行视频切割并分割提取唇形,将其 与
文字
相对应,准确率超过 95%,与 DeepMind 团队提出的英文
唇语
识别
数据采 集系统性能进行分析比较,得出了本系统性能更好的结论。
基于深度学习的
唇语
识别
应用的研究与实现_杨帆(好).caj
唇语
识别
是计算机视觉领域中一个富有挑战性的研究课题,其主要目的是从 视频中观察人嘴唇运动
识别
出对应文本内容。然而,由于嘴唇变化局限性和语言 内容丰富性,增加
唇语
识别
难度,使得
唇语
研究课题发展缓慢。如今,深度学习 在各个领域的发展,给我们足够的信心来完成
唇语
识别
这个任务。不同于传统的
唇语
识别
中的嘴唇特征
识别
,在基于深度学习的
唇语
识别
,通常包含使用深度网 络模型对图像的特征提取和理解。
多媒体/流媒体开发
2,543
社区成员
20,281
社区内容
发帖
与我相关
我的任务
多媒体/流媒体开发
专题开发/技术/项目 多媒体/流媒体开发
复制链接
扫一扫
分享
社区描述
专题开发/技术/项目 多媒体/流媒体开发
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章