作者:群芳 来源:科学时报 发布时间:2009-9-4 8:25:29
选择字号:
英科学家开发成功识别多种语言唇读技术
对耳聋患者、执法机构以及嘈杂环境中的工作者具有实际应用意义

计算机能够进行唇读这并不新鲜,但是在英国,它们首次被“教会”识别不同的语言。 

英国科学家日前研制出可以分辨不同语言的唇读计算机。其实研究人员一直在开发可以读唇语的计算机,但是它们被“教会”识别各种语言还是第一次。科学家指出,这项发明对耳聋患者、执法机构以及嘈杂环境中的工作者具有实际应用意义。
 
这项研究由英国东安格利亚大学计算机科学学院的Stephen Cox和Jake Newman指导完成。该技术是通过对23位掌握两种或三种语言的人的唇部动作进行统计建模而开发的。该系统能够识别单个讲话者所说的语言,而且具有很高的准确性。这些语言包括英语、法语、德语、阿拉伯语、汉语普通话及粤语、意大利语、波兰语和俄语。
 
Cox表示:“这是自动唇读技术的一次令人激动的进步,它第一次科学地证实了我们已有的直观推断,即当人们讲不同的语言时,他们会以不同的顺序出现不同的唇形。”Cox介绍说,“例如,我们发现讲法语的人较常出现圆唇形,而讲阿拉伯语的人具有很明显的舌部动作。”
 
Cox补充说:“多年来,科学家一直在进行语音和语言处理法则的基础研究,比如噪音中的语音识别、公式化语言建模、由语音合成所做的语言处理以及语音处理应用的开发。”
 
据研究人员介绍,自动唇读技术中蕴含着许多科学挑战。目前的项目已经解决了其中的几个主要科学问题,包括面部动作与感知语音之间是什么关系;讲话者的语言以及谈话内容如何影响这种关系;语言、讲话者的姿势以及谈话内容对识别准确度有什么影响等。
 
这项研究属于一个更宽泛的自动唇读项目中的一部分。该项目将建立在先进的计算机视频和语音识别技术之上,对视频中的自动唇读进行研究和评估,从而开发能够对来自视频中的目标进行自动、语言独立唇读的工具和技术。该项目还寻求量化人类以及自动机器的能力。研究人员下一步将使这个系统更加适合个人生理学,以及人们说话的方式。
 
《科学时报》 (2009-9-4 A4 国际)
 
 打印  发E-mail给: 
    
 
以下评论只代表网友个人观点,不代表科学网观点。 查看所有评论
SSI ļʱ
 
读后感言:
相关新闻 相关论文

图片新闻
史上最亮伽马射线暴来自一颗坍缩的恒星 中国天眼揭秘宇宙“随机烟花”
导师:年年审毕业论文,总有这些问题! 科学家发现第一颗拥有永久黑暗面的行星
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文
 
论坛推荐