英国东英吉利大学日前发布的新成果显示,该校研究人员开发的新型视觉语音识别系统能像专业人员那样识别唇语,且识别度更精确,未来在案件侦查以及辅助听力和语言有障碍的人士方面具有广泛用途。
据新华网29日消息,据研究人员介绍,无论是专业人士还是现有的视觉语音电脑识别系统,在读唇语时一个最大挑战是如何区别容易混淆的发音,如英文中“p”、“b”、“m”发音时,唇部动作都非常相似,很难区别。但最新开发的电脑系统利用特别设计的程序,能分辨出图像中唇部最细微的变化,并且完全不需要语音信息辅助。
参与这项研究的东英吉利大学学者海伦·贝尔说,发“p”、“b”、“m”这样的音时,唇部动作还是会有肉眼不易察觉的差别,这款电脑程序会不断学习和积累相似发音的唇部动作,并进行相关分类,从而不断提高识别的精确度。
贝尔表示,未来经过进一步优化,这一系统能够运用在多个领域中,除了用来帮助有听力和语言障碍的人士,相关技术也会对人工智能的发展起到很好的助推作用。