唇读是聋人社区的主要工具。通常,自动唇读需要一段说话人的视频。嘴唇形成的形状和节奏通常是口译中最重要的因素,但其他各种动作都有助于解读说话人的信息,另外,面部表情和头部的运动也是决定因素。如果有任何有用的音频,自动唇读过程将大大简化,因为来自听觉部分的上下文线索可以提示听不见的单词或语音片段。自动唇读技术的发展依赖于识别每次说话时使用相同嘴唇运动的孤立单词的能力。唇形几何估计(LGE)是一种更先进的计算机系统,可以监控和解释这些模式。科学家们已经为荷兰语开发了一个著名的自动唇读和语音识别系统,但总的来说,这一领域仍有很大的发展空间,自动唇读最近因其在阿道夫·希特勒的存档家庭视频中的应用而受到了极大的兴趣和关注战争期间由伊娃·布劳恩拍摄,当语音识别技术应用到镜头中时,曾经默默无闻的电影变得栩栩如生,自动唇读程序提供了一个历史人物的一瞥,无疑将创造出对自动唇读领域的持续兴趣。
0 篇文章
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!