过于敏感的麦克风可能会产生语音信息,这对语音来说很困难破译识别软件。最基本的语音识别问题之一是使用的输入设备的质量。如果麦克风不够灵敏或过于敏感,那么它会产生对软件来说很难破译的音频信息。尤其是当麦克风如此敏感以至于语音失真时,使识别软件几乎无用。一个类似的问题源于背景噪声,背景噪声可能难以从主语音中分离出来,并且当包含在语音处理中时可能导致不准确的翻译语音、口音和说话节奏的差异结合在一起,形成了一个更普遍的语音识别问题。当一个单词可以以多种方式发音时,软件可能会变得混乱并曲解所说的话。当一个人说话的速度比程序预期的慢或快时,也会出现同样的情况是一些局部的解决方案,例如在软件中训练单个用户的语音模式,并使用动态时间扭曲算法将语音与样本数据库相匹配,但它们并不能解决所有的问题语音识别问题是识别所说单词的上下文。计算机软件无法识别单词集合的预期含义,从而导致转录文本出现许多问题。只有当上下文用法是已知的。出于同样的原因,精确的标点符号对于软件来说几乎不可能仅仅基于知道单词的顺序来放置。有一些功能性的转录软件被用于医学等领域,但是结果往往是没有任何类型的分离的一块单词,这意味着仍然需要一个人类转录师来编辑文档并创建一个可读的最终副本
0 篇文章
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!