语音识别软件自诞生以来有了很大的发展,但仍有几个大的问题使它不能完全作为一种转录方法来使用,其中一些难以解决的语音识别问题包括单词发音的变化、个别口音的变化、语音识别软件的设计、语音识别软件的开发、语音识...
语音识别软件自诞生以来有了很大的发展,但仍有几个大的问题使它不能完全作为一种转录方法来使用,其中一些难以解决的语音识别问题包括单词发音的变化、个别口音的变化、语音识别软件的设计、语音识别软件的开发、语音识别软件的开发以及语音识别软件的开发等,同音词和不需要的环境噪声。另一组语音识别问题涉及实际输入声音的硬件类型,因为结果会对软件解释语音的方式产生很大影响。还有一个问题是不知道所说单词的上下文,这可能会导致文本没有标点或拼写不准确。

过于敏感的麦克风可能会产生语音信息,这对语音来说很困难破译识别软件。最基本的语音识别问题之一是使用的输入设备的质量。如果麦克风不够灵敏或过于敏感,那么它会产生对软件来说很难破译的音频信息。尤其是当麦克风如此敏感以至于语音失真时,使识别软件几乎无用。一个类似的问题源于背景噪声,背景噪声可能难以从主语音中分离出来,并且当包含在语音处理中时可能导致不准确的翻译语音、口音和说话节奏的差异结合在一起,形成了一个更普遍的语音识别问题。当一个单词可以以多种方式发音时,软件可能会变得混乱并曲解所说的话。当一个人说话的速度比程序预期的慢或快时,也会出现同样的情况是一些局部的解决方案,例如在软件中训练单个用户的语音模式,并使用动态时间扭曲算法将语音与样本数据库相匹配,但它们并不能解决所有的问题语音识别问题是识别所说单词的上下文。计算机软件无法识别单词集合的预期含义,从而导致转录文本出现许多问题。只有当上下文用法是已知的。出于同样的原因,精确的标点符号对于软件来说几乎不可能仅仅基于知道单词的顺序来放置。有一些功能性的转录软件被用于医学等领域,但是结果往往是没有任何类型的分离的一块单词,这意味着仍然需要一个人类转录师来编辑文档并创建一个可读的最终副本