词义消歧(WSD)是解释语言的软件程序的核心,歧义词或句子可以通过多种方式理解,虽然只有一个意思,但是歧义消除是为了解释单词和句子的意思。对于那些负责设计准确的界面来弥补口语和书面语之间的差距的程序员来说,这一领域...
词义消歧(WSD)是解释语言的软件程序的核心,歧义词或句子可以通过多种方式理解,虽然只有一个意思,但是歧义消除是为了解释单词和句子的意思。对于那些负责设计准确的界面来弥补口语和书面语之间的差距的程序员来说,这一领域是非常具有挑战性的,以及计算机生成的翻译。手持计算机软件的人可以“听”到用户对着麦克风讲话,并将所说的单词翻译成键入的句子。用户可以听写标点符号,在适当的地方插入“逗号”和“句点”等词。这听起来很简单除了许多单词听起来完全一样。例如,know和no或I和eye在语音上是无法区分的。词义消歧有助于正确地翻译“下周我应该知道”,这基本上是一套“if,then”规则,将单词位置和相邻单词作为目的词。这种词义消歧方法被称为“浅层方法”,相当准确,但不能总是依赖它。另一种方法是应用“世界知识,或者计算机语言学称之为“深度方法”。这种方法依赖于词典和同义词库等词典来帮助确定单词的正确含义。不幸的是,设计一个足够全面的、比浅层方法更准确的深层方法数据库并不是一件容易的事。软件朗读文本(文本到语音)也需要词义消歧。例如,bass这个词可能意味着乐器、音符或鱼。在后一种情况下,它的发音不同,由WSD来推断使用哪个发音如果输入的句子碰巧是“低音很重”,只有扫描一下周围的句子,才能发现一些线索,比如找到“钓鱼”、“船”、“码头”或相反的“乐队”、“音乐”或“歌曲”。如果程序的词义消歧不够有力,或者没有其他线索,程序可能会在翻译中出错。除了浅层方法中的“如果,那么”规则外,算法还用于确定正确的解释。在上面的例子中,算法可能会在整个文档中找到明确指向音乐解释的关键词,在WSD中也使用了其他方法,这些方法基本上是这些基本方法的改进或扩展。词义消歧在设计用来取代键盘的口头命令界面中也很重要,不仅仅是在转发简单的操作系统命令时,但是在诸如研究网络这样复杂的任务中,WSD所起作用的其他领域包括语义网的发展和人工智能模型的改进。事实上,任何依赖于人与机器之间语言桥梁的科学领域都将使用词义消歧
-
发表于 2020-08-07 18:16
- 阅读 ( 1224 )
- 分类:电脑网络