光学字符识别(OCR)软件,是一种将文本图像转换成计算机可以读取的实际文本的软件。通常,它是在图像扫描到计算机后使用的,尽管也可以使用其他形式的输入。OCR软件对已输入的文本最有效,无论是在原始打印件丢失的情况下,还是在...
光学字符识别(OCR)软件,是一种将文本图像转换成计算机可以读取的实际文本的软件。通常,它是在图像扫描到计算机后使用的,尽管也可以使用其他形式的输入。OCR软件对已输入的文本最有效,无论是在原始打印件丢失的情况下,还是在扫描打字机上打印的纸张时,好的软件也可以翻译手写文本,虽然这种转换的错误率往往要高得多。手写识别系统允许计算机学习不同风格的人类笔迹。OCR软件的实际术语有点误导,因为大多数现代版本实际上不使用光学字符识别,但实际上使用的是数字字符识别,这是因为几年前这两个领域有效地合并了,两个领域都采用了更具吸引力的术语光学字符识别,OCR软件近年来有了很大的进步,现代的程序在识别文本方面比以前的程序要好得多。最好的OCR软件可以将手写体抄写成计算机文本。事实上,早期的OCR软件要求在程序能够准确输入之前,对程序进行特定字体的训练。类似地,当输入手写体时,程序必须经过训练,这是一个非常耗时的过程。然而,方法已经得到改进,智能化程度更高的系统已成为标准。所使用的方法现在相对静态,只有一小部分的研究用于开发全新的方法,而大多数研究则致力于改进现有的程序使它们更加精确早期版本的软件被广泛应用于各种应用中,20世纪50年代的大公司都用它来读取信用卡的印记,而美国邮政从20世纪60年代中期开始就用它来分类邮件。10年前,选择一个OCR软件是很困难的,因为许多程序在某些任务上相当糟糕,而且相当擅长其他人。然而,如今,这个领域已经基本上趋于平衡。任何一个好的软件翻译拉丁文字的准确率都在99%以上。然而,当涉及到手写输入或更复杂的字体时,OCR软件的范围仍然相对较高。OCR软件的成本也很高波动很大,通常与它所拥有的准确率有关。可以找到相当数量的适合输入印刷品的免费软件,也可以找到一些比较擅长检测手写体的软件,特别是经过一些培训。更昂贵的软件套件,如OmniPage suite,其成本约为家庭版100美元(USD),专业版450美元左右,拥有令人印象深刻的功能阵列,通常成功率更高。不幸的是,仍然没有完美的OCR软件,因此,选择购买程序在很大程度上仍然是一个令人沮丧的过程。即使是最好的程序也可能在书写方面遇到困难,错误也会不可避免地蔓延,即使是在较低的水平上也是如此。大多数情况下,选择购买的程序可以归结为额外的功能:多语言支持、一键扫描和转换集成,自动PDF转换,以及跨专业学科(如法律和医学领域)的全字识别
-
发表于 2020-08-06 06:48
- 阅读 ( 916 )
- 分类:电脑网络