什么是文本挖掘(Text Mining)?

文本挖掘是利用计算机技术对文本文档进行筛选以进行研究和分析的过程,通常被认为与数据挖掘过程非常相似,但是,文本挖掘依赖于特殊的编程来查找未分类的文本并找到意义或模式,而不是分析预先分类的数据库信息,文本挖掘在科...
文本挖掘是利用计算机技术对文本文档进行筛选以进行研究和分析的过程,通常被认为与数据挖掘过程非常相似,但是,文本挖掘依赖于特殊的编程来查找未分类的文本并找到意义或模式,而不是分析预先分类的数据库信息,文本挖掘在科学、市场营销和数据组织等领域有着广泛的应用文本挖掘技术允许计算机在文本中发现有用的趋势,以一种可以揭示新事实或允许专家发现的方式呈现数据。将单词组织成语言所涉及的复杂程度对计算机来说太过复杂了,但是科学家们一直在努力改进这类程序。已经开发出许多方法,让科学家们识别短语并发现文本的事实。这通常与完全破译意思不同,但是它允许实现许多相同目标的快捷方式,文本挖掘利用了其中的一些技术,并且随着这种技术的改进,文本挖掘通常也会得到改进专家使用文本信息分析主要是对书面文件进行研究。大量的书面数据可能很难分析,因为需要大量的时间。计算机可以更快地阅读这些文本,但他们无法理解文本挖掘技术使计算机能够在文本中发现有用的趋势,以一种可以揭示新事实或允许专家进行发现的方式呈现数据。这项技术的一个应用就是市场调查。专家可以分析产品名称的搜索结果,并让程序查找表达用户情感的短语。通过这种方式,他们可以非常详细地了解人们对他们产品的真实感受。他们也可以简单地查找他们的产品,看看哪些短语最常出现,这可能有助于他们就如何取悦顾客提出新的想法挖掘文本的另一个用途是分析类似主题的科学论文,寻找新的趋势或协议。这使得一些科学家能够做出预测性假设,这些假设在蛋白质分析等领域已经被证明是有用的应用程序最终可能会提供意想不到的发现。一个叫做数据挖掘的过程实际上与文本挖掘非常相似,但它通常不那么复杂,因为它依赖于已经被格式化成类别的文本。例如,该软件可以在数据库中浏览求职者的所有信息,寻找趋势。文本挖掘对计算机来说更困难,因为纯文本比具有类别的数据更难分析。
  • 发表于 2020-08-15 09:22
  • 阅读 ( 1297 )
  • 分类:业务办理

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
admin
admin

0 篇文章

作家榜 »

  1. xiaonan123 189 文章
  2. 汤依妹儿 97 文章
  3. luogf229 46 文章
  4. jy02406749 45 文章
  5. 小凡 34 文章
  6. Daisy萌 32 文章
  7. 我的QQ3117863681 24 文章
  8. 华志健 23 文章

推荐文章

联系我们:uytrv@hotmail.com 问答工具