数据挖掘使用对大量数据进行操作的相对大量的计算能力来确定数据点之间的规律性和联系。采用统计学技术的算法,机器学习和模式识别用于自动搜索大型数据库。数据挖掘也称为数据库中的知识发现(KDD)。 垃圾邮件过滤可以被...
数据挖掘使用对大量数据进行操作的相对大量的计算能力来确定数据点之间的规律性和联系。采用统计学技术的算法,机器学习和模式识别用于自动搜索大型数据库。数据挖掘也称为数据库中的知识发现(KDD)。

垃圾邮件过滤可以被视为数据挖掘的一种形式。
人工智能,数据挖掘是一个可以应用于许多不同活动的总括术语,数据挖掘最常用于确定趋势的方向和预测未来。它被用来建立模型和决策支持系统,为人们提供他们可以使用的信息。数据挖掘在反恐斗争中扮演着前线角色。它被认为是用来确定9/11事件的领导者攻击。

数据挖掘过程中收集的信息通常以图表或图表的形式呈现。
数据挖掘者是使用诸如"近邻"之类的技术的统计学家模型,
k-均值聚类,
holdout method,
k-fold cross validation,the
leave one-out method等等。回归技术被用来减去不相关的模式,只留下有用的信息。
Bayesian一词在该领域经常出现,一类推理技术,通过结合先验概率和基于条件事件的概率来预测未来事件的可能性垃圾邮件过滤可以说是数据挖掘的一种形式,它自动将相关信息从一片混乱的网络钓鱼尝试和伟哥广告中带到水面。
决策树用于过滤成堆的数据。在决策树中,所有数据都通过入口节点,它面临一个过滤器,根据数据的特性将数据分成流。例如,关于消费者行为的数据很可能会根据人口统计因素进行过滤。数据挖掘主要不是关于花哨的图形和可视化技术,而是利用它们来显示它发现的东西可以从视觉上而不是口头上吸收更多的统计信息,如果在正确的背景下使用,这种呈现形式会非常具有说服力和强大的功能。
随着我们的文明越来越饱和,传感器大量分布在我们的本地环境中,我们会不经意地发现可能遗漏的东西数据挖掘将让我们在过去的数据基础上纠正这些错误并发现新的见解,从而为我们的数据存储带来更大的收益。