结构挖掘是对半结构化数据源进行扫描,发现并突出显示其结构元素的一种数据挖掘,半结构化数据源是指不使用传统的表数据库结构的数据源,但是它有一个语义元素,通过标记和标记来分离信息。结构挖掘可以用来挖掘数据库,网站和...
结构挖掘是对半结构化数据源进行扫描,发现并突出显示其结构元素的一种数据挖掘,半结构化数据源是指不使用传统的表数据库结构的数据源,但是它有一个语义元素,通过标记和标记来分离信息。结构挖掘可以用来挖掘数据库,网站和许多其他形式的计算机信息来发现结构的元素。它可以帮助用户了解片段之间是如何相互作用的,或者如何在某些标记下找到信息。这种挖掘还可以用来预测项目是什么,基于用户编写的规则。结构挖掘是一种数据挖掘类型,其中扫描半结构化数据源,发现并突出显示其结构的元素。有许多不同类型的数据挖掘,其中大多数涉及挖掘传统结构化源。这包括使用大多数数据库中典型的表和节点。在结构挖掘中,只使用半结构化数据。在这种情况下,数据来自网站或简单数据库,这些数据库的结构不符合传统数据库规则。这些数据需要标记或标记,以便正确地挖掘每个项目。通过读取半结构化数据集,结构挖掘能够发现结构是如何相互作用的,例如每个网站都有一个导航模型,正是这个模型决定了页面之间的交互,通过挖掘结构,用户可以发现这种导航是如何工作的,这有助于创建类似的导航架构。结构挖掘还可以通过将规则写入挖掘程序来查找项目。例如,如果有图书数据集,用户可以编写一条规则,任何没有索引的书籍都应返回为虚构图书,而有索引的书籍应返回为非虚构图书大多数小说都没有索引,所以这条规则可以很精确地预测数据是什么。这有助于用户查看一个半结构化的集合,它有一个组织方法,但不适合用户的需要。在弄清半结构化单元的结构后,用户通常会将其与另一个半结构化单元进行比较,如果用户有一个商业网站,他或她可以挖掘另一个商业网站进行导航和链接,并查看其网站的相似性。通过比较挖掘出的信息,用户可以找到提高结构效率的方法
-
发表于 2020-08-06 22:01
- 阅读 ( 910 )
- 分类:电脑网络