模式匹配是一种将两个或两个以上的复杂数据库或信息集合并到一起的技术。随着数据库和电子信息存储在互联网上的使用越来越广泛和复杂,必须定义将数据集从一个数据库合并到另一个数据库的方法,模式匹配就是这样一种技术...
模式匹配是一种将两个或两个以上的复杂数据库或信息集合并到一起的技术。随着数据库和电子信息存储在互联网上的使用越来越广泛和复杂,必须定义将数据集从一个数据库合并到另一个数据库的方法,模式匹配就是这样一种技术,概念简单,但数据合并的现实却相当复杂术语“模式匹配”与“模式映射”同义,因为用户实际上是在映射数据,不匹配。两个或多个数据库映射在一起,并且每个数据库的相似方面相互映射。合并数据最常见的方法是使用精确引用。这种合并方式的一个例子是将一个数据库的name列与另一个数据库的name列相结合对于人或计算机来说,合并通常不是那么简单。因为有太多的数据需要过滤、组合和使用,拥有一个数据库而不是多个数据库是必不可少的。模式映射的重点是使这一繁琐的过程自动化并提高效率。例如,当一个数据库有一个“学生专业”字段,而另一个数据库有一个“学生的研究领域”字段时,可能需要模式匹配。这是相同的信息,但稍微不同的标题使混合信息的工作复杂化模式匹配将数据库合并的复杂过程分为四个步骤:预集成、比较、整合和合并。在多个数据库可以合并之前,需要分析它们的异同。在模式匹配领域,这就是所谓的预集成。计算机开始决定有效的集成方法。下一步,计算机通过在更详细的层次上相互比较来评估方案。在比较步骤中,计算机查看每个数据库条目并确定可能存在冲突的位置例如,“学生兴趣”字段列出“医生”,而另一个数据库将其列为“医生”。一个人可能会认为这些信息是相同的,但对于数据库工具来说,它们是两个独立的实体计算机已经确定了所有潜在的冲突,它可以继续努力解决问题。这可能很简单,只需将“医生”的所有实例都改为“医生”。实际上,这个过程要复杂得多解决所有冲突后,计算机可以继续在架构匹配过程中合并数据。在此阶段,将两个或多个数据库合并到一个大型数据库中。如果一切顺利,则在集成和将来访问数据库期间不会发生冲突或错误
-
发表于 2020-07-31 14:31
- 阅读 ( 1819 )
- 分类:电脑网络