数据集成是将多个数据源合并为一个数据源。这种做法通常非常耗时且涉及面广,因为不同的数据源可能彼此不兼容。电子表格上不同的列名这样简单的事情就足以要求重新设置日期格式。这种过程最常见的情况是两个组开始时没...
数据集成是将多个数据源合并为一个数据源。这种做法通常非常耗时且涉及面广,因为不同的数据源可能彼此不兼容。电子表格上不同的列名这样简单的事情就足以要求重新设置日期格式。这种过程最常见的情况是两个组开始时没有连接,但在独立工作后放在一起。数据集成由于免费数据源和在线数据库的普及,成为一个更重要的话题。数据集成是将多个数据源合并为一个数据源。数据集成的数据部分几乎可以是任何内容,只要它存储在计算机系统中。数据的实际内容很少像数据存储的方式。大多数情况下,数据保存在数据库中,有组织的信息系统。这些系统包含独特的条目和字段,允许用户快速查找信息。任何数据集成过程中最大的障碍是数据本身。在许多情况下,当数据刚建立时,没有将数据集与另一个数据集合并的意图。这意味着即使两个数据集可能引用同一个数据集,它们也是完全不兼容的。几乎任何事物都会使数据库不兼容。例如字段顺序或列宽等简单的表示方式,这足以防止一个简单的合并。当数据明显不同时,例如一个数据库包含的信息或多或少,合并就要困难得多。比任何其他情况都更需要数据集成的两种情况是在商业和研究领域。在商业界,合并部门或公司需要将以前分开的信息合并到一个单一的结构中这种形式的整合通常是非常困难的,除非最初的研究小组使用类似的软件和具有相似的信息目标。当数据整合是为了研究目的而进行时,通常会变得更为顺利。当一个研究人员将自己的信息交给另一个研究人员时,双方通常都在研究相同的过程。这意味着他们将使用类似的方法来编目和存储数据。过去,数据集成是数据研究的一个相对较小的领域,但自21世纪初以来,这种情况已经发生了变化。随着免费在线数据库变得越来越流行和准确,企业正争先恐后地以可共享的格式获取信息,这使得它们既可以以公共形式发布信息,又可以将知名公共接口的私有版本集成到自己的系统中
-
发表于 2020-08-07 04:19
- 阅读 ( 1858 )
- 分类:电脑网络