数据仓库体系结构是一种封装企业环境中数据仓库所有方面的设计。数据仓库是创建一个中心域,将复杂的、分散的企业数据存储在一个逻辑单元中,从而实现数据挖掘、商业智能、,以及对组织内所有相关数据的全面访问。数据仓库...
数据仓库体系结构是一种封装企业环境中数据仓库所有方面的设计。数据仓库是创建一个中心域,将复杂的、分散的企业数据存储在一个逻辑单元中,从而实现数据挖掘、商业智能、,以及对组织内所有相关数据的全面访问。数据仓库体系结构包括所有报告要求、数据管理、安全要求、带宽要求,以及存储要求。

结构良好的数据仓库可以是';挖掘和#039;
在创建数据仓库体系结构时,重要的是将体系结构分解为特定的域,这些域被连接到一个整体的最终设计中。该设计应被视为企业数据体系结构的蓝图。尤其是,几个主要领域应在考虑数据仓库体系结构时开发。这些领域包括源系统访问、暂存区过程、数据充实过程、数据体系结构、商业智能过程,以及存储需求。

数据仓库是创建一个中心域,在逻辑单元中存储复杂的、分散的企业数据,从而实现数据挖掘、商业智能和整体对组织内所有相关数据的访问。
数据仓库要求将源数据从事务或记录数据库传输到数据仓库中。此过程被简化为术语提取、转换和加载(ETL),它基本上封装了源系统访问的区域,数据充实和数据体系结构为了清晰起见,最好详细设计这些体系结构区域,其中概述了如何实现ETL过程。虽然需要从源系统获取一些数据,但并非所有数据都是理想的,因为这会使企业仓库负担过重。在处理源系统层时,主要关注的是数据访问方法、源系统所需的数据以及刷新要求。
要考虑的下一个数据仓库体系结构层是暂存区过程。由于源系统的大多数数据都需要验证和数据清理,在加载到数据仓库的业务规则层之前,必须为源数据创建一个驻留区域。临时区域维护来自源系统的原始数据馈送,这些原始数据源通常带有时间戳,以确保数据的最新性。
数据充实或业务规则过程是将数据清理到满足数据仓库的预期结果。这种清理方法的一个很好的例子是使用地址清理工具;如果源系统有不正确的数据,数据扩充过程将从原始数据集中运行地址到业务规则系统中,该系统将更正无效地址。这也是删除或修改不准确数据以确保数据仓库内完整性的时间。
要考虑的下一层是数据体系结构层。此区域是企业数据仓库的真正设计或架构已经完成。数据仓库不是企业内所有数据集的组合,相反,它是一个新定义的数据库,用于对企业内所有业务实体进行概述。
这需要数据体系结构来回答企业在商业智能和数据挖掘领域提出的问题通过以这种方式创建数据架构,原始数据集将被转换为事实表,允许用户对整个企业视图执行即席报告,而不是对特定数据库执行报告。这也是维护原始系统数据元数据的区域,它可能包括源系统名称或主键。
下一个要考虑的区域是商业智能和报告要求。这一层可以被认为是面向用户的数据仓库需求。通常,该区域包含固定报告、特殊报告功能,业务智能层通常是最需要考虑的,因为它是数据仓库中唯一面向外部的组件。
最后一层需要考虑的是总体数据存储需求和维护。随着数据仓库的不断增长和扩展,基于用户的数据存储必须严格管理和维护。此外,在创建数据仓库架构时,设计应该对数据存储容量以及具有数据访问能力的频带所需的内容做出现实的估计。随着数据仓库在整个企业中的广泛应用,这些要求将是至关重要的。