数据仓库、数据集市和联机分析处理(OLAP)
简介
在信息时代,数据是所有信息的来源,而信息对于决策过程至关重要。
决策支持系统是为了支持高层管理和相关决策者而开发的。在现代,有大量的信息可供使用。因此需要数据仓库来存储大量数据。
由于数据仓库支持决策支持系统,因此它应该是面向主题的、集成的,并且随着时间的推移而收集的数据是静态的。
数据仓库
数据仓库包含面向主题的数据。这种面向主题的数据可以是销售、客户姓名等信息。数据仓库排除了对决策过程没有用的信息。
数据仓库是多个异构数据源的集成。 由于数据源有自己的数据协议,在数据仓储过程中需要进行数据处理。
数据仓库提供了随时间变化的信息。这为信息提供了历史视角。
一旦数据被捕捉到数据仓库中,它就不能被更改。
数据仓库中的数据通常以星形模式、雪花模式和银河模式的形式维护。
数据集市
数据集市是数据仓库访问层的一部分,供最终用户使用。 因此,数据集市是数据仓库的一个子集。数据集市通常分配给企业内的特定业务部门。数据集市用于将数据仓库按不同的业务部门切分。通常,特定业务部门或部门拥有该数据集市的所有权。
数据集市的主要用途是商业智能。与数据仓库相比,数据集市所需的投资非常少,因此非常适合小型企业。数据集市的设置时间也非常短,使其适合小型企业。
数据集市的主要优点如下:
- 它提供易于访问的日常使用数据。
- 它提高了最终用户的决策过程。
- 创建和维护起来很容易。
联机分析处理(OLAP)
OLAP或联机分析处理是一种概念,通过帮助分析多维数据的结构(称为立方体)来分析数据。 OLAP有助于将数据转换为信息。
OLAP的主要目标是从大型数据库中总结信息以供决策。通过OLAP生成的报告可以根据最终用户的需求格式化。
OLAP的优点如下:
- 它确保查询响应的一致性更快。
- 它提供了一种处理难以通过SQL查询的数据的功能。
- 它允许用户使用电子表格创建视图。
OLAP有三种类型:多维OLAP、关系OLAP和混合OLAP。在多维OLAP中,数据通常存储在适合多维分析的专有结构中。在关系OLAP中,数据库通过标准数据库以星形或雪花模式进行结构化。多维OLAP和关系OLAP的组合是混合OLAP。