数据仓库基础(四)ODS、元数据

ODS的概念:是一个面向主题的、集成的、可变的、反应当前细节的数据集合。为企业决策者提供当前细节性的数据,通过作为数据仓库的过度阶段。

ODS具有以下的特点:

1.数据是不断更新和易丢失的,当新的业务数据进入到ODS时,旧的数据会被新的数据覆盖或更新,一般不存储历史的数据,只反映当前实时性的信息。

2.ODS系统一般存储的都是细节性的信息,很少有汇总的数据。

3.ODS系统支持快读的数据更新操作,数据刷新频率很快。

4.ODS一般存储在关系型数据库中,通过各个业务系统的数据集成起来,组成企业的全局统一视图。

5.用户可以频繁访问ODS系统,因为它是基于操作型应用。

元数据的定义

在数据仓库系统的建立、维护、管理和使用过程中,用来描述实际数据的信息,是关于数据的数据。

数据仓库在建设过程中产生的数据源定义、转换规则的定义、目标库的定义都存储在元数据库中。还支持一下几种功能:

1.描述数据仓库系统存在哪些数据

2.描述哪些数据是在数据仓库系统中产生的。

3.描述哪些数据将要抽取到数据仓库系统中。

4.评估数据质量的好坏。

记录数据抽取工作的执行情况。

元数据的类型:

技术元数据:主要存储数据仓库系统管理技术细节方面的数据。主要包括:数据仓库的开发和管理使用的数据,ETL数据抽取的映射关系和转换规则,对数据仓库模式的定义,计算方法等内容。

业务元数据:从业务角度描述了商业智能中的数据。主要包括数据的来源、数据的访问原则、系统提供的决策分析方法、报表展示的信息等内容。

元数据的作用:

1.帮助用户理解数据仓库系统中的数据。

2.用户数据仓库系统的集成。

3.保证数据的质量

4.提供数据仓库系统的灵活性。

原文地址:https://www.cnblogs.com/evencao/p/3135691.html