下载此文档

数据仓库层次规范学习笔记.doc


文档分类:IT计算机 | 页数:约3页 举报非法文档有奖
1/3
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/3 下载此文档
文档列表 文档介绍
数据仓库层次规范学习笔记.doc系统信息模型从存储内容划分
STAGE接口信息模型
ODS/DWD信息模型
MID信息模型
DM信息模型
元数据信息模型
1) .STAGE是生产系统数据源直接拷贝,由 ETL过程对数据源进行直接抽取,在格式和数
据定义上不作任何改变。与生产系统数据的唯一不同是, stage层数据具有时间戳。
STAGE层存在的意义在于两点:
(1) 对数据源作统一的一次性获取,数据仓库中其他部分都依赖于 stage层的数据,不 再重复进行抽取,也不在生产系统上运算,减小生产系统的压力
(2) 在生产系统数据已经刷新的情况下,保存一定量的生产系统的历史数据,以便在二 次抽取过程中运算出错的情况下可以进行回溯。
2) .ODS/DWD层(对应原模型的 ODS和DW层)信息模型:简称 DWD层是数据仓库的 细节数据层,是对 STAGE层数据进行沉淀,减少了抽取的复杂性,同时 ODS/DWD的信息 模型组织主要遵循企业业务事务处理的形式, 将各个专业数据进行集中。 为企业进行经营数
据的分析,系统将数据按分析的主题的形式存放,跟 stage层的粒度一致,属于分析的公共
资源。
3) .MID信息模型:轻度综合层是新模型增加的数据仓库中 DWD层和DM层之间的一个过 渡层次,是对DWD层的生产数据进行轻度综合和汇总统计。 轻度综合层与DWD的主要区 别在于二者的应用领域不同, DWD的数据来源于生产型系统,并未满意一些不可预见的需
求而进行沉淀;轻度综合层则面向分析型应用进行细粒度的统计和沉淀。
4) .DM信息模型:为专题经营分析服务,系统将数据按分析的专题组织成多维库表的形式
存放,属于分析目标范畴的数据组织与汇总, 属于分析的专有资源。其信息主要来源于 DWD
层和MID层汇总,反映实时的经营状况,时间维度为天。而历史经营状况分析,时间维度 一般为月,同时也具有季度、年这样的维度。
5) MDW 元数据信息模型:描述数据及其环境的数据,即是对数据资源的描述,是信息共 享和交换的基础和前提,用于描述数据集的内容、质量、表示方式、空间参与、管理方式以
及数据集的其他特征。 一般来说,它有两方面的用途。首先,元数据能提供基于用户的信息, 如记录数据项的业务描述信息的元数据能帮助用户使用数据。 其次,

数据仓库层次规范学习笔记 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数3
  • 收藏数0 收藏
  • 顶次数0
  • 上传人3144187108
  • 文件大小37 KB
  • 时间2021-08-20
最近更新