第2章 数据仓库原理
数据仓库定义
数据集市
数据仓库体系结构
数据组织结构和形式
数据抽取E、转换T和装载L(ETL)
元数据管理
2020/12/24
1
数据仓库原理
数据仓库定义
William :数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用于支持管理人员的决策。
数据仓库之父--Bill Inmon
2020/12/24
2
数据仓库原理
四个基本特征
数据仓库的数据是面向主题的
数据仓库的数据是集成的
数据仓库的数据是非易失的
数据仓库的数据是随时间不断变化的
2020/12/24
3
数据仓库原理
面向主题
主题(Subject):特定的数据分析领域与目标。
面向主题:为特定的数据分析领域提供数据支持。
2020/12/24
4
数据仓库原理
面向主题
为特定数据分析领域提供的数据与传统数据库中的数据是有不同的。传统数据库中的数据是原始的、基础的数据,而特定分析领域数据则是需要对它们作必要的抽取、加工与总结而形成。
数据仓库是面向分析、决策人员的主观要求的,不同的用户有不同的要求,同一个用户的要求也会随时间而经常变化,因此,数据仓库中的主题有时会因用户主观要求的变化而变化的。
2020/12/24
5
数据仓库原理
面向主题示例
例:一个面向事务处理的“商场”数据库系统,其数据模式如下
采购子系统:
订单(订单号,供应商号,总金额,日期)
订单细则(订单号,商品号,类别,单价,数量)
供应商(供应商号,供应商名,地址,电话)
销售子系统:
顾客(顾客号,姓名,性别,年龄,文化程度,地址,电话)
销售(员工号,顾客号,商品号,数量,单价,日期)
2020/12/24
6
数据仓库原理
面向主题示例
库存管理子系统:
领料单(领料单号,领料人,商品号,数量,日期)
进料单(进料单号,订单号,进料人,收料人,日期)
库存(商品号,库房号,库存量,日期)
库房(库房号,仓库管理员,地点,库存商品描述)
人事管理子系统:
员工(员工号,姓名,性别,年龄,文化程度,部门号)
部门(部门号,部门名称,部门主管,电话)
2020/12/24
7
数据仓库原理
面向主题示例
上述数据模式基本上是按照企业内部的业务活动及其需要的相关数据来组织数据的存储的,没有实现真正的数据与应用分离,其抽象程度也不够高。
如果按照面向主题的方式进行数据组织,首先应该抽取主题,即按照管理人员的分析要求来确定主题,而与每个主题相关的数据又与有关的事务处理所需的数据不尽相同。
2020/12/24
8
数据仓库原理
主题一:商品
商品固有信息:商品号,商品名,类别,颜色等
商品采购信息:商品号,供应商号,供应价,供应日期,供应量等
商品销售信息:商品号,顾客号,售价,销售日期,销售量等
商品库存信息:商品号,库房号,库存量,日期等
2020/12/24
9
数据仓库原理
主题二:供应商
供应商固有信息:供应商号,供应商名,地址,电话等
供应商品信息:供应商号,商品号,供应价,供应日期,供应量等
2020/12/24
10
数据仓库原理
数据仓库原理课件 来自淘豆网m.daumloan.com转载请标明出处.