数据库的发展
数据仓库
存在两种不同的数据处理工作,操作型处理和分析型处理,也称作OLTP(联机事务处理)和OLAP(联机分析处理)。
操作型处理也叫事务处理,是指对数据库联机的日常操作,通常是对一个或一组记录的查询和修改,如火车售票系统、银行通存通兑系统和税务征收管理系统等。这些系统要求快速响应用户请求,对数据的安全性、完整性以及事务吞吐量要求很高。
1
分析型处理是指对数据的查询和分析操作。通常是对海量的历史的数据查询和分析,如金融风险预测预警系统和证券股市违规分析系统等。这些系统要访问的数据量非常大,查询和分析的操作十分复杂。
两者之间的差异使得传统的数据库技术不能同时满足这两类数据处理的要求,数据仓库技术应运而生。
2
数据仓库是为了构建新的分析处理环境而出现的一种数据存储和组织技术。
1. 什么是数据仓库
3
数据仓库和数据库主要的区别是数据仓库中的数据具有以下四个基本特征:
(1)数据仓库的数据是面向主题的;
(2)数据仓库的数据是集成的;
(3)数据仓库的数据是不可更新的;
(4)数据仓库的数据是随时间不断变化的。
2. 数据仓库的特征
4
一、主题与面向主题
与传统数据库面向应用进行数据组织的特点相对应,数据仓库中的数据是面向主题进行组织的。
什么是主题呢?从逻辑意义上讲,主题是企业中某一宏观分析领域所涉及的分析对象。主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据进行综合、归类并分析利用。所谓较高层次是相对面向应用的数据组织方式而言的,是按照主题进行数据组织的方式具有更高的数据抽象级别。
5
为了更好地理解主题与面向主题的概念,说明面向主题的数据组织与传统的面向应用的数据组织方式的不同,我们用一个例子来详细说明。
一家采用“会员制”经营方式的商场,按业务已建立起销售、采购、库存管理以及人事管理等子系统。按照其业务处理要求,建立了各子系统的数据库模式:
6
采购子系统:
订单(订单号,供应商号,总金额,日期)
订单细则(订单号,商品号,类别,单价,数量)
供应商(供应商号,供应商名,地址,电话)
销售子系统:
顾客(顾客号,姓名,性别,年龄,文化程度,地址,电话)
销售(员工号,顾客号,商品号,数量,单价,日期)
库存管理子系统:
领料单(领料单号,领料人,商品号,数量,日期)
进料单(进料单号,订单号,进料人,收料人,日期)
库存(商品号,库房号,库存量,日期)
库房(库房号,仓库管理员,地点,库存商品描述)
人事管理子系统:
员工(员工号,姓名,性别,年龄,文化程度,部门号)
部门(部门号,部门名称,部门主管,电话)
7
按照面向主题的方式,应该分两个步骤来组织数据:
抽取主题
确定每个主题所应包含的数据内容。
8
概括各种分析对象,我们抽取了商场的供应商、商品、顾客三个主题。
然后确定每个主题所应包含的数据内容这三个主题包含的主要内容有:
9
商品:
商品固有信息:
商品号,商品名,类别和颜色等。
商品采购信息:
商品号,供应商号,供应价,供应日期和供应量等。
商品销售信息:
商品号,顾客号,售价,销售日期和销售量等。
商品库存信息:
商品号,库房号,库存量和日期等。
10
DW数据仓库-精 来自淘豆网m.daumloan.com转载请标明出处.