�
Inmon数据仓库设计
�
�
体系结构化环境
三级模型
�
�
�
高级模型
中级模型
低级模型
�
性能优化
目录
�
数据仓库设计概述
�
�
�
�
�
�
与数据库设计的区别
处理类型
应用需求
设计目标
数据来源
设计方法
对比内容
数据库系统设计
数据仓库系统设计
面向的处理类型
面向应用
面向分析
应用需求
比较明确
不太明确
系统设计的目标
事务处理的并发性、安全
性、高效性
保证数据的四个特征和全局
一致性
数据来源
业务操作员的输入
业务系统
系统设计的方法
需求驱动
数据驱动
数据仓库设计概述
数据仓库与数据库设计的区别
处理类型不同
�
�
数据库系统设计
�面向应用来进行设计,根据具体的操作事件和操作对象
(实体)来进行设计;
�目的是建立一个操作型的数据环境。
�从需求开始,逐步展开
数据仓库设计
�面向分析的;
�从最基本的主题开始,不断完善已有主题,发展新主
题;
�最终建立起一个面向主题的分析型数据环境。
应用需求不同
数据库系统设计
�面向明确的应用需求
�设计人员能够清晰地了解应用的需求和数据流程
数据仓库设计
�很难获得对用户需求的确切了解
�应用人员往往是企业的中高层人员
�他们自己一开始不知道想看什么,需要引导
�后期又想什么东西都看,需要解释
系统设计的目标
�
数据库系统设计
�
�
�
�
为了进行OLTP处理
通常是对一个或者一组记录的查询和修改,“一次一集合”
主要为企业的特定应用服务的
事务处理响应时间、数据的安全性和完整性是系统的目标
�
数据仓库设计
�
�
�
�
�
为了分析决策
主要目标是保证数据的四个特征(面向主题、集成的、稳定的、时
变的),建立起一个全局一致的数据环境,作为企业决策支持的基
础
只有查询而无更新,“一次加载一批”
对响应时间不敏感
数据量大,海量数据
数据来源不同
�
�
数据库系统设计
�数据来源主要是业务操作员的输入
�描述如何通过操作员输入获取数据
�描述如何将获取的数据按照OLAP的需求合理存放
�如何使得OLTP的性能更加优化
�如何保证事务处理的安全性
数据仓库设计
�数据主要来源于业务系统
�主要解决如何从业务系统中得到完整一致的数据
�如何对数据进行转换、清洗、综合,ETL
�如何有效提高数据分析的效率与准确性
系统设计方法不同
�
数据库系统设计
�
�
�
“需求驱动”;
先收集需求、分析需求,再进行设计和开发;
系统的需求在收集和分析需求阶段之后就定下来了,一旦进入构建
数据库阶段,系统的需求就基本不变了。
�
数据仓库设计
�
�
�
�
“数据驱动”
从业务系统已经存在的数据出发,获取之后对数据进行集成并检查
数据的准确性
按照分析领域对数据及数据之间的联系重新考察,组织数据仓库中
的主题。
“数据驱动”的系统设计方法的优点是可以通过了解原有数据库系统
中的数据和需要建设的数据仓库中主题的数据的共同性,最大限度
地利用现有系统,减少系统建设的工作量。
开发生命周期-CLDS
�
�
�
传统的数据库系统的系统开发生命周期(SDLC)是需
求驱动的,而数据仓库系统的开发生命周期则是数据
驱动的,与SDLC相反,一般写作CLDS,这种写法
没有对应的实际意义,是一种幽默的写法。
CLDS由数据开始,一旦数据到手就集成数据。然
后,如果数据有偏差,就检验看看数据存在什么偏差。
再针对数据写程序,分析程序执行结果。最后,系统
需求才得到了理解。
因此,CASE工具和技术用于数据仓库领域是不合适
的。
促销分析
销售分析
市场分析
产品组合分析
财务绩效分析
合并报表
EIS
管理报告
公司季报、年报
投资者报表
预测模型
指标体系
业务模式规划
What-if分析
投资预算
长期发展预算
战略规划
日常运营预算
计划
建模
分析
报表
数据仓库系统结构模型 来自淘豆网m.daumloan.com转载请标明出处.