课程安排数据仓库: 18学时数据挖掘: 18学时考试: 撰写论文
第一章数据仓库的基本概念
案例讨论:下图展示了某电信公司的市场部和计划部对业务A是否具有市场前景的分析过程和结果。
试讨论为什么两部门分析结果不同。
企业级数据库
市场部
分析程序1
分析结果1:
前景很好
计划部
分析程序2
分析结果2:
前景不好
第一章:数据仓库的基本概念
1-1 数据仓库的产生与发展
传统的数据库技术作为数据管理手段,主要用于联机事务处理(OLTP,On-Line Transaction Process), 数据库中保存的是大量的日常业务数据。
在数据共享、数据与应用程序的独立性、维护数据的一致性与完整性、数据的安全保密性等方面提供了有效的手段。
第一章数据仓库的基本概念
与分析型应用结合时存在的问题:
决策支持系统为掌握充分的信息,需要访问大量的企业内部数据和外部数据。
传统数据库中的大量数据是事务型数据,即该数据是对每一项工作、管理对象的具体的、细节性的描述。
事务处理型应用与分析决策型应用对数据库系统的性能要求不同。
传统数据库中保存和管理的一般是当前数据,而决策支持系统不仅需要当前的数据,而且还要求有大量的历史数据。
第一章数据仓库的基本概念
结论:
在事务处理型应用环境中直接构建分析决策型应用是不可行的。
于是:
面向分析决策型应用而组织和存储数据的数据仓库技术应运而生。
第一章数据仓库的基本概念
时间:20世纪80年代初
人物:
定义: 数据仓库是面向主题的、集成的、具有时间特征的、稳定的数据集合,用以支持经营管理中的决策制定过程。
A data warehouse is a subject-oriented,integrated, time-variant,and nonvolatile collection of data in support of management’s decision making process.
第一章数据仓库的基本概念
数据仓库的四大特征:
数据是面向主题的
数据是集成的
数据是具有时间特征的
数据是相对稳定的
数据仓库的其它特点:
数据量非常大(10GB---1000GB)
是数据库技术的一种新的应用
使用人员较少
第一章数据仓库的基本概念
1-2 数据仓库与数据库
操作型数据库分析型数据仓库
系统目的支持日常操作支持管理需求,获取信息
使用人员办事员、DBA、数据库专家经理、管理人员、分析专家
数据内容当前数据历史数据、派生数据
数据特点细节的综合的或提炼的
数据组织面向应用面向主题
存取类型添加、修改、查询、删除查询、聚集
数据稳定性动态的相对稳定
第一章数据仓库的基本概念
续上表:
操作型数据库分析型数据仓库
需求特点需求事先可知道需求事先不知道
操作特点一个时刻操作一单元一个时刻操作一集合
数据库设计基于E-R图基于星型模式、雪花模式
一次操作数据量一次操作数据量小一次操作数据量大
存取频率较高较低
响应时间小于3秒几秒—几十分钟
第一章数据仓库的基本概念
1-3 数据仓库技术的术语
主题: (Subject)
主题是一个在较高层次上将数据归类的标准,每一个主题基本对应一个宏观的分析领域。
例:面向主题:产品订货分析,货物发运分析, 新产品开发分析;
面向应用:财务,销售,供应,人力资源,生产调度…….
主题域的特征:独立性,完备性
第一章数据仓库的基本概念
数据仓库和数据挖掘课件ppt 来自淘豆网m.daumloan.com转载请标明出处.