下载此文档

数据仓库和数据挖掘课件ppt.ppt


文档分类:IT计算机 | 页数:约62页 举报非法文档有奖
1/62
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/62 下载此文档
文档列表 文档介绍
课程安排 数据仓库: 18学时 数据挖掘: 18学时 考试: 撰写论文
第一章数据仓库的基本概念
案例讨论:下图展示了某电信公司的市场部和计划部对业务A是否具有市场前景的分析过程和结果。
试讨论为什么两部门分析结果不同。
企业级数据库
市场部
分析程序1
分析结果1:
前景很好
计划部
分析程序2
分析结果2:
前景不好
第一章:数据仓库的基本概念
1-1 数据仓库的产生与发展
传统的数据库技术作为数据管理手段,主要用于联机事务处理(OLTP,On-Line Transaction Process), 数据库中保存的是大量的日常业务数据。
在数据共享、数据与应用程序的独立性、维护数据的一致性与完整性、数据的安全保密性等方面提供了有效的手段。
第一章数据仓库的基本概念
与分析型应用结合时存在的问题:
决策支持系统为掌握充分的信息,需要访问大量的企业内部数据和外部数据。
传统数据库中的大量数据是事务型数据,即该数据是对每一项工作、管理对象的具体的、细节性的描述。
事务处理型应用与分析决策型应用对数据库系统的性能要求不同。
传统数据库中保存和管理的一般是当前数据,而决策支持系统不仅需要当前的数据,而且还要求有大量的历史数据。
第一章数据仓库的基本概念
结论:
在事务处理型应用环境中直接构建分析决策型应用是不可行的。
于是:
面向分析决策型应用而组织和存储数据的数据仓库技术应运而生。
第一章数据仓库的基本概念
时间:20世纪80年代初
人物:
定义: 数据仓库是面向主题的、集成的、具有时间特征的、稳定的数据集合,用以支持经营管理中的决策制定过程。
A data warehouse is a subject-oriented,integrated, time-variant,and nonvolatile collection of data in support of management’s decision making process.
第一章数据仓库的基本概念
数据仓库的四大特征:
数据是面向主题的
数据是集成的
数据是具有时间特征的
数据是相对稳定的
数据仓库的其它特点:
数据量非常大(10GB---1000GB)
是数据库技术的一种新的应用
使用人员较少
第一章数据仓库的基本概念
1-2 数据仓库与数据库
操作型数据库分析型数据仓库
系统目的支持日常操作支持管理需求,获取信息
使用人员办事员、DBA、数据库专家经理、管理人员、分析专家
数据内容当前数据历史数据、派生数据
数据特点细节的综合的或提炼的
数据组织面向应用面向主题
存取类型添加、修改、查询、删除查询、聚集
数据稳定性动态的相对稳定
第一章数据仓库的基本概念
续上表:
操作型数据库分析型数据仓库
需求特点需求事先可知道需求事先不知道
操作特点一个时刻操作一单元一个时刻操作一集合
数据库设计基于E-R图基于星型模式、雪花模式
一次操作数据量一次操作数据量小一次操作数据量大
存取频率较高较低
响应时间小于3秒几秒—几十分钟
第一章数据仓库的基本概念
1-3 数据仓库技术的术语
主题: (Subject)
主题是一个在较高层次上将数据归类的标准,每一个主题基本对应一个宏观的分析领域。
例:面向主题:产品订货分析,货物发运分析, 新产品开发分析;
面向应用:财务,销售,供应,人力资源,生产调度…….
主题域的特征:独立性,完备性
第一章数据仓库的基本概念

数据仓库和数据挖掘课件ppt 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数62
  • 收藏数0 收藏
  • 顶次数0
  • 上传人hnet653
  • 文件大小0 KB
  • 时间2015-12-18
最近更新