下载此文档

数据仓库和数据挖掘PPT课件.pptx


文档分类:IT计算机 | 页数:约64页 举报非法文档有奖
1/64
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/64 下载此文档
文档列表 文档介绍
第7章 数据仓库和数据挖掘
数据仓库概述
数据挖掘概述
数据挖掘的主要技术
数据仓库和挖掘对CRM的影响
第1页/共64页
第7章 数据仓库和数据挖掘
数据仓库概述
数据挖掘概述
数据挖掘的主要技术
数据仓库和挖掘对CRM的影响
第2页/共64页
什么是数据仓库?
数据仓库概念与特点
始于20世纪80年代初,“数据仓库之父”William 。
“数据仓库是在企业管理和决策中面向主题的、集成的、相对稳定的、与时间相关的数据集合,以支持经营管理中的决策。
数据仓库用于支持决策,面向分析型数据处理,不同于企业现有的操作型数据库;数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据。
第3页/共64页
数据仓库概念与特点
1、面向主题
2、集成的数据
3、数据相对稳定
4、数据仓库的时间相关性
特点
第4页/共64页
数据仓库概念与特点
(1)面向主题
数据库:面向事务处理任务,各系统分离
数据仓库:按照一定的主题域组织在一起
主题:用户使用数据仓库进行决策时所关心的重点方面。针对决策者的数据分析,而不是日常事务的处理,因而排除了对决策无用的数据,提供了特定主题的简明视图。是对应企业中某一宏观分析领域所涉及的分析对象,是针对某一决策问题而设置的。
第5页/共64页
第6页/共64页
财务子系统
销售商分析
产品分析
销售子系统
供应子系统
人力资源子系统
消费者分析
数据仓库
生产调度子系统
数据库
面向主题
面向事务
第7页/共64页
例如:一个保险公司的数据仓库所组织的主题可能是:客户、政策、保险金、索赔等,而按应用来组织则可能是:汽车保险、生命保险、伤亡保险等。
第8页/共64页
数据仓库概念与特点
(2)集成的数据
从原来分散的多个异种数据源(关系数据库、文本数据库、Web数据库、一般文件等)构成的子系统中提取数据。
① 原有数据库系统记录的是每一项业务处理的流水账,不适合分析处理,在进入数据仓库之前必须进行综合、计算,抛弃分析处理不需要的数据项,必要时增加一定的外部数据。
② 原分散数据库中有很多重复或不一致的地方,必须消除不一致和错误,全局统一。
为何进行数据集成?
第9页/共64页
数据仓库概念与特点
(3)数据相对稳定
数据库:通常定时更新,根据需要变化
数据仓库:主要供查询,只读。
从内容上看,存储当前和历史的数据,不是日常事务产生的数据,并且当前数据在一定时间间隔后要转换成历史数据转存慢速设备,不需要的则删除,因此极少修改。
火车票销售
第10页/共64页

数据仓库和数据挖掘PPT课件 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数64
  • 收藏数0 收藏
  • 顶次数0
  • 上传人wz_198613
  • 文件大小829 KB
  • 时间2021-06-27