下载此文档

数据仓库和数据挖掘技术.ppt


文档分类:IT计算机 | 页数:约332页 举报非法文档有奖
1/332
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/332 下载此文档
文档列表 文档介绍
数据仓库和数据挖掘技术
数据仓库和数据挖掘技术
教学方式与考核方式
教学方式
本课程以课堂教学为主,以电子教案的内容为主线
课外阅读指定的参考文献并利用网上资源,加深对教学内容的理解。
考核方式及要求
成立课程小组,每组3人选择一个课题进行研究,包括相关论文阅读综述、实验、论文撰写、宣讲论文等内容,小组得分相同。
课程论文的格式按照正式发表学术论文的要求,篇幅一般可大于正式发表的论文。
期末开卷考试
教材与参考书
电子教案
W. H. Inmon , 《数据仓库》第3版,王志海等译,机械工业出版社,
邵峰晶等,《数据挖掘-原理与算法》,中国水利水电出版社,
朱明等, 《数据挖掘》,中国科技术大学出版社,
陈京民等,《数据仓库与数据挖掘技术》,电子工业出版社,
康博创作室:《SQL SERVER 2000数据仓库设计和使用指南》,清华大学出版社
因特网上有关参考资料和文献
学术刊物上有关论文
第一章引言
一、从数据库到数据仓库
在市场经济激烈竞争中,企业必须把业务经营同市场联系,在此基础上作出科学、正确的决策以求生存。为此,企业纷纷建立了自己的数据库系统,由计算机管理代替手工操作,以此来收集、存储、管理业务数据,改善办公环境,提高操作人员的工作效率。
问题:面向业务操作设计,无论是查询、统计,还是生成报表,其处理方式都是对指定的数据进行简单的数字处理。
保险公司:购买人寿保险的客户一般有哪些特征?
市场部经理:在过去的一个季度里,咨询哪三样产品的热线电话最多?
传统的关系数据库可以回答这种类似问题吗?
可以,但是很成问题
决策者(比如总经理)希望得到一项分析数据
需求提交给公司的信息部门,信息部门指派人员编制程序
几天后信息部门的报表送到决策者手中
决策者发觉报表不符合要求,提出修改意见交还给信息部门
信息部门修改程序,几天后新的报表送给总经理
数据来的太慢了,我已经对它不感兴趣了!!
传统的关系数据库可以回答这种类似问题吗?
可以,但是很成问题
决策者(比如总经理)希望得到一项分析数据
需求提交给公司的信息部门,信息部门指派人员编制程序
几天后信息部门的报表送到决策者手中
决策者发觉报表不符合要求,提出修改意见交还给信息部门
信息部门修改程序,几天后新的报表送给总经理
我辛辛辛苦苦为一个特定问题加班加点干了十天最后被否定了,这已经是第n次了,我辞职不干了!!
原因:数据库是针对操作型处理设计的
也叫事务处理,是指对数据库的日常联机访问操作,所以也叫联机事务处理(OLTP)。
其访问特点是:
通常仅仅是对一个或一组记录的查询或修改
执行频率高
人们关心的是处理的响应时间、数据的安全性和完整性等指标。
为完成决策者的询问,信息部门必须:抽取数据
抽取程序搜索整个文件或数据库,使用某种标准选择符合限制的数据,并把数据传到其它文件或数据库中。
抽取程序很快流行起来并渗透到信息处理环境中,其原因是:
1)抽取程序将数据从高性能联机事物处理方式中转移出来,所以在需要总体分析数据时就与联机处理事物能不冲突
2)当抽取程序将数据从操作型事物处理范围内移出时,数据的控制方式就发生了转变。最终用户一旦开始控制数据,他最终就拥有了这些数据。
DB
抽取
DB
DB
……….
问题1: 蜘蛛网式的拓展

数据仓库和数据挖掘技术 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数332
  • 收藏数0 收藏
  • 顶次数0
  • 上传人399485529
  • 文件大小0 KB
  • 时间2012-03-31
最近更新