数据仓库及其案例张千福zhangqianfu@目的掌握数据仓库的基本概念和数据中心的体系架构。掌握有关商业智能和数据仓库的重要术语了解数据中心建设过程了解公司数据仓库项目重要案例培训提纲概念重要术语关键技术数据质量方法论典型案例历史沿革计算机数据管理的历史:1961年通用电气开发出网状数据库管理系统—集成数据存储(IntegratedDataStoreIDS)。1968年IBM公司开发出层次数据库的IMS(InformationManagementSystem)。1970年关系模型建立。IBM研发全功能关系DBMS—SystemR。1973年加州大学伯克利分校开发出关系数据库系统Ingres。后来由Oracle公司、Ingres公司等厂商商品化。在20世纪70年代提出了决策支持系统概念。在1970年,联机分析处理工具——Express诞生了。1980年明确了其部件结构(对话部件、数据部件、模型部件)。1988年,IBM公司的研究者BarryDevlin和PaulMurphy发明了一个新的术语—信息仓库,之后,IT的厂商开始构建实验性的数据仓库。1991年,."Bill"Inmon出版《如何构建数据仓库》。把数据仓库、联机分析处理、数据挖掘、模型库、数据库、知识库结合起来形成综合决策支持系统(SyntheticDecisionSupportSystem,SDSS)是今后的发展方向。数据仓库的概念[]: 数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。与其他数据库应用不同的是,数据仓库更像一种过程,对分布在企业内部各处的业务数据的整合、加工和分析的过程。企业管理与决策基层业务人员中层管理人员高层决策人员操作型数据操作型应用企业级操作型数据企业级操作型应用分析型(战术)数据分析型(战术)应用分析型(战略)数据分析型(战略)应用管理信息(数据分析)决策信息(辅助决策)基础数据(统计查询)数据范围数据汇总粒度数据仓库的特点1、面向主题操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。2、集成的数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。3、相对稳定的数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。4、反映历史变化数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。数据仓库-面向主题数据仓库系统结构数据仓库主要包括数据的提取、转换与装载(ETL)、元数据、数据集市和操作数据存储等部分,常用的数据仓库结构如图所示。IBM数据仓库解决方案
数据仓库及其案例介绍 来自淘豆网m.daumloan.com转载请标明出处.