商 务 智 能(BI) 概 述
Business Intelligence
*
培训主要内容
名词说明
商业智能BI
数据仓库DW
联机事务处理OLTP
联机分析处理OLAP
操作数据存储ODS
ETL
Analytical Processing) 联机分析处理
它所擅长的是对企业的当前和历史数据进行分析,对企业的状况进行分析,主要是针对企业管理人员
是数据仓库系统的主要应用,支持困难的分析操作,侧重决策支持,并且供应直观易懂的查询结果。
*
OLTP与OLAP特点比较
OLTP
OLAP
用户
操作人员,低层管理人员
决策人员,高级管理人员
功能
日常操作处理
分析决策
DB
面向应用
面向主题
设计数据
当前的,最新的,细节的,二维的(行,列 ),分立的
历史的, 聚集的, 多维的,集成的, 统一的
存取
读/写数十条记录
读上百万条记录
工作单位
简单的事务
复杂的查询
用户数
上千个
上百个
DB 大小
100MB-GB
100GB-TB
*
数据仓库建模的基本概念
第三范式
维度
维度的粒度
维度的层次
事实
关系型建模
星型模型
雪花模型
一个符合第三范式的关系必需具有以下三个条件:
,不具有多义性;
,而非主键的一部分;
,因为这样的话,这种属性应当归到其他关系中去。
第三范式的定义基本上是围绕主键与非主属性之间的关系而作出的。
维度是指一种视角,而不是一个固定的数字;是一个推断、说明、评价和确定一个事物的多方位、多角度、多层次的条件和概念。
时间是关键维度。
指待分析数据的分割大小
层次结构是一组相互之间具有多对一关系的层次,并且这一组层次共同构成维。
事实表是星型模式或雪花模式中的一个表,它存储用于量度业务(如销售量、商品成本或利润)的事实。
事实表还包含指向维表的外键。这些外键使事实表中的每个数据行与其对应的维和层次相关。
*
星型模式
星型模式是一种多维的数据关系,它由一个事实表(Fact Table)和一组维表(Dimension Table)组成。
注:每个维表都有一个维作为主键,全部这些维则组合成事实表的主键,换言之,事实表主键的每个元素都是维表的外键。事实表的非主属性称为事实 (Fact),它们一般都是数值或其他可以进行计算的数据;而维大都是文字、时间等类型的数据。
*
雪花模型
雪花模式将层次结构的不同层次进一步分隔到单独的维表中。
*
数据仓库设计的挑战
在数据仓库系统中,对数据库引擎最大的挑战主要是这样几种操作:多表连接、表的累计、数据排序、大量数据的扫描。
如何避开多表连接:在设计模型时对表进行合并,即所谓的预连接 (Pre-Join)。当数据规模小时,也可以接受星型模式, 这样能提高系统速度,但增加了数据冗余量。
如何避开表的累计:在模型中增加有关小计数据 (Summarized Data)的项。这样也增加了数据冗余,而且假如某项问题不在预建的累计项内,需临时调整。
如何避开数据排序:对数据事先排序。但随着数据仓库系统的运行,不断有新的数据加入,数据库管理员的工作将大大增加。大量的时间将用于对系统的整理,系统的可用性随之降低。
如何避开大表扫描:通过运用大量的索引,可以避开对大量数据进行扫描。但这也将增加系统的困难程度,降低系统进行动态查询的实力。
*
ODS (Operational Data Store) 操作数据存储
ODS是一个面对主题的、集成的、可变的、当前的微小环节数据集合,用于支持企业对于即时性的、操作性的、集成的全体信息的需求。
是操作型系统中的集成,用于当前,历史以及其它微小环节查询(业务系统的一部分)。
为决策支持供应当前微小环节数据(数据仓库的一部分)。
常常被作为数据仓库的过渡,也是数据仓库项目的可选项之一。
*
为什么须要有一个ODS系统
在业务系统和数据仓库之间形成一个隔离层。
转移一部分业务系统微小环节查询的功能。
完成数据仓库中不能完成的一些功能。
一般来说,带有ODS的数据仓库体系结构中,DW层所存储的数据都是进行汇总过的数据和运营指标,并不存储每笔交易产生的微小环节数据,但是在某些特殊的应用中,可能须要对交易微小环节数据进行查询,这时就须要把微小环节数据查询的功能转移到ODS来完成,而且ODS的数据模型依据面对主题的方式进行存储,可以便利地支持多维分析等查询功能。即数据仓库从宏观角度满足企业的决策支持要求,而ODS层
BI的价值解析 来自淘豆网m.daumloan.com转载请标明出处.