下载此文档

BI内部交流.ppt


文档分类: | 页数:约16页 举报非法文档有奖
1/16
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/16 下载此文档
文档列表 文档介绍
BI内部交流
提纲
BI介绍
BI框架
ETL介绍
数据仓库
术语介绍
BI经典故事
BI经典故事
在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在美国沃尔玛连锁店超市的真实案例,并一直为商家所津津乐道。原来,美国的妇女们经常会嘱咐她们的丈夫下班以后要为孩子买尿布。而丈夫在买完尿布之后又要顺手买回自己爱喝的啤酒,因此啤酒和尿布在一起购买的机会还是很多的。
BI介绍
商务智能(Business Intelligence ),简称BI,指通过对数据的收集、管理、分析以及转化,使数据成为可用的信息,从而获得必要的洞察力和理解力,更好地辅助决策和指导行动。
商业智能是根据企业发展需要,建立业务模型,从许多来自不同的企业运作系统的数据中提取出有用的数据并进行清理,以保证数据的正确性;然后对数据经过抽取、转换和装载,即ETL过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图;在此基础上利用合适的查询和分析工具、数据挖掘工具、联机分析处理(OLAP)工具等对其进行分析和处理,最后将知识呈现给管理者,为管理者的决策过程提供支持。
术语介绍
数据仓库:面向主题的、集成的、与时间相关且不可修改的数据集合。
维度:维度是分析中描述性的分类,通过它可以将度量值分离出来进行分析
度量:在多维数据集中,度量值是一组值,这些值基于多维数据集的事实数据表中的一列,而且通常为数字。此外,度量值是所分析的多维数据集的中心值。即,度量值是最终用户浏览多维数据集时重点查看的数字数据。您所选择的度量值取决于最终用户所请求的信息类型。
粒度:数据汇总的层次或深度。
聚合:聚合是预先计算好的数据汇总,由于在问题提出之前已经准备了答案,聚合可以改进查询响应时间。
切片:由一个维的一个成员限定的分区数据,称为一个切片。
数据钻取:最终用户从常规多维数据集、虚拟多维数据集或链接多维数据集中选择单个单元,并从该单元的源数据中检索结果集以获得更详细的信息,这个操作过程就是数据钻取。
级别:级别是维度层次结构的一个元素。级别描述了数据的层次结构,从数据的最高(汇总程度最大)级别直到最低(最详细)级别。
企业数据仓库
ETL(抽取、转换、加载)
即席查询、预定义报表、自定义报表、OLAP、数据挖掘、专题分析模型





Web
服务器
客户端
客户端
客户端
客户端
客户端
大客户分析数据集市
财务分析数据集市
客户分析数据集市
...
模型库
业务数据库
业务数据库
业务数据库
业务数据库
业务数据库
业务发展分析
客户分析
大客户分析
用户发展分析
收益情况分析
服务质量分析
营销管理分析
财务分析
渠道分析
反欺诈专题分析
客户流失专题分析
...
BI框架
ETL介绍
数据ETL是用来实现异构数据源的数据集成,即完成数据的抓取/抽取(Extraction )、清洗(Scrub or data cleansing)、转换( Transformation )、装载(Loading)数据整合工作。
数据抽取:只提取系统分析必需的那一部分数据
数据清洗:将错误的、不一致的数据在进入数据仓库之前予以更正或删除,以免影响决策支持系统决策的正确性
数据转化:业务系统使用不同数据库上的产品,各种产品提供的数据类型不同,数据格式不同
数据装载:将数据按照物理数据模型定义的表结构装入数据仓库,这些步骤包括清空数据域、填充空格、有效性检查等。
ETL流程
维度表
维度是分析中描述性的分类,通过它可以将度量值分离出来进行分析。
定义层次结构的好处:
允许用户从不同的层次展示数据
在分析中采用不同的路径进行钻取
举例:日期分为,年-半年-季度-月-日期
维度的层次

BI内部交流 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数16
  • 收藏数0 收藏
  • 顶次数0
  • 上传人mh900965
  • 文件大小283 KB
  • 时间2018-03-22