下载此文档

数据分析.pptx


文档分类:IT计算机 | 页数:约36页 举报非法文档有奖
1/36
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/36 下载此文档
文档列表 文档介绍
数据包括两类:计量型数据、计数型数据
计量型数据:又称为连续型数据,需要使用仪器测量的数值,如长度、宽度、高度、电压、内阻等;
计数型数据:又称为离散型数据,如分类、不良率、班次、设备等。
我们所做的任何数据研究都是通过样本来推论总体!!!!
6sigma单因子数据分析方法
6sigma单因子数据分析
分析路径图
注: 离散数据(Discrete data)是计数型数据( Attribute Data)的另一种叫法.
连续数据(Continuous data)是计量型数据( Variable Data)的另一种叫法.
数据 X
单一 X
多个 Xs
数据 Y
单一 Y
多个 Ys
数据 X
离散数据
连续数据
数据 Y
离散数据
连续数据
T检验/ 方差分析
均值/
中位数检验
数据 X
离散数据
连续数据
数据 Y
离散数据
连续数据
卡方分析
回归
多元回归
中位数检验
多元
ANOVA
逻辑回归
逻辑
回归
多元
逻辑
回归
多元
多变量分析
(注: 不同于多变量图表)
中心极限定理
中心极限定理:不论总体的分布如何,样本的均值会趋中分布(但不一定是正态分布)
σx = σx/√ n
中央极限定理就是
通过样本总体
U
σ
总体
N1
N2
N3


Nk
X1
X2
X3


Xk
总体推论性统计
假设检验
方差分析
t-检验
置信区间
F-检验
回归分析
健壮设计
试验设计
中心极限定理
中心检验
离散检验
使用样本推论总体
置信区间
由于采用样本来推论总体,被推论的参数总是与其真实值有一定的偏差,因此从样本中是无法准确的确定被推论参数的真实值,但是我们可以知道被推论值所在的一个范围[T1,T2],此范围我们称之为置信区间,T1为置信区间的下限,T2为置信区间的上限。
如:在某村抽查10个人的身高:,,,….,,现在我们想通过此10个数据来推论(估计)整个村子的平均身高。
只有这10个数据我们是不能精确的将整个村子的平均身高H平确定出来的。但我们可以有如下的假设:① ≤H平≤;② ≤H平≤;③ ≤H平≤….
置信区间
对于推论①,,,但此推论正确的可能性是多大呢?我们暂时定为80%,对于推论②呢?此推论的正确性肯定大于推论①,我们暂定为95%,推论③呢?其正确性肯定大于推论①②,此推论基本上可以说是100%正确。
因此我们在做推论的时候要给一个系数α,以1- α来确定此推论成立的概论,即置信水平。

通常情况下我们一般取α=5%。
假设检验
统计是精算风险的科学;统计不给绝对的结论,仅提供以概率为基础的判别;任何统计推论都含有一定的错误风险。
假设检验:先假设总体的分布形式或者总体的参数具有某些特征,然后利用样本提供的信息来判断原先的假设是否合理,若合理,则承认假设的正确性;否则便否定原先的假设。因此从某种意义上说,假设检验就是某种带有概率性质的反证法。
我们定义H0为原假设,Ha为H0的反面,称之为备择假设,P值H0为真的概率。通常情况下H0为非显著性假设,如无变化、相等、相同、无关等;Ha为显著性假设,如有变化、不相等、不相同、有关。
假设检验
分析路径
①将实际问题转化为统计问题H0
②定义α
③收集数据
④使用minitab计算P值
⑤判定是否接受H0
⑥若拒绝H0采取的行动?
若P< α,则拒绝H0
若P> α,则接受H0
假设检验
例1 领班想知道新进员工的操作时间是否等于标准时间
X是什么数据类型
Y是什么数据类型
H0是什么
Ha是什么
例2 人事部门想了解年龄(old和young)与人员受聘的关联性
X是什么数据类型
Y是什么数据类型
H0是什么
Ha是什么
假设检验
连续型Y和离散型X
此种情况使用t检验和方差分析。我们可以将其分为1水平x的比较、2水平x的比较与多水平的x比较。
1水平的x比较:基本上就是与标准值的比较;
2水平的x比较:a水平=b水平;
多水平的x比较:a水平=b水平….=n水平
不论水平多少,都是单因子捡定

数据分析 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数36
  • 收藏数0 收藏
  • 顶次数0
  • 上传人wz_198613
  • 文件大小330 KB
  • 时间2018-11-27