数据描述性分析
内容分布
均值、方差的数据特征
数据的分布
二元数据的数字特征及相关系数
误差
坏值的剔除
数据描述性分析
数据分析研究的对象是数据,它们是个观测值:
如果这个观测值就是所要研究对象的全体,那么数据分析的任务就是提取数据中包含的有用的信息。如果数据是从总体中抽出的样本,就要分析推断样本中包含的总体的信息。
,
均值、方差等数字特征
一元数据的数字特征主要是以下几种。设个观测值为
其中称为样本容量。
1 均值:即是的平均数:
均值表示数据的集中位置。
均值、方差等数字特征
2 方差、标准差与变异系数
方差是描述数据取值分散性的一个度量,
其量纲是数据量纲的平方。
标准差
均值、方差等数字特征
变异系数:刻画数据相对分散性的度量
CV=
校正平方和
CSS=
未校平方和
USS =
均值、方差等数字特征
3 偏度与峰度
偏度与峰度是刻画数据的偏态、尾重程度的度量。它们与数据的矩有关。数据的矩分为原点矩与中心矩。
k阶原点矩
K阶中心矩
均值、方差等数字特征
偏度
其中s是标准差。偏度是刻画数据对称性的指标。关于均值对成的数据其偏度为0,右侧更分散的数据偏度为正,左侧更分散的数据偏度为负。
频
数
频
数
频
数
偏向左
< 0
对称
= 0
偏向右
> 0
均值、方差等数字特征
峰度
当数据的总体分布为正态分布时,峰度近似为0;当分布较正态分布的尾部更为分散时,峰度为正,否则峰度为负。
当峰度为正时,两侧极端数据较多;当峰度为负时,两侧极端数据较少。
数据描述性分析 来自淘豆网m.daumloan.com转载请标明出处.