描述性统计分析本文由应用教程贡献LOGO描述性统计分析统计分析的基本概念武汉大学计算中心LOGO进行数据分析首先应:进行数据分析首先应:明确分析的目的明确分析的对象确定是否需要抽样在一些问题中,要考查整个总体往往是不可能的,(总体(population)是所研究)(sampling)(sample):在抽样的过程中,简单随机抽样:在抽样的过程中,(对于有限总体),可模拟简单随机抽样,如对学生的学号用随机数进行抽样对于无限总体不能进行标号,抽样过程不能用随机数,难于实施分层抽样::,按每年级分为一个层武汉大学计算中心LOGO分层抽样的优点抽取的样本在总体中分布得更均匀,抽取的样本在总体中分布得更均匀,更合理个层内单位之间差异程度相对减小,个层内单位之间差异程度相对减小,使在该层内抽取的样本对该层的代表性得到提高层内成员差异小,而层间成员差异较大时,层内成员差异小,而层间成员差异较大时,(parameters),样本的总体的度量值称为参数,度量值称为统计量(statistics).,总体参数是未知的总体参数是未知的,():总体的度量值参数(parameters):总体的度量值.):():样本的度量值统计量(statistics):样本的度量值.)::一般总体参数用希腊字母表示:,自由度是某一统计量中,[例]变量有n个取值,df=n;若它们受到变量X有个取值个取值,例变量;k(k<n)个条件制约,则df=n-k个条件制约,(均值(Mean):):=(∑xi)/ni=1n中位数():用以描述数据取中位数(Median或Med):用以描述数据取或)::先将数据从小到大排序,x1,x2,…,xn然后计算:中位数的优点是它不受个别极端数据的影响,():观测值中出现最多的数众数(Mode):观测值中出现最多的数.):(Percentile):,,下四分位数,,k百分位数(k-percentile),即约有k%(Range):数据中最大值和最小值之差.:=max{xi}min{xi}方差(Variance)以变量取值相对于均方差()值的偏差平方平均来度量(又称均方MS).值的偏差平方平均来度量(又称均方).s=(∑(xix))/(n1)22i=1武汉大学计算中心nLOGO[例]SAS计算样本方差的步骤例计算样本方差的步骤计算样本均值计算每个观测值同均值的差值把这些差值分别平方再求这些平方的和把平方和除以n-1,n为差值的个数(样本容量)为差值的个数(把平方和除以,为差值的个数样本容量)假设样本值分别为10,11,12,15,均值为,样假设样本值分别为,均值为12,本容量为4,方差按下式计算:本容量为,方差按下式计算:s2=((((10-12)2+(12-12)2+(11-12)2+(15-12)2)/(4-1)(()()()()()=():方标准差(Standarddeviation或StdDev):方或):(或方差
描述性统计分析2011535103531750 来自淘豆网m.daumloan.com转载请标明出处.