1
第一节常用的抽样方法
基本概念
总体和样本
概率抽样和非概率抽样
抽样误差
概率抽样的组织方式
简单随机抽样
分层抽样
等距抽样
整群抽样
2
(一)总体与样本
总体
总体:根据研究目的确定的所要研究的同类事物的全体,是所要说明其数量特征的研究对象。
总体单位/个体:构成总体的个别事物(基本单元)。
总体容量:总体单位的数量。
总体指标/总体参数:在抽样估计中,用来反映总体数量特征的指标。
总体平均数μ、总体比例P、总体标准差σ、总体方差σ2
样本
样本:从总体中抽取的部分总体单位所构成的整体。
样本容量:样本所包含的总体单位个数。
在实际工作中,通常把n≥30的样本称为大样本,把n<30的样本称为小样本。
样本指标/样本统计量/估计量:根据样本资料计算的、用以估计和推断相应总体指标的综合指标。
样本平均数、样本比例p、样本标准差s、样本方差s2
总体参数是唯一的,往往未知的;样本统计量是不唯一的,随着抽取的样本的不同而不尽相同。
3
总体参数和样本统计量
平均数
标准差、方差
成数
参数
、2
P
统计量
S、 S2
p
总体
样本
4
(二)概率抽样与非概率抽样
概率抽样/随机抽样
定义:按照随机原则抽取样本的抽样方法。
组织方式:简单随机抽样、分层抽样、等距抽样、整群抽样
特点:
抽样推断必须遵循抽样调查的随机原则
抽样推断是以样本指标数值去推断总体指标数值
抽样推断中产生的误差可以事先计算加以控制。
作用:
对于不可能进行全面调查的总体数量特征的推断
对于某些不必要进行全面调查的总体数量特征的推断
对于全面调查的资料进行评价和修正
非概率抽样
定义:从研究目的出发,根据调查者的经验或判断,从总体中有意识地抽取若干单位构成样本的抽样方法。
组织方式:典型调查、重点调查、配额抽样、方便抽样等
5
(三)抽样误差
登记性误差:在调查和汇总过程中由于观察、测量、登记、计算等方面的差错或被调查者提供虚假资料而造成的误差。
代表性误差:用样本指标推断总体指标时,由于样本结构与总体结构不一致、样本不能完全代表总体而产生的误差。
系统误差:由于非随机因素引起的样本代表性不足而产生的误差。
随机误差/偶然性误差:由于随机因素(偶然性因素)引起的代表性误差。
抽样估计中的抽样误差,即这种误差。
6
二、概率抽样的组织方式
简单随机抽样/纯随机抽样
在从总体抽取n个单位作为样本时,要使得每个总体单位都有相同的机会被抽中的抽样方式。
重复抽样和不重复抽样
分层抽样/分类抽样
在抽样之前先将总体的单位划分为若干层(类),然后从各个层中抽取一定数量的单位组成一个样本,这样的抽样方式称为分层抽样。
在分层或分类时,应使层内各单位的差异尽可能小,而使层与层之间的差异尽可能大。
等距抽样/系统抽样/机械抽样
在抽样中,先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,然后,每个一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。
样本在总体中的分布一般较均匀。
整群抽样
调查时先将总体划分成若干群,然后在以群作为调查单位从中抽取部分群,进而对抽中的各个群中所包含的所有个体单位进行调查或观察,这样的抽样方式称为整群抽样。
群内结构特征与总体越接近,抽样推断效果越好。
7
第二节抽样分布
一、抽样分布的概念
由样本统计量的全部可能取值和与之相应的概率(频率)组成的分配数列。
在实际应用中,统计量的抽样分布是通过教学推导或在计算机上利用程序进行模拟而得到的。
8
二、抽样分布的推导
以样本均值为例
例:设有四名学生参加知识题竞猜,竞猜成绩分别为1分、2分、3分、4分。现从中抽取两名学生构成样本(重复抽样),求样本平均成绩的抽样分布。
分析:
总体是什么?总体均值等于多少?
总体容量?样本容量?样本个数?
计算各个样本的均值?总体均值与样本均值的区别?
样本均值的概率分布?
9
分析
总体是什么?总体均值等于多少?
总体是4个学生。
总计均值即4名学生的平均成绩=(1+2+3+4)/4=
总体容量?样本容量?样本个数?
总体容量=4,样本容量=2
样本个数=42=16
计算各个样本的均值?总体均值与样本均值的区别?
总体均值是唯一的,样本均值是随机的。
样本均值的概率分布?
10
样本均值
样本编号
学生成绩
学生平均成绩
1
1,1
2
1,2
3
1,3
4
1,4
5
2,1
6
2,2
7
2,3
8
2,4
9
3,1
10
3,2
11
抽样与抽样分布 来自淘豆网m.daumloan.com转载请标明出处.