开篇案例“百脑汇”调研中的样本计划问题
“百脑汇”在中国华北几个省市经营连锁电脑超市,它希望获得更多关于其现有客户特点方面的信息。接受调研委托的李文博士指派班上的王洪同学为样本计划小组的负责人。
通过与“百脑汇”的市场部经理乔兰的初次会:各层的设计权数为:
城市层 wd,1=N1/n1==5
农村层 wd,2=N2/n2==2
步骤2:调整以弥补无回答。各层的无回答调整因子计算如下:
城市层:n1 / nr,1==200/150==
农村层:n2 / nr,2==50/40==
步骤3:无回答的调整权数等于设计权数与无回答调整因子的乘积:
城市层:
农村层:
整理ppt
9
使用辅助信息调整权数
为什么要使用辅助信息来调整权数呢?
首先,使调查的估计值与已知总体总值相匹配。例如,使用最新的人口普查数据来调整估计值,以确保这些估计值(如年龄、性别分布等)的一致性。
二是为了提高估计值的精度。将辅助信息与抽样设计相结合,将有助于提高估计的精度。
要想在调查设计阶段使用辅助信息,抽样框中的所有单元都必须具备这个辅助信息。否则,就只能在数据收集上来后,在估计阶段利用辅助信息提高估计值的精度。
整理ppt
10
使用辅助信息调整权数
[例10.5] 为得到某公司职员是否有吸烟习惯的信息,进行了一项调查。从N=780人的名录中抽出了一个n=100人的简单随机样本。
在收集有关吸烟习惯信息时,收集了每个回答者的年龄和性别情况,且100人都做出了回答,由此得到样本数据的分布如表10-3所示:
事后分层
估计值
男性
女性
总计
吸烟人数
164
47
211
总人数
360
420
780
吸烟者比例
回答者数量
男性
女性
总计
吸烟人数
25
5
30
总人数
55
45
100 (nr)
调查的估计值
男性
女性
总计
吸烟人数
195
39
234
总人数
429
351
780
吸烟者的比例
表10-5 利用辅助信息对抽样调查估计值的调整
表10-3 某公司吸烟习惯抽样调查数据
表10-4 根据某公司吸烟习惯抽样计算的估计值
整理ppt
11
10.3 抽样分布与抽样误差
抽样调查的目的是要对总体做出推断。
了解统计推断的理论基础,首先注意区分三种不同性质的分布:
总体分布
样本分布
抽样分布
同时,特别注意总体分布与抽样分布的关系。
整理ppt
12
三种不同性质的分布
总体分布:总体各单位的观察值所形成的频数分布,总体分布通常是未知的。
样本分布:一个样本中各个观察值所形成的频数分布就叫做样本分布。当样本容量n逐渐增大时,样本分布逐渐接近总体的分布。
抽样分布:样本统计量的抽样分布,是指在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布。抽样分布是一种理论分布。
抽样分布提供了样本统计量长远而稳定的信息,是进行推断的理论基础。
分布类型
均值
比例
标准差
总体分布
样本分布
抽样分布
X
P
S
表10-6 各种分布的均值、比例和标准差的符号表示
整理ppt
13
样本均值的抽样分布
样本均值的抽样分布,是指在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布。
[例10.6]设一个总体,含有4个元素,即总体单位数N =4。4个个体分别为x1=1, x2=2, x3=3, x4=4。则总体分布如图10-1。
现在从总体中有放回地抽取n=2的简单随机样本,则样本均值的抽样分布如图10-2。
整理ppt
14
均值抽样分布的规律
比较样本均值的分布与总体分布,得出如下结论:
(1)样本均值的数学期望 等于总体均值,即E( )=μ。
(2)在重复抽样条件下,样本均值的方差等于总体方差的1/n,或者说,样本均值的标准误 。
(3)如果总体服从正态分布,即x~N(μ,σ2),那么样本均值也服从正态分布,即 ~N(μ,σ2/n)。
(4)如果总体不服从正态分布,那么当样本量足够大时,样本均值 也服从正态分布。
中心极限定理,概括为:
设从均值为、方差为 2的一个任意总体中随机抽取容量为n的样本,当n足够大(n 30)时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。
整理ppt
15
样本比例的抽样分布
样本比例的抽样分布,是在重复抽取容量为n的样本时
抽样估计与样本量确定 来自淘豆网m.daumloan.com转载请标明出处.