第五章抽样和抽样分布
STAT
本章重点
1、统计推断(样本总体)的基本概念;
2、抽样分布;
3、参数估计的基本原理;
4、各类参数的区间估计。
本章难点
1、样本均值(比率)的抽样分布;
2、区间估计的基本原理。
参考资料
1、杜子芳:《抽样技术及其应用》,清华大学出版社2006;
2、施锡铨:《抽样调查的理论和方法》,上海财经大学出版社1999。
第五章抽样和抽样分布
STAT
第一节统计推断的基本概念
一、总体与样本(Population and Sample)(P124)
[例]某进出口公司拟进口10万台计算器。按规定,使用寿命小于4000小时即为次品,且次品率高于1%就不接受这批产品。现随机从中抽取1000台进行检验。
(一)(全及)总体:被观察(研究)的全体。
N:总体单位数
(二)样本总体:按随机原则从总体中抽取的部分单位。
1、随机原则:机会面前、人人平等。
2、n :样本容量→理论基础:边际信息量递减。
3、n≥30:大样本;n< 30:小样本。
第五章抽样和抽样分布
STAT
[例]在路易斯安那州的瑞皮德斯县(Rapides Parish , Louisiana),只有一家公司有权提供救护车服务。当地的报纸《镇报》(Town Talk)要求读者打电话回应,来表达他们是否赞成让这家公司垄断。
《镇报》共接到3763个电话,显示出对于救护车问题超乎寻常的关注。调查后发现,有638个电话来自救护车公司的办公室或公司高级主管的家里,而且无疑的是,一定还有更多的电话来自该公司的低级员工。该公司的一位副总裁说:“我们的员工很关心这个问题,他们为工作稳定性及家庭担心,可能多打了几个电话”。那么,这种样本及调查有效吗?
“自发性回应”(voluntary response)样本:对某一问题的回应而自发形成的样本(非主动抽样)。
第五章抽样和抽样分布
STAT
[例]王达尔公司每周向威尔斯公司出售4万箱桔子。为检验这些桔子的质量(重量、损伤及产地等),威尔斯公司的质检人员从库存中抽取样本,即从每个码堆的上层箱子中抽取100箱,然后从每箱随机抽取20个桔子进行调查并推断总体。试问这种抽样方式符合随机原则吗?
[例]在美国,制造商和广告代理商常常利用在购物中心的访谈来搜集消费者的消费习惯及广告效用等信息。他们认为,在购物中心选取样本既快速又省钱。
1、据调查,这些人比较富有;多青少年及退休人员;
2、客观上,调查人员往往倾向于选择那些外表整洁、看起来没有威胁的人进行调查。
“方便抽样”(convenience sampling)。
第五章抽样和抽样分布
STAT
二、总体参数(Population parameter)与样本统计量(Sample statistic)
[例]某养猪场共有存栏生猪10万头,现欲了解这批生猪的平均毛重及健康比例。调查者按随机原则从中抽取了100头生猪进行调查,以计算其平均毛重和健康比例。
(一)总体参数:反映总体特征的变量。
(二)样本统计量:反映样本特征的变量。
第五章抽样和抽样分布
STAT
三、简单随机抽样(Simple random samplingSRS)
(一)抽样组织(P125)
第五章抽样和抽样分布
STAT
(二)抽样方式
1、重复抽样(Sampling with replacement,回置抽样)
[例]总体5人年龄:1,2,3,4,5。按重复抽样随机抽取3人。
Xi(可能结果) xi(实际结果) 概率
第一次抽样 1,2,3,4,5 2 1/5回置
第二次抽样 1,2,3,4,5 5 1/5回置
第三次抽样 1,2,3,4,5 2 1/5回置
[例]N=3人(A、B、C) n=2。
①A、A;②A、B;③A、C;
④B、A;⑤B、B;⑥B、C;
⑦C、A;⑧C、B;⑨C、C。
(1)样本可能数目:M=Nn
(2)样本产生概率=1/ Nn
独立同分布的SRS样本
第五章抽样和抽样分布
STAT
2、不重复抽样( Sampling without replacement,不回置或不重置抽样)
[例]总体年龄为:1,2,3,4,5。按不重复抽样从中抽取3人。
Xi(可能结果) xi(实际结果) 概率
第一次抽样 1,2,3,4,5 2 1/5外置
第二次抽样 1,3,4,5 5 1/4外置
第三次抽样 1,3,4 3 1/3外置
[例]N=3人(A、B、C)n=2
①A、B;②A、C;
③B、A;④B、C;
⑤C、A;⑥C、B。
(1)样本可能数目: M= N!/(N–n)!
(2)样本产生概率= (N–n)!/ N!
第五章抽样和抽样分布
STAT
第二节抽样分布(Sampling
抽样与抽样分布 来自淘豆网m.daumloan.com转载请标明出处.