用样本频率分布估计总体分布
大兴安岭实验中学杨丽英
我国是世界上严重缺水的国家之一,城市缺水问题较为突出。
2000年全国主要城市中缺水情况排在前10位的城市
例1:某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a , 用水量不超过a的部分按平价收费,超过a的部分按议价收费。
①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
②为了较合理地确定这个标准,你认为需要做
哪些工作?
思考:由上表,大家可以得到什么信息?
通过抽样,我们获得了100位居民某年的月平均用水量(单位:t) ,如下表:
分析数据的基本方法
列表:改变数据的排列方式
使数据更加直观
作图:从数据中提取信息
从图形中传递信息
频数、频率:
将一批数据按要求分为若干个组,各组内数据的个数,叫
做该组的频数。
每组的频数除以样本容量的商叫做该组的频率;
频率分布是指一个样本数据在各个小范围内所占比例的大小。
通常:我们用频率分布直方图反映样本的频率分布。
(即一组数据中最大值与最小值的差)
组数=
- =
=
组距
极差
=
[0, ),[,1 ),…,[4,]
组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组。
组距:指每个小组的两个端点的距离,
100位居民月平均用水量的频率分布表
频率/组距
月平均用水量/t
0
1 2 3 4
小长方形的面积
组距
频率
=
组距×
频率
=
注意:
①这里的纵坐标不是频率,而是频率/组距;
②某个区间上的概率用这个区间的面积表示;
思考:所有小长方形的面积之和等于?
画一组数据的频率分布直方图,可以按照以下步骤进行:
一、求极差,即数据中最大值与最小值的差
二、决定组距与组数:组距=极差/组数
三、分组,通常对组内数值所在区间,
取左闭右开区间, 最后一组取闭区间
四、登记频数,计算频率,列出频率分布表
五、画出频率分布直方图(纵轴表示频率/组距)
用样本的频率分布估计总体分布 来自淘豆网m.daumloan.com转载请标明出处.