.
精选文档.
第1题:基本统计分析1
分析:本题要求随机选取80%的样本,因而需要选用随机抽样的方法,在此选择随机抽样中的近似抽样方法进行抽样。其基本操作步骤如下:数据→选择个案→随机个案样本→大约(A)80 所有个案的%。
1、基本思路:
(1)由于存款金额为定距型变量,直接采用频数分析不利于对其分布形态的把握,因而采用数据分组,先对数据进行分组再编制频数分布表。此处分为少于500元,500~2000元,2000~3500元,3500~5000元,5000元以上五组。分组后进行频数分析并绘制带正态曲线的直方图。
(2)进行数据拆分,并分别计算不同年龄段储户的一次存取款金额的四分位数,并通过四分位数比较其分布上的差异。
操作步骤:
(1)数据分组:【转换→重新编码为不同变量】,然后选择存取款金额到【数字变量→输出变量(V)】框中。在【名称(N)】中输入“存取款金额1”,单击【更改(H)】按钮;单击【旧值和新值】按钮进行分组区间定义。
存取款金额1
频率
百分比
有效百分比
累积百分比
有效
82
76
10
22
47
合计
237
(2)【分析→描述统计→频率】;选择“存款金额分组”变量到【变量(V)】框中;单击【图标(C)】按钮,选择【直方图】和【在直方图上显示正态曲线】;选中【显示频率表格】,确定。
.
精选文档.
(3)【数据→拆分文件】,选择“年龄”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析→描述统计→频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】→继续→确定。
统计量
存(取)款金额
20岁以下
N
有效
1
缺失
0
百分位数
25
50
75
20~35岁
N
有效
131
缺失
0
百分位数
25
50
75
35~50岁
N
有效
73
缺失
0
百分位数
25
50
75
50岁以上
N
有效
32
缺失
0
百分位数
25
50
75
结果及结果描述:
频数分布表表明,有一半以上的人的一次存取款金额少于2000元,%的人的存取款金额少于500元,%的人的存取款金额多于5000元,下图为相应的带正态曲线的直方图。
统计量表格表明,年龄在20岁以下的人有1人,其存取款金额的四分位差是0(50-50)元,
.
精选文档.
年龄在20~35岁之间的人有131人,其存取款金额的四分位差是4500(5000-500)元,年龄在35~50岁之间的人有73人,其存取款金额的四分位差是4000(4500-500)元,年龄在50岁以上的人有32人,其存取款金额的四分位差是1475(2000-525)元。可见,20~35,35~50两个年龄段的离散程度比较大,其余两个年龄段的离散程度较小。
2、基本思路:
本问题涉及到两个变量户口和物价趋势,考虑两者之间的联系,因而需要用到交叉列联表。该列联表的行变量为户口,列变量为物价趋势,需要在列联表中输出各种百分比、期望频数、剩余、标准剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对物价趋势的态度是否一致进行分析。
操作步骤:
(1)【分析→描述统计→交叉表】,选择“户口”到【行】框中,选择“物价趋势”到【列】框中;并选中【显示复式条形图】
(2)单击【单元格】按钮,选中【观测值】、【期望值】、【行】、【列】、【总计】各框→继续;
(3)单击【统计量】,选中【卡方】框→继续;
结果及其结果分析:
户口* 物价趋势 交叉制表
物价趋势
合计
上升
稳定
下降
户口
城镇户口
计数
21
131
18
170
期望的计数
户口 中的 %
%
%
%
%
物价趋势 中的 %
%
%
%
%
总数的 %
%
%
%
%
农村户口
计数
7
40
20
67
期望的计数
户口 中的 %
%
%
%
%
物价趋势 中的 %
%
%
%
%
总数的 %
%
%
%
%
合计
计数
28
171
38
237
期望的计数
SPSS期末大作业-完整版 来自淘豆网m.daumloan.com转载请标明出处.