数据分析方法与软件应用期末大作业第1题:基本统计分析 1分析:本题要求随机选取 80%的样本,因而需要选用随机抽样的方法, 在此选择随机抽样中的近似抽样方法进行抽样。 其基本操作步骤如下: 数据→选择个案→随机个案样本→大约(A)80 所有个案的%。1、基本思路:(1)由于存款金额为定距型变量,直接采用频数分析不利于对其分布形态的把握,因而采用数据分组,先对数据进行分组再编制频数分布表。此处分为少于500元,500~2000元,2000~3500元,3500~5000元,5000元以上五组。分组后进行频数分析并绘制带正态曲线的直方图。2)进行数据拆分,并分别计算不同年龄段储户的一次存取款金额的四分位数,并通过四分位数比较其分布上的差异。操作步骤:1)数据分组:【转换→重新编码为不同变量】,然后选择存取款金额到【数字变量→输出变量(V)】框中。在【名称(N)】中输入“存取款金额1”,单击【更改(H)】按钮;单击【旧值和新值】按钮进行分组区间定义。(2)【分析→描述统计→频率】;选择“存款金额分组”变量到【变量( V)】框中;单击【图标(C)】按钮,选择【直方图】和【在直方图上显示正态曲线】 ;选中【显示频率表格】,确定。1数据分析方法与软件应用期末大作业3)【数据→拆分文件】,选择“年龄”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析→描述统计→频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】→继续→确定。统计量存(取)~~:频数分布表表明,有一半以上的人的一次存取款金额少于 2000元,且有 %的人的存取款金额少于500元,%的人的存取款金额多于5000元,下图为相应的带正态曲线的直方图。2数据分析方法与软件应用期末大作业统计量表格表明,年龄在20岁以下的人有1人,其存取款金额的四分位差是0(50-50)元,年龄在20~35岁之间的人有131人,其存取款金额的四分位差是4500(5000-500)元,年龄在35~50岁之间的人有73人,其存取款金额的四分位差是4000(4500-500)元,年龄在50岁以上的人有32人,其存取款金额的四分位差是1475(2000-525)元。可见,20~35,35~50两个年龄段的离散程度比较大,其余两个年龄段的离散程度较小。2、基本思路:本问题涉及到两个变量户口和物价趋势, 考虑两者之间的联系, 因而需要用到交叉列联表。该列联表的行变量为户口, 列变量为物价趋势,需要在列联表中输出各种百分比、 期望频数、剩余、标准剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对物价趋势的态度是否一致进行分析。操作步骤:1)【分析→描述统计→交叉表】,选择“户口”到【行】框中,选择“物价趋势”到【列】框中;并选中【显示复式条形图】(2)单击【单元格】按钮,选中【观测值】、【期望值】、【行】、 【列】、【总计】各框→继续;3)单击【统计量】,选中【卡方】框→继续;结果及其结果分析:户口*物价趋势 交叉制表计数期望的计数城镇户口 户口中的%物价趋势中的总数的%户口计数期望的计数农村户口 户口中的%物价趋势中的总数的%计数期望的计数合计 户口 中的%物价趋势 中的总数的%物价趋势合计上升稳定下降2**********.%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%3数据分析方法与软件应用期末大作业卡方检验值df渐进Sig.(双侧)
SPSS期末大作业-完整版 来自淘豆网m.daumloan.com转载请标明出处.