目录实验一 描述性分析实验二 正态总体的均值检验实验三 非参数检验实验四 方差分析实验五 回归分析实验六 判别、聚类分析实验七 主成分分析实验八 因子分析实验一 描述性分析【实验目的】掌握数字特征的计算(A);2. 掌握相关矩阵计算(A)。【实验原理】数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用;是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。要对数据进行分析,当然要分析数据中包含的主要信息,即要分析数据的主要特征,也就是说,要研究数据的数字特征。对于数据的数字特征,要分析数据的集中位置、分散程度。数据的分布是正态的还是偏态等。对于多元数据,还要分析多元数据的各个分量之间的相关性等。【实验项目设计】给定一组单变量数据,分组计算均值、方差、Q1、Q3、偏度、峰度。给定一组多变量数据,计算相关矩阵。【实验内容】一、单样本的数字特征计算()从某商店的营业日中随机抽取12天,得日营业额数据为(单位:万元):,,,,,20,,,,,,、样本方差、样本变异系数、样本中位数、上样本四分位数、下样本四分位数、样本四分位数间距和极差。1. 建数据集Datad4;Inputx@@;Cards;;Run;2. 使用“SAS/分析家”菜单打开“分析家”界面。选择SAS界面的级联菜单:“解决方案”Ø“分析”Ø“分析家”。。在界面的空白处,右键弹出菜单,选择级联菜单:“文件”Ø“按SAS名称打开”。依次选择逻辑库和文件对象,分别为“Work”、“D4”,单击“确定”按钮。确定分析方法。选择界面上的级联菜单:“统计”Ø“描述性统计”Ø“分布”输送变量。首先选中变量“x”,然后单击“Analyst”按钮。即完成变量的输送,确定变量“x”作为分析变量。单击“OK”。得到输出结果上述使用“分析家”的调用过程等价于程序调用univariate过程:procunivariatedata=d4;Varx;Run;3. 解答样本均值mean= 样本方差Variance=样本变异系数CoeffVariation=样本上四分位数75%Q3=样本中位数Median=样本下四分位数25%Q1=极差Range=样本四分位数间距InterquartileRange=二、相关矩阵计算()今对31个人进行人体测试,考察或测试的七个指标是:年龄(x1)、体重(x2)、肺活量(x3)、(x4)、休息时的脉搏(x5)、跑步时的脉搏(x6)和跑步时记录的最大脉搏(x7)。。现欲对这些指标作一些相关分析。1. 对于给定EXCEL数据文件,. 使用SAS/INSIGHT菜单3. 输出 实验二 正态总体的均值检验【实验目的】掌握单正态总体样本的均值检验(B);掌握两独立组样本(服从正态总体)进行均值比较(A);掌握两对照组样本(服从正态总体)进行均值比较(A);了解两组样本均值差的置信区间计算(C)。【实验原理】单样本总体均值的t检验两独立组样本总体的方差比较【实验项目设计】单个正态总体的均值检验;两独立组样本(服从正态总体)进行均值比较检验;两对照组样本(服从正态总体)进行均值比较检验。【实验内容】一、单个正态总体的均值检验()从某商店的营业日中随机抽取12天,得日营业额数据为(单位:万元):,,,,,20,,,,,,:μ0=10。1. 建数据集Datad4;Inputx@@;Cards;;Run;2. 使用“SAS/分析家”菜单打开“分析家”界面。。确定分析方法。选择界面上的级联菜单:“统计”Ø“假设检验”Ø“均值的单样本T检验”输送变量。确定变量“x”为分析变量。得到输出结果3. 解答H0:μ0=10H1:μ0≠10检验方法:t检验统计量取值: t=____检验p值=_______结论:拒绝/(服从正态总体)进行均值比较()为比较甲、乙两种安眠药的疗效,将20名患者分成两组,每组10人,假定服药后延长的睡眠时间都近似服从正态分布且方差相等,测得其数据如下:,,,,-,,,,,,
数据分析实验指导书 来自淘豆网m.daumloan.com转载请标明出处.