第四章样本数据的统计分析
非参数检验
在数据分析过程中,由于多种原因,人们往往无法对总体分布形态作简单假设,但却希望能从样本数据中获得尽可能多的信息。这种情况下,在总体分布未知或知之甚少的情况下,利用样本数据对总体分布形态进行推断的方法。
单样本的参数检验
拿到一批样本数据后,往往希望了解样本来自的总体分布是否与某个已知的理论分布相吻和。SPSS单样本非参数检验正是对单个总体的分布形态进行推断的方法。主要介绍以下两种检验方法包括:
卡方检验
K-S检验
卡方检验
卡方检验解决以下类似问题:
Ex: 医学家研究心脏病人猝死人数与日期的关系时发现,一周之中周一心脏病人猝死者较多,其他日子则相当。:1:1:1:1:1:1。现收集到心脏病人死亡日期的样本数据,需要推断其总体分布是否与上述理论分布相吻合?
卡方检验
卡方检验分布推断总体分布与期望分布或某一理论分布之间是否存在显著差异。为吻合性分布检测,通常适用于多项分类值总体分布的分析。一般其零假设为:
H0: 总体分布与理论分布无显著差异。
卡方检验
Ex:为研究心脏病人猝死人数与日期的关系,收集到168个观察数据。统计样本数据,周一至周日的的死亡人数依次为:55,23,18,11,26,20,15. :1:1:1:1:1:1。这类问题变量往往为离散数据。
卡方检验
Data: “(非参数检验)心脏病猝死”
Command: AnalyzeNonparametric Tests Chi-Square
Expected Values 框中给出各个pi的值。All categories equal 表示所有pi都相同,即期望分布为均匀分布;Value框中依次输入pi.
卡方检验
观察值
按照理论分布,168人一周内每天死亡的期望频数。
,>, 不能拒绝原假设。即总体分布与理论分布无显著差异。
卡方检验
卡方检验的基本理论依据:
如果从一个随机变量X中随机抽取若干个观察样本,这些观察样本落在X的k个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k趋于无穷时近似服从卡方分布。基于这一思想,对变量X总体分布的研究就可从对各个观察频数的分析入手。
卡方检验
观察频数
期望频数
信息分析与决策Chapert4-2抽样与统计推断1-非参数检验 来自淘豆网m.daumloan.com转载请标明出处.