统计学
─从数据到结论
第十六章非参数检验
关于非参数的一些常识
经典统计的多数检验都假定了总体的背景分布。
但在总体未知时,如果假定的总体和真实总体不符,那么就不适宜用通常的检验
这时如果利用传统的假定分布已知的检验,就会产生错误甚至灾难。
无需假定总体分布的具体形式,仅仅依赖于数据观测值的相对大小(秩)或零假设下等可能的概率等和数据本身的具体总体分布无关的性质进行的检验都称为非参数检验(nonparametric testing)。
关于非参数的一些常识
这些非参数检验在总体分布未知时有很大的优越性。它总是比传统检验安全。
在总体分布形式已知时,非参数检验不如传统方法效率高。这是因为非参数方法利用的信息要少些。往往在传统方法可以拒绝零假设的情况,非参数检验无法拒绝。
但非参数统计在总体未知时效率要比传统方法要高,有时要高很多。是否用非参数统计方法,要根据对总体分布的了解程度来确定。
这里介绍一些非参数检验。
关于非参数方法的确切定义并不很明确。我们就其最广泛的意义来理解。
在计算中,诸如列联表分析中的许多问题都有精确方法,Monte Carlo抽样方法和用于大样本的渐近方法等选择。精确方法比较费时间,后两种要粗糙一些,但要快些。
秩(rank)
非参数检验中秩是最常使用的概念。什么是一个数据的秩呢?一般来说,秩就是该数据按照升幂排列之后,每个观测值的位置。例如我们有下面数据
Xi
15
9
18
3
17
8
5
13
7
19
Ri
7
5
9
1
8
4
2
6
3
10
这下面一行(记为Ri)就是上面一行数据Xi的秩。
秩(rank)
利用秩的大小进行推断就避免了不知道背景分布的困难。这也是非参数检验的优点。
多数非参数检验明显地或隐含地利用了秩的性质;但也有一些非参数方法没有涉及秩的性质。
单样本检验(a-分位数)符号检验
我们知道某点为中位数(a-分位数)(a).
因此,一个观测值小于该点(或与该点之差的符号为负号)(a)。
这就是符号检验名称的来源,并与二项分布有关。
例:
质量监督部门对商店里面出售的某厂家的西洋参片进行了抽查。对于25包写明为净重100g的西洋参片的称重结果为(单位:克):
16非参数检验 来自淘豆网m.daumloan.com转载请标明出处.