格拉布斯法Grubbs检验法.doc格拉布斯法 (Grubbs) 检验法
▲概述:一组测量数据中,如果个别数据偏离平均值很远,那么这个 ( 这些 ) 数据称作“可疑值”。如果用统计方法 —例如格拉布斯 (Grubbs) 法判断,能将“可疑值”从此组测量数据中剔除而不参与平均值的计算,那么该“可疑值”就称作“异常值 ( 粗大误差 ) ”。
本文就是介绍如何用格拉布斯法 (Grubbs) 判断“可疑值”是否为“异常值”。
▲测量数据:例如测量 10 次 ( n=10) ,获得以下数据: 、 、 、 、 、 、 、 、 、 。
▲排列数据: 将上述测量数据按从小到大的顺序排列, 得到 、 、 、 、 、 、 、 、 、 。可以肯定,可疑值不是最小值就是最大值。
▲计算平均值 x- 和标准差 s:x- = ;标准差 s= 。计算时,必须将所有
10 个数据全部包含在内。
(x
x) 2
s
= ;最大值与平均值之差
▲计算偏离值: 平均值与最小值之差为 -
为 - = 。
n
1
▲确定一个可疑值:比较起来,最大值与平均值之差
大于平均值与最小值
之差 ,因此认为最大值
是可疑值。
▲计算 Gi 值: Gi = ( xi - x- )/ s;其中 i 是可疑值的排列序号
——
10
号;因此10
x10- x-
)/
s=
(
-
)/
=
。由于
x
-
G = (
10
x- 是残差,而 s 是标准差,因而可认为
10 是残差与标准差的比值。下面要把计
G
算值 Gi 与格拉布斯表给出的临界值 GP( n) 比较,如果计算的 Gi 值大于表中的临界值 GP( n) ,则能判断该测量数据是异常值, 可以剔除。 但是要提醒, 临界值 GP( n) 与两个参数有关:检出水平 α ( 与置信概率 P 有关 ) 和测量次数 n ( 与自由度 f 有关)。
▲定检出水平 α :如果要求严格,检出水平 α 可以定得小一些, 例如定 α= ,那么置信概率 P= 1-α = ;如果要求不严格, α可以定得大一些,例如定 α = ,即 P= ;通常定 α = ,P= 。
▲查格拉布斯表获得临界值:根据选定的
P 值
此处为
)
和测量次数 n
此处
(
(
为 10) ,查格拉布斯表,横竖相交得临界值
G95=
。
(10)
▲比较计算值
Gi
和临界值
G95
: Gi
=
,G95
=
,Gi
>
G95
。
(10)
(10)
格拉布斯法Grubbs检验法 来自淘豆网m.daumloan.com转载请标明出处.