基础--综合--能力--创新
1
统计案例
:
㈠回归分析的定义:我们知道,函数关系是一种确定性关系,而相关关系是一种非确定性关系。回归分析就是对具有相关关系的两个变量进行统计分析的一种常用关系。
相关程度越强;⑶的越接近于0,线性相关程度越弱
2)相关性检验的步骤:
作统计假设:与不具有线性相关关系;
;
根据样本相关系数公式计算出的值;
做统计推断:如果,这是表明有的把握认为:与具有线性相关关系;
如果,这是表明假设成立,认为:与不具有线性相关关系,所求的回归直线方程是毫无意义的。
:
㈠不同的“值”表示个体所属不同类别,这样的变量叫做分类变量。
㈡列联表:列出两个分类变量的频数表称为列联表。常用等高条形图展示列联表数据的频率特征。
㈢两个事件独立的含义:如果事件与的发生彼此互不影响,或者影响可以忽略不计,就可以认为事件与是相互独立的。把相互独立事件与同时发生,记做“”,那么其概率为:
。
还有其它的公式:;;
㈣独立性检验:
利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验。
反证法原理与独立性检验原理的比较
基础--综合--能力--创新
5
反证法原理
在假设H0下,如果推出一个矛盾,就证明了H0不成立
独立性检验原理
在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超过这个小概率
一般地,假设有两个分类变量X和Y,它们取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
(事件)的取值y1
(事件)的取值y2
总计
(事件)的取值x1
a
b
a+b
(事件)的取值x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
假设H0: X与Y没有关系,即X与Y独立。
则有P(XY)=P(X)P(Y) ;
根据频率近似于概率,故有
aa+b+c+d≈a+ba+b+c+d×a+ca+b+c+d
化简得 ad≈bc
因此,|ad-bc|越小,两者关系越弱;|ad-bc|越大,两者关系越强;
基于以上分析,构造随机变量
K2=n(ad-bc)2a+bc+da+c(b+d),其中n=a+b+c+d为样本容量
K2的值越小则关系越小,K2的值越大则关系越大。(实际应用中通常要求a,b,c,d都不小于5)
计算K2的观测值k并与K2作比较。
统计学研究发现,在H0成立的情况下,
PK2≥=
即在H0成立的情况下,,,是一个小概率事件。
,则有理由判定H0不成立,即“X与Y有关系”。但这种判断会犯错误, .
*(这里概率计算的前提是H0成立,即H0:两个分类变量没有关系)
若要推断的论述为H1:“X与Y有关系”。可以通过频率直观地判断两个条件概率P(Y=y1|X=x1)和P(Y=y1|X=x2)是否相等。如果判断它们相等,就意味着X和Y没有关系;否则就认为它们有关系。由上表可知,在X=x1的情况
128《统计案例》知识点总结 来自淘豆网m.daumloan.com转载请标明出处.