Logistic 回归分析
前言
Logistic回归模型的基本思想
Logistic回归模型的参数估计
基本原理
多元线性回归模型:
其中是截距, 是参数向量,X是自变量向量。表示n个自变量x与反应变量Y间的关系,Y为任意实数,属于连续变量
当反应变量为离散型变量时,如研究不同治疗方法对某病治疗的效果,反应变量疗效Y的值为1(治愈)和0(未愈),要研究的是某种事件(如治愈)发生的可能与自变量(治疗方法)的关系,反应变量为事件发生的概率P(Y=1)。
发生比(odds ratio)
对概率进行转换,可建立线性回归模型
该转换称为logit转换。P为事件发生的概率,1-P为事件不发生的概率
一个人在家是否害怕生人来
用p(x)表示一个人文化程度是x时,害怕生人的概率,考虑模型
自变量(x)
不害怕(Y=0)
害怕(Y=1)
文盲(0)
11
7
小学(1)
45
32
中学(2)
664
422
大专以上(3)
168
72
模型中参数估计的方法
极大似然估计
加权最小二乘估计
极大似然估计
设x可以取值x1,x2……xk。x=xi时,Y的取值为yi(yi=0或1);
显然
似然函数
对数似然
加权最小二乘
设x可以取值x1,x2……xk。x=xi时,Y的取值为yi(yi=0或1);
如果模型正确
观测模型
其中
权系数
回归模型
SPSS
回归分析-Logistic回归 来自淘豆网m.daumloan.com转载请标明出处.