计算中心
Logistic回归分析
对于用属性变量Y表示的特性,例如节目是否受欢迎,产品是否被接受,信用卡是否被欺诈等,描述这一特性发生与否的统计特征是它发生的可能性大小,即概率。这一可能性本身也受其他因素的影响。因而也希望用一些自变量来说明和预测所关心的特性发生的可能性大小。
当Y是连续变量时,可用方差分析和回归分析处理;当Y时属性变量时,则用Logistic回归分析处理。
计算中心
Logistic回归分析
拟合Logistic回归模型不采用通常的最小二乘法,而是采用最大似然法。对于拟合的结果,检验模型或参数的显著性,也不是使用线性模型中的方差分析方法,而是使用与最大似然估计法相联系的卡方(2)统计量进行检验。原假设是模型无显著影响或回归系数全为零。
计算中心
Logistic回归分析
描述属性变量Y所表示的某一特征发生的可能性大小(即概率p),也希望用一些自变量x1, x2,...来说明和预测。特别是两值问题(Y=0表示某事件A不发生,Y=1表示发生):记
P{Y=1}=p
p的取值在0与1之间变化,所以简单地将概率p表示为自变量x1, x2,....的线性函数是不合适的。
计算中心
Logistic回归分析
概率p作一变换f(p)
假设在自变量x1,x2,…xn作用下,某事件发生的概率为p,则该事件不发生的概率为1-p,p/(1-p)为发生概率和不发生概率之比,称为“优势比”(odds),若对odds取自然对数,得到:
Logistic回归模型:
Logit(p)=ln(p/(1-p))=β0+β1x1+β2x2+βnxn
Y=Logit(p) 的图形如下
(随p由0变到1,Y的值由-∞单调上升到∞)
计算中心
Logistic回归分析
计算中心
Logistic回归分析
:
logit(p)=β0+β1x
或
计算中心
Logistic回归分析
一般地,拟合回归模型时,是要建立属性变量(因变量),,引入k-1个标识变量zi(i=1,...,k-1)
zi = 1 , 当x取第i种状态,
zi = 0 , 其它.
(i =1,…,k-1).
例
(gender:0=男和1=女),顾客的年龄(AGE),顾客的年收入(e:1=低,2=中和3=高)和购买价值(PURCHASE:0=小于100元,1=大于等于100元),共记录了431位顾客的资料,数据集为sales1。
计算中心
用分析家作logistic分析
统计→回归→ Logistic...。
purchase → Dependent,
sex→ Quantitative
在Logistic回归分析主窗口Dependent左边点击Model Pr{ }右侧向下箭头,并且选1;
在主窗口选Statistics键→Intervals,并选中Profile Likelihood Limits(使它左边方框打勾).
计算中心
结果分析
数据集名称:sales1
目标变量:purchase
目标变量类别数:2
映射函数:logit
观测值:431
计算中心
Logistic回归分析 来自淘豆网m.daumloan.com转载请标明出处.