SPSS-回归分析
可爱卡通创意手绘通用PPT幻灯片演讲
曲线估计(Curve Estimation)
对于一元回归,若散点图的趋势不呈线性分布,可以利用曲线估计方便地进行线性拟合(liner)、二次拟合(Quadrat较哪个大,结果是指数模型Compound的Adjusted R2=(拟合情况可见图形窗口), 结果方程为:mpg=*
说明:Growth和Exponential的结果也相同,也一样。
(Binary Logistic)
在现实中,经常需要判断一些事情是否将要发生,候选人是否会当选?为什么一些人易患冠心病?为什么一些人的生意会获得成功?此问题的特点是因变量只有两个值,不发生(0)和发生(1)。这就要求建立的模型必须因变量的取值范围在0~1之间。
Logistic回归模型
Logistic模型:在逻辑回归中,可以直接预测观测量相对于某一事件的发生概率。包含一个自变量的回归模型和多个自变量的回归模型公式:
其中: z=B0+B1X1+…BpXp(P为自变量个数)。某一事件不发生的概率为Prob(no event)=1-Prob(event) 。因此最主要的是求B0,B1,…Bp(常数和系数)
数据要求:因变量应具有二分特点。自变量可以是分类变量和定距变量。如果自变量是分类变量应为二分变量或被重新编码为指示变量。指示变量有两种编码方式。
回归系数:几率和概率的区别。几率=发生的概率/不发生的概率。如从52张桥牌中抽出一张A的几率为(4/52)/(48/52)=1/12,而其概率值为4/52=1/13
根据回归系数表,可以写出回归模型公式中的z。然后根据回归模型公式Prob(event) 进行预测。
(Binary Logistic)实例
实例P255 Data11-02 :乳腺癌患者的数据进行分析,变量为:年龄age,患病时间time,肿瘤扩散等级pathscat(3种), 肿瘤大小pathsize, 肿瘤史histgrad(3种)和癌变部位的淋巴结是否含有癌细胞ln_yesno,建立一个模型,对癌变部位的淋巴结是否含有癌细胞ln_yesno的情况进行预测。
Analyze->Regression-> Binary Logistic
Dependent: ln_yesno
Covariates: age, time,pathscat,pathsize, histgrad
比较有用的结果:在Variables in Equation表中的各变量的系数(B),可以写出z=--+ –+。
根据回归模型公式Prob(event)=1/(1+e-z),就可以计算一名年龄为60岁、pathsize为1、histgrad为1、pathscat为1的患者,其淋巴结中发现癌细胞的概率为1/(1+e-(-))=
(Prob(event) < 预测事件将不会发生, > 预测事件将会发生)
补充:回归分析
以下的讲义是吴喜之教授有关回归分析的讲义,很简单,但很实用
定量变量的线性回归分析
对例1()的两个变量的数据进行线性回归,就是要找到一条直线来最好地代表散点图中的那些点。
检验问题等
对于系数b1=0的检验
对于拟合的F检验
R2(决定系数)及修正的R2.
多个自变量的回归
如何解释拟合直线?
什么是逐步回归方法?
自变量中有定性变量的回归
例1()的数据中,还有一个自变量是定性变量“收入”,以虚拟变量或哑元(dummy variable)的方式出现;这里收入的“低”,“中”,“高”,用1,2,,如果要用这种哑元进行前面回归就没有道理了.
以例1数据为例,可以用下面的模型来描述:
自变量中有定性变量的回归
现在只要估计b0, b1,和a1, a2, a3即可。
哑元的各个参数a1, a2, a3本身只有相对意义,无法三个都估计,只能够在有约束条件下才能够得到估计。
约束条件可以有很多选择,一种默认的条件是把一个参数设为0,比如a3=0,这样和它有相对意义的a1和a2就可以估计出来了。
对于例1,对b0, b1, a1, a2, , , -, -, 0。这时的拟合直线有三条,对三种家庭收入各有一条:
SPSS实现()
Analize-General li
SPSS-回归分析 来自淘豆网m.daumloan.com转载请标明出处.