生物医学数据挖掘
上海交通大学基础医学院
生物医学工程学科, 计算机教研室
2011年
回顾
第二章数据采集与准备
1. 目的
2. 数据的分布状态
3. 数据清洗
4. 数据变换
5. 样本数据的选择
第三章回归分析
\目的
\模型
@
线性回归
定量关系式
残差最小准则
回归系数
@
数据转换在回归方程中的使用
线性
非线性
@
分类型变量在回归方程中如何使用?
有序?
值的大小有意义?
数值增量间距?
哑变量(1/0)
dummy variable
@
讨论
分析胃癌患者原发肿瘤的部位及大小与预后(五年生存)的关系
@
第三章回归分析
\目的
\模型
@
Logistic回归示例
例:预期目标是:确定采用新型通讯服务与教育、居住稳定性和收入的关系。
表中的数据是由美国AT&T主导的一次抽样调查中得到的。(说明:表中数据分母—实际采样总人数,分子—选择“采用”的人数)
@
设:Y=1(选择“采用”)
Y=0(选择“不采用”)
则:Logistic回归模型表达式为:
其中,
β0β1 ,...,βk是未知常数,和多元线性回归模型相似
X1----教育,X1=0:高中以下,X1=1:大学以上
X2----居住稳定性,X2=0:在过去5年中没有变化,
X2=1:在过去5年有变化
X3----收入,X3=0:收入低,X3=1:收入高
@
数据转换
在(X1,X2,X3)特定组合的条件下,Y=1(采用)的概率
@
04 回归分析 来自淘豆网m.daumloan.com转载请标明出处.