评分卡开发流程文档
一、数据集切分
将数据集按照70%与30%比率切分为训练集和测试集两部分;
二、分别对训练集与测试集进行数据预办理
衍生变量:进行衍生的变量
1)未销户信用卡上述步骤筛选获得的变量,建立逻辑回归方程;
2、采用后向逐步回归,经过剔除逻辑回归方程P值最不显着的变量(P值<),重复
以上步骤,直到所有变量均显着,或许最后没有可剔除变量。
3、最后获得的逻辑回归方程即为所训练的最终模型。
4、经过计算KS、AR指标评估模型;
训练集KSandARforthescorecardinthetestdatasetare57%and45%
变量
类型
WOE
Intercept
Cofficient
WOE*Coff+
Offset
Score
Factor
Intercep/11
性别
女
性别
男
最高学历
初中及以下
最高学历
大专
最高学历
高中
最高学历
本科及缺失及硕士及以上
婚姻状况
已婚已育
婚姻状况
未婚
婚姻状况
其他及离异
婚姻状况
已婚未育及缺失
现住房情况
其他
现住房情况
缺失
自购现有贷款及共同拥有或与父亲母亲
现住房情况
同住及小产权
宅基地房及与父亲母亲同住及自有及租
现住房情况
借或公司所有及多套自有
现住房情况
自购现无贷款及租房
单位性质
国有公司
单位性质
微型公司
单位性质
政府机关
单位性质
民营公司
单位性质
缺失
本人查问次数统计_Bin
Bin0
<=2
本人查问次数统计_Bin
Bin1
<=3
本人查问次数统计_Bin
Bin2
<=4
本人查问次数统计_Bin
Bin3
>4
近6个月累计查问次数
_Bin
Bin0
<=8
近6个月累计查问次数
_Bin
Bin1
<=11
近6个月累计查问次数
_Bin
Bin2
<=15
近6个月累计查问次数
_Bin
Bin3
>15
正在使用的信用卡超额
Bin0
<=9
信用评分卡开发流程报告 来自淘豆网m.daumloan.com转载请标明出处.