... ... 本科生毕业论文(设计) 题目基于代价敏感学习的客户流失预测模型研究学院工商管理学院专业管理科学学生姓名沈冰洁学号 0844021034 年级 08级指导教师肖进... ... 基于代价敏感的客户流失率预测模型研究专业:管理科学学生:沈冰洁指导老师:肖进摘要随着竞争日渐激烈,企业的同类化和产品的同质化都日趋严重,客户分流的现象日趋明显,最直接的影响就是客户流失率的大幅攀升,如何将客户流失率控制在一个稳定的范围内,成为企业关注的一个热点话题。过去已有多种分类模型对客户流失率进行预测,这些传统的分类模型均基于分类精度,即目标函数为分类精度最小化,忽略了分类代价不一致这一因素,因此造成很大分类代价,为了解决这一问题,本文在已有模型的算法和基础上进行改进,通过引入误分代价因子,从而使模型代价敏感,代价敏感模型不再仅仅基于分类精度最优,同时也是分类代价最低。完成模型的改进后,结合实例数据样本,对BP神经网络和代价敏感 BP神经网络以及支持向量机( SVM )的分类结果进行了对比,实验结果表明,引入误分代价因子之后,模型的分类精度得到了有效提高。关键词: 代价敏感客户流失率预测 BP神经网络 MATLAB 数据挖掘... ... 1绪论 选题目的及意义客户关系管理( Customer Relationship Management, CRM )已经被先进企业所关注,所谓以民为本的思想不仅在治国上是上策,同样适用于企业的企业文化和企业凝聚力的构建,因此,在这个竞争激烈的时代,以客户为中心的经营理念已经成为企业获得优良可持续竞争力的一个重要手段。 Jones 和 Sasser 对美国 9 个行业的客户保持情况进行了调查:客户保持率每增加 5% ,行业平均利润增加幅度在 25% ~ 85% 之间。 Bhattacharya 调查指出,发展一个新客户是保留一个老客户所花费代价的 5~6倍,而保持现有客户比获取新客户一般可节约代价 4~ 6倍,减少客户流失对企业利润有着惊人的影响[1] 。近年来,在客户流失率预测上,在数据挖掘这一板块的研究越来越得到广大学者的重视,随着竞争的不断白热化,单是注重实体产品的服务和本身质量提升已经不能满足这个同质化严重的产品市场,因此最优秀的企业通常是以出售产品附加价值为主导方向,而区别于产品的核心价值,附加价值最终受益和讨好的对象是客户,客户满意度直接关系到企业的市场份额的占有以及是否有实力长期占有。同样,除了盈利之外, 降低成本或者说是成本控制也是企业利益最大化的一个必要手段,面对同质产品的竞争企业,在规模、地域均差别不大的情况下,产品本身成本也是相差无几的,这样一来,一些隐性成本将成为影响利润的关键因素, 其中客户流失率引发的成本是一个占比较大的影响因素,因此,对于目前企业来说,对于客户流失率都十分的重视。由此可见客户流失对企业来说损失是非常大的,由此也引起了国内外的研究者的兴趣,在众多的研究手段中有一种是基于数据挖掘,对潜在客户流失进行预测,便于对企业今后的战略发展做出一定的指导和方向性建议。这类研究主要是利用数据挖掘,对现有数据进行分类,得到客户的流失倾向, 目前常见的分类方法有支持向量机( Support Vector Machine, SVM )、人工神经网络( Artificial work, ANN )、决策树( Decision Tree, DT )、 Logistic 回归( Logistic Regression )和贝叶斯网络( work, BN )等,并且今年来这些分类器均在电信行业、电子商务、银行信用卡业务和人寿保险纠纷上应用广泛, ... ... 其成效也是较为优秀可观的。但是任何一种方法总是有缺陷的,对于以上几种分类器来说,对于其不能对不同代价产生敏感反应这一缺陷,如今是研究的热门, 本文即针对这一热点讨论问题。对于不同客户代价,我们在对其进行挽留的过程中所要付出的成本是不同的,在此基础上以往的分类器模型就不再使用了,以往的分类模型最终均为基于模型运行的精度,即分类的准确性将是评价模型优劣的一个标准,但是在实际案例中,数据往往存在一个不平衡的问题,分类准确性不再是评价一个模型的最好标准,因此,本文中引入代价敏感这一概念对分类器模型进行优化,在原有方法和模型上进行了一个初步的研究和尝试性学习,相信在经过不断并且深入的学习和试验之后,在客户流失率这一方面将的到更加精确的预测模型,为企业的客户关系管理做出更大的帮助。 国内外研究现状目前的情况看来已经有很多方法研究分类模型,对传统模型的优化也有很多种,但是正如前面提及的一样,多数模型都是建立在代价一致对的前提下,在实际问题中,这种传统模型通常会带来很大分类错误成本。代价本身分类很多,主要考虑的有以下几种:
数据挖掘方法论文打包 来自淘豆网m.daumloan.com转载请标明出处.