第卷第期计算机技术与发展. .
年月.
基于的集成分类器
在电信增值业务中的应用
郝维来,郑同山
黑龙江科技学院计算机学院,黑龙江哈尔滨
摘要:为了解决数据挖掘技术较难有效地在电信行业挖掘出潜在增值业务用户的问题,针对当前单分类器分类精度低
这一不足,提出一个基于神经网络与结合的集成分类器模型。选用神经网络作为基分类器,通过—
算法进行轮迭代,每次迭代增加错分样本的权重,最终通过投票产生强分类器。通过对中国电信某地市用户消费
数据进行实例仿真,证明该模型能有效地提升分类精确度,分类精度达到.% ,并且拥有不错的鲁棒性,为以后的研究
工作提供了新的研究思路。
关键词:;数据挖掘;神经网络;集成分类器
中图分类号: 文献标识码: 文章编号:———
—, —
,,,
:’,
’
., , .
’,,,,—
.
:; ;;
引言问题。此外,回归、决策树和贝叶斯网络等方
电信客户消费行为分析是数据挖掘技术在电信行法也进行了不同深度的尝试。但是这些研究模型
业应用中的重要分支,其目的是通过对用户历史消费均为单分类器,由于算法本身或者数据集的问题,预测
话单中的结构性数据如地区、通话时间、短信费、在线精度往往难以提高。反之,基于算法的集成
时间等数据,通过数学建模后进行统计分析和预测,从分类器,已经结合各种单分类器算法,在手写体字符识
而挖掘出有潜在用户,进而为电信运营商的经营决策别、文本过滤、医疗诊断等各领域都取得了不俗
提供理论依据。的成绩。鉴于此,文中结合神经网络和
目前对电信行业客户消费行为分析问题的研究较算法,建立了一个基于组合分类器的电信客
为广泛,其中大部分研究都采用模式识别的方法,利户消费行为预测模型,通过该模型,提高了预测准确
用统计分析和数据挖掘中的分类算法来建立客户消费率,从而为电信运营商提供有力的决策支持。
行为模型。在各种分类算法中,人工神经网络的运用
较为广泛。人工神经网络学习规则简单,分类准确率算法简介
高,非线性拟合能力强,十分适合客户消费行为预测
在年首次提出—
学习模型川,它是一种提高任意
收稿日期:——;修回日期:—
给定学习算法精度的方法,算法思想正是源
基金项目:黑龙江省青年学术骨干教师资助项目
于该模型。在论文中,还首次提出了强学习算
作者简介:郝维来一,男,博士,副教授,研究方向为控制理论
和摔制工程、数据挖掘。法和弱学习算法的概念,即:如果一个学习算法通过对
· · 计算机技术与发展第卷
一组样本的学习,能达到很高的识别准确率并能在多块。后者又包含,生成器和生成强分类器的“投票委
项式时间内完成,则称为强学习算法;反之,如果识别员会”。
率仅好于随机猜测,则称为弱学习算法。此外,该论文
提出了学习模型中等价性问题:即任意给定仅比
随机猜测略好的弱学习算法,是否可以将其提升为强
学习算法年,.提出的.
算法证明了该问题的确定性,但是该算法存在一
个缺陷:必须知道弱分类算法的预测精确率的下限。
年,
算法,相对于算法,该算法运行效率
与持平,并且克服了算法的缺陷,
使得实用性极大提
基于AdaBoost 的集成分类器在电信增值业务中的应用 来自淘豆网m.daumloan.com转载请标明出处.