分类号:O213 密级:公开
专 业 学 位 研 究 生 学 位 论 文
论文题目(中文) Adaboost算法的改进及应用
论文题目(外文) The improvement and application of Adaboost algorithm
研 究 生 姓 名 张 贞 贞
学 科、 专业 数学 ∙ 应用统计
研 究 方 向 数据挖掘
学 位 级 别 硕 士
导师姓名、职称 陈进源 讲师
论 文 工 作
起 止 年 月 2016 年 2 月 至 2017 年 3 月
论文提交日期 2017 年 4 月
论文答辩日期 2017 年 5 月
学位授予日期
校 址: 甘 肃 省 兰 州 市
Adaboost算法的改进及应用
中文摘要
Adaboost算法主要用于处理分类问题和回归问题, Adaboost算法的核心是
将迭代生成的基分类器通过加权组合的方式生成强分类器. 与我们接触较多的
其他类机器学习算法相比, Adaboost算法能有效的避免过拟合的问题. 本文主要
将Adaboost算法用于分类问题. 在经典的Adaboost算法中, 基分类器的权重是通
过基分类器对训练子集分类的错误率计算得来的, 并被赋予固定的的权重, 即生
成的最终分类是唯一的. 当测试样本与训练样本存在一定的偏差时, 训练出的强
分类器有可能就不具有很好的泛化能力, 导致最终的分类结果不能达到我们的预
期效果. 本文提出了基于不同的测试样本生成不同的强分类器的想法. 主要思想
是, 先将训练集通过K-means++算法聚类分组, 再通过欧氏距离计算测试样本与
各组的相似度, 并通过错误率计算出各个基分类器对各组的权重, 最后 结合相似
度和权重, 加权组合生成最终的强分类器. 本文选取2组数据集进行实证分析, 最
终得出, 改进后 的Adaboost算法比经典的Adaboost算法分类效果更好.
关键词: Adaboost算法; K-means++算法; DY-Adaboost 算法; 动态; 聚类
I
The improvement and application of Adaboost algorithm
Abstract
The Adaboost algorithm is mainly used to deal with classification problems
and regression problems. The core of the Adaboost algorithm is using the base
classifiers with iterative procedures to generate a strong classifier by usingthe
weighted combination. Compared with other machine learning algorithms that
we have known, the
adaboost算法的改进及应用 来自淘豆网m.daumloan.com转载请标明出处.