下载此文档

机器学习复习总结.docx

文档分类：幼儿/小学教育 | 页数：约7页举报非法文档有奖

1/7

下载提示

1.该资料是网友上传的，本站提供全文预览，预览什么样，下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档，不会出现我们的网址水印。

同意并开始全文预览

(约 1-6 秒)

1/7 下载此文档

文档列表 文档介绍

第一章基本设计方法和学习途径选择训练经验选择目标函数选择目标函数的表示选择函数逼近算法最终设计选择训练经验第一个关键属性，训练经验能否为系统的决策提供直接或间接的反馈第二个重要属性，学习器在多大程度上控制样例序列第三个重些规则来分类后来的实例
第四章
解决反向传播算法中的过度拟合问题的方法：
权值衰减
■它在每次迭代过程中以某个小因子降低每个权值，这等效于修改E的定义，加入一个与网络权值的总量相应的惩罚项，此方法的动机是保持权值较小，从而使学习过程向着复杂决策面的反方向偏置
验证数据
■ 一个最成功的方法是在训练数据外再为算法提供一套验证数据，应该使用在验证集合上产生最小误差的迭代次数，不是总能明显地确定验证集合何时达到最小误差
k-fold 交叉方法
把训练样例分成 k 份，然后进行 k 次交叉验证过程，每次使用不同的一份作为验证集合，其余 k-1 份合并作为训练集合。
每个样例会在一次实验中被用作验证样例，在k-1次实验中被用作训练样例每次实验中，使用上面讨论的交叉验证过程来决定在验证集合上取得最佳性能的迭代次数，然后计算这些迭代次数的均值 _
最后，运行一次反向传播算法，训练所有m个实例并迭代i次
前馈网络的表征能力布尔函数：任何布尔函数可以被具有两层单元的网络准确表示，尽管在最坏情况下所需隐藏单元的数量随着网络输入数量的增加成指数级增长。
连续函数：每个有界的连续函数可以由一个两层的网络以任意小的误差逼近。这个结论适用于在隐藏层使用 sigmoid 单元、在输出层使用（非阈值）线性单元的网络。所需的隐藏单元数量依赖于要逼近的函数。
任意函数:任意函数可以被一个有三层单元的网络以任意精度逼近。两个隐藏层使用sigmoid 单元，输出层使用线性单元，每层所需单元数不确定。
第五章
error (h)(l — error (h)) error (h) 土 z s s
s n n
G8%
00%
03%
08%
00%

1 00
1 .28

1 .96
2,33
2,58
对有限数据样本集的采样方法
k-fold 方法
随机抽取至少有 30 个样例的测试集合，剩余样例组成训练集合，重复这一过程直到足够的次数
随机方法的好处是能够重复无数次，以减少置信区间到需要的宽度
k-fold 方法受限于样例的总数
随机方法的缺点是，测试集合不再被看作是从基准实例分布中独立抽取
k-fold交叉验证生成的测试集合是独立的，因为一个实例只在测试集合中出现一次
概括而言，统计学模型在数据有限时很少能完美地匹配学习算法验证中的所有约束。然而，它们确实提供了近似的置信区间
贝叶斯学习方法的特性
口观察到的每个训练样例可以增量地降低或升高某假设的估计概率
口先验知识可以与观察数据一起决定假设的最终概率
■每个候选假设的先验概率
■每个可能假设在可观察数据上的概率分布
口贝叶斯方法可允许假设做出不确定性的预测
口新的实例分类可由多个假设一起做出预测，用它们的概率来加权
口即使在贝叶斯方法计算复杂度较高时，它们仍可作为一个最优的决策标准衡量其他方法
一致学习器定义：如果某个学习器输出的假设在

机器学习复习总结来自淘豆网m.daumloan.com转载请标明出处.