下载此文档

分析线性回归,logistic回归和一般回归【参考】.docx


文档分类:IT计算机 | 页数:约9页 举报非法文档有奖
1/9
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/9 下载此文档
文档列表 文档介绍
1 摘要本报告是在学习斯坦福大学机器学习课程前四节加上配套的讲义后的总结与认识。前四节主要讲述了回归问题,回归属于有监督学习中的一种方法。该方法的核心思想是从连续型统计数据中得到数学模型,然后将该数学模型用于预测或者分类。该方法处理的数据可以是多维的。讲义最初介绍了一个基本问题,然后引出了线性回归的解决方法,然后针对误差问题做了概率解释。之后介绍了 logistic 回归。最后上升到理论层次,提出了一般回归。 2 问题引入假设有一个房屋销售的数据如下: 面积(m^2) 销售价钱(万元) 123 250 150 320 87 160 102 220 ……这个表类似于北京 5 环左右的房屋价钱,我们可以做出一个图, x 轴是房屋的面积。 y 轴是房屋的售价,如下: 如果来了一个新的面积,假设在销售价钱的记录中没有的,我们怎么办呢? 我们可以用一条曲线去尽量准的拟合这些数据,然后如果有新的输入过来,我们可以在将曲线上这个点对应的值返回。如果用一条直线去拟合,可能是下面的样子: 绿色的点就是我们想要预测的点。首先给出一些概念和常用的符号。房屋销售记录表: 训练集(training set) 或者训练数据(training data), 是我们流程中的输入数据,一般称为 x 房屋销售价钱:输出数据,一般称为 y 拟合的函数(或者称为假设或者模型) :一般写做 y= h(x) 训练数据的条目数(#training set), :一条训练数据是由一对输入数据和输出数据组成的输入数据的维度 n( 特征的个数, #features) 这个例子的特征是两维的,结果是一维的。然而回归方法能够解决特征多维,结果是一维多离散值或一维连续值的问题。 3 学习过程下面是一个典型的机器学习的过程,首先给出一个输入数据,我们的算法会通过一系列的过程得到一个估计的函数,这个函数有能力对没有见过的新数据给出一个新的估计,也被称为构建一个模型。就如同上面的线性回归函数。 4 线性回归线性回归假设特征和结果满足线性关系。其实线性关系的表达能力非常强大,每个特征对结果的影响强弱可以由前面的参数体现,而且每个特征变量可以首先映射到一个函数, 然后再参与线性计算。这样就可以表达特征与结果之间的非线性关系。我们用 X1 , X2..Xn 去描述 feature 里面的分量,比如 x1= 房间的面积, x2= 房间的朝向,等等,我们可以做出一个估计函数: θ在这儿称为参数,在这的意思是调整 feature 中每个分量的影响力,就是到底是房屋的面积更重要还是房屋的地段更重要。为了如果我们令 X0 =1 ,就可以用向量的方式来表示了: 我们程序也需要一个机制去评估我们θ是否比较好,所以说需要对我们做出的 h 函数进行评估,一般这个函数称为损失函数( loss function )或者错误函数(error function) ,描述 h 函数不好的程度,在下面,我们称这个函数为 J 函数在这儿我们可以认为错误函数如下: 这个错误估计函数是去对 x(i) 的估计值与真实值 y(i) 差的平方和作为错误估计函数,前面乘上的 1/2 是为了在求导的时候,这个系数就不见了。至于为何选择平方和作为错误估计函数,讲义后面从概率分布的角度讲解了该公式的来源。如何调整θ以使得 J(θ) 取得最小值有很多方法,其中有最小二乘

分析线性回归,logistic回归和一般回归【参考】 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数9
  • 收藏数0 收藏
  • 顶次数0
  • 上传人1017848967
  • 文件大小0 KB
  • 时间2016-06-05
最近更新