Simple Linear Regression.ppt


文档分类: | 页数:约31页 举报非法文档有奖
1/31
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/31
文档列表 文档介绍
简单线性回归 Simple Linear Regression
GE 公司智慧财产权声明
本文件内容属于 GE 公司智慧财产。由GE 公司授权 AVIC I 集团公司使用。并只限于AVIC I 集团内部使用。不得对外公开或使用。除非经由GE公司书面声明同意,否则不得以任何形式或方法复制本文件之全部或部分内容。倘若获得复制同意,则于复制文件之首页必须包括本声明,并于复制文件之每一页中必须包括如本页底部之授权使用说明。
目的
使用回归分析寻找潜在的X’s
使用假设检定来检定回归模式的代表性(p 值)
评定X’s能解释多少%的Y(的变化)
得到一个线性方程式–解释X和Y的关系
线性回归–量化关系
离洞口距离
进洞率
平均=56%
对这些数据你能得到什么结论?
回归线
平均=56%
总变异
Error
实际值
距离总
和最小
回归方程:
a –斜率
b –截距
e –误差或残差
回归估计变异
先做散点图
二次回归
线性回归
可能的线性回归
不知
分层
放大比例
如果X对Y无影响
Putt Length
% Made
1
98
2
95
3
90
4
88
5
80
6
75
7
60
8
62
9
40
10
42
11
30
12
25
13
24
14
20
15
18
Y= a X + b
0
如果无论离球洞距离x有多远,都不影响进洞率Y:
数学表达:斜率趋近0
图示表达:回归线是水平线
统计表达:任何X下Y的结果都是平均值 Y(X)=Y
直观表达:X对Y没有影响
Minitab 输出
The regression equation is
% Made = 109 - Putt Length
Predictor Coef SE Coef T P
Constant
Putt Len - -
S = R-Sq = % R-Sq(adj) = %
Analysis of Variance
Source DF SS MS F P
Regression 1 11934 11934
Residual Error 13 370 28
Total 14 12304
Regression Analysis: % Made versus Putt Length
斜率a
,
故斜率不是0
回归方程
Ho:斜率=0
Ha:斜率=0
p值指出回归线是否存在
“噪音”数据
能画出一条线吗?
斜率存在吗?
似乎成本cost与收益profit没有关系–实际上有相关吗?
回归的p值意味什么?
成本与收益的散点图
注:“噪音”意思是X与Y没有明显的
直接相关性–有“噪音”介入
如果你的数据不符道理,那么找项目的专家咨询或收集更多数据
用统计来证明
The regression equation is
PROFIT = 281 - COST
Predictor Coef SE Coef T P
Constant
COST - -
S = R-Sq = % R-Sq(adj) = %
Analysis of Variance
Source DF SS MS F P
Regression 1 3270 3270
Residual Error 20 661244 33062
Total 21 664514
成本与收益的散点图
,
故斜率不存在
,
故回归方程式不存在
收集更多数据来支持
增加100点数据。
现在斜率存在吗?有线性相关吗?
根据成本cost可预测收益profit吗?
线性关系好像存在–但是仍然有“噪音”(给定X不能预测Y)
成本与收益的散点图

Simple Linear Regression 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数31
  • 收藏数0 收藏
  • 顶次数0
  • 上传人mh900965
  • 文件大小1.27 MB
  • 时间2018-04-05