下载此文档

统计学bootstrap学习教案.pptx


文档分类:高等教育 | 页数:约56页 举报非法文档有奖
1/56
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/56 下载此文档
文档列表 文档介绍
会计学
1
统计学bootstrap
第一页,共56页。
2
本节课内容(nèiróng)
重采样(cǎi yànɡ)技术(resampling)
Bootstrap
刀切法(jackknife)
第1页/共55页
第二页,共56页。
3
引言(yǐnyán)
是一个统计量,或者是数据的某个函数,数据来自某个未知的分布F,我们想知道 的某些性质(如偏差、方差和置信区间)
假设我们想知道 的方差
如果 的形式比较简单,可以直接用上节课学习(xuéxí)的嵌入式估计量 作为 的估计
例: ,则
,其中
,其中
问题:若 的形式很复杂(任意统计量),如何计算/估计?
第2页/共55页
第三页,共56页。
4
Bootstrap简介(jiǎn jiè)
Bootstrap是一个很通用的工具,用来估计标准误差、置信区间和偏差。由Bradley Efron于1979年提出,用于计算任意估计的标准误差
术语“Bootstrap”来自短语“to pull oneself up by one’s bootstraps” (源自西方神话故事“ The Adventures of Baron Munchausen”,男爵掉到了深湖底,没有工具,所以他想到了拎着鞋带将自己提起来)
计算机的引导程序(chéngxù)boot也来源于此
意义:不靠外界力量,而靠自身提升自己的性能,翻译为自助/自举
1980年代很流行,因为计算机被引入统计实践中来
第3页/共55页
第四页,共56页。
5
Bootstrap简介(jiǎn jiè)
Bootstrap:利用计算机手段(shǒuduàn)进行重采样
一种基于数据的模拟(simulation)方法,用于统计推断。基本思想是:利用样本数据计算统计量和估计样本分布,而不对模型做任何假设(非参数bootstrap)
无需标准误差的理论计算,因此不关心估计的数学形式有多复杂
Bootstrap有两种形式:非参数bootstrap和参数化的bootstrap,但基本思想都是模拟
第4页/共55页
第五页,共56页。
6
重采样(cǎi yànɡ)
通过从原始数据 进行n次有放回采样n个数据,得到bootstrap样本(yàngběn)
对原始数据进行有放回的随机采样,抽取的样本(yàngběn)数目同原始样本(yàngběn)数目一样
如:若原始样本(yàngběn)为
则bootstrap样本(yàngběn)可能为

第5页/共55页
第六页,共56页。
7
计算(jì suàn)bootstrap样本
重复B次,
1. 随机选择整数 ,每个整数的取值范围为[1, n],选择每个[1, n]之间的整数的概率相等,均为
2. 计算(jì suàn)bootstrap样本为:
Web上有matlab代码:
BOOTSTRAP MATLAB TOOLBOX, by Abdelhak M. Zoubir and D. Robert Iskander,
Matlab函数:bootstrp
第6页/共55页
第七页,共56页。
8
Bootstrap样本(yàngběn)
在一次bootstrap采样中,某些原始样本可能没被采到,另外一些样本可能被采样多次
在一个bootstrap样本集中不包含某个原始样本 的概率为
一个bootstrap样本集包含了大约(dàyuē)原始样本集的1- = ,另外的样本没有包括
第7页/共55页
第八页,共56页。
9
模拟(mónǐ)
假设(jiǎshè)我们从 的分布 中抽取IID样本 ,当 时,根据大数定律,
也就是说,如果我们从 中抽取大量样本,我们可以用样本均值 来近似
当样本数目B足够大时,样本均值 与期望 之间的差别可以忽略不计
第8页/共55页
第九页,共56页。
10
模拟(mónǐ)
更一般地,对任意均值有限的函数h,当 有
则当 时,有

统计学bootstrap学习教案 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数56
  • 收藏数0 收藏
  • 顶次数0
  • 上传人wz_198613
  • 文件大小736 KB
  • 时间2022-01-04
最近更新