下载此文档

Bootstrap方法统计数据质量评价研究.docx


文档分类:研究报告 | 页数:约11页 举报非法文档有奖
1/11
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/11 下载此文档
文档列表 文档介绍








页 共 11 页




  步骤1:假定为初始样本,利用Matlab中Bootstrap函数从今样本中有放回抽取m个样本,本文规定m=1000。步骤2:依据1中抽样结果,计算各自样本统计量,具体利用Matlab中mean函数计算均值统计量,即可得到1000个样本均值;步骤3:基于2中计算结果,调用log函数计算统计量的对数值;步骤4:利用QQ图及单一样本Kolmogorov-Smirnov检验3中结果是否服从正态分布,假如是,说明统计量服从对数正态分布,统计数据质量符合要求,否则,统计数据误差大,需要修正。
  二、数据收集与实证讨论
  〔一〕数据收集
  本文以山西省2000-2022年地区生产总值为讨论对象,对其进行数据质量评估。表1是山西省2000-2022年地区生产总值。
  〔二〕验证对数正态分布
  利用Bootstrp方法对2000-2022年山西省地区生产总值进行可放回的重复抽样1000次,进而得到1000个Bootstrap样本,然后依据每一个样本计算对应的均值,从而得到1000个样本均值,接着计算样本均值对数,然后通过spss绘制其对应的直方图,如图1所示。从图1可以直观的看出,统计量的对数服从正态分布,从图中只是很形象的观看出统计量对数的分布,要想进一步证明其为正态分布,还需要进行统计检验。本文使用Q-Q图检验和K-S检验两种方法对统计量对数进行正态性检验。〔1〕Q-Q图又名分位数图,通过比较实际观测数据分位数与正态分布分位数是否一致来检验数据的正态性。具体是通过做散点图,观测两列数据的分位数是否分布在参考直线上,假如是,说明被检验数据服从正态分布,否则非正态。通过SPSS中Q-Q图功能对样本统计量对数进行检验,结果如图2所示,从Q-QPlot中,各点几乎全部落在参考直线上,说明被检验数据服从正态分布。〔2〕K-S检验。在利用Bootstrp方法得到1000个样本均值对数后,为了检验样本均值对数的分布,提出原假设和备择假设,原假设为样本均值对数服从正态分布,备择假设为样本均值对数不服从正态分布。通过SPSS中的非参数检验K-S方法进行检验,输出结果如表2,从表里可以看出,K-S检验中,Kolmogorov-,P值〔双侧〕=,在给定显著性水平α=,明显P>α,所以接受原假设,说明样本均值对数服从正态分布。










  结语










  本文讨论新时代统计数据质量评价方法,利用对数正态分布来评估数据质量,鉴于讨论数据分布需要足够的样本容量,然而现实数据无法满足此要求,故采纳Bootstrap重抽样方法解决两者间矛盾。通过以山西省2000-2022年地区生产总值为讨论对象,验证采纳Bootstrap方法构造的统计量是否服从对数正态分布推断真实数据的数据质量,通过检验,结果说明山西省2000-2022年地区生产总值统计数据质量可靠。
  参考文献
  [1][R/OL].[2022–01–19].
  [2][J].统计讨论,2000〔1〕:42–45.
  [3]:anotherlookatthejackknife[J].TheAnnalsofStatistics,1979〔1〕.
  [4]白永昕,闫懋博,基于Bootstrap方法的多维统计数据质量评估[J].统计与决策,2022〔11〕:5–9.
  [5]宗威,[

Bootstrap方法统计数据质量评价研究 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数11
  • 收藏数0 收藏
  • 顶次数0
  • 上传人mama
  • 文件大小31 KB
  • 时间2022-02-07
最近更新