下载此文档

数据分析.doc


文档分类:IT计算机 | 页数:约36页 举报非法文档有奖
1/36
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/36 下载此文档
文档列表 文档介绍
目录
1:收集的数据-----------------------------------------------------------------------第1页
2:使用的方法
:描述性统计分析过程及其总结---------------------------------------------第2页
:探索性统计分析过程及其总结--------------------------------------------第12页
:相关性统计分析过程及其总结--------------------------------------------第28页
:回归分析过程及其总结-----------------------------------------------------第31页
:因子分析过程及其总结-----------------------------------------------------第34页
:假设性检验分析过程及其总结--------------------------------------------第40页
:方差分析过程及其总结-------------------------------------------------------第52页
3:总结--------------------------------------------------------------------------------第59页
收集的数据说明:
1.我们选取的课题是城市发展现状分析,其中包含的因素包括城市、地区、房屋销售价格、经济增长、人口数目、dgp、居民消费、社会消费、人均支出等相关的数据。
2.为了使数据更有说服力以及真实性更强。我们选取的数据主要来源于国家统计局网站和社会调查网站以及经济普查网。
下面就是部分的数据截图:
使用的方法说明:
针对这些数据我们采用了相关的统计分析、相关分析、回归分析、假设检验分析、因子分析、方差分析,以来了解我国城市的发展现状。并在分析过程中选择性的截取了相关的数据结果。
以下为各个方法的数据分析:

分析:,GDP,消费指数,可支收入,零售总额的方差分别为; 61934此数据说明了人口数目,GDP,零售总额三个指标的差距较大,离散程度较高。从标准差也可以一眼就看出来此三个指标的离中趋势最大。
从频率表可以直接的看出:华东地区占的比例最大,其次为中南西南,东北和华北的比例相同为第四。但是我们可以从选取的样本中发现这样一个规律,中国的地区划分,属于华东地区的城市本来就多一些,所以他所占据的频率高也是有据可循的。
首先,对于这个问题,直方图比饼图看起来更直观,更方便。
从图我们可以直观地看出:占据最大的是华东和中南,其次是西南,东北,华北,最小的是西北。房价指数主要分布在104-110之间,分布比较均匀,标准偏差小。增长速度主要在5-15之间分布,距离平均数十相比,标准偏差较小。人口数目主要在0-700以内分布,标准偏差较大,集中分布比较明显。GDP主要分布在200-2000范围内,标准偏差较大,极差也比较大,两极化趋势比较明显。消费指数主要在100-105之间,标准偏差较小,距离均值较近。零售总额分布比较集中,主要集中在20000-40000,集中化程度较高,标准偏差较小。零售总额的分布主要集中在0-1000的范围内,离中趋势较小。总整体的分布来看,这些因素都与房价指数的分布趋势相吻合,所以我们可以初步断定这些因素与房价指数有一定的关系,但是具体关系的大小我们还需要进一步的论证。
:探索性统计分析过程及其总结
简单箱图:
分析表明:此图表明了东北、华北、华东、西北、西南和中南地区销售价格的中位数,东北地区的四分位距最小,销售价格分布更集中。出现了华东地区的46号和中南地区的24号两个高端奇异值。
分组箱图:
分析:由图可以看出,各地区的人口数目和经济增长的四分位距和中位数。上海、重庆、西安出现了高端奇异值,这说明了这些地区经济增长和人口数量和其他地区的差距拉得较大。
散点图

数据分析 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数36
  • 收藏数0 收藏
  • 顶次数0
  • 上传人关羽豆道
  • 文件大小1.70 MB
  • 时间2020-11-22
最近更新