转载
原文地址::建模手
线性回归数据(全国各地区能源消耗量与产量)来源,可点击协会博客数据挖掘栏:国泰安数据服务中心的经济研究数据库。
数据预处理包括的内容非常广泛,0
10
0
0
柴油产量
26
4
0
1
天然气产量
20
10
0
3
电力产量
30
0
.0
0
0
表2-1能源消耗量与产量数据缺失值分析
表1-1能源消耗量与产量数据缺失值分析
SPSS提供了填充缺失值的工具,点击菜单栏"”-->“",即可以使用软件提供的几种填充缺失值工具,包括序列均值,临近点中值,临近点中位数等。结合本次实习数据的具体情况,我们不使用SPSS软件提供的替换缺失值工具,主要是手动将缺失值用零值来代替。
描述性数据汇总技术用来获得数据的典型性质,我们关心数据的中心趋势和离中趋势,根据这些统计值,可以初步得到数据的噪声和离群点。中心趋势的量度值包括:均值(mean),中位数(median),众数(mode)等。离中趋势量度包括四分位数(quartiles),方差(variance)等。
SPSS提供了详尽的数据描述工具,单击菜单栏的""-->“”-->“",将弹出如图2-4所示的对话框,我们将所
有变量都选取到,然后在选项中勾选上所希望描述的数据特征,包括均值,标准差,方差,最大最小值等。由于本次数
据的单位不尽相同,我们需要将数据标准化,同时勾选上"将标准化得分另存为变量"。
图1-4描述性数据汇总
得到如表1-2所示的描述性数据汇总。
N
极小值
极大值
均值
标准差
方差
能源消费总量
30
911
26164
煤炭消费量
30
332
29001
焦炭消费量
30
19
5461
原油消费量
30
0
5555
汽油消费量
30
18
771
煤油消费量
30
0
262
柴油消费量
30
27
1368
燃料油消费量
30
0
1574
天然气消费量
30
1
106
电力消费量
30
98
3004
原煤产量
30
0
58142
焦炭产量
30
0
9202
原油产量
29
0
4341
燃料油产量
30
0
497
汽油产量
30
0
1032
煤油产量
30
0
219
柴油产量
30
0
1911
天然气产量
30
0
164
电力产量
30
97
2536
有效的N(列表状态)
29
表1-2描述性数据汇总
标准化后得到的数据值,以下的回归分析将使用标准化数据。如图1-5所示:
工柴油消费量
疋燃料油消费履
工夭然气消费量
疋电力消费量
煤
1
-.71385
-.29652
.95687
-.46462
2
-.48280
-.10808
-.37813
-.70808
3
.305B2
-.27649
-.,75969
4
-.4171
SPSS多元线性回归分析 来自淘豆网m.daumloan.com转载请标明出处.