第九讲 数据分析(一)
余可发 博士
江西财经大学工商管理学院
1
整理课件
一、数据处理与分析过程
1、编辑
2、编码
3、数据输入
4、数据分析
(描述性分析、单变量分析、双变量分析、多变量分析)
5、解释
2
整当数据量为偶数时,取最中间两位数的平均数为中位数。上例中数据量为100,是偶数,所以应取排序后第50位数和第51位数的平均值作为中位数。第50位数是3,第51位数也是3,所以中位数为3。
20
整理课件
中位数的计算(2)
分组数据的中位数计算
下式中L为中位数所在组的下限值,fm为中位数所在组的组频数, Sm-1为至中位数组时累计总频数,h为组距。
21
整理课件
中位数的计算(3)
例2:假设有分组数据如下(销售额单位为万元)
年销售额
组中值
商店数目
累计频数
80-90
85
3
3
90-100
95
7
10
100-110
105
13
23
110-120
115
5
28
120-130
125
2
30
合计
30
22
整理课件
中位数的计算(4)
依据公式
例2的中位数为
23
整理课件
众数的计算
未分组数据的众数为出现次数最多的数。
分组数据的众数依据下式计算获得。
表达式中△1表示众数所在组与前一组的频数差,△2表示众数所在组与后一组的频数差。依据公式,。
24
整理课件
全距(极差)的计算
全距指的是样本数据中最大值与最小值之间的距离,因而也叫极差。例1中最小值为1,最大值为6,因而全距为6-1=5。
25
整理课件
四分位差的计算
四分位差是一种按照位置来测定数据离散趋势的计量方法,它只取决于位于样本排序后中间50%位置内数据的差异程度。即第一个四分位与第三个四分位数据之间的差异。例2的四分位差计算过程如下
26
整理课件
标准差的计算(1)
未分组数据的标准差计算
27
整理课件
标准差的计算(2)
分组数据的标准差的计算
28
整理课件
常用图形——柱形图
29
整理课件
直方图
德国
英国
法国
意大利
西班牙
荷兰
瑞典
瑞士
比利时
奥地利
土耳其
挪威
丹麦
中国
芬兰
葡萄牙
希腊
俄罗斯
200 400 600 800 1000 1200 1400
xxx年中国内地与欧洲各国市场调查业
的市场规模比较(年营业额:百万美元)
30
整理课件
饼形图
31
整理课件
趋势图
3
2
15元 14元 13元 12元 11元 10元 9元 8元以下
32
整理课件
散点图
森氏
满 %
意 4
度 沃力 中美
3 % %
2
1
20% 40% 首都知名度
郑州市主要纯水品牌的知名度、美誉度和市场占有率
33
整理课件
态度对比图
34
整理课件
轮廓形象图
35
整理课件
雷达图
36
整理课件
数据分布形态图
37
整理课件
SPSS的描述性分析
Frequencies:频数分布表
Descriptives:一般性描述
Explore:探索性分析
Crosstabs:交叉列表
38
整理课件
描述性分析
频数分布表
一般性描述
探索性分析
交叉列表
计算连续变量的相对比
39
整理课件
频数分布表(Frequencies)
,此外还可对数据的分布趋势进行初步分析。
40
整理课件
待分析变量的列表
是否显示频数表
定义需要计算的统计量
定义需要绘制的统计图
定义表格
41
整理课件
百分位数
分布特征描述
离散趋势
集中趋势
Frequencies:定义统计量
42
整理课件
统计图类型
直方图加上正态曲线
以频数绘制条图或饼图
Frequencies:定义统计图
无图形
条图
饼图
直方图
以构成比绘制条图或饼图
43
整理课件
Freque
《数据分析》 来自淘豆网m.daumloan.com转载请标明出处.