Analysis of nominal data
分类数据分析
分类数据分析简介
分类数据也称名义数据,是社会科学研究的组成部分,其数据信息仅代表数据类别。例如种族,1=白种人,2=黄种人,3=黑人。
根据每个类别的数量,可以分析它们之间的关系。
分类数据的分析要求研究者应首先决定如何分类。
分类数据分析的应用范围
政治学领域:研究政治立场是否影响政治派别。
社会学和心理学领域:分析不同类别的人不同的心理特征。
公共政策分析领域:研究不同政策在不同地区产生的效果。
文化传播领域:研究人们对媒体的看法。
分类数据分析是社会科学中最重要的课题之一。一方面因为它的用途广泛,另一方面因为它解决的是基本问题
一些简单概念的解释
分类:最理想的分类是这些类别相互区别并且没有遗漏。统计过程中都假设分类是有意义的。
自变量和因变量:区别在于是否引起另外一个变量的变化。
取样:从总体抽取的简单随机样本。
符号:I、J表示表格的行数和列数,X、Y、Z表示变量。
表1:党派和立场间的关系
民主党
独立党
共和党
革命的
33%
(193)
30%
(161)
11%
(46)
400
中立的
41%
(241)
37%
(199)
33%
(134)
574
保守的
26%
(153)
34%
(182)
56%
(229)
564
100%
(587)
100%
(542)
100%
(409)
1538
X:党派
Y:立场
表2:受党派和地区影响的立场
民主党
独立党
共和党
革命的
%
(62)
%
(37)
%
(10)
109
中立的
%
(94)
%
(46)
%
(33)
173
保守的
%
(75)
%
(55)
%
(56)
186
100%
(231)
100%
(138)
100%
(99)
468
Z:地区=西部
X:党派
Y:立场
民主党
独立党
共和党
革命的
%
(131)
%
(124)
%
(36)
291
中立的
%
(147)
%
(153)
%
(101)
401
保守的
%
(78)
%
(127)
%
(173)
378
100%
(356)
100%
(404)
100%
(310)
1070
Z:地区=非西部
X:党派
Y:立场
表3:标准I×J表格
X:自变量
Y:因变量
1
2
j
J
Totals
1
n11
n12…
n1j …
n1J
n1+
2
n21
n22 …
n2j …
n2J
n2+
…
…
…
…
…
…
i
ni1
ni2 …
nij …
niJ
ni+
…
…
…
…
…
…
I
nI1
nI2…
nIj …
nIJ
nI+
Totals
n+1
n+2 …
n+j …
n+J
n
相关程度的测量
相关程度的测量方法是用一个系数来表示变量间的相关程度。
选择何种方法要考虑三个方面:
测量方法是否对称:是否可以确定自变量和因变量。
系数如何解释:取决于不同的测量方法制定的标准。
测量方法的敏感度:尽量使用敏感度较低的方法。
表5:完全相关的三种类型
X
50
0
0
0
0
50
0
50
0
50
50
50
Y
Totals
X
50
0
0
50
0
0
50
50
50
150
50
50
Y
Totals
X
0
50
0
50
Y
50
0
0
0
0
0
50
0
Totals
50
50
50
50
a 严格完全相关
b 隐含完全相关
c 弱完全相关
干扰因素和解决办法
边际分布不均匀(如表6):
调整数据
将表格标准化
选择对边际总数不敏感的测量方法
行列不相等:
选择可以达到最大值的测量方法。
分类数据分析 来自淘豆网m.daumloan.com转载请标明出处.