第三章 SPSS 数据的预处理在数据文件建立好后,通常还要对待分析的数据进行必要的预加工处理,这是数据分析过程中不可缺少的一个关键环节。而且,随着数据分析的不断深入,对数据的加工处理还会多次反复,实现数据加工和数据分析的螺旋上升。数据的预加工处理是服务于数据分析和建模的。 1、缺失值和异常数据的处理 2、数据的转换处理 3、数据抽样 4、选取变量 3-1 数据排序一、数据排序的目的通常数据编辑窗口中个案的前后次序是由数据录入的先后顺序决定的。数据预处理中,有时需要将数据按照一定的顺序重新排列。数据排序在数据分析过程中的作用: ★数据排序便于数据的浏览,有助于了解数据的取值状况、缺失值数量的多少等。★通过数据排序能够快捷地找到数据的最大值和最小值,进而可以计算出数据的全矩,初步把握和比较数据的离散程度。★通过数据排序能够快捷地发现数据的异常值,为进一步明确它们是否对分析产生重要影响提供帮助。单值排序:排序变量只有一个多重排序:第一个指定的排序变量称为主排序变量,其他依次指定的变量分别称为第二排序变量、第三排序变量等。 SPSS 数据排序的基本操作步骤: (1)选择菜单: (2)指定主排序变量,并选择是按升序还是降序排列数据-> 排序个案(3)如果是多重排序,还要依次指定第二、第三排序变量及相应的排序规则。否则,本步可略。例利用租房状况问卷调查和数据,通过数据排序功能分析本市户口和外地户口家庭的住房面积情况。 3-2 变量计算一、变量计算的目的变量计算是数据分析过程中应用最广泛也是最重要的一环。通过变量计算可以处理许多问题。 1、数据的转换处理 2、对数据的原有分布状态进行转换(1)变量计算是针对所有个案(或指定的部分个案)的,每条个案(或指定的部分个案)都有自己的计算结果。(2)变量计算的结果应保存到一个指定变量中,该变量的数据类型应与计算结果的数据类型相一致。注意 SPSS 算术表达式( Numeric Expression )是由常量、变量、算术运算符、圆括号、函数等组成的式子。★字符型常量应当用引号括起来★变量是那些已存在于数据编辑窗口中的原有变量★算术运算符主要包括+、-、*、/、**(乘方)。操作对象的数据类型为数值型。运算的先后次序是:先计算乘方,再计算乘除,最后计算加减。在同级运算中,按照从左往右的顺序进行计算。通过圆括号改变原有的计算顺序。★在同一算术表达式中的常量及变量,数据类型应该一致,否则无法计算。二、 SPSS 算术表达式三、 SPSS 条件表达式 SPSS 条件表达式是一个对条件进行判断的式子。其结果有两种取值:如果判断条件成立,则结果为真;如果判断条件不成立,则结果为假。 1 、简单条件表达式由关系运算符、常量、变量以及算术表达式等组成的式子。其中关系运算符包括>、<、=、~=(不等于)、>= 、<=。 2、复合条件表达式又称逻辑表达式,是由逻辑运算符号、圆括号和简单条件表达式等组成的式子。其中,逻辑运算符号包括&或 AND (并且)、|或 OR (或者)、~或 NOT (非) 。 NOT 的运算优先级最高,其次是 AND ,最低是 OR 。可以通过圆括号改变运算的优先级。四、 SPSS 函数函数书写的具体形式为: 函数名(参数) 其中函数名是 SPSS 已经规定好的,参数可以是常量(字符型常量应用引号括起来),也可以是变量或算术表达式。参数可能是一个,也可能是多个,各参数之间用逗号分隔。 SPSS 函数大致可以分成八大类: 1、算术函数 2、统计函数、 3、分布函数 4、逻辑函数、 5、字符串函数 6、缺失值函数、 7、日期函数 8、其他函数。五、变量计算的应用举例利用“职工数据. sav ”,依据职称级别计算实发工资,计算规则是:实发工资等于基本工资减去失业保险,之后,依据 1 ~4等级分别将以上计算结果上浮 5% ,3% ,2% ,1% 。 SPSS 变量计算的基本操作步骤如下(1)选择菜单: 转换- >计算变量(2)在数字表达式框给出 SPSS 算术表达式和函数。(3)在目标变量框中输入存放计算结果的变量名。(4)如果用户仅希望对符合一定提交的个案计算产生变量,则按“如果”按钮,选择“如果个案满足条件则包括”选项,然后输入条件表达式。
第三章 SPSS数据的预处理 来自淘豆网m.daumloan.com转载请标明出处.