地球化学数据统计基础
第一页,共24页
推荐用书
《数据统计分析与SPSS应用》
余建英 何旭宏 编著
人民邮电出版社 出版
第二页,共24页
第一讲 地球化学数据统计基础
第三页,共24页
一、地化数据的特点
各种地球化学特征在不同的研究对象(样品或测点)上进行测试,可以得到各自的数值。这种在不同对象上可以取值的地球化学特征称为地球化学变量。
地球化学变量具有3个特点。即它具有随机变量的性质,又具有确定性变量的特征,还具有区域化变量的结构性。
随机性
,地球化学变量的取值受多因素的控制
,误差就带有随机性特点
确定性
每一个研究对象在指定的时刻,某种地球化学特征的真实数值是客观存在的,是有确定数值的。这个值不依赖于人们是否已经测试到了。
区域结构性
所谓结构性是指地球化学变量由于受地质因素的控制,在不同方向上变化率的不同,具有不同的自相关的特性。当一个变量分布在空间内时(即赋于其空间位置时),称为区域化变量
第四页,共24页
二、地球化学变量的分类
按取值范围内的可能,分为3类:
连续型变量在取值范围内有不可数无限多个值。这种变量可以取在某一个数值区间内的任何数值。
离散型变量在取值范围内取有限多个或可数无限个值。
二元变量也称二态变量或有无变量,它是一种只有两个取值的离散变量。
第五页,共24页
根据给予某个变量具体数值的方式,划分为4类:
为叙述方便,先设变量x在两个观测对象A与B中的取值分别为xA和xB。
名义型变量把观测值分成互不相交的组别。这些组别可以用它们的名字、特征或符号来标识。
有序型变量对观测特征可以列出一个等级大小的顺序。对于A和B两个对象,它不仅能区别出xA=xB或xA≠xB,还能进一步区分出xA>xB或xA<xB,即有了大小顺序的差别。但它们的级差不是等距的。
第六页,共24页
间隔型变量不但能区分它们之间的值是相等、不等、谁大谁小,而且还能表示谁比谁大多少。间隔型变量可以定量地表示它们之间的差异,但间隔型变量没有绝对零值。
比例型变量比间隔型变量更进一步。它具有间隔型变量的标识功能,而且还有真正的零点。
以上4类变量中,名义型变量和有序型变量属于定性变量,间隔型变量和比例型变量为定量变量。一般来说,定性变量只能参加布尔运算,定量变量可作代数运算。
第七页,共24页
地球化学变量按其预处理取值方法的不同还可以分为:
它又叫观察变量或原始变量。它是用仪器或特定的分析手段对研究对象直接测定所得。
综合变量是将两个或多个原始观察值加以综合,组成一个新的变量,具有特定的地质意义。
它是根据地质人员对地质现象和成矿理论人为确定的变量。
第八页,共24页
地球化学数据统计的基本内容
数据统计基础
方差分析
相关分析
回归分析
聚类分析
判别分析
因子分析
第九页,共24页
统计描述
(Mean)和均值标准误差()
定义:均值(平均值、平均数)表示的是某变量所有取值的集中趋势或平均水平。
计算公式:
总体平均数<期望>:
样本平均数:
第十页,共24页
地球化学数据统计基础 来自淘豆网m.daumloan.com转载请标明出处.