该【正态分布对数正态分布】是由【鼠标】上传分享,文档一共【7】页,该文档可以免费在线阅读,需要了解更多关于【正态分布对数正态分布】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。正态分布科技名词定义
中文名称:正态分布 英文名称:normal distribution 定义 1:概率论中最重要的一种分布,
也是自然界最常见的一种分布。该分布由两个参数——平均值和方差决定。概率密度函数曲
线以均值为对称中线,方差越小,分布越集中在均值附近。 应用学科:生态学(一级学科);
数学生态学(二级学科) 定义 2:一种最常见的连续性随机变量的概率分布。 应用学科:
遗传学(一级学科);群体、数量遗传学(二级学科) 以上内容由全国科学技术名词审定委
员会审定公布
求助编辑百科名片
正态分布(normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理
及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量
X 服从一个数学期望为μ 、标准方差为σ 2 的高斯分布,记为:则其概率密度函数为正态分
布的期望值μ 决定了其位置,其标准差σ 决定了分布的幅度。因其曲线呈钟形,因此人们又
经常称之为钟形曲线。我们通常所说的标准正态分布是μ = 0σ, = 1的正态分布。
目录
正态分布
历史发展
研究过程
曲线应用频数分布
医学参考值
统计的理论基础
正态分布
历史发展
研究过程
曲线应用 频数分布
医学参考值
统计的理论基础
展开 编辑本段正态分布
正态分布的由来 normal distribution 正态分布
一种概率分布。正态分布是具有两个参数μ 和σ ^2 的连续型随机变量的分布,第一参数μ
是服从正态分布的随机变量的均值,第二个参数σ ^2 是此随机变量的方差,所以正态分布
记作 N(μ ,σ ^2 )。 服从正态分布的随机变量的概率规律为取与μ 邻近的值的概率大 ,而
取离μ 越远的值的概率越小;σ 越小,分布越集中在μ 附近,σ 越大,分布越分散。正态分
布的密度函数的特点是:关于μ 对称,在μ 处达到最大值,在正(负)无穷远处取值为0,
在μ ±σ 处有拐点。它的形状是中间高两边低 ,图像是一条位于 x 轴上方的钟形曲线。当
μ =0,σ ^2 =1 时,称为标准正态分布,记为 N(0,1)。μ 维随机向量具有类似的概率规
律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布
的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的
线性组合为一元正态分布。 正态分布最早由
到。。
质。 生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例
如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体
的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;
某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许
多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定
理)。从理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一
些常用的概率分布是由它直接导出的,例如对数正态分布、t 分布、F 分布等。 正态分
布应用最广泛的连续概率分布,其特征是“钟”形曲线。 正态分布公式
附:这种分布的概率密度函数为:(如右图) 正态分布 :若已知的密
度函数(频率曲线)为正态函数(曲线)则称已知曲线服从正态分布,记号 ~ 。其中μ 、
σ ^2 是两个不确定常数,是正态分布的参数,不同的μ 、不同的σ ^2 对应不同的正态分布。
正态曲线呈钟型,两头低,中间高,左右对称,曲线与横轴间的面积总等于1。 2.正
态分布的特征:服从正态分布的变量的频数分布由μ 、σ 完全决定。 集中性:正态曲
线的高峰位于正中央,即均数所在的位置。 对称性:正态曲线以均数为中心,左右对称,
曲线两端永远不与横轴相交。 均匀变动性:正态曲线由均数所在处开始,分别向左右
两侧逐渐均匀下降。 正态分布有两个参数,即均数μ 和标准差σ ,可记作 N(μ ,σ ):
均数μ 决定正态曲线的中心位置;标准差σ 决定正态曲线的陡峭或扁平程度。σ 越小,曲线
越陡峭;σ 越大,曲线越扁平。 u 变换:为了便于描述和应用,常将正态变量作数据
转换。μ 是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以X=μ 为对称
轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ 。 σ 描述正态分
布资料数据分布的离散程度,σ 越大,数据分布越分散,σ 越小,数据分布越集中。 也称
为是正态分布的形状参数,σ 越大,曲线越扁平,反之,σ 越小,曲线越瘦高。 标准
正态曲线 标准正态曲线 N(0,1)是一种特殊的正态分布曲线,以及标准正态总体在
任一区间(a,b)内取值概率 。 “小概率事件”和假设检验的基本思想 “小概率事件”
通常指发生的概率小于 5%的事件,认为在一次试验中该事件是几乎不可能发生的。这种认
识便是进行推断的出发点。关于这一点我们要有以下两个方面的认识:一是这里的“几乎不
可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;
二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误
的可能。 正态曲线下面积分布 1.实际工作中,正态曲线下横轴上一定区间的面
积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。不同 范
围内正态曲线下的面积可用公式计算。 轴与正态曲线之间的
面积恒等于 1。正态曲线下,横轴区间(μ -σ ,μ +σ )%,横轴区间
(μ - ,μ + )内的面积为 %,横轴区间(μ - ,μ + )内
的面积为 %。 标准正态曲线 1.标准正态分布是一种特殊的正态分布,
标准正态分布的μ 和σ ^2 为 0 和 1,通常用ξ (或 Z)表示服从标准正态分布的变量,记为
Z~N(0,1)。 2.标准化变换:此变换有特性:若原分布服从正态分布 ,则 Z=(x-
μ )/σ ~ N(0,1) 就服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分
布的概率值。故该变换被称为标准化变换。 3. 标准正态分布表:标准正态分布表中列
出了标准正态曲线下从-∞到 X(当前值)范围内的面积比例 。 一般正态分布与标准正
态分布的转化 由于一般的正态总体 其图像不一定关于 y 轴对称,对于任一正态总体 ,
其取值小于 x 的概率 。只要会用它求正态总体 在某个特定区间的概率即可。 “小概率事
件”和假设检验的基本思想“小概率事件”通常指发生的概率小于5%的事件,认为在一次
试验中该事件是几乎不可能发生的。这种认识便是进行推断的出发点。关于这一点我们要有
以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试
验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的
原理”进行推断时,我们也有 5%的犯错误的可能。 一般正态分布与标准正态分布的
区别与联系 正态分布也叫常态分布,是连续随机变量概率分布的一种,自然界、人类
社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属
于正态分布。标准正态分布是正态分布的一种,具有正态分布的所有特征。所有正态分布都
可以通过 Z 分数公式转换成标准正态分布。 两者特点比较: (1)正态分布的形式
是对称的,对称轴是经过平均数点的垂线。 (2)中央点最高,然后逐渐向两侧下降,曲
线的形式是先向内弯,再向外弯。 (3)正态曲线下的面积为 1。正态分布是一族分布,
它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。标准正态分布是正
态分布的一种,其平均数和标准差都是固定的,平均数为0,标准差为 1。 (4)正态
分布曲线下标准差与概率面积有固定数量关系。所有正态分布都可以通过 Z 分数公式转换
成标准正态分布。 主要特征 1.集中性:正态曲线的高峰位于正中央,即均数所
在的位置。 2.对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相
交。 3.均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
4.正态分布有两个参数,即均数μ 和标准差σ ,可记作N(μ ,σ ):均数μ 决定正态曲线
的中心位置;标准差σ 决定正态曲线的陡峭或扁平程度。σ 越小,曲线越陡峭;σ 越大,曲
线越扁平。 5.u 变换:为了便于描述和应用,常将正态变量作数据转换。 3σ 原
则 正态分布曲线性质: x<μ 时,曲线上升;当 x>μ 时,曲线下降。当曲线向左右
两边无限延伸时,以x 轴为渐近线。 x=μ 对称。 越大,正态曲线越
扁平;σ 越小,正态曲线越尖陡。 x 轴上方范围内区域面积为 1。3σ 原
则:P(μ -σ
≤μ +σ )=%P(μ -2σ
图 1
设想,如果观察例数逐渐增多,组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位
于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图(3)。这条
曲线称为频数曲线或频率曲线,近似于数学上的正态分布(normal distribution)。由于频率
的总和为 100%或 1,故该曲线下横轴上的面积为 100%或 1。 为了应用方便,常对正
态分布变量 X 作变量变换。
该变换使原来的正态分布转化为标准正态分布 (standard normal distribution,) 亦称 u 分布。u
被称为标准正态变量或标准正态离差(standard normal deviat)e。 正态分布研究图 2
正态分布研究图 3
实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该
≤μ +2σ )=%P(μ
区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。正态曲线下一定区
间的面积可以通过附表 1 求得。对于正态或近似正态分布的资料,已知均数和标准差,就可
对其频数分布作出概约估计。 查附表 1 应注意:①表中曲线下面积为-∞到 u 的左侧累
计面积;②当已知μ 、σ 和 X 时先按式 u=(X-μ )/σ 求得 u 值,再查表,当μ 、σ 未知且样
本含量 n 足够大时,可用样本均数 X1 和标准差 S 分别代替μ 和σ ,按 u=(X-X1)/S 式求得 u
值,再查表;③曲线下对称于0 的区间面积相等,如区间(-∞,-)与区间(,∞)
的面积相等,④曲线下横轴 正态分布面积图 1
上的总面积为 100%或 1。 图 2 正态曲线与标准正态曲线的面积分布 正态分布的
应用某些医学现象,如同质群体的身高、红细胞数、血红蛋白量、胆固醇等,以及实验中的
随机误差,呈现为正态或近似正态分布;有些资料虽为偏态分布,但经数据变换后可成为正
态或近似正态分布,故可按正态分布规律处理。 正态分布面积图 2
考试成绩及学生综合素质研究 教育统计学 统计规律表明,学生的智力水平,包括学习
能力,实际动手能力等呈正态分布。因而正常的考试成绩分布应基本服从正态分布。考试分
析要求绘制出学生成绩分布的直方图,以“中间高、两头低”来衡量成绩符合正态分布的程
度。其评价标准认为:考生成绩分布情况直方图,基本呈正态曲线状,属于好,如果略呈正
(负)态状,属于中等,如果呈严重偏态或无规律,就是差的。 生产与科学实验中很多随
机变量的概率分布都可以近似地用正态分布来描述。 从概率统计规律看,“正常的考试
成绩分布应基本服从正态分布”是正确的。但是必须考虑人与物的本质不同,以及教育的有
所作为可以使“随机”受到干预,用曲线或直方图的形状来评价考试成绩就有失偏颇现。在
许多教育专家(如上海顾泠沅 、美国布鲁姆等)已经通过实践论证,教育是可以大有作为
的,可以做到大多数学生及格,而且多数学生可以得高分,考试成绩曲线是偏正态分布的。
但是长期受到“中间高、两头低”标准的影响,限制了教师的作为,抑制了多数学生能够学
好的信心。这是很大的误会。 通常正态曲线有一条对称轴。当某个分数(或分数段)的考
生人数最多时,对应曲线的最高点,是曲线的顶点。该分数值在横轴上的对应点与顶点连接
的线段就是该正态曲线的对称轴。考生人数最多的值是峰值。我们注意到,成绩曲线或直方
图实际上很少对称的,称之为峰线更合适。
编辑本段曲线应用
综述 1. 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根
据公式即可估计任意取值范围内频数比例。 2. 制定参考值范围 (1)正态分布法
适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。 (2)
百分位数法 常用于偏态分布的指标。表 3-1 中两种方法的单双侧界值都应熟练掌握。 3.
质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,以 作为上、
下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。 4. 正态
分布是许多统计方法的理论基础。 检验、方差分析、相关和回归分析等多种统计方法均要
求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统
计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础
的。
频数分布
例 某地 1993 年抽样调查了 100 名 18 岁男大学生身高(cm),其均数=,
标准差 s=,①估计该地 18 岁男大学生身高在 168cm 以下者占该地 18 岁男大学生总
数的百分数;②分别求 X+-1s、X+-、X+- 范围内 18 岁男大学生占该地 18 岁男大
学生总数的实际百分数,并与理论百分数比较。 本例,μ 、σ 未知但样本含量 n 较大,
按式()用样本均数 X 和标准差 S 分别代替μ 和σ ,求得 u 值,u=(168-)/=-。
查附表标准正态曲线下的面积,在表的左侧找到-,表的上方找到 ,两者相交处为
=%。该地 18 岁男大学生身高在 168cm 以下者,约占总数 %。其它计算结
果见表 3。 表 3 100名 18 岁男大学生身高的实际分布与理论分布 分布
x+-s 身高范围(cm) 实际分布
人数 实际分布
百分数(%) 理论分布(%)
X+-1s ~ 67
X +- ~ 95
X+- ~ 99
医学参考值
某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,
呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量
可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指
标,被称为服从对数正态分布。 医学参考值范围亦称医学正常值范围。它是指所谓“正
常人”的解剖、生理、生化等指标的波动范围。制定正常值范围时,首先要确定一批样本含
量足够大的“正常人”,所谓“正常人”不是指“健康人,”而是指排除了影响所研究指标的
疾病和有关因素的同质人群;其次需根据研究目的和使用要求选定适当的百分界值,如 80%,
90%,95%和 99%,常用 95%;根据指标的实际用途确定单侧或双侧界值,如白细胞计数过
高过低皆属不正常须确定双侧界值,又如肝功中转氨酶过高属不正常须确定单侧上界,肺活
量过低属不正常须确定单侧下界。另外,还要根据资料的分布特点,选用恰当的计算方法。
常用方法有: (1)正态分布法:适用于正态或近似正态分布的资料。 双侧界值:
X+-u(u)^S 单侧上界:X+u(u)^S,或单侧下界:X-u(u)^S (2)对数正态分布法:适用
于 对 数 正 态 分 布 资 料 。 双 侧 界 值 : lg-1[X(lgx)+-u(u)S(lgx)] ; 单 侧 上 界 :
lg-1[X(lgx)+u(u)S(lgx)],或单侧下界:lg-1[X(lgx)-u(u)S(lgx)]。 常用 u 值可根据要求由
表 4 查出。 (3)百分位数法:常用于偏态分布资料以及资料中一端或两端无确切数值
的资料。 双侧界值: 和 ;单侧上界:P95,或单侧下界:P5。 表 4 常
用 u 值表 参考值范围(%) 单侧 双侧
80
90
95
99
统计的理论基础
如 t 分布、F 分布、分布都是在正态分布的基础上推导出来的,u 检验也是以正态分布
为基础的。此外,t 分布、二项分布、Poisson 分布的极限为正态分布,在一定条件下,可以
按正态分布原理来处理。 概率论中最重要的分布 正态分布有极其广泛的实际背
景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在
生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、
体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地
区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小
的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理。)从
理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一些常用
的概率分布是由它直接导出的,例如对数正态分布、t 分布、F 分布等。 主要内涵 在
联系自然、社会和思维的实践背景下,我们以正态分布的本质为基础,以正态分布曲线及面
积分布图为表征(以后谈及正态分布及正态分布论就要浮现此图),进行抽象与提升,抓住
其中的主要哲学内涵,归纳正态分布论(正态哲学)的主要内涵如下: 整体论 正
态分布启示我们,要用整体的观点来看事物。“系统的整体观念或总体观念是系统概念的精
髓。” 正态分布曲线及面积分布图由基区、负区、正区三个区组成,各区比重不一样。用整
体来看事物才能看清楚事物的本来面貌,才能得出事物的根本特性。不能只见树木不见森林,
也不能以偏概全。此外整体大于部分之和,在分析各部分、各层次的基础上,还要从整体看
事物,这是因为整体有不同于各部分的特点。用整体观来看世界,就是要立足在基区,放眼
负区和正区。要看到主要方面,还要看到次要方面,既要看到积极的方面还要看到事物消极
的一面,看到事物前进的一面还要看到落后的一面。片面看事物必然看到的是偏态或者是变
态的事物,不是真实的事物本身。 重点论 正态分布曲线及面积分布图非常清晰的
展示了重点,那就是基区占 %,是主体,要重点抓,此外 95%,99%则展示了正态的
全面性。认识世界和改造世界一定要住住重点,因为重点就是事物的主要矛盾,它对事物的
发展起主要的、支配性的作用。抓住了重点才能一举其纲,万目皆张。事物和现象纷繁复杂,
在千头万绪中不抓住主要矛盾,就会陷入无限琐碎之中。由于我们时间和精力的相对有限性,
出于效率的追求,我们更应该抓住重点。在正态分布中,基区占了主体和重点。如果我们结
合 20/80 法则,我们更可以大胆的把正区也可以看做是重点。 发展论 联系和发展
是事物发展变化的基本规律。任何事物都有其产生、发展和灭亡的历史,如果我们把正态分
布看做是任何一个系统或者事物的发展过程的话,我们明显的看到这个过程经历着从负区到
基区再到正区的过程。无论是自然、社会还是人类的思维都明显的遵循这这样一个过程。准
确的把握事物或者事件所处的历史过程和阶段极大的有助于掌握我们对事物、事件的特征和
性质,是我们分析问题,采取对策和解决问题的重要基础和依据。发展的阶段不同,性质和
特征也不同,分析和解决问题的办法要与此相适应,这就是具体问题具体分析,也是解放思
想、实事求是、与时俱乐进的精髓。正态发展的特点还启示我们,事物发展大都是渐进的和
累积的,走渐进发展的道路是事物发展的常态。例如,遗传是常
正态分布对数正态分布 来自淘豆网m.daumloan.com转载请标明出处.