计数原理
分类加法计数及分步乘法计数
分类加法计数原理: 完成一件事有两类不同方案,在第1类方案中有m种不同的方法,在第2类方案中有n种不同的方法,那么完成这件事共有 N=m+n种不同的方法。分类要做到“不重不漏”。
分步乘法计数原理P(X=1)为成功概率。(两点分布又称0-1分布。由于只有两个可能结果的随机试验叫伯努利试验,所以两点分布又叫伯努利分布)
X
0
1
P
1-p
p
若X服从两点分布,则E(X)=p ,D(X)=p(1-p)
一般地,在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则
PX=k=CMkCN-Mn-kCNn ,k=0,1,2,⋯,m
X
0
1
⋯
m
P
CM0CN-Mn-0CNn
CM1CN-Mn-1CNn
⋯
CMmCN-Mn-mCNn
其中m=min{M,n},且n≤N,M≤N,n,M,N∈N*
如果随机变量X的分布列具有上表的形式,则称随机变量X服从超几何分布(hypergeometric distribution)。
二项分布及其应用
条件概率
一般地,设A,B为两个事件,且P(A)>0,称
PBA=P(AB)P(A)
为在事件A发生的条件下,事件B发生的条件概率(conditional probability)。
如果B和C是两个互斥事件,则
PB∪CA=PBA+P(C|A)
事件的相互独立性
设A,B为两个事件,若
P(AB)=P(A)P(B)
则称事件A及事件B相互独立(mutually independent)。
可以证明,如果事件A及B相互独立,那么A及B,A及B,A及B也都相互独立。
独立重复试验及二项分布
一般地,在相同条件下重复做的n次试验称为n次独立重复试验(independent and repeated trials)。
PA1A2⋯An=PA1P(A2)⋯P(An)
其中Ai (i=1,2,⋯,n)是第i次试验的结果。
一般地,在n次独立重复试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,则
PX=k=Cnkpk(1-p)n-k , k=0,1,2,⋯,n
此时称随机变量X服从二项分布(binomial distribution),记作X~B(n,p),并称p为成功概率。
若X~B(n,p) ,则
EX=k=0nkCnkpkqn-k=k=1nnpCn-1k-1pk-1qn-1-(k-1)=npk=0n-1Cn-1kpkqn-1-k=np(p+q)n-1=np
D(X)=np(1-p)
*随机变量的均值是常数,而样本的平均值是随着样本的不同而变化的,因此样本的平均值是随机变量。
随机变量的方差是常数,而样本的方差是随着样本的不同而变化的,因此样本的方差是随机变量。
正态分布
一般地,如果对于任何实数a,b (a<b),随机变量X满足
φμ,σx=12πσe-(x-μ)22σ2 ,x∈(-∞,+∞)
Pa<X≤b=abφμ,σ(x)dx
则称随机变量X服从正态分布(normal distribution)。正态分布完全由参数μ和σ确定,记作N(μ,σ2)。如果随机变量X服从正态分布,则记为X~ N(μ,σ2).
φμ,σ(x)的图像称为正态分布密度曲线,简称正态曲线。
(参数μ是反映随机变量取值的平均水平的特征数,可用样本的均值去估计;σ是衡量随机变量总体波动大小的特征数,可用样本的标准差去估计。)
标准正态分布:X~N(0,1)
经验表明,一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布。
正态曲线的特点:
曲线位于x轴上方,及x轴不相交;
曲线是单峰的,它关于直线x= μ对称;
曲线在x=μ处达到峰值1σ2π ;
曲线及x轴之间的面积为1。
*σ越小,曲线越“高瘦”,表示总体分布越集中;σ越大,曲线越“矮胖”,表示总体分布越分散;
若X~ N(μ,σ2),则对于任何实数a>0,
Pμ-a<X≤μ+a=μ-aμ+aφμ,σ(x)dx
该面积随着σ的减少而变大。这说明σ越小,X落在区间(μ-a,μ+a]的概率越大,即X集中在μ周围概率越大。
特别有
Pμ-σ<X≤μ+σ=
Pμ-2σ<X≤μ+2σ=
Pμ-3σ<X≤μ+3σ=
在实际应用中,通常认为服从于正态分布N(μ,σ2)的随机变量X只取μ-3σ<X≤μ+3σ之间的值,并简称之为3σ原则。
统计案例
回归分析的基本思想
回归分析(regression analysi
强烈推荐高中数学知识点总结选修23 来自淘豆网m.daumloan.com转载请标明出处.