概率论统计学复习
摘要:本课程要求学生具有微积分、概率论和线性代数的基础。这里对其中概率论统计学的重要概念进行简单的复习。
1、概率论的复习
在现实生活中,我们常常遇到许多事先不能确定结果的现象,例如抛硬币,抛之前无法确定是正面还是负面。世界的许多方面都存在随机性,所谓“随机性”就是事前无法知道结果,而一旦被揭示就会取定一个实现值,概率理论提供了有用的数学工具对随机性进行描述和定量分析。
随机变量与概率分布
样本空间
所有可能结果组成的集合,通常记为;在样本空间的每一个可能结果称为基本事件,记为w。
随机变量
定义在样本空间上的单值函数,即C(w),通常简化为C。
事件
样本空间的一个子集,即一个可能结果或多个可能结果组成的集合就称为随机事件,简称事件。样本空间是其本身的子集,称为必然事件;空集Æ也是的子集,称Æ为不可能事件。
通常用随机变量的取值或者取值范围表示随机事件,例如{}。
概率
描述事件发生可能性大小的数量指标。事件A的概率记为P(A)。
通常研究随机变量各种取值情况的概率。随机变量的全部概率特征称为随机变量的概率分布。
离散随机变量的概率分布
通常用一个二维表格直观描述离散随机变量X的概率分布
X
…
P
…
其中,
连续随机变量的概率分布
用密度函数描述;
累计分布函数;
概率分布的数字特征
期望记为或
对于离散变量,;
对于连续变量,。
方差记为或
运算规则:给定任意常数,;.
标准差或
矩称为变量X的阶矩,时就是X的期望。
联合分布、条件分布与独立性
本课程的计量经济学就是以客观经济系统中具有随机性质的经济关系为研究对象,也就是说我们研究的是带有随机性的经济变量的关系。那么如何描述随机变量之间的关系呢?
联合分布
两个随机变量的联合分布的密度函数为;
X的边际密度函数定义为;
Y的边际密度函数定义为。
注意:如果是离散变量,则积分变为求和,密度函数变为离散变量的概率分布即可。
条件分布
给定X,Y的条件密度函数定义为;同理给出X的条件密度函数。
独立性
若,那么称这两个变量独立。这等价于。
联合分布的数字特征
协方差用于度量两个变量的线性相关程度,记为或;
.
意味着两个变量同方向变动,称之为正相关;
称之为负相关;
称之为不相关。
相关系数;.
如果独立,那么,.
条件分布的数字特征
条件期望
协方差和相关系数衡量的是两个随机变量之间的线性相关关系,两个变量在协方差和相关系数的定义公式中是对称的。在经济学研究中,我们更感兴趣的是用一个变量X去解释另一个变量Y;而且Y和X的关系很有可能是非线性的。在前面已经引入了“给定一个变量X,Y的条件密度函数”的概念,从条件分布我们可以知道变量X的变动如何影响变量Y的分布。然而,研究变量的分布很复杂,一个好的办法就是用一个简单的数字特征——“给定X,Y的条件期望”来总结出这个分布。条件期望在现代计量分析中扮演了一个很重要的角色,本课程的全部内容都是讲解如何在条件期望上进行系数估计和假设检验。
给定X,Y的条件期望定义为.
条件期望的性质:
1)对于任意的函数,;
2)对于任意的函数和,;
3)若X和Y独立,那么;
4)若,那么
5)若以及某一函数有,
概率论统计学复习[统计学经典理论] 来自淘豆网m.daumloan.com转载请标明出处.