4.1 数学期望、方差、矩
数学期望
常见的数学期望类型:
- 离散型:设其分布律为: P{ξ=xi}=pi, 那么:E(ξ)=i=1∑+∞xipi
称为 ξ 的数学期望或者均值。它是所有可能取值对取值概率的加权平均值
- 连续型:已知概率密度为 f(x), 若 ∫−∞+∞∣x∣f(x)dx<+∞, 称 :E(ξ)=∫−∞+∞xf(x)dx
为 ξ 的数学期望
- 一般随机变量的数学期望:随机变量 ξ 的分布函数为 F(x), 若 ∫−∞+∞∣x∣dF(x)<+∞, 则
E(ξ)=∫−∞+∞xdF(x)
一维随机变量的数学期望
ξ∼P(λ), 则 E(ξ)=λ ;
ξ∼B(n,p), 则 E(ξ)=np;
ξ∼U(a,b), 则 E(ξ)=(b+a)/2
ξ∼N(μ,σ2), 则 E(ξ)=μ;
指数分布: E(ξ)=λ−1
ξ∼Γ(α,β), E(ξ)=βα
对数正态分布: E(ξ)=10μ+2ω2⋅ln10
- 卡方分布:E(X)=n.
- t分布:E(X)=0(n>1).
- F分布:E(X)=n/(n−2)(n>2).
一维随机变量函数的数学期望
设 Fξ(x) 是随机变量 ξ 的分布函数, g(x) 在 R 上连续, 若
∫−∞+∞g(x)∣dFξ(x)<∞
则 η=g(ξ) 的数学期望存在, 且
E(η)=E[g(ξ)]=∫−∞+∞g(x)dFξ(x)
若 ξ 是连续型随机变量, 则
E(g(ξ))=∫−∞+∞g(x)F′(x)dx=∫−∞+∞g(x)f(x)dx
若 ξ 是离散型随机变量, 则
E(g(ξ))=i=1∑∞g(xi)P{ξ=xi}
E[aξ+b]=aE(ξ)+b,E(b)=b
期望的性质
- 性质:
- 若干个随机变量之和的期望等于各变量的期望值和,即
E(X1+X2+...+Xn)=E(X1)+E(X2)+...+E(Xn).
- 若干个独立随机变量之积的期望等于各变量的期望之积,即
E(X1X2...Xn)=E(X1)E(X2)...E(Xn).
- 设随机变量 X 为离散型,有分布 P(X=ai)=pi(i=1,2,...) ;或者为连续型,有概率密度函数 f(x) .则
E(g(x))=i∑g(ai)pi(当i∑∣g(ai)∣pi<∞时)或E(g(x))=∫−∞∞g(x)f(x)dx(当∫−∞∞∣g(x)∣f(x)dx<∞时)
多维随机变量的数学期望
E(ξ)=i=1∑+∞xiP{ξ=xi}=i=1∑+∞xij=1∑+∞P{ξ=xi,η=yj}=i=1∑+∞j=1∑+∞xipj
E(ξ)=∫−∞+∞xfξ(x)dx=∫−∞+∞x∫−∞+∞f(x,y)dydx=∫−∞+∞∫−∞+∞xf(x,y)dxdy
E(ξ)dF(x,y)=∫−∞+∞∫−∞+∞xdF(x,y)=F(x,y)−F(x−Δx,y)F(x,y−Δy)+F(x−Δx,y−Δy)=P{x−Δx<ξ≤x,y−Δy<η≤y}
E(g(ξ,η))=∫−∞+∞∫−∞+∞g(x,y)dF(x,y)
{E[ξη]}2≤E[ξ2]⋅E[η2]
多维随机变量数学期望的性质
设 n 维随机变量 (ξ1,ξ2,…,ξn) 的数学期望 E(ξi) 都存在, 则
- 线性性质:对任意常数 ci(i=1,2,…,n) 有
E(i=1∑nciξi)=i=1∑nciE(ξi)
- 若 ξ1,ξ2,…,ξn 相互独立, 则
E(i=1∏nξi)=i=1∏nE(ξi)
- 设 n 维随机变量 (ξ1,ξ2,…,ξn) 的方差 D(ξi) 都存在, 则
D(i=1∑nξi)=i=1∑nD(ξi)+2i,j=1∑nE{[ξi−E(ξi)][ξj−E(ξj)]}
方差
方差刻画了随机变量取值偏离数学期望的程度。
-
方差:随机变量 ξ 的分布函数为 F(x), 称:D(ξ)=E[ξ−E(ξ)2]=∫−∞+∞[x−E(ξ)]2dF(x)
为 ξ 的方差,而 σ(ξ)=D(ξ) 为 ξ 的标准差或均方差。
-
离散型的方差: 离散型随机变量的分布律为 P{ξ=xi}=pi, 那么方差有:D(ξ)=i=1∑+∞[xi−E(ξ)]2pi
-
连续型的方差: 对应概率密度为 f(X), 那么有 D(ξ)=∫−∞+∞[x−E(ξ)]2fξ(x)dx
方差的性质
- : 如果 E(ξ2) 存在,那么有: D(ξ)=E(ξ2)−[E(ξ)]2
- D(aξ+b)=a2D(ξ),D(b)=0
- 独立随机变量和的方差等于各变量方差和,即 Var(X1+...+Xn)=Var(X1)+...+Var(Xn) .
一些分布的期望和方差
- ξ∼P(λ), 则 E(ξ)=λ,D(ξ)=λ;
- ξ∼B(n,p), 则 E(ξ)=np;D(ξ)=np(1−p)
- ξ∼N(μ,σ2) , 则 E(ξ)=μ ; D(ξ)=σ2
- 几何分布: E(ξ)=p1;D(ξ)=p21−p
- 均匀分布 E(ξ)=(b+a)/2,D(ξ)=(b−a)2/12
- 指数分布 E(ξ)=D(ξ)=λ1
- χ2 分布: Var(X)=2n .
- t 分布: Var(X)=n2/(n2−2) .
- F 分布: Var(X)=2n2(m+n−2)/[m(n−2)2(n−4)](n>4) .
矩
- 定义:设X为随机变量,c为常数,k为正整数。则量E[(X−c)k]称为X关于c点的k阶矩。特别地,有两种重要的情况:
(1) c=0 .这时ak=E(Xk)称为X的k阶原点矩。
(2)c=E(X).这时μk=E[(X−EX)k]称为X的k阶中心矩。
一阶原点矩就是期望,一阶中心距μ1=0,二阶中心距μ2就是X的方差Var(X).
- 两种重要应用:
- 偏度系数:β1=μ3/μ23/2.衡量概率分布函数f(x)是否关于均值对称。如果β>0,则称分布为正偏或右偏;如果β<0,则称分布为负偏或左偏;如果β=0,则对称。(注:μ23/2为标准差的三次方,可将μ3缩放到一次因次)
- 峰度系数:β2=μ4/μ22.衡量概率分布函数f(x)在均值附近的陡峭程度。若X有正态分布N(μ,σ2),则β2=3.(注:μ22为标准差的四次方,将μ4缩放到一次因次。为了迁就正态分布,也常定义μ4/μ22−3为峰度系数,以使正态分布的峰度系数为0)
协方差与相关系数
协方差(Covariance)
- 定义:称 E[(X−EX)(Y−EY)] 为 X , Y 的协方差,并记为 Cov(X,Y) .
- 性质:
- Cov(X,Y)与X,Y的次序无关,即Cov(X,Y)=Cov(Y,X).
- Cov(c1X+c2,c3Y+c4)=c1c3Cov(X,Y) .
- Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
- Cov(X,Y)=E(XY)−E(X)E(Y) .
- 对任意常数 c , Cov(X,c)=0
- 若 X,Y 独立,则 Cov(X,Y)=0 .反过来 Cov(X,Y)=0 并不能推出独立
- [Cov(X,Y)]2≤σ12σ22.等号当且仅当X,Y之间有严格线性关系(Y=a+bX)时成立。
注:协方差的结果受随机变量量纲影响。
D(X±Y)=D(X)+D(Y)±2E[(X−EX)(Y−EY)]=D(X)+D(Y)±2cov(X,Y)
cov(X,Y)=E[(X−EX)(Y−EY)]=E(XY−XEY−YEX+EXEY)=E(XY)−E(XEY)−E(YEX)+EX⋅EY=E(XY)−EX⋅EY
相关系数(Correlation coefficient)
- 定义称Cov(X,Y)/(σ1σ2)为X,Y的相关系数,并记为Corr(X,Y).
- 性质:
- 若X,Y独立,则Corr(X,Y)=0.
- −1≤Corr(X,Y)≤1,或∣Corr(X,Y)≤1∣,等号当且仅当X和Y有严格线性关系时达到。当Corr(X,Y)=0时,推出X,Y不线性相关。
注:相关系数常称为“线性相关系数”,实际上相关系数并不是刻画了X,Y之间消除量纲后“一般”关系的程度,而只是“线性关系的程度”。即使X与Y有某种严格的函数关系但非线性关系,∣Corr(X,Y)∣不仅不必为1,还可以为0.
条件数学期望与条件方差
本节讨论随机变量在给定另外一个随机变量之下的条件期望,可以将这个条件期望看成依赖于另一个随机变量的函数,因而是随机变量,那么就有相应的期望、方差、甚至分布等。
条件数学期望
- 定义:随机变量 Y 的条件期望就是它在给定的某种附加条件下的数学期望。 E(Y∣x)=∫−∞∞yf(y∣x)dy .它反映了随着 X 取值 x 的变化 Y 的平均变化的情况如何。在统计上,常把条件期望 E(Y∣x) 作为 x 的函数,称为 Y 对 X 的回归函数。
- 性质:
- E(ξ)=∫−∞∞E(ξ∣η)fη(y)dy .
- 全数学期望公式: E(ξ)=E[E(ξ∣η)] .
- 离散型: E(ξ)=∑k=1∞E(ξ∣η=yk)P(η=yk)
- 连续型: E(ξ)=∫−∞+∞E(ξ∣η=y)fη(y)dy
- 如果 ξ,η 相互独立,那么 E(ξ∣η)=E(ξ)
- E[g(η)ξ∣η]=g(η)E[ξ∣η]
- E[g(η)⋅ξ]=E[g(η)⋅E(ξ∣η)]
- E(c∣η)=c, where c=constant
- E[g(η)]=E{[g(η)∣η]}
- E[aξ+bη∣ζ]=aE(ξ∣ζ)+bE(η∣ζ)
全期望公式:

条件方差
D(ξη=y)=E([ξ−E(ξη=y)]2η=y)
为 η=y 条件下,随机变量 ξ 的条件方差。

多维正态分布的随机变量
如何判断多维随机变量是否服从正态分布可能是个棘手的问题,但是幸运的是,我们能利用正态随机变量的线性变换不变性得到判断正态分布的充要条件:
(ξ1,ξ2,…,ξn) 服从 n 维正态分布的充要条件是它的任意一个非零线性组合服从一维正态分布。
如果将线性组合当作线性变换,那么可以得到矩阵形式的表述:
正态随机变量的线性变换不变性:设 X=(ξ1,ξ2,⋯,ξn)⊤ 服从 n 维正态分布 N(M,Σ) , C=(cj)m×n 是任意矩阵, 则 Y=CX 服从 m 维正态分布 N(CM,CΣC⊤) .
一维及二维正态随机变量的已知结论
- 正态随机变量的线性函数服从正态分布
- aξ+b∼N(aμ+b,a2σ2)
- 正态分布的可加性:
- 若 ξ∼N(m1,σ12),η∼N(m2,σ22) 相互独立,那么 ξ+η∼N(m1+m2,σ12+σ22)
- 若 (ξ,η)∼N(m1,σ12;m2,σ22;r) 存在,那么有:
- 每个分量服从对应参数的正态分布
- 相关系数 Cov(ξ,η)=b12=rσ1σ2,Corrξη=r
- (ξ,η) 相互独立的充分必要条件是 r=0 ,即 ξ 与 η 相互独立 ⇔ ξ 与 η 不相关。
- 多维正态分布的边缘分布依旧是正态分布