第四节 随机变量函数的分布
在讨论正态分布与标准正态分布的关系时,有如下结论:若随机变量X~N(μ,σ2),则随机变量
可以看出,Y是随机变量X的函数,对X的每一个可能取值,Y根据函数关系有唯一确定的值与之对应.因此,Y也是随机变量,这里称随机变量Y是随机变量X的函数,一般表示为Y=g(X).
对于随机变量函数,我们研究的是如何根据Y=g(X)的关系,由随机变量X的分布得到随机变量Y的分布,下面就随机变量X为离散型和连续型两种情况来讨论.
一、离散型随机变量函数的分布
如果随机变量X为离散型随机变量,则它的函数Y=g(X)也必然是离散型随机变量,可以由X的概率分布求出Y的概率分布.
【例2-4-1】 设随机变量X的概率分布为
求Y=2X+1和Z=X2的概率分布.
解:
其中,对于Z=X2,P{Z=0}=P{X=0}=0.2
P{Z=1}=P{“X=-1”∪“X=1”}=0.15+0.25=0.4
P{Z=4}=P{“X=-2”∪“X=2”}=0.05+0.2=0.25
P{Z=9}=P{X=3}=0.15
一般地,若随机变量X的概率分布为
P{X=xk}=pk(k=1,2,…)
则Y=g(X)的全部可能取值为{yk=g(xk)k=1,2,…},由于其中可能有重复的,所以在求Y的概率分布即计算P{Y=yi}时,要将使g(xk)=yi的所有xk所对应的概率P{X=xk}累加起来,即
二、连续型随机变量函数的分布
若X为连续型随机变量,已知其概率密度为fX(x),我们按照分布函数及其性质来求随机变量函数Y=g(X)的概率密度.
【例2-4-2】 设X~e(λ)和a>0,求Y=aX的概率密度.
解:由于X为连续型随机变量,则Y=aX也是连续型随机变量,现已知X的分布函数和概率密度分别为
现求Y=aX的分布函数FY(y)或概率密度fY(y).
由于X不可能取负值,因此Y也不可能取负值,所以有
当y≤0时 FY(y)=P{Y≤y}=0
当y>0时
因此得到Y的分布函数
对FY(y)求导即得到Y的概率密度
【例2-4-3】 设X~U[0,1],求Y=-lnX的概率分布.
解:由题可知X的分布函数与概率密度分别为
X仅在[0,1]上取值,因此Y=-lnX只可能在(0,+∞)上取值,所以
当y≤0时,FY(y)=0
当y>0时,FY(y)=P{Y≤y}=P{-lnX≤y}
=P{lnX≥-y}=P{X≥e-y}
=1-P{X<e-y}=1-FX(e-y)=1-e-y
因此Y的分布函数
对其求导得Y的概率密度
可见,当X服从[0,1]上的均匀分布时,Y=-lnX服从参数λ=1的指数分布.
按照以上例题的思路,不难得到以下定理
定理 设已知随机变量X的分布函数FX(x)和密度函数fX(x),又设Y=g(X),其中g(x)为严格单调函数,且导数存在,则Y的密度函数为
fY(y)=fX(h(y))|h'(y)|
其中h(y)是y=g(x)的反函数,h'(y)是其导数.
证略.
【例2-4-4】 设X~N(μ,σ2),求Y=aX+b(a≠0)的概率密度.
解:由题可知,X的取值范围为(-∞,+∞),g(x)=ax+b在(-∞,+∞)内严格单调且反函数为,导数为.则由定理1可得
可见Y=aX+b~N(aμ+b,a2σ2),即正态随机变量的线性函数仍为正态随机变量.