第四节 随机变量函数的分布

在讨论正态分布与标准正态分布的关系时,有如下结论:若随机变量XNμσ2),则随机变量

可以看出,Y是随机变量X的函数,对X的每一个可能取值,Y根据函数关系有唯一确定的值与之对应.因此,Y也是随机变量,这里称随机变量Y是随机变量X的函数,一般表示为Y=gX).

对于随机变量函数,我们研究的是如何根据Y=gX)的关系,由随机变量X的分布得到随机变量Y的分布,下面就随机变量X为离散型和连续型两种情况来讨论.

一、离散型随机变量函数的分布

如果随机变量X为离散型随机变量,则它的函数Y=gX)也必然是离散型随机变量,可以由X的概率分布求出Y的概率分布.

【例2-4-1】 设随机变量X的概率分布为

Y=2X+1和Z=X2的概率分布.

解:

其中,对于Z=X2P{Z=0}=P{X=0}=0.2

     P{Z=1}=P{“X=-1”∪“X=1”}=0.15+0.25=0.4

     P{Z=4}=P{“X=-2”∪“X=2”}=0.05+0.2=0.25

     P{Z=9}=P{X=3}=0.15

一般地,若随机变量X的概率分布为

P{X=xk}=pkk=1,2,…)

Y=gX)的全部可能取值为{yk=gxkk=1,2,…},由于其中可能有重复的,所以在求Y的概率分布即计算P{Y=yi}时,要将使gxk)=yi的所有xk所对应的概率P{X=xk}累加起来,即

二、连续型随机变量函数的分布

X为连续型随机变量,已知其概率密度为fXx),我们按照分布函数及其性质来求随机变量函数Y=gX)的概率密度.

【例2-4-2】 X~e(λ)和a>0,求Y=aX的概率密度.

解:由于X为连续型随机变量,则Y=aX也是连续型随机变量,现已知X的分布函数和概率密度分别为

现求Y=aX的分布函数FYy)或概率密度fYy).

由于X不可能取负值,因此Y也不可能取负值,所以有

y≤0时    FYy)=P{Yy}=0

   当y>0时   

因此得到Y的分布函数

FYy)求导即得到Y的概率密度

【例2-4-3】 XU[0,1],求Y=-lnX的概率分布.

解:由题可知X的分布函数与概率密度分别为

X仅在[0,1]上取值,因此Y=-lnX只可能在(0,+∞)上取值,所以

y≤0时,FYy)=0

y>0时,FYy)=P{Yy}=P{-lnXy}

        =P{lnX≥-y}=P{X≥e-y}

        =1-P{X<e-y}=1-FX(e-y)=1-e-y

因此Y的分布函数

对其求导得Y的概率密度

可见,当X服从[0,1]上的均匀分布时,Y=-lnX服从参数λ=1的指数分布.

按照以上例题的思路,不难得到以下定理

定理 设已知随机变量X的分布函数FXx)和密度函数fXx),又设Y=gX),其中gx)为严格单调函数,且导数存在,则Y的密度函数为

fYy)=fXhy))|h'(y)|

其中hy)是y=gx)的反函数,h'y)是其导数.

证略.

【例2-4-4】 XNμσ2),求Y=aX+ba≠0)的概率密度.

解:由题可知,X的取值范围为(-∞,+∞),gx)=ax+b在(-∞,+∞)内严格单调且反函数为,导数为.则由定理1可得

可见Y=aX+bN+ba2σ2),即正态随机变量的线性函数仍为正态随机变量.