第二章 随机变量的分布
第一节 随机变量及其分布函数
在第一章中,我们讨论了随机事件及其概率,为了更全面、系统地研究随机试验的结果,找到随机现象的统计规律性,有必要将随机试验的结果数量化.为此,人们引入了随机变量及其分布的概念.随机变量及其与之相关的一系列概念的引入,使概率论的研究能够借助数学分析工具,为概率论的研究获得了飞速发展.
一、随机变量
人们对随机事件的兴趣常常在其结果表现的数量.我们可以在随机试验中引入变量用来描述随机试验的结果.
比如:掷一颗均匀的骰子,观察出现的点数.
若记骰子出现的点数为X,则X的可能值为1,2,3,4,5,6,每掷一次X取1~6中的一个,X的取值是随试验结果变化的,当试验结果确定后,X的值就相应确定,称X这样的变量为随机变量.
若研究某超市一位顾客购买的商品件数和顾客付款时等待的时间,可记Y表示顾客购买的商品件数,Y可能取值为0,1,2,3或其他自然数.Y的取值为随机的,是一个随机变量,事件“Y<3”即“顾客购买的商品件数少于3件”.若记Z表示顾客付款的等待时间,则Z为随机变量,事件“Z>5”即“顾客付款等待的时间超过5分钟”.
可以看出,随机变量是研究随机现象的一个重要工具,也是概率论的一个基本概念,它的一般定义如下:
[定义1] 设S为某随机试验的样本空间,若对于S中任意一个样本点ω都有唯一的确定的实数X(ω)与之对应,即存在一个定义于S的单值实函数X=X(ω),则称X为随机变量.
本书中,一般用大写英文字母X、Y、Z等表示随机变量,其取值用小写字母x、y、z等表示.
随机变量X作为样本点的一个函数,它的取值随试验结果而定.该变量究竟取何值在试验之前是无法确定的,只有在试验之后才知道它的确切值;而试验的各种结果出现有一定的随机性,因此随机变量的取值具有随机性,这是随机变量和普通变量之间的差异.
如果一个随机变量仅取数轴上的有限个或可列个点,则称此随机变量为离散型随机变量.如果一个随机变量的可能取值充满数轴上的一个区间,则称此随机变量为连续型随机变量.
【例2-1-1】 区分以下随机变量是离散型随机变量,还是连续型随机变量.
(1)抛一枚质地均匀的硬币,正面出现的次数X是可能取0与1两个值的随机变量.“X=0”表示“出现反面”,“X=1”表示“出现正面”.类似地,检查一件产品,不合格品数Y也是一个仅能取0与1两个值的随机变量,“Y=0”表示“合格品”,“Y=1”表示“不合格品”.
(2)盒子中装有6个红球、4个白球,从中任取3个球,取到的白球数X是可能取0,1,2,3等四个值的随机变量.
(3)记录一个十字路口1小时通过的汽车数X,随机变量X可能取到的值为0,1,2,…等一切非负整数.类似地,一本书上的错别字个数、单位时间内某个站台上候车的人数都可以看作取一切非负整数的随机变量.
以上都是离散型随机变量,离散型随机变量常常与计数的过程联系在一起,而连续型随机变量则常常与测量过程联系在一起,以下的随机变量为连续型随机变量.
(4)电视机的使用寿命X(单位:小时)是(0,+∞)上取值的随机变量,“X>10000”表示“电视机的使用寿命超过1万小时”.
(5)若某路公共汽车在某站每隔5分钟通过一次,则某位乘客候车的时间X(单位:分钟)是在[0,5]上取值的随机变量.
二、分布函数
研究随机变量首先要解决以下两个问题:
①随机变量可能取哪些值,或取值范围是什么?
②随机变量取值的规律性如何?
下面定义的分布函数是为了描述随机变量取值规律性而引入的一个概念.
[定义2] 设X为一个随机变量,对任意实数x,事件“X≤x”的概率为x的函数,记为
F(x)=P{X≤x}
称F(x)为X的分布函数.
在有多个随机变量的场合,为了区分,X的分布函数也可记为FX(x).
如果将随机变量X看作数轴上“随机点”的坐标,那么分布函数F(x)的函数值就表示随机点X落在区间[-∞,x]内的概率.对于任意的x1,x2∈R(x1<x2)有
P{x1<X≤x2}=F(x2)-F(x1) (2-1-1)
即
P{x1<X≤x2}=P{X≤x2}-P{X≤x1}=F(x2)-F(x1)
在上述定义中并没有限定随机变量X是离散的或是连续的,不论离散型随机变量还是连续型随机变量都可以有分布函数.从分布函数的定义可得到它的以下基本性质:
①F(x)是不减函数且0≤F(x)≤1;
②;
③;
④F(x)是右连续函数.
【例2-1-2】 向半径为r的圆内任意投掷一点,求此点到圆心的距离X的分布函数F(x).
解:因为x<0时,事件“X≤x”为不可能事件,所以F(x)=P{X≤x}=0;
当x≥r时,事件“X≤x”为必然事件,所以F(x)=P{X≤x}=1;
当0≤x<r时,由几何概型可知
因此有
【例2-1-3】 设随机变量X的分布函数为
(1)求系数A、B;
(2)计算P{X≤2},.
解:(1)根据分布函数的性质,有
得
因此
(2)P{X≤2}=F(2)=1-e-2≈0.8647