3.1 复习笔记

一、概率

(一)概率

1.随机现象

在自然界和社会生活中,存在着两种不同类型的现象,即确定性现象和随机现象。

(1)确定性现象

含义

在一定的条件下事先可以断言必然会发生某种结果的现象叫确定性现象。

分类

a.必然现象,是指在一定条件下必然会发生的现象。

b.不可能现象,是指在一定的条件下必然不会发生的现象。

(2)随机现象

含义

随机现象是指在一定条件下,事先不能断言会出现哪种结果的现象。

特点

a.具有偶然性

随机现象具有偶然性,一次试验前,不能预言发生哪一种结果。

b.具有必然性

在相同条件下,进行大量次重复试验,呈现出统计规律性,这说明随机现象也具有必然性。

随机事件

随机现象中出现的各种可能的结果称为随机事件,简称为事件。随机事件的极端情况包括:

a.必然事件,当某一事件包含随机试验中所有可能的结果,则称这一事件为必然事件。

b.不可能事件,当某一事件不包含随机试验中的任何结果,则称这一事件为不可能事件。

2.事件与概率

(1)事件

频率的稳定性

如果进行多次试验和观察,事件的出现情况就能体现出一定的规律性,这种规律性就是频率的稳定性。频率的稳定性说明随机事件发生的可能性的大小是随机事件本身所固有的,不随人们意志改变的一种客观属性,可以对其进行度量。

频率的计算公式

在N次重复试验中统计出事件A发生的次数n,并计算n与试验总次数N的比值,这个比称为事件A发生的频率,记作FN(A)

c.特点

在研究或试验之前,事件的成功或失败事先是无法知道的,故要算它成功或失败的概率,只有借助试验结果来估计其概率。

概率的古典定义 

a.适用条件 

第一,每次试验中所可能出现的结果的个数是有限的,这些结果叫做基本事件。

第二,每次试验中每个基本事件的出现是等可能的,即每个基本事件发生的概率相等。

b.定义

若试验由n个有限的基本事件组成,且每次试验中每个基本事件出现是等可能的,有利事件A发生的次数为m,则事件A的概率为:

c.特点

事先就已经知道有关事件出现的事实,在试验或研究之前,就能决定事件发生的概率。故又称这种概率为先验概率。

统计定义与古典定义的概率具有的共同性质

a.必然事件发生的概率为1

b.不可能事件的概率为0;

c.事件A发生的概率满足:

d.逆事件的概率:

概率的两个基本定理

a.概率的加法定理

若A、B是两个互不相容的事件,则A和B至少有一个发生的概率为:

当有有限多个相互独立事件的情况,则有:

若A1,A2,…,An是有限个相互独立的事件,则A1,A2,…,An至少有一个发生的概率为:

b.概率的乘法定理

若A、B是两个相互独立事件,则A和B同时发生的概率P(A·B)为:

若A1,A2,…,An是有限个相互独立事件,则A1,A2,…,An同时发生的概率为:

(二)二项式定理

1.排列与组合

(1)排列

定义

从n个不同的元素中,任取m个(m≤n)元素,按一定的顺序排成一列,称为从n个不同元素中取出m个元素的一个排列。当m<n时,所得排列称为选排列,记作。当n=n时,所得排列称全排列,记作

计算公式

 

 

(2)组合

定义

从n个不同元素中,任取m个(m≤n)元素,不管顺序,并成一组,称为从n个不同的元素中取出m个元素的一个组合,记作

公式 

 

 

组合的两个性质

应用组合的计算公式,二项式定理可写成:

(2)的二项展开式的性质

展开式共有n+1项;

p按降幂排列,指数从n逐项减1到0;q按升幂排列,指数从0逐项增1到n;

各项次数和等于二项式的次数;

从第一项起,各项系数依次为:

由组合的性质()知,由两端起等距项的系数相等。

当项数为奇数时(二项式的指数n为偶数);中间一项的系数最大;当项数为偶数时(二项式的指数n为奇数),中间两项的系数相等且最大。

(3)杨辉三角

杨辉三角有助于记忆二项展开式各项系数的分配规律。在杨辉三角的表(如表3-1所示)中,可从中找到n(从1到10)次方的系数。注意:每行中的任何值均由它顶上左右两个值相加而得。按这种方法可为更大的n值求得二项式的各项系数。它的优点在于能简捷地确定二项展开式的各项系数。

表3-1  杨辉三角(n=10)

二、二项分布

(一)二项分布

1.二项分布讨论的概率问题

对于随机变量x进行n次独立试验,若:

(1)每次试验结果只出现对立事件A与之一;

(2)在每次试验中出现A的概率是p,则出现的概率为1-p,记为q=1-p,求在n次独立试验下,A出现次数为x的概率分布(其中x=0,1,2,…,n)。

2.二项分布的计算公式

  (=0,1,2,…,n)

(二)二项分布的均值、方差和标准差

二项分布的均值μ、方差σ2和标准差σ分别为:

 

  

  

其中,n为二项试验的总次数,p为事件发生的概率,

三、正态分布

(一)正态分布

1.正态分布的密度函数

其中:π是圆周率;e是自然对数的底;x为随机变量的取值;μ为正态分布的均值;σ2为正态分布的方差。正态分布一般记作

2.正态曲线

(1)含义

正态曲线是指由正态分布密度函数f(x)的表达式绘出的正态分布密度函数的曲线,简称为正态曲线(如图3-1所示)。

图3-1  正态分布的密度函数曲线

(2)基本性质

正态曲线位于x轴的上方,以直线x=μ为对称轴,μ为正态分布的均值,它向左向右对称地无限伸延,且以x轴为渐近线。

当x=μ时,曲线处于最高点,为最大值;x=μ±σ两点是拐点,当正态曲线由中央向两侧逐渐下降时,到拐点改变了弯曲方向,整条曲线呈现“中间高,两边低”的形状。

正态曲线与x轴所围成区域的面积为1,将正态曲线分成面积均为0.5的两部分。服从正态分布的随机变量x在x1到x2间变化的概率(x1≤x2)就是x=x1,x=x2两轴之间曲线下的面积。

正态分布x~N(μ,σ2)是由均值μ和标准差σ唯一决定的分布。均值μ决定曲线的位置;标准差σ决定曲线的形状。σ愈大,曲线愈“矮胖”,σ愈小,曲线愈“高瘦”。

(二)标准正态分布

1.定义

当均值为0,标准差为1时的正态分布称为标准正态分布,记作N(0,1)。标准正态分布的密度函数为:

2.标准正态分布曲线(如图3-2所示)

图3-2  标准正态分布曲线

3.标准正态分布的性质

(1)标准正态分布的位置、形状唯一确定。

(2)标准正态分布曲线在Z=0时达到最大值,密度函数为0.3989。

(3)曲线上Z=±1两点为拐点,曲线呈现“中间高,两边低”的形状。

(4)标准正态分布与一般正态分布可以转换。

4.一般正态分布与标准正态分布的转换

任何一般正态分布,都可以通过转化为标准正态分布Z~N(0,1)。因为是线性转化,转换后正态分布的各项性质都保持不变。

(三)正态分布表的使用

1.正态分布表

正态分布表包括三列:

(1)第一列表示曲线底线即横轴上的位置,用Z表示。对于正态分布x~N(μ,σ2)而言,z值相当于

(2)第二列是纵高Y,即曲线的高度,对于某Z0值纵高Y由计算。

(3)第三列是阴影部分的面积(如图3-3所示),用P表示,即概率P。

图3-3  正态分布表中Z、Y、P的意义

2.使用正态分布表时需要注意的问题

(1)正态分布表只列出Z≥0。所对应的纵高和面积。当z≤0时,可根据正态曲线的对称性,在正态分布表中查出-Z所对应的面积和纵高。

(2)对服从正态分布的变量x,先通过,转化为Z值,即计算得到以标准差σ为单位的离均差后,才能查表。

3.正态分布表的用途

(1)已知,求概率

(2)由曲线下的面积P(概率)求Z值;

(3)由Z值或面积(概率)P,求纵高Y。

(四)正态分布的实际应用

1.标准分数

(1)含义

标准分数又称Z分数,它以标准差为单位,反映了一个原始分数在团体中所处的位置。

(2)计算公式

若已知一个总体,则这个总体中的原始分数的标准分数用下式计算:

式中:Z为标准分数;为某个数据或分数;μ为总体平均数;σ为总体标准差。

若仅已知一个待研究总体中的样本,则在这个样本中的原始分数的标准分数用下式计算:

式中:Z为标准分数,为某个数据或分数,为样本平均数,S为样本标准差。

(3)性质

若原始分数服从(或近似服从)正态分布时,标准分数有如下的性质:

由原始分数转换得到的Z分数的平均数为0;

由原始分数转换得到的Z分数的标准差为1;

当X是以μ为平均数,为方差的正态分布总体,则经过转换后得到的标准分数所产生的新总体也为正态,且平均数为0,方差为l。

2.若考试成绩服从正态分布,确定录取分数线;

3.确定在正态分布下特定分数界限内的考生人数。