2011年首都经济贸易大学432统计学[专业硕士]考研真题及详解

一、单项选择题（本题包括1-30题共30小题，每小题2分，共60分）。

1用部分数据去估计总体数据的理论和方法，属于（　　）。

A．描述统计

B．复杂统计

C．推断统计

D．简单统计

【答案】C

【解析】描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的统计方法。

2电视观众对电视剧中插播广告的态度分为不应该、应该、无所谓三种，此数据为（　　）。

A．定类数据

B．定序数据

C．定距数据

D．定比数据

【答案】B

【解析】定序数据是对客观现象各类之间的等级差或顺序差的一种测度。利用定序数据不仅可以将研究对象分为不同的类别，而且可以反映各类的优劣、量的大小或顺序。本题中，态度分为不应该、应该、无所谓三种，既进行了分类又进行了排序，因此属于定序数据。

3为检测生产设备工作运行状态，在产品的生产线上每隔2小时抽取5件产品进行质量检查，此抽样方法是（　　）。

A．等距抽样

B．简单随机抽样

C．分层抽样

D．多阶抽样

【答案】A

【解析】等距抽样，又称系统抽样，是将总体中的所有单位（抽样单位）按一定顺序排列，在规定的范围内随机地抽取一个单位作为初始单位，然后按照事先规定好的规则确定其他样本单位。

4为了了解顾客对商场的满意度，在该商场门口访问了100位顾客，所调查的数据是（　　）。

A．一手资料

B．实验数据

C．次级资料

D．间接数据

【答案】A

【解析】统计调查的数据一般称为观测数据，属于一手资料。CD项表述的是同一个意思，间接数据属于二手资料。

5能够反映分类数据集中程度的指标是（　　）。

A．变异系数

B．标准差

C．平均数

D．分位差

【答案】C

【解析】集中趋势是指一组数据向某一中心值靠拢的程度，它反映了一组数据中心点的位置所在。分类数据集中趋势的测度主要有众数；顺序数据集中趋势的测度主要有中位数、分位数等；数值型数据集中趋势的测度主要有算术平均数、几何平均数等。ABD三项都是反映数据离中程度的指标。

6A、B两单位职工平均工资水平对比结果为_A＞_B，则两单位平均工资的代表性（　　）。

A．A单位的代表性高

B．B单位的代表性高

C．两单位的代表性一样

D．不一定

【答案】D

【解析】若两单位的离散程度一样，则说明A单位平均工资的代表性要高于B单位。为消除变量值水平高低对离散程度测度值的影响，需要计算离散系数。

7用简单随机重复抽样方法选择样本单位，如果要使抽样标准误差降低50%，则抽样单位数需要增加到原单位数的（　　）。

A．2倍

B．3倍

C．4倍

D．1倍

【答案】C

【解析】在简单随机重复抽样条件下，抽样标准误差的计算公式为：

要使抽样标准误差降低50%，则抽样单位数是原单位数的4倍。

8变量X服从二项分布，当n＝100，P＝0.2，X的期望值为（　　）。

A．10

B．20

C．30

D．40

【答案】B

【解析】E（X）＝nP＝100×0.2＝20，Var（X）＝nP（1－P）＝100×0.2×0.8＝16。

9估计量的无偏性指的是（　　）。

A．估计量的数学期望等于被估计的总体参数

B．估计量的方差最小

C．估计量的值等于总体参数

D．估计量的值近似等于总体参数

【答案】A

【解析】估计量的无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。有效性是指对同一总体参数的两个无偏估计量，有更小标准差的估计量更有效。一致性是指随着样本量的增大，点估计量的值越来越接近被估总体的参数。根据定义可知，B项描述的是有效性，D项描述的是一致性。

10当利用假设检验方法得出拒绝原假设的结论时，有可能犯的错误是（　　）。

A．针对原假设的弃真错误

B．针对备择假设的取伪错误

C．针对原假设的取伪错误

D．针对备择假设的弃真错误

【答案】A

【解析】假设检验的两类错误：第一类错误是指原假设H₀为真却被我们拒绝了，犯这种错误的概率用α表示，也称α错误或弃真错误；第二类错误是指原假设为伪我们却没有拒绝，犯这种错误的概率用β表示，也称β错误或取伪错误。

11按设计标准，某自动食品包装机所包装食品的平均每袋重量应为500克，若要检查该包装机运行状况是否符合设计要求，应该采用（　　）。

A．左侧检验

B．右侧检验

C．双侧检验

D．左侧或右侧均可

【答案】C

【解析】原假设是指研究者想收集证据予以反对的假设，原假设与备择假设互斥。题中要检查的是该包装机运行状况是否符合设计要求，因此为双侧检验。检验的原假设为：H₀：μ＝500，备择假设为：H₁：μ≠500。

12变量X与变量Y之间的简单相关系数为零，表示的是（　　）。

A．两变量之间完全相关

B．两变量之间不存在相关关系

C．两变量之间不存在线性相关关系

D．两变量之间存在非线性相关关系

【答案】C

【解析】相关系数r＝0只表示两个变量之间不存在线性相关关系，并不说明变量之间没有任何关系，它们之间可能存在非线性相关关系。变量之间的非线性相关程度较大时，就可能会导致r＝0。

13已知各期环比增长速度为2%、5%、8%和7%，则其平均增长速度的计算方法为（　　）。

A．

B．102%×105%×108%×107%－100%

C．

D．（2%×5%×8%×7%）－100%

【答案】A

【解析】平均增长速度也称平均增长率，它是时间序列中逐期环比值（也称环比发展速度）的几何平均数减1后的结果。而环比增长速度＝环比发展速度－1，因此，根据定义可知

14某地区今年物价上涨4%，则相同的人民币的购买力将下降的百分比为（　　）。

A．3%

B．3.8%

C．4%

D．4.2%

【答案】B

【解析】

则今年的货币购买力指数为

即相同的人民币的购买力将下降的百分比为1－96.2%＝3.8%。

15从总体为N＝1000000个家庭中用等概率抽选n＝1000个家庭作样本，设X_i为第i个家庭的人数，μ表示总体平均数，表示样本平均数，则μ与的关系是（　　）。

A．一定相等

B．在大多数情况下相等

C．偶尔相等

D．一定不相等

【答案】B

【解析】由中心极限定理可知，在大样本情况下，样本均值的抽样分布近似服从期望为总体均值，方差为总体方差的1/n的正态分布。

【说明】本题原题干符号有误，此处根据习惯用法进行了调整。

16多元回归分析中，对变量之间关系的基本要求是（　　）。

A．自变量与因变量之间非线性相关

B．各自变量之间高度线性相关

C．解释变量与被解释变量之间独立

D．解释变量与被解释变量之间高度相关

【答案】D

【解析】多元回归分析中。要求自变量对因变量有显著的影响，即解释变量与被解释变量之间高度相关。

17在时间数列中，计算各季度的季节指数，其和为（　　）。

A．4

B．1

C．12

D．6

【答案】A

【解析】季节指数实际上是各年的同期平均数相对于整个序列平均水平变动的程度，也称为季节比率，可用相对比率或百分比表示。在乘法模型中，季节比率有一个特性，这就是其总和等于季节周期L（＝12或4），或平均等于1。因此，根据各年的季度资料计算的季节指数之和应等于400%，根据各年的月份资料计算的季节指数之和应等于1200%。

18当抽样方式与置信度不变的条件下，样本容量越大则（　　）。

A．可靠性越大

B．可靠性越小

C．置信区间越大

D．置信区间越小

【答案】D

【解析】由置信区间表达式

可知，当抽样方式与置信度不变的条件下，置信区间与样本容量成反比，所以样本容量越大，置信区间越小。

19变量X与Y的相关系数和＝a＋bx回归系数b的关系是（　　）。

A．相关系数与回归系数的正负号相同

B．相关系数与回归系数的正负号相反

C．相关系数越大，回归系数越小

D．相关系数越大，回归系数越大

【答案】A

【解析】相关系数的计算公式为：

回归系数₁的计算公式为：

所以

据此可知，回归系数与相关系数的符号一致。

20总体方差已知，小样本条件下正态总体均值的显著水平为α的双侧检验的拒绝域为（　　）。

A．|Z|＞z_α/2

B．|t|＞t₁_－_α（n）

C．|Z|＞z_α

D．|t|＞t₁_－_α（n－1）

【答案】A

【解析】小样本，总体方差已知，且总体分布服从正态分布，此时采用Z检验统计量。假设检验的决策准则：①左单侧检验：若Z＜－z_α，则拒绝原假设；②右单侧检验：若Z＞z_α，则拒绝原假设；③双侧检验：若|Z|＞z_α/2，则拒绝原假设。

21在多元回归分析中，t检验是用来检验（　　）。

A．总体回归方程线性关系的显著性

B．样本回归系数的显著性

C．样本回归方程的线性关系的显著性

D．总体回归系数的显著性

【答案】D

【解析】在多元线性回归分析中，线性关系检验（F检验）主要是检验因变量同多个自变量的线性关系是否显著。回归系数的检验（t检验）主要是用于检验每个自变量对因变量的影响是否都显著。

22P（A）＝0.5，P（B）＝0.1，已知A、B互斥，P（A∪B）＝（　　）。

A．0.3

B．0.7

C．0.5

D．0.2

【解析】已知A、B互斥，则有P（AB）＝0，P（A∪B）＝P（A）＋P（B）－P（AB）＝0.6。（本题选项设置有误）

23在年度时间数列中，不可能存在的是（　　）。

A．循环变动

B．长期趋势

C．季节变动

D．随机变动

【答案】A

【解析】循环波动也称周期性，它是时间序列中呈现出来的围绕长期趋势的一种波浪形或震荡式变动。循环波动无固定规律，变动周期多在一年以上，且周期长短不一。

24回归分析中，说明回归直线拟合程度的统计量主要是（　　）。

A．相关系数

B．回归系数

C．协方差

D．判定系数

【答案】D

【解析】回归平方和占总平方和的比例称为判定系数，记为R²。判定系数R²测度了回归直线对观测数据的拟合程度。相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。

25在直线回归方程Y＝a＋bX，若回归系数b＝0，则说明（　　）。

A．Y对X的影响是显著的

B．Y对X的影响是不显著的

C．X对Y的影响是显著的

D．X对Y的影响是不显著的

【答案】D

【解析】若回归系数b＝0，那么不管X如何变化，Y不随X的变化作线性变化，这时求得的一元线性回归方程就没有意义，或称回归方程不显著；如果回归系数b≠0，那么当X变化时，Y随X的变化作线性变化，则此时求得的回归方程就有意义，或称回归方程是显著的。

26随机地掷一骰子两次，则两次出现的点数之和等于8的概率为（　　）。

A．3/36

B．4/36

C．5/36

D．2/36

【答案】C

【解析】随机地掷一骰子两次，出现的结果有6×6＝36种可能，两次出现的点数之和等于8的结果有5种，即（2，6）、（3，5）、（4，4）、（5，3）、（6，2）。则两次出现的点数之和等于8的概率为5/36。

27市场上某商品来自两个工厂它们市场占有率分别为60%和40%，有两人各自买一件。则买到的来自不同工厂之概率为（　　）。

A．0.5

B．0.24

C．0.48

D．0.3

【答案】C

【解析】P＝60%×40%＋40%×60%＝0.48。

28设X～N（μ，σ²），则不正确的是（　　）。

A．密度函数X＝μ为对称轴的钟形曲线

B．σ越大，曲线越峭

C．σ越小，曲线越陡峭

D．F（μ）＝1/2

【答案】B

【解析】尺度参数σ愈小，曲线呈高而瘦，分布较为集中；σ愈大，曲线呈矮而胖，分布较为分散。

29每张奖券中奖的概率为1/10。某人购买了20张号码杂乱的奖券，设中奖的张数为X，则X服从（　　）分布。

A．二项

B．泊松

C．指数

D．正态

【答案】A

【解析】这20张奖券每张奖券中奖是相互独立的事件，且X是离散变量，因此，X～b（20，1/20）。

30设连续型随机变量X的分布函数F（x），则有（　　）。

A．P（X＞b）＝1－F（b）

B．P（X＝a）＝F（a）

C．

D．

【答案】A

【解析】X为连续型随机变量，B项：P（X＝a）＝0，C项：

A项：F（b）＝P（X≤b），本题答案选择A。

二、简要回答下列问题（本题包括1～4题共4个小题，每小题10分，共40分）

1请简述泊松分布的性质，并举一个生活中泊松分布的例子。

答：（1）泊松分布的性质如下：

①泊松分布中的参数λ既是数学期望又是方差；

②泊松分布的可加性。

如果X₁，X₂，…，X_k相互独立，且它们分别服从以λ₁，λ₂，…，λ_k为参数的泊松分布，则T＝X₁＋X₂＋…＋X_k也服从泊松分布，其参数为λ₁＋λ₂＋…＋λ_k。

③泊松分布的正态近似

当样本量相当大时，泊松分布近似服从正态分布。

④二项分布的泊松近似

设X_i～B（n_i，p_i），则当n_i→∞，p_i很小，且n_ip_i＝μ保持不变时，可以证明X_i的极限分布是μ为参数的泊松分布。

（2）生活中泊松分布的例子：

①一天内，来到某商场的顾客数；

②在单位时间内，一电路受到外界电磁波的冲击次数；

③1平方米内，玻璃上的气泡数；

④一铸件上的砂眼数；

⑤在一定时期内，某种放射性物质放射出来的α-粒子数。

2简要说明进行抽样调查时，确定样本容量应考虑哪些因素。

答：设E代表所希望达到的估计误差，则必要样本容量可由公式

给出，可以看到样本容量n与允许误差、可靠性系数、总体标准差有以下关系：

（1）总体方差越大，必要的样本容量n越大。即必要的样本容量n与总体方差成正比。

（2）必要的样本容量n与允许误差E的平方成反比。即在给定置信水平下，允许误差越大，样本容量就可以越小；允许误差越小，样本容量就必须加大。

（3）必要的样本容量n与可靠性系数的平方成正比。即要求的可靠程度越高，样本容量就应该越大；要求的可靠程度越低，样本容量就可以越小。

3为客观反映某一地区职工工资总体水平，你认为应采用何种方法计算哪些指标（或统计量），并进行简要说明。

答：平均值，标准差，离散系数、偏态系数和峰态系数。

为反映某一地区职工工资总体水平，需要对该地区职工工资进行描述统计。职工工资为数值型数据，反映数值型数据集中趋势的统计量为均值，反映数值型数据离散趋势的统计量为标准差或方差，反映数据分布的形状是否对称、偏斜的程度以及分布的扁平程度的统计量为偏态系数和峰态系数。所以要计算该地区职工工资的平均值、标准差、偏态系数和峰态系数。

4为了解某市蔬菜的零售情况，拟采用抽样调查。进行抽样调查时，调查人员根据在工商局注册登记的从事蔬菜销售的企业名录，随机抽取了100家，并获得相关数据，计算出平均销售额和标准差。如果根据样本平均销售额推断全市的蔬菜零售额，你认为存在什么问题？为什么？

答：根据样本平均销售额推断全市的蔬菜零售额，存在抽样误差。抽样误差的大小与多方面的因素有关。抽样的样本量即抽取的某市从事蔬菜销售的企业数越大，抽样误差越小；总体的变异性越大，即这100家中每个从事蔬菜销售的企业之间的差异越大，抽样误差就越大；在抽取100家从事蔬菜销售企业数目时采用不重复抽样比采用重复抽样的抽样误差小。

三、计算分析题（本题包括1～4题共4个小题，其中第一题必答题10分，2～4题答2题，每题20分，共50分）

1某调查公司欲了解女性是否有足够的个人支配时间，为此随机抽取了千人左右的女性样本进行了调查。调查结果发现，有47%的女性说，她们没有足够的个人时间。

（1）调查结果说，在95%的置信水平下，误差界限为±3个百分点。请对于在所有女性中觉得个人时间不够的人的比例，做一个95%置信水平下的估计。

（2）请向一个完全不懂统计的人解释，为什么我们不能只说“全部女性当中有47%的人觉得个人时间不够”。

解：（1）样本容量为千人左右是大样本，因此采用z检验统计量。

已知p＝47%，Δ＝3%，α＝0.05，则在95%的置信水平下，所有女性中觉得个人时间不够的人的比例的置信区间为：p±Δ，即（44%，50%）。

（2）样本具有随机性。“47%的人觉得个人时间不够”仅仅是随机抽取的千人左右的女性样本得到的结论，我们不能把这千人左右的女性样本当作全部的女性总体，而且样本的抽取具有随机性，所以47%的概率水平并不是固定的，它会随着样本的改变而改变，因此，我们不能只说“全部女性当中有47%的人觉得个人时间不够”。

2假定其他条件不变的情况下'某种商品的需求量（Y）与该商品的价格（X）有关，现取得以下样本数据：

（1）绘制散点图，说明需求量与价格之间的关系。

（2）拟合需求量对价格的直线回归方程，说明回归系数的实际意义。

（3）计算当价格为10元时需求量的点估计值。

解：（1）需求量与价格之间关系的散点图如下图所示：

图1　需求量与价格之间关系的散点图

由散点图可以看出，需求量Y与该商品的价格X呈负的线性相关关系。

（2）

＝6，＝75，₀＝－₁＝112.5

则需求量对价格的直线回归方程为＝112.5－6.25x

₀是回归直线在y轴上的截距，它表示当商品的价格为0元时，需求量的期望值为112.5公斤；

₁是回归直线的斜率，它表示当商品的价格每增加一元时，需求量平均减少6.25公斤。

（3）当x＝10时，＝112.5－6.25×10＝50（公斤），即当价格为10元时需求量的点估计值为50。

3某电子元件寿命ξ服从N（μ，σ²），μ＝160（小时），若要求P{120＜ξ＜200}≥0.8，问允许σ的值最大为多少？

解：ξ～N（μ，σ²），则

因此

即Φ（40/σ）≥0.9

则40/σ≥1.282

得σ≤40/1.282＝31.2

因此，允许σ的值最大为31.2。

4消费者协会接到消费者对某产品质量的投诉后，拟对该产品进行质量抽检，请你为此设计对该产品的质量抽检方案。

解：（1）对该种产品进行抽样；

（2）对抽取的每个样品进行质量检查，统计出次品率；

（3）进行假设检验

①确定原假设和备择假设

原假设：样品的次品率与总体的次品率相等；

备择假设：样品的次品率与总体的次品率不相等。

②确定检验统计量

总体方差已知，总体分布为正态分布，因此采用z检验统计量。

③根据检验统计量的分布确定拒绝域；

④计算检验统计量的值；

⑤作出决策

若|z|≥z_α/2，则拒绝原假设，认为样品的次品率与总体的次品率不相等，即说明产品存在质量问题。