- 应用心理硕士(MAP)考试过关必做习题集(含名校考研真题详解)
- 圣才电子书
- 37820字
- 2020-12-01 17:48:53
第2章 心理学的研究方法
一、单项选择题
1.要消除研究者的实验期望对实验的影响应采取( )。[西南大学2016研]
A.单盲研究
B.双盲研究
C.现场实验
D.实验室实验
【答案】B
【解析】双盲法就是通过在实验过程中让主试和被试都不知晓实验真实意图,从而排除实验者效应和被试者效应对实验结果的污染的方法。要消除研究者的实验期望对实验的影响应该采取双盲研究。A项,单盲研究是指通过在实验过程中让被试不知晓实验真实意图,从而排除被试者效应对实验结果的污染的方法。C项,自然实验也叫现场实验,对实验条件进行适当的控制,使人们在正常的学习和工作情景中进行。D项,实验室实验是借助专门的实验设备,在实验条件严加控制的情况下进行的。
2.某公司欲考查广告的类型(报纸广告、电视广告和网络广告)对其产品销售的影响。为了保证研究结果的代表性,在不同规模的城市中分别抽取1000名被试进行调研。该研究中的城市规模属于( )。[统考2015研]
A.刺激变量
B.被试变量
C.控制变量
D.任务变量
【答案】C
【解析】在实验任务中,实验者不用于研究的那些相关变量称为额外变量,由于在实验中额外变量必须加以控制,所以额外变量也被称为控制变量。题干中,不同的城市规模并不用于研究,属于需要控制的变量。任务变量是指研究中实验任务发生变化;刺激变量是指实验刺激的某些变化;被试变量来源于被试的特征,也称机体变量或个别差异变量,如年龄、性别、学历或健康情况等。
3.在不同类型的自变量中,由主试给予不同的指导语所操纵的是( )。[统考2013研]
A.刺激特点
B.环境特点
C.被试特点
D.暂时造成的被试差别
【答案】D
【解析】暂时造成的被试差异通常是主试的安排,包括由主试给予的不同指导语造成的。
4.在时间估计准确性实验中,一只绿色小灯泡与电钟相连,主试按键让灯亮10秒,然后让被试按键复制10秒的时间。在这个实验中被试复制的时间长度是( )。[华东师范大学2013研]
A.自变量
B.控制变量
C.因变量
D.潜在自变量
【答案】C
【解析】因变量是指由于自变量的变化而引起变动的变量。因此,根据题干表述,为估计时间的准确性,被试复指的时间长度就是因变量。
5.王琴某年高考得了高分,在大学学习中,各科成绩也很好,表明当年的高考试题具有( )。[华东师范大学2011研]
A.信度
B.效度
C.自变量
D.因变量
【答案】B
【解析】本题实际考察的是效度中的实证效度。实证效度是指一个测验对处于特定情境中的个体的行为进行估计的有效性。被估计的行为是检验测验效度的标准,简称为效标。根据效标资料搜集的时间差异,实证效度可以分成同时效度和预测效度两种。同时效度主要用于诊断现状,在于用更简单、更省时、更廉价和更有效的测验分数来取代不易搜集的效标资料。预测效度的作用在于预测某个个体将来的行为。
6.下列选项属于测验稳定性或多次测量结果一致性程度的是( )。[华东师范大学2011研]
A.信度
B.标准化
C.效度
D.常模
【答案】A
【解析】信度指的是测量结果的稳定性程度。若能用同一测量工具反复测量某人的同一种心理特质,则其多次测量的结果间的一致性程度就叫信度,有时也叫测量的可靠性。
7.在探讨字号大小对汉字阅读速度产生影响的研究中,阅读速度是( )。[西南大学2011研]
A.自变量
B.因变量
C.刺激变量
D.控制变量
【答案】B
【解析】自变量亦称“刺激变量”,是指实验设计中实验者确定的作为实验条件的因素或条件,由实验者安排为不同的水平(或处理)。因变量亦称“反应变量”,是指心理学实验中,实验者要观察或记录的自变量变化的现象和结果,是由操纵自变量而导致变化的变量。本研究是探讨字号大小的变化能否引起阅读速度的变化,故字号大小为自变量,阅读速度是因变量。
8.在标准正态曲线下,正、负三个标准差范围内的面积占总面积的比例是( )。[西南大学2011研]
A.99.73%
B.99.00%
C.95.46%
D.95.00%
【答案】A
【解析】排除法,正负2.58个标准差范围内的面积占总面积的99%。故正负三个标准差范围内的面积应大于99%。
9.通过搜集和分析某人过去和现在有关方面的资料,以推知其行为原因的方法是( )。[西南大学2011、统考2007研]
A.调查法
B.个案法
C.测验法
D.观察法
【答案】B
【解析】个案法是对被试各个方面及其状况进行深入而详尽的了解,搜集有关信息,经分析推知其行为真正原因的研究方法;调查法是就某一问题要求被调查者自由表达其意见或态度,以此分析群体心理倾向的研究方法;测验法是使用标准化测验工具度量个体间对同一事物反应的差异,或同一个体在不同时间或情景中的反应差异的研究方法;观察法是在自然情境中对个体的心理现象与行为表现进行有系统、有计划的观察记录,经分析以获得其心理活动产生和发展规律的研究方法。
10.某次抽样调查研究显示,学生每天看电视的时间越多,他们的学习成绩越差。该研究属于( )。[统考2009研]
A.因果研究
B.相关研究
C.个案研究
D.纵向研究
【答案】B
【解析】抽样调查揭示的是两个变量之间的相关程度,因此属于相关研究;因果研究的目的是揭示心理现象之间的因果关系;个案研究是对某个人进行深入而详尽的观察与研究以获得某种行为和心理现象的原因;纵向研究是发展心理学中常用的研究方法之一,是对同一研究对象在不同的年龄或阶段进行长期的反复观测的方法。
11.通过裂脑人研究来揭示大脑两半球功能单侧化的科学家是( )[统考2008研]
A.布洛卡(P.Broca)
B.拉什利(K.S.Lashley)
C.斯佩里(R.Sperry)
D.威尔尼克(C.Wernicke)
【答案】C
【解析】单侧化的进一步研究是在20世纪60年代利用“割裂脑”技术进行的,主要研究者是斯佩里。
12.某研究发现,近40%的少年犯来自单亲家庭。该研究使用的研究方法是( )。
A.自然观察法
B.个案法
C.调查法
D.实验法
【答案】C
【解析】调查法是指通过书面或口头回答问题的方式,了解被试的心理活动的方法;自然观察法是指在自然条件下,对表现心理现象的外部活动进行有系统、有计划的观察的方法;实验法是指在控制条件下对某种心理现象进行观察的方法;个案法是指对某个人进行深入而详尽的观察与研究,以便发现影响某种行为和心理现象的原因的方法。从题目中获得的数据结果看,采用的是调查法。
13.某人对幼儿的合作行为进行研究,观察并记录幼儿在自由活动中的表现。此人运用的研究方法是( )。
A.观察法
B.调查法
C.访谈法
D.自然实验法
【答案】A
【解析】观察法指在自然条件下,对表现心理现象的外部活动进行有系统、有计划的观察。调查法(分为问卷法和访谈法)是指通过书面或口头回答问题的方式,了解被试的心理活动的方法。实验法(分为实验室实验和自然实验)是指在控制条件下,对某种心理现象进行观察的方法。
14.脑成像技术在心理学研究中属于( )。
A.观察法
B.实验法
C.心理测验法
D.调查法
【答案】B
【解析】实验法是指在控制的条件下系统地操纵某种变量的变化,来研究该变量的变化对其他变量产生的影响。脑成像技术是借助于仪器设备,在无损伤的条件下观察大脑在进行各种活动时脑内血流量的变化、脑电的变化或代谢功能的变化,属于实验室实验。
15.如果自变量是连续的量的变化,则要求所选自变量的检查点,一般( )为宜,只有这样,才能足以找出自变量和因变量的函数关系。
A.2~3个左右
B.3~5个左右
C.5~7个左右
D.以上都不对
【答案】B
【解析】因素型实验的自变量一般不超过4个水平;函数型实验的自变量水平,如果预期实验考察的是线性函数关系,可以取3~5个水平。
16.主试不知哪些被试接受的是哪种实验处理,被试不知实验目的的实验是( )。
A.双盲实验
B.单盲实验
C.不具有可重复性
D.控制不佳
【答案】A
【解析】双盲实验控制法是指在主试和被试都不知道实验目的的前提下实施实验,排除由于主试和被试知道实验目的和实验者的意图而引起的额外变量。
17.在一项研究中,研究者希望考察一种新的教学方法的作用。以下变量中最需要控制的是( )。
A.性别
B.人格
C.运动技能
D.智力水平
【答案】D
【解析】智力水平的高低对于教学方法的使用效果有重要影响,所以在实验中应该选择智力水平相同的被试以控制此额外变量。
18.下列属于实验者效应的是( )。
A.霍桑效应
B.回归假象
C.天花板效应
D.罗森塔尔效应
【答案】D
【解析】罗森塔尔效应是指教师对学生的殷切期望能戏剧性地收到预期效果的现象。实验者效应是指主试在实验中可能以某种方式(如表情、手势、语气等)有意无意地影响被试,使他们的反应符合主试的期望,如罗森塔尔效应。要求特征即被试者效应,是指被试自发地对实验目的产生一个假设或猜想,然后再以一种自以为能满足这一假想的实验目的的方式进行反应,如霍桑效应和安慰剂效应。
19.序列反应时任务试图将反应时实验的逻辑应用于( )心理过程的研究。
A.有意识
B.无意识
C.前意识
D.潜意识
【答案】B
【解析】内隐学习研究中新的研究范式—序列学习范式,用来研究人们对序列规则的无意识获得。序列反应时(SRT)任务正是序列学习范式中的经典任务之一,它以反应时作为反应指标,以序列规则下的操作成绩和随机序列下的操作成绩之差来表示内隐学习的学习量。
20.Posner等人应用减数法反应时实验确定了,某些短时记忆信息可以有( )两个连续的阶段,这是认知心理学上的重大发现。
A.视觉编码和语义编码
B.视觉编码和听觉编码
C.听觉编码和语义编码
D.图像编码和声音编码
【答案】B
【解析】波斯纳利用减数法实验证明短时记忆编码前期存在着视觉编码,随后以听觉编码为主。
21.内隐联想测验可以测量( )。
A.内隐学习
B.内隐记忆
C.内隐态度
D.阈下知觉
【答案】C
【解析】内隐联想测验是由格林沃德(Greenwald)在1998年提出的。内隐联想测验是以反应时为指标,通过一种计算机化的分类任务来测量两类词(概念词和属性词)之间的自动化联系的紧密程度,继而对个体的内隐态度等内隐社会认知进行测量。
22.增加击中的奖励数会使( )。
A.辨别力指数增高
B.辨别力指数下降
C.判断标准严格
D.判断标准宽松
【答案】D
【解析】信号检测论指标辨别力指数比较稳定,不受实验条件的影响。信号检测论指标判断标准受被试者的动机、态度、利害得失等心理因素影响。在实验中,增加击中的奖励数,会使人们报告击中的数量增加,导致判断标准宽松。
23.在用传统心理物理法测量阈限时,需要特别注意习惯误差和期望误差的是( )。
A.极限法
B.平均差误法
C.恒定刺激法
D.都可以
【答案】A
【解析】用极限法测量绝对阈限时易产生两对常误:习惯误差和期望误差;练习误差和疲劳误差。习惯误差指被试因习惯于原先的刺激所引起的判断,对新的刺激也作出与之前相同的判断。期望误差指被试因期望将要来临的刺激出现(或刺激消失)而导致提前的判断方向改变。
24.ROC曲线离对角线越近,代表( )。
A.被试的感觉辨别力越弱
B.被试的感觉辨别力越强
C.被试的判断标准越严格
D.被试的判断标准越宽松
【答案】A
【解析】机遇线(对角线)的意义:对角线是代表被试辨别力为零的一条线,即击中率等于虚报率的一条线称做“机遇线”,代表完全没有感受性的人在只靠猜测的情况下的反应。
25.使用直线内插法计算阈限的方法是( )。
A.极限法
B.恒定刺激法
C.阶梯法
D.平均差误法
【答案】B
【解析】直线内插法是将刺激作为横坐标,以正确判断的百分数作为纵坐标,画出曲线。然后再从纵轴50%处画出与横轴平行的直线,与曲线相交于点a,从点a向横轴画垂线,垂线与横轴相交处就是阈限值。恒定刺激法可用直线内插法计算绝对阈限和差别阈限值。
26.韦伯定律可被用来预测( )。
A.再认和回忆成绩间的差别
B.反应时和准确性成绩间的差别
C.智商和学业成绩之间的关系
D.最小可觉差
【答案】D
【解析】德国生理学家韦伯研究了刺激的增量与原刺激量之间的关系,提出韦伯定律:K=△I/I,其中I为标准刺激的强度或原刺激量,△I为引起差别感觉的刺激增量,即JND(最小可觉差),K为一个常数。
27.如果在一个次数分布中有M<Md<M0,则该分布为( )。
A.正态分布
B.二项分布
C.负偏态分布
D.正偏态分布
【答案】C
【解析】在正偏态分布中M>Md>M。,在负偏态分布中M<Md<M。
28.一位研究者测量了两个个体的某种特征,得到不同的分数,并得出结论:其中一个个体比另一个个体在这一特征上高两倍。该研究者使用的量表是( )。
A.命名量表
B.顺序量表
C.等距量表
D.比率量表
【答案】D
【解析】①比率量表既表明量的大小,也有相等的单位,同时还具有绝对零点,可以使用四则运算。②等距量表有相等单位,但无绝对零点,只能使用加减运算,不能使用乘除运算。③顺序量表不具有相等单位,也没有绝对零点,不能进行四则运算。④命名量表只计算个数,并不说明事物之间差异的大小。高两倍是一种乘除运算,故为比率量表。
29.以下表示等级数据之间相关的为( )。
A.φ相关
B.二列相关
C.点二列相关
D.U系数
【答案】D
【解析】肯德尔U系数又称一致性系数,是表示多列等级变量相关程度的一种方法。点二列相关适用于两列变量中,一列为等比或等距的测量资料,而且其总体的分布为正态分布,另一列资料是真正的二分变量。二列相关适用于两列变量中,一列为等比或等距的测量资料,且总体正态,另一列变量呈正态分布,且被人为地按照某一标准划分为两类。φ相关适用于两个相互关联的变量分布都是真正的二分变量。
30.方差分析的主要任务是检验( )。
A.综合虚无假设
B.部分虚无假设
C.组间虚无假设
D.组内虚无假设
【答案】A
【解析】方差分析是对三个或三个以上平均数间的差异进行检验,只要其中任意两个平均数间差异显著,我们就认为这三个或三个以上平均数的差异显著。所以,方差分析要对任意两个平均数的差异进行检验,检验的是综合虚无假设。
31.假设以某校一年级105名学生的数学考试成绩作为成绩总体,采用简单随机抽样方法从这105名学生的数学成绩总体中抽取一个容量为20的样本,求得这20个样本数据的次数分布,称为( )。
A.抽样分布
B.总体分布
C.样本分布
D.正态分布
【答案】C
【解析】样本分布是样本内个体数值的频数分布,如本题。抽样分布是某一种统计量的概率分布,比如平均数抽样分布。
32.有一项研究要调查中国人的主观幸福感,大约要抽取5000名被试,相对来说比较适宜的抽样方法是( )。
A.整群抽样
B.分层抽样
C.随机抽样
D.等距抽样
【答案】B
【解析】①分层随机抽样简称分层抽样,它先根据总体的已有特征信息,将总体分成不同层次(或部分),然后在每一层中再随机抽取若干个体组成样本。②等距抽样又称机械抽样或系统抽样,其实质是等间隔法的机械抽样。③简单随机抽样是指抽取时,总体中每个个体应有独立的、等概率被抽取的可能。对中国人全面的考查,需要根据不同的年龄等特征分层抽样为最佳。
33.参数估计的置信度为1-α的置信区间表示( )。
A.以1-α的可能性包含了未知总体参数真值的区间
B.以α的可能性包含了未知总体参数真值的区间
C.总体参数取值的变动范围
D.抽样误差的最大可能范围
【答案】A
【解析】置信区间,也称置信间距,是指在某一置信度时,总体参数所在的区域距离或区域长度。1-α的置信区间是指总体参数落在该区间之内,估计正确的概率为1-α。
34.统计学中不能对研究问题直接进行检验,需要预先建立一个与研究假设相对立的假设,这一假设称为( )。
A.原假设
B.备择假设
C.对立假设
D.无关假设
【答案】A
【解析】在假设检验中,这种基本假设是在推断研究假设之前提出的、与研究假设相反的假设,称为虚无假设、无差假设、零假设或原假设,记作H0。根据已有的理论和经验,事先对研究结果所作的一种预想的、希望证实的假设,称为科学假设或研究假设,又被称为H0的对立假设或备择假设。
35.对于样本相关系数是否为零的显著性检验,常用的参数检验方法为( )。
A.Z检验
B.近似Z检验
C.t检验
D.F检验
【答案】C
【解析】在一定条件下,样本相关系数的分布服从t分布。对于样本相关系数是否为零的显著性检验常采用t检验。
36.第一个使用“心理测验”一词的美国心理学家是( )。
A.高尔顿
B.卡特尔
C.桑代克
D.比奈
【答案】B
【解析】美国心理学家卡特尔于1890年发表《心理测验与测量》一文,首创了“心理测验”这个术语。
37.复本信度,又称等值性系数,其考虑的误差来源是( )。
A.时间取样
B.内容取样
C.系统误差
D.评分者误差
【答案】B
【解析】复本信度估计的是两个假定相等的复份测验之间的一致性,是两个平行测验分数的相关。其影响因素主要有:两份测验测题取样是否匹配,格式是否相同,内容、题数、难度、平均数、标准差是否一致。所以,复本信度的误差来源于内容取样。
38.系统误差影响测量的( )。
A.准确性
B.一致性
C.准确性和一致性
D.信度
【答案】A
【解析】系统误差只影响测验的效度而不影响测验的信度。效度就是一个测验对其所要测量的特性测量到什么程度的估计,反映的是测量的准确性。所以,系统误差影响测量的准确性。
39.认为被试某种相对稳定的、支配其对相应的测验做出反应并使反应表现出一致性的内在特征的理论是( )。
A.CTT
B.IRT
C.GT
D.ABC都涉及
【答案】B
【解析】①项目反应理论(IRT)指出了个体某些特征与个体某种反应类型的概率之间的关系。②经典测验理论(CTT)认为,观察分数与真分数之间是一种线性关系,并只相差一个随机误差。③概化理论(GT)运用方差分析技术将来自不同测量条件的误差分解,从而选择合理的测验设计方案以减少误差,提高测量的精度。
40.一项研究收集了一批大学新生的高考分数。在他们四年后毕业时又测量了他们的学习动机(让他们报告自己在大学期间学习的努力程度)。高考成绩与动机分数的相关为0.4,这个相关系数反映的是( )。
A.再测信度
B.内部一致性
C.预测效度
D.同时效度
【答案】C
【解析】预测效度是指效标资料是在测验之后根据实际工作成绩来确定的,符合题目中的情况。同时效度是指效标资料是与测验分数同时收集的。
41.当测验过难时,测验总分布一般呈( )。
A.正偏态
B.负偏态
C.倒U型
D.J型
【答案】A
【解析】测验过难时,测验分数大多数会分布在低分端,呈正偏态。
42.在编制测验的时候,同时编制两套复本,此时求出来的信度叫做( )。
A.等值性系数
B.内部一致性系数
C.稳定性系数
D.和谐系数
【答案】A
【解析】①内部一致性系数是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。②稳定性系数是指用同一个量表对同一组被试施测两次所得结果的一致性程度。③肯德尔和谐系数是考察多位评分者评分的一致性程度,或者称评分者系数。
43.在心理与教育测量中,测验误差与信度的关系是( )。
A.系统误差控制得好,测验信度就越高
B.随机误差控制得较好,测验信度就越高
C.各方面误差因素都控制得好,测验信度才会高
D.通过多次反复施测才能减少误差,提高测验信度
【答案】B
【解析】信度与随机误差有关;效度与系统误差和随机误差都有关。
44.当测验用于强调维护社会公平时,应重视( )。
A.总命中率
B.正命中率
C.基础率
D.录取率
【答案】A
【解析】总命中率又称取舍正确性,反映了正确决策的比例,指根据测验选出的人当中实际合格的人数以及根据测验淘汰的人当中实际不合格的人数之和与总人数之比。若总命中率高,则说明测量的效度高,也就可以更好地维护社会公平。
45.题目区分度的特点是( )。
A.不同的计算方法,所得区分值相同
B.不受样本容量大小的影响
C.极端组划分的标准不同,影响鉴别指数(D)的值
D.样本的同质性程度越高,测题的区分度就越高
【答案】C
【解析】题目区分度的特点是:①不同的计算方法,所得区分度值不同;②样本容量大小影响相关法区分度值的大小。样本容量越小,统计值越不可靠;③极端组划分的标准不同,影响鉴别指数(D)的值;④被试样本的同质性程度影响区分度值的大小。样本的同质性程度越高,测题的区分度就越小。
46.根据测量理论,( )的做法会降低测验的信度。
A.增加同类题目的数目
B.提高被测群体的同质性
C.对主试进行统一培训
D.筛选题目,使题目难度中等且正态分布
【答案】B
【解析】提高测量信度的方法有:①适当增加测验的长度,增加一些与原测验中题目具有较好同质性的题目;②使测验中所有试题的难度接近正态分布,并控制在中等水平;③选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度。被测群体的同质性越大,信度越低;④选择适宜的时间间隔;⑤主试者严格执行施测规程,评分者严格按标准给分,施测场地按测验说明书的要求进行布置,减少无关因素的干扰;⑥努力提高测验试题的区分度。
47.概化理论中的φ系数相当于经典测验理论中的( )。
A.难度
B.区分度
C.信度
D.效度
【答案】C
【解析】经典测验理论中,信度=真分数方差/(真分数方差+测量误差方差)。概化理论中,φ系数=测量目标方差/(测量目标方差+绝对误差方差)。两者含义相同。
48.( )是指测验能说明心理学上的理论结构或特质的程度。
A.内容效度
B.效标效度
C.预测效度
D.结构效度
【答案】D
【解析】结构效度是指测验能说明心理学上的理论结构或特质的程度。内容效度是指所设计的题项能否代表所要测量的内容或主题。效标效度是指一个测验对处于特定情景中的个体的行为进行预测时的有效性。预测效度是效标效度的一种,指测验对预测某种行为的有效性程度。
49.既影响效度又影响信度的误差是( )。
A.系统误差
B.抽样误差
C.随机误差
D.评分误差
【答案】C
【解析】①随机误差是指由与测量目的无关的偶然因素引起的无规律的误差。它使多次测量产生不一致的结果,直接影响测量的准确性和一致性,与信度和效度都有关。②系统误差是指由与测量目的无关的因素引起的恒定的有规律的误差。它稳定存在于每次测量之中,直接影响测量的准确性,与效度有关,但与信度无关。③抽样误差是指根据样本信息来推断总体信息时产生的随机误差。④评分者误差是由于评分者之间主观状态不一致而导致的误差。
50.下列关于项目反应理论的陈述不正确的是( )。
A.项目反应理论又称潜在特质理论,它与心理学中关于潜在特质的一般理论有关
B.大多数项目反应模型都假设完全潜在空间是单维的
C.项目反应理论还假设同一特质水平的被试对不同测验的反应在统计上是相关的
D.项目反应理论认为,被试对于测验项目的反应除了受到某种特定“特质”支配外,还受到许多随机因素的影响
【答案】C
【解析】项目反应理论的局部独立性假设指出:同一特质水平的被试对不同测验的反应在统计上是独立的,即被试对一个测验项目的反应不受他们对其他测验项目反应情况的影响。
二、多项选择题
1.开展以动物为被试的研究时,下列表述正确的有( )。[统考2011研]
A.给动物以人道对待
B.为保证实验顺利进行,动物解剖时可以不使用麻醉剂
C.获取、照料、使用和处理动物以符合实验设计要求为主
D.当动物的生命应当结束时,需要快速且无痛
【答案】AD
【解析】在做实验时,无论是用动物还是人,都要考虑到伦理问题。尽量避免和减少被试的痛苦。
2.内部效度的影响因素有( )。
A.统计回归
B.主试—被试的相互作用
C.零结果
D.被试的选择偏性
【答案】ABD
【解析】内部效度的影响因素有:①被试因素(历史;霍桑效应、安慰剂效应、要求特征;疲劳;成熟;被试亡失;选择);②测验工具因素(测验经验的增长;测量工具的稳定性);③实验者效应;④交互作用因素(主试—被试间的相互作用;选择与成熟之交互作用;前测与实验处理的反作用效果);⑤统计回归。零结果可以提示实验的假设或操纵方面存在问题。
3.( )可以用于额外变量的控制。
A.随机化法
B.ABBA法
C.采取标准化的指导语
D.实验后统计控制法
【答案】ABCD
【解析】对额外变量的控制技术主要有如下几种:①消除法;②恒定法(如采用标准化的指导语);③随机取样法;④等组匹配法;⑤抵消平衡法(包括ABBA法和拉丁方法);⑥统计控制法。
4.国外某些研究表明,一个地区的枪支拥有量与该地区谋杀案的发案率成正相关。这些研究属于( )。
A.相关研究设计
B.准则组设计
C.事后设计
D.真实验设计
【答案】AC
【解析】①相关研究设计指在一个被试组内收集两个集合的数据,其中一个数据集合是观察到的结果(谋杀案发率),另一个则是被追溯的数据集合(枪支拥有量),研究目的是确定这两个数据集合之间的关系。②事后设计是指研究者不需要设计实验处理或控制自变量,将以自然发生的处理或自变量与某种结果或因变量联系起来加以考虑,从而推断二者之间关系。这是一种由果溯因的研究,包含相关研究和准则组设计两种。
5.混合实验设计中,交互作用不显著说明( )。
A.各因素之间不存在内在联系
B.各因素的主效应是相互独立的
C.各因素之间可能存在内在联系
D.各因素的主效应可能会相互影响
【答案】AB
【解析】存在交互作用意味着变量A在变量B不同水平上的效应方向相反或效应方向相同,但效应量不同,即一个自变量对因变量的影响要受到其他自变量的制约,各因素的作用不是独立的。不存在交互作用则意味着各因素独立,没有内在联系。
6.平衡技术是控制额外变量的方法之一。常用的平衡技术有( )。
A.匹配法
B.拉丁方设计
C.双盲法
D.ABBA法
【答案】BD
【解析】常用的额外变量的控制方法有:排除法(如双盲实验)、恒定法、匹配法、随机化法、平衡法(如ABBA法和拉丁方设计)。
7.指导语是指在心理实验中,主试给被试交待任务时所说的话。一个规范的指导语应符合的要求是( )。
A.指导语的内容要确定
B.指导语的内容要完整
C.指导语的内容要简洁
D.指导语要做到标准化
【答案】ABCD
【解析】规范的指导语应符合:①内容确定,即主试要严格确定给被试什么样的指导语;②完全,即在指导语中,要把被试应当知道的事交待完全;③简单明确,即指导语要写得简单明确,要保证被试能理解指导语;④标准化,即指导语中所用的词语以及说明指导语时主试的表情、语气、声调等方面都要进行标准化。
8.下列几种额外变量中,可以由恒定法对其进行控制的是( )。
A.实验室物理环境如光线、噪音等
B.实验的程序
C.实验所使用的仪器
D.主试
【答案】ABCD
【解析】恒定法是指实验者采取一定措施使某些额外变量在整个实验研究中保持不变。恒定法的具体方式有:采用同一地点、同一仪器、同一主试、同一时间段;主试态度要保持恒定;按同一实验程序或步骤进行实验;选择智力、性别、年龄、受教育程度相同的被试。
9.真实验设计具备的特点是( )。
A.额外变量控制严格
B.生态效度较高
C.对自变量进行了有效操纵
D.内部效度较低
【答案】AC
【解析】真实验设计特征在于对影响内部效度的额外变量采取了严格的控制,并能有效地控制研究中自变量的不同取值和因变量的指标,以及被试的分配情况。优点是:要求控制的条件最严密;操纵的自变量最有效;测定记录的因变量最准确;要在实验室条件下进行;实验的信度、效度高。缺点是:自然性差,人为性强,生态效度低。
10.下面对准实验设计的阐述中,不正确的是( )。
A.前实验设计与事后设计都属于准实验设计的范畴
B.准实验设计的生态效度低于真实验设计
C.准实验设计对无关变量的控制不够严密
D.准实验设计一般不能得到变量之间的因果关系
【答案】AB
【解析】准实验设计是指降低了实验控制的标准,通常在不易对被试进行随机取样,无法严格创设等组的条件下进行的设计。优点是:准实验设计在真实性和生态效度上高于真实验设计。缺点是:对额外变量的控制不够严格;一般只能由果溯因,而不能由因推果。准实验设计的基本模式包括单组准实验设计、多组准实验设计。前实验设计与事后设计都属于非实验设计的范畴。
11.根据所采用的控制额外变量方法的不同,可以将真实验设计分为( )。
A.完全随机设计
B.随机区组设计
C.多因素设计
D.单因素设计
【答案】AB
【解析】完全随机设计通过随机给自变量不同水平分配被试的方法控制额外变量,随机区组设计则是按照某些特征将被试分成不同的区组,让每一组被试接受不同水平处理来控制额外变量。
12.下列关于反应时的概念说法正确的是( )。
A.反应时往往也被称为“反应的潜伏期”
B.反应时是指大脑进行加工的时间
C.反应时是刺激呈现到反应开始之间的时距
D.反应时是大脑作出指令到反应开始的时距
【答案】AC
【解析】反应时是指从刺激呈现到有机体做出外显应答之间的时间间隔,也即接受刺激到做出反应之间的潜伏期。
13.有可能采用反应时作为因变量的研究是( )。
A.短时记忆提取方式的研究
B.字形字号对认知加工速度的影响
C.奖励对再认记忆影响的研究
D.视觉搜索加工机制的研究
【答案】ABCD
【解析】反应时是一种反应变量,它可以作为成就的指标及内部过程复杂程度的指标。因为对于一件工作越熟悉,反应时就越短;内部过程越复杂,反应时就越长。在心理学实验中,反应时常作为因变量。
14.以下关于加因素法的描述中,正确的有( )。
A.加因素法是由认知心理学家斯腾伯格在1969年提出的
B.加因素法是对减法法的完全否定
C.加因素法提出之后,反应时研究便进入第二阶段,开始了反应时研究的新时期
D.证明短时记忆存在视觉编码的实验采用的是加因素法的原理
【答案】AC
【解析】加因素法不是对减法法的否定,而是对减法法的发展和延伸。证明短时记忆视觉编码的实验采用的是减法法的原理。
15.感觉的直接测量方法是( )。
A.数量估计法
B.节省法
C.绝对数量估计
D.整合法
【答案】AC
【解析】感觉的间接测量是指借助于某一中介变量或中介反应来测量感觉,比如恒定刺激法、最小变化法、调整法。而直接测量感觉就意味着对心理感受直接按其强度赋予数值,而不必通过如最小可觉差的个数等中介变量或有无刺激出现等中介反应。感觉直接测量法主要有数量估计、数量生产和绝对数量估计,数量估计和绝对数量估计之间并没有显著的不同。
16.影响被试的判定标准,从而达到最优决策的因素有( )。
A.信号和噪音的先验概率
B.支付矩阵
C.主观预期概率
D.信号和噪音的强度差异
【答案】ABC
【解析】影响被试判断标准的因素有:①信号和噪音的先验概率;②判定结果的奖惩;③被试欲达到的目的;④其他因素(速度与准确性权衡、有关实验的知识与经验、主观预期概率、系列跟随效应)。支付矩阵是指先验概率和奖惩标准的结合。信号和噪音的强度差异影响判断准确性,不影响判断标准。
17.制作感觉比例量表的方法有( )。
A.差别阈限法
B.数量估计法
C.对偶比较法
D.感觉比例法
【答案】BD
【解析】感觉比例法又称分段法,是制作感觉比例量表的一种直接方法。数量估计法也是制作比例量表的一种直接方法。差别阈限法是制作感觉等距量表的方法;对偶比较法是制作感觉等级量表的方法。
18.人类的感知系统好比是一个信号觉察器。我们把各种刺激看做是信号,噪音包括( )。
A.刺激的随机物理变化
B.感官信息处理中的随机变化
C.感觉器官
D.中枢神经
【答案】AB
【解析】信号和噪音是信号检测论中两个基本的概念。信号就是个体要完成的任务,凡是对个体完成任务起干扰作用的都是噪音,它包括刺激的随机物理变化和感官的随机变化。
19.可以刻画一个分数在它所属分数组中所处的位置的数值为( )。
A.Z
B.CV
C.S
D.百分位数
【答案】AD
【解析】Z分数是指以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。百分位数是指量尺上的一个点,在此之下包括数据分布中全部数据的一定百分比。CV是指标准差对平均数的百分比。S用来表示数据的离散程度。
20.AB两变量线性相关,变量A为符合正态分布的等距变量,变量B也符合正态分布。计算它们的相关系数应可以采用( )。
A.积差相关系数
B.点双列相关
C.斯皮尔曼等级相关
D.肯德尔和谐系数
【答案】AC
【解析】积差相关适用条件为:成对数据,正态连续双变量,线性相关。斯皮尔曼等级相关适用于等级变量和非正态分布的变量之间的相关分析。能用积差相关的方法求相关的,也都能用斯皮尔曼等级相关,只是斯皮尔曼等级相关的精确度就小了。
21.样本容量是由( )等因素决定的。
A.统计抽样的基本原理
B.研究的内容
C.采用的研究方法
D.课题本身的客观条件
【答案】ABCD
【解析】选择研究被试样本是研究设计的一个十分重要的环节。样本容量的确定要综合考虑以下因素:统计抽样的基本原理、研究的内容、采用的研究方法和课题本身的客观条件。
22.“非参数”概念的含义是指( )。
A.非参数模型
B.检验的问题与参数统计不同
C.不依赖总体分布的性质
D.自由分布检验
【答案】ABCD
【解析】非参数的概念可以从几个不同角度理解:首先它是指非参数模型。其次,在非参数统计中面临的问题也与参数统计中不同。最后,在非参数统计中使用的统计量与参数统计中使用的统计量也不同,具有不依赖总体分布的性质。非参数检验又称任意分布检验。
23.一个良好的估计量应具备的特征有( )。
A.无偏性
B.一致性
C.有效性
D.充分性
【答案】ABCD
【解析】好的点估计量应具备的特性:①无偏性,一切可能样本统计量的值与总体参数值偏差的平均值为0;②有效性,当总体参数不只有一种无偏估计量时,某一种估计量的一切可能样本值的方差小者为有效性高;③一致性,当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值;④充分性,一个容量为n的样本统计量,应能充分地反映全部n个数据所反映的总体的信息。
24.下列说法正确的是( )。
A.各抽样分布之间是有本质区别的
B.没有概率论就没有推断统计的各种方法
C.随机化原则就是不施加任何人为干预的抽样原则
D.抽样分布就是关于样本统计量的分布
【答案】BD
【解析】①推断统计的数学基础为概率理论以及在此基础上发展而来的次数分布理论和抽样理论。②抽样分布是描述样本统计量分布特征的一类分布,各抽样分布之间无本质区别。③随机化原则就是保证每一个体按照概率原理被抽取的可能性相等的原则。
25.以下关于假设检验的说法正确的有( )。
A.假设检验仅用于两个平均数、方差(标准差)、相关系数等参数间的比较
B.假设检验的主要依据是数学逻辑反证法
C.假设检验应该包括非参数检验在内
D.假设检验因总体分布形态等前提条件的不同而需要采用不同方法
【答案】CD
【解析】假设检验的基本任务就是事先对总体参数或总体分布形态做出一个假设,然后利用样本信息来判断原假设是否合理,从而决定是否接受原假设。假设检验包括参数检验和非参数检验,假设检验的基本思想是概率性质的反证法。
26.为研究教室照明对学习效果的影响,将教室亮度控制在三个水平上,则称这种方差分析是( )。
A.单因素方差分析
B.双因素方差分析
C.三因素方差分析
D.单因素三水平方差分析
【答案】AD
【解析】单因素方差分析或单向方差分析,是指对各种处理的分类仅以单个自变量为基础的实验进行的方差分析。教室亮度是实验中惟一的自变量。
27.项目反应理论的特点是( )。
A.可以通过等值转换,把不同样本组中的项目参数转到同一量表上
B.在估计项目参数时,不能估计考生的能力参数
C.仍存在测验难以实现等值的问题
D.具有参数的不变性,比较容易建立高质量的题库
【答案】AD
【解析】项目反应理论采用局部独立性假设与样本独立项校准的方法,可以通过等值转换,将在不同样本组中求得的题目参数转到同一量表上。项目反应理论在估计题目参数的同时,也估计了考生的能力参数。项目反应理论具有参数不变的性质,因而比较容易实现建立高质量题库的目标。项目反应理论由于其题目参数的稳定性,能够比较好地解决题目特异功能分析和测验等值等问题。
28.外部效度的影响因素有( )。
A.实验环境的人为性
B.没有预备实验
C.测量工具的局限性
D.样本缺乏代表性
【答案】ACD
【解析】实验的外部效度是指实验结果能够普遍推论到样本的总体和其他同类现象中去的程度,即实验结果的普遍代表性和适用性。外部效度的影响因素主要有:实验环境的人为性、被试样本缺乏代表性、测量工具的局限性。
三、名词解释
1.二项分布[南开大学2016研]
答:二项分布指的是实验仅有两种不同性质结果的概率分布,即各个变量都可归为两个不同性质中的一个。由于两个观测值是对立的,因而二项分布又可说是两个对立事件的概率分布。
2.整群抽样[首都师范大学2015研]
答:当被试以一些自然的组合单位成为各种团体时,如班级、工厂、医院等,便可以以一整群为单位随机抽样,这种抽样方法称为整群抽样。在第一阶段整群抽样中,被选中的单位团体将全部进入样本,每个团体都有同等的机会被抽到。为得到样本,研究者给每一个“整群”赋上从1到K的标签,然后利用随机数码表抽取单个被试。一般地,整群的容量大小不等,整群内部的被试比起总体来更趋于同质。
3.信度与效度[苏州大学2013研;南开大学2012研;陕西师范大学2012研;西南大学2012、2011研]
答:信度指的是测量结果的稳定性程度。若能用同一测量工具反复测量某人的同一种心理特质,则其多次测量的结果间的一致性程度就叫信度,有时也叫测量的可靠性。其测量定义为,一组测量分数的真变异数与总变异数(实得变异数)的比率,含义是在实得分数的变异中有多大比例是由真分数的变异决定的。信度是衡量一个量表质量高低的重要指标之一。信度系数愈高即表示该测验的结果愈一致、稳定与可靠。
效度是测量的有效性或正确性,是指一个测验或量表实际能测出其所要测的心理特质的程度。其测量定义为,在一列测量中,与测量目的有关的真实变异数(由所要测量的变因引起的有效变异)与总变异数(实得变异数)的比率,含义是有多大比例的变异是由测验所要测量的变因引起的。效度是对测量工具的最基本的要求。效度系数愈高即表示该测验测验能测量到所需要测的东西,测验越有效。
4.标准分数[首都师范大学2012研]
答:标准分数又称基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置,从而明确该分数在团体中的相对地位的量数。标准分数从分数对平均数的相对地位、该组分数的离中趋势两个方面来表示原始分数的地位。
5.双侧检验[首都师范大学2012研]
答:双侧检验是只关心μ1和μ0是否有差异,而不关心到底μ1与μ0哪个更大,即只强调差异而不强调方向性的检验叫做双侧检验。
6.I型错误[首都师范大学2012研]
答:Ⅰ型错误又称α错误或弃真错误,是指虚无假设H0本来是正确的,但拒绝了H0,所犯的错误。
7.内容效度[首都师范大学2012研]
答:内容效度是指一个测验实际测到的内容与所要测量的内容之间的吻合程度。估计一个测验的内容效度就是去确定该测验在多大程度上代表了所要测量的行为领域,所要测量的内容或行为领域通常包括欲测的知识范围,以及该范围内各知识点所要求掌握的程度两个方面。内容效度主要应用于成就测验,也适合于某些用于选拔和分类的职业测验,不适合用于能力倾向测验和人格测验。
8.能力倾向测验[首都师范大学2012研]
答:能力倾向是一个人的潜在能力,这种潜在能力在予以训练后,很容易使个人获得某种知识或技能。能力倾向测验涉及广泛的学习经验,是在一定遗传素质基础上各种经验积累的结果,只能预测一个人在将来某个方面的可能成就,并不能保证这个人这个方面就一定会获得成功。
9.区间估计[首都师范大学2011研]
答:区间估计就是根据估计量以一定可靠程度推断总体参数所在的区间范围,它是用数轴上的一段距离表示未知参数可能落入的范围,它虽不具体指出总体参数等于什么,但能指出未知总体参数落入某一区间的概率有多大。
10.区分度[首都师范大学2011研]
答:区分度是指测验项目对被试心理品质水平差异的区分能力。具有良好区分度的项目,能将不同水平的被试区分开来,也就是说,在该项目上水平高的被试得高分,水平低的被试得低分。反之,区分度低的项目则对不同水平被试不能很好地鉴别,水平高与水平低的被试,所得分数差不多,甚至正好相反。
11.离差智商[西南大学2011研]
答:离差智商是指用标准分数来表示的智商,即让每一个被试和他同年龄的人相比,而不像以前比奈量表所用的智商是和上下年龄的人相比。以某一年龄段内全体人的智力分布为正态分布,以该年龄组的平均智商为参照点,以标准差为单位求得的个体在智力测验中的标准分数。
12.遗传限[西南大学2011研]
答:遗传限是指个体发展受制于遗传的一段阈限,即从下限到上限之间的一段距离。就智商而言,按照遗传限的观点,遗传规定了个体可能表现的最低到最高的IQ分数。这种说法类似于潜能的概念。每个人的潜能大小是不一样的,其原因就在于各人的遗传限的大小不同。
13.现场实验[西南大学2011研]
答:现场实验是指在实际生活情境中对实验条件作适当控制所进行的实验。研究者按照研究目的主动控制或变化某一条件,以考察被试在自然情景中特定的心理现象。现场实验的优点是研究的问题来自生活实际,具有直接的实践意义;避免了观察法等待考察现象出现需时过长或难以分辨结果的多因性等缺点;也排除了实验室实验中因人为的实验环境或紧张气氛而影响被试心理表现等缺点。
四、简答题
1.编制心理测量量表时选定常模的步骤。[统考2016研]
答:常模是根据标准化样本的测验分数经过统计处理而建立起来的具有参照点和单位的测量量表。在这个量表上,被试可根据自己的测验分数找到自己在团体中的所处的地位。
制定常模需要三步:
(1)确定有关的比较团体,也就是确定测验将用于哪一个群体。根据测验群体,选定最基本的统计量,决定抽样误差的允许界限,在此基础上设计具体的抽样方法,并对该群体进行抽样,得到常模团体。
(2)对常模团体进行施测,并获得该团体成员的测验分数及分数分布;
(3)确定常模分数类型,把原始分数转化为量表分数,制作常模量表,同时给出抽取常模团体的书面说明、指南等。
2.一个怎样的心理测验才算得上是较好的测验?[首都师范大学2013研]
答:衡量心理测验客观性的指标包括以下几个:信度和效度,难度和鉴别力。
(1)信度
信度指的是测量结果的稳定性程度。若能用同一测量工具反复测量某人的同一种心理特质,则其多次测量的结果间的一致性程度就叫信度,有时也叫测量的可靠性。其测量定义为,一组测量分数的真变异数与总变异数(实得变异数)的比率,含义是在实得分数的变异中有多大比例是由真分数的变异决定的。信度是衡量一个量表质量高低的重要指标之一。信度系数愈高即表示该测验的结果愈一致、稳定与可靠。包括重测信度、复本信度以及内在一致性信度等。
信度高低可用相关系数来表示,即用相关系数来估计两个随机变量一致性变化的程度。不同的测验内容,对相关系数的要求有所不同。一般标准智力测验应达到0.85以上,个性测验和兴趣测验一般应达0.70~0.80水平。学业成就测验要求信度在0.90以上,才能被称为是一个良好的测验。
(2)效度
效度是测量的有效性或正确性,是指一个测验或量表实际能测出其所要测的心理特质的程度。其测量定义为,在一列测量中,与测量目的有关的真实变异数(由所要测量的变因引起的有效变异)与总变异数(实得变异数)的比率,含义是有多大比例的变异是由测验所要测量的变因引起的。效度是对测量工具的最基本的要求。效度的种类包括内容效度、结构效度以及效标关联效度。
效度系数愈高即表示该测验测验能测量到所需要测的东西,测验越有效。效度是心理测验最重要的客观性指标,没有效度指标的测验是不能使用的。鉴别一个测验的好坏,其首要指标就是效度。
(3)难度与鉴别力
①项目的难度。项目难度是衡量测题难易水平的数量指标。估计项目难度的方法通常是以被试通过每个项目的百分比来决定的。如果某一项目通过百分比太高或太低,这说明该项目太易或太难。
②项目的鉴别力。项目的鉴别力是衡量测题对不同水平被试区分程度的指标。估计项目鉴别力的方法通常是以不同水平的被试通过每个项目的百分比之差来决定。项目的难度和鉴别力之间有一定的关系。一般中等难度的项目鉴别力最高。一个好的测验项目安排要客观,项目的选择也应客观。
3.简述编制心理测验的步骤与程序。[首都师范大学2013研]
答:(1)确定测验目的。确定测验目的包括明确测量对象、明确测量目标和明确测量用途。
(2)制定编题计划。编题计划是编制测验的总体构思,包括编题计划要明确的信息和编题计划的用途。
(3)编辑测验项目。在编辑测验项目时需要解决三个问题:收集测验资料、选择项目形式以及编写测验项目。
(4)预测与项目分析。预测的目的在于获得被试对测验项目做何反应的资料。测验项目分析就是对预测结果进行统计分析,确定项目的难度和区分度。
(5)合成测验。合成测验就是把经过预测以后证明有价值的项目排成有组织的测验。它要解决的问题有两个:一是测验项目的选择;二是测验项目的编排。如要编制复本,还须懂得怎样编制复本。
(6)测验标准化。标准化是指测验的编制、施测、评分以及解释测验分数的程度的一致性。具体地说,测验标准化包括下列内容:测验内容、施测过程、测验评分、测验分数的解释。
(7)鉴定测验。鉴定测验主要是确定其信度系数、效度系数以及测验量表和常模。
(8)编写测验说明书。测验说明书向测验使用者说明如何使用该测验,以此才能保证测验的信度和效度。
4.简述心理测量的误差来源。[苏州大学2013研]
答:心理测量误差指的是在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。心理测量有两种误差,即随机误差和系统误差。系统误差只影响测量的准确性,不影响稳定性。而随机误差既影响稳定性又影响准确性。
在物理测量中,误差来源主要有3个,即测量工具、被测对象以及施测过程。当被测对象本身不稳定或测量工具不科学,或施测时的条件、操作等不合要求时,测量便必然会出现误差。同样,心理测量的误差也来自3个方面,即测量工具、被测对象和施测过程。
(1)在测量工具方面,心理测量与物理测量有所不同。心理测量工具通常是一套以测验(问卷)为核心的刺激反应系统(通常称作量表)。心理测量量表是否稳定、是否真正测到了所要测的东西是测量工具造成误差的两种主要原因。
(2)在测量对象方面,造成测量误差的主要原因是受测者真正水平是否得到正常发挥。一般地,受测者的某种心理特质水平是相对稳定的,但是他在接受测量时的生理和心理状态会影响其水平的正常发挥。
(3)在施测过程方面产生测量误差的原因主要是一些偶然因素(恒定因素较易控制)。
5.简述控制额外变量的方法。[苏州大学2013研]
答:在心理实验中,对额外变量的控制方法主要有如下几种:
(1)消除法,指把额外变量从实验中消除出去的方法。例如,如果外界的噪音和光线影响实验,最好的办法就是进入隔音室或暗室,这样就把它们直接消除掉。双盲实验也是一种消除法,即在主试和被试都不知道实验目的的前提下实施实验。
(2)恒定法,指实验者采取一定措施使某些额外变量在整个实验研究中保持不变。如采用同一地点、同一仪器、同一主试、同一时间段;按同一实验程序或步骤进行实验;选择智力、性别、年龄、受教育程度相同的被试等。
(3)随机取样法,指把被试随机地分派到各处理组中去的技术。在理论上可使不同组的被试除实验条件外,其他额外变量保持相等。随机取样法是控制额外变量较好的方法。
(4)等组匹配法,指使实验组和控制组中的被试属性相等的一种方法。使用等组匹配法时,先要测量所有被试身上与实验任务有高相关的属性,然后根据测得的结果将被试分成属性相等的实验组和控制组。
(5)抵消平衡法,主要用于控制顺序效应和处理水平之间的权重效应。抵消平衡法有ABBA法和拉丁方法。
(6)统计控制法,指在实验之后采用统计分析技术,把影响实验结果的额外变量的效果区分出来的方法。包括协方差分析和剔除极端数据等。例如,在对两班学生进行实验以比较两种教学方法的好坏时,无法对智力因素加以控制。实验后,使用协方差分析将智力因素所产生的影响排除后再比较两种教学方法的优劣。
6.简述影响测量信度的主要因素。[首都师范大学2012研]
答:信度是测量过程中随机误差大小的反映。随机误差大,信度就低,随机误差小,信度就高。影响信度的因素很多,被试、主试、测验内容、施测环境等各方面均能引起随机误差,导致分数不一致,从而降低测验的信度。下面介绍几个影响测验信度系数的重要因素。
(1)被试因素
①就单个被试而言,被试的身心健康状况、应试动机、注意力、耐心、求胜心、作答态度等会影响测量误差,因为这些因素往往会影响被试心理特质水平的稳定性。
②就被试团体而言,团体内部的异质程度与分数的分布有关,一个团体越是异质,其分数分布的范围也就越大,信度系数也就越高,这样就很可能会高估实际的信度值。反之,团体内部水平相差不大时,得分分布必定会较窄,有可能低估真正的信度值。此外,信度系数也受样本团体平均水平的影响,对于不同水平的团体,项目具有不同的难度,每个项目在难度上的变化累积起来便会影响信度。
(2)主试因素
对于施测者而言,如果不按指导手册中的规定施测,或故意制造紧张气氛,或通过指导语等给考生以暗示、协助等,则测量信度会大大降低。其次,如果评分者没有一个统一的标准答案或者评分标准等,也会降低测验的信度。
(3)施测情境因素
在实施测试时,测验现场条件,如通风、温度和光线情况以及考场的噪音、桌面好坏等都会影响到测验的信度。
(4)测量工具因素
以测验为代表的测量工具是否性能稳定是测量工作成败的关键,以下几个因素是影响测验稳定性的主要因素。
①测验的长度
一般来说,测验越长,信度值越高。测验加长,可能改进项目取样的代表性,从而能更好地反映受测者的真实水平;测验的项目越多,在每个项目上的随机误差就可以互相抵消。
②测验的难度
测验的难度与信度没有直接对应关系,但是当测验太难或太易时,被试的回答都倾向于一致,则分数的范围就会缩小,从而降低信度。
③试题的同质性程度
当一份测验中的同质性题目数量增多之后,同一心理特质被考察到的次数就会增多,被试的成绩就能被有效拉开,整个团体的测验分数分布就会更广,从而提高测验的信度。
④两次施测的间隔时间
在计算重测信度和稳定性与等值性系数(复本信度之一)时,两次测验相隔时间越短,其信度值越大;间隔时间越长,其他因素带来影响的机会就多,因而其信度值就可能越小。
7.简述假设检验的步骤。[首都师范大学2012研]
答:一个完整的假设检验过程和具体分析步骤,包括以下五个方面的内容:
(1)根据问题要求,提出虚无假设H0和备择假设H1。
(2)选择适当的检验统计量。直接用样本原始观测值检验假设是困难的,必须借助于根据样本构造出的统计量,而且对不同类型的问题需要选择不同的检验统计量。
(3)规定显著性水平。显著性水平的大小应根据研究问题的实际情况而定,若要求结果比较精确,则显著性水平应小一些;反之,若要求结果不那么精确,则可稍大一些。通常显著性水平为0.05,较严格也可以用0.01或者更小。显著性水平确定后,拒绝域也随之而定。
(4)计算检验统计量的值。根据样本资料计算出检验统计量的具体值。
(5)做出决策。根据显著性水平α和统计量的分布,查相应的统计表,查找接受域和拒绝域的临界值,用计算出的统计量的具体值与临界值相比较,做出接受虚无假设或拒绝虚无假设的决策。
另外,在假设检验中需要注意的是,在处理调查或实验数据时,经常讨论的有关两个平均数、两个比率、两个方差、两个相关系数这些统计值之间的差异问题,一般分为两种情况:样本统计量与相应总体参数的差异,两个样本统计量之间的差异。
8.方差分析和t检验中的齐性检验有什么不同?[华东师范大学2012研]
答:方差齐性检验也称之为方差一致性检验。方差分析和T检验中方差齐性的检验基本原理是一致的,在方差分析里常采用哈特莱最大F检验法。方法是计算出各处理组的方差,选出处理组中最大的方差和最小的方差。以大比小得出一个比值,即最大Fmax值。然后查最大Fmax值检验表进行检验。
平均数差异的显著性检验即T检验之前,应首先进行方差一致性检验。检验的目的是判定两个样本是否来自方差一致的总体,如果两个样本不是来自方差一致的总体,一个总体的数据比较分散,一个总体的数据相对集中,它们的总体平均数的代表性就不一致,分散的数据平均数代表性就小,集中的数据平均数的代表性就大,因此方差不一致的两个平均数不适宜直接比较,需要作特殊的统计处理。当推论两总体方差一致时,才可以作平均数差异的显著性检验。
方差分析中的前提之一是方差齐性。在进行方差分析之前,要进行方差一致性检验,检验的目的是为了判定各处理组的变异是一致的。如果方差不一致说明有的组的数据特别分散,有的组的数据相对集中,因此各个平均数的代表性不一致,此时检验要采用方差不一致方差分析的方法。
9.何谓信度?信度有哪些种类?[浙江师范大学2012研]
答:(1)信度是指测量结果的稳定性程度。同一测量工具反复测量某人的同一种心理特质,则其多次测量的结果间的一致性程度就叫信度,有时也叫测量的可靠性。
(2)信度包括:重测信度、复本信度、同质性信度、评分者信度。
①重测信度指的是用同一个量表对同一组被试施测两次所得结果的一致性程度。
②复本信度指的是两个平行的测验测量同一批被试所得结果的一致性程度。当同一测验不能用来实施两次时,就需要给同一种测验编制两份平行的测验,这样就可以分别用这两个平行测验进行测试。
③同质性信度也叫内部一致性系数,它是指测验内部所有题目间的一致性程度。当被试在同一测验里表现出跨项目的一致性时,就称测验具有项目同质性。内部一致性信度有两种方法:分半法和基于项目协方差的方法。分半法通常是先把一份测验按题目的奇偶顺序或其他方法分成两个尽可能平行的半份测验,然后计算两半之间的相关,即得到分半信度系数。而基于项目协方差的方法则是以项目统计量为转移,利用每道测题的方差或协方差来计算信度。
④评分者信度指的是多个评分者给一组测验结果进行评分的一致性程度。有些情况下,被试的得分会受到评分者的主观判断的影响,不同的评分人员对相同被试的评分存在着差异,典型的如投射测验、职业选拔中的面试测验等,这时需要考虑评分者之间的一致性。
10.列举并简介心理学的主要研究方法。[曲阜师范大学2011研]
答:心理学的研究方法很多,主要包括观察法、心理测验法、实验法与个案研究法四种研究方法。
(1)观察法
观察法是指在自然条件下,对表现心理现象的外部活动进行有系统、有计划的观察,从中发现心理现象产生和发展的规律性。是最原始、应用最广的科学研究方法。
观察法主要适用于以下几种情况:
①对所研究的对象无法加以控制;
②在控制条件下,可能影响某种行为的出现;
③由于社会道德的要求,不能对某种现象进行控制。
观察法的主要优点是被观察者在自然条件下的行为反应真实自然,其主要缺点是不能探索因果关系,不能控制需要观察现象的产生,研究结果难以重复验证和进行进一步的分析,并且观察资料的质量容易受本人的兴趣、愿望、知识经验和观察技能的影响。
(2)心理测验法
心理测验法是指用一套预先经过标准化的问题(量表)来测量某种心理品质的方法。可以用来了解个体或团体的心理特征;探讨心理特征与外界因素的关系;比较不同个体或团体之间的心理差异。按内容可分为智力测验、成就测验、态度测验和人格测验;按形式可分为文字测验和非文字测验;按测验规模可分为个别测验和团体测验。
心理测验法的优点是编制严谨,结果可靠,施测简单快捷,结果处理方便,可以根据设立好的常模,进行比较研究,并且研究类型较多,可适应不同研究目的的需要;缺点是难以进行定性的分析、难以揭示变量之间的因果关系,并且现有的一些测验存在编制不严谨,操作复杂,信度不高等问题。
(3)调查法
研究者根据事先拟定的调查提纲或者言简易答的问题,直接访问被试或有关人员,将访问结果统计处理或文字总结,进行心理分析的一种方法。它可分为谈话法和问卷法两种。
(4)实验法
实验法是在控制的情境下,研究者有系统的操纵自变量,使之系统的改变,然后观察自变量与因变量之间关系的一种研究方法。包括实验室实验和自然实验。
①实验室实验是在严密控制实验条件下借助一定仪器所进行的实验。实验室实验的最大优点是,对无关变量进行了严格控制,对自变量和因变量作了精确测定,精确度高。其主要缺点是研究情境是人为的,脱离实际情境,难以将结论推广到日常生活中去。
②自然实验也叫现场实验,对实验条件进行适当的控制,使人们在正常的学习和工作情景中进行的。它消除了实验室实验的缺点,但是由于条件控制的不够严格,因而难以得到精密的实验结果。
(5)个案研究法
个案研究法是对某个被试或者一小组被试进行深入而详尽的观察与研究,以便发现影响某种行为和心理现象的原因的研究方法。
个案研究法的优点是探索性强,可以为所研究的问题提供详尽、全面的深层资料。其缺点是所收集的资料往往缺乏可靠性。此外,个案研究的结论不能简单地推广到其他个人或团体,但在经过多次同类性质的个案研究之后,可为研究者设计实验研究假设时提供参考。
11.简述方差分析的功能及应满足的条件。[首都师范大学2011研]
答:(1)方差分析的功能
方差分析也称变异数分析,是在教育与心理研究中最常用的变量分析方法。其主要功能在于分析测量或实验数据中不同来源的变异对总变异的贡献大小,从而确定测量或实验中因素对反应变量是否存在显著影响。它既可以比较两个以上的样本平均数,也可以应用于一个因素多种水平以及多个因素各有多种水平的数据分析。它是教育与心理研究中最重要的统计分析方法之一。
(2)方差分析应满足的条件
与应用其他统计方法一样,应用方差分析时也有一定的条件限制。数据必须满足以下几个基本假定,否则不能使用方差分析方法。
①总体服从正态分布
与Z检验及t检验一样,方差分析要求其样本必须是来自正态分布的总体,因此对不能确定总体是否为正态的样本资料,应进行总体分布的正态性检验,当检验表明其所来自的总体不是正态时,应对数据进行正态转换,或使用非参数方法。在教育与心理研究领域中,如果研究对象有足够的证据说明总体是服从正态分布的,一般情况下可以不再做正态性检验。
②变异的可加性
变异的可加性也可理解为变异的可分解性,它是方差分析所依据的一个基本原理。方差分析要求数据的总变异可以被分解成意义明确、彼此相互独立的几个不同来源的变异。
③各处理内的方差齐性
方差齐性又称方差一致性。方差分析中计算出的组内方差,实际上是将不同处理内的方差合成,与平均数差数显著性检验中两个样本方差合成求联合方差时要求两个样本方差无显著差异一样,求组内方差时也要求各实验处理内的方差彼此无显著差异,这是方差分析的最为重要的前提。如果这一假设不被满足,原则上是不能进行方差分析的。
12.为什么说测验“可靠不一定有效”?[首都师范大学2011研]
答:测验可靠但不一定有效实际上指的是测验的信度与效度之间的关系。
(1)测验的信度与效度
信度指的是测量结果的稳定性程度。换句话说,若能用同一测量工具反复测量某人的同一种心理特质,则其多次测量的结果间的一致性程度就叫信度,有时也叫测量的可靠性。一个好的测量工具,对同一事物反复多次测量,其结果应该始终保持不变。
效度指的是测量的有效性,即一个测验对它所要测量的特质准确测量的程度。一个测验总是为了一定的测量目的而编制的,判断它的效度高低,就要看它达到测量目的的程度。如果能正确地测量出所要测的东西,这就是高效度的测量。
(2)信度与效度之间的关系
①信度高是效度高的必要而非充分的条件。也就是说信度高效度不一定高。但一个测验要想效度高,真分数的变异数必须占较大的比重,即测验的信度必须高,即效度高信度一定高。
信度和效度的这种关系,反映到日常经验中就是,一个测量工具具有一定的信度,但对于某一个目的并不一定是有效的;而一个测量工具如果对于某一个目的是有效的,那么它一定是可信的。譬如,用米尺来量身高是有效的,也是可信的,而用米尺来量体重,虽然多次量得的结果是一致的,即有较高的信度,但它的效度却很低。这也就是我们为什么说测验是“可靠但不一定有效的”。
②测验的效度受它的信度制约,效度以信度为上限。
13.列举几种信度和效度,并说信度和效度的关系。[北京大学2011研]
答:(1)信度是指测量结果的稳定性程度。同一测量工具反复测量某人的同一种心理特质,则其多次测量的结果间的一致性程度就叫信度,有时也叫测量的可靠性。信度包括:重测信度、复本信度、同质性信度、评分者信度。
①重测信度指的是用同一个量表对同一组被试施测两次所得结果的一致性程度。
②复本信度指的是两个平行的测验测量同一批被试所得结果的一致性程度。当同一测验不能用来实施两次时,就需要给同一种测验编制两份平行的测验,这样就可以分别用这两个平行测验进行测试。
③同质性信度也叫内部一致性系数,它是指测验内部所有题目间的一致性程度。当被试在同一测验里表现出跨项目的一致性时,就称测验具有项目同质性。内部一致性信度有两种方法:分半法和基于项目协方差的方法。
a.分半法通常是先把一份测验按题目的奇偶顺序或其他方法分成两个尽可能平行的半份测验,然后计算两半之间的相关,即得到分半信度系数。
b.基于项目协方差的方法则是以项目统计量为转移,利用每道测题的方差或协方差来计算信度。
④评分者信度指的是多个评分者给一组测验结果进行评分的一致性程度。有些情况下,被试的得分会受到评分者的主观判断的影响,不同的评分人员对相同被试的评分存在着差异,典型的如投射测验、职业选拔中的面试测验等,这时需要考虑评分者之间的一致性。
(2)效度是指测量的有效性,即一个测验或量表实际测出其所要测量的心理特质的程度。它主要有三种类型,内容效度、结构效度和效标效度。
①内容效度
内容效度又称表面效度或逻辑效度,它是指所设计的题项能否代表所要测量的内容或主题。内容效度的评估方法主要应用于对学绩测验的评估。一个测验要有内容效度必须具备两个条件:要有定义得完好的内容范围;测验题目应是所界定的内容范围的代表性取样。确定内容效度的方法主要有专家判断、统计分析、经验法等。
②结构效度
结构效度也称构想效度,是指测验能说明心理学上的理论结构或特质的程度,或是用心理学上的某种结构或特质来解释测验分数的恰当程度。结构效度的特点包括:其大小首先取决于抽象的心理理论;当观察分数无法证实理论假设时,不一定说明该测验的结构效度不高;结构效度不是靠单一数量指标描述的,而是通过对测量内容选择的证据累计起来确定的。
③效标效度
效标效度又称准则效度、实证效度,是指一个测验对处于特定情景中的个体的行为进行预测时的有效性,即对于研究者所感兴趣的行为能够预测得怎么样。根据效标资料搜集的时间不同,又可分为同时效度和预测效度两种。效标是衡量测验是否有效且独立于测验的外在指标。效标效度一般可以通过统计分析得到一个数量指标,因而又可以称为统计效度。
(3)信度和效度之间存在着一定的联系。
根据真分数理论的表达式S2X=S2V+S2I+S2E,可以得到信度与效度的关系:
①信度高是效度高的必要而非充分的条件。
当随机误差的变异数减小时,真实分数的变异数增加,测验信度随之提高。信度的提高只给有效变异数的增加提供了可能至于是否能提高效度,还要看系统误差变异数的大小。可见,信度高不一定效度高。但一个测验要想效度高,真分数的变异数必须占较大的比重,即测验的信度必须高。信度和效度的这种关系,从日常经验中也可以看。一个测量工具具有一定的信度,但对于某一个同的并不一定是有效的;而一个测量工具如果对于某一个目的是有效的,那么它一定是可信的。
②测验的效度受它的信度制约。
根据真分数理论的基本公式,可以将效度表达式改成如下形式:
其中rXY表示效度,rXX表示信度系数。而式中S2I/S2X一定大于等于零,因而,效度的大小始终受信度系数大小的制约。
14.简述加法法反应时的基本原理,并以一个经典实验例证说明。
相似题型:简述相加因素反应时法及其实验逻辑。[山东师范大学2011研]
答:(1)相加因素反应时法概述
认知心理学家斯滕伯格发展了唐德斯的减数法反应时逻辑,提出了加法法则,称之为加因素法。它不是对减数法反应时的否定,而是减数法的发展和延伸。他认为人的信息加工过程是系列进行的而不是平行进行的,是由一系列有先后顺序的加工阶段组成。
(2)相加因素反应时法的实验逻辑
相加因素反应时法认为完成一个作业所需的时间是这一系列信息加工阶段分别需要的时间总和,因此,若两个因素有交互作用,则它们作用于同一个加工阶段;若两个因素不存在交互作用,即相互独立,则它们作用于不同的加工阶段。根据这个逻辑,研究者在影响反应时间的各种因素中找出独立的因素,即当两个因素影响两个不同的阶段时,它们将对总反应时间产生独立的效应,那么称这两个因素的影响效应是相加的。
(3)加法法的实验例证
斯滕伯格的短时记忆的信息提取实验是使用加法法分析心理过程的一个典型实验。下面简要介绍这个实验。
实验任务:先给被试看l~6个数字(识记项目),然后再呈现一个数字(测试项目),请被试判定其是否为刚才识记过的,同时开始计时,要求被试按键作出“是”或“否”的反应,计时也随即停止。这样就可以确定被试能否提取信息以及提取信息所需的时间(反应时间)。
实验结果及解释:通过一系列的实验,斯滕伯格从反应时的变化上确定了对提取过程有独立作用的四个因素,即测试项目的质量(优质的或低劣的)、识记项目的数量、反应类型(肯定的或否定的)和每个反应类型的相对频率。
根据实验中发现的这四个独立因素,斯滕伯格认为短时记忆信息提取过程包含相应的四个独立加工阶段,即刺激编码阶段、顺序比较阶段、二择一的决策阶段和反应组织阶段。按照斯滕伯格的看法,测试项目的质量对刺激编码阶段起作用,识记项目的数量对顺序比较阶段起作用,反应类型对决策阶段起作用,反应类型的相对频率对反应组织阶段起作用。可以看到,按照加法法的原理,每一个独立因素作用于一个单独的加工阶段。
15.请举例说明影响反应时的外部因素有哪些。
答:影响反应时的外部因素有:
(1)刺激因素
①刺激类型。不同类型的刺激通过特定的通道作用于各个感官,它们的反应时间是不同的。人类同一种感觉,刺激部位不同,反应时也不同,如视觉刺激离中央凹越远,反应时越长。
②刺激强度。一般来说,当刺激强度很弱时,反应时就长,而当刺激强度增至中等或较高时,反应时就缩短了。这里的刺激强度既包括一般意义上的物理强度,也包括刺激的空间面积、作用时间、刺激的联合与累积等。
③刺激的复杂程度。刺激越复杂(如刺激选择数目越多、刺激相似程度越低等),反应时间必然越长。
④刺激的呈现方式。刺激的呈现方式不同(比如不同的呈现位置、有无线索提示等),使得刺激的难度也不同,从而导致反应时的变化。
(2)环境因素
实验室的声光控制要符合实验要求,以被试舒适和符合正常的生活与工作环境为标准,对环境因素进行有效控制,避免实验室背景光和噪音对实验可能造成的不利影响。
(3)实验仪器方面的因素
仪器的性能是影响实验结果的重要因素,直接关系到实验结果的精确性、科学性和可靠性。实验仪器在技术上应该保证其精确度达到实验的要求(毫秒),反应键设计合理,符合被试的反应习惯等。
16.请举例说明影响反应时的机体因素有哪些。
答:影响反应时的机体因素有:
(1)适应水平
适应是指在刺激物的持续作用下感受器发生的变化。感受器的适应水平对反应时有明显的影响。例如,视觉的明适应使视觉刺激的反应时变慢,而暗适应使视觉刺激的反应时加快。
(2)准备状态
准备状态是指机体对某种行为作出准备的情况。准备时间太长或太短都会使反应时延长。有研究者以1秒、l.5秒和2秒作为预备时间的三个水平,对蹲踞式起跑时间进行了研究。结果表明,预备时间为l.5秒时,运动员的起跑速度最快。
(3)练习次数
练习与反应时的关系相当密切。在一定范围内,练习次数越多,反应会越快,直到一个极限而稳定下来。而且反应越复杂,练习效应越显著。
(4)动机
动机是由于人的某种需要所引起的有意识或无意识的行为指向。在反应时实验中,被试易受某种额外动机的影响。有研究表明,受惩罚时反应时最快,受奖赏时稍慢,正常情况下最慢。
(5)年龄因素
有研究表明,年龄因素对反应时的影响趋势是:在25岁之前,反应时随年龄的增长而减少;在25~60岁这一年龄段,反应时保持稳定;60岁以后,反应时明显增加。
(6)个体差异
个体差异是指不同个体之间在品质和属性上存在的差别。在反应时实验中常会遇到个别差异的问题。
(7)酒精及药物的作用
酒精以及药物作用于被试后,可能会对被试的某些生理、心理因素产生影响,从而使反应时发生变化。
(8)速度—准确性权衡
这是指在反应时实验中,被试能根据不同的实验要求或在不同的实验条件下,建立一个权衡反应速度与反应准确率的标准来指导其反应。例如,有时牺牲准确率换取反应速度,而有时牺牲反应速度换取准确率。
17.简述统计推断的核心逻辑。
答:统计推断最重要的内容就是假设检验,其核心逻辑是概率性质的反证法。
(1)虚无假设是统计推断的出发点。
在进行任何一项研究时,都需要根据已有的理论和经验事先对研究结果作出一种预想希望证实的假设,这种假设称为科学假设,记作H1。统计学中不能对H1的真实性直接检验,需要建立与之对立的假设,称为虚无假设,记作H0。假设检验的问题,就是要判断虚无假设H0是否正确,决定接受还是拒绝虚无假设H0。运用统计方法若证明H0为真,则H1为假;反之,H0为假,则H1为真。虚无假设与科学假设互相排斥并且只有一个正确。因而,虚无假设是统计推断的出发点。
(2)运用小概率原理进行反证法推论。
为了检验虚无假设,首先假定虚无假设为真。在虚无假设为真的前提下,根据假设检验中的小概率原理,如果导致违反逻辑或违背常识和经验的不合理现象(小概率事件)出现,则表明“虚无假设为真”的假定是不正确的,也就不能接受虚无假设。若没有导致不合理现象出现,那就认为“虚无假设为真”的假定是正确的,也就是说要接受虚无假设。这种反证法是统计推断的一个重要特点。通常情况下,将概率不超过0.05的事件当做“小概率事件”,有时也将其概率定为不超过0.01或者0.001。
18.简述方差分析的适用条件。
答:运用F检验进行的方差分析是一种针对所有组间平均数差异的整体检验。进行方差分析有一定的条件限制,数据必须满足以下几个基本假定条件,否则,由其推导出的结论将会产生错误。
(1)总体正态分布。方差分析要求样本必须来自正态分布的总体。
(2)变异的相互独立性。总变异可以分解成几个不同来源的部分,这几个部分变异的来源在意义上必须明确,而且彼此要相互独立。
(3)各实验处理内的方差要一致。各实验处理内的方差彼此应无显著差异,这是方差分析中最为重要的基本假定。在方差分析中,用MS作为总体组内方差的估计值求组内均方时,相当于将各个处理中的样本方差合成。它必须满足的一个前提条件就是,各实验处理内的方差彼此无显著差异。这一假定若不能满足,原则上是不能进行方差分析的。
19.请简述效度的种类。
答:效度是指测量的有效性,即一个测验或量表实际测出其所要测量的心理特质的程度。它主要有三种类型,内容效度、结构效度和效标效度。
(1)内容效度
又称逻辑效度,它是指所设计的题项能否代表所要测量的内容或主题。内容效度的评估方法主要应用于对学绩测验的评估。
一个测验要有好的内容效度必须具备两个条件:要有定义得完好的内容范围;测验题目应是所界定的内容范围的代表性取样。测验题目并不需要包罗该范围的所有材料,而只需包含测验编制者认为是重要的材料。
确定内容效度的方法主要有专家评定法、统计分析法、经验法等。
(2)结构效度
也称构想效度,是指一个测验实际测到所要测量的理论结构和特质的程度,或者说它是指测验能说明心理学理论的某种结构或特质的程度。
结构效度的特点包括:①其大小首先取决于抽象的心理理论;②当观察分数无法证实理论假设时,不一定说明该测验的结构效度不高;③结构效度不是靠单一数量指标描述的,而是通过对测量内容选择的证据累计起来确定的。
确定构想效度的方法主要有测验内方法和测验间方法。
(3)效标效度
又称准则效度、实证效度,是指一个测验对处于特定情景中的个体的行为进行预测时的有效性,也就是对于研究者所感兴趣的行为能够预测得怎么样,即以实践来检验理论的可靠性。
根据效标资料搜集的时间不同,又可分为同时效度和预测效度两种。所谓效标,是指衡量测验是否有效且独立于测验的外在指标。效标效度一般可以通过统计分析得到一个数量指标,因而又可以称为统计效度。
确定效标效度的方法主要有相关法、区分法、命中率和功利率等。
五、论述题
1.结合例子论述测验编制的基本程序。[苏州大学2016研]
答:测验编制分为以下几步:
(1)确定测验目的
一是要明确测量对象,也就是要明确测量哪些个人或团体。二是要明确测量目标,注意进一步把目标具体化。三是要明确测量用途。如果要编制人格测验,明确测验对象就是二十岁左右的成年人,测量目标就是人格,人格包括气质、性格和认知风格。
(2)制订编题计划
编题计划是编制测验的总体构思。编题计划要明确的信息主要有两个方面:一是全面而具代表性的测验内容,不致使题目偏离了应测的范围;二是对各个内容点的相对重视程度,通常用百分比来标明。可以通过编制双向细目表(详见后文)加以具体化。所有的题目都必须紧扣人格,以人格为中心。
(3)编辑测验题目
主要包括三个方面:收集测验资料、选择题目形式和编写测验题目。详细内容可参考后文“题目编制技术”部分。
(4)预测与分析
①初编的测验题目是否具有适当的难度和区分度,必须通过预测进行测验题目分析,以便进一步修改。预测的目的在于获得被试对测验题目作何种反应的资料。它既能提供哪些题目意义不清、容易引起误解等质的信息,又能提供测验题目优劣的量的指标。
②测验题目分析就是对预测结果进行统计分析,确定题目的难度和区分度。由于预测的被试样本小,可能会存在取样误差,由此获得的题目分析结果未必完全可靠。所以,需要对来自同一总体的两个样本施测,然后分别进行测验项目分析,比较两个样本的分析结果是否一致。
对与人格相关的题目进行预测和分析。
(5)合成测验
合成测验是把经过预测以后证明有价值的题目排成有组织的测验。需要解决以下两个问题:一是测验题目的选择;二是测验题目的编排。如要编制复本,还须掌握编制复本的技术。
(6)测验标准化
一个测验的好坏,取决于该测验标准化的水平。所谓标准化,是指测验的编制、施测、评分以及解释测验分数的程度具有一致性。测验标准化包括:测验内容的标准化;施测过程的标准化;测验评分的标准化;测验分数解释的标准化。
(7)鉴定测验
对测验的鉴定,主要是确定其信度系数和效度系数。信度指的是测验的可靠性,效度指的是测验的有效性。为了说明和解释测验结果,还必须根据测验的性质、用途以及所要达到的测量量表的水平,按照统计学的原理,把某一标准化样本的测验分数转化为具有一定参照点、等值单位的导出分数。
(8)编写测验说明书
测验说明书向测验使用者说明如何使用该测验,才能保证测验的信度和效度。说明书应包括下列内容:本测验的目的与功用;本测验的理论依据;测验内容及实施测验的方法,包括何种测验、内容分几部分、每部分有多少测验题目、如何作答,等等;测验的标准答案和评分方法;关于测验的信度、效度资料的说明;常模表,即如何依据常模解释测验结果。
2.参照常模的分数解释有几种?请分析各自的优缺点。[首都师范大学2011研]
答:心理测量分数通常用参照常模的办法解释。按照统计学的原理,把某一标准化样组的原始分数或测验分数转化为具有一定单位、参照点和连续体的导出分数,这就是我们所说的测验量表。导出分数能以相同单位来表示测验成绩,能参照相同的或近似的常模团体在不同的测验中的作业情况,于是个体在多种测验中的有关作业情况就可比较了。常见的参照常模的解释有以下几种:
(1)组内常模和量表
一般来说,所有的标准化测验都提供某种形式的组内常模。利用这种常模,个体的作业情况可以通过与和其最可比较的标准化团体的作业比较而得以评价。常用的组内量表包括:
①百分等级分数
百分等级是应用最广的导出分数。一个原始分数的百分等级是指在一个群体的测验分数中,得分低于这个分数的人数的百分比。
百分等级分数的主要优点是:具有可比性,易于计算、解释方便。适用于不同的对象和性质不同的测验。另外,百分等级不受原始分数分布状态的影响,即使分数分配不是正态的,也不会改变百分等级常模的解释能力。
百分等级分数的主要缺点是:单位不等,尤其在分配的两个极端。百分等级只具有顺序性,而无法用它来说明不同被试之间分数差异的数量。另外,百分等级是相对于特定的被试团体而言的,所以,解释时不能离开特定的参照团体。
②标准分数
标准分数是一种具有相等单位的量数,又称作Z分数,以z表示。它是将原始分数与团体的平均数之差除以标准差所得的商数,是以标准差为单位度量原始分数离开其平均数的分数之上多少个标准差,或是在平均数之下多少个标准差。标准分数还包括一些变式如T分数等。
标准分数的主要优点有:具有等单位特点,便于工作进一步的统计分析;正态分布下,可以利用正态分布表将各种导出分数与百分等级分数作换算;正态分布下,运用某种变式分数可以将几个测验上的分数作直接的比较。即使是非正态分布,也可运用由正态化的Z分数转换而得的变式分数进行直接比较分析。
标准分数的主要缺点是:分数过于抽象,不易理解,正如在介绍的T分数时所提到的那样不为一般人所熟悉;在非正态分布下,分布形态不同的变式分数,仍然不可以作相互比较,也不能相加求和。
(2)发展性常模和量表
测验分数的一个可能意义是通过对原始分数的变换使其明示:个体达到了怎样的程度,他的行为属于哪一个水平。人的许多心理特质如智力、技能等,是随时间以有系统的方式发展的,所以可将个人的成绩与各种发展水平的人的成绩比较而制成发展量表。主要的发展量表包括:
①智龄,即心理年龄
测量儿童心理成长,可以将一个儿童的行为与各年龄水平的儿童比较,以获得该儿童的心理发展水平。这需要得到一个可评价儿童智力发展水平的年龄量表。一个儿童在年龄量表上所得的分数,就是最能代表他的智力水平的年龄,这样的分数就称作智力年龄,简称智龄。
②年级当量
在教育成就测验中,分数的解释通常也采用年级当量。即将被试的测验成绩与某一年级的学生的平均分数作比较,而说成相当于某一年级水平。
③商数
在教育测验中,有时也采用商数来表明教育发展或成就的速率,常见到的有教育商数与成就商数。教育商数与智商类似,它是教育年龄与实际年龄之比。成就商数是将一个学生的教育成就与他智力作比较,即教育年龄与智力年龄之比。
关于发展性量表,总的来看其优点主要有:以年龄或年级当量作为单位来报告分数易于被人理解;可以与同等团体做直接比较;为个人内比较与纵向比较提供了基础。
但其也存在一定的缺陷,主要包括:只适用于所测的特质随年龄或年级发生系统变化的情况,因此仅适用于年纪小的儿童,对成人不适用;由于人的行为发展受教育与经验的影响,因此发展量表只适用于典型环境下成长的儿童;发展量表的单位不相等;获得同样的年龄或年级当量分数,并不一定具有相同的智力或学业水平。
3.简述心理测验的功能和应用。[南开大学2012研]
答: 近几年来,心理测验的应用日益广泛,主要体现在理论研究和实际工作两个方面。
(1)心理测验的理论应用
①搜集资料
心理学的理论研究常涉及个别差异问题,测验则是用来搜集有关资料的一个简便易行而又较为可靠的方法。心理学研究中许多数据都是通过测验得到的。例如,欲研究成功人士的人格特点,一个有效的方法便是对成功个体及普通个体分别施测某种标准化的人格测验,通过分析两者的测验结果得出结论。
②建立和检验假说
心理学中的许多理论是在分析测验资料的基础上提出来的,并用测验来进行检验。测验在基本理论的研究中所起的作用是不容忽视的,例如,在教育工作中,不同教育措施的效果往往通过测验来比较和检验。
③实验分组
在心理学研究中,常用测验来对被试进行实验分组,以达到等组化的要求。
(2)心理测验的实际应用
①选才
在教育、工业、军事、艺术、体育等部门,人们常常面临着选才问题,即辨认出哪些具有最大成功可能性的人。单凭经验观察和识别人才容易出现主观偏差,而心理测验的出现则为选才工作提供了科学、客观的量化手段。通过职务分析找出各种活动要求的最佳心理模式,然后根据这些特征设计出各种能力、人格及学绩测验,预测个体活动的适应性,从而提高人才选拔和职业训练的效率。例如,美国1942年制订的选拔飞行员的全套方案,使得淘汰率由65%下降到36%。
②安置
所谓安置,就是做好人与事的最佳匹配,它可以和选才结合起来,共同完成开发人力资源的任务。例如在学校把学生分到不同班级以便因材施教;在企业中,根据兴趣、能力特长将个人分配到适合的工作岗位上。心理测验的重要内容之一—职业测验将选拔和安置结合起来,日益发挥其巨大的作用,节约了许多人力、物力资源。
③诊断
对于智力落后者的鉴别是促进心理测验发展的原动力之一。直到今天,在临床上对各种智能缺陷、精神疾病和脑功能障碍的诊断仍是心理测验的主要应用和发展方向。并且,诊断功能并不局限于临床,在教育上还能发现学生适应不良的原因和学习困难之所在,搞清是缺乏某种特殊能力,还是某方面的知识没有掌握,抑或是性格不良,以便采取适当的帮助及补救措施。
④评价
心理测验可以评价人们在学习和能力上的差异、人格的特点以及相对长处和弱点;评价儿童已达到的发展阶段等。测验既可用于评价学生,也可用于评价教师和教学方法;既可用于评价个人,也可用于评价集体。测验还有助于人们的自我了解和自我评价
⑤咨询
各种学业、能力、兴趣、性格测验可以服务于升学、就业咨询,还可考察个体的情绪困扰和人格障碍,为健康咨询和行为矫正提供帮助。
值得注意的是,心理测验的结果只是作决策时要考虑的一个因素,而不是充分条件,因为测验只是一个辅助工具。在实际工作中,作决策还应结合其他方面的信息。除了上述分类方式,依据测验服务的领域划分,心理测验在教育领域(主要是成就测验)、心理咨询和心理治疗领域(主要是诊断型问卷)、人事管理领域都有十分广泛的应用。
4.论述以人为被试的心理学实验的伦理道德。[陕西师范大学2012研]
答:涉及人类被试的实验心理学研究必须遵循以下伦理原则:
(1)保障被试的知情同意权
这一原则规定,心理学实验的被试有权利了解实验目的和内容,并仅在自愿同意的情况下参与实验。研究者在实验进行之前必须如实告知被试研究的目的、程序以及研究所具有的特点,包括那些可能导致有害影响的内容。即使这种告知可能影响被试乐意参与研究的程度,研究者也要如实履行这项义务。
按照知情同意原则,研究者必须如实告知被试诱导程序可能会使其产生暂时的负面情绪体验,并让被试自己决定是否接受这样的实验安排。这样才能保证被试在进行实验之前就明确表明他们尽管知道实验过程中所做的一些事情可能令他们感到不快,但却仍然同意进行实验。
(2)保障被试退出的自由
这一原则规定,研究者必须尊重被试的自由,允许被试在任何时候放弃或退出实验,被试应当被告知自己有权利随时选择放弃实验。
仍然以研究抑郁情绪对工作绩效影响的实验为例,伦理原则保证了实验被试在诱导抑郁的过程中,随时可以放弃实验以停止继续产生负面情绪体验,尽管此前他们已经充分了解并同意了这样的实验程序。有时心理学实验的被试往往是选修实验心理学课程的大学生,这时研究者不应将参与实验作为唯一规定的作业要求,因为这样就剥夺了被试退出的权利。正确的做法是给学生更多选择权利,如写一篇论文,或者参与实验,或者听一场专题报告等,此时被试就具备了潜在的自由,他们可以选择参加或放弃实验。
(3)保护被试免遭伤害
这一原则要求研究者在实验进行中和完成后,都必须确保被试不会因为实验而产生任何不良反应。
在实验进行过程中,研究者必须对被试的状态保持密切注意。因为即使是最缜密、危险程度最小的研究计划都可能产生未曾预料的后果,所以研究者应当随时准备向被试提供帮助和建议。
(4)保密原则
所谓保密原则就是指在未经被试许可的条件下,研究者不应泄露被试在实验中的任何表现,尤其是被试的一些个人信息。保密原则看上去简单易行,但实际执行时却有可能遇到道德的两难境地。因此,实验心理学的伦理行为必须建立在实效的基础上,即研究者必须首先做到最好地保护被试,然后才考虑如何完成一项有意义且有效的研究。这就是科学研究有效性与道德伦理的统一。
5.效度的影响因素有哪些?如何提高测量效度?[南开大学2012研;曲阜师范大学2011研]
答:(1)凡能产生随机误差和系统误差的因素都会降低测验的效度。效度的影响因素如下:
①测验组成方面。试题是构成测验的要素,测验的效度取决于试题性能。测验取材、测验长度、试题的区分度、难度及其编排方式等皆与效度有关.要想提高测验的效度,须谨慎选择测验材料,适当安排测验的长度,使试题具有相当的鉴别力而且难易程度适中。
②测验实施方面。测验的实施程序是影响效度的重要因素。若主试能适当控制测验情景,遵照测验手册的各项规定而实施,就能避免外在因素对测验结果的影响。在测验实施的过程中,如果场地的布置、材料的准备、做答方式的说明、时间的限制等任何一方面不遵照标准化的程序进行,都会使效度降低,失去测验的意义。
③被试反应方面。被试的兴趣、动机、情绪态度和身心健康状况等,都能影响他在测验情境中的行为反应。被试是否充分合作,也会影响测验结果的可靠性与正确性。
④所选效标的性质。由于同一个测验可以有不同的效标,同一个观念效标也可以有不同的效标测量,所以还要考虑测验分数与效标之间是否符合线性关系的问题。因为积差相关的前提之一是两个变量之间具有线性关系,否则会得出错误的效度结论。在选用相关系数的计算公式时,要注意各公式的适用条件。
⑤测量的信度。测量的信度是测量的随机误差的反映,而任何误差的增加都会降低测量的效度,因此信度不高的测验不可能具有很高的测量效度。
(2)提高效度的方法有:
①妥善组织测验,控制系统误差和随机误差。在测验实施过程中,系统误差一般不太明显,但随机误差却有可能失控。这就要求测验实施者一定要严格按手册指导语进行操作,要尽量减少无关因素的干扰。
②精心编制量表,避免出现系统误差。题目样本要有较好的代表性,题目的难易程度、区分度也要恰当,题目的数量要适中。此外,试卷的印刷、题目作答的要求、评分记分的标准、题目意义的表述等,都必须严格检查。
③创设标准的应试情境,以利于被试发挥正常水平。否则,焦虑因素和其他无关影响过大,必然会降低测量的效度,使研究者测不到想测的内容或构想效度。
④选好正确的效标,定好恰当的效标测量,正确使用有关公式。如若研究者所选效标不当,或所选效标无法量化,则很难正确地估计出测量的实证效度。如果效标及效标测量都合乎要求,则公式的选择也是影响效度估计的重要方面。
除此之外还有扩大样本的容量和代表性;合理处理效度与信度的关系;适当增加测验或量表的长度等。
6.试述信号检测论的基本思想及其意义。
答:(1)信号检测论的基本思想
①信号检测实际就是从噪音背景中检测信号,所以信号和噪音是信号检测论中最基本的两个概念。在心理学领域,信号检测论所指的信号可以理解为刺激。而噪音就是信号所伴随的背景。信号检测论对信号的判别能力和判别标准进行了区分。
②信号检测论认为,在受到感觉刺激时,其实存在着两个过程,一个是感觉过程,其反映了刺激的强度;另一个是随之而来的独立的判断过程,其反映了被试的反应偏差。信号检测论的测量,是将所要觉察的刺激或刺激的差别视为信号,将可能与信号相混淆的刺激视为噪音,将信号出现时报告说有信号时称为击中,将信号出现而报告无信号时称为漏报,将信号未出现而报告无信号时称为正确否定,将信号未出现而将噪音报告有信号称为虚报。错报比正确否定愈小,表明判断标准愈高。在同等判断标准下,虚报比击中愈小,表明判断力愈高。信号检测论就是通过将被试者的辨别力,即感觉分辨力(d')和被试的反应偏差(β)的测定,把被试者的主观态度、动机因素等产生的干扰作用从感受性中排除,从而得到比较准确的结果。
③信号检测论对传统阈限概念的批评,来源于传统方法在阈限测量中无法有效排除众多非感觉因素的影响,因而废除了费希纳传统中的阈限思想,用主观决策标准加以取代。但不可否认的是,人类的感觉系统就其本身而言很可能存在着灵敏性的绝对限制——正如所有精密传感器那样,确实无法有效分辨低于某个强度水平的刺激。阈限理论和信号检测论都反映了感觉过程的某些方面,将两者整合之后,或可得到更全面的图景:感觉系统对刺激的有效分辨从某一强度开始,这一强度就是阈限;同时对于阈限以上强度的刺激,感觉报告将取决于感觉强度与某一主观决策标准相比较的结果。因而费希纳传统中的50%阈限其实是不存在的。
(2)信号检测论的意义
通过信号检测论可以排除主观标准设定的变动,求得感觉系统对某一强度刺激的感受性,增进人们对于阈限的理解以及提供传统和现代心理物理学整合的可能性。
7.有人说CTT模型“已经过时了”。你如何评价?
答:这种说法有一定道理,但是它只看到了经典测量理论的缺点,却忽视了经典测量理论的优点。因而具有片面性。
(1)经典测量理论有不少优点,包括:
①它是以随机抽样理论为基础,建立在简单的数学模型之上,其理论直观易懂,易于被人理解和接受,且计算简便容易推广。
②理论假设较弱,对实施条件要求不严格,适用性广,不论客观性测验还是主观性测验,单维测验还是多维测验,对其结果都能方便的予以分析。
③在多数情况下CTT是足够精确的,测验结果是可信的。
(2)经典测量理论的主要缺点,包括:
①基本假设难以成立。
真分数与观测分数之间存在线性关系的假定不合理,越来越多的研究表明真分数与测验分数间的非线性关系更符合事实;平行测验的假设难以成立,严格平行的测验是不存在的,即使同一测验在不同时间施测,也会因练习、疲劳、成熟等因素的影响而使测验分数产生变异;误差与真分数独立的假设难以满足。
②测验信度观存在严重问题。
CTT的信度是针对被试全体的。只代表平均测量精度。没有揭示出不同能力水平的被试测验误差不同的事实,信度的计算也严重依赖于被试样本,当样本的能力水平分布不同时,测验分数的分布范围具有差异,计算出的信度值就会不同。
③项目统计量(难度和区分度)严重依赖于被试样本。
当被试样本的能力水平不同时,项目的难度和区分度就不相同。
④对被试能力的估计依赖于测验题目的难度。
⑤对测验等值、适应性测验、标准参照性测验的编制等问题不能给以满意的解决。
五、实验设计
1.教师在教学中常常会使用新的教学方法,如果新方法使用后教学效果比使用前有所提高,教师一般会认为是新方法起了作用。如果将这项活动看成是一个心理学实验,请你从实验设计的角度评价教师的思考方式。
答:(1)教师的实验模式为单组前后测设计,属于对额外变量的控制很差,致使实验结果的可靠性很低的非实验设计。
(2)单组前后测设计是指在在实验处理之前增加了一次前测,通过前测可以获得所抽取样本的最初水平或心理特征,再与随后的后测结果进行比较,以分析实验处理的效应。其基本模式为:O1-X-O2,其中,O1为前测成绩(作为基线观测值),X为实验处理,O2为实施处理X后的测验成绩。
(3)单组前后测设计的优点是:可以比较实验处理前后的效果;全体被试既是实验组,又是控制组,有利于控制被试的个体差异。其局限是,单组前后测设计可能存在几种误差,包括历史(如与教学有关的其他活动)、成熟(如学生的智力发展)等方面。
(4)所以当新方法使用后教学效果比使用前有所提高,不能肯定地认为是教学的缘故。
2.有研究者想探究人对高、低频率声音简单反应时的差异,现有两种研究方案:
方案一:选取两组大学生,一组大学生只对高音反应,另一组大学生只对低音反应;
方案二:只选取一组大学生,要求他们对高、低音均反应。
请回答如下问题:
(1)简述两种方案的样本抽取、额外变量控制与统计方法。
答:①方案一是被试间设计。被试选择要完全随机以保证两个组除了自变量以外所有的方面都相等,那么,这两组在因变量上的差异主要就是由不同的自变量造成的,主要采用随机选择和随机分配。
如果研究所使用的被试数量较少,则一般采用匹配组设计的方法。匹配组设计就是对全部被试进行预备测验,测验的性质与正式实验的性质是类似的,或者是相关的,然后按测验成绩均匀地形成组。
使用独立样本t检验对两组后测成绩进行比较。
②方案二是被试内设计。一种实验条件下(高音)的操作将会影响另一种实验条件下(低音)的操作,所以要采用ABBA法平衡实验顺序。
使用相关样本t检验对高、低音的反应时进行检验。
(2)你觉得哪种方案更合适?给出理由。
答:方案二更好。
①被试内设计需要的被试较少,实验设计方便、有效。
②被试内设计比组间设计更敏感。
③被试内设计消除了被试的个体差异对实验的影响。
④声音频率不存在明显的学习效应,因此采用被试内设计不会产生明显的顺序误差。
方案一的缺点是分配到各实验条件下的被试可能在各个方面不是等同的,如果是这样,那么,不同实验条件造成的差异也可能是由于被试的差别引起的。
3.请用信号检测论技术设计一个实验,考察青年、中年和老年三个年龄段的被试对图形和文字材料记忆能力的差异。
答:(1)研究题目:
个体年龄对图形和文字材料记忆能力的影响
(2)研究假设:
随着个体从青年到中年,再到老年的年龄变化,个体对图形和文字材料的记忆能力下降。
(3)实验设计:
①实验自变量为年龄和记忆材料
②因变量为再认成绩
③根据实验要求,采用3(青年、中年、老年)×2(图形、文字)混合实验设计,年龄为组间变量,识记材料为组内变量。
(4)实验材料:
80张印有不同图形的卡片和80张印有不同文字的卡片。
(5)实验步骤:
①让被试依次看完40张图形卡片和40张文字卡片,学习图片和文字的顺序在被试间平衡。
②将被试学习的卡片与其他卡片混合。
③让被试判断混合后的卡片中哪些是学习过的,哪些是没有学习过的,记录被试的反应。
(6)结果处理:
计算被试虚报和击中的概率,依次分别计算不同年龄的被试在再认图片和文字时的辨别力d'的大小,以d'作为因变量的指标,通过两因素混合实验设计的方差分析,看看被试年龄对再认产生的影响。