第二篇 测量的种类

第3章 智力测验

3.1 复习笔记

一、智力测验的概述

(一)智力测验的含义

智力测验是指在一定的条件下,使用特定的标准化的测验量表对被试施加刺激、从被试的一定反应中测量其智力的高低。它包含两层含义:一是指实施智力测验须有标准化量表或者测验;二是指智力测验是在一定条件下使用量表给被试测试的过程。

(二)智龄、比率智商和离差智商

1.智龄

比奈的贡献不仅在于他和西蒙共同编制了世界上第一个正式使用的儿童智力量表,而且在对这个量表的修订过程中提出了较好的报告智力测验结果的办法。比奈—西蒙智力量表有三个版本,其中1908年量表测验项目按年龄分组,它是第一个年龄量表。以年龄为单位,它所测量的是某一儿童的智力究竟相当于哪一个年龄水平;测验结果用智龄(智力年龄Mental Age,MA)表示。测验编制者根据测题的难易将它们按年龄分组,被试通过某个测题得2个月智龄,或得4个月智龄等。然后通过智龄与实龄(实足年龄Chronological Age,CA)的比较来衡量儿童智力水平的高低。智龄只能表示一名儿童智力的绝对水平,它不能用来比较实龄不同的儿童智力的高低。

2.比率智商

(1)斯坦福大学教授推孟(L.M.Terman)于1916年发表了斯坦福一比奈智力量表。

(2)1916年量表的特点

这个量表共有90个测验项目,其中51个是比奈量表中所有的,其余是新编制的。

适用范围自3岁至14岁,另有普通成人和优秀成人两组。这个量表后在1937年、1962年、1972年、1986年都作了进一步修订。

斯坦福—比奈智力量表第二版的结果用智商(IQ)来报告。智商能表示智力的相对水平,成为比较儿童聪明程度的指标。

a.比率智商的计算公式

b.智龄与智商的比较

智龄只能表示智力的绝对高低,不能比较实龄不同儿童智力高低。智商IQ表示智力的相对高低,用智商则能明确地比较他们智力的高低。

c.比率智商的缺点

比率智商的基本假定是智力发展和年龄增长成正比,是一种直线关系,但实际上当年龄增大时就不是成这种关系。一般认为一个人在13岁以前的测验的绝对分数是直线上升的,以后逐渐缓慢下来,约至26岁左右停止增长,26岁至36岁之间保持无变化,出现高原期。

3.离差智商

为了克服比率智商存在的缺点,1949年韦克斯勒首次在他编制的儿童智力量表中采用了离差智商。这是计算智力测验结果的方法上的一次改革。离差智商实际上是同年龄组的标准分,它是根据同年龄组测得的平均分和标准差计算出来的。

(三)智力的分布和分类标准

人的智商分数的分布是一个呈钟型的常态曲线,它与理论的常态分布吻合。许多心理学家按照智商分数的分布对智力的水平加以划分并进行分类,其中最具代表性的是推孟和韦克斯勒的智力分类。

1.推孟的分类(如表3.1所示)

2.韦克斯勒的分类(如表3.2所示)

二、斯坦福一比奈智力量表第四版

(一)斯比智力量表发展概况

1.1916年量表

1916年美国斯坦福大学著名心理学教授推孟和他的同事们共同编制了斯比智力量表。

(1)删去了比西量表中许多旧题目,新增了三分之一以上的题目。重新调整和安排了各年龄组的题目。

(2)以美国人为样本,重新标准化,样组人数大约为1000名儿童和400名成人。

(3)附有详细的施测指导与记分方式。

(4)首次采用智商分数。

2.1937年量表

在1937年,推孟进行了第二次修订。

(1)采用复本形式,即L题本与M题本,增加了量表的内容。

(2)适用年龄由1916年的3~13岁扩展到1.5~18岁。

3.1960年版

(1)1960年发行了第三版,把L本和M本又合起来称为L-M单本。

(2)选取了1937年版中较合适的题目,删除了一些过时的题目,并且重新编排那些随着时代和文化变迁而难度变动了的题目。

(3)适用于2岁到成人

(4)以平均数为100,标准差为16的离差智商作为智力评估指标。

4.1972年版

此量表保持1960年量表进行了再次标准化,但测验内容不变。重新修订常模,取样代表性有了很大提高。

5.1986年版

斯坦福—比奈智力量表第四次修订版的修订者是美国著名的心理测验学家桑代克、黑根和沙特勒等。新版斯比量表在测验的理论框架、测验题型、测验内容、施测程序及心理计量学上的观念等方面,皆有创新之处。

(二)斯比量表第四版的理论框架和测验的构成

斯比量表第四版的理论框架是一个三层次的阶梯模式,其理论框架及相应的组成量表的各分测验如下如所示:

1.第一个层次

顶端为一般智力因素,即G因素。它是个人解决新的问题而组织其适应策略的一种认知组合及控制的过程。

2.第二个层次

由晶体能力、流体—分析能力及短时记忆构成。

(1)晶体能力因素。代表获取与运用语文或数量概念的知识以解决问题的认知技能,它是一种学术的或学业的能力因素。

(2)流体—分析能力因素。代表需要涉及图形的或其他非语言的刺激以解决新问题的认知技能。

(3)短时记忆的因素。短时记忆不仅能暂时地保存新接受的信息直到它能被存于长时记忆中,而且还能保存由长时记忆所取得而在进行的工作中的信息。所以短时记忆包含在认知能力的模式中。

3.第三个层次

目前已经发现的三个因素:语言推理、数量推理、抽象/视觉推理,这些因素比第一、二层次的因素更特殊和更“内容依赖”,它们对临床诊断人员及教育人员有特殊的意义。

(三)斯比量表第四版的特点

1.新版在内容上涵盖较广泛的认知技能及信息处理能力方面的测试,突破了早期版本较偏重语言的倾向,范围扩大至数量、空间及短时记忆。

2.新版修订者放弃了以前版本采用的“年龄量表”的形式,而采用“分测验”的形式,目的是为了测量认知的能力以分析个人认知发展的水平与类型。

3.新版量表有15个分测验,它们主要评估四个较大领域的认知技能,即:语言推理;数量推理;抽象—视觉的推理;短时记忆。

4.在施测程序上,新版仍然保存了原先适应性测验的特点,以保证所得的测验分数有较高的信度及准确性。

5.新版除了提供代表一般推理能力的总分之外,还可获得上述四个领域的分数,包括四个领域中任何组合的分数,以及15个分测验的个别分数。

6.新版附有各种不同能力组合的分测验常模,在实施上更具有弹性。

(四)斯比量表测试的对象和使用目的

1.施测对象

第四版的测验对象范围很广,适用于2岁幼儿至成人的不同智力水平的被试。

2.使用目的

(1)有助于区别智力落后儿童及学习障碍儿童;

(2)帮助学校教师、学校心理学家及从事心理辅导的人员了解学生在学校中有特殊的学习困难的原因;

(3)有利于鉴定智力超常学生;

(4)可以用来研究2岁至成人的认知发展。

(五)测验的施测和评分

1.施测

斯比量表属于个别智力测验。该测验由通过高度专业训练的人使用。实际施测、计分及结果的解释都需要特别的训练与经验。主试要对量表相当熟悉且要有实际操作的经验。

2.评分

(1)斯比量表的适应性的特点是要求测验的施测分阶段进行。第一阶段施测词汇分测验。第二阶段施测其他的分测验。

(2)斯比量表在实际使用时是一边施测一边计分,主试在操作程序上稍微的疏忽和指导语的内容改变都会导致测题难度的改变。

(3)在施测过程中,主试得以更多地观察被试的工作方法,问题解决方式,及其他与表现有关的质的方面的特点。主试可能也有机会判断被试某些情绪与动机上的特性。

(4)斯比量表第四版的记分本的第一页提供了记录这类行为观察的评等量表。量表施测过程中的质的方面观察的价值大部分取决于主试的测验技巧、经验以及心理学知识的水平,并且也决定于他对这类观察本身必然存在的限制及缺点的认识。

(六)15个分测验所测内容介绍

1.词汇分测验

词汇分测验是每个被试的例行测验,被试在这个分测验的表现决定被试在其他分测验的起点,因此这个分测验在施测的过程中扮演极重要的角色。该分测验共有46题,分为两大类:

(1)图画词汇(第1~14题),适用于3岁至6岁的年幼儿童。主试呈现一些物品的图画,要求儿童回忆再认并说出名称;

(2)口语词汇(第15~46题),适用于7岁以上被试。由被试解释词的意义。

2.珠子记忆分测验

这个分测验共有42题。测验的材料是4种形状(圆球体、圆锥体、长椭圆体、圆盘体)的珠子,每一种形状又有三种颜色,即蓝色、白色及红色。

(1)水准A至E共有10题,由主试呈现一至两粒珠子若干秒(如红色的圆锥体,白色的圆球体),再出示印有珠子的卡片,让被试指认;

(2)水准F至V共有32题(第11至第42题),实施的方式则呈现卡片范例若干秒,然后拿去卡片让被试者凭记忆来穿置珠子。

3.算术分测验

本测验共有40题,主要测量被试的数量概念及心算能力。

(1)利用骰子计算点数(第1至第12题);

(2)利用图画卡片进行的计算题(第13至第30题);

(3)心算为主的应用题(第31至第40题)。

4.语句记忆分测验

本分测验共有42题,是一种有意义材料的记忆。主试念2至22个字长的句子,被试照着复诵,按回忆的程度评分。

5.图形(形态)分析分测验

这个分测验共有42题。有两种类型测题:

(1)水准A至C有6题,被试需要将一些形块安置在形板的凹槽内;

(2)水准D至U有36题,要求被试将一些黑白对称的方块组合成几何图案。

6.理解分测验

该分测验共有42题。

(1)水准A至C有6题。主试出示一张印有小男孩的图片让被试指认身体的各部位;

(2)水准D至U有36题,主试问一些问题,要求被试回答。

7.谬误分测验

这个分测验共有32题。主试呈现卡片,让被试指出图画中不合理的地方。

8.数字记忆分测验

这个分测验有26题,包括两大类:

(1)顺背数字,有14题;

(2)倒背数字,有12题。形式和施测方法和韦克斯勒智力测验相同。

9.仿造与仿画分测验

这个分测验有28题,分为两大类:

(1)仿造测验:水准A至F,有12题,如主试用绿色方块示范垒成“桥”的样子,让被试仿造;

(2)仿画图形:水准G至N,有16题,主试呈现图片,让被试仿画,如仿画菱形。

10.物品记忆分测验

这个分测验有14题。主试依序呈现一些常见的一般物品,要求被试照着顺序把刚刚呈现的物品从印有这些物品的图画卡片上指认出来。

11.矩阵分测验

该题共有26题。它是一种非文字的推理测验,在2×2或3×3的矩阵中缺少左下角的一格,要求被试根据已知的图形间的关系,在可供选择的图形中找出一个最适当的填补上去。

12.数列分测验

共有26题。呈现一列数字,其后留下两个空格,要求被试根据每列数的排列规则填补上所空缺的数字。

13.折纸与剪纸分测验

共有18题。每题是一幅图画,上排图画显示折纸的方式及剪去的部分,下排是其摊开的图形的选项,要求被试由下排选项中选出正确的答案来。

14.语文关系分测验

共有18题。每题有四个词,要求被试根据前面三个词的特征说出事物的相像之处,以便与第四个词作出区别。

15.等式分测验

这个分测验有18题。主试呈现一组含有数字、运算符号及等号的资料,要求被试根据这些资料,建立一个等式,如5+7=12。

三、韦克斯勒儿童智力量表

(一)韦克斯勒智力量表系列的发展概况

1939年韦克斯勒在他工作的美国纽约市贝勒维精神病院编制了韦克斯勒—贝勒维智力量表(Wechsler-Bellevue Inteilligerlce Test),此测验主要是用来评量成人的智力。其编制目的是为了取得成人患者智力发展状况的临床资料,以供诊断心理疾病之用。

1.韦克斯勒智力量表发展的原因

(1)比西量表的常模不适用于成人,某些题目对成人而言过于简单(虽然比西量表也包括施用于普通成人及优秀成人两组题目);

(2)他不太同意比西量表所采用的传统的计算比率智商的方法;

(3)他认为仅有一个智商的测验结果限制了测验的诊断功能。

2.韦克斯勒智力量表发展的历史

韦克斯勒根据自己对智力的看法和多年临床工作经验以及实际需要,自行编制了具有多种分测验的新式组合性测验,评分则采用点量表的积点计分法,测验结果以离差智商及分测验的量表分数表示。

(1)1955年进行了第一次修订并改名为韦克斯勒成人智力量表(WAIS)。

(2)1980年进行再次修订,称为WAIS-R。

(3)1949年,韦克斯勒将韦氏量表的使用年龄往下推延,编制了适用于学龄阶段的儿童和青少年(6~16岁)的韦克斯勒儿童智力量表(WISC)。

(4)这一量表在1974年重新修订并建立常模,称为韦克斯勒儿童智力量表修订版(WISC-R)。

(5)韦克斯勒在1963年又将韦氏量表的适用年龄再往下推延,又编制了韦克斯勒学龄前儿童和学龄初期儿童智力量表(WPPSI)。

(6)1967年对此量表也进行了修订,称为WPPSI-R。

(7)韦克斯勒儿童智力量表修订版(WISC-R)由美国心理公司组织修订并建立新的常模,在1991年正式出版了韦克斯勒儿童智力量表第三版(WISC-)。

(二)韦克斯勒儿童智力量表修订版(WISC-R)

1.韦克斯勒儿童智力量表修订版(WISC-R)的特点

(1)韦克斯勒儿童智力量表是当今国际心理学界公认的已被广泛运用的个别智力测验量表。心理学工作者常把它作为标准,对其他智力测验进行效度检验。

(2)WISC-R适用范围是6岁至16岁少年儿童。韦克斯勒学前儿童智力量表(WPPSI)适用于4岁至6岁幼儿;另有韦克斯勒成人智力量表(WAIS),适用于16岁以上成人。整个韦氏智力测验量表适用年龄范围可从幼儿到成人,其应用范围很广。

(3)WISC-R在结构上有其独特之处。它是作为“一种对一般智力的测验而设计和组织起来的”。这个量表的突出优点是兼有语言(文字)和操作(非文字)测验。

(4)第一次在用于儿童的、个别实施的、汇合性的测验中采用了离差智商。

2.12项分测验内容及特性简介

(1)常识

共30题。测题的范围甚广,涉及广泛的一般知识,包括天文、地理、历史、物品、节日及其他知识。被试试作答时,只须简洁扼要说出所知晓的特定事物之事实即可。

此分测验主要在评量个人在一般社会机会中,所习得的一些知识。

(2)类同

这个分测验包括了17组配成对的名词,要求被试说出每一对词两者在什么地方相似,概括出每对事物的共同之处。

此一分测验涉及较高的智力能力。如推理能力、语文概念形成和逻辑思考的能力。另外,被试在此一分测验上的表现也与其文化经验、兴趣及记忆能力有关。此类测题评分除了正确性以外还应从概括的深度来考虑。一般抽象水平上的概括比在具体水平上的概括得分要多。

(3)算术

共有19题。前两题呈现图片卡,1到13题系按指导手册上所列文字由主试以口述施测,而14到19题则呈现题卡由被试朗读作答。但被试若有视觉或阅读上的困难,可由主试代为朗读。此一分测验主要评量被试的一般运算能力。被试作答时,不得使用纸笔,只能心算。

此一分测验系测量被试的数量概念、计算及推理应用的心算能力。它也与学校的教育经验有密切的关系。这些测题不需要很多的“知识”,不超过与他年龄相当教育年龄所受的数学训练,但每题有不同的时间限制。

(4)词汇

共32题,它们是字典上随机选来并按难易程度排列的题目。主试口述时亦同时呈现词汇卡片,被试则须以口述方式回答问题,要求儿童对读给他听或看的词加以解释。

此一分测验涉及语词的理解、表达能力和认知功能,如学习能力、知识观念、记忆、概念形成及语义发展等。本分测验除可评量被试对词汇的了解程度外,还可根据被试解释词汇时运用的字句及解说方式,判断其生活经验的优劣及接受教育的程度。

(5)理解

共有17题,这些题目所涉及的问题包括一些与自然、人际关系及社会活动等有关的情境。此一分测验的题型有两种:一种是“该怎么办”;另一种是“为什么”。作答时,被试者必须具备了解问题情境并运用实际知识、判断能力及利用过去经验来推理解答的能力。

本分测验与社会性成熟、行为规范的遵循及文化经验有密切的关系。施测本分测验可看出被试评价和利用已有经验的能力,与文字表达能力也有关。

(6)数字广度

它是语言量表中的替代(补充)测验,但是若因诊断上的需要,特别是应用因素分析来解释结果时,亦应将它列为施测的分测验。

一系列随机排列的数字组由主试以每秒念1个数字的速度读给被试听,要求即时复述,包括顺背8组(顺背从3位到10位)和倒背7组(从2位到8位),这是一种短时回忆的测验,主要评量注意力与短时记忆的能力。

以上是语言量表的6个分测验,以下是操作量表的6个分测验。

(7)填图

又称图画补缺,共有26题。以图片卡形式向被试呈现26张未完成的图画,图中内容都取自日常生活中经常接触的事物。要求被试说出(或指出)图画上缺少部分的名称,而不是真正把图画缺少的部分补足。

此分测验被试需运用注意力、推理、视觉组织、记忆,以及区分重要因素与细节的视觉辨识和观察等能力。

(8)排列

又称图片排列。有一组图片作为例子,再有12组图片,每套3至5幅不等,以打乱的次序(按统一规定的)呈现给被试,要求儿童依逻辑次序将每组图片重新排列,使得每一组图画可以表示出一个故事,也就是要求被试按故事情节排列次序。有时间限制,速度快加分。

该测验可以测量一个人不用语言文字而能表达和评价每个情景的能力。此外,视觉组织与想像力也很重要。

(9)积木(block design)

又称积木图案,共有11题。该测验是将9块积木(每个积木两面是红色,两面是白色,两面红白各半)交给儿童,然后要求按呈现给他的图案拼摆出来。共有11张图案样子(其中有的由4块积木摆成,有的由9块摆成),有时间限制,速度快加分。

该测验需要视觉动作协调和组织能力、空间想像能力;与形象背景的分辨能力也有关。

(10)拼图

又称物体拼配,共有4题(外加一例题)。向被试呈现(按规定要求)一套切割成曲线的拼板,要求组合成一个完整的物体。有些告诉被试名称,有些不告诉被试名称。

此分测验须运用视觉组织能力、视觉动作的协调能力,以及知觉部分与整体关系的能力。

(11)译码

这是一种符号替代测验。它分两种形式:A型是“图形对符号”(用于8岁以下的儿童)。B型是“数字对符号”(用于8岁以及大于8岁的儿童)。这个测验要求被试按照所给的样子,把符号填入相应的数字下面或图形中间,既要正确又要迅速。

主要测短时记忆能力,视觉动觉联系,视觉动作的协调和心理操作的速度,它与学习能力有高度的相关。

(12)迷津

这是操作量表中的替代(补充)测验,共有一个例题另加9题正式测题。被试须从迷津中心人像开始,不穿越墙线(且需以连续绘线方式走到出口),要求被试用铅笔正确地找出出口。

此一分测验主要涉及计划能力、空间推理及视觉组织能力,亦需视觉动作的准确与速度。在实际测验时,语言测验和操作测验交替进行。

(三)韦克斯勒儿童智力量表第三版(WISC-

WISC-保持传统的质量和设计,仍然遵循韦克斯勒在前两版中所建立的宗旨和指导原则,保持WISC-R的基本结构和内容,使重新训练的要求减少到最低限度。重要的改进包括:建立了最新的常模;增加了分测验,补充了测题,以期能提供更多关于被试的有效信息。

1.WISC-报告了新的常模信息

修订时认真组成的2200名6岁至16岁的儿童的常模样组基本能代表美国目前儿童的全域。选择的变量确定为年龄、性别、种族、地区以及父母的教育水平。经研究发现,父母的教育水平比父母的职业对测验分数变化有更大的影响。

2.增加了一个分测验——符号搜索

韦克斯勒主张智力具有整体性,强调用尽可能多种多样的方式,即通过汇合尽量多样的分测验来探查智力。新版增加的“符号搜索”这一分测验使得测验者有可能测到儿童认知能力的第四个方面,它被称之为“加工速度”。这个分测验给心理学家提供了分析被试认知能力的新信息。

3.增加了测题的范围

为了提供年幼儿童和最大年龄组被试更好的测量,重新安排了几个分测验的测题。

算术:补充的探索计算和数字概念的图片的测题安排在分测验的开始部分。

更加困难的、多步应用题被安排在分测验的结束部分。

排列:包含了更加简单和更加困难的顺序的测题;

迷津:补充了更加复杂的测验。

4.测试材料的改进

WISC-R中的拼配、填图、排列几个分测验测试中的黑白插图在新版中被重新设计并全部改为彩色。这种改进方便了施行和评分,而且使得测试的主试和被试对测验材料感到更加亲切。彩图增加了儿童的注意。

5.WISC-手册提供更多的资料和信息

手册被重新设计,包括更多的常模信息和表格,以方便测验分数的解释。

有配合使用的新的、相联的成绩测验,这有助于对学习有困难或者说学习能力不足的学生作出更好的诊断。

有一个创新的计算机的解释软件包。

四、其他类型的智力测验举例

(一)考夫曼儿童成套评价测验

考夫曼儿童成套评价测验(Kaufman Assessment Battery for Children,简称K-ABC),又称考夫曼儿童智力测验,它是由美国测验学家考夫曼夫妇(A.S.Kaufman和N.L Kaufman)于1983年共同研究发展而成的个别实施的儿童智力测验和学业成就测验。这个测验以认知心理学和神经心理学的相关研究成果为基础。

1.考夫曼儿童智力测验编制目的及特点

(1)目的

从认知心理学及神经心理学理论与研究基础上测量智力;

区分既得的事实知识与解决新问题的能力;

转换所得分数,以便于教育上的特殊安排。

(2)应用范围

心理和临床的评量、学习障碍和其他特殊儿童的教育心理诊断、教育的计划和安置、学前及学龄儿童的评量、神经心理的评量及研究儿童发展水平等。

(3)特点

K-ABC主要用于评量2岁半至12岁半正常儿童及特殊儿童的智力和学业成就水平。

基于神经心理学及认知心理学的理论,K-ABC中对所评量的智能界定为:个体解决问题及信息加工处理方式的过程。以继时性加工方式和同时性加工方式代表心智功能的两种类型。继时加工方式着重问题解决时,掌握刺激的系列或时间顺序;同时加工方式则是以最有效率的方法把握刺激的完形和空间性,并整合刺激来解决问题。

K-ABC的智力量表透过精心设计,以尽量减少语言文字对被试的影响,在选题上考虑性别的差异但又不偏向某一性别。

K-ABC的成就量表,只是出自理性和逻辑的考虑,以崭新的方式评量传统智力测验所包括的语言能力(字词、语文的概念)、学业成就(阅读能力)或是两者兼具(数学、常识)。

K-ABC以问题解决和事实知识来区分智能与成就。

K-ABC的成就量表与卡特尔的智力理论中的晶体能力相当,而智力量表中的两种认知加工处理方式则与该理论中的流体能力相当。

K-ABC共有16个分测验,按被试的年龄选用7至13个分测验施测,每一被试最多只需接受13个分测验,测验时间约需35至80分钟。对于较幼小的儿童所测分测验较少并且全部的施测时间短。

K-ABC智力量表中各分测验的原始分数,可按年龄组换算成单位相等的量表分数(平均数10、标准差3);成就量表中各分测验的原始分数,按年龄组换算成单位相等的标准分数(平均数100、标准差15);并且依分测验之性质,可将其量表分数之和,依常态化程序转换成平均数为100、标准差为15的继时加工量表、同时加工量表、智力量表、成就量表、非语言量表等5个量表的标准分数。

2.16个分测验内容及介绍

考夫曼智力测验16个分测验组成了继时加工、同时加工和成就量表等3个量表。

(1)智力量表

动作模仿

被试看完主试的示范之后,要求他按照同样的顺序做出一系列的手部动作。该分测验主要是以视动协调的方式来评量儿童能否准确地按照同样顺序做出一系列主试先前示范过的手部动作。

数字背诵

被试根据主试的指导语,按同样的顺序重复念出一系列数字。该分测验用以评量儿童按照同样顺序复述主试念过的一串数字广度的能力。

系列记忆

被试者在听完主试说出一系列普通物件名称后,要求他按同样顺序逐一指出相对的图画。该分测验用以评量儿童记忆一系列普通物件的名称,并依序逐一指出图画的能力。

以上三个分测验测量继时加工过程。

图形辨认

被试经由一窄小裂缝看到一幅连续转动的图案后说出其名称。该分测验以视觉信息连续呈现的复杂结合方式,评量大脑半球的整合能力。

人物辨认

要求被试从一张一群人的图片上,指出在前一页纸上呈现过的人物来。该分测验用以评量儿童对人物面部的辨认和短时记忆。

完形测验

要求被试看着部分完成的墨渍图后,说出其名称。该分测验用以评量儿童从分散的信息中作整体性辨认的能力。

图形组合

要求被试利用三角拼板排出指定的图案。该分测验用以评量儿童在组合图形之前先分析再综合的同时加工处理信息的能力,同时也可评量视动协调。

图形类推

要求被试按已呈现的三幅图案,找出第四幅图案以完成其中的推理概念。该分测验用以评量推理概念的能力。

位置记忆

要求被试在一张空白的格子纸上,指出在前一页纸上出现过的图案的相对位置。该分测验用以评量同时加工处理信息时的短时记忆能力。

照片系列

要求被试将一组相关的照片,按发生时间的顺序排出来。该分测验用以评量对照片之间次序性的观察及对单一照片在整体中位置的辨认能力。

(2)成就量表

语汇表达

要求被试说出照片中物件的名称。该分测验用以评量再认的记忆能力和语言表达。

人地辨认

要求被试逐一辨认出照片中的人物或地点。该分测验用以评量儿童对环境中各层面实际所学习的知识。

数字运用

要求被试要有辨认数字和计算数字的能力。该分测验用以评量儿童对数字辨认、计算和运算中对概念推演了解的能力。

物件猜谜

要求被试根据主试的口语信息推断出该项概念的名称。该分测验用以评量传统测验中的普通成就和语文能力。

阅读发音

要求被试逐一念出主试者所呈现的字词。该分测验用以评量儿童对字词的辨认和诵读能力。

阅读理解

要求被试自行看完指导语后依照要求表演动作和做出表情。该分测验用以评估大脑功能对阅读(左大脑功能)及动作姿势(右大脑功能)整合的能力。

(二)瑞文测验

瑞文测验联合型是一种非文字的智力测验,主要用来测验一个人的观察力及清晰思维的能力。

1.瑞文测验的演变

瑞文测验原名“渐进矩阵”,是英国心理学家瑞文(J.C.Raven)于1938年创制的。现经过修订,它已发展出标准型、彩色型、高级型和联合型等四种。

(1)渐进矩阵标准型

测验材料

瑞文测验的最初型,由A、B、C、D、E五个单元构成,每单元包括12个测题,共60题。每个测题为:一张抽象的图案或一系列无意义的图形构成一个方阵(2×2或3×3),方阵的右下方缺失一块(即空档),要求被试从呈现在下面的另外6小块(或8小块)供选择的图片中挑选一块符合方阵整体结构的图片填补上去,只有一块是正确的,它能使图案或方阵成为一个完美的整体。

特点

测题是按从易到难的原则依次排列的,每单元在智慧活动的要求上也各不相同。A、B单元的测题主要是测量儿童直接观察辨别的能力。而C、D、E三个单元主要是测验一个人对矩阵(3×3)的系列关系进行类比推理的能力,但这三个单元的构图也表现出不同的深度。根据瑞文1956年发表的常模资料,标准型渐进矩阵测验总得分在14岁时达到最大值,此后10年保持相对稳定,随后每隔5年以均匀速度下降。

(2)渐进矩阵彩色型

彩色型是为了适应测量幼儿及智力低下者而设计的。它是将原来黑白的标准型中的A、B两单元加上彩色以突出图形的鲜明性,并插入一个彩色单元(12题),共三单元36题。

(3)渐进矩阵高级型

高级型包括渐进矩阵I型(12题)及型(48题),主要适用于智力超常者。

(4)瑞文测验联合型(Combined Raven's Test,简称CRT)

2.瑞文测验联合型的施测

(1)测验材料

瑞文测验联合型(CRT)是由原瑞文的渐进矩阵标准型与彩色型联合而成。由72幅图案构成72个测题的一本图册,内分六单元(A、AR、B、C、D、E),每单元12题,前三单元为彩色,后三单元为黑白。

根据CRT在中国施测后所获得的资料分析表明,全测验72题覆盖较广阔的难度范围,难度分布较合理;各单元1~12题的难度排列基本符合我国儿童及成人的状况;A-E各单元的难度也有递增的特点。

(2)适用范围

测验适用于5~75岁以内的幼儿、儿童、成年人及老年人。一般可团体(10~50人左右)进行测验,幼儿以及智力低下和不能自行书写的老年人可个别施测。

测验可用作有言语障碍者的智力测量,亦可作为不同民族、不同语种间的跨文化研究的工具。

测验结果既可用作对个别对象,也可用作对一个集体的对象的智商水平的估计,或粗分其智力水平等级。它特别适用于大规模智力筛选或对智力进行初步分等,具有省时省力的效果。

这个测验具有较高的信度和中等程度的效度,说明该非文字测验不能完全代替多面相的智力测验,特别是那些与言语有联系的能力测验。

五、对传统的比奈式智商测验的反思和评价

(一)传统比奈式智商测验仍有其存在的价值

传统比奈式智商测验虽然存在着一些缺点,但其价值仍不应忽视。只要对智力测验,尤其对智商持有正确的态度,恰当地运用这个工具,它就能发挥其应有的作用。智力差异是客观存在的,正确地了解和评价一个人的智力是十分重要的,这对教育更是至关重要,同时也是教师、家长及学生本人最为关心的问题。

(二)智力测验的优点

1.智力测验的优点与量表编制及修订的标准化过程分不开

智力测验是通过标准化量表中所给出的一群测题(刺激)引起人们认知方面行为的反应,从而使得人们能根据反应的程度来估计其智力水平。标准化的智力量表的编制十分严格。世界上一些著名的测验量表,斯坦福—比奈量表、韦克斯勒智力测验量表,它们在编制时都邀请各方面专家共同讨论测题,编制程序都是标准化的。

2.智力测验是评价一个人智力水平的有效方法

评价内容,智力测验中严格选定的测题比较有利于考察受试的各种能力。被评价者的范围,学业考试往往局限于一个班级或年级作比较,而智力测验则把一个人的分数与一个更广大的地区内的同龄人进行比较。智力测验编制中一项重要的工作就是要确定常模。

(三)智力测验在教育上的应用

智力测验与我国整个教育事业的发展及人才培养具有密切关系,正确地评价学生的智力水平对于因材施教是非常重要的。

1.选拔和安置

可以借助于智力测验选拔一些智力发育较早的“超常”儿童,让他们及时进入接受高等教育的阶段或进行各种形式的重点培养;可以及时鉴别出一些智力落后的儿童,以利于对他们采取特殊教育方法,尽可能使其内在潜力发挥到最高水平。

2.筛选、诊断和制定补救计划

在进行教育时,尤其是在进行教育项目研究时,可使用智力测验对学生进行筛选,排除一般智力的问题和确定实验班的平均智力水平。在诊断的过程中,智力测验不仅被用来确定认知能力的一般水平,而且也能发现学生的相对比较强和比较弱的方面,这对产生有效的学习策略和补救计划有所助益。智力的评价有助于确定学校学习成绩的期望值的相应水平。

3.教育研究成果效能核定和评价

运用测验结果为一些学校的教学改革成果提供科学的鉴定与论证。

(四)关于智力测验局限性的争论继续存在

1.智力测验局限性的主要表现

(1)智力测验主要进行了量的分析

智力测验的结果一般是用智商报告的,智商分数只提供了量的数据,只有数量说明,没有质的分析。韦克斯勒智力量表虽然作了一些努力,如提供剖面图、三种智商分数(语言、操作、全量表分数),提供了一些可供诊断、咨询分析的资料,但是质的分析仍不充分。

(2)智力测验只测了当时的智力,没有考虑发展的速度和趋势

每个人智力发展速度和高度是不同的,有的儿童发展快、成熟早,所以测的结果比别人高,他可能先达到了顶点,但他的顶点却不一定最高。另有些儿童发展较慢,但最后结果并不比别人低。

(3)智力测验只是部分地反映了一个人的智力水平

由于量表编制者对智力的看法和指导思想上的差异,因此所编量表测出的智力方面也就有所不同。其次,实际施测时,被试可能会受到不利变量(如疲劳、情绪、态度)的干扰从而影响到智商分数。

(4)其他不足

智力测验的正确答案一般是事先肯定的,因而它只考虑到收敛性的抽象概括、推理思维能力,而对于创造性思维,尤其是发散性思维方面考虑不够;它的测题不可避免受到文化知识的影响等。

2.斯腾博格对传统智商测验的批评

(1)测题的实际情景性问题

他认为传统智商测验的内容不全面,它未能把构成智力本质的一个重要方面,即社会智力涵盖在内。传统智商测验顾及的只是心理的内部世界。

(2)对于先前学习知识的要求

斯腾伯格认为传统智商测验一般未能很好地控制知识和经验因素的作用,因而其学业成就色彩过重。用作估计智力的所有测验都对被测学生提出了很重的学业成就要求。

(3)速度问题

斯腾伯格对渗透于当今社会的“快即聪明”的说法提出异议。传统智商测验一般都是限时测验,他认为这实际上是受世俗偏见之累。

(4)测验的焦虑

斯腾伯格本人在少年时代就是一名测验焦虑者,所以他对这点特别重视。由于测验结果影响一个人的升学、就业等重大人生道路的走向,因此,他认为再没有什么情景会使人像面对一个标准化测验时那么紧张。有很大比例的测试者的成绩会由于焦虑而失真,甚至会受到严重的影响。

(5)关于测验依据的智力理论

智力测验应该依据一种在实际中被证明有效的关于智力本质的理论。因为有理论依据的测验,才可能真正了解一个人智力的结构和功能。传统比奈式的智商测验的最大不足,归根结底是其理论基础的薄弱和缺失。

(五)对智商的分析

智力测验的结果是用智力商数(IQ)来报告的,人们根据IQ分数的大小按照分类标准来确定儿童的智力水平。

1.由于人的一生中生理和心理状态都在变化,其智商在一生中发生变化是完全可能的,尤其是在环境和教育条件发生较大改变时。因此,智力发展是一种动态的过程,智商是这种动态过程的定量显示。

2.不应仅根据对儿童施测一次智力测验所得的智商分数就轻易地对其智力水平作出定论。一个有效和可靠的智力测验能区分不同智力水平,但是对于一个人所得的具体智商分数却不能抱着绝对的态度,特别是对智商分数低的人下结论时更应谨慎。应该把所得的智商分数和家长与教师的评定、学业考试成绩、日常表现以及儿童测验时的态度、情绪、身体状况和测试时的环境等因素综合起来考虑。

六、智力的理论和智力测验的新发展

(一)智力概念和定义的演变

1.斯腾伯格对智力的观点

(1)智力是适应新情境的能力;

(2)智力是一种学习能力;

(3)智力是指抽象的思维能力;

(4)智力是从事艰难、复杂、抽象、敏捷和创造性的活动的能力,并且是能集中精力,保持情绪稳定以从事这种活动的能力;

(5)智力是一个人能够为着某些目标而行动、能够理智地思考和有效地适应环境这三种能力的综合表现。

2.韦克斯勒对智力的观点

美国心理学家韦克斯勒在20世纪70年代曾提出:“智力是一个假设的结构,它是一个人有目的地行动,合理地思维,并有效地处理周围事物的整体能力。”

3.我国心理学界对智力的看法

我国一些心理学家认为,智力是各种认识能力的综合表现,是观察、记忆、想像、思维等能力的综合,而思维能力是智力的核心。情感、动机、注意等是非智力因素,但对智力发展有很大影响。

(二)现代智力因素分析理论

1.斯皮尔曼的两因素论

著名英国心理学家斯皮尔曼(Spearman)在1904年提出了两因素论,他认为人的智力包含一种普遍因素,或者一般因素,它经常被称作为G因素;还有一种或多种特殊因素,即S因素。因为由一般因素所表现的能力渗入到所有的智力任务的操作中,由特殊因素表现的能力只渗入到一种单一的任务中,因而一般因素(G)具有重要的心理学意义。斯皮尔曼的两因素论因强调一般因素的重要性,也称为单一因素论。

2.塞斯顿的多因素论

美国心理学家塞斯顿(I.L.Thurstone)凭借多因素分析的方法提出了他的基本能力(primary mental abilities PMA)学说。人的全部智力分成若干种基本能力因素,这些基本能力因素的不同搭配,便构成每一个个体独特的智力整体。他提出的7种基本智力能力分别为:

(1)空间能力因素(S)(spatial or visualization),这是塞氏从测验变量中最初分离出来的一个基本能力因素,是观察空间事物能力因素。它有关于空间知觉能力,也即想像空间几何模式,想像物体或图形在二维或三维空间中彼此间关系的能力;

(2)计数能力(N)(number),迅速而正确地计算简单算术和处理数字的能力;

(3)言语理解(V)(verbal comprehension),即对文字和语义的理解能力;

(4)词汇流畅性(W)(word fluency),这是一种应用字词的能力,即迅速生成和流畅使用词汇的能力;

(5)记忆能力(M)(memory),它与其他因素基本相独立的因素,其中包括迅速强记的能力,对无意义材料的即时回忆,回忆过去的经历事件的能力;

(6)推理与归纳能力(R或I)(reasoning and induction),它是一种从一组材料中发现规律、原则和原理的能力,并且认为这是一种超越具体内容的能力。推理能力强的人,可以利用以往的知识经验,对其所面临的问题作正确的研究、判断并解决问题。他推测这种能力可能和创造性有一定的联系;

(7)知觉速度(P)(perceptual speed),这是塞氏最后提出的一种能力,是正确与迅速辨别事物、图形和符号的细节及异同的能力,即迅速而精确地注意细节的能力。

塞斯顿于1941年根据上述7种基本能力编成“基本心理能力测验”(PMAT),它是著名的心理测验之一。最初塞氏认为这7种能力因素在功能上是相互独立的,但后来发现它们彼此之间有正相关存在。

3.吉尔福特的三维结构模型

美国心理学家吉尔福特(J.P.Guilford)在1959年提出的,它是智力多因素论中最典型的代表,也是智力立体结构的代表。同时,它也是智力的因素分析理论中最复杂的模型之一。智力结构可用一个长方体的三个维度来表示,它们分别为:内容、操作、结果(产物)。

(1)内容

这一维度指的是引起智力活动的各类刺激,它包括四个从属范畴或称为组成类型:

图形:通过感官看到的具体信息,事物的各种形状和图画;

符号:图形或事物的象征标志,主要指数字、字母、单词;

语义:言语含义或概念;

行为:本人及他人的行为。

(2)操作

这一维度是指各种刺激所引起的智力活动的方式,即智力实现的过程和方式。

评价:它是这个模型中较有特色的一个范畴,即按照一定的标准进行比较的过程;

发散思维:以不同的思维方式求得新的答案。这是这个模型中最富有特色的一个范畴,是吉尔福特理论的一个创新,因为它对创造力的分析具有重大意义,因此提出后曾轰动一时;

聚合思维:对只有一个客观正确答案的问题,进行系统的思考方式,与发散思维相对应。吉尔福特认为这种思维方式实际是逻辑演绎的能力;

记忆:对以往学习的东西的保持;

认知:与一般心理学中的认知概念有些不同,它不包括记忆、思维、想像等其他全部认知过程,它是指知觉、直接发现和再次发现,各种形式的再认、领会或理解,它与上述的记忆的区别在于它是一种信息的直接展现,而记忆则是一种潜在的信息的保持。

(3)结果

这一维度指的是智力活动的产物或生成形式,亦即运用各种智力能力对各类问题处理的结果。这些结果从简单到复杂,共有6种:

单位:这是最基本的生成形式,可以按单位计算的产物,如一个词,一句话,一个特定的数字和概念等;

类别:一系列有关的单元,指的是对具有共同特征从而成为类成员的所有单元的集合所进行的抽象的结果;

关系:找出单元与类别之间的关系,找出事物之间的关联性;

系统:指事物之条理,或逻辑的完整体系,用逻辑方法组成的概念;

转换:涉及某种改变,指的是物体、形态、结构或关系改变,对问题的变动、修正、重新说明都属于转换的性质;

蕴涵:表示的大体上是一种预见性,即从已知的信息中观察某些结果。

吉尔福特1967年提出的三维智力结构模型由120种因素组成。在1982年内容维度的图形改为视觉图形、听觉图形两种。在1988年操作维度的记忆分为短时记忆和长时记忆,这样因素的数目就增加至180种。吉尔福特在1982年宣布已经展现了180个可能存在的因素中的105个因素,但是他至今仍难以完满地找到所有的因素。1982年他曾说,虽然150个因素在逻辑上是独立的,但从心理学上看,它们在相互联系的意义上是不独立的。

4.卡特尔的流体和晶体智力理论

该理论调和了斯皮尔曼和塞斯通的观点,卡特尔(R.B.Cattell)从智力的一般因素(G)中分析出两个一般因素和三个次要因素。他称这两个一般因素为流体智力与晶体智力两种G因素。

(1)晶体智力指的是通过学校和社会文化经验而获得的能力,是个体所获得知识与技能的结合,表现为个体的学识水平。

(2)流体智力是指个体基本的生物潜能,是非言语及不受文化影响的智慧能力。三个次要因素是:视觉能力、记忆提取和执行速度。

(3)卡特尔认为流体智力与晶体智力是两个相关的智力因素,一个人的接受能力有赖于其流体智力因素的水平。而作为晶体智力标志的一个人的学识,则是流体智力、学习努力与学习机会的交互作用的结果。

(4)流体和晶体智力表现在发展和衰退机制上有很大的不同。

流体智力比晶体智力更多地得自于遗传,流体智力水平上的差异要大于晶体智力水平上的差异。流体智力较晶体智力更受生理结构(如大脑皮层特定部分)因素的影响。

流体智力会随年龄衰退,但晶体智力则反之。流体智力的增长通常到青春期阶段就已大致发展定型,并进入高原期,于14岁左右达到高峰,而从22岁后便显示出持续下降的趋势。晶体智力则至青春期仍在上升,并保持其水平直至个体的晚年。

5.维尔隆的智力层次结构理论

(1)基本内容

他认为最上层是普通能力即G因素;第二层次可以分为两个主要群因素:言语和教育、操作与机械;再下一层次是由主群因素下分出的若干较小群因素,如创造力、语词流畅、数字能力、空间、心理动作能力等;而最底层则是多种特殊因素。

维尔隆认为愈底层次的因素影响智力行为的范围愈小,愈高层次则愈广,他相信若要了解一个人的智力必须首先考虑他的普通能力的水准。

(2)对该理论的评价

他的理论保留了斯皮尔曼的一般智力因素(G),同时又把塞斯通的基本心理能力和吉尔福特的智力结构归纳为G因素的下级层次。该理论巧妙地综合了各个理论的不同发现和解释。这种把一般智力(G)分为言语和操作两个因素群的两分法对传统智商测验的编制,尤其是对韦克斯勒智力测验系列,产生了很大的影响。

(三)智力的认知理论

1.智力的三重结构理论

斯腾伯格提出智力的三重理论由三个亚理论组成,即智力成分亚理论、智力经验亚理论和智力情境亚理论。它们分别从主体的内部世界、人生存的客观外部世界和联系主客体的经验世界这三个方面阐述智力的本质及其结构。

(1)成分亚理论

基本内容

成分亚理论是三重智力理论的核心内容,它阐述了智力活动的内部结构和心理机制。它以一种新的信息加工的语言来描述智力。成分是一种最基本的信息加工单元。斯腾伯格认为智力的成分从功能上划分有三个层次,分别是元成分、操作成分和知识获得成分。

a.元成分是智力活动的高级管理成分,它的功能是对其他成分的运行进行计划、评价和监控。

b.操作成分的功能是执行元成分的指令,进行各种具体的认知加工操作,对信息进行编码、推断、提取、应用、存贮等一系列操作,同时向元成分提供反馈信息。具体任务不同,主体所动用的操作成分的种类也有所不同。

c.知识获得成分的功能是学习如解决新问题,学会如何选择解决问题的策略等。

评价

a.根据成分来分析智力,它强调的是智力活动过程的特点。而编制测试总是要通过具体测题来进行。在这个意义上,智力测量总是一种间接测量。

b.成分亚理论关注的只是智力的内部特征,它与传统智商测验仍站在同一层次上,不管它们是静态的结果,还是动态的过程。

c.斯腾伯格三重智力理论的重大贡献是它提出了除成分亚理论以外的另两个亚理论。因此,斯腾伯格关于超越智商的观点还有更深的含义。这种从智力的外部世界和经验世界去分析智力本质属性的新观点,极大地丰富了智力的内涵。

(2)情境亚理论

智力的情境亚理论从本质上揭示了智力的社会文化的内涵。因此,情境亚理论规定了某一种特定的社会文化背景下的智力范围,这是任何智力测验的编制能有效进行的必要前提。

(3)经验亚理论

经验亚理论从主体经验角度提出了有关测验公平性的问题。要保证测验结果的有效和公正,就应使所有受测者对测题保持在基本相同的经验水平上,经验亚理论反映了斯腾伯格对智力的某种基本看法;处理新异性的能力和加工自动化的能力是智力的最基本的特质之一。

2.智力的PASS模型理论

(1)基本内容

斯腾伯格提出智力的三重理论是主张“必须把智力视作认知过程来重构智力概念”。他们提出了一种新的智力理论,即PASS模型,指“计划—注意—同时性加工和继时性加工”三级认知功能系统中所包含的四种认知过程。

注意一唤醒系统的主要功能是使大脑处于一种适宜的工作状态,它处于心理加工的基础地位,其功能状态直接影响到另两个系统的工作。

同时性加工和继时性加工系统又称编码系统,它负责对外界输入信息的接收、解释、转换、再编码和存贮。这一系统在PASS模型中处于关键地位,因为智能活动的大部分实际操作都在该系统发生。它又分为两种不同的加工方式,即若干个加工单元同时开始进行信息处理的同时性(并行)加工方式和几个加工单元先后依次对信息进行加工处理的继时性(序列)加工方式。

计划系统处于PASS模型最高层次。它执行的是计划、监控、评价等高级功能,如确定和调整目标、制定和选择策略、决定和修改解决问题的方法,以及对方法及其结果作出评价,实现对整个操作过程的监控和调节等。

三个系统之间存在密切的相互作用,尤以第一和第三系统之间的关系更为紧密。三个系统又是在人的一定知识背景的基础上发挥各自功能的。

(2)PASS模型与其他理论的关系

PASS模型的三级认知功能系统直接派生于鲁利亚神经心理学中大脑三级机能联合区的思想。这提高了PASS模型的实证性,PASS模型与大脑三级机能联合区两者之间的对应关系是:保证调节紧张度或觉醒状态的第一机能区与注意—唤醒系统相对应;接受、加工和保存来自外部世界的第二机能区与同时性加工—继时性加工系统相对应;制定、调节和控制心理活动的第三机能区与计划系统相对应。

戴斯等人根据PASS模型所设计的新的智力测验,称为DN认知评价系统。全系统由12种任务类型构成四个分测验,每一分测验有一种任务。分别对计划、注意、同时加工和继时加工进行测定。

第一分测验(测查计划性功能系统):视觉搜索、计划连接、数字匹配;

第二分测验(测查注意—唤醒功能系统):表现的注意、找数、听觉选择注意;

第三分测验(测查同时性加工成分):图形记忆、矩阵问题、同时性的言语加工;

第四分测验(测查继时性加工成分):句子重复、句子问题、字词回忆。

(3)评价

优点:PASS模型作为一种新智力理论,它以对加工过程的分析作为评价智力的基础,在一定程度上,它与其他认知派的智力理论一起,标志着智力理论和智力测验的范型转变。

局限:该模型以四个最一般的过程作为评定智力的指标,过于简单。

(四)智力测验的新发展

1.注重智力中的核心成分——元认知的测量和评定

自从20世纪70年代中期美国著名心理学家弗拉威尔提出“元认知”概念之后,人们逐渐重视智能活动中对认知过程本身的认知及自我意识的研究,以求揭示影响认知效率的高级控制因素的作用。

2.重视探索相应的智力培训程序

斯腾伯格和戴斯等人都在设计和编制他们的测验的同时,还探索相应的智力训练程序。智力测验已不仅仅作为一种智力评价和测量工具,而且作为智力训练、辅导和提高的手段。研究者们探索智力训练程序,以期对被试认知功能成分较弱的方面提供有效的帮助,从整体上提高智力水平。