- 刻板印象:我们为何歧视与被歧视
- (美)克劳德·M.斯蒂尔
- 5969字
- 2021-12-03 15:41:11
“第二点猜想”:女性数学能力实证测试
虽然我们坚信,女生在数学测验中表现欠佳的原因是她们在负面标签的影响下背负了要为自己正名的沉重压力。然而出于严谨考虑,我们不能排除的确还存在另外一种看起来合情合理,起码是极具干扰性的说法,即女生们的成绩欠佳可能恰恰印证了女性在数学能力方面的天生不足,只不过这种不足在她们面对高难度测试的时候暴露得更加明显而已。
在20世纪80年代早期,心理学家卡米拉·本博和朱利安·斯坦利曾围绕“数学学习中的性别差异”这一课题展开了一系列的大型研究,并将相关的成果发表在象征着学术权威的《科学》杂志上。有趣的是,他们的研究模式与我们的有着异曲同工之妙。他们的思路同样是选取数学能力很强的学生,具体来说,他们挑选的是八年级的男女学生,他们处于同一课程进度,并且数学成绩在针对八年级的标准化测试中名列全校前3%。然后他们也让这些孩子参加数学测试,测试题目则来自SAT考试中的数学部分,这对于八年级的孩子来说显然是非常困难的。他们的实验结果也与我们的类似,即女生的成绩明显低于男生。鉴于这些孩子们在接受测试前都经过了严格的挑选以确保他们在数学能力和学习进度方面处于同一水平,本博和斯坦利于是不得不做出一个艰难的论断:女生的成绩欠佳或许证明了女性在数学能力方面存在某些生理缺陷,而这些缺陷在她们面对难题时便会充分暴露出来。
我们的社会总是乐于将各种问题的原因归咎到基因层面,从酗酒到多动症,再到幸福感等。将数学成绩上的性别差异以及我此前提到过的运动表现上的种族差异等统统归结为基因问题,看上去是如此地顺理成章,而我们又是如此地趋之若鹜。一个真实的案例是,2005年1月,麻省理工学院举办了一场题为“女性在科学界的地位”的研讨会。会上,时任哈佛大学校长的劳伦斯·萨默斯在演讲时提及:
无论是本次会议上发表的论文,还是相关的历史文献都显示女性从事高端科研工作时的表现(与男性相比)存在明显差距。对于个中原因,我做了以下三点设想:第一,从事高端科研工作需要承受极大压力;第二,天资差异在高端科研领域体现得更为明显;第三,研究过程中出现了一些社会性因素以及歧视。而以上排序同样也体现了我对于三者重要程度的理解。
正当萨默斯校长滔滔不绝时,麻省理工学院的著名生物学家南希·霍普金斯突然起身离场以示抗议。随后现场嘉宾开始针对萨默斯抛出的所谓“第二点设想”究竟居心何在展开激烈的争论,场面顿时陷入一片混乱。数小时后,媒体开始介入报道这次骚乱,同时对萨默斯演讲时在场的与会者们进行了采访。接下来的几天中,大量的报纸专栏、电视报道、广播脱口秀、时事评论节目等都对萨默斯的演讲以及由此引发的支持者和抗议者之间的论战予以了高度关注。很快便出现了要求萨默斯校长辞职的呼声,哈佛大学内部的抗议活动在持续了数周乃至数月的时间后势头仍然不减。同年3月15日,哈佛大学文理学院的师生以218票对185票通过了对于萨默斯校长的不信任投票。虽然在哈佛董事会(掌控哈佛大学的决策层)的力挺下,萨默斯勉强顶住了这次不信任投票的压力,不过仅仅过了一年,为了避免再次遭到不信任投票,萨默斯最终还是选择了辞去校长职位。与此同时,他就任期间的其他一系列问题也开始陆续曝光,进一步加剧了大众对于其领导能力的质疑,不过大家公认的是,导致萨默斯下台的导火索主要还是他在那场演讲中轻描淡写地提到的“第二点设想”,也即在数理科研成果方面呈现的性别差异本质上来源于不同性别在数学能力上的基因差别。
我和史蒂文当然不会支持用基因原因解释数学能力上的性别差异。我们坚持将造成这种差距的原因更多地归咎于“负面标签”这一长期以来被严重低估的效应。不过我们也很清楚,在萨默斯校长的闹剧发生以前,基因观念就早已渗透在我们的文化血液中。同时,对于我们的实验结果来说,基因原因的确是一个可能的解释。因此我们必须对它有所提及。
对于我们手上这个还处在萌芽状态的实验来说,现在到了一个关键的时刻。我们仔细挑选出了数学能力同样优秀的男生和女生,然而测试结果却显示女生的表现不如男生。对于这样一个经典的学术表现欠佳的问题,我们面临着两个截然不同但各有道理的解释。我们自己持有的观点是,在接受高难度数学测试时如果遇到难题,女生会担心自己的表现会坐实或者被别人视作坐实对于女性数学能力缺陷的偏见,这种担心转而会影响到她们的最终成绩。这就是我们对于负面标签这一“毛领子”是如何影响数学成绩所做的解释。
另外一种解释则非常简单直白,那就是女生的数学成绩欠佳是由女性自身因素造成的,比如女性心理素质脆弱,或者是与萨默斯的“第二点设想”类似的一些原因。
所以我们还需要通过实验证明究竟哪种解释是更可取的。将两个对立的观点摆到同一个实证检测中进行验证,这可以说是科学研究中非常有趣而又令人紧张的环节了。很显然,实证检测的质量越高,得出的结论就越明确。而一个明确的结论对于我们的这次实验来说意义深远,它将验证我们所做的早期研究是否真的触及了一个此前一直未被揭示的影响因素——一个由美国国内环境中的性别偏见所引致的身份条件作用。当然,也有可能结果只是证明了女性长期以来在数学方面的天生缺陷在高难度的测试中更容易暴露出来而已。由此可见这是一次充满风险的实验。
话说回来,我们应该如何开展实验呢?
我们在构思实验的过程中注意到了一些与我们所秉持观点相关的额外信息。我们认为,对于积极上进的女生来说,在面对高难度的数学测试时,她们会在刻板印象的影响下产生为自己正名的压力。而这种压力是在测试过程中普遍存在的,一旦遇到解题困难(这在高难度测试中几乎不可避免),那么当事人会在潜意识里将刻板印象的内容与自己的处境建立联系,压力便随之而来。这就意味着,只需要让那些对数学学习充满积极性的女生们接受高难度测试便可以让她们自然而然地感受到压力,整个过程无须借助任何外力。这在实验环境中如此,在现实生活中应当也是如此。
因此,设计一个高质量实验的难点不在于寻找某个外力用以在测试中对女生们施压,而在于如何采取额外措施摘掉女生们脖子上的“毛领子”,也即消除负面标签影响,从而缓解她们在测试过程中的压力。
如果在成功缓解压力后女生们的成绩有所提高,那么就可以反证她们此前的成绩欠佳就是由这种压力引起的。
不过应该怎样才能让女生们的压力得到缓解呢?
我们首先想到的是向她们宣传有关女性在数学能力方面的刻板印象是错误的。如果她们不再相信这种刻板印象,那么应该就不会刻意地想要为自己正名。但后来我们意识到,即使她们自己不相信这种偏见,我们也不能向她们保证普罗大众也都不相信这一套,因此她们可能还是会担心自己表现不好的话就会加深外人(包括研究人员)对她们的偏见。
在经历了又一番焦躁不安后,我们想到了一个简单的办法,那就是将社会对女性数学能力的刻板印象与数学测试成绩之间的关联进行切割。我们可以告诉女生们:“你们可能听说过女生在参加高难度数学测试时的成绩不如男生好,不过情况在我们这儿就不太一样,在我们的特殊测试中,男生和女生的成绩通常都差不多。”(在正式的实验中我们大致也是这么说的。)
这一说辞非常简单,但是它却改变了女生们在测试中遇到难题时的心态。这时她们不会将遇到的困难与自己的女性身份联想到一起,因为这场“特殊测试”并不是在研究女性特质,或者说并不是在研究性别问题,所以她们正在以一个与男生平等的姿态参加测试。那么当遇到难题时,她们只会觉得是自己个人的数学能力还有待提高,而不会将困难归咎于自己的女性身份。
就这样,通过对测试说明做出某些改动,我们便可以成功地驱除掉那些在数学考场上广泛困扰女生们的基于性别的身份条件作用。
于是我们确定了实验方案。仍然是和之前一样的实验形式,我们在密歇根大学内招募数学能力优秀的男女学生,让他们依次单独接受高难度的数学测试,而为了让某个特定组别中的女生们不受负面标签效应的影响,我们会采取刚才提到的办法抹掉实验中的性别色彩。
如此一来我们便做好了万全的准备,终于可以在同一个实验场景中让两大对立观点进行正面交锋了!如果那些被我们从负面标签效应中解放出来的女生们在测试中的表现与男生处于同一水平,那么就说明负面标签效应此前的确拉低了女生们的成绩,因此这种压力会对女生们的数学成绩造成严重影响。但是如果在压力得到缓解后女生们的表现仍然没有起色,即如果她们的成绩仍然低于同水平的男生,那么就只能说明负面标签效应并不是一个决定性因素,我们此前的发现实际另有原因,可能是因为女性的社会定位,也可能是……萨默斯的所谓“第二点设想”。
在当前这个实验节点上,我和史蒂文还考虑不到更高层面上的意义,我们只知道这次的实验充满着不确定性,对此我们满怀激动,同时又紧张不已。
就这样,我们怀着忐忑不安的心情完成了实验,而实验结论则是确切而又惊人的。在明确知晓测试成绩存在性别差异的组别中,女生在负面标签效应的影响下,测试表现仍然弱于男生,这与先前的实验结果一致。然而,就在被我们特意提示测试成绩不存在性别差异的那个组别中,女生们不必承受为自己的性别正名的额外压力,而她们的测试成绩竟然和同水平的男生一样高了,她们的低迷状态消失了!①
毫不夸张地说,这些研究发现使得我们的整个科研生涯都发生了改变。这是我们所构建的“负面标签效应理论”首次得到实证研究的验证。实验证明负面标签效应的确足以影响到女性在数学学习过程中的普遍感受,尤其是在她们试图挑战自身极限、破解负面标签压力屡屡受挫的时候。这些发现同时也表明,女性在数学方面的弱势状况可能并非如人们想象的那般无可救药。其实只需要设法移除那些长期困扰女性的负面刻板印象风险,便可以显著改善她们的数学成绩,正如在简·埃利奥特实验中,只需要摘除学生们的“毛领子”便可以改善他们的表现一样。
目前,我们对于以上研究发现还未能形成一套全面的解释,后文还会就此进行更多探讨。同时,我们对于这一成果的推广也持谨慎态度,譬如我们不能笼统地认为,只要移除了负面标签效应便可以解决所有数学学习方面的性别差异。毕竟参与我们实验的男女学生们都是经过精心挑选的,他们在数学能力和学习积极性方面都相差无几。然而现实生活中更常见的则是在能力和热情方面有千差万别的男女学生之间的比较,他们接受的教学进度不同、对数学的兴趣不同、在不同的成长阶段受到负面标签影响的程度也不同,因此我们可以在某些特定场合下通过移除负面标签效应改善性别差异,但这并不意味着这一药方可以包治百病。
除此之外,这次的实验成果让我和史蒂文更加明白,我们要继续努力,将这样一种可能对女性从事数学相关活动产生非常不利影响的重要现象剖析得一清二楚。
研究显示,随着女性在数学研究的道路上走得越发深入,她们就越发难以坚持下去。这其中有很多原因,譬如女性的社会角色定位、对女性从事数学研究的歧视,抑或是对她们数学能力的期待值较低等。而我和史蒂文发现了另一种可能的原因,即在不断挑战更加高阶的数学成就之路上,她们在打开每一扇新世界的大门前,总难免会经历一段黎明前的至暗时刻,而每当此时,她们便会越发担心自己的表现坐实了(或是被视作坐实了)社会针对她们数学能力的强烈质疑。这种内心的焦虑使得她们本就艰难的研究道路变得更加崎岖陡峭。
而正是这一发现改变了我们的研究生涯,也照亮了我们的前进之路。
不过必须承认的是,我们的观点并非主流。我们的研究成果来自一步一个脚印的调研,包括我与学生们的谈话、搜集分析反映学业问题的相关数据,以及我们开展的关于女性数学能力的实验等。这些调研内容看似零散,但却具有高度的内在一致性。即便如此,我们所提出的“针对群体(譬如针对女性数学能力)的刻板印象所产生的巨大破坏力,足以令拥有杰出数学能力的女生在数学标准化测试中表现欠佳,甚至还可能会动摇她们坚持数学学习或研究的信念”这一观点仍未得到广泛的认可。
我们研究成果的另一个独到之处在于,它明确指出刻板印象的影响即使在没有任何恶意(譬如没有任何心怀偏见的人士在场)的环境中也会存在。举例来说,参与我们实验的女生都是在房间里单独完成测试的,她们没有理由认为实验的组织者是在针对女性。不过她们对整个社会的文化环境一清二楚。她们了解在这样一种文化环境中,人们普遍认为男性的数学能力比女性强;她们也明白自己的测试表现很可能会印证这一观点。这些思绪串联在一起产生了叠加效应,使得她们的心情和注意力受到严重干扰,从而最终影响到她们的测试成绩。
还有就是,我们的研究成果并没有得到广泛的采纳。大量文献对“女性很难在数理科学领域跻身尖端行列”的原因做了各种剖析,但我们的观点却未被收录其中。我们也会利用各种会议的机会阐述这一不断完善的观点,大家对于“移除针对女性数学能力的负面标签效应便可以大幅提高女性数学成绩”的发现很感兴趣,至于我们对此的解释则显得过于另类而很难给他们留下深刻印象。而且他们会自行寻找原因,他们会问道:“可不可以这样认为,女生本来对自己数学成绩的期望值就不高,而当她们被难题卡住时,她们的这种‘低预期’就‘自行兑现’了呢?”我们并不是没有考虑过这种可能性,但这种解释根本说不通,因为我们只会挑选那些在数学方面上进心很强的女生参加我们的实验,她们在数学方面一直表现不错,更重要的是当她们得知测试结果不存在性别差异后,同样是可以取得不错的成绩的。如果说女性的数学成绩不佳是因为在遇到解题困难时,她们对于自身的低预期便开始自行兑现的话,那么即使告知女生们测试结果不存在性别差异,她们的成绩也不会得到改善才对,然而实际情况并不是这样。
我们认为自己的理论是别具一格的。此外我们还意识到,我们目前的工作更多的还是在排除错误选项,但对于真实原因的探究做得还不够。仍然还有大量的问题有待解答。比如这种压力是通过何种途径对个人表现产生负面影响的?是通过损伤记忆力还是增加额外的认知负担,抑或是从心理层面产生破坏?它是否只会影响到那些在乎自己表现的人?它是否只会影响女性在数学方面的表现,还是说其他群体在其他场合中都有可能被影响到?通过付出更多努力能够克服这种压力,还是说反而会让情况变得更糟?学校和老师们是否可以做些什么缓解这种压力?对于个体来说,有没有什么办法能够实现自我解压?
我们会对所有这些重要的问题适时开展研究和解答,不过在目前这个时间点上,受合作条件所限,我的关注点又再次返回到少数族裔学生的学业问题上来。我们此前发现的影响女生数学成绩的因素会不会同时也是导致少数族裔学生低迷表现的重要因素呢?
①本次实验中最为接近现实生活场景的就是确信数学测试结果存在性别差异的那一组别的情况。在本次实验中,我们向该组内的成员明确告知了测试结果的性别差异,不过后续的实验证明这一步骤其实是多余的。即使在不被刻意提醒性别差异的前提下,女生们也会做出自行预判,所以她们在数学测试中的表现同样会弱于男生。