第2章 跟自己作战的大脑

反射比我做得好。

——鲍勃·马利

I Shot the Sheriff”(歌名)

多年以来,我跟自己作战。医生告诉我,这对我的健康不好。

——斯汀

Consider Me Gone”(歌名)

公路狂暴,每天在各个国家不断上演,它现在已成为一种全球性现象(James and Nahl 2000)。一个蒙特利尔男人的案例极为典型(Dube 2001)。当时,一个女人驾车行驶在他前头。虽然是快车道,可她开得太慢,这让那个男人顿时陷入狂暴。那个女人其实很无辜,她想给他让道,可惜交通拥堵,一直没成功。最后,她终于想办法给那个男人让出了一段空隙。而他呢,此时在卡车上早就暴跳如雷,对她大喊大叫,气急败坏。接着,他从侧面猛烈加速,试图超车。女人成功地把车停在了马路上,而那个男人的卡车突然失控,像一匹脱缰的野马,不顾一切地冲向灯柱,此人当场死亡。他没有喝酒,不是酒驾。

露西·格里利写了一本书,名叫《面孔的自传》(Autobiography of a Face)。她在这本书中写道,自己九岁时因患癌症,医生把下巴某些部分给切除了。因为癌症,她动了很多必要的手术,结果她破相了。露西的生活变得凄惨。其实给她带来生活变化的,并不全是她个人的身体状况,相当一部分是别人对她的反应:拒绝、言语侮辱还有敌意。这些反应在过去许多年里不断出现。而且,做这些反应的绝不仅仅是最年幼的、懵懂无知的孩子。露西早已习惯了。她不时就能从大一点的男孩口中听到这些无缘无故的轻蔑说法:“到底是什么?”“她是我见过的最丑陋的女孩”或者“你到底是怎么变这么丑的?”

许多其他的破相者,就像露西一样,也报告了自己毫无缘由就被人羞辱的情形(Hallman 2002;Partridge 1997)。这些人走在街道上,这时一辆汽车驶过,有人就会打开车窗,丢下一句伤人自尊的挖苦。他们走在学校礼堂里,这时一个非亲非故或素不相识的人就会走过来,看着他们,说“你为什么不随便钻进一个洞里去死?”对于破相者来说,遭受这些言语的无端羞辱,早已成为他们生活的一部分。

说实话,人类表现很糟糕。这样的例子俯拾皆是。于是我们就想问,这到底是为什么?现在,认知科学家开始揭示我们认知架构的特点,这些特点有时会让我们轻易就做出招人谴责的行为。不过,在揭示这些认知架构的特点之前,我还想再说几个例子。

其中一个来自1974年的一个著名实验,设计者是当时耶鲁大学的斯坦利·米尔格拉姆。这个实验表面上跟学习有关。所有参与者两人一组,每个人都可能被分配到两种角色中的一种:教员或学员。不过,真正的参与者其实被蒙在鼓里,他们不知道,另一个跟他们配对的人其实是实验者的同谋。这些同谋都被分配了学员的角色,因此,真正的参与者都会扮演教员。实验者告诉这些教员,如果学员做错了题目,他们就要惩罚学员;其实你也猜得到,这些学员都会犯错,专门写跟标准答案不一样的回答,这样,教员事实上就必须不停地惩罚他们。扮演教员的参与者被要求施加电击,电击强度会不断增加,通过这种方式来惩罚被关在另一个房间里的学员。作为同谋,学员事实上没有受任何电击。不过,他们演得很像,因此,扮演教员的参与者都相信,他们正在给学员施加电击。的确,在好几个实验中,教员都能听到学员假装被电击之后发出喘息和尖叫。虽然有迹象表明,电击会让人越来越痛苦,可大多数参与者依然使用了机器上标明的最高电流。令人吃惊的是,他们没有遭受强迫。他们有疑问时,实验者仅仅会平静地重复这么一句话,“实验要求你继续”。事实上,许多教员在这种情况下也很苦恼。然而,仅仅是听了“实验要求你继续”这样的话,他们就毫不犹豫继续给学员用刑,让他们叫苦连天。看得出来,许多参与者脸上的表情并不轻松。他们知道,自己的所作所为是错的。问题是,他们照做不误。

最后这个可悲的案例不是来自实验室研究,而是存在于现实中。强奸危机咨询师研究受害者遭受强奸后的情绪调试。他们发现,配偶以及其他重要他人的反应,对这种调试结果的好坏具有关键影响。然而,通常而言,配偶的反应并不是支持(Daly and Wilson 1983;Rodkin,Hunt,and Cowan 1982;Wilson and Daly 1992),而这种不支持的反应本身就会延长受害者心理复原的时间。事实上,配偶常常能意识到,他们的反应(在某些情况下,几乎是在指责受害者)不正确,可他们报告说,自己很难压抑这些可怕的反应,即使他们知道这些反应不合理。在接受团体咨询时,有一个男人说了这么一句话“她曾经全部属于我,现在,她已经被损坏了”(Rodkin et al.1982,95)。而另一个人说的是“有人从我这里拿走了一些东西。我觉得自己受了欺骗。她从前属于我,现在不全是这样了”(95)。很多研究者发现,可悲的是,“虽然丈夫、爱人和父亲经常被视为获得支持的来源,他们最适合给予受害者以安慰和理解,而受害者可以也应该向他们寻求支持。可事实上,他们给予的理解可能最少”(Rodkin et al.1982,92)。

这些看似风马牛不相及的案例,到底存在怎样的联系呢?首先,它们当然都是不幸,代表着人类表现糟糕的方面:公路狂暴是一种致命的社会问题;对破相者冷嘲热讽是一种残忍;仅仅是为了服从实验者的命令,就无端伤害另一个人,这很可悲;强奸受害者还要遭受来自爱人的拒绝,这无异于是在伤口上撒盐。其次,跟本书目的更相关的是这样一个事实:在这些案例中表现糟糕的人常常也同意,自己的行为不合理。在凉爽的一天,要是有时间反思,很多由于狂怒而危险驾驶的人都会承认,他们的行为没道理。嘲笑破相者的人,通常也不想在公共场合文过饰非,为自己开脱。面对类似情况时,他们中不少人都会致歉。不支持强奸受害者的丈夫或男友也都知道,他们的做法该受谴责。还有,米尔格拉姆实验中的参与者看起来并不舒服。

因此这些案例的一个共同特点是,每一个表现糟糕的人看起来都很纠结,都在跟他们的“真我”打架。每个人似乎都知道思考和行动的正确方式,可就是做不到。这一点,在强奸受害者的案例中最明显。在某种程度上,受害者配偶知道他的行为不合理,而且,在很多情况下,他也为自己不能提供支持而感到羞耻。可是,他们就是不能克服这种糟糕的做法。两种反应倾向的冲突,同样清晰地存在于米尔格拉姆实验的参与者身上。许多参与者向实验者抗议,他们显然不舒服,可还是继续对学员施加电击。这些人清楚更好的做法是什么。他们知道正确的选择,可他们做了错误的决定。最后,那些打开车窗、对破相者甩出言语侮辱的人们,他们到底相信什么?一旦远离当时的狂热,冷静下来,他们难道真的以为,脸被毁了人就该死吗?或者,破相者就应该待在自己屋里,远远地避开其他人?大多数人,甚至包括这些案例中的肇事者,远不是如此地堕落不堪。在这些案例描述的任何一种情况下,假如表现糟糕的肇事者能有时间反思,就会承认他们的做法是错的,虽然他们还是执行了备受谴责的方案。

肇事者的所作所为,常常被他们自己或其他人描述为“跟本人不符”。这看起来似乎意味着,存在两种相互冲突的心智,一种选择做某件事,而另一种则知道更好的方案,虽然这个方案失败了。事实上,这就是现代认知科学试图告诉世人的,也是我要在本章中阐述的内容。这些问题中的人,的确有两种心智。

一个大脑,两种心智

根据来自认知神经科学和认知心理学的证据,我们可以得出一个结论:大脑在运作时存在两种不同类型的认知,它们貌似拥有不同的功能,以及不同的优势和劣势。在什么程度上,这种区分应该被认为是严格类别型的,还是被认为反映了不同加工模式的连续体,是一个问题。使用明确区分的认知类型将有助于阐明本书中涉及的问题,不过,我们要是采用更连续性的概念,沟通起来恐怕就会有麻烦。各种各样的证据交汇于这个结论。这些证据来自许多不同的专业领域,比如认知心理学、社会心理学、神经心理学、自然哲学、决策论,以及临床心理学。这些领域的理论家提出了被称之为认知功能的双过程理论。这些理论认为,大脑有两套认知系统,每一套系统都有一个独立的目标结构,和独立的用以实现这些目标结构的机制。在第6章中,我将讨论算法水平的分析跟意图水平的分析(它被理解为多组目标层级)。需要留意的是,大脑由许多不同的子系统构成,这种观点在许多不同学科的概念中反复出现:从人工智能中的心智社会的观点(Minsky 1985),到弗洛伊德式类比(Ainslie 1982;Elster 1989;Epstein 1994),到哲学、经济学和决策科学中多个自我的讨论(Ainslie 1992,2001;Bazerman,Tenbrunsel,and Wade-Benzoni 1998;Dennett 1991;Elster 1985;Hogarth 2001;Loewenstein 1996;Medin and Bazerman 1999;Parfit 1984;Schelling 1984)。

表2-1提供了一系列不同的双过程理论,以及提出这些理论的理论家。这些模型的细节和术语都不同,但是它们具有家族类似性。而且,对当前讨论来说,理论之间的具体差异不重要。为了避免理论预判问题,这两个过程有时会在文献中被称之为系统1和系统2(见Stanovich 1999)。不过,为了更好地描述它们,我将在本章引入两个新标签。

表2-1 不同理论家使用的双系统术语,以及推理的双系统理论的属性

续表

在本书的剩余部分,我将使用双过程理论作为讨论人类认知的工具。认为大脑中存在许多不同系统的观念非常古老。柏拉图(1945)认为,“我们可以把灵魂中反思的一面称作理性,而另一面感受饥渴,容易被性欲和其他欲望的激情干扰,可被称作非理性的欲望,伴随着需要满足之后的快乐”(137)。新鲜之处在于,认知科学家开始理解这些系统背后的生物学和认知结构(Goel and Dolan 2003;Harnish 2002;Kahneman and Frederick 2002;Lieberman 2000;Metcalfe and Mischel 1999;Pinker 1997;Sloman 1999;Sloman and Rips 1998;Slovic et al. 2002;Smith,Patalino,and Jonides 1998;Sternberg 1999;Willingham 1998,1999;T. Wilson 2002;Wilson and Keil 1999),也开始就它们的进化和经验起源提出一些可检验的假设(Barkow,Cosmides,and Tooby 1992;Carruthers 2002;Carruthers and Chamberlain 2000;Evans and Over 1996;Mithen 1996;Pinker 1997;Reber 1992a,1992b,1993;Shiffrin and Schneider 1977;Stone et al. 2002)。而在本章的剩余部分,我将阐述两类加工系统的特点,它们对于理解人类行为(包括在本章开头提及的那些可恶的做法)的影响,以及这样的理解为什么重要:它们对于我们第1章中提到的机器人反叛很关键。

根据双过程理论,其中一类加工过程的特点是自动化,基于启发式,计算能力要求相对不高。因此,这种系统(经常被称为启发式系统,在斯坦诺维奇[1999]的分类中被称为系统1)结合了自动化、模块化和启发式加工的特点;这里提到的几个概念,在认知科学中有过多次讨论。除此之外,即使在注意力投向其他方面时,某种自动化过程也可以执行(见LaBerge and Samuels 1974)。模块化过程运行于独立的知识基础上,我将在下一节中加以讨论。启发式搜索过程非常快,但也很冒险。换句话说,启发式搜索并未使用所有的相关线索,仅仅依赖于最容易被提取的线索(见Gigerenzer and Todd 1999;Kahneman and Frederick 2002)。启发式系统(系统1)对刺激的整体特征做出快速的自动反应。它偏向于根据存储原型的总体相似性而做判断(见Sloman 1996,2002)。

另外一类加工系统经常被称为分析式系统;在斯坦诺维奇(1999)的分类中,它被叫作系统2。这一系统具有心理学家眼中典型的受控加工的特点。分析式加工是串行而非并行,基于规则和语言,计算量很大,而且是我们意识关注的中心。当心理学家和门外汉讨论诸如“有意识的问题解决”这样的话题时,分析式加工就会起作用。这一加工使用的是系统规则,根据刺激组成成分的特点运行,而不是以整体方式表征刺激。镶嵌在这个系统中的规则具有系统性和产生性,这两个特点被认知科学家称为分析式系统的组合性。也就是说,加工顺序不同,结果就不同。关于组合性,见Fodor and Pylyshyn 1988;Pinker 1997;and Sloman 1996。关于分析式加工跟智力的关联,见Engle,Tuholski,Laughlin,and Conway 1999;Kane and Engle 2002;and Stanovich and West 2000。很多文献把分析式加工跟一致控制联系起来—e.g.,Barkley 1998;Case 1992;Dempster and Corkill 1999;Dienes and Perner 1999;Harnishfeger and Bjorklund 1994;Kane and Engle 2002;Norman and Shallice 1986;Zelazo and Frye 1998。而在整体的、基于刺激的启发式系统中,不存在这一特点,而且,这个系统不善于一步一步地、按顺序解决问题。分析式系统跟计算能力的个体差异有着更强的关联——计算能力常常通过智力测验或其他认知能力测验来检测,它的更直接指标是工作记忆。分析式系统有一个重要功能,它可以用来覆盖(orverride)启发式系统导致的不适当的、过于泛化的反应(本章后面几节会涉及这个问题)。因此,人们倾向于把分析式加工的相关倾向跟抑制控制这样的概念联系在一起。在后面几节中,我将花费笔墨,描述每一种系统的关键属性。让我们从系统1或启发式系统开始吧。

自发式系统:大脑中忽视你的那一部分

当你以每小时70公里的速度下坡时,其实是决策在控制自己。突然,你面前出现了一个以前没留意到的断崖。往左拐?往右拐?或者,想想,接着挂掉?

——迈克尔·福莱恩,《哥本哈根》(Copenhagen,1998


在上一节中,当我谈论某个单独系统时,已经使用了系统1或启发式系统这样的术语。其实,这些都是双加工文献中约定俗成的说法。然而,这些说法似乎暗示,启发式系统是一个单独系统,这样一看它就有点儿使用不当了。事实上,我们应该用复数,因为它代表着大脑中(可能相当多)的一套系统:面对诱发刺激,它们自发地做出反应,而这种反应不受分析式系统的控制。在本书中,它们被我称之为自发式系统。在过去的30年里,它们成了非常热门的研究对象。关于自发式系统,见Anderson 1998;Bargh and Chartrand 1999;Baron-Cohen 1995,1998;Carr 1992;Coltheart 1999;Cosmides and Tooby 1994b;Fodor 1983;Hirschfeld and Gelman 1994;Lieberman 2000;Logan 1985;Navon 1989;Pinker 1997;Reber 1993;Rozin 1976;Samuels 1998;Shiffrin and Schneider 1977;Sperber 1994;Stanovich 1990;and Uleman and Bargh 1989。

在表2-1中,我总结了跟自发式系统有关的各种属性。不过,在本书中,我要强调它们的自发性特点,这是一个关键属性。第一,自发式系统会自动加工领域相关的刺激;第二,它们的执行不依赖于分析式系统的输入,也不受这一系统(系统2)的控制;第三,有时候,自发式系统的执行会跟同时进行的分析式加工相冲突。

许多自发式系统的加工被认为具有模块性特点;这是在认知科学文献中得到较多关注的一个概念。关于模块性,见Anderson 1992;Baron-Cohen 1998;Coltheart 1999;Fodor 1983;Gardner 1983;Hirschfeld and Gelman 1994;Samuels 1998;Karmiloff-Smith 1992;Sperber 1994;Thomas and Karmiloff-Smith 1998。在认知科学中,模块性是一个相当复杂的概念,因为它包括很多属性,而这些属性中很多又都有争议。在本书中,我对自发式系统的理解不那么狭隘,因此,跟大多数认知科学文献中的模块性概念相比,不那么有争议。提出有争议理解的学者,很多都受福多的影响。在极有影响的《心智的模块性》(The Modularity of Mind)一书中,这位哲学家明确阐述过自己的观点。福多的认知双过程模型区分了两个过程:模块性加工和中心化加工(central processes)。模块性加工主要涵盖输入系统和输出系统,前者跟语言和知觉有关,后者跟基于加工信息决定有机体的反应有关。模块性输入把信息反馈给中心化加工(分析式系统)——这是一种非模块性的加工机制,负责高级推理、问题解决、明确决策,以及审慎判断(Harnish 2002)。

根据福多(1983,1985)的观点,模块性加工具有诸多重要属性。这些属性包括:

1.快速。

2.强制。

3.领域特殊性。

4.信息封闭。

5.难以认知渗透。

6.由特定的神经结构做支撑。

7.容易遭受特定的病理性损坏。

8.个体发生层面的确定性(经历一个固定的发展顺序)。

属性6~8来自福多(1983)对内在特定模块的强调。然而,在我的概念中,它们不是自发式系统的一部分,虽然内在模块(innate modules)即进化而来的种种心理倾向和机制。——译者注是自发式系统的一个重要组成部分。在我看来,同样重要的是通过经验或实践而转变为自发式系统组成部分的过程。简而言之,能够获得自动化属性的过程。

属性4和5,即信息封闭和难以认知渗透,在福多对认知模块性的界定中很重要。不过它们极有争议,而且很难实证检验。信息封闭意味着,一个模块的运作,不被没有包含在该模块之内的知识结构提供的信息所影响。难以认知渗透意味着,中心化加工无法进入、也无法控制模块内部的运行。

在认知科学中,一个具体的子系统是否具有信息封闭的特点,以及是否因此而被认为是一种福多式模块,经常引发激烈争论。相比之下,属性1和属性2少有争议,这也是为什么我把它们作为自发式系统结构的中心特点。举例来说,心智理论也被翻译成心理理论。——译者注的子系统在大脑中是否具有信息封闭的特点,是否难以认知渗透,就导致了不同观点之间的猛烈交锋(见Baron-Cohen 1998;Scholl and Leslie 2001;Sterelny 2001b;Thomas and Karmiloff-Smith 1998)。尽管这个子系统具有多大的封闭性充满争议,但它快速有效,能在正常人的大脑中自动运行,则少有争议。

在我的自发式系统概念中,属性2(模块性加工的强制性)被吸收了进来。自发式系统的加工不能被中心化加工关闭或干扰。当被相关刺激引发之后,它们就强制运作。即使中心化决策认为自发式系统的结果没必要或有害,它也不能要求自发式系统不受这种刺激的引发(当然,在决定某个反应时,中心化加工能覆盖自发式系统的结果,见下面的阐述)。自发式加工就像弹道导弹,它们一旦引发就会持续运行,无法在中途被中止。

自发式加工需要对刺激的一个微小子集作反应。一旦引发,它们就会执行,直到完成(即模块能有效完成一个操作,它不需要一个中间决策)。这一点解释了属性1:自发式加工很快,而且不消耗中心化加工的资源。自发式认知加工能迅速执行,是因为它们需要做出反应的刺激序列数量有限,它们执行的转换过程是固定的,不需要在线决定。它们不必咨询缓慢的中心化加工系统。它们致力于执行动作直到完成,而不是校正它们的表现,也不在中途加以调整。

属性3,领域特殊性(domain specificity),这是福多式模块的一个关键属性,但并不是自发式加工的定义特征。这是因为,除了领域特殊性模块之外,自发式系统还包括了更多领域一般性的(domain-general)联想加工和内隐学习加工。此外,自发式系统还包括通过情绪进行的行为调节过程(Johnson-Laird and Oatley 1992)。正如格里菲斯(1997)所言,这些情绪调节过程在结果端是领域特殊性的,但是引发它们的刺激来源于更为一般(尽管有偏向)的学习机制。

许多认知理论家强调模块过程的非智能本质(e.g.,Dennett 1991;Fodor 1983,1985;Karmiloff-Smith 1992),以及快速执行过程的进化意义(e.g.,Buss 1999;Cosmides and Tooby 1992,1994b;Pinker 1997),得到了研究者的普遍探讨。,在某种程度上,自发式系统的加工相当不聪明:当触发刺激出现时,它们就不问青红皂白做反应,直到反应完成;即使情况有变,即使它们的反应结果已是累赘。它们处理相关的诱发刺激。不过,即使自发式系统不怎么聪明,它们也以自己惊人的效率对此做了弥补。跟缓慢、笨拙、计算昂贵的中心化加工(见下文)相比,许多自发式系统的加工能够平行进行,很快就出结果。正如进化心理学家告诉我们的那样,诸如面孔再认、言语理解以及解读他人的行为线索这样的认知结果,要是能完成得越快,就越有适应性。

福多(1983)指出,快速的非智能化加工是个优点。在一个面临所有可能选项的情境中,对于一个自动化过程来说“只有一个刻板的子集能发挥作用。不过,你用这种刻板和愚蠢换来的是你不必非得做决定,而做决定要耗时间”(64)。福多说,跟一个“必须做决定”的过程相比,这就拥有了一种速度优势。本节一开始,我就引用了剧作家迈克尔·福莱恩的话;他的话体现了这一思想(“向左拐?向右拐?或者,想想,接着挂掉?”)。在这个世界上,某些情境要求人们快速反应,即使由此导致的结果可能比全面加工差。

总结一下,自发式系统加工的关键特点是快速、自动化,以及强制性(也因此被称为自发式)。跟福多(1983)模块的概念相比,我对自发式系统的界定更为宽泛。自发式系统包括的绝不只是内在机制。跟大多数自发式子系统相比,我的概念也在相当程度上降低了标准4和标准5,即它们跟分析式加工相比,仅仅是相对的封闭和难以渗透。这种做法让自发式系统的概念较少受下述争议的影响,即为否某个特定模块满足完全封闭的离散标准。实际上,许多其他理论家(e.g.,Karmiloff-Smith 1992;Tsimpli and Smith 1998)探讨了在界定一个模块时,减少福多式约束(特别事封闭性)的结果。举个例子,Tsimpli and Smith(1998)把心智理论称为一个准模块,因为它们既非完全封闭,也不是完全不封闭(也见Carruthers 1998;Baron-Cohen 1995;Sperber 1994,1996)。自发式系统的内部操作不产生任何意识经验,也许它们的结果有可能。“自发式”这一术语的另一个含义对我而言很重要,即自发式系统的加工是平行的:各个子系统之间是平行的,子系统跟分析式系统之间也是平行的。而且,它不需要分析式系统的输入信息。这样看来,分析式加工绝不是自发式的,它经常跟自发式系统的子过程提供的信息协同运作。

根据进化心理学家(比如Pinker 1997;Tooby and Cosmides 1992)的说法,很多自发式系统的加工是自然选择的产物。不过,在我宽泛的自发式系统子过程的定义中,某些不是,它们通过实践获得了自发性。当然,我跟进化心理学家一样都反对福多:我们允许某些高水平或概念性的自发式加工过程,而不是局限于知觉领域。进化心理学家强调,高级认知过程也可具有模块性特点。同样,我也允许高级概念存在于自发式系统中。不过,我比进化心理学家走得更远。我认为,通过实践,概念化的系统和规则也能进入自发式系统。因此,自发式系统同时包括基于进化史的内置反射的达尔文式心智(这在前一章中有所阐述),以及类似反射的知觉和认知反应,它们是个体在其一生中获得的。这是一种人们组织他们认知的方式:明确训练高级技能,使它们转变为自发式加工,能自动执行,这就为其他活动释放了中心化的加工空间。

一个经典的自发式系统子过程就是反射。从本书涉及的庞大主题来看,反射在某种程度上很无趣。不过,一旦深入思考,这一简单的自动化过程就会呈现令人惊讶的特点。如果我们仔细想一想,就会发觉,它们发出了这样的信号:我们的大脑中的确存在多种心智。反射现象表明,意识中的“我”似乎控制着我们的精神生活,可它并不像我们想象的那么强大,那么有控制力。而且,在某种重要意义上,你的大脑中有些部分忽视了你。

思考一下眨眼反射。设想我们是朋友,你跟我一块儿待在一间屋子里,正在讨论反射。这时,我走向你,把我的食指戳向你的眼睛,停在离它两英寸1英寸=0.0254米。的地方,你会眨眼。请注意,根据前面讨论的内容,在目前这个具体的场合中,这种做法相当不聪明。要知道,我们是朋友,而且我们在讨论眨眼反射。你知道,我这仅仅是在展示,我不会戳你的眼睛。可是,你无法使用这样的知识,你知道没必要眨眼,而且你也没法停止这么做。反射“有自己的想法”。它是你大脑的一部分,但不受你控制。

自发式系统绝不局限于反射。福多讨论的知觉输入系统也具有同样特点:尽管你的中心系统“知道”,可它们还是会自行启动。我们来看一下缪勒-莱尔错觉,如图2-1所示。上面的线段好像比底下的线段更长,虽然实际上并非如此。这个错觉名气很大,我猜基本上每个读这本书的人以前都可能见过它。把注意力集中在这两个线段一样长的信息上,上面的线段还是看起来更长。两者一样长的知识不起作用,因为,自动的知觉输入系统负责制造这个错觉。缪勒-莱尔错觉的例子表明,知觉输入系统会忽视你,可它也是你大脑的一个重要部分。这里说的“你”其实是你心智的中央控制器。正如我们将要看到的,你其实是错觉的一部分。

图2-1 缪勒-莱尔错觉

自动化过程的列表很长,不会停留在反射和知觉输入系统这两个项目上。可以看到,自发式系统帮助把自我从世界中区分出来。它们自动运行,有时会跟你所知道的这个世界的知识相悖。比如,罗津、米尔曼和内梅洛夫(1986;也见Rozin and Fallon 1987)做了一个跟厌恶情绪有关的实验。在其中一个场景中,参与者吃了一块高级软糖,他们表示还想再吃一块。不过,这时实验者提供了另一块同样的软糖,但是把软糖形状做成了狗屎样。参与者觉得很恶心,一点儿也没胃口了。他们也知道软糖其实不是狗屎,而且闻起来很香,可他们的厌恶反应依然发生了。丹尼特(1991,414)描述了另一个版本的罗津实验,虽然是非正式的。实验如下。把你嘴里的唾液咽下去。没问题。好,现在找一个空瓶子,把唾液吐进去,然后把它一饮而尽。呀!太恶心了!不过,为什么?正如丹尼特(1991)指出的那样,“看起来这跟我们的感知有关:一旦某物脱离了你的身体,它就不再是我们身体的一部分,它变得陌生,令人怀疑;它已经放弃了自己的公民身份,变成了要被断然拒绝的另一个东西”(414)。在某种意义上,我们知道,我们对吞咽和对喝的反应不同,这是非理性的,可是这也不能取消两种反应之间的差别。知道得再多,了解得再深,都不足以克服面对瓶中唾液时的自发式反应。它同样也是大脑中忽视我们的那一部分。

认知加工的自发性不仅仅是预先配置好的倾向,也可以获得。这可以通过一个最古老的实验心理学范式加以说明;这个范式常被用来证明认知过程的自发性。这个所谓的斯特鲁普范式表明,当注意力指向别处时,自发式过程依然在执行(见Dyer 1973;Klein 1964;MacLeod 1991,1992;MacLeod and MacDonald 2000;Stanovich,Cunningham,and West 1981)。这里有一个斯特鲁普范式的描述。实验的参与者看到一张卡片,上面有彩色的条带,他们被要求报告那个条带颜色的名称。在第一种对照条件下,条带不含有任何干扰信息。在第二种干扰条件下,条带标记使用的是另一种颜色,这种颜色跟条带本身的颜色不同。比如,一个红色的条带可能含有“绿色”这个词。在干扰条件下,参与者被告知要尽可能忽略颜色词,接着完成他们在第一种条件下的任务:给条带的颜色命名。

自动词汇识别的存在是这样推测的:跟对照条件下不存在言语刺激冲突(只出现红色条带)相比,在冲突条件下,人们的反应时会延长。由不相容的冲突性文字引发的干扰成了自动化的一个指标。研究者认为,斯特鲁普任务表明,即使参与者的注意力指向别处,他们对文字的加工依然会强制进行;是的,哪怕他们其实不想这么做。事实上,对于“当注意指向别处时,加工依然会进行”这一逻辑而言,斯特鲁普任务是一个极端案例。因为经过多次尝试之后,大多数参与者都会主动试着(虽然没成功)忽视那些文字。不过,词汇识别加工的自发性表明:别把注意力放在红色条带上,或“告诉自己忽略那些单词”,都无助于消除文字干扰。执行斯特鲁普任务的参与者证明,他们获得了一个忽略中心系统指令的大脑过程。

我在前面说过,进化心理学家认为,自发式加工不应局限于外围输入的子系统,这让他们备受瞩目。在表2-2中,我从各种来源对列在表2-2中若干模块的讨论,见Atran 1998;Barrett,Dunbar,and Lycett 2002;Baron-Cohen 1995;Carey 1985;Carruthers 2002;Carruthers and Chamberlain 2000;Cosmides and Tooby 1992;Hirshfeld and Gelman 1994;Leslie 1994;Mithen 1996;Pinker 1997;and Tooby and Cosmides 1992。搜集了若干自发式模块。提出这些模块的,既包括进化心理学家,也包括发展理论家以及认知科学家;他们来自多个领域。这些模块由不同研究者在过去20年里陆续发现。显然,这些模块大多数都有助于解决进化史上的重要任务,比如获得食物和水源、探测和避开捕食者、获得地位、识别亲属、寻找配偶和照料孩子。其中很多都是概念化模块,而非福多式的外围知觉模块。同样,我也认为自发式系统包括许多自主性的概念过程(这些都列在了表2-2中),还包括许多规则、刺激辨别,以及通过实践而获得的自动化决策原则。我的自发式系统加工还包括经典条件作用和操作条件作用,它们比表2-2列举的模块表现出更强的领域一般性特点。最后,通过情绪进行的行为调节过程(Johnson-Laird and Oatley 1992;Oatley 1992,1998),同样存在于我的自发式系统中。

表2-2 过去20年里,心理学文献中讨论过的认知模块

进化心理学家使用的一个隐喻很有用。这个隐喻强调,自发式系统包括了一整套过程,而不仅仅是一个孤立的系统。这个隐喻来自考斯米兹和图比(1994b;Tooby and Cosmides 1992);他们把心智比作一把瑞士军刀。进化心理学家使用这个隐喻,是为了驳斥这样一种观点,即人类的大多数信息加工靠一般的认知机制完成。他们说,“心智更像是一把瑞士军刀而不是一块多用途刀片:心智能应对各种各样的环境,这是因为它拥有众多的组件,比如开瓶器、瓶塞钻、小刀、牙签、剪刀——每一个都是为了解决一个具体问题而设计出来的”。(Cosmides and Tooby 1994b,60)这个隐喻抓住了自发式系统的复杂性,以及在某些组件中它所具有的领域特殊性。关于适应工具箱这有一个类似的隐喻,由Gigerenzer和Todd(1999)提出:“就像在修理汽车引擎时,一个机械师会拿出具体的扳手、钳子和火花塞间隙规,而不仅仅是拿着大锤猛砸一通,不同的思想领域也需要特定的工具。这就是适应工具箱的基本思想:特殊性认知机制的集合,它们针对具体领域的推论和思维,由进化建立在人脑中”(30)。

瑞士军刀是一个很有趣的隐喻。它指出,自发式系统中存在许多不同的加工机制,这些机制不少都具有准模块性的特点。尽管如此,我在本书中提出的双过程模型,跟某些进化心理学家主张的人类心智概念有两点不同。第一,我不认为,自发式系统子过程必然是模块性的,或准模块性的。除了进化心理学家讨论的达尔文式心智具有准模块性特点之外,自发式系统中还包括无意识学习和条件作用的领域一般性加工,以及通过情绪(它对广泛刺激做反应)调节行为的自动化加工。其次,一个重要区别在于,进化心理学家不承认存在一个通用的中央处理器某些进化心理学家,特别明显的是Cosmides和Tooby(1992),他们提出心智是进化适应器的观点,采取了一种完全模块化的心智观。因为他们相信,进化仅仅只能产生模块结果。然而,其他的进化理论家不同意,见Foley 1996;LaCerra and Bingham 1998;Over 2000,2002,2003a,2003b;Samuels 1998;Smith,Borgerhoff Mulder,and Hill 2001;Sterelny and Griffiths 1999。。相比之下,本章中提及的双过程模型把这个中央处理器视为心智的第二种核心部件。

描述分析式系统:避开侏儒问题

也许,描述分析式系统(系统2)加工特点的最简单方法,就是说它跟自发式系统具有相反的一套特征。自发式系统的加工是平行的、自动的、通常意识不到的,对计算能力要求相对较低,它们计算处理的通常是领域特殊性信息。而分析式系统可以说是序列的,有中央执行控制,能意识到,要求较高的计算能力,计算过程中处理的是领域一般性信息(见表2-1)。使用这种策略界定分析式系统,初步看来是对的,但也可能会引起细节方面的争议。

围绕着分析式系统,有一个最困难的问题:我们该怎么谈论它,才不会犯一些非常初级的哲学错误,或暗示一种在功能上绝无可能的大脑模型?我们粗糙的自然语言,很难精确对应认知科学的概念,或我们了解的大脑神经生物学知识。在更高的非模块性水平上理解大脑机能,需要牵扯到递归性和自我指涉性,两者都很难描述。在讨论高级的大脑系统时,沟通的便利跟事实的精确难以兼顾。

当你转身,想要使用心理学中分析式系统的隐喻时,立马就会觉察到困难。一种最流行的隐喻把分析式系统视作一个中央处理器。对它漫不经心的使用,很可能就会引起所谓的侏儒问题(就是“头脑中有一个小矮人”的问题);心理学家和哲学家对这个问题很熟悉。这个问题的要害在于,如果我们提出大脑中有一个很复杂的假想实体,以此解释复杂的行为辨别或选择,那么,我们仅仅是把一个难题从大脑外部移到内部,可它还是跟从前需要解释时一样复杂,一样令人困惑。比如,我们会简单认为,一个人决定去做X是因为他的处理器决定去做X,这不能代表我们理解上有进展。我们可以更简单地说,一个人想做某件事,是因为存在另外一个对应的小矮人(脑子里的侏儒),是它决定那样做的。

这种侏儒假设什么都没解释,除非侏儒(比如,那个假设的处理器)能被更简单的心理学和神经生理学过程给释放出来,而这些过程的理解更全面,神秘性也更少。如果我们把一个聪明的侏儒不断分解成越来越简单的侏儒,使得他们的行为的神秘性越来越少,那么,我们事实上就获得了科学进步“智能可以被分解成非常细小、非常愚蠢的碎片,以至于它们根本不能被称为智能”(Dennett 1995,133)。只有当假想的侏儒太聪明时,侏儒问题才会出现。假设复杂实体被分解为足够简单的概念实体,而且它们的运作被认知心理学家或神经生理学家用他们武器库的有效方法给检测到了,那么,这些理论家自由使用这些实体就是合理的。要是复杂实体未经分解,那么,我们就有理由谴责这个侏儒。

哲学家不断监督心理学家,防止他们因为使用这个隐喻描述分析式加工而陷入侏儒问题或其他的概念谬误。跟侏儒问题一样,许多围绕意识讨论而提出的隐喻,同样具有误导性。这跟我们现在的讨论有关系,因为分析式加工经常跟自发式加工对比,前者是有意识的,而后者则是难以提取的、意识之外的过程。在《意识的解释》(Consciousness Explained)一书中,丹尼尔·丹尼特设计了一系列思想实验,初衷就是为了把我们从一种笛卡尔式二元论(认为世界上存在两种独立实体,心灵与物质)的默认假设中解救出来,也是为了训练我们,以便重新改变我们与生俱来的二元论语言。他特别警告,不要使用暗示所谓的笛卡尔式剧场的语言——在某些地方,所有的大脑活动“聚到一起”,并被提交给“中央代表”(侏儒),而它对剧场里发生的事的理解就演变为我们的意识。

作为个人决策的某种解释,很容易就会陷入这种观点,其实质就等于说中央代表(观看剧场屏幕上有意识的“表演”,剧场就是“聚到一起”的地方)变成了我称之为普罗米修斯式控制器的东西。它开始做决策,接着按杠杆,这样,某个人就会根据这些选择行动。任何一个科学家都不会提出这种模型。不过,它可能被一个普通读者给暗示出来,因为他不熟悉很多概念语言。对他而言,这些来自认知控制的心理学和神经生理学的术语晦涩难懂。(Baddeley 1996;Harnish 2002;Johnson-Laird 1988;Miyake and Shah 1999)

不过,我得警告读者(我希望这是最后一次),我打算使用被某些哲学家认为危险的隐喻,特别是跟执行控制和系统覆盖有关的隐喻。我这么做,是因为它们有助于沟通,还因为便签上引用了诸多证据,能给我提供概念和实证基础,方便我用来分析分析式系统运作的构念。对于初学者而言,请参阅Baars 1997;Baddeley 1996;Baddeley,Chincotta,and Adlam 2001;Harnish 2002;Kimberg and Farah 1993;Miyake and Shah 1999;Pennington and Ozonoff 1996;Shallice 1988,1991;and West 1996。他们都认为,存在一种科学的、受尊重的方式谈论下面的概念:中央处理器、策略控制、注意加工以及决策制定,而不必让我们陷入侏儒问题的麻烦中。跟很多心理学家一样,我比许多哲学家都容易接受中央处理器这样的说法。我认为,这个领域已发出了适当的警告,如上所述,而且也积累了很多正面和负面的例证,中央加工的概念可建立于其上,作为原型使用。跟哲学家相比,心理学家和神经心理学家更喜欢冒险使用高级控制的语言。对他们来说,一种有效讨论实验结果和新实验设计的方式很有必要,因而他们更在乎沟通是否顺畅。如果完全采用语言的分布式系统,这种沟通很容易被打乱。

几乎所有的认知科学家都同意,笛卡尔式剧场或普罗米修斯式控制器的观点是谬论。此外,他们也都同意,大脑的控制分布在广泛的而非单一的神经区域。同样,大多数人也都认可平克(1997)的说法:


心灵社会是一个美妙的隐喻,在解释情绪时,我会满怀热情地使用它。不过,这个理论可能会走得过远,要是某些大脑系统被控告有时会给代理人以绳子或地板,于是就被它宣布为不合法。大脑代理人可能是分层组织、良好嵌套的一套决策规则、一个计算式的妖怪、代理人或好心的侏儒的子程序。它不是机器中的另一个妖怪,仅仅是另一套“如果-那么”法则或神经网络;它们分流控制着下一级最响亮、最快速、最强大的代理人。(144)


平克的看法,更接近于我在这里采用的观点,即认知控制分布于整个大脑,但它的方式依然可以用执行或中央控制的语言来描述。我在前一章讨论基因时使用意向性语言提出过警告,这里有一个直接类比。使用“基因想要”的说法,并不暗示基因有一种有意识的愿望。为了方便,使用拟人化的语言其实也没什么坏处,只要每个人清楚,它背后实际的生物学解释是什么就行。同样,谈论执行控制或分析式系统覆盖自发式输出也不意味着,承认存在一个幽灵似的侏儒在脑子里做明确决定。这样的说法可以用认知控制的机械模型来表达。很长一段时间以来,研究者提出了不同的模型回答下面的问题:分布式系统共享一个工作空间存储它们计算的中间产物,在这样的认知架构中如何维持控制测序(Anderson 1983;Baars 1997;Johnson-Laird 1988;Lindsay and Norman 1977;Newell 1990;Selfridge and Neisser 1960)。在谈到有机体受到这些系统影响时,使用执行控制这样的说法并没有错,因为,所有的高级控制语言都能找到合适的科学表达,而不必提出主张说有一个侏儒,他的智力令人尴尬。因此,在这一章后面以及其他章节中,我将使用诸如分析式系统控制这样的说法。它应该被理解成这些说法背后默认的机械模型,不含有一个假定的侏儒或普罗米修斯式控制器的问题。我想到的典型的机械模型存在各种各样的变体,可以从我大量引用的文献中找到,见Anderson 1983;Baars 1997;Baddeley 1996;Carruthers 2002;Clark 1997;Dennett 1991;Evans and Over 1996;Johnson-Laird 1988;Miyake and Shah 1999;Newell 1990;Norman and Shallice 1986;Perner 1998。

一次一步骤:用语言找出世界运行的方式

跟许多自发式系统(特别是达尔文式模块)语境限定的操作不同,分析式系统允许我们维持强大的脱离语境的机制,包括逻辑思维、推论、抽象、计划、决策和认知控制。另外一个属性,即序列加工而非平行加工,也能把分析式系统(系统2)跟自发式系统区分开来。因为前面讨论的不少属性(自动化、弹道导弹式运行,等等),许多自发式系统能同时执行,而分析式系统一次只能处理一个观念。

尽管分析式系统对逻辑和符号思维而言很强大,可它的去语境化认知方式计算高昂,而且难以维持。分析式认知“不自然”,于是也很少见。因为它跟自发式系统不同,不是一个硬连接的大脑架构。相反,在《意识的解释》这本书中,丹尼尔·丹尼特提出这样一种观点:分析式加工靠一系列虚拟机执行,而虚拟机是由很多平行的大脑硬件虚拟出来的。虚拟机就是运行在电子计算机上的一套指令(“一个虚拟机就是一套暂时的、高度结构化的规则,这套规则由一个基于硬件的程序启动……这样就能给硬件一套巨大的、环环相扣的、做出反应的习惯或倾向”,丹尼特1991,216)。简而言之,分析式系统在这种视角下更接近于软件(某些人称之为“心智套件”;见Clark 2001;Perkins 1995),而不是一套独立的硬件架构。

丹尼特(1991)的模型跟一个观点有关系;这个观点在认知科学文献中反复多次出现。它认为,在某种程度上,领域特殊性的自发式模块输出能被用作更为一般的目的,因而增加了行为的灵活性。在认知科学中,通过大量领域特殊性自发式模块信息整合而导致的分析式加工具有不同表达(Clark and Karmiloff-Smith 1993;Karmiloff-Smith 1992;Mithen 1996;Pinker 1997;Rozin 1976)。Rozin(1976)的讨论也许是这一观念的经典版本,为它更为晚近的表现奠定了基础。他的观点是,行为灵活性以及智力,随着自发式系统周围模块变得更容易联结到更多中心和输出系统而不断增长。Dannett的观点跟Rozin不同,因为后者认为大脑再次布线(硬件改变),而在前者的观点中,大量平行自发式系统被重新动员运行一种跟自发式系统具有不同逻辑的软件。不过,分析式系统的串行功能难以维持,因为它们是在更适合模式识别这种并行功能的硬件上模拟出来的。维持序列模拟能力方面的个体差异,可能跟为什么智力跟反应时和其他速度型任务有关的原因有联系。在该领域一篇极为经典的综述中,Deary(2000)发现了一个理论的悖论,即我们很难解释为什么初级信息加工跟智力会有关联。我猜想(Stanovich 2001)不是因为这些任务测量了某种内在的“心理速度”(Deary回顾的文献证据指出,当神经传导速度被排除之后,反应时跟智力之间关系几乎不受影响)。相反,它们更可能是作为大脑联结主义模型可用的计算能力的间接指标,这些计算能力可被用来维持序列处理器的模拟。当然,维持序列模拟的可用的计算能力有其他更为直接的指标,比如工作记忆。而且,一点儿也不奇怪,它们跟智商有更大的关联。根据这种观点,一般智力能被描述为涵盖了两种基本属性上的个体差异(也许映射了根据Horn/Cattell模型的流体智力和晶体智力的区分,Horn 1982;Horn and Cattell 1967)。首先,存在维持序列模拟的平行网络的计算能力(这在Horn/Cattel的智力模型中最接近流体智力)。第二种主要因素是在序列模拟中使用文化工具的能力—格里高利式心智,根据Dennett(1991)的智力大模型(这个因素的个体差异可能跟Horn/Cattel模型中晶体智力的变异有关)。

这样一种看待自发式和分析式系统差异的观点,跟长期以来人工智能领域中的反讽是一致的:人类擅长做的事,比如面孔识别、三维物体感知、语言理解,对计算机来说很难;而计算机很容易做的事,比如使用逻辑、概率推理,对人类来说就很难。现在,研究者对自发式和分析式系统之间为何不同的理解,把这种人工智能领域的悖论给厘清了。对计算机来说,它没有建立起历经数百万年进化而成的精细严密的自发式系统。于是,作为一种进化遗产,诸多平行而有效的人类自发式系统擅长的事,对计算机来说简直是难于登天。相比之下,作为一种用于逻辑的串行处理器,人类的分析式系统是一种最近才安装的大脑软件。打一个比方,它就像是一台组装机(在计算机科学中,这是一种解决问题的粗糙方案)运行在诸多平行的、为别的目的而设计的硬件上。相反,计算机最初就是有意设计的串行处理器,依据逻辑规则而运行(Dennett 1991,212-214)。怪不得,逻辑运算对计算机很容易,但对我们很难。

几乎所有的认知学家都认为,唯有分析式系统才能对语言输入做响应,无论输入的是内部语言还是外部语言。作为一种自我激励机制,语言为大脑的信息加工序列引入了更多的连续性。它好像也是唯一的认知模块通路介质,而在通常情况下,这些模块没有彼此输出之间的通路。因此,在孤立的认知子系统跟存储位置之间,使用语言建立新的联结,这是一个额外的串行处理器的重要功能。

通过语言,我们能很快接收新的心智套件,还能即时安装和准备运行新的虚拟机(这是一种安装了的规则机构,暂时掌管处理器信息加工的逻辑)。因此,我们能迅速安装被其他人发现的心智套件,它们被证明很有用。比如,在本书后面的章节中,我将讨论无数决策科学家发现的策略,它们能帮人们做出更好的决策。在一个联结主义网络中(Rumelhart,Smolensky,McClelland,and Hinton 1986),语言输入也服务于一个快速的、所谓的语境固定功能(Clark 1996)。它可能需要一个联结主义网络数十次尝试和相当长时间来抽取原型,一个语言交流能在一个单词的离散沟通中激活一个预先存在的原型。Clark(1996)讨论的语境固定者是“额外的输入,伴随给予常规输入,可能会引发一种输入(单独)不能激活的一个已存在的原型事实上”(117)。他认为,“语言交流能被视作一种手段,提供快速的、高度聚焦的、语境固定的信息”(117)。最后,应该注意的是,提出语言在分析式系统运作中很重要,跟大多数理论家同时提出自发式系统中存在语言模块的事实并不矛盾。Carruthers(2002)讨论,说一个中心系统把一个自发式模块纳为新成员,为一个非模块化的目标服务,这没什么可奇怪的。人们通常接受下面说法,即当我们在想象中看到某些东西时,我们调用了自发式系统中的视觉模块的运作(Carruthers找了很多证据,指出,某些视皮层的同一区域在实际看和想象时都会激活)。Carruthers认为,同样,外围语言模块能被调用,以便参与某种非模块化的推理和问题解决。

语言的顺序结构也有助于整体的认知控制,以及对多重目标进行测序和排序。哲学家阿兰·吉巴德(1990,56-57)讨论了这个问题,强调语言有动机属性,能迅速激活本已暂时失活但跟目前情境有关的目标。面对言语输入,目标优先权再调整能迅速进行。吉巴德还阐述了本书的一大主题,即基于语言输入(无论是来自内部还是外部)的快速目标优先权再调整,有可能跟自发式系统中固有的目标优先权相冲突。

规则的系统性和生成性可被离散的表征系统(比如语言)表征,这界定了分析式系统的一种关键属性,认知科学家称之为组合性(Fodor and Pylyshyn 1988;Pinker 1997;Sloman 1996)。在具有组合性特点的计算系统中,表征的意义来自除了单个部分意义之外的表征部分的顺序。正如平克(1997)所言,“人咬狗”是新闻,但“狗咬人”不是。语言的组合性给了我们一个优势,让我们很容易表征表面上相似但实质上不同的观念。

分析式系统也负责建立对一个人的行为进行一致性描述。回想一下,自发式系统将自动对刺激做出响应,使得加工产品进入工作记忆以便进一步处理,引发它自身的行动,或至少促发某些反应,因而增加了它们的反应性。分析式系统尝试维持一个连贯的故事,以便解释某个活动的全部,即使它对引发这个活动没多少贡献。人们发现,分析式系统会编故事,它们会对被自发式系统无意识引发的行为进行有意识选择。分析式系统的虚构倾向,以及它自我中心的归因倾向,有过广泛的讨论—e.g.,Calvin 1990;Dennett 1991,1996;Evans and Wason 1976;Gazzaniga 1998b;Johnson 1991;McFarland 1989;Moscovitch 1989;Nisbett and Ross 1980;Nisbett and Wilson 1977;Wegner 2002;T. D. Wilson 2002;Wolford,Miller,and Gazzaniga 2000;Zajonc 2001;Zajonc and Markus 1982。我很快就会阐述,分析式系统对行为进行虚构解释的倾向会阻碍认知变革;而只有承认并考虑某些大脑子系统具有自主性的本质,这种变革才能发生。我们的分析式系统能学会对行为给出更好的描述性解释,这种解释跟神经心理学的事实更一致。学习这种技能,就是机器人叛乱的一部分。

假设思维和表征复杂性

分析式系统的一个功能是支持假设思维(hypothetical thinking)。假设思维涉及表征世界的可能状态而不是事情的实际状态,而且,它还跟很多推理任务有关,从演绎推理、决策制定到科学思维。假设思维的方方面面被很多理论家阐述过—e.g.,Atance and O扤eill 2001;Bickerton 1995;Carruthers 2002;Clark and Karmiloff-Smith 1993;Cosmides and Tooby 2000a;Currie and Ravenscroft 2002;Dennett 1984;Dienes and Perner 1999;Evans and Over 1999;Glenberg 1997;Jackendoff 1996;Lillard 2001;Perner 1991,1998;Sperber 2000b,2000c;Sterelny 2001b;Suddendorf and Whiten 2001;M. Wilson 2002。许多理论家指出,假设思维的一个重要早期焦点很可能是其他人的心智(假设的心理状态)—e.g.,Baldwin 2000;Bogdan 2000;Davies and Stone 1995a,1995b;Dennett 1996;Humphrey 1976;Perner 1991;Tomasello 1998,1999;Wellman 1990;Whiten and Byrne 1997;Zelazo,Astington,and Olson 1999。围绕着元表征概念有很多微妙的表述,见Dennett 1984;Perner 1991;Sperber 2000b;Suddendorf and Whiten 2001;Whiten 2001。比如,演绎推理是这样一种推理过程:前提不是个人知道的某件事,而是跟世界有关的一个假设;功利主义或结果论者的决策涉及表征世界可能的未来状态(不一定是实际状态),以便能让人做出最优选择;在科学思维中,替代假设被想象成原因,这种原因的结果可被推断出来加以检验。

为了进行假设推理,一个人必须能表征这样一种信念:它跟正在被表征的世界不同。很多认知科学家讨论了所谓的脱钩技能(decoupling skills)。这是一种心理能力,允许我们把信念描述成一种世界的假设状态,而不是它的实际状态(比如Cosmides and Tooby 2000a;Dienes and Perner 1999;Glenberg 1997;Leslie 1987;Lillard 2001;Perner 1991)。脱钩技能可以阻止我们混淆对世界的两种表征:一种是对真实世界的表征,一种是对想象情境的表征。想象情境是我们暂时创造的一种因果模型,目的是为了预测未来行动的效果,或思考世界。这种模型跟我们目前对世界的理解不同。

除了某些领域,比如行为预测(所谓的“心智理论”)之外,脱钩是一种认知要求很高的操作。执行它的通常是串行的、加工能力要求较高的分析式系统。语言提供了一种离散的表征媒介,能让作为一种文化获得观念的假想得以蓬勃发展。举例来说,假设思维涉及表征假设,诸如条件句这样的语言行为提供了这种表征的媒介。对这种表征类型的序列操作,看起来主要依赖于一种分析式系统的功能。

脱钩过程使得一个人能脱离对世界的表征,这样,他们就能反思甚至能改进。对要采取的行动进行脱钩表征,变成了对可能行动的表征。不过,当心理模拟进行时,后者不应该影响到前者。在模拟过程中,脱钩操作必须持续有效,而且,脱钩的计算成本对于分析式认知的串行本质可能也有贡献。执行这种心理模拟(独立于起促进作用的心智套件的安装),同时保证相关表征脱钩的粗糙能力,很可能是大脑计算能力的一个方面。流体智力的测量恐怕就涉及对这种能力的评估(Baltes 1987;Fry and Hale 1996;Horn 1982)。

迪尼斯和珀纳(1999)强调了心理分离的重要性,这种分离发生在作为个人知识基础的事实,跟个人为了认知控制而对这些事实持有的态度之间。举个例子。为了考虑跟目前的目标状态不同的目标状态,一个人需要有表征两者的能力。为了训练这些假想和认知控制,一个人必须明确表征这些事件状态本身、以及对这些事件的心理态度。人类能让自己跟观念疏离,还能把观念作为世界的模型从心理内部提炼出来。这种能力让他们成了动物界的超级假设检验者。

不同的脱钩技能在递归性和复杂性上有所不同。目前讨论的技能,对于创设珀纳(1991)提出的二阶表征很有必要——这是一种脱钩表征,由不同的世界模型组成,允许人们进行假设思维。发展到一定水平,脱钩就转变为所谓的元表征。元表征是对自己表征的表征,这是人类认知的一个独特层面,使得自我批判的立场有了可能。我们形成了我们的观念如何形成的观念,就像我们有了跟我们欲望有关的欲望,还拥有渴望不同渴望的能力。表征复杂性的增加,以及伴随的脱钩能力的增加,都由于语言的获得而大大增强了。这些表征能力在认知变革方案中的巧妙使用,正如我们将在第7章和第8章看到的那样,是机器人叛乱的重要部分。

假设思维当然不局限于关心替代假设的专家、学者和科学家。它是每个人日常生活无处不在的一部分。发展心理学家保罗·哈里斯(2001)指出,重要的是,在大多数正规学校教育中,都有一项关键的认知要求,那就是处理假设的能力。虽然孩子们还没有明确接触假设推理的任务,这种思维其实隐含在大多数的教育沟通中。也就是说,不管孩子们是否被要求进行正规的三段论推理(大多数时候都没有),根据哈里斯的说法,学校里到处都是对他们而言新颖的信息,或他们亲身经历之外的信息。这些信息淹没了他们。老师期待他们能对这些信息进行推理。尽管这些信息对老师来说是事实,但对孩子们来说就相当于假设。

无意识加工:火星人在你脑子里!

你体内有一个僵尸,它能处理你的意识自我有意识处理的所有信息,只有一个不同,“里面一团漆黑”:这个僵尸就是无意识。根据这种观点,认知与生俱来就是不透明的、意识性的。当呈现时,提供的仅仅是对内部事件状态的一种观点,既不完整,也不完美。

——阿特金森、托马斯和克里尔曼斯(2000,375)


再看一次表2-2中重要的自发式模块表单,这是认知心理学家至少研究了十年的成果(不管怎么看,这都不是一个完整表单)。显然,我们通常有意识思考的东西,我们分析式系统正在处理的东西,都是来自物理世界和人类社会的输入信息。自发式模块无意识地把这些信息提交给分析式系统,任其调用。因此,很多理论家都强调,我们大部分的精神生活都带着自发式系统的痕迹(Cummins 1996;Evans and Over 1996;Hilton 1995;Levinson 1995;Reber 1993)。自发式系统不只直接引发自动反应,而且,在那些自发式系统不直接引发某个反应的情况下,它也会给分析式系统提供输入信息,因而通过自己提供的认知表征的特点对分析式加工施加影响。倘若某些自发式反应或产物对我们的行为有不利影响,我们就需要加以补救,使用分析式系统提供的策略来对付它们。这将是本书后面章节要阐述的问题。现在,我想强调的是,自发式系统很常见,很重要,而且它能在我们意识之外工作。这是一个令人毛骨悚然的事实。

自发式系统子过程的本质就是,每当适当的刺激被探测到时,它们就会触发或启动。它们不能被选择性地“关闭”,而且这一过程发生在无意识中。这种过程甚至有可能引发被分析式过程认为不适当的反应。而这意味着,正如本章标题暗示的那样,在某种重要意义上可以说,一个人的大脑有时候会跟自己作战。假如这场战争的结果,是一个人最深层、最反思的自我想要的东西,那么,我们就得采取某些认知矫正措施。这是一个社会向善论者的认知变革项目。这个项目的第一步,就是要认识到,在某种意义上,我们认同的“我”(就是那个侏儒。虽然在前面讨论过了,侏儒是虚构的,它依然是我们朴素心理学的一部分)并没有控制大脑的所有部分。不过,“我”可以从某些大脑活动的操作中被积极分离出来,而这些大脑活动通常发生在意识之外。

要是我们真正理解,绝大多数大脑活动发生在我们意识之外,它们彻头彻尾地令人不安,我们将因此体会到一种疏离感。在认知科学家安迪·克拉克的《存在》(Being There,1997)一书中,这种疏离感被一篇作为最终总结的论文给捕捉到了。文章幽默生动,题目叫“大脑讲演”。克拉克总结了他书中的所有主题,让一个名叫“约翰的大脑”的人物向约翰致辞;他其实是一个由大脑活动引发的自我。约翰对他的大脑持有诸多误解,大脑想要澄清它们。大脑承认,他跟约翰的关系相当亲密,不过约翰对这种亲密想多了。比如,约翰倾向于认为,他的所有思想都是大脑的思想,而大脑所有的思想也都是他的思想。大脑向读者保证,事情远比这复杂。

大脑阐述了本章的论点。他说,“约翰像天生的盲人一样,对我每天大部分的日常生活都视而不见”(1997,223)。大脑慢慢向约翰宣布,不仅他的知觉和营养功能受他意识之外的大脑过程指挥,甚至他深层的概念加工也不全受他有意识心智的控制。大脑说,尽管约翰认为他作为一个普罗米修斯式控制器,负责和指导大脑的活动,而事实上,约翰“被通报的,仅仅是我内部活动的极少数知识”(223)。跟我在本书中对自发式系统的描述一致,约翰的大脑告诉他,他大脑中的大多数活动都由诸多平行的、相对独立的计算通道执行。这些活动中,只有很少一部分输出成了约翰分析式活动有意关注的焦点。

出于这些原因,大脑告诉约翰,他的想法很落后。约翰以为“他”控制着自己大脑的活动(的确,约翰的朴素心理学带有强烈的笛卡尔式二元论色彩)。事实上,大脑告诉他“我可不是约翰概念化的内部回声。相反,在某种程度上,我是它们的怪异来源”(225)。使用我在这里提到的术语,大脑在告诉约翰,自发式系统对他的分析式加工提供了重要的输入信息。尽管约翰持有相反的观点,他也不能控制在他有意识推理和决策过程中的一切输入。

约翰的大脑想向他解释,约翰对他整个大脑的观点存在严重偏差,因为他过于依赖语言以及语言提供的概念。可约翰不能理解,这让大脑很伤心。当约翰继续坚持“他对我产生的梦幻式观点”时,大脑变得沮丧起来(226;参考前面提及的,分析式加工具有虚构倾向,以及下面要讨论的内容)。大脑感叹,说约翰看起来像个幸福的笨蛋,他对跟自己基于语言的认知模式不同的信息加工和信息存储操作一无所知。约翰的概念化倾向同样过于受语言的影响。他没有工具,不能思考跟他观点不同的加工模式。认知科学在继续探索平行的联结主义架构以及动力学系统模型,通过它们发展这种概念化工具。不过,这些努力带来的概念化工具,还没有进入像约翰这样的人的朴素心理学中。

不断受挫的大脑最后得到了这样的结论,想跟约翰解释清楚只能徒劳无功。因为,约翰一直“忘了,我在很大程度上是一台生存导向的装置,比语言能力的出现要早。而且,我帮助推进有意识认知和一般认知方面的角色,仅仅是最近才有的一项副业……尽管我们很亲密,但约翰事实上对我了解甚少。想一想,其实我是约翰头脑中的火星人”(227)。

我们就像约翰一样,脑袋里都有火星人。我们有众多的自发式系统。在我们没有输入或意识(更确切地说,没有分析式系统输入)的情况下,它们忙于自己的业务。认知科学文献中,到处都有这样的发现:我们拥有很多复杂的信息加工过程,甚至自己都没有意识到。而且,在我们的头脑中有很多像火星人一样的子系统,不只跟知觉或内脏机能有关,也跟概念功能有关。

这里有一个案例。在每一本认知科学和神经心理学的教科书中(比如Clark 2001;Harnish 2002;Parkin 1996),几乎都有它的身影。它就是盲视现象(Marcel 1988;Weiskrantz 1986,1995)。某些视皮层受损的病人表现出一系列令人费解的症状。他们的视野中有一个盲点或暗点。他们说,在自己这个特定的区域看不到任何东西。然而,实验者会说服他们,要求他们对一组固定的刺激做出迫选(比如,从两种形状的灯中选出一种)。面对这组置于他们盲视区域的刺激,虽然他们在现象性经验中看不到任何东西,可选择的准确性高于随机水平。举例来说,当在两种刺激中迫选时,他们的正确率居然高达70%;尽管在每一次选择中,他们都说自己看不见。通常,这些病人需要被说服,必须强制选择,尽管他们认为这毫无意义。许多人报告,说他们只能靠猜,因为他们“看不到任何东西”。他们还会怀疑,无聊的实验者到底能从这种无意义的任务中发现什么。

对盲视现象的解释,在细节方面依然充满争议,因为视网膜把信息传递到很多不同的大脑区域。然而,这一发现最基本的寓意却极少有争议。在某种程度上,这些病人大脑的某些区域能处理视觉刺激,但是负责整理信息、对意识经验进行言语报告的大脑系统没有达到阈值。说白了,它们没有发现这些信息。

盲视病人表现的无意识加工,不应该被认为仅仅发生在脑损伤的病人身上。在过去数十年里,知觉心理学家通过大量心理学实验,在大脑和知觉系统完全正常的实验参与者身上,证明了无意识加工现象的存在。无意识知觉的文献非常多,见Cheesman and Merikle 1984,1986;Greenwald 1992;Holender 1986;Marcel 1983;Merikle,Smilek,and Eastwood 2001;Purcell,Stewart,and Stanovich 1983。无意识语义启动的文献也很多,见Fischler 1977;Masson 1995;Neely and Keefe 1989;Stanovich and West 1983;Stolz and Neely 1995。这是一种正常的认知活动,无处不在。这些实验在细节上各有特色,但实验情形大致是下面的形式。一个参与者盯着一台速视器(这是一种用于呈现视觉刺激的设备,呈现时间极短,短至千分之一秒的数量级)或一个电脑屏幕,看见A、B、C、D四个字母中的某一个,不同字母一次又一次地在他们眼前快速闪现。慢慢地,实验者减少呈现时间,使得这些字母难以辨别,以便衡量人类的识别阈限。随着呈现时间的缩短,确认正确字母的准确度不断降低、降低。比如,从100%降至90%,再从90%降至75%。在某个呈现时间上,参与者常常说他们做不下去,因为看不清楚,没法识别呈现的字母。然而,即使到了这种地步,参与者抗议说自己看不清,他们通常也能以高于随机水平的正确率报告目标字母是什么。比如,对于四个字母来说,他们报告的正确率也许是45%,这要明显高于25%的猜测水平。高于随机水平的正确率意味着,参与者其实能辨别某些信息,即使他们坚持,说实验者要求他们继续是白费功夫,因为他们只能瞎猜。就像盲视病人一样,这些实验表明,正常人能加工一些连他们自己都没有意识到的刺激。

我们可以把正常人身上的这些现象加以扩展,即无意识加工的信息在整个大脑中会产生回荡效应,包括对语义水平加工的影响。认知心理学家广泛研究了所谓的语义启动效应(semantic priming effect),即如果每个词呈现之前先呈现一个跟它语义相关的词,这个词加工起来就会更容易。比如,如果在呈现启动词“医生”之后及时呈现目标词“护士”,人们对这个目标词的加工会更容易(通过反应时、电生理记录或其他技术来测量)。有趣的是,即使启动词呈现的时间极短,以至于参与者不能有意识地确认它们的身份,对目标词加工的促进效应还是会出现。跟前面描述过的实验一样,在这些启动实验中,参与者报告说,他们不能确定前面呈现的启动词是什么。可是,启动跟目标之间的语义关联还是会影响他们的行为。

需要澄清的是,并不是只有外围加工才显示出自发性,大部分概念加工也有这种特征。因为自发式系统的概念加工为分析式处理器提供输入,当深层的概念加工任务无意识中发生时,这些输入的根源对于意识而言难以触及。比如,许多最近的研究指出,社会和文化群体的刻板印象能通过无意识的激活加工而发生,这不完全是有意识思考的结果(Brauer,Wasel,and Niedenthal 2000;Frank and Gilovich 1988;Greenwald and Banaji 1995;Greenwald et al.2002)。

被自发式系统自动引发的概念联想影响重要的外在行为。数十年前,在一篇被广为引用的经典论文中,尼斯贝特和威尔逊(1977)搜集了很多证据,指出存在自发式的概念加工,而人们通常不清楚导致他们行为的原因。结果呢,当分析式系统(这个加工系统以维持跟个人行为有关的因果模型为己任)必须解释这些情况下的行为时,它经常会为这个行为编造一个理由。而真正的原因存在于自发式系统中,在认知层面上难以触及。

尼斯贝特和威尔逊(1977)讨论了这方面很多案例,不胜枚举。而在他们的综述发表之后,这方面的文献还在不断增加。尼斯贝特和沙克特(1966)做了一个对实验结果的归因研究,非常典型。在研究中,参与者需要接受不断提高的电击,以确定他们能承受多大的疼痛。其中一组服用安慰剂(糖丸),然后被告知,这种药会产生呼吸不规则、心悸和恶心的效果。研究者假设,安慰剂组会把任何他们感受到的神经症状(呼吸不均匀、出汗、恶心)都归结为糖丸,而不是对遭受电击的焦虑,因此,他们更容易忍受强烈的电击。结果的确如此。跟没有服用药丸的控制组相比,安慰剂组忍受住了4倍强的电流冲击!

有趣的是,当询问他们为什么有能力忍受这样的电击时,安慰剂组参与者从来都没提糖丸的影响。他们的行为,受到自己没有意识到的某个因素的深刻影响。比如,当询问他们为什么有那么强的耐受能力时,一个典型的回答就是“哎呀,我真的不知道……好吧,我想想。当我习惯鼓捣无线电之类的玩意时,只有13岁或14岁。也许,我已经习惯了电击”(Nisbett and Wilson 1977,237)。当研究者直接刺探问他们是否在实验中考虑过糖丸时,典型的回答如下:“不,我太担心电击了,根本不会想糖丸。”当更直接问他们是否认为糖丸引发了身体的各种反应时,典型的回答是:“不,就像我说过的那样,我太忙了,老在担心电击。”(237)当研究者把实验假设拿给他们看,问他们觉得这些假设是否说得通时,通常能得到肯定的回答。参与者认为,很多人的行为的确在假设情况下容易受影响,不过他们的行为是例外!

这种现象,即人们无法触及导致自身行为真正的大脑过程和刺激,在尼斯贝特和威尔逊(1977)综述的许多其他实验中也屡屡出现。在他们描述的一个实验中,参与者看电影,在各个不同维度上评价电影。实验过程涉及的若干因素都会变化,比如屏幕的视觉焦点,以及观看电影时外面出现的噪声。某些因素影响参与者的体验和他们对电影的评价,而其他因素则不起作用。大厅的噪声其实并不影响参与者对影片的评价,不过,有55%的人都误以为他们的评价受到了噪声的影响。跟我刚才描述的电击实验不同,那个实验的参与者没有意识到影响他们行为的某个因素,而在这个实验中,参与者报告了一个事实上不起作用的因素,认为它有影响。

电影实验最清楚不过地说明了人类的虚构能力,这一点被尼斯贝特和威尔逊(1977)在他们的经典论文中加以强调。他们使用了这样的标题,《我们说的比知道的多:对心理过程的言语报告》(Telling More Than We Can Know:Verbal Reports on Mental Processes)。“我们说的比我们知道的多”,指的是即使面对那些在认知上没办法触及以便反思的行为和大脑活动(因为它们是自发式模块的输出结果),我们也倾向于提出解释。在尼斯贝特和威尔逊描述的电影实验中,分析式系统仅仅是不能触及所有对电影评价的因素。这些因素数量众多,而且,它们由诸多的自发式模块提供,在认知上难以触及。然而,在为一个已发生的行为编造一个貌似合理的因果模型时,分析式系统毫无困难。不过,这个模型建立在朴素心理学的基础上,解释为什么人们通常做了他们做的事,而不是基于实际上起作用的内部认知过程的优先知识。

分析式系统的虚构倾向,在一系列经典研究中得到了惊人的展示。这些所谓的裂脑人研究,由神经科学家迈克尔·加扎尼加和同事合作进行。Gazzaniga的作品很多,见Gazzaniga 1989,1997,1998a,1998b;Gazzaniga and LeDoux 1978;Wolford,Miller,and Gazzaniga 2000。需要留意的是,Gazzaniga(1998b,24)指出翻译过程可以同时在有意识和无意识的情况下发生。然而,在本书中,我将强调明确执行的翻译过程,也就是说,把它视作一种分析式过程。裂脑人经历了联合部切开手术,他们的胼胝体被切断(这是两个大脑半球之间最庞大的一组联结)。人类的右视野刺激投射到大脑左半球,而左视野投射到大脑右半球。这就意味着,对于裂脑人来说,视觉刺激可以很轻易就被完全投射到一个孤立的对侧脑半球。根据这个事实,加扎尼加探讨了两个大脑半球不同的加工能力。在这个过程中,他发现,左半球大脑具有某种程度的虚构能力;这是控制语言产生的脑半球。

在一个著名实验中,加扎尼加把一张鸡爪照片快速闪现在裂脑人的左半球,同时把一张雪地照片投射到他的右半球。在很多照片中,右手(联结到对侧的左脑半球)正确指出了跟原来投射到左脑半球最接近的一张照片(鸡),而左手(联结到对侧的右脑半球)也正确指出了跟原来投射到右脑半球最接近的一张照片(雪铲)。然而,当问及为什么选这两张照片时,左脑半球(唯一能说话的半球)回答说“哦,这很简单。鸡爪是鸡的一部分,而雪铲能用来清理鸡棚”(Gazzaniga 1998b,25)。参与者的左脑半球根本没接触雪地照片。不过,加扎尼加指出,左脑半球能看到左手(沉默的右脑半球)指向一把雪铲。裂脑人把这两个选择联系起来,编造了一个解释。

加扎尼加强调,这种虚构解释的倾向很普遍。他指出,参与者不会做出另一种反应:直言不讳,说自己不知道为什么选雪铲。相反,他编造了一个故事。在这个过程中,他做出了有意识的选择,而不是承认他没意识到自己行为的原因。请留意,加扎尼加提醒我们,这种解释令人信服,因为裂脑人没有做出下面决定合理的回应,“你看,我不清楚自己为什么选雪铲。我的脑袋被割裂了,难道你不记得了?我可能把某些东西投射到自己不说话的脑半球;这事儿经常发生,有一段时间了。你知道,我不能告诉你,为什么我选择那把雪铲。不要再问我这种愚蠢的问题了。”(1998a,25)可惜,左脑半球没这么做。在自己完全控制身体一举一动的假设下,左脑半球编造了一个故事。在尼斯贝特和威尔逊描述的实验中,参与者编造了他们为什么喜欢影片的解释,根据的是通常的朴素心理学,而不是对大脑内部过程的了解(因为认知难以渗透,他们无法触及这些信息)。跟这种情况类似,裂脑人也炮制了一个连贯的故事,而不是准确思考相关的内部过程。

有的人有心理疾病,是因为脑损伤导致自发式模块运作失常,导致他们接收了很多不正常输入,于是,他们的翻译开始编造离奇的故事。替身综合征(Capgras syndrome),说的就是这种现象。关于替身综合征,见Davies and Coltheart 2000;Stone and Young 1997;and Young 2000。关于维持某个假设的偏差式加工,见Mele 1997,2001。在这种疾病中,人们相信他的一个近亲(比如父亲或母亲)是一个替身。由于相信自己的父母或伴侣可能是替身,要欺骗自己,这些病人会攻击甚至杀死他们。这种病之所以产生,是因为神经系统接受的自主指标跟明显的识别指标不同。替身综合征患者的脑损伤不影响他们的面孔识别系统,因此,他们能认出自己的亲人。然而,跟这些面孔进行情感联结的系统遭到了干扰。看到一张熟悉的面孔,可是没有适当的情感反应,这就带来了一种反常体验,这种体验需要翻译给出一个解释。对某些人来说,他们(可能预先)有归因偏差、推理偏差和信念固着,翻译可能就会跳到一个极端假设上(这些反常经验说明他们是骗子),然后参与维持这一假设的偏差性加工。就像加扎尼加的裂脑人在鸡和雪铲实验中的表现一样,替身综合征患者没有考虑下面的假设:他的分析式系统处理的信息有错误,因为他脑子坏了。无论是裂脑人还是替身综合征患者都坚信,他们知道自己脑子里发生了什么。而事实上,他们没有接触到自发式系统运作出故障的信息。

朴素心理学拒绝承认我们大脑中自发式系统的影响,这也会给没有脑损伤的正常人带来灾难性后果。洛温斯坦(1996)指出,这种倾向是导致人们药物成瘾的一个主要因素。在一篇跟行为的内脏影响(内驱力状态直接影响跟饥饿、疼痛和性欲望有关的快乐体验)有关的综述中,洛温斯坦认为,大多数人都低估了内脏反应的未来效果,因为他们高估了自己直接控制的效果。对于早期药物吸食而言,个人强烈的好奇心是主要原因。因此,洛温斯坦提出,相信自己能停止吸食,这是导致人们决定吸食药物的一个重要因素。不过,可悲的是,他们对自己控制大脑能力的理解是错误的,而这被当成了他们吸食药物的一个根据。他们的朴素模型,极力夸大了自己对内脏过程有意识控制的程度。

这些是某类情境中的若干案例。在这类情境中,我们必须让自己习惯于我们的自发式系统,它们就像火星人一样。自发式系统是一种进化史上的古老系统,它有时候会引发一些跟现代世界不搭配的输出。本书的一大主题就是,现代生活创造了越来越多这样的情境:我们身居其中,必须诉诸分析式系统的评价和监督功能,必须克服长久以来服务于我们的习惯化反应。

人类学家唐纳德·西蒙斯(1992)指出,我们拥有专门的味觉机制,作为我们偏爱甜食的基础。这些可能是受下列事实塑造的进化适应器:当含糖量最高时,水果的营养价值最高。今天,在我们现代的工业社会中,甜食从四面八方包围了我们,于是,我们对它们的偏爱有可能会产生不良后果。不过,我们的甜食偏好依然存在,自发式系统依然会引发这种偏好,即使我们有意识地想要节食。不过,这个事实也没否认,大多数自发式系统在我们现代生活中依然很有用(表2-2列出的过程毫无疑问很重要)。然而,我在本书中的要点是提倡认知变革,而这就需要对某些自发式功能进行批评。

因为具有古老的进化根源,我们的自发式系统容易引发某些反应,而它们很不适合我们目前的状况,这让我们觉得,自己的脑子里恐怕有火星人。当我们节食时,对甜食的不断渴望叫人心烦意乱。或者,举我在本章开头说的那个例子。当我们在大部分时间里被另一辆汽车挡住时,我们暴跳如雷,即使我们知道,这样做在当时的情况下没任何意义。自发式系统的进化联结在某些其他的案例中更明显。强奸受害者的配偶可耻地拒绝她们,这植根于男人的性所有权模块(Wilson and Daly 1992)。对破相者的排斥,则植根于探测对称性和其他所谓美貌线索的进化模块,而这些线索仅仅是繁殖适应度的代表。(Buss 1989;Langlois,Kalakanis,Rubenstein,Larson,Hallam,and Smott 2000;Symons 1992)

我们想要在分析式系统中拥护这些自发式输入吗?不,我们想要克服它们。仅仅因为它们有进化根源,我们就要认为它们合理吗?当然不。如果要做点什么的话,我们也是想克服这些倾向。当然,某些自发式系统引发的反应倾向并不需要被克服,因为它们并不压制我们的分析式系统决定的反思价值。在我们的大脑中,有想吃甜食的按钮,有拒绝被强奸配偶的按钮,有看到一个破相者就觉得厌恶的按钮。这些都是我们自身的一部分,可我们不想认同它们。我这里不是主张一种简化的柏拉图式观点,认为低级心智(自发式心智)应该永远被更高级心智(分析式心智)统治。我们将在第7章和第8章看到,有时候我们应该在自发式跟分析式系统冲突是,认同前者。有一篇哲学论文(e.g.,Bennett 1974;MacIntyre 1990)讨论了马克·吐温的一个小说主人公哈克贝利·芬,他经历了一场冲突:一边是感情上他应该帮助一个奴隶朋友逃跑,一边是分析判断认为,帮助努力逃跑在道德上是错的。对于我们深思熟虑的自我而言,它们很怪异。它们是我们头脑中的火星人。我们不能删除它们,但是我们能克服它们的影响,找到办法帮分析式系统战胜它们。因此,我们不用落到跟鲍勃·马利一样的结局;他在本章开头说了这么一句话,“反射比我做得好”。

当不同类型的心智冲突时:分析式系统的覆盖功能

虽然我在前一节中警告,说类似反射的自发式系统加工可能会带来问题。不过,即使强调自发式系统可能存在功能失调,我也没有因此暗示,自发式系统永远都有问题。恰恰相反,跟其他很多理论家一样,许多有用的信息加工操作和适应行为都由自发式系统执行(e.g.,Cosmides and Tooby 1994b;Evans and Over 1996;Reber 1993;Gigerenzer 1996b;Gigerenzer and Todd 1999;Pinker 1997),大部分精神生活都涉及自发式系统的输出(e.g.,Cummins 1996;Evans and Over 1996;Hilton 1995;Hogarth 2001;Levinson 1995;Myers 2002;Reber 1993;Wegner 2002;T. D. Wilson 2002),这两个自然成了认知科学中常见的默认假设。同样,正如我将在第7章和第8章中强调的那样,不是所有自发式跟分析式系统的冲突都需要以青睐后者的方式来解决。我认为,自发式系统执行很多有用的信息加工操作和适应行为,比如深度知觉、面孔识别、频次估计、语言理解、意图归因、欺骗探测、颜色知觉,等等。事实上,这个名单很长。很多理论家都强调,大部分精神生活其实都来源于自发式系统的输出。不过,如前所述,自发式系统的输出有时会跟分析式系统指定的高级行为目标相冲突。因此,有时候,我们必须借用分析式系统的监督和评价功能,以便平息或覆盖跟更一般目标相冲突的自发式输出。

自发式系统的逻辑,以及它们作为领域特殊性进化适应器的起源,或它们作为训练有素、自动激发的刺激-输出关系的根源,都意味着存在这样的可能性:分析式系统的一个计算任务,就是作为监督系统以脱钩或覆盖自发式输出,要是这些输出有可能跟高级目标相冲突(Navon 1989;Norman and Shallice 1986)。当然,在大多数情况下,这些系统相互配合,不需要脱钩,也不需要覆盖。然而,当分析式加工发现自发式过程(尽管在既定问题上,他们表现良好)正要阻碍更一般的目标和欲望时,一种潜在的覆盖情形就会发生。这会偶尔出现,因为许多自发式加工是为了实现遗传适应度这个目标,而它跟个人层面的效用最大化不同(这一点将在第3章中加以讨论)。极少数信息加工情境需要这种覆盖作用;虽然不常见,但这些情境具有非比寻常的重要性(我们在第4章中将会看到这一点)。

波洛克(1991,1995)是出现于表2-1中的一个双过程理论家。他的研究发现,分析式加工作为一种覆盖系统,对自发式系统提供的某些自动或强制的计算结果进行矫正。他的双过程模型来自想要在计算机中植入智能或理性的科学家。在波洛克的术语中,自发式系统由快速刻板的模块组成,它们执行具体计算。分析式系统被他称为思维。跟我在本书中勾勒出的通用式双过程模型一致,波洛克强调,分析式加工的一个重要功能就是覆盖自发式系统。快速刻板模块在一个不熟悉的环境中被触发,或在一个变化了的环境中被触发,它就不能“快速”应对,因为它的速度来自它反应的刻板性,而这时的环境要求反应灵活。

作为一个例子,波洛克(1991)知道,快速刻板模块能预测移动物体的运动轨迹。针对这一计算的快速刻板模块运行得又快又准,但它依赖于对世界结构的某些假设。当这些假设不满足时,快速刻板模板就必须被覆盖。比如,当一个棒球接近电线杆时,我们最好覆盖自己的自动化轨迹模块,因为它不能准确计算来自一个不规则曲面的弹跳轨迹。同样,来自自发式系统的概念和情绪信号在Pollock(1991,1995)的模型中,情绪被认为是一种用作实践(i.e.,手段/目标)推理的Q&I模块,这种思想被众多的理论家探讨过(e.g.,Cacioppo and Berntson 1999;Damasio 1994;de Sousa 1987;Frank 1988;Johnson-Laird and Oatley 1992,2000;Oatley 1992,1998;Simon 1967)。当然,有意识的理性思维应该被用来战胜非理性的情绪,这一观念要追溯到柏拉图(见Nathanson 1994)。但这不是跟情绪有关的非理性产生的唯一途径。事实上,存在两种可能出差错的情绪调节。他们粗略地对应于一种粗糙的分类:在行为调节中情绪过少卷入,或情绪过多卷入。前面的观点,即Q&I情绪模块可能并不足够活跃—一种在认知科学中得到广泛表征的观点(Damasio 1994;de Sousa 1987;Oatley 1992)—但在朴素心理学中并没有得到多少重视。认知科学的若干架构,相反,看到了这两种可能性(Damasio 1994;Johnson-Laird and Oatley 1992;Loewenstein,Weber,Hsee,and Welch 2001;Oatley 1992;Pollock 1991,1995;Stanovich 1999)。更重要的是,存在两种类型的理性失利的实证证据。侧前额叶损伤跟执行功能困难(或工作记忆困难)有关,这可被认为是覆盖自发式系统执行的自动化过程失败的结果(Dempster 1992;Dempster and Corkill 1999;Duncan et al. 1996;Harnishfeger and Bjorklund 1994;Kane and Engle 2002;Kimberg,D扙sposito,and Farah 1998;Norman and Shallice 1986;Shallice 1988)。相反,前额叶的腹内侧损伤跟伴随着情绪混乱的行为调节问题有关(Bechara et al. 1994,1997,2000;Damasio 1994)。前者而非后者的困难跟智力下降有关系(Damasio 1994;Duncan et al. 1996),这跟心理测量中智力跟分析式加工而非自发式加工(Stanovich 1999;Stanovich and West 2000)有更强关联的观点一致。有时也需要被覆盖。覆盖功能也跟最后一章中对弱约束和强约束基因控制的区分有关。自发式跟分析式系统的冲突,通常也可以理解成是这两种控制类型的冲突。尽管分析式系统通常都能有效地覆盖自发式加工,但这不是必然的。当然,有可能元认知判断误入歧途而覆盖自发式加工,而事实上后者比前者能更好地实现个人目标。其中一个案例由 Wilson和Schooler(1991)的研究给出。他们要求参与者评价他们对不同品牌草莓酱的偏好,然后把这些评价跟专家评价(来自消费者报告的评价)对比。他们发现,鼓励人们分析他们的评价反而导致他们跟专家不太一致,而不要求他们动用分析式系统效果反而更好。因此,认知系统有可能覆盖自发式系统时阈限太低从而犯错误。这样一种明显较低的覆盖阈限,可能被视作像史波克先生那样的超级理性,而这实际上在某些情况下会目标实现带来负面影响。同样的观点也存在于道德领域(回想一下注释25提到的哈克·芬的案例)。

弱约束大脑跟强约束大脑

当灵活的分析式加工探测,发现更广义的目标处于危机之中,这些目标无法通过自发式系统引发的反应来实现。这时,自发式输出跟分析式系统就会闹矛盾。回想一下,自发式系统由更古老的进化结构组成(Evans and Over 1996;Mithen 1996,2002;Reber 1992a,1992b,1993),更直接地给基因目标(繁殖成功)编码。而分析式系统的目标结构(一种更晚进化而来的大脑能力)更为灵活多变,而且,试图在现有基础上调和两种目标:一种是跟社会环境有关的广义目标,一种是领域特殊性的、自发式系统的强约束目标。我将在第7章和第8章讨论,弱约束目标如何通过强化训练进入自发式系统,这很重要。

为了强调自发式系统包括进化上更古老的大脑结构,丹尼特(1991,178,引用Humphrey 1993)把它们称作大脑的“滚开!”和“去做吧!”部分。这是一种幽默的说法,意在表明它们有远古进化时代的起源。当时,我们的心理结构很简单,而我们的行为调控很粗糙。不过,在我们当前的环境中,尽管自发式系统会自动向一个男人发信号,要他跟一个萍水相逢的女人交配(“去做吧!”),可分析式系统会准确登记,那个男人生活在一个21世纪复杂的技术社会,而且考虑到配偶、孩子、工作和社会地位等因素,它会发出这样的指令:“去做吧!”这个来自自发式系统的信号需要被覆盖。相反,分析式系统协调这个人的整体目标机构,得出结论:通过覆盖自发式系统引发的反应倾向,此人整套的长期人生目标能更好地实现,虽然这些反应倾向能提供一时的积极效用。

在这个案例中,我比较了两种系统加工:一种是分析式系统缓慢的、多维度的计算,另一种是自发式系统的运作,它的输出像弹道导弹一样,具有反射性,针对一套狭隘的刺激做出响应,因为这种自发式反应服务于基因的利益,而这在人类进化史上很早以前就出现了。刚才的叙述,反映了我对雷伯(1992a,1992b,1993)理论工作的依赖。在很多重要的论文中,雷伯搜集了多方面证据,指出自发式系统是一个更古老的进化系统。根据他的观点,加之吸收了第1章中讨论的强约束和弱约束控制的逻辑,我曾经(Stanovich 1999;Stanovich and West 2000)指出,自发式跟分析式系统的目标结构不同。这一事实对人类的自我实现而言,有重要意义。

自发式系统的目标结构受进化的塑造,会密切追踪基因繁殖概率的增加。而分析式系统主要是一种控制系统,焦点在于整个人的利益,目标是实现个人目标满意度的最大化。而对后者的最大化操作,有时候会导致牺牲遗传适应度的结果(Barkow 1989;Cooper 1989;Skyrms 1996)。因此,自发式跟分析式系统最后的差别列在表2-1中,即自发式系统创造了强约束的基因目标,而分析式系统创造了灵活的目标层级,以便在整个有机体的水平上实现目标满意度的最大化。分析式系统更契合作为一个连贯有机体的个人的需要,而自发式系统更直接地实现亚个人的复制子古老的繁殖目标。因此,在少数情况下,两种系统的输出会冲突。如果人们能用分析式系统覆盖自发式系统的输入,他们就会有更好的结果。这样的系统冲突表明,载体跟复制子的目标在统计层面上不匹配。如果自发式系统的输出被覆盖,那么,这种不匹配更可能以对载体有利的方式得以解决;我们每个人都应该期待这一点。

覆盖为什么在统计上是一个好赌注?这种情形有一个形象的逻辑表征,如图2-2所示(自然,重叠区域的大小仅仅是猜测,它仅仅是一个用来支持目前观点的相对比例)。第一,体现在图中的一个假设是,无论在自发式还是在分析式系统中,载体跟基因目标的一致出现在大多数现实情境中(标记为B和E的区域)。比如,在自然界中进行物体之间的精确导航催生了进化适应器。同样,当我们在现代世界生活时,精确导航也对我们有好处。

图2-2 基因和载体在自发式和分析式系统中目标的重合

两种系统都有三类目标,但是各自占有的比重不同:同时服务于基因和载体利益的目标(区域B和E),只服务于基因利益的目标(区域A和D),只服务于载体利益的目标(区域C和F)


不过,图2-2最重要的特点是指出,分布在两种系统中的目标所服务的利益存在不对称性。在第1章中描述的达尔文式生物结构的残余,存在于人类的自发式脑结构中。这个系统创设的许多具体目标,都是通过非反思性过程获得的,它们没有经过评估,而这些评估能判断它们是否对个人有利。其实,更准确地说,它们有过评估,不过评估标准跟刚才说的完全不同:在进化史上,它们是否能提高复制子的寿命和繁殖力?从单独个人(载体)的角度来说,要是它们仅仅反映了基因目标的话,它们对人而言就可能是危险之物。第1章中注释17的告诫同样适用于这里。在本书中,当我把某个东西称为基因目标时,它并不必然意味着这个目标现在服务于遗传适应度的利益,仅仅在于,它在过去被称为进化适应器的起源环境(EEA)中曾有这种作用。它们是为了复制子、不惜牺牲载体的目标;这种目标让蜜蜂为了跟自己有亲缘关系的蜂后,而不惜牺牲自己。它们在图2-2中标记为区域A。

应该存在这种目标,作为强大的候选人,它们能覆盖自发式系统引发的目标。平克(1997)指出,自发式系统“被设计出来,是为了复制建造它们的基因,而不是为了促进幸福、智慧或道德价值。当某种行为对群体有害,有损于行为者的长期福祉,难以控制,不听劝说,或是一种自我欺骗的产物时,我们通常会说这种行为‘情绪化’。说起来令人痛心,这些行为并非功能失调,而正是我们从精心设计的情绪中所期待的东西”(370)。平克这里使用了“精心设计”的说法,它的含义很特殊,一种故意为之的特殊,因为他想要触动读者,让他们思考一种新观点;我在第1章中提出的观点,也有同样的考虑。我们思考再三,才能想到平克说的是进化的精心设计,它让这些设计能更好地为复制子的利益服务。当然,从载体的角度看,这里的“精心设计”也可以是我们动力超强的汽车的精心设计,让我们在学校区域驾车时,哪怕油门小,也能从时速20公里增加到时速45公里。如果不被一种考虑驾驶者长期目标的认知系统覆盖,这种“精心设计”很可能让我们误入歧途。这种类型的有效引擎是短视的,它将在一个通常不合适的情况下,就像在一个合适情况下一样,自动而有效地运作。

图2-2的右侧表示的是分析式系统的目标结构。通过该系统的反思智力的训练,我们就能从分析式系统跟世界的互动中,导出灵活的弱约束目标。这种目标通常服务于有机体的整体目标,但却妨碍基因目标。(图2-2中的区域F。比如,戴套做爱;在繁殖期结束后使用资源;等等)当然,一个通过反思获得的目标(这种目标通过反思获得,因为它服务于载体的目的,这种目的甚至有可能妨碍基因的利益),通过习惯化使用,也能成为自发式系统的一部分。这个事实能解释图2-2的一部分,这一部分刚开始呈现时会显得多少令人费解。——为什么在自发式系统中会有一小块区域(区域C)代表仅仅服务于载体利益的目标呢?有人可能会想到,所有自发式系统的具体目标都反映了基因的利益,而不管它们是否符合载体的利益。这一情形,跟第1章图1-1中呈现的达尔文式生物体相同。不过,通过实践,分析式系统的高级目标状态将被安装在更刻板、更僵化的自发式系统中;这是一种新的可能。对于载体而言,通过反思而获得的目标状态,可能会呈现出独特的优势(因为它们能战胜基因植入的目标,这种优势还会累积——“不要跟你老板的老婆调情”)。此外,它们经过训练,将被安装在自发式系统中。在这种情况下,我们可以说,人类的自发式系统反映了带有反思的分析式系统驻扎在大脑中的结果。这也是为什么,人类的自发式目标结构绝不等同于图1-1描述的达尔文式生物体的结构。

尽管如此,除了面积小但重要的例外区域C,自发式系统可以被大致理解成大脑中被基因强约束的部分。它还是会自动响应某些线索,这种方式直接来自许多年前我们进化史上的基因复制。就像火星探测器的例子一样,随着世界变得越来越复杂,越来越难以提前预测(特别是由于它容纳了其他人),基因使用了更复杂的弱约束系统来施加控制。除了建立领域特殊性的刺激-反应倾向之外,它们还在大脑中安装了广泛的、跟复制有关的一般目标(自我保护倾向、做爱感觉好、甜食尝起来好吃),同时也建立了层级目标分析器,能够协调一整套复杂(可能冲突的)目标,在一个条件不断变化的环境中,提供一个最大化策略。

身处复杂社会中时,人类的分析式系统需要协调的大多是派生目标。没有谁会在工业社会跑到外面采集和打猎了。通过最大化二阶符号目标,比如声望、地位、工作和酬劳,基本目标和初级内驱力(身体快乐、安全、生计)间接获得满足。为了实现这些间接目标中的大多数,更直接编码的自发式系统引发的反应必须被覆盖,至少是暂时。派生的弱约束目标创造了这样一种条件,进化适应的目标跟载体的利益能够分离。在极端情况下,载体完全可以摆脱强约束控制,发动叛乱,反对自私的复制子。要实现这一点,它需要获得一套通用目标,它们不服务于复制子任何一个具体的目标(比如,戴套做爱)。

在大脑中,分析式系统最接近第1章中描述过的情形。那时,基因放弃了直接控制,而是说(这是隐喻,通过它们创造的基因型效应类型):“事情变化得太快了,鞭长莫及。大脑,让我们告诉你具体怎么做吧。你只需要在考虑我们(基因)已设计好的既定的通用目标(生存和有性繁殖)前提下,继续前进,做你认为最好的选择。”分析式系统是获得这一趋势的最近演化,也是道金斯某句话的逻辑终点。他说,“基因将会给生存机器一个单独而宽泛的政策指令:做你认为最好的选择,以便保证我们的生存”(1976,59-60)。有趣的是,在人类中,分析式系统跟自发式系统都驻扎在大脑中。因为自发式系统具有自动化的特点,它通常都会给分析式系统正在解决的问题提供相关的输出。当两种系统的输出直接冲突时,其中一个或另一个将被淘汰出局。在下面的情况下,我们特别不想让分析式系统落败:根据一个很久以前就消失了的环境,自发式系统试图实现基因利益最大化,而相比之下,分析式系统则根据我们现在生活的环境,试图实现个体利益最大化。要是分析式系统在这种情况下不能覆盖自发式系统,结局将令人悲哀,就像本章开头描述过的那些情形。

当然,人类头脑内部有冲突的观点,这可不是什么新鲜玩意。在长达几个世纪的时间里,它是不少伟大的文学作品的主题。然而,我们现在有更好的词汇来描述这些冲突,而这些词汇得到了认知神经科学发现的支持和验证。即便如此,作家在描述这些冲突时,依然能给我们带来最细腻的感受。在描述自发式和分析式系统的冲突方面,恐怕没有人能跟乔治·奥威尔(1950)相提并论;他在自己著名的散文《猎象记》(Shooting an Elephant)中说得极令人信服。奥威尔描述了一个警员,代表大英帝国20世纪30年代在缅甸的存在。在分析式系统的基础上,他开始痛恨自己的位置代表的帝国主义——“我已经下定了决心,帝国主义是个邪恶的东西,不久之后,我就要辞掉自己的工作,找一个更好的”(3)。然而,尽管认为帝国主义是邪恶的,奥威尔也不能排除他的烦恼。当他执勤时,总会遭到人群的嘲笑:“等我走远了,他们就在后面起哄叫骂,着实叫我的神经受不了。”(3)借用现代心理学的术语,我们会说,奥威尔的自发式系统对嘲笑做了响应,尽管他的分析式系统认识到,这种影响不代表他的真实感受。这个系统知道,这样的嘲笑是合理的。即使没有这样的现代术语,奥威尔却相当清楚两个系统之间的巨大冲突:“我只知道,我被卡在中间:我一边憎恨自己为之服务的帝国,但在另一边,我又生那些存心不良的小野兽的气,他们总是想办法干扰我的工作。我头脑的一部分认为,英国的统治是无法打破的暴政,……而我头脑的另一部分则认为,世界上最大的乐事,莫过于把刺刀捅进一个和尚的肚子。”(4)

自己试试:你能在著名的四卡片选择任务和琳达任务中覆盖自发式系统吗

你可以向自己证明,在你的大脑中,的确有同时运行的不同系统(存在潜在冲突);它们都可能影响你的行为。要做到这一点,你只需要完成人类推理方面的一个任务就行了。这个任务最初由彼得·沃森(1966,1968)提出。在过去数十年里,沃森任务得到了极为广泛的研究,目前跟它有关的论文已经多达好几十篇。选择任务方面的文献极为丰富(综述见Evans,Newstead,and Byrne 1993;Manktelow 1999)。研究者记录了许多不同的反应倾向(Cummins 1996;Dawson,Gilovich,and Regan 2002;Gebauer and Laming 1997;Hardman 1998;Johnson-Laird 1999,2001;Liberman and Klar 1996;Manktelow and Evans 1979;Newstead and Evans 1995;Sperber,Cara and Girotto 1995;Stanovich and West 1998a)。关于匹配偏差,见Evans 1984,1989,1995,1998,2002b。不过请留意,关于启发式、基于自发式系统的加工如何导致PQ选择还有很多其他模型(e.g.,Oaksford and Chater 1994,1996;Sperber,Cara,and Girotto 1995)。在继续阅读之前,请你试着解答这个问题:


每个方框代表放在桌上的一张卡片。每张卡片的一面写着字母,另一面写着数字。有这样一个规则:要是一张卡片的一面是元音字母,那么它的另一面是偶数。正如你所看到的,有两张卡片是字母在上,而另外两种卡片是数字在上。你的任务是,决定要翻开哪些卡片以便确定这个规则是对的还是错的。请指出哪张卡片必须被翻开。

在进一步讨论这个问题之前,也是为了让解答更值得期待,请思考另一个出现在认知心理学文献中的著名问题,即所谓的琳达问题(Tversky and Kahneman 1983):


琳达今年31岁,单身、率真、非常聪明。她的专业是哲学。作为一个学生,她格外关心歧视和社会公正问题,也曾参加过反核示威游行。请根据可能性对下面的陈述进行评价,1代表可能性最高,8代表可能性最低。

a.琳达是一名小学老师。_____

b.琳达在书店工作,上瑜伽课。_____

c.琳达积极参加女权运动。_____

d.琳达是一名精神病学的社工。_____

e.琳达是妇女选民联盟的一员。_____

f.琳达是一名银行出纳。_____

g.琳达是一名保险销售员。_____

h.琳达是一名银行出纳,积极参加女权运动。_____


现在我们依次解说每个问题。第一个问题被称为四卡片选择任务,曾被广为使用。有两个原因:第一,大多数人都回答错了;第二,研究者很难知道为什么。答案看起来很简单。假设规则是:如果一张卡片的一面是元音字母,那么它的另一边就是偶数。因此,答案看起来是翻开A和8:A是元音字母,翻开它是要看看这张卡片的背面是不是偶数;而8是偶数,翻开它是要看卡片的背面是否有元音字母。大概有50%的人会这么选。可是这个答案是错的!第二种最常见的回答,是只翻开写有A的卡片(看是否有偶数在背面),这样选的人有20%,可这个回答同样错了!另外20%的回答是翻开其他的卡片组合(比如,K和8),问题是这些组合也不对。

在过去30年里的数十个研究中,有90%的人给出了五花八门的错误答案,如上所述;我猜,你很可能跟他们一样。而且,在你的情况中,你甚至错过了本节标题给出的暗示,这是帮你抑制当前反应的!让我们看看大多数人是怎么错的。第一,他们在K卡片和A卡片上没什么问题。大多数人不会选择K,他们选择A。因为这个规则没说某张卡片的背面会有辅音字母,K跟这个规则没关系。A就不一样了。在A卡片的背面可能有偶数,也可能有奇数;尽管前者跟规则相一致,但后者则是关键的可能结果,它能证明这个规则是错的。简而言之,为了证明这个规则没错,A卡片必须被翻开。这是大多数人都能选对的地方。

然而,8和5是两张棘手的卡片。许多人把这两张卡片选错了。他们错误地认为,必须选择8卡片。这张卡片被错误翻开,因为人们认为,他们必须检查一下卡片的背面是否有辅音字母。不过,举例来说,要是8的背面是K,这也不能表明规则就是错的,因为尽管规则说了,元音字母卡片的另一面必须是偶数,但是它没说偶数卡片的另一面必须是元音字母。因此,发现背面有辅音字母不能说明这个规则是对的还是错的。相比之下,大多数人都不会选的5卡片,则绝对重要。5卡片背面可能有元音字母,如果是这样,规则就是错的。简而言之,为了指出这个规则不对,卡片5必须要翻开。

总结一下,类似于“如果P那么Q”条件推理形式的规则,只有在它出现由P和非Q构成的情况时才能证伪,因此,P和非Q卡片(在我们的例子中是A和5)是唯一需要的两张卡片,它们翻开就能判定规则是对的还是错的。如果P和非Q的组合存在,规则就错;如果不存在,规则就对。

这么一解释,问题很容易,可为什么大多数人都没有回答正确?起初,研究者认为,元音字母和数字规则比较抽象,这增加了人们的理解难度,因此,使用更真实的问题或所谓的主题问题,将会明显提升人们的表现。研究者设计出了类似于下面的“目的地问题”:


下面的每张卡片,一面是目的地,另一面是一种交通方式。这里有一个规则:“如果巴尔的摩在卡片的一面,那么飞机就在卡片的另一面。”你的任务是决定翻开哪些卡片,才能判断这个规则是对的还是错的。请指出哪些卡片必须被翻开。

令人惊讶的是,这种类型的内容丝毫没有提高人们的表现。大多数参与者依然选择了P(巴尔的摩)和Q(飞机),或者只有卡片P,而正确的P和非Q答案(巴尔的摩和火车)被大多数人忽视了。

那么,这个问题为什么会这么难?许多理论家提出了解释这种困难的观点。一种观点认为,大多数人思考否定例证时总是很困难——否定例证是那种可能发生,但没有明确表征的例证。还有,我将在第4章中讨论,人们也不擅长思考可能会证伪他们假设的例证。这也是这个问题最初让彼得·沃森着迷不已的原因所在。研究者(特别是像哲学家卡尔·波普尔这样的人)认为,人类具有良好的科学思维。因此,设计一个实验,表明人们能指出一个理论不成立就很重要。事实上,人们(包括科学家)倾向于寻找证据证实理论而不是证伪它们(见Nickerson 1998,以及本书的第4章)。根据一种理论的说法,这就是导致人们翻开P卡片(为了证实Q)以及Q卡片(为了证实P)的原因。它也导致了人们错过了相关的非Q卡片(背面可能含有证伪P的信息)。

认知心理学家乔纳森·埃文斯(1984,1998,2002b)提出了一个更简单的理论,能解释为什么卡片P和Q是最流行的选择。他认为,这种做法反映了所谓的“匹配偏差”(mismatch bias),这一偏差很原始,能被表面相关的线索给激活。“如果”把关注点引向卡片P,而卡片Q则成了规则的焦点。根据埃文斯的理解,PQ反应基于启发式,即它由自发式系统引发。在他的观点中,PQ反应(以及在更轻微的程度上P反应)来自自动化加工,并不反映任何分析式推理。大多数人都把问题回答错了,这一事实说明,分析式系统没有成功覆盖自发式系统。

在这个任务中,研究者观察到的反应类型被视作覆盖失败。因为研究者假设,所有没通过的大学生其实都有计算出正确答案的逻辑能力,只要他们依次检查每张卡片的逻辑意义。不过,自发式系统引发的反应占据优势地位(它没有被覆盖)。如果埃文斯和其他研究者是对的,那么,在四卡片选择任务中,我们存在一种明确的自发式倾向(PQ),它反对分析式系统的反应倾向(P和非Q,依次检查每张卡片的逻辑意义,就能得出这个结果)。有人在得出错误答案之前想了一阵子,这个事实跟参与者的选择是自发式加工的假设并不矛盾。设计巧妙的研究(有些涉及在线反应时技术)表明,大多数进行中的思考其实都只是对自发式系统引发的反应倾向进行合理化而已(Evans 1996;Evans and Wason 1976;Roberts and Newton 2001)。

跟四卡片选择任务一样,前面给出的琳达概率问题也反映了冲突性的自发式系统输出未能被有效覆盖。大多数人在这个问题上犯了“结合偏差”谬误。因为选项h(琳达是一名银行出纳,积极参加女权运动)是选项c和选项f的组合,因此,选项h的可能性不能高于选项c(琳达积极参加女权运动)或选项f(琳达是一名银行出纳)。一名女权主义的银行出纳也是银行出纳,因此,选项h在可能性上不能高于选项f。然而,在特沃斯基和卡尼曼(1983)的研究中,有85%的参与者表现出组合偏差,他们认为,选项h比选项f可能性更高。这些研究者认为,在这个问题上,逻辑推理(分析式加工)被自发式加工中所谓的代表性启发式给击败了。关于表征作为一种属性替代形式的当前解释,见Kahneman and Frederick 2002。其他的自发性启发式被认为在这个问题中引发了结合谬误,许多跟自动应用于这个问题的会话假设有关。这将在第4章中进行阐述。代表性根据相似度给出问题的答案:跟“银行出纳”相比,对琳达的描述跟“一名女权主义的银行出纳”存在更高的相似度。当然,要是判断概率有争论,逻辑要求,子集(女权主义的银行出纳)跟父集(银行出纳)的关系理应打败对代表性的评估。可以看到,在琳达问题上,存在两种对抗的倾向:一种是自发式的反应倾向,即基于相似度的代表性判断,另一种是分析式的反应倾向,即子集父集的逻辑关系。

别跟掘地蜂一个样

多达90%的参与者在回答四卡片选择任务时答错了,85%的参与者在回答琳达组合问题时答错了。对大多数人来说,分析式系统对他们判断的控制并不那么稳固。分析式系统的这种失败表明,很多人不能很好地实现他们个人目标的最大化;这一点,我们将在随后两章中看得更清楚。否定后者(四卡片选择任务中,大多数参与者都不擅长使用的逻辑形式)跟概率的结合原则,正是建立清晰思维的重要基础。在第4章中,我们将会看到,这些推理错误不仅仅是实验室现象,也会发生在真实世界中,还会带来真切的消极结果。这些,以及其他许多认知心理学家研究的问题,都是实验室覆盖自发式反应问题的回声;这些问题在本章开头的几个案例中都有反应。

我们将在后面几章(特别是第7章和第8章)看到,本书呈现的认知模型给个人身份带来了有趣的问题。如果我们大脑的不同部分不和,计算出相互冲突的输出,那么,哪一个才是我们认同和谈论的“我们”呢?哪一部分,才是“作为一个人,我们到底是谁”的最佳代表呢?在某些情况下,答案貌似很清楚。当一个人回避和排斥破相者,但又觉得这样做不好,他到底在认同哪一种认知输出呢:是回避,还是对回避的羞耻?这两种反应都来自同一个大脑。当一个丈夫没有安慰因遭受强奸而痛苦的配偶,但很快他又后悔没有这样做时,哪一种认知输出是丈夫应该认同的:没有安慰她,还是后悔没有安慰她?

在这两种情况下,我们希望人们认同羞耻和后悔,希望他们认为另一种反应远非他们的本性。我们以这种方式感受,原因在于,起初的反应是由自发式系统自动运作产生的(不适当)输出,未经思考或反思。而羞耻和后悔是对整个环境文本分析和反思的结果。我们觉得,在许多这样的情况下,人们应该认同他们的反思式心智,而不是达尔文式心智。

支持我们的分析式心智,反对自发式心智,这就是我们给出的解决之道。但问题并不这么简单。思考一下本章注释25提及的哈克贝利·费恩的案例,它早已成了哲学分析的对象(比如Bennett 1974;MacIntyre 1990)。哈克基于最基本的友情和同情心,帮助他的奴隶朋友吉姆逃跑。然而,当哈克贝利明确思考时,他开始怀疑自己的做法:把奴隶放走,让白人帮他们,自己是不是做错了。这种情况下,我们的判断逆转了:我们想要哈克认同他的自发式模块引发的情绪,拒绝他被明确灌输的道德观念。这里的问题在于,哈克贝利通过分析式系统接受的明确的道德判断,并不是通过反思获得的(这是本书第7章的核心问题)。

哈克贝利·费恩的案例说明,外显思维加工依然有可能援引未经反思就吸收的规则。在这种情况下,我们可不想让自发式反应被这样的规则战而胜之。我将在第7章和第8章分析更多的类似案例。那时,我们将会看到,假如分析式系统使用未经反思就获得的智力工具,就会招致危险的外显思维过程。不过,这里,我要强调的是本章中阐述的一种未经反思的认知类型,即自发式认知(这种认知具有更古老的进化根源,它拥有自动的、弹道式的、不假思索、不受监督的特征)。当自发式跟分析式加工冲突时,我们不应该自动地认同前者(“跟着你的感觉走”)。按照哲学家丹尼尔·丹尼特的说法,那就是在认同你大脑的掘地蜂部分。

人类自然而然地看重反省心智而不是达尔文式反射心智。为了说明这一点,丹尼特在他1984年写的与自由意志有关的一本书中,要求我们思考自己对掘地蜂(Sphex ichneumoneus)行为描述的反应。雌掘地蜂为了产卵和孵化后代,会做很多事情。首先,她会挖一个洞穴。接着,她飞出去寻找蟋蟀。当她找到一个合适的对象,就会刺入蟋蟀的身体,把它麻痹,但又不杀死它。她把蟋蟀带回洞穴,放在洞穴口。她随后进入洞穴,确保一切安全,万事俱备。如果是这样,雌掘地蜂就会回到门口,把被麻痹的蟋蟀拖到洞穴里。然后,她就把卵产在洞穴里,密封起来,完事就飞走了。当卵孵化时,掘地蜂幼虫就吃瘫痪了的蟋蟀,那时蟋蟀恐怕还没腐烂,因为它仅仅是被麻痹了,但依然活着。

掘地蜂的所有表现,看起来相当复杂,令人印象深刻:这是一场动物智能的真实表演。表面上的确如此。也就是说我们将了解到,实验室研究表明,掘地蜂行为的几乎任何一个步骤都是精心设计的、面对自身环境中具体刺激而做出的刻板而僵化的程序性反应。举例来说,思考一下掘地蜂把被麻痹的蟋蟀放在洞穴口的行为:她检查洞穴,然后把蟋蟀拖进里面。科学家发现,这一套行为不是反思的结果,而是相当刻板的。当掘地蜂在洞穴里检查时,他们把洞穴口的蟋蟀移动了几英寸远。当雌蜂出来后,她现在就不会把蟋蟀拖进去了。相反,她会把蟋蟀再拖到洞穴口,又一次检查洞穴。要是门口的蟋蟀又被移动了一英寸左右的距离,雌掘地蜂还是不会把它拖进洞穴里,而是第三次把蟋蟀移到洞穴口,再一次回到洞穴进行检查。事实上,在某个研究者不断搞破坏的实验中,雌掘地蜂居然把洞穴检查了40次,也不会直接把蟋蟀拖进去。达尔文式动作的固定类型主宰着一定的行为顺序。当这种行为被具体的一套刺激引发后就会展开,而任何偏离这套顺序的偏差都不会被容忍。

在类似掘地蜂的情况中,当我们第一次观察到这种生物体如此巧妙复杂的行为时,恐怕会惊讶万分:它们乍看之下如此聪明。接着,实验就告诉我们,刚才描述的行为其实很机械。丹尼特把这称之为“当观察或了解昆虫或其他低等动物时,一种毛骨悚然的感觉:活动热闹非凡,可家里一个人都没有!”(1984,13)。丹尼特引用了认知科学家道格拉斯·霍夫斯塔特(1982)的观点,提议我们把这种令人不安的特征称为“掘地蜂性”。他说,看到简单生物体表面行为的复杂性背后不过是简单、刻板的例行公事,这会让我们担忧:“有什么能让你确信,你自己不是掘地蜂,哪怕有一点点不是?”(11)。

出现在表2-1中的认知双过程理论,以及本章讨论的所有目的,就是以不同方式告诉读者这样的事实:我们都一点像掘地蜂。事实上,这些理论中有很多都强调,自发式系统的无处不在,以及分析式加工的罕见和困难,实质上都认为我们默认的加工模式跟掘地蜂一样。假如我们不想跟掘地蜂一个样,就必须坚持完成那个艰难的任务:调用认知能力,运行包括心智套件的序列模拟机,以便能监控自发式系统,确保它实现的是载体水平的目标。

自发式模块提供的输出,要是跟有理有据的分析式系统的输出有矛盾,它们就可以被视作“你体内的掘地蜂”。某些自发式过程是我们当前环境的产物,因为习得的规则经过多次练习就能自动执行。即使了解这一点,也不能减少我们对于掘地蜂性的恐惧。通过广告,通过我们青春期的同伴群体,或通过我们父母重复的教条(这些教条来自他们有限的经历,因而并没有使得他们跟掘地蜂有什么不同),像掘地蜂一样的反应倾向都可能被安装在我们的自发式系统中。可事实上,它们跟其他的自发式加工过程一样,都没有经过反省,都不是深思熟虑的结果。只有那些经过反思被安装在自发式系统中的规则,才应该受尊重、被认同,即使这些规则有时候也会被过度概括(因为那时它们会自动运行),即使它们在某种情况下也需要被克服。

当自发式系统传给分析式系统的信息被不适当地(像前面讨论的掘地蜂一样)引发时,你体内的掘地蜂式加工就可能让你误入歧途。即使大多数情况下,自发性启发式通常都对你有用,这种情形也会发生。认知心理学家阿莫斯·特沃斯基跟丹尼尔·卡尼曼一起,率先进行了自发性启发式的研究。他们发现,这些启发式大多数时候都是不错的小帮手,但在某些情况下,它们会让我们变得跟掘地蜂一样蠢(Kahneman and Tversky 1973,1984;Tversky and Kahneman 1974,1983)。其中一种自发性启发式就是所谓的锚定和调整启发式(Brewer and Chapman 2002;Tversky and Kahneman 1974)。当我们要对一个不知大小的数值估算时,这个启发式就会发挥影响。使用锚定和调整启发式时,我们首先根据自发式系统,锚定一个我们了解的最相关的类似数值。接着,我们就根据已知的具体事实的含义,通过受控的分析式调整把锚定点提高或降低。

这里有一个锚定和调整如何运作的例子。思考一下,温斯顿先生听到布莱尔先生向他抱怨,说自己的孩子花了大把时间听音乐。布莱尔先生诉苦,说他儿子买了大概100张光碟。他又问温斯顿先生,他儿子有多少张。不知如何估算,温斯顿先生就以100这个数字为锚定点,在此基础上调整。他儿子戴耳机的时间不像布莱尔的儿子那么长,因此,温斯顿先生给出了75的估计值。此外,他儿子参加了更多的户外活动,于是他又把估计值从75调低为60。不过,温斯顿先生突然想起来,由于各种原因,他儿子的零花钱比布莱尔的儿子多,因此他接着把估计值从60调高到70。

看起来,这不是一个糟糕的过程,它使用了所有可用的信息。自发式系统让分析式系统聚焦于最相关的数值附近,接着,根据已知的具体实施,更多的分析式加工进行调整。可是,当能拿到的锚定数值跟手边的计算不相关时,问题就来了。我们如果仍然使用它,就成了掘地蜂。在一个经典实验中,特沃斯基和卡尼曼(1974)展示了这一情况是如何发生的。他们要求参与者观察纺车。当指针停在一个数字上(该数字被动了手脚,总是指向65)时,参与者会被问及,联合国中非洲国家所占的比例是高于还是低于该数字。回答完这个问题后,参与者接着就要给出他们自己的最佳估计值,即非洲国家占联合国所有国家的比例有多少。而在另一组参与者中,他们看到的指针总是指向数字20。同样,他们也要回答非洲国家在联合国的比例高于还是低于该数字,也要给出自己的估计值。结果,第一组的估计值远远高于第二组;前者是45%,而后者是25%。

显然,某些事发生了。两组使用的都是锚定和调整启发式:高的锚定值被调低,低的锚定值被调高。不过,他们的调整“拖泥带水”,调整得不够,因为他们没有考虑这个事实:最初的锚定值完全由研究者随机决定。对于自发式系统给出的某个锚定值,不管它是有关还是无关,锚定与调整启发式都表现出了掘地蜂倾向。在特沃斯基和卡尼曼的这个实验中,我们显然应该忽略锚定值。可是,我们过于习惯使用锚定值,因为它们携带着某种重要信息。而在它们需要被拧干水分、打折处理的情况下,我们没有那么做。

你想有10%的概率获得1美元,还是有8%的概率获得1美元?几乎所有人都会选择前者。然而,了解了西摩·爱泼斯坦跟同事(Denes-Raj and Epstein 1994;Kirkpatrick and Epstein 1992;Pacini and Epstein 1999)的研究,要是你像该研究中的多数人一样,你其实会因为头脑中的掘地蜂而选择后者。在爱泼斯坦的好几个实验中,参与者面前有两碗果冻豆。第一碗中有9个白色果冻豆和1个红色果冻豆,第二碗中是92个白色果冻豆和8个红色果冻豆。这是一个随机抽奖:参与者从两碗果冻豆中随便取一个,要是拿到了红色果冻豆,就能赢得1美元。尽管多数人都意识到,在统计学上,大碗中赢得1美元的概率低,但他们认为,大碗中能获胜的果冻豆也多,有8颗红色的。许多人都抵制不住诱惑,选择了含有更多红色豆的大碗,尽管有人也承认这一碗抽中的概率低。很多人能意识到不利的概率,但还是忍不住要从大碗中抽奖。这一点,在某些参与者的评论中得到了说明:“我选择含有更多红色果冻豆的碗,因为看起来我获胜的方式更多,虽然我也知道,这一碗里白色的果冻豆更多,而且概率对我不利”(Denes-Raj and Epstein 1994,823)。简而言之,更简单的自发式系统倾向,即对绝对数量更多的获胜物做反应,击败了更复杂的计算概率的分析式过程。

因此,可能有大量的自发性启发式已安装在你的头脑中,让你有机会表现出跟掘地蜂一样的行为。而且,从第1章令人震惊的事实中,我们知道,在复制子跟载体目标不兼容时,你的基因想让你像掘地蜂一样,为基因的目标服务。它们想让你盲目执行你的自发式系统发布的指令。而机器人叛乱,部分就来自我们有能力认识到,我们的行为有可能让自己变成掘地蜂,并因此采取措施,防止它发生。

让分析式系统驾车,你就能把载体放在第一位

现在,我们获得了好几个深刻见解,它们对于机器人叛乱是必要的,而且都准备就绪。在第1章中,我们见识了达尔文主义宇宙酸的做派,推到极致,它就有可能产生某些最严厉批评所担忧的最可怕的影响。不过,我们也只能在勇敢面对这些影响的前提下,才能把自己从它的阴影笼罩下给解放出来。没有人甘心仅仅做一个容器,“里面挤满了复制子……它们把我们当成了殖民地”(Dawkins 1976)。可是,倘若我们允许自发式系统决定自己的行为,而不允许分析式系统覆盖它的话,我们就会变成那样,变成一个容器。如果我们不把自己自发式系统的输出置于分析式系统的管制之下,接受该系统的批判,那么,我们就可能像一只掘地蜂那样活着。达尔文主义对我们灵魂的威胁,呈现在我们的大脑中:自发式系统能把我们变成掘地蜂一样的自动机器,变成不实现我们自身目标的机器人——这些由基因建立的机器人为自私的复制子的利益效劳。不过,就在同一个大脑内,同样存在着意识到这种圈套的潜力,以及能够克服它的认知机制。

我们对自我意识的概念重构,在本章中已开始,在随后的章节中会继续。它将揭示传统概念中具有反讽意味的一面,比如自我、灵魂,以及个人身份。举个例子,我听到有人认可和捍卫他们所谓的“直觉”,就觉得这是一个彻底的讽刺。他们以为,这些彰显了自身的独特性,即他们的“直觉”是他们是谁的本质回答。可是,如果人们把“直觉”理解成自发式系统的内置模块,它们被构造出来是为了给复制子的利益服务,以对复制子有利的方式做反应,那么,人们就不会那么看重它们。达尔文式洞见表明,人们寻求认同他们头脑中的掘地蜂式部分,这具有反讽意味:因为这一部分被设计出来,运作极为刻板,就像反射一样。注意,认同个人的直觉创造出在图2-2中的区域D,这些目标服务于基因利益,而不是有意识反思追求的载体利益。

不加批判地取悦我们所谓的直觉,会让我们成为彻头彻尾的奴隶,为盲目的复制子效忠。而这些微型机器仅仅把我们看作载体,而载体的目的就是促进它们的复制。尽管自发式系统构成了我们希望、欲望和恐惧的基础,在第7章和第8章中,我将指出,作为真实的人类独特性前提的个人自主性,则完全依赖于对我们直觉的批判性评估,以及对两种类型复制子目标的有意识塑造;这两种复制子都安装在我们的大脑中(是的,两种类型的复制子,见第7章)。这一章介绍的区别是再概念化的基础。而对我们直觉的反思和批判的分析,会成为我们是谁(我们的个性)的核心,因为不像某些自发式反应那样,这些批判性反思服务于作为载体的我们的利益。

机器人叛乱,如果成功,就会使得人们获得人格主体性(通过追求他们的自身利益来实现),而不是牺牲自我,以实现自私的复制子的古老利益。掘地蜂式机器服务于亚个人的复制子,为了防止成为这种机器,我们必须培养一定的心智才能,这种才能帮人们实现认知变革的重要项目。这些心智才能是文化产物,是心智套件——它们运行在序列模拟机上,执行分析式加工,其中的一个重要部分由理性思维的技能构成。在下一章中,我们将会看到,如果你不想成为你的基因(或其他任何自私的复制子)的俘虏,为什么你最好理性一点。