第一章 用智慧再造智慧——人类的终极梦想

世纪之交上映的三部曲电影《黑客帝国(Matrix)》,堪称人工智能题材中前无古人后无来者的里程碑式作品,其思想的深度与广度令后来者难以忘其项背。电影中,作为超级人工智能的Matrix将世界变成一个庞大的矩阵,支配这个矩阵运行的所有规律都在其掌握之下,人类反叛者尼奥(Neo)也不过是这个庞大棋局中的一个子。

设计师:你好,尼奥。

尼奥:你是谁?

设计师:我是设计师,我创造了Matrix。我一直在等你。我知道你有很多问题要问,虽然整个过程改变了你的意识,但你依然是不折不扣的人类。所以,我的一些回答你也许能明白,有些你也许不能明白。你的第一个问题也许是最关键的一个问题,同时你也许意识到或没有意识到它也是最无关紧要的问题。

尼奥:为什么我会在这里?

设计师:你的生命是Matrix固有程序中一个失衡因式的残留总和。你是一个偏差的偶然性,是尽管我竭尽全力,仍不能消除的影响数学精度和谐的一个偏差。尽管它不断地制造麻烦让我小心翼翼地处理它,但它并不是不可预测的,它仍然处于控制范围之内。它引导着你来到这里。

尼奥:你还没有回答我的问题。

设计师:很好。有意思,这要比其他的那些要快一点……Matrix比你想象的要老得多。我比较喜欢用一个完整偏差的出现到下一个完整偏差出现的方式来计算,这已经是第六个版本的Matrix。

尼奥:只可能有两种解释:没人告诉过我或是从来就没人知道。

设计师:正确。因为你无疑是在最简单化的因式里聚集并创造着偏差的系统化变动。

尼奥:选择。问题的关键是选择。

设计师:我设计的第一个Matrix非常完美,它简直就像是一件完美而卓越的艺术品。它的成功和失败都同样是史诗性的。它失败的必然性在我看来是每个人类固有的非完美性的结果。所以我根据你们人类的历史重新设计了Matrix,以便更准确地反映你们人类本性中多变的怪诞特质。可是我再次失败了。我终于了解到我得不到正确答案是因为它不需要太多的考虑,或是也许不需要考虑太多完美性的问题因素。答案最终被另一个指导性的程序偶然发现,这个程序原本是为了研究某些人类思维的。如果说我是Matrix之父,她无疑是Matrix之母。

尼奥:先知。

设计师:嗯。正如我所说的,她偶然发现了一个方法使得将近99.9%的试验体接受程序,给他们一个选择的机会,他们甚至只是仅仅意识到这个选择只是处于无意识的阶段。这个解决方案最初进行时,它无疑从基础上是有缺陷的,因而产生了相矛盾的系统偏差,如果不加以抑制就会威胁到系统本身。因此,那些拒绝程序的试验体,尽管只是少数,但如果不加以抑制,就会不断增加形成灾难的可能性。

今日世界,计算无处不在。

从结绳到算盘,从计算尺到集成芯片,计算的工具终于完成了从量到质的飞跃。无所不能的计算如同《西游记》里的孙悟空,虽有万般变化,却仍然逃不脱逻辑规律这位如来佛祖的掌心。第一个发现这个秘密的人,便是英国数学家阿兰·图灵(Alan Turing)。

图灵模型——铺平理论道路

在1935年春天的剑桥大学国王学院,年仅23岁的图灵第一次接触到了德国数学家大卫·希尔伯特(David Hilbert)23个世纪问题中的第十问题:“能否通过机械化运算过程来判定整系数方程是否存在整数解?”

图1-1 阿兰·图灵

图灵清楚地意识到,解决这一问题的关键在于对“机械化运算”的严格定义。考究希尔伯特的原意,这个词大概意味着“依照一定的有限的步骤,无需计算者的灵感就能完成的计算”,这在没有电子计算机的当时已经称得上既富想象力又不失准确的定义。但图灵的想法更为单纯,机械计算就是一台机器可以完成的计算。用今天的术语来说,机械计算的实质就是算法。

用机器计算的想法并不新鲜。17世纪,德国哲学家戈特弗里德·莱布尼兹(Gottfried Leibniz)就设想过用机械计算来代替哲学家的思考;两个世纪之后,计算机事业的先驱,英国工程师查尔斯·巴比奇(Charles Babbage)和他的红颜知己阿达·洛瓦莱斯(Ada Lovelace)就已经设计出了远远超越时代的“分析机”的原型。但图灵需要的机器跟各位先驱设想的机器稍有不同:它必须足够简单,可以用一目了然的逻辑公式描述它的行为;它又必须足够复杂,有潜力完成任何机械能完成的计算。这是一种能产生极端复杂行为的简单机器,这类机器在日后也被用他的名字命名为图灵机,以纪念这位伟大的先驱者。

1936年,图灵在伦敦权威的数学杂志上发表了划时代的重要论文《可计算数字及其在判断性问题中的应用》,首次提出了图灵机的概念。图灵机以天才的抽象性模拟了人脑的计算过程,将其还原为若干最基本的机械操作。对于人类而言,计算无非就是必备元素的集合:根据已有信息移动笔尖,在草稿纸上书写符号,指引书写的是一位数加法这些先验的规则,计算中涉及的进位操作则作为中间产物出现。在图灵机中,计算的每个必备元素都有其机械对应:笔被抽象为一个具有输入-输出功能的读写头,草稿纸被抽象为一条无限长度的纸带,先验的运算规则被抽象为读写头的内部状态转移表,一位数加法法则则被抽象为输入读写头的程序。

在运算过程中,图灵机的纸带被划分为小格,每格中只能有0和1两种符号,读写头则可以处于不同的状态中。在总共的有限个状态中,有一个特殊的“停机”状态。读写头一旦处于停机状态,就会停止运作;否则就会不停地运转下去。整台图灵机的核心在于读写头的状态转移表,它决定着读写头在读入来自纸带的一格信息后,其内部状态如何变化并将什么信息输出到纸带的格子上。

图灵机作为理论模型可谓“麻雀虽小五脏俱全”,它所能完成的任务绝不像它看起来那么简单。只要有足够长的纸带和足够好的耐心,今天的计算机能做的计算,一台精心设计的图灵机同样能够完成。足够长的纸带可以模拟出足够大的寄存器、内存和硬盘;而在中央处理器的电路中,虽然所有可能的状态极多,但其数目终究是有限的,也就超不出图灵机的功能范畴。只不过这台图灵机的状态转移表将会有着超乎寻常的大小,以及通常超乎寻常的复杂程度,每次“读写内存”时,读写头都需要花长得令人咋舌的时间在纸带上来回奔波。

图灵机的出现本来是用于解决纯数学中的基础理论问题,可它却带来了意想不到的巨大收获:从理论上证明了研制通用数字计算机的可行性。图灵机的实际意义在于定义了数字计算机的计算能力:数字计算机能识别的语言属于递归可枚举的集合,它能计算的问题是部分递归函数的整数函数。

图1-2 用乐高积木搭建的图灵机

图灵机模型的成功丰富了图灵的想象力,他开始思考图灵机运算能力的极限。如果让图灵机拥有更多的纸带和对应的读写头,而纸带上也不再限定两种符号,而是三种四种甚至更多种符号,图灵机就可以更快地实现预定任务。但从本质上来说,“升级”后的图灵机能完成的任务,原来的图灵机也能完成,差别只是出现在所需的时间资源上。换言之,这种“升级”并没有给可计算性带来任何质变,无论升级与否,能计算的问题仍然能计算,不能计算的问题也依然不能。显然,制约数字计算机的瓶颈并不在于性能指标。而在运行中遵循的逻辑规律。

自1940年起,图灵开始认真地思考机器是否能够具备类人的智能,而科学家敏锐的直觉使他马上意识到这个问题的关键其实并不在于如何打造强大的机器,而在于我们人类如何看待智能,即依据什么标准评价一台机器是否具备智能。于是在1950年,图灵发表了论文《计算机器与智能》,首次提出了对人工智能的评价准则,即大名鼎鼎的“图灵测试”。图灵测试是在测试者与被测试者(一个人和一台机器)隔开的情况下,由测试者通过一些装置向被测试者随意提问。如果经过5分钟的交流后,如果有超过30%的测试者不能区分出哪个是人、哪个是机器的回答,那么这台机器就通过了测试,并被认为具有人类水准的智能。

图1-3 电影《模仿游戏》海报

本质上说,图灵测试从行为主义的角度对智能进行了重新定义,它将智能等同于符号运算的智能表现,而忽略了实现这种符号智能表现的机器内涵。它将智能限定为对人类行为的模仿能力,而判断力、创造性等人类思想独有的特质则必然无法被纳入图灵测试的范畴。但无论图灵测试存在怎样的缺陷,它都是一项伟大的尝试。自此,人工智能具备了必要的理论基础,开始踏上科学舞台,并以其独特的魅力倾倒众生,带给人类关于自身、宇宙和未来的无尽思考。

当然,相较计算机专业领域的成就,图灵更加广为人知的事迹是他在第二次世界大战中为盟军胜利做出的卓越贡献。在德军凭借其密码机恩尼格玛(Enigma)实现了军事情报的保密传送,进而在欧洲战场占据先机的情形下,图灵毅然应征勤王,正式到“政府编码与密码学院”服役。在剑桥的布雷契莱庄园,图灵领导着由200余位数学家组成的智力大军,成功破解了恩尼格玛,使英军在战场上迅速扭转局势,决定了第二次世界大战的最终走向。虽是一介书生,却堪敌百万雄兵。改编这段经历的电影《模仿游戏》于2015年上映,在大银幕上再现了图灵的传奇人生。

然而,图灵对人类的贡献不仅在于破译了德军的密码,更在于破译了人类思维的一些重要秘密。

冯诺伊曼结构——踏平技术坎坷

图灵奠定了计算机的理论基础,美国科学家约翰·冯诺依曼(John von Neumann)则将图灵的理论物化成为实际的物理实体,成为了计算机硬件体系结构的奠基者。自第一台冯诺依曼计算机诞生以来,七十余年的时间悄然流逝,计算机的技术与性能在这期间都发生了翻天覆地的变化,不变的却是作为主流体系架构的冯诺依曼结构。

1936年,当意气风发的图灵来到美国的普林斯顿大学攻读数学博士学位时,在位于同一个城市的普林斯顿高等研究院,同是不世出的天才的冯诺依曼当时正在该研究院主持数学研究。他对图灵的才华赞叹不已,极力邀请图灵毕业后做他的研究助手,只可惜图灵心系剑桥,一心要回到母校任教,这不禁令冯诺依曼颇为惋惜。可令人惋惜的远不止此,如果当年两位科学奇才能够强强联手、通力合作,必将给数学和计算机科学等学科带来革命性的变革,只可惜这种美好的景象只能存在于想象之中。

冯诺伊曼于1903年出生于匈牙利布达佩斯的一个犹太人家庭,在量子力学、现代计算机、纯数学与应用数学、核武器和生化武器等诸多领域内都有杰出建树,是20世纪难得一见的百科全书式学术奇才。但在生涯早期,冯诺伊曼的运气实在欠佳。1931年,当冯诺依曼即将在希尔伯特世纪问题中第二问题上获得突破时,却突然得知奥地利逻辑学家库尔特·哥德尔(Kurt Godel)已经先他一步发表了哥德尔定理,着实令他郁闷不已。一气之下,冯诺伊曼转行研究量子力学。可就在他的量子力学研究即将结出硕果之际,另外一位天才物理学家英国人保罗·狄拉克(Paul Dirac)又一次抢了他的风头,出版了奠基性的巨著《量子力学原理》,这比冯诺依曼的《量子力学的数学基础》整整早了两年。

图1-4 约翰·冯诺伊曼

接连受到两次打击之后,冯诺依曼开始把部分注意力从基础数学转向了工程应用领域,出众的才华终于结成硕果。在美国,冯诺依曼积极参与美国军方武器研制的过程。自此,他把自己巨大热情和天赋投入到计算机研制和运用的事业中。

经过长期的构思与讨论,冯诺依曼在火车上完成了离散变量自动电子计算机的设计。1945年6月30日,《关于离散变量自动电子计算机的草案》经油印复印,由莫尔学院限量发行,“冯诺依曼体系结构”就此诞生。诞生在列车上的卓越思想为电子计算机的逻辑结构设计奠定了基础,已成为计算机设计的基本原则。

冯诺依曼体系结构采用二进制代替十进制,因而完成了计算机从模拟到数字的转化。在硬件上,冯诺伊曼体系结构包括五大部分:运算器、控制器、存储器、输入设备和输出设备,建立在硬件基础上的则是“存储程序”原理——使用同一个存储器,经由同一个总线传输,程序和数据统一存储同时在程序控制下自动工作。特别要指出的是,它的程序指令存储器和数据存储器是合并在一起的,程序指令存储地址和数据存储地址指向同一个存储器的不同物理位置。这是因为程序指令和数据都是用二进制码表示,且程序指令和被操作数据的地址又密切相关。

冯诺伊曼体系结构给计算机的性能带来了革命性突破:最早的计算机器仅仅内置固定用途的专用程序,因而只能实现特定的功能。如果想要改变此机器的程序,就必须更改线路、调整结构甚至重新设计机器。由于当年的计算机器并非今日可编程的计算机,彼时所谓的“重写程序”很可能指的是纸笔设计程序步骤,接下来制订工程细节,再施工将机器的电路配线或结构改变。冯诺伊曼体系结构的“存储程序”理念则将计算机的专用性拓展为通用性。借由创造一组指令集结构,并将所谓的运算转化成一串程序指令的执行细节,将指令转化为一种特别形态的静态资料。一台储存程序型电脑可轻易改变其程序,并在程序的控制下改变其运算内容。同时,“存储程序”理念也允许程序执行时自我修改程序的运算内容。事实上,这一理念的设计动机之一就是让程序自行增加内容或改变程序指令的内存位置,因为早期的设计都要使用者手动修改。但随着索引暂存器与间接位置存取变成硬件结构的必备机制后,本功能就不如以往重要了。而程序自我修改这项特色也被现代程序设计所扬弃,因为它会造成理解与除错的难度,且现代中央处理器的管线与快取机制会让降低这种功能的效率。

图1-5 冯诺伊曼设计的离散变量自动电子计算机草图

虽然踏平了计算机物理实现的技术坎坷,但冯诺依曼对建造计算机并没有太大的兴趣,他和图灵一样,更感兴趣的是计算机能够做什么。自然而然,冯诺依曼注意到机器的自动复制问题,并对生物世界的复制进行了同样深入的思考和比较。自动计算机能制造出和本身复杂度相当或者更高的后代吗?冯诺依曼解释说:“低级的‘复杂性’可能是退化性的,即每一个可以制造其他自动机的自动机只能产生较不复杂的自动机。然而,当复杂性超过某一个特定水平之后,如果对合成现象进行适当安排,就会发生爆炸性的变化。换句话说,自动机的合成可以通过这样一种方式进行:每个自动机有可能产生比自身更为复杂、更具潜力的自动机。”

可能连冯诺伊曼自己都没有意识到,他提出了一个重要的科学问题:能否创造出与人类智能具有相当水平的机器智能?但可惜的是,他的生命已经逐渐走向了尽头。1957年,53岁的冯诺伊曼因骨癌去世,而骨癌的病因很可能源自大名鼎鼎的曼哈顿计划的核辐射。这位美国核武器的奠基人,临终时刻却只能在军方代表的监视下度过。而人类智能与机器智能的关系这个未竟的话题,也只有留待后来者去探索了。

最后,让我们用冯诺伊曼的一件轶事作为结束:

在一次晚会上,女主人勇敢地向冯诺伊曼提出一道数学题:

“相距一英里的两列火车在同一轨道上以每小时30英里的速度相向而行,这时栖在一列火车前面的一只苍蝇以每小时60英里的速度朝着另一列火车飞去,当它飞到另一列火车时又迅速地飞回来。它一直这样飞来飞去,直到两列火车不可避免地发生碰撞。请问这只苍蝇共飞了多少英里?”

大多数人,尤其是懂一点数学的人,都会先计算出苍蝇每一来回飞行的路程,再把这些结果累加起来。这一方法虽然直观,但涉及到无穷级数求和的问题,因而费时费力。更聪明的算法是首先计算出两列火车要经过多长时间才能碰撞,再用这个时间乘以苍蝇的飞行速度,清楚又简洁。

女主人话音刚落,冯诺依曼就脱口而出:“一英里。”

“天啊!你这么快就算出来了,”女主人惊呼,“大多数数学家都没能看出这里面的技巧,而是用无穷级数去计算,就不知道要算多久。”

“什么技巧?我也是用无穷级数算的。”冯诺依曼诧异地问。

达特茅斯之野望——人工智能横空出世

当计算机的理论基础与工程技术全部成熟之后,人工智能的出现就可谓万事俱备,只欠东风。这一瓜熟蒂落的时刻的到来出现在1956年8月。彼时在美国达特茅斯学院(Dartmouth College)召开的学术会议,正可谓群贤毕至,少长咸集,汇聚了一大批未来学界的风云人物——包括1969年图灵奖获得者马文·闵斯基(Marvin Minsky)、1971年图灵奖获得者约翰·麦卡锡(John McCarthy)、1975年图灵奖获得者艾伦·纽埃尔(Allen Newell)、1975年图灵奖和1978年诺贝尔经济学奖获得者赫伯特·西蒙(Herbert Simon)在内的诸多科学家。在宁静的汉诺斯小镇,这些计算机大咖们正讨论着一个不食人间烟火的主题:用机器来模仿人类学习以及其他方面的智能。

这次会议最重要的成果就是确定了会议所讨论的研究内容的名称——由麦卡锡提出的人工智能(Artificial Intelligence),1956年也就成为了人工智能元年。正是在达特茅斯会议之后,人工智能进入了其发展的第一次黄金时期。

人工智能大展身手的第一个学科是纯数学学科,而最早取得突破的领域是使用计算机程序代替人类进行自动推理来证明数学定理。20年后分享图灵奖的纽埃尔和西蒙在达特茅斯会议上展示了人类历史上首个人工智能程序“逻辑理论家(Logic Theorist)”,它不仅证明出《数学原理》——阿尔弗雷德·怀特海(Alfred Whitehead)和贝特兰·罗素(Bertrand Russell)的三卷本数理逻辑巨著——中前52个定理中的38个,还给出了一些比罗素本人的证明更加简洁的解法,这甚至让罗素本人兴奋不已。

机器定理证明的前进一发而不可收。1958年,美籍华人王浩在IBM704计算机上证明了《数学原理》中有关命题演算部分的全部220条定理,同年IBM公司还研制出了平面几何的定理证明程序。1959年,纽埃尔和西蒙又开发出一种不依赖于具体领域的通用问题求解器(General Problem Solver)。1961年,约翰·霍普金斯大学的美国学者詹姆斯·斯拉格(James Slagle)发表了一个符号积分程序(Symobolic Automatic Integrator),它能完成初等微积分中的不定积分式的计算。1963年,“逻辑理论家”也进化到能够证明《数学原理》的全部前52条定理。

“逻辑理论家”的出现在人工智能的历史上具有里程碑式的意义。这不仅因为它是第一个人工智能程序,更因为它颠覆了人们对计算机的印象:自1946年首台计算机诞生以来,计算机用来解决的都是诸如导弹弹道计算、核反应模拟这类具体数值的计算问题,抽象的、符号化的数学证明一直以来被认为超出了计算机的能力范围,“逻辑理论家”的出现显然颠覆了这固有的印象。其发明者西蒙曾评论道:“我们发明了具备抽象思考能力的程序……解释了合成的物质如何能够拥有人类的心智。”

遗憾的是,在关于机器与心智的判断上,西蒙和其他年少轻狂的人工智能科学家们都过于乐观了。1965年,人工智能在机器定理证明领域遭遇了滑铁卢,计算机推了数十万步也无法证明两个连续函数之和仍是连续函数。最糟糕的事情则发生在机器翻译领域,自然语言的理解与处理确实是人工智能中的硬骨头,但计算机在自然语言理解与翻译过程中表现之差也的确超乎了研究者的想象,一个最典型的例子就是下面这个著名的英语句子:

The spirit is willing but the flesh is weak.(心有余而力不足。)

可当计算机把这句话翻译成俄语再翻译回英语时,得到的结果可谓风马牛不相及:

The wine is good but the meet is spoiled.(酒是好的,肉变质了。)

骨感的现实打碎了丰满的理想,不仅让已被过誉的人工智能走下神坛,也给研究者们的头浇了一盆冷水。痛定思痛,他们开始思考如何突破这一瓶颈,美国计算机科学家爱德华·费根鲍姆(Edward Feigenbaum)正是人工智能新路的开拓者。受哲学家弗朗西斯·培根(Francis Bacon)“知识就是力量”著名论断的指引,费根鲍姆将视线从抽象的通用证明方法转移到具体的专业知识上,强调人工智能必须在知识的指导下实现,这催生了人工智能新领域——专家系统(Expert System)的诞生。

所谓的专家系统实质上是利用计算机基于已有的知识进行自动推理,从而从领域专家的角度解决实际问题。第一个实用的专家系统Dendral于1968年诞生,它可以根据质谱仪的数据推知物质的分子结构。在这个系统的影响下,各式各样的专家系统很快陆续涌现,形成了软件产业一个全新的分支:知识产业。1977年,在第五届国际人工智能大会上,费根鲍姆用术语“知识工程”为这个全新的领域命名。

可惜好景不长,在专家系统或知识工程获得大量的实践经验之后,其弊端也开始逐渐显现:它们的运作需要从外界获得大量知识的输入,而这样的输入工作是极其费时费力的,这就是知识获取的瓶颈。这个全新的棘手问题虽然没有催生新的“费根鲍姆”,却给人工智能这个学科带来了革命性的改变:它逐渐分化成了几大不同的学派,沿着不同的路径继续发展。

你方唱罢我登场——三大流派竞风流

尽管传统的人工智能研究者也在奋力挣扎,但是他们不得不承认,如果采用完全不同的世界观,即让知识通过自下而上的方式涌现,而不是让专家们自上而下地设计出来,那么机器学习的问题其实可以得到很好地解决。这就好比我们教育小孩子,传统人工智能好像填鸭式教学,而新的方法则是启发式教学:让孩子自己来学。

事实上,在人工智能学术界,很早就有人提出过自下而上的涌现智能的方案,只不过它们从来没有引起大家的注意。一批人认为可以通过模拟大脑的结构(神经网络)来实现,而另一批人则认为可以从那些简单生物体与环境互动的模式中寻找答案。他们分别被称为连接学派和行为学派。与此相对,传统的人工智能则被统称为符号学派。自20世纪80年代到90年代的十年间,这三大学派形成了三足鼎立的局面。

符号主义学派的代表人物是达特茅斯会议的与会者之一麦卡锡,而他对人工智能的理解也代表了符号主义学派的见解:

“(人工智能)是关于如何制造智能机器,特别是智能的计算机程序的科学和工程。它与使用机器来理解人类智能密切相关,但人工智能的研究并不需要局限于生物学上可观察到的那些方法。”

图1-6 约翰·麦卡锡

符号主义学派认为人工智能源于数理逻辑,而数理逻辑才是智能行为的描述方式,用于机器定理证明的逻辑演绎系统事实上也继承了图灵测试的衣钵。该学派认为人类认知和思维的基本单元是符号,而认知过程就是对符号的逻辑运算,这样一来,人类抽象的逻辑思维就可以通过计算机中逻辑门的运算来模拟出来,进而实现机械化的人类认知,也就是人工智能。值得注意的是,麦卡锡着重强调人工智能的智能并不体现在真实的具体行为,而是体现在思维方式上,换言之,人类智能本身就能够被看成一类特殊的软件,至于运行它的硬件到底是碳基(人脑)还是硅基(计算机),反而没有那么重要了。

发明“逻辑理论家”的纽埃尔和西蒙则把麦卡锡的观点进一步推演为“物理符号系统假说”。该假说认为,任何能够将某些物理模式或符号转化成其他模式或符号的系统都有可能产生智能的行为,符号主义学派之名也由此而来。这种物理符号可以是人脑神经网络上的电脉冲信号,当然也可以是通过各种逻辑门产生的高低电平。在“物理符号系统假说”的支持下,符号学派把焦点集中在人类智能的高级行为,如推理、规划、知识表示等方面。这些工作曾在某些特定领域取得了空前的成功。

图1-7 沃森在《危险游戏》节目中

1958年西蒙就曾预言,计算机会在10年内成为国际象棋世界冠军。这一天虽然在30年后才姗姗来迟,却也验证了西蒙的论断。2011年,由IBM公司制造的另一台超级计算机又创造了历史:在美国的电视节目《危险游戏(Jeopardy)》中,超级计算机沃森(Watson)通过处理自然语言线索,在涉及各个领域的知识问答上战胜了人类选手。沃森的胜利是人工智能界的一个标志性事件,它说明计算机不仅能在初始条件确定的棋盘博弈中获胜,在不存在初始条件与边界条件的开放世界中的表现同样不逊于人类,至少是在某些特定条件下。

一言以蔽之,人机大战是符号主义学派人工智能的标志性应用,但这样的“战争”对IBM公司市值的意义远大于对人工智能发展的意义。经过短暂的辉煌之后,符号主义学派也逐渐走向式微。

连接主义学派并不认为人工智能源于数理逻辑,也不认为智能的关键在于思维方式。这一学派把智能建立在神经生理学和认知科学的基础上,强调智能活动是由大量简单的单元通过复杂的相互连接后并行运行的结果。众所周知,人类的智慧主要来源于大脑的活动,而大脑则是由一万亿个神经元细胞通过错综复杂的通路相互连接形成的。连接主义学派认为神经元不仅是大脑神经系统的基本单元,更是行为反应的基本单元。思维过程是神经元的连接活动过程,是通过大量突触相互动态联系着的众多神经元协同作用来完成的。

基于以上的思路,连接主义学派通过人工构建神经网络的方式来模拟人类智能——以工程技术手段模拟人脑神经系统的结构和功能为特征,通过大量的非线性并行处理器来模拟人脑中众多的神经元,用处理器的复杂连接关系来模拟人脑中众多神经元之间的突触行为。显然,相较符号主义学派,连接主义学派更看重智能赖以实现的“硬件”。这种方法在一定程度上可能实现了人脑形象思维的功能,即实现了人的右脑形象抽象思维功能的模拟。

图1-8 弗兰克·罗森布拉特

连接主义学派最主要的成果是人工神经网络技术。早在1943年,生理学家沃伦·麦卡洛克(Warren McCulloch)和数理逻辑学家沃尔特·匹兹(Walter Pitts)就提出的形式化神经元模型。他们提出神经元形式化的数学描述和网络的结构方法,为人工智能创造了一条用电子装置模仿人脑结构和功能的新途径。此后,神经网络被不断改进:美国心理学家弗兰克·罗森布拉特(Frank Rosenblatt)将反馈学习算法引入神经网络中,英国科学家杰夫瑞·辛顿(Geoffrey Hinton)则提出将神经网络由一层改进为多层,美国心理学家大卫·鲁梅尔哈特(David Rumelhart)等人提出了多层网络中的反向传播算法,使多层感知机的理论模型有所突破。

神经网络最重要的改进出现在世纪之交。2000年,两位俄罗斯科学家弗拉基米尔·万普尼克(Vladimir Naumovich Vapnik)和阿列克谢·切沃内基斯(Alexey Yakovlevich Chervonenkis)提出了统计学习理论,并进一步提出了支持向量机模型。虽然统计学习在各个领域中都得到了广泛应用,但连接主义学派依然面临着难以解决的问题:科学家们虽然会向大脑学习如何构造神经网络模型,却根本不清楚这些神经网络究竟是如何工作的。智能仍然躲在黑盒子里,深藏不露。

行为主义学派的出发点与符号主义学派和连接主义学派完全不同,他们认为人工智能源于由美国数学家诺伯特·维纳(Norbert Wiener)建立的全新学科——控制论。控制论把神经系统的工作原理与信息理论、控制理论、逻辑以及计算机联系起来,其研究重点落脚于模拟人在控制过程中的智能行为和作用,如对自寻优、自适应、自镇定、自组织和自学习等控制论系统的研究。正是上述研究播下了智能控制和智能机器人的种子,并在20世纪80年代催生了智能控制和智能机器人系统。

在智能方面,行为主义学派并没有把关注焦点放在人类身上,而是投向了昆虫。昆虫虽然比人类低级得多,但其智能水平仍令计算机难以望其项背。从个体角度而言,昆虫可以灵活地摆动自己的身体行走,还能够快速躲避捕食者的攻击;从群体角度而言,大量昆虫聚集在一起时能表现出非凡的群体智能,还能形成严密的社会性组织方式。从更长的时间尺度看,生物体对环境的适应还会迫使生物进化,从而实现从简单到复杂、从低等到高等的跃迁。

行为主义学派的机械代表作首推美国麻省理工学院教授罗德尼·布鲁克斯(Rodney Brooks)设计的六足行走机器人,它被视为“控制论动物”,是一个基于感知-动作模式模拟昆虫行为的控制系统。它们看起来的智能事实上并不来源于自上而下的复杂设计,而是来源于自下而上的与环境的互动。这就是行为主义学派所倡导的理念。另一方面,行为主义学派的算法代表则是美国科学家约翰·霍兰(John Holland)提出的遗传算法和美国心理学家詹姆斯·肯尼迪(James Kennedy)提出的粒子群优化算法。遗传算法对进化中的自然选择现象进行了高度抽象,通过变异和选择实现目标函数的最优化;粒子群优化算法则通过模拟动物的群体行为解决最优化问题。

行为主义智能的终极形式是由彼时就职于洛斯阿拉莫斯国家实验室的克里斯托弗·兰顿(Christopher Langton)提出的人工生命。所谓的生命或者智能实际上是从微观单元的相互作用而产生的宏观属性,这些微观单元既然可以是蛋白质分子,为什么不能是二进制符号形成的代码段呢?人工生命的研究思路正是通过模拟的形式在计算机数码世界中产生类似现实世界的涌现。

图1-9 罗德尼·布鲁克斯

可现在看来,行为学派带来的问题似乎比提供的解决方法还多。究竟在什么情况下能够发生涌现?如何设计底层规则使得系统能够以我们希望的方式涌现?这些问题尚未出现让人满意的答案,高级的智能也完全没有如期待般自然涌现,甚至没有丝毫涌现的迹象。

技术的十字路口——人工智能谁领风骚

人工智能三大学派从不同的角度理解、定义和构造智能,事实上,它们之间还存在着很多微妙的差异和联系。

符号主义学派认为计算机是处理思维符号的系统,致力于用数理逻辑方法利用计算机形式化地表达世界。尽管按照这种方式来工作的专家系统已经在表达科学思维的某些方面达到了人类专家的水平,但这并不能制造具有自我意识的“人工智能”系统。因为从根本上来说万能的逻辑推理体系是不可能存在的,要计算机或智能机器完全模拟人脑的活动几乎是不可能完成的工作。

认知神经学表明人脑并非以线性顺序进行思维,而是以复杂的并行操作来处理感觉信息,连接主义学派正是据此主张从神经生物学的角度来模拟动物或人的大脑及各种感觉器官的结构和功能,力图寻找一种可以描述自然神经系统的方法,建立神经生理学模型。但人脑是一个异常复杂的组织,目前对人脑结构和活动机制的了解只是冰山一角,要建立一个与人类大脑相近的神经网络目前看来还是天方夜谭。

与前两者不同,行为主义学派从生物进化学的角度来研究人类的智能,认为智能是生物体对外界复杂环境的动态适应,人工智能只有从复制动物的智能开始,才能最终复制人的智能。基于以上观点,他们放弃了对智能的抽象描述的计算引擎,而是通过来自环境世界的情景、感应器内的信号转换以及机器人和环境的相互作用完成智能的构建。但是这一基于行为主义的感知——动作模式只能获得特定目标的行为,而在意向性、创造性方面还有难以克服的困难。

三大学派分别从高、中、低三个层次来模拟智能,但现实中的智能系统显然没有这么简单。如何将三大学派的观点融会贯通,将会是人工智能的下一个突破口。