- AlphaGo六十连胜对局解析
- 江铸久 芮乃伟
- 1718字
- 2020-06-25 16:03:19
第一篇 我们亲历的人机大战
传说、传承、传奇,AlphaGo改变人类的生活——从人工智能看围棋史话
围棋历史悠久,但自发明起围棋的规则就比其他棋类的规则简单。围棋起初是用来观测天文、占卜的,后来逐渐演变成智力游戏。后来围棋东渡至日本,并在日本得到迅速发展。在日本职业围棋发展了300年后,14岁的吴清源老师远渡日本,改写了日本300多年的围棋理论。吴清源老师在与当时的日本著名棋手本因坊秀哉对战时,频出奇招。在为时三个半月的比赛时间里,秀哉经常因为吴清源老师的一步棋就回去研究一个星期。直到深度学习的出现,我们才开始能理解吴清源老师的棋。因为在AlphaGo下围棋时,经常就是采取这种方式,哪里都敢下,什么都敢想。在吴清源老师与本因坊秀哉对战的最后收官阶段,大厅里密密麻麻都是本因坊秀哉的弟子,都在思索对吴清源老师的应对方法。而这么多人,就好比今天的AlphaGo,使用了穷举法。
从Deep Blue到Nature
20世纪90年代,很多计算机专家开始研究如何运用人工智能下围棋,但在那个时候,人工智能技术远落后于现在,根本无法下赢职业棋手。不过人工智能步伐坚定地在追赶。后来,人工智能系统Deep Blue击败了国际象棋冠军卡斯巴罗夫,即使是这样,人们仍然认为人工智能并不够击败顶尖职业围棋棋手,这是因为围棋与国际象棋之间存在很大的差别。国际象棋利用穷举法是可能穷尽的,即使穷尽不了,可能性也不会越来越多,只会是一条通途。但是利用穷举法无法穷尽所有的围棋招式,因为围棋每一步后面都有着更多的可能性。退一步讲,即使能够穷尽,计算量也是一个难以想象的庞大数字,而这在当时是无法完成的。用当时美国专家的话来说便是:“用尽美国所有计算机,也无法完成。”
国际象棋冠军卡斯巴罗夫输给Deep Blue这一事件影响巨大。这些受影响的人当中有一位当时只有13岁的国际职业象棋棋手哈萨比斯。哈萨比斯深切地感受到人工智能的魅力,开始研究人工智能。正是他研发了现在叱咤风云的AlphaGo。
2015年深度学习团队在《自然》杂志(Nature)上提出要向职业围棋手挑战。但是当时人工智能和顶尖职业围棋棋手的差距是四五子,这是一个犹如天堑般的差距。然而在2016年,人工智能就迅速击败欧洲围棋冠军,登上《自然》杂志,震惊世界。存在2 000多年的围棋就这样被人工智能超越了。
纵观这段历史,人工智能从被普通围棋职业棋手击败到击败国际象棋大师卡斯巴罗夫,再到击败欧洲围棋冠军,步伐缓慢却坚定。
树繁便剪枝
通过穷举法很难突破围棋,每一步后面都连接着无数个可能性,计算负担巨大。这就类似搜索树,枝丫非常繁杂。
但是深度学习提供了另外一种方式—“剪枝”。深度学习可以通过“剪枝”,即创造价值网络来解决这一问题,两法并用。首先是穷举法,当时在将近3秒钟的时间内,人工智能能够走100万步,这是一个非常了不起的进步。并且在使用穷尽法的同时,通过之前识别的棋谱来判断每一步的价值,这样就降低了巨大的搜索空间,能耗也随之降低。在与李世石对战时,AlphaGo连接了谷歌1 200多个中心。AlphaGo每一步成本是3 000美元的电费。而在乌镇棋会上,AlphaGo计算所需要的能耗较与李世石的比赛已经下降了90%,因为此时的AlphaGo已经识别了非常多的著名棋谱。一位著名棋手,一般下棋不会超过2 000盘,而AlphaGo却输入了16万张有名的棋谱,这使得AlphaGo对每一步价值的判断更加准确,能耗便下降了。
从CPU(中央处理器)到GPU(图形处理器),再到TPU(张量处理器),深度学习的东西越来越多,但是所需要的东西却越来越少。人工智能能耗的下降使得人工智能应用的掣肘接近消失,应用范围能够更加广泛。
变革与期望
一群业余棋手研发出AlphaGo,击败了世界顶尖棋手。这对世界的影响是巨大的,当时2.8亿观众观看了比赛,产生了3.5万篇报告。大家都开始思索人工智能将会给我们的未来带来什么样的颠覆。
人工智能发展至今,已经完成了其当初的目标。乌镇棋会时,柯洁在第三局比赛还未结束时落泪了。人工智能对于人类未来意味着变革。我们以前常提工业革命、工业资本家和资本颠覆了世界,以后将是智能革命、数据资本家和智能颠覆世界。从工业革命到智能革命,工业资本家到数据资本家,资本到智能,一切都是变革。人工智能的应用将极其广泛,例如目前已经出现的智能投顾、人机对话、无人驾驶和太空探索等,而想象空间仍然巨大。总之,人工智能就像是一面镜子,映出人更强的一面,促使人变得更强,不断去挑战极限,颠覆未来。