第1章 AI与大模型时代对基础架构的需求

1.1 我们在谈论AI时,到底在谈论什么

2022年年底,以ChatGPT为代表的生成式AI及大模型技术,再次掀起机器学习的热潮。

为什么使用“再次”这个词呢?

这是因为,2016年,机器学习因Google主导开发的AlphaGo(围棋AI程序)与围棋世界冠军李世石的人机大战而掀起热潮。在此之前,绝大多数人都不看好AlphaGo,认为李世石能够轻松战胜计算机。但最终的结果颠覆了人类过往的认知,AlphaGo以4:1的绝对优势战胜了李世石。

可能一些读者还听说过,1997年,IBM的超级计算机“深蓝”战胜了国际象棋世界冠军卡斯帕罗夫。那么,究竟是什么原因,使得计算机在国际象棋领域战胜人类以后,又经过了近二十年的飞速发展,才实现在围棋领域战胜人类呢?

这是因为,国际象棋和围棋虽然都是棋类游戏,但关于局面价值判断的数学模型相去甚远。

在国际象棋中,只要擒获对方的“王”,就可以取得胜利,因此对于局面价值判断,其实可以用一个比较简单的数学模型来描述,也就是子力本身价值与子力控制范围的价值的加权。

而在围棋棋局中,对于局面价值判断,往往存在较大的争议。看一个例子:图1-1所示是日本围棋大师武宫正树在决定全球首个围棋世界冠军归属的1988年富士通杯决赛中下出的着法。

对于黑1这一手,在整个围棋界一直存在争议,武宫正树本人一直认为这是当前局面的最优解,但包含多名世界冠军在内的一些其他高手持反对意见。这也使得此局成为了围棋史上的名局,理由是武宫正树下出了一般人难以想到的创新着法,并最终凭此手棋赢得了全球首个围棋世界冠军。

图1-1

棋界对于武宫正树这手棋的争论,直到以AlphaGo为代表的围棋AI程序出现才有初步的结论——虽然武宫正树在下出黑1后,黑方有较大优势,但如果将黑1下在其他地方,黑方的优势会更大。

在围棋AI程序出现之前,这样的争议并不少见。这是因为,关于围棋的局面价值判断的数学模型非常复杂,存在很多难以量化评估的因素,人类一直难以建立精确的数学模型,取而代之的是围棋高手的“境界”。这也是围棋AI程序棋力长期停滞在较低水平的原因。

AlphaGo在围棋领域取得突破的核心因素是,它实现了较为精确地评估围棋局面价值及着法价值优劣的数学模型。这种数学模型就是Google通过机器学习方式,使用深度神经网络算法学习了10万局以上的人类棋谱得到的。

我们可以发现,在计算机看来,国际象棋或中国象棋与围棋的最大差异,在于采用的评估局面价值及着法价值优劣的数学模型。国际象棋或中国象棋采用的数学模型是通过专家系统实现的,而围棋采用的数学模型是通过机器学习实现的。

机器学习指的是,先构建一个参数待定的高次线性方程模型,再输入大量的训练样本(也就是方程模型中自变量及因变量的值),让计算机算出方程模型的参数。该参数被称为“权重”,该步骤被称为“训练”。而基于机器学习得到的方程模型,通过输入自变量得到因变量的过程,被称为“推理”。

在本书中讨论的AI算法,均指这种机器学习及推理算法,不包括基于专家模型的算法。

在接下来的部分章节中会出现一些数学公式,不超出高中数学的范畴,请不要轻易跳过这部分内容,因为学习这部分内容对于理解机器学习的本质有非常大的帮助。