第九章 语言的输入B

一、语境和意向

上一章讲述了正转录的主要信息处理流程,我们能看到:第二步代词、对象类名称、相对关系名称指向什么概念,我们需要依赖语境记忆;第三步语境省略的补全需要语境记忆。我们也简单讲述了对于表达者重点表达信息的识别需要在语境中积累每个信息被重复、被关联的次数。没有了语境记忆,正转录将转出成堆无用的、无相互关联的碎片信息。

这一章我们将更系统地讨论语境记忆形成的机制,将在上一章正转录的主体逻辑中插入语境记忆维护的逻辑。我们将构建一个更加完整而类人的语境记忆,并考察这个语境记忆如何帮助AI实现阅读,如何去找到一大段表达的核心思想,以及各个碎片信息和这个核心思想间的关系;能够读懂一本书的逻辑脉络,以及所有篇幅的局部和逻辑脉络的支持关系。从而让AI能学习系统化的书本信息,能建立各个系统化的知识体系,为实现AI详细复述一本书的内容、阐述教授一门学科(一开始必定是较为简单的学科和理论)创造前提条件。

上一章用较少篇幅描述了意向表达的处理。我们知道,人类绝大部分的表达都是意向层面驱动的,极少是精确的,所以无法适应意向表达是制约严格自然语言转录AI读懂人类表达最致命的因素。这一章我们将更加系统地构建人类意向信息识别、转录的机制。同样,这些更加细化的逻辑也将插入到上一章正转录的主体逻辑中。

本章的使命是在上一章的基础上对支持正转录的两个维度功能做进一步的系统化的讨论和工程层面的设计,从而使AI正转录的能力朝人类的水平更近一步。其中让AI能够阅读人类书籍,通过阅读系统化地继承一个学科的知识,是一个颠覆性的功能。这个能力决定了AI能够以怎样的效率去继承人类最完整的知识库——历史上数百万本的书籍记录了整个人类文明的信息,而AI能在算力不受限制的情况下用很短的时间学习继承这些信息。做到这点我们就有可能为我们目标搭建的原型机——第一代人工智能向全人类提供全领域专家朋友级别的咨询、建议做好知识层的储备。