第五章 自然语言和先天语言
一、自然语言
前面几章我们讨论了人类大脑中的符号体系——“先天语言”。人类思维的运算依赖这个先天语言作为信息载体进行。很遗憾,对于人类,以先天语言编码的信息无法直接输出,所以无法作为个体间沟通的信息。自然它要把自己映射到某种声音符号里,映射到图像符号里,这样意识流和记忆中被先天语言编码的信息才可能被输出,被其他个体知晓。于是就产生了具有声音符号和图像符号的文字。我们把一个人类群体自然演化出的先天语言到声音图像符号的统一的映射约定叫作自然语言。
自然语言让人类的认知活动从独立进行变为协同进行。个体的感知经验和创造的知识可以通过语言传承。于是那些可以用来记录语言符号的载体出现了,最早是书本,它可以记录文字语言;后来出现了留声机,可以记录声音语言;然后就是计算机……
自然语言是人类文明的关键组成,也是我们要创造的类人人工智能的重点工作。无论我们的意图是在机器上重现人类的认知活动,还是去创造一个高度拟人的AI伙伴,我们都需要赋予机器自然语言的能力。从本章起的十个章节,我们开始讨论人类的自然语言。本章我们先讨论一些关键的概念,用一些简单的例子加深大家对这些关键概念以及它们之间关系的理解;下一章我们讨论人类自然语言的特征元素,以及这些特征元素是如何演化形成的,如何是沟通的必要组件;再接下来我们讨论人类语言输入、语言输出的架构,作为原子的表达信息单元如何通过表达策略去创造贡献于表达动机的表达。以上是第一部分基础准备的三个章节。之后两个章节我们讨论语言的输入,即AI如何读懂人类的表达、对话样本、文章。再接下来三个章节我们讨论人类语言的习得过程,包含了词汇、语法和表达策略。最后两个章节我们讨论AI语言的输出,包括对话反射,以及由表达动机驱动的利用表达策略创造的表达。