七、语境省略
在沟通过程中,表达者和听者都会维护一个语境,这个语境记录了最近表达的对象、属性、行为、事件等。一旦一个具体的元素存在于最近的语境,表达者就有倾向在表达时省略掉这个信息,而听者有能力利用语境保存把这个信息补全之。
人类的对话伴随着大量的省略,有些省略存在于一方的连续表达中。比如“狼叼了一只鸡,从洞口钻了出去,狼狈地逃跑了”。在这个例子中,后面两个句子省略了主语,但主语对象存在于最近的语境中。当我们通过已有的信息“从洞口钻出去”“狼狈地逃跑了”,识别到是一个事件的结构信息,但缺少主语对象,我们就会在语境中寻找最近的对象进行补全。还有一类省略出现在对话中,比如在一个例子中:
A:红色的小花上停着一只蜻蜓。
B:有多大?
在另外一个例子中:
A:昨天中午他们去沙滩晒太阳。
B:午饭前还是午饭后?
在第一个例子中,我们可以意识到完整的表达是“蜻蜓有多大”;第二个例子中的完整表达是“昨天他们去沙滩这个事件发生在午饭前还是午饭后”。
我们再来看下一个事件省略的例子:
A:我鞋子全湿了。
B:因为踩到水里了吗?
在这个例子中,询问补全后的完整信息是“你鞋子湿了是因为踩到水里了吗?”
总结而言,只要省略后的句子有足够的特征归属到一个语义结构,智能体就能找到结构中缺失信息的位置和所需的信息类型,然后就可以去语境中寻找是否有此类型的信息,用这个信息来填补先天语言信息结构中的缺失。这就是我们工程上赋予AI应对人类表达省略的逻辑。我们会在后面的实验中对以上几种类型的省略进行测试。