- 基于语义类别的汉语词汇与辞书对比研究
- 冯海霞 白云
- 6834字
- 2021-10-29 10:01:18
第二节 课题的理论及工具支撑
一、语言词汇的系统论及语义场
按照系统科学的观点,世界上任何事物都是以系统的方式存在的,因而,人们的认识活动,只有用系统方法去研究对象,才能获得正确的即符合事物实际情况的认识。
由奥地利生物理论家贝塔朗菲(Bertalanffy)等学者提出的系统论是20世纪最有影响力的现代科学方法论之一,它不但对20世纪的自然科学贡献巨大,而且也被运用到了人文学科领域,并同样产生了重大的影响。从系统的角度来认识语言是这一理论在语言学领域中得以应用的反映和体现。自索绪尔以来,学者普遍认为语言是成系统的。但是,在20世纪前半期语言学界流行着的是语法有系统,语音有系统,而词汇是一盘散沙的观点。20世纪60年代,词汇是具有系统性的观点开始出现,但受到强力的“辩难”。直到80年代,这一观点才慢慢被学术界接受。但在这个阶段,也仅仅是推理的假说,处于理论上的自觉。这种假说或理论的自觉大致基于以下三个理论依据:第一,客观事物是成系统的,反映它的词义自然也是成系统的;第二,思维是成系统的,体现概念的义位自然也是成系统的;第三,洪堡特把语言结构比喻为一张巨大的有机网络整体。先哲们提出了一个古老的假说:“词义是成系统的”,并不断地进行理论上的推导和事实上的证明。
无数学者用了近半个世纪的时间把假说证明从幼儿低谷阶段推到了发现高强度无数事实的发展时期,最后使其攀上假说证明的高峰,并充分印证了这个假说的真实性:义位处在聚合和组合的系统性中,且某些聚合群是具有层级性的系统。总之,“我们生活的时代的特征是在一切科学中都有用结构主义取代原子主义,用普遍主义取代个别主义的趋势”。当然,正如黑格尔从实在论出发,以生物分类的复杂性为根据,说“自然界到处通过中间的和不完全的形成物把本质界限混淆起来,这些形成物总是跟任何固定的区分带来一些相反的例证”。词汇也有其非系统的一面,但这是词汇的非本质的现象。
19世纪末20世纪初,“相互作用关系组成的集合开始成为注意的中心”,这种世界观与认识论的出现,是科学发展思潮的一次深刻转折。场(field)的概念首先在自然科学领域应运而生,如磁场、引力场、电场等。语言学上产生的场概念最早是洪堡特。但最早提出语义场的概念并进行了认真研究的,是德国学者G. Ipson。他在《古老的东方人和印度日耳曼语》(1924)一书中提出语义场(Bedeutungsfeld)的概念,指“形成某种语义统一体的一组词”(a group of words that form some kind of semantic unity)。而有关语义场的较为系统的理论则是由德国另一位学者特里尔(J. Trier)20世纪30年代构建的,因此,一般把特里尔视为语义场论的创始人和主要代表人物。他在洪堡特的“每一种语言都包含着一种独特的世界观”理论的影响下为语义场理论提供更具体的解释。特里尔的场论始于这样的假设,即每个词的意义都依赖于语言中其他词,不同的语言用它们的词汇以不同的方式切分现实。他把词汇看作一个由词组成的系统,词与词之间有一定的语义分工。词汇系统里词和词的关系正如埃利奥特在一首诗中所描写的那样:“Every word is at home, Taking its place to support the others. ”——T. S. ELIOT(每一个词都有它活动的中心之地,它活动的位置保持在与其他词的关系之中。)整个词汇系统处于变化状态之中,词的数目不断增减。每当有一个词W1消失,与它相近的词W2的含义就会扩大,兼含原来属于W1的含义。反之,如果出现了新词W3,那么W2的含义就会缩小,划出一部分含义让W3表达。意义相近的词W1、W2、W3……构成一个集合,成为词汇场(Lexical field,德语原文为Wortfeld)。词汇场F1, F2, F3……的并集该语言中词汇的总和V。词、词汇场和词汇之间的关系可用①②表明。①V= {F1∪F2∪F3……} ②F1= {W1∪W2∪W3……}。特里尔认为同时存在着词汇场和概念场。一个词和它在概念上相关的词构成一个词汇场,词汇场和概念场相对应,词项的划分反映了概念的划分,相近的概念集在一起组成概念场(conceptual field,德语为Sinnfeld)。
到20世纪40年代,特里尔的学生威斯杰波,在两卷本的《论德语的世界》里,不仅从广度和深度上都推进了语义场理论,而且把这种理论应用到近代德语研究中,调查研究了空间、时间、植物、动物、亲属、人体、颜色等语义场,显示了理论的成效,因而被称为“特里尔—威斯杰波理论”。(莱昂斯)
特里尔及其追随者的理论引来了不少学者的批评。有些批评者认为特里尔的语义场概念在一般概念下存在着语义和心理的重要性,但是模糊且带有主观性。莱昂斯(Lyons)指出,特里尔提出的概念场和词汇场的理论显然是一种假设,即在所有语言词汇的底层都存在着一个先验的、未结构化的意义实体,这势必引发三点质疑:第一,我们很难解释清楚概念实体这一概念;第二,说现实是始终不变的和横跨地球不同地区的显然是错误的;第三,我们必须承认现实是有结构的,这一结构在相当程度上是不依赖具体语言的词汇结构的,外部世界或现实不只是一个无差别的连续统。因此在使用客观事物连续统这一概念时一定不能和这一概念有太大出入。莱昂斯认为一个词指示一个概念区(conceptual area),一种语言的所有某方面的词组成一个词汇场,这些词所指示的概念区合起来成为一个概念场(conceptual field)。词汇场指示、遮盖概念场,并提出了场的历时分析的五种变化情况,以克服原子主义的毛病。赖勒(Lehrer)指出,特里尔的两个假设,一是场内不存在意义的重叠,二是场内没有空缺,与语言事实不符,难以成立。徐烈炯认为,在第二种情况下,如果这两个集合都是闭集,一个词只能属一个场,各个场的成员合在一起是V。但实际情况显然不是如此。所谓词汇场有点像分类词库中的类,在这类词典中同一个词往往分属好几个类。
我们认为,第一,词汇场和概念场是不同的。语义场是由语言系统的结构划定的,所以是封闭的,它的划分是全面而无剩余的;概念集却是根据积极特性对概念所做的分类,凡是符合这种特性的,即属此类,所以是开放的。概念场的划分是统一的,而词汇场的划分在同一语言的各个历史时期是不同的。一种语言不同发展阶段对某事物的反映也不同,有时一个阶段的词对同一事物的反映要比另一阶段精细的多。
第二,语义场理论的核心是义位的价值对立。这显然是受到现代结构主义理论的影响。索绪尔(F.de. Saussure)认为,一个语言单位并没有孤立的内在功能,语言单位的值(Value)是同其纵横轴上的其他语言单位相辅相成的,相参照而取得自己的值。一个词的价值只有在与其邻近的词的联系和对立中才能得到确定。如法语的mouton(羊,羊肉)跟英语的sheep(羊)的价值不同,就在于英语除sheep之外还有另一个要素mouton(羊肉)。词义值的确立,取决于同一语言中其他词的存在和其他词值的大小。
聚合关系和组合关系是语言系统中的两大基本关系。语义场就是语言系统中词语之间的语义聚合关系的系统网络,反映了人类认知机制对事物及本身生活经验的归类和概括。研究现代汉语词汇的演变以语义场为研究单位进行不同时期的对比研究,从小的系统性入手,进而实现构建大系统性的完整。
二、语言的历时性与共时性特征
瑞士语言学家索绪尔提出,语言研究应注意区分语言发展的历时性(diachrony)和共时性(synchrony)两方面特征,并且强调这是继语言(Languages)和言语(Speech)之分后语言学面临的“第二条分叉路”。“于是,语言学在这里遇到了它的第二条分叉路。首先,我们必须对语言和言语有所选择;现在我们又处在两条道路的交叉点上:一条通往历时态,另一条通往共时态。”历时性是指语言历经不同社会历史时期发展变化的特点,是语言的动态特征;共时性是指语言在某一历史横断面所表现出来的系统性特征,是语言的静态特征。索绪尔又进一步指出:“事实上,绝对的不变是不存在的;语言的任何部分都会发生变化。每个时期都相应地有或大或小的演化。这种演化在速度上和强度上可能有所不同,但是无损于原则本身。语言的长河川流不息,是缓流还是急流,那是次要的考虑。”“无论如何,只要我们没有从单位的两个方面,即静态方面和演化方面去加以研究,就不能把它完全解释清楚。只有把历时单位的问题解决了,才能透过演化现象的外表,深入到它的本质。”他还说:“语音学,而且整个语音学,是历时语言学的头一个对象。”“但是随着时间起变化的只有声音吗?词的意义改变着;语法范畴演变着,其中有些随着表达它们的形式一起消失了(例如拉丁语的双数)。”
布龙菲尔德(Leonard Bloomfield)曾经强调:“任何言语社群的语言在观察者看来总是一个繁复的信号系统……一种语言在任何时刻呈现在我们面前的都是词汇和语法习惯的稳定结构。然而这是一种错觉。每一种语言时时刻刻都在经历着缓慢而不断的语言演变过程。”英国学者简·爱切生(Jean Aitchison)也谈道:“在一个人会老,蝌蚪会变成青蛙,牛奶会变成奶酪的世界上,如果只有语言会一成不变,那倒反而会令人奇怪了。”
词汇,作为语言中最活跃的因素,其发展进程会更多地显示出历时性即动态特征。因为随着人类历史的发展和进步,以及交流的不断深入和新事物的不断产生,新的词语被源源不断地创造出来,其间自然伴随着部分词的消亡、词义的变迁、语音的变异、字(词)形变异等一系列变化。任何一种语言的词汇系统都会既历经时代变化而变化,又在时代浪涛中努力保持着本系统地稳定。它同世界上万事万物一样,处在永恒的变化之中,不变是暂时的,是相对的。因而可以说,历时性特征是词汇发展的基本特征之一。
三、词典的可比性研究
“微观上,通过透视现代汉语词汇的同异度、分布状况以及20世纪现代汉语词汇的纵向演变,可以看出《现代汉语词典》与《重编国语辞典》在汉语词汇的分布与演变的研究上能提供独特的视角与价值;宏观上,《现代汉语词典》与《重编国语辞典》,再加上《国语辞典》,则使得我们在更宽阔的历史背景与地域范围下来研究20世纪现代汉语词汇的形成与发展成为可能。”词汇研究与词典有着天然的联系。词典是词汇材料的聚合体,它反映的是具有普遍的社会性、定型成熟、并经过人们整理的系统词汇材料。
早在五四运动以前,黎锦熙有感于中国传统字书的缺陷,认识到编纂汉语语文辞典的重要性,主张编写一部新型的汉语词典,以供学校汉语教学、广大民众学习语文和专门学者研究汉语时使用和参考。1920年国语辞典编纂委员会成立,1923年国语辞典编纂处成立,1928年该处更名为中国大辞典编纂处。1928年以后编纂处各项工作并力进行,并计划到1948年成书,但是由于《中国大辞典》规模宏大,卷帙浩繁,加之当时战乱不断,一时无法成就全书,编纂处便决定利用已收集到的材料,先编纂一些中小型字典、词典,以供社会及语文教育之急需。《国语辞典》就是其中的一种。
《国语辞典》是我国第一部描写性和详解性的现代汉语词典,全书共八册,1937—1944年出版,1947年再版时合订为四册。它收集了宋元以来白话文学作品里的词汇,以及当时使用的以北京方言为主的现代汉语普通话词语。这在20世纪30年代出版的辞书中属于首创。主编黎锦熙先生在序言中指出该辞典的用处有六,其中之一便是:定词,并在“凡例”中加以说明:①语文中常用、闲用及虽罕用而须供查考之辞,均行采收。②各科学术较常用之辞,分别搜采;见于古籍而尚流行于现代语文中及通俗口语中所用之辞,均尽量采入;其成语之具有特别意义或行文时习用者,亦酌收入。可见,《国语辞典》基本上能反映当时语言使用的实际面貌。1957年商务印书馆将其重新修订出版,更名为《汉语词典》,实际上它是《国语辞典》的简编本,为了叙述和行文的需要,我们简称其为《国语》。《国语》中作为原书特点的北京话词汇和有翻检必要的古汉语材料都被保留了下来,删节后存词汇74000多条(我们的统计为70644条)。其丰富的词汇语料对于我们了解现代汉语早期词汇系统的状况有着极其重要的研究价值。
《现代汉语词典》(以下简称《现汉》)是为推广普通话、促进汉语规范化服务的,以反映现代汉民族共同语词汇系统为己任,具有语文性、当代性、规范性的特点。1954年,国务院为了推广普通话,促进汉语规范化,责成中国科学院语言研究所编写以确定词汇规范为目的的中型现代汉语词典。1955年10月中国科学院主持召开了现代汉语规范问题学术会议,论证并确定了这个课题。从此,我国语言文字工作者开始了编纂《现代汉语词典》的浩繁工程。这部词典先后由我国著名语言学家吕叔湘先生和丁声树先生主持编写和修订。1958年2月开始试编,1959年10月完成初稿,初稿完成后,曾陆续印出油印稿征求社会意见。到1961年初铅印成“试印本”。又经过4年的通读和修改,才印成“试用本”。1978年,《现代汉语词典》正式出版,1986年出版了“补编本”,1996年出版了“修订本”,2002年出版了“增补本”, 2012年第6版面世,2016年9月第7版问世。《现汉》是为推广普通话服务的,其选词的依据,主要不是看查考的需要,而是看词语在语言使用中的频率。因而词汇多半是从现代文学、历史、哲学、经济、政治、卫生、体育、科技著作,以及现代报刊、社会科学和自然科学的一般论著和学校课本中搜集的。其收词的范围以普通话词语为主要对象,兼收一些常用的方言词语、文言词语、口语词语、专科词语以及一些见词明义的词语。本着这些原则,《现汉》第7版最后确定收录词语约69000条,基本上反映了目前汉语词汇的构成与面貌。
因此,两典在现代汉语词汇的形成与发展、分布与状况的认识上能提供独特的研究视角和研究价值。将二者结合起来,可以观察现代汉语词汇的百年发展史。
《新编国语日报辞典》(以下简称《国语日报》)出版于2000年,《国语日报》在“序”中表明其“目标在‘字音’和‘词音’的标注,以及‘音’和‘义’的互动关系”。“我们的做法,等于是为通行的国语,具体明确地画出了一个轮廓。”由此可以看出,《国语日报》也是一部以规范为目的的现代汉语词典,同时《国语日报》也是参照《国语辞典》编纂的。两部语文词典既同质又同源,为对比研究提供了可行性。从读者群体上来看,《现代汉语词典》所面向的是中等以上文化程度的读者;《国语日报》面向的是一般读者,各级学校学生与各阶层社会人士,两者具有相似的读者群体。从收词上来看,《现代汉语词典》在学者和专家不断地改革和修正下到了第7版收录的各类单字达到13000多个,而收录的词条数目已多达69000多条。《国语日报》收单字9238个,收词50960个,两者在规模上相当。从时代性来看,《现汉》第7版于2016年发布,而《国语日报》的修订本也是2016年发布,两部语文词典发布于同一年,这就增加了比较的可行性及其价值。
因此,对两典在同类别词语的收词、释义进行对比的话,不但能够比较出两岸词语的同与异,进而也能反观同类型词典释义的高低、优劣。
四、本文研究材料的选取
《国语》简本收词70644条,《现汉》7版收词69000多条,两部词典的词语合计约139644条。如此庞大的词汇集合,要想在短时间内进行全面系统的比较研究困难很大。因此,我们选取其中的一部分词语作为研究对象,参考梅家驹等编写的《同义词词林》、林杏光的《简明汉语义类词典》、苏新春的《现代汉语分类词典》等类义词典的分类,选取了植物、动物、经济、击打、衣物、颜色、亲属称谓、敬谦、亲属称谓等多个语义类别,对其中包含的词语给以穷尽、封闭的比较研究。为此我们建立了现代汉语词汇数据库。数据库中,以义位为单位,多义词有多少个义项就作为多少个记录;然后按语义场对义位逐个标注。
在现代化环境中的语言词汇统一体,主要是由两个密切相关的词汇系统构建的:日常的普通词汇和专门的学科词汇。有的学者认为除二者之外,还存在另外一个词汇系统,即具有“双重性能的词”,同时包括术语义和普通词义。专科词汇构成术语语义场,其中又可以划分出科技和哲社两个子场,这两个子场分别包含若干个更小的子场。专科词语承载的是学科义位。“义位总是处在一定的语义场中,并和同一语义场特别是同一最小子场中的其他义位互相联系,互相制约。”我们主要选取“植物、动物、衣物、击打、经济、颜色”等几大类词汇来考察20世纪初以来的汉语词汇发展变化的轨迹;选取“敬谦词、亲属称谓词”等几个类别观察两岸当代辞典的收词、释义,从而窥测当代两岸词汇使用的异与同。
五、研究方法
1.定量统计与定性分析相结合
随着计算机和网络技术的普以及研究手段的革新,特别是电子语料库的给汉语词汇研究提供了便利条件,数据统计、频率统计等计量研究方法也在汉语词汇研究中得以广泛使用。“定量方法对研究共时的语言现象意义重大,对研究历时的语言现象也同样重要。我们若能在频率、频度的基础上进一步展现某种历时现象的频度链,那么对揭示这种现象发生、发展和消亡的历史层次就有重大的意义。”客观准确的数据统计,对语言规律、结论的论证提供科学依据,使得定性研究更具说服力。
2.历时发展与断代描写相结合
词汇的历时动态研究中离不开共时的描写与分析,这已成为很多学者的共识。沈家煊先生指出:“跟这一趋势相关联的另一个趋势就是把共时和历时结合起来。……把共时的语义分析跟语义的历时演变结合起来,这必将大大加深我们对语义现象的认识。”
3.比较方法
“比较的方法是我们认识事物共性与个性的基本手段”,因此,从语言的单体描写走向比较研究,是语言学研究的大趋势,也是建设汉语语言学理论的必由之路。汉语词汇研究当也不例外。故本研究以不同类型词典为工具,对不同时代、不同空间的汉语词汇进行比较,在对比中发现变化与变异。