第一节 研究背景

我国是全国各族人民共同缔造的统一的多民族国家,1949年中华人民共和国成立以来,通过识别并经中央政府确认的民族共有56个,即汉、蒙古、回、藏、维吾尔、苗、彝、壮、布依、朝鲜、满、侗、瑶、白、土家、哈尼、哈萨克、傣、黎、傈僳、佤、畲、高山、拉祜、水、东乡、纳西、景颇、柯尔克孜、土、达斡尔、仫佬、羌、布朗、撒拉、毛南、仡佬、锡伯、阿昌、普米、塔吉克、怒、乌孜别克、俄罗斯、鄂温克、德昂、保安、裕固、京、塔塔尔、独龙、鄂伦春、赫哲、门巴、珞巴和基诺族。其中,汉族人口占绝大多数,其他55个民族人口相对较少,习惯上称为“少数民族”。根据2010年第六次全国人民普查的数据,大陆31个省、自治区、直辖市和现役军人的人口中,汉族人口为1225932641人,占91.51%;各少数民族人口为113792211人,占8.49%。[1]

汉语是目前世界上使用人口最多的语言,也是联合国6种正式工作语言之一。汉语普通话和规范汉字是我国的国家通用语言,汉族共同语的标准语,也是我国各民族之间族际交流的共同语。20世纪50年代以来,我国各级政府在大力推广汉语普通话和规范汉字的同时,一直坚持和贯彻“各民族一律平等”的宪法原则,尊重和保护各少数民族使用和发展本民族语言文字的自由,通过一系列的法律、规划和举措,帮助和促进少数民族语言文字的学习、使用和发展。目前,中国55个少数民族中,除回族、满族已全部转用汉语外,其他53个民族都仍保留有本民族的传统语言。有些少数民族内部不同支系还使用着不同的语言。语言是一种复杂的社会现象,要准确区分某种语言具有单独的语言地位还是属于某种现有语言的方言是非常困难的事情,由于对语言文字识别和界定所使用标准严格程度不同、对语言文字谱系划分的方案不同等原因,国内相关研究机构对少数民族语言文字种类的统计数据不尽相同。根据我国中央人民政府官网和教育部网站公布的数据,由于有的少数民族内部同时使用几种不同的语言文字,我国56个民族共使用72种语言,54种文字。[2]根据中国社会科学院民族学与人类学研究所孙宏开、胡增益、黄行等学者推动,国内少数民族语言学界的90多位专家参与编写的《中国的语言》一书的研究结论,截至2007年6月,我国56个民族正在使用的语言总数为129种,其中的绝大多数语言的使用状况堪忧,已经濒危的21种,迈入濒危的64种,临近濒危的24种,丧失交际功能的8种。[3]根据国务院新闻办2009年公布的数据,我国55个少数民族中的53个民族有本民族语言,22个民族有本民族文字,22个少数民族共使用28种文字,其中壮、布依、苗等12个民族使用的16种文字是由政府帮助创制或改进的。中国少数民族约有6000万人使用本民族语言,占少数民族总人口的60%以上,约有3000万人使用本民族文字。[4]因此,到目前为止,我国语言学界和相关政府机构对于我国境内正在使用的语言文字的种类和数量还没有完全准确、权威的数据,一般认为,56个民族正在使用的语言在100种以上,正在使用的文字在30种左右。[5]

从语言的系属来看,全国56个民族所使用的语言分别属于汉藏语系、阿尔泰语系、南岛语系、南亚语系和印欧语系。汉藏语系又可分为汉语和藏缅、苗瑶、壮侗三个语族,属于藏缅语族的有藏、门巴、仓拉、珞巴、羌、普米、独龙、景颇、彝、傈僳、哈尼、拉祜、纳西、基诺、怒苏、阿侬、柔若、土家、载瓦、阿昌等语言;属于苗瑶语族的有苗、布努、勉、畲等语言;属于壮侗语族的有壮、布依、傣、侗、水、仫佬、毛南、拉珈、黎、仡佬等语言。阿尔泰语系分为蒙古、突厥、满—通古斯三个语族,属于蒙古语族的有蒙古、达斡尔、东乡、东部裕固、土和保安等语言;属于突厥语族的有维吾尔、哈萨克、柯尔克孜、乌孜别克、塔塔尔、撒拉、西部裕固等语言;属于满—通古斯语族的有满、锡伯、赫哲、鄂温克、鄂伦春等语言。此外,属于南亚语系的有佤、德昂、布朗等语言;属于南岛语系的是高山族诸语言;属于印欧语系的是属斯拉夫语族的俄语和属印度—伊朗语族的塔吉克语。朝鲜语和京语的系属尚未确定。

文字是语言的记音符号,有了与语言相对应的文字,语言才能在更大的范围、更长的时间周期内进行传播,语言所承载的文化元素才能得到较好的传承与发展。汉字是国际活动中代表中国的法定文字,它不仅是汉族使用的文字,也是全国各少数民族通用的文字。全民族都通用汉语的几个少数民族,很自然地以汉字作为自己的文字,没有与自己语言相一致的文字的少数民族,大多也选择了汉字作为自己的交流文字。目前,中国55个少数民族中,除回族、满族的主体(回辉语、满语除外)不使用自己民族的文字外,有29个民族有与自己的语言相一致的文字。藏、蒙古、维吾尔、朝鲜、哈萨克、柯尔克孜、彝、傣等民族都有本民族的传统文字,藏文、彝文等少数民族文字已经有一千多年的历史,其他文字也都有几百年的历史。这些少数民族文字大部分已经有比较规范的习惯用法,使用范围较广,社会影响也较大。为了支持只有语言、没有文字的少数民族保存并发展本民族文化,我国政府千方百计地帮助其创制和推广新文字。20世纪50年代,政府组织语言学专家、少数民族知识分子先后为壮、布依、彝、苗、哈尼、傈僳、纳西、侗、佤、黎10个民族制订了14种拉丁字母形式的文字方案,其中,分别为苗语的不同方言制订了4种文字方案,为哈尼语的不同方言制订了2种文字方案;后来又为景颇族的载瓦支系制订了拉丁字母形式的载瓦文方案,为土族制订了拉丁字母形式的土文方案。20世纪80年代,政府根据部分少数民族的要求,组织语言学专家学者为白、独龙、土家、羌、基诺等少数民族设计了拼音文字方案。目前,苗文和壮文等新创少数民族文字的使用人数已经较多,并已在这些民族社会生活中产生较大的社会影响。

就法律地位而言,各民族语言文字都是平等的,然而由于成熟程度、人口规模等因素的制约,少数民族语言文字的使用现状却呈现出非常复杂和多样的特征。就目前而言,我国少数民族语言文字的使用现状大致可以分为以下三种类型。第一种,高度活跃的语言文字,如蒙古、藏、维吾尔、哈萨克、朝鲜等族,有大片聚居区,人口均在百万以上,文字历史也比较悠久,他们的语言除了在家庭内部、邻里亲友间使用外,还在本民族的政治、经济、文化、教育各个领域中使用,甚至在一些邻近的或者杂居在一起的其他民族中使用。第二种,中度活跃的语言文字,如彝族和傣族,他们虽然也有成片的聚居区,有传统的文字,但是文字没有统一的规范,方言差异也较大,本民族的语言在社会上的应用不如蒙古、藏、维吾尔、哈萨克、朝鲜等民族那么广泛。例如,壮语和傈僳语、拉祜语、景颇语、载瓦语由于语言内部差别较大,全民族通用的共同语还没有形成,文字的使用范围也很小,语言使用情况与彝语、傣语接近。第三种,活力降低的语言文字。民族的语言只在本民族内部日常生活中使用,在政治生活、学校教育中往往使用其他民族的语言(主要是汉语,有些地方也使用其他少数民族语言);没有与本民族语言相一致的文字,一般使用汉字。属于这个类型的少数民族语言相当多,占我国少数民族语言文字总数的四分之三以上,使用人口占少数民族总人口的一半以上。

从政府语言文字工作角度来看,上述三类不同的少数民族语言文字对应的管理需求和政策导向是不同的。语言并非单纯的交流工具,同时也是民族文化的载体,任何一种自然语言的产生和演进都是长期积淀的结果,是特定语言文字相对应的民族文化的载体。任何一种语言的衰亡,同时意味着蕴藏在这种语言背后的文化和知识也随之消失在历史的长河之中了,这对人类文化而言是巨大的损失。对于活力降低甚至已经濒危的少数民族语言文字,当前管理工作的主要任务是采用科学的理论和方法进行抢救性保护,采用数字化技术采集这些语言文字的语音信息,以备这些语言文字出现传承风险的时候作为恢复和研究的依据。例如,国家语言文字工作委员会2015年5月启动的“中国语言资源保护工程”(简称“语保工程”)就是一个由政府组织的大型语言文化工程,也是目前世界上最大规模的语言资源保护工程。“中国语言资源保护工程”旨在利用现代化技术手段,收集记录汉语方言、少数民族语言和口头语言文化的实态语料,通过科学整理和加工,建成大规模、可持续增长的多媒体语言资源库,并开展语言资源保护研究工作,形成系统的基础性成果,进而推进深度开发应用,全面提升我国语言资源保护和利用水平,为传承中华优秀传统文化、促进民族团结、维护国家安全服务。[6]

与此同时,对于具有高度和中度活力少数民族语言文字的管理,则更多的是要在确保国家通用语言文字法律地位的同时,保护少数民族人口使用和发展本民族语言文字的权利,促进少数民族语言文字在民族地区社会生活中的应用和发展,探索少数民族语言文字与国家通用语言文字和谐共存的政策和措施。与其他地区不同的是,我国民族地区公共信息管理需要同时兼顾推广国家通用语言文字和保护民族地区语言文字多样性的双重任务,这种特殊性就决定了我国绝大多数民族地区的信息生态必然是以多语言、多文字为基本特征的,如何通过管理和技术的变革削减语言文字多样性带来的沟通交流障碍,促进多民族语言信息资源的共享,成为民族地区公共文化服务必须面对和解决的问题。在上述过程中,承担着社会文化服务职责的公共图书馆、公共档案馆、公共博物馆、公共美术馆、公共纪念馆、公共文化馆等机构需要结合各自的业务特征,积极探索促进多民族语言信息资源共享的模式与策略,推动民族地区公共文化服务的创新。

20世纪80年代以来,伴随着全球范围的信息化建设浪潮,以蒙古文、藏文、维吾尔文、哈萨克文、柯尔克孜文、朝鲜文、壮文、彝文、傣文等为代表的少数民族语言文字计算机信息处理技术也逐步发展成熟,少数民族文字版本操作系统、文字处理软件、办公自动化系统、编辑出版系统开始在民族地区得到应用,一大批少数民族文字网站或者现有网站的少数民族文字版开始在互联网上亮相。当前,少数民族语言文字信息处理技术正在由基础代码录入、显示和排版向着基于语义信息的深度处理过渡。现代信息技术的介入,使传统必须依靠人工翻译等方式实现的跨语言信息交流具有了更多的实现形式,为数字化环境下中华民族多元一体架构的实现提供了更为广阔的空间。