彝文信息处理技术与彝语文现代化研究
摘要:彝语言文字是彝文信息和知识的载体,因此彝文信息处理技术的发展水平是关乎彝语文现代化、信息化的大事。从上世纪80代起,彝文信息处理研究就取得突破性进展,进入21世纪后彝文信息处理技术的各项成果如春笋般涌现,已经形成了一套完整的彝文信息处理技术体系,同时彝文网站也相继开通使用,这些都极大地推动了彝语文的发展与推广。
关键词:彝语文;现代化;彝文信息处理
一、前言
彝族是我国民族大家庭中人口较多的一员,据2010年统计,共有900多万人。分布在云南、四川、贵州、广西四省区。彝语属汉藏语系藏缅语族彝语支,分为六大方言区。彝语文现代化就是现代化时期的彝语文建设,彝语言文字是彝文信息和知识的载体,因此彝语言文字信息处理技术的发展水平是关乎彝语文现代化、信息化的大事。彝语文经历了漫长的发展历程,不断走向成熟,彝语文现代化、规范化的早期工作及其成果为后来的彝文信息处理技术的发展奠定坚实的基础。
二、彝语言文字的规范化、标准化为彝语文的信息化、现代化奠定了基础
彝语分为六大方言区,由于内部差异较大,使彝文在读音、写法、表义上产生了分歧,同样一个字形,不同的地方有不同的音、不同的写法及不同的意义。要发展彝文,使之在新时期发挥作用,就得对彝文进行必要的整理、规范,于是1980年在征求各方意见的基础上,国务院以[1980]70号文件批准推行《彝文规范方案》:规定了以彝语北部方言的圣乍语为基础方言,以喜德语音为标准音,规定一字一音,819个字加次高音符号的字以及一个替音符号,共1165个字符(核心部分);书写一律从左到右横排;还确定使用国际通用的阿拉伯数字和彝文原有的数字等内容。2010年11月在成都召开的全国彝语术语标准化工作委员会第二次术语审定会定了滇川黔桂民委、民语委根据滇、川、黔、桂四省区彝学会提出的《关于进一步完善规范彝文的建议》而制定出来的拼音方案和通用的规范彝文标准方案:即,在国务院批准的规范彝文的43个辅音和10个元音的基础上增加6个辅音,成为全国通用彝文拼音方案,即:49个辅音和10个元音。这一方案涵盖了四省区共同整理规范出来的5598个彝文字,并且把这5598个彝文字确定为通用规范彝文标准文字。
从实践证明来看,彝文规范方案推行后,已经培养了一大批彝语文专业人才,彝语文也得到了广泛使用,有力促进了彝族地区经济、文化等社会各项事业的发展,这也是我国对少数民族文字进行必要规范改革的一个成功的典型例子,同时也为彝语文的现代化、信息化的发展奠定了坚实的基础。①
三、彝文信息处理技术的开发与实践
(一)20世纪80年代彝文信息处理技术的开发
1982年开发了《PGYW彝文计算机》;1984年,开发了《微型计算机彝文处理系统YWCL》,并于1984年10月27日通过了省级专家技术鉴定,1985年获四川省科技进步奖;1986 年,《计算机激光彝文/ 汉文编辑排版系统》,通过了电子工业部和国家民族事务委员会共同主持的部级专家技术鉴定。该系统是我国首次运用激光照排技术进行少数民族文字处理的编辑排版系统。1986年5月在北京“全国‘六五'期间科学技术攻关项目展览会”上荣获国务院电子振兴办公室颁发的优秀科技成果奖;1985 年,中国计算机技术服务公司、华北终端设备公司和北京民族印刷厂合作,开发了《CMPT -Ⅱ大键盘彝文系统》,曾用于六届四次全国人大文件印刷;1986 年,中国计算机服务公司和北京民族印刷厂合作,在华光Ⅱ型上开发成功《华光Ⅱ型彝文、汉字、西文计算机激光照排系统》。
(二)20世纪90年代彝文信息处理技术的开发
1992 年,国家技术监督局颁布实施了沙马拉毅教授为主要起草人制定的国家标准《信息交换用彝文编码字符集》、《信息交换用15×16彝文点阵字模集》等多项规范彝文信息处理国家标准,从而使彝文信息处理工作得到了顺利发展。1992 年,《北大方正彝文激光照排系统》研制成功,是我国首次运用激光照排技术进行少数民族文字处理的编辑排版系统,也是当前报社、出版社、印刷厂等主要使用的彝文信息处理系统。1997年国务院批准的《信息交换用彝文24×24点阵字模集及数据集》以2000版的国际标准《多八位彝文编码字符集》等的颁布,为古老的彝文字汇入现代信息浪潮奠定了坚实的基础,研制出的计算机彝文输入法被应用于计算机彝文激光照排系统,填补了我国少数民族信息处理的一项空白,该项成果在北京科学会堂的鉴定会上,被两院院士王选命名为“沙马拉毅输入法”。1998 年,在滇、川、黔、桂四省(区) 彝族古籍整理协作会第六次会议上通过了“将国务院批准的四川规范彝文作为我国彝族统一文字的会议纪要”。至此,计算机彝文信息处理事业得到了迅猛发展。
(三)21世纪初彝文信息处理技术的开发
2000年后彝文信息处理技术的各项成果如春笋般涌现,从开始只能对单字的处理到现在的词汇处理,从文书编辑到电子彝文出版系统,已经形成了一套完整的彝文信息处理技术体系:2003年 “计算机彝文输入码及其键盘”获国家专利;2005年研制出的“中小学汉彝对照电子词典”和“彝文文献全文数据库研究与开发”均填补了国内相关方面的空白;2006年西南民族大学与北大方正合作开发的UNICODE彝文系统问世,计算机彝文字体从开始的2种发展到现在的白体、黑体、细黑体、宋体、仿宋体、综艺体、圆头体、手写体等8种字体;2007年西南民族大学与北大方正合作研发的彝文书版研发成功;2008年完成了“彝语六大方言语音库”的建设;2008年研制出的“彝汉双语平行语料库和术语库”是我国,也是世界上,第一个针对彝语和汉语的平行语料库和术语库;2009年研制出的“彝语语料库”是我国,也是世界上,第一个大规模的彝语语料资源库;2009年西南民族大学与中国社会科学院民族学与人类学所合作“彝语声学参数数据库”的研制成功,开创了彝语实验语音学研究的先河,也为西南少数民族语言实验语音学研究工作的开展进行了有意义的探索;②2009年研制成功彝文手机,被誉为“彝语文发展进程中的里程碑”,使历史悠久的彝族传统文化与移动通信技术相结合,为彝语言文字向科技化、信息化迈进开辟了一条新路;③2009年11月,全国彝语术语标准化工作委员会的成立,对进一步推动滇、川、黔、桂四省区彝语文全面规范化、标准化、信息化进程,促进彝语文信息化建设的健康发展具有重要的现实意义。
此外,2010年彝汉双语词语标注语料库和彝汉人名汉字音译数据库、彝族传统医药术语数据库的设计完成,以及2011年彝、汉、英三语平行语料库、通用彝文系统,2012年彝文智能输入法、彝文安卓智能手写手机等等的设计完成都为彝文信息处理技术的发展奠定了一个坚实的基础。
(四)彝文网站的开发与建设
2000年,由西南民族大学沙马拉毅教授主持研发的“彝文视窗平台”的完成,内容涉及系统平台、文字处理、彝文网站、彝文多媒体等,其中“彝文系统处理软件”具有文字信息处理软件的各种功能,能支持多文种的信息处理平台,使得古老的彝文进入了计算机信息处理世界,为彝文的网络化、信息化奠定了坚实技术基础,与此同时,中国第一个彝文网站—西南民族大学彝学网站建设成功,在互联网上第一次用彝、汉、英三种文字系统地宣传介绍了彝族悠久的历史、语言、文字、风俗等。彝学网站的建立、开通与彝文多媒体软件(如:轻松学彝语、跟我学彝语、在线学彝语等)的研制应用,为彝族地区经济、社会、教育、科技、文化的繁荣发展,为彝民族与世界各民族的信息交流开创了新的途径。进入21世纪后,彝文网站开始逐年增多。目前,国内已经开通的彝文网站还有人民网(彝文版)、中国彝学网(彝文版)、彝族人网(彝文版)、彝语在线等彝文网站。
四、彝文信息处理技术的开发推进了彝语文现代化的进程
随着计算机应用的不断普及,信息时代的到来,人们在日常生活中有大量的信息需要储存、传递和处理,用计算机实现信息的处理已经势在必行。中国在各民族地区实行民族平等的双语或多语政策,这为中国少数民族文字信息处理的现代化提供了基本的政治条件,当前,中国少数民族文字信息处理已获得喜人的发展。计算机彝文信息处理也是在这样的环境下,产生并发展壮大起来的。从前文的论述中可以将彝文信息处理技术的成果概括起来归纳为如下几个方面:
1.彝语文现代化取得丰硕成果,有关彝语文的规范化、信息化建设的一系列的国家法规、标准及规范已经形成。
2.彝文信息处理技术已达到实用化水平,并在实际应用中日趋成熟。
3.已建设完成一批颇具影响的信息处理用彝语言资源库,部分彝文信息处理技术已在实际应用中发挥作用。④
语言文字是人类最重要的交际工具,人们在运用语言的过程中不断改善和扩大它的交际职能,这样也就促成了语言文字的变化和发展。而电子计算机的出现,加速了语言文字现代化的进程。彝语文在计算机信息处理方面的开发应用,不仅标志着彝语文社会功能在这一领域扩展,而且为彝语文的繁荣和发展,为彝语文的现代化开辟了广阔的前景,这有利于促进彝族地区的政治、经济、文化的全面发展,主要体现在以下几个方面:
1.改变了传统的彝语文的教育与教学方法,促进了彝语文教育、教学手段的信息化与现代化。
2.使得古老的彝文告别了“铅与火”的时代,走进了“光与电”的时代。
3.“沙马拉毅输入法”、“彝文办公系统”、“彝文手机”、“彝文网站”、彝文短信播报”等等,解决了在信息时代几百万彝族同胞使用信息化工具进行彝语交流的问题,也为推广和普及彝文奠定了技术基础。
4.彝语语料库、彝汉双语对照标注词库、彝语方言资源数据库、彝语例句检索语料库等为开展彝语言文字的相关研究提供必要的语料基础。⑤
但由于彝文信息处理技术的研究起步相对晚,加之彝语文在计算机信息处理技术方面还相对落后于汉文信息处理、蒙古文信息处理、藏文信息处理等等,但可以预计随着彝区经济文化的发展,彝文信息处理技术的应用也必将得到更大范围的应用与发展,例如:在彝族地区特别是不通汉语的民族地区大力推进彝汉双语教学,也成为我国深化改革,加快发展民族教育的政策措施之一。由此可见,在彝族地区全面实施现代化远程教育,坚持实行双语教学的新形势下,普及和使用彝文信息技术就显得十分重要。
五、加大彝文信息处理技术研发力度,更好、更快地促进彝语文现代化
我国的语言文字信息处理技术的高速迅猛发展,有力地推动了彝文信息处理技术的不断发展,很多外文和汉字信息处理中的技术,在彝文信息处理技术的开发研究中可以借鉴和参考,有的还可以直接利用。这样给彝文信息处理创造了条件,大大加快了彝文信息处理技术的进展。近年来,国家有关部门对彝语言文字的信息处理事业给予极大的关怀和支持,比如国家自然科学基金、国家社科基金、教育部科研项目、国家民委科研项目、国家民族语言文字规范标准建设及信息化项目等重大课题的资助中都对给予了很大的支持,显示了国家和政府相关部门对彝文信息处理领域的高度重视,也充分表明了彝文信息处理技术的发展还有巨大的潜力。
当今世界已经进入信息网络时代,全信息化是社会发展和科技进步的主流。语言文字信息处理是专业范围应用最广泛、用户人群最众多、数据量最大的一个领域,计算机在多民族国家的应用,都面临扩充当地民族语言文字信息处理能力的强烈要求,而且计算机信息处理,已经不限于字符、字形的简单编辑加工,还包括词语处理、句子和篇章分析、机器翻译等多方面、深层次的加工与处理,例如:成篇文章或整个谈话内容输入计算机后,可以根据需要进行统计、自动分类、搜索、过滤和摘要;完成词法分析、句法分析、语义分析、语境分析等深层次的分析与信息处理。⑥可以预见,在信息化、网络化的未来,只有不断扩展彝文信息处理研究领域与研究方向,才能不断满足彝语文现代化发展的需求,也才会更好地促进彝文信息处理技术的可持续性发展。
六、结语
彝文信息处理技术的开发与应用不仅标志着彝语文的社会功能在这一领域的不断扩展,而且为彝语言文字的繁荣和发展,为彝语文的现代化开辟了广阔前景,对于促进彝族地区信息化的建设,宏扬优秀的民族文化等都具有重要的科学意义和社会意义。
2001年,正是互联网兴起的年代,彝-人-网团队便确立了构建彝族文化数据库的宏远目标,初心不改,坚持走下去。①沙马拉毅《规范彝文方案推行30年实践效果述评》,西南民族大学学报(人文社科版), 2010年第8期。
②王成平《彝语言信息处理的现况分析与发展前景探讨》,《西南民族大学学报》(人文社科版),2011年第2期。
③王辉《彝文进入手持通讯现代化时代》,中国民族报,2009年5月15日头版。
④王成平《彝文信息处理技术的发展历程评述》,人民论坛,2011年第3期。
⑤沙马拉毅《彝文信息处理技术三十年发展历程与展望》中文信息学报,2011年第6期。
⑥许嘉璐《现状和设想—试论中文信息处理与现代汉语研究》,中文信息学报,2001年第1期。
[参考文献]
[2]沙马拉毅.计算机彝文信息处理[M].成都:四川民族出版社,2000.
[3]冯志伟.计算机中文信息处理[M].北京:北京出版社,2001.
[5]俞士汶.关于语言信息处理技术的展望[J].计算机世界,1997(1).
[6]俞士汶,段慧明,朱学峰.综合型语言知识库的建设与利用[J] .中文信息学报,2004(5) .
[7]沙马拉毅.规范彝文方案推行30年实践效果述评[J].西南民族大学学报(人文社科版), 2010(8).
[7]王成平.彝语言信息处理的现况分析与发展前景探讨[J].《西南民族大学学报》(人文社科版),2011(2).
[9]王辉.彝文进入手持通讯现代化时代[N].中国民族报,2009年5月15日头版.
[10]王成平.彝文信息处理技术的发展历程评述[J].人民论坛,2011(3).
[11]沙马拉毅.彝文信息处理技术三十年发展历程与展望[J].中文信息学报,2011(6) .
[12]许嘉璐.现状和设想—试论中文信息处理与现代汉语研究[J].中文信息学报,2001(1).
[13]詹卫东.汉语言文字信息处理状况分析[R].
作者:王成平,西南民族大学西南民族研究院。