民族语文信息处理学科发展与成就——西南民族大学民族文字信息处理实验室巡礼
摘要:在民族语言文字信息处理领域中,彝、藏、傣、纳西、羌、花瑶等已取得了一系列具有开拓性的研究成果。相关成果在国内、国外的学术界产生了较大的影响。民族语言文字信息处理一直是西南民族大学的特色与优势研究方向,为民族语文工作的现代化、信息化的全面开展提供了强有力的技术支撑。现已成为国内具有鲜明学术特色的民族语言信息处理技术研发与人才培养基地。
关键词:民族语文;信息处理;学科发展;成就
一、西南民族大学民族语言信息实验室概述
(一)西南民大民族语言信息处理实验室创立人——沙马拉毅
沙马拉毅,西南民族大学副校长;西南民族大学校党委常委;《民族学刊》杂志原主编;西南民族大学民族文字信息技术处理实验室主任;是著名民族语言信息处理专家;二级教授、博士生导师;1992年被评为国务院特殊津贴专家;现任四川省文联副主席;四川省美术家协会会员;中国民间文艺家协会副主席; 中国少数民族语言文字信息处理学会常务理事。全国彝语术语标准化工作委员会主任;四川省学术技术带头人;国务院学位委员会学科评审组成员;国家民委民族语文专家咨询委员会专家;计算机彝文“沙马拉毅输入法”的发明者,曾获得“钱伟长中文信息科学技术奖”;2003年获得了彝文信息处理国家专利。沙马拉毅从1984年至今,一直不离不弃的从事着民族文字信息处理工作。
(二)实验室的成立与发展
实验室建立之初,以文字语言信息研发为主;之后,在文字语言信息基础上,语言文化数据库建设为主。在民族语言文字信息处理领域中,彝、藏、傣、纳西、羌、花瑶等语言数据处理已取得了一系列具有开拓性的研究成果。时任国家民委主任,现任全国政协副主席的王正伟视察西南民族大学时说:“西南民族大学在许多方面走在了教学改革的前面,特别是在藏、彝文信息处理方面取得了开拓性的成果。”相关成果在国内、国外的学术界产生了较大的影响。民族语言文字信息处理一直是西南民族大学的特色与优势研究方向,为民族语文工作的现代化、信息化的全面开展提供了强有力的技术支撑。现已成为国内具有鲜明学术特色的民族语言信息处理技术研发与人才培养基地。实验室是1995年国内最早从事民族语言文字信息技术研发的科研单位之一。也是中国西南少数民族语言资源库建设基地(与中国社科院共建)、全国彝语术语标准化工作委员会等也挂靠实验室建设与管理。
二、民族语言信息处理学科发展成就
(一)人才培养
实验室在国家级特色专业少数民族语言文学相关专业的基础上,开创了民族文字信息处理专业。相继开设了民族语言文字信息处理本科和硕士研究专业,在学校民族学博士点和本科设置了计算机民族文字信息处理技术课程,形成了较为完整的专业人才培养体系。
1995年以来,共培养了包括彝族、汉族、藏族、蒙古族、白族的52位信息处理硕士研究生,108位民族文字信息处理专业本科毕业生;其中 8人获得国家级奖学金,9人获得校级优秀研究生、优秀毕业生等荣誉称号,民族文字信息处理实验室已成为四川省高校民族语言文字信息处理的重点实验室,成为四川省民族文字信息处理人才培养重要基地。
就读“民族语言文字信息处理”专业毕业的硕士研究生中,现就业于西南民族大学、贵州大学、贵州民族大学、云南民族大学、红河学院、西昌学院、昆明医学院、云南师范大学等高等院校。 且都成为了该单位的中坚力量。还有的毕业生在部队、公安、法院、新闻、乡政等单位工作。 他们都在自己的岗位上各自承担着自己的职责,成为各界的工作技术骨干。
(二)实验室建设成就
1、获得国家重大资金资助
在沙马拉毅教授的带领下,实验室长期致力于民族语言信息化建设的研究与教学工作中。实验室先后3次获得了共计1080万元的国家财政部实验室专项建设与经费建设的支持。使实验室的设备一直处于先进行列。2010年被评为四川省高等院校重点实验室。
从“1999年就将1165个彝文字符、43个声母和10个韵母的拉丁字母输入码、笔画输入码及其在计算机键盘的布局申报了国家专利。经过4年的审查审定,于2003年“计算机彝文输入码及其键盘”获国家专利;专利号:ZL00112801.9,证书号:第117415号。”
2、科研方面
实验室在民族文字信息处理技术研究方面取得了科研成果80余项研究。其中有“国家自然科学基金项目”1项;“国家社会科学基金项目”2项;“主持制定了彝文信息处理中华人民共和国标准”3项;“主持制定了彝文信息处理国际标准”1项;“获得国家专利”1项,“获得省部级科研项目”12项,“合作开发项目完成了”8项,“获得省部级以下项目”26项,“获得省部级以上教学科研成果奖”11项;现已发表“相关学术论文”100余篇;目前在研项目有17项。分别是1项“国家社科基金重大项目(中国彝文古籍的整理保护与数据化建设)”;1项国家语委重点项目;1项“国家社会科学基金重大专项子课题”,8项“省部级科研项目”,15项“厅局级项目”等。
其中省部级以上主要科研项目:
(1)国家社会科学重大招标项目1项《中国彝文古籍文献整理与保护及其数字化建设建设》(编号:13&ZD142);
(1)国家自然科学基金项目有1项,即《彝文信息处理及标准彝文字符集与编码的研制》,已经研究完成;
(2)国家社科基金项目有2项,即《彝语语料库的研究与建设》和《汉彝对照标注词库的建设》,2个项目兼已研究完成;
(3)国家语委重点项目《国产多语种桌面操作系统通用规范研制项目》(合作)(编号:ZDA135-6)
(4)教育部项目有7项。已经研究完成项目有4项:即《彝语声学参数数据库的研究与建设》、《彝族传统医药术语整理及规范》、《彝语人名汉子音译撰写规范》、《彝语常用术语汉子转写规范标准研制》等,在研项目有3项:即《高校彝汉双语教材数字化建设》、《彝汉双语教材建设与人才培养研究》、《彝语方言综合资源数据库的建设研究》等;
(5)国家民委项目有3项,兼已经研究完成。即《藏、彝文全文献数据库》、《信息处理用规范彝文分词系统的设计与实现》、《少数民族语言水平测试标准研究(彝语文)》等。
(6)四川省社科规划项目有2项,即《彝文文献数据库》、《羌语语音数字化资源库建设》等。
(7)四川省教育厅科研项目有1项,即《汉彝对照电子词典》已经完成研究。
(8)国家社会科学基金重大专项子课题有1项,即《彝族史诗<勒俄>(四川省甘洛县)》。
(19)国家民委重点研究基地重点项目有1项,即《彝语方言基础词汇综合语料库的研究与建设》。
(10)四川省社科项目有1项,即《彝语方言综合资源库的建设研究》。
3、主要科研成果
主要科研成果有31项:《WYIN彝文系统》;《ZWIN藏文系统》;《DWIN傣文系统》;《中小学教材汉彝对照电子词典》;《基于颠川黔桂古彝文系统》;《彝语元音声学参数库》;《通用彝文系统》;《彝文智能输入系统》;《藏文智能输入系统》;《纳西东巴文输入系统》;《彝语基础例句语料数据库》;《彝语分词、词性标注加工规范》;《汉彝对照词性标注系统》;《信息处理用彝、汉语平行语料库》;《彝语六大方言语音库》;《中国彝文典籍译丛电子多媒体光盘》;《跟我学彝语多媒体教学软件》;《规范彝文字词频统计系统》、《彝语基础例句预料数据库》;《彝语分词、词性标注加工规范》;《方正unicode彝文系统》;《方正彝文书版系统》;《彝、藏文手写手机》;《彝、藏文智能手机》;《彝、藏、傣语言学习平台》;《花瑶语音资源库》;《藏语尔苏语音数据库》;《藏语嘉绒语音数据库》;《藏语动词一词多义语料库》;《彝语在线语料库》;《彝文手写识别技术》等。
4、民族语言数据库的建设
实验室与中国社会科学院语言所合作,建立了《彝语六大方言的语言数据库》、《藏语、藏语加绒语、尔苏语》、《羌语》、《花瑶语》等语言数据库。
5、获得省部级成果奖
1994年《信息交换用彝文编码字符集》获四川省第六次哲学社会科学优秀科研成果三等奖,《信息交换用彝文字符15×16点阵字模集及数据集》获得四川省人民政府社科三等奖;1997年《加强考试管理的有效探索与实践》获得四川省人民政府教学成果二等奖;2000年《计算机彝文输入法》获得四川省人民政府三等奖,出版专著《计算机彝文信息处理》,《计算机彝文字输入方法及其键盘》获得国家专利证书;2001年《关于对学生进行前综合素质强化培养的实施方案》获得四川省政府教学成果三等奖;2002年《计算机彝文字输入方法及其键盘》国家专利获得国际尤尼卡金奖;2003年《彝族文学概论》获得四川省巴蜀文艺一等奖《计算机信息处理彝文输入编码》,获四川省科技进步三等奖;《计算机彝文字输入方法》,获第五十一届尤里卡世界发明博览会金奖;《计算机彝文信息处理》,获四川省第十次哲学社会科学优秀成果三等奖;《四川民族地区少数民族语言文字应用的调查报告》,获国家民委社会科学研究成果奖调研报告三等奖;《计算机彝文信息处理系统及系列研究成果》,获钱伟长中文信息处理科学技术奖二等奖;《彝语语料库的研究与建设》,获四川省第十六次哲学社会科学优秀成果奖二等奖;《彝语言文学专业多语教学的改革与实践》,获四川省教学成果奖一等奖;《彝语古籍经典选译(1-3卷)》,获四川省第十七次哲学社会科学优秀成果奖三等奖。
2015年,计算机彝文系统成果获得“钱伟长中国中文信息处理科学技术奖”等。
实验室的民族文字信息处理受到社会各界的高度关注。原中央政治局常委、中央书记处书记、中央党校校长刘云山,原中国中央政治局委员、中宣部部长刘奇葆,全国政协副主席孙孚凌、原国家民委主任王正伟、原四川省政协主席冯元蔚,国家民委副主任陈改户、原四川省副省长张作哈、原国家民委副主任吴仕民、国家民委、教育部、西藏自治区、青海省等有关领导和专家先后视察了实验室,并对实验室取得的成果都给予了很高的评价。
实验室团队因各项工作落到实处、成绩突出,2016年被西南民族大学遴选为“共产党员示范团队”称号、2017年荣获“民族团结进步先进集体”称号等。
中央电视台、中国民族报、华西都市报、四川新闻报、人民网、新华网、国家民委网站、教育部网站等多家媒体和权威网站多次对实验室完成的科研成果进行了专题报道,给予了很高的评价,一致认为实验室研究工作为民族语言与传统文化的传承、创新发展提供了新的理论与实践探索。
(三)社会服务
高校要为社会作出贡献。为了结合规范彝文的进一步规范完善工作,实验室将计算机规范彝文系统扩充到5589个彝文字符。实现了通用规范彝文的计算机系统化。实验室一直在推进民族地区的信息化标准建设,主持制定了计算机彝文信息处理中华人民共和国国家标准3项,国际标准1项,先后完成了《通用规范彝文》、《彝族传统医药术语整理及规范》、《彝语人名汉子音译转写规范》等规范的制定,为彝语文的规范化、标准化提供了依据,也为彝语文的应用和推广起到了积极的引导作用。实验室研究工作与社会需求一直结合紧密,研发的藏、彝、傣文手机,民族语言学习平台(藏、彝、傣、花瑶),被誉为“民族语文发展进程中的里程碑”,使历史悠久的藏、彝、傣族传统文化与移动通信技术相结合,为藏、彝、傣等民族语言文字向科技化、信息化迈进开辟了一条新路。把藏、彝、傣语言文字的现代化传播手段带进了现代化的通讯时代。完成的“彝语语料库”、“彝语双语对照词汇语料库”是第一个大规模的彝语语料资源库,为彝语言教学、信息处理、科学研究等多方面提供丰富、翔实的语言数据。完成的藏语加绒语音数据库、羌语语音数据库、藏语尔苏语音数据库、花瑶语音数据库,为少数民族语言实验语音学研究工作的进一步开展奠定了丰富的语言数据基础。完成的彝文手写识别技术是彝族文化发展事业中的意见大事,标志着语言文字进入现代信息处理领域,有力地推动了民族文字和传统文化的保护和发展。
坚持为民族地区信息化建设、发展服务的宗旨,根据学校一体两翼发展规划,坚持走特色、内涵发展的道路,在民族语言信息处理领域开展多学科交叉的创新实践研究,同时与民族地区信息化建设、民族语言与文化传承、数字化建设等社会现实需求紧密结合,探索在云计算、大数据、互联网时代民族传统文化的保护、传承的理论与技术支撑,通过形式新颖、凸显特色、主题鲜明的信息化研究成果,来立体化呈现、弘扬、传承优秀的民族传统文化。
在民族语言信息处理系统开发、语言资源库建设、古籍文献数字化建设、语言自然理解等方面呢进一步开拓研究领域,在语言资源深度挖掘、智能化方面取得进一步突破,实现从对“民族语言字符形式的计算机处理”到对“民族语言语义层面上的信息知识的智能挖掘和处理”的转变、实现“视觉处理”和“听觉处理”的两条研究方向的齐头并进,为实现“字符处理”到“语义处理”打下坚持的基础;同时借助新的信息处理技术扩展民族语言文字信息技术的应用范围,逐步开展通讯终端的APP运用技术开发,拓展实验室的基础研究能力,使之成为能解决民族语言的实际应用、信息化建设进程中的基础性问题的研发与人才培养基地,成为发展少数民族地区科学、技术、文化,促进社会进步的新型科研实验室。
我们相信,在沙马拉毅教授的带领下,西南民族大学中文信息处技术团队根据中文信息处理的理论和方法,在大数字的新时代,随着大数据的建设和应用,实验室正在研究云平台等现代应用研究。
通过彝-族-人-网,你可以阅尽千里彝乡,略万种风情,宣传彝族文化,从我们自身点滴做起。