沙马拉毅――大凉山走出的“文明之虎”
2001年,正是互联网兴起的年代,彝-人-网团队便确立了构建彝族文化数据库的宏远目标,初心不改,坚持走下去。
他端坐在电脑前,身后围聚着好几位研究生,全神贯注于屏幕上显示的彝文信息处理新技术。他就是西南民族大学教授、博士生导师,有着杰出发明的沙马拉毅――一位出生在大凉山深处的彝族同胞,一个昔日奴隶家庭的儿子。
苦涩的岁月
1953年10月,一个婴孩出生在四川省雷波县乌觉村一间茅草房里。父母为他起名“拉毅”,“拉”即彝语中的“虎”,“毅”是文明,合起来即“文明之虎”。
这时候的大小凉山虽然解放了,但有数千年历史的彝族奴隶制仍然延续着。沙马拉毅家属于贫苦“曲诺”,在民主改革中被划为“半奴隶”成分。一间土坯墙、茅草顶的小屋,三个石条支一只铁锅形成的“锅庄”,这就是他家的全部家产。幼弱的拉毅穿着补丁摞补丁的衣服,常常饥饿地守着“锅庄”取暖。
1956年民主改革后,9岁的拉毅兴奋地走进学校。由于语言障碍,37人的班级,毕业时只剩下9人;能考取初中继续学业的只有拉毅一人。
然而,“文革”开始,学校停了课。小小年纪的拉毅拜泥瓦匠为师,砌砖、打地坪、粉刷墙壁,干了两年,后来在村里的小学校当代课教师。1971年中学复课,聪慧勤奋的小拉毅跳级了,两年读完三年的课程,并考取甘洛中学高中。毕业后,拉毅进入甘洛水电厂当了一名工人,并参加了县文化馆美术培训班。县文化馆认为他是个好苗子,便借用工作。
勇猛进取的虎
1977年12月,恢复高考的消息传到甘洛。县教育局长找到拉毅,摔下“强制令”:立即复习,参加高考!
只有八天时间,但大学梦像狂飙掀起了拉毅心中奋发的浪涛。他八天八夜读书、做习题,不松劲,不上床,困了就靠在桌上小憩一会儿。最后,他终于闯进了西南民族学院的大门,攻读彝语言文学专业。
在大学里,这头勇猛进取的虎没有一丝懈怠。他品学兼优,被选为学生会副主席;他平时少言寡语,登台却口若悬河;他待人真诚,又不乏幽默。在彝历年、火把节等节日里,拉毅身披“察尔瓦”,头饰“英雄髻”(天菩萨),放声高歌,潇洒起舞,令许多同学敬慕不已。同班同学孙国英(后成其妻子)说:“他是最优秀的。”大学毕业的拉毅,顺理成章地留校工作了。
王选定名:沙马拉毅输入法
20世纪80年代初,沙马拉毅在中央民族语文翻译局彝文翻译室工作。当时汉字印刷已迈进了“光与电”的时代,而彝文还在采用“铅与火”的生成方式。拉毅决心改变这个局面。
彝文字符的码化极为复杂困难,拉毅又使出了勇猛进取的虎劲。他骑车跑遍了成都的书店,购买了37本有关书籍攻读。现任彝文翻译室副主任的且萨乌牛回忆说:“他干工作是舍命的,彝语称‘乌果阿卡’。”
拉毅编码方案的草稿合起来有几麻袋。他最后确定:彝文编码用57个笔画单元,1165个字符,所有字符编成一套拼音码,外加一套字形码,及简码、词组码等。1985年,此项成果通过了鉴定。1986年,激光照排系统研制成功,在鉴定会上,北京大学教授王选赞扬说:“沙马拉毅输入法值得推广”。从此,这个输入法被定名并流行于世,这是中国唯一用人名定名的输入法。2003年,“计算机彝文字输入方法及其键盘”经国家知识产权局三年多审查,正式授予发明专利权。其他彝文输入技术则相形见绌,先后退出了历史舞台。
婉拒比尔·盖茨的聘用
拉毅还从事与彝文信息处理有关的软件程序设计制作,独立或合作制作了PGYW彝文系统、计算机彝文/汉文/西文系统等11个软件系统,并带领研制、起草了三项国家标准。
在信息处理领域,拉毅像一颗耀眼的新星,迅速升起。1998年4月,有关国际信息处理标准的会议在美国西雅图召开。在参观微软公司时,比尔?盖茨好奇地问沙马拉毅:“中国人的名字都是三个字,为什么你的名字是四个字?”拉毅笑答:“中国是一个多民族的大家庭,彝族人名大多数四个字,藏族人名有五个、十一个字符的,维吾尔族人名有七个字符的……”盖茨旋即对他的副总交待:立即将按三字定格处理中国人名的程序改为多字式。接着,盖茨询问了中国少数民族及文字信息处理的情况后,真诚地说:“你能不能来我公司从事中国少数民族文字信息处理技术的开发?每月薪酬8000美元。”拉毅立即礼貌地回答:“谢谢,我们中国已经具备开发的条件,我愿在国内从事技术开发。”
回国后,很多朋友都问拉毅:“为什么不跟盖茨干?”拉毅思绪万千,心潮难平:“我是新中国培养的,我不能把中国的技术拱手交给外国人,让外国人转过来赚中国人的钱。”
折桂――彝文信息处理国际标准
1994年底,国家技术监督局等四单位下达任务,由沙马拉毅带头研制《通用多八位彝文编码字符集》国际标准方案,参与国际竞争。在国外,英国、美国、德国和爱尔兰等都有学者制订了方案,竞争异常激烈。拉毅又一次鼓足虎劲,将妻子女儿劝回老家,一人关在屋里连续苦干十四天,足不出户,终于完成了任务。
1995年5月,国际标准化组织有关会议在土耳其安卡拉举行。之后四年间,又在希腊、伦敦等地连续举行了四次。拉毅一次又一次出征。经几番较量,英、美、德的方案相继退出,只剩了爱尔兰的迈克尔。在希腊,迈克尔提出以819个字符为准;在伦敦,又提出53个笔画单元“最佳”。在西雅图、东京,迈克尔继续坚持己见。沙马拉毅则据理反驳,逐步得到多数与会代表的赞同。
2000年9月,第六次会议在丹麦哥本哈根举行,要对中国方案投票表决。为此,拉毅又把自己紧闭在家十三天,写成了高水平的发言稿。会上,拉毅用流畅的英语发言,句句铿锵有力。在提问时段里,没有一声异议,连雄辩的迈克尔也闭口不言。“通过!”会议主席一锤定音,这是40多个国家和地区代表全票通过的结果。
中国胜利了!《通用多八位彝文编码字符集》国际标准,仿若在彝文信息处理的珠穆朗玛峰巅上树立的觇标,让世界的攀登者俯首与敬慕。
向更高的峰顶攀登
离校七年的拉毅回到母校,1993年晋升为教授,是其故乡雷波县及甘洛县唯一的彝族教授;2003年任博士生导师,是中国第一个彝语文博士生导师,至今也是唯一一位。他1992年获国务院政府特殊津贴,2004年被评为有突出贡献专家,被人们称为“彝族的王选”。
拉毅对学生既慈爱又严格。2005届硕士毕业生王成平说:“沙马老师常常第一个到实验室……我的毕业论文长达8万字,老师审阅五遍,提出周详的修改意见,方才通过。”
2004届硕士生李金发有一天在实验室愁眉紧锁,一言不发。拉毅多方了解,得知他有四千多元学费欠款无法交给学校,也没有路费去工作单位报到,便立即回家取钱给他,解了燃眉之急。
拉毅不愿谈自己的成绩与优点,他正默默地铆足虎劲,向彝文信息处理的高峰攀登。他先后承担了国家自然科学基金项目、社会科学基金项目和多项省部级科研项目,准备向彝文字符识别、语音处理、机器翻译高层次信息处理领域攻坚。
2001年,正是互联网兴起的年代,彝-人-网团队便确立了构建彝族文化数据库的宏远目标,初心不改,坚持走下去。
他端坐在电脑前,身后围聚着好几位研究生,全神贯注于屏幕上显示的彝文信息处理新技术。他就是西南民族大学教授、博士生导师,有着杰出发明的沙马拉毅――一位出生在大凉山深处的彝族同胞,一个昔日奴隶家庭的儿子。
苦涩的岁月
1953年10月,一个婴孩出生在四川省雷波县乌觉村一间茅草房里。父母为他起名“拉毅”,“拉”即彝语中的“虎”,“毅”是文明,合起来即“文明之虎”。
这时候的大小凉山虽然解放了,但有数千年历史的彝族奴隶制仍然延续着。沙马拉毅家属于贫苦“曲诺”,在民主改革中被划为“半奴隶”成分。一间土坯墙、茅草顶的小屋,三个石条支一只铁锅形成的“锅庄”,这就是他家的全部家产。幼弱的拉毅穿着补丁摞补丁的衣服,常常饥饿地守着“锅庄”取暖。
1956年民主改革后,9岁的拉毅兴奋地走进学校。由于语言障碍,37人的班级,毕业时只剩下9人;能考取初中继续学业的只有拉毅一人。
然而,“文革”开始,学校停了课。小小年纪的拉毅拜泥瓦匠为师,砌砖、打地坪、粉刷墙壁,干了两年,后来在村里的小学校当代课教师。1971年中学复课,聪慧勤奋的小拉毅跳级了,两年读完三年的课程,并考取甘洛中学高中。毕业后,拉毅进入甘洛水电厂当了一名工人,并参加了县文化馆美术培训班。县文化馆认为他是个好苗子,便借用工作。
勇猛进取的虎
1977年12月,恢复高考的消息传到甘洛。县教育局长找到拉毅,摔下“强制令”:立即复习,参加高考!
只有八天时间,但大学梦像狂飙掀起了拉毅心中奋发的浪涛。他八天八夜读书、做习题,不松劲,不上床,困了就靠在桌上小憩一会儿。最后,他终于闯进了西南民族学院的大门,攻读彝语言文学专业。
在大学里,这头勇猛进取的虎没有一丝懈怠。他品学兼优,被选为学生会副主席;他平时少言寡语,登台却口若悬河;他待人真诚,又不乏幽默。在彝历年、火把节等节日里,拉毅身披“察尔瓦”,头饰“英雄髻”(天菩萨),放声高歌,潇洒起舞,令许多同学敬慕不已。同班同学孙国英(后成其妻子)说:“他是最优秀的。”大学毕业的拉毅,顺理成章地留校工作了。
王选定名:沙马拉毅输入法
20世纪80年代初,沙马拉毅在中央民族语文翻译局彝文翻译室工作。当时汉字印刷已迈进了“光与电”的时代,而彝文还在采用“铅与火”的生成方式。拉毅决心改变这个局面。
彝文字符的码化极为复杂困难,拉毅又使出了勇猛进取的虎劲。他骑车跑遍了成都的书店,购买了37本有关书籍攻读。现任彝文翻译室副主任的且萨乌牛回忆说:“他干工作是舍命的,彝语称‘乌果阿卡’。”
拉毅编码方案的草稿合起来有几麻袋。他最后确定:彝文编码用57个笔画单元,1165个字符,所有字符编成一套拼音码,外加一套字形码,及简码、词组码等。1985年,此项成果通过了鉴定。1986年,激光照排系统研制成功,在鉴定会上,北京大学教授王选赞扬说:“沙马拉毅输入法值得推广”。从此,这个输入法被定名并流行于世,这是中国唯一用人名定名的输入法。2003年,“计算机彝文字输入方法及其键盘”经国家知识产权局三年多审查,正式授予发明专利权。其他彝文输入技术则相形见绌,先后退出了历史舞台。
婉拒比尔·盖茨的聘用
拉毅还从事与彝文信息处理有关的软件程序设计制作,独立或合作制作了PGYW彝文系统、计算机彝文/汉文/西文系统等11个软件系统,并带领研制、起草了三项国家标准。
在信息处理领域,拉毅像一颗耀眼的新星,迅速升起。1998年4月,有关国际信息处理标准的会议在美国西雅图召开。在参观微软公司时,比尔?盖茨好奇地问沙马拉毅:“中国人的名字都是三个字,为什么你的名字是四个字?”拉毅笑答:“中国是一个多民族的大家庭,彝族人名大多数四个字,藏族人名有五个、十一个字符的,维吾尔族人名有七个字符的……”盖茨旋即对他的副总交待:立即将按三字定格处理中国人名的程序改为多字式。接着,盖茨询问了中国少数民族及文字信息处理的情况后,真诚地说:“你能不能来我公司从事中国少数民族文字信息处理技术的开发?每月薪酬8000美元。”拉毅立即礼貌地回答:“谢谢,我们中国已经具备开发的条件,我愿在国内从事技术开发。”
回国后,很多朋友都问拉毅:“为什么不跟盖茨干?”拉毅思绪万千,心潮难平:“我是新中国培养的,我不能把中国的技术拱手交给外国人,让外国人转过来赚中国人的钱。”
折桂――彝文信息处理国际标准
1994年底,国家技术监督局等四单位下达任务,由沙马拉毅带头研制《通用多八位彝文编码字符集》国际标准方案,参与国际竞争。在国外,英国、美国、德国和爱尔兰等都有学者制订了方案,竞争异常激烈。拉毅又一次鼓足虎劲,将妻子女儿劝回老家,一人关在屋里连续苦干十四天,足不出户,终于完成了任务。
1995年5月,国际标准化组织有关会议在土耳其安卡拉举行。之后四年间,又在希腊、伦敦等地连续举行了四次。拉毅一次又一次出征。经几番较量,英、美、德的方案相继退出,只剩了爱尔兰的迈克尔。在希腊,迈克尔提出以819个字符为准;在伦敦,又提出53个笔画单元“最佳”。在西雅图、东京,迈克尔继续坚持己见。沙马拉毅则据理反驳,逐步得到多数与会代表的赞同。
2000年9月,第六次会议在丹麦哥本哈根举行,要对中国方案投票表决。为此,拉毅又把自己紧闭在家十三天,写成了高水平的发言稿。会上,拉毅用流畅的英语发言,句句铿锵有力。在提问时段里,没有一声异议,连雄辩的迈克尔也闭口不言。“通过!”会议主席一锤定音,这是40多个国家和地区代表全票通过的结果。
中国胜利了!《通用多八位彝文编码字符集》国际标准,仿若在彝文信息处理的珠穆朗玛峰巅上树立的觇标,让世界的攀登者俯首与敬慕。
向更高的峰顶攀登
离校七年的拉毅回到母校,1993年晋升为教授,是其故乡雷波县及甘洛县唯一的彝族教授;2003年任博士生导师,是中国第一个彝语文博士生导师,至今也是唯一一位。他1992年获国务院政府特殊津贴,2004年被评为有突出贡献专家,被人们称为“彝族的王选”。
拉毅对学生既慈爱又严格。2005届硕士毕业生王成平说:“沙马老师常常第一个到实验室……我的毕业论文长达8万字,老师审阅五遍,提出周详的修改意见,方才通过。”
2004届硕士生李金发有一天在实验室愁眉紧锁,一言不发。拉毅多方了解,得知他有四千多元学费欠款无法交给学校,也没有路费去工作单位报到,便立即回家取钱给他,解了燃眉之急。
拉毅不愿谈自己的成绩与优点,他正默默地铆足虎劲,向彝文信息处理的高峰攀登。他先后承担了国家自然科学基金项目、社会科学基金项目和多项省部级科研项目,准备向彝文字符识别、语音处理、机器翻译高层次信息处理领域攻坚。