贵州彝文计算机编码输入方法设计与实现
摘要:以彝文部件为码元,根据人体工程学原理,设计彝文计算机输入键位码。同时依据彝文字型结构和彝文字书写笔顺,设计彝文计算机编码输入方法,实现彝文计算机键盘输入。
关键词:彝文;编码;输入法
彝文是中国彝族固有的文字,明清以来的汉文史料称为“爨文”、“爨字”、“韪书”、“倮文”、“罗罗文”、“夷字”等[1]。从古至今,彝文记录了卷帙浩繁的民族文献,是民族传统文化的精髓。如今,随着社会信息化进程的推进及网络的普及,彝文应用的社会环境发生了巨大变化,要求彝文在面对现代化的机遇和挑战中必须寻求新的出路和发展,以适应彝文社会信息交换和日常交际的需要。在信息时代大背景下实现彝文数字化应用,是传承和弘扬民族文化不可或缺的有效途径。目前在彝文字形特征、字形结构、书写笔顺等构字要素基础之上,结合计算机编码输入文字的综合性要求,制定出一个成熟的彝文字编码输入方案是实现彝文计算机编码输入的关键所在。
本文以前期研究成果《信息技术 贵州彝文编码字符集·基本集》里的5980个彝文字为研究基础,以《贵州彝文部件系统》为研究对象,以彝文部件为码元,设计彝文计算机“形码”输入方法,解决彝文计算机输入的难题。彝文拼音输入方法不在本文探讨范围。
1 彝文部件码
古老的彝文,是一种以表意为主的、形音义结合的方块形的单音节文字[2]。彝文造字方法的基本特点是以“部首”为主导[3],彝文的字形往往可以分析出一个主体结构和若干附加符号[4]。彝文字形由部首和基本笔画组成,字型结构简单易于拆分,构字笔画间层次清晰明了,易于提起构字部件。因此,彝文字形输入方法设计采用部件码,也称为形码。彝文部件码的设计是把彝文字字形拆分为若干个构字部件,然后把彝文部件转换为输入代码,再按照计算机键位设计原则,结合彝文部件特征把彝文部件代码安排在输入键位上。因此,彝文基础构字部件是设计彝文部件输入码的基础。
贵州彝文字数量庞大,彝文整理是一个复杂的系统过程,彝文字形整理工作只能分阶段循序渐进地推进。目前,在《信息技术 贵州彝文编码字符集·基本集》研究成果基础之上,根据彝文构字规律全面、系统地整理出彝文部件,建立彝文规范部件系统,实现彝文构字部件的规范化和标准化应用,是开展彝文部件编码设计工作的首要任务。
彝文部件是由彝文笔画组成的具有组配彝文字形功能的构造单位,也叫字根、字元和字素[5]。本文采用《贵州彝文部件系统》里的181个构字部件为代码,部件笔画数目从1画至5画间不等,分为“方位倒置类、形变类、形近类和单个”4类部件,这些部件都是由彝文笔画组成的稳定结构块,这些构字部件的结构具有稳固性,不宜发生变动,具有强大的组配彝文字形的功能,符合计算机输入码的基本要件,是科学、合理的输入码。
2 键位设计
当前,虽然计算机的输入设备有多种,但是大众用户日常使用最多的还是键盘。因此,彝文键位设计尤为重要,建立彝文计算机输入平台。根据人体工学原理,对字母键盘的合理化要求是:
1) 中排字键应安排最常用的字母,上排负担其次,下排负担应最少;
2) 同一手指越排连击的次数尽量少;
3) 食指、中指、无名指、小指所负担的工作量应当依次降低;
4) 右手总负担应略大于左手总负担。
5) 打字时应尽量左右手交替[6]。
在现行英文键盘上,根据人体工学原理要求,结合彝文部件在主键盘区对彝文部件码进行合理、有效与实用的排列和分布,以期达到最佳编码速率。经笔者反复试验得出彝文键位设计应遵循以下规则:
4) 笔画数相同的部件归为同类,放置在同一键位上。在彝文部件系统中除与英文字母键外形相近的部件外,由“点、横、竖”3种基本笔画组合而成的部件很难归类,不利于键位码设计。为了解决这些部件的归类和键位设计问题,把常用笔画构成的部件按照笔画数目进行归类。这类部件可分为“2画部件组、3画部件组和4画部件组”3类,本文把30个部件分别归为3组,再把各组分别放置在相同键位上(见表1),这样就不仅便于对部件进行有序性归类,更便于部件码规律性放置。
表1 相同笔画数目部件归类表
图1 彝文键位设计图
至此,彝文部件码键位图设计工作已完成(见图1),彝文部件码在主键盘区的键位分布得出如下结论:
综上所述,彝文键盘部件码的分布完全符合彝文构字规律和人体工学原理,是科学而实用的彝文编码输入平台。
图2 彝文键位值图
3 编码方法
彝文编码是对“彝文字符集”中单个彝文字编制计算机输入码。彝文编码方法在上述彝文部件码和键位图基础上,根据“编码规则”把彝文部件按照其在不同字形中书写笔顺依次编制输入代码,本文采用传统码和简易码2种编码方法。
3.1 编码规则
彝文编码规则是指单个彝文字的编码规则,编码数为5位,即彝文书写的前3笔和末笔,最后加上彝文字结构末笔识别码。即彝文输入码 =首笔码 + 次笔码 + 第3笔码 + 末笔码 + 末笔结构识别码,其中首笔、次笔、第3笔、末笔是指按彝文书写笔顺编制彝文部件码,末笔结构识别码按其结构图和取码规则来编码。
3.2 传统码
彝文传统码完全按照彝文字的传统书写笔顺来编码,力争做到彝文计算机输入码与手写笔形相一致,不仅利于熟悉彝文用户便捷地应用彝文,对初学彝文的广大用户也有很大帮助,它是彝文传统书写方式与民族文字数字编码输入的有效结合。
按照彝文“自上而下、自左至右、先横后竖、从外到内、先中间后两边、先中间后上下、先下后上”等7种传统书写笔顺[7],对彝文构字部件进行编码,如:
3.3 简易码
按照“从上到下、从左到右、先横后竖、先主笔后附笔”的顺序对彝文部件进行编码,最大编码数5位,即简易码=首笔码 + 次笔码 + 第3笔码 + 末笔码+末笔结构识别码,这种编码方法简单,易于掌握。如:
4 末笔结构识别码
4.1 结构图
彝文造字方式以独体字、基本笔形加符号,独体字加符号和独体字加独体字为主,是基本笔形、独体字、辅助符号互相搭配溶合造字[8]。据此,大多数彝文字末笔符号依附在独体字、基本笔形符号的上、下、左、右、中、两旁、上下等位置。结合彝文字基本结构,确定彝文末笔符号可能出现在各种字型结构中的不同位置,从上、中、下、左、中、右方位制定彝文末笔结构识别码方案,末笔结构识别码共计9位(见图3),分为上左码、上中码、上右码、中左码、中码、中右码、下左码、下中码、下右码,末笔结构识别码涵盖了末笔符号可能出现在字形空间不同位置上。
图3 末笔结构识别码键位图
4.2 取码规则
以彝文字型结构为基准,对应彝文字末笔识别码结构图,确定末笔符号准确位置,再提取末笔识别码。彝文基本字型结构与末笔结构识别码对照基本如下:
1) 上下型结构与上中码T、下中码B相对应。
2) 上一下二型结构与上中码T、下左码V、下右码N相对应。
3) 上二下一型结构与上左码R、上右码Y、下中码B相对应。
4) 上中下结构与上中码T、中码G、下中码B相对应。
5) 左右结构与中左码F、中右码H相对应。
6) 左二右一型结构与上左码R、下左码V、中右码H相对应。
7) 左一右二型结构与中左码F、上右码Y、下右码N相对应。
8) 左中右结构与中左码F、中码G、中右码H相对应。
9) 包围字型除主笔外,其余附笔对照末笔结构图,根据末笔符号在结构图中的位置来取码,均适用于1)~9)取码规则。
10) 末笔的长度或宽度与字形的长或宽相等或略相等的识别码取中排码。
11) 成字部件取中码,如独体字О识别码取中码G。
总体而言,彝文计算机字形编码输入方案综合分析彝文字型的主要特点,设计出科学有效的字形输入码,有利于扩大适用范围,无论使用者懂不懂彝文,都可以根据文字的形码规则进行拆分输入,相比音码输入法而言,适用人群更为广泛[9]。
5 结语
彝文属于超方言的表意文字,根据彝文构字规律,采用彝文部件码,设计了彝文计算机字母键位,同时结合彝文字型结构和书写笔顺,设计彝文“传统码和简易码”2种计算机输入码,通过这2套编码,实现彝文计算机数字化录入,用户能快捷有效地输入彝文,实现与汉字、英文等其他文字同平台数字化应用,达到彝文计算机输入法软件开发目标,满足了用户使用需求,因此彝文编码是合理、高效且非常实用的计算机输入码。
这里是彝族文化网络博物馆,海量的数据,鲜明的彝族文化特色,是向世界展示彝族文化的窗口,感谢您访问彝族 人 网站。参考文献:
[1] 王继超.解码历史——彝文价值及整理[J].当代贵州, 2013 (16): 28-29.
[2] 那建坤.彝文部首浅析[J].贵州民族研究,1989(2):158.
[3] 丁椿寿.论彝文的类型及其超方言问题[J].贵州民族研究,1981(1):77.
[4] 武自立,纪嘉发,肖家成.云贵彝文浅论[J].民族语文,1980(4):37.
[5] 苏培成.现代汉子学纲要[M].北京:北京大学出版社,2001:74.
[6] 张泽全.汉光码汉字输入法的键盘分布研究[J].河南师范大学学报:自然科学版,2001,29(3):83-84.
[7] 王正贤,张和平.贵州彝族语言文字[M].贵阳:贵州民族出版社,1999:236.
[8] 李生福.古彝文及其造字规律新探[J].贵州民族研究,2001,21(2):135—138.
[9] 宁威林,王嘉梅,王辉,等.彝文输入法形码编码的研究与实现[J].云南民族大学学报:自然科学版,2011,20(4):310.
作者单位:毕节学院 彝学研究院。
原载:《云南民族大学学报(自然科学版)》2014年5期;文字来源:参考网。