发明内容
本发明的目的是提供一种有效的半方盲文数字编码汉字输入法,以便于盲人更好地在普通电脑、按键式电话、手机、掌上电脑和其它数字输入键盘上方便地输入汉字和符号,进行文字处理和信息交流。
为达到上述目的,本发明采取了以下的技术方案:
目前我国通用的盲文,实际上是一种拼音方案,声母和韵母均占盲文的一方点字,但声母和韵母的定义及拼音规则与国家颁布的汉语拼音方案略有不同,如取消了声母“y”和“w”,一些声母可以单独使用,一些在汉语拼音方案中不能单独使用的韵母在盲文中也可单独使用等。
本发明方法与普通的盲文编码输入法不同的是,它不是依照盲文的自然点序取码,而是先将一方盲文点字拆分为左右两个半方,并对两个半方独立编码,然后由左、右半方编码所组成的二位编码确定一方盲文点字的编码。
本发明所述的输入键盘是数字键盘,先将盲文的每方点字拆分为左右两个半方,然后用数字键盘上的数字键分别代表左右两个半方的点数,由左、右半方编码所组成的二位编码确定一方盲文点字的编码,汉字声母韵母及音调所对应的盲文的数字编码构成汉字的数字输入编码,各类符号和其它文字也由其盲文定义确定数字编码,使用数字键输入汉字和词语、其它文字及符号,或者在专门的盲文打字机上输出盲文点符。
本发明采用以下两种编码方式:
1、将盲文的每方点字拆分为左右两个半方,左右半方各有3个点位,各有8种可能的点序;然后用数字键盘上的数字键1、4、7、2、5、8、0依次代表左半方的1点、2点、3点、12点、13点、23点、123点和右半方的4点、5点、6点、45点、46点、56点、456点,数字键3代表左半方或右半方空点;汉字的第1、2、3、4声调的编码分别用其盲文点位对应的数字键1、4、7、8表示;由左、右半方编码所组成的二位编码确定一方盲文点字的编码,汉字声母韵母及音调所对应的盲文的数字编码构成汉字的数字输入编码。
2、将盲文的每方点字拆分为左右两个半方,然后用数字键盘左侧的3个数字1、4、7分别表示左半方的1点、2点、3点,用数字键盘右侧的三个数字3、6、9分别表示右半方的4点、5点、6点,用数字键盘中央的4个数字2、5、8、0依次表示左半方的12点、13点、23点、123点和右半方的45点、46点、56点、456点,除与456点对应的韵母“晕”前加数字键“9”表示“空半方”外,其余情况下的“空半方”在字词编码时均被忽略;第1、2、3、4声调的编码分别用相应盲文对应的数字键1、4、7和8表示,由左、右半方编码所组成的二位编码确定一方盲文点字的编码,汉字声母韵母及音调所对应的盲文的数字编码构成汉字的数字输入编码。
在前述方法的基础上,汉字的编码完成以后,可以为词编码,词的编码由相应各字编码中的部分编码组成,词的长度可以是二字或三字或四字以上。
其优选编码规则之一是:双字词的编码由二字的拼音编码加两字的声调编码组成;三字词的编码由每字的前两码和前两字的声调编码组成;四字以上词,编码依次由前三字每字前两码、末字前两码及前两字声调编码组成;编码最大长度为10。
另一种优选词组编码规则是:双字词的编码仍然由二字的拼音编码加两字的声调编码组成;三字词的编码依次取三字盲文声母的第一码和韵母的第一码(只有声母或韵母的情况,则取该方的二码),然后添加前两字的声调编码;对于四字以上词,编码依次取前三字及最后一字声母的第一码和韵母的第一码(只有声母或韵母时取该方的编码),然后添加前两字的声调编码。词最大码长为10。
在上述两种方案中,词编码的尾部均添加了前两字(首字和次字)的声调编码作为识别码,以降低重码率,无重码的词可不使用声调识别码。
本发明还可以将编码中未使用输入键盘的其他键作为功能键,用于切换英文输入状态及输入数字状态等。
本发明方法还可以采用盲文点字的规则为标点符号、其它常用符号和其它文字编码。
本发明的有益效果在于:
1、本发明方法属于一种盲文数字编码汉字输入法,与普通的盲文编码输入法不同之处在于:它不是依照盲文的自然点序进行编码,而是先将一方盲文点字拆分为左右两个半方,然后用0至9中的一个数字作为半方的编码,一方点字的编码长度仅为2;相比之下,常规能在数字键盘上使用的盲文输入法,其一方的编码长度平均接近4,而且一方的编码输入完毕后,还需要按确认键,因此本发明输入法具有较高的效率;同时由于保留了盲文的书写特征,因此对于盲人来说易学易用;
2、在字词的盲文拼音数字编码尾部,添加了声调编码作为识别码,其中字的声调识别码为1个,而词的声调识别码为2个。声调识别码的利用在较大程度上降低了字、词的重码率;
3、对于三字以上词,采用了离散编码方式,使得词的最大码长不超过10,提高了输入效率。
具体实施方式:
下面结合具体实施例对本发明内容做进一步详细说明:
实施例1(8键方案)
本实施例数字与左右半方点位的对应规则如表1所示:
表1实施例1中数字键与盲文点位的对应关系
数字键 |
1 |
4 |
7 |
2 |
5 |
8 |
0 |
3 |
左半方 |
1点 |
2点 |
3点 |
12点 |
13点 |
23点 |
123点 |
空 |
右半方 |
4点 |
5点 |
6点 |
45点 |
46点 |
56点 |
456点 |
空 |
表1中与点字对应的数字键采用按列的顺序编排,是为了符合盲文的书写习惯。当然也可采用其它的对应方式。上述方案中只用到了10个数字键中的8个,故称之为8键方案。
在本实施例中,每个数字键都同时对应着左右两个半方的点序,同样一个数字,如4,在左半方表示2点,而在右半方则表示5点;5在左半方表示13点,而在右半方则表示46点。
按照以上编码规则,举例如下:
声母“t”的盲文点位为2345点,左半方为23点,编码为8;右半方为45点,编码为2,因此“t”的编码为82;韵母“ai”的点位为246点,左半方为2点,编码为4,右半方为46点,编码为5,因此“ai”的编码为45;因此“tai”的编码为8245。
“yang”(或“iang”,在盲文中二者不区分)的点位为1346点,左半方为13点,对应于键5,右半方为46点,同样对应于键5,因此“yang”的编码为55。声母“ch”的盲文点位为12345点,左半方为123点,对应于数字键0;右半方为45点,对应于数字键2,因此声母“ch”的编码为02;韵母“en”(恩“的盲文点字为356点,左半方为3点,对应键位7,右半方为56点,对应于键位8,因此“en”的编码为78;因此“chen”的编码为0278。
再如:“I”(123点)的编码为03,“1”(24点)的编码为41,因此“iI”的编码为0341;
“fu”的点位为:124点+136点,因此其编码为:2157;
“ming”的点位为134点+16点,因此其编码为:5117;
“hui”的点位为125点+2456点,因此其编码为:2440。
从上面示例也可看出,如果按自然点序编码,则编码长度要比半方盲码的长度长许多。
由于汉字中同音字较多,为降低重码,本发明在汉字的编码中使用拼音编码后面添加声调编码的方式。在现行盲文中,分别用1点,2点,3点及23点表示第1,2,3、4声调,为此我们用相应的数字键1、4、7、8作为4个声调的编码。对于声调编码,当然根据需要和方便,也可采用其它的键,如3,6,9等。
一个汉字的完整编码,由相应的拼音编码和声调编码两部分组成,拼音编码在前,声调编码在后。作为识别码,只有前3个声调需要加声调编码,不加声调编码则默认为第4声调。之所以默认第4声调,是因为在汉字中,第4声调出现的几率最大,约占30%,这样可以提高输入效率。
下面是一些汉字采用实施例1方法得到的完整编码:
太:8245(因为是第4声调,省略了声调编码);
伟:407,因为“ui”在盲文中可独自拼音,故只有一方;
宏:24484;富:2157;明:51174;
对于词,采用如下编码规则:
1)双字词:首字盲文拼音编码+末字盲文拼音编码+首字声调编码+末字声调编码;
2)三字词:首字前两码+次字前两码+末字前两码+首字声调编码+次字声调编码;
3)四字以上词:
首字前两码+次字前两码+第三字前两码+末字前两码+首字声调编码+次字声调编码
对于重码的字词,由于盲人只能靠语音逐一去听,因此重码会浪费选字词的时间。为解决这一问题,我们将词中前两字的声调编码加在词组编码的尾部,作为识别码,即当拼音编码有重码时,用声调加以区别。如果拼音编码无重码,则这些识别码是不需要输入的,在制作输入法程序时,可只对拼音编码有重码的词组加声调识别码。
在词编码中,第4声调的代码“8”不可省略。
例如:北京:2385221771;背景:2385221787。
上面两词的拼音(前8位编码)均相同,但输入第一个声调识别码后,二词就不重码了。例如:教师节:22182281;金沙江:22182211;鉴赏家:22182287。
上面三个拼音重码的三字词,在输入声调识别码后,就可以完全区分开。
例如:一只:417111;一直:417114;一致:417118;移植:417144;遗址:417147;遗志:417148;已知:417171;以致:417178意旨:417187;意志:417188;抑制:417188。
上面11个词的拼音完全相同,因此在普通的拼音输入法中,无法将它们区分开,而如此多的重码在输入时是极不方便的,尤其是对于盲人;但在尾部添加本发明的声调识别码后,上述重码基本上被消除了,只有那些拼音和声调完全相同的词(如抑制和毅志),才会重码,但这种情况并不多见。
例如下面两个四字以上词的编码:欣欣向荣:2424244211;中华人民共和国:7124422214。
所有词的最大码长为10,但多数情况下只需输入到第67码时,词就出来了。
本发明还提出了另外一种词组编码方式:对于双字词,编码规则同上;对于三字、四字或四字以上词如下所述;
三字词:取每字盲文声母的第一码和韵母的第一码(只有声母或韵母的情况,则取该方的两码),然后在尾部添加首字和次字的声调编码;对于四字以上词,依次取前三字及最后一字声母的第一码和韵母的第一码(只有声母或韵母时取该方的编码),然后在尾部添加前两字的声调编码。词的最大码长为10。大量的比较表明,此方案能在一定程度上降低重码率。
对于标点符号,同样采用盲文的点字方案,按上面的编码规则进行编码,如:“逗号”(5点):34;“句号”(5点+23点):3483;“分号”(56点):38;“问号”(5点+3点):3473;“感叹号”(56点+2点):3843;“冒号”(36点):77,等等。
为节约输入时间,标点符号尾端的空半方的编码“3”可以不输入。比如“。”的编码可简化为348;“?”的编码可简化为347等等。
英文数字的半方盲文编码:
A:13;b:23;c:11;d:12;e:14;f:21;g:22;h:24;i:41;j:42;k:53;l:03;m:51
N:52;o:54;p:01;q:02;r:04;s:81;t:82;u:57;v:07;w:40;x:55;y:50:z:58
其它符号有盲文定义的,也同样可以编码。
本方案只用到了8个数字键,没有用到的数字键如6和9等,可以作为功能键,用来切换英文输入状态和数字输入状态。
实施例2(10键方案)
实施例1方案的优点是简便,但也存在明显的缺点,那就是要经常使用“空半方键”,为此我们还给出了第二种方案(见表2所示)。
表2实施例2数字与点位的对应关系表
数字键 |
1 |
4 |
7 |
2 |
5 |
8 |
0 |
3 |
6 |
9 |
左半方 |
1点 |
2点 |
3点 |
12点 |
13点 |
23点 |
123点 |
|
|
|
右半方 |
|
|
|
45点 |
46点 |
56点 |
456点 |
4点 |
5点 |
6点 |
表2中,空白的表示无对应关系。如1只对应于左半方的1点,与右半方无对应关系;6只对应于右半方的5点,与左半方无对应关系;而2既对应于左半方的12点,同时又对应于右半方的45点,其含义视具体位置而定。
音调的表示方法是:四声不需要标调,第1,2、3声分别用最左侧的3个键1、4、7表示,但在词组中,第4声调用8表示。
对于声母“b”,“l”,“k”,“q”,其右半方均为空,则在实施例2中,可省略空白半方的输入。如:白的编码为:2454,由于声调中的1、4、7不会与前面的点字“结方”,故省略空白半方不会导致混淆。
值得注意的是,韵母“晕”,既456点,其前面的空半方不可省略,本方案中用数字键“9”表示空白,故456点对应的韵母“晕”的编码为:90。
实施例2方案的优点是省略了拼音编码和标点符号编码中的空白半方,提高了效率,而且左右点位的顺序与手写习惯基本一致,对盲人来说更加方便。还有一点,是用10个数字键盘输入,提高了离散度,降低了重码率。
实施例1中的各种字词编码规则,同样适用于方案二。
实施例2字、词及符号的编码示例:百花245260071;白桦245260048;“,”:6;“。”:68;“?”:67。
本发明中各种半方盲文数字编码可以通过程序完成,并制造出相应输入法。