三、发明内容:
本发明的目的在于设计一种同时能够满足:规范、易学、快速、高效、实用的数字编码方案,符合汉字形、音、义的完美结合及人们的认知规律,让人们能使用数字键盘或设备快速录入汉字。
汉字二笔数码输入系统,是利用从0到9的数字键盘,包括移动电话机、电话机、收银机、PDA电脑、掌上电脑、电子字典、PC机、机顶盒、上网机等设备的10个数字按键进行汉字录入的编码系统,其方案为:在数字键盘上采用“音”“形”结合的编码方式输入中文,“音”就是取该字汉语拼音首字母在数字键盘上所对应的数字键,仅只按一次数字键,代表该键的任一拼音字母为首字母的所有汉字,再按“形”的结构、笔画或部首进行分类编码。二笔数码的编码采取10个数字码元,输入时不管是拼音首字母还是汉字笔画或部首,均可以在十个数字键当中找到与其对应的数字进行输入任一汉字。二笔数码键盘设定:
数字“1”,代表笔画“一”;
数字“2”,代表汉语拼音字母“a”、“b”、“c”和笔画“丨”;
数字“3”,代表汉语拼音字母“d”、“e”、“f”和笔画“丿”;
数字“4”,代表汉语拼音字母“g”、“h”、“i”和笔画“、”;
数字“5”,代表汉语拼音字母“j”、“k”、“l”和笔画“”;
数字“6”,代表汉语拼音字母“m”、“n”、“o”和部首“钅”、“日”;
数字“7”,代表汉语拼音字母“p”、“q”、“r”、“s”和部首“木”、“月”;
数字“8”,代表汉语拼音字母“t”、“u”、“v”和部首“氵”、“人(亻)”;
数字“9”,代表汉语拼音字母“w”、“x”、“y”、“z”和部首“土”、“口”;
数字“0”,代表部首“艹”,“扌”。输入汉字时,规则如下:
a.独体字
按第1键,该字拼音首字母对应的数字键,将该键对应的各拼音为首字母的所有汉
字分为第一键字类,显示其中使用频率最多的汉字,称为一码字;如该
字未显示
按第2键,该字第一笔画(或部首)对应的数字键,将第一键字类再次分类,显示
其中使用频率最多的汉字,称为二码字;如该字未显示
按第3键,该字第二笔画对应的数字键,将第二键字类又一次分类,显示其中使用
频率最多的汉字,称为三码字;如该字未显示
按第4键,该字第三笔画对应的数字键,第四键汉字分类,显示其中使用频率最多
的汉字,称为四码字;如该字未显示
按第5键,该字第四笔画对应的数字键,第五键汉字分类,显示其中使用频率最多
的汉字,称为五码字;如该字未显示
按第6键,该字第五笔画对应的数字键,该字肯定显示,称为六码字。b.合体字
按第1键,该字拼音首字母对应的数字键,该键代表的各拼音为首字母的所有汉
字分为第一键字类,显示其中使用频率最多的汉字,称为一码字;如
该字未显示
按第2键,该字前半第一笔画(或部首)对应的数字键,将第一键字类进行再次
分类,显示其中使用频率最多的汉字,称为二码字;如该字未显示
按第3键,该字前半第二笔画对应的数字键,将第二键字类又一次分类,显示其
中使用频率最多的汉字,称为三码字;如该字未显示
按第4键,该字后半第一笔画(或部首)对应的数字键,第四键汉字分类,显示
其中使用频率最多的汉字,称为四码字;如该字未显示
按第5键,该字后半第二笔画对应的数字键,第五键汉字分类,显示其中使用频
率最多的汉字,称为五码字;如该字未显示
按第6键,该字后半第三笔画对应的数字键,该字肯定显示,称为六码字。汉字二笔数码输入系统,其输入词组的操作步骤如下:a.录入二字词组:
按第1键,第一个字拼音首字母对应的数字键,
按第2键,第一个字第一笔画(或部首)对应的数字键,
按第3键,第一个字第二笔画对应的数字键;
按第4键,第二个字拼音首字母对应的数字键,
按第5键,第二个字第一笔画(或部首)对应的数字键,
按第6键,第二个字第二笔画对应的数字键,输入为一个二字词。b、录入三字词组:
按第1键,第一个字拼音首字母对应的数字键,
按第2键,第一个字第一笔画(或部首)对应的数字键;
按第3键,第二个字拼音首字母对应的数字键,
按第4键,第二个字第一笔画(或部首)对应的数字键;
按第5键,第三个字拼音首字母对应的数字键,
按第6键,第三个字第一笔画(或部首)对应的数字键,输入为一个三字词。c、录入四字词或四个字以上词组:
按第1键,第一个字拼音首字母对应的数字键,
按第2键,第一个字第一笔画(或部首)对应的数字键;
按第3键,第二个字拼音首字母对应的数字键,
按第4键,第二个字第一笔画(或部首)对应的数字键;
按第5键,第三个字拼音首字母对应的数字键;
按第6键,第末个字拼音首字母对应的数字键,输入为一个多字词组。本发明的核心在于,采用国家规范的和明确的汉字信息作为汉字数字编码基础,包括:1、拼音,取首字母,按《汉语拼音方案》的标准; 2、笔画,定义一、丨、丿、丶、五种笔画,符合国家语言工作委员会关于汉字基
本笔画分类的规定;
3、笔顺,按现代汉语通用字笔顺规则的标准;
4、部首设定,钅、木、氵、土、艹、日、月、人(亻)、口、扌十个常用部首,按GF3001
《信息处理用GB13000.1字符集汉字部件规范》的要求;
5、独体字和合体字划分的规范,按《汉字属性字典》的规范;
6、合体字拆分的规范性,鉴于95%的汉字是合体字,且具有“上下(或上中下)、
左右(或左中右)、里外(或包围、半包围)”的结构特征,在编码时,将合体字
一次性的地拆分为两半:前半和后半。
以拼音首字母及笔画或部首为编码元素分别取码,解决了数字键盘输入汉字不重复分类,大大降低数字键盘输入时出现的重码问题,有效提高输入速度。按国家标准信息交换汉字编码GB2312—80标准6763个汉字计:1、以拼音首字母通常设置在从2到9共8个数字键上,作为汉字取码的第一码,将
汉字分为八大类,每键字类平均约为845个字;2、以汉字第一笔画或字头部首取第二码,分为十大类,每键字类平均约为85个字;3、以汉字第二笔画取第三码,又分十大类,每键字类平均约为9个字;4、以汉字独体字的第三笔画或合体字后半第一笔画或部首取第四码,再分十大类,
每键字类平均仅约一个字;5、从理论上说,取第五码和第六码,全码重码率平均只约为1%了,如常用的一级
字库3755个字计,重码率又可以降低一半,依上述可推,从编码理论值计:
码级 字数 显示框可显三字(手机类)
一码字 8个字 24个字
二码字 80个字 240个字
三码字 800个字 2400个字
四码字 8000个字 24000个字
五码字 80000个字 240000个字
六码字 800000个字(或词组) 2400000个字(或词组)
据统计,常用的使用频率占99%的汉字约2000个字,以电话机显示框可显三个字推测,理论上按三个键可共有2664个字,已可满足常用汉字快速输入的要求。二笔数码的优点:
二笔数码属于音形码,利用音码和形码各自的优点,兼顾了汉字的音和形,音形结合,减少编码中死记或重复的部分,易学易记,输入快。本发明在汉字注音,字形和笔顺等方面遵循汉字规范,编码原理符合中小学的语文知识系统,符合学习者的思维习惯,令新用户可以迅速掌握,达到学习简易,上手即用的优势。
四、二笔数码实施方式:
二笔数码采用10个码元的编码方案,对应10个数字按键,把26个拼音(英文)字母,五类汉字基本笔画(一、丨、丿、丶、)以及10个常用部首归入这10个数字键中。26个拼音字母分别按顺序设置从2到9这8个数字键当中,五个汉字基本笔画(一、丨、丿、丶、)分别由数字从1到5表示,10个常用部首分别是(钅、木、氵、土、艹、日、月、人(亻)、口、扌),记忆口诀为:金木水土草,日月人口手,分别由另外5个数字从6到0表示,输入时,只要按照二笔数码的打字规则,就可以在10个数字键盘上进行汉字输入。
按汉字笔画的国家标准分类,将汉字笔画分成一、丨、丿、丶、五种笔画,定义:
“一”包括“一”、“/”;
“丨”包括“丨”、“”;
“丿”代表“丿”;
“丶”包括“丶”、“\”;
“”包括“乛”、“”、“乙”、
等所有带折勾的笔画。
设定数字“1”代表笔画“一”;数字“2”代表笔画“丨”;“3”代表笔画“丿”;“4”代表笔画“丶”;“5”代表笔画“”;也可依实用键位另行设定。独体字与合体字
汉字按其形体结构可以分为独体字与合体字两大类。
独体字是指没有上下、左右、内外(包围或半包围)结构,不能拆分的汉字。如大、中、小、人、丁、口、手、重等。
合体字是指由两部分或几部分组合而成,有上下、左右、内外(包围或半包围)结构,能拆分的汉字。如李、张、国、厅、同、建等。规定:将合体字一次性分为两半:前半和后半。
(注:√表示“同上”的意思)
单字编码举例:
第一码 第二码 第三码 第四码 第五码 第六码
独体字 |
拼音首字母 |
第1笔 |
第2笔 |
第3笔 |
第4笔 |
第5笔 |
例如:重: Z + 丿 + — + 丨 + + —输入“重”字(注:下述以显示框可显三个字为例)
按第1键,“重”的拼音首字母“Z”对应的数字键“9”,显示“9”代表的“WXYZ”
为首字母的所有汉字中最常用的汉字:为、一、在(一码字);
按第2键,“重”的第一笔画“丿”对应的数字键“3”,显示常用字:我、先、
自(二码字);
按第3键,“重”的第二笔画“一”对应的数字键“1”,显示次常用字:怎、重、
秧,可见按“931”,选“重”字就输入了。如果还未显示,可以依“重”
的笔顺笔画对应的数字键再依次按键,最多按六键肯定可以输入“重”
字。二笔数码全码:931251二笔数码简码:931木: M + 木二笔数码全码:67二笔数码简码:67
第一码 第二码 第三码 第四码 第五码 第六码
合体字 |
拼音首字母 |
前半第1笔 |
前半第2笔 |
后半第1笔 |
后半第2笔 |
后半第3笔 |
例如:忠: W + 丨 + + 丶 + + 丶输入“忠”字
按第1键,“忠”的拼音首字母“Z”对应的数字键“9”,显示“9”代表的“WXYZ”
为首字母的所有汉字中最常用的汉字:为、一、在(一码字);
按第2键,“忠”字前半“中”第一笔画“丨”对应的数字键“2”,显示常用字:中、
小、些(二码字);
按第3键,“忠”字前半第二笔画“”对应的数字键“5”,显示:央、则、由(三码
字);
按第4键,“忠”字后半“心”第一笔画“丶”对应的数字键“4”,显示:忠、愚、蚊
(四码字),即只按“9254”,选“忠”字就输入了。如果还未显示,可以依
“忠”的笔顺笔画对应的数字键再依次按键,最多按六键肯定可以输入“忠”
字。二笔数码全码:925454二笔数码简码:9254类: L + 丶 + 丿 + 一 + 丿 + 丶二笔数码全码:543134二笔数码简码:5431词组方式的输入:词组编码举例:
第一码 第二码 第三码 第四码 第五码 第六码
二字词 |
第1字拼音首字母 |
第1字第1笔 |
第1字第2笔 |
第2字拼音首字母 |
第2字第1笔 |
第2字第2笔 |
国家: G + I + + J + 丶 + 丶二笔数码:425544
第一码 第二码 第三码 第四码 第五码 第六码
三字词 |
第1字拼音首字母 |
第1字第1笔 |
第2字拼音首字母 |
第2字第1笔 |
第3字拼音首字母 |
第3字第1笔 |
计算机: J + 丶 + S + 丿 + J + 木二笔数码:547357联网:H + — + L + — + W + 丨二笔数码:415192
第一码 第二码 第三码 第四码 第五码 第六码
多字词 |
第1字拼音首字母 |
第1字第1笔 |
第2字拼音首字母 |
第2字第1笔 |
第3字拼音首字母 |
第4(末)字拼音首字母 |
万事如意: W + — + S + — + R + Y二笔数码:917179中华人民共和国:Z + 丨 + H + 亻 + R + G二笔数码:924874标点符号的输入:
第一码输入数字键“1”时,可以列出常用的标点符号供选择。按上页、下页翻页选择。全形方式的输入:
遇到不知道读音的汉字,可以利用“1”键代替拼音首字母,其它输入规则不变,照样可以把所需的汉字打出来。
注:除二笔数码音形版之外,将拼音首字母不作为编码元素,其他编码与上述编码方式一致,则为二笔数码全形版,以满足不懂拼音人士需要。