CN1100288C - 四笔序音计算机汉字键盘输入方法 - Google Patents
四笔序音计算机汉字键盘输入方法 Download PDFInfo
- Publication number
- CN1100288C CN1100288C CN95110379A CN95110379A CN1100288C CN 1100288 C CN1100288 C CN 1100288C CN 95110379 A CN95110379 A CN 95110379A CN 95110379 A CN95110379 A CN 95110379A CN 1100288 C CN1100288 C CN 1100288C
- Authority
- CN
- China
- Prior art keywords
- code
- sign indicating
- indicating number
- character
- chinese character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明是一种利用字根、两笔画排列、拼音相结合的计算机汉字键盘输入方法。它选择35个编码字根及汉字五种笔画的两两排列作为编码元素,分别与编码字符0-9、a-y之间形成一一对应关系,按照“字根优先,笔画为后”的原则从字首、字尾确定两位笔序特征码(字形码),或再结合汉字前二位拼音字母(拼音码)形成汉字编码。笔序特征码同时用于词组编码。该方法利用的字根数量少,编码规则简单,不用拆字,重码率低,简单易学,快速高效。
Description
本发明是一种利用字根、两笔画排列、拼音相结合的计算机汉字键盘输入方法。
目前计算机汉字键盘输入方法有多种方案,但是,其存在的主要问题是如何解决汉字编码的规范、标准、高效、快速、简单、易学等问题。所谓规范,是指编码规则明确,不存在或很少存在歧解的问题;标准是指编码规则应该依据一些最普通而又最明确,为大多数人能了解的一些汉字的基本特征而制定;高效是体现在编码长度上不宜过长,理论上讲,用现有常用字符来表达,要区分每个汉字且没有重码,至少需要三个字符,而实际上难以严格做到这一点,作为一个编码方案如果其平均输入效率达到三键或少于三键一字,就应该视为高效的;快速是要尽量减少重码,提高输入速度;简单易学就是要编码规则尽量少,记忆量少且便于联想,并且尽量减少特例与特殊情况的不规则处理。应该说为了同时解决以上问题,仍需要研究更好的编码方法。
在已知编码方案中,人们已经利用了汉字的多种特征作为编码元素,主要包括:拼音、声调、字根、字根拼音、笔画、笔画位、笔画数、笔画排列等。然而,作为一种优秀的编码方法不仅是要去寻找新的或更多的汉字特征用于编码,而且更重要的是需要研究采用哪种或哪些特征更符合编码的优化原则。实际上可以用于编码的汉字特征毕竟是有限的,而且按照优化原则有些特征不一定适合于编码,如音调虽然规范,但很多人掌握不好;单一笔画用于编码难免效率偏低;笔画位、笔画数用于编码使用起来比较困难等。如果这样考虑,实用的编码元素类型也许不过几种。
除编码元素外,每种类型编码方法中,还存在具体规则或实施细节上的差异。在编码方法大量出现并日趋完善的时候,这种规则或细节上的差异往往是编码方法优劣之分的主要依据。尽管不同的方法各有所长,但是,人们一直期望有一种优秀的编码方法能容各家之长,同时也克服其不足,这甚至会成为人们长期追求的一个目标。
在中国专利文献,申请号91106400.1中提出了一种利用汉字首尾笔画码结合拼音进行编码的方法,具有许多优点,如避免了汉字拆分的过程,不用定义和记忆大量字根,编码规则简单、明确等。但是,由于仅采用首尾笔画码与拼音相结合,其重码率比较高,估计可达20%左右,而且采用五位编码长度,效率较低。
在中国专利文献,申请号94103068.1中提出了另一种利用字根、五笔画组合及拼音声母相结合的编码方法,虽然具有字根较少,且规范、标准,编码长度较短等优点,但是,由于采用三位字形码,仍然不能避免汉字拆分的过程,尤其是采用第三笔、第四笔组合码给输入增加了一定困难;另外,仅采用26个英文字母作为编码字符集,虽然输入比较方便,但是容易造成重码,因此,输入词组时需用V键转换,降低了效率。
本发明是希望通过寻找和利用汉字的一些基本而又明确的特征及这些特征的组合进行单字和词组编码,达到简化编码规则,增加标准程度,减少记忆成分,提高编码效率的目的。
本发明是这样实现的:
首先将汉字的基本笔画划分成点(包括提、捺)、横、竖、撇、折(包括前四笔以外的其它笔画)五种笔画,并将五种笔画的两两排列分配到英文字母键a~y上,笔画排列所对应字符称谓“笔画排列码”;再从常用汉字偏旁、部首中选择部分字根作为“编码字根”,并且分配到数字键0~9及英文字母键a~y上,编码字根所对应的字符称谓“字根码”;另外,考虑编码需要,将字母z定义为补码;数字0-9及英文字母a-z同时被称谓“编码字符”。根据上述定义,利用字根码、笔画排列码、补码构成汉字字形码,再根据汉字拼音构成拼音码,然后字形码或与拼音码相结合构成汉字及词组编码,其特征是将编码字根和笔画排列与编码字符之间分别定义成一一对应关系,根据“字根优先,笔画为后,不足取补”的原则,按照书写笔序从字首选取字根码或笔画排列码及字尾选取字根码或笔画排列码或补码构成二位字形码,称谓“笔序特征码”,选取汉字拼音的前二位字母或包括拼音简化字母的前二位字母或一位拼音字母加空格构成二位拼音码,称谓“拼音特征码”,笔序特征码与拼音特征码相结合构成单个汉字编码,词组第一字的笔序特征码与词组末尾字的笔序特征码相结合构成词组编码。
在确定字首、字尾字根及字首、字尾笔画时利用了笔序的概念,在绝大多数情况下笔序有明确的定义且为人们所熟悉,因此字首、字尾字根或字首、字尾笔画的定义也具有明确性,容易为人们所掌握。利用字首、字尾为特征,简化了汉字拆分的过程和方法,并且字首、字尾特征突出,实现了规则简单、代码明确的目的要求。
作为上述方法的具体实施方案,可以采取以下步骤:
1、将汉字的基本笔画,如点、横、竖、撇、折、捺、钩等归成五种类型,定义如下:
①丶(
),点,包括提、捺;
②一,横;
③丨,竖;
④丿,撇;
这样,所有的汉字基本笔画可由以上五类为代表,作为该编码方案的基本笔画类型。
2、前述五类基本笔画按序进行两两排列,分配到25个英文字母键上,定义如下:
q:丶丶 w:丶一 e:丶丨 r:丶丿 t:丶
y:一丶 u:一一 i:一丨 o:一丿 p:一
a:丨丶 s:丨一 d:丨丨 f:丨丿 g:丨
h:丿丶 j:丿一 k:丿丨 l:丿丿 m:丿
x:丨丶 c:一 v:丨 b:丿 n:
英文字母“z”在定义中未用,编码中将作为补码。按照上述定义,25个英文字母与笔画排列形成了一一对应关系,即为笔画排列码,它们在键盘上是按顺序排列的,容易记忆。
3、选择35个汉字偏旁或部首作为编码特征,这些偏旁或部首即为编码字根,并将其分配到数字0-9及除z以外的25个英文字母键上,定义如下:
1:木 2:火 3:土 4:钅 5:氵
6:日 7:月 8:山 9:石 0:田
q:饣 w:攵 e:儿 r:子 t:寸
y:虫 u:马 i:十 o:又 p:几
a:口 s:忄 d:艹 f:目 g:巾
h:犭 j:八 k:人 l:禾 m:王
x: 讠 c: v: b:女 n :大
以上是按字母在键盘上的顺序排列的。部分偏旁或部首与上述字根非常相似,将作为同码字根,如:曰、士、孑、
按照上述定义仅用了少量字根,并且编码字根与其代码之间形成了一一对应关系,这些代码即为字根码。
4.对单个汉字进行编码,其方法是:
(1)根据字首和字尾的编码字根或笔画排列,按照字根优先,笔画为后的原则确定首尾特征码,即当字首为编码字根时则优先取字根码作为字首码,不为编码字根时则取第一笔和第二笔的笔画排列码作为字首码;同样,当字尾为编码字根时则优先取字根码作为字尾码,不为编码字根时则取倒数第二笔和倒数第一笔的笔画排列码作为字尾码;字首、字尾码即构成单字的两位笔序特征码,例如:
“民”的笔序特征码为“一”、“一”,即“cp”;
“汉”的笔序特征码为“氵 ”、“又 ”,即“5o”;
“字”的笔序特征码为“丶丶”、“子 ”,即“qr”;
“根”的笔序特征码为“木 ”、“丿丶”,即“lh”;
“社”的笔序特征码为“丶”、“土 ”、即“x3”;
(2)取字首、字尾的字根码时符合独立性原则,即用一条封闭曲线将字首或字尾的编码字根包围起来,其中不包括其它笔画,并且此曲线也不与其它笔画相交,如“老”字的字首不能作为“土”,其笔序特征码应为“一丨”、“丿”,即“im”。
(3)取字首、字尾笔序特征码时,对于笔画不足两笔或笔序特征码不足二位时,采用下述补笔或补码的方式处理:
对于单笔字,字首码为该笔画的重复笔画排列码,字尾码用z作为补码,例如:
“一”的字首码为“一一”,字尾码为“z”,其笔序特征码为“uz”。
对于两笔字,字首码为字根码或笔画排列码,字尾码用z作为补码,例如:
“二”的字首码为“一一”,字尾码为“z”,其笔序特征码为“uz”;
“人”的字首码为“人”,字尾码为“z”,其笔序特征码为“kz”。
对于三笔字,字首码为字根码或前二笔的笔画排列码,字尾码取第三笔的重复笔画排列码或用z作为补码,例如:
“义”的字首码为“丿丶”,字尾码为“丶丶”,其笔序特征码为“hq”;
“干”的字首码为“一一”,字尾码为“丨丨”,其笔序特征码为“ud”;
“个”的字首码为“人”,字尾码为“丨丨”,其笔序特征码为“kd”;
“马”的字首码为“马”,字尾码为“z”,其笔序特征码为“uz”。
对于三笔以上编码字根所代表的汉字,字首码为字根码,字尾码用z作为补码,例如:
“王”的字首码为“王”,字尾码为“z”,其笔序特征码为“mz”。
对于三笔以上其它汉字,当字首码取编码字根后,剩余笔画不足两笔时,字尾码为末笔的重复笔画排列码,例如:
“艺”的字首码为“艹”,字尾码为“”,其笔序特征码为“dn”。
以上规则称谓“不足取补”,即笔画不足两笔或笔序特征码不足二位时,采用补笔或补码的方式处理。
(4)取字首、字尾笔序特征码时不能重复利用字根或笔画特征,例如,“自”的字首码取“丿丨”后,字尾码则不能取“目”,其笔序特征码应为“丿丨”、“一一”,即“ku”。
(5)取拼音码时,对拼音字母进行了以下简化和修改:
①zh、ch、sh分别由z、c、s代替作为一位;
②ang、eng、ing、ong都由g代替作为一位;
③ü由u代替。
由于对拼音码只进行了少量简化和修改,所以没有增加过多的记忆量。
(6)按顺序取汉字拼音的前两位字母,拼音字母只有一位时,第二位为空格,这样构成的二位编码即为拼音特征码,又称拼音码。根据字首、字尾所确定二位笔序特征码与拼音码相结合即构成四位单字编码,称谓“四笔序音码”,简称“序音码”。
按照上述方法,部分汉字的序音码举例如下:
“民”的序音码为:“cpmi”
“汉”的序音码为:“5oha”
“字”的序音码为:“qrzi”
“根”的序音码为:“lhge”
“一”的序音码为:“uzyi”
“二”的序音码为:“uzer”
“人”的序音码为:“kzre”
“干”的序音码为:“udga”
“个”的序音码为:“kdge”
“马”的序音码为:“uzma”
“王”的序音码为:“mzwg”
“艺”的序音码为:“dmyi”
“老”的序音码为:“imla”
“自”的序音码为:“kuzi”
“社”的序音码为:“x3se”
“啊”的序音码为:“aaa”
5、对偏旁字(字库中有定义的无音字)进行编码其方法是按一般单字编码方法取其笔序特征码,然后,拼音码部分用两位字母zz代替。
6、对词组(包括两字和多字词组)进行编码其方法是选取词组的第一字的笔序特征码和末尾字的笔序特征码构成词组编码,例如:
“人民”的编码为:“kzcp”
“汉字”的编码为:“5oqr”
“社会主义”的编码为:“x3hq”
可以收录尽量多的两字和多字词组,有利于提高编码效率和输入速度。
对以上编码实施方案,特别说明以下几点:
(1)使用序音编码时可以采用简码,即对于某些字可只取其全码的前一、二或三位作为该字编码,简码字没有重码;
(2)由于扩大了编码字符集,该编码方法重码率较低,且重码字中大多数为两字重码,这样,在确定单字编码时常用字可取简码,不常用字仍采用全码,即四位序音码,保持一字一码,可以更进一步减少重码率;
(3)大多数汉字可采用简码输入,提高编码效率,并且,在设计计算机程序时对简码字可进行屏幕追踪显示,不需专门记忆。
按照简化方法,上述部分汉字可采用简码输入,举例如下:
“民”的简化码为:“cp”
“汉”的简化码为:“5o”
“字”的简化码为:“qrz”
“根”的简化码为:“lh”
“一”的简化码为:“uz”
“二”的简化码为:“uze”
“人”的简化码为:“k”
“义”的简化码为:“hq”
“干”的简化码为:“ud”
“个”的简化码为:“kd”
“马”的简化码为:“u”
“王”的简化码为:“m”
“艺”的简化码为:“dny”
“老”的简化码为:“im”
“自”的简化码为:“ku”
“社”的简化码为:“x3s”
采用上述编码方法主要有以下优点:
1.本方法将字形元素减少到60个,其中包括优选的35个编码字根和25种笔画排列,这些元素具有一定的规律性,并且比较规范、标准,数量少,容易记忆。
2.增加了编码字符集,采用35个字符与35个编码字根形成一一对应关系,既有效的利用了键盘资源,减少了重码,又使字根代码简单明确。
3.利用汉字的首尾笔序特征码,避免了汉字的拆分,使编码规则得到了简化,并且取码规则一般情况下不会产生歧解,符合特征明确,规则单一的要求。
4.采用简码与全码相结合的方式,即一字一码,常用字取简码,不常用字取全码的方式,可使单字重码率降到很低的程度。并且,绝大多数常用字可采用简码输入,而词组采用四码输入,有效地降低了单字与词组的重码,提高了编码效率,使大多数单字实现了三键以下输入和单字、词组的混合盲打。
根据上述特点,本发明是一种规范、标准、简单、明确的编码方法,同时具有快速、高效、易学、易用的优点。
Claims (5)
1.一种计算机汉字键盘输入方法,采用汉字的点、横、竖、撇、折五种笔画的两两笔画排列和部分编码字根作为编码元素,将这些编码元素分配到计算机键盘上,与编码字符形成对应关系,根据汉字所对应的编码元素及相应的编码字符构成汉字字形码,利用汉字拼音构成拼音码,字形码或与拼音码相结合构成汉字及词组编码,并利用键盘将汉字输入计算机,本发明的特征是:
1.1笔画排列与编码字符之间具有一一对应关系,且定义为:
q:丶丶 w:丶一 e:丶丨 r:丶丿 t:丶
y:一丶 u:一一 i:一丨 o:一丿 p:一
a:丨丶 s:丨一 d:丨丨 f:丨丿 g:丨
h:丿丶 j:丿一 k:丿丨 l:丿丿 m:丿
x:丶 c:一 v:丨 b:丿 n:;
1.2编码字根与编码字符之间具有一一对应关系,且定义为:
1:木 2:火 3:土 4:钅 5:氵
6:日 7:月 8:山 9:石 0:田
q:饣 w:攵 e:儿 r:子 t:寸
y:虫 u:马 i:十 o:又 p:儿
a:口 s:忄 d:艹 f:目 g:巾
h:犭 i:八 k:人 l:禾 m:王
x:讠 c: v: b:女 n:大;
1.3字形码由笔序特征码构成,笔序特征码是按照书写笔序,根据汉字字首和字尾对应的编码元素确定的两位编码,并且确定汉字字首或字尾编码时优先取字根码,字首或字尾不是编码字根时取笔画排列码,字首或字尾笔画不够两笔时采用补笔或补码方法确定字首或字尾编码;
1.4拼音码由汉字拼音的前两位拼音字母或简化拼音字母构成,并且,构成汉字编码时,拼音码位于笔序特征码之后。
2.根据权利要求1所述的计算机汉字键盘输入方法,其特征是所说的补码用英文字母z表示,并且补笔或补码方法包括:
2.1对于单笔字其字首码为该笔画的重复笔画排列码,字尾码为补码z;
2.2对于二笔字其字首码为字根码或笔画排列码,字尾码为补码z;
2.3对于三笔字其字首码为字根码或笔画排列码,字尾码为末笔的重复笔画排列码或补码z;
2.4对于编码字根对应的汉字其字首码为字根码,字尾码为补码z;
3.根据权利要求1所述的计算机汉字键盘输入方法,其特征是所说的简化拼音字母采用以下方法确定:
3.1 zh、ch、sh分别用z、c、s代替作为一位简化拼音码;
3.2 ang、eng、ing、ong都用g代替作为一位简化拼音码;
3.3用u代替。
4.根据权利要求1或2所述的计算机汉字键盘输入方法,其特征是所说的词组编码由词组第一字的笔序特征码加末尾字的笔序特征码构成。
5.按权利要求1或2或3所述的计算机汉字键盘输入方法,其特征是常用汉字可只取其全码的前一、或二、或三位码作为简码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN95110379A CN1100288C (zh) | 1995-03-25 | 1995-03-25 | 四笔序音计算机汉字键盘输入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN95110379A CN1100288C (zh) | 1995-03-25 | 1995-03-25 | 四笔序音计算机汉字键盘输入方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1132366A CN1132366A (zh) | 1996-10-02 |
CN1100288C true CN1100288C (zh) | 2003-01-29 |
Family
ID=5077773
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN95110379A Expired - Fee Related CN1100288C (zh) | 1995-03-25 | 1995-03-25 | 四笔序音计算机汉字键盘输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1100288C (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1078563A (zh) * | 1993-05-31 | 1993-11-17 | 王伟 | 汉字部首联想编码输入方法 |
CN1097072A (zh) * | 1993-06-29 | 1995-01-04 | 曹红海 | 笔顺组合式汉字编码法及键盘 |
-
1995
- 1995-03-25 CN CN95110379A patent/CN1100288C/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1078563A (zh) * | 1993-05-31 | 1993-11-17 | 王伟 | 汉字部首联想编码输入方法 |
CN1097072A (zh) * | 1993-06-29 | 1995-01-04 | 曹红海 | 笔顺组合式汉字编码法及键盘 |
Also Published As
Publication number | Publication date |
---|---|
CN1132366A (zh) | 1996-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1141633C (zh) | 计算机二十四部首汉字排序输入法 | |
CN1100288C (zh) | 四笔序音计算机汉字键盘输入方法 | |
CN1059281C (zh) | 汉字声韵调三拼音形编码输入方法 | |
CN1737739A (zh) | 基于英文键盘的藏文输入法 | |
CN1118085A (zh) | 可用数字键盘输入的汉字输入系统及其键盘 | |
CN1034245C (zh) | 缅文字型智能四码输入系统 | |
CN1257445C (zh) | 音义码汉字输入方法 | |
CN1238781C (zh) | 一种笔画笔顺汉字信息处理方法 | |
CN1119743C (zh) | 计算机汉字组词码输入方法 | |
CN100339808C (zh) | U码汉字输入法 | |
CN1315026C (zh) | 一种数码汉字输入法 | |
CN1107899C (zh) | 计算机四角汉字输入法 | |
CN1052314C (zh) | 一种汉字二维数码的计算机键盘输入方法 | |
CN1529221A (zh) | 九键拼音及其键盘 | |
CN1162766C (zh) | 一种汉字音形编码输入方法 | |
CN1347023A (zh) | 二笔手写智能输入系统 | |
CN1332401A (zh) | 四笔号码字词不重输入法及其键盘 | |
CN1195257C (zh) | 结构数码汉字输入方法 | |
CN1303506C (zh) | 汉字拼音标调定型输入法 | |
CN1584804A (zh) | 数字键盘汉字输入法 | |
CN1244671A (zh) | 数符汉字编码输入法及键盘 | |
CN1087083C (zh) | 一种计算机音韵调义汉字编码键盘输入方法 | |
CN1632731A (zh) | 一种五行码汉字输入法 | |
CN1146775C (zh) | 七字根双笔画形音码计算机汉字输入方法 | |
CN1048614A (zh) | 汉字一元多码结构分类编码法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |