CN1080070A - 形声位全息汉字编码 - Google Patents
形声位全息汉字编码 Download PDFInfo
- Publication number
- CN1080070A CN1080070A CN 93110396 CN93110396A CN1080070A CN 1080070 A CN1080070 A CN 1080070A CN 93110396 CN93110396 CN 93110396 CN 93110396 A CN93110396 A CN 93110396A CN 1080070 A CN1080070 A CN 1080070A
- Authority
- CN
- China
- Prior art keywords
- code
- word
- chinese
- stroke
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明属于汉字信息处理范畴,计算机汉字编码
技术。主要解决目前汉字编码输入技术存在的容易
学的使用不便,而能快速输入的却比较难学、难记的
缺点。其技术特征是:选取约三百二十个简单易识的
字和部首作为编码码元,以声助记,充分利用汉字的
形状和结构位置的各种信息以求有效地对汉字进行
编码,三键一字。好学、好记,可以盲打和快速输入。
除专业人员外,对非专业人员也很有效,并适合外国
人和中小学生使用。
Description
本发明属于汉字信息处理范畴,主要用於计算机汉字输入编码,并适用于其他需要进行汉字编码(如编纂词典、汉字检索等)的场合。
根据汉字的结构可以拆分为各种字根和笔形,不同的笔形和字根可以组成不同的汉字,而且相同的笔形和字根因为相对位置的不同也可以组成不同的汉字,例如“杏”和“呆”字,但更典型的是“旱”、“旰”,这两个字的书写先后也一致。因此,利用汉字的形、位进行汉字编码是本发明的重要特征。
目前的汉字编码技术大致可分为三类:声码、形码或声形(形声)码,一般存在好学好记的使用起来却不太方便;而输入速度快适于专业人员使用的又比较难学;有的编码技术利用计算机键盘比较容易,但对一些见字就要编码的场合(如查字典)就比较困难。而且,新的字符集有两万多字,对于大多数人来说不可能利用声码来复盖整个的字集。
本发明可以有效的克服上述的缺点,具有:①见字识码,易学易用;②重码率低,计算机输入时可以盲打;③兼顾字典编纂、汉字信息检索等多方面的需要;④借用英文键盘可以方便外国人使用,广大的中小学生也容易掌握本技术。
本技术的全称是:“形声位全息汉字编码技术”,简称“罗码”。是一种非字根的编码方法,其特点是:1.采用约三百个简单字和十三种笔划作为编码码元,这些简单字的选取原则是:六笔以下容易认识的字;笔划虽多但不易拆分的字,如“革”,“鬼”等;《BG2312-80》中的大部分部首字。由於这些简单字的组合不能完全复盖整个汉字字集,又选择了十三种笔划作为编码码元。
在笔划的选择上除传统的横、竖、撇、折、捺、点外,还定义了几种复笔笔划,具体解释如下:①交和叉。交是纵笔或近似纵笔的斜笔和其他两笔或两笔以上的笔划相交者,叉是任何两笔相交者。注意交、叉与“丰”、“十”、“乂”等字的区别,遵循取码时先简单字后笔划的原则。
②弯、勾、折、角。弯和勾的区别是取码位置的不同,从起笔处取码为弯笔,而在收笔处取码则为勾。“弯”是同方向弯曲者,而“折”是反向弯转如“乙”字形等。角是弯笔或两笔呈直角或小於直角的顶点。我们规定弯笔在转角处取码为“角”笔,而折笔无论在何处取码都为“折”。
2.为了便于记忆,我们用上述的简单字(以下简称笔形)和笔划的读音声母的第一个拼音字母作为这些笔形、笔划的编码码元代码,如“木”的代码为m,“撇”的代码为p。有一个例外,“口”字的代码为o。并用I、U、V代表yi、wu、yu,这样用英文字母键和拼音字母相对应,用英文键盘输入汉字。
简单字和笔划的代码见表1,表2。
3.按位置顺序取码,充分提取汉字字形中形状和位置的信息,如前述的“旱”、“旰”二字尽管码元和落笔的先后顺序一样,但其相对位置不一样,其编码分别为rgh和rgs。
具体说编码的方法是:自左上角起顺时针方向依次取字的左上、右上、右下字角的码元代码为其编码,如“韶,ldo”。由于汉字结构复杂,应遵循以下的规则:①不重复取码,如果这个码元已经取过,那么顺序取另一个字角的码元,如“敬”,其右下角的“反文”已经取过,因此第三码应取左下角的“句”,因此其码为cfj(“草字头”,“反文”,“句”)。②标准码长为三字符,若该字只有两个码元,那么第三码从第二个码元的相应位置取,如“码”字由码元“石、马”组成,该字的编码为smz,第三码Z在马字的右下角取,因该角为一折笔,其代码为Z。③最大取码的原则,即从这个取码的字角看以笔划最多的码元作为该角的代码,如“休”字,编码为rmx,它的右下角除已用过的码元“木”外,可以看作一捺或一个小字,按这个原则取码为x。④上、下结构的汉字若只有两个码元取第三码时,如下部可以分为两码则取左下角否则顺时针取下部结构的左上角。如“充,vep”,“宋,bms”。这就是顺时针螺旋定位取码的原则。⑤对于同一码元可有不同的代码,如十字也可以看成“叉”,因此规定取码时的次序是:先繁后简,先笔形后笔划,先复笔后单笔,先曲笔(折、弯)后直笔。⑥其他规则:可拆不断,即一个码元可从整个字中抽出来,但不能断任何笔划,如“难”的右下角可拆出一个“圭”但不能将一竖断开而成一个“王”;上上下侧,即在字的上部取码应侧重最上面的笔划,而在下部取码则应偏向一侧的笔划;先外后内,即先取外框的码再从内部结构取下一码;托笔后取,在下面有一笔(如“走之”等)的字,右下角应先取托笔以上的码元,如“这,zwi”。可以看出,本技术充分注意了汉字结构中码元所在的位置信息。
取码口诀:顺序循角,螺旋定位。最大取码,先繁后简。先外后内,上上下侧。可拆不断,托笔后取。
4.为了便于取码,根据上面的原则和不同的汉字结构绘制了取码图,以便按图索骥。见图1。
5.简码和四码。选取了二十六个以声母命名的高频简码字,这些字也作为码元。其它简单字以其代码和左上角的码元为其编码。如:“是s”,“分fb”不足三码者输入空格键。对于三码有重码的字则应取第四码,其方法是:①如存在第四角,在第四角取码,如“韶ldor”;②均衡取码,在顺时针的第二个码元与已取过码的相对位置再取一码如“剖ldog”,“傅rfck”;③全息取码,某一位置还存在没有取用的码元,也可作为第四码,如“寂byxs”。
6.词组编码。①二字词,第一字取第一和第二码,第二字取第一码,如三码有重码,再加取第二字的第二码。如“安静bnq”,“客观boyj”。②三字词,第一字取一、二两码,第二、三字各取第一码。③多字词,第一、二、三字各取第一码,最后一个字取第一码。
7.本发明的载体是计算机软磁盘或硬汉卡以及编码表和说明书。
①运行环境:硬件IBM-PC系列机及其兼容机;软件:CCDOS2.13H;
②输入方式:利用英文键盘用英文字母键与相应的汉语拼音字母对应;
③软件的特点:高频字优先,即有重码时只要敲空格键高频字即会录入;第四码输入灵活,如“骏、梭”,“傅、俦”等字,它们区别所在的部位是不同的,前一组可以左下角区别,而后一组则可用第二码元的左下角来区别,因此它们的编码分别为“mvyt、mvyx”,“rfck、rfcj”这样就产生了二义性,用户可以从屏幕提示行来得到提示,熟练后就记住了并不须强记,而且提示行可以双重提示:
MVY:1.骏b 2.梭b 3.骏t 4.梭x
即可屏幕选字,经过熟悉可以盲打。
大多数的四码字第四码很明确。上面仅是为处理少数重码的方法。
汉字中有许多字很冷僻,但对某一地区或某些行业却是高频字,软件中设置了用户词典可按用户的约定编码方便地输入汉字。
实施例:
韶ldor 领lyb 树mcyj 棉mbjr
纸lsct 纸张lsgc
人r 人民rmj 人间rmr
从rrn 从前rred 从而rreh
健rvzz 健全rvrw 健康rvav
中zj 中国zjkd 中华zjrq
中国政府zkza 中华人民共和国zrrk
济dwd 济南dwns
Claims (2)
1、一种用于计算机汉字词输入及其它进行汉字词编码检索(如编纂词典)的技术,其特征是:①选取约三百二十个笔形简单、笔划少的易识汉字如:弓、长、立、早等作为编码码元,为了弥补这些字复盖不全的问题,将十三种笔划也作为码元。②为了便于记忆,将这些简单字和笔划的读音声母的第一个字母作为该码元的代码。③编码时按码元的位置顺时针螺旋形方向循字角取码,不拆字只按该字角的外形表现取码。④取码的规则是:顺序循角,螺旋定位,最大取码,先繁后简,先外后内,上上下侧,可拆不断,托笔后取。
2、本发明以计算机软磁盘或汉卡为载体,包括编码表及说明书。
①运行环境:硬件IBM-PC系列及其兼容机;软件CCDOS2.13H;
②输入方式:利用英文键盘用英文字母键与相应的汉语拼音字母对应;
③软件的特点:高频字优先,在有重码的情况下只要敲空格键便可录入;设置了用户词典,可以根据用户的需要而规定设置某些汉字词的编码以有效地避免重码高速输入。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN93110396A CN1059745C (zh) | 1993-04-20 | 1993-04-20 | 计算机形声位全息汉字输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN93110396A CN1059745C (zh) | 1993-04-20 | 1993-04-20 | 计算机形声位全息汉字输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1080070A true CN1080070A (zh) | 1993-12-29 |
CN1059745C CN1059745C (zh) | 2000-12-20 |
Family
ID=4988268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN93110396A Expired - Fee Related CN1059745C (zh) | 1993-04-20 | 1993-04-20 | 计算机形声位全息汉字输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1059745C (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1054449C (zh) * | 1998-08-28 | 2000-07-12 | 刘国桢 | 汉语字词全息编码计算机输入方法及键盘 |
CN1063555C (zh) * | 1996-08-31 | 2001-03-21 | 刘瑞祥 | 汉字三维三码字词兼容输入法 |
CN100345090C (zh) * | 2005-09-28 | 2007-10-24 | 王彦春 | 一种汉字的字型编码键盘输入法 |
CN103543841A (zh) * | 2013-11-13 | 2014-01-29 | 罗嗣孝 | 汉字唯一拆分输入法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1009498B (zh) * | 1985-04-01 | 1990-09-05 | 许家梁 | 拼音四角键盘盘面设计及输入方法 |
-
1993
- 1993-04-20 CN CN93110396A patent/CN1059745C/zh not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1063555C (zh) * | 1996-08-31 | 2001-03-21 | 刘瑞祥 | 汉字三维三码字词兼容输入法 |
CN1054449C (zh) * | 1998-08-28 | 2000-07-12 | 刘国桢 | 汉语字词全息编码计算机输入方法及键盘 |
CN100345090C (zh) * | 2005-09-28 | 2007-10-24 | 王彦春 | 一种汉字的字型编码键盘输入法 |
CN103543841A (zh) * | 2013-11-13 | 2014-01-29 | 罗嗣孝 | 汉字唯一拆分输入法 |
Also Published As
Publication number | Publication date |
---|---|
CN1059745C (zh) | 2000-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5360343A (en) | Chinese character coding method using five stroke codes and double phonetic alphabets | |
CN1025699C (zh) | 汉字四角音形编码输入法及其键盘 | |
CN1080070A (zh) | 形声位全息汉字编码 | |
CN1037598A (zh) | 八笔首音(傻瓜)码汉字输入方法 | |
CN1110739C (zh) | 一种计算机汉字输入方法 | |
CN1096112A (zh) | 一种汉字声母编码输入法及其所用键盘 | |
CN1079060A (zh) | 汉字音形字词编码输入系统 | |
CN1200332C (zh) | 一种汉字计算机输入方法 | |
CN1106146A (zh) | 电脑汉字声韵调编码输入法及其键盘 | |
CN1022350C (zh) | 汉字字母编码输入法 | |
CN1036359C (zh) | 计算机汉字反切编码输入法 | |
CN1081811C (zh) | 汉字画音码编码输入方法 | |
CN1055826A (zh) | 中华汉字编码输入方法 | |
CN1073021A (zh) | “声形码”编码方法及其键盘 | |
CN1040259C (zh) | 二笔字画编码法及二笔字画键盘 | |
CN1107256C (zh) | 一种汉字右码计算机输入方法 | |
CN1060870C (zh) | 计算机汉字输入的编码方法 | |
CN1341884A (zh) | 一种汉语输入法 | |
CN1139023C (zh) | 一种计算机汉字输入方法 | |
CN1164695A (zh) | 汉字笔形数值编码法 | |
CN1074556C (zh) | 声角笔对码汉字输入方法及键盘 | |
CN1153334A (zh) | 计算机汉字“字块编码”方案 | |
CN1060725A (zh) | 拼音加偏旁部首代码汉字输入法 | |
CN1072784A (zh) | 汉字声母四角编码新方法及其键盘 | |
CN1127895A (zh) | 一种拆字拼音的计算机输入键盘及其输入方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |