CN1328283A - 形数关联汉字编码输入方法 - Google Patents
形数关联汉字编码输入方法 Download PDFInfo
- Publication number
- CN1328283A CN1328283A CN 00131600 CN00131600A CN1328283A CN 1328283 A CN1328283 A CN 1328283A CN 00131600 CN00131600 CN 00131600 CN 00131600 A CN00131600 A CN 00131600A CN 1328283 A CN1328283 A CN 1328283A
- Authority
- CN
- China
- Prior art keywords
- radical
- numeral
- character
- chinese
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 238000007789 sealing Methods 0.000 claims description 10
- 235000008429 bread Nutrition 0.000 claims description 9
- 238000005096 rolling process Methods 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 238000005194 fractionation Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 claims description 2
- 240000000233 Melia azedarach Species 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 description 12
- 235000015170 shellfish Nutrition 0.000 description 8
- 241000209094 Oryza Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 2
- 239000004570 mortar (masonry) Substances 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明提出一用数字进行汉字编码的方法。将汉字常用偏旁部首以宏观外形分为10种,其宏观外形分别与数字0-9具有关联特征,从而使用0-9数字表示和编码。字根分组完全以宏观外形而不强调笔形笔画,且与数字对应分配上具有巧妙的有序性或规律性,形成数字代码的“数”与字根宏观上的“形”直接联系,方便记忆,汉字在拆为字根部件后,按照“外形”即可对应确定出“数”-即数字代码。依据“形”-“数”联想编码记忆量极小、可在手机、电话、电脑等设备中方便实现数字编码的中文输入。
Description
本发明涉及一种用数字进行汉字编码输入的方法。
目前,在已有的汉字编码方案中主要集中在计算机键盘输入编码上,使用字母键位和数字键位。利用数字对汉字进行编码的方法主要有“五笔画”、“区位码”等,主要依据汉字笔画或偏旁进行编码。
本方案是一种拼形输入方法,即通常所指的“形码”。由于一般拼形方法普遍要使用200个左右字根,记忆量大,因而字根的分类规律性和在键位上对应分布的有序性,将是确定编码方法有无创造性的重要方面。
本发明的目的在于编制出一套具有规律性的汉字字根分组方案,并确定“字根分组”与“数字”的有机对应,达到易学易记,面向大众的目标,可广泛在手机、电话、电子记事本、电脑小键盘等具有数字键位的电子产品和设备上进行中文处理。
一、汉字的字根几何分类
由于汉字是一种图形符号,某字根具有几何学上特定图形特征,本发明提出利用字根宏观外形进行几何分类,将常用字根分为10类。
1、单方向线条(平行线):是主体为“水平、竖直、左斜”3个方向
的线条组合,也就是常说的“横-竖-撇”三种基本笔形,字根如
“一二三,丨刂川卜,丿
彡”等等。字根由数字“1”关联表示。
2、二方向包围字根:字根主体从两个相连方向上形成封闭。字根如
外形可描绘为“、、”。因有2个方向包围,故由数字“2”
关联表示。
3、三方向包围字根:字根主体从三个相连方向上形成封闭。字根如
廿”,它们的基本宏观外形可描绘为“匚、、冂、凵”四种3面包围。由数字“3”关联表示(即包围边的数量)。
宏观外形可描绘为“日、四、田”,这里以“田”来表示。由数字
“4”关联表示(“4“方形或”四“面包围中都含有”4“)。
5、“五(工)”形垂直字根:字根中中部竖线与上或(和)下水平线
本组中使用的字根“五“具有顶底双垂特点。由数字“5”关联表
示(可与“五“形交和字意相交)。
6、“六字型”离散字根:包含以“六”字头(亠)为主要特征开头
7、“七”交叉:字根形成交叉形状,包含正交和斜交,汉字“七”
8、“八”字型对称字根:字根呈左右对称,上部小底部扩散状,即
号记为“八”(或“人”)。由数字“8”表示(“八”与“8”关联)。
9、“九”状连折字根:连折形的字根常常包围方向不确定,如汉字
“九“中包含的”乙“状,字根如”乙九之讠ㄣ弓已ㄋ“,代表
符号用”乙“或“九”表示。由数字“9”表示(本组含有“九”
字并联用“九曲”之意)。
10、“0”形空心字根:字根为空心四方形,是汉字是较常用字根,
以上10种类型字根可简称为:“一单线、二包围、三包围、四方形、五垂直、六分散、七交叉、八对称、九连折、0空心”。这些类型分别与数字1、2、3、4、5、6、7、8、9、0对应进行分配,记忆和使用非常方便。
手机、电话机等常用键面的代表字根分布示意
在编码中,使用了130个左右基本汉字字根,经分析可满足GB2312-80字符集的汉字的编码使用。由于汉字字根是以宏观外形分类的,对于汉字扩充字符集和其它繁体字符集的需求,可要求扩充和增加繁体字字根,仍然依外形归类,因而记忆量并不会增加。如繁体字中常用的“門”按形状基本为3面包围,分布在3上,“貝”主体为四方形,分配在数字4上。因而,本方案中字根的选用针对不同字库要求可以扩充。
本方案可以进行单字和词组编码。
1、单字编码规则:
(1)将单字拆为一个至多个子根,根据子根所属数字对应编码,拆
分时按照汉字的书写顺序左向右,从上到下的习惯拆分,拆分
中力求取大,使编码最简,但字根间能独立或相连时就不拆分
为交叉的。
(2)单字编码选长度不超过4位,超过4位时取1、2、3和末个字
根进行编码。下面是一些汉字的拆分和编码例子:【中】(口丨)01 【国】(口王丶)056 【朋】(月月)33【崩】(山月月)333 【间】(门日)34 【昆】(日匕匕)422【盟】(日月皿)434 【置】(皿十且)474 【厕】(厂贝刂)231【书】(丨丶)2216 【词】(讠
一口)9210 【容】(宀八八口)3880【排】(扌三
三)7111 【剔】(日勹
刂)4211 【搪】(扌广彐口)7230【嘤】(口贝贝女)0337 【悬】(且厶心)422 【商】(六冂八口)6380【网】(冂XX)377 【断】(米斤)722 【担】(扌日一)741【场】(土弓彡)591 【园】(口二儿)018 【周】(冂土口)350【画】(一田凵)143 【东】(七小)78 【费】(弓刂贝)913【脑】(月文凵)363 【搪】(扌广彐丨口)0344 【局】(尸
口)220(3)繁体汉字的拆分取码方法一致,如:彄→(弓匚口口口)-----编码为9300悶→(門心)----编码32由上面介绍可看出,数字几何编码时主要根据字根宏观外形并与相关数字进行“联想”快速确定编码。例如:
能→厶 月 匕 匕
↓ ↓ ↓ ↓(宏观外形为) 对应包围量为2322
↓ ↓ ↓ ↓对应编码 2 3 2 2 看包围宏观形状确定编码
商→六 冂 八 口
↓ ↓ ↓ ↓
编码为 6 3 8 0(“六、八、口”的编码为6、8、0联想巧妙)
这样,主要看字根形状即可定出编码,如【电】拆为日乚,是一个4面包围和2面包围形,编码为42。(4)字根表中已有的字规定为“连击3次+0键″,如【门】编码为【3330】,【广】编码为【2220】,简单字不拆确定编码更方便。
2、词组编码规则
词组编码中使用长度为4位进行编码,双字词以次取各字前2位进行编码;三字词取1、2、3字首码和第三字第二码;三字以上取1、2、3字和末字首码。词组编码时遇到使用的子根作为单字在词组中出现,不再拆分,只重复以本键自身表示。
例如:
【昆明】----------→(日匕日月)→4243
【朋友】----------→(月月ナ又)→3377
【工人】----------→(工工人人)→5588
【记忆】----------→(讠己忄乙)→9919
【亏空】----------→(二ㄣ
宀八)→1938
【中国】----------→(口丨口王)→0105
【语文】----------→(讠五文文)→9566
【历史】----------→(厂力口X)→2207
【参观团】--------→(厶又口十)→2707
【联合国】--------→(耳人口王)→4805
【司空见惯】------→(
宀冂忄)→2331
【中国人民解放军】→(口口人冖)→0083
3、单字编码不足4码时的识别码
为减少单字编码重码,在汉字编码长度小于4时可在后面增加识别码,识别码以汉字尾部结构和字型结构为特征确定
(1)汉字字型结构:将汉字分为左右结构、上下结构、混合结构,
分别对应1-2-3、4-5-6、7-8-9三行数字表示。如:A、左右结构:如“朋明什回响计程从林项”B、上下结构:如“昌置量全类是号贡雪婪”C、混合结构:如“团回田又大正出王五天”
(2)汉字尾部结构:结尾的子根或笔划的几何形状分为3种即单线
条结尾、包围结尾、单点型结尾,分别以1-4-7、2-5-8、3-6-9
识别码对应如下:
单线条结尾 包围结尾 单点型结尾左右结构 1 2 3上下结构 4 5 6混合结构 7 8 9
识别码以汉字尾部结构和字型结构为特征确定,例如:汉字“回”的结构是“混合型”,字尾是“包围(口)”,识别码为“8”,同样汉字“万”的识别码也是“8”;汉字“吕”是上下结构,识别码为“5”;汉字“林”的识别码为“3”,汉字“太”的识别码为“6”等等。
识别码仅在使用中作为辅助可选技术。
4、简码
汉字单字标准码长为4,而常用字一般1-3码即可确定,这可根据汉
字的使用频度确定,同时可进一步降低重码。
如“一”编码“1”;“二”编码“11”;“三”编码“111”等。
“国”编码“05”(2级简码);“恰”编码“181”(3级简码)。
1-3级简码可容纳1000余个常用汉字,可大大提高输入速度。三、宏观字根特征进行数字编码的优点1、字根的分类方法上有显著的实质性特征
字根分类基本规则十分简单,即“字根包围看封闭量,不成包围看交连形态”,首次将汉字字根按几何宏观外形分为“1方向单线、2面包围、3面包围、四方形、五形垂直、六状离散、七状交叉、八字对称、九状连折、0型空心”共10大类,这对于字根分类记忆和使用十分方便,可使用户迅速掌握。字根分类后在宏观外形上是十分相近的,这对于分类记忆具有的特征。2、字根分类特征与数字本身具有奇妙的相关是分类方法的显著特点
汉字字根分类体现了中文图形字符的特征,同时在分组中巧妙使用数字与分组特征配合,更使分组的理解记忆变得简单、易用、具有趣味性。在10个字根组中,0代表“口”,外形便于联想;1代表单一方向线条;2、3上就是字根包围封闭量,如“冂”在3上;4是代表四方形,与字根中的“四”对应;5是代表“工(五)”形垂直字根,与字根中“五”对应;6代表“六首(亠)”型字根,与数字“六”对应;7代表“交叉”字根,对应的字根“七”主体就是交叉形状;8代表“八字对称”之意,与数字“八”巧妙融为一体;9代表“曲折”字根,与数字“九”形状不谋而合,尤言“九曲”之意。
下面是几个字例:
“中”的部件为“口丨”编码为“01”。
“画”的部件为“一田凵”编码为“143”(看包围封闭量)
“众”的部件为“人人人”编码“888”(“人”同“八”形)
“崩”的部件为“山月月”编码“333”(看包围数量)
“商”的部件为“六冂八口”编码6380(六→6冂→3八→8口→0)
“厕”的部件为“厂贝刂”编码为“231”(厂→2贝→3刂→1)3、字根分组记忆与编码十分简单字根组中各组的分配是依据宏观外形,而不是按笔画、笔顺或拼音。在人们学习和使用汉字的过程中,由于汉字是图形文字,人脑中首次产生的是对图形的总体轮廓,汉字几何字根分类就是使用的这种“模糊”印象进行快速记忆。如“冂门月巾冖雨贝
舟,山臼,彐”等就可统一按“包围量”对应到数字“3”上,无论从字根记忆还是在编码中都是十分快捷的。4、应用的设备范围和适应的用户范围十分广阔
本方案可广泛应用在电脑、手机、电子记事本、普通电话等大量具有数字键位的电子产品中,具有广阔的应用前景。
本方案分体现了汉字是图形文字的特征,编码中仅使用字汉字字根的宏观结构。也就是说,在汉字编码过程中,使用者可以通过对汉字平面组合的宏观印象识别出这种特征,从而直接提取出字根形状并联想到对应数字,达到“看字知码”的效果。
本方案易学易用,不易遗忘。使用几何宏观外形编码,对于汉语水平较差的外籍人士,亦可在短时间内掌握。因而,这一方案对于汉字在世界上的推广应用是有独特价值的,尤其对于不精通或不懂中文的非汉语语系人士,他们在进行汉字输入时完全可以在不熟悉汉字笔画笔顺情况下,使用这种方法去记忆众多字根,甚至直接根据汉字的宏观框架结构,使用这种特征去推测汉字编码。因而,这一方案号有望为汉语的世界性交流中发挥作用。
Claims (9)
1.一种用数字进行汉字编码的方法,其特征在于:将编码使用的字根(偏旁部首)按外形的宏观图形特征分成10大类,每类具有一种与数字相关的宏观外形特征,从而使每组字根与数字0-9形成字根的“形”与表示键的“数”密切相关,形成易于记忆的数字分组方法和数字键位分布,各个数字对应的汉字偏旁部首和分组特征如下:
2、根据权利要求1所述的汉字数字编码,其特征在于:10个数字键上分布的字根是一种具有与数字本身具有“形与数“关联和联想记忆的有序分组,数字0外形与“口”相近,数字1、2、3、4代表的字根类型分别是1、2、3、4个线条封闭包围方向(单线条可为1个方向包围),其中4上含字根“四”便于联想记忆,数字5上字根“五”可代表基本字根特征,数字6上用字根“六”代表基本形状、数字7上用“七”表示交叉型字根,数字8上为“八”字型左右对称字根,数字9上是“九”形连折状的字根。
3、根据权利要求1所述的汉字数字编码,其特征在于:在字根具有明确封闭或包围结构时分为单一(“1”)线条、2面、3面、4面包围特征,无包围特征时将字根宏观图形分为“五”字垂直、“八”字对称、“九”形连折、“六”状离散共5种,并以此对字根进行分组。
4、根据权利要求1所述的汉字数字编码,其特征在于:是一种按字根宏观外形进行的字根分组方法,数字键1上分配的是一个方向的单线条构成的字根,数字2、3、4分配的是2面、3面、4面包围或封闭的字根、数字5分配上或下为水平线中间有垂直线连结的垂直状字根,数字6上分布散点(含捺)和六字形开头字根、7上分配交叉型字根,数字8上为左右分散且基本对称字根,数字9上是连折状的字根,字根0只是“口”字根(含“母”字外框)。
5、根据权利要求1所述的汉字数字几何编码,其特征在于:汉字编码中将单字拆为一个或多个子根,根据子根所属的母根类别,选取不超过4个母根进行母根编码,超过4键时取1、2、3和末位进行编码。
6、根据权利要求1所述的汉字数字几何编码,其特征在于:汉字编码中将单字拆为一个或多个子根时,按照汉字的书写顺序左向右,从上到下的习惯拆分,拆分中力求取大,使编码最简,但字根间能独立或相连时就不拆分为交叉的。
7、根据权利要求1所述的汉字数字几何编码,其特征在于:对词组编码中使用长度为4位进行编码,双字词以次取各字前2位进行编码;三字以及三字以上取1、2、3和末字首码。
8、根据权利要求1所述的汉字数字几何编码,其特征在于:词组编码中遇到字根表中子根作为单字时不再拆分,只重复以本键自身表示。
9、根据权利要求1所述的汉字数字几何编码,其特征在于:为减少单字编码重码,在汉字编码长度小于4时可在后面增加识别码,识别码以汉字尾部结构和字型结构为特征确定,即将汉字分为左右结构、上下结构、混合结构,分别对应1-2-3、4-5-6、7-8-9三行数字,汉字结尾的子根或笔划的几何形状分为3种即单线条结尾、包围结尾、单点型结尾,分别以1-4-7、2-5-8、3-6-9三列表示,识别码由字型所在的行和尾部结构所在的列确定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 00131600 CN100351753C (zh) | 2000-11-02 | 2000-11-02 | 形数关联汉字编码输入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 00131600 CN100351753C (zh) | 2000-11-02 | 2000-11-02 | 形数关联汉字编码输入方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1328283A true CN1328283A (zh) | 2001-12-26 |
CN100351753C CN100351753C (zh) | 2007-11-28 |
Family
ID=4594756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 00131600 Expired - Fee Related CN100351753C (zh) | 2000-11-02 | 2000-11-02 | 形数关联汉字编码输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100351753C (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011003359A1 (zh) * | 2009-07-10 | 2011-01-13 | Zang Zhongwei | 爽快录字法 |
CN102750008A (zh) * | 2012-06-18 | 2012-10-24 | 申重学 | 汉字实用书写数字化输入法 |
CN103513779A (zh) * | 2012-06-18 | 2014-01-15 | 申重学 | 数字化汉字实用书写输入键盘 |
-
2000
- 2000-11-02 CN CN 00131600 patent/CN100351753C/zh not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011003359A1 (zh) * | 2009-07-10 | 2011-01-13 | Zang Zhongwei | 爽快录字法 |
CN101957661A (zh) * | 2009-07-10 | 2011-01-26 | 臧忠卫 | 爽快录字法 |
CN101957661B (zh) * | 2009-07-10 | 2015-08-05 | 臧忠卫 | 爽快录字法 |
CN102750008A (zh) * | 2012-06-18 | 2012-10-24 | 申重学 | 汉字实用书写数字化输入法 |
CN103513779A (zh) * | 2012-06-18 | 2014-01-15 | 申重学 | 数字化汉字实用书写输入键盘 |
Also Published As
Publication number | Publication date |
---|---|
CN100351753C (zh) | 2007-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1047447C (zh) | 实虚笔形编码计算输入法 | |
CN1328283A (zh) | 形数关联汉字编码输入方法 | |
CN1211726C (zh) | 一种使用位形音汉字编码的输入法 | |
CN1292335C (zh) | 一种汉字笔顺输入法 | |
CN1020386C (zh) | 结构笔画四位数编码法及键盘 | |
CN1081004A (zh) | 汉字结构笔顺数字编码方法 | |
CN1137432C (zh) | 快易码汉字输入法 | |
CN101782807B (zh) | 10笔部2字型字母键盘和数字键盘通用汉字输入法 | |
CN1293452C (zh) | 一种见字即识形码也可使用音码的汉字键盘输入方法 | |
CN1120404C (zh) | 一种数字小键盘15键汉字输入法 | |
CN1109282C (zh) | 汉字数码输入法 | |
CN101840271A (zh) | 纯声输入法 | |
CN1089920C (zh) | 计算机四角八位汉字输入法 | |
CN1243302C (zh) | 汉字辅元音形码输入法 | |
CN1118085A (zh) | 可用数字键盘输入的汉字输入系统及其键盘 | |
CN1115619C (zh) | 一种字元拼形计算机汉字输入法 | |
CN1204484C (zh) | 四笔汉字输入方法 | |
CN1272692C (zh) | 规范顺手汉字电脑输入法 | |
CN1052314C (zh) | 一种汉字二维数码的计算机键盘输入方法 | |
CN1123814C (zh) | 计算机二笔体系根形码汉字输入方法 | |
CN1056006C (zh) | 汉字编码输入方法 | |
CN1095833A (zh) | 一种计算机汉字输入方法 | |
CN1105765A (zh) | 一种汉字信息处理系统 | |
CN1109955C (zh) | 汉字部件笔顺编码输入法及其输入键盘 | |
CN1153339A (zh) | 汉字“中华之声”码计算机键盘输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |