CN101038517A - 一种汉字形声编码输入法 - Google Patents
一种汉字形声编码输入法 Download PDFInfo
- Publication number
- CN101038517A CN101038517A CNA2007100658196A CN200710065819A CN101038517A CN 101038517 A CN101038517 A CN 101038517A CN A2007100658196 A CNA2007100658196 A CN A2007100658196A CN 200710065819 A CN200710065819 A CN 200710065819A CN 101038517 A CN101038517 A CN 101038517A
- Authority
- CN
- China
- Prior art keywords
- stroke
- chinese
- letter
- character
- strokes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 150000001875 compounds Chemical class 0.000 abstract description 2
- 230000010365 information processing Effects 0.000 abstract description 2
- 230000006978 adaptation Effects 0.000 abstract 1
- 208000006011 Stroke Diseases 0.000 description 79
- 241000282376 Panthera tigris Species 0.000 description 2
- 239000004575 stone Substances 0.000 description 2
- 241000219495 Betulaceae Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明涉及一种汉字形声编码输入法,属计算机文字信息处理领域。它把汉字按自然结构划分为独体字和两体字二类,汉字体的首笔画划分为斜、横、竖3类,分别与英文字母键盘的三行对应,次笔画划分为横、竖、撇、捺(点)、单折、复折六类,分别与英文字母键盘的第三至第八列对应,首、次笔画的关系分为交叉、方框二类,分别与英文字母键盘的第一、二列对应,从而形成3×8的二维坐标编码键位,取每字体首、次笔画组合得到两体字的第一码和第二码,第3码为组成该字第1体最大成字的汉语拼音首字母,第4码为该汉字的汉语拼音首字母;独体字按汉字书写顺序依次取笔对组合,后续码为汉字拼音的首字母;汉字最大编码码长为四码。本发明具有拆分汉字简单、直观、规范,编码键位安排唯一,不涉及字根、记忆量小、学习周期短,只要熟悉汉字首、次笔画所在键盘的行、列和汉字体及汉字读音声母的首字母,就可输入汉字,适应期短,掌握后不会遗忘。
Description
技术领域
本发明涉及一种汉字编码输入法,是一种基于汉字简单分类的形声编码输入法,属计算机中文信息处理领域。
背景技术
近几年来,虽然计算机技术得到不断的发展,其应用范围也在不断地扩大,但计算机汉字输入中仍然大量地依赖汉字编码方式进行操作,计算机中文信息处理过程中汉字输入方案的规范、易学和输入速度、正确率等仍然是制约用户工作效率的主要瓶颈之一。汉字键盘输入的现状是:虽然汉字编码出现了“万码奔腾”的情况,但符合规范、易学、高效、适合常规用户学习的编码方案却屈指可数,尤其在学校的汉字键盘输入教学中除了拼音输入法外,没有更好的汉字输入方案,直接影响了学生键盘输入汉字水平的提高。目前,大多汉字编码存在的问题是:
1、形码方案大多采用字根编码方法,字根的数量多,要熟记字根,还要记住字根的分布,要掌握字根的拆分原则和编码规则,使字根编码方案难学难记。因此,字根编码方案容易产生编码不规范、编码过程复杂、记忆量大、输入法难学、一段时间不使用就会忘记等一系列问题。
2、单纯的音码方案对不认识的汉字或读不准确的汉字难以录入,且因为汉字只有400多个音节,重码率高(如全拼、双拼方案)。因此,输入效率低、无法输入不会读的汉字、不能适应各种层次人员使用是拼音编码方案的缺陷,这些问题在拼音编码方案中不可能从根本上得到解决。
事实上,汉字是由“声、形、义”三要素构成的图形符号,汉字键盘输入编码方案都是利用汉字的“形”和“声”两种要素来进行编码的。在汉字编码方案设计中,提取汉字拼音的首字母、部份笔画和笔顺信息,既能体现汉字特征,又精简了汉字“形”和“声”的信息,既有利于编码元素的选取,又易于用户的掌握。充分利用汉字“形”和“声”的信息,可以自然降低了编码的重码率,又能使方案易学易用。
随着计算机应用领域的逐步扩大和应用程度的不断深入,计算机汉字输入方法的复杂性和易学性已成为制约汉字处理技术发展的主要因素之一,因此,有必要探索简单、易学、规范、快速的汉字编码输入方法。
发明内容
本发明的目的在于提供一种汉字形声编码输入法,只要熟悉汉字首笔画所在键盘的行,次笔画所在键盘的列,以及汉字体和汉字拼音首字母,就可以输入汉字,适合任何层次的人员学习和使用,掌握后不会遗忘。
本发明通过下列技术方案实现:把汉字按自然结构划分为独体字和两体字二种,再把汉字各体的首笔画划分为斜、横、竖三类,分别与英文字母键盘的三行对应,次笔画划分为横、竖、撇、捺(点)、单折、复折六类,分别与英文字母键盘的第三至第八列对应,首、次笔画之间分为交叉和方框二类,分别与英文字母键盘的第一、第二列对应,形成3×8的二维坐标编码键位,其中斜包含撇、捺、点、提四种笔画,竖包含竖和折二种笔画,具体对应关系见图1。
两体字和独体字按下列规则编码,且汉字最大码长为四码:
1、两体字:
两体字包含上下、左右、内外三种结构,按笔顺分为第1体字和第2体字,其编码规则是:
第一码:第1体字的首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:第2体字的首、次笔画对应英文字母键盘行、列相交的字母键;
第三码:第1体是成字的,取其成字体的汉语拼音首字母;
第1体不是成字的,取该体中头几笔画组成的最大成字体的汉语拼音首字母;
第1体中无最大成字体的,取该体偏旁部首的汉语拼音首字母(见表1);
不符合以上所列情况的,取第一体首笔画的汉语拼音首字母(见表2);
第四码:所编汉字的汉语拼音首字母;
2、独体字:
按汉字笔画书写顺序将独体字分为:一、二笔画字,三、四笔画字,五笔及其以上字,各类型字按下列规则编码:
(1)一、二笔画字:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码;汉字的汉语拼音首字母;
第三码:英文字母O键;
(2)三、四笔画字:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:第三笔画、末笔画对应英文字母键盘行、列相交的字母键;
第三码:汉字的汉语拼音首字母;
第四码:英文字母O键;
(3)五笔画、五笔画以上字:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:第三、第四笔画对应英文字母键盘行、列相交的字母键;
第三码:第五、末笔画对应英文字母键盘行、列相交的字母键;
第四码:汉字的汉语拼音首字母;
3、在以上按笔画对进行取码的过程中,如果笔画对的第一笔画和第二笔画构成交叉或方框时优先取码。
具体编码方法:
(一)两体字:
两体字的编码顺序为(第1体字的首、次笔画对应英文字母键盘行、列相交的字母键)(第2体字的首、次笔画对应英文字母键盘行、列相交的字母键)(第1体成字的汉语拼音首字母)(所编汉字的汉语拼音首字母),即:
1、第一码和第二码分别为第1体和第2体首、次笔画对应英文字母键盘行、列相交的字母键,其中构成交叉和方框时优先取码,如:
“码”拆分为“石、马”两体字,第1体为“石”,其首笔画是“一”、次笔画是“丿”,对应英文字母键盘行、列相交的字母键为“g”(见图1中的第2行第5列),第2体为“马”,其首笔画是“乛”(单折)、次笔画是“ㄅ”(复折),对应英文字母键盘行、列相交的字母键为“l”(见图1中的第3行第8列),第三码是第1体“石”的汉语拼音首字母“s”,第四码是该汉字的汉语拼音首字母“m”,因此编码分别为“glsm”。
“盘”拆分为“舟、皿”,第1码和第2码分别为“t、x”(第二体为方框)。
“体”拆分为“亻、本”,第1码和第2码分别为“r、a”(第二体为交叉)。
2、第三码按以下顺序确定编码:
(1)当组成该字的第1体是成字的,取第1体成字的汉语拼音首字母,如:
“码”的第1体“石”的汉语拼音首字母是“s”;
“地”的第1体为“土”,汉语拼音首字母为“t”;
“突”的第1体为“穴”,汉语拼音首字母为“x”。
(2)当第1体不是成字的,取该体中按书写顺序(头几笔画)的最大成字体的拼音首字母,如:
“能”中第1体最大成字体为“厶”,编码为“s”;
“断”中第1体最大成字体为“米”,编码为“m”;
“毅”中第1体最大成字体为“立”,编码为“l”;
(3)无最大成字体的,取第1体偏旁部首的汉语拼音首字母(见表1),如:
“代”中第1体为“亻”,编码为“r”;
“虎”中第1体为“虍”,编码为“h”。
“沟”中第1体为“氵”,编码为“s”。
(4)不符合以上所列情况时,取第1体首笔画的汉语拼音首字母(见表2),如:
“石”的第1体为“_”,首笔画的汉语拼音首字母为“h”;
“制”中第一体的首笔画是“丿”,其汉语拼音首字母为“p”;
“党”的第一体为“_”,首笔画是“丨”,其汉语拼音首字母为“s”。
3、第4码为该汉字的汉语拼音首字母。
(二)独体字:
独体字按汉字笔画书写顺序分为:一、二笔画字,三、四笔画字,五笔及其以上字三种类型,按以下规则编码:
1、一、二笔画字的编码顺序是:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:汉字的汉语拼音首字母;
第三码:英文字母O键。
2、三、四笔画字的编码顺序是:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:第三笔画、末笔画对应英文字母键盘行、列相交的字母键;
第三码:汉字的汉语拼音首字母;
第四码:英文字母O键。
3、五笔画、五笔画以上字的编码顺序是:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:第三、第四笔画对应英文字母键盘行、列相交的字母键;
第三码:第五、末笔画对应英文字母键盘行、列相交的字母键;
第四码:汉字的汉语拼音首字母。
即:独体字按汉字笔画书写顺序最多取3组笔画对组合进行编码,后续编码为汉字的汉语拼音首字母,当组成汉字的笔画数小于5时,在汉字拼音首字母编码后加字母“O”表示结束编码。如:
“一”的编码为“dyo”;“十”的编码为“aso”;
“土”的编码为“adto”;“王”的编码为“dcwo”;
“玉”的编码为“dcyy”;“生”的编码为“eads”;
“甲”的编码为“xdvj”;“本”的编码为“aydb”;
“串”的编码为“xszc”;“重”的编码为“exdz”或“exdc”。
附图说明
图1为本发明汉字各体的首笔画(斜、横、竖三类)、次笔画(横、竖、撇、捺(点)、单折、复折六类)、首、次笔画之间的关系(交叉和方框二类)分别与英文字母键盘的三行、第三至第八列、第一和第二列对应,并形成3×8二维坐标的编码键位图。即笔对中首、次笔画的编码键位对应关系图。
注:图1中第三行和第八列因为符号“,”键,编码时实际对应字母“L”键。
具体实施方式
本发明编码实施例见表3:
表3不同类型汉字编码实例
汉字 | 分类 | 编码 | 汉字 | 分类 | 编码 |
一 | 独体字(一笔画字) | dyo | 舌 | 两体字(上下结构) | exqs |
十 | 独体字(二笔画字) | aso | 高 | 两体字(上下结构) | exdg |
土 | 独体字(三笔画字) | adto | 织 | 两体字(左右结构) | mxrz |
五 | 独体字(四笔画字) | fcwo | 汇 | 两体字(左右结构) | yjsh |
本 | 独体字(五笔画字) | aydb | 且 | 两体字(内外结构) | xdsq |
果 | 独体字(五笔画以上字) | xdhg | 居 | 两体字(内外结构) | casj |
表2笔画拼音首字母编码表
笔画 | 拼音首字母编码 | 笔画 | 拼音首字母编码 | 笔画 | 拼音首字母编码 |
一 | h | 丨 | s | 丿 | p |
、 | d | 乛(乚亅__) | z |
表1偏旁、部首拼音首字母编码表
偏旁或部首 | 拼音首字母编码 | 偏旁或部首 | 拼音首字母编码 | 偏旁或部首 | 拼音首字母编码 |
艹 | c | 扌 | s | 雨(头) | y |
刂 | d | 虍 | h | 罒 | s |
_ | z | _ | z | 攵 | w |
饣 | s | 钅 | j | 犭 | q |
亻 | r | 牜 | n | 衤 | y |
冫 | d | 疒 | b | 讠 | y |
忄 | x | 氵 | s | 礻 | d |
辶 | z | 阝 | e | 纟 | r |
注:1、本表共使用24个偏旁部首进行编码,均为相应偏旁部首读音声母的首字母,无需特别记忆。2、不在本表中所列的其它偏旁部首按成字或其首笔画取码。
Claims (3)
1、一种汉字编码输入法,其特征在于把汉字按自然结构划分为独体字和两体字二种,把各字体的首笔画划分为斜、横、竖三类,分别与英文字母键盘的三行对应,次笔画划分为横、竖、撇、捺(点)、单折、复折六类,分别与英文字母键盘的第三至第八列对应,首、次笔画之间分为交叉和方框二类,分别与英文字母键盘的第一、第二列对应,形成3×8的二维坐标编码键位,其中斜包含撇、捺、点、提四种笔画,竖包含竖和折二种笔画,具体对应关系如下(其中:第三行第八列实际对应字母L键):
交叉 方框 横 竖 撇 捺(点) 单折 复折
Q
W
E
R
T
Y
U
I
O
P
A
S
D
F
G
H
J
K
L
Z
X
C
V
B
N
M
(L)
斜(撇、捺、点、提)
横
竖和折
2、两体字和独体字按下列规则编码,汉字最大码长为四码:
(1)两体字:
两体字包含上下、左右、内外三种结构,按笔顺分为第1体字和第2体字,其编码规则是:
第一码:第1体字的首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:第2体字的首、次笔画对应英文字母键盘行、列相交的字母键;
第三码:第1体是成字的,取其成字体的汉语拼音首字母;
第1体不是成字的,取该体中头几笔画组成的最大成字体的汉
语拼音首字母;
第1体中无最大成字体的,取该体偏旁部首的汉语拼音首字母;
不符合以上所列情况的,取第一体首笔画的汉语拼音首字母;
第四码:所编汉字的汉语拼音首字母;
(2)独体字:
按汉字笔画书写顺序将独体字分为:一、二笔画字,三、四笔画字,五笔画及其以上字,各类型字按下列规则编码:
一、二笔画字:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:汉字的汉语拼音首字母;
第三码:英文字母O键;
三、四笔画字:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:第三笔画、末笔画对应英文字母键盘行、列相交的字母键;
第三码:汉字的汉语拼音首字母;
第四码:英文字母O键;
五笔画、五笔画以上字:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:第三、第四笔画对应英文字母键盘行、列相交的字母键;
第三码:第五、末笔画对应英文字母键盘行、列相交的字母键;
第四码:汉字的汉语拼音首字母;
3、在以上按笔画对进行取码的过程中,如果笔画对的第一笔画和第二笔画构成交叉或方框时优先取码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2007100658196A CN100501649C (zh) | 2007-04-18 | 2007-04-18 | 一种汉字形声编码输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2007100658196A CN100501649C (zh) | 2007-04-18 | 2007-04-18 | 一种汉字形声编码输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101038517A true CN101038517A (zh) | 2007-09-19 |
CN100501649C CN100501649C (zh) | 2009-06-17 |
Family
ID=38889453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2007100658196A Expired - Fee Related CN100501649C (zh) | 2007-04-18 | 2007-04-18 | 一种汉字形声编码输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100501649C (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106708286A (zh) * | 2017-01-10 | 2017-05-24 | 厦门雅迅网络股份有限公司 | 一种智能手表输入法 |
CN107728805A (zh) * | 2016-08-11 | 2018-02-23 | 吴敬祖 | 笔画与拼音输入法 |
CN107885338A (zh) * | 2017-10-17 | 2018-04-06 | 惠州Tcl移动通信有限公司 | 笔画输入处理方法、计算机可读存储介质及终端 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1234061C (zh) * | 2001-03-12 | 2005-12-28 | 肖湘茂 | 英文字母键盘和数字键盘通用汉字电脑输入法及其键盘 |
CN1538276A (zh) * | 2003-04-17 | 2004-10-20 | 吴宗继 | 汉字一笔音形结合码输入法 |
CN1211726C (zh) * | 2003-04-22 | 2005-07-20 | 李建学 | 一种使用位形音汉字编码的输入法 |
-
2007
- 2007-04-18 CN CNB2007100658196A patent/CN100501649C/zh not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107728805A (zh) * | 2016-08-11 | 2018-02-23 | 吴敬祖 | 笔画与拼音输入法 |
CN106708286A (zh) * | 2017-01-10 | 2017-05-24 | 厦门雅迅网络股份有限公司 | 一种智能手表输入法 |
CN106708286B (zh) * | 2017-01-10 | 2022-10-18 | 厦门雅迅网络股份有限公司 | 一种智能手表输入法 |
CN107885338A (zh) * | 2017-10-17 | 2018-04-06 | 惠州Tcl移动通信有限公司 | 笔画输入处理方法、计算机可读存储介质及终端 |
Also Published As
Publication number | Publication date |
---|---|
CN100501649C (zh) | 2009-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101038517A (zh) | 一种汉字形声编码输入法 | |
CN1141633C (zh) | 计算机二十四部首汉字排序输入法 | |
CN1945503A (zh) | 汉字(结构码)输入法及其装置 | |
CN101055502A (zh) | 一种汉字快笔输入法 | |
CN1435749A (zh) | 汉字笔音码输入法及键盘 | |
CN1147780C (zh) | 三笔数码汉字输入方法 | |
CN1142478C (zh) | 一种电脑汉字输入法 | |
CN1107899C (zh) | 计算机四角汉字输入法 | |
CN1138197C (zh) | 十笔字型形音码输入方法 | |
CN1530805A (zh) | 中华形码汉字输入系统 | |
CN1303506C (zh) | 汉字拼音标调定型输入法 | |
CN1598743A (zh) | 按规范笔顺输入汉字的输入法及其键盘 | |
CN1244855C (zh) | 中文信息处理汉字数字化规范编码输入技术 | |
CN1704878A (zh) | 新方码 | |
CN1186709C (zh) | 中文输入法 | |
CN1272693C (zh) | 仿真拼音数字输入法 | |
CN1167994C (zh) | 一二三四输入法 | |
CN1160883A (zh) | 声双码计算机汉字输入法 | |
CN1054446C (zh) | 一种合成编码的计算机汉字输入方法 | |
CN1395160A (zh) | 十笔字型输入方法 | |
CN100444090C (zh) | 五体笔块码汉字输入方法 | |
CN1932740A (zh) | 五加加汉字输入法 | |
CN1538278A (zh) | 一种数码汉字输入法及其键盘 | |
CN1264074A (zh) | 计算机汉字输入方法 | |
CN1165334A (zh) | 大字符集简笔汉字输入法及其键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090617 Termination date: 20100418 |