CN102339140A - 一种汉字拼形编码计算机输入方法 - Google Patents
一种汉字拼形编码计算机输入方法 Download PDFInfo
- Publication number
- CN102339140A CN102339140A CN2011103595208A CN201110359520A CN102339140A CN 102339140 A CN102339140 A CN 102339140A CN 2011103595208 A CN2011103595208 A CN 2011103595208A CN 201110359520 A CN201110359520 A CN 201110359520A CN 102339140 A CN102339140 A CN 102339140A
- Authority
- CN
- China
- Prior art keywords
- letter
- pinyin
- chinese character
- word
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明涉及一种汉字拼形编码计算机输入方法,属计算机文字信息处理领域。本发明依据汉字自然结构特点,把汉字分为三体字、二体字和独体字三类,按汉字笔画分为横(提)、竖、撇、点(捺)、折五类。三体字第一码为汉字拼音的首字母,第二码、第三码和第四码分别为第一体、第二体和第三体拼音的首字母;二体字第一码为汉字拼音的首字母,第二码和第三码分别为第一体和第二体拼音的首字母,第四码为汉字末笔画拼音的首字母;独体字第一码为汉字拼音的首字母,第二码、第三码和第四码按汉字书写笔顺为第一笔画、第二笔画和末笔画拼音的首字母,不足四码用字母O结束。本发明具有拆分汉字简单、直观、记忆量小、学习周期短等特点,可应用于计算机汉字编码输入领域。
Description
技术领域
本发明涉及一种汉字输入法,是一种汉字拼形编码输入法,属计算机中文信息处理技术领域。
背景技术
随着计算机技术的不断发展,用户对计算机汉字输入技术的要求越来越高,汉字编码方案的规范性、易学性、自然性等,逐渐成为用户选择该编码输入法的重要依据。目前的汉字编码输入法存在的主要问题是:
1、形码方案大多采用字根编码输入法或笔画编码输入法。字根编码输入法中涉及的字根数量多,汉字拆分规则复杂,虽然在一定程度上解决了重码率的问题,且一旦掌握,即可见字输字,其输入速度较快,但难学、难记却是字根编码输入法难以克服的障碍。笔画编码输入法虽然简单易学,但取码速度慢、重码率高却是笔画编码输入法的主要难题。因此,形码方案的编码过程复杂、记忆量大、容易忘记等一系列问题,是影响用户选择的重要因素。
2、音码方案对于不认识的汉字或者读音不准确的汉字则难以录入,并且因为汉字只有400多个音节,重码率极高(如全拼、双拼等方案),选字择字相当费时、费眼力,很大程度上影响了汉字的输入速度及输入效率,甚至无法输入不会读的汉字,不能适应各地区、各层次人员对汉字的输入要求,并且上述种种问题在拼音编码方案中是无法克服的。
随着计算机应用领域的逐步扩大和应用程度的不断深入,计算机汉字输入方法存在的上述问题,已成为制约汉字处理技术发展的主要因素之一,因此,有必要探索更为简单,更容易学会,更加规范、快速的汉字编码输入方法。
发明内容
本发明的目的在于提供一种汉字拼形编码计算机输入方法,只要掌握汉字的简单结构、笔画分类和汉字拼音的首字母,就可以快速完成汉字的拆分和输入,且不会遗忘。
本发明的技术方案是:依据汉字的自然结构,将汉字分为三体字结构、二体字结构、独体字结构三类,再依据汉字笔画,将汉字分为横(提)、竖、撇、点(捺)、折五类,其中:三体字结构为:上中下结构、左中右结构、上下或左右或内外或合体汉字的其中一部分能够继续拆分的结构,具体有下列六种三体字:上中下结构;左中右结构;左右结构,且左边或右边仍能按规则继续拆分;上下结构,且上边或下边仍能按规则继续拆分;内外结构,且内部仍能继续按规则拆分;合体结构,且其中一部分仍能继续按规则拆分。二体字结构为:上下结构;左右结构;内外结构;合体结构。独体字结构为:按自然结构不能进行拆分的汉字。本发明结合汉字的特点,设计了三体字结构、二体字结构、独体字结构的编码规则,从而实现了汉字编码方案的简单、易学、高效、低重码。
本发明的编码方案仍然使用原有的英文字母键盘,无需做任何改动。
本发明所述的拼形编码规则如下:
一、三体字结构的编码规则为:
第一码:汉字的拼音首字母;
第二码:汉字第一体的拼音首字母;
第三码:汉字第二体的拼音首字母;
第四码:汉字第三体的拼音首字母;
二、二体字结构的编码规则为:
第一码:汉字的拼音首字母;
第二码:汉字第一体的拼音首字母;
第三码:汉字第二体的拼音首字母;
第四码:汉字末笔画的拼音首字母;
三、独体字结构的编码规则为:
按汉字笔画书写顺序,将独体字分为一笔画的字、二笔画的字和三笔画及其以上的字,各类笔画的字按下列规则编码:
1、一笔画的字:
第一码:汉字的拼音首字母;
第二码:第一笔画的拼音首字母;
第三码:字母O,即不足四码时,用字母O结束;
2、二笔画的字:
第一码:汉字的拼音首字母;
第二码:第一笔画的拼音首字母;
第三码:第二笔画的拼音首字母;
第四码:字母O;
3、三笔画及其以上的字:
第一码:汉字的拼音首字母;
第二码:第一笔画的拼音首字母;
第三码:第二笔画的拼音首字母;
第四码:汉字末笔画的拼音首字母。
按以上规则,在对三体字或两体字进行编码时:
1、当汉字的第一体或第二体或第三体为成字时,取该成字的拼音首字母;
2、当第一体或第二体或第三体为非成字但该体为表2所列的偏旁部首时,取该偏旁部首对应的拼音首字母;
3、当第一体或第二体或第三体非成字且又不属于表2所列的偏旁部首时,按表3取第一体或第二体或第三体首笔画的拼音首字母;
4、按以上三体字、两体字和三笔画及以上的独体字的编码方法(即:先取整字的拼音,再取各体的拼音,简称为“先整后零”,下同),把汉字拼音的首字母作为最后一码,其余三码依次向前顺移,独体字中的一笔画字、二笔画字的汉字拼音的首字母移到字母O前,其余编码依次向前顺移(即:先取各体的拼音,再取整字的拼音,简称为“先零后整”,下同),增加了输入汉字的灵活性,对于不认识的汉字也能进行输入,从而达到混合输入的目的。
本发明具有下列优点和效果:采用上述方案,可自然、高效、快速完成汉字的拆分和输入,且重码率低,只要熟悉汉字的基本结构和汉字读音声母的首字母,就可输入汉字,适应期短,掌握后不会遗忘。本发明具有拆分汉字简单、直观、记忆量小、学习周期短等特点,可应用于计算机汉字编码输入领域。适合于任何层次的人员学习和使用,既适用于识字教学阶段的同步学习,也适用于已经掌握汉字、具备汉字拼读能力的人员使用。
具体实施方式
下面结合实施例对本发明做进一步描述。
实施例
本发明依据汉字的自然结构,将汉字分为三体字结构、二体字结构、独体字结构三类,再依据汉字笔画,将汉字分为横(提)、竖、撇、点(捺)、折五类,其中:
一、三体字结构有下列六种:
1、上中下结构,如“意、宽”等;
2、左中右结构,如“树、瓣”等;
3、左右结构,且左边部分能继续按规则拆分的汉字,如“剖、数、励”等,或右边能继续拆分的汉字,如“结、编、倍、涯”等;
4、上下结构,且上边部分能继续按规则拆分的汉字,如“智、驾”等,或下边能继续拆分的汉字,如“籍、崮”等;
5、内外结构,且内部能继续按规则拆分的汉字,如:“同、厢、周、阃”等;
6、合体字,且其中之一仍能继续按规则拆分的汉字,如“或、迥”等。
二、二体字结构为:
1、上下结构,且其中任何一部分按自然结构不能再拆分的汉字,如“字、类”等;
2、左右结构,且其中任何一部分按自然结构不能再拆分的汉字,如“任、利”等;
3、内外结构,且其中任何一部分按自然结构不能再拆分的汉字,如“凶、国”等;
4、合体结构,且其中任何一部分按自然结构不能再拆分的汉字,如“成、在、左”等。
三、独体字:不能拆分的汉字,如“大、中、重、一、十、乙”等。
本发明的编码方案仍然使用原有的英文字母键盘,无需做任何改动。
本发明的拼形编码规则如下:
一、三体字结构的编码规则为:
第一码:汉字的拼音首字母;
第二码:汉字第一体的拼音首字母;
第三码:汉字第二体的拼音首字母;
第四码:汉字第三体的拼音首字母;
如:
上中下结构:“意”的编码为:ylrx;“奔”的编码为:bdsh;
左中右结构:“树”的编码为:smyc;“堆”的编码为:dtrd;
上下结构,且上边部分能继续按规则拆分的汉字:“驾”的编码为:jlkm;
上下结构,且下边部分能继续按规则拆分的汉字:“籍”的编码为:jzlx;
左右结构,且左边部分能继续按规则拆分的汉字:“剖”的编码为:plkd;
左右结构,且右边部分能继续按规则拆分的汉字:“结”的编码为:jssk;
内外结构,且内部能继续按规则拆分的汉字:“同”的编码为:tshk;
合体字,且其中之一仍能继续按规则拆分的汉字:“氮”的编码为:dqhh。
二、二体字结构的编码规则为:
第一码:汉字的拼音首字母;
第二码:汉字第一体的拼音首字母;
第三码:汉字第二体的拼音首字母;
第四码:汉字末笔画的拼音首字母;
如:
上下结构的汉字:“舌”的编码为:sqkh;
左右结构的汉字:“村”的编码为:cmcd;
内外结构的汉字:“国”的编码为:gwyh;
合体汉字:“差”的编码为:cygh。
三、独体字结构的编码规则为:
按汉字笔画书写顺序,将独体字分为一笔画的字、二笔画的字和三笔画及其以上的字,各类笔画的字按下列规则编码:
1、一笔画的字:
第一码:汉字的拼音首字母;
第二码:第一笔画的拼音首字母;
第三码:字母O;
如:“一”的编码为:yho;“乙”的编码为:yzo。
2、二笔画的字:
第一码:汉字的拼音首字母;
第二码:第一笔画的拼音首字母;
第三码:第二笔画的拼音首字母;
第四码:字母O;
如:“十”的编码为:shso;“九”的编码为:jpzo。
3、三笔画及其以上的字:
第一码:汉字的拼音首字母;
第二码:第一笔画的拼音首字母;
第三码:第二笔画的拼音首字母;
第四码:汉字末笔画的拼音首字母;
如:“土”的编码为:thsh;“五”的编码为:whsh;“本”的编码为:bhsh;“果”的编码为:gszd。
在对三体字或两体字进行编码时:
1、当汉字的第一体或第二体或第三体为成字时,取该成字的拼音首字母,如:“地”中第一体为“土”,编码为“t”;“突”第三体为“犬”,编码为“q”;
2、当第一体或第二体或第三体为非成字但该体为表2中所列的偏旁部首时,取该偏旁部首对应的拼音首字母:
如:“代”中的第一体为“亻”,编码为“r”;“袖”中第一体为“衤”,编码为“y”;“虎”的第一体为“虍”,编码为“h”;
3、当第一体或第二体或第三体非成字且又不属于上述偏旁部首时,按表3取第一体或第二体或第三体首笔画的拼音首字母:
如:“石”的第一体为“丆”,不成字且不属于表2的偏旁部首,其首笔画为“一”,对应的拼音首字母为“h”;“冗”的第一体为“冖”,其首笔画为“丶”,对应的拼音首字母为“d”;“党”的第一体为“”,其首笔画为“丨”,对应的拼音首字母为“s”;
4、按以上三体字、两体字和三笔画及以上的独体字的编码方法(即:“先整后零”),把汉字拼音的首字母作为最后一码,其余三码依次向前顺移,独体字中的一笔画字、二笔画字的汉字拼音的首字母移到字母O前,其余编码依次向前顺移(即:“先零后整”),在输入过程中不用进行切换,增加了输入汉字的灵活性,从而达到混合输入的目的:
如:“一”按“先整后零”的编码为yho,也可以按“先零后整”的编码为hyo;
“十” 按“先整后零”的编码为shso, 也可以按“先零后整”的编码为hsso;
“土” 按“先整后零”的编码为thsh, 也可以按“先零后整”的编码为hsht;
“王” 按“先整后零”的编码为whhh, 也可以按“先零后整”的编码为hhhw;
“李” 按“先整后零”的编码为lmzh, 也可以按“先零后整”的编码为mzhl;
“材” 按“先整后零”的编码为cmcp, 也可以按“先零后整”的编码为mcpc;
“例” 按“先整后零”的编码为lrdd, 也可以按“先零后整”的编码为rddl;
“型” 按“先整后零”的编码为xkdt, 也可以按“先零后整”的编码为kdtx;
“编” 按“先整后零”的编码为bshs, 也可以按“先零后整”的编码为shsb;
“别” 按“先整后零”的编码为bkld, 也可以按“先零后整”的编码为kldb。
表1为不同类型汉字编码实例。
表2为偏旁、部首拼音首字母编码表。其中,表2中选用的22个偏旁部首进行编码,均为相应偏旁部首读音声母的首字母,无需特别记忆。不在表2中所列的其它偏旁部首按成字或其首笔画取码。
表3为笔画拼音首字母编码表。
表1 部分汉字编码实例
表2 偏旁或部首拼音首字母(编码)表
表3 笔画拼音首字母(编码)表
Claims (3)
1.一种汉字拼形编码计算机输入方法,其特征在于:依据汉字自然结构,将汉字分为三体字结构、二体字结构、独体字结构三类,再依据汉字笔画,将汉字分为横(提)、竖、撇、点(捺)、折五类,其中:三体字结构为:上中下结构、左中右结构、上下或左右或内外或合体汉字的其中一部分能够继续拆分的结构,三体字结构有下列六种:上中下结构;左中右结构;左右结构,且左边或右边仍能按规则继续拆分;上下结构,且上边或下边仍能按规则继续拆分;内外结构,且内部仍能继续按规则拆分;合体结构,且其中一部分仍能继续按规则拆分;二体字结构为:上下结构;左右结构;内外结构;合体结构;独体字结构为:按自然结构不能进行拆分的汉字。
2.如权利要求1所述的汉字拼形编码计算机输入方法,其特征在于所述的拼形编码具有下列规则:
一、三体字结构的编码规则为:
第一码:汉字的拼音首字母;
第二码:汉字第一体的拼音首字母;
第三码:汉字第二体的拼音首字母;
第四码:汉字第三体的拼音首字母;
二、二体字结构的编码规则为:
第一码:汉字的拼音首字母;
第二码:汉字第一体的拼音首字母;
第三码:汉字第二体的拼音首字母;
第四码:汉字末笔画的拼音首字母;
三、独体字结构的编码规则为:
按汉字笔画书写顺序,将独体字分为一笔画的字、二笔画的字和三笔画及其以上的字,各类笔画的字按下列规则编码:
(1)、一笔画的字:
第一码:汉字的拼音首字母;
第二码:第一笔画的拼音首字母;
第三码:字母O,即不足四码时,用字母O结束;
(2)、二笔画的字:
第一码:汉字的拼音首字母;
第二码:第一笔画的拼音首字母;
第三码:第二笔画的拼音首字母;
第四码:字母O;
(3)、三笔画及其以上的字:
第一码:汉字的拼音首字母;
第二码:第一笔画的拼音首字母;
第三码:第二笔画的拼音首字母;
第四码:汉字末笔画的拼音首字母。
3.如权利要求2所述的汉字拼形编码计算机输入方法,其特征在于在对三体字或两体字进行编码时:
(1)、当汉字的第一体或第二体或第三体为成字时,取该成字的拼音首字母;
(2)、当第一体或第二体或第三体为非成字但该体为表2所列的偏旁部首时,取该偏旁部首对应的拼音首字母;
(3)、当第一体或第二体或第三体非成字且又不属于表2所列的偏旁部首时,按表3取第一体或第二体或第三体首笔画的拼音首字母;
(4)、按以上三体字、两体字和三笔画及其以上的独体字,先取整字的拼音,再取各体的拼音,即先整后零,再把汉字拼音的首字母作为最后一码,其余三码依次向前顺移,独体字中的一笔画字、二笔画字的汉字拼音的首字母移到字母O前,其余编码依次向前顺移,即:先取各体的拼音,再取整字的拼音,即为先零后整。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011103595208A CN102339140A (zh) | 2011-11-14 | 2011-11-14 | 一种汉字拼形编码计算机输入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011103595208A CN102339140A (zh) | 2011-11-14 | 2011-11-14 | 一种汉字拼形编码计算机输入方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102339140A true CN102339140A (zh) | 2012-02-01 |
Family
ID=45514905
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011103595208A Pending CN102339140A (zh) | 2011-11-14 | 2011-11-14 | 一种汉字拼形编码计算机输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102339140A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102779003A (zh) * | 2012-06-20 | 2012-11-14 | 钟林 | 汉字拼形输入法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1098211A (zh) * | 1993-07-29 | 1995-02-01 | 石啸生 | 音形三码 |
CN1153334A (zh) * | 1995-06-11 | 1997-07-02 | 云南大理医学院 | 计算机汉字“字块编码”方案 |
CN1260528A (zh) * | 2000-01-17 | 2000-07-19 | 程东祥 | 计算机中文输入方法 |
-
2011
- 2011-11-14 CN CN2011103595208A patent/CN102339140A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1098211A (zh) * | 1993-07-29 | 1995-02-01 | 石啸生 | 音形三码 |
CN1153334A (zh) * | 1995-06-11 | 1997-07-02 | 云南大理医学院 | 计算机汉字“字块编码”方案 |
CN1260528A (zh) * | 2000-01-17 | 2000-07-19 | 程东祥 | 计算机中文输入方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102779003A (zh) * | 2012-06-20 | 2012-11-14 | 钟林 | 汉字拼形输入法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101694601B (zh) | 零记忆汉字编码输入法 | |
CN101882006B (zh) | 零记忆简单子字拆分输入法 | |
CN103616960A (zh) | 六元音字母双拼输入法 | |
CN102339140A (zh) | 一种汉字拼形编码计算机输入方法 | |
CN1141633C (zh) | 计算机二十四部首汉字排序输入法 | |
CN100498665C (zh) | 子母韩文输入法 | |
CN100501649C (zh) | 一种汉字形声编码输入法 | |
CN103744532A (zh) | 二十六偏旁部首字根中英和谐输入方法 | |
WO2005121993A1 (fr) | Systeme d'application d'apprentissage du chinois multidimensionnel | |
CN101551711A (zh) | 一种基于结构和基元的汉字编码输入方法 | |
CN102750002A (zh) | 数码汉字输入法 | |
CN103744533A (zh) | 三十偏旁部首字根输入法 | |
CN101699373B (zh) | 一种基于结构、基元和拼音的汉字输入方法 | |
CN102096478B (zh) | 复笔汉字输入法 | |
CN106021241A (zh) | 盲文点位汉字编码及其与盲文之间的机器翻译方法 | |
CN101063905B (zh) | 音数码汉字输入法 | |
CN102426484B (zh) | 零记忆十笔画汉字编码输入法 | |
CN103984420A (zh) | 一种基于拼音的藏文智能输入法 | |
CN1530805A (zh) | 中华形码汉字输入系统 | |
CN104536590B (zh) | 基于西夏文声韵字根输入法的嵌入式软键盘系统 | |
CN102043471A (zh) | 二十五偏旁部首字根中华形码输入法 | |
CN104133556B (zh) | 双笔类主副码字母型部首字典、声系字典汉字编码输入法及其键盘 | |
CN107977090A (zh) | 基于触摸屏的九宫汉字输入法 | |
CN114115886A (zh) | 用汉字正负数码法实现纯中文编程和建立纯中文操作系统 | |
CN1142474C (zh) | 字典码汉字输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120201 |