CN1368671A - 通用汉字笔序数字编码法及其键盘 - Google Patents
通用汉字笔序数字编码法及其键盘 Download PDFInfo
- Publication number
- CN1368671A CN1368671A CN 02115485 CN02115485A CN1368671A CN 1368671 A CN1368671 A CN 1368671A CN 02115485 CN02115485 CN 02115485 CN 02115485 A CN02115485 A CN 02115485A CN 1368671 A CN1368671 A CN 1368671A
- Authority
- CN
- China
- Prior art keywords
- code
- stroke
- chinese character
- character
- coding method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明是一种通用汉字笔序数字编码法及其键盘。本编码是将汉字的全部笔画分为单笔画和复合笔画,按笔顺编码,其代码是数字,编码原则是前码优先、兼顾直观;单笔画代码,使用数字1、2、3、4、5、6,依次将“一、丨、丿、、、乙”六种约定俗成的单笔画定码,“ノ、丶、亅”代码依次是1、4、5;复合笔画的代码,使用数字0、1、2、3、4、5、6、7、8、9,其代码由两个单笔画代码之和构成,最大之和为12,其中,10、11、12为复数代码,分别取其个位数0、1、2作代码。本发明具有编码科学规范、操作简单、易学难忘、通用性强、动态码长短和可扩充性等优点,可在移动电话、电话信息终端、掌上电脑、电脑等信息设备的数字键上实现字词、标点符号、阿拉伯数字和字母的快速输入。
Description
技术领域
本发明涉及汉字信息处理领域,特别是一种通用汉字笔序数字编码法及其键盘。
背景技术
纵观汉字数字编码的发展(请见附三),是一个学习过程由难到简、使用功能由单一到完善的发展过程。电报码是一种机械而笨拙的编码方法,最大的优点是无重码,缺点是把最繁重的学习记忆负担交给人。目前手机内置的单一笔画汉字输入方法,尽管把人从沉重的学习负担中解放出来,但在得到易学易用好处的同时,却丧失了快速性、扩充性、通用性、多用性等功能;在输入汉字、数字、常用标点符号和英文字母时,要进行输入状态转换,很麻烦;总之,欠缺科学性,这是一个致命的弱点。另外,从附三中可知,诺基亚手机仅用5种笔画,其易学性无疑最优,但它浪费了5个宝贵的数字码元,重码高。严格地说,诺基亚、摩托罗拉、索尼三种手机的输入方法本质相同,输入速度慢,区别在于笔画、笔形数量和键位安排。
还有的汉字数字编码方法,在笔画思路之外,选择若干高频部件分别安排于某个键位上,以牺牲规范性、规律性求得低重码,从而丧失科学性。
发明内容
本发明所要解决的技术问题是:提供一种适合各文化层次、年龄层次的人使用的通用汉字笔序数字编码方法,该编码符合汉字认知规律和书写习惯,把学习、记忆和操作难度都降到了最低限度,易学难忘,可在各种汉字信息处理设备的数字键上输入,特别是在同一种输入状态下,可使手机和电话机等微型信息设备实现字词、阿拉伯数字、常用标点符号及字母的自然编码语言输入。
本发明解决其技术问题所采用的技术方案是:将汉字的全部笔画分为单笔画和复合笔画,按笔顺编码,其代码是数字,编码原则是前码优先、兼顾直观;单笔画代码,使用数字1、2、3、4、5、6,依次将“一、丨、丿、、
乙”即“横、竖、撇、捺、左折、右折”六种约定俗成的单笔画定码,“
丶、亅”即“提、点、竖钩”代码分别同“横、捺、左折”的笔画代码;复合笔画的代码,使用数字0、1、2、3、4、5、6、7、8、9,其代码由两个单笔画代码之和构成,最大之和为12,其中,10、11、12为复数代码,分别取其个位数0、1、2作代码。
本发明具有如下主要优点:
一是科学性:做到了有序编码,有序学习,有序记忆,有序输入,规律性强,排列规范,没有二义性,从而体现了本编码科学严谨、规范简单的设计思想。
二是扩充性与全功能输入:可扩充到21000字至更多汉字及1至5万条词组,只用0-9个数字,同一编码方法,即可实现字词、常用标点符号及阿拉伯数字、字母的编码输入。
三是易学难忘:本发明扬各法之长,避众码之短,无论构成汉字的基础部件有多少个,化繁为简,只要掌握几种笔画及其代码的排列方法,就可掌握汉字所有单笔画及复合笔画的排列序数,完全摒弃了部件数量的不确定因素及部件与键符映射关系的记忆负担。从最少1画到最多50余画的汉字,从简体字到繁体字,其编码方法始终如一,让人掌握一法,受益终身。
四是通用性强:同一编码方法,中、日、韩通用,各文化层次、年龄层次的人均可适用,甚至可成为聋哑人、盲人适合的语言文字工具。
五是多用性好:可在电脑键盘、掌上电脑、移动电话、电话信息终端等信息设备的数字键上使用,可用于信息传递、汉字检索、字典编纂排序及汉字教学等方面。
六是重码少,汉字输入速度快:在多数情况下,采用两笔一码,更适合人的操作心理和书写习惯。本发明采用6位数字编码,意味着一个字最多可取12笔,与其它每字只取5、6笔或1-20多笔的单笔画数字输入方法相比,不会感到繁琐、累赘,只会感觉简便、轻快。重码少,动态码长短,单字平均码长在3码以下。
附图说明
图1是本发明在电脑单排数字键盘上的码元及笔画排列示意图。
图2是本发明在电脑小数字键盘上的码元及笔画排列示意图。
具体实施方式
下面结合实例对本发明作进一步说明。
本编码方法是用六种约定俗成的单笔画的习惯排列顺序的数字代码及由此构成的复合笔画代码作汉字编码,它涵盖了所有汉字,可对GB2312-80《汉字编码字符集—基本集》中6763个汉字、ISO/IEC-10646《CJK统一汉字编码字符集》(中、日、韩大汉字符集)中21003个汉字、全汉字符集中九万余字以及一至五万条词组,进行统一编码。
本编码可用手机、电话机、电脑、掌上机以及其它数字设备输入。其中,可利用手机、电话机或掌上机的数字键盘,在同一种输入状态下实现字词、阿拉伯数字、常用标点符号及字母的全能自然编码语言输入。本编码还是一种可直接翻页检索汉字的字典排序方法。
本编码的方法是:将汉字的全部笔画分为单笔画和复合笔画,按笔顺编码,其代码是数字,编码原则是前码优先、兼顾直观;单笔画代码,使用数字1、2、3、4、5、6,依次将“一、丨、丿、、乙”即“横、竖、撇、捺、左折、右折”六种单笔画定码,“
丶、亅”即“提、点、竖钩”代码分别同“横、捺、左折”的笔画代码;复合笔画的代码,使用数字0、1、2、3、4、5、6、7、8、9,其代码由两个单笔画代码之和构成,最大之和为12,其中,10、11、12为复数代码,分别取其个位数0、1、2作代码。
上述的编码原则中,按笔顺取码是基本规则,码长是1~6码。但少数汉字如果完全按笔顺规则编码,就与汉字认知规律(即汉字基础教育中的偏旁部首概念)相悖,因此,在容错范围内,对这些汉字可进行双重拆分处理。如:
区,笔顺:一ㄨ乙 容错:匚ㄨ 可,笔顺:一口亅 容错:丁口
兆,笔顺:丿ン乚
容错:儿ン
肃,笔顺:肀
八 容错:肀八
“取前优先,兼顾直观”,是一对矛盾体,两者往往相互抵触,但分清界限后,便迎刃而解。前码优先是指复合码与复合码或复合码与单笔画之间的取码次序。如:干,应取“二丨”,不应取“一十”。矢,应取“一人”,不应取“丿二人”。气,应取“一
”,不应取“丿二
缶,应取“十凵”,不应取“丿二丨凵”。辛,应取:“亠丷二丨”,不应取“亠丷一十”。叔,应取:“丁八又”,不应取“一…八又”。亲,应取:“亠丷二亅八”,不应取“亠丷一、
八”。兼顾直观是按汉字书写规律,以对应笔画优先加以拆分取码。如:失,应取“丿二人”,不应取“一人”艹,拆成“一‖”比拆成“十丨”直观,拆成“丨丷”比拆成“
丿”直观夂拆成“丿又”比拆成“丶”直观大,拆成“一人”比拆成“ナ、”直观广,拆成“、厂”比拆成“亠丿”直观白,拆成“丿
二”比拆成“亻二”直观正,拆成“一”比拆成“一”直观龙,拆成“ナ
、”比拆成“一儿丿丶”直观
以下是结合电脑单排数字键盘(图1)、小数字键盘(图2)以及手机、电话键盘(其码元及笔画排列同图2),对单笔画、复合笔画及代码与汉字取码方法的进一步说明。
一.键盘说明
图1、图2是为便于学习、加深理解而设计的辅助示意图,所列的笔画与数字,无需记忆,两者之间有着潜在而必然的联系,需要掌握的只是单笔画的排列方法和构成复合笔画的概念。二.单笔画汉字笔画 一 丨 丿
乙笔画名称 横 竖 撇 捺 左折 右折数字代码 1 2 3 4 5 6提
归入横,点(丶)同捺,竖钩(亅)归入左折。顺时针转折笔画为左折,逆时针转折笔画为右折,左折右折均以笔画末端方向为准。三.复合笔画
复合笔画“二、十、厂、亻、丁、人、力、九”的代码依次是2、3、4、5、6、7、8、9。“口”和围字框“口”的代码是0。其代码由两个单笔画代码之和构成,两代码之和最大为12,其中,10、11、12为复数代码,省略10位数上的1,分别取其个位数0、1、2作代码。其编码方法如下:二,一 一 1+1=2 横横的复合笔画代码为2。十,一 丨 1+2=3 所有横竖、竖横的复合笔画代码为3。厂,一 丿 1+3=4 所有横撇、撇横、竖竖的复合笔画代码为4。亻,丿 丨 3+2=5 所有撇竖、竖撇、点横的复合笔画代码为5。卜,丨 丶 2+4=6 所有竖点、点竖、横左折、左折横以及撇撇的复合笔画代码为6。人,丿 3+4=7 所有撇捺、撇点、点撇、横右折、竖左折、左折竖的复合笔画代码为7。凵, 丨 6+2=8 所有右折竖、竖右折、撇左折、左折撇、点点、点捺的复合笔画代码为8。九,丿 乙 3+6=9 所有撇右折、右折撇、点左折、左折点、左折捺的复合笔画代码为9。讠,丶
4+6=10 所有点右折、右折点、左折左折的复合笔画代码为0 乚 5+6=11 所有左折右折、右折左折的复合笔画代码为1。
6+6=12 所有右折右折的复合笔画代码为2。因外形之故,定义“口”及全包围结构的“□”(围字框)代码为0,不再拆分为“冂、一”,但“日、目、罒、田、由、甲、西等仍要按规则分解。“口”是汉字组字频率最高的部件。0、1、2、4、5、6、7、8、9分别代表2-6种复合笔画。如7包含“八、人、丷、乂、七、匚、阝、卩、刂、冂”及其变形复合笔画如“
入、
”等。复合笔画中单笔画不分正反、先后书写顺序,如“十、、、、
、、丄”横竖、竖横都是3;同样“勹ク
ㄅ、刀
力乃”都是8。按复数代码取码规则,“讠、厶、
了、
”的代码是0;“乜、
口、
”的代码是1;“
巜”的代码是2。复合笔画的主要特征是两个单笔画的对应形式,如:“二、‖、巜、丅、丄、、、、
厂、人、丷、八、亻、、
、マ、
勹、刀、匕、
儿、几、乃、冫、冖、匚、
冂、凵、阝、卩、丩、讠、厶、十、七、乂、ナ、九、力、又、廴”等。
四.单字
汉字可分为合体字、独体字,左右、上下、全包围、半包围结构的汉字统称为合体字。为减少汉字重码,提高输入速度,可加识别码。
字例:左右结构 汉 路 敖 频 激 游 诫 吼 嚆 飙
上下结构 节 呆 哭 品 擎 萝 霭 暑 叠 孽
半包围结构 冈 同 风 凰 威 臧 凶 函 幽 区 臣 过 递 越 题 魁 原 餍 床 度 魔 麝
展 房 虱 式 或 栽 畿
全包围结构 回 因 国 固 圃 圜
独 体 字 人 卫 重 乘 日 内 瓦 必 生 川 巫
1.独体字:不足6码的按实际码数取,6码以上的取前五末一码。如:一,一 1 乙,乙 6二,二 2 九,九 9大,一人 17 干,二丨 22臼,
一 3721 正,一 133册,
一 881 里,二十一 7231隶,
二亅ン
52557 甚,一‖二一八 142176垂,
二‖十一 32431 重,
一二十一 317231
2.合体字:将合体字划分为前、后两部分,前部分是指字结构的左部、上部及半包围和全包围结构的上部或外部,后部分是指字结构的右部、下部及半包围和全包围结构的下部或内部。前、后部分都在3码及3码以上的分别取前二末一码,不足3码的按实际码数取;前部分不足3码而后部分大于3码的,则后部分补足码长。这是由汉字的复杂性所决定的,如“酉、雨、鱼、骨、黑、鬼、髟、鼠、鼻”以及繁体部件“釒、飠、馬、門、魚、齒”等,如果完全按笔顺取码,仅偏旁部首就要占5码,剩下第6码给几十甚至几百个字编码,造成很多重码,如加上词组编码,势必重码成灾,严重影响输入速度。
以下是合体字的拆分、取码字例(“…”表示按编码规则被省略的部分,以下同):除,阝 人二亅八 77257 藕,一‖ 二十八…丶 142374嚏,口 十冖十…人 039737 音,亠丷一 二 57172炒,丷人 丨八
77273 过,
丶 丶
6449创,人
刂 717 邋,巜ㄑ…
丶
26649利,
十八刂 3377 露,一冖…
口…口 198030跎,口
丶冖匕 033499 圃,口 一冂二卜 01726骰,…二 几又 75299 舆,亻二 …一 八 5217鳄 …
口口…ㄅ 871005 魅,
…厶 二丨八 370227
3.识别码:是当同一组编码出现几个不同汉字时,采用其首笔与末笔代码加以区别的补充编码。什么时候该加首笔或者末笔,不能有二义性。识别码之末笔,是指末码的末笔,并非字末笔。两者概念有别。如“区”,末笔是“乙”,而末码的末笔是“丶”。在不增加学习负担前提下,顺着输入惯性,加入1-2位识别码,比停下来看屏幕选择重码字速度要快得多。
由于汉字左右结构约占65%,因此单独分为一类,以便与其它结构的识别码相区别,方法是:不足6码补末笔,仍不足6码再加首笔(以下打波浪线的为识别笔画及代码)。如:什,亻十
53
勤, 一‖…
力
1438
其它结构中上下、半包围、全包围、独体结构的识别码与左右结构相反:不足6码的汉字补首笔,仍不足6码再加末笔。如:
中国 口 丨 口二…丶 02024
巨人 匚コ 人 767
跟踪 口…
口 …八 037037三字词:每字各取第1、2码。如:
计算机 讠十 丶 十 八 034437
主人翁 亠十 人 八 厶 53770
宏伟蓝图 丶冖 亻二 一 口 495210
大刀阔斧 一人 刀 丶 八 17847
人民解放军 人 コ 亠 冖 76859
经济体制改革
亻 コ 一 285461
坚持改革开放 ‖
コ 一 二 亠 466125
中华人民共和国 口亻人 コ一…□ 057610
中国人民政治协商会议 口□人 コ一…讠 007610
国家语言文字工作委员会 □丶讠亠 亠…人 040557
六.其它
输入常用标点符号、阿拉伯数字、字母可加后断码。后断码可以分别是99、998、998,或者采用其它组合数字。
1.常用标点符号输入:先输入标点符号名称,只取名称前三字的编码,第一字取前二码,其它字取第一码,再加后断码。,逗号 一口 口 10099 ……省略号 丨 八
口 277099kg千克 丿十 十 33399 《正书名号 一
ク 130899”反引号
又 コ 口 696099 m2平方米 一 丷 亠 丷 175799‰千分号 丿 十 八 口 337099 ,半角逗号 丷 二 一 728199¥人民币 人 コ
76399 .半角小数点 丷 二 亅 728599≠不等于 丆卜 二 464299 ’反单引号
又 丷 コ 697699
2.阿拉伯数字:先输入一个任意数,再加后断码。
3.字母输入:先输入目标字母的数字键号和键符中字母的序号,再加后断码。如在手机数字键上输入英文字母A、B、Y:找其所在的数字键
先输入字母A的数字键号2及键符中字母A的序号1再加后断码998,即21998。同理,输入B、Y分别敲22998、93998即可。
4.附件:
乀 又夜癶祭良之廴辶赱 ㄑ 巜巛女巡巠巡巢巤粼5 亅 刂丁了小水于牙求隶
马巴雪妻肃捷丑骨鍋书
五工巫凸髟肆套畏 刀力乃 刃刄分加另盈仍
乂入 义凶驳爽鬯鹵攀籴俩
阝卩
队邓卫报卵也韦
Claims (8)
3.根据权利要求1所述的汉字编码法,其特征是所述的编码原则,其中,前码优先是指复合码与复合码或复合码与单笔画之间的取码次序,兼顾直观是按汉字书写规律取码。
4.根据权利要求1所述的汉字编码法,其特征是将汉字分为独体字与合体字,其码长是1~6码,
独体字不足6码的按实际码数取,6码以上的取前五末一码,
合体字划分为前、后部分,两部分都在3码以上的分别取前二末一码,不足3码的取实际码数;前部分不足3码而后部分大于3码的,则后部分补足码长。
5.根据权利要求1或3或4所述的汉字编码法,其特征是所述的编码,是用移动电话、电话信息终端或电脑、掌上机的数字键盘输入。
6.根据权利要求5所述的汉字编码法,其特征是利用手机、电话机或掌上机的数字键盘,输入字词及常用标点符号、阿拉伯数字、字母,
常用标点符号输入:先输入标点符号名称,只取名称前三字的编码,第一字取前二码,其它字取第一码,再加后断码,
阿拉伯数字:先输入一个任意数,再加后断码,
字母输入:先输入目标字母所在的数字键号和键符中字母的序号,再加后断码。
7.根据权利要求6所述的汉字编码法,其特征是所述的常用标点符号、阿拉伯数字、字母的后断码,分别是99、998、998。
8.根据权利要求1或3或4所述的汉字编码法,其特征是所述的编码方法,用于字典编纂。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB021154856A CN1155875C (zh) | 2002-01-29 | 2002-01-29 | 通用汉字笔序数字输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB021154856A CN1155875C (zh) | 2002-01-29 | 2002-01-29 | 通用汉字笔序数字输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1368671A true CN1368671A (zh) | 2002-09-11 |
CN1155875C CN1155875C (zh) | 2004-06-30 |
Family
ID=4743684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB021154856A Expired - Fee Related CN1155875C (zh) | 2002-01-29 | 2002-01-29 | 通用汉字笔序数字输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1155875C (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102426484A (zh) * | 2011-07-25 | 2012-04-25 | 张仁平 | 零记忆十笔画汉字编码输入法 |
CN103076890A (zh) * | 2012-07-01 | 2013-05-01 | 潘昌仁 | 一种文字数字化编码及数字国际公读法 |
-
2002
- 2002-01-29 CN CNB021154856A patent/CN1155875C/zh not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102426484A (zh) * | 2011-07-25 | 2012-04-25 | 张仁平 | 零记忆十笔画汉字编码输入法 |
CN102426484B (zh) * | 2011-07-25 | 2016-01-06 | 郑州航空工业管理学院 | 零记忆十笔画汉字编码输入法 |
CN103076890A (zh) * | 2012-07-01 | 2013-05-01 | 潘昌仁 | 一种文字数字化编码及数字国际公读法 |
Also Published As
Publication number | Publication date |
---|---|
CN1155875C (zh) | 2004-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105938402B (zh) | 一种声形码汉字输入法及键盘 | |
CN1368671A (zh) | 通用汉字笔序数字编码法及其键盘 | |
CN1081004A (zh) | 汉字结构笔顺数字编码方法 | |
CN1147777C (zh) | 计算机汉字输入方法 | |
CN1101568C (zh) | 计算机汉字输入方法及其键盘 | |
CN1101569C (zh) | 音形码汉字输入方法 | |
CN1028680C (zh) | 汉字全息码 | |
CN1267807C (zh) | 一种用汉字及部首读音编码的汉字输入方法 | |
CN1256644C (zh) | 一种偏旁部首汉字输入方法 | |
CN101923400B (zh) | 义码汉字计算机输入法 | |
CN1120191A (zh) | 计算机汉字输入归演码 | |
CN1101958C (zh) | 八卦码(笔画群)汉字输入方法 | |
CN1109289C (zh) | 汉字形声偏旁泛字根结构的码元编码输入方法 | |
CN1139867C (zh) | 新音形简易速录码汉字输入法 | |
CN1195257C (zh) | 结构数码汉字输入方法 | |
CN1269010C (zh) | 汉字位码键盘输入法 | |
CN1570815A (zh) | 写字式汉字输入法及其装置 | |
CN1120404C (zh) | 一种数字小键盘15键汉字输入法 | |
CN1467613A (zh) | 汉字位码手写输入法及输入装置 | |
CN1045226C (zh) | 普及型六笔二维汉字编码输入法及键盘 | |
CN104133560B (zh) | 组合式双笔类主副码汉字、词语编码输入法及其键盘 | |
CN1825254A (zh) | 汉字输入法及其所用的计算机键盘 | |
CN105389015A (zh) | 单码汉字输入法 | |
CN1119740C (zh) | 首尾特征码汉字计算机键盘输入法 | |
CN1161493A (zh) | 音形派生键形码汉字输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |