CN1178121C - 汉字笔顺部首双重输入方法及系统 - Google Patents
汉字笔顺部首双重输入方法及系统 Download PDFInfo
- Publication number
- CN1178121C CN1178121C CNB991230949A CN99123094A CN1178121C CN 1178121 C CN1178121 C CN 1178121C CN B991230949 A CNB991230949 A CN B991230949A CN 99123094 A CN99123094 A CN 99123094A CN 1178121 C CN1178121 C CN 1178121C
- Authority
- CN
- China
- Prior art keywords
- chinese character
- code
- chinese
- input
- account
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims description 23
- 230000009977 dual effect Effects 0.000 description 14
- 239000000126 substance Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 239000004922 lacquer Substances 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 239000003643 water by type Substances 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明提供用于普及汉字输入的一二级汉字(GB)和大字符集汉字(GBK)的笔顺数字输入系统和笔顺部首双重数字输入系统。其中,一二级汉字笔顺部首双重输入系统字均码长最短:在重码不过10时,高频字为3.18位,一级汉字为3.89位,一二级汉字为4.39位。在输入系统中,大字符集汉字字均码长5.40-6.27位。单字码长可调,重码数可指定,词组不编码,首字跟踪、末字跟踪或指定字跟踪输入,可定义和输入由中西文字、数字和符号混合组成的词组和字符串。除电脑外,还能用来在没有字母键的手机和其他产品上输入汉字。
Description
到目前为止,国内的汉字输入,拆字码难记,拼音码有方言干扰,普及问题没有真正解决。
本发明的目的在于:为广大非专职汉字输入的,电脑和手机等需要输入汉字的电子产品使用者,提供自学就会的,一二级汉字(GB)和大字符集汉字(GBK)的笔顺数字输入系统和笔顺部首双重数字输入系统,促进汉字输入的普及。
一二级汉字的笔顺数字码(以下简称笔顺码)已由国家规范化了,就是国家语言文字工作委员会和中华人民共和国新闻出版社于1997年4月7日联合发布的《现代汉语通用字笔顺规范》中的序号式。
《规范》规定,笔画分五类,用1-5五个数字作为它们的代码,如下:
1.横、挑,2.竖,3.撇,4.点、捺,5.折。
例如:″王″字的笔顺全码为:1121,
″巍″字的笔顺全码为:25231234531325113554等等。
大字符集汉字中,除一二级汉字外,汉字的笔顺码,国家还没有规范化,是参照上述《规范》和《汉语大字典》编写的。
一二级汉字的笔顺全码,字均码长10.67位,最长码长26位。大字符集汉字的笔顺全码,字均码长12.88位,最长码长48位。这些笔顺全码,由于码长过长,不能直接用作在键盘上进行输入的输入码。要使它们成为能用来在键盘上进行输入,产生技术效果的输入码,需经如下步骤处理:
(a)把全码按全码第一位的数字代码分类;
(b)分类后的各类分别按汉字的使用频率从高频到低频排序,使各类中排在最前面的都是该类中使用频率最高的字;
(c)取各类全码第一位的数字代码,即分类根据,作为各类中排在最前面的,10位以内(含10位)的字的实际使用的找字码,使这些字的找字码成为一位码,重码字不超过10个;
(d)各类中取过找字码后剩下的字,按全码的第一二两位的数字代码分类;
(e)分类后的各类分别按汉字的使用频率从高频到低频排序,使各类中排在最前面的都是该类中使用频率最高的字;
(f)取各类全码第一二两位的数字代码,即分类根据,作为各类中排在最前面的,10位以内(含10位)的字的实际使用的找字码,使这些字的找字码成为二位码,重码字不超过10个;
(g)各类中取过找字码后剩下的字,按(a)-(f)的方法和步骤,继续分类、排序和取找字码,直到所有全码都有了实际使用的找字码为止,其中,每次分类的分类根据,都比前一次分类的分类根据增加一个全码中的下一位数字代码,所取的找字码也相应地比前一次取的加长一位。
(h)在(a)-(g)的过程中,难于取短于全码的找字码的全码,就取全码作为找字码,在轮到这些全码取找字码时,给这些全码排序优先权,使它们排在序列的最前面,成为重码数10(含10)以内的字。
下面是第一位数字代码为4的一类全码的部分找字码。
4 这主为产学就义部方说 4411 河源满江灌渐潮湖洪浇
44 实家定深法性斗它没治 44111 污浅汗潜添涛汪沫渍沅
441 头流油活温清海注济测 441111 沣漆滟
笔顺全码,经上述(a)-(h)处理后,所得找字码的码长分类统计如下:
码长 | 高频字(1499) | 一级字(3600) | 一二级字(6716) | 大字符集(20720) |
1位码2位码3位码4位码5位码6位码7位码8位码9位码10位码11位码12位码13位码14位码 | 50占3%233占16%564占38%461占31%186占12%5占-%-占-%-占-%-占-%-占-%-占-%-占-%-占-%-占-% | 50占1%247占7%754占21%1126占31%900占25%444占12%70占2%9占-%-占-%-占-%-占-%-占-%-占-%-占-% | 50占1%250占4%856占13%1629占24%1867占28%1281占19%549占8%183占3%51占1%-占-%-占-%-占-%-占-%-占-% | 50占-%250占1%984占5%2486占12%3977占20%4588占22%3675占18%1957占9%1325占6%649占3%345占2%219占1%163占1%52占-% |
字均码长 | 3.34位 | 4.18位 | 4.83位 | 6.27位 |
以上统计显示:
高频字:字均码长3.34位,其中57%码长1-3位,88%码长1-4位。
一级汉字:字均码长4.18位,其中60%码长1-4位,84%码长1-5位。
一二级汉字:字均码长从10.67位缩短为4.83位,其中,70%码长1-5位。96%码长1-7位,最长码长从26位缩短为9位。
大字符集汉字:字均码长从12.88位缩短为6.27位,其中60%码长1-6位,93%码长1-9位。最长码长从48位缩短为14位。
这说明:一二级汉字的笔顺全码和大字符集汉字的笔顺全码,都已成了可以单独使用的汉字笔顺输入码。
为了进一步缩短找字码码长,提高输入速度,除了上述笔顺码外,本发明还对字典部首中部首在字首的汉字,给出部首数字码(以下简称部首码)。部首码按如下公式构成:
部首码=部首首笔+0+余部笔顺。
例如:″卿″字。笔顺全码为352512115115452 码长15位
部首全码为305115452 码长9位
显然,部首全码比笔顺全码短。
笔顺码可以与部首码相结合,构成汉字笔顺部首双重输入码,不仅能提高输入速度,也为使用者提供了方便。
例如:一二级汉字的笔顺码可以与其中四笔和四笔以上的字典部首中部首在字首的字的部首码构成汉字笔顺部首双重输入码。该编码,由于全码字均码长10.20位,最长码长26位,需经上述(a)-(h)的方法和步骤处理后,才能成为可以用来在键盘上进行双重输入,产生技术效果的双重输入码。
该全码经上述(a)-(h)的方法和步骤处理后,所得找字码的码长分类统计如下:
码长 | 高频字(1499) | 一级字(3600) | 一二级字(6716) | 双重输入码(9230) |
1位码2位码3位码4位码5位码6位码7位码8位码9位码 | 50占3%268占18%637占42%445占30%99占7%-占-%-占-%-占-%-占-% | 50占1%291占8%862占24%1375占38%851占24%171占5%-占-%-占-%-占-% | 50占1%299占4%992占15%2114占32%2284占34%832占12%145占2%-占-%-占-% | 50占1%300占3%1079占12%2409占26%2888占31%1609占17%644占7%194占2%57占1% |
字均码长 | 3.18位 | 3.89位 | 4.39位 | 4.70位 |
以上统计显示:
高频字:字均码长3.18位,其中63%码长1-3位,93%码长1-4位。
一级汉字:字均码长3.89位,其中71%码长1-4位,95%码长1-5位。
一二级汉字:字均码长4.39位,其中86%码长1-5位。最长码长从26位缩短为7位。
双重输入码:字均码长4.70位,最长码长从26位缩短为9位。
这些说明:该编码已成了可以单独使用的一种一二级汉字笔顺部首双重输入码。
又如:大字符集汉字的笔顺码也可以与其中四笔和四笔以上的字典部首中部首在字首的字的部首码构成汉字笔顺部首双重输入码。该编码的全码字均码长12.06位,最长码长48位,也需经上述(a)-(h)的方法和步骤处理后,才能成为可以用来在键盘上进行双重输入,产生技术效果的双重输入码。
该全码经上述(a)-(h)的方法和步骤处理后,所得找字码的码长分类统计如下:
码长 | 高频字(1499) | 一级字(3600) | 一二级字(6716) | 大字符集(20685) | 双重输入码(30758) |
1位码2位码3位码4位码5位码6位码7位码8位码9位码10位码11位码12位码13位码14位码 | 50占3%257占17%621占42%445占30%122占8%4占-%-占-%-占-%-占-%-占-%-占-%-占-%-占-%-占-% | 50占1%279占8%832占23%1329占37%878占25%220占6%12占-%-占-%-占-%-占-%-占-%-占-%-占-%-占-% | 50占1%287占4%961占14%2023占30%2292占34%915占14%166占3%22占-%-占-%-占-%-占-%-占-%-占-%-占-% | 50占-%300占1%1177占6%3321占16%6063占29%5912占29%2767占13%937占5%249占1%-占-%-占-%-占-%-占-%-占-% | 50占-%300占1%1229占4%3578占12%7021占23%7721占25%5208占17%2648占9%1562占5%663占2%364占1%226占1%173占-%51占-% |
字均码长 | 3.23位 | 3.95位 | 4.45位 | 5.40位 | 6.16位 |
以上统计显示:
高频字:字均码长3.23位,其中62%码长1-3位,92%码长1-4位。
一级汉字:字均码长3.95位,其中69%码长1-4位,94%码长1-5位。
一二级汉字:字均码长4.45位,其中83%码长1-5位。最长码长从26位缩短为8位。
大字符集汉字:字均码长5.40位,其中,81%码长1-6位。最长码长从48位缩短为9位。
双重输入码:字均码长从12.06位缩短为6.10位,最长码长从48位缩短为14位。
这说明:该编码已成了可以单独使用的一种大字符集汉字笔顺部首双重输入码。
上述找字码都是以字频为序的有重码编码,单字找字码的码长是由单字的字频和输入系统的重码数决定的,所以,可以通过人为地改变单字的频序来缩短或加长单字找字码的码长。单字找字码码长可调,使不同地区、不同时间、不同行业和不同个人所使用的不同的高频字集的找字码,可以长期地或临时地调整到系统允许的最短码位上,提高输入速度。
单字找字码码长可调,也使重码数成为可以改变的。如果某产品所需汉字总量有限,显示屏面积又小,便可把重码数10,改为8,7,6或更小。
上述数字代码可以单重或双重映射在键盘的数字按键上,构成数码数字键映射系统;也可以单重或双重映射在键盘的字母按键上,构成数码字母键映射系统。
上述汉字笔顺输入码和笔顺部首双重输入码,与上述码键映射系统,以及输入时的屏幕显示引导系统相结合,就构成了汉字笔顺输入系统和汉字笔顺部首双重输入系统,其优点是:
1.汉字的笔顺和部首都是汉字字形基础教学的基本内容,也是九年义务教学的内容,对它们的记忆是以汉语为母语的人,或学过汉语的人的常识性记忆。学习笔顺码,只需记住五类笔画,以及它们的五个数字代码,数量很少;学习部首码,只需记住一个很简单的公式,其中,部首码的首码与笔顺码的首码思路一致。这些都为记住输入码提供了方便。数字代码一般都映射在数字键上,这又为使用方块汉字的人提供了操作上的方便。
2. 输入系统的重码字按重码数一次显示,不换屏。
3.当输入系统采用数字代码对数字键单重映射系统时,输入系统便能用来在没有字母键,只有数字键的手机和其他产品上输入汉字。
4.当输入系统采用数字代码对数字键单重映射系统时,由于找字码和送字码都是数字码,使用的是相同的数字键,所以,需要设置送字标识。设置不同的送字标识,可以使用简体汉字的输入码输入相应的繁体汉字,也可以使用繁体汉字的输入码输入相应的简体汉字,还可以跟踪检索资料库。
5.词组不编码,采用跟踪联想方法输入。这给采用词组首字跟踪、末字跟踪和指定字跟踪,以及中西文字、数字和符号混合组词组串等技术带来了方便,不仅保证了词组输入的速度,还能定义和输入混编词组和字符串。
Claims (6)
1.一种在具有数据处理能力的系统中输入汉字的汉字笔顺部首双重输入法,采用“现代汉语通用字笔顺规则”中规定的5类基本笔画及其表示数字,即:1-横和/或挑、2-竖、3-撇、4-点和/或捺、以及5-折按照汉字的书写笔画顺序和/或相关汉字首部首第一笔画+部首标识码+除该首部首以外该汉字余部笔顺取汉字的全码编码汉字,即一个汉字的编码全码包括汉字笔顺数字全码和/或汉字部首数字笔顺全码,其中,所述的汉字首部首是指在汉语字典中出现的部首,所述的标识码是指除上述1-5以外的0和6-9中任一数字,该输入法包括:
(1)建立码表:
a)根据上述各类全码的第一位码对汉字进行分类,
b)按照其使用频率的高低,将分类后各分类中的汉字排序,形成使用频率从高到低汉字序列;
c)规定一屏所能够显示的汉字重码数为10;
d)在上述步骤b)形成的汉字序列中选择其排列顺序小于或等于步骤c)所规定的数字10的汉字的第一位码,作为这些汉字的输入码,即一位码汉字;
e)当欲输入的汉字没有包括在所述一位码汉字当中时,根据上述各类汉字全码的第一和第二位码对汉字分类;
f)重复步骤b);
g)在上述步骤f)形成的汉字序列中选择其排列顺序小于或等于步骤c)所规定的数字10的汉字的第一和第二位码,作为这些汉字的输入码,即二位码汉字;
依此类推,每当根据上述各类全码按书写顺序执行上述步骤而不能得到欲输入的汉字时,则对汉字进一步分类,其分类的分类根据比前一次分类的分类根据增加上述各类全码中的下一位代码,所取相应汉字的输入码对应增加一位,即变成三位码、四位码和五位码、...全位码,直到欲输入的汉字出现为止,当取汉字的全码输入汉字时,设置全码排序的优先权,以便使其成为小于或等于重码数10的汉字;
(2)输入汉字
依次以汉字的一位码、两位码、三位码、...、全码输入欲输入的汉字,一旦欲输入的汉字出现在步骤c)所规定的10个重码数范围内,即完成该汉字的输入。
2.根据权利要求1所述的方法,其中,所述具有数据处理能力的系统是个人数字助理。
3.根据权利要求1所述的方法,其中,所述具有数据处理能力的系统是具有相应输入设备的计算机。
4.根据权利要求3所述的方法,其中,所述的输入设备是键盘装置。
5.根据权利要求3所述的方法,其中,所述的输入设备是触屏输入装置。
6.根据权利要求3所述的方法,其中,所述的输入设备是语音输入装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB991230949A CN1178121C (zh) | 1999-12-08 | 1999-12-08 | 汉字笔顺部首双重输入方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB991230949A CN1178121C (zh) | 1999-12-08 | 1999-12-08 | 汉字笔顺部首双重输入方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1307269A CN1307269A (zh) | 2001-08-08 |
CN1178121C true CN1178121C (zh) | 2004-12-01 |
Family
ID=5282796
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB991230949A Expired - Fee Related CN1178121C (zh) | 1999-12-08 | 1999-12-08 | 汉字笔顺部首双重输入方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1178121C (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101807119B (zh) * | 2010-03-30 | 2011-08-31 | 中南民族大学 | 计算机女书字部首输入法 |
CN115694732B (zh) * | 2022-10-24 | 2025-03-14 | 杭州至千哩科技有限公司 | 数据传输编码方法、装置、计算机设备及存储介质 |
-
1999
- 1999-12-08 CN CNB991230949A patent/CN1178121C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1307269A (zh) | 2001-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1178121C (zh) | 汉字笔顺部首双重输入方法及系统 | |
CN1072785A (zh) | 无理序号数字综合编码法及其键盘 | |
CN1243277A (zh) | 一种可用数字键盘输入的汉字输入方法及键盘 | |
CN1186708C (zh) | 一种汉字输入方法及其装置 | |
CN1349157A (zh) | 数字笔形码汉字输入法 | |
CN1106146A (zh) | 电脑汉字声韵调编码输入法及其键盘 | |
CN1043381C (zh) | 汉字四笔画数码输入法 | |
CN1203391C (zh) | 左右音形数码汉字电脑输入法及其键盘 | |
CN1118085A (zh) | 可用数字键盘输入的汉字输入系统及其键盘 | |
CN1017662B (zh) | 无理序号数字编码法及其键盘 | |
CN1142474C (zh) | 字典码汉字输入法 | |
CN1068444C (zh) | 一种汉字编码输入方法 | |
CN1818836A (zh) | 快易码数码象形输入法 | |
CN1293448C (zh) | 十笔数码输入法 | |
CN1107593A (zh) | 音形经纬码计算机汉字输入方法 | |
CN1299189C (zh) | 拼音区位数码检字法和拼音区位数码输入法 | |
CN1189810C (zh) | 五角形四角号码汉字输入法 | |
CN1419179A (zh) | 按笔顺输入的汉字输入法及其键盘 | |
CN1328282A (zh) | 汉字《天然码》输入方法 | |
CN1178344A (zh) | 四声码汉字输入方法 | |
CN1357815A (zh) | 汉字数码输入法 | |
CN101021843A (zh) | 笔画笔顺数码汉字检索、输入法 | |
CN1828496A (zh) | 一种汉字笔形网络输入法 | |
CN101059722A (zh) | 多键并击式简略码拼音输入汉字的方法及键盘 | |
CN1425975A (zh) | 笔形数码汉字输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |