CN1104673C - 计算机汉字字根笔画分段输入方法 - Google Patents
计算机汉字字根笔画分段输入方法 Download PDFInfo
- Publication number
- CN1104673C CN1104673C CN 96114106 CN96114106A CN1104673C CN 1104673 C CN1104673 C CN 1104673C CN 96114106 CN96114106 CN 96114106 CN 96114106 A CN96114106 A CN 96114106A CN 1104673 C CN1104673 C CN 1104673C
- Authority
- CN
- China
- Prior art keywords
- radical
- stroke
- code
- key
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
推广型林码汉字输入方法把汉字拆分成组件,对组件编码,同时归纳分类组件之间的位置关系,对位置关系编码,按书写顺序排列组件代码,然后把组件之间的位置代码插入其中,从而形成整字编码。发明可以完全对汉字的书写过程进行模拟,易学、规范,使用位置代码旨在降低重码率,再通过利用简码可以达到较高的效率。
Description
本发明涉及计算机中文信息处理领域的计算机汉字编码输入技术。
计算机在人类当今的社会生活中发挥着巨大的作用。计算机在中国的普及利用很大程度上取决于计算机对汉字信息的处理水平。其中包括汉字的输入,输出,汉字信息检索,汉语的理解等等方面。汉字输入是目前比较热门的领域。计算机汉字输入有三个主要方面,即计算机汉字键盘输入,汉语语音输入,联机手写汉字识别输入和光学汉字识别输入。其中汉字键盘输入技术现阶段占主导地位。
汉字是表意文字,不同于西方拼音文字,汉字形体复杂,数量庞大,输入计算机有很大难度。经过多年的努力,已经有了汉字编码方案和输入系统。汉字键盘输入已经成为可能。但是完全令人满意的输入方案还没有研究出来,要真正达到易学,易用和高效的目标,还需要进一步努力研究。
汉字具有音,形,义三个方面的属性。所有输入方案都是基于这些属性的,根据所使用的特征,输入方案可以分为音码,形码,以及音形码等。各种方案都有长处和短处。
目前汉字输入技术向着横向和纵向两方面发展。横向就是单字输入,目标要达到易学,高效,规范;纵向是字,词,句输入,通过智能化处理,解决易学与高效的矛盾。
汉字的发音特征比较简单,字多,但音不多,所以音码的单字重码很多。
汉字的字形特征很复杂,从不同角度可以有不同理解,导致了众多的形码方案,字形多,特征多,码多,重码少,难学,难记。
下面,以几种常见的汉字编码方案为例,比较具体地进行性能分析和比较。
音码输入方法,使用汉字的发音特征来进行编码;易于掌握,但重码高,虽然可以通过智能手段使重码率有所降低,但系统开销较大,效果有限,很难盲打,速度较慢;对汉语拼音的要求较高,有地域和年龄层的限制;在大字符集内的使用有限制。
笔画编码法,将笔画按不同的形态分为若干类,依笔画书写顺序,把汉字-笔-画地编码输入;易于掌握,会写汉字就会输入,但是编码效率很低,重码多,码长长。
五笔字型编码方案,是字根类编码,按照汉字字根的使用频度,将字根挑选归类,分配键位,以”字根拼形”完成整字输入;特点是字根键位熟记以后,输入速度较快,存在的问题是:
1.字根较多,记忆负担大;
2.200多个一级字根的选取以统计为基础,字根键位的分配依据”相容性原理”确定,所谓相容性有一定统计范围,在字符集GB2312-80和ISO10646中的统计结果肯定不同,也就是说,在GB中相容的字根,在ISO中可能就不相容了,其结果会导致重码率的变化;
3.二级字根和非字根单体字的输入要拆分成一级字根,拆分过程的规律性和规范性不强,拆分二义性大;
4.末笔字型识别码难于掌握和使用。
总之,就目前来看,汉字字形输入趋向于在专职录入人员范围使用,一般人员如果会拼音则满足于使用拼音。这样汉字字形特征的使用越来越趋向于认读,而输入时使用字音特征,从而输入和认读过程不统一,这样会读不会写的情况就会出现。
本发明认为汉字字型特征是其独有的特点,不应该偏废,汉字的计算机输入应该和汉字书写有机结合,使得中国电脑用户,特别是中小学生在敲键过程中掌握书写方法,达到和谐统一的境界。
林码汉字输入方法(专利申请94117506.5)公开了一种利用键盘模拟书写过程的方法,林码将汉字拆分成字根、笔画组件,归纳字根、笔画之间的相对位置关系,并把这种关系和键盘上键区、键位相结合,从而达到在键盘上书写的目的。本发明是林码的推广,其任务与林码类同,即:
1.解决汉字编码中普遍存在的易学,易用与高效之间的矛盾,找到一种同时具备笔画码和拼音码的易学性,又具备字根码的高效性的编码方案;
2.缩小手写与敲键之间的差异;
3.使编码过程符合人的思维习惯;
4.使编码符合文字规范;
5.使编码符合人机工程的研究结果;
6.建立一套统一,完备的文字特征描述体系,以适应大字符集中各种文字符号的需要。
为了实现这个任务,本发明采用了与林码不一样的方法。林码也使用了汉字组件的相对位置关系,它把汉字组件的位置关系与键位的位置关系相结合,是一种隐含的方法,本发明将这种位置关系代码化,是一种显式方法。
汉字的书写是一个非常复杂的过程,各种字形输入方案其实都是对这一过程的一种反映。长期以来,汉字书写过程中的一个非常重要又似乎非常隐蔽的环节没有被加以重视。
下面对书写汉字“二”时,人手和笔的动作过程进行仔细分析:
开始
第一步,手持笔,将笔尖移动至第一个横笔画上方;
第二步,手将笔尖下压,定位于纸上;
第三步,手持笔,将笔尖在纸上自左至右移动,形成笔画痕迹;
第四步,手将笔尖抬起,悬空;
第五步,手持笔,将笔尖向左下方向移动至第二个横笔画上方;
第六步,手将笔尖下压,定位于纸上;
第七步,手持笔,将笔尖在纸上自左至右移动,形成笔画痕迹;
第八步,手将笔尖抬起,悬空;
收笔。
这是一个完整的汉字“二”的书写过程。在计算机键盘上,第三步和第七步很容易完成,只要敲击横笔画对应的键即可;而第二、四、六、八步也很容易和键的压下、抬起对应;但第一、第五步,特别是第五步,即笔尖从当前位置悬空移动到下一个位置的走向往往被忽略了,计算机没有得到这一个很有价值的信息。
从字根角度来看,当前字根书写完成后,笔尖移动到下一个字根的起点,这种笔尖悬空移动的规律也没有得到充分的使用。
本发明就是将这种笔尖悬空移动的规律进行归纳总结,并为之编代码,作为汉字输入过程的一部分,使得计算机能够得到汉字二维完整信息,充分模拟笔书写过程。
上述笔画、字根之间笔尖悬空移动走向被编码后,作为笔画、字根之间的位置提示符号。
字根之间使用位置提示符号,也是字根代码的分隔符,于是,林码汉字输入法中公开的动态组合编码在此也可以得到应用。
为了提高效率,结合频度特征可以采用简码技术缩短码长。
本发明适用于任何涉及敲击、点触类输入设备。
本发明也可应用到笔输入设备,即将输入区域分为实笔画区域、虚笔画区域,实笔画指笔尖在纸上的移动痕迹,虚笔画指笔尖悬空移动的轨迹。
本方案的优点和效果:
1.对文字书写过程做全面的仿真模拟,即使用点触设备模拟笔输入设备;
2.完全保留笔输入过程的易学性和适用性;
3.通过使用动态组合码表和简码技术,可以实现较为高效的输入系统。
下面结合附图和实施例对本发明做详细介绍。
图1为对汉字笔画间相对位置关系的归纳分类编码;
图2为对汉字字根间相对位置关系的归纳分类编码;
向下、向右、交叉、向上、向左的笔位关系分别用下列符号表示:
↓、→、×、↑、←;
向下、向右、包含、向上、向左的根位关系分别用下列符号表示:
∨ >、⊙、∧、<。
下面描述三个实施例,说明各种位置关系的用法。
实施例1:
本方案的特点是使用汉字笔画间的位置关系代码。
笔画分类:
将汉字笔画分为横、竖、撇、捺、折五类,定义在五个键位上。
键位安排:
按照键位使用个数的多少,对笔画位置关系进行取舍、合并。
两个笔位代码键:图3,向下、向左共用一键,向上、向右共
用一键,交叉按笔画起点之间位置关系分在两个键位上。
例如:“十”的交叉笔位并入向上、向右键,
“义”的交叉笔位并入向下、向左键。
向下、向左不仅包括正左、正下,它包括从左上方向逆时针
转至右下方向的一个方向区域;
向右、向上不仅包括正右、正上,它包括从左上方向顺时针
转至右下方向的一个方向区域;
笔画起点相同,则不使用笔位代码,如“厂”。
三个笔位代码键:图4,向下、向左共用一键,向上、向右共
用一键,交叉笔位安排一个键位。
五个笔位代码键:图5,每种笔位各安排一个键位。
取码方法:
取码方法有定长方式和不定长方式,本实施方案采用定长方式,
最长六码,笔画不足则按具体笔画定码。
单体字:依书写顺序提取笔画代码和笔位代码,例如,
“木”一×丨↓丿丶
两体字:每个根取前两笔画以及对应的笔位代码,例如,
“林”一×丨一×丨
三体及三体以上:前三根取第一个笔画和第一个笔位代码,例如,
“案”丶←乙×一×
实施例2:
本方案的特点是使用汉字字根间的位置关系代码。
笔画分类:
将汉字笔画分为横、竖、撇、捺、折五类,定义在五个键位上。
键位安排:
按照键位使用个数的多少,对字根位置关系进行取舍、合并。
两个根位代码键:图6,向下、向左、包含共用一键,向上、向
右共用一键;
三个根位代码键:图7,向下、向左共用一键,向上、向右共
用一键,包含根位安排一个键位;
五个根位代码键:图8,每种根位各安排一个键位。取码方法:
取码方法有定长方式和不定长方式,本实施方案用不定长方式,
使用笔画描述字根,在字根之间插入字根位置指示代码,根位代
码作为字根笔画序列的分隔符号,所以给字根笔画的码长提供了
较大自由度,本方案采用林码汉字输入方法(专利申请94117506.5)
中公开的动态组合码表方法,简码按频度设定。
单体字:依书写顺序提取笔画代码,例如,
“木”一丨丿丶
多体字:每个根由笔画代码表示,字根之间插入根位代码,例如,
“林”一丨丿丶
>
一丨丿丶
“案” 丶丶乙
∨
乙 丿一
∨
一丨丿丶
实施例3:
本方案的特点是同时使用汉字笔画和汉字字根间的位置关系代码。
笔画分类:
将汉字笔画分为横、竖、撇、捺、折五类,定义在五个键位上。
键位安排:
按照键位使用个数的多少,对笔画、字根位置关系进行取舍、合并。
三个笔位代码键、两个根位代码键:图9,向下、向左笔位共用一键,
向上、向右笔位共用一键,交叉笔位安排一个键位;向下、向左
以及包含根位共用一键,向上、向右根位共用一键;
五个笔位代码键、五个根位代码键:图10,每种笔位、根位各安排一
个键位。
取码方法:
取码方法有定长方式和不定长方式,本实施方案用不定长方式,
使用笔画描述字根,在笔画代码之间插入笔位代码,在字根之间
插入字根位置指示代码,根位代码作为字根描述代码序列的分隔
符号,所以给字根笔画的码长提供了较大自由度,本方案采用林
码汉字输入方法(专利申请94117506.5)中公开的动态组合码表方
法,简码按频度设定。
单体字:依书写顺序提取笔画代码和笔位代码,例如,
“木” 一×丨↓丿丶
多体字:每个根由笔画代码表示,字根之间插入根位代码,例如,
“林”一×丨↓丿丶
>
一×丨↓丿丶
“案”丶←丶乙
∨
乙×丿↑一
∨
一×丨↓丿丶
附图说明图1.笔画位置关系分类图2.字根位置关系分类图3.五个笔画键、两个笔位键图4.五个笔画键、三个笔位键图5.五个笔画键、五个笔位键图6.五个笔画键、两个根位键图7.五个笔画键、三个根位键图8.五个笔画键、五个根位键图9.五个笔画键、三个笔位键、两个根位键图10.五个笔画键、五个笔位键、五个根位键
Claims (7)
1.计算机汉字字根分段输入方法,按照汉字包含字根部件的数目把汉字分为单体字和多体字,单体字包含一个字根部件,多体字由两个以上字根部件组成,多体字根据字根相对位置可以分为左右结构、上下结构、包围结构;
根据单体字和字根的特征构造字根描述码,字根具有字音和字形两种特征,其中根据字音特征把相应的拼音字母序列构造成字根拼音描述码,根据字形特征把笔画按书写笔顺排列构造成字根笔画描述码;
单体字的输入是通过输入相应的字根描述码完成,字根描述码构成是如下之一:
1)字根拼音描述码,由声母或双拼或全拼组成;
2)字根笔画描述码;
3)字根拼音笔画描述码;
多体字首先按照规范和公认约定拆分成字根,然后选取所有字根或者特定字根构成组码字根序列,依次输入每个组码字根的字根描述码完成整字输入;
汉字输入编码库由字根描述码和多体字组成码构成;
在输入过程中,系统可以等待全码输入完成后,输出匹配结果,或者在每接收到一个码位输入后,动态提示当前匹配结果集合,以供选择;
其特征是:把多体字字根部件之间的位置关系归纳分类,包含如下一种或者多种位置关系:
向下、向右、包含、向左、向上;
根据选定的位置关系构造字根定位分隔码,分配键位,当输入多体字时,将字根分隔码插入到不同字根的描述码中间,作为汉字输入操作的组成部分;
按照可供使用的键位个数取舍合并、分配键位:
1)为每种位置关系分配一个键位;
2)向下、向左共用一个键位,向右、向上共用一个键位;
3)各种位置关系共用一个键位,分隔码只对字根描述码进行简单分隔,不包含位置信息;
涉及的输入过程是:
1)进入汉字输入初始等待状态;
2)接收输入操作,
如果是汉字特征描述操作,则转入3);
如果是汉字字根定位操作,则转入4);
3)接收字根描述码,系统接收到描述码的每一个码位时,进行匹配检索,获得候选字根和候选字集合;系统可以显示候选字集合供选择确认,如果有选择就转入5);单体汉字在此完成输入,转入结束5);否则转入2);
4)接收字根分隔码,上一个字根描述码输入完成,系统得到一个候选字根集合,系统由此候选字根集合查找得到多体候选汉字集合,供显示选择,当字根定位分割码包含字根位置信息时,也将此作为检索条件,进一步缩小候选集合范围;如果有整字选择操作就转入5);否则转入2);
5)选择结果确认,传递给文本区域。
2.计算机汉字笔画分段输入方法,根据笔画书写走向,对笔画归纳分类,为每种笔画类型分配键位,称为笔画类型码,按照书写笔顺依次输入笔画类型码完成整字输入,其特征是:对笔画之间的位置关系归纳分类,定义编码,分配键位,称为笔画定位分隔码,插入到不同位置的笔画类型码中间;
笔画之间的位置关系分类包含如下一种或者多种:
向上、向下、向左、向右、交叉;
按照可供使用的键位个数分配键位:
1)为每种笔画位置分配一个键位;
2)向下、向左共用一键,向右、向上共用一键;
涉及的输入步骤是:
1)进入汉字输入初始等待状态;
2)接收输入操作,
如果是汉字笔划描述操作,则转入3);
如果是汉字笔画分隔操作,则转入4);
3)接收笔画类型码,系统进行匹配检索,得到候选字集合;可以提示供选择;如果有选择就转入5);否则转入2);
4)接收笔画分隔码,指明后续笔画具有不同的位置;系统匹配检索得到候选字集合;如果有选择就转入5);否则转入2);
5)选择结果确认,传递给文本区域。
3.计算机汉字字根笔画分段输入方法,其特征是:同时使用笔画定位分隔码和字根定位分隔码,并且为分隔码分配键位。
4.按照权利要求1或者2或者3所述的方法,其特征是:所说的定位分隔码所指定的位置可以是该笔画在整个字根或者该字根在整个汉字中所处的位置。
5.按照权利要求3或4所述的方法,其特征是:为笔画分隔码和字根分隔码分配下述组合键位之一:
1)为左字根上笔画、左字根中笔画、左字根下笔画分配三个键位;为上字根上笔画、上字根中笔画、上字根下笔画分配三个键位;下字根和左字根、右字根和上字根共用键位;
2)在3X3按键阵列中,将第一行中间按键设定为向上键、将第三行中间按键设定为向下键,将第二行左按键设定为向左键、将第二行右按键设定为向右键,其它五个键位设定为五种笔划键位,左右键位操作指定字根位置的变换,上下键位操作指定笔划位置的变换。
6.按照权利要求1-5其中之一所述的方法,其特征是:为一个键位定义多个代码含义,根据分隔码键位连续操作次数或者按下时间长度,切换分隔码表示的位置信息。
7.按照权利要求1-5其中之一所述的方法,其特征是:根据汉字使用频度排列候选汉字集合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 96114106 CN1104673C (zh) | 1996-12-23 | 1996-12-23 | 计算机汉字字根笔画分段输入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 96114106 CN1104673C (zh) | 1996-12-23 | 1996-12-23 | 计算机汉字字根笔画分段输入方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1186271A CN1186271A (zh) | 1998-07-01 |
CN1104673C true CN1104673C (zh) | 2003-04-02 |
Family
ID=5121925
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 96114106 Expired - Fee Related CN1104673C (zh) | 1996-12-23 | 1996-12-23 | 计算机汉字字根笔画分段输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1104673C (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105807947A (zh) * | 2016-01-11 | 2016-07-27 | 金云中 | 一种模块化笔画编码汉字对应识别的方法 |
-
1996
- 1996-12-23 CN CN 96114106 patent/CN1104673C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1186271A (zh) | 1998-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1023916C (zh) | 简繁五笔字根汉字输入系统 | |
CN1024050C (zh) | 对汉字进行编码和译码的方法和装置 | |
CN1607491A (zh) | 使用操纵杆输入中文的系统和方法 | |
CN1434365A (zh) | 中文字形输入装置及中文字形输入法 | |
CN1549192A (zh) | 手写字体的计算机识别与自动输入方法 | |
CN1224889C (zh) | 一种汉字输入方法和使用该方法的系统 | |
CN1104673C (zh) | 计算机汉字字根笔画分段输入方法 | |
CN1141633C (zh) | 计算机二十四部首汉字排序输入法 | |
CN1097766C (zh) | 汉字五键输入法 | |
CN1009226B (zh) | 调声韵类式拼音输入键盘及输入法 | |
CN1257445C (zh) | 音义码汉字输入方法 | |
CN1072785A (zh) | 无理序号数字综合编码法及其键盘 | |
CN1274883A (zh) | 简化拼音-触摸屏鼠标式汉字输入方法 | |
CN1059281C (zh) | 汉字声韵调三拼音形编码输入方法 | |
CN1050915C (zh) | 一种计算机汉字输入引导提示方法 | |
CN1347023A (zh) | 二笔手写智能输入系统 | |
CN101034319A (zh) | 汉字输入方法及其专用键盘 | |
CN1256644C (zh) | 一种偏旁部首汉字输入方法 | |
CN1530806A (zh) | 一种文字书写录入方法 | |
CN1218214A (zh) | 一种汉字书写录入方法和设备 | |
CN1152293C (zh) | 一种汉字输入法 | |
CN1145875C (zh) | 计算机汉字同构输入法 | |
CN1301453C (zh) | 一种汉字双拼输入法 | |
CN1288185A (zh) | 音形字理码汉字输入方法 | |
CN1292333C (zh) | 一种方块字的输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |