CN1542594A - 以词为单位的汉字的通用计算机输入方法 - Google Patents
以词为单位的汉字的通用计算机输入方法 Download PDFInfo
- Publication number
- CN1542594A CN1542594A CNA2003101134274A CN200310113427A CN1542594A CN 1542594 A CN1542594 A CN 1542594A CN A2003101134274 A CNA2003101134274 A CN A2003101134274A CN 200310113427 A CN200310113427 A CN 200310113427A CN 1542594 A CN1542594 A CN 1542594A
- Authority
- CN
- China
- Prior art keywords
- sign indicating
- indicating number
- characters
- radicals
- chinese character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 74
- 238000005516 engineering process Methods 0.000 claims description 36
- 239000003550 marker Substances 0.000 claims description 14
- 230000008676 import Effects 0.000 claims description 10
- 230000000630 rising effect Effects 0.000 claims description 3
- 244000062793 Sorghum vulgare Species 0.000 claims description 2
- 235000019713 millet Nutrition 0.000 claims description 2
- 230000008901 benefit Effects 0.000 abstract description 3
- 230000010365 information processing Effects 0.000 abstract description 2
- LBDSXVIYZYSRII-IGMARMGPSA-N alpha-particle Chemical compound [4He+2] LBDSXVIYZYSRII-IGMARMGPSA-N 0.000 description 7
- 230000006872 improvement Effects 0.000 description 3
- 241000282693 Cercopithecidae Species 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000005266 casting Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 244000000383 Allium odorum Species 0.000 description 1
- 235000018645 Allium odorum Nutrition 0.000 description 1
- 241000282994 Cervidae Species 0.000 description 1
- 241001672694 Citrus reticulata Species 0.000 description 1
- 240000000491 Corchorus aestuans Species 0.000 description 1
- 235000011777 Corchorus aestuans Nutrition 0.000 description 1
- 235000010862 Corchorus capsularis Nutrition 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 210000001331 nose Anatomy 0.000 description 1
- 239000002304 perfume Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000002407 reforming Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
- 235000009019 yu li Nutrition 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明属于中文信息处理在汉字及相关信息处理领域方面的应用,是在ZL 95102608.9和专利申请03153755.3基础上再创造所产生的发明。针对目前不同设备输入法不同、不认识汉字无法直接用音码输入及单字词输入效率低的问题,根据汉语拼音归纳出音码及声调码,并将所有汉字拆解为部首+字身形式,分别用音码或笔画标记部首或字身,构成汉字的部首码和字身码,用汉字的音码及声调码,以及汉字的部首码和字身码,以词为单位按规则依次击键输入汉字。本发明码长短,重码率低,输入效率高;科学、系统、合理,学习起点低,易学易用,编码自然流畅;通用性强,可编码所有汉字和非汉字信息;在各种设备上编码规则相同、输入习惯类似、个人词库共享,可有效减轻用户的学习负担。
Description
技术领域 本发明是一种以词为单位的汉字的通用计算机输入方法,根据汉语拼音归纳出音码及声调码,并将所有汉字拆解为部首+字身的形式,分别用音码或者笔画标记部首或者字身,构成汉字的部首码和字身码,用汉字的音码及声调码,以及汉字的部首码和字身码,以词为单位按规则依次击键输入汉字。本发明属于中文信息处理在汉字及相关信息处理领域方面的应用,是在“拼音混合输入技术”(中国专利ZL 95102608.9)和“小键盘拼音混合输入技术”(中国专利申请03153755.3)基础上进行再创造所产生的发明。
背景技术 目前,计算机出现了膝上型、掌上型、微型化的趋势,手机逐渐出现了具备计算机各项功能的趋势,PDA、机顶盒、电子书、手持终端、家用电器以及固定电话等也都迫切需要用10个数字键方便、快捷地输入中文信息,这就要求我们将现有的主要使用英文字母编码的汉字输入方法转变为主要使用10个数字键编码的数字化汉字输入方法。
以智能ABC(itABC)和微软拼音(Microsoft Pinyin)为代表的拼音输入法是人们在PC机上输入汉字的主流输入方法。为提高拼音汉字输入方法的输入效率,发明人于1995年根据《汉语拼音方案》、《汉语拼音正词法基本规则》等规范的汉语知识,发明了拼音混合输入技术(“以词为单位的音形意汉字计算机输入方法”,中国专利ZL95102608.9),有效地解决了汉字输入前期易学性和后期效率的矛盾,使主要使用汉语拼音编码的计算机汉字输入变得更为快捷和便利。
在掌上型、微型化电脑以及手机、PDA、机顶盒、电子书、手持终端、家用电器、固定电话等领域,汉字输入的效率还比较低。发明人于2003年在中国专利ZL 95102608.9的基础上,发明了小键盘拼音混合输入技术(“以词为单位的数字化汉字计算机输入方法”,中国专利申请03153755.3),有效地解决了这一难题。该专利技术得到智能ABC(itABC)和美国特捷通讯(Tegic Communications,其T9输入法占据了世界手机输入法70%以上市场)公司的好评,三方将在该技术的基础上共同开发T9ABC小键盘汉字输入法,使主要使用汉语拼音编码的计算机小键盘汉字输入变得更为快捷和便利。
但是,在日常生活中,人们对在不同设备上需要使用不同的汉字输入方法,如在PC机上使用智能ABC(itABC),而在手机上使用T9(或者T9ABC)输入法,需要重新学习输入规则,需要重新建立个人词库等感到十分不便,他们迫切希望能有一种通用的汉字输入方法,以使在使用任何诸如计算机、手机、PDA、遥控器、智能家电等所有需要用到汉字的设备上,在输入任何汉字、阿拉伯数字、英文字母、标点符号等中文信息以及世界上其他任何国家的语言文字的时候,都可以使用同一种输入方法。可以想象,如果真能如人们所愿,发明出这种输入方法,那么,今后无论用户在任何领域处理中文信息,都可使用该输入法进行输入,不用重新学习输入规则、不用重新建立个人词库、不用操心需要多家公司提供技术支持和售后服务等诸多问题,等等,一切后顾之忧都可抛之脑后。本发明就试图在此方面进行有益的尝试。
此外,无论是拼音混合输入技术(中国专利ZL 95102608.9),还是小键盘拼音混合输入技术(中国专利申请03153755.3),一方面,对不认识的汉字,尚不能直接用音码输入,还需要查字典,或者切换到其他输入方法进行输入;另一方面,单字词的输入效率明显偏低,如输入“yi”仅仅在GB 2312-80中就有超过100个重码,在GB 18030中重码数量更是大大增加。人们迫切希望改进上述两项技术,从根本上改善单字词的输入方法,解决这两个难题。
发明内容 定义一种新型的计算机、手机、PDA、遥控器、智能家电、电子书、手持终端、固定电话等设备的通用键盘,包括大键盘和/或小键盘,取拼音混合输入技术(中国专利ZL 95102608.9)定义的30个音码,并将其按照拼音混合输入技术(中国专利ZL 95102608.9)的定义分布在大键盘“a”、“b”、“c”、“d”、“e”、“f”、“g”、“h”、“i”、“j”、“k”、“l”、“m”、“n”、“o”、“p”、“q”、“r”、“s”、“t”、“u”、“v”、“w”、“x”、“y”、“z”、“;”、“,”、“.”、“/”这30个键上,以及按照小键盘拼音混合输入技术(中国专利申请03153755.3)的定义分布在小键盘1、2、3、4、5、6、7、8、9、0这10个数字键上,按照国家标准将横“一”、竖“丨”、撇“丿”、点“丶”、折“乛”这五个笔画分别定义在大键盘以及小键盘“1”、“2”、“3”、“4”、“5”这5个数字键上,按照国家标准将阴平1、阳平2、上声3、去声4、轻声5这五个声调码分别定义在大键盘以及小键盘“1”、“2”、“3”、“4”、“5”这5个数字键上,使用小键盘拼音混合输入技术(中国专利申请03153755.3)的编码规则对所有词进行编码,或者用本发明所定义的部首码和字身码对单字词进行编码,或者用汉字的音码+部首码的第一码+字身码的第一码对单字词进行编码,在大键盘或者小键盘上依次击键输入汉字。同时,兼容编码标点符号、阿拉伯数字、英文词、混合词等。
本发明所述的新型的计算机、手机、PDA、遥控器、智能家电、电子书、手持终端、固定电话等的汉语通用键盘包括:
(1)大键盘的定义:在任何qwerty大键盘上,定义“v”键上同时标记逗号(“,”),“u”键上同时标记斜杠(“/”),“i”键上同时标记分号(“;”);同时,定义“,”键上同时标记“ch”(或者
以下凡是在编码中均标示为“,”),“.”键上同时标记“ng”(或者η,以下凡是在编码中均标示为
或者“η”),“/”键上同时标记“zh”(或者
以下凡是在编码中均标示为“/”),“;”键上同时标记“sh”(或者
以下凡是在编码中均标示为“;”)。
(2)小键盘的定义:在PC等键盘上的小键盘使用类似手机的数字分布定义,即将原普通PC键盘上的小键盘定义的第一行789、第二行456、第三行123中的第一行和第三行对调,也就是变为第一行123、第二行456、第三行789。
(3)以上大键盘和小键盘可任意组合,即可以只使用大键盘(小键盘不使用或者使用原小键盘),也可以只使用小键盘(大键盘不使用或者使用原定义),当然,推荐在计算机上两者同时使用。
本发明所述的计算机汉字输入方法包括:
(1)音码定义同小键盘拼音混合输入技术(中国专利申请03153755.3)。
(2)词的编码规则同小键盘拼音混合输入技术(中国专利申请03153755.3)。
(3)单字词除可按照小键盘拼音混合输入技术(中国专利申请03153755.3)编码外,还可以按照下述的汉字的部首—字身音码输入方法进行输入:
取部首的一个集合,该部首集合必须包含横“一”、竖“丨”、撇“丿”、点“丶”、折“乛”这五个单笔部首。对这五个笔画按照横1竖2撇3点4折5的国家标准进行编码,构成其部首码。对该部首集合中的其他部首每个部首确定一个唯一的读音,将该读音按照小键盘拼音混合输入技术(中国专利申请03153755.3)转换为音码,构成该部首的部首码。任何一个汉字的部首对应的部首码就是该汉字的部首码。
如果一个汉字是无字身的汉字,即该汉字就是所确定部首集合中的部首之一,如“匚”,或者就是由一个部首的变体构成的,如“孑”或者“孓”,则该汉字的编码就是该部首对应的部首码。
对于有字身的汉字,即除无字身的汉字外的其他汉字,则部首之外的部分构成该汉字的字身。对部首取部首码,对字身取字身码。部首码加字身码就是该汉字的编码,具体的取码顺序与部首和字身的相对位置相一致,但最长取6码(即按规则取码后略去第6码以后的部分)。
字身码的具体取法如下:
a)如果字身是由1个部分组成的,且该部分是一个部首或者一个汉字,则取该部首的部首码或该汉字的音码,构成该字身的字身码。字身既是一个部首同时又是一个汉字的,按照是一个部首处理。
例如“汉”的部首为“氵”,部首码为“;ui”,字身为“又”,字身码为“you”,由于“氵”在前,“又”在后,所以“汉”的编码为“;uiyou”(如果取“汉”的部首为“又”,则其部首码为“you”,字身为“氵”,字身码为“;ui”,由于“氵”在前,“又”在后,所以“汉”的编码同样为“;uiyou”)。
再如“旦”的编码为“ri1”,其部首是“日”,部首码为“ri”,字身是一个部首横“一”,字身码为“1”。
b)否则,如果字身是由1个部分组成的,则按顺序逐笔取笔画,最多取6和部首码码长之差个编码。
例如“禺”的部首为竖“丨”,部首码为“2”,部首码长度为1;字身为一个部分,按笔顺逐笔取6-1=5码,即“51125”,则“禺”的编码为“251125”。
再如“我”的部首为撇“丿”,部首码为“3”,部首码长度为1;字身为一个部分,按笔顺逐笔取6-1=5码,即“15153”,则“我”的编码为“315153”。
c)对于其他任何情况,即字身为2个或者2个以上部分,则对每一个部分按照下述规则取一码构成该汉字的字身码:构成部首的部分取该部首所对应的部首码的第一码,构成一个汉字的部分取该汉字音码的第一码,其他部分取该部分第一笔所对应的部首码。
如“能”的部首为“厶”,部首码为“si”,字身为“月匕匕”,字身码为“ybb”,则“能”的编码为“siybb”。再如“繁”的部首为“糸”,部首码为“jiao”,字身为“每”mei“攵”fan,则“繁”的编码为“mfjiao”。
又如“孬”的部首码为横1,字身为“不”的字身+“好”,则“孬”的编码为部首码横“1”+“不”的字身的第一码撇“3”+“好”的音码的第一码“h”,也就是“13h”。
再如“哉”的部首为“戈”,字身为“十口”,“戈”位于“十口”的中间,其编码为“;gek”(按照先后顺序,先取“十”的音码的第一码“;”,再取“哉”的部首码“ge”,最后取“口”的音码的第一码“k”)。
上述编码为规范码。对于上述c),如果一个汉字的字型是左右型,但其规范码的部首不是位于其左边或者右边的全部部分,而左边或者右边的全部部分可以构成一个汉字;或者一个汉字的字型是上下型,但其规范码的部首不是位于其上边或者下边的全部部分,而上边或者下边的全部部分可以构成一个汉字,则将该汉字视为虚拟的部首按照上述规范码编码的规则分别取部首码和字身码,构成容错码。当然,具有容错码的汉字一定具有规范码。
如“孬”可虚拟“不”为部首,相应的字身为“好”,则容错码为“buhao”;或者虚拟“好”为部首,相应的字身为“不”,结果同样为“buhao”。
再如“夥”的规范码为“gxxi”,部首为右下脚的夕,字身为果夕,符合容错码的条件,则其容错码为:虚拟“果”为部首,相应的字身为“多”,则结果为“guoduo”;或者虚拟“多”为部首,相应的字身为“果”,则结果同样为“guoduo”。
(4)单字词还可以按照下述方法输入:对于无字身的汉字,编码为该汉字的音码+部首码的第一码。如“木”的编码为“mum”;对于有字身的汉字,编码为该汉字的音码+部首码的第一码+字身码的第一码。如“编”的编码为“bianjb”。
(5)对于标点符号采用下述方法编码:所有中文标点符号按照其读音所对应的音码的第一码编码输入。
如逗号“,”或者其半角方式“,”编码为“d”,句号“。”或者其半角形式“.”编码为“j”。
此外,在大键盘上还可以直接用v键输入“,”,用u键输入“/”,用i键输入“;”。其他标点符号在大键盘上也可按照一般PC机汉字输入法(如智能ABC等)的约定输入。
(6)对于英文词采用下述方法编码:对每个英文字母视为一个虚拟汉字,编码为其本身,然后对该英文词按照小键盘拼音混合输入技术(中国专利申请03153755.3)的编码规则进行编码。
如“china”编码为“china”,“microsoft”编码为“microt”。
(7)对于阿拉伯数字采用下述方法编码:对每一个阿拉伯数字视为一个虚拟汉字,编码为其本身,数字长度为1-6的,编码就是该数字本身,如“2003”编码为“2003”;长度大于6的,每6个或少于6个数字为一组分组输入,如“20031111”编码为“200311”+“11”。
(8)对于混合词采用下述方法编码:对混合词中除汉字外的英文、阿拉伯数字、希腊字母等等的各种信息,每一个都视为一个虚拟汉字,编码为其本身,然后对该混合词按照小键盘拼音混合输入技术(中国发明专利申请03153755.3)的编码规则进行编码。
如“aol公司”编码为“aolgsi”,“智能abc”编码为“/nabc”,“microsoft公司”编码为“micros”。再如“lxd@znabc.com”编码为“lxdazm”、“www.hhpy.com”编码为“wwwdhm”、“hhpy.com”编码为“hhpydm”,“α粒子”编码为“alizi3”,“№1”编码为“no1”。又如“2003年”编码为“2003ni”,“11月11日”编码为“11y11r”。(网址、邮箱地址中的“.”定义为“d”,即拼音“dian”或者英文“dot”的首字母)
(9)上述方法也都具有小键盘拼音混合输入技术(中国专利申请03153755.3)定义的简码形式:任何一个词的编码可省去其除第一码外的最后一码,或最后两码,或最后三码,或最后四码,或最后五码,构成词的简码。
(10)上述方法在大键盘上采用编码的本身逐键键入,在小键盘上则需要根据小键盘的定义转换为数字逐键键入。如“编码”在大键盘上输入“bianma”即可,在小键盘上则需要转换为数字(如采用小键盘拼音混合输入技术实施方法二所定义的小键盘,则为“242662”)。
为提高大键盘上的汉字输入速度,本方法对上述方法作如下改进(以下称本改进方法为大键盘改进方案1):
(1)音码定义按照拼音混合输入技术确定,即音码=音码I+音码II,或者音码I+音码III,或者音码I+音码IV。
如“音”的音码为“yin”或者“yk”,“键”的音码“jian”或者“jx”或者“js”。
(2)用构成单字词的汉字的音码或者标准汉语拼音,顺序击键输入单字词。
如“音”的编码为“yin”或者“yk”,“键”的音码“jian”或者“jx”或者“js”,“帮”的编码为“ba.”或者“b;”或者“bang”。
(3)用组成双字词的两个汉字的音码(长于6码的取前6码),顺序击键输入双字词。
如“键盘”的编码为“jianpa”,或者“jxpan”,或者“jspan”,或者“jianps”,或者“jxps”,或者“jsps”,等等。
(4)用首字的音码I+后两个汉字的音码(长于6码的取前6码),顺序击键输入三字词。
如“计算机”的编码为“jsuanj”,或者“jswji”。
(5)用前三个汉字的音码I+最后一个汉字的音码的前三码,顺序击键输入四字词。如“计算机系”的编码为
(6)用前四个汉字的音码I+最后一个汉字音码的前两码,顺序击键输入五字词。
如“计算机语言”的编码为“jsjyya”,或者“jsjyys”。
为进一步提高大键盘上的汉字输入速度,本方法可对大键盘改进方案1进一步作如下改进(以下称本改进方案为大键盘改进方案2):
(1)由2-4个汉字组成的词如其编码长度不足6码,则在其编码后加最后一个汉字的声调码。
如“编码”当编码为“bxma”时长度不足6码,则可在“bxma”后加“码”的声调码“3”,结果为“bxma3”。
(2)对于无字身的汉字,编码为该汉字的音码+部首码的第一码。对于有字身的汉字,编码为该汉字的音码+部首码的第一码+字身码的第一码。
如“巾”的编码为“jinj”,或者“jkj”。
如“编”的编码为“bianjb”,或者“bxjb”。
(3)单字词还可用部首—字身音码输入方法(含规范码和容错码)输入,其中凡是部首码和字身码用到音码的,音码定义按照拼音混合输入技术的音码定义确定。
上述大键盘改进方案1和大键盘改进方案2中的编码也都具有简码形式:任何一个词的编码可省去其除第一码外的最后一码,或最后两码,或最后三码,或最后四码,或最后五码,构成词的简码。
具体实施方式 实施方法一:采用大键盘,不使用小键盘。
部首采用中国文字改革委员会、国家出版局1983年版《汉字统一部首表》(草案),共有部首201个。部首与部首码的对应关系如下:
175176177178179180181182183184185186187188189190191192193194195196197198199200201 | 阜(阝左)金(钅釒)鱼(魚)隶九画革面韭骨香鬼食(饣飠)音首十画鬲髟鬥高十一画黄麻鹿十二画鼎黑黍十三画鼓鼠十四画鼻十七画龠 | fuerjinyuligemianjiuguxia.gui;iyin;ougefadougaohua.maludi.hei;ugu;ubiyue |
编码规则同小键盘拼音混合输入技术(中国专利申请03153755.3)的实施方法一。则“法”编码为“fa”,或者“;uiqu”,或者“fa;q”;“方”编码为“faη”,或“fang”,或者“wen35”,或者“faηw3”;“方法”编码为“faηfa3”;“计算机”编码为“jsuanj”;“不进则退”编码为“bjztui”;“印度尼西亚”编码为“ydnxya”;“中华人民共和国”编码为“/hrmgg”,“aol公司”编码为“aolgsi”,“α粒子”编码为“alizi3”等。
当然,以上编码具有简码形式。例如:“法”的简码为“f”;“方法”的简码可为“faηf”;“计算机”的简码可为“jsuan”;“不进则退”的简码可为“bjzt”;“印度尼西亚”的简码可为“ydnxy”;“中华人民共和国”的简码可为“/hrm”,“aol公司”编码为“aolgs”,“α粒子”编码为“aliz”等。
实施方法二:采用小键盘拼音混合输入技术(中国专利申请03153755.3)实施方法二所定义的小键盘,不使用大键盘。部首与部首码的定义以及编码规则同本申请的实施方法一。
则“法”编码为“32”(fa),或者“08478”(;uiqu),或者“3207”(fa;q);“方”编码为“320”(faη),或“3264”(fang),或者“93635”(wen35),或者“32093”(faηw3);“方法”编码为“320323”(faηfa3);“计算机”编码为“578265”(jsuanj);“不进则退”编码为“259884”(bjztui);“印度尼西亚”编码为“936992”(ydnxya);“中华人民共和国”编码为“147644”(/hrmgg),“aol公司”编码为“26574”(aolgsi),“α粒子”编码为“254943”(alizi3)等。
当然,以上编码具有简码形式。例如:“法”的简码为“3”(f);“方法”的简码可为“3203”(faηf);“计算机”的简码可为“578”(jsu);“不进则退”的简码可为“2598”(bjzt);“印度尼西亚”的简码可为“93699”(ydnxy);“中华人民共和国”的简码可为“1476”(/hrm),“aol公司”编码为“26547”(aolgs),“α粒子”编码为“2549”(aliz)等。
实施方法三:采用大键盘和小键盘。大键盘的编码规则采用大键盘改进方案1和大键盘改进方案2。小键盘的编码规则同实施方法二。(以下括号内的为大键盘上的编码,括号外的为小键盘上的编码)
则“法”编码为32(fa),或者08478(;uiqu、;bqu),或者3207(fa;q);“方”编码为320(faη、f;),或3264(fang),或者93635(wen35、wd35),或者32093(faηw3、f;w3);“方法”编码为320323(faηfa3、f;fa3);“计算机”编码为578265(jsuanj、jswji);“不进则退”编码为259884(biztui、bjztb4);“印度尼西亚”编码为936992(ydnxya);“中华人民共和国”编码为147644(/hrmgg),“aol公司”编码为26574(aolgsi),“α粒子”编码为254943(alizi3)等。
当然,以上编码具有简码形式。例如:“法”的简码为3(f);“方法”的简码可为3203(faηf、f;f);“计算机”的简码可为578(jsu、jsw);“不进则退”的简码可为2598(bjzt);“印度尼西亚”的简码可为93699(ydnxy);“中华人民共和国”的简码可为1476(/hrm),“aol公司”编码为26547(aolgs),“α粒子”编码为2549(aliz)等。
本发明与现有技术相比,具有以下显著优点:
1、以词为单位输入,任何词码长最多6码,平均码长短,重码率低,输入效率高;
2、附和汉字和汉语的传统知识,科学、系统、合理,学习的起点低,编码自然流畅,易学易用;
3、通用性强,可对所有汉字和各种非汉字信息编码输入,有助于普通话的推行与传播,有助于汉语文化的传播;
4、该输入法还有一个其他任何输入法无法比拟的巨大优势,就是其在PC上与在手机等设备上具有相同的编码规则和类似的输入习惯,个人词库也完全可以实现共享,最大限度地减轻了用户的学习负担,大大方便了用户。
Claims (10)
1、一种以词为单位的汉字的通用计算机输入方法,根据汉语拼音归纳出音码及声调码,并将所有汉字拆解为部首+字身的形式,分别用音码或者笔画标记部首或者字身,构成汉字的部首码和字身码,用汉字的音码及声调码,以及汉字的部首码和字身码,以词为单位按规则依次击键输入汉字,其特征在于:
1-1所述的汉语通用键盘包括:在任何qwerty大键盘上,“v”键上同时标记逗号(“,”),“u”键上同时标记斜杠(“/”),“i”键上同时标记分号(“;”);“,”键上同时标记“ch”(或者
),“.”键上同时标记“ng”(或者η),“/”键上同时标记“zh”(或者
),“;”键上同时标记“sh”(或者
);
1-2取拼音混合输入技术定义的30个音码,并将其按照拼音混合输入技术的定义分布在大键盘“a”、“b”、“c”、“d”、“e”、“f”、“g”、“h”、“i”、“j”、“k”、“l”、“m”、“n”、“o”、“p”、“q”、“r”、“s”、“t”、“u”、“v”、“w”、“x”、“y”、“z”、“;”、“,”、“.”、“/”这30个键上,将横“一”、竖“丨”、撇“丿”、点“丶”、折“乛”这五个笔画分别定义在大键盘“1”、“2”、“3”、“4”、“5”这5个数字键上,将阴平1、阳平2、上声3、去声4、轻声5这五个声调码分别定义在大键盘“1”、“2”、“3”、“4”、“5”这5个数字键上;
1-3音码定义:同小键盘拼音混合输入技术;
1-4词的编码:同小键盘拼音混合输入技术;
1-5标点符号的编码:所有中文标点符号按照其读音所对应的音码的第一码编码输入;
1-6英文词的编码:对每个英文字母视为一个虚拟汉字,编码为其本身,然后对该英文词按照小键盘拼音混合输入技术的编码规则进行编码;
1-7阿拉伯数字的编码:对每一个阿拉伯数字视为一个虚拟汉字,编码为其本身,数字长度为1-6的,编码就是该数字本身;长度大于6的,每6个或少于6个数字为一组分组输入;
1-8混合词的编码:对混合词中除汉字外的英文、阿拉伯数字等各种信息每一个都视为一个虚拟汉字,编码为其本身,然后对该混合词按照小键盘拼音混合输入技术的编码规则进行编码;
1-9上述编码使用编码的原码逐键键入。
2、如权利要求1所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于单字词还可按照下述方法输入:
2-1取包含横“一”、竖“丨”、撇“丿”、点“丶”、折“乛”这五个单笔部首的一个部首集合,对横“一”、竖“丨”、撇“丿”、点“丶”、折“乛”这五个单笔部首按照横1竖2撇3点4折5编码,构成其部首码;对该部首集合中的其他部首每个部首确定一个唯一的读音,将该读音按照小键盘拼音混合输入技术音码的定义转换为音码,构成该部首的部首码;对任何一个汉字按照通用方法取部首,该部首对应的部首码就是该汉字的部首码;
2-2如果一个汉字是所确定部首集合中的部首之一,或者是由一个部首的变体构成的,则该汉字的编码就是该部首对应的部首码;
2-3对于有字身的汉字,部首之外的部分构成该汉字的字身;对部首取部首码,对字身取字身码;部首码加字身码就是该汉字的编码,具体的取码顺序与部首和字身的相对位置相一致,但最长取6码,即按规则取码后略去第6码以后的部分;
2-4字身码的具体取法如下:
2-4-1如果字身是由1个部分组成的,且该部分是一个部首或一个汉字,则取该部首的部首码或该汉字的音码,构成该字身的字身码;字身既是一个部首同时又是一个汉字的,按照是一个部首处理;
2-4-2如果字身是由1个部分组成的,且该部分既不是一个部首,也不是一个汉字,则先确定该汉字部首码的码长,然后按顺序逐笔对字身取笔画,最多取6和该汉字的部首码码长之差个编码;
2-4-3如果字身为2个或者2个以上部分,则对每个部分分别取一码构成该汉字的字身码:构成部首的部分取该部首所对应的部首码的第一码,构成一个汉字的部分取该汉字音码的第一码,其他部分取该部分第一笔对应的部首码;
2-5对于上述2-4-3,如果一个汉字的字型是左右型,但其规范码的部首不是位于其左边或者右边的全部部分,而左边或者右边的全部部分可以构成一个汉字;或者一个汉字的字型是上下型,但其规范码的部首不是位于其上边或者下边的全部部分,而上边或者下边的全部部分可以构成一个汉字,则该汉字具有容错码:
2-5-1将上述可以构成汉字的部分视为虚拟的部首,取其音码构成汉字的虚拟部首码;
2-5-2取汉字的虚拟部首外的部分视为虚拟字身,按照2-4的规则对虚拟字身进行编码,定义编码结果为虚拟字身码;
2-5-3按照2-3的规则组合汉字的虚拟部首码和汉字的虚拟字身码,构成汉字的容错码。
3、如权利要求1、2所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于单字词还可以按照下述方法输入:对于无字身的汉字,编码为该汉字的音码+部首码的第一码;对于有字身的汉字,编码为该汉字的音码+部首码的第一码+字身码的第一码。
5、如权利要求1、2、3、4所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于:任何一个词的编码可省去其除第一码外的最后一码、两码、三码、四码或五码,构成词的简码。
6、如权利要求1、2、3、4、5所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于使用小键盘输入:
6-1在小键盘上使用类似手机的数字分布定义,即将原普通PC键盘上的小键盘定义的第一行789、第二行456、第三行123中的第一行和第三行对调,也就是变为第一行123、第二行456、第三行789;将30个音码按照小键盘拼音混合输入技术键盘分布的定义分布在小键盘1、2、3、4、5、6、7、8、9、0这10个数字键上,将横“一”、竖“丨”、撇“丿”、点“丶”、折“乛”这五个笔画分别定义在小键盘“1”、“2”、“3”、“4”、“5”这5个数字键上,将阴平1、阳平2、上声3、去声4、轻声5这五个声调码分别定义在小键盘“1”、“2”、“3”、“4”、“5”这5个数字键上;
6-2将权利要求1-5所述的编码全部根据上述小键盘的定义逐键转换为数字编码,然后在小键盘上逐键键入。
7、如权利要求1、2、3、4、5所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于在大键盘上由1-5个汉字组成的词的编码规则如下:
7-1音码定义按照拼音混合输入技术确定;
7-2用构成单字词的汉字的音码或者标准汉语拼音,顺序击键输入单字词;
7-3用组成双字词的两个汉字的音码(长于6码的取前6码),顺序击键输入双字词;
7-4用首字的音码I+后两个汉字的音码(长于6码的取前6码),顺序击键输入三字词;
7-5用前三个汉字的音码I+最后一个汉字的音码的前三码,顺序击键输入四字词;
7-6用前四个汉字的音码I+最后一个汉字音码的前两码,顺序击键输入五字词。
8、如权利要求7所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于:由2-4个汉字组成的词如其编码长度不足6码,则在其编码后加最后一个汉字的声调码。
9、如权利要求7、8所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于单字词还可采用下述方法输入:对于无字身的汉字,编码为该汉字的音码+部首码的第一码;对于有字身的汉字,编码为该汉字的音码+部首码的第一码+字身码的第一码。
10、如权利要求7、8、9所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于单字词还可用权利要求2所述的部首一字身方法输入,其中凡是部首码和字身码用到音码的,音码定义按照拼音混合输入技术的音码定义确定。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2003101134274A CN1542594A (zh) | 2003-11-10 | 2003-11-10 | 以词为单位的汉字的通用计算机输入方法 |
PCT/CN2004/000967 WO2005043369A1 (en) | 2003-08-20 | 2004-08-19 | Character input method based on “phrase” as unit |
CN2004800234193A CN1836199B (zh) | 2003-08-20 | 2004-08-19 | 以词为单位的字符输入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2003101134274A CN1542594A (zh) | 2003-11-10 | 2003-11-10 | 以词为单位的汉字的通用计算机输入方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1542594A true CN1542594A (zh) | 2004-11-03 |
Family
ID=34336859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2003101134274A Pending CN1542594A (zh) | 2003-08-20 | 2003-11-10 | 以词为单位的汉字的通用计算机输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1542594A (zh) |
-
2003
- 2003-11-10 CN CNA2003101134274A patent/CN1542594A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1949151A (zh) | 一种数字键盘的键位功能定义方法 | |
CN1542594A (zh) | 以词为单位的汉字的通用计算机输入方法 | |
CN1235119C (zh) | 一种利用字符输入键盘的输入方法 | |
CN1252574C (zh) | 两码智能文字输入法 | |
CN1173253C (zh) | 十键四码中文手机输入法 | |
CN104793757B (zh) | 汉字输入方法和装置 | |
CN1808353A (zh) | 应用于数目字键盘的汉字输入法及相应的电子产品 | |
CN1334503A (zh) | 计算机汉字活码输入法及其键盘 | |
CN1696880A (zh) | 藏文计算机通用键盘布局与输入法 | |
CN1248092C (zh) | 一种数字笔画汉字输入方法 | |
CN1315026C (zh) | 一种数码汉字输入法 | |
CN1315027C (zh) | 十笔首尾数码检字法和十笔首尾数码输入法 | |
CN1159892C (zh) | 汉字象形数字编码方法及输入键盘 | |
CN1271493C (zh) | 数字键盘汉字输入法 | |
CN1487397A (zh) | 电子、手工处理汉字快易通用法 | |
CN1127009C (zh) | 一种使用拼音编码在数字键盘输入汉字的方法 | |
CN204731733U (zh) | 笔记本用多功能外接键盘 | |
CN104991653A (zh) | 一种新型便于携带的插接式键盘 | |
CN100384196C (zh) | 手机汉字十型输入法 | |
CN1203388C (zh) | 汉字双笔六码输入法 | |
CN1696879A (zh) | 手机矩阵键盘布局及汉字笔画双元输入法 | |
CN1292329C (zh) | 一种象形码数字键盘的英文字母输入方法 | |
CN1455319A (zh) | 中文四声母输入法及手机与电脑键盘 | |
CN1334505A (zh) | 汉字二笔数码输入系统及其键盘 | |
CN100340955C (zh) | 新易汉语拼音双拼小键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C57 | Notification of unclear or unknown address | ||
DD01 | Delivery of document by public notice |
Addressee: Liu Xiangdong Document name: Second notice of examination advice |
|
C57 | Notification of unclear or unknown address | ||
DD01 | Delivery of document by public notice |
Addressee: Liu Xiangdong Document name: Notification that Application Deemed to be Withdrawn |
|
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |