CN113253853B - 一种计算机和手机的汉字输入方法 - Google Patents
一种计算机和手机的汉字输入方法 Download PDFInfo
- Publication number
- CN113253853B CN113253853B CN202110337156.9A CN202110337156A CN113253853B CN 113253853 B CN113253853 B CN 113253853B CN 202110337156 A CN202110337156 A CN 202110337156A CN 113253853 B CN113253853 B CN 113253853B
- Authority
- CN
- China
- Prior art keywords
- code
- codes
- character
- words
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Abstract
一种计算机和手机的汉字输入方法,解决了目前汉字输入中或要频繁地在屏幕上选字,或要死记字根的痛点,特别是攻克了自有电脑以来的难题,即输入词语基本不用选词,让输入速度加倍提高。主要方案:所用代码限制在字的拼音首字母、成字组件独立为字时的拼音首字母以及指代笔画类型的键名字母;将笔画类型的代码设置为和拼音的声母不相同的键名字母;有规律地按笔顺在字中分散获取字根的代码;字和词语的全码编码的代码数量不同;把能改编成简码编码的字词的全码编码都改编成简码编码;把代码较少的简码编码分配给较常用的字词;改编成简码编码的字词在系统编码表中只保留简码编码;让用户重复击打编码最后一个代码一次或二次的方法输入相同编码字。
Description
一、技术领域
一种计算机和手机的汉字输入方法,利用汉字的发音,利用汉字字根的形状及和发音的关联,对汉字和词语编制编码,在计算机或手机的英文键盘上输入编码以输入汉字。
二、背景技术
拼音输入法和五笔输入法是目前计算机和手机的英文键盘汉字输入最普遍使用,也是使用效果最好的输入方法。拼音输入法简单易学,缺点是相同编码字、词语比率高,输入字、词语时要频繁地在屏幕上选择,影响输入速度;五笔输入法相同编码的字比率低,输入字时基本不用在屏幕上选字,缺点是需要记忆大量字根的代码,学习难,遗忘快,而且因为这个原因,现在用五笔输入法的大多是少数文字工作者,学生中几乎都用拼音输入法,由于拼音输入法的代码——拼音字母是和字的字根脱离的,造成学生会打字不会写字、写错别字的不好后果。
五笔输入法还有一个最大的缺点,就是十分不利词语输入——以词语为单位输入汉字。以词语输入为主输入汉字能加倍提高输入速度。拼音输入法输入词语要在屏幕上频繁地选词,五笔输入法输入词语实际上是不可能,因为五笔输入法在系统词语库中如果装入稍多的词语,输入时相同编码的词语会层出不穷,如果词语的装入量不足,用户输入时谁也不知道哪些词语能用词语输入,这使得使用五笔输入法的人只好放弃词语输入,一个字一个字地码字。究其原因有三(请注意,本输入法有的技术方案是针对这三个原因的):第一,五笔输入法每个字的“全码编码(包含了一个字的全部代码的编码)”是四个代码,词语的全码编码也是四个代码,使得字和词语的全码编码的代码组成结构差异化小,加上字和词语全码编码包含的代码数量相同,字和词语的全码编码容易重复;第二,五笔输入法词语的全码编码只四个代码,编码的空间不够,容易造成词语间全码编码相同,因为词语的数量不是字能相比的;第三,除了一码字,五笔输入法字词的“简码编码(省略了全码编码后面一个或几个代码的编码)”都由输入法系统码表中字词的全码编码按字母顺序排序自动产生,能用简码编码输入的字词不过是在全码编码的前一个代码相同或前几个代码相同或所有代码相同的字词中排序在最前面而已,虽然这部分字词能用简码编码输入,但是它们在系统码表中仍然以全码编码的形式存在,全码编码的数量没有减少;全码编码的数量没有减少,相同编码率也就不会降低;同时,五笔输入法简码编码由全码编码按字母顺序排序自动产生,也造成了几种简码编码属于同一个字或词的现象,影响了简码编码字词的数量,简码编码少,全码编码多,字词的相同编码数也就多;另外,简码编码由全码编码按字母顺序排序自动产生,也造成了这种现象:在全码编码前一个代码相同或前几个代码相同或所有代码相同的字词中,有的不常用的字词能用独一无二的编码输入,常用的字词反而要在屏幕上选择。以上不足存在于现今所有像五笔输入法这样的形码输入法和所有音码和形码相结合的输入法中。
我国已经出现了无数汉字输入法,原因是人们都感受到了拼音输入法或五笔输入法的不足,都试图发明出更好的输入法,但是迄今为止,没有一个输入法能做到既有拼音输入法的长处,又有五笔输入法的长处,也没有一个输入法能做到既不存在拼音输入法的弊病,又不存在五笔输入法的弊病,都成不了气候,绝大多数都自生自灭。
除了拼音输入法和五笔输入法的缺陷,目前在社会上使用的包括拼音输入法和五笔输入法在内的所有输入法,还有一个共同的最大的不足就是不能让用户流畅地以输入词语为主输入汉字。词语包括二字和二字以上词和词组,其数量惊人,特别是词语中的词组理论上是无穷尽的,要能让用户流畅地以输入词语为主输入汉字,条件是输入法系统词库中必须有十万条以上词语并且编码绝大多数是独一无二的,输入时基本不用在屏幕上选词。如果能做到这一点,会是汉字键盘输入法历史的一大跨越。
中国需要这样的输入法,能同时具备拼音输入法和五笔输入法的长处,没有两者的缺陷,并且能基本不用在屏幕上选词,能让用户流畅地以输入词语为主输入汉字。
三、发明内容
(一)解决的技术问题:第一,在同一个输入法中,既有拼音输入法的长处,又有五笔输入法的长处,不存在两者的缺点,即:输入汉字不但基本没有相同编码,不用频繁地在屏幕上选字,而且能让大部分常用字用简码编码输入;不需要死记字根的代码,输入规则简单明了,一看输入说明就能上手,且不易遗忘;第二,做到词语基本无相同编码,不用频繁地在屏幕上选词,并能让大部分常用词语用简码编码输入,成倍提高输入速度,解决一直以来所有汉字输入法都解决不了的让用户流畅地以输入词语为主输入汉字的难题。
(二)解决技术问题采用的技术方案及有益效果
1、解决技术问题采用的技术方案
要解决上述技术问题,不是从一个方面或两个方面就能解决的,需要多方面着手,本输入法采取以下技术方案:
方案第一部分:
将字根分为笔画和成字笔画组件(“成字笔画组件”指独立时能成为一个字的字中的笔画组件,即俗称的“字中字”,以下简称“成字组件”),所用代码限制在字的拼音首字母、成字组件独立成字时的拼音首字母、预先设置的充当汉字各笔画类型“丶(点)”、“一(横)”、“/(提)”、“丨(竖)”、“ノ(撇)”、“(捺)”、“乙(代表所有带转折弯钩的笔画)”的代码的键名英文字母,其中对各笔画类型“丶”、“一”、“/”、“丨”、“ノ”、“乙”的代码的设置尽量选择和其形状有共同特征点的键名英文字母,以便于记忆。
方案第一部分解析:上述所有代码的设置,使本输入法具备拼音输入法几乎没有记忆要求的优势,同时给字的编码设置代码的方法没有五笔输入法设置代码的弊端。五笔输入法代码所取的字根除了笔画、成字组件,还有非成字组件(包括部首和从字中人为地拆分出的非成字组件),每个字根用什么键名字母是人为地指定,代码和字根本身的特征或属性没有任何关联,故字根的代码必须死记硬背,不像本输入法按照字根本身具有的形状特征或关联的发音设置代码。五笔输入法那样做是以不产生相同编码字为导向,将键名字母作为代码分散到各字根中,而本输入法设置代码的方法,一定程度上也达到了分散代码的目的,原因是除了每类笔画的代码不同,以及每类笔画在字中所处的位置大多不同外,最主要的,每个字几乎都有成字组件,成字组件独立成字时的拼音首字母又分散在二十三个键名字母中,还有,本输入法让字的拼音首字母也作为代码参与到了编码中,使代码不集中在字根上,也起到了分散代码的效果。
方案第二部分:
代码没有了死记硬背的弊病,接着是如何将字和词语的相同编码率降到最低,做到输入时基本不用选字选词。这是本发明的重中之重,其难度在于,本输入法字根的代码是字中固有的,不像五笔输入法是以避免字与字之间的相同编码为导向而人为指定的。本发明采取以下方案以把字词的相同编码率降到最低:一、各笔画类型“丶”、“一”、“/”、“丨”、“ノ”、“乙”的代码还必须设置成和汉语拼音中的声母不相同的键名英文字母,使字根的代码不主要集中在和汉语拼音中的声母相同的键名英文字母上,而是得以分散到所有二十六个键名英文字母中,为减少字词的相同编码创造条件;二、根据汉字的结构特点制定规则,有规律地按笔顺先后在字中分散获取字根的代码,即不按字根在字中的位置挨个取码,因为只有分散取码,编码变化才大,相同编码字才少(提示:除了拼音输入法和五笔输入法,现在人们在使用的尚存活力的主要有笔画输入法和部首输入法,笔画输入法和部首输入法就是因为在字中没有分散获取字根码,论选字选词比拼音输入法频繁,论以输入词语为主输入汉字比五笔输入法更不可能);三、把能改编成简码编码的字的全码编码都改编成简码编码,改编成简码编码的字在系统编码表中只保留简码编码,让用户只用简码编码输入,以消除大量相同编码,也能让用户养成用简码编码输入的习惯,同时,在把字的全码编码改编成简码编码时,在全码编码前一个代码相同或前几个代码相同或所有代码相同的字中,把代码最少的简码编码分配给最常用的字,以提高用户的输入速度;四、对于少数的剩余的相同编码字(相同编码字都是全码编码字),用在字的全码编码后添加一个或二个和全码编码的最后一个代码一样的代码的方法,以和它们同编码的字区别,用户在输入时只要重复击最后击过的字母键一次或二次就可,不用思索,方便快捷;五、本输入法字的全码编码为四个代码,词语的全码编码为六个代码,使字的全码编码和词语的全码编码产生不了相同编码,又加大了字和词语之间的全码编码的代码组成结构的差异化,为词语的简码编码和字的编码不相同创造了条件[提示:虽然词语的全码编码比字的全码编码多了二个,由于字和词语全码编码取码的方法不同(详见下文),这种不同体现到词语的简码编码中,使得输入一个词语时,其代码数并不一定要比字的代码数多],同时,词语的全码编码比字的全码编码多二个代码又大大减少了词语之间的相同编码;六、把能改编成简码编码的词语的全码编码都改编成简码编码,词语的简码编码区别字的编码,并且改编成简码编码的词语在系统编码表中只保留简码编码,让用户只用简码编码输入,这消除了大量词语编码的重复,减少了绝大部分词语的编码的代码,也能让用户养成用简码编码输入词语的习惯;同时,改编时,在全码编码前一个代码相同或前几个代码相同或所有代码相同的词语中,把代码最少的简码编码分配给最常用的词语。
2、解决技术问题的有益效果
(1)本输入法收入《通用规范汉字表》中除了当今公众的计算机无法输入和显示的字以外的全部汉字,包括同形异音字,共8959个,能做到所收汉字除了360个字(多是冷僻字)有相同编码外,其余汉字的编码都独一无二(本说明的最后附上8959个字的系统编码表,以供验证);另外,本输入法能做到十六万多个系统词语基本没有相同编码(只因篇幅关系没办法提供纸质词语系统编码表,如需要可随时提供电子表格)。
(2)经发明人制成软件私下不公开试用,效果十分理想,在同一个输入法中拼音输入法和五笔输入法的不足得到了克服,优点得到了发扬,规则简单,既不用记忆字根,易上手,难遗忘,又能让学生,特别是小学生掌握输入法后更能巩固字的书写,绝大多数常用的字词可以用简码编码输入,更为重要的是,达到了任何输入法都达不到的新高度:不但输入字几乎不用选字,输入词语也基本不用选词,能让用户流畅地以输入词语为主输入汉字,大大突破了现有的输入速度。
四、具体实施方式
(一)为汉字字根设定字根码
为字根设定的代码叫“字根码”,我们把汉字的字根分为两大类:笔画和成字组件。
1、设定笔画的字根码
把各笔画类型分成五大类,给每大类笔画设定一个键名字母作为字根码,要求:
(1)尽可能地选择和笔画的形状有相似的特征点的键名字母作为笔画的字根码,原因:便于记忆。
(2)必须选择和汉语拼音中的声母不相同的键名字母作为笔画的字根码,原因:前面说过,字的拼音首字母将充当字的一个代码参与到字的编码中,加上成字组件的代码也是由成字组件独立为汉字时的拼音首字母充当,这样,字根的代码就集中到了和汉语拼音的声母相同的键名字母上,选择和汉语拼音中的声母不相同的键名字母作为笔画的字根码,能使字根的代码分散到所有二十六个键名英文字母中而不集中在和汉语拼音的声母相同的键名字母上,从而为减少字词的相同编码创造条件,因为在汉字中,不管哪个声母充当拼音首字母,它属下的汉字都比某个韵母充当拼音首字母所属的汉字要多得多,更何况,在二十六个健名字母中,除了充当汉字拼音首字母的“A”、“E”、“O”三个韵母,还有三个不充当拼音首字母的字母“I”、“V”、“U”。
五大笔画类型字根码的设置列表如下:
2、设定成字组件的字根码
将所有成字组件的代码设定为成字组件独立为汉字时的拼音首字母,如把“码”字中的“石”的代码设定为汉字“石”的拼音首字母“S”,把“码”字中的“马”的代码设定为汉字“马”的拼音首字母“M”。
(二)为汉字编制全码编码
1、字码和编码体系
每个字的全码编码为四个代码,其中有三个代码是字根码——笔画的代码和成字组件的代码,还有一个代码取自整个字的拼音首字母,叫“字码”,如“码”字的字码就是“码”的拼音首字母“M”。本输入法有两个编码体系供用户选择使用,一个是字码排在字根码前的编码体系:如果“X”代表字码,“Y”代表字根码的话,全码编码中的四个代码排列为“XYYY”;另一个是字码排在字根码后的编码体系:如果“X”代表字码,“Y”代表字根码的话,全码编码中的四个代码排列为“YYYX”。两个编码体系各有优势(见下文),用户可择一使用。
2、全码编码中三个字根码的获取
(1)三个字根码的第一码的取码。为了更清晰地说明,我们把字根码的第一码称为“字根码的第一基本码”,简称“第一基本码”。第一基本码取字书写时开头的字根的代码,如“技”字的第一基本码取开头的字根“一(横)”的代码“A”;“疑”字的第一基本码取开头的字根“匕”的代码“B”——“疑”字的第一基本码不能取开头的字根“ノ”的代码,只能取开头的字根“匕”的代码,因为取码的字根必须最大化,“匕”包含了“ノ”,比“ノ”大;“又”字的第一基本码取开头的字根“フ”的代码“U”;“一”字的第一基本码取开头的字根“一(横)”的代码“A”[注:“一”充当字根时,一律当作笔画“一(横)”取码,不当作成字组件“一(yī)取码]。第一基本码取码规则:第一基本码取码遵循取码的字根必须最大化的规则,取字书写时开头的字根的代码。
(2)三个字根码的第二码取码。我们把字根码的第二码称为“字根码的第二基本码”,简称“第二基本码”。第二基本码取字书写时末尾的字根的代码:如“技”字的第二基本码取末尾的字根“支”的代码“Z”——“技”字的第二基本码不能取末尾的字根“又”的代码,因为取码的字根必须最大化,“支”包含了“又”,比“又”大;“疑”字的第二基本码取末尾的字根“人”的代码“R”——“疑”字的第二基本码不能取末尾的字根的代码,因为取码的字根必须最大化,“人”包含了比大;“又”字的第二基本码取末尾的字根的代码“V”;“一”字被第一基本码取后没有了第二基本码可以取码的字根,在字码排在字根码前的编码体系中,“一”字的第二基本码用第一基本码“一(横)”的代码“A”来充当{“一”字的二个基本码排列也就是:第一基本码、第二基本码:AA[一(横)一(横))]},在字码排在字根码后的编码体系中,“一”字的第二基本码用“一”字的拼音首字母“Y”来充当(原因见下文){“一”字的二个基本码排列也就是:第一基本码、第二基本码:AY[一(横)一(yī)]}这里的“一(yī)”字的拼音首字母是被用来充当字根码的,属字根码。第二基本码取码规则:第二基本码取码遵循取码的字根必须最大化的规则,取字书写时末尾的字根的代码,如果是一个笔画的字,在字码排在字根码前的编码体系中,第二基本码用第一基本码来充当,在字码排在字根码后的编码体系中,第二基本码用字的拼音首字母来充当。
(3)三个字根码的第三码的取码。我们把字根码的第三码称为“字根码的补充码”,简称“补充码”。补充码是取第二基本码所取码的字根书写时末尾的字根的代码:如“技”字的第二基本码所取码的字根是“支”,“技”字的补充码取“支”末尾的字根“又”的代码“Y”——“技”字的补充码不能取的代码,因为取码的字根必须最大化[“技”字的三个字根码排列也就是:第一基本码、第二基本码、补充码:AZY(一支又)];“疑”字的第二基本码所取码的字根是“人”,“疑”字的补充码取“人”末尾的字根的代码“V”[“疑”字的三个字根码排列也就是:第一基本码、第二基本码、补充码:BRV];“又”字的第二基本码所取码的字根是不能再拆分出字根来供获取补充码,在字码排在字根码前的编码体系中,“又”字的补充码就用第二基本码即的代码“V”来充当[“又”字的三个字根码排列也就是:第一基本码、第二基本码、补充码:UVV],在字码排在字根码后的编码体系中,“又”字的补充码就用“又”字的拼音首字母“Y”来充当(原因见下文)[“又”字的三个字根码排列也就是:第一基本码、第二基本码、补充码:UVY ];同样,“一”字没有可供获取补充码的字根,在字码排在字根码前的编码体系中,“一”字的补充码就用第二基本码(也是第一基本码)即“一(横)”的代码“A”来充当[“一”字的三个字根码排列也就是:第一基本码、第二基本码、补充码:AAA[一(横)一(横)一(横)],在字码排在字根码后的编码体系中,“一”字的补充码就用“一”字的拼音首字母(也是第二基本码)“Y”来充当(原因见下文)[“一”字的三个字根码排列也就是:第一基本码、第二基本码、补充码:AYY[一(横)一(yī)一(yī)]。补充码取码规则:补充码取码遵循取码的字根必须最大化的规则,取字的第二基本码所取码的字根书写时末尾的字根的代码,对于第二基本码所取码的字根是一个笔画的字或者整个字是一个笔画的字,在字码排在字根码前的编码体系中,补充码用第二基本码充当,在字码排在字根码后的编码体系中,补充码用字的拼音首字母来充当。
为什么在字码排在字根码前的编码体系中,一个笔画的字的第二基本码、一个笔画的字的补充码和第二基本码所取码的字根是一个笔画的字的补充码,用前一个字根码来充当,而在字码排在字根码后的编码体系中,一个笔画的字的第二基本码、一个笔画的字的补充码和第二基本码所取码的字根是一个笔画的字的补充码,用字的拼音首字母来充当?举例来说,如“艺”字,字码是“艺”的拼音首字母“Y”,第一基本码是“一(横)”的代码“A”,第二基本码是笔画“乙(横折弯钩)”的代码U,在字码排在字根码前的编码体系中,“艺”的补充码用第二基本码U来充当,输入时只是再击一下前面击过的键,很方便,更为重要的,这时“艺”字的全码编码为“YAUU”,“艺”的前三码为三个不同的代码,而且有字码参与其中,这使“艺”的前三码和别的字的前三码相同的几率较小,“艺”能用简码编码输入的几率较大,而且,二字词语的输入和字的编码的前三码直接有关(详见下文),字的前三码和别的字的前三码不重复,这个字所在的二字词语就不可能和别的二字词语的全码编码相同,这个字所在的二字词语还能用词语的简码编码输入,但是,如果在字码排在字根码后的编码体系中,“艺”字的补充码仍然用第二基本码U来充当,“艺”字的全码编码会是“AUUY”,字码没有参与到前三码中,而且第二、第三码都是“U”,像“艺”这样第二基本码指代的是带转折弯钩的笔画的字还有很多,会有很多第二、第三码都是“U”的字,“艺”的前三码和其它字的前三码,“艺”的全码编码和其它字的全码编码相同的几率就会大大增加,反之,如果在字码排在字根码后的编码体系中“艺”字的补充码用字的拼音首字母来充当,“艺”的全码编码会是“AUYY”,前三个代码不相同,又有字码参与其中,“艺”的前三码和其它字的前三码,“艺”的全码编码和其它字的全码编码相同的几率就会大大减小,“艺”能用简码编码输入的几率就会大大增加,“艺”所在的二字词语和别的二字词语的全码编码不相同的几率以及“艺”所在的二字词语能用简码编码输入的几率相应会大很多。
三个字根码按照上述所取码的字根的位置在字中有规律地分散获取,大大降低了字的全码编码的相同编码率,如果不分散取码,字的相同编码率就非常高,如笔画输入法,所有以“艹”开头的字的前三码取码的字根都依次是“一”、“丨”、“丨”,所有以“扌”开头的字的前三码取码的字根都依次是“一”、“亅”、“/”,等等,又如以字典中的部首为单位取码的部首输入法,所有以成字组件“莫”开头的如“幕”、“慕”、“墓”、“暮”、“摹”等字的前三码取码的字根都依次是“艹”、“日”、“大”,所有以成字组件“章”结尾的如“障”、“樟”、“嶂”、“獐”、“蟑”等字的最后三码取码的字根都依次是“立”、“日”、“十”,等等,这些输入法的相同编码率自然高。
3、两个编码体系各自的优势
用字的拼音首字母作为字码而成为编码中的一个代码,也是为了分散取码,以降低字的相同编码率。
字码在字根码前的编码体系的优势是:由于字的简码编码输入只是输入全码编码中的前一个或前二个或前三个代码,字码排在字根码前面能使简码编码输入更方便;更为重要的,多字词语的输入主要和字的编码的第一个代码有关(见下文),字码在前会给词语的输入带来更大的便利。
字码在字根码后的编码体系的优势是:由于字的拼音首字母排在全码编码的最后,使得有的不认识的字能用简码编码直接打出,有的不认识的字在输入编码的前三码后能在屏幕候选字中找到,又因为词语的输入只和字的简码编码有关,不认识的字都可以用词语打出。
字码在字根码前的编码体系适合普通用户使用,字码在字根码后的编码体系适合专业打字者使用。
(三)编制全码编码遵循的细则
1、按书写笔顺取码,书写时笔画不是连续完成的成字组件,不能作为成字组件取码(有利于学生巩固字的书写笔顺)。如“甫”字,字根码的第一基本码不能取“十”,应取“一”,因为按书写笔顺,“十”的两笔不是连续完成的。同理,如“成”字,字根码的第一基本码不能取“戊”,应取“厂”,因为按书写笔顺“成”中的“戊”的笔画不是连续完成的。
2、取码的字根必须最大化(字例见上文)。
3、“一”和“乙”充当字根时,一律作为笔画取码,不作为成字组件取码。
4、为能让文字水平低的用户特别是小学生能流畅地输入汉字,如果一个字字中的成字组件独立成字时是个较生僻的字,这个字就增加编码,增加的编码取码时不把这个成字组件当作成字组件。如“包”字中的成字组件“巳”独立成字时是个较生僻的字,就增加“包”的一个编码,增加的编码取码时不把“巳”当作成字组件,即“包”的字根码的第二基本码取“乚”不取“巳”。
5、笔画长短和汉字“二”不一致的二横不能被当作成字组件“二”获取代码;笔画长短和汉字“三”不一致的三横不能被当作成字组件“三”获取代码。如“当”字、“日”字中的二横不能被当作成字组件“二”获取代码;“目”、“且”字中的三横和“非”字中的两组三横,不能被当作成字组件“三”获取代码。
(四)根据字的全码编码编制字的简码编码
我们把包含了全部四个代码的字的编码叫字的全码编码,省略掉字的全码编码后面一个或两个或三个代码的编码叫字的简码编码。
字的简码编码定义:省略掉字的全码编码后面一个或两个或三个代码,只保留全码编码前面一个或两个或三个代码,以最少的代码区别其它编码的编码,叫字的简码编码。也就是说,简码编码都是独一无二的编码。
本输入法把能改编成简码编码的字的全码编码,都改编成简码编码(注:通过EXCEL表格排序,统计,删除代码,进行改编),并且改编成简码编码的汉字在系统编码表中只保留简码编码,让用户只用简码编码输入这些汉字。
看一个字的全码编码能不能改编成简码编码,要看打算改编成的简码编码是否有别的更需要它的字。
把字的全码编码改编为简码编码的原则和好处是:
1、消除编码的重复,降低相同编码率;减少编码的代码,提高输入速度。假如在所有字的编码中,有三个字的全码编码相同,都是“LMOS”,如果能把其中的二个字分别改编成简码编码“LM”和“LMO”,并将这二个字的全码编码删去,只保留简码编码,那么,这三个字的每个字没有了相同编码,这三个字的编码在输入法系统编码表中按字母顺序排序后,用户输入这三个字时就不用在屏幕上选字了。反之,如果三个字都没有改编成简码编码,那么输入时除了系统码表里这三个字中排序最前的那个字,其它二个字都得在屏幕上选字。
2、在全码编码前一个代码相同或前几个代码相同或所有代码相同的字中,把代码最少的简码编码分配给最常用的字,以提高输入速度。如在字码排在字根码前的编码体系中,在全码编码前一个代码都为“W”的字中,把代码最少的简码编码“W”分配给这部分字中最常用的字“我”;在全码编码前二个代码都为“WO”的字中,把代码最少的简码编码“WO”分配给这部分字中最常用的字“为”;在全码编码前三个代码都为“WOW”的字中,把代码最少的简码编码“WOW”分配给这部分字中最常用的字“误”。
(五)相同编码字的处理
把能改编的字的全码编码改编成简码编码后,剩下的全码编码的字中还有少量字(多是生僻字)存在着几个字共用一个相同的全码编码的情况。我们把和别的字共用一个全码编码的字,叫做相同编码字。
本输入法的相同编码字多是二字共用一个全码编码,少量是三字共用一个全码编码,极少是四字或四字以上共用一个全码编码。
本输入法对相同编码字的处理是:
1、二字共用一个全码编码的,在其中一个较不常用的字的全码编码后添加一个和编码的最后一个代码一样的代码,使二个字的编码不相同。如在字码排在字根码前的编码体系中,“蚱”、“虸”是相同编码字,全码编码都是“ZCZA”,我们就在较不常用的“虸”字的全码编码后添加一个和编码的最后一个代码一样的代码“A”,让“虸”字的编码变成“ZCZAA”,使“虸”字和“蚱”字的编码不相同。
2、三字共用一个全码编码的,让最常用的一个字的全码编码保持原状,在较常用的一个字的全码编码后添加一个和编码的最后一个代码一样的代码,在最不常用的一个字的全码编码后添加二个和编码的最后一个代码一样的代码,使三个字的编码不相同。如在字码排在字根码前的编码体系中,“疹”、“瘃”、“鬷”是相同编码字,全码编码都是“ZGVV”,我们让最常用的“疹”字的全码编码保持原状,在较常用的“瘃”字的全码编码后添加一个和编码的最后一个代码一样的代码V,让“瘃”字的编码变成“ZGVVV”,在最不常用的“鬷”字的全码编码后添加二个和编码的最后一个代码一样的代码V,让“鬷”字的编码变成“ZGVVVV”,这样三个字的编码就不相同了。
3、四字或四字以上共用一个全码编码的,让最常用的一个字的全码编码保持原状,在较常用的一个字的全码编码后添加一个和编码的最后一个代码一样的代码,在其余字的全码编码后添加二个和编码的最后一个代码一样的代码,这样,最常用的那个字和较常用的那个字的编码就独一无二了。
这样处理相同编码字的好处是,用户输入这些字时,输完了全码编码后不用考虑要添加什么代码,只要再击一次或二次前面击过的最后一个键,绝大多数相同编码字就不用到屏幕上选择了,方便快捷。
(六)根据字的全码编码为词语编制全码编码
每个词语的全码编码为六个代码,其取码方法如下:
1、二字词语按顺序取每个字全码编码的第一、第二、第三个代码。如在字码排在字根码前的编码体系中,要给“于是”这个词语编制全码编码,“于”字的全码编码为“yeuu”,“是”字的全码编码为“sdrv”,“于是”的全码编码就是“于”字的全码编码的第一、第二、第三个代码y、e、u加上“是”字的全码编码的第一、第二、第三个代码s、d、r,即“yeusdr”。
2、三字词语按顺序取每个字全码编码的第一、第二个代码。
3、四字词语按顺序取前两个字每个字全码编码的第一个代码和后两个字每个字全码编码的第一、第二个代码。
4、五字词语按顺序取前四个字全码编码的第一个代码和最后一个字全码编码的第一、第二个代码。
5、六字词语按顺序取每个字全码编码的第一个代码。
6、六字以上词语按顺序取前六个字每个字全码编码的第一个代码。
从以上可以看出,由于字和词语全码编码取码的方法不同,一个字有可能要用全码编码的四个代码打出,而以这个字开头的一个词语有可能只用三个代码的简码编码甚至用更少代码的简码编码就能打出。
(七)根据词语的全码编码编制词语的简码编码
本输入法把能改编成简码编码的词语的全码编码,都改编成简码编码,并且改编成简码编码的词语在系统编码表中只保留简码编码,让用户只用简码编码输入。
词语的简码编码不光能区别其它词语的编码,还能区别字的编码,即词语的简码编码不和字的编码相同。
看一个词语的全码编码能不能改编成简码编码,要看打算改编成的简码编码是否有更需要它的字或更需要它的别的词语。
当词语的简码编码和字的编码有冲突时,一般把代码较少的编码让给字,只有当一边是极为冷僻的字,一边是较常用的词语时,才把代码较少的编码让给词语[注:用EXCEL表格把词语的全码编码和字的编码(包括字的简码编码和全码编码)放在一起排序,统计,删除或增加代码,进行改编]。
把词语的全码编码改编为简码编码的原则和好处是:
1、消除编码的重复,降低相同编码率;减少编码的代码,提高输入速度。假如在所有词的编码中有五个词语的全码编码相同,都是“YYOYYO”,如果能把其中的四个词语分别编成简码编码“YY”、“YYO”、“YYOY”、“YYOYY”,并将这四个词语的全码编码删去,只保留简码编码,那么,这五个词语的每个词语没有了相同编码,五个词语的编码在输入法系统编码表中按字母顺序排序后,用户输入这五个词语时就不用在屏幕上选词了。反之,如果五个词语都没有改编成简码编码,那么输入时除了输入法系统码表里五个词语中排序最前的那个词语,其它四个词语都得在屏幕上选词。
2、在全码编码前一个代码相同或前几个代码相同或所有代码相同的词语中,把代码最少的简码编码分配给最常用的词语,以提高输入速度。如,在字码排在字根码后的编码体系中,在全码编码前三个代码都为“KIZ”的词语中,把代码最少的简码编码“KIZ”分配给最常用的词语“中国”;在全码编码前四个代码都为“KIZI”的词语中,把代码最少的简码编码“KIZI”分配给最常用的词语“中央”;在全码编码前五个代码都为“KIZIS”的词语中,把代码最少的简码编码“KIZIS”分配给最常用的词语“中餐”。
五、汉字系统编码表(字码排在字根码前的编码体系)
[注:1、按字母顺序、按列排序,可用于检验说明书;2、共收汉字8959个,其中只360个字(大多是冷僻字)的编码为非独一无二;3、因篇幅关系,对于一字多编码的字,只收录主要编码]
Claims (1)
1.一种计算机和手机的汉字输入方法,利用汉字的发音,利用汉字字根的形状特征及和发音的关联,对汉字和词语编制编码,在计算机或手机的英文键盘上输入编码以输入汉字,其特征在于,所述给汉字编制编码,是把汉字的字根分为笔画和成字组件两大类,为字根设定字根码,其中笔画的代码设定为和汉语拼音中的声母不相同的键名英文字母,成字组件的代码设定为成字组件独立为汉字时的拼音首字母,全码编码的四个代码中三个是字根码,还有一个是以字的拼音首字母为代码的字码,根据字码在编码中的位置,有两个编码体系供用户择一使用,一个是字码排在三个字根码前的编码体系,一个是字码排在三个字根码后的编码体系,三个字根码的第一码取码遵循取码的字根必须最大化的规则,取字书写时开头的字根的代码,三个字根码的第二码取码遵循取码的字根必须最大化的规则,取字书写时末尾的字根的代码,如果是一个笔画的字,三个字根码的第二码在字码排在三个字根码前的编码体系中用第一个字根码来充当,在字码排在三个字根码后的编码体系中用字的拼音首字母来充当,三个字根码的第三码取码遵循取码的字根必须最大化的规则,取第二个字根码所取码的字根书写时末尾的字根的代码,对于第二个字根码所取码的字根是一个笔画的字或者整个字是一个笔画的字,三个字根码的第三码在字码排在三个字根码前的编码体系中用第二个字根码来充当,在字码排在三个字根码后的编码体系中用字的拼音首字母来充当,所述给汉字编制编码,把能改编成简码编码的字的全码编码,都改编成简码编码,并且改编成简码编码的汉字在系统编码表中只保留简码编码,让用户只用简码编码输入,字的简码编码定义是指,省略掉字的全码编码后面一个或两个或三个代码,只保留全码编码前面一个或两个或三个代码,以最少的代码区别其它编码的编码,叫字的简码编码,字的简码编码都是独一无二的编码,所述给汉字编制编码,对和别的字共用一个全码编码的相同编码字的处理是,二字共用一个全码编码的,在其中一个字的全码编码后添加一个和编码的最后一个代码一样的代码,三字共用一个全码编码的,让一个字的全码编码保持原状,在一个字的全码编码后添加一个和编码的最后一个代码一样的代码,在还有一个字的全码编码后添加二个和编码的最后一个代码一样的代码,四字或四字以上共用一个全码编码的,让一个字的全码编码保持原状,在一个字的全码编码后添加一个和编码的最后一个代码一样的代码,在其余字的全码编码后添加二个和编码的最后一个代码一样的代码,所述给词语编制编码,其全码编码为六个代码,二字词语先取第一个字的全码编码的第一、第二、第三个代码,再取第二个字的全码编码的第一、第二、第三个代码,并将它们按顺序连接,三字词语先取第一个字的全码编码的第一、第二个代码,再取第二个字的全码编码的第一、第二个代码,最后取第三个字的全码编码的第一、第二个代码,并将它们按顺序连接,四字词语先取第一个字的全码编码的第一个代码,再取第二个字的全码编码的第一个代码,再取第三个字的全码编码的第一、第二个代码,最后取第四个字的全码编码的第一、第二个代码,并将它们按顺序连接,五字词语先按字的顺序取前四个字全码编码的第一个代码,再取最后一个字全码编码的第一个和第二个代码,并将它们按顺序连接,六字词语按字的顺序取每个字全码编码的第一个代码,并将它们按顺序连接,六字以上词语按字的顺序取前六个字每个字全码编码的第一个代码,并将它们按顺序连接,所述给词语编制编码,把能改编成简码编码的词语的全码编码,都改编成简码编码,词语的简码编码不但区别其它词语的编码,还区别字的编码,并且改编成简码编码的词语在系统编码表中只保留简码编码,让用户只用简码编码输入,词语的简码编码定义是指,省略掉词语的全码编码后面一个或两个或三个或四个或五个代码,只保留全码编码前面一个或两个或三个或四个或五个代码,以最少的代码区别其它编码的编码,叫词语的简码编码,词语的简码编码都是独一无二的编码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110337156.9A CN113253853B (zh) | 2021-03-29 | 2021-03-29 | 一种计算机和手机的汉字输入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110337156.9A CN113253853B (zh) | 2021-03-29 | 2021-03-29 | 一种计算机和手机的汉字输入方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113253853A CN113253853A (zh) | 2021-08-13 |
CN113253853B true CN113253853B (zh) | 2023-01-10 |
Family
ID=77181213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110337156.9A Active CN113253853B (zh) | 2021-03-29 | 2021-03-29 | 一种计算机和手机的汉字输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113253853B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1397864A (zh) * | 2001-07-19 | 2003-02-19 | 甘锋利 | 计算机音形码汉字输入法 |
WO2003034195A1 (fr) * | 2001-09-10 | 2003-04-24 | Gao Jingjian | Procede de saisie numerique a deux traits pour la dactylographie des caracteres chinois et clavier utilise a cet effet |
CN1435749A (zh) * | 2002-12-05 | 2003-08-13 | 袁哲 | 汉字笔音码输入法及键盘 |
CN108919978A (zh) * | 2018-07-12 | 2018-11-30 | 周长河 | 计算机和手机的汉字音形输入方法 |
CN110737340A (zh) * | 2019-10-11 | 2020-01-31 | 周长河 | 一种计算机和手机的汉字音形输入方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1836199B (zh) * | 2003-08-20 | 2010-05-05 | 刘向东 | 以词为单位的字符输入方法 |
CN111124146A (zh) * | 2019-05-01 | 2020-05-08 | 王治阳 | 音素同声近位常用汉字码输入法 |
-
2021
- 2021-03-29 CN CN202110337156.9A patent/CN113253853B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1397864A (zh) * | 2001-07-19 | 2003-02-19 | 甘锋利 | 计算机音形码汉字输入法 |
WO2003034195A1 (fr) * | 2001-09-10 | 2003-04-24 | Gao Jingjian | Procede de saisie numerique a deux traits pour la dactylographie des caracteres chinois et clavier utilise a cet effet |
CN1435749A (zh) * | 2002-12-05 | 2003-08-13 | 袁哲 | 汉字笔音码输入法及键盘 |
CN108919978A (zh) * | 2018-07-12 | 2018-11-30 | 周长河 | 计算机和手机的汉字音形输入方法 |
CN110737340A (zh) * | 2019-10-11 | 2020-01-31 | 周长河 | 一种计算机和手机的汉字音形输入方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113253853A (zh) | 2021-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5119296A (en) | Method and apparatus for inputting radical-encoded chinese characters | |
US5903861A (en) | Method for specifically converting non-phonetic characters representing vocabulary in languages into surrogate words for inputting into a computer | |
JPH02135519A (ja) | 表意文字の集合体をコード化するシステム | |
JP2006127510A (ja) | テンキー・キーボードのための多言語入力方法エディタ | |
CN1027558C (zh) | 五笔二维计算机汉字输入方法及其键盘 | |
CN113253853B (zh) | 一种计算机和手机的汉字输入方法 | |
WO2000043861A1 (en) | Method and apparatus for chinese character text input | |
CN101952790B (zh) | 适用于中文教学的汉字输入方法 | |
CN1041661A (zh) | 中文输入装置及其键盘 | |
CN1053049C (zh) | 音数码计算机汉字输入方法 | |
CN110737340A (zh) | 一种计算机和手机的汉字音形输入方法 | |
CN110502128B (zh) | 一种汉字多元输入方法及系统 | |
CN105278697B (zh) | 组合式双拼类主副码汉字、词语编码输入法及其键盘 | |
CN1106146A (zh) | 电脑汉字声韵调编码输入法及其键盘 | |
CN102637077A (zh) | 用于计算机汉字输入的音、形、调混合编码方法 | |
CN113227946B (zh) | 一种拼音文字输入法 | |
CN108459735A (zh) | 声韵双击触摸屏汉语拼音输入方法 | |
GB2165677A (en) | Input/output method for computerized Chinese characters | |
CN1108553C (zh) | 通用普及型音元形音汉字编码输入方法 | |
CN119376554A (zh) | 一种计算机和手机的汉字部件输入方法 | |
CN106325540A (zh) | 一种滇东北次方言苗文的简笔输入法及其应用 | |
CN1063856C (zh) | 一种拆字拼音的计算机输入键盘及其输入方法 | |
JP6074332B2 (ja) | コンピュータ・電子辞書・スマートホンキーボードの日本語文字配列 | |
CA2270956A1 (en) | Method for converting non-phonetic characters into surrogate words for inputting into a computer | |
CN117917621A (zh) | 汉字输入方法和系统以及键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |