[go: up one dir, main page]

CN1148196A - 文字式音形汉字输入方法 - Google Patents

文字式音形汉字输入方法 Download PDF

Info

Publication number
CN1148196A
CN1148196A CN 95111380 CN95111380A CN1148196A CN 1148196 A CN1148196 A CN 1148196A CN 95111380 CN95111380 CN 95111380 CN 95111380 A CN95111380 A CN 95111380A CN 1148196 A CN1148196 A CN 1148196A
Authority
CN
China
Prior art keywords
word
sound
code
initial
pronunciations
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 95111380
Other languages
English (en)
Other versions
CN1069420C (zh
Inventor
戴石灵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN95111380A priority Critical patent/CN1069420C/zh
Publication of CN1148196A publication Critical patent/CN1148196A/zh
Application granted granted Critical
Publication of CN1069420C publication Critical patent/CN1069420C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明是一种文字式音形汉字输入方法,其特征是:用u、v、w代表声母zh、ch、sh,其它声母与键盘字母相同;用与声母相同的21个字母结合字母y表示韵母,声韵相拼便得“音”;用a、e、i、o表示声调和选择同码;将字拆为两个部件,合并其“音”的首字母得字“形”。字的编码为字“音”加字“形”,词组的编码由字码派生而来。本发明特有的“三元自选”、“特征码位”和“续符自选”技术可加速输入。它不仅具有易学性和快速性,还同时具有正音性和文字性。

Description

文字式音形汉字输入方法
本发明涉及一种以字音为主、字形为辅用键盘字母对汉语字词进行编码输入的文字式音形汉字编码输入方法。
众所周知,汉字的键盘输入要比任何一种拼音文字更为困难。尽管国内外已有数百种汉字编码键盘输入方法,但还没有一种既具有易学性和快速性,又具有正音性和文字性的中文字词编码键盘输入方法。如周志农先生的“自然码”(北京经济学院出版社《中国微机办公自动化软件大全》),它虽然较好地解决了快速性和易学性的统一问题,但由于它不能表示声调,所采用的拼音没有突破传统的双拼模式,形码部分也没有冲破传统的字根模式,因而仍存在记忆负担重,输入速度不理想和语音表达不全面的缺陷。唐懋宽先生的“声数码”(北京经济学院出版社《中国微机办公自动化软件大全》)用j、x、v、h表示阴、阳、上、去四声,与表示声母和韵母的字母有冲突,且声调键不能兼具选择同码的功能,因此它不具备文字性且输入速度不理想。
本发明的目的是提供一种既具有易学性和快速性,又具有正音性和文字性的文字式音形汉字输入方法。
本发明的目的是采用字母键盘结合编码规则和输入方法来实现的。其具体编码规则和输入方法是:用u、v、w分别代表声母的zh、ch、sh,其它声母与键盘字母相同;用与表示声母相同的21个字母结合字母y表示韵母;用a、e、i、o表示阴、阳、上、去四声和选择同码;声韵相拼,遇零声母音则加y,否则不加y,便得到“音”;用“二分成形法”拆字为两个部件,合并两部件“音”的首字母得字的“形”;单字的编码为字“音”加字“形”;双字词的编码为第一字“音”加第二字“音”;叁字词的编码为第一、二字“音”首字母加第三字“音”;肆字及肆字以上词的编码为第一、二、三、末字“音”首字母的组合。
下面结合表和实施例对本发明进一步说明。
表1是本发明声母、韵母和声调与键盘字母的对应关系表;
表2是本发明的键位;
表3是本发明的非成字部件表;
在表1中,用u、v、w分别代表声母的zh、ch、sh三个复声母,其它声母与键盘字母相同;把韵母按互补原则归并为2类,并用与表示声母相同的21个字母结合字母y来表示,后面加y的为+y韵母,首面加y的为y+韵母;声韵相拼时,对于非零声母音则不加y,对于零声母音则加y。因此,任何字的“音”都由上述22个字母中的两个拼成。节约的a、e、i、o四个字母,正好用来表示阴(-)、阳(
Figure A9511138000081
)、上( )、去(
Figure A9511138000083
)四个声调,也可兼做选择键。
在表2中,键上的大写字母表示键名;键上的三排小写字母表示为该键分配的声母和韵母;Y键上的+y和y+表示在拼写零声母音时与+y同排的韵母应在后面加y,与y+同排的韵母应在前面加y;A,E,I,O键上分配的是阴(-)、阳( )、上(
Figure A9511138000085
)、去(
Figure A9511138000086
)四声;
由于汉语的声调具有区别意义的作用,因此汉语拼音文字必须标调,而且标调必须用职能化的字母。若用其它方法标调,就会使其不象一种文字。本发明能做到这一点,故形如文字,称它为“文字式音形汉字输入方法”。
例如:妈、麻、马、骂四个字,从圈1或图2可知,声母为m,韵母为去掉y的b,其“音”都拼为mb,而其“带调音”则分别拼为mba、mbe、mbi、mbo。又如:师、实、使、视四个字,其“音”都拼为wm,面其“带调音”则分别拼为wma、wme、wmi、wmo。
本发明对字形编码采用“二分式成形法”进行拆字,所拆部件构成字的,其“音”为该字的“音”,所拆部件为非成字的,其“音”按“非成字部件表”中规定的音。
“二分式成形法”是将字拆分为前后两个部分,尽量使它们是较优先的部件;若某部分不是部件,则对该部分继续拆分并提取较优先的部件,合并所得两个部件“音”的首字母便得该字的“形”。
详细地讲,“二分式成形法”由以下三个步骤组成:
1.二分拆字,即将汉字拆分为前后两个部分,拆分的结果有下面4种情况:(1)前后两部分都是部件;(2)前部分是部件,后部分不是部件;(3)后部分是部件,前部分不是部件;(4)前后两个部分都不是部件。
2.提取部件,即对非部件部分继续拆分并提取优先级别高的部件代表该部分本身。在此过程后,前后两部分都成了部件,分别叫前部件和后部件。
3.合并音首,即“形”=前部件“音”的首字母+后部件“音”的首字母。
部分的前后是按先上后下、先左后右、先外后内、先横后竖的原则确定的。
部件分为三级,一级部件是用作构字的成字,其“音”就是该成字的音;二级部件是在“非成字部件表”(表3)中的非笔划部件,其“音”在表中规定;三级部件是在“非成字部件表”(表3)中的笔划部件,其“音”也在表中规定。
部件的优先级别是这样规定的:一级部件级别最高,二级部件次之,三级部件再次之;同级别的部件则笔画多的优先,笔画也相同的则按先上后下、先左后右、后外后内、先横后竖的原则确定优先级别。
本发明单字和词组的完全编码都是等长的四元码,即每个完全编码都由四个码元组成。单字的编码就是字“音”加字“形”。在词组的完全编码中,双字词的编码为第一字“音”加第二字“音”,叁字词的编码为第一、二字“音”首字母加第三字“音”,肆字及以上(含肆字)词的编码为第一、二、三、末字“音”首字母的组合。但在实际输入过程中,字词所用的输入码是不等长的。本发明按照高频优先的原则,为使用频率越高的字词分配码长越短的输入码。输入码分为一级码、二级码、三级码和四级码,分别取相应完全编码的前一、二、三、四个码元构成。四级码的第四码元要用大写字母输入。
如:“人”字的完全编码为rgpn,但其输入码为r;“算”字的完全编码为szum,但其输入码为sz;“计”字的完全编码为jmxw,但其输入码为jmx;而“腴”字的完全编码为yuyy,其输入码是yuyY。“计算”的编码为jmsz;“计算机”的编码为jsjm;“社会主义”的编码为whum;“中国共产党”的编码为uggd。
本发明用a、e、i、o选择同码字词,并且可同时表达字的声调。
例如:“妈”、“麻”、“马”、“骂”四个字输入码都是mb,用a、e、i、o键选取,且与所选字的声调相吻合,即表阴平的a选阴平字“妈”,表阳平的e选阳平字“麻”,上声的i选上声字“马”,去声的o选去声字“骂”。
本发明采用了多种自动选择技术来加快输入速度。本发明将自动选择技术分为“续码自选”、“续符自选”和“三元自选”三种。“续码自选”技术就是在输完完全编码后,若继续输入码元键,则自动选择第一同码字词。“续符自选”技术就是在已经输入1~4个码元时,若输入非码元、非选择键的图形字符键,将自动选择第一同码字词。“三元自选”技术就是,对于完全编码为四元的编码输入法,在输入三个码元后,若再以小写输入码元键将自动选择第一同码字词,且所输入的码元被作为下一输入码的第一码元。若要输入第四码元则须用大写字母。由于常用字词都尽量分配有较短的输入码,因此在实际输入过程中需要输入第四码元的字词是很少的。“续码自选”是几乎所有的汉字编码输入法都已采用的技术。“续符自选”和“三元自选”则是本发明的技术创新。
例如:在输完jmx三个字母后,第一同码字为“计”,若再输入小写字母,“计”字将被选中,输入的小写字母将被作为下一输入码的第一码元,不象现有输入法那样需用空格键选取。若要输入“悸”字(其输入码为jmxJ),则在输完jmx三个字母后,要用大写字母输入第四码元(即J)。若输完jmx三个字母后,再接着输入句号(即“。”号)时,“计”字也将被自动选择,不再需要空格键。
本发明由于“三元自选”技术的采用,使得三级输入码变成了一种很特别的码位。本发明的三级码码位有22×22×22=10648个,也即本发明有10648个特征码位。尽管中文字词数有数十上百万个,但对于每一个特定的输入环境,其所用的字词一般都在数千个左右。这就是特征码位技术赖以成立的基础。特征码位技术是这样实现的:编码输入系统提供特征码位的初始值(初始值为通用的常见字词),用户输入的每一个大于三个码元的字调将对其所包含的特征码位重新赋值,从而使特征码位上的字词随用户的输入环境而发生适应性的动态变化。变化后的特征码字词还可存盘后供用户在类似的输入环境中重复使用。
例如:在输入中医文献时经常用到“悸”字,  在第一次输入该字时需用四个码元jmxJ,在下次输入该字时,就只需用前三个码元了,即这时输入码jmx上的字变成了“悸”,而不是原来的“计”。此时,“计”字的输入码则变成了jmxW。
与现有技术相比,本发明具有下述优点:①采用文字式拼音,声调用字母表示,具有很强的正音性和文字性;其拼式简洁,信息容量大,汉语语音表达全面,规则简单。②本发明的“二分式成形法”从绝大部分现代汉字都是形声字这一客观事实出发,直观自然地拆分字形,符合人们分析汉字的习惯,具有较强的单一性。③用A、E、I、O键选择同码且兼表字的声调,使选择同码具有了有理性,便于学习和记忆,同时由于选择键为字母键,因而比用数字键易于盲打。④本发明通过“三元自选”和“特征码位”技术的结合使用起到了“四元编码,三键输入”的效果,一般字词的输入均只需三键,极大地提高了输入速度。采用“续符自选”技术使得常用符号的输入兼具了选择的功能,进一步加快了输入速度。

Claims (7)

1.一种文字式音形汉字输入方法,包括编码方法及字母键盘,其特征是:
①用u、v、w分别代表声母的zh、ch、sh,其它声母与键盘字母相同;
②用与表示声母相同的21个字母结合字母y表示韵母;
③用a、e、i、o表示阴、阳、上、去四声和选择同码;
④声韵相拼,遇零声母音则加y,否则不加y,便得到“音”;
⑤用“二分成形法”拆字为两个部件,合并两部件“音”的首字母得字的“形”;
⑥单字的编码为字“音”加字“形”;
⑦双字词的编码为第一字“音”加第二字“音”;
⑧叁字词的编码为第一、二字“音”首字母加第三字“音”;
⑨肆字及肆字以上词的编码为第一、二、三、末字“音”首字母的组合。
2.根据权利要求1所述的文字式音形汉字输入方法,其特征在于声母、韵母、声调与键盘字母的对应关系如下:
Figure A9511138000031
(接上表) 键盘字母 声母            韵母 声调   +y韵母   y+韵母   x   x   ian   uang   C   c   uen(un)   ün   V   ch   ou   B   b   a   ia N n ing   M   m   i   ê
3.根据权利要求所述的文字式音形汉字输入方法,其特征在于“二分式成形法”所拆部件构成字的,其“音”即为该字的音;所拆部件为非成字的,其“音”按如下“非成字部件表”规定的音:                       非成字部件表
4.根据权利要求1所述的文字式音形汉字输入方法,其特征在于字词的输入码分为一级码、二级码、三级码和四级码,分别取相应完全编码的前一、二、三、四个码元构成。
5.根据权利要求4所述的文字式音形汉字输入方法,其特征在于输入三个码元后,若再以小写字母输入码元键则将自动选择第一位的同码字词。
6.根据权利要求4所述的文字式音形汉字输入方法,其特征在于四级码的第四码元要用大写字母输入。
7.根据权利要求4所述的文字式音形汉字输入方法,其特征在于在已经输入(1-4个)码元时,若输入非码元、非选择键的图形字符键,将自动选择第一同码字词。
CN95111380A 1995-05-26 1995-05-26 文字式音形汉字输入方法 Expired - Fee Related CN1069420C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN95111380A CN1069420C (zh) 1995-05-26 1995-05-26 文字式音形汉字输入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN95111380A CN1069420C (zh) 1995-05-26 1995-05-26 文字式音形汉字输入方法

Publications (2)

Publication Number Publication Date
CN1148196A true CN1148196A (zh) 1997-04-23
CN1069420C CN1069420C (zh) 2001-08-08

Family

ID=5078677

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95111380A Expired - Fee Related CN1069420C (zh) 1995-05-26 1995-05-26 文字式音形汉字输入方法

Country Status (1)

Country Link
CN (1) CN1069420C (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101114292B (zh) * 2007-08-29 2011-06-22 广州市久邦数码科技有限公司 一种编码组合语言词语存储及动态派生方法
CN102707810A (zh) * 2012-04-23 2012-10-03 吴阳明 一种用易声码输入法命名的计算机汉字输入法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN85100588B (zh) * 1985-04-01 1985-09-10 陈明远 声韵式全音节同步输入电脑健盘
CN1009226B (zh) * 1985-12-28 1990-08-15 四川省科技咨询服务中心 调声韵类式拼音输入键盘及输入法
CN1051621C (zh) * 1988-10-18 2000-04-19 邱荷生 拼音文字型汉字编码输入法及键盘
CN1025540C (zh) * 1989-09-02 1994-07-27 马庆勇 汉字拼音编码计算机输入的一种键盘方案
CN1026924C (zh) * 1992-11-13 1994-12-07 叶冠卿 汉字析音编码计算机汉字输入方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101114292B (zh) * 2007-08-29 2011-06-22 广州市久邦数码科技有限公司 一种编码组合语言词语存储及动态派生方法
CN102707810A (zh) * 2012-04-23 2012-10-03 吴阳明 一种用易声码输入法命名的计算机汉字输入法

Also Published As

Publication number Publication date
CN1069420C (zh) 2001-08-08

Similar Documents

Publication Publication Date Title
US6292768B1 (en) Method for converting non-phonetic characters into surrogate words for inputting into a computer
US5903861A (en) Method for specifically converting non-phonetic characters representing vocabulary in languages into surrogate words for inputting into a computer
CN1106746C (zh) 助记数码拨号方案
CN1148196A (zh) 文字式音形汉字输入方法
CN101126959A (zh) 一种元拼拼音汉字输入方法
CN106227363B (zh) 拼音基础上的精确汉字编码和键盘输入方法
CN87100555A (zh) 双笔顺计算机汉字输入方案及其键盘
CN101373407A (zh) 手机汉字韵母族群录入法
CN1079060A (zh) 汉字音形字词编码输入系统
CN1200332C (zh) 一种汉字计算机输入方法
CN1854997A (zh) 数字字母输入法
CN1202647A (zh) 拼音汉字
CN85101055A (zh) 汉字拼音编码输入法(艺峰输入法)
CN1254895A (zh) 开放式全息全选全程模板式人机互补语言翻译方法
CN104731360A (zh) 分层首拼编码法
KR20000053095A (ko) 비음성문자를 컴퓨터에 입력하기 위한 대용 워드로 전환하는 방법
CN1122469A (zh) 拼音、声调、首笔码汉字输入法
CN100511111C (zh) 双码联合输入法
CN1174349A (zh) 汉字二十九形字根码编码输入方法
CN118068969A (zh) 基于88键大键盘的汉语拼音简拼或形码简拼输入法
CN118259762A (zh) 基于30键键盘的形码全拼输入法
CN1149147A (zh) 计算机音词调义汉字编码输入技术及键盘
CN118226971A (zh) 基于30键键盘的汉语拼音简拼或形码简拼输入法
CN118068966A (zh) 基于88键大键盘的形码全拼输入法
CN118092683A (zh) 基于10键键盘及应用于小屏电子设备的形码全拼输入法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee