CN1056357A - 中文输入法 - Google Patents
中文输入法 Download PDFInfo
- Publication number
- CN1056357A CN1056357A CN 90102790 CN90102790A CN1056357A CN 1056357 A CN1056357 A CN 1056357A CN 90102790 CN90102790 CN 90102790 CN 90102790 A CN90102790 A CN 90102790A CN 1056357 A CN1056357 A CN 1056357A
- Authority
- CN
- China
- Prior art keywords
- word
- character
- key
- words
- thesaurus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
一种以“词”所包含各字之先行字音(常是声母,
少数是韵母)结合成检索键语的思考式中文输入法。
检索两字词、单字词时可在检索键语中附加字形,以
增加检索速度。同时配合“词”的“阶层式词库管理”
方法,以简化词的检索程序与节约词的存储器容量。
同时,本输入法配合软件技术,具有线上学习能力,一
旦发生新词,使用者不需要离开当时之工作软件,即
可根据输入规则建立新词,从此永久使用。
Description
本发明涉及中文计算机输入法、中文计算机系统(软、硬件结构)及中文计算机应用环境等技术领域。具体地说,本发明是一种以“词”所包含各字之先行字音(通常是声母,少数是韵母)结合成检索键语的思考式中文输入法,其中检索两字词、单字词时,可在检索键语中附加字形,以增加检索速度;同时,配合“词”的“阶层式词库管理”方法,以简化词的检索程序与节约词的存储器容量。
根据发明人的研究归纳,当前各种中文计算机输入法,不外基于4种类型;
-“1键1字”类型
-“字根”的拆解与组合类型
-“字音”的拆解与组合类型
-由检索键语组合成“词”的类型
1键1字类型或其修正方法(如另一手按控制键,达成1键多字的效果。)早经学者批评为显然无法在短期内学会,不适合一般人使用。
字音组合成拼音的类型,若与从小学习注音的习惯结合,一般人使用应不成问题。但是,中文的同音字太多,使用时还要加上好几次选择的手续,输入程序十分繁琐。同时,中国幅员广大,南北方的母音、声调往往不统一,也造成检索的困难,不适合须要经常处理大量文书的人使用。
字根的拆解类型兴起最早,也是当前的主流,优点是只要记忆字根,就可以输入。但缺点则是字多,字根少,难免会发生重复,于是各种字根输入法便发展出来了许多不合理的规则,甚至变化规则、反规则,还是需要勉强背诵,不容易学习。
现在从拆解字根出发的输入方法很多,但因为根据的基本原则相同,优劣可能都差不多。这好比“朝三暮四”的故事,一只猴子吃7粒果子的情形。中文字数就是那么多,前面字根拆解的少,后面字根就要拆解的多;后面字根拆解的少,前面字根就要拆解的多。彼此的好处、坏处,差别其实并不太大。
因此,各种字根输入法虽然推广了很久,但是普及效果还是有限。
“词”检索的类型,则提供了相当好的基本观念。中文基本上是以字为单位,但实际上表达意义的时候,较少以1字表意,而通常是以“词”表意。因此,若将检“字”的观念,转化为检“词”的观念,那么,就可以按较少的键,而可以显示出较多的字。
不过,“词”的检索键语要怎么设计,还没有最佳的方法。过去,常用检字的字根结合成词,同样不容易记忆与使用。
人类在思考时,是以一组一组的概念在思考,而不是一个一个字的在思考;同时,思考时,在脑海中形成的是“声音”,而不是“字形”;而每组根念的“声音”是一种“声音的整体”,也不是由母音、子音、声调分割开来的形式。所以,过去的计算机输入法,或者是拆解字根,或者拆解字音,都违背了人类正常的思考方式,很难学习,更难由一般人很自然的使用。
本项发明人发现,在每组概念“声音的整体”中,最重要的决定因素,是概念中每个字的“第一个声音”。我们可以用注音符号表示这个声音,也可以用相对的英文字母表示这个声音,譬如:“台湾省”只要按“ㄊㄨㄕ”或是按“TWS”,形成检索键语,就可以顺着思想的流程,很轻松、很自然的在计算机上写出这三个字了,完全不需要背任何规则。
而且,“词”的字愈多,,造成拆解重复的可能性愈少。从排列组合的观念来看,4字“词”会重复的概率极小,3字“词”会重复的可能性也已很少。
不过。检索“两字词”与“单字词”时,将是一个问题,因为中文“双声叠韵”的情形很多,拆解造成重复的概率也随之提高,则必需按选择键了。
如果不想按选择键,那么检索两字词、单字词时,可在检索键语中附加字形,以增加检索速度。本项发明人因此把字音检索和字根检索结合起来、形成检索键语,好比三只猴子(字根、字音、词)一起吃7粒果子,就可能简化输入程序,达成容易学习,又不那么繁琐的效果。
同时,本项发明使检索“两字词”时,规则与检“单字词”相同,以使观念连贯一气。而检索3字以上的“词”时,规则便可以简化。
本发明之中文输入法具有以下5项特性:
·想打/以“音”为主
这项发明的特色,是将中国语文学的知识与信息科技结合在一起,形成一种不需要背诵规则的“思考式计算机写作法”,它是为一般人“创造性的写作”而设计,亦即在写作思考时“边想边写”;而非为打字员、输入员“提供劳力”而设计,不是看着字形“边拆解边打”。
人类在思考时,呈现在脑海中的是“字音”,而非字形;所以本输入法系以“音”为主。
·词输入/音-形-词,整合输入
人类在思考时,脑海中的概念是以“词”的方式出现,而不是以“一个字、一个字”的方式出现。所以,本输入法以“音”组成“词”输入。
“词”可能是多字词,也可能是单字词。本项输入法研究者发现,3字以上的词,重复率不高;而单字词、两字词的重复率就很高,为了减少选择的情形,本输入法并有“精简规则”,就是在单字词、两字词时附加字形,便可以使两字词重复率降低趋近于0,使单字词重复率降低趋近于32.4%。但是,单字词的使用情形很少,经由本输入法研究者分析,使用超过百分之0.1的常用单字词,只有20个;这些单字词各配上一个音键,便成为“一字一键”;也就是说,在实际使用时,绝大多数的单家词是“一字一键”,并不需要附加字形,输入比两字词还方便。
·基本词库/词库管理系统
“词”如果无限制增加,实际使用上会发生困难。所以,本输入法并分析了词的:常用、次常用、专业用、个人用的性质,建立了阶层式的词库。同时,以硬件技术改善软件系统,增加了词库存取的效益。
·线上学习能力
“词”会随着使用者的生活经验而增加,不可能完全事前建立完成。所以,本输入法骈以软件技术形成“线上学习能力”使用者可以在工作时,随时依据本输入法的规则建立新词,永久记忆;而且,不需要离开当时工作的软件,不会中断工作。
·最迅速、最易学、最有效益
本项输入法平均每字按1.29键,是当前各种输入法按键最少的方法。
本项输入法键盘与英文键盘整合,不需要背键盘、不需要背规则,在试用期间,任何人可以在3分钟内学会,是当前最容易学习的方法。
本项输入法使用存贮器容量不超过1024K,是当前使用词库观念的输入法中,最有效益的方法。
本发明的使用举例
输入时可以使用注音,也可以使用英文字母。但是为了减少学习键盘,发明人建议以英文输入为主。
-多字(三字以上)词
只要键入“词”的每个字的第一个音,也就是英文国际拼音的第一个字母。譬如:
“输入法”:s.r.f
“中文电脑”:z w d n
大部分字,每字只需敲一次键,即可输入。
键盘设计与英文打字机相同,使用者不必再学。
使用速度,一般人员每分钟300字,主管人员每分钟150字,专业打字人员可能可以达到每分钟600字。
-单字词
只要键入字的第一个音,加上起始字形与结束字形。譬如:
“热”:r 土 火
“情”:q 心 月
大部分字只需敲三次键,即可输入,平均也只敲键3.5次即可。字首、字尾符合传统的部首拆解,不必硬背。
使用速度,一般人员每分钟60字,主管人员每分钟30字,专业打字人员可能可以达到每分钟100字。
-常用单字词,只要键入单音即可,如:
“的”:d
“是”:s
-两字词
只要键入“词”的每个字的第一个音,加上第一个字的起始字形,第二个字的结束字形。譬如:
“中华”:z h 丨 十
“热情”:r q 土 月
使用速度,一般人员每分钟150字,主管人员每分钟75字,专业打字人员可能可以达到每分钟300字。
本发明输入法的定义与规则
(1)定义
字:每个词所包含的字数。
音:每一字首音/使用国际拼音、中英文整合键盘。
形:首:第一字首形/使用与字典或习惯相同之自然字根,不需另背。
尾:末一字尾形/使用与字典或习惯相同之自然字根,不需另背。
·音:英文字母/相对汉语注意关系
b:ㄅ d:ㄉ
p:ㄆ t:ㄊ
m:ㄇ n:ㄋ
f:ㄈ l:ㄌ
g:ㄍ j:ㄐ
k:ㄎ q:ㄑ
h:ㄏ x:ㄒ
z:ㄓ丶ㄗ a:ㄚ丶ㄞ丶ㄠ丶ㄢ丶ㄤ
c:ㄔ丶ㄘ i:一丶ㄝ
s:ㄕ丶ㄙ w:ㄨ
r:ㄖ丶ㄜ丶ㄦ o:ㄛ丶ㄡ
u:ㄩ
e:ㄟ丶ㄣ丶ㄥ(不常用)
·形:可因个人习惯弹性使用
为使已经使用中文输入的人,在习惯上均可与本项输入法相容,本项输入法所附加的字形,可以使用过去任何较流行的字根。台湾的“仓颉输入法”、“简捷输入法”,国内的“五笔输入法”等,均可使用。
这方面也说明,本项发明的重点在于“思考方式”与“词使用”的分析,而不是“字根”的分析。
(2)输入规则
●单字词
[一般单字词]
·音-首-尾-<选择键>
(如有重复字,则加选择键)
(选择键可按数字序,或按键盘上左手固定位置的英文字母序;亦即a-s-d-f-…等于1-2-3-4…,使得手不必移动,而增加速度。)
譬如:按“r土火”时,只有“热”一个字,便不需要再按选择键。而按“q心月”时,显示器最下面一行将出现“情悄”两字。再按数字键<2>,或英文字母键<S>时,均可获得“悄”字。
[常用单字词:一键一字]
·计20个,“而、然”,“和、会”两组,需加按选择键。
q:其 a:(未定义) z:在
w:为 s:是 x:新
e:以 d:的 c:(
r:而/然 f:法 v:(未定义)
t:同 g:更 b:不
y:(未定义) h:和/会 n:那
u:与 j:就 m:(未定义)
i:有 k:可
o:(未定义) l:“
p:(未定义)
*l、c为中文特殊标点符号,同时规定:
ll:” cc:)
●两字词
[一所规则]
·音-音-<选择键>
[精简规则]
·音-音-首-尾
[第一、或第二字为输入字形/或常用单字词,形可省]
·音-音-<形>
譬如:“只有”只要按“zi口”,“有”是常用单字词,便不需要再按“有”的字尾“月”。
“心情”只要按“xq月”,“心”是习惯上的字根,便不需要再按。再譬如:“不是”只要按“bs”,“不、是”都是常用单字词,便不需要再按字形。
[两字词,而为“人名、地名、专有名词”时]
·音-音(亦即不加字首、字尾)
譬如:“台湾”只要按“tw”。
●三字词以上/如果在8字以上,至多输入前7字的首音即可。
·音-音-音
·音-音-音-音
以此类推
(六)本项发明的“阶层式词库管理方法”
现在看到的词库,都没有提供“管理方法”,以致发生:
1.词库太庞大,占用存储器太多。
2.词库中的词,绝大部分被使用到的机会很少,浪费存储器。
3.使用者想用的词,往往不在词库中,并不实用。
本项发明因此提出“阶层式词库管理方法”,方法是:
1.依据现行文字使用情况,将“词”使用的频率、出现的场合,分析、分类。
2.依据前项分析结果,将相同的特性的词,整理、归纳在一起,设计出“阶层式词库”。
3.不同阶层的词,以不同的方式建立、存储、管理。
4.以达成:占用存储器经济、使用率高、同时满足普遍性与个别性使用的需求。
本项发明的“阶层式词库”如下表:
第一层 第二层 第三层
系统词库 公共词库
行业词库
使用者词库 团体词库
部门词库 部门通用词库
个人词库
1:系统词库与使用者词库
系统词库系由系统提供,预先建立的词库;使用者词库,则为使用者依据本项发明的输入法规则,自行建立的词库。
2.公共词库与行业词库
公共词库为一般人都会用到、而且常用的名词、动词、形容词、副词,以及成语等。
行业词库为某一种特定行业,经常会使用的词,而其他行业却极少可能使用的词,如“信息行业词库”、“医药行业词库”……等。
3.团体词库
团体词库为一个独立法人,如公司、部会……中,多数成员均有可能使用到的词,如人名、标语、往来对象……等。
4.部门词库
部门词库则为独立法人之下,一个部门如业务部、财务部……中,成员会使用到的词。以下又分作“部门通用词库”:部门专会使用到的词;以及“个人词库”:个人的亲戚朋友姓名等。
(七)本项发明“阶层式词库”的记忆方法
本项发明推算出了各阶层词库所需要的最适容量范围,发明了存储方法,另包括:适用存储器、词库建立者如下表:
词库阶层 容量最 建议使用 建立者
适范围 之存储器
公共词库 64-512k EEPROM 或其他存储器 系统预先设定
行业词库 64-128k EEPROM 或其他存储器 系统预先设定
团体词库 64-256k EEPROM,硬磁盘或其他 团体预先设定
部门通用词库 64k 硬磁盘或其他存储器 使用者自行建立
个人词库 64k 硬磁盘或其他存储器 使用者自行建立
如果百分之百满足使用词库的需求,本项发明的方法,将使最大容量仍然在1024K以下,占用存储器甚少,为本项发明的另一特色。
以上所述,为本项发明的全部说明。
Claims (19)
1、一种以“词”所包含各字之先行字音(通常是声母,少数时候是韵母)结合成检索键语的思考式中文输入法,其特征在于检索两字词、单字词时,可在检索键语中附加字形,以增加检索速度,
同时,配合“词”的“阶层式词库管理”方法,以简化词的检索程序,与节约词的存储器容量,
该输入法为:
“一般单字词”为:键入“该字之声母(或韵母)→“该字之字首”→“该字之字尾”→“选择键”,
“常用单字词”为:键入“该字之声母(或韵母)”→“选择键”,
“两字词”为:键入“第一字之声母(或韵母)”→“第二字之声母(或韵母)”→“选择键”;或为:键入“第一字之声母”(或韵母)”→“第二字之声母(或韵母)”→“第一字之字首”→“第二字之字尾”→“选择键”,
“三字以上之词”为:依序键入词中“各字之声母(或韵母)”,再键入一“选择键”。
2、如权利要求1所述之方法,其特征在于其中关于“一般单字词”的输入法为:键入“该字之声母(或韵母)”→“该字之字首”→“该字之字尾”→“选择键”。
3、如权利要求2所述之方法,其特征在于可省略“该字之字首”,或省略“该字之字尾”之键入动作。
4、如权利要求2或3所述之方法,其特征在于可省略“选择键”之键入动作。
5、如权利要求1所述之方法,其特征在于其中关于“常用单字词”的输入法为:键入“该字之声母(或韵母)”→“选择键”。
6、如权利要求5所述之方法,其特征在于可省略“选择键”之键入动作。
7、如权利要求1所述之方法,其特征在于其中关于“两字词”的第一种输入法为:键入“第一字之声母(或韵母)”→“第二字之声母(或韵母)”→“选择键”。
8、如权利要求7所述之方法,其特征在于可省略“选择键”之键入动作。
9、如权利要求1所述之方法,其特征在于其中关于“两字词”的第二种输入法为:键入“第一字之声母(或韵母)”→“第二字之声母(或韵母)”→“第一字之字首”→“第二字之字尾”→“选择键”。
10、如权利要求9所述之方法,其特征在于可省略“第一字之字首”,或省略“第二字之字尾”之键入动作。
11、如权利要求9或10所述之方法,其特征在于可省略“选择键”之键入动作。
12、如权利要求1所述之方法,其特征在于其中关于“三字以上之词”的输入法为:依序键入词中“各字之声母(或韵母)”,再键入一“选择键”。
13、如权利要求12所述之方法,其特征在于可省略“选择键”之键入动作。
14、如权利要求1、2、3、5、7、9、10和12项中任一项所述之方法,其中关于“选择键”之键入动作,其特征在于可用按英文键盘之“a,s,d,f,g,h,j,k,l,;”顺序,代替按数字键盘“1、2、3、4、5、6、7、8、9、10”之顺序。
15、一种如上述各权利要求之一之输入法所引导出来的“阶层式词库管理方法”,该项方法的特征在于:
令计算机系统本身提供一些依据本项发明输入法所预先建立之“词库”的存储器,
令计算机系统预备一些空白存储器,以供使用者依据本项发明输入法,自行建立所需要之“词库”。
16、如权利要求15所述之方法,其特征在于其中关于:令计算机系统本身提供一些依据本项发明输入法,所预先建立之“词库”的存储器。
17、如权利要求16所述之方法,其特征在于本项词库又可分作一般人可共同使用之词库,以及某专门行业内常用之词库。
18、如权利要求15所述之方法,其特征在于其中关于:令计算机系统预备一些空白存储器,以供使用者依据本项发明输入法,自行建立所需要之“词库”。
19、如权利要求18所述之方法,其特征在于本项词库又可分作某一独立团体可共同使用之词库,以及团体内某专门部门内常用之词库,以及纯粹提供个人使用之词库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 90102790 CN1056357A (zh) | 1990-05-10 | 1990-05-10 | 中文输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 90102790 CN1056357A (zh) | 1990-05-10 | 1990-05-10 | 中文输入法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1056357A true CN1056357A (zh) | 1991-11-20 |
Family
ID=4877686
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 90102790 Pending CN1056357A (zh) | 1990-05-10 | 1990-05-10 | 中文输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1056357A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1317628C (zh) * | 2004-01-05 | 2007-05-23 | 英华达(上海)电子有限公司 | 输入法增字系统与方法 |
CN105549758A (zh) * | 2015-12-23 | 2016-05-04 | 天津天地伟业数码科技有限公司 | 一种嵌入式录像设备的汉字五笔输入方法 |
-
1990
- 1990-05-10 CN CN 90102790 patent/CN1056357A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1317628C (zh) * | 2004-01-05 | 2007-05-23 | 英华达(上海)电子有限公司 | 输入法增字系统与方法 |
CN105549758A (zh) * | 2015-12-23 | 2016-05-04 | 天津天地伟业数码科技有限公司 | 一种嵌入式录像设备的汉字五笔输入方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1648828A (zh) | 去多义性语音输入系统和方法 | |
CN1607491A (zh) | 使用操纵杆输入中文的系统和方法 | |
CN101038508A (zh) | Gb拼音输入法 | |
CN1056357A (zh) | 中文输入法 | |
CN1110741C (zh) | 音形码汉字输入方法 | |
CN101046706A (zh) | 用于不同人群电脑和手机可通用的输入法 | |
CN1084500C (zh) | 汉字变换装置 | |
CN1052200A (zh) | 音形义字词兼容编码系列及键盘 | |
CN1737739A (zh) | 基于英文键盘的藏文输入法 | |
CN100338560C (zh) | 汉字笔画部件编码输入法及键盘 | |
CN1123818C (zh) | 电拼汉字计算机输入法、所用键盘及其中文内码 | |
CN1166997C (zh) | 汉字免拆分快速输入法 | |
CN1129058C (zh) | 仿真拼音汉字输入法 | |
CN1023917C (zh) | 汉语文字处理之方法 | |
CN1395195A (zh) | 东巴象形文字计算机处理技术 | |
CN1037043A (zh) | 计算机汉字输入方法 | |
CN1109283C (zh) | 利用计算机键盘的拼音汉词编码输入法 | |
CN1026829C (zh) | 中文头尾码输入法及其键盘装置 | |
CN1058342C (zh) | 汉字编码的计算机输入方法 | |
CN1269007C (zh) | 笔删式触控键盘中文音象全功能输入装置 | |
CN1042174C (zh) | 全息自然码中文输入系统 | |
CN1101732A (zh) | 汉字变换学习装置 | |
CN1734404A (zh) | 音码和识别音码、级库技术、笔码和数字笔码 | |
CN1295290A (zh) | 中文输入变换处理装置、方法及记录媒体 | |
CN1416039A (zh) | 电脑速记易捷码汉字输入方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C01 | Deemed withdrawal of patent application (patent law 1993) | ||
WD01 | Invention patent application deemed withdrawn after publication |