CN1095560C - 修改汉字转换结果的系统 - Google Patents
修改汉字转换结果的系统 Download PDFInfo
- Publication number
- CN1095560C CN1095560C CN94117294A CN94117294A CN1095560C CN 1095560 C CN1095560 C CN 1095560C CN 94117294 A CN94117294 A CN 94117294A CN 94117294 A CN94117294 A CN 94117294A CN 1095560 C CN1095560 C CN 1095560C
- Authority
- CN
- China
- Prior art keywords
- chinese character
- conversion
- character
- chinese
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 344
- 230000004048 modification Effects 0.000 claims abstract description 102
- 238000012986 modification Methods 0.000 claims abstract description 102
- 230000006870 function Effects 0.000 claims description 33
- 239000003607 modifier Substances 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims 17
- 230000005055 memory storage Effects 0.000 claims 2
- 238000005192 partition Methods 0.000 claims 1
- 238000000034 method Methods 0.000 description 36
- 230000008569 process Effects 0.000 description 18
- 230000008859 change Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000002715 modification method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
在处理中文文字的字处理软件中,为每个汉字转换串的汉字转换结果产生一个控制符号,同时汉字转换串和它的控制符号成对地在显示装置上显示出来。当需要修改时,用户输入一个对应于待修改汉字转换串的控制符号和一个用于标明修改类型的功能键。
Description
本发明涉及汉字转换结果的修改系统(汉字是一个中文字符),该系统用于有能力处理汉字的字处理软件中,更具体地说,本发明涉及汉字转换结果的修改系统,用来在多字转换方法中通过键有效地输入字符。通过减少为得到正确句子所需按键次数来有效地输入字符。
近年来,用于处理日文、中文等双字节字符的信息处理装置日益普及,并为信息处理行业带来了明显的进步。以此为背景,需要一种可以有效地产生包含如汉字那样的双字节字符的字的方法。
在常用的日文字处理软件中,输入平假名(拼音字符)以便转换成汉字。就是说,输入“*1”(kanji)后接着输入一个转换键,用于将输入的平假名转换成相应的汉字。本文中,以后括弧中所包括的字符都是用于表示第一个括弧前的日文文字的发音。接着,在屏幕上显示出对应于所输入平假名的待选汉字,例如“漢字”(kanji)和“幹事”(kanji)。通过一次或多次重复按下转换键,将下一组待选汉字显示出来或从众多的待选汉字中挑选一组,即可从所显示的一组发音相同但意义不同的汉字组中如“漢字”(kanji)和“幹事”(kanji)中挑选所需汉字。
另一方面,有几种汉字转换方法,例如,单字转换方法用于将所输入字符以字为单位加以转换,如将“ぎじゆつ”(gijutsu)转换成“技術”(gijutsu);双字转换方法用于将所输入字符以双字为单位加以转换,例如将“ぎじゆつを”(gijutsu wo)转换成“技術を”(gijutsu wo);以及多字转换方法用于将所输入字符以多字为单位加以转换,例如将“ぎじゆつをせつめいする”(gijutsu wosetsumei suru)转换成“技術を説明する”(gijutsu wo set-sumei suru)。在这些方法中,多字转换方法在现时最为流行。
在通过按键输入时,经常需要将所转换的字进行修改。下面所介绍的是多字转换过程中常用的修改操作。
图1显示一种常用的汉字转换结果的修改方法。
例如,用户先用拼音字符输入“じゆうらいのぎじゆつせつめい”(jurainogijutsusetsumei),它们即以多字为单位加以转换。然后,用户在“技術”(gijutsu)和“说明”(setsumei)之间输入“の”(no)。图1中,“-”表示光标位置。
如图1中a)所示,用户输入平假名“じゆうらいのぎじゆつせつめい”(jurainogijutsusetsumei)后,接着输入转换键。结果是,如图1中b)所示,得到汉字和平假名的混合形式“従来の技術説明”(ju-raino gijutsu setsumei)。现在光标位于“従来の技術説明”(ju-raino gijutsu setsumei)之后。
如果用户要在“技術”(gijutsu)和“説明”(setsumei)之间输入“の”(no),他或她先按取消键,将光标退至如图1中c)所示的初始位置。接着用户按制表键,将光标移至如图1中d)所示的下一个字的位置。因此“従来の”(juraino)就能加以修改。接着用户再一次按制表键,将光标置于图1中e)所示的又下一个字处。此时可以修改“技術”(gijutsu)。
然后,用户按取消键,将平假名“ぎじゆつ”(gijutsu)如图1中f)所示那样显示出来。此时光标位于“ぎ”(gi)处。接着用户按光标键,将光标移至“説”(setsu)处,按插入键将“の”(no)插入,如图1中g)所示,再按转换键将“ぎじゆつの”(gijutsuno)转换成如图1中h)所示的汉字,使用制表键将光标置于如图1中i)所示的所处理的字的末尾,从而结束对这些字的修改。
在上面所描述的常用方法中,为了如图1中c)至i)所示那样在“従来”(jurai)和“技術説明”(gijutsusetsumei)之间插入“の”(no),就需按9次删除、制表、光标和插入键。在这9次按键中,有4次是用于规定修改对象的。
另一方面,如“従来の技術説明”(juraino gijutsusetsumei)内的“技術”(gijutsu)需改为“内容”(naiyo),则不必按插入和光标键,因“ぎじゆつ”(gijutsu)的平假名数目和“ないよう”(naiyo)相同。相应地就不需按插入和光标键,因而将所需按功能键的次数减至7。然而,这是一个所需修改内容非常简单的例子。因此,如果原先发音字符的数目不同于所作修改的发音字符数目,就应再多按几次功能键。
这样,在常用方法中,为了修改转换结果,需要多次按下功能键和光标定位键,因此增加按键次数,拖长输入数据的时间。
也就是说,当字已被转换成汉字后再进行修改,需多次按功能键来指定修改对象。然后再按几次功能键和光标定位键来进行修改。还有,还需再多按几次功能键,将光标置于下一个输入位置。因此,这样大量的按键操作就减慢了整个输入过程。
本发明的目的是有效地修改汉字转换的结果,通过只规定待修改的汉字转换串来完成输入操作。
本发明基于以下装置:利用字典/语法数据库将输入字符转换成汉字的汉字转换单元,用于存储转换结果的文件存储单元;和显示单元。它还包括以下装置:用于产生控制符号的控制符号附加单元,它所产生的代表每个汉字转换串的特征被用作控制符号,例如,该特征可以是汉字转换串中某汉字的初始音节或一个带重音的平假名以及部件名称;用于存储所产生的控制符号的控制符号存储单元;用于成对显示汉字转换结果和控制符号的显示控制单元;用于输入待修改汉字转换串和应作修改的修改输入单元,其操作是输入一个控制符号和一个用于标明修改类型的功能键;以及一个修改单元,它用于对修改作出响应,以确定待修改汉字转换串,同时要求汉字转换单元根据修改类型去修改汉字转换结果。在上面所描述的配置下,在修改操作时,可用控制符号标明待修改汉字转换串,和用功能键标明修改类型,这样就确定了待修改汉字转换串。相应地,可以减少按键次数,因此加速修改操作和整个输入过程。
本发明的特点体现在汉字(日文字符)转换结果的修改系统中,后者包括以下装置:利用字典/语法数据库将用于众多汉字转换串而顺序输入的平假名转换成汉字,将所转换汉字存储于文件存储单元,和将所转换汉字在显示单元上显示出来的汉字转换单元;用于产生代表汉字转换串的控制符号的控制符号附加单元;用于按照将汉字转换结果存入文件存储单元的顺序将控制符号附加单元所产生的控制符号存储起来的控制符号存储单元;当汉字转换串需要修改时利用控制符号规定待修改汉字转换串的修改输入单元;以及用于对由修改输入单元规定的待修改汉字转换串进行修改的修改单元。
熟悉技术的人可以容易地从最佳实施例和附图的描述来了解本发明的附加特征和目的。
图1显示用于修改汉字转换结果的常用方法;
图2是用于表示本发明功能的框图;
图3显示根据最佳实施例的系统配置;
图4是根据最佳实施例的控制符号附加单元的运行流程图(只有每个汉字转换串的初始音节是控制符号);
图5是根据最佳实施例的显示处理单元的运行流程图;
图6显示一个中文转换系统的过程例子;
图7是根据最佳实施例的修改单元的运行流程图;以及
图8显示一个将平假名转换成汉字的过程例子。
图2是用于显示本发明功能的框图。本发明基于以下设备:在将输入的平假名转换成汉字时所用的由字典和语法积累起来的字典/语法数据库4;利用字典/语法数据库4将输入数据转换成汉字的汉字转换单元1;用于将汉字转换结果存储在汉字转换串中的文件存储单元2;以及用于将文件存储单元3中所存字显示出来的显示器3。
控制符号附加单元5为每个汉字转换串产生一个控制符号,汉字转换单元1使用字典/语法数据库4在每个汉字转换串上完成转换过程。汉字转换中涉及单字串和句子,在该串中输入的平假名转换成汉字。句子可以是双字串,例如“従来”(jurai)和“の”(no)。控制符号可由下列参量来代表:汉字转换串中的起始或结尾平假名或重音平假名,汉字的部件名称,汉字的笔划数,和当前汉字转换串中包含的汉字数。
控制符号存储单元6存储由控制符号附加单元5根据文件存储单元2中所存汉字转换串而产生的控制符号。
显示控制单元7显示存于文件存储单元2内的文件,以及存于控制符号存储单元6内用于文件中每一个汉字转换串的控制符号。
接着,修改输入单元8从用户接收待修改汉字转换串的一个控制符号和功能键的对,该功能键实际上标明一种修改。由功能键所规定的修改类型可以是汉字转换串的分拆和合并,可以是汉字转换串中包含的汉字的下一个汉字待选组的代表,也可以是汉字转换串的重新输入。
如修改输入单元8要执行修改操作,则修改单元9根据输入的控制符号确定待修改汉字转换串,还根据功能键的类型确定修改类型,以及根据所指定的修改类型完成修改操作。
下面描述的是图2中框图所示操作。
用户通过诸如键盘之类的输入装置输入平假名。汉字转换单元1利用字典/语法数据库4在词法和语法两方面对所输入平假名进行分析,将它们分成所需汉字转换串,将它们转换成汉字,并且将它们存入文件存储单元2中的汉字转换串中。
此时控制符号附加单元5从汉字转换单元1获得有关汉字转换串的分拆信息,从而产生汉字转换串的控制符号。例如,如果控制符号是汉字转换串的起始平假名,则控制符号附加单元5同时从汉字转换单元1获得汉字转换串的起始平假名和分拆信息。如果重音平假名用作控制符号,则在字典/语法数据库4中搜寻有关汉字转换串的重音信息。此外,如果汉字的部件名称或汉字的笔划数用作控制符号,则从汉字转换单元1获取汉字转换串中的起始或结尾汉字,并且通过搜索字典/语法数据库4来获取汉字的部件名称或笔划数。如果使用汉字转换串中的汉字字符数,则通过从汉字转换单元1中接收汉字信息,即可获得汉字字符数。
在如上所述产生控制符号后,控制符号附加单元5将所产生控制符号传送至控制符号存储单元6。
在从控制符号附加单元5接收到每个汉字转换串的控制符号后,控制符号存储单元6将文件存储单元2中所存每个汉字转换串的汉字转换结果的控制符号存储起来(如图2所示“従来の”(ju-raino)、“技術”(gijutsu)、“説明”(setsumei),等)。图2中,每个汉字转换串的罗马字的第一个字符被定为控制字符,并存储为“j”、“g”和“s”。
如预定的汉字转换串的汉字转换结果和控制符号分别存入文件存储单元和控制符号存储单元6,则显示单元7即被激活,从文件存储单元2读出了表现在汉字转换串中的汉字转换结果,以及从控制符号存储单元6中读出汉字转换串的控制符号,并在显示器3上显示出来。此时,汉字转换串中的字对应于控制符号而显示出来,例如“従来の技術説明”(juraino gijutsu setsumei)。
如用户希望修改输入的字,则用户通过修改输入单元8输入用于待修改汉字转换串的控制符号和用于标明修改类型的功能键。例如,如用户希望用另一个字来替代汉字转换串“説明”(setsumei),则他或她按下“s”和功能键以便重新输入。
如修改输入单元8输入了任何修改输入,则修改单元9即被激活。
修改单元9通过控制符号确定需要修改的汉字转换串,也通过输入功能键确定修改类型。如修改类型标明要将汉字转换串加以分拆,则它要求汉字转换单元1将现有汉字转换串进一步分拆,并将每一个分拆开的汉字转换串转换成汉字。如修改类型标明要将汉字转换串加以合并,则如果现有汉字转换串可和下一个汉字转换串合并并实际上可转换成汉字的话,于是它即要求汉字转换单元1将上述两个汉字转换串合并起来。如修改类型标明要显示另一待选汉字组,则它要求汉字转换单元1去获取下一组待选汉字组。如修改类型标明要重新输入特定的汉字转换串,则修改单元9要求汉字转换单元1将重新输入的汉字转换串转换成汉字。
汉字转换单元1响应修改单元9的请求将字进行修改。如字已修改,则文件存储单元2的内容重新写过,并激励控制符号附加单元5,以便如上所述为修改过的汉字转换串产生控制符号,同时将它传送给控制符号存储单元6。控制符号存储单元6将修改过的汉字转换串所用的输入的控制符号存储起来。
图3显示根据本发明实施例的系统配置。
本实施例可设计成文件处理软件,该软件可用于诸如个人计算机、工作站等的计算机系统,也可用于专门用来处理文件的字处理系统。
使用本发明的计算机系统或字处理系统的硬件包括CPU10,连接到CPU10的主存储单元20,同样连接到CPU10的I/O接口30,连接到I/O接口30的诸如键盘等的输入装置40,同样连接到I/O接口30的诸如显示单元等的显示装置50。主存储单元20一般都有例如操作系统那样的基本软件60,在此操作系统下可以运行诸如文件处理软件那样的应用软件。
主存储单元20将文件处理软件70存储起来。常用的可接收汉字的文件处理软件包括通过输入装置40用于临时存储平假名输入的缓存701,用于将所输入平假名转换成汉字的汉字转换单元702,用于汉字转换单元702的操作中的字典/语法数据库703,用于将文件作为汉字转换结果存储起来的文件存储单元704,用于将显示对象送至显示装置50的显示处理单元705,该显示对象就是缓存701中所存平假名和所转换的汉字。本例中,汉字转换单元702能在多字转换方法中将众多汉字转换串同时转换成汉字。
根据本实施例的汉字转换结果修改系统除基于上述配置外,还包括控制符号附加单元706,控制符号存储单元707,和修改单元708。它在主存储器20中作为软件加以实现。
当由用户通过输入装置40输入并存于缓存701中的平假名被分拆成一个或更多的需要转换成汉字的汉字转换串时,就激励控制符号附加单元706。接着控制符号附加单元706为每一个汉字转换串产生一个控制符号。
控制符号存储单元707是一块用于将由控制符号附加单元706产生的控制符号存储起来的存储区域,并将与已由汉字转换单元702处理过并存入文件存储单元704的汉字转换串相应的控制符号存储起来。例如,假如汉字转换结果从第一个汉字转换串开始顺序地存储到文件存储单元704中从起始地址往后的地址内,则控制符号存储单元707从用于第一个汉字转换串的控制符号开始将控制符号顺序地存储到起始地址往后的地址内。控制符号存储单元707的另一种配置如此设计,使控制符号作为有关存于文件存储单元704中的每一个汉字转换串的一段信息而附加上去。
另一方面,也在常用的文件处理软件70中使用的显示处理单元705向显示装置50发送一个控制符号,后者是对应于每一个已由汉字转换单元1处理过的汉字转换串而存储的,而每一个汉字转换串的汉字转换结果则对应于它的控制符号而加以显示。
当用户对汉字转换结果作出响应,在步骤S2中输入平假名时,修改单元708即被激活。接着,它根据用户输入的控制符号来确定一个待修改汉字转换串,还根据用户输入的功能键来确定修改类型,并且根据修改类型向汉字转换单元702输出一个修改请求。例如,如修改类型标明汉字转换串的分拆和合并,则它通知汉字转换单元702去改变一个汉字转换串或将它和下一个当字转换串合并。如修改类型标明重新输入,则它通知汉字转换单元702将用户重新输入的平假名替代待修改汉字转换串,以备转换成汉字。如修改类型标明更换到下一组和现有汉字发音相同但意义不同的待选汉字组,则修改单元708将待修改汉字转换串更换为下一待选汉字组。
上面所介绍的系统配置将在下面加以描述。
用户通过输入装置40输入平假名(在步骤S1内输入平假名)。所输入平假名S1通过I/O接口30存入主存储器20内的缓存701。又字转换单元702利用字典/语法数据库703将所存平假名分成一个或更多汉字转换串,并把它们转换成汉字。每一个汉字转换串的转换结果存入文件存储单元704。
此时,控制符号附加单元706被激活,并为每一个由汉字转换单元702所分拆的汉字转换串产生一个控制符号。
对应于存于文件存储单元704内的每一个汉字转换串的汉字转换结果,由控制符号附加单元706所产生的控制符号被存入控制符号存储单元707。
当输入的平假名S1存在缓存701内时,显示处理单元705向显示装置50发送一个平假名串,以便将所输入平假名成功地加以显示。如对应于平假名串的汉字转换结果和控制符号分别存于文件存储单元704和控制符号存储单元707内,则一个汉字转换结果的串和用于每个汉字转换串的控制符号字符即成对地送至显示装置50,并且控制符号和汉字转换结果成对地显示出来。
用户看到显示装置50上显示的汉字转换结果和控制符号,如显示内容可以接受,用户通过输入装置40输入下面一批平假名。然而,如果最后的汉字转换结果应该修改,则通过输入装置40将修改输入S2加以输入。
例如,修改输入S2是一个用于识别待修改汉字转换串的控制符号和一个用于标明同时输入的修改类型的功能键的组合。
当接收到修改输入S2时,修改单元708即被激活,并根据控制符号确定待修改汉字转换串,接着根据功能键确定修改类型。然后,它向汉字转换单元702发送一个决定于修改类型的修改请求。例如,如修改类型标明汉字转换串的分拆或合并,则它通知汉字转换单元702去改变汉字转换串或将汉字转换串和下一个加以合并。如修改类型标明重新输入,则它通知汉字转换单元702用一个用户重新输入准备转换成汉字的内容去替代待修改汉字转换串。如修改类型标明更换到下一组发音相同但意义不同的待选汉字,则修改单元708通知将待修改汉字转换串更换为下一组待选汉字。
如汉字转换单元702按照从修改单元708来的指令完成了它的操作,则汉字转换结果存入文件存储单元704,而且控制符号附加单元706被激活。接着如上面所描述那样,产生控制符号并存储在控制符号存储单元707中。显示处理单元705分别从文件存储单元704和控制符号存储单元707读取修改过的汉字转换串和它的控制符号,并将它们送至显示装置50。因此,修改的结果和控制符号一起显示出来。
在上面所描述的系统配置下,可以通过规定待修改汉字转换串来修改输入的字符串,而不需使用光标定位键或取消键。
图4是用于表示根据本发明实施例的控制符号附加单元706的操作的流程图。在本实施例中,每个汉字转换串的起始平假名可以是一个控制符号,并表示为字母下标。
在由用户输入并存入缓存701的平假名(S1)被汉字转换单元702利用字典/语法数据库703分拆成汉字转换串之前,控制符号附加单元706并不激活。控制符号附加单元706通知汉字转换单元702去送出输入的平假名中的汉字转换串的数目。汉字转换串的返回值是m(步骤S310)。如用户用拼音字符输入“じゆうらいのぎじゆつせつめい”(jurainogijutsusetsumei),则汉字转换单元702将它们分拆成汉字转换串,并应获得3个汉字转换串“じゆうらいの”(ju-raino)、“ぎじゆつ”(gijutsu)、和“せつめい”(setsumei)。于是,控制符号附加单元706得到m=3。
接着,用于标明每个汉字转换串的顺序的变量即汉字转换串号i设置为1(步骤S320),并进入下面的控制符号产生过程。
首先,要求汉字转换单元702发送第i个汉字转换串的起始字符X(步骤S330)。此外中,X是第一个汉字转换串的起始字符“ぎ”(ji)。
接着,基于起始字符X来产生控制字符x(步骤S340)。根据本实施例,控制符号用一个字母下标来代表。相应地,控制符号x是用作平假名“ぎ”的罗马字符“ji”的第一个字符j的下标的“j”。
中文文字中,拼音字符是字母,而控制符号x可以是将从汉字转换单元702来的汉字转换串的起始字符X看作下标而获得。
所获得的控制符号x存于控制符号存储单元707中与汉字转换串号i对应的第i个地址。现例中,它存入第一个地址(步骤S350)。控制符号存储单元707将控制符号x的字符码存储起来。因此汉字转换串的控制符号就被获取和存储起来。
汉字转转串号i增加1,以便处理下一个汉字转换串(步骤S360)。如汉字转换串号i小于汉字转换串的数目m(步骤S370中的是),控制交给步骤330,并获得了第i个汉字转换串的控制符号x。当所有汉字转换串的控制符号都已产生时,过程即终结(步骤S370中的否)。
如上所描述,当输入平假名“じゆうらいのぎじゆつせつめい”(jurainogijutsusetsumei)时,第一个汉字转换串的控制符呈j,第二个汉字转换串的控制符号g,和第三个汉字转换串的控制符号s都产生出来并分别存入控制符号存储单元707中的第一至第三个地址。
图5是用于显示根据本发明的实施例的显示处理单元705的操作的流程图。当显示处理单元705将用户输入的平假名(S1)存入缓存701时,它获得一个输入的平假名串,并将这些平假名在显示装置50上显示出来。如汉字转换单元702和控制符号附加单元706的过程都已完成,则汉字转换结果和控制符号都显示出来。根据图5所示操作的流程图,所输入的平假名是不显示的。显示的内容只是汉字转换结果和控制符号。
首先,从汉字转换单元702获得输入的平假名中的汉字转换串的数目m(S410)。接着将汉字转换串号i设为1,并开始显示过程(步骤S420)。
首先,从文件存储单元704中第i个地址(对应于汉字转换串号i的第一个地址)处读取一个字符串,作为汉字转换结果(步骤S430)。如输入的平假名是“じゆうらいのぎじゆつせつめい”(jurain-ogijutsusetsumei),则“従来の”(juraino)的字符码串作为第一汉字转换串的汉字转换的结果而获得。
第二,从控制符号存储单元707中对应于汉字转换串号i的第i个地址(本例中是第一个地址)读取控制符号x(S440)。本例中,获得字符码“j”。
接着,按此顺序将控制符号字符x和汉字转换结果的字符码串送至显示装置50(S450)。结果是,“j従来の”(juraino)在显示装置50上显示出来。因此一个汉字转换串就成功地显示出来。
接着汉字转换串号i增加1,以便处理下一个汉字转换串(步骤S460)。如汉字转换串号i小于汉字转换串的数目m(步骤S470中的是),则控制交还给步骤S430,去处理下一个汉字转换串,以便显示。如果后一个汉字转换串已经显示,则过程结束(步骤S470中的否)。
如上所描述,输入的平假名“じゆうらいのぎじゆつせつめい”(ju-rainogijutsusetsumei)的汉字转换将“j従来のg技術s説明”(juraino gijutsu setsumei)输出显示在显示装置50上。
图6显示基于本实施例的所处理的中文文字。这里显示4个例子(a)到(d)。根据控制符号附加单元706和显示处理单元705的操作流程图,图6中(a)到(d)标明显示装置50上显示的输入的拼音字符(a-1,b-1,c-1,d-1),汉字转换结果,和控制符号(a-2,b-2,c-2,d-2)。
就是说,当用户输入图6中的拼音字符“shifeiren”(a-1)时,系统将它们分拆成转换单位“shifei ren”,将它们转换成中文文字,赋予它们控制符号,并得到“s是非r人”(图6中(a-2))。中文文字中,拼音字符是字母字符,因此控制符号是每个转换单位的输入的拼音字符的第一个字母字符。
类似地,拼音字符“yuanlaishi”分拆成两个转换单位“yuanlaishi”,并转换成中文字符,并且赋予产生的控制符号如“y願l来世”(图6中(b-1),(b-2)。拼音字符“daxuexuesheng”分拆成“daxue xuesheng”并转换成“d大学x学生”((图6中(c-1),(c-2))。拼音字符“lianjiezhe”分拆为“lianjie zhe”,并转换为“l鏈接z着”,这是字符转换和产生控制符号的结果(图6中(d-1),(d-2))。
用户看到控制符号和转换结果成对显示出来,可决定是否需要修改。如不需修改,则通过输入装置40输入下一批平假名。因此转换结果就定下来,显示装置不再显示控制符号,而显示“従来の技術説明”(juraino gijutsu setsumei)。
如需要修改,则用户通过输入装置40输入待修改汉字转换串的控制符号和用于标明修改类型的功能键。例如,修改类型是汉字转换串的分拆或合并,重新输入汉字转换串,请求汉字转换串中下一组待选汉字,等等。如字处理软件能将输入字符转换成汉字,则键盘通常具备用于选择下一组待选汉字的功能键,但不具备用于标明诸如分拆、合并、重新输入等修改类型的功能键。因此,在设计系统时应为它赋予修改键。例如,修改类型可通过同时按两个特定键来指定,这些特定键可以是转换键(SHIFT)、CTRL键,ALT键等。
图7是用于显示根据本发明的实施例的修改单元708的操作的流程图。
首先通过输入装置40得到用户输入的控制符号和功能键,并分别标以x和K(步骤S610)。接着从控制符号存储单元707检索控制符号x,以便获得控制符号x所存的地址处的汉字转换串序列(步骤S620)。就是说,如控制符号x存于第i个地址,则第i个汉字转换串可考虑加以修改。此外,功能键K确定修改类型(步骤S630)。功能键类型和修改类型间的对应关系是预先规定的。修改类型可以是汉字转换串的分拆、合并和重新输入,并且获得下一组待选汉字。也可考虑其他修改类型。
如修改类型是分拆汉字转换串,则修改单元708要求汉字转换单元702将第i个汉字转换串分拆成其他分段,以便转换(步骤S640)。因此,汉字转换单元702进一步分拆第i个汉字转换串,而新的汉字转换串即转换成汉字。
另一方面,如修改类型是合并汉字转换串,则修改单元708要求汉字转换单元702去获取第i个和第(i+1)个汉字转换串,以便转换成汉字(步骤S650)。汉字转换单元702完成这一所请求的过程。
如修改类型是重新输入,则修改单元708要求汉字转换单元702将光标置于第i个汉字转换串的首部,并清除掉第i个汉字转换串的现有汉字转换结果(步骤S660)。因此显示处理单元705将缓存701中的第i个汉字转换串所对应的输入平假名显示出来。当用户输入新的平假名(S1)并将它们存于缓存701的第i个汉字转换串处时,显示处理单元705即显示出重新输入的平假名。汉字转换单元702将存于缓存701中第i个汉字转换串处的输入的平假名转换成汉字。
如修改类型是选择下一组待选汉字,则修改单元708要求汉字转换单元702将第i个汉字转换串中的下一组待选汉字加以输出(步骤S670)。因此汉字转换单元702选择了下一组待选汉字。
如果上述每一种修改请求都已完成,则修改单元708即结束操作。
如修改类型是汉字转换串的分拆和合并,则汉字转换串要改变分段,同时控制符号也要改变。因此控制符号附加单元706在汉字转换串标明改变时产生一个新控制符号。图4所示操作的流程图即再次运行,以产生新控制符号。
图6(a-3)显示一个例子,其中一个汉字转换串进一步分拆为众多的转换单位。本例中,第一个汉字转换结果“s是非r入”的第一个汉字转换串“是非”应按不同方法加以分拆。用户输入控制符号s来标明第一个汉字转换串,输入一个功能键来标明分拆汉字转换串。因此修改单元708要求汉字转换单元702去改变第一个汉字转换串的划分。结果是,汉字转换单元702将第一个汉字转换串加以分拆,以便完成第一个汉字转转串“shi”和第二个汉字转换串“feiren”的汉字转换,同时控制符号附加单元706产生新的控制符号,以得到图6(a-3)所示转换结果“s是f廃人”。
图6(b-3)显示一个众多汉字转换串合并成一个转换单位的例子。本例中,第一个汉字转换结果“y願l来世”的第一个汉字转换串“願”应和下一个汉字转换串合并。用户输入控制符号y标明第一个汉字转换串,和输入一个控制符号标明汉字转换串的合并。因此修改单元708要求汉字转换单元702将第一和第二个汉字转换串合并,以便重新转换。作为结果,汉字转换单元702得到新的汉字转换串“yuanlai shi”并将它们转换成汉字,同时控制符号附加单元706产生一个新的控制符号,以获得如图6(b-3)所示转换结果“y原来s是”。
图6(c-3至c-5)显示一个利用拼音字符重新输入汉字转换串的例子。本例中,第一个汉字转换结果“d大学x学生”的第一个汉字转换串“大学”应予重新输入。用户输入控制符号d,用以标明第一个汉字转换串,和输入一个功能键,用以标明汉字转换串的重新输入。因此修改单元708要求汉字转换单元702将第一个汉字转换串的第一个汉字转换结果清除掉。结果是,第一个汉字转换串退回到第一个输入的拼音字符“daxue”(图6(c-3))。如用户输入一个新输入的拼音字符“da”,则字符即被显示(图6(c-4))。当接收到输入的拼音字符时,汉字转换单元702重新分拆汉字转换串,获得一个作为单汉字转换串的“daxuesheng”,并将它转换为汉字。接着控制符号附加单元706产生新控制字符,并得到如图6(c-5)所示转换结果“d大学生”。
图6(d-3)显示最后一个例子,其中选择下一组待选汉字。本例中,第一个汉字转换结果“l鏈接z着”的第一个汉字转换串“鏈接”应该用其他汉字来替代。用户输入控制符号l用以标明第一个汉字转换串,并输入功能键用以标明下一组待选汉字。因此修改单元708要求汉字转换单元702将第一个汉字转换串的汉字用下一组待选汉字来替代。结果是,汉字转换单元702获得下一组待选汉字,同时控制符号附加单元706产生新控制符号并输出如图6(d-3)所示汉字转换结果“l聨接z着”。
和图1所示常用转换方法相比较,图8显示了根据本发明的修改汉字转换的过程。
如图8a所示,用户首先输入平假名“じゆうらいのぎじゆつせつめい”(jurainogijutsusetsumei)。汉字转换单元702将它们分拆成众多的汉字转换串,并将它们转换成汉字。接着控制符号附加单元706产生新控制符号,并输出如图8b所示转换结果“j従来のg技術s説明”。
如第二个汉字转换串“技術”(gijutsu)应修改为“技術の”(gi-jutsuno),则用户输入控制符号g,用于标明第二个汉字转换串,并输入功能键,用于标明重新输入。修改单元706要求汉字转换单元702重新输入第二个汉字转换串。结果是,汉字转换单元702将第二个汉字转换串的转换结果清除掉,并将转换操作退回到最初输入的平假名“ぎじゆつ”(gijutsu),如图8c所示。由于用户需要将平假名改为“ぎじゆつの”(gijutsuno),他或她将光标移至“ぎじゆつ”(gijutsu)的下一位置,按下插入键、然后是空格键、以及一个“の”(no)。因此该字行即附加到第二个汉字转换串的末尾(图8d)。接着汉字转换单元702将重新输入的平假名进行分拆,并将它们转换成汉字。控制符号附加单元706产生控制符号,并如图8e所示输出“j従来のg技術のs説明”。
如上所描述,当所转换的字符需修改时,本发明只需输入g以规定修改对象,和输入功能键以标明重新输入,因此只要求按两次键,也即常用方法中四次的一半。
因此,根据本发明,要修改所转换的汉字,按键次数较少,因此输入操作能大大加快。
当重音平假名、汉字部件名称、汉字字符的数目、或一个汉字字符的笔划数用作控制符号时,这些控制符号可用和初始音节一样的方法加以附加。当初始音节用于规定字首时,引用缓存701可立即产生控制符号,因输入时使用平假名。然而,如欲表示重音平假名、汉字字符部件名称、或汉字字符数目时,则需增加附加步骤。
就是说,字典/语法数据库703最初将重音平假名、汉字字符部件名称、或汉字字符笔划数加以存储。当由汉字转换块702获得汉字转换串或汉字字符时,由字典/语法数据库703读取汉字转换串中的重音平假名或部件名称或汉字字符的笔划数,转换成符号,再存入控制符号存储单元707。当汉字转换串中汉字字符数目表示为控制符号时,则当汉字转换单元702完成转换操作时,即计算出汉字转换结果中汉字字符数,同时该计数值作为控制符号存入控制符号存储单元707。
如上所描述,当控制符号由重音平假名、汉字部件名称、汉字字符的笔划数、或字符数目中任何一个代表时,同一个控制符号可赋给众多的汉字转换串。这种情况下,其他控制符号也可使用。就是说,也可用重音平假名和部件名称的组合,或第一首部字符和第二起始字符的组合。不然的话,第一平假名和第二平假名可用作控制符号。因此即使如果众多汉字转换串具有同一个汉字转换串的起始字符,那修改对象的汉字转换串也可由控制符号来确定。
当输入平假名“じゆうらいのじゆうわうなぎじゆつ”(jurainojuyonag-ijutsu)时,如控制符号由汉字转换串的初始音节表示,则显示转换结果“j従来のj重要なg技術”。本例中,第一和第二汉字转换串彼此间无法区分,因它们具有相同的控制符号j。接着第二汉字转换串用其他符号例如“j従来の¥:重要なg技術”来表示。结果是,第一汉字转换串可和第二汉字转换串清楚地区别开来。
由于本发明利用控制符号来确定修改对象的汉字转换串,就不需多次按光标键和功能键,因此在修改转换结果时可减少按键次数。因此用于修改转换结果的输入操作能大大加快,同时汉字转换串能有效地加以修改。
Claims (11)
1.一种汉字转换结果修改系统,它包括:
用于积累字典和语法的字典/语法数据库装置;
利用字典/语法数据库装置将用于众多汉字转换串而顺序输入的拼音字符或平假名转换成汉字的汉字转换装置;
用于将所转换的汉字作为汉字转换结果存储起来的文件存储装置;
用于显示所转换汉字的装置;
用于产生代表每一个所述众多汉字转换串的控制符号的控制符号附加装置;
按照汉字转换结果存入所述文件存储装置的顺序将由所述控制符号附加装置所产生的控制符号存储起来的控制符号存储装置;
当汉字转换串需要修改时,利用控制符号来规定所述众多待修改汉字转换串中的一个的修改输入装置;以及
将由所述修改输入装置所规定的待修改汉字转换串进行修改的修改装置。
2.一种汉字转换结果修改系统,它包括:
用于积累字典和语法的字典/语法数据库装置;
利用字典/语法数据库装置将用于众多汉字转换串而顺序输入的拼音字符或平假名转换成汉字的汉字转换装置;
用于将所转换的汉字作为汉字转换结果存储起来的文件存储装置;
用于显示所转换汉字的装置;
用于产生代表汉字转换串的控制符号的控制符号附加装置;
将由所述控制符号附加装置所产生的控制符号和汉字转换结果成对地在显示装置上显示出来的显示控制装置;
按照汉字转换结果存入所述文件存储装置的顺序将由所述控制符号附加装置所产生的控制符号存储起来的控制符号存储装置;
当汉字转换串需要修改时,利用控制符号来规定待修改汉字转换串的修改输入装置;以及
将由所述修改输入装置所规定的待修改汉字转换串进行修改的修改装置。
3.根据权利要求2的汉字转换结果修改系统,其中
所述控制符号附加装置利用每一个汉字转换串的起始或结尾平假名来产生控制符号。
4.根据权利要求2的汉字转换结果修改系统,其中
所述控制符号附加装置利用每一个汉字转换串的重音平假名来产生控制符号。
5.根据权利要求2的汉字转换结果修改系统,其中
所述控制符号附加装置利用每一个汉字转换串的起始或结尾汉字字符的部件名称来产生控制符号。
6.根据权利要求2的汉字转换结果修改系统,其中
所述控制符号附加装置利用每一个汉字转换串的汉字字符数目来产生控制符号。
7.根据权利要求2的汉字转换结果修改系统,其中
所述控制符号附加装置利用每一个汉字转换串的起始或结尾汉字字符的笔划数来产生控制符号。
8.根据权利要求2的汉字转换结果修改系统,其中
当众多汉字转换串被赋予相同的所产生的控制符号时,所述控制符号附加装置通过附加另一个控制符号来产生代表每一个所述众多汉字转换串的控制符号。
9.根据权利要求2的汉字转换结果修改系统,其中
所述修改输入装置同时输入标明待修改汉字转换串的控制符号和标明修改类型的功能键。
10.根据权利要求9的汉字转换结果修改系统,其中
所述修改输入装置提供一个用于标明修改类型的功能键,该修改类型就是分拆、合并、重新输入、或下一组待选汉字的表示。
11.根据权利要求10的汉字转换结果修改系统,其中所述修改装置
当修改类型标明汉字转换串的分拆时,要求所述汉字转换装置将由所述修改输入装置利用控制符号而规定的汉字转换串进一步加以分拆,并再完成一次汉字转换操作;
当修改类型标明汉字转换串的合并时,则请求所述汉字转换装置将由所述修改输入装置利用控制符号而规定的汉字转换串和另一个汉字转换串合并起来,并再完成一次汉字转换操作;
当修改类型标明汉字转换重新输入时,则请求所述汉字转换装置将由所述修改输入装置利用控制符号而规定的汉字转换串加以清除,并对作为汉字转换串而重新输入的平假名再完成一次汉字转换操作;以及
当修改类型标明下一个待选汉字的表示时,请求所述汉字转换装置用下一组待选汉字组来替代由所述修改输入装置利用控制符号而规定的汉字转换串的当前汉字转换结果。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5260613A JPH07114558A (ja) | 1993-10-19 | 1993-10-19 | 漢字変換訂正処理方式 |
JP260613/93 | 1993-10-19 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1117156A CN1117156A (zh) | 1996-02-21 |
CN1095560C true CN1095560C (zh) | 2002-12-04 |
Family
ID=17350366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN94117294A Expired - Fee Related CN1095560C (zh) | 1993-10-19 | 1994-10-17 | 修改汉字转换结果的系统 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5617314A (zh) |
JP (1) | JPH07114558A (zh) |
KR (1) | KR0149063B1 (zh) |
CN (1) | CN1095560C (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2773652B2 (ja) * | 1994-08-04 | 1998-07-09 | 日本電気株式会社 | 機械翻訳装置 |
JP3689954B2 (ja) * | 1995-03-13 | 2005-08-31 | 富士ゼロックス株式会社 | 異種コード文字列転記装置および電子辞書 |
JP2817776B2 (ja) * | 1995-05-25 | 1998-10-30 | 日本電気株式会社 | 単語変換装置 |
US5890184A (en) * | 1996-05-16 | 1999-03-30 | Fujitsu Limited | External character management apparatus |
US5952942A (en) * | 1996-11-21 | 1999-09-14 | Motorola, Inc. | Method and device for input of text messages from a keypad |
JPH10163953A (ja) * | 1996-11-29 | 1998-06-19 | Sony Corp | 情報入力装置およびカーソル移動装置、ならびに、これらを使用した携帯電話装置 |
US6101461A (en) * | 1997-02-28 | 2000-08-08 | Justsystem Corp. | Command inputting method |
US6054941A (en) * | 1997-05-27 | 2000-04-25 | Motorola, Inc. | Apparatus and method for inputting ideographic characters |
KR100322575B1 (ko) | 1998-07-15 | 2002-03-08 | 윤종용 | 범용문자오타변환기능을갖는컴퓨터 |
JP2000066656A (ja) * | 1998-08-25 | 2000-03-03 | Fujitsu Ltd | 動的文書の特殊文字処理システムおよび特殊文字処理プログラムを記録した記録媒体 |
KR100351584B1 (ko) * | 2000-07-05 | 2002-09-05 | 주식회사 팔만시스템 | 한자의 일자대조에 의한 교정 시스템 |
JP4650920B2 (ja) * | 2002-04-16 | 2011-03-16 | 富士通株式会社 | 情報処理装置及び情報処理プログラム |
WO2004109541A1 (ja) * | 2003-06-02 | 2004-12-16 | Fujitsu Limited | 携帯情報機器の入力データ変換装置、携帯情報機器、入力データ変換装置の制御プログラム |
JP5140997B2 (ja) * | 2006-11-15 | 2013-02-13 | 富士通株式会社 | プログラム、文字入力編集方法及び装置 |
US8316295B2 (en) * | 2007-03-01 | 2012-11-20 | Microsoft Corporation | Shared language model |
CN101667091A (zh) * | 2008-05-15 | 2010-03-10 | 杭州惠道科技有限公司 | 实时预测用户输入的人机界面 |
CN107992457B (zh) * | 2017-12-01 | 2021-12-03 | 深圳乐信软件技术有限公司 | 一种信息转换方法、装置、终端设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4544376A (en) * | 1984-11-29 | 1985-10-01 | The United States Of America As Represented By The United States Department Of Energy | Abrasive slurry composition for machining boron carbide |
CN87104550A (zh) * | 1986-07-03 | 1988-02-10 | 曼内斯曼股份公司 | 检测柱形管和棒上缺陷的方法及装置 |
US5276616A (en) * | 1989-10-16 | 1994-01-04 | Sharp Kabushiki Kaisha | Apparatus for automatically generating index |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4544276A (en) * | 1983-03-21 | 1985-10-01 | Cornell Research Foundation, Inc. | Method and apparatus for typing Japanese text using multiple systems |
JPS59208637A (ja) * | 1983-05-13 | 1984-11-27 | Ricoh Co Ltd | 文書作成装置 |
JPS6231467A (ja) * | 1985-08-01 | 1987-02-10 | Toshiba Corp | 文章作成装置 |
JP2758952B2 (ja) * | 1989-12-28 | 1998-05-28 | 富士通株式会社 | 日本語文書読取翻訳システムの修正時における表示方式 |
JPH0594436A (ja) * | 1990-10-10 | 1993-04-16 | Fuji Xerox Co Ltd | 文書処理装置 |
US5384700A (en) * | 1992-10-29 | 1995-01-24 | International Business Machines Corporation | Method and system for storing multiple, modifiable Yomi and Kanji strings in a structured document |
-
1993
- 1993-10-19 JP JP5260613A patent/JPH07114558A/ja active Pending
-
1994
- 1994-09-12 US US08/302,977 patent/US5617314A/en not_active Expired - Fee Related
- 1994-09-30 KR KR1019940025039A patent/KR0149063B1/ko not_active IP Right Cessation
- 1994-10-17 CN CN94117294A patent/CN1095560C/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4544376A (en) * | 1984-11-29 | 1985-10-01 | The United States Of America As Represented By The United States Department Of Energy | Abrasive slurry composition for machining boron carbide |
CN87104550A (zh) * | 1986-07-03 | 1988-02-10 | 曼内斯曼股份公司 | 检测柱形管和棒上缺陷的方法及装置 |
US5276616A (en) * | 1989-10-16 | 1994-01-04 | Sharp Kabushiki Kaisha | Apparatus for automatically generating index |
Also Published As
Publication number | Publication date |
---|---|
CN1117156A (zh) | 1996-02-21 |
KR0149063B1 (ko) | 1998-10-15 |
JPH07114558A (ja) | 1995-05-02 |
KR950012251A (ko) | 1995-05-16 |
US5617314A (en) | 1997-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1095560C (zh) | 修改汉字转换结果的系统 | |
CN1113305C (zh) | 语言处理装置和方法 | |
CN1030114C (zh) | 汉语发音符号/汉字变换装置及方法 | |
KR100656736B1 (ko) | 표음 입력 모호성 제거 시스템 및 방법 | |
CN101943952B (zh) | 一种至少两种语言混合输入的方法和输入法系统 | |
JP5513898B2 (ja) | 共有された言語モデル | |
CN102455845B (zh) | 一种文字输入方法和装置 | |
CN1922594A (zh) | 用于基于触发序列进行文本输入的高效方法和装置 | |
CN86105610A (zh) | 使用汉语拼音的汉字数据处理和字处理的方法和装置 | |
CN1591297A (zh) | 汉字输入方法及装置 | |
JP2010520532A (ja) | 画数の入力 | |
CN1106619C (zh) | 汉语输入变换处理装置和汉语输入变换处理方法 | |
CN1109311C (zh) | 在字间插入特定字符码的装置和方法 | |
JP5114228B2 (ja) | データ入力装置及びデータ入力方法 | |
CN1239041C (zh) | 移动通信终端设备的日语输入装置和方法 | |
JP2018101224A (ja) | 検索装置、検索方法、及びプログラム | |
CN1274883A (zh) | 简化拼音-触摸屏鼠标式汉字输入方法 | |
CN1379342A (zh) | 汉语输入变换处理装置以及汉语输入变换处理方法 | |
CN1023037C (zh) | 中文连续汉字变换装置 | |
CN1264072A (zh) | 不需要输入音调符号的汉字转换装置 | |
JPS62117060A (ja) | 文字・音声入力変換方式 | |
JP2001014304A (ja) | 文書作成装置、変換処理方法及び変換処理プログラムを記録した記録媒体 | |
CN1023917C (zh) | 汉语文字处理之方法 | |
CN1048345C (zh) | 汉字变换装置 | |
CN1040702C (zh) | 语言再现装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1001527 Country of ref document: HK |
|
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |