CN1071522A - 汉语发音符号/汉字变换装置及方法 - Google Patents
汉语发音符号/汉字变换装置及方法 Download PDFInfo
- Publication number
- CN1071522A CN1071522A CN92111509A CN92111509A CN1071522A CN 1071522 A CN1071522 A CN 1071522A CN 92111509 A CN92111509 A CN 92111509A CN 92111509 A CN92111509 A CN 92111509A CN 1071522 A CN1071522 A CN 1071522A
- Authority
- CN
- China
- Prior art keywords
- sign indicating
- indicating number
- sound sign
- sound
- mentioned
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/018—Input/output arrangements for oriental characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明为汉语发音符号/汉字变换装置,允许用
拼音符号表示法及注音符号表示法输入。用拼音法
输入的数据使用拼音/音码变换表,用注音法输入的
数据使用注音/音码变换表,分别变换成对应的音
码。在词典中对应于音码串存储着汉字码。从输入
数据作成音码串。通过筛选程序掩蔽筛选音码中的
某些字节,比较该输入音码列的各音码与词典中的音
码串的音码。通过比较,从词典中读出与一致的音码
串相对应的汉字码,显示出与该汉字码相对应的单
词。
Description
本发明涉及将从键盘输入的汉语发音符号变换成与其对应的汉字后输出的装置及方法,特别是涉及适合于汉语用的文字处理机或桌面系统等使用的装置及方法。
汉语是用汉字书写表现的。有几种用符号表示汉字发音的方法。其具有代表性的方法是中国政府于1958年公布的拼音(pin yin)法,以及在此之前就使用的、现在台湾仍在使用的注音(Zhu Yin)法。
一个汉字的发音可分为相当于子音的声母(Sheng Mu)和相当于母音的韵母(Yun Mu),以及表示抑抵的四声(Si Sheng)或声调(Sheng Diao)。韵母和声母合在一起就是该汉字的读音。在汉字的发音中,也有的汉字没有抑抵。一个汉字的发音由一个以下(一个或零个)声母和一个韵母(根据需要,还可用声调)来表示。
声调有以下四种:
一声(Yi Sheng或1Sheng):是平坦的高音,用“-”表示。
二声(Er Sheng或2Sheng):从低音上升到高音。用“/”表示。
三声(Shan Sheng或3Sheng):从高音到低音,再到高音。用“∨”表示。
四声(Si Sheng或4Sheng):从高音下降以低音。用“\”表示。
例如用拼音法书写“中国”这两个汉字时,则写作“Zhong Guo′”。其中“Zh”和“G”是声母,“ong”和“uo”是韵母。另外,用拼音法书写“日本”这两个汉字时,写作“Ri Ben”。其中“R”及“B”是声母,“i”及“en”是韵母。
汉字文字处理过去从来只允许输入拼音符号。因拼音法是一种较新的方法,因此虽然知道注音法,但不知道拼音法的人仍然很多。因此,要使更多的人能使用汉语文字处理机,就必须允许按注音法输入才行。
另外,拼音法的书写方法是以北京话作为普通话确定的。在辽阔的中国,有的口音与北京话的声调不同。在不同的地区,甚至声韵也与北京话不同。因此,不会说作为普通话的北京话的人或者不熟悉北京话的人,就很难正确地输入声韵和声调,经常错误地输入。即使是会说北京话的人,不仅要一边想到声调的区别,一边发音,而且还必须一边联想或考虑声调,一边进行文字处理机的输入操作,不仅输入操作繁杂,而且有时不能输入正确的声调。
以往的汉语字处理机,只有当正确地输入声韵和声调时,才能输出与其对应的正确的汉字,如果输入错了,就得不到正确的汉字。
本发明的目的是汉语发音符号/汉字交换装置中,使用包括拼音书写法和注音书写法在内的多种书写方法中的任何一种,都可以输入发音。
本发明的另一个目的是即使不输入声调,或者即使声调输入错了,也能获得包括所要求的汉字在内的候选汉字。
本发明的再一个目的是如果发音多少有点正确,就能检出与包括该发音部分的发音相对应的候选汉字。
本发明的第一个特征是本发明的汉语发音符号/汉字变换装置是一种可以按照多种汉语发音表示方法进输入的输入装置,上述输入装置中分别设有可能输入的数据变换成与该输入数据表示的发音相对应的音码的多种变换表以及能够将音码与其所表示的发音的汉字相互对应存储的词典,还有能利用上述几种变换表中的任意一种,将从上述输入装置输入的数据变换成音码,并从上述的词典中检索出与所变换成的音码相对应的汉字码的控制装置。
为了采用乐于使用的输入方式,本发明的装置还设有能够从几种表示法中任选一种输入方式的选择装置。然后利用该方式选择装置选定的与表示法相对应的变换表,将输入的数据变换成音码。
还可以根据上述输入装置输入的数据,自动判断表示方法,根据判断的结果,选择应该使用的变换表。
还可以将上述输入装置设置成一种能够将输入的声音变换成电信号的装置、以及根据声音电信号识别发音、并将输入的声音变换成音码的声音识别装置。
本发明的装置用于汉语文字处理机时,还设有将所检出的汉字码变换成表示该汉字码所示的汉字的显示数据的装置,以及根据显示数据显示汉字的装置。
该装置还设有从所显示的候选汉字中选下任意一个汉字的指定输入装置,以及存储表示所指定的汉字的汉字码的存储器。
为了适用于更现代的文字处理机,将上述各变换表设计成能够将单个汉字的输入数据变换成音码。与此对应,上述的词典是将一个汉字或数个汉字构成的单词的音码串与汉字码相对应存储的构成的。由上述输入装置输入的一系列输入数据,按单个汉字分区,并变换成音码。经过变换后的一个或几个音码排列成单词单元,构成音码串。再从上述词典中检出与该音码串相对应的汉字码。
本发明是建立在能使一个音码对应于一个发音(汉字的读音)的见解基础上的。即使存在拼音符号表示法、注音符号表示法等多种表示方法,如果用这些符号表示法表示的发音是同一个音的话,就必然可以收敛成一个音码。因此,作为汉字(或单词)词典,只要有用音码能进行检索的装置就够了。这样一来,按照本发明,可以用多种表示法中的任意一种输入发音,所输入的发音就会转换成具有这个发音的汉字。
在本发明的实施状态下,即使输入的声调不正确,或发音符号多少有些错误,也能获得包括所要求的汉字在内的候选汉字。因此,在本发明的装置中还备有对构成音码的某一个或数个比特进行掩蔽筛选的装置。于是,采用上述控制装置,对与输入数据相对应的音码和上述词典中的音码进行筛选、加以比较,从上述词典中检出与输入数据相对应的音码一致的音码。
本实施状态的特征,根据下述本发明的第二个特征的观点,便能够充分了解。
本发明的第二个特征是,汉语发音符号/汉字变换装置具有将输入的表示汉语发音的数据变换成与该码相对应的音码用的变换装置,使音码与表示具有用该音码表示的发音的汉字的汉字码相互对应存储的词典,通过掩蔽筛选选出构成音码的某一个或数个比特的掩蔽筛选装置。利用上述筛选装置选出后,对从上述变换装置获得的音码与上述词典中的音码相互比较,从上述词典中检出与从上述变换装置中获得的音码相一致的音码,再从上述词典中读出与一致的音码相对应的汉字码的控制装置。
在某一种输入方式下,在上述音码的结构中含有表示声母的字节、表示韵母的字节和表示声调的字节。在这种情况下,上述的筛选装置作为掩蔽表示声母的字节、表示韵母的字节或表示声调的字节的装置之用。
上述筛选装置应理解为包括使音码原样不动地直接通过的装置。
根据需要,还可设置选择是否使用筛选装置,或在几种筛选装置中任选一种检索方式的筛选装置。
如上所述的本发明的第一个特征,还可设置按照多种表示法可输入汉语发音的输入装置。这时,上述变的装置可分别设置能够利用上述输入装置输入的多种表示方法,而且备有能将按照各种表示法输入的数据变换成与由该输入数据表示的发音对应的音码用的数种变换表。
还可以设置根据声音输入信号识别发音、并输出与该音相对应的音码的声音识别装置,用来代替上述输入装置和变换装置。
为了适用于更现代化的文字处理机,可设置将读出的汉字码变换成表示该汉字的显示数据装置、根据显示数据显示汉字的装置、从所显示的候选汉字中指定任意一个字的指定装置,以及将表示所指定的汉字的汉字码存储起来的存储器。
再者,上述变换装置的结构是将单个汉字的输入数据变换成音码,与对应,上述词典的结构能够将由单个汉字或数个汉字构成的单词的音码串与汉字码对应存储。于是,一系列的输入数据按各单个汉字的区位划分,并变换成音码,变换后的一个或数个音码排列成单词单元,构成音码排列。从上述词典中检出与该音码排列相对应的汉字码。
如果采用本发明,在进行筛选后,对表示输入数据的音码与词典中的音码进行比较。不管是否一致,音码部分(一个或数个字节)经过由筛选出器进行掩蔽筛选,被掩蔽的部分则不作为比较处理的对象。
因此,在不管声调如何的情况下,使用适当的筛选器,不管声调是否一致,甚至即使无声调输入,用其他部分(声韵)也能获得与输入数据相对应的音码一致、与音码相对应的一个或数个候选汉字。这样,即使不输入声调,或者即使声调输入错了,也能输入包括所要求的汉字(单词)在内的候选汉字(单词)。
筛选器的种类可任意设定。因此,还可以只在声母一致的条件下或只在韵母一致的条件下检索汉字。即如果发音多少有些正确,就能获得与包括该音在内的发音相对应的候选汉字(单词)。
本发明还提供分别与具有第一个及第二个特征在的装置相对应的汉语发音符号/汉字变换方法。
具有第一个特征的方法是事先准备好可按照多种表示法输入汉语发音,且能将按照可输入的多种符号表示法分别输入的数据变换成与该输入的数据表示的发言相对应的音码用的变换表,以及使音符与表示具有该音符所示的发音的汉字的汉字码互相对应存储的词典。利用上述多种变换表中的任意一种,将输入数据变换成音码,再从上述词典中检出与变换后的音码相对应的汉字码。
具有第二个特征的方法是事先准备好将音码与表示具有该音码所示的发音的汉字的汉字码互相对应存储的词典,将所输入的表示汉语发音的数据变换成与该音相对应的音码,对构成音码的某一个或n个字节进行掩蔽筛选后,对于由变换获得的音码与上述词典中的音码进行互相比较,从上述词典中检出与由变换获得的音码一致的音码,再从上述词典中读出与一致的音码相对应的汉字码。
本发明的其它特征及优点,在下面参照附图对实施例的说明过程中便可明了。
图1是表示汉语发音符号/汉字变换装置的电路结构方框图。
图2是该装置的主要部分的硬件结构,或是从机能观点看的结构方框图。
图3表示拼音/音码变换表之一侧。
图4表示注音/音码变换表之一侧。
图5a表示音码的数据格式化,图5b表示用来表示声调的编码。
图6是表示输入、编辑处理顺序的程序方框图。
图7表示键数据缓冲存储器中存储起来的键输入数据的式样。
图8表示音符排列缓冲存储器中存储起来的音符的式样。
图9至图11是表示汉字检索处理顺序和程度方框图。
图12表示词典的结构。
图13表示音符排列/汉字符对应表之一侧。
图14表示汉字符缓冲存储器。
图15表示音符经过选出后被变换的式样。
图16表示利用选出器检索汉字的式样。
图17表示汉字检索装置的硬件结构,或是表示着眼于汉字检索处理功能的方框图。
图1表示汉语发音符号/汉字变换装置的结构。通常该装置是作为汉语文字处理机、桌面处理系统的一部分实现的。
汉语发音符号/汉字变换装置由下列各部分构成:包括中央处理装置(CPU)在内的计算机10;输入发音符号、各种方式及其它功能用的键盘20;存储词典及各种变换表的存储装置30;显示所变换成的汉字及其它信息或数据用的显示装置14;以及控制装置12。
计算机10可以使用市售的通用计算机.计算机10用来编制程序,以便执行后面所述的输入、编辑处理及汉字检索处理。
在该实施例中,可输入的发音符号表示方法有拼音法和注音法。另外,允许采用包含声调的完整的发音符号表示方法以及除去声调只用音韵进行的发音符号的表示方法。
键盘20上设有用拼音法输入发音符号用的拼音键21;用注音法输入发音符号用的注音键22;选择输入的发音符号是采用拼音法还是采用注音法用的输入方式键23;选择想用含有声调的完整的发言符号检索汉字(将其称为第一种状态)还是采用除去声调只使用音韵的发音符号检索汉字(将其称为第二种状态)用的变换方式键24;以及发出应将输入的发音符变换成汉字的指令用的变换键、空格键(需要时)及输入其它功能用的功能键25。
由键盘20输入的表示发音符号的数据(或符号)被变换成对应的音码(Yin Code)。为了进行这种符号变换,在存储装置30中设有拼音/音码变换表31注音/音符变换表32。因为用该发音符号或用其它发音符表示被输入的发音符,所以为了一旦要将变换成的音码反过来变换成表示拼音符或注音符号的数据(或符号),在存储装置30中设有音码/拼音表33及音码/注音表34。另外,在存储装置30中还设有根据变换后的音码检索出表示与其相对应汉字符号(汉字符)用的词典35,以及存储变换后的汉字符用的变换后的数据区36。存储装置30由半导体存储器(ROM或RAM)、磁存储器(软盘或硬盘)或由它们的组合来实现。例如,变换表31-34存储在ROM(只读存储器)、软盘或硬盘中,词典35存储在软盘或硬盘中,变换后的数据区设定的RAM(随机存取存储器)中。
作为显示装置14,最一般的是采用CRT(阴极射线管)显示装置,但也可采用等离子显示装置或液晶显示装置。在显示控制装置12中装有字符发生器13。字符发生器13是用来将表示拼音或注音的数据,以及汉字符变换成显示数据(光点数据)的装置。
图2是将图1所示的结构按照其功能及处理程序排列而成的。转换电路15,编辑处理装置16及汉字检索处理装置17,实际上是由计算机10实现的。另外,也可使发音符号/汉字变换装置具有如图2所示的硬件结构。
转换电路15根据通过输入方式键23进行选择输入,选择拼音键21或注音键22。用拼音键21或注音键22输入的表示拼音或注音符号的数据被输送给编辑处理装置16。转换电路15还可以自动识别是拼音键输入还是注音键输入,以便选择该输入。
汉语单词有用一个汉字构成的,也有用数个(通常是二个或三个)汉字构成的。编辑处理装置16将输入的表示拼音符号或注音符号的数据列全都分成表示一个汉字的数据。用输入方式键23,参照所选择的变换表31或32,将被分开的各个数据变换成音符。如果有来自包含功能键25的变换键的输入时,由至此所输入的数据构成的音码列,由编辑处理装置16输送给汉字检索处理装置17。编辑处理装置16将输入的表示拼音符号或注音符号的数据输送给显示控制装置12,所以在显示装置14的图象上,由输入的拼音符号或注音符号构成文字,按照输入的顺序依次显示。这时不需要逆变换表33、34。编辑处理装置16将输入数据变换成音码后,进行拼音符号或注音符号的显示时,要使用逆变换表33、34。在使用注音符号(或拼音符号)来显示用拼音符号(或注音符号输入的数据时,使用这些逆变换表33、34特别有效。因此,只知道拼音符号的操作人员能知道注音符号,只知道注意符号的操作人员能知道拼音符号,所以很是方便。
汉字检索处理装置17根据接收到的音码列,按照变换状态键24的选择,检索词典35,读出表示具有音码列所示发音的一个或数个汉字的汉字符,并输送给显示控制装置12。显示装置12从字符发生器13读出显示接收到的汉字符所示汉字用的显示数据,根据该数据,在显示装置14的显示图象上显示出一个或数个汉字(候选汉字)。操作人员观察该显示结果,利用功能键25,确认所显示的汉字,或选择任意一个汉字,然后将表示被确认或被选择的汉字的汉字符置于交换后的数据区中。
图3表示拼音/音码变换表之一侧,图4表示注音/音码变换表之一例。
对应于一种发音,虽然有拼音法或注音法之类的各种发音符号表示法;但这些符号必须对应于一种发音。对于一种发音,由一种音符(Yin code)来担任。一个拼音符号必定对应于一个音码,一个注音符号也必定对应于一个音码。表示一个音的拼音符号与表示该同一个音的注音符号共同对应于一个音码。这样,即使输入发音用的发音符号环境污染地有多种,但同一个音去都用同一个音码表示。不管是用拼音法输入,还是用注音法输入,如果是同一个音,则会变换成同一个音码,因此在装置内部,能够统一地把音码作为表示发音的唯一符号。因此不必为第一种发音符号环境污染地分别准备一种词典(例如拼音法用的词典及注音法用的词典),为所有的字符表示法准备一种通用的音码检索的词典就足够了。
例如,图3中第1行所示的用拼音字符表示的发音与图4中第1行的用注音字符表示的发音是相同的,都对应于同一音码52F8(16进制码)。其它行的发音也一样。为了容易理解,在图3及图4中,最左侧一栏中分别是拼音符号和注音符号。在变换表中,这些符号当然是用二进制数据表示的。
图5a表示音码的格式。在本实施例中,音码由两个二进制字节构成。前一个字节主要表示韵母,后一个字节主要表示声母。前一个字节中的最前方的(f)的数据“0”及后一个字节中的最前方的(7)的数据“1”是用来分隔构成一个音码的上一个字节和下一个字节的,同时也用来分隔其它数据的(特别是音码列中的音码)。
前一个字节中的最后的位(第8位)表示声调的有无。因为有的发音无声调。用“0”表示无声调,用“1”表示有声调。后一个字节中的最后的两位(第0-1位)表示声调。如图5b所示,一声、二声、三声、四声分别用“00”、“01”、“10”、“11”表示。
上一个字节的中间六位(第9-e位)表示韵母,下一个字节的中间五位(第2-6位)表示声母。韵音有37种,声母有24种,因此这么多的位数已经足够了。
在后面所述的汉字检索处理中使用筛选程序。该筛选程序也是由两个二进制字节构成,其第0位,第1位及第8位设定为“0”,其它各位设定为“1”。该过滤程序用16进制表示则为“FEFC”。
图6表示用计算机10进行输入,编辑处理的顺序,或者表示编辑处理装置16的动作情况。在计算机10或编辑处理装置16中,设有如图7所示的键数据缓冲存储器,以及如图8所示的音码串缓冲存储器。
首先,利用输入方式键23,判断设定的是拼音法还是注音法中的哪一种方式(步41),如果是选择了拼音法,则选择拼音码变换表31(步42)。如果是选择了注音法,则选择注音/音码变换表32(步43)。
接着,利用变换方式键24,判断选择的是第一方式还是第二方式(步44)。如果选择的是第一方式,则不需要进行任何处理,但若选择是第二方式,则应在筛选程序(由寄存储器或存储区位实施)中设定“FEFC”(步45)。选择第一方式,也可以设定全部各位均由1构成的数据“FFFF”作为筛选程序。
由拼音键21或注音键22每次输入的表示发音符号的字符或符号的数据,都存储于键数据缓冲存器中(步47)。如图7所示,输入一个字符后,便在该字符后段存入一个终端符号数据“φ”。这是因为表示发言符号的数据是可变称度的数据,所以有必要明确表示该数据的终端。在图7中,列出了按照第二方式输入的用拼音符号表示的“Zhong”的发音的式样。
需要判断是否输完一个汉字的键数据(步48)。这种判断有多种方法。其一是在输入一个汉字的键数据终了时,由操作人员按下空格键。如果有空格键的输入,即可断定一个汉字业已输入终了。其二是,在第一方式的情况下使用有效数据。在输入了发音符号后,由操作人员用1、2、3、4数字输入声调。例如,“Zhong”的发音是一个具有一声声调的音,则输入“Zhong1”。如果有数字键输入,即可断定一个汉字的数据来已输入终了。其三是,通过划分音节的自动识别方式进行判断。按拼音法书写发音时,有一定的规则,所以利用这个规则就能断定在所输入的键数据串的什么地方是一个汉字符号的终端。用注音法书写时,同样有一定的规则,因而也可以利用这个规则。
总之,输入了一个汉字的键数据后,先根据所选择的拼音/音码变换表31或注音/音符变换表32,将所输入的键数据(拼音符号或注音符号)变换成与其对应的音码。再将该音码存入音码串缓冲存储器中(步49)。
上述步骤47的处理反复进行,直至一个汉字的键数据完全输入终了为止(步48)。步47-49的处理反复进行,直至按下变换键为止(步46)。于是,等到有为换键输入后,音符串缓冲存储器中存储的音码串,就过渡到从图9开始的汉字检索处理(步50)。
例如,用拼音法以第二方式输入“Zhong Guo”时,键输入数据“Zhong”变换成音码“52f8”,“Guo”变换成音码“66b4”,结果获得音码串525866b4”。
在指定了第二方式之后,也可以输入包含声调的发音。例如,可以输入“Zhong1Guo2”。这时产生“53f867b5”这样的音码串。因为指定的是第二方式,所以设定筛选程序“FEFC”(步45),结果执行后面将更详细说明的第二方式的检索。
从图9至图11特别列出了第二方式的汉字检索处理顺序。由于将筛选程序设定为“FFFF”,所以这种处理方式同样适用于第一方式的汉字检索处理。另外,该处理最好由图1所示的计算机10或图2所示的汉字检索处理装置17执行。
在说明该汉字检索处理之前,先参照图12及图13说明词典35的结构。如图12所示,词典35右设有索引表Ⅰ、索引表Ⅱ及音串/汉字符对照表。
如图13所示,音码串/汉字符对照表中,存储着音码串和汉字符对照表,该汉字符是表示构成具有由该音码串表示的发音的单词的一个或数个汉字的。为了容易理解,图13中列出了汉字本身,用来代替汉字码,但实际上请理解为存储的是用二进制数据表示的符号。
“中国人”这个单词是由三个汉字构成的,所以音码串由6位构成。由两个汉字构成的单词(例如“中国”)对应于四个码串。一个汉字时,对应两位音码串,这样,开头的一个汉字(上例中的“中”)相同的单词都靠近排列,而且,构成单词的音码串的位数多者,采用以相对地址的值小的方式进行。在图13中,在音符串的最后一定要有表示“0000”的符号“φ”。
有时一个音有两个以上的汉字。例如,相对地址为102及103的音码串都是“53f8”,它们对应于汉字“中”、“忠”等。
用l表示音码串/汉字码对照表中的相对地址。另外,相对地址l的音码串用YO(l,1)、YO(l,2)……φ表示。YO(l,1)、YO(l,2)等,一般用YO(l,c)(c=1,2、……)表示。相对地址l的汉字符用KA(l)(可变长)表示。
在音码串/汉字码对照表中存入尽可能多的(如有可能,几乎是在中国使用的全部)单词。这些单词的排列顺序,除上述规则外,是任意的。因此,任意的一对音码串与汉字码可以分配在任意的存储区。将音码串/汉字码对照表中排列的单词数为M。
再回到图12,索引表Ⅰ及索引表Ⅱ是用来按照音码串的表示数值大小的顺序就能检索任意排列的音码串/汉字码对照表中的音码串的一种对照表。
在索引表Ⅰ中,有N个Index Ⅰ(i)(索引Ⅰ(i)),按一定的顺序排列。Index Ⅰ(i)是指示索引表Ⅱ中对应要素所在的指针(指示索引表Ⅱ的相对地址)。N是音码串/汉字码对照表中不同音码串的个数。如上所述,一个音码串有可能对应两个以上的单词,所以一般来说,N≤M成立。
在索引表Ⅱ中有M个存储区,在各存储区中存储着三种要素F1(K)、F2(K)、F3(K)。F3(K)是指向与码串/汉字码对照表中相对应的音码串的指针(指示对照表的相对地址)。F2(K)所指是那些与它在同一存储区中的F3(K)所指、但却与存在于索引表Ⅱ中其他存储区的所存的F3(K)所指的音码串相同的相对地址。因此采用这种方式音码串53f8才有可能检索到单词“中”、“忠”两个汉字。如果在别处及有同样的音码串,则置F2(K)=φ。F1(K)指示索引表Ⅱ中具有指示在上位含有与该F1(K)位于同一存储区中的F3(K)所指示的音码串相同的音码串(即比F3(K)所指示的音码串长的音码串)的F3(K)的其它存储场所(的相对地址)。因此,检索“中国”时,才能自动检索到虽然含有“中国”但汉字数目却比它多的“中国人”。
索引表Ⅰ中的Index(i)按照表示音码串/汉字码对照表中音码串的数值从小到大的顺序排序。因此,即使音码串/汉字码对照表中的音码串的排列是任意的,但通过索引表Ⅰ查看时,所看到的音码串/汉字码对照表中的音码串宛如按照表示它的数值从小到大的顺序排列。
从图9至图11所示的汉字检索处理采用对分法检索(binary search或dichotomizing)。
在进行这种汉字检索处理时,使用若干个变数。这些变数是START(开始)、END(终止)、find(搜索)等。变数START及END用来从索引表Ⅰ中选择数据。find用来指示存储所检到的汉字码的汉字码缓冲存储器(参见图14)中的存储区。这些变数是作为在寄存器或在存储区中存储的数据实现的。
从输入、编辑处理(图6)或编辑处理装置16输送到汉字检索处理或汉字检索处理装置17中的输入音码串,用X(1)、X(2)、X(3)……φ表示。例如,按照拼音字符表示法输入“Zhong Guo2”时,输入音码串为“53f86765φ”。即X(1)=53f8,X(2)=67b5用音码计数码C用来表示构成输入音码串的各个音码在输入音码串中的第n个位置。例如,X(1)写作X(C)(C=1)。
在图9中,首先使音码计数码C初始化(C=1,步51)。从而,输入音码串的头一个音码即被指定为X(1)。
接着使变数START为0,END为(N-1),find为0,都分别予以初始化(步52)。
用变数START和END算出索引表Ⅰ的相对地址为(START+END)/2,将它置作i(步54)。这是求出索引表Ⅰ的相对地址中恰好位于中央的相对地址的处理。对分检索法就是这样将一系列相对地址(一般说来是一群项目)分成两个部分,选择其中的某一部分,将所选择的部分再分成两份,直至到达(检出)目的物的相对地址(项目)的一种检索方法。
利用算出来的相对地址,从索引表Ⅰ中选取数据,读出存储在具有相对地址i的存储区位中的Index(i)。将该Index(i)置作k(步55)。
接着,将Index(i)=k作为相对地址用,再从索引表Ⅱ中选取数据,读出具有该相对地址的存储区中存储要素F1(K)、F2(K)、F3(K),将它们分别置作为l1、l2、l3(步56)。
参照图10,将从索引表Ⅱ中读出的第三个要素F3(K)=l3用作相对地址,从音码串/汉字码对照表中选取数据,读出具有该相对地址的存储区中存储的音码YO(l3,C)。在选择了第二方式时,设定FILTER(筛选程序)=FEFC(图6,步45)。进行筛选程序和读出的音码YO(l3,C)r AND逻辑运算。另外,利用输入音码的音码计数码C,对指定的音码X(C)和筛选程序进行ABD逻辑运算。比较这两个AND逻辑运算的结果是否相等,哪一个大(步63、64)。
如上所述,通过索引表Ⅰ,检查音码串汉字码对照表,在音码串/汉字码对照表中,将音码串按照其代表数值从小到大排列。因此
FILTER AND X(C)
<FILTER AND YO(l3,C) 式1表示式1成立,就是说输入的音码X(C)比搜索出来的音符YP(l3,C)小,即应该搜索出来的X(C)是存储在比YO(l3,C)的相对地址小的存储区。为了更接近X(C),必须从相对地址更小的存储区选取数据。即必须从索引表Ⅰ的上半部分选取数据。这里,用i代入变数EBD(步67),经过步53,返回步54。
FILTER AND X(C)
<FILTER AND YO(l3,C) 式2
正式2的情况下,用i代入变数START(步68),同样返回步54。
这样,按照对分探索法,在音符列/汉字符对照表中搜索与输入音符X(C)一致的音符。
接着FILTER AND X(C)
<FILTER AND YO(l3,C) 式2
如果式3成立,则要寻找的音码X(C),在对照表中所存储的存储区便能找到。
假设C=1,为了查看下一个第二个(C=2)的输入音码X(C)是否与对照表中音码串中的第二个音码YO(l3,C)一致,使音码计算码C增量(步66)。
如果C增量后式3成立,则根据式1或式2两者中哪一式成立,再按照对分检索法进行探索(步64、67、68)。C=1时所谓式3成立,就是说在对照表中找到的YO(l3,C)的附近存在着要找的音码串,因此故意不用对分法,也可以在其附近找出。另外,如后面所述,也可以利用要素F1(K)进行检索。
一边找出式3成立的音码YO(l3,C),一边使音码计数码C增量的结果,对输入音码串中的全部音符检索完毕,接着使X(C)=φ后(步61),检验一下YO(l3,C)=φ在对照表中的音码串的音码中是否也成立(步69)。这时如果是“YES”(是),便是找到了与输入音码串一致的音码。多至图11所示的处理程序。如果音码YO(l3,C)ijφ时,则要找的音码串存在于比该存储区的相对地址大的位置处,因此再在相对地址更大的存储区继续检索(步70)。理所当然,找到全部含有输入音码串的音码串之后,(就像随着找到了“中国”,也就找到了“中国人”),作为要寻找的音码串理应就在其附近,因此,如果使对照表中的相对地址一个接一个地增加,理应立刻找到所要寻找的音码串。
再者,当X(C)不是φ,而读出的音码YO(l3,C)已经是φ时(就像寻找“中国”时找到了“中”那样)(步62),移至相对地址更小的存储区检索(步65)。在这种情况下,要寻找的文字码串也应存在于所到在的存储区很近的地方,因此通过使对照表的相对地址一个一个地增值下去,就能迅速地找到所要找的文字码串。
下面参照图15说明FILTER=FEFC的含义。例如,对具有“Zhong”这个韵的一声一四扬中的任意一个音码和FITET=FEFC进行AND运算后,变换成忽视声调的表示“Zhong”韵的音码。因此,在第二方式下进行汉字检索时,能看到与声调无关而韵相同的全部汉字。其式样示于图16中。不管输入含有声调的“Zhong1Fuo2”,还是输入无声调的“Zhong Guo”,使该输入音码通过筛选程序,有关“中国”这个单词的式3成立,便找到了该单词。这意味着通过步63、64处理过程中的筛选程序。
在第一方式下,不一定必须使用筛选程序,可以直接比较输入音码对照表中的音码,但若使用FILTER=FFFF,步63、64,可直接使用式1-式3。
找到与输入音码串一致(通过过滤程序)的音码串后(步69),参照图11,使高数find增值,指定汉字码村冲存储器中的存储区,对照所检出的音码串,从音码串/汉字码对照表中读出存储的汉字码KA(l3),根据汉字码缓冲存储器中的变数find,存入指定的存储区(步71)。
接着利用索引表Ⅱ中的第二个要素F2(K),根据指示对照表中发音相同的音码串的索引表中的其它存储区的要素F3(K),仅供参考照表中选到数据。这时,使变数find增值,给被存储的发音相同的汉字码指定的存储区后,存入汉字码缓冲存储器中(步73)。利用要素F2(K),依次读出经过连接指令连接的发音桢的汉字码,并存入汉字码缓冲存储器中(反复进行步73、74)。因此,便能在“中”字处附加上“忠”字等汉字作为候选字一并检出。
如果F2(K)=l2=φ(步72),利用要素F1(K)=l1,检索含有输入音码串、且比它更长的音码串。利用由要素F1(K)所指的索引表Ⅱ中的其它(第二个)存储区中存储的要素F3(K),从对照表中读出被选取的汉字码,使变数find增值后,存入汉字码缓冲存储器中(步76)。根据第二个存储区中的要素F1(K),如果还有其它的被下达了连接指令的存储区,同样,再根据上述的其它存储区的要素F3(K),读出被选取的汉字码,并存入汉字码缓冲存储器(步75-77)如果F1(K)=l1=φ,则全部处理结束(步75)。
另外,反复进行对分检索,终于达到STATT+1>END时,表示没找到与输入音码串相当的音码串,于是汉字检索处理终了(步53)。
图17是表示实现上述处理的硬件结构,即表示汉字检索处理装置17的结构。
音码串/汉字码对照表81图12或图13所示的对照表相同。检索读出电路82,从该对照表中,或是参照输入音码串,依次读出音码串。在筛选程序寄存器83A中存入数据FFF,在过筛选程序寄存器83B中存入数据FEFC。根据由变换方式键24进行的变换方式的选择结果,转换开关84在第一方式状态时选择寄存器83?A,在第二方式状态时选择寄存器83B,将其中存储的筛选程序数据输送给AND电路85、86。
输入音码串被输送给AND电路85,从对照表81读出的音码串被输送给AND电路86。在AND电路85、86中,分别输入音码串、进行音码串的筛选,它们的输出数据在比较电路87中进行比较。比较电路87只在两个输入数据一致时才输出一致信号。由该一致信号起动门电路88。另外,一致信号被送给检索读出电路82。检索读出电路82从对照表中读出与一致的音码对应的全部汉字码,并输送到门电路88,所以该汉字码通过选通电路88,存入汉字码缓冲存储器89中。
在上述实施例中,有第一种方式和第二种方式之分,利用筛选程序FFFF及FEFC,进行含声调的和所徊声调的汉字检索,但也还可以利用另外的筛选程序进行其它状态的汉字检索。例如,如果使用16进制表达的筛选程序OOFC,就能检索具有声母与输入音码一致的音码的全部汉字。
另外,作为输入装置,不限于键盘,也可利用输入发音的装置。在这种情况下,可利用将表示发音的电信号变换成与对应的音码的声音识别装置。
Claims (21)
1、汉语发音符号/汉字变换装置,具有可按数种符号表示法输入汉语发音的输入装置;针对用上述输入装置可以输入的多种符号表示法分别设置的多种变换表,用来将按照各种符号表示法输入的数据变换成与由该输入数据表示的发音对应的音码;使音码与表示具有该音码所示音的汉字的汉字码互相对应存储的词典;以及利用上述数种变换表中的任意一种,将由上述输入装置输入的输入数据变换成音码,从上述词典中检索与交换后的音码相对应的汉字码的控制装置。
2、根据权利要求1所述的装置,还具有选择多种符号表示法中的某一种用的输入方式选择装置,上述控制装置利用与由上述输入方式选择装置选择的符号表示相关的变换表,将输入数据变换成音码。
3、根据权利要求1所述的装置,其上述控制装置根据从上述输入装置输入的输入数据,判断符号表示法,根据该判断结果选择应该使用的变换表。
4、根据权利要求1所述的装置,其上述输入装置由将输入声音变换成电信号的装置、以及根据声音电信号识别发音、并将输入的声音变换成音码的声音识别装置结构。
5、根据权利要求1所述的装置,还具有将检索到的汉字符,变换成表示该汉字码所示汉字的显示数据的装置,以及根据显示数据显示汉字的装置。
6、根据权利要求5所述的装置,还具有从显示出来的候选汉字中提定任意一个汉字的指定输入装置,以及存储表示所指下的汉字的汉字码的存储器。
7、根据权利要求1所述的装置,其上述各变换表是用来将单个汉字的输入数据变换成音码,上述词典是将由一个汉字或数个汉字构成的单词的音码串与汉字符对应存储用的,上述控制装置将从上述输入装置输入的输入数据分成一个个的汉字,并变换成音码,将变换后的音码排列在单词单元中,作成音码串,再从上述词典中检索与该音符列对应的汉字码。
8、根据权利要求1所述的装置,还具有将构成音码的给定的一个或数个字节进行掩蔽筛选的选装置,上述控制装置利用上述筛选装置对与输入数据对应的音码和上述词典中的音码经过筛选后进行比较,再从上述词典中寻找出与输入数据对应的音码一致的音码。
9、汉语发音符号/汉字变换装置具有将输入表示汉语发音的数据变换成与该音对应的音码的变换装置;将音码与表示具有该音码所示音的汉字的汉字码互相对应存储的词典;将构成音码的某一个或数个字节进行掩蔽筛选的筛选装置;用上述筛选装置对从上述变换装置获得的音码和上述词典中的音码进行筛选,互相比较,从上述词典中检索与从上述变换装置获得的音码一致的音码,再从上述词典中读出与一致的音码相对应的汉字码的控制装置。
10、根据权利要求9所述的装置,其上述音码包括表示声母字节、表示韵母的字节、以及表示声调的字节。
11、根据权利要求10所述的装置,其上筛选滤装置是用来筛选表示声母的字节、表示韵母的字节或表示声调的字节的装置。
12、根据权利要求9所述的装置,其上述筛选装置含有使音码直接通过的功能。
13、根据权利要求9所述的装置,还具有按照多种符号表示法可输入汉语发音的输入装置,上述变换装置是针对使用上述输入装置可输入的多种符号表示法准备的,而且备有多种变换表,用来将按照各种符号表示法输入的数据变换成与由该输入数据表示的音对应的音码。
14、根据权利要求9所述的装置,其上述变换装置是一种根据声音输入信号识别发音,并输出与该音对应的音码的声音识别装置。
15、根据权利要求9所述的装置,还具有选择是否使用筛选装置,或选择多种筛选装置中的某一种的检索方式选择装置。
16、根据权利要求13所述的装置,还具有选择数种符号表示法中的某一种用的输入方式选择装置,上述变换装置利用与由上述输入方式选择装置的符号表示法相关的变换表,将输入数据变换成音码。
17、根据权利要求9所述的装置,还具有将读出的汉字码变换成表示该汉字码所示汉字的显示数据的装置,以及根据显示数据显示汉字的装置。
18、根据权利要求17所述的装置,还具有从所显示的候选汉字中指定任意一个的指定输入装置,以及存储表示被指定的汉字的汉字符的存储器。
19、根据权利要求9所述的装置,其上述变换装置是将单个汉字的输入数据变换成音码的一种装置,上述词典是对应存储由一个汉字或数个汉字构成的单词的音码串和汉字码用的,上述控制装置是用来控制将输入数据分成单个汉字、并变换成音码的上述变换装置,将变换后的音码排列成单词单元,作成音码串,再从上述词典中检索与该音码串相对应的汉字码。
20、汉语发言符号/汉字变换方法可根据数种符号表示法输入汉语发音,针对可输入的多种符号表示法,预先准备了多种变换表,用来将按照各种符号表示法输入的数据变换成与该输入数据所示的音相对应的音码,以及使音码与表示具有该音码所示音的汉字的汉字码互相对应存储的词典,利用上述多种变换表中的某一种表,将输入数据变换成音码,再从上述词典中检索与变换后的音码相对应的汉字码。
21、汉语发音符号/汉字变换方法,预先准备了词典,该词典是将音码与表示具有该音码所示音的汉字的汉字码互相对应存储用的,将表示输入的汉语发音的数据变换成与该音相对应的音码,在将构成音码的某一个或数个字节进行掩蔽筛选之后,对通过变换获得的音码与上述词典中的音码进行互相比较,从上述词典中检出与通过变换获得的音码相一致的音码,再从上述词典中读出与一致音码相对应的汉字码。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29196091 | 1991-10-14 | ||
JP291960/91 | 1991-10-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1071522A true CN1071522A (zh) | 1993-04-28 |
CN1030114C CN1030114C (zh) | 1995-10-18 |
Family
ID=17775693
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN92111509A Expired - Lifetime CN1030114C (zh) | 1991-10-14 | 1992-10-14 | 汉语发音符号/汉字变换装置及方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5319552A (zh) |
CN (1) | CN1030114C (zh) |
GB (1) | GB2260633B (zh) |
TW (1) | TW268115B (zh) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5742838A (en) * | 1993-10-13 | 1998-04-21 | International Business Machines Corp | Method for conversion mode selection in hangeul to hanja character conversion |
JP3689954B2 (ja) * | 1995-03-13 | 2005-08-31 | 富士ゼロックス株式会社 | 異種コード文字列転記装置および電子辞書 |
US5893133A (en) * | 1995-08-16 | 1999-04-06 | International Business Machines Corporation | Keyboard for a system and method for processing Chinese language text |
DE19549059A1 (de) * | 1995-12-29 | 1997-07-03 | Siemens Ag | Übertragung von aus Tabellen ausgewählten asiatischen Schriftzeichen über den Kurz-Nachrichten-Dienst eines Mobilfunkgerätes |
JP3282976B2 (ja) * | 1996-11-15 | 2002-05-20 | 株式会社キングジム | 文字情報処理装置及び方法 |
US5952942A (en) * | 1996-11-21 | 1999-09-14 | Motorola, Inc. | Method and device for input of text messages from a keypad |
US6054941A (en) * | 1997-05-27 | 2000-04-25 | Motorola, Inc. | Apparatus and method for inputting ideographic characters |
JPH1186434A (ja) * | 1997-09-11 | 1999-03-30 | Sony Corp | 記録装置、記録方法、及びダビング装置 |
CN1120436C (zh) * | 1997-09-19 | 2003-09-03 | 国际商业机器公司 | 用于识别孤立、非相关汉字的语音识别方法和系统 |
US7257528B1 (en) | 1998-02-13 | 2007-08-14 | Zi Corporation Of Canada, Inc. | Method and apparatus for Chinese character text input |
TWM251204U (en) * | 1998-03-03 | 2004-11-21 | Koninkl Philips Electronics Nv | Chinese characters in an electronic device |
US6094666A (en) * | 1998-06-18 | 2000-07-25 | Li; Peng T. | Chinese character input scheme having ten symbol groupings of chinese characters in a recumbent or upright configuration |
JP2000049923A (ja) * | 1998-07-31 | 2000-02-18 | Matsushita Electric Ind Co Ltd | 電話機のための漢字入力装置 |
JP3842913B2 (ja) * | 1998-12-18 | 2006-11-08 | 富士通株式会社 | 文字通信方法及び文字通信システム |
JP2000235567A (ja) * | 1999-02-17 | 2000-08-29 | Matsushita Electric Ind Co Ltd | 声調符号無入力式中国語文字変換装置 |
CN1127011C (zh) * | 1999-03-15 | 2003-11-05 | 索尼公司 | 字符输入方法及字符输入装置 |
JP2000298667A (ja) * | 1999-04-15 | 2000-10-24 | Matsushita Electric Ind Co Ltd | 構文情報による漢字変換装置 |
JP2001043221A (ja) * | 1999-07-29 | 2001-02-16 | Matsushita Electric Ind Co Ltd | 中国語単語分割装置 |
US7165019B1 (en) | 1999-11-05 | 2007-01-16 | Microsoft Corporation | Language input architecture for converting one text form to another text form with modeless entry |
US7403888B1 (en) | 1999-11-05 | 2008-07-22 | Microsoft Corporation | Language input user interface |
US6848080B1 (en) | 1999-11-05 | 2005-01-25 | Microsoft Corporation | Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors |
US7047493B1 (en) * | 2000-03-31 | 2006-05-16 | Brill Eric D | Spell checker with arbitrary length string-to-string transformations to improve noisy channel spelling correction |
US7107204B1 (en) * | 2000-04-24 | 2006-09-12 | Microsoft Corporation | Computer-aided writing system and method with cross-language writing wizard |
CN1316338C (zh) * | 2000-06-14 | 2007-05-16 | 索尼公司 | 汉字输入方法 |
GB2365188B (en) * | 2000-07-20 | 2004-10-20 | Canon Kk | Method for entering characters |
US20030110451A1 (en) * | 2001-12-06 | 2003-06-12 | Sayling Wen | Practical chinese classification input method |
US7228267B2 (en) * | 2002-07-03 | 2007-06-05 | 2012244 Ontario Inc. | Method and system of creating and using Chinese language data and user-corrected data |
US20050010392A1 (en) * | 2003-07-10 | 2005-01-13 | International Business Machines Corporation | Traditional Chinese / simplified Chinese character translator |
US20050010391A1 (en) * | 2003-07-10 | 2005-01-13 | International Business Machines Corporation | Chinese character / Pin Yin / English translator |
US20050027547A1 (en) * | 2003-07-31 | 2005-02-03 | International Business Machines Corporation | Chinese / Pin Yin / english dictionary |
US8137105B2 (en) | 2003-07-31 | 2012-03-20 | International Business Machines Corporation | Chinese/English vocabulary learning tool |
US7359850B2 (en) * | 2003-09-26 | 2008-04-15 | Chai David T | Spelling and encoding method for ideographic symbols |
US7260780B2 (en) * | 2005-01-03 | 2007-08-21 | Microsoft Corporation | Method and apparatus for providing foreign language text display when encoding is not available |
US7889927B2 (en) | 2005-03-14 | 2011-02-15 | Roger Dunn | Chinese character search method and apparatus thereof |
US7516062B2 (en) * | 2005-04-19 | 2009-04-07 | International Business Machines Corporation | Language converter with enhanced search capability |
US7840073B2 (en) * | 2006-09-07 | 2010-11-23 | Sunrise Group Llc | Pictographic character search method |
CN101408873A (zh) * | 2007-10-09 | 2009-04-15 | 劳英杰 | 全范围语义信息综合认知系统及其应用 |
US9202460B2 (en) | 2008-05-14 | 2015-12-01 | At&T Intellectual Property I, Lp | Methods and apparatus to generate a speech recognition library |
US8862989B2 (en) * | 2008-06-25 | 2014-10-14 | Microsoft Corporation | Extensible input method editor dictionary |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5212638A (en) * | 1983-11-14 | 1993-05-18 | Colman Bernath | Alphabetic keyboard arrangement for typing Mandarin Chinese phonetic data |
US4698758A (en) * | 1985-03-25 | 1987-10-06 | Intech-Systems, Inc. | Method of selecting and reproducing language characters |
US4951202A (en) * | 1986-05-19 | 1990-08-21 | Yan Miin J | Oriental language processing system |
JPS6379164A (ja) * | 1986-09-24 | 1988-04-09 | Hitachi Ltd | 華字入力方式 |
-
1992
- 1992-10-12 TW TW081108074A patent/TW268115B/zh not_active IP Right Cessation
- 1992-10-13 US US07/959,653 patent/US5319552A/en not_active Expired - Lifetime
- 1992-10-14 CN CN92111509A patent/CN1030114C/zh not_active Expired - Lifetime
- 1992-10-14 GB GB9221588A patent/GB2260633B/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
GB2260633A (en) | 1993-04-21 |
TW268115B (zh) | 1996-01-11 |
GB9221588D0 (en) | 1992-11-25 |
US5319552A (en) | 1994-06-07 |
GB2260633B (en) | 1995-04-19 |
CN1030114C (zh) | 1995-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1030114C (zh) | 汉语发音符号/汉字变换装置及方法 | |
CN1258132C (zh) | 用于进行字母符号输入的小键盘布局 | |
CN86105610A (zh) | 使用汉语拼音的汉字数据处理和字处理的方法和装置 | |
CN86105459A (zh) | 输入处理系统 | |
CN1095560C (zh) | 修改汉字转换结果的系统 | |
CN1316689A (zh) | 汉字输入装置和方法 | |
CN86101871A (zh) | 选择和再生语言字符的方法 | |
CN1278931A (zh) | 特别适于译码数字音频信号的数字信号处理器 | |
CN1434365A (zh) | 中文字形输入装置及中文字形输入法 | |
CN1136496C (zh) | 简化拼音-触摸屏鼠标式汉字输入方法 | |
CN101055498A (zh) | 多重汉字输入方法 | |
CN1679023A (zh) | 创建和使用中文语言数据和用户自纠正数据的方法和系统 | |
CN1226692C (zh) | 基于语义语言的机器翻译系统及方法 | |
CN1510554A (zh) | 一种可嵌入应用的汉字输入法 | |
CN1040702C (zh) | 语言再现装置 | |
CN1379342A (zh) | 汉语输入变换处理装置以及汉语输入变换处理方法 | |
CN1065058C (zh) | 有辅佐外字造字功能的文件处理装置 | |
CN1102489A (zh) | 汉字变换装置 | |
CN1043541C (zh) | 汉语汉字变换装置 | |
CN1097244C (zh) | 多国语文件处理装置 | |
CN1048345C (zh) | 汉字变换装置 | |
CN1584809A (zh) | 可做拼音汉字的汉字编码的输入法 | |
CN1048346C (zh) | 词典检索装置 | |
CN1047678C (zh) | 电子汉日辞典编辑检索装置 | |
CN1838044A (zh) | 中文拼音声调笔划组合输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C15 | Extension of patent right duration from 15 to 20 years for appl. with date before 31.12.1992 and still valid on 11.12.2001 (patent law change 1993) | ||
OR01 | Other related matters | ||
C17 | Cessation of patent right | ||
CX01 | Expiry of patent term |
Expiration termination date: 20121014 Granted publication date: 19951018 |