CN1024050C - 对汉字进行编码和译码的方法和装置 - Google Patents
对汉字进行编码和译码的方法和装置 Download PDFInfo
- Publication number
- CN1024050C CN1024050C CN90101470A CN90101470A CN1024050C CN 1024050 C CN1024050 C CN 1024050C CN 90101470 A CN90101470 A CN 90101470A CN 90101470 A CN90101470 A CN 90101470A CN 1024050 C CN1024050 C CN 1024050C
- Authority
- CN
- China
- Prior art keywords
- character
- stroke
- unit
- basic strokes
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000008676 import Effects 0.000 claims description 49
- 238000003860 storage Methods 0.000 claims description 20
- 230000001960 triggered effect Effects 0.000 claims description 7
- 238000011084 recovery Methods 0.000 claims 3
- 239000012141 concentrate Substances 0.000 claims 1
- 238000009795 derivation Methods 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 description 58
- 238000005516 engineering process Methods 0.000 description 40
- 239000002689 soil Substances 0.000 description 27
- 150000001875 compounds Chemical class 0.000 description 20
- 230000008569 process Effects 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000003825 pressing Methods 0.000 description 3
- 239000002023 wood Substances 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/018—Input/output arrangements for oriental characters
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Character Discrimination (AREA)
Abstract
一种对汉字进行编码和译码的装置和方法,包括将一个汉字的笔划按至少在初始时与汉字手写规则相符的次序转换为一连串预先规定的三种形式的基本笔划,并确定字符中每种不同形式的基本笔划出现的初始次序以及出现的总次数,由此即可导出一个表示字符中每种基本笔划形式出现的初始次序和总次数的多元字符笔划代码,并将所存贮字符集中与此字符笔划代码相符合的每一个字符显示出来,如果字符笔划代码对应字符集中的多个字符,这时还要同时显示与每个被显示字符相关的一个附加代码元素。
Description
本发明涉及对汉字进行编码和译码的方法和装置。特别是,本发明涉及这样一种对汉字进行编码和译码的方法和装置。其中,对每个汉字进行分析确定在依照汉字手写规则的笔划顺序将汉字笔划转换为三种预先规定的基本笔划元时每个笔划出现的起始顺序以及每种笔划出现的次数,从而对某个汉字得到表示其每种笔划出现的起始顺序和次数的多元码。在大多数情况下,以上述方式得到的代码可能对应多个汉字,此时可在原有码的基础增补一个附加码,从而得到能唯一定义这一汉字的一个扩展码。当将本发明的装置和方法与一个可适当编码的计算机系统一起使用时,可以对汉字进行快速而有效的编码和译码,从而使用户在诸如字处理、电子词典或字符校对、打印、电子出版之类的诸多应用中能对汉字进行输入、存贮、显示、处理、修正、打印或者输出。
由香港商务出版社出版的《现代汉语字典》(第26版)包括七千多个字,每个字由一个或多个符号来定义。显然,包容如此大量字符的一种语言使人们、特别是那些没有高水平熟练掌握中文书写能力的人,在书写交流方面遇到了困难。
此外,一个单一的汉字可能包括(1)到(30)笔划,手写汉字时书写的笔划次序由汉字手写规则决定,熟悉书写汉语的人对此非常了解。再者,为了在打印或书写字符时看起来匀称、协调,不管其笔划多少,每个汉字的字宽和字高都应基本一致。例如表示英文“Sun”意思的汉字“日”有4划,表示英文“chicken”的意思的汉字“鸡”有20划。然而,当打印或书写这两个字时,其字宽和字高必须大体相
同。因此,当许多字符在同一文本中出现时,笔划多的字符其笔划必须要比笔划少的字符的笔划少一些。换名话说,在同一文本中,不同的汉字可能要求不同的笔划尺寸。这一要求对设计汉字编码和译码系统提出了新的问题。
以往已经提出过许多对汉字进行编码和译码的系统。例如,在美国专利4559615中,Goo等人揭示了一种对汉字进行编码、存贮和选取的方法及装置,其中根据所谓的“四角编码方法”对汉字在某种程度上进行了分析,从而对应每个字符取得了一个七位编码数。然而,四角编码法很复杂,因此,如果被分析的字符不具有确定的字根或如果字符的角笔划没有明确的定义的话,Goo等人所揭示的方法就很难推广应用。因此,需要有一种有存在四角编码法的复杂性及问题的对汉字进行编码和译码的技术。
因而,本发明的目的之一就是在不采用四角编码法的前提下提供对汉字的编码和译码。本发明的一个特征就是将一个汉字的笔划转换为三种预先确定形式的基本笔划元,这种转换按至少在某种程度上由汉字手写规则确定的次序进行。汉字可由一种多元码代表。这种多元码表示被编码的汉字中每种不同形式的基本笔划出现的初始次序以及每种形式的基本笔划出现的总次数,在某些情况下,要在这种码中加上一个附加码元,从而获得一种与被编码的字符有单一对应关系的扩展码。
Shojiam等人的美国专利4,718,102、Crane等人的美国专利4,718,102以及Odaka的美国专利4,284,975分别指示了应用图形识别技术对汉字进行编码和译码。然而,采用Shojiam、Crane、或Odaka等人的技术,用户需要输入字符图形或字符的笔划元素,然后,将其与一组预先存贮的关于汉字或笔划元素的模型或参考图形进行比较。此外,通常通过笔划记录设备来输入图形常常是很难实现的,这是因为不同用户书写汉语的技巧和书写笔划形式可能是各不相同
的。
同样,Monroe等人的美国专利4,829,583和Kimura等人的美国专利4,755,955揭示了采用与正被进行编码和译码的字符的笔划相关的座标值对表意字符编码和译码的技术。然而,所揭示的技术使用起来很困难,并且在很大程度依赖于用户在标准书写时对汉字笔划座标的确定技能,这是因为对一个字符所输入的笔划座标必须与所存贮的参照字符的笔划座标非常一致。因此,需要有这样一种对汉字进行编码和译码的技术,它不需要用户具有高水平的汉字书写技能,并且避免了对一个要编码的汉字将其笔划图形或笔划座标与存贮的参照字符的笔划图形或笔划座标进行比较的工作。
因此,本发明的另一个目的是提供一种对汉字进行编码和译码的装置和方法,它不需要用户具有高水平的汉字书写技能,并且不是基于将被编码的字符的笔划图形或笔划座标与参照字符的笔划图形或笔划座标进行比较的工作。
Lee的美国专利4,462,703和Leung等人的美国专利4,379,288两者都指示了一种采用传统键盘代表汉字组成笔划和字根的技术,这些技术要求用户在对字符编码时严格地依照汉字手写规则所规定的字符笔划顺序。同样,Chiu的美国专利4,689,743揭示了一种对表意文字、如汉字,进行编码和确认的技术。为了对一个字符编码,Chiu要求将字符的每一组成笔划根据对这类汉字所建立的手写规则按正确的顺序输入到Chium装置。然而,对于不具备高水平书写表意文字能力的用户来说这是很难完成的。因此,需要提供一种对表意文字、如汉字、进行编码和译码的技术,它不需要用户去了解要编码的字符的每一笔划的正确次序。
本发明的另一个目的是要提供一种对汉字进行编码和译码的装置和方法。对要编码的字符,除其最初的几个笔划以外,其余都不必严格依照汉字手写规则的笔划顺序。本发明的一个特征是在编码
为两种不同形式的基本笔划元以前,将要编码的字符笔划转换为预先规定的三种形式的基本笔划元时需要依照由汉字手写规则确定的笔划顺序,此后剩下的任何笔划都可以以任意次序转换为基本笔划。以此方式,那些汉字书写技能水平较低的用户也可以将汉字输入给数据库并将其从数据库中检索出来。
Feng的美国专利4,669,901和王永民的美国专利4,684,926也揭示了采用键盘方式对汉字编码和输入的技术。王永民的技术中采用了五种基本笔划,并且根据字根出现率分布来选择字根。Feng系统中包括一个键盘,其中含有代表所选择笔划、笔划组合、词根和其它字符元素的键。然而无论是Feng还是王永民,他们都没有揭示这样一种对汉字进行编码或译码的技术,即将字符首先全部或部分地转换为一连串预先规定的基本笔划元形式,然后在此转换基础上对字符编码或输入。
本发明另一目的就是提供一种对汉字进行编码和译码的装置和方法,它不需要确定字符的笔划出现率或笔划组合。本发明通过将每个汉字的笔划转变为三种形式的基本笔划元,并对每个作了这种转换的汉字确定三种基本笔划元的初始出现次序和出现次数,从而有利地实现编码和译码。
本发明的再一个目的是提供一种对汉字进行编码和译码的装置和方法,它能快速、有效地实施字符输入、存贮以及从一个数据库系统中将字符检索出来。
本发明的其它目的、特征和优点可由下面结合附图对实施例的详细描述反映出来。
根据本发明,将一个汉字的各笔划中逐次转换成一个基本的横笔划元一,一个基本的竖笔划元丨,一个既非水平也非垂直的基本的斜笔划元/或一连串的这种基本笔划元,这种转换次序至少在某种程度上已与确定的汉字手写规则相符合,由此导出一种能代表字
符中每种形式的基本笔划元初始出现的次序和出现次数的字符笔划码,这种代码具有多种代码元素。由此,与字符笔划代码相应的每个字符即可从一个预先存贮的字符集中检索出来并加以显示。当与一个字符笔划代码相应的多个字符被显示时,还要显示与每个被显示字符相关的相应附加代码元素,此时,用户从被显示的字符中挑选正在被编码或输入的字符,并将与被挑选字符相关的附加代码元素加到字符笔划代码上,得到一个扩展代码,此扩展码唯一地定义了要被编码或输入的字符。
本发明的一个实施例包括一个可适当编程的计算机,其中含有一个大容量存贮器,一个键盘、一个可任意选择的写入填充盘、一个阴极射线管(CRT)或相应的显示设备以及一个图象打印机或相当的硬拷贝输出设备。除其它功能之外,通过编程使计算机能通过键盘或写入填充盘对汉字进行编码或输入,并能对输入或存贮在计算机内的汉字或代码进行存贮,显示、处理以及译码或检索。键盘用于输入与每种形式的基本笔划元的初始出现次序和总的出现次数有关的数据,并用于输入与被显示的字符相关的附加代码元素以及控制计算机及其程序。写入填充盘可以用来通过至少在最初按照汉字手写规则确定的次序在写入填充盘的表面划出字符的实际笔划的方式来直接输入字符的笔划。通过将字符的每一笔划转换为一个相关的基本笔划或一连串相关的基本笔划元,可以导出表示字符中每种形式的基本笔划元出现的初始次序和出现的总次数的字符笔划码,计算机中的程序即与按上述方式划在写入填充盘表面的汉字的笔划相对应。与字符笔划码相对应的每一字符从存贮在计算机存贮器中的字符集中检出并显示在CRT上。如果字符笔划码对应所存贮的字符集中的不止一个字符,那么此时CRT屏幕上还同时显示与所显示的字符相关的附加代码元素。当不止一个字符被显示出来时,用户可通过键盘输入与要选择的字符相关的附加代码元素从而可以被
显示的字符中选择出来要编码的字符。输入计算机中的编码字符可以被存贮起来并随后进行检索和译码显示、处理或打印机打印。
本发明的装置和方法可以使得对书写汉字只有相对较低技能水平的用户实现对汉字的快速和有效地编码和译码。根据本发明,为了对一个字符进行编码和译码,当字符笔划依照汉字手写规则所规定的次序转换为基本笔划元时,用户只需了解两种不同形式的基本笔划的最初出现次序,随后的笔划可以不考虑手写规则进行编码。
下面对附图进行简要说明:
图1表示根据已知的汉字手写规则书写汉字时的笔划次序实例;
图1A是根据本发明一个实施例的一个系统硬件构成示意图;
图1B是根据本实施例,由图1A系统中的计算机程序所确定的信号流程图;
图1C是根据本实施例,与图1A系统计算机中的一部分程序相关的流程图;
图2是图1A系统中的写入填充盘的感应元件的配置平面视图;
图3是使用图1A系统中的写入填充盘的示意图;
图4表示了图1A系统中写入填充盘感应元件的联接关系;
图5a-5c表示采用图1A系统的写入填充盘输入一个汉字的三种例子:
图6是图1A系统的键盘及各个键的标识平面图;
图7是采用图1A系统的键盘通过输入字符的笔划座标输入汉字的示意图;
图8是一个表格,它表示一些通用的简单笔划,这些笔划用于一个字符中的例子以及根据本发明每一简单笔划与基本笔划元的对应关系;
图9的表格描述了另外一些常用的简单笔划,各上述笔划用于一个字符的例子以及它们与基本笔划元之间的对应关系;
图10的表格描述了用于汉字中的一些复杂笔划、每一个这种复杂笔划是如何应用于汉字以及依据本发明将每一个这种复杂笔划转换成一串基本笔划元的例子;
图11的表格描述了用于汉字的复合笔划、这些复合笔划在汉字中的应用以及将这些复合笔划根据本发明转换为一连串基本笔划元的例子;
图12的表格表示了用于图1A系统中标准字母数字键盘各个键上的笔划元、字根和笔划元组、以及它们相应笔划代码的分配情况;
图13A表示根据图1A、1B和1C的实施例,与所存贮字符集中字符笔划代码2-1丨0/相应的所有字符以及和每一被显示字符相关的附加代码元素的显示情况;
图13B示出根据图1A、1B和1C的实施例,与要被编码或输入的字符相应的扩展码。
下面将详细地描述本发明的装置和方法。
说明书和权利要求书中所用的“笔划”一词(除表达“复合笔划”中的“笔划”以外)表示这样一种汉字成分,即不必将书写工具从正在书写汉字的表面提起来就能完整地划出或写出的汉字成分,例如,如图1所示,汉字“凡”有三个笔划,汉字“鸟”有10个笔划。
说明书和权利要求书中提及的汉字手写规则是指在中国小学校中所教的确定的手写规则,这些手写规则在Wong的美国专利4,505,602中作了描述,这里将其作为参考文献。在不考虑任何特例的情况下,简单地说,人们在根据汉字手写规则书写汉字时通常是从左至右、从上至下。如果一个字符左右侧笔划相同时,那么就先写中间笔划。但熟悉书写汉字的人知道上面的一般规则确有某些例外
存在。
在本发明中,对一个汉字至少在其最初的笔划次序中依照汉字手写规则将汉字的笔划转换为基本笔划元,并确定不同形式的基本笔划元初始出现的次序以及每一种形式的基本笔划元出现的总次数。在说明书及权利要求书中所用到的“基本笔划元”一词代表下述三种笔划元:横笔划元一、竖笔划元丨和斜笔划元/。一个字符的每一笔划都必须首先转换为三种基本笔划元之一或以上或一连串的基本笔划元,对此,下面将作进一步的解释。对字符进行分析,从而确定基本笔划元的数目、形式和次序,而不必考虑字符的复杂程度。因此,在实施本发明时,一个给定字符所包含的基本笔划元数是不受限制的。
根据本发明,如果一个字符中的某一特定笔划元或一部分一般说来既不是一横线也不是一竖线的话,那可将其认为是一种基本斜笔划元/。因此,如图9所示,各种非横非竖的笔划或笔划部分,诸如“/”、“,”、“丶”“丶”及弯曲笔划,都被认为是基本斜笔划元/。字符中每一种对应于三种基本笔划元之中单一一种的笔划称作为一种“简单笔划”。
许多汉字中都包括不能对应于单一基本笔划元的笔划,这种笔划称之为“复杂笔划”,当对一个具有一个或多个复杂笔划的汉字进行编码或译码时,根据本发明,这些复杂笔划将按图10所示的方式被转换为一连串相应的基本笔划元。此外,许多汉字中都包含有复合笔划,这中复合笔划是不止一个笔划的笔划组,它们形成一个字符的一部分,但并不是一个完整的字符或字根,根据本发明,在对具有一个或多个复合笔划的汉字进行编码或译码之前,这些复合笔划将按图11所示的方式被转换为一连串相应的基本笔划元。在说明书和权利要求书中提到的将非横和非竖简单划或笔划部分转换为基本斜笔划元、将复杂笔划转换为一连串基本笔划元以及将复合笔
划转换为一连串基本笔划元分别是指图9、图10和图11例子中所示的转换。
通过至少在最初是按照汉字手写规则所确定的次序对汉字的笔划进行转换来确定字符的不同基本笔划或笔划部分的形式(如一、丨和/)出现的初始次序或顺序。从而,根据本发明,一个汉字其三种形式的基本笔划元出现的初始次序可以是下述6种可能形式中的一种,即:一丨/、/一丨、一/丨、/丨一、丨一/或丨/一。例如,依照汉字手写规则,汉字“日”的笔划为丨]-,当按上述方式将其转换为基本笔划元后,可得到基本笔划元次序为丨-丨-,其不同的基本笔划元形式出现的初始次序为丨-/。请注意,在汉字“日”中虽然没有可以转换为基本斜笔划元的笔划存在,但在汉字“日”的基本笔划元形式出现的初始次序中基本斜笔划元是其中一部分。汉字“土”依照汉字手写规则的笔划次序为一丨一,当这些笔划转换为基本笔划元时,可得到基本笔划元次序为一丨一,基本笔划元形式出现的初始次序为一丨/,由于编码格式的原因,在基本笔划元形式出现的初始次序中再次出现了汉字基本笔划元次序中不存在的基本斜笔划/,对此下面将会作一步的解释。
“日”和“土”是两个简单字符,它们既有自身的意义,同时又各自可能是另一更复杂字符的一部分,大量的汉字可由两个或多个简单字符组合而成。作为另一个字符的一部分的简单字符通常称之为“字根”。如果一个字根位于一个字符的开头部分,通常称其为一个“偏旁”符号(这里“偏旁”并不是指位置,而是指根据汉字手写规则,此符号是字符最先写出的部分)。为简单起见,作为一个字符最先写出部分的一个字根,如偏旁符号,在说明书和权利要求中称之为“首字根”(RooT);如果一个汉字的一个简单字符组成单元不是这个汉字最先写出的部分时,在说明书和权利要求书中就称之为“余字根”(root)。
本发明的编码和译码技术采用了三种预先确定的基本笔划元、首字根(RooT)、余字根以及汉字书写规则。根据本发明的一个汉字编码例子是对汉字“地”的编码,这个汉字包括首字根“土”和余字根“也”,由汉字手写规则,首字根“土”的笔划以一丨一划出,而余字根“也”的笔划顺序为丨L。当这些笔划次序转换为基本笔划元次序时,考虑到要首先写首字根“土”,“地”的基本笔划元次序为一丨一丨/丨丨一/,因此,其两种基本笔划元形式出现的初始次序为一丨/,这里基本斜笔划元在字符的基本笔划元次序中确实存在,但不包括在基本笔划元形式的最初出现次序中。
在另一个例子中涉及一个较复杂的汉字“智”,它由首字根“矢”和余字根“口”与“日”构成。根据汉字手写规则,首字根“矢”的笔划顺序为/-/\,其次所写的字根“口”的笔划次序为丨一,最后所写的字根“日”的笔划次序为丨一。因此,根据汉字手写规则,汉字“智”的笔划次序为/-/\丨一丨一,当将其转换为基本笔划元时,要得到下面的基本笔划元次序:/一//\一丨一丨一丨一,其中各种形式的基本笔划元初始出现的次序为/一丨。由上述例子可以看出,要得到字符中所有三种形式的基本笔划元出现的初始次序,只需要确定一个字符中最初两个不同形式的基本笔划元的出现次序。
要导出与被编码或译码的字符相关的字符笔划码还需要用到每种基本笔划元出现的总次数。在前面所举的例子中,汉字“智”包含三个斜笔划/、七个横笔划一和四个竖笔划丨,从而其相应的字符笔划码为3/7-4丨。可以看到,该代码表示了汉字“智”中各种不同形式的基本笔划出现的次序(根据汉字手写规则)和每种形式的基本笔划元出现的次数。
在上述例子所导出的字符笔划代码可能与存贮在计算机内的字符集中的多个字符对应,因此,当得到一个字符笔划码后,需要检查字符集中与字符笔划码相应的每个字符,在出现字符笔划码对应
字符集中多个字符情况下,用户必须从存储的字符集内相关的字符中选择要被编码的字符,并将与被选择字符相关的另一代码元素加到字符笔划代码上,从而得到一个与要被编码的字符一一对应的扩展码。通常,如果字符笔划码对应所存贮字符集中的多个字符,那么与要被编码的字符相应的扩展字符笔划代码可能具有如下某种形式:X|Y-Z/*、X丨Z/Y-*、Y-X|Z/*、Y-Z/X|*、Z/X|Y-*、Z/Y-X|*,其中,X是竖笔划元丨出现的总次数,Y是横笔划元一出现的总次数,Z是斜笔划元/出现的总次数,而*,如果有的话,是与要被编码的字符相关的附加代码元素。此要被编码的字符是从所存贮字符集中与字符笔划码对应的字符中选择出来的。上述字符笔划码是通过对笔划进行研究分析而导出的。
可以看到,在许多情况下,通过笔划分析所导出的字符笔划码将确定所存贮字符集中的唯一一个字符,这是只有一个字符被显示出来,不需要任何附加代码元素,字符笔划代码即可唯一地定义要被编码的字符。根据本发明,对与字符基本笔划元代码相应的字符进行检查来选择要被编码的字符和增加与要选择的字符相关的另一代码元素将在下面作进一步的描述。
采用上面所描述的汉字编码技术,对要编码的汉字,用户只需了解一个字符按汉字手写规则的最前面七个笔划,就能对“现代汉语字典”中90%以上的字符进行编码或译码;用户只需了解一个字符按汉字手写规则的最前面三个笔划,就能对“现代汉语字典”中80%以上的字符进行编码或译码。根据本发明,对要编码或译码的字符一旦其几种不同形式的基本元的初始出现次序确定后,不必考虑任何笔划次序就可以确定每种形式的基本笔划元出现的总次数。因此,除了极其简单的字符之外,根据本发明的编码和译码技术,用户不必知道要被编码和译码的字符按照汉字手写规则的全部笔划次序。
在一个实施例中,本发明的方法和装置被用于一个带中文版输入、处理、存贮、检索、显示和输出设备的计算机系统中,如图1A、1B和1C所示。参照图1A,系统中包括:带有一个磁盘驱动器的计算机1、传统的键盘2、备用写入填充盘3、CRT显示器4和图象打印机5。计算机1被编程用于控制汉字的编码和译码以及汉字的存贮、处理、检索和打印。键盘2用于输入与基本笔划元有关的数据并对由计算机程序所提供的功能进行控制。写入填充盘3(如果采用的话)可以通过直接在其上划出汉字的笔划来输入汉字,CRT显示器对与交互作用的汉字编码、译码、存贮、检索、处理和输出以及对与系统功能交互作用控制有关的字符和代码提供适当的显示。图象打印机5在程序控制下对存贮在计算机中的字符或代码提供硬拷贝输出。
根据本发明,对于包括有诸如与前述“现代汉语字典”中所有字符相关的图形数据和与每个字符相关的字符笔划码的适当的汉字集中的字符数据被存贮在计算机1的存贮器内,为简单起见,这些字符数据称为“存贮的字符集”。熟悉计算机编程技术的人会知道,这种字符数据可以各种不同的方式,如以表格形式或作为程序的一部分,输入到计算机存贮器中。图1B详细地给出了本发明实施例的流程图。要被编码字符的基本笔划元首字根或余字根由写入填充盘3或键盘2输入,笔划感应器8检测输入的笔划并将其传送到一个笔划比较器9,比较器9将输入的笔划与存贮在笔划和字根存贮器10中的笔划或字根进行比较。下面我们将会解释到,一个字符在键盘2中的输入是通过输入字符的一个或多个基本笔划元、复杂笔划、复合笔划和/或字根来完成的。前面已经提过,一个字符中其它笔划或字根之前首先输入的字根称为“首字根”。为简单起见,对基本笔划、复杂笔划、复合笔划或字根的输入都通称为输入笔划。如果输入的笔划在存贮器10中没有找到,就会产生一个报警信号(如嘟嘟声)指示错误输入。如果输入的笔划在存贮器10中找到了,笔划比较器9就
将其提供给笔划元累加器11,累加器累集要被编码字符的所有输入笔划。当累加器11中有两个或多个不同的基本笔划形式时,一个“两不相同元形式笔划感应器”12就在CRT显示器4上输出一条信息:“以任何方式输入”,当此信息出现在CRT屏幕上时,用户即可不必考虑任何笔划次序将字符中的其余笔划输入。
当字符所有输入笔划都输完后,按下键盘的“,”键(“结束键”),从而使输入结束信号传送给信号控制器13。后者又起动字符代码转换器14工作。代码转换器14将输入的笔划转换为与要被编码的字符相应的一个字符代码,字符代码识别器15将此字符代码与字符代码存贮器16中存贮的代码进行比较,如果在字符代码存贮器16中没发现被转换的字符代码,那么就由代码不明处理器17在CRT屏幕上显示“是否重作(redo)?”信息;如果在存贮器16中找到了转换过来的字符代码,字符代码识别器15就启动字符数据处理机18开始工作。字符数据处理机18从字符数据存贮器19中检索出以前所存贮的、具有由字符代码转换器14所提供字符代码的一个或多个字符图形数据,并将检索出的每个字符显示在CRT屏幕4上。如果CRT屏幕4上显示出了不止一个字符,那么还要同时显示与每个字符相关的附加字母代码,此时,用户从被显示的字符中选择要被编码的那个字符,并输入与被选择出的字符相关的字母代码元素,由此即可得到能唯一对应要被编码字符的一个扩展字符代码。如果由字符代码转换器14所提供的字符码能唯一对应存贮器16中一个字符,那么对要编码的字符此时就不要加上附加字母代码元素了。
以前面方式输入的所有字符都被存贮在由程序限定的一个缓冲器中(未示出),缓冲器中的字符可被处理,传送到磁盘驱动器的磁盘中或被检索出来显示在CRT屏幕4上,在打印机5上处理或打印。显示在CRT屏幕4上的字符可通过按压键盘2(在图6中未示出)上的“打印键”由打印机5打印出来。
图1C是一个流程图(占两页纸),表示根据本发明的实施例用于控制汉字编码的计算机的一部分程序。对一个特定的计算机要将由流程图1C中确定的程序部分进行实施,对计算机编程领域内的普通技术人员来说是公知的。在本发明的实施例中,程序在Sanyo Model 17 PLUS个人计算机上用BASIC编程语言实施。
图6是本发明实施例中键盘2的各个键的标识平面示意图。为了描述时简单起见,键盘2的某些特定作用和功能键没有示出。可以看到键盘2与用作个人计算机的传统字母键盘具有同样的键格式,而基本笔划、复杂笔划、复合笔划、字根和基本笔划组都由程序分派给了各个不同的键。图12以表格形式列出了图6的键盘2中基本笔划元、复杂笔划元、复合笔划和字根在各个键中的分派(不包括在笔划组模式时将笔划组分派给最上面一排键的情况)以及通过按压各个键可产生的相应笔划码。
在“现代汉语字典”的索引页中列出了214个字根。如果每个字根对应键盘上一个键,那么键盘就会大得不可思议,用户要对一个字符进行编码就得花费大量的时间去搜寻字根。在本发明的实施例中,只有一些经常用到的字根、复杂笔划、复合笔划元、每种基本笔划元和基本元的各种组合被分派到键盘2中的不同键上,没有由键代表的其它字根和笔划可用代表各种基本笔划元的键、代表与这些其它字根和笔划“笔划等同”的字根和笔划的键以及代表基本笔划元组的键来输入。这在下面还要进一步加以叙述。
参照图6,除笔划组模式情况之外,指派给第四行(r4)从键“1”到键“=”各个键的字根和笔划都具有初始基本笔划次序/一丨;指派给第三行(r3)从键“9”到键“]”各个键的字根和笔划都具有初始基本笔划次序丨一/;指派给第二行(r2)从键“a”到键“,”各个键的字根和笔划都具有初始基本笔划次序一丨/;指派给第一行(r1)从键“Z”到键“/”各个键的字根和笔划具有不同的初始基本笔划次序,它们可用作
等同笔划,对此下面将作进一步解释。虽然图6中的键盘2中有些键代表不止一个字根或笔划,但当按下此键时,由该键所代表的字根产生相同的代码。因此,每个这样的键可用于输入其所代表的任何一个字根或笔划,然而此键按下时所产生的代码并不引与此键所代表的任何一个字根唯一对应。由上面的讨论以及下面将作进一步解释可知,当笔划输入完成后,在CRT屏幕上将显示出与由程序根据输入笔划所导出的字符笔划代码相应的一个或多个字符。在显示多个字符的情况下,每个显示出来的字符将有一个相关的字母(即一个附加代码元素)同时显示。当不止一个字符在屏幕上显示时,用户从所显示的字符中选择要被编码的那个字符,输入与被选择字符相关的字母,从而获得能与被编码字符唯一对应的一个扩展字符笔划码。
在说明书和权利要求书中所用到的“笔划等同”(Stroke equivalents)表示那些没有由键盘2上的键所表示出的基本笔划元的组合、笔划或字根,但它们与键盘2上的一个键所代表的笔划或字根具有相同的每种基本笔划形式出现次数(不一定具有相同的每种基本笔划形式的初始出现次序)。因此,由图6键盘2的键所代表的基本笔划元、复杂笔划、复合笔划和字根、包括系统处于笔划组模式下由r4的键所代表的基本笔划组,加上由同样的键输入等同笔划,至少在“现代汉语字典”中的所有汉字可以由图6所示键盘配置来进行编码和译码。
例如,汉字“日”的基本笔划元次序为丨一丨一,相应的字符笔划代码为2丨3-0/,这在前面已作过解释。汉字“正”的基本笔划元次序为一丨一丨一,相应的字符笔划代码为3-2丨0/。以上两个字笔划等同,但它们的字符笔划代码并不相同,这是因为虽然两个字符的每种基本笔划元形式出现的总次数是一样的,但它们的基本笔划元形式出现的初始次序是不相同的。
在利用等同笔划的另一个例子中,汉字“歪”具有一个首字根
“不”和一个余字根“正”,首字根“不”中键盘2中没有任何键表示,但它可以通过使用“b”键(根据图12,它代表一个一笔划元和一个/笔划元)和“n”键(根据图12,它代表一个丨笔划元和一个/笔划元)来输入,因此,“不”的总笔划对应于字符笔划代码1-2/1丨,字根“正”可用代表字根“日”的“t”键输入,因为“日”和“正”是笔划等同字。可以看到,因为基本笔划元形式出现的正确初始次序(即一/丨)是由输入首字根“不”时建立的,所以在输入“正”的笔划时不必考虑它的其余基本笔划元次序。因此,字根“正”可由输入其它字符等同字“日”来完成。
根据附图12,由“t”键所代表的字符笔划代码是2丨3-0/,因此,由首字根“不”的基本笔划元形式初始出现次序和由首字根“不”和余字根“正”的基本笔划出现次数之和就可以确定字符“歪”的字符笔划代码,即4-2/3丨。单以字符“正”的编码可通过使用笔划等同来实现,因为在键盘2上没有代表字符“正”的基本笔划元形式出现的初始次序和每种不同形式的基本笔划形元出现次数的键。然而,因为字符“正”有三个一笔划元和两个丨笔划元,根据汉字书写规则,其上述两个两上初始笔划出现的初始次序为一丨,因此通过按压提供笔划代码3-0丨0/的“a”键和提供笔划代码2丨0-0/的“X”键就可对字符“正”编码。
当两种不同形式的基本笔划元被输入后,笔划等同的使用就更为便利了。例如,在前面描述对汉字“正”的编码时,先按“a”键,产生笔划代码3-0丨0/,与汉字“正”的基本笔划元形式的/,当此代码与第一个代码组合在一起时,就得到了汉字“正”的正确字符笔划代码3-2丨/。按压键盘2上代表具有多种基本笔形元形式的一个字根或笔划的任何键时,会导致计算机1中的程序在CRT屏幕上输出“以任何方式输入”的信息,以告之用户字符的剩余笔划可以任何次序输入而不必考虑汉字手写规则。
请注意,在图6所示的键盘上,除了“Z”、“X”、“C”、“V”、“a”、“q”、“1”和“2”键之外,在r1-r4各行的其它键所代表的字根每一个都具有多种形式的基本笔划元。因此,如输入字符过程中按下这些键中的其中一个时,字符中任何剩下的笔划都可以不必考虑笔划次序来输入。
在本发明的实施例中,要输入一个具有一个首字根和一个或多个余字根的字符,在模式选择时,用户首先通过按压“T”键将计算机置于“T模式(打印模式)。一旦处于“T模式”,用户就按压代表首字根的键,如果由所按压的键所代表的首字根包括两种或多种基本笔划元形式,那么用户即可不必考虑笔划次序将字符其余的任何笔划输入,包括按压代表字符任何余下字根的适当键。
然而,如果首字根由相同形式的基本笔划构成时,程序将产生一个相应的笔划码,它不仅指示基本笔划元出现的次数,而且还指示出其它基本笔划元形式出现的预先规定的错误次序,如图12中所示的“a”“c”“q”“v”“x”和“z”键。这时,如果接着要输入的笔划或字根与只有一种基本笔划元形式的首字根相比具有不同的基本笔划元形式初始出现次序时,那么就不能通过按压与之相应的键来输入。这时,要将紧接着字根再输入的余字根分解为基本笔划,用图6键盘上的基本笔划键(即“;”“1”“=”键)来输入,直至将一个与先编码的首字根中所包括基本笔划元形式不相同的基本笔划元形式输入为止。在此之后,余下的其它笔划就可以按任何次序或方式输入,包括使用代表字符任何剩余字根的键。
例如,在对具有一个首字根“日”和余字根“月”的汉字“明”进行编码或输入时,首字根包括两种不同形式的基本笔划元,即一和丨,这时,一旦通过按压键盘上的“t”键对首字根编码或输入后,那么“明”字剩下的笔划就可以任何方式或次序输入。这时最好是通过按压代表余字根“月”的键来完成。但是要对汉字“油”编码或输入则要
采用不同的步骤输入,这个字符有一个复合笔划“氵”和一个余字根“由”,复合笔划“氵”中只包含一种形式的基本笔划元,即三个斜笔划/,按压对应于复合笔划“氵”的“V”键启动程序产生一个笔划代码3/0-0丨,并显示在CRT屏幕上。这个笔划代码建立了一个错误的基本笔划元形式初始出现次序/一丨。然而,根据汉字手写规则,其后的字根“由”并没有同样的初始出现次序的其他两种基本笔划元形式,因此余字根“由”不能通过按压“P”键来输入,而是必须将其分解为基本笔划元次序丨一丨一丨一,并通过首先按“l”键或“q”键输入,这两个键分别代表一个或三个垂直基本笔划元(即丨或丨丨丨)的出现,其形式不同于复合笔划“三”,此后,余字根中剩余的其它基本笔划可以任何次序输入。
图6所示键盘2中的键可用于在系统处于笔划组模式下通过利用键盘2中r4行的笔划组键来编码或输入汉字。如图6所示,r4行中的笔划组键代表三种基本笔划元形式中每一种的1、2、3或4次出现。要采用笔划组键,用户在输入模式选择时可通过按压“S”键来选择“S”(笔划组)模式,从而导致被编码的模块与各笔划组键相对应。
写入填充盘3可用来代替键盘2或与键盘2联合使用来编码或输入汉字。如图2所示,写入填充盘由规则配置的多个感应元件6构成,每一感应元件都可由用户单独触发来提供相应的输出信号。感应元件可以是光敏感应设备、电容感应设备、磁感应设备或其它诸如机械开关之类可由用户各个触动的设备。
如图2和图3所示,感应元件按多行和多列布置,它们之间的连接关系示于图4。在本实施例中,写入填充盘的各个感应元件都是机械开关,标有A、B、C、D、E和F的感应元件的开关分别与键盘2上“a”、“b”、“c”、“d”、“e”和“f”键的关开并联。
参见图3,当横跨写入填充盘前三列对元件A、B和C进行触发
时,计算机1的程序检测出由这些感应元件的触发所产生的输入信号并将这些信号译为基本横笔划元一;当顺着写入填充盘的第二列对元件B、E和B进行触发时,计算机1的程序检测由这些感应元件的触发所产生的输入信号并将这些信号译为基本的竖笔划元丨;当从写入填充盘的第一例第一行到第三行第三例对感应元件A、E和C进行触发时,计算机1的程序检测由这些感应元件的触发所产生的输入信号并将这些信号译为基本的斜笔划元/。此外,从写入填充盘的第一行第三列到第三行第一列对感应元件C、E和A进行触发、或对不到三个相邻感应元件-无论是沿垂直、水平还是沿对角线方向-进行触发时,也由程序翻译为一个基本斜笔划元/。
为操作简便起见,写入填充盘可以是具有多于3×3个元件的相对较大的配置。这样,用户对字符基本笔划元的输入过程与用户在写入面划出这个字符的过程相类似。在写入填充盘的一个实施例中,感应元件的配置是9×9,这样在输入大多数汉字时,配置中的任何行、列或对角都不必用于一个以上的汉字笔划。具有较大配置的感应元件的联接与图4所示的方式相同。
要利用写入填充盘编码或输入一个字符,用户可以在写入填充盘的表面上划写字符,正如使用书写工具在一书写面写汉字一样,图5C中示出了书写汉字“日”的例子。然而利用写入填充盘输入一个字符时,并不需要在感应元件的配置上实际划出这个字符,用户只需在写入填充盘表面任何地方划出这个字符的所有基本笔划元,如图5a和5b所示。基本笔划可以任何次序划出,只要保证不同基本笔划元形式划出的初始次序与字符按汉字手写规则所确定的笔划次序中基本笔划元次序相同。根据上面的讨论,一个基本横笔划元一可通过在写入填充盘表面对三个或三个以上水平连续的感应元件进行触发来输入,一个基本的竖笔划元丨可通过对三个或三个以上垂直相邻的感应元件进行触发来输入,一个基本斜笔划/可通过对三个或三
个以上对角相邻的感应元件进行触发或对两个以下相邻感应元件进行触发来输入。如图5b所示,同一感应元件组可多次使用来输入多次出现的同一基本笔划形式。
在汉字“日”这一字符例子中,根据汉字手写规则其笔划和笔划次序为丨一,根据前面所作的解释,复杂笔划可转换为基本笔划元次序一丨,因此,“日”的基本笔划元次序为丨一丨一,而且竖笔划元丨出现了两次,横笔划元一出现了三次,斜笔划元/则没有出现。因此,在利用写入填充盘输入字符“日”时,用户按次序先划竖笔划元丨,接着划基本横笔划元可在写入填充盘的任何地方划出,而具有同样形式的基本笔划元可通过触发同一感应元件组将其叠和在一起,如图5b所示。
图5a、5b和5c示出了利用写入填充盘3将汉字“日”输入到图1A系统的三个例子,当字符的基本笔划元划出时,计算机1及其程序对来自写入填充盘3的感应元件中的输出信号作出反映,产生一个与所划出的基本笔划元相应的字符笔划代码2丨3-0/,这一代码被显示在CRT屏幕上,同时显示的还有存贮在计算机1的字符集中与此字符笔划代码对应的每一字符。此字符笔划代码表示字符具有一个初始基本笔划元次序为丨一/,有两个竖笔划元丨,三个横笔划元一,没有斜笔划元/。对于那些作中文文章而不是从一份文件中抄录文章的用户来讲,写入填充盘的使用更具优势,因为这样的用户只需将他(她)们所需的每个字符划出来输入到图1A、1B和1C的系统中。要输入的字符在划字符的工作结束后从显示在CRT屏幕4上的字符中选出。
本发明可通过下面的例子作更进一步的描述,这些例子并不以任何方式对本发明进行限定。
例1示出了利用键盘2中的键对汉字“土”进行输入的译码的五种技术,字根、笔划和笔划组的分派示于图6并详细地表示于图12
中(在S模式下对r4行键的分派除外)。当开始工作时,计算机1中的程序将其所提供的各种输入模式选择单显示在CRT屏幕4上,用户可通过按压键盘上的适当键来选择一种输入模式。在图1A,1B和1C的实施例中对一个字符进行输入的各种不同技术如下:
A:字符被完全转换为基本笔划元,然后按汉字手写规则所确定的次序对基本笔划元进行输入。要采用这一技术,用户可通过按压键盘上的“T”键来选择“打印”模式,在这种模式下,r1-r4各行的所有键都可用来输入笔划和字根。
B:字符被分解成一个首字根和一个或多个余字根、笔划和/或笔划等同,然后根据汉字手写规则进行输入。这一技术也需要在“打印”模式下采用。
C:字符被完全转换为基本笔划元,然后根据汉字手定规则的次序按笔划组织进行输入。采用这一技术时,用户可通过按压键盘2上的“S”来输入“笔划组”模式,在这种模式下,只有r4行中的数字键被用来输入各种形式基本笔划元的适当笔划组。
D:对要输入的字符用户用眼睛作番研究,确定各种形式的基本笔划元出现的初始次序,数出每种基本笔划元形式出现的次数,从而导出字符的字符笔划代码,以此方式导出的字符笔划代码通过键盘2被直接输入给计算机1。采用这种技术时,用户在各种输入模式选择单被显示出来时通过按压“M”键来选择“记忆”模式。在这种模式下,键盘2中的键只能用来输入相应的字母、数字和特殊符号。
E:用户记住与他(她)们所要输入字符唯一对应的完整代码,并将字符的完整字符笔划代码直接输入给计算机1,采用这一技术用户仍需选择“记忆”模式。
下面是使用上述技术输入汉字“土”、“也”和汉字“森”的多个例子。
*利用技术A输入字符“土”:
当在CRT屏幕上4上显示出输入模式选择单时,用户选择“打印”模式。按照汉字手写规则,字符“土”的笔划次序为一丨一,因为这些都是简单笔划,因而可直接转换为相应的基本笔划元次序为一丨一,而不需作复杂笔划或复合笔划的转换。要输入字符“土”,用户先按“;”键;再按“1”键,最后再按“;”键,将基本笔划元次序一丨一输入。当对基本笔划元次序的输入结束后,用户按下“,”键,启动程序产生一个字符笔划代码2-1丨0/,此代码表示字符的基本笔划元形式初始出现次序为一丨/,其一笔划出现两次,丨笔划出现一次,而/笔划没有出现。程序还使输入笔划所导出的字符笔划代码在CRT屏幕4上显示出来。
如果用户对显示在CRT屏幕4上的字符笔划代码满意的话,他(她)们就按下“输入(ENTER)”键(图6中未示出)。启动程序将一个字符笔划代码以及存贮器内的字符集中与此字符笔划代码相应的每一个字符都显示出来,如图13A所示。
因为字符笔划代码2-1丨0/对应存贮的字符集中的四个字符,这四个字符都被显示在CRT屏幕4上,和每一个字符同时显示的是一个相关的字母(附加代码元素)。用户从所显示的字符中选择要输入的那个字符,并输入与所选字符相关的字母,这些相关字母被加到字符笔划代码上,提供一个扩展字符笔划代码2-1丨0/C,该代码与要输入的字符唯一对应。
在本例子中,与字符“土”一起显示的相关字母为C,因此,用户按压键盘上的“C”键启动程序产生一个唯一对应字符“土”的完整字符笔划代码2-1丨0/C,然后按压“输入”(ENTER)键(图6中未示出)将这个完整代码存贮在缓冲器中。CRT屏幕4上的显示从图13A所示的显示变为图13B所示的显示,即只要显示一个字符“土”。这时程序返回输入状态,准备对另一字符进行输入。
当笔划输入完成后,如果用户对字符笔划代码或与之相应的字
符不满意的话,他(她)可按压“/”键(图6中未示出)将所有原先输入的笔划删掉并充许用户重新输入与他(她)想要输入的字符相关的笔划数据。按此方式,用户可在对一个字符的笔划输入过程结束以前用眼睛检查每一个字符笔划码。
*利用技术B输入字符“土”:
当表示各种输入模式的选择单在CRT4屏幕上显示出来时,用户按下“T”键来选择“打印”模式。因这字根“土”是由键盘2上的“S”键所代表的,如图6和图12所示,用户按压“S”键并接着按压“,”键,启动计算机1中的程序产生并显示字符笔划代码2-1丨0/,随后获得并存贮能唯一对应字符“土”的完整字符笔划代码2-1丨0/C的过程与前面在利用技术A输入字符“土”时所描述的过程相同。
*利用技术C输入字符“土”:
当表示各种输入模式的选择单在CRT4屏幕上显示出来时,用户按压“S”键选择“笔划组”模式。字符“土”有两个一笔划元和一个竖笔划元丨,由笔划转换所得到的基本笔划元次序一丨一符合汉字手写规则,按此规则所确定的字符“土”的笔划次序为一丨一。在笔划组模式下,用户按压“2”键和“5”键,前者代表由两个横笔划元一所构成的一个笔划组,后者代表一个竖笔划元丨,再按压“,”键,从而启动计算机1中的程序产生并在CRT4上显示字符笔划代码2-1丨0/。随后获得并存贮能唯一对应字符“土”的完整字符笔划代码2-1丨0/C的过程与前面利用技术A输入字符时所描述的过程相同。
*利用技术D输入字符“土”:
当表示各种输入模式的选择单在CRT4屏幕上显示时,用户按压“M”键选择“记忆”模式。通过用眼睛对字符“土”进行检查,用户可确定其基本笔划元的各种不同形式的初始出现次序以及各种基本笔划元形式出现的次数,从而可通过心算推导出其字符笔划代码2-1丨0/,要注意到,虽然字符“土”中没有斜笔划/,代码元“0/”必须
加到字符笔划代码上使其与程序所要求的字符笔划代码格式一致。字符笔划代码2-1丨0/可在键盘上通过依次按压“2”“-”“1”“1”“0”“/”和“,”键直接输入,在上述输入完成以后,字符笔划代码便显示在CRT4屏幕上了,随后获得并存贮能唯一对应字符“土”的完整笔划代码2-1丨0/C的过程与前面在利用技术A输入字符时所描述的过程相同。
*利用技术E输入字符“土”:
当按前面所述的方式选择了“记忆”模式后,用户根据其记忆在键盘上输入字符的完整代码。
请注意,对一个字符来说,即使可能有一种或两种基本笔划形式的出现次数为零,但由于程序的要求,字符笔划代码中都必须同时存在三种基本笔划元形式。然后,当字符笔划代码唯一对应一个字符时,以附加字母形式出现的附加代码元在完整字符笔划代码中就不存在了。
*利用技术A输入字符“也”:
用户首先按前面所描述的方式选择“打印”模式。由汉字手写规则所确定的“也”的笔划和笔划次序为]丨L,第一个笔划]是一个复杂笔划,根据图10所示的表,它可被分解为基本笔划元次序一丨/,第三个笔划L也是一个复杂笔划,它可被分解为基本笔划元次序丨一丨。因此,字符“也”的基本笔划元次序为一丨/丨丨一丨,这个次序可通过依次按压“;”“L”“=”“1”“;”和“L”键在键盘上将其输入。
然后,按压“,”键启动计算机1中的程序产生字符笔划代码2-4丨1/,并将这一代码显示在CRT4屏幕上。如果用户对所显示的代码满意的话,他(她)们可按压“输入”(ENTER)键(图6中未示出),启动程序将这个代码以及在所存贮字符集中与这个字符笔划代码对应的每一个字符在CRT4屏幕上显示出来。如果有不止一个字符被显示出来则与每一个被显示字符相关的一个相应字母也出现在
CRT4屏幕上。此时,用户从被显示的字符中选择字符“也”并在键盘2上输入与被选择字符相应的字母从而启动程序产生并存贮一个能唯一对应此字符的扩展字符笔划代码。
*利用技术B输入字符“也”:
字符“也”的三种笔划]丨L在键盘2上分别由“d”“l”和“W”键代表。因为笔划]在转换为一连串基本笔划元时包括了所有三种基本笔划元形式,因此,一旦这一笔划被输入后,其它的笔划就可以任何次序输入。当输入笔划后,用户按压“,”键启动程序产生一个字符笔划代码2-4丨1/,并将此代码显示在CRT4屏幕上,获得并存贮唯一对应字符“也”的扩展字符笔划代码的其余步骤与前面结合技术B所作的描述一样。
*利用技术A输入字符“森”:
字符“森”包括三个相同的字根“木”,由于这三个字根是一样的,因此它们之间的输入次序是无法区分的。每个字根可由操作者按次序按压“;”“L”“=”和“=”键来输入。要输入其余的两个字根,可将前面的按键过程重复两遍。当所有笔划都被输入以后,用户按压“,”键,启动计算机1中的程序产生字符笔划代码3-3丨6/并在CRT4屏幕上显示这一字符笔划代码。获得并存贮字符“森”的完整代码的其余步骤与前面结合技术B所作的描述一样。
*利用技术B输入字符“森”:
前面提到,字符“森”有三个相同的字根“木”,根据图6和图12的表格可知,字根“木”由“g”键代表,因为这个字根在分解为基本笔划元时包括了所有三种基本笔划元形式,因此,字符“森”可通过三次按压“g”键来输入。随后用户可按压“,”键启动计算机1中的程序产生字符笔划代码3-3丨6/并将这一代码显示在CRT4的屏幕上。获得并存贮唯一对应字符“森”的完整字符笔划代码的其余过程与前面结合技术B所作的描述一致。
*利用技术C输入字符“森”:
根据汉字手写规则,汉字“森”的三个相同字根中每一个都具有笔划次序一丨/\,因为这些都是简单笔划,它们可转换为基本笔划元次序一丨//。因此,利用笔划组方式输入字符“森”时,操作者按次序按压代表三个横笔划元-一的“3”键、代表三个竖笔划元丨丨丨的“\”键;代表四个斜笔划元////的“=”键和代表两个斜笔划元//的“0”键。后面两步按键动作可由两次相继按压代表三个斜笔划元///的“一”键来替代。上述笔划输入过程之后,用户按压“,”键启动计算机1的程序产生字符笔划代码3-3丨6/并将其在CRT4的屏幕上显示出来。获得并存贮与字符“森”唯一对应的完整字符笔划代码的其余步骤与前面结合技术B所作的描述相同。
对于笔划数少于10的汉字来说,技术D可能更具优势。对笔划数少于15且基本笔划元转换能很容易实现的汉字来说,技术C可能更具优势。而对笔划数多于15且其基本笔划元转换不易实现的汉字来讲,技术B可能要更有效。
根据本发明,对存贮在字符集中每一个汉字的笔划都按其形状和尺寸进行了编码。对一给定的笔划形式来说,其尺寸与其中汉字中所处的位置以及汉字的笔划数有关。一个笔划可首先被近似地看作是一条直线,其长度由其端点确定。这些端点可由具有某一适当原点的两维迪卡尔座标X1、Y1和X2、Y2来确定。座标值可由键盘2进行编码或输入。计算机1存贮汉字的每一笔划的座标值并根据其数量和笔划元形式导出一个代码,然后将座标值和代码存贮在计算机1的存贮器中。
下面以汉字“土”为例,对如何导出其座标值以及如何将其座标值插入其字根作一简要描述:
1.确定所需汉字的尺寸;
2.在座标纸上写出这个汉字,如图7所示;
3.由键盘2对每一笔划的座标值编码或输入。在本例中,横笔划元1的端点作标值为(4,5),(8,5);竖笔划元2的端点座标值为(6,3)、(6,7);横笔划元3的端点座标值为(3,7),(9,7)。
4.当所有这些输入结束后,字符笔划代码2-1丨0/被显示在CRT4屏幕上,通过按压“,”键,将每一笔划元的端点座标值和字符笔划元代码存贮器中。
5.输入该代码的最后代码元从而唯一确定这一字符。在本例中,完整的字符笔划代码是2-1丨0/C。
可以理解,上面所描述的每一要素或两种或两种以上要素的组合,也可以得到不同于上述形式的极有用的其它结构形式。
本发明通过详细的实施例示出并描述了对汉字进行编码和译码的一种装置和方法。但本发明并不局限于所示出或描述过的细节上,因为对本领域技术熟悉的人可知,对所示出的实施例在形式和细节方面作任何删节、修改、替代和变化而不会脱离由本发明权利要求书所确定的本发明的精神和范围。
Claims (22)
1、一种对汉字进行编码和译码的装置,包括:
(a)输入装置,用于输入一连串一个或多个基本笔划元,所要输入的相应汉字的笔划以至少在初始时符合汉字手写规则的次序分解成基本笔划元,仅有三种基本笔划元,即横笔划元一,竖笔划元丨;和斜笔划元/;
(b)处理装置,包括笔划代码导出装置,该笔划代码导出装置响应于输入装置输入与被输入的汉字对应的一连串一个或多个基本笔划元,导出表示在一连串一个或多个基本笔划中不同形式基本笔划元最初出现次序和每种基本笔划元出现总数的字符笔划代码,该处理装置进一步包括存贮装置,用于存贮一个字符集,该字符集含有大量汉字,每个汉字对应于一个相应的字符笔划代码;该处理装置还具有字符恢复装置,以响应于笔划代码导出装置从存贮装置恢复一个或多个对应于该字符笔划代码的汉字;
(c)显示装置,用于响应处理装置,对字符集中与由笔划代码导出装置导出和由恢复装置恢复的每个字符进行显示,如果由处理装置所导出的字符笔划代码对应字符集中多个字符,则输入装置还包括用于选择由显示装置显示的字符之一的选择装置,处理装置包括响应于选择装置以导出唯一地对应于一个被显示出来的字符的扩展字符笔划代码。
2、如权利要求1的装置,其特征在于,输入装置包括用于输入特定序列的一个或多个基本笔划元的装置输入汉字字根的笔划按至少在最初是符合汉字手写规则的次序分解成基本笔划元。
3、如权利要求1的装置,其特征在于,如果由处理装置所导出的字符笔划代码对应于字符集中多个字符,显示装置响应于处理装置显示与每个显示出来的字符相关的相应附加码元,以及,用于选择由显示装置显示出来的字符之一的装置包括用于输入与显示出来的字符之一相关的该附加码元的装置。
4、如权利要求1的装置,其特征在于,输入装置包括用于输入一个字符笔划代码的装置,该字符笔划代码表示在一连串一个或多个基本笔划元中不同形式基本笔划元出现初始次序和每种基本笔划元出现的总次数,被输入的相应汉字按照至少最初是符合汉字手写规则的次序分解成一连串一个或多个基本笔划元,以及,处理装置响应于由输入装置输入的汉字笔划代码,使显示装置显示字符集中与输入的字符笔划代码对应的每一汉字。
5、如权利要求1的装置,其特征在于,输入装置包括一个键盘,键盘上有着不同的键,对应于每种基本笔划元,通过敲击各个键,键盘可提供相应的笔划代码,代表对应的基本笔划元,以及,处理装置包括响应于对应的笔划代码以导出部分字符笔划代码的装置,该部分字符笔划代码表示相应的基本笔划元的单次出现。
6、如权利要求5的装置,其特征在于,键盘有许多键,每个键代表一个或多个字根或笔划,可分解为一连串相同的基本笔划元,通过敲击键盘上对应于某一字根或笔划的键,可提供相应的笔划代码,代表一连串一个或多个基本笔划元,相应的字根或笔划可以按至少在最初是符合汉字手写规则的次序分解为这些基本笔划元,以及,处理装置包括一个装置,响应于相应的笔划代码,以导出一个部分字符代码,表示在由相应的笔划代码所代表的一连串一个或多个基本笔划元中不同形式基本笔划元的最初出现次序和每种基本笔划元出现的总数。
7、如权利要求6的装置,其特征在于,键盘进一步包括各种不同键,对应于不同组别的每一类基本笔划元,敲击不同组别的某种基本笔划元中特定一组的键,以提供一个相应的笔划代码,代表该组别的一种基本笔划元中特定的一组,以及,处理装置包括响应于对应的笔划代码以导出一个部分字符代码的装置,该部分字符代码表示由相应的笔划代码所代表的该组别的一种基本笔划元内特定一个中基本笔划元的数量和形式。
8、如权利要求6的装置,其特征在于,处理装置响应于键盘提供的相应笔划代码所导出的每一部分字符代码包括与三种基本笔划元每一相对应的一个代码元,即使在相应于所敲的键的一个或多个字根、笔划或基本笔划元类型中并未出现一种或多种形式的基本笔划元时也是如此。
9、如权利要求1的装置,其特征在于,字符代码或扩展字符代码各包括一个相应的代码元,对应于三种基本笔划元的每一种,即使在所输入的对应字符的笔划被分解成的一连串基本笔划元中未出现一种或多种形式的基本笔划元时也是如此。
10、如权利要求1的装置,其特征在于,处理装置包括响应于输入装置输入两种不同形式的基本笔划元而使显示装置显示信息的装置,该信息表明被输入的相应字符的任何其余笔划可被分解成基本笔划元并按任意顺序输入。
11、如权利要求10的装置,其特征在于,输入装置包括键盘,键盘上有许多键,每个键代表一个或多个字根或笔划,可按至少在最初时符合汉字手写规则的次序分解成一个或多个基本笔划元的相同序列;或代表一种基本笔划元,每个键输入一连串一个或多个基本笔划元,相应的字根或笔划可分解成这些基本笔划元;或键入一个基本笔划元,以及,在处理装置使显示装置显示信息表明被输入的相应字符的任何其余笔划可被分解成基本笔划元并按任意顺序输入后,该字符不对应于键盘上任何键的某个剩余字根或笔划可由敲击与其剩余字根或笔划等同的一个字根或笔划所对应的键来输入。
12、如权利要求5的装置,其特征在于,处理装置包括响应于键盘提供的一连串一个或多个笔划代码以导出累加字符笔划代码的装置,该累加字符笔划代码表示由一连串一个或多个笔划代码代表的每种基本笔划元的最初出现顺序和每种基本笔划元出现的总数,而这些笔划代码则由键盘根据一个或多个键的动作而提供。
13、如权利要求12的装置,其特征在于,显示装置响应于处理装置以显示累加笔划代码。
14、如权利要求1的装置,其特征在于处理装置包括一个可编程计算机。
15、如权利要求1的装置,其特征在于处理装置包括这样的装置,它响应由处理装置导出的、与字符集中任何字符都不相关的一个字符笔划代码,从而启动显示装置显示一条需要重新输入的信息。
16、如权利要求1的装置,其特征在于输入装置包括一个写入填充盘,写入填充盘具有大量的感应元件,并被安排成具有大量行和列的规则配置,每一感应元件都可被各自触发,处理装置还包括响应对三个或三个以上水平相邻感应元件的触发从而提供一个与基本横笔划-的输入相应的一个笔划代码的装置、响应于三个或三个以上垂直相邻感应元件的触发从而提供一个与基本竖笔划丨的输入相应的一个笔划代码的装置以及响应对三个或三个以上对角相邻感应元件的触发或对不到两个相邻感应元件的触发从而提供一个与基本斜笔划/的输入相应的一个笔划代码的装置。
17、一种对汉字进行编码和译码的方法,包括下列步骤:
(a)输入一连串一个或多个基本笔划元,代表被编码汉字的笔划按至少在初始时符合汉字和手写规则的次序的分解形式,一连串的基本笔划元只有三种形式,即横笔划元一,竖笔划元丨和斜笔划元/;
(b)由输入的一连串一个或多个基本笔划元导出一个字符笔划代码,表示在输入的一连串基本笔划元中每种基本笔划元最初的出现次序和每种基本笔划元的出现总数;
(c)从存储的字符集中恢复对应于该字符笔划代码的一个或多个字符,存储的字符集包括许多汉字,每一汉字对应于一个相应的字符笔划代码;
(d)显示从存储的字符集中恢复的对应于该字符笔划代码的每一字符;
(e)如果字符集的一个以上字符对应于该字符笔划代码,从显示出来的字符中选择输入字符;以及
(f)如果字符集的一个以上字符对应于该字符笔划代码,修改该字符笔划代码,使包括一个与所选择的字符有关的附加代码元,以便得到一个唯一对应于所选择的字符的扩展字符笔划代码。
18、如权利要求17的方法,其特征在于,输入表示被编码汉字的分解形式的一连串一个或多个基本笔划元的步骤,包括依次输入一个或多个一连串基本笔划元,分别表示被编码的汉字的一个或多个字根或笔划,代表被输入的汉字的字根或笔划的一连串基本笔划元按至少在最初时符合汉字手写规则的次序输入。
19、如权利要求17的方法,其特征在于,被输入的一连串一个或多个基本笔划元在两种不同形式的基本笔划元输入之前按符合汉字手写规则的次序表示被编码汉字的笔划的分解形式,并在两种不同形式的基本笔划元输入之后可以以任意次序表示该字符笔划的分解形式。
20、如权利要求17的方法,其特征在于,输入一连串表示被编码汉字笔划的分解形式的一个或多个基本笔划元的步骤包括采用具有对应于每种基本笔划元的不同键的键盘输入该一连串基本笔划元。
21、如权利要求17的方法,其特征在于,输入一连串表示被编码的汉字笔划的分解形式的一个或多个基本笔划元的步骤包括采用具有许多键的键盘输入该字符一个或多个字根或笔划,每个键对应于一个或多个字根或笔划,可按至少在最初是符合汉字手写规则的顺序分解成一个或多个基本字符元的共同序列。
22、如权利要求17的方法,其特征在于,从显示出来的字符中选择被输入的字符的步骤包括采用键盘输入与被选择的字符有关的附加代码元。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US31388889A | 1989-02-23 | 1989-02-23 | |
US313,888 | 1989-02-23 | ||
US07/477,327 US5212769A (en) | 1989-02-23 | 1990-02-08 | Method and apparatus for encoding and decoding chinese characters |
US477,327 | 1990-02-08 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1045307A CN1045307A (zh) | 1990-09-12 |
CN1024050C true CN1024050C (zh) | 1994-03-16 |
Family
ID=26979103
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN90101470A Expired - Fee Related CN1024050C (zh) | 1989-02-23 | 1990-02-23 | 对汉字进行编码和译码的方法和装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US5212769A (zh) |
JP (1) | JP3292372B2 (zh) |
KR (1) | KR0163178B1 (zh) |
CN (1) | CN1024050C (zh) |
GB (1) | GB2228604B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106250035A (zh) * | 2015-10-19 | 2016-12-21 | 威锋数位开发股份有限公司 | 动态生成个人化手写字型的系统和方法 |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03225395A (ja) * | 1990-01-31 | 1991-10-04 | Canon Inc | 出力装置 |
US5325477A (en) * | 1991-12-02 | 1994-06-28 | Xerox Corporation | Method and apparatus for generating and displaying freeform strokes |
US5572656A (en) * | 1993-06-01 | 1996-11-05 | Brother Kogyo Kabushiki Kaisha | Portrait drawing apparatus having image data input function |
US5517610A (en) * | 1993-06-01 | 1996-05-14 | Brother Kogyo Kabushiki Kaisha | Portrait drawing apparatus having facial expression designating function |
US6215506B1 (en) * | 1993-06-01 | 2001-04-10 | Brother Kogyo Kabushiki Kaisha | Portrait drawing apparatus |
JPH0732649A (ja) * | 1993-07-16 | 1995-02-03 | Fujitsu Ltd | 文字の合成方法及びその装置 |
JPH07248755A (ja) * | 1994-02-25 | 1995-09-26 | Internatl Business Mach Corp <Ibm> | 文字表示方法 |
US6978421B1 (en) * | 1994-06-19 | 2005-12-20 | Mitsuhiro Aida | Handwriting text input system |
US5710880A (en) * | 1994-11-03 | 1998-01-20 | Microsoft Corporation | Method and system for creating a graphic image with geometric descriptors |
SE9601944L (sv) * | 1996-05-22 | 1997-11-23 | Ericsson Telefon Ab L M | Förfarande att välja ut objekt |
US5923778A (en) * | 1996-06-12 | 1999-07-13 | Industrial Technology Research Institute | Hierarchical representation of reference database for an on-line Chinese character recognition system |
US5796867A (en) * | 1996-06-12 | 1998-08-18 | Industrial Technology Research Institute | Stroke-number-free and stroke-order-free on-line Chinese character recognition method |
US6151032A (en) * | 1996-09-20 | 2000-11-21 | Dynalab, Inc. | Stroke-based glyph-outline font generation in low/high resolution space |
US6157390A (en) * | 1996-09-20 | 2000-12-05 | Dynalab (S) Ltd. | Stroke-based font generation |
US5831636A (en) * | 1996-11-26 | 1998-11-03 | Motorola | Method for compressing ideographic characters for storage decompression and display and a communication device therefor |
US7257528B1 (en) | 1998-02-13 | 2007-08-14 | Zi Corporation Of Canada, Inc. | Method and apparatus for Chinese character text input |
CN1156741C (zh) | 1998-04-16 | 2004-07-07 | 国际商业机器公司 | 手写汉字识别方法及装置 |
US6229551B1 (en) * | 1998-08-13 | 2001-05-08 | Arphic Technology Co., Ltd. | Structural graph display system |
US6275237B1 (en) * | 1998-09-30 | 2001-08-14 | Arphic Technology Co., Ltd. | Structural graph display system |
AUPP665398A0 (en) * | 1998-10-22 | 1998-11-12 | Charactech Pty. Limited | Chinese keyboard, input devices, methods and systems |
US6801659B1 (en) * | 1999-01-04 | 2004-10-05 | Zi Technology Corporation Ltd. | Text input system for ideographic and nonideographic languages |
US6219448B1 (en) * | 1999-06-25 | 2001-04-17 | Gim Yee Pong | Three-stroke chinese dictionary |
US6501475B1 (en) | 1999-10-22 | 2002-12-31 | Dynalab Inc. | Glyph-based outline font generation independent of resolution |
KR20000006943A (ko) * | 1999-11-13 | 2000-02-07 | 이규갑 | 한자 고속입력법 |
WO2001045034A1 (en) * | 1999-12-17 | 2001-06-21 | Motorola Inc. | Ideographic character input using legitimate characters as components |
US6349147B1 (en) * | 2000-01-31 | 2002-02-19 | Gim Yee Pong | Chinese electronic dictionary |
US6661417B1 (en) | 2000-08-28 | 2003-12-09 | Dynalab Inc. | System and method for converting an outline font into a glyph-based font |
US7900143B2 (en) * | 2000-12-27 | 2011-03-01 | Intel Corporation | Large character set browser |
US20030020738A1 (en) * | 2001-07-30 | 2003-01-30 | Milburn Ross William Vinters | Method and device for character input retrieval and indexing |
CN100388628C (zh) * | 2001-08-30 | 2008-05-14 | 美国在线服务公司 | 基于偏旁的自适应笔划顺序方法和系统 |
US7032175B2 (en) * | 2003-01-30 | 2006-04-18 | Ching-Shyan Wu | Collision-free ideographic character coding method and apparatus for oriental languages |
CN1826573B (zh) * | 2003-06-18 | 2010-06-16 | 字源加拿大公司 | 文本输入系统和方法 |
US20050065775A1 (en) * | 2003-09-23 | 2005-03-24 | Poon Paul Chi-Sing | Method and system for inputting chinese characters |
US7359850B2 (en) * | 2003-09-26 | 2008-04-15 | Chai David T | Spelling and encoding method for ideographic symbols |
US8094938B2 (en) * | 2004-04-02 | 2012-01-10 | Nokia Corporation | Apparatus and method for handwriting recognition |
US7609890B2 (en) * | 2004-09-30 | 2009-10-27 | Pitney Bowes Inc. | Packing list verification system |
US20090299822A1 (en) | 2006-11-08 | 2009-12-03 | P C Grocery Ltd. | System and method for optimized shopping transactions |
US7974472B2 (en) * | 2007-06-29 | 2011-07-05 | Microsoft Corporation | Feature design for HMM based Eastern Asian character recognition |
US20090060338A1 (en) * | 2007-09-04 | 2009-03-05 | Por-Sen Jaw | Method of indexing Chinese characters |
US20090060339A1 (en) * | 2007-09-04 | 2009-03-05 | Sutoyo Lim | Method of organizing chinese characters |
CN101930474A (zh) * | 2010-09-14 | 2010-12-29 | 闫卫 | 汉字简易笔划检索方法 |
US9418569B2 (en) * | 2010-12-22 | 2016-08-16 | Creative Technology Ltd | Methods and system for visually representing a rate of writing a plurality of identical chinese characters for at least one user on a display |
EP2807603B1 (en) | 2012-01-23 | 2020-03-18 | Microsoft Technology Licensing, LLC | Formula detection engine |
KR101898202B1 (ko) * | 2012-02-09 | 2018-09-12 | 삼성전자주식회사 | 필기 인식을 위한 필기 입력 가이드 장치 및 방법 |
US9330070B2 (en) | 2013-03-11 | 2016-05-03 | Microsoft Technology Licensing, Llc | Detection and reconstruction of east asian layout features in a fixed format document |
JP2017509080A (ja) * | 2014-03-25 | 2017-03-30 | パク・インギPARK, In Ki | 漢字入力装置と漢字入力方法、及びこれを用いた漢字検索方法 |
CN117648681B (zh) * | 2024-01-30 | 2024-04-05 | 北京点聚信息技术有限公司 | 一种ofd版式电子文档隐藏信息提取嵌入方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5580183A (en) * | 1978-12-12 | 1980-06-17 | Nippon Telegr & Teleph Corp <Ntt> | On-line recognition processing system of hand-written character |
US4462703A (en) * | 1979-11-19 | 1984-07-31 | Lee Hsing C | Apparatus and method for controlling and ordering Chinese characters |
JPS5675872A (en) * | 1979-11-19 | 1981-06-23 | Shiyuu Rii Shin | Method and device for controlling and arranging character |
CA1172335A (en) * | 1980-03-06 | 1984-08-07 | Daniel L. Leung | Means for encoding ideographic characters |
US4379288A (en) * | 1980-03-11 | 1983-04-05 | Leung Daniel L | Means for encoding ideographic characters |
US4365235A (en) * | 1980-12-31 | 1982-12-21 | International Business Machines Corporation | Chinese/Kanji on-line recognition system |
JPS581227A (ja) * | 1981-06-26 | 1983-01-06 | Tatsuya Matsuda | 漢字を1〜0までの数列でおきかえ、コンピュ−タ−にインプットする操作方法 |
US4559615A (en) * | 1982-09-15 | 1985-12-17 | Goo Atkin Y | Method and apparatus for encoding, storing and accessing characters of a Chinese character-based language |
US4505602A (en) * | 1982-09-30 | 1985-03-19 | Wong Wyman S | Method for encoding ideographic characters |
US4718102A (en) * | 1983-01-19 | 1988-01-05 | Communication Intelligence Corporation | Process and apparatus involving pattern recognition |
JPS6014292A (ja) * | 1983-07-06 | 1985-01-24 | 株式会社東芝 | 文書作成装置 |
JPS6027925A (ja) * | 1983-07-27 | 1985-02-13 | 葉 亮星 | 漢字の検索方法 |
US4684926A (en) * | 1984-05-14 | 1987-08-04 | Yong Min Wang | Universal system of encoding chinese characters and its keyboard |
JPS60263258A (ja) * | 1984-06-08 | 1985-12-26 | チヤイナ パテント エ−ジエント(ホンコン)リミテツド | 漢字符号化の一般的システム及びそのキ−ボ−ド |
US4829583A (en) * | 1985-06-03 | 1989-05-09 | Sino Business Machines, Inc. | Method and apparatus for processing ideographic characters |
US4669901A (en) * | 1985-09-03 | 1987-06-02 | Feng I Ming | Keyboard device for inputting oriental characters by touch |
JPS6282486A (ja) * | 1985-10-08 | 1987-04-15 | Hitachi Ltd | オンライン手書き図形認識装置 |
US4689743A (en) * | 1986-02-11 | 1987-08-25 | Andrew Chiu | Method and an apparatus for validating the electronic encoding of an ideographic character |
US5109352A (en) * | 1988-08-09 | 1992-04-28 | Dell Robert B O | System for encoding a collection of ideographic characters |
-
1990
- 1990-02-08 US US07/477,327 patent/US5212769A/en not_active Expired - Fee Related
- 1990-02-21 GB GB9003896A patent/GB2228604B/en not_active Expired - Fee Related
- 1990-02-23 JP JP04427690A patent/JP3292372B2/ja not_active Expired - Fee Related
- 1990-02-23 KR KR1019900002322A patent/KR0163178B1/ko not_active IP Right Cessation
- 1990-02-23 CN CN90101470A patent/CN1024050C/zh not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106250035A (zh) * | 2015-10-19 | 2016-12-21 | 威锋数位开发股份有限公司 | 动态生成个人化手写字型的系统和方法 |
US10346034B2 (en) | 2015-10-19 | 2019-07-09 | Dynacomware Taiwan Inc. | Dynamically generating characters with personalized handwriting character font characteristics method and system thereof |
CN106250035B (zh) * | 2015-10-19 | 2019-07-26 | 威锋数位开发股份有限公司 | 动态生成个人化手写字型的系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
KR910015914A (ko) | 1991-09-30 |
GB2228604B (en) | 1993-04-21 |
JPH02289100A (ja) | 1990-11-29 |
CN1045307A (zh) | 1990-09-12 |
GB9003896D0 (en) | 1990-04-18 |
JP3292372B2 (ja) | 2002-06-17 |
KR0163178B1 (ko) | 1999-01-15 |
GB2228604A (en) | 1990-08-29 |
US5212769A (en) | 1993-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1024050C (zh) | 对汉字进行编码和译码的方法和装置 | |
CN1156741C (zh) | 手写汉字识别方法及装置 | |
CN1607491A (zh) | 使用操纵杆输入中文的系统和方法 | |
CN1140868C (zh) | 表意语言及非表意语言的文字输入系统 | |
CN1316689A (zh) | 汉字输入装置和方法 | |
CN86101871A (zh) | 选择和再生语言字符的方法 | |
CN1434365A (zh) | 中文字形输入装置及中文字形输入法 | |
CN1136496C (zh) | 简化拼音-触摸屏鼠标式汉字输入方法 | |
Stallings | The morphology of Chinese characters: a survey of models and applications | |
CN1073722C (zh) | 一种拼音输入方法 | |
CN1177285C (zh) | 超大型汉字信息处理装置及方法 | |
CN1045308A (zh) | 藏文输入编码法及其键盘 | |
CN1334503A (zh) | 计算机汉字活码输入法及其键盘 | |
CN1257445C (zh) | 音义码汉字输入方法 | |
CN1059281C (zh) | 汉字声韵调三拼音形编码输入方法 | |
CN1395195A (zh) | 东巴象形文字计算机处理技术 | |
CN1246758C (zh) | 计算机四角码汉字输入法及其键盘 | |
CN1028457C (zh) | 一种笔画数码加声码的汉字计算机输入系统 | |
CN1598743A (zh) | 按规范笔顺输入汉字的输入法及其键盘 | |
CN1124064C (zh) | 九键中文输入法 | |
CN1347023A (zh) | 二笔手写智能输入系统 | |
CN1107255C (zh) | 无限有序字符集汉字全集方法和系统 | |
CN1540485A (zh) | 汉码系列输入法 | |
CN1269007C (zh) | 笔删式触控键盘中文音象全功能输入装置 | |
CN1081523A (zh) | 双拼汉语编码法及其键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C53 | Correction of patent for invention or patent application | ||
COR | Change of bibliographic data |
Free format text: CORRECT: PATENTEE; FROM: JIMULONGGE; PONTECH INC TO: PENG JIN |
|
CP01 | Change in the name or title of a patent holder |
Patentee after: Peng Jin Patentee before: Gim Pong Patentee before: Pontech INC |
|
C15 | Extension of patent right duration from 15 to 20 years for appl. with date before 31.12.1992 and still valid on 11.12.2001 (patent law change 1993) | ||
OR01 | Other related matters | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |