CN100483450C - 地址识别设备和方法 - Google Patents
地址识别设备和方法 Download PDFInfo
- Publication number
- CN100483450C CN100483450C CNB991013549A CN99101354A CN100483450C CN 100483450 C CN100483450 C CN 100483450C CN B991013549 A CNB991013549 A CN B991013549A CN 99101354 A CN99101354 A CN 99101354A CN 100483450 C CN100483450 C CN 100483450C
- Authority
- CN
- China
- Prior art keywords
- address
- character
- key character
- pattern
- key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/293—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of characters other than Kanji, Hiragana or Katakana
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
当所要识别的地址的图案得到输入时,在确定了接触字符的接触位置之后分离接触字符。通过识别所分离的各个字符的字符而提取出一个关键字符。在提取了关键字符之后,被该关键字符限定的图案得到集体获取。通过把该关键字符限定的整个图案的特征矢量与地址名称字的特征矢量进行比较,识别地址名称字。
Description
本发明涉及一种地址识别设备,且更具体地说涉及一种用于从一个自由间距区中的手写字符读取地址的设备。
传统的光学字符识别设备(OCR)指定了一个地址名称区,并通过提取一个分割字符(以下称为关键字符)—它可以是由于一个一个地识别字符而得到的位置名称的限定符—来读取地址。
图1是框图,显示了传统地址识别设备的配置。
在图1中,一个字符分割单元501把字符分割成所有可能的分割候选者。一个字符识别单元502输出所有可以分割成字符的可能的第一种候选者至第N种候选者的识别结果。如果关键字符“都”(首府)、“道”(专区)、“府”(专区)、“県”(专区)、“市”(城市)、“郡”(乡村)、“区”(行政区)、“町”(城镇)、“村”(村庄)、“字”(区)等中的任何一个被包括在第一至第N个候选者中,则一个关键字符提取单元503提取相应的候选者作为关键字符。
一个地址名称区候选者获取单元504获取关键字符之间的一个区作为地址名称区候选者。一个地址名称获取单元506一个字符一个字符地比较第一候选者至第M(M≤N)个候选者和一个地址名称字典505,并在地址名称的任何一个字符与第一至第M个候选者匹配的情况下获取地址名称字典505中的一个地址名称。地址名称候选者评价值运算单元507计算一个地址名称候选者的评价值,以获得地址名称获取单元506所获取的地址名称候选者中最可能的地址名称候选者。地址名称候选者选择单元509检查地址名称获取单元506获取的地址名称候选者是否与当前候选者之前或之后的地址名称候选者一致。如果一致,则当前的地址名称候选者被作为地址而得到输出。
传统的地址识别设备在例如Tokukaihei7-262320中得到了描述。
然而,传统的地址识别设备有一个问题,即它在从自由间距区中的手写字符串读取地址时和所要读取的字符彼此接触时经常产生读取误差。接触的字符被读成了一个字符。
传统设备的另一个问题,是所要识别的图案的数目由于从一个自由间距区分割的所有可能的候选者都要得到识别而增大,从而要求大量的处理。
另外,当在第一候选者至第N候选者中包含有任何关键字符时,所有的候选者都被作为关键字符而得到提取。因此,非关键字符被作为关键字符而得到了提取,且对于分割地址名称区出现了若干个关键字符组合,从而要求大量的处理。
如果在第一至第M候选者中有包含与包含在输入于地址名称字典505中的地址名称中的字符匹配的字符,这些地址名称都被作为地址名称候选者而得到获取。因此,需要识别大量的地址名称候选者,从而要求大量的处理以指定地址。
本发明的第一个目的是提供一种地址识别设备,它即使在字符彼此接触的情况下也能够高精度地识别地址。
本发明的第二目的,是提供一种地址识别设备,它能够高精度地识别地址。
为了解决上述的问题,本发明包括:一种关键字符提取单元,用于根据分离接触字符的结果来提取一个关键字符;一个地址名称区提取单元,用于根据该关键字符的位置来提取一个地址名称区;以及,一个地址名称识别单元,用于根据分离之前的接触字符的状态来识别地址名称区的地址名称.
即使形成一个字符串的字符表示了一个彼此接触的地址,在该字符串中的关键字符仍然能够得到正确的提取,表示一个地址名称的整个字符串仍然能够得到提取并在地址名称的识别中得到处理。因此,把表示一个地址名称的字符串分割成字符的处理可得到省略,且该地址可得到有效的识别。由于不需要分割表示一个地址名称的字符串,能够避免表示该地址名称的字符串的错误分割,从而改善地址识别中的正确率。
根据本发明的一个方面,被一个关键字符分割的整个图案的特征矢量被与输入地址名称输入字典的地址名称的特征矢量相比较,从而使该地址名称能够得到识别。
因此,表示地址名称的字符串能够在不分割成单个字符的情况下得到识别,从而改善地址识别的正确率。
根据本发明的另一个方面,为由一个关键字符指定的各个属性输入了一个地址名称,且被一个关键字符分割的一个图案的特征矢量被与一个地址名称相比较—而该地址名称具有由一个关键字符指定的属性。
因此,例如,如果通过一个关键字符分割的图案的属性是“県”,则利用包含地址名称“県”的一个字典进行一个比较操作,从而以改善的识别精度进行与由一个关键字符指定的属性相应的比较操作。
根据本发明的再一个方面,当从一个输入图案提取的相连的图案得到分离时,分离的位置根据输入图案的大小而得到评价。
因此,当从一个输入图案提取了一个关键字符时,相连的图案可被分离成适合于提取关键字符的大小。因此,相连的图案的分离位置的数目可得到,且识别操作的次数也可得到减小,从而有效地识别地址。
根据本发明的再一个方面,可根据相连图案的大小检测其分离位置的相连图案能够得到选择。
因此,只为较大的可能包含接触的字符的相连图案检测分离位置。对于较小的被认为是不包含接触字符的相连图案,可省略分离位置检测。从而改善了地址识别的效率。
根据本发明的又一个方面,如果输入图案中的黑象素数目直方图的最小点的值等于或小于一个预定值,则它被定义为一个分离的点候选者。
其结果,一个字符的窄部分可与字符之间的一个接触点相区分,且只有字符之间的接触点可以得到高精度的检测。因此,可在接触点以高精度分离相连图案。
根据本发明的进一个的方面,如果分离的图案的高宽比到达了预定范围以下的区域,则该分离点被从分离点候选者中除去。
因此,可以防止相连图案在提取关键字符时被分离成具有不适当的尺寸的部分,并可防止相连图案被分离成不包含关键字符的图案,从而有效地识别地址并为不包含关键字符的图案省略了无用的处理。
根据本发明的另一个方面,当字符是水平书写时,具有平均大小的字符的一半宽度的倍数的位置得到了计算。当字符是纵向书写时,平均大小的字符的一半高度的倍数的位置得到计算。而且,只有该计算点之前和之后的一个预定范围内的一个最小点被定义为黑象素数目直方图的最小点中的暂定分离点候选者。
因此,当字符被水平书写时即使只有关键字符的左或右部分与另一字符相接触,或者当字符被纵向书写时即使只有关键字符的上或下部与另一字符相接触,也能够有效地从接触字符中提取关键字符的一个部分,从而有效地恢复原来的关键字符。
根据本发明的又一个方面,一个暂定分离点候选者是一个最小点—它具有从平均字符一半大小的倍数的位置的预定范围内的点中的黑象素数目的直方图的值。
因此,即使有多个最小点—这些点具有在距平均字符的一半大小的倍数的位置的预定范围内的点中的黑象素数目直方图的最小值,只有一个暂定分离点候选者能够得到提取。其结果,能够通过把一个相连图案分成若干位于不限定字符的位置的部分,而防止处理变得复杂。
根据本发明的另一个方面,一个暂定分离点候选者是具有黑象素数目直方图的最小值的点中与平均字符的一半大小的倍数的位置最近的点。
因此,即使在位于距平均字符的一半大小的倍数的位置预定范围的点中,有多个具有黑象素数目直方图的最小值的最小点,也只有一个暂定分离点候选者能够得到提取。其结果,可通过把相连图案分成处于不限定字符的位置处的若干部分,而防止处理变得复杂。
根据本发明的进一个方面,可根据一个图案的整合分离部分的结果而提取一个关键字符。
因此,即使字符的一个部分与另一字符接触,也能够从其他字符分离出该字符的部分,且字符的该分离部分能够与该字符的其余部分相整合而形成原来的字符,从而防止关键字符被错误识别。
根据本发明的另一个方面,可以通过使具有较高级的关键字符候选者具有优先权,而从由输入图案提取的关键字符候选者中提取出一个地址名称区。
因此,能够防止被错误地作为关键字符候选者而得到提取的字符被用于提取一个地址名称区。其结果,作为地址名称候选者而得到提取的候选者的数目可得到减小,且地址名称识别处理的次数可得到减小,从而改善地址识别的效率。
根据本发明的进一个方面,产生了关键字符候选者的一个图案信息表,该表包括了关键字符的级、关键字符类型、层次结构的级、位置坐标、一个图案是否将要被包含到一个相邻的图案中的信息。
因此,可通过参照该图案信息表而迅速地进行处理,从而改善了地址识别的效率。
根据本发明的进一步的方面,判定关键字符的排列顺序和位置或关键字符的组合是否适合于地址的表示。
因此,即使在表示一个地址名称的字符中包含了一个地址的关键字符,包含在表示该地址名称的字符中的该关键字符仍然可从所要提取的关键字符中被除去,从而使只被用于表示地址名称的层次结构级的字符被作为关键字符得到提取,从而防止地址名称区得到错误的提取,并有效地进行地址识别。
根据本发明的进一步的方面,当有被一个部分选择项指定的关键字符时,从比该关键字符的层次结构级别低的一个层次结构级别确定一组关键字符候选者。
因此,当给出了一个部分选择项以利用例如一个询问卡来指定一个地址时,关键字符提取的准确能够得到改善。
根据本发明的的另一个方面,当不能只通过采用具有较高级别的关键字符候选者来获得适合于表示一个地址的一组关键字符时,具有较低的顺序的一个关键字符候选者被加上。
因此,地址名称区能够得到正确的提取,且关键字符候选者的数目能够被限制在最小的可能数目。
根据本发明的进一步的方面,用于表示一个地址的一组关键字符中所缺少的被从具有较低顺序的关键字符候选者中选出并被加到关键字符候选者中。
因此,只有所需的候选者被从具有较低顺序的关键字符候选者中选出并作为关键字符候选者,从而使关键字符能够得到有效的提取。
根据本发明的进一步的方面,从表示一个地址的字符串提取的关键字符候选者的关键字符级得到计算,且通过给予具有较高位置级的关键字符候选者优先而确定一组关键字符候选者。
因此,当与地址层次结构结构知识和地址关键字符位置知识一致的一组关键字符候选者得到确定时,处理时间通过减小关键字符候选者组的数目而得到缩短,从而有效地识别一个地址。
根据本发明的另一方面,判定表示地址的地址名称的组合或表示地址的地址名称的排列顺序是否适当。
因此,如果多个地址名称候选者被表示到一地址名称区的一个图案且可通过组合这些地址名称候选者而获得多个地址候选者,则不表示实际地址的地址名称的组合将被删除,从而只有存在的地址得到识别,从而改善地址识别的精度。
根据本发明的进一步的方面,通过以字符单检查从表示一个地址的字符串提取的图案而获得的地址识别结果得到输出。
其结果,即使未成功地提取关键字符,该地址也能够得到正确的识别,且地址识别的可靠性能够得到改善。
根据本发明的进一步的方面,在关键字符识别字典中输入的字符类型被限制在与该关键字符类型和与该关键字符类型类似的字符类型。
因此,当从由输入图象分割的图案提取一个关键字符时,从输入图象分割的图案与在关键字符识别字典中输入的字符类型之间的比较,与其中所有字符类型都被输入到关键字符识别字典中的情况相比,得到了大大的减小,从而缩短了识别地址时的处理时间。
另一方面,当在关键字符识别字典中只输入有关键字符类型时,该关键字符类型总是首先以在图案识别中出现的数目排列。因此,当所要识别的一个图案与一个关键字符类似时,则不是一个关键字符的图案可能被错误地作为一个关键字符而得到提取。另一方面,如果与关键字符类型类似的字符类型得到输入,则对于与一个关键字符类似但不是该关键字符的一个图案,与关键字符类型类似的字符类型在出现数目上首先出现。其结果,该关键字符类型排列级别较低。因此,通过检查关键字符类型的出现顺序,可以确定与一个关键字符类似但不相同的一个图案是否属于该关键字符类型。因此,可以防止与一个关键字符类似但不同的一个图案被错误地作为关键字符而得到提取。
根据本发明的进一步的一个方面,如果作为字符识别的结果而包含第N级中的关键字符类型的取样图案的数目K与为一个字符类型的字符识别而处理的取样图案的数目M的比值等于或大于一个预定值,则该字符类型被定义为该关键字符类型的类似字符类型。
因此,可以在各种手写字符中指定确定一个频繁且错误地被提取的非关键字符的图案作为关键字符,从而高精度地确定与该关键字符类型类似的字符类型。
图1是框图,显示了传统地址识别设备的配置。
图2是框图,显示了根据本发明的第一实施例的地址识别设备的配置;
图3显示了根据本发明的一个实施例的地址识别方法图。
图4是框图,显示了根据本发明的第二实施例的地址识别设备的配置;
图5是框图,显示了根据本发明的第三实施例的地址识别设备的配置;
图6是框图,显示了根据本发明的第四实施例的地址识别设备的配置;
图7是框图,显示了根据本发明的第五实施例的地址识别设备的配置;
图8是流程图,显示了根据本发明的一个实施例的分离点确定和分离处理;
图9是流程图,显示了根据本发明的一个实施例的关键字符候选者提取处理;
图10是流程图,显示了根据本发明的一个实施例的关键字符候选者确定处理和关键字符再提取处理;
图11A显示了表示包含接触字符的地址的手写字符串的第一个例子;
图11B显示了由一个矩形包围的标签图象;
图11C显示了积分包围的矩形的结果;
图12A显示了提取包含接触字符的字符串的结果;
图12B显示了在包含接触字符的字符串的黑象素数目的直方图中的分离点候选者的位置;
图12C显示了在包含接触字符的字符串的黑象素数目的直方图中的暂定分离点候选者的位置;
图13A显示了在图11A显示的字符串上的暂定分离结果;
图13B显示了暂定分离获得的单个图案是否能够被整合到另一图案中的判定结果;
图14A显示了暂定分离获得的单个图案的识别结果;
图14B显示了通过把暂定分离获得的一个单个图案临时整合到另一图案中而获得的一个图案的识别结果;
图15显示了图11A显示的字符串产生的图案信息表的一个例子;
图16显示了显示关键字符的层次结构级别的表;
图17显示了从图11A中显示的字符串提取的关键字符候选者;
图18A显示了用在地址中的字符串的层次结构;
图18B显示了可用于图17显示的关键字符候选者的关键字符组;
图19显示了表示包含接触字符的地址的手写字符串的第二个例子;
图20显示了为图19显示的字符串产生的图案信息表的一个例子;
图21A显示了从图19显示的字符串提取的关键字符候选者;
图21B显示了从图19显示的字符串再提取的关键字符候选者;
图21C显示了可用于图19显示的字符串的关键字符组;
图22显示了当根据本发明的一个实施例的关键字符识别字典得到适当利用时一个关键字符类型的识别结果;
图23是框图,显示了根据本发明的一个实施例的关键字符识别字典的配置;
图24显示了根据本发明的一个实施例的关键字符类型和一个类似字符类型;
图25显示了当使用根据本发明的一个实施例的关键字符识别字典—它只包含关键字符类型及其类似字符类型—得到使用时的关键字符识别结果;
图26是框图,显示了根据本发明的第六实施例的地址识别设备的配置;
图27是流程图,显示了根据本发明的一个实施例的关键字符识别字典的一种生成方法;
图28是框图,显示了根据本发明的一个实施例的地址识别设备的系统配置。
以下结合附图描述根据本发明的一个实施例的地址识别设备。
图2是框图,显示了根据本发明的第一实施例的地址识别设备的配置。
在图2中,一个关键字符提取单元101从一个输入图象提取一个关键字符。一个集体识别单元102集体地识别由关键字符提取单元101所提取的一个关键字符所分离的一个图案。这种集体识别可通过把从一个图案—该图案被定义为由关键字符分离的一个组—提取的特征矢量与代表一个地址名称字的字符串或一组字符的特征矢量进行比较,而进行处理。
因此,与一个地址名称字相应的一个图案,可通过从输入图象提取该关键字符并分割在关键字符的位置处的该输入图象的图案,而从一个输入图象得到集体分割。进一步地,可通过集体获取一个集体分割的图案而有效地识别一个地址。
图3显示了根据本发明的一个实施例的地址识别方法。
在图3中,假定手写字符“栃木県下都賀郡壬生町”的原始图象得到输入,从原始图象“栃木県下都賀郡壬生町”的图案提取出一个关键字符候选者。其结果,“県”、“都”、“郡”、“町”作为关键字符候选者而得到提取。
这些关键字符候选者,通过从原始图象“栃木県下都賀郡壬生町”的图案一个一个地分割字符并识别字符单位中的分割图案,而得到提取。
当关键字符候选者“県”、“都”、“郡”、“町”被结合时,只获得了被用作一个实际地址的组合。其结果,关键字符候选者“県”、“都”、“郡”、“町”的实际组合可以是关键字符组候选者{県,郡,町},关键字符组候选者{都,郡,町},以及关键字符组候选者{郡,町}。
随后,原始图象“栃木県下都賀郡壬生町”的图案在各个关键字符的位置处得到分离,且从该原始图象分割出在关键字符的位置得到分离的图案。
其结果,对于关键字符组候选者{県,郡,町},获得了包含原始图象“栃木”的分割区R1、包含原始图象“下都賀”的图案的分割区R2、以及包含原始图象“壬生”的图案的分割区R3。
对于关键字符组候选者{都,郡,町},获得了包含原始图象“栃木県下”的图案的分割区R4、包含原始图象“賀”的图案的分割区R5、以及包含原始图象“壬生”的图案的分割区R6。
对于关键字符组候选者{郡,町},获得了包含原始图象“栃木県下都賀”的图案的分割区R7和包含原始图象“壬生”的图案的分割区R8。
随后,对于关键字符组候选者{県,郡,町},进行集体识别包含在从原始图象分割的分割区R1至R3中的图案的处理。在这种集体识别处理中,一组字符或表示一个地址名称字的字符串的特征矢量被输入一个地址名称字字典103。随后,原始图象的各个分割区R1至R3中的图案被定义为一个组。从该图案提取的特征矢量被与输入到地址名称字字典103中的特征矢量进行比较。
例如,假定地址名称字字典103包含与地址名称字“栃木”相应的特征矢量、与地址名称字“下都賀”相应的特征矢量,且与地址名称字“壬生”相应的特征矢量。包含在分割区R1至R3中的原始图象的图案的特征矢量被与地址名称字字典103中输入的特征矢量进行比较。其结果,地址名称字“栃木”被从地址名称字字典103获取,因为它与包含在分割区R1中的原始图象的图案的特征矢量更为接近。因此,地址名称字“栃木”作为包含在分割区R1中的原始图象的图案的识别结果而得到输出。地址名称字“下都賀”,由于它与包含在分割区R2中的原始图象的图案的特征矢量更为接近,而被获取。因此,地址名称字“下都賀”作为包含在分割区R2中的原始图象的图案的识别结果而得到输出。地址名称字“壬生”,由于它与包含在分割区R3中的原始图象的图案的特征矢量更接近,而得到获取。因此,地址名称字“壬生”作为包含在分割区R3中的原始图象的图案的识别结果而得到输出。
对于关键字符组候选者{都,郡,町},集体识别包含在从原始图象分割的分割区R4至R6中的图案的处理从而进行处理。即,包含在分割区R4至R6中的原始图象的图案的特征矢量被与输入地址名称字字典103中的特征矢量进行比较。由于包含在分割区R4中的地址名称“栃木県下”实际上不存在,地址名称字字典103不存储与地址名称字“栃木県下”相应的特征矢量。其结果,从地址名称字字典103获取不到作为与包含在分割区R4中的原始图象的图案接近的特征矢量的地址名称字,从而输出了一个结果“不可识别”。
由于包含在分割区R5中的地址名称字“賀”实际上不存在,地址名称字字典103不存储与地址名称字“賀”相应的特征矢量。其结果,从地址名称字字典103获取不到作为与包含在分割区R5中的原始图象的图案的特征矢量接近的地址名称字,因而输出了一个结果“不可识别”。
地址名称字“壬生”,由于它与包含在分割区R6中的原始图象的图案的特征矢量更接近,而从地址名称字字典103得到获取。因此,地址名称字“壬生”作为识别包含在分割区R6中的原始图象的图案的结果而得到输出。
对于关键字符组候选者{郡,町},进行集体识别包含在从原始图象分割出的分割区R7和R8中的图案的处理。即,包含分割区R7和R8中的原始图象的图案的特征矢量被与输入到地址名称字字典103中的特征矢量相比较。由于包含在分割区R7中的地址名称“栃木県下都賀”实际上不存在,地址名称字字典103不存储与地址名称字“栃木県下都賀”相应的特征矢量。其结果,从地址名称字字典103获取不到作为与包含在分割区R7中的原始图象的图案的特征矢量接近的地址名称字,从而输出一个结果“不可识别”。
地址名称字“壬生”,由于它与包含在分割区R8中的原始图象的图案的特征矢量更接近,而得到获取。因此,地址名称字“壬生”被作为在分割区R8中包含的原始图象的图案的识别结果,而得到输出。
作为地址名称字的集体识别的处理的结果,对于关键字符组候选者{都,郡,町}和关键字符组候选者{郡,町}都输出“不可识别”的结果。因此,这些关键字符组候选者被拒绝,且关键字符组候选者{県,郡,町}得到选择。其结果,对于手写的原始图象“栃木県下都賀郡壬生町”的图案,识别地址“栃木県下都賀郡壬生町”的结果可得到输出。
图7是根据本发明的第二实施例的地址识别设备的配置的框图。在图4中,一个接触位置确定单元1确定接触字符的接触位置。一个接触字符分离单元2分离由接触位置确定单元1确定的在接触位置的接触字符。一个关键字符提取单元3根据接触字符分离单元2的接触字符分离结果提取一个关键字符。一个地址名称区提取单元4根据关键字符提取单元3提取的关键字符的位置而提取一个地址名称区。地址名称识别单元5,根据分离之前的接触字符的状态,识别地址名称区提取单元4提取的地址名称区的地址名称。
当一个地址的要识别的图案被输入时,接触字符的接触点得到确定且接触字符得到分离。当接触字符被分离时,分离的各个字符得到识别且一个关键字符得到提取。当该关键字符被提取时,由该关键字符限定的图案被集体地取出,且该关键字符限定的整个图案的特征矢量被与地址名称的特征矢量进行比较,从而识别地址名称。
因此,通过利用在关键字符提取处理中的接触字符图案分离处理,能够防止输入的图案被分割的关键字符区域以外的区域中的若干部分。其结果,可以避免产生大量的需要识别的图案。因此,识别处理的时间能够得到减小,且关键字符可得到有效提取。
进一步地,通过对将要由关键字符限定的整个图案进行集体识别,不需要对将要由关键字符限定的图案进行一个字符一个字符的分割。因此,处理可以变得简单且由于图案分离位置的定位引起的错误识别能够得到避免,且地址识别中的正确率能够得到成功的改善。
另外,由于关键字符限定的整个图案得到集体处理,地址名称候选者的数目比其中与关键字符限定的图案中的任何一个字符匹配的所有地址名称都得到获取的情况下要小,从而有效地进行处理。
图5是框图,显示了根据本发明的第三实施例的地址识别设备的配置。
在图5中,一个分离位置检测单元11检测相连图案的分离位置。一个分离位置评价单元12根据输入图案的尺寸评价由分离位置检测单元11检测的分离位置。相连图案分离单元13根据由分离位置评价单元12得到的评价结果分离一个相连图案。一个关键字符提取单元14根据相连图案分离单元13的相连图案分离结果提取一个关键字符。地址名称区提取单元15根据关键字符提取单元14提取的关键字符的位置提取一个地址名称区。地址名称识别单元16识别地址名称区提取单元15提取的地址名称区的地址名称。
当将要进行识别的地址图案被输入时,所要分离的图案得到指定。随后,将要分离的图案的黑象素数目直方图被计算出来。在具有黑象素数目直方图的最小值的最小点中,具有等于或小于预定的值的点被确定为分离点候选者。当图案是在所有分离点候选者的位置得到分离时,一个图案被分成位于与关键字符的提取无关的位置处的若干小的部分。其结果,处理量增大了。因此,与分离点候选者中的关键字符的提取有关的点得到选择。实际上,其中当图案被分离时高/宽比处于预定的范围内的一个区域得到检测,且不在该区域中的分离点候选者被排除在分离位置之外。其结果,与关键字符的尺寸相应的区域可作为字符区而得到分割,从而进行有效的处理。
图6是框图,显示了根据本发明的第四实施例的地址识别设备的配置。
在图6中,关键字符候选者提取单元21从一个输入图案提取关键字符候选者。一个等级排列单元22根据关键字符候选者提取单元21提取的关键字符候选者的识别结果排列关键字符候选者。一个地址名称区提取单元23根据通过等级排列单元22而等级较高的关键字符候选者的位置提取一个地址名称。一个地址名称识别单元24识别地址名称区提取单元23提取的地址名称区的地址名称。
当输入一个要识别的地址图案时,从输入图案提取一个关键字符候选者。在关键字符候选者的提取中,一个手写的字符可能被错误地识别且非关键字符可能被作为关键字符候选者而得到提取。如果发生了这种错误识别,作为关键字符候选者提取的图案的数目增大且整个处理时间延长。因此,根据识别结果的顺序和距离而定义了一个关键字符级别,且根据优先级而使用具有较大关键字符级别的关键字符候选者作为关键字符候选者。结果,作为关键字符候选者而被错误提取的图案被从关键字符候选者中排除,且用于地址名称区的候选者的数目可得到增大,从而有效地进行处理。
图7是框图,显示了根据本发明的第五实施例的地址识别设备的配置。该地址识别设备可在例如通过光学字符识别装置(OCR)读取集合字符框、询问中的非单个字符框、用户输入卡、邮件订购卡等中的自由手写字符所表示的水平地址时得以使用。
在图7中,一个标签单元31为从一个利用扫描器等读取的一个二进化的图象提取了一个地址区之后分割的一个图案的各个相连元素加上标签。
一个单个字符区确定单元32从一个加了标签的相连图案的尺寸、距一个相邻图案的距离等整合相连图案,并获得一个单个字符区。
一个平均字符大小计算单元33通过除去比其他图案诸如接触字符大或小的图案,而计算一个平均字符大小。
一个接触部分确定/分离单元34包括一个直方图生成单元35、一个暂定分离点候选者提取单元36、以及一个暂定分离点确定单元37。
直方图生成单元35,在字符是水平书写时根据一个图案的宽度与平均字符的宽度的比值,在字符是纵向书写时根据图案的高度与一个平均字符的高度的比值,以及一个图案的包围矩形的高/宽比等等,来确定一个图案的字符彼此接触的可能性。当判定图案包含接触字符时,计数沿着与字符串垂直的方向的黑象素的数目,且在利用一个运动平均进行平滑化之后生成黑象素数目直方图。
暂定分离点候选者提取单元36从直方图生成单元35产生的黑象素数目直方图检测一个最小点,并把黑象素数目直方图的具有等于或小于一个阈值的最小点值的一个点定义为暂定分离点候选者。
当目标图案的字符是水平书写的时候,暂定分离点确定单元37确定在沿着水平方向距图案的包围矩形的端点平均字符宽度的1/2的倍数的一个点处,字符最可能彼此接触,并定义在距该点预定范围内的暂定分离点候选者是一个暂定分离点。当在距该点从端点的平均字符宽度的1/2的倍数的预定范围内有多个暂定分离点时,具有黑象素数目直方图的最小值的一个点被定义为暂定分离点。如果有多个点具有黑象素数目直方图的最小点,则与离该端点平均字符宽度的1/2倍数的点距离最近的点被定义为暂定分离点。
当目标图案的字符是纵向书写时,字符最可能在沿着纵向距离图案的包围矩形的端点平均字符高度的1/2的倍数的点处彼此接触,且在距该点预定范围内的暂定分离点候选者被定义为暂定分离点。当在距该点距离该端点平均字符宽度的1/2的倍数的该预定范围内有多个暂定分离点候选者时,具有黑象素数目直方图的最小值的点被定义为暂定分离点。如果有多个点具有黑象素数目直方图的最小值,则与距该端点平均字符高度的1/2的倍数的点相距最近的点被定义为暂定分离点。
当能够获得暂定分离点时,该图案被通过该暂定分离点的一条直线或曲线所临时分割。
一个关键字符识别字典38存储与地址有关的字符的特征矢量。
一个关键字符候选者提取单元39包括图案整合/判定和整合单元40、特征提取单元41、字典参照单元42和图案信息表产生单元43。
当相邻的图案按照从字符串的开始处开始的顺序得到整合时,图案整合判定/整合单元40根据整合的图案的宽度和高度判定整合的图案是否可以是一个字符。如果判定整合的图案有可能是一个字符,则可通过暂时把该图案整合成一个相邻的图案,而产生一个暂定图案。
特征提取单元41只为不能被整合的图案提取单个图案的特征。对于可被整合的图案,从一个单个图案和一个整合图案提取特征。
对于不能被整合的图案,字典参照单元42通过比较一个单个图案的特征矢量和输入到关键字符识别字典38中的字符的特征矢量,输出第一至第N候选者字符类型。对于能够被整合的图案,字典参照单元42通过把该单个图案和整合的图案的各个特征矢量与输入关键字符识别字典38的一个字符的特征矢量相比较,而输出单个图案和整合图案的每一个的第一至第N个候选者字符类型。
一个图案信息表产生单元43从该第一至第N候选者字符类型获得候选者字符类型的距离。当一个关键字符被包含在这些候选者字符类型中时,关键字符级别根据与该关键字符相应的候选者字符类型的距离和出现顺序而得到计算。
例如,该关键字符级别可被定义为当识别一个图案时的不同程度或类似程度。
当关键字符级别由不同程度定义时,采用了以下的函数。
不同程度指的是当较大的值被表示为所要识别的图案的特征矢量与输入到字典中的字符类型的特征矢量之间的距离的值时一个字符类型被输入到字典中的可能性低的尺度。假定一个图案相对于关键字符类型k的关键字符级别为k。fk是一个图案与关键字符类型k之间的不同程度d的函数。fk的特性被描述如下。
a.当一个图案相对于关键字符类型k具有最高关键字符级别时,该函数具有值1。当它具有最低关键字符级别时,该函数具有值0。即,由于fk当一个图案与关键字符类型k之间的不同程度d是最小值dmin时具有值1,且当关键字符类型k是最大值dmax时具有值0,以下的条件得到满足。
fk(dmin)=1
fk(dmax)=0
0≤fk(d)≤1
其中dmin≤d≤dmax
b.当不同程度d是常数时,关键字符级别当目标关键字符类型的出现顺序在识别候选者中较低时变得较低。
c.当不同程度等于识别候选者中的出现顺序,且目标关键字符类型的出现顺序不是识别候选者中的第一个时,关键字符级别当相对于第一顺序字符类型的不同程度与相对于关键字符类型的不同程度之差较大时较低。
满足上述三个特性的函数可被表示如下。
fk(di)=1/(1+i×((dl-di)/dc)×(di/dc))
其中0≤di≤无穷大
在上述公式中,i表示作为识别结果的候选者字符类型中关键字符类型k的出现顺序,di表示此时的不同程度,且dc表示通过实验适当确定的一个常数。
如果该关键字符级别由类似程度定义,采用以下的函数。
类似程度指的是当一个较小的值得到表示时一个图案是一个字符类型k的可能性的比率。当采用类似程度时,fk是一个图案与关键字符类型k之间的类似程度的函数。fk的特性被描述如下。
a.当一个图案相对于关键字符类型k具有最高关键字符级别时,该函数具有值1。当它具有最低关键字符级别时,该函数具有值0。即由于fk当一个图案与关键字符类型k之间的类似程度s为最大值smax时fk具有值1,且当关键字符类型k是最小值smin时具有值0,以下的条件得到满足。
fk(smax)=1
fk(smin)=0
0≤fk(s)≤1
b.当类似程度是恒定的时候,关键字符级别当目标关键字符类型的出现顺序在识别候选者中较低时变得较低。
c.当不同程度等于识别候选者中的出现顺序,且目标关键字符类型的出现顺序不是识别候选者中的第一个时,当相对于第一顺序字符类型的类似程度和相对于关键字符类型的类似程度之间的差别较大时,关键字符级别较低。
满足上述三个特性的函数可被表示如下。
fk(di)=(si/sc)/(1+i×((si-sl)/sc)
其中0≤fk≤1,0≤si<1
在上述公式中,i表示作为识别结果的候选者字符类型中关键字符类型k的出现顺序,si表示此时的类似程度,且sc表示通过实验适当确定的一个常数。
如果该关键字符级别得到计算,则具有等于或高于一个阈值的关键字符级别的一个字符被定义为关键字符候选者,且具有非零且低于该阈值的关键字符级别的一个字符被定义为准关键字符候选者。诸如上述关键字符级别的信息、具有非0关键字符级别的关键字符类型、暂定分离和整合的存在、图象中的包围矩形的坐标等等的信息,被输入到图案信息表中。
一个地址知识单元44包括一个地址层次结构知识单元45和在地址知识单元46中的一个关键字符位置。
地址层次结构知识单元45输入有关关键字符的层次结构的地址层次结构知识,其中该关键字符诸如“都”(首府)、“道”(专区)、“府”(专区)、“県”(专区)、“市”(城市)、“町”(城镇)、“村”(村庄)、“郡”(县)等等。例如,只有关键字符“町”(城镇)和“村”(村庄)位于关键字符“郡”—它不会出现在关键字符“区”(行政区)或“市”(城市)之前—之后的信息得到输入。在这种地址层次结构知识中,具有最高层次结构级别的字符—诸如“都”(首府)、“道”(专区)、“府”(专区)或“県”(专区)可被省略。
在地址知识单元46中的关键字符位置输入与地址中关键字符的可能的排列位置有关的地址知识中的关键字符位置。例如,它存储关键字符从未作为地址的开头字符出现、关键字符从未相邻地出现、包含作为结尾的关键字符“県”的字符的数目是3或4个的信息。
一个关键字符候选者确定单元47分别从地址层次结构知识单元45和地址知识单元46地址层次结构知识和地址知识中的关键字符位置。随后,该关键字符候选者确定单元47把与所有提取的关键字符组中的地址层次结构知识和地址知识的关键字符位置一致的字符定义为一组关键字符候选者。如果没有关键字符候选者得到确定,则它把有关不充分的关键字符的层次和字符类型的信息发送到一个不充分关键字符再提取单元48,并请求对关键字符候选者进行再提取。当不充分关键字符再提取单元48成功地再提取了一个关键字符候选者时,它确定包括由不充分关键字符再提取单元48再提取的关键字符候选者的一组关键字符候选者。当该组关键字符候选者被确定时,暂定分离或整合的字符得到实际分离或整合。
当不充分关键字符再提取单元48不能通过仅通过采用输入到图案信息表中的关键字符候选者检测与地址层次结构知识和地址知识中的关键字符位置相一致的一组关键字符候选者而确定一组关键字符候选者时,它再提取输入到图案信息表中的准关键字符候选者中的第一至第N个识别结果中的不充分层次结构级中的关键字符类型中包含的图案,作为关键字符候选者。
一个地址名称字分割单元49分割从一个地址的第一个字符至第一关键字符之前的字符的每一个图案,以及第二和随后的关键字符包围的所有图案中的每一个以作为一个地址名称字图案。
一个地址名称字字典单元50输入日语的一个地址名称的特征矢量。输入到地址名称字字典单元50中的一个地址名称的特征矢量代表了一组字符或表示一个地址名称的字符串。一个地址名称的特征矢量情况从一个学习图案提取。
一个地址名称字集体识别单元51表示一个特征提取单元52和一个字典参照单元53。
特征提取单元52从存在于一行的开始与一个关键字符之间的各个地址名称字图案以及存在于关键字符之间的地址名称字图案提取特征矢量。
字典参照单元53通过把特征提取单元52提取的地址名称字图案的特征矢量与从地址名称字字典单元50输入的地址名称的特征矢量相比较,输出一个地址名称候选者。
一个单个字符识别字典单元54输入每个字符的特征矢量。
一个单个字符识别单元55包括单个字符分割单元56、单个字符分割单元56、以及字典参照单元58。当一个既不是代表诸如“丁目”、“番地”、“方書”等的字符串又不是一个关键字符的图案被读取时,该图案被一个字符一个字符地分割,以识别一个单个字符。
单个字符分割单元56从输入图案分割字符。
特征提取单元57分割由单个字符分割单元56分割的图案的特征矢量。
字典参照单元58通过把特征提取单元57提取的特征矢量与在单个字符识别字典单元54中输入的字符的特征矢量进行比较,识别各个字符。
一个地址名称信息单元59存储关于作为一个地址所表示的地址名称组合是否可接受或者作为一个地址表示的地址名称的顺序是否适当的地址名称知识。地址名称信息单元59能够编码并存储已有的地址名称。
一个地址判定单元60,通过参照地址名称信息单元59,检查从地址名称字集体识别单元51输出的地址名称候选者是否与前面或随后的地址名称候选者相一致。
因此,第一至第N个图案中的所有包含关键字符类型的图案都未被定义为关键字符候选者,但关键字符级别根据识别结果的距离和关键字符的顺序得到了定义。随后,只从具有高关键字符级别的图案中,获得与地址层次结构知识和地址知识中的关键字符位置一致的一组关键字符候选者。只有当与地址层次结构知识和地址知识中的关键字符位置相一致的一组关键字符候选者由于不充分关键字符类型而不能获得时,才从较低关键字符级别的图案中再提取识别结果中的包含处于不充分层次结构级别处的关键字符类型的图案。其结果候选者组的数目可以小得足够抑制错误匹配的可能性和进行有效的处理。
进一步地,接触处理、分离处理、整合处理只用于关键字符提取处理。为了识别一个地址名称字图案,该地址名称字图案被集体地处理。因此,即使当关键字符彼此接触时,也能够正确地提取关键字符。该接触处理、分离处理、和整合处理对于地址名称图案得到了省略,以进行识别处理,从而有效地进行处理。
当地址名称图案得到识别时,它不在被分离成字符单位之后得到识别,而是地址名称字图案得到集体处理以提取一个特征并参照一个字典。因此,当地址名称字图案被分离时发生的错误分割和错误识别可得到避免,且识别速率可得到改善。例如,即使当一个地址包含诸如“川”的限定符时,由于错误分割引起的错误识别也能够得到避免。其结果,地址读取中的精度即使在例如用户输入卡、询问明信片等的自由间距手写地址图象包含接触字符时也能够得到改善。
当一个关键字符由于它不唯一而不能得到读取时,地址识别的可靠性可通过操作单个字符识别单元55而输出一个直接读取结果,而得到改善。
图8是流程图,显示了根据本发明的一个实施例的分离部分确定/分离处理。
在图8中,分离部分确定/分离单元35计算由一个单个字符区域确定单元32确定的单个字符区的图案上的高/宽比(步骤S1)。当一个图案的高/宽比小于一个阈值时,就认为该图案不可能与其他字符接触,且该图案被排除在将要分离的候选者之外(步骤S2)。
另一方面,当一个图案的高/宽比等于或大于该阈值时,直方图生成单元35根据图案的高/宽比预测接触字符的数目(步骤S3),并产生该图案的黑象素数目直方图(步骤S4)。
随后,暂定分离点候选者提取单元36检测直方图生成单元35产生的黑象素数目直方图的最小点(步骤S5),并把具有等于或小于阈值的最小点的值定义为一个暂定分离点候选者。
对于其中已经检测到暂定分离点候选者的图案,暂定分离点候选者确定单元37在字符是水平书写时提取距图案的包围矩形的开始点平均字符宽度的1/2的倍数的水平距离的一个点,且当字符是纵向书写时提取距离图案的包围矩形的起始点平均字符高度的1/2的倍数的纵向距离的一个点。这些点中在一个预定范围内的一个暂定分离点候选者被定义为一个暂定分离点(步骤S6)。
分离部分确定/分离单元34,当暂定分离点候选者确定单元37确定的暂定分离点的数目大于0(步骤S7)时,暂定地用通过暂定分离点的一条直线或曲线分割该图案(步骤S8)。分离部分确定/分离单元34在暂定分离点候选者确定单元37确定的暂定分离点的数目为0时不对图案进行暂定分割。
图9是流程图,显示了根据本发明的一个实施例的关键字符候选者提取处理。
在图9中,关键字符候选者提取单元39通过对暂定分离获得的图案进行分别处理而识别单个的图案(步骤S11)。当一个单个图案得到识别时,关键字符识别字典38得到参照,且暂定分离得到的图案被与输入关键字符识别字典38的图案进行比较从而输出第一至第N级的候选者字符类型。
随后,利用有关单个图案的识别结果,该单个图案的关键字符级别得到计算(步骤S12)。
根据单个图案的关键字符级别,判定该单个图案是属于一个关键字符候选者、准关键字符候选者、还是非关键字符(步骤S13)。
当相邻的图案被整合成一个单个图案时,图案整合确定/整合单元40根据整合图案的宽度和高度确定整合图案是否可能是一个字符(步骤S14)。如果整合图案可以是一个字符,可通过把该单个图案暂定整合成相邻图案,产生暂定整合图案(步骤S15)。
随后,把整合图案与输入关键字符识别字典38的图案进行比较,以输出第一至第N级的候选者字符类型(步骤S16)。
随后,利用有关整合图案的识别结果,计算整合图案的关键字符级别(步骤S17)。
根据整合图案的关键字符级别,判定整合图案是属于一个关键字符候选者、准关键字符候选者、还是非关键字符(步骤S18)。
随后,对于各个单个图案和整合图案,图案信息表产生单元43在图案信息表中输入诸如关键字符级别、具有不为0的关键字符级别的关键字符类型、暂定分离或整合的存在、图象中的包围矩形的坐标等的信息(步骤S19)。
判定暂定分离之后的所有图案是否都已经进行了上述处理(步骤S20)。如果还未对所有图案进行上述处理,则控制返回到步骤S11,且重复上述处理(步骤S20)。
图10是流程图,显示了根据本发明的一个实施例的关键字符候选者确定处理和关键字符再提取处理。
在图10中,关键字符候选者提取单元确定单元47访问地址层次结构知识单元45中的一个地址层次结构知识61和地址知识单元46中的关键字符位置中的地址知识62中的一个关键字符位置。从关键字符候选者提取单元39提取的所有关键字符候选者组,与地址层次结构知识61和地址知识62中的关键字符位置一致的候选者作为关键字符组而得到提取(步骤S21)。
当关键字符组候选者的数目大于0时(步骤S22),表示一个成功的提取。
另一方面,如果没有关键字符组得到提取(步骤S22),则通过访问地址层次结构知识61和地址知识62中的关键字符位置预测不充分关键字符的字符类型和层次结构级别(步骤S23),且获得的信息被发送到不充分关键字符再提取单元48。
随后,不充分关键字符再提取单元48访问一个图案信息表63,并再提取一个准关键字符候选者以作为一个关键字符候选者—该准关键字符候选者是被输入在图案信息表63中的并是包含第一至第N个识别结果中的不充分层次结构级别的关键字符类型的图案(步骤S24)。
随后,从包括从不充分关键字符再提取单元48再提取的准关键字符候选者的所有关键字符候选者组中,提取出与地址层次结构知识61和地址知识62中的关键字符位置一致的组,作为关键字符组。
当关键字符组候选者的数目大于0时(步骤S25),表明一个成功的再提取。
另一方面,如果没有关键字符组得到提取,则输出一个错误码以作为不成功的关键字符提取。然而,即使没有关键字符组得到提取,也可通过激活单个字符识别单元55而输出一个字符一个字符的识别结果。因此,可防止一个地址在关键字符提取中被错误地读取。
以下通过结合实际的手写字符串,对根据本发明的地址识别设备进行实际的描述。
图11A显示了包含接触字符的手写地址的字符串的第一个例子。
在图11A中,地址“余市郡余市町”是手写在询问明信片的自由间距栏中的。手写地址的字符串被一个扫描器等读取,且从二进制图象数据提取出一行。在此字符串图象上,通过标签单元31对各个不同的相连元素进行标签处理。
其结果,第一个“余”的一部分与第一个“市”和“郡”的左半部分彼此接触。因此,这些图案被定义为一个相连的元素并被给予标签1。第一个“余”的其余部分被给予标签2和3且“郡”的右半部分被给予标签4。由于第二个“余”包含三个分离的图案,它被给予标签5至7。由于第二个“市”包含两个分离的图案,它被给予标签8和9。“町”被给予标签10。当具有标签1至10的相连元素得到提取时,包围各个相连元素的矩形得到产生。
图10B显示了包围矩形包围的标签图象。
在图11B中,与带有标签1至10的各个相连元素相应地,产生出包围各个相连元素的矩形K1至K10。当包围矩形K1至K10被产生时,包围矩形K1至K10的重叠程度得到确定。当包围矩形具有高的彼此重叠程度时,它们被彼此整合。
图11C显示了整合包围矩形的结果。
在图11C中,由于包围矩形K2和K3被包括在包围矩形K1中,包围矩形K2和K3被整合到包围矩形K1中。类似地,由于包围矩形K6和K7被包括在包围矩形K5中,包围矩形K6和K7被整合到包围矩形K5中。
因此,即使不同的标签由于字符的组成部分被分离而被给予了一个字符的部分,通过整合具有高重叠程度的包围矩形,这些组成部分被作为同一字符的组成部分而得到集体处理。
随后,单个字符区提取单元32根据整合所获得的包围矩形K1、K4、K5、K8和K10的位置,获得一个单个字符区。当获得了一个单个字符时,平均字符大小计算单元33,通过例如从单个字符区排除太大或小的包围矩形,计算平均字符宽度We和平均字符高度Wh。例如,平均字符大小计算单元33,通过排除包围矩形K1和K4且只使用包围矩形K5、K8和K10,计算出平均字符宽度We和平均字符高度Wh。
接触字符确定/分离单元34对包围矩形K1、K4、K5、K8、K10中的各个图案确定它们是否包含接触字符,并分离包含接触字符的图案。即,各个包围矩形K1、K4、K5、K8和K10的宽度W和高度H。假定宽度/高度的阈值、水平书写的宽度、以及纵向书写的高度分别是Rth、Wth和Hth。如果满足以下的表示的包围矩形存在,则在该包围矩形中的图案被当作包含接触字符的包围矩形。
W>Wth,且W/H>Rth(水平书写)
H>Hth,且W/H<Rth(纵向书写)
在图11C中的例子中,假定在包围矩形K1、K4、K5、K8和K10中,包围矩形K1满足了上述条件,且包围矩形K1中的图案包含了接触字符。
图12A显示了接触字符串的提取结果。
在图12A中,在包围矩形K1中的图案被显示为接触字符的候选者。当接触字符的候选者被提取时,接触字符的数目在水平书写时根据We/2且在纵向书写时根据He/2而得到计算。即,接触字符的数目可以是1.5、2.0、2.5等,而误差被近似到0.5单位。其结果,图12A显示的接触字符数目为2.5。
因此,通过以0.5字符单位计算接触字符的数目,即使只有水平书写字符的右或左半,或者只有纵向书写字符的上或下半彼此接触,也能够有效地分离接触字符。当接触字符的数目得到计算时,得到了在黑象素数目直方图中的暂定分离点候选者的位置。
图12B显示了接触的字符串的黑象素数目直方图中的暂定分离点候选者的位置。
在图12B中,一个直方图生成单元35通过对图12A所示的图案进行纵向扫描而获得黑象素数目直方图,并用移动平均等使其平滑。
暂定分离点候选者提取单元36获得黑象素数目直方图的最小点中具有小于黑象素数目直方图的阈值Hth的值的所有点,并把这些点定义为暂定分离点候选者。在图12B显示的例子中,黑象素数目直方图的阈值Hth被设定为13(Hth=13),且获得了作为暂定分离点候选者的点P1至P6。黑象素数目直方图的阈值Hth可根据输入图象的分辨率来确定。对于高分辨率的图象,黑象素数目直方图的阈值可被设定为较大的值。
暂定分离点候选者确定单元37通过对于水平书写把字符宽度W或者对于纵向书写把字符高度H分割成沿着黑象素数目直方图的纵向轴的0.5字符单位,而获得一个点Ci(i=1,2,……)。在图12B显示的例子中,由于接触字符的数目被计算为2.5,获得了四个分割点C1至C4。
随后,一个暂定分离点得到确定,从而使至少一个暂定分离点能够被设定在从沿着黑象素数目直方图的水平轴距离Dth的范围内。即,当在距分割点Ci距离Dth的范围内的暂定分离点候选者的数目仅为一时,该点被定义为暂定分离点。当在距分割点Ci距离Dth的范围内有多个暂定分离点候选者时,具有黑象素数目直方图的最小值的点被定义为暂定分离点。即,假定在距分割点Ci距离Dth的范围内有m(m>1)个暂定分离点候选者,且在各个点的黑象素数目直方图的值是hk(k=1,………m),满足以下表示的暂定分离点候选者Pk是一个暂定分离点。
min(hk)(k=1,……m)
然而,当还有多个满足这些条件的暂定分离点候选者Pk时,具有水平轴的距离Dth的最小值的点被定义为暂定分离点。
在图12B显示的例子中,暂定分离点候选者P1存在于距分割点C2距离Dth的范围内。在暂定分离点候选者P1至P6中,只有暂定分离点候选者P1处于距分割点C2距离Dth的范围内。因此,暂定分离点候选者P1被定义为暂定分离点。
由于暂定分离点候选者P2不存在于距分割点C1、C2、C3和C4距离Dth的任何范围内,它不被定义为暂定分离点。
暂定分离点候选者P3和P4存在于距分割点C3距离Dth的范围中,在距分割点C3距离Dth的范围内有多个暂定分离点候选者。因此,检查暂定分离点候选者P3和P4的黑象素数目直方图的值hk,且具有黑象素数目直方图最小值hk的点被定义为暂定分离点。然而,对于暂定分离点候选者P3和P4黑象素数目直方图的值hk是相同的。因此,对于暂定分离点候选者P3和P4,距分割点C3的距离Dth得到检查,且表示距分割点C3的较短距离的候选者被定义为暂定分离点。其结果,由于距分割点C3的暂定分离点候选者P4的距离Dth比暂定分离点候选者P3的短,暂定分离点候选者P4被定义为暂定分离点。
由于暂定分离点候选者P5不存在于距分割点C1、C2、C3和C4距离Dth的任何范围内,所以它不被定义为暂定分离点。
暂定分离点候选者P6存在于距分割点C4距离Dth的范围内。在暂定分离点候选者P1至P6中,只有暂定分离点候选者P6处于距分割点C4距离Dth的范围内。因此,暂定分离点候选者P6被定义为暂定分离点。
图12C显示了一个接触字符串的黑象素数目直方图中的暂定分离点的位置。
在图12C中,当暂定分离点P1、P4和P6得到确定时,图11A中所示的图案得到暂定分离。
因此,即使一个图案在错误的点被分离,一个字符最差也是通过以0.5字符单位确定暂定分离部分而得到分割,从而减小了错误的分离,且进一步地通过考虑把包围矩形整合到相邻的矩形中而从错误分离得到恢复。
图13A显示了有关图12所示的字符串的暂定分离结果。
在图13A中,当图12A显示的图案在图12C中的暂定分离点P1、P4和P6处得到分离时,通过分离获得的各个图案被包围矩形K11至K14所包围。
图13B显示了确定通过暂定分离获得的单个图案是否能够得到整合的结果。
在图13B中,图案整合确定/整合单元40确定暂定分离的字符串的图案能够依次被整合成相邻的包围矩形K11至K14、K4、K5、K8和K10中的图案。如果判定包围矩形的整合可以进行,则产生暂定整合图案。在这种整合判定中,假定一个目标图案被整合到一个相邻图案(当字符水平书写时是右相邻图案,且当字符是纵向书写时是下相邻图案),并检查以下条件是否得到满足。
WI<WIth,WI/HI<RIth(当字符水平书写时)
WI<WIth,WI/HI>RIth(当字符纵向书写时)
当上述条件得到满足时,判定图案可被整合。
在上述表达式中,HI表示整合之后的图案高度,WI表示整合之后的图案宽度,RIth表示宽度与高度的比值的阈值,WIth表示当字符水平书写时宽度的阈值;且HItH表示当字符纵向书写时高度的阈值。
当包围矩形K11和包围矩形K12被整合时,整合的图案的宽/高比变得大于图13B所示的例子中的阈值RIth。因此,判定包围矩形K11中的图案不能被整合到包围矩形K12中的图案中。还判定包围矩形K12中的图案不能被整合到包围矩形K13中的图案中,因为如果它们被整合,图案的宽/高比低于阈值RIth,且图案的宽度小于阈值WIth。
类似地,判定包围矩形K13中的图案不能被整合到包围矩形K14中的图案中,判定包围矩形K14中的图案不能被整合到包围矩形K4中的图案中,判定包围矩形K4中的图案不能被整合到包围矩形K5中的图案中,判定包围矩形K5中的图案不能被整合到包围矩形K8中的图案中,且判定包围矩形K8中的图案不能被整合到包围矩形K10中的图案中。
当判定图案不能被整合时,关键字符候选者提取单元39,通过为各个单个图案和暂定整合的图案提取特征并访问字典,而输出作为识别结果的第一至第N阶字符类型。当判定图案不能被整合时,关键字符候选者提取单元39通过只为单个图案提取特征和访问字典而输出作为识别结果的第一至第N最高顺序字符类型。
图14A显示了通过暂定分离获得的单个图案的识别结果。在图14显示的例子中,第一至第十字符类型被作为识别结果而输出。
图14A显示了当在图13B中显示的包围矩形K12中的图案被作为一个单个图案处理时获得的识别结果。在此单个图案识别结果中,“付”、“竹”、“甘”、“对”、“行”、“所”、“氏”、“科”、“杵”、“同”出现在第一至第十字符候选者。进一步地,作为包围矩形K12与各个字符类型候选者之间的距离,计算出506、518、536、538、551、554、559、561、572和574。
图14B显示了从暂定分离获得的暂定整合单个图案的识别结果。
在图14B中,作为把包围矩形K13中的图案整合成包围矩形K12中的图案的结果,产生了一个暂定整合图案。在包围矩形K15中的暂定整合图案的这种识别结果中,“市”、“布”、“府”、“弟”、“巾”、“右”、“虎”、“防”、“古”、“街”出现在第一至第十字符类型候选者中。另外,作为包围矩形K15中的暂定整合图案与各个字符类型的候选者之间的距离值,计算出253、351、398、406、413、432、435、436、336和451。
在包围矩形K15中的整合图案的第一至第十个字符类型候选者中,关键字符“市”作为第一级字符类型出现。当在第一至第十字符类型候选者中存在关键字符时,该关键字符级别得到计算,以获得一个关键字符候选者和一个准关键字符候选者。
当一个关键字符作为例如第i个目标图案出现时,该关键字符级别可用表示距离的di定义如下。
关键字符级别=1/(1+di×(1+(i-1)×wi)/dth)(i=1,2,……N)
其中wi是一个小于1的正值,并表示候选级的权。权wi是这样定义的,即当距离di为无穷时关键字符级别被置为0,当距离di是0时关键字符级别被置为1,且当距离di是dth时关键字符级别被置为0.5。具有等于或大于0.5的关键字符级别的图案被定义为一个关键字符候选者。具有小于0.5且不等于0的的关键字符级别的图案被定义为准关键字符候选者。具有等于0的关键字符级别的图案被定义为一个关键字符候选者。具有大于0.5的关键字符级别的图案被定义为非关键字符类型。
在图14A所示的例子中,由于单个图案的字符级别是0且wi=0.2且dth=480,该图案被假定是非关键字符类型。另一方面,由于暂定整合图案的关键字符级别是0.65,字符类型“市”被假定是一个关键字符候选者。
因此,诸如各个图案是否能够被整合到其相邻的图案中的判定、关键字符级别、关键字符得到确定时的字符类型和层次结构级别等等的信息被存储在图案信息表中。
图15显示了为图11A显示的字符串产生的图案信息表的一个例子。
在图15中,一个图案信息表包含这样一些栏—这些栏用于图13B所示的包围矩形K11至K14、K4、K5、K8和K10中的每一个单个图案以及整合到右相邻单个图案中的包围矩形K11至K14、K4、K5、K8和K10中的单个图案的每一个暂定整合图案的标记信息、层次结构级别信息、字符类型、字符级别、相关行、行中的序号等的输入项。一个标记1表示一个关键字符候选者。一个标记2表示一个准关键字符候选者。一个标记0表示其他的字符类型。在图15显示的例子中,关键字符级别用百分比表示。层次结构级别信息栏包含用于表示一个地址的关键字符的层次结构级别。
图16显示了包含用于表示一个地址的关键字符的层次结构级别的表。
在图16中,关键字符“都”、“道”、“府”和“県”的层次结构级别是1,关键字符“市”和“郡”的层次结构级别是2,关键字符“区”的层次结构级别是3,且关键字符“町”和“村”的层次结构级别是4。
在图15显示的图案信息表中,通过图案整合确定/整合单元40判定包围矩形K11、K4、K5、K8和K10中的暂定整合图案不能被整合。因此,这些栏是空白的。
包围矩形K12、K14和K5中的单个图案以及包围矩形K13中的暂定整合图案和单个图案具有标记0,表示这些图案指的是关键字符以外的字符类型的图案且关键字符级别为0.0%。
包围矩形K11中的单个图案具有标记2,表示该图案指的是准关键字符候选者。字符“村”被表示为准关键字符候选者的字符类型。字符“村”的层次结构字符级别是4,且关键字符级别是25.4%。
包围矩形K11中的暂定整合图案具有标记1,表示该图案指的是一个关键字符候选者。字符“市”被表示为关键字符候选者的字符类型。字符“市”的层次结构字符级别是2,且关键字符级别是65.5%。
包围矩形K14中的暂定整合图案具有标记1,表示该图案指的是一个关键字符候选者。字符“郡”被表示为该关键字符候选者的字符类型。字符“郡”的层次结构字符级别是2,且关键字符级别是63.4%。
包围矩形K4中的单个图案具有标记2,表示该图案指的是准关键字符候选者。字符“区”被表示为准关键字符候选者的字符类型。字符“区”的层次结构字符级别是3,且关键字符级别是45.8%。
包围矩形K8中的单个图案具有标志1,表示该图案指的是一个关键字符候选者。字符“市”被表示为该关键字符候选者的字符类型。字符“市”的层次结构字符级别是2,且关键字符级别是60.0%。
包围矩形K10中的单个图案具有标志1,表示该图案指的是一个关键字符候选者。字符“町”被表示为该关键字符候选者的字符类型。字符“町”的层次结构字符级别是4,且关键字符级别是67.9%。
当图15所示的图案信息表被生成时,其标记被置于1的暂定整合图案和单个图案作为关键字符候选者而得到提取。随后,在图案信息表中所示的关键字符候选者的组合得到考虑,且判定这些组合是否包括一致的地址层次结构知识和地址知识中的关键字符位置。
图17显示了从图11A中显示的字符串中提取的关键字符候选者。
在图17中,通过把图13B中显示的包围矩形K12中的图案整合到包围矩形K13中的图案中而获得的暂定整合图案,作为一个关键字符候选者,而得到提取,并被包围矩形K15所包围。被包围矩形K15所包围的图案“市”被图7所示的分离部分确定/分离单元34暂定分离成一半,并随后被通过关键字符候选者提取单元39进行的整合和识别处理整合成一个。因此,判定图案是“市”。
因此,即使当相连图案被分离时一个关键字符被分离成两个部分的图案,相邻的图案也能够在进行识别处理时被整合在一起,从而正确地提取一个关键字符。
通过把图13B中所示的包围矩形K14中的图案整合到包围矩形K4中的图案中而获得的暂定整合图案,作为一个关键字符候选者,而得到提取,并被包围矩形K16所包围。包围矩形K15所包围的图案“都”原来是由两个分离的图案形成的。图案“郡”的左一半和右一半被作为分离的图案而得到提取。如图11A所示,图案“郡”的左一半与同图案“郡”相邻的字符“市”相接触。其结果,如图11C所示,图案“郡”的左一半被假定是在包围矩形K1中的一个图案,而图案“郡”被假定是在包围矩形K4中的一个图案。
图案“郡”的左一半,由图7显示的分离部分确定/分离单元34,被从包围矩形K1中的图案分离出来。被分离所分割的图案“郡”的左一半,在由关键字符候选者提取单元39进行整合和识别处理中,被整合成图案K4,且图案“郡”作为一个关键字符候选者而得到提取。
图13A中显示的包围矩形K8中的图案作为一个关键字符候选者“市”而得到提取,且图13A中所示的包围矩形K10中的图案作为一个关键字符候选者“町”而得到提取。
当关键字符候选者得到提取时,关键字符候选者提取单元47分别从地址层次结构知识单元45和地址知识单元46中的关键字符位置提取地址层次结构知识和地址知识中的关键字符位置,并检查是否有与地址层次结构知识和地址知识中的关键字符位置相一致的关键字符候选者的组合。
图18A显示了用于表示一个地址的关键字符的层次结构。
在图18A中,地址层次结构取决于{都}或{道},以及{府}或{県}。关于“都”,能够跟随“都”的关键字符是{区}、{区,町}、{市}、{市,町}、{郡,町}、{郡,村}、{町}、以及{村}。关于{道}、{府}和{県},能够跟随{道}、{府}或{県}的关键字符是{市}、{市,区}、{市,区,町}、{市,町}、{郡,町}、以及{郡,村}。
地址知识中的关键字符位置是有关诸如“一个关键字符未出现在一行的开头”、“一个关键字符未出现在另一关键字符之后”等的关键字符的出现位置的知识。
通过参照地址层次结构知识和地址知识中的关键字符位置,作为地址名称中的关键字符类型的错误识别或图案的错误分割的结果,不满足这些规则的关键字符候选者能够被除去。当在地址名称中有不能由字符确定的不确定的关键字符时,则一组多个关键字符被定义为关键字符组候选者,且随后地址名称字集体识别单元51能够确定一个正确的关键字符组。
图18B显示了可用于图17中所示的关键字符候选者的一个关键字符组。
在图18B中,图17中所示的关键字符候选者的以下三种组合与地址层次结构知识和地址知识中的关键字符位置一致。
第一组{市,町} ○市○○○町
第二组{郡,町} ○○郡○○町
第三组{市}○○○○市○
当有与地址层次结构知识和地址知识中的关键字符位置一致的关键字符组时,与该关键字符组候选者相应的图案的暂定整合结果和暂定分离点被确定为整合结果和分离位置。
当关键字符组候选者得到确定时,有关各个关键字符组候选者的信息被传送到地址名称字分割单元49。地址名称字分割单元49根据关键字符位置信息为各个关键字符组候选者分割地址名称字候选者。
例如,当图18B中所示的{市,町}被用作关键字符组候选者时,在{市}之前的一个图案和在{市}与{町}之间的一个图案作为地址名称字而从图13所示的图案得到提取。其结果,分别与“余”和“郡余市”相应的图案作为地址名称字而得到提取。
当图18B中显示的{郡,町}被用作关键字符组候选者时,在{郡}之前的一个图案和在{郡}与{町}之间的一个图案作为地址名称字而从图13所示的图案得到提取。其结果,分别对应于第一个“余市”和第二个“余市”的图案作为地址名称字而得到提取。
当图18B中的{市}被用作关键字符组候选者时,在{市}之前的一个图案和在{市}之后的一个图案作为地址名称字而从图13所示的图案得到提取。其结果,分别对应于“余市郡余”和“町”的图案作为地址名称字而得到提取。
特征提取单元52为被地址名称字分割单元49分割的地址名称字图案提取一个图象特征。
例如,当图18B所示的{市,郡}被用作关键字符组候选者时,与作为地址名称而被提取的“余”和“郡余市”对应的相应图案的特征矢量得到提取。当图案“郡余市”的特征矢量得到提取时,图案“郡余市”得到集体处理,而不是把“郡余市”分离成字符单位“郡”、“余”、“市”再进行处理。因此,整个字符串“郡余市”的特征矢量得到提取。
当图18B显示的{郡,町}被用作关键字符组候选者时,分别与作为地址名称而得到提取的第一个“余市”和第二个“余市”对应的图案的特征矢量得到提取。当“余市”的特征矢量得到提取时,图案“余市”被集体地处理,而不是把“余市”分离成字符单位而单独地提取“余”和“市”。因此,整个字符串“余市”的特征矢量得到了提取。
当图18B中所示的{市}被用作关键字符组候选者时,与作为地址名称而得到提取的“余市郡余”和“町”对应的相应图案得到提取。当图案“余市郡余”的特征矢量得到提取时,图案“余市郡余”得到集体处理,而不把它分离中心字符单位以单独地提取“余”、“市”、“郡”、“余”。因此,整个字符串“余市郡余”的特征矢量得到了提取。
地址名称字字典单元50能够输入表示日本所有地址名称的图案的特征矢量。例如,地址名称的属性是“県”,表示诸如“千叶”、“神奈川”、“埼玉”等的地址名称的图案的特征矢量与属性“県”相对应地得到输入。如果地址名称的属性是区,则表示“世田谷”、“千代田”、“中央”等的图案的特征矢量与属性“区”相应地得到输入。
例如,当刚好在关键字符“県”之前的图案得到识别时,只把它与表示与属性“県”相应的地址名称的图案进行比较。
因此,当进行地址名称识别时,比较的频率能够得到降低,从而迅速地进行整个处理。
字典参照单元53根据关键字符检查刚好在该关键字符之前的地址名称的属性。随后,在输入到地址名称字字典50中的地址名称的特征矢量中,把与地址名称的属性相应的地址名称字图案的特征矢量同用特征提取单元52提取的地址名称字图案的特征矢量进行比较。
例如,当图18B所示的{市,町}被用作关键字符组候选者时,把作为地址名称字提取的{余}和{郡余市}的特征矢量与输入到地址名称字字典单元50中的地址名称的特征矢量相比较。由于作为地址名称字提取的“余”的属性是{市},所以把它和输入到地址名称字字典单元50中的地址名称的特征矢量中具有属性{市}的地址名称的特征矢量进行比较。由于作为地址名称字而提取的“郡余市”的属性是“町”,所以把它和输入到地址名称字字典单元50中的地址名称的特征矢量中具有属性“町”的特征矢量进行比较。
假定在日语的地址名称中不存在名称为“余”的{町}和名称为“郡余市”的{町},则不输出地址名称字图案“余”或地址名称字图案“郡余市”的识别结果,否则识别速率将大大降低。因此,可从关键字符组候选者中除去{市,町}。
当图18B所示的{郡,町}被用作关键字符组候选者时,把作为地址名称字提取的第一个“余市”和第二个“余市”的各个特征矢量与输入到地址名称字字典单元50中的具有属性{郡}的地址名称的特征矢量进行比较。由于作为地址名称字提取的“余市”的属性是{市},所以把它与输入地址名称字字典单元50中的地址名称特征矢量中具有属性{市}的地址名称的特征矢量进行比较。由于作为地址名称字提取的第二个“余市”的属性是“町”,所以把它与输入地址名称字字典单元50中的地址名称的特征矢量中具有属性{町}的地址名称的特征矢量进行比较。
假定在日语地址名称中存在有名称为“余市”的{郡}和名称为“余市”的{町},输入到地址名称字字典单元50,则输入到地址名称字字典单元50中的地址名称作为一个地址名称候选者而得到输出,以作为地址名称字图案“余市”的识别结果。当为一个地址名称字图案输出多个地址名称候选者时,可通过参照地址名称信息单元59中的地址名称知识而选择一个正确的地址名称候选者。
当图18B中所示的{市}被用作一个关键字符组候选者时,把作为地址名称字提取的“余市郡余”和“町”的特征矢量与在地址名称字字典单元50中的特征矢量进行比较。由于作为地址名称提取的“余市郡余”的属性是{市},把它与输入到地址名称字字典单元50中的地址名称的特征矢量中具有属性{市}的地址名称的特征矢量进行比较。
假定在日语地址名称中不存在名称为“余市郡余”的{市}和地址名称{町},则不输出地址名称字图案“余市郡余”或地址名称字图案“町”的识别结果,否则识别速率会大大降低。因此,可从关键字符组候选者中除去{市}。
地址名称信息单元59存储有关地址名称之间的联系的知识。例如,有关在地址名称“余市郡”之后是否有具有“余市町”的地址名称的知识,以及有关能够跟随在地址名称“横滨市”之后的{区}名称的知识。
地址确定单元60从地址名称信息单元59获取地址名称知识,并从地址集体识别单元51输出的地址名称候选者中输出与该地址名称知识一致的候选者,作为地址读取结果。
例如,当判定名称为“余市”的{町}位于名称为“余市”{郡}之后一它与地址名称知识一致—时,“余市郡余市町”被作为读取地址的结果而得到输出。
当不存在与地址名称知识一致的一组地址名称时,没有地址读取结果得到输出,而是输出一个错误码。
图19显示了包含接触字符的手写地址字符串的第二个例子。
在图19中,地址“北葛城郡王寺町明神”被手写在询问明信片等的自由间距栏中。手写的地址的字符串通过一个扫描仪等而被读取,且从二进制化的图象数据提取出一行。在此字符串图象上,通过标签单元31为不同的组合元素的每一个进行标签处理。
随后,为各个相连元素产生一个包围矩形。通过整合具有大的重叠程度的包围矩形,产生出包围矩形K21至K33。当包围矩形K21至K33被产生时,判定是否有需要分离的图案。如果判定没有需要分离的图案,则进一步判定图案是否可从开头的图案依次被整合到包围矩形中的相邻图案中。当判定图案可被整合时,图案得到整合以产生一个暂定整合图案。
随后,对包围矩形K21至K33中的单个图案和被判定为实际上能够被整合的暂定整合图案进行识别处理,根据识别结果,计算出一个关键字符级别。
当获得了有关各个图案是否能够被整合到相邻图案中、有关关键字符级别、字符类型、当它是一个关键字符时的层次结构级别等的信息时,该信息被存储在图案信息表中。
图20显示了为图19所示的字符串产生的图案信息表的一个例子。
在图20中,图案信息表100包含一些栏,而这些栏被用于图19中所示的包围矩形K21至K33中的每一个单个图案以及每一个整合到右相邻单个图案中的包围矩形K11至K14、K4、K5、K8和K10中的单个图案的暂定整合图案中的用于标记信息、层次结构级别信息、字符类型、字符级别、有关的行、行中的序号等的输入项。一个标记1表示一个关键字符候选者。一个标记2表示一个准关键字符候选者。一个标记0表示其他字符类型。关键字符级别用百分比表示。层次结构级别信息栏包含用来表示一个地址的关键字符的层次结构级别。
通过图案整合确定/整合单元40判定包围矩形K24、K26至K29中的暂定整合图案不能被整合。因此,这些栏是空白的。
在包围矩形K21至K23、以及K30至K33中的单个图案和暂定整合图案,以及在包围矩形K24、K25和K28中的单个图案具有表明这些图案指的是关键字符以外的字符的标记0,且关键字符级别是0.0%。
包围矩形K25中的暂定整合图案具有标志1,表明该图案指的是一个关键字符候选者。字符“郡”被表示为关键字符候选者的字符类型。字符“郡”的层次字符级别为2,且关键字符级别是67.6%。
在包围矩形K26中的单个图案具有标志2,表明该图案指的是一个准关键字符候选者。字符“市”被表示为该准关键字符候选者的字符类型。字符“市”的层次字符级别是2,且关键字符级别是21.8%。
包围矩形K27中的单个图案具有标志2,表明该图案指的是准关键字符候选者。字符“区”被表示为准关键字符候选者提取单元的字符类型。字符“区”的层次字符级别是3,且关键字符级别是29.6%。
包围矩形K29中的单个图案具有标志2,表明该图案指的是准关键字符候选者。字符“町”被表示为该准关键字符候选者的字符类型。字符“町”的层次结构级别是4,且关键字符级别是47.9%。
当产生图案信息表时,其标记被置于1的单个图案和暂定整合图案作为关键字符候选者而得到提取。随后,图案信息表中所示的关键字符候选者的组合得到考虑,并判定这些组合是否包含一致的地址层次结构知识和地址知识中的关键字符位置。
图21A显示了从图19所示的字符串中提取的关键字符候选者。在图21A中,通过把图19中所示的包围矩形K25中的图案整合到包围矩形K26中的图案中所获得的暂定整合图案,作为一个关键字符候选者,而得到提取,并被包围矩形K34所包围。被包围矩形K34所包围的图案“郡”原来是由两个分离的图案形成的,并随后通过关键字符候选者提取单元39的整合和识别处理而被整合成一个。因此,判定该图案是“郡”。
当关键字符“郡”得到提取时,地址层次结构知识和地址知识中的关键字符位置得到访问。然而,“郡”不是被单独地用作关键字符,而是必需被关键字符“町”或“村”所跟随。
因此,当关键字符候选者确定单元47由于不充分的关键字符而不能提取关键字符组候选者时,它请求不充分关键字符再提取单元48对所需的关键字符进行再提取,并传送有关需要再提取的关键字符的信息。
例如,当关键字符候选者确定单元47只能提取“郡”的关键字符候选者时,它通知不充分关键字符再提取单元48“郡”被“町”或“村”所跟随。随后,关键字符候选者确定单元47请求不充分关键字符再提取单元48对“町”或“村”的关键字符进行再提取。
在请求再提取关键字符时,不充分关键字符再提取单元48访问图案信息表,并从准关键字符候选者提取所请求的关键字符。在此情况下,它访问与该知识一致的地址层次结构知识。
例如,图20所示的图案信息表包含包围矩形K26中的单个图案、在包围矩形K27中的单个图案、以及在包围矩形K29中的作为准关键字符候选者的单个图案。然而,字符类型中与“町”或“村”匹配的图案是在包围矩形K29中的单个图案。因此,在包围矩形K29中的单个图案作为关键字符候选者而得到再提取。
图21B显示了从图19显示的字符串中再提取的一个关键字符候选者。
在图21B中,作为关键字符候选者的再提取的结果,在图19中显示的包围矩形K34中的图案作为关键字符候选者而得到提取,且在图19中显示的包围矩形K29中的图案作为关键字符候选者“町”而得到提取。
当一个关键字符候选者被提取时,与地址层次结构知识和地址知识中的关键字符位置一致的关键字符候选者的组合得到选择。
图21C显示了可用于图19所示的字符串的关键字符组。
在图21C中,在图19所示的关键字符候选者组合中,只有一个与地址层次结构知识和地址知识中的关键字符位置一致的一个关键字符组候选者。
第一组{郡,町}
当检测到与地址层次结构知识和地址知识中的关键字符位置一致的关键字符组候选者时,关于各个关键字符组候选者的信息被传送到地址名称字分割单元49。地址名称字分割单元49根据有关关键字符的位置信息来分割各个关键字符组候选者的地址名称字候选者。例如,当图21C所示的{郡,町}被用作关键字符组候选者时,{郡}之前的一个图案、{郡}和{町}之间的一个图案、以及{町}之后的一个图案作为地址名称字而得到提取。其结果,分别与“北葛城”、“王寺”和“明神”对应的图案作为地址名称字而得到提取。
当“北葛城”的图案、“王寺”的图案和“明神”的图案作为地址名称字的图案而得到提取时,图案“北葛城”、“王寺”和“明神”的各个特征矢量得到提取。当与“北葛城”相应的图案的特征矢量得到提取时,与“北葛城”相应的图案得到了集体处理,而不是分离成字符单位以单独地提取与“北”相应的图案、与“葛”相应的图案和与“城”相应的图案的特征矢量再进行处理。因此,整个字符串“北葛城”的特征矢量得到了提取。
当与“王寺”相应的图案的特征矢量得到提取时,与“王寺”相应的图案得到了集体的处理,而不是分离成字符单位以单独地提取与“王”相应的图案和与“寺”相应的图案的特征矢量再进行处理。因此,整个字符串“王寺”的特征矢量得到了提取。
当与“明神”相应的图案的特征矢量得到提取时,与“明神”相应的图案得到了集体的处理,而不是分离成字符单位以单独地提取与“明”相应的图案和与“神”相应的图案的特征矢量再进行处理。因此,整个字符串“明神”的特征矢量得到了提取。
当“北葛城”的图案、“王寺”的图案和“明神”的图案得到提取时,把与“北葛城”相应的图案、与“王寺”相应的图案和与“明神”相应的图案的特征矢量同输入地址名称字字典单元50中的地址名称的特征矢量进行比较。由于与作为地址名称字提取的“北葛城”相应的图案的属性是{郡},所以把它与输入地址名称字字典单元50中的具有属性“郡”的地址名称的特征矢量进行比较。由于与作为地址名称字提取的“王寺”对应的图案的属性是{町},所以把它与输入到地址名称字字典单元50中的具有属性“町”的地址名称的特征矢量进行比较。
假定日语中有名称为“北葛城”的{郡}、名称为“王寺”的{町}和地址名称“明神”,则输入到地址名称字字典单元50中的作为地址名称候选者而得到输出,作为地址名称字图案“北葛城”、“王寺”和“明神”的识别结果。当对于一个地址名称字图案有多个地址名称候选者时,可通过参照地址名称信息单元59中的地址名称知识而选择一个正确的地址名称候选者。
如果判定名称为“北葛城”的{郡}、名称为“王寺”的{町}和地址名称“明神”与地址名称知识一致,则“北葛城郡王寺町明神”的字符码等得到输出,以作为读取地址的结果。
以下描述的是根据本发明的一个实施例的关键字符识别字典。
在图7中,关键字符候选者提取单元39访问关键字符识别字典38以从一个原始图象提取一个关键字符候选者,并识别各个标签图案的字符和整合的标签图案。当输入关键字符识别字典38的字符类型不受限制时,有3000个JIS第一级汉字字符类型和约1000个地址名称汉字字符需要得到检查。因此,比较的频率变得较高,且需要长的处理时间。
另一方面,假定输入关键字符识别字典38的字符类型是有限的。诸如,如果只有诸如“都”、“道”、“府”、“県”、“市”、“郡”、“区”、“町”、“村”得到输入,则不仅一个关键字符而且与该关键字符类似的图案都能够得到经常的提取,从而输出一个额外的关键字符候选者。
图22显示了当利用根据本发明的一个实施例的关键字符识别字典时关键字符类型的识别结果。
图22实际显示了,对于“見”的字符类型的取样图案61和“県”的字符类型的样本图案,利用其中输入了所有字符类型的关键字符识别字典38获得的识别结果(至第N阶的候选者字符类型和距离),以及利用其中只输入有九个字符类型即“都”、“道”、“府”、“県”、“市”、“郡”、“区”、“町”、“村”的关键字符识别字典38获得的识别结果(至第N阶的候选者字符类型和距离)。
作为样本图案61的识别结果,当使用其中输入了所有字符类型的关键字符识别字典38时,“見”作为第一候选者的字符类型而得到输出,“貝”作为第二候选者的字符类型而得到输出,且“県”作为第三候选者的字符类型而得到输出。进一步地,作为样本图案62与各个字符类型之间的距离,210、250和320得到输出。当采用其中只输入了关键字符类型的关键字符识别字典38时,“県”被作为第一候选者的字符类型而输出,加“道”作为第二候选者的字符类型而得到输出。作为样本图案61与各个字符类型之间的距离,320和640得到了输出。
作为样本图案62的识别结果,当采用了其中输入有所有字符类型的关键字符识别字典38时,“県”被作为第一候选者的字符类型输出,“見”被作为第二候选者的字符类型输出,且“貝”作为第三候选者的字符类型而得到输出。另外,作为样本图案62与各个字符类型之间的距离,320、480和590得到输出。当采用其中只输入有关键字符类型性能关键字符识别字典38时,“県”作为第一候选者的字符类型而得到输出且“道”作为第二候选者的字符类型而得到输出。320和640作为样本图案62与各个字符类型之间的距离而得到输出。
当采用其中输入有所有字符类型的关键字符识别字典38时,样本图案61与关键字符类型“県”之间的距离是320,并等于样本图案62与关键字符类型“県”之间的距离。因此,不能只通过评价关键字符类型“県”之间的距离,来判定样本图案61(它不是一个关键字符)不是一个关键字符和判定样本图案62(它是一个关键字符)是一个关键字符。然而,关键字符类型“県”的出现顺序对于样本图案61是第三而对样本图案62是第一。因此,可以通过评价关键字符类型“県”的出现顺序,来判定样本图案61(它不是一个关键字符)不是一个关键字符并判定样本图案62(它是一个关键字符)是一个关键字符。
另一方面,当采用其中只输入有关键字符类型的关键字符识别字典38时,样本图案61与关键字符类型“県”之间的距离是320,并等于样本图案62与关键字符类型“県”之间的距离。另外,关键字符类型“県”的出现顺序对于样本图案61与62来说都是第一。因此,当采用其中只输入有关键字符类型的关键字符识别字典38时,即使评价了距关键字符类型“県”的距离或关键字符类型“県”的出现顺序,也能判定样本图案61(它不是一个关键字符)不是一个关键字符和判定样本图案62(它是一个关键字符)是一个关键字符。
在此例中,如果关键字符识别字典38中的字符类型被过度地限制,可预测关键字符候选者受到极端的提取。当关键字符候选者受到极端提取时,地址很可能被错误地读取。
另一方面,如果关键字符识别字典38中有太多的字符类型,则需要过长的处理时间。因此,需要适当地限制关键字符识别字典38中的字符类型。
图23是框图,显示了根据本发明的一个实施例的关键字符识别字典的配置。
在图23中,一个关键字符识别字典201表示一个关键字符类型存储单元202和一个类似字符类型存储单元203,且输入到关键字符识别字典201中的字符类型被限制在关键字符类型和类似的字符类型。
其结果,与其中所有字符类型都被输入到关键字符识别字典中的情况相比,所要识别的图案与输入到关键字符识别字典中的字符类型之间的比较处理的频率可得到减小,从而缩短了识别地址的处理时间。进一步地,与其中只把关键字符类型输入关键字符识别字典的情况不同,可以在考虑所要识别的关键字符类型的出现顺序的情况下,判定所要识别的图案是否是一个关键字符。其结果,能够高精度地判定一个图案—而该图案不能仅通过评价所要识别的图案与关键字符类型之间的距离而以通常的方式被判定为是否为关键字符。
图24显示了输入到关键字符识别字典201中的关键字符类型的一个例子和类似的字符类型。
在图24中,关键字符类型“都”的的类似字符类型可以是例如输入到关键字符识别字典中的“郡”、“部”、“祁”和“郎”。关键字符类型“道”的类似字符类型可以是例如输入到关键字符识别字典中的“追”、“造”、“迫”和“通”。关键字符类型“府”的类似字符类型可以是例如输入到关键字符识别字典中的“麻”、“狩”、“有”和“碕”。关键字符类型“県”的类似字符类型可以是例如输入关键字符识别字典中的“吳”、“具”、“貝”和“見”。与关键字字符类型“市”类似的字符类型可以是输入到关键字符识别字典中的“布”、“巾”、“希”和“帝”。与关键字符类型“郡”类似的字符类型可以是例如输入到关键字符识别字典中的“都”、“邦”、“部”和“郎”。与关键字符类型“区”类似的字符类型可以是例如输入到关键字符识别字典中的“匹”、“巨”、“匠”和“医”。与关键字符类型“町”类似的字符类型可以是例如输入到关键字符识别字典中的“野”、“財”、“時”、和“肝”。与关键字符类型“村”类似的字符类型可以是例如输入到关键字符识别字典中的“付”、“对”、“杖”和“打”。
图25显示了当关键字符识别字典只包含关键字符类型和图24所示的类似字符类型时获得的关键字符识别结果。
在图25中,“見”作为字符类型“見”的样本图案61的第一字符类型候选者而得到输出,“貝”作为第二字符类型候选者而得到输出,“県”作为第三字符类型候选者而得到输出。“県”对于作为字符类型的“見”的样本图案62的第一字符类型候选者而得到输出,“見”作为第二字符类型候选者而得到输出,“貝”作为第三字符类型候选者而得到输出。
“県”的特征矢量与样本图案61的特征矢量之间的距离等于样本图案62的特征矢量与“県”的特征矢量之间的距离。因此,不能只根据距离来判定样本图案61不是一个关键字符。然而,对样本图案62关键字符类型
“県”的出现顺序是第一,而对样本图案62关键字符类型“県”的出现顺序是第三。因此,样本图案62可作为一个关键字符候选者而得到提取,而样本图案61可被抑制且不作为关键字符候选者进行提取,例如可通过只提取关键字符类型的出现顺序中的第一个图案作为关键字符候选者,并定义关键字符类型的出现顺序中的第二和随后的图案为非关键字符。
其结果,样本图案62(它是一个关键字符)可作为一个关键字符而得到正确的提取,且可防止样本图案62(它不是一个关键字符)被错误地作为关键字符而得到提取。至于访问的频率,通过采用存储有所有JIS第一级汉字字符类型的字典,样本图案61和62每个均需要约3000次的访问;而通过采用包含图24所示的字符类型的字典,样本图案61和62每一个只需要45次访问,从而缩短了处理时间。
图26是框图,显示了根据本发明的第六实施例的地址识别设备的配置。
在图26中,301是一个地址识别设备。一个观测单元303利用一个扫描仪、一个CCD等等来从清单302读取一个地址图象,把它作为电子数据进行存储,并把该数据转换成单色二进制数据。一个字符串分割单元304以字符串为单位分割一个地址图象。标签单元305对各个行的图象的各个相连元素进行标签处理,并对水平排列的字符进行沿着纵向方向的重叠标签整合处理。一个接触部分确定/分离单元306确定包含字符之间的接触的部分,并分离这些字符。
一个关键字符候选者提取单元308,利用关键字符字典307和关键字符级别,提取字符串中的关键字符候选者。当一个关键字符候选者得到提取时,一个字符与一个相邻的标签图象之间的整合的可能性得到了检查,对该字符和与该字符整合的一个标签图象进行字符识别处理,从而获得至第N级的识别结果。随后,识别结果中包含第一至第N个字符类型的一个字符被定义为关键字符候选者,或者具有等于或高于一个阈值的关键字符级别的一个字符被定义为关键字符候选者。输入到关键字符字典37中的字符类型被限于关键字符和它们的类似字符类型。因此,可以在不降低关键字符提取的精度的情况下以高速提取关键字符。
一个关键字符组候选者确定单元310,从被关键字符候选者提取单元308提取的关键字符候选者,确定与通过输入到一个地址层次结构知识单元309中的地址层次结构知识相一致的一个关键字符组的一个候选者。一个地址名称字区分割单元311分割被关键字符所包围的一个地址名称字区。一个地址名称字集体识别单元313,通过参照一个地址名称字识别字典312,对地址名称字进行集体识别,并确定关键字符组候选者中的一个。一个单字符识别单元315,通过从一个地址表示的各个部分一个一个地分割字符,而对一个字符进行识别。一个地址确定单元317,利用输入到一个地址知识单元316中的地址知识,检查一个读取的结果是否与一个实际地址相匹配,并输出与实际地址匹配的结果。
图27是流程图,显示了根据本发明的一个实施例的关键字符识别字典的产生方法。
在图27中,利用一个包含所有字符类型的字典对具有充分的样本图案的各个字符类型组和从第一至第N个类型的字符类型候选者进行字符识别处理(步骤S31)。如果有任何关键字符类型被包含在第一至第N个字符类型候选者中(步骤S32),则包含的关键字符类型的数目被加1(步骤S33)。假定对其进行了字符识别处理的一个字符的字符类型的样本图案的数目是Ns,且包含从第一至第N个类型的第K个关键字符的样本图案的数目是Nk,则Nk/Ns被计算出来,作为第K个关键字符类型的内容的比值(步骤S34)并检查以下的条件是否得到满足(步骤S35)。
Nk/Ns>Rth
随后,判定满足该条件的字符类型是与该关键字符类似的字符类型(步骤S36),且从包含所有字符类型的字典获取对应于和该关键字符类似的字符类型的部分(步骤S37)。在上述表达中,Rth表示一个比例阈值,并通过实验而可被置于适当的值。
例如,假定字符类型“見”的样本图案的数目是2000,作为各个样本图案进行的字符识别处理的结果的从第一至第N类型的包含关键字符类型“県”的样本图案的数目是1500,且Rth=0.5。由于Nk=1500且Ns=2000,以下的公式成立。
Nk/Ns=0.75>0.5
其结果,判定字符类型“見”是与关键字符类型“県”类似的字符类型。
图28是框图,显示了根据本发明的一个实施例的地址识别设备的系统配置。
在图28中,一个中央处理单元(CPU)401进行系统的整个处理。402是只读存储器(ROM)。403是随机存取存储器(RAM)。404是通信接口。405是通信网络。406是一个输入/输出接口。一个显示器407显示一个地址等的识别结果。一个打印机408打印识别结果等等。存储器409临时存储扫描器410读取的数据。扫描仪410读取一个输入图象等。411是一个键盘。驱动器412驱动一个存储介质。413是一个硬盘。414是一个IC存储卡。416是磁带。416是软盘。417是诸如CD-ROM、DVD-ROM等的光盘。418是总线。
用于进行地址识别处理的程序、关键字符识别字典的内容、地址名称字典的内容、地址层次结构知识、地址知识中的关键字符位置、地址名称知识等等,都被存储在存储介质中—该介质诸如硬盘413、IC存储卡414、磁带415、软盘416、光盘417等。该地址识别处理可通过把用于执行地址识别处理的程序、关键字符识别字典的内容、地址名称字典的内容、地址层次结构知识、地址知识中的关键字符位置、地址名称知识等从存储介质读到RAM403,而得到进行。进一步地,用于执行地址识别处理的程序、关键字符识别字典的内容、地址名称字典的内容、地址层次结构知识、地址知识中的关键字符位置、地址名称知识等,可被存储在ROM 402中。
用于执行地址识别处理的程序、关键字符识别字典的内容、地址名称字典的内容、地址层次结构知识、地址知识中的关键字符位置、地址名称知识等,也可通过通信接口404而从通信网络405下载。作为与通信接口404相连的通信网络405,可采用诸如LAN(局域网络)、WAN(宽域网络)、因特网、模拟电话网络、ISDN(集成服务数字网络)、PHS(个人无线电话系统)、卫星通信等。
当用于执行一个地址识别处理的程序得到激活时,CPU 401从扫描仪410读取的输入图象提取一个地址区,并从一个地址区的一个图案提取一个关键字符。随后,它判定提取的关键字符是否与地址层次结构知识和地址知识中的关键字符位置相一致,并利用与地址层次结构知识和地址知识中的关键字符位置一致的关键字符提取一个地址名称区。当一个地址名称区得到提取时,地址名称区的图案被集体地进行比较并提取一个地址名称。随后,判定提取的地址名称是否与地址名称知识一致。一个与地址名称知识一致的地址名称被输出到显示器407和打印机408,作为读取地址的结果。
以上描述的本发明的一个实施例,但本发明不限于上述的实施例,并可在本发明的技术构思的范围之内变化。例如,当一个地址的识别得到解释时,诸如“県”、“市”、“町”、“村”等的地址名称限定字符可作为关键字符得到提取。然而,当使用公司的机构的邮寄的识别时,可把诸如“部”、“課”、“係”的机构位置限定字符作为关键字符进行提取。
如上所述,根据本发明,在关键字符的点处限定的一个地址名称区中的地址名称根据分离之前的接触字符的状态而得到识别。其结果,即使形成一个字符串的字符表明彼此接触的一个地址,在地址名称识别中表示一个地址名称的整个字符串可得到集体提取和处理。因此,表示一个地址名称的字符串至字符的分割处理可得到省略,且地址能够得到有效的识别。由于不需要分割表示地址名称的字符串,表示地址名称的字符串的错误分割可避免,从而改善了地址识别中的正确率。
根据本发明一个方面,把一个关键字符所分割的整个图案的特征矢量与地址名称字典中输入的地址名称的特征矢量相比较,从而能够识别地址名称。因此,表示地址名称的字符串可得到集体识别,而不用分割成单个的字符,从而改善了地址识别的效率和正确性。
根据本发明一个方面,如果被一个关键字符分割的图案的属性是“県”专区,则利用包含地址名称“県”专区的字典进行比较操作,从而进行与关键字符指定的属性相应的比较操作,并改善识别精度。
根据本发明的进一步的方面,当从输入图案提取的相连图案得到分离时,分离的位置根据输入图案的尺寸而得到评价。因此,当从一个输入提取了关键字符时,相连图案能够以适合于提取关键字符的尺寸得到分离。因此,相连图案的分离位置的数目可得到减小,且识别操作的次数也可得到减小,从而有效地识别地址。
根据本发明的进一步的方面,可选择一个相连图案—其分离位置可根据相连图案的尺寸得到检测。因此,只对较大的可能包含接触字符的相连图案进检测该分离位置。对于被认为是不包含接触字符的小的相连图案,分离位置的检测可以省略,从而改善地址识别的效率。
根据本发明的进一步的方面,若输入图案的黑象素数目直方图的最小点的值等于或小于一个预定值,则它被定义为一个分离点候选者。其结果,字符之间的接触点可得到检测,且相连图案可在一个接触点处得到分离。
根据本发明的进一步的一个方面,分离的相连图案的高/宽比可以处于一个预定的值以内.因此,可防止相连图案在关键字符得到提取时被分离成具有不适当的尺寸的部分,并可防止相连图案被分离成不包含关键字符的图案,从而有效地识别地址而不进行对不包含关键字符的图案的无用的处理。
根据本发明的进一步的一个方面,一个暂定分离点候选者可被设定在半字符尺寸,即使一个关键字符在水平书写时只有其右或左部分与另一字符相接触或在水平书写时其上或下部分与另一字符相接触,该关键字符的一部分也可有效地从接触字符得到提取,从而有效地恢复原来的关键字符。
根据本发明的一个方面,即使在处于距平均字符的一半大小的倍数的位置预定的范围内的点中有多个具有黑象素数目直方图最小值的最小点,通过选择具有黑象素数目直方图的最小值的最小点,只有一个暂定分离点候选者可得到提取。其结果,可防止处理由于把相连图案分离成若干个不处于限定字符位置的部分而变得复杂。
根据本发明的一个方面,即使在处于距平均字符的一半大小的倍数的位置预定的范围内的点中有多个具有黑象素数目直方图最小值的最小点,通过选择距平均字符的一半大小的倍数的位置最近的点,只有一个暂定分离点候选者能够得到提取。其结果,可防止处理由于把相连图案分成位于非限定字符位置的若干部分而变得复杂。
根据本发明的进一步的方面,关键字符可根据一个图案的分离部分的整合结果而得到提取。因此,即使一个字符只有一部分与另一字符接触,该字符的该部分也可以从其他字符分离,且该字符的分离部分可以与该字符的其余部分相整合,以形成原来的字符,从而防止关键字符被错误识别。
根据本发明的进一步的方面,可以通过使排列顺序较高的一个关键字符候选者具有优先权,而从由输入图案提取的关键字符候选者中提取出一个地址名称区。因此,可防止被错误地作为关键字符候选者提取的字符被用于提取一个地址名称区。其结果,将要作为地址名称候选者提取的候选者的数目可得到减小,且地址名称识别处理的次数可得到减小,从而改善了地址识别的效率。
根据本发明的进一步的方面,一个关键字符候选者的关键字符级别得到输入,以通过优先采用具有较高关键字符级别的关键字符候选者。同时,当不能只通过采用优先关键字符候选者而获得可被用于表示一个地址的关键字符的组合时,可以方便地选择一个额外的关键字符候选者,从而迅速地进行处理。
根据本发明的进一步的方面,判定关键字符的排列顺序和位置或关键字符的组合是否适合于表示地址。因此,即使在一个地址名称中包含了一个地址的关键字符时,包含在该地址名称中的该关键字符也可被除去,从而使用于表示地址名称的层次结构级别的一个字符可被指定为一个关键字符,从而防止地址名称区被错误地提取,并有效地识别地址。
根据本发明的进一步的方面,当有被一个部分选择项所指定的关键字符时,从低于该关键字符的层次结构级别的一个层次结构级别确定一组关键字符候选者。因此,当给出了一个部分选择项以利用例如询问明信片指定一个地址时,关键字符提取的精度能够得到改善。
根据本发明的进一步的方面,当不能只通过利用排列顺序较高的一个关键字符候选者获得适合于表示一个地址的一组关键字符时,排列顺序较低的一个关键字符被加上。因此,地址名称区可得到正确的提取,且关键字符候选者的数目可被限制在最小的可能数目。
根据本发明的进一步的方面,一组关键字符表示一个地址时所缺少的东西被加到排列顺序较低的关键字符候选者上。因此,只有所需的候选者从排列较低的关键字符候选者中被选为关键字符候选者,从而使关键字符能够得到有效的提取。
根据本发明的进一步的方面,从表示一个地址的字符串提取的一个关键字符候选者的关键字符级别得到计算,且一组关键字符候选者通过使具有较高关键字符级别的关键字符候选者得到优先,而得到确定。因此,当与地址层次结构知识和地址关键字符位置知识一致的一组关键字符候选者得到确定时,处理时间可通过减少关键字符候选者组的数目而得到缩短,从而有效地识别地址。
根据本发明的进一步的方面,判定表示地址的地址名称组合或表示一个地址的地址名称的排列顺序是否适当。因此,如果一个地址名称区的图案表示多个地址名称候选者且通过结合这些地址名称候选者可获得多个地址候选者,则不表示实际地址的组合被删除,从而能够只识别存在的地址,从而改善地址识别的精度。
根据本发明的进一步的方面,通过检查字符单位中从表示一个地址的字符串中提取的一个图案而获得的一个地址识别结果也得到输出。其结果,即使还未成功提取一个关键字符,地址也能够得到正确的识别且地址识别的可靠性可得到改善。
根据本发明的进一步的方面,输入关键字符识别字典中的字符类型限于关键字符类型和与关键字符类型类似的字符类型。因此,当从由输入图象分割的图案提取一个关键字符时,从输入图象分割的图案同输入到关键字符识别字典中的字符类型之间的比较的数目,与其中所有字符类型都被输入关键字符识别字典的情况相比,可以大大地减少,从而缩短地址识别的处理时间。进一步地,与其中关键字符识别字典只包含关键字符类型的情况不同,与所要识别的图案相应的关键字符类型的出现顺序得到了考虑,从而成功地判定所要识别的图案是否关键字符。因此,类似但不是关键字符的图案可得到高精度的正确识别。其结果,可防止与关键字符类似的非关键字符图案被错误地作为关键字符而得到提取而降低地址识别的精度。
根据本发明的进一步的方面,如果包含作为字符识别的结果的第N级的关键字符类型的样本图案的数K与为字符类型的字符识别而处理的样本图案的数目M的比值等于或大于一个预定的值,该字符类型被定义为关键字符类型的类似字符类型。因此,与关键字符类型类似的字符类型可得到高精度的确定。
Claims (49)
1、一种地址识别设备,包括:
关键字符提取装置,用于根据接触字符的分离结果提取关键字符;
包括汉字字符的地址名称字区提取装置,用于根据所述关键字符的位置提取包括汉字字符的地址名称字区;以及
包括汉字字符的地址名称字识别装置,用于至少根据所述关键字符的类别和在分离之前所述接触字符的状态之一,来识别所述包括汉字字符的地址名称字区中的包括汉字字符的地址名称字。
2、根据权利要求1的设备,其中
所述地址名称字识别装置包括:
用于存储地址名称字字典的装置,在所述地址名称字字典中输入地址名称字图案的典型特征矢量;
比较装置,用于将地址名称字区中的特征矢量与输入到地址名称字字典中的地址名称字的特征矢量进行比较;以及
输出装置,用于根据比较结果输出地址名称字的识别结果。
3、根据权利要求2的设备,其中:
所述用于存储地址名称字字典的装置包含由关键字符指定的每个属性的地址名称字图案的典型特征矢量;
所述比较装置将由所述关键字符限定的图案的特征矢量与具有由关键字符指定的属性的地址名称字进行比较。
4、一种地址识别设备,包括:
相连图案提取装置,用于从输入图案中提取相连图案;
分离位置检测装置,用于检测所述相连图案的分离位置;
分离位置评价装置,用于根据输入图案的尺寸评价候选的分离位置;
相连图案分离装置,用于根据所述评价的结果分离相连图案;
关键字符提取装置,用于根据所述相连图案的分离结果来提取关键字符;
包括汉字字符的地址名称字区提取装置,用于根据所述关键字符的位置提取包括汉字字符的地址名称字区;以及
包括汉字字符的地址名称字识别装置,用于识别包括汉字字符的地址名称字区中的包括汉字字符的地址名称字;其中
包含在所述地址中的字符由多个字根所构成。
5、根据权利要求4的设备,其中
所述分离位置检测装置进一步包括用于选择相连图案的选择装置,其中所述相连图案的分离位置将根据相连图案的尺寸而被检测。
6、根据权利要求4的设备,其中
所述分离位置检测装置包括:
直方图生成装置,用于计算输入图案的黑像素数目的直方图;
最小点检测装置,用于检测黑像素数目的直方图的最小点;以及
分离点候选者检测装置,用于将具有等于或小于所述最小点上的预定值的黑像素数目的直方图的值的点定义为分离点候选者。
7、根据权利要求4的设备,其中
所述分离位置评价装置包括:
区检测装置,用于在相连图案被分离时检测在预定的高/宽比的范围内的区;以及
排除装置,用于从所述分离位置检测装置检测的分离点中除去位于所述区检测装置检测的区之外的分离位置。
8、根据权利要求4的设备,进一步包括:
整合确定装置,用于在整合之前,根据整合之后的图案的尺寸确定图案的整合;以及
整合装置,用于根据整合确定的结果,对整合之前的图案进行整合,其中:
所述关键字符提取装置根据所述整合装置进行整合之后的图案提取关键字符。
9、一种地址识别设备,包括:
关键字符候选者提取装置,用于从输入图案提取关键字符候选者;
排列装置,用于根据所述关键字符候选者的识别结果排列关键字符候选者;
包括汉字字符的地址名称字区提取装置,用于根据高排列级别的关键字符候选者的位置来提取包括汉字字符的地址名称字区;以及
包括汉字字符的地址名称字识别装置,用于识别包括汉字字符的地址名称字区中的包括汉字字符的地址名称字;其中所述包括汉字字符的地址名称字区提取装置包括:
判定装置,用于判定是否有用于表示地址的关键字符排列顺序和排列位置或者关键字符候选者的组合;以及
添加装置,用于在不能只通过采用排列的级别高的关键字符候选者表示地址时,添加排列级别较低的关键字符候选者。
10、根据权利要求9的设备,其中
所述添加装置只添加排列级别低的关键字符候选者中的、用于表示地址的关键字符组中缺少的关键字符候选者。
11、一种地址识别设备,包括:
标签单元,用于对输入图案的各个相连元素加上标签;
单个字符区确定单元,用于根据相连图案的整合结果来确定单个字符区,其中在所述相连图案中,包围相连元素的矩形的重叠程度等于或大于预定的值;
平均字符大小计算单元,用于根据所述单个字符区的大小计算平均字符大小;
接触位置确定单元,用于根据所述平均字符大小来确定相连图案中的字符之间的接触部分;
分离单元,用于根据字符之间的接触部分的确定结果分离相连图案;
矩形区产生单元,用于根据所述相连图案的分离结果产生作为比较单位的矩形区;
关键字符识别字典单元,用于输入用以表示地址的字符;
关键字符候选者提取单元,用于通过将被矩形区所包围的图案与输入在所述关键字符识别字典单元中的字符进行比较,来提取关键字符候选者;
地址层次结构知识单元,用于存储与关键字符的地址表示中的可能组合和排列顺序相关的地址层次结构知识;
地址知识中的关键字符位置单元,用于存储与地址中的关键字符的可应用排列位置相关的地址知识中的关键字符位置;
关键字符候选者确定单元,用于通过参照地址层次结构知识和地址知识中的关键字符位置,确定用以表示关键字符候选者中的地址的关键字符候选者的可能组合;
包括汉字字符的地址名称字分割单元,用于从由所述关键字符候选者确定单元所确定的关键字符候选者限定的区域中分离包括汉字字符的地址名称字;
包括汉字字符的地址名称字特征提取单元,用于提取包括汉字字符的地址名称字的特征矢量;
包括汉字字符的地址名称字字典单元,用于存储包括汉字字符的地址名称字的特征矢量;
包括汉字字符的地址名称字集体识别单元,用于通过将所述包括汉字字符的地址名称字特征提取单元提取的包括汉字字符的地址名称字的特征矢量与输入到所述包括汉字字符的地址名称字字典单元中的包括汉字字符的地址名称字的特征矢量进行比较,识别包括汉字字符的地址名称字;
地址名称知识单元,用于存储关于用以表示地址的地址名称的组合是否可被接受或用以表示地址的地址名称的排列顺序是否适当的地址名称知识;以及
地址确定单元,用于通过检查包括汉字字符的地址名称字的识别结果是否与地址名称知识一致而确定地址;其中
包含在所述地址中的字符由多个字根所构成。
12、根据权利要求11的设备,其中所述关键字符候选者确定单元在所述关键字符候选者提取单元提取的关键字符候选者的组合与地址层次结构知识一致,并且这些关键字符候选者的排列位置和顺序与地址知识中的关键字符位置一致时,将所述组合确定为一组关键字符候选者。
13、根据权利要求12的设备,其中
所述关键字符候选者确定单元在一组关键字符由部分选择项指定时,根据比这些关键字符的层次结构级别低的层次结构级别确定一组关键字符候选者。
14、根据权利要求11的设备,其中
所述接触位置确定单元包括:
高/宽比计算单元,用于计算单个字符区中的图案的包围矩形的高/宽比;
接触字符确定单元,用于根据包围矩形的高/宽比确定相连图案中是否包含接触字符;
黑像素的数目直方图生成单元,用于产生沿着与被确定为包含接触字符的相连图案的字符串相垂直的方向计数的黑像素数目的直方图;
平滑单元,用于通过对黑像素数目的直方图进行运动平均运算,对黑像素数目的直方图进行平滑处理;
暂定分离点候选者计算单元,用于根据平滑之后的黑像素数目的直方图计算相连图案的暂定分离点候选者。
15、根据权利要求14的设备,其中
所述暂定分离点候选者是具有等于或小于预定阈值的值的黑像素数目的直方图的最小点中的一个。
16、根据权利要求14的设备,其中
所述暂定分离点候选者在字符被水平书写时处于与字符的水平距离为平均字符宽度的1/2倍的点的预定范围内,且当字符被纵向书写时处于与字符的纵向距离为平均字符高度的1/2倍的点的预定范围内。
17、根据权利要求16的设备,其中所述暂定分离点候选者是处于所述预定范围内的点中具有黑像素数目的直方图的最小值的最小点。
18、根据权利要求17的设备,其中所述暂定分离点候选者离具有黑像素数目的直方图的最小值的最小点中字符大小的1/2倍的点最近。
19、根据权利要求11的设备,其中
所述关键字符候选者提取单元包括:
整合确定单元,用于根据整合相邻的图案而获得的整合图案的宽度、高度或高/宽比,确定是否将要整合相连图案;
暂定整合单元,用于根据整合确定结果临时整合相连图案。
20、根据权利要求19的地址识别设备,进一步包括:
整合图案识别单元,用于识别暂定整合图案的关键字符;以及
单个图案识别单元,用于在暂定整合之前识别单个图案的关键字符。
21、根据权利要求20的设备,其中
所述整合图案识别单元包括第一关键字符级别计算单元,用于根据暂定整合图案的特征矢量与输入到所述关键字符识别字典中的关键字符类型的特征矢量之间的距离以及所述关键字符类型的出现顺序,计算关键字符级别。
22、根据权利要求20的设备,其中
所述单个图案识别单元包括第二关键字符级别计算单元,用于根据单个图案的特征矢量与输入到所述关键字符识别字典中的关键字符类型的特征矢量之间的距离以及所述关键字符类型的出现顺序计算关键字符级别。
23、根据权利要求21的设备,其中
所述关键字符候选者提取单元包括图案信息表产生单元,用于产生关键字符候选者的关键字符级别、关键字符类型、层次结构级别、位置坐标、关于图案是否将要被包含在相邻图案中的信息组成的图案信息表。
24、根据权利要求21的设备,其中
所述关键字符候选者提取单元包括:
关键字符候选者检测单元,用于检测具有等于或高于阈值的关键字符级别的图案,作为关键字符候选者;以及
准关键字符候选者检测单元,用于检测具有低于所述阈值且不为0的关键字符级别的图案,作为准关键字符候选者。
25、根据权利要求24的设备,进一步包括:
不充分关键字符再提取单元,用于在没有与地址层次结构知识和地址知识中的关键字符位置一致的关键字符候选者组时,从准关键字符候选者中提取具有所要求的地址层次结构级别或所要求的字符类型的关键字符。
26、根据权利要求11的设备,其中在确定与地址层次结构知识和地址知识中的关键字符位置相一致的一组关键字符候选者时,将从其产生关键字符候选者的暂定分离点定义为分离点。
27、根据权利要求18的设备,其中在确定了与地址层次结构知识和地址知识中的关键字符位置一致的一组关键字符候选者时,将从其产生关键字符候选者的暂定整合图案定义为整合图案。
28、根据权利要求11的设备,其中
所述地址名称字分割单元将从第一地址字符到刚好在第一关键字符之前的字符的所有图案和在第二关键字符之后的所有图案作为地址名称字进行分割。
29、根据权利要求11的设备,其中所述地址确定单元输出输入到地址名称知识单元中的地址名称的组合作为读取地址名称字集体识别单元所获得的地址名称候选者的多种组合中的地址的结果。
30、根据权利要求11的设备,其中
在未确定与地址层次结构知识和地址知识中的关键字符位置一致的一组关键字符候选者时,或者在没有获得与地址名称知识一致的地址时,输出错误码。
31、根据权利要求11的设备,进一步包括:
单个字符识别字典,用于存储各个字符的特征矢量;以及
单个字符识别单元,用于通过将单个字符区中的图案的特征矢量与输入到单个字符识别字典中的特征矢量进行比较,识别单个字符。
32、一种地址识别设备,包括:
关键字符提取装置,用于从输入图像提取关键字符,用以识别包含汉字字符的地址名称字;以及
集体识别装置,用于对所述关键字符限定的图案进行集体识别。
33、根据权利要求32的设备,进一步包括
用于存储关键字符识别字典的装置,在所述关键字符识别字典中输入的字符类型只限于关键字符类型和与关键字符类型类似的字符类型。
34、根据权利要求33的设备,其中
在包含作为字符识别处理的结果所获得的第一至第N类型中的关键字符类型的样本图案的数目K与已经进行了字符识别处理的字符类型的样本图案的数目M的比值等于或高于预定值时,所述字符类型被定义为与关键字符类型类似的字符类型。
35、根据权利要求33的设备,其中所述关键字符提取装置包括:
比较装置,用于将从输入图像分割的图案与输入到所述关键字符识别字典中的字符类型进行比较;以及
关键字符候选者确定装置,用于确定由所述比较装置获得的关键字符类型为关键字符候选者,其中所述关键字符类型在从输入图像分割出的图案中具有较高的出现顺序。
36、根据权利要求35的设备,其中
所述比较装置根据从输入图像分割的图案与输入到所述关键字符识别字典中的字符类型之间的不同程度或类似程度,定义关键字符类型的出现顺序。
37、根据权利要求36的设备,其中
在有两个图案具有与关键字符类型相等的不同程度或类似程度以及具有所述关键字符类型的相等出现顺序时,所述关键字符候选者确定装置从这两个图案的每一个的第一顺序字符检测在不同程度或类似程度上的差别,并使与第一顺序候选者在不同程度或类似程度上的差别较小的图案具有优先的顺序,作为关键字符。
38、一种用于存储关键字符识别字典的装置,在所述关键字符识别字典中所输入的字符类型只限于关键字符类型和与关键字符类型类似的字符类型,并且根据所述关键字符的位置来识别包括汉字字符的地址名称字。
39、一种地址识别方法,包括以下步骤:
根据关键字符的位置提取包括汉字字符的地址名称字区;
通过比较包含在包括汉字字符的地址名称字区中的整个图案对包括汉字字符的地址名称字进行集体识别;以及
根据包括汉字字符的地址名称字的识别结果识别地址,用以识别包含汉字字符的地址名称字。
40、一种地址识别方法,包括以下步骤:
根据关键字符的大小从相连图案分割矩形区;
根据包含在所述矩形区中的图案提取关键字符;以及
根据所述关键字符的提取结果识别地址,用以识别包含汉字字符的地址名称字。
41、一种地址识别方法,包括以下步骤:
从输入图案提取关键字符区;
根据包含在所述关键字符区中的图案的识别结果选择所述关键字符区;
根据选定的关键字符区的位置提取包括汉字字符的地址名称字区;以及
根据包括汉字字符的地址名称字区的提取结果识别地址。
42、一种用于通过提取关键字符识别地址的地址识别方法,包括步骤:
在不将字符串分割为字符单位的情况下,通过对表示包括汉字字符的地址名称字的字符串进行集中处理,识别由关键字符限定的包括汉字字符的地址名称字。
43、一种通过从输入图像提取关键字符而识别地址的方法,包括步骤:
通过将从输入图像分割出的图案与限于关键字符类型和与关键字符类型类似的字符类型的字符类型进行比较,提取关键字符,用以识别包括汉字字符的地址名称字。
44、一种地址识别设备,包括:
关键字符提取单元,用于提取关键字符候选者;
关键字符识别单元,用于识别关键字符候选者;
排列单元,用于对所述关键字符候选者进行排列;以及
选择单元,用于选择高排列级别的关键字符候选者,并且排除出现在地址名称字段中的关键字符候选者;以及
地址名称识别单元,用于根据相对于所选择的关键字符候选者的位置,识别包括汉字字符的地址名称。
45、根据权利要求44的地址识别设备,其中通过评价关键字符候选者的不同组合并且选择适合于在层级地址结构中的组合而排除关键字符候选者。
46、根据权利要求44的地址识别设备,其中使用包含地址名称和与所述地址名称相关的特征矢量的地址名称字典来识别所述地址名称,使得对于每一个地址名称,从所述地址名称中提取特征矢量,并且所提取的特征矢量与存储在所述字典中的特征矢量相匹配。
47、根据权利要求46的地址识别设备,进一步包括:
分离位置检测单元,用于检测连接图案的候选分离位置;以及
分离位置评价单元,用于评价候选分离位置。
48、根据权利要求47的地址识别设备,其中所述分离位置评价单元排除将导致字字段小于预定尺寸的候选分离位置。
49、根据权利要求47的地址识别设备,其中所述分离位置评价单元排除将导致字字段的高/宽比超出期望比值的预定范围的候选分离位置。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1064398 | 1998-01-22 | ||
JP010643/98 | 1998-01-22 | ||
JP27993198A JP3639126B2 (ja) | 1998-01-22 | 1998-10-01 | 住所認識装置及び住所認識方法 |
JP279931/98 | 1998-10-01 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1225484A CN1225484A (zh) | 1999-08-11 |
CN100483450C true CN100483450C (zh) | 2009-04-29 |
Family
ID=26345950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB991013549A Expired - Fee Related CN100483450C (zh) | 1998-01-22 | 1999-01-22 | 地址识别设备和方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6535619B1 (zh) |
JP (1) | JP3639126B2 (zh) |
KR (1) | KR100339446B1 (zh) |
CN (1) | CN100483450C (zh) |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3482191B2 (ja) * | 1999-05-12 | 2003-12-22 | シーメンス アクチエンゲゼルシヤフト | 住所読み取りのための方法 |
DE19933984C2 (de) * | 1999-07-20 | 2001-05-31 | Siemens Ag | Verfahren zur Bildung und/oder Aktualisierung von Wörterbüchern zum automatischen Adreßlesen |
JP2001134716A (ja) * | 1999-11-09 | 2001-05-18 | Toshiba Corp | 所在情報認識方法と認識アプリケーションと記録媒体と所在情報認識装置 |
JP2001137788A (ja) * | 1999-11-12 | 2001-05-22 | Hitachi Ltd | 地名表記辞書作成方法および地名表記辞書作成装置 |
US6876765B2 (en) * | 2000-03-30 | 2005-04-05 | Ricoh Company, Ltd. | Character recognition method and computer-readable storage medium |
JP4136316B2 (ja) * | 2001-01-24 | 2008-08-20 | 富士通株式会社 | 文字列認識装置 |
JP4846924B2 (ja) * | 2001-05-31 | 2011-12-28 | キヤノン株式会社 | パターン認識装置 |
US7305612B2 (en) * | 2003-03-31 | 2007-12-04 | Siemens Corporate Research, Inc. | Systems and methods for automatic form segmentation for raster-based passive electronic documents |
US7298904B2 (en) * | 2004-01-14 | 2007-11-20 | International Business Machines Corporation | Method and apparatus for scaling handwritten character input for handwriting recognition |
US20050152600A1 (en) * | 2004-01-14 | 2005-07-14 | International Business Machines Corporation | Method and apparatus for performing handwriting recognition by analysis of stroke start and end points |
US7756337B2 (en) * | 2004-01-14 | 2010-07-13 | International Business Machines Corporation | Method and apparatus for reducing reference character dictionary comparisons during handwriting recognition |
US7490033B2 (en) * | 2005-01-13 | 2009-02-10 | International Business Machines Corporation | System for compiling word usage frequencies |
KR100599141B1 (ko) * | 2005-05-20 | 2006-07-12 | 삼성전자주식회사 | 문서 압축시스템 및 그 압축방법 |
JP2007004584A (ja) * | 2005-06-24 | 2007-01-11 | Toshiba Corp | 情報処理装置 |
CN100555308C (zh) * | 2005-07-29 | 2009-10-28 | 富士通株式会社 | 地址识别装置和方法 |
CN101645134B (zh) * | 2005-07-29 | 2013-01-02 | 富士通株式会社 | 整体地名识别方法和整体地名识别装置 |
JP4658848B2 (ja) * | 2006-03-30 | 2011-03-23 | 日本電産サンキョー株式会社 | 文字列認識方法及び文字列認識装置 |
WO2007139039A1 (ja) * | 2006-05-26 | 2007-12-06 | Nec Corporation | 情報分類装置、情報分類方法、及び情報分類プログラム |
JP4860574B2 (ja) * | 2006-09-13 | 2012-01-25 | 株式会社キーエンス | 文字切り出し装置、方法およびプログラム |
JP4774390B2 (ja) * | 2006-09-13 | 2011-09-14 | 株式会社キーエンス | 文字切り出し装置、方法およびプログラム |
JP4909216B2 (ja) * | 2006-09-13 | 2012-04-04 | 株式会社キーエンス | 文字切り出し装置、方法およびプログラム |
CN101276327B (zh) * | 2007-03-27 | 2010-06-23 | 富士通株式会社 | 地址识别装置 |
JP4945739B2 (ja) * | 2007-03-30 | 2012-06-06 | 日本電産サンキョー株式会社 | 文字列認識方法及び文字列認識装置 |
JP5011508B2 (ja) * | 2007-04-27 | 2012-08-29 | 日本電産サンキョー株式会社 | 文字列認識方法及び文字列認識装置 |
US7925046B2 (en) * | 2007-05-02 | 2011-04-12 | Lockheed Martin Corporation | Implicit video coding confirmation of automatic address recognition |
US9261979B2 (en) * | 2007-08-20 | 2016-02-16 | Qualcomm Incorporated | Gesture-based mobile interaction |
EP2191397B1 (en) * | 2007-08-20 | 2019-01-23 | Qualcomm Incorporated | Enhanced rejection of out-of-vocabulary words |
JP5383022B2 (ja) * | 2007-09-26 | 2014-01-08 | キヤノン株式会社 | 画像検出装置及び方法 |
JP5338063B2 (ja) * | 2007-10-31 | 2013-11-13 | 富士通株式会社 | 画像認識プログラム、画像認識装置および画像認識方法 |
US8005260B2 (en) * | 2008-05-15 | 2011-08-23 | Graham Packaging Company L.P. | Correcting video coding errors using an automatic recognition result |
JP5146190B2 (ja) * | 2008-08-11 | 2013-02-20 | オムロン株式会社 | 文字認識装置、文字認識プログラム、および文字認識方法 |
US9002051B2 (en) * | 2010-08-25 | 2015-04-07 | Siemens Industry, Inc. | Mail exchange tracking and analysis |
JP5647919B2 (ja) * | 2011-03-07 | 2015-01-07 | 株式会社Nttドコモ | 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム |
JP2012194705A (ja) * | 2011-03-15 | 2012-10-11 | Omron Corp | 画像処理装置、画像処理方法および画像処理プログラム |
US8942484B2 (en) | 2011-09-06 | 2015-01-27 | Qualcomm Incorporated | Text detection using image regions |
JP6078953B2 (ja) * | 2012-02-17 | 2017-02-15 | オムロン株式会社 | 文字認識方法、およびこの方法を用いた文字認識装置およびプログラム |
JP5831420B2 (ja) * | 2012-09-28 | 2015-12-09 | オムロン株式会社 | 画像処理装置および画像処理方法 |
US9727287B2 (en) * | 2013-04-10 | 2017-08-08 | Hewlett-Packard Indigo B.V. | Data transfer system, method of transferring data, and system |
US9524440B2 (en) | 2014-04-04 | 2016-12-20 | Myscript | System and method for superimposed handwriting recognition technology |
US9384403B2 (en) | 2014-04-04 | 2016-07-05 | Myscript | System and method for superimposed handwriting recognition technology |
CN105704258B (zh) * | 2014-11-28 | 2019-11-29 | 方正国际软件(北京)有限公司 | 一种地址识别的方法和设备 |
US9659213B2 (en) * | 2015-07-03 | 2017-05-23 | Cognizant Technology Solutions India Pvt. Ltd. | System and method for efficient recognition of handwritten characters in documents |
US10373103B2 (en) | 2015-11-11 | 2019-08-06 | International Business Machines Corporation | Decision-tree based address-station matching |
CN108073564B (zh) * | 2016-11-09 | 2021-05-14 | 北京国双科技有限公司 | 法院名称的统计方法及装置 |
US11036976B2 (en) * | 2018-05-17 | 2021-06-15 | Hasan Mirjan | Methods and systems of handwriting recognition in virtualized-mail services |
JP2021144307A (ja) * | 2020-03-10 | 2021-09-24 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5050218A (en) * | 1986-08-26 | 1991-09-17 | Nec Corporation | Apparatus for recognizing address appearing on mail article |
US5293429A (en) * | 1991-08-06 | 1994-03-08 | Ricoh Company, Ltd. | System and method for automatically classifying heterogeneous business forms |
US5581633A (en) * | 1993-06-11 | 1996-12-03 | Fujitsu Limited | Method and apparatus for segmenting a character and for extracting a character string based on a histogram |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4731857A (en) * | 1984-06-29 | 1988-03-15 | International Business Machines Corporation | Recognition system for run-on handwritten characters |
JPS63182793A (ja) * | 1987-01-26 | 1988-07-28 | Sharp Corp | 文字切り出し方式 |
JP2859307B2 (ja) | 1989-07-31 | 1999-02-17 | 沖電気工業株式会社 | 文字切出し装置 |
US5825920A (en) * | 1991-01-28 | 1998-10-20 | Hitachi, Ltd. | Method and unit for binary processing in image processing unit and method and unit for recognizing characters |
JPH0581477A (ja) | 1991-09-18 | 1993-04-02 | Sumitomo Electric Ind Ltd | 文字切出し方法 |
KR960009280B1 (ko) | 1993-06-11 | 1996-07-16 | 박경식 | 터널의 시공방법 |
JP2937729B2 (ja) * | 1993-12-21 | 1999-08-23 | 株式会社バーズ情報科学研究所 | パターン認識方法及び装置及び辞書作成方法 |
JP3453422B2 (ja) | 1994-02-10 | 2003-10-06 | キヤノン株式会社 | 文字パターンのユーザ辞書への登録方法及び該ユーザ辞書を有する文字認識装置 |
JPH07262320A (ja) | 1994-03-18 | 1995-10-13 | Matsushita Electric Ind Co Ltd | 住所認識装置 |
KR970004539A (ko) | 1995-06-07 | 1997-01-29 | 조종호 | 숫자-모음 결합 버튼 체계 |
KR970002740A (ko) | 1995-06-09 | 1997-01-28 | 구자홍 | 문자인식장치의 접촉문자 분리 및 특징추출방법 |
JP3232991B2 (ja) | 1995-12-13 | 2001-11-26 | 株式会社日立製作所 | 文字読取り方法及び住所読取り方法 |
-
1998
- 1998-10-01 JP JP27993198A patent/JP3639126B2/ja not_active Expired - Fee Related
-
1999
- 1999-01-13 US US09/229,329 patent/US6535619B1/en not_active Expired - Fee Related
- 1999-01-21 KR KR1019990001820A patent/KR100339446B1/ko not_active IP Right Cessation
- 1999-01-22 CN CNB991013549A patent/CN100483450C/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5050218A (en) * | 1986-08-26 | 1991-09-17 | Nec Corporation | Apparatus for recognizing address appearing on mail article |
US5293429A (en) * | 1991-08-06 | 1994-03-08 | Ricoh Company, Ltd. | System and method for automatically classifying heterogeneous business forms |
US5581633A (en) * | 1993-06-11 | 1996-12-03 | Fujitsu Limited | Method and apparatus for segmenting a character and for extracting a character string based on a histogram |
Also Published As
Publication number | Publication date |
---|---|
CN1225484A (zh) | 1999-08-11 |
JPH11272803A (ja) | 1999-10-08 |
US6535619B1 (en) | 2003-03-18 |
JP3639126B2 (ja) | 2005-04-20 |
KR100339446B1 (ko) | 2002-06-03 |
KR19990068054A (ko) | 1999-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100483450C (zh) | 地址识别设备和方法 | |
US6341176B1 (en) | Method and apparatus for character recognition | |
JP2973944B2 (ja) | 文書処理装置および文書処理方法 | |
US10242296B2 (en) | Method and device for realizing chinese character input based on uncertainty information | |
CN103995904B (zh) | 一种影像档案电子资料的识别系统 | |
JP7149721B2 (ja) | 情報処理装置、文字認識エンジン最適化方法及びプログラム | |
JP2019169025A (ja) | 情報処理装置、文字認識エンジン選択方法及びプログラム | |
CN100555308C (zh) | 地址识别装置和方法 | |
JPS5947641A (ja) | 名刺デ−タベ−ス作成装置 | |
JP2015005100A (ja) | 情報処理装置、テンプレート生成方法、およびプログラム | |
TWI285849B (en) | Optical character recognition device, document searching system, and document searching program | |
Saiga et al. | An OCR system for business cards | |
JP2024003769A (ja) | 文字認識システム、コンピュータによる文字の認識方法、および文字検索システム | |
JP2006146627A (ja) | 文書情報検索システム | |
JPH0689365A (ja) | 文書画像処理装置 | |
JP4266240B1 (ja) | 項目判定システムおよび項目判定プログラム | |
JP4054453B2 (ja) | 文字認識装置およびプログラム記録媒体 | |
CN115294593A (zh) | 一种图像信息抽取方法、装置、计算机设备及存储介质 | |
Dos Santos | Automatic content extraction on semi-structured documents | |
JP3145071B2 (ja) | 文字認識方法および装置 | |
EP1072986A2 (en) | System and method for extracting data from semi-structured text | |
WO2007070010A1 (en) | Improvements in electronic document analysis | |
Jiang et al. | A suffix tree based handwritten Chinese address recognition system | |
JPH07319880A (ja) | キーワード抽出・検索装置 | |
KR102673900B1 (ko) | 표 데이터 추출 시스템 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090429 Termination date: 20140122 |