JPH0991382A - Method and device for on-line handwritten character recognition - Google Patents
Method and device for on-line handwritten character recognitionInfo
- Publication number
- JPH0991382A JPH0991382A JP8175248A JP17524896A JPH0991382A JP H0991382 A JPH0991382 A JP H0991382A JP 8175248 A JP8175248 A JP 8175248A JP 17524896 A JP17524896 A JP 17524896A JP H0991382 A JPH0991382 A JP H0991382A
- Authority
- JP
- Japan
- Prior art keywords
- stroke
- pattern
- input
- character
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、任意の画数及び筆
順で筆記された文字の入力パターンを各文字カテゴリー
について予め用意された正しい画数及び筆順の標準パタ
ーンと比較してその入力パターンがいずれの文字カテゴ
リーに該当するかを自動的に判断するオンライン手書き
文字認識方法及びその装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention compares an input pattern of characters written in an arbitrary stroke number and stroke order with a standard pattern of the correct stroke number and stroke order prepared for each character category, and determines which input pattern The present invention relates to an on-line handwritten character recognition method and apparatus for automatically determining whether a character category is met.
【0002】[0002]
【従来の技術】従来、手書き変形に対する耐性を高める
ためのオンライン手書き文字認識技術としては、まず予
想される手書き変形、すなわち例えば傾き変動や特定の
続け書き等を予め登録しておくという技術があった。2. Description of the Related Art Conventionally, as an online handwritten character recognition technique for improving resistance to handwriting deformation, there is a technique in which expected handwriting deformation, that is, for example, inclination variation or specific continuous writing is registered in advance. It was
【0003】その後、筆順は正しいという前提で入力パ
ターンと標準パターンとを共に一筆書きに変換し、動的
計画法を用いて時間軸方向の伸縮を許容しつつ特徴点間
の重なりが最大となるパターンマッチングを行う技術が
提案された。After that, both the input pattern and the standard pattern are converted into one-stroke writing on the assumption that the stroke order is correct, and the overlap between the feature points is maximized while allowing expansion and contraction in the time axis direction by using the dynamic programming method. Techniques for pattern matching have been proposed.
【0004】更に、標準パターンとして、各文字カテゴ
リーに属する多数の手書き文字パターンの平均形状のみ
でなく、文字を構成する特徴点の位置座標の共分散行列
等の手書き変形に関する情報を格納しておき、入力パタ
ーンとの間で統計的な識別尺度を用いる技術が提案され
た。Further, as a standard pattern, not only the average shape of a large number of handwritten character patterns belonging to each character category, but also information about handwriting deformation such as a covariance matrix of position coordinates of feature points forming a character is stored. , A technique that uses a statistical discriminant measure between input patterns has been proposed.
【0005】[0005]
【発明が解決しようとする課題】しかし、予め予想され
る手書き変形を登録しておく上記従来の手書き文字認識
技術では、予想外の変形に対しては全く対処できないと
いう本質的な限界を持っていた。However, the above-mentioned conventional handwritten character recognition technology in which expected handwriting deformations are registered in advance has an essential limit that it cannot deal with unexpected deformations at all. It was
【0006】また、動的計画法を用いる従来の手書き文
字認識技術では、大きな手書き変形は時間軸方向の伸縮
のみでは吸収しきれないと共に、処理時間が膨大とな
る、という問題点があった。Further, the conventional handwriting character recognition technique using dynamic programming has a problem that a large handwriting deformation cannot be absorbed only by expansion and contraction in the time axis direction, and the processing time becomes enormous.
【0007】更に、統計的な識別尺度を用いる従来の手
書き文字認識技術では、予め安定な統計情報を得るには
膨大な手書き文字パターンの収集が必要となるという問
題点があり、また、標準パターンとして平均値のみでな
く共分散行列等の情報も格納するため標準パターンの辞
書容量が極めて大きくなるという問題点があった。Further, in the conventional handwritten character recognition technique using the statistical discriminant scale, there is a problem that a huge amount of handwritten character patterns must be collected in order to obtain stable statistical information in advance, and the standard pattern As a result, since not only the average value but also information such as a covariance matrix is stored, there is a problem that the dictionary capacity of the standard pattern becomes extremely large.
【0008】上記各問題点を解決する手段として、特開
昭63−206881号公報に記載された技術がある。
この技術の概要は以下の如くである。先ず、各文字カテ
ゴリーの標準パターンとして、正しい画数及び筆順で筆
記された多数の手書き文字パターンの各特徴点の平均位
置座標のみを格納しておき、任意の画数及び筆順で筆記
された手書き文字についても各特徴点の位置座標を格納
した入力パターンを構成し、その入力パターンと各文字
カテゴリーの標準パターンとの間で1対1の特徴点対応
を決定する。次に、その標準パターンの各特徴点ごとに
一定近傍に含まれるその標準パターン中の特徴点群を含
めてその入力パターン中の対応する特徴点群への重なり
が最大となる局所的アフィン変換を反復的に施してその
標準パターンを変形してから安定なパターンマッチング
を行うというものである。As a means for solving the above problems, there is a technique described in Japanese Patent Laid-Open No. 63-206881.
The outline of this technique is as follows. First, as the standard pattern of each character category, only the average position coordinates of each characteristic point of a large number of handwritten character patterns written in the correct stroke number and stroke order are stored, and handwritten characters written in any stroke number and stroke order are stored. Also forms an input pattern in which the position coordinates of each feature point are stored, and a one-to-one correspondence between feature points is determined between the input pattern and the standard pattern of each character category. Next, for each feature point of the standard pattern, a local affine transformation that maximizes the overlap with the corresponding feature point group in the input pattern including the feature point group in the standard pattern included in a constant neighborhood is performed. Stable pattern matching is performed after repeatedly applying the standard pattern to transform the standard pattern.
【0009】この技術は、任意の手書き変形を各特徴点
周りの局所的アフィン変換の反復操作で吸収できる点
と、標準パターンの辞書容量が少ない点と、においては
原理的な解決を与えたが、一方で、局所的アフィン変換
を施す一定近傍の最適な大きさの決定と手書き変形の過
剰吸収を防ぐための反復回数の制御とに試行錯誤を要す
る点と、各特徴点ごとに最適な局所的アフィン変換を反
復的に施すために処理時間が膨大となる点と、において
実用上の大きな問題を残していた。This technique provides a theoretical solution in that any handwritten deformation can be absorbed by iterative operations of local affine transformation around each feature point and that the standard pattern dictionary capacity is small. On the other hand, on the other hand, it requires trial and error to determine the optimal size of a certain neighborhood to which local affine transformation is applied and to control the number of iterations to prevent excessive absorption of handwriting deformation, and the optimal local for each feature point. However, the processing time is enormous due to the iterative affine transformation, which leaves a big problem in practical use.
【0010】以上述べたように、手書き変形への耐性を
高めるための従来のオンライン手書き文字認識技術にお
いては、大きな又は予想外の手書き変形を吸収できるこ
とと、辞書容量及び処理時間を最小限に抑えることと、
を共に満足するような本質的な解決手段は得られていな
い。As described above, in the conventional online handwritten character recognition technique for increasing the resistance to handwriting deformation, large or unexpected handwriting deformation can be absorbed, and the dictionary capacity and processing time are minimized. That
No essential solution has been obtained that satisfies both.
【0011】本発明は上述のような事情から成されたも
のであり、本発明の目的は、手書き変形の大きな入力パ
ターンに対しても、正しい画数及び筆順での平均形状を
格納した標準パターンとの間で手書き変形を安定に吸収
したパターンマッチングを行い、辞書容量及び処理時間
を十分に抑制しつつ高い認識能力を有するオンライン手
書き文字認識方法及びその装置を提供することにある。The present invention has been made under the circumstances as described above, and an object of the present invention is to provide a standard pattern in which the correct number of strokes and the average shape in the stroke order are stored even for an input pattern with large handwriting deformation. It is an object of the present invention to provide an on-line handwritten character recognition method and apparatus that perform pattern matching with stable absorption of handwriting deformation between the two, and have high recognition ability while sufficiently suppressing the dictionary capacity and processing time.
【0012】[0012]
【課題を解決するための手段】請求項1に記載の発明
は、文字カテゴリーごとに、文字を構成する各ストロー
クを一定点数の特徴点で表し、その特徴点の位置座標を
標準パターンとして予め格納しておき、入力された手書
き文字の入力パターンを前記特徴点で表し、前記標準パ
ターンを文字カテゴリーごとに取り出し、その取り出し
た標準パターンと前記入力パターンとの間で、画数及び
筆順の変動を吸収した1対1のストローク対応を決定
し、前記入力パターンの各ストロークごとに、前記取り
出した標準パターンの対応するストロークに対して重な
りが最大となるような前記入力パターンの対応するスト
ロークに対するアフィン変換操作を決定し、前記入力パ
ターンの各ストロークごとに、決定されたアフィン変換
操作に基づき、アフィン変換を行って整形入力パターン
を生成し、前記取り出した標準パターンと前記整形入力
パターンとの間で、対応するストローク対ごとの距離の
和に基づくパターン間距離を算出し、全ての標準パター
ンと全ての標準パターンに対してそれぞれ生成した整形
入力パターンとのパターン間距離に基づき、そのパター
ン間距離の小さい標準パターンに係る文字カテゴリーか
ら順に前記入力パターンについての認識候補文字カテゴ
リーとすることを特徴とするオンライン手書き文字認識
方法である。According to a first aspect of the present invention, for each character category, each stroke forming a character is represented by a fixed number of characteristic points, and the position coordinates of the characteristic points are stored in advance as a standard pattern. The input pattern of input handwritten characters is represented by the characteristic points, the standard patterns are extracted for each character category, and variations in the number of strokes and stroke order are absorbed between the extracted standard patterns and the input patterns. 1: 1 stroke correspondence is determined, and for each stroke of the input pattern, an affine transformation operation is performed on the corresponding stroke of the input pattern such that the overlap with the corresponding stroke of the extracted standard pattern is maximized. For each stroke of the input pattern based on the determined affine transformation operation. A shaped input pattern is generated by performing conversion, and between the extracted standard pattern and the shaped input pattern, the inter-pattern distance is calculated based on the sum of the distances for each corresponding stroke pair, and all standard patterns and all Based on the inter-pattern distance between the generated standard input pattern and the generated input pattern, the character categories related to the standard pattern having the smaller inter-pattern distance are sequentially set as the recognition candidate character categories for the input pattern. An online handwriting recognition method.
【0013】本発明によれば、大きな又は予想外の手書
き変形を含む場合について格段の認識精度の向上を達成
することができる。特に、パターン全体でもなく、特徴
点単位でもなく、ストローク単位で一様なアフィン変換
を施しているため、固過ぎず柔らか過ぎず安定な整形操
作を実現している。また、このような手書き変形への耐
性向上のみではなく、辞書量を小さくすることができ、
かつ処理時間も十分に抑制できることも明らかである。According to the present invention, it is possible to significantly improve the recognition accuracy when a large or unexpected handwriting deformation is included. In particular, since the uniform affine transformation is performed not for the entire pattern but for each feature point, but for each stroke, a stable shaping operation is realized without being too hard or too soft. In addition to improving the resistance to such handwriting transformation, the dictionary size can be reduced,
It is also clear that the processing time can be suppressed sufficiently.
【0014】請求項2に記載の発明は、前記アフィン変
換操作の決定の際に、前記入力パターンの各ストローク
ごとに、そのストローク及び筆順で前後する適当数のス
トロークを含む複数ストローク群についてアフィン変換
を施し、標準パターン中の対応する複数ストローク群へ
の重なりが最大となるアフィン変換操作を決定するもの
である。According to a second aspect of the present invention, when determining the affine transformation operation, for each stroke of the input pattern, the affine transformation is performed for a plurality of stroke groups including the stroke and an appropriate number of strokes preceding and following the stroke order. The affine transformation operation that maximizes the overlap with the corresponding plural stroke groups in the standard pattern is determined.
【0015】この態様によれば、各ストロークについて
筆順で前後する適当数の複数ストロークをも含めてアフ
ィン変換操作を最適化することで、認識対象となってい
る文字データに含まれる手書き変形の程度に応じて変形
吸収の能力を制御することが可能である。According to this aspect, the degree of handwriting deformation included in the character data to be recognized is optimized by optimizing the affine transformation operation by including an appropriate number of strokes that precede and follow each stroke for each stroke. It is possible to control the deformation absorption capacity in accordance with.
【0016】請求項3に記載の発明は、前記パターン間
距離の算出を行う際に、前記入力パターンと前記標準パ
ターン間で対応するストローク対ごとの距離の和をも加
えてパターン間距離を算出するものである。According to a third aspect of the present invention, when calculating the inter-pattern distance, the inter-pattern distance is calculated by adding the sum of the distances for each stroke pair corresponding between the input pattern and the standard pattern. To do.
【0017】この態様によれば、過剰な整形によって類
似文字間のパターン間距離差が小さくなることによる誤
認識を防止することができる。According to this aspect, it is possible to prevent erroneous recognition due to the reduction in the pattern distance difference between similar characters due to excessive shaping.
【0018】請求項4に記載の発明は、前記取り出した
標準パターンと前記入力パターンとの間で画数を揃える
際に、画数の少ない方に揃えるものである。According to a fourth aspect of the present invention, when the number of strokes is made uniform between the extracted standard pattern and the input pattern, the one having the smaller number of strokes is arranged.
【0019】請求項5に記載の発明は、前記取り出した
標準パターンと前記入力パターンとの間で、それぞれの
ストロークを1対1に対応させる際に、ストローク対ご
とに特徴点数を揃えるものである。According to a fifth aspect of the present invention, when the respective strokes are made to correspond one-to-one between the extracted standard pattern and the input pattern, the number of characteristic points is made uniform for each stroke pair. .
【0020】請求項6に記載の発明は、文字カテゴリー
ごとに、文字を構成する各ストロークを一定点数の特徴
点で表し、その特徴点の位置座標を標準パターンとして
予め格納しておく際に、文字カテゴリーごとに複数の文
字パターンを特徴点で表し、それらの平均位置座標を標
準パターンとして予め格納しておくものである。According to a sixth aspect of the present invention, each stroke forming a character is represented by a certain number of characteristic points for each character category, and the position coordinates of the characteristic points are stored in advance as a standard pattern. A plurality of character patterns are represented by feature points for each character category, and their average position coordinates are stored in advance as a standard pattern.
【0021】この態様によれば、特に、標準パターンの
生成が容易になる。According to this aspect, it is particularly easy to generate the standard pattern.
【0022】請求項7に記載の発明は、前記特徴点を抽
出する際に、ストロークの始点及び終点を含むストロー
ク長と共に増加する一定点数を抽出するものである。According to a seventh aspect of the present invention, when extracting the characteristic points, a fixed number of points that increases with the stroke length including the start point and the end point of the stroke is extracted.
【0023】請求項8に記載の発明は、手書き文字の入
力パターンが入力される文字情報入力手段と、前記入力
パターンを構成する各ストロークを一定点数の特徴点で
表す特徴点抽出手段と、文字カテゴリーごとに、文字を
構成する各ストロークが一定点数の特徴点で表され、そ
の特徴点の位置座標が標準パターンとして予め格納され
る標準パターン格納手段と、前記標準パターンを文字カ
テゴリーごとに取り出し、その取り出した標準パターン
と前記入力パターンとの間で、画数及び筆順の変動を吸
収した1対1のストローク対応を決定するストローク対
応決定手段と、前記入力パターンの各ストロークごと
に、前記取り出した標準パターンの対応するストローク
に対して重なりが最大となるような前記入力パターンの
対応するストロークに対するアフィン変換操作を決定す
るストロークアフィン変換操作決定手段と、前記入力パ
ターンの各ストロークごとに、決定されたアフィン変換
操作に基づき、アフィン変換を行って整形入力パターン
を生成する整形入力パターン生成手段と、前記取り出し
た標準パターンと前記整形入力パターンとの間で、対応
するストローク対ごとの距離の和に基づくパターン間距
離を算出するパターン間距離算出手段と、全ての標準パ
ターンと全ての標準パターンに対してそれぞれ生成した
整形入力パターンとのパターン間距離に基づき、そのパ
ターン間距離の小さい標準パターンに係る文字カテゴリ
ーから順に前記入力パターンについての認識候補文字カ
テゴリーとするパターン間距離並べ換え手段と、を備え
ることを特徴とするオンライン手書き文字認識装置であ
る。According to an eighth aspect of the present invention, character information input means for inputting an input pattern of handwritten characters, feature point extracting means for expressing each stroke constituting the input pattern by a certain number of feature points, and a character For each category, each stroke forming a character is represented by a fixed number of characteristic points, and the standard pattern storage means in which the position coordinates of the characteristic points are stored in advance as a standard pattern, and the standard pattern is extracted for each character category, Stroke correspondence determining means for determining a one-to-one stroke correspondence that absorbs variations in the number of strokes and stroke order between the extracted standard pattern and the input pattern, and the extracted standard for each stroke of the input pattern. Corresponding strokes of the input pattern that have maximum overlap with corresponding strokes of the pattern Stroke affine transformation operation determining means for determining an affine transformation operation for the stroke, and shaping input pattern generation means for performing affine transformation to generate a shaping input pattern based on the determined affine transformation operation for each stroke of the input pattern. , Between the extracted standard pattern and the shaping input pattern, inter-pattern distance calculation means for calculating the inter-pattern distance based on the sum of the distances for each corresponding stroke pair, all standard patterns and all standard patterns On the basis of the inter-pattern distance between each of the generated shaped input patterns and the generated pattern, the inter-pattern distance rearranging means is set as a recognition candidate character category for the input pattern in order from the character category of the standard pattern having a small inter-pattern distance. Online handwriting characterized by It is a character recognition device.
【0024】請求項9に記載の発明は、前記ストローク
アフィン変換操作決定手段は、前記アフィン変換操作の
決定の際に、前記入力パターンの各ストロークごとに、
そのストローク及び筆順で前後する適当数のストローク
を含む複数ストローク群についてアフィン変換を施し、
標準パターン中の対応する複数ストローク群への重なり
が最大となるアフィン変換操作を決定するものである。According to a ninth aspect of the invention, the stroke affine transformation operation determining means determines each stroke of the input pattern when determining the affine transformation operation.
Affine transformation is applied to a plurality of stroke groups including the stroke and an appropriate number of strokes that move back and forth in the stroke order,
The affine transformation operation that maximizes the overlap with the corresponding plural stroke groups in the standard pattern is determined.
【0025】請求項10に記載の発明は、前記パターン
間距離算出手段は、前記パターン間距離の算出を行う際
に、前記入力パターンと前記標準パターン間で対応する
ストローク対ごとの距離の和をも加えてパターン間距離
を算出するものである。According to a tenth aspect of the present invention, the inter-pattern distance calculating means calculates a sum of distances for each stroke pair corresponding between the input pattern and the standard pattern when calculating the inter-pattern distance. In addition, the inter-pattern distance is calculated.
【0026】請求項11に記載の発明は、前記ストロー
ク対応決定手段は、前記取り出した標準パターンと前記
入力パターンとの間で画数を揃える際に、画数の少ない
方に揃えるものである。According to the eleventh aspect of the present invention, the stroke correspondence determining means aligns the stroke number between the extracted standard pattern and the input pattern with the one having the smaller stroke number.
【0027】請求項12に記載の発明は、前記ストロー
ク対応決定手段は、前記取り出した標準パターンと前記
入力パターンとの間で、それぞれのストロークを1対1
に対応させる際に、ストローク対ごとに特徴点数を揃え
るものである。According to a twelfth aspect of the present invention, the stroke correspondence determining means makes each stroke one to one between the extracted standard pattern and the input pattern.
The number of characteristic points is made uniform for each pair of strokes.
【0028】請求項13に記載の発明は、前記特徴点抽
出手段は、前記特徴点を抽出する際に、ストロークの始
点及び終点を含むストローク長と共に増加する一定点数
を抽出するものである。In the thirteenth aspect of the present invention, the feature point extracting means extracts, when extracting the feature points, a fixed number of points which increases with a stroke length including a start point and an end point of a stroke.
【0029】請求項14に記載の発明は、前記標準パタ
ーンについても、文字情報入力手段を介して入力され、
特徴点抽出手段により特徴点が抽出されるものである。According to a fourteenth aspect of the present invention, the standard pattern is also input through the character information input means,
The feature points are extracted by the feature point extraction means.
【0030】請求項15に記載の発明は、文字情報入力
手段を介して、文字カテゴリーごとに複数の文字パター
ンが入力され、前記特徴点抽出手段の後段に、前記複数
の文字パターンの対応する複数のストロークについての
複数の特徴点の平均位置座標を算出する特徴点平均位置
座標算出手段を更に有するものである。According to a fifteenth aspect of the present invention, a plurality of character patterns are input for each character category via the character information inputting means, and a plurality of character patterns corresponding to the plurality of character patterns are provided after the feature point extracting means. It further comprises feature point average position coordinate calculation means for calculating average position coordinates of a plurality of feature points for the stroke.
【0031】この態様によれば、特に、標準パターンの
生成が容易になる。According to this aspect, it is particularly easy to generate the standard pattern.
【0032】[0032]
【発明の実施の形態】以下、図面に基づいて本発明の実
施形態を詳細に説明する。Embodiments of the present invention will be described below in detail with reference to the drawings.
【0033】図1は、本発明のオンライン手書き文字認
識装置における一実施形態の構成ブロック図である。FIG. 1 is a block diagram showing the configuration of an embodiment of the online handwritten character recognition device of the present invention.
【0034】図1において、1は文字情報入力装置、2
は前処理装置、3は特徴点抽出装置、4は特徴点平均位
置座標算出装置、5は標準パターン格納装置、6は入力
パターン格納装置、7はストローク対応決定装置、8は
ストロークアフィン変換操作決定装置、9は整形入力パ
ターン生成装置、10はパターン間距離算出装置、11
はパターン間距離並べ換え装置である。In FIG. 1, 1 is a character information input device, 2
Is a preprocessing device, 3 is a feature point extraction device, 4 is a feature point average position coordinate calculation device, 5 is a standard pattern storage device, 6 is an input pattern storage device, 7 is a stroke correspondence determination device, and 8 is a stroke affine transformation operation determination. Device, 9 a shaping input pattern generation device, 10 an inter-pattern distance calculation device, 11
Is an inter-pattern distance rearrangement device.
【0035】以下、各装置の動作について具体的に説明
する。The operation of each device will be specifically described below.
【0036】文字情報入力装置1は、好ましくは既存の
データタブレットから構成され、そのデータタブレット
上に専用ペンで描かれる1文字パターンの筆跡について
ストロークごとに筆点の位置座標の時系列データを入力
して、前処理装置2に送出する。この文字情報入力装置
1は、標準パターンを作成する際の各文字カテゴリーに
属する多数の手書き文字パターンを入力する際にも利用
されるし、入力パターンを入力する際にも利用される。The character information input device 1 is preferably composed of an existing data tablet, and the time series data of the position coordinate of the writing point is input for each stroke for the handwriting of one character pattern drawn by a dedicated pen on the data tablet. Then, it is sent to the pretreatment device 2. The character information input device 1 is used not only when inputting a large number of handwritten character patterns belonging to each character category when creating a standard pattern, but also when inputting an input pattern.
【0037】前処理装置2は、文字情報入力装置1から
送出された1文字パターンの筆点位置座標列に対して、
公知の技術に基づき雑音除去や位置及び大きさの正規化
などの処理を施してから特徴点抽出処理装置3に送出す
る。この前処理装置2も、標準パターンを作成する際の
入力と入力パターンの入力の双方に利用される。The pre-processing device 2 receives the writing point position coordinate sequence of the one-character pattern sent from the character information input device 1,
Processing such as noise removal and normalization of position and size is performed based on a known technique, and then sent to the feature point extraction processing device 3. This preprocessing device 2 is also used for both input when creating a standard pattern and input of an input pattern.
【0038】特徴点抽出装置3は、前処理装置2から送
出された1文字パターンの筆点位置座標列について、各
ストロークを構成する筆点列から始点及び終点を含みス
トローク長と共に増加する一定点数分だけそのストロー
ク上を等間隔に刻んだ位置に最も近い筆点を特徴点とし
て順次抽出し、それらを1文字パターンの特徴点列とし
て格納する。ここで、ストローク長に応じた総特徴点数
pの選択については、例えば、ストローク長が増加する
につれてp=2,3,5,9,17,・・・と離散的に
増加させればよい。例えば、p=2はストロークの始点
及び終点のみを抽出することに相当し、p=3は始点,
終点及びストロークの中点を抽出することに相当する。
図2に、例えば文字カテゴリー「い」について、筆点か
ら特徴点を抽出した例を示す。ここで得られた1文字の
ストロークごとの特徴点列は、標準パターンに係るもの
は特徴点平均位置座標算出装置4に送出され、入力パタ
ーンに係るものは入力パターン格納装置6へ送出され
る。The feature point extraction device 3 has a fixed number of points of the writing point position coordinate sequence of one character pattern sent from the preprocessing device 2, which increases from the writing point sequence forming each stroke, including the start point and the end point, with the stroke length. The writing points closest to the positions obtained by equally dividing the stroke by that amount are sequentially extracted as feature points, and they are stored as a feature point sequence of one character pattern. Here, regarding the selection of the total number p of characteristic points according to the stroke length, for example, p = 2, 3, 5, 9, 17, ... May be discretely increased as the stroke length increases. For example, p = 2 is equivalent to extracting only the start point and end point of the stroke, and p = 3 is the start point,
This is equivalent to extracting the end point and the midpoint of the stroke.
FIG. 2 shows an example in which feature points are extracted from writing points for the character category “I”. Regarding the feature point sequence for each stroke of one character obtained here, those relating to the standard pattern are sent to the feature point average position coordinate calculation device 4, and those relating to the input pattern are sent to the input pattern storage device 6.
【0039】特徴点平均位置座標算出装置4は、認識対
象となっている各文字カテゴリーごとに収集した正しい
画数及び筆順の筆記による多数の文字パターンについて
特徴点抽出装置3から送出された特徴点列を用いて、そ
の文字カテゴリーを構成する各ストロークの各特徴点に
ついての平均位置座標を算出し、特徴点平均位置座標と
して標準パターン格納装置5へ送出する。The feature point average position coordinate calculation device 4 sends a feature point sequence sent from the feature point extraction device 3 to a correct number of strokes and a large number of character patterns written in writing order for each character category to be recognized. Is used to calculate the average position coordinates for each feature point of each stroke that constitutes the character category, and is sent to the standard pattern storage device 5 as the feature point average position coordinates.
【0040】標準パターン格納装置5は、認識対象とな
っている各文字カテゴリーについて、特徴点平均位置座
標算出装置4から送出された各ストロークを構成する特
徴点の平均位置座標を正しい画数及び筆順に従って連ね
たものを、その文字カテゴリーの標準パターンとして格
納する。ここで、各文字カテゴリーの標準パターンを構
成する個々の標準ストロークをRと記すと、式(1)に
示すように、Rはその標準ストロークの特徴点の平均位
置ベクトルを連ねたものとして表現でき、その標準パタ
ーンはそれら個々の標準ストロークを正しい筆順に従っ
て格納したものとなる。The standard pattern storage device 5 determines the average position coordinates of the feature points forming each stroke sent from the feature point average position coordinate calculation device 4 for each character category to be recognized according to the correct stroke number and stroke order. The series is stored as a standard pattern of the character category. Here, when each standard stroke constituting the standard pattern of each character category is denoted by R, R can be expressed as a series of average position vectors of the characteristic points of the standard stroke as shown in Expression (1). , The standard pattern is the individual standard strokes stored in the correct stroke order.
【0041】[0041]
【数1】 R=(r1,r2,・・・,ri,・・・,rp) ・・・(1) 但し、p:標準ストローク長から定まる総特徴点数 ri=(rix,riy)T:標準ストロークの第i特徴点
の平均位置ベクトル 各ストロークを構成する特徴点の平均位置座標で表現さ
れた全文字カテゴリーの標準パターンの集合は、ストロ
ーク対応決定装置7へ送出される。## EQU1 ## R = (r 1 , r 2 , ..., R i , ..., R p ) ... (1) where p: total number of feature points determined from standard stroke length r i = (r ix , r iy ) T: Average position vector of i-th feature point of standard stroke A set of standard patterns of all character categories expressed by average position coordinates of feature points forming each stroke is sent to the stroke correspondence determining device 7. To be done.
【0042】入力パターン格納装置6は、任意の画数及
び筆順で筆記された認識すべき文字パターンについて、
特徴点抽出装置3から送出された各ストロークを構成す
る特徴点の位置座標を画数及び筆順に従って連ねたもの
を、その文字カテゴリーの入力パターンとして格納す
る。ここで、入力パターンを構成する個々の入力ストロ
ークをSと記すと、式(2)に示すように、Sはその入
力ストロークの特徴点の位置ベクトルを連ねたものとし
て表現でき、その入力パターンはそれら個々の入力スト
ロークを正しい筆順に従って格納したものとなる。The input pattern storage device 6 stores, for an arbitrary number of strokes and a character pattern written in the stroke order, to be recognized,
A series of position coordinates of feature points forming each stroke sent from the feature point extraction device 3 in accordance with the number of strokes and the stroke order is stored as an input pattern of the character category. Here, if each input stroke forming the input pattern is denoted by S, S can be expressed as a series of position vectors of the feature points of the input stroke as shown in Expression (2), and the input pattern is These input strokes are stored in the correct stroke order.
【0043】[0043]
【数2】 S=(s1,s2,・・・,sj,・・・,sp') ・・・(2) 但し、p’入力ストローク長から定まる総特徴点数 sj=(sjx,siy)T:入力ストロークの第j特徴点
の位置ベクトル 各ストロークを構成する特徴点の位置座標で表現された
入力パターンは、ストローク対応決定装置7へ送出され
る。[Number 2] S = (s 1, s 2 , ···, s j, ···, s p ') ··· (2) However, p' the total number of feature points is determined from the input stroke length s j = ( s jx , s iy ) T: Position vector of the j-th feature point of the input stroke The input pattern represented by the position coordinates of the feature points forming each stroke is sent to the stroke correspondence determining device 7.
【0044】ストローク対応決定装置7は、入力パター
ン格納装置6から送出された認識すべき入力パターン
と、標準パターン格納装置5から送出された各文字カテ
ゴリーの標準パターンとの間で、画数及び筆順の変動を
吸収した1対1のストローク対応を決定する。ここで入
力パターンと標準パターンの画数の多い方をM、画数の
少ない方をN(M≧N)と記すと、本装置は双方のパタ
ーンとも少ない方の画数Nのパターンに揃え、かつN対
のストローク対応を決定する。このような最適な1対1
のストローク対応を決定するには公知の技術が利用で
き、例えば、Proceedings of the Third International
Conference on Document Analysis and Recognition
(Montreal, Canada; August 14-16, 1995; IEEE COMPUT
ER SOCIETY)に掲載された若原他のOn-Line Cursive Kan
ji Character Recognition as StrokeCorrespondence P
roblemと題した論文に示された技術では、2段階の処理
でストローク対応を決定している。第1段階の処理で
は、N画パターンの全ストロークとM画パターン中のN
本のストロークとの間でストローク間距離和が最小とな
るような最適なN対のストローク対応を離散的な組合せ
最適化法を用いて決定する。この処理により筆順の変動
が吸収される。次に、第2段階の処理で、M画パターン
中で未対応の(M−N)本の各ストロークをそれぞれ筆
順で前後する2本の既対応ストロークのいずれかにN画
パターンとの重なりが良くなるように選択的に結合す
る。この処理により画数変動が吸収され、双方パターン
が画数Nに揃えられる。The stroke correspondence determining device 7 determines the number of strokes and the stroke order between the input pattern to be recognized sent from the input pattern storage device 6 and the standard pattern of each character category sent from the standard pattern storage device 5. A one-to-one stroke correspondence that absorbs the fluctuation is determined. Here, if the number of strokes of the input pattern and the standard pattern is described as M, and the one with a small number of strokes is described as N (M ≧ N), this apparatus aligns both patterns with the pattern of the smaller stroke number N and sets N pairs. Stroke correspondence is determined. Such an optimal one-to-one
Known techniques can be used to determine the stroke correspondence of, for example, Proceedings of the Third International
Conference on Document Analysis and Recognition
(Montreal, Canada; August 14-16, 1995; IEEE COMPUT
Wakahara et al.'S On-Line Cursive Kan published in ER SOCIETY)
ji Character Recognition as StrokeCorrespondence P
In the technique shown in a paper entitled roblem, stroke correspondence is determined by a two-step process. In the first stage processing, all strokes of the N-image pattern and N strokes in the M-image pattern are processed.
The optimum N pairs of stroke correspondences that minimize the sum of stroke distances with the strokes of the book are determined by using the discrete combination optimization method. By this processing, the fluctuation of the stroke order is absorbed. Next, in the process of the second stage, the non-corresponding (M−N) strokes in the M image pattern are overlapped with the N image pattern on any of the two already-corresponding strokes preceding and following in the stroke order. Selectively combine to improve. By this processing, the variation in the number of strokes is absorbed, and both patterns are arranged in the number N of strokes.
【0045】上記ストローク対応決定操作により、双方
のパターンとも画数Nのパターンとなり、かつN対のス
トローク対応が得られる。尚、N画に揃ったその入力パ
ターンと標準パターンについて、その入力パターンを構
成するN本のストロークの特徴点列表現を筆順に従い、
S1,S2,・・・,Si,・・・,SNと記し、その標準
パターンを構成するN本のストロークの特徴点列表現を
R1,R2,・・・,Ri,・・・,RNと記し、Ri(1
≦i≦N)はSi(1≦i≦N)にそれぞれ対応づけら
れているものとする。但し、図3(a),3(b)に示
すように、各ストローク対ごとに特徴点数を揃えておく
ものとする。このようにして画数及び筆順並びに特徴点
数が揃った入力パターンと標準パターンの特徴点列表現
は、ストロークアフィン変換操作決定装置8へ送出され
る。By the stroke correspondence determining operation, both patterns become patterns with the number of strokes N, and N pairs of stroke correspondences are obtained. For the input pattern and the standard pattern arranged in N strokes, the characteristic point sequence representation of N strokes forming the input pattern is written in the order of strokes.
S 1, S 2, ···, S i, ···, denoted as S N, the feature point string representation of the N strokes constituting the standard pattern R 1, R 2, ···, R i ,..., denoted as R N, R i (1
≦ i ≦ N) is associated with S i (1 ≦ i ≦ N). However, as shown in FIGS. 3A and 3B, it is assumed that the number of characteristic points is made uniform for each stroke pair. In this way, the characteristic point sequence representation of the input pattern and the standard pattern in which the number of strokes, the stroke order, and the number of characteristic points are uniform is sent to the stroke affine transformation operation determining device 8.
【0046】ストロークアフィン変換操作決定装置8
は、ストローク対応決定装置7から送出された画数及び
筆順並びに特徴点数が揃った入力パターンと標準パター
ンの特徴点列表現を用い、その入力パターンを構成する
各ストロークごとに当該ストロークを含む複数ストロー
ク群についてアフィン変換操作を施すことにより、その
標準パターン中の対応する複数ストローク群への重なり
が最大となるような最適なアフィン変換操作の決定を行
う。入力パターンの第iストロークSi(1≦i≦N)
に対応する最適なアフィン変換操作は以下の手順で決定
する。Stroke affine transformation operation determining device 8
Is a feature point sequence representation of an input pattern and a standard pattern in which the number of strokes, the stroke order, and the number of feature points, which are sent from the stroke correspondence determining device 7, are used, and a plurality of stroke groups including the stroke for each stroke forming the input pattern. By performing the affine transformation operation on, the optimum affine transformation operation that maximizes the overlap with the corresponding multiple stroke groups in the standard pattern is determined. I-th stroke S i of input pattern (1 ≦ i ≦ N)
The optimum affine transformation operation corresponding to is determined by the following procedure.
【0047】先ず、引き続くストローク間で手書き変形
の相関が大きいことを利用し、そのストロークに筆順で
先行するストロークn1本及び筆順で後続するストロー
クn2本を含めた複数ストローク群を抽出する。但し、
n1≧0、n2≧0であり、例えば、n1=1、n2=1、
あるいは、n1=1、n2=0を用いる。すなわち、Si
(1≦i≦N)に対して、u=max(1,i−n1)
及びv=min(N,i+n2)と記した場合、筆順に
従った複数のストローク群Su,Su+1,・・・,Si,
・・・,Sv-1,Svを抽出する。これについて例を挙げ
て説明する。例えば、文字カテゴリーが「泣」であると
する。この場合、図4に示すように、ストロークはS1
からS8 までである。今、第iストロークSi としてス
トロークS2 が対象となっているものとする。この場合
には、例えばn1 =1、n2 =1、すなわち先行するス
トロークS1 及び後続するストロークS3 を含めた複数
ストローク群S1 ,S2 ,S3 を抽出する。また、第i
ストロークSi としてストロークS8 が対象となってい
る場合、n1 =1、n2 =1あっても後続するストロー
クが存在しないため、先行するストロークS7 のみを含
めた複数ストローク群S7 ,S8 を抽出する。First, by taking advantage of the large correlation of handwriting deformation between successive strokes, a plurality of stroke groups including the stroke n 1 preceding the stroke in the stroke order and the stroke n 2 succeeding in the stroke order are extracted. However,
n 1 ≧ 0, n 2 ≧ 0, and for example, n 1 = 1 and n 2 = 1
Alternatively, n 1 = 1 and n 2 = 0 are used. That is, S i
For (1 ≦ i ≦ N), u = max (1, i−n 1 ).
, And v = min (N, i + n 2 ), a plurality of stroke groups S u , S u + 1 , ..., S i in the stroke order are written.
..., S v-1 , S v are extracted. This will be described with an example. For example, assume that the character category is "cry". In this case, the stroke is S 1 as shown in FIG.
To S 8 . Now, it is assumed that the stroke S 2 is targeted as the i-th stroke S i . In this case, extracted, for example n 1 = 1, n 2 = 1, a plurality stroke group S 1, including stroke S 1 and subsequent stroke S 3 that is preceding, S 2, S 3. Also, the i-th
If the stroke S 8 are subject as a stroke S i, n 1 = 1, n 2 = 1 for subsequent stroke exists even prior multiple strokes S 7 including only the stroke S 7 that, Extract S 8 .
【0048】これらに含まれる全特徴点の点数をqと
し、それらのq個の特徴点の位置ベクトルを筆順に従っ
て連ねたものを式(3)に示すように記す。Let q be the number of all the feature points included in these, and the position vectors of these q feature points are connected in the order of writing in order as shown in equation (3).
【0049】[0049]
【数3】 C1 =(s′1 ,s′2 ,・・,s′k ,・・,s′q ) ・・・(3) 例えば、前述のように、第iストロークSi としてスト
ロークS2 が対象となっている場合、特徴点が図5のよ
うに構成されているとすると、C1 は式(4)に示すよ
うになる。[Equation 3] C 1 = (s ′ 1 , s ′ 2 , ..., S ′ k , ..., s ′ q ) (3) For example, as described above, the stroke is the i-th stroke S i. When S 2 is the target, and the characteristic points are configured as shown in FIG. 5, C 1 becomes as shown in Expression (4).
【0050】 C1 =(s1 ,s2 ,・・・,s19) ・・・(4) 一方、標準パターン中で複数ストローク群Su ,・・,
Si ,・・,Sv に対応するのはRu ,・・,Ri ,・
・,Rv であり、これらに含まれる全特徴点数は同一の
qである。それらのq個の特徴点の位置ベクトルを筆順
に従って連ねたものを式(5)に示すように記す。C 1 = (s 1 , s 2 , ..., S 19 ) (4) On the other hand, in the standard pattern, a plurality of stroke groups S u , ...
S i , ..., S v correspond to R u , ..., R i ,.
, R v , and the total number of feature points contained in them is the same q. A series of position vectors of these q feature points in the stroke order is written as shown in Expression (5).
【0051】[0051]
【数4】 C2 =(r′1 ,r′2 ,・・,r′k ,・・,r′q ) ・・・(5) 次いで、入力パターンの第iストロークSi に係る特徴
点列C1 に含まれる各特徴点s′k について式(6)で
定義されるアフィン変換操作を施し、特徴点列C1 に対
する変換で特徴点列C2 への重なりを最大にする、すな
わち式(7)に示した目的関数Ψi を最小にするような
アフィン変換操作Ai ,bi を決定する。Equation 4] C 2 = (r '1, r' 2, ··, r 'k, ··, r' q) ··· (5) Next, the feature point according to a i stroke S i of the input pattern An affine transformation operation defined by equation (6) is performed on each feature point s ′ k included in the column C 1 to maximize the overlap with the feature point sequence C 2 by the transformation on the feature point sequence C 1 , that is, the equation Affine transformation operations A i and b i that minimize the objective function Ψ i shown in (7) are determined.
【0052】[0052]
【数5】 s″k =Ais′k +bi (1≦k≦q) ・・・(6) 但し、Ai :2行2列の行列で伸縮、回転及び歪みを表
現 bi :2次元ベクトルで並進移動を表現S ″ k = A i s ′ k + b i (1 ≦ k ≦ q) (6) where A i is a matrix of 2 rows and 2 columns and represents expansion, contraction, rotation, and distortion b i : Representing translational movement with a two-dimensional vector
【数6】 Ψi=Σk‖s″k−r′k‖2=‖Ais′k+bi−r′k‖2 ・・・(7) (1≦i≦N) 但し、Σk:k=1,・・・,qに関する和 ‖ ‖:ベクトルのユークリッドノルム 目的関数Ψiの最小化問題は、公知の技術によりAi及び
biの各成分に関する連立一次方程式の解法に帰着し、
これは高速に解を求めることができる。## EQU6 ## Ψ i = Σ k ‖s ″ k −r ′ k ‖ 2 = ‖A i s ′ k + b i −r ′ k ‖ 2 (7) (1 ≦ i ≦ N) where Σ k : sum of k = 1, ..., q ‖ ‖: Euclidean norm of vector The minimization problem of the objective function Ψ i is reduced to a solution of simultaneous linear equations for each component of A i and b i by a known technique. Then
This can find a solution at high speed.
【0053】このようにして入力パターンの各ストロー
クSiに対する最適なアフィン変換操作が決定され、そ
れらのストロークアフィン変換操作の組{Ai,bi}
(1≦i≦N)及びその入力パターンと標準パターンの
特徴点列表現は、整形入力パターン生成装置9へ送出さ
れる。In this way, the optimum affine transformation operation for each stroke S i of the input pattern is determined, and a set of those stroke affine transformation operations {A i , b i }.
(1 ≦ i ≦ N) and the characteristic point sequence representation of the input pattern and the standard pattern are sent to the shaping input pattern generation device 9.
【0054】整形入力パターン生成装置9は、ストロー
クアフィン変換操作決定装置8から送出された入力パタ
ーンの各ストロークに対するストロークアフィン変換操
作の組及びその入力パターンと標準パターンの特徴点列
表現を用いて、ストロークアフィン変換操作を入力パタ
ーンの各ストロークにそれぞれ施し、整形入力パターン
の生成を行う。ここで、入力パターンの第iストローク
Si及び対応する標準パターンの第iストロークRiの特
徴点列を式(8),(9)で記す。但し、特徴点数をp
と記し、前述のように双方ストロークで揃えてある。The shaping input pattern generation device 9 uses the set of stroke affine transformation operations for each stroke of the input pattern sent from the stroke affine transformation operation determination device 8 and the feature point sequence representation of the input pattern and standard pattern, A stroke affine transformation operation is performed on each stroke of the input pattern to generate a shaped input pattern. Here, the feature point sequences of the i-th stroke S i of the input pattern and the corresponding i-th stroke R i of the standard pattern are described by equations (8) and (9). However, the number of feature points is p
, And both strokes are aligned as described above.
【0055】[0055]
【数7】 Si=(s1,s2,・・・,sk,・・・,sp) ・・・(8) Ri=(r1,r2,・・・,rk,・・・,rp) ・・・(9) 整形入力パターンの生成は、入力パターンの各ストロー
ク単位に行う。入力パターンの第iストロークSi(1
≦i≦N)に対する整形操作は、ストロークアフィン変
換操作Ai,biを用いてそのストロークの各特徴点につ
いて次の式(10)により実施する。[Equation 7] S i = (s 1, s 2, ···, s k, ···, s p) ··· (8) R i = (r 1, r 2, ···, r k , ..., r p ) (9) The shaping input pattern is generated for each stroke unit of the input pattern. I-th stroke S i (1
The shaping operation for ≦ i ≦ N) is performed by the following equation (10) for each feature point of the stroke using the stroke affine transformation operations A i and b i .
【0056】[0056]
【数8】 s″k=Ais′k+bi (1≦k≦p) ・・・(10) このようにして得られたs″k(1≦k≦p)を連ねた
ものが、整形入力ストロークS″iを構成する。整形入
力パターンは、整形入力ストローク列{S″i}(1≦
i≦N)として表現される。整形入力パターンと標準パ
ターンの特徴点列表現は、パターン間距離算出装置10
へ送出される。S ″ k = A i s ′ k + b i (1 ≦ k ≦ p) (10) A series of s ″ k (1 ≦ k ≦ p) thus obtained is , A shaping input stroke S ″ i . The shaping input pattern is a shaping input stroke sequence {S ″ i } (1 ≦
It is expressed as i ≦ N). The feature point sequence representation of the shaping input pattern and the standard pattern is calculated by the inter-pattern distance calculation device 10.
Sent to
【0057】図6は、文字カテゴリー「泣」についての
処理の例を示す図である。ここで、図6(a)は入力パ
ターンを示す図であり、図6(b)は標準パターンを示
す図であり、図6(c)は整形入力パターンを示す図で
ある。図6(d)はそれらのパターンを重ね合わせた図
であり、“・”は入力パターンの点、“◎”は標準パタ
ーンの点、“○”は整形入力パターンの点、“●”は標
準パターンと整形入力パターンが重なった点、をそれぞ
れ示す。尚、ストローク内の特徴点間を内挿した点列で
示してある。FIG. 6 is a diagram showing an example of processing for the character category "cry". Here, FIG. 6A is a diagram showing an input pattern, FIG. 6B is a diagram showing a standard pattern, and FIG. 6C is a diagram showing a shaped input pattern. FIG. 6 (d) is a diagram in which these patterns are superimposed, “•” is the point of the input pattern, “◎” is the point of the standard pattern, “○” is the point of the shaped input pattern, and “●” is the standard. The points where the pattern and the shaping input pattern overlap are shown. It should be noted that interpolated point sequences are shown between the characteristic points in the stroke.
【0058】また、図7は、文字カテゴリー「永」につ
いての処理の例を示す図である。Further, FIG. 7 is a diagram showing an example of processing for the character category "permanent".
【0059】パターン間距離算出装置10は、整形入力
パターン生成装置9から送出された整形入力パターンと
標準パターンの特徴点列表現を用いて、整形入力パター
ンと標準パターンとの間で、対応するストローク対ごと
の距離の和に基づくパターン間距離の算出を行う。前述
のように、整形入力ストロークS″i(1≦i≦N)
は、標準パターンの第iストロークRiと対応してい
る。先ず、対応ストローク対であるS″iとRiの間でス
トローク間距離d(S″i,Ri)を式(11)で算出す
る。The inter-pattern distance calculation device 10 uses the feature point sequence representation of the shaping input pattern and the standard pattern sent from the shaping input pattern generation device 9 to make a corresponding stroke between the shaping input pattern and the standard pattern. The inter-pattern distance is calculated based on the sum of the distances for each pair. As described above, the shaping input stroke S ″ i (1 ≦ i ≦ N)
Corresponds to the i-th stroke R i of the standard pattern. First, the inter-stroke distance d (S ″ i , R i ) between the corresponding stroke pair S ″ i and R i is calculated by the equation (11).
【0060】[0060]
【数9】 d(S″i,Ri)=(1/p)Σk‖s″k−rk‖2 ・・・(11) 但し、Σk:k=1,・・・,pに関する和 次いで、上記ストローク間距離の和に基づき、整形入力
パターンと標準パターンとのパターン間距離Dを式(1
2)で算出する。## EQU9 ## d (S ″ i , R i ) = (1 / p) Σ k ‖s ″ k −r k ‖ 2 ... (11) where Σ k : k = 1, ..., p Then, based on the sum of the distances between the strokes, the pattern distance D between the shaping input pattern and the standard pattern is calculated by the formula (1
Calculated in 2).
【0061】[0061]
【数10】 D=(M/N)Σid(S″i,Ri) ・・・(12) 但し、Σi:i=1,・・・,Nに関する和 M/N:画数の違いによる正規化乗数(≧1) もしくは、整形前の重なりの程度も同様に評価して加え
るべく、式(13)を用いて算出してもよい。[Equation 10] D = (M / N) Σ i d (S ″ i , R i ) ... (12) where Σ i : sum of i = 1, ..., N M / N: number of strokes The normalization multiplier (≧ 1) due to the difference or the degree of overlap before shaping may be calculated and calculated using the equation (13) in order to be evaluated and added in the same manner.
【0062】[0062]
【数11】 D=(M/N)Σi[d(S″i,Ri)+d(Si,Ri)]・・・(13) 式(13)を用いた場合、過剰な整形によって類似文字
間のパターン間距離差が小さくなることによる誤認識を
防止することができる。算出されたパターン間距離D
は、パターン間距離並べ換え装置11へ送出され一時格
納される。[Equation 11] D = (M / N) Σ i [d (S ″ i , R i ) + d (S i , R i )] (13) When using the equation (13), excessive shaping is performed. By this, it is possible to prevent erroneous recognition due to a decrease in the distance between patterns between similar characters.
Is sent to the inter-pattern distance rearrangement device 11 and temporarily stored.
【0063】上述した各装置7〜10における操作を、
その入力パターンと認識対象となっている全ての文字カ
テゴリーの標準パターンとの間で順次反復して行い、算
出されたパターン間距離はパターン間距離並べ換え装置
11へ逐次送出され蓄積される。The operation in each of the above-mentioned devices 7 to 10 is
The input pattern and the standard patterns of all the character categories to be recognized are sequentially repeated, and the calculated inter-pattern distances are sequentially transmitted to the inter-pattern distance rearrangement device 11 and accumulated.
【0064】パターン間距離並べ換え装置11は、認識
対象となっている全ての文字カテゴリーのおのおのにつ
いて算出されたパターン間距離Dを小さい順に並べ換え
て、該当し得る各文字カテゴリーについて距離Dの小さ
い順にその入力パターンの認識候補カテゴリーとして順
序付けて出力する。The inter-pattern distance rearrangement device 11 rearranges the inter-pattern distances D calculated for all the character categories to be recognized in ascending order, and for each applicable character category in the ascending order of the distance D. The input patterns are ordered and output as recognition candidate categories.
【0065】[0065]
【発明の効果】このように、本発明においては、先ず、
認識対象となっている文字カテゴリーのおのおのについ
て正しい画数及び筆順で筆記された多数文字パターンを
用いて、予め各ストロークの特徴点の平均位置座標を算
出してこれを標準文字パターンとして格納しておき、任
意の画数及び筆順で筆記されたカテゴリー未知の文字パ
ターンに対しても各ストロークの特徴点からなる入力パ
ターンで表現する。そして、その入力パターンと各文字
カテゴリーの標準パターンとの間で少ない方の画数に揃
えた最適な1対1のストローク対応を決定する。更に、
対応ストローク対ごとに双方の重なりが増すようにその
入力パターンの各ストロークに対して最適なアフィン変
換操作を施して整形入力パターンを生成し、標準パター
ンとの間でパターンマッチングを行う。従って、以上の
処理により、大きな又は予想外の手書き変形を含む場合
について格段の認識精度の向上を達成することができ
る。特に、パターン全体でもなく、特徴点単位でもな
く、ストローク単位で一様なアフィン変換を施している
ため、固過ぎず柔らか過ぎず安定な整形操作を実現して
いる。また、このような手書き変形への耐性向上のみで
はなく、辞書量を小さくすることができ、かつ処理時間
も十分に抑制できることも明らかである。更に、各スト
ロークについて筆順で前後する適当数の複数ストローク
をも含めてアフィン変換操作を最適化することで、認識
対象となっている文字データに含まれる手書き変形の程
度に応じて変形吸収の能力を制御することが可能であ
る。As described above, in the present invention, first,
For each of the character categories to be recognized, the average position coordinates of the characteristic points of each stroke are calculated in advance using the correct number of strokes and the multiple character pattern written in the stroke order, and this is stored as a standard character pattern. , A character pattern of unknown category written in an arbitrary number of strokes and stroke order is represented by an input pattern consisting of feature points of each stroke. Then, the optimum one-to-one stroke correspondence in which the number of strokes is aligned between the input pattern and the standard pattern of each character category is determined. Furthermore,
An optimal affine transformation operation is performed on each stroke of the input pattern so that the overlap between the corresponding strokes increases, and a shaped input pattern is generated, and pattern matching is performed with the standard pattern. Therefore, by the above processing, it is possible to significantly improve the recognition accuracy when a large or unexpected handwriting deformation is included. In particular, since the uniform affine transformation is performed not for the entire pattern but for each feature point, but for each stroke, a stable shaping operation is realized without being too hard or too soft. Further, it is apparent that not only the resistance to handwriting deformation is improved, but also the dictionary size can be reduced and the processing time can be sufficiently suppressed. Furthermore, by optimizing the affine transformation operation for each stroke, including the appropriate number of strokes before and after in the stroke order, the ability to absorb deformation according to the degree of handwriting deformation included in the character data to be recognized. It is possible to control
【図1】本発明のオンライン手書き文字認識装置におけ
る一実施形態の構成ブロック図である。FIG. 1 is a configuration block diagram of an embodiment of an online handwritten character recognition device of the present invention.
【図2】筆点から特徴点を抽出する場合の例を示す図で
ある。FIG. 2 is a diagram showing an example in the case of extracting feature points from writing points.
【図3】各ストローク対ごとに特徴点数を揃える処理の
例を示す図である。FIG. 3 is a diagram illustrating an example of a process of aligning the number of characteristic points for each stroke pair.
【図4】ストロークアフィン変換操作決定装置における
処理を説明するための図である。FIG. 4 is a diagram for explaining a process in a stroke affine transformation operation determining device.
【図5】ストロークアフィン変換操作決定装置における
処理を説明するための図である。FIG. 5 is a diagram for explaining processing in a stroke affine transformation operation determining device.
【図6】文字カテゴリー「泣」についての処理の例を示
す図である。FIG. 6 is a diagram illustrating an example of processing for a character category “cry”.
【図7】文字カテゴリー「永」についての処理の例を示
す図である。FIG. 7 is a diagram illustrating an example of processing for a character category “naga”.
1 文字情報入力装置 2 前処理装置 3 特徴点抽出装置 4 特徴点平均位置座標算出装置 5 標準パターン格納装置 6 入力パターン格納装置 7 ストローク対応決定装置 8 ストロークアフィン変換操作決定装置 9 整形入力パターン生成装置 10 パターン間距離算出装置 11 パターン間距離並べ換え装置 1 Character Information Input Device 2 Pre-Processing Device 3 Feature Point Extraction Device 4 Feature Point Average Position Coordinates Calculation Device 5 Standard Pattern Storage Device 6 Input Pattern Storage Device 7 Stroke Correspondence Determination Device 8 Stroke Affine Transformation Operation Determination Device 9 Shaped Input Pattern Generation Device 10 inter-pattern distance calculation device 11 inter-pattern distance rearrangement device
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小高 和己 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Kazumi Odaka 3-19-2 Nishishinjuku, Shinjuku-ku, Tokyo Inside Nippon Telegraph and Telephone Corporation
Claims (15)
各ストロークを一定点数の特徴点で表し、その特徴点の
位置座標を標準パターンとして予め格納しておき、 入力された手書き文字の入力パターンを前記特徴点で表
し、 前記標準パターンを文字カテゴリーごとに取り出し、 その取り出した標準パターンと前記入力パターンとの間
で、画数及び筆順の変動を吸収した1対1のストローク
対応を決定し、 前記入力パターンの各ストロークごとに、前記取り出し
た標準パターンの対応するストロークに対して重なりが
最大となるような前記入力パターンの対応するストロー
クに対するアフィン変換操作を決定し、 前記入力パターンの各ストロークごとに、決定されたア
フィン変換操作に基づき、アフィン変換を行って整形入
力パターンを生成し、 前記取り出した標準パターンと前記整形入力パターンと
の間で、対応するストローク対ごとの距離の和に基づく
パターン間距離を算出し、 全ての標準パターンと全ての標準パターンに対してそれ
ぞれ生成した整形入力パターンとのパターン間距離に基
づき、そのパターン間距離の小さい標準パターンに係る
文字カテゴリーから順に前記入力パターンについての認
識候補文字カテゴリーとすることを特徴とするオンライ
ン手書き文字認識方法。1. Strokes forming a character are represented by a fixed number of characteristic points for each character category, and the position coordinates of the characteristic points are stored in advance as a standard pattern, and an input pattern of an input handwritten character is stored. Expressed by the characteristic points, the standard pattern is extracted for each character category, and a one-to-one stroke correspondence that absorbs variations in the number of strokes and stroke order is determined between the extracted standard pattern and the input pattern, and the input For each stroke of the pattern, determine the affine transformation operation for the corresponding stroke of the input pattern such that the overlap with the corresponding stroke of the extracted standard pattern is maximum, and for each stroke of the input pattern, Generates a shaped input pattern by performing affine transformation based on the determined affine transformation operation , Between the extracted standard pattern and the shaping input pattern, the inter-pattern distance is calculated based on the sum of the distances of the corresponding stroke pairs, and the shaping is generated for all the standard patterns and all the standard patterns. An online handwritten character recognition method, characterized in that, based on a distance between patterns with an input pattern, character categories related to a standard pattern having a smaller distance between patterns are sequentially set as recognition candidate character categories for the input pattern.
記入力パターンの各ストロークごとに、そのストローク
及び筆順で前後する適当数のストロークを含む複数スト
ローク群についてアフィン変換を施し、標準パターン中
の対応する複数ストローク群への重なりが最大となるア
フィン変換操作を決定することを特徴とする請求項1に
記載のオンライン手書き文字認識方法。2. When deciding the affine transformation operation, for each stroke of the input pattern, affine transformation is performed on a plurality of stroke groups including the stroke and an appropriate number of strokes preceding and succeeding in the stroke order, and the affine transformation is performed. The on-line handwritten character recognition method according to claim 1, wherein an affine transformation operation that maximizes the overlap with a corresponding plurality of stroke groups is determined.
前記入力パターンと前記標準パターン間で対応するスト
ローク対ごとの距離の和をも加えてパターン間距離を算
出することを特徴とする請求項1に記載のオンライン手
書き文字認識方法。3. When the distance between patterns is calculated,
The online handwritten character recognition method according to claim 1, wherein the inter-pattern distance is calculated by adding a sum of distances for each stroke pair corresponding between the input pattern and the standard pattern.
パターンとの間で画数を揃える際に、画数の少ない方に
揃えることを特徴とする請求項1に記載のオンライン手
書き文字認識方法。4. The on-line handwritten character recognition method according to claim 1, wherein when the number of strokes is made uniform between the extracted standard pattern and the input pattern, the number of strokes is made smaller.
パターンとの間で、それぞれのストロークを1対1に対
応させる際に、ストローク対ごとに特徴点数を揃えるこ
とを特徴とする請求項1に記載のオンライン手書き文字
認識方法。5. The feature points according to claim 1, wherein when the strokes are made to correspond one-to-one between the extracted standard pattern and the input pattern, the feature points are made uniform for each stroke pair. Online handwriting recognition method.
各ストロークを一定点数の特徴点で表し、その特徴点の
位置座標を標準パターンとして予め格納しておく際に、
文字カテゴリーごとに複数の文字パターンを特徴点で表
し、それらの平均位置座標を標準パターンとして予め格
納しておくことを特徴とする請求項1に記載のオンライ
ン手書き文字認識方法。6. When each stroke forming a character is represented by a fixed number of characteristic points for each character category and the position coordinates of the characteristic points are stored in advance as a standard pattern,
The online handwritten character recognition method according to claim 1, wherein a plurality of character patterns are represented by feature points for each character category, and the average position coordinates of them are stored in advance as a standard pattern.
の始点及び終点を含むストローク長と共に増加する一定
点数を抽出することを特徴とする請求項1に記載のオン
ライン手書き文字認識方法。7. The on-line handwritten character recognition method according to claim 1, wherein when extracting the characteristic points, a fixed number of points that increases with a stroke length including a start point and an end point of the stroke is extracted.
文字情報入力手段と、 前記入力パターンを構成する各ストロークを一定点数の
特徴点で表す特徴点抽出手段と、 文字カテゴリーごとに、文字を構成する各ストロークが
一定点数の特徴点で表され、その特徴点の位置座標が標
準パターンとして予め格納される標準パターン格納手段
と、 前記標準パターンを文字カテゴリーごとに取り出し、そ
の取り出した標準パターンと前記入力パターンとの間
で、画数及び筆順の変動を吸収した1対1のストローク
対応を決定するストローク対応決定手段と、 前記入力パターンの各ストロークごとに、前記取り出し
た標準パターンの対応するストロークに対して重なりが
最大となるような前記入力パターンの対応するストロー
クに対するアフィン変換操作を決定するストロークアフ
ィン変換操作決定手段と、 前記入力パターンの各ストロークごとに、決定されたア
フィン変換操作に基づき、アフィン変換を行って整形入
力パターンを生成する整形入力パターン生成手段と、 前記取り出した標準パターンと前記整形入力パターンと
の間で、対応するストローク対ごとの距離の和に基づく
パターン間距離を算出するパターン間距離算出手段と、 全ての標準パターンと全ての標準パターンに対してそれ
ぞれ生成した整形入力パターンとのパターン間距離に基
づき、そのパターン間距離の小さい標準パターンに係る
文字カテゴリーから順に前記入力パターンについての認
識候補文字カテゴリーとするパターン間距離並べ換え手
段と、 を備えることを特徴とするオンライン手書き文字認識装
置。8. A character information input means for inputting an input pattern of handwritten characters, a feature point extraction means for expressing each stroke constituting the input pattern by a fixed number of feature points, and a character for each character category. Each stroke is represented by a fixed number of characteristic points, the position coordinates of the characteristic points are stored in advance as a standard pattern standard pattern storage means, the standard pattern is extracted for each character category, the standard pattern extracted and Stroke correspondence determining means for determining one-to-one stroke correspondence that absorbs variations in stroke count and stroke order between the input pattern and strokes corresponding to the extracted standard pattern for each stroke of the input pattern. Affine transformation for the corresponding strokes of the input pattern so that the overlap is maximized Stroke affine transformation operation determining means for determining a work, shaping input pattern generation means for performing affine transformation on the basis of the determined affine transformation operation for each stroke of the input pattern to generate a shaping input pattern, and the extraction Between the standard pattern and the shaped input pattern, the inter-pattern distance calculating means for calculating the inter-pattern distance based on the sum of the distances of the corresponding stroke pairs, and for all the standard patterns and all the standard patterns, respectively. Based on the inter-pattern distance with the generated shaped input pattern, the inter-pattern distance rearranging means that makes the recognition candidate character category for the input pattern in order from the character category related to the standard pattern having the smaller inter-pattern distance, An online handwriting recognition device.
段は、前記アフィン変換操作の決定の際に、前記入力パ
ターンの各ストロークごとに、そのストローク及び筆順
で前後する適当数のストロークを含む複数ストローク群
についてアフィン変換を施し、標準パターン中の対応す
る複数ストローク群への重なりが最大となるアフィン変
換操作を決定することを特徴とする請求項8に記載のオ
ンライン手書き文字認識装置。9. The stroke affine transformation operation determining means, when determining the affine transformation operation, for each stroke of the input pattern, regarding a plurality of stroke groups including the stroke and an appropriate number of strokes preceding and following the stroke order. 9. The on-line handwritten character recognition device according to claim 8, wherein an affine transformation operation is performed to determine an affine transformation operation that maximizes the overlap with a corresponding plurality of stroke groups in the standard pattern.
パターン間距離の算出を行う際に、前記入力パターンと
前記標準パターン間で対応するストローク対ごとの距離
の和をも加えてパターン間距離を算出することを特徴と
する請求項8に記載のオンライン手書き文字認識装置。10. The inter-pattern distance calculation means calculates the inter-pattern distance by adding the sum of the distances for each stroke pair corresponding between the input pattern and the standard pattern when calculating the inter-pattern distance. The on-line handwritten character recognition device according to claim 8, which is calculated.
取り出した標準パターンと前記入力パターンとの間で画
数を揃える際に、画数の少ない方に揃えることを特徴と
する請求項8に記載のオンライン手書き文字認識装置。11. The online handwriting according to claim 8, wherein the stroke correspondence determining means aligns the stroke number between the extracted standard pattern and the input pattern in a direction having a smaller stroke number. Character recognizer.
取り出した標準パターンと前記入力パターンとの間で、
それぞれのストロークを1対1に対応させる際に、スト
ローク対ごとに特徴点数を揃えることを特徴とする請求
項8に記載のオンライン手書き文字認識装置。12. The stroke correspondence determining means, between the extracted standard pattern and the input pattern,
9. The on-line handwritten character recognition device according to claim 8, wherein the number of characteristic points is made uniform for each stroke pair when each stroke is made to correspond one-to-one.
抽出する際に、ストロークの始点及び終点を含むストロ
ーク長と共に増加する一定点数を抽出することを特徴と
する請求項8に記載のオンライン手書き文字認識装置。13. The online system according to claim 8, wherein the feature point extracting means extracts a fixed number of points that increases with a stroke length including a start point and an end point of a stroke when the feature points are extracted. Handwritten character recognition device.
報入力手段を介して入力され、特徴点抽出手段により特
徴点が抽出されることを特徴とする請求項8に記載のオ
ンライン手書き文字認識装置。14. The on-line handwritten character recognition device according to claim 8, wherein the standard pattern is also input through the character information input means and the feature points are extracted by the feature point extraction means.
ゴリーごとに複数の文字パターンが入力され、 前記特徴点抽出手段の後段に、前記複数の文字パターン
の対応する複数のストロークについての複数の特徴点の
平均位置座標を算出する特徴点平均位置座標算出手段を
更に有することを特徴とする請求項14に記載のオンラ
イン手書き文字認識装置。15. A plurality of character patterns are input for each character category via the character information inputting means, and a plurality of features for a plurality of strokes corresponding to the plurality of character patterns are provided after the feature point extracting means. The online handwritten character recognition device according to claim 14, further comprising feature point average position coordinate calculation means for calculating average position coordinates of points.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17524896A JP3454335B2 (en) | 1995-07-17 | 1996-07-04 | Online handwritten character recognition method and apparatus |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7-179728 | 1995-07-17 | ||
JP17972895 | 1995-07-17 | ||
JP17524896A JP3454335B2 (en) | 1995-07-17 | 1996-07-04 | Online handwritten character recognition method and apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0991382A true JPH0991382A (en) | 1997-04-04 |
JP3454335B2 JP3454335B2 (en) | 2003-10-06 |
Family
ID=26496578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP17524896A Expired - Fee Related JP3454335B2 (en) | 1995-07-17 | 1996-07-04 | Online handwritten character recognition method and apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3454335B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002523844A (en) * | 1998-08-26 | 2002-07-30 | デクマ アクチボラゲット | Character recognition |
US6618504B1 (en) | 1996-11-15 | 2003-09-09 | Toho Business Management Center | Business management system |
JP2006091212A (en) * | 2004-09-22 | 2006-04-06 | Fuji Xerox Co Ltd | Printer and print result check method |
WO2010142090A1 (en) * | 2009-06-10 | 2010-12-16 | 中兴通讯股份有限公司 | Writing stroke identification apparatus, mobile terminal and method for realizing spatial writing |
CN113159031A (en) * | 2021-04-21 | 2021-07-23 | 广州逅艺文化科技有限公司 | Handwritten text detection method and device and storage medium |
-
1996
- 1996-07-04 JP JP17524896A patent/JP3454335B2/en not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6618504B1 (en) | 1996-11-15 | 2003-09-09 | Toho Business Management Center | Business management system |
JP2002523844A (en) * | 1998-08-26 | 2002-07-30 | デクマ アクチボラゲット | Character recognition |
JP2006091212A (en) * | 2004-09-22 | 2006-04-06 | Fuji Xerox Co Ltd | Printer and print result check method |
JP4525270B2 (en) * | 2004-09-22 | 2010-08-18 | 富士ゼロックス株式会社 | Printing apparatus and printing result inspection method |
WO2010142090A1 (en) * | 2009-06-10 | 2010-12-16 | 中兴通讯股份有限公司 | Writing stroke identification apparatus, mobile terminal and method for realizing spatial writing |
CN113159031A (en) * | 2021-04-21 | 2021-07-23 | 广州逅艺文化科技有限公司 | Handwritten text detection method and device and storage medium |
CN113159031B (en) * | 2021-04-21 | 2024-05-10 | 广州逅艺文化科技有限公司 | Handwritten text detection method, device and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP3454335B2 (en) | 2003-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kolcz et al. | A line-oriented approach to word spotting in handwritten documents | |
Kashi et al. | A Hidden Markov Model approach to online handwritten signature verification | |
US6275611B1 (en) | Handwriting recognition device, method and alphabet, with strokes grouped into stroke sub-structures | |
EP0539749A2 (en) | A statistical mixture approach to automatic handwriting recognition | |
Zhang et al. | Decoupled detr: Spatially disentangling localization and classification for improved end-to-end object detection | |
Sethy et al. | Off-line Odia handwritten numeral recognition using neural network: a comparative analysis | |
JP3125904B2 (en) | Handwritten character recognition method and handwritten character recognition system | |
US5940534A (en) | On-line handwritten character recognition using affine transformation to maximize overlapping of corresponding input and reference pattern strokes | |
Rabhi et al. | Multi-lingual handwriting recovery framework based on convolutional denoising autoencoder with attention model | |
CN109800702B (en) | Quick comparison method for finger vein identification and computer readable storage medium | |
JP3454335B2 (en) | Online handwritten character recognition method and apparatus | |
Schenk et al. | Selecting features in on-line handwritten whiteboard note recognition: SFS or SFFS? | |
CN110796138A (en) | A method for text recognition in irregular scenes based on explicit correction mechanism | |
US5337372A (en) | Method and apparatus for symbol recognition using multidimensional preprocessing at multiple resolutions | |
JP2997403B2 (en) | Handwritten character recognition method and apparatus | |
Safdar et al. | A novel similar character discrimination method for online handwritten Urdu character recognition in half forms | |
CN107067009B (en) | Real-time pole number identification method | |
Hamanaka et al. | On-line Japanese character recognition based on flexible pattern matching method using normalization-cooperative feature extraction | |
Chang et al. | Dynamic positional warping: dynamic time warping for online handwriting | |
Pavlidis et al. | An on-line handwritten note recognition method using shape metamorphosis | |
JPH0922443A (en) | On-line handwritten character recognition method | |
JP2686231B2 (en) | Handwritten character online recognition method and apparatus | |
Ou et al. | Fingerprint classifier using embedded hidden Markov models | |
Shao et al. | SETRN: A Transform Structure with Adaptive 3D Attention Mechanism and Global Semantic Supervision for Mobile-Captured Retail Receipts Recognition | |
Yamada et al. | Recognition of human kidney ultrasonic organ images by two‐dimensional dp matching method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070725 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080725 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080725 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090725 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |