[go: up one dir, main page]

JPH0934998A - On-line handwritten character recognizing method and device for the same - Google Patents

On-line handwritten character recognizing method and device for the same

Info

Publication number
JPH0934998A
JPH0934998A JP7179729A JP17972995A JPH0934998A JP H0934998 A JPH0934998 A JP H0934998A JP 7179729 A JP7179729 A JP 7179729A JP 17972995 A JP17972995 A JP 17972995A JP H0934998 A JPH0934998 A JP H0934998A
Authority
JP
Japan
Prior art keywords
character
stroke
pattern
writing
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7179729A
Other languages
Japanese (ja)
Inventor
Minoru Mori
稔 森
Yoshimasa Kimura
義政 木村
Nobuo Miyamoto
信夫 宮本
Kazumi Odaka
和己 小高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP7179729A priority Critical patent/JPH0934998A/en
Publication of JPH0934998A publication Critical patent/JPH0934998A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide on-line handwritten character recognizing method and device for the same with which even double writing/stroke cut/character describing a stroke from the opposite direction can be recognized by utilizing a recognizing method not depending on the input state of strokes consisting of a character. SOLUTION: A binary pattern composed of continuous lines is provided by performing the processing of interpolation between the writing points of the stroke consisting of a character to a handwritten input pattern 1 by preprocessing 30. The character line of this binary pattern is made thicker by thickening processing and sent to feature extracting processing 40 and a feature describing the character is extracted from the sent binary pattern. While using this extracted feature, the category to which the input pattern 1 belongs is discriminated by identifying processing 60 and a character candidate is outputted. Thus, since on-line handwritten character recognition is performed without depending on the input state of strokes, even double write/stroke cut/ character describing the stroke from the opposite direction can be recognized as well.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、文字の筆跡を筆記
の際の筆点座標の時系列で表現し、得られた位置座標の
時系列から当該文字を認識するオンライン手書き文字認
識に関わるものであり、更に詳しくは、二度書き/スト
ローク切れ/ストロークが逆方向から筆記された文字で
も認識可能とするオンライン手書き文字認識方法及びそ
の装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to online handwritten character recognition in which a handwriting of a character is represented by a time series of writing point coordinates at the time of writing and the character is recognized from the time series of the obtained position coordinates. More specifically, the present invention relates to an on-line handwritten character recognition method and an apparatus therefor capable of recognizing double strokes / stroke breaks / strokes written from the opposite direction.

【0002】[0002]

【従来の技術】従来のオンライン手書き文字認識方法
は、筆記された文字を構成するストロークを抽出し、該
ストローク群と予め格納されている標準辞書を構成する
ストローク群との間で各ストロークの対応付け処理を行
い、対応付けられたストローク間の距離の総和あるいは
類似度を求めることにより文字認識を行っていた。
2. Description of the Related Art A conventional online handwritten character recognition method extracts strokes forming a written character, and associates each stroke between the stroke group and a stroke group forming a standard dictionary stored in advance. Character recognition is performed by performing an attachment process and obtaining the sum of the distances between the associated strokes or the degree of similarity.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、上記従
来のオンライン手書き文字認識方法では、二度書き/ス
トローク切れ/ストロークが逆方向から筆記された文字
などには、認識が困難になるという問題点があった。
However, in the above-mentioned conventional online handwritten character recognition method, there is a problem in that it is difficult to recognize double strokes / stroke breaks / strokes written in the opposite direction. there were.

【0004】本発明は上記従来の技術における問題点に
鑑みてなされたもので、その目的は、文字を構成するス
トロークの入力状態に依存しない認識方法を利用するこ
とにより、二度書き/ストローク切れ/ストロークが逆
方向から筆記された文字も認識可能とする方法及びその
装置を提供し、手書き文字認識の入力条件の緩和を実現
することにある。
The present invention has been made in view of the above problems in the prior art, and an object of the present invention is to use a recognition method that does not depend on the input state of the strokes that form a character, so that double strokes / stroke breaks can be achieved. Another object of the present invention is to provide a method and an apparatus for making it possible to recognize a character whose stroke is written from the opposite direction, and to relax the input condition for handwritten character recognition.

【0005】[0005]

【課題を解決するための手段】上記目的を達成するため
本発明の第1の発明では、手書き入力文字の筆跡を筆記
の際のペンダウン点からペンアップ点までの一連の筆点
座標時系列からなるストロークで表現する段階と、前記
表現されたストロークから白黒2値の画素からなる2値
パターンを生成する段階と、前記生成された2値パター
ンから特徴を抽出して当該文字の認識を行う段階と、を
有することを特徴とするオンライン手書き文字認識方法
を手段とする。
In order to achieve the above object, in the first invention of the present invention, a handwriting of a handwritten input character is selected from a series of writing point coordinate time series from a pen down point to a pen up point when writing. And a step of generating a binary pattern consisting of black and white binary pixels from the expressed stroke, and a step of extracting features from the generated binary pattern to recognize the character. And an on-line handwritten character recognition method characterized by having:

【0006】上記のオンライン手書き文字認識方法で
は、2値パターンを生成する段階において、文字を構成
するストロークの各筆点間の補間処理によって連続した
線からなる2値パターンを生成するのが、手書き文字入
力の速度と入力パターンの取り込み速度の差により筆点
座標列が離散的になるのを補正して認識能力を高める上
で好適である。
In the above-described online handwritten character recognition method, at the stage of generating a binary pattern, a binary pattern composed of continuous lines is generated by interpolation processing between each writing point of strokes forming a character. This is suitable for correcting the fact that the brush point coordinate sequence becomes discrete due to the difference between the speed of inputting characters and the speed of inputting an input pattern and improving recognition ability.

【0007】また、以上のオンライン手書き文字認識方
法では、2値パターンを生成する段階において、ストロ
ークの太め処理によって太められた線からなる2値パタ
ーンを生成するするのが、特徴抽出を容易にする上で好
適である。
Further, in the above online handwritten character recognition method, at the stage of generating a binary pattern, generating a binary pattern composed of a line thickened by stroke thickening processing facilitates feature extraction. It is suitable above.

【0008】同じく、本発明の第2の発明では、表示手
段の画面上に重ねられ、手書き入力される文字のストロ
ークの座標の検出を行う入力手段と、前記座標の検出さ
れた文字のストロークの筆点から2値パターンを生成す
る前処理部と、前記生成された2値パターンから特徴を
抽出する特徴抽出部と、前記抽出された特徴を用いて前
記入力された文字のカテゴリの識別を行う識別部と、を
具備することを特徴とするオンライン手書き文字認識装
置を手段とする。
Similarly, in the second aspect of the present invention, the input means for detecting the coordinates of the stroke of the character overlaid on the screen of the display means and input by handwriting, and the stroke of the character for which the coordinates have been detected are detected. A pre-processing unit that generates a binary pattern from a brush point, a feature extraction unit that extracts a feature from the generated binary pattern, and a category of the input character is identified using the extracted feature. An on-line handwritten character recognition device, characterized by comprising: an identification unit.

【0009】上記のオンライン手書き文字認識装置にお
いては、前処理部に、または前処理とは独立に、文字の
ストロークの筆点間を補間し連続した線からなるストロ
ークとする筆点間補間手段を有する構成とするのが、手
書き文字入力の速度と入力パターンの取り込み速度の差
により筆点座標列が離散的になるのを補正して認識能力
を高める上で好適である。
In the above-mentioned on-line handwritten character recognition device, a pre-processing unit or, independently of the pre-processing, inter-writing point interpolating means for interpolating the writing points of the strokes of a character to form a stroke consisting of continuous lines is provided. It is preferable to have the configuration to improve the recognition ability by correcting the fact that the brush point coordinate sequence is discrete due to the difference between the handwriting character input speed and the input pattern input speed.

【0010】また、以上のオンライン手書き文字認識装
置においては、前処理部に、または前処理とは独立に、
前記前処理部が生成する2値パターンの文字線分を太め
る手段を有する構成とするのが、特徴抽出を容易にする
上で好適である。
Further, in the above online handwritten character recognition device, in the preprocessing section or independently of the preprocessing,
It is preferable to have a configuration for thickening the character line segment of the binary pattern generated by the preprocessing unit in order to facilitate the feature extraction.

【0011】上記本発明のオンライン手書き文字認識方
法及びその装置では、手書き入力された文字のストロー
クの筆点間の補間処理によって得られる連続した線で構
成される2値パターン、あるいは該2値パターンの文字
線の太め処理により得られる2値パターンから抽出した
特徴を用いて文字認識を行うことで、ストロークの入力
状態に依存しないオンライン手書き文字認識を可能とす
ることにより、二度書き/ストローク切れ/ストローク
が逆方向から筆記された文字などの認識を可能とする。
In the above-described on-line handwritten character recognition method and apparatus of the present invention, a binary pattern composed of continuous lines obtained by interpolation processing between the writing points of strokes of characters input by handwriting, or the binary pattern. By performing character recognition using the features extracted from the binary pattern obtained by thickening the character lines, it is possible to perform online handwritten character recognition that does not depend on the input state of strokes. / Enables recognition of strokes written in the opposite direction.

【0012】[0012]

【発明の実施の形態】次に、図を参照して本発明の実施
の形態を説明する。
Next, an embodiment of the present invention will be described with reference to the drawings.

【0013】図1は、本発明のオンライン手書き文字認
識方法における一実施の形態例を示すブロック図であっ
て、1は入力パターン、30は前処理、40は特徴抽出
処理、60は識別処理、70は識別結果である。
FIG. 1 is a block diagram showing an embodiment of an online handwritten character recognition method of the present invention, in which 1 is an input pattern, 30 is preprocessing, 40 is feature extraction processing, 60 is identification processing, 70 is an identification result.

【0014】入力パターン1は、入力手段から手書き入
力された文字の筆跡が筆記の際のペンダウン点からペン
アップ点までの一連の筆点座標時系列からなるストロー
クで表現されて、前処理30に送られる。入力パターン
1は、この前処理30により2値パターン化が施され、
特徴抽出処理40により文字を記述する特徴が抽出され
て、識別処理60に送られる。識別処理60では、前記
特徴を用いることにより、該入力パターン1の属する文
字カテゴリを判定する識別処理を行い、識別結果70を
出力する。
The input pattern 1 is represented by a stroke composed of a series of writing point coordinate time series from a pen-down point to a pen-up point at the time of writing a handwriting of a character handwritten by the input means. Sent. The input pattern 1 is binary-patterned by this preprocessing 30,
The features that describe the character are extracted by the feature extraction process 40 and sent to the identification process 60. In the discrimination processing 60, the characteristic is used to perform the discrimination processing for determining the character category to which the input pattern 1 belongs, and the discrimination result 70 is output.

【0015】図2は、図1の前処理30を詳細に示すブ
ロック図であって、31は雑音除去処理、32は平滑化
処理、33は位置の正規化処理、34は大きさの正規化
処理、35は筆点間補間処理、36は太め処理である。
FIG. 2 is a block diagram showing in detail the preprocessing 30 of FIG. 1, in which 31 is a noise removing process, 32 is a smoothing process, 33 is a position normalizing process, and 34 is a size normalizing process. The process, 35 is the inter-stroke interpolation process, and 36 is the thickening process.

【0016】雑音除去処理31は、入力パターン1の筆
点時系列中における時刻tの筆点と時刻t+1の筆点と
が、あらかじめ定めた閾値以上に離れている時、時刻t
+1の筆点を除去する最初の処理である。
The noise removal processing 31 is performed at time t when the writing point at time t and the writing point at time t + 1 in the writing point time series of the input pattern 1 are separated by a predetermined threshold value or more.
This is the first processing to remove the +1 writing point.

【0017】雑音除去処理31に続く平滑化処理32
は、手書きによるペンのぶれが生じた場合などに、座標
系列が多数の凸凹を含んでいる状態を平滑にする処理で
ある。
Smoothing processing 32 following noise removal processing 31
Is a process for smoothing a state in which the coordinate series includes a large number of irregularities, for example, when a pen shakes due to handwriting.

【0018】平滑化処理32に続く位置の正規化処理3
3は、文字を構成する全筆点のx,y座標値の各々の平
均値を算出して文字の重心と定義し、ついで該重心が文
字枠の中心位置にくるように入力パターン全体の平行移
動を行う処理である。
Position normalization process 3 following the smoothing process 32
3 is defined as the center of gravity of the character by calculating the average value of each of the x and y coordinate values of all the writing points forming the character, and then the input pattern is parallel so that the center of gravity is at the center of the character frame. This is a process of moving.

【0019】位置の正規化処理33に続く大きさの正規
化処理34は、上記で求めた文字の重心から各筆点への
距離の平均値があらかじめ定めた正規化半径に等しくな
るように、重心回りに一様に文字パターンの拡大/縮小
を行う処理である。
A size normalization process 34 following the position normalization process 33 is performed so that the average value of the distances from the barycenter of the character obtained above to each writing point becomes equal to a predetermined normalization radius. This is a process for uniformly enlarging / reducing a character pattern around the center of gravity.

【0020】大きさの正規化処理34に続いて筆点間補
間処理35がなされるが、その詳細な説明は、図3を用
いて行う。
The size normalization process 34 is followed by a writing point interpolation process 35, which will be described in detail with reference to FIG.

【0021】同じストローク内の連続した筆点aと筆点
b間を補間する場合において、まず、筆点a、筆点b間
のx軸射影長Δx(=‖xb−xa‖)とy軸射影長Δy
(=‖yb−ya‖)を計算する。但し、‖‖は絶対値を
表す。
When interpolating between consecutive writing points a and b in the same stroke, first, the x-axis projection length Δx (= ‖x b −x a ‖) between the writing points a and b is calculated. y-axis projection length Δy
(= ‖Y b -y a ||) is calculated. However, ‖‖ represents the absolute value.

【0022】Δx≧Δyの場合、c=Δy/Δxとし、
b>xaかつyb>yaならば、補間される筆点列は(x
a+1,[c×1+ya+0.5]),(xa+2,[c
×2+ya+0.5])…,(xa+Δx−2,[c×
(Δx−2)+ya+0.5]),(xa+Δx−1,
[c×(Δx−1)+ya+0.5])である。ただ
し、[]はガウス関数を表す。
When Δx ≧ Δy, c = Δy / Δx,
x b> x a and y b> y a, then the writing point sequence to be interpolated are (x
a +1, [c × 1 + y a +0.5]), (x a +2, [c
× 2 + y a +0.5]) ..., (x a + Δx-2, [c ×
(Δx-2) + y a +0.5]), (x a + Δx-1,
It is [c × (Δx-1) + y a +0.5]). However, [] represents a Gaussian function.

【0023】同様に、xb>xaかつyb<yaならば、補
間される筆点列は(xa+1,[c×(−1)+ya
0.5]),(xa+2,[c×(−2)+ya+0.
5])…,(xa+Δx−2,[c×(−Δx+2)+
a+0.5]),(xa+Δx−1,[c×(−Δx+
1)+ya+0.5])である。
[0023] Similarly, x b> x a and y b <y a, then the writing point sequence to be interpolated are (x a +1, [c × (-1) + y a +
0.5]), (x a +2 , [c × (-2) + y a +0.
5]) ..., (x a + Δx−2, [c × (−Δx + 2) +
y a +0.5]), (x a + Δx-1, [c × (-Δx +
1) a + y a +0.5]).

【0024】xb<xaかつyb>yaならば、補間される
筆点列は(xa−1,[c×1+ya+0.5]),(x
a−2,[c×2+ya+0.5])…,(xa−Δx+
2,[c×(Δx−2)+ya+0.5]),(xa−Δ
x+1,[c×(Δx−1)+ya+0.5])であ
る。
[0024] If x b <x a and y b> y a, writing point sequence to be interpolated are (x a -1, [c × 1 + y a +0.5]), (x
a -2, [c × 2 + y a +0.5]) ..., (x a -Δx +
2, [c × (Δx- 2) + y a +0.5]), (x a -Δ
x + 1, which is [c × (Δx-1) + y a +0.5]).

【0025】xb<xaかつyb<yaならば、補間される
筆点列は(xa−1,[c×(−1)+ya+0.
5]),(xa−2,[c×(−2)+ya+0.5])
…,(xa−Δx+2,[c×(−Δx+2)+ya
0.5]),(xa−Δx+1,[c×(−Δx+1)
+ya+0.5])である。
[0025] x b <x If a and y b <y a, writing point sequence to be interpolated are (x a -1, [c × (-1) + y a +0.
5]), (x a -2 , [c × (-2) + y a +0.5])
..., (x a -Δx + 2 , [c × (-Δx + 2) + y a +
0.5]), (x a −Δx + 1, [c × (−Δx + 1)
+ A y a +0.5]).

【0026】また、Δx<Δyの場合、c=Δy/Δx
とし、xとyを逆にした前記同様の処理で補間する。
When Δx <Δy, c = Δy / Δx
Then, interpolation is performed by the same process as above with x and y reversed.

【0027】図4に、文字「て」において、ストローク
内の筆点間補間処理により、離散した筆点系列から連続
した筆点系列が得られる例を示す。
FIG. 4 shows an example in which a continuous writing point series is obtained from a discrete writing point series by interpolating the writing point in the stroke in the character "TE".

【0028】次に、筆点間補間処理35に続く太め処理
36の詳細な説明を、図5を用いて行う。
Next, a detailed description of the thickening process 36 following the inter-stroke interpolating process 35 will be given with reference to FIG.

【0029】2値パターンは、文字線分を表す黒点と文
字背景部を表す白点とから構成されている。筆点補間処
理を施されると、1メッシュの幅からなる線分で構成さ
れた文字パターンが生成される。補間処理後の文字パタ
ーンの一部を図5(a)に示す。
The binary pattern is composed of black dots representing a character line segment and white dots representing a character background portion. When the brush point interpolation processing is performed, a character pattern composed of line segments having a width of 1 mesh is generated. A part of the character pattern after the interpolation processing is shown in FIG.

【0030】まず最初に、文字線に3メッシュ太める処
理を行う方法について説明する。点Pにおいて上/下/
左/右に隣接する4メッシュが白点であれば、該白点を
黒点に変換する。点Pにおいては上/左/下に隣接する
点は白点であるため文字線分を表す黒点に変更される
が、右が隣接する点は元来黒点であるため前記処理は施
されない。該処理の様子を図5(b)に示す。次に隣の
点P’に着目する。点P’においては、上/左に隣接す
るメッシュは元来黒点であるため前処理を行わないが、
下/右に隣接するメッシュは白点であるため新たに黒点
にする。該処理の様子を図5(c)に示す。同様な手法
で存在する全ての文字線分のメッシュについて太め処理
を行う。
First, a method for thickening a character line by 3 meshes will be described. Up / down / at point P
If the four meshes adjacent to the left / right are white points, the white points are converted to black points. At the point P, the points adjacent to the top / left / bottom are white points and are therefore changed to black points that represent the character line segment, but the points that are adjacent to the right are originally black points and the above processing is not performed. The state of the processing is shown in FIG. Next, pay attention to the adjacent point P ′. At the point P ′, since the mesh adjacent to the upper / left side is originally a black point, pre-processing is not performed,
The mesh adjacent to the bottom / right side is a white point, so a new black point is created. The state of the processing is shown in FIG. The thickening process is performed on all the meshes of the character line segments that exist in the same manner.

【0031】また、同様に5メッシュの幅に太める場合
には、1度目の太め処理で新たに付け加えられたメッシ
ュにのみ着目して同様な処理を行うことにより、効率的
に太め処理を行うことが可能となる。さらに、それ以上
の太め処理に関しては、前記手法の繰り返しで可能であ
る。
Similarly, when thickening to a width of 5 meshes, the thickening process is efficiently performed by focusing on only the mesh newly added in the first thickening process and performing the same process. It becomes possible. Further, for thickening processing beyond that, it is possible to repeat the above method.

【0032】また、以上説明した太め処理では着目する
隣接メッシュ数は4メッシュとしたが、上/下/左/右
に隣接する4メッシュと右上/右下/左下/左上に隣接
する4メッシュとを合わせた8メッシュに着目する方法
も可能である。隣接する8メッシュに着目した場合にお
ける例を図5(d)及び図5(e)に示す。
In the thickening process described above, the number of adjacent meshes of interest is 4 meshes. However, there are 4 meshes adjacent to top / bottom / left / right and 4 meshes adjacent to upper right / lower right / lower left / upper left. It is also possible to pay attention to the 8 meshes that are combined. An example in the case of paying attention to adjacent 8 meshes is shown in FIG. 5 (d) and FIG. 5 (e).

【0033】図6に、文字「ヘ」において、太め処理が
行われる例を示す。図6(a)は筆点間補間処理が行わ
れた後の文字パターン、図6(b)は上/下/左/右の
4メッシュに着目した場合における3メッシュの幅に太
めた後の文字パターン、図6(c)は該文字パターンを
5メッシュの幅に太めた後の文字パターン、図6(d)
は上/下/左/右/右上/右下/左下/左上の8メッシ
ュに着目した場合における3メッシュの幅に太めた後の
文字パターン、図6(e)は該文字パターンを5メッシ
ュの幅に太めた後の文字パターンを表す。
FIG. 6 shows an example in which the thickening process is performed on the character "F". FIG. 6A shows a character pattern after the inter-stroke interpolation processing is performed, and FIG. 6B shows a character pattern after being thickened to a width of 3 mesh when focusing on 4 meshes of upper / lower / left / right. Character pattern, FIG. 6 (c) is a character pattern after the character pattern is thickened to a width of 5 mesh, FIG. 6 (d).
Is a character pattern after being thickened to a width of 3 mesh in the case of focusing on 8 meshes of top / bottom / left / right / bottom right / bottom left / bottom left, and FIG. 6 (e) shows the character pattern of 5 meshes. Represents a character pattern after it is widened to the width.

【0034】図7は、本発明のオンライン手書き文字認
識装置の構成例を示す図であって、10は入力一体化表
示部、11は入力部、12は表示部、20はスタイラス
ペン、30aは前処理部、40aは特徴抽出部、50は
辞書、60aは識別部である。
FIG. 7 is a diagram showing a configuration example of the on-line handwritten character recognition apparatus of the present invention. 10 is an input integrated display section, 11 is an input section, 12 is a display section, 20 is a stylus pen, and 30a is 30a. A preprocessing unit, 40a is a feature extraction unit, 50 is a dictionary, and 60a is an identification unit.

【0035】以上のように構成された装置における動作
を説明する。
The operation of the apparatus configured as above will be described.

【0036】本構成例では、文字を記述する特徴とし
て、拡張外郭寄与度特徴を用いた場合を例にして説明す
る。
In this configuration example, the case where the extended contour contribution rate feature is used as a feature for describing a character will be described as an example.

【0037】入力一体化表示部10は、入力部11と表
示部12を重ね合わせることにより構成されるものであ
って、例えば入力部11としては電磁誘導タブレット、
表示部12としては液晶表示装置が用いられる。
The input-integrated display unit 10 is constituted by stacking the input unit 11 and the display unit 12, and for example, the input unit 11 is an electromagnetic induction tablet,
A liquid crystal display device is used as the display unit 12.

【0038】文字はスタイラスペン20により、一本ず
つのストロークとして入力部11に入力される。入力部
11に入力されたストローク群は一文字単位で切り出さ
れ、前処理部30aに送られる。
Characters are input to the input unit 11 by the stylus pen 20 as individual strokes. The stroke group input to the input unit 11 is cut out character by character and sent to the preprocessing unit 30a.

【0039】前処理部30aに送られたストローク群
は、図2で示される手順で各前処理31〜36が行われ
る。公知の前処理としては、雑音除去処理がある。雑音
除去が行われたストローク群は平滑化処理が行われ、つ
いで位置の正規化処理、大きさの正規化処理が行われ
る。
The stroke groups sent to the preprocessing unit 30a are subjected to the preprocessings 31 to 36 in the procedure shown in FIG. A well-known pre-process is a noise removal process. The noise-removed stroke group is subjected to smoothing processing, and then to position normalization processing and size normalization processing.

【0040】また、本発明における前処理部30aで
は、上記した前処理以外に筆点間補間処理を行う。該処
理を行う理由は、スタイラスペン20で入力される筆記
速度に対し、入力部11が筆点座標列として取り込む速
度が充分でない場合に、その筆点座標列が離散的になる
ような場合に対応して認識能力を高めるためである。補
間法としては、例えば図3に示した補間法を利用するこ
とが考えられる。
Further, the preprocessing unit 30a of the present invention performs the inter-stroke interpolation processing in addition to the above-mentioned preprocessing. The reason for performing this processing is that when the writing speed input by the stylus pen 20 is not sufficiently fast for the input unit 11 to take in as a writing point coordinate sequence, the writing point coordinate sequence becomes discrete. This is to increase the cognitive ability correspondingly. As the interpolation method, for example, the interpolation method shown in FIG. 3 may be used.

【0041】筆点間補間処理が行われることによって2
値パターン化された入力パターンに対して、次に、文字
線分の線幅を太くする太め処理を行う。該処理を行う理
由は、特徴抽出部40aにおける特徴抽出を容易にする
ためである。太め処理方法としては、例えば図5に示す
ような太め処理が考えられる。該前処理が行われること
により、入力パターンは、二度書き/ストローク切れ/
ストロークが逆方向からの筆記などストロークの入力状
態に依存しない文字パターンに変換することが可能とな
る。
By performing the inter-stroke interpolating process, 2
A thickening process for thickening the line width of the character line segment is then performed on the value-patterned input pattern. The reason for performing this process is to facilitate the feature extraction in the feature extraction unit 40a. As a thickening processing method, for example, a thickening processing as shown in FIG. 5 can be considered. By performing the pre-processing, the input pattern is written twice
It becomes possible to convert the stroke into a character pattern that does not depend on the input state of the stroke, such as writing from the opposite direction.

【0042】前処理が行われた文字パターンは、特徴抽
出部40aに送られる。特徴抽出部40aでは、前処理
部30aより送られた文字パターンから、拡張外郭方向
寄与度特徴を抽出する処理が行われる。抽出された特徴
は、識別部60aに送られる。
The pre-processed character pattern is sent to the feature extraction unit 40a. The feature extraction unit 40a performs a process of extracting the extended contour direction contribution rate feature from the character pattern sent from the preprocessing unit 30a. The extracted features are sent to the identification unit 60a.

【0043】特徴処理された文字パターンを受け取った
識別部60aは、辞書50から取り出した各々の標準パ
ターンの特徴と入力パターンの特徴との間で距離計算を
行う。距離が最小となった文字カテゴリを識別結果とし
て、表示部11に送る。また、2番目に距離が小さい文
字からn番目に距離が小さい文字までの文字カテゴリを
候補文字群として、表示部11に送る。nの値は予め設
定しておく。
The identification unit 60a, which has received the character pattern subjected to the characteristic process, calculates the distance between the characteristic of each standard pattern extracted from the dictionary 50 and the characteristic of the input pattern. The character category having the smallest distance is sent to the display unit 11 as an identification result. Further, the character categories from the character having the second smallest distance to the character having the nth smallest distance are sent to the display unit 11 as a candidate character group. The value of n is set in advance.

【0044】以上の動作により、ストロークに依存しな
いオンライン手書き文字認識を行うことが可能となり、
二度書き/ストローク切れ/ストロークが逆方向から筆
記された文字を認識することが可能となる。
With the above operation, it is possible to perform online handwritten character recognition independent of strokes.
It becomes possible to recognize a character written twice from strokes / stroke breaks / strokes in opposite directions.

【0045】二度書きされた文字「よ」が認識可能とな
る例を図8に示す。入力パターンを表す図8(a)にお
いて、横の線を後で書き直すことにより3画で書かれて
いるために、従来手法では正しく認識することが困難で
ある。二度書きが行われた部分の拡大図を図8(b)に
示す。しかし、本発明の認識方法においては、2値パタ
ーン化することにより、筆順/画数に依存しないため、
二度書きの影響を受けにくくなることにより認識可能に
なる。2値パターン化後の拡大図を図8(c)に示す。
FIG. 8 shows an example in which the character "YO" written twice can be recognized. In FIG. 8A showing the input pattern, it is difficult to correctly recognize it by the conventional method because the horizontal line is written in three strokes by rewriting it later. An enlarged view of the portion where the writing is performed twice is shown in FIG. However, since the recognition method of the present invention does not depend on the stroke order / stroke count by forming a binary pattern,
It becomes recognizable because it is less susceptible to double writing. An enlarged view after the binary patterning is shown in FIG.

【0046】ストローク切れの文字「4」が認識可能と
なる例を図9に示す。入力パターン図9(a)におい
て、1画目がストローク切れになった為に、従来手法で
は、3画の「千」に誤認識される可能性が極めて高い。
「4」の標準パターンを図9(b)、「千」の標準パタ
ーンを図9(c)に示す。しかし、本発明の認識方法に
おいては、2値パターン化することにより、ストローク
切れによる画数変動の影響を受けなくなることにより認
識可能となる。2値パターン化後の入力パターンを図9
(d)に、同「4」の標準パターンを図9(e)、同
「千」の標準パターンを図9(f)に示す。
FIG. 9 shows an example in which the character "4", which is out of stroke, can be recognized. In the input pattern FIG. 9A, since the stroke of the first stroke is broken, the conventional method has a very high possibility of being erroneously recognized as “thousand” of three strokes.
The standard pattern of "4" is shown in FIG. 9B, and the standard pattern of "thousand" is shown in FIG. 9C. However, in the recognition method of the present invention, the binary patterning allows the recognition to be performed because it is not affected by the fluctuation in the number of strokes due to the stroke break. Figure 9 shows the input pattern after binary patterning.
9D shows the standard pattern of "4" and FIG. 9F shows the standard pattern of "1000".

【0047】ストロークが逆方向から筆記された文字
「能」が認識可能となる例を図10に示す。入力パター
ンを表す図10(a)において、ストロークが逆方向か
ら筆記されている。ストロークが逆方向から筆記された
部分の拡大図を図9(c)に示す。従来手法において
は、ストロークの入力方向順に距離計算を行うため、標
準パターン図9(b)間との距離値が大きくなってしま
い誤認識される確率が大きくなる。該拡大図と対応する
標準パターンの拡大図を図10(d)に示す。しかし、
本発明の認識方法においては、2値パターン化すること
により、ストロークの入力方向の影響を受けなくなるこ
とにより認識可能になる。入力パターンの2値パターン
化後の拡大図を図10(e)に示す。標準パターンの2
値パターン化後の拡大図を図10(f)に示す。
FIG. 10 shows an example in which the character "Noh" whose stroke is written in the opposite direction can be recognized. In FIG. 10A showing the input pattern, strokes are written from the opposite direction. An enlarged view of the portion where the stroke is written from the opposite direction is shown in FIG. In the conventional method, since the distances are calculated in order of the stroke input direction, the distance value between the standard pattern and FIG. 9B becomes large, and the probability of erroneous recognition increases. An enlarged view of the standard pattern corresponding to the enlarged view is shown in FIG. But,
In the recognition method of the present invention, the binary pattern is used, so that it can be recognized because the influence of the stroke input direction is eliminated. An enlarged view of the input pattern after binary patterning is shown in FIG. Standard pattern 2
An enlarged view after the value patterning is shown in FIG.

【0048】以上説明した本実施の形態例では、特徴抽
出法として拡張外郭寄与度特徴を用いたが、それ以外の
特徴抽出法を用いることも可能である。
In the embodiment described above, the extended contour contribution feature is used as the feature extraction method, but it is also possible to use other feature extraction methods.

【0049】また、本実施の形態例では、筆点間補間処
理と太め処理の両方を実施する例を示したが、特徴抽出
処理の手法によっては太め処理を必要としない場合もあ
る。その場合には、図2に示すように、2値パターンを
筆点間補間処理35から特徴抽出処理40に送れば良
い。また、高速に筆点座標列を取り込むことができる場
合には、筆点間補間処理を必要としない場合も考えられ
る。
Further, in the present embodiment, an example in which both the inter-stroke point interpolation processing and the thickening processing are executed is shown, but the thickening processing may not be necessary depending on the feature extraction processing method. In that case, as shown in FIG. 2, the binary pattern may be sent from the inter-stroke interpolating process 35 to the feature extracting process 40. In addition, when the brush point coordinate sequence can be captured at high speed, there may be a case where inter-brush point interpolation processing is not required.

【0050】また、本実施の形態例では、筆点間補間部
と太め処理部が前処理部の内部に存在するものとした
が、前処理部と別の回路とすることも可能である。
Further, in the present embodiment, the inter-stroke interpolating section and the thickening processing section are provided inside the pre-processing section, but a circuit different from the pre-processing section may be used.

【0051】以上、本発明の実施の形態例に基づいて具
体的に説明したが、本発明は前記実施の形態例に限定さ
れるものではなく、その主旨を逸脱しない範囲において
種々変更可能であることは言うまでもない。
Although the present invention has been specifically described based on the embodiments of the present invention, the present invention is not limited to the embodiments described above, and various modifications can be made without departing from the spirit of the present invention. Needless to say.

【0052】[0052]

【発明の効果】以上説明したように、本発明のオンライ
ン手書き文字認識方法及びその装置によれば、ストロー
クの入力状態に依存せずに認識を行うことができ、従来
のオンライン文字認識方法及びその装置に特有な筆順/
画数の筆記制限をなくし自由な筆順/画数での入力が可
能となるのみならず、二度書き/ストローク切れ/スト
ロークの逆方向から筆記された文字に対しても認識可能
となるため、携帯時などの悪環境での文字筆記に極めて
耐性を持つ入力方法及びその装置を実現できる長所があ
る。
As described above, according to the on-line handwritten character recognition method and apparatus of the present invention, recognition can be performed without depending on the stroke input state. Stroke order / specific to the device
It is possible not only to input the stroke order / strokes freely by eliminating the writing stroke limit, but also to recognize characters written from double strokes / stroke breaks / reverse strokes. There is an advantage that it is possible to realize an input method and its device that are extremely resistant to writing characters in a bad environment such as.

【0053】また、前処理において、筆点間補間を行う
ようにした場合には、特に、筆記速度と筆点座標列の入
力速度の差から入力文字の筆点座標列が離散的になる場
合に、ストロークが連続する線となるように補正するこ
とができ、認識能力の向上に寄与できる。
Further, in the case where the inter-writing point interpolation is performed in the pre-processing, especially when the writing point coordinate sequence of the input character becomes discrete due to the difference between the writing speed and the input velocity of the writing point coordinate sequence. In addition, the stroke can be corrected to be a continuous line, which can contribute to the improvement of the recognition ability.

【0054】また、前処理において、ストロークの太め
処理を行うようにした場合には、特に、認識を行うため
の特徴抽出を容易にすることができ、認識能力の向上に
寄与できる。
When stroke thickening processing is performed in the preprocessing, feature extraction for recognition can be particularly facilitated, which contributes to improvement of recognition ability.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明のオンライン手書き文字認識方法におけ
る実施の形態例を示すブロック図である。
FIG. 1 is a block diagram showing an embodiment of an online handwritten character recognition method of the present invention.

【図2】上記実施の形態における前処理を詳細に示すブ
ロック図である。
FIG. 2 is a block diagram showing details of preprocessing in the above embodiment.

【図3】上記前処理におけるストロークの筆点間を補間
する様子を表した図である。
FIG. 3 is a diagram showing a state of interpolating between stroke writing points in the preprocessing.

【図4】上記前処理におけるストロークの筆点間を補間
する処理を表した図である。
FIG. 4 is a diagram showing a process of interpolating between stroke writing points in the preprocessing.

【図5】上記前処理における2値パターンにおける線分
の太め処理を説明する図である。
FIG. 5 is a diagram illustrating thickening processing of a line segment in a binary pattern in the preprocessing.

【図6】上記太め処理例を示した図である。FIG. 6 is a diagram showing an example of the thickening process.

【図7】本発明の構成例を説明する図である。FIG. 7 is a diagram illustrating a configuration example of the present invention.

【図8】二度書きが行われた例を示した図である。FIG. 8 is a diagram showing an example in which writing is performed twice.

【図9】ストローク切れの例を示した図である。FIG. 9 is a diagram showing an example of stroke shortage.

【図10】ストロークが逆方向から筆記された例を示し
た図である。
FIG. 10 is a diagram showing an example in which strokes are written from the opposite direction.

【符号の説明】[Explanation of symbols]

1…入力パターン 10…入力一体化表示部 11…入力部 12…表示部 20…スタイラスペン 30…前処理 30a…前処理部 40…特徴抽出 40a…特徴抽出部 50…辞書 60…識別処理 60a…識別部 70…識別結果 31…雑音除去処理 32…平滑化処理 33…位置の正規化処理 34…大きさの正規化処理 35…筆点間補間処理 36…太め処理 DESCRIPTION OF SYMBOLS 1 ... Input pattern 10 ... Input integrated display part 11 ... Input part 12 ... Display part 20 ... Stylus pen 30 ... Preprocessing 30a ... Preprocessing part 40 ... Feature extraction 40a ... Feature extraction part 50 ... Dictionary 60 ... Identification process 60a ... Identification unit 70 ... Identification result 31 ... Noise removal processing 32 ... Smoothing processing 33 ... Position normalization processing 34 ... Size normalization processing 35 ... Inter-brush point interpolation processing 36 ... Thickening processing

フロントページの続き (72)発明者 小高 和己 東京都千代田区内幸町1丁目1番6号 日 本電信電話株式会社内Front Page Continuation (72) Inventor Kazumi Otaka 1-1-6 Uchisaiwaicho, Chiyoda-ku, Tokyo Nihon Telegraph and Telephone Corporation

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 手書き入力文字の筆跡を筆記の際のペン
ダウン点からペンアップ点までの一連の筆点座標時系列
からなるストロークで表現する段階と、 前記表現されたストロークから白黒2値の画素からなる
2値パターンを生成する段階と、 前記生成された2値パターンから特徴を抽出して当該文
字の認識を行う段階と、 を有することを特徴とするオンライン手書き文字認識方
法。
1. A step of expressing a handwriting of a handwritten input character by a stroke consisting of a series of writing point coordinate time series from a pen down point to a pen up point at the time of writing, and a black and white binary pixel from the expressed stroke. An online handwritten character recognition method comprising: a binary pattern consisting of: and a step of extracting a feature from the generated binary pattern to recognize the character.
【請求項2】 2値パターンを生成する段階において、 文字を構成するストロークの各筆点間の補間処理によっ
て連続した線からなる2値パターンを生成することを特
徴とする請求項1記載のオンライン手書き文字認識方
法。
2. The online pattern according to claim 1, wherein, in the step of generating a binary pattern, a binary pattern composed of continuous lines is generated by an interpolation process between each writing point of strokes forming a character. Handwriting recognition method.
【請求項3】 2値パターンを生成する段階において、 ストロークの太め処理によって太められた線からなる2
値パターンを生成することを特徴とする請求項1または
請求項2記載のオンライン手書き文字認識方法。
3. The step of generating a binary pattern, wherein the strokes are thickened by thickening 2
3. The online handwritten character recognition method according to claim 1, wherein a value pattern is generated.
【請求項4】 表示手段の画面上に重ねられ、手書き入
力される文字のストロークの座標の検出を行う入力手段
と、 前記座標の検出された文字のストロークの筆点から2値
パターンを生成する前処理部と、 前記生成された2値パターンから特徴を抽出する特徴抽
出部と、 前記抽出された特徴を用いて前記入力された文字のカテ
ゴリの識別を行う識別部と、 を具備することを特徴とするオンライン手書き文字認識
装置。
4. Input means for detecting the coordinates of strokes of characters to be handwritten and input, which is superimposed on the screen of the display means, and a binary pattern is generated from the writing points of the strokes of the characters for which the coordinates have been detected. A preprocessing unit; a feature extraction unit that extracts features from the generated binary pattern; and an identification unit that identifies the category of the input character using the extracted features. A unique online handwriting recognition device.
【請求項5】 前処理部に、または前処理部とは独立
に、 文字のストロークの筆点間を補間し連続した線からなる
ストロークとする筆点間補間手段を有することを特徴と
する請求項4記載のオンライン手書き文字認識装置。
5. The pre-processing unit or independently of the pre-processing unit has a writing point interpolating means for interpolating between the writing points of the strokes of a character to form a stroke composed of continuous lines. Item 5. The online handwritten character recognition device according to Item 4.
【請求項6】 前処理部に、または前処理部とは独立
に、 前記前処理部が生成する2値パターンの文字線分を太め
る手段を有することを特徴とする請求項4または請求項
5記載のオンライン手書き文字認識装置。
6. The pre-processing unit or independent of the pre-processing unit has means for thickening the character line segment of the binary pattern generated by the pre-processing unit. 5. The online handwritten character recognition device described in 5.
JP7179729A 1995-07-17 1995-07-17 On-line handwritten character recognizing method and device for the same Pending JPH0934998A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7179729A JPH0934998A (en) 1995-07-17 1995-07-17 On-line handwritten character recognizing method and device for the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7179729A JPH0934998A (en) 1995-07-17 1995-07-17 On-line handwritten character recognizing method and device for the same

Publications (1)

Publication Number Publication Date
JPH0934998A true JPH0934998A (en) 1997-02-07

Family

ID=16070855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7179729A Pending JPH0934998A (en) 1995-07-17 1995-07-17 On-line handwritten character recognizing method and device for the same

Country Status (1)

Country Link
JP (1) JPH0934998A (en)

Similar Documents

Publication Publication Date Title
US8306327B2 (en) Adaptive partial character recognition
US5737443A (en) Method of joining handwritten input
JPH0772861B2 (en) Program creation device
WO1990001198A1 (en) Character recognition apparatus
CN108615058A (en) A kind of method, apparatus of character recognition, equipment and readable storage medium storing program for executing
JPH1196301A (en) Character recognizing device
CN104751153A (en) Scene text recognizing method and device
JP4565396B2 (en) Image processing apparatus and image processing program
Li An effective approach to offline arabic handwriting recognition
CN113610809A (en) Fracture detection method, fracture detection device, electronic device, and storage medium
JP4543675B2 (en) How to recognize characters and figures
JPH0934998A (en) On-line handwritten character recognizing method and device for the same
JP3172498B2 (en) Image recognition feature value extraction method and apparatus, storage medium for storing image analysis program
US6208756B1 (en) Hand-written character recognition device with noise removal
KR20000025647A (en) Method for processing image using shading algorithm
JP2871590B2 (en) Image extraction method
JPH11232382A (en) Ruled line extraction method and ruled line elimination method
JPH09134404A (en) Bar graph recognizing device
Ramalingam et al. Identification of Broken Characters in Degraded Documents
JP2674475B2 (en) Character reader
JP4142911B2 (en) Character recognition device and character recognition method
Jain et al. A novel approach for word segmentation in correlation based OCR system
JP3446794B2 (en) Polygon approximation method and character recognition device for character recognition
JP3365941B2 (en) Character pattern recognition method and apparatus
JPH096909A (en) Character reader