[go: up one dir, main page]

JPH0776980B2 - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH0776980B2
JPH0776980B2 JP62040014A JP4001487A JPH0776980B2 JP H0776980 B2 JPH0776980 B2 JP H0776980B2 JP 62040014 A JP62040014 A JP 62040014A JP 4001487 A JP4001487 A JP 4001487A JP H0776980 B2 JPH0776980 B2 JP H0776980B2
Authority
JP
Japan
Prior art keywords
partial pattern
normalization
character
value
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62040014A
Other languages
English (en)
Other versions
JPS63208183A (ja
Inventor
英雄 谷本
義美 山田
直人 信太
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP62040014A priority Critical patent/JPH0776980B2/ja
Publication of JPS63208183A publication Critical patent/JPS63208183A/ja
Publication of JPH0776980B2 publication Critical patent/JPH0776980B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は文字認識方法に関し、特に部分パターンQ値な
る特徴パラメータを用いて、筆記文字を認識する文字認
識方法に関するものである。
(従来の技術) 従来、この種の文字認識装置は、タブレット上に筆記入
力して得られた座標データ列の不要データを除去し、直
線化処理を施す前処理部と、前処理部により直線化され
た座標データ列から筆記文字を構成するストロークの特
徴を表す特徴点を抽出する特徴点抽出部とを具備し、特
徴点抽出部で抽出した特徴点から部分パターン毎に各セ
グメントの長さ、方向、位置等の特徴を表す部分パター
ンQ値なるパラメータを用いて文字を認識している。
上記のストローク、セグメント、部分パターンの関係
は、 セグメント<ストロヘーク<部分パターン である。ここで、セグメントとは、特徴点抽出部によっ
て算出された特徴点と次の特徴点を結ぶ線分を言い、ス
トロークとは、幾つかのセグメントの集まりで、ペンオ
ンからペンオフまでを言う。また、部分パターンとは、
いくつかのストロークの集まりで一般的には辺やつくり
を構成するものであり、複数の部分パターンで文字を構
成するものを言う。
上記部分パターンQ値は、部分パターンの座標値が文字
幅正規化法により正規化された後、次のように算出され
る。なお下式においてはΣは、全ストローク、全セグメ
ントに関する加算を示す。またHX,HYはそれぞれX方
向、Y方向の文字幅を示す。
+x方向成分のx方向位置 −x方向成分のx方向位置 +y方向成分のy方向位置 −y方向成分のy方向位置 +x方向成分のy方向位置 −x方向成分のy方向位置 +y方向成分のx方向位置 −y方向成分のx方向位置 〜の場合は原点を左下に設定したときの各方向位置
の値であるが、このとき原点近くにあるものは乗算する
に供すると0となってしまうため、0となるのを防ぐた
め原点を入れかえ原点を右上に設定しようとしたときの
各方向位置の値Q9〜Q16についても同様に記述し、Q1〜Q
16の合計16個の値により対象文字の各ストロークのセグ
メントの長さ、方向及び位置を表わすものとする。
従来の算出方法では、例えば式(1)について と表現できる。つまり、本算出方法は文字幅(式(1)
の場合HX)で正規化しているので、個人差による各部分
パターンの形状の違いをうまく吸収できるわけである。
(発明が解決しようとする問題点) しかしながら、従来の文字幅正規化による部分パターン
Q値を用いた文字認識方法では次のような問題点があ
る。
ほぼ垂直又はほぼ水平な直線の部分パターン、例えば
“|"や“−”に関しては、その微妙な傾斜により、部分
パターンQ値が大きく変化してしまう(部分パターンQ
値はX,Y成分の他に+,−成分を区別しているため)。
ほぼ垂直な直線の部分パターン“|"の場合の文字幅正規
化の問題点の説明図を第6図(a)乃至(e)に示す。
微妙に左に傾斜した入力部分パターン(同図(a))を
文字幅により正規化すると、同図(b)と同等の部分パ
ターンQ値となる。ここで、予め格納された登録パター
ンが同図(c)の様に微妙に右に傾斜していたとする。
このパターンは文字幅により正規化することにより同図
(d)と同等のQ値となる。つまり、この2つのパター
ン(同図(b)と同図(d))のマッチング結果はかな
り異なるものとなる。また、予め格納された登録パター
ンがいくつものパターンを平均したものであるとすれ
ば、左及び右に傾斜したそれぞれ異なったパターンを平
均するため、これもまた入力部分パターンとは一致しな
いものとなるであろう。このどちらの例においても入力
パターン同図(a)は、同図(e)に示す登録パターン
に近いものと判断されてしまうため所望のマッチング結
果が得られない。このように従来の算出方法では、文字
幅によって正規化することによって、個人差による形状
の違いを吸収できるわけではあるが、前記述べた様な部
分パターンの場合は良い結果とはならないという問題点
がある。
本発明は以上述べた問題点を解決し、ほぼ垂直又はほぼ
水平な直線の部分パターンに対して適切な正規化によっ
て得られる部分パターンQ値を用いてマッチングを行う
文字認識方法を提供することを目的とする。
(問題点を解決するための手段) 本発明は前記問題点を解決するために、タブレットに筆
記入力して得られた座標データ列の不要データを除去
し、直線化処理を施す前処理部と、前処理部で直線化さ
れた座標データ列から筆記文字を構成するストロークの
特徴を表わす特徴点を抽出する抽出部とを設け、抽出部
で得られた特徴点から部分パターン毎に各ストローク各
セグメントの特徴を表わす部分パターンQ値を求め、該
部分パターンQ値と予め登録された部分パターンQ値と
のマッチングを行って入力文字の認識を行う文字認識方
法において、ほぼ垂直又はほぼ水平な直線の部分パター
ンに対しては部分パターンのX方向幅及びY方向幅のう
ち大きな方を一辺とする正方形の枠を作り該枠の中央に
部分パターンを配置する正方正規化を行うか又は通常の
文字幅正規化を行うかの正規化法の指定を文字辞書に各
部分パターン毎に予め格納しておき、マッチングを行う
場合に、入力部分パターンに対して文字辞書に格納され
ている正規化法の指定に従った正規化を行うことにより
得られた部分パターン座標値に基づいて上述の部分パタ
ーンQ値を求めるものである。
(作用) 本発明の文字認識方法では、ほぼ垂直又はほぼ水平な直
線の部分パターン、例えば“引”の“|"に対して、x方
向幅及びy方向幅のうち大きな方を一辺とする正方形の
枠の中央に部分パターンを配置する正方正規化を施して
いる。即ち、この正方正規化は、部分パターンの傾斜を
変化させないで正規化するように作用する。従って、部
分パターンの座標値を文字幅で除算して正規化する文字
幅正規化における傾斜の特徴が反映されないという問題
を取り除くことができる。従って、上記のような部分パ
ターンに対し、正方正規化を行って得られた部分パター
ンQ値により、適切なマッチングを行うことができる。
(実施例) まず、本発明の文字認識方法に用いる正方正規化の概念
について説明する。第4図(a)乃至(d)は正方正規
化の説明図である。同図(a)はほぼ垂直な直線の部分
パターン例であって、微妙に右に傾斜したものである。
この部分パターンを従来の文字幅正規化によるものを同
図(b)に示し、本発明の方式の正方正規化によるもの
を同図(c)に示す。従来の文字幅正規化では、入力部
分パターンのX,Y方向の文字幅、即ちHX,HYで入力部分パ
ターンの座標値を除算することにより正規化しているた
め、同図(d)に示すような極端に傾斜した部分パター
ンの場合と同一の結果となる。即ち、文字幅正規化は個
人差による形状の違いを吸収する特徴を有するが、傾斜
そのものに特徴のあるパターンに対しては対処はできな
い。一方、正方正規化では、入力部分パターンのX,Y方
向文字幅のうち大きい方で正方形の枠を作り、その中央
に部分パターンを配置する正規化を行っている(同図
(c))。即ち、正方正規化は、傾斜そのものに特徴の
あるパターンに対してその特徴を反映させる特徴を有す
る。よって、正方正規化は文字幅正規化の弱点を補うも
のであるといえる。
次に具体的な正方正規化による算出方法について、文字
幅正規化と比較して説明する。第5図にその説明図を示
す。同図において、51は正方正規化枠、52は文字幅正規
化枠である。また点Aは文字幅正規化法の原点、点Bは
正方正規化法の原点、XMIN,xはそれぞれ絶対座標系にお
ける点A、点BのX方向座標値、HX,HYはそれぞれX方
向幅,Y方向幅である(HY>HXとする)。
同図では、HY>HXであるので正方正規化はX方向のみに
関して適用される。点Pの文字幅正規化法における変換
は Xm=x−XMIN となる。また、正方正規化法における変換は、 XS=Xm+Δx=x−XMIN+Δx となる。ここでΔxは次式で求められる。
Δx=(HY−HX)/2 つまり、点Pの文字幅正規化法における座標値X′は X′=Xm/HX と求められる。
また、点Pの正方正規化法における座標値XS′は XS′=XS/HY(X方向文字幅はHYとなる。)となる。Y
方向座標値に関しては両方とも同じ結果が得られる。
YS′=Y′=(y−YMIN)/HY 以上まとめると正方正規化法による座標値は以下の通り
となる。
但し、HY>HXの場合には、Δx,Δy,SHABAは、 Δx=(HY−HX)/2 Δy=0 SHABA=HY となる。一方、HX>HYの場合には、Δx,Δy,SHABAは、 Δx=0 Δy=(HX−HY)/2 SHABA=HX となる。
次に以上述べてきた正方正規化による部分パターンQ値
を用いた本発明の文字認識方法の一実施例について説明
する。
第1図は本発明の方法が適用される文字認識装置の構成
例を示すブロック図である。同図において、1はタブレ
ット、2はタブレット上に筆記入力して得られた座標デ
ータ列の不要データを除去し、直線化処理を施す前処理
部、3は前処理部により直線化された座標データ列から
筆記文字を構成するストロークの特徴を表わす特徴点を
抽出する特徴点抽出部である。4は特徴点抽出部3の出
力データより得られる部分パターンの正規化を行う正規
化部で、文字幅正規化部4a及び正方正規化部4bから成
る。5は認識部で正規化部4の出力データに基づいて部
分パターンQ値を算出する部分パターンQ値算出部5a
と、算出された部分パターンQ値と、予め算出されて登
録された部分パターンQ値とのマッチングするマッチン
グ部5bとから構成される。
マッチングに使用する文字辞書の構成例を第2図に示
す。ここで文字辞書とは文字とその文字を分割する情報
(カット位置と呼ぶ)とそれぞれの部分パターン(部分
パターンコード)で構成された辞書である。マッチング
方法は、入力文字が文字辞書に定義されているカット位
置で分割したときどの程度似通っているか算出するわけ
である。ここで部分パターンの右上に付けられた“*”
は正方正規化によって部分パターンQ値の算出を行う指
定であるとする。
次に第3図のフローチャートを用いて本実施例の特徴部
分の動作を説明する。
まず、入力文字として“引”がタブレット1に筆記され
たとする。1番目の定義“幻”について考えてみる(第
2図)。ここで“幻”のカット位置は(3,1)であるの
で入力文字をその位置で分割すると“弓",“|"になる。
次に“幻”の部分パターン は両方とも正方正規化指定ではないので文字幅正規化に
よる部分パターンQ値算出を文字幅正規化部4a及び部分
パターンQ値算出部5aで行う(S1,S2b,S3)。次に算出
された部分パターンQ値と、登録パターンの部分パター
ンQ値とのマッチングをマッチング部5bで行って、部分
パターンQ値の距離を算出しそれを“幻”の距離とする
(S4)。次の定義“引”のカット位置も“幻”と同様に
(3,1)であるので分割すると同様になる(第2図)。
ここで は上記と同様にして文字幅正規化によって部分パターン
Q値を算出する(S1,S2b,S3)。一方、“|"は正方正規
化指定であるので、正方正規化による部分パターンQ値
の算出を正方正規化部4b及び部分パターンQ値算出部5a
で行う(S1,S2a,S3)。これらの結果の部分パターンQ
値と登録パターンの部分パターンQ値とのマッチングを
マッチング部5bで行って部分パターンQ値の距離を算出
し、それを“引”の距離とする(S4)。ここで、入力文
字“引”の“|"がどちらかに微妙に傾斜していたとして
も登録パターンと近い値になる。
このように文字辞書上に文字幅正規化で処理するのか正
方正規化で処理するのか決めておけば、直線でしかも垂
直及び水平な部分パターンにおいても部分パターンQ値
の算出が有効に行え、結果として部分パターンQ値の距
離は小さくなるわけである。
なお、上記実施例では、正方正規化の指定方法を部分パ
ターンにマークを付けることにより行ったが、他にも様
々な方法が考えられる。例えば部分パターンコードによ
って処理するか否かを決定する方法、入力パターンの形
状によって決定する方法等が考えられる。つまり本発明
は正方正規化の指定方法において上記実施例に限定され
ないことは言うまでもない。
このように、本実施例によれば、直線でしかも垂直及び
水平なパターンにおいて、文字幅正規化による部分パタ
ーンQ値算出では良い結果が得られなかったが、パター
ン幅の大なる一辺で正方形の枠を作りその中央にパター
ンを配置する正方正規化を行うことによりその特徴を反
映させることができ、結果として部分パターンQ値のマ
ッチングによる距離を小さくすることが可能である。
(発明の効果) 以上詳細に説明したように本発明によれば、ほぼ垂直又
はほぼ水平な直線の部分パターンに対して正方正規化を
行うことにより、部分パターンの傾斜の特徴を反映させ
ることができるので、この正方正規化による部分パター
ンQ値により適切なマッチングを行うことができる。し
かも、文字幅正規化を行うか正方正規化を行うかの正規
化法の指定を文字辞書に各部分パターン毎に予め格納し
ておき、この指定に応じて正方正規化又は文字幅正規化
を行っているため、入力された文字に正規化の方法が依
存されず従って文字入力する人の字体の癖等によって正
規化の方法を誤ることがない。さらに、正規化法の指定
が文字辞書に予め格納されているため、正規化法を決定
すべくその都度パターン分析する必要がないので、処理
速度を落とすことなく優れた認識率を得ることができ
る。
【図面の簡単な説明】
第1図は本発明の方法が適用される一実施例の文字認識
装置の構成図、第2図は本実施例のマッチングに使用す
る文字辞書の構成図、第3図は本実施例の要部の動作を
示すフローチャート、第4図は正方正規化の概念を説明
する図、第5図は正方正規化による座標値算出の説明
図、第6図は従来の文字幅正規化の問題点の説明図であ
る。 1……タブレット、2……前処理部、3……特徴点抽出
部、4……正規化部、4a……文字幅正規化処理部、4b…
…正方正規化処理部、5……認識部、5a……部分パター
ンQ値算出部、5b……マッチング部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 信太 直人 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内 (56)参考文献 特開 昭61−32187(JP,A)

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】タブレットに筆記入力して得られた座標デ
    ータ列の不要データを除去し、直線化処理を施す前処理
    部と、該前処理部で直線化された座標データ列から筆記
    文字を構成するストロークの特徴を表わす特徴点を抽出
    する抽出部とを設け、該抽出部で得られた特徴点から部
    分パターン毎に各ストローク各セグメントの特徴を表わ
    す部分パターンQ値を求め、該求めた部分パターンQ値
    と予め登録された部分パターンQ値とのマッチングを行
    って入力文字の認識を行う文字認識方法において、ほぼ
    垂直又はほぼ水平な直線の部分パターンに対しては部分
    パターンのX方向幅及びY方向幅のうち大きな方を一辺
    とする正方形の枠を作り該枠の中央に部分パターンを配
    置する正方正規化を行うか又は通常の文字幅正規化を行
    うかの正規化法の指定を文字辞書に各部分パターン毎に
    予め格納しておき、マッチングを行う場合に、入力部分
    パターンに対して前記文字辞書に格納されている正規化
    法の指定に従った正規化を行うことにより得られた部分
    パターン座標値に基づいて前記部分パターンQ値を求め
    ることを特徴とする文字認識方法。
JP62040014A 1987-02-25 1987-02-25 文字認識方法 Expired - Lifetime JPH0776980B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62040014A JPH0776980B2 (ja) 1987-02-25 1987-02-25 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62040014A JPH0776980B2 (ja) 1987-02-25 1987-02-25 文字認識方法

Publications (2)

Publication Number Publication Date
JPS63208183A JPS63208183A (ja) 1988-08-29
JPH0776980B2 true JPH0776980B2 (ja) 1995-08-16

Family

ID=12569052

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62040014A Expired - Lifetime JPH0776980B2 (ja) 1987-02-25 1987-02-25 文字認識方法

Country Status (1)

Country Link
JP (1) JPH0776980B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7298904B2 (en) 2004-01-14 2007-11-20 International Business Machines Corporation Method and apparatus for scaling handwritten character input for handwriting recognition
US7756337B2 (en) 2004-01-14 2010-07-13 International Business Machines Corporation Method and apparatus for reducing reference character dictionary comparisons during handwriting recognition
US7490033B2 (en) 2005-01-13 2009-02-10 International Business Machines Corporation System for compiling word usage frequencies

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6132187A (ja) * 1984-07-19 1986-02-14 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 文字認識方式

Also Published As

Publication number Publication date
JPS63208183A (ja) 1988-08-29

Similar Documents

Publication Publication Date Title
KR100658119B1 (ko) 문자 인식 장치 및 방법
JP3453134B2 (ja) 複数の記号ストリングの等価性を判定する方法
Shi et al. Segmentation and recognition of connected handwritten numeral strings
JPH10143668A (ja) 手書き文字列の照合方法および装置
Manke et al. Combining bitmaps with dynamic writing information for on-line handwriting recognition
JPH0776980B2 (ja) 文字認識方法
JP2003157070A (ja) 文字パターン生成方法、文字パターン生成装置、コンピュータ読み取り可能な記録媒体、プログラム
JP2658136B2 (ja) 文字認識方式
JP3657077B2 (ja) オンライン文字認識装置
JPH069064B2 (ja) 手書き文字認識装置
JP3198218B2 (ja) オンライン手書き文字認識方法
JPH0962788A (ja) オンライン手書き文字認識方法
JP2803892B2 (ja) 文字認識装置
JPH0664629B2 (ja) 文字認識方式
JP3015137B2 (ja) 手書文字認識装置
JP2976426B2 (ja) 文字認識装置
JP3139701B2 (ja) ファジィベクトルによるオンライン手書き入力文字認識方法及び装置並びにその方法を実行するための記録媒体
JP2785438B2 (ja) 文字認識方式
JP3146046B2 (ja) オンライン文字認識装置
JP2974396B2 (ja) 画像処理方法及び装置
JPH0241589A (ja) オンライン文字認識装置
JPH0632080B2 (ja) 文字認識方式
JPH0531796B2 (ja)
JPH0668302A (ja) 傾き正規化装置
JPH08137994A (ja) 文字認識装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term