[go: up one dir, main page]

JPH09223195A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH09223195A
JPH09223195A JP8020133A JP2013396A JPH09223195A JP H09223195 A JPH09223195 A JP H09223195A JP 8020133 A JP8020133 A JP 8020133A JP 2013396 A JP2013396 A JP 2013396A JP H09223195 A JPH09223195 A JP H09223195A
Authority
JP
Japan
Prior art keywords
character
vector
category
feature vector
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8020133A
Other languages
English (en)
Inventor
Hiroyuki Shimizu
裕之 清水
Takahiko Kawatani
隆彦 川谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HP Inc
Original Assignee
Hewlett Packard Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Co filed Critical Hewlett Packard Co
Priority to JP8020133A priority Critical patent/JPH09223195A/ja
Priority to US08/795,221 priority patent/US6038343A/en
Priority to KR1019970003747A priority patent/KR100480316B1/ko
Publication of JPH09223195A publication Critical patent/JPH09223195A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】入力前の特別な作業を必要としないで、入力さ
れた文字の認識率を向上する。 【解決手段】入力された文字の特徴ベクトルと、各カテ
ゴリー毎の参照ベクトルに関する情報を持った辞書とを
照合し、前記文字が属する前記カテゴリーを決定する文
字認識方法において、前記文字毎の特徴ベクトルとその
認識結果とを保持し、前記認識結果に基づき前記文字の
属する該当カテゴリとは別のカテゴリ−の特徴ベクトル
を予測し、前記予測された特徴ベクトルと、対応する前
記参照ベクトルとに応じて前記情報を修正し、前記修正
された前記情報を用いて所望の文字の属する前記カテゴ
リを決定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識方法に関し、
詳細には、筆記個人性又はフォントの違いを利用して認
識率を向上する方法に関する。
【0002】
【従来の技術】文字認識は、前処理、特徴抽出、識別の
3つの処理を行ない、実現される。通常、前処理では入
力された文字パターンの大きさの正規化、雑音除去など
を行なう。また、特徴抽出では入力された文字パターン
から文字の形状を表す特徴量を特徴ベクトルとして抽出
する。また抽出された特徴ベクトルを線形変換などを用
いて変換し新しい特徴ベクトルとすることもある。識別
では入力された文字パターンから抽出された特徴ベクト
ルと識別辞書に格納されている各カテゴリーの参照ベク
トルとを照合し、入力された文字パターンのカテゴリー
を決定する。この際使用する識別辞書は、通常予め多数
の筆記者によって書かれた文字パターンから統計的に作
成される。
【0003】手書き文字認識の場合、筆記者が異なるこ
となどによる文字の変形を吸収する必要があるが、この
変形の存在が正読率の高精度化を妨げる要因でもある。
ある筆記者が書いたあるカテゴリーの文字が、別の筆記
者の別のカテゴリーの文字に酷似しているような場合、
それぞれの文字を正確に認識するのは非常に困難であ
る。上記問題を解決するためには、従来は入力者に入力
前に特定の文字を入力させる事等により入力者の文字パ
ターンを文字認識装置に記憶させていた。この方法で
は、不特定多数の入力者には対応出来ず、特定の限られ
た範囲でしか有効でなかった。これらの問題を解決する
ために、電子情報通信学会論文誌 Vol.J78-D-II NO.7 J
uly 1995 に記載されている「筆記個人性を用いた手書
き数字認識の改善」等があるが、更に応用分野を広ろ
げ、更に認識率を改善するための別の認識方法が望まれ
る。
【0004】
【発明が解決しようとする課題】本発明は、このような
問題を解決し、未知の入力文字に対して入力前の特別な
作業をすることなく、入力文字認識率の向上に有効な方
法を提供する。
【0005】
【課題を解決するための手段】本発明は、筆記個人性又
はフォントの違いを利用して認識率を向上する方法に関
するものであるが、以下、便宜的に筆記個人性に着目し
て説明を行う。本発明では、 ・同一筆記者の筆記した同一カテゴリーに属する文字の
字形は近いこと、 ・同一筆記者により筆記された文字であるならば、カテ
ゴリーは異なっても字形の間には調和、すなわち有効な
又は高い相関が存在すること、いう2つの筆記個人性に
関する知見を利用して、あるカテゴリーに確実に認識で
きた文字の特徴ベクトルから、その筆記者が書くであろ
う他の個々のカテゴリーの文字の特徴ベクトルを予測
し、その予測した特徴ベクトルを用いて参照ベクトルを
修正して再度識別を行なう事により手書き文字認識率の
向上を実現する。
【0006】
【実施例】図1は適宜のコンピュータシステムなどを用
いて実施される本発明の一実施例を表す機能ブロック図
である。図中、10は文字入力ブロック、11は文字認
識ブロック、12は不特定筆記者用文字識別辞書(参照
ベクトル)、13は文字情報蓄積ブロック、14は認識
文字選択ブロック、15は筆記者別特徴ベクトル予測ブ
ロック、16は筆記者別参照ベクトル修正ブロック、1
7は文字再認識ブロックを表す。以下にそれぞれの処理
について手順に従い説明する。
【0007】文字入力ブロック10を経由して入力され
た文字は、文字認識ブロック11により、不特定筆記者
用文字識別辞書(参照ベクトル)12を用いて認識す
る。文字認識処理の結果として同一筆記者の入力文字毎
に特徴ベクトル、認識結果が文字情報蓄積ブロック13
により保存される。認識結果としては認識処理によって
得られる候補カテゴリーとそれに対応する距離値もしく
は類似度を保存する。所定個数の認識処理が終了した
後、あるいは、確実性の高い文字を認識した時等、所定
の条件が揃った後、認識文字選択ブロック14は、文字
情報蓄積ブロック13によって保存されている各文字毎
の認識結果から確実に認識されている入力文字の特徴ベ
クトルを選択する。選択は第1位候補と第2位候補の距
離、もしくは類似度の差を用いれば容易に行なうことが
できる。筆記者別特徴ベクトル予測ブロック15は、認
識文字選択ブロック14によって選択された入力文字の
特徴ベクトルを用いて予め統計的に求められた回帰式を
用いて、文字認識ブロック11によって選択された入力
文字が帰属すると判定された認識されたカテゴリー以外
のカテゴリーの特徴ベクトルを予測する。予測する際に
用いる該回帰式の一例は Yb = Bab・Xa + ε である。
【0008】ここで、Xaはカテゴリーaに認識された特
徴ベクトル、Babはカテゴリーaの入力文字の特徴ベク
トルからカテゴリーbの特徴ベクトルを予測する回帰式
の回帰係数行列、εは定数ベクトル、Ybはカテゴリー
bの予測特徴ベクトルである。そして、筆記者別参照ベ
クトル修正ブロック16は、認識文字選択ブロック14
によって選択された入力文字の特徴ベクトルから予測さ
れた同一筆記者に対する個々のカテゴリーの特徴ベクト
ルを用いて、不特定筆記者用の参照ベクトルからその筆
記者専用の参照ベクトルを求める。その際に用いる修正
式は、 Z'a = α・Ya + β・Za である。
【0009】ここで、Yaはカテゴリーaの予測特徴ベク
トル、Zaはカテゴリーaの不特定筆記者用参照ベクト
ル、α、βは定数行列(一般には、対角行列で、各々の
全要素が同一の場合も含む)Z'aはカテゴリーaの筆記
者専用に修正された参照ベクトルである。ただし、各カ
テゴリーに対して予測される特徴ベクトルが複数存在す
る場合、筆記者別参照ベクトル修正ブロック16に用い
る特徴ベクトルは予測された複数の特徴ベクトルの平均
ベクトルとする。この場合、加重平均等他の計算方法で
求められた特徴ベクトルでもよい。文字再認識ブロック
17は、まず筆記者別参照ベクトル修正ブロック16で
求まる新しい参照ベクトルを用いて各入力文字の特徴ベ
クトルとの間の距離値、もしくは類似度を求める。そし
て再識別を行なう。再識別を行なう方法として、新たに
求まる距離値、もしくは類似度を文字情報蓄積ブロック
13で保存されている距離値、もしくは類似度に加算し
て修正を行い、候補カテゴリーを決定する方法と、新た
に求まった距離値、もしくは類似度から候補カテゴリー
を決定する方法がある。
【0010】図2は本発明の実施例の流れ図を示してい
る。以下各ステップで行う処理を説明する。 ステップ20:認識条件などの初期値設定 ステップ21:未知の筆記者の文字が入力される。 ステップ22:入力された文字は、不特定筆記者用の文
字識別辞書を用いて認識処理が行われる。 ステップ23:入力された文字の特徴ベクトル、該当す
るカテゴリー等の情報を蓄積する。 ステップ24:次のステップに進む為の条件として、所
定個数の認識処理が終了したことの確認、あるいは、確
実性の高い文字を認識した時等所定の条件が揃ったこと
の確認をする。 ステップ25:ステップ23の情報を基に高い確実性で
すなわち正しく認識された文字を選ぶ。正しく認識され
なかった文字は、参照ベクトルを修正した後、再認識を
行う。 ステップ26:正しく認識された文字を基に、入力者の
特徴ベクトルを予測する。 ステップ27:ステップ26の結果を基に、参照ベクト
ルを修正する。 ステップ28:修正された参照ベクトルを基に、認識確
実性の低い文字の再認識を行う。 ステップ29:最終的に認識された文字が得られる。
【0011】図3は、特徴ベクトルを予測する際に用い
る回帰式の回帰係数を求める手順を示す流れ図である。
以下各ステップで行う処理を説明する。 ステップ30:必要な初期値設定 ステップ31:多数の筆記者によって書かれた訓練文字
パターンを用意する。 ステップ32:各訓練文字パターンについて位置、傾
き、大きさの正規化などの前処理を行なう。 ステップ33:前処理の行なわれた各訓練文字パターン
から特徴抽出を行なう。 ステップ34:各カテゴリー対に対して回帰分析を行な
う。回帰分析の具体的な処理内容は、まず全訓練文字パ
ターンの特徴ベクトルから各カテゴリー毎に特徴ベクト
ルの平均ベクトルを求め、求まる平均ベクトルを用いて
各カタゴリー対の分散共分散行列を求める。そして分散
共分散行列から各カテゴリー対の回帰式の回帰係数を求
める。 ステップ35:全てのカテゴリー対の回帰係数が求めた
か否かをチェックする。終了していなければステップ3
4へ戻り回帰分析を繰り返す。 ステップ36:終了。
【0012】以上、本発明の実施例について詳述した
が、以下、本発明の各実施態様の例を示す。 (実施態様1)入力された文字の特徴ベクトルと、各カ
テゴリー毎の参照ベクトルに関する情報を持った辞書と
を照合し、前記文字が属する前記カテゴリーを決定する
文字認識方法において、前記文字毎の特徴ベクトルとそ
の認識結果とを保持する過程と、前記認識結果に基づき
前記文字の属する該当カテゴリとは別のカテゴリ−の特
徴ベクトルを予測する過程と、前記予測された特徴ベク
トルと、対応する前記参照ベクトルとに応じて前記情報
を修正する過程と、前記修正された前記情報を用いて所
望の文字の属する前記カテゴリを決定する過程とを有す
る文字認識方法。
【0013】(実施態様2)前記予測する過程で用いる
文字は認識確実性の高い文字である実施態様1に記載の
文字認識方法。
【0014】(実施態様3)前記情報を修正する過程に
おいて、前記文字毎の予測された特徴ベクトルを前記該
文字の属する参照ベクトルに置き換える事により前記情
報を修正することを特徴とする実施態様1及び2に記載
の文字認識方法。
【0015】(実施態様4)前記情報を修正する過程に
おいて、所定個数の入力された文字を基に、前記情報を
修正することを特徴とする実施態様1乃至3に記載の文
字認識方法。
【0016】(実施態様5)前記情報を修正する過程に
おいて、所定の条件が揃った後で、前記情報を修正する
ことを特徴とする実施態様1乃至4に記載の文字認識方
法。
【0017】
【発明の効果】本発明では、不特定多数の入力者を対象
に筆記個人性を用いて入力文字の特徴ベクトルからその
筆記者が書くであろう個々のカテゴリーの特徴ベクトル
を予測し、その予測された特徴ベクトルから各カテゴリ
の参照ベクトルを求め、その求められた参照ベクトルを
用いて認識を行なうため、入力前の特別な作業をするこ
となく、従来の不特定筆記者用に設計された辞書では認
識が不可能な文字に対しても認識が可能になり、正読率
の向上が可能である。また、本発明は、同一筆記者でな
くとも、同一パターンを持った筆記者に対しても有効で
ある。以上、手書き文字について説明してきたが、本発
明は印刷された入力文字のフォントの違いに対しても有
効である。
【0018】
【図面の簡単な説明】
【図1】: 文字認識処理ブロック図
【図2】: 文字認識処理流れ図
【図3】: 回帰係数決定処理流れ図
【符号の説明】
10:文字入力ブロック 11:文字認識ブロック 12:不特定筆記者用識別辞書(参照ベクトル) 13:認識文字情報蓄積ブロック 14:文字選択ブロック 15:筆記者用特徴ベクトル予測ブロック 16:筆記者別参照ベクトル修正ブロック 17:文字再認識ブロック 21:文字入力 22:文字認識処理 23:文字情報蓄積 24:文字認識条件 25:認識文字選択 26:特徴ベクトル予測 27:参照ベクトル修正 28:入力文字再認識処理 29:最終文字認識 31:訓練文字パターン入力 32:前処理 33:特徴抽出 34:回帰分析 35:全カテゴリー対終了

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】入力された文字の特徴ベクトルと、各カテ
    ゴリー毎の参照ベクトルに関する情報を持った辞書とを
    照合し、前記文字が属する前記カテゴリーを決定する文
    字認識方法において、前記文字毎の特徴ベクトルとその
    認識結果とを保持する過程と、前記認識結果に基づき前
    記文字の属する該当カテゴリとは別のカテゴリ−の特徴
    ベクトルを予測する過程と、前記予測された特徴ベクト
    ルと、対応する前記参照ベクトルとに応じて前記情報を
    修正する過程と、前記修正された前記情報を用いて所望
    の文字の属する前記カテゴリを決定する過程とを有する
    文字認識方法。
  2. 【請求項2】前記予測する過程で用いる文字は認識確実
    性の高い文字である請求項1に記載の文字認識方法。
  3. 【請求項3】前記情報を修正する過程において、前記文
    字からカテゴリー毎に予測された特徴ベクトルを該カテ
    ゴリ−の参照ベクトルに置き換えることにより、前記情
    報を修正することを特徴とする請求項1及び2に記載の
    文字認識方法。
  4. 【請求項4】前記情報を修正する過程において、所定個
    数の入力された文字を基に、前記情報を修正することを
    特徴とする請求項1乃至3に記載の文字認識方法。
  5. 【請求項5】前記情報を修正する過程において、所定の
    条件が揃った後で、前記情報を修正することを特徴とす
    る請求項1乃至4に記載の文字認識方法。
JP8020133A 1996-02-06 1996-02-06 文字認識方法 Pending JPH09223195A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP8020133A JPH09223195A (ja) 1996-02-06 1996-02-06 文字認識方法
US08/795,221 US6038343A (en) 1996-02-06 1997-02-05 Character recognition method and apparatus using writer-specific reference vectors generated during character-recognition processing
KR1019970003747A KR100480316B1 (ko) 1996-02-06 1997-02-06 문자인식방법및장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8020133A JPH09223195A (ja) 1996-02-06 1996-02-06 文字認識方法

Publications (1)

Publication Number Publication Date
JPH09223195A true JPH09223195A (ja) 1997-08-26

Family

ID=12018646

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8020133A Pending JPH09223195A (ja) 1996-02-06 1996-02-06 文字認識方法

Country Status (3)

Country Link
US (1) US6038343A (ja)
JP (1) JPH09223195A (ja)
KR (1) KR100480316B1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6671404B1 (en) * 1997-02-14 2003-12-30 Hewlett-Packard Development Company, L.P. Method and apparatus for recognizing patterns
US6061472A (en) * 1997-06-06 2000-05-09 Microsoft Corporation Method and mechanism to reduce handwriting recognizer errors using multiple decision trees
JPH1196301A (ja) * 1997-09-22 1999-04-09 Hitachi Ltd 文字認識装置
AU2002333065B2 (en) * 2001-10-15 2006-11-02 Silverbrook Research Pty Ltd Character identification
AUPR824401A0 (en) * 2001-10-15 2001-11-08 Silverbrook Research Pty. Ltd. Methods and systems (npw002)
AU2002952106A0 (en) * 2002-10-15 2002-10-31 Silverbrook Research Pty Ltd Methods and systems (npw008)
US7284200B2 (en) * 2002-11-10 2007-10-16 Microsoft Corporation Organization of handwritten notes using handwritten titles
JP2004348706A (ja) * 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP2005339039A (ja) * 2004-05-25 2005-12-08 Fuji Xerox Co Ltd 文書処理装置および文書処理方法
US7362902B1 (en) * 2004-05-28 2008-04-22 Affiliated Computer Services, Inc. Resolving character data boundaries
CN100409251C (zh) * 2005-08-26 2008-08-06 富士通株式会社 用于退化文字行的字符识别装置和方法
CN100535931C (zh) * 2006-09-06 2009-09-02 中国科学院自动化研究所 一种多分辨率退化字符自适应识别系统及方法
CN107239786B (zh) 2016-03-29 2022-01-11 阿里巴巴集团控股有限公司 一种字符识别方法和装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58129684A (ja) * 1982-01-29 1983-08-02 Toshiba Corp パタ−ン認識装置
JPS62190581A (ja) * 1986-02-17 1987-08-20 Sharp Corp 辞書作成方式
JPS63177285A (ja) * 1987-01-17 1988-07-21 Nippon Telegr & Teleph Corp <Ntt> 文字認識処理装置
US5191622A (en) * 1987-07-17 1993-03-02 Hitachi, Ltd. Hand-written character recognition apparatus with a personal dictionary preparation function
JP2651009B2 (ja) * 1989-04-06 1997-09-10 キヤノン株式会社 情報認識装置
US5023918A (en) * 1989-10-03 1991-06-11 International Business Machines Corporation Cross-product filter
US5105468A (en) * 1991-04-03 1992-04-14 At&T Bell Laboratories Time delay neural network for printed and cursive handwritten character recognition
US5343537A (en) * 1991-10-31 1994-08-30 International Business Machines Corporation Statistical mixture approach to automatic handwriting recognition
JPH06162264A (ja) * 1992-04-23 1994-06-10 Nec Corp 文字認識方法および装置
JP3163185B2 (ja) * 1992-11-27 2001-05-08 株式会社東芝 パターン認識装置およびパターン認識方法
US5745599A (en) * 1994-01-19 1998-04-28 Nippon Telegraph And Telephone Corporation Character recognition method
JP3453422B2 (ja) * 1994-02-10 2003-10-06 キヤノン株式会社 文字パターンのユーザ辞書への登録方法及び該ユーザ辞書を有する文字認識装置
US5577135A (en) * 1994-03-01 1996-11-19 Apple Computer, Inc. Handwriting signal processing front-end for handwriting recognizers

Also Published As

Publication number Publication date
KR100480316B1 (ko) 2005-06-16
KR970062956A (ko) 1997-09-12
US6038343A (en) 2000-03-14

Similar Documents

Publication Publication Date Title
CN109919147A (zh) 服装吊牌图像中文本识别的方法
EP0539749A2 (en) A statistical mixture approach to automatic handwriting recognition
JPH09223195A (ja) 文字認識方法
CN113361666B (zh) 一种手写字符识别方法、系统及介质
JP2002216076A (ja) 文字列認識装置
Kırlı et al. Automatic writer identification from text line images
EP2138959B1 (en) Word recognizing method and word recognizing program
Ghiasi et al. An efficient method for offline text independent writer identification
Kaufmann et al. Recognition of cursively handwritten words using a combined normalization/perturbation approach
Hu et al. Combining high-level features with sequential local features for on-line handwriting recognition
CN100541522C (zh) 用于识别手写图形的方法和设备
Shin On-line cursive hangul recognition that uses DP matching to detect key segmentation points
JP3180792B2 (ja) 文字認識装置、文字学習装置およびコンピュータ可読記録媒体
Schlapbach et al. Off-line writer verification: A comparison of a hidden markov model (hmm) and a gaussian mixture model (gmm) based system
JP2906758B2 (ja) 文字読取装置
CN116597458B (zh) 一种手写字母识别方法、系统和应用
Premananada et al. Design and Implementation of Automated Image Handwriting Sentences Recognition using Hybrid Techniques on FPGA
KR100290606B1 (ko) 온라인 한글 필기체 문자 인식방법
JPH0950491A (ja) オンライン手書き文字認識方法および装置
Wimmer et al. Dictionary preselection in a neuro-Markovian word recognition system
Kawatani Character recognition performance improvement using personal handwriting characteristics
Zhou et al. Character recognition under severe perspective distortion
JP3151866B2 (ja) 英文字認識方法
JP3115369B2 (ja) 局所的字形変動を考慮したオンライン走り書き文字認識装置
JP3006823B2 (ja) 文字および単語の認識方式