[go: up one dir, main page]

JP2639314B2 - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JP2639314B2
JP2639314B2 JP5207123A JP20712393A JP2639314B2 JP 2639314 B2 JP2639314 B2 JP 2639314B2 JP 5207123 A JP5207123 A JP 5207123A JP 20712393 A JP20712393 A JP 20712393A JP 2639314 B2 JP2639314 B2 JP 2639314B2
Authority
JP
Japan
Prior art keywords
character
weighting
type
order
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5207123A
Other languages
English (en)
Other versions
JPH0744551A (ja
Inventor
泰彦 浅川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP5207123A priority Critical patent/JP2639314B2/ja
Publication of JPH0744551A publication Critical patent/JPH0744551A/ja
Application granted granted Critical
Publication of JP2639314B2 publication Critical patent/JP2639314B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識方式に関し、特
に文字種の重み付けを行う重み付け規則により異なる文
字種で同一または類似の形態を有する文字(以下、類似
文字という)を判別することを可能にする文字認識方式
に関する。
【0002】
【従来の技術】従来の文字認識方式では、類似文字、例
えば口(漢字)とロ(カタカナ)や、1(数字)とl
(英字)のような類似文字を判別するのは困難であり、
類似文字を判別するために様々な方法がとられている。
【0003】例えば、文字種判定テーブルを用意してお
き、入力された文字が類似文字として登録されているか
どうかをチェックし、類似文字として登録されている場
合には文字種判定テーブルを用いて文字を特定するもの
がある(特開昭61−39175号公報等参照)。
【0004】
【発明が解決しようとする課題】上述した従来の文字認
識方式では、類似文字を判別するために文字種判定テー
ブルを用意するようになっているので、類似文字データ
をあらかじめ登録しておかなかればならず、登録したデ
ータ以外の類似文字は判別できないという問題点があっ
た。
【0005】本発明の目的は、上述の点に鑑み、文字種
判定テーブルを用意して類似文字データを登録しておく
ことなしに、類似文字を判別できるようにした文字認識
方式を提供することにある。
【0006】
【課題を解決するための手段】本発明の文字認識方式
は、入力された文字を文字認識し漢字仮名混じり文に変
換する文字認識方式において、文字を入力する入力手段
と、この入力手段により入力された文字を文字認識辞書
を参照して変換文字候補コードに変換する文字認識部
と、この文字認識部により変換された変換文字候補コー
ドに重み付け規則に基づいてカタカナ種,ひらがな種,
漢字種,数字種および英字種の文字種重み付け属性を付
与し、三文字ごとの組合せ重み付け属性を付与し、文字
種重み付け属性と組合せ重み付け属性との和である重み
付け属性合計により類似文字を判別する類似文字判別部
とを有する。
【0007】
【実施例】次に、本発明について図面を参照して詳細に
説明する。
【0008】図1は、本発明の一実施例に係る文字認識
方式の構成を示すブロック図である。本実施例の文字認
識方式は、タブレット1と、文字認識辞書2と、文字認
識部3と、重み付け展開テーブル4と、重み付け規則フ
ァイル5と、類似文字判別部6とから構成されている。
【0009】タブレット1は、文字を手書き入力する入
力手段である。
【0010】文字認識辞書2は、個々の文字の特徴情報
が格納されている辞書である。
【0011】文字認識部3は、タブレット1からの文字
の形態情報と文字認識辞書2の文字の特徴情報とを比較
することにより、文字の認識を行い単数または複数の変
換文字候補コードに変換し重み付け展開テーブル4に格
納する手段である。
【0012】重み付け規則ファイル5は、図2に示すよ
うに、変換文字候補コードから文字種の重み付けを行う
重み付け規則を格納するファイルである。図2におい
て、領域aは規則番号を登録する領域、領域bは重み付
け規則の内容を記載する領域である。
【0013】重み付け展開テーブル4は、図3に示すよ
うに、重み付け属性を展開するメモリ上のテーブルであ
る。図3において、領域イはタブレット1で手書き入力
した文字の入力文字順番を登録する領域、領域ロは類似
文字判別部6で三文字ごとの組合せを処理する際に処理
文字順番を登録する領域、領域ハは文字認識部3で変換
された変換文字候補コードの変換候補順番を登録する領
域、領域ニは変換文字候補コードを登録する領域、領域
ヘは類似文字判別部5で処理文字順番の変換文字候補コ
ードの重み付け属性を三文字の組合せで処理した場合に
生じる組合せ重み付け属性を登録する領域、領域トは各
変換文字候補コードの文字種重み付け属性と組合せ重み
付け属性との合計である重み付け属性合計を登録する領
域、領域チは各変換文字候補コードの順番を重み付け属
性合計の値の大きい順番に1,2,3…と重み付け順番
として登録する領域である。
【0014】類似文字判別部6は、文字認識部3により
変換された変換文字候補コードに重み付け規則ファイル
5の重み付け規則に基づいてカタカナ種,ひらがな種,
漢字種,数字種および英字種の文字種重み付け属性を付
与し、三文字ごとの組合せ重み付け属性を付与し、文字
種重み付け属性と組合せ重み付け属性との和である重み
付け属性合計により類似文字を判別する手段である。
【0015】図6を参照すると、類似文字判別部6の処
理は、文字種重み付け属性付与ステップ61と、入力文
字順番nの3未満判定ステップ62と、処理文字順番付
与ステップ63と、文字種重み付け属性比較ステップS
64と、同一文字種重み付け属性判断ステップS65
と、組合せ重み付け属性付与ステップS66と、重み付
属性合計付与ステップ67と、重み付け順番付与ステッ
プS68と、処理文字順番消去ステップ69とからな
る。
【0016】次に、このように構成された本実施例の文
字認識方式の動作について説明する。
【0017】タブレット1から手書き文字が入力される
たびに、文字認識部3は、入力文字順番n(nは1以上
の整数)を1から昇順に付与し、入力された文字を文字
認識辞書2を参照し特徴マッチング法等の公知の文字認
識アルゴリズムを用いて単数または複数の変換文字候補
コードに変換し、各変換文字候補コードに変換候補順番
を付して重み付け展開テーブル4に格納する。
【0018】類似文字判別部6は、文字認識部3により
文字が変換文字候補コードに変換されて重み付け展開テ
ーブル4に格納されるたびに入力文字順番nを引数とし
て起動される。
【0019】まず、類似文字判別部6は、重み付け規則
ファイル5の重み付け規則に基づいて重み付け展開テー
ブル4の入力文字順番nの各変換文字候補コードに文字
種重み付け属性を付与する(ステップ61)。
【0020】次に、類似文字判別部6は、入力文字順番
nが3未満かどうかを判断し(ステップ62)、3未満
であればそのまま処理を終了する。
【0021】入力文字順番nが3以上であれば、類似文
字判別部6は、重み付け展開テーブル4の入力文字順番
(n−2),(n−1)およびnに対して処理文字順番
1,2および3を付与する(ステップ63)。
【0022】次に、類似文字判別部6は、処理文字順番
3の変換文字候補コードの文字種重み付け属性と、処理
文字順番1および2の変換文字候補コードの文字種重み
付け属性との比較を行い(ステップ64)、処理文字順
番1,2および3のそれぞれの変換文字候補コードの文
字種重み付け属性が同じ組合せがあるかどうかを判断す
る(ステップ65)。同じ文字種重み付け属性の組合せ
がなければ、類似文字判別部6は、ステップ67に制御
を移す。
【0023】処理文字順番1,2および3のそれぞれの
変換文字候補コードの文字種重み付け属性が同じ組合せ
があれば、類似文字判別部6は、同じ文字種重み付け属
性の組合せを持つ変換文字候補コードの組合せ重み付け
属性に各々1を付与する(ステップ66)。
【0024】次に、類似文字判別部6は、各々の変換文
字候補コードの文字種重み付け属性と組合せ重み付け属
性との和を重み付け属性合計に付与する(ステップ6
7)。
【0025】続いて、類似文字判別部6は、各々の変換
文字候補コードに対して重み付け属性合計の値の大きい
順に重み付け順番1,2,3,…を付与する(ステップ
68)。
【0026】最後に、類似文字判別部6は、処理文字順
番1,2,3を消去し(ステップ69)、処理を終了す
る。
【0027】次に、本実施例の文字認識方式の動作を、
図4および図5を参照しながら、「ア」,「メ」,
「リ」,「カ」および「で」と入力する例を用いて具体
的に説明する。
【0028】まず、文字「ア」が入力されると、文字認
識部3により、「ア」の変換文字候補コードが生成され
て重み付け展開テーブル4の入力文字順番に1、変換候
補順番に1、変換文字候補コードに「ア」のコードがそ
れぞれ登録され、類似文字識別部6により、重み付け展
開テーブル4の文字種重み付け属性のカタカナ種に3が
登録される(図4の入力文字順番1の列参照)。
【0029】次に、文字「メ」が入力されると、文字認
識部3により、「メ(カタカナ)」,「x(英字)」お
よび「×(記号)」の変換文字候補コードが生成されて
重み付け展開テーブル4の入力文字順番に2、変換候補
順番に1,2および3、変換文字候補コードに「メ(カ
タカナ)」,「x(英字)」および「×(記号)」のコ
ードがそれぞれ登録され、類似文字判別部6により、重
み付け展開テーブル4の文字種重み付け属性のカタカナ
種に3、英字種に3、その他すべてに0がそれぞれ登録
される(図4の入力文字順番2の列参照)。
【0030】続いて、文字「リ」が入力されると、文字
認識部3により、「り(ひらがな)」および「リ(カタ
カナ)」の変換文字候補コードが生成されて重み付け展
開テーブル4の入力文字順番に3、変換候補順番に1お
よび2、変換文字候補コードに「り(ひらがな)」およ
び「リ(カタカナ)」のコードがそれぞれ登録され、類
似文字判別部6により、重み付け展開テーブル4の文字
種重み付け属性のひらがな種に3、カタカナ種に3がそ
れぞれ登録される(図4の入力文字順番3の列参照)。
【0031】次に、類似文字判別部6により、処理文字
順番3の変換文字候補コード「リ(カタカナ)」および
「り(ひらがな)」の文字種重み付け属性と、処理文字
順番1の変換文字候補コード「ア(カタカナ)」の文字
種重み付け属性ならびに処理文字順番2の変換文字候補
コード「メ(カタカナ)」,「x(英字)」および「×
(記号)」の文字種重み付け属性との比較が行われ、同
じ文字種重み付け属性を持つ三文字の組合せがカタカナ
種なので、変換文字候補コード「ア(カタカナ)」,
「メ(カタカナ)」および「リ(カタカナ)」の組合せ
重み付け属性にそれぞれ1が付与される(図5の組合せ
重み付け属性の第1行参照)。
【0032】次に、文字「カ」が入力されると、文字認
識部3および類似文字判別部6により同様な処理が行わ
れ、変換文字候補コード「メ(カタカナ)」,「リ(カ
タカナ)」および「カ(カタカナ)」の組合せ重み付け
属性にそれぞれ1が付与される(図5の組合せ重み付け
属性の第2行参照)。これにより、入力文字順番2の変
換文字候補コード「メ(カタカナ)」,「x(英字)」
および「×(記号)」の重み付け属性合計の値がこの順
番に大きくなり、それぞれ重み付け順番1,2および3
が付与される(図5の入力文字順番2の列参照)。
【0033】続いて、文字「で」が入力されると、文字
認識部3および類似文字判別部6により同様な処理が行
われ、入力文字順番3の変換文字候補コード「り(ひら
がな)」および「リ(カタカナ)」の重み付け属性合計
の値がこの順番に小さくなり、それぞれ重み付け順番2
および1が付与される(図5の入力文字順番3の列参
照)。
【0034】また、入力文字順番4の変換文字候補コー
ドの「カ(カタカナ)」および「力(漢字)」の重み付
け属性合計の値がこの順番に大きくなり、それぞれ重み
付け順番1および2が付与される(図5の入力文字順番
4の列参照)。
【0035】この結果、複数の変換文字候補コードが発
生した文字「メ」,「リ」および「カ」についてカタカ
ナ種の重み付け順番がそれぞれ1になり、「ア」,
「メ」,「リ」,「カ」および「で」と類似文字が正し
く判別されることになる。
【0036】なお、上記実施例では、入力手段1として
タブレットを用いた手書き入力の場合を例にとって説明
したが、図6に示す類似文字判別部6の類似文字判別処
理が文字のストローク情報を使用していないので、入力
手段としてOCR(Optical Characte
r Reader)を用いる場合にも本発明が同様に適
用できることはあきらかであろう。
【0037】
【発明の効果】以上説明したように本発明は、変換文字
候補コードに重み付け規則に基づいてカタカナ種,ひら
がな種,漢字種,数字種および英字種の文字種重み付け
属性を付与し、三文字ごとの組合せ重み付け属性を付与
して、重み付け属性合計により類似文字を判別するよう
にしたことにより、類似文字を判別するために文字種判
定テーブルに類似文字データを登録しておくことなしに
類似文字を判別することができるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例に係る文字認識方式の構成を
示すブロック図である。
【図2】図1中の重み付け規則ファイルの内容を例示す
る図である。
【図3】図1中の重み付け展開テーブルの内容を示す図
である。
【図4】図3の重み付け展開テーブルの状態遷移図であ
る。
【図5】図4の重み付け展開テーブルの状態遷移図であ
る。
【図6】図1中の類似文字判別部の処理を示す流れ図で
ある。
【符号の説明】
1 タブレット 2 文字認識辞書 3 文字認識部 4 重み付け展開テーブル 5 重み付け規則ファイル 6 類似文字判別部

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された文字を文字認識し漢字仮名混
    じり文に変換する文字認識方式において、 文字を入力する入力手段と、 この入力手段により入力された文字を文字認識辞書を参
    照して変換文字候補コードに変換する文字認識部と、 この文字認識部により変換された変換文字候補コードに
    重み付け規則に基づいてカタカナ種,ひらがな種,漢字
    種,数字種および英字種の文字種重み付け属性を付与
    し、三文字ごとの組合せ重み付け属性を付与し、文字種
    重み付け属性と組合せ重み付け属性との和である重み付
    け属性合計により類似文字を判別する類似文字判別部と
    を有することを特徴とする文字認識方式。
  2. 【請求項2】 前記重み付け展開テーブルが、入力文字
    順番を登録する領域と、処理文字順番を登録する領域
    と、変換候補順番を登録する領域と、変換文字候補コー
    ドを登録する領域と、組合せ重み付け属性を登録する領
    域と、重み付け属性合計を登録する領域と、重み付け順
    番を登録する領域とからなる請求項1記載の文字認識方
    式。
  3. 【請求項3】 前記入力手段が、タブレットでなる請求
    項1記載の文字認識方式。
  4. 【請求項4】 前記入力手段が、OCRでなる請求項1
    記載の文字認識方式。
JP5207123A 1993-07-29 1993-07-29 文字認識方式 Expired - Fee Related JP2639314B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5207123A JP2639314B2 (ja) 1993-07-29 1993-07-29 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5207123A JP2639314B2 (ja) 1993-07-29 1993-07-29 文字認識方式

Publications (2)

Publication Number Publication Date
JPH0744551A JPH0744551A (ja) 1995-02-14
JP2639314B2 true JP2639314B2 (ja) 1997-08-13

Family

ID=16534579

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5207123A Expired - Fee Related JP2639314B2 (ja) 1993-07-29 1993-07-29 文字認識方式

Country Status (1)

Country Link
JP (1) JP2639314B2 (ja)

Also Published As

Publication number Publication date
JPH0744551A (ja) 1995-02-14

Similar Documents

Publication Publication Date Title
US5982929A (en) Pattern recognition method and system
US4991094A (en) Method for language-independent text tokenization using a character categorization
JP2009193603A (ja) 走査された及びリアルタイムの手書き文字の識別を行う文字認識システム
US6035062A (en) Character recognition method and apparatus
JP2639314B2 (ja) 文字認識方式
US6320985B1 (en) Apparatus and method for augmenting data in handwriting recognition system
US20020126903A1 (en) Word recognizing apparatus for dynamically generating feature amount of word and method thereof
JP2903779B2 (ja) 文字列認識方法及びその装置
JPH10302025A (ja) 手書き文字認識装置およびそのプログラム記録媒体
JP3763262B2 (ja) 手書文字認識装置
JPS6224382A (ja) 手書き文字の認識方法
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JPH11120294A (ja) 文字認識装置および媒体
KR940007933B1 (ko) 사용자 독립형 온라인 한글문자 인식방법
JP3022790B2 (ja) 手書き文字入力装置
JP4143148B2 (ja) 文字認識装置
JP2875678B2 (ja) 文字認識結果の後処理方法
JPH0436885A (ja) 光学式文字読取装置
JPH06333083A (ja) 光学式文字読取装置
JP2851865B2 (ja) 文字認識装置
JP2851102B2 (ja) 文字切出し方法
JPH0462692A (ja) 文字認識方法
JPH05298489A (ja) 文字認識方式
JPH01166187A (ja) 文字認識方法
JPS6344287A (ja) 文字読取装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080425

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090425

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100425

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120425

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120425

Year of fee payment: 15

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120425

Year of fee payment: 15

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120425

Year of fee payment: 15

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120425

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120425

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130425

Year of fee payment: 16

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130425

Year of fee payment: 16

LAPS Cancellation because of no payment of annual fees