JP5935324B2 - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP5935324B2 JP5935324B2 JP2012000231A JP2012000231A JP5935324B2 JP 5935324 B2 JP5935324 B2 JP 5935324B2 JP 2012000231 A JP2012000231 A JP 2012000231A JP 2012000231 A JP2012000231 A JP 2012000231A JP 5935324 B2 JP5935324 B2 JP 5935324B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- character string
- quasi
- module
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Discrimination (AREA)
- Character Input (AREA)
Description
これに関連する技術として、例えば、特許文献1には、文書画像の行と段の抽出機能を持つ文書画像認識装置に関し、横行と縦行が混在する文書画像の行・段の抽出を高速かつ高精度に行うことができるようにすることを課題とし、文書画像傾き検出部は、文書画像を参照して文字を構成する成分の集合を抽出し、これをもとに横及び縦の行候補を抽出し、それらの各々の行候補に対して信頼度を推定し、推定した行信頼度に基づいて確度の高い行の集合を抽出し、その結果をもとに確度の高い行の集合の文字成分の配置を用いて傾きを推定し、レイアウト解析部は、文書画像を構成する基礎要素の集合から行方向の確定した行集合を抽出し、行同士の関連付けによる段抽出と段を制約とした行抽出とを相互に実行して行と段を抽出することが開示されている。
請求項1の発明は、文字列の構成要素である準文字の集合である文字列要素内から、対象としている文字列に含まれる準文字を選択する準文字選択手段と、前記準文字選択手段によって選択された準文字を、前記対象としている文字列に含めることによって文字列を形成する文字列形成手段と、前記文字列形成手段によって形成された文字列の文字列らしさを示す特徴量を算出し、該文字列に含まれている準文字に該特徴量を付与する特徴量付与手段を具備し、前記準文字選択手段によって選択の対象となる準文字として、前記文字列形成手段によって形成された文字列に含まれている準文字を含み、前記準文字選択手段は、前記特徴量付与手段によって準文字に付与された特徴量に基づいて、前記対象としている文字列に含まれる準文字を選択し、前記準文字選択手段は、前記文字列形成手段によって形成途中である文字列の特徴量と既に形成された文字列に含まれている準文字に付与されている特徴量とを比較して、対象としている文字列に含まれる準文字を選択することを特徴とする情報処理装置である。
文字列の抽出技術とは、文書画像(ビットマップ画像、ストローク画像、ベクトル画像)中の、個々の文字列を抽出する技術である。
本実施の形態は、特に、1つの文字列を構成する個々の要素(以下、「準文字」という)を統合することで文字列を形成する、ボトムアップ指向の文字列の抽出技術に属するものである。文字列の抽出は、文字列の切り出し、文字列の検出ともいわれ、本実施の形態の説明において「文字列を形成する」とは、文字列の抽出、文字列の切り出し、文字列の検出と同義である。
図2に文書画像の例を示す。一般に、文書画像中には、複数の文字列がある。さらに、文字列は個々に固有の形状(サイズ、方向、歪曲、等)を持つ。文字列の抽出技術の目的は、文書画像から、個々の文字列を抽出することである。図2に示す例では、2つの文字列が抽出されるべきである。
文字列抽出の一般的な技術について説明する。特許文献1、特許文献2、特許文献3に開示の技術では、いずれも、1つの文字列を成す個々の要素を統合することで文字列を抽出する、ボトムアップ指向の文字列の抽出技術に属する。
ボトムアップ指向の文字列の抽出技術は、個々の文字列に対して、個別に統合を行うため、個々に固有の形状を持つ文字列を抽出する目的で採用されることが多い。
図3に例を示す。図3に示す例は、誤った文字列を抽出している。図3の例に示す文字列301のように、先に誤った文字列が抽出され、この文字列中の準文字が、準文字のセットから除去されたため、その後も誤った文字列(すなわち、文字列302、303、304)が抽出されている。
これらは、準文字が単一の文字列に所属する条件下で文字列を抽出しようとすることに起因する。
図4に例を示す。図4に示す例は、誤った文字列を抽出している。図4の例に示す文字列401のように、先に誤った文字列が抽出されているが、単一の準文字が複数の文字列に所属することを許すため、文字列402(「文字列の切り出し」の文字列)のように正しく文字列が抽出される。しかし、同様の理由で、文字列403、404、405、406のように、誤った文字列が抽出されている。図4の例においては、文字列の抽出結果として、下段の文字列に対しては正しい抽出結果がない。
特に、特許文献3、非特許文献1、非特許文献2に開示の技術のような、追跡型の文字列の抽出技術においては、前述の現象は顕著に現れる。ここで、追跡型とは、1つの文字列の抽出が、既に統合した準文字に基づいて、次に統合すべき準文字があるべき範囲を予測し、これに基づいて準文字を観測する、という処理の繰り返しから成るアプローチを指す。
また、本アプローチにおいては、文字列の抽出結果の仮定に対する取捨選択の後処理が生じる。抽出対象の文字列の形状に自由度が高い程、抽出される文字列の仮定の個数は増加し、取捨選択の処理の負荷は増加する。
後の文字列の抽出において、準文字501と同じ文字列に含まれるとして統合されうる準文字に、準文字502と準文字503の候補があるとする。このとき、準文字501と準文字503の準文字を統合することは誤りである。これは、文字列403、文字列404のような誤った文字列の抽出に相当する。
本実施の形態において、準文字に付与された特徴量を参照することで、文字列511よりも、文字列512の文字列の方が正しいと評価される。つまり、文字列511内の準文字に付与されている特徴量と、文字列512内の準文字に付与されている特徴量とを比較した場合、文字列512内の準文字に付与されている特徴量の方がより文字列らしさを表している特徴量であることを示している。このため、準文字503の準文字は既に正しい文字列512に含まれているものである可能性が高く、準文字502は既に文字列511に含まれているが、正しい文字列として抽出されている可能性が低いため、この場合、準文字502を統合すべきと判別される。結果として、図6の例に示すような正しい文字列(文字列611、612)の抽出結果を得る。
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
第1の実施の形態は、準文字のセットに対して、複数の文字列を検出する。また、図1の例に示す実施の形態による処理フロー例を図7に示す。なお、図1、図7の例における破線部内のモジュール、処理は、1つの文字列を検出するものである。
第1の実施の形態は、1つの文字列を検出する度に、その文字列に含まれている準文字に、その文字列に基づく特徴量を付与する。そして、後の文字列の抽出において、抽出している文字列に含めるべき準文字を選択するか否かの判別において、その特徴量を参照する。
文字列要素とは、準文字の集合である。前述の特許文献、非特許文献に示される技術においては、文字列要素は1つの準文字に相当する。また、任意個数の準文字であってもよい。例えば、文書画像内に含まれている準文字が該当する。
また、開始文字列要素112が検出されなければ、終了信号114を出力する。つまり、この第1の実施の形態による処理を終了する。
つまり、選択モジュール130は、範囲122に基づいて、準文字保持モジュール180から条件を満たす準文字を選択し、出力する。このとき、準文字に付与された特徴量を参照する。
また、選択モジュール130は、範囲設定モジュール120によって設定された範囲にある文字列要素内から、対象としている文字列に含まれる準文字を選択するようにしてもよい。
例えば、対象としている文字列について、その傾きやピッチが大きい程、長さや長細さが小さい程、歪みが大きい程、正しい文字列である可能性(すなわち、評価値)が低い、等とすればよい。いずれも、予め定められた値との比較によって、対象としている準文字が含まれている文字列が正しいか否かを判別するようにしてもよいし、ニューラルネットやブースティングといった手段により、機械学習的に設計してもよい。
具体的には、次のような文字列の正しさの判別方法がある。
(1)前述の特徴量から、1つの評価値を算出し、その大小で判別する。
(2)前述の特徴量を組み合わせ、決定木的に判別する。
前述の評価値の順に上位N(予め定められた値)個の準文字を採用してもよいし、予め定められた閾値との比較によって、準文字を選択するか否かを判断してもよい。さらに、予め定められた閾値の参照と上位N個の準文字を選択する方式を組み合わせ、選択する準文字数を制限してもよい。
なお、各準文字の特徴量の初期値として、前述の評価値が最低となるような値を設定すればよい。
つまり、文字列形成モジュール140は、受け付けた準文字132を文字列要素142として統合し、範囲設定モジュール120と文字列要素保持モジュール170へ出力する。準文字がない場合、又は、適切な文字列要素が統合されない場合、観測失敗信号144を文字列出力モジュール150へ出力する。
範囲設定モジュール120から文字列形成モジュール140による処理を、観測失敗信号144が出力されるまで繰り返す。
つまり、特徴量算出モジュール160は、受け付けた文字列152の準文字に対して、文字列152に基づく特徴量を付与する(特徴量付与162)。また、1つの文字列の検出が終了したことを受け、次の文字列の検出を開始するための信号を終了判別モジュール110へ出力する。
算出する特徴量は、選択モジュール130によって利用されるものであり、例えば、次のような特徴量がある。これらのうち、いずれか1つ、又は組み合わせを抽出する。
(1)文字列の長さ
例えば、横書きの場合は文字列の外接矩形の幅、縦書きの場合は文字列の外接矩形の縦長が該当する。又は、文字行の始点(一方の端)における中心と終点(他方の端)における中心を結ぶ直線の距離であってもよい。又は、その文字列に含まれている準文字や複数の準文字群(いわゆる単文字)の個数であってもよい。
(2)文字列の太さ
例えば、横書きの場合は文字列の外接矩形の縦長、縦書きの場合は文字列の外接矩形の幅が該当する。又は、横書きの場合は文字列の予め定められた距離毎における縦長の統計量(例えば、平均値、最頻値、中央値、最大値等をいう。以下、同様)、空白以外の場所における縦長の統計量、縦書きの場合は文字列の予め定められた距離毎における幅の統計量、空白以外の場所における幅の統計量等が該当する。
(3)文字列の傾き
例えば、文字行の始点(一方の端)における中心と終点(他方の端)における中心を結ぶ直線の傾きが該当する。
(4)文字列のピッチ(文字列に含まれている準文字又は複数の準文字群間の距離)
例えば、その文字列に含まれている準文字であって、隣り合っている準文字(又は準文字の外接矩形)間の距離が該当する。又は、複数の準文字において、その準文字の外接矩形が重なりあっている場合は、重なりあっている準文字群間の距離としてもよい。
(5)文字列の歪み
例えば、その文字列に含まれている準文字であって、隣り合っている準文字(又は準文字の外接矩形)の中心間を結ぶ直線の傾きの微分値(傾きの差分値であってもよい)の合計値等が該当する。又は、傾きの他に、準文字や単文字間の太さ、位置、ピッチ間の微分値としてもよい。
(6)文字列の長細さ
例えば、前述の文字列の長さと文字列の太さとの比率が該当する。
終了判別モジュール110から特徴量算出モジュール160までの処理を、終了信号114が出力されるまで繰り返す。
ステップS702では、終了判別モジュール110が、開始文字列要素が作成されたか否かを判断し、作成された場合はステップS704へ進み、それ以外の場合は処理を終了する(ステップS799)。
ステップS704では、範囲設定モジュール120が、開始文字列要素を受け付ける。
ステップS706では、範囲設定モジュール120が、文字列要素に基づいて、範囲を設定する。
ステップS708では、選択モジュール130が、設定された範囲中の準文字から文字列に含めるべき準文字を選択する。
ステップS712では、文字列形成モジュール140が、文字列要素が観測されなかったか否かを判断し、観測されなかった場合はステップS714へ進み、それ以外の場合はステップS718へ進む。
ステップS714では、文字列出力モジュール150が、文字列の出力を行う。
ステップS716では、特徴量算出モジュール160が、特徴量の算出を行う。
ステップS718では、範囲設定モジュール120が、文字列要素を受け付ける。
第2の実施の形態は、準文字のセットに対して、複数の文字列を検出する。また、図8の例に示す実施の形態による処理フロー例を図9に示す。なお、図8、図9の例における破線部内のモジュール、処理は、1つの文字列を検出するものである。
範囲設定モジュール820は、終了判別モジュール110、選択モジュール830と接続されている。範囲設定モジュール820は、第1の実施の形態における範囲設定モジュール120と同等の処理を行う。そして、選択モジュール830に対して、統合パラメータ824を渡す。統合パラメータ824とは、1つの文字列の形成において、次に選択すべき準文字があるべき範囲を予測するためのパラメータである。例えば、文字列形成モジュール140によって形成途中である文字列の特徴量が該当する。ここでの特徴量には、特徴量算出モジュール160が算出した特徴量が該当し、具体的には、前述の文字列の長さ、文字列の太さ、文字列の傾き、文字列に含まれている準文字又は複数の準文字群間の距離、文字列の歪みのいずれか1つ又はこれらの組み合わせがある。また、この特徴量は、形成途中である文字列に対して付与されているものである。
また、選択モジュール830は、さらに、統合パラメータ824を用いた選択と、予め定められた閾値の参照又は上位N個の準文字を選択する方式を組み合わせ、選択する準文字数を制限してもよい。
準文字保持モジュール180は、終了判別モジュール110、選択モジュール830、特徴量算出モジュール160と接続されている。
ステップS902では、終了判別モジュール110が、開始文字列要素が作成されたか否かを判断し、作成された場合はステップS904へ進み、それ以外の場合は処理を終了する(ステップS999)。
ステップS904では、範囲設定モジュール820が、開始文字列要素を受け付ける。
ステップS906では、範囲設定モジュール820が、文字列要素に基づいて、範囲を設定し、選択モジュール830に統合パラメータ824を渡す。
ステップS908では、選択モジュール830が、統合パラメータ824に基づいて、設定された範囲中の準文字から文字列に含めるべき準文字を選択する。
ステップS912では、文字列形成モジュール140が、文字列要素が観測されなかったか否かを判断し、観測されなかった場合はステップS914へ進み、それ以外の場合はステップS918へ進む。
ステップS914では、文字列出力モジュール150が、文字列の出力を行う。
ステップS916では、特徴量算出モジュール160が、特徴量の算出を行う。
ステップS918では、範囲設定モジュール820が、文字列要素を受け付ける。
準文字作成モジュール1010は、文字列切り出しモジュール1020、準文字保持モジュール1030と接続されている。
文字列切り出しモジュール1020は、準文字作成モジュール1010、準文字保持モジュール1030と接続されている。
準文字保持モジュール1030は、準文字作成モジュール1010、文字列切り出しモジュール1020と接続されている。
準文字作成モジュール1010は、受け付けた文書画像1008から、準文字1014を抽出し、その準文字1014を準文字保持モジュール1030に記憶させる。文書画像1008中のすべての準文字を抽出し終えたとき、開始信号1012を文字列切り出しモジュール1020へ出力する。
なお、図10内の文字列1022は図1、8内の文字列152に相当し、図10内の特徴量付与1024は図1、8内の特徴量付与162に相当し、図10内の終了信号1026は図1、8内の終了信号114に相当する。
文字列処理装置1000は、文字列認識装置1120と接続されている。
文字列認識装置1120は、文字列処理装置1000と接続されている。文字列認識装置1120は、文字列処理装置1000の文字列形成モジュール140によって形成された文字列1112内の文字を認識し、その文字列内の文字認識結果1122を出力する。文字認識結果1122とは、文字列1112に対する、個々の単文字の位置とテキストコードによって構成されている。
歪み量推定モジュール1220は、文字列処理装置1000、歪み補正モジュール1230と接続されている。歪み量推定モジュール1220は、文字列処理装置1000の文字列形成モジュール140によって形成された文字列の歪みを算出する。つまり、文字列処理装置1000から文字列1212を受け付けて、補正に必要な文字列の歪み量1222を推定する。
歪み補正モジュール1230は、文字列処理装置1000、歪み量推定モジュール1220と接続されている。歪み補正モジュール1230は、歪み量推定モジュール1220によって算出された歪み量1222に基づいて、その文字列を含む文書画像1208の歪みを補正する。つまり、歪み補正モジュール1230は、複数の文字列の歪みを対象としているため、文字列処理装置1000がすべての文字列を検出したことを示す終了信号1214を出力すると、処理を開始する。歪み量推定モジュール1220によって推定された歪み量1222に基づいて、文書画像1208の歪みを補正し、歪み補正文書画像1232を出力する。
なお、「文字列の歪みに基づいて」とは、各文字列の歪みの統計量を解消するように補正することをいう。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
120…範囲設定モジュール
130…選択モジュール
140…文字列形成モジュール
150…文字列出力モジュール
160…特徴量算出モジュール
170…文字列要素保持モジュール
180…準文字保持モジュール
820…範囲設定モジュール
830…選択モジュール
1010…準文字作成モジュール
1020…文字列切り出しモジュール
1030…準文字保持モジュール
1220…歪み量推定モジュール
1230…歪み補正モジュール
Claims (6)
- 文字列の構成要素である準文字の集合である文字列要素内から、対象としている文字列に含まれる準文字を選択する準文字選択手段と、
前記準文字選択手段によって選択された準文字を、前記対象としている文字列に含めることによって文字列を形成する文字列形成手段と、
前記文字列形成手段によって形成された文字列の文字列らしさを示す特徴量を算出し、該文字列に含まれている準文字に該特徴量を付与する特徴量付与手段
を具備し、
前記準文字選択手段によって選択の対象となる準文字として、前記文字列形成手段によって形成された文字列に含まれている準文字を含み、
前記準文字選択手段は、前記特徴量付与手段によって準文字に付与された特徴量に基づいて、前記対象としている文字列に含まれる準文字を選択し、
前記準文字選択手段は、前記文字列形成手段によって形成途中である文字列の特徴量と既に形成された文字列に含まれている準文字に付与されている特徴量とを比較して、対象としている文字列に含まれる準文字を選択する
ことを特徴とする情報処理装置。 - 前記文字列要素内から、前記準文字選択手段によって選択し得る準文字がある範囲を設定する範囲設定手段
をさらに具備し、
前記準文字選択手段は、前記範囲設定手段によって設定された範囲にある文字列要素内から、対象としている文字列に含まれる準文字を選択する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記特徴量付与手段は、特徴量として、文字列の長さ、文字列の太さ、文字列の傾き、文字列に含まれている準文字又は複数の準文字群間の距離、文字列の歪み、文字列の長細さのいずれか1つ又はこれらの組み合わせを算出する
ことを特徴とする請求項1又は2に記載の情報処理装置。 - 前記文字列形成手段によって形成された文字列内の文字を認識し、文字認識結果を出力する文字認識手段
をさらに具備することを特徴とする請求項1から3のいずれか1項に記載の情報処理装置。 - 前記文字列形成手段によって形成された文字列の歪みを算出する歪み算出手段と、
前記歪み算出手段によって算出された歪みに基づいて、前記文字列を含む文書の歪みを補正する補正手段
をさらに具備することを特徴とする請求項1から3のいずれか1項に記載の情報処理装置。 - コンピュータを、
文字列の構成要素である準文字の集合である文字列要素内から、対象としている文字列に含まれる準文字を選択する準文字選択手段と、
前記準文字選択手段によって選択された準文字を、前記対象としている文字列に含めることによって文字列を形成する文字列形成手段と、
前記文字列形成手段によって形成された文字列の文字列らしさを示す特徴量を算出し、該文字列に含まれている準文字に該特徴量を付与する特徴量付与手段
として機能させ、
前記準文字選択手段によって選択の対象となる準文字として、前記文字列形成手段によって形成された文字列に含まれている準文字を含み、
前記準文字選択手段は、前記特徴量付与手段によって準文字に付与された特徴量に基づいて、前記対象としている文字列に含まれる準文字を選択し、
前記準文字選択手段は、前記文字列形成手段によって形成途中である文字列の特徴量と既に形成された文字列に含まれている準文字に付与されている特徴量とを比較して、対象としている文字列に含まれる準文字を選択する
ことを特徴とする情報処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012000231A JP5935324B2 (ja) | 2012-01-04 | 2012-01-04 | 情報処理装置及び情報処理プログラム |
CN201210281080.3A CN103198291B (zh) | 2012-01-04 | 2012-08-08 | 信息处理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012000231A JP5935324B2 (ja) | 2012-01-04 | 2012-01-04 | 情報処理装置及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013140487A JP2013140487A (ja) | 2013-07-18 |
JP5935324B2 true JP5935324B2 (ja) | 2016-06-15 |
Family
ID=48720829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012000231A Active JP5935324B2 (ja) | 2012-01-04 | 2012-01-04 | 情報処理装置及び情報処理プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5935324B2 (ja) |
CN (1) | CN103198291B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7618458B2 (ja) | 2021-02-08 | 2025-01-21 | 株式会社東芝 | 文字認識装置、文字認識方法、及びプログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3585143B2 (ja) * | 1996-07-17 | 2004-11-04 | 日本電信電話株式会社 | 文字列抽出方法および装置 |
JPH1196288A (ja) * | 1997-09-18 | 1999-04-09 | Hitachi Ltd | 文字行方向検出方法および文字行方向検出装置 |
JP4395188B2 (ja) * | 1997-11-28 | 2010-01-06 | 富士通株式会社 | 文書画像認識装置および文書画像認識プログラムの記憶媒体 |
JP2000181993A (ja) * | 1998-12-16 | 2000-06-30 | Fujitsu Ltd | 文字認識方法および装置 |
JP2004038530A (ja) * | 2002-07-03 | 2004-02-05 | Ricoh Co Ltd | 画像処理方法、同方法の実行に用いるプログラム及び画像処理装置 |
CN101520851A (zh) * | 2008-02-29 | 2009-09-02 | 富士通株式会社 | 字符信息识别装置和方法 |
JP5488077B2 (ja) * | 2010-03-15 | 2014-05-14 | オムロン株式会社 | 文字列検知装置、文字評価装置、画像処理装置、文字列検知方法、文字評価方法、制御プログラムおよび記録媒体 |
JP5591578B2 (ja) * | 2010-04-19 | 2014-09-17 | 日本電産サンキョー株式会社 | 文字列認識装置および文字列認識方法 |
-
2012
- 2012-01-04 JP JP2012000231A patent/JP5935324B2/ja active Active
- 2012-08-08 CN CN201210281080.3A patent/CN103198291B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN103198291B (zh) | 2017-11-28 |
JP2013140487A (ja) | 2013-07-18 |
CN103198291A (zh) | 2013-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6119952B2 (ja) | 画像処理装置及び画像処理プログラム | |
KR101235226B1 (ko) | 화상 처리 장치, 화상 처리 방법 및 기록 매체 | |
US10740899B2 (en) | Image processing apparatus for identifying region within image, information processing method, and storage medium | |
JP6187323B2 (ja) | 画像処理装置及び画像処理プログラム | |
US9280725B2 (en) | Information processing apparatus, information processing method, and non-transitory computer readable medium | |
US20150213332A1 (en) | Image processing apparatus, non-transitory computer readable medium, and image processing method | |
US8787676B2 (en) | Image processing apparatus, computer readable medium storing program, and image processing method | |
JP5935324B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6260350B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5821648B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5640645B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5724341B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6003375B2 (ja) | 画像処理装置及び画像処理プログラム | |
US20150043832A1 (en) | Information processing apparatus, information processing method, and computer readable medium | |
JP2017010187A (ja) | 画像処理装置及び画像処理プログラム | |
JP6187307B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5949248B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5636766B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6511942B2 (ja) | 情報処理装置および情報処理プログラム | |
JP6003677B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5845724B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6409423B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5991076B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5673033B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2016053797A (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141211 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150908 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160412 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160425 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5935324 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |