JP7184411B1 - Character Recognition Program Evaluation Method, Character Recognition Program Evaluation System, and Method of Manufacturing Teacher Data for Character Recognition Program - Google Patents
Character Recognition Program Evaluation Method, Character Recognition Program Evaluation System, and Method of Manufacturing Teacher Data for Character Recognition Program Download PDFInfo
- Publication number
- JP7184411B1 JP7184411B1 JP2022099004A JP2022099004A JP7184411B1 JP 7184411 B1 JP7184411 B1 JP 7184411B1 JP 2022099004 A JP2022099004 A JP 2022099004A JP 2022099004 A JP2022099004 A JP 2022099004A JP 7184411 B1 JP7184411 B1 JP 7184411B1
- Authority
- JP
- Japan
- Prior art keywords
- character recognition
- image data
- human
- recognition result
- machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【課題】文字認識プログラムを客観的に評価することができる文字認識プログラムの評価方法。
【解決手段】手書き文字の画像データを取得するステップと、複数の異なる文字認識プログラムによる文字認識演算部が複数の機械文字認識結果を得るステップと、前記画像データから得られる前記複数の機械文字認識結果の一致率に関する一致率データを得るステップと、前記画像データについての人間の視認による文字認識結果である人文字認識結果を得るステップと、前記複数の機械文字認識結果の正誤を判定するとともに、前記複数の機械文字認識結果の正解率を得るステップと、前記画像データと、前記複数の機械文字認識結果のうち少なくとも1つおよびその正誤と、前記人文字認識結果と、前記一致率データと、前記正解率と、が関連付けられた文字認識プログラム評価結果を記憶するステップと、を有する文字認識プログラムの評価方法。
【選択図】図1
A character recognition program evaluation method capable of objectively evaluating a character recognition program.
A step of obtaining image data of a handwritten character, a step of obtaining a plurality of machine character recognition results by a character recognition calculation unit using a plurality of different character recognition programs, and a step of obtaining a plurality of machine character recognition results from the image data. a step of obtaining matching rate data regarding a matching rate of a result; a step of obtaining a human character recognition result that is a result of character recognition by human visual recognition of the image data; determining whether the plurality of machine character recognition results are correct or not; a step of obtaining an accuracy rate of the plurality of machine character recognition results; the image data; at least one of the plurality of machine character recognition results and correct/wrong thereof; the human character recognition result; and a step of storing character recognition program evaluation results associated with the accuracy rate.
[Selection drawing] Fig. 1
Description
本発明は、OCRに用いられる文字認識プログラムの評価方法、文字認識プログラムの評価システムおよび文字認識プログラム用教師データの製造方法に関する。 The present invention relates to a character recognition program evaluation method used in OCR, a character recognition program evaluation system, and a method of producing teacher data for a character recognition program.
近年、いわゆるOCR(Optical Character Recognition)と呼ばれる技術が、多様な分野で使われている。また、OCRでは、文字を認識する際のプログラム(アルゴリズム)を、機械学習により改良する技術なども提案されている。たとえば、教師データに含まれる画像データ(文字を含む)を、学習対象であるプログラムに文字認識させるとともに、画像データの正しい文字認識結果(正解)を、対象プラグラムの学習機能部分に伝えることにより、プログラムの文字認識における正解率向上が期待される。 In recent years, a technique called OCR (Optical Character Recognition) has been used in various fields. In addition, in OCR, techniques such as improving the program (algorithm) for recognizing characters by machine learning have been proposed. For example, image data (including characters) contained in training data can be recognized by the program to be learned, and the correct character recognition result (correct answer) of the image data can be conveyed to the learning function part of the target program. It is expected to improve accuracy rate in program character recognition.
ここで、従来の文字認識プログラムは、印刷文字に対する文字認識精度はかなり高いものの、手書き文字に対する文字認識精度については、印刷文字に対するそれよりかなり低く、その向上が期待されている。しかしながら、手書き文字は、書き手の個性に依存して極めて多様であり、しかも、シチュエーションに応じて、略字などの省略記載が頻繁に行われる。このような手書き文字の多様性を背景として、特定のプログラムの手書き文字に対する文字認識精度を客観的に評価することが難しいことや、手書き文字に対する文字認識精度を高めるために有効な教師データが得られないことが、文字認識プログラムによる手書き文字の文字認識精度の向上を妨げている。 Here, conventional character recognition programs have a fairly high character recognition accuracy for printed characters, but the character recognition accuracy for handwritten characters is considerably lower than that for printed characters, and an improvement is expected. However, handwritten characters are extremely diverse depending on the personality of the writer, and abbreviations such as abbreviated characters are frequently used depending on the situation. Against the background of such diversity of handwritten characters, it is difficult to objectively evaluate the character recognition accuracy of a specific program for handwritten characters. The inability to do so prevents character recognition programs from improving the character recognition accuracy of handwritten characters.
本発明は、文字認識プログラムを客観的に評価することができる文字認識プログラムの評価方法や評価システムおよび手書き文字に対する文字認識精度を高めるために有効な教師データの製造方法に関する。 The present invention relates to a character recognition program evaluation method and evaluation system capable of objectively evaluating a character recognition program, and to a method of producing teaching data effective for improving character recognition accuracy for handwritten characters.
本発明に係る文字認識プログラムの評価方法は、
手書き文字の画像データを取得するステップと、
複数の異なる文字認識プログラムによる文字認識演算部が前記画像データに対して文字認識を行い、前記画像データについての前記複数の文字認識プログラムによる文字認識結果である複数の機械文字認識結果を得るステップと、
前記画像データから得られる前記複数の機械文字認識結果の一致率に関する一致率データを得るステップと、
前記画像データについての人間の視認による文字認識結果である人文字認識結果を得るステップと、
前記複数の機械文字認識結果のそれぞれと、前記人文字認識結果とを比較して、前記複数の機械文字認識結果の正誤を判定するとともに、前記複数の機械文字認識結果の正解率を得るステップと、
前記画像データと、前記複数の機械文字認識結果のうち少なくとも1つおよびその正誤と、前記人文字認識結果と、前記一致率データと、前記正解率と、が関連付けられた文字認識プログラム評価結果を記憶するステップと、を有する。
A character recognition program evaluation method according to the present invention includes:
obtaining image data of handwritten characters;
a step of performing character recognition on the image data by a character recognition calculation unit using a plurality of different character recognition programs to obtain a plurality of machine character recognition results, which are character recognition results of the image data by the plurality of character recognition programs; ,
obtaining match rate data relating to the match rate of the plurality of machine character recognition results obtained from the image data;
a step of obtaining a human character recognition result, which is a character recognition result by human visual recognition of the image data;
comparing each of the plurality of machine character recognition results with the human character recognition result to determine whether the plurality of machine character recognition results are correct or not, and obtaining an accuracy rate of the plurality of machine character recognition results; ,
a character recognition program evaluation result in which the image data, at least one of the plurality of machine character recognition results and correct/incorrect thereof, the human character recognition result, the matching rate data, and the accuracy rate are associated with each other; and storing.
本発明に係る文字認識プログラムの評価方法によれば、実際の手書き文字の画像データを、複数の文字認識プログラムが文字認識することにより、現実の手書き文字に対する文字認識の状況に整合しており、かつ、客観的である評価結果が得られる。また、共通の画像データを、複数の文字認識プログラムにより文字認識することにより、評価の効率を高めることができる。また、各画像データについて、正解率と一致率という多角的な指標が得られるため、その画像データに対する機械文字認識結果の正誤について、多角的かつ有効な知見を得ることができる。 According to the character recognition program evaluation method according to the present invention, image data of actual handwritten characters are subjected to character recognition by a plurality of character recognition programs. Moreover, an objective evaluation result can be obtained. In addition, evaluation efficiency can be improved by recognizing common image data using a plurality of character recognition programs. In addition, since multifaceted indices such as the accuracy rate and the matching rate can be obtained for each image data, multifaceted and effective knowledge can be obtained as to whether the machine character recognition result for the image data is correct or incorrect.
また、たとえば、前記人文字認識結果を得るステップでは、少なくとも2人の人間を評価者として選定するステップと、
前記少なくとも2人の人間から得られた文字認識結果である仮認識結果を判定するステップと、を有してもよく、
前記仮認識結果を判定するステップでは、前記仮認識結果が互いに一致する場合には前記仮認識結果を前記人文字認識結果として認定し、前記仮認識結果が互いに一致しない場合は少なくとも2人の人間を評価者として選定するステップに戻ってもよい。
Further, for example, in the step of obtaining the human character recognition result, selecting at least two humans as evaluators;
determining tentative recognition results that are character recognition results obtained from the at least two humans;
In the step of determining the provisional recognition result, if the provisional recognition results match each other, the provisional recognition result is recognized as the human character recognition result, and if the provisional recognition results do not match, at least two people may return to the step of selecting as the evaluator.
このような文字認識プログラムの評価方法では、人間である評価者の文字認識結果のばらつきに起因する評価結果の誤差を、効果的に抑制することができる。 In such a character recognition program evaluation method, it is possible to effectively suppress errors in evaluation results caused by variations in the character recognition results of human evaluators.
また、たとえば、前記人文字認識結果を得るステップでは、各評価者の仮認識結果が前記人文字認識結果と一致する確率に関する評価者信頼度を記憶するステップを含み、
前記少なくとも2人の人間を評価者として選定するステップでは、前記一致率データと、前記評価者信頼度とを用いて、少なくとも2人の人間を評価者として選定してもよい。
Further, for example, the step of obtaining the human character recognition result includes a step of storing an evaluator confidence level relating to the probability that the temporary recognition result of each evaluator matches the human character recognition result,
In the step of selecting at least two persons as evaluators, at least two persons may be selected as evaluators using the matching rate data and the evaluator reliability.
このような文字認識プログラムの評価方法では、たとえば一致率の高い画像データに対しては評価信頼度の高い人間を優先して評価者に選定し、一致率の低い画像データに対しては評価信頼度の低い人間を優先して評価者に選定することで、人文字認識結果の取得効率を向上させることができる。人間による人文字認識結果を得るステップでは、一致率の高い画像データに対する評価を行うシチュエーションの方が、評価効率や評価精度に、評価者の能力差が現れやすいからである。 In the evaluation method of such a character recognition program, for example, for image data with a high matching rate, a person with a high evaluation reliability is given priority and selected as an evaluator, and for image data with a low matching rate, the evaluation reliability is selected. By preferentially selecting a person with a low degree of accuracy as an evaluator, it is possible to improve the efficiency of obtaining human character recognition results. This is because, in the step of obtaining human character recognition results, differences in the abilities of evaluators are more likely to appear in evaluation efficiency and evaluation accuracy in situations where image data with a high matching rate is evaluated.
また、たとえば、前記人文字認識結果を得るステップでは、前記画像データと、前記複数の機械文字認識結果と、前記複数の機械文字認識結果のいずれかを前記人文字認識結果またはその候補として選択可能なグラフィカルインターフェースと、を評価者の端末に表示してもよい。 Further, for example, in the step of obtaining the human character recognition result, any one of the image data, the plurality of machine character recognition results, and the plurality of machine character recognition results can be selected as the human character recognition result or a candidate thereof. A graphical interface may be displayed on the evaluator's terminal.
このような文字認識プログラムの評価方法では、評価者による入力作業量を抑制し、人間による人文字認識結果を得るステップの効率を高めることができる。 In such a character recognition program evaluation method, it is possible to reduce the amount of input work by the evaluator and improve the efficiency of the step of obtaining human character recognition results by humans.
また、本発明に係る文字認識プログラムの評価システムでは、手書き文字の画像データを取得する画像データ取得部と、
複数の異なる文字認識プログラムが前記画像データに対して文字認識を行い、前記画像データについての前記複数の文字認識プログラムによる文字認識結果である複数の機械文字認識結果を得る機械文字認識結果取得部と、
前記画像データから得られる前記複数の機械文字認識結果の一致率に関する一致率データを得る一致率データ取得部と、
前記画像データについての人間の視認による文字認識結果である人文字認識結果を得る人文字認識結果取得部と、
前記複数の機械文字認識結果のそれぞれと、前記人文字認識結果とを比較して、前記複数の機械文字認識結果の正誤を判定する正誤判定部および前記複数の機械文字認識結果の正解率を得る正解率演算部と、
前記画像データと、前記複数の機械文字認識結果のうち少なくとも1つおよびその正誤と、前記人文字認識結果と、前記一致率データと、前記正解率と、が関連付けられた文字認識プログラム評価結果を記憶する評価結果記憶部と、を有する。
Further, in the character recognition program evaluation system according to the present invention, an image data acquisition unit for acquiring image data of handwritten characters;
a machine character recognition result acquisition unit for obtaining a plurality of machine character recognition results, which are character recognition results of the image data by a plurality of different character recognition programs performing character recognition on the image data by the plurality of character recognition programs; ,
a matching rate data obtaining unit for obtaining matching rate data relating to the matching rates of the plurality of machine character recognition results obtained from the image data;
a human character recognition result obtaining unit for obtaining a human character recognition result, which is a character recognition result of the image data visually recognized by a human;
Each of the plurality of machine character recognition results and the human character recognition result are compared to obtain a correctness determination unit for determining whether the plurality of machine character recognition results are correct and an accuracy rate of the plurality of machine character recognition results. an accuracy rate calculator;
a character recognition program evaluation result in which the image data, at least one of the plurality of machine character recognition results and correct/incorrect thereof, the human character recognition result, the matching rate data, and the accuracy rate are associated with each other; and an evaluation result storage unit for storing.
また、本発明に係る文字認識プログラム用教師データの製造方法では、手書き文字の画像データを取得するステップと、
複数の異なる文字認識プログラムが前記画像データに対して文字認識を行い、前記画像データについての前記複数の文字認識プログラムによる文字認識結果である複数の機械文字認識結果を得るステップと、
前記画像データから得られる前記複数の機械文字認識結果の一致率に関する一致率データを得るステップと、
前記画像データについての人間の視認による文字認識結果である人文字認識結果を得るステップと、
前記複数の機械文字認識結果のそれぞれと、前記人文字認識結果とを比較して、前記複数の機械文字認識結果の正誤を判定するとともに、前記複数の文字認識プログラムのうち前記画像データに対して正しい文字認識を行えた文字認識プログラムの割合を表す正解率を得るステップと、
前記画像データと、前記人文字認識結果と、前記一致率データと、前記正解率が関連付けられた教師データを記憶するステップと、を有する。
Further, in a method for producing teacher data for a character recognition program according to the present invention, a step of obtaining image data of handwritten characters;
a step of performing character recognition on the image data by a plurality of different character recognition programs to obtain a plurality of machine character recognition results, which are character recognition results of the image data by the plurality of character recognition programs;
obtaining match rate data relating to the match rate of the plurality of machine character recognition results obtained from the image data;
a step of obtaining a human character recognition result, which is a character recognition result by human visual recognition of the image data;
each of the plurality of machine character recognition results and the human character recognition result are compared to determine whether the plurality of machine character recognition results are correct or not; a step of obtaining an accuracy rate representing the percentage of character recognition programs that performed correct character recognition;
and storing the image data, the human character recognition result, the match rate data, and teacher data associated with the correct rate.
本発明に係る文字認識プログラム用教師データの製造方法によれば、実際の手書き文字の画像データを、複数の文字認識プログラムが文字認識することにより製造することで、現実の手書き文字を文字認識の状況に整合しており、かつ、学習効果の高い教師データを製造できる。また、共通の画像データを、複数の文字認識プログラムにより文字認識することにより、教師データの製造効率を高めることができる。また、教師データに含まれる画像データについて、正解率と一致率という多角的な指標が付いているため、教師データを用いることにより期待される学習効果について、多角的かつ有効な知見を得ることができる。 According to the method for producing teacher data for a character recognition program according to the present invention, image data of actual handwritten characters are produced through character recognition by a plurality of character recognition programs, so that actual handwritten characters are used for character recognition. It is possible to produce teacher data that is consistent with the situation and has a high learning effect. Further, by recognizing common image data using a plurality of character recognition programs, the production efficiency of teacher data can be improved. In addition, since the image data included in the training data has multifaceted indices such as the accuracy rate and the matching rate, it is possible to obtain multifaceted and effective knowledge about the expected learning effect of using the training data. can.
開示される技術は、複数の人工知能の結果を同時に評価するシステム(A system that simultaneously evaluates the results of multiple artificial intelligences)に関する内容を含む。また、複数の人工知能(Multiple Artificial Intelligence)、自動処理結果(Automatic processing results)、合理的な変更(Reasonable modifications)、インテジェンスデータの生成(Intelligence data generation)、修正の自動処理(Automatic processing of corrections)に関連する知見を含む。 The disclosed technology includes content related to a system that simultaneously evaluates the results of multiple artificial intelligences. Also, Multiple Artificial Intelligence, Automatic processing results, Reasonable modifications, Intelligence data generation, Automatic processing of corrections ), including findings related to
図1は、本発明の一実施形態に係る文字認識プログラムの評価方法を行う文字認識プログラム評価システム10を示す概念図である。図1に示すように、文字認識プログラム評価システム10は、画像データ取得部20、機械文字認識結果取得部30、機械文字認識傾向演算部40、人文字認識結果取得部50、採点部60、情報統合部70等を有する。
FIG. 1 is a conceptual diagram showing a character recognition
文字認識プログラム評価システム10は、演算処理を行う演算部や、情報の記憶を行う記憶部や、他のサーバや端末との通信を行う通信部などを有し、物理サーバやクラウド・コンピューティングによる仮想サーバ等によって実現される。また、文字認識プログラム評価システム10に含まれる各種演算部や記憶部等は、1か所に集中して配置されていてもよく、通信ネットワークを介して分散して配置されていてもよい。
The character recognition
以下、文字認識プログラム評価システム10による文字認識プログラムの評価方法および文字認識プログラム用教師データの製造方法について、具体例を挙げて説明を行う。ただし、文字認識プログラム評価システム10による文字認識プログラムの評価方法および文字認識プログラム用教師データの製造方法は、これらの具体例のみに限定されるものではない。
Hereinafter, a method for evaluating a character recognition program and a method for producing teacher data for a character recognition program by the character recognition
文字認識プログラム評価システム10による評価方法等においては、まず、画像データ取得部20において、手書き文字の画像データ20aを取得するステップが行われる。画像データ取得部20は、スキャナやカメラ等の読取部24を有しており、帳票22等に記載の文字を読み取り、画像データ20aを取得する。取得された画像データ20aは、画像データ20の記憶部等に保存される。取得される画像データ20aの数や、画像データ20aに含まれる文字数などは、特に限定されない。
In the evaluation method and the like by the character recognition
画像データ20aとして取得される手書き文字は、帳票22のみには限定されず、各種申込書、手紙、挨拶状などの他の書面に含まれる手書き文字であってもよい。ただし、画像データ20aとして取得される手書き文字は、何らかの実用的な目的で手書きされたものであることが好ましい。実用的な目的で書かれた手書き文字を用いることにより、評価システム10により得られる評価結果が、文字認識プログラムの実用上の文字認識精度により近いものとなる。
The handwritten characters acquired as the
次に、評価システム10では、機械文字認識結果取得部30において、画像データ20aに対して文字認識を行い、文字認識プログラムによる文字認識結果である機械文字認識結果を得るステップが行われる。図1に示すように、機械文字認識結果取得部30は、複数の異なる文字認識プログラムによる文字認識演算部である第1文字認識演算部31、第2文字認識演算部32、第3文字認識演算部33を有する。
Next, in the
それぞれの第1文字認識演算部31、第2文字認識演算部32、第3文字認識演算部33は、互いに異なる文字認識プログラムによって制御されており、互いに異なるアルゴリズムで、共通の画像データ20aに対して文字認識を行う。これにより、機械文字認識結果取得部30では、画像データ20aについての複数の文字認識プログラムによる文字認識結果である第1機械文字認識結果31a、第2機械文字認識結果32a、第3機械文字認識結果33aを得る。
The first character
図1に示すように、機械文字認識結果取得部30は、それぞれの第1文字認識演算部31、第2文字認識演算部32、第3文字認識演算部33に対応して独立するデータベースを有することが、演算速度を維持する観点から好ましい。各データベースに、各文字認識演算部31、32、33による文字認識結果である第1~第3機械文字認識結果31a、32a、33aが記憶されるほか、認識対象となる画像データ20aも、各データベースに複製して保存される。これにより、第1文字認識演算部31、第2文字認識演算部32、第3文字認識演算部33によるデータベースからの読み出しおよび書き込みが、それぞれ独立に行われることになるため、機械文字認識結果取得部30での処理速度の向上に資する。
As shown in FIG. 1, the machine character recognition result
機械文字認識結果取得部30で画像データ20aに対して文字認識を行う文字認識プログラムの数は、複数であれば特に限定されないが、好ましくは3~8192程度、より好ましくは10~256程度である。文字認識プログラムの数が多いほど、評価および教師データ製造の効率が高まるとともに、評価等で得られる一致率や正解率(後述)の客観性が高まる。一方、文字認識プログラムの数を所定数以下とすることにより、評価システム10に必要なリソースが増えすぎることを防止できる。
The number of character recognition programs that perform character recognition on the
次に、評価システム10では、機械文字認識傾向演算部40において、画像データ20aから得られる複数の機械文字認識結果31a、32a、33aの一致率に関する一致率データを得るステップを行う。図1に示すように、機械文字認識傾向演算部40は、機械文字認識結果31a、32a、33aの一致率に関する一致率データを得る一致率データ取得部42を有する。
Next, in the
図2は、評価システム10による処理により得られる情報の対応関係を示す概念図である。図1に示す一致率データ取得部42は、機械文字認識結果取得部30に含まれる各データベースから第1~第3機械文字認識結果31a~33aを読み出し、一致率データ42aを得る。
FIG. 2 is a conceptual diagram showing a correspondence relationship of information obtained by processing by the
図2(a)では、手書き文字である「日本太郎」という画像データ20aに対して、5つの異なる文字認識演算部31、32、33(第4および第5文字認識演算部は図1において図示を省略)を用いて、5つの機械文字認識結果31a~33aを得た場合を示している。図2(a)に示される5つの機械文字認識結果31a~33aから理解できるように、「日本太郎」という画像データ20aに対して5つの異なる文字認識演算部によって文字認識が行われた結果、3種類の異なる機械文字認識結果が得られ、そのうち最大3つの機械文字認識結果が一致している。
In FIG. 2A, five different character
一致率データ取得部42は、図2(a)に示すケースでは、5つの異なる文字認識演算部によって文字認識が行われた結果、最大で3つの機械文字認識結果が一致している。したがって、一致率データ取得部42は、「日本太郎」という画像データ20aに関する一致率を、60%(3/5)であると判断する。
In the case shown in FIG. 2(a), the match rate
一方、図2(b)に示すケースでは、手書き文字である「同上」という画像データ20aに対して3つの異なる文字認識演算部によって文字認識が行われた結果、3種類の異なる機械文字認識結果が得られ、そのうち最大2つの機械文字認識結果が一致している。図2(b)に示すケースでは、5つの異なる文字認識演算部によって文字認識が行われた結果、最大で2つの機械文字認識結果が一致しているため、一致率データ取得部42は、「同上」という画像データ20aに関する一致率を、40%(2/5)であると判断する。
On the other hand, in the case shown in FIG. 2B, three different machine character recognition results are obtained as a result of character recognition performed by three different character recognition calculation units on the
図2に示すように、一致率データ42aは、文字認識の対象となった画像データ20aごとに算出される。また、一致率データ42aは、共通する画像データ20aに対する複数の機械文字認識結果31a~33aの比較から算出され、一致した機械文字認識結果が正答であるか誤答であるかを問わない。言い換えると、一致率データ42aは、後述する人文字認識結果56aとは関係なく、もしくは、人文字認識結果56aが取得される前に、算出される。
As shown in FIG. 2, matching
なお、一致率データ42aは、複数の互いに異なる文字認識プログラムによって文字認識結果を得る場合にのみ、意味のある値(変位する価)となる。なぜなら、1つの文字認識プログラムによって1つの文字認識結果を得るケースでは、一致率は常に100%となるからである。
Note that the
次に、評価システム10では、人文字認識結果取得部50において、画像データ20aについての人間の視認による文字認識結果である人文字認識結果56aを得るステップを実施する。図1に示すように、人文字認識結果取得部50は、評価者選定部52、仮認識結果取得部54、判定部56、評価者データベース52aおよび人文字認識結果56aを記憶する記憶部等を有する。
Next, in the
図1に示すように、人文字認識結果取得部50は、通信ネットワーク等を介して評価者が操作する複数の評価者端末94に対して通信を行い、リモートで人間の視認による文字認識結果である人文字認識結果56aを得ることが、効率的かつ安価に評価を行う観点から好ましい。また、図1に示す人文字認識結果取得部50は、評価者選定部52が少なくとも2人の人間(評価者端末94に紐づけられる)を評価者として選定するステップと、判定部56が少なくとも2人の人間(評価者)から得られた文字認識結果である仮認識結果を判定するステップとを実施して、人文字認識結果を得ることができる。
As shown in FIG. 1, the human character recognition result
図10は、人文字認識結果取得部50が人文字認識結果56aを得るステップにおける処理の一例を示すフローチャートである。ステップ001で所定の画像データ20aに対する人文字認識結果56aの取得処理を開始した人文字認識結果取得部50は、ステップS0002において、対応する画像データ20aの一致率に関する一致率データ42a(図2参照)を読み出す。
FIG. 10 is a flow chart showing an example of processing in a step in which the human character recognition result
次に、ステップS003では、図1に示す人文字認識結果取得部50の評価者選定部52が、評価システム10にログインしている候補者の中から、2人の人間を評価者として選定する。ステップS003において、評価者選定部52は、ステップS002で読み出した一致率データ42aと、候補者の評価者としての信頼度を示す評価者信頼度とを参照して、2人の評価者を選定する。
Next, in step S003, the
ここで、評価者選定部52が評価者の選定に用いる評価者信頼度は、各評価者の個別の文字認識結果である仮認識結果が、図10に示す人文字認識結果取得部50の処理によって最終的に決定される人文字認識結果56aと一致する確率(評価者正答率)に関する。ただし、評価者信頼度は、各評価者の評価者正答率のみから構成されるものに限定されるものではなく、たとえば、経験年数などの他の指標を評価者正答率と合わせて構成されるものであってもよい。
Here, the evaluator reliability used by the
図3は、ステップS003において、評価者選定部52が評価者を選定する基準を示す対応表である。評価者選定部52は、処理対象の画像データ20aの一致率が高い(たとえば80%以上=Aランク)場合は、評価者信頼度のより高い候補を、評価者として優先的に選定する。また、評価者選定部52は、処理対象の画像データ20aの一致率が低い(たとえば40%以下=Cランク)場合は、評価者信頼度が相対的に低い候補を、評価者として優先的に選定する。また、評価者選定部52は、処理対象の画像データ20aの一致率が中程度(たとえば40%より大きく80%未満=Bランク)場合は、評価者信頼度が中程度の候補を、評価者として優先的に選定する。
FIG. 3 is a correspondence table showing criteria for selecting evaluators by the
このように、一致率の高い画像データ20aに対しては、一致率の低い画像データ20aに対する場合に比べて、評価信頼度の高い人間を優先して評価者に選定することで、人文字認識結果56aの取得効率を向上させることができる。図4を用いて後述するように、一致率の高い画像データ20aに対する評価を行うシチュエーションでは、機械文字認識結果31a~33aの中に正しい文字認識結果が含まれる可能性が高いため、迅速かつ正確に、画像データ20aと一致するものを機械文字認識結果31a~33aから探し出す能力が重要となり、評価者の能力差が現れやすい。一方、一致率の低い画像データに対する評価を行うシチュエーションでは、機械文字認識結果31a~33aの中に正しい文字認識結果が存在しない可能性が高く、仮認識結果を打ち込む頻度が高くなるので、誰が行っても時間がかかるケースが多く、相対的に評価者の能力差が現れにくい。
As described above, for the
次に、ステップS004では、ステップS003で選定した評価者の評価者端末94に対して、人文字認識結果取得部50の仮認識結果取得部54が、図4に示すような仮認識結果(または人文字認識結果56a)の入力画面を表示する。図4に示すように、人文字認識結果取得部50は、画像データ20aと、複数の機械文字認識結果31a~33aと、複数の機械文字認識結果31a~33aのいずれかを人文字認識結果56aまたはその候補である仮認識結果として選択可能な第1グラフィカルインターフェース58とを、評価者端末94の表示部に表示する。
Next, in step S004, the temporary recognition result acquiring unit 54 of the human character recognition
図4に示すように、第1グラフィカルインターフェース58は、複数の機械文字認識結果31a~33aの中から、画像データ20aの正しい文字認識結果となっているものにチェックを入れるチェックボックスになっている。図4において点線で示されるように、評価者が、正しい文字認識結果となっている機械文字認識結果31a~33aに対応するチェックボックスを選択することにより、画像データ20aに対する評価者による文字認識結果である仮認識結果が決定される。
As shown in FIG. 4, the first
ステップS005では、さらに確定ボタン58aの入力などを経て、評価者によって評価者端末94に入力された仮認識結果が人文字認識結果取得部50の仮認識結果取得部54に送られ、仮認識結果取得部54が仮認識結果を取得する。この際、仮認識結果取得部54は、ステップS003で選定した2人の評価者から、仮認識結果を取得する。なお、図4に示すように、評価者端末94の表示部には、仮認識結果を打ち込み可能なテキストボックス等の第2グラフィカルインターフェース59が表示されてもよい。評価者は、第2グラフィカルインターフェース59に直接入力することでも、仮認識結果の入力を行うことができる。
In step S005, the provisional recognition result input by the evaluator to the
また、図4に示すように、第1グラフィカルインターフェース58によって機械文字認識結果のいずれかが選択された場合は、選択された機械文字認識結果が、第2グラフィカルインターフェース59にコピーされる。また、評価者端末94の表示部には、仮認識結果が入力された際に、各機械文字認識結果31a~33aが正答であるか誤答であるかを表示する自動判定表示欄57が設けられていてもよい。
Also, as shown in FIG. 4 , when any of the machine character recognition results is selected by the first
ステップS006では、図1に示す判定部56が、ステップS005で取得した2人の評価者から得られた文字認識結果である仮認識結果が、互いに一致するか否かを判定する。ステップS006において、2人の選定者よる仮認識結果が互いに一致する場合はステップS007へ進み、図1に示す判定部56が、一致した仮認識結果を、画像データ20aに対する人文字認識結果56aとして認定し、人文字認識結果取得部50の記憶部に記憶させる。
In step S006, the
一方、2人の選定者よる仮認識結果が互いに一致しない場合は、ステップS008およびステップS009において、繰り返し回数が所定の回数(5回)を超えてないことを判断したのち、2人の人間を評価者として選定するステップ(ステップS003)の処理へ戻る。なお、ステップS008およびステップS009において、繰り返し回数が所定の回数(5回)を超えていると判断された場合は、ステップS010のへ進む。ステップS010では、人文字認識結果取得部50が、対象である画像データ20aに関する人文字認識結果56aの取得を保留し、際限なく処理が繰り返されることを防止する。なお、ステップS010で人文字認識結果56aの取得が保留された画像データ20aについては、たとえば評価システム10のスーパーバイザー等によって、人文字認識結果56aが決定される。
On the other hand, if the provisional recognition results of the two selectors do not match each other, it is determined in steps S008 and S009 that the number of repetitions does not exceed a predetermined number (5 times), and then the two persons are identified. The process returns to the step of selecting the evaluator (step S003). If it is determined in steps S008 and S009 that the number of repetitions exceeds the predetermined number (5 times), the process proceeds to step S010. In step S010, the human character recognition result
ステップS007またはステップS010の後、ステップS011へ進み、人文字認識結果取得部50による人文字認識結果56aの取得処理を終了する。なお、図10に示すステップS007等において、画像データ20aに対する人文字認識結果56aが決定した際、人文字認識結果取得部50は、一連の処理に関与した評価者について、仮認識結果が人文字認識結果56aと一致する確率に関する評価者信頼度を記憶または更新する。図7は、図1に示す人文字認識結果取得部50の評価者データベース52aに記憶される評価者信頼度52a1~52a6を示す概念図である。評価者データベース52aには、各評価者の評価者信頼度52a1~52a6が記憶されている。なお、評価者データベース52aには、各評価者のログイン時間や処理数など、評価者に関する他の情報が記憶されている。
After step S007 or step S010, the process proceeds to step S011, and the process of obtaining the human
また、図10等では、2人の評価者を選定して人文字認識結果56aを取得する処理を例示して人文字認識結果を取得するステップを説明したが、選定する評価者は2人には限定されず、1人であってもよく、3人以上であってもよい。たとえば、1人の評価者により人文字認識結果56aの取得を行う場合は、図4に示す画面によって評価者が入力した結果により、人文字認識結果56aの認定を行う。
Also, in FIG. 10 and the like, the step of acquiring the human character recognition result is explained by exemplifying the process of selecting two evaluators and acquiring the human
図1に示す人文字認識結果取得部50により人文字認識結果56aの取得が行われた後、評価システム10では、採点部60により、機械文字認識結果31a~33aの採点が実施される。採点部60は、正誤判定部62と、正解率演算部64と、機械文字認識結果31aの正誤62aおよび正解率64aを記憶する記憶部を有する。
After the human
図1に示す採点部60の正誤判定部62は、図2(a)に示すように、5つの機械文字認識結果31a~33aのそれぞれと、人文字認識結果取得部50で取得した人文字認識結果56aとを比較して、各機械文字認識結果31a~33aの正誤62aを判定する。正誤判定部62は、機械文字認識結果31a~33aが人文字認識結果56aに対して一致するものを正答と判定し、機械文字認識結果31a~33aが人文字認識結果56aに対して不一致であるものを誤答と判定する。正誤判定部62は、機械文字認識結果31a~33aの正誤62aを、採点部60の記憶部に記憶させる。図2(b)についても同様である。
The correct/
また、図1に示す採点部60の正解率演算部64は、所定の画像データ20aに対する複数の機械文字認識結果31a~33aのうち、所定の画像データ20aに対して正しい文字認識を行うことができた文字認識プログラムによるものの割合を示す正解率64aを算出し、採点部60の記憶部に記憶させる。図2(a)に示すように、手書き文字である「日本太郎」という画像データ20aに関しては、5つの異なる文字認識プログラムに対応する機械文字認識結果31a~33aのうち、3つが正答であり、2つが誤答である。すなわち、「日本太郎」という画像データ20aに関しては、評価対象である5つの文字認識プログラムのうち、60%にあたる3つの文字認識プログラムが正答しているので、算出される正解率64aは60%である。
Further, the accuracy
一方、図2(b)に示すように、手書き文字である「同上」という画像データ20aに関しては、5つの異なる文字認識プログラムに対応する機械文字認識結果31a~33aのうち、1つが正答であり、4つが誤答であるため、算出される正解率64aは20%である。図2(a)および図2(b)から理解できるように、所定の画像データ20aについての一致率と正解率64aとを比較した場合、一致率が正解率64aより高い場合と、正解率64aと一致率とが一致する場合とがある。
On the other hand, as shown in FIG. 2B, with respect to the
次に、図1に示す評価システムでは、情報統合部70において、文字認識プログラムの評価結果72bと、機械学習機能付き文字認識プログラム用教師データ72aを、記憶部に記憶する。情報統合部70は、情報処理部72を有しており、情報処理部72が評価システム10の各部が生成した情報を統合することにより、文字認識プログラム評価結果72bおよび教師データ72aを生成する。
Next, in the evaluation system shown in FIG. 1, the
図8は、文字認識プログラム評価結果72bに含まれる情報を示す概念図である。図8に示すように、文字認識プログラム評価結果72bには、画像データ取得部20で取得された画像データ20aと、機械文字認識結果取得部30で取得された機械文字認識結果31a~33aおよび採点部60で取得されたその正誤62aと、人文字認識結果取得部50で取得された人文字認識結果56aと、機械文字認識傾向演算部40で取得された一致率データ42aと、採点部60で取得された正解率64aとが含まれる。
FIG. 8 is a conceptual diagram showing information included in the character recognition
図9は、文字認識プログラム評価結果72bに含まれる情報の具体例を示す概念図である。図9に示すように、文字認識プログラム評価結果72bでは、所定の文字認識プログラムによる第1機械文字認識結果31aおよびその正誤62aと、人文字認識結果56aと、一致率データ42aと、正解率64aとが、対応する画像データ20aに関連づけられて記憶されている。
FIG. 9 is a conceptual diagram showing a specific example of information included in the character recognition
文字認識プログラム評価結果72bは、各画像データ20aについて、正解率64aと一致率という多角的な指標を含むため、その画像データ20aに対する機械文字認識結果の正誤62aについて、多角的かつ有効な知見を得ることができる。図6は、文字認識プログラム評価結果72bに含まれる情報から得られる分析的知見の一例を示す概念図である。
Since the character recognition
たとえば、図6の2行目に示すように、所定の文字認識プログラムが、一致率も正解率も高い画像データに誤答した場合は、その画像データに関する文字認識能力に関して、他の文字認識プログラムに対して相対的劣位であると分析できる。また、図6の3行目に示すように、所定の文字認識プログラムが、一致率が高く正解率が低い画像データに誤答した場合は、その画像データに関する文字認識能力に関して、文字認識プログラムに共通する根本的問題を有すると分析できる。また、図6に示す表の4行目に示すように、所定の文字認識プログラムが、一致率が高く正解率が低い画像データに正答した場合は、その画像データに関する文字認識能力に関して、他の文字認識プログラムには無い革新的優位性を有すると分析できる。 For example, as shown in the second line of FIG. 6, when a predetermined character recognition program gives an incorrect answer to image data with a high matching rate and a high accuracy rate, the character recognition ability for that image data will be evaluated by another character recognition program. It can be analyzed that it is relatively inferior to In addition, as shown in the third line of FIG. 6, when the predetermined character recognition program gives an incorrect answer to image data with a high match rate and a low accuracy rate, the character recognition program will be notified of the character recognition ability for that image data. It can be analyzed as having a common underlying problem. Also, as shown in the fourth row of the table shown in FIG. 6, when the predetermined character recognition program gives a correct answer to image data with a high match rate and a low accuracy rate, the character recognition ability for that image data is evaluated by another program. It can be analyzed that it has an innovative superiority that character recognition programs do not have.
また、図6の5行目に示すように、所定の文字認識プログラムが、一致率も正解率も低い画像データに誤答した場合は、その画像データに関する文字認識能力に関して、文字認識プログラム毎のばらつきが大きく、やや根深い問題を有すると分析できる。また、図6の6行目に示すように、所定の文字認識プログラムが、一致率も正解率も低い画像データに正答した場合は、その画像データに関する文字認識能力に関して、他の文字認識プログラムに対して相対的優位性を有すると分析できる。 Further, as shown in the fifth line of FIG. 6, when a predetermined character recognition program gives an incorrect answer to image data with a low matching rate and a low accuracy rate, the character recognition ability for that image data is determined by each character recognition program. It can be analyzed that there is a large variation and that there is a somewhat deep-seated problem. In addition, as shown in the sixth line of FIG. 6, when a predetermined character recognition program gives a correct answer to image data with a low matching rate and a low accuracy rate, the character recognition ability for that image data is determined by another character recognition program. It can be analyzed that it has a relative advantage over
図1に示す教師データ72aも、図8および図9に示す文字認識プログラム評価結果72bと同様に、人文字認識結果56aと、一致率データ42aと、正解率64aとが、対応する画像データ20aに関連づけられて記憶されている。ただし、教師データ72aは、文字認識プログラム評価結果72bとは異なり、所定の文字認識プログラムによる第1機械文字認識結果31aおよびその正誤62aについては、省略してよい。
As with the character recognition program evaluation results 72b shown in FIGS. 8 and 9, the
教師データ72aも、文字認識プログラム評価結果72bと同様に、各画像データ20aについて、正解率64aと一致率という多角的な指標を含むため、その画像データ20aにより期待される学習効果について、多角的かつ有効な知見を得ることができる。図5は、教師データ72aに含まれる情報から得られる分析的知見の一例を示す概念図である。
As with the character recognition
図5の2行目に示すように、一致率も正解率も高い画像データには、多くの文字認識プログラムが正答できる現状到達レベルを確認する学習効果が期待できる。また、図5の3行目に示すように、一致率が高く正解率が低い画像データには、文字認識プログラムに共通の課題を改善する学習効果が期待できる。また、図5の4行目に示すように、一致率も正解率も低い画像データには、文字認識プログラムごとの個体差が大きい文字の認識を改善する学習効果が期待される。 As shown in the second line of FIG. 5, image data with a high matching rate and a high accuracy rate can be expected to have a learning effect of confirming the current attainment level at which many character recognition programs can give correct answers. In addition, as shown in the third line of FIG. 5, image data with a high match rate and a low accuracy rate can be expected to have a learning effect that improves problems common to character recognition programs. Further, as shown in the fourth line of FIG. 5, image data with a low match rate and a low accuracy rate is expected to have a learning effect of improving character recognition, which has large individual differences between character recognition programs.
以上のように、図1に示すような評価システム10によれば、実際の手書き文字の画像データ20aを、複数の文字認識プログラムが文字認識することにより、現実の手書き文字を文字認識する状況に整合しており、かつ、客観的な評価結果が得られる。また、共通の画像データ20aを複数の文字認識プログラムにより文字認識することにより、1件の人文字認識結果あたりのプログラム評価数を増加させることができるので、評価の効率を高めることができる。
As described above, according to the
10…文字認識プログラムの評価システム(評価システム)
20…画像データ取得部
22…手書き文字
20a…画像データ
30…機械文字認識結果取得部
31…第1文字認識演算部
31a…第1機械文字認識結果
32…第2文字認識演算部
32a…第2機械文字認識結果
33…第3文字認識演算部
33a…第3機械文字認識結果
40…機械文字認識傾向演算部
42…一致率データ取得部
42a…一致率データ
50…人文字認識結果取得部
52…評価者選定部
54…仮認識結果取得部
56…判定部
52a…評価者データベース
52a1~52a6…評価者信頼度
56a…人文字認識結果
58…第1グラフィカルインターフェース
59…第2グラフィカルインターフェース
57…自動判定表示欄
60…採点部
62…正誤判定部
64…正解率演算部
64a…正解率
70…情報統合部
72b…文字認識プログラム評価結果
72a…教師データ
94…評価者端末
10 Evaluation system for character recognition program (evaluation system)
20 Image
Claims (6)
画像データ取得部が、手書き文字の画像データを取得するステップと、
複数の異なる文字認識プログラムによる文字認識演算部が前記画像データに対して文字認識を行い、前記画像データについての前記複数の文字認識プログラムによる文字認識結果である複数の機械文字認識結果を、機械文字認識結果取得部が得るステップと、
一致率データ取得部が、前記画像データから得られる前記複数の機械文字認識結果の一致率に関する一致率データを得るステップと、
人文字認識結果取得部が、前記画像データについての人間の視認による文字認識結果である人文字認識結果を得るステップと、
正解率演算部が、前記複数の機械文字認識結果のそれぞれと、前記人文字認識結果とを比較して、前記複数の機械文字認識結果の正誤を判定するとともに、前記複数の機械文字認識結果の正解率を得るステップと、
情報統合部が、前記画像データと、前記複数の機械文字認識結果のうち少なくとも1つおよびその正誤と、前記人文字認識結果と、前記一致率データと、前記正解率と、が関連付けられた文字認識プログラム評価結果を記憶するステップと、を有する文字認識プログラムの評価方法。 A character recognition program evaluation method by a character recognition program evaluation system,
an image data acquisition unit acquiring image data of handwritten characters;
A character recognition calculation unit using a plurality of different character recognition programs performs character recognition on the image data, and a plurality of machine character recognition results, which are the character recognition results of the plurality of character recognition programs for the image data, are converted into machine characters. a step obtained by the recognition result obtaining unit ;
a matching rate data obtaining unit obtaining matching rate data relating to a matching rate of the plurality of machine character recognition results obtained from the image data;
a step in which a human character recognition result obtaining unit obtains a human character recognition result, which is a character recognition result of the image data visually recognized by a human;
An accuracy rate calculation unit compares each of the plurality of machine character recognition results with the human character recognition result to determine whether the plurality of machine character recognition results are correct or not, and determines whether the plurality of machine character recognition results are correct or not. a step of obtaining an accuracy rate;
The information integration unit generates a character associated with the image data, at least one of the plurality of machine character recognition results and correct/wrong thereof, the human character recognition result, the matching rate data, and the accuracy rate. and a step of storing recognition program evaluation results.
前記少なくとも2人の人間から得られた文字認識結果である仮認識結果を判定するステップと、をさらに有し、
前記仮認識結果を判定するステップでは、前記人文字認識結果取得部が、前記仮認識結果が互いに一致する場合には前記仮認識結果を前記人文字認識結果として認定し、前記仮認識結果が互いに一致しない場合は少なくとも2人の人間を評価者として選定するステップに戻る請求項1に記載の文字認識プログラムの評価方法。 In the step of obtaining the human character recognition result, the human character recognition result acquisition unit selects at least two humans as evaluators;
determining tentative recognition results that are character recognition results obtained from the at least two humans;
In the step of judging the provisional recognition result, the human-character recognition result acquisition unit recognizes the provisional recognition result as the human-character recognition result when the provisional recognition results match each other; 2. The method of evaluating a character recognition program according to claim 1, wherein if there is no match, the process returns to the step of selecting at least two persons as evaluators.
前記少なくとも2人の人間を評価者として選定するステップでは、前記人文字認識結果取得部が、前記一致率データと、前記評価者信頼度とを用いて、少なくとも2人の人間を評価者として選定する請求項2に記載の文字認識プログラムの評価方法。 In the step of obtaining the human character recognition result, the human character recognition result acquisition unit stores an evaluator confidence level regarding the probability that the temporary recognition result of each evaluator matches the human character recognition result,
In the step of selecting at least two people as evaluators, the human character recognition result acquisition unit selects at least two people as evaluators using the matching rate data and the evaluator reliability. 3. The character recognition program evaluation method according to claim 2.
複数の異なる文字認識プログラムが前記画像データに対して文字認識を行い、前記画像データについての前記複数の文字認識プログラムによる文字認識結果である複数の機械文字認識結果を得る機械文字認識結果取得部と、
前記画像データから得られる前記複数の機械文字認識結果の一致率に関する一致率データを得る一致率データ取得部と、
前記画像データについての人間の視認による文字認識結果である人文字認識結果を得る人文字認識結果取得部と、
前記複数の機械文字認識結果のそれぞれと、前記人文字認識結果とを比較して、前記複数の機械文字認識結果の正誤を判定する正誤判定部および前記複数の機械文字認識結果の正解率を得る正解率演算部と、
前記画像データと、前記複数の機械文字認識結果のうち少なくとも1つおよびその正誤と、前記人文字認識結果と、前記一致率データと、前記正解率と、が関連付けられた文字認識プログラム評価結果を記憶する評価結果記憶部と、を有する文字認識プログラムの評価システム。 an image data acquisition unit that acquires image data of handwritten characters;
a machine character recognition result acquisition unit for obtaining a plurality of machine character recognition results, which are character recognition results of the image data by a plurality of different character recognition programs performing character recognition on the image data by the plurality of character recognition programs; ,
a matching rate data obtaining unit for obtaining matching rate data relating to the matching rates of the plurality of machine character recognition results obtained from the image data;
a human character recognition result obtaining unit for obtaining a human character recognition result, which is a character recognition result of the image data visually recognized by a human;
Each of the plurality of machine character recognition results and the human character recognition result are compared to obtain a correctness determination unit for determining whether the plurality of machine character recognition results are correct and an accuracy rate of the plurality of machine character recognition results. an accuracy rate calculator;
a character recognition program evaluation result in which the image data, at least one of the plurality of machine character recognition results and correct/incorrect thereof, the human character recognition result, the matching rate data, and the accuracy rate are associated with each other; An evaluation system for a character recognition program, comprising: an evaluation result storage unit for storing.
画像データ取得部が、手書き文字の画像データを取得するステップと、
複数の異なる文字認識プログラムが前記画像データに対して文字認識を行い、前記画像データについての前記複数の文字認識プログラムによる文字認識結果である複数の機械文字認識結果を機械文字認識結果取得部が得るステップと、
一致率データ取得部が、前記画像データから得られる前記複数の機械文字認識結果の一致率に関する一致率データを得るステップと、
人文字認識結果取得部が、前記画像データについての人間の視認による文字認識結果である人文字認識結果を得るステップと、
正解率演算部が、前記複数の機械文字認識結果のそれぞれと、前記人文字認識結果とを比較して、前記複数の機械文字認識結果の正誤を判定するとともに、前記複数の文字認識プログラムの正解率を得るステップと、
情報統合部が、前記画像データと、前記人文字認識結果と、前記一致率データと、前記正解率が関連付けられた教師データを記憶するステップと、を有する文字認識プログラム用教師データの製造方法。
A method for producing teacher data for a character recognition program using a character recognition program evaluation system,
an image data acquisition unit acquiring image data of handwritten characters;
A plurality of different character recognition programs perform character recognition on the image data, and a machine character recognition result acquisition unit obtains a plurality of machine character recognition results, which are character recognition results of the image data by the plurality of character recognition programs. a step;
a matching rate data obtaining unit obtaining matching rate data relating to a matching rate of the plurality of machine character recognition results obtained from the image data;
a step in which a human character recognition result obtaining unit obtains a human character recognition result, which is a character recognition result of the image data visually recognized by a human;
A correctness rate calculation unit compares each of the plurality of machine character recognition results with the human character recognition result to determine whether the plurality of machine character recognition results are correct or not, and determines whether the plurality of character recognition programs are correct. obtaining a rate;
A method for producing teaching data for a character recognition program , wherein an information integration unit stores teaching data associated with the image data, the human character recognition result, the matching rate data, and the accuracy rate.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022099004A JP7184411B1 (en) | 2022-06-20 | 2022-06-20 | Character Recognition Program Evaluation Method, Character Recognition Program Evaluation System, and Method of Manufacturing Teacher Data for Character Recognition Program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022099004A JP7184411B1 (en) | 2022-06-20 | 2022-06-20 | Character Recognition Program Evaluation Method, Character Recognition Program Evaluation System, and Method of Manufacturing Teacher Data for Character Recognition Program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7184411B1 true JP7184411B1 (en) | 2022-12-06 |
JP2024000290A JP2024000290A (en) | 2024-01-05 |
Family
ID=84327863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022099004A Active JP7184411B1 (en) | 2022-06-20 | 2022-06-20 | Character Recognition Program Evaluation Method, Character Recognition Program Evaluation System, and Method of Manufacturing Teacher Data for Character Recognition Program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7184411B1 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001084336A (en) | 1999-09-16 | 2001-03-30 | Fujitsu Ltd | Character recognition apparatus and method and program recording medium |
JP2001297306A (en) | 2000-04-12 | 2001-10-26 | Oki Electric Ind Co Ltd | Character recognizing device |
JP2010073201A (en) | 2008-08-20 | 2010-04-02 | Hammock:Kk | Ocr system |
JP2019159374A (en) | 2018-03-07 | 2019-09-19 | 富士ゼロックス株式会社 | Information processing apparatus and program |
WO2019225157A1 (en) | 2018-05-25 | 2019-11-28 | 株式会社ふくおかフィナンシャルグループ | Ledger sheet recognition system |
-
2022
- 2022-06-20 JP JP2022099004A patent/JP7184411B1/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001084336A (en) | 1999-09-16 | 2001-03-30 | Fujitsu Ltd | Character recognition apparatus and method and program recording medium |
JP2001297306A (en) | 2000-04-12 | 2001-10-26 | Oki Electric Ind Co Ltd | Character recognizing device |
JP2010073201A (en) | 2008-08-20 | 2010-04-02 | Hammock:Kk | Ocr system |
JP2019159374A (en) | 2018-03-07 | 2019-09-19 | 富士ゼロックス株式会社 | Information processing apparatus and program |
WO2019225157A1 (en) | 2018-05-25 | 2019-11-28 | 株式会社ふくおかフィナンシャルグループ | Ledger sheet recognition system |
Non-Patent Citations (2)
Title |
---|
Shunichi Kimura et al.,"A Man-Machine Cooperating System Based on the Generalized Reject Model",2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR),米国,IEEE,2017年11月09日,pp.1324-1329 |
小西 晃治、佐藤 雅史,"5万円以下のOCRソフト12本を比較する",DOS/V magazine,日本,ソフトバンクパブリッシング株式会社,1999年09月01日,Vol.8, No.17,pp.145-157 |
Also Published As
Publication number | Publication date |
---|---|
JP2024000290A (en) | 2024-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102194837B1 (en) | Method and apparatus for answering knowledge-based question | |
US20160132815A1 (en) | Skill estimation method in machine-human hybrid crowdsourcing | |
CN111753767A (en) | Method and device for automatically correcting operation, electronic equipment and storage medium | |
CN109902665A (en) | Similar face retrieval method, apparatus and storage medium | |
US20060246410A1 (en) | Learning support system and learning support program | |
CN110659311B (en) | Topic pushing method and device, electronic equipment and storage medium | |
CN109993102A (en) | Similar face retrieval method, apparatus and storage medium | |
CN110263133B (en) | Knowledge graph-based question and answer method, electronic device, equipment and storage medium | |
CN112215175B (en) | Handwritten character recognition method, device, computer equipment and storage medium | |
CN113705092B (en) | Disease prediction method and device based on machine learning | |
CN115205764B (en) | Online learning concentration monitoring method, system and medium based on machine vision | |
US20240177624A1 (en) | Learning management systems and methods therefor | |
JP7491370B2 (en) | OBJECT RECOGNITION DEVICE, OBJECT RECOGNITION METHOD, LEARNING DEVICE, LEARNING METHOD, AND PROGRAM | |
CN111582405B (en) | Data labeling method and device | |
CN114971425B (en) | Database information monitoring method, device, equipment and storage medium | |
CN114399827B (en) | College graduate career character testing method and system based on facial micro-expression | |
CN111612659B (en) | Automatic scoring system and scoring method for online financial examination | |
CN111444906A (en) | Image recognition method based on artificial intelligence and related device | |
JP7184411B1 (en) | Character Recognition Program Evaluation Method, Character Recognition Program Evaluation System, and Method of Manufacturing Teacher Data for Character Recognition Program | |
CN115100007A (en) | Online teaching management method and system based on artificial intelligence | |
CN113780365A (en) | Sample generation method and device | |
Jennifer et al. | Feels bad man: Dissecting automated hateful meme detection through the lens of facebook's challenge | |
CN117313943A (en) | Test question accuracy prediction method, system, equipment and storage medium | |
CN116955598A (en) | Method, device, equipment, medium and program product for generating event summary text | |
JP6930754B2 (en) | Learning support device and questioning method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220620 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220622 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220809 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7184411 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |