[go: up one dir, main page]

JP7184411B1 - Character Recognition Program Evaluation Method, Character Recognition Program Evaluation System, and Method of Manufacturing Teacher Data for Character Recognition Program - Google Patents

Character Recognition Program Evaluation Method, Character Recognition Program Evaluation System, and Method of Manufacturing Teacher Data for Character Recognition Program Download PDF

Info

Publication number
JP7184411B1
JP7184411B1 JP2022099004A JP2022099004A JP7184411B1 JP 7184411 B1 JP7184411 B1 JP 7184411B1 JP 2022099004 A JP2022099004 A JP 2022099004A JP 2022099004 A JP2022099004 A JP 2022099004A JP 7184411 B1 JP7184411 B1 JP 7184411B1
Authority
JP
Japan
Prior art keywords
character recognition
image data
human
recognition result
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022099004A
Other languages
Japanese (ja)
Other versions
JP2024000290A (en
Inventor
健彦 深山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2022099004A priority Critical patent/JP7184411B1/en
Application granted granted Critical
Publication of JP7184411B1 publication Critical patent/JP7184411B1/en
Publication of JP2024000290A publication Critical patent/JP2024000290A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

Figure 0007184411000001

【課題】文字認識プログラムを客観的に評価することができる文字認識プログラムの評価方法。
【解決手段】手書き文字の画像データを取得するステップと、複数の異なる文字認識プログラムによる文字認識演算部が複数の機械文字認識結果を得るステップと、前記画像データから得られる前記複数の機械文字認識結果の一致率に関する一致率データを得るステップと、前記画像データについての人間の視認による文字認識結果である人文字認識結果を得るステップと、前記複数の機械文字認識結果の正誤を判定するとともに、前記複数の機械文字認識結果の正解率を得るステップと、前記画像データと、前記複数の機械文字認識結果のうち少なくとも1つおよびその正誤と、前記人文字認識結果と、前記一致率データと、前記正解率と、が関連付けられた文字認識プログラム評価結果を記憶するステップと、を有する文字認識プログラムの評価方法。
【選択図】図1

Figure 0007184411000001

A character recognition program evaluation method capable of objectively evaluating a character recognition program.
A step of obtaining image data of a handwritten character, a step of obtaining a plurality of machine character recognition results by a character recognition calculation unit using a plurality of different character recognition programs, and a step of obtaining a plurality of machine character recognition results from the image data. a step of obtaining matching rate data regarding a matching rate of a result; a step of obtaining a human character recognition result that is a result of character recognition by human visual recognition of the image data; determining whether the plurality of machine character recognition results are correct or not; a step of obtaining an accuracy rate of the plurality of machine character recognition results; the image data; at least one of the plurality of machine character recognition results and correct/wrong thereof; the human character recognition result; and a step of storing character recognition program evaluation results associated with the accuracy rate.
[Selection drawing] Fig. 1

Description

本発明は、OCRに用いられる文字認識プログラムの評価方法、文字認識プログラムの評価システムおよび文字認識プログラム用教師データの製造方法に関する。 The present invention relates to a character recognition program evaluation method used in OCR, a character recognition program evaluation system, and a method of producing teacher data for a character recognition program.

近年、いわゆるOCR(Optical Character Recognition)と呼ばれる技術が、多様な分野で使われている。また、OCRでは、文字を認識する際のプログラム(アルゴリズム)を、機械学習により改良する技術なども提案されている。たとえば、教師データに含まれる画像データ(文字を含む)を、学習対象であるプログラムに文字認識させるとともに、画像データの正しい文字認識結果(正解)を、対象プラグラムの学習機能部分に伝えることにより、プログラムの文字認識における正解率向上が期待される。 In recent years, a technique called OCR (Optical Character Recognition) has been used in various fields. In addition, in OCR, techniques such as improving the program (algorithm) for recognizing characters by machine learning have been proposed. For example, image data (including characters) contained in training data can be recognized by the program to be learned, and the correct character recognition result (correct answer) of the image data can be conveyed to the learning function part of the target program. It is expected to improve accuracy rate in program character recognition.

ここで、従来の文字認識プログラムは、印刷文字に対する文字認識精度はかなり高いものの、手書き文字に対する文字認識精度については、印刷文字に対するそれよりかなり低く、その向上が期待されている。しかしながら、手書き文字は、書き手の個性に依存して極めて多様であり、しかも、シチュエーションに応じて、略字などの省略記載が頻繁に行われる。このような手書き文字の多様性を背景として、特定のプログラムの手書き文字に対する文字認識精度を客観的に評価することが難しいことや、手書き文字に対する文字認識精度を高めるために有効な教師データが得られないことが、文字認識プログラムによる手書き文字の文字認識精度の向上を妨げている。 Here, conventional character recognition programs have a fairly high character recognition accuracy for printed characters, but the character recognition accuracy for handwritten characters is considerably lower than that for printed characters, and an improvement is expected. However, handwritten characters are extremely diverse depending on the personality of the writer, and abbreviations such as abbreviated characters are frequently used depending on the situation. Against the background of such diversity of handwritten characters, it is difficult to objectively evaluate the character recognition accuracy of a specific program for handwritten characters. The inability to do so prevents character recognition programs from improving the character recognition accuracy of handwritten characters.

特許5464474号明細書Patent No. 5464474

本発明は、文字認識プログラムを客観的に評価することができる文字認識プログラムの評価方法や評価システムおよび手書き文字に対する文字認識精度を高めるために有効な教師データの製造方法に関する。 The present invention relates to a character recognition program evaluation method and evaluation system capable of objectively evaluating a character recognition program, and to a method of producing teaching data effective for improving character recognition accuracy for handwritten characters.

本発明に係る文字認識プログラムの評価方法は、
手書き文字の画像データを取得するステップと、
複数の異なる文字認識プログラムによる文字認識演算部が前記画像データに対して文字認識を行い、前記画像データについての前記複数の文字認識プログラムによる文字認識結果である複数の機械文字認識結果を得るステップと、
前記画像データから得られる前記複数の機械文字認識結果の一致率に関する一致率データを得るステップと、
前記画像データについての人間の視認による文字認識結果である人文字認識結果を得るステップと、
前記複数の機械文字認識結果のそれぞれと、前記人文字認識結果とを比較して、前記複数の機械文字認識結果の正誤を判定するとともに、前記複数の機械文字認識結果の正解率を得るステップと、
前記画像データと、前記複数の機械文字認識結果のうち少なくとも1つおよびその正誤と、前記人文字認識結果と、前記一致率データと、前記正解率と、が関連付けられた文字認識プログラム評価結果を記憶するステップと、を有する。
A character recognition program evaluation method according to the present invention includes:
obtaining image data of handwritten characters;
a step of performing character recognition on the image data by a character recognition calculation unit using a plurality of different character recognition programs to obtain a plurality of machine character recognition results, which are character recognition results of the image data by the plurality of character recognition programs; ,
obtaining match rate data relating to the match rate of the plurality of machine character recognition results obtained from the image data;
a step of obtaining a human character recognition result, which is a character recognition result by human visual recognition of the image data;
comparing each of the plurality of machine character recognition results with the human character recognition result to determine whether the plurality of machine character recognition results are correct or not, and obtaining an accuracy rate of the plurality of machine character recognition results; ,
a character recognition program evaluation result in which the image data, at least one of the plurality of machine character recognition results and correct/incorrect thereof, the human character recognition result, the matching rate data, and the accuracy rate are associated with each other; and storing.

本発明に係る文字認識プログラムの評価方法によれば、実際の手書き文字の画像データを、複数の文字認識プログラムが文字認識することにより、現実の手書き文字に対する文字認識の状況に整合しており、かつ、客観的である評価結果が得られる。また、共通の画像データを、複数の文字認識プログラムにより文字認識することにより、評価の効率を高めることができる。また、各画像データについて、正解率と一致率という多角的な指標が得られるため、その画像データに対する機械文字認識結果の正誤について、多角的かつ有効な知見を得ることができる。 According to the character recognition program evaluation method according to the present invention, image data of actual handwritten characters are subjected to character recognition by a plurality of character recognition programs. Moreover, an objective evaluation result can be obtained. In addition, evaluation efficiency can be improved by recognizing common image data using a plurality of character recognition programs. In addition, since multifaceted indices such as the accuracy rate and the matching rate can be obtained for each image data, multifaceted and effective knowledge can be obtained as to whether the machine character recognition result for the image data is correct or incorrect.

また、たとえば、前記人文字認識結果を得るステップでは、少なくとも2人の人間を評価者として選定するステップと、
前記少なくとも2人の人間から得られた文字認識結果である仮認識結果を判定するステップと、を有してもよく、
前記仮認識結果を判定するステップでは、前記仮認識結果が互いに一致する場合には前記仮認識結果を前記人文字認識結果として認定し、前記仮認識結果が互いに一致しない場合は少なくとも2人の人間を評価者として選定するステップに戻ってもよい。
Further, for example, in the step of obtaining the human character recognition result, selecting at least two humans as evaluators;
determining tentative recognition results that are character recognition results obtained from the at least two humans;
In the step of determining the provisional recognition result, if the provisional recognition results match each other, the provisional recognition result is recognized as the human character recognition result, and if the provisional recognition results do not match, at least two people may return to the step of selecting as the evaluator.

このような文字認識プログラムの評価方法では、人間である評価者の文字認識結果のばらつきに起因する評価結果の誤差を、効果的に抑制することができる。 In such a character recognition program evaluation method, it is possible to effectively suppress errors in evaluation results caused by variations in the character recognition results of human evaluators.

また、たとえば、前記人文字認識結果を得るステップでは、各評価者の仮認識結果が前記人文字認識結果と一致する確率に関する評価者信頼度を記憶するステップを含み、
前記少なくとも2人の人間を評価者として選定するステップでは、前記一致率データと、前記評価者信頼度とを用いて、少なくとも2人の人間を評価者として選定してもよい。
Further, for example, the step of obtaining the human character recognition result includes a step of storing an evaluator confidence level relating to the probability that the temporary recognition result of each evaluator matches the human character recognition result,
In the step of selecting at least two persons as evaluators, at least two persons may be selected as evaluators using the matching rate data and the evaluator reliability.

このような文字認識プログラムの評価方法では、たとえば一致率の高い画像データに対しては評価信頼度の高い人間を優先して評価者に選定し、一致率の低い画像データに対しては評価信頼度の低い人間を優先して評価者に選定することで、人文字認識結果の取得効率を向上させることができる。人間による人文字認識結果を得るステップでは、一致率の高い画像データに対する評価を行うシチュエーションの方が、評価効率や評価精度に、評価者の能力差が現れやすいからである。 In the evaluation method of such a character recognition program, for example, for image data with a high matching rate, a person with a high evaluation reliability is given priority and selected as an evaluator, and for image data with a low matching rate, the evaluation reliability is selected. By preferentially selecting a person with a low degree of accuracy as an evaluator, it is possible to improve the efficiency of obtaining human character recognition results. This is because, in the step of obtaining human character recognition results, differences in the abilities of evaluators are more likely to appear in evaluation efficiency and evaluation accuracy in situations where image data with a high matching rate is evaluated.

また、たとえば、前記人文字認識結果を得るステップでは、前記画像データと、前記複数の機械文字認識結果と、前記複数の機械文字認識結果のいずれかを前記人文字認識結果またはその候補として選択可能なグラフィカルインターフェースと、を評価者の端末に表示してもよい。 Further, for example, in the step of obtaining the human character recognition result, any one of the image data, the plurality of machine character recognition results, and the plurality of machine character recognition results can be selected as the human character recognition result or a candidate thereof. A graphical interface may be displayed on the evaluator's terminal.

このような文字認識プログラムの評価方法では、評価者による入力作業量を抑制し、人間による人文字認識結果を得るステップの効率を高めることができる。 In such a character recognition program evaluation method, it is possible to reduce the amount of input work by the evaluator and improve the efficiency of the step of obtaining human character recognition results by humans.

また、本発明に係る文字認識プログラムの評価システムでは、手書き文字の画像データを取得する画像データ取得部と、
複数の異なる文字認識プログラムが前記画像データに対して文字認識を行い、前記画像データについての前記複数の文字認識プログラムによる文字認識結果である複数の機械文字認識結果を得る機械文字認識結果取得部と、
前記画像データから得られる前記複数の機械文字認識結果の一致率に関する一致率データを得る一致率データ取得部と、
前記画像データについての人間の視認による文字認識結果である人文字認識結果を得る人文字認識結果取得部と、
前記複数の機械文字認識結果のそれぞれと、前記人文字認識結果とを比較して、前記複数の機械文字認識結果の正誤を判定する正誤判定部および前記複数の機械文字認識結果の正解率を得る正解率演算部と、
前記画像データと、前記複数の機械文字認識結果のうち少なくとも1つおよびその正誤と、前記人文字認識結果と、前記一致率データと、前記正解率と、が関連付けられた文字認識プログラム評価結果を記憶する評価結果記憶部と、を有する。
Further, in the character recognition program evaluation system according to the present invention, an image data acquisition unit for acquiring image data of handwritten characters;
a machine character recognition result acquisition unit for obtaining a plurality of machine character recognition results, which are character recognition results of the image data by a plurality of different character recognition programs performing character recognition on the image data by the plurality of character recognition programs; ,
a matching rate data obtaining unit for obtaining matching rate data relating to the matching rates of the plurality of machine character recognition results obtained from the image data;
a human character recognition result obtaining unit for obtaining a human character recognition result, which is a character recognition result of the image data visually recognized by a human;
Each of the plurality of machine character recognition results and the human character recognition result are compared to obtain a correctness determination unit for determining whether the plurality of machine character recognition results are correct and an accuracy rate of the plurality of machine character recognition results. an accuracy rate calculator;
a character recognition program evaluation result in which the image data, at least one of the plurality of machine character recognition results and correct/incorrect thereof, the human character recognition result, the matching rate data, and the accuracy rate are associated with each other; and an evaluation result storage unit for storing.

また、本発明に係る文字認識プログラム用教師データの製造方法では、手書き文字の画像データを取得するステップと、
複数の異なる文字認識プログラムが前記画像データに対して文字認識を行い、前記画像データについての前記複数の文字認識プログラムによる文字認識結果である複数の機械文字認識結果を得るステップと、
前記画像データから得られる前記複数の機械文字認識結果の一致率に関する一致率データを得るステップと、
前記画像データについての人間の視認による文字認識結果である人文字認識結果を得るステップと、
前記複数の機械文字認識結果のそれぞれと、前記人文字認識結果とを比較して、前記複数の機械文字認識結果の正誤を判定するとともに、前記複数の文字認識プログラムのうち前記画像データに対して正しい文字認識を行えた文字認識プログラムの割合を表す正解率を得るステップと、
前記画像データと、前記人文字認識結果と、前記一致率データと、前記正解率が関連付けられた教師データを記憶するステップと、を有する。
Further, in a method for producing teacher data for a character recognition program according to the present invention, a step of obtaining image data of handwritten characters;
a step of performing character recognition on the image data by a plurality of different character recognition programs to obtain a plurality of machine character recognition results, which are character recognition results of the image data by the plurality of character recognition programs;
obtaining match rate data relating to the match rate of the plurality of machine character recognition results obtained from the image data;
a step of obtaining a human character recognition result, which is a character recognition result by human visual recognition of the image data;
each of the plurality of machine character recognition results and the human character recognition result are compared to determine whether the plurality of machine character recognition results are correct or not; a step of obtaining an accuracy rate representing the percentage of character recognition programs that performed correct character recognition;
and storing the image data, the human character recognition result, the match rate data, and teacher data associated with the correct rate.

本発明に係る文字認識プログラム用教師データの製造方法によれば、実際の手書き文字の画像データを、複数の文字認識プログラムが文字認識することにより製造することで、現実の手書き文字を文字認識の状況に整合しており、かつ、学習効果の高い教師データを製造できる。また、共通の画像データを、複数の文字認識プログラムにより文字認識することにより、教師データの製造効率を高めることができる。また、教師データに含まれる画像データについて、正解率と一致率という多角的な指標が付いているため、教師データを用いることにより期待される学習効果について、多角的かつ有効な知見を得ることができる。 According to the method for producing teacher data for a character recognition program according to the present invention, image data of actual handwritten characters are produced through character recognition by a plurality of character recognition programs, so that actual handwritten characters are used for character recognition. It is possible to produce teacher data that is consistent with the situation and has a high learning effect. Further, by recognizing common image data using a plurality of character recognition programs, the production efficiency of teacher data can be improved. In addition, since the image data included in the training data has multifaceted indices such as the accuracy rate and the matching rate, it is possible to obtain multifaceted and effective knowledge about the expected learning effect of using the training data. can.

開示される技術は、複数の人工知能の結果を同時に評価するシステム(A system that simultaneously evaluates the results of multiple artificial intelligences)に関する内容を含む。また、複数の人工知能(Multiple Artificial Intelligence)、自動処理結果(Automatic processing results)、合理的な変更(Reasonable modifications)、インテジェンスデータの生成(Intelligence data generation)、修正の自動処理(Automatic processing of corrections)に関連する知見を含む。 The disclosed technology includes content related to a system that simultaneously evaluates the results of multiple artificial intelligences. Also, Multiple Artificial Intelligence, Automatic processing results, Reasonable modifications, Intelligence data generation, Automatic processing of corrections ), including findings related to

図1は、本発明の一実施形態に係る文字認識プログラムの評価方法を行う文字認識プログラム評価システムの概念図である。FIG. 1 is a conceptual diagram of a character recognition program evaluation system that performs a character recognition program evaluation method according to an embodiment of the present invention. 図2は、文字認識プログラムの評価方法により得られる情報の一例を表す概念図である。FIG. 2 is a conceptual diagram showing an example of information obtained by the character recognition program evaluation method. 図3は、人文字認識結果を得るステップにおける評価者の選定基準の一例を示す概念図である。FIG. 3 is a conceptual diagram showing an example of evaluator selection criteria in the step of obtaining human character recognition results. 図4は、人文字認識結果を得るステップにおける評価者の入力方法を説明する概念図である。FIG. 4 is a conceptual diagram illustrating an evaluator's input method in the step of obtaining human character recognition results. 図5は、教師データに含まれる画像データの文字認識上の性質の一例を示す概念図である。FIG. 5 is a conceptual diagram showing an example of character recognition properties of image data included in training data. 図6は、評価結果に含まれる情報から得られる分析的知見の一例を示す概念図である。FIG. 6 is a conceptual diagram showing an example of analytical knowledge obtained from information included in evaluation results. 図7は、評価者の信頼度情報を記憶する信頼度情報記憶部を示す概念図である。FIG. 7 is a conceptual diagram showing a reliability information storage unit that stores reliability information of evaluators. 図8は、評価結果および教師データに含まれる情報を示す概念図である。FIG. 8 is a conceptual diagram showing information included in evaluation results and teacher data. 図9は、評価結果および教師データに含まれる情報の具体例を示す概念図である。FIG. 9 is a conceptual diagram showing a specific example of information included in evaluation results and teacher data. 図10は、人文字認識結果を得るステップにおける処理の一例を示すフローチャートである。FIG. 10 is a flow chart showing an example of processing in the step of obtaining a human character recognition result.

図1は、本発明の一実施形態に係る文字認識プログラムの評価方法を行う文字認識プログラム評価システム10を示す概念図である。図1に示すように、文字認識プログラム評価システム10は、画像データ取得部20、機械文字認識結果取得部30、機械文字認識傾向演算部40、人文字認識結果取得部50、採点部60、情報統合部70等を有する。 FIG. 1 is a conceptual diagram showing a character recognition program evaluation system 10 that performs a character recognition program evaluation method according to an embodiment of the present invention. As shown in FIG. 1, the character recognition program evaluation system 10 includes an image data acquisition unit 20, a machine character recognition result acquisition unit 30, a machine character recognition tendency calculation unit 40, a human character recognition result acquisition unit 50, a scoring unit 60, an information It has an integration unit 70 and the like.

文字認識プログラム評価システム10は、演算処理を行う演算部や、情報の記憶を行う記憶部や、他のサーバや端末との通信を行う通信部などを有し、物理サーバやクラウド・コンピューティングによる仮想サーバ等によって実現される。また、文字認識プログラム評価システム10に含まれる各種演算部や記憶部等は、1か所に集中して配置されていてもよく、通信ネットワークを介して分散して配置されていてもよい。 The character recognition program evaluation system 10 has an arithmetic unit that performs arithmetic processing, a storage unit that stores information, a communication unit that communicates with other servers and terminals, and the like, and is based on physical servers and cloud computing. It is implemented by a virtual server or the like. Moreover, various calculation units, storage units, and the like included in the character recognition program evaluation system 10 may be centrally arranged in one place, or may be arranged dispersedly via a communication network.

以下、文字認識プログラム評価システム10による文字認識プログラムの評価方法および文字認識プログラム用教師データの製造方法について、具体例を挙げて説明を行う。ただし、文字認識プログラム評価システム10による文字認識プログラムの評価方法および文字認識プログラム用教師データの製造方法は、これらの具体例のみに限定されるものではない。 Hereinafter, a method for evaluating a character recognition program and a method for producing teacher data for a character recognition program by the character recognition program evaluation system 10 will be described with specific examples. However, the character recognition program evaluation method and the character recognition program teacher data production method by the character recognition program evaluation system 10 are not limited to these specific examples.

文字認識プログラム評価システム10による評価方法等においては、まず、画像データ取得部20において、手書き文字の画像データ20aを取得するステップが行われる。画像データ取得部20は、スキャナやカメラ等の読取部24を有しており、帳票22等に記載の文字を読み取り、画像データ20aを取得する。取得された画像データ20aは、画像データ20の記憶部等に保存される。取得される画像データ20aの数や、画像データ20aに含まれる文字数などは、特に限定されない。 In the evaluation method and the like by the character recognition program evaluation system 10, first, in the image data acquisition unit 20, a step of acquiring image data 20a of handwritten characters is performed. The image data acquisition unit 20 has a reading unit 24 such as a scanner or a camera, and reads characters written on the form 22 or the like to acquire image data 20a. The acquired image data 20a is stored in the storage unit of the image data 20 or the like. The number of image data 20a to be acquired and the number of characters included in the image data 20a are not particularly limited.

画像データ20aとして取得される手書き文字は、帳票22のみには限定されず、各種申込書、手紙、挨拶状などの他の書面に含まれる手書き文字であってもよい。ただし、画像データ20aとして取得される手書き文字は、何らかの実用的な目的で手書きされたものであることが好ましい。実用的な目的で書かれた手書き文字を用いることにより、評価システム10により得られる評価結果が、文字認識プログラムの実用上の文字認識精度により近いものとなる。 The handwritten characters acquired as the image data 20a are not limited to the forms 22, and may be handwritten characters included in other documents such as various application forms, letters, and greeting cards. However, the handwritten characters acquired as the image data 20a are preferably handwritten for some practical purpose. By using handwritten characters written for practical purposes, the evaluation results obtained by the evaluation system 10 are closer to the practical character recognition accuracy of the character recognition program.

次に、評価システム10では、機械文字認識結果取得部30において、画像データ20aに対して文字認識を行い、文字認識プログラムによる文字認識結果である機械文字認識結果を得るステップが行われる。図1に示すように、機械文字認識結果取得部30は、複数の異なる文字認識プログラムによる文字認識演算部である第1文字認識演算部31、第2文字認識演算部32、第3文字認識演算部33を有する。 Next, in the evaluation system 10, the machine character recognition result obtaining unit 30 performs character recognition on the image data 20a, and obtains the machine character recognition result, which is the character recognition result by the character recognition program. As shown in FIG. 1, the machine character recognition result acquisition unit 30 includes a first character recognition calculation unit 31, a second character recognition calculation unit 32, a third character recognition calculation unit, which are character recognition calculation units using a plurality of different character recognition programs. It has a part 33 .

それぞれの第1文字認識演算部31、第2文字認識演算部32、第3文字認識演算部33は、互いに異なる文字認識プログラムによって制御されており、互いに異なるアルゴリズムで、共通の画像データ20aに対して文字認識を行う。これにより、機械文字認識結果取得部30では、画像データ20aについての複数の文字認識プログラムによる文字認識結果である第1機械文字認識結果31a、第2機械文字認識結果32a、第3機械文字認識結果33aを得る。 The first character recognition calculation unit 31, the second character recognition calculation unit 32, and the third character recognition calculation unit 33 are controlled by mutually different character recognition programs. character recognition. As a result, the machine character recognition result acquisition unit 30 obtains a first machine character recognition result 31a, a second machine character recognition result 32a, and a third machine character recognition result, which are character recognition results obtained by a plurality of character recognition programs for the image data 20a. 33a is obtained.

図1に示すように、機械文字認識結果取得部30は、それぞれの第1文字認識演算部31、第2文字認識演算部32、第3文字認識演算部33に対応して独立するデータベースを有することが、演算速度を維持する観点から好ましい。各データベースに、各文字認識演算部31、32、33による文字認識結果である第1~第3機械文字認識結果31a、32a、33aが記憶されるほか、認識対象となる画像データ20aも、各データベースに複製して保存される。これにより、第1文字認識演算部31、第2文字認識演算部32、第3文字認識演算部33によるデータベースからの読み出しおよび書き込みが、それぞれ独立に行われることになるため、機械文字認識結果取得部30での処理速度の向上に資する。 As shown in FIG. 1, the machine character recognition result acquisition unit 30 has independent databases corresponding to the respective first character recognition calculation unit 31, second character recognition calculation unit 32, and third character recognition calculation unit 33. is preferable from the viewpoint of maintaining the computation speed. In each database, the first to third machine character recognition results 31a, 32a, 33a, which are the character recognition results by the character recognition calculation units 31, 32, 33, are stored. It is copied and stored in the database. As a result, reading and writing from the database by the first character recognition calculation unit 31, the second character recognition calculation unit 32, and the third character recognition calculation unit 33 are performed independently of each other. This contributes to improving the processing speed of the unit 30 .

機械文字認識結果取得部30で画像データ20aに対して文字認識を行う文字認識プログラムの数は、複数であれば特に限定されないが、好ましくは3~8192程度、より好ましくは10~256程度である。文字認識プログラムの数が多いほど、評価および教師データ製造の効率が高まるとともに、評価等で得られる一致率や正解率(後述)の客観性が高まる。一方、文字認識プログラムの数を所定数以下とすることにより、評価システム10に必要なリソースが増えすぎることを防止できる。 The number of character recognition programs that perform character recognition on the image data 20a in the machine character recognition result acquisition unit 30 is not particularly limited as long as it is plural, but is preferably about 3 to 8192, more preferably about 10 to 256. . As the number of character recognition programs increases, the efficiency of evaluation and training data production increases, and the objectivity of the matching rate and accuracy rate (described later) obtained in evaluation and the like increases. On the other hand, by limiting the number of character recognition programs to a predetermined number or less, it is possible to prevent the resources required for the evaluation system 10 from increasing excessively.

次に、評価システム10では、機械文字認識傾向演算部40において、画像データ20aから得られる複数の機械文字認識結果31a、32a、33aの一致率に関する一致率データを得るステップを行う。図1に示すように、機械文字認識傾向演算部40は、機械文字認識結果31a、32a、33aの一致率に関する一致率データを得る一致率データ取得部42を有する。 Next, in the evaluation system 10, the machine character recognition tendency calculation unit 40 performs a step of obtaining match rate data regarding the match rates of the plurality of machine character recognition results 31a, 32a, and 33a obtained from the image data 20a. As shown in FIG. 1, the machine character recognition tendency calculation unit 40 has a match rate data acquisition unit 42 for acquiring match rate data relating to the match rates of the machine character recognition results 31a, 32a, and 33a.

図2は、評価システム10による処理により得られる情報の対応関係を示す概念図である。図1に示す一致率データ取得部42は、機械文字認識結果取得部30に含まれる各データベースから第1~第3機械文字認識結果31a~33aを読み出し、一致率データ42aを得る。 FIG. 2 is a conceptual diagram showing a correspondence relationship of information obtained by processing by the evaluation system 10. As shown in FIG. The concordance rate data acquisition unit 42 shown in FIG. 1 reads out the first to third machine character recognition results 31a to 33a from each database included in the machine character recognition result acquisition unit 30, and obtains concordance rate data 42a.

図2(a)では、手書き文字である「日本太郎」という画像データ20aに対して、5つの異なる文字認識演算部31、32、33(第4および第5文字認識演算部は図1において図示を省略)を用いて、5つの機械文字認識結果31a~33aを得た場合を示している。図2(a)に示される5つの機械文字認識結果31a~33aから理解できるように、「日本太郎」という画像データ20aに対して5つの異なる文字認識演算部によって文字認識が行われた結果、3種類の異なる機械文字認識結果が得られ、そのうち最大3つの機械文字認識結果が一致している。 In FIG. 2A, five different character recognition calculation units 31, 32, and 33 (fourth and fifth character recognition calculation units are shown in FIG. are omitted) to obtain five machine character recognition results 31a to 33a. As can be understood from the five machine character recognition results 31a to 33a shown in FIG. 2(a), the image data 20a of "Nippon Taro" was subjected to character recognition by five different character recognition calculation units. Three different machine character recognition results are obtained, of which at most three machine character recognition results agree.

一致率データ取得部42は、図2(a)に示すケースでは、5つの異なる文字認識演算部によって文字認識が行われた結果、最大で3つの機械文字認識結果が一致している。したがって、一致率データ取得部42は、「日本太郎」という画像データ20aに関する一致率を、60%(3/5)であると判断する。 In the case shown in FIG. 2(a), the match rate data acquisition unit 42 matches up to three machine character recognition results as a result of character recognition performed by five different character recognition calculation units. Therefore, the match rate data acquisition unit 42 determines that the match rate for the image data 20a of "Nippon Taro" is 60% (3/5).

一方、図2(b)に示すケースでは、手書き文字である「同上」という画像データ20aに対して3つの異なる文字認識演算部によって文字認識が行われた結果、3種類の異なる機械文字認識結果が得られ、そのうち最大2つの機械文字認識結果が一致している。図2(b)に示すケースでは、5つの異なる文字認識演算部によって文字認識が行われた結果、最大で2つの機械文字認識結果が一致しているため、一致率データ取得部42は、「同上」という画像データ20aに関する一致率を、40%(2/5)であると判断する。 On the other hand, in the case shown in FIG. 2B, three different machine character recognition results are obtained as a result of character recognition performed by three different character recognition calculation units on the image data 20a of handwritten characters "same as above". are obtained, of which at most two machine character recognition results match. In the case shown in FIG. 2B, as a result of character recognition performed by five different character recognition calculation units, a maximum of two machine character recognition results match. The matching rate for the image data 20a of "same as above" is determined to be 40% (2/5).

図2に示すように、一致率データ42aは、文字認識の対象となった画像データ20aごとに算出される。また、一致率データ42aは、共通する画像データ20aに対する複数の機械文字認識結果31a~33aの比較から算出され、一致した機械文字認識結果が正答であるか誤答であるかを問わない。言い換えると、一致率データ42aは、後述する人文字認識結果56aとは関係なく、もしくは、人文字認識結果56aが取得される前に、算出される。 As shown in FIG. 2, matching rate data 42a is calculated for each image data 20a that is the object of character recognition. The matching rate data 42a is calculated by comparing a plurality of machine character recognition results 31a to 33a with respect to the common image data 20a, regardless of whether the matching machine character recognition result is correct or incorrect. In other words, the matching rate data 42a is calculated regardless of the human character recognition result 56a, which will be described later, or before the human character recognition result 56a is obtained.

なお、一致率データ42aは、複数の互いに異なる文字認識プログラムによって文字認識結果を得る場合にのみ、意味のある値(変位する価)となる。なぜなら、1つの文字認識プログラムによって1つの文字認識結果を得るケースでは、一致率は常に100%となるからである。 Note that the matching rate data 42a becomes a meaningful value (value to be shifted) only when character recognition results are obtained by a plurality of mutually different character recognition programs. This is because the match rate is always 100% when one character recognition result is obtained by one character recognition program.

次に、評価システム10では、人文字認識結果取得部50において、画像データ20aについての人間の視認による文字認識結果である人文字認識結果56aを得るステップを実施する。図1に示すように、人文字認識結果取得部50は、評価者選定部52、仮認識結果取得部54、判定部56、評価者データベース52aおよび人文字認識結果56aを記憶する記憶部等を有する。 Next, in the evaluation system 10, the human character recognition result obtaining unit 50 performs a step of obtaining a human character recognition result 56a, which is a character recognition result of the image data 20a visually recognized by a human. As shown in FIG. 1, the human character recognition result acquisition unit 50 includes an evaluator selection unit 52, a temporary recognition result acquisition unit 54, a determination unit 56, an evaluator database 52a, a storage unit for storing human character recognition results 56a, and the like. have.

図1に示すように、人文字認識結果取得部50は、通信ネットワーク等を介して評価者が操作する複数の評価者端末94に対して通信を行い、リモートで人間の視認による文字認識結果である人文字認識結果56aを得ることが、効率的かつ安価に評価を行う観点から好ましい。また、図1に示す人文字認識結果取得部50は、評価者選定部52が少なくとも2人の人間(評価者端末94に紐づけられる)を評価者として選定するステップと、判定部56が少なくとも2人の人間(評価者)から得られた文字認識結果である仮認識結果を判定するステップとを実施して、人文字認識結果を得ることができる。 As shown in FIG. 1, the human character recognition result acquisition unit 50 communicates with a plurality of evaluator terminals 94 operated by the evaluator via a communication network or the like, and remotely obtains the character recognition results visually recognized by humans. Obtaining a certain human character recognition result 56a is preferable from the viewpoint of efficient and inexpensive evaluation. 1, the evaluator selection unit 52 selects at least two persons (linked to the evaluator terminal 94) as evaluators; and determining tentative recognition results, which are character recognition results obtained from two humans (evaluators), to obtain human character recognition results.

図10は、人文字認識結果取得部50が人文字認識結果56aを得るステップにおける処理の一例を示すフローチャートである。ステップ001で所定の画像データ20aに対する人文字認識結果56aの取得処理を開始した人文字認識結果取得部50は、ステップS0002において、対応する画像データ20aの一致率に関する一致率データ42a(図2参照)を読み出す。 FIG. 10 is a flow chart showing an example of processing in a step in which the human character recognition result acquisition unit 50 acquires the human character recognition result 56a. In step S0002, the human character recognition result acquisition unit 50, which has started the process of acquiring the human character recognition result 56a for the predetermined image data 20a in step S001, acquires the matching rate data 42a (see FIG. 2) regarding the matching rate of the corresponding image data 20a. ).

次に、ステップS003では、図1に示す人文字認識結果取得部50の評価者選定部52が、評価システム10にログインしている候補者の中から、2人の人間を評価者として選定する。ステップS003において、評価者選定部52は、ステップS002で読み出した一致率データ42aと、候補者の評価者としての信頼度を示す評価者信頼度とを参照して、2人の評価者を選定する。 Next, in step S003, the evaluator selection unit 52 of the human character recognition result acquisition unit 50 shown in FIG. . In step S003, the evaluator selection unit 52 selects two evaluators by referring to the matching rate data 42a read out in step S002 and the evaluator reliability indicating the reliability of the candidate as an evaluator. do.

ここで、評価者選定部52が評価者の選定に用いる評価者信頼度は、各評価者の個別の文字認識結果である仮認識結果が、図10に示す人文字認識結果取得部50の処理によって最終的に決定される人文字認識結果56aと一致する確率(評価者正答率)に関する。ただし、評価者信頼度は、各評価者の評価者正答率のみから構成されるものに限定されるものではなく、たとえば、経験年数などの他の指標を評価者正答率と合わせて構成されるものであってもよい。 Here, the evaluator reliability used by the evaluator selection unit 52 for selecting evaluators is obtained by the processing of the human character recognition result acquisition unit 50 shown in FIG. It relates to the probability (evaluator correct answer rate) of matching with the human character recognition result 56a finally determined by . However, the evaluator reliability is not limited to being composed only of the evaluator's rate of correct answers for each evaluator. can be anything.

図3は、ステップS003において、評価者選定部52が評価者を選定する基準を示す対応表である。評価者選定部52は、処理対象の画像データ20aの一致率が高い(たとえば80%以上=Aランク)場合は、評価者信頼度のより高い候補を、評価者として優先的に選定する。また、評価者選定部52は、処理対象の画像データ20aの一致率が低い(たとえば40%以下=Cランク)場合は、評価者信頼度が相対的に低い候補を、評価者として優先的に選定する。また、評価者選定部52は、処理対象の画像データ20aの一致率が中程度(たとえば40%より大きく80%未満=Bランク)場合は、評価者信頼度が中程度の候補を、評価者として優先的に選定する。 FIG. 3 is a correspondence table showing criteria for selecting evaluators by the evaluator selection unit 52 in step S003. When the match rate of the image data 20a to be processed is high (for example, 80% or more=A rank), the evaluator selection unit 52 preferentially selects candidates with higher evaluator reliability as evaluators. In addition, when the matching rate of the image data 20a to be processed is low (for example, 40% or less = C rank), the evaluator selection unit 52 preferentially selects candidates with relatively low evaluator reliability as evaluators. Select. In addition, when the match rate of the image data 20a to be processed is medium (for example, more than 40% and less than 80% = B rank), the evaluator selection unit 52 selects a candidate with a medium degree of evaluator reliability as an evaluator. to be selected preferentially.

このように、一致率の高い画像データ20aに対しては、一致率の低い画像データ20aに対する場合に比べて、評価信頼度の高い人間を優先して評価者に選定することで、人文字認識結果56aの取得効率を向上させることができる。図4を用いて後述するように、一致率の高い画像データ20aに対する評価を行うシチュエーションでは、機械文字認識結果31a~33aの中に正しい文字認識結果が含まれる可能性が高いため、迅速かつ正確に、画像データ20aと一致するものを機械文字認識結果31a~33aから探し出す能力が重要となり、評価者の能力差が現れやすい。一方、一致率の低い画像データに対する評価を行うシチュエーションでは、機械文字認識結果31a~33aの中に正しい文字認識結果が存在しない可能性が高く、仮認識結果を打ち込む頻度が高くなるので、誰が行っても時間がかかるケースが多く、相対的に評価者の能力差が現れにくい。 As described above, for the image data 20a with a high matching rate, compared to the case for the image data 20a with a low matching rate, a person with a high evaluation reliability is selected as an evaluator, giving priority to human character recognition. The efficiency of obtaining the result 56a can be improved. As will be described later with reference to FIG. 4, in a situation where image data 20a with a high matching rate is evaluated, there is a high possibility that correct character recognition results are included in the machine character recognition results 31a to 33a. In addition, the ability to search out the machine character recognition results 31a to 33a that match the image data 20a is important, and the ability difference of the evaluators tends to appear. On the other hand, in a situation where image data with a low matching rate is evaluated, there is a high possibility that there is no correct character recognition result among the machine character recognition results 31a to 33a, and the frequency of typing temporary recognition results increases. However, there are many cases where it takes a long time, and it is relatively difficult to show differences in the ability of evaluators.

次に、ステップS004では、ステップS003で選定した評価者の評価者端末94に対して、人文字認識結果取得部50の仮認識結果取得部54が、図4に示すような仮認識結果(または人文字認識結果56a)の入力画面を表示する。図4に示すように、人文字認識結果取得部50は、画像データ20aと、複数の機械文字認識結果31a~33aと、複数の機械文字認識結果31a~33aのいずれかを人文字認識結果56aまたはその候補である仮認識結果として選択可能な第1グラフィカルインターフェース58とを、評価者端末94の表示部に表示する。 Next, in step S004, the temporary recognition result acquiring unit 54 of the human character recognition result acquiring unit 50 sends the temporary recognition result (or An input screen for the human character recognition result 56a) is displayed. As shown in FIG. 4, the human character recognition result acquiring unit 50 obtains one of the image data 20a, the plurality of machine character recognition results 31a to 33a, and the plurality of machine character recognition results 31a to 33a as a human character recognition result 56a. Alternatively, the first graphical interface 58 that can be selected as the candidate provisional recognition result is displayed on the display unit of the evaluator terminal 94 .

図4に示すように、第1グラフィカルインターフェース58は、複数の機械文字認識結果31a~33aの中から、画像データ20aの正しい文字認識結果となっているものにチェックを入れるチェックボックスになっている。図4において点線で示されるように、評価者が、正しい文字認識結果となっている機械文字認識結果31a~33aに対応するチェックボックスを選択することにより、画像データ20aに対する評価者による文字認識結果である仮認識結果が決定される。 As shown in FIG. 4, the first graphical interface 58 is a check box for checking the correct character recognition result of the image data 20a from among the plurality of machine character recognition results 31a to 33a. . As indicated by the dotted lines in FIG. 4, the evaluator selects the check boxes corresponding to the machine character recognition results 31a to 33a that are correct character recognition results, and the character recognition results for the image data 20a by the evaluator are displayed. is determined.

ステップS005では、さらに確定ボタン58aの入力などを経て、評価者によって評価者端末94に入力された仮認識結果が人文字認識結果取得部50の仮認識結果取得部54に送られ、仮認識結果取得部54が仮認識結果を取得する。この際、仮認識結果取得部54は、ステップS003で選定した2人の評価者から、仮認識結果を取得する。なお、図4に示すように、評価者端末94の表示部には、仮認識結果を打ち込み可能なテキストボックス等の第2グラフィカルインターフェース59が表示されてもよい。評価者は、第2グラフィカルインターフェース59に直接入力することでも、仮認識結果の入力を行うことができる。 In step S005, the provisional recognition result input by the evaluator to the evaluator terminal 94 is sent to the provisional recognition result acquisition unit 54 of the human character recognition result acquisition unit 50 through the input of the confirmation button 58a and the like. The acquisition unit 54 acquires the temporary recognition result. At this time, the temporary recognition result acquisition unit 54 acquires temporary recognition results from the two evaluators selected in step S003. As shown in FIG. 4, the display unit of the evaluator terminal 94 may display a second graphical interface 59 such as a text box into which the temporary recognition result can be typed. The evaluator can also input the provisional recognition result by directly inputting to the second graphical interface 59 .

また、図4に示すように、第1グラフィカルインターフェース58によって機械文字認識結果のいずれかが選択された場合は、選択された機械文字認識結果が、第2グラフィカルインターフェース59にコピーされる。また、評価者端末94の表示部には、仮認識結果が入力された際に、各機械文字認識結果31a~33aが正答であるか誤答であるかを表示する自動判定表示欄57が設けられていてもよい。 Also, as shown in FIG. 4 , when any of the machine character recognition results is selected by the first graphical interface 58 , the selected machine character recognition result is copied to the second graphical interface 59 . Further, the display section of the evaluator terminal 94 is provided with an automatic judgment display column 57 for displaying whether each of the machine character recognition results 31a to 33a is a correct answer or an incorrect answer when the provisional recognition result is input. may have been

ステップS006では、図1に示す判定部56が、ステップS005で取得した2人の評価者から得られた文字認識結果である仮認識結果が、互いに一致するか否かを判定する。ステップS006において、2人の選定者よる仮認識結果が互いに一致する場合はステップS007へ進み、図1に示す判定部56が、一致した仮認識結果を、画像データ20aに対する人文字認識結果56aとして認定し、人文字認識結果取得部50の記憶部に記憶させる。 In step S006, the determination unit 56 shown in FIG. 1 determines whether or not the temporary recognition results, which are the character recognition results obtained from the two evaluators acquired in step S005, match each other. In step S006, when the temporary recognition results obtained by the two selectors match each other, the process proceeds to step S007, and the determination unit 56 shown in FIG. It is authorized and stored in the storage section of the human character recognition result acquisition section 50 .

一方、2人の選定者よる仮認識結果が互いに一致しない場合は、ステップS008およびステップS009において、繰り返し回数が所定の回数(5回)を超えてないことを判断したのち、2人の人間を評価者として選定するステップ(ステップS003)の処理へ戻る。なお、ステップS008およびステップS009において、繰り返し回数が所定の回数(5回)を超えていると判断された場合は、ステップS010のへ進む。ステップS010では、人文字認識結果取得部50が、対象である画像データ20aに関する人文字認識結果56aの取得を保留し、際限なく処理が繰り返されることを防止する。なお、ステップS010で人文字認識結果56aの取得が保留された画像データ20aについては、たとえば評価システム10のスーパーバイザー等によって、人文字認識結果56aが決定される。 On the other hand, if the provisional recognition results of the two selectors do not match each other, it is determined in steps S008 and S009 that the number of repetitions does not exceed a predetermined number (5 times), and then the two persons are identified. The process returns to the step of selecting the evaluator (step S003). If it is determined in steps S008 and S009 that the number of repetitions exceeds the predetermined number (5 times), the process proceeds to step S010. In step S010, the human character recognition result acquisition unit 50 suspends the acquisition of the human character recognition result 56a for the target image data 20a to prevent endless repetition of the process. For the image data 20a for which acquisition of the human character recognition result 56a has been suspended in step S010, the human character recognition result 56a is determined by, for example, the supervisor of the evaluation system 10 or the like.

ステップS007またはステップS010の後、ステップS011へ進み、人文字認識結果取得部50による人文字認識結果56aの取得処理を終了する。なお、図10に示すステップS007等において、画像データ20aに対する人文字認識結果56aが決定した際、人文字認識結果取得部50は、一連の処理に関与した評価者について、仮認識結果が人文字認識結果56aと一致する確率に関する評価者信頼度を記憶または更新する。図7は、図1に示す人文字認識結果取得部50の評価者データベース52aに記憶される評価者信頼度52a1~52a6を示す概念図である。評価者データベース52aには、各評価者の評価者信頼度52a1~52a6が記憶されている。なお、評価者データベース52aには、各評価者のログイン時間や処理数など、評価者に関する他の情報が記憶されている。 After step S007 or step S010, the process proceeds to step S011, and the process of obtaining the human character recognition result 56a by the human character recognition result obtaining unit 50 ends. Note that when the human character recognition result 56a for the image data 20a is determined in step S007 or the like shown in FIG. Store or update rater confidence in terms of probability of matching with recognition result 56a. FIG. 7 is a conceptual diagram showing the evaluator reliability levels 52a1 to 52a6 stored in the evaluator database 52a of the human character recognition result acquisition unit 50 shown in FIG. Evaluator reliability levels 52a1 to 52a6 of each evaluator are stored in the evaluator database 52a. The evaluator database 52a stores other information about the evaluators, such as the login time of each evaluator and the number of processes.

また、図10等では、2人の評価者を選定して人文字認識結果56aを取得する処理を例示して人文字認識結果を取得するステップを説明したが、選定する評価者は2人には限定されず、1人であってもよく、3人以上であってもよい。たとえば、1人の評価者により人文字認識結果56aの取得を行う場合は、図4に示す画面によって評価者が入力した結果により、人文字認識結果56aの認定を行う。 Also, in FIG. 10 and the like, the step of acquiring the human character recognition result is explained by exemplifying the process of selecting two evaluators and acquiring the human character recognition result 56a, but only two evaluators are selected. is not limited, and may be one or three or more. For example, when the human character recognition result 56a is acquired by one evaluator, the human character recognition result 56a is certified based on the results input by the evaluator on the screen shown in FIG.

図1に示す人文字認識結果取得部50により人文字認識結果56aの取得が行われた後、評価システム10では、採点部60により、機械文字認識結果31a~33aの採点が実施される。採点部60は、正誤判定部62と、正解率演算部64と、機械文字認識結果31aの正誤62aおよび正解率64aを記憶する記憶部を有する。 After the human character recognition result 56a is obtained by the human character recognition result obtaining unit 50 shown in FIG. The grading unit 60 has a correct/wrong judging unit 62, a correct answer rate calculation unit 64, and a storage unit that stores the correct/wrong answer 62a and the correct answer rate 64a of the machine character recognition result 31a.

図1に示す採点部60の正誤判定部62は、図2(a)に示すように、5つの機械文字認識結果31a~33aのそれぞれと、人文字認識結果取得部50で取得した人文字認識結果56aとを比較して、各機械文字認識結果31a~33aの正誤62aを判定する。正誤判定部62は、機械文字認識結果31a~33aが人文字認識結果56aに対して一致するものを正答と判定し、機械文字認識結果31a~33aが人文字認識結果56aに対して不一致であるものを誤答と判定する。正誤判定部62は、機械文字認識結果31a~33aの正誤62aを、採点部60の記憶部に記憶させる。図2(b)についても同様である。 The correct/wrong judging section 62 of the scoring section 60 shown in FIG. 1, as shown in FIG. The result 56a is compared to determine whether each of the machine character recognition results 31a to 33a is correct or incorrect 62a. The correctness determination unit 62 determines that the machine character recognition results 31a to 33a match the human character recognition result 56a as a correct answer, and the machine character recognition results 31a to 33a do not match the human character recognition result 56a. Judge things as wrong answers. The correct/wrong judging section 62 stores the correct/wrong 62a of the machine character recognition results 31a to 33a in the storage section of the scoring section 60. FIG. The same applies to FIG. 2(b).

また、図1に示す採点部60の正解率演算部64は、所定の画像データ20aに対する複数の機械文字認識結果31a~33aのうち、所定の画像データ20aに対して正しい文字認識を行うことができた文字認識プログラムによるものの割合を示す正解率64aを算出し、採点部60の記憶部に記憶させる。図2(a)に示すように、手書き文字である「日本太郎」という画像データ20aに関しては、5つの異なる文字認識プログラムに対応する機械文字認識結果31a~33aのうち、3つが正答であり、2つが誤答である。すなわち、「日本太郎」という画像データ20aに関しては、評価対象である5つの文字認識プログラムのうち、60%にあたる3つの文字認識プログラムが正答しているので、算出される正解率64aは60%である。 Further, the accuracy rate calculation unit 64 of the scoring unit 60 shown in FIG. 1 can perform correct character recognition on the predetermined image data 20a among the plurality of machine character recognition results 31a to 33a for the predetermined image data 20a. A correct answer rate 64a indicating the ratio of the character recognition program is calculated and stored in the storage section of the scoring section 60. FIG. As shown in FIG. 2(a), for image data 20a of handwritten characters "Nippon Taro", three of machine character recognition results 31a to 33a corresponding to five different character recognition programs are correct answers, Two are wrong answers. That is, with respect to the image data 20a of "Nippon Taro", three character recognition programs, which are 60%, out of the five character recognition programs to be evaluated give correct answers, so the calculated correct answer rate 64a is 60%. be.

一方、図2(b)に示すように、手書き文字である「同上」という画像データ20aに関しては、5つの異なる文字認識プログラムに対応する機械文字認識結果31a~33aのうち、1つが正答であり、4つが誤答であるため、算出される正解率64aは20%である。図2(a)および図2(b)から理解できるように、所定の画像データ20aについての一致率と正解率64aとを比較した場合、一致率が正解率64aより高い場合と、正解率64aと一致率とが一致する場合とがある。 On the other hand, as shown in FIG. 2B, with respect to the image data 20a of handwritten characters "same as above", one of the machine character recognition results 31a to 33a corresponding to five different character recognition programs is correct. , are incorrect answers, the calculated accuracy rate 64a is 20%. As can be understood from FIGS. 2A and 2B, when the matching rate and the correct answer rate 64a for the predetermined image data 20a are compared, the matching rate is higher than the correct answer rate 64a, and the correct answer rate 64a is higher than the correct answer rate 64a. and the rate of coincidence.

次に、図1に示す評価システムでは、情報統合部70において、文字認識プログラムの評価結果72bと、機械学習機能付き文字認識プログラム用教師データ72aを、記憶部に記憶する。情報統合部70は、情報処理部72を有しており、情報処理部72が評価システム10の各部が生成した情報を統合することにより、文字認識プログラム評価結果72bおよび教師データ72aを生成する。 Next, in the evaluation system shown in FIG. 1, the information integrating section 70 stores the evaluation result 72b of the character recognition program and the teacher data 72a for the character recognition program with machine learning function in the storage section. The information integration unit 70 has an information processing unit 72, and the information processing unit 72 integrates information generated by each unit of the evaluation system 10 to generate a character recognition program evaluation result 72b and teacher data 72a.

図8は、文字認識プログラム評価結果72bに含まれる情報を示す概念図である。図8に示すように、文字認識プログラム評価結果72bには、画像データ取得部20で取得された画像データ20aと、機械文字認識結果取得部30で取得された機械文字認識結果31a~33aおよび採点部60で取得されたその正誤62aと、人文字認識結果取得部50で取得された人文字認識結果56aと、機械文字認識傾向演算部40で取得された一致率データ42aと、採点部60で取得された正解率64aとが含まれる。 FIG. 8 is a conceptual diagram showing information included in the character recognition program evaluation result 72b. As shown in FIG. 8, the character recognition program evaluation result 72b includes the image data 20a obtained by the image data obtaining unit 20, the machine character recognition results 31a to 33a obtained by the machine character recognition result obtaining unit 30, and the score. The correct/wrong 62a obtained by the unit 60, the human character recognition result 56a obtained by the human character recognition result obtaining unit 50, the coincidence rate data 42a obtained by the machine character recognition tendency calculation unit 40, and the scoring unit 60 and the obtained accuracy rate 64a.

図9は、文字認識プログラム評価結果72bに含まれる情報の具体例を示す概念図である。図9に示すように、文字認識プログラム評価結果72bでは、所定の文字認識プログラムによる第1機械文字認識結果31aおよびその正誤62aと、人文字認識結果56aと、一致率データ42aと、正解率64aとが、対応する画像データ20aに関連づけられて記憶されている。 FIG. 9 is a conceptual diagram showing a specific example of information included in the character recognition program evaluation result 72b. As shown in FIG. 9, in the character recognition program evaluation result 72b, a first machine character recognition result 31a by a predetermined character recognition program, its correctness/incorrectness 62a, a human character recognition result 56a, matching rate data 42a, and an accuracy rate 64a are stored in association with the corresponding image data 20a.

文字認識プログラム評価結果72bは、各画像データ20aについて、正解率64aと一致率という多角的な指標を含むため、その画像データ20aに対する機械文字認識結果の正誤62aについて、多角的かつ有効な知見を得ることができる。図6は、文字認識プログラム評価結果72bに含まれる情報から得られる分析的知見の一例を示す概念図である。 Since the character recognition program evaluation result 72b includes multifaceted indices such as the accuracy rate 64a and the match rate for each image data 20a, it provides multifaceted and effective knowledge about the correctness 62a of the machine character recognition result for the image data 20a. Obtainable. FIG. 6 is a conceptual diagram showing an example of analytical knowledge obtained from the information included in the character recognition program evaluation result 72b.

たとえば、図6の2行目に示すように、所定の文字認識プログラムが、一致率も正解率も高い画像データに誤答した場合は、その画像データに関する文字認識能力に関して、他の文字認識プログラムに対して相対的劣位であると分析できる。また、図6の3行目に示すように、所定の文字認識プログラムが、一致率が高く正解率が低い画像データに誤答した場合は、その画像データに関する文字認識能力に関して、文字認識プログラムに共通する根本的問題を有すると分析できる。また、図6に示す表の4行目に示すように、所定の文字認識プログラムが、一致率が高く正解率が低い画像データに正答した場合は、その画像データに関する文字認識能力に関して、他の文字認識プログラムには無い革新的優位性を有すると分析できる。 For example, as shown in the second line of FIG. 6, when a predetermined character recognition program gives an incorrect answer to image data with a high matching rate and a high accuracy rate, the character recognition ability for that image data will be evaluated by another character recognition program. It can be analyzed that it is relatively inferior to In addition, as shown in the third line of FIG. 6, when the predetermined character recognition program gives an incorrect answer to image data with a high match rate and a low accuracy rate, the character recognition program will be notified of the character recognition ability for that image data. It can be analyzed as having a common underlying problem. Also, as shown in the fourth row of the table shown in FIG. 6, when the predetermined character recognition program gives a correct answer to image data with a high match rate and a low accuracy rate, the character recognition ability for that image data is evaluated by another program. It can be analyzed that it has an innovative superiority that character recognition programs do not have.

また、図6の5行目に示すように、所定の文字認識プログラムが、一致率も正解率も低い画像データに誤答した場合は、その画像データに関する文字認識能力に関して、文字認識プログラム毎のばらつきが大きく、やや根深い問題を有すると分析できる。また、図6の6行目に示すように、所定の文字認識プログラムが、一致率も正解率も低い画像データに正答した場合は、その画像データに関する文字認識能力に関して、他の文字認識プログラムに対して相対的優位性を有すると分析できる。 Further, as shown in the fifth line of FIG. 6, when a predetermined character recognition program gives an incorrect answer to image data with a low matching rate and a low accuracy rate, the character recognition ability for that image data is determined by each character recognition program. It can be analyzed that there is a large variation and that there is a somewhat deep-seated problem. In addition, as shown in the sixth line of FIG. 6, when a predetermined character recognition program gives a correct answer to image data with a low matching rate and a low accuracy rate, the character recognition ability for that image data is determined by another character recognition program. It can be analyzed that it has a relative advantage over

図1に示す教師データ72aも、図8および図9に示す文字認識プログラム評価結果72bと同様に、人文字認識結果56aと、一致率データ42aと、正解率64aとが、対応する画像データ20aに関連づけられて記憶されている。ただし、教師データ72aは、文字認識プログラム評価結果72bとは異なり、所定の文字認識プログラムによる第1機械文字認識結果31aおよびその正誤62aについては、省略してよい。 As with the character recognition program evaluation results 72b shown in FIGS. 8 and 9, the teacher data 72a shown in FIG. are stored in association with However, unlike the character recognition program evaluation result 72b, the teacher data 72a may omit the first machine character recognition result 31a by a predetermined character recognition program and its correctness/incorrectness 62a.

教師データ72aも、文字認識プログラム評価結果72bと同様に、各画像データ20aについて、正解率64aと一致率という多角的な指標を含むため、その画像データ20aにより期待される学習効果について、多角的かつ有効な知見を得ることができる。図5は、教師データ72aに含まれる情報から得られる分析的知見の一例を示す概念図である。 As with the character recognition program evaluation result 72b, the teacher data 72a also includes multifaceted indices such as the accuracy rate 64a and the match rate for each image data 20a. And effective knowledge can be obtained. FIG. 5 is a conceptual diagram showing an example of analytical knowledge obtained from information included in the teacher data 72a.

図5の2行目に示すように、一致率も正解率も高い画像データには、多くの文字認識プログラムが正答できる現状到達レベルを確認する学習効果が期待できる。また、図5の3行目に示すように、一致率が高く正解率が低い画像データには、文字認識プログラムに共通の課題を改善する学習効果が期待できる。また、図5の4行目に示すように、一致率も正解率も低い画像データには、文字認識プログラムごとの個体差が大きい文字の認識を改善する学習効果が期待される。 As shown in the second line of FIG. 5, image data with a high matching rate and a high accuracy rate can be expected to have a learning effect of confirming the current attainment level at which many character recognition programs can give correct answers. In addition, as shown in the third line of FIG. 5, image data with a high match rate and a low accuracy rate can be expected to have a learning effect that improves problems common to character recognition programs. Further, as shown in the fourth line of FIG. 5, image data with a low match rate and a low accuracy rate is expected to have a learning effect of improving character recognition, which has large individual differences between character recognition programs.

以上のように、図1に示すような評価システム10によれば、実際の手書き文字の画像データ20aを、複数の文字認識プログラムが文字認識することにより、現実の手書き文字を文字認識する状況に整合しており、かつ、客観的な評価結果が得られる。また、共通の画像データ20aを複数の文字認識プログラムにより文字認識することにより、1件の人文字認識結果あたりのプログラム評価数を増加させることができるので、評価の効率を高めることができる。 As described above, according to the evaluation system 10 shown in FIG. 1, the image data 20a of the actual handwritten characters are subjected to character recognition by a plurality of character recognition programs. Consistent and objective evaluation results are obtained. Further, character recognition of common image data 20a by a plurality of character recognition programs can increase the number of program evaluations per result of human character recognition, thereby improving efficiency of evaluation.

10…文字認識プログラムの評価システム(評価システム)
20…画像データ取得部
22…手書き文字
20a…画像データ
30…機械文字認識結果取得部
31…第1文字認識演算部
31a…第1機械文字認識結果
32…第2文字認識演算部
32a…第2機械文字認識結果
33…第3文字認識演算部
33a…第3機械文字認識結果
40…機械文字認識傾向演算部
42…一致率データ取得部
42a…一致率データ
50…人文字認識結果取得部
52…評価者選定部
54…仮認識結果取得部
56…判定部
52a…評価者データベース
52a1~52a6…評価者信頼度
56a…人文字認識結果
58…第1グラフィカルインターフェース
59…第2グラフィカルインターフェース
57…自動判定表示欄
60…採点部
62…正誤判定部
64…正解率演算部
64a…正解率
70…情報統合部
72b…文字認識プログラム評価結果
72a…教師データ
94…評価者端末
10 Evaluation system for character recognition program (evaluation system)
20 Image data acquisition unit 22 Handwritten characters 20a Image data 30 Machine character recognition result acquisition unit 31 First character recognition calculation unit 31a First machine character recognition result 32 Second character recognition calculation unit 32a Second Machine character recognition result 33 Third character recognition calculation unit 33a Third machine character recognition result 40 Machine character recognition tendency calculation unit 42 Concordance rate data acquisition unit 42a Concordance rate data 50 Human character recognition result acquisition unit 52 Evaluator selection unit 54 Temporary recognition result acquisition unit 56 Judgment unit 52a Evaluator database 52a1 to 52a6 Evaluator reliability 56a Human character recognition result 58 First graphical interface 59 Second graphical interface 57 Automatic judgment Display column 60 Scoring unit 62 Correctness determination unit 64 Accuracy rate calculation unit 64a Accuracy rate 70 Information integration unit 72b Character recognition program evaluation result 72a Teacher data 94 Evaluator terminal

Claims (6)

文字認識プログラムの評価システムによる文字認識プログラムの評価方法であって、
画像データ取得部が、手書き文字の画像データを取得するステップと、
複数の異なる文字認識プログラムによる文字認識演算部が前記画像データに対して文字認識を行い、前記画像データについての前記複数の文字認識プログラムによる文字認識結果である複数の機械文字認識結果を、機械文字認識結果取得部が得るステップと、
一致率データ取得部が、前記画像データから得られる前記複数の機械文字認識結果の一致率に関する一致率データを得るステップと、
人文字認識結果取得部が、前記画像データについての人間の視認による文字認識結果である人文字認識結果を得るステップと、
正解率演算部が、前記複数の機械文字認識結果のそれぞれと、前記人文字認識結果とを比較して、前記複数の機械文字認識結果の正誤を判定するとともに、前記複数の機械文字認識結果の正解率を得るステップと、
情報統合部が、前記画像データと、前記複数の機械文字認識結果のうち少なくとも1つおよびその正誤と、前記人文字認識結果と、前記一致率データと、前記正解率と、が関連付けられた文字認識プログラム評価結果を記憶するステップと、を有する文字認識プログラムの評価方法。
A character recognition program evaluation method by a character recognition program evaluation system,
an image data acquisition unit acquiring image data of handwritten characters;
A character recognition calculation unit using a plurality of different character recognition programs performs character recognition on the image data, and a plurality of machine character recognition results, which are the character recognition results of the plurality of character recognition programs for the image data, are converted into machine characters. a step obtained by the recognition result obtaining unit ;
a matching rate data obtaining unit obtaining matching rate data relating to a matching rate of the plurality of machine character recognition results obtained from the image data;
a step in which a human character recognition result obtaining unit obtains a human character recognition result, which is a character recognition result of the image data visually recognized by a human;
An accuracy rate calculation unit compares each of the plurality of machine character recognition results with the human character recognition result to determine whether the plurality of machine character recognition results are correct or not, and determines whether the plurality of machine character recognition results are correct or not. a step of obtaining an accuracy rate;
The information integration unit generates a character associated with the image data, at least one of the plurality of machine character recognition results and correct/wrong thereof, the human character recognition result, the matching rate data, and the accuracy rate. and a step of storing recognition program evaluation results.
前記人文字認識結果を得るステップでは、前記人文字認識結果取得部が、少なくとも2人の人間を評価者として選定するステップと、
前記少なくとも2人の人間から得られた文字認識結果である仮認識結果を判定するステップと、をさらに有し、
前記仮認識結果を判定するステップでは、前記人文字認識結果取得部が、前記仮認識結果が互いに一致する場合には前記仮認識結果を前記人文字認識結果として認定し、前記仮認識結果が互いに一致しない場合は少なくとも2人の人間を評価者として選定するステップに戻る請求項1に記載の文字認識プログラムの評価方法。
In the step of obtaining the human character recognition result, the human character recognition result acquisition unit selects at least two humans as evaluators;
determining tentative recognition results that are character recognition results obtained from the at least two humans;
In the step of judging the provisional recognition result, the human-character recognition result acquisition unit recognizes the provisional recognition result as the human-character recognition result when the provisional recognition results match each other; 2. The method of evaluating a character recognition program according to claim 1, wherein if there is no match, the process returns to the step of selecting at least two persons as evaluators.
前記人文字認識結果を得るステップでは、前記人文字認識結果取得部が、各評価者の仮認識結果が前記人文字認識結果と一致する確率に関する評価者信頼度を記憶するステップを含み、
前記少なくとも2人の人間を評価者として選定するステップでは、前記人文字認識結果取得部が、前記一致率データと、前記評価者信頼度とを用いて、少なくとも2人の人間を評価者として選定する請求項2に記載の文字認識プログラムの評価方法。
In the step of obtaining the human character recognition result, the human character recognition result acquisition unit stores an evaluator confidence level regarding the probability that the temporary recognition result of each evaluator matches the human character recognition result,
In the step of selecting at least two people as evaluators, the human character recognition result acquisition unit selects at least two people as evaluators using the matching rate data and the evaluator reliability. 3. The character recognition program evaluation method according to claim 2.
前記人文字認識結果を得るステップでは、前記人文字認識結果取得部が、前記画像データと、前記複数の機械文字認識結果と、前記複数の機械文字認識結果のいずれかを前記人文字認識結果またはその候補として選択可能なグラフィカルインターフェースと、を評価者の端末に表示するステップを有する請求項1に記載の文字認識プログラムの評価方法。 In the step of obtaining the human character recognition result, the human character recognition result obtaining unit obtains one of the image data, the plurality of machine character recognition results, and the plurality of machine character recognition results as the human character recognition result or 2. The character recognition program evaluation method according to claim 1, further comprising the step of displaying a graphical interface selectable as the candidate on the evaluator's terminal. 手書き文字の画像データを取得する画像データ取得部と、
複数の異なる文字認識プログラムが前記画像データに対して文字認識を行い、前記画像データについての前記複数の文字認識プログラムによる文字認識結果である複数の機械文字認識結果を得る機械文字認識結果取得部と、
前記画像データから得られる前記複数の機械文字認識結果の一致率に関する一致率データを得る一致率データ取得部と、
前記画像データについての人間の視認による文字認識結果である人文字認識結果を得る人文字認識結果取得部と、
前記複数の機械文字認識結果のそれぞれと、前記人文字認識結果とを比較して、前記複数の機械文字認識結果の正誤を判定する正誤判定部および前記複数の機械文字認識結果の正解率を得る正解率演算部と、
前記画像データと、前記複数の機械文字認識結果のうち少なくとも1つおよびその正誤と、前記人文字認識結果と、前記一致率データと、前記正解率と、が関連付けられた文字認識プログラム評価結果を記憶する評価結果記憶部と、を有する文字認識プログラムの評価システム。
an image data acquisition unit that acquires image data of handwritten characters;
a machine character recognition result acquisition unit for obtaining a plurality of machine character recognition results, which are character recognition results of the image data by a plurality of different character recognition programs performing character recognition on the image data by the plurality of character recognition programs; ,
a matching rate data obtaining unit for obtaining matching rate data relating to the matching rates of the plurality of machine character recognition results obtained from the image data;
a human character recognition result obtaining unit for obtaining a human character recognition result, which is a character recognition result of the image data visually recognized by a human;
Each of the plurality of machine character recognition results and the human character recognition result are compared to obtain a correctness determination unit for determining whether the plurality of machine character recognition results are correct and an accuracy rate of the plurality of machine character recognition results. an accuracy rate calculator;
a character recognition program evaluation result in which the image data, at least one of the plurality of machine character recognition results and correct/incorrect thereof, the human character recognition result, the matching rate data, and the accuracy rate are associated with each other; An evaluation system for a character recognition program, comprising: an evaluation result storage unit for storing.
文字認識プログラムの評価システムによる文字認識プログラム用教師データの製造方法であって、
画像データ取得部が、手書き文字の画像データを取得するステップと、
複数の異なる文字認識プログラムが前記画像データに対して文字認識を行い、前記画像データについての前記複数の文字認識プログラムによる文字認識結果である複数の機械文字認識結果を機械文字認識結果取得部が得るステップと、
一致率データ取得部が、前記画像データから得られる前記複数の機械文字認識結果の一致率に関する一致率データを得るステップと、
人文字認識結果取得部が、前記画像データについての人間の視認による文字認識結果である人文字認識結果を得るステップと、
正解率演算部が、前記複数の機械文字認識結果のそれぞれと、前記人文字認識結果とを比較して、前記複数の機械文字認識結果の正誤を判定するとともに、前記複数の文字認識プログラムの正解率を得るステップと、
情報統合部が、前記画像データと、前記人文字認識結果と、前記一致率データと、前記正解率が関連付けられた教師データを記憶するステップと、を有する文字認識プログラム用教師データの製造方法。
A method for producing teacher data for a character recognition program using a character recognition program evaluation system,
an image data acquisition unit acquiring image data of handwritten characters;
A plurality of different character recognition programs perform character recognition on the image data, and a machine character recognition result acquisition unit obtains a plurality of machine character recognition results, which are character recognition results of the image data by the plurality of character recognition programs. a step;
a matching rate data obtaining unit obtaining matching rate data relating to a matching rate of the plurality of machine character recognition results obtained from the image data;
a step in which a human character recognition result obtaining unit obtains a human character recognition result, which is a character recognition result of the image data visually recognized by a human;
A correctness rate calculation unit compares each of the plurality of machine character recognition results with the human character recognition result to determine whether the plurality of machine character recognition results are correct or not, and determines whether the plurality of character recognition programs are correct. obtaining a rate;
A method for producing teaching data for a character recognition program , wherein an information integration unit stores teaching data associated with the image data, the human character recognition result, the matching rate data, and the accuracy rate.
JP2022099004A 2022-06-20 2022-06-20 Character Recognition Program Evaluation Method, Character Recognition Program Evaluation System, and Method of Manufacturing Teacher Data for Character Recognition Program Active JP7184411B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022099004A JP7184411B1 (en) 2022-06-20 2022-06-20 Character Recognition Program Evaluation Method, Character Recognition Program Evaluation System, and Method of Manufacturing Teacher Data for Character Recognition Program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022099004A JP7184411B1 (en) 2022-06-20 2022-06-20 Character Recognition Program Evaluation Method, Character Recognition Program Evaluation System, and Method of Manufacturing Teacher Data for Character Recognition Program

Publications (2)

Publication Number Publication Date
JP7184411B1 true JP7184411B1 (en) 2022-12-06
JP2024000290A JP2024000290A (en) 2024-01-05

Family

ID=84327863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022099004A Active JP7184411B1 (en) 2022-06-20 2022-06-20 Character Recognition Program Evaluation Method, Character Recognition Program Evaluation System, and Method of Manufacturing Teacher Data for Character Recognition Program

Country Status (1)

Country Link
JP (1) JP7184411B1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001084336A (en) 1999-09-16 2001-03-30 Fujitsu Ltd Character recognition apparatus and method and program recording medium
JP2001297306A (en) 2000-04-12 2001-10-26 Oki Electric Ind Co Ltd Character recognizing device
JP2010073201A (en) 2008-08-20 2010-04-02 Hammock:Kk Ocr system
JP2019159374A (en) 2018-03-07 2019-09-19 富士ゼロックス株式会社 Information processing apparatus and program
WO2019225157A1 (en) 2018-05-25 2019-11-28 株式会社ふくおかフィナンシャルグループ Ledger sheet recognition system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001084336A (en) 1999-09-16 2001-03-30 Fujitsu Ltd Character recognition apparatus and method and program recording medium
JP2001297306A (en) 2000-04-12 2001-10-26 Oki Electric Ind Co Ltd Character recognizing device
JP2010073201A (en) 2008-08-20 2010-04-02 Hammock:Kk Ocr system
JP2019159374A (en) 2018-03-07 2019-09-19 富士ゼロックス株式会社 Information processing apparatus and program
WO2019225157A1 (en) 2018-05-25 2019-11-28 株式会社ふくおかフィナンシャルグループ Ledger sheet recognition system

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Shunichi Kimura et al.,"A Man-Machine Cooperating System Based on the Generalized Reject Model",2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR),米国,IEEE,2017年11月09日,pp.1324-1329
小西 晃治、佐藤 雅史,"5万円以下のOCRソフト12本を比較する",DOS/V magazine,日本,ソフトバンクパブリッシング株式会社,1999年09月01日,Vol.8, No.17,pp.145-157

Also Published As

Publication number Publication date
JP2024000290A (en) 2024-01-05

Similar Documents

Publication Publication Date Title
KR102194837B1 (en) Method and apparatus for answering knowledge-based question
US20160132815A1 (en) Skill estimation method in machine-human hybrid crowdsourcing
CN111753767A (en) Method and device for automatically correcting operation, electronic equipment and storage medium
CN109902665A (en) Similar face retrieval method, apparatus and storage medium
US20060246410A1 (en) Learning support system and learning support program
CN110659311B (en) Topic pushing method and device, electronic equipment and storage medium
CN109993102A (en) Similar face retrieval method, apparatus and storage medium
CN110263133B (en) Knowledge graph-based question and answer method, electronic device, equipment and storage medium
CN112215175B (en) Handwritten character recognition method, device, computer equipment and storage medium
CN113705092B (en) Disease prediction method and device based on machine learning
CN115205764B (en) Online learning concentration monitoring method, system and medium based on machine vision
US20240177624A1 (en) Learning management systems and methods therefor
JP7491370B2 (en) OBJECT RECOGNITION DEVICE, OBJECT RECOGNITION METHOD, LEARNING DEVICE, LEARNING METHOD, AND PROGRAM
CN111582405B (en) Data labeling method and device
CN114971425B (en) Database information monitoring method, device, equipment and storage medium
CN114399827B (en) College graduate career character testing method and system based on facial micro-expression
CN111612659B (en) Automatic scoring system and scoring method for online financial examination
CN111444906A (en) Image recognition method based on artificial intelligence and related device
JP7184411B1 (en) Character Recognition Program Evaluation Method, Character Recognition Program Evaluation System, and Method of Manufacturing Teacher Data for Character Recognition Program
CN115100007A (en) Online teaching management method and system based on artificial intelligence
CN113780365A (en) Sample generation method and device
Jennifer et al. Feels bad man: Dissecting automated hateful meme detection through the lens of facebook's challenge
CN117313943A (en) Test question accuracy prediction method, system, equipment and storage medium
CN116955598A (en) Method, device, equipment, medium and program product for generating event summary text
JP6930754B2 (en) Learning support device and questioning method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220620

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221003

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221018

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221116

R150 Certificate of patent or registration of utility model

Ref document number: 7184411

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150