JP6771906B2 - Information processing device and its control method and program - Google Patents
Information processing device and its control method and program Download PDFInfo
- Publication number
- JP6771906B2 JP6771906B2 JP2016043928A JP2016043928A JP6771906B2 JP 6771906 B2 JP6771906 B2 JP 6771906B2 JP 2016043928 A JP2016043928 A JP 2016043928A JP 2016043928 A JP2016043928 A JP 2016043928A JP 6771906 B2 JP6771906 B2 JP 6771906B2
- Authority
- JP
- Japan
- Prior art keywords
- document data
- information
- flow definition
- correction
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、情報処理装置及びその制御方法及びプログラムに関するものである。 The present invention relates to an information processing device and its control method and program.
文書に対する作業手順に従い各種業務の達成を図る文書処理ワークフローが広く用いられている。特に紙媒体に記載された文書情報をコンピュータシステムに取り込む文書処理ワークフローは文書認識技術の精度向上につれ一般オフィスワークから金融業、流通業、医療等の活用領域が拡大している。紙文書を用いた文書処理ワークフローにおいては、記載内容を自動認識して業務遂行に必要な情報を抽出する必要がある。抽出情報に誤りがあると業務が達成されなかったり、あるいは業務効率を著しく低下させてしまうため、自動認識結果を目視で確認し、誤りがあれば修正する業務も不可欠となっている。そのような目視確認、修正業務にかかる作業者の負担、時間を軽減するため、必要な場合のみ確認をするよう制御する文書ワークフローシステムも提案されている。特許文献1には文字認識結果の類似度と確信度とを比較し、人手による確認の要否を判定する技術が開示されている。また、文字認識などを自動処理する場合、実際に存在する語彙などを知識データとして保持し、知識データと照合することで認識精度を高める方式が考案されている。そのような知識参照による自動認識システムである特許文献2には、修正された文字認識の結果に基づき知識データの更新を行うことにより、誤りの修正結果を学習する方式が開示されている。
A document processing workflow that aims to achieve various tasks according to the work procedure for a document is widely used. In particular, the document processing workflow for importing document information written on paper media into a computer system is expanding its application area from general office work to financial industry, distribution industry, medical care, etc. as the accuracy of document recognition technology is improved. In a document processing workflow using a paper document, it is necessary to automatically recognize the description contents and extract information necessary for business execution. If there is an error in the extracted information, the work will not be achieved or the work efficiency will be significantly reduced. Therefore, it is indispensable to visually check the automatic recognition result and correct any mistake. In order to reduce the burden and time of workers involved in such visual confirmation and correction work, a document workflow system that controls confirmation only when necessary has also been proposed.
上述した従来技術は、ワークフロー処理結果の修正が必要か否かを判別したり、認識結果の確からしさを高めるために知識データベースを更新することができる。しかしながら、学習処理として更新すべき知識データベースは認識候補を特定するための知識データ更新処理として既定されている。そのため、文書処理ワークフロー全体で学習効果を得るために、いずれの処理を実行しなければならないかについて言及されない。 The above-mentioned prior art can determine whether or not the workflow processing result needs to be modified, and can update the knowledge database in order to increase the certainty of the recognition result. However, the knowledge database to be updated as a learning process is defined as a knowledge data update process for identifying recognition candidates. Therefore, it is not mentioned which process must be performed in order to obtain the learning effect in the entire document processing workflow.
本発明は、文書処理を複合的に組み合わせて構成する文書処理ワークフローにおいて、修正されたワークフロー処理結果を参照して、次のワークフローを実行できるようにすることを目的とする。 An object of the present invention is to enable the next workflow to be executed by referring to the modified workflow processing result in a document processing workflow composed of a complex combination of document processing.
この課題を解決するため、例えば本発明の情報処理装置は以下の構成を備える。すなわち、
文書データに処理する情報処理装置であって、
処理対象の文書データと、当該文書データに対して行われる複数種類の処理とそれぞれの処理の順序を記述したフロー定義文書データとを入力する入力手段と、
前記フロー定義文書データに記述された順序に従った全処理を実行する実行手段と、
該実行手段による実行結果の誤りを、ユーザからの指示に従って修正する修正手段と、
前記フロー定義文書データに記述された処理の順序に対して逆の順に処理を実行し、各処理による処理の結果が前記修正手段による修正内容となるための情報を生成し、当該情報を記憶する記憶手段と、
前記記憶手段に記憶された情報に従った処理を実行させるための記述を前記フロー定義文書データに追加した新たなフロー定義文書データを、前記入力手段による入力対象として、生成する生成手段とを有する。
In order to solve this problem, for example, the information processing apparatus of the present invention has the following configuration. That is,
An information processing device that processes document data
An input means for inputting document data to be processed, a plurality of types of processing performed on the document data, and flow definition document data describing the order of each processing.
An execution means for executing all processes in the order described in the flow definition document data, and
A correction means for correcting an error in the execution result by the execution means according to an instruction from the user, and a correction means.
The processing is executed in the reverse order of the processing order described in the flow definition document data, information is generated so that the result of the processing by each processing becomes the correction content by the correction means, and the information is stored. Memories and
It has a generation means for generating new flow definition document data in which a description for executing a process according to the information stored in the storage means is added to the flow definition document data as an input target by the input means. ..
本発明によれば、文書処理ワークフローにて、ジョブの結果を修正した際に、同種の文書処理ジョブにおいてもユーザの修正結果を反映させることを可能にする。 According to the present invention, when the result of a job is modified in the document processing workflow, it is possible to reflect the modification result of the user in the same type of document processing job.
以下、添付図面に従って本発明に係る実施形態を詳細に説明する。 Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings.
[第1実施形態]
図1は、本実施形態を適用する文書処理フロー制御装置(情報処理装置)100のハードウェア構成の一例を示す図である。ROM102には、CPU101が実行することになるプログラムを格納している。CPU101はROM102に格納されている制御プログラムを実行することにより、文書処理フロー制御装置100を制御する。CPU101がこのプログラムを実行することにより、後述する文書処理フロー制御装置100のソフトウェア構成及びフローチャートに示す各処理が実現される。RAM103は、各構成要素からの各種データを一時記憶する。また、RAM103は、CPU101が実行するプログラムを展開するための記憶領域としても利用される。文書処理部104は、CPU101からの指示に応じて文書処理フロー制御の処理を行う。表示部105は、液晶パネル等で構成され、文書処理部104の処理結果を表示する。通信部106はネットワークインターフェース(NIC)であり、ネットワーク上の他の装置とLANケーブル等を介した通信を可能とする。バス107は、上述したCPU101乃至通信部106の各機器間のデジタル信号を伝達する。
[First Embodiment]
FIG. 1 is a diagram showing an example of a hardware configuration of a document processing flow control device (information processing device) 100 to which this embodiment is applied. The
以上の構成要素を有する文書処理フロー制御装置100のCPU101は、後述するフローチャートの各処理を実行する。
The
図2は、CPU101がROM102に格納されたプログラムを実行する際の、文書処理フロー制御装置100の機能ブロック構成図である。図示の各構成要素201乃至207は、プログラムを実行したCPU101が行うものであるが、これらの一部がハードウェアにより実現しても構わない。
FIG. 2 is a functional block configuration diagram of the document processing
図2に示すように、文書処理フロー制御装置100は、ジョブ管理部201、ジョブ入力部202、ジョブ表示部203、ジョブ実行部204、ジョブ実行結果修正部205、修正結果再生部206、記憶部207を有する。記憶部207は、文書処理フロー制御装置100の文書処理フロー定義文書のほか、文書処理ジョブの状態、処理中の入出力の情報を記憶する。
As shown in FIG. 2, the document processing
ジョブ入力部202は、不図示の入力源から、文書処理のワークフロー(以降、「文書処理フロー」とも記載する)を定義したフロー定義文書と処理対象となる入力データを入力し、文書処理ジョブとして文書処理ジョブ管理部201に供給する。入力源は特に問わないが、処理対象のデータはユーザがイメージスキャナを介して帳票の読取を行わせ、フロー定義文書はユーザが指定するものとして説明する。ジョブ管理部201は、入力したジョブを記憶管理するものである。そして、ジョブ管理部201は、入力ジョブの実行順を制御し、ジョブ表示部203によりジョブの実行状態をユーザに通知するとともに、ユーザからのジョブの実行、修正確認の指示を受け付ける。ジョブ実行部204は文書処理フロー定義文書に記憶される文書処理フローの実行順に従い、文書処理を実行する。ジョブ実行結果修正部205はジョブ実行部204の処理結果をジョブ表示部203に表示し、必要に応じてユーザの修正指示を受け付け、ジョブ実行結果を修正する。修正結果再生部206はジョブ実行結果修正部205で修正された結果を再現可能とするよう再生する処理を実行する。
The
図3は、文書処理フロー制御装置100における、ジョブ表示部203が表示部105に表示するジョブ一覧の操作画面の一例を示す図である。図示において、参照符号300は、文書処理ジョブ実行制御モニタ表示を行うウインドウである。参照符号301は、ジョブ管理部201の制御対象となっているジョブを識別するジョブ識別番号である。参照符号302はジョブ識別番号301で識別されるジョブの実行状態を示すジョブステータスである。ジョブステータスには、以下の種類がある。
・入力ジョブが未実行である「実行待ち」
・ジョブ実行部204による実行中で処理が完了していない「実行中」
・処理フローを完了しジョブ実行結果修正部205による結果の確認修正が完了していない「確認待ち」
・ジョブ実行結果の修正確認が完了し、修正が生じなかった状態である「完了」
・ジョブ実行結果の修正が生じ、修正結果を再生可能にする処理を実行中である「再生フロー実行中」
・再生可能となったことを示す「再生完了」
上記の種類が識別可能に表示されることで、ユーザは各ジョブの状態を認識することができる。
FIG. 3 is a diagram showing an example of an operation screen of the job list displayed on the
-"Waiting for execution" where the input job has not been executed
-"Running", which is being executed by the
-"Waiting for confirmation" where the processing flow is completed and the confirmation and correction of the result by the job execution
-"Complete", which is a state in which the correction confirmation of the job execution result is completed and no correction has occurred.
-The job execution result has been modified, and the process to make the modified result reproducible is being executed. "Reproduction flow is being executed."
-"Playback completed" indicating that playback is possible
By displaying the above types in an identifiable manner, the user can recognize the status of each job.
参照符号303は、ジョブの実行を取り消す中止ボタン305、実行待ち状態ジョブを即時実行する実行ボタン304を含む指示入力部である。ユーザが、この指示入力部を、不図示のマウスなどのポインティングデバイスで指示(クリック)することで、該当するジョブの実行、中止を指示することができる。なお、ジョブステータスが「完了」または「再生完了」のジョブの場合、そのジョブの実行、中止はできないため、指示入力部303には、実行ボタン304、中止ボタン305は表示されない。参照符号306は、ジョブ識別番号301のいずれかを表示領域内のクリック操作等により指定した場合、当該ジョブにおける入力画像のサムネイル画像を表示する。図示においては、指定されたジョブ識別番号“00182938”のサムネイル画像が表示される。
図4は文書処理フロー定義を指定するフロー定義文書の一例を示す図である。フロー定義文書はXML(eXtensible Markup Language)で記述され、<process_flow>がフロー定義文書全体を表す構造化要素である。<process>は実行する文書処理種別を指定する構造化要素であり、order属性で実行順が指定される。また、parameters属性で実行時のパラメータを指定することができる。図4ではinformation extractionの実行時は抽出情報を指定するpatient−id、document−type、department−nameの3種を指定する定義となっている。<process>要素によって指定される文書処理種別はジョブ実行部204が保持する文書処理サービスに対応するラベルである。ジョブ実行部204は文書処理種別に示されるラベルに対する文書処理サービスとを対応させ実行する。
FIG. 4 is a diagram showing an example of a flow definition document that specifies a document processing flow definition. The flow definition document is described in XML (eXtensible Markup Language), and <process_flow> is a structured element representing the entire flow definition document. <process> is a structured element that specifies the document processing type to be executed, and the execution order is specified by the orderer attribute. In addition, run-time parameters can be specified in the parameters attribute. In FIG. 4, when the information extension is executed, it is defined to specify three types, patient-id, document-type, and departure-name, which specify extraction information. The document processing type specified by the <process> element is a label corresponding to the document processing service held by the
以下、図4の文書処理フロー定義文書に基づく、文書処理フロー制御を説明する。この文書フロー制御では、イメージスキャナで読み取ったレイアウト非定型の医療帳票の画像から、患者識別情報(patient−id)、文書種別情報(document−type)、文書の帰属診療科名(department−name)を抽出する。 Hereinafter, document processing flow control based on the document processing flow definition document of FIG. 4 will be described. In this document flow control, patient identification information (patient-id), document type information (document-type), and document belonging clinical department name (department-name) are used from the image of a medical form with a non-standard layout read by an image scanner. Is extracted.
図9は文書処理フロー制御装置における文書処理フロー実行制御の一例を示すフローチャートである。このフローチャートに係るプログラムは、CPU101が実行するものであるが、図2の構成に基づき説明する。
FIG. 9 is a flowchart showing an example of document processing flow execution control in the document processing flow control device. The program related to this flowchart is executed by the
なお、記憶部207には、ジョブ入力部202により、複数の文書処理ジョブが既に入力され、ジョブ管理部201によって管理されているものとする。また、ジョブ入力部202は、処理対象の帳票画像が入力される度に、その帳票画像に対してユニークなジョブ識別番号を発行しているものとする。
It is assumed that a plurality of document processing jobs have already been input to the
S900にて、ジョブ管理部201は、記憶部207にキューイングされている未実行ジョブを取得し、当該ジョブのジョブステータスを「実行待ち」から「実行中」に更新する。ジョブ表示部203は、ジョブステータスの更新に応じて表示画面を更新する。そして、S910にて、ジョブ管理部201は、取得した未実行のジョブに対する文書処理フロー定義文書を記憶部207より取得する。そして、ジョブ管理部201は、取得した情報をジョブ実行部204に渡し、ジョブの実行を行わせる。
In S900, the
S920にて、ジョブ実行部204は、文書処理フロー定義文書の、先頭の<process>要素の文書処理を実行する。図4の文書処理フロー定義によれば、文字領域抽出(character extraction)の処理が、order属性1の最初の処理として記述されている。それ故、ジョブ実行部204は、入力した帳票の画像データの全域にわたって文字抽出処理を実行することになる。そして、ジョブ実行部204は、入力した帳票の画像データと、処理結果の出力データ(ここでは抽出した文字画像データ)とを、ジョブ識別番号に対応づけて、記憶部207に一時記憶する。
In S920, the
S930にて、ジョブ実行部204は、文書処理フロー定義に記載された全処理手順を実行したかどうかを判定し、全手順実行完了であればS940へ、未実行の文書処理があればS920へループし、次の文書処理を実行する。図4の文書処理フロー定義では文字領域抽出処理の次「order属性2」の文字認識(character recognition)がある。よって、ジョブ実行部204は、2回目のS920にて、先に抽出した文字画像に対する文字認識処理を実行する。この際、文書処理ジョブ実行部204は、文字認識対象の文字画像と文字認識結果(文字コード)とを、ジョブ識別番号と対応付けて記憶部207に一時記憶する。次いで、3回目のS920にて、「order属性3」の情報抽出(information extraction)の処理も同様に行う。図4のフロー定義文書によれば、ジョブ実行部204は、文字認識結果を受けて、文字認識結果である文字列から、患者識別情報(patient−id)を抽出する。更に、ジョブ実行部204は、文書種別情報(document−type)、文書の帰属診療科名(department−name)も抽出することになる。ジョブ実行部204は、文字認識結果と、抽出した患者識別情報(patient−id)、文書種別情報(document−type)、文書の帰属診療科名(department−name)を、ジョブ識別番号と対応づけて記憶部207に記憶する。この抽出を終えると次に行うべき処理がないので、ジョブ実行部204は処理を終える。このとき、ジョブ実行部204は、文書処理ジョブ管理部201に、該当するジョブの終了を通知する。
In S930, the
S940に処理が進むのは、S900で取得したジョブの文書処理フロー実行が終了した場合である。そのため、ジョブ管理部201は、ユーザによる修正確認の実行指示の待機状態とするため、当該ジョブのジョブステータスを「実行中」から「確認待ち」に更新し、確認処理実行指示がされるまで待機する。ジョブ表示部203は、このステータス更新を受けて、表示画面を更新する。
The processing proceeds to S940 when the document processing flow execution of the job acquired in S900 is completed. Therefore, the
S950で、ジョブ管理部201は、図3に示す文書処理ジョブ実行制御モニタから当該ジョブの結果確認実行指示がされたかどうかを判定する。図3においてジョブ識別番号“00182938”のジョブステータス「確認待ち」になっていて、ユーザが、このジョブに対して「実行」をクリックしたとする。この場合、ジョブ識別番号“00182938”に対する確認処理が実行される。そのため、ジョブ管理部201は、ユーザが指示したジョブ識別番号“00182938”をジョブ実行結果修正部205に渡し、修正を行わせる。
In S950, the
S960にて、ジョブ実行結果修正部205は、ジョブ表示部203を制御し、ユーザが指定した文書処理ジョブ結果の修正を行うための編集画面を表示し、修正処理を行う。図5はその表示画面の例である。そして、S970にて、ジョブ実行結果修正部205は修正、並びに、確認処理を行う。ジョブ実行結果修正部205による修正確認の処理の詳細は、図5乃至図8A,Bを用いて後述する。
In S960, the job execution
S980にて、ジョブ管理部201は、S970における修正確認の結果、修正結果を次回フロー実行に反映させるための再生処理が必要か否かを判定する。再生処理とは、一度行った文書処理フローに含まれる文書処理に対して修正結果を記憶させる処理である。次に再び文書処理をした時には、記憶された修正結果を出力(再生)する。図8Bに示す文書処理フロー実行結果の修正文書(又は編集情報)の<result>要素にchange属性が“1”となっているものがあれば、再生処理が必要である。また、change属性を持つ<result>要素がなければ、結果の確認のみで修正はされなかったと判定され、再生処理は不要となりジョブステータスを「確認待ち」から「完了」に更新して文書処理フロー制御の実行を終了する。
In S980, the
再生処理が必要と判定された場合、S990において、ジョブ管理部201は、修正結果再生部206に対し、修正結果を次回フロー実行に反映させるための再生処理の実行を要求する。かつ、ジョブ管理部201は、該当するジョブステータスを「確認待ち」から「再生完了」に更新して文書処理フロー制御の実行を終了する。修正結果再生部206によるS990の修正結果再生処理の詳細は図10を用いて後述する。
When it is determined that the reproduction process is necessary, in S990, the
次に、S960における、実施形態におけるジョブ実行結果修正部205による修正処理を説明する。図5は文書処理ジョブ結果の修正を行うための編集画面の一例である。図示において、参照符号500はジョブ実行結果の確認および修正を行う編集画面を表示するウインドウである。参照符号501は、図3で確認実行指示された修正確認対象のジョブ識別番号を表示する領域である。参照符号502は、当該ジョブの処理対象帳票画像の全体を縮小画像で表示し、帳票画像の一部分503を、表示領域504に拡大表示される。表示領域504に表示されるのが、どの位置かを確認するため、縮小帳票画像の一部分503がハッチング表示される。
Next, the correction process by the job execution
詳細は以下の説明から明らかになるが、図5は、ジョブ実行部204が文書種別情報(document−type)として、本来の意図通りに“検査報告書”を抽出した例を示している。そして、図5は、ジョブ実行部204が患者情報(patient−id)として“123456”を抽出すべきところ誤って検査IDの“3579090”を抽出し、帰属診療科名(department−name)として“胸腹部検診センター”を抽出すべきところ誤って“総合診療科”を抽出した場合を示している。
The details will be clarified from the following description, but FIG. 5 shows an example in which the
図5に示すように、3つの出力結果(患者番号、文書種別、診療科)の情報が、処理対象の画像のどこに描出されているかを簡単に把握可能とするため、それぞれに矩形枠505、506、507が表示される。
As shown in FIG. 5, in order to make it possible to easily grasp where the information of the three output results (patient number, document type, clinical department) is drawn in the image to be processed, the
参照符号508は処理結果である抽出情報の属性(又は項目名)、参照符号509が抽出情報の値を表示する領域である。抽出結果表示領域509の特定のセル領域をクリック等により指定すると、対応する矩形領域表示とともに強調表示される。図5においては患者番号が“3579090”のセルと、矩形領域507が対応関係にある抽出結果として強調表示される。参照符号510は抽出結果を修正する際の入力領域である。また、参照符号511は他の抽出候補がある場合に表示されるアイコンであり、クリックすると候補リストがアイコン下に表示され選択可能となる。そして、参照符号512は完了ボタンであり、ユーザは、確認・修正操作を完了させるときに押下することになる。
図6は図5の候補表示アイコン511をクリックした場合の表示例である。他の候補結果があれば、このアイコン511をクリックすると、その候補が表示され、その1つを選択することで、修正結果入力欄510に選択した候補が表示される。図示では、患者情報の他の候補“123456”が候補リスト602として表示されており、この候補をクリックすることで、患者番号に対応した編集結果入力欄510を更新できる。また、このとき、修正結果入力欄510の1つが文字入力用カーソルが点滅している(図示では、患者番号に対応する変数結果入力欄510)。ユーザは、不図示のキーボード等から、文字の挿入、削除などの編集操作が可能となる。また、患者番号として認識した矩形領域507がハイライト表示されるが、これは誤った領域であり、それ故、領域指定用カーソル601をマウス操作で移動し、正しい矩形領域600を指定することも可能である。図示の場合、矩形領域600が、本来の患者番号を示しているので、ユーザは矩形領域600の対角の2点を領域指定用カーソル601で設定する。正しい矩形領域600を設定しなおしたときに、ジョブ実行結果修正部205は該当する位置の文字認識結果(記憶部207に格納されている)をサーチし、その結果を修正結果入力欄510に表示する。なお、この正しい領域を設定した場合に、ユーザは、キーボード等から直接正しい患者番号“123456”を、修正結果入力欄510に入力しても構わない。上記のように、候補リスト602による操作、修正対象の抽出結果を選択した状態での領域指定用カーソル601による矩形領域の再設定、或いは、編集結果入力欄510へのダイレクト入力のいずれでも、患者情報を修正できる。
FIG. 6 is a display example when the
図7は出力結果となるべき矩形領域を指定して、処理結果を修正する場合の他の例を示す。図7において、診療科として抽出された結果「総合診療科」が誤っているが、他候補表示されていないため、矩形領域指定カーソル701により、矩形領域702の対角の2点を設定する。矩形領域702が確定すると、ジョブ実行結果修正部205は指定領域の文字認識処理を実行し、結果を修正結果入力欄510に表示する。
FIG. 7 shows another example in which the processing result is modified by designating the rectangular area to be the output result. In FIG. 7, although the “general clinical department” is incorrect as a result of being extracted as a clinical department, other candidates are not displayed. Therefore, two diagonal points of the
図8Aは文書処理フロー実行結果修正の処理を完了させた状態を示している。図5乃至図7の操作により、文書処理フロー実行結果のうち、患者番号、診療科が修正され、修正結果入力欄に入力されており、抽出結果の最終確認結果に対応する矩形領域枠801、802、803が表示される。この状態でユーザが「完了ボタン」を押下することで、実行結果修正部206による修正の処理が終了する。
FIG. 8A shows a state in which the process of correcting the execution result of the document processing flow is completed. By the operation of FIGS. 5 to 7, the patient number and the clinical department are corrected in the document processing flow execution result and entered in the correction result input field, and the
図8Bは図8Aで完了ボタンが押下された際に、実行結果修正部206が生成した文書処理フロー実行結果の修正文書の例である。この修正文書verified_resultはresut要素として、修正あるいは確認完了された処理結果の領域座標、データ種別とその値の組が格納される。また、処理結果に修正があった場合、resut要素にchange属性が付加される。
FIG. 8B is an example of a document processing flow execution result correction document generated by the execution
図10は、図9のS990における修正結果再生部206の処理の動作フローチャートである。以下、同図を参照して、修正結果再生部206の処理を説明する。
FIG. 10 is an operation flowchart of the processing of the correction
S1000にて、修正結果再生部206は、文書処理フローの実行結果確認が行われたジョブの文書処理フロー定義から処理手順を取得する。S1010にて、修正結果再生部206は、処理手順の末尾、すなわち、図4のprocess要素におけるorder属性が最大の処理からorder属性の降順に、S1020で処理を順次実行する。
In S1000, the correction
S1020にて、修正結果再生部206は、S1010で取得した処理を通常の文書処理実行とは異なる結果を記憶するための再生モードで実行する。この再生モードでは、修正結果再生部206は、各処理は指定される入力データを処理した結果に、同じく指定される出力結果が含まれるか否かを判定する。そして、含まれていれば、修正結果再生部206は、出力すべき結果となるよう、記憶部207に記憶されている文書処理結果の修正情報を記憶するテーブル(以下、修正テーブル)に記憶する。この修正テーブルについては、図13を用いて後述する。文書処理実行時には修正テーブルに記憶されたパターンが存在すれば、記憶されたパターンを出力する。
In S1020, the correction
S1030にて、修正結果再生部206は、図8Bの修正結果文書に記載されたすべての出力が再生可能となるよう修正テーブルに記憶されたと判定した場合、本処理を終了する。再生可能とならない修正結果があれば処理をS1040に進む。
When the correction
S1040において、修正結果再生部206は、S1000で取得された処理手順のすべてを終了したか否かを判定する。終了したと判定した場合は、処理をS1050へ進め、否の場合、つまり、未実行の処理があれば、S1020へループし、再生モードで実行する。
In S1040, the correction
S1050にて、修正結果再生部206は、すべての修正結果が再生可能となっていないが、処理手順のすべてを完了したならば、再生可能となっていない修正結果を修正テーブルに記憶して終了する。
In S1050, the correction
図11(a)および(b)は修正結果再生部206が、再生モードで情報抽出処理を実行する場合に参照する入力情報の例を示している。情報抽出処理は文書画像中の特定文字列をレイアウト情報も考慮して抽出するため、修正結果再生部206は、文字認識結果である文字列データと、その領域座標情報を入力とする。図11(b)は、図11(a)に示す文書画像から抽出された文字認識結果を格納した入力情報である。region要素が1つの文字領域における文字認識結果であり、id属性1、2、…、8のregion要素がそれぞれ図11(a)の参照符号1101、1102、…、1108に対応している。図11(b)において途中省略しているが、id属性3、4、5、6、7についても図11(a)のそれぞれの矩形表示領域に対応する。一方,図11(a)に記載される「胸腹部検診センター」は文字領域として認識されておらず,対応する文字情報が図11(b)に格納されない。各region要素には複数の文字認識結果char要素を格納でき、cand属性で識別される。例えば,region要素idが1の文字認識結果はcand属性1の「検査報告書」,cand属性2の「倹査報告書」の2つの候補文字列が格納されている。これら入力データに基づき、修正結果データである図8Bが再生可能となるよう、修正テーブルへ登録する。図8Bの場合、修正結果のresult要素のidが2である「検査報告書」、idが3である「123456」については入力情報に選択肢1101、1104として含まれている。このため、情報抽出処理での修正結果再生が可能といえるが、修正結果のresult要素のidが1である「胸腹部健診センター」は入力情報に選択肢として含まれていないため、情報抽出処理の処理対象とならず、修正結果再生はできない。
11 (a) and 11 (b) show an example of the input information referred to when the correction
図12(a)及び(b)は、修正結果再生部206が、再生モードで文字認識処理を実行する場合に参照する入力情報の例を示す。文字認識処理は文書画像中の文字が描画された領域内の字形パターンを認識して文字コード列を出力するため、文字が描画された領域座標を入力とする。図12(b)は図12(a)に示す文書画像から抽出された文字描画領域座標を格納した入力情報である。region要素が1つの文字描画領域であり、id属性1、2、8のregion要素がそれぞれ図11(a)の参照符号1101、1102、1108に対応している。図12(b)において途中省略しているが、id属性3、4、5、6、7についても図12(a)のそれぞれの文字描画領域に対応する。これら入力データに基づき、修正結果データである図8Bが再生可能となるよう、修正テーブルへ登録する。図12(a)の場合、修正結果のresult要素のidが2である「検査報告書」、idが3である「123456」については入力情報に選択肢1201、1204として含まれている。このため、文字認識処理での修正結果再生が可能といえるが、修正結果のresult要素のidが1である「胸腹部健診センター」は入力情報に選択肢として含まれていないため、文字認識処理の処理対象とならず、修正結果再生はできない。
12 (a) and 12 (b) show an example of input information referred to when the correction
図13は修正結果を再生可能とするために記憶される修正テーブルの一例を示す図である。修正テーブルはRAM103に保持したり、通信部106を介して不図示の外部記憶装置に保持したり、あるいはバス107に接続された不図示の外部記憶装置に保持するよう構成される。
FIG. 13 is a diagram showing an example of a correction table stored to make the correction result reproducible. The modification table is configured to be held in the
フィールド1300は入力データ識別情報であり、記憶対象の入力画像データを保持した保存場所のURL(Universal Resource Locator)を格納する。フィールド1301、1302、1303、1304は入力データにおける特定の矩形領域のX座標、Y座標、領域の高さを表すピクセル数、領域の幅を表すピクセル数をそれぞれ格納する。フィールド1306は、フィールド1301乃至1304が示す特定領域を構成する画像データであり、画像を構成する画素データ配列、または画素データ配列から算出された特徴量データ配列などを格納し、フィールド1305はそのデータサイズを格納する。フィールド1307は、フィールド1301乃至1304が示す特定領域に描画されている内容のデータ属性であり、本実施形態においては「患者番号」、「文書種別」、「診療科」のいずれかが格納される。フィールド1308は、フィールド1301乃至1304が示す特定領域に描画されている内容を格納する。
The
以上説明したように、本第1実施形態によれば、帳票画像に対するジョブ(予め設定された項目の文字列抽出に至る処理)に対するユーザによる修正(編集)結果を、次回のジョブの実行時に優先させることになる。例えば、レイアウトが異なるが、同じ目的の帳票画像を入力した場合、その中に「胸腹部検診センター」があれば、それが文書の帰属診療科名(department−name)として抽出されるようになる。 As described above, according to the first embodiment, the result of modification (editing) by the user for the job (process leading to the extraction of the character string of the preset item) for the form image is prioritized when the next job is executed. Will let you. For example, if a form image with a different layout but the same purpose is input, and if there is a "chest and abdomen examination center" in it, it will be extracted as the department name (department-name) of the document. ..
[第2実施形態]
上記の第1実施形態では、文書処理フロー定義に基づき実行した処理結果がユーザが望んでいなかった場合に修正を行い、その修正結果を次回の文書処理フロー実行時に再生するよう、フロー定義された処理を逆順に実行することにより修正結果を記憶した。
[Second Embodiment]
In the first embodiment described above, the flow is defined so that the processing result executed based on the document processing flow definition is corrected when the user does not want it, and the correction result is reproduced at the next document processing flow execution. The correction result was memorized by executing the processing in reverse order.
本第2実施形態では、修正結果を再生実行するよう文書処理のフロー定義文書を再定義することにより修正結果の記憶を行う。 In the second embodiment, the correction result is stored by redefining the flow definition document of the document processing so that the correction result is reproduced and executed.
図14は、修正結果を再生するために実行すべき再生記憶処理を記載した文書処理フロー定義文書の一例を示している。処理順定義をするprocess要素は図4と同様であるが、再生記憶処理定義部であるfeedback要素が追加される。feedback要素は図8Bの修正結果要素によって再生記憶処理を実行する処理を格納する。result_typeは修正結果要素を示し、regionであれば、図8Bにおけるregion要素に対応する。process要素は指定のresult_typeに対する再生記憶処理のために実行する処理を格納する。図4における文書処理フロー定義と同様、order属性を付加して複数の処理を連結することもできる。 FIG. 14 shows an example of a document processing flow definition document that describes the reproduction storage process to be executed in order to reproduce the correction result. The process element that defines the processing order is the same as in FIG. 4, but the feedback element that is the reproduction storage processing definition unit is added. The feedback element stores a process of executing the reproduction storage process according to the modification result element of FIG. 8B. result_type indicates a modification result element, and if it is a region, it corresponds to the region element in FIG. 8B. The process element stores the process to be executed for the reproduction storage process for the specified result_type. Similar to the document processing flow definition in FIG. 4, a plurality of processes can be concatenated by adding an orderer attribute.
図14を用いた修正結果再生処理においては、処理手順取得後、修正結果に含まれる修正結果要素を再生記憶する処理をfeedback要素から取得して実行することで、修正結果の再生記憶が実行される。 In the correction result reproduction processing using FIG. 14, after the processing procedure is acquired, the correction result reproduction storage is executed by acquiring and executing the processing for reproducing and storing the correction result element included in the correction result from the feedback element. To.
[第3実施形態]
第1、第2実施形態においては、修正結果を再生するための記憶情報を無条件に格納するように構成することで、同種のワークフロージョブの修正結果の再現を図っている。一方、再生記憶情報を活用することにより他のジョブの結果が変わってしまう可能性が考慮される。そこで、過去実行した文書処理ジョブを蓄積し、再生記憶情報を適用して蓄積ジョブを再実行して、修正結果が得られる比率が一定所定値以上になる場合のみ、当該再生記憶情報を残し、そうでなければ当該再生記憶情報を削除する。また、再生記憶情報を削除した場合、図3のジョブステータス302に「再生不能」を表示ステータスとして追加するように構成する。
[Third Embodiment]
In the first and second embodiments, the modification result of the same type of workflow job is reproduced by configuring the storage information for reproducing the modification result to be unconditionally stored. On the other hand, the possibility that the results of other jobs may change by utilizing the regenerated memory information is considered. Therefore, the document processing jobs executed in the past are accumulated, the reproduction storage information is applied, and the accumulation job is re-executed, and the reproduction storage information is left only when the ratio for obtaining the correction result becomes a certain predetermined value or more. If not, the reproduction storage information is deleted. Further, when the reproduction storage information is deleted, "unreproducible" is added as a display status to the
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
(Other Examples)
The present invention is also realized by executing the following processing. That is, software (program) that realizes the functions of the above-described embodiment is supplied to the system or device via a network or various storage media, and the computer (or CPU, MPU, etc.) of the system or device reads the program. This is the process to be executed.
100…文書処理フロー制御装置、101…CPU、102…ROM、103…RAM、104…文書処理部、105…表示部、106…通信部、107…バス、201…ジョブ管理部、202…ジョブ入力部、203…ジョブ表示部、204…ジョブ実行部、205…ジョブ実行結果修正部、206…修正結果再生部、207…記憶部 100 ... Document processing flow control device, 101 ... CPU, 102 ... ROM, 103 ... RAM, 104 ... Document processing unit, 105 ... Display unit, 106 ... Communication unit, 107 ... Bus, 201 ... Job management unit, 202 ... Job input Unit, 203 ... Job display unit, 204 ... Job execution unit, 205 ... Job execution result correction unit, 206 ... Correction result playback unit, 207 ... Storage unit
Claims (10)
処理対象の文書データと、当該文書データに対して行われる複数種類の処理とそれぞれの処理の順序を記述したフロー定義文書データとを入力する入力手段と、
前記フロー定義文書データに記述された順序に従った全処理を実行する実行手段と、
該実行手段による実行結果の誤りを、ユーザからの指示に従って修正する修正手段と、
前記フロー定義文書データに記述された処理の順序に対して逆の順に処理を実行し、各処理による処理の結果が前記修正手段による修正内容となるための情報を生成し、当該情報を記憶する記憶手段と、
前記記憶手段に記憶された情報に従った処理を実行させるための記述を前記フロー定義文書データに追加した新たなフロー定義文書データを、前記入力手段による入力対象として、生成する生成手段と
を有することを特徴とする情報処理装置。 An information processing device that processes document data
An input means for inputting document data to be processed, a plurality of types of processing performed on the document data, and flow definition document data describing the order of each processing .
An execution means for executing all processes in the order described in the flow definition document data, and
A correction means for correcting an error in the execution result by the execution means according to an instruction from the user, and a correction means.
The processing is executed in the reverse order of the processing order described in the flow definition document data, information is generated so that the result of the processing by each processing becomes the correction content by the correction means, and the information is stored. Memories and
It has a generation means for generating a new flow definition document data in which a description for executing a process according to the information stored in the storage means is added to the flow definition document data as an input target by the input means. An information processing device characterized by this.
前記修正手段は、The correction means
前記抽出処理で抽出された文字列が、設定された種類を示す正しい文字列か誤った文字列か、並びに、誤った文字列であれば正しい文字列を指定する指定手段を含み、The character string extracted by the extraction process includes a correct character string or an incorrect character string indicating the set type, and a specifying means for designating the correct character string if the character string is incorrect.
前記記憶手段は、The storage means
前記設定された種類と、前記文書データにおける前記指定手段で指定された正しい文字列が存在する領域を示す情報を記憶するStores information indicating the set type and the area in which the correct character string specified by the designated means in the document data exists.
ことを特徴とする請求項1に記載の情報処理装置。The information processing apparatus according to claim 1.
ことを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。The information processing device according to any one of claims 1 to 3, wherein the information processing device is characterized by the above.
処理対象の文書データと、当該文書データに対して行われる複数種類の処理とそれぞれの処理の順序を記述したフロー定義文書データとを入力する入力手段と、An input means for inputting document data to be processed, a plurality of types of processing performed on the document data, and flow definition document data describing the order of each processing.
前記フロー定義文書データに記述された順序に従った全処理を実行する実行手段と、An execution means for executing all processes in the order described in the flow definition document data, and
該実行手段による実行結果の誤りを、ユーザからの指示に従って修正する修正手段と、A correction means for correcting an error in the execution result by the execution means according to an instruction from the user, and a correction means.
前記フロー定義文書データに記述された処理の結果が前記修正手段による修正内容となるための情報を生成し、当該情報を記憶する記憶手段と、A storage means for generating information for the result of the process described in the flow definition document data to be the correction content by the correction means and storing the information, and a storage means for storing the information.
前記記憶手段に記憶された情報に従った処理を実行させるための記述を前記フロー定義文書データに追加した新たなフロー定義文書データを、前記入力手段による入力対象として、生成する生成手段とA generation means for generating new flow definition document data in which a description for executing a process according to the information stored in the storage means is added to the flow definition document data as an input target by the input means.
を有することを特徴とする情報処理装置。An information processing device characterized by having.
前記修正手段は、前記処理対象の文書データにおける、正しい文字列が存在する正しい領域を指定する手段を含み、 The correction means includes means for designating the correct area in which the correct character string exists in the document data to be processed.
前記記憶手段は、前記正しい領域を特定する座標情報を記憶するThe storage means stores coordinate information that identifies the correct area.
ことを特徴とする請求項5に記載の情報処理装置。The information processing apparatus according to claim 5.
ことを特徴とする請求項6に記載の情報処理装置。The information processing apparatus according to claim 6.
処理対象の文書データと、当該文書データに対して行われる複数種類の処理とそれぞれの処理の順序を記述したフロー定義文書データとを入力する入力工程と、
前記フロー定義文書データに記述された順序に従った全処理を実行する実行工程と、
該実行工程による実行結果の誤りを、ユーザからの指示に従って修正する修正工程と、
前記フロー定義文書データに記述された処理の順序に対して逆の順に処理を実行し、各処理による処理の結果が前記修正工程による修正内容となるための情報を生成し、当該情報を記憶する記憶工程と、
前記記憶工程で記憶された情報に従った処理を実行させるための記述を前記フロー定義文書データに追加した新たなフロー定義文書データを、前記入力工程による入力対象として、生成する生成工程と
を有することを特徴とする情報処理装置の制御方法。 A control method for an information processing device that processes document data .
An input process for inputting document data to be processed, a plurality of types of processing performed on the document data, and flow definition document data describing the order of each processing .
An execution process that executes all processes in the order described in the flow definition document data, and
A correction step of correcting an error in the execution result by the execution process according to an instruction from the user ,
The processing is executed in the reverse order of the processing order described in the flow definition document data, information is generated so that the result of the processing by each processing becomes the correction content by the correction step, and the information is stored. Memory process and
It has a generation step of generating new flow definition document data in which a description for executing a process according to the information stored in the storage step is added to the flow definition document data as an input target by the input step. A control method for an information processing device, which is characterized in that.
処理対象の文書データと、当該文書データに対して行われる複数種類の処理とそれぞれの処理の順序を記述したフロー定義文書データとを入力する入力工程と、An input process for inputting document data to be processed, a plurality of types of processing performed on the document data, and flow definition document data describing the order of each processing.
前記フロー定義文書データに記述された順序に従った全処理を実行する実行工程と、An execution process that executes all processes in the order described in the flow definition document data, and
該実行工程による実行結果の誤りを、ユーザからの指示に従って修正する修正工程と、A correction step of correcting an error in the execution result by the execution process according to an instruction from the user,
前記フロー定義文書データに記述された処理の結果が前記修正工程による修正内容となるための情報を生成し、当該情報を記憶する記憶工程と、A storage process for generating information for the result of the process described in the flow definition document data to be the content of the correction by the correction step and storing the information,
前記記憶工程で記憶された情報に従った処理を実行させるための記述を前記フロー定義文書データに追加した新たなフロー定義文書データを、前記入力工程による入力対象として、生成する生成工程とA generation step of generating new flow definition document data in which a description for executing a process according to the information stored in the storage step is added to the flow definition document data as an input target by the input step.
を有することを特徴とする情報処理装置の制御方法。A method for controlling an information processing device, which comprises.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016043928A JP6771906B2 (en) | 2016-03-07 | 2016-03-07 | Information processing device and its control method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016043928A JP6771906B2 (en) | 2016-03-07 | 2016-03-07 | Information processing device and its control method and program |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017162033A JP2017162033A (en) | 2017-09-14 |
JP2017162033A5 JP2017162033A5 (en) | 2019-04-11 |
JP6771906B2 true JP6771906B2 (en) | 2020-10-21 |
Family
ID=59857999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016043928A Active JP6771906B2 (en) | 2016-03-07 | 2016-03-07 | Information processing device and its control method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6771906B2 (en) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005266925A (en) * | 2004-03-16 | 2005-09-29 | Toshiba Solutions Corp | Form reader, program and form reading method by form reader |
JP5353476B2 (en) * | 2009-06-24 | 2013-11-27 | 富士ゼロックス株式会社 | Document transmission apparatus, document transmission program, and document flow system |
JP2012190357A (en) * | 2011-03-11 | 2012-10-04 | Murata Mach Ltd | Image processing device, image processing method and program |
JP5961196B2 (en) * | 2014-01-29 | 2016-08-02 | 京セラドキュメントソリューションズ株式会社 | Electronic device and workflow generation program |
JP2016015007A (en) * | 2014-07-02 | 2016-01-28 | 株式会社リコー | Information processing apparatus, information processing system, information processing method, and program |
-
2016
- 2016-03-07 JP JP2016043928A patent/JP6771906B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017162033A (en) | 2017-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11775262B2 (en) | Multi-technology visual integrated data management and analytics development and deployment environment | |
US7979849B2 (en) | Automatic model-based testing | |
KR101076867B1 (en) | Automatic Image Capture to Generate Content | |
JP5267732B2 (en) | Web page control method, computer system, and program | |
JPH0895767A (en) | Program generation method using program parts | |
CN113807698A (en) | Work order generation method and device, electronic equipment and readable storage medium | |
JP2016009423A (en) | Information processing device, method for controlling information processing device, and program | |
JP6771906B2 (en) | Information processing device and its control method and program | |
JPH11305998A (en) | Computer system | |
JP6336922B2 (en) | Business impact location extraction method and business impact location extraction device based on business variations | |
JP2008009966A (en) | Device and method for setting business process | |
JP2001273125A (en) | Source program automatic generation method and system, and program recording medium therefor | |
JP4357226B2 (en) | Form definition device, form definition method, and form definition program | |
JP2002298081A (en) | Optical character recognition device and field definition method of document reading definition body | |
JP4867229B2 (en) | Information processing apparatus and program | |
JP7395934B2 (en) | Information processing device and program | |
JP2007034807A (en) | Information processing apparatus and program | |
CN112306333A (en) | Data filling method and device | |
JP2024094938A (en) | Information processing apparatus, information processing method, and program | |
JP2009230322A (en) | Job management system | |
JPS63211433A (en) | Prior error check system for generating command procedure/job control language | |
JP2007034806A (en) | Information processing apparatus and program | |
JP2006243996A (en) | Job network management system | |
JPS61145628A (en) | Pattern control system | |
JP2020113057A (en) | Information processing device and information processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190304 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190304 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200330 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200831 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200930 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6771906 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |