JP5845764B2 - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP5845764B2 JP5845764B2 JP2011205615A JP2011205615A JP5845764B2 JP 5845764 B2 JP5845764 B2 JP 5845764B2 JP 2011205615 A JP2011205615 A JP 2011205615A JP 2011205615 A JP2011205615 A JP 2011205615A JP 5845764 B2 JP5845764 B2 JP 5845764B2
- Authority
- JP
- Japan
- Prior art keywords
- character recognition
- information
- module
- name
- person
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
請求項1の発明は、動画内で撮影されている静止画像を判定する判定手段と、前記判定手段によって判定された静止画像を対象として文字認識を行う文字認識手段と、前記動画に関する情報を取得する取得手段と、前記取得手段によって取得された情報に基づいて、前記文字認識手段による文字認識結果を修正する修正手段と、前記修正手段によって修正された文字認識結果を前記動画と関連付けて出力する出力手段を具備し、前記取得手段は、前記動画内の人物を認識して、該人物に関する情報を取得し、前記修正手段は、前記取得手段によって取得された人物に関する情報に基づいて、前記文字認識結果を修正することを特徴とする情報処理装置である。
請求項2の発明は、前記取得手段は、前記文字認識手段による文字認識結果内の人物名又は出来事名を抽出し、該人物名又は該出来事名が複数ある場合は、前記静止画像の時間的順番に基づいた重み付けを行い、該重み付けの結果を用いて選択した人物名又は出来事名に関する情報を取得し、前記修正手段は、前記取得手段によって取得された人物名又は出来事名に関する情報に基づいて、前記文字認識手段による文字認識結果を修正することを特徴とする請求項1に記載の情報処理装置である。
請求項3の発明は、動画内で撮影されている静止画像を判定する判定手段と、前記判定手段によって判定された静止画像を対象として文字認識を行う文字認識手段と、前記動画に関する情報を取得する取得手段と、前記取得手段によって取得された情報に基づいて、前記文字認識手段による文字認識結果を修正する修正手段と、前記修正手段によって修正された文字認識結果を前記動画と関連付けて出力する出力手段を具備し、前記取得手段は、前記文字認識手段による文字認識結果内の人物名又は出来事名を抽出し、該人物名又は該出来事名が複数ある場合は、前記静止画像の時間的順番に基づいた重み付けを行い、該重み付けの結果を用いて選択した人物名又は出来事名に関する情報を取得し、前記修正手段は、前記取得手段によって取得された人物名又は出来事名に関する情報に基づいて、前記文字認識手段による文字認識結果を修正することを特徴とする情報処理装置である。
請求項10の発明は、コンピュータを、動画内で撮影されている静止画像を判定する判定手段と、前記判定手段によって判定された静止画像を対象として文字認識を行う文字認識手段と、前記動画に関する情報を取得する取得手段と、前記取得手段によって取得された情報に基づいて、前記文字認識手段による文字認識結果を修正する修正手段と、前記修正手段によって修正された文字認識結果を前記動画と関連付けて出力する出力手段として機能させ、前記取得手段は、前記文字認識手段による文字認識結果内の人物名又は出来事名を抽出し、該人物名又は該出来事名が複数ある場合は、前記静止画像の時間的順番に基づいた重み付けを行い、該重み付けの結果を用いて選択した人物名又は出来事名に関する情報を取得し、前記修正手段は、前記取得手段によって取得された人物名又は出来事名に関する情報に基づいて、前記文字認識手段による文字認識結果を修正することを特徴とする情報処理プログラムである。
請求項2の情報処理装置によれば、静止画像の時間的順番による重み付けが行われた人物名又は出来事名に関する情報に基づいて、文字認識結果を修正することができる。
請求項3の情報処理装置によれば、動画と関連付ける情報として、本構成を有していない場合に比較して、動画内の画像に対する文字認識結果であって、認識精度の高い文字認識結果を用いることができる。また、静止画像の時間的順番による重み付けが行われた人物名又は出来事名に関する情報に基づいて、文字認識結果を修正することができる。
請求項10の情報処理プログラムによれば、動画と関連付ける情報として、本構成を有していない場合に比較して、動画内の画像に対する文字認識結果であって、認識精度の高い文字認識結果を用いることができる。また、静止画像の時間的順番による重み付けが行われた人物名又は出来事名に関する情報に基づいて、文字認識結果を修正することができる。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
動画に情報を関連付けるとは、その情報によって動画を検索しやすいようにするためである。本実施の形態は、例えば、講義風景を撮影した動画を解析して、文字列を抽出しインデキシングしてテキストによる動画検索を可能とするシステムに利用され得るものである。より具体的には、撮影されている動画像に、スライド投影されているシーンが存在する場合に、そのスライドに含まれる文字列を抽出してインデキシングを行い検索可能とするものである。
動画読取モジュール105は、動画格納モジュール100、スライド画像判定モジュール110と接続されている。動画読取モジュール105は、動画格納モジュール100に記憶されている動画から、対象とする動画を読み取り、スライド画像判定モジュール110に渡す。
さらに、静止画像と判定する条件として、その静止画像が矩形であること、その静止画像内の予め定められた色(例えば、白等)の面積として、予め定められた割合より高い又は以上であること等を付け加えてもよい。
コンテキスト取得モジュール125は、キーワード群選択モジュール130と接続されている。コンテキスト取得モジュール125は、動画読取モジュール105が読み取った動画に関する情報を取得する。コンテキスト取得モジュール125が行う処理は、図2又は図3の例に示すコンテキスト取得モジュール125内のモジュールとして、後述する。
キーワード群格納モジュール140は、キーワード群選択モジュール130、単語出力モジュール145と接続されている。キーワード群格納モジュール140は、キーワード群選択モジュール130、単語出力モジュール145からアクセスされ、キーワード群を記憶している。キーワード群格納モジュール140が記憶しているキーワード群については、図2、図3、図6、図8、図10、図13、図17、図20等の例を用いて説明する。
単語出力モジュール145は、単語推定モジュール120、キーワード群格納モジュール140、単語格納モジュール150と接続されている。単語出力モジュール145は、単語推定モジュール120によって修正された文字認識結果を対象としている動画と関連付けて出力する。例えば、単語推定モジュール120から受け取った単語を対象としている動画のインデキシングのために、単語格納モジュール150に格納するとともに、コンテキスト取得モジュール125が取得したコンテキスト情報と単語推定モジュール120から受け取った単語を対応させてキーワード群格納モジュール140に格納し、キーワード群格納モジュール140内の情報をアップデートする。
単語格納モジュール150は、単語出力モジュール145と接続されている。単語格納モジュール150は、対象としている動画と関連付けて、単語推定モジュール120から渡された文字認識結果を記憶する。例えば、テキストをキーワードとして動画を検索可能にするデータベース等である。
動画読取モジュール105は、スライド画像判定モジュール110、コンテキスト取得モジュール125の人物認識モジュール210と接続されている。
スライド画像判定モジュール110は、動画読取モジュール105、文字認識モジュール115、コンテキスト取得モジュール125の動画ID・ページNo認識モジュール220と接続されている。
文字認識モジュール115は、スライド画像判定モジュール110、単語推定モジュール120、コンテキスト取得モジュール125の講演者名認識モジュール230と接続されている。
人物認識モジュール210は、動画読取モジュール105、キーワード群選択モジュール130と接続されている。人物認識モジュール210は、対象としている動画内の人物を認識して、その人物に関する情報を取得する。例えば、動画に出現する公演者に対して顔認識を行い、顔認識の結果である顔情報(人物を特定する情報、具体的には、名前、識別情報等)をコンテキスト情報とする。詳細な処理内容については、図4から図6の例を用いて後述する。
この人物認識モジュール210による処理結果を用いる場合、単語推定モジュール120は、人物認識モジュール210によって取得された人物に関する情報に基づいて、文字認識結果を修正する。
この動画ID・ページNo認識モジュール220による処理結果を用いる場合、単語推定モジュール120は、動画ID・ページNo認識モジュール220によって取得された文字情報に基づいて、文字認識結果を修正する。
この講演者名認識モジュール230による処理結果を用いる場合、単語推定モジュール120は、講演者名認識モジュール230によって取得された人物名に関する情報に基づいて、文字認識モジュール115による文字認識結果を修正する。
単語推定モジュール120は、文字認識モジュール115から渡された認識結果の文字列と、キーワード群選択モジュール130によって選択されたキーワード群の類似度を判定し、予め定められた閾値以上のキーワードを単語候補として、単語出力モジュール145へ出力する。また、類似度を判定せずに、形態素解析等の処理によって単語として認識されたものを単語候補として、単語出力モジュール145へ出力するようにしてもよい。そして、これらの単語候補は、単語出力モジュール145によって、コンテキストの新しい値としてキーワード群格納モジュール140にフィードバックされる。
動画読取モジュール105は、スライド画像判定モジュール110、講義名特定モジュール320と接続されている。
スライド画像判定モジュール110は、動画読取モジュール105、文字認識モジュール115と接続されている。
文字認識モジュール115は、スライド画像判定モジュール110、単語推定モジュール120、テキスト群整形モジュール330、人名抽出モジュール340、講義名抽出モジュール350と接続されている。
コンテキスト取得モジュール125は、講義名特定モジュール320、テキスト群整形モジュール330、人名抽出モジュール340、講義名抽出モジュール350の少なくとも一つを有している。
講義名特定モジュール320は、動画読取モジュール105、キーワード群選択モジュール130、タイムテーブル記憶モジュール310と接続されている。講義名特定モジュール320は、対象としている動画の撮影場所と撮影日時に関する情報を抽出し、その撮影場所とその撮影日時に行われた出来事に関する情報を取得する。ここで、出来事としては、例えば講義がある。講義予定(タイムテーブル、場所と日時と講義名等を含む)から、講義に関する情報を取得する。
例えば、講義名特定モジュール320は、動画読取モジュール105で読み取られる動画の動画情報から、その動画が撮影された日時に関する情報である日時情報、撮影された場所に関する情報である場所情報を抽出する。動画が日時情報、場所情報と共に動画格納モジュール100に格納されている場合は、その日時情報、場所情報を抽出する。また、日時情報に関しては動画ファイルの記録日時から取得するようにしてもよい。場所情報に関しては、動画に含まれるメタデータからカメラのシリアル番号を抽出し、予め用意されたシリアル番号と場所情報とを対応付けたテーブルを利用することにより、場所情報を抽出するようにしてもよい。そして、その日時情報の曜日と時間から特定される講義名や授業名から、講義に関する情報を取得する。
詳細な処理内容については、図11から図14の例を用いて後述する。
この講義名特定モジュール320による処理結果を用いる場合、単語推定モジュール120は、講義名特定モジュール320によって取得された出来事に関する情報に基づいて、文字認識モジュール115による文字認識結果を修正する。
このテキスト群整形モジュール330による処理結果を用いる場合、単語推定モジュール120は、テキスト群整形モジュール330によって取得された文字列に関する情報に基づいて、文字認識モジュール115による文字認識結果を修正する。
この人名抽出モジュール340による処理結果を用いる場合、単語推定モジュール120は、人名抽出モジュール340によって取得された人物名に関する情報に基づいて、文字認識モジュール115による文字認識結果を修正する。
この講義名抽出モジュール350による処理結果を用いる場合、単語推定モジュール120は、講義名抽出モジュール350によって取得された出来事名に関する情報に基づいて、文字認識モジュール115による文字認識結果を修正する。
単語推定モジュール120は、文字認識モジュール115から渡された認識結果の文字列と、キーワード群選択モジュール130によって選択されたキーワード群の類似度を判定し、予め定められた閾値以上のキーワードを単語候補として、単語出力モジュール145へ出力する。また、類似度を判定せずに、形態素解析等の処理によって単語として認識されたものを単語候補として、単語出力モジュール145へ出力するようにしてもよい。そして、これらの単語候補は、単語出力モジュール145によって、コンテキストの新しい値としてキーワード群格納モジュール140にフィードバック(格納)される。
ステップS404では、キーワード群選択モジュール130が、得られた顔情報を利用して、その顔情報に関連付けられている、キーワード群をキーワード群格納モジュール140から検索する。
ステップS406は、文字認識モジュール115が、静止画像を対象として文字認識を行う。
ステップS410では、単語推定モジュール120が、形態素解析の結果、名詞として抽出された単語を抽出する。さらに、ステップS408で切り出された、文字列とキーワード群に含まれるキーワードとの類似度を算出する。この場合、同じ長さの単語同士を比較することで計算量を減らすようにしてもよい。類似度の算出は、レーベンシュタイン距離と単語の長さを利用することで求める。
ステップS414では、単語出力モジュール145が、解析結果を出力する。これらの結果は動画を示すIDとともにインデキシングされる。
図4の例に示すフローチャートの処理は、1つの動画に含まれる静止画像に対して、文字認識した結果を修正しているが、動画に含まれるスライド一枚毎に処理をするようにしてもよい。
動画500は、対象としている動画内の一フレームの画像である。動画500には、スライド画像510、人物が撮影されている。スライド画像判定モジュール110が、動画500を静止画像として判定する。
ステップS402で、人物認識モジュール210が、顔領域520に対して顔認識を行う。例えば、人物Aであると認識できたとする。
ステップS404で、キーワード群選択モジュール130が、図6の例に示す人物キーワード群テーブル600から、コンテキストの種類が人物(コンテキストの種類欄604)であり、その値(顔認識の結果)が人物A(コンテキストの値欄606)である、キーワード群(キーワード群欄608)を抽出する。なお、人物キーワード群テーブル600は、図2の例に示したキーワード群テーブル240と同等のものである。ここでは、キーワード群欄608内の「セキュリティ、認証、暗号、アクセス」のキーワード群を抽出することになる。
ステップS408で、単語推定モジュール120が、文字認識結果に対する形態素解析の結果、名詞である「セーフティ」を抽出する。
そして、ステップS404で抽出したキーワード群内の各文字列の長さを計数する。この場合は、6文字、2文字、4文字となる。そこで、文字認識結果を2文字、4文字、6文字になるように切り分ける。この結果、「墓本、本釣、釣1、1こ、こ七、七キ、・・・、七キュリTオ、・・・、ティな畳右る」となる。
ステップS412で、単語出力モジュール145が、形態素解析の結果得られた単語「セーフティ」と類似度計算の結果得られたキーワード「セキュリティ」をキーワード群格納モジュール140に対して格納する。つまり、「人物A」に対応する人物キーワード群テーブル600のキーワード群欄608に「セーフティ」が追加されることになる。なお、「セキュリティ」は既にあるキーワードである。
ステップS414で、単語出力モジュール145が、対象としている動画に対して、「セーフティ」と「セキュリティ」をインデキシング情報として付加する。
ステップS702では、動画ID・ページNo認識モジュール220が、動画ID・ページNoを特定したか否かを判断し、特定した場合はステップS704へ進み、特定なしの場合はステップS706へ進む。動画IDとページNoの特定では、解析対象の動画に与えられた動画IDを利用する。この動画IDはその動画に予め付されていたものを利用してもよいし、動画IDと対応して動画のタイトル、撮影日時を記憶しているテーブルを用いて、動画に付されているタイトル、撮影日時から動画IDを求めてもよい。ページNoは、その動画IDの動画が解析される場合に、テキスト抽出対象として抽出された静止画像の時間的順番を示すものである。つまり、静止画像として抽出された画像の順番である。具体的には、スライドが変わると(ページめくりされると)、新しくそのスライドが静止画像として抽出されることになる。したがって、静止画像として判定されたものの時間的順番が、ここでのページNoとなる。
例えば、キーワード群格納モジュール140内に動画ID・ページIDキーワード群テーブル800が記憶されており、静止画像を抽出した動画が、A123という動画IDであり、3ページ目の静止画像と特定した場合について説明する。なお、図8は、動画ID・ページIDキーワード群テーブル800のデータ構造例を示す説明図である。動画ID・ページIDキーワード群テーブル800は、ID欄802、コンテキストの種類欄804、コンテキストの値欄806、キーワード群欄808を有している。動画ID・ページIDキーワード群テーブル800は、キーワード群テーブル240と同等のものであるが、説明のため、コンテキストの種類欄804が動画ID・ページNoのものを示している。
キーワード群選択モジュール130が行うキーワード群検索では、得られた動画ID:A123のページNo:003に関連するキーワード群を検索する。検索方法としては複数種類ある。例えば、A123が動画IDである全てのページを検索し(動画IDだけを用いた検索)、そのキーワード群欄808を抽出するようにしてもよい。A123が動画ID、かつ、ページNoが003であるものを検索し(動画ID及びページNoを用いた検索)、そのキーワード群欄808を抽出するようにしてもよい。又は、A123が動画IDであり、ページNoが003に関連するページNo(例えば、そのページの前の予め定められたページ数等、具体的には、1ページ、2ページ、3ページ等)を検索し、そのキーワード群欄808を抽出するようにしてもよい。さらに、後に続く静止画像のページも解析した後に、前ページだけでなく、後ろのページについても検索対象(例えば、そのページの後の予め定められたページ数等、具体的には、3ページ、4ページ、5ページ等、そのページの前と後ろの予め定められたページ数等、具体的には、1ページ、2ページ、3ページ、4ページ等)とし、そのキーワード群欄808を抽出するようにしてもよい。
ステップS706では、文字認識モジュール115が、静止画像を対象として文字認識を行う。
ステップS708では、単語推定モジュール120が、文字認識結果である文字列に対して、文字列の切り出しを行う。
ステップS710では、単語推定モジュール120が、形態素解析の結果、名詞として抽出された単語を抽出する。さらに、ステップS708で切り出された、文字列とキーワード群に含まれるキーワードとの類似度を算出する。
ステップS712では、単語出力モジュール145が、形態素解析の結果得られた単語と類似度計算の結果得られた単語をキーワード群格納モジュール140に格納する。
ステップS714では、単語出力モジュール145が、解析結果を出力する。
図7の例に示すフローチャートの処理は、1つの動画に含まれる静止画像に対して、文字認識した結果を修正しているが、動画に含まれるスライド一枚毎に処理をするようにしてもよい。
ステップS902では、講演者名認識モジュール230が、講演者名を特定したか否かを判断し、特定した場合はステップS904へ進み、特定なしの場合はステップS906へ進む。ページNoが予め定められた数(例えば、1又は2)である静止画像に対して、文字認識モジュール115により文字認識を行わせる。そして、その文字認識結果内で、予め講演者名を記憶しているテーブル(例えば、後述する講演者名キーワード群テーブル1000、講演者名キーワード群テーブル1000のコンテキストの値欄1006だけのテーブル等)内の講演者名と一致するものがあるか否かを判断する。一致するものがある場合は、講演者名を特定したことになり、一致するものがない場合は、講演者名を特定なしになる。
例えば、キーワード群格納モジュール140内に講演者名キーワード群テーブル1000が記憶されている。なお、図10は、講演者名キーワード群テーブル1000のデータ構造例を示す説明図である。講演者名キーワード群テーブル1000は、ID欄1002、コンテキストの種類欄1004、コンテキストの値欄1006、キーワード群欄1008を有している。講演者名キーワード群テーブル1000は、キーワード群テーブル240と同等のものであるが、説明のため、コンテキストの種類欄1004が講演者名のものを示している。
キーワード群選択モジュール130が行うキーワード群検索では、得られた講演者名をコンテキストの値欄1006から検索し、その講演者名に関連するキーワード群欄1008を抽出する。
ステップS906では、文字認識モジュール115が、静止画像を対象として文字認識を行う。
ステップS908では、単語推定モジュール120が、文字認識結果である文字列に対して、文字列の切り出しを行う。
ステップS910では、単語推定モジュール120が、形態素解析の結果、名詞として抽出された単語を抽出する。さらに、ステップS908で切り出された、文字列とキーワード群に含まれるキーワードとの類似度を算出する。
ステップS912では、単語出力モジュール145が、形態素解析の結果得られた単語と類似度計算の結果得られた単語をキーワード群格納モジュール140に格納する。
ステップS914では、単語出力モジュール145が、解析結果を出力する。
図9の例に示すフローチャートの処理は、1つの動画に含まれる静止画像に対して、文字認識した結果を修正しているが、動画に含まれるスライド一枚毎に処理をするようにしてもよい。
ステップS1102では、講義名特定モジュール320が、動画の撮影日時及び撮影場所を取得する。この取得方法は、講義名特定モジュール320の処理の説明で既に述べた。
ステップS1104では、講義名特定モジュール320が、撮影日時から曜日と時間を求め、場所と曜日・時間をキーとしてタイムテーブル記憶モジュール310を検索し、講義名を取得する。タイムテーブル記憶モジュール310内にはタイムテーブル1200等が記憶されている。図12は、タイムテーブル1200等のデータ構造例を示す説明図である。タイムテーブル1200は、時間割欄1202、月欄1204、火欄1206、水欄1208等を有している。タイムテーブルは、例えば学年毎に複数ある(タイムテーブル1200、1220、1240)。時間割欄1202は、講義の開始時刻と終了時刻を記憶している。月欄1204は、月曜日の講義と教室を記憶している。火欄1206は、火曜日の講義と教室を記憶している。水欄1208は、水曜日の講義と教室を記憶している。講義名特定モジュール320は、撮影日時から、該当する曜日と時間における講義名と教室を抽出し、撮影場所が教室と一致している講義名を取得する。なお、ここで、講義名を取得できたか否かを判断して、取得できた場合はステップS1106へ進み、それ以外の場合はステップS1108へ進むようにしてもよい。
例えば、キーワード群格納モジュール140内に講義名キーワード群テーブル1300が記憶されており、講義名が「経済I」と特定した場合について説明する。なお、図13は、講義名キーワード群テーブル1300のデータ構造例を示す説明図である。講義名キーワード群テーブル1300は、ID欄1302、コンテキストの種類欄1304、コンテキストの値欄1306、キーワード群欄1308を有している。講義名キーワード群テーブル1300は、キーワード群テーブル240と同等のものであるが、説明のため、コンテキストの種類欄1304が講義名のものを示している。
キーワード群選択モジュール130が行うキーワード群検索では、得られた講義名をコンテキストの値欄1306から検索し、それに対応するキーワード群欄1308を抽出する。ここでは、「経済」、「市場」、「エコノミック」、「GDP」というキーワード群が抽出される。
ステップS1110では、全ての抽出画像について処理が完了したか否かを判断し、完了した場合は処理を終了し(ステップS1199)、それ以外の場合はステップS1112へ進む。
ステップS1114では、単語推定モジュール120が、文字認識結果である文字列に対して、文字列の切り出しを行う。文字認識された文字列に対して、形態素解析を行い、ステップS1106のキーワード群検索で検索されたキーワードの文字列の長さになるように、文字列を切り出す。
前述の文字認識結果の例では、形態素解析の結果、「キャピタル」、「経済」が名詞として抽出される。ステップS1106のキーワード群検索で検索されたキーワードの文字列の長さは、「経済」、「市場」、「エコノミック」、「GDP」というキーワードであるので、2文字、3文字、6文字である。したがって、切り出した文字列は、「エコ、コソ、ソミ、ミツ、ツク、・・・、エコソミツク、コソミツクキ、・・・」となる。
切り出された文字列とキーワード群に含まれるキーワードの類似度の算出について説明する。同じ長さの単語同士を比較することで計算量を減らし、類似度の算出はレーベンシュタイン距離と単語の長さを利用する具体例を用いる。「エコソミツク」(文字認識結果である文字列であり、6文字で切り分けられたもの)と「エコノミック」(キーワード群に含まれるキーワード)とを比較した場合、「ソ」、「ツ」の2文字が異なるのでレーベンシュタイン距離は2となり、その値を単語列の長さ6で割った値である0.3を類似度とする。そして、類似度が予め定められた閾値以下の場合に候補として、比較対象となったキーワードを単語出力モジュール145へ出力する。閾値が0.5の場合、「エコノミック」が出力される。
ステップS1120では、単語出力モジュール145が、対象としている動画に対して、「エコノミック」、「キャピタル」、「経済」をインデキシング情報として付加する。具体的には、これらのキーワードは、動画ID及びスライド画像が出現した時間とともにインデキシングされる。
図11の例に示すフローチャートの処理は、動画に含まれるスライド一枚毎の処理であるが、1つの動画に含まれる静止画像に対して、文字認識した結果を修正するようにしてもよい。
ステップS1502では、スライド画像判定モジュール110が、動画を解析して、スライドが投影されている画像を静止画像(又は、スライドが投影されている画像内のスライド部分を静止画像)として抽出する。例えば、スライド画像1610を静止画像として抽出した例について説明する。図16は、動画1600、スライド画像1610の例を示す説明図である。動画1600には、スライド画像1610が撮影されている。ステップS1504降の処理は、抽出された静止画像の枚数分の繰り返し処理となる。
ステップS1504では、全ての抽出画像について処理が完了したか否かを判断し、完了した場合は処理を終了し(ステップS1599)、それ以外の場合はステップS1506へ進む。
ステップS1508では、テキスト群整形モジュール330が、文字認識結果に対して整形を行う。まず文字認識結果の文字列に対して形態素解析を行い、単語を抽出する。さらに、その文字認識結果に対して、予め定められた長さの文字列を抽出する。前述の例では、名詞である「セーフティ」を単語として抽出する。そして、2文字以上、6文字以下の文字列に切り出しを行う。その結果、「墓木、木釣、釣1、1こ、こ七、七キ、・・・、七キュリTオ、・・・、ティな畳右る」となる。
例えば、キーワード群格納モジュール140内にテキスト群キーワード群テーブル1700が記憶されてする。なお、図17は、テキスト群キーワード群テーブル1700のデータ構造例を示す説明図である。テキスト群キーワード群テーブル1700は、ID欄1702、コンテキストの種類欄1704、キーワード群欄1708を有している。講義名キーワード群テーブル1300は、キーワード群テーブル240からコンテキストの値欄246を削除したものと同等のものである。なお、空欄であるコンテキストの値欄246と同等の欄を含めてもよい。説明のため、コンテキストの種類欄1704がテキスト群のものを示している。
この検索の場合、全ての単語、文字列がキーワード群欄1708内のキーワードとマッチする必要はなく、予め定められた数以上のマッチ、又は、マッチした数を検索したキーワード数等で割ったマッチ度数が予め定められた値以上であればよい。前述の例では、「セーフティ」がマッチしたので(テキスト群キーワード群テーブル1700内の1行目)、そのカラムに含まれるキーワード群(セキュリティ、セーフティ)を検索結果として返す。
切り出された文字列とキーワード群に含まれるキーワードの類似度の算出について説明する。同じ長さの単語同士を比較することで計算量を減らし、類似度の算出はレーベンシュタイン距離と単語の長さを利用する具体例を用いる。「七キュリTオ」(文字認識結果である文字列であり、6文字で切り分けられたもの)と「セキュリティ」(キーワード群に含まれるキーワード)とを比較した場合、「七」、「T」、「オ」の3文字が異なるのでレーベンシュタイン距離は3となり、その値を単語列の長さ6で割った値である0.5を類似度とする。そして、類似度が予め定められた閾値以下の場合に候補として、比較対象となったキーワードを単語出力モジュール145へ出力する。閾値が0.5の場合、「セキュリティ」が出力される。
ステップS1516では、単語出力モジュール145が、対象としている動画に対して、「セーフティ」、「セキュリティ」をインデキシング情報として付加する。具体的には、これらのキーワードは、動画ID及びスライド画像が出現した時間とともにインデキシングされる。
図15の例に示すフローチャートの処理は、動画に含まれるスライド一枚毎の処理であるが、1つの動画に含まれる静止画像に対して、文字認識した結果を修正するようにしてもよい。
ステップS1802では、スライド画像判定モジュール110が、動画を解析して、スライドが投影されている画像を静止画像(又は、スライドが投影されている画像内のスライド部分を静止画像)として抽出する。例えば、スライド画像1910、スライド画像2110を静止画像として抽出した例について説明する。図19は、動画1900、スライド画像1910の例を示す説明図である。動画1900には、スライド画像1910が撮影されている。図21は、動画2100、スライド画像2110の例を示す説明図である。動画2100には、スライド画像2110が撮影されている。
ステップS1804では、全て(又は一部)の抽出画像について処理が完了したか否かを判断し、完了した場合はステップS1812へ進み、それ以外の場合はステップS1806へ進む。
なお、この判断で、人物名又は講義名が複数ある場合(1つの静止画像内に複数の人物名又は講義名がある場合、複数の静止画像を文字認識した結果、人物名又は講義名が複数ある場合)は、静止画像の時間的順番(前述のページNo)に基づいた重み付けを行い、その重み付けの結果を用いて人物名又は講義名を選択してもよい。例えば、重み付けとしては、最初のページNo又は最後のページNoの静止画像にある場合を1とし、他のページNoの静止画像にある場合は0とすることによって、最初のページNo又は最後のページNoにある人物名又は講義名を選択するようにしてもよい。この他に、重み付けとして、最初に出現する人物名が重要である可能性が高いので、最初のページNoの静止画像にある場合を10とし、順方向にページNoが進むに合わせて重み付けの値を1ずつ減らした値としてもよい。逆に、最後のページNoの静止画像にある場合を10とし、逆方向にページNoが戻るに合わせて重み付けの値を1ずつ減らした値としてもよい。
例えば、キーワード群格納モジュール140内に人名/講義名キーワード群テーブル2000が記憶されている。なお、図20は、人名/講義名キーワード群テーブル2000のデータ構造例を示す説明図である。人名/講義名キーワード群テーブル2000は、ID欄2002、コンテキストの種類欄2004、コンテキストの値欄2006、キーワード群欄2008を有している。人名/講義名キーワード群テーブル2000は、キーワード群テーブル240と同等のものであるが、説明のため、コンテキストの種類欄2004が人名又は講義名のものを示している。
この場合、人名で検索する場合はコンテキストの種類欄2004が人名で、かつコンテキストの値欄2006が同じのものを検索する。例えば、人名で「山田B子」を検索した場合、その結果としてキーワード群欄2008に格納されている「需要」、「供給」、「市場」、「指数」が検索結果となる。
前記の処理は、全ての画像に対して行ってもよいし、一部の画像に対して行ってもよい。複数の結果が得られた場合は得られたキーワード群をマージする。
切り出された文字列とキーワード群に含まれるキーワードの類似度の算出について説明する。この場合、同じ長さの単語同士を比較することで計算量を減らすようにしてもよい。類似度の算出はレーベンシュタイン距離と単語の長さを利用することで求める。具体的には、「共給」(文字認識結果である文字列であり、2文字で切り分けられたもの)と「供給」(キーワード群に含まれるキーワード)とを比較した場合、「供、共」の1文字が異なるのでレーベンシュタイン距離は1となり、その値を単語列の長さ2で割った値である0.5を類似度とする。そして、類似度が予め定められた閾値以下の場合に候補として、比較対象となったキーワードを単語出力モジュール145へ出力する。閾値が0.5の場合、「供給」が出力される。
ステップS1816では、単語出力モジュール145が、対象としている動画に対して、「需要」、「供給」をインデキシング情報として付加する。具体的には、これらのキーワードは、動画ID及びスライド画像が出現した時間とともにインデキシングされる。
動画蓄積サーバー2210A、動画蓄積サーバー2210B、情報処理サーバー2220、クライアント端末2230A、クライアント端末2230Bは、通信回線2290を介してそれぞれ接続されている。動画蓄積サーバー2210A、2210Bには、図1の例に示す動画格納モジュール100が構築されている。情報処理サーバー2220には、図1の例に示す動画読取モジュール105、スライド画像判定モジュール110、文字認識モジュール115、単語推定モジュール120、コンテキスト取得モジュール125、キーワード群選択モジュール130、キーワード群格納モジュール140、単語出力モジュール145、単語格納モジュール150が構築されている。クライアント端末2230A、2230Bは、情報処理サーバー2220内の単語格納モジュール150を検索し、該当する動画を動画蓄積サーバー2210A、2210Bから取り出して再生する。
なお、図23に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図23に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えばASIC等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図23に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、情報家電、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
105…動画読取モジュール
110…スライド画像判定モジュール
115…文字認識モジュール
120…単語推定モジュール
125…コンテキスト取得モジュール
130…キーワード群選択モジュール
140…キーワード群格納モジュール
145…単語出力モジュール
150…単語格納モジュール
210…人物認識モジュール
220…動画ID・ページNo認識モジュール
230…講演者名認識モジュール
240…キーワード群テーブル
310…タイムテーブル記憶モジュール
320…講義名特定モジュール
330…テキスト群整形モジュール
340…人名抽出モジュール
350…講義名抽出モジュール
360…キーワード群テーブル
380…データベースA
382…データベースB
390…通信回線
2210…動画蓄積サーバー
2220…情報処理サーバー
2230…クライアント端末
2290…通信回線
Claims (10)
- 動画内で撮影されている静止画像を判定する判定手段と、
前記判定手段によって判定された静止画像を対象として文字認識を行う文字認識手段と、
前記動画に関する情報を取得する取得手段と、
前記取得手段によって取得された情報に基づいて、前記文字認識手段による文字認識結果を修正する修正手段と、
前記修正手段によって修正された文字認識結果を前記動画と関連付けて出力する出力手段
を具備し、
前記取得手段は、前記動画内の人物を認識して、該人物に関する情報を取得し、
前記修正手段は、前記取得手段によって取得された人物に関する情報に基づいて、前記文字認識結果を修正する
ことを特徴とする情報処理装置。 - 前記取得手段は、前記文字認識手段による文字認識結果内の人物名又は出来事名を抽出し、該人物名又は該出来事名が複数ある場合は、前記静止画像の時間的順番に基づいた重み付けを行い、該重み付けの結果を用いて選択した人物名又は出来事名に関する情報を取得し、
前記修正手段は、前記取得手段によって取得された人物名又は出来事名に関する情報に基づいて、前記文字認識手段による文字認識結果を修正する
ことを特徴とする請求項1に記載の情報処理装置。 - 動画内で撮影されている静止画像を判定する判定手段と、
前記判定手段によって判定された静止画像を対象として文字認識を行う文字認識手段と、
前記動画に関する情報を取得する取得手段と、
前記取得手段によって取得された情報に基づいて、前記文字認識手段による文字認識結果を修正する修正手段と、
前記修正手段によって修正された文字認識結果を前記動画と関連付けて出力する出力手段
を具備し、
前記取得手段は、前記文字認識手段による文字認識結果内の人物名又は出来事名を抽出し、該人物名又は該出来事名が複数ある場合は、前記静止画像の時間的順番に基づいた重み付けを行い、該重み付けの結果を用いて選択した人物名又は出来事名に関する情報を取得し、
前記修正手段は、前記取得手段によって取得された人物名又は出来事名に関する情報に基づいて、前記文字認識手段による文字認識結果を修正する
ことを特徴とする情報処理装置。 - 前記取得手段は、前記動画内の人物を認識して、該人物に関する情報を取得し、
前記修正手段は、前記取得手段によって取得された人物に関する情報に基づいて、前記文字認識結果を修正する
ことを特徴とする請求項3に記載の情報処理装置。 - 前記取得手段は、前記動画を識別する情報である動画識別情報又は該動画識別情報と前記判定手段によって判定された静止画像の時間的順番に基づいて、該静止画像内に含まれている可能性がある文字情報を取得し、
前記修正手段は、前記取得手段によって取得された文字情報に基づいて、前記文字認識結果を修正する
ことを特徴とする請求項1から4のいずれか一項に記載の情報処理装置。 - 前記取得手段は、予め定められた時間的順番の前記静止画像に対する前記文字認識手段による文字認識結果内の人物名を抽出し、該人物名に関する情報を取得し、
前記修正手段は、前記取得手段によって取得された人物名に関する情報に基づいて、前記文字認識手段による文字認識結果を修正する
ことを特徴とする請求項1から5のいずれか一項に記載の情報処理装置。 - 前記取得手段は、前記動画の撮影場所と撮影日時に関する情報を抽出し、該撮影場所と該撮影日時に行われた出来事に関する情報を取得し、
前記修正手段は、前記取得手段によって取得された出来事に関する情報に基づいて、前記文字認識手段による文字認識結果を修正する
ことを特徴とする請求項1から6のいずれか一項に記載の情報処理装置。 - 前記取得手段は、前記文字認識手段による文字認識結果に対して形態素解析を行い、該形態素解析の結果の文字列又は該文字列に類似する文字列に関する情報を取得し、
前記修正手段は、前記取得手段によって取得された文字列に関する情報に基づいて、前記文字認識手段による文字認識結果を修正する
ことを特徴とする請求項1から7のいずれか一項に記載の情報処理装置。 - コンピュータを、
動画内で撮影されている静止画像を判定する判定手段と、
前記判定手段によって判定された静止画像を対象として文字認識を行う文字認識手段と、
前記動画に関する情報を取得する取得手段と、
前記取得手段によって取得された情報に基づいて、前記文字認識手段による文字認識結果を修正する修正手段と、
前記修正手段によって修正された文字認識結果を前記動画と関連付けて出力する出力手段
として機能させ、
前記取得手段は、前記動画内の人物を認識して、該人物に関する情報を取得し、
前記修正手段は、前記取得手段によって取得された人物に関する情報に基づいて、前記文字認識結果を修正する
ことを特徴とする情報処理プログラム。 - コンピュータを、
動画内で撮影されている静止画像を判定する判定手段と、
前記判定手段によって判定された静止画像を対象として文字認識を行う文字認識手段と、
前記動画に関する情報を取得する取得手段と、
前記取得手段によって取得された情報に基づいて、前記文字認識手段による文字認識結果を修正する修正手段と、
前記修正手段によって修正された文字認識結果を前記動画と関連付けて出力する出力手段
として機能させ、
前記取得手段は、前記文字認識手段による文字認識結果内の人物名又は出来事名を抽出し、該人物名又は該出来事名が複数ある場合は、前記静止画像の時間的順番に基づいた重み付けを行い、該重み付けの結果を用いて選択した人物名又は出来事名に関する情報を取得し、
前記修正手段は、前記取得手段によって取得された人物名又は出来事名に関する情報に基づいて、前記文字認識手段による文字認識結果を修正する
ことを特徴とする情報処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011205615A JP5845764B2 (ja) | 2011-09-21 | 2011-09-21 | 情報処理装置及び情報処理プログラム |
US13/399,074 US8755603B2 (en) | 2011-09-21 | 2012-02-17 | Information processing apparatus performing character recognition and correction and information processing method thereof |
CN201210102344.4A CN103020581B (zh) | 2011-09-21 | 2012-04-09 | 信息处理设备和信息处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011205615A JP5845764B2 (ja) | 2011-09-21 | 2011-09-21 | 情報処理装置及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013069015A JP2013069015A (ja) | 2013-04-18 |
JP5845764B2 true JP5845764B2 (ja) | 2016-01-20 |
Family
ID=47880688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011205615A Expired - Fee Related JP5845764B2 (ja) | 2011-09-21 | 2011-09-21 | 情報処理装置及び情報処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8755603B2 (ja) |
JP (1) | JP5845764B2 (ja) |
CN (1) | CN103020581B (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5845764B2 (ja) * | 2011-09-21 | 2016-01-20 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
US8918406B2 (en) * | 2012-12-14 | 2014-12-23 | Second Wind Consulting Llc | Intelligent analysis queue construction |
WO2016104156A1 (ja) * | 2014-12-22 | 2016-06-30 | キヤノンイメージングシステムズ株式会社 | 画像処理方法 |
JP6430914B2 (ja) | 2014-12-22 | 2018-11-28 | キヤノンイメージングシステムズ株式会社 | 画像処理装置および画像処理方法 |
JP6390480B2 (ja) * | 2015-03-18 | 2018-09-19 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置、および紙媒体への撮像で得られるデータのデータ構造 |
CN105306065A (zh) * | 2015-11-10 | 2016-02-03 | 珠海多玩信息技术有限公司 | 时间戳的处理方法及装置、压缩字符串的解压方法及装置 |
JP7102103B2 (ja) * | 2017-03-31 | 2022-07-19 | キヤノン株式会社 | 携帯型の情報処理装置及び当該情報処理装置を用いた方法及びプログラム |
US11263222B2 (en) * | 2017-10-25 | 2022-03-01 | Walmart Apollo, Llc | System for calculating competitive interrelationships in item-pairs |
JP6506427B1 (ja) * | 2018-01-25 | 2019-04-24 | 株式会社リクルート | 情報処理装置、動画検索方法、生成方法及びプログラム |
CN108495185B (zh) * | 2018-03-14 | 2021-04-16 | 北京奇艺世纪科技有限公司 | 一种视频标题生成方法和装置 |
JP2020017156A (ja) * | 2018-07-27 | 2020-01-30 | 富士通株式会社 | 文字認識装置、文字認識プログラムおよび文字認識方法 |
JP2020095374A (ja) * | 2018-12-11 | 2020-06-18 | 沖電気工業株式会社 | 文字認識システム、文字認識装置、プログラム及び文字認識方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04115384A (ja) | 1990-09-06 | 1992-04-16 | Nec Software Ltd | 単語チェック機能を持つ日本語ocr |
JP3692018B2 (ja) | 2000-01-24 | 2005-09-07 | 株式会社東芝 | テロップ情報処理装置 |
EP1398726B1 (en) * | 2002-09-11 | 2008-07-30 | Samsung Electronics Co., Ltd. | Apparatus and method for recognizing character image from image screen |
US20050120391A1 (en) * | 2003-12-02 | 2005-06-02 | Quadrock Communications, Inc. | System and method for generation of interactive TV content |
US7916948B2 (en) * | 2004-01-08 | 2011-03-29 | Nec Corporation | Character recognition device, mobile communication system, mobile terminal device, fixed station device, character recognition method and character recognition program |
JP4528705B2 (ja) * | 2005-09-30 | 2010-08-18 | 株式会社東芝 | 文字認識装置および文字認識方法 |
US7949192B2 (en) * | 2006-05-10 | 2011-05-24 | University Of Maryland, Baltimore | Techniques for converting analog medical video to digital objects |
JP2009100351A (ja) * | 2007-10-18 | 2009-05-07 | Sharp Corp | 情報処理装置、情報処理システム、及び情報処理方法 |
US9155068B2 (en) * | 2009-03-03 | 2015-10-06 | Nokia Technologies Oy | Method and apparatus for delivering advertising data |
US8438131B2 (en) * | 2009-11-06 | 2013-05-07 | Altus365, Inc. | Synchronization of media resources in a media archive |
JP5845764B2 (ja) * | 2011-09-21 | 2016-01-20 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
-
2011
- 2011-09-21 JP JP2011205615A patent/JP5845764B2/ja not_active Expired - Fee Related
-
2012
- 2012-02-17 US US13/399,074 patent/US8755603B2/en not_active Expired - Fee Related
- 2012-04-09 CN CN201210102344.4A patent/CN103020581B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013069015A (ja) | 2013-04-18 |
US8755603B2 (en) | 2014-06-17 |
CN103020581A (zh) | 2013-04-03 |
CN103020581B (zh) | 2018-01-02 |
US20130070964A1 (en) | 2013-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5845764B2 (ja) | 情報処理装置及び情報処理プログラム | |
US8335354B2 (en) | Apparatus for registering face identification features, method for registering the same, program for registering the same, and recording medium | |
JP4337064B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US8645353B2 (en) | Anchor image identification for vertical video search | |
CN106557545B (zh) | 视频检索方法和装置 | |
US20090123071A1 (en) | Document processing apparatus, document processing method, and computer program product | |
US10311038B2 (en) | Methods, computer program, computer program product and indexing systems for indexing or updating index | |
US8068678B2 (en) | Electronic apparatus and image processing method | |
CN104798068A (zh) | 视频检索方法和装置 | |
US11531839B2 (en) | Label assigning device, label assigning method, and computer program product | |
JP6829740B2 (ja) | データ検索方法及びそのデータ検索システム | |
KR100644016B1 (ko) | 동영상 검색 시스템 및 방법 | |
JP2006072744A (ja) | 文書処理装置、その制御方法、プログラム、及び記憶媒体 | |
KR20130039649A (ko) | 정보 처리 장치 및 정보 처리 방법 | |
JP7027696B2 (ja) | 情報処理装置及び情報処理プログラム | |
US20210295033A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP5910222B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5320470B2 (ja) | タイトル判別装置 | |
JP6621437B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム | |
CN110717091B (zh) | 基于人脸识别的词条数据扩充方法及装置 | |
CN116483946B (zh) | 数据处理方法、装置、设备及计算机程序产品 | |
CN114222193B (zh) | 一种视频字幕时间对齐模型训练方法及系统 | |
KR102027297B1 (ko) | 장면 기반 동영상 네비게이션 장치 | |
JP4547998B2 (ja) | 録画情報管理装置及びプログラム | |
JP5585145B2 (ja) | 修正箇所判別装置、修正箇所判別プログラム、および修正箇所判別方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140822 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150428 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150528 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151027 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151109 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5845764 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |