JP3529036B2 - 文書付き画像の分類方法 - Google Patents
文書付き画像の分類方法Info
- Publication number
- JP3529036B2 JP3529036B2 JP16588599A JP16588599A JP3529036B2 JP 3529036 B2 JP3529036 B2 JP 3529036B2 JP 16588599 A JP16588599 A JP 16588599A JP 16588599 A JP16588599 A JP 16588599A JP 3529036 B2 JP3529036 B2 JP 3529036B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- document
- divided
- classification
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims 4
- 238000001514 detection method Methods 0.000 claims 2
- 238000000605 extraction Methods 0.000 claims 1
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
画像内容毎に分類し、画像理解に役立てることが可能な
文書付き画像の分類方法、分類装置および記録媒体に関
する。
随した文書情報などの記号情報を関連付けて検索に供す
るシステムとして、下記のものが提案されている。
板倉あゆみ:"印象語による絵画データベースの検索,
“情処論,Vol.33、No.11,pp1373−
1383,1992 (2)小野敦史,天野督士,斗谷充宏,佐藤隆,坂内正
夫:“状態遷移モデルとシーン記述言語による自動キー
ワード付与機能をもつ画像データベースとその評価”信
学論.J79−D−II,No.4,pp.476−4
83,1996. (3)渡辺靖彦,長尾真:“画像の内容を説明するテキ
ストを利用した画像解析、”人工知能学会誌,Vol1
3,No.1,pp66−74,1998 (4)井出一郎,浜田玲子,坂井修一,田中英彦:“言
語情報を伴う画像の画像的特徴量と語彙の統計的対応付
け”情報処理学会研究報告,99−CVIM−114−
18,1999 このような提案では、画像に、その画像の内容を表した
文書を付加し、データベースに記憶しておく。このよう
なシステムでは、キーワードを入力すると、そのキーワ
ードを有する画像をデータベースから検索したり、判別
したい画像をシステムに与えると、同じ特徴を有する画
像をデータベースで検索し、検索の結果得られる画像に
付随する文書情報を画像の判別結果とすることができ
る。
数の物体が含まれていることが多い。このような画像を
判別したい場合、同じ複数の物体が撮影されている画像
がデータベースにないと、画像の特徴が一致せず、判別
結果が得られない。したがって、画像の判別精度を上げ
るためには、多種多様の画像をデータベースに登録しな
ければならない。
なってしまうという課題が従来技術にはあった。
域を指定し、かつ、その領域についてキーワードを個別
指定入力をしなければならなかった。
スの情報量であれば、判別できる画像の種類を従来より
も多数とすることができる。文書付き画像の分類方法、
分類装置および記録媒体を提供することにある。
るために、請求項1の発明は、文書付き画像をコンピュ
ータにより分類する文書付き画像の分類方法において、
前記コンピュータは、第1の分割手段、付随手段、分類
手段、計数手段および抽出手段を有し、m個の文書付き
画像の各々をn個の分割画像に前記第1の分割手段によ
り分割し、1つの前記文書付き画像に付加されている文
書を当該分割されたn個の分割画像それぞれに対して前
記付随手段により付随させ、前記m個の文書付き画像か
ら得られるn×m個の分割画像をその画像特徴が類似す
る画像同士に前記分類手段により分類し、当該分類毎に
該分類に属する1以上の前記分割画像に付随した文書中
の単語の出現頻度を前記計数手段により計数し、当該計
数された出現頻度上位所定数に対応する単語を前記分類
の意味内容を示す単語として前記抽出手段により抽出す
ることを特徴とする。
付き画像の分類方法において、前記分割画像、該分割画
像の属する分類を示す情報、該分類に対応の抽出単語は
前記コンピュータ内外の記憶装置に記憶され、前記コン
ピュータは入力手段、第2の分割手段、検出手段および
出力手段をさらに有し、内容が未知の未知画像を前記入
力手段から前記コンピュータに入力し、当該入力された
未知画像を前記第2の分割手段により分割し、当該分割
された未知分割画像と最も特徴が類似する分類を前記検
出手段により検出し、当該検出された分類に対応する単
語を使用して前記入力された未知画像の意味内容を前記
出力手段から出力することを特徴とする。
る文書付き画像の分類装置において、m個の文書付き画
像の各々をn個の分割画像に分割する手段と、1つの前
記文書付き画像に付加されている文書を当該分割された
n個の分割画像に対してそれぞれ付随させる手段と、前
記m個の文書付き画像から得られるn×m個の分割画像
をその画像特徴が類似する画像同士に分類する手段と、
当該分類毎に該分類に属する1以上の画像に付随した文
書中の単語の出現頻度を計数する手段と、当該計数され
た出現頻度の上位所定数に対応する単語を分類の意味内
容を示す単語として抽出する手段とを具えたことを特徴
とする。
付き画像の分類装置において、前記分割画像、該分割画
像の属する分類を示す情報、該分類に対応の抽出単語を
記憶する記憶手段と、内容が未知の未知画像を入力する
手段と、当該入力された未知画像を分割する手段と、当
該分割された未知分割画像と最も特徴が類似する分類を
検出する手段と、当該検出された分類に対応する単語を
使用して前記入力された未知画像の意味内容を出力する
手段とをさらに具えたことを特徴とする。
ュータにより分類するためのプログラムを記録した記録
媒体において、前記コンピュータは、第1の分割手段、
付随手段、分類手段、計数手段および抽出手段を有し、
前記プログラムは、m個の文書付き画像の各々をn個の
分割画像に前記第1の分割手段により分割するステップ
と、1つの前記文書付き画像に付加されている文書を当
該分割されたn個の分割画像に対してそれぞれ前記付随
手段により付随させるステップと、前記m個の文書付き
画像から得られるn×m個の分割画像をその画像特徴が
類似する画像同士に前記分類手段により分類するステッ
プと、当該分類毎に該分類に属する1以上の前記分割画
像に付随した文書中の単語の出現頻度を前記計数手段に
より計数するステップと、当該計数された出現頻度の上
位所定数に対応する単語を分類の意味内容を示す単語と
して前記抽出手段により抽出するステップとを具えたこ
とを特徴とする。
媒体において、前記コンピュータは入力手段、第2の分
類手段、検出手段および出力手段をさらに有し、前記プ
ログラムは、前記分割画像、該分割画像の属する分類を
示す情報、該分類に対応の抽出単語を前記コンピュータ
内外の記憶装置に記憶するステップと、内容が未知の未
知画像を前記入力手段から入力するステップと、当該入
力された未知画像を前記第2の分割手段により分割する
ステップと、当該分割された未知分割画像と最も特徴が
類似する分類を前記検出手段により検出するステップ
と、当該検出された分類に対応する単語を使用して前記
入力された未知画像の意味内容を前記出力手段から出力
するステップとをさらに具えたことを特徴とする。
施形態を詳細に説明する。
明するための説明図である。
コンピュータ上で実行される。図1において、データベ
ースに登録される画像には文書情報、すなわち、画像の
内容を示す文章情報が付随している。
する。1枚の画像は、画像中の複数の物体を切り離すた
めに3×3に分割される。分割された画像それぞれに元
の画像の文書、たとえば情報が付される。分割された画
像から特徴量が抽出される。
すればよいが、本実施形態では演算によって得られる色
特徴量および輝度特徴量を使用する。本実施形態では、
RGB色空間を4×4×4に離散化して、各領域に属す
るピクセルの数を見た立体色ヒストグラム(64次元)
を色特徴量とする。
l)の出力から算出される輝度方向の勾配の方向を8方
向で離散化し、それぞれの割り当て角度内で強度の和を
とって8次元の特徴量とする。さらに輝度特徴量に関し
ては、1/2ずつ画像を縮小して4つの解像度それぞれ
について上記特徴量を算出する。その結果得られる特徴
量は32次元。また、各分割領域毎に抽出される特徴量
次元は64+32=96次元となる。
れぞれに上述の文書情報が付加されて、コンピュータ内
の記憶装置に集積される。以上が1枚の画像に関する情
報処理であり、内容の異なる複数の画像について上述と
同様の画像分割、特徴量の抽出、集積を行う。
下に述べる分類処理を行って、特徴が類似する文書付き
特徴量データ同士に分類する。
クトル量子化と呼ばれる情報処理方法を使用する。ベク
トル量子化は多次元データ空間を分割して少ない代表ベ
クトルにてデータを表現する手法であり、画像圧縮技術
において、よく知られている。具体的な情報処理方法
は、たとえば、原島博、“画像情報圧縮”、オーム社、
平成3年8月発行に記載されている。
ルであるセントロイドとその帰属データ(あるいは領
域)を決定することで量子化が行われる。本実施形態で
は,遠藤隆、高橋裕信、豊浦淳、向井理朗、岡隆一:
“動画像の自己組織化ネットワークによるモデル化とそ
の動的特徴の可視化−Video Intra−str
ucture Visualization−”信学技
法PRMU97−78(1997)と同じくデータにイ
ンクリメンタルにセントロイドを作成する手法を使用し
ている。その手順は以下のとおりである。
する。
「最小、かつ許容量子化誤差(スケールとも呼ぶ)d以
下」である既存セントロイドを探し、存在すれば、現在
のデータはそのセントロイドに帰属(分類)させる。
トロイドとして追加する。
実行するために、予め決定しておくパラメータは許容量
子化誤差dである。今回は分割特徴量の全てを同一視し
て分散を算出し、その大きさを基準として許容量子化誤
差dを与えた。
ンピュータにおいて実行すると、セントロイド(代表ベ
クトル−各分類を代表する特徴量)がC(整数)個生成さ
れる。次にそれらの各セントロイドcj(j=1,2,....,C)に
属する文書付き部分画像(代表ベクトルに対して距離が
近い特徴量を有する分割画像、図1の分類1,2,3の
各々に属する分割画像)をコンピュータにより取り出
す。コンピュータはこの分割画像に付加された文書から
単語を取り出すと共に文書中に出現する単語の個数(出
現頻度)を計数する。次に、上記処理を繰り返して同一
の代表ベクトルに属する部分画像、すなわち、同一の分
類内に属する全ての部分画像について、単語の出現頻度
を累積する。
1,2,...,W:Wは語彙数)の出現確率P(wi|cj)を以下のよう
にコンピュータにより推定する。
wiの数がmji,セントロイドcj中の全単語数が
ける単語の出現総数をN(同じ単語を重複して数え
る),全画像における単語wiの出現頻度をniとすると出
現確率P(wi|cj)は以下のように計算される。
て事前確率P(wi)の推定を行う最大事後確率基準を用い
ている。その他の基準としてはP(wi)をwIによらずに一
定とした最大尤度基準を場合によっては使用することが
できる。このようにして各分類毎にその分類に属する部
分画像(分割画像)の文書情報の中から出現頻度の高い
ものから所定数、たとえば、3つの単語をコンピュータ
により取り出す。取り出した所定数の単語が、その分類
に属する画像群を表す単語となる。取り出した単語、部
分画像、特徴量、分類を表す情報をデータベースに登録
すると、そのデータベースが画像データベースとなる。
また、また、取り出された単語群をすべて単語テーブル
に登録し、各単語と分類の対応付けを行っておくと、単
語テーブルに記載された単語がインデックスとなって、
任意の単語を指定すると、その単語に対応する分類の部
分画像をデータベースから取り出すことが可能となる。
分画像、特徴量、分類毎の抽出単語を使用して画像の内
容を判別する方法を説明する。
とコンピュータでは与えられた画像を分類時と同様のS
個の部分画像I1,I2,...ISに分割する。分割された画像
から、上述と同様の方法で特徴量が抽出される。各部分
画像Ikの特徴量、すなわち、特徴ベクトルに対して最短
距離のセントロイドcIkを見つけ帰属セントロイド(未
知の部分画像が属する分類の代表特徴)とする。
語出現頻度P(wi|cIk)を未知の部分画像全てについて合
成して単語尤度P(wi|I)とする。本実施形態では上記合
成は下記の和の演算で行う。
いものから所定数だけ抽出すると、抽出された単語が、
未知の画像(分割された元の画像)の内容を表す単語と
なる。以上の処理はコンピュータにより実行される。
ム(画像処理装置)の概略構成を図2を参照して説明す
る。
タなどの汎用コンピュータである。汎用コンピュータ1
0はCPU11、システムメモリ12、ハードディスク
記憶装置(HD)13を有する。CPU11は後述の処
理プログラムを実行する。システムメモリ12はCPU
11が実行する処理プログラム、演算データ,ディスプ
レイ40に表示するデータ、キーボード30から入力さ
れたデータ等を一時記憶する。ハードディスク記憶装置
13は上記処理プログラム、分類された文書付き画像デ
ータをデータベースの形態で記憶する。なお、汎用コン
ピュータ11はマウスなどのポインティングデバイス
や、CDROM読み取り装置等をも有する。
録媒体に記録しておきハードディスク記憶装置13にイ
ンストールされる。処理プログラムを実行する場合に
は、従来と同様マウス等の起動指示に応じて、ハードデ
ィスク記憶装置13上の処理プログラムがシステムメモ
リ12にロードされ、CPU11により実行される。
指示を入力する。また、キーボード30から画像に付加
する画像説明用の文書情報、すなわち、複数の単語や文
章が入力される。スキャナー20はデータベースに登録
すべき画像を載置された原稿から読み取る。
力されたデータを表示する他、処理内容を案内するメニ
ュー画面、未知の画像の判別結果を表示する。
れる画像分類処理および未知の画像の判別処理を図3〜
図5の処理プログラムを参照して説明する。起動の指示
に応じて図3のプログラムがCPU11により実行され
る。図3において、CPU11はディスプレイ40に処
理メニューを表示する(ステップS10)。本実施形態
では画像の登録処理と未知の画像の判別処理が処理メニ
ューの中で選択可能である。ユーザはマウスあるいはキ
ーボード30を使用してどちらかの処理の実行を指示す
る。
処理手順はステップS20を経てステップS25で画像
登録処理が実行される。
場合には、処理手順はステップS20→S30→S35
へと進み、このステップで未知の画像の判別処理が実行
される。
ステップS20〜S40へと進み、処理プログラムの実
行が終了する。
4に示す。図4において、CPU11はスキャナー20
により読み取られた原稿画像をシステムメモリ12に記
憶した後、キーボード30から入力される説明文をシス
テムメモリ12に一時記憶する(ステップS100)。
の読み取り画像を所定の手順に従って分割する。分割さ
れた個々の画像から上述の方法で特徴量が抽出される。
抽出された特徴量と対応する分割画像、文書情報、およ
び全体画像が互いに関連付けられて、データベースに登
録される(ステップS120→S130)。
使用して、特徴が類似するもの同士に分類する。分類方
法は上述した方法を使用する(ステップS140)。な
お分類された特徴量同士は分類番号が与えられて文書情
報、分割画像元の全体画像の記憶アドレスなどと共にデ
ータベースに再登録される。また、分類毎の代表ベクト
ルも計算され、図6に示すようなテーブル形態でデータ
ベースに記憶される。なお、この時点では図6の単語部
分は空白である。
スに登録されている文書情報の単語の出現頻度を分類毎
に計算する。文書中の単語については一般に知られてい
る文法解析により単語を文書の先頭から取り出す。取り
出された単語はシステムメモリ12に記憶されるが、そ
の際に、これまでに記憶されている単語との重複の有無
が判定される。重複があった場合には、その単語の出現
頻度に数値1が加算される。重複が無い場合には、その
単語はシステムメモリ12に記憶され、出現頻度の初期
値として数値1が与えられる。このようにして文書中の
単語を先頭から順次に取り出して、システムメモリ12
中の単語と比較し、出現単語の計数と、新規単語のシス
テムメモリ12上の登録を行っていく。このようにして
1つの文書情報の単語の出現頻度を計数して、各分類全
ての特徴についての文書情報の単語出現頻度を計算する
(ステップS150)。
るよう、各分類において、出現頻度の高い単語を検出す
る。単語頻度の最も高い単語を検出するためにはソーテ
ィングと呼ばれる周知の並び替え処理を使用するとよ
い。分類毎に得られた単語が図6のテーブルに分類に対
応させて登録される(ステップS160)。
したことをディスプレイ40に表示して図4の処理手順
を終了する(ステップS160→リターン)。
別処理(分析処理)について図5を参照して説明する。
CPU11はスキャナー20を制御して未知の原稿画像
を読み取り、読み取った画像を画像分割する。続いて、
分割された画像の特徴量が抽出される(ステップS20
0→S210)。
とデータベースに保存されている図6の代表ベクトルと
の距離計算により、距離が最も近い分類、すなわち、画
像の内容が最も類似する分類が検出される。この分類に
対応する単語が図6のテーブルから抽出される。
された特徴ベクトルの分割画像の内容を表す単語とし
て、ディスプレイ40に表示される(ステップS24
0)。
上述の処理を繰り返すと各分割画像の内容を表す単語が
抽出され、ディスプレイ40に表示される(ステップS
210〜S240のループ処理)。
あり、判別精度を高めたい場合には、コンピュータシス
テムの説明に先立って説明した未知画像の判別方法のよ
うに、代表ベクトル(セントロイド)に対して複数の上
位単語とその出現頻度の値を図6のテーブルに記憶し、
判別対象の分割画像の分類が検出される毎に、単語の出
現頻度の値を集計する。異なる分類に重複する単語があ
る場合には、その単語の出現頻度の値が合計され、単語
が重複しない場合には、その単語の出現頻度の値がその
まま合計値となる。
3つの値に対応する単語を抽出すると、全体画像につい
て最も内容を良く表す単語を検出することができる。こ
のような処理は、たとえば、画像の分割に際して、被写
体の物体が2つに分割されてしまう場合でも精度よく、
未知の内容の画像を判別することができる。
る。
て色と輝度を抽出しているが画像の内容に固有な特徴を
抽出するためにこれまでに知られている特徴抽出方法を
使用してもよい。
方法として量子化の手法を使用しているが、たとえば、
クラスタリングと呼ばれる手法(統計学辞典,東洋経済
新報社、1989,12,4発行)を使用することがで
きる。
像を登録し、これまでに登録されている画像と新規登録
の画像とで、再分類を行う例を示したが、予め多数の画
像をまとめて登録して分類処理を行ってもよい。
ャナー40から行ったが、CDROM等の記録媒体、通
信等により画像入力を行うことができる。また文書情報
についても、記録媒体,通信等により入力を行うことが
できる。
情報の他に識別番号などの記号列をも含めることができ
る。この場合1つの意味を示す記号列は単語として取り
扱う。また、複数組の記号列が画像の意味内容として与
えられる場合は、その複数組の記号列は文書と解すべき
である。
に分割したが、これに限ることはなく、周知の領域抽出
(識別)処理を使用して画像分割することができる。た
とえば、被写体の輪郭線の内と外に画像を分割してもよ
い。
ンピュータ内外の記憶装置とすることができる。
5の発明によれば、1枚の画像が分割されることにより
画像内の複数の物体に分割され、単体の物体を表す画像
となる確率が高くなる。これにより画像の容量を増やす
ことなく画像の種類内容を増やすことができる。
士は、同一の意味内容を表す単語が文書中に含まれてい
ることから、文書の単語の出現頻度の高い単語を検出す
ることで各分類毎の単語を自動検出することができる。
しなくてもこの処理が自動的に行われるので操作労力が
低減される。
画像も分割し、その分割画像の属する分類を画像特徴に
基づき調べることで、複数の物体が含まれる未知の画像
の内容を知ることができる。
するための説明図である。
付き画像分類装置)のシステム構成を示すブロック図で
ある。
ャートである。
ャートである。
ャートである。
示す説明図である。
Claims (6)
- 【請求項1】 文書付き画像をコンピュータにより分類
する文書付き画像の分類方法において、前記コンピュー
タは、第1の分割手段、付随手段、分類手段、計数手段
および抽出手段を有し、 m個 の文書付き画像の各々をn個の分割画像に前記第1
の分割手段により分割し、1つの前記文書付き画像に 付加されている文書を当該分
割されたn個の分割画像それぞれに対して前記付随手段
により付随させ、前記m個の文書付き画像から得られるn×m個 の分割画
像をその画像特徴が類似する画像同士に前記分類手段に
より分類し、当該分類毎に該分類に属する 1以上の前記分割画像に付
随した文書中の単語の出現頻度を前記計数手段により計
数し、 当該計数された出現頻度上位所定数に対応する単語を前
記分類の意味内容を示す単語として前記抽出手段により
抽出することを特徴とする文書付き画像の分類方法。 - 【請求項2】 請求項1に記載の文書付き画像の分類方
法において、前記分割画像、該分割画像の属する分類を
示す情報、該分類に対応の抽出単語は前記コンピュータ
内外の記憶装置に記憶され、前記コンピュータは入力手
段、第2の分割手段、検出手段および出力手段をさらに
有し、 内容が未知の未知画像を前記入力手段から前記コンピュ
ータに入力し、当 該入力された未知画像を前記第2の分割手段により分
割し、 当該分割された未知分割画像と最も特徴が類似する分類
を前記検出手段により検出し、当該検出された分類に対
応する単語を使用して前記入力された未知画像の意味内
容を前記出力手段から出力することを特徴とする文書付
き画像の分類方法。 - 【請求項3】 文書付き画像を分類する文書付き画像の
分類装置において、m個 の文書付き画像の各々をn個の分割画像に分割する
手段と、1つの前記文書付き画像に 付加されている文書を当該分
割されたn個の分割画像に対してそれぞれ付随させる手
段と、前記m個の文書付き画像から得られるn×m個 の分割画
像をその画像特徴が類似する画像同士に分類する手段
と、当該分類毎に該分類に属する 1以上の画像に付随した文
書中の単語の出現頻度を計数する手段と、 当該計数された出現頻度の上位所定数に対応する単語を
分類の意味内容を示す単語として抽出する手段とを具え
たことを特徴とする文書付き画像の分類装置。 - 【請求項4】 請求項3に記載の文書付き画像の分類装
置において、前記分割画像、該分割画像の属する分類を
示す情報、該分類に対応の抽出単語を記憶する記憶手段
と、 内容が未知の未知画像を入力する手段と、 当該入力された未知画像を分割する手段と、 当該分割された未知分割画像と最も特徴が類似する分類
を検出する手段と、 当該検出された分類に対応する単語を使用して前記入力
された未知画像の意味内容を出力する手段とをさらに具
えたことを特徴とする文書付き画像の分類装置。 - 【請求項5】 文書付き画像をコンピュータにより分類
するためのプログラムを記録した記録媒体において、前
記コンピュータは、第1の分割手段、付随手段、分類手
段、計数手段および抽出手段を有し、前記プログラム
は、m個の 文書付き画像の各々をn個の分割画像に前記第1
の分割手段により分割するステップと、1つの前記文書付き画像に 付加されている文書を当該分
割されたn個の分割画像に対してそれぞれ前記付随手段
により付随させるステップと、前記m個の文書付き画像から得られるn×m個 の分割画
像をその画像特徴が類似する画像同士に前記分類手段に
より分類するステップと、当該分類毎に該分類に属する 1以上の前記分割画像に付
随した文書中の単語の出現頻度を前記計数手段により計
数するステップと、 当該計数された出現頻度の上位所定数に対応する単語を
分類の意味内容を示す単語として前記抽出手段により抽
出するステップとを具えたことを特徴とする記録媒体。 - 【請求項6】 請求項5に記載の記録媒体において、前
記コンピュータは入力手段、第2の分類手段、検出手段
および出力手段をさらに有し、前記プログラムは、前記
分割画像、該分割画像の属する分類を示す情報、該分類
に対応の抽出単語を前記コンピュータ内外の記憶装置に
記憶するステップと、 内容が未知の未知画像を前記入力手段から入力するステ
ップと、 当該入力された未知画像を前記第2の分割手段により分
割するステップと、 当該分割された未知分割画像と最も特徴が類似する分類
を前記検出手段により検出するステップと、 当該検出された分類に対応する単語を使用して前記入力
された未知画像の意味内容を前記出力手段から出力する
ステップとをさらに具えたことを特徴とする記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16588599A JP3529036B2 (ja) | 1999-06-11 | 1999-06-11 | 文書付き画像の分類方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16588599A JP3529036B2 (ja) | 1999-06-11 | 1999-06-11 | 文書付き画像の分類方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000353173A JP2000353173A (ja) | 2000-12-19 |
JP3529036B2 true JP3529036B2 (ja) | 2004-05-24 |
Family
ID=15820836
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16588599A Expired - Lifetime JP3529036B2 (ja) | 1999-06-11 | 1999-06-11 | 文書付き画像の分類方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3529036B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102376079A (zh) * | 2010-08-12 | 2012-03-14 | 富士施乐株式会社 | 图像识别信息添加装置和图像识别信息添加方法 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5565190B2 (ja) * | 2010-08-11 | 2014-08-06 | 富士ゼロックス株式会社 | 学習モデル作成プログラム、画像識別情報付与プログラム、学習モデル作成装置及び画像識別情報付与装置 |
CN105653701B (zh) * | 2015-12-31 | 2019-01-15 | 百度在线网络技术(北京)有限公司 | 模型生成方法及装置、词语赋权方法及装置 |
KR102103518B1 (ko) * | 2018-09-18 | 2020-04-22 | 이승일 | 인공지능을 이용한 텍스트 및 그림 데이터를 동영상 데이터로 생성하는 시스템 |
JP6792751B2 (ja) * | 2019-03-05 | 2020-12-02 | 株式会社医療情報技術研究所 | 分類システム |
JP6902764B1 (ja) * | 2020-12-15 | 2021-07-14 | ソプラ株式会社 | メタデータ抽出プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1055366A (ja) * | 1996-08-08 | 1998-02-24 | Masao Sakauchi | 画像データベース装置 |
JPH1153511A (ja) * | 1997-07-31 | 1999-02-26 | Canon Inc | 画像処理装置および方法および記憶媒体 |
JPH1153370A (ja) * | 1997-07-31 | 1999-02-26 | Canon Inc | 画像処理装置及びその方法、記憶媒体 |
JPH1153372A (ja) * | 1997-07-31 | 1999-02-26 | Canon Inc | 画像処理装置及びその方法、記憶媒体 |
-
1999
- 1999-06-11 JP JP16588599A patent/JP3529036B2/ja not_active Expired - Lifetime
Non-Patent Citations (2)
Title |
---|
柴田滝也 外,街路の景観画像データベースのイメージ語による検索,電子情報通信学会論文誌(J82−D−I),1999年 1月25日,Vol.J82−D−I,No.1,p.174−183 |
森靖英 外,知的作業支援のためのテキストデータベースに基づく画像理解,人工知能学会研究会資料 第9回合同研究会"AIシンポジウム’98",1998年12月 9日,p.101−106 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102376079A (zh) * | 2010-08-12 | 2012-03-14 | 富士施乐株式会社 | 图像识别信息添加装置和图像识别信息添加方法 |
CN102376079B (zh) * | 2010-08-12 | 2015-04-15 | 富士施乐株式会社 | 图像识别信息添加装置和图像识别信息添加方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2000353173A (ja) | 2000-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105027162B (zh) | 图像解析装置、图像解析系统、图像解析方法 | |
JP5050075B2 (ja) | 画像判別方法 | |
KR100737176B1 (ko) | 신호 처리 방법 및 영상 음성 처리 장치 | |
JP4859025B2 (ja) | 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体 | |
US9910829B2 (en) | Automatic document separation | |
JP4781924B2 (ja) | 文書画像のコンテント適応スケーリング用ホワイトスペースグラフ及びツリー | |
US8315465B1 (en) | Effective feature classification in images | |
US8005300B2 (en) | Image search system, image search method, and storage medium | |
US7120318B2 (en) | Automatic document reading system for technical drawings | |
US8326029B1 (en) | Background color driven content retrieval | |
US8300942B2 (en) | Area extraction program, character recognition program, and character recognition device | |
US7545980B2 (en) | Method of and apparatus for classifying an image | |
JP6188976B2 (ja) | 画像に含まれるテキストを検出する方法、装置及びコンピュータ読み取り可能な記録媒体 | |
CN111460961B (zh) | 一种基于cdvs的相似图聚类的静态视频摘要方法 | |
CN101453575A (zh) | 一种视频字幕信息提取方法 | |
CN109213886B (zh) | 基于图像分割和模糊模式识别的图像检索方法及系统 | |
US7277584B2 (en) | Form recognition system, form recognition method, program and storage medium | |
CN105260428A (zh) | 图片处理方法和装置 | |
CN115203408A (zh) | 一种多模态试验数据智能标注方法 | |
JP3529036B2 (ja) | 文書付き画像の分類方法 | |
CN114117038A (zh) | 一种文档分类方法、装置、系统及电子设备 | |
JP2005208977A (ja) | 文書ファイリング装置および文書ファイリング方法 | |
Barhoumi et al. | Effective region-based relevance feedback for interactive content-based image retrieval | |
JP3768738B2 (ja) | 電子ファイリングシステム,表紙識別処理装置およびそれらのプログラム記録媒体 | |
CN117809061B (zh) | 基于aigc的视频素材匹配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040219 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 3529036 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080305 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090305 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100305 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100305 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110305 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110305 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130305 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130305 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140305 Year of fee payment: 10 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |