[go: up one dir, main page]

JP2007096379A - 撮像装置、画像記録検索装置およびプログラム - Google Patents

撮像装置、画像記録検索装置およびプログラム Download PDF

Info

Publication number
JP2007096379A
JP2007096379A JP2005279020A JP2005279020A JP2007096379A JP 2007096379 A JP2007096379 A JP 2007096379A JP 2005279020 A JP2005279020 A JP 2005279020A JP 2005279020 A JP2005279020 A JP 2005279020A JP 2007096379 A JP2007096379 A JP 2007096379A
Authority
JP
Japan
Prior art keywords
image
feature
unit
feature extraction
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005279020A
Other languages
English (en)
Other versions
JP4706415B2 (ja
Inventor
Kazunori Kita
一記 喜多
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2005279020A priority Critical patent/JP4706415B2/ja
Publication of JP2007096379A publication Critical patent/JP2007096379A/ja
Application granted granted Critical
Publication of JP4706415B2 publication Critical patent/JP4706415B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)

Abstract

【課題】ユーザー以外の者であっても、所望の内容や構成の撮影画像を検索する際に有用な情報を得ることができるようにする。
【解決手段】特徴抽出手段106は、画像から各々異なる特徴を抽出する複数の特徴抽出部A、B、・・・を有している。撮影指示により撮像手段109により取り込まれて画像データメモリー111に一時的に記憶された画像データは、特徴抽出手段106と圧縮/符号化手段112とに転送される。そして、特徴抽出手段106において画像の送信先に応じて予め選択されている特徴抽出部A、B、・・・のいずれかにより、特徴が抽出され、この抽出された特徴は特徴データ符号化手段107で符号化される。また、画像データ自体は圧縮/符号化手段113で圧縮および符号化され、この圧縮および符号化された画像データと、前記符号化された特徴データとは、多重化されて画像データメモリー115に記録される。
【選択図】 図2

Description

本発明は、被写体を撮像する撮像装置、画像記録検索装置およびプログラムに関する。
従来、撮影した画像のみならず、他の情報も記録する機能を備えたカメラが提案されるに至っている。このカメラは、撮影時の被写体距離、レンズ焦点距離、ストロボ光源情報や、フィルム処理情報、露出不足画像の補正必要情報などの撮影情報を着脱自在な記録媒体に記録するものである(例えば、特許文献1参照)。
特開平02−306228号公報
しかしながら、前記カメラにおいて記録媒体に記録される情報は、撮影時の被写体距離やレンズ焦点距離などの撮影条件に関する情報であって、撮影した画像自体の内容や構成に関する情報ではない。したがって、前記記録媒体に記録された情報を用いても、撮影した多数の画像から所望の内容や構成の画像を検索することが困難となる。無論、当該カメラのユーザーであれば他人よりも、所望の内容や構成の画像を検索することは容易である場合もあるが、ユーザー以外の者にあっては、多数の画像から所望の内容や構成の画像を検索することが極めて困難となる。
本発明は、かかる従来の課題に鑑みてなされたものであり、ユーザー以外の者であっても、所望の内容や構成の撮影画像を検索する際に有用な情報を得ることのできる撮像装置、所望の内容や構成の撮影画像を検索することのできる撮像装置、画像記録検索装置およびプログラムを提供することを目的とする。
前記課題を解決するために請求項1記載の発明に係る撮像装置は、画像を撮像する撮像手段と、この撮像手段により撮像された画像からその特徴を抽出する特徴抽出手段と、前記画像を送信する相手先に応じて前記特徴抽出手段を動作させ、前記撮像手段により撮像される画像の特徴を抽出して取得する特徴取得手段とを備える。
したがって、本発明においては、特徴抽出手段により撮像する画像自体の特徴を抽出することから、この特徴の抽出により、複数の撮像した画像から所望の内容や構成の画像を検索する際に有用な情報を得ることができる。また、特徴抽出手段は、画像を送信する相手先に応じて動作することから、ユーザー以外の者において、所望の内容や構成の撮影画像を検索する際に有用な特徴情報を得ることができる。
また、請求項2記載の発明に係る撮像装置は、前記特徴抽出手段は、複数種の特徴抽出手段を含み、前記特徴取得手段は、前記画像を送信する相手先に応じて、前記特徴抽出手段のいずれかを選択する選択手段を含み、この選択手段により選択された特徴抽出手段を用いて、前記撮像手段により撮像される画像の特徴を抽出し取得する。したがって、予め選択された特徴抽出手段を用いて特徴抽出を行うことから、処理速度やメモリー容量などの処理負担の増加を抑制しつつ、適切な特徴の抽出を行うことができる。
また、請求項3記載の発明に係る撮像装置は、前記特徴抽出手段により抽出された特徴を記述する複数種の記述手段を更に備え、前記選択手段は、前記画像を送信する相手先に応じて、前記特徴手段とともにいずれかの記述手段を選択し、前記特徴取得手段は、前記選択手段により選択された記述手段を用いて前記抽出した画像の特徴を記述する。したがって、画像の特徴を記述した記述データにより、検索が容易となるとともに検索の精度を高めることができる。
また、請求項4記載の発明に係る撮像装置は、前記撮像手段により撮像された画像と、前記特徴取得手段により取得された画像の特徴とを外部に送信する送信手段を更に備える。したがって、画像とともにその画像を外部に送信し、これを受信した外部機器側でこれらを記録することにより、画像の記録及び検索が可能となる。
また、請求項5記載の発明に係る撮像装置は、画像を撮像する撮像手段と、この撮像手段により撮像された画像からその特徴を抽出する特徴抽出手段と、この特徴抽出手段により抽出された特徴を前記画像に付加して送信する送信手段と、前記撮像手段により撮像された前記画像に、前記特徴抽出手段により抽出された特徴を付加して送信するか否かを送信相手先別に設定する設定手段と、この設定手段の設定に従って前記特徴抽出手段及び送信手段を制御する制御手段とを備える。したがって、送信相手先に応じて特徴を付加した画像と、付加しない画像とを選択的に送信することができる。
また、請求項6記載の発明に係る撮像装置は、前記特徴抽出手段は、複数種の特徴抽出手段を含み、前記制御手段は、前記送信相手先に応じて、前記特徴抽出手段のいずれかを選択する選択手段を含み、前記送信手段は、 前記選択手段により選択された特徴抽出手段により抽出された特徴を前記画像に付加して送信する。したがって、予め選択された特徴抽出手段を用いて特徴抽出を行うことから、処理速度やメモリー容量などの処理負担の増加を抑制しつつ、適切な特徴の抽出を行うことができる。
また、請求項7記載の発明に係る画像記録検索装置は、画像を取得する画像取得手段と、この画像取得手段により取得された画像からその特徴を抽出する複数種の特徴抽出手段と、この複数種の特徴抽出手段から、いずれかの特徴抽出手段を選択する選択手段と、この選択手段により選択された特徴抽出手段を用いて前記画像の特徴を抽出し取得する特徴取得手段と、この特徴抽出手段により抽出し取得された特徴と前記画像とを記録する記録手段と、画像の特徴を入力する入力手段と、この入力手段により入力された画像の特徴と前記記録手段に記録された画像の特徴とに基づき、前記記録手段にて対応する画像を検索する画像検索手段と、この画像検索手段による検索結果を出力する出力手段とを備える。
したがって、本発明においては、特徴抽出手段により画像自体の特徴を抽出することから、この特徴の抽出により、記録した複数の画像から所望の内容や構成の画像を検索する際に有用な情報を得ることができる。また、予め選択された特徴抽出手段を用いて特徴抽出を行うことから、処理速度やメモリー容量などの処理負担の増加を抑制しつつ、適切な特徴の抽出を行うことができる。また、画像の検索に際しては、画像の特徴を入力する簡単な操作により、記録された複数の画像から所望の内容や構成の画像を検索することができる。
また、請求項8記載の発明に係る画像記録検索装置は、前記画像取得手段は、撮像手段から出力された画像を取得する手段又は前記記録手段に記録されている画像を取得する手段を含むことを特徴とする請求項7記載の画像記録検索装置。したがって、撮像装置として、請求項7記載の発明と同様の作用効果を奏する。
また、請求項9記載の発明に係る画像記録検索装置は、前記出力手段は、前記検索結果を表示出力する表示手段を含む。したがって、この表示手段による表示よって、ユーザーは検索結果を視覚的に確認することができる。
また、請求項10記載の発明に係る画像記録検索装置は、前記出力手段は、前記検索結果を一覧表示する第1の表示手段と、この第1の表示手段により表示された一覧からいずれかの検索結果が選択されると、当該検索結果に対応する画像を表示する第2の表示手段とを含む。したがって、表示手段に検索結果の一覧が表示された状態において、いずれかを選択することにより、対応する画像を表示することができる。
また、請求項11記載の発明に係る画像記録検索装置は、前記入力手段は、複数の特徴を入力し、前記画像検索手段は、前記入力手段により入力された複数の特徴と前記記録手段に記録された画像の特徴とに基づき、前記画像を検索する。したがって、複数の特徴に基づき検索が実行されることにより、画像の検索精度を高めることができる。
また、請求項12記載の発明に係る画像記録検索装置は、前記入力手段は、キーワードにより前記画像の特徴を入力し、前記画像検索手段は、前記入力手段により入力されたキーワードに基づき、前記画像を検索する。したがって、キーワードを入力するという明快かつ簡単な操作に操作により、所望の画像を検索することできる。
また、請求項13記載の発明に係る画像記録検索装置は、前記入力手段により入力されるキーワードに関連する複数種の関連語を記憶した辞書手段と、この辞書手段から、前記キーワードに関連する関連語を検索する関連語検索手段とを更に備え、前記画像検索手段は、前記関連語検索手段により検索された関連語と前記記録手段に記録された画像の特徴記述とに基づき、前記画像を検索する。したがって、入力されたキーワードが検索目的とする画像との関係において適切でなかった場合であっても、これに左右されることなく、目的とする画像を検索することが可能となる。
また、請求項14記載の発明に係る画像記録検索装置は、前記画像の特徴には、(1)前記画像中の所定の領域の色情報または色分布に関する特徴、(2)前記画像中の分割された領域の輪郭線の形状に関する特徴、(3)前記画像中の全体領域または分割された領域、もしくは背景領域のテクスチャーに関する特徴のいずれかが含まれる。したがって、これらの特徴により、所望の内容や構成の撮影画像を的確に検索することができる。
また、請求項15記載の発明に係る画像記録検索装置は、前記画像検索手段は、前記入力手段により入力された画像の特徴に基づき、当該装置が有する前記記録手段にて対応する画像を検索する第1画像検索手段と、外部装置が有する記録手段にて対応する画像を検索する第2の画像検索手段とを含む。したがって、外部装置が有する記録手段に記録された画像の検索をも行うことができる。
また、請求項16記載の発明に係る画像記録装置は、画像を記録する記録手段と、この記録手段に記録される画像からその特徴を抽出する特徴抽出手段と、前記画像を送信する相手先に応じて前記特徴抽出手段を制御し、前記記録手段に記録される画像の特徴を抽出して取得する特徴取得手段とを備える。したがって、画像記録装置として請求項1記載の発明と同様の作用効果を奏する。
また、請求項17記載の発明に係る撮像制御プログラムは、画像を撮像する撮像手段を備える撮像装置が有するコンピュータを、前記撮像手段により撮像された画像からその特徴を抽出する特徴抽出手段と、前記画像を送信する相手先に応じて前記特徴抽出手段を制御し、前記撮像手段により撮像される画像の特徴を抽出して取得する特徴取得手段として機能させる。したがって、前記コンピュータがこのプログラムに従って処理を実行することにより、請求項1記載の発明と同様の作用効果を奏する。
また、請求項18記載の発明に係る画像記録検索プログラムは、記録手段と、画像の特徴を入力する入力手段とを備える画像記録検索装置が有するコンピュータを、前記記録手段により記録される画像からその特徴を抽出する複数種の特徴抽出手段と、この複数種の特徴抽出手段から、いずれかの特徴抽出手段を選択する選択手段と、この選択手段により選択された特徴抽出手段を用いて前記画像の特徴を抽出し、この抽出した特徴を前記画像とともに前記記録手段に記録する記録制御手段と、前記入力手段により入力された画像の特徴と前記記録手段に記録された画像の特徴とに基づき、前記記録手段にて対応する画像を検索する画像検索手段と、この画像検索手段による検索結果を出力する出力手段と
して機能させる。したがって、前記コンピュータがこのプログラムに従って処理を実行することにより、請求項7記載の発明と同様の作用効果を奏する。
以上説明したように請求項1、16及び17に係る発明によれば、特徴抽出手段により撮像する画像自体の特徴を抽出することから、この特徴の抽出により、複数の撮像した画像あるいは記録した画像から所望の内容や構成の画像を検索する際に有用な情報を得ることができる。また、選択される特徴抽出手段は、画像を送信する相手先に応じて選択されることから、ユーザー以外の者において、所望の内容や構成の撮影画像を検索する際に有用な特徴情報を得ることができる。
また、請求項7及び18に係る発明によれば、特徴抽出手段により画像自体の特徴を抽出することから、この特徴の抽出により、記録した複数の画像から所望の内容や構成の画像を検索する際に有用な情報を得ることができる。また、予め選択された特徴抽出手段を用いて特徴抽出を行うことから、処理速度やメモリー容量などの処理負担の増加を抑制しつつ、適切な特徴の抽出を行うことができる。また、画像の検索に際しては、画像の特徴を入力する簡単な操作により、記録された複数の画像から所望の内容や構成の画像を検索することができる。
また、請求項5に係る発明によれば、ユーザにおいては送信相手先に応じて特徴を付加した画像と、付加しない画像とを選択的に送信することができ、ユーザー以外の者においては、所望の内容や構成の撮影画像を検索する際に有用な特徴情報を得ることができる。
以下、本発明の一実施の形態を図に従って説明する。
(第1の実施の形態)
図1(A)は各実施の形態に共通するデジタルカメラ1の正面図、(B)は背面図、(C)は側面透視図である。このデジタルカメラ1の本体2には、その上面部に半押し機能を備えたレリーズ釦(シャッタースイッチ)3と電源スイッチ4とが配置されており、正面部にはグリップ部5、ストロボ6および撮像レンズ部の受光窓7が配置されている。また、背面部には、モード切替スイッチ8、ズーム操作キー9、カーソルキー10、決定/OKキー11、DISPキー12、メニューキー13および電子ファインダとしても機能するLCDからなる表示部14が配置されているとともに、メモリー媒体と電池とを収納するメモリー媒体/電池収納部15が設けられている。また、回動式ミラー18、レンズ群19およびCCD等で構成される電子撮像センサ20等が配置されている。
なお、後述するフローチャートにおいて説明する「選択」あるいは「設定」は、カーソルキー10、決定/OKキー11、DISPキー12、メニューキー13を適宜操作することによりなされる。また、メニューキー13の操作により表示部14に選択可能な文字列が表示され、この文字列からカーソルキー10と決定/OKキー11の操作によりいずれかの文字を選択することにより、後述する検索項目、ワード等の文字を入力することも可能である。
図2は、デジタルカメラ1の概略的回路構成を示すブロック図である。このデジタルカメラ1は、ユーザーにより操作される操作入力手段130を備えている。この操作入力手段130には、撮影条件設定手段101、特徴データの選択手段102、特徴データ付加の設定手段103、特徴記述様式の選択手段104、撮影・記録制御手段105が接続されている。撮影条件設定手段101は、操作入力手段130からの操作入力信号に基づき、撮影条件を設定する。特徴データの選択手段102は、前記操作入力信号に基づき、特徴抽出手段106が有するいずれかの特徴抽出部A、B、・・・を選択する。特徴データ付加の設定手段103は、前記操作入力信号に基づき、抽出された特徴データを画像に付加するか否かを設定する。特徴記述様式の選択手段104は、前記操作入力信号に基づき、特徴データを付加する際の記述様式を選択する。また、特徴データ符号化手段107は、前記いずれかの特徴抽出部A、B、・・・により抽出された特徴データを符号化する。 さらに、このデジタルカメラ1には、撮像手段109、信号処理手段110、画像データメモリー111、画像・動画像の圧縮/符号化手段112、多重化部113、メモリー制御手段114、画像データメモリー115、多重分離部116、画像・動画像の伸張/復号化手段117、表示制御手段118および表示手段119が設けられている。前記撮影・記録制御手段105は、前記操作入力信号(撮影指示操作入力信号)に基づき、撮像手段109を制御するとともに、前記撮影条件設定手段101の設定内容に従って信号処理手段110を制御する。一定のタイミング毎に撮像手段109により取り込まれる画像信号は、信号処理手段110により処理されて画像データメモリー111に一時的に記憶されるとともに、表示制御手段118を介して表示手段119に与えられることにより、スルー画像として表示手段112に表示される。また、撮影指示があった時点で撮像手段109により取り込まれて画像データメモリー111に一時的に記憶された画像データは、特徴抽出手段106転送されるとともに、画像・動画像の圧縮/符号化手段112に転送される。
そして、特徴抽出手段106において予め選択されている特徴抽出部A、B、・・・のいずれかにより、特徴が抽出され、この抽出された特徴は特徴データ符号化手段107で符号化される。また、画像データ自体は画像・動画像の圧縮/符号化手段112で圧縮および符号化され、この圧縮および符号化された画像データと、前記符号化された特徴データとは、多重化部113で多重化され、メモリー制御手段114により画像データメモリー115に記録される。また、画像の再生時においては、メモリー制御手段114は、前記多重化された画像データと特徴データとからなる多重データを画像データメモリー115から読み出す。この読み出された多重データは、多重分離部116にて画像データと特徴データとに分離される。この分離された画像データは、画像・動画像の伸張/復号化手段117で伸張および復号化され、画像データメモリー111に一時的に記憶される。
さらに、このデジタルカメラ1には、画像検索手段120と、再生制御手段121とが設けられており、画像検索手段120は特徴データの復号化手段123、検索特徴量の指定手段122および比較手段124を有している。検索特徴量の指定手段122は、ユーザーの操作に応じて検索特徴量を比較手段124に出力する。一方、前記多重分離部116で分離された特徴データは、特徴データの復号化手段123により復号されて比較手段124に出力される。比較手段124は、前記検索特徴量と特徴データとを比較して、その比較結果を再生制御手段121に出力し、再生制御手段121前記比較結果に基づき、検索特徴量と一致する特徴データを有していた画像データを画像データメモリー111から表示制御手段118に転送する。これにより、表示手段119に、検索特徴量と一致する特徴データを有していた画像データに基づく画像を表示させることができる。なお、比較手段124には、前記特徴抽出手段106からの特徴データも入力される。
図3は、デジタルカメラ1の具体的回路構成を示すブロック図である。このデジタルカメラ1は、AE、AWB、AF等の一般的な機能を有するものであり、ズームレンズ、フォーカスレンズで構成される前記レンズ群19を有している。このレンズ群19の光軸上には電子撮像センサ20が配置されており、前記レンズ群19は、モーター等を有する駆動部21によって駆動される。
このデジタルカメラ1全体を制御する制御回路22は、CPUおよびその周辺回路で構成されており、プログラムメモリー23に格納されているプログラムに基づき、データメモリー24をワークエリアとして使用しつつ各部を制御する。この制御回路22には、撮影制御部25が接続されている。撮影制御部25は、制御回路22が発生するタイミング信号に基づき、電子撮像センサ20を駆動するとともに、測光/測距センサ33より測光/測距部34を介して入力される測光データおよび測距データに基づき、前記駆動部21および映像信号処理部26を制御する。
前記電子撮像センサ20の受光面には、レンズ群19によって被写体が結像される。電子撮像センサ20は、撮影制御部25によって駆動され、被写体の光学像に応じたアナログの撮像信号を映像信号処理部26へ出力する。映像信号処理部26は、電子撮像センサ20の出力信号に含まれるノイズを相関二重サンプリングによって除去するCDS回路や、ノイズが除去された撮像信号をデジタル信号に変換するA/D変換器等から有するとともに、入力した撮像信号に対しペデスタルクランプ等の処理を施し、それを輝度(Y)信号および色差(UV)信号に変換するとともに、オートホワイトバランス、輪郭強調、画素補間などの画品質向上のためのデジタル信号処理を行う。映像信号処理部26で変換されたYUVデータは順次画像メモリー27に格納されるとともに、RECスルー・モードでは1フレーム分のデータ(画像データ)が蓄積される毎にビデオ信号に変換され、表示制御部28を介して前記表示部14へ送られてスルー画像として画面表示される。したがって、このとき表示部14は電子ファインダ29として機能する。なお、表示部14を電子ファインダ29として機能させる際には、その中央部にフォーカス枠を表示させ、このフォーカス枠内のをAFエリアとして、AFがなされる。
そして、静止画撮影モードにおいては、前記レリーズ釦3に対する操作をトリガとして、制御回路22は、電子撮像センサ20、撮影制御部25、および映像信号処理部26に対してスルー画撮影モードから静止画撮影モードへの切り替えを指示し、この静止画撮影モードによる撮影処理により得られ画像メモリー27に一時記憶された画像データは、圧縮符号化・伸張復号部30で圧縮および符号化され、所定のフォーマットの静止画ファイルとして、画像&音声メモリー媒体31(または後述するHDD記憶装置46の磁気ディスク48)に記録される。また、動画撮影モードにおいては、1回目のシャッターキーと2回目のシャッターキー操作との間に、画像メモリー27に順次記憶される複数の画像データが圧縮符号化・伸張復号部30で順次圧縮され、順次記憶された後、動画ファイルとして画像&音声メモリー媒体31(または後述するHDD記憶装置46の磁気ディスク48)に記録される。この画像&音声メモリー媒体31(または磁気ディスク48)に記録された静止画ファイルおよび動画ファイルは、PLAY・モードにおいてユーザーの選択操作に応じて圧縮符号化・伸張復号部30に読み出されて伸張および復号化され、YUVデータとしてに展開された後、表示部14に表示される。したがって、このとき表示部14は画像モニター32として機能する。
前記プログラムメモリー23には、制御回路22に前記各部を制御させるための各種のプログラム、例えばAE、AF、AWB制御用のプログラムや、データ通信用プログラム、さらには、後述するフローチャートに示す処理を実行するためのプログラム等の各種のプログラム、後述する類語辞書や心理辞書等が格納されている。また、制御回路22には、操作入力部35が入力回路36を介して接続されている。操作入力部35には、前記レリーズ釦3や電源スイッチ4等の図1に示したスイッチやキー群等が設けられている。
また、このデジタルカメラ1は、前記動画撮影モード、音声のみを記録する録音モード、音声付き(静止画)撮影モードにおいて、周囲音を記録する録音機能を備えており、このため周囲音を検出するマイク39が設けられている。このマイク39からの音声信号は、アンプ40で増幅され、A/D変換器41でデジタル変換され、音声メモリー42に格納される。この音声メモリー42に格納された音声データは、前記圧縮符号化・伸張復号部30で圧縮される。制御回路22は、この圧縮音声データと前記圧縮動画データとを含む音声付き動画ファイルを生成して画像&音声メモリー媒体31(または後述するHDD記憶装置46の磁気ディスク48)に記録する。この画像&音声メモリー媒体31(磁気ディスク48)に記録された動画ファイルの音声データは、PLAY・モードにおいてユーザーの選択操作に応じて圧縮符号化・伸張復号部30に読み出されるとともに伸張および復号化される。この伸張および復号化された音声データは、D/A変換器43でアナログ信号に変換され、アンプ44を介してスピーカー45に供給されて音声として再生される。なお、音声記録を行うタイミングは、動画撮影時に限定されず、音声付き静止画撮影モードにおける録音動作時でもよく、また、録音モードやアフレコモードにおける録音動作時でもよい。
また、このデジタルカメラ1は、外部入出力インタフェース38を介して制御回路22に接続された外部入出力端子37を備えている。この外部入出力端子37には、PC等の外部機器70を接続することが可能である。外部機器は70は、ゲートウェイGWおよびインターネット71を介して、サーバー装置72に接続可能であり、サーバー装置72は画像データを格納する画像データベース73接続されている。一方、HDD記憶装置46は、HDD・IF47を介して制御回路22に接続されている。HDD記憶装置46は、前記磁気ディスク48を有するとともに、モータ49、モータドライバ50、マイコン部51、VCM52、ヘッドアンプ53、リード/ライトチャンネル54、HDD制御部55等を有している。
また、制御回路22には、画像・音声の特徴抽出/認識用データメモリー56が画像・音声の特徴抽出/認識処理部57を介して接続されている。後述するように、制御回路22は、画像・音声の特徴抽出/認識処理部57を制御して、前記電子撮像センサ20により取り込まれた画像、および前記マイク39により取り込まれた音声の特徴を抽出するとともに認識し、画像・音声の特徴抽出/認識用データメモリー56は、これら抽出および認識された画像の特徴や音声の特徴等を記憶する。また、制御回路22の制御下で画像・音声の特徴抽出/認識処理部57が抽出あるいは抽出した特徴の記述データは、圧縮符号化・伸張復号部30で圧縮符号化されて画像&音声メモリー媒体31に記憶される。したがって、画像&音声メモリー媒体31には、画像メモリー27および音声メモリー42側から入力された画像/音声データ31aと、画像・音声の特徴抽出/認識処理部57側から入力された特徴記述データ31bとが記憶される。
図4は、本実施の形態の処理手順を示すフローチャートであり、制御回路22はプログラムメモリー23に格納されているプログラムに基づき、図4に示すフローチャートに従って処理を実行する。先ず、ユーザーによる操作入力部35での操作により、撮影モードが設定されているか否かを判断する(ステップS101)。撮影モードが設定されていない場合には、再生モード、設定モードなど、その他のモード処理へ移行する(ステップS102)。
図5は、このステップS102により、その他の処理に移行した場合の処理手順を示すフローチャートである。先ず、前記ユーザーによる操作入力部35での操作により、設定モードが選択されたか否かを判断し(ステップS201)、設定モードが設定されていない場合には、その他のモード処理へ移行する(ステップS202)。また、設定モードが設定された場合には、さらに特徴抽出の設定モードが設定されたか否かを判断し(ステップS203)、特徴抽出の設定モードが設定されていない場合にも、その他のモード処理へ移行する(ステップS204)。
また、特徴抽出の設定モードが設定された場合には、設定状態の表示など、設定モードの表示処理を行って、表示部14に後述するような表示を行う(ステップS205)。次に、この表示処理により表示部14に表示された選択肢から特徴抽出による撮影方法が選択されたか否かを判断する(ステップS206)。特徴抽出による撮影方法が選択されたならば、操作に応じて、特徴抽出するか否か、また、特徴抽出による撮影処理の識別を選択する(ステップS107)。
また、ステップS206での判断の結果、特徴抽出による撮影方法が選択されなかった場合には、特徴データの記録の設定が選択されたか否かを判断する(ステップS208)。特徴データの記録の設定が選択された場合には、操作に応じて、特徴データを付加して記録するか否か(ON/OFF)を設定する。特徴データの記録の設定が選択されなかった場合には、特徴データの選択がなされたか否かを判断し(ステップS210)、特徴データの選択がなされた場合には、操作に応じて、抽出した特徴項目または特徴量を選択し(ステップS211)、選択された特徴項目、特徴量に基づいて、特徴抽出方法を選択する(ステップS212)。
また、特徴データの選択がなされなかった場合には、特徴方法の選択がなされたか否かを判断し(ステップS213)、特徴方法の選択がなされた場合には、操作に応じて、オートまたはカスタム設定の特徴抽出方法を選択する(ステップS214)。特徴方法の選択がなされなかった場合には、特徴データの記述様式の選択がなされたか否かを判断し(ステップS215)、特徴データの記述様式の選択がなされた場合には、さらに送付先別に設定するが選択されたか否かを判断する(ステップS216)。そして、送付先別に設定するが選択された場合には、送付先別に特徴データの記述様式および記述する特徴量を選択する(ステップS217)。
すなわち、ステップS216で送付先別に設定するを選択する予定のユーザーは、予め撮像した画像データを送信する相手(メールアドレス)や、該画像データを出力する外部機器等の送付先を入力し、データメモリー24に記憶させておく。すると、ステップS217により、各送付先別に特徴データの記述様式および特徴量を選択する処理を行う。これにより、送付先別、つまり画像データを送信する相手や外部機器別に記述様式および記述する特徴量を選択設定されることとなる。
しかし、送付先別に設定するが選択されなかった場合には、操作に応じて、特徴データの記述様式を選択する(ステップS218)。
また、前記ステップS215での判断の結果、特徴データの記述様式の選択がなされなかった場合には、識別する被写体の選択がなされたか否かを判断する(ステップS219)。識別する被写体の選択がなされ場合には、操作に応じて、特徴データに基づいて識別する被写体の種類または識別方法を選択し(ステップS220)、識別する被写体の選択がなされ場合には、その他のキー処理を実行する(ステップS221)。しかる後に、設定状態の表示更新など、表示処理を実行して(ステップS222)、リターンする。
したがって、本実施の形態においては、設定モードにおいて、ユーザー操作に従って、特徴抽出する場合の方法、および、抽出する特徴量、画像識別を行う被写体の設定、類似する画像か否かを比較参照する為のテンプレート画像(テンプレートデータ)の設定などを任意に選択して設定できる。また、撮影モードや画像認識モードなどに応じて、オート(自動)で特徴抽出や画像識別する場合にも、ユーザーの目的や希望に応じて、その抽出方法や識別方法、識別精度などを選択したり、加減調整することもできる。
なお、本実施の形態においては、送付先別に特徴データの記述様式および記述する特徴量を選択して設定し(ステップS217)、この特徴量の選択により結果的に特徴注出手段(特徴注出方法)が選択されるようにしたが、直接的に特徴注出手段を送付先別に選択設定したり、あるいは特徴注出手段のみ、記述様式のみ、特徴量のみを送付先別に選択設定するようにしてもよい。
一方、前記図4のフローチャートにおいて、ステップS101での判断の結果、撮影モードが設定されたならば、露出条件などの撮影条件を設定するとともに(ステップS103)、測光処理、測距処理(ステップS104)、ズーム処理、AF処理を実行する(ステップS105)。
一方、制御回路22は、予め行われたユーザーの操作に応じた設定処理により、特徴抽出がONとなっているか否かを判断し(ステップS106)、ONとなっている場合には、撮影前に特徴抽出が設定されているか否かを判断する(ステップS107)。撮影前に特徴抽出が設定されている場合には、画像データから前記ステップS217で選択されている特徴量を抽出する(ステップS108)。さらに、抽出被写体にAFする設定がONとなっているか否かを判断し(ステップS109)、ONとなっている場合には、抽出された特徴量に基づいてAF処理、または、追尾AF処理を行う(ステップS110)。
なお、この特徴量に基づくAF処理、追尾AF処理については、第3の実施の形態において詳述する。
また、ステップS109での判断の結果、抽出被写体にAFする設定がONとなっていない場合には、撮影シーンの自動選択がONに設定されているか否かを判断する(ステップS111)。ONとなっている場合には、抽出特徴量に基づいて撮影シーンを選択し(ステップS112)、選択された撮影シーンに応じて撮影条件を設定する(ステップS113)。また、ステップS111での判断の結果、撮影シーンの自動選択がOFFとなっている場合には、被写体の識別がONとなっているか否かを判断する(ステップS114)。ONとなっている場合には、抽出特徴量に基づいて内蔵テンプレート(図12のテンプレートデータ246)と比較し、類似する被写体を識別し分類処理するとともに(ステップS115)、識別分類結果を記録する(ステップS116)。さらに、ステップS114での判断の結果、被写体の識別がOFFとなっている場合には、抽出特徴量に基づいて顔領域を識別し(ステップS118)、被写体の顔領域にAF処理する(ステップS119)。
しかる後に、撮像画像をスルー画像表示し(ステップS120)、これにより、表示部14には、顔領域にAFされることによって被写体の顔にピントがあったスルー画像が表示部14に表示され、ユーザーはこの表示部14に表示されたスルー画像を見ながら、このデジタルカメラ1の向きを調整する等してシャッターチャンスを伺うこととなる。したがって、次にレリーズ釦3が押し操作されて撮影指示がなされたか否かを判断する(ステップS121)。そして、レリーズ釦3が押し操作されて撮影指示がなされたならば、測光処理、AF処理を実行するとともに(ステップS122)、設定撮影条件と測光値(および特徴抽出結果)に従い撮影動作し(ステップS123)、電子撮像センサ20から取り込まれた画像データを圧縮符号化する(ステップS124)。
次に、特徴データの付加記録がONに設定されているか否かを判断し(ステップS125)、ONに設定されていない場合には画像データと撮影情報とを画像&音声メモリー媒体31(または磁気ディスク48)に記録する。また、ONに設定されている場合には、撮影後に特徴抽出が設定されているか否かを判断し(ステップS126)、設定されている場合には前記記録した画像データから選択されている特徴量を抽出する(ステップS127)。また、被写体の識別分類がONとなっているか否かを判断し(ステップS128)、ONとなっている場合には、識別・分類結果を特徴データに付加する(ステップS129)。さらに、特徴データを選択されている記述様式で符号化し(ステップS130)、ファイル名を付して前記画像データ、撮影情報とともに特徴データを画像&音声メモリー媒体31(または磁気ディスク48)に記録する(ステップS131)。しかる後に、撮影画像を表示部14にレビュー表示し、または、特徴抽出結果を表示し(ステップS133)、その他のキー処理、表処理を行って(ステップS134)、リターンする。
したがって、前記ステップS216で送付先別が選択されて、ステップS217で送付先別に特徴データの記述様式および記述する特徴量が選択されていると、ステップS131の処理により、特徴データは送付先別に選択された記述様式で符号化されて画像データ、撮影情報とともに画像&音声メモリー媒体31に記録されることとなる。そして、この画像&音声メモリー媒体31(または磁気ディスク48)に記録された前記画像データ、撮影情報および特徴データは、外部入出力端子37に、PC等の外部機器70を接続した状態において、外部機器は70に送信することができ、さらには、この外部機器は70
、ゲートウェイGWおよびインターネット71を介して、サーバー装置72に送信したり、相手先メールアドレスに送信することが可能となる。
図6は、前記図5のフローチャートにより実行される特徴抽出の設定モードにおける表示部14の表示画面例を示す図である。(a)特徴抽出撮影、画像認識撮影の設定メニューにおいては、「撮影モード 静止画」「特徴抽出・識別 抽出被写体にAF」・・・等のメニューを表示し(a1)、「特徴抽出・識別 抽出被写体にAF」が選択されると「OFF(抽出しない)」「被写体の特徴記録」・・・等の選択肢を表示する(a2)。また、(b)特徴抽出方法の設定メニューにおいては、「撮影モード 静止画」「特徴識別 被写体の特徴記録」「特徴抽出方法 オート(シーン別)」・・・等のメニューを表示し(b1)、「特徴抽出方法 オート(シーン別)」が選択されると、「オート(撮影シーン別)」や「色の抽出」「輪郭の抽出」「テクスチャー抽出」・・・との特徴抽出方法の設定(b2)に移行する。また、(c)抽出した特徴データの記述様式の設定においては、「撮影モード」・・・「特徴データの記録」・・・等を表示し、「特徴データの記録」が選択されると「OFF(記録しない)」「DCF拡張形式」「MPEG−7」・・・等の記述様式を表示して、いずれか(図の例では「MPEG−7」)を選択させる。また、(d)識別する被写体の設定においては、「識別する被写体 人物の顔」「識別アルゴリズム 特徴点グラフ」等を表示させて、いずれかを選択させる。
なお、選択項目は、図6に示したものに限らず、以下のような項目とするようにしてもよい。すなわち、写真を検索する場合には、その主な利用用途、例えばa)画像を印刷する、b)画像をホームページ等にアップロードする、c)画像データを外部機器に送る、d)画像を編集する、e)他人に送る、などの主な用途や優先度を選択し、それに応じて、抽出すべき特徴量や組合せを選択し、特徴量に応じて、特徴抽出方法を選択するようにしてもよい。
例えば、画像を印刷する場合には、特定の画像やシーンだけで効率よく検索することが好ましく、画像の付加データとして、撮影日時とともに、シーンや被写体の種別、および、撮影場所などを識別して、特徴データやメタデータとして記録しておくことにより、迅速に検索でき、効率的となる。
また、ホームページなどのアップロードする画像素材を探すことが多い場合には、過去から最近までの画像の中から、文脈や目的に合った画像を検索する必要があり、被写体の識別だけでなく、その情景やイメージを表す、色調や配色パターン、テクスチャーなども特徴データとして記録しておくことにより、迅速な検索が可能となる。
また、画像を他人に送る場合には、送る相手の顔が写っている画像や、一緒に出かけた旅行の写真を検索することが多く、友人の登録画像との類似度など、顔の特徴データの抽出を行い、類似度や認識結果を記録しておくと、迅速な検索が可能となる。
また、画像データを送信する相手(メールアドレスなど)毎に、または、出力する相手側機器別に、どの特徴データを抽出するか、また、その特徴データを付加して記録するか、送信するかを設定しておき、送信相手または出力機器に応じて、設定された特徴データが付加されて送信/出力できるようにることができる。
また、送信する相手または出力する機器が変わる場合には、撮影時に抽出されて記録された特徴記述データと異なる特徴を新たに抽出したり(再抽出)、特徴記述データに付加したり(再記録)できるようにすることが好ましい。
また、特徴抽出においては、当該画像の撮影時に記録された撮影条件データ、例えば、撮影モード、画像サイズ、画質、AFモード、測光モード、測光値、被写体距離、露出条件、感度、照明条件、静止画/動画/連写モード、などに基づいて、特徴抽出したり、特徴抽出手段を選択するように構成すると、当該画像の特徴の抽出を効率的に行い得る。例えば、選択されたオートフォーカスのAF(合焦)枠や、測光方式がスポット測光や中央重点測光などの場合には、AF枠や測光枠は主要な被写体に向けられて撮影されることが多いので、当該枠を中心にその隣接周辺領域で、主要被写体の色相分布または輪郭線による人物や被写体の識別を行うのが効果的である。また、合焦AF枠が2〜3と複数の場合には、複数の人物や被写体の画像と判断され、複数の被写体の色相分布または輪郭線よる識別等を行うのが効果的である。他方、平均測光やパンフォーカスの場合では、画像の領域全体に被写体が分散した画像や近景、遠景を含む風景などを撮影した画像が多いので、それに応じて、広い範囲での輝度や色相分布による特徴抽出や、拝啓のテクスチャー解析などの特徴抽出手段を選択できる。このように、抽出すべき特徴量や抽出方法だけでなく、抽出対象の画像領域、抽出オブジェクトの設定、抽出アルゴリズム、抽出レベル、分解能やビット数、類似度など、特徴抽出や画像識別の設定パラメータを、前記撮影条件データに応じて設定することができる。
図7は、本実施の形態における特徴抽出処理と特徴データの記録処理の概要(制御の流れ)を示す説明図である。すなわち、ユーザーによって予めなされる設定項目201に対する設定操作cにより、抽出する特徴項目202、特徴データ付加のON/OFF203、特徴データの記述様式204が選択される。また、撮影条件205に対する設定操作bにより、撮影条件などの撮影情報206が確定する。そして、撮影操作aを行うと、撮影処理207が実行され、撮影画像208が取得され、この撮影画像208に対して画像の圧縮/符号化209がなされ、画像データファイル210において符号化画像データ211やサムネイル画像212として記録される。また、前記撮影条件などの撮影情報206は、画像データファイル210においてヘッダ情報213として記録される。
一方、撮影画像208からは、前記選択された特徴事項について特徴抽出214がなされて、特徴抽出データ215が得られる。この特徴抽出データ215は、前記選択された特徴データの記述様式204に従って、特徴データの記述符号化218されて、特徴記述コード216が得られ、この特徴記述コード216が前記画像データファイル210において拡張ヘッダ情報(画像特徴データ等)217として記録されるのである。
なお、図7において、206aは撮影条件などの撮影情報206の具体例を示し、216aは特徴記述コード216の具体例を示す。
図8は、本実施の形態における、画像から抽出した特徴データの記述例を示す図である。すなわち、撮影した主画像(1)から、その画像の特徴部分の部分画像(Still Region)(2)〜(8)を抽出する。そして、主画像(1)からは特徴データとして「類似:サッカー5」を抽出し、部分画像(2)からは特徴データとして「形:人間、代表色:Blue(ブルー)、類似:サッカー5」を抽出し、部分画像(3)からは特徴データとして「代表色:Green(グリーン)、テクスチャー:植物、類似:芝生」を抽出する。以下同様にして、部分画像(4)〜(8)からの各々図中に記載した特徴データを抽出する。また、撮影した主画像(10)から、その画像の特徴部分の部分画像(Still Region)(11)および(12)を抽出する。そして、主画像(10)からは特徴データとして「類似:港3」を抽出し、部分画像(11)からは特徴データとして「形:人間、代表色:Blue(ブルー)、テクスチャー:海、類似:船1」を抽出する。
また、これら特徴データの記録(出力)は、ユーザー操作により選択された方法(記述用紙に従って、例えば、特徴データをDFCやEXIFなどの画像ファイルのヘッダ情報の拡張データとしても、あるいは、MPEG−7(ISO/IEC 15938)規格に準じたメタデータ記述ファイル、または、SMPTE(Society of Motion Picture and Television Engineeers)規格、EBU(European Broadcasting Union)によるP/Meta規格、TV−Anytime(TV-Anytime Forum)規格、W3CによるSMIL(Syncronized Multimedia Integration Language)規格、あるいは、Dublin Core(Dublin Core Metadate Initiative)とRDF(W3C、Resource Description Framaework)によるXML構文、などの各種メタデータ記述用の規格や言語、あるいは、XML(W3C)などの汎用記述言語に準じた記述ファイル、あるいは、これらをバイナリデータ等に交換した記述データファイル等から、任意に選択して記録(出力)するようにできる。
図9において、(a)はMPEG−7による特徴データの記述例を示し、(b)はDublin CoreとRDFのXML構文による特徴データの記述例を示し、(c)はSMILによる特徴データの記述例を示す。
なお、例えば、最も古くから書誌情報のメタデータ記述法として用いられているDublin Core(1995)では、タイトル(title)、概要記述(description)、出版社(publisher)、作者(creator)、著作権(ights)、年月日(date)、種別(type)、様式(format)、・・・など15の基本属性(Dublin Core Metadata Element Set:DCMES)が規定されており、表記法は例えばXMLに準じたRDF(Resource Description framework)のスキーマなどを用いて記述する。各種メタデータ記述規格では、放送映像用やビットストリーム映像用、ネットワーク配信用など、用途別の規格によって記述子や記述スキーム等はそれぞれ異なるが、同様に、このような書誌情報の多くを記述できる。
マルチメディア用のメタデータ記述規格のMPEG−7(ISO/IEC 15938)の、MPEG−7Visual(ISO/IEC 15938-3)では、画像や映像データ、音声などの各種の特徴を記述できる記述子(Descriptor)と記述書式(Description Scheme)等も詳細に定義されている。例えば、色やテクスチャー、輪郭形状などの特徴を表すために以下のような記述子が用意されているので、これに準じて記述してもよい。
Color space(色空間を指定する記述子)、
Color quantization(色空間の量子化方法を指定する記述子)、
Dominant color(任意形状領域における代表色を表す記述子)、
Scaiable color(色特徴をHSV色空間におけるカラーヒストグラムで表 す記述子)、
Color layout(色の分布をDCT係数で表す記述子)、
Color structure(色の分布における偏りの程度を表す記述子)など、
Homegeneous texture(テクスチャーの特徴を、画像強度と周波数空 間上のエネルギー分布により表す記述子)、
Texture browsing(テクスチャーの特徴を、均一性、粒度、方向性の3 要素で表す)、
Edge histogram(エッジ特徴の分布をヒストグラムにより表す記述子)、
Region shape(領域の形状特徴を表す記述子)、
Contour shape(領域の閉輪郭線の形状特徴を表す記述子)、
図10は、前記図4に示したフロー中の、特徴量を抽出する処理(ステップS108、ステップS127)の処理手順を示すサブルーチンであり、対象となる画像データを読み込んだ後、設定されている抽出すべき特徴量または特徴抽出方法などの設定データを読み込み、それに応じて、設定されている特徴データを抽出して特徴データ記述ファイル出力すものである。
すなわち、対象画像データファイルを読み込み(ステップS301)、特徴抽出処理の設定データを読み込む(ステップS302)。次に、抽出する特徴はオートに設定されているか否かを判断し(ステップS303)、オートに設定されていない場合には、設定データに基づいて、特徴抽出する特徴の種類を設定する(ステップS304)。また、オードに設定されている場合には、当該画像の撮影情報を読み込み(ステップS305)、撮影モードまたは撮影条件に基づいて、抽出する特徴の種類を選択する(ステップS306)。
そして、このステップS306または前記ステップS304に続き、抽出する特徴の種別に応じて、前処理、および、特徴抽出手段を選択した後(ステップS307)、前処理1(ステップS308)および前処理2(ステップS309)を実行する。前処理1においては、画像強調、または、鮮鋭化などを行い、前処理2においては、2値化、または、正規化、回転、座標変換、細線化、膨脹収縮処理、などを行う。
しかる後に、特徴抽出処理(色領域の抽出)(ステップS310)、特徴抽出処理(輪郭形状の特徴抽出)(ステップS312)、特徴抽出処理(テクスチャーの特徴抽出)(ステップS314)、特徴抽出処理(位置・配置の特徴抽出)(ステップS316)、・・・特徴抽出処理(動きの抽出)(ステップS318)等を実行する。そして、特徴抽出処理(色領域の抽出)(ステップS310)を実行した場合には、代表色、色分布、RGBヒストグラム、DCT係数などの特徴記述データを作成する(ステップS311)。特徴抽出処理(輪郭形状の特徴抽出)(ステップS312)を実行した場合には、代形状評価値、フーリエ記述子、パワースペクトルなどの特徴記述データを作成する(ステップS313)。特徴抽出処理(テクスチャーの特徴抽出)(ステップS314)を実行した場合には、輝度ヒストグラム、フーリエスペクトル、共起行列、自己関数などの特徴記述データを作成する(ステップS315)。特徴抽出処理(位置・配置の特徴抽出)(ステップS316)を実行した場合には、位置座標、DCT係数など特徴記述データを作成する(ステップS317)。特徴抽出処理(動きの抽出)(ステップS318)を実行した場合には、動きスペクトル、強度分布などの特徴記述データを作成する(ステップS319)。
前記色の特徴抽出では、当該他像の色データに基づいて、RGBやHSV値などの色差ヒストグラムや色分布、あるいは、色差成分のDCT変換後のDCT係数などを求め、特徴量とする。輪郭形状の特徴抽出では、輪郭図形の外周輪郭線に沿って偏角関数や位置座標の列を一次元データに変換した後、P型フーリエ記述子(後述)等のフーリエ記述子や、各種の形状評価値などを求め、形状の特徴量とする。テクスチャーの特徴抽出では、当該画像データの輝度ヒストグラム分布やフーリエ変換スペクトルなどを求めたり、あるいは、後述するように輝度の共起行列や複数のマスクを用いる高次局所自己相関関数による相関行列等を求め、テクスチャーの特徴量とする。同様に、主要被写体の配置や配色などの特徴抽出には、輝度情報や色差情報の位置座標やDCT変換により周波数空間に変換した場合のDCT係数などを求め、配置や配色の特徴量とする。動きの特徴抽出では、動きベクトルやフーリエ変換、DCT変換による強度分布などを特徴量とすることができる。その他、抽出する特徴量に応じて、所定の輝度や色相等の領域の抽出処理、所定のフィルタ処理などを行ってもよい。
次に、認識処理をするか否かを判断し(ステップS320)、認識処理をする場合には、認識対象のテンプレートデータ(図12参照)を読み込む(ステップS321)。次の認識処理により、前記読み込んだテンプレートデータとのテンプレートマッチング、または、相関度、類似度、類似距離、差分我の算出などを行い(ステップS322)。つまり、被写体の識別や類似度の判定、人間顔領域の識別などを必要とする場合には、識別したいテンプレートとなる参照画像データやその特徴データを読み込み、対象画像と参照画像とのテンプレートマッチング、または、各々の特徴データを比較して、相関度、類似度、類似距離などを算出する。そして、前記ステップS310〜S319の処理により、抽出されたデータ、または、前記ステップS322の処理による認識結果を出力する(ステップS323)。
次に、上記において用いる特徴抽出方法の具体例について、その概要を説明する。
(先鋭化、輪郭抽出)
特徴抽出処理の例として、1次微分フィルタまたは2次微分フィルタ処理による画像の先鋭化処理、エッジ(輪郭)抽出処理を行うことができる。また、このようなフィルタ処理を、前述の前処理における画像の先鋭化処理や、特徴抽出処理における輪郭抽出やエッジ抽出などに利用できる。被写体像の輪郭形状や外形パターン、面積などを特徴データに利用するには、特徴抽出したい画像データの輝度置等を、画素毎に輪郭強調やエッジ検出用のフィルタ演算等を行って、輪郭強調や外形抽出した画像に変換してから、特徴データ等を抽出する。
一般に、階調が変化する部分のエッジがボケた画像f(i,j)を、
Δx=f(i+j,j)−j(i−1,j)、
Δy=f(i+j,j)−j(i−1,j)、
g(i,j)=√{(Δx+(Δyf)}、
または、g(i,j)=|Δxf|+|Δyf|、
等の演算により、1次部分や勾配(Gradient)を求めると、階調が変化する勾配部分や輪郭を抽出できる。
あるいは、
f(i,j)=∂f/∂x+∂f/∂y、または、
f(i,j)=f(i+1,j)+f(i−1,j)+f(i,j−1)+f(i,j −1)−4f(i,j)
等の演算により、さらに微分する2次微分(Laplacian)処理を施し、この結果を原画像データから差し引くと、エッジ部分の高周波成分を強調した画像を合成でき、ボケたエッジや輪郭を強調することができる。エッジや輪郭の強調処理をソフトウエア処理で御構内には、「Prewittフィルタ」「Sobeiフィルタ」や「Kirschフィルタ」「Robertsフィルタ」等の1次微分の空間フィルタ演算子(オペレータ)、または、「Laplaciantフィルタ」等の2次微分の空間フィルタ演算子等を用いることができる。
(2値化、平均化、輝度変換)
また、輝度ヒストグラムの変換処理などにより、中間階調など画像強調を行う例、2値化処理や所定の輝度領域の抽出などができる。被写体像の画像データ(輝度値や色差値)の分布パターンなどを特徴データとして利用する場合に、画像データの輝度分布(ヒストグラム)を求め、輝度変換処理を行うことにより中間階調などの強調や圧縮ができる。また、所定の閾値との大小で2値化したり、所定の輝度の領域だけを抽出することができる。あるいは、画素数毎に輝度値や色差値を平均化して、パターン単純化や情報量の圧縮ができる。
(膨脹、収縮、細線化、線図形化)
また、輪郭形状などから被写体の形状や特徴を判別するには、先ず、形状を単純化して情報量を圧縮や線図形化してから判別することが好ましい。例えば、2値化された画像の輪郭や、1−画素と0−画素の境界領域で、1−画素を(8近傍の画素の)一層分だけ外側に太くする、所謂「膨脹」(Expansion)処理を行うと、輪郭などの境界部分の小さな孔や溝が取り除かれ、また、同図(b)のように、逆に、一層分だけ細くする「収縮」(Contraction)処理により境界部分の突起や孤立点などが取り除かれるので、膨脹処理と収縮処理を組み合わせることで、図(c)、(d)のように、凹部や凸部の除去や形状の単純化ができる。
また、2値化された画像から、線幅が1の中心を抽出する、所謂「細線化」(Thinning)処理により、骨状(スケルトン)の概略形状を求めることができる。また、2値化された輪郭パターンの周囲を外側と内側とから境界に沿ってたどり、境界部画素を1とし、残りの画素を0とする「境界線追跡」処理により、輪郭の境界線のみの画像に変換できる。あるいは、輪郭形状の数画素毎に選択した画素のみを折れ線で連結する「折れ線近似」処理などを用いてもよい。
(輪郭形状の特徴)
形状の識別は、2値化や線図形化したテンプレート画像やその特徴量を記憶しておき、それらと入力画像の2値化や線図形化した画像や特徴データとの相関度や類似度などを計算して、形状の識別や類似度の判別ができる。あるいは、領域内の画像からテンプレート画像と類似する画像の位置を順次検索するテンプレートマッチング等の手法により、類似する画像や図形の検索ができる。また、簡略には、被写体像の2値化画像や輪郭図形、境界線図形等の縦横の大きさ、半径、周囲長、画素数、面積、幾何学的な寸法の比などから、簡易に類似度判断や被写体の識別を行ってもよい。
例えば、円では周囲長L=2πr、面積S=πrなので、(周囲長L)/(面積A)=4πとなることから、図形の輪郭線の円らしさを、
円らしさ=(周囲長L)/(面積S)、または、
円形度e=4π(円らしさ)=4πS/Lとして計算して、
円らしさが4π(=12.57)に近い値かどうか、または、円形度が1.0に近いかどうかで、丸い形状の被写体か、凹凸が多い尖った被写体か等を計算し、形状の識別に利用できる。同様に、輪郭の縦横比=長さh/幅wなどから、形状の「細長さ」等の評価値を求めてもよい。
(輪郭形状の偏角関数、位置座標関数)
また、図形の輪郭線に沿って、始点から順次、偏角θ(s)を求めて、1次元関数(偏角関数)に変換して、輪郭形状の特徴量として利用できる。あるいは、同様に、輪郭線に沿って順次、位置座標x(s)、y(s)、または、z(s)=x(s)+j・y(s)を求めて、1次元の位置座標関数に変換して、輪郭形状の特徴量として利用できる。
(輪郭形状のフーリエ記述子)
(Z形記述子)
例えば、前述の偏角関数θ(s)を正規化して、正規化偏角関数:θ(s)=θ(s)−θ(0)−2πs/L、
を求め、これの(i=0,1,2・・・,N−1)の離散化データφ[i]をフーリエ変換して、次のようなZ(Zahn)形フーリエ記述子を求め、輪郭形状の識別に利用できる。
θ(s)の離散化データ:φ[i]=θ[i]−θ[0]−2πi/N
(i=0,1,2・・・,N-1)
θ(s)の離散フーリエ変換(=Z形記述子):Cz[k]=(1/N)Σφ[i]EXP(−j2πki/N)。
(G形記述子)
同様に、前述の位置座標の複素平面座標z(s)を離散フーリエ変換して、G(Grundlund)形フーリエ記述子を求め、輪郭形状の識別に利用してもよい。
位置座標の複素平面座標z(s)=x(s)+j・y[s]、
z(s)の離散化データz(i)=x[i]+j・y[0] (i=0,1,2・・・,N-1)、
z(s)の離散フーリエ変換(=G記述子):Cg[k]=(1/N)Σz[i]EXP(−j2πki/N)。
(P形記述子)
また、折れ線近似した偏角θ[i]の指数関数w[i]を求め、w[i]をフーリエ変換した、P(Phase)形記述子を求め、輪郭形状の識別に利用してもよい。
w[i]=exp(jθ[i])=cosθ[i]+sinθ[i]
=(z[i+1]−z[i])/δ、
ただし、線分δ=|z[i+1]−z[i]|
w[i]の離散フーリエ変換(=p形記述子):Cp[k]=(1/N)Σw[i]exp(−j2πki/N)。
(輪郭の抽出と形状の識別)
図11は、輪郭形状の抽出と被写体の形状識別処理の処理手順を示すフローチャートである。先ず、被写体の画像を取り込み(ステップS401)、この処理により画像240を取り込む。次に、輝度階調値または色差信号に基づいて複数領域に分割し(ステップS402)、この処理により魚部分241を含む領域が分割される。さらに、被写体の領域を選択し(ステップS403)、この処理により魚部分241が選択される。引き続き、領域の画像を2値化し(ステップS404)、この処理により魚部分の2値化画像242が生成される。また、エッジを検出し(ステップS405)、この処理により魚形状のエッジ243が検出される。次に、検出したエッジをN辺の等辺多角形で近似し(ステップS406)、この処理により近似形状の輪郭線244が得られる。
さらに、得られた輪郭線のP形記述子などフーリエ記述子を求めて(ステップS407)、パワースペクトルを求め(ステップS408)、この処理によりパワースペクトル245が求められる。引き続き、低周波成分からn個の成分を取り出し、データ圧縮して、輪郭線データとし(ステップS409)、求めた特徴量をメモリー−(特徴抽出/認識用データメモリー56)に記憶する(ステップS410)。そして、このメモリーに記憶した特徴量と記憶済のテンプレートデータ246(図12参照)とを順次比較し、類似度を求める(ステップS411)。さらに、当該被写体を最も類似するテンプレートデータに対応する種類と判定して、当該種類の特徴データを記述し(ステップS412)、この特徴データの記述データを出力する(ステップS413)。
ここで、前記テンプレートデータ246は、図12に示すように、魚における「科」「魚名」等の種類246a、特徴データ124b、輪郭図形246c、色・柄・テクスチャー246dとが対応して記憶されている。したがって、本例の場合、例えば前記ステップS409で得られた輪郭線特徴データとテンプレートデータ246における輪郭図形とを、ステップS411で比較して類似度を求めることにより、ステップS412で「チョウチョウウオ科」であると判定することができる。よって、この「チョウチョウウオ科」の特徴データ246bの記述データがステップS413で出力されることとなる。
(代表色、色分布の抽出)
図13は、選択された領域画像のRGBヒストグラムから代表色やその分布の分散度合いを特徴抽出する処理手順例を示すフローチャートである。被写体の画像を取り込み(ステップS501)、輝度階調値または色差信号に基づいて複数の輪郭領域に分割する(ステップS502)。次に、面積の大きい領域、または中央のフォーカス枠に近い領域から順に1〜n個の被写体領域を選択し(ステップS503)、各分割領域毎にRGB別ヒストグラム分布Pr(i)、Pg(i)、Pb(i)を求める(ステップS504)引き続き、このPr(i)、Pg(i)、Pb(i)をそれぞれ全体が1.0となるように正規化する(ステップS505)。
そして、下記のようにRGBヒストグラムPr(i)、Pg(i)、Pb(i)の最頻値を求める(ステップS506)。
μ=Max{P(i)},
μ=Max{P(i)},
μ=Max{P(i)},
また、下記のようにRGBヒストグラムPr(i)、Pg(i)、Pb(i)の平均μを求める(ステップS507)。
μ=Σi・P(i),
μ=Σi・P(i),
μ=Σi・P(i),
また、下記のようにRGBヒストグラムPr(i)、Pg(i)、Pb(i)の分散σを求める(ステップS508)。
σ =Σ(i−μ・P(i),
σ =Σ(i−μ・P(i),
σ =Σ(i−μ・P(i),
次に、各領域のRGBヒストグラムの最頻値または平均値を代表色とし、代表色とRGBの分散値を色の特徴データとして記述して出力する(ステップS509)。
図14は、領域画像を複数ブロックに分割して、ブロック毎の平均色を求め、そのDCT変換したDCT係数の分布データなど、色分布や配色パターンの特徴を抽出する処理手順例を示すフローチャートである。撮影画像、または、領域画像を取り込み(ステップS601)、領域を縦m×横nの複数ブロック領域に分割する(ステップS602)。次に、各分割ブロック領域の平均色を算出し(ステップS203)、各分割ブロック領域の平均色をRGBまたはYCbCr空間でDFT変換またはDCT変換で周波数に変換し、各係数を求める(ステップS604)。そして、DFTまたはDCTの低周波成分の係数をジグザグスキャンなどで走査して1次元化し(ステップS605)、この1次元化した各係数を量子化(デジタル符号化)し(ステップS606)、このデジタル符号化したDFTまたはDCT係数列を、色分布の特徴データとし記述し出力する(ステップS607)
(画像データの変換)
画像データのRGB信号や輝度信号Y、色差信号Cb,Cr、あるいは、色相/彩度/明度を表すHSV(またはHSB)データ等は、以下の変換式で相互に容易に変換できる。
例えば、RGBデータをYCbCrデータに変換するには、
Y=0.299*R+0.587*G+0.114*B、
Cb=0.172*R−0.339*G+0.511*B+CENTER、
Cr=0.511*R−0.428*G−0.083*B+CENTER、
YCbCrデータをRGBデータに変換するには、
R=Y+0.000*(Cb−CENTER)+1.371*(Cr−CENTER)、
G=Y−0.336*(Cb−CENTER)−0.698*(Cr−CENTER)、
B=Y+1.732*(Cb−CENTER)+0.000*(Cr−CENTER)、
RGBデータ(各0〜1)をHSV(またはHSB)データに変換するには、
cmax=maximum(R,G.B)、cmin=minimum(R,G.B)とすると、
明度V=cmax、彩度S=(cmax−cmin)/cmax(ただし、cmax=0のときは、S=0)、
R=cmaxのときは、色相H=60°*{(G−B)/(cmax−cmin)}、
G=cmaxのときは、色相H=60°*{2+(B−R)/(cmax−cmin)}、
B=cmaxのときは、色相H=60°*{4+(R−G)/(cmax−cmin)}、
なお、H<0のときはHに360°を加える。また、S=0のときはH=0とする。
(色相の抽出、肌色の抽出)
また、所定の色の領域を抽出する例として、人間の肌色領域の抽出に関して、人間の肌の分光反射率特性、または、撮影画像サンプル中の肌色領域のRGB値、もしくはHSV値(色相:Hue、彩度:Saturation、明度:Value of Brightness)などを元に、肌色の領域や人間の肌や顔の領域を抽出できる。例えば、肌色の色相(Hue)と彩度(Saturation)の分布データをとると、肌色の画像データの多くは、彩度は広い範囲で分布するが、色相(Hue)環では、約6°〜38°の範囲に多く分布することが知られている。これらを利用すれば、HSV値から、色相(Hue)が約6°〜38°の範囲の人間の顔の肌色とするなど、特定の色の被写体の領域を適宜抽出することができる。
(顔の認識処理)
前記の特徴抽出において、特定の被写体やシーン別撮影モードなどで注目する被写体別に専用の識別データや認識処理を必要とする場合がある。例えば、顔の眼の領域を抽出するためには瞳領域のマスクパターンを作成し、これを参照パターンとして、テンプレートマッチング等を用いて検索して、入力画像から眼や顔のある画像領域を検索できる。また、眼を認識するための条件データとしては、例えば、
眼の細長さ=b/aとして、α≦b/a≦αの条件に合致する、または、
(眼の面積)S≒π×a×b、(黒眼(瞳)の面積)S=π×r、黒眼(瞳)の比率S/S=r/abとして、β≦r/ab≦βなどの条件に合致する被写体画像の領域を「眼の領域」と識別することができる。また、人間の顔と認識するための条件データの設定で、例えば、(眉下〜鼻下までの長さ)h1≒(鼻下〜あごまでの長さ)h2、または、(右眼の幅)W≒(両眼の間)W≒(左眼の幅)W、などの条件を満たす被写体画像の領域を「顔の領域」であると識別できる。
(動きの特徴抽出)
図15は、時間的に連続する複数画像をそれぞれ複数ブロックに分割し、その輝度値または色差値を前画像とテンプレートマッチングして、移動方向と移動量を抽出して、動きベクトルなど動きの特徴を抽出する処理手順を示すフローチャートである。すなわち、時間的に連続する複数枚の画像を取り込み(ステップS701)、各画像をm×nの複数ブロック領域に分割する(ステップS702)。各画像の各ブロックの輝度値または色差値を前画像とテンプレートマッチングし、移動方法と移動量を抽出する(ステップS703)。分割ブロック毎に移動方向と移動量を量子化して、各ブロックの動きベクトルを求め(ステップS704)、画像、ブロック毎の動きベクトル(移動方向と移動量)を、動きの特徴データとして記述して出力する(ステップS705)。
(特徴量の比較、類似図形の検索)
また、記憶されたテンプレート画像と被写体画像の類似度の判別や検索には、テンプレートマッチングなどのパターンマッチング法や、動きベクトル検出におけるブロックマッチング法などが利用できる。テンプレートマッチングにより、特徴抽出領域の入力画像f[i,j]の特徴データの中から、例えば、(m×n)の記録された参照画像(または特徴データ)t[k,l]に一致する画像の位置を検出する。参照画像の中心(または端点)が入力画像のある点(i,j)に重なるように置いて、点(i,j)を順に縦横にラスター走査しながら、重なる部分の画像データの類似度を順次計算して、類似度が最も高い位置点(i,j)を、類似する被写体がある位置として求めることができる。
このテンプレートマッチングは、選択した被写体像を記憶して、被写体を追尾して合焦する追尾式AF処理などにも利用でき、また、前回の被写体の位置から今回の被写体の位置へのベクトルは、当該被写体の動きベクトルとして動きの特徴データとすることもできる。
(相関度(相関係数))
入力画像f[k,l]とテンプレート画像(参照画像)t[k,l]との相関度は、次式のピアソンの相関係数(積率相関係数)Rなどで算出でき、最も相関係数Rが大きくなる位置が、検索する類似被写体がある位置として求められる。
R=(画像fと画像tの共分散)/f(画像fの標準偏差)・(画像tの標準偏差)
=[ΣL=0 n−1ΣK=0 m−1{f[k,l]−fAV}{t[k,l]−tAV}]
/√[ΣL=0 n−1ΣK=0 m−1{f[k,l]−fAV]・√[ΣL=0 n−1ΣK=0 m−1{t[k,l]−tAV
ただし、fAV:参照画像f[k,l]の画像データ(輝度値、色差値、特徴量など)の平均値、
AV:参照画像t[k,l]の画像データ(輝度値、色差値、特徴量など)の平均値、
(テンプレートマッチングの類似度)
テンプレートマッチングなど、画像f[i,j]の中から、画像サイズ(m×n)の画像t[k,l]を走査して検索する場合、類似度は、次式で計算でき、類似度r(i,j)が最も大きくなる走査位置の点(i,j)が類似する被写体の位置として求まる。
R(i,j)=ΣL=0 n−1ΣK=0 m−1f[i−(m/2)+k,j−(n/2)+1]・t[k,l]
ただし、(i,j):点の位置座標、f[i,j]:入力画像データ、t[k,l]:テンプレート画像のデータ、(m×n):テンプレート画像のサイズ。
これを、前述の相関係数Rと同様に、平均値を差し引くなど正規化してもちいてもよい。
(絶対値差分和、距離)
前記の類似度、R(i,j)では乗算のための計算が増えるため、2値化画像など、平均値を差し引いたり、正規化を省略したりできる場合には、類似度の代わりに、次式のような画像間の差分和により、相違の程度(「距離」)を表すD(i,j)を求め、これを評価関数として利用できる。この場合には、加減算だけで計算できるので演算を高速化できる。この場合は、距離D(i,j)が最も小さい点(i,j)がマッチング位置を表す。
D(i,j)=ΣL=0 n−1ΣK=0 m−1|f[i−(m/2)+k,j−(n/2)+1]−t[k,l]|
ただし、(i,j):点の位置座標、f[i,j]:入力画像データ、t[k,l]:テンプレート画像のデータ、(m×n):テンプレート画像のサイズ。
(テクスチャーの特徴抽出)
図16は、輝度ヒストグラム分布によりテクスチャーを解析する例であり、先ず撮影画像を取り込む(ステップS801)。次に、この取り込んだ取得画像の輝度ヒストグラム分布P′(i) (i=0,1・・・,n−1)を求め(ステップS802)、全体が1.0となるように正規化した輝度ヒストグラムP(i)に変換する(ステップS803)。引き続き、μ=Σi/P(i)により、輝度ヒストグラムP(i)の平均μを求め(ステップS804)、σ=Σ(i−μ)・P(i)により、輝度ヒストグラムP(i)の分散σを求める(ステップS805)。また、f1=S=[Σ(1−μ)・P(i)]/σにより、f1=S(Skewnss、歪み度)を求め(ステップS806)、f2=K=[Σ(1−μ)・P(i)]/σにより、f2=K(Kurtosis、尖り度)を求める(ステップS807)。そして、輝度ヒストグラムのf1(Skewness)、f2(Kurtosis)をテクスチャーの特徴データとて記述し出力する(ステップS808)。
また、他の方法により、テクスチャーの特徴量を抽出するようにしてもよい。例えば、フーリエスペクトルからテクスチャー解析する例においては、離散2次元フーリエ変換したフーリエスペクトル
F(u,v)=ΣΣf(x,y)W1xuW2yu(ただし、W1=exp(−j2π/M)を求め、
F(u,v)のパワースペクトルP(u,v)=|F(u,v)|を算出し、
これを極座標形式のP(r,θ)に変換して、原点を中心としたドーナツ形領域のエネルギーの和p(r)、および、角度θの扇形領域内のエネルギーの和q(r)を求め、
p(r)=2Σθ=0 πP(r,θ)、
q(r)=2Σf=0 W/2P(r,θ)。
そのヒストグラム分布のピーク、平均、分散など統計量から、例えばP(r)のピークよりテクスチャーのきめの大きさ、q(θ)のピークよりテクスチャー画素の方向性など、テクスチャーの特徴量を抽出して、特徴データを記述して、出力するようにしてもよい。
また、輝度の共起行列を用いてテクスチャーの特徴を抽出してもよい。画像(x,y)において、画素f(x1、y1)から距離d、角度θの位置関係(d,θ)にある画素f(x2,y2)の輝度をd(1,2,・・・)、θ(0度、45度、90度、135度など)を変えて順次求め(ただし、距離d=max(|x1−x2|,|y1−y2|)
、位置関係(d,θ)にある2点の輝度がそれぞれ、f(x1,y1)=i,f(x2,y2)=jの対となる頻度(ヒストグラム)を集計して、輝度共起行列P(i,j;d,θ)を求め、正規化した共起行列p(i,j)=P(i,j)/ΣΣ(i,j)から、・角2次モーメント(Angular second moment,全体の均一性を表す)f1=ΣΣ{p(i,j)}
・コントラスト(Contrast,局所変化を表す)f2=Σ{np(i,j)}、
・方向に関する相関(Correlation)f3=ΣΣ{(i,j)p(i,j−μ)}/σ、 ただし、μ=Σp(i)=1/g、(g;階調数)
σ=√{Σ{p(i)−μ}/(g−1)}
・平方和(Sum of Squares,局所同調性を表すf4=ΣΣ{(i−μ)p(i,j)}、
・逆差分モーメント(Inverse difference Moment,複雑さの測度を表す)f5=ΣΣ[p(i,j)/{1+(1−j))}]、
などを求めて、テクスチャーの特徴データとすることができる。
また、高次局所自己相関関数によりテクスチャー特徴量を抽出してもよい。具体的には、各画像のRGB成分をYIQ成分に変換し、Y画像、I画像、Q画像を得て、設定された特徴に応じて、(n×n)画素のマスクパターン1〜25の参照点を重ね合わせ、各画素の輝度値f(i,j)tと掛け合わせ(論理積)、特徴ベクトルC1〜25を求める。
C1=ΣΣ{f(i,j)}、
C2=ΣΣ{f(i,j)f(i+1,j)}、
・・・
C5=ΣΣ{f(i,j)f(i−1,j+1)}、
C6=ΣΣ{f(i,j)f(i−1,j)f(i+1,j)}、
・・・
C25=ΣΣ{f(i,j)f(i−1,j+1)f(i+1,j+1)}。
また、前記C1〜C25を加算(積和)して、
C(a1,・・・,aN)=Σ√{f(r)f(r+a1)・・・f(r+aN)}]、
各特徴量を特徴ベクトル全体の和Σ{Cj}で除算して、特徴ベクトルの絶対値が1となるように正規化して、
Ci=Ci/Σ{Cj} (i,j=1〜25)とし、
各YIQ画像毎に求めた局所自己相関による特徴ベクトルC1〜C25、またはその統計量を、テクスチャーの特徴データとして出力するようにしてもよい。
なお、以上のように本実施の形態においては、特徴抽出手段をソフトウェアで構成するようにしたが、ハードウェアで構成するようにしてもよい。
図17は、本実施の形態の再生時おける処理手順を示すフローチャートである。先ず、ユーザーによる操作入力部35での操作により、再生モードが設定されているか否かを判断し(ステップS901)、再生モードが設定されない場合には、その他のモード処理へ移行する(ステップS902)。再生モードが設定された場合には、初期画面(図18(a)参照)を表示して、ユーザーによる操作入力部35での操作により、インデックス表示が選択されたか否かを判断する(ステップS903)。インデックス表示が選択された場合には、インデックス画像(図18(b))を一覧表示する(ステップS904)。
また、インデックス表示が選択されない場合には、一覧リスト表示が選択されたか否かを判断する(ステップS905)。一覧リスト表示が選択された場合には、画像&音声メモリー媒体31に記憶されている画像データをファイル名順、撮影日時順などの一覧リストで表示する(ステップS906)。一覧リスト表示が選択されない場合には、認識結果の一覧表示が選択されたか否かを判断する(ステップS907)。認識結果の一覧表示が選択された場合には、検索された画像データを一覧表示またはリスト表示する(ステップS908)。認識結果の一覧表示が選択されない場合には、画像の再生表示が選択されたか否かを判断し(ステップS909)、画像の再生表示が選択されない場合には、後述するステップS913に進む。画像の再生表示が選択された場合には、選択された画像データの復号/再生処理を実行する(ステップS910)。次に、この再生が動画の再生であるか否かを判断し(ステップS911)、動画の再生である場合には再生が終了した時点(ステップS912:YES)でステップS913に進む。
そして、以上の処理に続くステップS913においては、キー入力があった否かを判断する(ステップS913)。キー入力があった場合には、それが検索項目、ワードの入力であるか否かを判断し(ステップS914)、検索項目、ワードの入力であった場合には、キー操作に従い、検索項目、検索ワード(キーワード)を選択または入力させ(ステップS915)、表示処理によりこれら選択または入力させた検索項目、検索ワードを表示させて(ステップS916)、リターンする。
また、前記ステップS914での判断の結果、キー入力が検索項目、ワードの入力でなかった場合には、ユーザーによる操作入力部35での操作により、キーワード検索の実行が指示されたか否かを判断する(ステップS917)。キーワード検索の実行が指示された場合には、画像&音声メモリー媒体31にキーワードに対応する特徴量があるか否か(記憶されているか否か)を判断し(ステップS918)、キーワードに対応する特徴量がない場合(記憶されていない場合)には、該当データが見つからない旨の表示、またはエラー処理を行って(ステップS919)、リターンする。
また、キーワードに対応する特徴量がある場合には、ユーザーにより特徴データまたは撮影情報を使用することが選択されたか否かを判断する(ステップS920)。特徴データまたは撮影情報を使用することが選択されなかった場合には、特徴データおよび撮影情報を用いることなく、画像&音声メモリー媒体31に記録されている画像データからキーワードに対応する特徴量を抽出する(ステップS921)。そして、この画像データから抽出した抽出特徴量とキーワードに該当する特徴量とを比較し、類似度を算出する(ステップS922)。しかし、特徴データまたは撮影情報を使用することが選択された場合には、画像&音声メモリー媒体31に格納されている画像ファイルに記録された特徴データまたは撮影情報と前記キーワードに該当する特徴量とを比較し、類似度を算出する(ステップS923)。
そして、このステップS923または前記ステップS922で算出した類似度が所定以上であるか否かを判断し(ステップS924)、所定以上である場合には、類似する画像データファイルのファイル名をデータメモリー24に順次記憶する(ステップS925)。また、画像&音声メモリー媒体31内において検索を終了したか否かを判断し(ステップS926)、検索が終了するまで、画像&音声メモリー媒体31内において次のファイルを読み出して(ステップS927)、ステップS920からの処理を繰り返す。これにより、画像&音声メモリー媒体31内において検索が終了したならば(ステップS926;YES)、該当データ検索に成功したか否か、つまり、ステップS925の処理が1度でも行われて、類似度が所定以上である画像データファイル名のファイル名がデータメモリー24に記憶されたか否かを判断する(ステップS958)。該当データの検索に成功した場合には、検索結果の該当データを表示部14(画像モニター32)に一覧表示する(ステップS929)。
したがって、このステップS929での処理により、画像&音声メモリー媒体31に記憶されている、類似度が所定以上である画像ファイルのファイル名が一覧表示されることととなる。よって、表示されている何れかの画像ファイル名を選択して再生表示指示を行うことにより、前述したステップS910での処理により、画像モニター32に選択された画像ファイルの画像が表示されることとなる。
他方、ステップS917での判断の結果、キーワード検索の実行でなかった場合には、特徴データの再抽出・再記録が指示されたか否かを判断し(ステップS930)、特徴データの再抽出・再記録も指示されなかった場合には、その他のキー処理を実行する(ステップS931)。また、特徴データの再抽出・再記録が指示された場合には、画像&音声メモリー媒体31に記憶されている画像データのうち、このとき選択されている画像データから、このとき選択されている特徴データを抽出する(ステップS932)。そして、この抽出した特徴データを、このとき選択されている記述様式で符号化して(ステップS933)、当該画像データおよび撮影情報とともにこの特徴データを付加して、画像&音声メモリー媒体31に記録し(ステップS934)、その他の表示処理実行して(ステップS935)、リターンする。
図18は、前記図17のフローチャートにより実行される再生時の特徴抽出、特徴データの再記録の設定メニュー表示画面例を示す図である。図において、(a)は、再生モードにおける処理画面あるいは再生時の画面例であり、(b)はインデックス表示画面例である。また、(c)は再設定メニュー(1)、(d)は再設定メニュー(2)の画面例である。(c)の再設定メニュー(1)においては、「スライドショー」「ダイジェスト再生」「画像検索」・・・等の選択肢を表示し、(d)の再設定メニュー(2)においては、「タイトル作成」「動画編集」「特徴の抽出・変更」・・・等の選択肢を表示する。また、(e)は特徴抽出方法の詳細設定画面例であり、「色の抽出」「輪郭の抽出」「テクスチャー抽出」・・・等の選択肢を表示する。(f)は特徴データの記録方法の詳細設定画面例であり、「識別名称」「類似率」「配色分布」・・・等の選択肢を表示する。
(第2の実施の形態)
図19〜図22は、本発明の第2の実施の形態を示すものであり、撮影シーンに応じて、特徴量データを自動的に選択して抽出して、画像データの付加情報として記録するようにしたものである。
すなわち、この実施の形態において前記プログラムメモリー23には、図19に示すように、人物を写す場合(BS1)、風景を移す場合(BS2)・・・等の撮影シーン別に、当該シーンを撮影する場合に好適なシーン別撮影制御プログラムが記憶されているとともに、そのサンプル画像300と、「色強調が肌色に設定されます。」等の当該シーン別撮影制御プログラムに関する説明文301等が記憶されている。
図20および図21は、本実施の形態の処理手順を示す一連のフローチャートであり、制御回路22はプログラムメモリー23に格納されているプログラムに基づき、同図に示すフローチャートに従って処理を実行する。先ず、ユーザーによる操作入力部35での操作に応じて、前記撮影シーンBS1〜BS18のいずれか選択するとともに、この選択した撮影シーンBS1〜BS18に対応するシーン別撮影制御プログラムに従って撮影条件などを設定し、あるいは入力された撮影条件を設定する(図20ステップS1001)。そして、レリーズ釦3が押し操作されて撮影指示がなされた時点で撮影処理を実行し(ステップS1002)、電子撮像センサ20から画像データを取り込み圧縮符号化する(ステップS1003)。
次に、特徴データ付加記録がONに設定されているか否かを判断し(ステップS1004)、ONに設定されていない場合には、撮影画像データとともに、撮影情報を画像&音声メモリー媒体31(または磁気ディスク48)に記録する(ステップS1022)。また、ONに設定されている場合には、オート(前記シーン別撮影制御プログラムを用いるモード)が設定されているか否かを判断し(ステップS1005)、オートに設定されていない場合には、その他の特徴抽出処理を実行する(ステップS1006)。
そして、オートに設定されちる場合には、フォーカス枠周辺の領域内の被写体像を輝度もしくは色差データに基づいて輪郭抽出し(ステップS1007)、この抽出した輪郭を境界とする領域に分類する(ステップS1008)。引き続き、今回の撮影で選択されたシーンが人物撮影シーン(図33のBS1参照)であるか否かを判断し(ステップS1009)、人物撮影シーンでない場合には、後述する図21のステップS1023に進む。人物撮影シーンである場合には、顔のテンプレートと各分割領域画像とを比較し、顔の領域を抽出する(ステップS1010)。また、この抽出した顔の領域の輝度、色差、HSBデータを平均化して、支配色を検出し(ステップS1011)、顔の輪郭形状をフーリエ記述子などのデジタルデータに変換する(ステップS1012)。
次に、顔の下の領域を選択して、上半身(衣服)領域を抽出する(ステップS1013)。この抽出した上半身(衣服)領域の輝度、色差、HSBデータを平均化し、支配色を検出し(ステップS1014)、上半身(衣服)領域の輪郭形状をフーリエ記述子などのデジタルデータに変換する(ステップS1015)。さらに、他に顔の領域がないか否かを判断し(ステップS1016)、ある場合にはステップS1010からの処理を繰り返す。
その結果、他に顔の領域がなくなった場合には、背景領域を検出し(ステップS1017)、背景の支配色を検出し(ステップS1018)、背景のテクスチャーを検出する(ステップS1019)。そして、撮影シーン名、および、各領域の支配色、輪郭形状、テクスチャーなどの特徴データを処理の記述様式で記述し(ステップS1020)、撮影画像データとともに、撮影情報、および、前記特徴データを画像&音声メモリー媒体31(または磁気ディスク48)に記録する(ステップS1021)。
一方、ステップS1009での判断の結果、人物撮影シーンでなかった場合には、風景+人物シーン(図33のBS3参照)であるか否かを判断する(図21ステップS1023)。風景+人物シーンである場合には、人物のテンプレートと各分割領域画像とを比較し、人物の領域、顔の領域を抽出する(ステップS1024)。また、この抽出した人物と顔の支配色を検出し(ステップS1025)、人物と顔の輪郭形状を同様にデジタルデータに変換する(ステップS1026)。
次に、人物以外の主な被写体領域を抽出して(ステップS1027)、この抽出した上半身(衣服)領域の輝度、色差、HSBデータを平均化し、支配色を検出し(ステップS1028)、人物以外の領域の輪郭形状をフーリエ記述子などのデジタルデータに変換する(ステップS1029)。さらに、他に人物、被写体の領域がないか否かを判断し(ステップS1030)、ある場合にはステップS1024からの処理を繰り返す。
その結果、他に人物、被写体の領域がなくなった場合には、背景領域を検出し(ステップS1031)、背景の支配色を検出し(ステップS1032)、背景のテクスチャーを検出する(ステップS1033)。そして、撮影シーン名、および、各領域の支配色、輪郭形状、テクスチャーなどの特徴データを処理の記述様式で記述し(ステップS1034)、撮影画像データとともに、撮影情報、および、前記特徴データを画像&音声メモリー媒体31(または磁気ディスク48)に記録する(図21ステップS1021)。
他方、ステップS1024での判断の結果、風景+人物シーンでなかった場合には、風景シーン(図33のBS2参照)であるか否かを判断し(ステップS1035)、風景シーンでもなかった場合には、その他のシーン処理に移行する(ステップS1036)。風景シーンである場合には、風景のテンプレートと各分割領域画像とを比較し、主な被写体領域を抽出し(ステップS1037)、この抽出した主な被写体の支配色を検出し(ステップS1038)、主な被写体の輪郭形状を同様にデジタルデータに変換する(ステップS1039)。
さらに、他に主な被写体の領域がないか否かを判断し(ステップS1040)、ある場合にはステップS1037からの処理を繰り返す。その結果、他に主な被写体の領域がなくなった場合には、背景領域を検出し(ステップS1041)、背景の支配色を検出し(ステップS1042)、背景のテクスチャーを検出する(ステップS1043)。そして、撮影シーン名、および、各領域の支配色、輪郭形状、テクスチャーなどの特徴データを処理の記述様式で記述し(ステップS1034)、撮影画像データとともに、撮影情報、および、前記特徴データを画像&音声メモリー媒体31(または磁気ディスク48)に記録する(図21ステップS1021)。
図22は、撮影シーン別の特徴量、テンプレート画像の設定例を示す図である。すなわち、前記プログラムメモリー23には、シーン別撮影モードとして、「人物」「子供、「風景」「風景と人物」等が記憶されているとすると、例えば「人物」の特徴として「一人」「複数」・・・等を設定することができ、さらに、「一人」に対応する特徴として「配色」「形状」「配置」等を設定することができ、これらをテンプレート画像と対応させることができる。
(第3の実施の形態)
図23は、本発明の第3の実施の形態における検索処理手順を示すフローチャートである。すなわち、ユーザーによる操作入力部35での操作により、キーワードによる画像検索が設定されたか否かを判断し(ステップS1101)、設定されない場合にはその他の検索処理を実行する(ステップS1102)。また、キーワードによる画像検索が設定されたならば、入力されたキーワードに対応する特徴量が画像&音声メモリー媒体31にあるか否か(記憶されているか否か)を判断する(ステップS1103)。キーワードに対応する特徴量がない場合(記憶されていない場合)には、ユーザーの選択操作により、後述する類似辞書または心理辞書を使用するが選択されたか否かを判断し(ステップS1104)、選択されなかった場合には、該当データが見つからない旨の表示、またはエラー処理を行って(ステップS1107)、リターンする。また、類似辞書または心理辞書を使用するが選択された場合には、類似辞書または心理辞書を用いて、入力されたキーワードの類語または対応語を検索し、それらをキーワードとする(ステップS1105)。そして、このキーワードに対応する特徴量が画像&音声メモリー媒体31にあるか否か(記憶されているか否か)を判断し(ステップS1106)、ない場合には前述と同様に、該当データが見つからない旨の表示、またはエラー処理を行って(ステップS1107)、リターンする。
前記ステップS1106とステップS1103で、キーワードに対応する特徴量があると判断された場合には、ユーザーにより、特徴データまたは撮影情報を使用することが選択されたか否かを判断する(ステップS1108)。特徴記述データまたは撮影情報を使用することが選択されなかった場合には、これら特徴記述データおよび撮影情報を使用することなく、画像&音声メモリー媒体31に記録されている画像データからキーワードに対応する特徴量を抽出する(ステップS1109)。そして、この画像データから抽出した抽出特徴量とキーワードに該当する特徴量とを純次比較する(ステップS1110)。また、特徴データまたは撮影情報を使用することが選択された場合には(ステップS1108;YES)、画像&音声メモリー媒体31に格納されている各画像ファイルに記録された特徴記述データまたは撮影情報と前記キーワードに該当する特徴量とを純次比較する(ステップS1111)。
そして、このステップS1111または前記ステップS1110での比較による類似度が所定以上であるか否かを判断し(ステップS1112)、所定以上である場合には、該当する画像データファイルのファイル名をデータメモリー24に順次記憶する(ステップS1113)。次に、画像&音声メモリー媒体31内において検索を終了したか否かを判断し(ステップS1114)、検索が終了するまで、画像&音声メモリー媒体31内において次のファイルを読み出して(ステップS1115)、ステップS1108からの処理を繰り返す。これにより、画像&音声メモリー媒体31内において検索が終了したならば(ステップS1114;YES)、該当データ検索に成功したか否か、つまり、ステップS1113の処理が1度でも行われて、該当する画像データが1つ以上あるか否かを判断する(ステップS1116)。該当データの検索に成功しなかった場合には、該当データが見つからない旨の表示、またはエラー処理を行い(ステップS1107)、成功した場合には、検索された該当データのサムネイルを一覧表示するか、または、リスト表示する(ステップS1117)。
したがって、このステップS1117での処理により、画像&音声メモリー媒体31に記憶されている、類似度が所定以上である画像ファイルの画像がサムネイル表示あるいはリスト表示され、表示されているサムネイル画像の何れか、または、リストのいずれかを再生表示指示を行うことにより、画像モニター32に選択された画像ファイルの画像が表示されることとなる。
図24は、前記図23のフローチャートにより実行される画像データの検索処理の操作との関係における表示例を示す図である。図において、(a)は、検索メニュー表示(1)の画面例であり、「ファイル名による検索」・・・「キーワードによる検索」等の検索方法に関する選択肢を表示する。この状態で、「キーワードによる検索」が選択されると、(c)のキーワードによる検索メニュー画面に遷移して、「キーワード選択:サッカー」「キーワード入力」・・・「類似辞書を使用」「心理辞書を使用」等の選択肢を表示表示させる。なお、この図(c)の例では、「サッカー」というキーワードを選択すると、「サッカー」に対応して予め設定された「代表色:緑」、「形状輪郭:ボール(球)」、「テクスチャー:芝」などの特徴量の組合せに基づいて、サッカーの画像と判断される画像を検索する場合を示す。そして、検索が実行されると検索結果として、(e−1)の検索結果の一覧リスト、または、(e−2)の検索結果のインデックス表示(サムネイル表示)を行う。この状態で一覧リストからいずれかのファイル名が選択され、またはインデックス表示からいずれかの画像が選択されると、(f−1)の当該画像の再生表示(静止画)、または、(f−2)の再生表示(像画像)を行う。
また、(b)は検索メニュー表示(2)の画面例であり、「画像、シーンによる検索」「音声による検索」等の検索方法に関する選択肢を表示する。この状態で、「画像、シーンによる検索」が選択されると、(d)の画像、シーンによる検索メニューに遷移して、「登録済参照画像:サッカー」・・・「被写体の識別:サッカー」・・・等の選択肢を表示表示させる。そして、検索が実行される前述と同様にして、(e−1)の検索結果の一覧リスト、または、(e−2)の検索結果のインデックス表示(サムネイル表示)い、この状態で一覧リストからいずれかのファイル名が選択され、またはインデックス表示からいずれかの画像が選択されると、(f−1)の当該画像の再生表示(静止画)、または、(f−2)の再生表示(像画像)を行う。
図25は、入力キーワードに対応する特徴データによる画像検索処理と指定した画像データに類似する画像検索処理の概略を示す説明図である。すなわち、キーワード(サッカー)に対応する特徴記述データによる検索(A)においては、画像&音声メモリー媒体31内の各画像ファイルに記録されている当該画像の特徴記述データA1(例えば、代表色:緑)と、キーワード(サッカー)から得られる検索特徴データ1(代表色:緑)とを比較し、特徴データ1は一致するか否かを判断する(A2)。一致する場合には、当該画像ファイルに記録されている画像の特徴記述データA3(例えば、形状2:ボール)と、キーワード(サッカー)から得られる検索特徴データ2(形状2:ボール)とを比較し、特徴データ2は一致するか否かを判断する(A4)。一致する場合には、当該画像ファイルに記録されている画像の特徴記述データA5(例えば、テクスチャー1:芝)と、キーワード(サッカー)から得られる検索特徴データ3(テクスチャー1:芝)とを比較し、特徴データ3は一致するか否かを判断する(A6)。そして、A2、A4、A6の判断が全て一致するであった画像A7、A8を検索結果として得る。
また、画像データによる検索(B)においては、画像&音声メモリー媒体31内の各画像B1と予め選択した検索被写体シーンのパターン(B2)とを比較し(画像の特徴量の比較)、被写体類似度は所定以上であるか否かを判断する(B3)。被写体類似度は所定以上である場合には、前記検索被写体シーンのパターン(B2)に対応する参照画像データB4と画像&音声メモリー媒体31内の当該画像B5とを比較し、画像の類似度は所定以上であるか否かを判断する(B6)。そして、画像の類似度は所定以上であった画像B7、B8、B9を検索結果として得る。
図26は、図23のフローチャートにおけるステップS1105で用いる類語辞書のデータ構成例を示す図である。このデータ構成例においては、「見出し語」に対応して、「同義語」、「広義語」、」「狭義語」、「反意語」、「関連語」が記憶されている。したがって、例えば「派手」を見出し語として検索し、「目立つ」、「彩度が高い」、「つややか」などの類義語から、「彩度の高い色の自動車」の画像データを検索することができる。また、類義語が「派手」となる見出し語を逆検索して、「赤」の広義語の「派手」を見つけ、「赤い車」の画像データを検索することもできる。
類義語辞書に記憶された類語データでは定性的な特徴を表すが、例えば、それらを区分して、表記の揺れの場合の距離=0、同義語との距離=1、広義語との距離=2、狭義語との距離=3、反義語との距離=4、関連語との距離=5、・・・などと、類語間でも、その類似度や距離を数値で表して、より類似度の高い特徴量を用いて検索したり、より、定性的な特徴量を用いて検索できるようにしてもよい。あるいは、これら類語の意味の類似度は、同じ語句でも、文脈や分野により意味や用例も変動するため、文書やニュース記事などにおける実例での意味や用例の頻度などから、平均化した数値などを用いてもよい。
図27は、図23のフローチャートにおけるステップS1105で用いる心理辞書のデータ構成例を示す図である。このデータ構成例においては、「色」に対応して、「心理的な意味1(+(プラス)イメージ)」と「心理的な意味2(−(マイナス)イメージ)」とが感情用語として記憶されている。したがって、例えば「赤」を見出し語として検索し、「情熱的」、「エネルギー」、「怒り」などの感情用語から、これらの語を含む画像データを検索することができる。
なお、類語辞書や心理辞書のように類語や心理イメージ(感情用語)などの定性的な意味だけでなく、図28および図29に示すように「汚い−美しい」、「強い−弱い」、「快い−不快な」、「暖かい−冷たい」・・・など、対となる意味のどちらに近いかの程度を、色別に数値や空間座標などの定量的な指標で「色の意味プロファイル」や「色の意味空間マップ」として、プログラムメモリー23に記憶しておき、その意味のプロファイルや組合せから、近い意味や心理イメージの代表色や配色などの特徴量の程度を具体的に指定して検索できるようにしてもよい。
また、本例では、理解し易いように色や色相の例で示したが、輪郭形状(円い、角張った、細長い、尖った、凸凹した、・・・など)やテクスチャーなど(緻密、荒い、柔らかい、ごわごわ、ザラザラ、・・・など)、その他の特徴量についても、同様に、選択肢として用意された特徴量だけでなく、任意の自由なキーワードで画像の特徴指定し検索することもできる。
(その他の実施の形態)
図30〜図32は、本発明のその他の実施の形態を示す図であり、図30は、外部サーバーに設けられた検索エンジンなどを利用して画像検索を行う例である。本例において撮像機能を備えたカメラ等の機器400は、画像データおよび特徴記述データを記録する画像メモリー401を有するとともに、アプリケーション上で動作するカメラ制御プログラム402、PC転送プログラム403や、ファームウェア404およびUSB等405を有している。また、PC等の通信端末600は、アプリケーション上で動作するWWWブラウザ601、カメラ転送ソフト602や、OS(基本ソフト)603、USB等604、HTTP,FTP605、TCP/IP606、EtherNet/PPP/無線LAN607を有している。また、ウェブ上のサーバー装置700は、サーバーソフト701、HTML、XML文書部702、CGAプログラム703、704、検索ソフト705、MPEG7等記述言語デコーダ706、画像データDB707、画像登録ソフト709およびMPEG7等記述言語エンコーダ710を有しているとともに、HTTP,FTP711、TCP/IP712、EtherNet/PPP/無線LAN713を有している。そして、機器400と通信端末600とは、USB等405、604を介して接続され、通信端末600とサーバー装置700は、インターネット500を介して接続されている。
したがって、機器400から通信端末600に送信された画像の登録要求や、検索要求URL、画像要求URLを通信端末600からサーバー装置700に送り、これ応じてサーバー装置700側から送られてくる登録結果HTML、XML文書、検索結果HTML、XML文書、画像HTML、XML文書を通信端末600側で受信することができる。
図31は、カメラ等の機器内に検索ソフトなどを設けた例である。本例において撮像機能を備えたカメラ等の機器400は、複数の画像データ451、各画像データ451のメタデータ452、検索ソフト453、画像データのデコーダ454、MPEG7等記述言語デコーダ455、PC転送ソフト456、およびUSB等457を有している。また、PC等の通信端末600は、カメラ転送ソフト651、ブラウザ652、OS(基本ソフト)653、USB等654、HTTP,FTP655、TCP/IP656、EtherNet/PPP/無線LAN657を有している。また、ウェブ上のサーバー装置700は、サーバーソフト751、インデックスデータ752、MPEG7等記述データDB753、画像データDB754を有しているとともに、HTTP,FTP755、TCP/IP756、EtherNet/PPP/無線LAN757を有している。そして、機器400と通信端末600とは、USB等457、654を介して接続され、通信端末600とサーバー装置700は、インターネット500を介して接続されている。
したがって、機器400から通信端末600を介して、サーバー装置700に画像データおよび特徴記述データをアップロードして登録することができる。また、所望の特徴記述データまたはキーワードをサーバー装置700に送信し、サーバー装置700が該当する画像データを検索して検索結果を送信し、この送信結果を受信して表示することができる。
図32は、HDD内蔵のデジタルカメラ800の外観構成を示す斜視図である。このデジタルカメラ800のボディ801には、その背面部部にスピーカ802が設けられているとともに、開閉自在な蓋803が設けられている。この蓋803の外面部には、ズームスイッチ804、撮影スイッチ805、カーソル/再生操作スイッチ806、電源/モード切替スイッチ803が設けられている。また、ボディ801の側面部には、ファインダー兼画像モニター表示部808が開閉自在に設けられており、ボディ801の蓋803で覆われる部位には、ハードディスク(HDD)媒体809とメモリー媒体810とを収納するメモリー媒体収容部811が設けられている。
このように、本発明はこの実施の形態に示した外観構成のデジタルカメラ800に限らず、前記実施の形態に示した外観構成のデジタルカメラ等、如何なる外観構成のデジタルカメラであっても適用することができる。また、実施の形態においては、本発明をデジタルカメラに適用するようにしたが、カメラに限らず撮像機能を備えた携帯電話等の各種機器、あるいは撮像機能を備えていないが画像記録機能を備えた画像記録装置にも本発明を適用することができる。
(A)は本発明の各実施の形態に共通するデジタルカメラの正面図、(B)は背面図、(C)は側面透視図である。 同デジタルカメラの概略的回路構成を示すブロック図である。 同デジタルカメラの具体的回路構成を示すブロック図である。 第1の実施の形態における処理手順を示すフローチャートである。 同実施の形態における設定モード時の処理手順を示すフローチャートである。 同実施の形態の表示画面例を示す図である。 同実施の形態における特徴抽出処理と特徴データの記録処理の概要(制御の流れ)を示す説明図である。 同実施の形態おける、画像から抽出した特徴データの記述例を示す図である。 特徴データの記述例を示す図である。 図4に示したフロー中の、特徴量を抽出する処理の処理手順を示すサブルーチンである。 輪郭形状の抽出と被写体の形状識別処理の処理手順を示すフローチャートである。 テンプレートデータの例を示す図である。 選択された領域画像のRGBヒストグラムから代表色やその分布の分散度合いを特徴抽出する処理手順例を示すフローチャートである。 色分布や配色パターンの特徴を抽出する処理手順例を示すフローチャートである。 動きベクトルなど動きの特徴を抽出する処理手順を示すフローチャートである。 輝度ヒストグラム分布によりテクスチャーを解析する処理手順例を示すフローチャートである。 本実施の形態の再生時おける処理手順を示すフローチャートである。 図17のフローチャートにより実行される再生時の特徴抽出、特徴データの再記録の設定メニュー表示画面例を示す図である。 本発明の第2の実施の形態において選択される撮影シーンを示す図である。 同実施の形態の処理手順を示すフローチャートである。 図20のフローチャートに続くフローチャートである。 撮影シーン別の特徴量、テンプレート画像の設定例を示す図である。 本発明の第3の実施の形態における検索処理手順を示すフローチャートである。 図23のフローチャートにより実行される画像データの検索処理の操作との関係における表示例を示す図である。 入力キーワードに対応する特徴データによる画像検索処理と指定した画像データに類似する画像検索処理の概略を示す説明図である。 類語辞書のデータ構成例を示す図である。 心理辞書のデータ構成例を示す図である。 各色の意味プロファイルの例を示す図である。 色の意味空間の例を示す図である。 本発明の他の実施の形態であって、外部サーバーに設けた検索エンジンを利用する例を示す図である。 本発明の他の実施の形態であって、カメラ内に検索ソフトなどを設けた例を示す図である。 本発明の他の実施の形態に係るデジタルカメラの外観構成を示す斜視図である。
符号の説明
1 デジタルカメラ
2 本体
14 表示部
20 電子撮像センサ
22 制御回路
23 プログラムメモリー
24 データメモリー
25 撮影制御部
26 映像信号処理部
27 画像メモリー
28 表示制御部
30 伸張復号部
31 画像&音声メモリー媒体
31a 画像/音声データ
31b 特徴記述データ
32 画像モニター
35 操作入力部
36 入力回路
37 外部入出力端子
38 外部入出力インタフェース
46 HDD記憶装置
56 特徴抽出/認識用データメモリー
57 特徴抽出/認識処理部
70 外部機器
71 インターネット
72 サーバー装置
73 画像データベース
246 テンプレートデータ
246a 種類
246b 特徴データ
246c 輪郭図形
246d テクスチャー
300 サンプル画像

Claims (18)

  1. 画像を撮像する撮像手段と、
    この撮像手段により撮像された画像からその特徴を抽出する特徴抽出手段と、
    前記画像を送信する相手先に応じて前記特徴抽出手段を動作させ、前記撮像手段により撮像される画像の特徴を抽出して取得する特徴取得手段と
    を備えることを特徴とする撮像装置。
  2. 前記特徴抽出手段は、複数種の特徴抽出手段を含み、
    前記特徴取得手段は、前記画像を送信する相手先に応じて、前記特徴抽出手段のいずれかを選択する選択手段を含み、
    この選択手段により選択された特徴抽出手段を用いて、前記撮像手段により撮像される画像の特徴を抽出し取得することを特徴とする請求項1記載の撮像装置。
  3. 前記特徴抽出手段により抽出された特徴を記述する複数種の記述手段を更に備え、
    前記選択手段は、前記画像を送信する相手先に応じて、前記特徴手段とともにいずれかの記述手段を選択し、
    前記特徴取得手段は、前記選択手段により選択された記述手段を用いて前記抽出した画像の特徴を記述することを特徴とする請求項2記載の撮像装置。
  4. 前記撮像手段により撮像された画像と、前記特徴取得手段により取得された画像の特徴とを外部に送信する送信手段を更に備えることを特徴とする請求項1、2または3記載の撮像装置。
  5. 画像を撮像する撮像手段と、
    この撮像手段により撮像された画像からその特徴を抽出する特徴抽出手段と、
    この特徴抽出手段により抽出された特徴を前記画像に付加して送信する送信手段と、
    前記撮像手段により撮像された前記画像に、前記特徴抽出手段により抽出された特徴を付加して送信するか否かを送信相手先別に設定する設定手段と、
    この設定手段の設定に従って前記特徴抽出手段及び送信手段を制御する制御手段と
    を備えることを特徴とする撮像装置。
  6. 前記特徴抽出手段は、複数種の特徴抽出手段を含み、
    前記制御手段は、前記送信相手先に応じて、前記特徴抽出手段のいずれかを選択する選択手段を含み、
    前記送信手段は、 前記選択手段により選択された特徴抽出手段により抽出された特徴を前記画像に付加して送信することを特徴とする請求項5記載の撮像装置。
  7. 画像を取得する画像取得手段と、
    この画像取得手段により取得された画像からその特徴を抽出する複数種の特徴抽出手段と、
    この複数種の特徴抽出手段から、いずれかの特徴抽出手段を選択する選択手段と、
    この選択手段により選択された特徴抽出手段を用いて前記画像の特徴を抽出し取得する特徴取得手段と、
    この特徴抽出手段により抽出し取得された特徴と前記画像とを記録する記録手段と、 画像の特徴を入力する入力手段と、
    この入力手段により入力された画像の特徴と前記記録手段に記録された画像の特徴とに基づき、前記記録手段にて対応する画像を検索する画像検索手段と、
    この画像検索手段による検索結果を出力する出力手段と
    を備えることを特徴とする画像記録検索装置。
  8. 前記画像取得手段は、撮像手段から出力された画像を取得する手段又は前記記録手段に記録されている画像を取得する手段を含むことを特徴とする請求項7記載の画像記録検索装置。
  9. 前記出力手段は、前記検索結果を表示出力する表示手段を含むことを特徴とする請求項7または8記載の画像記録検索装置。
  10. 前記出力手段は、前記検索結果を一覧表示する第1の表示手段と、
    この第1の表示手段により表示された一覧からいずれかの検索結果が選択されると、当該検索結果に対応する画像を表示する第2の表示手段と
    を含むことを特徴とする請求項9記載の画像記録検索装置。
  11. 前記入力手段は、複数の特徴を入力し、
    前記画像検索手段は、前記入力手段により入力された複数の特徴と前記記録手段に記録された画像の特徴とに基づき、前記画像を検索することを特徴とする請求項7から10にいずれか記載の画像記録検索装置。
  12. 前記入力手段は、キーワードにより前記画像の特徴を入力し、
    前記画像検索手段は、前記入力手段により入力されたキーワードに基づき、前記画像を検索することを特徴とする請求項7から11にいずれか記載の画像記録検索装置。
  13. 前記入力手段により入力されるキーワードに関連する複数種の関連語を記憶した辞書手段と、
    この辞書手段から、前記キーワードに関連する関連語を検索する関連語検索手段とを更に備え、
    前記画像検索手段は、前記関連語検索手段により検索された関連語と前記記録手段に記録された画像の特徴とに基づき、前記画像を検索することを特徴とする請求項12記載の画像記録検索装置。
  14. 前記画像の特徴には、
    (1)前記画像中の所定の領域の色情報または色分布に関する特徴、
    (2)前記画像中の分割された領域の輪郭線の形状に関する特徴、
    (3)前記画像中の全体領域または分割された領域、もしくは背景領域のテクスチャーに関する特徴、
    のいずれかが含まれることを特徴とする請求項7から13にいずれか記載の画像記録検索装置。
  15. 前記画像検索手段は、前記入力手段により入力された画像の特徴に基づき、当該装置が有する前記記録手段にて対応する画像を検索する第1画像検索手段と、外部装置が有する記録手段にて対応する画像を検索する第2の画像検索手段とを含むことを特徴とする請求項7から14にいずれか記載の画像記録検索装置。
  16. 画像を記録する記録手段と、
    この記録手段に記録される画像からその特徴を抽出する特徴抽出手段と、
    前記画像を送信する相手先に応じて前記特徴抽出手段を制御し、前記記録手段に記録される画像の特徴を抽出して取得する特徴取得手段と
    を備えることを特徴とする画像記録装置。
  17. 画像を撮像する撮像手段を備える撮像装置が有するコンピュータを、
    前記撮像手段により撮像された画像からその特徴を抽出する特徴抽出手段と、
    前記画像を送信する相手先に応じて前記特徴抽出手段を制御し、前記撮像手段により撮像される画像の特徴を抽出して取得する特徴取得手段と
    して機能させることを特徴とする撮像制御プログラム。
  18. 記録手段と、画像の特徴を入力する入力手段とを備える画像記録検索装置が有するコンピュータを、
    前記記録手段により記録される画像からその特徴を抽出する複数種の特徴抽出手段と、
    この複数種の特徴抽出手段から、いずれかの特徴抽出手段を選択する選択手段と、
    この選択手段により選択された特徴抽出手段を用いて前記画像の特徴を抽出し、この抽出した特徴を前記画像とともに前記記録手段に記録する記録制御手段と、
    前記入力手段により入力された画像の特徴と前記記録手段に記録された画像の特徴とに基づき、前記記録手段にて対応する画像を検索する画像検索手段と、
    この画像検索手段による検索結果を出力する出力手段と
    して機能させることを特徴とする画像記録検索プログラム。
JP2005279020A 2005-09-27 2005-09-27 撮像装置、画像記録装置およびプログラム Expired - Fee Related JP4706415B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005279020A JP4706415B2 (ja) 2005-09-27 2005-09-27 撮像装置、画像記録装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005279020A JP4706415B2 (ja) 2005-09-27 2005-09-27 撮像装置、画像記録装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2007096379A true JP2007096379A (ja) 2007-04-12
JP4706415B2 JP4706415B2 (ja) 2011-06-22

Family

ID=37981597

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005279020A Expired - Fee Related JP4706415B2 (ja) 2005-09-27 2005-09-27 撮像装置、画像記録装置およびプログラム

Country Status (1)

Country Link
JP (1) JP4706415B2 (ja)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009017092A (ja) * 2007-07-03 2009-01-22 Dainippon Printing Co Ltd 図形に埋め込まれた情報を読み取るプログラム
JP2010145966A (ja) * 2008-12-22 2010-07-01 Fujinon Corp オートフォーカスシステム
JP2012003395A (ja) * 2010-06-15 2012-01-05 Honda Motor Co Ltd 形状データ検索システム及び形状データ検索方法
JP2012103865A (ja) * 2010-11-09 2012-05-31 Canon Inc 画像処理システム、撮像装置、画像処理装置及びそれらの制御方法、プログラム
WO2012121137A1 (ja) * 2011-03-04 2012-09-13 株式会社ニコン 画像処理装置および画像処理プログラム
WO2012133028A1 (ja) * 2011-03-25 2012-10-04 株式会社ニコン 電子機器、選択方法、取得方法、電子装置、合成方法および合成プログラム
JP2012203657A (ja) * 2011-03-25 2012-10-22 Nikon Corp 電子機器及び取得方法
JP2012221033A (ja) * 2011-04-05 2012-11-12 Nikon Corp 電子機器及び選択方法
JP2012221401A (ja) * 2011-04-13 2012-11-12 Nikon Corp 電子機器及び選択方法
JP2013020505A (ja) * 2011-07-12 2013-01-31 Central Research Institute Of Electric Power Industry 画像処理方法、画像処理装置及び画像処理プログラム、並びに、画像処理による放射線量推定方法
JP2013021733A (ja) * 2012-10-29 2013-01-31 Fujitsu Mobile Communications Ltd 携帯情報機器
WO2013089051A1 (ja) * 2011-12-14 2013-06-20 シャープ株式会社 画像処理装置、画像処理方法、画像処理プログラム、および画像処理プログラムを記憶した記録媒体
JP5223034B2 (ja) * 2010-04-28 2013-06-26 楽天株式会社 情報提供装置、情報提供方法、情報提供処理プログラム、及び情報提供処理プログラムを記録した記録媒体
US9723214B2 (en) 2014-07-30 2017-08-01 Olympus Corporation Characteristic image display apparatus
JPWO2016159150A1 (ja) * 2015-03-31 2018-02-22 株式会社エクォス・リサーチ 脈波検出装置、及び脈波検出プログラム
US10595732B2 (en) 2015-03-31 2020-03-24 Equos Research Co., Ltd. Pulse wave detection device and pulse wave detection program
WO2021091161A1 (en) * 2019-11-07 2021-05-14 Samsung Electronics Co., Ltd. Electronic device and method of controlling the same

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09138804A (ja) * 1995-11-14 1997-05-27 Masao Sakauchi 画像検索装置
JPH11238078A (ja) * 1998-02-24 1999-08-31 Minolta Co Ltd 画像検索装置及び方法並びに画像検索プログラムを記録した記録媒体
JP2000083146A (ja) * 1998-09-07 2000-03-21 Fuji Photo Film Co Ltd 画像処理システム及び画像処理方法
JP2000123047A (ja) * 1998-10-19 2000-04-28 Nec Corp キ―ワ―ドをメディア・オブジェクトに割り当てる方法、及び装置
JP2003052032A (ja) * 2001-08-07 2003-02-21 Sony Corp 情報配信システム及び情報配信方法、情報供給装置及び情報供給方法
JP2003076695A (ja) * 2001-09-05 2003-03-14 Canon Inc 画像検索装置及びその方法、プログラム
JP2003132090A (ja) * 2001-10-26 2003-05-09 Olympus Optical Co Ltd 類似データ検索装置および方法
JP2003204275A (ja) * 2001-10-31 2003-07-18 Victor Co Of Japan Ltd メタデータ受信方法
JP2004023656A (ja) * 2002-06-19 2004-01-22 Canon Inc 画像処理装置、画像処理方法、及び、プログラム
JP2004186723A (ja) * 2002-11-29 2004-07-02 Sony Corp ビデオ信号処理装置,ビデオ信号記録装置,ビデオ信号再生装置,ビデオ信号処理装置の処理方法,ビデオ信号記録装置の処理方法,ビデオ信号再生装置の処理方法,プログラム,記録媒体
JP2004312281A (ja) * 2003-04-04 2004-11-04 Sony Corp 映像編集装置,映像編集装置の処理方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09138804A (ja) * 1995-11-14 1997-05-27 Masao Sakauchi 画像検索装置
JPH11238078A (ja) * 1998-02-24 1999-08-31 Minolta Co Ltd 画像検索装置及び方法並びに画像検索プログラムを記録した記録媒体
JP2000083146A (ja) * 1998-09-07 2000-03-21 Fuji Photo Film Co Ltd 画像処理システム及び画像処理方法
JP2000123047A (ja) * 1998-10-19 2000-04-28 Nec Corp キ―ワ―ドをメディア・オブジェクトに割り当てる方法、及び装置
JP2003052032A (ja) * 2001-08-07 2003-02-21 Sony Corp 情報配信システム及び情報配信方法、情報供給装置及び情報供給方法
JP2003076695A (ja) * 2001-09-05 2003-03-14 Canon Inc 画像検索装置及びその方法、プログラム
JP2003132090A (ja) * 2001-10-26 2003-05-09 Olympus Optical Co Ltd 類似データ検索装置および方法
JP2003204275A (ja) * 2001-10-31 2003-07-18 Victor Co Of Japan Ltd メタデータ受信方法
JP2004023656A (ja) * 2002-06-19 2004-01-22 Canon Inc 画像処理装置、画像処理方法、及び、プログラム
JP2004186723A (ja) * 2002-11-29 2004-07-02 Sony Corp ビデオ信号処理装置,ビデオ信号記録装置,ビデオ信号再生装置,ビデオ信号処理装置の処理方法,ビデオ信号記録装置の処理方法,ビデオ信号再生装置の処理方法,プログラム,記録媒体
JP2004312281A (ja) * 2003-04-04 2004-11-04 Sony Corp 映像編集装置,映像編集装置の処理方法

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009017092A (ja) * 2007-07-03 2009-01-22 Dainippon Printing Co Ltd 図形に埋め込まれた情報を読み取るプログラム
JP2010145966A (ja) * 2008-12-22 2010-07-01 Fujinon Corp オートフォーカスシステム
JP5223034B2 (ja) * 2010-04-28 2013-06-26 楽天株式会社 情報提供装置、情報提供方法、情報提供処理プログラム、及び情報提供処理プログラムを記録した記録媒体
US8918414B2 (en) 2010-04-28 2014-12-23 Rakuten, Inc. Information providing device, information providing method, information providing processing program, and recording medium having information providing processing program recorded thereon
JP2012003395A (ja) * 2010-06-15 2012-01-05 Honda Motor Co Ltd 形状データ検索システム及び形状データ検索方法
JP2012103865A (ja) * 2010-11-09 2012-05-31 Canon Inc 画像処理システム、撮像装置、画像処理装置及びそれらの制御方法、プログラム
WO2012121137A1 (ja) * 2011-03-04 2012-09-13 株式会社ニコン 画像処理装置および画像処理プログラム
JP6020439B2 (ja) * 2011-03-04 2016-11-02 株式会社ニコン 画像処理装置、撮像装置、および画像処理プログラム
CN103403762A (zh) * 2011-03-04 2013-11-20 株式会社尼康 图像处理装置及图像处理程序
WO2012133028A1 (ja) * 2011-03-25 2012-10-04 株式会社ニコン 電子機器、選択方法、取得方法、電子装置、合成方法および合成プログラム
JP2012203657A (ja) * 2011-03-25 2012-10-22 Nikon Corp 電子機器及び取得方法
JP2012221033A (ja) * 2011-04-05 2012-11-12 Nikon Corp 電子機器及び選択方法
JP2012221401A (ja) * 2011-04-13 2012-11-12 Nikon Corp 電子機器及び選択方法
JP2013020505A (ja) * 2011-07-12 2013-01-31 Central Research Institute Of Electric Power Industry 画像処理方法、画像処理装置及び画像処理プログラム、並びに、画像処理による放射線量推定方法
WO2013089051A1 (ja) * 2011-12-14 2013-06-20 シャープ株式会社 画像処理装置、画像処理方法、画像処理プログラム、および画像処理プログラムを記憶した記録媒体
JP2013021733A (ja) * 2012-10-29 2013-01-31 Fujitsu Mobile Communications Ltd 携帯情報機器
US9723214B2 (en) 2014-07-30 2017-08-01 Olympus Corporation Characteristic image display apparatus
US10021310B2 (en) 2014-07-30 2018-07-10 Olympus Corporation Characteristic image display apparatus
JPWO2016159150A1 (ja) * 2015-03-31 2018-02-22 株式会社エクォス・リサーチ 脈波検出装置、及び脈波検出プログラム
US10445560B2 (en) 2015-03-31 2019-10-15 Equos Research Co., Ltd. Pulse wave detection device and pulse wave detection program
US10595732B2 (en) 2015-03-31 2020-03-24 Equos Research Co., Ltd. Pulse wave detection device and pulse wave detection program
WO2021091161A1 (en) * 2019-11-07 2021-05-14 Samsung Electronics Co., Ltd. Electronic device and method of controlling the same
US11323632B2 (en) 2019-11-07 2022-05-03 Samsung Electronics Co., Ltd. Electronic device and method for increasing exposure control performance of a camera by adjusting exposure parameter of the camera

Also Published As

Publication number Publication date
JP4706415B2 (ja) 2011-06-22

Similar Documents

Publication Publication Date Title
JP4706415B2 (ja) 撮像装置、画像記録装置およびプログラム
JP5261724B2 (ja) 階層的クラスタリングによる代表画像選定
CN103535023B (zh) 包括特定人的视频摘要
TWI375917B (en) Image processing apparatus, imaging apparatus, image processing method, and computer program
JP3108585B2 (ja) ビデオ画像プリントアクセス方法およびシステム
TWI253860B (en) Method for generating a slide show of an image
JP2008011316A (ja) カメラ装置及びカメラ装置制御プログラム
KR101345284B1 (ko) 멀티미디어 컨텐츠 부호화/재생 방법 및 장치
EP2573758B1 (en) Method and apparatus for displaying summary video
US20130222645A1 (en) Multi frame image processing apparatus
WO2006112652A1 (en) Method and system for albuming multimedia using albuming hints
JP2008017224A (ja) 撮像装置、撮像装置の出力制御方法及びプログラム
JP2011160044A (ja) 撮像装置
KR101812103B1 (ko) 썸네일이미지 설정방법 및 설정프로그램
US20060078315A1 (en) Image display device, image display program, and computer-readable recording media storing image display program
WO2017215194A1 (zh) 一种图像处理方法及其装置、存储介质
JP2007088814A (ja) 撮像装置、画像記録装置および撮像制御プログラム
JPH08331495A (ja) 撮影機能付き電子アルバムシステム
US9767587B2 (en) Image extracting apparatus, image extracting method and computer readable recording medium for recording program for extracting images based on reference image and time-related information
JP5808056B2 (ja) 撮像装置、撮像制御プログラム、画像再生装置及び画像再生制御プログラム
JP4867428B2 (ja) 撮像装置、撮像方法及びプログラム
WO2022158201A1 (ja) 画像処理装置、画像処理方法、プログラム
JP2012029119A (ja) 表示制御装置、カメラ、および、表示装置
JP5131041B2 (ja) 撮像装置、撮像制御プログラム
US8798439B2 (en) Method and apparatus for continuously reproducing moving picture files

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080922

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100806

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110228

R150 Certificate of patent or registration of utility model

Ref document number: 4706415

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees