[go: up one dir, main page]

JP2011166442A - 撮像装置 - Google Patents

撮像装置 Download PDF

Info

Publication number
JP2011166442A
JP2011166442A JP2010026821A JP2010026821A JP2011166442A JP 2011166442 A JP2011166442 A JP 2011166442A JP 2010026821 A JP2010026821 A JP 2010026821A JP 2010026821 A JP2010026821 A JP 2010026821A JP 2011166442 A JP2011166442 A JP 2011166442A
Authority
JP
Japan
Prior art keywords
subject
image
face
unit
specific subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010026821A
Other languages
English (en)
Inventor
Kazuhiro Kojima
和浩 小島
Haruo Hatanaka
晴雄 畑中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2010026821A priority Critical patent/JP2011166442A/ja
Priority to CN2011100350586A priority patent/CN102148931A/zh
Priority to US13/024,126 priority patent/US20110193986A1/en
Publication of JP2011166442A publication Critical patent/JP2011166442A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/21Intermediate information storage
    • H04N1/2166Intermediate information storage for mass storage, e.g. in document filing systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00336Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing pattern recognition, e.g. of a face or a geographic feature
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • H04N1/00458Sequential viewing of a plurality of images, e.g. browsing or scrolling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00488Output means providing an audible output to the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00501Tailoring a user interface [UI] to specific requirements
    • H04N1/00509Personalising for a particular user or group of users, e.g. a workgroup or company
    • H04N1/00514Personalising for a particular user or group of users, e.g. a workgroup or company for individual users
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/21Intermediate information storage
    • H04N1/2104Intermediate information storage for one or a few pictures
    • H04N1/2112Intermediate information storage for one or a few pictures using still video cameras
    • H04N1/2137Intermediate information storage for one or a few pictures using still video cameras with temporary storage before final recording, e.g. in a frame buffer
    • H04N1/2141Intermediate information storage for one or a few pictures using still video cameras with temporary storage before final recording, e.g. in a frame buffer in a multi-frame buffer
    • H04N1/2145Intermediate information storage for one or a few pictures using still video cameras with temporary storage before final recording, e.g. in a frame buffer in a multi-frame buffer of a sequence of images for selection of a single frame before final recording, e.g. from a continuous sequence captured before and after shutter-release
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/667Camera operation mode switching, e.g. between still and video, sport and normal or high- and low-resolution modes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Studio Devices (AREA)

Abstract

【課題】音声を出力することで被写体がカメラ目線になるように誘導し、被写体がカメラ目線になった瞬間の画像を撮影し、記録媒体に記録する。
【解決手段】撮影領域から特定被写体を検出し、検出された特定被写体の種類に応じた音声を出力することで、当該特定被写体が正面顔(カメラ目線)になるように誘導する。音声出力は特定被写体がカメラ目線の状態の画像を撮影するまで繰り返され、その間、特定被写体の状態が遷移する毎に撮影を行う。
【選択図】図1

Description

本発明は、被写体の光学像を撮影する撮像装置に関する。
近年、デジタルカメラが広く普及し、様々な撮影シーンや用途で使用されている。この種のデジタルカメラには、通常撮影モード以外に様々な撮影モードが備えられているものもあり、その一例として、被写体の状態を判断し、当該被写体が所定の条件を満たす状態になった場合に、自動的に撮影を行うといったものがある。
例えば、特許文献1には、被写体が撮像装置の方向を見ている画像、即ち、カメラ目線の画像を取得できる撮像装置が開示されている。かかる撮像装置によると、顔画像を含む一人または複数の人物の画像から人物の視線方向を検出して、視線が撮像装置の方向を向いているかどうか判断し、撮像装置の方向を向いていると判断された場合に画像の撮影、保存を行う。
特開2006−319610号公報
しかしながら、上記特許文献1には、被写体をカメラ目線にさせる効果については開示されていない。そのため、例えば、子供や動物などの被写体を撮影する場合、被写体がなかなかカメラ目線にならない場合も想定され、そのような場合、撮影者は被写体がカメラ目線になるまで待たなければならず、負担になる。
本発明は上記課題に鑑みてなされたものであり、本願の発明にかかる撮像装置は、プレビュー画像から特定被写体を検出する被写体検出手段、前記被写体検出手段により検出された被写体の状態を判別する状態判別手段、前記特定の被写体が第1の状態ではないと判別された場合に、前記特定被写体に音声を出力する音声出力手段、前記特定被写体の状態が前記第1の状態であると判別された場合に撮影を行う撮影手段、を備えること特徴とする。
本発明によると、撮影領域内から特定被写体を検出し、該特定被写体がカメラ目線になるように誘導する音声を出力する。その際、出力する音声は、該特定被写体の種類に応じて決定される。そして、前記特定被写体がカメラ目線になった瞬間の画像を撮影する。そのため、撮影者に負担をかけることなく被写体がカメラ目線の画像を撮影することができる。
本発明の第1の実施の形態にかかる撮像装置の構成の概略を示すブロック図である。 本発明に係る撮像装置の動画撮影時の基本動作の概略を示すフローチャートである。 特定被写体検出部7aの内部構成の概略を示すブロック図である。 縮小画像生成手段によって得られる階層画像の一例を示す図解図である。 被写体検出処理の処理動作を示す図解図である。 撮像装置が捉えている撮影領域の一例を示す図解図である。 テーブル構造の一例を示す図解図である。 本発明の第1の実施の形態にかかる正面顔撮影モードの処理動作を示すフローチャートである。 本発明の第1の実施の形態にかかる正面顔撮影処理の処理動作を示すフローチャートである。 本発明の第2の実施の形態にかかる撮像装置の構成の概略を示すブロック図である。 顔検出処理の処理動作を示す図解図である。 類似度判定部7cの内部構成の概略を示すブロック図である。 本発明の第2の実施の形態にかかる正面顔撮影モードの処理動作を示すフローチャートである。
<実施例1>
本発明を静止画の撮影が可能なデジタルカメラ等の撮像装置に実施した第1の実施の形態について、図面を参照して説明する。当該撮像装置は静止画を撮影できるものであれば、動画の撮影が可能なものであっても構わない。
(撮像装置の構成)
図1は、本実施の形態にかかる撮像装置の構成の概略を示すブロック図である。撮像装置は、入射される光を電気信号に変換するCCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)センサなどの固体撮像素子(イメージセンサ)1と、被写体の光学像をイメージセンサ1に結像させるズームレンズとズームレンズの焦点距離、即ち、光学ズーム倍率を変化させるモータとズームレンズの焦点を被写体に合わせるためのモータとを有するレンズ部3を備える。
また、図1の撮像装置はイメージセンサ1から出力されるアナログ信号である画像信号をデジタル信号に変換するAFE(Analog Front End)5と、AFE5からのデジタル信号となる画像信号に対して、階調補正等の各種画像処理を施す画像処理部7と、静止画を撮影する場合は画像処理部7からの画像信号に対してJPEG(Joint Photographic Experts Group)圧縮方式など、動画を撮影する場合は画像処理部7からの画像信号と集音マイクを含む音声処理部(図示せず)から出力される音声信号とに対してMPEG(Moving Picture Experts Group)圧縮方式などの圧縮符号化処理を施す圧縮処理部9と、圧縮処理部9で圧縮符号化された圧縮符号化信号をSDメモリカード(SD Memory Card)などの記録媒体27に記録するドライバ部29と、ドライバ部29で記録媒体27から読み出した圧縮符号化信号を伸長して復号化する伸長処理部11と、伸長処理部11で復号されて得られた画像信号に基づく画像の表示を行うLCD(Liquid Crystal Display)等を有する表示部13と、を更に備える。
また、本実施の形態にかかる撮像装置は、各ブロックの動作タイミングを一致させるためのタイミング制御信号を出力するタイミングジェネレータ(TG)15と、撮像装置内全体の駆動動作を制御するCPU(Central Processing Unit)17と、各動作のための各プログラムを記憶するとともにプログラム実行時のデータの一時保管を行うメモリ19と、静止画撮影用のシャッタボタン21sを含む、ユーザからの指示が入力される操作部21と、音声を出力する音声出力部31を更に備える。
また、本実施の形態にかかる撮像装置は、CPU17と各ブロックとの間でデータのやりとりを行うためのバス23と、メモリ19と各ブロックとの間でデータのやりとりを行うためのバス25と、を更に備える。
レンズ部3は、画像処理部7で検出した画像信号に応じてCPU17が、モータを駆動させ、焦点や絞りの制御を行うものである。また、画像処理部7は、AFE5から出力された画像信号に応じた画像から特定の被写体(例えば、人物や動物など。)を検出する特定被写体検出部7aを更に備える。
尚、記録媒体27は、DVD(Digital Versatile Disc)等の光ディスクやHDD(Hard disk drive)等の磁気記録媒体でも良い。
(撮像装置の基本動作 撮影時)
次に、図2を参照して、この撮像装置の静止画撮影時の基本動作についてフローチャートを用いて説明する。ユーザが撮像装置の電源をONにすると、撮像装置の駆動モード、即ち、イメージセンサ1の駆動モードがプレビューモードに設定される(S1)。プレビューモードとは、撮影対象となる画像を記録することなく表示部13に表示するモードであり、撮影対象を定め、構図を決定するために用いることができる。続いて撮影モードの入力待ち状態となり、人物撮影に適したモード、移動物体の撮影に適したモード、逆光での撮影に適したモード等、撮像装置の機能や撮影シーンに応じたモードが選択される。撮影モードが入力されない場合は通常撮影モードが選択されたものとする(S3)。
プレビューモードでは、イメージセンサ1の光電変換動作によって得られたアナログの画像信号は、AFE5においてデジタル画像信号に変換されて、画像処理部7で色分離、ホワイトバランス調整、YUV変換などの画像処理が施され、メモリ19に書き込まれる。メモリ19に書き込まれた画像信号は、逐次、表示部13に表示される。この結果、所定期間毎(例えば、1/30秒毎や1/60秒毎、等)の撮影領域を表すフレーム画像(プレビュー画像)が表示部13に逐次表示される。
続いてユーザが、撮影の対象とする被写体に対して所望の画角となるように、光学ズームでのズーム倍率を設定する(S5)。その際、画像処理部7に入力された画像信号に基づきCPU37によってレンズ部3を制御して、最適な露光制御(Automatic Exposure;AE)・焦点合わせ制御(Automatic Focus;AF)が行われる(S7)。ユーザが撮影画角、構図を決定し、操作部21のシャッタボタン21sを半押しすると(S9でYes)、AEの調整を行い(S11)、AFの最適化処理を行う(S13)。
その後、シャッタボタン21sが全押しされると(S15でYes)、TG15より、イメージセンサ1、AFE5、画像処理部7及び圧縮処理部9それぞれに対してタイミング制御信号が与えられ、各部の動作タイミングを同期させ、イメージセンサ1の駆動モードを静止画撮影モードに設定し(S17)、イメージセンサ1から出力されるアナログ画像信号をAFE5でデジタル画像信号に変換して画像処理部7内のフレームメモリに書き込む(S19)。このデジタル信号がこのフレームメモリから読み込まれ、画像処理部7において輝度信号及び色差信号の生成を行う信号変換処理などの各種画像処理が施され、画像処理が施された信号が圧縮処理部9においてJPEG(Joint Photographic Experts Group)形式に圧縮された(S21)後、記録媒体27に圧縮画像を書き込み(S23)、撮影を完了する。その後、プレビューモードに戻る。
(撮像装置の基本動作 画像再生時)
記録媒体27に記録された動画を再生することが、操作部21を通じて指示されると、再生を選択された圧縮信号が、ドライバ部29によって読み出されて伸長処理部11に与えられる。そして、伸長処理部11において、圧縮符号方式に基づいて、伸長復号されて、画像信号が取得される。そして、画像信号が表示部13に与えられて画像が再生される。これにより、記録媒体27に記録された圧縮信号に基づく画像が再生される。
(被写体検出処理)
ここで、この撮像装置の被写体検出処理について説明する。本実施例に係る撮像装置は、特定被写体検出部7aを備え、入力された画像信号から人物の顔や動物の顔などの特定被写体を検出することができる。ここでは、人物の顔を検出する場合を例として、特定被写体検出部7aの構成及び動作について以下に説明する。
図3は、特定被写体検出部7aの構成の概略を示すブロック図である。特定被写体検出部7aは、AFE5によって得られた画像信号に基づいて1または複数の縮小画像を生成する縮小画像生成部71、入力画像及びその縮小画像から構成される各階層画像とメモリ19に記憶された特定被写体検出用の重みテーブルである被写体検出辞書Dとを用いて入力画像に特定被写体が存在するか否かを判定する被写体判定部72、および被写体判定部72の判定結果を出力する判定結果出力部73を備えている。尚、被写体検出辞書Dは、記録媒体27に記憶しておくようにしても良い。
また、メモリ19に記憶された被写体検出辞書Dは、入力画像から特定被写体を検出するのに用いる判定領域と同じ大きさの各方向のエッジ特徴画像(例えば、水平方向エッジ画像や垂直方向エッジ画像など)の画素位置を、エッジ特徴画像の種類、エッジ特徴画像の各画素の行番号及び列番号で定義する。エッジ特徴画像とは、画像のエッジ部分のみを抽出した画像のことである。
このような被写体検出辞書Dは、大量の教師サンプル(例えば、顔を検出する辞書である場合、顔および非顔のサンプル画像など)から求められたものである。このような被写体検出辞書Dは、例えば、Adaboostと呼ばれる公知の学習方法を利用して作成することができ(Yoav Freund, Robert E. Schapire,"A decision-theoretic generalization of on-line learning and an application to boosting", European Conference on Computational Learning Theory, September 20,1995.)、例えば、正面顔を検出する正面顔検出辞書、横顔を検出する横顔検出辞書などを個別に作成することもできる。
また、人物に限らず、例えば、犬や猫などの動物を検出する辞書や自動車などを検出する辞書を作成することもできる。
尚、Adaboostは、適応的なブースティング学習方法の1つで、大量の教師サンプルをもとに、複数の弱識別器候補の中から識別に有効な弱識別器を複数個選択し、それらを重み付けして統合することによって高精度な識別器を実現する学習方法である。ここで、弱識別器とは、全くの偶然よりは識別能力は高いが、十分な精度を満たすほど高精度ではない識別器のことをいう。弱識別器の選択時には、既に選択した弱識別器がある場合、選択済の弱識別器によって誤認識してしまう教師サンプルに対して学習を重点化することによって、残りの弱識別器候補の中から最も効果の高い弱識別器を選択する。
図4は、縮小画像生成部71によって得られる階層画像の一例を示している。階層画像とは、撮像装置が取得した画像を任意の縮小率R(0<R<1、理想的には0.8や0.9など1に近い値が望ましい。)に従い縮小された複数の画像である。図4において、P1は入力画像を、P2〜P5はそれぞれR倍、R倍、R倍、R倍に縮小された縮小画像を示している。F1は判定領域を示している。判定領域は、例えば、縦24画素、横24画素の大きさに設定される。判定領域の大きさは、入力画像及びその縮小画像においても同じである。被写体検出処理は、各階層画像に設定された判定領域に対応する複数のエッジ特徴画像と被写体検出辞書Dに含まれる辞書の各々とを用いて行われる。
本実施例では、矢印で示すように、階層画像上で判定領域を左から右に移動させる、水平方向走査を、画像の上方から下方に向かって行いながらパターンマッチングを行うことで被写体を検出する。各判定領域と被写体検出辞書Dの各辞書との類似度(similarity measure)によって、当該判定領域が顔領域であるか否かの検出を行う。ただし、走査順はこれに限られるものではない。
入力画像P1の他に、複数の縮小画像P2〜P5を生成しているのは、大きさが異なる複数の顔を検出するためである。
図5は被写体検出処理を説明するための図である。被写体判定部72による被写体検出処理は、各階層画像に対して行なわれるが、処理方法は同様なので、ここでは入力画像P1に対して行なわれる被写体検出処理についてのみ説明する。
図5には、入力画像P1と、入力画像内に設定された判定領域F1とを示している。階層画像毎に行なわれる顔検出処理は、画像内に設定された判定領域に対応する画像と被写体検出辞書Dとを用いた、パターンマッチングによって行われる。パターンマッチングとは、入力画像の中に被写体検出辞書Dに設定されているパターンと同じ物があるか、或いは近いものがあるかを検出すること指し、本発明では、入力画像に被写体検出辞書Dを重ねながら移動し、2つの画像が画素データレベルの相関(類似性)を有するか否かを調べる。入力画像と被写体検出辞書Dとの相関は、例えば、類似度判定によって行なわれる。類似度判定は、例えば、ディジタル画像処理第2版(CG−ARTS協会出版,2007年3月1日発行)に記載されている類似度を算出する手法で調べる。類似度は、例えば、SSD(Sum of Squared Difference)やSAD(Sum of Absolute Difference)、NCC(Normalized Cross-Correlation)を用いて導出する。SSDやSADを用いる場合、類似度の値は画像が類似しているほど小さくなり、類似度の値が所定の閾値以下であれば、当該判定領域は顔領域であると判定する。また、NCCを用いる場合は、ベクトルのなす角の余弦が1に近いほど類似度が高くなり、類似度の値から1を減算した値の絶対値が所定の閾値以下であれば、当該判定領域は顔領域であると判定する。
被写体検出処理は粗い判定から順次細かい判定に移行する複数の判定ステップからなり、ある判定ステップにおいて、被写体が検出されなかった場合には、次の判定ステップには移行せず、当該判定領域に被写体は存在しないと判定する。全ての判定ステップにおいて、被写体が検出された場合にのみ、当該判定領域に顔が存在すると判定し、判定領域を走査して次の判定領域での判定に移行する。尚、このような被写体検出処理については、特開2007−257358号公報に詳しく開示されている。
以上、人物の顔を検出する場合を例として、特定被写体の検出手法について説明したが、上記手法により、人物の顔以外の特定被写体(例えば、動物や自動車など。)を検出することも可能である。
尚、本実施例に係る撮像装置は、図3に示すように、人物の顔を検出する人物検出辞書と、犬の顔を検出する犬検出辞書を備えているものとする。また、人物検出辞書及び犬検出辞書は、それぞれ正面顔を検出する正面顔辞書、横顔を検出する横顔辞書、傾いた顔を検出する傾き顔辞書、回転した顔を検出する回転顔辞書を備えているものとする。
また、正面顔辞書により特定被写体が検出されている状態をST1、横顔辞書により特定被写体が検出されている状態をST2、後ろ顔辞書により被写体が検出されている状態をST3、傾き顔辞書により特定被写体が検出されている状態をST4、回転顔辞書により被写体が検出されている状態をST5とする。
(正面顔撮影モード)
本実施例に係る撮像装置は、音声を出力することで撮影領域内にいる人物や動物などの被写体がカメラが存在する方向に向く(以下、正面顔と記載する。)ように誘導し、当該被写体が正面顔になった瞬間の画像を自動的に記録する、所謂、正面顔撮影モードを備えている。
正面顔撮影モードは、例えば、次のようにして実現される。ユーザが操作部21を操作することで、撮影モードが正面顔撮影モードに設定され、シャッタボタン21sが半押しされると、撮像装置1は、通常撮影モード時と同様にAE調整、AF最適化処理を行なう。
その後、撮影者によりシャッタボタン21sが全押しされると、その瞬間の画像に対して特定被写体検出処理を行ない、判定結果をCPU17に出力する。この判定結果には、被写体の有無を示す情報、また、特定被写体が検出された場合、当該特定被写体の状態(ST1〜ST5)を示す情報が含まれる。尚、特定被写体が人物であるか犬であるか否かといった被写体の種類の特定、及び特定被写体の状態ST1〜ST5は、どの顔辞書によって検出されたかによって特定することができる。
このとき、特定被写体が検出されなかった場合は、そのまま画像撮影を行い、記録媒体27に画像データを記録する。
特定被写体が検出された場合(例えば、図6に示すようなプレビュー画像である場合、人物の横顔が検出され、状態ST2に相当。)、CPU17は、検出された特定被写体が人物であるか、或いは、犬であるかに応じて出力する音声を決定する。音声はメモリ19に記憶させておいても良いし、記録媒体27に記憶させておいてもよい。音声は、例えば、図7に示すようなテーブルで管理されており、特定被写体検出処理による検出結果に応じて、出力する音声を決定する。
特定被写体検出処理によって人物が検出された場合は、人物の注意を惹き、カメラが存在する方向へ振り向かせるための音声A、犬が検出された場合は犬を振り向かせるための音声Bが、音声出力部31から出力される。特定被写体検出部7aは所定周期毎に生成される各フレーム画像(プレビュー画像)に対して検出された被写体に応じた検出辞書を用いて(特定被写体が人物である場合は人物検出辞書、特定被写体が犬である場合は犬検出辞書)、特定被写体検出処理を行なう。音声出力および特定被写体検出処理は、被写体の正面顔が検出されるまで繰り返され、その間、特定被写体の状態がST1に遷移した場合に画像の記録を行なう。状態ST1の画像を記録媒体27に記録すると、撮影を終了する。
尚、特定被写体が犬である場合は、音声出力部から出力される音声が音声Bになり、使用する特定被写体検出辞書が犬検出辞書になること以外は上述した処理動作と同一である。
図8は正面顔撮影モード時における撮像装置の処理動作を示すフローチャートである。尚、図2に示すフローチャートと同一の符号を付す部分は、上述した通常撮影モード時と同一の処理動作を行うため、説明は省略する。
ステップS80では、正面顔撮影処理を行う。図9は、ステップS80の正面顔撮影処理の処理動作を示すフローチャートである。正面顔撮影処理は、次のサブルーチンに従って実行される。
ステップS90では、被写体検出処理によって特定被写体を検出されたか否かを判別する。特定被写体が検出された場合はステップS92に進み、そうでない場合はステップS19に進む。
ステップS92では、被写体の状態がST1(正面顔)であるか否かを判別する。被写体の状態がST1である場合はステップS19に進み、そうでない場合はステップS94に進む。
ステップS94では、ステップS90で検出された被写体の種類に応じて出力する音声を決定し、音声出力部31から出力する。音声を出力したらステップS92に戻る。
尚、上述した実施の形態では、シャッタボタン21sが全押しされた後の特定被写体検出処理において、特定被写体が検出されなかった場合、そのまま画像を記録するようにしているが、例えば、シャッタボタン21s全押し後、所定期間は被写体検出処理を繰り返し、当該期間内に特定被写体が検出された場合は、上述した正面顔撮影処理を行うようにしてもよい。
上述した実施の形態では、特定被写体の状態がST1である時の画像のみを記録するようにしているが、特定被写体が正面顔になるまでの間、所定のタイミング毎(例えば、所定時間毎、被写体の状態が遷移する毎、等)に画像の記録を行なうようにしても良い。
また、予め所定の被写体の顔に関する情報と所定の音声Dをメモリ19又は記録媒体27に記憶しておき、特定被写体が検出された場合、類似度判定によって該特定被写体が予め記録されている所定の被写体と類似すると判定された場合は音声Dを出力するようにしても良い。
また、上述した実施の形態では、撮影が完了するまでの間、継続的に状態判別を行うようにしているが、例えば、10フレーム毎など、断続的に状態判別を行うようにしても良い。音声出力についても同様に、継続的に出力するようにしても良いし、断続的に出力するようにしても良い。
また、撮影領域から複数の特定被写体が検出された場合は、全ての特定被写体が正面顔になった瞬間の画像を記録するようにしても良いし、いずれか一方の特定被写体が正面顔になった瞬間の画像を記録するようにしても良い。
或いは、予め特定被写体に優先度を設定し、優先度の高い特定被写体が正面を向いた瞬間の画像を記録するようにしても良いし、撮影領域の中央部に近い位置に存在する特定被写体が正面顔になった瞬間の画像を記録するようにしても良い。
また、上述した画像を記録するタイミングを撮影者が任意で選択、設定できるようにしてもよい。
また、人物と犬の両方が撮影領域から検出された場合は、音声Aと音声Bを同時に出力するようにしてもよいし、音声Aと音声Bを交互に出力するようにしてもよい。
或いは、人物と犬の両方が検出された場合に出力する音声を別途用意しても良い。
また、上述した実施例と同様の手法で、例えば、横顔や後ろ顔などを確実に撮影することもできる。
また、上述した実施例では被写体の状態がST1(正面顔)の画像を記録するようにしているが、例えば、被写体の状態がST2(横顔)の画像やST5(傾き顔)の画像を記録し、その時点で撮影を終了するようにしてもよい。
また、被写体がどのような状態の画像を記録するかをユーザーが任意で設定できるようにしても良い。
<実施例2>
次に、本発明を静止画の撮影が可能なデジタルカメラ等の撮像装置に実施した第2の実施の形態について、図面を参照して説明する。当該撮像装置は静止画を撮影できるものであれば、動画の撮影が可能なものであっても構わない。
図10は本発明の第2の実施形態にかかる撮像装置の構成の概略を示すブロック図である。尚、図1に示したブロック図と同一の符号を付す箇所は、上述した説明と同一の処理動作を行うため、その説明は省略する。
撮像装置は、人物の顔を検出する顔検出部7bと、顔検出部7bで検出された顔がどの動物に類似しているかを判定する類似度判定部7cを備える。また、撮像装置は動物を検出するための動物検出辞書(図示せず。)を更に備える。本実施例における動物検出辞書は犬を検出するための犬検出辞書、及び猫を検出するための猫検出辞書を備えているものとする。
図11は、撮像装置が捉えている撮影領域を示している。ユーザが操作部21を操作することで、撮影モードが正面顔撮影モードに設定され、シャッタボタン21sが半押しされると、撮像装置はAE調整、AF最適化処理を行なう。その後、シャッタボタン21sが全押しされるとプレビュー画像に対して顔検出処理を行ない、当該検出結果を類似度判定部7cに出力する。例えば、図11に示すようなプレビュー画像である場合、横顔辞書により人物の横顔が検出され、当該検出結果が類似度判定部7cに出力される。
図12は、類似度判定部7cの内部構成の概略を示すブロック図である。類似度判定部7cは、部分画像と動物を検出するための動物検出辞書の類似度を導出する類似度導出部74、類似度導出結果に基づき、類似度の比較を行い、顔検出処理によって検出された顔がどの動物に最も類似しているかを判定する類比較判定部75、類似度比較部75による比較結果をCPU17に出力する比較結果出力部76を備える。
類似度導出部7cは、部分画像と各動物検出辞書との類似度を導出し、類似度判定部75に出力する。類似度比較部75は、類似度導出部74で導出された類似度に基づき、当該人物がどの動物に最も類似しているか(本実施例では、犬または猫のどちらに類似しているか)を比較する。比較結果出力部76は、その比較結果をCPU17に出力する。
CPU17は比較結果出力部76から出力された比較結果に基づき、出力する音声を決定する。音声はメモリ19に記憶させておいても良いし、記録媒体27に記憶させておいてもよい。
その後、顔検出処理によって検出された人物の顔が、犬に類似していると判定された場合は、例えば、「ワン、ワン」という犬の鳴き声など、犬に関係する音声B、猫に類似していると判定された場合は「ニャー、ニャー」という猫の鳴き声など、猫に関係する音声Cが、音声出力部31から出力される。特定被写体検出部7aは所定期間毎に生成される各プレビュー画像に対して顔検出処理を行ない、検出された被写体が人物である場合は人物検出辞書、犬である場合は犬検出辞書、猫である場合は猫検出辞書を用いて、被写体の顔の状態がST1(即ち、正面顔)であるか否かを判別する。被写体の顔の状態がST1であると判断されると、その瞬間の画像を記録媒体27に記録し、音声出力を終了する。音声出力および顔検出処理は、状態ST1が検出されるまで繰り返される。
図13は本発明の第2の実施の形態における正面顔撮影モード時における撮像装置の処理動作を示すフローチャートである。尚、図2に示すフローチャートと同一の符号を付す部分は、上述した通常撮影モード時と同一の処理動作を行うため、説明は省略する。
ステップS130では、人物検出辞書により、人物の顔を検出したか否かを判別する。人物の顔を検出した場合はステップS132に進み、そうでない場合はステップS19に進む。
ステップS132では、ステップS130で検出した顔と各動物検出辞書との類似度を導出し、ステップS134では、ステップS132で導出した類似度に基づき、ステップS130で検出した顔がどの動物に最も類似しているかを判定する。ステップS136では、ステップS134の判定結果に応じて出力する音声を決定し、音声出力部31から音声を出力する。
ステップS138では、ステップS130で検出した顔が状態ST1であるか否かを判別する。状態ST1である場合はステップS19に進み、そうでない場合は、ステップS136に戻る。
上述した実施例は、特定被写体の顔の状態がST1になるまで音声を出力し続けるようにしているが、所定期間が経過しても状態ST1にならない場合、音声出力を終了し、正面顔撮影処理を中止するようにしてもよい。
また、顔検出処理によって検出された状態に応じて類似度導出に使用する辞書を制限するようにしても良い。即ち、例えば、顔検出処理によって検出された顔の状態がST2であれば、横顔辞書のみを使用して類似度を導出し、顔の状態がST3であれば、傾き顔辞書のみを使用して類似度を導出するようにする。そうすることで、類似度判定の処理量が低下し、より短時間で類似度判定を行なうことができる。
また、本実施の形態では、検出した人物の顔がどの動物検出辞書を動物に最も類似しているかを判定しているが、動物以外の物体を検出するための辞書を用意し、当該辞書と検出した人物の顔との類似性を判定するようにしても良い。
また、本実施の形態では、被写体の顔が状態ST1、即ち正面顔になるまで撮影は行わないため、顔検出後に該顔の状態を判別するのではなく、正面顔辞書のみを用いて顔検出を行い、顔が検出された時に撮影を行うようにしてもよい。
また、実施例1と同様に予め所定の被写体の顔に関する情報と所定の音声Dをメモリ19又は記録媒体27に記憶しておき、特定被写体が検出された場合、類似度判定によって該特定被写体が予め記録されている所定の被写体と類似すると判定された場合は音声Dを出力するようにしても良い。
また、撮影領域から複数の特定被写体が検出された場合は、全ての特定被写体が正面顔になった瞬間の画像を記録するようにしても良いし、いずれか一方の特定被写体が正面顔になった瞬間の画像を記録するようにしても良い。
或いは、予め特定被写体に優先度を設定し、優先度の高い特定被写体が正面を向いた瞬間の画像を記録するようにしても良いし、撮影領域の中央部に近い位置に存在する特定被写体が正面顔になった瞬間の画像を記録するようにしても良い。
また、上述した画像を記録するタイミングを撮影者が任意で選択、設定できるようにしてもよい。
また、撮影領域から複数の人物が検出され、検出された人物がそれぞれ異なる動物と類似していると判定された場合は、各判定結果に対応する音声を同時に出力するようにしてもよいし、各音声を交互に出力するようにしてもよい。或いは、上述した様な状況の際に出力する音声を別途用意しても良い。
以上、本発明の一実施例について説明したが、本発明はこれらの実施例に限定されず、その要旨の範囲内で変形及び変更が可能である。
1 イメージセンサ
3 レンズ部
5 AFE
7 画像処理部
7a 特定被写体検出部
7b 顔検出部
7c 類似度判定部
71 縮小画像生成部
72 被写体判定部
73 判定結果出力部
74 類似度導出部
75 類似度比較部
76 比較結果出力部
9 圧縮処理部
11 伸長処理部
13 表示部
15 TG
17 CPU
19 メモリ
21 操作部
21s シャッタボタン
23 バス回線
25 バス回線
27 記録媒体
29 ドライバ部

Claims (6)

  1. プレビュー画像から特定被写体を検出する被写体検出手段、
    前記被写体検出手段により検出された被写体の状態を判別する状態判別手段、
    前記特定の被写体が第1の状態ではないと判別された場合に、前記特定被写体に音声を出力する音声出力手段、
    前記特定被写体の状態が前記第1の状態であると判別された場合に撮影を行う撮影手段、
    を備えること特徴とする撮像装置。
  2. 前記状態判別手段は、所定期間毎に繰り返されることを特徴とする請求項1記載の撮像装置。
  3. 前記音声出力手段は、前記撮影手段による撮影が完了するまで音声出力を継続することを特徴とする請求項1乃至2いずれかに記載の撮像装置。
  4. 前記音声出力手段は、前記撮影手段による撮影が完了するまでの間、音声出力を断続的に行うことを特徴とする請求項1乃至2いずれかに記載の撮像装置。
  5. 前記特定の被写体の種類を判別する被写体判別手段、
    前記被写体判別手段による判別結果に応じて、出力する音声の種類を決定する音声決定手段、
    を更に備えることを特徴とする請求項1乃至4いずれかに記載の撮像装置。
  6. 前記被写体検出手段は、プレビュー画像から人物の顔を検出する顔検出手段、
    前記人物の顔と類似する動物を選択する選択手段、
    前記判定結果に応じた音声を出力する音声出力手段とを備え、
    前記音声出力手段は選択された動物に応じた音声を出力することを特徴とする請求項1乃至5いずれかに記載の撮像装置。
JP2010026821A 2010-02-09 2010-02-09 撮像装置 Pending JP2011166442A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010026821A JP2011166442A (ja) 2010-02-09 2010-02-09 撮像装置
CN2011100350586A CN102148931A (zh) 2010-02-09 2011-01-30 摄像装置
US13/024,126 US20110193986A1 (en) 2010-02-09 2011-02-09 Image sensing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010026821A JP2011166442A (ja) 2010-02-09 2010-02-09 撮像装置

Publications (1)

Publication Number Publication Date
JP2011166442A true JP2011166442A (ja) 2011-08-25

Family

ID=44353436

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010026821A Pending JP2011166442A (ja) 2010-02-09 2010-02-09 撮像装置

Country Status (3)

Country Link
US (1) US20110193986A1 (ja)
JP (1) JP2011166442A (ja)
CN (1) CN102148931A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012090068A (ja) * 2010-10-19 2012-05-10 Canon Marketing Japan Inc 撮像装置、制御方法及びプログラム
JP2013162240A (ja) * 2012-02-02 2013-08-19 Car Mate Mfg Co Ltd 自動撮影装置
JP2013182325A (ja) * 2012-02-29 2013-09-12 Toshiba Corp 顔登録装置、プログラムおよび顔登録方法
JP2015208029A (ja) * 2015-06-19 2015-11-19 キヤノンマーケティングジャパン株式会社 撮像装置、制御方法及びプログラム
JP2021072597A (ja) * 2019-11-01 2021-05-06 株式会社アップステアーズ 目線撮像方法及び目線撮像システム

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5694097B2 (ja) * 2011-09-08 2015-04-01 オリンパスイメージング株式会社 撮影機器
JP2013110551A (ja) * 2011-11-21 2013-06-06 Sony Corp 情報処理装置、撮像装置、情報処理方法およびプログラム
KR101545883B1 (ko) 2012-10-30 2015-08-20 삼성전자주식회사 단말의 카메라 제어 방법 및 그 단말
KR20140099111A (ko) * 2013-02-01 2014-08-11 삼성전자주식회사 카메라 장치의 동작을 제어하는 방법 및 상기 카메라 장치
KR102032347B1 (ko) 2013-02-26 2019-10-15 삼성전자 주식회사 이미지 센서 위치를 이용한 이미지 영역 설정 장치 및 방법
CN104469127B (zh) * 2013-09-22 2019-10-18 南京中兴软件有限责任公司 拍摄方法和装置
CN104486548B (zh) * 2014-12-26 2018-12-14 联想(北京)有限公司 一种信息处理方法及电子设备
JP6682222B2 (ja) * 2015-09-24 2020-04-15 キヤノン株式会社 検知装置及びその制御方法、コンピュータプログラム
CN108074224B (zh) * 2016-11-09 2021-11-05 生态环境部环境规划院 一种陆生哺乳动物与鸟类的监测方法及其监测装置
TWI662438B (zh) * 2017-12-27 2019-06-11 緯創資通股份有限公司 防止危險自拍之方法、裝置、及儲存媒體
JP7623105B2 (ja) * 2020-03-31 2025-01-28 株式会社小松製作所 作業機械および検出方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009212980A (ja) * 2008-03-05 2009-09-17 Sony Corp 撮像装置、その制御方法およびプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3683113A (en) * 1971-01-11 1972-08-08 Santa Rita Technology Inc Synthetic animal sound generator and method
JP2006319610A (ja) * 2005-05-12 2006-11-24 Matsushita Electric Ind Co Ltd 撮像装置
JP4787180B2 (ja) * 2007-01-24 2011-10-05 富士フイルム株式会社 撮影装置及び撮影方法
JP4976160B2 (ja) * 2007-02-22 2012-07-18 パナソニック株式会社 撮像装置
JP4600435B2 (ja) * 2007-06-13 2010-12-15 ソニー株式会社 画像撮影装置及び画像撮影方法、並びにコンピュータ・プログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009212980A (ja) * 2008-03-05 2009-09-17 Sony Corp 撮像装置、その制御方法およびプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012090068A (ja) * 2010-10-19 2012-05-10 Canon Marketing Japan Inc 撮像装置、制御方法及びプログラム
JP2013162240A (ja) * 2012-02-02 2013-08-19 Car Mate Mfg Co Ltd 自動撮影装置
JP2013182325A (ja) * 2012-02-29 2013-09-12 Toshiba Corp 顔登録装置、プログラムおよび顔登録方法
JP2015208029A (ja) * 2015-06-19 2015-11-19 キヤノンマーケティングジャパン株式会社 撮像装置、制御方法及びプログラム
JP2021072597A (ja) * 2019-11-01 2021-05-06 株式会社アップステアーズ 目線撮像方法及び目線撮像システム

Also Published As

Publication number Publication date
US20110193986A1 (en) 2011-08-11
CN102148931A (zh) 2011-08-10

Similar Documents

Publication Publication Date Title
JP2011166442A (ja) 撮像装置
JP4804398B2 (ja) 撮像装置及び撮影方法
TWI330747B (en) Image capture apparatus and auto focus control method
JP4746295B2 (ja) デジタルカメラおよび撮影方法
US9894280B2 (en) Imaging apparatus for displaying selected face in in-focus state and method for controlling imaging apparatus
JP4674471B2 (ja) デジタルカメラ
US20080181460A1 (en) Imaging apparatus and imaging method
KR20080012790A (ko) 얼굴 검출 장치, 촬상 장치 및 얼굴 검출 방법
JP2011097576A (ja) 撮像装置
JP4839908B2 (ja) 撮像装置、自動焦点調整方法、およびプログラム
JP2010136223A (ja) 撮像装置及び撮像方法
TW201119365A (en) Image selection device and method for selecting image
JP2011010275A (ja) 画像再生装置及び撮像装置
JP4974812B2 (ja) 電子カメラ
JP4127521B2 (ja) ディジタル・カメラおよびその制御方法
JP2011182252A (ja) 撮像装置および画像撮影方法
JP2010103972A (ja) 画像処理装置及び電子機器
JP2010028608A (ja) 画像処理装置、撮像装置、再生装置及び画像処理方法
JP5375846B2 (ja) 撮像装置、自動焦点調整方法、およびプログラム
JP2009124644A (ja) 画像処理装置、撮像装置及び画像再生装置
KR20120080376A (ko) 디지털 영상 촬영 장치 및 이의 제어 방법
KR20110090610A (ko) 디지털 촬영 장치, 그 제어 방법, 및 컴퓨터 판독가능 매체
JP2010199681A (ja) 画像処理装置、および画像処理プログラム
JP4806471B2 (ja) 撮像装置
JP4806470B2 (ja) 撮像装置

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20111117

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20111130

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130116

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20130404

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131022

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140701