JP7536464B2 - IMAGE PROCESSING APPARATUS, IMAGING APPARATUS, IMAGE PROCESSING METHOD, AND PROGRAM - Google Patents
IMAGE PROCESSING APPARATUS, IMAGING APPARATUS, IMAGE PROCESSING METHOD, AND PROGRAM Download PDFInfo
- Publication number
- JP7536464B2 JP7536464B2 JP2020026506A JP2020026506A JP7536464B2 JP 7536464 B2 JP7536464 B2 JP 7536464B2 JP 2020026506 A JP2020026506 A JP 2020026506A JP 2020026506 A JP2020026506 A JP 2020026506A JP 7536464 B2 JP7536464 B2 JP 7536464B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary data
- likelihood
- subject
- image processing
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 29
- 238000003384 imaging method Methods 0.000 title claims description 27
- 238000003672 processing method Methods 0.000 title claims description 5
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 238000001514 detection method Methods 0.000 claims description 108
- 238000013527 convolutional neural network Methods 0.000 claims description 31
- 238000000034 method Methods 0.000 claims description 15
- 238000009966 trimming Methods 0.000 claims description 3
- 238000013500 data storage Methods 0.000 description 10
- 230000003287 optical effect Effects 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000005375 photometry Methods 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000011514 reflex Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Landscapes
- Studio Devices (AREA)
- Image Analysis (AREA)
Description
本発明は、画像処理装置、撮像装置、画像処理方法およびプログラムに関する。 The present invention relates to an image processing device, an imaging device, an image processing method, and a program.
例えば、デジタルカメラやデジタルビデオカメラ等の撮像装置は、画像から特定の被写体パターンを自動的に検出する画像処理を行う。この画像処理により、人間の顔領域等を特定することができる。関連する技術として特許文献1の技術が提案されている。特許文献1の技術は、顔領域検出の対象となるフレームの画像に対しての変化量が所定内の撮影画像に基づき、AF/AE/WB評価値検出を行う。また、近年では、画像からの被写体の検出に、コンボリューショナル・ニューラル・ネットワーク(以下、CNNとする)が用いられている。CNNに関連する技術が、非特許文献1に開示されている。
For example, imaging devices such as digital cameras and digital video cameras perform image processing to automatically detect specific subject patterns from an image. This image processing makes it possible to identify human face regions and the like. The technology of
被写体の検出に、被辞書データを用いることができる。辞書データは、被写体ごとに生成される。このため、複数種類の被写体を検出する場合、複数の辞書データを順次切り替えながら、被写体検出が行われる。複数の辞書データを順次切り替えて、被写体検出が行われる場合、目的の被写体に適した辞書データを用いて被写体検出を行うまでに要する時間が長くなることがある。また、複数の辞書データの中から、目的の被写体と特性が異なる辞書データを用いて被写体検出が行われた場合、被写体が誤検出されることがある。特に、辞書データの数が多くなると、上記の問題が顕著になる。 Dictionary data can be used to detect subjects. Dictionary data is generated for each subject. Therefore, when detecting multiple types of subjects, subject detection is performed while sequentially switching between multiple dictionary data. When subject detection is performed by sequentially switching between multiple dictionary data, it may take a long time to perform subject detection using dictionary data suitable for the target subject. Furthermore, when subject detection is performed using dictionary data from multiple dictionary data that has different characteristics from the target subject, the subject may be erroneously detected. The above problem becomes particularly noticeable when the number of dictionary data is large.
本発明は、被写体検出を行う際の辞書データの選択を効率的に行うことを目的とする。 The present invention aims to efficiently select dictionary data when performing subject detection.
上記目的を達成するために、本発明の画像処理装置は、撮像された画像データに基いて、被写体の検出に用いられる複数の辞書データのそれぞれについての被写体有無の尤度を推定する推定手段と、推定された前記尤度に応じて設定された辞書データを用いて、前記画像データから被写体を検出する被写体検出手段と、前記被写体検出手段に設定する複数の辞書データを切り替える制御手段と、を備え、前記制御手段は、前記尤度が所定の閾値未満の辞書データ以外の複数の辞書データを切り替えることを特徴とする。 In order to achieve the above-mentioned object, the image processing device of the present invention comprises an estimation means for estimating the likelihood of the presence or absence of a subject for each of a plurality of dictionary data used to detect a subject based on captured image data, a subject detection means for detecting a subject from the image data using dictionary data set according to the estimated likelihood, and a control means for switching between the plurality of dictionary data set in the subject detection means, wherein the control means switches between the plurality of dictionary data other than dictionary data whose likelihood is less than a predetermined threshold value .
本発明によれば、被写体検出を行う際の辞書データの選択を効率的に行うことができる。 According to the present invention, it is possible to efficiently select dictionary data when performing subject detection.
以下、本発明の各実施の形態について図面を参照しながら詳細に説明する。しかしながら、以下の各実施の形態に記載されている構成はあくまで例示に過ぎず、本発明の範囲は各実施の形態に記載されている構成によって限定されることはない。 Each embodiment of the present invention will be described in detail below with reference to the drawings. However, the configurations described in each of the following embodiments are merely examples, and the scope of the present invention is not limited to the configurations described in each of the embodiments.
以下、図面を参照して、本実施形態について説明する。本実施形態の撮像装置100は、複数の撮像光学系により結像された被写体像から画像信号を生成し、被写体検出を行う。図1は、撮像装置100の断面図である。撮像装置100の構成は、図1の例には限定されない。撮像装置100は、カメラ本体101および撮影レンズ102を有する。カメラ本体101は、例えば、デジタル一眼レフカメラ本体である。カメラ本体101の前面に、撮影レンズ102が着脱可能に装着される。撮像装置100は、システム制御部201を有する。システム制御部201は、CPU、RAMおよびROMを含む。例えば、ROMに記憶された制御プログラムがRAMに展開され、CPUが制御プログラムを実行することで、本実施形態の処理が実現されてもよい。CPUは、例えば、複数のタスクを並列処理できるマルチコアCPUであってもよい。
The present embodiment will be described below with reference to the drawings. The
撮影レンズ102は交換可能なレンズである。カメラ本体101と撮影レンズ102とは、マウント接点群115を介して電気的にも接続される。撮影レンズ102の中には、フォーカシングレンズ113および絞りシャッター114が設けられている。マウント接点群115を介した制御により、撮影レンズ102内に取り込む光量およびピントを調整可能なように構成されている。
The photographing
次に、カメラ本体101について説明する。カメラ本体101は、メインミラー103およびサブミラー104により構成されるクイックリターンミラーを有する。メインミラー103は、ハーフミラーであり、ファインダー観測状態では撮影光路上に斜設され、撮影レンズ102から入射される光束をファインダー光学系へと反射する。一方、透過光はサブミラー104を介して測距センサ105へと入射する。測距センサ105は、撮影レンズ102の二次結像面を焦点検出ラインセンサ上に形成することで、位相差検出方式によって撮影レンズ102の焦点調節状態を検出することのできるAF像信号を生成する。生成されたAF像信号はシステム制御部201へ送信される。システム制御部201は、AF像信号に基づいてフォーカシングレンズ113の焦点状態を検出する。また、システム制御部201は、焦点検出の結果に基づいてフォーカシングレンズ113の駆動を制御することで焦点調節を行う。
Next, the
ピント板106は、ファインダー光学系を構成する撮影レンズ102の予定結像面に配置されている。ペンタリズム107は、ファインダー光路を変更するために用いられる。測光センサ108は、照射される光信号から輝度信号および色差信号を持つ画像データを生成する。測光センサ108は、被写体から照射される光信号からAE像信号を生成し、システム制御部201へ送信する。システム制御部201は、受信したAE像信号を用いて露出制御等を行う。システム制御部201は、後述する被写体検出部204にて検出された被写体に基づき、焦点露出を最適化させる。カメラ本体101には、アイピース109が設けられている。撮影者は、アイピース109からピント板106を観察することで、撮影画面および撮影情報を確認することができる。
The focusing
また、カメラ本体101は、フォーカルプレーンシャッター110および撮像センサ111を有する。図2では、フォーカルプレーンシャッター110は、「シャッター」と表記される。露光が行われる際、メインミラー103およびサブミラー104は、撮影光路上から退避し、フォーカルプレーンシャッター110が開く。これにより、撮像センサ111が露光される。フォーカルプレーンシャッター110は、撮影が行われているときには撮像センサ111を遮光する。また、撮影が行われているときには、フォーカルプレーンシャッター110が開かれ、撮像センサ111に被写体光束が導かれる。
The
撮像部としての撮像センサ111は、CCDセンサやCMOSセンサ等で構成される。撮像センサ111は、赤外カットフィルターやローパスフィルター等を含んでもよい。撮像センサ111は、撮影レンズ102の撮影光学系を通過して結像した被写体像を光電変換し、撮影画像を生成するための画像信号をシステム制御部201に送信する。システム制御部201は、受信した画像信号から撮影画像を生成して画像記憶部202に記憶するとともに、LCD等の表示部112に表示する。操作部203は、カメラ本体101に設けられるレリーズボタンやスイッチ、接続機器等を介して行なわれるユーザー操作を検知し、操作内容に応じた信号をシステム制御部201へ送信する。レリーズボタンが半押し操作等されると、レリーズスイッチSW1がオンになり、AFやAE等の撮影準備動作が行われる。レリーズボタンが全押し操作等されると、レリーズスイッチSW2がオンになり、静止画の撮影動作が行われる。表示部112は、撮影した結果をユーザーが確認できるように、直前に撮影した静止画を一定時間、表示する。
The
図2は、システム制御部201と各部との関係を示す図である。制御手段としてのシステム制御部201には、上述した各部が接続されるとともに、被写体検出部204、辞書推定部205および辞書データ記憶部206が接続される。被写体検出部204および辞書推定部205は、システム制御部201の一部であってもよいし、システム制御部201とは別途に設けられてもよい。システム制御部201、被写体検出部204および辞書推定部205により画像処理装置が構成されてもよい。該画像処理装置は、例えば、スマートフォンやタブレット端末等に搭載されてもよい。
FIG. 2 is a diagram showing the relationship between the
被写体検出手段としての被写体検出部204は、機械学習により生成される辞書データに基づいて、被写体検出を行う。本実施形態では、被写体検出部204は、複数種類の被写体を検出するために、被写体ごとの辞書データを用いる。各辞書データは、例えば、対応する被写体の特徴が登録されたデータである。被写体検出部204は、被写体ごとの辞書データを順次切り替えながら被写体検出を行う。本実施形態では、被写体ごとの辞書データは辞書データ記憶部206に記憶される。従って、辞書データ記憶部206には、複数の辞書データが記憶される。システム制御部201は、複数の辞書データの中から何れの辞書データを用いて被写体検出を行うかを、辞書推定部205の推定結果に基づいて、決定する。
The
辞書推定部205は、画像データに基いて、辞書データごとの被写体有無の尤度を推定する。辞書データ記憶部206には、被写体ごとの辞書データが記憶されている。辞書推定部205は、画像中に、何れの被写体が含まれているかを推定するために、辞書データごとの被写体有無の尤度を推定結果として出力する。被写体検出部204は、撮像された画像データと推定された辞書データとに基づいて、画像中の被写体の位置を推定する。被写体検出部204は、被写体の位置やサイズ、信頼度等を推定して、推定した情報を出力してもよい。被写体検出部204は、他の情報を出力してもよい。
The
辞書データとしては、例えば、被写体として「人物」を検出するための辞書データや「動物」を検出するための辞書データ、「乗物」を検出するための辞書データ等がある。また、「人物の全体」を検出するための辞書データと「人物の顔」を検出するための辞書データとが別個に辞書データ記憶部206に記憶されていてもよい。辞書推定部205は、画像データに基いて、例えば、「人物」と「動物」と「乗物」とのそれぞれの辞書データについての被写体有無の尤度を確率として出力する。
The dictionary data includes, for example, dictionary data for detecting "people" as a subject, dictionary data for detecting "animals", and dictionary data for detecting "vehicles". Furthermore, dictionary data for detecting "the whole person" and dictionary data for detecting "a person's face" may be stored separately in the dictionary
被写体検出部204は、尤度が高い辞書データを用いて、画像データから被写体検出を行う。本実施形態では、辞書推定部205は、機械学習されたCNNにより構成され、辞書データごとの尤度を出力する。被写体検出部204は、機械学習されたCNNにより構成され、画像データに含まれる被写体の位置等を推定する。本実施形態では、被写体検出部204および辞書推定部205は、それぞれ異なるCNN(コンボリューショナル・ニューラル・ネットワーク)により構成される。被写体検出部204および辞書推定部205は、GPU(グラフィックス・プロセッシング・ユニット)やCNNによる推定処理に特化した回路で実現されてもよい。
The
CNNの機械学習は、任意の手法で行われ得る。例えば、サーバ等の所定のコンピュータが、CNNの機械学習を行い、撮像装置100は、学習されたCNNを、所定のコンピュータから取得してもよい。例えば、所定のコンピュータが、学習用の画像データを入力とし、学習用の画像データに対応する被写体の位置等を教師データとした教師あり学習を行うことで、被写体検出部204のCNNの学習が行われてもよい。また、所定のコンピュータが、学習用の画像データを入力とし、学習用の画像データの被写体に対応する辞書データを教師データとした教師あり学習を行うことで、辞書推定部205のCNNの学習が行われてもよい。以上により、学習済みのCNNが生成される。CNNの学習は、撮像装置100または上述した画像処理装置で行われてもよい。
The machine learning of the CNN may be performed by any method. For example, a specific computer such as a server may perform machine learning of the CNN, and the
次に、本実施形態の処理の流れについて説明する。図3は、本実施形態の処理の流れを示すフローチャートである。図3のステップS301からステップS310までの一連の処理は、撮像装置100による1フレーム分(1枚の画像データ)に相当する処理である。ステップS301では、システム制御部201は、レリーズスイッチSW1またはレリーズスイッチSW2がオンになっているかを判定する。システム制御部201は、ステップS301でYesと判定した場合、フレームを1つ進めるとともに、処理をステップS302に進める。システム制御部201は、ステップS301でNoと判定した場合、処理を終了させる。
Next, the process flow of this embodiment will be described. FIG. 3 is a flowchart showing the process flow of this embodiment. A series of processes from step S301 to step S310 in FIG. 3 corresponds to one frame (one piece of image data) by the
ステップS302では、システム制御部201は、測光センサ108に電荷蓄積を行わせ、生成された像信号をAE像信号として読み出すとともに、測距センサ105に電荷蓄積を行わせ、生成された像信号をAF像信号として読み出す。図3では、AE像信号およびAF像信号は、像信号と表記される。ステップS303では、辞書推定部205は、ステップS302で読み出したAE像信号を入力画像として、辞書データごとに被写体有無の尤度を出力する。ステップS304では、システム制御部201は、辞書推定部205が出力した各辞書データのそれぞれの尤度に基づき辞書データを選定し、被写体検出のための辞書データとして設定する。システム制御部201は、例えば、尤度が最も高い1つの辞書データのみを選定してもよいし、尤度が所定の閾値より大きい複数の辞書データを選定してもよい。
In step S302, the
ステップS305では、被写体検出部204は、ステップS302で読み出したAE像信号を入力画像として、ステップS304で設定された辞書データを用いて、被写体検出を行う。このとき、被写体検出部204は、検出した被写体の位置やサイズ、信頼度等の情報を出力する。このとき、システム制御部201は、被写体検出部204が出力した上記の情報を表示部112に表示させてもよい。また、システム制御部201は、辞書推定部205が出力した各辞書データのそれぞれの尤度の情報を表示部112に表示させてもよい。
In step S305, the
ステップS306では、システム制御部201は、ステップS305で検出した被写体の位置に最も近い焦点検出点を選択し、ステップS302で取得したAF像信号を用いて、選択した焦点検出点の焦点状態を検出する。なお、ステップS305で被写体が検出されなかった場合、システム制御部201は、全ての焦点検出点の焦点検出を行った上で、最も撮像装置100に近い位置に焦点がある焦点検出点を選択する。ステップS307では、システム制御部201は、ステップS306で選択された焦点検出点の焦点状態に基づいて、フォーカシングレンズ113の焦点位置を調節する。
In step S306, the
ステップS308では、システム制御部201は、ステップS302で読み出したAE像信号を用いて所定の手法で自動露出演算を行い、絞り値(AV値)やシャッタスピード(TV値)、ISO感度(ISO値)等を決定する。ここでのAV値やTV値、ISO値は、予め記憶されたプログラム線図を用いて決定される。ステップS309では、システム制御部201は、レリーズスイッチSW2がONであるかを判定する。システム制御部201は、ステップS309でYesと判定した場合、処理を、ステップS310に進める。一方、システム制御部201は、ステップS309でNoと判定した場合、処理をステップS302に戻す。
In step S308, the
ステップS310では、システム制御部201は、メインミラー103およびサブミラー104をアップすることで光路上から退避させ、撮像センサ111を露光させて、撮像を行う。露光された撮像センサ111は、画像信号を生成し、生成された画像信号をシステム制御部210に送信する。そして、システム制御部210は、撮像センサ111から受信した画像信号に基づいて画像データを生成し、画像記憶部202に記憶するとともに、表示部112に画像を表示する。
In step S310, the
次に、辞書データの切り替えについて説明する。システム制御部201は、辞書推定部205が推定した辞書データごとの尤度に基づいて、被写体検出部204に辞書データを設定する。本実施形態では、システム制御部201は、辞書データごとの尤度に基づいて、被写体検出部204に設定する辞書データの順番および周期を設定する。図4は、辞書データの切り替えの一例を示す図である。図4の例では、辞書データ記憶部206に3つの辞書データ(辞書データ1~辞書データ3)が記憶されているものとする。ただし、辞書データ記憶部206には、多くの辞書データが記憶されていてもよい。
Next, switching of dictionary data will be described. The
図4(a)は、被写体検出部204に設定する辞書データを逐次的に切り替える例を示す。図4に示される「辞書n(nは1~3)の検出」は、被写体検出部204が、辞書nを用いて被写体検出を行う時間を示す。「画像」は、画像データを取得する時間を示す。図4(a)の例では、辞書データ1、辞書データ2、辞書データ3の周期で、辞書データが逐次的に均等に切り替えられる。ここで、目的の被写体に対応する辞書データが、辞書データ3であるとする。この場合、辞書データ3を用いた被写体検出は、辞書データ1を用いた被写体検出および辞書データ2を用いた被写体検出の後に行われる。従って、辞書データ3を用いた被写体検出が行われるまでの時間が長くなる。特に、辞書データ記憶部206に記憶されている辞書データの数が多くなると、目的の被写体に対応する辞書データを用いた被写体検出が行われるまでの時間が非常に長くなる可能性がある。
FIG. 4A shows an example of sequentially switching dictionary data set in the
そこで、本実施形態では、システム制御部201は、辞書データ記憶部206に記憶されている各辞書データのそれぞれの尤度に応じて、辞書データの切り替えを行う。システム制御部201は、辞書推定部205が推定した尤度が所定の閾値未満の辞書データを、被写体検出部204に設定する対象から除外する。そして、システム制御部201は、辞書データの切り替えを行う際、推定された尤度が高い辞書データを被写体検出部204に設定する順番の優先度を高くするとともに切り替えの周期を短くする。
Therefore, in this embodiment, the
つまり、システム制御部201は、辞書データの尤度が高くなるに応じて、被写体検出部204に設定する順番が早くなるように、切り替えのスケジューリングを行う。また、システム制御部201は、辞書データの尤度が高くなるに応じて、被写体検出部204に設定する辞書データの切り替えの周期が短くなるように、切り替えのスケジューリングを行う。システム制御部201は、被写体検出部204に設定する辞書データの順番の制御と、辞書データの切り替えの周期の制御とのうち何れか一方のみを行ってもよいし、両方を行ってもよい。本実施形態では、順番の制御と周期の制御との両方が行われるものとして説明する。
In other words, the
図4(b)は、システム制御部201が行う辞書データの切り替えの制御の一例を示す。辞書推定部205は、辞書データ1の尤度が0%、辞書データ2の尤度が40%、辞書データ3の尤度が80%であると推定したとする。ここで、上述した所定の閾値が30%として設定されているとする。システム制御部201は、尤度が所定の閾値未満である辞書データ1を、被写体検出部204に設定する対象から除外する。このため、システム制御部201は、尤度が所定の閾値未満である辞書データ以外の辞書データ2と辞書データ3との切り替え制御が行われる。尤度の低い辞書データが被写体検出部204に設定する対象から除外されることで、目的とする被写体の検出に適していない辞書データが用いられることが抑制される。これにより、被写体の誤検出が低減される。
Figure 4 (b) shows an example of dictionary data switching control performed by the
そして、図4(b)に示されるように、システム制御部201は、3つの辞書データのうち最も尤度が高い辞書データ3を、最初に、被写体検出部204に設定する。そして、システム制御部201は、次に尤度が高い辞書データ2を、被写体検出部204に設定する。これにより、システム制御部201は、辞書データの切り替えについての順番の制御を行う。そして、システム制御部201は、システム制御部201は、辞書データ3を連続して被写体検出部204に設定する。これにより、システム制御部201は、辞書データの切り替えについての周期の制御を行う。つまり、システム制御部201は、被写体検出部204に設定する辞書データを切り替える際、尤度が高い辞書データ3の順番を早くし、切り替えの周期を短くする。推定された尤度が最も高い辞書データ3は、目的とする被写体の検出に適している可能性が高い。システム制御部201が、上述した順番の制御および周期の制御を行うことで、目的とする被写体を検出するまでの時間を短縮することができる。
As shown in FIG. 4B, the
また、システム制御部201は、各辞書データの尤度に応じて、被写体検出部204が被写体を検出するための閾値(信頼度の閾値)を変更してもよい。例えば、被写体検出部204に設定された辞書データの尤度が低い場合、システム制御部201は、被写体検出のための信頼度の閾値を高く設定する。これにより、尤度が低い辞書データを用いた被写体の検出がされにくくなる。一方、被写体検出部204に設定された辞書データの尤度が高い場合、システム制御部201は、被写体検出のための信頼度の閾値を高く設定する。これにより、被写体検出部204は、尤度が高い辞書データを用いて、被写体の検出を行いやすくなる。
The
また、システム制御部201は、推定された尤度が高い辞書データを被写体検出部204に設定したにもかかわらず、被写体検出部204が被写体を検出できなかった場合、被写体検出部204に入力する画像を加工してもよい。加工する手法としては、例えば、被写体検出をしやすくするためのトリミング処理が適用される。システム制御部201は、入力された画像データを、画像中心基準でトリミング処理を行ってもよい。これにより、画像データにおける被写体のサイズを大きくすることができ、被写体検出部204は、被写体を検出しやすくなる。
Furthermore, if the
上述したように、辞書推定部205は、撮像された画像データに、複数種類の被写体の何れの被写体が存在するかを推定するために、辞書データごとの被写体有無の尤度を推定する。また、被写体検出部204は、画像データの中の何れの位置に被写体が存在するかを推定する。このため、辞書推定部205の推定結果よりも被写体検出部204の推定結果の方が、時間的に変化しやすい。そこで、被写体検出部204の処理周期は、辞書推定部205の処理周期よりも短いことが好ましい。
As described above, the
上述したように、被写体検出部204および辞書推定部205は、機械学習により学習されたCNN(学習済みのCNN)により構成される。被写体検出部204は、画像データを入力として、被写体の位置やサイズ、信頼度等を推定し、推定した情報を出力する。辞書推定部205は、画像データを入力として、各辞書データの尤度を推定し、推定した尤度の情報を出力する。CNNは、例えば、畳み込み層とプーリング層とが交互に積層された層構造に、全結合層および出力層が結合されたネットワークであってもよい。この場合、CNNの学習としては、例えば、誤差逆伝搬法等が適用され得る。また、CNNは、特徴検出層(S層)と特徴統合層(C層)とをセットとした、ネオコグニトロンのCNNであってもよい。この場合、CNNの学習としては、「Add-if Silent」と称される学習手法が適用され得る。
As described above, the
なお、被写体検出部204のCNNと辞書推定部205のCNNとは、学習済み係数パラメータ等が異なるものであってよい。この場合、被写体検出部204のCNNと辞書推定部205のCNNとで学習済み係数パラメータが切り替えられてもよい。また、被写体検出部204のCNNと辞書推定部205のCNNとは、異なるネットワーク構成であってもよい。
The CNN of the
また、被写体検出部204および辞書推定部205には、学習済みのCNN以外の任意の学習済みモデルが用いられてもよい。例えば、サポートベクタマシンや決定木等の機械学習により生成される学習済みモデルが、被写体検出部204および辞書推定部205に適用されてもよい。また、被写体検出部204および辞書推定部205は、機械学習により生成される学習済みモデルでなくてもよい。例えば、被写体検出部204には、機械学習を用いない任意の被写体検出手法が適用されてもよい。辞書推定部205には、尤度を出力する関数等が適用されてもよい。
In addition, any trained model other than a trained CNN may be used for the
以上説明したように、辞書推定部205の推定により、複数の辞書データから、目的の被写体に適した辞書データを被写体検出部204に設定することができる。そして、被写体検出部204は、目的の被写体に適した辞書データを用いて、被写体検出を行う。これにより、目的の被写体を検出するまでの時間が短縮され、被写体の誤検出を抑制することができる。その結果、被写体検出を行う際の辞書データの選択を効率的に行うことができる。
As described above, the
以上、本発明の好ましい実施の形態について説明したが、本発明は上述した各実施の形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。本発明は、上述の各実施の形態の1以上の機能を実現するプログラムを、ネットワークや記憶媒体を介してシステムや装置に供給し、そのシステム又は装置のコンピュータの1つ以上のプロセッサがプログラムを読み出して実行する処理でも実現可能である。また、本発明は、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。 Although the preferred embodiments of the present invention have been described above, the present invention is not limited to the above-mentioned embodiments, and various modifications and variations are possible within the scope of the gist of the present invention. The present invention can also be realized by supplying a program that realizes one or more functions of the above-mentioned embodiments to a system or device via a network or storage medium, and having one or more processors of a computer in the system or device read and execute the program. The present invention can also be realized by a circuit (e.g., an ASIC) that realizes one or more functions.
100 撮像装置
111 撮像センサ
201 システム制御部
204 被写体検出部
205 辞書推定部
206 辞書データ記憶部
100
Claims (15)
推定された前記尤度に応じて設定された辞書データを用いて、前記画像データから被写体を検出する被写体検出手段と、
前記被写体検出手段に設定する複数の辞書データを切り替える制御手段と、
を備え、
前記制御手段は、前記尤度が所定の閾値未満の辞書データ以外の複数の辞書データを切り替えることを特徴とする画像処理装置。 an estimation means for estimating a likelihood of the presence or absence of a subject for each of a plurality of dictionary data used for detecting the subject based on captured image data;
an object detection means for detecting an object from the image data by using dictionary data set according to the estimated likelihood;
A control means for switching between a plurality of dictionary data to be set in the object detection means;
Equipped with
The image processing device according to the present invention, wherein the control means switches between a plurality of dictionary data other than the dictionary data whose likelihood is less than a predetermined threshold value .
推定された前記尤度に応じて設定された辞書データを用いて、前記画像データから被写体を検出する被写体検出手段と、
前記被写体検出手段に設定する複数の辞書データを切り替える制御手段と、
を備え、
前記制御手段は、前記被写体検出手段に設定する複数の辞書データを切り替える順番と周期とのうち何れか一方または両方を、前記尤度に応じて変更することを特徴とする画像処理装置。 an estimation means for estimating a likelihood of the presence or absence of a subject for each of a plurality of dictionary data used for detecting the subject based on captured image data;
an object detection means for detecting an object from the image data by using dictionary data set according to the estimated likelihood;
A control means for switching between a plurality of dictionary data to be set in the object detection means ;
Equipped with
The image processing device according to claim 1, wherein the control means changes either one or both of an order and a cycle for switching between a plurality of dictionary data sets set in the subject detection means in accordance with the likelihood .
前記被写体検出手段は、前記学習済みモデルとは異なる学習済みモデルを用いて前記被写体を検出することを特徴とする請求項1乃至8のうち何れか1項に記載の画像処理装置。 The estimation means estimates the likelihood using a trained model;
The image processing device according to claim 1 , wherein the object detection means detects the object using a trained model different from the trained model.
請求項1乃至11のうち何れか1項に記載の画像処理装置と、
を備えることを特徴とする撮像装置。 An imaging unit;
An image processing device according to any one of claims 1 to 11 ,
An imaging device comprising:
推定された前記尤度に応じて設定された辞書データを用いて、前記画像データから被写体を検出する工程と、
前記画像データから被写体を検出する工程に設定する複数の辞書データを切り替える制御工程と、
を備え、
前記制御工程は、前記尤度が所定の閾値未満の辞書データ以外の複数の辞書データを切り替えることを特徴とする画像処理方法。 estimating a likelihood of the presence or absence of an object for each of a plurality of dictionary data used for detecting the object based on the captured image data;
detecting a subject from the image data by using dictionary data set according to the estimated likelihood;
a control step of switching between a plurality of dictionary data sets to be set in the step of detecting a subject from the image data;
Equipped with
The image processing method , wherein the control step switches between a plurality of dictionary data other than the dictionary data whose likelihood is less than a predetermined threshold value .
推定された前記尤度に応じて設定された辞書データを用いて、前記画像データから被写体を検出する工程と、detecting a subject from the image data by using dictionary data set according to the estimated likelihood;
前記画像データから被写体を検出する工程に設定する複数の辞書データを切り替える制御工程と、a control step of switching between a plurality of dictionary data sets to be set in the step of detecting a subject from the image data;
を備え、Equipped with
前記制御工程は、前記画像データから被写体を検出する工程に設定する複数の辞書データを切り替える順番と周期とのうち何れか一方または両方を、前記尤度に応じて変更することを特徴とする画像処理方法。The image processing method is characterized in that the control step changes either one or both of the order and period of switching between multiple dictionary data set in a step of detecting a subject from the image data, depending on the likelihood.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020026506A JP7536464B2 (en) | 2020-02-19 | 2020-02-19 | IMAGE PROCESSING APPARATUS, IMAGING APPARATUS, IMAGE PROCESSING METHOD, AND PROGRAM |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020026506A JP7536464B2 (en) | 2020-02-19 | 2020-02-19 | IMAGE PROCESSING APPARATUS, IMAGING APPARATUS, IMAGE PROCESSING METHOD, AND PROGRAM |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021132298A JP2021132298A (en) | 2021-09-09 |
JP7536464B2 true JP7536464B2 (en) | 2024-08-20 |
Family
ID=77551332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020026506A Active JP7536464B2 (en) | 2020-02-19 | 2020-02-19 | IMAGE PROCESSING APPARATUS, IMAGING APPARATUS, IMAGE PROCESSING METHOD, AND PROGRAM |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7536464B2 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011086261A (en) | 2009-10-19 | 2011-04-28 | Canon Inc | Information processing apparatus and information processing method |
JP2019186911A (en) | 2018-04-10 | 2019-10-24 | キヤノン株式会社 | Image processing apparatus, image processing method, and imaging apparatus |
JP2020008899A (en) | 2018-07-02 | 2020-01-16 | キヤノン株式会社 | Image processing device, image processing method, program and storage medium |
-
2020
- 2020-02-19 JP JP2020026506A patent/JP7536464B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011086261A (en) | 2009-10-19 | 2011-04-28 | Canon Inc | Information processing apparatus and information processing method |
JP2019186911A (en) | 2018-04-10 | 2019-10-24 | キヤノン株式会社 | Image processing apparatus, image processing method, and imaging apparatus |
JP2020008899A (en) | 2018-07-02 | 2020-01-16 | キヤノン株式会社 | Image processing device, image processing method, program and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP2021132298A (en) | 2021-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6931369B2 (en) | Image processing device and image processing method, and imaging device | |
JP6742173B2 (en) | Focus adjusting device and method, and imaging device | |
CN107645632B (en) | Focus adjustment device, focus adjustment method, imaging device, and storage medium | |
JP5003529B2 (en) | Imaging apparatus and object detection method | |
JP6812387B2 (en) | Image processing equipment and image processing methods, programs, storage media | |
US9615019B2 (en) | Image capturing apparatus and control method for image capturing apparatus with particle filter for main object detection and selecting focus detection area based on priority | |
JP2009192774A (en) | Focus adjustment device and imaging device | |
US10896350B2 (en) | Image processing apparatus, image processing method, and image capture apparatus | |
JP7630272B2 (en) | Image processing device and control method thereof, imaging device, program, and storage medium | |
JP7536464B2 (en) | IMAGE PROCESSING APPARATUS, IMAGING APPARATUS, IMAGE PROCESSING METHOD, AND PROGRAM | |
CN113572951A (en) | Focus adjustment device, imaging device, focus adjustment method, and storage medium | |
JP5448868B2 (en) | IMAGING DEVICE AND IMAGING DEVICE CONTROL METHOD | |
JP5832618B2 (en) | Imaging apparatus, control method thereof, and program | |
JP5359150B2 (en) | Imaging device | |
KR20150104012A (en) | A smart moving image capture system | |
JP4926757B2 (en) | Imaging apparatus and control method | |
JP7600163B2 (en) | IMAGE PROCESSING APPARATUS, IMAGING APPARATUS, CONTROL METHOD, AND PROGRAM | |
JP7566830B2 (en) | Image capture device, image capture device control method, and program | |
CN118633295A (en) | Imaging method, imaging device and program | |
JP2010113130A (en) | Focus detecting device, imaging apparatus, focus detecting method | |
JP6592968B2 (en) | Focus detection apparatus and imaging apparatus | |
JP6592967B2 (en) | Focus detection apparatus and imaging apparatus | |
JP6168831B2 (en) | Optical equipment | |
JP2024004307A (en) | Imaging device and control method thereof, program, and storage medium | |
US20080056703A1 (en) | Image capture methods and systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230216 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240123 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240305 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240430 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240709 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240807 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7536464 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |