JP2022054251A - 生成装置、生成方法、およびプログラム - Google Patents
生成装置、生成方法、およびプログラム Download PDFInfo
- Publication number
- JP2022054251A JP2022054251A JP2020161329A JP2020161329A JP2022054251A JP 2022054251 A JP2022054251 A JP 2022054251A JP 2020161329 A JP2020161329 A JP 2020161329A JP 2020161329 A JP2020161329 A JP 2020161329A JP 2022054251 A JP2022054251 A JP 2022054251A
- Authority
- JP
- Japan
- Prior art keywords
- subject
- image
- images
- value
- reliability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
Description
本実施形態では、姿勢推定に用いる被写体画像を、機械学習の結果(学習済みモデル)を用いて抽出するケースにおいて、被写体抽出時の前景に対する確率値を用いて姿勢推定に用いる画像を選択し、被写体の姿勢モデルを推定する方法について述べる。本実施形態の画像処理システムは、複数の撮像装置が異なる方向から撮像することにより得られた複数の画像に基づいて、被写体の姿勢モデルを推定する。
形状モデルは、例えば被写体が人物である場合、被写体のシルエット、輪郭を示し、点群や複数のボクセルで表現されてもよい。また、形状モデルは、複数のポリゴンを含むポリゴンデータとして表現されてもよい。
姿勢モデルは、例えば被写体が人物である場合、その人物の関節位置を表す点と、骨格を表す線とで表現されてもよい。つまり、この場合、姿勢モデルは、複数の点と、2点間を結ぶ線と、を含んでもよい。姿勢モデルは、これに限定されず、それ以外の表現であってもよく、関節位置を示す点のみで表現されていてもよい。また、すべての関節位置が表現されていなくてもよく、一部の関節位置が表現されていてもよい。また、姿勢モデルが、被写体の3次元姿勢を表すものであれば、必ずしも関節位置を点で表現しなくても、いくつか又はすべての関節位置に代えて特徴的な部位を点で表現してもよい。また、人物の顔などの輪郭については、複数の点と直線あるいは曲線で表現してもよいし、球や楕円球で表現してもよい。
本実施形態における画像処理システムの構成例を図1に示す。本実施形態における画像処理システム10は、撮像装置100と姿勢推定装置110とを含む。なお、図1には1台の撮像装置100を示すが、同様の構成の複数の撮像装置100が、無線または有線の接続で姿勢推定装置110に接続されているものとする。また、以下の説明において、「撮像装置」は、「カメラ」と同義に用いられるものとする。
次に、姿勢推定装置110の構成について説明する。まず、姿勢推定装置110の内部構成について、図1を参照して説明する。姿勢推定装置110は、画像取得部111、信頼度算出部112、画像選択部113、姿勢推定部114を有する。
続いて、姿勢推定装置110の動作について説明する。まず、本実施形態における撮影対象とカメラ配置について説明する。図4に、本実施形態における撮影対象とカメラ配置の例を示す。なお、図4並びに後述する図8における参照符号について、番号の後ろに付与したアルファベットのみが異なる符号は、同一機能を持つ装置の別インスタンスを示すものとする。例えば、図4(a)において、カメラ403Aとカメラ403Bは同一の機能を持つ別インスタンスを示している。なお、同一の機能を持つとは、少なくとも特定の機能(撮像機能など)を有することを指すものであり、例えばカメラ403Aとカメラ403Bが有する機能及び性能の一部が異なっていてもよい。また、以下の説明において、カメラ403は、カメラ403A~403Hの総称を表す。
実施形態1では、被写体の前景画像を分離手法として、機械学習の結果に基づく手法を用いた場合を説明したが、他の手法を用いてもよい。例えば、前景画像を分離する手法として、予め作成した背景画像と撮影画像の画素値の差分から前景画像を抽出(生成)する背景差分による手法を用いることもできる。この場合、実施形態1で用いた前景確率のヒストグラムの代わりに、抽出した前景画像の周辺領域における撮影画像と背景画像の各画素の差分値のヒストグラムを用いることができる。撮影画像と背景画像の差分値の分離度が大きいということは、前景に対応する画素と背景に対応する画素の色輝度の差分がはっきりしているということであり、これにより前景境界に忠実に前景部分を分離出来たことを意味する。すなわち、抽出した前景画像の周辺領域における撮影画像において、差分値が大きい値をとるほど(もしくは、差分値として取り得る最大値に近い値を取る割合が多いほど)、信頼度は高くなる(大きくなる)。このように前景部分が忠実に分離出来た前景画像を選択することで、より姿勢推定に適した被写体画像を選択することができる。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (11)
- 複数の撮像装置が被写体を異なる方向から撮像することに基づいて得られた複数の撮像画像から、前記被写体の領域を抽出した複数の被写体画像を取得する第1の取得手段と、
前記複数の被写体画像について、前記被写体に対する精度を示す信頼度を取得する第2の取得手段と、
前記信頼度に基づいて、前記複数の被写体画像から1つ以上の被写体画像を選択する選択手段と、
前記選択された1つ以上の被写体画像に基づいて、前記被写体の3次元姿勢を示す姿勢モデルを生成する生成手段と、
を有することを特徴とする生成装置。 - 前記第1の取得手段は、前記複数の撮像画像のそれぞれについて、撮像画像における各画素が前記被写体の領域を構成する画素であるか否かを示す確率値を、画素ごとに導出し、当該確率値に基づいて、前記撮像画像における前記被写体画像を取得することを特徴とする請求項1に記載の生成装置。
- 前記第1の取得手段は、前記撮像画像における各画素の前記確率値を所定の閾値で2値化することによって、前記被写体画像を取得することを特徴とする請求項2に記載の生成装置。
- 前記第1の取得手段は、機械学習による結果に基づいて、前記撮像画像における各画素の前記確率値を導出することを特徴とする請求項2または3に記載の生成装置。
- 前記第2の取得手段は、前記撮像画像における各画素の前記確率値の分布に基づいて、前記被写体画像に対する前記信頼度を取得することを特徴とする請求項2から4のいずれか1項に記載の生成装置。
- 前記第2の手段は、前記確率値の分布において、確率値として取り得る最低値に近い確率値と最高値に近い確率値の割合が大きいほど、値が大きくなるように、前記信頼度を取得することを特徴とする請求項5に記載の生成装置。
- 前記第1の取得手段は、前記複数の撮像画像のそれぞれについて、撮像画像の撮影領域に前記被写体が存在しない背景画像の画素値と、前記撮像画像の画素値との差分値を、画素ごとに導出し、当該差分値に基づいて、前記被写体画像を取得することを特徴とする請求項1に記載の生成装置。
- 前記第2の取得手段は、前記撮像画像における前記差分値が大きい値をとるほど、値が大きくなるように、前記信頼度を取得することを特徴とする請求項7に記載の生成装置。
- 前記選択手段は、前記信頼度と前記複数の撮像装置の配置を示す情報に基づいて、前記1つ以上の被写体画像を選択することを特徴とする請求項1から8のいずれか1項に記載の生成装置。
- 複数の撮像装置が被写体を異なる方向から撮像することに基づいて得られた複数の撮像画像から、前記被写体の領域を抽出した複数の被写体画像を取得する第1の取得工程と、
前記複数の被写体画像のそれぞれについて、前記被写体に対する精度を示す信頼度を取得する第2の取得工程と、
前記信頼度に基づいて、前記複数の被写体画像から1つ以上の被写体画像を選択する選択工程と、
前記選択された1つ以上の被写体画像に基づいて、前記被写体の3次元姿勢を示す姿勢モデルを生成する生成工程と、
を有することを特徴とする生成方法。 - コンピュータを、請求項1から9のいずれか1項に記載の生成装置として機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020161329A JP2022054251A (ja) | 2020-09-25 | 2020-09-25 | 生成装置、生成方法、およびプログラム |
EP21187357.5A EP3951715B1 (en) | 2020-08-05 | 2021-07-23 | Generation apparatus, generation method, and program |
US17/387,295 US11776213B2 (en) | 2020-08-05 | 2021-07-28 | Pose generation apparatus, generation method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020161329A JP2022054251A (ja) | 2020-09-25 | 2020-09-25 | 生成装置、生成方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022054251A true JP2022054251A (ja) | 2022-04-06 |
JP2022054251A5 JP2022054251A5 (ja) | 2023-10-05 |
Family
ID=80996863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020161329A Pending JP2022054251A (ja) | 2020-08-05 | 2020-09-25 | 生成装置、生成方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022054251A (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000251078A (ja) * | 1998-12-22 | 2000-09-14 | Atr Media Integration & Communications Res Lab | 人物の3次元姿勢推定方法および装置ならびに人物の肘の位置推定方法および装置 |
JP2006172080A (ja) * | 2004-12-15 | 2006-06-29 | Hitachi Global Storage Technologies Netherlands Bv | 光源のパラメータ設定方法及び識別記号の認識方法 |
JP2012099070A (ja) * | 2010-11-05 | 2012-05-24 | Glory Ltd | 被写体検出方法および被写体検出装置 |
CN110796699A (zh) * | 2019-06-18 | 2020-02-14 | 叠境数字科技(上海)有限公司 | 多目相机系统的最优视角选择方法和三维人体骨骼检测方法 |
-
2020
- 2020-09-25 JP JP2020161329A patent/JP2022054251A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000251078A (ja) * | 1998-12-22 | 2000-09-14 | Atr Media Integration & Communications Res Lab | 人物の3次元姿勢推定方法および装置ならびに人物の肘の位置推定方法および装置 |
JP2006172080A (ja) * | 2004-12-15 | 2006-06-29 | Hitachi Global Storage Technologies Netherlands Bv | 光源のパラメータ設定方法及び識別記号の認識方法 |
JP2012099070A (ja) * | 2010-11-05 | 2012-05-24 | Glory Ltd | 被写体検出方法および被写体検出装置 |
CN110796699A (zh) * | 2019-06-18 | 2020-02-14 | 叠境数字科技(上海)有限公司 | 多目相机系统的最优视角选择方法和三维人体骨骼检测方法 |
Non-Patent Citations (2)
Title |
---|
KARIM ISKAKOV, ET AL.: "Learnable Triangulation of Human Pose", 2019 IEEE/CVF INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV), JPN6024025178, 27 October 2019 (2019-10-27), US, ISSN: 0005358161 * |
ZHONG LIU, ET AL.: "A New Model-Based Method for Multi-View Human Body Tracking and Its Application to View Transfer in", IEEE TRANSACTIONS ON MULTIMEDIA, vol. Volume: 20, Issue: 6, June 2018, JPN6024025179, 30 October 2017 (2017-10-30), US, pages 1321 - 1334, ISSN: 0005358162 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6748773B2 (ja) | 映像提示装置、映像提示方法、およびプログラム | |
JP5837508B2 (ja) | 姿勢状態推定装置および姿勢状態推定方法 | |
US11776213B2 (en) | Pose generation apparatus, generation method, and storage medium | |
JP7566973B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
US9743014B2 (en) | Image recognition system, image recognition apparatus, image recognition method, and computer program | |
JP6587421B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP5873442B2 (ja) | 物体検出装置および物体検出方法 | |
CN109035334B (zh) | 位姿的确定方法和装置、存储介质及电子装置 | |
US20180321776A1 (en) | Method for acting on augmented reality virtual objects | |
JP7250493B2 (ja) | 画像処理装置、三次元形状データの生成方法およびプログラム | |
JP5940862B2 (ja) | 画像処理装置 | |
CN108227920B (zh) | 运动封闭空间追踪方法及追踪系统 | |
KR20120065063A (ko) | 고속 스테레오 카메라를 이용한 구형 물체의 비행 정보 측정 시스템 및 방법 | |
US20230351615A1 (en) | Object identifications in images or videos | |
JP7634955B2 (ja) | 制御装置および学習装置及び制御方法 | |
JP5503510B2 (ja) | 姿勢推定装置および姿勢推定プログラム | |
Wang et al. | Practical color-based motion capture | |
JP6799468B2 (ja) | 画像処理装置、画像処理方法及びコンピュータプログラム | |
JP7500333B2 (ja) | 生成装置、生成方法、およびプログラム | |
JP2022054251A (ja) | 生成装置、生成方法、およびプログラム | |
CN111462294A (zh) | 一种图像处理方法、电子设备及计算机可读存储介质 | |
KR102715450B1 (ko) | 사람의 동작분석시스템 | |
US20250005846A1 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable medium | |
CN112511764B (zh) | 移动图像整合方法及移动图像整合系统 | |
JP2022131197A (ja) | 画像処理装置、画像処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20210103 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230925 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230925 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240624 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240628 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20241118 |