JP7521704B2 - 姿勢推定装置、学習モデル生成装置、姿勢推定方法、学習モデル生成方法及び、プログラム - Google Patents
姿勢推定装置、学習モデル生成装置、姿勢推定方法、学習モデル生成方法及び、プログラム Download PDFInfo
- Publication number
- JP7521704B2 JP7521704B2 JP2023541061A JP2023541061A JP7521704B2 JP 7521704 B2 JP7521704 B2 JP 7521704B2 JP 2023541061 A JP2023541061 A JP 2023541061A JP 2023541061 A JP2023541061 A JP 2023541061A JP 7521704 B2 JP7521704 B2 JP 7521704B2
- Authority
- JP
- Japan
- Prior art keywords
- person
- image
- pixel
- joint
- learning model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
- G06T7/75—Determining position or orientation of objects or cameras using feature-based methods involving models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20036—Morphological image processing
- G06T2207/20044—Skeletonization; Medial axis transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Description
画像中の人物の関節点を検出する、関節点検出部と、
前記画像中の人物それぞれにおいて、予め設定された基準点を特定する、基準点特定部と、
人物のセグメンテーション領域における画素毎に画素データと当該画素を起点にした前記基準点までのベクトルの単位ベクトルとの関係を機械学習している学習モデルを用いて、検出した前記関節点毎に、当該関節点と前記画像中の各人物の前記基準点との関係を求め、求めた関係に基づいて、当該関節点が前記画像中の人物に属する可能性を示すスコアを算出し、算出した前記スコアを用いて、当該関節点が属する前記画像中の人物を決定する、帰属決定部と、
前記帰属決定手段による決定の結果に基づいて、前記画像中の人物の姿勢を推定する、姿勢推定部と、
を備えている、ことを特徴とする。
人物のセグメンテーション領域における画素毎の画素データと、前記セグメンテーション領域における画素毎の座標データと、前記セグメンテーション領域の画素毎の、当該画素を起点にした予め設定された基準点までのベクトルの単位ベクトルと、を訓練データとして、機械学習を実行して、学習モデルを生成する、学習モデル生成部を備えている、
ことを特徴とする。
画像中の人物の関節点を検出する、関節点検出ステップと、
前記画像中の人物それぞれにおいて、予め設定された基準点を特定する、基準点特定ステプと、
人物のセグメンテーション領域における画素毎に画素データと当該画素を起点にした前記基準点までのベクトルの単位ベクトルとの関係を機械学習している学習モデルを用いて、検出した前記関節点毎に、当該関節点と前記画像中の各人物の前記基準点との関係を求め、求めた関係に基づいて、当該関節点が前記画像中の人物に属する可能性を示すスコアを算出し、算出した前記スコアを用いて、当該関節点が属する前記画像中の人物を決定する、帰属決定ステップと、
前記帰属決定手段による決定の結果に基づいて、前記画像中の人物の姿勢を推定する、姿勢推定ステップと、
を有することを特徴とする。
人物のセグメンテーション領域における画素毎の画素データと、前記セグメンテーション領域における画素毎の座標データと、前記セグメンテーション領域の画素毎の、当該画素を起点にした予め設定された基準点までのベクトルの単位ベクトルと、を訓練データとして、機械学習を実行して、学習モデルを生成する、学習モデル生成ステップを有する、
ことを特徴とする。
コンピュータに、
画像中の人物の関節点を検出する、関節点検出ステップと、
前記画像中の人物それぞれにおいて、予め設定された基準点を特定する、基準点特定ステップと、
人物のセグメンテーション領域における画素毎に画素データと当該画素を起点にした前記基準点までのベクトルの単位ベクトルとの関係を機械学習している学習モデルを用いて、検出した前記関節点毎に、当該関節点と前記画像中の各人物の前記基準点との関係を求め、求めた関係に基づいて、当該関節点が前記画像中の人物に属する可能性を示すスコアを算出し、算出した前記スコアを用いて、当該関節点が属する前記画像中の人物を決定する、帰属決定ステップと、
前記帰属決定ステップによる決定の結果に基づいて、前記画像中の人物の姿勢を推定する、姿勢推定ステップと、
を実行させる、ことを特徴とする。
コンピュータに、
人物のセグメンテーション領域における画素毎の画素データと、前記セグメンテーション領域における画素毎の座標データと、前記セグメンテーション領域の画素毎の、当該画素を起点にした予め設定された基準点までのベクトルの単位ベクトルと、を訓練データとして、機械学習を実行して、学習モデルを生成する、学習モデル生成ステップを、
実行させる、ことを特徴とする。
以下、実施の形態1においては、学習モデル生成装置、学習モデル生成方法、及び学習モデル生成のためのプログラムについて、図1~図5を参照しながら説明する。
最初に、実施の形態1における学習モデル生成装置の概略構成について図1を用いて説明する。図1は、実施の形態1における学習モデル生成装置の概略構成を示す構成図である。
次に、実施の形態1における学習モデル生成装置10の動作について図5を用いて説明する。図5は、実施の形態1における学習モデル生成装置の動作を示すフロー図である。以下の説明においては、適宜図1~図4を参照する。また、実施の形態1では、学習モデル生成装置10を動作させることによって、学習モデル生成方法が実施される。よって、実施の形態における学習モデル生成方法の説明は、以下の学習モデル生成装置10の動作説明に代える。
実施の形態1における学習モデル生成のためのプログラムは、コンピュータに、図5に示すステップA1~A3を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、実施の形態1における学習モデル生成装置10と学習モデル生成方法とを実現することができる。この場合、コンピュータのプロセッサは、学習モデル生成部11及び訓練データ取得部12として機能し、処理を行なう。コンピュータとしては、汎用のPCの他に、スマートフォン、タブレット型端末装置が挙げられる。
次に、実施の形態2においては、姿勢推定装置、姿勢推定方法、及び姿勢推定のためのプログラムについて、図6~図11を参照しながら説明する。
最初に、実施の形態2における姿勢推定装置の概略構成について図6を用いて説明する。図6は、実施の形態2における姿勢推定装置の概略構成を示す構成図である。
(x成分)2+(y成分)2<閾値
次に、実施の形態2における姿勢推定装置30の動作について図11を用いて説明する。図11は、実施の形態2における姿勢推定装置の動作を示すフロー図である。以下の説明においては、適宜図6~図10を参照する。また、実施の形態2では、姿勢推定装置30を動作させることによって、姿勢推定方法が実施される。よって、実施の形態における姿勢推定方法の説明は、以下の姿勢推定装置30の動作説明に代える。
実施の形態2における姿勢推定のためのプログラムは、コンピュータに、図11に示すステップB1~B11を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、実施の形態2における姿勢推定装置30と姿勢推定方法とを実現することができる。この場合、コンピュータのプロセッサは、関節点検出部31、基準点特定部32、帰属決定部33、姿勢推定部34、画像データ取得部35、及び帰属補正部36として機能し、処理を行なう。コンピュータとしては、汎用のPCの他に、スマートフォン、タブレット型端末装置が挙げられる。
ここで、実施の形態1におけるプログラムを実行することによって、学習モデル生成装置10を実現するコンピュータと、実施の形態2におけるプログラムを実行することによって、姿勢推定装置30を実現するコンピュータとについて図12を用いて説明する。図12は、実施の形態1における学習モデル生成装置及び実施の形態2における姿勢推定装置を実現するコンピュータの一例を示すブロック図である。
画像中の人物の関節点を検出する、関節点検出部と、
前記画像中の人物それぞれにおいて、予め設定された基準点を特定する、基準点特定部と、
人物のセグメンテーション領域における画素毎に画素データと当該画素を起点にした前記基準点までのベクトルの単位ベクトルとの関係を機械学習している学習モデルを用いて、検出した前記関節点毎に、当該関節点と前記画像中の各人物の前記基準点との関係を求め、求めた関係に基づいて、当該関節点が前記画像中の人物に属する可能性を示すスコアを算出し、算出した前記スコアを用いて、当該関節点が属する前記画像中の人物を決定する、帰属決定部と、
前記帰属決定部による決定の結果に基づいて、前記画像中の人物の姿勢を推定する、姿勢推定部と、
を備えている、
ことを特徴とする姿勢推定装置。
付記1に記載の姿勢推定装置であって、
前記帰属決定部が、検出した前記関節点毎に、前記画像中の人物の前記基準点それぞれについて、前記画像中に当該関節点から前記基準点までの間に中間点を設定し、
そして、当該関節点の画素データ及び前記中間点の画素データを、前記学習モデルに入力し、その出力結果から、当該関節点及び前記中間点それぞれを起点にした前記基準点までのベクトルの単位ベクトルを求め、
更に、前記画像中の人物の前記基準点毎に、当該関節点及び前記中間点について求めた前記単位ベクトルの始点を揃えた場合の方向のバラツキを求め、求めたバラツキに基づいて、前記スコアを算出する、
ことを特徴とする姿勢推定装置。
付記2に記載の姿勢推定装置であって、
前記帰属決定部が、更に、検出した前記関節点毎に、前記画像中の人物の前記基準点それぞれについて、当該関節点までの距離を求め、
加えて、前記学習モデルの出力結果を用いて、前記中間点のうち、前記人物のセグメンテーション領域に存在していない中間点を特定し、前記画像中の人物の前記基準点毎に、前記人物のセグメンテーション領域に存在していない中間点の割合を求め、
前記バラツキ、前記距離、及び前記割合を用いて、前記スコアを算出する、
ことを特徴とする姿勢推定装置。
付記1~3のいずれかに記載の姿勢推定装置であって、
前記画像中の同一の人物に属すると決定された関節点において、重複する関節点が含まれている場合に、重複する関節点それぞれにおける前記スコアを比較し、比較結果に基づいて、重複する関節点のいずれかを属しないと判定する、帰属補正部を、更に備えている、
ことを特徴とする姿勢推定装置。
付記1~4のいずれかに記載の姿勢推定装置であって、
前記基準点が、前記画像中の人物の体幹の領域、または首の領域に設定されている、
ことを特徴とする姿勢推定装置。
人物のセグメンテーション領域における画素毎の画素データと、前記セグメンテーション領域における画素毎の座標データと、前記セグメンテーション領域の画素毎の、当該画素を起点にした予め設定された基準点までのベクトルの単位ベクトルと、を訓練データとして、機械学習を実行して、学習モデルを生成する、学習モデル生成部を備えている、
ことを特徴とする学習モデル生成装置。
画像中の人物の関節点を検出する、関節点検出ステップと、
前記画像中の人物それぞれにおいて、予め設定された基準点を特定する、基準点特定ステップと、
人物のセグメンテーション領域における画素毎に画素データと当該画素を起点にした前記基準点までのベクトルの単位ベクトルとの関係を機械学習している学習モデルを用いて、検出した前記関節点毎に、当該関節点と前記画像中の各人物の前記基準点との関係を求め、求めた関係に基づいて、当該関節点が前記画像中の人物に属する可能性を示すスコアを算出し、算出した前記スコアを用いて、当該関節点が属する前記画像中の人物を決定する、帰属決定ステップと、
前記帰属決定ステップによる決定の結果に基づいて、前記画像中の人物の姿勢を推定する、姿勢推定ステップと、
を有する、
ことを特徴とする姿勢推定方法。
付記7に記載の姿勢推定方法であって、
前記帰属決定ステップにおいて、検出した前記関節点毎に、前記画像中の人物の前記基準点それぞれについて、前記画像中に当該関節点から前記基準点までの間に中間点を設定し、
そして、当該関節点の画素データ及び前記中間点の画素データを、前記学習モデルに入力し、その出力結果から、当該関節点及び前記中間点それぞれを起点にした前記基準点までのベクトルの単位ベクトルを求め、
更に、前記画像中の人物の前記基準点毎に、当該関節点及び前記中間点について求めた前記単位ベクトルの始点を揃えた場合の方向のバラツキを求め、求めたバラツキに基づいて、前記スコアを算出する、
ことを特徴とする姿勢推定方法。
付記8に記載の姿勢推定方法であって、
前記帰属決定ステップにおいて、更に、検出した前記関節点毎に、前記画像中の人物の前記基準点それぞれについて、当該関節点までの距離を求め、
加えて、前記学習モデルの出力結果を用いて、前記中間点のうち、前記人物のセグメンテーション領域に存在していない中間点を特定し、前記画像中の人物の前記基準点毎に、前記人物のセグメンテーション領域に存在していない中間点の割合を求め、
前記バラツキ、前記距離、及び前記割合を用いて、前記スコアを算出する、
ことを特徴とする姿勢推定方法。
付記7~9のいずれかに記載の姿勢推定方法であって、
前記画像中の同一の人物に属すると決定された関節点において、重複する関節点が含まれている場合に、重複する関節点それぞれにおける前記スコアを比較し、比較結果に基づいて、重複する関節点のいずれかを属しないと判定する、帰属補正ステップを、更に有する、
ことを特徴とする姿勢推定方法。
付記7~10のいずれかに記載の姿勢推定方法であって、
前記基準点が、前記画像中の人物の体幹の領域、または首の領域に設定されている、
ことを特徴とする姿勢推定方法。
人物のセグメンテーション領域における画素毎の画素データと、前記セグメンテーション領域における画素毎の座標データと、前記セグメンテーション領域の画素毎の、当該画素を起点にした予め設定された基準点までのベクトルの単位ベクトルと、を訓練データとして、機械学習を実行して、学習モデルを生成する、学習モデル生成ステップを有する、
ことを特徴とする学習モデル生成方法。
コンピュータに、
画像中の人物の関節点を検出する、関節点検出ステップと、
前記画像中の人物それぞれにおいて、予め設定された基準点を特定する、基準点特定ステップと、
人物のセグメンテーション領域における画素毎に画素データと当該画素を起点にした前記基準点までのベクトルの単位ベクトルとの関係を機械学習している学習モデルを用いて、検出した前記関節点毎に、当該関節点と前記画像中の各人物の前記基準点との関係を求め、求めた関係に基づいて、当該関節点が前記画像中の人物に属する可能性を示すスコアを算出し、算出した前記スコアを用いて、当該関節点が属する前記画像中の人物を決定する、帰属決定ステップと、
前記帰属決定ステップによる決定の結果に基づいて、前記画像中の人物の姿勢を推定する、姿勢推定ステップと、
を実行させる命令を含む、プログラムを記録しているコンピュータ読み取り可能な記録媒体。
付記13に記載のコンピュータ読み取り可能な記録媒体であって、
前記帰属決定ステップにおいて、検出した前記関節点毎に、前記画像中の人物の前記基準点それぞれについて、前記画像中に当該関節点から前記基準点までの間に中間点を設定し、
そして、当該関節点の画素データ及び前記中間点の画素データを、前記学習モデルに入力し、その出力結果から、当該関節点及び前記中間点それぞれを起点にした前記基準点までのベクトルの単位ベクトルを求め、
更に、前記画像中の人物の前記基準点毎に、当該関節点及び前記中間点について求めた前記単位ベクトルの始点を揃えた場合の方向のバラツキを求め、求めたバラツキに基づいて、前記スコアを算出する、
ことを特徴とするコンピュータ読み取り可能な記録媒体。
付記14に記載のコンピュータ読み取り可能な記録媒体であって、
前記帰属決定ステップにおいて、更に、検出した前記関節点毎に、前記画像中の人物の前記基準点それぞれについて、当該関節点までの距離を求め、
加えて、前記学習モデルの出力結果を用いて、前記中間点のうち、前記人物のセグメンテーション領域に存在していない中間点を特定し、前記画像中の人物の前記基準点毎に、前記人物のセグメンテーション領域に存在していない中間点の割合を求め、
前記バラツキ、前記距離、及び前記割合を用いて、前記スコアを算出する、
ことを特徴とするコンピュータ読み取り可能な記録媒体。
付記13~15のいずれかに記載のコンピュータ読み取り可能な記録媒体であって、
前記プログラムが、前記コンピュータに、
前記画像中の同一の人物に属すると決定された関節点において、重複する関節点が含まれている場合に、重複する関節点それぞれにおける前記スコアを比較し、比較結果に基づいて、重複する関節点のいずれかを属しないと判定する、帰属補正ステップを実行させる命令を更に含む、
ことを特徴とするコンピュータ読み取り可能な記録媒体。
付記13~16のいずれかに記載のコンピュータ読み取り可能な記録媒体であって、
前記基準点が、前記画像中の人物の体幹の領域、または首の領域に設定されている、
ことを特徴とするコンピュータ読み取り可能な記録媒体。
コンピュータに、
人物のセグメンテーション領域における画素毎の画素データと、前記セグメンテーション領域における画素毎の座標データと、前記セグメンテーション領域の画素毎の、当該画素を起点にした予め設定された基準点までのベクトルの単位ベクトルと、を訓練データとして、機械学習を実行して、学習モデルを生成する、学習モデル生成ステップを、
実行させる命令を含む、プログラムを記録しているコンピュータ読み取り可能な記録媒体。
11 学習モデル生成部
12 訓練データ取得部
13 訓練データ格納部
20 画像データ
21 人物(セグメンテーション領域)
22 基準点
30 姿勢推定装置
31 関節点検出部
32 基準点特定部
33 帰属決定部
34 姿勢推定部
35 画像データ取得部
36 帰属補正部
37 学習モデル格納部
40 画像データ
41、42 人物(セグメンテーション領域)
110 コンピュータ
111 CPU
112 メインメモリ
113 記憶装置
114 入力インターフェイス
115 表示コントローラ
116 データリーダ/ライタ
117 通信インターフェイス
118 入力機器
119 ディスプレイ装置
120 記録媒体
121 バス
Claims (10)
- 画像中の人物の関節点を検出する、関節点検出部と、
前記画像中の人物それぞれにおいて、予め設定された基準点を特定する、基準点特定部と、
人物のセグメンテーション領域における画素毎に画素データと当該画素を起点にした前記基準点までのベクトルの単位ベクトルとの関係を機械学習している学習モデルを用いて、検出した前記関節点毎に、当該関節点と前記画像中の各人物の前記基準点との関係を求め、求めた関係に基づいて、当該関節点が前記画像中の人物に属する可能性を示すスコアを算出し、算出した前記スコアを用いて、当該関節点が属する前記画像中の人物を決定する、帰属決定部と、
前記帰属決定部による決定の結果に基づいて、前記画像中の人物の姿勢を推定する、姿勢推定部と、
を備えている、
ことを特徴とする姿勢推定装置。 - 請求項1に記載の姿勢推定装置であって、
前記帰属決定部が、検出した前記関節点毎に、前記画像中の人物の前記基準点それぞれについて、前記画像中に当該関節点から前記基準点までの間に中間点を設定し、
そして、当該関節点の画素データ及び前記中間点の画素データを、前記学習モデルに入力し、その出力結果から、当該関節点及び前記中間点それぞれを起点にした前記基準点までのベクトルの単位ベクトルを求め、
更に、前記画像中の人物の前記基準点毎に、当該関節点及び前記中間点について求めた前記単位ベクトルの始点を揃えた場合の方向のバラツキを求め、求めたバラツキに基づいて、前記スコアを算出する、
ことを特徴とする姿勢推定装置。 - 請求項2に記載の姿勢推定装置であって、
前記帰属決定部が、更に、検出した前記関節点毎に、前記画像中の人物の前記基準点それぞれについて、当該関節点までの距離を求め、
加えて、前記学習モデルの出力結果を用いて、前記中間点のうち、前記人物のセグメンテーション領域に存在していない中間点を特定し、前記画像中の人物の前記基準点毎に、前記人物のセグメンテーション領域に存在していない中間点の割合を求め、
前記バラツキ、前記距離、及び前記割合を用いて、前記スコアを算出する、
ことを特徴とする姿勢推定装置。 - 請求項1に記載の姿勢推定装置であって、
前記画像中の同一の人物に属すると決定された関節点において、重複する関節点が含まれている場合に、重複する関節点それぞれにおける前記スコアを比較し、比較結果に基づいて、重複する関節点のいずれかをその人物に属しないと判定する、帰属補正部を、更に備えている、
ことを特徴とする姿勢推定装置。 - 請求項1に記載の姿勢推定装置であって、
前記基準点が、前記画像中の人物の体幹の領域、または首の領域に設定されている、
ことを特徴とする姿勢推定装置。 - 人物のセグメンテーション領域における画素毎の画素データと、前記セグメンテーション領域における画素毎の座標データと、前記セグメンテーション領域の画素毎の、当該画素を起点にした予め設定された基準点までのベクトルの単位ベクトルと、を訓練データとして、機械学習を実行して、前記セグメンテーション領域における画素毎に、前記画素データと前記単位ベクトルとの関係を学習した学習モデルを生成する、学習モデル生成部を備えている、
ことを特徴とする学習モデル生成装置。 - コンピュータによって実行する方法であって、
画像中の人物の関節点を検出する、関節点検出ステップと、
前記画像中の人物それぞれにおいて、予め設定された基準点を特定する、基準点特定ステップと、
人物のセグメンテーション領域における画素毎に画素データと当該画素を起点にした前記基準点までのベクトルの単位ベクトルとの関係を機械学習している学習モデルを用いて、検出した前記関節点毎に、当該関節点と前記画像中の各人物の前記基準点との関係を求め、求めた関係に基づいて、当該関節点が前記画像中の人物に属する可能性を示すスコアを算出し、算出した前記スコアを用いて、当該関節点が属する前記画像中の人物を決定する、帰属決定ステップと、
前記帰属決定ステップによる決定の結果に基づいて、前記画像中の人物の姿勢を推定する、姿勢推定ステップと、
を有する、
ことを特徴とする姿勢推定方法。 - コンピュータによって実行する方法であって、
人物のセグメンテーション領域における画素毎の画素データと、前記セグメンテーション領域における画素毎の座標データと、前記セグメンテーション領域の画素毎の、当該画素を起点にした予め設定された基準点までのベクトルの単位ベクトルと、を訓練データとして、機械学習を実行して、前記セグメンテーション領域における画素毎に、前記画素データと前記単位ベクトルとの関係を学習した学習モデルを生成する、学習モデル生成ステップを有する、
ことを特徴とする学習モデル生成方法。 - コンピュータに、
画像中の人物の関節点を検出する、関節点検出ステップと、
前記画像中の人物それぞれにおいて、予め設定された基準点を特定する、基準点特定ステップと、
人物のセグメンテーション領域における画素毎に画素データと当該画素を起点にした前記基準点までのベクトルの単位ベクトルとの関係を機械学習している学習モデルを用いて、検出した前記関節点毎に、当該関節点と前記画像中の各人物の前記基準点との関係を求め、求めた関係に基づいて、当該関節点が前記画像中の人物に属する可能性を示すスコアを算出し、算出した前記スコアを用いて、当該関節点が属する前記画像中の人物を決定する、帰属決定ステップと、
前記帰属決定ステップによる決定の結果に基づいて、前記画像中の人物の姿勢を推定する、姿勢推定ステップと、
を実行させる、プログラム。 - コンピュータに、
人物のセグメンテーション領域における画素毎の画素データと、前記セグメンテーション領域における画素毎の座標データと、前記セグメンテーション領域の画素毎の、当該画素を起点にした予め設定された基準点までのベクトルの単位ベクトルと、を訓練データとして、機械学習を実行して、前記セグメンテーション領域における画素毎に、前記画素データと前記単位ベクトルとの関係を学習した学習モデルを生成する、学習モデル生成ステップを、
実行させる、プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2021/001248 WO2022153481A1 (en) | 2021-01-15 | 2021-01-15 | Posture estimation apparatus, learning model generation apparatus, method, and computer-readable recordingmedium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2024502122A JP2024502122A (ja) | 2024-01-17 |
JP7521704B2 true JP7521704B2 (ja) | 2024-07-24 |
Family
ID=82448068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023541061A Active JP7521704B2 (ja) | 2021-01-15 | 2021-01-15 | 姿勢推定装置、学習モデル生成装置、姿勢推定方法、学習モデル生成方法及び、プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20240303855A1 (ja) |
JP (1) | JP7521704B2 (ja) |
WO (1) | WO2022153481A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12356076B2 (en) * | 2022-05-24 | 2025-07-08 | Canon Kabushiki Kaisha | Image capture control device, image capture device, image capture control method, and non-transitory computer-readable storage medium |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007199864A (ja) | 2006-01-24 | 2007-08-09 | Matsushita Electric Ind Co Ltd | 画像列生成方法および画像列生成装置 |
JP2017097578A (ja) | 2015-11-24 | 2017-06-01 | キヤノン株式会社 | 情報処理装置及び方法 |
WO2018189795A1 (ja) | 2017-04-10 | 2018-10-18 | 富士通株式会社 | 認識装置、認識方法および認識プログラム |
JP2019191974A (ja) | 2018-04-26 | 2019-10-31 | 株式会社 ディー・エヌ・エー | 情報処理装置、情報処理プログラム、及び、情報処理方法 |
-
2021
- 2021-01-15 US US18/271,377 patent/US20240303855A1/en active Pending
- 2021-01-15 WO PCT/JP2021/001248 patent/WO2022153481A1/en active Application Filing
- 2021-01-15 JP JP2023541061A patent/JP7521704B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007199864A (ja) | 2006-01-24 | 2007-08-09 | Matsushita Electric Ind Co Ltd | 画像列生成方法および画像列生成装置 |
JP2017097578A (ja) | 2015-11-24 | 2017-06-01 | キヤノン株式会社 | 情報処理装置及び方法 |
WO2018189795A1 (ja) | 2017-04-10 | 2018-10-18 | 富士通株式会社 | 認識装置、認識方法および認識プログラム |
JP2019191974A (ja) | 2018-04-26 | 2019-10-31 | 株式会社 ディー・エヌ・エー | 情報処理装置、情報処理プログラム、及び、情報処理方法 |
Non-Patent Citations (1)
Title |
---|
NIE, Xuecheng et al.,"Single-Stage Multi-Person Pose Machines",2019 IEEE/CVF International Conference on Computer Vision (ICCV),米国,IEEE,2019年10月27日,pp.6950-6959 |
Also Published As
Publication number | Publication date |
---|---|
JP2024502122A (ja) | 2024-01-17 |
US20240303855A1 (en) | 2024-09-12 |
WO2022153481A1 (en) | 2022-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kristan et al. | A novel performance evaluation methodology for single-target trackers | |
KR100886407B1 (ko) | 정보 처리 장치 및 그 제어방법 | |
JP2011134114A (ja) | パターン認識方法およびパターン認識装置 | |
US11836944B2 (en) | Information processing apparatus, information processing method, and storage medium | |
CN110956131B (zh) | 单目标追踪方法、装置及系统 | |
US20130148849A1 (en) | Image processing device and method | |
JPWO2019003973A1 (ja) | 顔認証装置、顔認証方法およびプログラム | |
JP7192143B2 (ja) | オンライン学習を利用した物体追跡のための方法およびシステム | |
Kan et al. | Self-constrained inference optimization on structural groups for human pose estimation | |
CN118119971A (zh) | 使用神经网络确定人的身高的电子设备和方法 | |
JP2013016171A (ja) | 人体動作周期の特定と人体動作の認識の方法、装置、及びプログラム | |
US20230237777A1 (en) | Information processing apparatus, learning apparatus, image recognition apparatus, information processing method, learning method, image recognition method, and non-transitory-computer-readable storage medium | |
JP7521704B2 (ja) | 姿勢推定装置、学習モデル生成装置、姿勢推定方法、学習モデル生成方法及び、プログラム | |
Li et al. | Recognizing hand gestures using the weighted elastic graph matching (WEGM) method | |
JP2018036901A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
CN109325387B (zh) | 图像处理方法、装置、电子设备 | |
JP2021144359A (ja) | 学習装置、推定装置、学習方法、及びプログラム | |
WO2022181253A1 (ja) | 関節点検出装置、学習モデル生成装置、関節点検出方法、学習モデル生成方法、及びコンピュータ読み取り可能な記録媒体 | |
JP7540500B2 (ja) | グループ特定装置、グループ特定方法、及びプログラム | |
US20230114776A1 (en) | Image recognition system, image recognition method, and non-transitory computerreadable medium | |
WO2023275941A1 (en) | Image processing apparatus, feature map generating apparatus, learning model generation apparatus, image processing method, and computer-readable recording medium | |
JP7665117B1 (ja) | 機械学習装置、技能判定装置、機械学習方法、及び機械学習プログラム | |
JP7708225B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
US20250005782A1 (en) | Image processing apparatus, image processing method, and storage medium | |
US20250131708A1 (en) | Image processing apparatus, image processing method, and non-transitory storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230705 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230705 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240402 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240611 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240624 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7521704 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |