CN115239906A - 基于物理的手与物体交互过程的实时重建方法及装置 - Google Patents
基于物理的手与物体交互过程的实时重建方法及装置 Download PDFInfo
- Publication number
- CN115239906A CN115239906A CN202210715807.8A CN202210715807A CN115239906A CN 115239906 A CN115239906 A CN 115239906A CN 202210715807 A CN202210715807 A CN 202210715807A CN 115239906 A CN115239906 A CN 115239906A
- Authority
- CN
- China
- Prior art keywords
- fingertip
- hand
- contact state
- confidence
- real
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
- G06T17/10—Constructive solid geometry [CSG] using solid primitives, e.g. cylinders, cubes
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/103—Measuring devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
- A61B5/11—Measuring movement of the entire body or parts thereof, e.g. head or hand tremor or mobility of a limb
- A61B5/1116—Determining posture transitions
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/103—Measuring devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
- A61B5/11—Measuring movement of the entire body or parts thereof, e.g. head or hand tremor or mobility of a limb
- A61B5/1124—Determining motor skills
- A61B5/1125—Grasping motions of hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/10—Geometric effects
- G06T15/20—Perspective computation
- G06T15/205—Image-based rendering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
- G06V40/11—Hand-related biometrics; Hand pose recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2210/00—Indexing scheme for image generation or computer graphics
- G06T2210/28—Force feedback
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Geometry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Physiology (AREA)
- Dentistry (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Veterinary Medicine (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Heart & Thoracic Surgery (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Computer Graphics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请涉及人机交互技术领域,特别涉及一种基于物理的手与物体交互过程的实时重建方法及装置,其中,方法包括:基于深度输入数据获取物体的几何与位姿信息和手的姿态信息;根据物体的几何与位姿信息计算物体的物理属性和初始接触状态,并基于物理属性和初始接触状态进行接触状态优化,得到优化后的每个手指尖的坐标和压力;根据手的姿态信息计算每个手指尖的置信度,并根据优化后的每个手指尖的坐标和压力及置信度计算手的最终姿态与每个手指尖的最终坐标。由此,解决了相关技术中仅使用单目深度相机对交互过程进行实时的重建,缺乏物理约束,使得重建结果不符合物理情况,降低了重建结果的准确性,无法满足手与物体实时重建的需求等问题。
Description
技术领域
本申请涉及人机交互技术领域,特别涉及一种基于物理的手与物体交互过程的实时重建方法及装置。
背景技术
相关技术中,通过使用联合学习网络处理深度图像,完成手和物体数据点的分割以及手关键点的预测,同时利用LSTM(Long Short-Term Memory,长短期记忆网络)对手的姿势进行预测,并进行优化得到手的姿势和物体的非刚性运动,从而根据手的姿势,物体的运动和物体模型得到最终的重建结果。
然而,相关技术中仅使用单目深度相机对交互过程进行实时的重建,缺乏物理约束,使得重建结果不符合物理情况,降低了重建结果的准确性,无法满足手与物体实时重建的需求,亟待改进。
发明内容
本申请提供一种基于物理的手与物体交互过程的实时重建方法及装置,以解决相关技术中仅使用单目深度相机对交互过程进行实时的重建,缺乏物理约束,使得重建结果不符合物理情况,降低了重建结果的准确性,无法满足手与物体实时重建的需求等问题。
本申请第一方面实施例提供一种基于物理的手与物体交互过程的实时重建方法,包括以下步骤:基于深度输入数据获取物体的几何与位姿信息和手的姿态信息;根据所述物体的几何与位姿信息计算所述物体的物理属性和初始接触状态,并基于所述物理属性和初始接触状态进行接触状态优化,得到优化后的每个手指尖的坐标和压力;根据所述手的姿态信息计算所述每个手指尖的置信度,并根据所述优化后的每个手指尖的坐标和压力及所述置信度计算所述手的最终姿态与所述每个手指尖的最终坐标。
可选地,在本申请的一个实施例中,所述物理属性包括线速度与角速度、线加速度和角加速度、质量、质心和惯性张量中的至少一项。
可选地,在本申请的一个实施例中,所述基于所述物理属性和初始接触状态进行接触状态优化,包括:基于预设的带约束的能量优化问题,求解力和接触状态解释物体的运动,其中,优化变量为接触点上的力和优化后的接触状态中每个手指尖到物体表面的距离。
可选地,在本申请的一个实施例中,所述置信度的计算公式为:
Ci=min(1,Ni/Ns).
其中,Ci表示每个手指尖的置信度,Ni表示手指尖i附近(距离小于3mm)的深度点数量,其中,预定义Ns=75来表示能够较为准确地预测手指尖位置所需要的深度点数量。
本申请第二方面实施例提供一种基于物理的手与物体交互过程的实时重建装置,包括:获取模块,用于基于深度输入数据获取物体的几何与位姿信息和手的姿态信息;第一计算模块,用于根据所述物体的几何与位姿信息计算所述物体的物理属性和初始接触状态,并基于所述物理属性和初始接触状态进行接触状态优化,得到优化后的每个手指尖的坐标和压力;第二计算模块,用于根据所述手的姿态信息计算所述每个手指尖的置信度,并根据所述优化后的每个手指尖的坐标和压力及所述置信度计算所述手的最终姿态与所述每个手指尖的最终坐标。
可选地,在本申请的一个实施例中,所述物理属性包括线速度与角速度、线加速度和角加速度、质量、质心和惯性张量中的至少一项。
可选地,在本申请的一个实施例中,所述第一计算模块进一步用于基于预设的带约束的能量优化问题,求解力和接触状态解释物体的运动,其中,优化变量为接触点上的力和优化后的接触状态中每个手指尖到物体表面的距离。
可选地,在本申请的一个实施例中,所述置信度的计算公式为:
Ci=min(1,Ni/Ns).
其中,Ci表示每个手指尖的置信度,Ni表示手指尖i附近(距离小于3mm)的深度点数量,其中,预定义Ns=75来表示能够较为准确地预测手指尖位置所需要的深度点数量。
本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的基于物理的手与物体交互过程的实时重建方法。
本申请第四方面实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,该程序被处理器执行时实现如上的基于物理的手与物体交互过程的实时重建方法。
本申请实施例可以根据物体的几何与位姿信息计算物体的物理属性和初始接触状态,进行接触状态优化,并得到优化后的每个手指尖的坐标和压力,还可以根据手的姿态信息计算每个手指尖的置信度,进而根据优化后的每个手指尖的坐标和压力及置信度计算手的最终姿态与每个手指尖的最终坐标,从而可以实现对任何手与物体交互的重建结果进行优化,使得手与物体的交互动作更符合物理规律,提升了重建结果的准确性,有效的满足手与物体实时重建的需求。由此,解决了相关技术中仅使用单目深度相机对交互过程进行实时的重建,缺乏物理约束,使得重建结果不符合物理情况,降低了重建结果的准确性,无法满足手与物体实时重建的需求等问题。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本申请实施例提供的一种基于物理的手与物体交互过程的实时重建方法的流程图;
图2为本申请一个具体实施例的基于物理的手与物体交互过程的实时重建方法的流程图;
图3为本申请一个具体实施例的重建结果和预测的力的示意图;
图4为根据本申请实施例的基于物理的手与物体交互过程的实时重建装置的结构示意图;
图5为根据本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的基于物理的手与物体交互过程的实时重建方法及装置。针对上述背景技术中心提到的相关技术中仅使用单目深度相机对交互过程进行实时的重建,缺乏物理约束,使得重建结果不符合物理情况,降低了重建结果的准确性,无法满足手与物体实时重建的需求的问题,本申请提供了一种基于物理的手与物体交互过程的实时重建方法,在该方法中,可以根据物体的几何与位姿信息计算物体的物理属性和初始接触状态,进行接触状态优化,并得到优化后的每个手指尖的坐标和压力,还可以根据手的姿态信息计算每个手指尖的置信度,进而根据优化后的每个手指尖的坐标和压力及置信度计算手的最终姿态与每个手指尖的最终坐标,从而可以实现对任何手与物体交互的重建结果进行优化,使得手与物体的交互动作更符合物理规律,提升了重建结果的准确性,有效的满足手与物体实时重建的需求。由此,解决了相关技术中仅使用单目深度相机对交互过程进行实时的重建,缺乏物理约束,使得重建结果不符合物理情况,降低了重建结果的准确性,无法满足手与物体实时重建的需求等问题。
具体而言,图1为本申请实施例所提供的一种基于物理的手与物体交互过程的实时重建方法的流程示意图。
如图1所示,该基于物理的手与物体交互过程的实时重建方法包括以下步骤:
在步骤S101中,基于深度输入数据获取物体的几何与位姿信息和手的姿态信息。
在一些实施例中,如图1所示,本申请实施例首先进行运动学重建,可以基于运动学的手物交互重建方法SingleDepth,对于每帧深度数据使用SingleDepth进行重建,从而得到物体几何信息位姿信息Wt和手的姿势信息进而可以提升手物交互重建的精确性。
在步骤S102中,根据物体的几何与位姿信息计算物体的物理属性和初始接触状态,并基于物理属性和初始接触状态进行接触状态优化,得到优化后的每个手指尖的坐标和压力。
在实际执行过程中,如图1所示,本申请实施例可以进行接触状态优化,根据物体的几何信息和位姿信息Wt计算物体的物理属性和初始接触状态,从而进行接触状态优化,得到优化后的每个手指尖的坐标和压力,进而得到更加符合物理,且更准确的重建结果。
其中,在本申请的一个实施例中,物理属性包括线速度与角速度、线加速度和角加速度、质量、质心和惯性张量中的至少一项。
具体而言,物体的物理属性包括运动属性(线速度与角速度vt,ωt,线加速度和角加速度)和固有属性(质量mo,质心co和惯性张量I),其中,运动属性可以通过对相邻几帧物体位姿{Wt-2,Wt-1,Wt}进行差分得到,固有属性由于物体的几何表面已被SingleDepth重建,可以假定物体质量为定值,且均匀分布于物体表面,并在该假设下进行计算。
可选地,在本申请的一个实施例中,基于物理属性和初始接触状态进行接触状态优化,包括:基于预设的带约束的能量优化问题,求解力和接触状态解释物体的运动,其中,优化变量为接触点上的力和优化后的接触状态中每个手指尖到物体表面的距离。
作为一种可能实现的方式,本申请实施例可以计算初始接触状态,其中,只考虑五个手指尖与物体之间的接触状态,一方面可以节约时间且提升效率,另一方面手指尖是交互过程中最重要的部位,接触状态的定义为:
其中,pi表示第i个手指尖在物体表面上的投影点,ni表示pi处物体的内法向量,di表示手指尖与pi之间的距离,为了计算pi,需要在每个手指尖表面采样部分点,并计算点到物体表面的距离,取其中最近的投影到物体表面,该投影点为pi。
Ef(fi)一项要求物体自身重力和所有接触点给物体的力二者的合力能够解释物体的线加速度,具体计算方式为:
其中,Ai=[x1,x2,x3,x4]表示四棱锥侧棱的方向向量,优化变量fi表示四条棱上的分量,Aifi表示接触力。
其中,本申请实施例使用一个四棱锥线性近似摩擦锥来进行接触力的建模,四棱锥侧棱的方向向量用一个矩阵Ai=[x1,x2,x3,x4]表示,而优化变量fi则是四条棱上的分量,Aifi表示接触力。
Em(fi)项要求物体的角加速度能够被接触点施加的合力矩解释,具体计算方式为:
τt的计算方法如下:
其中,[.]代指向量的叉乘矩阵。
Ereg(fi)为限制力大小的正则项,定义为:
在步骤S103中,根据手的姿态信息计算每个手指尖的置信度,并根据优化后的每个手指尖的坐标和压力及置信度计算手的最终姿态与每个手指尖的最终坐标。
在实际执行过程中,如图1所示,本申请实施例可以进行接触点运动优化,根据根据手的姿态信息和深度输入计算每个手指尖的置信度Ci,并根据上述步骤预测到的每个接触点上的力,约束其中压力大的接触点的滑动,从而避免重建结果中出现不符合物理的接触点滑动现象,进而根据优化后的每个手指尖的坐标和压力及置信度计算手的最终姿态与每个手指尖的最终坐标,使得手与物体的交互动作更符合物理规律,提升了重建结果的准确性,有效的满足手与物体实时重建的需求。
其中,在本申请的一个实施例中,置信度Ci的计算公式为:
Ci=min(1,Ni/Ns).
其中,Ci表示每个手指尖的置信度,Ni表示手指尖i附近(距离小于3mm)的深度点数量,其中,预定义Ns=75来表示能够较为准确地预测手指尖位置所需要的深度点数量。
进一步地,更高的置信度表明,运动学重建系统可以获得足够的数据来拟合手指尖并产生准确的结果,优化中会更倾向于相信该系统的结果。
经过上述步骤的优化后可以得到每个手指尖优化后的坐标为:
每个手指尖给物体的压力为:
其中,表示每个手指尖优化后的坐标,表示当前帧手指尖i的坐标,Go=mo||g||表示物体受到的重力大小,α表示一个固定的比例参数,β表示用来控制置信度作用的强度,γ表示用来对滑动的过程进行平滑,其中,根据经验设置α=0.3,β=5mm,γ=0.5。
如图3所示,本申请实施例可以通过参考彩色图像获得相对应的重建结果以及预测的力,从而可以得到更加符合物理,且更准确的重建结果,同时,还可以对每个手指尖接触点上的接触力给出一个合理的估计结果,使得手与物体的交互动作更符合物理规律,提升了重建结果的精确性,有效的满足手与物体实时重建的需求。
根据本申请实施例提出的基于物理的手与物体交互过程的实时重建方法,可以根据物体的几何与位姿信息计算物体的物理属性和初始接触状态,进行接触状态优化,并得到优化后的每个手指尖的坐标和压力,还可以根据手的姿态信息计算每个手指尖的置信度,进而根据优化后的每个手指尖的坐标和压力及置信度计算手的最终姿态与每个手指尖的最终坐标,从而可以实现对任何手与物体交互的重建结果进行优化,使得手与物体的交互动作更符合物理规律,提升了重建结果的准确性,有效的满足手与物体实时重建的需求。
其次参照附图描述根据本申请实施例提出的基于物理的手与物体交互过程的实时重建装置。
图4是本申请实施例的基于物理的手与物体交互过程的实时重建装置的方框示意图。
如图4所示,该基于物理的手与物体交互过程的实时重建装置10包括:获取模块100、第一计算模块200和第二计算模块300。
具体地,获取模块100,用于基于深度输入数据获取物体的几何与位姿信息和手的姿态信息。
第一计算模块200,用于根据物体的几何与位姿信息计算物体的物理属性和初始接触状态,并基于物理属性和初始接触状态进行接触状态优化,得到优化后的每个手指尖的坐标和压力。
第二计算模块300,用于根据手的姿态信息计算每个手指尖的置信度,并根据优化后的每个手指尖的坐标和压力及置信度计算手的最终姿态与每个手指尖的最终坐标。
可选地,在本申请的一个实施例中,物理属性包括线速度与角速度、线加速度和角加速度、质量、质心和惯性张量中的至少一项。
可选地,在本申请的一个实施例中,第一计算模块200进一步用于基于预设的带约束的能量优化问题,求解力和接触状态解释物体的运动,其中,优化变量为接触点上的力和优化后的接触状态中每个手指尖到物体表面的距离。
可选地,在本申请的一个实施例中,置信度的计算公式为:
Ci=min(1,Ni/Ns).
其中,Ci表示每个手指尖的置信度,Ni表示手指尖i附近(距离小于3mm)的深度点数量,其中,预定义Ns=75来表示能够较为准确地预测手指尖位置所需要的深度点数量。
需要说明的是,前述对基于物理的手与物体交互过程的实时重建方法实施例的解释说明也适用于该实施例的基于物理的手与物体交互过程的实时重建装置,此处不再赘述。
根据本申请实施例提出的基于物理的手与物体交互过程的实时重建装置,可以根据物体的几何与位姿信息计算物体的物理属性和初始接触状态,进行接触状态优化,并得到优化后的每个手指尖的坐标和压力,还可以根据手的姿态信息计算每个手指尖的置信度,进而根据优化后的每个手指尖的坐标和压力及置信度计算手的最终姿态与每个手指尖的最终坐标,从而可以实现对任何手与物体交互的重建结果进行优化,使得手与物体的交互动作更符合物理规律,提升了重建结果的准确性,有效的满足手与物体实时重建的需求。
图5为本申请实施例提供的电子设备的结构示意图。该电子设备可以包括:
存储器501、处理器502及存储在存储器501上并可在处理器502上运行的计算机程序。
处理器502执行程序时实现上述实施例中提供的基于物理的手与物体交互过程的实时重建方法。
进一步地,电子设备还包括:
通信接口503,用于存储器501和处理器502之间的通信。
存储器501,用于存放可在处理器502上运行的计算机程序。
存储器501可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器501、处理器502和通信接口503独立实现,则通信接口503、存储器501和处理器502可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(PeripheralComponent,简称为PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选地,在具体实现上,如果存储器501、处理器502及通信接口503,集成在一块芯片上实现,则存储器501、处理器502及通信接口503可以通过内部接口完成相互间的通信。
处理器502可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的基于物理的手与物体交互过程的实时重建方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或N个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种基于物理的手与物体交互过程的实时重建方法,其特征在于,包括以下步骤:
基于深度输入数据获取物体的几何与位姿信息和手的姿态信息;
根据所述物体的几何与位姿信息计算所述物体的物理属性和初始接触状态,并基于所述物理属性和初始接触状态进行接触状态优化,得到优化后的每个手指尖的坐标和压力;以及
根据所述手的姿态信息计算所述每个手指尖的置信度,并根据所述优化后的每个手指尖的坐标和压力及所述置信度计算所述手的最终姿态与所述每个手指尖的最终坐标。
2.根据权利要求1所述的方法,其特征在于,所述物理属性包括线速度与角速度、线加速度和角加速度、质量、质心和惯性张量中的至少一项。
3.根据权利要求1或2所述的方法,其特征在于,所述基于所述物理属性和初始接触状态进行接触状态优化,包括:
基于预设的带约束的能量优化问题,求解力和接触状态解释物体的运动,其中,优化变量为接触点上的力和优化后的接触状态中每个手指尖到物体表面的距离。
4.根据权利要求1所述的方法,其特征在于,所述置信度的计算公式为:
Ci=min(1,Ni/Ns)
其中,Ci表示每个手指尖的置信度,Ni表示手指尖i附近(距离小于3mm)的深度点数量,其中,预定义Ns=75来表示能够较为准确地预测手指尖位置所需要的深度点数量。
5.一种基于物理的手与物体交互过程的实时重建装置,其特征在于,包括:
获取模块,用于基于深度输入数据获取物体的几何与位姿信息和手的姿态信息;
第一计算模块,用于根据所述物体的几何与位姿信息计算所述物体的物理属性和初始接触状态,并基于所述物理属性和初始接触状态进行接触状态优化,得到优化后的每个手指尖的坐标和压力;以及
第二计算模块,用于根据所述手的姿态信息计算所述每个手指尖的置信度,并根据所述优化后的每个手指尖的坐标和压力及所述置信度计算所述手的最终姿态与所述每个手指尖的最终坐标。
6.根据权利要求5所述的装置,其特征在于,所述物理属性包括线速度与角速度、线加速度和角加速度、质量、质心和惯性张量中的至少一项。
7.根据权利要求5或6所述的装置,其特征在于,所述第一计算模块进一步用于基于预设的带约束的能量优化问题,求解力和接触状态解释物体的运动,其中,优化变量为接触点上的力和优化后的接触状态中每个手指尖到物体表面的距离。
8.根据权利要求5所述的装置,其特征在于,所述置信度的计算公式为:
Ci=min(1,Ni/Ns).
其中,Ci表示每个手指尖的置信度,Ni表示手指尖i附近(距离小于3mm)的深度点数量,其中,预定义Ns=75来表示能够较为准确地预测手指尖位置所需要的深度点数量。
9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-4任一项所述的基于物理的手与物体交互过程的实时重建方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-4任一项所述的基于物理的手与物体交互过程的实时重建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210715807.8A CN115239906A (zh) | 2022-06-22 | 2022-06-22 | 基于物理的手与物体交互过程的实时重建方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210715807.8A CN115239906A (zh) | 2022-06-22 | 2022-06-22 | 基于物理的手与物体交互过程的实时重建方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115239906A true CN115239906A (zh) | 2022-10-25 |
Family
ID=83670211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210715807.8A Pending CN115239906A (zh) | 2022-06-22 | 2022-06-22 | 基于物理的手与物体交互过程的实时重建方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115239906A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN119006702A (zh) * | 2024-07-25 | 2024-11-22 | 中山大学 | 一种根据单帧输入图像的手部图像生成方法、装置和存储介质 |
-
2022
- 2022-06-22 CN CN202210715807.8A patent/CN115239906A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN119006702A (zh) * | 2024-07-25 | 2024-11-22 | 中山大学 | 一种根据单帧输入图像的手部图像生成方法、装置和存储介质 |
CN119006702B (zh) * | 2024-07-25 | 2025-05-06 | 中山大学 | 一种根据单帧输入图像的手部图像生成方法、装置和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11321895B2 (en) | Neural state machine digital character animation | |
KR102292028B1 (ko) | 제스처 인식 방법, 장치, 전자 기기 및 저장 매체 | |
US11410464B2 (en) | Detection of hand gestures using gesture language discrete values | |
CN110561421B (zh) | 机械臂间接拖动示教方法及装置 | |
US11244506B2 (en) | Tracking rigged polygon-mesh models of articulated objects | |
Holden et al. | Learning an inverse rig mapping for character animation | |
JP7192143B2 (ja) | オンライン学習を利用した物体追跡のための方法およびシステム | |
US20220382246A1 (en) | Differentiable simulator for robotic cutting | |
US20210335028A1 (en) | Motion model refinement based on contact analysis and optimization | |
US12248286B2 (en) | Inferring device, training device, inferring method, and training method | |
US20230237342A1 (en) | Adaptive lookahead for planning and learning | |
CN115239906A (zh) | 基于物理的手与物体交互过程的实时重建方法及装置 | |
Lakshmipathy et al. | Kinematic motion retargeting for contact-rich anthropomorphic manipulations | |
CN119311122A (zh) | 基于自适应多模态融合的云游戏虚拟现实手势交互方法、设备及存储介质 | |
EP3639193B1 (en) | Human feedback in 3d model fitting | |
CN110400369A (zh) | 一种人脸重建的方法、系统平台及存储介质 | |
CN118799208A (zh) | 基于整流扩散模型的图像增强方法 | |
KR20220086971A (ko) | 손 관절을 추적하는 방법 및 장치 | |
AU2017213546B2 (en) | Face painting on a single image with an underlying 3d model | |
CN112905006B (zh) | 基于物理仿真的虚拟现实人手交互方法和装置 | |
CN116934948A (zh) | 基于多视角视频的可重光照三维数字人构建方法及装置 | |
CN117315758A (zh) | 面部表情的检测方法、装置、电子设备及存储介质 | |
Yu et al. | INCAME: Interruptible CNN accelerator for multirobot exploration | |
Duret et al. | Toward synthetic data generation for robotic tactile manipulations | |
US20230393711A1 (en) | Context-Based Copy-Paste Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |