CN118349099A - 头势识别方法和装置 - Google Patents
头势识别方法和装置 Download PDFInfo
- Publication number
- CN118349099A CN118349099A CN202310064347.1A CN202310064347A CN118349099A CN 118349099 A CN118349099 A CN 118349099A CN 202310064347 A CN202310064347 A CN 202310064347A CN 118349099 A CN118349099 A CN 118349099A
- Authority
- CN
- China
- Prior art keywords
- head
- determining
- data
- frequency band
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000009471 action Effects 0.000 claims abstract description 38
- 230000000737 periodic effect Effects 0.000 claims abstract description 34
- 238000012545 processing Methods 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 9
- 230000002123 temporal effect Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000004091 panning Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/012—Head tracking input arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Social Psychology (AREA)
- Psychiatry (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及计算机技术领域,尤其涉及一种头势识别方法和装置。先获取第一时间长度内用户的头部姿态数据,然后确定头部姿态数据的频域分布,并在头部姿态数据的频域分布确定符合周期信号条件的中心频段区域,根据中心频段区域的振幅和功率占比中的至少一项,确定用户是否做出预设动作。该方法通过计算频域分布中特定频段的振幅或功率占比来确定用户的点头或摇头动作,提高了头势识别的精确度。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种头势识别方法和装置。
背景技术
随着计算机技术的发展,其影响力遍布生活中的各个领域,使得其他领域变得越来越智能化。例如,汽车领域中,车辆通常会安装车载设备(如车载电视、车载音响等),丰富驾驶员的驾驶体验。然而,驾驶员有时会在车辆行驶过程中对车载设备进行一定的操作,例如,修改车辆导航的目的地,或者切换车载音响播放的歌曲,该行为会使得驾驶员一只手脱离方向盘,分散驾驶员的注意力,可能会导致交通事故。
发明内容
本发明实施例提供了一种头势识别方法和装置,通过计算频域分布中特定频段的振幅和功率占比来确定用户的点头或摇头动作,提高了头势识别的精确度。
第一方面,本发明实施例提供了一种头势识别方法,包括:
获取第一时间长度内用户的头部姿态数据;
确定所述头部姿态数据的频域分布,并在所述头部姿态数据的频域分布确定符合周期信号条件的中心频段区域;
根据所述中心频段区域的振幅和功率占比中的至少一项,确定所述用户是否做出预设动作。
一种实现方式中,所述在所述头部姿态数据的频域分布确定符合周期信号条件的中心频段区域,包括:
根据所述头部姿态数据的时域分布,确定所述头部姿态数据的预估频率;
根据所述预估频率,在所述头部姿态数据的频域分布确定中心频段;
在所述头部姿态数据的频域分布确定至少包含所述中心频段的区域作为所述中心频段区域。
一种实现方式中,所述根据所述头部姿态数据的时域分布,确定所述头部姿态数据的预估频率,包括:
根据所述头部姿态数据在时域分布的多个峰值确定所述头部姿态数据的预估周期;
将所述预估周期的倒数确定为所述头部姿态数据的预估频率。
一种实现方式中,所述根据所述头部姿态数据在时域分布的多个峰值确定所述头部姿态数据的预估周期,包括:
根据多个波峰/谷在时间维度的差值确定所述头部姿态数据的多个周期值;
确定所述多个周期值的平均值和标准差,并将与所述平均值的差值大于X倍所述标准差的周期值删除,X为正整数;
将剩余的周期值的中位数确定所述预估周期。
一种实现方式中,所述根据所述预估频率,在所述头部姿态数据的频域分布确定中心频段,包括:
根据公式C=f*L确定所述频域分布的中心频段,C为所述中心频段,f为所述预估频率,L为所述第一时间长度。
一种实现方式中,所述根据所述中心频段区域的振幅和功率占比中的至少一项,确定所述用户是否做出预设动作,包括:
确定所述中心频段区域中的最大振幅;
若所述最大振幅大于第一阈值,则确定所述用户出现所述预设动作。
一种实现方式中,述根据所述中心频段区域的振幅和功率占比中的至少一项,确定所述用户是否做出预设动作,包括:
确定所述中心频段区域的功率在整个频段的总功率中的功率占比;
若所述功率占比大于第二阈值,则确定所述用户出现所述预设动作。
一种实现方式中所述预设动作包括:周期性点头或者周期性摇头。
一种实现方式中,所述获取第一时间长度内用户的头部姿态数据,包括:
根据公式F=N/L确定所述头部姿态数据的采样频率,F为所述采样频率,L为所述第一时间长度,N为在所述第一时间长度内需采集的头部姿态数据的数量;
基于所述采样频率在已获取的用户的图像数据中采集所述头部姿态数据。
一种实现方式中,所述在所述头部姿态数据的频域分布确定符合周期信号条件的中心频段区域之前,还包括:
将所述第一时间长度内采集的所述头部姿态数据发送至识别队列,若检测到所述识别队列中的头部姿态数据的数量不为N,则对所述头部姿态数据进行插值处理;
其中,插值处理后的头部姿态数据的数量为N。
一种实现方式中,所述在所述头部姿态数据的频域分布确定符合周期信号条件的中心频段区域之前,还包括:
对所述头部姿态数据进行高斯滤波。
一种实现方式中,还包括:
在所述识别队列中N个头部姿态数据识别完成之后,将所述识别队列自队首开始M个头部姿态数据弹出所述识别队列,并将新采集的M个头部姿态数据发送至所述识别队列的队尾;
其中,M为小于或等于N的整数。
一种实现方式中,所述头部姿态数据包括:所述用户头部的横向旋转角数据或纵向旋转角数据。
第二方面,本发明实施例提供了一种头势识别装置,包括:
获取模块,用于获取第一时间长度内用户的头部姿态数据;
处理模块,用于确定所述头部姿态数据的频域分布,并在所述头部姿态数据的频域分布确定符合周期信号条件的中心频段区域;
所述处理模块,还用于根据所述中心频段区域的振幅和功率占比中的至少一项,确定所述用户是否做出预设动作。
第三方面,本发明实施例还提供一种车辆,包括:
车载设备,所述车载设备运行时能够实现第一方面提供的方法。
第四方面,本发明实施例提供了一种电子芯片,包括:
至少一个处理器;
所述处理器与至少一个存储器耦合,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行第一方面提供的方法。
第五方面,本发明实施例提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现第一方面提供的方法。
第六方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行第一方面提供的方法。
本发明实施例中,先获取第一时间长度内用户的头部姿态数据,然后确定头部姿态数据的频域分布,并在头部姿态数据的频域分布确定符合周期信号条件的中心频段区域,根据中心频段区域的振幅和功率占比中的至少一项,确定用户是否做出预设动作。该方法通过计算频域分布中特定频段的振幅和功率占比中的至少一项来确定用户的点头或摇头动作,提高了头势识别的精确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种头势识别方法的流程图;
图2为本发明实施例提供的另一种头势识别方法的流程图;
图3为本发明实施例提供的一种头势识别装置的结构示意图;
图4为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为了更好的理解本说明书的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本说明书保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
在驾驶员驾驶车辆过程中,车载设备可以根据驾驶员的头部动作进行相应的处理,如切换音乐等,头部动作识别的精确性是车载设备需要保证的。
图1为本发明实施例提供的一种头势识别方法的流程图。该方法可以应用于车载设备或其他处理设备,如图1所示,该方法可以包括:
步骤1,获取第一时间长度内用户的头部姿态数据。
本发明实施例中,车载设备可以通过车载摄像装置获取用户(驾驶员或其他车内用户)的头部姿态数据。头部姿态数据主要包括用户头部的横向旋转角数据或纵向旋转角数据,头部姿态数据可以显示于二维坐标系中,横坐标为时间,纵坐标为横向旋转角或纵向旋转角,旋转角的数值可以在负180度到正180度之间。例如,用户看向正前方时,横向旋转角和纵向旋转角都为0。当用户向左转头时,横向旋转角可以变为负90度,当驾驶员看向上方时,纵向旋转角可以变为正90度。如果用户在1秒内点头3次,则纵向旋转角可以看做一段连续的周期信号;如果用户在1秒内摇头3次,则横向旋转角可以看做一段连续的周期信号。第一时间长度为预先设置的合理数值,第一用户完成周期性点头或周期性摇头所需的时间通常小于第一时间长度,例如,第一时间长度可以为2.5秒或3秒或其他合理数值。
步骤2,确定所头部姿态数据的频域分布,并在头部姿态数据的频域分布确定符合周期信号条件的中心频段区域。
车载设备对获取的头部姿态数据进行时域到频域的转换,确定其频域分布,然后在多个频段中确定符合周期信号条件的中心频段区域。
一种可选的实施例中,车载设备可以通过傅里叶变换确定头部姿态数据的频域分布。车载设备确定头部姿态数据频域分布的具体步骤可以包括:根据头部姿态数据的时域分布,确定头部姿态数据的预估频率;根据预估频率,在头部姿态数据的频域分布确定中心频段;在头部姿态数据的频域分布确定至少包含中心频段的区域作为中心频段区域。
具体的,当第一用户进行周期性点头或周期性摇头时,头部姿态数据显示为周期性信号,车载设备可以先根据周期性信号的多个峰值确定多个周期值,如第一个波峰和第二个波峰为第一周期值,第一个波谷和第二个波谷为第二周期值,第二个波峰和第三个波峰为第三周期值。然后,车载设备可以通过数学手段删除误差较大的周期值,例如,确定多个周期值的平均值和标准差,将与平均值的差值大于X倍标准差的周期值删除,X为正整数,通常为3。之后,车载设备可以将剩余周期值的中位数确定为预估周期,并将预估周期的倒数确定为头部姿态数据的预估频率。车载设备确定预估频率后,可以根据公式C=f*L确定频域分布的中心频段,C为中心频段,f为预估频率,L为第一时间长度。
步骤3,根据中心频段区域的振幅和功率占比中的至少一项,确定用户是否做出预设动作。
本发明实施例中的预设动作通常为周期性点头或周期性摇头,车载设备可以确定中心频段区域中的最大振幅或者中心频段区域的功率在整个频段的总功率中的功率占比,若检测到最大振幅大于第一阈值或者功率占比大于第二阈值,则确定用户出现预设动作。车载设备可以只根据最大振幅或功率占比判断用户是否出现预设动作,也可以根据二者同时判断,提高准确性。
本发明实施例中,车载设备通过计算频域分布中特定频段的振幅和功率占比中的至少一项来确定用户的点头或摇头动作,能够准确识别用户的头部动作,进行相应的处理。
一种可选的实施例中,车载设备还可以设置其他的预设动作,并根据用户其他部位的姿态数据判断用户是否出现预设动作。车载设备计算中心频段区域的最大振幅或功率占比主要用于判断头部姿态数据中是否包含周期性信号。除了周期性点头或周期性摇头外,用户短时间内快速左右挥手或上下挥手也可以被识别为一种周期性信号。车载设备同样可以通过车载摄像装置获取用户的手部姿态数据,并根据上述头部姿态数据的判断流程确定用户是否出现预设动作。其他能够被判定为周期性信号的动作也可以作为本发明实施例的预设动作。
一种可选的实施例中,车载设备通过车载摄像装置获取用户的头部姿态数据的过程主要包括:基于采样频率在已获取的用户的图像数据中采集头部姿态数据。其中,根据公式F=N/L可以确定采样频率,F为采样频率,L为第一时间长度,N为在第一时间长度内需采集的头部姿态数据的数量。
一种可选的实施例中,车载设备确定头部姿态数据后,会将第一时间长度内采集的头部姿态数据发送至识别队列,若检测到识别队列中的头部姿态数据的数量不为N,则对头部姿态数据进行插值处理,其中,插值处理后的头部姿态数据的数量为N。例如,第一时间长度设置为2.5秒,正常情况下,车载摄像装置在2.5秒内可以获取64帧图像数据,车载设备可以采集64个头部姿态数据。在实际采集时,由于帧率可能不稳定,车载摄像装置获取了60帧图像数据,车载设备能够采集60个头部姿态数据。采集头部姿态数据时,会记录每个头部姿态数据的采集时间。车载设备可以将2.5秒的采集时间平均划分为64份(1-64),每份对应一个时间点和头部姿态数据。然后根据实际采集的60个头部姿态数据的采集时间确定4个因帧率不稳定而漏采集的时间点,并补全4个时间点对应的头部姿态数据。车载设备可以采用线性差值的方法补全缺失的数据。例如,时间点50对应的头部姿态数据缺失,时间点49对应的头部姿态数据为正50度,时间点51对应的头部姿态数据为正54度,则车载设备可以将二者均值确定为时间点50对应的头部姿态数据,即正52度。若确定的头部姿态数据为于采集时间的两端,如时间点64对应的头部姿态数据缺失,时间点63对应的头部姿态数据为负30度,时间点62对应的头部姿态数据为负20度,则车载设备将时间点64对应的头部姿态数据确定为负40度,使得三个头部姿态数据在二维坐标系中过同一条直线。若实际采集的头部姿态数据大于64,也需进行差值处理。例如,时间点60和时间点61分别有各自对应的头部姿态数据,时间点60和时间点61之间还有一个头部姿态数据,车载设备可以将多余的头部姿态数据删除。又例如,时间点50和时间点52分别有各自对应的头部姿态数据,时间点51对应两个头部姿态数据:正30度和正32度,车载设备可以将二者均值确定为时间点51对应的头部姿态数据,即正31度。
本发明实施例通过对头部姿态数据进行差值处理,能够有效降低车载摄像装置帧率不稳定带来的影响,间接提高预设动作识别的准确度。
一种可选的实施例中,车载设备还会对差值处理后的头部姿态数据进行高斯滤波,消除噪声信号对头部姿态数据的影响。
一种可选的实施例中,在识别队列中N个头部姿态数据识别完成之后,车载设备会将识别队列自队首开始M个头部姿态数据弹出识别队列,并将新采集的M个头部姿态数据发送至识别队列的队尾,其中,M为小于或等于N的整数。例如,车载设备先对识别队列中的64个头部姿态数据进行识别,识别过后,将识别队列中的前4个头部姿态数据弹出,并将新采集的4个头部姿态数据发送至识别队列,放入剩余60个头部姿态数据的队尾,组成新的64个头部姿态数据,车载继续对其进行识别。车载设备可以循环重复上述操作。
图2为本发明实施例提供的另一种头势识别方法的流程图。如图2所示,该方法可以包括:
步骤201,采集头部姿态数据。
车辆启动后,车载设备通过车载摄像装置实时获取用户的图像数据,并在图像数据中采集头部姿态数据。
步骤202,差值处理。
车载设备将采集的头部姿态数据发送至识别队列,若检测到识别队列中的头部姿态数据的个数与预设的个数不同,则进行差值处理。
步骤203,高斯滤波处理。
车载设备对头部姿态数据进行高斯滤波处理,消除噪声干扰。
步骤204,确定预估频率。
车载设备根据头部姿态数据的时域分布确定预估频率。
步骤205,确定频域分布。
车载设备通过傅里叶变换确定头部姿态数据的频域分布。
步骤206,确定中心频段区域。
车载设备基于步骤204确定的预估频率和公式确定中心频段,将以中心频段为中心的一段区域确定为中心频段区域,区域范围可以合理设置。
步骤207,确定最大振幅。
车载设备确定中心频段区域中的最大振幅。
步骤208,判断是否大于第一阈值。
车载设备判断步骤207确定的最大振幅是否大于第一阈值,若是,则进入步骤211,否则进入结束整个流程。
步骤209,确定功率占比。
车载设备确定中心频段区域的功率在所有频段总功率的功率占比。
步骤210,判断是否大于第二阈值。
车载设备判断步骤209确定的功率占比是否大于第二阈值,若是,则进入步骤211,否则结束整个流程。
步骤211,确定用户出现预设动作,进行相应处理。
车载设备确定用户出现预设动作后,进行预设动作关联的任务处理。例如,检测到用户周期性摇头时,切换歌曲播放,检测到用户周期性点头时,打开车内空调。
车载设备通过上述流程可以实时检测车载用户的头部动作,并在出现预设动作时进行相应处理,提高了用户体验和驾驶安全性。
图3为本发明实施例提供的一种头势识别装置的结构示意图。该装置可以部署于车载设备,如图3所示,可以包括:获取模块310和处理模块320。
获取模块310,用于获取第一时间长度内用户的头部姿态数据。
处理模块320,用于确定头部姿态数据的频域分布,并在头部姿态数据的频域分布确定符合周期信号条件的中心频段区域。
所述处理模块320,还用于根据中心频段区域的振幅和功率占比中的至少一项,确定用户是否做出预设动作。
本发明实施例还提供一种车辆,该车辆可以装载车载设备,车载设备运行时能够实现本发明实施例的头势识别方法。
图4为本发明实施例提供的一种电子设备的结构示意图。图4显示的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于:一个或者多个处理器410,存储器430,连接不同系统组件(包括存储器430和处理器410)的通信总线440。
通信总线440表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
电子设备典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器430可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)和/或高速缓存存储器。电子设备可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read Only Memory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read Only Memory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与通信总线440相连。存储器430可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块的程序/实用工具,可以存储在存储器430中,这样的程序模块包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块通常执行本发明所描述的实施例中的功能和/或方法。
电子设备也可以与一个或多个外部设备通信,还可与一个或者多个使得用户能与该电子设备交互的设备通信,和/或与使得该电子设备能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过通信接口420进行。并且,电子设备还可以通过网络适配器(图4中未示出)与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信,上述网络适配器可以通过通信总线440与电子设备的其它模块通信。应当明白,尽管图4中未示出,可以结合电子设备使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(RedundantArrays of Independent Drives;以下简称:RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器410通过运行存储在存储器430中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例提供的头势识别方法。
本发明实施例还提供一种计算机程序产品,上述计算机程序产品包括计算机程序,计算机程序被处理器执行时实现本发明实施例提供的头势识别方法。
本发明实施例还提供一种计算机可读存储介质,上述计算机可读存储介质存储计算机指令,上述计算机指令使上述计算机执行本发明实施例提供的头势识别方法。
上述计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ReadOnly Memory;以下简称:ROM)、可擦式可编程只读存储器(Erasable Programmable ReadOnly Memory;以下简称:EPROM)或闪存、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (14)
1.一种头势识别方法,其特征在于,包括:
获取第一时间长度内用户的头部姿态数据;
确定所述头部姿态数据的频域分布,并在所述头部姿态数据的频域分布确定符合周期信号条件的中心频段区域;
根据所述中心频段区域的振幅和功率占比中的至少一项,确定所述用户是否做出预设动作。
2.根据权利要求1所述的方法,其特征在于,所述在所述头部姿态数据的频域分布确定符合周期信号条件的中心频段区域,包括:
根据所述头部姿态数据的时域分布,确定所述头部姿态数据的预估频率;
根据所述预估频率,在所述头部姿态数据的频域分布确定中心频段;
在所述头部姿态数据的频域分布确定至少包含所述中心频段的区域作为所述中心频段区域。
3.根据权利要求2所述的方法,其特征在于,所述根据所述头部姿态数据的时域分布,确定所述头部姿态数据的预估频率,包括:
根据所述头部姿态数据在时域分布的多个峰值确定所述头部姿态数据的预估周期;
将所述预估周期的倒数确定为所述头部姿态数据的预估频率。
4.根据权利要求3所述的方法,其特征在于,所述根据所述头部姿态数据在时域分布的多个峰值确定所述头部姿态数据的预估周期,包括:
根据多个波峰/谷在时间维度的差值确定所述头部姿态数据的多个周期值;
确定所述多个周期值的平均值和标准差,并将与所述平均值的差值大于X倍所述标准差的周期值删除,X为正整数;
将剩余的周期值的中位数确定所述预估周期。
5.根据权利要求2所述的方法,其特征在于,所述根据所述预估频率,在所述头部姿态数据的频域分布确定中心频段,包括:
根据公式C=f*L确定所述频域分布的中心频段,C为所述中心频段,f为所述预估频率,L为所述第一时间长度。
6.根据权利要求1所述的方法,其特征在于,所述根据所述中心频段区域的振幅和功率占比中的至少一项,确定所述用户是否做出预设动作,包括:
确定所述中心频段区域中的最大振幅;
若所述最大振幅大于第一阈值,则确定所述用户出现所述预设动作。
7.根据权利要求1所述的方法,其特征在于,所述根据所述中心频段区域的振幅和功率占比中的至少一项,确定所述用户是否做出预设动作,包括:
确定所述中心频段区域的功率在整个频段的总功率中的功率占比;
若所述功率占比大于第二阈值,则确定所述用户出现所述预设动作。
8.根据权利要求1所述的方法,其特征在于,所述获取第一时间长度内用户的头部姿态数据,包括:
根据公式F=N/L确定所述头部姿态数据的采样频率,F为所述采样频率,L为所述第一时间长度,N为在所述第一时间长度内需采集的头部姿态数据的数量;
基于所述采样频率在已获取的用户的图像数据中采集所述头部姿态数据。
9.根据权利要求1至8任一项所述的方法,其特征在于,所述头部姿态数据包括:所述用户头部的横向旋转角数据或纵向旋转角数据。
10.一种头势识别装置,其特征在于,包括:
获取模块,用于获取第一时间长度内用户的头部姿态数据;
处理模块,用于确定所述头部姿态数据的频域分布,并在所述头部姿态数据的频域分布确定符合周期信号条件的中心频段区域;
所述处理模块,还用于根据所述中心频段区域的振幅和功率占比中的至少一项,确定所述用户是否做出预设动作。
11.一种车辆,其特征在于,所述车辆包括:
车载设备,所述车载设备运行时能够实现如权利要求1至9任一项所述的方法。
12.一种电子设备,其特征在于,包括:
至少一个处理器;
所述处理器与至少一个存储器耦合,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至9任一项所述的方法。
13.一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至9任一项所述的方法。
14.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至9任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310064347.1A CN118349099A (zh) | 2023-01-13 | 2023-01-13 | 头势识别方法和装置 |
PCT/CN2023/110246 WO2024148793A1 (zh) | 2023-01-13 | 2023-07-31 | 头势识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310064347.1A CN118349099A (zh) | 2023-01-13 | 2023-01-13 | 头势识别方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118349099A true CN118349099A (zh) | 2024-07-16 |
Family
ID=91814671
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310064347.1A Pending CN118349099A (zh) | 2023-01-13 | 2023-01-13 | 头势识别方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN118349099A (zh) |
WO (1) | WO2024148793A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118567489A (zh) * | 2024-07-31 | 2024-08-30 | 杭州锐见智行科技有限公司 | 一种车辆控制的方法、装置、电子设备及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10444831B2 (en) * | 2015-12-07 | 2019-10-15 | Eyeware Tech Sa | User-input apparatus, method and program for user-input |
US10934764B2 (en) * | 2016-09-08 | 2021-03-02 | Magna Closures Inc. | Radar detection system for non-contact human activation of powered closure member |
CN107172514B (zh) * | 2017-05-18 | 2019-08-27 | 歌尔科技有限公司 | 呼叫处理方法和装置 |
CN110858097A (zh) * | 2018-08-22 | 2020-03-03 | 阿里巴巴集团控股有限公司 | 一种交互方法及装置 |
CN110547807A (zh) * | 2019-09-17 | 2019-12-10 | 深圳市赛梅斯凯科技有限公司 | 驾驶行为分析方法、装置、设备及计算机可读存储介质 |
-
2023
- 2023-01-13 CN CN202310064347.1A patent/CN118349099A/zh active Pending
- 2023-07-31 WO PCT/CN2023/110246 patent/WO2024148793A1/zh unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118567489A (zh) * | 2024-07-31 | 2024-08-30 | 杭州锐见智行科技有限公司 | 一种车辆控制的方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2024148793A1 (zh) | 2024-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108172213B (zh) | 娇喘音频识别方法、装置、设备及计算机可读介质 | |
US11361555B2 (en) | Road environment monitoring device, road environment monitoring system, and road environment monitoring program | |
CN110287810B (zh) | 车门动作检测方法、装置和计算机可读存储介质 | |
CN115720253B (zh) | 视频处理方法、装置、车辆以及存储介质 | |
CN108009463A (zh) | 一种身份识别的方法及装置 | |
CN115761702B (zh) | 车辆轨迹生成方法、装置、电子设备和计算机可读介质 | |
CN118349099A (zh) | 头势识别方法和装置 | |
CN112630799A (zh) | 用于输出信息的方法和装置 | |
CN112622923B (zh) | 用于控制车辆的方法和装置 | |
CN114373189A (zh) | 一种行为检测方法、装置、终端设备及存储介质 | |
CN115817463B (zh) | 车辆避障方法、装置、电子设备和计算机可读介质 | |
CN113743456A (zh) | 一种基于无监督学习的场景定位方法及系统 | |
CN114103944B (zh) | 车间时距调整方法、装置和设备 | |
CN110363193A (zh) | 车辆重识别方法、装置、设备和计算机存储介质 | |
CN114333404A (zh) | 一种停车场寻车方法、装置、车辆及存储介质 | |
CN110189242B (zh) | 图像处理方法和装置 | |
WO2024148794A1 (zh) | 头部动作识别方法和装置 | |
CN111833847B (zh) | 语音处理模型训练方法和装置 | |
CN112558036A (zh) | 用于输出信息的方法和装置 | |
CN117036190A (zh) | 图像去噪方法、装置及电子设备 | |
CN116311155A (zh) | 障碍物信息生成方法、装置、电子设备和计算机可读介质 | |
CN111348047B (zh) | 一种道路路面状况分析方法、装置和存储介质 | |
CN112132031B (zh) | 车款识别方法、装置、电子设备及存储介质 | |
CN119176146B (zh) | 数据处理方法、装置、设备、存储介质及产品 | |
CN112477886A (zh) | 无人驾驶车辆的控制方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |