CN111128157B

CN111128157B - 一种智能家电的免唤醒语音识别控制方法、计算机可读存储介质及空调

Info

Publication number: CN111128157B
Application number: CN201911270433.8A
Authority: CN
Inventors: 李保水; 王子; 梁博; 廖湖锋; 王慧君
Original assignee: Gree Electric Appliances Inc of Zhuhai
Current assignee: Gree Electric Appliances Inc of Zhuhai
Priority date: 2019-12-12
Filing date: 2019-12-12
Publication date: 2022-05-27
Anticipated expiration: 2039-12-12
Also published as: CN111128157A

Abstract

本发明提供了一种智能家电的免唤醒语音识别控制方法、计算机可读存储介质及空调，预先设定物体与智能家电的注视唤醒关系,通过视觉传感器实时检测当前环境的人物人体信息,利用神经网络算法分析判断人物是否有意启动对应的智能家电,若判断为有意启动对应的智能家电,则智能家电进入免唤醒状态采集语音信息。通过绑定物体与智能家电的关系，物体可以是设备也可以日常用品，当用户正视某一物体即可对应语音控制对应绑定的智能家电，用户能够免唤醒语音操作空调，提升了用户的无感交互体验，同时也在一定程度上增加了其语音唤醒的趣味性。

Description

一种智能家电的免唤醒语音识别控制方法、计算机可读存储介质及空调

技术领域

本发明涉及语音唤醒技术领域，具体涉及一种智能家电的免唤醒语音识别控制方法、计算机可读存储介质及空调。

背景技术

目前随着人工智能领域的迅速发展以及人们对智能监控、智能家居及新型人机交互的需求日益提升。目前市面上的智能语音音箱已经遍地开花，语音交互技术已经较为成熟，语音交互应用于家电产品也逐渐增多，如语音空调。基于图像无感交互技术在家电行业的应用也渐渐地出现，图像技术结合语音控制的控制迎来新的机遇。通常我们控制语音空调（或语音智能设备），每次发出语音控制指令之前都需要进行先唤醒的操作，发出语音唤醒词控制指令，待唤醒后才开始控制指令的识别操作，每次操作都需要唤醒。

发明内容

针对现有技术的不足，本发明提出了一种智能家电的免唤醒语音识别控制方法，通过结合图像识别技术进行免唤醒直接语音空调，提升用户的交互体验，同时通过设备绑定实现正视某一设备即可控制某一设备，无需每次操作设备时要唤醒设备名称。

为实现上述目的，本发明采用如下技术方案：

一种智能家电的免唤醒语音识别控制方法，预先设定物体与智能家电的注视唤醒关系,通过视觉传感器实时检测当前环境的人物人体信息,利用神经网络算法分析判断人物是否有意启动对应的智能家电,若判断为有意启动对应的智能家电,则智能家电进入免唤醒状态采集语音信息。通过绑定物体与智能家电的关系，物体可以是设备也可以日常用品，当用户正视某一物体即可对应语音控制对应绑定的智能家电，用户能够免唤醒语音操作空调，提升了用户的无感交互体验，同时也在一定程度上增加了其语音唤醒的趣味性。

进一步的，所述通过视觉传感器实时检测当前环境的人物人体信息具体为：通过双目摄像头实时检测可视区域人物脸部和头部的动态信息，脸部的动态信息具体包括眼睛状态信息和嘴部动态信息。通过检测的眼睛状态信息和嘴部动态信息可以直观直接反映用户当前的意图，提高判断的准确率，降低误唤醒的几率。

进一步的，所述利用神经网络算法分析判断人物是否有意启动对应的智能家电具体为：检测并识别人物头部方向和仰角、脸部的方向和仰角、瞳孔眼珠占位比，通过深度学习循环神经网络识别判断人物是否正在注视目标智能家电；若用户是在注视目标智能家电，则判断人物嘴部是否处于运动发声状态，若人物嘴部处于运动发声状态，则判断人物有意启动目标智能家电。先通过头部和脸部的信息判断是否处于注视智能家电状态，再检测嘴部动作进入唤醒操作，双目摄像头检测到人脸时即刻开启检测嘴部状态，通过循环记忆神经网络匹配算法模型识别嘴部动作，使得设备能够更准确地识别到用户将要控制设备，进入免唤醒，降低误判率。

进一步的，所述通过深度学习循环神经网络识别判断人物是否正在注视目标智能家电具体为：将获取到的人物脸部图像进行平滑去噪预处理，再进行图像特征提取，将图像信息通过模板分类器处理，与预设正脸图像进行算法比对处理，判断人脸图像偏置角度是否满足上下左右偏置角度在正负y°以内，若满足则确定用户正在注视目标智能家电，其中y为预设角度值。设置的图像偏置角度可以有效解决了图像正脸识别的识别率问题，有效地避免高误识别率问题，提高识别率。

进一步的，所述预先设定物体与智能家电的注视唤醒关系具体为：设定若干组目标物体与智能家电之间一一对应绑定关系，注视目标物体A设定对应免唤醒可语音控制智能家电A。用户无需每次操作设备时要唤醒设备名称，可直接正视某一目标物体即可控制某一智能家电。

进一步的，所述通过深度学习循环神经网络识别判断人物是否正在注视目标智能家电具体为：若判断人物未注视目标智能家电，则结束唤醒过程。当用户未注视目标智能家电，表明其没有唤醒智能家电的意图，这时候就不用进行下一步的判断，直接结束唤醒，避免造成误唤醒的情况发生。

进一步的，所述判断人物嘴部是否处于运动发声状态具体为：若判断人物嘴部处于闭合状态，则结束唤醒过程。在用户注视目标智能家电的基础上，若人物嘴部处于闭合说明用户也没有唤醒智能家电的意图，两步的判断确保了唤醒的精确。

进一步的，所述判断人物有意启动目标智能家电具体为：人物嘴部处于运动发声状态，采集语音信息并识别，若识别检测到的语音是控制指令，则进入智能家电语音控制状态；若识别检测到的语音不是控制指令，则结束唤醒过程。对检测到的语音进行精确的分析判断，可以有效提高识别率。

一种计算机可读存储介质，用于存储计算机程序，所述计算机程序被处理器调用时实现以上任一项所述的智能家电的免唤醒语音识别控制方法。

一种空调，包括处理器和存储器，所述存储器用于存储计算机程序，所述计算机程序被所述处理器调用时实现以上任一项所述的智能家电的免唤醒语音识别控制方法。

本发明提供的一种智能家电的免唤醒语音识别控制方法、计算机可读存储介质及空调的有益效果在于：智能家电配置双目摄像头技术，通过图像识别技术检测人脸的注视情况及嘴型动作，利用循环神经网络处理和预测图像数据，判断用户将控制空调，此时空调处于免唤醒状态，用户可以直接说语音命令控制智能家电，提升了用户的无感交互体验；用户无需每次操作设备时要唤醒设备名称，可直接正视某一设备即可控制某一设备，增加了唤醒控制的趣味性。

附图说明

图1为本发明流程示意图；

图2为本发明LSTM循环神经网络模型示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例，均属于本发明的保护范围。

实施例1：一种智能家电的免唤醒语音识别控制方法。

如图1所示，一种智能家电的免唤醒语音识别控制方法，应用家电具体为语音空调，具体步骤如下：

S1，预先设定物体与智能家电的注视唤醒关系，具体为设定若干组目标物体与智能家电之间一一对应绑定关系，语音空调配置双目摄像头，双目摄像头能有效避免静态图片，摄像头实时检测可视区域用户脸和头部的动态，识别用户双眼聚焦位置是否对应目标物体，摄像头迅速检测并识别用户的头部和脸部的方向和仰角、瞳孔眼珠占位比，通过深度学习循环神经网络识别判断用户是否正在注视某一目标物体；具体为将获取到的人物脸部图像进行平滑去噪预处理，再进行图像特征提取，将图像信息通过模板分类器处理，与预设正脸图像进行算法比对处理，判断人脸图像偏置角度是否满足上下左右偏置角度在正负5°以内，若满足则确定用户正在注视目标物体；

S2,若用户是在注视目标物体，则判断用户嘴巴是否处于运动发声状态；

S3，若判断人物未注视目标物体，则结束唤醒过程；

S4，若嘴巴属于运动发声状态，则采集当前时段声音信息，语音识别模块获取该声音信息是否对应有效的控制指令；

S5, 若判断人物嘴部处于闭合状态，则结束唤醒过程；

S6，当识别到语音控制指令后语音空调进入语音控制状态；

S7，当识别不到语音控制指令则结束唤醒过程。

如图2所示，深度学习循环神经网络为LSTM循环神经网络模块，具体为：首先，“遗忘门”层通过sigmoid函数来控制，它会根据上一时刻的输出h_t−1（隐藏状态）和当前输入x_t来产生一个0到1的f_t(遗忘门值)，来决定是否让上一时刻学到的信息C_t−1通过或部分通过；其次，产生需要更新的新信息，这一步包含两部分，第一部分“输入门”层通过sigmoid函数来决定哪些值用来更新，第二部分是tanh函数生成新的候选值C_t（状态），它作为当前层产生的候选值可能会添加到cell state（单元状态）中，再把这两部分产生的值结合来进行更新；最后，“输出门”，通过sigmoid函数来得到一个初始输出，然后使用tanh函数将 C_t值缩放到-1到1间，再与sigmoid得到的输出逐对相乘，从而得到模型的输出h_t。

在空调双目摄像头可视范围内预设用户注视的目标（目标可以为某一物体或具体设备，用户注视目标的画图面均在摄像头的可视区域内），目标A设定对应免唤醒可语音直接控制设备A；目标B设定对应免唤醒可语音直接控制设备B；目标C设定对应免唤醒可语音直接控制设备C等等，可进行多预设。当检测到用户注视某一目标时即可判断用户将要控制某一设备，此刻用户可以直接语音进行控制某一设备。如检测到用户注视A目标，则立即唤醒空调进行拾音，并将控制指令转发去控制相应的设备1。

本实施例中，房间里放置空调，空调的双目摄像头可视范围内放置有除湿机设备，摄像头能够识别到用户注视除湿机设备的画面，对此进行了预先的设定，设定设备正常通电且互相绑定情况下，当空调摄像头检测到用户正在注视除湿机设备时，空调立即进入免唤醒侦听拾音状态，用户语音指令即可直接控制除湿机。比如在房间内用户正视除湿机设备，空调检测到后进入拾音状态并等待转发控制指令给除湿机以实现控制除湿机，实现了看着谁就对谁说的免唤醒交互。

实施例2：种智能家电的免唤醒语音识别控制方法。

与实施例1不同之处在于，目标物体为画和花瓶等，双目摄像头能够识别到用户注视画的画面和用户注视花瓶的画面。对此进行了预先的设定，用户注视画时设定对应可控制热水器设备、用户注视花瓶时设定对应可控制空气净化器设备。当空调双目摄像头检测到用户正在注视画的画面图像时，空调立即进入免唤醒侦听拾音状态，用户语音指令即可直接控制热水器设备。当空调摄像头检测到用户正在注视花瓶的画面图像时，空调立即进入免唤醒侦听拾音状态，用户语音指令即可直接控制空气净化器设备。

实施例3：一种计算机可读存储介质。

一种计算机可读存储介质，用于存储计算机程序，所述计算机程序被处理器调用时实现实施例1或实施例2所述的智能家电的免唤醒语音识别控制方法。

实施例4：一种空调。

一种空调，包括处理器和存储器，所述存储器用于存储计算机程序，所述计算机程序被所述处理器调用时实现实施例1或实施例2所述的智能家电的免唤醒语音识别控制方法。

以上所述为本发明的较佳实施例而已，但本发明不应局限于该实施例和附图所公开的内容，所以凡是不脱离本发明所公开的精神下完成的等效或修改，都落入本发明保护的范围。

Claims

1.一种智能家电的免唤醒语音识别控制方法，其特征在于,预先设定物体与智能家电的注视唤醒关系,通过视觉传感器实时检测当前环境的人物人体信息,利用神经网络算法分析判断人物是否有意启动对应的智能家电,若判断为有意启动对应的智能家电,则智能家电进入免唤醒状态采集语音信息；所述预先设定物体与智能家电的注视唤醒关系具体为：设定若干组目标物体与智能家电之间一一对应绑定关系，注视目标物体A设定对应免唤醒可语音控制智能家电A，

所述通过视觉传感器实时检测当前环境的人物人体信息具体为：通过双目摄像头实时检测可视区域人物脸部和头部的动态信息，脸部的动态信息具体包括眼睛状态信息和嘴部动态信息，

所述利用神经网络算法分析判断人物是否有意启动对应的智能家电具体为：检测并识别人物头部方向和仰角、脸部的方向和仰角、瞳孔眼珠占位比，通过深度学习循环神经网络识别判断人物是否正在注视目标智能家电；若用户是在注视目标智能家电，则判断人物嘴部是否处于运动发声状态，若人物嘴部处于运动发声状态，则判断人物有意启动目标智能家电，所述通过深度学习循环神经网络识别判断人物是否正在注视目标智能家电具体为：若判断人物未注视目标智能家电，则结束唤醒过程，深度学习循环神经网络为LSTM循环神经网络模块，具体为：首先，“遗忘门”层通过sigmoid函数来控制，它会根据上一时刻的输出隐藏状态ht-1和当前输入xt来产生一个0到1的遗忘门值ft，来决定是否让上一时刻学到的信息Ct-1通过或部分通过；其次，产生需要更新的新信息，这一步包含两部分，第一部分“输入门”层通过sigmoid函数来决定哪些值用来更新，第二部分是tanh函数生成新的候选值状态Ct，它作为当前层产生的候选值可能会添加到单元状态cell state中，再把这两部分产生的值结合来进行更新；最后，“输出门”，通过sigmoid函数来得到一个初始输出，然后使用tanh函数将Ct值缩放到-1到1间，再与sigmoid得到的输出逐对相乘，从而得到模型的输出ht。

2.如权利要求1所述的智能家电的免唤醒语音识别控制方法，其特征在于，所述通过深度学习循环神经网络识别判断人物是否正在注视目标智能家电具体为：将获取到的人物脸部图像进行平滑去噪预处理，再进行图像特征提取，将图像信息通过模板分类器处理，与预设正脸图像进行算法比对处理，判断人脸图像偏置角度是否满足上下左右偏置角度在正负y°以内，若满足则确定用户正在注视目标智能家电，其中y为预设角度值。

3.如权利要求1所述的智能家电的免唤醒语音识别控制方法，其特征在于，所述判断人物嘴部是否处于运动发声状态具体为：若判断人物嘴部处于闭合状态，则结束唤醒过程。

4.如权利要求1所述的智能家电的免唤醒语音识别控制方法，其特征在于，所述判断人物有意启动目标智能家电具体为：人物嘴部处于运动发声状态，采集语音信息并识别，若识别检测到的语音是控制指令，则进入智能家电语音控制状态；若识别检测到的语音不是控制指令，则结束唤醒过程。

5.一种计算机可读存储介质，用于存储计算机程序，其特征在于，所述计算机程序被处理器调用时实现权利要求1-4任一项所述的智能家电的免唤醒语音识别控制方法。

6.一种空调，包括处理器和存储器，所述存储器用于存储计算机程序，其特征在于，所述计算机程序被所述处理器调用时实现权利要求1-4任一项所述的智能家电的免唤醒语音识别控制方法。