CN113147779A

CN113147779A - 一种车辆控制方法及装置

Info

Publication number: CN113147779A
Application number: CN202110480121.0A
Authority: CN
Inventors: 吴贤; 欧阳琼林; 邱磊
Original assignee: Qianhai Qijian Technology Shenzhen Co ltd
Current assignee: Qianhai Qijian Technology Shenzhen Co ltd
Priority date: 2021-04-29
Filing date: 2021-04-29
Publication date: 2021-07-23

Abstract

本申请提供一种车辆控制方法及装置，应用于车辆技术领域，方法包括：获取语音数据，并判断语音数据是否用于语音交互；若语音数据用于语音交互，则获取产生语音数据的声源对应的声源位置；根据声源位置获取声源对应的视线目标；根据语音数据以及视线目标对车辆进行控制，以实现车辆语音交互。在上述方案中，在判断语音数据是用于语音交互之后，可以结合视线检测，检测产生语音数据的声源的视线目标，从而可以结合语音数据以及视线检测的结果对车辆进行控制。由于加入了视线检测，且无需用户在行驶过程中做出对应的手势，因此提高了车辆语音交互的准确性以及安全性。

Description

一种车辆控制方法及装置

技术领域

本申请涉及车辆技术领域，具体而言，涉及一种车辆控制方法及装置。

背景技术

随着智能汽车的发展，智能网联汽车座舱受到越来越多的青睐。其中，在现有的智能网联汽车座舱中，一般采用智能语音交互以及手势识别事先用户与车辆之间的人机交互。但是，由于汽车座舱中的环境较为复杂，采用智能语音交互的方式往往语音识别的准确性较低；而由于手势识别需要用户在行驶的同时做出对应的手势，从而导致采用手势识别的方式的安全性较低。

发明内容

本申请实施例的目的在于提供一种车辆控制方法及装置，用以解决语音识别的准确性较低以及手势识别的安全性较低的技术问题。

为了实现上述目的，本申请实施例所提供的技术方案如下所示：

第一方面，本申请实施例提供一种车辆控制方法，包括：获取语音数据，并判断所述语音数据是否用于语音交互；若所述语音数据用于语音交互，则获取产生所述语音数据的声源对应的声源位置；根据所述声源位置获取所述声源对应的视线目标；根据所述语音数据以及所述视线目标对车辆进行控制。在上述方案中，在判断语音数据是用于语音交互之后，可以结合视线检测，检测产生语音数据的声源的视线目标，从而可以结合语音数据以及视线检测的结果对车辆进行控制。由于加入了视线检测，且无需用户在行驶过程中做出对应的手势，因此提高了车辆语音交互的准确性以及安全性。

在本申请的可选实施例中，所述根据所述语音数据以及所述视线目标对车辆进行控制，包括：对所述语音数据进行数据处理，确定所述语音数据中的关键词；若所述关键词包括语音交互动作，则根据所述视线目标确定语音交互要素；控制所述语音交互要素以完成所述语音交互动作。在上述方案中，当用户产生的语音数据中包括语音交互动作时，可以结合视线检测确定对应的语音交互要素，并控制语音交互要素完成语音交互动作，以实现准确性以及安全性较高的车辆语音交互过程。

在本申请的可选实施例中，所述根据所述语音数据以及所述视线目标对车辆进行控制，包括：对所述语音数据进行数据处理，确定所述语音数据中的关键词；若所述关键词包括语音交互要素以及语音交互动作，则控制所述语音交互要素以完成所述语音交互动作。在上述方案中，当用户产生的语音数据中包括语音交互要素以及语音交互动作时，可以直接控制语音交互要素完成语音交互动作，从而可以在保证车辆语音交互过程的准确性以及安全性的基础上，降低运算量。

在本申请的可选实施例中，所述判断所述语音数据是否用于语音交互，包括：对所述语音数据进行数据处理，确定所述语音数据中的关键词；将所述关键词与语义数据库进行对比，判断所述关键词是否表征所述语音数据用于语音交互。在上述方案中，可以对语音数据进行处理以得到语音数据中的关键词，并根据关键词判断上述语音数据是否是用于语音交互的，以避免出现错误的控制，从而进一步的提高车辆语音交互过程的准确性以及安全性。

在本申请的可选实施例中，所述判断所述语音数据是否用于语音交互，包括：判断在获取到所述语音数据前，是否接收到用于激活语音交互功能的激活指令。在上述方案中，可以根据用户的激活指令执行车辆语音交互过程，以避免出现漏掉的控制，从而进一步的提高车辆语音交互过程的准确性以及安全性。

第二方面，本申请实施例提供一种车辆控制装置，包括：第一获取模块，用于获取语音数据，并判断所述语音数据是否用于语音交互；第二获取模块，用于若所述语音数据用于语音交互，则获取产生所述语音数据的声源对应的声源位置；第三获取模块，用于根据所述声源位置获取所述声源对应的视线目标；控制模块，用于根据所述语音数据以及所述视线目标对车辆进行控制。在上述方案中，在判断语音数据是用于语音交互之后，可以结合视线检测，检测产生语音数据的声源的视线目标，从而可以结合语音数据以及视线检测的结果对车辆进行控制。由于加入了视线检测，且无需用户在行驶过程中做出对应的手势，因此提高了车辆语音交互的准确性以及安全性。

在本申请的可选实施例中，所述控制模块具体用于：对所述语音数据进行数据处理，确定所述语音数据中的关键词；若所述关键词包括语音交互动作，则根据所述视线目标确定语音交互要素；控制所述语音交互要素以完成所述语音交互动作。在上述方案中，当用户产生的语音数据中包括语音交互动作时，可以结合视线检测确定对应的语音交互要素，并控制语音交互要素完成语音交互动作，以实现准确性以及安全性较高的车辆语音交互过程。

在本申请的可选实施例中，所述控制模块具体用于：对所述语音数据进行数据处理，确定所述语音数据中的关键词；若所述关键词包括语音交互要素以及语音交互动作，则控制所述语音交互要素以完成所述语音交互动作。在上述方案中，当用户产生的语音数据中包括语音交互要素以及语音交互动作时，可以直接控制语音交互要素完成语音交互动作，从而可以在保证车辆语音交互过程的准确性以及安全性的基础上，降低运算量。

在本申请的可选实施例中，所述第一获取模块具体用于：对所述语音数据进行数据处理，确定所述语音数据中的关键词；将所述关键词与语义数据库进行对比，判断所述关键词是否表征所述语音数据用于语音交互。在上述方案中，可以对语音数据进行处理以得到语音数据中的关键词，并根据关键词判断上述语音数据是否是用于语音交互的，以避免出现错误的控制，从而进一步的提高车辆语音交互过程的准确性以及安全性。

在本申请的可选实施例中，所述第一获取模块具体用于：判断在获取到所述语音数据前，是否接收到用于激活语音交互功能的激活指令。在上述方案中，可以根据用户的激活指令执行车辆语音交互过程，以避免出现漏掉的控制，从而进一步的提高车辆语音交互过程的准确性以及安全性。

第三方面，本申请实施例提供一种电子设备，包括：处理器、存储器和总线；所述处理器和所述存储器通过所述总线完成相互间的通信；所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行如第一方面中的车辆控制方法。

第四方面，本申请实施例提供一种车辆语音交互系统，包括：语音数据采集装置，用于采集语音数据；声源定位装置，用于对产生所述语音数据的声源对应的声源位置进行定位；视线检测装置，用于检测所述声源的视线目标；如第三方面所述的电子设备，与所述语音数据采集装置、所述声源定位装置以及所述视线检测装置连接。

第五方面，本申请实施例提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行如第一方面中的车辆控制方法。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举本申请实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的一种车辆语音交互系统的结构框图；

图2为本申请实施例提供的一种电子设备的结构框图；

图3为本申请实施例提供的一种车辆控制方法的流程图；

图4为本申请实施例提供的步骤S301的具体实施方式的流程图；

图5为本申请实施例提供的第一种步骤S304的具体实施方式的流程图；

图6为本申请实施例提供的第二种步骤S304的具体实施方式的流程图；

图7为本申请实施例提供的一种车辆控制装置的结构框图。

图标：10-车辆语音交互系统；110-语音数据采集装置；120-声源定位装置；130-视线检测装置；140-电子设备；141-处理器；142-通信接口；143-存储器；144-通信总线；700-车辆控制装置；701-第一获取模块；702-第二获取模块；703-第三获取模块；704-控制模块。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。

请参照图1，图1为本申请实施例提供的一种车辆语音交互系统的结构框图，该车辆语音交互系统10可以包括：语音数据采集装置110、声源定位装置120、视线检测装置130以及电子设备140，电子设备140与语音数据采集装置110、声源定位装置120以及视线检测装置130连接。

具体的，语音数据采集装置110可以设置在车辆内部的多个位置，用于采集车辆内部的语音数据。声源定位装置120同样可以设置在车辆内部的任意位置，用于对产生语音数据的声源对应的声源位置进行定位。举例来说，语音数据采集装置110以及声源定位装置120可以设置在车辆内部的顶部，或者车辆方向盘上等，本申请实施例对此不作具体的限定，本领域技术人员可以根据实际情况选择车辆内部可以采集到语音数据的位置设置语音数据采集装置110，以及选择车辆内部可以对声源位置进行定位的位置设置声源定位装置120。

其中，语音数据采集装置110以及声源定位装置120均有多种实施方式，本申请实施例对此不作具体的限定。举例来说，语音数据采集装置110可以为麦克风，声源定位装置120可以为图像采集装置；或者，语音数据采集装置110以及声源定位装置120可以共同采用声学照相机实现。

以语音数据采集装置110以及声源定位装置120共同采用声学照相机实现为例。声学照相机是一种利用传声器阵列测量一定范围内的声场分布的专用设备，传声器阵列包括几个到上千个按照一定规则排列组成的麦克风，多个麦克风可以同步采集声音信号，并利用多个麦克风之间的信号相位差，求得发出声音信号的声源对应的位置。在本申请实施例中，声学照相机可以采集车辆内的语音数据，并根据采集到的语音数据对发出该语音数据的声源进行定位，从而可以确定声源位置。

需要说明的是，作为一种实施方式，语音数据采集装置110以及声源定位装置120可以持续工作，也就是可以一直对车辆内的语音数据进行采集并对声源进行定位；作为另一种实施方式，语音数据采集装置110以及声源定位装置120可以在满足一定条件时才开始工作，例如：当检测到有人进入车辆后，语音数据采集装置110以及声源定位装置120才开始工作；或者，当用户手动激活语音交互功能时，语音数据采集装置110以及声源定位装置120才可以工作等。本申请实施例对此不作具体的限定，本领域技术人员可以根据实际情况进行合适的调整。

视线检测装置130设置在车辆内部的多个位置，用于检测声源的视线目标。举例来说，视线检测装置130可以设置在车辆内部的顶部，或者车辆方向盘上等，本申请实施例对此不作具体的限定，本领域技术人员可以根据实际情况选择车辆内部可以对视线进行检测的位置设置视线检测装置130。其中，视线检测装置130存在多种实施方式，本申请实施例对此不作具体的限定。举例来说，视线检测装置130可以采用眼动仪；或者，视线检测装置130可以采用图像采集装置。

以视线检测装置130采用眼动仪为例。眼动仪可以通过图像处理技术，定位声源的瞳孔位置并获取瞳孔的中心坐标，然后通过霍夫圆检测、阈值分割、灰度检测、模板匹配等算法，计算该声源的注视点，该注视点即为该声源的视线目标。在本申请实施例中，眼动仪可以定位声源的瞳孔位置，并计算得到该声源的视线目标。

需要说明的是，与语音数据采集装置110以及声源定位装置120类似，作为一种实施方式，视线检测装置130可以持续工作，也就是可以一直对车辆内的用户视线进行检测；作为另一种实施方式，视线检测装置130可以在满足一定条件时才开始工作，例如：当检测到车辆开始行驶后，视线检测装置130才开始工作；或者，当用户手动激活语音交互功能时，视线检测装置130才可以工作等。本申请实施例对此同样不作具体的限定，本领域技术人员可以根据实际情况进行合适的调整。

电子设备140可以与语音数据采集装置110、声源定位装置120以及视线检测装置130连接，以实现相互之间的数据交互。举例来说，语音数据采集装置110可以将采集到的语音数据发送给电子设备140，以使电子设备140可以对语音数据进行处理分析；声源定位装置120可以将定位到的声源位置发送给电子设备140，以使电子设备140可以对声源位置进行处理分析；同样的，视线检测装置130可以将视线检测的结果发送给电子设备140，以使电子设备140可以对视线检测的结果进行处理分析。

请参照图2，图2为本申请实施例提供的一种电子设备的结构框图，该电子设备140包括：至少一个处理器141，至少一个通信接口142，至少一个存储器143和至少一个通信总线144。其中，通信总线144用于实现这些组件直接的连接通信，通信接口142用于与其他节点设备进行信令或数据的通信，存储器143存储有处理器141可执行的机器可读指令。当电子设备140运行时，处理器141与存储器143之间通过通信总线144通信，机器可读指令被处理器141调用时执行本申请实施例提供的车辆控制方法。

处理器141可以是一种集成电路芯片，具有信号处理能力。上述处理器141可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(NetworkProcessor，NP)等；还可以是数字信号处理器(Digital Signal Processing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中公开的各种方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器143可以包括但不限于随机存取存储器(Random Access Memory，RAM)，只读存储器(Read Only Memory，ROM)，可编程只读存储器(Programmable Read-OnlyMemory，PROM)，可擦除只读存储器(Erasable Programmable Read-Only Memory，EPROM)，电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory，EEPROM)等。

可以理解，图2所示的结构仅为示意，电子设备140还可包括比图2中所示更多或者更少的组件，或者具有与图2所示不同的配置。图2中所示的各组件可以采用硬件、软件或其组合实现。于本申请实施例中，电子设备140可以与车辆中已有的控制器集成在一起；当然，电子设备140也可以采用单独的芯片实现，本申请实施例对此不作具体的限定。举例来说，电子设备140可以为车载芯片、车载智能终端等。

基于上述车辆语音交互系统10，本申请实施例还提供一种车辆控制方法，该车辆控制方法可以应用于上述车辆语音交互系统10中的电子设备140。下面对上述车辆控制方法进行详细的介绍。

请参照图3，图3为本申请实施例提供的一种车辆控制方法的流程图，该车辆控制方法可以包括如下步骤：

步骤S301：获取语音数据，并判断语音数据是否用于语音交互。

步骤S302：若语音数据用于语音交互，则获取产生语音数据的声源对应的声源位置。

步骤S303：根据声源位置获取声源对应的视线目标。

步骤S304：根据语音数据以及视线目标对车辆进行控制。

具体的，电子设备获取语音数据的方式有多种，例如：语音数据采集装置在采集到语音数据之后，可以直接将语音数据发送给电子设备；或者，语音数据采集装置在采集到语音数据之后，可以将语音数据上传到云端服务器，电子设备可以在需要的时候从云端服务器中读取语音数据等，本申请实施例对此不作具体的限定。

可以理解的是，电子设备获取的语音数据可以是语音数据采集装置采集到的原始的语音信号，也可以是经过语音数据采集装置处理后的语音数据。举例来说，语音数据采集装置可以先对采集到的语音信号进行处理，例如：降噪处理、语义切割处理等，然后再将处理后的数据发送给电子设备，这样，电子设备上的运算量可以大大降低。

电子设备在获取到语音数据之后，可以判断该语音数据是否是用于语音交互的。其中，电子设备判断语音数据是否是用于语音交互的方式有多种，在本申请实施例中，主要对两种方式进行说明。可以理解的是，本领域技术人员结合本申请实施例中的两种方式以及本领域技术人员的惯用技术手段，还可以采用其他的方式判断语音数据是否是用于语音交互的。

首先，介绍第一种判断语音数据是否是用于语音交互的方式。

在该种方式中，语音数据采集装置、声源定位装置以及视线检测装置可以持续工作，电子设备可以获取语音数据采集装置采集到的所有语音数据，并对所有的语音数据进行判断。

与上述实施例对应，若电子设备获取到的是原始的语音信号，则电子设备可以先对语音信号进行处理后，再执行上述判断的步骤；若电子设备获取到的语音数据已经经过语音数据采集装置的初步处理，则电子设备可以对经过初步处理的语音数据进行进一步的处理，再执行上述判断的步骤；若电子设备获取到的语音数据已经经过语音数据采集装置的初步处理以及进一步的处理，则电子设备可以直接执行上述判断的步骤。本领域技术人员可以根据实际情况选择上述多种实施方式中的一种，本申请实施例对此不作具体的限定。

以电子设备获取到的是原始的语音信号为例对上述判断的步骤进行介绍。请参照图4，图4为本申请实施例提供的步骤S301的具体实施方式的流程图，上述步骤S301可以包括如下步骤：

步骤S401：对语音数据进行数据处理，确定语音数据中的关键词。

步骤S402：将关键词与语义数据库进行对比，判断关键词是否表征语音数据用于语音交互。

其中，电子设备对语音数据进行数据处理可以包括：对语音数据进行初步处理(例如：降噪处理等)以及对语音数据进行进一步的处理。

电子设备对语音数据进行进一步的处理可以包括：对语音数据进行语义检测、语义解析、语音切割等处理，以将语音数据划分为多个管检测，并确定其中的关键词。

然后，电子设备可以将确定得到的关键词与实现确定的语义数据库进行对此，从而通过判断关键词是否表征语音数据用于语音交互，来确定语音数据是否用于语音交互。

其中，判断关键词是否表征语音数据用于语音交互，可以采用将关键词与语义数据库中表征语音数据用于语音交互的词语进行匹配的方式，若关键词可以与语义数据库中表征语音数据用于语音交互的词语匹配上，则说明该关键词表征语音数据用于语音交互。例如：打开、关闭、使用等词语，可以事先在语义数据库中进行标记，为表征语音数据用于语音交互的词语。

可以理解的是，除了上述步骤S401-步骤S402，本申请实施例还可以采用其他的关键词检测方法，实现判断语音数据是否用于语音交互的步骤。举例来说，可以采用神经网络对语音数据中的关键词进行检测；或者，可以采用补白模型对语音数据中的关键词进行检测等，本申请实施例对此不作具体的限定，本领域技术人员结合现有技术可以采用其他实施方式。

因此，可以对语音数据进行处理以得到语音数据中的关键词，并根据关键词判断上述语音数据是否是用于语音交互的，以避免出现错误的控制，从而进一步的提高车辆语音交互过程的准确性以及安全性。

接下来，介绍第二种判断语音数据是否是用于语音交互的方式。

在该种方式中，用户可以通过手动激活的方式激活车辆语音交互功能，并且在用户激活车辆语音交互功能之后，语音数据采集装置、声源定位装置以及视线检测装置可以才开始工作，电子设备获取这之后语音数据采集装置采集的语音数据。

可以理解的是，在该种方式中，语音数据采集装置、声源定位装置以及视线检测装置也可以持续工作，电子设备在检测到接收到用于激活语音交互功能的激活指令之后，才获取语音数据；或者，语音数据采集装置、声源定位装置以及视线检测装置也可以持续工作，电子设备获取语音数据采集装置采集的所有音频数据，并执行如下步骤：

判断在获取到语音数据前，是否接收到用于激活语音交互功能的激活指令。

因此，可以根据用户的激活指令执行车辆语音交互过程，以避免出现漏掉的控制，从而进一步的提高车辆语音交互过程的准确性以及安全性。

电子设备在判断语音数据是用于语音交互的之后，可以获取产生语音数据的声源对应的声源位置。

类似的，电子设备获取声源位置的方式有多种，例如：声源定位装置在定位到声源位置之后，可以直接将声源位置发送给电子设备；或者，声源位置装置在定位到声源位置之后，可以将声源位置上传到云端服务器，电子设备可以在需要的时候从云端服务器中读取声源位置等，本申请实施例对此不作具体的限定。

电子设备在获取到产生语音数据的声源对应的声源位置之后，可以根据声源位置获取声源对应的视线目标，并根据语音数据以及视线目标对车辆进行控制，以实现车辆语音交互。

类似的，电子设备获取视线目标的方式有多种，例如：视线检测装置在检测到视线目标之后，可以直接将视线目标发送给电子设备；或者，视线检测装置在检测到视线目标之后，可以将视线目标上传到云端服务器，电子设备可以在需要的时候从云端服务器中读取视线目标等，本申请实施例对此不作具体的限定。

下面对本申请实施例中的步骤S304进行详细的介绍。

可以将用于语音交互的语音数据分为两类：第一类，语音数据中仅包括语音交互动作，不包括语音交互要素；第二类，语音数据中既包括语音交互动作，也包括语音交互要素。其中，语音交互动作指用户指示车辆执行的动作，例如：打开、关闭、使用等；语音交互要素指用户指示车辆执行动作的对象，例如：窗户、座椅等。举例来说，“打开”属于第一语音数据类，而“打开窗户”属于第二类语音数据。

针对上述第一类语音数据，请参照图5，图5为本申请实施例提供的第一种步骤S304的具体实施方式的流程图，上述步骤S304可以包括如下步骤：

步骤S501：对语音数据进行数据处理，确定语音数据中的关键词。

步骤S502：若关键词包括语音交互动作，则根据视线目标确定语音交互要素。

步骤S503：控制语音交互要素以完成语音交互动作。

具体的，电子设备可以首先确定语音数据中的关键词，其中，上述实施例中已经对电子设备确定语音数据中的关键词的方式进行了详细的介绍，此处不再赘述。可以理解的是，若在实施过程中执行了上述步骤S401，则该处的步骤S501可以省略。

然后电子设备可以判断检测到的关键词中是否包括语音交互动作，若语音数据中仅包括语音交互动作，不包括语音交互要素，则电子设备需要结合之前确定的视线目标确定与该语音交互动作对应的语音交互要素。

举例来说，电子设备获取到的视线目标可以为一个物体的具体名称，此时，电子设备可以直接确定与该语音交互动作对应的语音交互要素为该物体，然后结合语音交互动作以及语音交互要素得到完整的指令。当然，电子设备获取到的实现目标也可以为一个物体的图像，此时，电子设备需要对该物体的图像进行图像处理，以确定该语音交互动作对应的语音交互要素，然后结合语音交互动作以及语音交互要素得到完整的指令。

例如：语音数据采集装置采集到的语音信号为“打开”，视线检测装置检测到发出该语音信号的用户的视线目标为“窗户”，则可以确定语音交互动作为“打开”、语音交互要素为“窗户”，完整的指令为“打开窗户”，电子设备可以控制窗户完成打开的动作。

因此，当用户产生的语音数据中包括语音交互动作时，可以结合视线检测确定对应的语音交互要素，并控制语音交互要素完成语音交互动作，以实现准确性以及安全性较高的车辆语音交互过程。

针对上述第二类语音数据，请参照图6，图6为本申请实施例提供的第二种步骤S304的具体实施方式的流程图，上述步骤S304可以包括如下步骤：

步骤S601：对语音数据进行数据处理，确定语音数据中的关键词。

步骤S602：若关键词包括语音交互要素以及语音交互动作，则控制语音交互要素以完成语音交互动作。

具体的，电子设备可以首先确定语音数据中的关键词，其中，上述实施例中已经对电子设备确定语音数据中的关键词的方式进行了详细的介绍，此处不再赘述。可以理解的是，若在实施过程中执行了上述步骤S401，则该处的步骤S601可以省略。

然后电子设备可以判断检测到的关键词中是否包括语音交互动作以及语音交互要素，若语音数据中既包括语音交互动作，也包括语音交互要素，则电子设备可以直接执行指令。

例如：语音数据采集装置采集到的语音信号为“打开窗户”，则可以确定语音交互动作为“打开”、语音交互要素为“窗户”，完整的指令即为“打开窗户”，电子设备可以直接控制窗户完成打开的动作。

因此，当用户产生的语音数据中包括语音交互要素以及语音交互动作时，可以直接控制语音交互要素完成语音交互动作，从而可以在保证车辆语音交互过程的准确性以及安全性的基础上，降低运算量。

在本申请实施例提供的车辆控制方法中，在判断语音数据是用于语音交互之后，可以结合视线检测，检测产生语音数据的声源的视线目标，从而可以结合语音数据以及视线检测的结果对车辆进行控制。由于加入了视线检测，且无需用户在行驶过程中做出对应的手势，因此提高了车辆语音交互的准确性以及安全性。

请参照图7，图7为本申请实施例提供的一种车辆控制装置的结构框图，该车辆控制装置700可以包括：第一获取模块701，用于获取语音数据，并判断所述语音数据是否用于语音交互；第二获取模块702，用于若所述语音数据用于语音交互，则获取产生所述语音数据的声源对应的声源位置；第三获取模块703，用于根据所述声源位置获取所述声源对应的视线目标；控制模块704，用于根据所述语音数据以及所述视线目标对车辆进行控制。

在本申请实施例中，在判断语音数据是用于语音交互之后，可以结合视线检测，检测产生语音数据的声源的视线目标，从而可以结合语音数据以及视线检测的结果对车辆进行控制。由于加入了视线检测，且无需用户在行驶过程中做出对应的手势，因此提高了车辆语音交互的准确性以及安全性。

进一步的，所述控制模块704具体用于：对所述语音数据进行数据处理，确定所述语音数据中的关键词；若所述关键词包括语音交互动作，则根据所述视线目标确定语音交互要素；控制所述语音交互要素以完成所述语音交互动作。

在本申请实施例中，当用户产生的语音数据中包括语音交互动作时，可以结合视线检测确定对应的语音交互要素，并控制语音交互要素完成语音交互动作，以实现准确性以及安全性较高的车辆语音交互过程。

进一步的，所述控制模块704具体用于：对所述语音数据进行数据处理，确定所述语音数据中的关键词；若所述关键词包括语音交互要素以及语音交互动作，则控制所述语音交互要素以完成所述语音交互动作。

在本申请实施例中，当用户产生的语音数据中包括语音交互要素以及语音交互动作时，可以直接控制语音交互要素完成语音交互动作，从而可以在保证车辆语音交互过程的准确性以及安全性的基础上，降低运算量。

进一步的，所述第一获取模块701具体用于：对所述语音数据进行数据处理，确定所述语音数据中的关键词；将所述关键词与语义数据库进行对比，判断所述关键词是否表征所述语音数据用于语音交互。

在本申请实施例中，可以对语音数据进行处理以得到语音数据中的关键词，并根据关键词判断上述语音数据是否是用于语音交互的，以避免出现错误的控制，从而进一步的提高车辆语音交互过程的准确性以及安全性。

进一步的，所述第一获取模块701具体用于：判断在获取到所述语音数据前，是否接收到用于激活语音交互功能的激活指令。

在本申请实施例中，可以根据用户的激活指令执行车辆语音交互过程，以避免出现漏掉的控制，从而进一步的提高车辆语音交互过程的准确性以及安全性。

本申请实施例还提供一种计算机程序产品，包括存储在非暂态计算机可读存储介质上的计算机程序，计算机程序包括程序指令，当程序指令被计算机执行时，计算机能够执行上述实施例中车辆控制方法的步骤，例如包括：获取语音数据，并判断所述语音数据是否用于语音交互；若所述语音数据用于语音交互，则获取产生所述语音数据的声源对应的声源位置；根据所述声源位置获取所述声源对应的视线目标；根据所述语音数据以及所述视线目标对车辆进行控制。

在本申请所提供的实施例中，应该理解到，所揭露装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

再者，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

以上所述仅为本申请的实施例而已，并不用于限制本申请的保护范围，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种车辆控制方法，其特征在于，包括：

获取语音数据，并判断所述语音数据是否用于语音交互；

若所述语音数据用于语音交互，则获取产生所述语音数据的声源对应的声源位置；

根据所述声源位置获取所述声源对应的视线目标；

根据所述语音数据以及所述视线目标对车辆进行控制。

2.根据权利要求1所述的车辆控制方法，其特征在于，所述根据所述语音数据以及所述视线目标对车辆进行控制，包括：

对所述语音数据进行数据处理，确定所述语音数据中的关键词；

若所述关键词包括语音交互动作，则根据所述视线目标确定语音交互要素；

控制所述语音交互要素以完成所述语音交互动作。

3.根据权利要求1所述的车辆控制方法，其特征在于，所述根据所述语音数据以及所述视线目标对车辆进行控制，包括：

若所述关键词包括语音交互要素以及语音交互动作，则控制所述语音交互要素以完成所述语音交互动作。

4.根据权利要求1所述的车辆控制方法，其特征在于，所述判断所述语音数据是否用于语音交互，包括：

将所述关键词与语义数据库进行对比，判断所述关键词是否表征所述语音数据用于语音交互。

5.根据权利要求1所述的车辆控制方法，其特征在于，所述判断所述语音数据是否用于语音交互，包括：

判断在获取到所述语音数据前，是否接收到用于激活语音交互功能的激活指令。

6.一种车辆控制装置，其特征在于，包括：

第一获取模块，用于获取语音数据，并判断所述语音数据是否用于语音交互；

第二获取模块，用于若所述语音数据用于语音交互，则获取产生所述语音数据的声源对应的声源位置；

第三获取模块，用于根据所述声源位置获取所述声源对应的视线目标；

控制模块，用于根据所述语音数据以及所述视线目标对车辆进行控制。

7.根据权利要求6所述的车辆控制装置，其特征在于，所述根据所述控制模块具体用于：

控制所述语音交互要素以完成所述语音交互动作。

8.一种电子设备，其特征在于，包括：处理器、存储器和总线；

所述处理器和所述存储器通过所述总线完成相互间的通信；

所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行如权利要求1-5任一项所述的车辆控制方法。

9.一种车辆语音交互系统，其特征在于，包括：

语音数据采集装置，用于采集语音数据；

声源定位装置，用于对产生所述语音数据的声源对应的声源位置进行定位；

视线检测装置，用于检测所述声源的视线目标；

如权利要求8所述的电子设备，与所述语音数据采集装置、所述声源定位装置以及所述视线检测装置连接。

10.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令被计算机运行时，使所述计算机执行如权利要求1-5任一项所述的车辆控制方法。