WO2022160911A1

WO2022160911A1 - 显示设备上语音方案的切换方法、显示设备及控制装置

Info

Publication number: WO2022160911A1
Application number: PCT/CN2021/133767
Authority: WO
Inventors: 王振菊; 路怀培; 娄畅
Original assignee: 青岛海信传媒网络技术有限公司
Priority date: 2021-01-29
Filing date: 2021-11-27
Publication date: 2022-08-04

Abstract

本申请提供了一种显示设备上语音方案的切换方法、显示设备及控制装置。显示设备在接收到语音控制指令后，将显示器的显示页面切换至与动作数据对应的语音方案页面，以及在该页面上显示与语音数据对应的目标内容。

Description

显示设备上语音方案的切换方法、显示设备及控制装置

本申请要求在2021年1月29日提交的、申请号为202110124749.7、发明名称为“一种视频搜索方法、显示设备及服务器”的中国专利申请的优先权，其全部内容通过引用结合在本申请中；申请要求在2021年2月4日提交的、申请号为202110156337.1、发明名称为“显示设备上语音方案的切换方法、显示设备及控制装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及显示技术领域，尤其涉及一种显示设备上语音方案的切换方法、显示设备及控制装置。

背景技术

随着显示设备趋于智能化，一些显示设备上可配备智能语音功能，用户可以通过输入语音的方式方便地控制显示设备。

发明内容

本申请实施方式提供了一种显示设备上语音方案的切换方法、显示设备及控制装置。

第一方面，本申请实施方式提供了一种显示设备，包括：

显示器；

控制器，被配置为：

接收控制装置发送的语音控制指令；所述语音控制指令包括用于切换显示设备语音方案的用户操作所述控制装置的动作数据，以及，用于在显示设备上搜索目标内容的用户输入的语音数据；

响应于所述语音控制指令，将显示器的显示页面切换至与所述动作数据相对应的目标语音方案页面，以及在所述目标语音方案页面上显示与所述语音数据对应的目标内容。

第二方面，本申请实施方式还提供了一种控制装置，包括：

控制器，被配置为：

在接收用户输入的语音数据的同时，检测用户操作所述控制装置的动作并生成动作数据；

将所述语音数据与所述动作数据打包生成的语音控制指令发送给显示设备。

第三方面，本申请实施方式还提供了一种显示设备上语音方案的切换方法，包括：

第四方面，本申请实施方式还提供了另一种显示设备上语音方案的切换方法，包括：

附图说明

下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了根据一些实施例的显示设备的使用场景的示意图；

图2示出了根据一些实施例的控制装置100的硬件配置框图；

图3示出了根据一些实施例的显示设备200的硬件配置框图；

图4示出了根据一些实施例的显示设备200中软件配置图；

图5示出了根据一些实施例的控制器250与控制器110之间的一种交互示意图；

图6示出了根据一些实施例的控制器110与控制器250之间的第二种交互示意图；

图7示出了根据一些实施例的语音方案页面的一种示意图；

图8示出了根据一些实施例的语音方案页面的第二种示意图；

图9示出了根据一些实施例的用户操作控制装置100的一种示意图；

图10示出了根据一些实施例的控制器110与控制器250之间的第三种交互示意图；

图11示出了根据一些实施例的用户操作控制装置100的第二种示意图；

图12示出了根据一些实施例的控制器110与控制器250之间的第四种交互示意图；

图13示出了根据一些实施例的用户操作控制装置100的第三种示意图；

图14示出了根据一些实施例的显示设备上语音方案的切换方法的一种流程图；

图15示出了根据一些实施例的显示设备上语音方案的切换方法的另一种流程图；

图16示出了根据一些实施例的视频搜索系统的框架图；

图17示出了根据一些实施例中显示设备200中的用户界面示意图；

图18示出了根据一些实施例中又一种显示设备200中的用户界面示意图；

图19示出了根据一些实施例中又一种显示设备200中的用户界面示意图；

图20示出了根据一些实施例中又一种显示设备200中的用户界面示意图；

图21示出了根据一些实施例的视频搜索方法信令图；

图22示出了根据一些实施例的又一种视频搜索方法信令图。

具体实施方式

为使本申请的目的和实施方式更加清楚，下面将结合本申请示例性实施例中的附图，对本申请示例性实施方式进行清楚、完整地描述，显然，描述的示例性实施例仅是本申请一部分实施例，而不是全部的实施例。

需要说明的是，本申请中对于术语的简要说明，仅是为了方便理解接下来描述的实施方式，而不是意图限定本申请的实施方式。除非另有说明，这些术语应当按照其普通和通常的含义理解。

本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体，而不必然意味着限定特定的顺序或先后次序，除非另外注明。应该理解这样使用的用语在适当情况下可以互换。

术语“包括”和“具有”以及他们的任何变形，意图在于覆盖但不排他的包含，例如，包含了一系列组件的产品或设备不必限于清楚地列出的所有组件，而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。

术语“模块”是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合，能够执行与该元件相关的功能。

图1示出了根据一些实施例的显示设备的使用场景的示意图。如图1所示，显示设备200还与服务器400进行数据通信，用户可通过智能设备300或控制装置100操作显示设备200。

在一些实施例中，控制装置100可以是遥控器，遥控器和显示设备的通信包括红外协议通信或蓝牙协议通信，及其他短距离通信方式中的至少一种，通过无线或有线方式来控制显示设备200。用户可以通过遥控器上按键、语音输入、控制面板输入等至少一种输入用户指令，来控制显示设备200。

在一些实施例中，智能设备300可以包括移动终端、平板电脑、计算机、笔记本电脑，AR/VR设备等中的任意一种。

在一些实施例中，也可以使用智能设备300以控制显示设备200。例如，使用在智能设备上运行的应用程序控制显示设备200。

在一些实施例中，显示设备可以不使用上述的智能设备或控制设备接收指令，而是通过触摸或者手势等接收用户的控制。

在一些实施例中，也可以使用智能设备300和显示设备进行数据的通信。

在一些实施例中，显示设备200还可以采用除了控制装置100和智能设备300之外的方式进行控制，例如，可以通过显示设备200设备内部配置的获取语音指令的模块直接接收用户的语音指令控制，也可以通过显示设备200设备外部设置的语音控制装置来接收用户的语音指令控制。

在一些实施例中，显示设备200还与服务器400进行数据通信。可允许显示设备200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。服务器400可以向显示设备200提供各种内容和互动。服务器400可以是一个集群，也可以是多个集群，可以包括一类或多类服务器。

在一些实施例中，一个步骤执行主体执行的软件步骤可以随需求迁移到与之进行数据通信的另一步骤执行主体上进行执行。示例性的，服务器执行的软件步骤可以随需求迁移到与之数据通信的显示设备上执行，反之亦然。

图2示出了根据一些实施例的控制装置100的硬件配置框图。如图2所示，控制装置100包括控制器110、通信接口130、用户输入/输出接口140、存储器、供电电源。控制装置100可接收用户的输入操作指令，且将操作指令转换为显示设备200可识别和响应的指令，起用用户与显示设备200之间交互中介作用。

在一些实施例中，通信接口130用于和外部通信，包含WIFI芯片，蓝牙模块，NFC或可替代模块中的至少一种。

在一些实施例中，用户输入/输出接口140包含麦克风，触摸板，传感器，按键或可替代模块中的至少一种。

图3示出了根据一些实施例的显示设备200的硬件配置框图。

在一些实施例中，显示设备200包括调谐解调器210、通信器220、检测器230、外部装置接口240、控制器250、显示器260、音频输出接口270、存储器、供电电源、用户接口中的至少一种。

在一些实施例中控制器包括中央处理器，视频处理器，音频处理器，图形处理器，RAM，ROM，用于输入/输出的第一接口至第n接口。

在一些实施例中，显示器260包括用于呈现画面的显示屏组件，以及驱动图像显示的驱动组件，用于接收源自控制器输出的图像信号，进行显示视频内容、图像内容以及菜单操控界面的组件以及用户操控UI界面等。

在一些实施例中，显示器260可为液晶显示器、OLED显示器、以及投影显示器中的至少一种，还可以为一种投影装置和投影屏幕。

在一些实施例中，调谐解调器210通过有线或无线接收方式接收广播电视信号，以及从多个无线或有线广播电视信号中解调出音视频信号，如以及EPG数据信号。

在一些实施例中，通信器220是用于根据各种通信协议类型与外部设备或服务器进行通信的组件。例如：通信器可以包括Wifi模块，蓝牙模块，有线以太网模块等其他网络通信协议芯片或近场通信协议芯片，以及红外接收器中的至少一种。显示设备200可以通过通信器220与控制装置100或服务器400建立控制信号和数据信号的发送和接收。

在一些实施例中，检测器230用于采集外部环境或与外部交互的信号。例如，检测器230包括光接收器，用于采集环境光线强度的传感器；或者，检测器230包括图像采集器，如摄像头，可以用于采集外部环境场景、用户的属性或用户交互手势，再或者，检测器230包括声音采集器，如麦克风等，用于接收外部声音。

在一些实施例中，外部装置接口240可以包括但不限于如下：高清多媒体接口(HDMI)、模拟或数据高清分量输入接口(分量)、复合视频输入接口(CVBS)、USB输入接口(USB)、RGB端口等任一个或多个接口。也可以是上述多个接口形成的复合性的输入/输出接口。

在一些实施例中，控制器250和调谐解调器210可以位于不同的分体设备中，即调谐解调器210也可在控制器250所在的主体设备的外置设备中，如外置机顶盒等。

在一些实施例中，控制器250，通过存储在存储器上中各种软件控制程序，来控制显示设备的工作和响应用户的操作。控制器250控制显示设备200的整体操作。例如：响应于接收到用于选择在显示器260上显示UI对象的用户命令，控制器250便可以执行与由用户命令选择的对象有关的操作。

在一些实施例中，所述对象可以是可选对象中的任何一个，例如超链接、图标或其他可操作的控件。与所选择的对象有关操作有：显示连接到超链接页面、文档、图像等操作，或者执行与所述图标相对应程序的操作。

在一些实施例中控制器包括中央处理器(Central Processing Unit，CPU)，视频处理器，音频处理器，图形处理器(Graphics Processing Unit，GPU)，RAM Random Access Memory，RAM)，ROM(Read-Only Memory,ROM)，用于输入/输出的第一接口至第n接口，通信总线(Bus)等中的至少一种。

CPU处理器。用于执行存储在存储器中操作系统和应用程序指令，以及根据接收外部输入的各种交互指令，来执行各种应用程序、数据和内容，以便最终显示和播放各种音视频内容。CPU处理器，可以包括多个处理器。如，包括一个主处理器以及一个或多个子处理器。

在一些实施例中，图形处理器，用于产生各种图形对象，如：图标、操作菜单、以及用户输入指令显示图形等中的至少一种。图形处理器包括运算器，通过接收用户输入各种交互指令进行运算，根据显示属性显示各种对象；还包括渲染器，对基于运算器得到的各种对象，进行渲染，上述渲染后的对象用于显示在显示器上。

在一些实施例中，视频处理器，用于将接收外部视频信号，根据输入信号的标准编解码协议，进行解压缩、解码、缩放、降噪、帧率转换、分辨率转换、图像合成等视频处理中的至少一种，可得到直接可显示设备200上显示或播放的信号。

在一些实施例中，视频处理器，包括解复用模块、视频解码模块、图像合成模块、帧率转换模块、显示格式化模块等中的至少一种。其中，解复用模块，用于对输入音视频数据流进行解复用处理。视频解码模块，用于对解复用后的视频信号进行处理，包括解码和缩放处理等。图像合成模块，如图像合成器，其用于将图形生成器根据用户输入或自身生成的GUI信号，与缩放处理后视频图像进行叠加混合处理，以生成可供显示的图像信号。帧率转换模块，用于对转换输入视频帧率。显示格式化模块，用于将接收帧率转换后视频输出信号，改变信号以符合显示格式的信号，如输出RGB数据信号。

在一些实施例中，音频处理器，用于接收外部的音频信号，根据输入信号的标准编解码协议，进行解压缩和解码，以及降噪、数模转换、和放大处理等处理中的至少一种，得到可以在扬声器中播放的声音信号。

在一些实施例中，用户可在显示器260上显示的图形用户界面(GUI)输入用户命令，则用户输入接口通过图形用户界面(GUI)接收用户输入命令。或者，用户可通过输入特定的声音或手势进行输入用户命令，则用户输入接口通过传感器识别出声音或手势，来接收用户输入命令。

在一些实施例中，“用户界面”，是应用程序或操作系统与用户之间进行交互和信息交换的介质接口，它实现信息的内部形式与用户可以接受形式之间的转换。

在一些实施例中，用户接口280，为可用于接收控制输入的接口(如：显示设备本体上的实体按键，或其他等)。

在一些实施例中，显示设备的系统可以包括内核(Kernel)、命令解析器(shell)、文件系统和应用程序。内核、shell和文件系统一起组成了基本的操作系统结构，它们让用户可以管理文件、运行程序并使用系统。上电后，内核启动，激活内核空间，抽象硬件、初始化硬件参数等，运行并维护虚拟内存、调度器、信号及进程间通信(IPC)。内核启动后，再加载Shell和用户应用程序。应用程序在启动后被编译成机器码，形成一个进程。

如图4所示，显示设备的系统可以包括内核(Kernel)、命令解析器(shell)、文件系统和应用程序。内核、shell和文件系统一起组成了基本的操作系统结构，它们让用户可以管理文件、运行程序并使用系统。上电后，内核启动，激活内核空间，抽象硬件、初始化硬件参数等，运行并维护虚拟内存、调度器、信号及进程间通信(IPC)。内核启动后，再加载Shell和用户应用程序。应用程序在启动后被编译成机器码，形成一个进程。

如图4所示，将显示设备的系统分为三层，从上至下分别为应用层、中间件层和硬件层。

应用层主要包含电视上的常用应用，以及应用框架(Application Framework)，其中，常用应用主要是基于浏览器Browser开发的应用，例如：HTML5APPs；以及原生应用(Native APPs)；

应用框架(Application Framework)是一个完整的程序模型，具备标准应用软件所需的一切基本功能，例如：文件存取、资料交换…，以及这些功能的使用接口(工具栏、状态列、菜单、对话框)。

原生应用(Native APPs)可以支持在线或离线，消息推送或本地资源访问。

中间件层包括各种电视协议、多媒体协议以及系统组件等中间件。中间件可以使用系统软件所提供的基础服务(功能)，衔接网络上应用系统的各个部分或不同的应用，能够达到资源共享、功能共享的目的。

硬件层主要包括HAL接口、硬件以及驱动，其中，HAL接口为所有电视芯片对接的统一接口，具体逻辑由各个芯片来实现。驱动主要包含：音频驱动、显示驱动、蓝牙驱动、摄像头驱动、WIFI驱动、USB驱动、HDMI驱动、传感器驱动(如指纹传感器，温度传感器，压力传感器等)、以及电源驱动等。

第一部分：

随着显示设备200趋于智能化，一些显示设备200上可配备智能语音功能，用户可以通过输入语音的方式方便地控制显示设备200。目前，越来越多的语音方案也可以应用于显示设备200中，因此一台显示设备200就可能会存在多个语音方案，比如目前最流行的Amazon的Alexa语音方案和Google的语音方案，以及其他某些国家自己特定的语音方案等。

目前显示设备200中的语音方案，主要通过遥控器等收音设备来收集用户输入的语音内容，当显示设备200上存在两个或者多个语音方案时，会存在不同语音方案之间切换的问题。比如，用户前一次选择语音方案A来进行语音内容的搜索，但是当前操作时，又选择了语音方案B来进行语音内容的搜索。

目前，通常有两种方法来实现不同语音方案的切换：一种是，用户与显示设备200的UI菜单进行交互，通过遥控器在UI菜单上选择某一语音方案；另一种是，用户在遥控器上通过按下不同的按键或语音键来控制显示设备200使用不同的语音方案，比如某显示设备200通过短按某些遥控器按键或者语音键默认使用第一种语音方案，而按键长按则使用第二种语音方案。以上两种语音方案的切换方法中，前者会增加用户的交互复杂度，从而影响用户体验，而后者则会增加遥控器等相同功能按键的冗余，增加硬件成本或者增加按键复用程度。无论哪种方式，会都增加用户切换语音方案时的操作难度。

基于以上内容，本申请实施例提供了一种显示设备上语音方案的切换方法、显示设备200及控制装置100，可以将不同的语音方案与用户操作控制装置100的动作相关联，用户可以根据自己的喜好操作控制装置100，产生对应的动作，进而控制显示设备200使用用户想要选择的语音方案。这种方式可以减少控制装置100的按键使用，使语音方案的切换难度减小。

如前述实施例所述，本申请实施例中的显示设备200具有控制器250。控制器250可以接收用户通过控制装置100输入到显示设备200的语音控制指令等，并根据语音控制指令控制显示器260将显示页面切换至用户希望看到的语音方案的页面。

另外，控制装置100中也具有控制器110。控制器110可以接收用户输入的语音数据，以及利用或者控制传感器等检测用户操作控制装置100的动作数据。

显示设备200与控制装置100之间的数据传输与处理过程，均是由其各自的控制器执行。

图5示出了根据一些实施例的控制器250与控制器110之间的一种交互示意图。

如图5所示，用户可以通过控制装置100输入想要在显示设备200上观看的语音数据，例如“天气如何”等。本申请实施例中，预先可将显示设备200中的不同语音方案与不同的控制装置100的动作相对应，当用户想要在显示设备200选择自己喜欢的语音方案显示自己想要观看的内容时，可以在向控制装置100输入语音数据的同时，操作控制装置100做出与目标语音方案对应的动作，而后，控制器110将检测到的动作数据，连同语音数据一起打包生成语音控制指令，并将其发送给显示设备200。显示设备200的控制器250在接收到语音控制指令后，找到与动作数据对应的目标语音方案以及与语音数据对应的目标内容。然后，控制器250将显示器260的显示页面切换至与动作数据相对应的目标语音方案页面，以及在目标语音方案页面上显示与语音数据对应的目标内容。

本申请实施例中所说的用户操作控制装置100的动作可以包括但不限于：转动控制装置100所指的方向、手持控制装置100移动、或者在控制装置100上画出手势等。由于显示设备200中可以同时具备多种语音方案，那么不同的语音方案可以对应不同的方向，可以对应不同的移动轨迹，也可以对应不同的手势。

用户采用本申请实施例中所提供的控制装置100和显示设备200时，仅可以通过操作控制装置100做出一定的动作，就可以控制显示设备200切换到相应的目标语音方案页面进行显示。这种方式可以避免控制装置100上安装多过的语音控制按键，也可以避免用户与显示设备200的UI菜单频繁进行交互，使得用户的语音方案切换操作更加方面简洁。

本申请实施例中的控制装置100可以是与显示设备200蓝牙连接的遥控器，也可以是安装有虚拟遥控器的智能终端等。当控制装置100是遥控器时，用户可以操作遥控器转动不同的方向，也可以操作遥控器移动出一定的轨迹；当控制装置100是装有虚拟遥控器的智能终端时，用户不仅可以操作智能终端转动不同的方向，以及可以操作智能终端移动出一定的轨迹，还可以在智能终端的显示屏上画出不同的手势等等。

另外，例如遥控器、智能终端等控制装置100中，均安装有重力或者陀螺仪等传感器，以便其检测方向数据和轨迹数据。

图6示出了根据一些实施例的控制器110与控制器250之间的第二种交互示意图。

在一些实施例中，当控制装置100为遥控器时，如图6所示，控制器110可以在接收用户输入的语音数据的同时，利用传感器检测用户操作控制装置100(即遥控器)的方向，并生成方向数据，例如左、右方向等。然后，控制器110再将该方向数据与语音数据打包生成语音控制指令发送给显示设备200。

显示设备200的控制器250接收到语音控制指令后，将其解析获得语音数据和方向数据。而后，控制器250获取与方向数据对应的目标语音方案页面，并将显示器260的显示页面切换至该目标语音方案页面；同时控制器250还要获取与语音数据对应的目标内容，并在显示器260显示目标语音方案页面的同时，将目标内容显示在目标语音方案页面上。

图7示出了根据一些实施例的语音方案页面的一种示意图。图8示出了根据一些实施例的语音方案页面的第二种示意图。图9示出了根据一些实施例的用户操作控制装置100的一种示意图。

以用户操作遥控器分别指向左、右方向为例，具体操作方式如图9所示。其中，预先设置遥控器向左的方向数据对应语音方案A，遥控器向右的方向数据对应语音方案B。用户在对着遥控器说出语音内容(例如“天气如何”)的同时，可以拿着遥控器指向左侧，控制器110将接收到的语音数据以及方向数据发送给显示设备200。显示设备200的控制器250解析语音控制指令后，获取与左侧的方向数据对应的语音方案A，同时获取与语音数据对应的目标内容(例如当前时刻的天气数据)。然后，控制器250将显示器260的显示页面切换至与语音方案A的显示页面，如图7所示，并在该显示页面上的右侧显示当前时刻的天气信息。

或者，用户在对着遥控器说出语音内容(例如“天气如何”)的同时，可以拿着遥控器指向右侧，控制器110将接收到的语音数据以及方向数据发送给显示设备200。显示设备200的控制器250解析语音控制指令后，获取与向右的方向数据对应的语音方案B，同时获取与语音数据对应的目标内容(例如当前时刻的天气数据)。然后，控制器250将显示器260的显示页面切换至与语音方案B的显示页面，如图8所示，并在该显示页面上的底部显示当前时刻的天气信息。

另外，如图7和图8中所示的目标内容的显示位置并不是唯一的，在其他一些实施例中，也可以根据用户的喜好或者实际需求等，将目标内容显示在目标语音方案页面上的任何位置。

图10示出了根据一些实施例的控制器110与控制器250之间的第三种交互示意图。

在一些实施例中，当控制装置100为遥控器时，如图10所示，控制器110还可以在接收用户输入的语音数据的同时，利用传感器检测用户操作控制装置100(即遥控器)的移动轨迹，并生成轨迹数据，例如圆形、方形、三角形等。然后，控制器110再将该轨迹数据与语音数据打包生成语音控制指令发送给显示设备200。

显示设备200的控制器250接收到语音控制指令后，将其解析获得语音数据和轨迹数据。而后，控制器250获取与轨迹数据对应的目标语音方案页面，并将显示器260的显示页面切换至该目标语音方案页面；同时控制器250还要获取与语音数据对应的目标内容，并在显示器260显示目标语音方案页面的同时，将目标内容显示在目标语音方案页面上。

图11示出了根据一些实施例的用户操作控制装置100的第二种示意图。

例如，将遥控器移动的圆形轨迹数据对应语音方案A，将三角形轨迹数据对应语音方案B。用户在对着遥控器说出语音内容(例如“天气如何”)的同时，移动遥控器画出圆形轨迹，例如图11所示，对应的，在显示设备200上就可以显示出语音方案A的页面，以及在页面上显示出当前时刻的天气信息，如图7所示；或者，用户在对着遥控器说出语音内容(例如“天气如何”)的同时，移动遥控器画出三角形轨迹，对应的，在显示设备200上就可以显示出语音方案B的页面，以及在页面上显示出当前时刻的天气信息，如图8所示。

在一些实施例中，智能终端上安装虚拟遥控器后，也可以作为控制装置100使用，例如在智能手机上安装虚拟遥控器等。由于智能终端本身具有重力传感器或者陀螺仪等，因此，智能终端可实现与上述实体遥控器一样的功能，既能检测自身移动的方向数据，也能检测出自身移动的轨迹数据。

同时，由于智能终端本身还具有显示屏，因此智能终端还能检测用户在显示屏上画出的手势并生成手势数据。

图12示出了根据一些实施例的控制器110与控制器250之间的第四种交互示意图。

在一些实施例中，当控制装置100为上述智能终端时，如图12所示，控制器110还可以在接收用户输入的语音数据的同时，检测用户在控制装置100(即智能终端)显示屏上输入的手势并生成手势数据，例如用手指画出“Z”字形手势、“O”字形手势、“L”字形手势等。然后，控制器110再将该手势数据与语音数据打包生成语音控制指令发送给显示设备200。

显示设备200的控制器250接收到语音控制指令后，将其解析获得语音数据和手势数据。而后，控制器250获取与手势数据对应的目标语音方案页面，并将显示器260的显示页面切换至该目标语音方案页面；同时控制器250还要获取与语音数据对应的目标内容，并在显示器260显示目标语音方案页面的同时，将目标内容显示在目标语音方案页面上。

图13示出了根据一些实施例的用户操作控制装置100的第三种示意图。

以用户在智能终端显示屏上分别画出“Z”字形手势和“L”字形手势为例，其中，预先设置“Z”字形手势数据对应语音方案A，“L”字形手势数据对应语音方案B。用户在对着智能终端说出语音内容(例如“天气如何”)的同时，可以在显示屏上画出“Z”字形手势，例如图13所示。控制器110将接收到的语音数据以及手势数据发送给显示设备200。显示设备200的控制器250解析语音控制指令后，获取与“Z”字形手势数据对应的语音方案A，同时获取与语音数据对应的目标内容(例如当前时刻的天气数据)。然后，控制器250将显示器260的显示页面切换至与语音方案A的显示页面，如图7所示，并在该显示页面上的右侧显示当前时刻的天气信息。

或者，用户在对着智能终端说出语音内容(例如“天气如何”)的同时，可以在显示屏上画出“L”字形手势，控制器110将接收到的语音数据以及手势数据发送给显示设备200。显示设备200的控制器250解析语音控制指令后，获取与“L”字形手势数据对应的语音方案B，同时获取与语音数据对应的目标内容(例如当前时刻的天气数据)。然后，控制器250将显示器260的显示页面切换至与语音方案B的显示页面，如图8所示，并在该显示页面上的右侧显示当前时刻的天气信息。

在本申请实施例中，遥控器和虚拟遥控器上均设置有语音按键，用户按下该按键即可说出语音内容，在语音内容输入完成后释放按键。并且，为了保证动作数据的准确性和时效性，控制器110需要在用户按下语音按键的同时，开始检测用户操作遥控器的动作，以保证动作数据与语音数据同步进行采集。

在一些实施例中，也可能会出现动作时间大于语音输入时间的情况，即用户已经将语音内容说完，但是操作动作并未做完，此时，用户可以继续保持语音按键按下的状态，直至操作动作完成。

值得说明的是，前述实施例中所说的遥控器和智能终端，可以分别单独控制显示设备200，也可以共同控制显示设备200。并且，使用遥控器时，既可以分别单独使用方向数据、轨迹数据等对显示设备200进行控制，也可以同时利用方向数据和轨迹数据共同对显示设备200进行控制。或者，使用智能终端时，既可以分别单独使用方向数据、轨迹数据、手势数据等对显示设备200进行控制，也可以同时利用其中的任两项或者全部三项数据共同对显示设备200进行控制。

由上述内容可知，本申请实施例提供的控制装置100，在接收用户输入的语音数据的同时检测用户操作控制装置100的动作并生成动作数据；并将语音数据与动作数据打包生成的语音控制指令发送给显示设备200。该控制装置100上不必设置过多冗余的按键，只需利用一个语音按键接收用户输入的语音内容，并且检测出用户的操作动作，就可以在显示设备200上切换出对应语音方案的页面以及目标内容，减小了语音方案的切换难度。

另外，本申请实施例提供的显示设备200，在接收到语音控制指令后，将显示器260的显示页面切换至与动作数据相对应的语音方案页面，以及在语音方案页面上显示与语音数据对应的目标内容。该显示设备200也避免了用户使用UI菜单进行语音方案的手动选择，同时也减小了语音方案的切换难度。

在上述控制装置100与显示设备200之间的交互方案中，将不同的语音方案与用户操作控制装置100的动作相关联，用户可以根据自己的喜好操作控制装置100，产生对应的动作，进而控制显示设备200使用用户想要选择的语音方案。减少控制装置100的按键设置，也避免使用显示设备200的UI菜单，使语音方案的切换难度减小。

图14示出了根据一些实施例的显示设备上语音方案的切换方法的一种流程图。

本申请实施例提供了一种可以应用于前述实施例显示设备200上的语音方案的切换方法，该方法由可以实现控制功能的控制器250以及其他控制部件执行，如图14所示，具体可以包括如下步骤：

步骤S101，接收控制装置100发送的语音控制指令。

其中，语音控制指令包括用于切换显示设备200语音方案的用户操作控制装置100的动作数据，以及，用于在显示设备200上搜索目标内容的用户输入的语音数据。

步骤S102，响应于语音控制指令，将显示器260的显示页面切换至与动作数据相对应的目标语音方案页面，以及在目标语音方案页面上显示与语音数据对应的目标内容。

在一些实施例中，所述方法还包括：解析语音控制指令，获得语音数据和方向数据；方向数据为根据用户操作控制装置100的方向生成的数据；获取与语音数据对应的目标内容；在将显示器260的显示页面切换至与方向数据对应的目标语音方案页面的同时，在目标语音方案页面上显示目标内容。

在一些实施例中，所述方法还包括：解析语音控制指令，获得语音数据和轨迹数据；轨迹数据为根据用户操作控制装置100的轨迹生成的数据；获取与语音数据对应的目标内容；在将显示器260的显示页面切换至与轨迹数据对应的目标语音方案页面的同时，在目标语音方案页面上显示目标内容。

在一些实施例中，所述方法还包括：解析语音控制指令，获得语音数据和手势数据；手势数据为根据用户在控制装置100上输入的手势生成的数据；获取与语音数据对应的目标内容；在将显示器260的显示页面切换至与手势数据对应的目标语音方案页面的同时，在目标语音方案页面上显示目标内容。

图15示出了根据一些实施例的显示设备上语音方案的切换方法的另一种流程图。

本申请实施例还提供了一种可以应用于前述实施例控制装置100上的语音方案的切换方法，该方法由可以实现控制功能的控制器110以及其他控制部件执行，如图15所示，具体可以包括如下步骤：

步骤S201，在接收用户输入的语音数据的同时，检测用户操作控制装置100的动作并生成动作数据。

步骤S202，将语音数据与动作数据打包生成的语音控制指令发送给显示设备200。

在一些实施例中，所述方法还包括：在接收用户输入的语音数据的同时，利用传感器检测用户操作控制装置100的方向并生成方向数据；其中，不同的方向数据对应显示设备200中不同的语音方案。

在一些实施例中，所述方法还包括：在接收用户输入的语音数据的同时，利用传感器检测用户操作控制装置100的轨迹并生成轨迹数据；其中，不同的轨迹数据对应显示设备200中不同的语音方案。

在一些实施例中，所述方法还包括：在接收用户输入的语音数据的同时，检测用户在控制装置100上输入的手势并生成手势数据；其中，不同的手势数据对应显示设备200中不同的语音方案。

由于本申请实施例中两种显示设备上语音方案的切换方法可以分别应用于如前述实施例所述的控制器250和控制器110中，因此，关于本申请实施例中两种显示设备上语音方案的切换方法的其他内容可以参照前述关于控制器250和控制器110实施例的内容，在此不再赘述。

第二部分：

本申请实施例提供一种服务器，所述服务器用于执行：

接收显示设备采集的声音数据，所述声音数据中至少包含视频资源名称；

在所述声音数据中还包含视频应用名称，且在所述显示设备上安装有所述视频应用名称对应的视频应用时，在所述视频应用名称对应的视频应用中搜索所述视频资源名称对应的视频资源，以及将所述视频资源反馈至所述显示设备；

在所述声音数据中还包含视频应用名称，且在所述显示设备上未安装所述视频应用名称对应的视频应用时，不向所述显示设备反馈视频资源。

在本申请一些实施例中，所述服务器还用于执行：

在所述声音数据中不包含视频应用名称，且在所述显示设备上运行有视频应用时，在当前运行的视频应用中搜索所述视频资源名称对应的视频资源，以及将所述视频资源反馈至所述显示设备。

在本申请一些实施例中，所述服务器还用于执行：

在所述声音数据中不包含视频应用名称，且在所述显示设备上未运行视频应用时，在所述显示设备上安装的所有视频应用中，搜索所述视频资源名称对应的视频资源，以及将所述视频资源反馈至所述显示设备。

在本申请一些实施例中，所述服务器包括：

语音识别子服务器，用于执行接收显示设备采集的声音数据，从所述声音数据中至少识别视频资源名称，以及将从所述声音数据中识别的数据发送至指令生成子服务器；

指令生成子服务器，用于执行，根据从所述声音数据中识别的数据生成资源搜索指令，以及将所述资源搜索指令发送至所述显示设备；

视频搜索子服务器，用于执行，在从所述声音数据中识别的数据中还包含视频应用名称，且在所述显示设备上安装有所述视频应用名称对应的视频应用时，接收所述显示设备发送的视频搜索请求，根据所述视频搜索请求在所述视频应用名称对应的视频应用中，搜索所述视频资源名称对应的视频资源，以及将所述视频资源反馈至所述显示设备，其中，所述视频搜索请求为根据所述资源搜索指令生成的；

所述视频搜索子服务器，还用于执行，在从所述声音数据中识别的数据中还包含视频应用名称，且在所述显示设备上未安装所述视频应用名称对应的视频应用时，不接收所述显示设备发送的视频搜索请求。

在本申请一些实施例中，所述视频搜索子服务器，还用于执行，在从所述声音数据中识别的数据中不包含视频应用名称，且在所述显示设备上运行有视频应用时，接收所述显示设备发送的所述视频搜索请求，根据所述视频搜索请求在当前运行的视频应用中，搜索所述视频资源名称对应的视频资源，以及将所述视频资源反馈至所述显示设备。

在本申请一些实施例中，所述视频搜索子服务器，还用于执行，在从所述声音数据中识别的数据中不包含视频应用名称，且在所述显示设备上未运行视频应用时，接收所述显示设备发送的所述视频搜索请求，根据所述视频搜索请求在所述显示设备上安装的所有视频应用中，搜索所述视频资源名称对应的视频资源，以及将所述视频资源反馈至所述显示设备。

本申请一些实施例还提供一种显示设备，包括：

显示器；

声音采集器，用于执行采集用户的声音数据；

控制器，用于执行，将所述声音数据发送至服务器，所述声音数据中至少包含视频资源名称；

在所述声音数据中还包含视频应用名称，且在所述显示设备上安装有所述视频应用名称对应的视频应用时，从所述服务器接收与所述视频资源名称对应的视频资源，其中，所述视频资源为在与所述视频应用名称对应的视频应用中搜索的；

在所述声音数据中还包含视频应用名称时，且在所述显示设备上未安装所述视频应用名称对应的视频应用时，不从所述服务器接收视频资源。

在本申请一些实施例中，所述控制器，在所述声音数据中还包含视频应用名称时，且在所述显示设备上未安装所述视频应用名称对应的视频应用时，还用于执行：在所述显示器上显示提示信息，其中，所述提示信息用于提示用户在所述显示设备上未安装所述视频应用名称对应的视频应用。

在本申请一些实施例中，所述控制器，还用于执行：

在所述声音数据中不包含视频应用名称时，且在所述显示设备上运行有视频应用时，从所述服务器接收与所述视频资源名称对应的视频资源，其中，所述视频资源为在当前运行的视频应用中搜索的；

在所述声音数据中不包含视频应用名称时，且在所述显示设备上未运行视屏应用，从所述服务器接收与所述视频资源名称对应的视频资源，其中，所述视频资源为在所述显示设备上安装的所有视频应用中搜索的。

本申请一些实施例还提供一种视频搜索方法，应用于显示设备，包括：

将采集的声音数据发送至服务器，所述声音数据中至少包含视频资源名称；

在所述声音数据中还包含视频应用名称，且在所述显示设备上未安装所述视频应用名称对应的视频应用时，不从所述服务器接收视频资源。

目前显示设备集成有智能语音助手，用户可以利用遥控器，通过智能语音助手进行视频搜索。

然而，用户在输入想要搜索的视频资源名称后，传统的显示设备通常是进行整机搜索，即同时在显示设备安装的多款视频应用上搜索视频，因此无法实现在指定视频应用上搜索视频的目的，造成用户的视频搜索体验较差。

为了解决上述问题，本申请提供一种视频搜索系统，如图16所示的视频搜索系统的框架图，该系统包括显示设备200和服务器400。本申请实施例为显示设备和服务器交互的场景。显示设备上安装有多款视频应用，服务器用于识别显示设备采集的声音数据，同时于提供多款视频应用的视频资源。

利用本实施例的视频搜索系统进行视频搜索的过程，具体为：

用户向显示设备输入声音数据，显示设备的声音采集器采集到用户输入的声音数据。显示设备可以将转码后的声音数据发送至服务器。所述声音数据中至少包含视频资源名称。

服务器在接收到声音数据后，从声音数据中识别数据，具体的至少识别视频资源名称。

在一些实施例中，如果所述声音数据中还包含视频应用名称，并且显示设备上安装有该视频应用名称对应的视频应用。即服务器不仅从声音数据中识别出视频资源名称，还从声音数据中识别出视频应用名称，同时显示设备安装有所述视频应用。则显示设备调用所述视频应用的搜索接口，在服务器中搜索所述视频资源名称对应的视频资源。搜索成功后，服务器将所述视频资源反馈至显示设备。

在一些实施例中，如果该声音数据中还包含视频应用名称，并且显示设备上未安装该视频应用名称对应的视频应用。则显示设备不可调用所述视频应用的搜索接口，同样也不能在服务器中搜索所述视频资源名称对应的视频资源，不能向显示设备反馈所述视频资源。

示例性的，当用户输入声音数据“在视频应用A中搜索视频X”时，显示设备将所述声音数据发送至服务器。服务器从所述声音数据中识别出视频资源名称为视频X和视频应用名称为应用A。

如果在显示设备上安装有视频应用A，则显示设备调用视频应用A的搜索接口，在服务器中搜索视频X。在搜索到视频X的视频资源后，将视频X的视频资源反馈至显示设备。从而实现通过语音助手，在指定的视频应用中搜索指定视频资源的目的，提升用户视频搜索的体验。

如果在显示设备上未安装视频应用A，则显示设备不可调用视频应用A的搜索接口，也就无法在服务器中搜索视频X，同样无法向显示设备反馈视频X的视频资源。

在一些实施例中，如果所述声音数据中不包含视频应用名称，而只包含视频资源名称，同时当前在显示设备的后台运行有视频应用，则调用当前运行的视频应用的搜索接口，在服务器中搜索所述视频应用名称对应的视频资源。在搜索到视频资源名称对应的视频资源后，将所述视频资源反馈至显示设备。

在一些实施例中，如果所述声音数据中不包含视频应用名称，而只包含视频资源名称，同时当前在显示设备的后台没有运行的视频应用，则调用整机搜索功能，整机搜索所述视频资源。

示例性的，当用户输入声音数据“搜索视频X”时，显示设备将所述声音数据发送至服务器。服务器从所述声音数据中只能识别出视频资源名称，视频X。

如果当前显示设备的后台运行有视频应用B，则显示设备调用视频应用B的搜索接口，在服务器中搜索视频X的视频资源。在搜索到视频X的视频资源后，将所述视频资源反馈至显示设备。

如果当前显示设备的后台没有视频应用运行，无法调用单个视频应用的搜索接口，则调用整机搜索功能(在显示设备上安装的所有视频应用内搜索)，整机搜索视频X的视频资源。在搜索到视频X的视频资源后，将所述视频资源反馈至显示设备。在该场景，有可能在多个视频应用中搜索到视频X的视频资源。在显示设备上，可以按照该用户对各个视频应用的喜好程度，对在不同视频应用中搜索到的视频X的视频资源进行排序展示。

在一些实施例中，服务器400包括语音识别子服务400A、指令生成子服务器400B以及视频搜索子服务器400C。语音识别子服务器可以是智能语音合作商的服务器，用于解析语音和语义，识别出相关指令。指令生成子服务器和视频搜索子服务器可以是本地服务器，用于根据解析的语义生成相关的搜索指令。视频搜索子服务器用于接收显示设备端的搜索请求，反馈相关的资源。

用户向显示设备输入声音数据，显示设备的声音采集器采集到用户输入的声音数据。显示设备可以将转码后的声音数据发送至语音识别子服务器。所述声音数据中至少包含视频资源名称。

语音识别子服务器在接收到声音数据后，对声音数据进行语音和语义的解析，识别出相关指令参数，具体的至少识别视频资源名称。

在一些实施例中，如果所述声音数据中还包含视频应用名称，且显示设备安装有视频应用名称对应的视频应用。语音识别子服务器对声音数据解析后，还识别出视频应用名称。之后语音识别子服务器将识别出的视频应用名称和视频资源名称，以及与形成指令的其他相关参数(如执行的操作参数、设备参数，语言参数等)，发送至指令生成子服务器。

指令生成子服务器根据视频应用名称、视频资源名称以及形成指令的其他相关参数，生成资源搜索指令。这里，也可以是语音识别子服务器直接从声音数据中识别出相关指令，将识别出的相关指令发送至指令生成子服务器。指令生成子服务器将识别出的相关指令，转化为显示设备可识别的资源搜索指令。解析声音数据，根据解析的数据生成资源搜索指令的具体的过程，本申请不作限制。

指令生成子服务器将生成的资源搜索指令反馈至显示设备。显示设备接收到资源搜索指令后，根据所述资源搜索指令生成视频搜索请求。显示设备将所述视频搜索请求发送至视频搜索子服务器，即调用视频应用名称对应视频应用的搜索接口，视频搜索子服务器中搜索该视频应用中的视频资源。

在搜索到视频资源名称的视频资源后，视频搜索子服务器将该视频资源反馈至显示设备。

示例性的，如图17所示，当用户输入声音数据“在视频应用A中搜索视频X”，在显示设备上显示所述声音数据。显示设备将所述声音数据发送至语音识别子服务器。语音识别子服务器接收到所述声音数据后，从声音数据中识别出视频资源名称为视频X、视频应用名称为应用A以及其他相关参数(需要执行的操作为搜索)。

语音识别子服务器将识别出的视频资源名称视频X、视频应用名称应用A以及其他相关参数发送至指令生成子服务器。指令生成子服务器根据识别出的视频资源名称视频X、视频应用名称应用A以及其他相关参数生成资源搜索指令：在视频应用A中搜索视频X。指令生成子服务器将生成的所述资源搜索指令反馈至显示设备。

显示设备在接收到所述资源搜索指令后，从如图17所示的用户界面跳转到图18所示的用户界面，图18的用户界面为视频应用A的用户界面。

具体的实现过程为：显示设备根据所述资源搜索指令生成视频搜索请求，并将所述视频搜索请求发送至视频搜索子服务器，以使在应用A中搜索在视频应用A中搜索视频X。即在显示设备上调用应用A的搜索接口，在应用A中搜索在视频应用A中搜索视频X。

在搜索到视频X的视频资源后，视频搜索子服务器将视频X的视频资源反馈至显示设备。如图18所示的用户界面，向用户展示搜索得到的视频X的视频资源(可以展示视频X和与视频X相关的其他视频)。

在一些实施例中，如果所述声音数据中还包含视频应用名称，且显示设备未安装视频应用名称对应的视频应用。语音识别子服务器对声音数据解析后，还识别出视频应用名称。之后语音识别子服务器将识别出的视频应用名称和视频资源名称，以及与形成指令的其他相关参数(如执行的操作参数、设备参数，语言参数等)，发送至指令生成子服务器。

指令生成子服务器根据视频应用名称、视频资源名称以及形成指令的其他相关参数，生成资源搜索指令。这里，也可以是语音识别子服务器直接从声音数据中识别出相关指令，将识别出的相关指令发送至指令生成子服务器。指令生成子服务器将识别出的相关指令，转化为显示设备可识别的资源搜索指令。

指令生成子服务器将生成的资源搜索指令反馈至显示设备。由于此时显示设备未安装所述视频应用名称对应的视频应用，无法调用所述视频应用的搜索接口。则无法向视频搜索子服务器发送对应的视频搜索请求，同样也无法从视频搜索子服务器获取所述视频资源。

示例性的，当用户输入声音数据“在视频应用A中搜索视频X”时，语音识别子服务器从所述声音数据中识别生成指令的相关参数，并将相关参数发送至指令生成子服务器。

指令生成子服务器根据生成指令的相关参数，生成资源搜索指令：在视频应用A中搜索视频X。此时显示设备上未安装应用A，因此无法调用应用A的搜索接口，因此无法向视频搜索子服务器发出视频搜索请求。视频搜索子服务器也无法反馈搜索视频X的视频资源。

在一些实施例中，如果声音数据中还包含视频应用名称，且显示设备未安装与所述视频应用名称对应的视频应用，则无法向视频搜索子服务器发送对应的视频搜索请求，同样也无法从视频搜索子服务器获取所述视频资源。控制器生成提示信息，同时将所述提示信息展示在显示器上。提示信息可以是：不存在该应用，请在其他应用中搜索。

在一些实施例中，如果所述声音数据中不包含视频应用名称，且显示设备当前运行有视频应用，语音识别子服务器仅能从声音数据中识别出视频资源名称。语音识别子服务器将识别出的视频资源名称和指令生成的其他相关参数，发送至指令生成子服务器。指令生成子服务器根据视频资源名称和其他相关参数，生成资源搜索指令。

显示设备接收到资源搜索指令后，根据资源搜索指令生成视频搜索请求，即调用当前运行视频应用的搜索接口。将视频搜索请求发送至视频搜索子服务器。在当前运行视频应用中搜索与所述视频资源名称对应的视频资源，以及将搜索得到的视频资源反馈至显示设备。

示例性的，如图19所示的用户界面，为视频应用B的主页界面，包括导航栏和推荐视频。在图19所示的用户界面中，当用户输入声音数据“搜索视频X”，可以在用户界面中显示该声音数据。显示设备将该声音数据发送至语音识别子服务器。

语音识别子服务器从所述声音数据中识别生成指令的相关参数，并将相关参数发送至指令生成子服务器。指令生成子服务器根据生成指令的相关参数，生成资源搜索指令：搜索视频X，以及将所述资源搜索指令发送至显示设备。

显示设备在接收到所述资源搜索指令后，从如图19所示的用户界面跳转到图20所示的用户界面。具体的实现过程为：显示设备根据资源搜索指令调用视频应用B的搜索接口，生成视频搜索请求。将视频搜索请求发送至视频搜索子服务器，在视频应用B中搜索视频X的视频资源，以及将搜索得到的视频X的视频资源反馈至显示设备。同样的，在显示设备上展示搜索得到的与视频X相关的视频资源。

在一些实施例中，如果所述声音数据中不包含视频应用名称，且显示设备当前未运行视频应用，语音识别子服务器仅能从声音数据中识别出视频资源名称。指令生成子服务器根据从声音数据中识别的数据生成资源搜索指令。

显示设备当前没有正在后台运行的视频应用，同时声音数据中不包含视频应用名称，因此显示设备调用已安装的所有视频应用的搜索接口，生成视频搜索请求，将视频搜索请求发送至视频搜索子服务器。从而实现整机搜索，最后将搜索得到的所有与视频资源名称对应的视频资源反馈至显示设备。

示例性，当用户输入声音数据“搜索视频X”时，语音识别子服务器从所述声音数据中识别生成指令的相关参数，并将相关参数发送至指令生成子服务器。指令生成子服务器根据生成指令的相关参数，生成资源搜索指令：搜索视频X。

此时，搜索指令中不包含指定的视频应用，并且显示设备当前没有正在后台运行的视频应用。则调用已安装的所有视频应用的搜索接口，生成视频搜索请求，将视频搜索请求发送至视频搜索子服务器。从而实现整机搜索视频X的视频资源。最后将与视频X对应的视频资源反馈至显示设备。

在一些实施例中，指令生成子服务器在根据从声音数据中识别的数据，生成的资源搜索指令中包含ApplicationName参数。如果语音识别子服务器从声音数据中识别出某应用的名称，则将该应用的名称赋值给ApplicationName参数。当显示设备接收到资源搜索指令后，如果ApplicationName字段值不为空，并且ApplicationName字段值与显示设备上安装的某个应用的名称一致，则打开该应用。同时将要搜索的视频资源名称发送至该应用的搜索接口，实现在该应用内搜索与视频资源名称对应的视频资源。

当显示设备接收到资源搜索指令后，如果ApplicationName字段值不为空，并且显示设备上安装的应用中没有与ApplicationName字段值一致的应用，则无法打开应用，也无法实现在该应用内搜索视频资源。

当显示设备接收到资源搜索指令后，如果ApplicationName字段值为空，即没有从声音数据中识别出应用的名称，并且当前显示设备后台运行有某应用，则打开当前运行的视频应用。同时将要搜索的视频资源名称发送至当前运行应用的搜索接口，实现在当前运行应用内搜索与视频资源名称对应的视频资源。

当显示设备接收到资源搜索指令后，如果ApplicationName字段值为空，并且当前显示设备后台没有运行的应用，则打开显示设备上安装的所有视频应用。同时将要搜索的视频资源名称发送至所有视频应用的搜索接口，实现在整机搜索。

本申请实施例提供一种视频搜索方法，如图21所示的视频搜索方法的信令图，所述方法包括以下步骤：

步骤一、显示设备采集声音数据，所述声音数据为用户通过用户输入接口输入的语音指令。所述声音数据至少包含视频资源名称。显示设备将所述声音数据发送至服务器。

步骤二、服务器接收到声音数据后，如果声音数据中还包含视频应用名称，且在显示设备上安装有与视频应用名称对应的视频应用。则在所述视频应用名称对应的视频应用中搜索与视频资源名称对应的视频资源。

步骤三、服务器将与视频资源名称对应的视频资源反馈至显示设备。

在一些实施例中，如果声音数据中还包含视频应用名称，且在显示设备上未安装与视频应用名称对应的视频应用。则不向显示设备反馈视频资源。

在一些实施例中，如果声音数据中不包含视频应用名称，且当前在显示设备上有运行的视频应用。则在当前运行的视频应用中搜索与视频资源名称对应的视频资源，以及将视频资源反馈至显示设备。

在一些实施例中，如果声音数据中不包含视频应用名称，且当前在显示设备上未运行视频应用。则整机搜索与视频资源名称对应的视频资源，以及将视频资源反馈至显示设备。

基于上述方法实施例，本申请实施例提供又一种视频搜索方法，如图22所示的视频搜索方法的信令图，所述方法包括以下步骤：

步骤一、显示设备采集声音数据，所述声音数据为用户通过用户输入接口输入的语音指令。所述声音数据至少包含视频资源名称。显示设备将该声音数据发送至语音识别子服务器。

步骤二、语音识别子服务器从所述声音数据中识别生成指令的各参数，其中至少包含视频资源名称，以及将生成指令的各参数发送至指令生成子服务器。

步骤三、指令生成子服务器根据生成指令的各参数生成资源搜索指令，以及将资源搜索指令反馈至显示设备。

步骤四、显示设备接收所述资源搜索指令，此时声音数据中还包含视频应用名称，如果显示设备中安装有视频应用名称对应的视频应用，则根据资源搜索指令生成视频搜索请求(调用与视频应用名称对应的视频应用的搜索接口)，以及将视频搜索请求发送至视频搜索子服务器。

步骤五、视频搜索子服务器在接收到视频搜索请求后，在于视频应用名称对应的视频应用中，搜索有视频资源名称对应的视频资源，以及将与视频资源名称对应的视频资源反馈至显示设备。

在一些实施例中，如果声音数据中还包含视频应用名称，且显示设备中未安装与视频应用名称对应的视频应用，则无法调用该视频应用的搜索接口，无法根据资源搜索指令生成视频搜索请求。

在一些实施例中，如果声音数据中不包含视频应用名称，且显示设备当前运行有视频应用，则调用当前运行的视频应用的搜索接口，以及向视频搜索子服务器发送视频搜索请求。视频搜索子服务器在接收到所述视频搜索请求后，在当前运行的视频应用中搜索与视频资源名称对应的视频资源，以及将所述视频资源反馈至显示设备。

在一些实施例中，如果声音数据中不包含视频应用名称，且显示设备当前没有运行的视频应用，则整机搜索与视频资源名称对应的视频资源。具体的，调用显示设备安装的所有视频应用的搜索接口，向视频搜索子服务器发送视频搜索请求。视频搜索子服务器在所有视频应用中搜索与视频资源名称对应的视频资源，以及将搜索到的所有与视频资源名称对应的视频资源反馈至显示设备。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

为了方便解释，已经结合具体的实施方式进行了上述说明。但是，上述示例性的讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导，可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用，从而使得本领域技术人员更好的使用所述实施方式以及适于具体使用考虑的各种不同的变形的实施方式。

Claims

一种显示设备，包括：

显示器；

控制器，被配置为：

接收控制装置发送的语音控制指令；所述语音控制指令包括用于切换显示设备语音方案的用户操作所述控制装置的动作数据，以及，用于在显示设备上搜索目标内容的用户输入的语音数据；

响应于所述语音控制指令，将显示器的显示页面切换至与所述动作数据相对应的目标语音方案页面，以及在所述目标语音方案页面上显示与所述语音数据对应的目标内容。
根据权利要求1所述的显示设备，所述控制器，还被配置为：

解析所述语音控制指令，获得语音数据和方向数据；所述方向数据为根据用户操作所述控制装置的方向生成的数据；

获取与所述语音数据对应的目标内容；

在将显示器的显示页面切换至与所述方向数据对应的目标语音方案页面的同时，在所述目标语音方案页面上显示所述目标内容。
根据权利要求1所述的显示设备，所述控制器，还被配置为：

解析所述语音控制指令，获得语音数据和轨迹数据；所述轨迹数据为根据用户操作所述控制装置的轨迹生成的数据；

获取与所述语音数据对应的目标内容；

在将显示器的显示页面切换至与所述轨迹数据对应的目标语音方案页面的同时，在所述目标语音方案页面上显示所述目标内容。
根据权利要求1所述的显示设备，所述控制器，还被配置为：

解析所述语音控制指令，获得语音数据和手势数据；所述手势数据为根据用户在所述控制装置上输入的手势生成的数据；

获取与所述语音数据对应的目标内容；在将显示器的显示页面切换至与所述手势数据对应的目标语音方案页面的同时，在所述目标语音方案页面上显示所述目标内容。
一种控制装置，包括：

控制器，被配置为：

在接收用户输入的语音数据的同时，检测用户操作所述控制装置的动作并生成动作数据；

将所述语音数据与所述动作数据打包生成的语音控制指令发送给显示设备。
根据权利要求5所述的控制装置，所述控制器，还被配置为：

在接收用户输入的语音数据的同时，利用传感器检测用户操作所述控制装置的方向并生成方向数据；其中，不同的方向数据对应显示设备中不同的语音方案。
根据权利要求5所述的控制装置，所述控制器，还被配置为：

在接收用户输入的语音数据的同时，利用传感器检测用户操作所述控制装置的轨迹并生成轨迹数据；其中，不同的轨迹数据对应显示设备中不同的语音方案。
根据权利要求5所述的控制装置，所述控制器，还被配置为：

在接收用户输入的语音数据的同时，检测用户在所述控制装置上输入的手势并生成手势数据；其中，不同的手势数据对应显示设备中不同的语音方案。
一种显示设备上语音方案的切换方法，包括：

接收控制装置发送的语音控制指令；所述语音控制指令包括用于切换显示设备语音方案的用户操作所述控制装置的动作数据，以及，用于在显示设备上搜索目标内容的用户输入的语音数据；

响应于所述语音控制指令，将显示器的显示页面切换至与所述动作数据相对应的目标语音方案页面，以及在所述目标语音方案页面上显示与所述语音数据对应的目标内容。
一种显示设备上语音方案的切换方法，包括：

在接收用户输入的语音数据的同时，检测用户操作所述控制装置的动作并生成动作数据；

将所述语音数据与所述动作数据打包生成的语音控制指令发送给显示设备。