CN110099295B - 电视机语音控制方法、装置、设备及存储介质 - Google Patents
电视机语音控制方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110099295B CN110099295B CN201910464835.5A CN201910464835A CN110099295B CN 110099295 B CN110099295 B CN 110099295B CN 201910464835 A CN201910464835 A CN 201910464835A CN 110099295 B CN110099295 B CN 110099295B
- Authority
- CN
- China
- Prior art keywords
- voice
- vocabulary library
- voice information
- television
- cloud
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 239000000463 material Substances 0.000 claims abstract description 73
- 238000013135 deep learning Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1095—Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
- H04N21/42206—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
- H04N21/42222—Additional components integrated in the remote control device, e.g. timer, speaker, sensors for detecting position, direction or movement of the remote control, microphone or battery charging device
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明实施例公开了一种电视机语音控制方法、装置、设备及存储介质,该方法包括:获取用于控制电视机的语音信息;确定本地词汇库是否存在所述语音信息对应的语音素材;如果是,则基于本地词汇库识别所述语音信息以生成控制指令;如果否,则在线通过云词汇库识别所述语音信息以生成控制指令,以及基于所述云词汇库对所述本地词汇库进行更新;控制电视机执行所述控制指令。解决了现有技术的电视机语音控制方法的准确率较低的问题,达到了提高电视机语音控制准确率的技术效果。
Description
技术领域
本发明实施例涉及电视机控制领域,尤其涉及一种电视机语音控制方法、装置、设备及存储介质。
背景技术
随着人们对生活品质要求的提高,集成有语音控制装置的电视机受到了越来越多用户的青睐。为了迎合用户的需求,越来越多的电视集成有语音控制装置,但目前电视机的语音控制装置普遍存在语音控制准确率较低的问题,即经常出现语音控制失效的情况,究其原因是电视机无法识别用户说出的语音信息,从而无法执行该语音信息对应的控制命令。
综上,有必要提供一种电视机语音控制方法以调高电视机语音控制方法的准确性。
发明内容
本发明实施例提供了一种电视机语音控制方法、装置、设备及存储介质,解决了现有技术的电视机语音控制方法的准确率较低的问题。
第一方面,本发明实施例提供了一种电视机语音控制方法,包括:
获取用于控制电视机的语音信息;
确定本地词汇库是否存在所述语音信息对应的语音素材;
如果是,则基于本地词汇库识别所述语音信息以生成控制指令;
如果否,则在线通过云词汇库识别所述语音信息以生成控制指令,以及基于所述云词汇库对所述本地词汇库进行更新;
控制电视机执行所述控制指令。
进一步,所述如果否,则在线通过云词汇库识别所述语音信息以生成控制指令之后,还包括:
如果在线云词汇库不存在所述语音信息对应的语音素材,则输出手动遥控信息,以使用户手动遥控电视机;
将所述语音信息以及用户手动遥控电视机的操作所对应的控制指令异步缓存至本地词汇库。
进一步,还包括:基于预设时间间隔,从网络获取包含热门词汇的语音素材并将所述语音素材添加至云词汇库,并将本地词汇库的语音素材定期同步至云词汇库,以使所述云词汇库将当前语音素材基于预设分类发送至本地词汇库以更新本地词汇库。
进一步,所述将本地词汇库的语音素材定期同步至云词汇库,以使所述云词汇库将当前语音素材基于预设分类发送至本地词汇库以更新本地词汇库之后,还包括:
根据本地词汇库和云词汇库中的语音素材,基于深度学习建立语音信息与控制指令之间的对应关系。
进一步,所述预设分类至少包括方言分类和娱乐类型分类中的一种,其中娱乐类型分类包括电视剧、综艺、美食和体育。
第二方面,本发明实施例还提供了一种电视机语音控制装置,包括:
获取模块,用于获取用于控制电视机的语音信息;
语音素材确定模块,用于确定本地词汇库是否存在所述语音信息对应的语音素材;
本地识别模块,用于在本地词汇库存在所述语音信息对应的语音素材时,基于本地词汇库识别所述语音信息以生成控制指令;
在线识别模块,用于在本地词汇库不存在所述语音信息对应的语音素材时,在线通过云词汇库识别所述语音信息以生成控制指令,以及基于所述云词汇库对所述本地词汇库进行更新;
控制模块,用于控制电视机执行所述控制指令。
进一步,还包括提示模块;所述提示模块用于在线云服务器不存在所述语音信息对应的语音素材时输出手动遥控信息,以使用户手动遥控电视机;同时将所述语音信息以及用户手动遥控电视机的操作所对应的控制指令异步缓存至本地词汇库。
进一步,还包括更新模块;所述更新模块用于基于预设时间间隔从网络获取包含热门词汇的语音素材并将所述语音素材添加至云词汇库,并将本地词汇库的语音素材定期同步至云词汇库,以使所述云词汇库将当前语音素材基于预设分类发送至本地词汇库以更新本地词汇库。
第三方面,本发明实施例还提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的电视机语音控制方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的电视机语音控制方法。
本发明实施例提供的电视机语音控制方法的技术方案,包括获取用于控制电视机的语音信息;确定本地词汇库是否存在语音信息对应的语音素材;如果是,则基于本地词汇库识别语音信息以生成控制指令,具有较高的语音识别速度,从而具有较高的语音控制速度;如果否,则在线通过云词汇库识别语音信息以生成控制指令,以及基于云词汇库对本地词汇库进行更新,通过云词汇库进行补充语音识别,有助于提高语音识别的准确率,进而提高语音控制的准确率,通过云词汇库对本地词汇库进行更新可以丰富本地词汇库的语音素材;控制电视机执行控制指令已完成语音控制以完成语音控制。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的电视机语音控制方法的流程图;
图2是本发明实施例二提供的电视机语音控制装置的结构框图;
图3是本发明实施例二提供的又一电视机语音控制装置的结构框图;
图4是本发明实施例三提供的设备的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,以下将参照本发明实施例中的附图,通过实施方式清楚、完整地描述本发明的技术方案,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
图1是本发明实施例一提供的电视机语音控制方法的流程图。本实施例的技术方案适用于集成有语音控制装置的电视机、机顶盒和OTT盒子的情况。该方法可以由本发明实施例提供的电视机语音控制装置来执行,该装置可以采用软件和/或硬件的方式实现,并配置在处理器中应用。该方法具体包括如下步骤:
S101、获取用于控制电视机的语音信息。
对于集成有语音控制装置的电视机、机顶盒或OTT盒子来说,如果用户要通过语音控制电视机,则只要对着语音控制装置的麦克风说出用于控制电视机的语音信息,语音控制装置即可通过麦克风接收该语音信息。
优选地,语音控制装置在不使用时通常处于休眠状态,以节省其所配置对象的内存和耗电量。比如,如果语音控制装置集成在电视机上,则控制语音控制装置在不进行语音控制时处于休眠状态,则有助于减少电视机的运行内存的使用率。当语音控制装置接收到语音信息后,则自动被唤醒以对所接收的语音信息进行调整;而当完成语音信息的控制之后,则在闲置预设时间之后自动进入休眠状态。
S102、确定本地词汇库是否存在语音信息对应的语音素材,如果是则执行S103,如果否则执行S104。
语音控制装置接收到语音信息之后,通常需要先判断本地词汇库是否存在该语音信息对应的语音素材,然后根据判断结果确定使用哪个词汇库进行语音识别,并根据语音识别结果进行语音控制。
S103、基于本地词汇库识别语音信息以生成控制指令。
如果本地词汇库包含该语音信息所对应的语音素材,则基于本地词汇库对该语音信息进行识别,并根据识别结果生成控制指令。基于本地词汇库识别语音信息具有较高的语音识别速度,而且不会占用网络资源。
S104、在线通过云词汇库识别语音信息以生成控制指令,以及基于云词汇库对本地词汇库进行更新。
如果本地词汇库不包含该语音信息所对应的语音素材,则基于云词汇库对该语音信息进行识别,并根据识别结果生成控制指令。在本地词汇库没有某个语音信息对应的语音素材时,通过云词汇库对该语音进行语音识别,相当于通过云词汇库对本地词汇库进行补充语音识别以完成语音识别,进而完成语音控制。
可以理解的是,对于同一用户,其观影偏好以及其语音为普通话还是方言通常比较固定,因此其所使用的用于控制电视机的语音信息也比较固定。基于此,为了提高后期语音信息识别和语音控制的速度,本实施例还基于云词汇库对本地词汇库进行更新,以将该语音信息对应的语音素材添加至本地词汇库,那么后期可以直接基于本地词汇库对该语音信息进行语音识别,无需基于云词汇库对该语音信息进行识别。
其中,本实施例可以在本地词汇库不存在所要识别语音信息的语音素材,而云词汇库存在该语音信息的语音素材并完成该语音信息识别的情况下,基于云词汇库对本地词汇库进行更新,当然,也可以基于预设时间间隔基于云词汇库对本地词汇库进行更新。
对于基于预设时间间隔根据云词汇库对本地词汇库进行更新。可以理解的是,如果词汇库中的语音素材越多,则语音识别的成功率就越大。为了提高语音识别的准确率,进而提高语音控制的准确率,本实施例的语音控制装置还从网络获取包含热门词汇的语音素材,并将所获取的语音素材添加至云词汇库,以及将本地词汇库的语音素材添加至云词汇库。然后控制云词汇库基于预设分类对其中的语音素材进行分类,并将分类后的语音素材发送至本地词汇库以更新本地词汇库,从而使本地词汇库的语音素材可以紧跟时代潮流。
其中,预设分类至少包括方言分类和娱乐分类中的一种,其中娱乐分类包括电视剧、综艺、美食和体育。
可以理解的是,随着电视剧节目、电影、综艺节目和网络热词汇等的不断涌现,如果云词汇库没有及时获取相关的语音素材,则可能出现基于云词汇库也无法识别语音信息的情形,此时语音控制装置优选输出手动遥控信息,以提示用户通过遥控器手动遥控电视机。在手动遥控完电视机之后,语音控制装置优选将该语音信息以及用户手动遥控电视机的操作所对应的控制指令异步缓存至本地词汇库,以增加本地词汇库的语音素材。从而可以大大提高基于本地词汇库完成语音信息识别和语音控制的概率和准确率。
为了提高语音识别的准确率,进而提高语音控制的准确率,本实施例还基根据本地词汇库和云词汇库的语音素材,基于深度学习建立语音信息和控制指令之间的对应关系,从而提高语音信息识别和语音控制的准确率。
S105、控制电视机执行控制指令已完成语音控制。
基于语音信息确定了控制指令之后,则控制电视机执行该控制指令,从而完成语音控制电视机的操作。
本发明实施例提供的电视机语音控制方法的技术方案,包括获取用于控制电视机的语音信息;确定本地词汇库是否存在语音信息对应的语音素材;如果是,则基于本地词汇库识别语音信息以生成控制指令,具有较高的语音识别速度,从而具有较高的语音控制速度;如果否,则在线通过云词汇库识别语音信息以生成控制指令,以及基于云词汇库对本地词汇库进行更新,通过云词汇库进行补充语音识别,有助于提高语音识别的准确率,进而提高语音控制的准确率,通过云词汇库对本地词汇库进行更新可以丰富本地词汇库的语音素材;控制电视机执行控制指令已完成语音控制以完成语音控制。
实施例二
图2是本发明实施例二提供的电视机语音控制装置的结构框图。该装置用于执行上述任意实施例所提供的电视机语音控制方法,该控制装置可选为软件或硬件实现。该装置包括:
获取模块11,用于获取用于控制电视机的语音信息;
语音素材确定模块12,用于确定本地词汇库是否存在语音信息对应的语音素材;
本地识别模块13,用于在本地词汇库存在语音信息对应的语音素材时,基于本地词汇库识别语音信息以生成控制指令;
在线识别模块14,用于在本地词汇库不存在语音信息对应的语音素材时,在线通过云词汇库识别语音信息以生成控制指令,以及基于云词汇库对本地词汇库进行更新;
控制模块15,用于控制电视机执行控制指令已完成语音控制。
如图3所示,该装置还包括提示模块16,该提示模块用于在线云服务器不存在语音信息对应的语音素材时输出手动遥控信息,以使用户手动遥控电视机;同时将语音信息以及用户手动遥控电视机的操作所对应的控制指令异步缓存至本地词汇库。
该装置还包括更新模块17,该更新模块用于从网络获取包含热门词汇的语音素材并将语音素材添加至云词汇库;以及将本地词汇库的语音素材定期同步至云词汇库,以使云词汇库将当前的词汇基于预设分类发送至本地词汇库以更新本地词汇库。
本发明实施例提供的电视机语音控制装置的技术方案,通过获取模块获取用于控制电视机的语音信息;通过语音素材确定模块确定本地词汇库是否存在语音信息对应的语音素材;在本地词汇库存在语音信息对应的语音素材时,通过本地识别模块基于本地词汇库识别语音信息以生成控制指令,具有较高的语音识别速度,从而具有较高的语音控制速度;在本地词汇库不存在语音信息对应的语音素材时,通过在线识别模块在线基于云词汇库识别语音信息以生成控制指令,以及基于云词汇库对所述本地词汇库进行更新,通过云词汇库进行补充语音识别,有助于提高语音识别的准确率,进而提高语音控制的准确率,通过云词汇库对本地词汇库进行更新可以丰富本地词汇库的语音素材;通过控制模块控制电视机执行控制指令已完成语音控制以完成语音控制。
本发明实施例所提供的电视机语音控制装置可执行本发明任意实施例所提供的电视机语音控制方法,具备执行方法相应的功能模块和有益效果。
实施例三
图4为本发明实施例提供的设备的结构示意图,如图4所示,该设备包括处理器201、存储器202、输入装置203以及输出装置204;设备中处理器201的数量可以是一个或多个,图4中以一个处理器201为例;设备中的处理器201、存储器202、输入装置203以及输出装置204可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器202作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的电视机语音控制方法对应的程序指令/模块(例如,获取模块11、语音素材确定模块12、本地识别模块13、在线识别模块14以及控制模块15)。处理器201通过运行存储在存储器202中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的电视机语音控制方法。
存储器202可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器202可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器202可进一步包括相对于处理器201远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置203可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。
输出装置204可包括显示屏等显示设备,例如,用户终端的显示屏。
实施例四
本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种电视机语音控制方法,该方法包括:
获取用于控制电视机的语音信息;
确定本地词汇库是否存在所述语音信息对应的语音素材;
如果是,则基于本地词汇库识别所述语音信息以生成控制指令;
如果否,则在线通过云词汇库识别所述语音信息以生成控制指令,以及基于所述云词汇库对所述本地词汇库进行更新;
控制电视机执行所述控制指令。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的电视机语音控制方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(RandomAccess Memory,简称RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的电视机语音控制方法。
值得注意的是,上述电视机语音控制装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (5)
1.一种电视机语音控制方法,其特征在于,包括:
获取用于控制电视机的语音信息;
确定本地词汇库是否存在所述语音信息对应的语音素材;
如果是,则基于本地词汇库识别所述语音信息以生成控制指令;
如果否,则在线通过云词汇库识别所述语音信息以生成控制指令,以及基于所述云词汇库对所述本地词汇库进行更新;
控制电视机执行所述控制指令;
所述如果否,则在线通过云词汇库识别所述语音信息以生成控制指令之后,还包括:
如果在线云词汇库不存在所述语音信息对应的语音素材,则输出手动遥控信息,以使用户手动遥控电视机;
将所述语音信息以及用户手动遥控电视机的操作所对应的控制指令异步缓存至本地词汇库;
基于预设时间间隔,从网络获取包含热门词汇的语音素材并将所述语音素材添加至云词汇库,并将本地词汇库的语音素材定期同步至云词汇库,以使所述云词汇库将当前语音素材基于预设分类发送至本地词汇库以更新本地词汇库;
根据本地词汇库和云词汇库中的语音素材,基于深度学习建立语音信息与控制指令之间的对应关系;
语音控制装置在不使用时处于休眠状态,当接收到语音信息后,则自动被唤醒以对所接收的语音信息进行调整;而当完成语音信息的控制之后,则在闲置预设时间之后自动进入休眠状态。
2.根据权利要求1所述的方法,其特征在于,所述预设分类至少包括方言分类和娱乐类型分类中的一种,其中娱乐类型分类包括电视剧、综艺、美食和体育。
3.一种电视机语音控制装置,其特征在于,包括:
获取模块,用于获取用于控制电视机的语音信息;
语音素材确定模块,用于确定本地词汇库是否存在所述语音信息对应的语音素材;
本地识别模块,用于在本地词汇库存在所述语音信息对应的语音素材时,基于本地词汇库识别所述语音信息以生成控制指令;
在线识别模块,用于在本地词汇库不存在所述语音信息对应的语音素材时,在线通过云词汇库识别所述语音信息以生成控制指令,以及基于所述云词汇库对所述本地词汇库进行更新;
控制模块,用于控制电视机执行所述控制指令;
提示模块,用于在线云服务器不存在所述语音信息对应的语音素材时输出手动遥控信息,以使用户手动遥控电视机;同时将所述语音信息以及用户手动遥控电视机的操作所对应的控制指令异步缓存至本地词汇库;
更新模块,用于基于预设时间间隔从网络获取包含热门词汇的语音素材并将所述语音素材添加至云词汇库,并将本地词汇库的语音素材定期同步至云词汇库,以使所述云词汇库将当前语音素材基于预设分类发送至本地词汇库以更新本地词汇库;
根据本地词汇库和云词汇库中的语音素材,基于深度学习建立语音信息与控制指令之间的对应关系;
语音控制装置在不使用时处于休眠状态,当接收到语音信息后,则自动被唤醒以对所接收的语音信息进行调整;而当完成语音信息的控制之后,则在闲置预设时间之后自动进入休眠状态。
4.一种电子设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-2中任一所述的电视机语音控制方法。
5.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-2中任一所述的电视机语音控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910464835.5A CN110099295B (zh) | 2019-05-30 | 2019-05-30 | 电视机语音控制方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910464835.5A CN110099295B (zh) | 2019-05-30 | 2019-05-30 | 电视机语音控制方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110099295A CN110099295A (zh) | 2019-08-06 |
CN110099295B true CN110099295B (zh) | 2022-04-12 |
Family
ID=67449642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910464835.5A Active CN110099295B (zh) | 2019-05-30 | 2019-05-30 | 电视机语音控制方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110099295B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110602556A (zh) * | 2019-09-20 | 2019-12-20 | 深圳创维-Rgb电子有限公司 | 播放方法、云端服务器及存储介质 |
CN111327935B (zh) * | 2020-03-02 | 2021-12-24 | 彩迅工业(深圳)有限公司 | 一种基于人工智能电视机的信息交互平台 |
CN111933139A (zh) * | 2020-08-20 | 2020-11-13 | 成都启英泰伦科技有限公司 | 一种离在线语音识别方法及系统 |
CN115240665A (zh) * | 2022-06-22 | 2022-10-25 | 海信视像科技股份有限公司 | 显示设备、控制方法和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050221771A1 (en) * | 2004-04-06 | 2005-10-06 | Nec Corporation | Receiving and sending method of mobile TV phone and mobile TV phone terminal |
CN102945672A (zh) * | 2012-09-29 | 2013-02-27 | 深圳市国华识别科技开发有限公司 | 一种多媒体设备语音控制系统及方法 |
CN204613722U (zh) * | 2015-05-12 | 2015-09-02 | 杭州晟元芯片技术有限公司 | 一种可语音控制的智能云家居生活系统 |
CN109471678A (zh) * | 2018-11-07 | 2019-03-15 | 苏州思必驰信息科技有限公司 | 基于图像识别的语音中控方法及装置 |
-
2019
- 2019-05-30 CN CN201910464835.5A patent/CN110099295B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050221771A1 (en) * | 2004-04-06 | 2005-10-06 | Nec Corporation | Receiving and sending method of mobile TV phone and mobile TV phone terminal |
CN102945672A (zh) * | 2012-09-29 | 2013-02-27 | 深圳市国华识别科技开发有限公司 | 一种多媒体设备语音控制系统及方法 |
CN204613722U (zh) * | 2015-05-12 | 2015-09-02 | 杭州晟元芯片技术有限公司 | 一种可语音控制的智能云家居生活系统 |
CN109471678A (zh) * | 2018-11-07 | 2019-03-15 | 苏州思必驰信息科技有限公司 | 基于图像识别的语音中控方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110099295A (zh) | 2019-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110099295B (zh) | 电视机语音控制方法、装置、设备及存储介质 | |
US9520133B2 (en) | Display apparatus and method for controlling the display apparatus | |
US9940929B2 (en) | Extending the period of voice recognition | |
CN106098063B (zh) | 一种语音控制方法、终端设备和服务器 | |
KR101289081B1 (ko) | 음성 인터페이스를 이용한 iptv 시스템 및 서비스 방법 | |
EP3190512B1 (en) | Display device and operating method therefor | |
CN103491411A (zh) | 基于语言推荐频道的方法及其装置 | |
US20240070171A1 (en) | Systems and methods for predicting where conversations are heading and identifying associated content | |
CN111462744A (zh) | 一种语音交互方法、装置、电子设备及存储介质 | |
CN109325180B (zh) | 文章摘要推送方法、装置、终端设备、服务器及存储介质 | |
US9832526B2 (en) | Smart playback method for TV programs and associated control device | |
US11942089B2 (en) | Electronic apparatus for recognizing voice and method of controlling the same | |
CN110782886A (zh) | 语音处理的系统、方法、电视、设备和介质 | |
CN115762497A (zh) | 语音识别方法、装置、人机交互设备和存储介质 | |
KR20210065308A (ko) | 전자장치 및 그 제어방법 | |
JP7617971B2 (ja) | 言語データ処理システム、言語データ処理方法、及びコンピュータープログラム | |
CN115174825B (zh) | 一种配音方法、装置、电子设备以及存储介质 | |
US20240177214A1 (en) | Computing device and operating method thereof | |
CN113703621B (zh) | 语音交互方法、存储介质及设备 | |
US20220406308A1 (en) | Electronic apparatus and method of controlling the same | |
CN119357327A (zh) | 人名识别方法、装置、设备及计算机介质 | |
CN116680421A (zh) | 一种搜索方法、装置和电子设备 | |
CN119473016A (zh) | 人机对话方法和装置 | |
CN116386627A (zh) | 显示设备及热词识别方法 | |
CN116600171A (zh) | 一种设备控制方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |