CN102855872B - 基于终端及互联网语音交互的家电控制方法及系统 - Google Patents
基于终端及互联网语音交互的家电控制方法及系统 Download PDFInfo
- Publication number
- CN102855872B CN102855872B CN201210329698.2A CN201210329698A CN102855872B CN 102855872 B CN102855872 B CN 102855872B CN 201210329698 A CN201210329698 A CN 201210329698A CN 102855872 B CN102855872 B CN 102855872B
- Authority
- CN
- China
- Prior art keywords
- speech recognition
- voice
- recognition conversion
- terminal
- described terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000006243 chemical reaction Methods 0.000 claims abstract description 207
- 238000003032 molecular docking Methods 0.000 claims abstract description 8
- 238000004891 communication Methods 0.000 claims description 65
- 230000002452 interceptive effect Effects 0.000 claims description 37
- 230000009466 transformation Effects 0.000 claims description 15
- 239000000284 extract Substances 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 239000013589 supplement Substances 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 description 10
- 238000004378 air conditioning Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000005034 decoration Methods 0.000 description 3
- 230000002618 waking effect Effects 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001502 supplementing effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明涉及一种基于终端及互联网语音交互的家电控制方法及系统,所述终端及所述网络服务器并行对接收的语音进行识别转换,该语音识别转换结果为指令或指令和参数的形式,由所述网络服务器、所述终端、待控制家电共同执行该语音识别转换结果或者由其中任意两个执行该语音识别转换结果或者由待控制家电和所述终端任意一个执行该语音识别转换结果。本发明一种基于终端及互联网语音交互的家电控制方法及系统,利用互联网络实现了终端与所述网络服务器并行对输入的语音进行识别转换,提高了语音识别转换的速度,同时,所述网络服务器执行语音识别转换结果,大大提高了网络服务器执行语音识别结果的能力,包括采用在网络服务器设置大量的服务内容,丰富了语音指令的内容,使家电控制更加智能。
Description
技术领域
本发明涉及一种家电控制方法及系统,尤其涉及一种基于终端及互联网语音交互的家电控制方法及系统。
背景技术
随着社会的发展,电子技术也发展得越来越快。语音识别技术对于现有电器来说,是一项革命性技术,由于其不需要手动操作,只需要发出语音指令,便可控制电器。现有技术中,越来越多的家用电器采用语音进行控制,但通常将语音识别模块集成在家用电器上。由于现有技术中家用电器的处理能力较弱,只是对语音进行简单机械地识别,更不存在语音交互控制以及大量的语音控制服务内容了。而语音识别强的识别模块需要更强劲的处理器进行处理,同时,还需要占用较大的内存,因此,这些都大大限制了现有家用电器的语音控制。
随着网络的发展,特别是云技术的发展,语音识别也有了全新的发展。中国专利(申请号:201110388896.1)专利公开通过云服务器进行语音识别,但该技术方案采用分步式语音识别,同时客户端对云服务器的语音识别结果进行打分,根据打分结果同步到各个客户端。该技术方案存在以下缺陷:1、分步式识别会影响处理速度;2、仅针对语音进行识别,不能进行指令转化,更不能进行电器控制,3、服务器将语音识别结果发送到客户端,不对语音识别结果进行执行处理,大大影响了智能语音的使用范围。另外,现有技术语音识别大多只能对标准语音进行语音指令转换,对于自然语言的语音则不能准确地进行识别转换。
发明内容
本发明解决的技术问题是:构建一种基于终端及互联网语音交互的家电控制方法及系统,克服现有技术语音识别速度慢、不能利用网络语音控制家电、语音识别分步进行影响语音识别效果以及不能利用网络服务器执行语音识别结果的技术问题。
本发明的技术方案是:构建一种基于终端及互联网语音交互的家电控制方法,包括具有语音输入和语音识别转换的终端、具有语音识别转换的网络服务器,所述待控制家电控制方法包括如下步骤:
输入语音:通过所述终端输入语音;
上传语音:将所述终端连接互联网,所述终端将接收的语音信息通过互联网上传到所述网络服务器;
语音识别转换:所述终端及所述网络服务器并行对接收的语音进行识别转换,该语音识别转换结果为指令或指令和参数的形式;
执行识别转换结果:由所述网络服务器、所述终端、待控制家电共同执行该语音识别转换结果或者由其中任意两个执行该语音识别转换结果或者由待控制家电和所述终端任意一个执行该语音识别转换结果。
本发明的进一步技术方案是:还包括根据识别场景构建语义知识库,所述语义知识库包括字词的语义属性,在语音识别转换步骤中,还包括语义识别转换具体包括如下步骤:
分词及语义消歧:根据知识库字词的语义属性对语音识别结果进行分词并进行语义消歧;
意图分类及参数提取:对分词及语义消歧的结果进行意图分类,并进行参数提取。
本发明的进一步技术方案是:所述网络服务器和所述终端的语音识别转换结果均包括语音识别转换的置信度,所述终端设置语音识别转换结果的置信度阈值,当所述终端语音识别转换结果的置信度大于等于该置信度阈值时,取该语音识别转换结果,若所述终端语音识别转换结果的置信度小于该置信度阈值时,取所述网络服务器语音识别转换结果的置信度和所述终端语音识别转换结果的置信度中较大值的语音识别转换结果。
本发明的进一步技术方案是:在输入不能识别语音信息或不能执行的语音信息时,通过所述终端进行语音交互补充输入语音信息,以获取能执行的语音信息。
本发明的进一步技术方案是:还包括采集家电运行参数,然后将采集的信息根据接收的语音指令发送到所述终端,由所述终端输出或传送到家电由家电输出。
本发明的进一步技术方案是:待控制家电与所述终端通过红外通讯组件、高频调制通讯组件、蓝牙通讯组件、2.4G无线通讯组件、RFID射频通讯组件中任一种进行通讯连接。
本发明的进一步技术方案是:所述红外信号为向多个方向发射的红外信号,使所述终端通过多个方向与多个待控制家电进行通信。
本发明的进一步技术方案是:在不使用移动通讯终端输入的语音信息时,通过待控制家电输入语音,待控制家电对该语音信息进行识别转换,待控制家电执行该语音识别转换结果。
本发明的技术方案是:构建一种基于终端及互联网语音交互的家电控制系统,包括网络服务器和连接互联网并具有语音输入的终端,所述终端包括连接互联网的网络连接模块、输入语音的语音输入模块、进行无线通讯的第一无线信号通讯模块、进行语音识别转换的第一语音识别转换单元,所述网络服务器包括进行语音识别转换的第二语音识别转换单元,待控制家电包括进行无线通讯的第二无线信号通讯模块,所述终端的语音输入模块输入语音,所述终端通过互联网将所述语音信息传送到所述网络服务器,所述网络服务器的第二语音识别转换单元和所述终端的第一语音识别转换单元并行识别转换所述语音信息;由所述网络服务器、所述终端、待控制家电共同执行该语音识别转换结果或者由其中任意两个执行该语音识别转换结果或者由待控制家电和所述终端任意一个执行该语音识别转换结果。
本发明的进一步技术方案是:所述网络服务器和所述终端的语音识别转换结果均包括语音识别转换的置信度,所述终端设置语音识别转换结果的置信度阈值,当所述终端语音识别转换结果的置信度大于等于该置信度阈值时,取该语音识别转换结果,若所述终端语音识别转换结果的置信度小于该置信度阈值时,取所述网络服务器语音识别转换结果的置信度和所述终端语音识别转换结果的置信度中较大值的语音识别转换结果
本发明的进一步技术方案是:所述第二语音识别转换单元包括进行语音识别的语音识别模块和进行语义识别的语义识别模块,所述语义识别模块根据所述语音识别模块识别的语音再进行语义分析判断。
本发明的进一步技术方案是:所述终端还包括唤醒所述终端进入输入语音的状态的唤醒模块,所述唤醒模块包括语音指令、按键或无线信号中的任一种方式。
本发明的进一步技术方案是:所述终端为移动通讯终端、机顶盒或电脑中任一种,所述移动通讯终端包括手机、IPAD。
本发明的进一步技术方案是:所述终端的第一无线通讯模块为红外通讯组件、高频调制通讯组件、蓝牙通讯组件、2.4G无线通讯组件、RFID射频通讯组件中任一种或多种,待控制家电上的第二无线通讯模块为配合所述第一无线通讯模块的红外通讯组件、高频调制通讯组件、蓝牙通讯组件、2.4G无线通讯组件、RFID射频通讯组件中任一种或多种。
本发明的进一步技术方案是:待控制家电还包括进行语音识别转换的第三语音识别转换单元,在不使用移动通讯终端输入的语音信息时,通过待控制家电输入语音,待控制家电的第三语音识别转换单元对该语音信息进行识别转换,待控制家电执行该语音识别转换结果。
本发明的技术效果是:构建一种基于终端及互联网语音交互的家电控制方法及系统,所述终端及所述网络服务器并行对接收的语音进行识别转换,该语音识别转换结果为指令或指令和参数的形式,由所述网络服务器、所述终端、待控制家电共同执行该语音识别转换结果或者由其中任意两个执行该语音识别转换结果或者由待控制家电和所述终端任意一个执行该语音识别转换结果。本发明一种基于终端及互联网语音交互的家电控制方法及系统,利用互联网络实现了终端与所述网络服务器并行对输入的语音进行识别转换,提高了语音识别转换的速度以及语音识别转换的效果,同时,所述网络服务器执行语音识别转换结果,大大提高了网络服务器执行语音识别结果的能力,包括采用在网络服务器设置大量的服务内容,丰富了语音指令的内容,使家电控制更加智能。
附图说明
图1为本发明的流程图。
图2为本发明的结构示意图。
具体实施方式
下面结合具体实施例,对本发明技术方案进一步说明。
如图1所示,本发明的具体实话方式是:构建一种基于终端及互联网语音交互的家电控制方法,包括具有语音输入和语音识别转换的终端1、具有语音识别转换的网络服务器2,所述待控制家电控制方法包括如下步骤:
步骤100:输入语音,即:通过所述终端1输入语音。
步骤200:上传语音,即:将所述终端1连接互联网,所述终端1将接收的语音信息通过互联网上传到所述网络服务器2。
步骤300:语音识别转换,即:所述终端1及所述网络服务器2并行对接收的语音进行识别转换,该语音识别转换结果为指令或指令和参数的形式。
步骤400:执行识别转换结果,即:由所述网络服务器2、所述终端1、待控制家电3共同执行该语音识别转换结果或者由其中任意两个执行该语音识别转换结果或者由待控制家电3和所述终端1任意一个执行该语音识别转换结果。
如图1、图2所示,本发明的具体实施过程如下:由终端1输入语音,终端1将接收的语音上传到所述网络服务器2,所述终端1和所述网络服务器2并行对接收的语音进行识别,将语音识别结果再进行转换,该语音识别转换结果为指令或指令和参数的形式。所述网络服务器2、所述终端1、待控制家电3共同执行该语音识别转换结果,比如:所述网服务器2查询所述语音识别结果中的相应参数,然后由所述移动通讯终端1调用该参数,最后将该语音识别转换结果中的指令和参数传送到所述待控制家电3,由所述待控制家电3执行,这样实现了由所述网络服务器2、所述终端1、待控制家电3共同执行该语音识别转换结果。所述网络服务器2将语音识别转换结果的指令或指令和参数传送到所述终端1,所述终端1与待控制家电3建立无线通讯连接,然后所述终端1将语音识别结果传送到所述待控制家电,由所述待控制家电3执行,这样实现了由所述网络服务器2、待控制家电3共同执行该语音识别转换结果。所述网络服务器2根据语音识别转换结果的指令或指令和参数调用或查询相关信息,然后发送到所述终端1,由终端1执行,则实现了由所述网络服务器2、所述终端1共同执行该语音识别转换结果。所述网络服务器2将语音识别转换结果的指令或指令和参数传送到所述终端1,所述终端1根据语音识别转换结果的指令或指令和参数调用或查询相关信息,然后发送到待控制家电3,由所述待控制家电3执行,这样实现了由所述终端1、待控制家电3共同执行该语音识别转换结果。所述网络服务器2将语音识别转换结果的指令或指令和参数传送到所述终端1,所述终端1根据语音识别转换结果的指令或指令和参数调用或查询相关信息,然后所述终端1执行,这样实现了由所述终端1执行该语音识别转换结果。比如:由终端1播放在终端1上找到的信息,即由所述终端1执行该语音识别转换结果。若语音识别转换结果包括控制家电3的控制指令,所述待控制家电2上存储该控制指令及与语音指令相配合的内容,则所述终端1将语音识别结果传送到所述待控制家电3,由所述待控制家电3执行该指令及调用指令的内容。具体实施例中,所述网络服务器2和所述终端1的语音识别转换结果均包括语音识别转换的置信度。所谓置信度,也叫置信水平,它是指特定个体对待特定命题真实性相信的程度,也就是概率是对个人信念合理性的量度。概率的置信度解释表明,事件本身并没有什么概率,事件之所以指派有概率只是指派概率的人头脑中所具有的信念证据。置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。语音识别转换结果的置信度即对语音识别转换结果真实性的相信程度。所述终端1设置语音识别转换结果的置信度阈值,当所述终端1语音识别转换结果的置信度大于等于该置信度阈值时,取该语音识别转换结果,若所述终端1语音识别转换结果的置信度小于该置信度阈值时,取所述网络服务器2语音识别转换结果的置信度和所述终端1语音识别转换结果的置信度中较大值的语音识别转换结果。
若网络服务器2上存储与语音指令相应的内容或相应交互信息,所述网络服务器2根据语音转换结果调用该与语音指令相应的内容或相应交互信息,通过所述终端1传送到所述待控制家电,由家电执行该执行结果。若所述终端1存储与语音指令相应的内容或相应交互信息,则由所述网络服务器2将语音识别转换结果传送到所述终端1,由所述终端1执行该语音识别转换结果,即调用该与语音指令相应的内容或相应交互信息,然后传送到所述待控制家电,所家电执行该执行结果。所述语音识别转换结果为指令或指令和参数,执行该指令或指令和参数,对于控制家电的指令及内容,比如“打开空调到27度”,则“打开空调”为指令,“27度”为内容作为参数。具体实施例中,所述内容包括音频内容、文字内容中的一种或多种。本发明的具体实施例中,还包括进行唤醒所述终端1进入接收输入语音状态的唤醒步骤,所述唤醒步骤中,通过输入语音指令或按按键实现唤醒。
具体实施例中,所述终端1为移动通讯终端、机顶盒或电脑中任一种,所述移动通讯终端包括手机、IPAD,待控制家电包括电视、冰箱、空调、灯饰、电饭煲、音响。所述终端1和所述网络服务器2均设置交互语音信息库,在输入不能识别语音信息或不能执行的语音信息时,通过所述终端进行语音交互补充输入语音信息,以获取所述网络服务器2或所述终端1能执行的语音信息。若语音识别转换结果包括交互信息,则调用交互语音信息库中相应的交互信息并由所述终端1传送到所述待控制家电,由家电播放该交互信息实现语音交互。的交互信息,比如,要通过交互语音“有没有王菲的歌”,则所述网络服务器2通过查询,得到查询结果为“有”或“无”,该查询结果“有”或“无”则为相应的交互信息。另外,在输入不能识别语音信息或不能执行的语音信息时,通过所述终端1输入语音与终端1或所述网络服务器2交互语音信息库的交互语音信息进行语音交互,以获取所述网络服务器2或终端1或者家电3能执行的语音信息。比如,在输入“开机”语音信息时,若可能由于语音不清楚或者与标准语音差别过大,导致不能识别时,可以调用交互语音信息库进行提示再输入语音。再比如,在输入“现在打开故事吧”,此时,可能网络服务器不能将该语音指令转换为控制指令,此时,需要补充输入语音信息,比如,调用交互信息库“您是想听故事吗?”这样语音交互提示,完成语音指令信息的补充,实现以自然语音即可控制家电。待控制家电2包括电视、冰箱、空调、灯饰、电饭煲、音响、电动窗帘、电扇。
如图1所示,本发明的优选实施方式是:还包括根据识别场景构建语义知识库,所述语义知识库包括字词的语义属性。构建语义知识库为语义识别的基本条件,对一些字词构建其知识库,定义其语义属性。比如:“刘德华”,其知识库包括:男、香港人、歌手、演员,其语义属性为“娱乐人物”。“下雨”,则为一种天气情况,天气预报,其语义属性为“天气”。在语音转换步骤中,还包括根据语音转换结果进行语义转换。具体包括:
步骤10:分词及语义消歧,即:根据知识库字词的语义属性对语音识别结果进行分词并进行语义消歧。具体过程如下:根据字词在知识库中的语义属性,对语音识别结果进行分词或消除歧义,比如:语音识别结果为“明天北京会下雨吗?”根据知识库字词的语义属性分词为“明天”、“北京”、“会”、“下雨”、“吗”, “明天”为时间属性,“北京”为地点属性,“会”为动词,“下雨”为天气属性,“吗”为提问。在某些情况下,需要消除歧义,比如“刘德华的歌”,可能识别为“浏得滑”,但经过知识库对“刘德华”的定义,分析判断为“刘德华”。这属于根据知识库字词的语义属性消除歧义。
步骤20:意图分类及参数提取,即:对分词及语义消歧的结果进行意图分类,并进行参数提取。比如:语音识别结果为“明天北京会下雨吗?”根据分词及语义消歧的结果进行意图分类,其意图类为“查询天气”,提取参数为:地点是北京,时间是明天。这样对“明天北京会下雨吗?”进行了语义转换。
具体过程如下:比如,输入语音为“今天天气好吗?”,首先,进行语音识别,输出识别结果为“今天天气好吗?”然后根据语音识别结果,进行语义判断,根据语义判断为:播出今天该地的天气情况。再比如:语音输入为:“我想听王菲的音乐”,最终语义识别分析得到用户的意图为“播放歌曲”,参数是“王菲”,然后根据分析结果,调用歌曲播放功能并直接播放王菲的歌曲。因为采用有语义识别,用户并不需要记住固定的语音控制命令,而是可以采用用户自己最习惯的语言表达来与家电互动。所以对上一条意图,用户也可以说“请帮我找王菲的歌”、“有没有王菲最新的专辑?”、“王菲的执迷不悟”,也就是说,用户可自由表达自己的命令和意图,移动终端上强大的语音识别和语义理解引擎,都可以非常好的识别出用户的真正意图:播放王菲的歌曲,或播放王菲的某一首歌曲。如此,让智能家电和用户的交互更佳自由、有趣,而且也没有增加原来家电终端的直接硬件成本,让家电厂商可以用比较低的成本,却实现了高性能的人机交互效果。
如图2所示,本发明的具体实施方式是:待控制家电3还包括进行语音识别转换的第三语音识别转换单元32,在不使用移动通讯终端输入的语音信息时,通过待控制家电3输入语音,待控制家电3的第三语音识别转换单元32对该语音信息进行识别转换,待控制家电3执行该语音识别转换结果。
如图1所示,本发明的优选实施方式是:还包括采集家电运行参数,然后将采集的信息根据接收的语音指令发送到所述终端,由所述终端输出或者发送到所述待控制家电,由家电输出,其输出方式包括播放音频信号、显示中任一种。
如图2所示,本发明的具体实施方式是:构建一种基于终端及互联网语音交互的家电控制系统,包括连接互联网并具有语音输入的终端1和网络服务器2,所述终端1包括连接互联的网络连接模块11、输入语音的语音输入模块12、进行无线通讯的第一无线信号通讯模块14、进行语音识别转换的第一语音识别转换单元13,所述网络服务器2包括进行语音识别转换的第二语音识别转换单元21,待控制家电3包括进行无线通讯的第二无线信号通讯模块31,所述终端1的语音输入模块12输入语音,所述终端1通过互联网将所述语音信息传送到所述网络服务器2,所述网络服务器2的第二语音识别转换单元21和所述终端1的第一语音识别转换单元13并行识别转换所述语音信息;由所述网络服务器2、所述终端1、待控制家电3共同执行该语音识别转换结果或者由其中任意两个执行该语音识别转换结果或者由待控制家电3和所述终端1任意一个执行该语音识别转换结果。
如图1、图2所示,本发明的具体实施过程如下:由终端1输入语音,终端1将接收的语音上传到所述网络服务器2,所述终端1和所述网络服务器2并行对接收的语音进行识别,将语音识别结果再进行转换,该语音识别转换结果为指令或指令和参数的形式。所述网络服务器2、所述终端1、待控制家电3共同执行该语音识别转换结果,比如:所述网服务器2查询所述语音识别结果中的相应参数,然后由所述移动通讯终端1调用该参数,最后将该语音识别转换结果中的指令和参数传送到所述待控制家电3,由所述待控制家电3执行,这样实现了由所述网络服务器2、所述终端1、待控制家电3共同执行该语音识别转换结果。所述网络服务器2将语音识别转换结果的指令或指令和参数传送到所述终端1,所述终端1与待控制家电建立无线通讯连接,然后所述终端1将语音识别结果传送到所述待控制家电,由所述待控制家电3执行,这样实现了由所述网络服务器2、待控制家电3共同执行该语音识别转换结果。所述网络服务器2根据语音识别转换结果的指令或指令和参数调用或查询相关信息,然后发送到所述终端1,由终端1执行,则实现了由所述网络服务器2、所述终端1共同执行该语音识别转换结果。所述网络服务器2将语音识别转换结果的指令或指令和参数传送到所述终端1,所述终端1根据语音识别转换结果的指令或指令和参数调用或查询相关信息,然后发送到待控制家电3,由所述待控制家电3执行,这样实现了由所述终端1、待控制家电3共同执行该语音识别转换结果。所述网络服务器2将语音识别转换结果的指令或指令和参数传送到所述终端1,所述终端1根据语音识别转换结果的指令或指令和参数调用或查询相关信息,然后所述终端1执行,这样实现了由所述终端1执行该语音识别转换结果。比如:由终端1播放在终端1上找到的信息,即由所述终端1执行该语音识别转换结果。若语音识别转换结果包括控制家电的控制指令,所述待控制家电2上存储该控制指令及与语音指令相配合的内容,则所述终端1将语音识别结果传送到所述待控制家电,由所述待控制家电执行该指令及调用指令的内容。具体实施例中,所述网络服务器2和所述终端1的语音识别转换结果均包括语音识别转换的置信度。所谓置信度,也叫置信水平,它是指特定个体对待特定命题真实性相信的程度,也就是概率是对个人信念合理性的量度。概率的置信度解释表明,事件本身并没有什么概率,事件之所以指派有概率只是指派概率的人头脑中所具有的信念证据。置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。语音识别转换结果的置信度即对语音识别转换结果真实性的相信程度。所述终端设置语音识别转换结果的置信度阈值,当所述终端1语音识别转换结果的置信度大于等于该置信度阈值时,取该语音识别转换结果,若所述终端1语音识别转换结果的置信度小于该置信度阈值时,取所述网络服务器2语音识别转换结果的置信度和所述终端1语音识别转换结果的置信度中较大值的语音识别转换结果。
若网络服务器2上存储与语音指令相应的内容或相应交互信息,所述网络服务器2根据语音转换结果调用该与语音指令相应的内容或相应交互信息,通过所述终端1传送到所述待控制家电,由家电执行该执行结果。若所述终端1存储与语音指令相应的内容或相应交互信息,则由所述网络服务器2将语音识别转换结果传送到所述终端1,由所述终端1执行该语音识别转换结果,即调用该与语音指令相应的内容或相应交互信息,然后传送到所述待控制家电,所家电执行该执行结果。所述语音识别转换结果为指令或指令和参数,执行该指令或指令和参数,对于控制家电的指令及内容,比如“打开空调到27度”,则“打开空调”为指令,“27度”为内容作为参数。具体实施例中,所述内容包括音频内容、文字内容中的一种或多种。本发明的具体实施例中,所述终端还包括唤醒所述终端进入输入语音的状态的唤醒模块,所述唤醒模块包括语音指令、按键或无线信号中的任一种方式,通过输入语音指令或按按键实现唤醒。
具体实施例中,所述终端1为移动通讯终端、机顶盒或电脑中任一种,所述移动通讯终端包括手机、IPAD。所述终端1和所述网络服务器2均设置交互语音信息库,在输入不能识别语音信息或不能执行的语音信息时,通过所述终端1进行语音交互补充输入语音信息,以获取所述网络服务器2或所述终端1能执行的语音信息。若语音识别结果包括交互信息,则调用交互语音信息库中相应的交互信息并由所述终端1传送到所述待控制家电,由家电播放该交互信息实现语音交互。的交互信息,比如,要通过交互语音“有没有王菲的歌”,则所述网络服务器2通过查询,得到查询结果为“有”或“无”,该查询结果“有”或“无”则为相应的交互信息。另外,在输入不能识别语音信息或不能执行的语音信息时,通过所述终端1输入语音与终端1或所述网络服务器2交互语音信息库的交互语音信息进行语音交互,以获取所述网络服务器2或终端1或者家电能执行的语音信息。比如,在输入“开机”语音信息时,若可能由于语音不清楚或者与标准语音差别过大,导致不能识别时,可以调用交互语音信息库进行提示再输入语音。再比如,在输入“现在打开故事吧”,此时,可能网络服务器不能将该语音指令转换为控制指令,此时,需要补充输入语音信息,比如,调用交互信息库“您是想听故事吗?”这样语音交互提示,完成语音指令信息的补充,实现以自然语音即可控制家电,待控制家电3包括电视、冰箱、空调、灯饰、电饭煲、音响、电动窗帘、电扇。
如图2所示,本发明的优选实施方式是:所述第二语音识别转换单元21包括进行语音识别的语音识别模块211和进行语义识别的语义识别模块212,所述语义识别模块212根据所述语音识别模块211识别的语音再进行语义分析判断。所述语义识别模块212具体工作过程如下:构建语义知识库,即:根据识别场景构建语义知识库,所述语义知识库包括字词的语义属性。构建语义知识库为语义识别的基本条件,对一些字词构建其知识库,定义其语义属性。比如:“刘德华”,其知识库包括:男、香港人、歌手、演员,其语义属性为“娱乐人物”。“下雨”,则为一种天气情况,天气预报,其语义属性为“天气”。分词及语义消歧,即:根据知识库字词的语义属性对语音识别结果进行分词并进行语义消歧。具体过程如下:根据字词在知识库中的语义属性,对语音识别结果进行分词或消除歧义,比如:语音识别结果为“明天北京会下雨吗?”根据知识库字词的语义属性分词为“明天”、“北京”、“会”、“下雨”、“吗”, “明天”为时间属性,“北京”为地点属性,“会”为动词,“下雨”为天气属性,“吗”为提问。在某些情况下,需要消除歧义,比如“刘德华的歌”,可能识别为“浏得滑”,但经过知识库对“刘德华”的定义,分析判断为“刘德华”。这属于根据知识库字词的语义属性消除歧义。意图分类及参数提取,即:对分词及语义消歧的结果进行意图分类,并进行参数提取。比如:语音识别结果为“明天北京会下雨吗?”根据分词及语义消歧的结果进行意图分类,其意图类为“查询天气”,提取参数为:地点是北京,时间是明天。这样对“明天北京会下雨吗?”进行了语义转换。
具体过程如下:比如,输入语音为“今天天气好吗?”,首先,进行语音识别,输出识别结果为“今天天气好吗?”然后根据语音识别结果,进行语义判断,根据语义判断为:播出今天该地的天气情况。再比如:语音输入为:“我想听王菲的音乐”,最终语义识别分析得到用户的意图为“播放歌曲”,参数是“王菲”,然后根据分析结果,调用歌曲播放功能并直接播放王菲的歌曲。因为采用有语义识别,用户并不需要记住固定的语音控制命令,而是可以采用用户自己最习惯的语言表达来与家电互动。所以对上一条意图,用户也可以说“请帮我找王菲的歌”、“有没有王菲最新的专辑?”、“王菲的执迷不悟”,也就是说,用户可自由表达自己的命令和意图,移动终端上强大的语音识别和语义理解引擎,都可以非常好的识别出用户的真正意图:播放王菲的歌曲,或播放王菲的某一首歌曲。如此,让智能家电和用户的交互更佳自由、有趣,而且也没有增加原来家电终端的直接硬件成本,让家电厂商可以用比较低的成本,却实现了高性能的人机交互效果。
如图2所示,本发明的优选实施方式是:还包括采集家电运行参数,然后将采集的信息根据接收的语音指令发送到所述终端1,由所述终端1输出或者发送到所述待控制家电3,由待控制家电3输出,其输出方式包括播放音频信号、显示中任一种。
如图2所示,本发明的具体实施方式是:待控制家电3还包括进行语音识别转换的第三语音识别转换单元32,在不使用移动通讯终端输入的语音信息时,通过待控制家电3输入语音,待控制家电3的第三语音识别转换单元32对该语音信息进行识别转换,待控制家电3执行该语音识别转换结果。
本发明的进一步技术方案是:所述终端1的第一无线信号通讯模块14第一无线通讯模块为红外通讯组件、高频调制通讯组件、蓝牙通讯组件、2.4G无线通讯组件、RFID射频通讯组件中任一种或多种,所述待控制家电3上的第二无线信号通讯模块31为为配合所述第一无线通讯模块14的红外通讯组件、高频调制通讯组件、蓝牙通讯组件、2.4G无线通讯组件、RFID射频通讯组件中任一种或多种。
本发明的技术效果是:构建一种基于终端1及互联网语音交互的家电控制方法及系统,所述终端1及所述网络服务器2并行对接收的语音进行识别转换,该语音识别转换结果为指令或指令和参数的形式,由所述网络服务器2、所述终端1、待控制家电3共同执行该语音识别转换结果或者由其中任意两个执行该语音识别转换结果或者由待控制家电3和所述终端1任意一个执行该语音识别转换结果。本发明一种基于终端及互联网语音交互的家电控制方法及系统,利用互联网络实现了终端1与所述网络服务器2并行对输入的语音进行识别转换,提高了语音识别转换的速度,同时,所述网络服务器2执行语音识别转换结果,大大提高了网络服务器2执行语音识别结果的能力,包括采用在网络服务器2设置大量的服务内容,丰富了语音指令的内容,使家电控制更加智能。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (9)
1.一种基于终端及互联网语音交互的家电控制方法,家电控制方法包括如下步骤:
输入语音:通过所述终端输入语音;在不使用终端输入的语音信息时,通过待控制家电输入语音;
上传语音:将所述终端连接互联网,所述终端将接收的语音信息通过互联网上传到网络服务器;
语音识别转换:所述终端及所述网络服务器并行对接收的语音进行识别转换,语音识别转换结果为指令或指令和参数的形式;所述网络服务器和所述终端的语音识别转换结果均包括语音识别转换的置信度,所述终端设置语音识别转换结果的置信度阈值,当所述终端语音识别转换结果的置信度大于等于该置信度阈值时,取该语音识别转换结果,若所述终端语音识别转换结果的置信度小于该置信度阈值时,取所述网络服务器语音识别转换结果的置信度和所述终端语音识别转换结果的置信度中较大值的语音识别转换结果;
执行识别转换结果:由所述网络服务器、所述终端、待控制家电共同执行该语音识别转换结果或者由其中任意两个执行该语音识别转换结果或者由待控制家电和所述终端任意一个执行该语音识别转换结果;若网络服务器上存储与语音指令相应的内容或相应交互信息,所述网络服务器根据语音转换结果调用该与语音指令相应的内容或相应交互信息,通过所述终端传送到所述待控制家电,由家电执行该语音识别转换结果;若所述终端存储与语音指令相应的内容或相应交互信息,则由所述网络服务器将语音识别转换结果传送到所述终端,由所述终端执行该语音识别转换结果,即调用该与语音指令相应的内容或相应交互信息,然后传送到所述待控制家电,所述家电执行该语音识别转换结果。
2.根据权利要求1所述基于终端及互联网语音交互的家电控制方法,其特征在于,还包括根据识别场景构建语义知识库,所述语义知识库包括字词的语义属性,在语音识别转换步骤中,还包括语义识别转换具体包括如下步骤:
分词及语义消歧:根据知识库字词的语义属性对语音识别结果进行分词并进行语义消歧;
意图分类及参数提取:对分词及语义消歧的结果进行意图分类,并进行参数提取。
3.根据权利要求1所述基于终端及互联网语音交互的家电控制方法,其特征在于,在输入不能识别语音信息或不能执行的语音信息时,通过所述终端进行语音交互补充输入语音信息,以获取能执行的语音信息。
4.根据权利要求1所述基于终端及互联网语音交互的家电控制方法,其特征在于,还包括采集家电运行参数,然后将采集的信息根据接收的语音指令发送到所述终端,由所述终端输出或传送到家电由家电输出。
5.一种基于终端及互联网语音交互的家电控制系统,其特征在于,包括网络服务器和连接互联网并具有语音输入的终端,所述终端包括连接互联网的网络连接模块、输入语音的语音输入模块、进行无线通讯的第一无线信号通讯模块、进行语音识别转换的第一语音识别转换单元,所述网络服务器包括进行语音识别转换的第二语音识别转换单元,待控制家电包括进行无线通讯的第二无线信号通讯模块,所述终端的语音输入模块输入语音,在不使用终端输入的语音信息时,通过待控制家电输入语音;所述终端通过互联网将所述语音信息传送到所述网络服务器,所述网络服务器的第二语音识别转换单元和所述终端的第一语音识别转换单元并行识别转换所述语音信息,所述网络服务器和所述终端的语音识别转换结果均包括语音识别转换的置信度,所述终端设置语音识别转换结果的置信度阈值,当所述终端语音识别转换结果的置信度大于等于该置信度阈值时,取该语音识别转换结果,若所述终端语音识别转换结果的置信度小于该置信度阈值时,取所述网络服务器语音识别转换结果的置信度和所述终端语音识别转换结果的置信度中较大值的语音识别转换结果;由所述网络服务器、所述终端、待控制家电共同执行该语音识别转换结果或者由其中任意两个执行该语音识别转换结果或者由待控制家电和所述终端任意一个执行该语音识别转换结果;若网络服务器上存储与语音指令相应的内容或相应交互信息,所述网络服务器根据语音转换结果调用该与语音指令相应的内容或相应交互信息,通过所述终端传送到所述待控制家电,由家电执行该语音识别转换结果;若所述终端存储与语音指令相应的内容或相应交互信息,则由所述网络服务器将语音识别转换结果传送到所述终端,由所述终端执行该语音识别转换结果,即调用该与语音指令相应的内容或相应交互信息,然后传送到所述待控制家电,所述家电执行该语音识别转换结果。
6.根据权利要求5所述基于终端及互联网语音交互的家电控制系统,其特征在于,所述第二语音识别转换单元包括进行语音识别的语音识别模块和进行语义识别的语义识别模块,所述语义识别模块根据所述语音识别模块识别的语音再进行语义分析判断。
7.根据权利要求5所述基于终端及互联网语音交互的家电控制系统,其特征在于,所述终端还包括唤醒所述终端进入输入语音的状态的唤醒模块,所述唤醒模块包括语音指令、按键或无线信号中的任一种方式。
8.根据权利要求5所述基于终端及互联网语音交互的家电控制系统,其特征在于,所述终端的第一无线通讯模块为红外通讯组件、高频调制通讯组件、蓝牙通讯组件、2.4G无线通讯组件、RFID射频通讯组件中任一种或多种,待控制家电上的第二无线通讯模块为配合所述第一无线通讯模块的红外通讯组件、高频调制通讯组件、蓝牙通讯组件、2.4G无线通讯组件、RFID射频通讯组件中任一种或多种。
9.根据权利要求5所述基于终端及互联网语音交互的家电控制系统,其特征在于,待控制家电还包括进行语音识别转换的第三语音识别转换单元,在不使用移动通讯终端输入的语音信息时,通过待控制家电输入语音,待控制家电的第三语音识别转换单元对该语音信息进行识别转换,待控制家电执行该语音识别转换结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210329698.2A CN102855872B (zh) | 2012-09-07 | 2012-09-07 | 基于终端及互联网语音交互的家电控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210329698.2A CN102855872B (zh) | 2012-09-07 | 2012-09-07 | 基于终端及互联网语音交互的家电控制方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102855872A CN102855872A (zh) | 2013-01-02 |
CN102855872B true CN102855872B (zh) | 2015-08-05 |
Family
ID=47402402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210329698.2A Active CN102855872B (zh) | 2012-09-07 | 2012-09-07 | 基于终端及互联网语音交互的家电控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102855872B (zh) |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104020985A (zh) * | 2013-03-03 | 2014-09-03 | 上海能感物联网有限公司 | 汉语文本遥控计算机程序运行的方法 |
CN104049960A (zh) * | 2013-03-16 | 2014-09-17 | 上海能感物联网有限公司 | 外语语音遥控计算机程序运行的方法 |
CN104049961A (zh) * | 2013-03-16 | 2014-09-17 | 上海能感物联网有限公司 | 汉语语音遥控计算机程序运行的方法 |
CN104049989A (zh) * | 2013-03-16 | 2014-09-17 | 上海能感物联网有限公司 | 外语语音调用计算机程序运行的方法 |
CN104078043B (zh) * | 2013-04-26 | 2016-06-15 | 腾讯科技(深圳)有限公司 | 网络交易系统的语音操作指令识别处理方法和系统 |
US10255930B2 (en) * | 2013-06-28 | 2019-04-09 | Harman International Industries, Incorporated | Wireless control of linked devices |
CN104575499B (zh) * | 2013-10-09 | 2019-12-20 | 上海携程商务有限公司 | 移动终端的声控方法及移动终端 |
CN103578474B (zh) * | 2013-10-25 | 2017-09-12 | 小米科技有限责任公司 | 一种语音控制方法、装置和设备 |
CN103730116B (zh) * | 2014-01-07 | 2016-08-17 | 苏州思必驰信息科技有限公司 | 在智能手表上实现智能家居设备控制的系统及其方法 |
CN103929489A (zh) * | 2014-04-28 | 2014-07-16 | 成都衔石科技有限公司 | 远程智能控制系统 |
CN103903409A (zh) * | 2014-04-28 | 2014-07-02 | 成都衔石科技有限公司 | 智能家居控制系统 |
CN104864434B (zh) * | 2015-06-01 | 2017-05-31 | 华帝股份有限公司 | 一种多功能烟机系统 |
CN106653008B (zh) * | 2015-10-28 | 2021-02-02 | 中兴通讯股份有限公司 | 一种语音控制方法、装置及系统 |
CN106657521A (zh) * | 2015-10-30 | 2017-05-10 | 中兴通讯股份有限公司 | 一种智能设备语音交流方法、装置和系统 |
CN105334743B (zh) | 2015-11-18 | 2018-10-26 | 深圳创维-Rgb电子有限公司 | 一种基于情感识别的智能家居控制方法及其系统 |
CN105957535A (zh) * | 2016-04-15 | 2016-09-21 | 青岛克路德机器人有限公司 | 机器人语音信号探测识别系统 |
CN105913839A (zh) * | 2016-05-30 | 2016-08-31 | 合肥华凌股份有限公司 | 一种智能冰箱、服务器及语音控制系统和方法 |
CN106205611B (zh) * | 2016-06-29 | 2020-03-27 | 北京儒博科技有限公司 | 一种基于多模态历史响应结果的人机交互方法及系统 |
CN107578779A (zh) * | 2016-07-01 | 2018-01-12 | 佛山市顺德区美的电热电器制造有限公司 | 穿戴式设备的控制方法、穿戴式设备及具有其的控制系统 |
CN106101789B (zh) * | 2016-07-06 | 2020-04-24 | 深圳Tcl数字技术有限公司 | 终端的语音交互方法及装置 |
CN106254186A (zh) * | 2016-08-05 | 2016-12-21 | 易晓阳 | 一种语音交互识别控制系统 |
CN107977387A (zh) * | 2016-10-25 | 2018-05-01 | 北京酷我科技有限公司 | 一种基于语义识别的歌曲推荐方法及系统 |
CN106331956A (zh) * | 2016-11-04 | 2017-01-11 | 北京声智科技有限公司 | 集成远场语音识别和声场录制的系统和方法 |
CN106683674A (zh) * | 2017-01-16 | 2017-05-17 | 西安电子科技大学 | 利用语音控制智能家居的系统及方法 |
CN106847269A (zh) * | 2017-01-20 | 2017-06-13 | 浙江小尤鱼智能技术有限公司 | 一种智能家居系统的语音控制方法及装置 |
CN106997762A (zh) * | 2017-03-08 | 2017-08-01 | 广东美的制冷设备有限公司 | 家用电器的语音控制方法以及装置 |
CN106859358A (zh) * | 2017-04-13 | 2017-06-20 | 马导利 | 一种基于歌曲控制电饭煲的装置 |
CN107516516B (zh) * | 2017-08-21 | 2018-11-20 | 北京格致创想科技有限公司 | 基于语音交互的仪器智能控制方法及系统 |
CN107678288A (zh) * | 2017-09-21 | 2018-02-09 | 厦门盈趣科技股份有限公司 | 一种室内智能设备自动控制系统及方法 |
CN109557831A (zh) * | 2017-09-26 | 2019-04-02 | 郭连花 | 一种家电控制方法及装置 |
CN108428452B (zh) | 2018-03-14 | 2019-12-13 | 百度在线网络技术(北京)有限公司 | 终端支架和远场语音交互系统 |
CN108320749A (zh) * | 2018-03-14 | 2018-07-24 | 百度在线网络技术(北京)有限公司 | 远场语音控制设备和远场语音控制系统 |
EP3826280B1 (en) * | 2018-08-07 | 2023-05-24 | Huawei Technologies Co., Ltd. | Method for generating speech control command, and terminal |
CN110070864A (zh) * | 2019-03-13 | 2019-07-30 | 佛山市云米电器科技有限公司 | 一种基于语音设置家居场景的控制系统及其方法 |
CN110085232A (zh) * | 2019-03-13 | 2019-08-02 | 佛山市云米电器科技有限公司 | 一种基于语音的红外控制系统及其方法 |
CN111752169A (zh) * | 2019-03-27 | 2020-10-09 | 广州汽车集团股份有限公司 | 一种车载终端控制方法、装置及系统 |
CN110418118A (zh) * | 2019-09-05 | 2019-11-05 | 深圳伯图康卓智能科技有限公司 | 一种视频交互式语音识别智能温控系统 |
CN111292746A (zh) * | 2020-02-07 | 2020-06-16 | 普强时代(珠海横琴)信息技术有限公司 | 一种基于人机交互的语音输入转换系统 |
CN112289316A (zh) * | 2020-11-18 | 2021-01-29 | 江西台德智慧科技有限公司 | 一种人工智能电饭煲、系统及交互方法 |
CN116192554A (zh) * | 2023-04-25 | 2023-05-30 | 山东工程职业技术大学 | 一种基于语音的物联网设备控制方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1361516A (zh) * | 2000-12-28 | 2002-07-31 | 广东科龙电器股份有限公司 | 家庭综合服务器 |
CN102196207A (zh) * | 2011-05-12 | 2011-09-21 | 深圳市子栋科技有限公司 | 语音控制电视机的方法、装置和系统 |
CN102496364A (zh) * | 2011-11-30 | 2012-06-13 | 苏州奇可思信息科技有限公司 | 基于云端网络的交互式语音识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9276761B2 (en) * | 2009-03-04 | 2016-03-01 | At&T Intellectual Property I, L.P. | Method and apparatus for group media consumption |
-
2012
- 2012-09-07 CN CN201210329698.2A patent/CN102855872B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1361516A (zh) * | 2000-12-28 | 2002-07-31 | 广东科龙电器股份有限公司 | 家庭综合服务器 |
CN102196207A (zh) * | 2011-05-12 | 2011-09-21 | 深圳市子栋科技有限公司 | 语音控制电视机的方法、装置和系统 |
CN102496364A (zh) * | 2011-11-30 | 2012-06-13 | 苏州奇可思信息科技有限公司 | 基于云端网络的交互式语音识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102855872A (zh) | 2013-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102855872B (zh) | 基于终端及互联网语音交互的家电控制方法及系统 | |
CN102855874B (zh) | 基于互联网语音交互的家电控制方法及系统 | |
CN103093755B (zh) | 基于终端及互联网语音交互的网络家电控制方法及系统 | |
CN102847325B (zh) | 基于移动通讯终端语音交互的玩具控制方法及系统 | |
CN102855875B (zh) | 基于外部开启控制语音输入的网络语音转换控制系统和方法 | |
CN102831892A (zh) | 基于互联网语音交互的玩具控制方法及系统 | |
CN103177557B (zh) | 基于智能设备的家电控制方法及系统 | |
CN103188538A (zh) | 基于智能电视设备和互联网的家电控制方法及系统 | |
CN103208285A (zh) | 基于移动通讯终端语音交互的家电控制方法及系统 | |
CN102543071B (zh) | 用于移动设备的语音识别系统和方法 | |
CN112735418B (zh) | 一种语音交互的处理方法、装置、终端及存储介质 | |
CN202961885U (zh) | 基于移动通讯终端语音控制玩具的通讯装置 | |
CN107147618A (zh) | 一种用户注册方法、装置及电子设备 | |
CN107767863A (zh) | 语音唤醒方法、系统及智能终端 | |
CN103714815A (zh) | 语音控制方法及其设备 | |
CN108877790A (zh) | 音箱控制方法、装置、可读存储介质及移动终端 | |
CN204904540U (zh) | 有屏智能遥控器 | |
CN106847269A (zh) | 一种智能家居系统的语音控制方法及装置 | |
CN103729193A (zh) | 一种人机交互方法及装置 | |
CN111462741B (zh) | 语音数据处理方法、装置及存储介质 | |
CN107403619A (zh) | 一种应用于自行车环境的语音控制方法及系统 | |
CN202976432U (zh) | 基于移动通讯终端语音控制家电的通讯装置 | |
CN103491406A (zh) | 一种基于语音识别的android智能电视系统 | |
CN102868740A (zh) | 基于移动通讯终端及互联网语音交互的玩具控制方法及系统 | |
CN205596133U (zh) | 一种基于语音识别的智能家居系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |