CN102708865A - 语音识别方法、装置及系统 - Google Patents
语音识别方法、装置及系统 Download PDFInfo
- Publication number
- CN102708865A CN102708865A CN2012101233692A CN201210123369A CN102708865A CN 102708865 A CN102708865 A CN 102708865A CN 2012101233692 A CN2012101233692 A CN 2012101233692A CN 201210123369 A CN201210123369 A CN 201210123369A CN 102708865 A CN102708865 A CN 102708865A
- Authority
- CN
- China
- Prior art keywords
- recognition result
- cloud computing
- computing platform
- platform server
- local
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000001228 spectrum Methods 0.000 description 39
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明公开一种语音识别方法、装置及系统,涉及语音识别技术。为了解决现有技术产生网络延迟并且语音识别的准确率的问题而发明。本发明实施例公开的技术方案包括:接收用户发送的语音信息;通过嵌入式语音识别数据库对所述语音信息进行识别、解析,获取所述语音信息对应的本地识别结果以及所述本地识别结果的可信度值;如果所述本地识别结果的可信度值大于预先设置的可信度门限,输出所述本地识别结果;否则,向云计算平台服务器发送所述语音信息,使所述云计算平台服务器通过远端语音识别数据库对所述语音信息进行识别、解析,获取所述语音信息对应的远端识别结果;输出所述云计算平台服务器返回的远端识别结果。本发明实施例公开的技术方案可以应用在信息服务系统中。
Description
技术领域
本发明涉及语音识别技术,尤其涉及一种语音识别方法、装置及系统。
背景技术
随着计算机与信息技术的持续发展,语音交互已经成为人机交互的必要手段。作为语音交互的重要技术之一,语音识别技术经过近半个世纪的发展,已日趋成熟,并得到广泛的应用。
现有技术中语音识别的过程包括:接收用户发送的语音信息;与语音识别服务器建立连接;将该语音信息发送至语音识别服务器,使语音识别服务器对该语音信息进行识别、解析,得到对应的识别结果;接收语音识别服务器返回的识别结果。
由于通过网络侧的语音识别服务器进行语音识别,使得每次语音识别均需要与网络侧进行交互,产生网络延迟;并且,当网络条件较差时,与网络侧进行交互的过程中可能会产生丢包,使得语音识别的准确率较低。
发明内容
本发明的实施例提供一种语音识别方法、装置及系统,能够减少网络延迟,并提高语音识别的准确率。
一方面,提供一种语音识别方法,包括:接收用户发送的语音信息;通过嵌入式语音识别数据库对所述语音信息进行识别、解析,获取所述语音信息对应的本地识别结果以及所述本地识别结果的可信度值;如果所述本地识别结果的可信度值大于预先设置的可信度门限,输出所述本地识别结果;否则,向云计算平台服务器发送所述语音信息,使所述云计算平台服务器通过远端语音识别数据库对所述语音信息进行识别、解析,获取所述语音信息对应的远端识别结果;输出所述云计算平台服务器返回的远端识别结果。
另一方面,提供一种语音识别装置,包括:
语音接收模块,用于接收用户发送的语音信息;
识别模块,用于通过嵌入式语音识别数据库对所述语音信息进行识别、解析,获取所述语音信息对应的本地识别结果以及所述本地识别结果的可信度值;
第一输出模块,用于如果所述本地识别结果的可信度值大于预先设置的可信度门限,输出所述本地识别结果;
信息发送模块,用于否则,向云计算平台服务器发送所述语音信息,使所述云计算平台服务器通过远端语音识别数据库对所述语音信息进行识别、解析,获取所述语音信息对应的远端识别结果;
第二输出模块,用于输出所述云计算平台服务器返回的远端识别结果。
又一方面,提供一种语音识别系统,包括:
语音识别装置,用于接收用户发送的语音信息;通过嵌入式语音识别数据库对所述语音信息进行识别、解析,获取所述语音信息对应的本地识别结果以及所述本地识别结果的可信度值;如果所述本地识别结果的可信度值大于预先设置的可信度门限,输出所述本地识别结果;否则,向云计算平台服务器发送所述语音信息;输出所述云计算平台服务器返回的远端识别结果;
所述云计算平台服务器,用于接收所述语音识别装置发送的语音信息;对所述语音信息进行识别、解析,获取所述语音信息对应的远端识别结果;向所述语音识别装置发送所述远端识别结果。
本发明实施例提供的语音识别方法、装置及系统,将嵌入式语音识别与云端语音识别结合,如果本地识别结果的可信度值大于预先设置的可信度门限,输出该本地识别结果;否则,向云计算平台服务器发送语音信息并输出其返回的远端识别结果。由于本发明实施例提供的技术方案将嵌入式语音识别与云端语音识别结合,使得无需每次语音识别均与网络侧进行交互,从而在保证语音识别的准确率的前提下,减少了与网络侧的交互过程,减少了网络延迟;并且,当网络条件较差时,可以降低丢包率,从而提高语音识别的准确率;解决了现有技术由于通过网络侧的语音识别服务器进行语音识别,使得每次语音识别均需要与网络侧进行交互,产生网络延迟;并且,当网络条件较差时,与网络侧进行交互的过程中可能会产生丢包,使得语音识别的准确率较低。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的语音识别方法的流程图;
图2为本发明实施例二提供的语音识别方法的流程图一;
图3为本发明实施例二提供的语音识别方法的流程图二;
图4为本发明实施例三提供的语音识别方法的流程图;
图5为本发明实施例四提供的语音识别装置的结构示意图一;
图6为本发明实施例四提供的语音识别装置的结构示意图二;
图7为本发明实施例四提供的语音识别装置的结构示意图三;
图8为本发明实施例五提供的语音识别系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有技术产生网络延迟并且语音识别的准确率的问题,本发明实施例提供一种语音识别方法、装置及系统。
实施例一:
如图1所示,本发明实施例提供的语音识别方法,包括:
步骤101,接收用户发送的语音信息。
在本实施例中,步骤101可以在用户按下语音录入键之后接收用户发送的语音信息,也可以在用户进行其他操作后接收用户发送的语音信息,在此不作限制。其中,用户输入的语音信息可以为简单的语音指令,也可以为包含语音指令的其他信息,再次不再一一赘述。
步骤102,通过嵌入式语音识别数据库对该语音信息进行识别、解析,获取语音信息对应的本地识别结果以及该本地识别结果的可信度值。
在本实施例中,步骤102中嵌入式语音识别数据库可以用于存储任意语音特征库,为了缩小嵌入式语音识别数据库的规模,优选的,该嵌入式语音识别数据库可以用于存储控制指令。以音乐播放应用为例,嵌入式语音识别数据库可以用于存储播放、暂停、上一首、下一首等控制指令;嵌入式语音识别数据库存储的控制指令包括但不仅限于以上所述,在此不再一一赘述。
在本实施例中,步骤102通过嵌入式语音识别数据库对语音信息进行识别、解析,得到本地识别结果的过程,可以为将语音信息与嵌入式语音识别数据库中的语音特征分别进行相似度比较,得到嵌入式语音识别数据库中各个语音特征的可信度值,并将可信度值最高的语音特征作为本地识别结果;步骤102也可以通过其他方式得到本地识别结果,在此不再一一赘述。其中,本地识别结果的可信度值可以通过上述过程确定,也可以通过其他方式确定,在此不作限制。
在本实施例中,嵌入式语音识别库可以预先存储几种较典型的语音特征库;也可以预先存储多种广谱语音特征库。需要说明的是,该广谱语音特征库可以通过采集全中国各地、各种人以及这些人在不同环境下(不同噪声背景)的声音后,精粹提取出来的广谱语音特征的集合,该广谱语音特征库只依赖于现有“语音特征库”的信息,而不依赖于某个人的语音特征训练结果。特别的,该广谱语音特征库还可以包括外语库,其中该外语库可以具有英语库、法语库、德语库、日语库等主流国外语言库。
步骤103,判断本地识别结果的可信度值是否大于预先设置的可信度门限。
在本实施例中,步骤103中可信度门限可以任意设置,也可以根据统计结果设置,在此不作限制。如果通过步骤103确定本地识别结果的可信度值大于预先设置的可信度门限,可以通过步骤104输出本地识别结果;否则,通过步骤105向云计算平台服务器发送语音信息。
步骤104,输出本地识别结果。
步骤105,向云计算平台服务器发送语音信息,使云计算平台服务器通过远端识别数据库对语音信息进行识别、解析,获取语音信息对应的远端识别结果。
在本实施例中,本地可以预先与云计算平台服务器建立连接,也可以在本地识别结果的可信度值小于预先设置的可信度门限时与云计算平台服务器建立连接,在此不作限制。可以通过如Internet、3G移动网络等多种通信方式与云计算平台服务器建立连接;具体的,可以预先存储云计算平台服务器的网络地址(如统一资源定位符URL)或者呼叫号码,根据网络地址或者呼叫号码通过如Internet、3G移动网络等与云计算平台服务器建立通信连接。
在本实施例中,云计算平台服务器可以预先存储多种广谱语音特征库,例如:按照地名设置的广谱语音特征库,按照音视频名称设置的广谱语音特征库以及按照人名设置的广谱语音特征库等。需要说明的是,该广谱语音特征库可以通过采集全中国各地、各种人以及这些人在不同环境下(不同噪声背景)的声音后,精粹提取出来的广谱语音特征的集合,该广谱语音特征库只依赖于现有“语音特征库”的信息,而不依赖于某个人的语音特征训练结果。特别的,该广谱语音特征库还可以包括外语库,其中该外语库可以具有英语库、法语库、德语库、日语库等主流国外语言库。
步骤106,输出云计算平台服务器返回的远端识别结果。
在本实施例中,可以直接通过步骤106输出云计算平台服务器返回的远端识别结果;也可以在远端识别结果的可信度值高于本地识别结果的可信度值时,通过步骤106输出云计算平台服务器返回的远端识别结果,在此不再一一赘述。
本发明实施例提供的语音识别方法,将嵌入式语音识别与云端语音识别结合,如果本地识别结果的可信度值大于预先设置的可信度门限,输出该本地识别结果;否则,向云计算平台服务器发送语音信息并输出其返回的远端识别结果。由于本发明实施例提供的技术方案将嵌入式语音识别与云端语音识别结合,使得无需每次语音识别均与网络侧进行交互,从而在保证语音识别的准确率的前提下,减少了与网络侧的交互过程,减少了网络延迟;并且,当网络条件较差时,可以降低丢包率,从而提高语音识别的准确率;解决了现有技术由于通过网络侧的语音识别服务器进行语音识别,使得每次语音识别均需要与网络侧进行交互,产生网络延迟;并且,当网络条件较差时,与网络侧进行交互的过程中可能会产生丢包,使得语音识别的准确率较低。
实施例二:
如图2所示,本发明实施例提供的语音识别方法,包括:
步骤201至步骤205,获取本地识别结果以及本地识别结果的可信度值,本地识别结果的可信度值大于预先设置的可信度门限时输出,否则向云计算平台服务器发送语音命令。具体过程与图1所示的步骤101至步骤105相似,在此不再一一赘述。
步骤206,向云计算平台服务器发送本地识别结果以及本地识别结果的可信度值。
步骤207,判断远端识别结果的可信度值是否大于本地识别结果的可信度值。
在本实施例中,如果通过步骤207确定远端识别结果的可信度值小于等于本地识别结果的可信度值时,可以通过步骤208输出本地识别结果。
步骤208,根据云计算平台服务器返回的控制命令,输出本地识别结果。
在本实施例中,步骤208中控制命令用于指示输出本地识别结果。
进一步的,如图3所示,本实施例中语音识别方法,还可以包括:
步骤209,输出云计算平台服务器返回的远端识别结果。
在本实施例中,如果通过步骤207确定远端识别结果的可信度值大于本地识别结果的可信度值,可以通过步骤209输出云计算平台服务器返回的远端识别结果。
本发明实施例提供的语音识别方法,将嵌入式语音识别与云端语音识别结合,如果本地识别结果的可信度值大于预先设置的可信度门限,输出该本地识别结果;否则,向云计算平台服务器发送语音信息并输出其返回的远端识别结果。由于本发明实施例提供的技术方案将嵌入式语音识别与云端语音识别结合,使得无需每次语音识别均与网络侧进行交互,从而在保证语音识别的准确率的前提下,减少了与网络侧的交互过程,减少了网络延迟;并且,当网络条件较差时,可以降低丢包率,从而提高语音识别的准确率;解决了现有技术由于通过网络侧的语音识别服务器进行语音识别,使得每次语音识别均需要与网络侧进行交互,产生网络延迟;并且,当网络条件较差时,与网络侧进行交互的过程中可能会产生丢包,使得语音识别的准确率较低。
实施例三:
如图4所示,本发明实施例提供的语音识别方法,该方法与图1所示的语音识别方法相似,区别在于,还包括:
步骤107,从云计算平台服务器获取数据库更新信息。
在本实施例中,通过步骤107从云计算平台服务器获取的数据库更新信息,可以为本地向云计算平台服务器发送数据库更新请求,根据数据库返回的相应的信息获取的;也可以为根据云计算平台服务器返回的信息获取的;还可以为通过其他方式获取的,在此不再一一赘述。其中,本地向云计算平台服务器发送数据更新请求,可以为定时发送,也可以为根据用户指示发送,在此不作限制;云计算平台服务器返回的信息,可以为定时返回的信息,也可以为根据其他设置返回的信息,在此不作限制。
在本实施例中,步骤107中数据库更新信息,可以为嵌入式语音识别数据库的语音特征的增加信息,也可以为嵌入式语音识别数据库的语音特征的减少信息,也可以为嵌入式语音识别数据库删除信息,还可以为上述内容的叠加,如嵌入式语音识别数据库的语音特征的增加信息和嵌入式语音识别数据库删除信息等,在此不再一一赘述。
步骤108,根据该数据库更新信息更新嵌入式语音识别数据库。
在本实施例中,通过步骤107从云计算平台服务器获取数据库更新信息后,可以根据该数据库更新信息对嵌入式语音识别数据库进行相应的更新操作。例如:通过步骤107从云计算平台服务器获取嵌入式语音识别数据库删除信息,对嵌入式语音识别数据库进行相应的删除操作,在此不再一一赘述。
本发明实施例提供的语音识别方法,将嵌入式语音识别与云端语音识别结合,如果本地识别结果的可信度值大于预先设置的可信度门限,输出该本地识别结果;否则,向云计算平台服务器发送语音信息并输出其返回的远端识别结果。由于本发明实施例提供的技术方案将嵌入式语音识别与云端语音识别结合,使得无需每次语音识别均与网络侧进行交互,从而在保证语音识别的准确率的前提下,减少了与网络侧的交互过程,减少了网络延迟;并且,当网络条件较差时,可以降低丢包率,从而提高语音识别的准确率;解决了现有技术由于通过网络侧的语音识别服务器进行语音识别,使得每次语音识别均需要与网络侧进行交互,产生网络延迟;并且,当网络条件较差时,与网络侧进行交互的过程中可能会产生丢包,使得语音识别的准确率较低。
实施例四:
如图5所示,本发明实施例提供的语音识别装置,包括:
语音接收模块501,用于接收用户发送的语音信息。
在本实施例中,语音接收模块501可以在用户按下语音录入键之后接收用户发送的语音信息,也可以在用户进行其他操作后接收用户发送的语音信息,在此不作限制。其中,用户输入的语音信息可以为简单的语音指令,也可以为包含语音指令的其他信息,再次不再一一赘述。
识别模块502,用于通过嵌入式语音识别数据库对语音信息进行识别、解析,获取语音信息对应的本地识别结果以及本地识别结果的可信度值。
在本实施例中,识别模块502中嵌入式语音识别数据库可以用于存储任意语音特征库,为了缩小嵌入式语音识别数据库的规模,优选的,该嵌入式语音识别数据库可以用于存储控制指令。以音乐播放应用为例,嵌入式语音识别数据库可以用于存储播放、暂停、上一首、下一首等控制指令;嵌入式语音识别数据库存储的控制指令包括但不仅限于以上所述,在此不再一一赘述。
在本实施例中,识别模块502通过嵌入式语音识别数据库对语音信息进行识别、解析,得到本地识别结果的过程,可以为将语音信息与嵌入式语音识别数据库中的语音特征分别进行相似度比较,得到嵌入式语音识别数据库中各个语音特征的可信度值,并将可信度值最高的语音特征作为本地识别结果;识别模块502也可以通过其他方式得到本地识别结果,在此不再一一赘述。其中,本地识别结果的可信度值可以通过上述过程确定,也可以通过其他方式确定,在此不作限制。
在本实施例中,嵌入式语音识别库可以预先存储几种较典型的语音特征库;也可以预先存储多种广谱语音特征库。需要说明的是,该广谱语音特征库可以通过采集全中国各地、各种人以及这些人在不同环境下(不同噪声背景)的声音后,精粹提取出来的广谱语音特征的集合,该广谱语音特征库只依赖于现有“语音特征库”的信息,而不依赖于某个人的语音特征训练结果。特别的,该广谱语音特征库还可以包括外语库,其中该外语库可以具有英语库、法语库、德语库、日语库等主流国外语言库。
第一输出模块503,用于如果本地识别结果的可信度值大于预先设置的可信度门限,输出本地识别结果。
信息发送模块504,用于否则,向云计算平台服务器发送语音信息,使云计算平台服务器通过远端语音识别数据库对语音信息进行识别、解析,获取语音信息对应的远端识别结果。
在本实施例中,本地可以预先与云计算平台服务器建立连接,也可以在本地识别结果的可信度值小于预先设置的可信度门限时与云计算平台服务器建立连接,在此不作限制。可以通过如Internet、3G移动网络等多种通信方式与云计算平台服务器建立连接;具体的,可以预先存储云计算平台服务器的网络地址(如统一资源定位符URL)或者呼叫号码,根据网络地址或者呼叫号码通过如Internet、3G移动网络等与云计算平台服务器建立通信连接。
在本实施例中,云计算平台服务器可以预先存储多种广谱语音特征库,例如:按照地名设置的广谱语音特征库,按照音视频名称设置的广谱语音特征库以及按照人名设置的广谱语音特征库等。需要说明的是,该广谱语音特征库可以通过采集全中国各地、各种人以及这些人在不同环境下(不同噪声背景)的声音后,精粹提取出来的广谱语音特征的集合,该广谱语音特征库只依赖于现有“语音特征库”的信息,而不依赖于某个人的语音特征训练结果。特别的,该广谱语音特征库还可以包括外语库,其中该外语库可以具有英语库、法语库、德语库、日语库等主流国外语言库。
第二输出模块505,用于输出云计算平台服务器返回的远端识别结果。
在本实施例中,可以直接通过第二输出模块505输出云计算平台服务器返回的远端识别结果;也可以在远端识别结果的可信度值高于本地识别结果的可信度值时,通过第二输出模块505输出云计算平台服务器返回的远端识别结果,在此不再一一赘述。
进一步的,如图6所示,本实施例提供的语音识别装置,还包括:
识别结果发送模块506,用于向云计算平台服务器发送本地识别结果以及本地识别结果的可信度值。
此时,第二输出模块505,还用于如果远端识别结果的可信度值小于等于本地识别结果的可信度值,根据云计算平台服务器返回的控制命令,输出本地识别结果,控制命令用于指示输出本地识别结果。
进一步的,如图7所示,本实施例提供的语音识别装置,还可以包括:
更新信息获取模块507,用于从云计算平台服务器获取数据库更新信息。
在本实施例中,通过更新信息获取模块507从云计算平台服务器获取的数据库更新信息,可以为本地向云计算平台服务器发送数据库更新请求,根据数据库返回的相应的信息获取的;也可以为根据云计算平台服务器返回的信息获取的;还可以为通过其他方式获取的,在此不再一一赘述。其中,本地向云计算平台服务器发送数据更新请求,可以为定时发送,也可以为根据用户指示发送,在此不作限制;云计算平台服务器返回的信息,可以为定时返回的信息,也可以为根据其他设置返回的信息,在此不作限制。
在本实施例中,更新信息获取模块507中数据库更新信息,可以为嵌入式语音识别数据库的语音特征的增加信息,也可以为嵌入式语音识别数据库的语音特征的减少信息,也可以为嵌入式语音识别数据库删除信息,还可以为上述内容的叠加,如嵌入式语音识别数据库的语音特征的增加信息和嵌入式语音识别数据库删除信息等,在此不再一一赘述。
更新模块508,用于根据数据库更新信息更新嵌入式语音识别数据库。
在本实施例中,通过更新信息获取模块507从云计算平台服务器获取数据库更新信息后,可以根据该数据库更新信息对嵌入式语音识别数据库进行相应的更新操作。例如:通过更新信息获取模块507从云计算平台服务器获取嵌入式语音识别数据库删除信息,对嵌入式语音识别数据库进行相应的删除操作,在此不再一一赘述。
本发明实施例提供的语音识别装置,将嵌入式语音识别与云端语音识别结合,如果本地识别结果的可信度值大于预先设置的可信度门限,输出该本地识别结果;否则,向云计算平台服务器发送语音信息并输出其返回的远端识别结果。由于本发明实施例提供的技术方案将嵌入式语音识别与云端语音识别结合,使得无需每次语音识别均与网络侧进行交互,从而在保证语音识别的准确率的前提下,减少了与网络侧的交互过程,减少了网络延迟;并且,当网络条件较差时,可以降低丢包率,从而提高语音识别的准确率;解决了现有技术由于通过网络侧的语音识别服务器进行语音识别,使得每次语音识别均需要与网络侧进行交互,产生网络延迟;并且,当网络条件较差时,与网络侧进行交互的过程中可能会产生丢包,使得语音识别的准确率较低。
实施例五:
如图8所示,本发明实施例提供的语音识别系统,包括:
语音识别装置801,用于接收用户发送的语音信息;通过嵌入式语音识别数据库对语音信息进行识别、解析,获取语音信息对应的本地识别结果以及本地识别结果的可信度值;如果本地识别结果的可信度值大于预先设置的可信度门限,输出本地识别结果;否则,向云计算平台服务器发送语音信息;输出云计算平台服务器返回的远端识别结果。
在本实施例中,可以在用户按下语音录入键之后接收用户发送的语音信息,也可以在用户进行其他操作后接收用户发送的语音信息,在此不作限制。其中,用户输入的语音信息可以为简单的语音指令,也可以为包含语音指令的其他信息,再次不再一一赘述。
在本实施例中,嵌入式语音识别数据库可以用于存储任意语音特征库,为了缩小嵌入式语音识别数据库的规模,优选的,该嵌入式语音识别数据库可以用于存储控制指令。以音乐播放应用为例,嵌入式语音识别数据库可以用于存储播放、暂停、上一首、下一首等控制指令;嵌入式语音识别数据库存储的控制指令包括但不仅限于以上所述,在此不再一一赘述。
在本实施例中,通过嵌入式语音识别数据库对语音信息进行识别、解析,得到本地识别结果的过程,可以为将语音信息与嵌入式语音识别数据库中的语音特征分别进行相似度比较,得到嵌入式语音识别数据库中各个语音特征的可信度值,并将可信度值最高的语音特征作为本地识别结果;也可以通过其他方式得到本地识别结果,在此不再一一赘述。其中,本地识别结果的可信度值可以通过上述过程确定,也可以通过其他方式确定,在此不作限制。
在本实施例中,嵌入式语音识别库可以预先存储几种较典型的语音特征库;也可以预先存储多种广谱语音特征库。需要说明的是,该广谱语音特征库可以通过采集全中国各地、各种人以及这些人在不同环境下(不同噪声背景)的声音后,精粹提取出来的广谱语音特征的集合,该广谱语音特征库只依赖于现有“语音特征库”的信息,而不依赖于某个人的语音特征训练结果。特别的,该广谱语音特征库还可以包括外语库,其中该外语库可以具有英语库、法语库、德语库、日语库等主流国外语言库。
在本实施例中,本地可以预先与云计算平台服务器建立连接,也可以在本地识别结果的可信度值小于预先设置的可信度门限时与云计算平台服务器建立连接,在此不作限制。可以通过如Internet、3G移动网络等多种通信方式与云计算平台服务器建立连接;具体的,可以预先存储云计算平台服务器的网络地址(如统一资源定位符URL)或者呼叫号码,根据网络地址或者呼叫号码通过如Internet、3G移动网络等与云计算平台服务器建立通信连接。
在本实施例中,可以直接输出云计算平台服务器返回的远端识别结果;也可以在远端识别结果的可信度值高于本地识别结果的可信度值时,输出云计算平台服务器返回的远端识别结果,在此不再一一赘述。
云计算平台服务器802,用于接收语音识别装置发送的语音信息;对语音信息进行识别、解析,获取语音信息对应的远端识别结果;向语音识别装置发送远端识别结果。
在本实施例中,云计算平台服务器可以预先存储多种广谱语音特征库,例如:按照地名设置的广谱语音特征库,按照音视频名称设置的广谱语音特征库以及按照人名设置的广谱语音特征库等。需要说明的是,该广谱语音特征库可以通过采集全中国各地、各种人以及这些人在不同环境下(不同噪声背景)的声音后,精粹提取出来的广谱语音特征的集合,该广谱语音特征库只依赖于现有“语音特征库”的信息,而不依赖于某个人的语音特征训练结果。特别的,该广谱语音特征库还可以包括外语库,其中该外语库可以具有英语库、法语库、德语库、日语库等主流国外语言库。
进一步的,本实施例提供的语音识别系统中,语音识别装置801,还用于向云计算平台服务器发送本地识别结果以及本地识别结果的可信度值;根据云计算平台服务器返回的控制命令,输出本地识别结果;云计算平台服务器802,还用于获取远端识别结果的可信度值;如果远端识别结果的可信度值小于等于本地识别结果的可信度值,向语音识别装置发送指示输出本地识别结果的控制命令。
本发明实施例提供的语音识别系统,将嵌入式语音识别与云端语音识别结合,如果本地识别结果的可信度值大于预先设置的可信度门限,输出该本地识别结果;否则,向云计算平台服务器发送语音信息并输出其返回的远端识别结果。由于本发明实施例提供的技术方案将嵌入式语音识别与云端语音识别结合,使得无需每次语音识别均与网络侧进行交互,从而在保证语音识别的准确率的前提下,减少了与网络侧的交互过程,减少了网络延迟;并且,当网络条件较差时,可以降低丢包率,从而提高语音识别的准确率;解决了现有技术由于通过网络侧的语音识别服务器进行语音识别,使得每次语音识别均需要与网络侧进行交互,产生网络延迟;并且,当网络条件较差时,与网络侧进行交互的过程中可能会产生丢包,使得语音识别的准确率较低。
本发明实施例提供的语音识别方法、装置及系统,可以应用在如导航、点歌以及联系人查询等信息服务系统中。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种语音识别方法,其特征在于,包括:
接收用户发送的语音信息;
通过嵌入式语音识别数据库对所述语音信息进行识别、解析,获取所述语音信息对应的本地识别结果以及所述本地识别结果的可信度值;
如果所述本地识别结果的可信度值大于预先设置的可信度门限,输出所述本地识别结果;
否则,向云计算平台服务器发送所述语音信息,使所述云计算平台服务器通过远端语音识别数据库对所述语音信息进行识别、解析,获取所述语音信息对应的远端识别结果;
输出所述云计算平台服务器返回的远端识别结果。
2.根据权利要求1所述的语音识别方法,其特征在于,还包括:
向所述云计算平台服务器发送所述本地识别结果以及本地识别结果的可信度值;
则所述输出所述云计算平台服务器返回的远端识别结果替换为:
如果所述远端识别结果的可信度值小于等于本地识别结果的可信度值,根据云计算平台服务器返回的控制命令,输出本地识别结果,所述控制命令用于指示输出本地识别结果。
3.根据权利要求1所述的语音识别方法,其特征在于,还包括:
从所述云计算平台服务器获取数据库更新信息;
根据所述数据库更新信息更新所述嵌入式语音识别数据库。
4.根据权利要求1-3中任意一项所述的语音识别方法,其特征在于,所述嵌入式语音识别数据库用于存储控制指令。
5.一种语音识别装置,其特征在于,包括:
语音接收模块,用于接收用户发送的语音信息;
识别模块,用于通过嵌入式语音识别数据库对所述语音信息进行识别、解析,获取所述语音信息对应的本地识别结果以及所述本地识别结果的可信度值;
第一输出模块,用于如果所述本地识别结果的可信度值大于预先设置的可信度门限,输出所述本地识别结果;
信息发送模块,用于否则,向云计算平台服务器发送所述语音信息,使所述云计算平台服务器通过远端语音识别数据库对所述语音信息进行识别、解析,获取所述语音信息对应的远端识别结果;
第二输出模块,用于输出所述云计算平台服务器返回的远端识别结果。
6.根据权利要求5所述的语音识别装置,其特征在于,还包括:
识别结果发送模块,用于向所述云计算平台服务器发送所述本地识别结果以及本地识别结果的可信度值;
所述第二输出模块,还用于如果所述远端识别结果的可信度值小于等于本地识别结果的可信度值,根据云计算平台服务器返回的控制命令,输出本地识别结果,所述控制命令用于指示输出本地识别结果。
7.根据权利要求5所述的语音识别装置,其特征在于,还包括:
更新信息获取模块,用于从所述云计算平台服务器获取数据库更新信息;
更新模块,用于根据所述数据库更新信息更新所述嵌入式语音识别数据库。
8.根据权利要求5-7中任意一项所述的语音识别装置,其特征在于,所述嵌入式语音识别数据库用于存储控制指令。
9.一种语音识别系统,其特征在于,包括:
语音识别装置,用于接收用户发送的语音信息;通过嵌入式语音识别数据库对所述语音信息进行识别、解析,获取所述语音信息对应的本地识别结果以及所述本地识别结果的可信度值;如果所述本地识别结果的可信度值大于预先设置的可信度门限,输出所述本地识别结果;否则,向云计算平台服务器发送所述语音信息;输出所述云计算平台服务器返回的远端识别结果;
所述云计算平台服务器,用于接收所述语音识别装置发送的语音信息;对所述语音信息进行识别、解析,获取所述语音信息对应的远端识别结果;向所述语音识别装置发送所述远端识别结果。
10.根据权利要求9所述的语音识别系统,其特征在于,
所述语音识别装置,还用于向所述云计算平台服务器发送所述本地识别结果以及本地识别结果的可信度值;根据云计算平台服务器返回的控制命令,输出本地识别结果;
所述云计算平台服务器,还用于获取所述远端识别结果的可信度值;如果所述远端识别结果的可信度值小于等于本地识别结果的可信度值,向所述语音识别装置发送指示输出本地识别结果的控制命令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012101233692A CN102708865A (zh) | 2012-04-25 | 2012-04-25 | 语音识别方法、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012101233692A CN102708865A (zh) | 2012-04-25 | 2012-04-25 | 语音识别方法、装置及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102708865A true CN102708865A (zh) | 2012-10-03 |
Family
ID=46901567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012101233692A Pending CN102708865A (zh) | 2012-04-25 | 2012-04-25 | 语音识别方法、装置及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102708865A (zh) |
Cited By (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102968992A (zh) * | 2012-11-26 | 2013-03-13 | 北京奇虎科技有限公司 | 用于浏览器的语音识别处理方法和浏览器 |
CN103247291A (zh) * | 2013-05-07 | 2013-08-14 | 华为终端有限公司 | 一种语音识别设备的更新方法、装置及系统 |
CN103440867A (zh) * | 2013-08-02 | 2013-12-11 | 安徽科大讯飞信息科技股份有限公司 | 语音识别方法及系统 |
CN103488384A (zh) * | 2013-09-30 | 2014-01-01 | 乐视致新电子科技(天津)有限公司 | 一种语音助手应用界面显示方法和装置 |
CN103489444A (zh) * | 2013-09-30 | 2014-01-01 | 乐视致新电子科技(天津)有限公司 | 一种语音识别方法和装置 |
CN103488401A (zh) * | 2013-09-30 | 2014-01-01 | 乐视致新电子科技(天津)有限公司 | 一种语音助手激活方法和装置 |
CN104240707A (zh) * | 2012-11-26 | 2014-12-24 | 北京奇虎科技有限公司 | 用于浏览器的语音识别处理方法和浏览器 |
CN104407834A (zh) * | 2014-11-13 | 2015-03-11 | 腾讯科技(成都)有限公司 | 信息输入方法和装置 |
CN104536978A (zh) * | 2014-12-05 | 2015-04-22 | 奇瑞汽车股份有限公司 | 识别语音数据的方法和装置 |
CN104575494A (zh) * | 2013-10-16 | 2015-04-29 | 中兴通讯股份有限公司 | 一种语音处理的方法和终端 |
CN104681026A (zh) * | 2013-11-27 | 2015-06-03 | 夏普株式会社 | 语音识别终端及系统、服务器及其控制方法、非易失性存储介质 |
CN104795069A (zh) * | 2014-01-21 | 2015-07-22 | 腾讯科技(深圳)有限公司 | 语音识别方法和服务器 |
CN104916283A (zh) * | 2015-06-11 | 2015-09-16 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
CN104978971A (zh) * | 2014-04-08 | 2015-10-14 | 安徽科大讯飞信息科技股份有限公司 | 一种口语评测方法及系统 |
CN105118508A (zh) * | 2015-09-14 | 2015-12-02 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
CN105578240A (zh) * | 2015-12-23 | 2016-05-11 | 广州视源电子科技股份有限公司 | 电视终端交互方法和系统 |
CN105824857A (zh) * | 2015-01-08 | 2016-08-03 | 中兴通讯股份有限公司 | 一种语音搜索方法、装置及终端 |
CN105931633A (zh) * | 2016-05-30 | 2016-09-07 | 深圳市鼎盛智能科技有限公司 | 语音识别的方法及系统 |
CN105931645A (zh) * | 2016-04-12 | 2016-09-07 | 深圳市京华信息技术有限公司 | 虚拟现实设备的控制方法、装置及虚拟现实设备、系统 |
CN106019993A (zh) * | 2016-06-01 | 2016-10-12 | 佛山市顺德区美的电热电器制造有限公司 | 烹饪系统 |
CN106098062A (zh) * | 2016-06-16 | 2016-11-09 | 杭州古北电子科技有限公司 | 本地处理与无线网络结合的智能语音识别控制系统及方法 |
CN106126714A (zh) * | 2016-06-30 | 2016-11-16 | 联想(北京)有限公司 | 信息处理方法及信息处理装置 |
CN106228975A (zh) * | 2016-09-08 | 2016-12-14 | 康佳集团股份有限公司 | 一种移动终端的语音识别系统及方法 |
CN106328148A (zh) * | 2016-08-19 | 2017-01-11 | 上汽通用汽车有限公司 | 基于本地和云端混合识别的自然语音识别方法、装置和系统 |
CN106847291A (zh) * | 2017-02-20 | 2017-06-13 | 成都启英泰伦科技有限公司 | 一种本地和云端相结合的语音识别系统及方法 |
CN106847287A (zh) * | 2017-01-22 | 2017-06-13 | 陈海峰 | 文字阅读识别方法、用户端以及文字阅读识别系统 |
CN106910504A (zh) * | 2015-12-22 | 2017-06-30 | 北京君正集成电路股份有限公司 | 一种基于语音识别的演讲提示方法及装置 |
CN106992009A (zh) * | 2017-05-03 | 2017-07-28 | 深圳车盒子科技有限公司 | 车载语音交互方法、系统及计算机可读存储介质 |
CN107146617A (zh) * | 2017-06-15 | 2017-09-08 | 成都启英泰伦科技有限公司 | 一种新型语音识别设备及方法 |
CN107785019A (zh) * | 2017-10-26 | 2018-03-09 | 西安Tcl软件开发有限公司 | 车载设备及其语音识别方法、可读存储介质 |
CN109869862A (zh) * | 2019-01-23 | 2019-06-11 | 四川虹美智能科技有限公司 | 一种空调、一种空调的控制方法及一种空调系统 |
CN109949815A (zh) * | 2014-04-07 | 2019-06-28 | 三星电子株式会社 | 电子装置 |
CN110299136A (zh) * | 2018-03-22 | 2019-10-01 | 上海擎感智能科技有限公司 | 一种用于语音识别的处理方法及其系统 |
CN110706711A (zh) * | 2014-01-17 | 2020-01-17 | 微软技术许可有限责任公司 | 外源性大词汇量模型到基于规则的语音识别的合并 |
WO2020119438A1 (zh) * | 2018-12-11 | 2020-06-18 | 青岛海尔洗衣机有限公司 | 语音控制方法、云端服务器及终端设备 |
WO2020119437A1 (zh) * | 2018-12-11 | 2020-06-18 | 青岛海尔洗衣机有限公司 | 语音控制方法、云端服务器及终端设备 |
CN112509585A (zh) * | 2020-12-22 | 2021-03-16 | 北京百度网讯科技有限公司 | 车载设备的语音处理方法、装置、设备及存储介质 |
CN112562660A (zh) * | 2019-09-25 | 2021-03-26 | 深圳云端生活科技有限公司 | 一种组合型语音识别处理方法 |
CN112714284A (zh) * | 2020-12-22 | 2021-04-27 | 全球能源互联网研究院有限公司 | 一种电力设备检测方法、装置及移动终端 |
CN113129896A (zh) * | 2019-12-30 | 2021-07-16 | 北京猎户星空科技有限公司 | 一种语音交互方法、装置、电子设备及存储介质 |
WO2022063288A1 (zh) * | 2020-09-27 | 2022-03-31 | 中国商用飞机有限责任公司北京民用飞机技术研究中心 | 一种机上信息辅助系统和方法 |
WO2022217621A1 (zh) * | 2021-04-17 | 2022-10-20 | 华为技术有限公司 | 语音交互的方法和装置 |
US11817101B2 (en) | 2013-09-19 | 2023-11-14 | Microsoft Technology Licensing, Llc | Speech recognition using phoneme matching |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1448915A (zh) * | 2002-04-01 | 2003-10-15 | 欧姆龙株式会社 | 声音识别系统、装置、声音识别方法以及声音识别程序 |
US20060009980A1 (en) * | 2004-07-12 | 2006-01-12 | Burke Paul M | Allocation of speech recognition tasks and combination of results thereof |
CN101454775A (zh) * | 2006-05-23 | 2009-06-10 | 摩托罗拉公司 | 通过基于协同客户端和服务器的语言识别的语法调整 |
CN102196207A (zh) * | 2011-05-12 | 2011-09-21 | 深圳市子栋科技有限公司 | 语音控制电视机的方法、装置和系统 |
-
2012
- 2012-04-25 CN CN2012101233692A patent/CN102708865A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1448915A (zh) * | 2002-04-01 | 2003-10-15 | 欧姆龙株式会社 | 声音识别系统、装置、声音识别方法以及声音识别程序 |
US20060009980A1 (en) * | 2004-07-12 | 2006-01-12 | Burke Paul M | Allocation of speech recognition tasks and combination of results thereof |
CN101454775A (zh) * | 2006-05-23 | 2009-06-10 | 摩托罗拉公司 | 通过基于协同客户端和服务器的语言识别的语法调整 |
CN102196207A (zh) * | 2011-05-12 | 2011-09-21 | 深圳市子栋科技有限公司 | 语音控制电视机的方法、装置和系统 |
Cited By (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104240707A (zh) * | 2012-11-26 | 2014-12-24 | 北京奇虎科技有限公司 | 用于浏览器的语音识别处理方法和浏览器 |
CN102968992A (zh) * | 2012-11-26 | 2013-03-13 | 北京奇虎科技有限公司 | 用于浏览器的语音识别处理方法和浏览器 |
CN102968992B (zh) * | 2012-11-26 | 2014-11-05 | 北京奇虎科技有限公司 | 用于浏览器的语音识别处理方法和浏览器 |
CN103247291A (zh) * | 2013-05-07 | 2013-08-14 | 华为终端有限公司 | 一种语音识别设备的更新方法、装置及系统 |
WO2014180218A1 (zh) * | 2013-05-07 | 2014-11-13 | 华为终端有限公司 | 一种语音识别设备的更新方法、装置及系统 |
CN103440867A (zh) * | 2013-08-02 | 2013-12-11 | 安徽科大讯飞信息科技股份有限公司 | 语音识别方法及系统 |
CN103440867B (zh) * | 2013-08-02 | 2016-08-10 | 科大讯飞股份有限公司 | 语音识别方法及系统 |
US11817101B2 (en) | 2013-09-19 | 2023-11-14 | Microsoft Technology Licensing, Llc | Speech recognition using phoneme matching |
CN103489444A (zh) * | 2013-09-30 | 2014-01-01 | 乐视致新电子科技(天津)有限公司 | 一种语音识别方法和装置 |
CN103488401A (zh) * | 2013-09-30 | 2014-01-01 | 乐视致新电子科技(天津)有限公司 | 一种语音助手激活方法和装置 |
CN103488384A (zh) * | 2013-09-30 | 2014-01-01 | 乐视致新电子科技(天津)有限公司 | 一种语音助手应用界面显示方法和装置 |
CN104575494A (zh) * | 2013-10-16 | 2015-04-29 | 中兴通讯股份有限公司 | 一种语音处理的方法和终端 |
CN104681026A (zh) * | 2013-11-27 | 2015-06-03 | 夏普株式会社 | 语音识别终端及系统、服务器及其控制方法、非易失性存储介质 |
CN104681026B (zh) * | 2013-11-27 | 2019-03-15 | 夏普株式会社 | 语音识别终端及系统、服务器及其控制方法 |
CN110706711A (zh) * | 2014-01-17 | 2020-01-17 | 微软技术许可有限责任公司 | 外源性大词汇量模型到基于规则的语音识别的合并 |
CN110706711B (zh) * | 2014-01-17 | 2023-11-28 | 微软技术许可有限责任公司 | 外源性大词汇量模型到基于规则的语音识别的合并 |
CN104795069A (zh) * | 2014-01-21 | 2015-07-22 | 腾讯科技(深圳)有限公司 | 语音识别方法和服务器 |
CN109949815A (zh) * | 2014-04-07 | 2019-06-28 | 三星电子株式会社 | 电子装置 |
CN109949815B (zh) * | 2014-04-07 | 2024-06-07 | 三星电子株式会社 | 电子装置 |
CN104978971B (zh) * | 2014-04-08 | 2019-04-05 | 科大讯飞股份有限公司 | 一种口语评测方法及系统 |
CN104978971A (zh) * | 2014-04-08 | 2015-10-14 | 安徽科大讯飞信息科技股份有限公司 | 一种口语评测方法及系统 |
CN104407834A (zh) * | 2014-11-13 | 2015-03-11 | 腾讯科技(成都)有限公司 | 信息输入方法和装置 |
CN104536978A (zh) * | 2014-12-05 | 2015-04-22 | 奇瑞汽车股份有限公司 | 识别语音数据的方法和装置 |
CN105824857A (zh) * | 2015-01-08 | 2016-08-03 | 中兴通讯股份有限公司 | 一种语音搜索方法、装置及终端 |
CN104916283A (zh) * | 2015-06-11 | 2015-09-16 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
CN105118508B (zh) * | 2015-09-14 | 2018-10-23 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
CN105118508A (zh) * | 2015-09-14 | 2015-12-02 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
CN106910504A (zh) * | 2015-12-22 | 2017-06-30 | 北京君正集成电路股份有限公司 | 一种基于语音识别的演讲提示方法及装置 |
CN105578240A (zh) * | 2015-12-23 | 2016-05-11 | 广州视源电子科技股份有限公司 | 电视终端交互方法和系统 |
CN105931645A (zh) * | 2016-04-12 | 2016-09-07 | 深圳市京华信息技术有限公司 | 虚拟现实设备的控制方法、装置及虚拟现实设备、系统 |
CN105931633A (zh) * | 2016-05-30 | 2016-09-07 | 深圳市鼎盛智能科技有限公司 | 语音识别的方法及系统 |
WO2017206661A1 (zh) * | 2016-05-30 | 2017-12-07 | 深圳市鼎盛智能科技有限公司 | 语音识别的方法及系统 |
CN106019993A (zh) * | 2016-06-01 | 2016-10-12 | 佛山市顺德区美的电热电器制造有限公司 | 烹饪系统 |
CN106098062A (zh) * | 2016-06-16 | 2016-11-09 | 杭州古北电子科技有限公司 | 本地处理与无线网络结合的智能语音识别控制系统及方法 |
CN106126714A (zh) * | 2016-06-30 | 2016-11-16 | 联想(北京)有限公司 | 信息处理方法及信息处理装置 |
CN106328148A (zh) * | 2016-08-19 | 2017-01-11 | 上汽通用汽车有限公司 | 基于本地和云端混合识别的自然语音识别方法、装置和系统 |
CN106228975A (zh) * | 2016-09-08 | 2016-12-14 | 康佳集团股份有限公司 | 一种移动终端的语音识别系统及方法 |
CN106847287A (zh) * | 2017-01-22 | 2017-06-13 | 陈海峰 | 文字阅读识别方法、用户端以及文字阅读识别系统 |
CN106847291A (zh) * | 2017-02-20 | 2017-06-13 | 成都启英泰伦科技有限公司 | 一种本地和云端相结合的语音识别系统及方法 |
CN106992009A (zh) * | 2017-05-03 | 2017-07-28 | 深圳车盒子科技有限公司 | 车载语音交互方法、系统及计算机可读存储介质 |
CN107146617A (zh) * | 2017-06-15 | 2017-09-08 | 成都启英泰伦科技有限公司 | 一种新型语音识别设备及方法 |
CN107785019A (zh) * | 2017-10-26 | 2018-03-09 | 西安Tcl软件开发有限公司 | 车载设备及其语音识别方法、可读存储介质 |
CN110299136A (zh) * | 2018-03-22 | 2019-10-01 | 上海擎感智能科技有限公司 | 一种用于语音识别的处理方法及其系统 |
US11705129B2 (en) | 2018-12-11 | 2023-07-18 | Qingdao Haier Washing Machine Co., Ltd. | Voice control method, cloud server and terminal device |
CN111312234A (zh) * | 2018-12-11 | 2020-06-19 | 青岛海尔洗衣机有限公司 | 语音控制方法、云端处理器及终端设备 |
WO2020119437A1 (zh) * | 2018-12-11 | 2020-06-18 | 青岛海尔洗衣机有限公司 | 语音控制方法、云端服务器及终端设备 |
US11967320B2 (en) | 2018-12-11 | 2024-04-23 | Qingdao Haier Washing Machine Co., Ltd. | Processing voice information with a terminal device and a cloud server to control an operation |
WO2020119438A1 (zh) * | 2018-12-11 | 2020-06-18 | 青岛海尔洗衣机有限公司 | 语音控制方法、云端服务器及终端设备 |
CN109869862A (zh) * | 2019-01-23 | 2019-06-11 | 四川虹美智能科技有限公司 | 一种空调、一种空调的控制方法及一种空调系统 |
CN112562660A (zh) * | 2019-09-25 | 2021-03-26 | 深圳云端生活科技有限公司 | 一种组合型语音识别处理方法 |
CN113129896A (zh) * | 2019-12-30 | 2021-07-16 | 北京猎户星空科技有限公司 | 一种语音交互方法、装置、电子设备及存储介质 |
CN113129896B (zh) * | 2019-12-30 | 2023-12-12 | 北京猎户星空科技有限公司 | 一种语音交互方法、装置、电子设备及存储介质 |
WO2022063288A1 (zh) * | 2020-09-27 | 2022-03-31 | 中国商用飞机有限责任公司北京民用飞机技术研究中心 | 一种机上信息辅助系统和方法 |
CN112509585A (zh) * | 2020-12-22 | 2021-03-16 | 北京百度网讯科技有限公司 | 车载设备的语音处理方法、装置、设备及存储介质 |
CN112714284A (zh) * | 2020-12-22 | 2021-04-27 | 全球能源互联网研究院有限公司 | 一种电力设备检测方法、装置及移动终端 |
WO2022217621A1 (zh) * | 2021-04-17 | 2022-10-20 | 华为技术有限公司 | 语音交互的方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102708865A (zh) | 语音识别方法、装置及系统 | |
CN1333385C (zh) | 用于通信系统的语音浏览器启用器 | |
CN101576901B (zh) | 搜索请求的产生方法 | |
CN102196207B (zh) | 语音控制电视机的方法、装置和系统 | |
CN104715752A (zh) | 语音识别方法、装置及系统 | |
CN104123940A (zh) | 一种基于智能家居系统的语音控制系统及方法 | |
WO2006120446A3 (en) | Method and apparatus for searching data in a plurality of heterogeneous databases | |
CN105206272A (zh) | 语音传输控制方法及系统 | |
CN102708858A (zh) | 基于编组方式的语音库实现语音识别系统及其方法 | |
CN110992955A (zh) | 一种智能设备的语音操作方法、装置、设备及存储介质 | |
CN103377652A (zh) | 一种用于进行语音识别的方法、装置和设备 | |
CN104091478A (zh) | 随问随答学习机以及网络学习系统 | |
CN103744836A (zh) | 一种人机对话方法及装置 | |
CN106205613B (zh) | 一种导航语音识别方法及系统 | |
CN103076893A (zh) | 一种用于实现语音输入的方法与设备 | |
CN108538289A (zh) | 基于蓝牙实现语音遥控的方法、装置和终端设备 | |
CN109670109A (zh) | 信息获取方法、装置、服务器、终端和介质 | |
CN110139127A (zh) | 音频文件播放方法、服务器、智能音箱及播放系统 | |
CN104010097A (zh) | 基于传统pstn电话的多媒体通讯系统及方法 | |
CN101943991A (zh) | 一种基于云计算的输入方法与设备 | |
CN104216982A (zh) | 一种信息处理方法及电子设备 | |
CN104135569A (zh) | 进行求助的方法、处理求助的方法及智能移动设备 | |
CN108540677A (zh) | 语音处理方法及系统 | |
CN104392366B (zh) | 数据比对信息获取的方法、装置及系统 | |
CN103474075A (zh) | 语音信号发送方法及系统、接收方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20121003 |