CN102496364A - 基于云端网络的交互式语音识别方法 - Google Patents
基于云端网络的交互式语音识别方法 Download PDFInfo
- Publication number
- CN102496364A CN102496364A CN2011103888961A CN201110388896A CN102496364A CN 102496364 A CN102496364 A CN 102496364A CN 2011103888961 A CN2011103888961 A CN 2011103888961A CN 201110388896 A CN201110388896 A CN 201110388896A CN 102496364 A CN102496364 A CN 102496364A
- Authority
- CN
- China
- Prior art keywords
- speech recognition
- client
- service end
- recognition engine
- feature information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于云端网络的交互式语音识别方法,其实施步骤如下:1)在客户端建立本地语音识别引擎,在服务端建立远程语音识别引擎,采集客户端语音,提取语音特征信息;2)客户端识别语音特征信息,如果本地语音识别引擎识别成功,则返回识别信息给用户;如果本地语音识别引擎识别失败,则将语音特征信息发送给服务端;3)服务端使用远程语音识别引擎识别语音特征信息,并返回最优的识别结果信息发送给客户端,客户端针对识别结果进行打分并发送给服务端;4)服务端根据客户端的打分对远程语音识别引擎的语音识别数据库进行整理并同步至各个客户端。本发明具有语音识别效果好、具备自学习功能、使用简单方便的优点。
Description
技术领域
本发明涉及交互式语音识别领域,具体涉及一种基于云端网络的交互式语音识别方法。
背景技术
语音识别技术,也被称为自动语音识别(英语:Automatic Speech Recognition, ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。 语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。语音特征信息是语音识别中的一个最重要基本问题,语音识别系统常用的语音特征信息有线性预测系数、倒频谱系数、平均过零率、能量、短时频谱、共振峰频率及带宽等。目前采用的语音特征信息是14维倒谱、14维差分倒谱、能量、一阶差分能量、二阶差分能量,共31维。计算参数时,分析帧长为200,窗移100。目前语音识别方法也开始渐渐得到了商业应用。但是目前的语音识别方法一般采用单机实现,语音识别引擎的语音识别数据库不能更新,导致语音识别方法无法实现自学习,识别效果不佳,而且缺乏有效的交互手段,不能实现用户参与语音识别的学习和验证,使得语音识别方法受到限制。
发明内容
本发明要解决的技术问题是提供一种语音识别效果好、具备自学习功能、使用简单方便的基于云端网络的交互式语音识别方法。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于云端网络的交互式语音识别方法,其实施步骤如下:
1)在客户端建立包含语音识别数据库的本地语音识别引擎,在服务端建立语音识别数据库的远程语音识别引擎,采集客户端用户输入的语音,提取语音中的语音特征信息;
2)客户端使用本地语音识别引擎识别语音特征信息,如果本地语音识别引擎识别成功,则返回识别信息给用户;如果本地语音识别引擎识别失败,则将语音特征信息发送给服务端;
3)服务端使用远程语音识别引擎识别语音特征信息,并返回最优的识别结果信息发送给客户端,客户端针对识别结果进行打分并发送给服务端;
4)服务端根据客户端的打分对远程语音识别引擎的语音识别数据库进行整理,并将语音识别数据库中分数超过预设阈值的项目同步至各个客户端。
作为上述技术方案的进一步改进:
所述步骤2)中客户端在本地语音识别引擎识别失败时将语音特征信息发送给服务端前还包括将语音特征信息采用Speex编码器进行压缩的步骤。
所述服务端包括多个镜像服务器和用于实现反向代理的中央服务器,所述中央服务器和多个镜像服务器组成CDN网络架构。
所述步骤2)中客户端在本地语音识别引擎识别失败时将语音特征信息发送给服务端的详细步骤包括:客户端首先将语音特征信息发送给中央服务器,所述中央服务器将语音特征信息通过HTTP协议发送给服务端。
本发明具有下述优点:
1、本发明通过在客户端建立包含语音识别数据库的本地语音识别引擎,在服务端建立语音识别数据库的远程语音识别引擎,客户端采集的语音在用本地语音识别引擎优先、辅以远程语音识别引擎来实现语音识别,而且通过服务端与客户端的语音识别数据库中分数超过预设阈值的项目同步,能够有效提高本发明的语音识别正确率。
2、本发明通过服务端根据客户端的打分对远程语音识别引擎的语音识别数据库进行整理,并将语音识别数据库中分数超过预设阈值的项目同步至各个客户端,能够充分利用用户评价实现对语音识别效果的评估,使得本发明具有自学习功能,能够逐步提高语音识别的识别效果。
3、本发明的服务端进一步包括多个镜像服务器和用于实现反向代理的中央服务器,中央服务器和多个镜像服务器组成CDN网络架构,能够有效降低服务端的平均负担,提高服务器的数据处理效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的主要流程示意图。
具体实施方式
下面结合附图对本发明的优选实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
如图1所示,本实施例基于云端网络的交互式语音识别方法的实施步骤如下:
1)在客户端建立包含语音识别数据库的本地语音识别引擎,在服务端建立语音识别数据库的远程语音识别引擎,采集客户端用户输入的语音,提取语音中的语音特征信息;
2)客户端使用本地语音识别引擎识别语音特征信息,如果本地语音识别引擎识别成功,则返回识别信息给用户;如果本地语音识别引擎识别失败,则将语音特征信息发送给服务端;
3)服务端使用远程语音识别引擎识别语音特征信息,并返回最优的识别结果信息发送给客户端,客户端针对识别结果进行打分并发送给服务端;
4)服务端根据客户端的打分对远程语音识别引擎的语音识别数据库进行整理,并将语音识别数据库中分数超过预设阈值的项目同步至各个客户端。
本实施例步骤2)中客户端在本地语音识别引擎识别失败时将语音特征信息发送给服务端前还包括将语音特征信息采用Speex编码器进行压缩的步骤。Speex编码器是一个开源、免费而且无软件专利的自由音频压缩编码器,尤其适用于语音编码。Speex编码器旨在降低语音入门门槛,能够替代昂贵的专用语音编解码器。
本实施例服务端包括多个镜像服务器和用于实现反向代理的中央服务器,中央服务器和多个镜像服务器组成CDN网络架构。
本实施例步骤2)中客户端在本地语音识别引擎识别失败时将语音特征信息发送给服务端的详细步骤包括:客户端首先将语音特征信息发送给中央服务器,中央服务器将语音特征信息通过HTTP协议发送给服务端。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (4)
1.一种基于云端网络的交互式语音识别方法,其特征在于其实施步骤如下:
1)在客户端建立包含语音识别数据库的本地语音识别引擎,在服务端建立语音识别数据库的远程语音识别引擎,采集客户端用户输入的语音,提取语音中的语音特征信息;
2)客户端使用本地语音识别引擎识别语音特征信息,如果本地语音识别引擎识别成功,则返回识别信息给用户;如果本地语音识别引擎识别失败,则将语音特征信息发送给服务端;
3)服务端使用远程语音识别引擎识别语音特征信息,并返回最优的识别结果信息发送给客户端,客户端针对识别结果进行打分并发送给服务端;
4)服务端根据客户端的打分对远程语音识别引擎的语音识别数据库进行整理,并将语音识别数据库中分数超过预设阈值的项目同步至各个客户端。
2.根据权利要求1所述的基于云端网络的交互式语音识别方法,其特征在于:所述步骤2)中客户端在本地语音识别引擎识别失败时将语音特征信息发送给服务端前还包括将语音特征信息采用Speex编码器进行压缩的步骤。
3.根据权利要求1或2所述的基于云端网络的交互式语音识别方法,其特征在于,所述服务端包括多个镜像服务器和用于实现反向代理的中央服务器,所述中央服务器和多个镜像服务器组成CDN网络架构。
4.根据权利要求1或2或3所述的基于云端网络的交互式语音识别方法,其特征在于,所述步骤2)中客户端在本地语音识别引擎识别失败时将语音特征信息发送给服务端的详细步骤包括:客户端首先将语音特征信息发送给中央服务器,所述中央服务器将语音特征信息通过HTTP协议发送给服务端。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011103888961A CN102496364A (zh) | 2011-11-30 | 2011-11-30 | 基于云端网络的交互式语音识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011103888961A CN102496364A (zh) | 2011-11-30 | 2011-11-30 | 基于云端网络的交互式语音识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102496364A true CN102496364A (zh) | 2012-06-13 |
Family
ID=46188181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011103888961A Pending CN102496364A (zh) | 2011-11-30 | 2011-11-30 | 基于云端网络的交互式语音识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102496364A (zh) |
Cited By (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831892A (zh) * | 2012-09-07 | 2012-12-19 | 深圳市信利康电子有限公司 | 基于互联网语音交互的玩具控制方法及系统 |
CN102855872A (zh) * | 2012-09-07 | 2013-01-02 | 深圳市信利康电子有限公司 | 基于终端及互联网语音交互的家电控制方法及系统 |
CN102855874A (zh) * | 2012-09-07 | 2013-01-02 | 深圳市信利康电子有限公司 | 基于互联网语音交互的家电控制方法及系统 |
CN102855875A (zh) * | 2012-09-07 | 2013-01-02 | 深圳市信利康电子有限公司 | 基于外部开启控制语音输入的网络语音转换控制系统和方法 |
CN102868740A (zh) * | 2012-09-07 | 2013-01-09 | 深圳市信利康电子有限公司 | 基于移动通讯终端及互联网语音交互的玩具控制方法及系统 |
CN103000175A (zh) * | 2012-12-03 | 2013-03-27 | 深圳市金立通信设备有限公司 | 一种语音识别的方法及移动终端 |
CN103079258A (zh) * | 2013-01-09 | 2013-05-01 | 广东欧珀移动通信有限公司 | 一种提高语音识别准确性的方法及移动智能终端 |
CN103093755A (zh) * | 2012-09-07 | 2013-05-08 | 深圳市信利康电子有限公司 | 基于终端及互联网语音交互的网络家电控制方法及系统 |
CN103092181A (zh) * | 2012-12-28 | 2013-05-08 | 吴玉胜 | 基于智能电视设备的家电控制方法及系统 |
CN103208285A (zh) * | 2012-09-07 | 2013-07-17 | 深圳市信利康电子有限公司 | 基于移动通讯终端语音交互的家电控制方法及系统 |
CN103247291A (zh) * | 2013-05-07 | 2013-08-14 | 华为终端有限公司 | 一种语音识别设备的更新方法、装置及系统 |
CN103295572A (zh) * | 2012-08-13 | 2013-09-11 | 深圳市路畅科技股份有限公司 | 一种语音识别方法及具有语音识别的车载多媒体导航仪系统 |
CN103440867A (zh) * | 2013-08-02 | 2013-12-11 | 安徽科大讯飞信息科技股份有限公司 | 语音识别方法及系统 |
CN103533154A (zh) * | 2012-06-28 | 2014-01-22 | Lg电子株式会社 | 移动终端及其识别语音的方法 |
CN104134442A (zh) * | 2014-08-15 | 2014-11-05 | 广东欧珀移动通信有限公司 | 一种启动语音服务的方法及装置 |
CN104681026A (zh) * | 2013-11-27 | 2015-06-03 | 夏普株式会社 | 语音识别终端及系统、服务器及其控制方法、非易失性存储介质 |
CN104715752A (zh) * | 2015-04-09 | 2015-06-17 | 刘文军 | 语音识别方法、装置及系统 |
CN104717536A (zh) * | 2013-12-11 | 2015-06-17 | 中国电信股份有限公司 | 一种语音控制的方法和系统 |
CN105118508A (zh) * | 2015-09-14 | 2015-12-02 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
CN105261366A (zh) * | 2015-08-31 | 2016-01-20 | 努比亚技术有限公司 | 语音识别方法、语音引擎及终端 |
CN106098062A (zh) * | 2016-06-16 | 2016-11-09 | 杭州古北电子科技有限公司 | 本地处理与无线网络结合的智能语音识别控制系统及方法 |
CN106164869A (zh) * | 2014-04-01 | 2016-11-23 | 微软技术许可有限责任公司 | 用于并行处理的混合客户端/服务器架构 |
TWI574255B (zh) * | 2016-02-22 | 2017-03-11 | 華碩電腦股份有限公司 | 語音辨識方法、電子裝置及語音辨識系統 |
CN106847291A (zh) * | 2017-02-20 | 2017-06-13 | 成都启英泰伦科技有限公司 | 一种本地和云端相结合的语音识别系统及方法 |
CN107146623A (zh) * | 2017-04-07 | 2017-09-08 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音识别方法、装置和系统 |
CN107430853A (zh) * | 2015-05-27 | 2017-12-01 | 谷歌公司 | 将用于具有选择性离线能力的话音动作的数据本地保存在支持话音的电子装置中 |
CN108074571A (zh) * | 2017-12-27 | 2018-05-25 | 深圳市亿道信息股份有限公司 | 增强现实设备的语音控制方法、系统及存储介质 |
CN109102804A (zh) * | 2018-08-17 | 2018-12-28 | 飞救医疗科技(赣州)有限公司 | 一种语音病历终端输入的方法及其系统 |
CN109119071A (zh) * | 2018-09-26 | 2019-01-01 | 珠海格力电器股份有限公司 | 一种语音识别模型的训练方法及装置 |
US10311878B2 (en) | 2014-01-17 | 2019-06-04 | Microsoft Technology Licensing, Llc | Incorporating an exogenous large-vocabulary model into rule-based speech recognition |
CN109918949A (zh) * | 2019-03-12 | 2019-06-21 | 深圳灵图慧视科技有限公司 | 识别方法、装置、电子设备和存储介质 |
CN110517674A (zh) * | 2019-07-26 | 2019-11-29 | 视联动力信息技术股份有限公司 | 一种语音处理方法、装置及存储介质 |
WO2020119437A1 (zh) * | 2018-12-11 | 2020-06-18 | 青岛海尔洗衣机有限公司 | 语音控制方法、云端服务器及终端设备 |
WO2020119438A1 (zh) * | 2018-12-11 | 2020-06-18 | 青岛海尔洗衣机有限公司 | 语音控制方法、云端服务器及终端设备 |
US10885918B2 (en) | 2013-09-19 | 2021-01-05 | Microsoft Technology Licensing, Llc | Speech recognition using phoneme matching |
CN112259098A (zh) * | 2020-10-28 | 2021-01-22 | 湖南天琛信息科技有限公司 | 一种基于指纹识别的语音遥控系统 |
CN112927721A (zh) * | 2019-12-06 | 2021-06-08 | 观致汽车有限公司 | 人车互动方法、系统以及车辆和计算机可读存储介质 |
US11087762B2 (en) | 2015-05-27 | 2021-08-10 | Google Llc | Context-sensitive dynamic update of voice to text model in a voice-enabled electronic device |
CN114078476A (zh) * | 2020-08-21 | 2022-02-22 | 观致汽车有限公司 | 车载人物情绪展示方法以及车载人物情绪展示装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000058942A2 (en) * | 1999-03-26 | 2000-10-05 | Koninklijke Philips Electronics N.V. | Client-server speech recognition |
US6532446B1 (en) * | 1999-11-24 | 2003-03-11 | Openwave Systems Inc. | Server based speech recognition user interface for wireless devices |
CN1877697A (zh) * | 2006-07-25 | 2006-12-13 | 北京理工大学 | 一种基于分布式结构的说话人确认方法 |
CN102122506A (zh) * | 2011-03-08 | 2011-07-13 | 天脉聚源(北京)传媒科技有限公司 | 一种语音识别的方法 |
-
2011
- 2011-11-30 CN CN2011103888961A patent/CN102496364A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000058942A2 (en) * | 1999-03-26 | 2000-10-05 | Koninklijke Philips Electronics N.V. | Client-server speech recognition |
US6532446B1 (en) * | 1999-11-24 | 2003-03-11 | Openwave Systems Inc. | Server based speech recognition user interface for wireless devices |
CN1877697A (zh) * | 2006-07-25 | 2006-12-13 | 北京理工大学 | 一种基于分布式结构的说话人确认方法 |
CN102122506A (zh) * | 2011-03-08 | 2011-07-13 | 天脉聚源(北京)传媒科技有限公司 | 一种语音识别的方法 |
Cited By (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103533154B (zh) * | 2012-06-28 | 2015-09-02 | Lg电子株式会社 | 移动终端及其识别语音的方法 |
CN103533154A (zh) * | 2012-06-28 | 2014-01-22 | Lg电子株式会社 | 移动终端及其识别语音的方法 |
US9147395B2 (en) | 2012-06-28 | 2015-09-29 | Lg Electronics Inc. | Mobile terminal and method for recognizing voice thereof |
CN103295572A (zh) * | 2012-08-13 | 2013-09-11 | 深圳市路畅科技股份有限公司 | 一种语音识别方法及具有语音识别的车载多媒体导航仪系统 |
CN103295572B (zh) * | 2012-08-13 | 2016-02-03 | 深圳市路畅科技股份有限公司 | 一种语音识别方法及具有语音识别的车载多媒体导航仪系统 |
CN103093755B (zh) * | 2012-09-07 | 2016-05-11 | 深圳市信利康电子有限公司 | 基于终端及互联网语音交互的网络家电控制方法及系统 |
CN103093755A (zh) * | 2012-09-07 | 2013-05-08 | 深圳市信利康电子有限公司 | 基于终端及互联网语音交互的网络家电控制方法及系统 |
CN103208285A (zh) * | 2012-09-07 | 2013-07-17 | 深圳市信利康电子有限公司 | 基于移动通讯终端语音交互的家电控制方法及系统 |
CN102855872B (zh) * | 2012-09-07 | 2015-08-05 | 深圳市信利康电子有限公司 | 基于终端及互联网语音交互的家电控制方法及系统 |
CN102868740A (zh) * | 2012-09-07 | 2013-01-09 | 深圳市信利康电子有限公司 | 基于移动通讯终端及互联网语音交互的玩具控制方法及系统 |
CN102855875A (zh) * | 2012-09-07 | 2013-01-02 | 深圳市信利康电子有限公司 | 基于外部开启控制语音输入的网络语音转换控制系统和方法 |
CN102855874A (zh) * | 2012-09-07 | 2013-01-02 | 深圳市信利康电子有限公司 | 基于互联网语音交互的家电控制方法及系统 |
CN102855872A (zh) * | 2012-09-07 | 2013-01-02 | 深圳市信利康电子有限公司 | 基于终端及互联网语音交互的家电控制方法及系统 |
CN102855875B (zh) * | 2012-09-07 | 2015-05-06 | 深圳市信利康电子有限公司 | 基于外部开启控制语音输入的网络语音转换控制系统和方法 |
CN102831892A (zh) * | 2012-09-07 | 2012-12-19 | 深圳市信利康电子有限公司 | 基于互联网语音交互的玩具控制方法及系统 |
CN103000175A (zh) * | 2012-12-03 | 2013-03-27 | 深圳市金立通信设备有限公司 | 一种语音识别的方法及移动终端 |
CN103092181A (zh) * | 2012-12-28 | 2013-05-08 | 吴玉胜 | 基于智能电视设备的家电控制方法及系统 |
CN103079258A (zh) * | 2013-01-09 | 2013-05-01 | 广东欧珀移动通信有限公司 | 一种提高语音识别准确性的方法及移动智能终端 |
CN103247291A (zh) * | 2013-05-07 | 2013-08-14 | 华为终端有限公司 | 一种语音识别设备的更新方法、装置及系统 |
WO2014180218A1 (zh) * | 2013-05-07 | 2014-11-13 | 华为终端有限公司 | 一种语音识别设备的更新方法、装置及系统 |
CN103440867A (zh) * | 2013-08-02 | 2013-12-11 | 安徽科大讯飞信息科技股份有限公司 | 语音识别方法及系统 |
CN103440867B (zh) * | 2013-08-02 | 2016-08-10 | 科大讯飞股份有限公司 | 语音识别方法及系统 |
US10885918B2 (en) | 2013-09-19 | 2021-01-05 | Microsoft Technology Licensing, Llc | Speech recognition using phoneme matching |
CN104681026A (zh) * | 2013-11-27 | 2015-06-03 | 夏普株式会社 | 语音识别终端及系统、服务器及其控制方法、非易失性存储介质 |
CN104717536A (zh) * | 2013-12-11 | 2015-06-17 | 中国电信股份有限公司 | 一种语音控制的方法和系统 |
US10311878B2 (en) | 2014-01-17 | 2019-06-04 | Microsoft Technology Licensing, Llc | Incorporating an exogenous large-vocabulary model into rule-based speech recognition |
CN106164869A (zh) * | 2014-04-01 | 2016-11-23 | 微软技术许可有限责任公司 | 用于并行处理的混合客户端/服务器架构 |
CN106164869B (zh) * | 2014-04-01 | 2020-12-11 | 微软技术许可有限责任公司 | 用于并行处理的混合客户端/服务器架构 |
US10749989B2 (en) | 2014-04-01 | 2020-08-18 | Microsoft Technology Licensing Llc | Hybrid client/server architecture for parallel processing |
CN104134442A (zh) * | 2014-08-15 | 2014-11-05 | 广东欧珀移动通信有限公司 | 一种启动语音服务的方法及装置 |
CN104715752B (zh) * | 2015-04-09 | 2019-01-08 | 刘文军 | 语音识别方法、装置及系统 |
CN104715752A (zh) * | 2015-04-09 | 2015-06-17 | 刘文军 | 语音识别方法、装置及系统 |
CN107430853A (zh) * | 2015-05-27 | 2017-12-01 | 谷歌公司 | 将用于具有选择性离线能力的话音动作的数据本地保存在支持话音的电子装置中 |
US10986214B2 (en) | 2015-05-27 | 2021-04-20 | Google Llc | Local persisting of data for selectively offline capable voice action in a voice-enabled electronic device |
CN107430853B (zh) * | 2015-05-27 | 2020-11-03 | 谷歌有限责任公司 | 将用于具有选择性离线能力的话音动作的数据本地保存在支持话音的电子装置中 |
US11676606B2 (en) | 2015-05-27 | 2023-06-13 | Google Llc | Context-sensitive dynamic update of voice to text model in a voice-enabled electronic device |
US11087762B2 (en) | 2015-05-27 | 2021-08-10 | Google Llc | Context-sensitive dynamic update of voice to text model in a voice-enabled electronic device |
CN105261366A (zh) * | 2015-08-31 | 2016-01-20 | 努比亚技术有限公司 | 语音识别方法、语音引擎及终端 |
CN105118508B (zh) * | 2015-09-14 | 2018-10-23 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
CN105118508A (zh) * | 2015-09-14 | 2015-12-02 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
TWI574255B (zh) * | 2016-02-22 | 2017-03-11 | 華碩電腦股份有限公司 | 語音辨識方法、電子裝置及語音辨識系統 |
CN106098062A (zh) * | 2016-06-16 | 2016-11-09 | 杭州古北电子科技有限公司 | 本地处理与无线网络结合的智能语音识别控制系统及方法 |
CN106847291A (zh) * | 2017-02-20 | 2017-06-13 | 成都启英泰伦科技有限公司 | 一种本地和云端相结合的语音识别系统及方法 |
CN107146623B (zh) * | 2017-04-07 | 2021-03-16 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音识别方法、装置和系统 |
CN107146623A (zh) * | 2017-04-07 | 2017-09-08 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音识别方法、装置和系统 |
CN108074571A (zh) * | 2017-12-27 | 2018-05-25 | 深圳市亿道信息股份有限公司 | 增强现实设备的语音控制方法、系统及存储介质 |
CN109102804A (zh) * | 2018-08-17 | 2018-12-28 | 飞救医疗科技(赣州)有限公司 | 一种语音病历终端输入的方法及其系统 |
CN109119071A (zh) * | 2018-09-26 | 2019-01-01 | 珠海格力电器股份有限公司 | 一种语音识别模型的训练方法及装置 |
WO2020119438A1 (zh) * | 2018-12-11 | 2020-06-18 | 青岛海尔洗衣机有限公司 | 语音控制方法、云端服务器及终端设备 |
US11967320B2 (en) | 2018-12-11 | 2024-04-23 | Qingdao Haier Washing Machine Co., Ltd. | Processing voice information with a terminal device and a cloud server to control an operation |
WO2020119437A1 (zh) * | 2018-12-11 | 2020-06-18 | 青岛海尔洗衣机有限公司 | 语音控制方法、云端服务器及终端设备 |
US11705129B2 (en) | 2018-12-11 | 2023-07-18 | Qingdao Haier Washing Machine Co., Ltd. | Voice control method, cloud server and terminal device |
CN109918949A (zh) * | 2019-03-12 | 2019-06-21 | 深圳灵图慧视科技有限公司 | 识别方法、装置、电子设备和存储介质 |
CN110517674A (zh) * | 2019-07-26 | 2019-11-29 | 视联动力信息技术股份有限公司 | 一种语音处理方法、装置及存储介质 |
CN112927721A (zh) * | 2019-12-06 | 2021-06-08 | 观致汽车有限公司 | 人车互动方法、系统以及车辆和计算机可读存储介质 |
CN114078476A (zh) * | 2020-08-21 | 2022-02-22 | 观致汽车有限公司 | 车载人物情绪展示方法以及车载人物情绪展示装置 |
CN114078476B (zh) * | 2020-08-21 | 2023-12-19 | 观致汽车有限公司 | 车载人物情绪展示方法以及车载人物情绪展示装置 |
CN112259098A (zh) * | 2020-10-28 | 2021-01-22 | 湖南天琛信息科技有限公司 | 一种基于指纹识别的语音遥控系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102496364A (zh) | 基于云端网络的交互式语音识别方法 | |
CN111508498B (zh) | 对话式语音识别方法、系统、电子设备和存储介质 | |
CN103035238B (zh) | 音频数据的编码方法及解码方法 | |
WO2019227579A1 (zh) | 会议信息记录方法、装置、计算机设备及存储介质 | |
US8386265B2 (en) | Language translation with emotion metadata | |
US8731936B2 (en) | Energy-efficient unobtrusive identification of a speaker | |
CN108305616A (zh) | 一种基于长短时特征提取的音频场景识别方法及装置 | |
CN105679310A (zh) | 一种用于语音识别方法及系统 | |
CN108319666A (zh) | 一种基于多模态舆情分析的供电服务评估方法 | |
CN103700370A (zh) | 一种广播电视语音识别系统方法及系统 | |
CN106024010B (zh) | 一种基于共振峰曲线的语音信号动态特征提取方法 | |
CN102332262A (zh) | 基于音频特征的歌曲智能识别方法 | |
CN113724718B (zh) | 目标音频的输出方法及装置、系统 | |
US11996084B2 (en) | Speech synthesis method and apparatus, device and computer storage medium | |
CN108256458A (zh) | 一种针对聋人自然手语的双向实时翻译系统及方法 | |
CN105869658B (zh) | 一种采用非线性特征的语音端点检测方法 | |
CN108074570A (zh) | 自动切割、传输、保存的语音识别方法 | |
CN109785832A (zh) | 一种适用于重口音的老人机顶盒智能语音识别方法 | |
CN118553231B (zh) | 用于多语言的语音识别方法 | |
CN102376306B (zh) | 语音帧等级的获取方法及装置 | |
CN103474075B (zh) | 语音信号发送方法及系统、接收方法及系统 | |
CN105741853A (zh) | 一种基于共振峰频率的数字语音感知哈希方法 | |
CN112599114A (zh) | 一种语音识别方法及装置 | |
CN110930985A (zh) | 电话语音识别模型、方法、系统、设备及介质 | |
CN115954004A (zh) | 一种语音识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120613 |