CN103117058B - 基于智能电视平台的多语音引擎切换系统及方法 - Google Patents
基于智能电视平台的多语音引擎切换系统及方法 Download PDFInfo
- Publication number
- CN103117058B CN103117058B CN201210558320.XA CN201210558320A CN103117058B CN 103117058 B CN103117058 B CN 103117058B CN 201210558320 A CN201210558320 A CN 201210558320A CN 103117058 B CN103117058 B CN 103117058B
- Authority
- CN
- China
- Prior art keywords
- speech
- speech engine
- module
- engine
- interface
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 17
- 230000005540 biological transmission Effects 0.000 claims description 3
- 230000002452 interceptive effect Effects 0.000 abstract description 5
- 230000001737 promoting effect Effects 0.000 abstract description 3
- 238000001514 detection method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明涉及智能电视软件平台,其公开了一种基于智能电视平台的多语音引擎切换方法,实现自动查找当前识别效率最高的语音引擎并进行切换,提升用户的语音交互体验。该方法可以概括为:当用户运行语音应用程序使用语音识别功能时,语音引擎选择模块通过语音应用接口获取采集到的语音数据,然后将语音数据发送给每一个语音引擎模块,记录并比较各个语音引擎模块返回识别结果的响应时间,选择响应时间最短的语音引擎模块进行切换。此外,本发明还公开了相应的切换系统,适用于在智能电视中实现快速语音识别功能。
Description
技术领域
本发明涉及智能电视软件平台,具体的说,是涉及一种基于智能电视平台的多语音引擎切换系统及方法。
背景技术
随着电视终端智能化、网络化的发展,智能电视可获取的内容得到了极大的丰富,功能也更加的多元化,电视的操控随之变得更加频繁和复杂。语音识别技术在智能电视上的应用大大简化了用户的操作过程,用户体验得到极大提高。由于语音识别需要占用巨大的系统资源,智能电视目前一般都通过网络连接云端服务器来实现语音识别功能;
在服务器中用于实现语音识别功能的语音识别引擎由语音检测模块、特征提取模块和识别搜索模块组成;其中,语音检测模块的功能是进行语音信号的检测和与处理,电视将采集到的原始语音数据送入到该模块,语音信号数据需要在语音检测模块里转换成标准的数据格式(比如:8K,16bit);同时,利用高效的信号检测算法,判断出语音的起始点和终止点;特征提取模块收到检测后的语音数据流,从中提取得到语音信号的特征矢量流。语音特征是利用数字信号处理技术,从语音信号中提取最反应其本质属性的信息。在这个模块中,需要对语音信号进行预加重、分帧、加窗、品与变换、倒谱变换、差分等处理,最终得到数十维左右的特征矢量;识别搜索模块将收到的未知语音信号特征与引擎内的声学模型库、词典/字典和识别语法信息进行匹配,得到最适合未知语音特征的词序列。这个过程可以简单描述如下:通过检索词典/字典,可以将句子由词序列分解成音素的序列。这种音素的序列与声学模型相结合,就得到更反映其本质属性的声学模型单元序列信息。然后,将原始语音的特征矢量与所有可能的句子候选的声学模型单元序列的信息相互匹配,计算得到其匹配概率,从中挑选出具有最大后验概率的声学模型单元序列。通过该单元序列,可以得到与之对应的词序列,这就是引擎输出给电视的文字序列。
而由于服务器中存在多个语音识别引擎,如果单一的使用某一个固定引擎进行语音识别,不利于智能电视语音识别效率的提升,造成用户语音交互体验不好;因此,如何在多个语音识别引擎之间查找当前最有效率的语音识别引擎并进行切换是语音交互应用中一个亟待解决的问题。
发明内容
本发明所要解决的技术问题是:提出一种基于智能电视平台的多语音引擎切换系统及方法,实现自动查找当前识别效率最高的语音引擎并进行切换,提升用户的语音交互体验。
本发明解决上述技术问题采用的方案是:基于智能电视平台的多语音引擎切换系统,包括:语音引擎选择模块及至少两个语音引擎模块;所有的语音引擎模块由统一的语音引擎接口进行封装,并通过语音引擎接口连接语音引擎选择模块;所述语音引擎选择模块通过语音应用接口与语音应用程序相连。
进一步,所述语音引擎模块用于从语音引擎接口获取语音引擎选择模块传送的语音数据,并对语音数据进行识别,然后向语音引擎选择模块返回识别结果;所述语音引擎选择模块用于在语音应用程序使用语音识别功能时,通过语音应用接口获取采集到的语音数据,将语音数据通过语音引擎接口发送给每一个语音引擎模块,并接收所有语音引擎模块返回的识别结果,记录各个语音引擎模块返回识别结果的响应时间并进行对比,选择响应时间最短的语音引擎模块进行切换,使得语音应用程序可以调用到识别效率最高的语音引擎模块。
进一步,所述选择响应时间最短的语音引擎模块进行切换是指:语音引擎选择模块通过语音引擎接口连接到响应时间最短的语音引擎模块,同时断开与其它语音引擎模块的连接。
此外,本发明还提出了一种相应的基于智能电视平台的多语音引擎切换方法,包括:
a.当用户运行语音应用程序使用语音识别功能时,语音引擎选择模块通过语音应用接口获取采集到的语音数据;
b.语音引擎选择模块将语音数据通过语音引擎接口发送给每一个语音引擎模块;
c.各个语音引擎模块对语音数据进行识别,然后向语音引擎选择模块返回识别结果;
d.语音引擎选择模块记录各个语音引擎模块返回识别结果的响应时间并进行对比,选择响应时间最短的语音引擎模块进行切换。
进一步,步骤d中,所述选择响应时间最短的语音引擎模块进行切换是指:语音引擎选择模块通过语音引擎接口连接到响应时间最短的语音引擎模块,同时断开与其它语音引擎模块的连接。
本发明的有益效果是:通过对各个语音引擎模块返回识别结果的响应时间(即识别速度)进行对比,选择响应时间最短的语音引擎模块进行切换,使得语音应用程序可以调用到识别效率最高的语音引擎模块进行语音识别,从而提升了语音识别的整体识别效率;并且,由于语音应用程序与语音引擎选择模块之间的连接载体(语音应用接口)保持不变,当语音引擎模块发生切换时,语音应用程序无需关注具体是哪一个语音引擎模块发生切换,从而保证了语音识别的稳定性和延续性。
附图说明
图1为本发明中基于智能电视平台的多语音引擎切换系统实现构架图;
图2为本发明中的基于智能电视平台的多语音引擎切换方法的流程图。
具体实施方式
本发明的实现原理是:由于系统中各个语音引擎模块的性能差异,这些模块对语音数据的处理就有快有慢,因此,我们可以通过设置一个语音引擎选择模块来对各个语音引擎模块处理语音数据的响应时间进行记录和比较,从而找出处理时间最短、响应最快的语音引擎模块,然后切换至该语音引擎模块的连接即可,而语音引擎选择模块的引入由于其与语音应用程序之间的应用接口始终未发生改变,因此,同时还能解决系统的稳定性问题。
参见图1,本发明中基于智能电视平台的多语音引擎切换系统包括语音引擎选择模块及多个语音引擎模块;所有的语音引擎模块由统一的语音引擎接口进行封装,并通过语音引擎接口连接语音引擎选择模块;所述语音引擎选择模块通过语音应用接口与语音应用程序相连。
其中,所述语音引擎模块用于从语音引擎接口获取语音引擎选择模块传送的语音数据,并对语音数据进行识别,然后向语音引擎选择模块返回识别结果;所述语音引擎选择模块用于在语音应用程序使用语音识别功能时,通过语音应用接口获取采集到的语音数据,将语音数据通过语音引擎接口发送给每一个语音引擎模块,并接收所有语音引擎模块返回的识别结果,记录各个语音引擎模块返回识别结果的响应时间并进行对比,选择响应时间最短的语音引擎模块进行切换,使得语音应用程序可以调用到识别效率最高的语音引擎模块。
图2给出了切换方法的相应流程,其包括以下实现步骤:
a.当用户运行语音应用程序使用语音识别功能时,语音引擎选择模块通过语音应用接口获取采集到的语音数据;该语音数据来源于智能电视的语音采集设备采集到得音源信号;
b.语音引擎选择模块将语音数据通过语音引擎接口发送给每一个语音引擎模块;由于采用了统一的语音引擎接口进行封装,每一个语音引擎模块都能同时收到同样的语音数据;
c.各个语音引擎模块对语音数据进行识别,然后向语音引擎选择模块返回识别结果;
d.语音引擎选择模块记录各个语音引擎模块返回识别结果的响应时间并进行对比,选择响应时间最短的语音引擎模块进行切换:语音引擎选择模块通过语音引擎接口连接到响应时间最短的语音引擎模块,同时断开与其它语音引擎模块的连接。此后,语音应用程序都可以通过调用该响应时间最短的语音引擎模块实现快速的语音识别,提升用户的语音交互体验。
Claims (2)
1.基于智能电视平台的多语音引擎切换系统,其特征在于,包括:语音引擎选择模块及至少两个语音引擎模块;所有的语音引擎模块由统一的语音引擎接口进行封装,并通过语音引擎接口连接语音引擎选择模块;所述语音引擎选择模块通过语音应用接口与语音应用程序相连;
所述语音引擎模块用于从语音引擎接口获取语音引擎选择模块传送的语音数据,并对语音数据进行识别,然后向语音引擎选择模块返回识别结果;所述语音引擎选择模块用于在语音应用程序使用语音识别功能时,通过语音应用接口获取采集到的语音数据,将语音数据通过语音引擎接口发送给每一个语音引擎模块,并接收所有语音引擎模块返回的识别结果,记录各个语音引擎模块返回识别结果的响应时间并进行对比,选择响应时间最短的语音引擎模块进行切换,使得语音应用程序可以调用到识别效率最高的语音引擎模块;
所述选择响应时间最短的语音引擎模块进行切换是指:语音引擎选择模块通过语音引擎接口连接到响应时间最短的语音引擎模块,同时断开与其它语音引擎模块的连接。
2.基于智能电视平台的多语音引擎切换方法,应用在如权利要求1所述的系统中,其特征在于,包括:
a.当用户运行语音应用程序使用语音识别功能时,语音引擎选择模块通过语音应用接口获取采集到的语音数据;
b.语音引擎选择模块将语音数据通过语音引擎接口发送给每一个语音引擎模块;
c.各个语音引擎模块对语音数据进行识别,然后向语音引擎选择模块返回识别结果;
d.语音引擎选择模块记录各个语音引擎模块返回识别结果的响应时间并进行对比,选择响应时间最短的语音引擎模块进行切换;
步骤d中,所述选择响应时间最短的语音引擎模块进行切换是指:语音引擎选择模块通过语音引擎接口连接到响应时间最短的语音引擎模块,同时断开与其它语音引擎模块的连接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210558320.XA CN103117058B (zh) | 2012-12-20 | 2012-12-20 | 基于智能电视平台的多语音引擎切换系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210558320.XA CN103117058B (zh) | 2012-12-20 | 2012-12-20 | 基于智能电视平台的多语音引擎切换系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103117058A CN103117058A (zh) | 2013-05-22 |
CN103117058B true CN103117058B (zh) | 2015-12-09 |
Family
ID=48415416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210558320.XA Active CN103117058B (zh) | 2012-12-20 | 2012-12-20 | 基于智能电视平台的多语音引擎切换系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103117058B (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103336687B (zh) * | 2013-06-17 | 2016-09-14 | 深圳市金立通信设备有限公司 | 一种应用界面的切换方法及终端 |
CN103714814A (zh) * | 2013-12-11 | 2014-04-09 | 四川长虹电器股份有限公司 | 一种语音识别引擎语音对接方法 |
CN104795069B (zh) * | 2014-01-21 | 2020-06-05 | 腾讯科技(深圳)有限公司 | 语音识别方法和服务器 |
CN105609102B (zh) * | 2014-11-21 | 2021-03-16 | 中兴通讯股份有限公司 | 一种语音引擎参数配置方法和装置 |
CN107018228B (zh) * | 2016-01-28 | 2020-03-31 | 中兴通讯股份有限公司 | 一种语音控制系统、语音处理方法及终端设备 |
CN107526512B (zh) * | 2017-08-31 | 2020-11-20 | 联想(北京)有限公司 | 用于电子设备的切换方法和系统 |
CN107657031A (zh) * | 2017-09-28 | 2018-02-02 | 四川长虹电器股份有限公司 | 基于Android系统管理智能音箱语音技能的方法 |
CN109036427B (zh) * | 2018-09-25 | 2021-01-26 | 苏宁智能终端有限公司 | 一种动态配置语音识别服务的方法及系统 |
CN111179934A (zh) * | 2018-11-12 | 2020-05-19 | 奇酷互联网络科技(深圳)有限公司 | 选择语音引擎的方法、移动终端和计算机可读存储介质 |
CN109410926A (zh) * | 2018-11-27 | 2019-03-01 | 恒大法拉第未来智能汽车(广东)有限公司 | 语音语义识别方法及系统 |
CN109493862B (zh) * | 2018-12-24 | 2021-11-09 | 深圳Tcl新技术有限公司 | 终端、语音服务器的确定方法和计算机可读存储介质 |
CN109949816A (zh) * | 2019-02-14 | 2019-06-28 | 安徽云之迹信息技术有限公司 | 机器人语音处理方法及装置、云端服务器 |
CN109947651B (zh) * | 2019-03-21 | 2022-08-02 | 上海智臻智能网络科技股份有限公司 | 人工智能引擎优化方法和装置 |
CN110708365A (zh) * | 2019-09-23 | 2020-01-17 | 杭州迪普科技股份有限公司 | 一种数据接收器的选择方法和装置 |
CN113450785B (zh) * | 2020-03-09 | 2023-12-19 | 上海擎感智能科技有限公司 | 车载语音处理的实现方法、系统、介质及云端服务器 |
CN113593535B (zh) * | 2021-06-30 | 2024-05-24 | 青岛海尔科技有限公司 | 语音数据的处理方法及装置、存储介质、电子装置 |
CN114446279A (zh) * | 2022-02-18 | 2022-05-06 | 青岛海尔科技有限公司 | 语音识别方法、装置、存储介质及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1323435A (zh) * | 1998-10-02 | 2001-11-21 | 国际商业机器公司 | 提供网络协同会话服务的系统和方法 |
CN1429019A (zh) * | 2001-12-18 | 2003-07-09 | 松下电器产业株式会社 | 装有声音识别功能的电视机及其控制方法 |
CN1633679A (zh) * | 2001-12-29 | 2005-06-29 | 摩托罗拉公司 | 用于多级分布式语音识别的方法和装置 |
CN1723487A (zh) * | 2002-12-13 | 2006-01-18 | 摩托罗拉公司 | 用于选择性语音识别的方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6480819B1 (en) * | 1999-02-25 | 2002-11-12 | Matsushita Electric Industrial Co., Ltd. | Automatic search of audio channels by matching viewer-spoken words against closed-caption/audio content for interactive television |
-
2012
- 2012-12-20 CN CN201210558320.XA patent/CN103117058B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1323435A (zh) * | 1998-10-02 | 2001-11-21 | 国际商业机器公司 | 提供网络协同会话服务的系统和方法 |
CN1429019A (zh) * | 2001-12-18 | 2003-07-09 | 松下电器产业株式会社 | 装有声音识别功能的电视机及其控制方法 |
CN1633679A (zh) * | 2001-12-29 | 2005-06-29 | 摩托罗拉公司 | 用于多级分布式语音识别的方法和装置 |
CN1723487A (zh) * | 2002-12-13 | 2006-01-18 | 摩托罗拉公司 | 用于选择性语音识别的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103117058A (zh) | 2013-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103117058B (zh) | 基于智能电视平台的多语音引擎切换系统及方法 | |
CN103093755B (zh) | 基于终端及互联网语音交互的网络家电控制方法及系统 | |
CN110473546B (zh) | 一种媒体文件推荐方法及装置 | |
CN102855872A (zh) | 基于终端及互联网语音交互的家电控制方法及系统 | |
US20190355354A1 (en) | Method, apparatus and system for speech interaction | |
US11457061B2 (en) | Creating a cinematic storytelling experience using network-addressable devices | |
CN107018228B (zh) | 一种语音控制系统、语音处理方法及终端设备 | |
CN104867492A (zh) | 智能交互系统及方法 | |
CN102196207A (zh) | 语音控制电视机的方法、装置和系统 | |
US11244686B2 (en) | Method and apparatus for processing speech | |
CN102831892A (zh) | 基于互联网语音交互的玩具控制方法及系统 | |
CN102625007A (zh) | 一种语音识别的家庭设备控制方法 | |
CN103730115A (zh) | 一种语音中检测关键词的方法和装置 | |
CN102847325B (zh) | 基于移动通讯终端语音交互的玩具控制方法及系统 | |
JP2019091429A (ja) | 情報処理方法および装置 | |
CN113889113A (zh) | 分句方法、装置、存储介质及电子设备 | |
CN103491406A (zh) | 一种基于语音识别的android智能电视系统 | |
CN111833857A (zh) | 语音处理方法、装置和分布式系统 | |
KR20190115405A (ko) | 검색 방법 및 이 방법을 적용하는 전자 장치 | |
CN103095927A (zh) | 基于移动通讯终端及眼镜的显示及语音输出方法及系统 | |
CN102970618A (zh) | 基于音节识别的视频点播方法 | |
CN102868740A (zh) | 基于移动通讯终端及互联网语音交互的玩具控制方法及系统 | |
EP3059731A1 (en) | Method and apparatus for automatically sending multimedia file, mobile terminal, and storage medium | |
CN113936655A (zh) | 语音播报处理方法、装置、计算机设备和存储介质 | |
CN101588415A (zh) | 语音服务方法和语音服务系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |