[go: up one dir, main page]

CN105718019A - 一种信息处理方法及电子设备 - Google Patents

一种信息处理方法及电子设备 Download PDF

Info

Publication number
CN105718019A
CN105718019A CN201410718607.3A CN201410718607A CN105718019A CN 105718019 A CN105718019 A CN 105718019A CN 201410718607 A CN201410718607 A CN 201410718607A CN 105718019 A CN105718019 A CN 105718019A
Authority
CN
China
Prior art keywords
unit
sound
audio data
detection unit
power consumption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410718607.3A
Other languages
English (en)
Other versions
CN105718019B (zh
Inventor
章丹峰
靳玉茹
刘长生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201410718607.3A priority Critical patent/CN105718019B/zh
Publication of CN105718019A publication Critical patent/CN105718019A/zh
Application granted granted Critical
Publication of CN105718019B publication Critical patent/CN105718019B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephone Function (AREA)

Abstract

本发明公开了一种信息处理方法及电子设备,所述电子设备中包括声音检测单元和触发单元,所述声音检测单元设置于所述触发单元中;所述信息处理方法包括:利用声音采集单元采集音频数据;利用功耗控制单元提取所述音频数据的能量参数,并判断所述能量参数是否大于等于第一阈值,得到第一判断结果;当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,启动声音检测单元,并利用所述声音检测单元从所述音频数据中提取声音信息;启动触发单元,并利用所述触发单元基于语音模板对所述声音信息进行语音匹配。

Description

一种信息处理方法及电子设备
技术领域
本发明涉及信息处理技术,尤其涉及一种信息处理方法及电子设备。
背景技术
语音触发器(VoiceTrigger)在移动互联网设备(MID,MobileInternetDevice)中一直处于待命状态,因此需要将其功耗降到最低。目前常用的功耗控制方法都是基于语音活动检测(VAD,VoiceActivityDetection)算法实现整个语音触发器的功耗控制。但是,VAD本身算法比较复杂,计算量大,实际功耗也很大。
发明内容
为解决上述技术问题,本发明实施例提供了一种信息处理方法及电子设备。
一种信息处理方法,应用于电子设备,所述电子设备中包括声音检测单元和触发单元,所述声音检测单元设置于所述触发单元中;所述信息处理方法包括:
采集音频数据;
提取所述音频数据的能量参数,并判断所述能量参数是否大于等于第一阈值,得到第一判断结果;
当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,启动所述声音检测单元,并利用所述声音检测单元从所述音频数据中提取声音信息;
启动所述触发单元,并利用所述触发单元基于语音模板对所述声音信息进行语音匹配。
本发明实施例提供的电子设备包括:声音采集单元、功耗控制单元、触发单元以及设置在所述触发单元中的声音检测单元;其中,
所述声音采集单元,用于采集音频数据;
所述功耗控制单元,用于提取所述音频数据的能量参数,并判断所述能量参数是否大于等于第一阈值,得到第一判断结果;当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,启动所述声音检测单元;
所述声音检测单元,用于当启动时,从所述音频数据中提取声音信息;
所述触发单元,用于当启动时,基于语音模板对所述声音信息进行语音匹配。
本发明实施例的技术方案中,在VAD之前增加了一级功耗控制,具体为功耗控制单元,功耗控制单元和VAD结合起来,分成两级功耗控制,减少了VAD的功耗消耗。具体地,利用声音采集单元采集音频数据;利用功耗控制单元提取所述音频数据的能量参数,并判断所述能量参数是否大于等于第一阈值;当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,也即检测到非环境语音时,启动声音检测单元,并利用所述声音检测单元从所述音频数据中提取声音信息;最后,启动触发单元,并利用所述触发单元基于语音模板对所述声音信息进行语音匹配。从而实现了当采集到的音频数据为非环境音频数据时,则利用功耗控制单元触发VAD工作,否则,VAD处于关闭状态,从而节省功耗。
附图说明
图1为本发明实施例一的信息处理方法的流程示意图;
图2为本发明实施例二的信息处理方法的流程示意图;
图3为本发明实施例三的信息处理方法的流程示意图;
图4为本发明实施例四的信息处理方法的流程示意图;
图5为本发明实施例五的信息处理方法的流程示意图;
图6为本发明实施例一的电子设备的结构组成示意图;
图7为本发明实施例二的电子设备的结构组成示意图;
图8为本发明实施例三的电子设备的结构组成示意图;
图9为本发明实施例四的电子设备的结构组成示意图;
图10为本发明实施例五的电子设备的结构组成示意图。
具体实施方式
为了能够更加详尽地了解本发明实施例的特点与技术内容,下面结合附图对本发明实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本发明实施例。
图1为本发明实施例一的信息处理方法的流程示意图,本示例中的信息处理方法应用于电子设备中,如图1所示,所述信息处理方法包括以下步骤:
步骤101:利用声音采集单元采集音频数据。
本发明实施例中,所述电子设备尤指MID,此类电子设备具有声音采集单元,例如数字麦克风(DMIC,DigitalMicrophone)。所述电子设备还具有功耗控制单元、触发单元以及设置在所述触发单元中的声音检测单元。这里,所述触发单元具体为VoiceTrigger;声音检测单元具体为VAD。
本发明实施例中,声音采集单元实时采集电子设备外界的音频数据,这里,采集到的音频数据可以是电子设备的外界环境所产生的环境音频数据,也可以是由用户等产生的特定音频数据,例如用户说出“放大”、“缩小”语音所产生的音频数据。
步骤102:利用功耗控制单元提取所述音频数据的能量参数,并判断所述能量参数是否大于等于第一阈值,得到第一判断结果。
本发明实施例中,在VAD的前端设置一级功耗控制,具体为功耗控制单元,当利用声音采集单元采集音频数据后,再利用功耗控制单元提取所述音频数据的能量参数,这里,能量参数可以是音频数据的信息熵或者能量值。因为信息熵或者能量值都比背景音频数据高好多倍,因此,信息熵或者能量值都可以用来做功耗控制,优选地,能量计算相对简单,反应速度也更快,不会导致有效数据的丢失,因此,能量参数为音频数据的能量值。
本发明实施例中,第一阈值与环境音频数据相关,为此,利用所述声音采集单元采集环境音频数据;并计算所述环境音频数据的平均值;依据所述环境音频数据的平均值,确定所述第一阈值。这里,可将第一阈值设置为平均值的倍数,例如4倍。第一阈值用于区分所检测到的音频数据是否为环境音频数据。
步骤103:当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,启动声音检测单元,并利用所述声音检测单元从所述音频数据中提取声音信息。
本发明实施例中,当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,则声音采集单元采集到的音频数据为非环境音频,例如,当用户说出“开启”时,则能量参数大于等于所述第一阈值,如此,功耗控制单元通知声音检测单元启动,然后,声音检测单元从所述音频数据中提取声音信息。这里,声音信息至少但不限于包括以下信息:声音的起始位置、结束位置、长度、频率信息、强度信息、能量信息。
本发明实施例中,当所述第一判断结果表明所述能量参数小于所述第一阈值时,则检测到音频数据为环境音频,此时,控制所述声音检测单元处于关闭状态,如此,可以节省声音检测单元的功耗。
本发明实施例中,电子设备中的触发单元还设置有反馈单元,具体地,所述声音检测单元将所述声音信息发送至反馈单元;所述反馈单元判断所述声音信息是否满足第一预定条件,得到第二判断结果;这里,第一预定条件用于判断声音信息是否为有效语音数据,具体地,累计几十帧数据里有无真正的语音输入。当所述第二判断结果表明所述声音信息满足第一预定条件时,所述反馈单元通知所述功耗控制单元,并利用所述功耗控制单元控制所述声音检测单元处于开启状态。
本发明实施例中,当所述第二判断结果表明所述声音信息不满足第一预定条件时,则所采集到的音频数据为无效语音输入,所述反馈单元通知所述功耗控制单元,并利用所述功耗控制单元控制所声音检测单元处于关闭状态,如此,可以节省声音检测单元的功耗。
步骤104:启动触发单元,并利用所述触发单元基于语音模板对所述声音信息进行语音匹配。
本发明实施例中,触发单元设置有语音模板,例如某些语句的模板声音信息,利用触发单元中的语音模板对所述声音信息进行匹配,以确定出所采集到的音频数据为何音频数据。
本发明实施例中,所述利用所述触发单元基于语音模板对所述声音信息进行语音匹配之后,唤醒处理器处理所匹配的声音信息。具体地,对特定的声音信息设置对应的处理指令,然后基于处理指令实施对应的操作。
本发明实施例中,因为电子设备实际的工作环境,80%以上是安静或普通环境,也就是说声音检测单元有80%是在空转,浪费功耗。在VAD前面增加了一级控制,具体为功耗控制单元,可以大大减少声音检测单元的消耗。
图2为本发明实施例二的信息处理方法的流程示意图,本示例中的信息处理方法应用于电子设备中,如图2所示,所述信息处理方法包括以下步骤:
步骤201:利用声音采集单元采集音频数据。
本发明实施例中,所述电子设备尤指MID,此类电子设备具有声音采集单元,例如DMIC。所述电子设备还具有功耗控制单元、触发单元以及设置在所述触发单元中的声音检测单元。这里,所述触发单元具体为VoiceTrigger;声音检测单元具体为VAD。
本发明实施例中,声音采集单元实时采集电子设备外界的音频数据,这里,采集到的音频数据可以是电子设备的外界环境所产生的环境音频数据,也可以是由用户等产生的特定音频数据,例如用户说出“放大”、“缩小”语音所产生的音频数据。
步骤202:利用功耗控制单元提取所述音频数据的能量参数,并判断所述能量参数是否大于等于第一阈值,得到第一判断结果。
本发明实施例中,在VAD的前端设置一级功耗控制,具体为功耗控制单元,当利用声音采集单元采集音频数据后,再利用功耗控制单元提取所述音频数据的能量参数,这里,能量参数可以是音频数据的信息熵或者能量值。因为信息熵或者能量值都比背景音频数据高好多倍,因此,信息熵或者能量值都可以用来做功耗控制,优选地,能量计算相对简单,反应速度也更快,不会导致有效数据的丢失,因此,能量参数为音频数据的能量值。
本发明实施例中,第一阈值与环境音频数据相关,为此,利用所述声音采集单元采集环境音频数据;并计算所述环境音频数据的平均值;依据所述环境音频数据的平均值,确定所述第一阈值。这里,可将第一阈值设置为平均值的倍数,例如4倍。第一阈值用于区分所检测到的音频数据是否为环境音频数据。
步骤203:当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,启动声音检测单元,并利用所述声音检测单元从所述音频数据中提取声音信息。
本发明实施例中,当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,则声音采集单元采集到的音频数据为非环境音频,例如,当用户说出“开启”时,则能量参数大于等于所述第一阈值,如此,功耗控制单元通知声音检测单元启动,然后,声音检测单元从所述音频数据中提取声音信息。这里,声音信息至少但不限于包括以下信息:声音的起始位置、结束位置、长度、频率信息、强度信息、能量信息。
本发明实施例中,当所述第一判断结果表明所述能量参数小于所述第一阈值时,则检测到音频数据为环境音频,此时,控制所述声音检测单元处于关闭状态,如此,可以节省声音检测单元的功耗。
本发明实施例中,电子设备中的触发单元还设置有反馈单元,具体地,所述声音检测单元将所述声音信息发送至反馈单元;所述反馈单元判断所述声音信息是否满足第一预定条件,得到第二判断结果;这里,第一预定条件用于判断声音信息是否为有效语音数据,具体地,累计几十帧数据里有无真正的语音输入。当所述第二判断结果表明所述声音信息满足第一预定条件时,所述反馈单元通知所述功耗控制单元,并利用所述功耗控制单元控制所述声音检测单元处于开启状态。
本发明实施例中,当所述第二判断结果表明所述声音信息不满足第一预定条件时,则所采集到的音频数据为无效语音输入,所述反馈单元通知所述功耗控制单元,并利用所述功耗控制单元控制所声音检测单元处于关闭状态,如此,可以节省声音检测单元的功耗。
步骤204:启动触发单元,并利用所述触发单元基于语音模板对所述声音信息进行语音匹配。
本发明实施例中,触发单元设置有语音模板,例如某些语句的模板声音信息,利用触发单元中的语音模板对所述声音信息进行匹配,以确定出所采集到的音频数据为何音频数据。
步骤205:唤醒处理器处理所匹配的声音信息。
本发明实施例中,所述利用所述触发单元基于语音模板对所述声音信息进行语音匹配之后,唤醒处理器处理所匹配的声音信息。具体地,对特定的声音信息设置对应的处理指令,然后基于处理指令实施对应的操作。
本发明实施例中,因为电子设备实际的工作环境,80%以上是安静或普通环境,也就是说声音检测单元有80%是在空转,浪费功耗。在VAD前面增加了一级控制,具体为功耗控制单元,可以大大减少声音检测单元的消耗。
图3为本发明实施例三的信息处理方法的流程示意图,本示例中的信息处理方法应用于电子设备中,如图3所示,所述信息处理方法包括以下步骤:
步骤301:利用声音采集单元采集音频数据。
本发明实施例中,所述电子设备尤指MID,此类电子设备具有声音采集单元,例如DMIC。所述电子设备还具有功耗控制单元、触发单元以及设置在所述触发单元中的声音检测单元。这里,所述触发单元具体为VoiceTrigger;声音检测单元具体为VAD。
本发明实施例中,声音采集单元实时采集电子设备外界的音频数据,这里,采集到的音频数据可以是电子设备的外界环境所产生的环境音频数据,也可以是由用户等产生的特定音频数据,例如用户说出“放大”、“缩小”语音所产生的音频数据。
步骤302:利用功耗控制单元提取所述音频数据的能量参数,并判断所述能量参数是否大于等于第一阈值,得到第一判断结果。
本发明实施例中,在VAD的前端设置一级功耗控制,具体为功耗控制单元,当利用声音采集单元采集音频数据后,再利用功耗控制单元提取所述音频数据的能量参数,这里,能量参数可以是音频数据的信息熵或者能量值。因为信息熵或者能量值都比背景音频数据高好多倍,因此,信息熵或者能量值都可以用来做功耗控制,优选地,能量计算相对简单,反应速度也更快,不会导致有效数据的丢失,因此,能量参数为音频数据的能量值。
本发明实施例中,第一阈值与环境音频数据相关,为此,利用所述声音采集单元采集环境音频数据;并计算所述环境音频数据的平均值;依据所述环境音频数据的平均值,确定所述第一阈值。这里,可将第一阈值设置为平均值的倍数,例如4倍。第一阈值用于区分所检测到的音频数据是否为环境音频数据。
步骤303:当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,启动声音检测单元,并利用所述声音检测单元从所述音频数据中提取声音信息。
本发明实施例中,当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,则声音采集单元采集到的音频数据为非环境音频,例如,当用户说出“开启”时,则能量参数大于等于所述第一阈值,如此,功耗控制单元通知声音检测单元启动,然后,声音检测单元从所述音频数据中提取声音信息。这里,声音信息至少但不限于包括以下信息:声音的起始位置、结束位置、长度、频率信息、强度信息、能量信息。
步骤304:当所述第一判断结果表明所述能量参数小于所述第一阈值时,控制所述声音检测单元处于关闭状态。
本发明实施例中,当所述第一判断结果表明所述能量参数小于所述第一阈值时,则检测到音频数据为环境音频,此时,控制所述声音检测单元处于关闭状态,如此,可以节省声音检测单元的功耗。
本发明实施例中,电子设备中的触发单元还设置有反馈单元,具体地,所述声音检测单元将所述声音信息发送至反馈单元;所述反馈单元判断所述声音信息是否满足第一预定条件,得到第二判断结果;这里,第一预定条件用于判断声音信息是否为有效语音数据,具体地,累计几十帧数据里有无真正的语音输入。当所述第二判断结果表明所述声音信息满足第一预定条件时,所述反馈单元通知所述功耗控制单元,并利用所述功耗控制单元控制所述声音检测单元处于开启状态。
本发明实施例中,当所述第二判断结果表明所述声音信息不满足第一预定条件时,则所采集到的音频数据为无效语音输入,所述反馈单元通知所述功耗控制单元,并利用所述功耗控制单元控制所声音检测单元处于关闭状态,如此,可以节省声音检测单元的功耗。
步骤305:启动触发单元,并利用所述触发单元基于语音模板对所述声音信息进行语音匹配。
本发明实施例中,触发单元设置有语音模板,例如某些语句的模板声音信息,利用触发单元中的语音模板对所述声音信息进行匹配,以确定出所采集到的音频数据为何音频数据。
本发明实施例中,所述利用所述触发单元基于语音模板对所述声音信息进行语音匹配之后,唤醒处理器处理所匹配的声音信息。具体地,对特定的声音信息设置对应的处理指令,然后基于处理指令实施对应的操作。
本发明实施例中,因为电子设备实际的工作环境,80%以上是安静或普通环境,也就是说声音检测单元有80%是在空转,浪费功耗。在VAD前面增加了一级控制,具体为功耗控制单元,可以大大减少声音检测单元的消耗。
图4为本发明实施例四的信息处理方法的流程示意图,本示例中的信息处理方法应用于电子设备中,如图4所示,所述信息处理方法包括以下步骤:
步骤401:利用声音采集单元采集音频数据。
本发明实施例中,所述电子设备尤指MID,此类电子设备具有声音采集单元,例如DMIC。所述电子设备还具有功耗控制单元、触发单元以及设置在所述触发单元中的声音检测单元。这里,所述触发单元具体为VoiceTrigger;声音检测单元具体为VAD。
本发明实施例中,声音采集单元实时采集电子设备外界的音频数据,这里,采集到的音频数据可以是电子设备的外界环境所产生的环境音频数据,也可以是由用户等产生的特定音频数据,例如用户说出“放大”、“缩小”语音所产生的音频数据。
步骤402:利用功耗控制单元提取所述音频数据的能量参数,并判断所述能量参数是否大于等于第一阈值,得到第一判断结果。
本发明实施例中,在VAD的前端设置一级功耗控制,具体为功耗控制单元,当利用声音采集单元采集音频数据后,再利用功耗控制单元提取所述音频数据的能量参数,这里,能量参数可以是音频数据的信息熵或者能量值。因为信息熵或者能量值都比背景音频数据高好多倍,因此,信息熵或者能量值都可以用来做功耗控制,优选地,能量计算相对简单,反应速度也更快,不会导致有效数据的丢失,因此,能量参数为音频数据的能量值。
本发明实施例中,第一阈值与环境音频数据相关,为此,利用所述声音采集单元采集环境音频数据;并计算所述环境音频数据的平均值;依据所述环境音频数据的平均值,确定所述第一阈值。这里,可将第一阈值设置为平均值的倍数,例如4倍。第一阈值用于区分所检测到的音频数据是否为环境音频数据。
步骤403:当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,启动声音检测单元,并利用所述声音检测单元从所述音频数据中提取声音信息。
本发明实施例中,当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,则声音采集单元采集到的音频数据为非环境音频,例如,当用户说出“开启”时,则能量参数大于等于所述第一阈值,如此,功耗控制单元通知声音检测单元启动,然后,声音检测单元从所述音频数据中提取声音信息。这里,声音信息至少但不限于包括以下信息:声音的起始位置、结束位置、长度、频率信息、强度信息、能量信息。
本发明实施例中,当所述第一判断结果表明所述能量参数小于所述第一阈值时,则检测到音频数据为环境音频,此时,控制所述声音检测单元处于关闭状态,如此,可以节省声音检测单元的功耗。
步骤404:所述声音检测单元将所述声音信息发送至反馈单元。
步骤405:所述反馈单元判断所述声音信息是否满足第一预定条件,得到第二判断结果。
步骤406:当所述第二判断结果表明所述声音信息满足第一预定条件时,所述反馈单元通知所述功耗控制单元,并利用所述功耗控制单元控制所述声音检测单元处于开启状态。
本发明实施例中,电子设备中的触发单元还设置有反馈单元,具体地,所述声音检测单元将所述声音信息发送至反馈单元;所述反馈单元判断所述声音信息是否满足第一预定条件,得到第二判断结果;这里,第一预定条件用于判断声音信息是否为有效语音数据,具体地,累计几十帧数据里有无真正的语音输入。当所述第二判断结果表明所述声音信息满足第一预定条件时,所述反馈单元通知所述功耗控制单元,并利用所述功耗控制单元控制所述声音检测单元处于开启状态。
本发明实施例中,当所述第二判断结果表明所述声音信息不满足第一预定条件时,则所采集到的音频数据为无效语音输入,所述反馈单元通知所述功耗控制单元,并利用所述功耗控制单元控制所声音检测单元处于关闭状态,如此,可以节省声音检测单元的功耗。
步骤407:启动触发单元,并利用所述触发单元基于语音模板对所述声音信息进行语音匹配。
本发明实施例中,触发单元设置有语音模板,例如某些语句的模板声音信息,利用触发单元中的语音模板对所述声音信息进行匹配,以确定出所采集到的音频数据为何音频数据。
本发明实施例中,所述利用所述触发单元基于语音模板对所述声音信息进行语音匹配之后,唤醒处理器处理所匹配的声音信息。具体地,对特定的声音信息设置对应的处理指令,然后基于处理指令实施对应的操作。
本发明实施例中,因为电子设备实际的工作环境,80%以上是安静或普通环境,也就是说声音检测单元有80%是在空转,浪费功耗。在VAD前面增加了一级控制,具体为功耗控制单元,可以大大减少声音检测单元的消耗。
图5为本发明实施例五的信息处理方法的流程示意图,本示例中的信息处理方法应用于电子设备中,如图5所示,所述信息处理方法包括以下步骤:
步骤501:利用声音采集单元采集音频数据。
本发明实施例中,所述电子设备尤指MID,此类电子设备具有声音采集单元,例如DMIC。所述电子设备还具有功耗控制单元、触发单元以及设置在所述触发单元中的声音检测单元。这里,所述触发单元具体为VoiceTrigger;声音检测单元具体为VAD。
本发明实施例中,声音采集单元实时采集电子设备外界的音频数据,这里,采集到的音频数据可以是电子设备的外界环境所产生的环境音频数据,也可以是由用户等产生的特定音频数据,例如用户说出“放大”、“缩小”语音所产生的音频数据。
步骤502:利用功耗控制单元提取所述音频数据的能量参数,并判断所述能量参数是否大于等于第一阈值,得到第一判断结果。
本发明实施例中,在VAD的前端设置一级功耗控制,具体为功耗控制单元,当利用声音采集单元采集音频数据后,再利用功耗控制单元提取所述音频数据的能量参数,这里,能量参数可以是音频数据的信息熵或者能量值。因为信息熵或者能量值都比背景音频数据高好多倍,因此,信息熵或者能量值都可以用来做功耗控制,优选地,能量计算相对简单,反应速度也更快,不会导致有效数据的丢失,因此,能量参数为音频数据的能量值。
本发明实施例中,第一阈值与环境音频数据相关,为此,利用所述声音采集单元采集环境音频数据;并计算所述环境音频数据的平均值;依据所述环境音频数据的平均值,确定所述第一阈值。这里,可将第一阈值设置为平均值的倍数,例如4倍。第一阈值用于区分所检测到的音频数据是否为环境音频数据。
步骤503:当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,启动声音检测单元,并利用所述声音检测单元从所述音频数据中提取声音信息。
本发明实施例中,当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,则声音采集单元采集到的音频数据为非环境音频,例如,当用户说出“开启”时,则能量参数大于等于所述第一阈值,如此,功耗控制单元通知声音检测单元启动,然后,声音检测单元从所述音频数据中提取声音信息。这里,声音信息至少但不限于包括以下信息:声音的起始位置、结束位置、长度、频率信息、强度信息、能量信息。
本发明实施例中,当所述第一判断结果表明所述能量参数小于所述第一阈值时,则检测到音频数据为环境音频,此时,控制所述声音检测单元处于关闭状态,如此,可以节省声音检测单元的功耗。
步骤504:所述声音检测单元将所述声音信息发送至反馈单元。
步骤505:所述反馈单元判断所述声音信息是否满足第一预定条件,得到第二判断结果。
步骤506:当所述第二判断结果表明所述声音信息满足第一预定条件时,所述反馈单元通知所述功耗控制单元,并利用所述功耗控制单元控制所述声音检测单元处于开启状态。
本发明实施例中,电子设备中的触发单元还设置有反馈单元,具体地,所述声音检测单元将所述声音信息发送至反馈单元;所述反馈单元判断所述声音信息是否满足第一预定条件,得到第二判断结果;这里,第一预定条件用于判断声音信息是否为有效语音数据,具体地,累计几十帧数据里有无真正的语音输入。当所述第二判断结果表明所述声音信息满足第一预定条件时,所述反馈单元通知所述功耗控制单元,并利用所述功耗控制单元控制所述声音检测单元处于开启状态。
步骤507:当所述第二判断结果表明所述声音信息不满足第一预定条件时,所述反馈单元通知所述功耗控制单元,并利用所述功耗控制单元控制所述声音检测单元处于关闭状态。
本发明实施例中,当所述第二判断结果表明所述声音信息不满足第一预定条件时,则所采集到的音频数据为无效语音输入,所述反馈单元通知所述功耗控制单元,并利用所述功耗控制单元控制所声音检测单元处于关闭状态,如此,可以节省声音检测单元的功耗。
步骤508:启动触发单元,并利用所述触发单元基于语音模板对所述声音信息进行语音匹配。
本发明实施例中,触发单元设置有语音模板,例如某些语句的模板声音信息,利用触发单元中的语音模板对所述声音信息进行匹配,以确定出所采集到的音频数据为何音频数据。
本发明实施例中,所述利用所述触发单元基于语音模板对所述声音信息进行语音匹配之后,唤醒处理器处理所匹配的声音信息。具体地,对特定的声音信息设置对应的处理指令,然后基于处理指令实施对应的操作。
本发明实施例中,因为电子设备实际的工作环境,80%以上是安静或普通环境,也就是说声音检测单元有80%是在空转,浪费功耗。在VAD前面增加了一级控制,具体为功耗控制单元,可以大大减少声音检测单元的消耗。
图6为本发明实施例一的电子设备的结构组成示意图,所述电子设备包括:声音采集单元61、功耗控制单元62、触发单元64以及设置在所述触发单元64中的声音检测单元63;其中,
所述声音采集单元61,用于采集音频数据;
所述功耗控制单元62,用于提取所述音频数据的能量参数,并判断所述能量参数是否大于等于第一阈值,得到第一判断结果;当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,启动所述声音检测单元63;
所述声音检测单元63,用于当启动时,从所述音频数据中提取声音信息;
所述触发单元64,用于当启动时,基于语音模板对所述声音信息进行语音匹配。
优选地,所述电子设备还包括:计算单元65、确定单元66;
所述声音采集单元61,还用于采集环境音频数据;
所述计算单元65,用于计算所述环境音频数据的平均值;
所述确定单元66,用于依据所述环境音频数据的平均值,确定所述第一阈值。
本领域技术人员应当理解,图6所示的电子设备中的各单元的实现功能可参照前述信息处理方法的相关描述而理解。图6所示的电子设备中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
图7为本发明实施例二的电子设备的结构组成示意图,所述电子设备包括:声音采集单元71、功耗控制单元72、触发单元74以及设置在所述触发单元74中的声音检测单元73;其中,
所述声音采集单元71,用于采集音频数据;
所述功耗控制单元72,用于提取所述音频数据的能量参数,并判断所述能量参数是否大于等于第一阈值,得到第一判断结果;当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,启动所述声音检测单元73;
所述声音检测单元73,用于当启动时,从所述音频数据中提取声音信息;
所述触发单元74,用于当启动时,基于语音模板对所述声音信息进行语音匹配。
优选地,所述电子设备还包括:计算单元75、确定单元76;
所述声音采集单元71,还用于采集环境音频数据;
所述计算单元75,用于计算所述环境音频数据的平均值;
所述确定单元76,用于依据所述环境音频数据的平均值,确定所述第一阈值。
优选地,所述触发单元74,还用于唤醒处理器处理所匹配的声音信息。
本领域技术人员应当理解,图7所示的电子设备中的各单元的实现功能可参照前述信息处理方法的相关描述而理解。图7所示的电子设备中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
图8为本发明实施三的电子设备的结构组成示意图,所述电子设备包括:声音采集单元81、功耗控制单元82、触发单元84以及设置在所述触发单元84中的声音检测单元83;其中,
所述声音采集单元81,用于采集音频数据;
所述功耗控制单元82,用于提取所述音频数据的能量参数,并判断所述能量参数是否大于等于第一阈值,得到第一判断结果;当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,启动所述声音检测单元83;
所述声音检测单元83,用于当启动时,从所述音频数据中提取声音信息;
所述触发单元84,用于当启动时,基于语音模板对所述声音信息进行语音匹配。
优选地,所述电子设备还包括:计算单元85、确定单元86;
所述声音采集单元81,还用于采集环境音频数据;
所述计算单元85,用于计算所述环境音频数据的平均值;
所述确定单元86,用于依据所述环境音频数据的平均值,确定所述第一阈值。
优选地,所述功耗控制单元82,还用于当所述第一判断结果表明所述能量参数小于所述第一阈值时,控制所述声音检测单元处于关闭状态。
本领域技术人员应当理解,图8所示的电子设备中的各单元的实现功能可参照前述信息处理方法的相关描述而理解。图8所示的电子设备中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
图9为本发明实施例四的电子设备的结构组成示意图,所述电子设备包括:声音采集单元91、功耗控制单元92、触发单元94以及设置在所述触发单元94中的声音检测单元93;其中,
所述声音采集单元91,用于采集音频数据;
所述功耗控制单元92,用于提取所述音频数据的能量参数,并判断所述能量参数是否大于等于第一阈值,得到第一判断结果;当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,启动所述声音检测单元93;
所述声音检测单元93,用于当启动时,从所述音频数据中提取声音信息;
所述触发单元94,用于当启动时,基于语音模板对所述声音信息进行语音匹配。
优选地,所述电子设备还包括:计算单元95、确定单元96;
所述声音采集单元91,还用于采集环境音频数据;
所述计算单元95,用于计算所述环境音频数据的平均值;
所述确定单元96,用于依据所述环境音频数据的平均值,确定所述第一阈值。
优选地,所述电子设备还包括反馈单元97,相应地,
所述声音检测单元93,还用于将所述声音信息发送至所述反馈单元97;
所述反馈单元97,还用于判断所述声音信息是否满足第一预定条件,得到第二判断结果;
所述反馈单元97,还用于当所述第二判断结果表明所述声音信息满足第一预定条件时,通知所述功耗控制单元92;
所述功耗控制单元92,还用于控制所述声音检测单元93处于开启状态。
本领域技术人员应当理解,图9所示的电子设备中的各单元的实现功能可参照前述信息处理方法的相关描述而理解。图9所示的电子设备中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
图10为本发明实施例五的电子设备的结构组成示意图,所述电子设备包括:声音采集单元11、功耗控制单元12、触发单元14以及设置在所述触发单元14中的声音检测单元13;其中,
所述声音采集单元11,用于采集音频数据;
所述功耗控制单元12,用于提取所述音频数据的能量参数,并判断所述能量参数是否大于等于第一阈值,得到第一判断结果;当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,启动所述声音检测单元13;
所述声音检测单元13,用于当启动时,从所述音频数据中提取声音信息;
所述触发单元14,用于当启动时,基于语音模板对所述声音信息进行语音匹配。
优选地,所述电子设备还包括:计算单元15、确定单元16;
所述声音采集单元11,还用于采集环境音频数据;
所述计算单元15,用于计算所述环境音频数据的平均值;
所述确定单元16,用于依据所述环境音频数据的平均值,确定所述第一阈值。
优选地,所述电子设备还包括反馈单元17,相应地,
所述声音检测单元13,还用于将所述声音信息发送至所述反馈单元17;
所述反馈单元17,还用于判断所述声音信息是否满足第一预定条件,得到第二判断结果;
所述反馈单元17,还用于当所述第二判断结果表明所述声音信息满足第一预定条件时,通知所述功耗控制单元12;
所述功耗控制单元12,还用于控制所述声音检测单元13处于开启状态。
优选地,所述反馈单元17,还用于当所述第二判断结果表明所述声音信息不满足第一预定条件时,通知所述功耗控制单元12;
所述功耗控制单元12,还用于控制所述声音检测单元13处于关闭状态。
本领域技术人员应当理解,图10所示的电子设备中的各单元的实现功能可参照前述信息处理方法的相关描述而理解。图10所示的电子设备中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
在不冲突的情况下,上述各实施例之间的技术方案可以合并。
在本发明所提供的几个实施例中,应该理解到,所揭露的方法和智能设备,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过应用指令相关的硬件来完成,前述的应用可以存储于一计算机可读取存储介质中,该应用在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储应用代码的介质。
或者,本发明实施例上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储应用代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。

Claims (12)

1.一种信息处理方法,应用于电子设备,所述电子设备中包括声音检测单元和触发单元,所述声音检测单元设置于所述触发单元中;其特征在于,所述信息处理方法包括:
采集音频数据;
提取所述音频数据的能量参数,并判断所述能量参数是否大于等于第一阈值,得到第一判断结果;
当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,启动所述声音检测单元,并利用所述声音检测单元从所述音频数据中提取声音信息;
启动所述触发单元,并利用所述触发单元基于语音模板对所述声音信息进行语音匹配。
2.根据权利要求1所述的信息处理方法,其特征在于,所述利用所述触发单元基于语音模板对所述声音信息进行语音匹配之后,所述方法还包括:唤醒处理器处理所匹配的声音信息。
3.根据权利要求1所述的信息处理方法,其特征在于,所述方法还包括:
当所述第一判断结果表明所述能量参数小于所述第一阈值时,控制所述声音检测单元处于关闭状态。
4.根据权利要求1所述的信息处理方法,其特征在于,所述方法还包括:
判断所述声音信息是否满足第一预定条件,得到第二判断结果;
当所述第二判断结果表明所述声音信息满足第一预定条件时,控制所述声音检测单元处于开启状态。
5.根据权利要求4所述的信息处理方法,其特征在于,所述方法还包括:
当所述第二判断结果表明所述声音信息不满足第一预定条件时,控制所述声音检测单元处于关闭状态。
6.根据权利要求1至5任一项所述的信息处理方法,其特征在于,所述利用所述声音采集单元采集音频数据之前,所述方法还包括:
利用所述声音采集单元采集环境音频数据;
计算所述环境音频数据的平均值;
依据所述环境音频数据的平均值,确定所述第一阈值。
7.一种电子设备,其特征在于,所述电子设备包括:声音采集单元、功耗控制单元、触发单元以及设置在所述触发单元中的声音检测单元;其中,
所述声音采集单元,用于采集音频数据;
所述功耗控制单元,用于提取所述音频数据的能量参数,并判断所述能量参数是否大于等于第一阈值,得到第一判断结果;当所述第一判断结果表明所述能量参数大于等于所述第一阈值时,启动所述声音检测单元;
所述声音检测单元,用于当启动时,从所述音频数据中提取声音信息;
所述触发单元,用于当启动时,基于语音模板对所述声音信息进行语音匹配。
8.根据权利要求7所述的电子设备,其特征在于,所述触发单元,还用于唤醒处理器处理所匹配的声音信息。
9.根据权利要求7所述的电子设备,其特征在于,所述功耗控制单元,还用于当所述第一判断结果表明所述能量参数小于所述第一阈值时,控制所述声音检测单元处于关闭状态。
10.根据权利要求7所述的电子设备,其特征在于,所述电子设备还包括反馈单元,相应地,
所述声音检测单元,还用于将所述声音信息发送至所述反馈单元;
所述反馈单元,还用于判断所述声音信息是否满足第一预定条件,得到第二判断结果;
所述反馈单元,还用于当所述第二判断结果表明所述声音信息满足第一预定条件时,通知所述功耗控制单元;
所述功耗控制单元,还用于控制所述声音检测单元处于开启状态。
11.根据权利要求8所述的电子设备,其特征在于,
所述反馈单元,还用于当所述第二判断结果表明所述声音信息不满足第一预定条件时,通知所述功耗控制单元;
所述功耗控制单元,还用于控制所述声音检测单元处于关闭状态。
12.根据权利要求7至11任一项所述的电子设备,其特征在于,所述电子设备还包括:计算单元、确定单元;
所述声音采集单元,还用于采集环境音频数据;
所述计算单元,用于计算所述环境音频数据的平均值;
所述确定单元,用于依据所述环境音频数据的平均值,确定所述第一阈值。
CN201410718607.3A 2014-12-01 2014-12-01 一种信息处理方法及电子设备 Active CN105718019B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410718607.3A CN105718019B (zh) 2014-12-01 2014-12-01 一种信息处理方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410718607.3A CN105718019B (zh) 2014-12-01 2014-12-01 一种信息处理方法及电子设备

Publications (2)

Publication Number Publication Date
CN105718019A true CN105718019A (zh) 2016-06-29
CN105718019B CN105718019B (zh) 2020-04-24

Family

ID=56146258

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410718607.3A Active CN105718019B (zh) 2014-12-01 2014-12-01 一种信息处理方法及电子设备

Country Status (1)

Country Link
CN (1) CN105718019B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110556128A (zh) * 2019-10-15 2019-12-10 出门问问信息科技有限公司 一种语音活动性检测方法、设备及计算机可读存储介质
CN110686354A (zh) * 2019-10-12 2020-01-14 宁波奥克斯电气股份有限公司 一种语音空调的控制方法、语音空调的控制装置及空调器

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1949364A (zh) * 2005-10-12 2007-04-18 财团法人工业技术研究院 检测输入语音信号可识别度的系统与方法
CN101064043A (zh) * 2006-04-29 2007-10-31 上海优浪信息科技有限公司 一种声纹门禁系统及其应用
CN101308653A (zh) * 2008-07-17 2008-11-19 安徽科大讯飞信息科技股份有限公司 一种应用于语音识别系统的端点检测方法
CN101562013A (zh) * 2008-04-15 2009-10-21 联芯科技有限公司 一种自动识别语音的方法和装置
US20120066529A1 (en) * 2004-08-11 2012-03-15 Kabushhiki Kaisha Toshiba Information processing apparatus and method for controlling power supply of the apparatus
CN102428424A (zh) * 2010-03-26 2012-04-25 索尼公司 信息处理装置和电源控制电路
CN103956164A (zh) * 2014-05-20 2014-07-30 苏州思必驰信息科技有限公司 一种声音唤醒方法及系统
CN104144377A (zh) * 2013-05-09 2014-11-12 Dsp集团有限公司 话音激活设备的低功率激活

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120066529A1 (en) * 2004-08-11 2012-03-15 Kabushhiki Kaisha Toshiba Information processing apparatus and method for controlling power supply of the apparatus
CN1949364A (zh) * 2005-10-12 2007-04-18 财团法人工业技术研究院 检测输入语音信号可识别度的系统与方法
CN101064043A (zh) * 2006-04-29 2007-10-31 上海优浪信息科技有限公司 一种声纹门禁系统及其应用
CN101562013A (zh) * 2008-04-15 2009-10-21 联芯科技有限公司 一种自动识别语音的方法和装置
CN101308653A (zh) * 2008-07-17 2008-11-19 安徽科大讯飞信息科技股份有限公司 一种应用于语音识别系统的端点检测方法
CN102428424A (zh) * 2010-03-26 2012-04-25 索尼公司 信息处理装置和电源控制电路
CN104144377A (zh) * 2013-05-09 2014-11-12 Dsp集团有限公司 话音激活设备的低功率激活
CN103956164A (zh) * 2014-05-20 2014-07-30 苏州思必驰信息科技有限公司 一种声音唤醒方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110686354A (zh) * 2019-10-12 2020-01-14 宁波奥克斯电气股份有限公司 一种语音空调的控制方法、语音空调的控制装置及空调器
CN110556128A (zh) * 2019-10-15 2019-12-10 出门问问信息科技有限公司 一种语音活动性检测方法、设备及计算机可读存储介质
CN110556128B (zh) * 2019-10-15 2021-02-09 出门问问信息科技有限公司 一种语音活动性检测方法、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN105718019B (zh) 2020-04-24

Similar Documents

Publication Publication Date Title
JP6801095B2 (ja) 音声制御システム及びそのウェイクアップ方法、ウェイクアップ装置、並びに家電製品、コプロセッサ
CN106782554B (zh) 基于人工智能的语音唤醒方法和装置
CN107360327B (zh) 语音识别方法、装置和存储介质
TWI474317B (zh) 訊號處理裝置以及訊號處理方法
CN108154882A (zh) 遥控设备的控制方法及控制装置、存储介质及遥控设备
CN104820556A (zh) 唤醒语音助手的方法及装置
CN107277672B (zh) 一种支持唤醒模式自动切换的方法和装置
WO2017096843A1 (zh) 头戴设备的控制方法和装置
CN108564948B (zh) 一种语音识别方法及电子设备
US20190130911A1 (en) Communications with trigger phrases
CN108848264A (zh) 麦克风的控制方法、装置、存储介质及电子设备
TW201403588A (zh) 電能有效型聲音致動
CN106131292B (zh) 设置终端唤醒的方法、唤醒方法及对应的系统
CN111755002B (zh) 语音识别装置、电子设备和语音识别方法
CN108962250A (zh) 语音识别方法、装置及电子设备
CN108509225B (zh) 一种信息处理方法及电子设备
CN111199733A (zh) 多级识别语音唤醒方法及装置、计算机存储介质及设备
CN110675873A (zh) 智能设备的数据处理方法、装置、设备及存储介质
CN105430564B (zh) 移动设备
CN113963695A (zh) 一种智能设备的唤醒方法、装置、设备及存储介质
CN105718019B (zh) 一种信息处理方法及电子设备
CN112233676A (zh) 智能设备唤醒方法、装置、电子设备及存储介质
CN110956968A (zh) 语音唤醒以及触发语音唤醒功能的方法及装置、终端设备
CN106155707B (zh) 信息处理方法及电子设备
CN114356275B (zh) 交互控制方法、装置、智能语音设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant