CN105426357A

CN105426357A - 语音快速选择方法

Info

Publication number: CN105426357A
Application number: CN201510749516.0A
Authority: CN
Inventors: 卢超; 王宁; 冉龙波
Original assignee: Wuhan Carbit Information Co Ltd
Current assignee: Wuhan Carbit Information Co Ltd
Priority date: 2015-11-06
Filing date: 2015-11-06
Publication date: 2016-03-23

Abstract

本发明涉及语音快速选择方法，它包括以下步骤：创建前缀关键词库、动作词库及后缀限定词库；将每个动作词分别与一个应用程序相关联；在每个应用程序中确立一个目标词库，将所有前缀关键词都与每个目标词中的其中一个信息选项相关联，并将所有后缀限定词分别与每个目标词中的其中一个信息选项相关联；获取音频信息，并将获取的音频信息转换为文本信息文件；对该文本信息文件进行语义解析，得到语义解析结果；将语义解析结果依次与动作词、目标词、后缀限定词和前缀关键词进行匹配；根据匹配结果让相关应用程序执行相关操作。注重用户的使用环境，能够快速地筛选出用户所需要的词选项，无需让用户进行二次选择，从而大大方便了用户使用智能设备。

Description

语音快速选择方法

技术领域

本发明涉及通讯技术领域，特别是一种语音快速选择方法。

背景技术

随着语音识别技术的发展，越来越多的智能设备开始倾向于通过语音和使用者建立交互渠道，如现有的手机、车载平板、智能手表、智能手环等通常都附带有语音选择系统，通过语音选择系统，人们不需要低头看智能设备，也不需要对智能设备进行手动物理按键操作，只需以语音命令的形式即可实现对智能设备的操作，从而摆脱了传统点击屏幕或按键的繁琐操作，将控制智能设备操作以更加方便、快捷、准确和智能的方式实现。但是，目前现有的语音选择方法在使用时都没有注重用户的使用环境，使得这些语音选择方法在某些特定的使用环境中使用仍然存在较为繁琐之处，例如：需要打电话时，若手机通讯录中的某个联系人对应有多个号码，那么当用户说出“打电话给某某”时，语音选择系统通常会将所有匹配到的号码都筛选出来，然后问用户选择拨打哪一个，而若此时用户正在开车或骑车，那么上述方法不但会让用户觉得繁琐，而且用户的注意力还难免会被选择拨打哪一个号码的提示语音所吸引，从而产生开车或骑车安全隐患。

发明内容

本发明要解决的一个技术问题是，提供一种注重用户的使用环境，使用更为方便的语音快速选择方法。

为解决上述技术问题，本发明的第一种技术方案是：提供一种语音快速选择方法，其中，它包括以下步骤：

第一步，在智能设备中创建一个前缀关键词库，并在该前缀关键词库中设置至少一个前缀关键词，同时在智能设备中创建一个动作词库，并在该动作词库中设置至少一个动作词；

第二步，将每个动作词分别与智能设备中的其中一个应用程序相关联；

第三步，在与动作词相关联的每个应用程序中确立一个目标词库，每个目标词库在至少包含有一个目标词，每个目标词中至少包含有一个信息选项；

第四步，将所有前缀关键词都与每个目标词中的其中一个信息选项相关联；

第五步，获取音频信息，并将获取的音频信息转换为文本信息文件；

第六步，对该文本信息文件进行语义解析，得到语义解析结果，语义解析结果中至少包含有前缀关键词、动作词以及目标词；

第七步，将语义解析结果中的动作词与动作词库中所有的动作词进行匹配；

第八步，判别动作词匹配是否成功，若不成功，则生成未匹配成功的提示信息通知用户，并跳转至“获取语音输入信息，并将获取的语音输入信息转换为文本信息文件”步骤，生成的提示信息至少包括语音提示信息，若成功，则根据匹配到的动作词调取与该动作词相关联的应用程序中确立的目标词库，并将语义解析结果中的目标词与该目标词库中所有的目标词进行匹配；

第九步，判别目标词匹配是否成功，若不成功，则生成未匹配成功的提示信息通知用户，并跳转至“获取语音输入信息，并将获取的语音输入信息转换为文本信息文件”步骤，生成的提示信息至少包括语音提示信息，若成功，则将语义解析结果中的前缀关键词与前缀关键词库中所有的前缀关键词进行匹配；

第十步，判别前缀关键词匹配是否成功，若不成功，则生成未匹配成功的提示信息通知用户，并跳转至“获取语音输入信息，并将获取的语音输入信息转换为文本信息文件”步骤，生成的提示信息至少包括语音提示信息，若成功，则根据匹配到的动作词开启与该动作词相关联的应用程序，再根据匹配到的目标词和前缀关键词让应用程序执行相关操作。

本发明所述的语音快速选择方法，其中，第五步具体是指：采集用户的语音，再将该语音储存为音频文件，然后将该音频文件进行提取声学特征、进行声学模型匹配等处理，最终将处理结果转换为相应的文字输出到文本信息文件中。

本发明所述的语音快速选择方法，其中，第六步中的“对该文本信息文件进行语义解析”是指，对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理。

本发明的第二种技术方案是：提供一种语音快速选择方法，其中，它包括以下步骤：

第一步，在智能设备中创建一个后缀限定词库，并在该后缀限定词库中设置至少一个后缀限定词，同时在智能设备中创建一个动作词库，并在该动作词库中设置至少一个动作词；

第四步，将所有后缀限定词分别与每个目标词中的其中一个信息选项相关联；

第六步，对该文本信息文件进行语义解析，得到语义解析结果，语义解析结果中至少包含有后缀限定词、动作词以及目标词；

第九步，判别目标词匹配是否成功，若不成功，则生成未匹配成功的提示信息通知用户，并跳转至“获取语音输入信息，并将获取的语音输入信息转换为文本信息文件”步骤，生成的提示信息至少包括语音提示信息，若成功，则将语义解析结果中的后缀限定词与后缀限定词库中所有的后缀限定词进行匹配；

第十步，判别后缀限定词匹配是否成功，若不成功，则生成未匹配成功的提示信息通知用户，并跳转至“获取语音输入信息，并将获取的语音输入信息转换为文本信息文件”步骤，生成的提示信息至少包括语音提示信息，若成功，则根据匹配到的动作词开启与该动作词相关联的应用程序，再根据匹配到的目标词和后缀限定词让应用程序执行相关操作。

本发明的第三种技术方案是：提供一种语音快速选择方法，其中，它包括以下步骤：

第一步，在智能设备中创建一个前缀关键词库，并在该前缀关键词库中设置至少一个前缀关键词，同时在智能设备中创建一个后缀限定词库，并在该后缀限定词库中设置至少一个后缀限定词，同时在智能设备中创建一个动作词库，并在该动作词库中设置至少一个动作词；

第四步，将所有前缀关键词都与每个目标词中的其中一个信息选项相关联，并将所有后缀限定词分别与每个目标词中的其中一个信息选项相关联；

第六步，对该文本信息文件进行语义解析，得到语义解析结果，语义解析结果中至少包含有前缀关键词、后缀限定词、动作词以及目标词；

第十步，判别后缀限定词匹配是否成功，若成功，则根据匹配到的动作词开启与该动作词相关联的应用程序，再根据匹配到的目标词和后缀限定词让应用程序执行相关操作，若不成功则将语义解析结果中的前缀关键词与前缀关键词库中所有的前缀关键词进行匹配；

第十一步，判别前缀关键词匹配是否成功，若不成功，则生成未匹配成功的提示信息通知用户，并跳转至“获取语音输入信息，并将获取的语音输入信息转换为文本信息文件”步骤，生成的提示信息至少包括语音提示信息，若成功，则根据匹配到的动作词开启与该动作词相关联的应用程序，再根据匹配到的目标词和前缀关键词让应用程序执行相关操作。

与现有技术相比，本发明的有益效果是：本发明语音快速选择方法注重用户的使用环境，它通过增加前缀关键词和/或后缀限定词，并将它们分别与得到的语义解析结果进行匹配，从而能够快速地筛选出目标词库内每个目标词中用户所需要的信息选项并执行相关操作，而无需再让用户进行二次选择，从而大大方便了用户使用智能设备。

附图说明

图1是本发明语音快速选择方法中实施例1的流程图；

图2是本发明语音快速选择方法中实施例2的流程图；

图3是本发明语音快速选择方法中实施例3的流程图。

具体实施方式

下面结合具体实施方式对本发明语音快速选择方法作进一步的详细说明。

实施例1：

如图1所示，本发明语音快速选择方法包括以下步骤：

第五步，获取音频信息，并将获取的音频信息转换为文本信息文件，即采集用户的语音，再将该语音储存为音频文件，然后将该音频文件进行提取声学特征、进行声学模型匹配等处理，最终将处理结果转换为相应的文字输出到文本信息文件中；

第六步，对该文本信息文件进行语义解析，即对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理，得到语义解析结果，语义解析结果中至少包含有前缀关键词、动作词以及目标词；

下面以用户在使用手机时通过语音快速选择某个联系人的其中一个电话号码进行拨号为例对本发明语音快速选择方法作进一步的详细说明。

第一步，在手机中创建一个前缀关键词库，并在该前缀关键词库中设置两个前缀关键词：“马上”和“直接”；同时在手机中创建一个动作词库，并在该动作词库中设置一个动作词：“呼叫”；

第二步，将动作词“呼叫”与手机中的拨号程序相关联；

第三步，将拨号程序中自带的通讯录确立为目标词库，那么该通讯录中的每个联系人即为目标词，而每个联系人名下的每个电话号码都为其中一个信息选项，这里假设通讯录中具有联系人“张三”，且“张三”名下具有两个电话号码，其中第一个电话号码为“13000000000”，第二个电话号码为“13800000000”；

第四步，将两个前缀关键词“马上”和“直接”都与每个联系人名下的第一个电话号码相关联；

第五步，开启语音识别软件，然后用户对着麦克风说：“直接呼叫张三”，这时语音识别软件就会采集用户说的这句语音，将该语音储存为音频文件，再将该音频文件进行提取声学特征、进行声学模型匹配等处理，最终将处理结果转换为相应的文字输出到文本信息文件中；

第六步，语音识别软件对该文本信息文件进行语义解析，即对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理，得到语义解析结果，即前缀关键词“直接”，动作词“呼叫”和目标词“张三”；

第七步，将语义解析结果中的动作词“呼叫”与动作词库中所有的动作词进行匹配；

第八步，判定动作词匹配成功，调取拨号程序中自带的通讯录，并将语义解析结果中的目标词“张三”与该通讯录中所有的联系人进行匹配；

第九步，判定目标词匹配成功，将语义解析结果中的前缀关键词“直接”与前缀关键词库中所有的前缀关键词进行匹配；

第十步，判定前缀关键词匹配成功，开启拨号程序，然后根据匹配到的前缀关键词“直接”和目标词“张三”，拨号程序就会直接拨打“13000000000”这个电话号码。

本实施例中的语音快速选择方法适合在用户对目标词中的信息选项不了解或是不太了解的情况下使用。

实施例2：

如图2所示，本发明语音快速选择方法包括以下步骤：

第六步，对该文本信息文件进行语义解析，即对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理，得到语义解析结果，语义解析结果中至少包含有后缀限定词、动作词以及目标词；

下面以用户在使用车载电脑时通过语音快速选择导航路径为例对本发明语音快速选择方法作进一步的详细说明。

第一步，在车载电脑中创建一个后缀限定词库，并在该后缀限定词库中设置两个后缀限定词：“第一地址”和“第二地址”，同时在车载电脑中创建一个动作词库，并在该动作词库中设置一个动作词“导航”；

第二步，将动作词“导航”与车载电脑中的导航程序相关联；

第三步，将导航程序中自带的地址库确立为目标词库，那么该地址库中的每个地址即为目标词，而每个地址名下的每个精确导航地点都为其中一个信息选项，这里假设地址库中具有地址“浙江大学”，且“浙江大学”名下具有两个精确导航地点，其中第一个精确导航地点为“玉泉校区”，第二个精确导航地点为“紫荆港校区”；

第四步，将后缀限定词“第一地址”和“第二地址”分别与每个地址名下的第一个精确导航地点和第二个精确导航地点相关联；

第五步，开启语音识别软件，然后用户对着麦克风说：“导航到浙江大学的第二个地址”，这时语音识别软件就会采集用户说的这句语音，将该语音储存为音频文件，再将该音频文件进行提取声学特征、进行声学模型匹配等处理，最终将处理结果转换为相应的文字输出到文本信息文件中；

第六步，语音识别软件对该文本信息文件进行语义解析，即对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理，得到语义解析结果，即动作词“导航”、目标词“浙江大学”和后缀限定词“第二个地址”；

第七步，将语义解析结果中的动作词“导航”与动作词库中所有的动作词进行匹配；

第八步，判定动作词匹配成功，调取导航程序中自带的地址库，并将语义解析结果中的目标词“浙江大学”与该地址库中所有的地址进行匹配；

第九步，判定目标词匹配成功，将语义解析结果中的后缀限定词“第二个地址”与后缀限定词库中所有的后缀限定词进行匹配；

第十步，判定后缀限定词匹配成功，开启导航程序，然后根据匹配到的后缀限定词“第二个地址”和目标词“浙江大学”，导航程序就会直接生成去“紫荆港校区”的这导航路径并开始导航。

本实施例中的语音快速选择方法适合在用户对目标词中的信息选项非常熟悉或非常了解的情况下使用。

实施例3：

如图3所示，本发明语音快速选择方法包括以下步骤：

第五步，获取音频信息，并将获取的音频信息转换为文本信息文件,即采集用户的语音，再将该语音储存为音频文件，然后将该音频文件进行提取声学特征、进行声学模型匹配等处理，最终将处理结果转换为相应的文字输出到文本信息文件中；

第六步，对该文本信息文件进行语义解析，即对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理，得到语义解析结果，语义解析结果中至少包含有前缀关键词、后缀限定词、动作词以及目标词；

下面以用户在使用车载电脑时通过语音快速选择收音机频道为例对本发明语音快速选择方法作进一步的详细说明。

第一步，在车载电脑中创建一个前缀关键词库，并在该前缀关键词库中设置一个前缀关键词：“快速”和“直接”，同时在车载电脑中创建一个后缀限定词库，并在该后缀限定词库中设置三个后缀限定词：“第一个电台”、“第二个电台”和“第三个电台”，同时在车载电脑中创建一个动作词库，并在该动作词库中设置一个动作词“收听”；

第二步，将动作词“收听”与车载电脑中的收音机程序相关联；

第三步，将收音机程序中自带的波段库确立为目标词库，那么该波段库中的每个波段即为目标词，而每个波段中包含的每个电台都为其中一个信息选项，这里假设波段库中具有波段“FM”，且“FM”中具有三个电台，其中第一个电台的频率为“96MHz”，第二个电台的频率为“102MHz”，第三个电台的频率为“108MHz”；

第四步，将前缀关键词“快速”和“直接”都与每个波段中的第一个电台频率相关联，并将后缀限定词“第一个电台”、“第二个电台”和“第三个电台”分别与每个波段中的第一个电台、第二个电台和第三个电台相关联；

第五步，开启语音识别软件，然后用户对着麦克风说：“快速收听FM的第四个电台”，这时语音识别软件就会采集用户说的这句语音，将该语音储存为音频文件，再将该音频文件进行提取声学特征、进行声学模型匹配等处理，最终将处理结果转换为相应的文字输出到文本信息文件中；

第六步，语音识别软件对该文本信息文件进行语义解析，即对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理，得到语义解析结果，即动作词“收听”、目标词“FM”、前缀关键词“快速”和后缀限定词“第四个电台”；

第七步，将语义解析结果中的动作词“收听”与动作词库中所有的动作词进行匹配；

第八步，判定动作词匹配成功，调取收音机程序中自带的波段库，并将语义解析结果中的目标词“FM”与该波段库中所有的波段进行匹配；

第九步，判定目标词匹配成功，将语义解析结果中的后缀限定词“第四个电台”与后缀限定词库中所有的后缀限定词进行匹配；

第十步，判定后缀限定词匹配不成功，将语义解析结果中的前缀关键词“快速”与前缀关键词库中所有的前缀关键词进行匹配；

第十一步，判定前缀关键词匹配成功，开启收音机程序，然后根据匹配到的前缀关键词“快速”和目标词“FM”，收音机程序就会直接播放FM波段中的第一个电台，即频率为“96MHz”的电台。

本实施例中的语音快速选择方法不但适合在用户对目标词中的信息选项不了解或是不太了解的情况下使用，而且也适合在用户对目标词中的信息选项非常熟悉或非常了解的情况下使用。

以上的实施例仅仅是对本发明的优选实施方式进行描述，并非对本发明的范围进行限定，在不脱离本发明设计精神的前提下，本领域普通技术人员对本发明的技术方案作出的各种变形和改进，均应落入本发明权利要求书确定的保护范围内。

Claims

1.一种语音快速选择方法，其特征在于：它包括以下步骤：

2.根据权利要求1所述的语音快速选择方法，其特征在于：第五步具体是指：采集用户的语音，再将该语音储存为音频文件，然后将该音频文件进行提取声学特征、进行声学模型匹配等处理，最终将处理结果转换为相应的文字输出到文本信息文件中。

3.根据权利要求1或2所述的语音快速选择方法，其特征在于：第六步中的“对该文本信息文件进行语义解析”是指，对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理。

4.一种语音快速选择方法，其特征在于：它包括以下步骤：

5.根据权利要求4所述的语音快速选择方法，其特征在于：第五步具体是指：采集用户的语音，再将该语音储存为音频文件，然后将该音频文件进行提取声学特征、进行声学模型匹配等处理，最终将处理结果转换为相应的文字输出到文本信息文件中。

6.根据权利要求4或5所述的语音快速选择方法，其特征在于：第六步中的“对该文本信息文件进行语义解析”是指，对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理。

7.一种语音快速选择方法，其特征在于：它包括以下步骤：

8.根据权利要求7所述的语音快速选择方法，其特征在于：第五步具体是指：采集用户的语音，再将该语音储存为音频文件，然后将该音频文件进行提取声学特征、进行声学模型匹配等处理，最终将处理结果转换为相应的文字输出到文本信息文件中。

9.根据权利要求7或8所述的语音快速选择方法，其特征在于：第六步中的“对该文本信息文件进行语义解析”是指，对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理。