CN105426357A - 语音快速选择方法 - Google Patents
语音快速选择方法 Download PDFInfo
- Publication number
- CN105426357A CN105426357A CN201510749516.0A CN201510749516A CN105426357A CN 105426357 A CN105426357 A CN 105426357A CN 201510749516 A CN201510749516 A CN 201510749516A CN 105426357 A CN105426357 A CN 105426357A
- Authority
- CN
- China
- Prior art keywords
- information
- word
- action
- target
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010187 selection method Methods 0.000 title abstract 2
- 238000000034 method Methods 0.000 claims abstract description 68
- 230000008878 coupling Effects 0.000 claims description 43
- 238000010168 coupling process Methods 0.000 claims description 43
- 238000005859 coupling reaction Methods 0.000 claims description 43
- 238000000605 extraction Methods 0.000 claims description 12
- 230000009191 jumping Effects 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 241000246150 Cercis Species 0.000 description 2
- 235000006228 Cercis occidentalis Nutrition 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及语音快速选择方法,它包括以下步骤:创建前缀关键词库、动作词库及后缀限定词库;将每个动作词分别与一个应用程序相关联;在每个应用程序中确立一个目标词库,将所有前缀关键词都与每个目标词中的其中一个信息选项相关联,并将所有后缀限定词分别与每个目标词中的其中一个信息选项相关联;获取音频信息,并将获取的音频信息转换为文本信息文件;对该文本信息文件进行语义解析,得到语义解析结果;将语义解析结果依次与动作词、目标词、后缀限定词和前缀关键词进行匹配;根据匹配结果让相关应用程序执行相关操作。注重用户的使用环境,能够快速地筛选出用户所需要的词选项,无需让用户进行二次选择,从而大大方便了用户使用智能设备。
Description
技术领域
本发明涉及通讯技术领域,特别是一种语音快速选择方法。
背景技术
随着语音识别技术的发展,越来越多的智能设备开始倾向于通过语音和使用者建立交互渠道,如现有的手机、车载平板、智能手表、智能手环等通常都附带有语音选择系统,通过语音选择系统,人们不需要低头看智能设备,也不需要对智能设备进行手动物理按键操作,只需以语音命令的形式即可实现对智能设备的操作,从而摆脱了传统点击屏幕或按键的繁琐操作,将控制智能设备操作以更加方便、快捷、准确和智能的方式实现。但是,目前现有的语音选择方法在使用时都没有注重用户的使用环境,使得这些语音选择方法在某些特定的使用环境中使用仍然存在较为繁琐之处,例如:需要打电话时,若手机通讯录中的某个联系人对应有多个号码,那么当用户说出“打电话给某某”时,语音选择系统通常会将所有匹配到的号码都筛选出来,然后问用户选择拨打哪一个,而若此时用户正在开车或骑车,那么上述方法不但会让用户觉得繁琐,而且用户的注意力还难免会被选择拨打哪一个号码的提示语音所吸引,从而产生开车或骑车安全隐患。
发明内容
本发明要解决的一个技术问题是,提供一种注重用户的使用环境,使用更为方便的语音快速选择方法。
为解决上述技术问题,本发明的第一种技术方案是:提供一种语音快速选择方法,其中,它包括以下步骤:
第一步,在智能设备中创建一个前缀关键词库,并在该前缀关键词库中设置至少一个前缀关键词,同时在智能设备中创建一个动作词库,并在该动作词库中设置至少一个动作词;
第二步,将每个动作词分别与智能设备中的其中一个应用程序相关联;
第三步,在与动作词相关联的每个应用程序中确立一个目标词库,每个目标词库在至少包含有一个目标词,每个目标词中至少包含有一个信息选项;
第四步,将所有前缀关键词都与每个目标词中的其中一个信息选项相关联;
第五步,获取音频信息,并将获取的音频信息转换为文本信息文件;
第六步,对该文本信息文件进行语义解析,得到语义解析结果,语义解析结果中至少包含有前缀关键词、动作词以及目标词;
第七步,将语义解析结果中的动作词与动作词库中所有的动作词进行匹配;
第八步,判别动作词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词调取与该动作词相关联的应用程序中确立的目标词库,并将语义解析结果中的目标词与该目标词库中所有的目标词进行匹配;
第九步,判别目标词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则将语义解析结果中的前缀关键词与前缀关键词库中所有的前缀关键词进行匹配;
第十步,判别前缀关键词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词开启与该动作词相关联的应用程序,再根据匹配到的目标词和前缀关键词让应用程序执行相关操作。
本发明所述的语音快速选择方法,其中,第五步具体是指:采集用户的语音,再将该语音储存为音频文件,然后将该音频文件进行提取声学特征、进行声学模型匹配等处理,最终将处理结果转换为相应的文字输出到文本信息文件中。
本发明所述的语音快速选择方法,其中,第六步中的“对该文本信息文件进行语义解析”是指,对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理。
本发明的第二种技术方案是:提供一种语音快速选择方法,其中,它包括以下步骤:
第一步,在智能设备中创建一个后缀限定词库,并在该后缀限定词库中设置至少一个后缀限定词,同时在智能设备中创建一个动作词库,并在该动作词库中设置至少一个动作词;
第二步,将每个动作词分别与智能设备中的其中一个应用程序相关联;
第三步,在与动作词相关联的每个应用程序中确立一个目标词库,每个目标词库在至少包含有一个目标词,每个目标词中至少包含有一个信息选项;
第四步,将所有后缀限定词分别与每个目标词中的其中一个信息选项相关联;
第五步,获取音频信息,并将获取的音频信息转换为文本信息文件;
第六步,对该文本信息文件进行语义解析,得到语义解析结果,语义解析结果中至少包含有后缀限定词、动作词以及目标词;
第七步,将语义解析结果中的动作词与动作词库中所有的动作词进行匹配;
第八步,判别动作词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词调取与该动作词相关联的应用程序中确立的目标词库,并将语义解析结果中的目标词与该目标词库中所有的目标词进行匹配;
第九步,判别目标词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则将语义解析结果中的后缀限定词与后缀限定词库中所有的后缀限定词进行匹配;
第十步,判别后缀限定词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词开启与该动作词相关联的应用程序,再根据匹配到的目标词和后缀限定词让应用程序执行相关操作。
本发明所述的语音快速选择方法,其中,第五步具体是指:采集用户的语音,再将该语音储存为音频文件,然后将该音频文件进行提取声学特征、进行声学模型匹配等处理,最终将处理结果转换为相应的文字输出到文本信息文件中。
本发明所述的语音快速选择方法,其中,第六步中的“对该文本信息文件进行语义解析”是指,对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理。
本发明的第三种技术方案是:提供一种语音快速选择方法,其中,它包括以下步骤:
第一步,在智能设备中创建一个前缀关键词库,并在该前缀关键词库中设置至少一个前缀关键词,同时在智能设备中创建一个后缀限定词库,并在该后缀限定词库中设置至少一个后缀限定词,同时在智能设备中创建一个动作词库,并在该动作词库中设置至少一个动作词;
第二步,将每个动作词分别与智能设备中的其中一个应用程序相关联;
第三步,在与动作词相关联的每个应用程序中确立一个目标词库,每个目标词库在至少包含有一个目标词,每个目标词中至少包含有一个信息选项;
第四步,将所有前缀关键词都与每个目标词中的其中一个信息选项相关联,并将所有后缀限定词分别与每个目标词中的其中一个信息选项相关联;
第五步,获取音频信息,并将获取的音频信息转换为文本信息文件;
第六步,对该文本信息文件进行语义解析,得到语义解析结果,语义解析结果中至少包含有前缀关键词、后缀限定词、动作词以及目标词;
第七步,将语义解析结果中的动作词与动作词库中所有的动作词进行匹配;
第八步,判别动作词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词调取与该动作词相关联的应用程序中确立的目标词库,并将语义解析结果中的目标词与该目标词库中所有的目标词进行匹配;
第九步,判别目标词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则将语义解析结果中的后缀限定词与后缀限定词库中所有的后缀限定词进行匹配;
第十步,判别后缀限定词匹配是否成功,若成功,则根据匹配到的动作词开启与该动作词相关联的应用程序,再根据匹配到的目标词和后缀限定词让应用程序执行相关操作,若不成功则将语义解析结果中的前缀关键词与前缀关键词库中所有的前缀关键词进行匹配;
第十一步,判别前缀关键词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词开启与该动作词相关联的应用程序,再根据匹配到的目标词和前缀关键词让应用程序执行相关操作。
本发明所述的语音快速选择方法,其中,第五步具体是指:采集用户的语音,再将该语音储存为音频文件,然后将该音频文件进行提取声学特征、进行声学模型匹配等处理,最终将处理结果转换为相应的文字输出到文本信息文件中。
本发明所述的语音快速选择方法,其中,第六步中的“对该文本信息文件进行语义解析”是指,对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理。
与现有技术相比,本发明的有益效果是:本发明语音快速选择方法注重用户的使用环境,它通过增加前缀关键词和/或后缀限定词,并将它们分别与得到的语义解析结果进行匹配,从而能够快速地筛选出目标词库内每个目标词中用户所需要的信息选项并执行相关操作,而无需再让用户进行二次选择,从而大大方便了用户使用智能设备。
附图说明
图1是本发明语音快速选择方法中实施例1的流程图;
图2是本发明语音快速选择方法中实施例2的流程图;
图3是本发明语音快速选择方法中实施例3的流程图。
具体实施方式
下面结合具体实施方式对本发明语音快速选择方法作进一步的详细说明。
实施例1:
如图1所示,本发明语音快速选择方法包括以下步骤:
第一步,在智能设备中创建一个前缀关键词库,并在该前缀关键词库中设置至少一个前缀关键词,同时在智能设备中创建一个动作词库,并在该动作词库中设置至少一个动作词;
第二步,将每个动作词分别与智能设备中的其中一个应用程序相关联;
第三步,在与动作词相关联的每个应用程序中确立一个目标词库,每个目标词库在至少包含有一个目标词,每个目标词中至少包含有一个信息选项;
第四步,将所有前缀关键词都与每个目标词中的其中一个信息选项相关联;
第五步,获取音频信息,并将获取的音频信息转换为文本信息文件,即采集用户的语音,再将该语音储存为音频文件,然后将该音频文件进行提取声学特征、进行声学模型匹配等处理,最终将处理结果转换为相应的文字输出到文本信息文件中;
第六步,对该文本信息文件进行语义解析,即对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理,得到语义解析结果,语义解析结果中至少包含有前缀关键词、动作词以及目标词;
第七步,将语义解析结果中的动作词与动作词库中所有的动作词进行匹配;
第八步,判别动作词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词调取与该动作词相关联的应用程序中确立的目标词库,并将语义解析结果中的目标词与该目标词库中所有的目标词进行匹配;
第九步,判别目标词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则将语义解析结果中的前缀关键词与前缀关键词库中所有的前缀关键词进行匹配;
第十步,判别前缀关键词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词开启与该动作词相关联的应用程序,再根据匹配到的目标词和前缀关键词让应用程序执行相关操作。
下面以用户在使用手机时通过语音快速选择某个联系人的其中一个电话号码进行拨号为例对本发明语音快速选择方法作进一步的详细说明。
第一步,在手机中创建一个前缀关键词库,并在该前缀关键词库中设置两个前缀关键词:“马上”和“直接”;同时在手机中创建一个动作词库,并在该动作词库中设置一个动作词:“呼叫”;
第二步,将动作词“呼叫”与手机中的拨号程序相关联;
第三步,将拨号程序中自带的通讯录确立为目标词库,那么该通讯录中的每个联系人即为目标词,而每个联系人名下的每个电话号码都为其中一个信息选项,这里假设通讯录中具有联系人“张三”,且“张三”名下具有两个电话号码,其中第一个电话号码为“13000000000”,第二个电话号码为“13800000000”;
第四步,将两个前缀关键词“马上”和“直接”都与每个联系人名下的第一个电话号码相关联;
第五步,开启语音识别软件,然后用户对着麦克风说:“直接呼叫张三”,这时语音识别软件就会采集用户说的这句语音,将该语音储存为音频文件,再将该音频文件进行提取声学特征、进行声学模型匹配等处理,最终将处理结果转换为相应的文字输出到文本信息文件中;
第六步,语音识别软件对该文本信息文件进行语义解析,即对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理,得到语义解析结果,即前缀关键词“直接”,动作词“呼叫”和目标词“张三”;
第七步,将语义解析结果中的动作词“呼叫”与动作词库中所有的动作词进行匹配;
第八步,判定动作词匹配成功,调取拨号程序中自带的通讯录,并将语义解析结果中的目标词“张三”与该通讯录中所有的联系人进行匹配;
第九步,判定目标词匹配成功,将语义解析结果中的前缀关键词“直接”与前缀关键词库中所有的前缀关键词进行匹配;
第十步,判定前缀关键词匹配成功,开启拨号程序,然后根据匹配到的前缀关键词“直接”和目标词“张三”,拨号程序就会直接拨打“13000000000”这个电话号码。
本实施例中的语音快速选择方法适合在用户对目标词中的信息选项不了解或是不太了解的情况下使用。
实施例2:
如图2所示,本发明语音快速选择方法包括以下步骤:
第一步,在智能设备中创建一个后缀限定词库,并在该后缀限定词库中设置至少一个后缀限定词,同时在智能设备中创建一个动作词库,并在该动作词库中设置至少一个动作词;
第二步,将每个动作词分别与智能设备中的其中一个应用程序相关联;
第三步,在与动作词相关联的每个应用程序中确立一个目标词库,每个目标词库在至少包含有一个目标词,每个目标词中至少包含有一个信息选项;
第四步,将所有后缀限定词分别与每个目标词中的其中一个信息选项相关联;
第五步,获取音频信息,并将获取的音频信息转换为文本信息文件,即采集用户的语音,再将该语音储存为音频文件,然后将该音频文件进行提取声学特征、进行声学模型匹配等处理,最终将处理结果转换为相应的文字输出到文本信息文件中;
第六步,对该文本信息文件进行语义解析,即对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理,得到语义解析结果,语义解析结果中至少包含有后缀限定词、动作词以及目标词;
第七步,将语义解析结果中的动作词与动作词库中所有的动作词进行匹配;
第八步,判别动作词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词调取与该动作词相关联的应用程序中确立的目标词库,并将语义解析结果中的目标词与该目标词库中所有的目标词进行匹配;
第九步,判别目标词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则将语义解析结果中的后缀限定词与后缀限定词库中所有的后缀限定词进行匹配;
第十步,判别后缀限定词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词开启与该动作词相关联的应用程序,再根据匹配到的目标词和后缀限定词让应用程序执行相关操作。
下面以用户在使用车载电脑时通过语音快速选择导航路径为例对本发明语音快速选择方法作进一步的详细说明。
第一步,在车载电脑中创建一个后缀限定词库,并在该后缀限定词库中设置两个后缀限定词:“第一地址”和“第二地址”,同时在车载电脑中创建一个动作词库,并在该动作词库中设置一个动作词“导航”;
第二步,将动作词“导航”与车载电脑中的导航程序相关联;
第三步,将导航程序中自带的地址库确立为目标词库,那么该地址库中的每个地址即为目标词,而每个地址名下的每个精确导航地点都为其中一个信息选项,这里假设地址库中具有地址“浙江大学”,且“浙江大学”名下具有两个精确导航地点,其中第一个精确导航地点为“玉泉校区”,第二个精确导航地点为“紫荆港校区”;
第四步,将后缀限定词“第一地址”和“第二地址”分别与每个地址名下的第一个精确导航地点和第二个精确导航地点相关联;
第五步,开启语音识别软件,然后用户对着麦克风说:“导航到浙江大学的第二个地址”,这时语音识别软件就会采集用户说的这句语音,将该语音储存为音频文件,再将该音频文件进行提取声学特征、进行声学模型匹配等处理,最终将处理结果转换为相应的文字输出到文本信息文件中;
第六步,语音识别软件对该文本信息文件进行语义解析,即对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理,得到语义解析结果,即动作词“导航”、目标词“浙江大学”和后缀限定词“第二个地址”;
第七步,将语义解析结果中的动作词“导航”与动作词库中所有的动作词进行匹配;
第八步,判定动作词匹配成功,调取导航程序中自带的地址库,并将语义解析结果中的目标词“浙江大学”与该地址库中所有的地址进行匹配;
第九步,判定目标词匹配成功,将语义解析结果中的后缀限定词“第二个地址”与后缀限定词库中所有的后缀限定词进行匹配;
第十步,判定后缀限定词匹配成功,开启导航程序,然后根据匹配到的后缀限定词“第二个地址”和目标词“浙江大学”,导航程序就会直接生成去“紫荆港校区”的这导航路径并开始导航。
本实施例中的语音快速选择方法适合在用户对目标词中的信息选项非常熟悉或非常了解的情况下使用。
实施例3:
如图3所示,本发明语音快速选择方法包括以下步骤:
第一步,在智能设备中创建一个前缀关键词库,并在该前缀关键词库中设置至少一个前缀关键词,同时在智能设备中创建一个后缀限定词库,并在该后缀限定词库中设置至少一个后缀限定词,同时在智能设备中创建一个动作词库,并在该动作词库中设置至少一个动作词;
第二步,将每个动作词分别与智能设备中的其中一个应用程序相关联;
第三步,在与动作词相关联的每个应用程序中确立一个目标词库,每个目标词库在至少包含有一个目标词,每个目标词中至少包含有一个信息选项;
第四步,将所有前缀关键词都与每个目标词中的其中一个信息选项相关联,并将所有后缀限定词分别与每个目标词中的其中一个信息选项相关联;
第五步,获取音频信息,并将获取的音频信息转换为文本信息文件,即采集用户的语音,再将该语音储存为音频文件,然后将该音频文件进行提取声学特征、进行声学模型匹配等处理,最终将处理结果转换为相应的文字输出到文本信息文件中;
第六步,对该文本信息文件进行语义解析,即对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理,得到语义解析结果,语义解析结果中至少包含有前缀关键词、后缀限定词、动作词以及目标词;
第七步,将语义解析结果中的动作词与动作词库中所有的动作词进行匹配;
第八步,判别动作词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词调取与该动作词相关联的应用程序中确立的目标词库,并将语义解析结果中的目标词与该目标词库中所有的目标词进行匹配;
第九步,判别目标词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则将语义解析结果中的后缀限定词与后缀限定词库中所有的后缀限定词进行匹配;
第十步,判别后缀限定词匹配是否成功,若成功,则根据匹配到的动作词开启与该动作词相关联的应用程序,再根据匹配到的目标词和后缀限定词让应用程序执行相关操作,若不成功则将语义解析结果中的前缀关键词与前缀关键词库中所有的前缀关键词进行匹配;
第十一步,判别前缀关键词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词开启与该动作词相关联的应用程序,再根据匹配到的目标词和前缀关键词让应用程序执行相关操作。
下面以用户在使用车载电脑时通过语音快速选择收音机频道为例对本发明语音快速选择方法作进一步的详细说明。
第一步,在车载电脑中创建一个前缀关键词库,并在该前缀关键词库中设置一个前缀关键词:“快速”和“直接”,同时在车载电脑中创建一个后缀限定词库,并在该后缀限定词库中设置三个后缀限定词:“第一个电台”、“第二个电台”和“第三个电台”,同时在车载电脑中创建一个动作词库,并在该动作词库中设置一个动作词“收听”;
第二步,将动作词“收听”与车载电脑中的收音机程序相关联;
第三步,将收音机程序中自带的波段库确立为目标词库,那么该波段库中的每个波段即为目标词,而每个波段中包含的每个电台都为其中一个信息选项,这里假设波段库中具有波段“FM”,且“FM”中具有三个电台,其中第一个电台的频率为“96MHz”,第二个电台的频率为“102MHz”,第三个电台的频率为“108MHz”;
第四步,将前缀关键词“快速”和“直接”都与每个波段中的第一个电台频率相关联,并将后缀限定词“第一个电台”、“第二个电台”和“第三个电台”分别与每个波段中的第一个电台、第二个电台和第三个电台相关联;
第五步,开启语音识别软件,然后用户对着麦克风说:“快速收听FM的第四个电台”,这时语音识别软件就会采集用户说的这句语音,将该语音储存为音频文件,再将该音频文件进行提取声学特征、进行声学模型匹配等处理,最终将处理结果转换为相应的文字输出到文本信息文件中;
第六步,语音识别软件对该文本信息文件进行语义解析,即对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理,得到语义解析结果,即动作词“收听”、目标词“FM”、前缀关键词“快速”和后缀限定词“第四个电台”;
第七步,将语义解析结果中的动作词“收听”与动作词库中所有的动作词进行匹配;
第八步,判定动作词匹配成功,调取收音机程序中自带的波段库,并将语义解析结果中的目标词“FM”与该波段库中所有的波段进行匹配;
第九步,判定目标词匹配成功,将语义解析结果中的后缀限定词“第四个电台”与后缀限定词库中所有的后缀限定词进行匹配;
第十步,判定后缀限定词匹配不成功,将语义解析结果中的前缀关键词“快速”与前缀关键词库中所有的前缀关键词进行匹配;
第十一步,判定前缀关键词匹配成功,开启收音机程序,然后根据匹配到的前缀关键词“快速”和目标词“FM”,收音机程序就会直接播放FM波段中的第一个电台,即频率为“96MHz”的电台。
本实施例中的语音快速选择方法不但适合在用户对目标词中的信息选项不了解或是不太了解的情况下使用,而且也适合在用户对目标词中的信息选项非常熟悉或非常了解的情况下使用。
以上的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (9)
1.一种语音快速选择方法,其特征在于:它包括以下步骤:
第一步,在智能设备中创建一个前缀关键词库,并在该前缀关键词库中设置至少一个前缀关键词,同时在智能设备中创建一个动作词库,并在该动作词库中设置至少一个动作词;
第二步,将每个动作词分别与智能设备中的其中一个应用程序相关联;
第三步,在与动作词相关联的每个应用程序中确立一个目标词库,每个目标词库在至少包含有一个目标词,每个目标词中至少包含有一个信息选项;
第四步,将所有前缀关键词都与每个目标词中的其中一个信息选项相关联;
第五步,获取音频信息,并将获取的音频信息转换为文本信息文件;
第六步,对该文本信息文件进行语义解析,得到语义解析结果,语义解析结果中至少包含有前缀关键词、动作词以及目标词;
第七步,将语义解析结果中的动作词与动作词库中所有的动作词进行匹配;
第八步,判别动作词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词调取与该动作词相关联的应用程序中确立的目标词库,并将语义解析结果中的目标词与该目标词库中所有的目标词进行匹配;
第九步,判别目标词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则将语义解析结果中的前缀关键词与前缀关键词库中所有的前缀关键词进行匹配;
第十步,判别前缀关键词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词开启与该动作词相关联的应用程序,再根据匹配到的目标词和前缀关键词让应用程序执行相关操作。
2.根据权利要求1所述的语音快速选择方法,其特征在于:第五步具体是指:采集用户的语音,再将该语音储存为音频文件,然后将该音频文件进行提取声学特征、进行声学模型匹配等处理,最终将处理结果转换为相应的文字输出到文本信息文件中。
3.根据权利要求1或2所述的语音快速选择方法,其特征在于:第六步中的“对该文本信息文件进行语义解析”是指,对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理。
4.一种语音快速选择方法,其特征在于:它包括以下步骤:
第一步,在智能设备中创建一个后缀限定词库,并在该后缀限定词库中设置至少一个后缀限定词,同时在智能设备中创建一个动作词库,并在该动作词库中设置至少一个动作词;
第二步,将每个动作词分别与智能设备中的其中一个应用程序相关联;
第三步,在与动作词相关联的每个应用程序中确立一个目标词库,每个目标词库在至少包含有一个目标词,每个目标词中至少包含有一个信息选项;
第四步,将所有后缀限定词分别与每个目标词中的其中一个信息选项相关联;
第五步,获取音频信息,并将获取的音频信息转换为文本信息文件;
第六步,对该文本信息文件进行语义解析,得到语义解析结果,语义解析结果中至少包含有后缀限定词、动作词以及目标词;
第七步,将语义解析结果中的动作词与动作词库中所有的动作词进行匹配;
第八步,判别动作词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词调取与该动作词相关联的应用程序中确立的目标词库,并将语义解析结果中的目标词与该目标词库中所有的目标词进行匹配;
第九步,判别目标词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则将语义解析结果中的后缀限定词与后缀限定词库中所有的后缀限定词进行匹配;
第十步,判别后缀限定词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词开启与该动作词相关联的应用程序,再根据匹配到的目标词和后缀限定词让应用程序执行相关操作。
5.根据权利要求4所述的语音快速选择方法,其特征在于:第五步具体是指:采集用户的语音,再将该语音储存为音频文件,然后将该音频文件进行提取声学特征、进行声学模型匹配等处理,最终将处理结果转换为相应的文字输出到文本信息文件中。
6.根据权利要求4或5所述的语音快速选择方法,其特征在于:第六步中的“对该文本信息文件进行语义解析”是指,对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理。
7.一种语音快速选择方法,其特征在于:它包括以下步骤:
第一步,在智能设备中创建一个前缀关键词库,并在该前缀关键词库中设置至少一个前缀关键词,同时在智能设备中创建一个后缀限定词库,并在该后缀限定词库中设置至少一个后缀限定词,同时在智能设备中创建一个动作词库,并在该动作词库中设置至少一个动作词;
第二步,将每个动作词分别与智能设备中的其中一个应用程序相关联;
第三步,在与动作词相关联的每个应用程序中确立一个目标词库,每个目标词库在至少包含有一个目标词,每个目标词中至少包含有一个信息选项;
第四步,将所有前缀关键词都与每个目标词中的其中一个信息选项相关联,并将所有后缀限定词分别与每个目标词中的其中一个信息选项相关联;
第五步,获取音频信息,并将获取的音频信息转换为文本信息文件;
第六步,对该文本信息文件进行语义解析,得到语义解析结果,语义解析结果中至少包含有前缀关键词、后缀限定词、动作词以及目标词;
第七步,将语义解析结果中的动作词与动作词库中所有的动作词进行匹配;
第八步,判别动作词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词调取与该动作词相关联的应用程序中确立的目标词库,并将语义解析结果中的目标词与该目标词库中所有的目标词进行匹配;
第九步,判别目标词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则将语义解析结果中的后缀限定词与后缀限定词库中所有的后缀限定词进行匹配;
第十步,判别后缀限定词匹配是否成功,若成功,则根据匹配到的动作词开启与该动作词相关联的应用程序,再根据匹配到的目标词和后缀限定词让应用程序执行相关操作,若不成功则将语义解析结果中的前缀关键词与前缀关键词库中所有的前缀关键词进行匹配;
第十一步,判别前缀关键词匹配是否成功,若不成功,则生成未匹配成功的提示信息通知用户,并跳转至“获取语音输入信息,并将获取的语音输入信息转换为文本信息文件”步骤,生成的提示信息至少包括语音提示信息,若成功,则根据匹配到的动作词开启与该动作词相关联的应用程序,再根据匹配到的目标词和前缀关键词让应用程序执行相关操作。
8.根据权利要求7所述的语音快速选择方法,其特征在于:第五步具体是指:采集用户的语音,再将该语音储存为音频文件,然后将该音频文件进行提取声学特征、进行声学模型匹配等处理,最终将处理结果转换为相应的文字输出到文本信息文件中。
9.根据权利要求7或8所述的语音快速选择方法,其特征在于:第六步中的“对该文本信息文件进行语义解析”是指,对该文本信息文件进行分词、词性标注、句法分析、语义模型归类处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510749516.0A CN105426357A (zh) | 2015-11-06 | 2015-11-06 | 语音快速选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510749516.0A CN105426357A (zh) | 2015-11-06 | 2015-11-06 | 语音快速选择方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105426357A true CN105426357A (zh) | 2016-03-23 |
Family
ID=55504571
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510749516.0A Pending CN105426357A (zh) | 2015-11-06 | 2015-11-06 | 语音快速选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105426357A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106023993A (zh) * | 2016-07-29 | 2016-10-12 | 西安旭天电子科技有限公司 | 基于自然语言的机器人控制系统及控制方法 |
CN106649427A (zh) * | 2016-08-08 | 2017-05-10 | 中国移动通信集团湖北有限公司 | 一种信息识别的方法及装置 |
CN106847284A (zh) * | 2017-03-09 | 2017-06-13 | 深圳市八圈科技有限公司 | 电子设备、计算机可读存储介质及语音交互方法 |
WO2017206133A1 (zh) * | 2016-06-02 | 2017-12-07 | 深圳市智物联网络有限公司 | 语音识别方法及装置 |
CN107799116A (zh) * | 2016-08-31 | 2018-03-13 | 科大讯飞股份有限公司 | 多轮交互并行语义理解方法和装置 |
WO2018205704A1 (zh) * | 2017-05-10 | 2018-11-15 | 平安科技(深圳)有限公司 | 电子装置、智能语音导航方法及计算机可读存储介质 |
CN109213470A (zh) * | 2018-09-11 | 2019-01-15 | 昆明理工大学 | 一种基于语音识别的光标控制方法 |
CN110534113A (zh) * | 2019-08-26 | 2019-12-03 | 深圳追一科技有限公司 | 音频数据脱敏方法、装置、设备和存储介质 |
CN110825840A (zh) * | 2019-11-08 | 2020-02-21 | 北京声智科技有限公司 | 词库扩充方法、装置、设备及存储介质 |
CN112614491A (zh) * | 2020-12-11 | 2021-04-06 | 广州橙行智动汽车科技有限公司 | 一种车载语音交互方法、装置、车辆、可读介质 |
CN112862458A (zh) * | 2021-03-02 | 2021-05-28 | 岭东核电有限公司 | 核电试验工序监管方法、装置、计算机设备和存储介质 |
CN113470645A (zh) * | 2021-06-30 | 2021-10-01 | 百度在线网络技术(北京)有限公司 | 呼叫处理的方法、装置、设备以及存储介质 |
US11152007B2 (en) | 2018-12-07 | 2021-10-19 | Baidu Online Network Technology Co., Ltd. | Method, and device for matching speech with text, and computer-readable storage medium |
CN114155855A (zh) * | 2021-12-17 | 2022-03-08 | 海信视像科技股份有限公司 | 语音识别方法、服务器以及电子设备 |
CN117877478A (zh) * | 2024-01-15 | 2024-04-12 | 广州小鹏汽车科技有限公司 | 语音交互方法、服务器及可读存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1494026A (zh) * | 2002-10-31 | 2004-05-05 | 英业达股份有限公司 | 具有语音辨识辅助功能的中文输入方法及其系统 |
CN102521229A (zh) * | 2011-11-01 | 2012-06-27 | 华为终端有限公司 | 一种获取应用程序的方法及设备 |
CN103280217A (zh) * | 2013-05-02 | 2013-09-04 | 锤子科技(北京)有限公司 | 一种移动终端的语音识别方法及其装置 |
US20130332172A1 (en) * | 2012-06-08 | 2013-12-12 | Apple Inc. | Transmitting data from an automated assistant to an accessory |
CN103959751A (zh) * | 2011-09-30 | 2014-07-30 | 苹果公司 | 自动调整用户界面以用于免提交互 |
CN104202455A (zh) * | 2014-08-30 | 2014-12-10 | 北京光年无限科技有限公司 | 智能语音拨号的方法及装置 |
CN104282301A (zh) * | 2013-07-09 | 2015-01-14 | 安徽科大讯飞信息科技股份有限公司 | 一种语音命令处理方法以及系统 |
CN104301500A (zh) * | 2013-07-16 | 2015-01-21 | 中兴通讯股份有限公司 | 一种终端控制方法、装置和终端 |
CN104380254A (zh) * | 2014-06-11 | 2015-02-25 | 华为技术有限公司 | 快速启动应用服务的方法和终端 |
CN104969289A (zh) * | 2013-02-07 | 2015-10-07 | 苹果公司 | 数字助理的语音触发器 |
-
2015
- 2015-11-06 CN CN201510749516.0A patent/CN105426357A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1494026A (zh) * | 2002-10-31 | 2004-05-05 | 英业达股份有限公司 | 具有语音辨识辅助功能的中文输入方法及其系统 |
CN103959751A (zh) * | 2011-09-30 | 2014-07-30 | 苹果公司 | 自动调整用户界面以用于免提交互 |
CN102521229A (zh) * | 2011-11-01 | 2012-06-27 | 华为终端有限公司 | 一种获取应用程序的方法及设备 |
US20130332172A1 (en) * | 2012-06-08 | 2013-12-12 | Apple Inc. | Transmitting data from an automated assistant to an accessory |
CN104969289A (zh) * | 2013-02-07 | 2015-10-07 | 苹果公司 | 数字助理的语音触发器 |
CN103280217A (zh) * | 2013-05-02 | 2013-09-04 | 锤子科技(北京)有限公司 | 一种移动终端的语音识别方法及其装置 |
CN104282301A (zh) * | 2013-07-09 | 2015-01-14 | 安徽科大讯飞信息科技股份有限公司 | 一种语音命令处理方法以及系统 |
CN104301500A (zh) * | 2013-07-16 | 2015-01-21 | 中兴通讯股份有限公司 | 一种终端控制方法、装置和终端 |
CN104380254A (zh) * | 2014-06-11 | 2015-02-25 | 华为技术有限公司 | 快速启动应用服务的方法和终端 |
CN104202455A (zh) * | 2014-08-30 | 2014-12-10 | 北京光年无限科技有限公司 | 智能语音拨号的方法及装置 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017206133A1 (zh) * | 2016-06-02 | 2017-12-07 | 深圳市智物联网络有限公司 | 语音识别方法及装置 |
CN106023993A (zh) * | 2016-07-29 | 2016-10-12 | 西安旭天电子科技有限公司 | 基于自然语言的机器人控制系统及控制方法 |
CN106649427B (zh) * | 2016-08-08 | 2020-07-03 | 中国移动通信集团湖北有限公司 | 一种信息识别的方法及装置 |
CN106649427A (zh) * | 2016-08-08 | 2017-05-10 | 中国移动通信集团湖北有限公司 | 一种信息识别的方法及装置 |
CN107799116A (zh) * | 2016-08-31 | 2018-03-13 | 科大讯飞股份有限公司 | 多轮交互并行语义理解方法和装置 |
CN106847284A (zh) * | 2017-03-09 | 2017-06-13 | 深圳市八圈科技有限公司 | 电子设备、计算机可读存储介质及语音交互方法 |
WO2018205704A1 (zh) * | 2017-05-10 | 2018-11-15 | 平安科技(深圳)有限公司 | 电子装置、智能语音导航方法及计算机可读存储介质 |
CN109213470B (zh) * | 2018-09-11 | 2021-06-18 | 昆明理工大学 | 一种基于语音识别的光标控制方法 |
CN109213470A (zh) * | 2018-09-11 | 2019-01-15 | 昆明理工大学 | 一种基于语音识别的光标控制方法 |
US11152007B2 (en) | 2018-12-07 | 2021-10-19 | Baidu Online Network Technology Co., Ltd. | Method, and device for matching speech with text, and computer-readable storage medium |
CN110534113A (zh) * | 2019-08-26 | 2019-12-03 | 深圳追一科技有限公司 | 音频数据脱敏方法、装置、设备和存储介质 |
CN110825840A (zh) * | 2019-11-08 | 2020-02-21 | 北京声智科技有限公司 | 词库扩充方法、装置、设备及存储介质 |
CN112614491A (zh) * | 2020-12-11 | 2021-04-06 | 广州橙行智动汽车科技有限公司 | 一种车载语音交互方法、装置、车辆、可读介质 |
CN112614491B (zh) * | 2020-12-11 | 2024-03-08 | 广州橙行智动汽车科技有限公司 | 一种车载语音交互方法、装置、车辆、可读介质 |
CN112862458A (zh) * | 2021-03-02 | 2021-05-28 | 岭东核电有限公司 | 核电试验工序监管方法、装置、计算机设备和存储介质 |
CN113470645A (zh) * | 2021-06-30 | 2021-10-01 | 百度在线网络技术(北京)有限公司 | 呼叫处理的方法、装置、设备以及存储介质 |
CN113470645B (zh) * | 2021-06-30 | 2024-05-28 | 百度在线网络技术(北京)有限公司 | 呼叫处理的方法、装置、设备以及存储介质 |
CN114155855A (zh) * | 2021-12-17 | 2022-03-08 | 海信视像科技股份有限公司 | 语音识别方法、服务器以及电子设备 |
CN117877478A (zh) * | 2024-01-15 | 2024-04-12 | 广州小鹏汽车科技有限公司 | 语音交互方法、服务器及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105426357A (zh) | 语音快速选择方法 | |
CN104834847B (zh) | 身份验证方法及装置 | |
CN103000175A (zh) | 一种语音识别的方法及移动终端 | |
US11011170B2 (en) | Speech processing method and device | |
CN103903611B (zh) | 一种语音信息的识别方法和设备 | |
WO2016145973A1 (zh) | 一种通话过程中的语音协助方法及装置 | |
CN101576901B (zh) | 搜索请求的产生方法 | |
KR100883105B1 (ko) | 휴대단말기에서 음성인식을 이용한 다이얼링 방법 및 장치 | |
CN107274885A (zh) | 语音识别方法及相关产品 | |
CN103956168A (zh) | 一种语音识别方法、装置及终端 | |
CN104798031A (zh) | 具有连续关键词识别的免提设备 | |
CN104202455A (zh) | 智能语音拨号的方法及装置 | |
CN102566961A (zh) | 基于车载设备的应用程序的语音执行方法及装置 | |
WO2020038145A1 (zh) | 一种业务数据处理方法、装置以及相关设备 | |
CN102932539A (zh) | 一种基于语音识别通过打开应用方式解锁的终端及方法 | |
CN105049646B (zh) | 变声通话方法、装置及终端 | |
CN103106061A (zh) | 语音输入方法和装置 | |
CN102237087A (zh) | 语音控制方法和语音控制装置 | |
CN104468941A (zh) | 信息显示方法和装置 | |
CN104601202A (zh) | 基于蓝牙技术实现文件搜索的方法、终端及蓝牙设备 | |
KR101594835B1 (ko) | 음성인식 기능을 갖는 차량 및 헤드유닛과 이를 위한 음성 인식방법 | |
CN103152480A (zh) | 利用移动终端进行到站提示的方法和装置 | |
CN108509412A (zh) | 一种数据处理方法、装置、电子设备以及存储介质 | |
CN106571144A (zh) | 一种基于语音识别的搜索方法及装置 | |
CN106878535A (zh) | 移动终端位置的提醒方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160323 |
|
RJ01 | Rejection of invention patent application after publication |