[go: up one dir, main page]

CN106294306B - 一种信息处理方法及电子设备 - Google Patents

一种信息处理方法及电子设备 Download PDF

Info

Publication number
CN106294306B
CN106294306B CN201510245923.8A CN201510245923A CN106294306B CN 106294306 B CN106294306 B CN 106294306B CN 201510245923 A CN201510245923 A CN 201510245923A CN 106294306 B CN106294306 B CN 106294306B
Authority
CN
China
Prior art keywords
information
sub
text
voice
tables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510245923.8A
Other languages
English (en)
Other versions
CN106294306A (zh
Inventor
戴海生
王哲鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201510245923.8A priority Critical patent/CN106294306B/zh
Publication of CN106294306A publication Critical patent/CN106294306A/zh
Application granted granted Critical
Publication of CN106294306B publication Critical patent/CN106294306B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种信息处理方法及电子设备,所述信息处理方法包括:采集用户的语音输入,得到语音信息;按照第一预设规则对所述语音信息进行解析,得到第一子信息和第二子信息;在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息,并确定出与所述第二子信息对应的文本信息;显示输出与所述第二子信息对应的文本信息。

Description

一种信息处理方法及电子设备
技术领域
本发明涉及信息处理技术,尤其涉及一种信息处理方法及电子设备。
背景技术
随着电子设备的智能化发展,电子设备已经能够对用户的语音进行识别,并根据用户的语音输入进行相应的操作。这样,用户无需输入文本信息,只需对电子设备说出需要执行操作的内容即可,方便快捷。然而,目前的语音识别一般针对于较长的句子,对于单个的字词,电子设备的识别率还较低,且由于同音字的存在,识别出来的候选内容较多,电子设备无法执行用户想要的操作,用户体验较差。
发明内容
为解决上述技术问题,本发明实施例提供了一种信息处理方法及电子设备。
本发明实施例提供的信息处理方法应用于电子设备,所述信息处理方法包括:
采集用户的语音输入,得到语音信息;
按照第一预设规则对所述语音信息进行解析,得到第一子信息和第二子信息;
在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息,并确定出与所述第二子信息对应的文本信息;
显示输出与所述第二子信息对应的文本信息。
在本发明一实施例中,当在预定义的第一数据表中未查找到与所述第一子信息相匹配的第二子信息时,所述信息处理方法还包括:
对所述第一子信息进行语音解析,得到所述第一子信息中包括的各个语音子信息;
对所述第一子信息中包括的各个语音子信息进行文本转换,得到所述各个语音子信息对应的文本子信息;
按照预设的一条以上组合规则对各个文本子信息进行组合,得到相应的候选文本信息;
当所述候选的文本信息对应的语音信息与所述第二子信息相一致时,所述候选的文本信息为与所述第二子信息对应的文本信息。
在本发明一实施例中,所述信息处理方法还包括:
将所述第一子信息与所述第二子信息的匹配关系、以及与所述第二子信息对应的文本信息存储至预定义的所述第一数据表中。
在本发明一实施例中,所述信息处理方法还包括:
当所述第二子信息满足第一预定条件时,在第二数据表中查找与所述第一子信息对应的所有文本信息;
将查找到的所有文本信息分别转换为对应的语音信息;
将语音信息相同的文本信息划分为一类文本信息组;
分类显示输出所有的文本信息组。
在本发明一实施例中,所述信息处理方法还包括:
当所述第二子信息满足第一预定条件时,在第二数据表中查找与所述第一子信息对应的所有文本信息;
获取所述第一子信息对应的所有文本信息的使用频率;
按照使用频率由高到低的顺序依次显示输出所有的文本信息。
本发明实施例提供的电子设备包括:
语音采集单元,用于采集用户的语音输入,得到语音信息;
第一解析单元,用于按照第一预设规则对所述语音信息进行解析,得到第一子信息和第二子信息;
第一查找单元,用于在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息,并确定出与所述第二子信息对应的文本信息;
输出单元,用于显示输出与所述第二子信息对应的文本信息。
在本发明一实施例中,所述电子设备还包括:
第二解析单元,用于当所述第一查找单元在预定义的第一数据表中未查找到与所述第一子信息相匹配的第二子信息时,对所述第一子信息进行语音解析,得到所述第一子信息中包括的各个语音子信息;
语音文本转换单元,用于对所述第一子信息中包括的各个语音子信息进行文本转换,得到所述各个语音子信息对应的文本子信息;
拼字单元,用于按照预设的一条以上组合规则对各个文本子信息进行组合,得到相应的候选文本信息;
确定单元,用于当所述候选的文本信息对应的语音信息与所述第二子信息相一致时,所述候选的文本信息为与所述第二子信息对应的文本信息。
在本发明一实施例中,所述电子设备还包括:
添加单元,用于将所述第一子信息与所述第二子信息的匹配关系、以及与所述第二子信息对应的文本信息存储至预定义的所述第一数据表中。
在本发明一实施例中,所述电子设备还包括:
第二查找单元,用于当所述第二子信息满足第一预定条件时,在第二数据表中查找与所述第一子信息对应的所有文本信息;
文本语音转换单元,用于将查找到的所有文本信息分别转换为对应的语音信息;
归类单元,用于将语音信息相同的文本信息划分为一类文本信息组;
所述输出单元,还用于分类显示输出所有的文本信息组。
在本发明一实施例中,所述电子设备还包括:
第二查找单元,用于当所述第二子信息满足第一预定条件时,在第二数据表中查找与所述第一子信息对应的所有文本信息;
获取单元,用于获取所述第一子信息对应的所有文本信息的使用频率;
所述输出单元,还用于按照使用频率由高到低的顺序依次显示输出所有的文本信息。
本发明实施例的技术方案中,通过辅助词来确定用户需要的字词,具体地,可以通过拼字的方式确定用户需要的字词,也可以通过偏旁部首的方式确定用户需要的字词。电子设备首先采集用户的语音信息,该语音信息中包括了辅助词和待确定的字词,本发明实施例将辅助词称为第一子信息,将待确定的字词称为第二子信息。为了通过第一子信息确定第二子信息,本发明实施例按照第一预设规则将语音信息分离为第一子信息和第二子信息。然后,在预定义的第一数据表中查找与第一子信息匹配的第二子信息,这里,与第一子信息匹配的第二子信息可以是一个或多个;每个第二子信息均对应一文本信息。最后,显示输出第二子信息对应的文本信息。本发明实施例的技术方案能够通过拼字语音方式进行文字的输入,能够对常见的拼字说法进行支持。本发明实施例的技术方案还能够通过偏旁部首来快速确定字词;能够通过语义解析,纠正语音识别错误,从而给出正确的字词输出;能够对所有偏旁部首对应的字词和发音进行覆盖性支持;通过建立预定义的第一数据表,即热词库,从而提高对应句型的语音识别率。
附图说明
图1为本发明实施例一的信息处理方法的流程示意图;
图2为本发明实施例二的信息处理方法的流程示意图;
图3为本发明实施例三的信息处理方法的流程示意图;
图4为本发明实施例一的电子设备的结构组成示意图;
图5为本发明实施例二的电子设备的结构组成示意图;
图6为本发明实施例三的电子设备的结构组成示意图。
具体实施方式
为了能够更加详尽地了解本发明实施例的特点与技术内容,下面结合附图对本发明实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本发明实施例。
图1为本发明实施例一的信息处理方法的流程示意图,本示例中的信息处理方法应用于电子设备中,如图1所示,所述信息处理方法包括以下步骤:
步骤101:采集用户的语音输入,得到语音信息。
本发明实施例中,所述电子设备可以是手机、平板电脑、笔记本等电子设备。
本发明实施例中,所述电子设备具有麦克风,可以采集用户的语音输入。具体地,用户对电子设备说出语音内容,电子设备的麦克风采集到用户输入的语音信息。
本发明实施例中,用户输入的语音信息可以分为两大类,一类是通过拼字方式输入的语音信息,例如语音输入:立早章。另一类是通过偏旁部首描述的语音输入,例如语音输入:三点水的沙。
步骤102:按照第一预设规则对所述语音信息进行解析,得到第一子信息和第二子信息。
本发明实施例中,第一预设规则也可以分为两大类,一类是拼字规则,另一类是偏旁部首规则。例如,第一预设规则为拼字规则,一般,拼字规则时的语音输入为三字语音输入,前两个字为辅助词,最后一个字为待确定的字。因此,可以对语音信息进行解析,得到语音信息中包括的各个音节,例如解析出立早章这三个音节,将前两个音节作为第一子信息,将最后一个音节作为第二子信息。再例如,第一预设规则为偏旁部首规则,对语音信息进行解析,得到语音信息中包括的各个音节,例如解析出三点水的沙这五个音节,将前三个音节作为第一子信息,将组后一个音节作为第二子信息。
综上所述,第一子信息为辅助词,用于确定第二子信息。第一子信息可以是拼字类的辅助信息,也可以是偏旁部首类的辅助信息。
本发明实施例中,第一子信息和第二子信息均为语音信息,而非文本信息。
步骤103:在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息,并确定出与所述第二子信息对应的文本信息。
本发明实施例中,预定义的第一数据表具体为热词库,即将常用的辅助词+待确定词的匹配关系存储在第一数据表中。这里,第一数据表也可以分为两大类,一类是基于拼字规则的数据表,另一类是基于偏旁部首规则的数据表。例如,基于拼字规则的数据表:立早章、弓长张、木子李等等。再例如,基于偏旁部首规则的数据表:三点水的沙、三点水的杀、三点水的漠、三点水的沫等等。可见,与第一信息相匹配的第二子信息可以是一个,也可以是多个。最后,确定出与第二子信息对应的文本信息。
本发明实施例中,当在预定义的第一数据表中未查找到与所述第一子信息相匹配的第二子信息时,对所述第一子信息进行语音解析,得到所述第一子信息中包括的各个语音子信息;对所述第一子信息中包括的各个语音子信息进行文本转换,得到所述各个语音子信息对应的文本子信息;按照预设的一条以上组合规则对各个文本子信息进行组合,得到相应的候选文本信息;当所述候选的文本信息对应的语音信息与所述第二子信息相一致时,所述候选的文本信息为与所述第二子信息对应的文本信息。这里,各个语音子信息为第一子信息中所包含的各个音节。
上述方案中,对于不符合解析的三字语音输入,通过音字转换找出所有的前两字列表,通过拼字法,把这两个字合起来,分别进行左右结构、上下结构等所有可能结构的组合,最后通过光学字符识别(OCR,Optical Character Recognition),如果OCR识别结果符合下述要求:发音符合第三个字的发音、第三个字的笔顺和前两字的组合笔顺一致,则把新输入的第一子信息与所述第二子信息的匹配关系、以及与所述第二子信息对应的文本信息存储至预定义的所述第一数据表中,以便下次能够通过第一数据表查找到与第一子信息相匹配的第二子信息。
本发明实施例中,当所述第二子信息满足第一预定条件时,在第二数据表中查找与所述第一子信息对应的所有文本信息;将查找到的所有文本信息分别转换为对应的语音信息;将语音信息相同的文本信息划分为一类文本信息组;分类显示输出所有的文本信息组。例如,当用户输入的语音信息为三点水的字,第二子信息为字,满足第一预定条件,则此时显示所有带三点水的字。这里,第二数据表为所有字的数据表。当查找到所有带三点水的字时,将这些字为对应的语音信息,然后将语音信息发音相同的文本信息归位一类进行显示,以实现对于所有偏旁部首的覆盖性和多候选排序。例如:
ting 汀
hui 汇 洄 溃
cha 汊
shan 汕 潸
han 汗 汉 涵 瀚
xun 汛 洵 浔
ru 汝 濡 洳 溽
jiang 江 洚
chi 池
wu 污 浯
shang 汤
mi 汨
wang 汪
步骤104:显示输出与所述第二子信息对应的文本信息。
本发明实施例中,电子设备具有显示屏,利用显示屏显示输出与所述第二子信息对应的文本信息。
本发明实施例中,对于所有偏旁部首的字,分类显示输出所有的文本信息组。或者,按照使用频率由高到低的顺序依次显示输出所有的文本信息。
本发明实施例通过辅助词来确定用户需要的字词,可以通过拼字的方式确定用户需要的字词,也可以通过偏旁部首的方式确定用户需要的字词。本发明实施例的技术方案能够通过拼字语音方式进行文字的输入,能够对常见的拼字说法进行支持。本发明实施例的技术方案还能够通过偏旁部首来快速确定字词;能够通过语义解析,纠正语音识别错误,从而给出正确的字词输出;能够对所有偏旁部首对应的字词和发音进行覆盖性支持;通过建立预定义的第一数据表,即热词库,从而提高对应句型的语音识别率。
图2为本发明实施例二的信息处理方法的流程示意图,本示例中的信息处理方法应用于电子设备中,如图2所示,所述信息处理方法包括以下步骤:
步骤201:采集用户的语音输入,得到语音信息。
本发明实施例中,所述电子设备可以是手机、平板电脑、笔记本等电子设备。
本发明实施例中,所述电子设备具有麦克风,可以采集用户的语音输入。具体地,用户对电子设备说出语音内容,电子设备的麦克风采集到用户输入的语音信息。
本发明实施例中,用户输入的语音信息可以分为两大类,一类是通过拼字方式输入的语音信息,例如语音输入:立早章。另一类是通过偏旁部首描述的语音输入,例如语音输入:三点水的沙。
步骤202:按照第一预设规则对所述语音信息进行解析,得到第一子信息和第二子信息。
本发明实施例中,第一预设规则也可以分为两大类,一类是拼字规则,另一类是偏旁部首规则。例如,第一预设规则为拼字规则,一般,拼字规则时的语音输入为三字语音输入,前两个字为辅助词,最后一个字为待确定的字。因此,可以对语音信息进行解析,得到语音信息中包括的各个音节,例如解析出立早章这三个音节,将前两个音节作为第一子信息,将最后一个音节作为第二子信息。再例如,第一预设规则为偏旁部首规则,对语音信息进行解析,得到语音信息中包括的各个音节,例如解析出三点水的沙这五个音节,将前三个音节作为第一子信息,将组后一个音节作为第二子信息。
综上所述,第一子信息为辅助词,用于确定第二子信息。第一子信息可以是拼字类的辅助信息,也可以是偏旁部首类的辅助信息。
本发明实施例中,第一子信息和第二子信息均为语音信息,而非文本信息。
步骤203:在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息,并确定出与所述第二子信息对应的文本信息。
本发明实施例中,预定义的第一数据表具体为热词库,即将常用的辅助词+待确定词的匹配关系存储在第一数据表中。这里,第一数据表也可以分为两大类,一类是基于拼字规则的数据表,另一类是基于偏旁部首规则的数据表。例如,基于拼字规则的数据表:立早章、弓长张、木子李等等。再例如,基于偏旁部首规则的数据表:三点水的沙、三点水的杀、三点水的漠、三点水的沫等等。可见,与第一信息相匹配的第二子信息可以是一个,也可以是多个。最后,确定出与第二子信息对应的文本信息。
步骤204:当在预定义的第一数据表中未查找到与所述第一子信息相匹配的第二子信息时,对所述第一子信息进行语音解析,得到所述第一子信息中包括的各个语音子信息。
步骤205:对所述第一子信息中包括的各个语音子信息进行文本转换,得到所述各个语音子信息对应的文本子信息。
步骤206:按照预设的一条以上组合规则对各个文本子信息进行组合,得到相应的候选文本信息。
步骤207:当所述候选的文本信息对应的语音信息与所述第二子信息相一致时,所述候选的文本信息为与所述第二子信息对应的文本信息。
本发明实施例中,当在预定义的第一数据表中未查找到与所述第一子信息相匹配的第二子信息时,对所述第一子信息进行语音解析,得到所述第一子信息中包括的各个语音子信息;对所述第一子信息中包括的各个语音子信息进行文本转换,得到所述各个语音子信息对应的文本子信息;按照预设的一条以上组合规则对各个文本子信息进行组合,得到相应的候选文本信息;当所述候选的文本信息对应的语音信息与所述第二子信息相一致时,所述候选的文本信息为与所述第二子信息对应的文本信息。这里,各个语音子信息为第一子信息中所包含的各个音节。
上述方案中,对于不符合解析的三字语音输入,通过音字转换找出所有的前两字列表,通过拼字法,把这两个字合起来,分别进行左右结构、上下结构等所有可能结构的组合,最后通过OCR识别,如果OCR识别结果符合下述要求:发音符合第三个字的发音、第三个字的笔顺和前两字的组合笔顺一致,则把新输入的第一子信息与所述第二子信息的匹配关系、以及与所述第二子信息对应的文本信息存储至预定义的所述第一数据表中,以便下次能够通过第一数据表查找到与第一子信息相匹配的第二子信息。
步骤208:将所述第一子信息与所述第二子信息的匹配关系、以及与所述第二子信息对应的文本信息存储至预定义的所述第一数据表中。
步骤209:显示输出与所述第二子信息对应的文本信息。
本发明实施例中,电子设备具有显示屏,利用显示屏显示输出与所述第二子信息对应的文本信息。
本发明实施例中,对于所有偏旁部首的字,分类显示输出所有的文本信息组。或者,按照使用频率由高到低的顺序依次显示输出所有的文本信息。
本发明实施例通过辅助词来确定用户需要的字词,可以通过拼字的方式确定用户需要的字词,也可以通过偏旁部首的方式确定用户需要的字词。本发明实施例的技术方案能够通过拼字语音方式进行文字的输入,能够对常见的拼字说法进行支持。本发明实施例的技术方案还能够通过偏旁部首来快速确定字词;能够通过语义解析,纠正语音识别错误,从而给出正确的字词输出;能够对所有偏旁部首对应的字词和发音进行覆盖性支持;通过建立预定义的第一数据表,即热词库,从而提高对应句型的语音识别率。
图3为本发明实施例三的信息处理方法的流程示意图,本示例中的信息处理方法应用于电子设备中,如图3所示,所述信息处理方法包括以下步骤:
步骤301:采集用户的语音输入,得到语音信息。
本发明实施例中,所述电子设备可以是手机、平板电脑、笔记本等电子设备。
本发明实施例中,所述电子设备具有麦克风,可以采集用户的语音输入。具体地,用户对电子设备说出语音内容,电子设备的麦克风采集到用户输入的语音信息。
本发明实施例中,用户输入的语音信息可以分为两大类,一类是通过拼字方式输入的语音信息,例如语音输入:立早章。另一类是通过偏旁部首描述的语音输入,例如语音输入:三点水的沙。
步骤302:按照第一预设规则对所述语音信息进行解析,得到第一子信息和第二子信息。
本发明实施例中,第一预设规则也可以分为两大类,一类是拼字规则,另一类是偏旁部首规则。例如,第一预设规则为拼字规则,一般,拼字规则时的语音输入为三字语音输入,前两个字为辅助词,最后一个字为待确定的字。因此,可以对语音信息进行解析,得到语音信息中包括的各个音节,例如解析出立早章这三个音节,将前两个音节作为第一子信息,将最后一个音节作为第二子信息。再例如,第一预设规则为偏旁部首规则,对语音信息进行解析,得到语音信息中包括的各个音节,例如解析出三点水的沙这五个音节,将前三个音节作为第一子信息,将组后一个音节作为第二子信息。
综上所述,第一子信息为辅助词,用于确定第二子信息。第一子信息可以是拼字类的辅助信息,也可以是偏旁部首类的辅助信息。
本发明实施例中,第一子信息和第二子信息均为语音信息,而非文本信息。
步骤303:在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息,并确定出与所述第二子信息对应的文本信息。
本发明实施例中,预定义的第一数据表具体为热词库,即将常用的辅助词+待确定词的匹配关系存储在第一数据表中。这里,第一数据表也可以分为两大类,一类是基于拼字规则的数据表,另一类是基于偏旁部首规则的数据表。例如,基于拼字规则的数据表:立早章、弓长张、木子李等等。再例如,基于偏旁部首规则的数据表:三点水的沙、三点水的杀、三点水的漠、三点水的沫等等。可见,与第一信息相匹配的第二子信息可以是一个,也可以是多个。最后,确定出与第二子信息对应的文本信息。
本发明实施例中,当在预定义的第一数据表中未查找到与所述第一子信息相匹配的第二子信息时,对所述第一子信息进行语音解析,得到所述第一子信息中包括的各个语音子信息;对所述第一子信息中包括的各个语音子信息进行文本转换,得到所述各个语音子信息对应的文本子信息;按照预设的一条以上组合规则对各个文本子信息进行组合,得到相应的候选文本信息;当所述候选的文本信息对应的语音信息与所述第二子信息相一致时,所述候选的文本信息为与所述第二子信息对应的文本信息。这里,各个语音子信息为第一子信息中所包含的各个音节。
步骤304:当所述第二子信息满足第一预定条件时,在第二数据表中查找与所述第一子信息对应的所有文本信息。
步骤305:将查找到的所有文本信息分别转换为对应的语音信息;将语音信息相同的文本信息划分为一类文本信息组。
本发明实施例中,当所述第二子信息满足第一预定条件时,在第二数据表中查找与所述第一子信息对应的所有文本信息;将查找到的所有文本信息分别转换为对应的语音信息;将语音信息相同的文本信息划分为一类文本信息组;分类显示输出所有的文本信息组。例如,当用户输入的语音信息为三点水的字,第二子信息为字,满足第一预定条件,则此时显示所有带三点水的字。这里,第二数据表为所有字的数据表。当查找到所有带三点水的字时,将这些字为对应的语音信息,然后将语音信息发音相同的文本信息归位一类进行显示,以实现对于所有偏旁部首的覆盖性和多候选排序。例如:
ting 汀
hui 汇 洄 溃
cha 汊
shan 汕 潸
han 汗 汉 涵 瀚
xun 汛 洵 浔
ru 汝 濡 洳 溽
jiang 江 洚
chi 池
wu 污 浯
shang 汤
mi 汨
wang 汪
步骤306:显示输出与所述第二子信息对应的文本信息。
本发明实施例中,电子设备具有显示屏,利用显示屏显示输出与所述第二子信息对应的文本信息。
本发明实施例中,对于所有偏旁部首的字,分类显示输出所有的文本信息组。或者,获取所述第一子信息对应的所有文本信息的使用频率,按照使用频率由高到低的顺序依次显示输出所有的文本信息。
本发明实施例通过辅助词来确定用户需要的字词,可以通过拼字的方式确定用户需要的字词,也可以通过偏旁部首的方式确定用户需要的字词。本发明实施例的技术方案能够通过拼字语音方式进行文字的输入,能够对常见的拼字说法进行支持。本发明实施例的技术方案还能够通过偏旁部首来快速确定字词;能够通过语义解析,纠正语音识别错误,从而给出正确的字词输出;能够对所有偏旁部首对应的字词和发音进行覆盖性支持;通过建立预定义的第一数据表,即热词库,从而提高对应句型的语音识别率。
图4为本发明实施例一的电子设备的结构组成示意图,如图4所示,所述电子设备包括:
语音采集单元41,用于采集用户的语音输入,得到语音信息;
第一解析单元42,用于按照第一预设规则对所述语音信息进行解析,得到第一子信息和第二子信息;
第一查找单元43,用于在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息,并确定出与所述第二子信息对应的文本信息;
输出单元44,用于显示输出与所述第二子信息对应的文本信息。
本领域技术人员应当理解,图4所示的电子设备中的各单元的实现功能可参照前述信息处理方法的相关描述而理解。图4所示的电子设备中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
图5为本发明实施例二的电子设备的结构组成示意图,如图5所示,所述电子设备包括:
语音采集单元51,用于采集用户的语音输入,得到语音信息;
第一解析单元52,用于按照第一预设规则对所述语音信息进行解析,得到第一子信息和第二子信息;
第一查找单元53,用于在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息,并确定出与所述第二子信息对应的文本信息;
输出单元54,用于显示输出与所述第二子信息对应的文本信息。
本发明实施例中,所述电子设备还包括:
第二解析单元55,用于当所述第一查找单53元在预定义的第一数据表中未查找到与所述第一子信息相匹配的第二子信息时,对所述第一子信息进行语音解析,得到所述第一子信息中包括的各个语音子信息;
语音文本转换单元56,用于对所述第一子信息中包括的各个语音子信息进行文本转换,得到所述各个语音子信息对应的文本子信息;
拼字单元57,用于按照预设的一条以上组合规则对各个文本子信息进行组合,得到相应的候选文本信息;
确定单元58,用于当所述候选的文本信息对应的语音信息与所述第二子信息相一致时,所述候选的文本信息为与所述第二子信息对应的文本信息。
所述电子设备还包括:
添加单元59,用于将所述第一子信息与所述第二子信息的匹配关系、以及与所述第二子信息对应的文本信息存储至预定义的所述第一数据表中。
本领域技术人员应当理解,图5所示的电子设备中的各单元的实现功能可参照前述信息处理方法的相关描述而理解。图5所示的电子设备中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
图6为本发明实施例三的电子设备的结构组成示意图,如图6所示,所述电子设备包括:
语音采集单元61,用于采集用户的语音输入,得到语音信息;
第一解析单元62,用于按照第一预设规则对所述语音信息进行解析,得到第一子信息和第二子信息;
第一查找单元63,用于在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息,并确定出与所述第二子信息对应的文本信息;
输出单元64,用于显示输出与所述第二子信息对应的文本信息。
本发明实施例中,所述电子设备还包括:
第二查找单元65,用于当所述第二子信息满足第一预定条件时,在第二数据表中查找与所述第一子信息对应的所有文本信息;
文本语音转换单元66,用于将查找到的所有文本信息分别转换为对应的语音信息;
归类单元67,用于将语音信息相同的文本信息划分为一类文本信息组;
所述输出单元64,还用于分类显示输出所有的文本信息组。
所述第二查找单元65,还用于当所述第二子信息满足第一预定条件时,在第二数据表中查找与所述第一子信息对应的所有文本信息;
所述电子设备还包括:
获取单元68,用于获取所述第一子信息对应的所有文本信息的使用频率;
所述输出单元64,还用于按照使用频率由高到低的顺序依次显示输出所有的文本信息。
本领域技术人员应当理解,图6所示的电子设备中的各单元的实现功能可参照前述信息处理方法的相关描述而理解。图6所示的电子设备中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (8)

1.一种信息处理方法,应用于电子设备,其特征在于,所述信息处理方法包括:
采集用户的语音输入,得到语音信息;
按照第一预设规则对所述语音信息进行解析,得到第一子信息和第二子信息;
在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息,并确定出与所述第二子信息对应的文本信息;
显示输出与所述第二子信息对应的文本信息;
其中,当在预定义的第一数据表中未查找到与所述第一子信息相匹配的第二子信息时,所述信息处理方法还包括:
对所述第一子信息进行语音解析,得到所述第一子信息中包括的各个语音子信息;
对所述第一子信息中包括的各个语音子信息进行文本转换,得到所述各个语音子信息对应的文本子信息;
按照预设的一条以上组合规则对各个文本子信息进行组合,得到相应的候选文本信息;
当所述候选的文本信息对应的语音信息与所述第二子信息相一致时,所述候选的文本信息为与所述第二子信息对应的文本信息。
2.根据权利要求1所述的信息处理方法,其特征在于,所述信息处理方法还包括:
将所述第一子信息与所述第二子信息的匹配关系、以及与所述第二子信息对应的文本信息存储至预定义的所述第一数据表中。
3.根据权利要求1所述的信息处理方法,其特征在于,所述信息处理方法还包括:
当所述第二子信息满足第一预定条件时,在第二数据表中查找与所述第一子信息对应的所有文本信息;
将查找到的所有文本信息分别转换为对应的语音信息;
将语音信息相同的文本信息划分为一类文本信息组;
分类显示输出所有的文本信息组。
4.根据权利要求1所述的信息处理方法,其特征在于,所述信息处理方法还包括:
当所述第二子信息满足第一预定条件时,在第二数据表中查找与所述第一子信息对应的所有文本信息;
获取所述第一子信息对应的所有文本信息的使用频率;
按照使用频率由高到低的顺序依次显示输出所有的文本信息。
5.一种电子设备,其特征在于,所述电子设备包括:
语音采集单元,用于采集用户的语音输入,得到语音信息;
第一解析单元,用于按照第一预设规则对所述语音信息进行解析,得到第一子信息和第二子信息;
第一查找单元,用于在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息,并确定出与所述第二子信息对应的文本信息;
输出单元,用于显示输出与所述第二子信息对应的文本信息;
其中,所述电子设备还包括:
第二解析单元,用于当所述第一查找单元在预定义的第一数据表中未查找到与所述第一子信息相匹配的第二子信息时,对所述第一子信息进行语音解析,得到所述第一子信息中包括的各个语音子信息;
语音文本转换单元,用于对所述第一子信息中包括的各个语音子信息进行文本转换,得到所述各个语音子信息对应的文本子信息;
拼字单元,用于按照预设的一条以上组合规则对各个文本子信息进行组合,得到相应的候选文本信息;
确定单元,用于当所述候选的文本信息对应的语音信息与所述第二子信息相一致时,所述候选的文本信息为与所述第二子信息对应的文本信息。
6.根据权利要求5所述的电子设备,其特征在于,所述电子设备还包括:
添加单元,用于将所述第一子信息与所述第二子信息的匹配关系、以及与所述第二子信息对应的文本信息存储至预定义的所述第一数据表中。
7.根据权利要求5所述的电子设备,其特征在于,所述电子设备还包括:
第二查找单元,用于当所述第二子信息满足第一预定条件时,在第二数据表中查找与所述第一子信息对应的所有文本信息;
文本语音转换单元,用于将查找到的所有文本信息分别转换为对应的语音信息;
归类单元,用于将语音信息相同的文本信息划分为一类文本信息组;
所述输出单元,还用于分类显示输出所有的文本信息组。
8.根据权利要求5所述的电子设备,其特征在于,所述电子设备还包括:
第二查找单元,用于当所述第二子信息满足第一预定条件时,在第二数据表中查找与所述第一子信息对应的所有文本信息;
获取单元,用于获取所述第一子信息对应的所有文本信息的使用频率;
所述输出单元,还用于按照使用频率由高到低的顺序依次显示输出所有的文本信息。
CN201510245923.8A 2015-05-14 2015-05-14 一种信息处理方法及电子设备 Active CN106294306B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510245923.8A CN106294306B (zh) 2015-05-14 2015-05-14 一种信息处理方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510245923.8A CN106294306B (zh) 2015-05-14 2015-05-14 一种信息处理方法及电子设备

Publications (2)

Publication Number Publication Date
CN106294306A CN106294306A (zh) 2017-01-04
CN106294306B true CN106294306B (zh) 2019-04-26

Family

ID=57631054

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510245923.8A Active CN106294306B (zh) 2015-05-14 2015-05-14 一种信息处理方法及电子设备

Country Status (1)

Country Link
CN (1) CN106294306B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110109607B (zh) * 2019-05-10 2021-07-27 网易(杭州)网络有限公司 信息处理方法及装置、电子设备和存储介质
CN112650398B (zh) * 2020-12-21 2024-10-29 北京搜狗科技发展有限公司 输入方法、装置和介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1212403A (zh) * 1997-09-19 1999-03-31 国际商业机器公司 用于识别孤立、非相关汉字的语音识别方法和系统
CN1901041A (zh) * 2005-07-22 2007-01-24 康佳集团股份有限公司 语音字典形成方法、语音识别系统及其方法
US8478732B1 (en) * 2000-05-02 2013-07-02 International Business Machines Corporation Database aliasing in information access system
CN103218199A (zh) * 2013-02-26 2013-07-24 马骏 带标识码输入的语音输入法
CN103903615A (zh) * 2014-03-10 2014-07-02 联想(北京)有限公司 一种信息处理方法及电子设备
CN104598464A (zh) * 2013-10-31 2015-05-06 联想(北京)有限公司 一种信息处理方法及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1212403A (zh) * 1997-09-19 1999-03-31 国际商业机器公司 用于识别孤立、非相关汉字的语音识别方法和系统
US8478732B1 (en) * 2000-05-02 2013-07-02 International Business Machines Corporation Database aliasing in information access system
CN1901041A (zh) * 2005-07-22 2007-01-24 康佳集团股份有限公司 语音字典形成方法、语音识别系统及其方法
CN103218199A (zh) * 2013-02-26 2013-07-24 马骏 带标识码输入的语音输入法
CN104598464A (zh) * 2013-10-31 2015-05-06 联想(北京)有限公司 一种信息处理方法及电子设备
CN103903615A (zh) * 2014-03-10 2014-07-02 联想(北京)有限公司 一种信息处理方法及电子设备

Also Published As

Publication number Publication date
CN106294306A (zh) 2017-01-04

Similar Documents

Publication Publication Date Title
CN108447486B (zh) 一种语音翻译方法及装置
CN112185348B (zh) 多语种语音识别方法、装置及电子设备
CN107291783B (zh) 一种语义匹配方法及智能设备
CN107423363B (zh) 基于人工智能的话术生成方法、装置、设备及存储介质
CN107590172B (zh) 一种大规模语音数据的核心内容挖掘方法及设备
CN111951779B (zh) 语音合成的前端处理方法及相关设备
CN109545183A (zh) 文本处理方法、装置、电子设备及存储介质
CN104573099B (zh) 题目的搜索方法及装置
Sitaram et al. Speech synthesis of code-mixed text
CN100592385C (zh) 用于对多语言的姓名进行语音识别的方法和系统
KR20160058470A (ko) 음성 합성 장치 및 그 제어 방법
CN108062303A (zh) 垃圾短信的识别方法及装置
CN110517668B (zh) 一种中英文混合语音识别系统及方法
JP6806662B2 (ja) 音声合成システム、統計モデル生成装置、音声合成装置、音声合成方法
CN104050962B (zh) 基于语音合成技术的多功能阅读器
CN113380222A (zh) 语音合成方法、装置、电子设备及存储介质
CN112818680A (zh) 语料的处理方法、装置、电子设备及计算机可读存储介质
Bali et al. Tools for the development of a Hindi speech synthesis system.
CN112489634A (zh) 语言的声学模型训练方法、装置、电子设备及计算机介质
WO2014183411A1 (en) Method, apparatus and speech synthesis system for classifying unvoiced and voiced sound
CN106294306B (zh) 一种信息处理方法及电子设备
CN106502988B (zh) 一种目标属性抽取的方法和设备
CN102970618A (zh) 基于音节识别的视频点播方法
Kayte et al. Grapheme-to-phoneme tools for the Marathi speech synthesis
Gupta On building spoken language understanding systems for low resourced languages

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant