CN106294306B

CN106294306B - 一种信息处理方法及电子设备

Info

Publication number: CN106294306B
Application number: CN201510245923.8A
Authority: CN
Inventors: 戴海生; 王哲鹏
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2015-05-14
Filing date: 2015-05-14
Publication date: 2019-04-26
Anticipated expiration: 2035-05-14
Also published as: CN106294306A

Abstract

本发明公开了一种信息处理方法及电子设备，所述信息处理方法包括：采集用户的语音输入，得到语音信息；按照第一预设规则对所述语音信息进行解析，得到第一子信息和第二子信息；在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息，并确定出与所述第二子信息对应的文本信息；显示输出与所述第二子信息对应的文本信息。

Description

一种信息处理方法及电子设备

技术领域

本发明涉及信息处理技术，尤其涉及一种信息处理方法及电子设备。

背景技术

随着电子设备的智能化发展，电子设备已经能够对用户的语音进行识别，并根据用户的语音输入进行相应的操作。这样，用户无需输入文本信息，只需对电子设备说出需要执行操作的内容即可，方便快捷。然而，目前的语音识别一般针对于较长的句子，对于单个的字词，电子设备的识别率还较低，且由于同音字的存在，识别出来的候选内容较多，电子设备无法执行用户想要的操作，用户体验较差。

发明内容

为解决上述技术问题，本发明实施例提供了一种信息处理方法及电子设备。

本发明实施例提供的信息处理方法应用于电子设备，所述信息处理方法包括：

采集用户的语音输入，得到语音信息；

按照第一预设规则对所述语音信息进行解析，得到第一子信息和第二子信息；

在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息，并确定出与所述第二子信息对应的文本信息；

显示输出与所述第二子信息对应的文本信息。

在本发明一实施例中，当在预定义的第一数据表中未查找到与所述第一子信息相匹配的第二子信息时，所述信息处理方法还包括：

对所述第一子信息进行语音解析，得到所述第一子信息中包括的各个语音子信息；

对所述第一子信息中包括的各个语音子信息进行文本转换，得到所述各个语音子信息对应的文本子信息；

按照预设的一条以上组合规则对各个文本子信息进行组合，得到相应的候选文本信息；

当所述候选的文本信息对应的语音信息与所述第二子信息相一致时，所述候选的文本信息为与所述第二子信息对应的文本信息。

在本发明一实施例中，所述信息处理方法还包括：

将所述第一子信息与所述第二子信息的匹配关系、以及与所述第二子信息对应的文本信息存储至预定义的所述第一数据表中。

在本发明一实施例中，所述信息处理方法还包括：

当所述第二子信息满足第一预定条件时，在第二数据表中查找与所述第一子信息对应的所有文本信息；

将查找到的所有文本信息分别转换为对应的语音信息；

将语音信息相同的文本信息划分为一类文本信息组；

分类显示输出所有的文本信息组。

在本发明一实施例中，所述信息处理方法还包括：

获取所述第一子信息对应的所有文本信息的使用频率；

按照使用频率由高到低的顺序依次显示输出所有的文本信息。

本发明实施例提供的电子设备包括：

语音采集单元，用于采集用户的语音输入，得到语音信息；

第一解析单元，用于按照第一预设规则对所述语音信息进行解析，得到第一子信息和第二子信息；

第一查找单元，用于在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息，并确定出与所述第二子信息对应的文本信息；

输出单元，用于显示输出与所述第二子信息对应的文本信息。

在本发明一实施例中，所述电子设备还包括：

第二解析单元，用于当所述第一查找单元在预定义的第一数据表中未查找到与所述第一子信息相匹配的第二子信息时，对所述第一子信息进行语音解析，得到所述第一子信息中包括的各个语音子信息；

语音文本转换单元，用于对所述第一子信息中包括的各个语音子信息进行文本转换，得到所述各个语音子信息对应的文本子信息；

拼字单元，用于按照预设的一条以上组合规则对各个文本子信息进行组合，得到相应的候选文本信息；

确定单元，用于当所述候选的文本信息对应的语音信息与所述第二子信息相一致时，所述候选的文本信息为与所述第二子信息对应的文本信息。

在本发明一实施例中，所述电子设备还包括：

添加单元，用于将所述第一子信息与所述第二子信息的匹配关系、以及与所述第二子信息对应的文本信息存储至预定义的所述第一数据表中。

在本发明一实施例中，所述电子设备还包括：

第二查找单元，用于当所述第二子信息满足第一预定条件时，在第二数据表中查找与所述第一子信息对应的所有文本信息；

文本语音转换单元，用于将查找到的所有文本信息分别转换为对应的语音信息；

归类单元，用于将语音信息相同的文本信息划分为一类文本信息组；

所述输出单元，还用于分类显示输出所有的文本信息组。

在本发明一实施例中，所述电子设备还包括：

获取单元，用于获取所述第一子信息对应的所有文本信息的使用频率；

所述输出单元，还用于按照使用频率由高到低的顺序依次显示输出所有的文本信息。

本发明实施例的技术方案中，通过辅助词来确定用户需要的字词，具体地，可以通过拼字的方式确定用户需要的字词，也可以通过偏旁部首的方式确定用户需要的字词。电子设备首先采集用户的语音信息，该语音信息中包括了辅助词和待确定的字词，本发明实施例将辅助词称为第一子信息，将待确定的字词称为第二子信息。为了通过第一子信息确定第二子信息，本发明实施例按照第一预设规则将语音信息分离为第一子信息和第二子信息。然后，在预定义的第一数据表中查找与第一子信息匹配的第二子信息，这里，与第一子信息匹配的第二子信息可以是一个或多个；每个第二子信息均对应一文本信息。最后，显示输出第二子信息对应的文本信息。本发明实施例的技术方案能够通过拼字语音方式进行文字的输入，能够对常见的拼字说法进行支持。本发明实施例的技术方案还能够通过偏旁部首来快速确定字词；能够通过语义解析，纠正语音识别错误，从而给出正确的字词输出；能够对所有偏旁部首对应的字词和发音进行覆盖性支持；通过建立预定义的第一数据表，即热词库，从而提高对应句型的语音识别率。

附图说明

图1为本发明实施例一的信息处理方法的流程示意图；

图2为本发明实施例二的信息处理方法的流程示意图；

图3为本发明实施例三的信息处理方法的流程示意图；

图4为本发明实施例一的电子设备的结构组成示意图；

图5为本发明实施例二的电子设备的结构组成示意图；

图6为本发明实施例三的电子设备的结构组成示意图。

具体实施方式

为了能够更加详尽地了解本发明实施例的特点与技术内容，下面结合附图对本发明实施例的实现进行详细阐述，所附附图仅供参考说明之用，并非用来限定本发明实施例。

图1为本发明实施例一的信息处理方法的流程示意图，本示例中的信息处理方法应用于电子设备中，如图1所示，所述信息处理方法包括以下步骤：

步骤101：采集用户的语音输入，得到语音信息。

本发明实施例中，所述电子设备可以是手机、平板电脑、笔记本等电子设备。

本发明实施例中，所述电子设备具有麦克风，可以采集用户的语音输入。具体地，用户对电子设备说出语音内容，电子设备的麦克风采集到用户输入的语音信息。

本发明实施例中，用户输入的语音信息可以分为两大类，一类是通过拼字方式输入的语音信息，例如语音输入：立早章。另一类是通过偏旁部首描述的语音输入，例如语音输入：三点水的沙。

步骤102：按照第一预设规则对所述语音信息进行解析，得到第一子信息和第二子信息。

本发明实施例中，第一预设规则也可以分为两大类，一类是拼字规则，另一类是偏旁部首规则。例如，第一预设规则为拼字规则，一般，拼字规则时的语音输入为三字语音输入，前两个字为辅助词，最后一个字为待确定的字。因此，可以对语音信息进行解析，得到语音信息中包括的各个音节，例如解析出立早章这三个音节，将前两个音节作为第一子信息，将最后一个音节作为第二子信息。再例如，第一预设规则为偏旁部首规则，对语音信息进行解析，得到语音信息中包括的各个音节，例如解析出三点水的沙这五个音节，将前三个音节作为第一子信息，将组后一个音节作为第二子信息。

综上所述，第一子信息为辅助词，用于确定第二子信息。第一子信息可以是拼字类的辅助信息，也可以是偏旁部首类的辅助信息。

本发明实施例中，第一子信息和第二子信息均为语音信息，而非文本信息。

步骤103：在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息，并确定出与所述第二子信息对应的文本信息。

本发明实施例中，预定义的第一数据表具体为热词库，即将常用的辅助词+待确定词的匹配关系存储在第一数据表中。这里，第一数据表也可以分为两大类，一类是基于拼字规则的数据表，另一类是基于偏旁部首规则的数据表。例如，基于拼字规则的数据表：立早章、弓长张、木子李等等。再例如，基于偏旁部首规则的数据表：三点水的沙、三点水的杀、三点水的漠、三点水的沫等等。可见，与第一信息相匹配的第二子信息可以是一个，也可以是多个。最后，确定出与第二子信息对应的文本信息。

本发明实施例中，当在预定义的第一数据表中未查找到与所述第一子信息相匹配的第二子信息时，对所述第一子信息进行语音解析，得到所述第一子信息中包括的各个语音子信息；对所述第一子信息中包括的各个语音子信息进行文本转换，得到所述各个语音子信息对应的文本子信息；按照预设的一条以上组合规则对各个文本子信息进行组合，得到相应的候选文本信息；当所述候选的文本信息对应的语音信息与所述第二子信息相一致时，所述候选的文本信息为与所述第二子信息对应的文本信息。这里，各个语音子信息为第一子信息中所包含的各个音节。

上述方案中，对于不符合解析的三字语音输入，通过音字转换找出所有的前两字列表，通过拼字法，把这两个字合起来，分别进行左右结构、上下结构等所有可能结构的组合，最后通过光学字符识别(OCR，Optical Character Recognition)，如果OCR识别结果符合下述要求：发音符合第三个字的发音、第三个字的笔顺和前两字的组合笔顺一致，则把新输入的第一子信息与所述第二子信息的匹配关系、以及与所述第二子信息对应的文本信息存储至预定义的所述第一数据表中，以便下次能够通过第一数据表查找到与第一子信息相匹配的第二子信息。

本发明实施例中，当所述第二子信息满足第一预定条件时，在第二数据表中查找与所述第一子信息对应的所有文本信息；将查找到的所有文本信息分别转换为对应的语音信息；将语音信息相同的文本信息划分为一类文本信息组；分类显示输出所有的文本信息组。例如，当用户输入的语音信息为三点水的字，第二子信息为字，满足第一预定条件，则此时显示所有带三点水的字。这里，第二数据表为所有字的数据表。当查找到所有带三点水的字时，将这些字为对应的语音信息，然后将语音信息发音相同的文本信息归位一类进行显示，以实现对于所有偏旁部首的覆盖性和多候选排序。例如：

ting 汀

hui 汇洄溃

cha 汊

shan 汕潸

han 汗汉涵瀚

xun 汛洵浔

ru 汝濡洳溽

jiang 江洚

chi 池

wu 污浯

shang 汤

mi 汨

wang 汪

步骤104：显示输出与所述第二子信息对应的文本信息。

本发明实施例中，电子设备具有显示屏，利用显示屏显示输出与所述第二子信息对应的文本信息。

本发明实施例中，对于所有偏旁部首的字，分类显示输出所有的文本信息组。或者，按照使用频率由高到低的顺序依次显示输出所有的文本信息。

本发明实施例通过辅助词来确定用户需要的字词，可以通过拼字的方式确定用户需要的字词，也可以通过偏旁部首的方式确定用户需要的字词。本发明实施例的技术方案能够通过拼字语音方式进行文字的输入，能够对常见的拼字说法进行支持。本发明实施例的技术方案还能够通过偏旁部首来快速确定字词；能够通过语义解析，纠正语音识别错误，从而给出正确的字词输出；能够对所有偏旁部首对应的字词和发音进行覆盖性支持；通过建立预定义的第一数据表，即热词库，从而提高对应句型的语音识别率。

图2为本发明实施例二的信息处理方法的流程示意图，本示例中的信息处理方法应用于电子设备中，如图2所示，所述信息处理方法包括以下步骤：

步骤201：采集用户的语音输入，得到语音信息。

步骤202：按照第一预设规则对所述语音信息进行解析，得到第一子信息和第二子信息。

步骤203：在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息，并确定出与所述第二子信息对应的文本信息。

步骤204：当在预定义的第一数据表中未查找到与所述第一子信息相匹配的第二子信息时，对所述第一子信息进行语音解析，得到所述第一子信息中包括的各个语音子信息。

步骤205：对所述第一子信息中包括的各个语音子信息进行文本转换，得到所述各个语音子信息对应的文本子信息。

步骤206：按照预设的一条以上组合规则对各个文本子信息进行组合，得到相应的候选文本信息。

步骤207：当所述候选的文本信息对应的语音信息与所述第二子信息相一致时，所述候选的文本信息为与所述第二子信息对应的文本信息。

上述方案中，对于不符合解析的三字语音输入，通过音字转换找出所有的前两字列表，通过拼字法，把这两个字合起来，分别进行左右结构、上下结构等所有可能结构的组合，最后通过OCR识别，如果OCR识别结果符合下述要求：发音符合第三个字的发音、第三个字的笔顺和前两字的组合笔顺一致，则把新输入的第一子信息与所述第二子信息的匹配关系、以及与所述第二子信息对应的文本信息存储至预定义的所述第一数据表中，以便下次能够通过第一数据表查找到与第一子信息相匹配的第二子信息。

步骤208：将所述第一子信息与所述第二子信息的匹配关系、以及与所述第二子信息对应的文本信息存储至预定义的所述第一数据表中。

步骤209：显示输出与所述第二子信息对应的文本信息。

图3为本发明实施例三的信息处理方法的流程示意图，本示例中的信息处理方法应用于电子设备中，如图3所示，所述信息处理方法包括以下步骤：

步骤301：采集用户的语音输入，得到语音信息。

步骤302：按照第一预设规则对所述语音信息进行解析，得到第一子信息和第二子信息。

步骤303：在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息，并确定出与所述第二子信息对应的文本信息。

步骤304：当所述第二子信息满足第一预定条件时，在第二数据表中查找与所述第一子信息对应的所有文本信息。

步骤305：将查找到的所有文本信息分别转换为对应的语音信息；将语音信息相同的文本信息划分为一类文本信息组。

ting 汀

hui 汇洄溃

cha 汊

shan 汕潸

han 汗汉涵瀚

xun 汛洵浔

ru 汝濡洳溽

jiang 江洚

chi 池

wu 污浯

shang 汤

mi 汨

wang 汪

步骤306：显示输出与所述第二子信息对应的文本信息。

本发明实施例中，对于所有偏旁部首的字，分类显示输出所有的文本信息组。或者，获取所述第一子信息对应的所有文本信息的使用频率，按照使用频率由高到低的顺序依次显示输出所有的文本信息。

图4为本发明实施例一的电子设备的结构组成示意图，如图4所示，所述电子设备包括：

语音采集单元41，用于采集用户的语音输入，得到语音信息；

第一解析单元42，用于按照第一预设规则对所述语音信息进行解析，得到第一子信息和第二子信息；

第一查找单元43，用于在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息，并确定出与所述第二子信息对应的文本信息；

输出单元44，用于显示输出与所述第二子信息对应的文本信息。

本领域技术人员应当理解，图4所示的电子设备中的各单元的实现功能可参照前述信息处理方法的相关描述而理解。图4所示的电子设备中的各单元的功能可通过运行于处理器上的程序而实现，也可通过具体的逻辑电路而实现。

图5为本发明实施例二的电子设备的结构组成示意图，如图5所示，所述电子设备包括：

语音采集单元51，用于采集用户的语音输入，得到语音信息；

第一解析单元52，用于按照第一预设规则对所述语音信息进行解析，得到第一子信息和第二子信息；

第一查找单元53，用于在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息，并确定出与所述第二子信息对应的文本信息；

输出单元54，用于显示输出与所述第二子信息对应的文本信息。

本发明实施例中，所述电子设备还包括：

第二解析单元55，用于当所述第一查找单53元在预定义的第一数据表中未查找到与所述第一子信息相匹配的第二子信息时，对所述第一子信息进行语音解析，得到所述第一子信息中包括的各个语音子信息；

语音文本转换单元56，用于对所述第一子信息中包括的各个语音子信息进行文本转换，得到所述各个语音子信息对应的文本子信息；

拼字单元57，用于按照预设的一条以上组合规则对各个文本子信息进行组合，得到相应的候选文本信息；

确定单元58，用于当所述候选的文本信息对应的语音信息与所述第二子信息相一致时，所述候选的文本信息为与所述第二子信息对应的文本信息。

所述电子设备还包括：

添加单元59，用于将所述第一子信息与所述第二子信息的匹配关系、以及与所述第二子信息对应的文本信息存储至预定义的所述第一数据表中。

本领域技术人员应当理解，图5所示的电子设备中的各单元的实现功能可参照前述信息处理方法的相关描述而理解。图5所示的电子设备中的各单元的功能可通过运行于处理器上的程序而实现，也可通过具体的逻辑电路而实现。

图6为本发明实施例三的电子设备的结构组成示意图，如图6所示，所述电子设备包括：

语音采集单元61，用于采集用户的语音输入，得到语音信息；

第一解析单元62，用于按照第一预设规则对所述语音信息进行解析，得到第一子信息和第二子信息；

第一查找单元63，用于在预定义的第一数据表中查找与所述第一子信息相匹配的第二子信息，并确定出与所述第二子信息对应的文本信息；

输出单元64，用于显示输出与所述第二子信息对应的文本信息。

本发明实施例中，所述电子设备还包括：

第二查找单元65，用于当所述第二子信息满足第一预定条件时，在第二数据表中查找与所述第一子信息对应的所有文本信息；

文本语音转换单元66，用于将查找到的所有文本信息分别转换为对应的语音信息；

归类单元67，用于将语音信息相同的文本信息划分为一类文本信息组；

所述输出单元64，还用于分类显示输出所有的文本信息组。

所述第二查找单元65，还用于当所述第二子信息满足第一预定条件时，在第二数据表中查找与所述第一子信息对应的所有文本信息；

所述电子设备还包括：

获取单元68，用于获取所述第一子信息对应的所有文本信息的使用频率；

所述输出单元64，还用于按照使用频率由高到低的顺序依次显示输出所有的文本信息。

本领域技术人员应当理解，图6所示的电子设备中的各单元的实现功能可参照前述信息处理方法的相关描述而理解。图6所示的电子设备中的各单元的功能可通过运行于处理器上的程序而实现，也可通过具体的逻辑电路而实现。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元，即可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(ROM，Read Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、只读存储器(ROM，Read Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种信息处理方法，应用于电子设备，其特征在于，所述信息处理方法包括：

采集用户的语音输入，得到语音信息；

显示输出与所述第二子信息对应的文本信息；

其中，当在预定义的第一数据表中未查找到与所述第一子信息相匹配的第二子信息时，所述信息处理方法还包括：

2.根据权利要求1所述的信息处理方法，其特征在于，所述信息处理方法还包括：

3.根据权利要求1所述的信息处理方法，其特征在于，所述信息处理方法还包括：

将查找到的所有文本信息分别转换为对应的语音信息；

将语音信息相同的文本信息划分为一类文本信息组；

分类显示输出所有的文本信息组。

4.根据权利要求1所述的信息处理方法，其特征在于，所述信息处理方法还包括：

获取所述第一子信息对应的所有文本信息的使用频率；

5.一种电子设备，其特征在于，所述电子设备包括：

语音采集单元，用于采集用户的语音输入，得到语音信息；

输出单元，用于显示输出与所述第二子信息对应的文本信息；

其中，所述电子设备还包括：

6.根据权利要求5所述的电子设备，其特征在于，所述电子设备还包括：

7.根据权利要求5所述的电子设备，其特征在于，所述电子设备还包括：

所述输出单元，还用于分类显示输出所有的文本信息组。

8.根据权利要求5所述的电子设备，其特征在于，所述电子设备还包括：