CN113361275A

CN113361275A - 演讲稿逻辑结构评价方法和设备

Info

Publication number: CN113361275A
Application number: CN202110910921.1A
Authority: CN
Inventors: 张�林; 王晔; 李东朔
Original assignee: Beijing Youmu Technology Co ltd
Current assignee: Beijing Youmu Technology Co ltd
Priority date: 2021-08-10
Filing date: 2021-08-10
Publication date: 2021-09-07

Abstract

本申请公开了一种演讲稿逻辑结构评价方法和设备。所述方法包括：对获取的待评价演讲稿文本进行划分处理，得到多个目标评价单元；对多个目标评价单元中的每一目标评价单元进行连词识别处理，得到每一目标评价单元对应的连词识别结果；连词识别结果用于表征预设连词在每一目标评价单元中的出现概率；根据每一目标评价单元的连词识别结果，得到待评价演讲稿文本的逻辑结构评价结果。本申请通过连词识别结果表征预设连词在目标评价单元中的出现概率，提高了连词识别的精准度，确保了演讲稿逻辑结构评价结果的准确性。本申请解决现有技术中采用基于穷举的连词识别方法对演讲稿的逻辑结构进行评价，存在评价结果不准确的技术问题。

Description

演讲稿逻辑结构评价方法和设备

技术领域

本发明涉及自然语言处理领域，具体涉及一种演讲稿逻辑结构评价方法和设备。

背景技术

演讲是指在公众场合以有声语言为主要手段，以体态语言为辅助手段，针对某个具体问题，鲜明、完整地发表自己的见解和主张，阐明事理或抒发情感，进行宣传鼓动的一种语言交际活动。演讲稿是进行演讲的依据，由于演讲是以口语表达为主，为了使听众更好地理解演讲内容，通常情况下，可以采用连词对演讲稿的内容进行逻辑结构的构建。

演讲稿的逻辑结构即是口语化表述中的主次关系、递进关系、并列关系等，比如采用连词“首先”和“其次”可以构建内容之间的主次关系。通常情况下，演讲稿中所使用的连词数量和连词分布情况，可以作为评价该演讲稿质量优劣的指标。

目前，识别演讲稿中的连词大多采用基于穷举的连词识别方法，即预先穷举所有可能出现的连词，然后在演讲稿文本中逐句识别是否出现预先设定的连词，这种连词识别方法虽然具有较高的识别准确率，但是，由于连词的变形非常多，尤其是中文用词非常丰富，基本无法做到预先穷举所有的连词，因此，在对演讲稿的逻辑结构进行评价时，有可能出现连词漏识别的情况，导致评价结果有误。

发明内容

因此，本发明要解决的技术问题在于克服现有技术中对演讲稿的逻辑结构进行评价时，采用基于穷举的连词识别方法，存在评价结果不准确的问题。

为了实现上述目的，第一方面，本申请提供了一种演讲稿逻辑结构评价方法，该演讲稿逻辑结构评价方法包括：

对获取的待评价演讲稿文本进行划分处理，得到多个目标评价单元；

分别对多个目标评价单元中的每一目标评价单元进行连词识别处理，得到每一目标评价单元对应的连词识别结果；其中，连词识别结果用于表征预设连词在每一目标评价单元中的出现概率；

根据每一目标评价单元对应的连词识别结果，得到待评价演讲稿文本的逻辑结构评价结果。

在本申请一种可能的实现方式中，对获取的待评价演讲稿文本进行划分处理，得到多个目标评价单元，包括：

根据预设的划分窗口和划分窗口的移动步长，对待评价演讲稿文本进行逐句划分，得到多个目标评价单元；

其中，多个目标评价单元中的每一目标评价单元包括至少一个的待评价演讲稿文本的句段。

在本申请一种可能的实现方式中，划分窗口的窗口宽度根据待评价演讲稿文本的句段长度确定。

在本申请一种可能的实现方式中，分别对多个目标评价单元中的每一目标评价单元进行连词识别处理，得到每一目标评价单元对应的连词识别结果，包括：

针对多个目标评价单元中的每一目标评价单元，将每一目标评价单元依次输入预设的连词识别模型；

通过连词识别模型对每一目标评价单元进行连词识别处理，得到每一目标评价单元对应的连词识别结果。

在本申请一种可能的实现方式中，预设连词包括多个连接词；

通过连词识别模型对每一目标评价单元进行连词识别处理，得到每一目标评价单元对应的连词识别结果，包括：

连词识别模型基于多个连接词对每一目标评价单元的内容进行特征匹配及提取，得到多个连接词在每一目标评价单元中相应的出现概率；

根据多个连接词在每一目标评价单元中相应的出现概率，得到每一目标评价单元对应的连词识别结果。

在本申请一种可能的实现方式中，通过连词识别模型对每一目标评价单元进行连词识别处理之前，方法包括：

对若干训练样本句段中的每一训练样本句段进行标注，得到与每一训练样本句段的连词相对应的样本标签；其中，若干训练样本句段分别携带有不同的连词，不同的连词中含义相同或相近的连词构成连词集合，样本标签与连词集合中的所有连词相对应；

将若干训练样本句段依次输入预设的初始连词识别模型，基于每一训练样本句段和与每一训练样本句段的连词相对应的样本标签，对初始连词识别模型进行连词识别训练，将训练好的初始连词识别模型作为连词识别模型。

在本申请一种可能的实现方式中，根据每一目标评价单元对应的连词识别结果，得到待评价演讲稿文本的逻辑结构评价结果，包括：

将每一目标评价单元对应的连词识别结果依次输入预设的评价模型；

通过评价模型对多个连词识别结果进行综合评估分析，得到待评价演讲稿文本的逻辑结构评价结果。

在本申请一种可能的实现方式中，通过评价模型对多个连词识别结果进行综合评估分析，得到待评价演讲稿文本的逻辑结构评价结果，包括：

评价模型根据多个连词识别结果中预设连词的出现概率，以及预设连词在多个目标评价单元中的分布情况进行综合评估分析，得到待评价演讲稿文本的逻辑结构评价结果；

其中，逻辑结构评价结果包括评价分数、评价类别或评价等级中的一种或多种。

第二方面，本申请还提供了一种演讲稿逻辑结构评价装置，该演讲稿逻辑结构评价装置包括：

划分模块，用于对获取的待评价演讲稿文本进行划分处理，得到多个目标评价单元；

连词识别模块，用于分别对多个目标评价单元中的每一目标评价单元进行连词识别处理，得到每一目标评价单元对应的连词识别结果；其中，连词识别结果用于表征预设连词在每一目标评价单元中的出现概率；

评价模块，用于根据每一目标评价单元对应的连词识别结果，得到待评价演讲稿文本的逻辑结构评价结果。

在本申请一种可能的实现方式中，划分模块具体用于：

在本申请一种可能的实现方式中，连词识别模块具体用于：

在本申请一种可能的实现方式中，预设连词包括多个连接词，连词识别模块具体还用于：

在本申请一种可能的实现方式中，演讲稿逻辑结构评价装置还包括：

模型训练模块，用于对若干训练样本句段中的每一训练样本句段进行标注，得到与每一训练样本句段的连词相对应的样本标签；其中，若干训练样本句段分别携带有不同的连词，不同的连词中含义相同或相近的连词构成连词集合，样本标签与连词集合中的所有连词相对应；

在本申请一种可能的实现方式中，评价模块具体用于：

在本申请一种可能的实现方式中，评价模块具体还用于：

根据多个连词识别结果中预设连词的出现概率，以及预设连词在多个目标评价单元中的分布情况进行综合评估分析，得到待评价演讲稿文本的逻辑结构评价结果；

第三方面，本申请还提供了一种演讲稿逻辑结构评价设备，该演讲稿逻辑结构评价设备包括处理器、存储器以及存储于存储器中并可在处理器上运行的计算机程序，处理器执行计算机程序以实现第一方面中任意一项的演讲稿逻辑结构评价方法的步骤。

第四方面，本申请还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行以实现第一方面中任意一项的演讲稿逻辑结构评价方法中的步骤。

从以上内容可得出，本申请具有以下的有益效果：

本申请中通过对待评价演讲稿文本进行划分处理，得到多个目标评价单元，再分别对每一个目标评价单元进行连词识别处理，得到每一个目标评价单元的连词识别结果，该连词识别结果表征预设连词在目标评价单元中的出现概率，最后再根据每一个目标评价单元对应的连词识别结果得到该待评价演讲稿文本的逻辑结构评价结果；相对于现有技术通过穷举所有可能出现的连词，然后在演讲稿文本中逐句识别是否出现预先设定的连词来说，因为本申请的连词识别结果代表的是预设连词在目标评价单元中的出现概率，因此，当目标评价单元中不存在与预设连词一致的连词，但存在与预设连词含义相同或相近的连词时，得到的连词识别结果所表征的出现概率也会较高，如此，便可以解决由于无法穷举所有连词而导致连词漏识别的问题，提高了连词识别的精准度，确保了演讲稿逻辑结构评价结果的准确性。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为根据本申请实施例提供的一种演讲稿逻辑结构评价系统的一个实施例场景示意图；

图2为根据本申请实施例提供的一种演讲稿逻辑结构评价方法的一个实施例流程示意图；

图3为根据本申请实施例提供的移动划分窗口得到目标评价单元的一个实施例示意图；

图4为根据本申请实施例提供的移动划分窗口得到目标评价单元的另一个实施例示意图；

图5为根据本申请实施例提供的得到连词识别结果的一个实施例示意图；

图6为根据本申请实施例提供的连词识别模型的一个实施例结构示意图；

图7为根据本申请实施例提供的连词识别结果的一个实施例示意图；

图8为根据本申请实施例提供的一种演讲稿逻辑结构评价装置的一个实施例结构示意图；

图9为根据本申请实施例提供的一种演讲稿逻辑结构评价设备的一个实施例结构示意图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

此外，下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

本申请提供一种演讲稿逻辑结构评价方法、设备和计算机可读存储介质，以下分别进行详细说明。

请参阅图1，图1为根据本申请实施例提供的一种演讲稿逻辑结构评价系统的一个实施例场景示意图，该演讲稿逻辑结构评价系统可以包括服务器100以及与服务器100通信连接的用户终端200，用户终端200可以向服务器100上传待评价演讲稿文本，以使得服务器100对该待评价演讲稿文本的逻辑结构进行评价，得到待评价演讲稿文本的逻辑结构评价结果输出至用户终端200。

本申请实施例中，该服务器100主要用于对获取的待评价演讲稿文本进行划分处理，得到多个目标评价单元；分别对多个目标评价单元中的每一目标评价单元进行连词识别处理，得到每一目标评价单元对应的连词识别结果；其中，连词识别结果用于表征预设连词在每一目标评价单元中的出现概率；根据每一目标评价单元对应的连词识别结果，得到待评价演讲稿文本的逻辑结构评价结果。

本申请实施例中，该服务器100可以是独立的服务器，也可以是服务器组成的服务器网络或服务器集群，例如，本申请中所描述的服务器100，其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云服务器。其中，云服务器由基于云计算（Cloud Computing）的大量计算机或网络服务器构成。

本申请实施例中，服务器100与用户终端200之间可以通过任何通信方式实现网络通信，包括但不限于，基于第三代合作伙伴计划（3rd Generation Partnership Project，3GPP）、长期演进（Long Term Evolution，LTE)、全球互通微波访问（WorldwideInteroperability for Microwave Access， WiMAX）的移动通信，或基于TCP/IP协议族（TCP/IP Protocol Suite，TCP/IP）、用户数据报协议（User Datagram Protocol，UDP）的计算机网络通信等。用户终端200可以通过上述通信方式与服务器100进行交互。

本申请实施例中，上述的用户终端200可以是一个通用的计算机设备或者是一个专用计算机设备。在具体实现中，用户终端200可以是掌上电脑、个人数字助理（PersonalDigital Assistant，PDA）、移动手机、平板电脑、手持无线终端设备或其他具有通信功能的终端设备等，本申请不限定上述用户终端200的类型。

需要说明的是，图1所示的演讲稿逻辑结构评价系统的场景示意图仅仅是一个示例，本申请描述的演讲稿逻辑结构评价系统以及场景是为了更加清楚地说明本申请的技术方案，并不构成对于本申请提供的技术方案的限定，本领域普通技术人员可知，随着演讲稿逻辑结构评价系统的演变和新业务场景的出现，本申请提供的技术方案对于类似的技术问题，同样适用。

首先，本申请提供一种演讲稿逻辑结构评价方法，该演讲稿逻辑结构评价方法应用于服务器，该演讲稿逻辑结构评价方法的执行主体为演讲稿逻辑结构评价装置，演讲稿逻辑结构评价方法包括：对获取的待评价演讲稿文本进行划分处理，得到多个目标评价单元；分别对多个目标评价单元中的每一目标评价单元进行连词识别处理，得到每一目标评价单元对应的连词识别结果；其中，连词识别结果用于表征预设连词在每一目标评价单元中的出现概率；根据每一目标评价单元对应的连词识别结果，得到待评价演讲稿文本的逻辑结构评价结果。

请参阅图2，图2为根据本申请实施例提供的一种演讲稿逻辑结构评价方法的一个实施例流程示意图，该演讲稿逻辑结构评价方法包括：

S201、对获取的待评价演讲稿文本进行划分处理，得到多个目标评价单元。

本申请实施例中，服务器获取待评价演讲稿文本的方式可以是被动获取，例如，用户终端直接将待评价演讲稿文本通过通信网络上传到服务器，以使服务器接收到该待评价演讲稿文本。

可以理解的，服务器获取待评价演讲稿文本的方式也可以是主动获取，例如，用户终端将待评价演讲稿文本存储在某一存储区域或存储器中，服务器可以按照设定的间隔时间，定期访问该存储区域或存储器，以此来获取待评价演讲稿文本。

由于不同的演讲稿文本的篇幅不同，对于篇幅较长的演讲稿文本来说，若直接对其进行通篇的连词识别，不仅需要耗费较长时间，导致效率较低，而且有可能因为数据量较大而导致识别结果有误。

因此，为了便于对演讲稿文本的逻辑结构进行更好地评价，本申请实施例中，可以对获取的待评价演讲稿文本进行划分处理，将一份待评价演讲稿文本划分为多个目标评价单元，以便于后续分别对每一个目标评价单元进行连词识别，不仅可以提高连词识别效率，还可以确保得到的连词识别结果的准确率。

S202、分别对多个目标评价单元中的每一目标评价单元进行连词识别处理，得到每一目标评价单元对应的连词识别结果；其中，连词识别结果用于表征预设连词在每一目标评价单元中的出现概率。

本申请实施例中，对目标评价单元进行连词识别处理的方式，并非现有技术中识别演讲稿文本中是否出现与预先设定的连词一致的连词，而是判断预设连词在目标评价单元中的出现概率，此处通过出现概率可以涵盖与预设连词不同，但含义却相同或相近的连词。也就是说，对目标评价单元进行连词识别处理时，除了预设连词以外，还可以识别预设连词的同义词。

可以理解的，出现概率可以是任一概率值，例如，若目标评价单元中存在与预设连词相同的连词，则对应的出现概率即为100%，若目标评价单元中不存在与预设连词相同的连词，但存在预设连词的同义词，则对应的出现概率可以是90%。当然，若目标评价单元中即不存在与预设连词相同的连词，也不存在含义与预设连词相同或相近的同义词，则对应的出现概率可以是0。

S203、根据每一目标评价单元对应的连词识别结果，得到待评价演讲稿文本的逻辑结构评价结果。

通常情况下，一份演讲稿文本的逻辑结构的优劣可以根据该演讲稿文本中所用的连词进行确定，具体的，由于连词是构建演讲稿文本的逻辑结构所用的若干连接词，因此，依据演讲稿文本中的连词的数量以及连词的分布情况可以确定演讲稿文本的逻辑结构的优劣。

本申请实施例中，每一个目标评价单元都对应有各自的连词识别结果，该连词识别结果可以表征预设连词在相应目标评价单元中的出现概率，并且由于各目标评价单元是对待评价演讲稿文本进行划分处理得到的，因此，各目标评价单元在分布位置上存在一定的联系。基于此，根据每一个目标评价单元对应的连词识别结果，便可以得到待评价演讲稿文本的逻辑结构评价结果。

在本申请一些实施例中，对获取的待评价演讲稿文本进行划分处理，得到多个目标评价单元，可以进一步包括：根据预设的划分窗口和划分窗口的移动步长，对待评价演讲稿文本进行逐句划分，得到多个目标评价单元；其中，多个目标评价单元中的每一目标评价单元包括至少一个的待评价演讲稿文本的句段。

可以理解的，待评价演讲稿文本是由若干的文字形成的，并且在文字之间设置有各类标点符号来进行断句，从而形成一个个的句段，本申请实施例中，句段可以是由逗号“，”、句号“。”、问号、感叹号“！”等标点符号断句所形成的。

例如，对于一段文字“首先要学习相关知识，其次再掌握它，最后才能应用它。”，句段可以分别是 “首先要学习相关知识”、“其次再掌握它”以及“最后才能应用它”，也可以分别是“首先要学习相关知识，其次再掌握它”和“最后才能应用它”，还可以是“首先要学习相关知识，其次再掌握它，最后才能应用它”。需要说明的是，上述仅是对本申请中的句段的一些示例，本申请实施例中关于句段的划分还可以根据实际应用场景进行确定，具体此处不做限定。

本申请实施例中，通过在待评价演讲稿文本中移动划分窗口便可以实现对待评价演讲稿文本的划分处理，得到对应的目标评价单元。

如图3所示，图3为根据本申请实施例提供的移动划分窗口得到目标评价单元的一个实施例示意图。具体的，本申请实施例中，划分窗口的窗口宽度可以根据待评价演讲稿文本的句段长度确定，例如，待评价演讲稿文本的内容“第一xxxx，yyyy，进而zzzz。”，可以分为3个句段，“第一xxxx”、“yyyy”和“进而zzzz”，设定划分窗口的窗口宽度为2个句段长度，移动步长为1个句段长度，则如图3所示，对“第一xxxx，yyyy，进而zzzz。”进行划分处理，得到的目标评价单元分别为“第一xxxx，yyyy”和“yyyy，进而zzzz”。

如图4所示，图4为根据本申请实施例提供的移动划分窗口得到目标评价单元的另一个实施例示意图。具体的，可以设定划分窗口的窗口宽度为1个句段长度，移动步长也为1个句段长度，则如图4所示，对“第一xxxx，yyyy，进而zzzz。”进行划分处理，得到的目标评价单元分别为“第一xxxx”、“yyyy”和“进而zzzz”。

另外，本申请实施例中，划分窗口的窗口宽度还可以根据计算式确定，滑动窗口的尺寸size符合：size* log(句子长度) <= 3，size上取整为1，当size<1时size取1。

在本申请一些实施例中，分别对多个目标评价单元中的每一目标评价单元进行连词识别处理，得到每一目标评价单元对应的连词识别结果，可以进一步包括：

针对多个目标评价单元中的每一目标评价单元，将每一目标评价单元依次输入预设的连词识别模型；通过连词识别模型对每一目标评价单元进行连词识别处理，得到每一目标评价单元对应的连词识别结果。

如图5所示，图5为根据本申请实施例提供的得到连词识别结果的一个实施例示意图，本申请实施例中，假设将待评价演讲稿文本划分为n个目标评价单元，其中，n为大于2的正整数，则将n个目标评价单元分别输入连词识别模型中，可以对应得到n个连词识别结果。此处，n个连词识别结果可以分别表示预设连词在对应的目标评价单元中的出现概率。

具体可以使用Facebook开源的BART模型，以问答的方式得到连词识别结果。比如设置问题为”What’s conjunction in this sentence ”，将该问题和某个目标评价单元作为模型的输入数据，模型输出的回答可能是“first of all”和0.95，表示该目标评价单元中存在“first of all”这一连词的概率是0.95。

进一步的，本申请实施例中，预设连词可以包括多个连接词；通过连词识别模型对每一目标评价单元进行连词识别处理，得到每一目标评价单元对应的连词识别结果，可以进一步包括：

连词识别模型基于多个连接词对每一目标评价单元的内容进行特征匹配及提取，得到多个连接词在每一目标评价单元中相应的出现概率；根据多个连接词在每一目标评价单元中相应的出现概率，得到每一目标评价单元对应的连词识别结果。

如图6所示，图6为根据本申请实施例提供的连词识别模型的一个实施例结构示意图，本申请实施例中，该连词识别模型可以是神经网络模型，该神经网络模型可以包括输入层、卷积层、全连接层以及输出层，其中，目标评价单元输入到神经网络模型的输入层，然后经过第一卷积层以及第二卷积层对目标评价单元的内容进行特征匹配及提取，此处的特征匹配及提取相当于对预设连词的识别，接着全连接层综合所提取的特征进行分类，得到最终的连词评价结果，即预设连词在目标评价单元中的出现概率。

具体的，假设预设连词包括5个连接词，分别为“首先”、“其次”、“再次”、“进而”和“最后”。通过连词识别模型对目标评价单元（如“yyyy，进而zzzz”）进行特征匹配及提取，则可以得到连接词“首先”的出现概率为0，连接词“其次”的出现概率为0，连接词“再次”的出现概率为0，连接词“进而”的出现概率为100%，连接词“最后”的出现概率为0，则对应的连词识别结果可以是[0，0，0，1，0]。

若通过连词识别模型对目标评价单元（如“第一xxxx，yyyy”）进行特征匹配及提取，由于目标评价单元中的“第一”与连接词“首先”的含义相近，即“第一”是连接词“首先”的近义词，则可以得到连接词“首先”的出现概率为90%，连接词“其次”的出现概率为0，连接词“再次”的出现概率为0，连接词“进而”的出现概率为0，连接词“最后”的出现概率为0，则对应的连词识别结果可以是[0.9，0，0，0，0]。

如图7所示，图7为根据本申请实施例提供的连词识别结果的一个实施例示意图，其中，横轴表示预设连词，即图7中的7个连接词“首先”、“其次”、“再次”、“进而”、“xx1”、“xx2”以及“最后”，纵轴表示目标评价单元的编号，图7中深浅不一的方块表示各连接词在相应目标评价单元中的出现概率，方块黑色越深代表出现概率越大，方块黑色越浅代表出现概率越小，白色部分则代表出现概率为0。

由于对待评价演讲稿文本进行划分处理时，可以对其逐句进行划分，因此，目标评价单元也可以是顺次排序的，因此，得到的连词识别结果也可以根据目标评价单元的顺序进行排布，如图7所示，针对于目标评价单元51，其内容中连接词“xx1”的出现概率极高，假设为100%，其他连接词的出现概率皆为0，则其对应的连词识别结果为[0，0，0，0，1，0，0]；针对于目标评价单元52，其内容中连接词“xx1”和连接词“再次”的出现概率较高，且连接词“xx1”的出现概率比连接词“再次”的出现概率高，假设连接词“xx1”的出现概率为90%，连接词“再次”的出现概率为75%，其他连接词的出现概率皆为0，则其对应的连词识别结果为[0，0，0.75，0，0.9，0，0]。

可以理解的，通过连词识别模型进行连词识别处理之前，还可以预先对其进行训练，因此，在本申请一些实施例中，通过连词识别模型对每一目标评价单元进行连词识别处理之前，演讲稿逻辑结构评价方法还可以进一步包括：

由于中文用词非常丰富，词语变形较多，不同的连词可以代表相同或相近的含义，例如连词“首先”和连词“第一”的含义相近，若直接将可能用到的连词作为初始连词识别模型训练时使用的样本标签，则可能导致样本标签过多，且有可能存在样本标签遗漏的问题。因此，本申请实施例中，将若干训练样本句段携带的不同的连词中含义相同或相近的连词构成连词集合，即连词集合中的所有连词均为同义词或近义词，针对于一个连词集合来设置样本标签，即样本标签可以与连词集合中的所有连词相对应，这样便可以大大减少样本标签的数量，避免样本标签被遗漏。

示例性的，对于近义词“首先”、“第一”等构成的连词集合来说，其对应的样本标签可以设定为“第一”，该样本标签“第一”可以分别与来连词集合中的连词“首先”和连词“第一”相对应；对于连词“最后”、“最终”等构成的连词集合来说，其对应的样本标签可以设定为“最后”，该样本标签“最后”可以分别与来连词集合中的连词“最后”和连词“最终”相对应。

对于近义词“首先”、“第一”等构成的连词集合来说，其对应的样本标签也可以设定为英文副词“firstly”，该样本标签“firstly”可以分别与来连词集合中的连词“首先”和连词“第一”相对应；对于连词“最后”、“最终”等构成的连词集合来说，其对应的样本标签也可以设定为英文副词“finally”，该样本标签“finally”可以分别与来连词集合中的连词“最后”和连词“最终”相对应，如此便可以进一步避免中文多义性造成的干扰。需要说明的是，样本标签除了可以是中文、英文副词形式以外，还可以是其他语种的表现形式，具体此处不做限定。

在通过训练样本句段和与训练样本句段的连词相对应的样本标签，对初始连词识别模型进行连词识别训练时，训练模式可以是中文的训练样本句段和英文的样本标签；同样的，在对目标评价单元进行连词识别时，预设连词也可以是英文副词形式，此处，神经网络模型即连词识别模型并没有做翻译工作，从工作原理上来看，它并不关注语种，因为对初始连词识别模型训练的时候，训练模式是中文的训练样本句段和英文的样本标签，因此，在对目标评价单元进行连词识别时，也可以是中文的目标评价单元和英文的预设连词。

在本申请一些实施例中，根据每一目标评价单元对应的连词识别结果，得到待评价演讲稿文本的逻辑结构评价结果，可以进一步包括：

将每一目标评价单元对应的连词识别结果依次输入预设的评价模型；通过评价模型对多个连词识别结果进行综合评估分析，得到待评价演讲稿文本的逻辑结构评价结果。

具体的，评价模型可以根据多个连词识别结果中预设连词的出现概率，以及预设连词在多个目标评价单元中的分布情况进行综合评估分析，得到待评价演讲稿文本的逻辑结构评价结果；可以理解的，若同一个预设连词同时高概率出现在相邻的两目标评价单元中，则待评价演讲稿文本的逻辑结构可能比较混乱；或者是具有主次关系、递进关系、或并列关系的两个预设连词，依次出现在相邻或相近的两目标评价单元中时，则待评价演讲稿文本的逻辑结构可能比较清晰。

本申请实施例的评价模型可以基于目标评价单元的连词识别结果对待评价演讲稿文本中的连词进行更高级的分布信息统计分析，而非单纯对待评价演讲稿文本中的连词进行数量统计，可以进一步提高逻辑结构评价结果的确定性。

评价模型也可以是预先训练好的神经网络模型，可以将若干经过人工标定评价结果的演讲稿文本输入到评价模型中，以人工标定的评价结果为训练标签，通过训练标签和与训练标签对应的演讲稿文本对评价模型进行训练，将训练好的评价模型作为待评价演讲稿文本的逻辑结构评价模型。

在一些实施例中，该评价模型可以结合连词识别结果中预设连词的出现概率，以及预设连词在目标评价单元中的分布情况对待评价演讲稿文本进行回归预测分析，最终输出待评价演讲稿文本的评价分数。

在另一些实施例中，该评价模型也可以结合连词识别结果中预设连词的出现概率，以及预设连词在目标评价单元中的分布情况对待评价演讲稿文本进行分类预测，最终输出待评价演讲稿文本的评价类别（如“A类”、“B类”等）或评价等级（如“优秀”、“良好”、“一般”等）。

示例性的，选取互联网视频上的1000例演讲视频进行人工标注，分为好、中、差 3类。基于本申请提供的演讲稿逻辑结构评价方法，对每一演讲视频所涉及的演讲稿文本进行逻辑结构评价，3分钟内便可以完成万字以内演讲稿文本的逻辑评价，并且，将本申请提供的演讲稿逻辑结构评价方法得到的逻辑结构评价结果与人工标注的结果进行比较，相关性达到了97%，一致性达到了82%，极大提高了评价效率，并具备较高的准确性。

为了更好实施本申请实施例中的演讲稿逻辑结构评价方法，在演讲稿逻辑结构评价方法基础之上，本申请实施例还提供一种演讲稿逻辑结构评价装置，如图8所示，图8为根据本申请实施例提供的一种演讲稿逻辑结构评价装置的一个实施例结构示意图，该演讲稿逻辑结构评价装置800包括：

划分模块801，用于对获取的待评价演讲稿文本进行划分处理，得到多个目标评价单元；

连词识别模块802，用于分别对多个目标评价单元中的每一目标评价单元进行连词识别处理，得到每一目标评价单元对应的连词识别结果；其中，连词识别结果用于表征预设连词在每一目标评价单元中的出现概率；

评价模块803，用于根据每一目标评价单元对应的连词识别结果，得到待评价演讲稿文本的逻辑结构评价结果。

在本申请一些实施例中，划分模块801具体可以用于：

在本申请一些实施例中，连词识别模块802具体可以用于：

在本申请一些实施例中，预设连词包括多个连接词，连词识别模块802具体还可以用于：

在本申请一些实施例中，演讲稿逻辑结构评价装置800还可以包括：

模型训练模块804，用于对若干训练样本句段中的每一训练样本句段进行标注，得到与每一训练样本句段的连词相对应的样本标签；其中，若干训练样本句段分别携带有不同的连词，不同的连词中含义相同或相近的连词构成连词集合，样本标签与连词集合中的所有连词相对应；

在本申请一些实施例中，评价模块803具体可以用于：

在本申请一些实施例中，评价模块803具体还可以用于：

具体的，本申请实施例的装置中各模块实现其功能的具体过程可参见如图2至图7对应任意实施例中演讲稿逻辑结构评价方法的说明，具体在此不再赘述。

本申请实施例还提供一种演讲稿逻辑结构评价设备，该演讲稿逻辑结构评价设备集成了本申请实施例所提供的任一种演讲稿逻辑结构评价装置，该演讲稿逻辑结构评价设备包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，该指令被至少一个处理器执行，以使至少一个处理器执行上述演讲稿逻辑结构评价方法中任一实施例中的演讲稿逻辑结构评价方法中的步骤。

本申请实施例的一种演讲稿逻辑结构评价设备，其集成了本申请实施例所提供的任一种演讲稿逻辑结构评价装置。如图9所示，其示出了本申请实施例所涉及的演讲稿逻辑结构评价设备的结构示意图，具体来讲：

该电子设备可以包括一个或者一个以上处理核心的处理器901、一个或一个以上计算机可读存储介质的存储器902、电源903和输入单元904等部件。本领域技术人员可以理解，图9中示出的演讲稿逻辑结构评价设备结构并不构成对演讲稿逻辑结构评价设备的限定，还可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器901是该演讲稿逻辑结构评价设备的控制中心，利用各种接口和线路连接整个演讲稿逻辑结构评价设备的各个部分，通过运行或执行存储在存储器902内的软件程序和/或模块，以及调用存储在存储器902内的数据，执行演讲稿逻辑结构评价设备的各种功能和处理数据，从而对演讲稿逻辑结构评价设备进行整体监控。可选的，处理器901可包括一个或多个处理核心；处理器901可以是中央处理单元（Central Processing Unit，CPU），还可以是其他通用处理器、数字信号处理器（Digital Signal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现成可编程门阵列（Field-Programmable Gate Array，FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，优选的，处理器901可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器901中。

存储器902可用于存储软件程序以及模块，处理器901通过运行存储在存储器902的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器902可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如声音播放功能、图像播放功能等）等；存储数据区可存储根据服务器的使用所创建的数据等。此外，存储器902可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器902还可以包括存储器控制器，以提供处理器901对存储器902的访问。

该演讲稿逻辑结构评价设备还包括给各个部件供电的电源903，优选的，电源903可以通过电源管理系统与处理器901逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源903还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该演讲稿逻辑结构评价设备还可以包括输入单元904，该输入单元904可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，该演讲稿逻辑结构评价设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，演讲稿逻辑结构评价设备中的处理器901会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器902中，并由处理器901来运行存储在存储器902中的应用程序，从而实现各种功能，如下：

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的演讲稿逻辑结构评价装置、演讲稿逻辑结构评价设备及其相应单元的具体工作过程，可以参考如图1至图7对应任意实施例中演讲稿逻辑结构评价方法的说明，具体在此不再赘述。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器901进行加载和执行。

为此，本申请实施例提供一种计算机可读存储介质，该计算机可读存储介质可以包括：只读存储器（Read Only Memory ，ROM）、随机存取记忆体（Random Access Memory ，RAM）、磁盘或光盘等。该计算机可读存储介质上存储有计算机程序，计算机程序被处理器进行加载，以执行本申请实施例所提供的任一种演讲稿逻辑结构评价方法中的步骤。例如，计算机程序被处理器进行加载可以执行如下步骤：

本领域内的技术人员应明白，本申请的实施例可提供为方法、设备（系统）或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备（系统）和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

显然，上述实施例仅仅是为清楚地说明所作的举例，而并非对实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims

1.一种演讲稿逻辑结构评价方法，其特征在于，所述方法包括：

分别对所述多个目标评价单元中的每一目标评价单元进行连词识别处理，得到所述每一目标评价单元对应的连词识别结果；其中，所述连词识别结果用于表征预设连词在所述每一目标评价单元中的出现概率；

根据所述每一目标评价单元对应的连词识别结果，得到所述待评价演讲稿文本的逻辑结构评价结果。

2.根据权利要求1所述的方法，其特征在于，所述对获取的待评价演讲稿文本进行划分处理，得到多个目标评价单元，包括：

根据预设的划分窗口和所述划分窗口的移动步长，对所述待评价演讲稿文本进行逐句划分，得到所述多个目标评价单元；

其中，所述多个目标评价单元中的每一目标评价单元包括至少一个的所述待评价演讲稿文本的句段。

3.根据权利要求2所述的方法，其特征在于，所述划分窗口的窗口宽度根据所述待评价演讲稿文本的句段长度确定。

4.根据权利要求1所述的方法，其特征在于，所述分别对所述多个目标评价单元中的每一目标评价单元进行连词识别处理，得到所述每一目标评价单元对应的连词识别结果，包括：

针对所述多个目标评价单元中的每一目标评价单元，将所述每一目标评价单元依次输入预设的连词识别模型；

通过所述连词识别模型对所述每一目标评价单元进行连词识别处理，得到所述每一目标评价单元对应的连词识别结果。

5.根据权利要求4所述的方法，其特征在于，所述预设连词包括多个连接词；

所述通过所述连词识别模型对所述每一目标评价单元进行连词识别处理，得到所述每一目标评价单元对应的连词识别结果，包括：

所述连词识别模型基于所述多个连接词对所述每一目标评价单元的内容进行特征匹配及提取，得到所述多个连接词在所述每一目标评价单元中相应的出现概率；

根据所述多个连接词在所述每一目标评价单元中相应的出现概率，得到所述每一目标评价单元对应的连词识别结果。

6.根据权利要求4所述的方法，其特征在于，所述通过所述连词识别模型对所述每一目标评价单元进行连词识别处理之前，所述方法包括：

对若干训练样本句段中的每一训练样本句段进行标注，得到与所述每一训练样本句段的连词相对应的样本标签；其中，所述若干训练样本句段分别携带有不同的连词，所述不同的连词中含义相同或相近的连词构成连词集合，所述样本标签与所述连词集合中的所有连词相对应；

将所述若干训练样本句段依次输入预设的初始连词识别模型，基于所述每一训练样本句段和与所述每一训练样本句段的连词相对应的样本标签，对所述初始连词识别模型进行连词识别训练，将训练好的初始连词识别模型作为所述连词识别模型。

7.根据权利要求1-6所述的方法，其特征在于，所述根据所述每一目标评价单元对应的连词识别结果，得到所述待评价演讲稿文本的逻辑结构评价结果，包括：

将所述每一目标评价单元对应的连词识别结果依次输入预设的评价模型；

通过所述评价模型对多个所述连词识别结果进行综合评估分析，得到所述待评价演讲稿文本的逻辑结构评价结果。

8.根据权利要求7所述的方法，其特征在于，所述通过所述评价模型对多个所述连词识别结果进行综合评估分析，得到所述待评价演讲稿文本的逻辑结构评价结果，包括：

所述评价模型根据多个所述连词识别结果中所述预设连词的出现概率，以及所述预设连词在所述多个目标评价单元中的分布情况进行综合评估分析，得到所述待评价演讲稿文本的逻辑结构评价结果；

其中，所述逻辑结构评价结果包括评价分数、评价类别或评价等级中的一种或多种。

9.一种演讲稿逻辑结构评价设备，其特征在于，所述演讲稿逻辑结构评价设备包括处理器、存储器以及存储于所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序以实现权利要求1-8任一项所述的演讲稿逻辑结构评价方法中的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行以实现权利要求1-8任一项所述的演讲稿逻辑结构评价方法中的步骤。