CN113076736B - 多维度的文本评分方法、装置、计算机设备及存储介质 - Google Patents
多维度的文本评分方法、装置、计算机设备及存储介质Info
- Publication number
- CN113076736B CN113076736B CN202110481306.3A CN202110481306A CN113076736B CN 113076736 B CN113076736 B CN 113076736B CN 202110481306 A CN202110481306 A CN 202110481306A CN 113076736 B CN113076736 B CN 113076736B
- Authority
- CN
- China
- Prior art keywords
- text
- scoring
- dimension
- scored
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013598 vector Substances 0.000 claims abstract 25
- 238000006243 chemical reaction Methods 0.000 claims abstract 12
- 238000000034 method Methods 0.000 claims abstract 9
- 238000013077 scoring method Methods 0.000 claims abstract 2
- 238000011176 pooling Methods 0.000 claims 5
- 238000004590 computer program Methods 0.000 claims 4
Abstract
本发明实施例公开了一种多维度的文本评分方法、装置、计算机设备及存储介质。所述方法包括:获取待评分文本;然后根据预设的文本转换网络模型将所述待评分文本转换成文本特征向量;再基于预设的多个评分维度中每个评分维度分别对应的LSTM评分模型,分别对所述文本特征向量进行评分,得到所述待评分文本在每个评分维度下的维度分数;最后根据所述维度分数确定所述待评分文本的目标分数。本发明实施例中,使用了多个评分维度的LSTM评分模型分别对文本进行了对应维度的评分,得到待评分文本多个评分维度下的分数,所以本方案不需耗费人力就可以快速地从多个维度去对文本进行评分。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种多维度的文本评分方法、装置、计算机设备及存储介质。
背景技术
随着科技的进步,越来越多工作使用机器来代替完成,随着人们对教育越来越重视,越来越多的学生需要通过练习写作提高自己的文章水平。
在对文章进行评分时,一方面,现在绝大多数的文章打分依然基于人工审阅,在审阅众多文章以及对文章做出各维度的评分非常浪费时间,并且文章的审核时间较长;另一方面,现在自动文章评分领域所做的大部分研究工作都是着眼于文章的整体评分,而不是研究文章特征在整体评分中的重要性,那么作者以及老师得到的仅仅只能是总体的分数,但是他们依然不清楚文章在哪方面进行改进,很难帮助作者在写作方面取得进步。
目前,还未提供一种能够快速地从多个维度去对文章评分的方法。
发明内容
本发明实施例提供了一种多维度的文本评分方法、装置、计算机设备及存储介质,可以快速地从多个维度去对文本进行评分。
第一方面,本发明实施例提供了一种多维度的文本评分方法,其包括:
获取待评分文本;
根据预设的文本转换网络模型将所述待评分文本转换成文本特征向量;
基于预设的多个评分维度中每个评分维度分别对应的LSTM评分模型,分别对所述文本特征向量进行评分,得到所述待评分文本在每个评分维度下的维度分数;
根据所述维度分数确定所述待评分文本的目标分数。
第二方面,本发明实施例还提供了一种多维度的文本评分装置,其包括用于执行上述方法的单元。
第三方面,本发明实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时可实现上述方法。
本发明实施例提供了一种多维度的文本评分方法、装置、计算机设备及存储介质。其中,所述方法包括:获取待评分文本;然后根据预设的文本转换网络模型将所述待评分文本转换成文本特征向量;再基于预设的多个评分维度中每个评分维度分别对应的LSTM评分模型,分别对所述文本特征向量进行评分,得到所述待评分文本在每个评分维度下的维度分数;最后根据所述维度分数确定所述待评分文本的目标分数。本发明实施例中,使用了多个评分维度的LSTM评分模型分别对文本进行了对应维度的评分,得到待评分文本多个评分维度下的分数,所以本方案不需耗费人力就可以快速地从多个维度去对文本进行评分。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的多维度的文本评分方法的应用场景示意图;
图2为本发明实施例提供的多维度的文本评分方法的一个流程示意图;
图3为本发明实施例提供的多维度的文本评分方法的一个子流程示意图;
图4为本发明实施例提供的文本转换模型的框架示意图;
图5为本发明实施例提供的多维度的文本评分方法的另一个子流程示意图;
图6为本发明实施例提供的LSTM评分模型的框架示意图;
图7为本发明实施例提供的多维度的文本评分方法的另一个子流程示意图;
图8为本发明另一实施例提供的多维度的文本评分方法的一个流程示意图;
图9为本发明实施例提供的多维度的文本评分装置的示意性框图;
图10为本发明另一实施例提供的多维度的文本评分装置的示意性框图;
图11为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本发明实施例提供一种多维度的文本评分方法、装置、计算机设备及存储介质。
该多维度的文本评分方法的执行主体可以是本发明实施例提供的多维度的文本评分装置,或者集成了该多维度的文本评分装置的计算机设备,其中,该多维度的文本评分装置可以采用硬件或者软件的方式实现,该计算机设备可以包括服务器或终端,该终端可以是智能手机、平板电脑、掌上电脑、或者笔记本电脑等。
例如,请参阅图1,图1为本发明实施例提供的多维度的文本评分方法的一个应用场景示意图。该多维度的文本评分方法可以应用于如图1所示的计算机设备中,当用户需要对待评分文本进行多维度评分时,可以将该待评分文本提供给该计算机设备,然后计算机设备根据文本转换网络模型将待评分文本转换成文本特征向量,再将该文本特征向量分别输入多个评分维度中每个评分维度分别对应的长短期记忆网络(Long Short-TermMemory,LSTM)评分模型,例如,将该文本特征向量分别输入第一评分点LSTM评分模型、第二评分点LSTM评分模型…以及第N评分点LSTM评分模型,其中N为大于2的整数,然后输出第一评分点分数、第二评分点分数…以及第N评分点分数,最后根据第一评分点分数、第二评分点分数…以及第N评分点分数得到该待评分文本的目标分数。
图2是本发明实施例提供的多维度的文本评分方法的一个流程示意图。如图所示,该方法包括以下步骤S110-140。
S110、获取待评分文本。
本实施例中,该待评分文本可以为中文、也可以为英文等其他语言的文本,具体语言类型此处不做限定,其中,该待评分文本可以为论文、作文以及日记等文本,文本的类型此处不做限定。
在一些实施例中,当作者(例如学生)完成待评分文本的写作时,或者文本的评分者(例如老师)获取到该待评分文本时,若该待评分文本为电子文本,则将该待评分文本直接输入计算机设备中。
在一些实施例中,若需要对纸质文本进行评分,例如,作者在撰写文本时将文本写在了纸上,则此时需要用户对该纸质文本进行拍照,此时,如图3所示,步骤S110包括:
S111、获取包含该待评分文本的图像。
譬如,用户对对写在纸上的待评分文本进行拍照,得到包含该待评分文本的图像,然后将该图像输入计算机设备中。
又譬如,计算机设备上设置有摄像头,用户直接通过计算机设备上的摄像头拍摄获取包含该待评分文本的图像。
S112、对图像进行光学字符识别处理,得到待评分文本。
本实施例中,得到包含该待评分文本的图像之后,对该图像进行光学字符识别(Optical Character Recognition,OCR)处理,将识别到的文本作为待评分文本。
在一些实施例中,本实施例中的计算机设备还支持文本在线评分,即用户可以在线撰写文本,此时网络识别可以为手机或计算机等终端。
例如当用户写完一个段落或者一个句子的时候,计算机设备自动将该段落或者句子作为待评分文本进行评分,或者当用户在在线撰写的过程中想对文本进行检测的时候,主动触发计算机设备执行本发明中的多维度的文本评分方法,此时计算机设备将用户已经撰写的文本作为待检测文本。
S120、根据预设的文本转换网络模型将待评分文本转换成文本特征向量。
在一些实施例中,文本转换网络模型可以为向量空间模型(Vector Space Model,VSM)。
其中,如图4所示,本实施例中的文本转换模型包括词嵌入层、卷积层、池化层以及稠密层,在一些实施例中,本实施例中的文本转换模型可以对应多个LSTM评分模型;在另一些实施例中,每个LSTM评分模型分别对应一个文本转换模型;再在另一些实施例中,文本转换模型中的词嵌入层可以对应多个文本转换模型,此时,对应的文本转换模型包括卷积层、池化层以及稠密层,每个LSTM评分模型分别对应一个文本转换模型。
在一些实施例中,如图5所示,步骤S120包括:
S121、将待评分文本拆分成多个单词。
本实施例中,若待评分文本是中文文本,则此时的单词为中文的词语,例如“花朵”、“天空”以及“的”等,此时需要根据词汇识别网络模型识别出待评分文本中的词,然后根据识别出来的词对文本进行拆分,其中,词汇识别网络模型可以为根据现有词汇训练而成的卷积神经网络。
若待评分文本是英文文本,则将每个将待评分文本拆分成多个单词,例如,将“Iam”拆分成“I”和“am”。
S122、根据文本转换网络模型中的词嵌入层分别将多个单词转换成多个词特征向量。
具体地,本实施例中的词嵌入层(Word Embedding)是一种将文本中的词转换成数字向量的方法,由于计算机是不能够看懂文字的,为了使用标准机器学习算法来对它们进行分析,就需要把这些被转换成数字的向量以数字形式作为输入。
在一些实施例中,我们使用最常见的5000个单词作为词汇表,所有其他单词映射到成向量,例如在词嵌入层中使用one-hot编码将“I”和“am”分别表示为[1,0,0,0,0,0,0,0,0,0],[0,1,0,0,0,0,0,0,0,0],方便计算机识别。例如给出一个由单词“w1、w、…wm”组成的文本,此时将单词映射成xi,i=1,2,…m,如下公式所示:
xi=Ewi;
其中,wi是文本中第i个单词的编码表示,E是嵌入矩阵,xi是第i个单词的嵌入向量,即词特征向量。
S123、根据多个词特征向量确定待评分文本的句子特征向量。
在一些实施例中,步骤S123包括:在文本转换网络模型的卷积(ConvolutionalLayer)层中,利用过滤器得到多个词特征向量的分散的句子特征向量;然后根据文本转换网络模型中的池化层对分散的句子特征向量进行尺度统一处理(即通过池化层固定输出的维度),得到句子特征向量。
具体地,将词特征向量xi,i=1,2,…m传输到卷积层和池化层进行聚合,如果一个文本中有10单词,每个单词用100维向量表示,利用上述方法会生成10×100的向量,这就是“图像”,卷积层中利用过滤器滑过由词特征向量组成的整个矩阵得到分散的句子特征向量表达(每个句子特征向量为一个特征图),然后通过池化层固定输出的维度,方便稠密层进行加权分配。
S124、根据文本转换网络模型中的稠密层对句子特征向量进行加权分配处理,得到文本特征向量。
其中,本实施例中的文本特征向量由多个句子特征向量组成,稠密层为文本转换网络模型的全连接层。
本实施例中,通过稠密层对步骤S123得到的多个句子特征向量进行加权分配,得到多个句子特征向量分别对应的加权后的句子特征向量,多个加权后的句子特征向量组成本实施例中的文本特征向量。
S130、基于预设的多个评分维度中每个评分维度分别对应的LSTM评分模型,分别对文本特征向量进行评分,得到待评分文本在每个评分维度下的维度分数。
本实施例中,LSTM评分模型的框架如图6所示,包括LSTM层、池化层以及稠密层。
在一些实施例中,如图7所示,针对每个评分维度分别对应的LSTM评分模型,步骤S130包括:
S131、通过LSTM评分模型中LSTM层的评分逻辑分别确定文本特征向量中每个句子特征向量的句子分数。
本实施例中,LSTM据有记忆性并且可以将上下文关联,例如预测“the clouds areinthe...”的最后一个单词,通过已有数据的训练(语境预测),下一个单词显然是sky。LSTM能够在更长的句子甚至整篇文章中预测到最佳匹配的单词与句子,有利于各个评分维度的评分。
本实施例中,评分逻辑即(评分标准)判断句子出现什么情况需要被扣分,对于每个得分点而言,训练的LSTM评分模型的评分逻辑是不一样的,本实施例以评分维度包括“句子结构维度”、“语法维度”以及“文本与主题的关联维度”为例进行距离说明,当然评分维度还可以根据设置包括其他评分维度,例如“高级词维度”以及“布局维度”等,评分维度的具体类型此处不做限定。
对于“句子结构维度”对应的LSTM评分模型,可以按照句法分析树,例如主谓宾结构,利用语料库中的正确结构句子与非正确结构句子训练LSTM评分模型,将词语分为形容词副词等,通过固定句子搭配判断句子的结构是否正确并对每个句子进行评分。
对于“语法维度”对应的LSTM评分模型,可以通过将句子分为不同的词性,例如:“Linda will feel uncomfortable.”对应的词性标注为:(‘Linda’‘NNP’),(‘will’‘MD’)(‘feel’‘VB’)(‘uncomfortable’‘ADJ’)。将其中的专有名词(NNP)及情态动词(MD)动词(VB),形容词(ADJ),利用LSTM的记忆功能预测与之能够搭配的单词的词性并与句子做对比,如果错误则会扣分。
对于“文本与主题的关联维度”对应的LSTM评分模型,可以查找与主题类似的单词,与观点相似的句子,对论证过程构成意义的句子等。利用LSTM的分类功能以及预测功能,通过数据(如语料库中的同义词,合理的逻辑结构)对LSTM模型进行训练,利用分类计算将相关的语句找出并进行评分。
S132、通过LSTM评分模型中的池化层对句子分数进行尺度统一处理,得到处理后的句子分数。
本实施例中,对句子分数进行尺度统一处理,即将待评分文本中的每个句子所对应的句子分数处理成固定的维度,方便后面稠密层进行加权分配。
S133、通过LSTM评分模型中的稠密层对处理后的句子分数进行加权分配处理,得到待评分文本的维度分数。
本实施例中,每个评分维度都有对应的权重分配规则,譬如,位于待测文本前面和后面的句子所占的权重比较高,位于待测文本中间的句子所占的权重比较低。
又譬如,根据句子的长度确定对应的句子分数的权重,句子越长,对应的句子分数所占的权重越高,反之,句子越短,所占的权重越低,此时,步骤S133包括:确定每个处理后的句子分数分别对应的句子长度;然后通过稠密层根据句子长度确定处理后的句子分数分别对应的权重;最后通过稠密层根据权重对处理后的句子分数进行加权分配处理,得到待评分文本的维度分数。
即本实施例中,会对待评分文本中的每个句子分别进行各评分维度的评分,然后根据句子的权重,对每个句子所对应的句子分数进行加权分配处理,分别得到待评分文本在各评分维度下的分数。
S140、根据维度分数确定待评分文本的目标分数。
具体地,本实施例中的目标分数包括待评分文本各维度的综合分数以及各个评分维度的维度分数。
其中,在确定待评分文本的综合分数时,需要根据每个评分维度分别对应权重以及所述维度分数确定所述待评分文本的综合分数,本实施例中,每个评分维度都预设有其对应的权重,例如,“句子结构维度”的权重为0.2、“语法维度”的权重为0.3、“文本与主题的关联维度”的群众为0.5,此时,综合分数=句子结构维度分数*0.2+语法维度分数*0.3+文本与主题的关联维度分数*0.5。
在一些实施例中,在各LSTM评分模型之后连接一个稠密层,然后通过该稠密层对各个维度分数进行加权评分,得到综合分数。
具体地,当确定待评分文本的目标分数分数之后,将输出目标分数给用户看,如果本实施例中的计算机设备为终端,则此时可以直接输出目标分数,如果本实施例中的计算机设备是服务器,则此时服务器需要将该目标分数发送给用户终端,使得用户获得待评分文本的目标分数。
用户获取待评分文本的目标分数之后,由于目标分数不仅包括综合分数,还包括各维度的维度分数,用户就可以知道待评分文本哪个方面有待改进,可以更好地帮助作者提高撰写水平。
在一些实施例中,本实施例中的计算机设备还可以在进行各评分维度评分时,收集错误点,然后根据收集到的错误点对对应的评分维度进行自动评价,例如,在“语法维度”中,如果超过5处语法错误会自动添加需要注意语法的评论等。
综上所述,本实施例中的计算机设备获取待评分文本;然后根据预设的文本转换网络模型将待评分文本转换成文本特征向量;再基于预设的多个评分维度中每个评分维度分别对应的LSTM评分模型,分别对文本特征向量进行评分,得到待评分文本在每个评分维度下的维度分数;最后根据维度分数确定待评分文本的目标分数。本发明实施例中,使用了多个评分维度的LSTM评分模型分别对文本进行了对应维度的评分,得到待评分文本多个评分维度下的分数,所以本方案不需耗费人力就可以快速地从多个维度去对文本进行评分。
图8是本发明另一实施例提供的一种多维度的文本方法的流程示意图。如图8所示,本实施例的多维度的文本方法包括步骤S210-S290。其中步骤S210-S240与上述实施例中的步骤S110-S140类似,在此不再赘述。下面对本实施例中所增加的步骤S250-S290进行说明。
S250、接收待评分文本对应的修改文本。
本实施例中,待评分文本对应的修改文本为用户根据之前的待评分文本的目标分数进行过文本语句修改的文本,为了检验修改的效果,用户可以将修改文本输入计算机设备进行再一次的验证。
在一些实施例中,计算机设备可以根据修改文本的文本标识确定该修改文本是否被评分过,如果确定被评分过,则根据评分记录找出该修改文本对应的前文本,其中,该文本标识可以为文本标题或者文本编号等,标识的具体类型此处不做限定。
S260、根据文本转换网络模型将修改文本转换成修改文本特征向量。
S270、基于LSTM评分模型,分别对修改文本特征向量进行评分,得到修改文本在每个评分维度下的修改文本维度分数。
S280、根据修改文本维度分数确定修改文本的修改文本目标分数。
需要说明的是,步骤S260至S280与步骤S120至S140相比,待评分文本替换成了修改文本,其他步骤两者类似,具体此处也不做赘述。
S290、将目标分数与修改文本目标分数做比对,得到分数比对结果。
具体地,本实施例将目标分数与修改文本目标分数中对应的维度分数做比对,综合分数与对应的综合分数作比对,得到分数的比对结果。
其中,分数的比对结果包括,各评分维度的分数变化情况以及综合分数的比对情况,例如句子结构维度提高5分,语法维度分数提高4分,文本与主题的关联维度分数提高6分,综合分数提高5.2分,方便用户作比对,知道修改后的文本是否有改进,以及哪个维度有改进。
图9是本发明实施例提供的一种多维度的文本评分装置的示意性框图。如图9所示,对应于以上多维度的文本评分方法,本发明还提供一种多维度的文本评分装置。该多维度的文本评分装置包括用于执行上述多维度的文本评分方法的单元,该装置可以被配置于终端或服务器中。具体地,请参阅图9,该多维度的文本评分装置包括获取单元901、转换单元902、评分单元903以及确定单元904,其中:
获取单元901,用于获取待评分文本;
转换单元902,用于根据预设的文本转换网络模型将所述待评分文本转换成文本特征向量;
评分单元903,用于基于预设的多个评分维度中每个评分维度分别对应的LSTM评分模型,分别对所述文本特征向量进行评分,得到所述待评分文本在每个评分维度下的维度分数;
确定单元904,用于根据所述维度分数确定所述待评分文本的目标分数。
在一些实施例中,所述评分单元903具体用于:
针对所述每个评分维度分别对应的LSTM评分模型,通过所述LSTM评分模型中LSTM层的评分逻辑分别确定所述文本特征向量中每个句子特征向量的句子分数;
通过所述LSTM评分模型中的池化层对所述句子分数进行尺度统一处理,得到处理后的句子分数;
通过所述LSTM评分模型中的稠密层对所述处理后的句子分数进行加权分配处理,得到所述待评分文本的维度分数。
在一些实施例中,所述评分单元903进一步具体用于:
确定每个所述处理后的句子分数分别对应的句子长度;
通过所述稠密层根据所述句子长度确定所述处理后的句子分数分别对应的权重;
通过所述稠密层根据所述权重对所述处理后的句子分数进行加权分配处理,得到所述待评分文本的维度分数。
在一些实施例中,所述转换单元902具体用于:
将所述待评分文本拆分成多个单词;
根据所述文本转换网络模型中的词嵌入层分别将所述多个单词转换成多个词特征向量;
根据所述多个词特征向量确定所述待评分文本的句子特征向量;
根据所述文本转换网络模型中的稠密层对所述句子特征向量进行加权分配处理,得到所述文本特征向量。
在一些实施例中,所述转换单元902进一步具体用于:
在所述文本转换网络模型的卷积层中,利用过滤器得到所述多个词特征向量的分散的句子向量;
根据所述文本转换网络模型中的池化层对所述分散的句子特征向量进行尺度统一处理,得到所述句子特征向量。
在一些实施例中,所述确定单元904具体用于:
根据每个评分维度分别对应权重以及所述维度分数确定所述待评分文本的综合分数;
将所述综合分数以及所述维度分数确定为所述目标分数。
在一些实施例中:
所述获取单元901,还用于接收所述待评分文本对应的修改文本;
转换单元902,还用于根据所述文本转换网络模型将所述修改文本转换成修改文本特征向量;
评分单元903,还用于基于所述LSTM评分模型,分别对所述修改文本特征向量进行评分,得到所述修改文本在每个评分维度下的修改文本维度分数;
确定单元904,还用于根据所述修改文本维度分数确定所述修改文本的修改文本目标分数;
图10是本发明另一实施例提供的一种多维度的文本评分装置的示意性框图。如图10所示,本实施例的多维度的文本评分装置是上述实施例的基础上增加了比对单元905。
比对单元905,用于将所述目标分数与所述修改文本目标分数做比对,得到分数比对结果。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述多维度的文本评分装置和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述多维度的文本评分装置可以实现为一种计算机程序的形式,该计算机程序可以在如图11所示的计算机设备上运行。
请参阅图11,图11是本发明实施例提供的一种计算机设备的示意性框图。该计算机设备1100可以是终端,也可以是服务器,其中,终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图11,该计算机设备1100包括通过系统总线1101连接的处理器1102、存储器和网络接口1105,其中,存储器可以包括非易失性存储介质1103和内存储器1104。
该非易失性存储介质1103可存储操作系统11031和计算机程序11032。该计算机程序11032包括程序指令,该程序指令被执行时,可使得处理器1102执行一种多维度的文本评分方法。
该处理器1102用于提供计算和控制能力,以支撑整个计算机设备1100的运行。
该内存储器1104为非易失性存储介质1103中的计算机程序11032的运行提供环境,该计算机程序11032被处理器1102执行时,可使得处理器1102执行一种多维度的文本评分方法。
该网络接口1105用于与其它设备进行网络通信。本领域技术人员可以理解,图11中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备1100的限定,具体的计算机设备1100可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器1102用于运行存储在存储器中的计算机程序11032,以实现如下步骤:
获取待评分文本;
根据预设的文本转换网络模型将所述待评分文本转换成文本特征向量;
基于预设的多个评分维度中每个评分维度分别对应的LSTM评分模型,分别对所述文本特征向量进行评分,得到所述待评分文本在每个评分维度下的维度分数;
根据所述维度分数确定所述待评分文本的目标分数。
在一些实施例中,处理器1102在实现所述基于预设的多个评分维度中每个评分维度分别对应的LSTM评分模型,分别对所述文本特征向量进行评分,得到所述待评分文本在每个评分维度下的维度分数步骤时,具体实现如下步骤:
针对所述每个评分维度分别对应的LSTM评分模型,通过所述LSTM评分模型中LSTM层的评分逻辑分别确定所述文本特征向量中每个句子特征向量的句子分数;
通过所述LSTM评分模型中的池化层对所述句子分数进行尺度统一处理,得到处理后的句子分数;
通过所述LSTM评分模型中的稠密层对所述处理后的句子分数进行加权分配处理,得到所述待评分文本的维度分数。
在一些实施例中,处理器1102在实现所述通过所述LSTM评分模型中的稠密层对所述处理后的句子分数进行加权分配处理,得到所述待评分文本的维度分数步骤时,具体实现如下步骤:
确定每个所述处理后的句子分数分别对应的句子长度;
通过所述稠密层根据所述句子长度确定所述处理后的句子分数分别对应的权重;
通过所述稠密层根据所述权重对所述处理后的句子分数进行加权分配处理,得到所述待评分文本的维度分数。
在一些实施例中,处理器1102在实现所述根据预设的文本转换网络模型将所述待评分文本转换成文本特征向量步骤时,具体实现如下步骤:
将所述待评分文本拆分成多个单词;
根据所述文本转换网络模型中的词嵌入层分别将所述多个单词转换成多个词特征向量;
根据所述多个词特征向量确定所述待评分文本的句子特征向量;
根据所述文本转换网络模型中的稠密层对所述句子特征向量进行加权分配处理,得到所述文本特征向量。
在一些实施例中,处理器1102在实现所述根据所述多个词特征向量确定所述待评分文本的句子特征向量步骤时,具体实现如下步骤:
在所述文本转换网络模型的卷积层中,利用过滤器得到所述多个词特征向量的分散的句子向量;
根据所述文本转换网络模型中的池化层对所述分散的句子特征向量进行尺度统一处理,得到所述句子特征向量。
在一些实施例中,处理器1102在实现所述根据所述维度分数确定所述待评分文本的目标分数步骤时,具体实现如下步骤:
根据每个评分维度分别对应权重以及所述维度分数确定所述待评分文本的综合分数;
将所述综合分数以及所述维度分数确定为所述目标分数。
在一些实施例中,处理器1102在实现所述根据所述维度分数确定所述待评分文本的目标分数步骤之后,还实现如下步骤:
接收所述待评分文本对应的修改文本;
根据所述文本转换网络模型将所述修改文本转换成修改文本特征向量;
基于所述LSTM评分模型,分别对所述修改文本特征向量进行评分,得到所述修改文本在每个评分维度下的修改文本维度分数;
根据所述修改文本维度分数确定所述修改文本的修改文本目标分数;
将所述目标分数与所述修改文本目标分数做比对,得到分数比对结果。
应当理解,在本发明实施例中,处理器1102可以是中央处理单元(CentralProcessing Unit,CPU),该处理器1102还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中计算机程序包括程序指令。该程序指令被处理器执行时使处理器执行如下步骤:
获取待评分文本;
根据预设的文本转换网络模型将所述待评分文本转换成文本特征向量;
基于预设的多个评分维度中每个评分维度分别对应的LSTM评分模型,分别对所述文本特征向量进行评分,得到所述待评分文本在每个评分维度下的维度分数;
根据所述维度分数确定所述待评分文本的目标分数。
在一些实施例中,所述处理器在执行所述程序指令而实现所述基于预设的多个评分维度中每个评分维度分别对应的LSTM评分模型,分别对所述文本特征向量进行评分,得到所述待评分文本在每个评分维度下的维度分数步骤时,具体实现如下步骤:
针对所述每个评分维度分别对应的LSTM评分模型,通过所述LSTM评分模型中LSTM层的评分逻辑分别确定所述文本特征向量中每个句子特征向量的句子分数;
通过所述LSTM评分模型中的池化层对所述句子分数进行尺度统一处理,得到处理后的句子分数;
通过所述LSTM评分模型中的稠密层对所述处理后的句子分数进行加权分配处理,得到所述待评分文本的维度分数。
在一些实施例中,所述处理器在执行所述程序指令而实现所述通过所述LSTM评分模型中的稠密层对所述处理后的句子分数进行加权分配处理,得到所述待评分文本的维度分数步骤时,具体实现如下步骤:
确定每个所述处理后的句子分数分别对应的句子长度;
通过所述稠密层根据所述句子长度确定所述处理后的句子分数分别对应的权重;
通过所述稠密层根据所述权重对所述处理后的句子分数进行加权分配处理,得到所述待评分文本的维度分数。
在一些实施例中,所述处理器在执行所述程序指令而实现所述根据预设的文本转换网络模型将所述待评分文本转换成文本特征向量步骤时,具体实现如下步骤:
将所述待评分文本拆分成多个单词;
根据所述文本转换网络模型中的词嵌入层分别将所述多个单词转换成多个词特征向量;
根据所述多个词特征向量确定所述待评分文本的句子特征向量;
根据所述文本转换网络模型中的稠密层对所述句子特征向量进行加权分配处理,得到所述文本特征向量。
在一些实施例中,所述处理器在执行所述程序指令而实现所述根据所述多个词特征向量确定所述待评分文本的句子特征向量步骤时,具体实现如下步骤:
在所述文本转换网络模型的卷积层中,利用过滤器得到所述多个词特征向量的分散的句子向量;
根据所述文本转换网络模型中的池化层对所述分散的句子特征向量进行尺度统一处理,得到所述句子特征向量。
在一些实施例中,所述处理器在执行所述程序指令而实现所述根据所述维度分数确定所述待评分文本的目标分数步骤时,具体实现如下步骤:
根据每个评分维度分别对应权重以及所述维度分数确定所述待评分文本的综合分数;
将所述综合分数以及所述维度分数确定为所述目标分数。
在一些实施例中,所述处理器在执行所述程序指令而实现所述根据所述维度分数确定所述待评分文本的目标分数步骤之后,还实现如下步骤:
接收所述待评分文本对应的修改文本;
根据所述文本转换网络模型将所述修改文本转换成修改文本特征向量;
基于所述LSTM评分模型,分别对所述修改文本特征向量进行评分,得到所述修改文本在每个评分维度下的修改文本维度分数;
根据所述修改文本维度分数确定所述修改文本的修改文本目标分数;
将所述目标分数与所述修改文本目标分数做比对,得到分数比对结果。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者计算机设备等)执行本发明各个实施例所述方法的全部或部分步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (9)
1.一种多维度的文本评分方法,其特征在于,包括:
获取待评分文本;
根据预设的文本转换网络模型将所述待评分文本转换成文本特征向量,所述文本转换网络模型包括词嵌入层、卷积层、池化层以及稠密层;
基于预设的多个评分维度中每个评分维度分别对应的LSTM评分模型,分别对所述文本特征向量进行评分,得到所述待评分文本在每个评分维度下的维度分数;
根据所述维度分数确定所述待评分文本的目标分数;
所述基于预设的多个评分维度中每个评分维度分别对应的LSTM评分模型,分别对所述文本特征向量进行评分,得到所述待评分文本在每个评分维度下的维度分数,包括:
针对所述每个评分维度分别对应的LSTM评分模型,通过所述LSTM评分模型中LSTM层的评分逻辑分别确定所述文本特征向量中每个句子特征向量的句子分数;
通过所述LSTM评分模型中的池化层对所述句子分数进行尺度统一处理,得到处理后的句子分数;
通过所述LSTM评分模型中的稠密层对所述处理后的句子分数进行加权分配处理,得到所述待评分文本的维度分数。
2.根据权利要求1所述的方法,其特征在于,所述通过所述LSTM评分模型中的稠密层对所述处理后的句子分数进行加权分配处理,得到所述待评分文本的维度分数,包括:
确定每个所述处理后的句子分数分别对应的句子长度;
通过所述稠密层根据所述句子长度确定所述处理后的句子分数分别对应的权重;
通过所述稠密层根据所述权重对所述处理后的句子分数进行加权分配处理,得到所述待评分文本的维度分数。
3.根据权利要求1所述的方法,其特征在于,所述根据预设的文本转换网络模型将所述待评分文本转换成文本特征向量,包括:
将所述待评分文本拆分成多个单词;
根据所述文本转换网络模型中的词嵌入层分别将所述多个单词转换成多个词特征向量;
根据所述多个词特征向量确定所述待评分文本的句子特征向量;
根据所述文本转换网络模型中的稠密层对所述句子特征向量进行加权分配处理,得到所述文本特征向量。
4.根据权利要求3所述的方法,其特征在于,所述根据所述多个词特征向量确定所述待评分文本的句子特征向量,包括:
在所述文本转换网络模型的卷积层中,利用过滤器得到所述多个词特征向量的分散的句子向量;
根据所述文本转换网络模型中的池化层对所述分散的句子特征向量进行尺度统一处理,得到所述句子特征向量。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据所述维度分数确定所述待评分文本的目标分数,包括:
根据每个评分维度分别对应权重以及所述维度分数确定所述待评分文本的综合分数;
将所述综合分数以及所述维度分数确定为所述目标分数。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据所述维度分数确定所述待评分文本的目标分数之后,所述方法还包括:
接收所述待评分文本对应的修改文本;
根据所述文本转换网络模型将所述修改文本转换成修改文本特征向量;
基于所述LSTM评分模型,分别对所述修改文本特征向量进行评分,得到所述修改文本在每个评分维度下的修改文本维度分数;
根据所述修改文本维度分数确定所述修改文本的修改文本目标分数;
将所述目标分数与所述修改文本目标分数做比对,得到分数比对结果。
7.一种多维度的文本评分装置,其特征在于,包括:
获取单元,用于获取待评分文本;
转换单元,用于根据预设的文本转换网络模型将所述待评分文本转换成文本特征向量,所述文本转换网络模型包括词嵌入层、卷积层、池化层以及稠密层;
评分单元,用于基于预设的多个评分维度中每个评分维度分别对应的LSTM评分模型,分别对所述文本特征向量进行评分,得到所述待评分文本在每个评分维度下的维度分数;
确定单元,用于根据所述维度分数确定所述待评分文本的目标分数;
所述评分单元具体用于:
针对所述每个评分维度分别对应的LSTM评分模型,通过所述LSTM评分模型中LSTM层的评分逻辑分别确定所述文本特征向量中每个句子特征向量的句子分数;
通过所述LSTM评分模型中的池化层对所述句子分数进行尺度统一处理,得到处理后的句子分数;
通过所述LSTM评分模型中的稠密层对所述处理后的句子分数进行加权分配处理,得到所述待评分文本的维度分数。
8.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-6中任一项所述的方法。
9.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时可实现如权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110481306.3A CN113076736B (zh) | 2021-04-30 | 多维度的文本评分方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110481306.3A CN113076736B (zh) | 2021-04-30 | 多维度的文本评分方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113076736A CN113076736A (zh) | 2021-07-06 |
CN113076736B true CN113076736B (zh) | 2025-04-04 |
Family
ID=
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111199151A (zh) * | 2019-12-31 | 2020-05-26 | 联想(北京)有限公司 | 数据处理方法、及数据处理装置 |
CN112527968A (zh) * | 2020-12-22 | 2021-03-19 | 大唐融合通信股份有限公司 | 一种基于神经网络的作文评阅方法和系统 |
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111199151A (zh) * | 2019-12-31 | 2020-05-26 | 联想(北京)有限公司 | 数据处理方法、及数据处理装置 |
CN112527968A (zh) * | 2020-12-22 | 2021-03-19 | 大唐融合通信股份有限公司 | 一种基于神经网络的作文评阅方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2607416C2 (ru) | Крауд-сорсные системы обучения лексике | |
Wang et al. | Covost: A diverse multilingual speech-to-text translation corpus | |
US8744855B1 (en) | Determining reading levels of electronic books | |
US10147336B2 (en) | Systems and methods for generating distractors in language learning | |
US10504010B2 (en) | Systems and methods for fast novel visual concept learning from sentence descriptions of images | |
Cummins et al. | Constrained multi-task learning for automated essay scoring | |
US10803850B2 (en) | Voice generation with predetermined emotion type | |
US20120141959A1 (en) | Crowd-sourcing the performance of tasks through online education | |
KR101988165B1 (ko) | 청각 장애 학생들을 위한 전문 자료 텍스트 분석 기반 음성인식 기술 정확도 향상 방법 및 시스템 | |
CN110929532B (zh) | 数据处理方法、装置、设备及存储介质 | |
Malmi et al. | Automatic prediction of discourse connectives | |
CN110853422A (zh) | 一种沉浸式语言学习系统及其学习方法 | |
US10867525B1 (en) | Systems and methods for generating recitation items | |
CN113836894A (zh) | 多维度英语作文评分方法、装置及可读存储介质 | |
CN112559711A (zh) | 一种同义文本提示方法、装置及电子设备 | |
CN113076736B (zh) | 多维度的文本评分方法、装置、计算机设备及存储介质 | |
Safari et al. | Data augmentation and preparation process of perinfex: A persian chatbot with the ability of information extraction | |
Duan et al. | Automatically build corpora for chinese spelling check based on the input method | |
CN117932020A (zh) | 评分模型的训练方法、评分方法和装置 | |
US20240320500A1 (en) | Method and apparatus for generating training data | |
Jones | Development and evaluation of speech recognition for the welsh language | |
Yoon et al. | Toward automated content feedback generation for non-native spontaneous speech | |
CN113076736A (zh) | 多维度的文本评分方法、装置、计算机设备及存储介质 | |
CN113177406A (zh) | 文本处理方法、装置、电子设备和计算机可读介质 | |
CN117275319B (zh) | 训练语言重点能力的装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |