[go: up one dir, main page]

CN111428724B - 一种试卷手写统分方法、装置及存储介质 - Google Patents

一种试卷手写统分方法、装置及存储介质 Download PDF

Info

Publication number
CN111428724B
CN111428724B CN202010286693.0A CN202010286693A CN111428724B CN 111428724 B CN111428724 B CN 111428724B CN 202010286693 A CN202010286693 A CN 202010286693A CN 111428724 B CN111428724 B CN 111428724B
Authority
CN
China
Prior art keywords
image
unified
test paper
picture
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010286693.0A
Other languages
English (en)
Other versions
CN111428724A (zh
Inventor
杨仁凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Star Net Ruijie Networks Co Ltd
Original Assignee
Beijing Star Net Ruijie Networks Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Star Net Ruijie Networks Co Ltd filed Critical Beijing Star Net Ruijie Networks Co Ltd
Priority to CN202010286693.0A priority Critical patent/CN111428724B/zh
Publication of CN111428724A publication Critical patent/CN111428724A/zh
Application granted granted Critical
Publication of CN111428724B publication Critical patent/CN111428724B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Character Input (AREA)

Abstract

本申请公开了一种试卷手写统分方法、装置及存储介质,涉及图像处理领域,用以节约人力资源,提高统分的效率。该方法中,通过对试卷图像进行本文检测得到文本候选框,并根据文本候选框的位置确定待统分候选框,根据待统分候选框对应的待统分图片进行图像识别得到待统分图片中的字符信息,从而完成统分。这样,通过机器自动的对试卷进行统分,可以节省人力资源,并提高了统分的效率;且由于是根据试卷图像进行统分,因此无需将每一道题目的分数填写到试卷首页分数栏也可进行统分,使阅卷老师可以节省阅卷时间,提高了阅卷老师的工作效率。

Description

一种试卷手写统分方法、装置及存储介质
技术领域
本申请涉及图像处理领域,尤其涉及一种试卷手写统分方法、装置及存储介质。
背景技术
在相关技术中,多数科目的试卷还是采用人工阅卷的方式,阅卷老师在阅卷后将每道题目的分数统一填写到试卷首页分数栏,并核算总分,但是人工计算总分无论是用心算还是用计算器都比较容易出错。
因此,在相关技术中,对手写试卷的统分需要使用较多的人力资源,且统分的效率较低。
发明内容
本申请实施例提供一种试卷手写统分方法、装置及存储介质,用以节约人力资源,提高统分的效率。
第一方面,本申请实施例提供一种试卷手写统分方法,该方法包括:
对获取的试卷图像进行文本检测,得到多个文本候选框;其中,所述文本候选框包含试卷中的文本信息;
根据得到的多个文本候选框的位置信息,确定待统分候选框;其中,所述待统分候选框包含试卷中的字符信息;
对所述待统分候选框进行剪切,得到待统分图片;
对所述待统分图片进行图像识别,确定所述待统分图片中的字符信息;
根据所述字符信息,对所述试卷进行统分。
在一个实施例中,所述根据得到的多个文本候选框的位置信息,确定待统分候选框,包括:
确定各文本候选框的中心坐标;
将中心坐标位于预设坐标范围内的文本候选框作为所述待统分候选框。
在一个实施例中,所述对所述待统分图片进行图像识别,确定所述待统分图片中的字符信息,包括:
对所述待统分图片进行图像预处理,得到处理后的图片;
对所述处理后的图片进行图像分割,得到单字符图片;
对所述单字符图片进行图像识别,确定所述待统分图片中的字符信息。
在一个实施例中,所述对所述处理后的图片进行图像分割,得到单字符图片,包括:
对所述处理后的图片进行图像分割,得到多张图片;
若得到的多张图片不存在噪声,则将得到的图片作为单字符图片;或;
若得到的多张图片存在噪声,则将存在噪声的图片进行连通域分割得到图片中的各连通域;并将面积最大的连通域作为所述单字符图片。
在一个实施例中,所述对所述处理后的图片进行图像分割,得到单字符图片之后,对所述单字符图片进行图像识别,确定所述待统分图片中的字符信息之前,所述方法还包括:
确定各单字符图片的中心坐标;
根据所述单字符图片的中心坐标进行排序,并按顺序将相邻两个单字符图片组成组合图像;
若确定组合图像为一个字符,则将所述组合图像作为一个单字符图片。
在一个实施例中,若具有多个试卷图像,所述方法还包括:
从多个试卷图像中确定同一张试卷的试卷图像;
对同一张试卷下各试卷图像进行统分,得到所述试卷的分数。
第二方面,提供一种试卷手写统分装置,包括:
文本检测模块,用于对获取的试卷图像进行文本检测,得到多个文本候选框;其中,所述文本候选框包含试卷中的文本信息;
确定模块,用于根据得到的多个文本候选框的位置信息,确定待统分候选框;其中,所述待统分候选框包含试卷中的字符信息;
剪切模块,用于对所述待统分候选框进行剪切,得到待统分图片;
图像识别模块,用于对所述待统分图片进行图像识别,确定所述待统分图片中的字符信息;
第一统分模块,用于根据所述字符信息,对所述试卷进行统分。
在一个实施例中,确定模块包括:
确定中心坐标单元,用于确定各文本候选框的中心坐标;
确定待统分候选框单元,用于将中心坐标位于预设坐标范围内的文本候选框作为所述待统分候选框。
在一个实施例中,图像识别模块包括:
预处理单元,用于对所述待统分图片进行图像预处理,得到处理后的图片;
图像分割单元,用于对所述处理后的图片进行图像分割,得到单字符图片;
图像识别单元,用于对所述单字符图片进行图像识别,确定所述待统分图片中的字符信息。
在一个实施例中,图像分割单元包括:
图像分割子单元,用于对所述处理后的图片进行图像分割,得到多张图片;
第一确定单字符图片子单元,用于若得到的多张图片不存在噪声,则将得到的图片作为单字符图片;或;
第二确定单字符图片子单元,用于若得到的多张图片存在噪声,则将存在噪声的图片进行连通域分割得到图片中的各连通域;并将面积最大的连通域作为所述单字符图片。
在一个实施例中,所述装置还包括:
确定中心坐标模块,用于图像分割单元对所述处理后的图片进行图像分割,得到单字符图片之后,图像识别单元对所述单字符图片进行图像识别,确定所述待统分图片中的字符信息之前,确定各单字符图片的中心坐标;
组合图像模块,用于根据所述单字符图片的中心坐标进行排序,并按顺序将相邻两个单字符图片组成组合图像;
确定单字符图片模块,用于若确定组合图像为一个字符,则将所述组合图像作为一个单字符图片。
在一个实施例中,若具有多个试卷图像,所述装置还包括:
确定试卷图像模块,用于从多个试卷图像中确定同一张试卷的试卷图像;
第二统分模块,用于对同一张试卷下各试卷图像进行统分,得到所述试卷的分数。
第三方面,提供一种计算装置,包括至少一个处理单元、以及至少一个存储单元,其中,存储单元存储有计算机程序,当程序被处理单元执行时,使得处理单元执行上述任意一种试卷手写统分方法的步骤。
第四方面,提供一种计算机可读介质,其存储有可由终端设备执行的计算机程序,当程序在终端设备上运行时,使得终端设备执行上述任意一种试卷手写统分方法的步骤。
本申请实施例提供的一种试卷手写统分方法、装置及存储介质,通过对试卷图像进行文本检测得到文本候选框,并根据文本候选框的位置确定待统分候选框,根据待统分候选框对应的待统分图片进行图像识别得到待统分图片中的字符信息,从而完成统分。这样,通过机器自动的对试卷进行统分,可以节省人力资源,并提高了统分的效率;且由于是根据试卷图像进行统分,因此无需将每一道题目的分数填写到试卷首页分数栏也可进行统分,使阅卷老师可以节省阅卷时间,提高了阅卷老师的工作效率。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例中一种试卷手写统分方法的流程示意图;
图2为本申请实施例中试卷图像示意图;
图3为本申请实施例中文本候选框的示意图;
图4为本申请实施例中本文候选框的坐标示意图;
图5为本申请实施例中待统分图片示意图;
图6为本申请实施例中预处理图片示意图;
图7为本申请实施例中一种图像分割的示意图;
图8为本申请实施例中另一种图像分割的示意图;
图9为本申请实施例中一种单字符图片的示意图;
图10为本申请实施例中另一种单字符图片的示意图;
图11为本申请实施例中组合图片的示意图;
图12为本申请实施例中一种试卷手写统分装置的结构示意图;
图13为本申请实施方式中终端设备结构示意图。
具体实施方式
为了节省人力资源,提高统分的效率,本申请实施例中提供一种试卷手写统分方法、装置、存储介质。为了更好的理解本申请实施例提供的技术方案,这里对该方案的基本原理做一下简单说明:
为了便于本领域技术人员更好地理解本申请实施例中的技术方案,下面对本申请实施例涉及到的专业术语进行示例说明。
统分:统分全名叫统计分数,是老师或裁判把一个队或组的分统计起来,从而很容易就能知道同组的分数。在本申请实施例中,统分是指将试卷中的得分进行统计,得出结果。
下面对本申请实施例的设计思想进行简要介绍。
如前所述,每次考试后教师们都要阅卷,阅卷后统分却是件非常麻烦的事,都要进行人工统计分数,这样的工作量是很巨大的。比如,如果教师带的仅仅是一两个班还好,有的教师一人带好几个班,改完卷后统分的工作量显得非常之大。甚至有很多新闻报道一线老师由于整夜通宵改卷统分而造成猝死的事故发生。并且,很多时候由于疲劳等原因,会造成分数计算错误等情况,从而需要反复核算多次。
因此,如何智能化进行手写分数的统计是一个很有意义且急需解决的问题,为此,本申请实施例提供的一种试卷手写统分方法、装置及存储介质,该方法中,通过对试卷图像进行本文检测得到文本候选框,并根据文本候选框的位置确定待统分候选框,根据待统分候选框对应的待统分图片进行图像识别得到待统分图片中的字符信息,从而完成统分。这样,通过机器自动的对试卷进行统分,可以节省人力资源,并提高了统分的效率;且由于是根据试卷图像进行统分,因此无需将每一道题目的分数填写到试卷首页分数栏也可进行统分,使阅卷老师可以节省阅卷时间,提高了阅卷老师的工作效率。
为便于理解,下面结合附图对本申请提供的技术方案做进一步说明。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
在本申请实施例中,为了实现对手写试卷的统分,本方案可分为两个部分,分别为:确定图像和图像识别。如图1所示,具体可包括以下步骤:
步骤101:对获取的试卷图像进行文本检测,得到多个文本候选框;其中,所述文本候选框包含试卷中的文本信息。
在本申请实施例中,文本信息包括:文字信息、数字信息以及符号信息等。
步骤102:根据得到的多个文本候选框的位置信息,确定待统分候选框;其中,所述待统分候选框包含试卷中的字符信息。
在本申请实施例中,字符信息包括:数字信息以及符号信息。
步骤103:对所述待统分候选框进行剪切,得到待统分图片。
其中,步骤101-步骤103为确定图像部分。
步骤104:对所述待统分图片进行图像识别,确定所述待统分图片中的字符信息。
步骤105:根据所述字符信息,对所述试卷进行统分。
其中,步骤104-步骤105为图像识别部分。
这样,通过机器自动的对试卷进行统分,可以节省人力资源,并提高了统分的效率;且由于是根据试卷图像进行统分,因此无需将每一道题目的分数填写到试卷首页分数栏也可进行统分,使阅卷老师可以节省阅卷时间,提高了阅卷老师的工作效率。
在整体的介绍了本方案的方法后,下面具体对确定图像和图像识别这两部分进行详细的解释说明。
一、确定图像:
如上所述,步骤101-步骤103为确定图像部分,在此部分中,需要在获取的试卷图像中找到待统分图片。
步骤101:对获取的试卷图像进行文本检测,得到多个文本候选框;其中,所述文本候选框包含试卷中的文本信息。
在本申请实施例中,试卷图像可通过摄像头对试卷进行图像采集。将摄像头固定在试卷上方,调用摄像头对试卷进行瞬时抓拍,从而得到试卷图像。如图2所示,其为试卷图像示意图。在图2中,试卷图像包含的信息有考生信息、试题信息以及得分信息。
在本申请实施例中,可采用ctpn模型(Connectionist Text Proposal Network,场景文本检测网络模型)对试卷图像进行文本检测。当然,也可以使用其它网络模型,本申请对此不做限定。
通过对试卷图像进行文本检测后,可以得到文本候选框。如图3所示,其为文本候选框的示意图。在图3中,试卷中的文本信息均包含在文本候选框中。
步骤102:根据得到的多个文本候选框的位置信息,确定待统分候选框;其中,所述待统分候选框包含试卷中的字符信息。
在本申请实施例中,在文本候选框中确定包含分数的待统分候选框,需要获取每一个文本候选框的坐标位置。其中,每一个文本候选框由四个坐标来表示,如图4所示,该本文候选框的坐标为(x0,y0,x1,y1)。其中,(x0,y0)表示文本候选框的左上角,(x1,y1)表示文本候选框的右下角。这样,通过四个坐标便可以表示一个文本候选框的位置。
而为了在文本候选框中确定待统分候选框,可根据坐标位置来确定,具体可实施为步骤A1-A2:
步骤A1:确定各文本候选框的中心坐标。
在本申请实施例中,中心坐标可根据文本候选框的坐标来确定。其中,中心坐标的横坐标为(x1+x0)/2;中心坐标的纵坐标为(y1+y0)/2。这样,便可以用一个坐标来表示文本候选框,便于后续的计算,以及更加容易确定待统分候选框。
步骤A2:将中心坐标位于预设坐标范围内的文本候选框作为所述待统分候选框。
在本申请实施例中,由于阅卷老师在批改试卷时,习惯将每一道题的得分写在试卷两侧,因此,可以预先设定一个坐标范围,中心坐标在此坐标范围内的文本候选框作为待统分候选框。例如:若设定中心坐标在试卷两侧1/5内的文本候选框作为待统分候选框,且试卷图像从左到右的坐标为0-50,则将中心坐标横坐标在0-10和40-50的文本候选框作为待统分候选框。
在一个实施例中,由于确定待统分候选框时,仅需要横坐标的位置,因此仅确定中心坐标的横坐标即可。
需要说明的是,如图3所示,试卷中央位置的-4为误差操作,不计入统分中。
这样,通过在试卷中的文本候选框中确定待统分候选框,可以使阅卷老师节省阅卷时间,提高了阅卷老师的工作效率。
步骤103:对所述待统分候选框进行剪切,得到待统分图片。
在本申请实施例中,将得到待统分候选框进行剪切,得到待统分图片。如图5所示。在图5中,得到的图片为图2中的得分。
二、图像识别:
在得到了待统分图片后,需要对待统分图片进行图像识别,以得到字符信息,从而完成统分。
步骤104:对所述待统分图片进行图像识别,确定所述待统分图片中的字符信息。
在本申请实施例中,对待统分图片进行图像识别,具体可包括步骤B1-B3:
步骤B1:对所述待统分图片进行图像预处理,得到处理后的图片。
在本申请实施例中,由于光照强度、噪声等干扰因素,需要对待统分图片进行预处理。图像预处理包括对图像的灰度化处理、高斯滤波处理、确定图像内容在图像上所处的位置、二值化处理、去除噪声处理等步骤。
在本申请实施例中,可采用平均阈值、直方图阈值、sauvola(一种考虑局部均值亮度的图像二值化方法,以局部均值为基准再根据标准差做些微调)等二值化方法。
在本申请实施例中,以图片“+3”为例,经过图像预处理后,如图6所示,得到一个二值化后的图片。
步骤B2:对所述处理后的图片进行图像分割,得到单字符图片。
在本申请实施例中,由于得到的待统分图片包括数字信息和符号信息,为了将数字和符号分割出来,可采用最大连通域方法对图像进行分割。分割后的结果如图7所示,在图7中,将待统分图片分割为两部分,由框来表示。
在本申请实施例中,切割后的图片由于交叉切割,可能会出现噪声,因此可通过二次切割去噪处理方法来去除噪声,具体可实施为步骤C1-C3:
步骤C1:对所述处理后的图片进行图像分割,得到多张图片。
步骤C2:若得到的多张图片不存在噪声,则将得到的图片作为单字符图片。
步骤C3:若得到的多张图片存在噪声,则将存在噪声的图片进行连通域分割得到图片中的各连通域;并将面积最大的连通域作为所述单字符图片。
在本申请实施例中,如图8所示,若得到的多张图片中仍然存在噪声(每一张图片中存在多余的部分),则对得到的图片再次进行连通域分割,并将面积最大的连通域作为所述单字符图片。如图9所示,二次切割去噪后得到的图片去除了噪声。这样,可以使图像识别更加准确。
在本申请实施例中,由于阅卷老师在批改试卷时,一些数字可能会没有连在一起,从而导致切割后的图片将数字分离,此时,可以对切割的图片进行分析,具体可实施为步骤D1-D3:
步骤D1:确定各单字符图片的中心坐标。
步骤D2:根据所述单字符图片的中心坐标进行排序,并按顺序将相邻两个单字符图片组成组合图像。
步骤D3:若确定组合图像为一个字符,则将所述组合图像作为一个单字符图片。
在本申请实施例中,对于手写的数字5,可能是一笔也有可能是两笔,若为两笔,可能会导致数字5之间产生缝隙,从而导致在进行将数字5切割为两张图片。这时需要对切割的图片进行空间位置分析,来确定切割的图片是否为一个数字。
首先需要进行空间结果预处理,按照候选分数框横坐标进行排序,并按顺序将相邻两个单字符图片组成组合图像。通过判断组合图像的右上角是否存在内容来判断是否将数字5分为了两张图片。如图10所示,在图10中,经过切割后得到两个图片,根据横坐标的大小进行排序,得到组合图像,如图11所示。由于组合图像为数字5,而之前的两个图片并不是数字,因此,将组合图像作为单字符图片。
其次,还需要对组合图像的左右方位进行分析,提取分数标识操作符,例如:打勾、打叉、加减等数学符号,分析组合图像是一位分数还是两位分数。这样,保证了切割图片的准确性,从而提高了图像识别的准确率。
步骤B3:对所述单字符图片进行图像识别,确定所述待统分图片中的字符信息。
通过对单字符图片进行图像识别,可以得到准确的字符信息。
步骤105:根据所述字符信息,对所述试卷进行统分。
在本申请实施例中,若一张试卷存在多幅试卷图像时(例如:正反两面的试卷),需要确定同一张试卷的试卷图像,并进行统分,具体的:
从多个试卷图像中确定同一张试卷的试卷图像;对同一张试卷下各试卷图像进行统分,得到所述试卷的分数。
在本申请实施例中,可根据试卷上的考生信息来确定同一张试卷的试卷图像,也可以通过设备来区分同一张试卷的试卷图像。对此,本申请不做限定。
基于相同的发明构思,本申请实施例还提供了一种试卷手写统分装置。如图12所示,该装置包括:
文本检测模块1201,用于对获取的试卷图像进行文本检测,得到多个文本候选框;其中,所述文本候选框包含试卷中的文本信息;
确定模块1202,用于根据得到的多个文本候选框的位置信息,确定待统分候选框;其中,所述待统分候选框包含试卷中的字符信息;
剪切模块1203,用于对所述待统分候选框进行剪切,得到待统分图片;
图像识别模块1204,用于对所述待统分图片进行图像识别,确定所述待统分图片中的字符信息;
第一统分模块1205,用于根据所述字符信息,对所述试卷进行统分。
在一个实施例中,确定模块1202包括:
确定中心坐标单元,用于确定各文本候选框的中心坐标;
确定待统分候选框单元,用于将中心坐标位于预设坐标范围内的文本候选框作为所述待统分候选框。
在一个实施例中,图像识别模块1204包括:
预处理单元,用于对所述待统分图片进行图像预处理,得到处理后的图片;
图像分割单元,用于对所述处理后的图片进行图像分割,得到单字符图片;
图像识别单元,用于对所述单字符图片进行图像识别,确定所述待统分图片中的字符信息。
在一个实施例中,图像分割单元包括:
图像分割子单元,用于对所述处理后的图片进行图像分割,得到多张图片;
第一确定单字符图片子单元,用于若得到的多张图片不存在噪声,则将得到的图片作为单字符图片;或;
第二确定单字符图片子单元,用于若得到的多张图片存在噪声,则将存在噪声的图片进行连通域分割得到图片中的各连通域;并将面积最大的连通域作为所述单字符图片。
在一个实施例中,所述装置还包括:
确定中心坐标模块,用于图像分割单元对所述处理后的图片进行图像分割,得到单字符图片之后,图像识别单元对所述单字符图片进行图像识别,确定所述待统分图片中的字符信息之前,确定各单字符图片的中心坐标;
组合图像模块,用于根据所述单字符图片的中心坐标进行排序,并按顺序将相邻两个单字符图片组成组合图像;
确定单字符图片模块,用于若确定组合图像为一个字符,则将所述组合图像作为一个单字符图片。
在一个实施例中,若具有多个试卷图像,所述装置还包括:
确定试卷图像模块,用于从多个试卷图像中确定同一张试卷的试卷图像;
第二统分模块,用于对同一张试卷下各试卷图像进行统分,得到所述试卷的分数。
基于同一技术构思,本申请实施例还提供了一种终端设备1300,参照图13所示,终端设备1300用于实施上述各个方法实施例记载的方法,例如实施图1所示的实施例,终端设备1300可以包括存储器1301、处理器1302、输入单元1303和显示面板1304。
存储器1301,用于存储处理器1302执行的计算机程序。存储器1301可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据终端设备1300的使用所创建的数据等。处理器1302,可以是一个中央处理单元(central processing unit,CPU),或者为数字处理单元等。输入单元1303,可以用于获取用户输入的用户指令。显示面板1304,用于显示由用户输入的信息或提供给用户的信息,本申请实施例中,显示面板1304主要用于显示终端设备中各应用程序的显示界面以及各显示界面中显示的控件实体。可选的,显示面板1304可以采用液晶显示器(liquid crystal display,LCD)或OLED(organic light-emitting diode,有机发光二极管)等形式来配置显示面板1304。
本申请实施例中不限定上述存储器1301、处理器1302、输入单元1303和显示面板1304之间的具体连接介质。本申请实施例在图13中以存储器1301、处理器1302、输入单元1303、显示面板1304之间通过总线1305连接,总线1305在图13中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线1305可以分为地址总线、数据总线、控制总线等。为便于表示,图13中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器1301可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器1301也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD)、或者存储器1301是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器1301可以是上述存储器的组合。
处理器1302,用于实现如图1所示的实施例,包括:
处理器1302,用于调用存储器1301中存储的计算机程序执行如实施图2所示的实施例。
本申请实施例还提供了一种计算机可读存储介质,存储为执行上述处理器所需执行的计算机可执行指令,其包含用于执行上述处理器所需执行的程序。
在一些可能的实施方式中,本申请提供的一种试卷手写统分的方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述描述的根据本申请各种示例性实施方式的一种试卷手写统分的方法中的步骤。例如,终端设备可以执行如实施图1所示的实施例。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请的实施方式的用于一种试卷手写统分的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算设备上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,程序设计语言包括面向实体的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (8)

1.一种试卷手写统分方法,其特征在于,所述方法包括:
对获取的试卷图像进行文本检测,得到多个文本候选框;其中,所述文本候选框包含试卷中的文本信息;
根据得到的多个文本候选框的位置信息,确定待统分候选框;其中,所述待统分候选框包含试卷中的字符信息;
对所述待统分候选框进行剪切,得到待统分图片;
对所述待统分图片进行图像识别,确定所述待统分图片中的字符信息;包括:
对所述待统分图片进行图像预处理,得到处理后的图片;
对所述处理后的图片进行图像分割,得到单字符图片;包括:对所述处理后的图片进行图像分割,得到多张图片;若得到的多张图片不存在噪声,则将得到的图片作为单字符图片;或若得到的多张图片存在噪声,则将存在噪声的图片进行连通域分割得到图片中的各连通域;并将面积最大的连通域作为所述单字符图片;
对所述单字符图片进行图像识别,确定所述待统分图片中的字符信息;
根据所述字符信息,对所述试卷进行统分。
2.根据权利要求1所述的方法,其特征在于,所述根据得到的多个文本候选框的位置信息,确定待统分候选框,包括:
确定各文本候选框的中心坐标;
将中心坐标位于预设坐标范围内的文本候选框作为所述待统分候选框。
3.根据权利要求1所述的方法,其特征在于,所述对所述处理后的图片进行图像分割,得到单字符图片之后,对所述单字符图片进行图像识别,确定所述待统分图片中的字符信息之前,所述方法还包括:
确定各单字符图片的中心坐标;
根据所述单字符图片的中心坐标进行排序,并按顺序将相邻两个单字符图片组成组合图像;
若确定组合图像为一个字符,则将所述组合图像作为一个单字符图片。
4.根据权利要求1所述的方法,其特征在于,若具有多个试卷图像,所述方法还包括:
从多个试卷图像中确定同一张试卷的试卷图像;
对同一张试卷下各试卷图像进行统分,得到所述试卷的分数。
5.一种试卷手写统分装置,其特征在于,所述装置包括:
文本检测模块,用于对获取的试卷图像进行文本检测,得到多个文本候选框;其中,所述文本候选框包含试卷中的文本信息;
确定模块,用于根据得到的多个文本候选框的位置信息,确定待统分候选框;其中,所述待统分候选框包含试卷中的字符信息;
剪切模块,用于对所述待统分候选框进行剪切,得到待统分图片;
图像识别模块,用于对所述待统分图片进行图像识别,确定所述待统分图片中的字符信息;所述图像识别模块具体包括:预处理单元、图像分割单元、和图像识别单元;其中,
所述预处理单元,用于对所述待统分图片进行图像预处理,得到处理后的图片;
所述图像分割单元,用于对所述处理后的图片进行图像分割,得到单字符图片;所述图像分割单元包括图像分割子单元、第一确定单字符图片子单元和第二确定单字符图片子单元,其中:所述图像分割子单元,用于对所述处理后的图片进行图像分割,得到多张图片;所述第一确定单字符图片子单元,用于若得到的多张图片不存在噪声,则将得到的图片作为单字符图片;所述第二确定单字符图片子单元,用于若得到的多张图片存在噪声,则将存在噪声的图片进行连通域分割得到图片中的各连通域,并将面积最大的连通域作为所述单字符图片;
所述图像识别单元,用于对所述单字符图片进行图像识别,确定所述待统分图片中的字符信息;
第一统分模块,用于根据所述字符信息,对所述试卷进行统分。
6.根据权利要求5所述的装置,其特征在于,确定模块包括:
确定中心坐标单元,用于确定各文本候选框的中心坐标;
确定待统分候选框单元,用于将中心坐标位于预设坐标范围内的文本候选框作为所述待统分候选框。
7.一种计算机可读介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令用于执行如权利要求1-4中任一权利要求所述的方法。
8.一种计算装置,其特征在于,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-4中任一权利要求所述的方法。
CN202010286693.0A 2020-04-13 2020-04-13 一种试卷手写统分方法、装置及存储介质 Active CN111428724B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010286693.0A CN111428724B (zh) 2020-04-13 2020-04-13 一种试卷手写统分方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010286693.0A CN111428724B (zh) 2020-04-13 2020-04-13 一种试卷手写统分方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN111428724A CN111428724A (zh) 2020-07-17
CN111428724B true CN111428724B (zh) 2023-09-22

Family

ID=71557860

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010286693.0A Active CN111428724B (zh) 2020-04-13 2020-04-13 一种试卷手写统分方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN111428724B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348028A (zh) * 2020-11-30 2021-02-09 广东国粒教育技术有限公司 一种场景文本检测方法、批改方法、装置、电子设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874893A (zh) * 2017-03-24 2017-06-20 武汉天喻教育科技有限公司 一种试卷分数的统计方法及系统
CN107292308A (zh) * 2017-06-08 2017-10-24 东华大学 一种智能统分装置
CN108171237A (zh) * 2017-12-08 2018-06-15 众安信息技术服务有限公司 一种文本行图像单字切分方法和装置
CN109086695A (zh) * 2018-07-18 2018-12-25 深圳迪普乐宁科技有限公司 一种纸上手工阅卷电脑统分的方法与系统
CN109543677A (zh) * 2018-11-08 2019-03-29 上海金啤包装检测科技有限公司 喷码的检测方法及设备、生产线、计算机设备、存储介质
CN110929713A (zh) * 2019-11-22 2020-03-27 中南大学 一种基于bp神经网络的钢印字符识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7496547B2 (en) * 2005-06-02 2009-02-24 Microsoft Corporation Handwriting recognition using a comparative neural network
JP6119952B2 (ja) * 2012-05-15 2017-04-26 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874893A (zh) * 2017-03-24 2017-06-20 武汉天喻教育科技有限公司 一种试卷分数的统计方法及系统
CN107292308A (zh) * 2017-06-08 2017-10-24 东华大学 一种智能统分装置
CN108171237A (zh) * 2017-12-08 2018-06-15 众安信息技术服务有限公司 一种文本行图像单字切分方法和装置
CN109086695A (zh) * 2018-07-18 2018-12-25 深圳迪普乐宁科技有限公司 一种纸上手工阅卷电脑统分的方法与系统
CN109543677A (zh) * 2018-11-08 2019-03-29 上海金啤包装检测科技有限公司 喷码的检测方法及设备、生产线、计算机设备、存储介质
CN110929713A (zh) * 2019-11-22 2020-03-27 中南大学 一种基于bp神经网络的钢印字符识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马飞 ; 吕海莲 ; 杨帅 ; 程荣花 ; .基于图像处理的客观题自动阅卷系统研究开发.计算机技术与发展.2012,(第07期),全文. *

Also Published As

Publication number Publication date
CN111428724A (zh) 2020-07-17

Similar Documents

Publication Publication Date Title
US10685462B2 (en) Automatic data extraction from a digital image
CN108595583B (zh) 动态图表类页面数据爬取方法、装置、终端及存储介质
US20210271809A1 (en) Machine learning process implementation method and apparatus, device, and storage medium
US20230401828A1 (en) Method for training image recognition model, electronic device and storage medium
CN111160569A (zh) 基于机器学习模型的应用开发方法、装置及电子设备
CN108090043B (zh) 基于人工智能的纠错举报处理方法、装置及可读介质
CN110175609B (zh) 界面元素检测方法、装置及设备
CN111079638A (zh) 基于卷积神经网络的目标检测模型训练方法、设备和介质
CN117275005B (zh) 文本检测、文本检测模型优化、数据标注的方法、装置
CN112365344A (zh) 一种业务规则自动生成方法和系统
CN116049597A (zh) 网页的多任务模型的预训练方法、装置及电子设备
CN111428724B (zh) 一种试卷手写统分方法、装置及存储介质
CN113723093B (zh) 人员管理策略推荐方法、装置、计算机设备及存储介质
US11615618B2 (en) Automatic image annotations
CN111914863A (zh) 目标检测方法、装置、终端设备及计算机可读存储介质
CN117409430A (zh) 一种医疗票据信息提取方法、装置、设备及其存储介质
CN112529116B (zh) 场景元素融合处理方法、装置和设备及计算机存储介质
CN112328812B (zh) 基于自调参数的领域知识抽取方法与系统、电子设备
US11113081B2 (en) Generating a video for an interactive session on a user interface
CN115880702A (zh) 数据处理方法、装置、设备、程序产品及存储介质
CN110472728B (zh) 目标信息确定方法、目标信息确定装置、介质及电子设备
CN116403074B (zh) 基于主动标注的半自动图像标注方法及标注装置
CN116341531B (zh) 基于知识驱动的人物信息抽取和检查方法及装置
CN117234769A (zh) 一种页面白屏事件处理方法、装置、设备及其存储介质
CN118762369A (zh) 一种用于工程图纸的标识识别方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant