CN116311301A - 无线表格识别方法及系统 - Google Patents
无线表格识别方法及系统 Download PDFInfo
- Publication number
- CN116311301A CN116311301A CN202310183762.9A CN202310183762A CN116311301A CN 116311301 A CN116311301 A CN 116311301A CN 202310183762 A CN202310183762 A CN 202310183762A CN 116311301 A CN116311301 A CN 116311301A
- Authority
- CN
- China
- Prior art keywords
- result
- text box
- text
- candidate
- wireless
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000003058 natural language processing Methods 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 11
- 238000001914 filtration Methods 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 6
- 238000013145 classification model Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
本发明提供一种无线表格识别方法及系统,方法包括:获取目标图像中的待识别无线表格的第一文本框识别结果和文本识别结果;根据所述第一文本框识别结果和所述文本识别结果,得到候选无线表格识别结果;根据所述候选无线表格识别结果的合并特征,对所述候选无线表格识别结果进行调整,得到目标无线表格识别结果。所述系统执行所述方法。本发明能够解决现有无线表格识别方案中识别结果精度低的问题,提高了无线表格识别的精度。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种无线表格识别方法及系统。
背景技术
随着电子信息的普及,大量的电子文档涌现出来,如何从这些文档中挖掘出有用的信息是信息时代的重中之重。在信息挖掘之前首先要面对的就是不同格式电子文件,有html、doc、pdf、扫描件、图片等,其中图片和扫描件的挖掘尤其困难,因为它是像素级编码的格式,需要通过计算机技术将像素编码翻译为类似LaTeX、html等编码形式。在信息文档中,无线表格能尽可能清晰、简洁高效的表达,但是真实的文档中,无线表格的变化是多种多样的,尤其是无线无线表格部分,有大量的布局形式是基于人的共识形成的,很难形成固定的程式以代码的形式描述。
在处理此类的无线无线表格时,一般基于深度学习思想进行端到端的无线表格识别,存在无线表格识别精度低的问题。
发明内容
本发明提供的无线表格识别方法及系统,用于解决现有技术中存在的基于深度学习思想对无线表格进行端到端识别精度低的问题。
本发明提供的一种无线表格识别方法,包括:
获取目标图像中的待识别无线表格的第一文本框识别结果和文本识别结果;
根据所述第一文本框识别结果和所述文本识别结果,得到候选无线表格识别结果,所述候选无线表格识别结果为候选无线表格的识别结果,所述候选无线表格为基于所述第一文本框识别结果创建的无线表格;
根据所述候选无线表格识别结果的合并特征,对所述候选无线表格识别结果进行调整,得到目标无线表格识别结果,所述合并特征为用于确定所述候选无线表格识别结果中的待合并行或待合并单元格的特征,所述待合并行为以行为单位,需要与相邻的上一行或相邻的下一行进行整体合并的行,所述待合并单元格为以单元格为单位,需要与相邻的上一单元格或相邻的下一单元格进行整体合并的单元格。
根据本发明提供的一种无线表格识别方法,所述获取目标图像中的待识别无线表格的第一文本框识别结果,包括:
将所述目标图像输入至第一检测模型,得到所述待识别无线表格的位置信息;
基于第二检测模型,确定所述位置信息的候选文本框识别结果;
根据所述候选文本框识别结果,确定所述第一文本框识别结果。
根据本发明提供的一种无线表格识别方法,所述获取目标图像中的待识别无线表格的文本识别结果,包括:
对所述候选文本框识别结果进行透视变换,得到第二文本框识别结果;
将所述第二文本框识别结果输入至目标方向分类模型,得到第三文本框识别结果;
将所述第三文本框识别结果输入至目标识别网络,得到所述文本识别结果。
根据本发明提供的一种无线表格识别方法,所述根据所述候选文本框识别结果,确定所述第一文本框识别结果,包括:
将所述候选文本框识别结果作为所述第一文本框识别结果;
或者,
计算所述候选文本框识别结果中的每列像素的方差;
根据所述每列像素的方差,删除所述候选文本框识别结果中的文本行首尾多余的空白部分;
根据所述文本行中文字间的空白间隔统计结果,确定第一裁切线;
根据所述第一裁切线对所述候选文本框识别结果进行裁切,得到第一裁切结果;
将所述第一裁切结果输入至目标自然语言处理模型,确定第二裁切线;
根据所述第一裁切线和所述第二裁切线,确定目标裁切线;
根据所述目标裁切线,对所述候选文本框识别结果进行裁切,得到第二裁切结果;
根据预设过滤规则对所述第二裁切结果进行过滤,得到所述第一文本框识别结果。
根据本发明提供的一种无线表格识别方法,所述根据所述第一文本框识别结果和所述文本识别结果,得到候选无线表格识别结果,包括:
将所述第一文本框识别结果中的目标文本框进行合并,得到第一合并结果,所述目标文本框包括第一文本框和第二文本框,所述第一文本框为所述第一文本框识别结果中任意多个文本框之间的距离小于等于预设阈值的文本框,所述第二文本框为所述第一文本框识别结果中第一目标列中的文本框,所述第一目标列为所述第一文本框识别结果中包括一个文本框的行数大于包括多个文本框的行数的列;
将所述第一合并结果输入到目标自然语言处理模型,确定合并点;
根据所述合并点对所述第一文本框识别结果进行合并,得到第二合并结果;
根据所述第一合并结果和所述第二合并结果,确定目标合并结果;
根据所述目标合并结果创建候选无线表格;
根据所述候选无线表格和所述文本识别结果,确定所述候选无线表格识别结果。
根据本发明提供的一种无线表格识别方法,所述根据所述候选无线表格和所述文本识别结果,确定所述候选无线表格识别结果,包括:
将所述文本识别结果写入所述候选无线表格,得到第一无线表格识别结果;
将所述第一无线表格识别结果中的第一单元格进行合并,得到第三合并结果,所述第一单元格为所述第一无线表格识别结果中的包括多个文本框的单元格;
删除所述第三合并结果中的空白行和空白列,得到第四合并结果;
在所述第四合并结果的目标行中添加竖线,并在所述第四合并结果中的第二目标列添加横线,所述目标行是所述第四合并结果中存在一个单元格包括多个文本框的行,所述第二目标列是所述第四合并结果中存在一个单元格包括多个文本框的列;
根据所述横线和所述竖线对所述第四合并结果进行网格划分,得到所述候选无线表格识别结果。
根据本发明提供的一种无线表格识别方法,所述候选无线表格识别结果的合并特征的获取方式,包括:
确定所述待识别无线表格中的显性直线,所述显性直线用于指示所述待识别无线表格中的文本所属的列;
确定所述候选无线表格识别结果中的表头和无线表格体;
确定所述候选无线表格识别结果中需要合并的第二单元格,所述第二单元格是通过将所述候选无线表格识别结果中的相邻单元格输入至目标自然语言处理模型后得到的;
根据所述显性直线、所述表头、所述无线表格体和所述第二单元格,确定所述合并特征。
本发明还提供一种无线表格识别系统,包括:第一获取模块、第二获取模块以及无线表格识别模块;
所述第一获取模块,用于获取目标图像中的待识别无线表格的第一文本框识别结果和文本识别结果;
所述第二获取模块,用于根据所述第一文本框识别结果和所述文本识别结果,得到候选无线表格识别结果,所述候选无线表格识别结果为候选无线表格的识别结果,所述候选无线表格为基于所述第一文本框识别结果创建的无线表格;
所述识别模块,用于根据所述候选无线表格识别结果的合并特征,对所述候选无线表格识别结果进行调整,得到目标无线表格识别结果,所述合并特征为用于确定所述候选无线表格识别结果中的待合并行或待合并单元格的特征,所述待合并行为以行为单位,需要与相邻的上一行或相邻的下一行进行整体合并的行,所述待合并单元格为以单元格为单位,需要与相邻的上一单元格或相邻的下一单元格进行整体合并的单元格。
本发明还提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述程序时实现如上述任一种所述无线表格识别方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述无线表格识别方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述无线表格识别方法。
本发明提供的无线表格识别方法及系统,通过无线表格识别得到待识别无线表格的文本框识别结果和文本识别结果,并基于该文本框识别结果和文本识别结果得到候选无线表格识别结果,基于该候选无线表格识别结果中的合并特征对候选无线表格识别结果进行调整,得到目标无线表格识别结果,解决了现有无线表格识别方案中识别结果精度低的问题,提高了无线表格端到端识别的精度。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的无线表格识别方法的流程示意图;
图2是本发明提供的候选文本框识别结果的示意图;
图3是本发明提供的创建的候选无线表格的示意图;
图4是本发明提供的待识别无线表格的示意图;
图5是本发明提供的无线表格识别方法应用在港股业绩报告上的测试结果示意图;
图6是本发明提供的无线表格识别系统的结构示意图;
图7是本发明提供的电子设备的实体结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有的基于深度学习思想的无线表格识别方案,例如,基于img2seq模型进行无线表格识别的技术,需要的数据量比较大,而且一些先验的无线表格知识很难融入到img2seq模型中,如果数据稍有波动就会导致输出结果错误。对于无线表格数据而言,标注成本比较高,如果模型过分依赖海量数据,必然后加大算法的成本;
本发明的目的是提供一种精度高成本低的无线表格算法,通过将无线表格识别算法过程进行拆分,得到一个个解耦的独立的子模块,解决img2seq模型依赖大数据、模态信息单一、标注数据成本高、精度低以及先验的无线表格知识无法融入模型的问题,本发明提供的无线表格识别方法,对无线表格识别流程进行了步骤拆分,以达到高精度低成本的目的,主要包括,无线表格区域检测、文本位置检测、文本方向分类、文本识别、单行文本拆分、单行文本合并、根据行预测网格线以及布局信息进行多行文本合并,得到目标无线表格识别结果,具体实现如下:
图1是本发明提供的无线表格识别方法的流程示意图,如图1所示,方法包括:
步骤110,获取目标图像中的待识别无线表格的第一文本框识别结果和文本识别结果;
步骤120,根据所述第一文本框识别结果和所述文本识别结果,得到候选无线表格识别结果,所述候选无线表格识别结果为候选无线表格的识别结果,所述候选无线表格为基于所述第一文本框识别结果创建的无线表格;
步骤130,根据所述候选无线表格识别结果的合并特征,对所述候选无线表格识别结果进行调整,得到目标无线表格识别结果,所述合并特征为用于确定所述候选无线表格识别结果中的待合并行或待合并单元格的特征,所述待合并行为以行为单位,需要与相邻的上一行或相邻的下一行进行整体合并的行,所述待合并单元格为以单元格为单位,需要与相邻的上一单元格或相邻的下一单元格进行整体合并的单元格。
需要说明的是,上述方法的执行主体可以是计算机设备。
可选地,该目标图像可以具体为包含待识别无线表格的图像,该图像可以具体为包含待识别无线表格的html页面图像、扫描件图像等。
该第一文本框识别结果可以具体为对待识别无线表格进行检测后得到的以行为单位,包围文本条的坐标位置结果,该文本条的坐标位置可以具体包括文本条的各个顶点的位置坐标。
该文本识别结果可以具体为对待识别无线表格进行检测后得到的文本信息,该文本信息可以以字符串的形式展示。
根据第一文本框识别结果和文本识别结果,得到候选无线表格识别结果可以具体为将得到的第一文本框识别结果进行网格线预测,根据网格线预测结果创建候选无线表格,通过将文本识别结果填入候选无线表格得到候选无线表格识别结果。
得到候选无线表格识别结果之后,待识别无线表格中包括的结构化信息,例如无线表格的表头(横表头和纵表头)和无线表格体均可以初步确定。同时,候选无线表格识别结果中部分行或者部分单元格是需要进行合并处理,通过根据得到的候选无线表格识别结果中的合并特征,确定候选无线表格识别结果中需要合并的行或者单元格,并对其进行合并处理,进而才可以得到更为准确的目标无线表格识别结果。其中,该合并特征为用于确定候选无线表格识别结果中的待合并行或待合并单元格的特征,该待合并行可以具体指以行为单位,需要与相邻的上一行或相邻的下一行进行整体合并的行,该待合并单元格可以具体指以单元格为单位,需要与相邻的上一单元格或相邻的下一单元格进行整体合并的单元格。
本发明提供的无线表格识别方法,通过无线表格识别得到待识别无线表格的文本框识别结果和文本识别结果,并基于该文本框识别结果和文本识别结果得到候选无线表格识别结果,基于该候选无线表格识别结果中的合并特征对候选无线表格识别结果进行调整,得到目标无线表格识别结果,解决了现有无线表格识别方案中识别结果精度低的问题,提高了无线表格端到端识别的精度。
进一步地,在一个实施例中,所述获取目标图像中的待识别无线表格的第一文本框识别结果,可以具体包括:
将所述目标图像输入至第一检测模型,得到所述待识别无线表格的位置信息;
基于第二检测模型,确定所述位置信息的候选文本框识别结果;
根据所述候选文本框识别结果,确定所述第一文本框识别结果。
可选地,通过第一检测模型把待识别无线表格从目标图像中检测出来,得到待识别无线表格的位置信息,该第一检测模型可以是目标检测模型,例如YoLo模型、Fast R-CNN模型、Mask R-CNN模型、SSD模型等,该位置信息可以具体为待识别无线表格的位置坐标,该待识别无线表格的位置坐标可以具体包括待识别无线表格的各个顶点的坐标,也可以具体是只包括待识别无线表格的左上顶点坐标和右下顶点坐标,还可以具体是只包括待识别无线表格的左下顶点坐标和右上顶点坐标,本发明对此不作具体限定。
基于第二检测模型检测出待识别无线表格区域内的候选文本框识别结果,该第二检测模型可以具体为目标检测模型,例如DB模型、DB++模型、YoLo模型、FCE-Net模型等,该候选文本框识别结果包括文本信息和包围文本信息的文本框的位置信息,该文本信息可以具体以行为单位,该文本框的位置信息可以具体包括文本框的位置坐标,该文本框的位置坐标可以具体包括文本框的各个顶点的坐标。
得到候选文本框识别结果之后,可以直接将其作为第一文本框识别结果,也可以对该候选文本框识别结果进行处理后,将处理后的候选文本框识别结果作为第一文本框识别结果,这是由于候选文本框识别结果中有一些邻近单元格离得比较近,所以在检测的时候会将它们检测为一个文本框,需要将它们以单元格为单位进行拆分,候选文本框识别结果中有一些文本框本属于同一个单元格但是在检测时被误检为两个文本框,还有一些是在对邻近单元格进行拆分的过程中误拆分的,对于这两种情况,可以通过对候选文本框识别结果进行处理,得到第一文本框识别结果。
进一步地,在一个实施例,所述根据所述候选文本框识别结果,确定所述第一文本框识别结果,可以具体包括:
将所述候选文本框识别结果作为所述第一文本框识别结果;
或者,
计算所述候选文本框识别结果中的每列像素的方差;
根据所述每列像素的方差,删除所述候选文本框识别结果中的文本行首尾多余的空白部分;
根据所述文本行中文字间的空白间隔统计结果,确定第一裁切线;
根据所述第一裁切线对所述候选文本框识别结果进行裁切,得到第一裁切结果;
将所述第一裁切结果输入至目标自然语言处理模型,确定第二裁切线;
根据所述第一裁切线和所述第二裁切线,确定目标裁切线;
根据所述目标裁切线,对所述候选文本框识别结果进行裁切,得到第二裁切结果;
根据预设过滤规则对所述第二裁切结果进行过滤,得到所述第一文本框识别结果。
可选地,得到候选文本框识别结果之后,可以直接将其作为第一文本框识别结果,也可以通过如下过程对该候选文本框识别结果进行处理后,将处理后的候选文本框识别结果作为第一文本框识别结果,具体地:
(1),计算出候选文本框识别结果中文本框的每列像素的分布值,该分布值可以具体为方差,根据目标图像在R、G、B通道的R均值、G均值、B均值、RG均值、RB均值、GB均值、RGB均值和灰度图,计算每列像素的方差,如果该方差大于设定的第一阈值,那么代表此位置是文字,如图2所示,字符之间用凸起的线条表示空白部分;
(2),根据每列像素的分布值去掉候选文本框识别结果中的文本行的首尾多余的空白部分;
(3),统计文本行内文字间的空白间隔统计结果,若该空白间隔数量大于设定的第二阈值,则确定需要裁开;
(4),根据上述(2)和(3)确定裁切线(即第一裁切线),例如,候选文本框识别结果中某两列单元格中间大部分(该两列中间分开的单元格的数量大于不分开的单元格数量)都是分开的,则可以根据两列间空白部分设计第一裁切线,然后根据第一裁切线和候选文本框识别结果中文本框对应位置的像素的分布值进行裁切,得到裁切结果,即第一裁切结果;
(5),将得到的第一裁切结果经过目标自然语言处理NLP模型进行断句预测,挑选出置信度高的裁切点,沿该裁切点,确定第二裁切线,通过选择第一裁切线和第二裁切线中置信度较高的裁切线,并将其作为目标裁切线,对候选文本框识别结果进行裁切,得到裁切结果,即第二裁切结果,以此保证结果是正交的;
(6),得到第二裁切结果之后,需要根据预设过滤规则对其进行一次过滤,得到第一文本框识别结果,该预设过滤规则可以具体根据文本信息设定,比如,文本中裁切线的左侧为‘(’,右侧为‘)’则不进行裁切,其他文本判断依据类似。
本发明提供的无线表格识别方法,对无线表格识别流程进行拆分后不仅可以加入先验的无线表格知识,还可以利用大数据训练相应的子模块(比如第一检测模型和第二检测模型),并且可以同时应用自然语言处理模型,将多种模态信息加入到无线表格识别任务,以提高无线表格端到端识别的精度。
进一步地,在一个实施例中,所述获取目标图像中的待识别无线表格的文本识别结果,包括:
对所述候选文本框识别结果进行透视变换,得到第二文本框识别结果;
将所述第二文本框识别结果输入至目标方向分类模型,得到第三文本框识别结果;
将所述第三文本框识别结果输入至目标识别网络,得到所述文本识别结果。
可选地,在得到待识别无线表格的候选文本框识别结果之后,需要对该候选文本框识别结果进行校正,这是因为检测出来的候选文本框识别结果中的文本框有倾斜或者畸变,所以需要经过仿射变换将畸变的文本框变换为矩形,得到第二文本框识别结果,同样结果以包围文本框的坐标位置返回。
经过仿射变换后的候选文本框识别结果(即第二文本框识别结果)中的文本框的方向可能是反的,即文字是颠倒的,所以需要经过目标方向分类模型将候选文本框识别结果中的文本框的方向旋转到正确方向,得到第三文本框识别结果,该目标方向分类模型可以具体包括Mobile-Net模型、Res-Net模型、Shuffle-Net模型等。
将经过方向旋转后,得到的第三文本框识别结果送入到目标识别网络,得到最终的文本识别结果,该目标识别网络可以具体是R-CNN网络、ViTSTR网络、ABINet网络、VisionLAN网络等,需要说明的是,该文本识别结果可以具体以字符串的形式返回。
本发明提供的无线表格识别方法,通过对得到的候选文本框识别结果中的文本框进行仿射变换和方向旋转,提高得到文本识别结果的准确度。
进一步地,在一个实施例中,所述根据所述第一文本框识别结果和所述文本识别结果,得到候选无线表格识别结果,可以具体包括:
将所述第一文本框识别结果中的目标文本框进行合并,得到第一合并结果,所述目标文本框包括第一文本框和第二文本框,所述第一文本框为所述第一文本框识别结果中任意多个文本框之间的距离小于等于预设阈值的文本框,所述第二文本框为所述第一文本框识别结果中第一目标列中的文本框,所述第一目标列为所述第一文本框识别结果中包括一个文本框的行数大于包括多个文本框的行数的列;
将所述第一合并结果输入到目标自然语言处理模型,确定合并点;
根据所述合并点对所述第一文本框识别结果进行合并,得到第二合并结果;
根据所述第一合并结果和所述第二合并结果,确定目标合并结果;
根据所述目标合并结果创建候选无线表格;
根据所述候选无线表格和所述文本识别结果,确定所述候选无线表格识别结果。
可选地,该目标文本框可以具体包括第一文本框识别结果中的第一文本框和第二文本框,该第一文本框可以具体为第一文本框识别结果中距离比较近的文本框,更具体为任意多个文本框之间的距离小于等于预设阈值的文本框,该第二文本框可以具体为第一文本框识别结果中第一目标列中的文本框,该第一目标列可以具体为第一文本框识别结果中包括一个文本框的行数大于包括多个文本框的行数的列。
通过将第一文本框识别结果中的目标文本框进行合并得到第一合并结果。
将得到的第一合并结果输入到目标自然语言处理NLP模型进行断句预测,挑选出置信度高的合并点,并根据该合并点对第一文本框识别结果进行合并,得到第二合并结果。
通过对第一合并结果和第二合并结果进行比较,选择基于置信度较高的合并点对第一文本框识别进行合并后得到的合并结果,并将其作为最终的目标合并结果。
利用得到的目标合并结果进行网格线预测,创建候选无线表格,例如可以把候选无线表格分成M*N的横线和竖线,如图3所示,具体地:
根据得到的目标合并结果生成mask图像,该mask图像中有字的位置像素值为255,无字位置像素值为0;
根据该mask图像的行列像素值均值找出横竖线,像素值均值大于设定的第三阈值时则可以有线穿过,也可以通过模型进行学习;
根据找到的线生成M*N的格子,即候选无线表格。
根据得到的候选无线表格和文本识别结果得到候选无线表格识别结果。
进一步地,在一个实施例中,所述根据所述候选无线表格和所述文本识别结果,确定所述候选无线表格识别结果,可以具体包括:
将所述文本识别结果写入所述候选无线表格,得到第一无线表格识别结果;
将所述第一无线表格识别结果中的第一单元格进行合并,得到第三合并结果,所述第一单元格为所述第一无线表格识别结果中的包括多个文本框的单元格;
删除所述第三合并结果中的空白行和空白列,得到第四合并结果;
在所述第四合并结果的目标行中添加竖线,并在所述第四合并结果中的第二目标列添加横线,所述目标行是所述第四合并结果中存在一个单元格包括多个文本框的行,所述第二目标列是所述第四合并结果中存在一个单元格包括多个文本框的列;
根据所述横线和所述竖线对所述第四合并结果进行网格划分,得到所述候选无线表格识别结果。
可选地,将得到文本识别结果填入到创建的候选无线表格,得到第一无线表格识别结果,并对第一无线表格识别结果中的第一单元格进行合并,得到第三合并结果,该第一单元格可以具体为第一无线表格识别结果中的包括多个文本框的单元格;
删除第三合并结果中的空白行和空白列,得到第四合并结果;
拆分第四合并结果中的多列多行合并情况,例如第四合并结果中某一列存在包括多个文本框的单元格,但是该单元格没有用横线拆开,通过在第四合并结果的目标行中添加竖线,并在第四合并结果中的第二目标列添加横线,对第四合并结果中某一列或某一行存在多个文本框的单元格添加横竖线进行拆分,该目标行可以具体为第四合并结果中的一个单元格包括多个文本框的行,该第二目标列可以具体为第四合并结果中的一个单元格包括多个文本框的列;
根据横线和所述竖线对第四合并结果进行网格划分,得到候选无线表格识别结果。
本发明提供的无线表格识别方法,通过无线表格识别得到待识别无线表格的文本框识别结果和文本识别结果,并基于该文本框识别结果和文本识别结果得到候选无线表格识别结果,为后续基于该候选无线表格识别结果中的合并特征对候选无线表格识别结果进行调整,得到目标无线表格识别结果,解决了现有无线表格识别方案中识别结果精度低的问题,提高无线表格端到端识别的精度奠定了基础。
进一步地,在一个实施例中,所述候选无线表格识别结果的合并特征的获取方式,可以具体包括:
确定所述待识别无线表格中的显性直线,所述显性直线用于指示所述待识别无线表格中的文本所属的列;
确定所述候选无线表格识别结果中的表头和无线表格体;
确定所述候选无线表格识别结果中需要合并的第二单元格;
根据所述显性直线、所述表头、所述无线表格体和所述第二单元格,确定所述合并特征。
可选地,根据候选无线表格识别结果的合并特征,对候选无线表格识别结果进行调整,得到目标无线表格识别结果,该候选无线表格识别结果的合并特征可以具体通过如下方式得到,具体地:
找出待识别无线表格中的显式直线,该显示直线可以具体指一些单元格的文本下方画的一条线,用来提示文本所属的列,如图4所示,其中,显示直线的检测可以具体使用LSD、FLD等直线检测算法;
从得到的候选无线表格识别结果中确定无线表格的表头(包括横表头和纵表头)和无线表格体,可以具体根据文本布局、图像信息(显式直线、颜色等)以及目标自然语言处理NLP模型来确定;
根据邻近关系匹配出相邻单元格,然后使用目标NLP模型预测是否需要合并,挑出合并置信度比较高的相邻单元格,即第二单元格;
根据得到的显性直线、候选无线表格识别结果的表头、无线表格体和第二单元格,得到合并特征,并基于该合并特征对待合并行或待合并单元格进行合并,调整无线表格结构,得到目标无线表格识别结果,调整依据可以是空白单元格与其他单元格的关系、文本条对齐关系、表头与表体的对齐关系、行间文本条缩进方式、行间文本条分布关系等。
将得到的目标无线表格识别结果转化为html或者Excel格式。
在实际应用中,采用本发明提供的无线表格识别方法,将无线表格识别流程进行拆分后不仅可以加入先验的无线表格知识,还可以利用大数据训练相应的子模块(比如文本检测、文本识别),而且可以灵活的嵌入图像处理和自然语言处理方法,将本发明在港股业绩报告上进行测试,TEDS(Tree-Edit-Distance-based Similarity)达到了0.97,结果实例如图5所示。
本发明提供的无线表格识别方法,通过将无线表格识别过程进行拆分,得到一个个解耦的独立的子模块,解决img2seq模型依赖大数据、依赖模态信息单一、标注数据成本高、精度不高、无线表格中的先验知识无法融入模型的问题,提高无线表格识别的精度。
下面对本发明提供的无线表格识别系统进行描述,下文描述的无线表格识别系统与上文描述的无线表格识别方法可相互对应参照。
图6是本发明提供的无线表格识别系统的结构示意图,如图6所示,包括:
第一获取模块610、第二获取模块611以及无线表格识别模块612;
所述第一获取模块610,用于获取目标图像中的待识别无线表格的第一文本框识别结果和文本识别结果;
所述第二获取模块611,用于根据所述第一文本框识别结果和所述文本识别结果,得到候选无线表格识别结果,所述候选无线表格识别结果为候选无线表格的识别结果,所述候选无线表格为基于所述第一文本框识别结果创建的无线表格;
所述识别模块612,用于根据所述候选无线表格识别结果的合并特征,对所述候选无线表格识别结果进行调整,得到目标无线表格识别结果,所述合并特征为用于确定所述候选无线表格识别结果中的待合并行或待合并单元格的特征,所述待合并行为以行为单位,需要与相邻的上一行或相邻的下一行进行整体合并的行,所述待合并单元格为以单元格为单位,需要与相邻的上一单元格或相邻的下一单元格进行整体合并的单元格。
本发明提供的无线表格识别系统,通过无线表格识别得到待识别无线表格的文本框识别结果和文本识别结果,并基于该文本框识别结果和文本识别结果得到候选无线表格识别结果,基于该候选无线表格识别结果中的合并特征对候选无线表格识别结果进行调整,得到目标无线表格识别结果,解决了现有无线表格识别方案中识别结果精度低的问题,提高了无线表格端到端识别的精度。
图7是本发明提供的一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(communication interface)711、存储器(memory)712和总线(bus)713,其中,处理器710,通信接口711,存储器712通过总线713完成相互间的通信。处理器710可以调用存储器712中的逻辑指令,以执行如下方法:
获取目标图像中的待识别无线表格的第一文本框识别结果和文本识别结果;
根据所述第一文本框识别结果和所述文本识别结果,得到候选无线表格识别结果,所述候选无线表格识别结果为候选无线表格的识别结果,所述候选无线表格为基于所述第一文本框识别结果创建的无线表格;
根据所述候选无线表格识别结果的合并特征,对所述候选无线表格识别结果进行调整,得到目标无线表格识别结果,所述合并特征为用于确定所述候选无线表格识别结果中的待合并行或待合并单元格的特征,所述待合并行为以行为单位,需要与相邻的上一行或相邻的下一行进行整体合并的行,所述待合并单元格为以单元格为单位,需要与相邻的上一单元格或相邻的下一单元格进行整体合并的单元格。
此外,上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机电源屏(可以是个人计算机,服务器,或者网络电源屏等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
进一步地,本发明公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的无线表格识别方法,例如包括:
获取目标图像中的待识别无线表格的第一文本框识别结果和文本识别结果;
根据所述第一文本框识别结果和所述文本识别结果,得到候选无线表格识别结果,所述候选无线表格识别结果为候选无线表格的识别结果,所述候选无线表格为基于所述第一文本框识别结果创建的无线表格;
根据所述候选无线表格识别结果的合并特征,对所述候选无线表格识别结果进行调整,得到目标无线表格识别结果,所述合并特征为用于确定所述候选无线表格识别结果中的待合并行或待合并单元格的特征,所述待合并行为以行为单位,需要与相邻的上一行或相邻的下一行进行整体合并的行,所述待合并单元格为以单元格为单位,需要与相邻的上一单元格或相邻的下一单元格进行整体合并的单元格。
另一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的无线表格识别方法,例如包括:
获取目标图像中的待识别无线表格的第一文本框识别结果和文本识别结果;
根据所述第一文本框识别结果和所述文本识别结果,得到候选无线表格识别结果,所述候选无线表格识别结果为候选无线表格的识别结果,所述候选无线表格为基于所述第一文本框识别结果创建的无线表格;
根据所述候选无线表格识别结果的合并特征,对所述候选无线表格识别结果进行调整,得到目标无线表格识别结果,所述合并特征为用于确定所述候选无线表格识别结果中的待合并行或待合并单元格的特征,所述待合并行为以行为单位,需要与相邻的上一行或相邻的下一行进行整体合并的行,所述待合并单元格为以单元格为单位,需要与相邻的上一单元格或相邻的下一单元格进行整体合并的单元格。
以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机电源屏(可以是个人计算机,服务器,或者网络电源屏等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种无线表格识别方法,其特征在于,包括:
获取目标图像中的待识别无线表格的第一文本框识别结果和文本识别结果;
根据所述第一文本框识别结果和所述文本识别结果,得到候选无线表格识别结果,所述候选无线表格识别结果为候选无线表格的识别结果,所述候选无线表格为基于所述第一文本框识别结果创建的无线表格;
根据所述候选无线表格识别结果的合并特征,对所述候选无线表格识别结果进行调整,得到目标无线表格识别结果,所述合并特征为用于确定所述候选无线表格识别结果中的待合并行或待合并单元格的特征,所述待合并行为以行为单位,需要与相邻的上一行或相邻的下一行进行整体合并的行,所述待合并单元格为以单元格为单位,需要与相邻的上一单元格或相邻的下一单元格进行整体合并的单元格。
2.根据权利要求1所述的无线表格识别方法,其特征在于,所述获取目标图像中的待识别无线表格的第一文本框识别结果,包括:
将所述目标图像输入至第一检测模型,得到所述待识别无线表格的位置信息;
基于第二检测模型,确定所述位置信息的候选文本框识别结果;
根据所述候选文本框识别结果,确定所述第一文本框识别结果。
3.根据权利要求2所述的无线表格识别方法,其特征在于,所述获取目标图像中的待识别无线表格的文本识别结果,包括:
对所述候选文本框识别结果进行透视变换,得到第二文本框识别结果;
将所述第二文本框识别结果输入至目标方向分类模型,得到第三文本框识别结果;
将所述第三文本框识别结果输入至目标识别网络,得到所述文本识别结果。
4.根据权利要求2所述的无线表格识别方法,其特征在于,所述根据所述候选文本框识别结果,确定所述第一文本框识别结果,包括:
将所述候选文本框识别结果作为所述第一文本框识别结果;
或者,
计算所述候选文本框识别结果中的每列像素的方差;
根据所述每列像素的方差,删除所述候选文本框识别结果中的文本行首尾多余的空白部分;
根据所述文本行中文字间的空白间隔统计结果,确定第一裁切线;
根据所述第一裁切线对所述候选文本框识别结果进行裁切,得到第一裁切结果;
将所述第一裁切结果输入至目标自然语言处理模型,确定第二裁切线;
根据所述第一裁切线和所述第二裁切线,确定目标裁切线;
根据所述目标裁切线,对所述候选文本框识别结果进行裁切,得到第二裁切结果;
根据预设过滤规则对所述第二裁切结果进行过滤,得到所述第一文本框识别结果。
5.根据权利要求1所述的无线表格识别方法,其特征在于,所述根据所述第一文本框识别结果和所述文本识别结果,得到候选无线表格识别结果,包括:
将所述第一文本框识别结果中的目标文本框进行合并,得到第一合并结果,所述目标文本框包括第一文本框和第二文本框,所述第一文本框为所述第一文本框识别结果中任意多个文本框之间的距离小于等于预设阈值的文本框,所述第二文本框为所述第一文本框识别结果中第一目标列中的文本框,所述第一目标列为所述第一文本框识别结果中包括一个文本框的行数大于包括多个文本框的行数的列;
将所述第一合并结果输入到目标自然语言处理模型,确定合并点;
根据所述合并点对所述第一文本框识别结果进行合并,得到第二合并结果;
根据所述第一合并结果和所述第二合并结果,确定目标合并结果;
根据所述目标合并结果创建候选无线表格;
根据所述候选无线表格和所述文本识别结果,确定所述候选无线表格识别结果。
6.根据权利要求5所述的无线表格识别方法,其特征在于,所述根据所述候选无线表格和所述文本识别结果,确定所述候选无线表格识别结果,包括:
将所述文本识别结果写入所述候选无线表格,得到第一无线表格识别结果;
将所述第一无线表格识别结果中的第一单元格进行合并,得到第三合并结果,所述第一单元格为所述第一无线表格识别结果中的包括多个文本框的单元格;
删除所述第三合并结果中的空白行和空白列,得到第四合并结果;
在所述第四合并结果的目标行中添加竖线,并在所述第四合并结果中的第二目标列添加横线,所述目标行是所述第四合并结果中存在一个单元格包括多个文本框的行,所述第二目标列是所述第四合并结果中存在一个单元格包括多个文本框的列;
根据所述横线和所述竖线对所述第四合并结果进行网格划分,得到所述候选无线表格识别结果。
7.根据权利要求1-6任一项所述的无线表格识别方法,其特征在于,所述候选无线表格识别结果的合并特征的获取方式,包括:
确定所述待识别无线表格中的显性直线,所述显性直线用于指示所述待识别无线表格中的文本所属的列;
确定所述候选无线表格识别结果中的表头和无线表格体;
确定所述候选无线表格识别结果中需要合并的第二单元格,所述第二单元格是通过将所述候选无线表格识别结果中的相邻单元格输入至目标自然语言处理模型后得到的;
根据所述显性直线、所述表头、所述无线表格体和所述第二单元格,确定所述合并特征。
8.一种无线表格识别系统,其特征在于,包括:第一获取模块、第二获取模块以及识别模块;
所述第一获取模块,用于获取目标图像中的待识别无线表格的第一文本框识别结果和文本识别结果;
所述第二获取模块,用于根据所述第一文本框识别结果和所述文本识别结果,得到候选无线表格识别结果,所述候选无线表格识别结果为候选无线表格的识别结果,所述候选无线表格为基于所述第一文本框识别结果创建的无线表格;
所述识别模块,用于根据所述候选无线表格识别结果的合并特征,对所述候选无线表格识别结果进行调整,得到目标无线表格识别结果,所述合并特征为用于确定所述候选无线表格识别结果中的待合并行或待合并单元格的特征,所述待合并行为以行为单位,需要与相邻的上一行或相邻的下一行进行整体合并的行,所述待合并单元格为以单元格为单位,需要与相邻的上一单元格或相邻的下一单元格进行整体合并的单元格。
9.一种电子设备,包括处理器和存储有计算机程序的存储器,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述无线表格识别方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述无线表格识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310183762.9A CN116311301B (zh) | 2023-02-17 | 2023-02-17 | 无线表格识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310183762.9A CN116311301B (zh) | 2023-02-17 | 2023-02-17 | 无线表格识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116311301A true CN116311301A (zh) | 2023-06-23 |
CN116311301B CN116311301B (zh) | 2024-06-07 |
Family
ID=86819973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310183762.9A Active CN116311301B (zh) | 2023-02-17 | 2023-02-17 | 无线表格识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116311301B (zh) |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190236661A1 (en) * | 2018-01-31 | 2019-08-01 | Aon Risk Consultants, Inc. | System and methods for vulnerability assessment and provisioning of related services and products for efficient risk suppression |
CN110135446A (zh) * | 2018-02-09 | 2019-08-16 | 北京世纪好未来教育科技有限公司 | 文本检测方法及计算机存储介质 |
US20200104323A1 (en) * | 2019-09-02 | 2020-04-02 | Lg Electronics Inc. | User profiling method using event occurrence time |
CN111695553A (zh) * | 2020-06-05 | 2020-09-22 | 北京百度网讯科技有限公司 | 表格识别方法、装置、设备和介质 |
CN111814722A (zh) * | 2020-07-20 | 2020-10-23 | 电子科技大学 | 一种图像中的表格识别方法、装置、电子设备及存储介质 |
CN111985459A (zh) * | 2020-09-18 | 2020-11-24 | 北京百度网讯科技有限公司 | 表格图像校正方法、装置、电子设备和存储介质 |
CN112528813A (zh) * | 2020-12-03 | 2021-03-19 | 上海云从企业发展有限公司 | 表格识别方法、装置以及计算机可读存储介质 |
CN113139457A (zh) * | 2021-04-21 | 2021-07-20 | 浙江康旭科技有限公司 | 一种基于crnn的图片表格提取方法 |
WO2021147219A1 (zh) * | 2020-01-22 | 2021-07-29 | 平安科技(深圳)有限公司 | 基于图像的文本识别方法、装置、电子设备及存储介质 |
CN113435240A (zh) * | 2021-04-13 | 2021-09-24 | 北京易道博识科技有限公司 | 一种端到端的表格检测和结构识别方法及系统 |
CN113642380A (zh) * | 2021-06-04 | 2021-11-12 | 深度交叉(南京)智能科技有限公司 | 一种用于无线表格的识别技术 |
CN114005126A (zh) * | 2021-11-26 | 2022-02-01 | 成都数联云算科技有限公司 | 表格重构方法、装置、计算机设备及可读存储介质 |
CN114511861A (zh) * | 2021-12-20 | 2022-05-17 | 杭州未名信科科技有限公司 | 一种表格线定位方法和系统 |
CN114529773A (zh) * | 2020-10-30 | 2022-05-24 | 上海交通大学 | 基于结构单元的表格识别方法、系统、终端及介质 |
CN114528817A (zh) * | 2022-02-24 | 2022-05-24 | 中国人民解放军火箭军工程大学 | 一种基于ascii码字符的通用表格算法实现方法 |
WO2022150193A1 (en) * | 2021-01-06 | 2022-07-14 | Crosstex International, Inc. | Biological indicator reader with graphical user interface and methods of use |
CN114782974A (zh) * | 2022-05-18 | 2022-07-22 | 深圳市图灵机器人有限公司 | 表格识别方法、系统、智能终端及计算机可读存储介质 |
CN114783584A (zh) * | 2022-03-09 | 2022-07-22 | 广州方舟信息科技有限公司 | 一种药品随货同行单的录单方法及装置 |
US20230005286A1 (en) * | 2021-06-24 | 2023-01-05 | Nielsen Consumer Llc | Methods, systems, articles of manufacture, and apparatus for decoding purchase data using an image |
-
2023
- 2023-02-17 CN CN202310183762.9A patent/CN116311301B/zh active Active
Patent Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190236661A1 (en) * | 2018-01-31 | 2019-08-01 | Aon Risk Consultants, Inc. | System and methods for vulnerability assessment and provisioning of related services and products for efficient risk suppression |
CN110135446A (zh) * | 2018-02-09 | 2019-08-16 | 北京世纪好未来教育科技有限公司 | 文本检测方法及计算机存储介质 |
US20200104323A1 (en) * | 2019-09-02 | 2020-04-02 | Lg Electronics Inc. | User profiling method using event occurrence time |
WO2021147219A1 (zh) * | 2020-01-22 | 2021-07-29 | 平安科技(深圳)有限公司 | 基于图像的文本识别方法、装置、电子设备及存储介质 |
CN111695553A (zh) * | 2020-06-05 | 2020-09-22 | 北京百度网讯科技有限公司 | 表格识别方法、装置、设备和介质 |
US20210383105A1 (en) * | 2020-06-05 | 2021-12-09 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for recognizing table, device, medium |
CN111814722A (zh) * | 2020-07-20 | 2020-10-23 | 电子科技大学 | 一种图像中的表格识别方法、装置、电子设备及存储介质 |
CN111985459A (zh) * | 2020-09-18 | 2020-11-24 | 北京百度网讯科技有限公司 | 表格图像校正方法、装置、电子设备和存储介质 |
CN114529773A (zh) * | 2020-10-30 | 2022-05-24 | 上海交通大学 | 基于结构单元的表格识别方法、系统、终端及介质 |
CN112528813A (zh) * | 2020-12-03 | 2021-03-19 | 上海云从企业发展有限公司 | 表格识别方法、装置以及计算机可读存储介质 |
WO2022150193A1 (en) * | 2021-01-06 | 2022-07-14 | Crosstex International, Inc. | Biological indicator reader with graphical user interface and methods of use |
CN113435240A (zh) * | 2021-04-13 | 2021-09-24 | 北京易道博识科技有限公司 | 一种端到端的表格检测和结构识别方法及系统 |
CN113139457A (zh) * | 2021-04-21 | 2021-07-20 | 浙江康旭科技有限公司 | 一种基于crnn的图片表格提取方法 |
CN113642380A (zh) * | 2021-06-04 | 2021-11-12 | 深度交叉(南京)智能科技有限公司 | 一种用于无线表格的识别技术 |
US20230005286A1 (en) * | 2021-06-24 | 2023-01-05 | Nielsen Consumer Llc | Methods, systems, articles of manufacture, and apparatus for decoding purchase data using an image |
CN114005126A (zh) * | 2021-11-26 | 2022-02-01 | 成都数联云算科技有限公司 | 表格重构方法、装置、计算机设备及可读存储介质 |
CN114511861A (zh) * | 2021-12-20 | 2022-05-17 | 杭州未名信科科技有限公司 | 一种表格线定位方法和系统 |
CN114528817A (zh) * | 2022-02-24 | 2022-05-24 | 中国人民解放军火箭军工程大学 | 一种基于ascii码字符的通用表格算法实现方法 |
CN114783584A (zh) * | 2022-03-09 | 2022-07-22 | 广州方舟信息科技有限公司 | 一种药品随货同行单的录单方法及装置 |
CN114782974A (zh) * | 2022-05-18 | 2022-07-22 | 深圳市图灵机器人有限公司 | 表格识别方法、系统、智能终端及计算机可读存储介质 |
Non-Patent Citations (2)
Title |
---|
MANABU OHTA等: "A Cell-detection-based Table-structure Recognition Method", 《2019 ASSOCIATION FOR COMPUTING MACHINERY》, 26 September 2019 (2019-09-26), pages 1 - 4 * |
孔垂鑫: "基于深度学习的表格文档图像数字化技术研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 01, 15 January 2022 (2022-01-15), pages 138 - 2594 * |
Also Published As
Publication number | Publication date |
---|---|
CN116311301B (zh) | 2024-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111401371B (zh) | 一种文本检测识别方法、系统及计算机设备 | |
CN112818813B (zh) | 图像中表格信息的识别方法、装置、电子设备及存储介质 | |
CN112560849B (zh) | 基于神经网络算法的文理分割方法及系统 | |
KR102472821B1 (ko) | 혼합 조판 문자를 인식하는 방법, 기기, 칩 회로 및 컴퓨터 프로그램 제품 | |
CN112069991B (zh) | 一种pdf的表格信息提取方法及相关装置 | |
CN113095267B (zh) | 统计图的数据提取方法、电子设备和存储介质 | |
KR20160132842A (ko) | 플로우 문서를 생성하기 위한 이미지 문서 컴포넌트 검출 및 추출 기법 | |
CN113343815B (zh) | 一种pdf等版式文档中识别表格的方法 | |
CN102567300A (zh) | 图片文档的处理方法及装置 | |
CN103488711A (zh) | 一种快速制作矢量字库的方法及系统 | |
CN112926564A (zh) | 图片分析方法、系统、计算机设备和计算机可读存储介质 | |
CN112241730A (zh) | 一种基于机器学习的表格提取方法和系统 | |
CN112651331A (zh) | 文本表格提取方法、系统、计算机设备及存储介质 | |
CN116824608A (zh) | 基于目标检测技术的答题卡版面分析方法 | |
CN111126266A (zh) | 文本处理方法、文本处理系统、设备及介质 | |
CN115393872B (zh) | 一种训练文本分类模型的方法、装置、设备及存储介质 | |
CN101877062A (zh) | 图像版面区域轮廓分析方法 | |
CN111611883A (zh) | 基于最小单元格聚类的表格版面分析方法、系统及设备 | |
CN114399782B (zh) | 文本图像处理方法、装置、设备、存储介质及程序产品 | |
CN111428446A (zh) | 问卷生成方法、问卷识别方法及问卷识别系统 | |
CN113420580B (zh) | 用于对二维码进行辅助定位符定位的方法及装置、二维码扫描设备、存储介质 | |
CN112084103A (zh) | 界面测试方法、装置、设备和介质 | |
CN118522020B (zh) | 一种书写数据处理方法、电子设备及可读存储介质 | |
CN116311301B (zh) | 无线表格识别方法及系统 | |
CN117496521A (zh) | 一种表格关键信息抽取方法、系统、装置及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |