CN110717492B - 基于联合特征的图纸中字符串方向校正方法 - Google Patents
基于联合特征的图纸中字符串方向校正方法 Download PDFInfo
- Publication number
- CN110717492B CN110717492B CN201910983293.2A CN201910983293A CN110717492B CN 110717492 B CN110717492 B CN 110717492B CN 201910983293 A CN201910983293 A CN 201910983293A CN 110717492 B CN110717492 B CN 110717492B
- Authority
- CN
- China
- Prior art keywords
- character
- characters
- character string
- angle
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Multimedia (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种基于联合特征的图纸中字符串方向校正方法,其包括提取字符串图像中字符的最小外接矩形;选取字符的最小外接矩形的长边方向作为主方向,并在长边上任意选取两个不相同的点,计算每个字符的方向角度;根据字符的最小外接矩形的长边和短边,计算字符的边长比,并将边长比大于等于预设阈值的字符标记为第一类字符;基于字符Hu不变矩,提取第一类字符的矩特征,并根据矩特征,采用已训练的SVM分类器对每个字符进行分类;根据分类结果更新其方向角度;根据字符串中字符数量与预设数量时,采用K均值聚类算法或算术平均值的方式得到字符串的主方向旋转角度,之后采用主方向旋转角度对字符串的主方向进行校正。
Description
技术领域
本发明涉及图像处理技术,具体涉及一种基于联合特征的图纸中字符串方向校正方法。
背景技术
常见的图纸有工程图纸和机械图纸两大类。工程图纸是工程设计、施工和验收等环节中的重要依据。机械图纸是机械零部件的设计、加工和质量检查的重要依据。每一类图纸中的字符标注是图纸中一种关键数据。图纸中的图像前景复杂,但背景较为简单,没有丰富的色彩信息;标注串分布不均,方向各异,穿插在图像的各个位置。自动提取和识别字符标注串可以帮助人们快速识别、理解、管理图纸,以及利用图纸进行质量检测和质量控制,解决人工长时间阅读图纸带来的疲劳、注意力容易不集中、效率低等问题。图纸的字符识别步骤一般分为以下几步:
(1)字符检测,基于字符特征和检测算法,获得图纸中字符的位置,即定位标注串中的字符。常见的字符检测方法是基于笔画宽度、极值稳定性、DCT或者小波频域系数等特征检测字符。近年来,有人借助针对自然场景中的深度学习方法检测字符。还有人利用字符形态特征,将字符与图纸线条分离,从而实现字符检测。
(2)标注串分割,通过形态滤波、旋转投影、字符切割等处理,分离字符与背景粘连的点线,剔除干扰线元素,将字符与背景分离,保留标注串的字符;并对字符进行重组,从而分理出一个完整的标出串图像。字符检测和字符串分割的操作容易引起字符的形态失真和扭曲字符原本的方向。
(3)标注串的字符校正,为了紧凑安排图纸中的布局和便于用户理解,图纸中标注串的字符方向非常灵活,各个方向的字符串都可能存在,这给计算机自动提取和识别标出字符串造成了困难。
(4)标注串的字符识别;采用OCR技术,识别标注串中的字符。
在整个图纸的标注串的识别过程中,无论是利用传统算法识别图纸文字,还是利用深度学习进行识别,面对那些复杂的倾斜角度不一的标注串,都需要进行校正处理,否则会增加识别过程的计算量和算法复杂度。
目前常规的字符倾斜旋转校正方法主要有以下几类:基于文本行直线检测的倾斜校正方法、基于角点和投影的倾斜校正方法,还有基于深度学习的畸变矫正方法,虽然这三类方法能够在一定程度上校正字符倾斜,但仍存在如下缺陷:
基于文本行直线检测的倾斜校正方法缺点是对于工程图纸中较为复杂的排列杂乱未能形成文本行的图片,其效果不佳;基于角点和投影的倾斜校正方法缺点是于工程图纸中字符排列可能存在多行错位的情况,不能保有良好的鲁棒性;现有基于深度学习的畸变矫正方法缺点是对于工程图纸中,字符存在自由方向的旋转,而非扭曲畸变,因此该方法可行性不高,而且深度学习训练时间长,需要大量的资源开销,不够经济适用。
发明内容
针对现有技术中的上述不足,本发明提供了一种校准精度高的基于联合特征的图纸中字符串方向校正方法。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种基于联合特征的图纸中字符串方向校正方法,其包括:
S1、获取待校正的字符串图像,并提取字符串中每个字符的连通域的最小外接矩形;
S2、选取字符的最小外接矩形的长边方向作为主方向,并在长边上任意选取两个不相同的点,基于两个点的坐标计算出每个字符的方向角度;
S3、根据字符的最小外接矩形的长边和短边,计算字符的边长比,并将边长比大于或者等于预设阈值的字符标记为第一类字符;
S4、基于字符Hu不变矩,提取第一类字符的矩特征,并根据每个第一类字符的矩特征,采用已训练的SVM分类器对第一类字符进行分类;
S5、根据分类结果查找对应字符的补偿角度,更新其方向角度=方向角度+补偿角度;
S6、当字符串中字符数量大于预设数量时,采用K均值聚类算法从所有的字符方向角度中选取字符串的主方向旋转角度;
S7、当字符串中字符数量小于或者等于预设数量时,采用所有字符的方向角度的算术平均值作为字符串的主方向旋转角度;
S8、根据主方向旋转角度,对字符串图像中字符串的主方向进行校正。
本发明的有益效果为:本方案针对图纸中字符的方向特点,用于已经定位了字符所在的区域并且分割出来的字符串,提取每个字符的连通域最小外接矩形,并以长边方向作为字符的主方向,经过分类补偿和聚类提取主方向角度作为字符串的主方向旋转角度,最后进行旋转校正。
本方案通过Hu高阶不变矩作为特征矩和SVM分类器相结合进行角度补偿,可以对最小外接矩形方向不是字符主方向的情况进行校正,有效弥补了直接利用字符连通域外接矩形进行方向校正可能会引入的误差,使结果更加的精确,也没有造成过多的资源开销。
利用K均值(K-means)算法对字符主方向特征进行聚类,进一步达到精确提取字符串中各个字符的方向角,从而来获取需要校正的角度。本方法直观有效,计算速度快,能够较好较快地实现图纸上字符串的方向校正
附图说明
图1为基于联合特征的图纸中字符串方向校正方法的流程图。
图2为输入的倾斜字符串的图像。
图3为字符的最小外接矩形和主方向dv。
图4为主方向聚类校正条件不满足的图片。
图5为获得主方向RA后旋转结果,其中(a)为原始图片,(b)旋转后的图片。
图6为实施例中输入的部分样图示例。
图7为实施例中输入的部分样图校正后的示例。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
参考图1,图1示出了基于联合特征的图纸中字符串方向校正方法的流程图;如图1所示,该方法S包括步骤S1至步骤S8。
在步骤S1中,获取待校正的字符串图像,并提取字符串中每个字符的连通域的最小外接矩形;本方案获取的字符串图像是已经经过字符检测和分割后获得的倾斜标注串,本方案输入字符串图像示例可以参见图2。
实施时,本方案优选所述提取字符串中每个字符的连通域的最小外接矩形进一步包括:
采用连通域检测方法提取字符串图像中每个字符包含的所有像素点;
根据凸包理论,计算出完全包含点集的最小的凸多边形凸包;
采用旋转卡壳算法计算出凸包的最小外接矩形。
在步骤S2中,选取字符的最小外接矩形的长边方向作为主方向,并在长边上任意选取两个不相同的点,基于两个点的坐标计算出每个字符的方向角度;
标注串字符包含了两个方向,一种是平行于标注字符串的文本行所在的方向dh,另外一种是垂直于标注字符串的文本行方向的单个字符方向dv。本发明选择dv来描述字符的主方向,dv普遍为字符的长边方向,dv与图纸图像垂直方向的y轴(高度方向)的夹角RA称为标注串的旋转角,以图3为示例。
实施时,本方案优选基于两个点的坐标计算出每个字符的方向角度进一步包括:根据两个点坐标,计算字符长边的斜率;根据斜率和反正切函数,计算出每个字符主方向的方向角度。
在步骤S3中,根据字符的最小外接矩形的长边和短边,计算字符的边长比,并将边长比大于或者等于预设阈值的字符标记为第一类字符;边长比的计算公式为:Re=(V-H)/H,Re为边长比,V为字符的长边,H为字符的短边。
第一类字符指代具有显著方向的字符,将边长比小于预设阈值的字符标记为不具有显著方向的字符。
根据边长比和预设阈值的关系,可以将全部字符分为具有显著方向的和非显著方向的两大类字符。非显著方向的字符通常是具有多对称轴的字符,比如角度数(°)、圆圈(○)等。而具有显著方向的字符中还可以进一步分为两类。第一类字符是提取的方向角度δ就是字符的真实主方向dv与坐标轴的夹角,对于这类字符,不需要作额外的方向角度补偿。另外一类字符是提取的方向角θ并不是字符真实的主方向角度,比如字符4、7、Φ符号,示例如图4所示,对于这类字符,必须需要作额外的方向角度补偿,才能获得真实的字符方向。本方案对字符的完全分类如表1所示。
表1标注串中字符的分类
在步骤S4中,基于字符Hu不变矩,提取第一类字符的矩特征,并根据每个第一类字符的矩特征,采用已训练的SVM分类器对第一类字符进行分类,SVM分类器将字符划分为C1-C5类中的某一类。
在本发明的一个实施例中,基于字符Hu不变矩,提取第一类字符图像的矩特征进一步包括:
分别构建每个字符图像的(p+q)阶矩mpq和中心矩μpq:
其中,p为x分量的阶数;q为y分量的阶数;p,q=0,1,2…;f(x,y)为字符图像中坐标(x,y)的像素值;N为字符图像高度;M为字符图像宽度;为代表字符图像的重心;μpq的归一化中心矩ηpq为:
其中,平均阶数ρ=(p+q)/2+1,且p+q=2,3,…;
采用二阶和三阶归一化中心矩构造4个不变矩M1、M2、M3、M4:
M1=η20+η02,M2=(η20+η02)2+4η11 2
M3=(η30-3η12)2+(3η21-η03)2,M4=(η30+η12)2+(η21+η03)2
对构造的4个不变矩M1、M2、M3、M4按预设比例放大得到每个第一类字符最终的矩特征。
对构造的4个不变矩M1、M2、M3、M4按预设比例放大得到每个第一类字符最终的矩特征,部分字符样本放大后的Hu不变矩参考表2。
表2部分字符样本放大后的Hu不变矩
对4个不变矩的数值进行放大,可以使过小的Hu不变矩能够直观呈现进行比较,以保证后续的精确分类。本发明选取4个不变矩用于步骤S5中的聚类,可以在减少提取矩特征计算的复杂度,同时还可以保证足够的精确度。
在对SVM分类器进行训练时,将每个字符的M1,M2,M3,M4,将其作为数据集SM中一个特征向量x=[M1,M2,M3,M4]T;根据其是否需要进行角度补充,可以将x的类别y设定为1或者-1;将数据集输入SVM分类中训练,识别其需要添加补偿与不需要添加补偿的字符,保存好训练的权重参数。
然后再后续的角度补偿过程中,读取权重参数,利用SVM分类模型识别出当前字符的类别,根据提前训练得出的需要添加补偿的夹角δi,在字符的最小外接矩形长边的方向角度的基础上做出补偿。
在步骤S5中,根据分类结果查找对应字符的补偿角度,更新其方向角度=方向角度+补偿角度。
在步骤S6中,当字符串中字符数量大于预设数量时,采用K均值聚类算法从所有的字符方向角度中选取字符串的主方向旋转角度。
采用K均值聚类算法从所有的字符方向角度中选取字符串的主方向旋转角度进一步为:以预设数量作为聚类中心个数,采用K均值聚类算法对所有字符的方向角度进行聚类,并选取聚类后字符最多的簇的聚类中心的方向角度作为字符串的主方向旋转角度。
在本发明的一个实施例中,采用K均值聚类算法对所有字符的方向角度进行聚类进一步包括:
S61、从采用所有字符的方向角度构成的样本集中随机选取预设数量个聚类中心,并将距离每个聚类中心最近的方向角度划分至同一簇中;
S62、计算任意两个聚类中心之间的距离,并判断所述距离是否小于预设距离,若是,则进入步骤S63,否则进入步骤S64;
S63、判断两个聚类中心对应的两簇的方向角度总个数是否大于预设总数,若是,则将两个聚类中心对应的簇合并为一个簇,之后进入步骤S64;否则直接进入步骤S64;
通过步骤S62和步骤S63中聚类中心间距离的判断,能够将部分较近的方向角度进行合并,以减少后续判断的复杂度和计算量。
S64、计算每个簇中所有方向角的平均欧式距离,并根据平均欧式距离更新各簇的聚类中心;
S65、计算误差平方和函数J:
其中,Aj为第j簇的聚类中心,k为聚类中心的数量;Ai为第j簇的第i个方向角,Nj为Aj所在簇的方向角总数量;||Ai-Aj||2为Ai和Aj的平均欧式距离;
S66、判断误差平方和函数J是否小于函数阈值,若是,完成K均值聚类,否则,返回步骤S61。
图文分离和字符串分割阶段所采用的旋转插值、形态学操作等可能引起字符方向偏差,使得提取的最小外接矩形存在误差。本方案通过采用K均值聚类算法进行主方向旋转角度的选取,能够获得绝大多数字符的相似主方向,以克服该问题,以保证最终旋转校正的准确性。
由于一个字符标注串中的字符方向的个数有限,而K均值算法需要先设定K的值,本方案优选将K均值聚类的初始K值设定为3,在获得的标注串的字符主方向数据中随机选取3个角度数据作为起始点,然后进入后续的聚类迭代的过程。
在步骤S7中,当字符串中字符数量小于或者等于预设数量时,采用所有字符的方向角度的算术平均值作为字符串的主方向旋转角度;
下面结合具体的实例,对本方案提供的校正方法的效果进行说明:
本实例使用的实验平台为:硬件环境:CPU Intel(R)Core(TM)i7-6700HQ CPU@2.60GHz 2.59GHz 8核;内存16G;显卡NVIDIA GeForce GTX 1060;软件环境:操作系统64位Windows10;OpenCV 2.4.9;编程语言为C++。
实验样图为已经定位后消除了绝大部分的外部干扰的干净标注串图片,数量为800张,字符总数约为7000个,取自若干图纸,部分样图示例如图6。
采用本方案提供的校正方法的部分样图参考图7,校正的字符串样本图总共800张图,其中正确旋转786图,旋转成功率为98.25%,总计耗时时间23秒,平均每张所需时间29毫秒。综上所述,本方案的校正方法具有较好的准确率和较快的处理速度。
Claims (7)
1.基于联合特征的图纸中字符串方向校正方法,其特征在于,包括:
S1、获取待校正的字符串图像,并提取字符串中每个字符的连通域的最小外接矩形;
S2、选取字符的最小外接矩形的长边方向作为主方向,并在长边上任意选取两个不相同的点,基于两个点的坐标计算出每个字符的方向角度;
S3、根据字符的最小外接矩形的长边和短边,计算字符的边长比,并将边长比大于或者等于预设阈值的字符标记为第一类字符;
S4、基于字符Hu不变矩,提取第一类字符的矩特征,并根据每个第一类字符的矩特征,采用已训练的SVM分类器对第一类字符进行分类;
S5、根据分类结果查找对应字符的补偿角度,更新其方向角度=方向角度+补偿角度;
S6、当字符串中字符数量大于预设数量时,采用K均值聚类算法从所有的字符方向角度中选取字符串的主方向旋转角度;
S7、当字符串中字符数量小于或者等于预设数量时,采用所有字符的方向角度的算术平均值作为字符串的主方向旋转角度;
S8、根据主方向旋转角度,对字符串图像中字符串的主方向进行校正。
2.根据权利要求1所述的基于联合特征的图纸中字符串方向校正方法,其特征在于,采用K均值聚类算法从所有的字符方向角度中选取字符串的主方向旋转角度进一步为:
以预设数量作为聚类中心个数,采用K均值聚类算法对所有字符的方向角度进行聚类,并选取聚类后字符最多的簇的聚类中心的方向角度作为字符串的主方向旋转角度。
3.根据权利要求2所述的基于联合特征的图纸中字符串方向校正方法,其特征在于,采用K均值聚类算法对所有字符的方向角度进行聚类进一步包括:
S61、从采用所有字符的方向角度构成的样本集中随机选取预设数量个聚类中心,并将距离每个聚类中心最近的方向角度划分至同一簇中;
S62、计算任意两个聚类中心之间的距离,并判断所述距离是否小于预设距离,若是,则进入步骤S63,否则进入步骤S64;
S63、判断两个聚类中心对应的两簇的方向角度总个数是否大于预设总数,若是,则将两个聚类中心对应的簇合并为一个簇,之后进入步骤S64;否则直接进入步骤S64;
S64、计算每个簇中所有方向角的平均欧式距离,并根据平均欧式距离更新各簇的聚类中心;
S65、计算误差平方和函数J:
其中,Aj为第j簇的聚类中心,k为聚类中心的数量;Ai为第j簇的第i个方向角,Nj为Aj所在簇的方向角总数量;||Ai-Aj||2为Ai和Aj的平均欧式距离;
S66、判断误差平方和函数J是否小于函数阈值,若是,完成K均值聚类,否则,返回步骤S61。
4.根据权利要求1所述的基于联合特征的图纸中字符串方向校正方法,其特征在于,所述提取字符串中每个字符的连通域的最小外接矩形进一步包括:
采用连通域检测方法提取字符串图像中每个字符包含的所有像素点;
根据凸包理论,计算出完全包含点集的最小的凸多边形凸包;
采用旋转卡壳算法计算出凸包的最小外接矩形。
5.根据权利要求1所述的基于联合特征的图纸中字符串方向校正方法,其特征在于,所述基于两个点的坐标计算出每个字符的方向角度进一步包括:
根据两个点坐标,计算字符长边的斜率;
根据斜率和反正切函数,计算出每个字符主方向的方向角度。
6.根据权利要求1所述的基于联合特征的图纸中字符串方向校正方法,其特征在于,所述基于字符Hu不变矩,提取第一类字符图像的矩特征进一步包括:
分别构建每个字符图像的(p+q)阶矩mpq和中心矩μpq:
其中,p为x分量的阶数;q为y分量的阶数;p,q=0,1,2...;f(x,y)为字符图像中坐标(x,y)的像素值;N为字符图像高度;M为字符图像宽度;为代表字符图像的重心,μpq的归一化中心矩ηpq为:
其中,平均阶数ρ=(p+q)/2+1,且p+q=2,3,...;
采用二阶和三阶归一化中心矩构造4个不变矩M1、M2、M3、M4:
M1=η20+η02,M2=(η20+η02)2+4η11 2
M3=(η30-3η12)2+(3η21-η03)2,M4=(η30+η12)2+(η21+η03)2
对构造的4个不变矩M1、M2、M3、M4按预设比例放大得到每个第一类字符最终的矩特征。
7.根据权利要求1所述的基于联合特征的图纸中字符串方向校正方法,其特征在于,边长比的计算公式为:Re=(V-H)/H,Re为边长比,V为字符的长边,H为字符的短边。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910983293.2A CN110717492B (zh) | 2019-10-16 | 2019-10-16 | 基于联合特征的图纸中字符串方向校正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910983293.2A CN110717492B (zh) | 2019-10-16 | 2019-10-16 | 基于联合特征的图纸中字符串方向校正方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110717492A CN110717492A (zh) | 2020-01-21 |
CN110717492B true CN110717492B (zh) | 2022-06-21 |
Family
ID=69211740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910983293.2A Expired - Fee Related CN110717492B (zh) | 2019-10-16 | 2019-10-16 | 基于联合特征的图纸中字符串方向校正方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110717492B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113554558B (zh) * | 2020-04-26 | 2024-11-01 | 北京金山数字娱乐科技有限公司 | 一种图像处理的方法和装置 |
CN112383670B (zh) * | 2020-11-10 | 2022-09-16 | 武汉天有科技有限公司 | 一种试卷扫描自动扶正方法及装置 |
CN112580507B (zh) * | 2020-12-18 | 2024-05-31 | 合肥高维数据技术有限公司 | 一种基于图像矩矫正的深度学习文本字符检测方法 |
CN112686128B (zh) * | 2020-12-28 | 2022-10-14 | 南京览众智能科技有限公司 | 基于机器学习的教室课桌检测方法 |
CN112966318B (zh) * | 2021-04-12 | 2022-06-10 | 青矩技术股份有限公司 | 一种显示cad文件中字符的方法及终端设备 |
CN113869314B (zh) * | 2021-10-13 | 2024-07-16 | 广东金赋科技股份有限公司 | 一种文本方向聚类矫正的图像信息提取方法及系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2171773A1 (en) * | 1995-04-28 | 1996-10-29 | Philip Andrew Chou | Automatic Training of Character Templates Using a Transcription and a Two-Dimensional Image Source Model |
CN1137657A (zh) * | 1995-03-08 | 1996-12-11 | 佳能株式会社 | 一种图像处理方法和一种图像处理装置 |
JPH11282959A (ja) * | 1998-03-27 | 1999-10-15 | Nec Corp | 文字列照合装置、方法及び記録媒体、並びに文書分類装置、文字読み取り装置及び真贋判定装置 |
JP2000003407A (ja) * | 1998-06-11 | 2000-01-07 | Seiko Epson Corp | 手書き文字正規化方法及び手書き文字正規化装置並びに手書き文字正規化処理プログラムを記録した記録媒体 |
CN101777124A (zh) * | 2010-01-29 | 2010-07-14 | 北京新岸线网络技术有限公司 | 一种提取视频文本信息的方法及装置 |
CN102346847A (zh) * | 2011-09-26 | 2012-02-08 | 青岛海信网络科技股份有限公司 | 一种支持向量机的车牌字符识别方法 |
CN103077389A (zh) * | 2013-01-07 | 2013-05-01 | 华中科技大学 | 一种结合字符级分类和字符串级分类的文本检测和识别方法 |
CN105512657A (zh) * | 2015-08-20 | 2016-04-20 | 北京旷视科技有限公司 | 字符识别方法和设备 |
CN108681729A (zh) * | 2018-05-08 | 2018-10-19 | 腾讯科技(深圳)有限公司 | 文本图像矫正方法、装置、存储介质及设备 |
CN108780572A (zh) * | 2017-02-22 | 2018-11-09 | 华为技术有限公司 | 图像校正的方法及装置 |
CN109447067A (zh) * | 2018-10-24 | 2019-03-08 | 北方民族大学 | 一种票据方向检测矫正方法及自动检票系统 |
-
2019
- 2019-10-16 CN CN201910983293.2A patent/CN110717492B/zh not_active Expired - Fee Related
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1137657A (zh) * | 1995-03-08 | 1996-12-11 | 佳能株式会社 | 一种图像处理方法和一种图像处理装置 |
CA2171773A1 (en) * | 1995-04-28 | 1996-10-29 | Philip Andrew Chou | Automatic Training of Character Templates Using a Transcription and a Two-Dimensional Image Source Model |
JPH11282959A (ja) * | 1998-03-27 | 1999-10-15 | Nec Corp | 文字列照合装置、方法及び記録媒体、並びに文書分類装置、文字読み取り装置及び真贋判定装置 |
JP2000003407A (ja) * | 1998-06-11 | 2000-01-07 | Seiko Epson Corp | 手書き文字正規化方法及び手書き文字正規化装置並びに手書き文字正規化処理プログラムを記録した記録媒体 |
CN101777124A (zh) * | 2010-01-29 | 2010-07-14 | 北京新岸线网络技术有限公司 | 一种提取视频文本信息的方法及装置 |
CN102346847A (zh) * | 2011-09-26 | 2012-02-08 | 青岛海信网络科技股份有限公司 | 一种支持向量机的车牌字符识别方法 |
CN103077389A (zh) * | 2013-01-07 | 2013-05-01 | 华中科技大学 | 一种结合字符级分类和字符串级分类的文本检测和识别方法 |
CN105512657A (zh) * | 2015-08-20 | 2016-04-20 | 北京旷视科技有限公司 | 字符识别方法和设备 |
CN108780572A (zh) * | 2017-02-22 | 2018-11-09 | 华为技术有限公司 | 图像校正的方法及装置 |
CN108681729A (zh) * | 2018-05-08 | 2018-10-19 | 腾讯科技(深圳)有限公司 | 文本图像矫正方法、装置、存储介质及设备 |
CN109447067A (zh) * | 2018-10-24 | 2019-03-08 | 北方民族大学 | 一种票据方向检测矫正方法及自动检票系统 |
Non-Patent Citations (2)
Title |
---|
工程图中字符分离和标注字符串生成技术;胡友兰;黄树槐;常明;《华中理工大学学报》;19970330;第25卷(第3期);第30-33页 * |
工程图纸字符串及标注信息提取;范帆;关佶红;《计算机工程与应用》;20120301;第7卷(第48期);第161-164页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110717492A (zh) | 2020-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110717492B (zh) | 基于联合特征的图纸中字符串方向校正方法 | |
JP4594372B2 (ja) | ドキュメント画像からのパラメータ化された形状の認識方法 | |
Roy et al. | HMM-based Indic handwritten word recognition using zone segmentation | |
CN102388392B (zh) | 模式识别设备 | |
JP4623676B2 (ja) | 動的なコネクタ解析のための方法、装置及び記憶媒体 | |
JP4414401B2 (ja) | 顔特徴点検出方法および装置並びにプログラム | |
US8548253B2 (en) | Fast line linking | |
CN112634125B (zh) | 一种基于离线人脸数据库的自动面部替换方法 | |
CN113158977B (zh) | 改进FANnet生成网络的图像字符编辑方法 | |
JP2003515230A (ja) | ビデオストリームの分類可能な記号の分離方法及びシステム | |
CN106682679B (zh) | 一种基于水平集超像素和贝叶斯框架的显著性检测方法 | |
CN110399877B (zh) | 连接字符的光学字符识别 | |
CN110598703A (zh) | 一种基于深度神经网络的ocr识别方法及装置 | |
CN105096244A (zh) | 图像变换方法及其装置以及图像识别方法及其装置 | |
CN106326895A (zh) | 图像处理装置和图像处理方法 | |
CN108830270A (zh) | 对满文单词正确分割各识别的满文单词中轴线的定位方法 | |
CN110852327A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN116612478A (zh) | 一种脱机手写汉字的评分方法、装置及存储介质 | |
CN108256518A (zh) | 文字区域检测方法及装置 | |
CN111814801B (zh) | 一种机械图中标注串的提取方法 | |
CN107368826A (zh) | 用于文本检测的方法和装置 | |
CN111062393B (zh) | 一种基于谱聚类的自然场景汉字分割方法 | |
CN105096239A (zh) | 图像配准方法及其装置以及图像拼接方法及其装置 | |
Ali et al. | A new design based-fusion of features to recognize Arabic handwritten characters | |
CN112183538B (zh) | 一种满文识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220621 |