[go: up one dir, main page]

CN101763516B - 一种基于拟合函数的文字识别方法 - Google Patents

一种基于拟合函数的文字识别方法 Download PDF

Info

Publication number
CN101763516B
CN101763516B CN2010100179333A CN201010017933A CN101763516B CN 101763516 B CN101763516 B CN 101763516B CN 2010100179333 A CN2010100179333 A CN 2010100179333A CN 201010017933 A CN201010017933 A CN 201010017933A CN 101763516 B CN101763516 B CN 101763516B
Authority
CN
China
Prior art keywords
point
stroke
line segment
vector
fit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2010100179333A
Other languages
English (en)
Other versions
CN101763516A (zh
Inventor
皮德常
彭立勋
王明涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanxing Nanjing Network Engineering Co ltd
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN2010100179333A priority Critical patent/CN101763516B/zh
Publication of CN101763516A publication Critical patent/CN101763516A/zh
Application granted granted Critical
Publication of CN101763516B publication Critical patent/CN101763516B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明公布了一种基于拟合函数的文字识别方法。本发明方法对构成待识别的文字的线条进行拟合,将文字转化为多个多项式函数来描述,然后通过分析拟合函数与模板库的标准函数的相似度,取出相似度最高的模板作为识别结果。本发明不仅能够识别汉字,还能够识别数字、字母和一些特殊的符号,且具有较高的执行效率和准确率。

Description

一种基于拟合函数的文字识别方法
技术领域
本发明属于模式识别、人工智能和文字信息处理领域,特别涉及一种基于拟合函数的文字识别方法。
背景技术
随着计算机技术的推广应用,尤其是互联网的日益普及,人类越来越多地依靠计算机获得各种信息。大量地信息处理工作也都转移到计算机上进行。在日常的生活和工作中,存在着大量的文字信息处理问题,因而将文字信息快速输入到计算机这一要求变得非常迫切。
现在一般的文字识别算法是基于对待识别图形的点阵分析,对构成文字的线条较复杂的文字进行识别有很大的局限性,例如对汉字有专门的汉字识别方法,对字母有专门的字母识别方法,即使用同一类算法思想也是需要不同的程序来实现。尤其将多种类型符号混在一起时,大部分算法都很难识别出来。如果是手写输入,识别的难度就更大。
现有的通用文字识别算法,例如模板匹配算法,一般用训练样本特征的平均值来描述,分类器根据输入样本特征与各个文字的参照特征的距离进行识别。由于汉字存在各种各样字体,手写汉字中还存在各种各样的变形,因此文件的任何特征都存在一个分布空间。只有把这些分布考虑进去,才能更精确地进行分类识别,因此只用特征平均值来描述特征是不够的。
贝叶斯分类算法则是采用一种用分段线性函数描述汉字特征的概率密度函数方法,能很好的识别出汉字的特征分布,但是由于特征值的分布通常不是某种简单的统计分布,如果没有简单的方法描述这些概率密度函数,则表示所有的汉字的各维特征的概率密度函数需要的存储空间将是实用系统所不能承受的。
以上这两种方法都不能很好的将复杂图形分类,对文字识别执行的准确率和效率很低。
发明内容
本发明目的是针对现有技术存在的缺陷,根据文字图像的特点,应用拟合函数的技术和特征,提出一种有效的基于拟合函数的文字识别方法。本发明更好的兼顾了文字识别的准确度和速度。
本发明为实现上述目的,采用如下技术方案:
本发明是一种基于拟合函数的文字识别方法,其特征在于包括如下步骤:
(1)在联机或者在离线的情况下读入待识别的文字样本;
(2)文字图像预处理:首先将步骤(1)所述的待识别的文字样本图像二值化,然后线条消抖,再进行断点连接,最后把文字图像规范化;
(3)分析样本:先从步骤(2)所述的规范化后的待识别的文字样本图像中拆分出文字笔画,然后将拆分出的每个笔画归类到笔画集中,并以此生成可识别的符号序列;对笔画集中的每条线段寻找特征点,根据特征点集拟合多项式找出最佳拟合函数,选取最佳拟合函数的系数作为最佳拟合向量;用最佳拟合向量匹配笔画写入符号向量;
(4)识别样本:首先根据步骤(3)所述的符号序列在知识库中寻找与之匹配的多个模板;然后提取这多个模板图案的符号向量并与步骤(3)所述的待识别的文字样本图像的符号向量进行匹配;
(5)输出结果:将与步骤(3)所述的待识别的文字样本图像的符号向量相似度最高的那个模板文字图案作为识别结果。
本发明是针对二值文字图像的识别,二值化后的图像能使图像的处理速度高、成本低,此外,由于最终是对字符串进行匹配,使用索引提高了匹配速度,因此具有较高的执行效率;本发明将各种复杂的文字图形转化为多项式函数进行描述,生成符号向量,然后通过分析与知识库中模板的相似度进行文字识别,对文字识别正确率高,稳定性好。
附图说明
图1:本发明方法的总体框图;
图2:联机情况下笔画拆分流程图。
具体实施方式
为了便于叙述本发明提供的基于拟合函数的文字识别方法,首先给出关于本方法如下的基本定义:
定义一线段(LS,Line Segment)与线段集(LSS,Line Segment Set):
一段连续的,由若干个点构成,可以被拟合的点序列称为线段(可以为曲线段或直线段),由线段组成的序列称为线段集。
定义:LS=((X1,Y1),(X2,Y2),...,(XNpi,YNpi),...,(XNp,YNp)),Np为点的数量。
      LSS=(LS1,LS2,..LSNli,...,LSNl),Nl为线段的数量。
其中:Npi、Nli、Np、Nl∈Z+,XNpi、YNpi∈Z,LS∈LSS,|XNpi-XNpi-1|≤1,|YNpi-YNpi-1|≤1。
定义二特征点(LC,Line Character points)与特征点集(LCS,Line Character pointsSet):
对于一条由Np个点构成的线段LS,选取其中Ncp个点进行拟合,每个被选取的点称为线段LS的特征点,由这Ncp个特征点组成的序列称为特征点集。
定义:LC∈LS。
LCS={LC1,LC2,...,LCNcpi,...,LCNcp},Ncp为特征点的数量。
其中:LCNcpi∈LS,0≤Ncpi≤Ncp≤Np。
定义三最佳拟合函数(BFF,Best-Fitting Function):
利用一条线段LS的一个特征点集LCS对线段进行拟合得到的p阶多项式Y(X)或X(Y)称为这条线段的拟合函数,其中最优的拟合函数称为最佳拟合函数。
定义:BFF(X)=Ap*Xp+Ap-1*Xp-1+...Aj*Xj+...+A0*X0,Flag标志位0。
      BFF(Y)=Ap*Yn+Ap-1*Yp-1+...Aj*Xj+...+A0*Y0,Flag标志位1.
其中:Aj∈R,j、p∈Z+
定义四最佳拟合向量(BFV,Best-Fitting Vector):
最佳拟合函数的系数Aj和Y(X)型或X(Y)型的标志位Flag组成的向量称为最佳拟合向量。
定义:BFV=(Flag,Ap,Ap-1,...,Aj,...A0)。
其中:Aj∈R,j、p∈Z+
定义五笔画(SK,Strokes):
由一些具有类似属性的最佳拟合向量组成的集合称为笔画,是可识别符号集中的元素所能被分割的最小单位。
定义:SK={BFV1,BFV2,...,BFVNski,...,BFVNsk},Nsk是笔画的模板样本数。
其中:Nski,Nsk∈Z+
例如:汉字中所有的与X轴近似平行的拟合向量构成的集合定义为“横”这个笔画。
定义六笔画集(SKS,Strokes Set):
由可识别符号集中所有笔画所构成的集合,称为笔画集。
定义:SKS={SK1,SK2,...,SKNsksi,...,SKNsks},Nsks是笔画的数量。
其中:Nsksi,Nsks∈Z+
例如:汉字由“横”“竖”“撇”“捺”等一系列基本笔画的集合构成。
定义七符号向量(SV,Symbol Vector):
由n个笔画元素构成的可以表示一个待识别或可识别符号的向量称为符号向量。必要时可包含一个图像元素记录符号的图像信息以便更精确地识别。
定义:SV=(SK1,SK2,...,SkNsvi,...,SKNsv),Nsv是构成这个符号的笔画数。
其中:Nsvi,Nsv∈Z+
例如:汉字“十”,由一个汉字笔画集中的“横”笔画和一个“竖”笔画组成,因而“十”这个符号由(横,竖)这个向量构成。
定义八符号集(SVS,Symbol Vector Set):
由所有可识别符号向量构成的集合称为符号集。
定义:SVS={SV1,SV2,...,SVNsvsi,...,SVNsvs},Nsvs是可识别符号向量的数量。
其中:Nsvsi,Nsvs∈Z+
定义九知识库(KB,Knowledge Base):
由笔画集模板和符号集模板所组成的模板库称为知识库。
定义:KB=<SKS,SVS>。
定义十相似度(Smlt,Similarity):
待识别样本与知识库中符号集模板的相似程度称为相似度。
本发明提供的基于拟合函数的文字识别方法具体的实现步骤是:在联机或者在离线的情况下输入待识别文字样本,然后对输入的文字图像样本进行二值化、线条消抖、断点连接、规范化等相关的预处理工作;接着进行线段的拆分、选取特征点,利用一条线段LS的一个特征点集LCS对线段进行拟合,得到最佳的拟合函数和最佳拟合向量,进而从图形中拆分出笔画的图案,将拆分出的笔画图案进行分析归类到笔画集中最匹配的笔画,并以此生成可识别的符号序列;而后在知识库中找出与之最匹配的若干个模板,并提取这若干个模板的图案和待识别的样本进行匹配,最后分别计算待识别样本与知识库中这几个模板的相似程度,把其中相似度最高的文字作为待识别文字的最终识别结果。
具体过程如下:
如图1所示。一种基于拟合函数的文字识别方法,其特征在于包括如下步骤:
(1)在联机或者在离线的情况下读入待识别的文字样本;
(2)文字图像预处理:首先将步骤(1)所述的待识别的文字样本图像二值化,然后线条消抖,再进行断点连接,最后把文字图像规范化;
(3)分析样本:先从步骤(2)所述的规范化后的待识别的文字样本图像中拆分出文字笔画,然后将拆分出的每个笔画归类到笔画集中,并以此生成可识别的符号序列;对笔画集中的每条线段寻找特征点,根据特征点集拟合多项式找出最佳拟合函数,选取最佳拟合函数的系数作为最佳拟合向量;用最佳拟合向量匹配笔画写入符号向量;
(4)识别样本:首先根据步骤(3)所述的符号序列在知识库中寻找与之匹配的多个模板;然后提取这多个模板图案的符号向量并与步骤(3)所述的待识别的文字样本图像的符号向量进行匹配;
(5)输出结果:将与步骤(3)所述的待识别的文字样本图像的符号向量相似度最高的那个模板文字图案作为识别结果。
所述的一种基于拟合函数的文字识别方法,其特征在于步骤(5)输出结果后,将步骤(3)所述的待识别的文字样本图像存为模板。
所述的一种基于拟合函数的文字识别方法,其特征在于步骤(2)所述的二值化方法如下:
首先取T1=70作为第一次选用的阈值,对步骤(1)所述的待识别的文字样本图像进行整体阈值二值化,区分待识别的文字样本图像的背景和图像;再分别求出对应阈值T1的待识别的文字样本图像的图像和背景的灰度平均值Fa和Ba,定出二次选用的阈值为:
T 2 = 1 2 ( F a + B a )
最后再用二次选用的阈值T2对原图进行整体阈值二值化。
所述的一种基于拟合函数的文字识别方法,其特征在于步骤(2)所述的线条消抖方法如下:
在二值化后的待识别的文字样本图像中的文字笔迹中随机抽取占总数据点50%的点,用直线连接最近的点并且距离不超过3个像素点的相邻点。
所述的一种基于拟合函数的文字识别方法,其特征在于步骤(2)所述的文字断点连接方法如下:
在线条消抖后的待识别的文字样本图像中的文字笔迹中随机抽取占总数据点60%的点,用直线连接最近的点并且距离不超过3个像素点的相邻点。
如图2所示。所述的一种基于拟合函数的文字识别方法,其特征在于步骤(3)所述的拆分文字笔画的方法如下:
联机情况:
①初始化两个覆盖表CovX和CovY,分别用于记录X轴和Y轴的被覆盖情况,并将所有项置为False,表示两个覆盖表CovX和CovY都未被覆盖;初始化一个数组LS,用来存储拆分出来的线段,Nlj=0;
②建立两个空队列QueueX和QueueY,分别用于压入按Y(X)方式记录和按X(Y)方式记录的点序列;
③每当获取一个点(Xi,Yi)时,分别判断在两个覆盖表CovX和CovY的Xi位置和Yi位置是否为False:若CovX的Xi位置为False,则将(Xi,Yi)压入队列QueueX并在覆盖表CovX的Xi位置写入True;若覆盖表CovY的Yi位置为False则将(Xi,Yi)压入队列QueueY并在覆盖表CovY的Yi位置写入True;直到遇到两个覆盖表CovX和CovY表中的一个Cov表突即对应位置为True的Xi或Yi位置已经为True,则进入步骤④;当点全部处理完,则进入步骤⑤;
④如果有一个Cov表冲突,则将对应的队列Queue中的元素全部出队列清空并且将Cov表复位;另一个Cov表继续进行步骤③中的操作,直到也出现冲突,则将对应队列Queue全部出队列到线段LS[Nlj],Nlj=Nlj+1,清空Cov表;
⑤如果是一条文字笔画线画完,则进入步骤①拆分下一条文字笔画;如果没有点可以获取了,则结束;
离线情况:
A.按照从左向右,从上到下的扫描方法,只要扫描到一个点,就用这个点用种子填充法的方法扩散,把能连通的线段全部连通,然后用联机识别的方法生成LS,转步骤(B);
B.每取走一条线段,判断这条线段是否与其他线段交叉,如果不交叉则从图中删掉这条线段,如有交叉则补上交叉点,转步骤(A),直到图中没有点了为止。
其中点(Xi,Yi)表示构成一条文字笔画的第i点,i∈Z+,0≤i≤Np,Np为一条文字笔画的点数。
所述的一种基于拟合函数的文字识别方法,其特征在于步骤(3)所述的特征点选取方法如下:
线段的起点(X1,Y1)和终点(XNp,YNp)应当被选取,其余的点应当以一定规则从线段的各个部分取,本发明每隔5个点取一个特征点,保证特征点能较好的描述原线段的轮廓。
所述的一种基于拟合函数的文字识别方法,其特征在于步骤(3)所述的确定最佳拟合向量的方法如下:
确定最佳拟合函数中阶数p和系数Aj,j=1,2...p,然后选取最佳拟合函数的系数最为最佳拟合向量;
最佳拟合函数中阶数p通过以下方式获得:p从1开始拟合,求出拟合相似度R2,每当p+1可以使拟合相似度R2增加一个阈值α=5%,则取p+1为当前的p,再次进行判断,直到p+1阶拟合不能使拟合相似度R2增加α为止;
最佳拟合函数中各系数Aj通过以下方式获得:对于系数Aj,如果Aj的绝对值小于一个阈值β=1E-3,那么测试去掉Aj*Xj项后,拟合相似度R2会不会减小一个阈值γ=5%,如果不会减小γ那么多,就去掉Aj*Xj项即把Aj赋值为0。
所述的一种基于拟合函数的文字识别方法,其特征在于步骤(4)所述的寻找相似度最高的模板作为识别结果的方法如下:
(a)根据图形拆分出的各个最佳拟合向量,在知识库的笔画集里查找最匹配的笔画,生成符号向量;
(b)利用符号向量在知识库的符号集里查找最匹配的符号,如果笔画是有序的那么在查找过程中笔画和顺序都要匹配;如果笔画无序那么按照笔画的数量和类型进行查找,不考虑顺序能否匹配;
(c)如果在笔画有序和无序的情况下既不能找到笔画数相同的也不能找到所用笔画完全相同的,则用最接近匹配原则,找最接近的符号:对于笔画有序的字符向量,则取各个位按顺序能匹配到正确笔画数量最多的字符;如果笔画无序的,则取所有笔画中能匹配到所用笔画最多的字符,然后根据需要,可以取出字符向量的图像,用图像进行对比确认结果。
本发明算法的执行过程为:
S1.KB=CreatKB()或LoadKB(KB);//建立知识库或载入知识库
S2.SV.Pic=ReadSV();//读入样本
S3.AnalysisSV(SV)    //分析样本
Begin
LSS=GetLSS(SV.Pic);//将图像拆分成笔画集
For k:=1 To LSS.size()Do
Begin      //生成特征点集合
   LCS=GetLCS(LSS[k]);//生成最佳拟合向量写入符号向量
   SV.SKV[k].BFV.add(GetBFV(LCS));//用最佳拟合向量匹配笔画
   SV.SKV[k]=MatchingSK(SV.SKV[k].BFV);
End
return SUCCESS;
End
S4.SVS=MatchingTP(SV);//匹配模板
S5.Begin  //按向量匹配得若干个符号向量
       SVS=MatchingSV(SV.SKV);
          //如果需要,比较样本的图像和每个可能的符号的图像进行匹配
       SVS=MatchingPIC(SV.Pic);
       If(用户需要更新知识库)
       Then
          StoreKB(SV);
       return SVS;
End
 Write(SVS[0]);//输出最匹配的结果

Claims (9)

1.一种基于拟合函数的文字识别方法,其特征在于包括如下步骤:
(1)在联机或者在离线的情况下读入待识别的文字样本;
(2)文字图像预处理:首先将步骤(1)所述的待识别的文字样本图像二值化,然后线条消抖,再进行断点连接,最后把文字图像规范化;
(3)分析样本:先从步骤(2)所述的规范化后的待识别的文字样本图像中拆分出文字笔画,然后将拆分出的每个笔画归类到笔画集中,并以此生成可识别的符号序列;对笔画集中的每条线段寻找特征点,根据特征点集拟合多项式找出最佳拟合函数,选取最佳拟合函数的系数作为最佳拟合向量;用最佳拟合向量匹配笔画写入符号向量;
(4)识别样本:首先根据步骤(3)所述的符号序列在知识库中寻找与之匹配的多个模板;然后提取这多个模板图案的符号向量并与步骤(3)所述的待识别的文字样本图像的符号向量进行匹配;
(5)输出结果:将与步骤(3)所述的待识别的文字样本图像的符号向量相似度最高的那个模板文字图案作为识别结果;
其中线段LS与线段集LSS:
一段连续的,由若干个点构成,可以被拟合的点序列称为线段,由线段组成的序列称为线段集;
LS=((X1,Y1),(X2,Y2),...,(XNpi,YNpi),...,(XNp,YNp)),Np为点的数量;
LSS=(LS1,LS2,..LSNli,...,LSNl),Nl为线段的数量;
其中:Npi、Nli、Np、Nl∈Z+即正整数,XNpi、YNpi∈Z即整数,LS∈LSS,|XNpi-XNpi-1|≤1,|YNpi-YNpi-1|≤1;
特征点LC与特征点集LCS:
对于一条由Np个点构成的线段LS,选取其中Ncp个点进行拟合,每个被选取的点称为线段LS的特征点,由这Ncp个特征点组成的序列称为特征点集;
LC∈LS;
LCS={LC1,LC2,...,LCNcpi,...,LCNcp},Ncp为特征点的数量;
其中:LCNcpi∈LS,0≤Ncpi≤Ncp≤Np;
最佳拟合函数BFF:
利用一条线段LS的一个特征点集LCS对线段进行拟合得到的p阶多项式Y(X)或X(Y)称为这条线段的拟合函数,其中最优的拟合函数称为最佳拟合函数;
BFF(X)=Ap*Xp+Ap-1*Xp-1+...Aj*Xj+...+A0*X0,Flag标志位0;
BFF(Y)=Ap*Yn+Ap-1*Yp-1+...Aj*Xj+...+A0*Y0,Flag标志位1;
其中:Aj∈R,j、p∈Z+
最佳拟合向量BFV:
最佳拟合函数的系数Aj和Y(X)型或X(Y)型的标志位Flag组成的向量称为最佳拟合向量;
BFV=(Flag,Ap,Ap-1,...,Aj,...A0);
其中:Aj∈R,j、p∈Z+
笔画SK:
由一些具有类似属性的最佳拟合向量组成的集合称为笔画,是可识别符号集中的元素所能被分割的最小单位;
SK={BFV1,BFV2,...,BFVNski,...,BFVNsk},Nsk是笔画的模板样本数;
其中:Nski,Nsk∈Z+; 
笔画集SKS:
由可识别符号集中所有笔画所构成的集合,称为笔画集;
SKS={SK1,SK2,...,SKNsksi,...,SKNsks},Nsks是笔画的数量;
其中:Nsksi,Nsks∈Z+
符号向量SV:
由n个笔画元素构成的可以表示一个待识别或可识别符号的向量称为符号向量;
SV=(SK1,SK2,...,SkNsvi,...,SKNsv),Nsv是构成这个符号的笔画数;
其中:Nsvi,Nsv∈Z+
符号集SVS:
由所有可识别符号向量构成的集合称为符号集;
SVS={SV1,SV2,...,SVNsvsi,...,SVNsvs},Nsvs是可识别符号向量的数量;
其中:Nsvsi,Nsvs∈Z+
知识库KB:
由笔画集模板和符号集模板所组成的模板库称为知识库;
KB=<SKS,SVS>;
相似度Smlt,Similarity:
待识别样本与知识库中符号集模板的相似程度称为相似度。
2.根据权利要求1所述的一种基于拟合函数的文字识别方法,其特征在于步骤(5)输出结果后,将步骤(3)所述的待识别的文字样本图像存为模板。
3.根据权利要求1所述的一种基于拟合函数的文字识别方法,其特征在于步骤(2)所述的二值化方法如下:
首先取T1=70作为第一次选用的阈值,对步骤(1)所述的待识别的文字样本图像进行整体阈值二值化,区分待识别的文字样本图像的背景和图像;再分别求出对应阈值T1的待识别的文字样本图像的图像和背景的灰度平均值Fa和Ba,定出二次选用的阈值为:
Figure FSB00000510955800021
最后再用二次选用的阈值T2对原图进行整体阈值二值化。
4.根据权利要求1所述的一种基于拟合函数的文字识别方法,其特征在于步骤(2)所述的线条消抖方法如下:
在二值化后的待识别的文字样本图像中的文字笔迹中随机抽取占总数据点50%的点,用直线连接最近的点并且距离不超过3个像素点的相邻点。
5.根据权利要求1所述的一种基于拟合函数的文字识别方法,其特征在于步骤(2)所述的断点连接方法如下:
在线条消抖后的待识别的文字样本图像中的文字笔迹中随机抽取占总数据点60%的点,用直线连接最近的点并且距离不超过3个像素点的相邻点。
6.根据权利要求1所述的一种基于拟合函数的文字识别方法,其特征在于步骤(3)所述的拆分文字笔画的方法如下:
联机情况:
①初始化两个覆盖表CovX和CovY,分别用于记录X轴和Y轴的被覆盖情况,并将所有项置为False,表示两个覆盖表CovX和CovY都未被覆盖;初始化一个数组LS[Nlj],用来存储拆分出来的线段,Nlj=0;
②建立两个空队列QueueX和QueueY,分别用于压入按Y(X)方式记录和按X(Y)方式记录的点序列;
③每当获取一个点(Xi,Yi)时,分别判断在两个覆盖表CovX和CovY的Xi位置和 Yi位置是否为False:若CovX的Xi位置为False,则将(Xi,Yi)压入队列QueueX并在覆盖表CovX的Xi位置写入True;若覆盖表CovY的Yi位置为False则将(Xi,Yi)压入队列QueueY并在覆盖表CovY的Yi位置写入True;直到遇到两个覆盖表CovX和CovY表中的一个Cov表突即对应位置为True的Xi或Yi位置已经为True,则进入步骤④;当点全部处理完,则进入步骤⑤;
④如果有一个Cov表冲突,则将对应的队列Queue中的元素全部出队列清空并且将Cov表复位;另一个Cov表继续进行步骤③中的操作,直到也出现冲突,则将对应队列Queue全部出队列到线段LS[Nlj],Nlj←Nlj+1,清空Cov表,其中←表示赋值;
⑤如果是一条文字笔画线画完,则进入步骤①拆分下一条文字笔画;如果没有点可以获取了,则结束;
离线情况:
A.按照从左向右,从上到下的扫描方法,只要扫描到一个点,就用这个点用种子填充法的方法扩散,把能连通的线段全部连通,然后用联机识别的方法生成LS,转步骤B;
B.每取走一条线段,判断这条线段是否与其他线段交叉,如果不交叉则从图中删掉这条线段,如有交叉则补上交叉点,转步骤A,直到图中没有点了为止;
其中点(Xi,Yi)表示构成一条文字笔画的第i点,i∈Z+即正整数,0≤i≤Np,Np为一条文字笔画的点数。
7.根据权利要求1所述的一种基于拟合函数的文字识别方法,其特征在于步骤(3)所述的寻找特征点方法如下:
线段的起点(X1,Y1)和终点(XNp,YNp)应当被选取,其余的点应当以一定规则从线段的各个部分取,本发明每隔5个点取一个特征点,保证特征点能较好的描述原线段的轮廓。
8.根据权利要求1所述的一种基于拟合函数的文字识别方法,其特征在于步骤(3)所述最佳拟合向量的确定方法如下:
确定最佳拟合函数中阶数p和系数Aj,j=1,2...p,然后选取最佳拟合函数的系数为最佳拟合向量;
最佳拟合函数中阶数p通过以下方式获得:p从1开始拟合,求出拟合相似度R2,每当p+1可以使拟合相似度R2增加一个阈值α=5%,则取p+1为当前的p,再次进行判断,直到p+1阶拟合不能使拟合相似度R2增加α为止;
最佳拟合函数中各系数Aj通过以下方式获得:对于系数Aj,如果Aj的绝对值小于一个阈值β=1E-3,那么测试去掉Aj*Xj项后,拟合相似度R2会不会减小一个阈值γ=5%,如果不会减小γ那么多,就去掉Aj*Xj项即把Aj赋值为0。
9.根据权利要求1所述的一种基于拟合函数的文字识别方法,其特征在于步骤(5)所述的寻找符号向量相似度最高的模板作为识别结果的方法如下:
(a)根据图形拆分出的各个最佳拟合向量,在知识库的笔画集里查找最匹配的笔画,生成符号向量;
(b)利用符号向量在知识库的符号集里查找最匹配的符号,如果笔画是有序的那么在查找过程中笔画和顺序都要匹配;如果笔画无序那么按照笔画的数量和类型进行查找,不考虑顺序能否匹配;
(c)如果在笔画有序和无序的情况下既不能找到笔画数相同的也不能找到所用笔画完全相同的,则用最接近匹配原则,找最接近的符号:对于笔画有序的字符向量,则取各个位按顺序能匹配到正确笔画数量最多的字符;如果笔画无序的,则取所有笔画中能匹配到所用笔画最多的字符,然后根据需要,可以取出字符向量的图像,用图像进行对比确认结果。 
CN2010100179333A 2010-01-15 2010-01-15 一种基于拟合函数的文字识别方法 Active CN101763516B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010100179333A CN101763516B (zh) 2010-01-15 2010-01-15 一种基于拟合函数的文字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010100179333A CN101763516B (zh) 2010-01-15 2010-01-15 一种基于拟合函数的文字识别方法

Publications (2)

Publication Number Publication Date
CN101763516A CN101763516A (zh) 2010-06-30
CN101763516B true CN101763516B (zh) 2012-02-29

Family

ID=42494672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010100179333A Active CN101763516B (zh) 2010-01-15 2010-01-15 一种基于拟合函数的文字识别方法

Country Status (1)

Country Link
CN (1) CN101763516B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102184395B (zh) * 2011-06-08 2012-12-19 天津大学 基于字符串核的草图识别方法
CN102737254B (zh) * 2012-06-15 2014-04-02 常州南京大学高新技术研究院 一种标志图像的识别方法
CN104008363B (zh) * 2013-02-26 2017-08-01 佳能株式会社 手写轨迹的检测、规范化和在线识别以及异常字根的收集
CN103106402B (zh) * 2013-03-07 2016-04-13 成都威路特软件科技有限公司 一种基于重建的车牌汉字识别方法
CN107093172B (zh) * 2016-02-18 2020-03-17 清华大学 文字检测方法及系统
CN108288064B (zh) * 2017-01-09 2022-06-07 北京京东尚科信息技术有限公司 用于生成图片的方法和装置
CN108052925B (zh) * 2017-12-28 2021-08-03 江西高创保安服务技术有限公司 一种小区人员档案智能管理方法
CN108345853B (zh) * 2018-02-08 2020-10-23 吉首大学 基于同构理论的字符识别方法、装置及终端设备
CN108668129A (zh) * 2018-03-14 2018-10-16 西安万像电子科技有限公司 一种编码方法及装置
CN108877768B (zh) * 2018-05-21 2020-12-11 广东省电信规划设计院有限公司 座机提示音识别方法、装置及计算机设备
CN109101973B (zh) * 2018-08-06 2019-12-10 掌阅科技股份有限公司 文字识别方法、电子设备、存储介质
CN109359529B (zh) * 2018-09-11 2021-11-30 北京语言大学 长笔段的处理方法和装置
CN109766978B (zh) 2019-01-17 2020-06-16 北京悦时网络科技发展有限公司 一种词码的生成方法、识别方法、装置、存储介质
CN113361368B (zh) * 2021-06-01 2024-03-19 福建福昕软件开发股份有限公司 基于桌面软件通过函数拟合识别pdf内多类线条的方法
CN114419740A (zh) * 2022-01-11 2022-04-29 平安普惠企业管理有限公司 基于人工智能的活体检测方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000082113A (ja) * 1998-07-01 2000-03-21 Ricoh Co Ltd 文字認識装置および辞書作成方法および記録媒体
CN1315024A (zh) * 1998-08-26 2001-09-26 德库玛股份公司 字符识别

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000082113A (ja) * 1998-07-01 2000-03-21 Ricoh Co Ltd 文字認識装置および辞書作成方法および記録媒体
CN1315024A (zh) * 1998-08-26 2001-09-26 德库玛股份公司 字符识别

Also Published As

Publication number Publication date
CN101763516A (zh) 2010-06-30

Similar Documents

Publication Publication Date Title
CN101763516B (zh) 一种基于拟合函数的文字识别方法
Gilani et al. Table detection using deep learning
CN107622230B (zh) 一种基于区域识别与分割的pdf表格数据解析方法
US20200065601A1 (en) Method and system for transforming handwritten text to digital ink
US8175389B2 (en) Recognizing handwritten words
TW389865B (en) System and method for automated interpretation of input expressions using novel a posteriori probability measures and optimally trained information processing network
Agnihotri Offline handwritten Devanagari script recognition
JP2005242579A (ja) 文書処理装置、文書処理方法、および文書処理プログラム
CN105260751B (zh) 一种文字识别方法及其系统
JP2001325564A (ja) 部首モデルに基づく草書体漢字の手書き注釈の検索
Azeem et al. Online arabic handwritten digits recognition
CN105117741A (zh) 一种书法字风格的识别方法
CN109857912A (zh) 一种字形识别方法、电子设备及存储介质
Sahare et al. Robust character segmentation and recognition schemes for multilingual Indian document images
Obaidullah et al. Structural feature based approach for script identification from printed Indian document
Bogacz et al. Cuneiform character similarity using graph representations
Al-Maadeed et al. Automatic handedness detection from off-line handwriting
Lamghari et al. Template matching for recognition of handwritten Arabic characters using structural characteristics and Freeman code
Inunganbi et al. Recognition of handwritten Meitei Mayek script based on texture feature
US20140164370A1 (en) Method for retrieval of arabic historical manuscripts
Salamah et al. Towards the machine reading of arabic calligraphy: a letters dataset and corresponding corpus of text
CN112329389A (zh) 一种基于语义分割与禁忌搜索的汉字笔画自动提取方法
Tang et al. Online chemical symbol recognition for handwritten chemical expression recognition
CN106529475A (zh) 一种基于优化手势库分布的dnn群手势识别方法
CN117765520A (zh) 一种高效准确的歧义场景文字检测方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160414

Address after: 210042 Xu Zhuang Software Park, 699-27 Xuanwu Avenue, Xuanwu District, Jiangsu, Nanjing Province, Room 204, South Building, F, three District, China

Patentee after: JIANGSU MID-CENT HAIFU NETWORK TECHNOLOGY CO.,LTD.

Address before: Yudaojie Baixia District of Nanjing City, Jiangsu Province, No. 29 210016

Patentee before: Nanjing University of Aeronautics and Astronautics

TR01 Transfer of patent right

Effective date of registration: 20231123

Address after: Room 751, Yingying Building, 99 Tuanjie Road, Yanchuangyuan, Jiangbei New District, Nanjing, Jiangsu Province, 211899

Patentee after: Nanjing Ruishengda Technology Co.,Ltd.

Address before: Room 204, South Building F, R&D Zone 3, Xuzhuang Software Park, No. 699-27 Xuanwu Avenue, Xuanwu District, Nanjing City, Jiangsu Province, 210042

Patentee before: JIANGSU MID-CENT HAIFU NETWORK TECHNOLOGY CO.,LTD.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240328

Address after: Room 158, No. 2 Huayuan Road, Xuanwu District, Nanjing City, Jiangsu Province, 210042

Patentee after: Shanxing (Nanjing) Network Engineering Co.,Ltd.

Country or region after: China

Address before: Room 751, Yingying Building, 99 Tuanjie Road, Yanchuangyuan, Jiangbei New District, Nanjing, Jiangsu Province, 211899

Patentee before: Nanjing Ruishengda Technology Co.,Ltd.

Country or region before: China

TR01 Transfer of patent right