CN1149509C - 图像处理设备和方法 - Google Patents
图像处理设备和方法 Download PDFInfo
- Publication number
- CN1149509C CN1149509C CNB991083679A CN99108367A CN1149509C CN 1149509 C CN1149509 C CN 1149509C CN B991083679 A CNB991083679 A CN B991083679A CN 99108367 A CN99108367 A CN 99108367A CN 1149509 C CN1149509 C CN 1149509C
- Authority
- CN
- China
- Prior art keywords
- character recognition
- resolution
- image
- images
- predetermined area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
- G06V30/2504—Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
一个输入图像被转换为预定格式的图像。一个最佳字符识别分辨率确定元件使用该转换图像确定在执行该输入图像的字符识别时所使用的最佳分辨率。一个字符识别电路在该确定结果的基础上执行字符识别。一个输出装置输出该识别结果。
Description
技术领域
本发明涉及一种图像处理设备和方法,以及一种计算机可读存储器。
背景技术
具有字符识别功能的传统图像处理设备基本上可识别给定分辨率的一幅二进制图像。另一方面,字符识别精度与输入图像的分辨率密切相关。
然而,因为传统的图像处理设备只能识别给定分辨率的图像,从识别精度的角度来说,字符识别并不总是在最理想的状况下完成。
发明内容
考虑到上述问题,本发明的目的在于提供一种能够改进字符识别精度的图像处理设备和方法,以及一种计算机可读存储器。
根据本发明的一个方面,提供了一种图象处理设备,包括:
输入装置,用于输入包括多个图象的一个图象文档,所述多个图象中的每一个图象都是从相同的文件生成的并具有与其他图象不同的分辨率;以及
确定装置,用于从包括在所述图象文档中的所述多个图象的分辨率,确定一个优选的分辨率,该优选的分辨率对于执行所述输入图象文档的字符识别来说比其他的分辨率好,
其中所述确定装置执行包括在所述输入图象文档中的所述多个图象的一个预定区域的字符识别,并根据包括在所述输入图象文档中的所述多个图象的所述预定区域的字符识别结果的评估值而确定所述优选的分辨率。
根据本发明的一个方面,提供了一种图象处理方法,包括:
输入步骤,该输入步骤输入包括多个图象的一个图象文档,所述多个图象中的每一个图象都是从相同的文件生成的并具有与其他图象不同的分辨率;以及
确定步骤,该确定步骤从包括在所述图象文档中的所述多个图象的分辨率,确定一个优选的分辨率,该优选的分辨率对于执行所述输入图象文档的字符识别来说比其他的分辨率好,
其中所述确定步骤执行包括在所述输入图象文档中的所述多个图象的一个预定区域的字符识别,并根据包括在所述输入图象文档中的所述多个图象的所述预定区域的字符识别结果的评估值而确定所述优选的分辨率。
附图说明
本发明的其他特点和优点,从以下结合附图的描述,会更加显而易见。其中,同样的参考字符在全部图中代表相同或类似的部件。
图1是一个方框图,显示根据本发明的第一个实施例的一个图像处理设备的功能配置;
图2是一个流程图,显示在本发明的第一个实施例中,由一个最佳字符识别分辨率确定电路执行的处理细节;
图3是一个流程图,显示在本发明的第一个实施例中,由一个字符识别电路执行的处理细节;
图4显示一个结构化图像文件的例子;
图5显示一个结构化图像文件的例子;
图6显示包含一组具有不同分辨率的图像的一个图像文件的例子;
图7显示一个图像分割成拼板状的例子;
图8是一个表格,显示一个图像内容属性集的例子;
图9是一个表格,显示一个子图像头部的例子;
图10是一个方框图,显示根据本发明的图像处理设备的硬件配置;和
图11是一个图表,显示平均相关值的迟滞性。
具体实施方式
以下结合附图对本发明的优选实施例给以详细描述。
(第一个实施例)
图1是一个方框图,显示根据本发明的图像处理设备的功能配置。
参看图1,数字2表示一个扫描仪,用于输入一个原始图像。注意:该原始图像不必总是由扫描仪2输入。例如,由数字相机摄取的图像,存储在存储设备中的图像,均可输入。数字4表示一个FlashPix光栅器(rasterizer),用于将扫描仪2输入的图像转换成FlashPix图像,作为图像的一种文件格式。数字6表示一个图像存储器,用于存储由FlashPix光栅器4转换的FlashPix图像。
数字8表示一个最佳字符识别分辨率确定电路,用于确定在存储于图像存储器6中图像的基础上,对字符识别最佳的分辨率。数字10表示一个字符识别电路,用于在该最佳字符识别分辨率确定电路10的确定结果的基础上,对存储在图像存储器6中的图像进行最后的字符识别。数字12表示一个输出电路,用于输出该字符识别电路10的识别结果到一个存储设备,如:打印机、显示器、网络等等。
以下简述FlashPix文件格式的图像文件中(FlashPix是Eastman柯达公司的商品名称),存储在图像头部域中的图像属性信息和图像数据被进一步结构化,并存储成一个图像文件。图4和图5显示了该结构化图像文件。
对图像文件中的属性和图像数据使用“存储仓”和“信息流”来管理,对应于使用MS-DOS时的目录和文件。参看图4和图5,带阴影的方块是“存储仓”,不带阴影的方块是“信息流”。图像数据和图像属性信息存储在信息流中。图像数据按不同的分辨率分等级存储,具有相应分辨率的图像称为子图像,由其分辨率0,1,…,n-1和n表示。对每一分辨率的一个图像而言,读取该图像所必需的信息存储在一个子图像头部,图像数据本身存储在子图像数据中。
属性集按其使用目的和内容分类并定义各种属性信息,包括概要信息属性集,图像信息属性集,图像内容属性集,和扩展列表属性集。
(属性集的解释)
概要信息属性集对于FlashPix而言,并不是唯一的。例如,这个属性集对于微软公司的“结构化存储”是必须的,存储诸如标题、内容、作者、缩微图等该图像文件的信息。
图像内容属性集是描述图像数据存储方法的一个属性。这个属性描述图像数据的层数、宽度、高度、最大分辨率图像的颜色深度,具有相应分辨率的图像的信息,或者使用JPEG时,一个量化表或Huffman表的定义。图8显示该图像内容属性集的一个例子。
图像信息属性集存储了可在使用该图像时应用的有关信息,如表示图像抓取方法的信息,图像使用方法的信息等等。这类信息的一个例子如下:
有关该数字数据抓取/生成方法的信息(文件源)
有关版权的信息(知识产权)
有关图像内容(人物、地点等图像中的类似内容)的信息(内容描述)
有关图像摄取中使用的相机信息(照相机信息)
有关图像摄取时设定的(曝光值、快门速度、焦距、有无使用电子闪光灯等等)相机信息(每张照片相机设定值)
有关对于数字相机和马赛克过滤器而言唯一的分辨率信息(数字相机特征)
有关胶卷的生产商名称、产品名称、类型(正片/负片,彩色/黑白)等信息(胶卷信息)
有关当原始图像是一个文档或打印出的文件时类型和尺寸的信息(原始文档扫描信息)
有关所使用的扫描仪和软件,以及使用扫描仪扫描图像时操作者的信息(扫描设备)
扩展列表属性集是当不包括在FlashPix的基本规格中的信息要加入时所使用的一个域。
图5中显示的FlashPix图像浏览对象是一个图像文件,它存储了在显示图像和图像数据时所使用的一组浏览参考参数。浏览参数是当在图像显示中应用图像旋转,放大/缩小,移动,颜色转换,过滤等操作时所存储的一组处理系数。
来源/结果FlashPix图像对象是FlashPix图像的集合。来源FlashPix图像对象是必须的,而结果FlashPix图像对象是可选的。来源FlashPix图像对象存储原始图像,而结果FlashPix图像对象存储使用该浏览参数处理过的图像。来源/结果描述属性集是用于区别图像数据的属性集,并存储诸如图像ID,变化抑制属性集,最后修改日期等信息。
变形属性集存储诸如旋转、放大/缩小,移动,颜色转换矩阵,对比度调节值,过滤系数等仿射变形系数信息。
以下描述图像数据的处理。
图6显示了包括一组具有不同分辨率图像的图像文件的例子。参看图6,一个具有最大分辨率的图像,其尺寸为C×R(列×行),另一个最大图像的尺寸为C/2×R/2。类似地,重复缩小列和行的尺寸到1/2,直到列和行的尺寸相等或者小于64像素。
作为这种分级的结果,“每个图像文件的层数”,以及前述头部信息和每层图像的图像数据都要求作为一个图像的属性信息。上述图像内容属性集描述有关每个图像文件的层数,具有最大分辨率的图像的宽度和高度,或者具有相应分辨率的图像的宽度、高度、颜色深度,压缩格式等等的信息。如图8所示。
此外,每一分辨率的一个图像被分割成64×64拼板,如图7所示。当一个图像从其左上部分开始被依次分割成64×64拼板时,有些图像会在其右部和下端出现空白拼板。在这种情况下,通过重复插入最右端或最下端图像来构成64×64像素。在FlashPix中,每一拼板中的图像通过JPEG压缩、单一颜色压缩和非压缩中的一种而存储,注意:JPEG压缩是由ISO/IEC JTC1/SC29图标标准化了的方案,此处省略对该方案本身的描述。同样,单一颜色压缩也是一种方案,它是当该拼板由相同颜色构成时,用一种颜色表示给定拼板的颜色,而不记录个别的像素值。这个方案尤其适用于由计算机图形程序生成的图像。
这些分割的图像数据存储在一个子图像数据流中。全部的拼板数,个别拼板的大小,数据开始位置以及压缩方案都存储在子图像头部。图9显示这个子图像头部的一个例子。
以下描述图1所示的配置所进行的操作。
由扫描仪2输入的图像被FlashPix光栅器4转换成FlashPix图像,该FlashPix图像存储在图像存储器6中。最佳字符识别分辨率确定电路8从该图像存储器6读取相应分辨率的图像的预定部分,并执行该读取部分的字符识别。然后,电路8在相应字符识别结果的基础上确定最佳字符识别分辨率。
该字符识别电路10从该图像存储器6读取由该最佳字符识别分辨率确定电路8确定的具有最佳分辨率的一个图像,并执行整个读取图像的字符识别。以后将详细描述该最佳字符识别分辨率确定电路8和字符识别电路10的操作。输出电路12将字符识别电路10的字符识别结果转换成输出格式(文件,打印机,显示器,网络等等),并输出转换的结果。
图10显示根据本发明的图像处理设备的硬件配置。
以下结合附图1对附图10中的相应构件加以描述。数字101表示CPn(中央处理器),它根据存储在存储器(MEM)102和外部存储媒介103中的程序代码执行各种处理。以后将要描述的流程图所示的处理是在CPU 101的控制下执行的。FlashPix光栅器4,最佳字符识别分辨率确定电路8和字符识别电路10都由CPU 101实施。
数字102表示包括ROM和RAM在内的存储器。存储器102存储从图像输入装置104输入的图像,或是从另一个终端经由通信I/F 108相连的通讯网络输入的图像,转换成FlashPix等文件格式的图像数据,字符识别电路10在字符识别中使用的字符词典数据,一个识别结果的候选字符组,在以后将要描述的处理中使用的各种参数,等等。存储器102有一个工作存储区,用于存储正在进行处理的数据。图像存储器6由这个存储器102实施。
数字103表示外部存储媒介,如CD-ROM,CD-R,FD等等,可从本实施例的设备分离。图像,控制程序的程序代码,处理结果的图像文件,文本等等可在或向这些外部存储媒介存储或读取。数字104表示一个图像输入装置,如扫描仪,数字相机等可以光学方式扫描原始图像的装置。扫描仪2与图像输入装置104相对应。数字105表示一个显示器,如CRT,液晶显示器等在处理期间显示图像,文本,消息的装置。同样,显示器105也显示在键盘107和操作窗口输入的数据。
数字106表示一个打印机,如LBP(激光打印机),喷墨打印机等用于记录图像,文本等内容的装置。数字107表示可以输入各种命令,字符代码等由操作员操作时输入的键盘。除键盘107以外,也可配备像鼠标,触摸板这样的坐标输入装置以输入坐标数据。数字108表示一个通讯I/F以经由一个通讯网络(公众网或LAN)与另一个终端交换数据,命令等。数字109表示一条总线,它允许各种构件彼此交换数据,命令等。
以下结合附图2和3详细描述由最佳字符识别分辨率确定电路8和字符识别电路10执行的处理。
图2是一张流程图,显示根据本发明的第一个实施例由最佳字符识别分辨率确定电路执行的处理细节。
在步骤S202中,存储器102存储将要在步骤S204中读取的FlashPix图像的读取分辨率,在该存储器102中的读取分辨率参数被设定成待处理的FlashPix图像的最大分辨率。在步骤S204中,读取具有某个分辨率的图像的预定区域,该分辨率由存储在图像存储器6中的FlashPix图像的读取分辨率参数表示。假定该预定区域在包含图像的文本块中是第一个块。在步骤S206中,读取图像被转换成二进制图像。在步骤S208中,该二进制图像经受一系列包括字符抽取和相关计算在内的,由字符识别电路10执行的字符识别操作。在步骤S210,相应字符的相关值的平均相关值被计算为与在步骤S204中读取的图像有关的字符识别评估值。这个平均相关值可由步骤S208中作为字符识别结果得到的第一个候选字符的所有类似值的叠加,再将总数除以字符数而得到。计算过的平均相关值,与图像分辨率相对应存储在存储器102中。
在步骤S212中检查步骤S204到步骤S210中计算平均相关值的过程是否对于待处理的FlashPix图像的包括最小分辨率在内的所有分辨率的图像都得到处理。如果确定所有分辨率的图像的平均相关值还没有被计算(在步骤S212中是“否”),则流程前进到步骤S214。在步骤S214中,按当前读取分辨率参数设定的分辨率被降低一个等级,并在存储器102中设定。此后,流程返回步骤S204。另一方面,如果确定所有分辨率的图像的平均相关值已经被计算(在步骤S212中是“是”),则流程前进到步骤S216。在步骤S216中,搜索存储在存储器102中的所有分辨率的图像的平均相关值以找出最大值,产生最大值的图像分辨率在存储器102中被设定成一个最佳字符识别分辨率,由此结束处理。
如果由检索找到的最大值小于预存储在存储器102中的一个给定的临界值,即:如果相似性很低,将在步骤S204中读取的区域被转换到另一个区域(如第二个抽取文本块),步骤S202到步骤S216中的过程可以重复。同样,在步骤S216中得到的最佳字符识别分辨率数据也可存储在FlashPix图像中。
附图3是一张流程图,显示根据本发明的第一个实施例由该字符识别电路执行的处理细节。
在步骤S302中,由该最佳字符识别分辨率确定电路8读取存储在存储器102中的最佳字符识别分辨率。在步骤S304中,具有读取最佳字符识别分辨率的FlashPix图像从图像存储器6中被读取。在步骤S306中,字符识别电路10执行从图像存储器6读取的整个图像的字符识别。识别结果的文本可以存储成一个FlashPix图像文件格式,或者由显示器105,打印机106,或通信I/F108输出。
如上所述,根据第一个实施例,该最佳字符识别分辨率确定电路8可以提前确定对字符识别而言最佳的分辨率,使用确定的分辨率的一个FlashPix图像完成字符识别,由此极大提高字符识别精度。
(第二个实施例)
第一个实施例的最佳字符识别分辨率确定电路8抽取一个图像的给定区域,以确定一个最佳字符识别分辨率。然而,本发明并不限于这种特定的方法。例如,如果将被字符识别的图像数据是包含多页的多页图像,可以抽取第一页以确定一个最佳字符识别分辨率,并且可以使用该确定的最佳字符识别分辨率对所有页的图像进行字符识别。
在第一和第二个实施例中,使用了FlashPix图像。然而,本发明不限于这种特定的图像格式。例如,也可使用另一种格式数据,CIFF(佳能图像格式文件),它可存储或生成一组不同分辨率的图像。
在第三个实施例中,该读取分辨率设定为步骤S202中的最大级,降低步骤S214中的分辨率来确定一个最佳字符识别分辨率。然而,本发明并不限于这种特定方法。例如,读取分辨率可以设定为步骤S202中的最低级,可通过逐级提高步骤S214中分辨率级来检查所有的分辨率,由此确定一个最佳字符识别分辨率。
在第一个实施例中,检测从所有分辨率的图像得到的平均相关值的最大值,产生该最大值的分辨率被确定为一个最佳字符识别分辨率。然而,本发明并不限于这种特定的方法。例如,可以控制在相应分辨率得到的平均相关值的迟滞性,当步骤S210中得到的值为峰值时,产生该值的图像的分辨率可以确定为一个最佳字符识别分辨率,计算下一个分辨率的一个图像的相关值的平均值的过程可以停止。附图11显示了当依次从最低分辨率级的图像计算平均相关值时,该平均相关值的迟滞性。当得到一个值1104,确定值1103与一个峰值相对应,并停止计算。
根据第一和第二个实施例,字符识别精度级对于一个相同图像的一组分辨率而言是有区别的,根据该差别结果选择具有最佳分辨率的一个图像,以执行字符识别,由此极大提高字符识别精度。
注意:本发明既可以适用于由一组装置(如一个主机,一个界面装置,一个读取器,一个打印机等等)组成的系统,也可适用于由单一装置(如复印机,传真设备等等)构成的设备。
本发明的目的还通过提供一种存储媒介而达到,该媒介可记录能实现上述实施例中系统或设备功能的软件程序的程序代码,由该系统或设备的计算机(或一个CPU或MPU)读取并执行存储在该存储媒介中的程序代码。上述流程图描述的处理步骤,按照该程序代码,在CPU的控制下得以执行。
在这种情况下,从该存储媒介读取的程序代码本身实现上述实施例的功能,存储该程序代码的存储媒介包含在本发明内。
作为提供程序代码的存储媒介,可以使用软盘,硬盘,光盘,磁光盘,CD-ROM,CD-R,磁带,固定存储卡,ROM等等。
上述实施例的功能不仅可以通过由计算机执行所读取的程序代码来实现,也可通过在该程序代码的指令基础上,由计算机上运行的OS(操作系统)执行的一些或全部实际的处理操作来实现。
此外,上述实施例的功能可以通过由配置在功能扩展板或功能扩展元件(这种扩展板是插在计算机中或与计算机相连,在从存储媒介读取的程序代码被写入该扩展板或元件的存储器中以后)上的CPU等所执行的一些或全部实际的处理操作来实现。
很明显,本发明可以有很多不同的实施例,而不与其精神和范围相分离,应当理解本发明包括但不限于所属权利要求中所限定的特定实施例。
Claims (20)
1.一种图象处理设备,包括:
输入装置,用于输入包括多个图象的一个图象文档,所述多个图象中的每一个图象都是从相同的文件生成的并具有与其他图象不同的分辨率;以及
确定装置,用于从包括在所述图象文档中的所述多个图象的分辨率,确定一个优选的分辨率,该优选的分辨率对于执行所述输入图象文档的字符识别来说比其他的分辨率好,
其中所述确定装置执行包括在所述输入图象文档中的所述多个图象的一个预定区域的字符识别,并根据包括在所述输入图象文档中的所述多个图象的所述预定区域的字符识别结果的评估值而确定所述优选的分辨率。
2.根据权利要求1的设备,进一步包括:
识别装置,用于对包括在具有由所述确定装置所确定的优选的分辨率的所述输入图象文档中的所述多个图象之一进行字符识别;以及
输出装置,用于输出所述识别装置的识别结果。
3.根据权利要求1的设备,进一步包括:
控制装置,用于在图象文档中存储由所述确定装置所确定的优选分辨率的信息。
4.根据权利要求1的设备,其中所述确定装置根据作为所述评估值而计算出的平均相关度值而确定优选分辨率。
5.根据权利要求2的设备,其中所述确定装置
按照分辨率增大的顺序,执行包括在所述图象文档中的所述多个图象的一个预定区域的字符识别;
当用于按照分辨率增大的顺序的各字符识别的平均相关度值的滞后表示了一个峰时,阻止对包括在该图象文档中的多个图象的该预定区域的字符识别;以及
根据当所述滞后表示所述峰时的分辨率,确定由所述识别装置进行所述输入图象文档的字符识别时所要采用的优选分辨率。
6.根据权利要求2的设备,其中所述确定装置
按照分辨率减小的顺序,执行包括在所述图象文档中的所述多个图象的一个预定区域的字符识别;
当用于按照分辨率减小的顺序的各字符识别的平均相关度值的滞后表示了一个峰时,阻止对包括在该图象文档中的多个图象的该预定区域的字符识别;以及
根据当所述滞后表示所述峰时的分辨率,确定由所述识别装置进行所述输入图象文档的字符识别时所要采用的优选分辨率。
7.根据权利要求1的设备,其中所述预定区域是所述多个图象的每一个图象中的一个部分区域。
8.根据权利要求7的设备,其中所述预定区域是所述多个图象的每一个图象中的预定文本块。
9.根据权利要求1的设备,进一步包括:
转换装置,用于用于把从所述文件生成的一个图象转换成包括所述多个图象的所述输入图象文档。
10.根据权利要求7的设备,其中当所述部分区域的所述字符识别结果的评估值小于一个预定值时,所述确定装置根据与已经进行了字符识别的部分区域不同的一个部分区域的字符识别结果的评估值而确定优选分辨率。
11.一种图象处理方法,包括:
输入步骤,该输入步骤输入包括多个图象的一个图象文档,所述多个图象中的每一个图象都是从相同的文件生成的并具有与其他图象不同的分辨率;以及
确定步骤,该确定步骤从包括在所述图象文档中的所述多个图象的分辨率,确定一个优选的分辨率,该优选的分辨率对于执行所述输入图象文档的字符识别来说比其他的分辨率好,
其中所述确定步骤执行包括在所述输入图象文档中的所述多个图象的一个预定区域的字符识别,并根据包括在所述输入图象文档中的所述多个图象的所述预定区域的字符识别结果的评估值而确定所述优选的分辨率。
12.根据权利要求11的方法,进一步包括:
识别步骤,该识别步骤对包括在具有由所述确定步骤所确定的优选的分辨率的所述输入图象文档中的所述多个图象之一进行字符识别;以及
输出步骤,该输出步骤输出所述识别步骤的识别结果。
13.根据权利要求11的方法,进一步包括:
控制步骤,该控制步骤在图象文档中存储由所述确定步骤所确定的优选分辨率的信息。
14.根据权利要求11的方法, 其中所述确定步骤根据作为所述评估值而计算出的平均相关度值而确定优选分辨率。
15.根据权利要求12的方法,其中所述确定步骤包括:
按照分辨率增大的顺序,执行包括在所述图象文档中的所述多个图象的一个预定区域的字符识别;
当用于按照分辨率增大的顺序的各字符识别的平均相关度值的滞后表示了一个峰时,阻止对包括在该图象文档中的多个图象的该预定区域的字符识别;以及
根据当所述滞后表示所述峰时的分辨率,确定由所述识别步骤进行所述输入图象文档的字符识别时所要采用的优选分辨率。
16.根据权利要求12的方法,其中所述确定步骤包括
按照分辨率减小的顺序,执行包括在所述图象文档中的所述多个图象的一个预定区域的字符识别;
当用于按照分辨率减小的顺序的各字符识别的平均相关度值的滞后表示了一个峰时,阻止对包括在该图象文档中的多个图象的该预定区域的字符识别;以及
根据当所述滞后表示所述峰时的分辨率,确定由所述识别步骤进行所述输入图象文档的字符识别时所要采用的优选分辨率。
17.根据权利要求11的方法,其中所述预定区域是所述多个图象的每一个图象中的一个部分区域。
18.根据权利要求17的方法,其中所述预定区域是所述多个图象的每一个图象中的预定文本块。
19.根据权利要求11的方法,进一步包括:
转换步骤,该转换步骤把从所述文件生成的一个图象转换成包括所述多个图象的所述输入图象文档。
20.根据权利要求17的方法,其中当所述部分区域的所述字符识别结果的评估值小于一个预定值时,所述确定步骤根据与已经进行了字符识别的部分区域不同的一个部分区域的字符识别结果的评估值而确定优选分辨率。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16530298 | 1998-06-12 | ||
JP165302/1998 | 1998-06-12 | ||
JP131509/1999 | 1999-05-12 | ||
JP13150999A JP4338155B2 (ja) | 1998-06-12 | 1999-05-12 | 画像処理装置及びその方法、コンピュータ可読メモリ |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1241758A CN1241758A (zh) | 2000-01-19 |
CN1149509C true CN1149509C (zh) | 2004-05-12 |
Family
ID=26466328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB991083679A Expired - Fee Related CN1149509C (zh) | 1998-06-12 | 1999-06-11 | 图像处理设备和方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6668101B2 (zh) |
EP (1) | EP0964353B1 (zh) |
JP (1) | JP4338155B2 (zh) |
CN (1) | CN1149509C (zh) |
DE (1) | DE69942165D1 (zh) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6891972B2 (en) * | 1997-12-19 | 2005-05-10 | Canon Kabushiki Kaisha | Communication system and control method thereof, and computer-readable memory |
US20010019424A1 (en) * | 2000-03-06 | 2001-09-06 | Takenori Idehara | Image-forming devices portable telephones, image-processing devices, image-processing methods, and computer program product |
FR2827460B1 (fr) * | 2001-07-12 | 2004-10-29 | Poseidon | Procede et systeme pour fournir, selon un format standard, a des logiciels de traitement d'images des informations liees aux caracteristiques des appareils de capture d'image et/ou des moyens de resti |
DE60239061D1 (de) | 2001-07-12 | 2011-03-10 | Dxo Labs | Verfahren und system zur qualitätsverbesserung von bildern |
ES2282429T3 (es) * | 2001-07-12 | 2007-10-16 | Do Labs | Procedimiento y sistema para producir informaciones formateadas relacionadas con las distorsiones geometricas. |
FR2827459B1 (fr) * | 2001-07-12 | 2004-10-29 | Poseidon | Procede et systeme pour fournir a des logiciels de traitement d'image des informations formatees liees aux caracteristiques des appareils de capture d'image et/ou des moyens de restitution d'image |
US6922487B2 (en) * | 2001-11-02 | 2005-07-26 | Xerox Corporation | Method and apparatus for capturing text images |
US7343052B2 (en) * | 2002-04-09 | 2008-03-11 | Sonic Solutions | End-user-navigable set of zoomed-in images derived from a high-resolution master image |
US20040047519A1 (en) * | 2002-09-05 | 2004-03-11 | Axs Technologies | Dynamic image repurposing apparatus and method |
JP4064196B2 (ja) * | 2002-10-03 | 2008-03-19 | 株式会社リコー | クライアントコンピュータ、サーバコンピュータ、プログラム、記憶媒体、画像データ処理システム及び画像データ処理方法 |
FR2851357B1 (fr) * | 2003-02-19 | 2005-04-22 | Solystic | Procede pour la reconnaissance optique d'envois postaux utilisant plusieurs images |
US20040210444A1 (en) * | 2003-04-17 | 2004-10-21 | International Business Machines Corporation | System and method for translating languages using portable display device |
JP2005084948A (ja) * | 2003-09-09 | 2005-03-31 | Hitachi Ltd | 情報処理装置、情報処理方法及び情報処理システム |
FR2899359B1 (fr) * | 2006-03-28 | 2008-09-26 | Solystic Sas | Procede utilisant la multi-resolution des images pour la reconnaissance optique d'envois postaux |
US8031940B2 (en) * | 2006-06-29 | 2011-10-04 | Google Inc. | Recognizing text in images using ranging data |
US7953295B2 (en) * | 2006-06-29 | 2011-05-31 | Google Inc. | Enhancing text in images |
US8098934B2 (en) | 2006-06-29 | 2012-01-17 | Google Inc. | Using extracted image text |
JP4986279B2 (ja) * | 2006-09-08 | 2012-07-25 | 任天堂株式会社 | ゲームプログラムおよびゲーム装置 |
US8000554B2 (en) * | 2007-04-04 | 2011-08-16 | Xerox Corporation | Automatic dynamic range adjustment in digital imaging |
US8611661B2 (en) * | 2007-12-26 | 2013-12-17 | Intel Corporation | OCR multi-resolution method and apparatus |
US7933473B2 (en) * | 2008-06-24 | 2011-04-26 | Microsoft Corporation | Multiple resolution image storage |
US8064733B2 (en) * | 2008-06-24 | 2011-11-22 | Microsoft Corporation | Variable resolution images |
US7983512B2 (en) * | 2008-06-24 | 2011-07-19 | Microsoft Corporation | Embedding large images within one another |
JP5683367B2 (ja) | 2011-04-20 | 2015-03-11 | キヤノン株式会社 | 画像処理装置、画像処理装置の制御方法、およびプログラム |
CN103136559B (zh) * | 2011-11-30 | 2016-01-20 | 北大方正集团有限公司 | 可变条码的光栅化方法和装置 |
CN102567947A (zh) * | 2012-01-12 | 2012-07-11 | 惠州Tcl移动通信有限公司 | 一种移动终端中图像处理方法及移动终端 |
GB201203883D0 (en) * | 2012-03-05 | 2012-04-18 | King S College London | Method and system to assist 2D-3D image registration |
JP6049437B2 (ja) | 2012-12-14 | 2016-12-21 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP6001008B2 (ja) * | 2014-06-06 | 2016-10-05 | キヤノン株式会社 | 画像読取装置、画像読取装置の制御方法、プログラム、及び記憶媒体 |
JP6705984B2 (ja) * | 2015-03-31 | 2020-06-03 | キヤノンマーケティングジャパン株式会社 | 情報処理装置と、その処理方法及びプログラム |
WO2017079696A1 (en) * | 2015-11-06 | 2017-05-11 | California Institute Of Technology | Devices and methods for direct visual detection and readout of single nucleic acid molecules |
WO2017109998A1 (ja) | 2015-12-25 | 2017-06-29 | 株式会社Pfu | モバイル端末、画像処理方法、および、プログラム |
JP7326779B2 (ja) * | 2019-03-11 | 2023-08-16 | 富士フイルムビジネスイノベーション株式会社 | 画像形成装置及びプログラム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5943480A (ja) * | 1982-09-03 | 1984-03-10 | Ricoh Co Ltd | 文字認識方法 |
WO1990001198A1 (en) * | 1988-07-20 | 1990-02-08 | Fujitsu Limited | Character recognition apparatus |
US5361309A (en) * | 1989-09-07 | 1994-11-01 | Canon Kabushiki Kaisha | Character recognition apparatus and method with low-resolution storage for character extraction |
US5309548A (en) * | 1989-09-21 | 1994-05-03 | Canon Kabushiki Kaisha | Pattern generating method and apparatus |
CA2036974C (en) * | 1990-02-26 | 1996-06-11 | Masayuki Kimura | Pattern recognition data processing device using an associative matching method |
US5091968A (en) * | 1990-12-28 | 1992-02-25 | Ncr Corporation | Optical character recognition system and method |
US5317654A (en) * | 1991-09-26 | 1994-05-31 | Inscerco Mfg. Inc. | Selective collating and inserting apparatus |
TW222337B (zh) * | 1992-09-02 | 1994-04-11 | Motorola Inc | |
US5337372A (en) * | 1992-10-13 | 1994-08-09 | At&T Bell Laboratories | Method and apparatus for symbol recognition using multidimensional preprocessing at multiple resolutions |
JP2979109B2 (ja) * | 1992-12-03 | 1999-11-15 | 日本アイ・ビー・エム 株式会社 | 認識文字の情報作成方法及び装置 |
JPH06274680A (ja) * | 1993-03-17 | 1994-09-30 | Hitachi Ltd | 文書認識方法およびシステム |
JPH07152865A (ja) | 1993-11-30 | 1995-06-16 | Canon Inc | 情報認識装置及びその方法 |
EP0677811A1 (en) * | 1994-04-15 | 1995-10-18 | Canon Kabushiki Kaisha | Image processing system with on-the-fly JPEG compression |
US5970170A (en) * | 1995-06-07 | 1999-10-19 | Kodak Limited | Character recognition system indentification of scanned and real time handwritten characters |
TW347503B (en) * | 1995-11-15 | 1998-12-11 | Hitachi Ltd | Character recognition translation system and voice recognition translation system |
US5784487A (en) * | 1996-05-23 | 1998-07-21 | Xerox Corporation | System for document layout analysis |
JPH1132287A (ja) * | 1997-07-08 | 1999-02-02 | Fuji Photo Film Co Ltd | 画像ファイル作成方法および装置 |
US6041143A (en) * | 1998-04-14 | 2000-03-21 | Teralogic Incorporated | Multiresolution compressed image management system and method |
-
1999
- 1999-05-12 JP JP13150999A patent/JP4338155B2/ja not_active Expired - Fee Related
- 1999-06-08 DE DE69942165T patent/DE69942165D1/de not_active Expired - Fee Related
- 1999-06-08 EP EP99304479A patent/EP0964353B1/en not_active Expired - Lifetime
- 1999-06-10 US US09/329,202 patent/US6668101B2/en not_active Expired - Fee Related
- 1999-06-11 CN CNB991083679A patent/CN1149509C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP0964353B1 (en) | 2010-03-24 |
US20020122590A1 (en) | 2002-09-05 |
EP0964353A3 (en) | 2001-05-23 |
DE69942165D1 (de) | 2010-05-06 |
EP0964353A2 (en) | 1999-12-15 |
JP2000067155A (ja) | 2000-03-03 |
CN1241758A (zh) | 2000-01-19 |
US6668101B2 (en) | 2003-12-23 |
JP4338155B2 (ja) | 2009-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1149509C (zh) | 图像处理设备和方法 | |
US8339619B2 (en) | System and image processing method and apparatus for re-using and re-editing images | |
JP4251629B2 (ja) | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 | |
US7593961B2 (en) | Information processing apparatus for retrieving image data similar to an entered image | |
US10477063B2 (en) | Character detection and binarization | |
JP2000306103A (ja) | 情報処理装置及び方法 | |
US7596271B2 (en) | Image processing system and image processing method | |
JP2004246577A (ja) | 画像処理方法 | |
CN1711558A (zh) | 相似图像提取装置、相似图像提取方法以及相似图像提取程序 | |
US20010041014A1 (en) | Image processing device and method and memory medium | |
US20090290797A1 (en) | Image processing for storing objects separated from an image in a storage device | |
US8295602B2 (en) | Image processing apparatus and image processing method | |
JP4710672B2 (ja) | 文字色判別装置、文字色判別方法、およびコンピュータプログラム | |
JP4569162B2 (ja) | 画像処理方法、画像処理プログラムおよび画像処理装置 | |
JP7301529B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2006134042A (ja) | 画像処理システム | |
TW200811726A (en) | Method and apparatus for processing image with picture and characters | |
JP2002236921A (ja) | 文書画像認識方法、文書画像認識装置及び記録媒体 | |
JP4310176B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2002024766A (ja) | 文字認識装置及び方法 | |
JP2000187670A (ja) | 画像処理装置及びその方法、コンピュータ可読メモリ | |
US8515186B2 (en) | Image processor, image processing method and storage medium | |
JP2006146486A (ja) | 画像処理装置 | |
JP2000306076A (ja) | 画像処理装置及び制御方法及び記憶媒体 | |
JP2008084127A (ja) | 画像形成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20040512 Termination date: 20150611 |
|
EXPY | Termination of patent right or utility model |