[go: up one dir, main page]

CN106056112A - 图像处理装置及图像处理方法 - Google Patents

图像处理装置及图像处理方法 Download PDF

Info

Publication number
CN106056112A
CN106056112A CN201510631549.5A CN201510631549A CN106056112A CN 106056112 A CN106056112 A CN 106056112A CN 201510631549 A CN201510631549 A CN 201510631549A CN 106056112 A CN106056112 A CN 106056112A
Authority
CN
China
Prior art keywords
character
character string
similarity
image
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510631549.5A
Other languages
English (en)
Other versions
CN106056112B (zh
Inventor
安永真明
平和树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Tec Corp
Original Assignee
Toshiba Tec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Tec Corp filed Critical Toshiba Tec Corp
Publication of CN106056112A publication Critical patent/CN106056112A/zh
Application granted granted Critical
Publication of CN106056112B publication Critical patent/CN106056112B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/809Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像处理装置及图像处理方法,其能够提高低分辨率的图像所映现的字符串的识别精度。该图像处理装置,包括:抽取部、判定部、切出部及计算部。所述抽取部抽取第一图像所映现的第一字符串,抽取第二图像所映现的第二字符串。所述判定部判定为所述第一字符串的被摄体及所述第二字符串的被摄体同时与第一被摄体对应。所述切出部以一字符单位切出构成所述第一字符串的各字符,以一字符单位切出构成所述第二字符串的各字符。所述计算部计算出由构成所述第一字符串的各字符和候选字符组中的各候选字符的相似度构成的第一相似度组,计算出由构成所述第二字符串的各字符和所述候选字符组中的各候选字符的相似度构成的第二相似度组。

Description

图像处理装置及图像处理方法
本申请主张申请日为2015年04月08日、申请号为US14/681,933的美国申请为优先权,并引用上述申请的内容。
技术领域
本发明涉及一种图像处理装置及图像处理方法。
背景技术
通常,OCR(Optical Character Recognition:光学字符识别)处理是针对用扫描仪读取了纸面上所写着(记载着)的字符的字符图像进行的。近年来,随着摄像头的高分辨率化,补正通过摄像头所摄像的字符图像,并对补正后的字符图像进行OCR处理的应用软件出现了(上市了)。OCR处理不仅仅分析字符图像确定对应的字符,而且也可以在分析字符串的意思的同时确定最终的字符。通常通过摄像头摄像的字符图像的OCR处理诸如是针对象200dpi以上那样对字符具有充分的分辨能力的字符图像进行的。
不过,在通过摄像头取得的字符图像的OCR处理中,对低分辨率的字符图像的字符的识别率极低。而且,在低分辨率的字符图像中,字符的识别率容易受图像的品质影响。图像的品质因字符图像的摄像定时、摄像位置、摄像环境(照明)等细微的摄像条件的差别而较大地变化。因此,考虑仅对品质好的字符图像进行OCR处理。不过,当因摄像环境不能获得有品质好的字符图像时,所有的字符图像变成了不是OCR处理的对象。因此,考虑对从多个定时、多个位置摄像的多个字符图像进行OCR处理,并根据基于OCR处理的多个识别结果进行最终的字符识别。不过,当基于OCR处理的多个识别结果被多个分割时,很难判断最终的字符。
发明内容
鉴于上述问题,本发明的目的在于提供一种图像处理装置及图像处理方法,其能够提高低分辨率的图像所映现的字符串的识别精度。
为解决上述问题,本发明第一方面所涉及的图像处理装置,包括:抽取部、判定部、切出部、计算部及识别部。所述抽取部抽取第一图像所映现的第一字符串,抽取第二图像所映现的第二字符串。所述判定部判定为所述第一字符串的被摄体及所述第二字符串的被摄体同时与第一被摄体对应。所述切出部以一字符单位切出构成所述第一字符串的各字符,以一字符单位切出构成所述第二字符串的各字符。所述计算部计算出由构成所述第一字符串的各字符和候选字符组中的各候选字符的相似度构成的第一相似度组,计算出由构成所述第二字符串的各字符和所述候选字符组中的各候选字符的相似度构成的第二相似度组。所述识别部基于所述第一相似度组及所述第二相似度组识别所述第一被摄体的字符串。
本发明第二方面所涉及的图像处理方法,包括以下步骤:抽取第一图像所映现的第一字符串的步骤;抽取第二图像所映现的第二字符串的步骤;判定为所述第一字符串的被摄体及所述第二字符串的被摄体同时与第一被摄体对应的步骤;以一字符单位切出构成所述第一字符串的各字符的步骤;以一字符单位切出构成所述第二字符串的各字符的步骤;计算出由构成所述第一字符串的各字符和候选字符组中的各候选字符的相似度构成的第一相似度组的步骤;计算出由构成所述第二字符串的各字符和所述候选字符组中的各候选字符的相似度构成的第二相似度组的步骤;以及基于所述第一相似度组及所述第二相似度组识别所述第一被摄体的字符串的步骤。
附图说明
下面,参照附图对本发明所涉及的图像处理装置及图像处理方法进行说明。当结合附图考虑时,通过参照下面的详细描述,能够更完整更好地理解本发明以及容易得知其中许多伴随的优点,但此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定,其中:
图1是作为第一实施例所涉及的一例的图像处理装置的概略图;
图2是作为第一实施例所涉及的一例的图像处理装置的框图;
图3是作为第一实施例所涉及的一例的图像处理装置的处理的流程图;
图4是表示作为第一实施例所涉及的一例的多个图像的图;
图5a至图5d是表示作为第一实施例所涉及的一例的多个相似度图的图;
图6是表示作为第一实施例所涉及的一例的最终相似度图的图;以及
图7是作为第二实施例所涉及的一例的图像处理装置的概略图。
附图说明
10 图像处理装置 11 计算机
12 移动体 13 第一摄像部
14 第二摄像部 20 货架
21、22 物品 111 处理部
112 存储部 113 输入部
114 显示部 115 第一接口
116 第二接口 1111 采集部
1112 抽取部 1113 切出部
1114 计算部 1115 判定部
1115a 推定部 1115b 确定部
1116 识别部
具体实施方式
以下,参照附图,对几个实施例进行说明。
第一实施例
对第一实施例进行说明。图1是作为第一实施例所涉及的一例的图像处理装置10的概略图。
图像处理装置10被用于仓库、店铺的多个货架所载置的多个物品(例如,纸箱)的库存管理、所在地管理等。图像处理装置10具有计算机11、移动体12、第一摄像部13及第二摄像部14。图像处理装置10无需必须具有这些全部要素。例如,图像处理装置10也可以是至少具有计算机11的装置。
计算机11是通过象后述那样的OCR处理从图像中进行字符识别的装置。计算机11诸如是PC(Personal Computer:个人计算机)。另外,字符是包含数字、记号、符号或标识等识别代码的概念。字符串是将数字、记号、符号或标识等识别代码进行了多位排列的字符串。
移动体12是可使图像处理装置10向任意方向自律行驶(行走)的台车。移动体12向在与排列成直线状的货架20的延伸方向平行的方向上进行行驶。移动体12装载有计算机11、第一摄像部13及第二摄像部14。
第一摄像部13及第二摄像部14是摄像对象的摄像头。另外,对象也有称为被摄体的情况。第一摄像部13及第二摄像部14可以是将对象作为视频进行摄像的摄像头,也可以是将对象作为静态图像进行摄像的摄像头。第一摄像部13及第二摄像部14以从不同方向摄像同一对象的方式固定在移动体12上。第一摄像部13的摄像范围及第二摄像部14的摄像范围进行重复。第一摄像部13及第二摄像部14的相对位置及各自的摄像方向是已知的。对象是粘贴在载置在货架20上的多个物品的标签的字符串。例如,物品21的标签记载“000872”。物品22的标签记载“103371”。标签所记载的字符串是为了识别各物品而唯一地分配给各物品的ID(IDentification:识别)信息。一般粘贴在某区所管理的多个物品上的所有的标签的字符串是相同位数且预定的字符的组合。在图1所示的例子中,字符串由6位数且各位数为0~9的组合构成。第一摄像部13及第二摄像部14依次摄像粘贴在货架20所载置的多个物品上的标签。第一摄像部13及第二摄像部14向计算机11发送已取得的图像数据。
图2是作为第一实施例所涉及的一例的图像处理装置10的框图。图2主要示出计算机11的构成。计算机11具有处理部111、存储部112、输入部113、显示部114、第一接口115及第二接口116。
处理部111相当于计算机11的中枢部分。处理部111按照操作系统、应用程序,控制计算机11的各要素。处理部111具有采集部1111、抽取部1112、切出部1113、计算部1114、包含推定部1115a及确定部1115b的判定部1115以及识别部1116。这些要素的处理内容进行后述。
存储部112包括存储上述操作系统、应用程序的存储器。而且,存储部112包括作为处理部111的处理所需的工作区的存储器。而且,存储部112包括存储处理部111的处理所需的数据的存储器。
输入部113是可向计算机11输入命令的键盘。
显示部114是基于来自处理部111的信号显示影像的显示器。显示部114是影像的输出部。
第一接口115连接计算机11和第一摄像部13。计算机11通过第一接口115从第一摄像部13采集图像数据。
第二接口116连接计算机11和第二摄像部14。计算机11通过第二接口116从第二摄像部14采集图像数据。
接着,对基于图像处理装置10的字符识别的处理进行说明。图像处理装置10所处理的图像,诸如是第一摄像部13及第二摄像部14从远处摄像了粘贴在货架20所载置的多个物品上的标签的低分辨率的图像。因此,第一摄像部13所摄像的图像及第二摄像部14所摄像的图像,虽然人看后能识别(能读出)字符串,但是在基于图像处理装置10的一般OCR处理中却不能充分进行字符识别。
图3是作为第一实施例所涉及的一例的图像处理装置10的处理的流程图。
处理部111的采集部1111采集图像(Act101)。在Act101中,处理部111通过第一接口115及第二接口116采集第一摄像部13所取得第一图像的数据及第二摄像部14所取得的第二图像的数据。存储部112存储第一图像数据及第二图像数据。第一图像及第二图像映现有成为字符识别的对象的字符串(以下,称为第一被摄体)。另外,第一图像及第二图像也可以映现有第一被摄体以外的字符串。
处理部111的抽取部1112抽取字符串(Act102)。在Act102中,处理部111抽取第一图像所映现的所有字符串。同样地,处理部111抽取第二图像所映现的所有字符串。以下为了简化说明,示出对第一图像所映现的第一字符串的处理及对第二图像所映现的第二字符串的处理。处理部111抽取第一图像所映现的第一字符串。同样地,处理部111抽取第二图像所映现的第二字符串。Act102中的字符串的抽取处理可以是OCR处理所使用的任意方法。
处理部111的切出部1113切出字符(Act103)。在Act103中,处理部111以一字符单位切出构成第一字符串的各字符。同样地,处理部111以一字符单位切出构成第二字符串的各字符。Act103中的字符的切出处理可以是OCR处理所使用的任意方法。
处理部111的计算部1114计算相似度(Act104)。在Act104中,处理部111计算出构成第一字符串的各字符和候选字符组中的各候选字符的相似度。通过这样,处理部111计算出由构成第一字符串的各字符和候选字符组中的各候选字符的相似度构成的第一相似度组。也就是,处理部111在第一字符串的各位数中,计算出与候选字符的数量对应的数量的相似度。同样地,处理部111计算出构成第二字符串的各字符和候选字符组中的各候选字符的相似度。通过这样,处理部111计算出由构成第二字符串的各字符和候选字符组中的各候选字符的相似度构成的第二相似度组。也就是,处理部111在第二字符串的各位中,计算出与候选字符的数量对应的数量的相似度。
在上述的Act104中所使用的候选字符组,由多个候选字符构成。多个候选字符由可作为用于识别各物品的字符串使用的预定的多个字符构成。例如,多个候选字符是0~9的数字。候选字符组保存在存储部112中。候选字符组有根据管理有物品的区而不同的可能性。因此,存储部112也可以用区单位保存不同的候选字符组的数据。
在上述的Act104中计算出的相似度是表示构成第一字符串的各字符及构成第二字符串的各字符与各候选字符一致的可能性(概率)的指标。在Act104中的相似度的计算方法也可以是任意方法。另外,相似度的范围尤其不限。例如,相似度的范围可以是0~1,也可以是0~100。相似度可以示出越接近上限值越与候选字符相似,示出越接近下限值越与候选字符不相似,也可以对这些相反示出。例如,处理部111能够以候选字符彼此之间没有依存关系的方式计算出各相似度。也就是,在第一字符串的各位数中,第一相似度组所包含的各相似度相互没有依存关系。用第一字符串的位数单位合计了相似度的值没有被100%标准化。对第二字符串中的相似度也同样。也就是,在第二字符串的各位数中,第二相似度组所包含的各相似度相互没有依存关系。这时,处理部111在相同位数中计算出某候选字符的相似度时,不受其他的候选字符的相似度的值影响。因此,处理部111能够计算出候选字符彼此独立的准确度高的相似度。
与此相反,处理部111也可以用候选字符彼此之间具有依存关系的方式计算出各相似度。也就是,在第一字符串的各位数中,第一相似度组所包含的各相似度具有相互依存关系。用第一字符串的位数单位合计了相似度的值被100%标准化。关于第二字符串中的相似度也同样。也就是,在第二字符串的各位数中,第二相似度组所包含的各相似度相互具有依存关系。这样,第一相似度组所包含的各相似度及第二相似度组所包含的各相似度是似然(likelihood)的。这时,处理部111能够计算出构成第一字符串的各位字符与哪个候选字符一致的可能性高。同样地,处理部111能够计算出构成第二字符串的各位字符与哪个候选字符一致的可能性高。
处理部111的推定部1115a推定相同字符串(Act105)。在Act105中,推定为第一被摄体依存于第一图像及第二图像的可能性高。这是因为第一摄像部13及第二摄像部14从不同的方向摄像相同的对象的缘故。
处理部111的确定部1115b确定相同字符串(Act106)。在Act106中,处理部111基于第一摄像部13和第二摄像部14的位置关系、第一图像所映现的字符串的位置及第二图像所映现的字符串的位置,能够确定从第一图像中抽取的哪个字符串和从第二图像中抽取的哪个字符串与同一被摄体对应。也就是,处理部111能够用被摄体单位对应从第一图像抽取的字符串和从第二图像抽取的字符串。这是因为第一摄像部13及第二摄像部14的相对位置及各自的摄像方向是已知的缘故。例如,处理部111采用基于第一摄像部13和第二摄像部14的位置关系的三角测量等。
如以上那样,在Act105及Act106中,处理部111的判定部1115判定为第一字符串的被摄体及第二字符串的被摄体同时与第一被摄体对应。作为一例,处理部111基于第一摄像部13和第二摄像部14的位置关系、第一图像所映现的第一字符串的位置及第二图像所映现的第二字符串的位置,判定为第一字符串的被摄体及第二字符串的被摄体同时与第一被摄体对应。另外,在Act105及Act106中的处理可以不在Act104之后,也可以在Act102和Act103之间或者在Act103和Act104之间。
处理部111的识别部1116执行字符识别(Act107)。在Act107中,处理部111基于对应在第一字符串及第二字符串中相互对应的每位数且候选字符组中的每个候选字符,将第一相似度组所包含的相似度和第二相似度组所包含的相似度加在一起的值计算出第一计算值组。另外,第一计算值组可以是合计了第一相似度组所包含的相似度和第二相似度组所包含的相似度的值,也可以是第一相似度组所包含的相似度和第二相似度组所包含的相似度的平均值。接着,处理部111对应每位数抽取第一计数值组中的最大值。接着,处理部111识别与每位数的最大值对应的候选字符的集合作为第一被摄体中的字符串。如上那样,处理部111基于第一相似度组及第二相似度组识别第一被摄体的字符串。处理部111采用第一相似度组及第二相似度组的两方,是因为与第一相似度组中的每位数的最大值对应的候选字符的集合和与第二相似度组中的每位数的最大值对应的候选字符的集合有时不同。
根据第一实施例,图像处理装置10不仅采用字符串的OCR处理,而且通过采用上述的相似度进行字符识别,能够提高低分辨率的图像所映现的字符串的识别精度。
另外,当各相似度象上述那样以候选字符彼此之间没有依存关系的方式计算出时,基于图像处理装置10的字符串的识别精度进一步提高。这是因为各相似度的准确度高的缘故。
接着,参照图4至图6,对上述的图像处理装置10的字符识别的处理的具体例进行说明。
图4是表示作为第一实施例所涉及的一例的图像的图。图4的左图是由第一摄像部13摄像的第一图像。图4的右图是由第二摄像部14摄像的第二图像。第一图像及第二图像映现有粘贴在作为字符识别的对象的物品21上的标签的字符串“000872”(以下,称为被摄体A)及粘贴在作为字符识别的对象的物品22上的标签的字符串“103371”(以下,称为被摄体B)。如在上述Act101中说明的那样,处理部111通过第一接口115及第二接口116采集第一摄像部13所取得的第一图像的数据及第二摄像部14所取得的第二图像的数据。
如在Act102中说明的那样,处理部111抽取在图4中所示的第一图像所映现的与被摄体A对应的字符串a1及与被摄体B对应的字符串b1。处理部111抽取第二图像所映现的与被摄体A对应的字符串a2及与被摄体B对应的字符串b2。如在Act103中说明的那样,处理部111以一字符单位切出构成字符串a1及字符串b1的各字符。同样地,处理部111以一字符单位切出构成字符串a2及字符串b2的各字符。
图5a至图5d是表示作为第一实施例所涉及的一例的多个相似度图的图。相似度图相当于上述的第一相似度组及第二相似度组。图5a是字符串a1相关的相似度图。图5b是字符串b1相关的相似度图。图5c是字符串a2相关的相似度图。图5d是字符串b2相关的相似度图。如在Act104中说明的那样,处理部111计算出构成字符串a1的各字符和候选字符组中的各候选字符的相似度。通过这样,处理部111计算出由构成字符串a1的各字符和候选字符组中的各候选字符的相似度构成的相似度图。同样地,处理部111计算出字符串b1相关的相似度图、字符串a2相关的相似度图及字符串b2相关的相似度图。相似度图的横轴示出字符串的位数。另外,字符串a1、字符串b1、字符串a2及字符串b2中任意一个字符串都是6位数。纵轴示出候选字符。候选字符是0~9的10个。因此,各相似度图由60个相似度构成。
图5a至图5d所示的各相似度图是如上述那样以在各位数中候选字符彼此之间没有依存关系的方式计算出各相似度的例子。图5a至图5d的相似度示出越接近1.0越与候选字符相似,越接近0.0越与候选字符不相似。
在图5a至图5d的各相似度图的下面示出有识别结果。识别结果是排列了与每位数的相似度的最大值对应的候选字符的集合。如在Act105及Act106中说明的那样,处理部111判定为字符串a1的被摄体及字符串a2的被摄体同时与被摄体A对应。不过,字符串a1的识别结果“000872”与字符串a2的识别结果“008872”不同。同样地,处理部111判定为字符串b1的被摄体及字符串b2的被摄体同时与被摄体B对应。不过,字符串b1的识别结果“103371”与字符串b2的识别结果“708371”不同。因此,如Act107中说明的那样,处理部111基于对应字符串a1及字符串a2中相互对应的每位数且候选字符组中的每个候选字符,将字符串a1的相似度图所包含的相似度和字符串a2的相似度图所包含的相似度相加一起的值,计算出最终相似度图。最终相似度图相当于上述的第一计算值组。
图6是表示作为第一实施例所涉及的一例的最终相似度图的图。图6所示的最终相似度图由字符串a1的相似度图所包含的相似度和字符串a2的相似度图所包含的相似度的平均值构成。处理部111对应每位数抽取最终相似度图中的最大值。接着,处理部111识别与每位数的最大值对应的候选字符的集合(以下,称为识别结果)“000872”作为被摄体A的字符串。同样地,处理部111基于字符串b1的相似度图和字符串b2的相似度图识别被摄体B中的字符串。图像处理装置10虽然有仅用OCR处理不能准确地识别被摄体的字符串的可能性,但是通过采用上述的相似度能够以高精度识别被摄体的字符串。
另外,在Act107中,处理部111也可以基于第二图像所映现的第二字符串的位置将依存于图像所映现的字符串的位置的第一分量系数与第一相似度组所包含的各相似度相乘。同样地,处理部111也可以基于第二图像所映现的第二字符串的位置将第一分量系数与第二相似度组所包含的各相似度相乘。例如,第一系数是使图像端的分量变低,并随着靠近中央使分量变高那样的系数。即使被摄体是相同的,映现有该被摄体的位置在第一图像和第二图像中也不同。图像端所映现的字符串与中央部分所映现的字符串相比歪斜的可能性高。因此,基于图像端所映现的字符串的相似度组,与基于图像中央部分所映现的字符串的相似度组相比可靠性低。图像处理装置10通过采用第一分量系数补正相似度组,能够以更高的精度识别被摄体的字符串。
另外,在Act107中,处理部111也可以基于第二图像所映现的第二字符串的像素信息,将依存于图像所映现的字符串的像素信息的第二分量系数与第一相似度组所包含的各相似度相乘。同样地,处理部111也可以基于第二图像所映现的第二字符串的像素信息将第二分量系数与第二相似度组所包含的各相似度相乘。例如,像素信息是对比度。例如,第二系数是使对比度低的部分的分量变低,并随着对比度变高使分量变高那样的系数。第一摄像部13及第二摄像部14由于摄像位置及方向不同,所以第一图像及第二图像的对比度不同。而且,即使在相同图像内,也有对比度不同的情况。基于对比度低的部分所映现的字符串的相似度组,与基于对比度高的部分所映现的字符串的相似度组相比可靠度低。处理部111能够根据对比度以图像单位、字符串单位及构成字符串的字符单位改变第二分量系数。图像处理装置10通过采用第二分量系数补正相似度组,能够以更高的精度识别被摄体的字符串。
另外,在Act107中,处理部111也可以通过基于规定的规则的意思分析处理修正基于最终相似度图的识别结果。通过这样,图像处理装置10能够以更高的精度识别被摄体的字符串。
另外,图像处理装置10也可以基于根据来自大于等于三个的摄像部的图像计算出的大于等于三个的相似度组,识别被摄体的字符串。通过这样,图像处理装置10能够以更高的精度识别被摄体的字符串。
第二实施例
对第二实施例进行说明。在这里,对与第一实施例不同的点进行说明,并省略同样点的说明。图7是作为第二实施例所涉及的一例的图像处理装置10的概略图。第二实施例所涉及的图像处理装置10相当于从第一实施例所涉及的图像处理装置10中除去了第二摄像部14及第二接口116的装置。也就是,第二实施例所涉及的图像处理装置10仅具有一个摄像对象的摄像部。
基于图像处理装置10的字符识别的处理在图3的Act101、Act105及Act106中与第一实施例不同。
在Act101中,处理部111通过第一接口115采集第一摄像部13所取得的第一图像及第二图像的数据。第一图像及第二图像是第一摄像部13从不同的位置拍摄了第一被摄体的图像。
在Act105及Act106中,处理部111的判定部1115判定为第一字符串的被摄体及第二字符串的被摄体同时与第一被摄体对应。作为一例,处理部111基于第一摄像部13的移动量、第一图像所映现的第一字符串的位置及第二图像所映现的第二字符串的位置,判定为第一字符串的被摄体及第二字符串的被摄体同时与所述第一被摄体对应。如果第一摄像部13的移动量与第一图像所映现的第一字符串的位置和第二图像所映现的第二字符串的位置的移动量一致,则处理部111能够判定为第一字符串的被摄体及第二字符串的被摄体同时与所述第一被摄体对应。另外,处理部111也可以采用第一图像及第二图像所映现的任意标记的移动量,替代第一摄像部13的移动量。
第二实施例能够获得与上述第一实施例同样的效果。
执行动作的主体诸如是硬件、硬件和软件的复合体、软件及执行中的软件等的计算机所涉及的主体。执行动作的主体虽然诸如是在处理器上执行的进程、处理器、目的物、执行文件、线程、程序及计算机,但是并不限定于这些。例如,也可以图像处理装置及在这里被执行的应用程序是执行动作的主体。也可以使进程、线程起到多个执行动作的主体的作用。执行动作的主体既可以位于一个图像处理装置内,也可以为分配给多个图像处理装置的形式。
既可以在装置内部预先记录有以上说明的功能,又可以将同样功能从网络下载到装置中,还可以将存储同样功能的存储介质安装在装置中。作为记录介质,只要是光盘ROM、存储卡等能存储程序且装置可读取的存储介质,则其形态可以是任意形态。此外,通过这样预先安装、下载获得的功能也可以与装置内部的OS(操作系统)等协作来实现其功能。
虽然对本发明的几个实施例进行了说明,但是这些实施例是作为例子提出的,并不意图限定发明的范围。这些新颖的实施例可以用其他的各种形式来实施,只要不脱离本发明的主旨的范围内可以进行各种省略、替换、变更。这些实施例及其变形均包含在发明的范围或要旨中,而且包含在权利要求的范围所记载的发明及其均等的范围内。

Claims (10)

1.一种图像处理装置,包括:
抽取部,抽取第一图像所映现的第一字符串,抽取第二图像所映现的第二字符串;
判定部,判定为所述第一字符串的被摄体及所述第二字符串的被摄体同时与第一被摄体对应;
切出部,以一字符单位切出构成所述第一字符串的各字符,以一字符单位切出构成所述第二字符串的各字符;
计算部,计算出由构成所述第一字符串的各字符和候选字符组中的各候选字符的相似度构成的第一相似度组,计算出由构成所述第二字符串的各字符和所述候选字符组中的各候选字符的相似度构成的第二相似度组;以及
识别部,基于所述第一相似度组及所述第二相似度组识别所述第一被摄体的字符串。
2.根据权利要求1所述的图像处理装置,还包括:
第一摄像部,摄像所述第一被摄体;以及
第二摄像部,摄像所述第一被摄体,
其中,所述判定部基于所述第一摄像部和所述第二摄像部的位置关系、所述第一图像所映现的所述第一字符串的位置及所述第二图像所映现的所述第二字符串的位置,判定为所述第一字符串的被摄体及所述第二字符串的被摄体同时与所述第一被摄体对应。
3.根据权利要求1所述的图像处理装置,还包括:
摄像部,摄像所述第一被摄体,
其中,所述判定部基于所述摄像部的移动量、所述第一图像所映现的所述第一字符串的位置及所述第二图像所映现的所述第二字符串的位置,判定为所述第一字符串的被摄体及所述第二字符串的被摄体同时与所述第一被摄体对应。
4.根据权利要求1所述的图像处理装置,其中,
所述识别部基于对应在所述第一字符串及所述第二字符串中相互对应的每位数且所述候选字符组中的每个候选字符将所述第一相似度组所包含的相似度和所述第二相似度组所包含的相似度加在一起的值,计算出第一计算值组,对应所述每位数抽取所述第一计算值组中的最大值,识别与所述最大值对应的候选字符的集合作为所述第一被摄体中的字符串。
5.根据权利要求4所述的图像处理装置,其中,
所述识别部基于所述第二图像所映现的所述第二字符串的位置将依存于图像所映现的字符串的位置的第一分量系数与所述第一相似度组所包含的各相似度相乘,基于所述第二图像所映现的所述第二字符串的位置将所述第一分量系数与所述第二相似度组所包含的各相似度相乘。
6.根据权利要求4所述的图像处理装置,其中,
所述识别部基于所述第二图像所映现的所述第二字符串的像素信息将依存于图像所映现的字符串的像素信息的第二分量系数与所述第一相似度组所包含的各相似度相乘,基于所述第二图像所映现的所述第二字符串的像素信息将所述第二分量系数与所述第二相似度组所包含的各相似度相乘。
7.根据权利要求1所述的图像处理装置,其中,
所述第一相似度组所包含的各相似度及所述第二相似度组所包含的各相似度是似然的。
8.根据权利要求1所述的图像处理装置,其中,
所述第一相似度组所包含的各相似度相互没有依存关系,所述第二相似度组所包含的各相似度相互没有依存关系。
9.根据权利要求1所述的图像处理装置,其中,
所述识别部基于对应在所述第一字符串及所述第二字符串中相互对应的每位数且所述候选字符组中的每个候选字符所述第一相似度组所包含的相似度和所述第二相似度组所包含的相似度的平均值,计算出第一计算值组,对应所述每位数抽取所述第一计算值组中的最大值,识别与所述最大值对应的候选字符的集合作为所述第一被摄体中的字符串。
10.一种图像处理方法,包括以下步骤:
抽取第一图像所映现的第一字符串的步骤;
抽取第二图像所映现的第二字符串的步骤;
判定为所述第一字符串的被摄体及所述第二字符串的被摄体同时与第一被摄体对应的步骤;
以一字符单位切出构成所述第一字符串的各字符的步骤;
以一字符单位切出构成所述第二字符串的各字符的步骤;
计算出由构成所述第一字符串的各字符和候选字符组中的各候选字符的相似度构成的第一相似度组的步骤;
计算出由构成所述第二字符串的各字符和所述候选字符组中的各候选字符的相似度构成的第二相似度组的步骤;以及
基于所述第一相似度组及所述第二相似度组识别所述第一被摄体的字符串的步骤。
CN201510631549.5A 2015-04-08 2015-09-29 图像处理装置及图像处理方法 Active CN106056112B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/681,933 2015-04-08
US14/681,933 US9563812B2 (en) 2015-04-08 2015-04-08 Image processing apparatus, image processing method and computer-readable storage medium

Publications (2)

Publication Number Publication Date
CN106056112A true CN106056112A (zh) 2016-10-26
CN106056112B CN106056112B (zh) 2019-09-03

Family

ID=54843674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510631549.5A Active CN106056112B (zh) 2015-04-08 2015-09-29 图像处理装置及图像处理方法

Country Status (4)

Country Link
US (2) US9563812B2 (zh)
EP (1) EP3079100B1 (zh)
JP (2) JP6619635B2 (zh)
CN (1) CN106056112B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112001392A (zh) * 2019-05-27 2020-11-27 株式会社东芝 读取系统、读取方法、存储介质以及移动体

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USD914047S1 (en) 2014-11-04 2021-03-23 Teenage Engineering Ab Display screen or portion thereof with graphical user interface
USD789955S1 (en) 2014-11-04 2017-06-20 Teenage Engineering Ab Display screen or portion thereof with graphical user interface
US9684984B2 (en) * 2015-07-08 2017-06-20 Sage Software, Inc. Nearsighted camera object detection
US9785850B2 (en) 2015-07-08 2017-10-10 Sage Software, Inc. Real time object measurement
JP2017187988A (ja) 2016-04-07 2017-10-12 東芝テック株式会社 コード認識装置
US10108856B2 (en) * 2016-05-13 2018-10-23 Abbyy Development Llc Data entry from series of images of a patterned document
US10037459B2 (en) 2016-08-19 2018-07-31 Sage Software, Inc. Real-time font edge focus measurement for optical character recognition (OCR)
JP2018088116A (ja) * 2016-11-29 2018-06-07 キヤノン株式会社 情報処理装置、プログラム、情報処理方法
JP2020017156A (ja) * 2018-07-27 2020-01-30 富士通株式会社 文字認識装置、文字認識プログラムおよび文字認識方法
JP6929823B2 (ja) 2018-11-16 2021-09-01 株式会社東芝 読取システム、読取方法、プログラム、記憶媒体、及び移動体

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6014460A (en) * 1994-12-20 2000-01-11 Nec Corporation Character strings reading device
US20080063280A1 (en) * 2004-07-08 2008-03-13 Yoram Hofman Character Recognition System and Method
US20090028443A1 (en) * 2007-07-26 2009-01-29 Palo Alto Research Center Incorporated Innovative ocr systems and methods that combine a template based generative model with a discriminative model
US7680329B2 (en) * 2005-08-22 2010-03-16 Kabushiki Kaisha Toshiba Character recognition apparatus and character recognition method
US7844115B2 (en) * 2006-03-27 2010-11-30 Sony Corporation Information processing apparatus, method, and program product
US8457407B2 (en) * 2009-11-11 2013-06-04 Kabushiki Kaisha Toshiba Electronic apparatus and image display method
US20130208991A1 (en) * 2012-02-10 2013-08-15 Canon Kabushiki Kaisha Information processing apparatus for determining matching language for characters in image
CN103488983A (zh) * 2013-09-13 2014-01-01 复旦大学 一种基于知识库的名片ocr数据修正方法和系统
CN103714338A (zh) * 2012-09-28 2014-04-09 欧姆龙株式会社 图像处理装置和图像处理方法
CN104143141A (zh) * 2013-05-06 2014-11-12 金培新 一种基于信用卡扫描技术的金融支付方法
CN104463124A (zh) * 2014-12-11 2015-03-25 天津普达软件技术有限公司 一种奶盒喷打字符识别的方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0363895A (ja) * 1989-08-02 1991-03-19 Mitsubishi Electric Corp 文字認識方式
JP3917252B2 (ja) * 1997-08-25 2007-05-23 株式会社東芝 車両のナンバプレート認識装置および車両のナンバプレート認識方法
JP2000155803A (ja) * 1998-11-20 2000-06-06 Nec Corp 文字読取方法および光学式文字読取装置
JP2005352705A (ja) * 2004-06-09 2005-12-22 Omron Corp パターン認識装置、パターン認識方法及び文字認識方法。
WO2008099664A1 (ja) * 2007-02-15 2008-08-21 Mitsubishi Heavy Industries, Ltd. 車両番号認識装置
JP2011113440A (ja) * 2009-11-30 2011-06-09 Fujitsu Ltd ナンバープレート認識プログラムおよびナンバープレート認識装置
JP5640601B2 (ja) * 2010-09-22 2014-12-17 富士通株式会社 文字認識装置、文字認識装置制御プログラム、文字認識装置制御方法及び携帯端末装置
JP5825172B2 (ja) 2012-03-28 2015-12-02 富士通株式会社 画像判定装置、画像判定方法及び画像判定用コンピュータプログラム
JP6146209B2 (ja) * 2013-08-28 2017-06-14 富士通株式会社 情報処理装置、文字認識方法、及びプログラム
JP6282065B2 (ja) * 2013-09-05 2018-02-21 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6014460A (en) * 1994-12-20 2000-01-11 Nec Corporation Character strings reading device
US20080063280A1 (en) * 2004-07-08 2008-03-13 Yoram Hofman Character Recognition System and Method
US7680329B2 (en) * 2005-08-22 2010-03-16 Kabushiki Kaisha Toshiba Character recognition apparatus and character recognition method
US7844115B2 (en) * 2006-03-27 2010-11-30 Sony Corporation Information processing apparatus, method, and program product
US20090028443A1 (en) * 2007-07-26 2009-01-29 Palo Alto Research Center Incorporated Innovative ocr systems and methods that combine a template based generative model with a discriminative model
US8457407B2 (en) * 2009-11-11 2013-06-04 Kabushiki Kaisha Toshiba Electronic apparatus and image display method
US20130208991A1 (en) * 2012-02-10 2013-08-15 Canon Kabushiki Kaisha Information processing apparatus for determining matching language for characters in image
CN103714338A (zh) * 2012-09-28 2014-04-09 欧姆龙株式会社 图像处理装置和图像处理方法
CN104143141A (zh) * 2013-05-06 2014-11-12 金培新 一种基于信用卡扫描技术的金融支付方法
CN103488983A (zh) * 2013-09-13 2014-01-01 复旦大学 一种基于知识库的名片ocr数据修正方法和系统
CN104463124A (zh) * 2014-12-11 2015-03-25 天津普达软件技术有限公司 一种奶盒喷打字符识别的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CASE, CARL 等: "Autonomous Sign Reading for Semantic Mapping", 《2011 IEEE INTERNATIONAL CONFERENCE ON ROBOTICS AND AUTOMATION 》 *
RAMOS-GARIJO, R等: "An autonomous assistant robot for book manipulation in a library", 《2003 IEEE INTERNATIONAL CONFERENCE ON SYSTEMS, MAN AND CYBERNETICS》 *
WANG, HSUEH-CHENG等: "Spatially Prioritized and Persistent Text Detection and Decoding", 《LECTURE NOTES IN COMPUTER SCIENCE》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112001392A (zh) * 2019-05-27 2020-11-27 株式会社东芝 读取系统、读取方法、存储介质以及移动体

Also Published As

Publication number Publication date
EP3079100A1 (en) 2016-10-12
US9563812B2 (en) 2017-02-07
CN106056112B (zh) 2019-09-03
US20160300116A1 (en) 2016-10-13
EP3079100B1 (en) 2019-01-30
JP6619635B2 (ja) 2019-12-11
JP2016201094A (ja) 2016-12-01
JP2020030858A (ja) 2020-02-27
US20170140234A1 (en) 2017-05-18
JP6952094B2 (ja) 2021-10-20
US9934444B2 (en) 2018-04-03

Similar Documents

Publication Publication Date Title
JP6843213B2 (ja) 画像処理装置及び画像処理方法
CN106056112B (zh) 图像处理装置及图像处理方法
US10796162B2 (en) Information processing apparatus, information processing method, and information processing system
JP6832504B2 (ja) 物体追跡方法、物体追跡装置およびプログラム
JP6354589B2 (ja) 物体識別装置、方法及びプログラム
JP6143111B2 (ja) 物体識別装置、物体識別方法、及びプログラム
CN108921204B (zh) 电子装置、图片样本集生成方法和计算机可读存储介质
JP6278276B2 (ja) 物体識別装置、物体識別方法、及びプログラム
US10025977B2 (en) Method for identifying a sign on a deformed document
JP6831951B2 (ja) 画像認識システム
US11816923B2 (en) Face image candidate determination apparatus for authentication, face image candidate determination method for authentication, program, and recording medium
CN111046859A (zh) 字符识别方法及装置
JP2019045909A (ja) 画像認識システム
WO2021189640A1 (zh) 酒品信息管理方法、装置、计算机设备以及存储介质
KR20130080743A (ko) 특징점 집합 비교를 이용한 객체 영역 검색 방법
JP2019016128A (ja) 画像類否判断プログラム、画像類否判断装置および画像類否判断方法
JP6941331B2 (ja) 画像認識システム
US20230377188A1 (en) Group specification apparatus, group specification method, and computer-readable recording medium
Lin et al. Invariant Hough random ferns for object detection and tracking

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant