CN109325138B - 一种基于扩展与亚像素矩阵结合的图像快速识别方法 - Google Patents
一种基于扩展与亚像素矩阵结合的图像快速识别方法 Download PDFInfo
- Publication number
- CN109325138B CN109325138B CN201810767195.0A CN201810767195A CN109325138B CN 109325138 B CN109325138 B CN 109325138B CN 201810767195 A CN201810767195 A CN 201810767195A CN 109325138 B CN109325138 B CN 109325138B
- Authority
- CN
- China
- Prior art keywords
- image
- pixel matrix
- matrix
- sub
- original pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 132
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000010606 normalization Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于扩展与亚像素矩阵结合的图像快速识别方法,首先对所有图像进行预处理,构造候选图像数据库;然后构造候选图像数据库的扩展矩阵和亚像素矩阵;再构建原像素矩阵分类器,据此将图像数据库内所有图像存放于树形结构内;然后对待识别图像进行预处理,形成待识别图像的原像素矩阵;并构造待识别图像的原像素矩阵对应的扩展矩阵、亚像素矩阵;最后将待识别图像与候选图像数据库内图像按照扩展矩阵、亚像素矩阵、原像素矩阵逐步匹配,从而快速识别出结果。本发明基于图像的扩展矩阵和亚像素矩阵进行特征匹配,逐步缩小目标数据库的范围,大大提高了信息搜素匹配度和搜索效率,节省了匹配时间,提高了图像识别的准确度。
Description
技术领域
本发明涉及一种图像快速识别方法,尤其涉及一种基于扩展与亚像素矩阵结合的图像快速识别方法。
背景技术
汉字、数字、字母单词、指纹、人脸等的识别是生活中常用且极为关键的技术。目前,在文献资料的检索、物流行业新建和包裹的分拣、各类证件识别、快速录入信息、安检、指模考勤等众多领域都要用到汉字、数字、字母单词、指纹、人脸等图像识别技术。
汉字、数字、字母单词、指纹、人脸等的识别一般包括信息的采集、信息的分析与处理、信息的分类判别等几个部分。常用的方法有模板匹配法和几何特征抽取法,这些方法存在着识别效率低和识别准确度不够高的缺陷。
因此,如何节省识别时间,提高图像识别的效率和准确度,是本领域技术人员致力于解决的难题。
发明内容
本发明要解决的技术问题是如何节省图像识别时间,提高图像识别的效率和准确度。
为了解决上述技术问题,本发明的技术方案是提供一种基于扩展与亚像素矩阵结合的图像快速识别方法,其特征在于,包括如下步骤:
步骤1:对所有图像进行预处理,构造候选图像数据库;
步骤2:构造候选图像数据库中所有图像的原像素矩阵对应的扩展矩阵;
步骤3:构造候选图像数据库中所有图像的原像素矩阵对应的亚像素矩阵;
步骤4:基于扩展矩阵的扩展特征和亚像素矩阵的特征,构建原像素矩阵分类器;将图像数据库内所有图像的原像素矩阵依据原像素矩阵分类器的特征,存放于树形结构内,以便搜索识别时按照原像素矩阵分类器的特征进行匹配搜索;
步骤5:对待识别图像进行预处理,形成待识别图像的原像素矩阵;并构造待识别图像的原像素矩阵对应的扩展矩阵、亚像素矩阵;
步骤6:将待识别图像的扩展矩阵的扩展部分与候选图像数据库内所有图像的扩展矩阵的扩展部分进行对比;
当扩展部分相同时,再将待识别图像的亚像素矩阵与扩展矩阵相同的树形结构节点下候选图像数据库内图像的亚像素矩阵进行对比;
当亚像素矩阵相同时,进一步将待识别图像的原像素矩阵与亚像素矩阵相同的树形结构节点下候选图像数据库内图像的原像素矩阵逐一对比,最后找出原像素矩阵全部相同的目标图像,从而识别出结果。
优选地,所述步骤1中,预处理包括如下步骤:
步骤1.1:将纸面上的图像的灰度变换成电信号,输入到计算机中去;
步骤1.2:对变换后的电信号消除各种因素所造成的噪音和干扰,进行大小、偏转、浓淡、粗细方面的正规化处理;
步骤1.3:将处理后的图像放大,直到图像上的信息由像素单位组成;将白色像素设置为第一值、非白色像素设置为第二值,得到由第一值和第二值组成的图像数值矩阵或序列,即为图像的原像素矩阵。
优选地,所述步骤1中,图像包括但不限于汉字、数字、字母单词、指纹、人脸。
本发明提供的方法克服了现有技术的不足,基于图像的扩展矩阵和亚像素矩阵进行特征匹配,逐步缩小目标数据库的范围,大大提高了信息搜素匹配度和搜索效率,节省了匹配时间,提高了图像识别的准确度。
附图说明
图1为本实施例提供的基于扩展与亚像素矩阵结合的图像快速识别方法流程图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。
本实施例提供的基于扩展与亚像素矩阵结合的图像快速识别方法包括:图像数据库建立;库内各图像原像素矩阵生成、扩展像素矩阵构造、亚像素矩阵构造、分类器构造;目标识别图像信息提取、预处理、像素扩展矩阵构造、亚像素矩阵构造;及其扩展矩阵匹配、亚像素矩阵匹配等过程。在采集图像信息后,进行预处理,构造该图像的扩展矩阵与亚像素矩阵,并将其与图像数据库矩阵的扩展矩阵及亚像素矩阵进行匹配,得出识别结果。
所述图像包括汉字、数字、字母单词、指纹、人脸等。
图1为本实施例提供的基于扩展与亚像素矩阵结合的图像快速识别方法流程图,所述的基于扩展与亚像素矩阵结合的图像快速识别方法具体步骤如下:
步骤1:将纸面上的汉字、数字、字母单词、指纹、人脸等图像的灰度变换成电信号,输入到计算机中去。汉字、数字、字母单词、指纹、人脸等图像的提取由识别机中的送纸机构和光电变换装置来实现。光电变换装置包括飞点扫描、摄像机、光敏元件和激光扫描等。
对变换后的电信号消除各种由于印刷质量、纸质(均匀性、污点等)或书写工具等因素所造成的噪音和干扰,进行大小、偏转、浓淡、粗细等各种正规化处理。
将处理后的图像放大,直到图像被放大到使得图像上的信息由像素单位组成的,随后将白色像素设置为第一值,而且将非白色像素设置为第二值,以得到由第一值和第二值组成的图像数值矩阵或序列,即为图像的原像素矩阵。在本发明实施例中,将白色像素设置为0,非白色像素设置为1,这样等于整张图像上的信息是由许多的0和1有规则排序成二维数组显示出来的,形成的图像的原像素矩阵P如下:
其中,aij=1或者0;n为正整数。
如此,便建立了用于识别汉字、数字、字母、指纹、人脸信息的候选图像数据库,所述候选图像数据库包括由第一值和第二值组成的参考数值矩阵或序列,该参考数值矩阵或序列表示参考汉字、数字、字母、指纹、人脸等信息。
步骤2:构造候选图像数据库中所有图像的原像素矩阵P对应的扩展矩阵E:
步骤3:构造候选图像数据库中所有图像的原像素矩阵P对应的亚像素矩阵S。即将原像素矩阵P进行预处理,划分成l*r块像素矩阵,再转化成原像素矩阵的l*r亚像素矩阵。l、r为正整数。
步骤4:基于扩展矩阵的扩展特征和亚像素矩阵的特征,构建原像素矩阵分类器。将汉字、数字、字母单词、指纹、人脸等候选图像数据库的原像素矩阵依据原像素矩阵分类器特征,存放于三层树形结构内,具体如下:
其中,A1,A2……Ak分别为整数,表示分别以x1~xn,y1~yn的相同为特征分类器,将扩展矩阵保存于该节点下:以扩展矩阵扩展部分相同为分类器,将对应的亚像素矩阵保存在相应的第二层节点下;以亚像素矩阵相同为分类器,将对应的原像素矩阵保存在对应的节点下,Src表示亚像素矩阵S第r行第c列的元素。r、c为正整数。
将候选图像数据库内的汉字、数字、字母单词、指纹、人脸等图像的原像素矩阵、扩展矩阵、亚像素矩阵在树节点下存储,按照A的值由大至小或者由小至大依次存放,以便根据待识别汉字、数字、字母单词、指纹、人脸等图像的扩展矩阵的A值快速搜寻对应的树节点。
步骤5:按照上面的方法对待识别的图像进行预处理,构造其原像素矩阵对应的扩展矩阵和亚像素矩阵。
步骤6:将待识别的图像的扩展矩阵的扩展部分与候选图像数据库内所有图像的扩展矩阵的扩展部分快速对比,先对比扩展部分n+1行n+1列的A,当扩展部分A相等时,再对比扩展部分的xi(i=1,2…n),yj(j=1,2…n);
当扩展部分相同时,再将待识别图像的亚像素矩阵与扩展矩阵相同的树形结构节点下候选图像数据库内图像的亚像素矩阵进行对比。
当亚像素矩阵相同时,然后将待识别图像的原像素矩阵与亚像素矩阵相同的树形结构节点下候选图像数据库内图像的原像素矩阵逐一对比,最后找出原像素矩阵全部相同的目标图像,从而识别出结果。
该搜索方法提高了信息搜素匹配度和搜索效率,节省了匹配时间,缩小了候选图像数据库的范围。
下面以一个目标汉字信息快速识别方法具体说明本发明。目标汉字信息快速识别方法包括:
将目标信息图片放大,直到图片被放大到使得图片上的信息由像素单位组成的,随后将白色像素设置为第一值而且将非白色像素设置为第二值,以得到由第一值和第二值组成的图片数值矩阵或序列(在本发明实施例中将白色像素的设置为0,非白色像素的设置为1,这样等于整张图片上的信息是由许多的0和1有规则排序成二维数组显示出来的)。
一方面,建立用于识别汉字的数据库,所述数据库包括由第一值和第二值组成的参考数值矩阵或序列,该参考数值矩阵或序列表示参考汉字信息。这种目标图像信息进行了第一轮扩展矩阵扩展部分快速对比,剔除了大量不必要的详尽对比识别,提高了信息搜素匹配度和搜素效率,节省了匹配时间。
在本发明实施例中,将这些0和1通过放大图片的方式一个一个找出来,对于目标信息,只需要识别汉字,所以本发明将建立专门的字库,通过识别图片上的信息,跟字库中的汉字进行对比,然后读取出相对应的信息,这样就可以提取出图片中的信息。
以上所述,仅为本发明的较佳实施例,并非对本发明任何形式上和实质上的限制,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还将可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。凡熟悉本专业的技术人员,在不脱离本发明的精神和范围的情况下,当可利用以上所揭示的技术内容而做出的些许更动、修饰与演变的等同变化,均为本发明的等效实施例;同时,凡依据本发明的实质技术对上述实施例所作的任何等同变化的更动、修饰与演变,均仍属于本发明的技术方案的范围内。
Claims (3)
1.一种基于扩展与亚像素矩阵结合的图像快速识别方法,其特征在于,包括如下步骤:
步骤1:对所有图像进行预处理,构造候选图像数据库;
步骤2:构造候选图像数据库中所有图像的原像素矩阵对应的扩展矩阵;
步骤3:构造候选图像数据库中所有图像的原像素矩阵对应的亚像素矩阵;
步骤4:基于扩展矩阵的扩展特征和亚像素矩阵的特征,构建原像素矩阵分类器;将图像数据库内所有图像的原像素矩阵依据原像素矩阵分类器的特征,存放于树形结构内,以便搜索识别时按照原像素矩阵分类器的特征进行匹配搜索;
步骤5:对待识别图像进行预处理,形成待识别图像的原像素矩阵;并构造待识别图像的原像素矩阵对应的扩展矩阵、亚像素矩阵;
步骤6:将待识别图像的扩展矩阵的扩展部分与候选图像数据库内所有图像的扩展矩阵的扩展部分进行对比;
当扩展部分相同时,再将待识别图像的亚像素矩阵与扩展矩阵相同的树形结构节点下候选图像数据库内图像的亚像素矩阵进行对比;
当亚像素矩阵相同时,进一步将待识别图像的原像素矩阵与亚像素矩阵相同的树形结构节点下候选图像数据库内图像的原像素矩阵逐一对比,最后找出原像素矩阵全部相同的目标图像,从而识别出结果。
2.如权利要求1所述的一种基于扩展与亚像素矩阵结合的图像快速识别方法,其特征在于:所述步骤1中,预处理包括如下步骤:
步骤1.1:将纸面上的图像的灰度变换成电信号,输入到计算机中去;
步骤1.2:对变换后的电信号消除各种因素所造成的噪音和干扰,进行大小、偏转、浓淡、粗细方面的正规化处理;
步骤1.3:将处理后的图像放大,直到图像上的信息由像素单位组成;将白色像素设置为第一值、非白色像素设置为第二值,得到由第一值和第二值组成的图像数值矩阵或序列,即为图像的原像素矩阵。
3.如权利要求1或2所述的一种基于扩展与亚像素矩阵结合的图像快速识别方法,其特征在于:所述步骤1中,图像包括但不限于汉字、数字、字母单词、指纹、人脸。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810767195.0A CN109325138B (zh) | 2018-07-12 | 2018-07-12 | 一种基于扩展与亚像素矩阵结合的图像快速识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810767195.0A CN109325138B (zh) | 2018-07-12 | 2018-07-12 | 一种基于扩展与亚像素矩阵结合的图像快速识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109325138A CN109325138A (zh) | 2019-02-12 |
CN109325138B true CN109325138B (zh) | 2022-07-15 |
Family
ID=65263721
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810767195.0A Expired - Fee Related CN109325138B (zh) | 2018-07-12 | 2018-07-12 | 一种基于扩展与亚像素矩阵结合的图像快速识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109325138B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111814781B (zh) * | 2019-04-11 | 2024-08-27 | 富士通株式会社 | 用于对图像块识别结果进行校正的方法、设备和存储介质 |
CN110852340A (zh) * | 2019-09-16 | 2020-02-28 | 上海电机学院 | 一种扩展矩阵与亚像素矩阵结合的彩色图像识别方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101207405A (zh) * | 2007-12-14 | 2008-06-25 | 西安华迅微电子有限公司 | 一种伪码序列的捕获方法 |
CN102737254A (zh) * | 2012-06-15 | 2012-10-17 | 常州南京大学高新技术研究院 | 一种标志图像的识别方法 |
CN105913218A (zh) * | 2016-04-01 | 2016-08-31 | 上海电机学院 | 电子发票开具报销方法以及电子发票报销信息提取方法 |
CN106778563A (zh) * | 2016-12-02 | 2017-05-31 | 江苏大学 | 一种基于空间连贯特征的快速任意姿态人脸表情识别方法 |
CN107392212A (zh) * | 2017-07-19 | 2017-11-24 | 上海电机学院 | 一种图像信息快速识别方法 |
CN107527047A (zh) * | 2017-09-25 | 2017-12-29 | 曾传德 | 有利于提高分析速度的辨识系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI467498B (zh) * | 2011-12-19 | 2015-01-01 | Ind Tech Res Inst | 影像識別方法及系統 |
-
2018
- 2018-07-12 CN CN201810767195.0A patent/CN109325138B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101207405A (zh) * | 2007-12-14 | 2008-06-25 | 西安华迅微电子有限公司 | 一种伪码序列的捕获方法 |
CN102737254A (zh) * | 2012-06-15 | 2012-10-17 | 常州南京大学高新技术研究院 | 一种标志图像的识别方法 |
CN105913218A (zh) * | 2016-04-01 | 2016-08-31 | 上海电机学院 | 电子发票开具报销方法以及电子发票报销信息提取方法 |
CN106778563A (zh) * | 2016-12-02 | 2017-05-31 | 江苏大学 | 一种基于空间连贯特征的快速任意姿态人脸表情识别方法 |
CN107392212A (zh) * | 2017-07-19 | 2017-11-24 | 上海电机学院 | 一种图像信息快速识别方法 |
CN107527047A (zh) * | 2017-09-25 | 2017-12-29 | 曾传德 | 有利于提高分析速度的辨识系统 |
Non-Patent Citations (1)
Title |
---|
遥感影像亚像素快速配准方法;周靖鸿等;《测绘工程》;20160731;第25卷(第7期);71-77 * |
Also Published As
Publication number | Publication date |
---|---|
CN109325138A (zh) | 2019-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6151423A (en) | Character recognition with document orientation determination | |
EP2545492B1 (en) | Document page segmentation in optical character recognition | |
Singh et al. | Offline script identification from multilingual indic-script documents: a state-of-the-art | |
Althobaiti et al. | A survey on Arabic optical character recognition and an isolated handwritten Arabic character recognition algorithm using encoded freeman chain code | |
Rosyda et al. | A review of various handwriting recognition methods | |
Shehu et al. | Character recognition using correlation & hamming distance | |
Ayesh et al. | A robust line segmentation algorithm for Arabic printed text with diacritics | |
CN109325138B (zh) | 一种基于扩展与亚像素矩阵结合的图像快速识别方法 | |
Moussa et al. | Fractal-based system for Arabic/Latin, printed/handwritten script identification | |
Khan et al. | A holistic approach to Urdu language word recognition using deep neural networks | |
Sharma et al. | A deep cnn model for student learning pedagogy detection data collection using ocr | |
Aravinda et al. | Template matching method for Kannada handwritten recognition based on correlation analysis | |
Xue | Optical character recognition | |
Kumar et al. | Handwritten character recognition using machine learning | |
Halder et al. | Individuality of isolated Bangla characters | |
Joshi et al. | Combination of multiple image features along with KNN classifier for classification of Marathi Barakhadi | |
Jia et al. | Grayscale-projection based optimal character segmentation for camera-captured faint text recognition | |
Madan Kumar et al. | Text extraction from business cards and classification of extracted text into predefined classes | |
Joseph | Advanced digital image processing technique based optical character recognition of scanned document | |
Hirata et al. | Comics image processing: learning to segment text | |
Choudhury et al. | Recognition of handwritten Bangla numerals using adaptive coefficient matching technique | |
Halder et al. | Individuality of Bangla numerals | |
He et al. | Chinese character recognition in natural scenes | |
Chanda et al. | Font identification—In context of an Indic script | |
Chandolikar et al. | Devanagari Characters Recognition: Extracting Best Match for Photographed Text. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220715 |
|
CF01 | Termination of patent right due to non-payment of annual fee |