CN114529912A - 图形验证码识别方法、装置、电子设备及可读存储介质 - Google Patents
图形验证码识别方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN114529912A CN114529912A CN202210111754.9A CN202210111754A CN114529912A CN 114529912 A CN114529912 A CN 114529912A CN 202210111754 A CN202210111754 A CN 202210111754A CN 114529912 A CN114529912 A CN 114529912A
- Authority
- CN
- China
- Prior art keywords
- icon
- clicked
- image
- standard
- pixels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/04817—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04845—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供了一种图形验证码识别方法、装置、电子设备及可读存储介质。本发明实施例基于深度学习训练的目标检测模型,可以快速从待点击区域图像中提取待点击图标的外框的坐标信息,进而可以提取各待点击图标,然后根据相似度确定各标准图标对应的待点击图标,并根据标准图标的排列顺序,依次点击各标准图标对应的待点击图标。上述识别方式,避免了进行大规模图像标注与分类,减少标注工作量,节约实施难度且可广泛应用于图形点击验证码存在的众多生产情景之中。
Description
技术领域
本发明涉及验证码识别技术领域,特别是涉及一种点击类图形验证码识别方法、装置、电子设备及可读存储介质备。
背景技术
当前,众多网站在进行访问、查询过程中均会使用验证码方式对是否为真实人工操作进行合规验证。
图形点击类验证码是最为常见的验证码形式之一,是根据图例中图标的顺序,顺序点击待点击图案背景图中对应的图标位置,完成验证码验证过程。
现有的图形点击验证码识别方案,需要通过计算机视觉算法、机器学习检测模型对图例中图像进行检测分类,同时对待点击区域进行检测及分类,再根据图例部分检测结果的检测框位置及类别对比待点击区域检测到图标位置及分类进行顺序点击,从而完成验证过程。
但是,上述图形点击类验证码的验证过程对分类所需的数据标注需求量较大,且由于验证码图案经常实时更新,而在图标库更新图标时都需要对算法或模型进行同步更新,使得现有图形点击类验证码的识别方式实用性不佳。
发明内容
鉴于上述问题,提出了本发明以便提供解决上述问题或者至少部分地解决上述问题的一种图形验证码识别方法、装置、电子设备及可读存储介质。
第一方面,本发明实施例提供了一种图形验证码识别方法,所述方法包括:
从验证码图像中分割出图例图像及待点击区域图像;
提取所述图例图像中的各标准图标,并确定各所述标准图标的排列顺序;
将所述待点击区域图像输入目标检测模型,输出目标坐标信息;所述目标检测模型用于根据待点击区域图像,确定待点击图标的外框所在图像位置的坐标信息;
根据所述目标坐标信息,从所述验证码图像中抠取待点击图标;
根据相似度,确定每个所述标准图标对应的所述待点击图标;
按照所述排列顺序,依次点击各所述标准图标对应的所述待点击图标。
可选地,所述的图形验证码识别方法中,根据相似度,确定每个所述标准图标对应的所述待点击图标,包括:
提取所述标准图标的第一特征向量与所述待点击图标的第二特征向量;
针对每个所述标准图标,计算所述第一特征向量与所述第二特征向量之间的相似度;
将与所述第一特性向量相似度最高的所述第二特性向量所属的待点击图标,确定为所述标准图标对应的所述待点击图标。
可选地,所述的图形验证码识别方法中,提取所述标准图标的第一特征向量与所述待点击图标的第二特征向量,包括:
采用采用权值共享的卷积神经网络,分别提取所述标准图标的特征为一维的第一特征向量、以及提取所述待点击图标的特征为一维的第二特征向量。
可选地,所述的图形验证码识别方法中,提取所述图例图像中的各标准图标,并确定各所述标准图标的排列顺序,包括:
从验证码图像中整体抠取图例图像;
从左至右按列对所述图例图像进行像素值扫描;
依次将第一列像素和第二列像素之间的图像,记录为一个标准图标;所述第一列像素包括黑色像素,且所述第一列像素的前一个列像素不包括黑色像素;所述第二列像素为位于所述第一列像素右侧的首个整列为白色像素的列像素;
根据记录结果,从所述图例图像中切割各所述标准图标,并根据切割顺序进行排序。
可选地,所述的图形验证码识别方法中,计算所述第一特征向量与所述第二特征向量之间的相似度,包括:
利用余弦相似度计算所述第一特征向量与所述第二特征向量之间的相似度。
可选地,所述的图形验证码识别方法中,所述目标检测模型预先由YOLOv5s模型训练获得。
第二方面,本发明实施例提供了一种图形验证码识别装置,所述装置包括:
分割模块,用于从验证码图像中分割出图例图像及待点击区域图像;
第一提取模块,用于提取所述图例图像中的各标准图标,并确定各所述标准图标的排列顺序;
检测模块,用于将所述待点击区域图像输入目标检测模型,输出目标坐标信息;所述目标检测模型用于根据待点击区域图像,确定待点击图标的外框所在图像位置的坐标信息;
第二提取模块,用于根据所述目标坐标信息,从所述验证码图像中抠取待点击图标;
匹配模块,用于根据相似度,确定每个所述标准图标对应的所述待点击图标;
点击模块,用于按照所述排列顺序,依次点击各所述标准图标对应的所述待点击图标。
可选地,所述的装置中,所述匹配模块包括:
特征向量提取单元,用于提取所述标准图标的第一特征向量与所述待点击图标的第二特征向量;
相似度计算单元,用于针对每个所述标准图标,计算所述第一特征向量与所述第二特征向量之间的相似度;
确定单元,用于将与所述第一特性向量相似度最高的所述第二特性向量所属的待点击图标,确定为所述标准图标对应的所述待点击图标。
可选地,所述的装置中,所述第一提取模块包括:
扫描单元,用于从左至右按列对所述图例图像进行像素值扫描;
记录单元,用于依次将第一列像素和第二列像素之间的图像,记录为一个标准图标;所述第一列像素包括黑色像素,且所述第一列像素的前一个列像素不包括黑色像素;所述第二列像素为位于所述第一列像素右侧的首个整列为白色像素的列像素;
切割单元,用于根据记录结果,从所述图例图像中切割各所述标准图标,并根据切割顺序进行排序。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
相对于在先技术,本发明实施例具有如下优点:
本发明实施例中,从验证码图像中分割出图例图像及待点击区域图像;提取图例图像中的各标准图标,并确定各所述标准图标的排列顺序;将待点击区域图像输入目标检测模型,输出目标坐标信息;目标检测模型用于根据待点击区域图像,确定待点击图标的外框所在图像位置的坐标信息;根据目标坐标信息,从验证码图像中抠取待点击图标;根据相似度,确定每个图例图像对应的待点击图标;按照上述排列顺序,依次点击各标准图标对应的述待点击图标。因为基于深度学习训练的目标检测模型,可以快速从待点击区域图像中提取待点击图标的外框的坐标信息,进而可以提取各待点击图标,然后根据相似度确定各标准图标对应的待点击图标,并根据标准图标的排列顺序,依次点击各标准图标对应的待点击图标。上述识别方式,避免了进行大规模图像标注与分类,减少标注工作量,节约实施难度且可广泛应用于图形点击验证码存在的众多生产情景之中。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明的一种图形验证码识别方法实施例的步骤流程图;
图2示出了根据本发明实施例的执行原理图;
图3示出了根据本发明的一种图形验证码识别装置实施例的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参照图1,示出了根据本发明的一种图形验证码识别方法实施例的步骤流程图,具体可以包括步骤101~步骤106。
本发明实施例应用于终端,终端可以为移动终端、非移动终端,如手机、平板、计算机、便携电脑等办公设备。本发明实施例适用于图形点击验证码的识别。
步骤101、从验证码图像中分割出图例图像及待点击区域图像。
其中,上述验证码图像包括图例图像及待点击区域图像,上述图例图像是作为验证参考的各标准图标所在区域的整体图像,上述待点击区域图像则为待点击图标所在区域的整体图像。
其中,由于验证码图像大小固定,而图例图像在验证码图像中的位置固定,因而可以根据验证码图像的绝对位置,结合图例图像相对验证码图像的相对位置,准确判定出图例图像所在区域,并将图例图像从验证码图中分割,而剩余部分则为待点击区域图像,从而获得上述包括各标准图标的图例图像以及上述待点击区域图像。
步骤102、提取所述图例图像中的各标准图标,并确定各所述标准图标的排列顺序。
其中,上述各标准图例在上述图例图像中从左至右的位置顺序,也即各标准图例的排列顺序,因而在从验证码图像中分割出图像图像后,即可以根据各标准图例在图例图像中的位置,确定各所述标准图标的排列顺序。
步骤103、将所述验证码图像输入目标检测模型,输出目标坐标信息;所述目标检测模型用于根据待点击区域图像,确定待点击图标的外框所在图像位置的坐标信息。
其中,预先通过深度学习训练出从验证码图像中待点击区域图像检测出区别于待点击区域背景的待点击图标的高精度目标检测模型,检测结果包括待点击图标的外框所在图像位置的坐标信息,以便于后续根据检测结果将待点击区域内的各待点击图标部分进行切割。
可选地,上述目标检测模型预先通过深度学习方法,采用模型训练方式,由YOLOv5s模型训练获得。
步骤104、根据所述目标坐标信息,从所述验证码图像中抠取待点击图标。
其中,因为目标坐标信息限定了待点击图像在待点击区域图像中的位置,因而可以根据上述目标坐标信息,从验证码图像中抠取各个待点击图标,即利用检测到的图标外框将图标感兴趣区域(region of interest,ROI)进行提取。
步骤105、根据相似度,确定每个所述标准图标对应的所述待点击图标。
其中,针对各标准图标中的任一各标准图标,通过度量学习方式,计算各待点击图标与该标准图标之间的相似度,并将与该标准图标相似度最高的待点击图标确定为其对应的待点击图标。
步骤106、按照所述排列顺序,依次点击各所述标准图标对应的所述待点击图标。
其中,上述排列顺序为图例中各标准图标的顺序,因而按照上述排列顺序点击各标准图标对应的待点击图标,也即点击待点击图案背景图中与标准图标相似度最高的图标位置,从而完成验证码验证过程。具体地,按照待点击区域中对应的图标外框外置,采用RPA或Selenium等方式进行自动化点击,从而完成整个图形点击类验证码识别与自动化处理过程。
本发明实施例中,因为基于深度学习训练的目标检测模型,可以快速从待点击区域图像中提取待点击图标的外框的坐标信息,进而可以提取各待点击图标,然后根据相似度确定各标准图标对应的待点击图标,并根据标准图标的排列顺序,依次点击各标准图标对应的待点击图标。上述识别方式,避免了进行大规模图像标注与分类,减少标注工作量,节约实施难度且可广泛应用于图形点击验证码存在的众多生产情景之中。
可选地,在一种实施方式中,上述步骤102具体包括步骤201~步骤203。
步骤201、从左至右按列对所述图例图像进行像素值扫描。
其中,按列扫描的方式从左至右对所分割出的图例图像进行像素值扫描,以判定整列像素的像素情况,进而判定是否抵达相应标准图标外框所在位置。
步骤202、依次将第一列像素和第二列像素之间的图像,记录为一个标准图标;所述第一列像素包括黑色像素,且所述第一列像素的前一个列像素不包括黑色像素;所述第二列像素为位于所述第一列像素右侧的首个整列为白色像素的列像素。
其中,当列像素中遇到首个黑色像素开始记录,若遇到整列均为白色像素则停止,记录为一个图例图标;然后继续对图例图像的未进行像素值扫描的部分从左至右按列进行像素值扫描,并在列像素中遇到首个黑色像素开始记录,若遇到整列均为白色像素则停止,记录为一个图例图标,直至完成对整个图例图像的像素值扫描。
其中,因为首个黑色像素即相应标准图例左侧外框所在位置,首次遇到整列均为白色像素即该标准图例右侧外框所在位置,通过上述方法完成对图例中各标准图标位置的确定,进而将图例图标中的各标准图标进行切割。
步骤203、根据记录结果,从所述图例图像中切割各所述标准图标,并根据切割顺序进行排序。
其中,因为上述记录结果记录了标准图标左侧外框所在位置及右侧外框所在位置,所以根据上述记录结果,可以按从左至右的顺序将图例图像中各标准图标进行切割;同时,因为是从左至右进行切割,而图形验证码的验证方式即是从左至右依次点击图例图像中各标准图例对应的待点击图标,因而可以直接根据切割的先后顺序对各标准图标进行排序。
本实施方式中,利用计算机图形学相关原理对图例图像的各标准图标进行分割,并可以直接根据切割的先后顺序快速实现对各标准图标进行排序,便于后续进行图标的点击验证。
可选地,在一种实施方式中,上述步骤105包括步骤501~步骤503。
步骤501、提取所述标准图标的第一特征向量与所述待点击图标的第二特征向量。
其中,依次将切割出的标准图标与待点击图标使用同一个自定义卷积神经网络(CNN)提取特征向量,从而获得上述标准图标的第一特征向量及待点击图标的第二特性向量。
可选地,上述步骤501中,采用采用权值共享的卷积神经网络,分别提取所述标准图标的特征为一维的第一特征向量、以及提取所述待点击图标的特征为一维的第二特征向量,也即从标准图标提取特征为一维向量与从待点击图标提取特性为一维的第二特征向量的卷积神经网络为孪生网络,既保证特征提取方式的一致性,减小特征提取方式对相似度判断带来不利影响,可以快速提取各图标的特性向量,又极大地减少了后续相似度计算过程的运算量。
步骤502、针对每个所述标准图标,计算所述第一特征向量与所述第二特征向量之间的相似度。
其中,标准图标的特征向量与待点击图标的特征向量之间通过度量学习方式计算相似度,并根据标准图例顺序,依次将每个标准图标与待点击区域的待点击图标进行相似度匹配,判断出各待点击图标与标准图标匹配的可能性。
可选地,上述步骤502中,利用余弦相似度计算所述第一特征向量与所述第二特征向量之间的相似度。
步骤503、将与所述第一特性向量相似度最高的所述第二特性向量所属的待点击图标,确定为所述标准图标对应的所述待点击图标。
其中,与第一特性向量相似度最高的第二特性向量所属的待点击图标,也即是与标准图标相似度最高的待点击图标,因而可以将该待点击图标判定为该标准图标对应的待点击图标。
该实施方式中,分别将切割出的标准图例与待点击图标使用权值共享的同一个自定义卷积神经网络(CNN)提取特征为一维向量,并利用余弦相似度计算标准图标与待点击图标之间的相似度,可以快速、准确地完成标准图标与各待点击图标的相似度匹配。
请参阅图2,示出了本发明实施例所提供的图形验证码识别方法的执行原理图。
图2所示,在步骤21中,先通过点选图标输入的方式,触发进入步骤22,执行图像验证码识别即;
在步骤22中,根据验证码图像的绝对位置,结合图例图像相对验证码图像的相对位置,准确判定出图例图像所在区域,进而将图例图像及待点击区域图像从验证码图中分割;
在步骤23中,利用计算机图形学相关原理对图例图像的各标准图标进行分割,获得各标准图标;
在步骤24中,对于待点击区域图像,利用由YOLOv5s模型训练获得的目标检测模型进行图案检测,检测背景图中待点击图标的位置,然后进入步骤25;
在步骤25中,利用检测到的图标外框位置提取在背景图中,将图标ROI(感兴趣区域)部分进行提取;
在步骤26及27中,分别将切割出的标准图例与待点击图标使用权值共享的同一个自定义卷积神经网络(CNN)提取特征为一维向量;
在步骤28中,利用余弦相似度计算标准图标的特征向量与待点击图标的特征向量之间的相似度;
在步骤29中,按照各标准图标上述排列顺序点击各标准图标对应的待点击图标,也即点击待点击图案背景图中与标准图标相似度最高的图标位置,从而完成整个图形点击类验证码识别与自动化处理过程。
综上所述,本发明实施例所提供的图形验证码识别方法,基于深度学习训练的目标检测模型,可以快速从待点击区域图像中提取待点击图标的外框的坐标信息,进而可以提取各待点击图标,然后根据相似度确定各标准图标对应的待点击图标,并根据标准图标的排列顺序,依次点击各标准图标对应的待点击图标。上述识别方式,避免了进行大规模图像标注与分类,减少标注工作量,节约实施难度且可广泛应用于图形点击验证码存在的众多生产情景之中。
参照图3,示出了根据本发明的一种图形验证码识别装置实施例的结构框图,该图形验证码识别装置30包括:
分割模块31,用于从验证码图像中分割出图例图像及待点击区域图像;
第一提取模块32,用于提取所述图例图像中的各标准图标,并确定各所述标准图标的排列顺序;
检测模块33,用于将所述待点击区域图像输入目标检测模型,输出目标坐标信息;所述目标检测模型用于根据待点击区域图像,确定待点击图标的外框所在图像位置的坐标信息;
第二提取模块34,用于根据所述目标坐标信息,从所述验证码图像中抠取待点击图标;
匹配模块35,用于根据相似度,确定每个所述标准图标对应的所述待点击图标;
点击模块36,用于按照所述排列顺序,依次点击各所述标准图标对应的所述待点击图标。
根据本发明的一种图形验证码识别装置,因为基于深度学习训练的目标检测模型,可以快速从待点击区域图像中提取待点击图标的外框的坐标信息,进而可以提取各待点击图标,然后根据相似度确定各标准图标对应的待点击图标,并根据标准图标的排列顺序,依次点击各标准图标对应的待点击图标。上述识别方式,避免了进行大规模图像标注与分类,减少标注工作量,节约实施难度且可广泛应用于图形点击验证码存在的众多生产情景之中。
可选地,所述的装置中,所述匹配模块35包括:
特征向量提取单元,用于提取所述标准图标的第一特征向量与所述待点击图标的第二特征向量;
相似度计算单元,用于针对每个所述标准图标,计算所述第一特征向量与所述第二特征向量之间的相似度;
确定单元,用于将与所述第一特性向量相似度最高的所述第二特性向量所属的待点击图标,确定为所述标准图标对应的所述待点击图标。
可选地,所述的装置中,所述第一提取模块32包括:
扫描单元,用于从左至右按列对所述图例图像进行像素值扫描;
记录单元,用于依次将第一列像素和第二列像素之间的图像,记录为一个标准图标;所述第一列像素包括黑色像素,且所述第一列像素的前一个列像素不包括黑色像素;所述第二列像素为位于所述第一列像素右侧的首个整列为白色像素的列像素;
切割单元,用于根据记录结果,从所述图例图像中切割各所述标准图标,并根据切割顺序进行排序。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
可选地,本申请实施例还提供一种电子设备,包括处理器,存储器,存储在存储器上并可在所述处理器上运行的程序或指令,该程序或指令被处理器执行时实现上述图形验证码识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要注意的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述图形验证码识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述图形验证码识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以基于此示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的文件下载设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (11)
1.一种图形验证码识别方法,其特征在于,所述方法包括:
从验证码图像中分割出图例图像及待点击区域图像;
提取所述图例图像中的各标准图标,并确定各所述标准图标的排列顺序;
将所述待点击区域图像输入目标检测模型,输出目标坐标信息;所述目标检测模型用于根据待点击区域图像,确定待点击图标的外框所在图像位置的坐标信息;
根据所述目标坐标信息,从所述验证码图像中抠取待点击图标;
根据相似度,确定每个所述标准图标对应的所述待点击图标;
按照所述排列顺序,依次点击各所述标准图标对应的所述待点击图标。
2.根据权利要求1所述的图形验证码识别方法,其特征在于,根据相似度,确定每个所述标准图标对应的所述待点击图标,包括:
提取所述标准图标的第一特征向量与所述待点击图标的第二特征向量;
针对每个所述标准图标,计算所述第一特征向量与所述第二特征向量之间的相似度;
将与所述第一特性向量相似度最高的所述第二特性向量所属的待点击图标,确定为所述标准图标对应的所述待点击图标。
3.根据权利要求2所述的图形验证码识别方法,其特征在于,提取所述标准图标的第一特征向量与所述待点击图标的第二特征向量,包括:
采用采用权值共享的卷积神经网络,分别提取所述标准图标的特征为一维的第一特征向量、以及提取所述待点击图标的特征为一维的第二特征向量。
4.根据权利要求1所述的图形验证码识别方法,其特征在于,提取所述图例图像中的各标准图标,并确定各所述标准图标的排列顺序,包括:
从左至右按列对所述图例图像进行像素值扫描;
依次将第一列像素和第二列像素之间的图像,记录为一个标准图标;所述第一列像素包括黑色像素,且所述第一列像素的前一个列像素不包括黑色像素;所述第二列像素为位于所述第一列像素右侧的首个整列为白色像素的列像素;
根据记录结果,从所述图例图像中切割各所述标准图标,并根据切割顺序进行排序。
5.根据权利要求2所述的图形验证码识别方法,其特征在于,计算所述第一特征向量与所述第二特征向量之间的相似度,包括:
利用余弦相似度计算所述第一特征向量与所述第二特征向量之间的相似度。
6.根据权利要求1所述的图形验证码识别方法,其特征在于,所述目标检测模型预先由YOLOv5s模型训练获得。
7.一种图形验证码识别装置,其特征在于,所述装置包括:
分割模块,用于从验证码图像中分割出图例图像及待点击区域图像;
第一提取模块,用于提取所述图例图像中的各标准图标,并确定各所述标准图标的排列顺序;
检测模块,用于将所述待点击区域图像输入目标检测模型,输出目标坐标信息;所述目标检测模型用于根据待点击区域图像,确定待点击图标的外框所在图像位置的坐标信息;
第二提取模块,用于根据所述目标坐标信息,从所述验证码图像中抠取待点击图标;
匹配模块,用于根据相似度,确定每个所述标准图标对应的所述待点击图标;
点击模块,用于按照所述排列顺序,依次点击各所述标准图标对应的所述待点击图标。
8.根据权利要求7所述的装置,其特征在于,所述匹配模块包括:
特征向量提取单元,用于提取所述标准图标的第一特征向量与所述待点击图标的第二特征向量;
相似度计算单元,用于针对每个所述标准图标,计算所述第一特征向量与所述第二特征向量之间的相似度;
确定单元,用于将与所述第一特性向量相似度最高的所述第二特性向量所属的待点击图标,确定为所述标准图标对应的所述待点击图标。
9.根据权利要求7所述的装置,其特征在于,所述第一提取模块包括:
扫描单元,用于从左至右按列对所述图例图像进行像素值扫描;
记录单元,用于依次将第一列像素和第二列像素之间的图像,记录为一个标准图标;所述第一列像素包括黑色像素,且所述第一列像素的前一个列像素不包括黑色像素;所述第二列像素为位于所述第一列像素右侧的首个整列为白色像素的列像素;
切割单元,用于根据记录结果,从所述图例图像中切割各所述标准图标,并根据切割顺序进行排序。
10.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1~6任一所述的图形验证码识别方法的步骤。
11.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1~6任一所述的图形验证码识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210111754.9A CN114529912A (zh) | 2022-01-29 | 2022-01-29 | 图形验证码识别方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210111754.9A CN114529912A (zh) | 2022-01-29 | 2022-01-29 | 图形验证码识别方法、装置、电子设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114529912A true CN114529912A (zh) | 2022-05-24 |
Family
ID=81623492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210111754.9A Pending CN114529912A (zh) | 2022-01-29 | 2022-01-29 | 图形验证码识别方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114529912A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118210418A (zh) * | 2024-03-12 | 2024-06-18 | 湖南蚁坊软件股份有限公司 | 点选生僻字验证码破解方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101196994A (zh) * | 2007-12-26 | 2008-06-11 | 腾讯科技(深圳)有限公司 | 图片内容识别方法及识别系统 |
CN101663672A (zh) * | 2007-02-21 | 2010-03-03 | 维杜普有限责任公司 | 用于图形图像认证的方法和系统 |
CN107273890A (zh) * | 2017-05-26 | 2017-10-20 | 亿海蓝(北京)数据技术股份公司 | 针对字符组合的图形验证码识别方法及装置 |
CN112035821A (zh) * | 2020-09-04 | 2020-12-04 | 平安科技(深圳)有限公司 | 图形验证码识别方法、装置、计算机设备及存储介质 |
CN112487394A (zh) * | 2020-11-30 | 2021-03-12 | 携程旅游网络技术(上海)有限公司 | 图形推理验证码识别方法、系统、设备及介质 |
-
2022
- 2022-01-29 CN CN202210111754.9A patent/CN114529912A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101663672A (zh) * | 2007-02-21 | 2010-03-03 | 维杜普有限责任公司 | 用于图形图像认证的方法和系统 |
CN101196994A (zh) * | 2007-12-26 | 2008-06-11 | 腾讯科技(深圳)有限公司 | 图片内容识别方法及识别系统 |
CN107273890A (zh) * | 2017-05-26 | 2017-10-20 | 亿海蓝(北京)数据技术股份公司 | 针对字符组合的图形验证码识别方法及装置 |
CN112035821A (zh) * | 2020-09-04 | 2020-12-04 | 平安科技(深圳)有限公司 | 图形验证码识别方法、装置、计算机设备及存储介质 |
WO2021159802A1 (zh) * | 2020-09-04 | 2021-08-19 | 平安科技(深圳)有限公司 | 图形验证码识别方法、装置、计算机设备及存储介质 |
CN112487394A (zh) * | 2020-11-30 | 2021-03-12 | 携程旅游网络技术(上海)有限公司 | 图形推理验证码识别方法、系统、设备及介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118210418A (zh) * | 2024-03-12 | 2024-06-18 | 湖南蚁坊软件股份有限公司 | 点选生僻字验证码破解方法、装置、设备及存储介质 |
CN118210418B (zh) * | 2024-03-12 | 2025-02-14 | 湖南蚁坊软件股份有限公司 | 点选生僻字验证码破解方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111259889B (zh) | 图像文本识别方法、装置、计算机设备及计算机存储介质 | |
CN109948507B (zh) | 用于检测表格的方法和装置 | |
CN109815770B (zh) | 二维码检测方法、装置及系统 | |
US9349076B1 (en) | Template-based target object detection in an image | |
CN109960742B (zh) | 局部信息的搜索方法及装置 | |
CN108154105B (zh) | 水下生物检测与识别方法、装置、服务器及终端设备 | |
CN109886928B (zh) | 一种目标细胞标记方法、装置、存储介质及终端设备 | |
CN112101386B (zh) | 文本检测方法、装置、计算机设备和存储介质 | |
CN110738030A (zh) | 表格重建方法、装置、电子设备及存储介质 | |
CN112767354B (zh) | 基于图像分割的缺陷检测方法、装置、设备及存储介质 | |
US12154261B2 (en) | Image defect detection method, electronic device and readable storage medium | |
CN110399760A (zh) | 一种批量二维码定位方法、装置、电子设备及存储介质 | |
CN111738252B (zh) | 图像中的文本行检测方法、装置及计算机系统 | |
CN113449538A (zh) | 视觉模型的训练方法、装置、设备及存储介质 | |
CN115690051A (zh) | Pcb缺陷检测方法、装置、计算机设备及存储介质 | |
CN113269752A (zh) | 一种图像检测方法、装置终端设备及存储介质 | |
CN112084874A (zh) | 一种物体检测方法、装置及终端设备 | |
CN110516731B (zh) | 一种基于深度学习的视觉里程计特征点检测方法及系统 | |
CN114596243A (zh) | 缺陷检测方法、装置、设备及计算机可读存储介质 | |
CN116071405A (zh) | 一种锂电池表面丝网印刷图像配准的方法及装置 | |
CN114529912A (zh) | 图形验证码识别方法、装置、电子设备及可读存储介质 | |
CN110321869A (zh) | 基于多尺度融合网络的人员检测和提取方法 | |
Tang et al. | Image dataset creation and networks improvement method based on CAD model and edge operator for object detection in the manufacturing industry | |
JP7396076B2 (ja) | 番号認識装置、方法及び電子機器 | |
CN117788444A (zh) | Smt贴片偏移检测方法、装置及视觉检测系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |