CN111489283B - 图片格式转换方法、装置及计算机存储介质 - Google Patents
图片格式转换方法、装置及计算机存储介质 Download PDFInfo
- Publication number
- CN111489283B CN111489283B CN201910075931.0A CN201910075931A CN111489283B CN 111489283 B CN111489283 B CN 111489283B CN 201910075931 A CN201910075931 A CN 201910075931A CN 111489283 B CN111489283 B CN 111489283B
- Authority
- CN
- China
- Prior art keywords
- picture
- format
- converted
- point
- pictures
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 120
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000002372 labelling Methods 0.000 claims abstract description 40
- 238000012549 training Methods 0.000 claims description 105
- 238000012795 verification Methods 0.000 claims description 92
- 238000013507 mapping Methods 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 2
- 238000013136 deep learning model Methods 0.000 abstract description 11
- 238000013135 deep learning Methods 0.000 abstract description 8
- 230000008569 process Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 9
- 238000013473 artificial intelligence Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32144—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
- H04N1/32149—Methods relating to embedding, encoding, decoding, detection or retrieval operations
- H04N1/32267—Methods relating to embedding, encoding, decoding, detection or retrieval operations combined with processing of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
本发明提出一种图片格式转换方法,用于转换图片的格式。该方法包括如下步骤:标注待转换图片;获取标注后的待转换图片;判断标注后的待转换图片的标注部位是否为正四边形;若是,则将待转换图片根据预设的第一转换规则进行图片格式转换;若否,则将待转换图片根据预设的第二转换规则进行图片格式转换。本发明还对应提供了一种图片格式转换装置和计算机存储介质。利用上述图片格式转换方法和装置,将用于AI深度学习的图片进行格式转换,使其兼容深度学习模型,得到准确度更高的用于深度学习的网络模型。
Description
技术领域
本发明涉及数据处理技术领域,特别是一种图片格式转换方法、装置及计算机存储介质。
背景技术
随着现代社会的发展,使得计算机技术以及相应的软件产品一直处于增长的状态。各行各业在生产过程中均需要使用软件产品,面对庞大的软件产品需求。例如,在人工智能(AI)开发中,后端使用深度学习模型进行训练,训练使用的资料需要统一格式。软件之间的处理对象的格式相容性成为各行各业所需要解决的问题。
发明内容
鉴于上述状况,有必要提供一种图片格式转换方法、装置及计算机存储介质,通过转换图片标注格式使之兼容深度学习模型训练的软件,以解决上述问题。
本发明第一方面提供了一种图片格式转换方法,用于转换图片的格式,所述图片格式转换方法包括如下步骤:标注待转换图片;获取标注后的所述待转换图片;判断标注后的所述待转换图片的标注部位是否为正四边形;若是,则将所述待转换图片根据预设的第一转换规则进行图片格式转换;若否,则将所述待转换图片根据预设的第二转换规则进行图片格式转换。
优选的,所述第一转换规则为标注所述待换转图片的标注部位的其中一个点的坐标得到第一格式的点坐标值,根据预设的第一映射关系表将所述第一格式的点坐标值转换为第二格式的点坐标值,所述第一映射关系表中设置有所述第一格式的一个点坐标与所述第二格式的至少两个点坐标的转换关系;所述第二格式中所述至少两个点坐标是通过所述第一格式点坐标中X坐标、Y坐标以及标注部分宽度、高度得到的。
优选的,所述第二转换规则为标注所述待转换图片的至少四个点的坐标值得到第一格式的点坐标,根据预设的第二映射关系表将所述第一格式的点坐标转换为第二格式的点坐标,所述第二映射关系表中设置有所述第一格式的至少四个点的点坐标值的记录方式及将所述第一格式的点坐标转换为所述第二格式的点坐标后所述四个点的点坐标值的记录方式;所述第一格式的至少四个点的坐标排列方式为先记录所述至少四个点的X坐标,再记录所述至少四个点的Y坐标;转换为所述第二格式后,所述至少四个点的点坐标的排列方式为依次记录每个点的X坐标、Y坐标。
优选的,所述标注待转换图片之前,还包括如下步骤:获取所有所述待转化图片;分配所述待转化图片为训练图片和验证图片,并将所述训练图片和所述验证图片分别存储于训练文件和验证文件;分别标注所述训练图片和所述验证图片。
优选的,所述分别标注所述训练图片和所述验证图片,包括如下步骤:分批标注所述训练图片和所述验证图片,每批标注后的图片形成一子文件;将多个所述子文件进行去噪后分别合并为一个训练目标文件和验证目标文件。
本发明第二方面提供了一种图片格式转换装置,用于转换图片的格式,所述图片格式转换装置包括:处理器;以及存储器,所述存储器中存储有多个程序模块,多个所述程序模块由所述处理器运行并执行如下步骤:标注待转换图片;获取标注后的所述待转换图片;判断标注后的所述待转换图片的标注部位是否为正四边形;若是,则将所述待转换图片根据预设的第一转换规则进行图片格式转换;若否,则将所述待转换图片根据预设的第二转换规则进行图片格式转换。
优选地,所述第一转换规则为标注所述待换转图片的标注部位的其中一个点的坐标得到第一格式的点坐标值,根据预设的第一映射关系表将所述第一格式的点坐标值转换为第二格式的点坐标值,所述第一映射关系表中设置有所述第一格式的一个点坐标与所述第二格式的至少两个点坐标的转换关系;所述第二格式中所述至少两个点坐标是通过所述第一格式点坐标中X坐标、Y坐标以及标注部分宽度、高度得到的。
优选地,所述第二转换规则为标注所述待转换图片的至少四个点的坐标值得到第一格式的点坐标,根据预设的第二映射关系表将所述第一格式的点坐标转换为第二格式的点坐标,所述第二映射关系表中设置有所述第一格式的至少四个点的点坐标值的记录方式及将所述第一格式的点坐标转换为所述第二格式的点坐标后所述四个点的点坐标值的记录方式;所述第一格式的至少四个点的坐标排列方式为先记录所述至少四个点的X坐标,再记录所述至少四个点的Y坐标;转换为所述第二格式后,所述至少四个点的点坐标的排列方式为依次记录每个点的X坐标、Y坐标。
优选地,多个所述程序模块由所述处理器运行并还执行如下步骤:获取所有所述待转化图片;分配所述待转化图片为训练图片和验证图片,并将所述训练图片和所述验证图片分别存储于训练文件和验证文件;分批标注所述训练图片和所述验证图片,每批标注后的图片形成一子文件;将多个所述子文件进行去噪后分别合并为一个训练目标文件和验证目标文件。
本发明第三方面还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序代码,当所述计算机程序代码在计算设备上运行时,导致所述计算设备执行上述所述的图片格式转换方法。
本发明提供的图片格式转换方法,首先依据预设的判断规则判断标注后的训练图片和验证图片的标注部位是否正四边形。若为正四边形,则利用第一转换规则将训练图片和验证图片转换为目标格式图片;若为多边形,则利用第二转换规则将训练图片和验证图片转换为目标格式图片。本发明还对应提供了一种图片格式转换装置和计算机存储介质。利用上述图片格式转换方法和装置,将用于AI深度学习的图片进行格式转换,使其兼容深度学习模型,得到准确度更高的用于深度学习的网络模型。
附图说明
图1是本发明一个实施例中的图片格式转换装置的架构示意图。
图2是本发明一个实施例中的图片格式转换装置内的图片格式转换系统的模块示意图。
图3是本发明一个实施例中的图片格式转换方法的图片标注过程的流程示意图。
图4是本发明一个实施例中的图片格式转换方法的图片格式转换过程的流程示意图。
主要元件符号说明
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施方式及实施方式中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施方式仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施方式,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施方式的目的,不是旨在限制本发明。
本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
请参照图1,本发明提供了一种图片格式转换装置10。图1为该图片格式转换装置10的硬件架构示意图。在本实施例中,该图片格式转换装置10包括存储器100和处理器200。存储器100与处理器200之间建立通信连接关系。
存储器100用于存储图片格式转换装置10中的各种数据,例如,待转换图片、转换规则、存储路径及程序代码等。在本实施例中,存储器100可以包括但不限于只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
进一步地,本发明提供的图片格式转换装置10得到标注格式转换后的图片,主要用于AI深度学习的网络模型训练。因此,存储器100存储的待转换图片包括训练图片和验证图片。训练图片用于放入深度学习模型中对网络模型进行训练,以得到具有一定学习功能的深度学习模型。验证图片用于在深度学习训练过程中进行验证并修正权重值,以得到更准确的深度学习模型。
存储器100内存储的转换规则具体包括第一转换规则和第二转换规则。
第一转换规则具体为标注上述训练图片和验证图片的标注部分的其中一个点的坐标得到第一格式的点坐标值,根据预设的第一映射关系表将第一格式的点坐标值转换为第二格式的点坐标值。第一映射关系表中设置有第一格式的一个点坐标与第二格式的至少两个点坐标的转换关系。其中,所述第二格式中所述至少两个点坐标是通过所述第一格式点坐标中X坐标、Y坐标以及标注部分宽度、高度得到的。
第一格式的A1点的坐标信息以Bounding Box(缩写为Bbox)表示,Bbox是个能够包覆住图片中标注部位的矩形。Segmentation是一种图片标注的方式,将目标物件(object)以多边形(polygon)点坐标的方式描绘图片的轮廓外框。Bbox包覆住图片中矩形标注部位后,Segmentation对该矩形标注部位进行标注得到标注部位第一格式的其中一个点A1的坐标信息。
具体地,在本实施例中,所述第一转换规则中将第一格式的一个点(A1点)坐标转换成第二格式中四个点(B1点、B2点、B3点和B4点)对应的坐标,第一映射表如下表所示:
其中,宽度为该点所在图片的标注部分的宽度,高度为该点所在图片的标注部分的高度。
可以理解的是,第一转换规则也可以转换第二格式的B1、B2两个点或B1、B2和B3三个点。
第二转换规则具体为标注上述训练图片和验证图片的至少四个点的坐标值得到第一格式的点坐标,根据预设的第二映射关系表将第一格式的点坐标转换为第二格式的点坐标。所述第二映射关系表中设置有第一格式的至少四个点的点坐标值的记录方式及将所述第一格式的点坐标转换为第二格式的点坐标后所述至少四个点的点坐标值的记录方式。
具体地,在本实施例中,第二映射表如下表所示,第一格式中四个点的坐标排列方式为:先记录四个点(A1点、A2点、A3点和A4点)的X坐标,再记录所述四个点的Y坐标;转换为第二格式后,所述四个点(B1点、B2点、B3点和B4点)的点坐标的排列方式为依次记录每个点的X坐标、Y坐标,即,第二格式坐标的排列方式为第一点的X坐标Y坐标、第二点的X坐标Y坐标、第三点的X坐标Y坐标、第四点的X坐标Y坐标:
同理,A1、A2、A3和A4点的坐标信息先采用Bounding Box(缩写为Bbox)包覆住图片中的标注部位的矩形,再采用Segmentation对该矩形标注部位进行标注得到上述坐标信息。
在本实施例中,图片的第一格式可以但不限于适用于VIA(VGG Image Annotator)软件的图片标注格式。第二格式可以但不限于使用于MS COCO dataset(Microsoft CommonObjects in Context dataset)影像资料集的图片标注格式。COCO dataset的标注有固定的格式,所有的图片皆需转成规范的格式方能加载AI模型中训练。
存储器100内的存储路径包括标注后的子文件和目标文件对应的存储地址。标注后的子文件和目标文件将在后面进行详述。存储路径还包括训练图片和验证图片的存储文件对应的存储地址。
处理器200可以为中央处理器(CPU,Central Processing Unit)、微处理器、数字处理芯片或任何能够执行数据处理功能的处理器芯片。
请参照图2,图片格式转换装置10中还运行有一图片格式转换系统300。图片格式转换系统300内包括一个或多个程序形式的计算机指令,该一个或多个程序形式的计算机指令存储于存储器100中,并由处理器200执行。请参照图2,在实施例中,该图片格式转换系统300包括获取模块310、分配模块320、标注模块330、判断模块340、计算模块350、转换模块360和输出模块370。
获取模块310用于获取待转换的图片。待转换图片进行格式转换后用于AI深度学习模型的训练。
分配模块320用于分配上述待转换图片为训练图片和验证图片。根据预设的比例,将上述待转换的图片分为训练图片和验证图片。在具体实施例中,70%的待转换图片为训练图片,30%的待转换图片为验证图片。在其他实施例中,不限于上述分配比例。分配后的训练图片和验证图片分别存储于训练文件和验证文件内。
标注模块330用于标注上述待转换图片。具体的,针对训练图片和验证图片分别进行标注。标注的具体信息包括基本信息类、许可信息类、分类信息类、图像信息类和标注内容类。
基本信息类包括但不限于描述保存待转换图片的文件以及保存标注图片的文件的创建时间、版本和访问网址等。保存待转换图片的文件包括训练文件和验证文件。保存标注图片的文件包括分批标注待转换图片得到的子文件和合并上述子文件得到的目标文件。
许可信息类包括但不限于待转换图片的版权。
分类信息类包括但不限于待转换图片为训练图片和验证图片。
图像信息类包括但不限于图片的宽度、高度、图片命名和读取时间等。
标注内容类包括但不限于图片分类、点坐标信息、图片边界信息等。点坐标信息以Bounding Box(缩写为Bbox)表示,Bbox是个能够包覆住图片中标注部位的矩形。图片边界信息采用分割方式(Segmentation)获得。Segmentation是一种图片标注的方式,将目标物件(object)以多边形(polygon)点坐标的方式描绘图片的轮廓外框。
上述标注的具体信息是固定且需预先定义的信息。基本信息类、许可信息类和图像信息类一起作为转换基础,并独立成一个档案,成为基础档案(OIA Template)。
当需要转换图片格式时,以基础档案为基础,再将待转换完成后的个别图片的图像信息类和标注内容类填入,即可并凑出完成的转换格式后的图片。
判断模块340用于根据预设的判断规则判断标注后的训练图片和验证图片的标注部位是否为正四边形。在本实施例中,判断规则为若训练图片和验证图片的标注部位的边数为四个,则为正四边形;若训练图片和验证图片截取的标注部位的边数为大于四个,则为多边形。在本发明中,不赘述边数小于四个的多边形。
计算模块350用于计算标注后的训练图片和验证图片的标注部位的面积。标注部位的面积采用现有技术中的API(Application Programming Interface,应用程序编程接口)获得。API是一些预先定义的函数,用于计算标注部位的面积,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。
转换模块360用于根据预设的转换规则对待转换的图片进行格式转换。转换格式预存于存储器100内,具体包括如前所述的第一转换规则和第二转换规则。当训练图片和验证图片的标注部位为正四边形时,使用第一转换规则进行图片格式转换;当训练图片和验证图片的标注部位为多边形时,使用第二转换规则进行图片格式转换。
输出模块370用于输出格式转换后的训练图片和验证图片。输出后的图片用于AI深度学习模型的训练。
本发明提供的图片格式转换装置10,将用于AI深度学习的图片进行格式转换,使其兼容深度学习模型,得到准确度更高的用于深度学习的网络模型。
本发明还提供了一种图片格式转换方法。请同时参照图3和图4,该图片格式转换方法包括两个过程,分别为图片标注过程和图片格式转换过程。图3为该图片标注过程的流程示意图,图4为该图片格式转换过程的流程示意图。
请参照图3,图片标注过程具体包括如下步骤:
步骤S301,获取所有待转换图片。
具体地,存储器100内存储所有待转换图片。由存储器100中获取待转换图片。
步骤S302,分配待转换图片为训练图片和验证图片。
具体地,将上述待转换图片分配为训练图片和验证图片。根据预设的比例,将上述待转换的图片分为训练图片和验证图片。在具体实施例中,70%的待转换图片为训练图片,30%的待转换图片为验证图片。在其他实施例中,不限于上述分配比例。分配后的训练图片和验证图片分别存储于训练文件和验证文件内。
步骤S303,分批标注训练图片和验证图片。
具体地,分别标注训练文件里的训练图片和验证文件里的验证图片。在标注过程中,对训练图片和验证图片均分批标注。
标注的具体信息包括基本信息类、许可信息类、分类信息类、图像信息类和标注内容类。
基本信息类包括但不限于描述保存待转换图片的文件以及保存标注图片的文件的创建时间、版本和访问网址等。待转换图片的文件包括训练文件和验证文件。标注图片的文件包括分批标注待转换图片得到的子文件和合并上述子文件得到的目标文件。
许可信息类包括但不限于待转换图片的图片版权。
分类信息类包括但不限于待转换图片为训练图片和验证图片。
图像信息类包括但不限于图片的宽度、高度、图片命名和读取时间等。
标注内容类包括但不限于图片分类、点坐标信息、图片边界信息等。点坐标信息以Bounding Box(缩写为Bbox)表示,Bbox是个能够包覆住图片中标注部位的矩形。图片边界信息采用分割方式(Segmentation)获得。Segmentation是一种图片标注的方式,将目标物件(object)以多边形(polygon)点坐标的方式描绘图片的轮廓外框。
上述标注的具体信息是固定且需预先定义的信息。基本信息类、许可信息类和图像信息类一起作为转换基础,并独立成一个档案,成为基础档案(OIA Template)。基础档案在后续转换格式中使用。
在另一些替代性实施例中,待转换的图片可以在标注后分配为训练图片和验证图片。
步骤S304,每批标注后的训练图片和验证图片分别形成一子文件。
具体地,将每批标注后的训练图片和验证图片分别形成一子文件,并对子文件命名并存储至预设存储路径。存储器100内存储有上述子文件的文件命名和存储路径。在后续步骤中,一一对子文件进行处理时,方便查找。处理完一个子文件,再处理另外一个子文件,若发生错误也仅需重复当前子文件的处理过程,减少不必要的流程,提高图片处理速度。
步骤S305,分别将训练图片和验证图片形成的子文件进行去噪后对应合并为目标文件。
具体地,分别对标注后的训练图片和验证图片进行去噪处理,换句话说,将训练图片形成的所有子文件合并为训练目标文件,将验证图片形成的所有子文件合并为验证目标文件。去噪处理是去掉标注后的训练图片和验证图片中的不需要的信息。由于上述子文件具有连续性且具有累加性,因此将去噪后的训练图片和验证图片的子文件分别合并为目标文件。目标文件包括上述训练目标文件和验证目标文件。
请参照图4,图片格式转换过程具体包括如下步骤:
步骤S401,分别获取标注后的训练图片和验证图片。
具体地,分别从训练目标文件和验证目标文件获取标注后的训练图片和验证图片,以便对标注后的训练图片和验证图片进行格式转换。
步骤S402,判断训练图片或验证图片的标注部位是否为正四边形。
具体地,根据预设的判断规则判断标注后的训练图片和验证图片是否为正四边形。判断规则为若训练图片和验证图片截取的边数为四个,则为正四边形;若训练图片和验证图片截取的边数为大于四个,则为多边形。在本发明中,不赘述边数为小于四个的多边形。
若是,则进行步骤S403,训练图片或验证图片根据预设的第一转换规则进行图片格式转换。
第一转换规则具体为标注上述训练图片和验证图片的标注部分的其中一个点的坐标得到第一格式的点坐标值,根据预设的第一映射关系表将第一格式的点坐标值转换为第二格式的点坐标值。第一映射关系表中设置有第一格式的一个点坐标与第二格式的至少两个点坐标的转换关系。其中,所述第二格式中所述至少两个点坐标是通过所述第一格式点坐标中X坐标、Y坐标以及标注部分宽度、高度得到的。
训练图片或验证图片以基础档案为基础,将待转换的训练图片或验证图片填入对应的图像信息类和标注内容类,即可完成图片的格式转换。
具体地,在本实施例中,所述第一转换规则中将第一格式的一个点(A1点)坐标转换成第二格式中四个点(B1点、B2点、B3点和B4点)对应的坐标,第一映射表如下表所示:
若否,则进行步骤S404,训练图片或验证图片根据预设的第二转换规则进行图片格式转换。
同理,训练图片或验证图片为多边形的转换方法和正四边形的一样,也是在基础档案的基础上进行转换,不同的是转换规则具有区别。第二转换规则具体为标注上述训练图片和验证图片的至少四个点的坐标值得到第一格式的点坐标,根据预设的第二映射关系表将第一格式的点坐标转换为第二格式的点坐标。所述第二映射关系表中设置有第一格式的至少四个点的点坐标值的记录方式及将所述第一格式的点坐标转换为第二格式的点坐标后所述四个点的点坐标值的记录方式。
具体地,在本实施例中,第二映射表如下表所示,第一格式中四个点的坐标排列方式为:先记录四个点(A1点、A2点、A3点和A4点)的X坐标,再记录所述四个点的Y坐标;转换为第二格式后,所述四个点(B1点、B2点、B3点和B4点)的点坐标的排列方式为依次记录每个点的X坐标、Y坐标,即,第二格式坐标的排列方式为第一点的X坐标Y坐标、第二点的X坐标Y坐标、第三点的X坐标Y坐标、第四点的X坐标Y坐标:
在一些替代性实施例中,在步骤S403和步骤S404内,还包括计算训练图片或验证图片的标注部位的面积,标注部位的面积作为图片标注格式转换的一个信息填充于图片的第二格式内。标注部位的面积采用现有技术中的API获得。API是一些预先定义的函数,用于计算标注部位的面积。
步骤S405,输出格式转换后的训练图片或验证图片。
输出格式转换后的训练图片或验证图片。输出后的图片用于AI深度学习模型的训练。
本发明提供的图片格式转换方法,首先依据预设的判断规则判断标注后的训练图片和验证图片是否正四边形。若为正四边形,则利用第一转换规则将训练图片和验证图片转换为目标格式图片;若为多边形,则利用第二转换规则将训练图片和验证图片转换为目标格式图片。利用上述图片格式转换方法,可以高效准确地进行图片格式转换。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他器或步骤,单数不排除复数。计算机装置权利要求中陈述的多个器或计算机装置也可以由同一个器或计算机装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (8)
1.一种图片格式转换方法,用于转换图片的格式,其特征在于,所述图片格式转换方法包括如下步骤:
标注待转换图片;
获取标注后的所述待转换图片;
判断标注后的所述待转换图片的标注部位是否为正四边形;
若是,则将所述待转换图片根据预设的第一转换规则进行图片格式转换,其中,所述第一转换规则为标注所述待转换图片的标注部位的其中一个点的坐标以得到第一格式的点坐标值,根据预设的第一映射关系表将所述第一格式的点坐标值转换为第二格式的点坐标值,所述第一映射关系表中设置有所述第一格式的一个点坐标与所述第二格式的至少两个点坐标的转换关系;所述第二格式中所述至少两个点坐标是通过所述第一格式点坐标中X坐标、Y坐标以及标注部分宽度、高度得到的;
若否,则将所述待转换图片根据预设的第二转换规则进行图片格式转换。
2.如权利要求1所述的图片格式转换方法,其特征在于,
所述第二转换规则为标注所述待转换图片的至少四个点的坐标值以得到第一格式的点坐标,根据预设的第二映射关系表将所述第一格式的点坐标转换为第二格式的点坐标,所述第二映射关系表中设置有所述第一格式的至少四个点的点坐标值的记录方式及将所述第一格式的点坐标转换为所述第二格式的点坐标后所述至少四个点的点坐标值的记录方式;所述第一格式的至少四个点的坐标排列方式为先记录所述至少四个点的X坐标,再记录所述至少四个点的Y坐标;转换为所述第二格式后,所述至少四个点的点坐标的排列方式为依次记录每个点的X坐标、Y坐标。
3.如权利要求1所述的图片格式转换方法,其特征在于,所述标注待转换图片之前,还包括如下步骤:
获取所有所述待转换图片;
分配所述待转换图片为训练图片和验证图片,并将所述训练图片和所述验证图片分别存储于训练文件和验证文件;
分别标注所述训练图片和所述验证图片。
4.如权利要求3所述的图片格式转换方法,其特征在于,所述分别标注所述训练图片和所述验证图片,包括如下步骤:
分批标注所述训练图片和所述验证图片,每批标注后的图片形成一子文件;
将多个所述子文件进行去噪后分别合并为一个训练目标文件和验证目标文件。
5.一种图片格式转换装置,用于转换图片的格式,其特征在于,所述图片格式转换装置包括:
处理器;以及
存储器,所述存储器中存储有多个程序模块,多个所述程序模块由所述处理器运行并执行如下步骤:
标注待转换图片;
获取标注后的所述待转换图片;
判断标注后的所述待转换图片的标注部位是否为正四边形;
若是,则将所述待转换图片根据预设的第一转换规则进行图片格式转换,其中,所述第一转换规则为标注所述待转换图片的标注部位的其中一个点的坐标以得到第一格式的点坐标值,根据预设的第一映射关系表将所述第一格式的点坐标值转换为第二格式的点坐标值,所述第一映射关系表中设置有所述第一格式的一个点坐标与所述第二格式的至少两个点坐标的转换关系;所述第二格式中所述至少两个点坐标是通过所述第一格式点坐标中X坐标、Y坐标以及标注部分宽度、高度得到的;
若否,则将所述待转换图片根据预设的第二转换规则进行图片格式转换。
6.如权利要求5所述的图片格式转换装置,其特征在于,
所述第二转换规则为标注所述待转换图片的至少四个点的坐标值以得到第一格式的点坐标,根据预设的第二映射关系表将所述第一格式的点坐标转换为第二格式的点坐标,所述第二映射关系表中设置有所述第一格式的至少四个点的点坐标值的记录方式及将所述第一格式的点坐标转换为所述第二格式的点坐标后所述四个点的点坐标值的记录方式;所述第一格式的至少四个点的坐标排列方式为先记录所述至少四个点的X坐标,再记录所述至少四个点的Y坐标;转换为所述第二格式后,所述至少四个点的点坐标的排列方式为依次记录每个点的X坐标、Y坐标。
7.如权利要求5所述的图片格式转换装置,其特征在于,多个所述程序模块由所述处理器运行并还执行如下步骤:
获取所有所述待转换图片;
分配所述待转换图片为训练图片和验证图片,并将所述训练图片和所述验证图片分别存储于训练文件和验证文件;
分批标注所述训练图片和所述验证图片,每批标注后的图片形成一子文件;
将多个所述子文件进行去噪后分别合并为一个训练目标文件和验证目标文件。
8.一种计算机存储介质,所述计算机存储介质存储有计算机程序代码,其特征在于,当所述计算机程序代码在计算设备上运行时,导致所述计算设备执行权利要求1-4任一项所述的图片格式转换方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910075931.0A CN111489283B (zh) | 2019-01-25 | 2019-01-25 | 图片格式转换方法、装置及计算机存储介质 |
US16/534,059 US11003953B2 (en) | 2019-01-25 | 2019-08-07 | Method for image format conversion and device employing the method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910075931.0A CN111489283B (zh) | 2019-01-25 | 2019-01-25 | 图片格式转换方法、装置及计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111489283A CN111489283A (zh) | 2020-08-04 |
CN111489283B true CN111489283B (zh) | 2023-08-11 |
Family
ID=71732517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910075931.0A Active CN111489283B (zh) | 2019-01-25 | 2019-01-25 | 图片格式转换方法、装置及计算机存储介质 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11003953B2 (zh) |
CN (1) | CN111489283B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112183298A (zh) * | 2020-09-23 | 2021-01-05 | 上海蜜度信息技术有限公司 | 表格图片的标注方法、系统、介质及装置 |
CN112700367A (zh) * | 2021-01-14 | 2021-04-23 | 南方电网深圳数字电网研究院有限公司 | 图片格式转换方法、装置及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105844277A (zh) * | 2016-03-22 | 2016-08-10 | 江苏木盟智能科技有限公司 | 标签识别方法和装置 |
CN107943363A (zh) * | 2017-11-21 | 2018-04-20 | 广州视睿电子科技有限公司 | 背景图像的配置方法及装置、交互智能平板及存储介质 |
CN108052937A (zh) * | 2017-12-28 | 2018-05-18 | 百度在线网络技术(北京)有限公司 | 基于弱监督的字符检测器训练方法、装置、系统及介质 |
WO2018107777A1 (zh) * | 2016-12-15 | 2018-06-21 | 威创集团股份有限公司 | 视频图像的标注方法和系统 |
CN108346168A (zh) * | 2018-02-12 | 2018-07-31 | 腾讯科技(深圳)有限公司 | 一种手势图像生成方法、装置及存储介质 |
CN108549893A (zh) * | 2018-04-04 | 2018-09-18 | 华中科技大学 | 一种任意形状的场景文本端到端识别方法 |
CN109035370A (zh) * | 2018-07-23 | 2018-12-18 | 郑州云海信息技术有限公司 | 一种图片标注方法与系统 |
CN109064525A (zh) * | 2018-08-20 | 2018-12-21 | 广州视源电子科技股份有限公司 | 一种图片格式转换方法、装置、设备和存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7348995B2 (en) * | 2005-06-09 | 2008-03-25 | International Business Machines Corporation | Method, apparatus and computer program product for implementing picture format conversion to X, Y plot |
WO2007120772A2 (en) * | 2006-04-14 | 2007-10-25 | Advanced Solutions, Inc. | Method, system, and computer-readable medium to maintain and/or purge files of a document management system |
US10460023B1 (en) * | 2016-03-10 | 2019-10-29 | Matthew Connell Shriver | Systems, methods, and computer readable media for creating slide presentations for an annotation set |
-
2019
- 2019-01-25 CN CN201910075931.0A patent/CN111489283B/zh active Active
- 2019-08-07 US US16/534,059 patent/US11003953B2/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105844277A (zh) * | 2016-03-22 | 2016-08-10 | 江苏木盟智能科技有限公司 | 标签识别方法和装置 |
WO2018107777A1 (zh) * | 2016-12-15 | 2018-06-21 | 威创集团股份有限公司 | 视频图像的标注方法和系统 |
CN107943363A (zh) * | 2017-11-21 | 2018-04-20 | 广州视睿电子科技有限公司 | 背景图像的配置方法及装置、交互智能平板及存储介质 |
CN108052937A (zh) * | 2017-12-28 | 2018-05-18 | 百度在线网络技术(北京)有限公司 | 基于弱监督的字符检测器训练方法、装置、系统及介质 |
CN108346168A (zh) * | 2018-02-12 | 2018-07-31 | 腾讯科技(深圳)有限公司 | 一种手势图像生成方法、装置及存储介质 |
CN108549893A (zh) * | 2018-04-04 | 2018-09-18 | 华中科技大学 | 一种任意形状的场景文本端到端识别方法 |
CN109035370A (zh) * | 2018-07-23 | 2018-12-18 | 郑州云海信息技术有限公司 | 一种图片标注方法与系统 |
CN109064525A (zh) * | 2018-08-20 | 2018-12-21 | 广州视源电子科技股份有限公司 | 一种图片格式转换方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111489283A (zh) | 2020-08-04 |
US11003953B2 (en) | 2021-05-11 |
US20200242401A1 (en) | 2020-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113609820B (zh) | 基于可扩展标记语言文件生成word文件的方法、装置及设备 | |
CN112699775A (zh) | 基于深度学习的证件识别方法、装置、设备及存储介质 | |
CN110908697A (zh) | 一种资源打包方法、装置、服务器及存储介质 | |
CN113254455B (zh) | 数据库的动态配置方法、装置、计算机设备及存储介质 | |
CN111489283B (zh) | 图片格式转换方法、装置及计算机存储介质 | |
CN113849552B (zh) | 结构化数据转换方法、装置、电子设备及介质 | |
CN112528616A (zh) | 业务表单生成方法、装置、电子设备及计算机存储介质 | |
CN112686015A (zh) | 图表生成方法、装置、设备及存储介质 | |
CN113407080B (zh) | 构件标签的生成方法、装置、计算机设备及存储介质 | |
CN113885935A (zh) | 资源打包方法、装置、电子设备及计算机可读存储介质 | |
CN114581639A (zh) | 一种基于梁平法施工图生成bim模型中梁钢筋信息的方法 | |
CN111179402B (zh) | 一种目标对象的渲染方法、装置及系统 | |
CN113808142A (zh) | 一种地面标识的识别方法、装置、电子设备 | |
CN113807975A (zh) | 一种校验信息的方法、装置、计算机设备及存储介质 | |
CN109191379B (zh) | 一种全景拼接的语义标注方法、系统、终端和存储介质 | |
CN114816772B (zh) | 基于兼容层运行的应用的排错方法、排错系统及计算设备 | |
CN105844255A (zh) | 主观题阅卷方法及其装置 | |
CN110209769A (zh) | 文本填写方法及装置 | |
CN116152368A (zh) | 字体生成方法、字体生成模型的训练方法、装置及设备 | |
CN111046096B (zh) | 用于生成图文结构化信息的方法和装置 | |
CN115170765A (zh) | 一种模型处理系统、方法及装置 | |
CN112612915A (zh) | 一种图片标注方法及设备 | |
CN114692583A (zh) | 电子表单审批流水号生成方法、装置、设备以及存储介质 | |
CN117726170B (zh) | 数据存储方法及装置 | |
CN111047415A (zh) | 服饰配件订单处理方法、系统、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |