CN111143597B - 图像检索方法、终端及存储装置 - Google Patents
图像检索方法、终端及存储装置 Download PDFInfo
- Publication number
- CN111143597B CN111143597B CN201911285315.4A CN201911285315A CN111143597B CN 111143597 B CN111143597 B CN 111143597B CN 201911285315 A CN201911285315 A CN 201911285315A CN 111143597 B CN111143597 B CN 111143597B
- Authority
- CN
- China
- Prior art keywords
- coarse
- target
- sub
- sample
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 239000013598 vector Substances 0.000 claims abstract description 161
- 238000013139 quantization Methods 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims description 19
- 238000001914 filtration Methods 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 13
- 238000012216 screening Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 5
- 238000004364 calculation method Methods 0.000 description 10
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 101100043754 Metarhizium robertsii (strain ARSEF 23 / ATCC MYA-3075) subD gene Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种图像检索方法、终端及存储装置,所述方法包括:提取待检索图像的目标特征向量;查询训练好的粗码本表,确认与目标特征向量最近的多个目标粗聚类中心点和每个目标粗聚类中心点对应的目标样本识别码;利用多个目标粗聚类中心点查询训练好的子码本表,得到多个目标子聚类中心点;通过目标特征向量、多个目标粗聚类中心点、多个目标子聚类中心点、目标样本识别码和预先计算好的距离表进行查询和计算,得到与目标特征向量最近的预设数量个检索结果,距离表包括样本识别码和对应的距离值。本发明通过乘积量化的方式极大程度减少数据处理量,且保证了搜索精度。
Description
技术领域
本申请涉及图像检索技术领域,特别是涉及一种图像检索方法、终端及存储装置。
背景技术
随着近年来计算机、互联网、多媒体的迅猛发展,世界上有着愈来愈多的海量图像数据。为了有效分析和利用这些图像的价值,各行各业都在深研着高效精确的特征检索技术,如搜索引擎、电商平台、安防、信息认证领域等。
以图搜图,基于一张图像搜索出与之最相似的多张图像。相比于文本搜索,图像搜索需要间接使用自身内容隐含的关键信息——特征值。为了不损失更多细节,从图像提取出的特征值一般是高维矢量数据,即高维特征向量。目前流行的图搜方法包括暴力搜图和降维搜图等方法,其中,暴力搜图是通过将图像的高维特征向量进行一一对比,从而判断图像的相似度,降维搜图是将图像的高维特征向量降维,再进行检索。但是,两种方式中均存在一定缺陷,例如,暴力搜图需要处理海量的数据,计算强度高,效率低下,而降维搜图需要对高维特征向量进行降维,而降维过程会导致检索精度降低。
发明内容
本申请提供一种图像检索方法、终端及存储装置,以解决现有搜图方式效率和精度较低的问题。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种一种图像检索方法,包括:
提取待检索图像的目标特征向量;
查询训练好的粗码本表,确认与目标特征向量最近的多个目标粗聚类中心点和每个目标粗聚类中心点对应的目标样本识别码,粗码本表包括对所有样本的特征向量进行聚类得到的粗聚类中心点,样本识别码在训练粗码本表和子码本表时生成;
利用多个目标粗聚类中心点查询训练好的子码本表,得到多个目标子聚类中心点,子码本表包括对多个样本的残差向量进行乘积量化得到的多个子聚类中心点,残差向量通过样本的特征向量与最近的粗聚类中心点做残差得到;
通过目标特征向量、多个目标粗聚类中心点、多个目标子聚类中心点、目标样本识别码和预先计算好的距离表进行查询和计算,得到与目标特征向量最近的预设数量个检索结果,距离表包括样本识别码和对应的距离值,距离值通过样本的粗聚类中心点和子聚类中心点计算得到。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种终端,终端包括处理器、与处理器耦接的存储器,其中,
存储器存储有用于实现上述中任一项的图像检索方法的程序指令;
处理器用于执行存储器存储的程序指令以检索与待检索图像相似的图像。
为解决上述技术问题,本申请采用的再一个技术方案是:提供一种存储装置,其特征在于,存储有能够实现上述中任一项的图像检索方法的程序文件。
本申请的有益效果是:本发明根据待检索图像的目标特征向量查询训练好的粗码本表,得到多个目标粗聚类中心点和每个目标粗聚类中心点对应的目标样本识别码,剔除掉了目标粗聚类中心点对应的目标样本之外的其他样本,再查询子码本表,得到多个目标子聚类中心点,利用目标特征向量、多个目标粗聚类中心点、多个目标子聚类中心点、目标样本识别码和预先计算好的距离表进行查询和计算,得到每个目标样本的样本特征与目标特征向量之间的距离,再从中选取出与目标特征向量最近的预设数量个目标样本作为检索结果,其通过剔除目标样本外的其他样本,从而极大程度上缩减了检索图像时所需要处理的数据量,节省了计算所需的存储空间,提高了检索的效率,并且,其不需要对根据待检索图像提高到的高维特征向量进行降维处理,避免向量降维对检索结果带来的影响。
附图说明
图1是本发明第一实施例的图像检索方法的流程示意图;
图2是本发明图像检索方法中训练粗码本表、子码本表及生成样本识别码的第一实施例的流程示意图;
图3是本发明图像检索方法中训练粗码本表、子码本表及生成样本识别码的第二实施例的流程示意图;
图4是本发明图像检索方法中训练粗码本表、子码本表及生成样本识别码的第三实施例的流程示意图;
图5是本发明第二实施例的图像检索方法的流程示意图;
图6是本发明第三实施例的图像检索方法的流程示意图;
图7是本发明第四实施例的图像检索方法的流程示意图;
图8是本发明第五实施例的图像检索方法的流程示意图;
图9是本发明实施例的图像检索装置的结构示意图;
图10是本发明实施例的终端的结构示意图;
图11是本发明实施例的存储装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。本申请实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
图1是本发明第一实施例的图像检索方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图1所示的流程顺序为限。如图1所示,该方法包括步骤:
步骤S100:提取待检索图像的目标特征向量。
在步骤S100中,接收用户输入的待检索图像,并提取该待检索图像的目标特征向量,该目标特征向量为高维特征向量。
步骤S101:查询训练好的粗码本表,确认与目标特征向量最近的多个目标粗聚类中心点和每个目标粗聚类中心点对应的目标样本识别码。
需要说明的是,粗码本表包括对多个样本的特征向量进行聚类得到的多个粗聚类中心点,样本识别码在训练粗码本表和子码本表时生成。
在步骤S101中,通过查询粗码本表,得到与目标特征向量最近的多个目标粗聚类中心点,以及每个目标粗聚类中心点对应的目标样本的的目标识别码,其他样本即可剔除掉,从而减少后续需要处理的数据量。
步骤S102:利用多个目标粗聚类中心点查询训练好的子码本表,得到多个目标子聚类中心点。
需要说明的是,子码本表包括对多个样本的残差向量进行乘积量化得到的多个子聚类中心点,每个样本均对应多个子聚类中心点,样本的残差向量通过将样本的特征向量进行粗聚类,得到样本的粗聚类中心点,再将样本的特征向量和与该样本的特征向量最近的粗聚类中心点取差值,得到样本的残差向量。
在步骤S102中,基于多个目标粗聚类中心点的基础上查询子码本表,从而得到多个目标子聚类中心点。
步骤S103:通过目标特征向量、多个目标粗聚类中心点、多个目标子聚类中心点、目标样本识别码和预先计算好的距离表进行查询和计算,得到与目标特征向量最近的预设数量个检索结果。
需要说明的是,距离表包括样本识别码和与样本识别码对应的距离值,距离值通过样本的粗聚类中心点和子聚类中心点计算得到。
在步骤S103中,通过目标特征向量、多个目标粗聚类中心点、多个目标子聚类中心点、目标样本识别码和预先计算好的距离表进行查询和计算,从而得到每个目标样本的特征向量与目标特征向量之间的距离,将所有的距离升序排序,再从中挑选出排列在前N(N为正整数)个距离,将这些距离对应的目标样本作为检索结果并输出。
进一步的,在根据上述实施例提供的图像检索方法进行图像检索之前,还需要训练粗码本表和子码本表,具体地,如图2所示,训练粗码本表和子码本表的步骤包括:
步骤S200:获取样本数据库中每个样本的特征向量。
步骤S201:将多个特征向量分别进行粗聚类,得到多个粗聚类中心点,并记录每个粗聚类中心点的编号。
具体地,举一个例子说明,例如:n个样本,每个样本的特征向量的维度D=64,将特征向量划分为M=8段,则每段的子维度subD=8,对每段分别进行k-means聚类,假设每段聚类的k=256,则M段分别粗聚类之后会得到M*k个粗聚类中心,每个粗聚类中心的维数为subD。需要说明的是,在进行聚类的过程中,同步记录记录每个粗聚类中心点的编号。
步骤S202:分别将每个特征向量与距离最近的粗聚类中心点做残差,得到多个残差向量。
具体地,确认每个样本的特征向量距离最近的粗聚类中心点,并将样本的特征向量与最近的粗聚类中心点取差值,从而得到每个样本的残差向量。
步骤S203:对多个残差向量分别进行乘积量化,得到多个子聚类中心点,并记录每个子聚类中心点的量化码。
具体地,在得到每个样本的残差向量之后,参照步骤S201中的聚类过程,对残差向量再次进行聚类,再对残差向量的每个子段求笛卡尔乘积,从而得到每个样本的子聚类中心点。需要说明的是,在进行乘积量化的过程中,同步记录每个子聚类中心点的量化码。
步骤S204:利用编号和量化码得到样本识别码,并输出多个粗聚类中心点得到粗码本表,输出多个子聚类中心点得到子码本表。
进一步的,为了保证训练好的粗码本表和子码本表能够为图像检索提供精确的结果,上述实施例的基础上,其他实施例中,如图3所示,在步骤S204之后,还包括:
步骤S300:提取测试图像的测试特征向量。
步骤S301:基于测试特征向量、粗码本表、子码本表、样本识别码、距离表进行查询,得到第一检索结果。
步骤S302:将测试特征向量与样本数据库中每一个样本图像的特征进行比对,得到第二检索结果。
在步骤S302中,通过将测试图像的特征向量逐个与样本图像的特征向量进行比对,从而得到第二检索检索。
步骤S303:取第一检索结果和第二检索结果的交集,得到第三检索结果。
步骤S304:计算第三检索结果和第二检索结果的比值,得到召回率。
步骤S305:当召回率高于第一预设阈值时,确认粗码本表和子码本表训练合格。
需要说明的是,第一预设阈值预先设定。
在步骤S305中,通过比对召回率和第一预设阈值,从而获知粗码本表和子码本表是否合格,当召回率低于第一预设阈值时,说明此时的粗码本表和子码本表还不可用于图像检索,需要更多的样本进行训练。
本实施例中,通过利用传统的图像检索方法来对粗码本表和子码本表进行测验,仅当召回率达到要求时,才将粗码本表和子码本表用于图像检索,从而保证图像检索的精确度。
进一步的,随着样本的扩充,粗码本表和子码本表同样需要经过进一步的训练,因此,上述实施例的基础上,其他实施例中,如图4所示,步骤S204之后,还包括:
步骤S400:间隔预设时间段后,获取样本数据库中新增样本的个数。
步骤S401:当新增样本的个数超过第二预设阈值时,利用新增样本对粗码本表和子码本表进行训练,并生成新增样本的样本识别码。
需要说明的是,第二预设阈值预先设定。
具体地,每间隔预设时间段,获取样本数据库中新增的样本的个数,当新增样本的个数超过第二预设阈值时,利用新增样本对粗码本表和子码本表进行训练,从而对粗码本表和子码本表进行更新,并生成新增样本的样本识别码。
需要说明的是,在一些实施例中,还可通过接收用户输入的任务或指令,根据用户输入的任务或指令开启对粗码本表和子码本表的更新。
本实施例根据待检索图像的目标特征向量查询训练好的粗码本表,得到多个目标粗聚类中心点和每个目标粗聚类中心点对应的目标样本识别码,剔除掉了目标粗聚类中心点对应的目标样本之外的其他样本,再查询子码本表,得到多个目标子聚类中心点,利用目标特征向量、多个目标粗聚类中心点、多个目标子聚类中心点、目标样本识别码和预先计算好的距离表进行查询和计算,得到每个目标样本的样本特征与目标特征向量之间的距离,再从中选取出与目标特征向量最近的预设数量个目标样本作为检索结果,其通过剔除目标样本外的其他样本,从而极大程度上缩减了检索图像时所需要处理的数据量,节省了计算所需的存储空间,提高了检索的效率,并且,其不需要对根据待检索图像提高到的高维特征向量进行降维处理,避免向量降维对检索结果带来的影响。
图5是本发明第二实施例的图像检索方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图5所示的流程顺序为限。如图5所示,该方法包括步骤:
步骤S500:提取待检索图像的目标特征向量。
在本实施例中,图5中的步骤S500和图1中的步骤S100类似,为简约起见,在此不再赘述。
步骤S501:查询训练好的粗码本表,确认与目标特征向量最近的多个目标粗聚类中心点和每个目标粗聚类中心点对应的目标样本识别码。
在本实施例中,图5中的步骤S501和图1中的步骤S101类似,为简约起见,在此不再赘述。
步骤S502:利用多个目标粗聚类中心点查询训练好的子码本表,得到多个目标子聚类中心点。
在本实施例中,图5中的步骤S502和图1中的步骤S102类似,为简约起见,在此不再赘述。
步骤S503:计算目标特征向量与每个粗聚类中心点的距离,得到第一距离值。
步骤S504:利用样本识别码查询计算好的距离表,得到第二距离值。
步骤S505:计算目标特征向量与每个子聚类中心点的内积,得到第三距离值。
步骤S506:利用第一距离值、第二距离值和第三距离值计算得到多个目标样本的特征向量与目标特征向量的距离。
具体地,在步骤S503~步骤S506中,需要理解的是,在获取目标特征向量、目标粗聚类中心点、目标子聚类中心点之后,即可计算得到样本的特征向量与目标特征向量之间的距离,具体如下公式:
D=‖x-yC-yR‖2·········(1);
其中,D为样本的特征向量与目标特征向量之间的距离,x为目标特征向量,yC为目标粗聚类中心点(向量),yR为目标子聚类中心点(向量)。通过将上述公式(1)展开即可得到下述公式:
D=‖x-yC‖2+‖yR‖2+2*(yC|yR)-2*(x|yR)······(2);
将上述公式(2)划分为三部分,第一部分为‖x-yC‖2,第二部分为‖yR‖2+2*(yC|yR),第三部分为2*(x|yR),其中,第一部分和第三部分的计算均涉及到目标特征向量x,而第二部分的计算仅涉及到目标粗聚类中心点和目标子聚类中心点,因此,第二部分的结果可以预先计算好,并结合样本的样本识别码生成距离表,后续通过样本识别码查询距离表即可得知该第二部分的具体值。该生成距离表的具体步骤包括:
获取每个样本对应的粗聚类中心点和子聚类中心点;
利用每个样本的粗聚类中心点和子聚类中心点进行计算,得到每个样本的距离值;
将每个样本的样本识别码与距离值进行对应,得到距离表。
根据上述公式(2)可知,第一部分即步骤S503中通过目标特征向量与每个粗聚类中心点计算得到的第一距离值;第二部分即步骤S504中利用样本识别码查询计算好的距离表得到的第二距离值;第三部分即步骤S505中通过目标特征向量和子聚类中心点计算得到的第三距离值,再将第一距离值、第二距离值、第三距离值想加即可得到样本的特征向量与目标特征向量之间的距离。
步骤S507:选取距离最近的预设数量个目标样本作为检索结果。
在步骤S507中,将目标样本按距离的大小升序排序,再从中挑选出排列在前N(N为正整数)个距离,将这些距离对应的目标样本作为检索结果并输出。
在本实施例中,在计算目标特征向量和样本的特征向量之间的距离时,通过将不涉及到目标特征向量的部分提前计算出来以生成距离表,在后续计算时,通过样本识别码查询距离表即可获知该部分的数值,从而缩减了距离计算过程中的计算量,提升了计算速度,节省了内存资源。
图6是本发明第三实施例的图像检索方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图6所示的流程顺序为限。如图6所示,该方法包括步骤:
步骤S600:提取待检索图像的目标特征向量。
在本实施例中,图6中的步骤S600和图1中的步骤S100类似,为简约起见,在此不再赘述。
步骤S601:基于目标特征向量加载与待检索图像对应的样本数据库、粗码本表和子码本表。
具体地,图像可以分为风景图、实物图、人物图等等类型,因此,在图像检索过程中,为了减少数据处理量,在构建样本数据库时,将不同类型的样本图像分配至不同的样本数据库,再各自训练每个样本数据库的粗码本表和子码本表。在步骤S601中,提取待检索图像的目标特征向量之后,可根据目标特征向量加载与待检索图像对应的样本数据库、粗码本表和子码本表,例如待检索图像为车辆,则加载存储车辆图像的样本数据库,以及相应的粗码本表和子码本表。
步骤S602:查询训练好的粗码本表,确认与目标特征向量最近的多个目标粗聚类中心点和每个目标粗聚类中心点对应的目标样本识别码。
在本实施例中,图6中的步骤S602和图1中的步骤S101类似,为简约起见,在此不再赘述。
步骤S603:利用多个目标粗聚类中心点查询训练好的子码本表,得到多个目标子聚类中心点。
在本实施例中,图6中的步骤S603和图1中的步骤S102类似,为简约起见,在此不再赘述。
步骤S604:通过目标特征向量、多个目标粗聚类中心点、多个目标子聚类中心点、目标样本识别码和预先计算好的距离表进行查询和计算,得到与目标特征向量最近的预设数量个检索结果。
在本实施例中,图6中的步骤S604和图1中的步骤S103类似,为简约起见,在此不再赘述。
本实施例通过根据图像的类型样本划分至不同的样本数据库,在进行图像检索时,仅需检索与待检索图像对应的样本数据库即可,大幅度降低了检索过程中所需要处理的数据,提高了检索的效率。
图7是本发明第四实施例的图像检索方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图7所示的流程顺序为限。如图7所示,该方法包括步骤:
步骤S700:提取待检索图像的目标特征向量。
在本实施例中,图7中的步骤S700和图6中的步骤S600类似,为简约起见,在此不再赘述。
步骤S701:基于目标特征向量加载与待检索图像对应的样本数据库、粗码本表和子码本表。
在本实施例中,图7中的步骤S701和图6中的步骤S601类似,为简约起见,在此不再赘述。
步骤S702:接收外部输入的过滤条件。
在步骤S702中,过滤条件为用户根据自身的需求所设定,例如,用户需要检索一辆车的图像时,可以加入限定条件,如车身颜色,车的品牌和型号,以及样本新增至样本数据库的时间等。
步骤S703:基于过滤条件过滤掉样本数据库中不符合要求的样本。
在步骤S703中,根据过滤条件将样本数据库中不符合过滤条件的样本过滤掉,从而缩减需要处理的数据量。
步骤S704:查询训练好的粗码本表,确认与目标特征向量最近的多个目标粗聚类中心点和每个目标粗聚类中心点对应的目标样本识别码。
在本实施例中,图7中的步骤S704和图6中的步骤S602类似,为简约起见,在此不再赘述。
步骤S705:利用多个目标粗聚类中心点查询训练好的子码本表,得到多个目标子聚类中心点。
在本实施例中,图7中的步骤S705和图6中的步骤S603类似,为简约起见,在此不再赘述。
步骤S706:通过目标特征向量、多个目标粗聚类中心点、多个目标子聚类中心点、目标样本识别码和预先计算好的距离表进行查询和计算,得到与目标特征向量最近的预设数量个检索结果。
在本实施例中,图7中的步骤S706和图6中的步骤S604类似,为简约起见,在此不再赘述。
本实施例通过过滤条件进一步减少需要处理的样本的数量,从而减少计算量,进一步提升了检索的效率。
图8是本发明第五实施例的图像检索方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图8所示的流程顺序为限。如图8所示,该方法包括步骤:
步骤S800:提取待检索图像的目标特征向量。
在本实施例中,图8中的步骤S800和图1中的步骤S100类似,为简约起见,在此不再赘述。
步骤S801:查询训练好的粗码本表,确认与目标特征向量最近的多个目标粗聚类中心点和每个目标粗聚类中心点对应的目标样本识别码。
在本实施例中,图8中的步骤S801和图1中的步骤S101类似,为简约起见,在此不再赘述。
步骤S802:利用多个目标粗聚类中心点查询训练好的子码本表,得到多个目标子聚类中心点。
在本实施例中,图8中的步骤S802和图1中的步骤S102类似,为简约起见,在此不再赘述。
步骤S803:通过目标特征向量、多个目标粗聚类中心点、多个目标子聚类中心点、目标样本识别码和预先计算好的距离表进行查询和计算,得到与目标特征向量最近的预设数量个检索结果。
需要说明的是,样本数据库划分为多个子数据库,每个子数据库包括多个样本。
步骤S804:计算目标特征向量与检索结果中每个样本的特征向量的相似度。
步骤S805:基于相似度筛选出目标数量的样本作为最终检索结果。
在步骤S804~S805中,在筛选出预设数量个样本之后,将预设数量个样本的特征向量逐个与待检索图像的特征向量进行相似度计算,再根据计算结果筛选出目标数量的样本作为最终检索结果,例如,按相似度将样本降序排序,再挑选出排列在前N(N为正整数)个的样本作为最终检索结果。
本实施例通过对检索结果中的样本进行暴力搜图的方式进行一遍检索,再挑选出目标数量的样本作为最终检索结果,从而进一步提升了最终检索结果的精确率。
进一步的,现有的CPU大多都是多核CPU,而遍历一个样本数据库的过程仅需一个核心即可完成,因此,为了避免浪费CPU资源,在上述五个实施例的基础上,其他实施例中,将样本数据库划分为多个子数据库,在遍历样本数据库时,同步遍历多个子数据库,从而提高对CPU资源的利用率,同时提高了图像检索的效率。
图9是本发明实施例的图像检索装置的结构示意图。如图9所示,该装置10包括提取模块11、第一查询模块12、第二查询模块13和检索模块14。
提取模块11,用于提取待检索图像的目标特征向量。
第一查询模块12,与提取模块11耦接,用于查询训练好的粗码本表,确认与目标特征向量最近的多个目标粗聚类中心点和每个目标粗聚类中心点对应的目标样本识别码,粗码本表包括对所有样本的特征向量进行聚类得到的粗聚类中心点,样本识别码在训练粗码本表和子码本表时生成。
第二查询模块13,与第一查询模块12耦接,用于利用多个目标粗聚类中心点查询训练好的子码本表,得到多个目标子聚类中心点,子码本表包括对多个样本的残差向量进行乘积量化得到的多个子聚类中心点,残差向量通过样本的特征向量与最近的粗聚类中心点做残差得到。
检索模块14,与第二查询模块13耦接,用于通过目标特征向量、多个目标粗聚类中心点、多个目标子聚类中心点、目标样本识别码和预先计算好的距离表进行查询和计算,得到与目标特征向量最近的预设数量个检索结果,距离表包括样本识别码和对应的距离值,距离值通过样本的粗聚类中心点和子聚类中心点计算得到。
可选地,检索模块14通过目标特征向量、多个目标粗聚类中心点、多个目标子聚类中心点、目标样本识别码和预先计算好的距离表进行查询和计算,得到与目标特征向量最近的预设数量个检索结果,距离表包括样本识别码和对应的距离值,距离值通过样本的粗聚类中心点和子聚类中心点计算得到的操作还可以是:计算目标特征向量与每个粗聚类中心点的距离,得到第一距离值;利用样本识别码查询计算好的距离表,得到第二距离值;计算目标特征向量与每个子聚类中心点的内积,得到第三距离值;利用第一距离值、第二距离值和第三距离值计算得到多个目标样本的特征向量与目标特征向量的距离;选取距离最近的预设数量个目标样本作为检索结果。
可选地,该图像检索装置还包括训练模块,训练模块用于训练粗码本表、子码本表及生成样本识别码,包括:获取样本数据库中每个样本的特征向量;将多个特征向量分别进行粗聚类,得到多个粗聚类中心点,并记录每个粗聚类中心点的编号;分别将每个特征向量与距离最近的粗聚类中心点做残差,得到多个残差向量;对多个残差向量分别进行乘积量化,得到多个子聚类中心点,并记录每个子聚类中心点的量化码;利用编号和量化码得到样本识别码,并输出多个粗聚类中心点得到粗码本表,输出多个子聚类中心点得到子码本表。
可选地,训练模块利用编号和量化码得到样本识别码,并输出多个粗聚类中心点得到粗码本表,输出多个子聚类中心点得到子码本表的操作之后还包括:提取测试图像的测试特征向量;基于测试特征向量、粗码本表、子码本表、样本识别码、距离表进行查询,得到第一检索结果;将测试特征向量与样本数据库中每一个样本图像的特征进行比对,得到第二检索结果;取第一检索结果和第二检索结果的交集,得到第三检索结果;计算第三检索结果和第二检索结果的比值,得到召回率;当召回率高于第一预设阈值时,确认粗码本表和子码本表训练合格。
可选地,训练模块利用编号和量化码得到样本识别码,并输出多个粗聚类中心点得到粗码本表,输出多个子聚类中心点得到子码本表的操作之后还包括:间隔预设时间段后,获取样本数据库中新增样本的个数;当新增样本的个数超过第二预设阈值时,利用新增样本对粗码本表和子码本表进行训练,并生成新增样本的样本识别码。
可选地,训练模块还用于生成距离表,具体操作为:获取每个样本对应的粗聚类中心点和子聚类中心点;利用每个样本的粗聚类中心点和子聚类中心点进行计算,得到每个样本的距离值;将每个样本的样本识别码与距离值进行对应,得到距离表。
可选地,提取模块11提取待检索图像的目标特征向量的操作之后,还包括:基于目标特征向量加载与待检索图像对应的样本数据库、粗码本表和子码本表。
可选地,提取模块11基于目标特征向量加载与待检索图像对应的样本数据库、粗码本表和子码本表的操作之后,还包括:接收外部输入的过滤条件;基于过滤条件过滤掉样本数据库中不符合要求的样本。
可选地,检索模块14得到与目标特征向量最近的预设数量个检索结果的操作之后还包括:计算目标特征向量与检索结果中每个样本的特征向量的相似度;基于相似度筛选出目标数量的样本作为最终检索结果。
请参阅图10,图10为本发明实施例的终端的结构示意图。如图10所示,该终端60包括处理器61及和处理器61耦接的存储器62。
存储器62存储有用于实现上述任一实施例所述的图像检索方法的程序指令。
处理器61用于执行存储器62存储的程序指令以检索与待检索图像相似的图像。
其中,处理器61还可以称为CPU(Central Processing Unit,中央处理单元)。处理器61可能是一种集成电路芯片,具有信号的处理能力。处理器61还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
参阅图11,图11为本发明实施例的存储装置的结构示意图。本发明实施例的存储装置存储有能够实现上述所有方法的程序文件71,其中,该程序文件71可以以软件产品的形式存储在上述存储装置中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储装置包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等终端设备。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。以上仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种图像检索方法,其特征在于,其包括:
提取待检索图像的目标特征向量;
查询训练好的粗码本表,确认与所述目标特征向量最近的多个目标粗聚类中心点和每个所述目标粗聚类中心点对应的目标样本识别码,所述粗码本表包括对所有样本的特征向量进行聚类得到的粗聚类中心点,所述样本识别码在基于样本数据库训练所述粗码本表和子码本表时生成,其中,将不同类型的样本图像分配至不同的样本数据库,再各自训练每个样本数据库的粗码本表和子码本表,并将所述每个样本数据库划分为多个子数据库,在遍历样本数据库时,同步遍历所述多个子数据库;
利用所述多个目标粗聚类中心点查询训练好的子码本表,得到多个目标子聚类中心点,所述子码本表包括对多个样本的残差向量进行乘积量化得到的多个子聚类中心点,所述残差向量通过所述样本的特征向量与最近的粗聚类中心点做残差得到;
计算所述目标特征向量与每个所述粗聚类中心点的距离,得到第一距离值;
利用所述样本识别码查询预先计算好的距离表,得到第二距离值;所述距离表包括所述样本识别码和对应的距离值,所述距离值通过所述样本的粗聚类中心点和子聚类中心点计算得到;
计算所述目标特征向量与每个所述子聚类中心点的内积,得到第三距离值;
利用所述第一距离值、所述第二距离值和所述第三距离值计算得到多个目标样本的特征向量与所述目标特征向量的距离;
选取所述距离最近的预设数量个目标样本作为检索结果。
2.根据权利要求1所述的图像检索方法,其特征在于,还包括:训练所述粗码本表、所述子码本表及生成样本识别码,包括:
获取样本数据库中每个样本的特征向量;
将多个所述特征向量分别进行粗聚类,得到多个粗聚类中心点,并记录每个所述粗聚类中心点的编号;
分别将每个所述特征向量与距离最近的所述粗聚类中心点做残差,得到多个残差向量;
对所述多个残差向量分别进行乘积量化,得到多个子聚类中心点,并记录每个所述子聚类中心点的量化码;
利用所述编号和所述量化码得到所述样本识别码,并输出所述多个粗聚类中心点得到所述粗码本表,输出所述多个子聚类中心点得到所述子码本表。
3.根据权利要求2所述的图像检索方法,其特征在于,所述利用所述编号和所述量化码得到所述样本识别码,并输出所述多个粗聚类中心点得到所述粗码本表,输出所述多个子聚类中心点得到所述子码本表的步骤之后,还包括:
提取测试图像的测试特征向量;
基于所述测试特征向量、所述粗码本表、所述子码本表、所述样本识别码、所述距离表进行查询,得到第一检索结果;
将所述测试特征向量与所述样本数据库中每一个样本图像的特征进行比对,得到第二检索结果;
取所述第一检索结果和所述第二检索结果的交集,得到第三检索结果;
计算所述第三检索结果和所述第二检索结果的比值,得到召回率;
当所述召回率高于第一预设阈值时,确认所述粗码本表和所述子码本表训练合格。
4.根据权利要求2所述的图像检索方法,其特征在于,所述利用所述编号和所述量化码得到所述样本识别码,并输出所述多个粗聚类中心点得到所述粗码本表,输出所述多个子聚类中心点得到所述子码本表的步骤之后,还包括:
间隔预设时间段后,获取所述样本数据库中新增样本的个数;
当所述新增样本的个数超过第二预设阈值时,利用所述新增样本对所述粗码本表和所述子码本表进行训练,并生成所述新增样本的样本识别码。
5.根据权利要求2所述的图像检索方法,其特征在于,还包括:生成所述距离表,包括:
获取每个所述样本对应的粗聚类中心点和子聚类中心点;
利用每个所述样本的粗聚类中心点和子聚类中心点进行计算,得到每个所述样本的距离值;
将每个所述样本的样本识别码与所述距离值进行对应,得到所述距离表。
6.根据权利要求1所述的图像检索方法,其特征在于,所述提取待检索图像的目标特征向量的步骤之后,还包括:
基于所述目标特征向量加载与所述待检索图像对应的所述样本数据库、所述粗码本表和所述子码本表。
7.根据权利要求6所述的图像检索方法,其特征在于,所述基于所述目标特征向量加载与所述待检索图像对应的所述样本数据库、所述粗码本表和所述子码本表的步骤之后,还包括:
接收外部输入的过滤条件;
基于所述过滤条件过滤掉所述样本数据库中不符合要求的样本。
8.根据权利要求1所述的图像检索方法,其特征在于,所述得到与所述目标特征向量最近的预设数量个检索结果的步骤之后,还包括:
计算所述目标特征向量与所述检索结果中每个样本的特征向量的相似度;
基于所述相似度筛选出目标数量的样本作为最终检索结果。
9.一种终端,其特征在于,所述终端包括处理器、与所述处理器耦接的存储器,其中,
所述存储器存储有用于实现如权利要求1-8中任一项所述的图像检索方法的程序指令;
所述处理器用于执行所述存储器存储的所述程序指令以检索与待检索图像相似的图像。
10.一种存储装置,其特征在于,存储有能够实现如权利要求1-8中任一项所述的图像检索方法的程序文件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911285315.4A CN111143597B (zh) | 2019-12-13 | 2019-12-13 | 图像检索方法、终端及存储装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911285315.4A CN111143597B (zh) | 2019-12-13 | 2019-12-13 | 图像检索方法、终端及存储装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111143597A CN111143597A (zh) | 2020-05-12 |
CN111143597B true CN111143597B (zh) | 2023-06-20 |
Family
ID=70518359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911285315.4A Active CN111143597B (zh) | 2019-12-13 | 2019-12-13 | 图像检索方法、终端及存储装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111143597B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111581423B (zh) * | 2020-05-29 | 2021-10-26 | 上海依图网络科技有限公司 | 一种目标检索方法及装置 |
CN112418298B (zh) * | 2020-11-19 | 2021-12-03 | 北京云从科技有限公司 | 数据检索方法、装置以及计算机可读存储介质 |
CN113360700B (zh) * | 2021-06-30 | 2023-09-29 | 北京百度网讯科技有限公司 | 图文检索模型的训练和图文检索方法、装置、设备和介质 |
CN113536020B (zh) * | 2021-07-23 | 2022-05-24 | 贝壳找房(北京)科技有限公司 | 数据查询的方法、存储介质和计算机程序产品 |
CN113656373A (zh) * | 2021-08-16 | 2021-11-16 | 百度在线网络技术(北京)有限公司 | 构建检索数据库的方法、装置、设备以及存储介质 |
JP7558299B2 (ja) | 2021-08-16 | 2024-09-30 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | 検索データベースを構築するための方法、装置、デバイス及び記憶媒体 |
CN114299306B (zh) * | 2021-10-22 | 2025-01-21 | 腾讯科技(深圳)有限公司 | 获取图像检索模型的方法、图像检索方法、装置和设备 |
CN114218420A (zh) * | 2021-11-15 | 2022-03-22 | 浙江大华技术股份有限公司 | 图像检索的加速方法、检索设备、电子设备和存储介质 |
CN116010669B (zh) * | 2023-01-18 | 2023-12-08 | 深存科技(无锡)有限公司 | 向量库重训练的触发方法、装置、检索服务器及存储介质 |
CN119415724A (zh) * | 2023-07-21 | 2025-02-11 | 华为技术有限公司 | 一种数据处理方法及装置 |
CN116662588B (zh) * | 2023-08-01 | 2023-10-10 | 山东省大数据中心 | 一种海量数据智能搜索方法及系统 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0831457A2 (en) * | 1996-09-24 | 1998-03-25 | Sony Corporation | Vector quantization method and speech encoding method and apparatus |
JP2010218181A (ja) * | 2009-03-17 | 2010-09-30 | Yahoo Japan Corp | 画像検索装置 |
CN103577824A (zh) * | 2012-07-24 | 2014-02-12 | 浙江大华技术股份有限公司 | 一种提取目标图像的方法及装置 |
CN103902704A (zh) * | 2014-03-31 | 2014-07-02 | 华中科技大学 | 面向大规模图像视觉特征的多维倒排索引与快速检索算法 |
CN104008127A (zh) * | 2014-04-21 | 2014-08-27 | 中国电子科技集团公司第二十八研究所 | 一种基于聚类算法的群组识别方法 |
JP2015022383A (ja) * | 2013-07-16 | 2015-02-02 | Kddi株式会社 | 画像に基づくバイナリ局所特徴ベクトルを用いた検索装置、システム、プログラム及び方法 |
CN105117407A (zh) * | 2015-07-27 | 2015-12-02 | 电子科技大学 | 一种基于聚类的距离方向直方图的图像检索方法 |
CN106777349A (zh) * | 2017-01-16 | 2017-05-31 | 广东工业大学 | 基于深度学习的人脸检索系统及方法 |
CN109740660A (zh) * | 2018-12-27 | 2019-05-10 | 深圳云天励飞技术有限公司 | 图像处理方法及装置 |
CN110083731A (zh) * | 2019-03-12 | 2019-08-02 | 平安科技(深圳)有限公司 | 图像检索方法、装置、计算机设备及存储介质 |
CN110134804A (zh) * | 2019-05-20 | 2019-08-16 | 北京达佳互联信息技术有限公司 | 图像检索方法、装置及存储介质 |
CN110245714A (zh) * | 2019-06-20 | 2019-09-17 | 厦门美图之家科技有限公司 | 图像识别方法、装置及电子设备 |
CN110275970A (zh) * | 2019-06-21 | 2019-09-24 | 北京达佳互联信息技术有限公司 | 图像检索的方法、装置、服务器及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5808371B2 (ja) * | 2013-08-28 | 2015-11-10 | ヤフー株式会社 | 画像認識装置、画像認識方法及び画像認識プログラム |
US9430718B1 (en) * | 2015-02-09 | 2016-08-30 | Sony Corporation | Efficient local feature descriptor filtering |
CN105095435A (zh) * | 2015-07-23 | 2015-11-25 | 北京京东尚科信息技术有限公司 | 一种图像高维特征的相似比较方法及装置 |
-
2019
- 2019-12-13 CN CN201911285315.4A patent/CN111143597B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0831457A2 (en) * | 1996-09-24 | 1998-03-25 | Sony Corporation | Vector quantization method and speech encoding method and apparatus |
JP2010218181A (ja) * | 2009-03-17 | 2010-09-30 | Yahoo Japan Corp | 画像検索装置 |
CN103577824A (zh) * | 2012-07-24 | 2014-02-12 | 浙江大华技术股份有限公司 | 一种提取目标图像的方法及装置 |
JP2015022383A (ja) * | 2013-07-16 | 2015-02-02 | Kddi株式会社 | 画像に基づくバイナリ局所特徴ベクトルを用いた検索装置、システム、プログラム及び方法 |
CN103902704A (zh) * | 2014-03-31 | 2014-07-02 | 华中科技大学 | 面向大规模图像视觉特征的多维倒排索引与快速检索算法 |
CN104008127A (zh) * | 2014-04-21 | 2014-08-27 | 中国电子科技集团公司第二十八研究所 | 一种基于聚类算法的群组识别方法 |
CN105117407A (zh) * | 2015-07-27 | 2015-12-02 | 电子科技大学 | 一种基于聚类的距离方向直方图的图像检索方法 |
CN106777349A (zh) * | 2017-01-16 | 2017-05-31 | 广东工业大学 | 基于深度学习的人脸检索系统及方法 |
CN109740660A (zh) * | 2018-12-27 | 2019-05-10 | 深圳云天励飞技术有限公司 | 图像处理方法及装置 |
CN110083731A (zh) * | 2019-03-12 | 2019-08-02 | 平安科技(深圳)有限公司 | 图像检索方法、装置、计算机设备及存储介质 |
CN110134804A (zh) * | 2019-05-20 | 2019-08-16 | 北京达佳互联信息技术有限公司 | 图像检索方法、装置及存储介质 |
CN110245714A (zh) * | 2019-06-20 | 2019-09-17 | 厦门美图之家科技有限公司 | 图像识别方法、装置及电子设备 |
CN110275970A (zh) * | 2019-06-21 | 2019-09-24 | 北京达佳互联信息技术有限公司 | 图像检索的方法、装置、服务器及存储介质 |
Non-Patent Citations (1)
Title |
---|
一种基于子空间聚类的图像分层索引方法;许宏丽;须德;林恩爱;;中国图象图形学报(第01期);第143-146页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111143597A (zh) | 2020-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111143597B (zh) | 图像检索方法、终端及存储装置 | |
CN108804641B (zh) | 一种文本相似度的计算方法、装置、设备和存储介质 | |
CN111798273A (zh) | 产品的购买概率预测模型的训练方法及购买概率预测方法 | |
CN115563287B (zh) | 一种获取关联对象的数据处理系统 | |
CN110825894B (zh) | 数据索引建立、数据检索方法、装置、设备和存储介质 | |
CN112364014B (zh) | 数据查询方法、装置、服务器及存储介质 | |
US20230205755A1 (en) | Methods and systems for improved search for data loss prevention | |
US20210026891A1 (en) | Information processing method, related device, and computer storage medium | |
US10331717B2 (en) | Method and apparatus for determining similar document set to target document from a plurality of documents | |
CN110083731B (zh) | 图像检索方法、装置、计算机设备及存储介质 | |
CN104462347A (zh) | 关键词的分类方法及装置 | |
CN119046285A (zh) | 向量索引的方法、装置、电子设备及可读存储介质 | |
CN114120064A (zh) | 训练数据集的生成方法、神经网络的训练方法及装置 | |
CN102567420B (zh) | 文档检索方法和装置 | |
CN112100670A (zh) | 一种基于大数据的隐私数据分级保护方法 | |
US8577861B2 (en) | Apparatus and method for searching information | |
EP2763052A1 (en) | Search method and information management device | |
CN115293271A (zh) | 预测模型的训练方法、装置、设备及存储介质 | |
CN115563515A (zh) | 文本相似性检测方法、装置、设备及存储介质 | |
CN115732052A (zh) | 基于结构化临床项目的病例报告表生成方法及设备 | |
CN107967300B (zh) | 机构名称的检索方法、装置、设备及存储介质 | |
CN113065071A (zh) | 一种产品信息推荐方法及计算机设备 | |
CN114692638B (zh) | 行业实体的识别方法、装置、存储介质及电子设备 | |
CN117851608B (zh) | 案件图谱生成方法、装置、设备和介质 | |
US20230296406A1 (en) | Apparatus and method for matching POI entities |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |