[go: up one dir, main page]

CN103176980A - 一种标引方法及装置 - Google Patents

一种标引方法及装置 Download PDF

Info

Publication number
CN103176980A
CN103176980A CN2011104306563A CN201110430656A CN103176980A CN 103176980 A CN103176980 A CN 103176980A CN 2011104306563 A CN2011104306563 A CN 2011104306563A CN 201110430656 A CN201110430656 A CN 201110430656A CN 103176980 A CN103176980 A CN 103176980A
Authority
CN
China
Prior art keywords
keywords
group
picture
keyword
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011104306563A
Other languages
English (en)
Inventor
张宇伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN2011104306563A priority Critical patent/CN103176980A/zh
Publication of CN103176980A publication Critical patent/CN103176980A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种标引方法,用于提升标引质量,从而提高检索性能。所述方法为:获得第一用户输入的针对一图片的第一组关键词,所述第一组关键词中包括至少一个关键词;获得第二用户输入的针对所述图片的第二组关键词,所述第二组关键词中包括至少一个关键词;判断所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词是否满足第一预设条件;当判断结果为是时,将所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词中的任一个关键词确定为所述图片的标签。本发明还公开了用于实现所述方法的装置。

Description

一种标引方法及装置
技术领域
本发明涉及计算机领域,特别涉及一种标引方法及装置。
背景技术
随着WEB2.0、WEB3.0的应用发展,标签(tag)技术被广泛应用,加注标签是为了更好地显示和突出待搜寻的重点关键词或者词条,以便更好地指导用户进行浏览和查询。
图片内容标引就是帮助用户对库中图片进行准确、高效、深入的标引,从而为检索提供可靠、全面的标引信息,有效提升检索性能。图片内容标引主要包括四项内容,分别是基本类别标引、自拟标引、智能辅助标引及标引质量管理。
自拟标引,即标引人员根据自身对图片内容的理解,输入自拟的标签来进行标引,其目的是提供基本类别标引无法表述的具体图片语义信息,通过细化标签的粒度来保证标引的精度。引入开放的自拟标签标引体制是因为图片数据的涵义丰富多样,无法用固定的封闭的标签体系来描述。标引人员、尤其是非专业标引人员可能会输入完全不符合图片内容的标签,造成标引错误。
为解决标引错误问题,现有技术中普遍采用单人标引和校对机制,即一人标引,一人校对的标引流程。
本申请发明人在实现本申请实施例技术方案的过程中,至少发现现有技术中存在如下技术问题:
一、精度不高。由校对人员检查标引人员的标引结果,其评价的准确性如何难以把握,可能会造成修正错误。本质原因是图片标引过程是较为主观化的活动,校对人员查看已有标签时容易受到影响,对模棱两可的标签无法判断正误。
二、开放度不够。现有的标引流程只适用于组织专门标引者集中标引的场合,不利于非专业人员参与标引。而构建海量规模的图片库却需要开放的标引策略以实现网络用户参与标引。
发明内容
本发明实施例提供一种标引方法,用于提升标引质量,从而提高检索性能。
一种标引方法,用于对图片进行标引,包括以下步骤:
获得第一用户输入的针对一图片的第一组关键词,所述第一组关键词中包括至少一个关键词;
获得第二用户输入的针对所述图片的第二组关键词,所述第二组关键词中包括至少一个关键词;
判断所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词是否满足第一预设条件;
当判断结果为是时,将所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词中的任一个关键词确定为所述图片的标签。
一种标引装置,用于对图片进行标引,包括:
获取模块,用于获得第一用户输入的针对一图片的第一组关键词,所述第一组关键词中包括至少一个关键词,及获得第二用户输入的针对所述图片的第二组关键词,所述第二组关键词中包括至少一个关键词;
判断模块,用于判断所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词是否满足第一预设条件;
处理模块,用于当判断结果为是时,将所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词中的任一个关键词确定为所述图片的标签。
本发明实施例中标引方法为获得第一用户输入的针对一图片的第一组关键词,所述第一组关键词中包括至少一个关键词;获得第二用户输入的针对所述图片的第二组关键词,所述第二组关键词中包括至少一个关键词;判断所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词是否满足第一预设条件;当判断结果为是时,将所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词中的任一个关键词确定为所述图片的标签。本发明实施例中可以有不同用户对任一图片进行标引,当确定不同用户输入的关键词满足第一预设条件时,可以将所述至少两个关键词中的任一个关键词确定为所述图片的标签,这样可以得到较为准确的标签。不再需要专门的校对人员来检查标签精度,提高了工作效率。其次多用户合作所决定的标签代表了主流的语义解释,具有明显的合理性。
附图说明
图1为本发明实施例中标引装置的主要结构图;
图2为本发明实施例中标引方法的主要流程图。
具体实施方式
本发明实施例中标引方法为获得第一用户输入的针对一图片的第一组关键词,所述第一组关键词中包括至少一个关键词;获得第二用户输入的针对所述图片的第二组关键词,所述第二组关键词中包括至少一个关键词;判断所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词是否满足第一预设条件;当判断结果为是时,将所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词中的任一个关键词确定为所述图片的标签。本发明实施例中可以有不同用户对任一图片进行标引,当确定不同用户输入的关键词满足第一预设条件时,可以将所述至少两个关键词中的任一个关键词确定为所述图片的标签,这样可以得到较为准确的标签。不再需要专门的校对人员来检查标签精度,提高了工作效率。其次多用户合作所决定的标签代表了主流的语义解释,具有明显的合理性。
参见图1,本发明实施例中标引装置包括获取模块101、判断模块102和处理模块103。
获取模块101用于获得第一用户输入的针对一图片的第一组关键词,所述第一组关键词中包括至少一个关键词,及获得第二用户输入的针对所述图片的第二组关键词,所述第二组关键词中包括至少一个关键词。当需要对一图片进行标引时,可以有至少两个用户输入关键词对该图片进行标引,获取模块101获得至少两个用户输入的关键词,其中,每个用户针对一幅图片可以输入一组关键词,该一组关键词中至少包括一个关键词。本发明实施例以两个用户输入关键词为例。在实际操作时,该两个用户可以同时进行输入,也可以不完全同步,例如,第一用户先输入了第一组关键词,系统开始计时,如果第二用户在第一预设时间之内输入了第二组关键词,则系统默认有效,获取模块101进行获取,如果第二用户是在该第一预设时间之外输入了第二组关键词,则系统可能会提示第一用户再次输入第一组关键词,并开始计时,如果该第一用户在所述第一预设时间之内再次输入了第一组关键词,则获取模块101进行获取,系统进行后续操作。本发明实施例中,所述用户可以是标引者。
判断模块102用于判断所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词是否满足第一预设条件。本发明实施例以两个用户输入关键词为例,则获取模块101共获得两组关键词。所述第一预设条件可以是第一组关键词中包含的关键词及第二组关键词中包含的关键词相同,或者也可以是第一组关键词中包含的关键词及第二组关键词中包含的关键词为同义词或近义词。例如,针对一幅蓝色调图片,两个用户输入了两组关键词,每组关键词中分别包括一个关键词,所述包括的关键词均为“安静”,则判断模块102确定第一组关键词中包含的关键词及第二组关键词中包含的关键词满足第一预设条件;如果第一用户输入的第一组关键词中包含的关键词为“安静”,第二用户输入的第二组关键词中包含的关键词为“沉静”,因“安静”与“沉静”是近义词,因此判断模块102也可以确定第一组关键词中包含的关键词及第二组关键词中包含的关键词满足第一预设条件。
处理模块103用于当判断结果为是时,将所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词中的任一个关键词确定为所述图片的标签。当判断模块102判断确定针对一幅图片的所有关键词均满足第一预设条件时,处理模块103可以从该所有关键词中任选一个作为该图片的标签。如果该所有关键词均相同,则处理模块103确定所述相同的关键词为所述图片的标签,如果该所有关键词均为同义词或近义词,则处理模块103可以从中任选一个关键词来作为所述图片的标签。
可以有一个第二预设时间,在开始对一图片进行标引时即开始计时,如果在该第二预设时间内没有关键词符合条件,则判断模块102可以判断是否还有需标引的图片,如果有,则继续对下一幅需标引的图片进行标引,继续获得下一幅需标引的图片的关键词,如果没有,则可以结束操作。其中,如果需标引的图片有多幅,则所述下一幅需标引的图片可以是所述多幅图片中的任意一幅图片。
其中,一幅图片可以对应有一个标签,也可以对应多个标签。如果一幅图片需要对应多个标签,则在处理模块103确定该图片的一个标签后,可以通知判断模块102判断该图片是否需要继续确定新标签,当判断确定该图片需要继续确定新标签时,通知获取模块101继续获取第一用户及第二用户针对该图片的两组关键词,如果判断确定该图片不需要继续确定新标签,则可以继续判断是否还有需标引的图片。
以下通过具体实施例介绍本发明实施例中的标引方法。
参见图2,本发明实施例中标引方法的主要流程如下:
步骤201:获得第一用户输入的针对一图片的第一组关键词,所述第一组关键词中包括至少一个关键词。
步骤202:获得第二用户输入的针对所述图片的第二组关键词,所述第二组关键词中包括至少一个关键词。
步骤203:判断所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词是否满足第一预设条件。
步骤204:当判断结果为是时,将所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词中的任一个关键词确定为所述图片的标签。
本发明实施例中标引方法为获得第一用户输入的针对一图片的第一组关键词,所述第一组关键词中包括至少一个关键词;获得第二用户输入的针对所述图片的第二组关键词,所述第二组关键词中包括至少一个关键词;判断所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词是否满足第一预设条件;当判断结果为是时,将所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词中的任一个关键词确定为所述图片的标签。本发明实施例中可以有不同用户对任一图片进行标引,当确定不同用户输入的关键词满足第一预设条件时,可以将所述至少两个关键词中的任一个关键词确定为所述图片的标签,这样可以得到较为准确的标签。不再需要专门的校对人员来检查标签精度,提高了工作效率。其次多用户合作所决定的标签代表了主流的语义解释,具有明显的合理性。在确定某图片的一个标签之后,判断模块102还可以判断该图片是否还需要确定新标签,如果需要,可以继续获取新的关键词,从而保证每幅图片能够获得足够的标签,更便于查找。并且,如果在第二预设时间之内没有符合条件的关键词可以确定为某一图片的标签,则可以判断是否还有需标引的图片,如果有,则继续标引下一幅需标引的图片,以提高标引效率。本发明实施例保证了工作效率,节省了校对的过程,节省了时间。同时,所有人员作为用户在一定时间内合作标引的图片数目,或者给出的标签数目等,可作为明确的评价指标来量化他们的绩效和贡献。在排名激励后,可大幅提高用户的积极性,从而提高工作效率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种标引方法,用于对图片进行标引,其特征在于,包括以下步骤:
获得第一用户输入的针对一图片的第一组关键词,所述第一组关键词中包括至少一个关键词;
获得第二用户输入的针对所述图片的第二组关键词,所述第二组关键词中包括至少一个关键词;
判断所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词是否满足第一预设条件;
当判断结果为是时,将所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词中的任一个关键词确定为所述图片的标签。
2.如权利要求1所述的方法,其特征在于,所述第一预设条件为:所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词相同,或所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词为同义词或近义词。
3.如权利要求2所述的方法,其特征在于,当判断结果为是时,将所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词中的任一个关键词确定为所述图片的标签的步骤包括:
如果所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词相同,则当判断结果为是时,将所述相同的关键词确定为所述图片的标签;
如果所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词为同义词或近义词,则当判断结果为是时,将所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词中的任一个关键词确定为所述图片的标签。
4.如权利要求1所述的方法,其特征在于,在当判断结果为是时,将所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词中的任一个关键词确定为所述图片的标签之后还包括步骤:
判断所述图片是否还需要确定新标签;
当判断确定所述图片需要确定新标签时,获得第一用户输入的针对所述图片的第三组关键词,所述第三组关键词中包括至少一个关键词,及获得第二用户输入的针对所述图片的第四组关键词,所述第四组关键词中包括至少一个关键词。
5.如权利要求1或4所述的方法,其特征在于,在当判断结果为是时,将所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词中的任一个关键词确定为所述图片的标签之后还包括步骤:
判断是否还有需标引的图片;
当判断确定还有需标引的图片时,获得第一用户输入的针对需标引的图片的第五组关键词,所述第五组关键词中包括至少一个关键词,及获得第二用户输入的针对所述需标引的图片的第六组关键词,所述第六组关键词中包括至少一个关键词。
6.一种标引装置,用于对图片进行标引,其特征在于,包括:
获取模块,用于获得第一用户输入的针对一图片的第一组关键词,所述第一组关键词中包括至少一个关键词,及获得第二用户输入的针对所述图片的第二组关键词,所述第二组关键词中包括至少一个关键词;
判断模块,用于判断所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词是否满足第一预设条件;
处理模块,用于当判断结果为是时,将所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词中的任一个关键词确定为所述图片的标签。
7.如权利要求6所述的装置,其特征在于,所述第一预设条件为:所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词相同,或所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词为同义词或近义词。
8.如权利要求7所述的装置,其特征在于,所述处理模块具体用于:
如果所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词相同,则当判断结果为是时,将所述相同的关键词确定为所述图片的标签;
如果所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词为同义词或近义词,则当判断结果为是时,将所述第一组关键词中包含的关键词及所述第二组关键词中包含的关键词中的任一个关键词确定为所述图片的标签。
9.如权利要求6所述的装置,其特征在于,
所述判断模块还用于判断所述图片是否还需要确定新标签;
所述获取模块还用于当判断确定所述图片需要确定新标签时,获得第一用户输入的针对所述图片的第三组关键词,所述第三组关键词中包括至少一个关键词,及获得第二用户输入的针对所述图片的第四组关键词,所述第四组关键词中包括至少一个关键词。
10.如权利要求6或9所述的装置,其特征在于,
所述判断模块还用于判断是否还有需标引的图片;
所述获取模块还用于当判断确定还有需标引的图片时,获得第一用户输入的针对需标引的图片的第五组关键词,所述第五组关键词中包括至少一个关键词,及获得第二用户输入的针对所述需标引的图片的第六组关键词,所述第六组关键词中包括至少一个关键词。
CN2011104306563A 2011-12-20 2011-12-20 一种标引方法及装置 Pending CN103176980A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011104306563A CN103176980A (zh) 2011-12-20 2011-12-20 一种标引方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011104306563A CN103176980A (zh) 2011-12-20 2011-12-20 一种标引方法及装置

Publications (1)

Publication Number Publication Date
CN103176980A true CN103176980A (zh) 2013-06-26

Family

ID=48636861

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011104306563A Pending CN103176980A (zh) 2011-12-20 2011-12-20 一种标引方法及装置

Country Status (1)

Country Link
CN (1) CN103176980A (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452479A (zh) * 2007-12-04 2009-06-10 株式会社理光 文件管理装置、文件管理方法和计算机程序产品

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452479A (zh) * 2007-12-04 2009-06-10 株式会社理光 文件管理装置、文件管理方法和计算机程序产品

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LUIS VON AHN等: "Labeling Images with a Computer Game", 《PROCEEDINGS OF THE SIGCHI CONFERENCE ON HUMAN FACTORS IN COMPUTING SYSTEMS》, 29 April 2004 (2004-04-29) *
郭乔进: "基于关键词的图像标注综述", 《计算机工程与应用》, 21 October 2011 (2011-10-21) *

Similar Documents

Publication Publication Date Title
US11354356B1 (en) Video segments for a video related to a task
US9244991B2 (en) Uniform search, navigation and combination of heterogeneous data
US10042911B2 (en) Discovery of related entities in a master data management system
US8370359B2 (en) Method to perform mappings across multiple models or ontologies
WO2015010566A1 (zh) 综合信息精准搜索方法
JP2013518322A5 (zh)
CN108132957A (zh) 一种数据库处理方法及装置
US20150234883A1 (en) Method and system for retrieving real-time information
WO2022027943A1 (zh) 一种基于污染要素源解析的水污染溯源系统及方法
US11200201B2 (en) Metadata storage method, device and server
CN103020086B (zh) 一种图片查重的方法及装置
CN108446115A (zh) 一种代码复用的方法及装置
CN106484699A (zh) 数据库查询字段的生成方法及装置
JP2012038207A5 (zh)
US20160004752A1 (en) Single table index relational database
CN114064606A (zh) 数据库迁移方法、装置、设备、存储介质和系统
CN107807964A (zh) 数字内容排序方法、装置和计算机可读存储介质
CN103176980A (zh) 一种标引方法及装置
US10944756B2 (en) Access control
CN113535781B (zh) 一种时序库的数据查询方法、装置、设备及存储介质
CN105787029A (zh) 一种基于solr的关键字词识别办法
JP6516343B2 (ja) アプリケーションユーザーインターフェース自動テスト方法、電子装置、システム及び記憶媒体
CN116594628A (zh) 数据溯源方法、装置和计算机设备
CN111625570A (zh) 列表数据资源检索方法及装置
CN109948021A (zh) 一种基于Elasticsearch的云盘搜索方法、系统、服务器及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130626