[go: up one dir, main page]

CN108628832A - 一种信息情报关键字获取方法及装置 - Google Patents

一种信息情报关键字获取方法及装置 Download PDF

Info

Publication number
CN108628832A
CN108628832A CN201810431832.7A CN201810431832A CN108628832A CN 108628832 A CN108628832 A CN 108628832A CN 201810431832 A CN201810431832 A CN 201810431832A CN 108628832 A CN108628832 A CN 108628832A
Authority
CN
China
Prior art keywords
keyword
keywords
coverage
preset
interim
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810431832.7A
Other languages
English (en)
Other versions
CN108628832B (zh
Inventor
李素粉
孙兆欣
张云勇
滕佳佳
伍珺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN201810431832.7A priority Critical patent/CN108628832B/zh
Publication of CN108628832A publication Critical patent/CN108628832A/zh
Application granted granted Critical
Publication of CN108628832B publication Critical patent/CN108628832B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种信息情报关键字获取方法及装置,通过计算当前热点信息关键字集合、各跟踪对象的共性关键字集合、各跟踪对象的个性关键字集合的并集,可以快速确定出信息情报关键字,且确定出的信息情报关键字不但覆盖当前热点信息,而且具有针对性,能够满足各用户(即跟踪对象)的个性化需求,具有多维度、覆盖面广的特点。

Description

一种信息情报关键字获取方法及装置
技术领域
本发明涉及通信技术领域,具体涉及一种信息情报关键字获取方法及装置。
背景技术
为适应市场环境变化,情报工作一直受到国内外主流运营商、设备商和互联网企业的高度重视,为公司战略提供决策支撑。
根据Gartner的分析报告,世界排名前30的电信运营商均有专门竞争情报部门,且非常重视情报工作,AT&T早在2007年就设计专业门户管理其情报工作;Verizon也早在2008年就建立自服务模型以提高情报服务效率,并在Linkin常年热招情报分析人员,截至2016年发布相关职位招聘77个;德国电信市场与竞争情报部门的领导者亦是世界竞争情报大会及欧洲竞争情报大会的专家。
关键字是获取信息素材的主要检索依据,如何获取信息情报关键字,是信息情报管理面临的一个主要问题。
发明内容
本发明针对现有技术中存在的上述不足,提供一种信息情报关键字获取方法及装置,用以至少部分解决如何自动获取信息情报关键字的问题。
本发明为解决上述技术问题,采用如下技术方案:
本发明提供一种信息情报关键字获取方法,所述方法包括:
确定第二关键字集合,所述第二关键字集合内的关键字为当前热点信息的关键字;
确定第三关键字集合,所述第三关键字集合内的关键字为各跟踪对象的共性关键字;
计算所述第二关键字集合、所述第三关键字集合以及预设的第一关键字集合的并集,以确定信息情报关键字;其中,所述第一关键字集合内的关键字为各跟踪对象的个性关键字。
优选的,所述确定第三关键字集合,具体包括:
计算各待选关键字的覆盖度;
根据所述各待选关键字的覆盖度、预设的阈值、所述第一关键字集合和第二关键字集合,确定第一临时集合;
根据预设的第三关键字集合内关键字的数量和所述第一临时集合,确定第三关键字集合。
优选的,所述计算各待选关键字的覆盖度,具体包括:
获取与各待选关键字相关的跟踪对象的数量,以及跟踪对象的总数量;
分别计算所述与各待选关键字相关的跟踪对象的数量和所述跟踪对象的总数量的比值,以得到各待选关键字的覆盖度。
优选的,所述根据预设的第三关键字集合内关键字的数量和所述第一临时集合,确定第三关键字集合,具体包括:
将所述第一临时集合内关键字的数量与预设的第三关键字集合内关键字的数量相比较;
若前者大于或等于后者,则将所述第一临时集合内的关键字按照覆盖度从大到小排序,并选取所述排序中前预设数量个关键字作为所述第三关键字集合的元素,所述预设数量为所述第三关键字集合内关键字的数量;
若前者小于后者,则所述第三关键字集合为所述第一临时集合。
优选的,所述根据所述各待选关键字的覆盖度、预设的阈值、所述第一关键字集合和第二关键字集合,确定第一临时集合,具体包括:
将所述各待选关键字的覆盖度与预设的阈值相比较,若前者大于后者,则将相应的待选关键字作为第二临时集合的元素;
计算所述第二临时集合、第一关键字集合和第二关键字集合的交集并取反,以得到所述第一临时集合。
本发明还提供一种关键字管理装置,所述装置包括:第一处理模块、第二处理模块和第三处理模块;
所述第一处理模块用于,确定第二关键字集合,所述第二关键字集合内的关键字为当前热点信息的关键字;
所述第二处理模块用于,确定第三关键字集合,所述第三关键字集合内的关键字为各跟踪对象的共性关键字;
所述第三处理模块用于,计算所述第二关键字集合、所述第三关键字集合以及预设的第一关键字集合的并集,以确定信息情报关键字;其中,所述第一关键字集合内的关键字为各跟踪对象的个性关键字。
优选的,所述第二处理模块具体用于,计算各待选关键字的覆盖度;根据所述各待选关键字的覆盖度、预设的阈值、所述第一关键字集合和第二关键字集合,确定第一临时集合;根据预设的第三关键字集合内关键字的数量和所述第一临时集合,确定第三关键字集合。
优选的,所述第二处理模块具体用于,获取与各待选关键字相关的跟踪对象的数量,以及跟踪对象的总数量;分别计算所述与各待选关键字相关的跟踪对象的数量和所述跟踪对象的总数量的比值,以得到各待选关键字的覆盖度。
优选的,所述第二处理模块用于,将所述第一临时集合内关键字的数量与预设的第三关键字集合内关键字的数量相比较;当前者大于或等于后者时,将所述第一临时集合内的关键字按照覆盖度从大到小排序,并选取所述排序中前预设数量个关键字作为所述第三关键字集合的元素,所述预设数量为所述第三关键字集合内关键字的数量;当前者小于后者时,所述第三关键字集合为所述第一临时集合。
优选的,所述第三处理模块用于,将所述各待选关键字的覆盖度与预设的阈值相比较,当前者大于后者时,将相应的待选关键字作为第二临时集合的元素,并计算所述第二临时集合、第一关键字集合和第二关键字集合的交集并取反,以得到所述第一临时集合。
本发明通过计算当前热点信息关键字集合、各跟踪对象的共性关键字集合、各跟踪对象的个性关键字集合的并集,可以快速确定出信息情报关键字,且确定出的信息情报关键字不但覆盖当前热点信息,而且具有针对性,能够满足各用户(即跟踪对象)的个性化需求,具有多维度、覆盖面广的特点。
附图说明
图1为本发明实施例提供的信息情报关键字获取流程图;
图2为本发明实施例提供的确定第三关键字集合的流程图之一;
图3为本发明实施例提供的确定第三关键字集合的流程图之二;
图4为本发明实施例提供的确定第一临时集合的流程图;
图5为本发明实施例提供的关键字管理装置的结构图。
具体实施方式
下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种信息情报关键字获取方法,所述方法应用于信息情报资源系统,所述信息情报资源系统包括:素材采集装置、资源池建立装置、信息情报资源池、跟踪对象数据库、跟踪对象管理装置、关键字数据库和关键字管理装置,跟踪对象管理装置用于更新跟踪对象数据库,关键字管理装置用于更新关键字数据库,素材采集装置通过跟踪对象管理装置和关键字管理装置分别获取跟踪对象信息素材和关键字信息素材,资源池建立装置对跟踪对象信息素材和关键字信息素材进行编码,得到情报信息,并将情报信息存储在信息情报资源池内。
在本发明实施例中,跟踪对象主要包括全球主流运营商及大型互联网公司,跟踪对象存储在跟踪对象数据库中。
情报信息关键字包括个性关键字和共性关键字。关键字根据本公司战略和重点工作等提炼形成,各个跟踪对象信息检索的必查关键字为共性关键字,例如5G、云计算、大数据、物联网等,共性关键字存储在关键字数据库的共性关键字模块内。根据跟踪对象的当前热点信息梳理提炼的关键字为该跟踪对象的个性关键字,个性关键字存储在关键字数据库的个性关键字模块内。
如图1所示,信息情报关键字获取方法包括以下步骤:
步骤101,确定第二关键字集合,所述第二关键字集合内的关键字为当前热点信息的关键字。
具体的,第二关键字集合kw2内关键字的数量为n2,n2为预设值,且n2≥0。kw2={kw21,kw22,kw23,…kw2n2},第二关键字集合kw2内的各关键字为当前热点信息的关键字,可以通过最活跃选取算法计算得到,最活跃选取算法为现有算法,在此不再赘述。
步骤102,确定第三关键字集合,所述第三关键字集合内的关键字为各跟踪对象的共性关键字。
具体的,第三关键字集合kw3内关键字的数量为n3,n3为预设值,且n3≥0。kw3={kw31,kw32,kw33,…kw3n3},第三关键字集合kw3内的各关键字为各跟踪对象的共性关键字,包括各跟踪对象均关注的热点词汇,例如:物联网、区块链、大数据等。
确定第三关键字集合kw3的具体实现方案后续结合图2再详细说明。
步骤103,计算第二关键字集合、第三关键字集合以及预设的第一关键字集合的并集,以确定信息情报关键字。
具体的,第一关键字集合kw1内关键字的数量为n1,n1为预设值,且n1≥0。信息情报关键字的总数量为n,n=n1+n2+n3,0≤n1≤n,0≤n2≤n,0≤n3≤n。kw1={kw11,kw12,kw13,…kw1n1},第一关键字集合kw1内的关键字为各跟踪对象的个性关键字,包括各个跟踪对象长期关注的领域和热点词汇,第一关键字集合kw1内的各关键字可以由各个跟踪对象设置。
最终确定出的信息情报关键字集合为kw,kw=kw1∪kw2∪kw3。
通过步骤101-103可以看出,本发明通过计算当前热点信息关键字集合、各跟踪对象的共性关键字集合、各跟踪对象的个性关键字集合的并集,可以快速确定出信息情报关键字,且确定出的信息情报关键字不但覆盖当前热点信息,而且具有针对性,能够满足各用户(即跟踪对象)的个性化需求,具有多维度、覆盖面广的特点。
进一步的,如图2所示,所述确定第三关键字集合(即步骤102),具体包括以下步骤:
步骤201,计算各待选关键字的覆盖度。
具体的,获取与各待选关键字相关的跟踪对象的数量T1i,以及跟踪对象的总数量T,分别计算所述与各待选关键字相关的跟踪对象的数量和所述跟踪对象的总数量的比值,以得到各待选关键字的覆盖度qi,即qi=T1i/T,其中,i表示待选关键字。
与各待选关键字相关的跟踪对象是指,关注该待选关键字的跟踪对象,即选择该待选关键字作为共性关键字和/或个性关键字的跟踪对象。
步骤202,根据各待选关键字的覆盖度qi、预设的阈值Q、第一关键字集合kw1和第二关键字集合kw2,确定第一临时集合temp1kw。
具体的,确定第一临时集合temp1kw的流程后续结合图4再详细说明。
步骤203,根据预设的第三关键字集合kw3内关键字的数量n3和第一临时集合temp1kw,确定第三关键字集合kw3。
具体的,第一临时集合temp1kw内的关键字有可能是最终的信息情报关键字,即第三关键字集合kw3与第一临时集合temp1kw相同。第一临时集合temp1kw内的关键字有可能与最终的信息情报关键字不同,即第一临时集合temp1kw的范围大于第三关键字集合kw3的范围。
具体如何确定第三关键字集合kw3的方案后续结合图3再详细说明。
通过步骤201-203可以看出,将各待选关键字的覆盖度qi作为确定第三关键字集合kw3内关键字的标准,可以选择出覆盖度较高、覆盖面广的关键字,从而能够涵盖各个跟踪对象的不同需求。
以下结合图3,对确定第三关键字集合kw3(即步骤203)的流程进行详细说明。如图3所示,确定第三关键字集合kw3的流程包括以下步骤:
步骤301,将第一临时集合内关键字的数量与预设的第三关键字集合内关键字的数量相比较,若前者大于后者,则执行步骤302;否则,执行步骤304。
具体的,假设第一临时集合temp1kw内关键字的数量为n’,将n’与第三关键字集合kw3内关键字的数量n3相比较,若n’>n3,说明第一临时集合temp1kw内关键字的数量大于所需的第三关键字集合kw3内关键字的数量,此时,需要进一步从第一临时集合temp1kw内选取更为合适的关键字放入第三关键字集合kw3内(即执行步骤302和步骤303);若n’≤n3,说明第一临时集合temp1kw内关键字的数量小于或等于所需的第三关键字集合kw3内关键字的数量,此时,将第一临时集合temp1kw内的全部关键字放入第三关键字集合kw3内(即执行步骤304)。
步骤302,将第一临时集合内的关键字按照覆盖度从大到小排序。
具体的,将第一临时集合temp1kw内的n’个关键字按照覆盖度qi从大到小排序,其中各关键字的覆盖度qi在步骤201中已计算得出。
步骤303,选取所述排序中前预设数量个关键字作为第三关键字集合的元素。
具体的,所述预设数量为第三关键字集合内关键字的数量n3,也就是说,在所述覆盖度排序中,选取前n3个关键字形成第三关键字集合kw3。
步骤304,第三关键字集合为第一临时集合。
具体的,若第一临时集合temp1kw内关键字的数量n’未达到第三关键字集合kw3所需的关键字数量,则将整个第一临时集合temp1kw作为第三关键字集合kw3。
通过步骤301-步骤303可以看出,通过对第一临时集合temp1kw内关键字的筛选,这样选择出的信息情报关键字(即第三键字集合kw3)的覆盖度更大,覆盖面更广。
以下结合图4,对确定第一临时集合temp1kw(即步骤202)的流程进行详细说明。如图3所示,确定第一临时集合temp1kw的流程包括以下步骤:
步骤401,将各待选关键字的覆盖度与预设的阈值相比较,若前者大于后者,则执行步骤402;否则,丢弃该待选关键字。
具体的,预先设定阈值Q,将各待选关键字的覆盖度qi分别与阈值Q相比较,若待选关键字的覆盖度qi>Q,说明该待选关键字合格,则将该待选关键字放入第二临时集合temp2kw中(即执行步骤402);若待选关键字的覆盖度qi≤Q,说明该待选关键字不合格,则丢弃该待选关键字。
步骤402,将相应的待选关键字作为第二临时集合的元素。
步骤403,计算第二临时集合、第一关键字集合和第二关键字集合的交集并取反,以得到第一临时集合。
具体的,第一临时集合这样,可以排除掉第二临时集合temp2kw、第一关键字集合kw1和第二关键字集合kw2中相同的关键字。在后续根据第一临时集合temp1kw确定第三关键字集合kw3时,避免第三关键字集合kw3内的关键字重复。
基于相同的技术构思,本发明实施例还提供一种关键字管理装置,如图5所示,该关键字管理装置包括:第一处理模块51、第二处理模块52和第三处理模块53。
第一处理模块51用于,确定第二关键字集合,所述第二关键字集合内的关键字为当前热点信息的关键字。
第二处理模块52用于,确定第三关键字集合,所述第三关键字集合内的关键字为各跟踪对象的共性关键字。
第三处理模块53用于,计算所述第二关键字集合、所述第三关键字集合以及预设的第一关键字集合的并集,以确定信息情报关键字;其中,所述第一关键字集合内的关键字为各跟踪对象的个性关键字。
优选的,第二处理模块52具体用于,计算各待选关键字的覆盖度;根据所述各待选关键字的覆盖度、预设的阈值、所述第一关键字集合和第二关键字集合,确定第一临时集合;根据预设的第三关键字集合内关键字的数量和所述第一临时集合,确定第三关键字集合。
优选的,第二处理模块52具体用于,获取与各待选关键字相关的跟踪对象的数量,以及跟踪对象的总数量;分别计算所述与各待选关键字相关的跟踪对象的数量和所述跟踪对象的总数量的比值,以得到各待选关键字的覆盖度。
优选的,第二处理模块52用于,将所述第一临时集合内关键字的数量与预设的第三关键字集合内关键字的数量相比较;当前者大于或等于后者时,将所述第一临时集合内的关键字按照覆盖度从大到小排序,并选取所述排序中前预设数量个关键字作为所述第三关键字集合的元素,所述预设数量为所述第三关键字集合内关键字的数量;当前者小于后者时,所述第三关键字集合为所述第一临时集合。
优选的,第三处理模块53用于,将所述各待选关键字的覆盖度与预设的阈值相比较,当前者大于后者时,将相应的待选关键字作为第二临时集合的元素,并计算所述第二临时集合、第一关键字集合和第二关键字集合的交集并取反,以得到所述第一临时集合。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。

Claims (10)

1.一种信息情报关键字获取方法,其特征在于,所述方法包括:
确定第二关键字集合,所述第二关键字集合内的关键字为当前热点信息的关键字;
确定第三关键字集合,所述第三关键字集合内的关键字为各跟踪对象的共性关键字;
计算所述第二关键字集合、所述第三关键字集合以及预设的第一关键字集合的并集,以确定信息情报关键字;其中,所述第一关键字集合内的关键字为各跟踪对象的个性关键字。
2.如权利要求1所述的方法,其特征在于,所述确定第三关键字集合,具体包括:
计算各待选关键字的覆盖度;
根据所述各待选关键字的覆盖度、预设的阈值、所述第一关键字集合和第二关键字集合,确定第一临时集合;
根据预设的第三关键字集合内关键字的数量和所述第一临时集合,确定第三关键字集合。
3.如权利要求2所述的方法,其特征在于,所述计算各待选关键字的覆盖度,具体包括:
获取与各待选关键字相关的跟踪对象的数量,以及跟踪对象的总数量;
分别计算所述与各待选关键字相关的跟踪对象的数量和所述跟踪对象的总数量的比值,以得到各待选关键字的覆盖度。
4.如权利要求2所述的方法,其特征在于,所述根据预设的第三关键字集合内关键字的数量和所述第一临时集合,确定第三关键字集合,具体包括:
将所述第一临时集合内关键字的数量与预设的第三关键字集合内关键字的数量相比较;
若前者大于或等于后者,则将所述第一临时集合内的关键字按照覆盖度从大到小排序,并选取所述排序中前预设数量个关键字作为所述第三关键字集合的元素,所述预设数量为所述第三关键字集合内关键字的数量;
若前者小于后者,则所述第三关键字集合为所述第一临时集合。
5.如权利要求2所述的方法,其特征在于,所述根据所述各待选关键字的覆盖度、预设的阈值、所述第一关键字集合和第二关键字集合,确定第一临时集合,具体包括:
将所述各待选关键字的覆盖度与预设的阈值相比较,若前者大于后者,则将相应的待选关键字作为第二临时集合的元素;
计算所述第二临时集合、第一关键字集合和第二关键字集合的交集并取反,以得到所述第一临时集合。
6.一种关键字管理装置,其特征在于,包括:第一处理模块、第二处理模块和第三处理模块;
所述第一处理模块用于,确定第二关键字集合,所述第二关键字集合内的关键字为当前热点信息的关键字;
所述第二处理模块用于,确定第三关键字集合,所述第三关键字集合内的关键字为各跟踪对象的共性关键字;
所述第三处理模块用于,计算所述第二关键字集合、所述第三关键字集合以及预设的第一关键字集合的并集,以确定信息情报关键字;其中,所述第一关键字集合内的关键字为各跟踪对象的个性关键字。
7.如权利要求6所述的关键字管理装置,其特征在于,所述第二处理模块具体用于,计算各待选关键字的覆盖度;根据所述各待选关键字的覆盖度、预设的阈值、所述第一关键字集合和第二关键字集合,确定第一临时集合;根据预设的第三关键字集合内关键字的数量和所述第一临时集合,确定第三关键字集合。
8.如权利要求7所述的关键字管理装置,其特征在于,所述第二处理模块具体用于,获取与各待选关键字相关的跟踪对象的数量,以及跟踪对象的总数量;分别计算所述与各待选关键字相关的跟踪对象的数量和所述跟踪对象的总数量的比值,以得到各待选关键字的覆盖度。
9.如权利要求7所述的关键字管理装置,其特征在于,所述第二处理模块用于,将所述第一临时集合内关键字的数量与预设的第三关键字集合内关键字的数量相比较;当前者大于或等于后者时,将所述第一临时集合内的关键字按照覆盖度从大到小排序,并选取所述排序中前预设数量个关键字作为所述第三关键字集合的元素,所述预设数量为所述第三关键字集合内关键字的数量;当前者小于后者时,所述第三关键字集合为所述第一临时集合。
10.如权利要求7所述的关键字管理装置,其特征在于,所述第三处理模块用于,将所述各待选关键字的覆盖度与预设的阈值相比较,当前者大于后者时,将相应的待选关键字作为第二临时集合的元素,并计算所述第二临时集合、第一关键字集合和第二关键字集合的交集并取反,以得到所述第一临时集合。
CN201810431832.7A 2018-05-08 2018-05-08 一种信息情报关键字获取方法及装置 Active CN108628832B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810431832.7A CN108628832B (zh) 2018-05-08 2018-05-08 一种信息情报关键字获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810431832.7A CN108628832B (zh) 2018-05-08 2018-05-08 一种信息情报关键字获取方法及装置

Publications (2)

Publication Number Publication Date
CN108628832A true CN108628832A (zh) 2018-10-09
CN108628832B CN108628832B (zh) 2022-03-18

Family

ID=63695891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810431832.7A Active CN108628832B (zh) 2018-05-08 2018-05-08 一种信息情报关键字获取方法及装置

Country Status (1)

Country Link
CN (1) CN108628832B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111651657A (zh) * 2020-06-04 2020-09-11 深圳前海微众银行股份有限公司 情报监控方法、装置、设备及计算机可读存储介质

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1912872A (zh) * 2006-07-25 2007-02-14 北京搜狗科技发展有限公司 一种提取新词的方法和系统
US7181438B1 (en) * 1999-07-21 2007-02-20 Alberti Anemometer, Llc Database access system
CN101296128A (zh) * 2007-04-24 2008-10-29 北京大学 一种对互联网信息进行异常状态监测的方法
CN101520878A (zh) * 2009-04-03 2009-09-02 华为技术有限公司 向用户进行广告推送的方法、装置和系统
CN102110269A (zh) * 2011-02-25 2011-06-29 中兴通讯股份有限公司 广告投放方法及系统
CN103425677A (zh) * 2012-05-18 2013-12-04 阿里巴巴集团控股有限公司 关键词分类模型确定方法、关键词分类方法及装置
CN103530398A (zh) * 2013-10-23 2014-01-22 合山市科学技术情报研究所 一种情报收集处理和检索系统
CN103714413A (zh) * 2013-11-21 2014-04-09 清华大学 基于职位信息构建素质模型的系统与方法
CN103744873A (zh) * 2013-12-18 2014-04-23 天脉聚源(北京)传媒科技有限公司 一种显示热点关键词的方法、装置及浏览器
CN104035997A (zh) * 2014-06-13 2014-09-10 淮阴工学院 一种基于文本分类和图像深度挖掘的科技情报获取与推送方法
CN104679787A (zh) * 2013-11-27 2015-06-03 华为技术有限公司 兴趣信息的统计方法及装置
CN104965893A (zh) * 2015-06-18 2015-10-07 山东师范大学 一种大数据广告投放方法
CN106126588A (zh) * 2016-06-17 2016-11-16 广州视源电子科技股份有限公司 提供相关词的方法和装置
CN106227735A (zh) * 2016-07-11 2016-12-14 苏州天梯卓越传媒有限公司 一种用于出版行业的词云选题方法及系统
CN106453423A (zh) * 2016-12-08 2017-02-22 黑龙江大学 一种基于用户个性化设置的垃圾邮件的过滤系统及方法
CN107341199A (zh) * 2017-06-21 2017-11-10 北京林业大学 一种基于文献信息共性模式的推荐方法
CN107786595A (zh) * 2016-08-26 2018-03-09 阿里巴巴集团控股有限公司 分布式存储系统中关键字的处理方法、装置及系统

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7181438B1 (en) * 1999-07-21 2007-02-20 Alberti Anemometer, Llc Database access system
CN1912872A (zh) * 2006-07-25 2007-02-14 北京搜狗科技发展有限公司 一种提取新词的方法和系统
CN101296128A (zh) * 2007-04-24 2008-10-29 北京大学 一种对互联网信息进行异常状态监测的方法
CN101520878A (zh) * 2009-04-03 2009-09-02 华为技术有限公司 向用户进行广告推送的方法、装置和系统
CN102110269A (zh) * 2011-02-25 2011-06-29 中兴通讯股份有限公司 广告投放方法及系统
CN103425677A (zh) * 2012-05-18 2013-12-04 阿里巴巴集团控股有限公司 关键词分类模型确定方法、关键词分类方法及装置
CN103530398A (zh) * 2013-10-23 2014-01-22 合山市科学技术情报研究所 一种情报收集处理和检索系统
CN103714413A (zh) * 2013-11-21 2014-04-09 清华大学 基于职位信息构建素质模型的系统与方法
CN104679787A (zh) * 2013-11-27 2015-06-03 华为技术有限公司 兴趣信息的统计方法及装置
CN103744873A (zh) * 2013-12-18 2014-04-23 天脉聚源(北京)传媒科技有限公司 一种显示热点关键词的方法、装置及浏览器
CN104035997A (zh) * 2014-06-13 2014-09-10 淮阴工学院 一种基于文本分类和图像深度挖掘的科技情报获取与推送方法
CN104965893A (zh) * 2015-06-18 2015-10-07 山东师范大学 一种大数据广告投放方法
CN106126588A (zh) * 2016-06-17 2016-11-16 广州视源电子科技股份有限公司 提供相关词的方法和装置
CN106227735A (zh) * 2016-07-11 2016-12-14 苏州天梯卓越传媒有限公司 一种用于出版行业的词云选题方法及系统
CN107786595A (zh) * 2016-08-26 2018-03-09 阿里巴巴集团控股有限公司 分布式存储系统中关键字的处理方法、装置及系统
CN106453423A (zh) * 2016-12-08 2017-02-22 黑龙江大学 一种基于用户个性化设置的垃圾邮件的过滤系统及方法
CN107341199A (zh) * 2017-06-21 2017-11-10 北京林业大学 一种基于文献信息共性模式的推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
田野等: "基于关键词相关度的Deep_Web爬虫爬行策略", 《计算机工程》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111651657A (zh) * 2020-06-04 2020-09-11 深圳前海微众银行股份有限公司 情报监控方法、装置、设备及计算机可读存储介质
CN111651657B (zh) * 2020-06-04 2024-05-24 深圳前海微众银行股份有限公司 情报监控方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN108628832B (zh) 2022-03-18

Similar Documents

Publication Publication Date Title
CN111382956A (zh) 企业集团关系的挖掘方法和装置
CN107220732A (zh) 一种基于梯度提升树的停电投诉风险预测方法
CN106251114B (zh) 应用中实现审批的方法和装置
CN106326923B (zh) 一种顾及位置重复和密度峰值点的签到位置数据聚类方法
CN106462620A (zh) 巨型网络上的距离查询
CN109996245B (zh) 通信资源投放评估方法、装置、电子设备及存储介质
CN110288824B (zh) 基于Granger causality路网早晚高峰拥堵状况和传播机制分析方法
CN102388387A (zh) 访问控制策略模板生成设备、系统、方法及程序
CN106789338A (zh) 一种在动态大规模社交网络中发现关键人物的方法
CN115510249A (zh) 一种知识图谱的构建方法及装置、电子设备、存储介质
CN114297714A (zh) 一种云环境下数据隐私保护与安全搜索的方法
CN116701979A (zh) 基于受限k-均值的社交网络数据分析方法及系统
CN109885797B (zh) 一种基于多身份空间映射的关系网络构建方法
CN108628832A (zh) 一种信息情报关键字获取方法及装置
CN108256083A (zh) 基于深度学习的内容推荐方法
CN108280176A (zh) 基于MapReduce的数据挖掘优化方法
CN111026863A (zh) 客户行为预测方法、装置、设备及介质
CN108256086A (zh) 数据特征统计分析方法
CN105095264A (zh) 一种关系圈的确定方法及装置
CN111125541B (zh) 面向多用户的可持续多云服务组合的获取方法
CN111611397B (zh) 信息匹配方法、装置、计算机设备和存储介质
CN106780060A (zh) 基于信息熵的地方协商社交网络用户身份判别方法和装置
CN117114202B (zh) 一种简历投递概率预估方法、装置、设备及存储介质
CN106888237A (zh) 一种数据调度方法及系统
US20120054117A1 (en) Identifying an individual in response to a query seeking to locate personnel with particular experience

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant