[go: up one dir, main page]

CN103561123B - Ip段归属确定方法和装置 - Google Patents

Ip段归属确定方法和装置 Download PDF

Info

Publication number
CN103561123B
CN103561123B CN201310518186.5A CN201310518186A CN103561123B CN 103561123 B CN103561123 B CN 103561123B CN 201310518186 A CN201310518186 A CN 201310518186A CN 103561123 B CN103561123 B CN 103561123B
Authority
CN
China
Prior art keywords
data sources
sections
credibility
point
attaching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310518186.5A
Other languages
English (en)
Other versions
CN103561123A (zh
Inventor
张运
吴充
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201310518186.5A priority Critical patent/CN103561123B/zh
Publication of CN103561123A publication Critical patent/CN103561123A/zh
Application granted granted Critical
Publication of CN103561123B publication Critical patent/CN103561123B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种IP段归属确定方法和装置,其中,IP段归属确定方法包括:获取多个IP数据源中相同的IP段;分别获取IP段在多个IP数据源中的归属信息,得到多个IP段归属信息分别计算多个IP段归属信息的可信度;以及将可信度最大的IP段归属信息作为IP段的归属信息。通过本发明,达到了提高IP数据源中的IP段的归属信息准确性的效果。

Description

IP段归属确定方法和装置
技术领域
本发明涉及互联网领域,具体而言,涉及一种IP段归属确定方法和装置。
背景技术
IP(Internet Protocol,网络之间互联的协议,简称IP)数据源(该IP数据源也可以称为IP数据库)中通常都包括多个IP段,每个IP段对应一个归属信息,例如,IP段0.0.0.0-1.0.0.0属于X城市。现有的IP数据源中的IP段的归属信息准确性都很低,不同的IP数据源之间相同的IP段的归属信息存在一定的争议,例如,对于相同的IP段a到b,IP数据源A认为该IP段是上海的,而IP数据源B则认为,该IP段是南京的。同样,相同的归属信息,例如,归属信息为北京市,IP数据源A认为其对应的IP段为c到d,而IP数据源B认为其对应的IP段为e到f。
针对现有技术中IP数据源中的IP段的归属信息准确性低的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种IP段归属确定方法和装置,以解决IP数据源中的IP段的归属信息准确性低的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种IP段归属确定方法。根据本发明的IP段归属确定方法包括:获取多个IP数据源中相同的IP段;分别获取IP段在多个IP数据源中的归属信息,得到多个IP段归属信息分别计算多个IP段归属信息的可信度;以及将可信度最大的IP段归属信息作为IP段的归属信息。
进一步地,分别计算多个IP段归属信息的可信度包括:分别确定多个IP数据源的粒度,粒度用于表示对应IP数据源归属的区域的级数;分别获取多个IP数据源中每个IP数据源对应的IP数据源分和粒度分,其中,IP数据源分为对IP数据源预先配置的数值,粒度分为对粒度预先配置的数值;以及通过以下公式分别计算第一IP段归属信息的可信度,其中,第一IP段归属信息为多个IP段归属信息中的任一IP段归属信息:
K=S+N*L
其中,K为第一IP段归属信息的可信度,S为IP数据源分,N为粒度,L为粒度分。
进一步地,IP数据源分通过以下方式进行配置:由多个IP数据源的数量设置具有相应数量的多个IP数据源分,其中,多个IP数据源分满足:其中任意两个IP数据源分加和大于任一IP数据源分;以及将多个IP数据源分一一对应地配置给多个IP数据源。
进一步地,将多个IP数据源分一一对应地配置给多个IP数据源包括:将多个IP数据源分以不同的配置方式一一对应地配置给多个IP数据源;计算每一个配置方式下的IP段归属信息的可信度;将相同的配置方式下多个IP数据源的IP段归属信息的最大可信度相加;以及采用最大可信度相加的和最大的配置方式将多个IP数据源分一一对应地配置给多个IP数据源。
进一步地,多个IP数据源中包括多个相同的IP段,其中,分别计算多个IP段归属信息的可信度包括:分别计算多个IP数据源中每一个IP段归属信息的可信度;将可信度最大的IP段归属信息作为IP段的归属信息包括:将IP段归属信息相同的可信度加和;将加和后的可信度作为对应的IP段归属信息的可信度;将每一个IP段中可信度最大的IP段归属信息作为对应的IP段的归属信息。
为了实现上述目的,根据本发明的另一方面,提供了一种IP段归属确定方法装置。根据本发明的IP段归属确定装置包括:第一获取单元,用于获取多个IP数据源中相同的IP段;第二获取单元,用于分别获取IP段在多个IP数据源中的归属信息,得到多个IP段归属信息;计算单元,用于分别计算多个IP段归属信息的可信度;以及生成单元,用于将可信度最大的IP段归属信息作为IP段的归属信息。
进一步地,计算单元包括:确定模块,用于分别确定多个IP数据源的粒度,粒度用于表示对应IP数据源归属的区域的级数;获取模块,用于分别获取多个IP数据源中每个IP数据源对应的IP数据源分和粒度分,其中,IP数据源分为对IP数据源预先配置的数值,粒度分为对粒度预先配置的数值;以及第一计算模块,用于通过以下公式分别计算第一IP段归属信息的可信度,其中,第一IP段归属信息为多个IP段归属信息中的任一IP段归属信息:
K=S+N*L
其中,K为第一IP段归属信息的可信度,S为IP数据源分,N为粒度,L为粒度分。
进一步地,IP段归属确定装置还包括配置单元,用于配置IP数据源分,其中,配置单元包括:设置模块,用于由多个IP数据源的数量设置具有相应数量的多个IP数据源分,其中,多个IP数据源分满足:其中任意两个IP数据源分加和大于任一IP数据源分;以及配置模块,用于将多个IP数据源分一一对应地配置给多个IP数据源。
进一步地,配置模块包括:配置子模块,用于将多个IP数据源分以不同的配置方式一一对应地配置给多个IP数据源;第一计算子模块,用于计算每一个配置方式下的IP段归属信息的可信度;第二计算子模块,用于将相同的配置方式下多个IP数据源的IP段归属信息的最大可信度相加;以及确定子模块,用于采用最大可信度相加的和最大的配置方式将多个IP数据源分一一对应地配置给多个IP数据源。
进一步地,多个IP数据源中包括多个相同的IP段,其中,计算单元还用于分别计算多个IP数据源中每一个IP段归属信息的可信度;
生成单元包括:第二计算模块,用于将IP段归属信息相同的可信度加和;第一生成模块,用于将加和后的可信度作为对应的IP段归属信息的可信度;第二生成模块,用于将每一个IP段中可信度最大的IP段归属信息作为对应的IP段的归属信息。
通过本发明,采用一种IP段归属确定方法包括:获取多个IP数据源中相同的IP段;分别获取所述IP段在所述多个IP数据源中的归属信息,得到多个IP段归属信息;分别计算所述多个IP段归属信息的可信度;以及将可信度最大的IP段归属信息作为所述IP段的归属信息。,通过计算多个IP数据源中相同的IP段归属信息的可信度,将多个IP数据源中相同的IP段归属信息的可信度进行对比,选取可信度最大的IP段归属信息作为该相同的IP段的归属信息,相对于现有的IP段归属信息,其准确性相对较高,IP数据源中的IP段的归属信息准确性低的问题,达到了提高IP数据源中的IP段的归属信息准确性的效果。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明第一实施例的IP段归属确定装置的结构示意图;
图2是根据本发明第二实施例的IP段归属确定装置的结构示意图;
图3是根据本发明第三实施例的IP段归属确定装置的结构示意图
图4是根据本发明第一实施例的IP段归属确定方法的流程图;
图5是根据本发明第二实施例的IP段归属确定方法的流程图;以及
图6是根据本发明第三实施例的IP段归属确定方法的流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
本发明实施例提供了一种IP段归属确定装置,该装置通过计算机设备实现其功能。
图1是根据本发明第一实施例的IP段归属确定装置的结构示意图。如图1所示,该IP段归属确定装置,包括:第一获取单元10、第二获取单元20、计算单元30和生成单元40。
第一获取单元10用于获取多个IP数据源中相同的IP段。多个IP数据源中包括相同的IP段,第一获取单元10获取的IP段可以是一个也可以是多个,例如,IP数据源A和IP数据源B据包括IP段:1.0.0.1~2.0.0.0和IP段2.0.0.1~3.0.0.0。其前提是,多个IP数据源中的不同的IP数据源之间的IP段的划分保持一致。
第二获取单元20用于分别获取IP段在多个IP数据源中的归属信息,得到多个IP段归属信息。在获取到多个IP数据源中相同的IP段之后,第二获取单元20可以获取该IP段在每一个IP数据源中对应的归属信息,由于不同的IP数据源中相同的IP段对应的归属信息可能相同也可能不同,多个IP数据源则对应着多个IP段归属信息。这里所指的归属信息可以是IP段对应的地理信息,也可以是IP段对应的运营商信息。
计算单元30用于分别计算多个IP段归属信息的可信度。由于不同的IP数据源的IP段归属信息会存在差异,单个IP数据源的IP段归属信息存在着一定的误差,通过计算单元30计算IP段归属信息的可信度,得到多个IP数据源中相同IP段的IP段归属信息的可信度。由于IP段归属信息的可信度由IP段归属信息和归属信息的粒度等因素决定,因此可以根据IP段归属信息和归属信息的粒度对IP段归属信息的准确性的影响程度对IP数据源设置计算数值,根据该数值计算IP段归属信息的可信度。
生成单元40用于将可信度最大的IP段归属信息作为IP段的归属信息。分别计算得到多个IP段归属信息的可信度之后,将各IP数据源中该IP段归属信息的可信度进行对比,得到可信度最大的IP段归属信息,生成单元40将该IP段归属信息作为该IP段的归属信息。
根据本发明实施例,通过计算多个IP数据源中相同的IP段归属信息的可信度,将多个IP数据源中相同的IP段归属信息的可信度进行对比,选取可信度最大的IP段归属信息作为该相同的IP段的归属信息,相对于现有的IP段归属信息,其准确性相对较高,IP数据源中的IP段的归属信息准确性低的问题,达到了提高IP数据源中的IP段的归属信息准确性的效果。
图2是根据本发明第二实施例的IP段归属确定装置的结构示意图。该实施例的IP段归属确定装置可以作为上述实施例的IP段归属确定装置的一种优选实施方式。如图2所示,该IP段归属确定装置包括:第一获取单元10、第二获取单元20、计算单元30和生成单元40,其中,计算单元30包括确定模块301、获取模块302和第一计算模块303。第一获取单元10、第二获取单元20和生成单元40与图1所示的第一获取单元10、第二获取单元20和生成单元40功能相同,这里不作赘述。
确定模块301用于分别确定多个IP数据源的粒度,粒度用于表示对应IP数据源归属的区域的级数。粒度可以用于表示IP数据源归属的地理区域或者行政区域的级数,例如,国家对应的粒度为1,省对应的粒度为2,市对应的粒度为3,区或者县对应的粒度为4,行政区域的级数越大,粒度的值越大。每个IP数据源中的IP段对应一个归属信息,每一个归属信息都有一个粒度,多个IP数据源中相同的IP段对应多个粒度。
获取模块302用于分别获取多个IP数据源中每个IP数据源对应的IP数据源分和粒度分,其中,IP数据源分为对IP数据源预先配置的数值,粒度分为对粒度预先配置的数值。由于具有相同IP段的不同的IP数据源,该IP段的归属信息相同的IP数据源越多,其归属可信度越高,同时,粒度的值越大,也即是对IP段归属信息的越细,IP段归属信息的可信度越高。如IP段归属信息为河北省唐山市的可信度比IP段归属信息为河北省的可信度要高。IP数据源分可以根据获取到的IP数据源的数量进行配置,用于计算IP数据源中的IP段归属的可信度。粒度分为对所述粒度预先配置的数值。粒度分可以根据需要进行设置。
第一计算模块303用于通过以下公式分别计算第一IP段归属信息的可信度,其中,第一IP段归属信息为多个IP段归属信息中的任一IP段归属信息:
K=S+N*L
其中,K为第一IP段归属信息的可信度,S为IP数据源分,N为粒度,L为粒度分。如表1所示,在配置方案1中,IP段1.0.0.1~2.0.0.0在数据源A中的可信度K1=100+3*20=160,IP段1.0.0.1~2.0.0.0在数据源B中的可信度K2=101+3*20=161,IP段1.0.0.1~2.0.0.0在数据源C中的可信度K3=102+3*20=162,由于,数据源A和数据源B中IP段1.0.0.1~2.0.0.0的归属信息相同,均为北京市,则将K1与K2相加得到归属信息为北京市的可信度321,由于321>162所以确认IP段1.0.0.1~2.0.0.0最终的可信度为321。其他方案同理。
优选地,IP段归属确定装置还包括配置单元,该配置单元用于配置IP数据源分,其中,配置单元包括设置模块和配置模块。
设置模块用于由多个IP数据源的数量设置具有相应数量的多个IP数据源分,其中,多个IP数据源分满足:其中任意两个IP数据源分加和大于任一IP数据源分。由于IP数据源有多个,因此,对应的IP数据源分也有多个,将每个IP数据源设置一个相应的IP数据源分,其中,IP数据源分满足:任意两个IP数据源分的加和大于其他任一IP数据源分,这是为了在计算可信度过程中,避免IP段归属信息相同的IP数据源分的加和小于其他任一IP数据源分的情况的发生,从而避免了由于IP数据源分配置的不合理导致影响IP段归属信息可信度的问题。
配置模块用于将多个IP数据源分一一对应地配置给多个IP数据源。使得每一个IP数据源对应一个IP数据源分。
优选地,配置模块包括:配置子模块、第一计算子模块、第二计算子模块和确定子模块。
配置子模块用于将多个IP数据源分以不同的配置方式一一对应地配置给多个IP数据源。由于多个IP数据源分对应多个IP数据源,因此,IP数据源分的配置方式与IP数据源的数量相关,例如,当有三个IP数据源包括IP段1.0.0.1~2.0.0.0,各IP数据源分别为数据源A、数据源B和数据源C时,IP数据源分分别为100、101和102,则IP数据源分的配置方式总共有6种,如表1所示,方式1:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:100、101和102;方式2:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:100、102和101;方式3:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:101、100和102;方式4:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:101、102和100;方式5:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:102、100和101;方式6:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:102、101和100。
表1:
表1中,在数据源A中IP段1.0.0.1~2.0.0.0对应的归属为北京市,在数据源B中IP段1.0.0.1~2.0.0.0对应的归属为北京市,在数据源C中IP段1.0.0.1~2.0.0.0对应的归属为上海市。
第一计算子模块用于计算每一个配置方式下的IP段归属信息的可信度。如表1中所示,计算每个配置方式下该IP段的可信度,其中,方式1下的可信度为321,方式2下的可信度为322,方式3下的可信度为321,方式4下的可信度为323,方式5下的可信度为322,方式六下的可信度为323。
同理,根据表1中的计算方法,依次计算表2中IP段为2.0.0.1~3.0.0.0在六种配置方式下IP段归属信息的可信度;计算表3中IP段为3.0.0.1~4.0.0.0在六种配置方式下IP段归属信息的可信度;表4中IP段为4.0.0.1~5.0.0.0在六种配置方式下IP段归属信息的可信度。
表2:
表3:
表4:
第二计算子模块用于将相同的配置方式下多个IP数据源的IP段归属信息的最大可信度相加。将六种配置方式中各配置方式下的IP数据源的IP段1.0.0.1~2.0.0.0、IP段2.0.0.1~3.0.0.0、IP段3.0.0.1~4.0.0.0和IP段4.0.0.1~5.0.0.0的可信度加和记录在表5中。
表5:
确定子模块用于采用最大可信度相加的和最大的配置方式将多个IP数据源分一一对应地配置给多个IP数据源。采用最大可信度相加的和最大的配置方式将多个IP数据源分一一对应地配置给多个IP数据源。从表5中可以看出配置方式5的可信度加和做大,将配置方式5的最为最佳配分方案,将多个IP数据源分一一对应地配置给多个IP数据源。因此,得到最终IP数据源的IP段归属及其对应的可信度如表6中所示。
表6:
IP段 地理信息 可信度
1.0.0.1-2.0.0.0 北京市 322
2.0.0.1-3.0.0.0 上海市静安区 181
3.0.0.1-4.0.0.0 北京市 323
4.0.0.1-5.0.0.0 上海市 162
图3是根据本发明第三实施例的IP段归属确定装置的结构示意图。该实施例的IP段归属确定装置可以作为上述实施例的IP段归属确定装置的一种优选实施方式。如图3所示,该IP段归属确定装置,包括:第一获取单元10、第二获取单元20、计算单元30和生成单元40,其中,生成单元40包括第二计算模块401、第一生成模块402和第二生成模块403。第二获取单元20和计算单元30与图1所示的第二获取单元20和计算单元30功能相同,这里不作赘述。
在本实施例中,多个IP数据源中包括多个相同的IP段。
计算单元10还用于分别计算多个IP数据源中每一个IP段归属信息的可信度。多个IP数据源中包括相同的IP段,第一获取单元10获取的IP段可以是一个也可以是多个,例如,IP数据源A和IP数据源B据包括IP段:1.0.0.1~2.0.0.0和IP段2.0.0.1~3.0.0.0。其前提是,多个IP数据源中的不同的IP数据源之间的IP段的划分保持一致。多个IP数据源中包括多个相同的IP段,如表1、表2、表3和表4中所示,数据源A、数据源B和数据源C均包括IP段1.0.0.1~2.0.0.0、IP段2.0.0.1~3.0.0.0、IP段3.0.0.1~4.0.0.0和IP段4.0.0.1~5.0.0.0。
第二计算模块401用于将IP段归属信息相同的可信度加和。如表1中的数据源A和数据源B的归属信息相同,那么,将数据源A和数据源B的可信度相加。
第一生成模块402用于将加和后的可信度作为对应的IP段归属信息的可信度。将上述中数据源A与数据源B的可信度之和作为IP段1.0.0.1~2.0.0.0的归属信息的可信度。
第二生成模块403用于将每一个IP段中可信度最大的IP段归属信息作为对应的IP段的归属信息。由于在表1中数据源A中的可信度K1=100+3*20=160,IP段1.0.0.1~2.0.0.0在数据源B中的可信度K2=101+3*20=161,IP段1.0.0.1~2.0.0.0在数据源C中的可信度K3=102+3*20=162,由于,数据源A和数据源B中IP段1.0.0.1~2.0.0.0的归属信息相同,均为北京市,则将K1与K2相加得到归属信息为北京市的可信度321,由于321>162所以确认IP段1.0.0.1~2.0.0.0最终的可信度为321,则该IP段的归属信息为北京市。
本发明实施例还提供了一种IP段归属确定方法。该方法运行在计算机设备上。需要说明的是,本发明实施例的IP段归属确定方法可以通过本发明实施例所提供的IP段归属确定装置来执行,本发明实施例的IP段归属确定装置也可以用于执行本发明实施例所提供的IP段归属确定方法。
图4是根据本发明第一实施例的IP段归属确定方法的流程图。如图4所示,该IP段归属确定方法包括步骤如下:
步骤S101,获取多个IP数据源中相同的IP段。多个IP数据源中包括相同的IP段,第一获取单元10获取的IP段可以是一个也可以是多个,例如,IP数据源A和IP数据源B据包括IP段:1.0.0.1~2.0.0.0和IP段2.0.0.1~3.0.0.0。其前提是,多个IP数据源中的不同的IP数据源之间的IP段的划分保持一致。
步骤S102,分别获取IP段在多个IP数据源中的归属信息,得到多个IP段归属信息。在获取到多个IP数据源中相同的IP段之后,第二获取单元20可以获取该IP段在每一个IP数据源中对应的归属信息,由于不同的IP数据源中相同的IP段对应的归属信息可能相同也可能不同,多个IP数据源则对应着多个IP段归属信息。这里所指的归属信息可以是IP段对应的地理信息,也可以是IP段对应的运营商信息。
步骤S103,分别计算多个IP段归属信息的可信度。由于不同的IP数据源的IP段归属信息会存在差异,单个IP数据源的IP段归属信息存在着一定的误差,通过计算单元30计算IP段归属信息的可信度,得到多个IP数据源中相同IP段的IP段归属信息的可信度。由于IP段归属信息的可信度由IP段归属信息和归属信息的粒度等因素决定,因此可以根据IP段归属信息和归属信息的粒度对IP段归属信息的准确性的影响程度对IP数据源设置计算数值,根据该数值计算IP段归属信息的可信度。
步骤S104,将可信度最大的IP段归属信息作为IP段的归属信息。分别计算得到多个IP段归属信息的可信度之后,将各IP数据源中该IP段归属信息的可信度进行对比,得到可信度最大的IP段归属信息,生成单元40将该IP段归属信息作为该IP段的归属信息。
根据本发明实施例,通过计算多个IP数据源中相同的IP段归属信息的可信度,将多个IP数据源中相同的IP段归属信息的可信度进行对比,选取可信度最大的IP段归属信息作为该相同的IP段的归属信息,相对于现有的IP段归属信息,其准确性相对较高,IP数据源中的IP段的归属信息准确性低的问题,达到了提高IP数据源中的IP段的归属信息准确性的效果。
图5是根据本发明第二实施例的IP段归属确定方法的流程图。该实施例的IP段归属确定方法可以作为上述实施例的一种优选实施方式,如图5所示,该IP段归属确定方法包括步骤如下:
步骤S201,获取多个IP数据源中相同的IP段。多个IP数据源中包括相同的IP段,第一获取单元10获取的IP段可以是一个也可以是多个,例如,IP数据源A和IP数据源B据包括IP段:1.0.0.1~2.0.0.0和IP段2.0.0.1~3.0.0.0。其前提是,多个IP数据源中的不同的IP数据源之间的IP段的划分保持一致。
步骤S202,分别获取IP段在多个IP数据源中的归属信息,得到多个IP段归属信息。在获取到多个IP数据源中相同的IP段之后,第二获取单元20可以获取该IP段在每一个IP数据源中对应的归属信息,由于不同的IP数据源中相同的IP段对应的归属信息可能相同也可能不同,多个IP数据源则对应着多个IP段归属信息。这里所指的归属信息可以是IP段对应的地理信息,也可以是IP段对应的运营商信息。
步骤S203,分别确定多个IP数据源的粒度,粒度用于表示对应IP数据源归属的区域的级数。粒度可以用于表示IP数据源归属的地理区域或者行政区域的级数,例如,国家对应的粒度为1,省对应的粒度为2,市对应的粒度为3,区或者县对应的粒度为4,行政区域的级数越大,粒度的值越大。每个IP数据源中的IP段对应一个归属信息,每一个归属信息都有一个粒度,多个IP数据源中相同的IP段对应多个粒度。
步骤S204,分别获取多个IP数据源中每个IP数据源对应的IP数据源分和粒度分,其中,IP数据源分为对IP数据源预先配置的数值,粒度分为对粒度预先配置的数值。由于具有相同IP段的不同的IP数据源,该IP段的归属信息相同的IP数据源越多,其归属可信度越高,同时,粒度的值越大,也即是对IP段归属信息的越细,IP段归属信息的可信度越高。如IP段归属信息为河北省唐山市的可信度比IP段归属信息为河北省的可信度要高。IP数据源分可以根据获取到的IP数据源的数量进行配置,用于计算IP数据源中的IP段归属的可信度。粒度分为对所述粒度预先配置的数值。粒度分可以根据需要进行设置。
步骤S205,通过以下公式分别计算第一IP段归属信息的可信度,其中,第一IP段归属信息为多个IP段归属信息中的任一IP段归属信息。
K=S+N*L
其中,K为第一IP段归属信息的可信度,S为IP数据源分,N为粒度,L为粒度分。如表1所示,在配置方案1中,IP段1.0.0.1~2.0.0.0在数据源A中的可信度K1=100+3*20=160,IP段1.0.0.1~2.0.0.0在数据源B中的可信度K2=101+3*20=161,IP段1.0.0.1~2.0.0.0在数据源C中的可信度K3=102+3*20=162,由于,数据源A和数据源B中IP段1.0.0.1~2.0.0.0的归属信息相同,均为北京市,则将K1与K2相加得到归属信息为北京市的可信度321,由于321>162所以确认IP段1.0.0.1~2.0.0.0最终的可信度为321。其他方案同理。
步骤S206,将可信度最大的IP段归属信息作为IP段的归属信息。分别计算得到多个IP段归属信息的可信度之后,将各IP数据源中该IP段归属信息的可信度进行对比,得到可信度最大的IP段归属信息,生成单元40将该IP段归属信息作为该IP段的归属信息。
优选地,IP数据源分通过以下方式进行配置:
由多个IP数据源的数量设置具有相应数量的多个IP数据源分,其中,多个IP数据源分满足:其中任意两个IP数据源分的加和大于任一IP数据源分。由于IP数据源有多个,因此,对应的IP数据源也有多个,将每个IP数据源设置一个相应的IP数据源分,其中,IP数据源分满足:任意两个IP数据源分的加和大于其他任一IP数据源分,这是为了在计算可信度过程中,避免IP段归属信息相同的IP数据源分的加和小于其他任一IP数据源分的情况的发生,从而避免了由于IP数据源分配置的不合理导致影响IP段归属信息可信度的问题。
将多个IP数据源分一一对应地配置给多个IP数据源。使得每一个IP数据源对应一个IP数据源分。
进一步优选地,将多个IP数据源分以不同的配置方式一一对应地配置给多个IP数据源。由于多个IP数据源分对应多个IP数据源,因此,IP数据源分的配置方式与IP数据源的数量相关,例如,当有三个IP数据源包括IP段1.0.0.1~2.0.0.0,各IP数据源分别为数据源A、数据源B和数据源C时,IP数据源分分别为100、101和102,则IP数据源分的配置方式总共有6种,如表1所示,方式1:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:100、101和102;方式2:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:100、102和101;方式3:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:101、100和102;方式4:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:101、102和100;方式5:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:102、100和101;方式6:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:102、101和100。
表1中,在数据源A中IP段1.0.0.1~2.0.0.0对应的归属为北京市,在数据源B中IP段1.0.0.1~2.0.0.0对应的归属为北京市,在数据源C中IP段1.0.0.1~2.0.0.0对应的归属为上海市。
计算每一个配置方式下的IP段归属信息的可信度。如表1中所示,计算每个配置方式下该IP段的可信度,其中,方式1下的可信度为321,方式2下的可信度为322,方式3下的可信度为321,方式4下的可信度为323,方式5下的可信度为322,方式六下的可信度为323。
同理,根据表1中的计算方法,依次计算表2中IP段为2.0.0.1~3.0.0.0在六种配置方式下IP段归属信息的可信度;计算表3中IP段为3.0.0.1~4.0.0.0在六种配置方式下IP段归属信息的可信度;表4中IP段为4.0.0.1~5.0.0.0在六种配置方式下IP段归属信息的可信度。
将相同的配置方式下多个IP数据源的IP段归属信息的最大可信度相加。将六种配置方式中各配置方式下的IP数据源的IP段1.0.0.1~2.0.0.0、IP段2.0.0.1~3.0.0.0、IP段3.0.0.1~4.0.0.0和IP段4.0.0.1~5.0.0.0的可信度加和记录在表5中。
采用最大可信度相加的和最大的配置方式将多个IP数据源分一一对应地配置给多个IP数据源。从表5中可以看出配置方式5的可信度加和做大,将配置方式5的最为最佳配分方案,将多个IP数据源分一一对应地配置给多个IP数据源。因此,得到最终IP数据源的IP段归属及其对应的可信度如表6中所示。
根据本发明实施例,通过配置获取预先配置的IP数据源分和粒度分以对IP段归属信息进行计算,得到每一个IP段的归属信息,进一步提高了IP段归属信息的准确性。
图6是根据本发明第三实施例的IP段归属确定方法的流程图。该实施例的IP段归属确定方法可以作为上述实施例的一种优选实施方式,如图6所示,该IP段归属确定方法包括步骤如下:
步骤S301,获取多个IP数据源中相同的IP段。多个IP数据源中包括相同的IP段,第一获取单元10获取的IP段可以是一个也可以是多个,例如,IP数据源A和IP数据源B据包括IP段:1.0.0.1~2.0.0.0和IP段2.0.0.1~3.0.0.0。其前提是,多个IP数据源中的不同的IP数据源之间的IP段的划分保持一致。多个IP数据源中包括多个相同的IP段,如表1、表2、表3和表4中所示,数据源A、数据源B和数据源C均包括IP段1.0.0.1~2.0.0.0、IP段2.0.0.1~3.0.0.0、IP段3.0.0.1~4.0.0.0和IP段4.0.0.1~5.0.0.0。
步骤S302,分别获取IP段在多个IP数据源中的归属信息,得到多个IP段归属信息。在获取到多个IP数据源中相同的IP段之后,第二获取单元20可以获取该IP段在每一个IP数据源中对应的归属信息,由于不同的IP数据源中相同的IP段对应的归属信息可能相同也可能不同,多个IP数据源则对应着多个IP段归属信息。这里所指的归属信息可以是IP段对应的地理信息,也可以是IP段对应的运营商信息。
步骤S303,分别计算多个IP数据源中每一个IP段归属信息的可信度。计算多个IP数据源中每一个IP段对应的IP段归属信息,如表1中的IP段1.0.0.1~2.0.0.0,表2中的IP段2.0.0.1~3.0.0.0,表3中的IP段3.0.0.1~4.0.0.0和表4中的IP段4.0.0.1~5.0.0.0,计算每一IP段的归属信息的可信度。
步骤S304,将IP段归属信息相同的可信度加和。如表1中的数据源A和数据源B的归属信息相同,那么,将数据源A和数据源B的可信度相加。
步骤S305,将加和后的可信度作为对应的IP段的可信度。将上述中数据源A与数据源B的可信度之和作为IP段1.0.0.1~2.0.0.0的归属信息的可信度。
步骤S306,将每一个IP段中可信度最大的IP段归属信息作为对应的IP段的归属信息。由于在表1中数据源A中的可信度K1=100+3*20=160,IP段1.0.0.1~2.0.0.0在数据源B中的可信度K2=101+3*20=161,IP段1.0.0.1~2.0.0.0在数据源C中的可信度K3=102+3*20=162,由于,数据源A和数据源B中IP段1.0.0.1~2.0.0.0的归属信息相同,均为北京市,则将K1与K2相加得到归属信息为北京市的可信度321,由于321>162所以确认IP段1.0.0.1~2.0.0.0最终的可信度为321,则该IP段的归属信息为北京市。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种IP段归属确定方法,其特征在于,包括:
获取多个IP数据源中相同的IP段;
分别获取所述IP段在所述多个IP数据源中的归属信息,得到多个IP段归属信息;
分别计算所述多个IP段归属信息的可信度,包括:
分别确定所述多个IP数据源的粒度,所述粒度用于表示对应IP数据源归属的区域的级数;
分别获取所述多个IP数据源中每个IP数据源对应的IP数据源分和粒度分,其中,IP数据源分为对所述IP数据源预先配置的数值,所述粒度分为对所述粒度预先配置的数值;以及
通过以下公式分别计算第一IP段归属信息的可信度,其中,所述第一IP段归属信息为所述多个IP段归属信息中的任一IP段归属信息:
K=S+N*L
其中,K为所述第一IP段归属信息的可信度,S为所述IP数据源分,N为所述粒度,L为所述粒度分;以及
将可信度最大的IP段归属信息作为所述IP段的归属信息。
2.根据权利要求1所述的IP段归属确定方法,其特征在于,所述IP数据源分通过以下方式进行配置:
由所述多个IP数据源的数量设置具有相应数量的多个所述IP数据源分,其中,多个所述IP数据源分满足:其中任意两个所述IP数据源分加和大于任一所述IP数据源分;以及
将多个所述IP数据源分一一对应地配置给所述多个IP数据源。
3.根据权利要求2所述的IP段归属确定方法,其特征在于,将多个所述IP数据源分一一对应地配置给所述多个IP数据源包括:
将多个所述IP数据源分以不同的配置方式一一对应地配置给所述多个IP数据源;
计算每一个所述配置方式下的IP段归属信息的可信度;
将相同的所述配置方式下所述多个IP数据源的IP段归属信息的最大可信度相加;以及
采用所述最大可信度相加的和最大的所述配置方式将多个所述IP数据源分一一对应地配置给所述多个IP数据源。
4.根据权利要求2所述的IP段归属确定方法,其特征在于,所述多个IP数据源中包括多个相同的IP段,其中,
分别计算所述多个IP段归属信息的可信度包括:分别计算所述多个IP数据源中每一个所述IP段归属信息的可信度;
将可信度最大的IP段归属信息作为所述IP段的归属信息包括:将所述IP段归属信息相同的所述可信度加和;将加和后的所述可信度作为对应的所述IP段归属信息的可信度;将每一个所述IP段中所述可信度最大的所述IP段归属信息作为对应的所述IP段的归属信息。
5.一种IP段归属确定装置,其特征在于,包括:
第一获取单元,用于获取多个IP数据源中相同的IP段;
第二获取单元,用于分别获取所述IP段在所述多个IP数据源中的归属信息,得到多个IP段归属信息;
计算单元,用于分别计算所述多个IP段归属信息的可信度,包括:
确定模块,用于分别确定所述多个IP数据源的粒度,所述粒度用于表示对应IP数据源归属的区域的级数;
获取模块,用于分别获取所述多个IP数据源中每个IP数据源对应的IP数据源分和粒度分,其中,IP数据源分为对所述IP数据源预先配置的数值,所述粒度分为对所述粒度预先配置的数值;以及
第一计算模块,用于通过以下公式分别计算第一IP段归属信息的可信度,其中,所述第一IP段归属信息为所述多个IP段归属信息中的任一IP段归属信息:
K=S+N*L
其中,K为所述第一IP段归属信息的可信度,S为所述IP数据源分,N为所述粒度,L为所述粒度分;以及
生成单元,用于将可信度最大的IP段归属信息作为所述IP段的归属信息。
6.根据权利要求5所述的IP段归属确定装置,其特征在于,所述装置还包括配置单元,用于配置所述IP数据源分,其中,所述配置单元包括:
设置模块,用于由所述多个IP数据源的数量设置具有相应数量的多个所述IP数据源分,其中,多个所述IP数据源分满足:其中任意两个所述IP数据源分加和大于任一所述IP数据源分;以及
配置模块,用于将多个所述IP数据源分一一对应地配置给所述多个IP数据源。
7.根据权利要求6所述的IP段归属确定装置,其特征在于,所述配置模块包括:
配置子模块,用于将多个所述IP数据源分以不同的配置方式一一对应地配置给所述多个IP数据源;
第一计算子模块,用于计算每一个所述配置方式下的IP段归属信息的可信度;
第二计算子模块,用于将相同的所述配置方式下所述多个IP数据源的IP段归属信息的最大可信度相加;以及
确定子模块,用于采用所述最大可信度相加的和最大的所述配置方式将多个所述IP数据源分一一对应地配置给所述多个IP数据源。
8.根据权利要求6所述的IP段归属确定装置,其特征在于,所述多个IP数据源中包括多个相同的IP段,其中,
所述计算单元还用于分别计算所述多个IP数据源中每一个所述IP段归属信息的可信度;
所述生成单元包括:第二计算模块,用于将所述IP段归属信息相同的所述可信度加和;第一生成模块,用于将加和后的所述可信度作为对应的所述IP段归属信息的可信度;第二生成模块,用于将每一个所述IP段中所述可信度最大的所述IP段归属信息作为对应的所述IP段的归属信息。
CN201310518186.5A 2013-10-28 2013-10-28 Ip段归属确定方法和装置 Active CN103561123B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310518186.5A CN103561123B (zh) 2013-10-28 2013-10-28 Ip段归属确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310518186.5A CN103561123B (zh) 2013-10-28 2013-10-28 Ip段归属确定方法和装置

Publications (2)

Publication Number Publication Date
CN103561123A CN103561123A (zh) 2014-02-05
CN103561123B true CN103561123B (zh) 2017-05-10

Family

ID=50015273

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310518186.5A Active CN103561123B (zh) 2013-10-28 2013-10-28 Ip段归属确定方法和装置

Country Status (1)

Country Link
CN (1) CN103561123B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106375490A (zh) * 2016-08-29 2017-02-01 飞思达技术(北京)有限公司 Ip信息匹配与扩展方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106302843B (zh) * 2015-05-26 2019-08-06 上海帝联信息科技股份有限公司 一种ip地址库更新方法及装置
CN106790748A (zh) * 2016-12-13 2017-05-31 小咖秀(北京)科技有限公司 一种基于c段ip的快速寻址调度方法
CN107172129B (zh) * 2017-04-25 2020-05-19 北京潘达互娱科技有限公司 一种服务器配置方法与装置
CN107743153B (zh) * 2017-05-19 2018-10-30 贵州白山云科技有限公司 一种ip地址数据库生成方法和装置
CN107277188B (zh) * 2017-06-19 2020-01-14 网宿科技股份有限公司 一种确定ip地址归属信息的方法、客户端、服务器及业务系统
CN109783521B (zh) * 2018-12-29 2021-09-28 湖南安数网络有限公司 一种ip归属地确定方法、装置和计算机存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1711742A (zh) * 2002-11-18 2005-12-21 西门子公司 用于处理具有移动功能的数据网中的数据包的方法
CN101026627A (zh) * 2007-03-15 2007-08-29 上海交通大学 基于规则和可信度的多源数据融合系统
CN101355595A (zh) * 2008-09-17 2009-01-28 北京搜狗科技发展有限公司 定位ip地址的物理所在地的方法和装置
CN101882259A (zh) * 2009-05-06 2010-11-10 日电(中国)有限公司 用于对实体关系实例进行过滤的方法和设备
CN102289936A (zh) * 2006-03-03 2011-12-21 因瑞克斯有限公司 使用来自移动数据源的数据估算道路交通状况

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1711742A (zh) * 2002-11-18 2005-12-21 西门子公司 用于处理具有移动功能的数据网中的数据包的方法
CN102289936A (zh) * 2006-03-03 2011-12-21 因瑞克斯有限公司 使用来自移动数据源的数据估算道路交通状况
CN101026627A (zh) * 2007-03-15 2007-08-29 上海交通大学 基于规则和可信度的多源数据融合系统
CN101355595A (zh) * 2008-09-17 2009-01-28 北京搜狗科技发展有限公司 定位ip地址的物理所在地的方法和装置
CN101882259A (zh) * 2009-05-06 2010-11-10 日电(中国)有限公司 用于对实体关系实例进行过滤的方法和设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于可信度的决策规则处理";韩红旗;《信息技术》;20091031(第10期);27-29 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106375490A (zh) * 2016-08-29 2017-02-01 飞思达技术(北京)有限公司 Ip信息匹配与扩展方法
CN106375490B (zh) * 2016-08-29 2019-02-12 飞思达技术(北京)有限公司 Ip信息匹配与扩展方法

Also Published As

Publication number Publication date
CN103561123A (zh) 2014-02-05

Similar Documents

Publication Publication Date Title
CN103561123B (zh) Ip段归属确定方法和装置
CN105740084B (zh) 考虑共因故障的云计算系统可靠性建模方法
CN104408179A (zh) 数据表中数据处理方法和装置
CN104484398A (zh) 数据表中的数据聚合方法和装置
CN107704625A (zh) 字段匹配方法和装置
CN103699618B (zh) 数据报表的生成方法和系统
CN105162894A (zh) 设备标识获取方法及装置
CN105373986A (zh) 医院无胶片化云计算的实现方法
CN107220376B (zh) 一种数据查询方法和装置
CN104601586B (zh) 一种公开可验证的外包统计方法
CN103605756A (zh) 用于联机分析处理的数据处理方法和装置
CN105376347A (zh) 一种ip地址分配方法及系统
CN108874297A (zh) 合并文件的方法、存储装置、存储设备和存储介质
CN108074123A (zh) 外呼名单的分配方法及系统
CN106599291A (zh) 数据分组方法及装置
CN103530413B (zh) 数据处理方法和装置
CN103533101B (zh) Ip数据源的处理方法和装置
CN109377391B (zh) 一种信息追踪方法、存储介质和服务器
CN107733846B (zh) 一种分配用户权限的方法及装置
CN105761119B (zh) 在线人数分布计算方法及装置
CN114860851A (zh) 数据处理方法、装置、设备及存储介质
CN115643090A (zh) 基于隐私检索的纵向联邦分析方法、装置、设备及介质
CN114202434A (zh) 基于优先算法的理赔方案生成方法、装置、设备及介质
CN107809353B (zh) 多端口实测带宽的测量方法及网间结算方法
CN105978714B (zh) 互联网数据中心的扩容规划方法和扩容规划系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method and device for determining IP segment affiliation

Effective date of registration: 20190531

Granted publication date: 20170510

Pledgee: Shenzhen Black Horse World Investment Consulting Co.,Ltd.

Pledgor: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Registration number: 2019990000503

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Patentee after: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Patentee before: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

PP01 Preservation of patent right
PP01 Preservation of patent right

Effective date of registration: 20240604

Granted publication date: 20170510