发明内容
本发明的主要目的在于提供一种IP段归属确定方法和装置,以解决IP数据源中的IP段的归属信息准确性低的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种IP段归属确定方法。根据本发明的IP段归属确定方法包括:获取多个IP数据源中相同的IP段;分别获取IP段在多个IP数据源中的归属信息,得到多个IP段归属信息分别计算多个IP段归属信息的可信度;以及将可信度最大的IP段归属信息作为IP段的归属信息。
进一步地,分别计算多个IP段归属信息的可信度包括:分别确定多个IP数据源的粒度,粒度用于表示对应IP数据源归属的区域的级数;分别获取多个IP数据源中每个IP数据源对应的IP数据源分和粒度分,其中,IP数据源分为对IP数据源预先配置的数值,粒度分为对粒度预先配置的数值;以及通过以下公式分别计算第一IP段归属信息的可信度,其中,第一IP段归属信息为多个IP段归属信息中的任一IP段归属信息:
K=S+N*L
其中,K为第一IP段归属信息的可信度,S为IP数据源分,N为粒度,L为粒度分。
进一步地,IP数据源分通过以下方式进行配置:由多个IP数据源的数量设置具有相应数量的多个IP数据源分,其中,多个IP数据源分满足:其中任意两个IP数据源分加和大于任一IP数据源分;以及将多个IP数据源分一一对应地配置给多个IP数据源。
进一步地,将多个IP数据源分一一对应地配置给多个IP数据源包括:将多个IP数据源分以不同的配置方式一一对应地配置给多个IP数据源;计算每一个配置方式下的IP段归属信息的可信度;将相同的配置方式下多个IP数据源的IP段归属信息的最大可信度相加;以及采用最大可信度相加的和最大的配置方式将多个IP数据源分一一对应地配置给多个IP数据源。
进一步地,多个IP数据源中包括多个相同的IP段,其中,分别计算多个IP段归属信息的可信度包括:分别计算多个IP数据源中每一个IP段归属信息的可信度;将可信度最大的IP段归属信息作为IP段的归属信息包括:将IP段归属信息相同的可信度加和;将加和后的可信度作为对应的IP段归属信息的可信度;将每一个IP段中可信度最大的IP段归属信息作为对应的IP段的归属信息。
为了实现上述目的,根据本发明的另一方面,提供了一种IP段归属确定方法装置。根据本发明的IP段归属确定装置包括:第一获取单元,用于获取多个IP数据源中相同的IP段;第二获取单元,用于分别获取IP段在多个IP数据源中的归属信息,得到多个IP段归属信息;计算单元,用于分别计算多个IP段归属信息的可信度;以及生成单元,用于将可信度最大的IP段归属信息作为IP段的归属信息。
进一步地,计算单元包括:确定模块,用于分别确定多个IP数据源的粒度,粒度用于表示对应IP数据源归属的区域的级数;获取模块,用于分别获取多个IP数据源中每个IP数据源对应的IP数据源分和粒度分,其中,IP数据源分为对IP数据源预先配置的数值,粒度分为对粒度预先配置的数值;以及第一计算模块,用于通过以下公式分别计算第一IP段归属信息的可信度,其中,第一IP段归属信息为多个IP段归属信息中的任一IP段归属信息:
K=S+N*L
其中,K为第一IP段归属信息的可信度,S为IP数据源分,N为粒度,L为粒度分。
进一步地,IP段归属确定装置还包括配置单元,用于配置IP数据源分,其中,配置单元包括:设置模块,用于由多个IP数据源的数量设置具有相应数量的多个IP数据源分,其中,多个IP数据源分满足:其中任意两个IP数据源分加和大于任一IP数据源分;以及配置模块,用于将多个IP数据源分一一对应地配置给多个IP数据源。
进一步地,配置模块包括:配置子模块,用于将多个IP数据源分以不同的配置方式一一对应地配置给多个IP数据源;第一计算子模块,用于计算每一个配置方式下的IP段归属信息的可信度;第二计算子模块,用于将相同的配置方式下多个IP数据源的IP段归属信息的最大可信度相加;以及确定子模块,用于采用最大可信度相加的和最大的配置方式将多个IP数据源分一一对应地配置给多个IP数据源。
进一步地,多个IP数据源中包括多个相同的IP段,其中,计算单元还用于分别计算多个IP数据源中每一个IP段归属信息的可信度;
生成单元包括:第二计算模块,用于将IP段归属信息相同的可信度加和;第一生成模块,用于将加和后的可信度作为对应的IP段归属信息的可信度;第二生成模块,用于将每一个IP段中可信度最大的IP段归属信息作为对应的IP段的归属信息。
通过本发明,采用一种IP段归属确定方法包括:获取多个IP数据源中相同的IP段;分别获取所述IP段在所述多个IP数据源中的归属信息,得到多个IP段归属信息;分别计算所述多个IP段归属信息的可信度;以及将可信度最大的IP段归属信息作为所述IP段的归属信息。,通过计算多个IP数据源中相同的IP段归属信息的可信度,将多个IP数据源中相同的IP段归属信息的可信度进行对比,选取可信度最大的IP段归属信息作为该相同的IP段的归属信息,相对于现有的IP段归属信息,其准确性相对较高,IP数据源中的IP段的归属信息准确性低的问题,达到了提高IP数据源中的IP段的归属信息准确性的效果。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
本发明实施例提供了一种IP段归属确定装置,该装置通过计算机设备实现其功能。
图1是根据本发明第一实施例的IP段归属确定装置的结构示意图。如图1所示,该IP段归属确定装置,包括:第一获取单元10、第二获取单元20、计算单元30和生成单元40。
第一获取单元10用于获取多个IP数据源中相同的IP段。多个IP数据源中包括相同的IP段,第一获取单元10获取的IP段可以是一个也可以是多个,例如,IP数据源A和IP数据源B据包括IP段:1.0.0.1~2.0.0.0和IP段2.0.0.1~3.0.0.0。其前提是,多个IP数据源中的不同的IP数据源之间的IP段的划分保持一致。
第二获取单元20用于分别获取IP段在多个IP数据源中的归属信息,得到多个IP段归属信息。在获取到多个IP数据源中相同的IP段之后,第二获取单元20可以获取该IP段在每一个IP数据源中对应的归属信息,由于不同的IP数据源中相同的IP段对应的归属信息可能相同也可能不同,多个IP数据源则对应着多个IP段归属信息。这里所指的归属信息可以是IP段对应的地理信息,也可以是IP段对应的运营商信息。
计算单元30用于分别计算多个IP段归属信息的可信度。由于不同的IP数据源的IP段归属信息会存在差异,单个IP数据源的IP段归属信息存在着一定的误差,通过计算单元30计算IP段归属信息的可信度,得到多个IP数据源中相同IP段的IP段归属信息的可信度。由于IP段归属信息的可信度由IP段归属信息和归属信息的粒度等因素决定,因此可以根据IP段归属信息和归属信息的粒度对IP段归属信息的准确性的影响程度对IP数据源设置计算数值,根据该数值计算IP段归属信息的可信度。
生成单元40用于将可信度最大的IP段归属信息作为IP段的归属信息。分别计算得到多个IP段归属信息的可信度之后,将各IP数据源中该IP段归属信息的可信度进行对比,得到可信度最大的IP段归属信息,生成单元40将该IP段归属信息作为该IP段的归属信息。
根据本发明实施例,通过计算多个IP数据源中相同的IP段归属信息的可信度,将多个IP数据源中相同的IP段归属信息的可信度进行对比,选取可信度最大的IP段归属信息作为该相同的IP段的归属信息,相对于现有的IP段归属信息,其准确性相对较高,IP数据源中的IP段的归属信息准确性低的问题,达到了提高IP数据源中的IP段的归属信息准确性的效果。
图2是根据本发明第二实施例的IP段归属确定装置的结构示意图。该实施例的IP段归属确定装置可以作为上述实施例的IP段归属确定装置的一种优选实施方式。如图2所示,该IP段归属确定装置包括:第一获取单元10、第二获取单元20、计算单元30和生成单元40,其中,计算单元30包括确定模块301、获取模块302和第一计算模块303。第一获取单元10、第二获取单元20和生成单元40与图1所示的第一获取单元10、第二获取单元20和生成单元40功能相同,这里不作赘述。
确定模块301用于分别确定多个IP数据源的粒度,粒度用于表示对应IP数据源归属的区域的级数。粒度可以用于表示IP数据源归属的地理区域或者行政区域的级数,例如,国家对应的粒度为1,省对应的粒度为2,市对应的粒度为3,区或者县对应的粒度为4,行政区域的级数越大,粒度的值越大。每个IP数据源中的IP段对应一个归属信息,每一个归属信息都有一个粒度,多个IP数据源中相同的IP段对应多个粒度。
获取模块302用于分别获取多个IP数据源中每个IP数据源对应的IP数据源分和粒度分,其中,IP数据源分为对IP数据源预先配置的数值,粒度分为对粒度预先配置的数值。由于具有相同IP段的不同的IP数据源,该IP段的归属信息相同的IP数据源越多,其归属可信度越高,同时,粒度的值越大,也即是对IP段归属信息的越细,IP段归属信息的可信度越高。如IP段归属信息为河北省唐山市的可信度比IP段归属信息为河北省的可信度要高。IP数据源分可以根据获取到的IP数据源的数量进行配置,用于计算IP数据源中的IP段归属的可信度。粒度分为对所述粒度预先配置的数值。粒度分可以根据需要进行设置。
第一计算模块303用于通过以下公式分别计算第一IP段归属信息的可信度,其中,第一IP段归属信息为多个IP段归属信息中的任一IP段归属信息:
K=S+N*L
其中,K为第一IP段归属信息的可信度,S为IP数据源分,N为粒度,L为粒度分。如表1所示,在配置方案1中,IP段1.0.0.1~2.0.0.0在数据源A中的可信度K1=100+3*20=160,IP段1.0.0.1~2.0.0.0在数据源B中的可信度K2=101+3*20=161,IP段1.0.0.1~2.0.0.0在数据源C中的可信度K3=102+3*20=162,由于,数据源A和数据源B中IP段1.0.0.1~2.0.0.0的归属信息相同,均为北京市,则将K1与K2相加得到归属信息为北京市的可信度321,由于321>162所以确认IP段1.0.0.1~2.0.0.0最终的可信度为321。其他方案同理。
优选地,IP段归属确定装置还包括配置单元,该配置单元用于配置IP数据源分,其中,配置单元包括设置模块和配置模块。
设置模块用于由多个IP数据源的数量设置具有相应数量的多个IP数据源分,其中,多个IP数据源分满足:其中任意两个IP数据源分加和大于任一IP数据源分。由于IP数据源有多个,因此,对应的IP数据源分也有多个,将每个IP数据源设置一个相应的IP数据源分,其中,IP数据源分满足:任意两个IP数据源分的加和大于其他任一IP数据源分,这是为了在计算可信度过程中,避免IP段归属信息相同的IP数据源分的加和小于其他任一IP数据源分的情况的发生,从而避免了由于IP数据源分配置的不合理导致影响IP段归属信息可信度的问题。
配置模块用于将多个IP数据源分一一对应地配置给多个IP数据源。使得每一个IP数据源对应一个IP数据源分。
优选地,配置模块包括:配置子模块、第一计算子模块、第二计算子模块和确定子模块。
配置子模块用于将多个IP数据源分以不同的配置方式一一对应地配置给多个IP数据源。由于多个IP数据源分对应多个IP数据源,因此,IP数据源分的配置方式与IP数据源的数量相关,例如,当有三个IP数据源包括IP段1.0.0.1~2.0.0.0,各IP数据源分别为数据源A、数据源B和数据源C时,IP数据源分分别为100、101和102,则IP数据源分的配置方式总共有6种,如表1所示,方式1:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:100、101和102;方式2:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:100、102和101;方式3:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:101、100和102;方式4:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:101、102和100;方式5:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:102、100和101;方式6:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:102、101和100。
表1:
表1中,在数据源A中IP段1.0.0.1~2.0.0.0对应的归属为北京市,在数据源B中IP段1.0.0.1~2.0.0.0对应的归属为北京市,在数据源C中IP段1.0.0.1~2.0.0.0对应的归属为上海市。
第一计算子模块用于计算每一个配置方式下的IP段归属信息的可信度。如表1中所示,计算每个配置方式下该IP段的可信度,其中,方式1下的可信度为321,方式2下的可信度为322,方式3下的可信度为321,方式4下的可信度为323,方式5下的可信度为322,方式六下的可信度为323。
同理,根据表1中的计算方法,依次计算表2中IP段为2.0.0.1~3.0.0.0在六种配置方式下IP段归属信息的可信度;计算表3中IP段为3.0.0.1~4.0.0.0在六种配置方式下IP段归属信息的可信度;表4中IP段为4.0.0.1~5.0.0.0在六种配置方式下IP段归属信息的可信度。
表2:
表3:
表4:
第二计算子模块用于将相同的配置方式下多个IP数据源的IP段归属信息的最大可信度相加。将六种配置方式中各配置方式下的IP数据源的IP段1.0.0.1~2.0.0.0、IP段2.0.0.1~3.0.0.0、IP段3.0.0.1~4.0.0.0和IP段4.0.0.1~5.0.0.0的可信度加和记录在表5中。
表5:
确定子模块用于采用最大可信度相加的和最大的配置方式将多个IP数据源分一一对应地配置给多个IP数据源。采用最大可信度相加的和最大的配置方式将多个IP数据源分一一对应地配置给多个IP数据源。从表5中可以看出配置方式5的可信度加和做大,将配置方式5的最为最佳配分方案,将多个IP数据源分一一对应地配置给多个IP数据源。因此,得到最终IP数据源的IP段归属及其对应的可信度如表6中所示。
表6:
IP段 |
地理信息 |
可信度 |
1.0.0.1-2.0.0.0 |
北京市 |
322 |
2.0.0.1-3.0.0.0 |
上海市静安区 |
181 |
3.0.0.1-4.0.0.0 |
北京市 |
323 |
4.0.0.1-5.0.0.0 |
上海市 |
162 |
图3是根据本发明第三实施例的IP段归属确定装置的结构示意图。该实施例的IP段归属确定装置可以作为上述实施例的IP段归属确定装置的一种优选实施方式。如图3所示,该IP段归属确定装置,包括:第一获取单元10、第二获取单元20、计算单元30和生成单元40,其中,生成单元40包括第二计算模块401、第一生成模块402和第二生成模块403。第二获取单元20和计算单元30与图1所示的第二获取单元20和计算单元30功能相同,这里不作赘述。
在本实施例中,多个IP数据源中包括多个相同的IP段。
计算单元10还用于分别计算多个IP数据源中每一个IP段归属信息的可信度。多个IP数据源中包括相同的IP段,第一获取单元10获取的IP段可以是一个也可以是多个,例如,IP数据源A和IP数据源B据包括IP段:1.0.0.1~2.0.0.0和IP段2.0.0.1~3.0.0.0。其前提是,多个IP数据源中的不同的IP数据源之间的IP段的划分保持一致。多个IP数据源中包括多个相同的IP段,如表1、表2、表3和表4中所示,数据源A、数据源B和数据源C均包括IP段1.0.0.1~2.0.0.0、IP段2.0.0.1~3.0.0.0、IP段3.0.0.1~4.0.0.0和IP段4.0.0.1~5.0.0.0。
第二计算模块401用于将IP段归属信息相同的可信度加和。如表1中的数据源A和数据源B的归属信息相同,那么,将数据源A和数据源B的可信度相加。
第一生成模块402用于将加和后的可信度作为对应的IP段归属信息的可信度。将上述中数据源A与数据源B的可信度之和作为IP段1.0.0.1~2.0.0.0的归属信息的可信度。
第二生成模块403用于将每一个IP段中可信度最大的IP段归属信息作为对应的IP段的归属信息。由于在表1中数据源A中的可信度K1=100+3*20=160,IP段1.0.0.1~2.0.0.0在数据源B中的可信度K2=101+3*20=161,IP段1.0.0.1~2.0.0.0在数据源C中的可信度K3=102+3*20=162,由于,数据源A和数据源B中IP段1.0.0.1~2.0.0.0的归属信息相同,均为北京市,则将K1与K2相加得到归属信息为北京市的可信度321,由于321>162所以确认IP段1.0.0.1~2.0.0.0最终的可信度为321,则该IP段的归属信息为北京市。
本发明实施例还提供了一种IP段归属确定方法。该方法运行在计算机设备上。需要说明的是,本发明实施例的IP段归属确定方法可以通过本发明实施例所提供的IP段归属确定装置来执行,本发明实施例的IP段归属确定装置也可以用于执行本发明实施例所提供的IP段归属确定方法。
图4是根据本发明第一实施例的IP段归属确定方法的流程图。如图4所示,该IP段归属确定方法包括步骤如下:
步骤S101,获取多个IP数据源中相同的IP段。多个IP数据源中包括相同的IP段,第一获取单元10获取的IP段可以是一个也可以是多个,例如,IP数据源A和IP数据源B据包括IP段:1.0.0.1~2.0.0.0和IP段2.0.0.1~3.0.0.0。其前提是,多个IP数据源中的不同的IP数据源之间的IP段的划分保持一致。
步骤S102,分别获取IP段在多个IP数据源中的归属信息,得到多个IP段归属信息。在获取到多个IP数据源中相同的IP段之后,第二获取单元20可以获取该IP段在每一个IP数据源中对应的归属信息,由于不同的IP数据源中相同的IP段对应的归属信息可能相同也可能不同,多个IP数据源则对应着多个IP段归属信息。这里所指的归属信息可以是IP段对应的地理信息,也可以是IP段对应的运营商信息。
步骤S103,分别计算多个IP段归属信息的可信度。由于不同的IP数据源的IP段归属信息会存在差异,单个IP数据源的IP段归属信息存在着一定的误差,通过计算单元30计算IP段归属信息的可信度,得到多个IP数据源中相同IP段的IP段归属信息的可信度。由于IP段归属信息的可信度由IP段归属信息和归属信息的粒度等因素决定,因此可以根据IP段归属信息和归属信息的粒度对IP段归属信息的准确性的影响程度对IP数据源设置计算数值,根据该数值计算IP段归属信息的可信度。
步骤S104,将可信度最大的IP段归属信息作为IP段的归属信息。分别计算得到多个IP段归属信息的可信度之后,将各IP数据源中该IP段归属信息的可信度进行对比,得到可信度最大的IP段归属信息,生成单元40将该IP段归属信息作为该IP段的归属信息。
根据本发明实施例,通过计算多个IP数据源中相同的IP段归属信息的可信度,将多个IP数据源中相同的IP段归属信息的可信度进行对比,选取可信度最大的IP段归属信息作为该相同的IP段的归属信息,相对于现有的IP段归属信息,其准确性相对较高,IP数据源中的IP段的归属信息准确性低的问题,达到了提高IP数据源中的IP段的归属信息准确性的效果。
图5是根据本发明第二实施例的IP段归属确定方法的流程图。该实施例的IP段归属确定方法可以作为上述实施例的一种优选实施方式,如图5所示,该IP段归属确定方法包括步骤如下:
步骤S201,获取多个IP数据源中相同的IP段。多个IP数据源中包括相同的IP段,第一获取单元10获取的IP段可以是一个也可以是多个,例如,IP数据源A和IP数据源B据包括IP段:1.0.0.1~2.0.0.0和IP段2.0.0.1~3.0.0.0。其前提是,多个IP数据源中的不同的IP数据源之间的IP段的划分保持一致。
步骤S202,分别获取IP段在多个IP数据源中的归属信息,得到多个IP段归属信息。在获取到多个IP数据源中相同的IP段之后,第二获取单元20可以获取该IP段在每一个IP数据源中对应的归属信息,由于不同的IP数据源中相同的IP段对应的归属信息可能相同也可能不同,多个IP数据源则对应着多个IP段归属信息。这里所指的归属信息可以是IP段对应的地理信息,也可以是IP段对应的运营商信息。
步骤S203,分别确定多个IP数据源的粒度,粒度用于表示对应IP数据源归属的区域的级数。粒度可以用于表示IP数据源归属的地理区域或者行政区域的级数,例如,国家对应的粒度为1,省对应的粒度为2,市对应的粒度为3,区或者县对应的粒度为4,行政区域的级数越大,粒度的值越大。每个IP数据源中的IP段对应一个归属信息,每一个归属信息都有一个粒度,多个IP数据源中相同的IP段对应多个粒度。
步骤S204,分别获取多个IP数据源中每个IP数据源对应的IP数据源分和粒度分,其中,IP数据源分为对IP数据源预先配置的数值,粒度分为对粒度预先配置的数值。由于具有相同IP段的不同的IP数据源,该IP段的归属信息相同的IP数据源越多,其归属可信度越高,同时,粒度的值越大,也即是对IP段归属信息的越细,IP段归属信息的可信度越高。如IP段归属信息为河北省唐山市的可信度比IP段归属信息为河北省的可信度要高。IP数据源分可以根据获取到的IP数据源的数量进行配置,用于计算IP数据源中的IP段归属的可信度。粒度分为对所述粒度预先配置的数值。粒度分可以根据需要进行设置。
步骤S205,通过以下公式分别计算第一IP段归属信息的可信度,其中,第一IP段归属信息为多个IP段归属信息中的任一IP段归属信息。
K=S+N*L
其中,K为第一IP段归属信息的可信度,S为IP数据源分,N为粒度,L为粒度分。如表1所示,在配置方案1中,IP段1.0.0.1~2.0.0.0在数据源A中的可信度K1=100+3*20=160,IP段1.0.0.1~2.0.0.0在数据源B中的可信度K2=101+3*20=161,IP段1.0.0.1~2.0.0.0在数据源C中的可信度K3=102+3*20=162,由于,数据源A和数据源B中IP段1.0.0.1~2.0.0.0的归属信息相同,均为北京市,则将K1与K2相加得到归属信息为北京市的可信度321,由于321>162所以确认IP段1.0.0.1~2.0.0.0最终的可信度为321。其他方案同理。
步骤S206,将可信度最大的IP段归属信息作为IP段的归属信息。分别计算得到多个IP段归属信息的可信度之后,将各IP数据源中该IP段归属信息的可信度进行对比,得到可信度最大的IP段归属信息,生成单元40将该IP段归属信息作为该IP段的归属信息。
优选地,IP数据源分通过以下方式进行配置:
由多个IP数据源的数量设置具有相应数量的多个IP数据源分,其中,多个IP数据源分满足:其中任意两个IP数据源分的加和大于任一IP数据源分。由于IP数据源有多个,因此,对应的IP数据源也有多个,将每个IP数据源设置一个相应的IP数据源分,其中,IP数据源分满足:任意两个IP数据源分的加和大于其他任一IP数据源分,这是为了在计算可信度过程中,避免IP段归属信息相同的IP数据源分的加和小于其他任一IP数据源分的情况的发生,从而避免了由于IP数据源分配置的不合理导致影响IP段归属信息可信度的问题。
将多个IP数据源分一一对应地配置给多个IP数据源。使得每一个IP数据源对应一个IP数据源分。
进一步优选地,将多个IP数据源分以不同的配置方式一一对应地配置给多个IP数据源。由于多个IP数据源分对应多个IP数据源,因此,IP数据源分的配置方式与IP数据源的数量相关,例如,当有三个IP数据源包括IP段1.0.0.1~2.0.0.0,各IP数据源分别为数据源A、数据源B和数据源C时,IP数据源分分别为100、101和102,则IP数据源分的配置方式总共有6种,如表1所示,方式1:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:100、101和102;方式2:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:100、102和101;方式3:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:101、100和102;方式4:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:101、102和100;方式5:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:102、100和101;方式6:数据源A、数据源B和数据源C对应的IP数据源分的配置依次为:102、101和100。
表1中,在数据源A中IP段1.0.0.1~2.0.0.0对应的归属为北京市,在数据源B中IP段1.0.0.1~2.0.0.0对应的归属为北京市,在数据源C中IP段1.0.0.1~2.0.0.0对应的归属为上海市。
计算每一个配置方式下的IP段归属信息的可信度。如表1中所示,计算每个配置方式下该IP段的可信度,其中,方式1下的可信度为321,方式2下的可信度为322,方式3下的可信度为321,方式4下的可信度为323,方式5下的可信度为322,方式六下的可信度为323。
同理,根据表1中的计算方法,依次计算表2中IP段为2.0.0.1~3.0.0.0在六种配置方式下IP段归属信息的可信度;计算表3中IP段为3.0.0.1~4.0.0.0在六种配置方式下IP段归属信息的可信度;表4中IP段为4.0.0.1~5.0.0.0在六种配置方式下IP段归属信息的可信度。
将相同的配置方式下多个IP数据源的IP段归属信息的最大可信度相加。将六种配置方式中各配置方式下的IP数据源的IP段1.0.0.1~2.0.0.0、IP段2.0.0.1~3.0.0.0、IP段3.0.0.1~4.0.0.0和IP段4.0.0.1~5.0.0.0的可信度加和记录在表5中。
采用最大可信度相加的和最大的配置方式将多个IP数据源分一一对应地配置给多个IP数据源。从表5中可以看出配置方式5的可信度加和做大,将配置方式5的最为最佳配分方案,将多个IP数据源分一一对应地配置给多个IP数据源。因此,得到最终IP数据源的IP段归属及其对应的可信度如表6中所示。
根据本发明实施例,通过配置获取预先配置的IP数据源分和粒度分以对IP段归属信息进行计算,得到每一个IP段的归属信息,进一步提高了IP段归属信息的准确性。
图6是根据本发明第三实施例的IP段归属确定方法的流程图。该实施例的IP段归属确定方法可以作为上述实施例的一种优选实施方式,如图6所示,该IP段归属确定方法包括步骤如下:
步骤S301,获取多个IP数据源中相同的IP段。多个IP数据源中包括相同的IP段,第一获取单元10获取的IP段可以是一个也可以是多个,例如,IP数据源A和IP数据源B据包括IP段:1.0.0.1~2.0.0.0和IP段2.0.0.1~3.0.0.0。其前提是,多个IP数据源中的不同的IP数据源之间的IP段的划分保持一致。多个IP数据源中包括多个相同的IP段,如表1、表2、表3和表4中所示,数据源A、数据源B和数据源C均包括IP段1.0.0.1~2.0.0.0、IP段2.0.0.1~3.0.0.0、IP段3.0.0.1~4.0.0.0和IP段4.0.0.1~5.0.0.0。
步骤S302,分别获取IP段在多个IP数据源中的归属信息,得到多个IP段归属信息。在获取到多个IP数据源中相同的IP段之后,第二获取单元20可以获取该IP段在每一个IP数据源中对应的归属信息,由于不同的IP数据源中相同的IP段对应的归属信息可能相同也可能不同,多个IP数据源则对应着多个IP段归属信息。这里所指的归属信息可以是IP段对应的地理信息,也可以是IP段对应的运营商信息。
步骤S303,分别计算多个IP数据源中每一个IP段归属信息的可信度。计算多个IP数据源中每一个IP段对应的IP段归属信息,如表1中的IP段1.0.0.1~2.0.0.0,表2中的IP段2.0.0.1~3.0.0.0,表3中的IP段3.0.0.1~4.0.0.0和表4中的IP段4.0.0.1~5.0.0.0,计算每一IP段的归属信息的可信度。
步骤S304,将IP段归属信息相同的可信度加和。如表1中的数据源A和数据源B的归属信息相同,那么,将数据源A和数据源B的可信度相加。
步骤S305,将加和后的可信度作为对应的IP段的可信度。将上述中数据源A与数据源B的可信度之和作为IP段1.0.0.1~2.0.0.0的归属信息的可信度。
步骤S306,将每一个IP段中可信度最大的IP段归属信息作为对应的IP段的归属信息。由于在表1中数据源A中的可信度K1=100+3*20=160,IP段1.0.0.1~2.0.0.0在数据源B中的可信度K2=101+3*20=161,IP段1.0.0.1~2.0.0.0在数据源C中的可信度K3=102+3*20=162,由于,数据源A和数据源B中IP段1.0.0.1~2.0.0.0的归属信息相同,均为北京市,则将K1与K2相加得到归属信息为北京市的可信度321,由于321>162所以确认IP段1.0.0.1~2.0.0.0最终的可信度为321,则该IP段的归属信息为北京市。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。