[go: up one dir, main page]

CN107220255A - 地址信息处理方法及装置 - Google Patents

地址信息处理方法及装置 Download PDF

Info

Publication number
CN107220255A
CN107220255A CN201610165389.4A CN201610165389A CN107220255A CN 107220255 A CN107220255 A CN 107220255A CN 201610165389 A CN201610165389 A CN 201610165389A CN 107220255 A CN107220255 A CN 107220255A
Authority
CN
China
Prior art keywords
address
address information
determined
information
true
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610165389.4A
Other languages
English (en)
Other versions
CN107220255B (zh
Inventor
王卓君
王瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201610165389.4A priority Critical patent/CN107220255B/zh
Publication of CN107220255A publication Critical patent/CN107220255A/zh
Application granted granted Critical
Publication of CN107220255B publication Critical patent/CN107220255B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种地址信息处理方法及装置。地址信息处理方法包括:获取待判定地址信息;基于至少两种地址信息数据库,对待判定地址信息的真实性进行判定,以获得至少两种初始判定结果;根据至少两种初始判定结果,确定待判定地址信息是否为真实地址。本申请可以更加准确的判定地址信息是否为真实地址,提高判定结果的准确度。

Description

地址信息处理方法及装置
【技术领域】
本申请涉及信息处理技术领域,尤其涉及一种地址信息处理方法及装置。
【背景技术】
随着互联网技术的发展,基于互联网的应用越来越广泛。在互联网应用中,经常需要用户以文本方式填写一些地址信息,例如家庭住址、公司地址等。例如,用户在注册某些应用过程中,往往需要用户填写地址信息。又例如,用户在网络购买东西时,也需要填写收货地址。
在实际应用中,有时会基于用户填写的地址信息进行相应操作,例如基于用户填写的地址信息辅助判断用户的身份,或者基于用户填写的地址信息为用户提供上门服务等,所以有必要预先获知用户填写的地址信息是否为真实地址。
在现有技术中,最方便且最常用的判断用户填写的地址信息是否为真实地址的方法是:将用户填写的地址信息作为待判定地址信息,根据待判定地址信息查询地图,然后判断待判定地址信息是否可以在地图上展现出来;如果待判定地址信息能够在地图上展现出来,则判定其为真实地址;如果待判定地址信息不能在地图上展现出来,则判定其为虚假地址。
上述方法需要地图信息能够及时更新,如果地图信息未能及时更新,就会导致部分真实地址无法在地图上展现出来,从而被判定为虚假地址。由此可见,这种基于地图的判定方法存在误判的情况,其判定结果的准确度较低。
【发明内容】
本申请的多个方面提供一种地址信息处理方法及装置,用以更加准确的判定地址信息是否为真实地址,提高判定结果的准确度。
本申请的一方面,提供一种地址信息处理方法,包括:
获取待判定地址信息;
基于至少两种地址信息数据库,对所述待判定地址信息的真实性进行判定,以获得至少两种初始判定结果;
根据所述至少两种初始判定结果,确定所述待判定地址信息是否为真实地址。
本申请的另一方面,提供一种地址信息处理装置,包括:
获取模块,用于获取待判定地址信息;
判定模块,用于基于至少两种地址信息数据库,对所述待判定地址信息的真实性进行判定,以获得至少两种初始判定结果;
确定模块,用于根据所述至少两种初始判定结果,确定所述待判定地址信息是否为真实地址。
由上述技术方案可知,本申请基于至少两种地址信息数据库,对待判定地址信息的真实性进行判定,获得至少两种初始判定结果,然后综合至少两种初始判定结果,最终确定待判定地址信息是否为真实信息,可以克服基于单一信息进行判断时存在的各种缺陷,有利于更加准确的判定地址信息是否为真实地址,提高了判定结果的精确度。
【附图说明】
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的地址信息处理方法的流程示意图;
图2为本申请另一实施例提供的地址信息处理装置的结构示意图;
图3为本申请又一实施例提供的地址信息处理装置的结构示意图。
【具体实施方式】
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请一实施例提供的地址信息处理方法的流程示意图。如图1所示,该方法包括:
101、获取待判定地址信息。
102、基于至少两种地址信息数据库,对待判定地址信息的真实性进行判定,以获得至少两种初始判定结果。
103、根据至少两种初始判定结果,确定待判定地址信息是否为真实地址。
本实施例提供一种地址信息处理方法,可由地址信息处理装置来执行,用以更加准确的判定地址信息是否为真实地址,提高判定结果的准确度。
具体的,当用户需要对地址信息的真实性进行判断时,可以将地址信息提供给信息处理装置,由地址信息处理装置完成判断,不需要依赖人工实地考察,也不需要依赖了解该地址信息的用户提供判断依据,可以避免受人为主观因素的影响,有利于降低人力成本,提高判定效率,节约时间成本。
为便于描述,本实施例将用户需要进行真实性判断的地址信息称为待判定地址信息。本实施例不对待判定地址信息进行限制,可以是任何应用场景中的地址信息,例如可以是订单中的收货地址、发货地址、用户在注册过程中填写的地址信息,等等。
其中,面向不同用户,地址信息处理装置可以提供不同的信息入口,以供用户输入待判定地址信息。
例如,地址信息处理装置可以提供网页入口,以支持用户通过地址信息处理装置提供的网页输入待判定地址信息,这种方式适合远程场景。
又例如,地址信息处理装置可以作为一客户端,用户预先在其终端设备上下载并安全该客户端,用户只要打开该客户端即可在客户端提供的输入框内输入待判定地址信息。
又例如,地址信息处理装置还提供扫描入口,允许用户通过扫描仪输入待判定地址信息。
地址信息处理装置在获取待判定地址信息之后,基于至少两种地址信息数据库,对待判定地址信息的真实性进行判定,以获得至少两种初始判定结果;然后根据至少两种初始判定给结果,确定待判定地址信息是否为真实地址。进一步,地址信息处理装置还可以通过文本或者声音等方式将待判定地址信息是否为真实地址的最终判断结果输出。
由于本实施例不像现有技术那样仅根据地图数据进行判断,而是同时结合至少两种地址信息数据库进行判断,并综合考虑至少两种初始判定结果得出最终判定结果,可以克服基于单一信息进行判断时存在的各种缺陷,有利于更加准确的判定地址信息是否为真实地址,提高了判定结果的精确度。例如,相对于现有技术中仅根据地图数据进行判断的方案,同时基于至少两种地址信息数据库,有利于减少因地图数据更新不及时造成部分地址信息被误判为虚假地址的情况,并且至少两种地址信息数据库的信息覆盖度更广,所以有利于提高判定结果的准确度。
在一可选实施方式中,上述至少两种地址信息数据库包括:地址规则数据库、地图数据库、待判定地址信息所属业务方提供的第一地址数据库、以及与该业务方相关的第三方提供的第二地址数据库中的至少两种地址信息数据库。基于此,上述步骤102的一种实施方式具体为:
基于地址规则数据库、地图数据库、待判定地址信息所属业务方提供的第一地址数据库、以及与该业务方相关的第三方提供的第二地址数据库中的至少两种地址信息数据库,对待判定地址信息的真实性进行判定,以获得至少两种初始判定结果。
其中,每基于一种地址信息数据库,对待判定地址信息的真实性进行判定,就可以得到一种初始判定结果。
可选的,每种初始判定结果可以包括:用于指示待判定地址信息偏向于真实地址或虚假地址的真伪指示信息以及待判定地址信息的判定得分中的至少一种信息。
上述地址规则数据库中包括用于判定待判定地址信息是否为真实地址的字符规则。在一具体应用场景中,上述至少两种地址信息数据库包括:地址规则数据库。也就是说,地址信息处理装置需要基于地址规则数据库,对待判定地址信息的真实性进行判定,以获得至少两种初始判定结果中的一种初始判定结果。
进一步,地址信息处理装置在基于地址规则数据库,对待判定地址信息的真实性进行判定的过程包括:
将待判定地址信息与地址规则数据库中的字符规则逐一进行比较,以确定待判定地址信息满足的目标字符规则;为便于描述,这里将待判定地址信息满足的字符规则称为目标字符规则;根据待判定地址信息满足的目标字符规则,生成初始判定结果。
可选的,这里的初始判定结果可以包括:用于指示待判定地址信息偏向于真实地址或虚假地址的真伪指示信息以及待判定地址信息的判定得分中的至少一种信息。
可选的,上述地址规则数据库中的字符规则是真实地址应该满足的规则,即如果一个地址信息按照一定条件满足了地址规则数据库中的字符规则,那么该地址信息为真实地址;另外,上述地址规则数据库还包括字符规则对应的增加分数。或者,上述地址规则数据库中的字符规则是虚假地址应该满足的规则,即如果一个地址信息按照一定条件满足了地址规则数据库中的字符规则,那么该地址信息为虚假地址;另外,上述地址规则数据库还包括字符规则对应的扣减分数。
基于上述,在上述地址规则数据库中的字符规则是真实地址应该满足的规则的情况下,地址信息处理装置根据待判定地址信息满足的目标字符规则,生成初始判定结果,包括执行以下至少一种生成操作:
真伪指示信息生成操作:将目标字符规则的个数与预设个数阈值进行比较,根据目标字符规则的个数与预设个数阈值的比较结果,生成用于指示待判定地址信息偏向于真实地址或虚假地址的真伪指示信息;或者,将目标字符规则对应的扣减分数之和与预设分数阈值进行比较,根据目标字符规则对应的增加分数之和与预设分数阈值的比较结果,生成用于指示待判定地址信息偏向于真实地址或虚假地址的真伪指示信息。
具体的,若目标字符规则的个数大于或等于预设个数阈值,则生成用于指示待判定地址信息偏向于真实地址的真伪指示信息;若目标字符规则的个数小于预设个数阈值,则生成用于指示待判定地址信息偏向于虚假地址的真伪指示信息。
相应的,若目标字符规则对应的增加分数之和大于或等于预设分数阈值,则生成用于指示待判定地址信息偏向于真实地址的真伪指示信息;若目标字符规则对应的增加分数之和小于预设分数阈值,则生成用于指示待判定地址信息偏向于虚假地址的真伪指示信息。
判定得分生成操作:根据目标字符规则对应的增加分数,生成待判定地址信息的判定得分。具体的,地址信息处理装置可以将各目标字符规则对应的增加分数相加,将相加结果作为待判定地址信息的判定得分。
基于上述,在上述地址规则数据库中的字符规则是虚假地址应该满足的规则的情况下,地址信息处理装置根据待判定地址信息满足的目标字符规则,生成初始判定结果,包括执行以下至少一种生成操作:
真伪指示信息生成操作:将目标字符规则的个数与预设个数阈值进行比较,根据目标字符规则的个数与预设个数阈值的比较结果,生成用于指示待判定地址信息偏向于真实地址或虚假地址的真伪指示信息;或者,根据目标字符规则对应的扣减分数之和与预设分数阈值的比较结果,生成用于指示待判定地址信息偏向于真实地址或虚假地址的真伪指示信息。
具体的,若目标字符规则的个数大于或等于预设个数阈值,则生成用于指示待判定地址信息偏向于虚假地址的真伪指示信息;若目标字符规则的个数小于预设个数阈值,则生成用于指示待判定地址信息偏向于真实地址的真伪指示信息。
相应的,若目标字符规则对应的扣减分数之和大于或等于预设分数阈值(例如40),则生成用于指示待判定地址信息偏向于虚假地址的真伪指示信息;若目标字符规则对应的扣减分数之和小于预设分数阈值,则生成用于指示待判定地址信息偏向于真实地址的真伪指示信息。
判定得分生成操作:根据目标字符规则对应的扣减分数,生成待判定地址信息的判定得分。具体的,地址信息处理装置可以预先设置待判定地址信息的初始得分,例如设置初始得分为100,然后用待判定地址信息的初始得分减去各目标字符规则对应的扣减分数,以获得待判定地址信息的判定得分。
可选的,在上述地址规则数据库中的字符规则是虚假地址应该满足的规则的情况下,地址规则数据库中的字符规则包括以下至少一种:
含有指定的特殊字符:例如,@、#、¥、%、&等特殊字符一般不会出现在地址信息中所以属于乱码,如果待判定地址信息包含这些特殊字符就要进行扣分;
包含的数字个数大于第一指定个数:按照地址信息的常规形式可知,地址信息中楼号、单元号、门牌号等可能是数字,这些数字一般不会太多,所以待判定地址信息包含的数字的个数不应大于第一指定个数,例如一般不会超过10,若大于第一指定个数,就要进行扣分;
包含的汉字个数小于第二指定个数:按照地址信息的常规形式可知,地址信息中一般会包括若干个汉字,通常汉字的个数不应太少,所以待判定地址信息包含的汉字个数不应小于第二指定个数,例如不应小于5,若小于第二指定个数,就要进行扣分;
指定标点分隔方式的出现次数大于第一指定次数:按照地址信息的常规形式可知,地址信息中的标点分割不应过密,即字符和标点交错出现的次数不应过多,所以待判定地址信息中指定标点分割方式的出现次数不应大于第一指定次数,例如不应大于3次,若大于第一指定次数,就要进行扣分;
标点分隔出非语义词组的出现次数大于第二指定次数:对标点分割出的词组进行语义分析,若识别出标点分割出的词组属于非语义词组,则统计该非语义词组在指定地址库中的出现次数,若大于第二指定次数,例如大于3次,就要进行扣分。所述指定地址库可以是第一地址数据库或第二地址数据库,或者也可以同时包括第一地址数据库和第二地址数据库。
当然,地址规则数据库中还可以包括其他字符规则,在此不再详述。
具体的,地址信息处理装置可以将待判定地址信息在地址规则数据库中进行匹配,以确定待判定地址信息满足的目标字符规则,然后根据目标字符规则的个数或各目标字符规则对应的扣减分数,生成用于指示该待判定地址信息是偏向于真实地址还是虚假地址的真伪指示信息,例如若各目标字符规则对应的扣减分数之和超过指定分数阈值,例如40,则生成指示待判定地址信息偏向于虚假地址的真伪指示信息,并根据各目标字符规则对应的扣减分数,生成该待判定地址信息的判定得分。
在一具体应用场景中,上述至少两种地址信息数据库包括:地图数据库、第一地址数据库或第二地址数据库。也就是说,地址信息处理装置需要基于地图数据库、第一地址数据库或第二地址数据库,对待判定地址信息的真实性进行判定,以获得至少两种初始判定结果中的一种初始判定结果。由于基于地图数据库、第一地址数据库或第二地址数据库,对待判定地址信息的真实性进行判定的过程类似,所以本实施例放在一起进行说明。
具体的,地址信息处理装置需要基于地图数据库、第一地址数据库或第二地址数据库,对待判定地址信息的真实性进行判定的过程包括:
执行整体查询操作和切分查询操作中的至少一种,并根据至少一种查询操作的查询结果,生成初始判定结果;
其中,整体查询操作为:将待判定地址信息作为查询条件,到地图数据库、第一地址数据库或第二地址数据库中进行查询;
切分查询操作为:按照预设地址切分规则将待判定地址信息切分为至少一个地址片段,将至少一个地址片段中的每个地址片段作为查询条件,到地图数据库、第一地址数据库或第二地址数据库中进行查询。
在一具体实施方式中,在基于地图数据库、第一地址数据库或第二地址数据库,对待判定地址信息的真实性进行判定的过程中,可以仅执行整体查询操作,即将待判定地址信息作为查询条件,到地图数据库、第一地址数据库或第二地址数据库中进行查询,并根据查询结果,生成初始判定结果。
在另一具体实施方式中,在基于地图数据库、第一地址数据库或第二地址数据库,对待判定地址信息的真实性进行判定的过程中,可以仅执行切分查询操作,即按照预设地址切分规则将待判定地址信息切分为至少一个地址片段,将至少一个地址片段中的每个地址片段作为查询条件,到地图数据库、第一地址数据库或第二地址数据库中进行查询,并根据每个地址片段的查询结果,生成初始判定结果。
在又一具体实施方式中,在基于地图数据库、第一地址数据库或第二地址数据库,对待判定地址信息的真实性进行判定的过程中,结合执行整体查询操作和切分查询操作,并根据两种查询操作的查询结果,生成初始判定结果。
在一具体实施方式中,结合执行整体查询操作和切分查询操作,对待判定地址信息的真实性进行判定的过程包括:
首先执行整体查询操作,以生成第一子判定结果;
若第一子判定结果指示待判定地址信息偏向于虚假地址,则执行切分查询操作,以生成第二子判定结果,根据第一子判定结果和所述第二子判定结果,生成初始判定结果;
若第一子判断结果指示待判定地址信息偏向于真实地址,则直接根据第一子判定结果,生成初始判定结果,并结束操作。
在另一具体实施方式中,结合执行整体查询操作和切分查询操作,对待判定地址信息的真实性进行判定的过程包括:
分别执行整体查询操作以及切分查询操作,以生成第一子判定结果和第二子判定结果,根据第一子判定结果和第二子判定结果,生成初始判定结果。其中,整体查询操作和切分查询操作的执行顺序不做限定,可以顺序执行,也可以并行执行。
下面分别针对地图数据库、第一地址数据库或第二地址数据库,地图数据库,对上述结合执行整体查询操作和切分查询操作,对待判定地址信息的真实性进行判定的过程进行详细说明。
地图数据库:
地址信息处理装置可以将待判定地址信息输入到地图数据库的查询接口中进行查询;如果有超过1条的匹配结果返回,则直接判定该待判定地址信息偏向于真实地址,并且进行真实性加分,并结束操作;如果没有任何匹配结果返回,则将待判定地址信息按照省、市、区以及详细地址的切分规则,将待判定地址信息切分为地址片段,即省、市、区以及详细地址,然后将各地址片段分别输入到地图数据库的查询接口中进行查询,对于每个地址片段,如果有超过1条的匹配结果返回,则直接判定该地址片段偏向于真实地址,并且进行真实性加分,如果没有任何匹配结果返回,则结束操作。
第一地址数据库:
地址信息处理装置可以将待判定地址信息输入到第一地址数据库的查询接口中进行查询;如果有超过1条的匹配结果返回,则直接判定该待判定地址信息偏向于真实地址,并且进行真实性加分,并结束操作;
如果没有任何匹配结果返回,则将待判定地址信息按照省、市、区以及详细地址的切分规则,将待判定地址信息切分为地址片段,即省、市、区以及详细地址,然后将各地址片段分别输入到第一地址数据库的查询接口中进行查询,对于每个地址片段,如果有超过1条的匹配结果返回,则直接判定该地址片段偏向于真实地址,并且进行真实性加分,如果没有任何匹配结果返回,则结束操作。
可选的,以业务方是电子商务领域中的电商平台为例,则第一地址数据库可以包括:用户自定义的收货地址信息、订单中的收货地址信息以及退款单中的收货地址信息中的至少一种地址信息。
在一具体实施方式中,第一地址数据库包括:用户自定义的收货地址信息、订单中的收货地址信息以及退款单中的收货地址信息。基于此,地址信息处理装置在第一地址数据库中进行整体查询操作或切分查询操作的过程包括:
将待判定地址信息或地址片段输入到用于存储用户自定义的收货地址信息的子数据库的查询接口中进行查询,如果有超过1条的匹配结果返回,则直接判定该待判定地址信息或地址片段为偏向于真实地址,并且进行真实性加分;
如果没有任何匹配结果返回,则将待判定地址信息或地址片段输入到用于存储订单中的收货地址信息的子数据库的查询接口中进行查询,如果有超过1条的匹配结果返回,则直接判定该待判定地址信息或地址片段为偏向于真实地址,并且进行真实性加分;
如果没有任何匹配结果返回,则将待判定地址信息或地址片段输入到用于存储退款单中的收货地址信息的子数据库的查询接口中进行查询,如果有超过1条的匹配结果返回,则直接判定该待判定地址信息或地址片段为偏向于真实地址,并且进行真实性加分,如果没有任何匹配结果返回,则结束此次查询操作。
第二地址数据库:
地址信息处理装置可以将待判定地址信息输入到第二地址数据库的查询接口中进行查询;如果有超过1条的匹配结果返回,则直接判定该待判定地址信息偏向于真实地址,并且进行真实性加分,并结束操作;
如果没有任何匹配结果返回,则将待判定地址信息按照省、市、区以及详细地址的切分规则,将待判定地址信息切分为地址片段,即省、市、区以及详细地址,然后将各地址片段分别输入到第二地址数据库的查询接口中进行查询,对于每个地址片段,如果有超过1条的匹配结果返回,则直接判定该地址片段偏向于真实地址,并且进行真实性加分,如果没有任何匹配结果返回,则结束操作。
可选的,若业务方是电子商务领域中的电商平台,则与业务方相关的第三方为物流平台。基于此,第二地址数据库可以包括:收货地址信息、发货地址信息以及途径地址信息中的至少一种地址信息。
在一具体实施方式中,第二地址数据库包括:收货地址信息、发货地址信息以及途径地址信息。基于此,地址信息处理装置在第二地址数据库中进行整体查询操作或切分查询操作的过程包括:
将待判定地址信息或地址片段输入到用于存储收货地址信息的子数据库的查询接口中进行查询,如果有超过1条的匹配结果返回,则直接判定该待判定地址信息或地址片段为偏向于真实地址,并且进行真实性加分;
如果没有任何匹配结果返回,则将待判定地址信息或地址片段输入到用于存储发货地址信息的子数据库的查询接口中进行查询,如果有超过1条的匹配结果返回,则直接判定该待判定地址信息或地址片段为偏向于真实地址,并且进行真实性加分;
如果没有任何匹配结果返回,则将待判定地址信息或地址片段输入到用于存储途径地址信息的子数据库的查询接口中进行查询,如果有超过1条的匹配结果返回,则直接判定该待判定地址信息或地址片段为偏向于真实地址,并且进行真实性加分,如果没有任何匹配结果返回,则结束此次查询操作。
在上述各实施方式中,在获得匹配结果后,需要根据匹配结果生成初始判定结果。
可选的,初始判定结果可以包括:用于指示待判定地址信息偏向于真实地址或虚假地址的真伪指示信息和待判定地址信息的判定得分中的至少一个。
基于上述,根据查询结果生成初始判定结果的过程可以包括执行以下至少一种操作:
根据至少一种查询操作的查询结果,生成用于指示待判定地址信息偏向于真实地址或虚假地址的真伪指示信息;
根据至少一种查询操作的查询结果对应的增加分数,以生成待判定地址信息的判定得分。
具体的,若上述实施过程中仅执行了整体查询操作未执行切分查询操作,则可以直接上述整体查询操作的查询结果作为初始判定结果,即直接将整体查询操作的查询结果中确定待判定地址信息偏向于真实地址或虚假地址的信息作为真伪指示信息,并将其中的真实性加分作为待判定地址信息的判定得分。
若上述实施过程中既执行了整体查询操作又执行了切分查询操作,则可以同时结合两种查询操作的查询结果,生成初始判定结果。具体生成真伪指示信息的方式为:若至少一种查询操作的查询结果满足预设第一真实判定条件,则生成用于指示待判定地址信息偏向于真实地址的真伪指示信息;若至少一种查询操作的查询结果不满足第一真实判定条件,则生成用于指示待判定地址信息偏向于虚假地址的真伪指示信息。具体生成待判定地址信息的判定得分的方式为:将每种查询操作的查询结果对应的增加分数相加,将相加的结果作为待判定地址信息的判定得分。
上述第一真实判定条件可以是指示待判定地址信息偏向于真实地址的结果个数大于或等于指示待判定地址信息偏向于虚假地址的结果个数,或者,可以是指示待判定地址信息偏向于真实地址的结果个数大于预设阈值,或者,可以是指示待判定地址信息偏向于真实地址的结果对应的增加分数之和大于预设分数阈值,等等。
经过上述各实施方式,获得了至少两个初始判定结果。地址信息处理装置可以根据至少两个初始判定结果,确定待判定地址信息是否为真实地址。
具体的,地址信息处理装置可以判断至少两种初始判定结果是否满足第二真实判定条件;如果判断结果为至少两种初始判定结果满足预设第二真实判定条件,则确定待判定地址信息为真实地址;如果判断结果为至少两种初始判定结果不满足第二真实判定条件,则确定待判定地址信息为虚假地址。
可选的,上述第二真实判定条件可以是指示待判定地址信息偏向于真实地址的结果个数大于或等于指示待判定地址信息偏向于虚假地址的结果个数,或者,可以是指示待判定地址信息偏向于真实地址的结果个数大于预设阈值,或者,可以是各初始判定结果中待判定地址信息的判定得分之和大于预设分数阈值,等等。
经过上述分析可知,本申请各实施例基于至少两种地址信息数据库,对待判定地址信息的真实性进行判定,获得至少两种初始判定结果,然后综合至少两种初始判定结果,最终确定待判定地址信息是否为真实信息,可以克服基于单一信息进行判断时存在的各种缺陷,有利于更加准确的判定地址信息是否为真实地址,提高了判定结果的精确度。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图2为本申请另一实施例提供的地址信息处理装置的结构示意图。如图2所示,该装置包括:获取模块21、判定模块22和确定模块23。
获取模块21,用于获取待判定地址信息。
判定模块22,用于基于至少两种地址信息数据库,对获取模块21获取的待判定地址信息的真实性进行判定,以获得至少两种初始判定结果。
确定模块23,用于根据判定模块22获得的至少两种初始判定结果,确定待判定地址信息是否为真实地址。
在一可选实施方式中,判定模块22具体用于:
基于地址规则数据库、地图数据库、待判定地址信息所属业务方提供的第一地址数据库、以及与业务方相关的第三方提供的第二地址数据库中的至少两种地址信息数据库,对待判定地址信息的真实性进行判定,以获得至少两种初始判定结果。
在一可选实施方式中,如图3所示,判定模块22的一种实现结构包括:比较单元221和第一生成单元222。
比较单元221,用于将待判定地址信息与地址规则数据库中的字符规则逐一进行比较,以确定待判定地址信息满足的目标字符规则。
第一生成单元222,用于根据目标字符规则,生成初始判定结果。
进一步,第一生成单元222具体用于执行以下至少一种操作:
根据目标字符规则的个数与预设个数阈值的比较结果,或目标字符规则对应的扣减分数之和与预设分数阈值的比较结果,生成用于指示待判定地址信息偏向于真实地址或虚假地址的真伪指示信息;
根据目标字符规则对应的扣减分数,生成待判定地址信息的判定得分。
在一可选实施方式中,地址规则数据库中的字符规则包括以下至少一种:
含有指定的特殊字符;
包含的数字个数大于第一指定个数;
包含的汉字个数小于第二指定个数;
指定标点分隔方式的出现次数大于第一指定次数;
标点分隔出非语义词组的出现次数大于第二指定次数。
在一可选实施方式中,如图3所示,判定模块22的一种实现结构还包括:查询单元223和第二生成单元224。
查询单元223,用于执行整体查询操作和切分查询操作中的至少一种。
第二生成单元224,用于根据至少一种查询操作的查询结果,生成初始判定结果。
其中,整体查询操作为:将待判定地址信息作为查询条件,到地图数据库、第一地址数据库或第二地址数据库中进行查询。
切分查询操作为:按照预设地址切分规则将待判定地址信息切分为至少一个地址片段,将至少一个地址片段中的每个地址片段作为查询条件,到地图数据库、第一地址数据库或第二地址数据库中进行查询。
进一步,第二生成单元224具体用于执行以下至少一种操作:
根据至少一种查询操作的查询结果,生成用于指示待判定地址信息偏向于真实地址或虚假地址的真伪指示信息;
根据至少一种查询操作的查询结果对应的增加分数,以生成待判定地址信息的判定得分。
更进一步,第二生成单元224在根据至少一种查询操作的查询结果,生成用于指示待判定地址信息偏向于真实地址或虚假地址的真伪指示信息时,具体用于:
若至少一种查询操作的查询结果满足预设第一真实判定条件,则生成用于指示待判定地址信息偏向于真实地址的真伪指示信息;
若至少一种查询操作的查询结果不满足第一真实判定条件,则生成用于指示待判定地址信息偏向于虚假地址的真伪指示信息。
可选的,上述第一真实判定条件可以是指示待判定地址信息偏向于真实地址的结果个数大于或等于指示待判定地址信息偏向于虚假地址的结果个数,或者,可以是指示待判定地址信息偏向于真实地址的结果个数大于预设阈值,或者,可以是指示待判定地址信息偏向于真实地址的结果对应的增加分数之和大于预设分数阈值,等等。
在一可选实施方式中,确定模块23具体用于:
若至少两种初始判定结果满足预设第二真实判定条件,则确定待判定地址信息为真实地址;
若至少两种初始判定结果不满足第二真实判定条件,则确定待判定地址信息为虚假地址。
可选的,上述第二真实判定条件可以是指示待判定地址信息偏向于真实地址的结果个数大于或等于指示待判定地址信息偏向于虚假地址的结果个数,或者,可以是指示待判定地址信息偏向于真实地址的结果个数大于预设阈值,或者,可以是各初始判定结果中待判定地址信息的判定得分之和大于预设分数阈值,等等。
在一可选实施方式中,业务方为电商平台,第三方为物流平台。相应的,第一地址数据库包括:用户自定义的收货地址信息、订单中的收货地址信息以及退款单中的收货地址信息中的至少一种地址信息;第二地址数据库包括:收货地址信息、发货地址信息以及途径地址信息中的至少一种地址信息。
本实施例提供的地址信息处理装置,基于至少两种地址信息数据库,对待判定地址信息的真实性进行判定,获得至少两种初始判定结果,然后综合至少两种初始判定结果,最终确定待判定地址信息是否为真实信息,可以克服基于单一信息进行判断时存在的各种缺陷,有利于更加准确的判定地址信息是否为真实地址,提高了判定结果的精确度。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (20)

1.一种地址信息处理方法,其特征在于,包括:
获取待判定地址信息;
基于至少两种地址信息数据库,对所述待判定地址信息的真实性进行判定,以获得至少两种初始判定结果;
根据所述至少两种初始判定结果,确定所述待判定地址信息是否为真实地址。
2.根据权利要求1所述的方法,其特征在于,所述基于至少两种地址信息数据库,对所述待判定地址信息的真实性进行判定,以获得至少两种初始判定结果,包括:
基于地址规则数据库、地图数据库、所述待判定地址信息所属业务方提供的第一地址数据库、以及与所述业务方相关的第三方提供的第二地址数据库中的至少两种地址信息数据库,对所述待判定地址信息的真实性进行判定,以获得所述至少两种初始判定结果。
3.根据权利要求2所述的方法,其特征在于,所述基于地址规则数据库,对所述待判定地址信息的真实性进行判定,以获得所述至少两种初始判定结果中的一种初始判定结果,包括:
将所述待判定地址信息与所述地址规则数据库中的字符规则逐一进行比较,以确定所述待判定地址信息满足的目标字符规则;
根据所述目标字符规则,生成所述初始判定结果。
4.根据权利要求3所述的方法,其特征在于,所述根据所述目标字符规则,生成所述初始判定结果,包括以下至少一种操作:
根据所述目标字符规则的个数与预设个数阈值的比较结果,或所述目标字符规则对应的扣减分数之和与预设分数阈值的比较结果,生成用于指示所述待判定地址信息偏向于真实地址或虚假地址的真伪指示信息;
根据所述目标字符规则对应的扣减分数,生成所述待判定地址信息的判定得分。
5.根据权利要求3所述的方法,其特征在于,所述地址规则数据库中的字符规则包括以下至少一种:
含有指定的特殊字符;
包含的数字个数大于第一指定个数;
包含的汉字个数小于第二指定个数;
指定标点分隔方式的出现次数大于第一指定次数;
标点分隔出非语义词组的出现次数大于第二指定次数。
6.根据权利要求2所述的方法,其特征在于,所述基于所述地图数据库、所述第一地址数据库或所述第二地址数据库,对所述待判定地址信息的真实性进行判定,以获得所述至少两种初始判定结果中的一种初始判定结果,包括:
执行整体查询操作和切分查询操作中的至少一种,并根据所述至少一种查询操作的查询结果,生成所述初始判定结果;
所述整体查询操作为:将所述待判定地址信息作为查询条件,到所述地图数据库、所述第一地址数据库或所述第二地址数据库中进行查询;
所述切分查询操作为:按照预设地址切分规则将所述待判定地址信息切分为至少一个地址片段,将所述至少一个地址片段中的每个地址片段作为查询条件,到所述地图数据库、所述第一地址数据库或所述第二地址数据库中进行查询。
7.根据权利要求6所述的方法,其特征在于,所述根据所述至少一种查询操作的查询结果,生成所述初始判定结果,包括执行以下至少一种操作:
根据所述至少一种查询操作的查询结果,生成用于指示所述待判定地址信息偏向于真实地址或虚假地址的真伪指示信息;
根据所述至少一种查询操作的查询结果对应的增加分数,以生成所述待判定地址信息的判定得分。
8.根据权利要求7所述的方法,其特征在于,所述根据所述至少一种查询操作的查询结果,生成用于指示所述待判定地址信息偏向于真实地址或虚假地址的真伪指示信息,包括:
若所述至少一种查询操作的查询结果满足预设第一真实判定条件,则生成用于指示所述待判定地址信息偏向于真实地址的真伪指示信息;
若所述至少一种查询操作的查询结果不满足所述第一真实判定条件,则生成用于指示所述待判定地址信息偏向于虚假地址的真伪指示信息。
9.根据权利要求2-8任一项所述的方法,其特征在于,所述业务方为电商平台,所述第三方为物流平台;
所述第一地址数据库包括:用户自定义的收货地址信息、订单中的收货地址信息以及退款单中的收货地址信息中的至少一种地址信息;
所述第二地址数据库包括:收货地址信息、发货地址信息以及途径地址信息中的至少一种地址信息。
10.根据权利要求1-8任一项所述的方法,其特征在于,所述根据所述至少两种初始判定结果,确定所述待判定地址信息是否为真实地址,包括:
若所述至少两种初始判定结果满足预设第二真实判定条件,则确定所述待判定地址信息为真实地址;
若所述至少两种初始判定结果不满足所述第二真实判定条件,则确定所述待判定地址信息为虚假地址。
11.一种地址信息处理装置,其特征在于,包括:
获取模块,用于获取待判定地址信息;
判定模块,用于基于至少两种地址信息数据库,对所述待判定地址信息的真实性进行判定,以获得至少两种初始判定结果;
确定模块,用于根据所述至少两种初始判定结果,确定所述待判定地址信息是否为真实地址。
12.根据权利要求11所述的装置,其特征在于,所述判定模块具体用于:
基于地址规则数据库、地图数据库、所述待判定地址信息所属业务方提供的第一地址数据库、以及与所述业务方相关的第三方提供的第二地址数据库中的至少两种地址信息数据库,对所述待判定地址信息的真实性进行判定,以获得所述至少两种初始判定结果。
13.根据权利要求12所述的装置,其特征在于,所述判定模块包括:
比较单元,用于将所述待判定地址信息与所述地址规则数据库中的字符规则逐一进行比较,以确定所述待判定地址信息满足的目标字符规则;
第一生成单元,用于根据所述目标字符规则,生成所述初始判定结果。
14.根据权利要求13所述的装置,其特征在于,所述第一生成单元具体用于执行以下至少一种操作:
根据所述目标字符规则的个数与预设个数阈值的比较结果,或所述目标字符规则对应的扣减分数之和与预设分数阈值的比较结果,生成用于指示所述待判定地址信息偏向于真实地址或虚假地址的真伪指示信息;
根据所述目标字符规则对应的扣减分数,生成所述待判定地址信息的判定得分。
15.根据权利要求13所述的装置,其特征在于,所述地址规则数据库中的字符规则包括以下至少一种:
含有指定的特殊字符;
包含的数字个数大于第一指定个数;
包含的汉字个数小于第二指定个数;
指定标点分隔方式的出现次数大于第一指定次数;
标点分隔出非语义词组的出现次数大于第二指定次数。
16.根据权利要求12所述的装置,其特征在于,所述判定模块包括:
查询单元,用于执行整体查询操作和切分查询操作中的至少一种;
第二生成单元,用于根据所述至少一种查询操作的查询结果,生成所述初始判定结果;
所述整体查询操作为:将所述待判定地址信息作为查询条件,到所述地图数据库、所述第一地址数据库或所述第二地址数据库中进行查询;
所述切分查询操作为:按照预设地址切分规则将所述待判定地址信息切分为至少一个地址片段,将所述至少一个地址片段中的每个地址片段作为查询条件,到所述地图数据库、所述第一地址数据库或所述第二地址数据库中进行查询。
17.根据权利要求16所述的装置,其特征在于,所述第二生成单元具体用于执行以下至少一种操作:
根据所述至少一种查询操作的查询结果,生成用于指示所述待判定地址信息偏向于真实地址或虚假地址的真伪指示信息;
根据所述至少一种查询操作的查询结果对应的增加分数,以生成所述待判定地址信息的判定得分。
18.根据权利要求17所述的装置,其特征在于,所述第二生成单元进一步具体用于:
若所述至少一种查询操作的查询结果满足预设第一真实判定条件,则生成用于指示所述待判定地址信息偏向于真实地址的真伪指示信息;
若所述至少一种查询操作的查询结果不满足所述第一真实判定条件,则生成用于指示所述待判定地址信息偏向于虚假地址的真伪指示信息。
19.根据权利要求12-18任一项所述的装置,其特征在于,所述业务方为电商平台,所述第三方为物流平台;
所述第一地址数据库包括:用户自定义的收货地址信息、订单中的收货地址信息以及退款单中的收货地址信息中的至少一种地址信息;
所述第二地址数据库包括:收货地址信息、发货地址信息以及途径地址信息中的至少一种地址信息。
20.根据权利要求11-18任一项所述的装置,其特征在于,所述确定模块具体用于:
若所述至少两种初始判定结果满足预设第二真实判定条件,则确定所述待判定地址信息为真实地址;
若所述至少两种初始判定结果不满足所述第二真实判定条件,则确定所述待判定地址信息为虚假地址。
CN201610165389.4A 2016-03-22 2016-03-22 地址信息处理方法及装置 Active CN107220255B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610165389.4A CN107220255B (zh) 2016-03-22 2016-03-22 地址信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610165389.4A CN107220255B (zh) 2016-03-22 2016-03-22 地址信息处理方法及装置

Publications (2)

Publication Number Publication Date
CN107220255A true CN107220255A (zh) 2017-09-29
CN107220255B CN107220255B (zh) 2021-03-19

Family

ID=59927261

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610165389.4A Active CN107220255B (zh) 2016-03-22 2016-03-22 地址信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN107220255B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109872098A (zh) * 2018-12-12 2019-06-11 平安科技(深圳)有限公司 基于车险保单配送的物流地址解析方法及计算机设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1929929A (zh) * 2004-04-02 2007-03-14 德国邮政股份公司 处理带有错误收信地址邮件的方法
US20090267768A1 (en) * 2006-08-07 2009-10-29 Hiroko Fujiwara Registration method and placement assisting apparatus for location information tag
CN102750351A (zh) * 2012-06-11 2012-10-24 迪尔码国际营销服务(北京)有限公司 基于规则的地址信息匹配方法
CN103778516A (zh) * 2014-02-21 2014-05-07 北京购阿购技术服务有限公司 全方位安全定位交易信息集成方法
CN103916435A (zh) * 2013-01-04 2014-07-09 阿里巴巴集团控股有限公司 判断信息真实性的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1929929A (zh) * 2004-04-02 2007-03-14 德国邮政股份公司 处理带有错误收信地址邮件的方法
US20090267768A1 (en) * 2006-08-07 2009-10-29 Hiroko Fujiwara Registration method and placement assisting apparatus for location information tag
CN102750351A (zh) * 2012-06-11 2012-10-24 迪尔码国际营销服务(北京)有限公司 基于规则的地址信息匹配方法
CN103916435A (zh) * 2013-01-04 2014-07-09 阿里巴巴集团控股有限公司 判断信息真实性的方法和装置
CN103778516A (zh) * 2014-02-21 2014-05-07 北京购阿购技术服务有限公司 全方位安全定位交易信息集成方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109872098A (zh) * 2018-12-12 2019-06-11 平安科技(深圳)有限公司 基于车险保单配送的物流地址解析方法及计算机设备

Also Published As

Publication number Publication date
CN107220255B (zh) 2021-03-19

Similar Documents

Publication Publication Date Title
CN110765770B (zh) 一种合同自动生成方法及装置
CN107704512B (zh) 基于社交数据的金融产品推荐方法、电子装置及介质
CN108595583A (zh) 动态图表类页面数据爬取方法、装置、终端及存储介质
CN106943747B (zh) 虚拟角色名称推荐方法、装置、电子设备和存储介质
CN110704719A (zh) 企业搜索文本分词方法和装置
CN110717801A (zh) 一种商品信息推送方法及装置
CN103577547B (zh) 网页类型识别方法及装置
CN111523030B (zh) 报盘信息推荐方法、装置及计算机可读存储介质
CN116701658A (zh) 业务意向的确定方法、装置及计算机设备
CN114528851B (zh) 回复语句确定方法、装置、电子设备和存储介质
CN110515929B (zh) 书籍展示方法、计算设备及存储介质
CN108984777B (zh) 客户服务方法、装置和计算机可读存储介质
CN107220255A (zh) 地址信息处理方法及装置
CN109523377B (zh) 一种数字货币的交易方法、装置、设备和存储介质
CN112559775A (zh) 一种专利信息管理方法及其系统、计算机设备
CN116595149A (zh) 一种人机对话生成方法、装置、设备及存储介质
CN118114660A (zh) 文本检测方法、系统及计算机可读存储介质
CN109727142A (zh) 保险投保方法、系统、设备及存储介质
CN111753548B (zh) 信息获取方法及装置、计算机存储介质、电子设备
CN115545976A (zh) 跨境商标注册方法、系统、装置及计算机可读存储介质
CN109189833B (zh) 一种知识库的挖掘方法及装置
CN114490969A (zh) 基于表格的问答方法、装置以及电子设备
CN113326368A (zh) 作答数据的处理方法、装置、设备以及存储介质
CN116541382B (zh) 基于数据安全识别级别的数据治理方法及系统
CN119358551B (zh) 一种词库生成方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant