[go: up one dir, main page]

CN119540983A - 一种车辆工单的校验方法和装置 - Google Patents

一种车辆工单的校验方法和装置 Download PDF

Info

Publication number
CN119540983A
CN119540983A CN202411676263.4A CN202411676263A CN119540983A CN 119540983 A CN119540983 A CN 119540983A CN 202411676263 A CN202411676263 A CN 202411676263A CN 119540983 A CN119540983 A CN 119540983A
Authority
CN
China
Prior art keywords
work order
vehicle
text
result
verification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202411676263.4A
Other languages
English (en)
Inventor
谢裕鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202411676263.4A priority Critical patent/CN119540983A/zh
Publication of CN119540983A publication Critical patent/CN119540983A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种车辆工单的校验方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取待校验车辆工单所对应的工单图片检测结果和工单文本提取结果;基于预先配置的别名库对所述工单文本提取结果进行别名转化处理,得到转化处理后的工单文本提取结果;基于所述工单图片检测结果和所述转化处理后的工单文本提取结果进行数据一致性校验,得到图文数据校验结果;从所述图文数据校验结果中提取出图片特征和文本特征,基于所述图片特征和文本特征确定所述待校验车辆工单的复审校验结果。本实施例能够自动进行工单校验,并且降低了校验成本,提高了校验效率和校验结果的准确性。

Description

一种车辆工单的校验方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种车辆工单的校验方法和装置。
背景技术
目前的车辆工单校验方法主要是人工罗列出校验的内容,然后根据校验规则进行简单初步审核,最后由后台工作人员手工进行后续的校验处理。
在实现本发明过程中,发明人发现相关技术中至少存在如下问题:
无法自动进行工单校验,成本高、效率低,并且校验结果准确性差。
发明内容
有鉴于此,本发明实施例提供一种车辆工单的校验方法和装置,能够自动进行工单校验,并且降低了校验成本,提高了校验效率和校验结果的准确性。
为实现上述目的,根据本发明实施例的一个方面,提供了一种车辆工单的校验方法,包括:
获取待校验车辆工单所对应的工单图片检测结果和工单文本提取结果;
基于预先配置的别名库对工单文本提取结果进行别名转化处理,得到转化处理后的工单文本提取结果;
基于工单图片检测结果和转化处理后的工单文本提取结果进行数据一致性校验,得到图文数据校验结果;
从图文数据校验结果中提取出图片特征和文本特征,基于图片特征和文本特征确定待校验车辆工单的复审校验结果。
可选地,方法还包括:
根据预先配置的适配关系校验待校验车辆工单中车辆与商品的适配性,得到待校验车辆工单的适配关系校验结果。
可选地,基于图片特征和文本特征确定待校验车辆工单的复审校验结果,包括:
将图片特征和文本特征进行加权融合,得到图文融合向量;
基于图文融合向量和获取到的历史图文融合向量,重新校验待校验车辆工单所对应的工单图片数据和工单文本数据,得到待校验车辆工单的复审校验结果。
可选地,方法还包括:
基于获取的历史车辆工单数据确定价格校验策略;根据价格校验策略校验待校验车辆工单中的金额数据,得到待校验车辆工单的价格风险校验结果;其中,历史车辆工单数据是待校验车辆工单的相同类目工单或相近类目工单的历史数据;
或者,基于获取的历史车辆工单数据确定地址校验策略;根据地址校验策略校验待校验车辆工单中的地域数据,得到待校验车辆工单的地址风险校验结果。
可选地,获取待校验车辆工单所对应的工单图片检测结果之前,还包括:
利用工单图片检测模型对获取到的待校验车辆工单所对应的工单图片数据进行检测处理,以得到待校验车辆工单所对应的工单图片检测结果;其中,工单图片检测结果包括以下至少之一:车身图片检测结果、车型图片检测结果和车牌图片检测结果;
方法还包括:
根据工单图片检测结果对工单图片检测模型进行迭代优化。
可选地,获取待校验车辆工单所对应的工单文本提取结果之前,还包括:
利用工单实体提取模型对获取到的待校验车辆工单所对应的工单文本数据进行实体提取处理,以得到待校验车辆工单所对应的工单文本提取结果;其中,工单文本提取结果包括以下至少之一:车型实体提取结果和车牌实体提取结果;
方法还包括:
根据工单文本提取结果对工单实体提取模型进行迭代优化。
根据本发明实施例的第二方面,提供了一种车辆工单的校验装置,包括:
结果获取模块,用于获取待校验车辆工单所对应的工单图片检测结果和工单文本提取结果;
别名转化模块,用于基于预先配置的别名库对工单文本提取结果进行别名转化处理,得到转化处理后的工单文本提取结果;
数据校验模块,用于基于工单图片检测结果和转化处理后的工单文本提取结果进行数据一致性校验,得到图文数据校验结果;
复审校验模块,用于从图文数据校验结果中提取出图片特征和文本特征,基于图片特征和文本特征确定待校验车辆工单的复审校验结果。
根据本发明实施例的第三方面,提供了一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述任一实施例的方法。
根据本发明实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现上述任一实施例的方法。
根据本发明实施例的第五方面,提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现上述任一实施例的方法。
上述发明中的一个实施例具有如下优点或有益效果:通过获取待校验车辆工单所对应的工单图片检测结果和工单文本提取结果;基于预先配置的别名库对工单文本提取结果进行别名转化处理,得到转化处理后的工单文本提取结果;基于工单图片检测结果和转化处理后的工单文本提取结果进行数据一致性校验,得到图文数据校验结果;从图文数据校验结果中提取出图片特征和文本特征,基于图片特征和文本特征确定待校验车辆工单的复审校验结果;由此能够自动进行工单校验,并且降低了校验成本,提高了校验效率和校验结果的准确性。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的车辆工单的校验方法的主要流程的示意图;
图2是根据本发明一个可参考实施例的车辆工单的校验方法的主要流程的示意图;
图3是根据本发明优选实施例的车辆工单的校验方法的主要流程的示意图;
图4是根据本发明实施例的车辆工单的校验装置的主要模块的示意图;
图5是本发明实施例可以应用于其中的示例性系统架构图;
图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要说明的是,本发明实施例所涉及的个人信息等的获取、存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
目前,主要是人工罗列出校验的内容,然后根据校验规则进行简单初步审核,最后由后台工作人员手工进行后续的校验处理,无法自动进行工单校验,成本高、效率低,并且校验结果准确性差。
有鉴于此,根据本发明实施例的一个方面,提供了一种车辆工单的校验方法。
图1是根据本发明实施例的车辆工单的校验方法的主要流程的示意图。如图1所示,根据本发明实施例的车辆工单的校验方法,包括如下步骤S101至步骤S104。
步骤S101,获取待校验车辆工单所对应的工单图片检测结果和工单文本提取结果。
其中,待校验车辆工单是指尚未进行确认或审核的车辆工单信息,可以包含工单编号、创建时间、责任人、工单内容描述等信息。待校验车辆工单可以来自不同的来源,如用户提供线下提供的商品核销单、用户提交的报修请求、内部生成的维护任务或其他形式的工单记录。工单图片检测结果包括检测到的对象类别、位置坐标(如边界框)、置信度评分等信息。例如,如果工单图片数据涉及某台设备的故障,工单图片检测模型可标出设备上损坏的部件,并给出该损坏的详细信息和可能的故障类型。工单文本提取结果包括从工单描述或相关文档中提取的关键信息,如故障描述、工作内容、技术规范等。
具体地,可以利用预先训练好的图像检测模型,从车辆工单图片中提取信息,得到工单图片检测结果。也可以通过基于边缘检测或分割算法的方法,定位工单图片中的关键区域,结合规则匹配对特定对象类别和位置进行检测,生成工单图片检测结果。关于工单文本提取结果,可以利用工单实体提取模型对工单文本数据进行实体提取处理,得到工单文本提取结果。还可以对工单图片中的文本区域进行识别,并结合自然语言处理技术进行关键字段抽取和语义分析,生成工单文本提取结果。
步骤S102,基于预先配置的别名库对工单文本提取结果进行别名转化处理,得到转化处理后的工单文本提取结果。
利用预先配置的别名库,将不同形式的实体名称统一转换为标准化的名称,从而生成更加准确和一致的工单文本提取结果。从工单文本数据中提取的实体数据可能包含各种不同的命名形式,例如,同一品牌、车型或部件可能有多种别名或缩写。为了保证数据的一致性,系统加载预先配置的别名库,别名库中存储了常见实体的各种别名和对应的标准化名称,例如将“Toyota”与“丰田”统一为“Toyota”,或者将“发动机”与“引擎”统一为“发动机”等等。对提取出的工单文本提取结果进行别名转化处理,具体地,逐一扫描提取到的工单文本提取结果中的实体,并在别名库中查找其对应的标准化名称,如果找到匹配项,系统会将原始实体名称替换为标准化名称,例如,如果工单文本数据中提取到的实体为“丰田”,系统会将其转换为标准化名称“Toyota”。这种转换不仅限于品牌名称,还包括其他实体类型,如部件名称、车型名称等。通过别名转化处理,避免了因不同命名方式导致的数据混淆和错误,能够生成更加精确和一致的工单文本提取结果,为后续的校验和处理提供了坚实的数据基础,提高了工单处理的效率和准确性。
步骤S103,基于工单图片检测结果和转化处理后的工单文本提取结果进行数据一致性校验,得到图文数据校验结果。
数据一致性校验根据工单图片检测结果和转化处理后的工单文本提取结果进行,确保待校验工单数据在图像和文本两个维度上的完整性和一致性。具体地,从工单图片检测结果和转化处理后的工单文本提取结果中分别获取结构化的数据,工单图片检测结果包括从图片中提取的关键信息,如物体检测(例如设备、部件)、区域识别(例如位置坐标)、特定属性(如损坏程度或状态),工单文本提取结果包括从工单描述或相关文档中提取的关键信息,如故障描述、工作内容、技术规范等。然后,进行数据匹配和验证,可以比对工单图片检测到的物体、区域或属性与工单文本提取到的描述和信息,例如,检查工单中描述的具体设备或问题是否与图像中检测到的实际情况相符。如果发现工单图片和文本之间存在不一致或不完整的情况,可以重新获取图片或文本数据,进一步核实待校验工单的具体内容,以提高最终校验结果的准确性和可信度。最后,生成待校验工单的图文数据校验结果,图文数据校验结果汇总每个待校验的数据一致性评估,反映图片和文本数据在匹配度和准确性上的综合表现。这些校验结果为后续的审批、审核或决策提供了重要依据,保证了工单信息处理过程中的可靠性和有效性。
步骤S104,从图文数据校验结果中提取出图片特征和文本特征,基于图片特征和文本特征确定待校验车辆工单的复审校验结果。
从图文数据校验结果中提取图片特征和文本特征,图片特征可以包括图像中检测到的对象类别、位置、颜色、形状等视觉信息,可以通过深度学习模型(如卷积神经网络)或其他方式提取;文本特征包括工单文本中的关键信息,如设备名称、故障描述、操作步骤等,可以通过自然语言处理技术(如BERT模型)或者其他方法提取。
本发明实施例通过获取待校验车辆工单所对应的工单图片检测结果和工单文本提取结果;基于预先配置的别名库对工单文本提取结果进行别名转化处理,得到转化处理后的工单文本提取结果;基于工单图片检测结果和转化处理后的工单文本提取结果进行数据一致性校验,得到图文数据校验结果;从图文数据校验结果中提取出图片特征和文本特征,基于图片特征和文本特征确定待校验车辆工单的复审校验结果;能够自动进行工单校验,并且降低了校验成本,提高了校验效率和校验结果的准确性。
可选地,方法还包括:根据预先配置的适配关系校验待校验车辆工单中车辆与商品的适配性,得到待校验车辆工单的适配关系校验结果。
从待校验车辆工单中提取车辆信息和商品信息,车辆信息包括品牌、车型、年款等关键属性,商品信息包括商品的类型、规格、适用范围等。预先配置的适配关系存储在关系库中,关系库用于存储车辆与商品的对应关系和适配规则,适配规则可以是基于历史数据、专家经验和实际使用情况制定的。利用预先配置的适配关系库,对提取到的车辆信息与商品信息进行匹配和比对,具体来说,检索适配关系库,查找与当前车辆信息相符的商品适配规则,例如,如果待校验车辆工单中的车辆是某品牌的特定车型,系统可以查找该车型所适配的易损件、配件等商品的详细列表和适配条件。在比对过程中,系统确定待校验车辆工单中的商品符合车辆的适配条件,包括检查商品的规格是否与车辆的技术要求相匹配,如尺寸、型号、兼容性等,此外,还可以核对商品的适用范围是否涵盖当前车辆的品牌和车型。如果有多个商品符合适配条件,可以进一步细化匹配标准,选择最合适的商品进行比对。如果匹配过程中发现不一致或不符合适配条件的情况,标记该待校验工单为不合格,以进一步核实和处理,重新确认商品信息或车辆信息,或者调整待校验车辆工单内容以符合适配关系。最后,生成待校验车辆工单的适配关系校验结果,适配关系校验结果包括车辆与商品的适配性评估、是否满足适配条件的详细说明以及任何不合格的原因和建议处理方案等等。
本发明实施例通过适配关系校验了待校验车辆工单中商品与车辆的匹配度,提高了车辆工单处理的准确性和可靠性,提升整体业务运作的质量和效率。
可选地,图2是根据本发明一个可参考实施例的车辆工单的校验方法的主要流程的示意图。如图2所示,基于图片特征和文本特征确定待校验车辆工单的复审校验结果,包括步骤S201至步骤S202。
步骤S201,将图片特征和文本特征进行加权融合,得到图文融合向量。
步骤S202,基于图文融合向量和获取到的历史图文融合向量,重新校验待校验车辆工单所对应的工单图片数据和工单文本数据,得到待校验车辆工单的复审校验结果。
将提取到的图片特征和文本特征进行加权融合,得到图文融合向量,加权融合是指根据图片特征和文本特征的重要性和相关性,分配不同的权重,使融合向量能够更全面地代表工单的整体信息。融合方法可以采用多种技术,如加权平均、注意力机制等,使得融合后的向量能够充分捕捉图文数据的相关性和一致性。
基于生成的图文融合向量和获取到的历史图文融合向量,重新校验待校验车辆工单对应的工单图片数据和工单文本数据。历史图文融合向量存储了之前工单的图文特征信息,通过与当前待校验工单的图文融合向量进行比对,可以识别重复内容、异常情况和潜在问题等等。
在复审校验过程中,系统比较当前待校验车辆工单与历史车辆工单的图文融合向量,如检查是否存在重复提交或类似问题,确保当前待校验车辆工单信息的唯一性和准确性。通过图文融合向量的分析,识别文本和图片数据中的异常,如金额异常、常用地域异常等,并进行标记和处理。通过融合向量的综合分析,提高车辆工单复审的准确性,减少因单一数据源导致的误判。
可选地,方法还包括:基于获取的历史车辆工单数据确定价格校验策略;根据价格校验策略校验待校验车辆工单中的金额数据,得到待校验车辆工单的价格风险校验结果;其中,历史车辆工单数据是待校验车辆工单的相同类目工单或相近类目工单的历史数据;或者,基于获取的历史车辆工单数据确定地址校验策略;根据地址校验策略校验待校验车辆工单中的地域数据,得到待校验车辆工单的地址风险校验结果。
从历史车辆工单中获取相同类目或相近类目的工单数据。历史车辆工单包括价格信息、地址信息及其他相关属性,通过分析这些工单数据,能够确定正常情况下的价格范围和地址分布。其中,同类目工单是指属于同一个类别或分类的工单,这些工单在属性、处理流程和业务内容上具有高度的一致性,例如,工单涉及的商品类型或服务类型相同,都是关于某一品牌某一型号的汽车维修工单或某种产品的售后服务工单。相近类目工单是指在属性、处理流程和业务内容上与待校验工单有一定相似性但不完全相同的工单,例如,相似的商品或服务类别,相同品牌但不同型号的汽车维修工单或不同种类的电子产品售后工单。
基于历史车辆工单,系统分析同类或相近类目工单的价格分布情况,确定合理的价格区间和异常价格的判定标准,例如,通过统计分析方法,计算出正常价格的平均值和标准差,确定价格上限和下限。根据制定的价格校验策略,系统对待校验车辆工单的数据中的金额进行校验,如果待校验车辆工单的金额数据超出了预定的合理价格区间,系统会标记为价格风险异常,生成价格风险校验结果,能够识别潜在的价格欺诈或数据录入错误。通过分析历史车辆工单的地址数据,确定常见的地理分布和异常区域,历史数据分析可以包括频率分析和地理聚类等方法,以识别正常的服务区域和不常见的异常地址。根据制定的地址校验策略,系统对待校验车辆工单的数据中的地址信息进行校验,系统会检查待校验车辆工单的地址是否在常见的服务区域内,是否存在不合理的地理位置或频繁变动的地址,如果发现异常地址,将标记为地址风险异常,生成地址风险校验结果,有利于识别潜在的地址欺诈或操作失误。
可选地,获取待校验车辆工单所对应的工单图片检测结果之前,还包括:利用工单图片检测模型对获取到的待校验车辆工单所对应的工单图片数据进行检测处理,以得到待校验车辆工单所对应的工单图片检测结果;其中,工单图片检测结果包括以下至少之一:车身图片检测结果、车型图片检测结果和车牌图片检测结果。方法还包括:根据工单图片检测结果对工单图片检测模型进行迭代优化。
工单图片数据是指与工单相关的图片或图像资料,图片可以是现场照片、设备截图、故障图示或其他相关的视觉资料,图片与工单一起上传或通过其他方式收集,并与工单编号等信息关联存储在数据库中。可以通过工单管理系统的查询功能或API接口(Application Programming Interface,应用程序编程接口)获取所有待校验状态的工单列表或者扫描用户线下提供的待校验工单,从数据库或系统中提取待校验工单的基本信息,如工单编号、创建时间、责任人、工单状态等。对于每个待校验工单,通过工单编号在图片存储系统(如文件服务器、云存储等)中检索对应的图像文件,可以使用API接口、文件路径或其他关联信息来获取相关图片,并使得图片与正确的工单匹配。
具体地,本实施例将与工单相关的图片数据输入到预训练的工单图片检测模型中,以识别和分析图片中的关键信息。工单图片检测模型能够识别特定类型的图像特征和异常情况,工单图片检测模型将工单图片数据进行多层次的特征提取和分析,识别出图片中的重要元素,例如设备部件、设备外观、损坏区域、操作工具等,并标注出检测到的对象或异常。检测处理完成后,工单图片检测模型生成工单图片检测结果,这些信息可以与工单的文本描述相互验证,提高工单检验的准确性和效率。
另外,收集和整理工单图片检测结果,工单图片检测结果来自实际工单的处理过程,包含工单图片检测对车身、车型和车牌的检测输出,这些检测结果包括模型的预测标签、预测的置信度、检测框的位置和大小,以及与实际情况的对比结果。对于车身图片检测结果,工单图片检测模型识别和定位汽车的轮廓和特征。迭代优化过程中,分析工单图片检测结果中错误分类或定位不准的案例,例如,模型可能误将其他物体识别为车身或未能正确框选车身区域;针对检测中的弱点,进行数据增强,例如,通过增加不同角度、不同光照条件下的车身图片来丰富训练数据;根据错误分析结果,调整模型架构或参数,例如调整卷积层的深度、增加特征提取层等,以提高模型对车身检测的准确性。对于车型图片检测结果,工单图片检测模型精确识别汽车的品牌和型号,迭代优化过程中,将车型细分为更具体的类别,增加标签的精细度,以提高模型区分相似车型的能力;解决训练数据中不同车型样本数量不平衡的问题,通过数据重采样或生成合成数据来平衡样本分布;改进特征提取方法,利用多尺度特征或融合多种特征提取技术,提高模型对车型细节的敏感度。对于车牌图片检测结果,工单图片检测模型准确定位并识别车牌字符,迭代优化过程中,分析字符识别错误,改进字符识别算法,采用更强大的OCR(光学字符识别)模型;处理车牌图片中的噪声和模糊问题,例如通过图像预处理技术去除噪声、增强对比度等,提高车牌字符的清晰度;通过迁移学习或少样本学习技术,提升模型在小样本数据上的表现,特别是针对稀有车牌样式或特殊字符的识别。
本发明实施例通过以上优化步骤,工单图片检测模型能够在车身、车型和车牌检测方面表现得更加准确和可靠,从而提高整体工单处理的效率和质量,提升用户满意度。
可选地,获取待校验车辆工单所对应的工单文本提取结果之前,还包括:利用工单实体提取模型对获取到的待校验车辆工单所对应的工单文本数据进行实体提取处理,以得到待校验车辆工单所对应的工单文本提取结果;其中,工单文本提取结果包括以下至少之一:车型实体提取结果和车牌实体提取结果。方法还包括:根据工单文本提取结果对工单实体提取模型进行迭代优化。
工单文本数据是指工单的详细文字描述信息,包括但不限于故障描述、解决方案、操作步骤、客户反馈等,工单文本数据可以存储在工单管理系统的数据库中,并可通过工单编号等标识符进行检索和关联。通过工单管理系统的数据库查询功能或API接口,根据工单编号提取工单的详细文本描述来获取工单文本数据。
具体地,通过自然语言处理技术,从工单文本数据中自动抽取出关键实体信息,以支持工单内容的详细分析和验证。工单实体提取模型基于机器学习算法,如序列标注模型(例如BiLSTM-CRF)或预训练语言模型(如BERT),通过对大量标注数据的训练,学习如何识别和分类文本中的实体,例如车牌号、车型、品牌等。工单实体提取模型将工单文本数据进行多层次的文本分析和语义理解,识别并标注出工单文本数据中特定实体的位置和类型,例如,从工单文本数据中提取出车辆的车牌号、品牌信息、车型信息等重要元素。工单实体提取模型的输出结果可以是结构化的数据,包括提取到的实体类型(如车牌、品牌、车型)、实体具体内容以及实体在文本中的位置,这些数据不仅能够帮助确定工单内容的关键信息,还可以为后续的自动化处理提供基础。工单实体提取模型能够显著提高工单处理的效率和准确性,与传统的手动处理相比,这种自动化的文本分析技术能够快速而精确地提取出工单中的重要信息,减少人工处理的时间和成本,同时减少因人为错误而引起的问题,不仅适用于单一工单的处理,还能有效地应对大量工单数据的高效处理需求,为企业提供了更高效和智能的业务运营支持。
通过分析工单文本提取结果中的错误和不足,可以发现工单实体提取模型在车型和车牌实体提取中的问题,例如,工单实体提取模型可能会错误地提取出不相关的信息,或者对相似车型和车牌的区分不够准确。对于车型实体提取结果的优化,可以增加训练数据的多样性和覆盖面,尤其是针对容易混淆的车型实体,通过扩充数据集,引入更多不同品牌、型号、年款的文本数据,可以增强模型对各类车型的识别能力,此外,可以采用更高级的自然语言处理技术,如上下文感知的语言模型(例如BERT),来提高模型对车型实体的理解和提取能力。对于车牌实体提取结果的优化,车牌实体通常具有固定的格式和字符组合,可以引入规则基于模型的校正机制,对提取出的车牌实体进行验证和修正,此外,可以通过增加对不同地区和不同类型车牌的数据训练,来增强工单实体提取模型的泛化能力和识别准确度。在整个迭代优化过程中,不仅要关注单次优化的效果,还可以建立持续的优化机制,通过定期收集新的工单文本数据,不断更新和扩充训练集,保持模型的高效学习和适应能力。
本发明实施例通过基于工单文本提取结对工单实体提取模型进行优化,能够使得工单文本提取模型在车型实体和车牌实体的提取上表现得更加精准和可靠,从而提高工单处理的整体效率和准确性。
图3是根据本发明优选实施例的车辆工单的校验方法的主要流程的示意图。如图3所示,本实施例是汽车易损件类目商品线下进行核销安装正确性审核的场景,主要包括以下步骤1至步骤8。
步骤1:待校验工单数据输入,从商品属性库、工单文本库、工单图片库中加载商品的属性、工单的文本、工单的图片信息。
步骤2:针对图片中带有的工单图片,需完成工单图片中车身检测、车牌检测汽车品牌、车型识别,任务包含有多目标任务检测,需要使用真实优质图片进行模型的微调,提升对车身检测、车牌检测以及汽车品牌识别的准确度,完成图片提取模型的优化和训练工作。
步骤3:对于工单的图片数据,使用步骤2训练好的工单图片检测模型,完成车身检测、品牌、车型识别、车牌检测模型工作,车牌检测之后还需要通过针对车牌优化的OCR识别模型识别出实际车牌,完成对汽车工单图片中所包含的信息提取。
步骤4:对于工单的文本数据,使用基于汽车工单文本数据训练好的工单文本实体提取模型,提取出汽车工单文本中的车牌信息、品牌、车型信息。
步骤5:在步骤3、步骤4中,已完成对工单图片中的车身检测、车型识别、车牌检测、车牌识别工作,已完成对工单文本中的车牌实体提取、车型实体提取工作,得到了原始模型提取的基本文本数据,紧接着需要校验图文数据的一致性,主要校验核销工单的车牌一致性、车型一致性、以及车身阈值是否满足工单校验条件,在校验过程中,需要将核销工单中文本提取的非规范化的实体规范化为同图片维度一致的实体,再进行比对。
步骤6:通过前5个步骤,可以基本校验出工单记录的车辆是否符合实际到达门店的车辆,需进一步校验商品同车型适配关系是否满足条件,不同的商品会有不同的校验属性,得出最相近商品,并得到对应商品的车型适配关系,然后校验核销工单车型是否适配当前商品。
步骤7:完成前6个步骤的单个销校工单核验之后,需要使用图片提取网络的骨干网络和命名实体提取模型的倒数第一层完成图片和文本的特征提取工作,统一特征维度后再使用加权平均方式进行融合为图文融合向量,再通过图文向量召回引擎校验当前工单图片、文本和历史工单图片、文本是否有重复上传内容,还需要校验当前工单在历史同类目工单中是否有金额异常、常用地域异常等问题,用于添加历史数据维度的校验逻辑,并能够完成追溯复审的工作。
步骤8:完成以上7步骤之后,得出最终核销工单的图文多模态审核校验结果,并把增量数据进行存储,用于校验核销工单合规结果,并输出到下游应用。
具体地,从系统输入到输出按照工单核销图片信息提取模块、核销文本实体提取模块、图片文本一致性校验模块、商品适配关系校验模块、历史图文重复检索校验模块、历史工单异常检测及存储输出七个关键模块进行详述本发明实施例。
核销图片信息提取模块,核销图片为技师现场施工及进行核销商品替换现场的实况照片,主要目标是检测出核销工单当中是否包含车、车身占比是否满足照片阈值、具体拍照汽车的车型名称、拍照车辆的车牌检测,在检测完成后,还需对检测出来的车牌使用OCR模型(Optical Character Recognition,光学字符识别)识别车牌文本工作,因此需要完成车辆多信息检测及OCR识别模型微调和车辆信息识别及阈值计算的工作。
车辆多信息检测识别及OCR识别模型微调,首先是图片数据收集与预处理的工作,主要是通过历史工单的图片数据进行分层抽样和筛选;车辆实际施工图片获取:根据存量的工单图片,收集市面上全量品牌车辆图片,包括不同品牌、型号、颜色和施工环境下的车辆图片;车牌图片获取:收集车牌图片,确保包含不同地区、字体和格式的车牌;数据标注:对车辆图片进行标注,包括是否是车、车辆品牌、车辆车型等,同时对车牌图片进行ocr标注;数据增强:通过旋转、缩放、裁剪等方法增加数据多样性;数据清洗:去除质量差的图片,同时需要保证品牌覆盖度、车型覆盖度、车牌字符覆盖度,确保数据集的质量。然后是模型微调及模型部署迭代的工作;模型选择:车辆检测模型,选择一个预训练的目标识别及检测模型(如YOLO、SSD、Faster R-CNN)进行微调;车牌OCR识别,选择一个预训练的OCR模型(如CRNN、Attention OCR)进行微调,在进行微调前需要将数据格式进行对应模型的转换及调整,以适应模型输入;车辆识别检测模型微调:使用车辆图片数据集对模型进行微调,调整模型的最后几层以适应新的类别(车辆品牌、车辆型号)以及物体检测框精确绘制,训练模型,直到在验证集上达到满意的准确率;OCR识别模型微调:使用车牌图片数据集对模型进行微调,使其适应当前车牌字符类型的识别结果,训练模型,直到在验证集上达到业务要求识别率;
车辆信息识别OCR识别及阈值计算,上述已得到使用真实核销工单图片(车辆图片 和车牌图片)进行微调之后的车辆多信息检测识别模型以及OCR识别模型,将训练好的模型 导出为可部署的格式(如ONNX、TensorRT等),将模型封装为API服务,以便于集成到应用全 流程内,根据实际应用场景对模型进行优化,确保满足实时性、以及批量处理的需求;同时 由于车辆的市场在不断的更新迭代,模型也需要随着新增数据的更新进行迭代,因此需在 实际应用中收集模型的预测结果和用户反馈,根据反馈更新数据集,包括增加新的样本和 修正错误标注,定期使用更新后的数据集对模型进行再训练和微调,并进行热线上模型的 自动更新;当新增的核销工单图片,通过车辆多信息检测识别模型以及OCR识别模型的处理 之后,可以得到是否为车的标签L、识别为车之后的车型检测框坐标Loc1=[x1,y1,x2,y2]、 标标准化后的车辆品牌、车型、年款、车牌等信息,并通过原始工单图片的长W 宽H尺寸来计算车辆的车身占总图片的比例rate,用于评定占比是否满足工单核销车身占 比要求。
核销文本实体提取模块,核销图片校验完成后,针对核销工单中的人员录入信息进行核验,策略采用基于微调后的命名实体提取模型来进行文本的验证提取工作,提取文本中的车型品牌、车型、录入车牌号等信息,同时针对提取到的名称进行别名转换,用于上述步骤中的图片识别的车型信息结果匹配工作。
命名实体模型微调,首先是文本数据收集与预处理的工作,主要是通过历史工单的文本数据进行分层抽样和筛选;工单文本数据获取:使用历史工单数据进行录入,收集包含车辆品牌、车型名称的文本数据,需要包含车型品牌、车型的标准名称、别名、昵称、年款等实体;数据标注及预处理:对收集到的文本数据进行人工标注,标注出文本中的车辆品牌、车型名称等实体使用BIO标注规范,再对文本进行清洗(去除无关字符、统一字符编码等)、分词、构建词汇表等步骤,同时通过实体的位置重组、别名替换等工作,在原有数据基础上再进一步扩充数据量级,扩充训练数据,保证文本数据的质量;模型选择:基于Transformer的预训练模型(如BERT、RoBERTa、ALBERT等)在NER任务上表现优异,选择其中一个适合中文文本NER提取的预训练模型作为基础,用于下游微调;模型微调:对于车辆文本的NER任务,在预训练模型的基础上添加一个分类层,用于识别文本中的实体类型(如车辆品牌、车型名称等),使用准确率(Accuracy)、召回率(Recall)、F1分数等指标评估模型性能。
命名实体提取及别名转换,在得到车型实体提取的模型后,将训练好的模型导出 为可部署的格式(如ONNX、TensorRT等),将模型封装为API服务,以便于集成到应用全流程 内,根据实际应用场景对模型进行优化,确保满足实时性、以及批量处理的需求;当新增的 核销工大文本传入之后,通过模型服务,完成车型词实体的提取工作,可针对不工单提取文 本中的非标准品牌、车型、年款, 车牌等实体;提取的非标准品牌、 车型、年款, 车牌等实体,通过别名映射关系,将其映射到标准的品牌、 车型、年款, 车牌上,为非标转换为标准的转换函数。
图片文本一致性校验模块,在完成核销图片和核销文本的提取之后,需要校验从 图片维度和从文本维度,是否满足图文一致性,以及校验图片、文本是否满足上传等内容是 否满足核销条件。在完成图片和文本数据的训练之后,分别使用两部分模型针对核销工单 的图片数据和文本数据做核销图片提取和核销文本提取,图片数据检测识别出图片中车型 的实际品牌、车型、年款、车牌等信息,可以记录为列表,文本部分 提取出车辆在系统文本中录入的品牌、车型、年款、车牌等信息, 可以记录为列表,用于比较规范化后的实际上传图片和工单录入工单文本信 息提取的内容是否匹配。
同时,根据设定的车身占图片比例设定阈值,判定是否满足条件,图文一致性、车身占比阈值、是否为车辆图片标签L满足条件之后,继 续进行后续校验。
商品适配关系校验模块,校验完成图文一致性和长传合规性之后,针对有适配的 核销商品,需要校验车型及核销商品是否满足车型商品的校验逻辑,一方面是防止不适配 商品安装导致让客户车辆受损,另一方面也是防止商家套利随机绑定商品进行直接核销, 规范核销适配。核销的商品SKU(库存单元)在标库内为标准数据,运维在维护数据的时候, 会同时维护商品对应的车型适配数据集,通过核销图片及 文本数据提取的品牌B、车型S、年款Y,判定当前车型是否在车型之和之中,并通过核销商品 的通用属性信息、专有属性信息,在原有的车型商品适配关系库内作比对,保证商品满足当 前核销车型的核销条件,保证车型商品都没有错误。
历史图文重复检索校验模块,除了校验当前工单的图文一致性、商品适配之外,还需要核验当前上传的图片是否同当前店铺、当前区域近一个滑动时间区间周期M内有重复上传的情况,用于校验是否有通过重复的历史校验图文来进行绕过核验机制,进行虚假核销。
图文向量提取中,图片向量转换:可以选择将车辆多信息检测识别中图片识别模型的backbone部分单独拆出来,用于提取图片的特征向量,针对不同通道所输出的特征向量,进行加权平均和flatten的操作,用于提取出核销工单图片特征,将图片输入模型,得到的输出即为图片的特征向量E_P;文本向量转换:可选择已经训练好的命名实体模型的倒数第一层输出作为特征向量,将文本转换为特征向量,将文本输入模型,得到的输出可以转换为文本的特征向量E_T;图文向量融合:由于E_P和E_T的维度可能不一致,需要通过维度调整使它们具有相同的维度N,通过在特征提取之后的两个输出后添加全连接层来调整特征向量的维度,如E_P的维度为D_P,E_T的维度为D_T,添加全连接层F,将它们的维度都调整为N,有了维度一致的特征向量后,可以通过拼接、加权求和或者特征融合网络的方式来进行特征的融合,在此图片和文本是同样的权重系数,可以设定权重比例相等,设定权重系数θ为0.5进行融合,最终得到图文融合特征向量E。
图文向量检索引擎,向量数据存储及向量索引构建:可以使用如Elasticsearch, Faiss,Annoy等专门为向量搜索设计的数据库来存储特征向量,将历史所有的图文数据通 过图文向量提取模块,提取出对应的特征向量并存入向量数据库,并构建索引以加快相似 度索引检索的搜索速度,常用的相似度度量方法包括余弦相似度、欧氏距离,选择其一作为 相似度度量计算方式即可。对于统一了特征长度均为n的两个向量的余弦相似度可以表示为:
新增的核销工单图文数据,通过图文特征提取完成之后,得到当前工单的特征向量E_new,并使用图文检索引擎对滑动时间周期M内的图文特征进行相似度检索和匹配,设定的滑动时间周期M会根据保养、易损件、车辆行驶公里数进行动态调整,一般为3个月到12个月时间不等,设定相似度阈值β,当存在历史的特征向量同当前工单的特征向量E_new的相似度大于阈值β时,判定为存在使用重复的历史校验图文来进行绕过核验机制的行为,判定为虚假核销风险。
历史工单风险项异常检测,除了图文维度的校验之外,还需要校验历史订单中对 应类目订单金额的趋势变化,根据实际的标定价格、服务费和浮动阈值区间,制定异常 价格校验,核销价格需要在阈值区间(以内;同时需要根据用户历史核销地址, 根据不同类目校验地域核销是否有异常地址出现,以避免通过同一账户,不同地域、门店重 复下单,进行虚假核销套利的行为。
存储及校验结果输出,完成核销工单的图文一致性校验、车型适配校验、历史图文重复项校验、以及历史工单风险项异常校验之后,保证了核销工单多维度的核销校验,将关键节点的中建信息落库存储,文本数据存入关系型数据库内,图片数据存入云存储系统内,检索向量存入向量数据库内,最终生成工单核销的自动校验结果,用于下游应用。下游能够精确判定核销车辆在车型、车牌、适配关系、历史重复内容校验、合规等维度的核销条件审核结果,生成通过及驳回理由,有效提效核销工单审核流程。
本发明实施例系统输出最终核销工单图文多模态的数据校验结果,用于提高后台审核平台自动化工单审核能力、效率以及准确度,并能够提前发现核销潜在问题,提升核销服务监控质量,并可以进行工单数据的追溯及复审,保证用户满意度和提升规范性。
根据本发明实施例的第二方面,如图4所示,提供了一种车辆工单的校验装置400,包括:
结果获取模块401,用于获取待校验车辆工单所对应的工单图片检测结果和工单文本提取结果;
别名转化模块402,用于基于预先配置的别名库对工单文本提取结果进行别名转化处理,得到转化处理后的工单文本提取结果;
数据校验模块403,用于基于工单图片检测结果和转化处理后的工单文本提取结果进行数据一致性校验,得到图文数据校验结果;
复审校验模块404,用于从图文数据校验结果中提取出图片特征和文本特征,基于图片特征和文本特征确定待校验车辆工单的复审校验结果。
可选地,车辆工单的校验装置400还包括关系校验模块,关系校验模块用于:
根据预先配置的适配关系校验待校验车辆工单中车辆与商品的适配性,得到待校验车辆工单的适配关系校验结果。
可选地,复审校验模块404还用于:
将图片特征和文本特征进行加权融合,得到图文融合向量;
基于图文融合向量和获取到的历史图文融合向量,重新校验待校验车辆工单所对应的工单图片数据和工单文本数据,得到待校验车辆工单的复审校验结果。
可选地,工单校验装置400还包括风险校验模块,风险校验模块用于:
基于获取的历史车辆工单数据确定价格校验策略;根据价格校验策略校验待校验车辆工单中的金额数据,得到待校验车辆工单的价格风险校验结果;其中,历史车辆工单数据是待校验车辆工单的相同类目工单或相近类目工单的历史数据;
或者,基于获取的历史车辆工单数据确定地址校验策略;根据地址校验策略校验待校验车辆工单中的地域数据,得到待校验车辆工单的地址风险校验结果。
可选地,工单校验装置400还包括图片检测模型模块,图片检测模型模块用于:
利用工单图片检测模型对获取到的待校验车辆工单所对应的工单图片数据进行检测处理,以得到待校验车辆工单所对应的工单图片检测结果;其中,工单图片检测结果包括以下至少之一:车身图片检测结果、车型图片检测结果和车牌图片检测结果;还用于:根据工单图片检测结果对工单图片检测模型进行迭代优化。
可选地,工单校验装置400还包括实体提取模型模块,实体提取模型模块用于:
利用工单实体提取模型对获取到的待校验车辆工单所对应的工单文本数据进行实体提取处理,以得到待校验车辆工单所对应的工单文本提取结果;其中,工单文本提取结果包括以下至少之一:车型实体提取结果和车牌实体提取结果;还用于:根据工单文本提取结果对工单实体提取模型进行迭代优化。
需要说明的是,在本发明车辆工单的校验装置的具体实施内容,在上面车辆工单的校验方法中已经详细说明了,故在此重复内容不再说明。
根据本发明实施例的第三方面,提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本发明实施例第一方面提供的方法。
根据本发明实施例的第四方面,提供一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现本发明实施例第一方面提供的方法。
根据本发明实施例的第五方面,提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现本发明实施例第一方面提供的方法。
图5示出了可以应用本申请实施例的车辆工单的校验方法或车辆工单的校验装置的示例性系统架构500。
如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的车辆工单的校验请求等数据进行分析等处理,并将处理结果(例如车辆工单的校验结果--仅为示例)反馈给终端设备。
需要说明的是,本申请实施例所提供的车辆工单的校验方法一般由服务器505执行,相应地,车辆工单的校验装置一般设置于服务器505中。
应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图6,其示出了适于用来实现本申请实施例的终端设备的计算机系统600的结构示意图。图6示出的终端设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有计算机系统600操作所需的各种程序和数据。CPU601、ROM602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶征信授权查询处理器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本申请公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括结果获取模块、别名转化模块、数据校验模块和复审校验模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,结果获取模块还可以被描述为“用于获取待校验车辆工单所对应的工单图片检测结果和工单文本提取结果的模块”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取待校验车辆工单所对应的工单图片检测结果和工单文本提取结果;基于预先配置的别名库对工单文本提取结果进行别名转化处理,得到转化处理后的工单文本提取结果;基于工单图片检测结果和转化处理后的工单文本提取结果进行数据一致性校验,得到图文数据校验结果;从图文数据校验结果中提取出图片特征和文本特征,基于图片特征和文本特征确定待校验车辆工单的复审校验结果。
本发明实施例提供的计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现本发明实施例中的车辆工单的校验方法。
根据本发明实施例的技术方案,具有如下优点或有益效果:通过获取待校验车辆工单所对应的工单图片检测结果和工单文本提取结果;基于预先配置的别名库对工单文本提取结果进行别名转化处理,得到转化处理后的工单文本提取结果;基于工单图片检测结果和转化处理后的工单文本提取结果进行数据一致性校验,得到图文数据校验结果;从图文数据校验结果中提取出图片特征和文本特征,基于图片特征和文本特征确定待校验车辆工单的复审校验结果;由此能够自动进行工单校验,并且降低了校验成本,提高了校验效率和校验结果的准确性。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
需要说明的是,本公开的技术方案中,所涉及的用户个人信息的获取、存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。

Claims (10)

1.一种车辆工单的校验方法,其特征在于,包括:
获取待校验车辆工单所对应的工单图片检测结果和工单文本提取结果;
基于预先配置的别名库对所述工单文本提取结果进行别名转化处理,得到转化处理后的工单文本提取结果;
基于所述工单图片检测结果和所述转化处理后的工单文本提取结果进行数据一致性校验,得到图文数据校验结果;
从所述图文数据校验结果中提取出图片特征和文本特征,基于所述图片特征和文本特征确定所述待校验车辆工单的复审校验结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据预先配置的适配关系校验所述待校验车辆工单中车辆与商品的适配性,得到所述待校验车辆工单的适配关系校验结果。
3.根据权利要求1所述的方法,其特征在于,基于所述图片特征和文本特征确定所述待校验车辆工单的复审校验结果,包括:
将所述图片特征和文本特征进行加权融合,得到图文融合向量;
基于所述图文融合向量和获取到的历史图文融合向量,重新校验所述待校验车辆工单所对应的工单图片数据和工单文本数据,得到所述待校验车辆工单的复审校验结果。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于获取的历史车辆工单数据确定价格校验策略;根据所述价格校验策略校验所述待校验车辆工单中的金额数据,得到待校验车辆工单的价格风险校验结果;其中,所述历史车辆工单数据是待校验车辆工单的相同类目工单或相近类目工单的历史数据;
或者,基于获取的历史车辆工单数据确定地址校验策略;根据地址校验策略校验所述待校验车辆工单中的地域数据,得到待校验车辆工单的地址风险校验结果。
5.根据权利要求1所述的方法,其特征在于,获取待校验车辆工单所对应的工单图片检测结果之前,还包括:
利用工单图片检测模型对获取到的待校验车辆工单所对应的工单图片数据进行检测处理,以得到待校验车辆工单所对应的工单图片检测结果;其中,所述工单图片检测结果包括以下至少之一:车身图片检测结果、车型图片检测结果和车牌图片检测结果;
所述方法还包括:
根据所述工单图片检测结果对所述工单图片检测模型进行迭代优化。
6.根据权利要求1所述的方法,其特征在于,获取待校验车辆工单所对应的工单文本提取结果之前,还包括:
利用工单实体提取模型对获取到的待校验车辆工单所对应的工单文本数据进行实体提取处理,以得到待校验车辆工单所对应的工单文本提取结果;其中,所述工单文本提取结果包括以下至少之一:车型实体提取结果和车牌实体提取结果;
所述方法还包括:
根据所述工单文本提取结果对所述工单实体提取模型进行迭代优化。
7.一种车辆工单的校验装置,其特征在于,包括:
结果获取模块,用于获取待校验车辆工单所对应的工单图片检测结果和工单文本提取结果;
别名转化模块,用于基于预先配置的别名库对所述工单文本提取结果进行别名转化处理,得到转化处理后的工单文本提取结果;
数据校验模块,用于基于所述工单图片检测结果和所述转化处理后的工单文本提取结果进行数据一致性校验,得到图文数据校验结果;
复审校验模块,用于从所述图文数据校验结果中提取出图片特征和文本特征,基于所述图片特征和文本特征确定所述待校验车辆工单的复审校验结果。
8.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任一所述的方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一所述的方法。
CN202411676263.4A 2024-11-21 2024-11-21 一种车辆工单的校验方法和装置 Pending CN119540983A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202411676263.4A CN119540983A (zh) 2024-11-21 2024-11-21 一种车辆工单的校验方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202411676263.4A CN119540983A (zh) 2024-11-21 2024-11-21 一种车辆工单的校验方法和装置

Publications (1)

Publication Number Publication Date
CN119540983A true CN119540983A (zh) 2025-02-28

Family

ID=94698346

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202411676263.4A Pending CN119540983A (zh) 2024-11-21 2024-11-21 一种车辆工单的校验方法和装置

Country Status (1)

Country Link
CN (1) CN119540983A (zh)

Similar Documents

Publication Publication Date Title
US10783367B2 (en) System and method for data extraction and searching
US10896392B2 (en) Methods and systems for generating supply chain representations
US10255550B1 (en) Machine learning using multiple input data types
WO2020001106A1 (zh) 分类模型的训练方法、店铺分类的方法及装置
CN112182246B (zh) 通过大数据分析建立企业画像的方法、系统、介质及应用
CN109598517B (zh) 商品通关处理、对象的处理及其类别预测方法和装置
CN109118316B (zh) 线上店铺真实性的识别方法和装置
US20150186739A1 (en) Method and system of identifying an entity from a digital image of a physical text
CN109740642A (zh) 发票类别识别方法、装置、电子设备及可读存储介质
EP4049241A1 (en) Docket analysis methods and systems
US9256805B2 (en) Method and system of identifying an entity from a digital image of a physical text
CN114240553A (zh) 车辆保险产品的推荐方法、装置、设备及存储介质
CN112308251A (zh) 一种基于机器学习的工单分派方法和系统
CN117112782A (zh) 一种招标公告信息提取方法
CN113901817A (zh) 文档分类方法、装置、计算机设备和存储介质
CN117131426B (zh) 基于预训练的品牌识别方法、装置及电子设备
CN117235608B (zh) 风险检测方法、装置、电子设备及存储介质
CN118781621A (zh) 基于大语言模型的发票信息提取与开票类别判断方法
CN117808512A (zh) 基于智慧电商平台的产品管理方法及系统
CN117195319A (zh) 保函文件电子件的验真方法、装置、电子设备和介质
CN119540983A (zh) 一种车辆工单的校验方法和装置
CN112016268B (zh) 线上文档处理方法、装置、计算机设备和可读存储介质
CN116756281A (zh) 知识问答方法、装置、设备和介质
CN116228265A (zh) 发票风险识别方法、装置和设备
CN115187387B (zh) 一种风险商家的识别方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination