[go: up one dir, main page]

CN113627168B - 一种元器件封装冲突的检查方法、装置、介质及设备 - Google Patents

一种元器件封装冲突的检查方法、装置、介质及设备 Download PDF

Info

Publication number
CN113627168B
CN113627168B CN202110945684.2A CN202110945684A CN113627168B CN 113627168 B CN113627168 B CN 113627168B CN 202110945684 A CN202110945684 A CN 202110945684A CN 113627168 B CN113627168 B CN 113627168B
Authority
CN
China
Prior art keywords
data
keywords
packaging
specifications
package
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110945684.2A
Other languages
English (en)
Other versions
CN113627168A (zh
Inventor
谢国清
林颖朝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yuncai Network Technology Co ltd
Original Assignee
Shenzhen Yuncai Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yuncai Network Technology Co ltd filed Critical Shenzhen Yuncai Network Technology Co ltd
Priority to CN202110945684.2A priority Critical patent/CN113627168B/zh
Publication of CN113627168A publication Critical patent/CN113627168A/zh
Application granted granted Critical
Publication of CN113627168B publication Critical patent/CN113627168B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了基于一种元器件封装冲突的检查方法、装置、介质及设备,包括对物料清单进行文本处理,获得多个关键词;识别所述多个关键词的封装规格;当所述多个关键词中存在至少两个封装规格时,检测所述至少两个封装规格的相关状态;以及当所述至少两个封装规格的相关状态为冲突状态时,确定所述物料清单存在异常。本申请可以解决在读取物料清单时无法检测物料清单中是否存在数据异常的问题。

Description

一种元器件封装冲突的检查方法、装置、介质及设备
技术领域
本申请涉及数据处理技术领域,具体涉及一种元器件封装冲突的检查方法、装置、介质及设备。
背景技术
现有的采购系统通常从用户提供的物料清单中获取采购需求信息。但用户提供的物料清单中可能存在参数搭配错误等问题,采购系统在读取物料清单时无法检测物料清单中是否存在数据异常,因此,如果物料清单中出现数据异常,将会影响最终采购系统生成的数据。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种元器件封装冲突的检查方法、装置、介质及设备,可以解决在读取物料清单时无法检测物料清单中是否存在数据异常的问题。
根据本申请的一个方面,提供了一种元器件封装冲突的检查方法,包括:对物料清单进行文本处理,获得多个关键词;识别所述多个关键词的封装规格;当所述多个关键词中存在至少两个封装规格时,检测所述至少两个封装规格的相关状态;以及当所述至少两个封装规格的相关状态为冲突状态时,确定所述物料清单存在异常。
在一实施例中,所述当所述多个关键词中存在至少两个封装规格时,检测所述至少两个封装规格的相关状态包括:将所述至少两个封装规格进行两两对比,获得对比结果;根据所述对比结果,确定所述至少两个封装规格的相关状态。
在一实施例中,所述将所述至少两个封装规格进行两两对比,获得对比结果包括:单次将所述至少两个封装规格代入函数中,获得两个函数值;其中,所述函数包括散列函数;对比所述两个函数值和数据封装字典,获得所述两个函数值对应的两个预设封装规格;当所述两个预设封装规格相等时,确定所述两个函数值对应的两个封装规格具有相同含义。
在一实施例中,所述根据所述对比结果,确定所述至少两个封装规格的相关状态包括:当所述对比结果为所述两个函数值对应的两个封装规格具有不同含义时,确定所述两个函数值对应的两个封装规格的相关状态为冲突状态。
在一实施例中,所述识别所述多个关键词的封装规格包括:对比所述多个关键词和所述数据封装字典,确定所述多个关键词的封装规格。
在一实施例中,所述对比所述多个关键词和数据封装字典,确定所述多个关键词的封装规格包括:当所述关键词与所述数据封装字典里的数据相同时,确定所述关键词的封装规格。
在一实施例中,所述对物料清单进行文本处理,获得多个关键词包括:获取物料清单文件;对所述物料清单进行解析,获取所述物料清单的目标BOM数据;根据所述目标BOM数据,获取所述目标BOM数据中的列头数据以及每种单品的元件数据;其中,所述物料清单中包含多个单品的物料信息;根据所述列头数据,对所述元件数据进行清洗以及转换,生成解析电子元件数据;以及根据所述列头数据以及所述解析元件数据,封装成BOM解析数据;根据所述BOM解析数据,获得多个关键词。
在一实施例中,所述对物料清单进行文本处理,获得多个关键词包括:从所述物料清单中提取物料文本;对所述物料文本进行文本预处理,获得预处理后的物料文本;以及对所述预处理后的物料文本进行词汇分词,获得所述多个关键词。
在一实施例中,所述对所述物料文本进行文本预处理,获得预处理后的物料文本包括:对所述物料文本进行编码转换,获得编码物料文本;将所述编码物料文本中的全角字符转换为半角字符,获得转符物料文本;以及删除所述转符物料文本中的干扰字符,获得预处理后的物料文本;其中,所述干扰字符包括表情符号、制表符或不可见字符。
在一实施例中,所述对所述预处理后的物料文本进行词汇分词,获得所述多个关键词包括:根据所述分词词典,将所述预处理后的物料文本拆分为所述多个关键词;其中,所述分词词典包括预设分词词典。
在一实施例中,所述根据所述分词词典,将所述预处理后的物料文本拆分为所述多个关键词包括:根据所述分词词典,将所述预处理后的物料文本拆分为所述多个关键词;其中,所述预处理后的物料文本包括多个非结构化数据,所述多个关键词包括多个结构化数据。
根据本申请的另一个方面,提供了一种元器件封装冲突的检查装置,包括:处理模块,用于对物料清单进行文本处理,获得多个关键词;识别模块,用于识别所述多个关键词的封装规格;检测模块,当所述多个关键词中存在至少两个封装规格时,检测所述至少两个封装规格的相关状态;以及确定模块,用于当所述至少两个封装规格的相关状态为冲突状态时,确定所述物料清单存在异常。
根据本申请的另一个方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述任一实施例所述的一种元器件封装冲突的检查方法。
根据本申请的另一个方面,提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于执行上述任一实施例所述的一种元器件封装冲突的检查方法。
本申请提供的一种元器件封装冲突的检查方法、装置、介质及设备,首先对物料清单进行文本处理,排除会对后续分析产生干扰的字符。再从处理后的文本中提取多个关键词,因为文本的属性决定其无法直接代入函数进行处理,因此需要将文本进行再次处理,获得多个关键词。然后识别多个关键词的封装规格,对数据进行封装可以防止不同模块之间数据的非法访问。当多个关键词中存在至少两个封装规格时,还需要对至少两个封装规格的相关状态进行同义检查,因为两个不同的封装规格表达的意思可能相同。最后根据一个或多个相关状态,判断物料清单是否存在异常,如果相关状态为冲突状态,则可以反映物料清单中存在异常,因此基于封装冲突可以对物料清单进行检查。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本申请一示例性实施例提供的元器件封装冲突的检查方法的流程示意图。
图2是本申请另一示例性实施例提供的元器件封装冲突的检查方法的流程示意图。
图3是本申请另一示例性实施例提供的元器件封装冲突的检查方法的流程示意图。
图4是本申请另一示例性实施例提供的元器件封装冲突的检查方法的流程示意图。
图5是本申请另一示例性实施例提供的元器件封装冲突的检查方法的流程示意图。
图6是本申请另一示例性实施例提供的元器件封装冲突的检查方法的流程示意图。
图7是本申请另一示例性实施例提供的元器件封装冲突的检查方法的流程示意图。
图8是本申请一示例性实施例提供的元器件封装冲突的检查装置的结构示意图。
图9是本申请另一示例性实施例提供的元器件封装冲突的检查装置的结构示意图。
图10是本申请一示例性实施例提供的电子设备的结构图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
示例性方法
图1是本申请一示例性实施例提供的元器件封装冲突的检查方法的流程示意图,如图1所示,该元器件封装冲突的检查方法包括:
步骤100:对物料清单进行文本处理,获得多个关键词。
物料清单可以为经过解析识别后的BOM文件,从经过解析识别后的BOM文件中可以提取物料文本。直接从BOM文件中提取的文本可能会存在干扰字符或很多不可见字符,这些字符会对会后续分析产生干扰。并且直接从BOM文件中提取的文本都是非结构化数据,无法对这些非结构数据直接进行数学计算。因此,需要对物料清单先进行文本处理,并从中获取多个关键词,可以采用基于词典匹配的分词方式对文本进行词汇分词,从中获得关键词。物料清单可以为采购元器件的清单。
物料清单中包含多行数据,对物料清单进行文本处理时,可以一行一行进行文本处理,每一行划分出多个关键词,对每一行中的多个关键词进行冲突检查,处理完一行数据的冲突检查后,再进行下一行的文本处理和冲突检查。
步骤200:识别多个关键词的封装规格。
获取多个关键词后,可以形成关键词列表,根据关键词列表,查找关键词对应的封装规格。其中,多个关键词可以对应一个封装规格,也可以对应多个封装规格,多个关键词的封装规格可能相同,也可能各不相同。识别多个关键词的封装规格,可以从多个关键词中筛选出非封装的数据,并将非封装的数据过滤掉。其中,封装是指对电子元器件进行元件封装,封装就是元器件的外形和引脚的分布图,即电子元器件封装是指实际电子元器件焊接到电路板时所指示的外观和焊点的位置,包括了实际电子元器件的外型尺寸、所占空间位置、各管脚之间的间距等。
步骤300:当多个关键词中存在至少两个封装规格时,检测至少两个封装规格的相关状态。
当多个关键词中只存在一个封装规格时,一个封装规格不会产生封装冲突。当多个关键词中存在至少两个封装规格时,则需要对每两个封装规格进行同义检查,因为有的封装规格虽然原始数据不一样,但代表的可能是同一种意思。
步骤400:当至少两个封装规格的相关状态为冲突状态时,确定物料清单存在异常。
当存在两个封装规格的相关状态为冲突状态时,或两个以上封装规格的相关状态为冲突状态时,可以反映出物料清单中存在异常,例如存在参数搭配错误的异常。
本申请提供的元器件封装冲突的检查方法,首先对物料清单进行文本处理,排除会对后续分析产生干扰的字符。再从处理后的文本中提取多个关键词,因为文本的属性决定其无法直接代入函数进行处理,因此需要将文本进行再次处理,获得多个关键词。然后识别多个关键词的封装规格,对数据进行封装可以防止不同模块之间数据的非法访问。当多个关键词中存在至少两个封装规格时,还需要对至少两个封装规格的相关状态进行同义检查,因为两个不同的封装规格表达的意思可能相同。最后根据一个或多个相关状态,判断物料清单是否存在异常,如果相关状态为冲突状态,则可以反映物料清单中存在异常,因此基于封装冲突可以对物料清单进行检查。
上述步骤200的具体实施方式可以调整为:获取物料清单;对物料清单进行解析,获取物料清单的目标BOM数据;根据目标BOM数据,获取目标BOM数据中的列头数据以及每种单品的元件数据;其中,物料清单中包含多个单品的物料信息;根据列头数据,对元件数据进行清洗以及转换,生成解析元件数据;以及根据列头数据以及解析元件数据,封装成BOM解析数据;根据BOM解析数据,获得多个关键词。
物料清单,即BOM(Bill of Material)文件,也就是以数据格式来描述产品结构的文件,是计算机可以识别的数据文件,也是电子制造供应链企业联系与沟通主要业务的纽带。物料清单为系统所识别到的客户上传的原始BOM文件,其数据内容、格式等不尽相同,系统只有在获取得到物料清单后,才能进行后续的解析识别过程,便于将各种各样的物料清单进行格式的统一以及错漏的纠正。
目标BOM数据指的是物料清单中用于表示单品的数据,目标BOM数据为进行了格式的统一以及错误的纠正后得到的BOM数据。在BOM数据进行了格式统一以及错误纠正后,系统得以更加准确地识别出单品的物料信息,进而对所需单品进行更加准确的报价,降低出现错误报价的概率。列头数据指的是每列BOM数据的开头数据,单品可以为电子元器件。获取到BOM解析数据后,可以根据BOM解析数据进行关键词提取,为后续检查封装冲突提供识别基础。
由于不同公司的物料清单格式不一,人工输入又难以避免会出现错漏,因此,预先清洗数据并进行格式的统一转化,便于系统更加准确地识别物料信息,进而准确报价。而整个解析识别过程由系统进行,无需人力,节省人力成本的同时,再次避免了因工作人员疲劳或经验不足等原因出现的二次错误情况,且识别效率更高。
图2是本申请另一示例性实施例提供的元器件封装冲突的检查方法的流程示意图,如图2所示,上述步骤300可以包括:
步骤310:将至少两个封装规格进行两两对比,获得对比结果。
将多个封装规格进行两两相互对比,比对完一对封装规格后进行下一对封装规格的比对。可以通过哈希表实现两个封装规格的对比。哈希表是根据设定的哈希函数和处理冲突的方法,将一组关键词映像到一个有限的连续的地址集(区间)上,并以关键词在地址集中的像作为记录在表中的存储位置。哈希算法的时间复杂度为O(1),O(1)无论链表大或者小,所耗费的计算时间都是一样的,因此可以确保进行对比的效率。
步骤320:根据对比结果,确定至少两个封装规格的相关状态。
根据至少两个封装规格中任意两个封装规格的对比结果,可以确定任意两个封装规格的相关状态。两个封装规格的相关状态可以为不冲突,也可以为冲突状态。
图3是本申请另一示例性实施例提供的元器件封装冲突的检查方法的流程示意图,如图3所示,上述步骤310可以包括:
步骤311:单次将至少两个封装规格代入函数中,获得两个函数值;其中,函数包括散列函数。
散列函数就是哈希函数,将封装规格输入哈希函数中,可以得到与关键词对应的哈希值。例如,有关键词k1和关键词k2,将关键词k1和关键词k2代入散列函数后,得到哈希值f(k1)和f(k2)。
步骤312:对比两个函数值和数据封装字典,获得两个函数值对应的两个预设封装规格;
在数据封装字典中查询两个哈希值对应的预设封装规格。数据封装字典中提前预设了预设封装规格以及预设封装规格对应的哈希值。
步骤313:当两个预设封装规格相等时,确定两个函数值对应的两个封装规格具有相同含义。
当在数据封装字典中查询到不同的两个哈希值对应相同的预设封装规格时,关键词k1和关键词k2为同义词。例如,将关键词k1和关键词k2代入哈希函数后,得到哈希值f(k1)和f(k2),在数据封装字典中查询f(k1)和f(k2)对应的预设封装规格,如果两个预设封装规格相同,关键词k1和关键词k2对该哈希函数来说称作同义词。
关键词k1、k2分别对应封装规格0603和1608,在数据封装字典中预设0603对应的哈希值为7c4a8d09ca3762af61e59520943dc26494f8941b和b08fff87998d20605f134b632cb8fa3398008116。将0603和1608分别代入哈希函数中进行计算,得到0603的哈希值为7c4a8d09ca3762af61e59520943dc26494f8941b,1608的哈希值为b08fff87998d20605f134b632cb8fa3398008116,在数据封装字典中查询0603和1608的哈希值对应的预设封装规格,根据数据封装字典预设的哈希值来看,0603的哈希值和1608的哈希值对应的预设封装规格都为0603,因此,0603和1608虽然表现形式不同,但都代表同一种含义,关键词k1和关键词k2为同义词。
在一实施例中,如图3所示,上述步骤320可以包括:
步骤321:当对比结果为两个函数值对应的两个封装规格具有不同含义时,确定两个函数值对应的两个封装规格的相关状态为冲突状态。
当两个封装规格具有不同含义时,可以确定两个函数值对应的两个封装规格的相关状态为冲突状态。同一元器件不能对应两个封装尺寸,因此,当出现两个具有不同含义的封装规格时,可以判断出现冲突。例如,将k1和k2代入哈希函数后,得到哈希值f(k1)和f(k2),在数据封装字典中查询f(k1)和f(k2)对应的预设封装规格,如果f(k1)和f(k2)分别对应的两个预设封装规格不相同,关键词k1和关键词k2则具有不同的含义,两个封装规格为冲突状态,冲突状态也表示物料清单存在异常。
图4是本申请另一示例性实施例提供的元器件封装冲突的检查方法的流程示意图,如图4所示,上述步骤200可以包括:
步骤210:对比多个关键词和数据封装字典,确定多个关键词的封装规格。
对比多个关键词可以采用key-value数据库进行对比,其中,key代表关键词,value代表值,key和value可以用作键值对,每一个key可以对应一个value,也可以支撑一个key对应多个value。数据封装字典就是key-value键值对的数据的集合,数据封装字典具有可变的、无序的、key不重复的特点。数据封装字典可以直接调用现有的字典。
在一实施例中,上述步骤210的具体实施方式还可以调整为:当关键词与数据封装字典里的数据相同时,确定关键词的封装规格。
通过输入关键词,然后获得根据关键词返回的对应的值,可以判断关键词与数据封装字典里的数据是否对应。如果输入关键词,但数据封装字典里没有对应的数据,检测到关键词不存在,将返回异常提示。当关键词存在于数据封装字典里时,可以判断关键词的封装规格,关键词的封装规格可以是一个也可以是多个。
图5是本申请另一示例性实施例提供的元器件封装冲突的检查方法的流程示意图,如图5所示,上述步骤100可以包括:
步骤110:从物料清单中提取物料文本。
从经过识别和清洗的BOM文件(物料清单)中提取物料文本,物料文本中可以包括物料的名称、型号、规格、数量等信息。
步骤120:对物料文本进行文本预处理,获得预处理后的物料文本。
对物料文本进行文本清洗,将其中会对分析结果造成干扰的字符删掉,获得去掉干扰字符或不可见字符的预处理后的物料文本,以减少文本的干扰项。
步骤130:对预处理后的物料文本进行词汇分词,获得多个关键词。
物料文本经过文本预处理,能够获得干净的物料文本,而干净的物料文本中起到关键作用的是一些关键词,甚至关键词就能决定文本取向,因此,提取文本中的多个关键词可以概括整个文本。而且文本都是一些非结构化的数据,无法直接代入函数中进行计算,因此需要将物料文本转化为关键词,关键词是结构化数据,方便对其进行数学计算。
图6是本申请另一示例性实施例提供的元器件封装冲突的检查方法的流程示意图,如图6所示,上述步骤120可以包括:
步骤121:对物料文本进行编码转换,获得编码物料文本。
例如,将gb2312转化为UTF8。对物料文件进行编码转换,便于使用不同编码方案的两个系统沟通,减少分析过程中可能产生干扰的可能性。
步骤122:将所编码物料文本中的全角字符转换为半角字符,获得转符物料文本。
全角字符中一个字符占用两个标准字符位置,半角字符中一个字符占用一个标准的字符位置,通常在系统内部,英文字母、数字键和符号键的半角形态是作为基本代码处理的。因此,将全角字符转换为半角字符方便系统的识别和处理。
步骤123:删除转符物料文本中的干扰字符,获得预处理后的物料文本。
其中,干扰字符包括表情符号、制表符或不可见字符。
对物料文本进行字符转换后,还是可能存在一些无用的符号,不仅不能反映出文本的意思,还会对物料文本造成干扰。因此,删除转符物料文本中的干扰字符,进一步清洗物料文本,最终获得经过预处理后的物料文本。
图7是本申请另一示例性实施例提供的元器件封装冲突的检查方法的流程示意图,如图7所示,上述步骤130可以包括:
步骤131:根据分词词典,将预处理后的物料文本拆分为多个关键词。
其中,分词词典包括预设分词词典。
采用基于词典匹配的分词方式,对物料文本进行分词。基于词典匹配的分词方式的效果与分词词典的丰富程度成正比,因此,可以调用现有的分词词典,并人为的根据物料文本的内容和属性,在分词词典中加入大量相关行业的专业词汇,使物料文本拆分出的关键词更加全面和完整。
在一实施例中,上述步骤131的具体实施方式还可以调整为:根据分词词典,将预处理后的物料文本拆分为多个关键词;其中,预处理后的物料文本包括多个非结构化数据,多个关键词包括多个结构化数据。
文本都是一些非结构化的数据,无法直接代入函数中进行计算,因此需要将物料文本转化为关键词,关键词是结构化数据,方便对其进行数学计算。例如,将结构化数据的关键词代入哈希函数中,可以得到关键词对应的散列地址(哈希值)。
物料清单中包含多行数据,在对物料清单进行文本处理时,可以对每一行数据单独进行处理。每一行数据包含多个文本,从物料清单中第一行数据开始,首先对第一行数据进行文本处理,划分出关键词,识别第一行中多个关键词的封装规格,如果第一行中多个关键词存在至少两个封装规格,则检测至少两个封装规格的相关状态,确定两个封装规格是否存在冲突,从而确定第一行数据是否存在异常,检查完第一行数据后再继续对下一行数据进行关键词划分和冲突检查,确定下一行的数据是否存在异常。
示例性装置
图8是本申请一示例性实施例提供的元器件封装冲突的检查装置的结构示意图,如图8所示,该元器件封装冲突的检查装置8包括:处理模块81,用于对物料清单进行文本处理,获得多个关键词;识别模块82,用于识别多个关键词的封装规格;检测模块83,当多个关键词中存在至少两个封装规格时,检测至少两个封装规格的相关状态;以及确定模块84,用于当至少两个封装规格的相关状态为冲突状态时,确定物料清单存在异常。
本申请提供的元器件封装冲突的检查装置8,首先通过处理模块81对物料清单进行文本处理,排除会对后续分析产生干扰的字符。再从处理后的文本中提取多个关键词,因为文本的属性决定其无法直接代入函数进行处理,因此需要将文本进行再次处理,获得多个关键词。然后通过识别模块82识别多个关键词的封装规格,对数据进行封装可以防止不同模块之间数据的非法访问。当多个关键词中存在至少两个封装规格时,还需要通过检测模块83对至少两个封装规格的相关状态进行同义检查,因为两个不同的封装规格表达的意思可能相同。最后根据一个或多个相关状态,判断物料清单是否存在异常,如果相关状态为冲突状态,通过确定模块84可以确定物料清单中存在异常,因此基于封装冲突可以对物料清单进行检查。
图9是本申请另一示例性实施例提供的元器件封装冲突的检查装置的结构示意图,如图9所示,上述检测模块83可以包括:对比单元831,用于将至少两个封装规格进行两两对比,获得对比结果;确定状态单元832,用于根据对比结果,确定至少两个封装规格的相关状态。
在一实施例中,如图9所示,上述对比单元831可以包括:计算子单元8311,用于单次将至少两个封装规格代入函数中,获得两个函数值;其中,函数包括散列函数;对比子单元8312,对比子单元用于对比两个函数值和数据封装字典,获得两个函数值对应的预设封装规格;确定含义子单元8313,用于当两个预设封装规格相等时,确定两个函数值对应的两个封装规格具有相同含义。
在一实施例中,如图9所示,上述确定状态单元832可以包括:确定冲突子单元8321,用于当对比结果为两个函数值对应的两个封装规格具有不同含义时,确定两个函数值对应的两个封装规格的相关状态为冲突状态。
在一实施例中,如图9所示,上述识别模块82可以包括:确定封装单元821,用于对比多个关键词和数据封装字典,确定多个关键词的封装规格。
上述确定封装单元821可以进一步配置为:当关键词与数据封装字典里的数据相同时,确定关键词的封装规格。
在一实施例中,如图9所示,上述处理模块81可以包括:提取单元811,用于从物料清单中提取物料文本;预处理单元812,用于对物料文本进行文本预处理,获得预处理后的物料文本;分词单元813,用于对预处理后的物料文本进行词汇分词,获得多个关键词。
在一实施例中,如图9所示,上述预处理单元812可以包括:编码子单元8121,用于对物料文本进行编码转换,获得编码物料文本;转符子单元8122,用于将所编码物料文本中的全角字符转换为半角字符,获得转符物料文本;删符子单元8123,用于删除转符物料文本中的干扰字符,获得预处理后的物料文本。
在一实施例中,如图9所示,上述分词单元813可以包括:分词子单元8131,用于根据分词词典,将预处理后的物料文本拆分为多个关键词。
在一实施例中,分词子单元8131还可以配置为:根据分词词典,将预处理后的物料文本拆分为多个关键词;其中,预处理后的物料文本包括多个非结构化数据,多个关键词包括多个结构化数据。
示例性电子设备
下面,参考图10来描述根据本申请实施例的电子设备。该电子设备可以是第一设备和第二设备中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一设备和第二设备进行通信,以从它们接收所采集到的输入信号。
图10图示了根据本申请实施例的电子设备的框图。
如图10所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的元器件封装冲突的检查方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
在该电子设备是单机设备时,该输入装置13可以是通信网络连接器,用于从第一设备和第二设备接收所采集的输入信号。
此外,该输入装置13还可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图10中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种元器件封装冲突的检查方法,其特征在于,包括:
对物料清单进行文本处理,获得多个关键词;其中,所述对物料清单进行文本处理,获得多个关键词包括:获取物料清单文件;对所述物料清单进行解析,获取所述物料清单的目标BOM数据;根据所述目标BOM数据,获取所述目标BOM数据中的列头数据以及每种单品的元件数据;其中,所述物料清单中包含多个单品的物料信息;根据所述列头数据,对所述元件数据进行清洗以及转换,生成解析电子元件数据;根据所述列头数据以及所述解析电子元件数据,封装成BOM解析数据;根据所述BOM解析数据,获得多个关键词;所述关键词是结构化数据;以及
识别所述多个关键词的封装规格;以及
当所述多个关键词中存在至少两个封装规格时,检测所述至少两个封装规格的相关状态;
其中,所述当所述多个关键词中存在至少两个封装规格时,检测所述至少两个封装规格的相关状态包括:
将所述至少两个封装规格进行两两对比,获得对比结果;
其中,所述将所述至少两个封装规格进行两两对比,获得对比结果包括:单次将所述至少两个封装规格代入函数中,获得两个函数值;其中,所述函数包括散列函数,所述散列函数就是哈希函数,将封装规格输入所述哈希函数中,可以得到与关键词对应的哈希值;对比所述两个函数值和数据封装字典,获得所述两个函数值对应的两个预设封装规格;所述数据封装字典中提前预设了预设封装规格以及预设封装规格对应的哈希值;当所述两个预设封装规格相等时,确定所述两个函数值对应的两个封装规格具有相同含义;
根据所述对比结果,确定所述至少两个封装规格的相关状态;
其中,所述根据所述对比结果,确定所述至少两个封装规格的相关状态包括:当所述对比结果为所述两个函数值对应的两个封装规格具有不同含义时,确定所述两个函数值对应的两个封装规格的相关状态为冲突状态;以及
当所述至少两个封装规格的相关状态为冲突状态时,确定所述物料清单存在异常。
2.根据权利要求1所述的方法,其特征在于,所述识别所述多个关键词的封装规格包括:
对比所述多个关键词和所述数据封装字典,确定所述多个关键词的封装规格。
3.根据权利要求2所述的方法,其特征在于,所述对比所述多个关键词和数据封装字典,确定所述多个关键词的封装规格包括:
当所述关键词与所述数据封装字典里的数据相同时,确定所述关键词的封装规格。
4.根据权利要求1所述的方法,其特征在于,所述对物料清单进行文本处理,获得多个关键词包括:
从所述物料清单中提取物料文本;
对所述物料文本进行文本预处理,获得预处理后的物料文本;以及
对所述预处理后的物料文本进行词汇分词,获得所述多个关键词。
5.根据权利要求4所述的方法,其特征在于,所述对所述物料文本进行文本预处理,获得预处理后的物料文本包括:
对所述物料文本进行编码转换,获得编码物料文本;
将所述编码物料文本中的全角字符转换为半角字符,获得转符物料文本;以及
删除所述转符物料文本中的干扰字符,获得预处理后的物料文本;其中,所述干扰字符包括表情符号、制表符或不可见字符。
6.根据权利要求4所述的方法,其特征在于,所述对所述预处理后的物料文本进行词汇分词,获得所述多个关键词包括:
根据分词词典,将所述预处理后的物料文本拆分为所述多个关键词;其中,所述分词词典包括预设分词词典。
7.根据权利要求6所述的方法,其特征在于,所述根据分词词典,将所述预处理后的物料文本拆分为所述多个关键词包括:
根据所述分词词典,将所述预处理后的物料文本拆分为所述多个关键词;其中,
所述预处理后的物料文本包括多个非结构化数据,所述多个关键词包括多个结构化数据。
8.一种元器件封装冲突的检查装置,其特征在于,包括:
处理模块,用于对物料清单进行文本处理,获得多个关键词;
处理模块包括用于获取物料清单文件;对所述物料清单进行解析,获取所述物料清单的目标BOM数据;根据所述目标BOM数据,获取所述目标BOM数据中的列头数据以及每种单品的元件数据;其中,所述物料清单中包含多个单品的物料信息;根据所述列头数据,对所述元件数据进行清洗以及转换,生成解析电子元件数据;根据所述列头数据以及所述解析电子元件数据,封装成BOM解析数据;根据所述BOM解析数据,获得多个关键词;所述关键词是结构化数据;
识别模块,用于识别所述多个关键词的封装规格;
检测模块,当所述多个关键词中存在至少两个封装规格时,检测所述至少两个封装规格的相关状态;
检测模块包括:对比单元,用于将至少两个封装规格进行两两对比,获得对比结果;对比单元包括:计算子单元,用于单次将至少两个封装规格代入函数中,获得两个函数值;其中,函数包括散列函数,所述散列函数就是哈希函数,将封装规格输入所述哈希函数中,可以得到与关键词对应的哈希值;对比子单元,对比子单元用于对比两个函数值和数据封装字典,获得两个函数值对应的预设封装规格;所述数据封装字典中提前预设了预设封装规格以及预设封装规格对应的哈希值;确定含义子单元,用于当两个预设封装规格相等时,确定两个函数值对应的两个封装规格具有相同含义;确定状态单元,用于根据对比结果,确定至少两个封装规格的相关状态;确定状态单元包括:确定冲突子单元,用于当对比结果为两个函数值对应的两个封装规格具有不同含义时,确定两个函数值对应的两个封装规格的相关状态为冲突状态;
以及
确定模块,用于当所述至少两个封装规格的相关状态为冲突状态时,确定所述物料清单存在异常。
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-7任一所述的一种元器件封装冲突的检查方法。
10.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于执行上述权利要求1-7任一所述的一种元器件封装冲突的检查方法。
CN202110945684.2A 2021-08-16 2021-08-16 一种元器件封装冲突的检查方法、装置、介质及设备 Active CN113627168B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110945684.2A CN113627168B (zh) 2021-08-16 2021-08-16 一种元器件封装冲突的检查方法、装置、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110945684.2A CN113627168B (zh) 2021-08-16 2021-08-16 一种元器件封装冲突的检查方法、装置、介质及设备

Publications (2)

Publication Number Publication Date
CN113627168A CN113627168A (zh) 2021-11-09
CN113627168B true CN113627168B (zh) 2023-06-30

Family

ID=78386211

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110945684.2A Active CN113627168B (zh) 2021-08-16 2021-08-16 一种元器件封装冲突的检查方法、装置、介质及设备

Country Status (1)

Country Link
CN (1) CN113627168B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113988068B (zh) * 2021-12-29 2022-04-15 深圳前海硬之城信息技术有限公司 Bom文本的分词方法、装置、设备及存储介质
CN114386368B (zh) * 2022-03-23 2022-07-19 百芯智能制造科技(深圳)有限公司 一种封装规格项数据的处理方法以及处理装置
CN116452124B (zh) * 2023-06-15 2023-08-18 商飞软件有限公司 一种适用民用航空器时控件实时状态清单构建系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1549670A (zh) * 2003-05-21 2004-11-24 华为技术有限公司 一种检查一致性的方法与装置
CN102447673A (zh) * 2010-09-30 2012-05-09 突触计算机系统(上海)有限公司 一种用于解封装携有封装格式的多媒体文件的方法与设备
CN107633353A (zh) * 2017-09-08 2018-01-26 南京国电南自电网自动化有限公司 基于excel表vba的物料bom表合规检查方法
CN110502674A (zh) * 2019-08-27 2019-11-26 云汉芯城(上海)互联网科技股份有限公司 一种基于bom选型的类别校验方法、装置
CN111543070A (zh) * 2018-02-09 2020-08-14 英特尔公司 受信任iot设备配置和装载
CN111858698A (zh) * 2020-06-02 2020-10-30 深圳市鼎盛光电有限公司 一种数据检查方法、数据检查装置及终端设备
CN112447693A (zh) * 2019-09-03 2021-03-05 联发科技股份有限公司 半导体装置
CN112667480A (zh) * 2020-12-30 2021-04-16 平安证券股份有限公司 业务数据的动态监控方法、装置、电子设备及存储介质
CN112801621A (zh) * 2021-01-30 2021-05-14 深圳捷创电子科技有限公司 一种bom物料清单整理核准方法、系统及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4385387B1 (ja) * 2009-07-02 2009-12-16 修平 西山 属性付きキー・バリュー・ストアによるデータベース・システム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1549670A (zh) * 2003-05-21 2004-11-24 华为技术有限公司 一种检查一致性的方法与装置
CN102447673A (zh) * 2010-09-30 2012-05-09 突触计算机系统(上海)有限公司 一种用于解封装携有封装格式的多媒体文件的方法与设备
CN107633353A (zh) * 2017-09-08 2018-01-26 南京国电南自电网自动化有限公司 基于excel表vba的物料bom表合规检查方法
CN111543070A (zh) * 2018-02-09 2020-08-14 英特尔公司 受信任iot设备配置和装载
CN110502674A (zh) * 2019-08-27 2019-11-26 云汉芯城(上海)互联网科技股份有限公司 一种基于bom选型的类别校验方法、装置
CN112447693A (zh) * 2019-09-03 2021-03-05 联发科技股份有限公司 半导体装置
CN111858698A (zh) * 2020-06-02 2020-10-30 深圳市鼎盛光电有限公司 一种数据检查方法、数据检查装置及终端设备
CN112667480A (zh) * 2020-12-30 2021-04-16 平安证券股份有限公司 业务数据的动态监控方法、装置、电子设备及存储介质
CN112801621A (zh) * 2021-01-30 2021-05-14 深圳捷创电子科技有限公司 一种bom物料清单整理核准方法、系统及计算机可读存储介质

Also Published As

Publication number Publication date
CN113627168A (zh) 2021-11-09

Similar Documents

Publication Publication Date Title
CN113627168B (zh) 一种元器件封装冲突的检查方法、装置、介质及设备
CN112015430B (zh) JavaScript代码翻译方法、装置、计算机设备及存储介质
US9690788B2 (en) File type recognition analysis method and system
EP3591539A1 (en) Parsing unstructured information for conversion into structured data
CN111881183B (zh) 企业名称匹配方法和装置、以及存储介质和电子设备
CN117707922B (zh) 测试用例的生成方法、装置、终端设备和可读存储介质
CN113986864B (zh) 日志数据处理方法、装置、电子设备及存储介质
CN113626561A (zh) 一种元器件的型号识别方法、装置、介质和设备
US8874426B2 (en) Method for translating computer generated log files
CN117827923A (zh) 一种查询需求的处理方法、装置、计算机设备及存储介质
CN114743012B (zh) 一种文本识别方法及装置
CN118781621B (zh) 基于大语言模型的发票信息提取与开票类别判断方法
CN113627892B (zh) 一种bom数据的识别方法及其电子设备
CN113627136A (zh) 一种元器件推荐方法、装置及系统
US20200279106A1 (en) Document extraction system and method
CN110083807B (zh) 合同的修改影响自动预测方法、装置、介质及电子设备
US11928421B2 (en) Technical document error detection
CN114154480B (zh) 信息提取方法、装置、设备和存储介质
CN116991744A (zh) 自动测试的方法、装置、电子设备及存储介质
CN111177387A (zh) 用户名单信息处理方法、电子装置及计算机可读存储介质
CN116340172A (zh) 基于测试场景的数据收集方法、装置及测试用例检测方法
CN115470034A (zh) 一种日志分析方法、设备及存储介质
CN115294593A (zh) 一种图像信息抽取方法、装置、计算机设备及存储介质
CN113127635A (zh) 数据处理方法、装置及系统,存储介质和电子设备
CN115841677B (zh) 文本版面分析方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant