CN114004456B - 数据标签的计算方法、装置、计算机设备和存储介质 - Google Patents
数据标签的计算方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN114004456B CN114004456B CN202111177512.1A CN202111177512A CN114004456B CN 114004456 B CN114004456 B CN 114004456B CN 202111177512 A CN202111177512 A CN 202111177512A CN 114004456 B CN114004456 B CN 114004456B
- Authority
- CN
- China
- Prior art keywords
- data source
- data
- tag
- target data
- enterprise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 50
- 238000000034 method Methods 0.000 claims abstract description 40
- 238000004590 computer program Methods 0.000 claims description 15
- 238000012795 verification Methods 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 9
- 238000011161 development Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OTZZZISTDGMMMX-UHFFFAOYSA-N 2-(3,5-dimethylpyrazol-1-yl)-n,n-bis[2-(3,5-dimethylpyrazol-1-yl)ethyl]ethanamine Chemical compound N1=C(C)C=C(C)N1CCN(CCN1C(=CC(C)=N1)C)CCN1C(C)=CC(C)=N1 OTZZZISTDGMMMX-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000009960 carding Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Security & Cryptography (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种数据标签的计算方法、装置、计算机设备和存储介质。方法包括:响应于数据标签计算请求,根据企业画像模型获取目标数据标签与数据源信息;基于目标数据标签与数据源信息确定数据源评分指标,数据源评分指标包括内容匹配度、数据源成本、数据源可靠性和数据源准确性;根据数据源评分指标在不同的数据源方案中选择目标数据源方案;各数据源方案是由不同数据源信息所组成的集合;对目标数据源方案中数据源信息对应的企业数据进行分析,得到目标数据标签结果;对目标数据标签结果进行结构化处理,得到处理后的目标数据标签结果;处理后的目标数据标签结果用于生成企业画像。采用本方法减少了数据标签的开发量。
Description
技术领域
本申请涉及企业画像技术领域,特别是涉及一种数据标签的计算方法、装置、计算机设备和存储介质。
背景技术
企业画像就是将描述企业状态及行为的信息标签化,基于与企业状态及行为信息相关的数据为企业“贴”标签,刻画出企业全貌,从而帮助资源提供方全面了解企业状况。企业画像通常是根据企业画像模型设计,由数据标签计算系统进行计算得到。对于资源提供方提供的资源产品,其对企业画像模型的数据维度和丰富度要求是不一样的,即对数据标签的要求不一样。传统基于企业画像的数据标签计算方法中,在互联网平台重新对接一个资源提供方的资源产品时,需要重新开发和计算数据标签,增加了数据标签的开发量。
发明内容
基于此,有必要针对上述技术问题,提供一种据标签的计算方法、装置、计算机设备和存储介质。
一种数据标签的计算方法,所述方法包括:
响应于数据标签计算请求,根据企业画像模型获取目标数据标签与数据源信息;
基于所述目标数据标签与所述数据源信息确定数据源评分指标,所述数据源评分指标包括内容匹配度、数据源成本、数据源可靠性和数据源准确性;
根据所述数据源评分指标在不同的数据源方案中选择目标数据源方案;各所述数据源方案是由不同所述数据源信息所组成的集合;
对所述目标数据源方案中所述数据源信息对应的企业数据进行分析,得到目标数据标签结果;
对所述目标数据标签结果进行结构化处理,得到处理后的所述目标数据标签结果;处理后的所述目标数据标签结果用于生成企业画像。
在其中的一个实施例中,所述数据标签计算请求是经过加密的请求;所述根据企业画像模型获取目标数据标签与数据源信息之前,所述方法还包括:
对数据标签计算请求中的签名进行验证,验证通过后,对所述数据标签计算请求进行解密;
判断解密后的所述数据标签计算请求中是否存在企业画像模型编码;
若存在所述企业画像模型编码,则判断是否具有访问所述企业画像模型的权限;
若具有访问所述企业画像模型的权限,则对解密后的数据标签计算请求中的业务参数进行合法性验证;
当合法性验证通过时,执行所述根据企业画像模型获取目标数据标签与数据源信息的步骤。
在其中的一个实施例中,所述根据企业画像模型获取目标数据标签与数据源信息包括:
基于企业画像模型获取企业画像编码;
根据所述企业画像编码查询目标数据标签和数据源编码;
根据所述数据源编码获取数据源信息;所述数据源信息是指数据源的基本信息。
在其中的一个实施例中,所述基于所述目标数据标签与所述数据源信息确定数据源评分指标,所述数据源评分指标包括内容匹配度、数据源成本、数据源可靠性和数据源准确性包括:
基于所述数据源信息获取数据源的所有数据标签;
对所有所述数据标签进行筛选,得到所述目标数据标签以及所述目标数据标签的标签数量;
基于所述标签数量确定内容匹配度;
基于数据服务方的API接口的调用成本确定数据源成本;
基于调用所述API接口的可靠比率确定数据源可靠性;
基于调用所述API接口的数据准确比率确定数据源准确性;
其中,所述内容匹配度、所述数据源成本、所述数据源可靠性和所述数据源准确性组成数据源评分指标。
在其中的一个实施例中,所述根据所述数据源评分指标在不同的数据源方案中选择目标数据源方案包括:
基于所述目标数据标签对所述数据源信息筛选,得到目标数据源信息;
对所得的各目标数据源信息进行组合,得到不同的数据源方案;
计算不同所述数据源方案对应的数据源评分指标值;所述数据源评分指标值包括内容匹配度值、数据源成本值、数据源可靠值和数据源准确值;
对不同所述数据源方案的各数据源评分指标值进行加权计算,得到不同所述数据源方案的评分;
选择最高所述评分对应的数据源方案为目标数据源方案。
在其中的一个实施例中,所述对所述目标数据源方案中所述数据源信息对应的企业数据进行分析,得到目标数据标签结果包括:
基于所述目标数据源方案中的数据源信息,获取企业数据;
计算所述企业数据对应的数据标签结果;
将所述数据标签结果进行筛选,得到目标数据标签结果。
在其中的一个实施例中,所述对所述目标数据标签结果进行结构化处理,得到处理后的目标数据标签结果包括:
响应于标签名称调整操作,对所述标签名称调整操作指定的且为所述目标数据标签结果中的标签的名称进行调整;
将所述目标数据标签结果进行归类和分级处理,得到处理后的目标数据标签结果。
一种数据标签的计算装置,所述装置包括:
获取模块,用于响应于数据标签计算请求,根据企业画像模型获取目标数据标签与数据源信息;
确定模块,用于基于所述目标数据标签与所述数据源信息确定数据源评分指标,所述数据源评分指标包括内容匹配度、数据源成本、数据源可靠性和数据源准确性;
决策模块,用于根据所述数据源评分指标在不同的数据源方案中选择目标数据源方案;各所述数据源方案是由不同所述数据源信息所组成的集合;
路由模块,用于对所述目标数据源方案中数据源信息对应的企业数据进行分析,得到目标数据标签结果;
组合模块,用于对所述目标数据标签结果进行结构化处理,得到处理后的所述目标数据标签结果;处理后的所述目标数据标签结果用于生成企业画像。
在其中的一个实施例中,所述数据标签计算请求是经过加密的请求;数据标签的计算装置还包括:
网关模块,用于对数据标签计算请求中的签名进行验证,验证通过后,对所述数据标签计算请求进行解密;判断解密后的所述数据标签计算请求中是否存在企业画像模型编码;若存在所述企业画像模型编码,则判断是否具有访问所述企业画像模型的权限;若具有访问所述企业画像模型的权限,则对解密后的数据标签计算请求中的业务参数进行合法性验证;当合法性验证通过时,执行所述根据企业画像模型获取目标数据标签与数据源信息的步骤。
在其中的一个实施例中,所述获取模块还用于基于企业画像模型获取企业画像编码;根据所述企业画像编码查询目标数据标签和数据源编码;根据所述数据源编码获取数据源信息;所述数据源信息是指数据源的基本信息。
在其中的一个实施例中,所述确定模块还用于基于所述数据源信息获取数据源的所有数据标签;对所有所述数据标签进行筛选,得到所述目标数据标签以及所述目标数据标签的标签数量;基于所述标签数量确定内容匹配度;基于数据服务方的API接口的调用成本确定数据源成本;基于调用所述API接口的可靠比率确定数据源可靠性;基于调用所述API接口的数据准确比率确定数据源准确性;其中,所述内容匹配度、所述数据源成本、所述数据源可靠性和所述数据源准确性组成数据源评分指标。
在其中的一个实施例中,所述决策模块还用于基于所述目标数据标签对所述数据源信息筛选,得到目标数据源信息;对所得的各目标数据源信息进行组合,得到不同的数据源方案;计算不同所述数据源方案对应的数据源评分指标值;所述数据源评分指标值包括内容匹配度值、数据源成本值、数据源可靠值和数据源准确值;对不同所述数据源方案的各数据源评分指标值进行加权计算,得到不同所述数据源方案的评分;选择最高所述评分对应的数据源方案为目标数据源方案。
在其中的一个实施例中,所述路由模块还用于基于所述目标数据源方案中的数据源信息,获取企业数据;计算所述企业数据对应的数据标签结果;将所述数据标签结果进行筛选,得到目标数据标签结果。
在其中的一个实施例中,所述组合模块还用于响应于标签名称调整操作,对所述标签名称调整操作指定的且为所述目标数据标签结果中的标签的名称进行调整;将所述目标数据标签结果进行归类和分级处理,得到处理后的目标数据标签结果。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述数据标签的计算方法的步骤。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述数据标签的计算方法的步骤。
上述数据标签的计算方法、装置、计算机设备和存储介质。根据画像模型获取目标数据标签信息与数据源信息,使得数据标签信息与数据源信息的获取更加的简便。基于所述目标数据标签与所述数据源信息确定数据源评分指标,根据所述数据源评分指标在不同的数据源方案中选择目标数据源方案;对所述目标数据源方案中所述数据源信息对应的企业数据进行分析,得到目标数据标签结果,对所述目标数据标签结果进行结构化处理,通过设计数据源选择和数据标签的计算策略,减少了数据标签的开发量。
附图说明
图1为一个实施例中数据标签的计算方法的应用环境图;
图2为一个实施例中数据标签的计算方法的流程示意图;
图3为一个请求加密加签的流程示意图;
图4为一个选择目标数据源方案的流程示意图;
图5为一个实施例中数据标签的计算装置的结构框图;
图6为又一个实施例中数据标签的计算装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请提供的数据标签的计算方法,可以应用于如图1所示的应用环境中。该数据标签的计算方法应用于数据标签的计算系统,该数据标签的计算系统包括终端102和服务器104。
其中,终端102可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。
服务器104可以是独立的物理服务器,也可以是区块链系统中的服务节点,该区块链系统中的各服务节点之间形成组成点对点(P2P,Peer To Peer)网络,P2P协议是一个运行在传输控制协议(TCP,Transmission Control Protocol)协议之上的应用层协议。
此外,服务器104还可以是多个物理服务器构成的服务器集群,可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
终端102与服务器104之间可以通过蓝牙、USB(Universal Serial Bus,通用串行总线)或者网络等通讯连接方式进行连接,本申请在此不做限制。
在一个实施例中,如图2所示,提供了一种数据标签的计算方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
S202,响应于数据标签计算请求,根据企业画像模型获取目标数据标签与数据源信息。
其中,数据标签可以指在确定企业画像过程中,对企业相关数据进行梳理归类、指标化和量化的一种数据,可以反映企业特征。目标数据标签可以是当前用于构建企业画像的对应企业画像模型的数据标签。
企业画像是通过对目标公司包含不限于基本情况、经营、财务、融资、行业状况等数据进行识别和分析,得到关于目标公司的一份调查报告。
企业画像模型是包含企业画像所含数据维度中特定维度数据的标签配置。企业画像模型是针对不同融资产品而配置的,不同产品所关注的、在意的企业维度信息有所差异的,因此模型是依据产品需要而配置的。对于每个资源提供方提供的资源产品都对应一个企业画像模型,比如,在某个贷款产品中,对贷款方的财务信息比较关注,那该贷款产品的企业画像模型可能就会选择更多财务维度下的数据标签进行配置,这就能更好的体现贷款方财务方面的实际情况。
数据源是目标公司公开信息的来源渠道,包括数据内容、数据服务商。数据源信息是指数据源的基本信息。基本信息包括数据源的地址,请求方式,服务商等信息。
在一个实施例中,在S202之前,终端对数据标签计算请求中的签名进行验证,验证通过后,对数据标签计算请求进行解密;判断解密后的数据标签计算请求中是否存在企业画像模型编码;若存在企业画像模型编码,则判断是否具有访问企业画像模型的权限;若具有访问企业画像模型的权限,则对解密后的数据标签计算请求中的业务参数进行合法性验证;当合法性验证通过时,执行根据企业画像模型获取目标数据标签与数据源信息的步骤。
其中,如图3所示,数据标签计算请求(以下简称请求)使用JSON作为数据传输格式,该请求的业务参数先经过序列化得到请求明文字符串,例如,业务参数可以是指:{"模型":"ZYD","公司名称":"测试公司","法人姓名":"张三"},使用3DES算法进行加密,得到请求中的密文参数,用RSA算法对请求中的密文参数和随机序列号进行加签。最后将请求中的参数进行组合,得到组合参数,即最终传输参数,该请求中的最终传输参数中可以包含调用者身份ID,密文参数,签名和请求的随机序列号,例如:最终传输参数可以指:{"身份ID":"se12443","密文参数":"xxx","签名":"xxx","请求的随机序列号":"xxx"}。该请求的随机序列号是一段随机固定长度的字符串,请求时生成,作用是增加数据加密的安全性和防止请求重放攻击。密文参数中可以包含企业画像模型编码,企业画像编码是一个具有业务含义的字符串,企业画像编码和企业画像模型两者是一一对应的关系。获取数据标签所必须依赖的业务参数,如企业名称,企业统一社会信用代码等。
其中,JSON(JavaScript Object Notation)是一种轻量级的数据交换格式。3DES(Triple DES)是一种三重数据加密算法(Triple Data Encryption Algorithm,TDEA)块密码的通称,相当于是对每个数据块应用三次DES加密算法。
RSA(公开密钥密码体制)是一种使用不同的加密密钥与解密密钥,由已知加密密钥推导出解密密钥在计算上是不可行的密码体制。
具体的,终端验证签名的步骤为,对数据标签计算请求中的签名进行验证,验证通过后,对数据标签计算请求进行解密,从而可以验证用户是否合法。若用户合法,则验证成功,则执行判断解密后的数据标签计算请求中是否存在企业画像模型编码的步骤。
在一个实施例中,S202具体可以包括:终端基于企业画像模型获取企业画像编码;根据企业画像编码查询目标数据标签和数据源编码;根据数据源编码获取数据源信息;数据源信息是指数据源的基本信息。
在一个实施例中,在校验通过之后,终端将建立一个处理任务,该处理任务与请求唯一绑定。各处理任务可以用于对各任务流程之间进行统筹管理和流程控制。本次请求建立一个处理任务,提交到任务等待队列,任务执行器从任务队列中获取任务进行下一步的执行。
其中,队列是先进先出(FIFO,First-In-First-Out)的线性表。是一种常用的数据结构,在具体应用中通常用链表或者数组来实现。队列只允许在后端(称为rear)进行插入操作,在前端(称为front)进行删除操作在计算机中,任务的定义主要取决于处理任务的对象。
S204,基于目标数据标签与数据源信息确定数据源评分指标,数据源评分指标包括内容匹配度、数据源成本、数据源可靠性和数据源准确性。
其中,内容匹配度可以是数据源中的数据标签与目标数据标签的匹配度。内容匹配度的值可以是数据源中数据标签与目标数据标签的匹配个数。数据源成本可以是数据服务方的API接口的调用时产生的成本。数据源可靠性可以是调用API接口时,其接口正常响应次数与发生网络连接失败、超时、服务不可用等问题次数的统计比率,具体的公式为:可靠性=正常响应次数/(正常响应次数+发生问题次数)。数据源准确性指的是调用API接口时,其接口正常响应次数与发生业务响应码失败、数据解析失败、数据不准确情况的统计比率,具体的公式为:正确性=正常响应次数/(正常响应次数+发生问题次数)。
在一个实施例中,S204的步骤具体可以包括:终端基于数据源信息获取数据源的所有数据标签;对所有数据标签进行筛选,得到目标数据标签以及目标数据标签的标签数量;基于标签数量确定内容匹配度;基于数据服务方的API接口的调用成本确定数据源成本;基于调用API接口的可靠比率确定数据源可靠性;基于调用API接口的数据准确比率确定数据源准确性;其中,内容匹配度、数据源成本、数据源可靠性和数据源准确性组成数据源评分指标。
S206,根据数据源评分指标在不同的数据源方案中选择目标数据源方案;各数据源方案是由不同数据源信息所组成的集合。
其中,目标数据源方案指的是本次请求实际要调用的数据源。
在一个实施例中,如图4所示,S206的具体步骤可以包括:终端基于目标数据标签对数据源信息筛选(映射策略),得到目标数据源信息;对所得的各目标数据源信息进行组合(方案策略),得到不同的数据源方案;计算不同数据源方案对应的数据源评分指标值;数据源评分指标值包括内容匹配度值、数据源成本值、数据源可靠值和数据源准确值;对不同数据源方案的各数据源评分指标值进行加权计算(权重策略),得到不同数据源方案的评分;选择最高评分对应的数据源方案为目标数据源方案。
其中,加权策略为:设加权因素比较总分100分,根据标签内容匹配度、数据源成本、数据源可靠性、数据源准确性作为评价指标,设计加权因素。其中,金额不为负数,最低为0。加权因素表1如下:
不同数据源方案的评分公式为:其中,式中:U为方案的总分,fij为第i个因素对方案j的评价等级分值,Wi为第i个因素的权系数。
例如,方案1:数据源《企业工商信息接口001》,可以计算出数据标签"企业注册时间"、"企业注册资金",成本0.1元,历史可靠率80%,历史准确率60%,内容匹配度为2,方案1评价分=10%*2*10+40%*(2-0.1)*50+25%*80+25%*60=2+38+20+15=75分。
方案2:数据源《企业工商信息接口002》可以计算出数据标签"企业注册时间"、"企业注册资金",成本0.2元,历史可靠率100%,历史准确率100%,内容匹配度为2,方案2评价分=10%*2*10+40%*(2-0.2)*50+25%*100+25%*100=2+36+25+25=88分,方案2评价分更高,因此选择方案2。
S208,对目标数据源方案中数据源信息对应的企业数据进行分析,得到目标数据标签结果。
在一个实施例中,S208的具体步骤包括,终端基于目标数据源方案中的数据源信息,获取企业数据;计算企业数据对应的数据标签结果;将数据标签结果进行筛选,得到目标数据标签结果。
具体的,终端遍历目标数据源方案中的数据源信息,从配置上下文中获取到企业数据地址;基于企业数据地址,以并行的方式调用方案中的数据源,以此获得所有数据标签结果,基于所有数据标签结果筛选出目标数据标签,目标数据标签的形式为基础JSON对象,例如,{"订单个数":100}。
S210,对目标数据标签结果进行结构化处理,得到处理后的目标数据标签结果;处理后的目标数据标签结果用于生成企业画像。
在一个实施例中,终端结构化处理包括,首先对数据标签结果输出JSON标签(KEY)的替换,例如,将JSON对象{"标签A":"值A"}转换为新的JSON对象{"标签B":"值A"},再对JSON进行模块化处理,即将数据标签进行归类,分级,例如,将JSON对象{"标签A":"值A"}转换为有层级的JSON对象{"模块1":{"标签A":"值A"}}。
例如,目标数据标签结果为{"淘宝次数":100},先把“淘宝次数”变成“网购次数”,那么结果需要转化成:{"网购次数":100},再将其归类为“个人消费”,那么这时会转化成:{"个人消费":{"网购次数":100}}。
在一个实施例中,终端还对各流程提供相应的配置,包括请求认证和请求校验过程中的账号和密码的配置,计算不同数据源方案对应的数据源评分指标值过程中的权重系统参考项和权重配置,数据源和数据标签映射关系配置,企业画像模型配置。在各流程执行过程中,需要从配置上下文获取响应配置。
在一个实施例中,终端在各流程中还记录生成方案的日志,包括企业画像模型信息、数据标签信息、数据源信息、链路信息;记录数据源访问日志,包含企业画像模型信息、数据标签信息、数据源信息、数据源响应状态信息等信息,选择目标数据源方案完成之后,终端记录决策结果;得到目标数据标签结果后,终端会记录调用记录和目标数据标签结果,方便在选择数据源信息,调用企业数据和计算目标数据标签等步骤的过程中使用以上记录的信息。
在一个实施例中,终端对记录的日志以及决策结果、调用记录和目标数据标签结果定时进行统计分析,同时将分析结果反馈给选择目标数据源的流程,影响后续的决策行为。例如,在每一次调用完数据服务方的API接口后,会记录调用时间和调用结果,通过统计这些记录,计算出数据源的可靠性和准确性,两者作为权重评分系统的2个指标,影响决策行为。
上述实施例中,上述数据标签的计算方法,通过根据画像模型获取目标数据标签信息与数据源信息,使得数据标签信息与数据源信息的获取更加的简便。基于目标数据标签与数据源信息确定数据源评分指标,根据数据源评分指标在不同的数据源方案中选择目标数据源方案;对目标数据源方案中数据源信息对应的企业数据进行分析,得到目标数据标签结果,对目标数据标签结果进行结构化处理,通过设计数据源选择和数据标签的计算策略,减少了数据标签的开发量。
应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种数据标签的计算装置,该数据标签的计算装置具体包括:获取模块302、确定模块304、决策模块306、路由模块308、组合模块310;其中:
获取模块302,用于响应于数据标签计算请求,根据企业画像模型获取目标数据标签与数据源信息;
确定模块304,用于基于目标数据标签与数据源信息确定数据源评分指标,数据源评分指标包括内容匹配度、数据源成本、数据源可靠性和数据源准确性;
决策模块306,用于根据数据源评分指标在不同的数据源方案中选择目标数据源方案;各数据源方案是由不同数据源信息所组成的集合;
路由模块308,用于对目标数据源方案中数据源信息对应的企业数据进行分析,得到目标数据标签结果;
组合模块310,用于对目标数据标签结果进行结构化处理,得到处理后的目标数据标签结果;处理后的目标数据标签结果用于生成企业画像。
在一个实施例中,获取模块302还用于基于企业画像模型获取企业画像编码;根据企业画像编码查询目标数据标签和数据源编码;根据数据源编码获取数据源信息;数据源信息是指数据源的基本信息。
在一个实施例中,确定模块304还用于基于数据源信息获取数据源的所有数据标签;对所有数据标签进行筛选,得到目标数据标签以及目标数据标签的标签数量;基于标签数量确定内容匹配度;基于数据服务方的API接口的调用成本确定数据源成本;基于调用API接口的可靠比率确定数据源可靠性;基于调用API接口的数据准确比率确定数据源准确性;其中,内容匹配度、数据源成本、数据源可靠性和数据源准确性组成数据源评分指标。
在一个实施例中,决策模块306还用于基于目标数据标签对数据源信息筛选,得到目标数据源信息;对所得的各目标数据源信息进行组合,得到不同的数据源方案;计算不同数据源方案对应的数据源评分指标值;数据源评分指标值包括内容匹配度值、数据源成本值、数据源可靠值和数据源准确值;对不同数据源方案的各数据源评分指标值进行加权计算,得到不同数据源方案的评分;选择最高评分对应的数据源方案为目标数据源方案。
在一个实施例中,路由模块308还用于基于目标数据源方案中的数据源信息,获取企业数据;计算企业数据对应的数据标签结果;将数据标签结果进行筛选,得到目标数据标签结果。
在一个实施例中,组合模块310还用于响应于标签名称调整操作,对标签名称调整操作指定的且为目标数据标签结果中的标签的名称进行调整;将目标数据标签结果进行归类和分级处理,得到处理后的目标数据标签结果。
在一个实施例中,如图6所示,数据标签的计算装置还包括:网关模块312;其中:
网关模块312,用于终端对数据标签计算请求中的签名进行验证,验证通过后,对数据标签计算请求进行解密;判断解密后的数据标签计算请求中是否存在企业画像模型编码;若存在企业画像模型编码,则判断是否具有访问企业画像模型的权限;若具有访问企业画像模型的权限,则对解密后的数据标签计算请求中的业务参数进行合法性验证;当合法性验证通过时,执行根据企业画像模型获取目标数据标签与数据源信息的步骤。
上述实施例中,上述数据标签的计算装置,通过根据画像模型获取目标数据标签信息与数据源信息,使得数据标签信息与数据源信息的获取更加的简便。基于目标数据标签与数据源信息确定数据源评分指标,根据数据源评分指标在不同的数据源方案中选择目标数据源方案;对目标数据源方案中数据源信息对应的企业数据进行分析,得到目标数据标签结果,对目标数据标签结果进行结构化处理,通过设计数据源选择和数据标签的计算策略,减少了数据标签的开发量。
关于数据标签的计算装置的具体限定可以参见上文中对于数据标签的计算方法的限定,在此不再赘述。上述数据标签的计算装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端或服务器,在本实施例中以计算机设备为终端为例进行说明,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种数据标签的计算方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种数据标签的计算方法,其特征在于,所述方法包括:
响应于数据标签计算请求,根据企业画像模型获取目标数据标签与数据源信息;
基于所述数据源信息获取数据源的所有数据标签;对所有所述数据标签进行筛选,得到所述目标数据标签以及所述目标数据标签的标签数量;基于所述标签数量确定内容匹配度;基于数据服务方的API接口的调用成本确定数据源成本;基于调用所述API接口的可靠比率确定数据源可靠性;基于调用所述API接口的数据准确比率确定数据源准确性;其中,所述内容匹配度、所述数据源成本、所述数据源可靠性和所述数据源准确性组成数据源评分指标;
根据所述数据源评分指标在不同的数据源方案中选择目标数据源方案;各所述数据源方案是由不同所述数据源信息所组成的集合;
对所述目标数据源方案中所述数据源信息对应的企业数据进行分析,得到目标数据标签结果;
对所述目标数据标签结果进行结构化处理,得到处理后的所述目标数据标签结果;处理后的所述目标数据标签结果用于生成企业画像。
2.根据权利要求1所述的方法,其特征在于,所述数据标签计算请求是经过加密的请求;所述根据企业画像模型获取目标数据标签与数据源信息之前,所述方法还包括:
对数据标签计算请求中的签名进行验证,验证通过后,对所述数据标签计算请求进行解密;
判断解密后的所述数据标签计算请求中是否存在企业画像模型编码;
若存在所述企业画像模型编码,则判断是否具有访问所述企业画像模型的权限;
若具有访问所述企业画像模型的权限,则对解密后的数据标签计算请求中的业务参数进行合法性验证;
当合法性验证通过时,执行所述根据企业画像模型获取目标数据标签与数据源信息的步骤。
3.根据权利要求1所述的方法,其特征在于,所述根据企业画像模型获取目标数据标签与数据源信息包括:
基于企业画像模型获取企业画像编码;
根据所述企业画像编码查询目标数据标签和数据源编码;
根据所述数据源编码获取数据源信息;所述数据源信息是指数据源的基本信息。
4.根据权利要求1所述的方法,其特征在于,所述数据源可靠性是调用API接口时,所述API接口正常响应次数与发生问题次数的统计比率,所述发生问题次数包括网络连接失败、超时、服务不可用的次数总和。
5.根据权利要求1所述的方法,其特征在于,所述根据所述数据源评分指标在不同的数据源方案中选择目标数据源方案包括:
基于所述目标数据标签对所述数据源信息筛选,得到目标数据源信息;
对所得的各目标数据源信息进行组合,得到不同的数据源方案;
计算不同所述数据源方案对应的数据源评分指标值;所述数据源评分指标值包括内容匹配度值、数据源成本值、数据源可靠值和数据源准确值;
对不同所述数据源方案的各数据源评分指标值进行加权计算,得到不同所述数据源方案的评分;
选择最高所述评分对应的数据源方案为目标数据源方案。
6.根据权利要求1所述的方法,其特征在于,所述对所述目标数据源方案中所述数据源信息对应的企业数据进行分析,得到目标数据标签结果包括:
基于所述目标数据源方案中的数据源信息,获取企业数据;
计算所述企业数据对应的数据标签结果;
将所述数据标签结果进行筛选,得到目标数据标签结果。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述对所述目标数据标签结果进行结构化处理,得到处理后的目标数据标签结果包括:
响应于标签名称调整操作,对所述标签名称调整操作指定的且为所述目标数据标签结果中的标签的名称进行调整;
将所述目标数据标签结果进行归类和分级处理,得到处理后的目标数据标签结果。
8.一种数据标签的计算装置,其特征在于,所述装置包括:
获取模块,用于响应于数据标签计算请求,根据企业画像模型获取目标数据标签与数据源信息;
确定模块,用于基于所述数据源信息获取数据源的所有数据标签;对所有所述数据标签进行筛选,得到所述目标数据标签以及所述目标数据标签的标签数量;基于所述标签数量确定内容匹配度;基于数据服务方的API接口的调用成本确定数据源成本;基于调用所述API接口的可靠比率确定数据源可靠性;基于调用所述API接口的数据准确比率确定数据源准确性;其中,所述内容匹配度、所述数据源成本、所述数据源可靠性和所述数据源准确性组成数据源评分指标;
决策模块,用于根据所述数据源评分指标在不同的数据源方案中选择目标数据源方案;各所述数据源方案是由不同所述数据源信息所组成的集合;
路由模块,用于对所述目标数据源方案中数据源信息对应的企业数据进行分析,得到目标数据标签结果;
组合模块,用于对所述目标数据标签结果进行结构化处理,得到处理后的所述目标数据标签结果;处理后的所述目标数据标签结果用于生成企业画像。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111177512.1A CN114004456B (zh) | 2021-10-09 | 2021-10-09 | 数据标签的计算方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111177512.1A CN114004456B (zh) | 2021-10-09 | 2021-10-09 | 数据标签的计算方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114004456A CN114004456A (zh) | 2022-02-01 |
CN114004456B true CN114004456B (zh) | 2024-04-09 |
Family
ID=79922403
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111177512.1A Active CN114004456B (zh) | 2021-10-09 | 2021-10-09 | 数据标签的计算方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114004456B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106127522A (zh) * | 2016-06-29 | 2016-11-16 | 苏州迈科网络安全技术股份有限公司 | 基于网络数据挖据技术的企业经营状况分析方法及系统 |
CN106777235A (zh) * | 2016-12-27 | 2017-05-31 | 天津数集科技有限公司 | 一种评估不同数据源数据准确度的方法和装置 |
CN107341206A (zh) * | 2017-06-23 | 2017-11-10 | 南京甄视智能科技有限公司 | 基于多个数据源构建精准的用户画像系统及方法 |
CN107464037A (zh) * | 2017-07-05 | 2017-12-12 | 九次方大数据信息集团有限公司 | 基于多指标维度模型的企业画像方法及系统 |
CN109492021A (zh) * | 2018-09-26 | 2019-03-19 | 平安科技(深圳)有限公司 | 企业画像信息查询方法、装置、计算机设备和存储介质 |
CN109658478A (zh) * | 2017-10-10 | 2019-04-19 | 爱信诺征信有限公司 | 一种提供企业画像的方法及系统 |
CN111178747A (zh) * | 2019-12-26 | 2020-05-19 | 金蝶征信有限公司 | 企业画像生成方法、装置、计算机设备和存储介质 |
CN111552734A (zh) * | 2020-03-30 | 2020-08-18 | 平安医疗健康管理股份有限公司 | 用户画像的生成方法及装置、计算机设备、存储介质 |
CN112256762A (zh) * | 2020-10-26 | 2021-01-22 | 中冶赛迪技术研究中心有限公司 | 基于产业地图的企业画像方法、系统、设备及介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10498851B2 (en) * | 2017-01-10 | 2019-12-03 | International Business Machines Corporation | Method of label transform for managing heterogeneous information |
CN107038256B (zh) * | 2017-05-05 | 2018-06-29 | 平安科技(深圳)有限公司 | 基于数据源的业务定制装置、方法及计算机可读存储介质 |
US10540578B2 (en) * | 2017-12-21 | 2020-01-21 | International Business Machines Corporation | Adapting a generative adversarial network to new data sources for image classification |
-
2021
- 2021-10-09 CN CN202111177512.1A patent/CN114004456B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106127522A (zh) * | 2016-06-29 | 2016-11-16 | 苏州迈科网络安全技术股份有限公司 | 基于网络数据挖据技术的企业经营状况分析方法及系统 |
CN106777235A (zh) * | 2016-12-27 | 2017-05-31 | 天津数集科技有限公司 | 一种评估不同数据源数据准确度的方法和装置 |
CN107341206A (zh) * | 2017-06-23 | 2017-11-10 | 南京甄视智能科技有限公司 | 基于多个数据源构建精准的用户画像系统及方法 |
CN107464037A (zh) * | 2017-07-05 | 2017-12-12 | 九次方大数据信息集团有限公司 | 基于多指标维度模型的企业画像方法及系统 |
CN109658478A (zh) * | 2017-10-10 | 2019-04-19 | 爱信诺征信有限公司 | 一种提供企业画像的方法及系统 |
CN109492021A (zh) * | 2018-09-26 | 2019-03-19 | 平安科技(深圳)有限公司 | 企业画像信息查询方法、装置、计算机设备和存储介质 |
CN111178747A (zh) * | 2019-12-26 | 2020-05-19 | 金蝶征信有限公司 | 企业画像生成方法、装置、计算机设备和存储介质 |
CN111552734A (zh) * | 2020-03-30 | 2020-08-18 | 平安医疗健康管理股份有限公司 | 用户画像的生成方法及装置、计算机设备、存储介质 |
CN112256762A (zh) * | 2020-10-26 | 2021-01-22 | 中冶赛迪技术研究中心有限公司 | 基于产业地图的企业画像方法、系统、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114004456A (zh) | 2022-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10705801B2 (en) | Data processing systems for identity validation of data subject access requests and related methods | |
US20220004662A1 (en) | Secure multi-client data analysis | |
US11875400B2 (en) | Systems, methods, and apparatuses for dynamically assigning nodes to a group within blockchains based on transaction type and node intelligence using distributed ledger technology (DLT) | |
JP7026475B2 (ja) | セキュリティ評価システムおよびセキュリティ評価方法 | |
US11050690B2 (en) | Method for providing recording and verification service for data received and transmitted by messenger service, and server using method | |
US20220100731A1 (en) | Validating test results using a blockchain network | |
WO2020001105A1 (zh) | 基于区块链的数据验证方法及装置、电子设备 | |
US9691035B1 (en) | Real-time updates to item recommendation models based on matrix factorization | |
CA3145505C (en) | Staged information exchange facilitated by content-addressable records indexed to pseudonymous identifiers by a tamper-evident data structure | |
US20180373885A1 (en) | Hybrid on-premises/software-as-service applications | |
JP7257172B2 (ja) | 通信プログラム、通信装置、および、通信方法 | |
US11997216B2 (en) | Systems and methods for maintaining secure, encrypted communications across distributed computer networks by linking cryptography-based digital repositories in order to perform blockchain operations in decentralized applications | |
US20230306128A1 (en) | Systems and methods for using secure, encrypted communications across distributed computer networks to provide variable resiliency when indexing blockchain states for performing blockchain operations in decentralized applications using cryptography-based digital repositories | |
US10970741B2 (en) | Method and system for integrating audience data with a social media site | |
CN116868194A (zh) | 对用于生成训练数据的数据的安全存储和处理 | |
CN118797604A (zh) | 基于硬件密码卡的数据存储加密方法、装置、介质和产品 | |
US11711203B2 (en) | Systems and methods for gated offer eligibility verification | |
CN114004456B (zh) | 数据标签的计算方法、装置、计算机设备和存储介质 | |
US12244722B2 (en) | Systems and methods for selecting secure, encrypted communications across distributed computer networks for cryptography-based digital repositories in order to perform blockchain operations in decentralized | |
US12206788B2 (en) | Systems and methods for using secure, encrypted communications across distributed computer networks to efficiently update cryptography-based digital repositories for performing blockchain operations in decentralized applications | |
US20230269086A1 (en) | Systems and methods for using secure, encrypted communications across distributed computer networks to efficiently index blockchain states for performing blockchain operations in decentralized applications using cryptography-based digital repositories | |
CN116150188A (zh) | 信息查询方法、装置、计算机设备和存储介质 | |
CN115470256A (zh) | 一种留痕数据管理、追溯、稽查系统和方法 | |
Qi et al. | DE-sword: Incentivized verifiable tag path query in RFID-enabled supply chain systems | |
JP2022075328A (ja) | データ管理方法、コンピュータプログラム及びデータ管理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |