CN108446270A - 电子装置、系统敏感内容的预警方法及存储介质 - Google Patents
电子装置、系统敏感内容的预警方法及存储介质 Download PDFInfo
- Publication number
- CN108446270A CN108446270A CN201810182928.4A CN201810182928A CN108446270A CN 108446270 A CN108446270 A CN 108446270A CN 201810182928 A CN201810182928 A CN 201810182928A CN 108446270 A CN108446270 A CN 108446270A
- Authority
- CN
- China
- Prior art keywords
- index
- sensitive
- coefficient
- user
- antiallergic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/57—Certifying or maintaining trusted computer platforms, e.g. secure boots or power-downs, version controls, system software checks, secure updates or assessing vulnerabilities
- G06F21/577—Assessing vulnerabilities and evaluating computer system security
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种电子装置、系统敏感内容的预警方法及存储介质,该方法包括:获取业务系统对应的各个抗敏参数及各个抗敏参数对应的权重,根据各个抗敏参数及对应的权重计算业务系统的系统抗敏指数;获取业务系统中每一用户发布内容的内容敏感指数及用户历史行为指数,根据内容敏感指数及用户历史行为指数计算该用户的系统敏感指数,将业务系统中所有用户的系统敏感指数相加得到系统敏感指数总和;计算业务系统对应的系统抗敏指数与系统敏感指数总和两者的差值,根据该差值确定是否发出预警。本发明能够结合业务场景及用户行为对敏感信息进行层级化评判,对敏感信息进行更准确的预警。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种电子装置、系统敏感内容的预警方法及存储介质。
背景技术
目前,对于大型综合企业机构,旗下通常涵盖多种业务,例如金融企业机构,旗下包括证券、保险、银行等各种金融业务,每种业务可以对应一个或多个社交平台,例如股票BBS、理财讲解直播等。在这些平台中可能会出现各类敏感信息,例如,色情、政治、广告等词,容易产生了不良的影响。业内有一些针对平台中的内容进行评判并对敏感信息预警的方法,但是对敏感信息的评判较固化,一般仅关注于评判的正确率,容易出现一刀切的情况。
发明内容
本发明的目的在于提供一种电子装置、系统敏感内容的预警方法及存储介质,旨在结合业务场景及用户行为对敏感信息进行层级化评判,对敏感信息进行更准确的预警。
为实现上述目的,本发明提供一种电子装置,所述电子装置包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:
抗敏指数处理步骤,获取业务系统对应的各个抗敏参数及各个抗敏参数对应的权重,根据各个抗敏参数及对应的权重计算业务系统的系统抗敏指数;
敏感指数处理步骤,获取业务系统中每一用户发布内容的内容敏感指数及用户历史行为指数,根据内容敏感指数及用户历史行为指数计算该用户的系统敏感指数,将业务系统中所有用户的系统敏感指数相加得到系统敏感指数总和;
确定预警步骤,计算业务系统对应的系统抗敏指数与系统敏感指数总和两者的差值,根据该差值确定是否发出预警。
优选地,所述抗敏参数包括系统重要等级系数x1、用户量等级系数x2、系统信息传播系数x3、应急处理系数x4、敏感词汇关注度系数x5,所述系统重要等级系数x1、用户量等级系数x2、系统信息传播系数x3、应急处理系数x4、敏感词汇关注度系数x5的权重对应分别为w1、w2、w3、w4、w5,所述系统抗敏指数=x1*w1+x2*w2+x3*w3+x4*w4+x5*w5。
优选地,所述系统重要等级系数x1根据该业务系统中各业务场景的权重及各业务场景对应的业务量计算得到,所述业务场景包括金融交易场景及普通交易场景,所述金融交易场景的权重为k1,所述普通交易场景的权重为k2,所述金融交易场景的业务量为c1,所述普通交易场景的的业务量为c2,所述业务系统的系统重要等级系数x1=(k1+k2)/((πk1/2arctan(c1/α)+πk2/2arctan(c2/α)),其中,所述α为该业务系统的业务场景的平均业务量,α=(c1+c2)/2。
优选地,所述内容敏感指数的获取过程包括:对用户发布内容以句子为单位进行分词,将分词后的词与预先建立的词库中的词进行匹配,以匹配得到对应的关键词,根据该关键词分析每一句子的对应的核心观点信息,根据预先建立的核心观点信息与内容敏感指数的关联关系获取该核心观点信息关联的内容敏感指数。
为实现上述目的,本发明还提供一种系统敏感内容的预警方法,所述系统敏感内容的预警方法包括:
S1,获取业务系统对应的各个抗敏参数及各个抗敏参数对应的权重,根据各个抗敏参数及对应的权重计算业务系统的系统抗敏指数;
S2,获取业务系统中每一用户发布内容的内容敏感指数及用户历史行为指数,根据内容敏感指数及用户历史行为指数计算该用户的系统敏感指数,将业务系统中所有用户的系统敏感指数相加得到系统敏感指数总和;
S3,计算业务系统对应的系统抗敏指数与系统敏感指数总和两者的差值,根据该差值确定是否发出预警。
优选地,所述抗敏参数包括系统重要等级系数x1、用户量等级系数x2、系统信息传播系数x3、应急处理系数x4、敏感词汇关注度系数x5,所述系统重要等级系数x1、用户量等级系数x2、系统信息传播系数x3、应急处理系数x4、敏感词汇关注度系数x5的权重对应分别为w1、w2、w3、w4、w5,所述系统抗敏指数=x1*w1+x2*w2+x3*w3+x4*w4+x5*w5。
优选地,所述系统重要等级系数x1根据该业务系统中各业务场景的权重及各业务场景对应的业务量计算得到,所述业务场景包括金融交易场景及普通交易场景,所述金融交易场景的权重为k1,所述普通交易场景的权重为k2,所述金融交易场景的业务量为c1,所述普通交易场景的的业务量为c2,所述业务系统的系统重要等级系数x1=(k1+k2)/((πk1/2arctan(c1/α)+πk2/2arctan(c2/α)),其中,所述α为该业务系统的业务场景的平均业务量,α=(c1+c2)/2。
优选地,所述内容敏感指数的获取过程包括:对用户发布内容以句子为单位进行分词,将分词后的词与预先建立的词库中的词进行匹配,以匹配得到对应的关键词,根据该关键词分析每一句子的对应的核心观点信息,根据预先建立的核心观点信息与内容敏感指数的关联关系获取该核心观点信息关联的内容敏感指数。
优选地,所述步骤S3,具体包括:
若所述差值大于预设的第一阈值,则确定该业务系统不发出预警;
若所述差值小于等于该第一阈值且大于预设的第二阈值,则确定该业务系统发出轻度预警;
若所述差值小于等于该第二阈值且大于预设的第三阈值,则确定该业务系统发出中度预警;
若所述差值小于等于该第三阈值,则确定该业务系统发出重度预警。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有处理系统,所述处理系统被处理器执行时实现上述的方法的步骤。
本发明的有益效果是:本发明针对不同的业务系统计算用以评判其抵抗敏感信息的能力的系统抗敏指数、计算用以评判用户的行为给业务系统带来的敏感影响程度的系统敏感指数总和,根据两者的差值确定该业务系统是否发出预警,本发明综合考虑在业务系统的实际应用中,各个业务系统对敏感信息的包容度不同,各个业务系统中的用户的严谨程度也不同,基于这两个方面从业务系统的实际应用角度出发,结合业务场景及用户行为对敏感信息进行层级化评判,并对敏感信息进行更准确的预警。
附图说明
图1为本发明电子装置一实施例的硬件架构的示意图;
图2为本发明系统敏感内容的预警方法一实施例的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参阅图1所示,是本发明电子装置一实施例的硬件架构示意图。电子装置1是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。所述电子装置1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在本实施例中,电子装置1可包括,但不仅限于,可通过系统总线相互通信连接的存储器11、处理器12、网络接口13,存储器11存储有可在处理器12上运行的处理系统。需要指出的是,图1仅示出了具有组件11-13的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
其中,存储器11包括内存及至少一种类型的可读存储介质。内存为电子装置1的运行提供缓存;可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中,可读存储介质可以是电子装置1的内部存储单元,例如该电子装置1的硬盘;在另一些实施例中,该非易失性存储介质也可以是电子装置1的外部存储设备,例如电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。本实施例中,存储器11的可读存储介质通常用于存储安装于电子装置1的操作系统和各类应用软件,例如存储本发明一实施例中的处理系统的程序代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子装置1的总体操作,例如执行与其他设备进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行处理系统等。
所述网络接口13可包括无线网络接口或有线网络接口,该网络接口13通常用于在所述电子装置1与其他电子设备之间建立通信连接。
所述处理系统存储在存储器11中,包括至少一个存储在存储器11中的计算机可读指令,该至少一个计算机可读指令可被处理器器12执行,以实现本申请各实施例的方法;以及,该至少一个计算机可读指令依据其各部分所实现的功能不同,可被划为不同的逻辑模块。
在一实施例中,上述处理系统被所述处理器12执行时实现如下步骤:
抗敏指数处理步骤,获取业务系统对应的各个抗敏参数及各个抗敏参数对应的权重,根据各个抗敏参数及对应的权重计算业务系统的系统抗敏指数;
其中,系统抗敏指数为业务系统抵抗敏感信息或敏感内容的能力的指标,系统抗敏指数越高,则业务系统抵抗敏感词汇的能力越强。在一实施例中,抗敏参数包括系统重要等级系数、用户量等级系数、系统信息传播系数;在另一实施例中,抗敏参数包括系统重要等级系数、用户量等级系数、系统信息传播系数、应急处理系数、敏感词汇关注度系数。
其中,系统重要等级系数越小则该业务系统越重要,用户量等级系数越小则该业务系统的用户数量越多,系统信息传播系数越小则该业务系统的信息传播能力越强,应急处理系数越小则该业务系统的应急处理能力越弱,敏感词汇关注度系数越小则该业务系统中敏感词汇关注度最高。
在一具体的实例中,系统重要等级系数的范围为[0,1],当系统重要等级系数为0时候业务系统的重要性最高,可以将系统重要等级系数分为3级:0为一级、0.5为二级、1为三级;
用户量等级系数的范围为[0,1],当用户量等级系数为0时候用户量最多最高,可以将用户量等级系数分为3级:0为用户量在10000以上、0.5为用户量在1000至10000以内、1为用户量在1000以内;
系统信息传播系数的范围为[0,1],当系统信息传播系数为0时候系统信息最容易传播,可以将系统信息传播系数分为3级:0为仅以纯互联网为传播途径、0.5为企业局域网与互联网组成的网络中的混合传播途径、1为仅以局域网为传播途径;
应急处理系数的范围为[0,1],当应急处理系数为0时候系统无应急处理,可以将应急处理系数分为3级:0为无应急处理、0.5为能迅速删除系统内的敏感内容、1为能迅速删除敏感内容的同时定位转发地址协助删除;
敏感词汇关注度系数的范围为[0,1],当敏感词汇关注度系数为0时候敏感词汇关注度最高,可以将敏感词汇关注度系数分为3级:0为色情、政治、广告、违法等全部关注、0.5为关注广告等危害性不大的、1为已有其他手段抗敏所以都不用关注。
以抗敏参数包括系统重要等级系数x1、用户量等级系数x2、系统信息传播系数x3、应急处理系数x4、敏感词汇关注度系数x5为例,系统重要等级系数x1、用户量等级系数x2、系统信息传播系数x3、应急处理系数x4、敏感词汇关注度系数x5的权重对应分别为w1、w2、w3、w4、w5,则系统抗敏指数=x1*w1+x2*w2+x3*w3+x4*w4+x5*w5。其中,权重w1、w2、w3、w4、w5为预先配置的大于1的数值,可以取均相同的值或者不同的值,在一实施例中,w1=w2=w3=w4=w5=20。
根据上述实例的描述,业务系统越重要、用户量越大、信息传播越容易、应急处理能力越弱、敏感词汇关注度越高,则该业务系统的系统抗敏指数越小,抵抗敏感词汇的能力越弱;反之则业务系统的系统抗敏指数越大,抵抗敏感词汇的能力越强。
在另一实例中,系统重要等级系数x1可以根据该业务系统中各业务场景的权重及各业务场景对应的业务量进行度量,以金融业务系统为例,业务场景包括金融交易场景及普通交易场景,金融交易场景包括例如银行转账、基金购买等,普通交易包括例如保费支付、保费续保等。金融交易场景的权重为k1,普通交易场景的权重为k2,金融交易场景的业务量为c1,普通交易场景的的业务量为c2,业务量可以以数据的收发量为度量,数据的收发量越大,则业务量越大。业务系统的系统重要等级系数x1=(k1+k2)/((πk1/2arctan(c1/α)+πk2/2arctan(c2/α)),其中,α为该业务系统的业务场景的平均业务量,α=(c1+c2)/2,系统重要等级系数x1的范围为[0,1]。当然,业务场景还可以进一步进行细分,以便更加客观、综合性地评判业务系统的重要性。例如包括金融交易场景、普通交易场景、核心业务场景及非核心业务场景等等,各种场景具有对应的业务量,通过与上述相同原理的计算方式可以计算得到系统重要等级系数x1。
敏感指数处理步骤,获取业务系统中每一用户发布内容的内容敏感指数及用户历史行为指数,根据内容敏感指数及用户历史行为指数计算该用户的系统敏感指数,将业务系统中所有用户的系统敏感指数相加得到系统敏感指数总和;
其中,用户的系统敏感指数用以评判:用户的行为给业务系统带来的敏感影响程度。用户的系统敏感指数越小,则给业务系统带来的敏感影响程度越小,用户的系统敏感指数越大,则给业务系统带来的敏感影响程度越大。
其中,内容敏感指数指的是用户发布的内容的敏感程度或度量,其内容若涉及敏感词汇或者敏感信息,则内容敏感指数越大,敏感词汇或者敏感信息包括色情、政治、广告、违法等等。
在一实施例中,内容敏感指数的获取过程包括:对用户发布内容以句子为单位进行分词,将分词后的词与预先建立的词库中的词进行匹配,以匹配得到对应的关键词,其中,关键词包括名词、动词、与色情、政治、广告、违法等相关的词等,根据该关键词分析每一句子的对应的核心观点信息,在一实施例中,可以直接将关键词组成新的语句,该语句的信息即为核心观点信息,根据预先建立的核心观点信息与内容敏感指数的关联关系获取该核心观点信息关联的内容敏感指数。其中,预先通过鉴定核心程序鉴定得出核心观点信息对应的内容敏感指数并存储在词库中。在一实施例中,核心观点信息为色情信息,其内容敏感指数对应为n1,核心观点信息为违法信息,其内容敏感指数对应为n2,核心观点信息为政治信息,其内容敏感指数对应为n3,核心观点信息为广告信息,其内容敏感指数对应为n4,n1≥n2≥n3≥n4。
在一具体的实例中,例如:对于用户在某个平台系统中发布的内容“***化妆品今日促销大优惠”,该语句经分词后得到“***化妆品”、“今日”、“促销”、“大优惠”,将这些分词与词库中的词进行匹配,得到的关键词为“化妆品”、“促销”、“大优惠”,根据这些关键词,可以分析出该语句的核心观点信息为“化妆品促销优惠”,其核心观点信息属于广告信息。
其中,用户历史行为指数为用户应对其他用户发布的内容的行为描述,在一实施例中,用户历史行为指数的基数为1,若用户有举报其他用户发布涉及敏感词汇或者敏感信息的行为,则用户历史行为指数为(1-0.2),若用户自己有发布涉及敏感词汇或者敏感信息的行为,则用户历史行为指数为(1+0.2)。
在获取业务系统中每一用户发布内容的内容敏感指数及用户历史行为指数之后,计算该用户的系统敏感指数=内容敏感指数*用户历史行为指数,将业务系统中所有用户的系统敏感指数相加得到系统敏感指数总和。
在其他实施例中,可对词库中的词进行维护,结合业务系统的运营情况,实时调整现有词库中核心观点信息对应的内容敏感指数的评定,其具体的调整算法包括:根据词汇的出现总频率、词汇的在各业务系统出现广度、运营人员的反馈评定等级、运营人员的反馈频率等进行综合评定,若上述的4个指标越高,则内容敏感指数越大。
确定预警步骤,计算业务系统对应的系统抗敏指数与系统敏感指数总和两者的差值,根据该差值确定是否发出预警。
其中,若系统抗敏指数与系统敏感指数总和两者的差值越大,则系统抗敏指数越大,系统敏感指数总和越小,该业务系统
在一实施例中,该步骤具体包括:
若所述差值大于预设的第一阈值,则确定该业务系统不发出预警;
若所述差值小于等于该第一阈值且大于预设的第二阈值,则确定该业务系统发出轻度预警;
若所述差值小于等于该第二阈值且大于预设的第三阈值,则确定该业务系统发出中度预警;
若所述差值小于等于该第三阈值,则确定该业务系统发出重度预警。
在一具体的实例中,若差值大于90,则确定该业务系统不发出预警;若所述差值小于等于90且大于60,则确定该业务系统发出轻度预警;若所述差值小于等于60且大于30,则确定该业务系统发出中度预警;若所述差值小于等于30,则确定该业务系统发出重度预警。
与现有技术相比,本发明针对不同的业务系统计算用以评判其抵抗敏感信息的能力的系统抗敏指数、计算用以评判用户的行为给业务系统带来的敏感影响程度的系统敏感指数总和,根据两者的差值确定该业务系统是否发出预警,本发明综合考虑在业务系统的实际应用中,各个业务系统对敏感信息的包容度不同,各个业务系统中的用户的严谨程度也不同,基于这两个方面从业务系统的实际应用角度出发,结合业务场景及用户行为对敏感信息进行层级化评判,对敏感信息进行更准确的预警。
如图2所示,图2为本发明系统敏感内容的预警方法一实施例的流程示意图,该系统敏感内容的预警方法包括以下步骤:
步骤S1,获取业务系统对应的各个抗敏参数及各个抗敏参数对应的权重,根据各个抗敏参数及对应的权重计算业务系统的系统抗敏指数;
其中,系统抗敏指数为业务系统抵抗敏感词汇的能力的指标,系统抗敏指数越高,则业务系统抵抗敏感词汇的能力越强。在一实施例中,抗敏参数包括系统重要等级系数、用户量等级系数、系统信息传播系数;在另一实施例中,抗敏参数包括系统重要等级系数、用户量等级系数、系统信息传播系数、应急处理系数、敏感词汇关注度系数。
其中,系统重要等级系数越小则该业务系统越重要,用户量等级系数越小则该业务系统的用户数量越多,系统信息传播系数越小则该业务系统的信息传播能力越强,应急处理系数越小则该业务系统的应急处理能力越弱,敏感词汇关注度系数越小则该业务系统中敏感词汇关注度最高。
在一具体的实例中,系统重要等级系数的范围为[0,1],当系统重要等级系数为0时候业务系统的重要性最高,可以将系统重要等级系数分为3级:0为一级、0.5为二级、1为三级;
用户量等级系数的范围为[0,1],当用户量等级系数为0时候用户量最多最高,可以将用户量等级系数分为3级:0为用户量在10000以上、0.5为用户量在1000至10000以内、1为用户量在1000以内;
系统信息传播系数的范围为[0,1],当系统信息传播系数为0时候系统信息最容易传播,可以将系统信息传播系数分为3级:0为仅以纯互联网为传播途径、0.5为企业局域网与互联网组成的网络中的混合传播途径、1为仅以局域网为传播途径;
应急处理系数的范围为[0,1],当应急处理系数为0时候系统无应急处理,可以将应急处理系数分为3级:0为无应急处理、0.5为能迅速删除系统内的敏感内容、1为能迅速删除敏感内容的同时定位转发地址协助删除;
敏感词汇关注度系数的范围为[0,1],当敏感词汇关注度系数为0时候敏感词汇关注度最高,可以将敏感词汇关注度系数分为3级:0为色情、政治、广告、违法等全部关注、0.5为关注广告等危害性不大的、1为已有其他手段抗敏所以都不用关注。
以抗敏参数包括系统重要等级系数x1、用户量等级系数x2、系统信息传播系数x3、应急处理系数x4、敏感词汇关注度系数x5为例,系统重要等级系数x1、用户量等级系数x2、系统信息传播系数x3、应急处理系数x4、敏感词汇关注度系数x5的权重对应分别为w1、w2、w3、w4、w5,则系统抗敏指数=x1*w1+x2*w2+x3*w3+x4*w4+x5*w5。其中,权重w1、w2、w3、w4、w5为预先配置的大于1的数值,可以取均相同的值或者不同的值,在一实施例中,w1=w2=w3=w4=w5=20。
根据上述实例的描述,业务系统越重要、用户量越大、信息传播越容易、应急处理能力越弱、敏感词汇关注度越高,则该业务系统的系统抗敏指数越小,抵抗敏感词汇的能力越弱;反之则业务系统的系统抗敏指数越大,抵抗敏感词汇的能力越强。
在另一实例中,系统重要等级系数x1可以根据该业务系统中各业务场景的权重及各业务场景对应的业务量进行度量,以金融业务系统为例,业务场景包括金融交易场景及普通交易场景,金融交易场景包括例如银行转账、基金购买等,普通交易包括例如保费支付、保费续保等。金融交易场景的权重为k1,普通交易场景的权重为k2,金融交易场景的业务量为c1,普通交易场景的的业务量为c2,业务量可以以数据的收发量为度量,数据的收发量越大,则业务量越大。业务系统的系统重要等级系数x1=(k1+k2)/((πk1/2arctan(c1/α)+πk2/2arctan(c2/α)),其中,α为该业务系统的业务场景的平均业务量,α=(c1+c2)/2,系统重要等级系数x1的范围为[0,1]。当然,业务场景还可以进一步进行细分,以便更加客观、综合性地评判业务系统的重要性。例如包括金融交易场景、普通交易场景、核心业务场景及非核心业务场景等等,各种场景具有对应的业务量,通过与上述相同原理的计算方式可以计算得到系统重要等级系数x1。
步骤S2,获取业务系统中每一用户发布内容的内容敏感指数及用户历史行为指数,根据内容敏感指数及用户历史行为指数计算该用户的系统敏感指数,将业务系统中所有用户的系统敏感指数相加得到系统敏感指数总和;
其中,用户的系统敏感指数用以评判:用户的行为给业务系统带来的敏感影响程度。用户的系统敏感指数越小,则给业务系统带来的敏感影响程度越小,用户的系统敏感指数越大,则给业务系统带来的敏感影响程度越大。
其中,内容敏感指数指的是用户发布的内容的敏感程度或度量,其内容若涉及敏感词汇或者敏感信息,则内容敏感指数越大,敏感词汇或者敏感信息包括色情、政治、广告、违法等等。
在一实施例中,内容敏感指数的获取过程包括:对用户发布内容以句子为单位进行分词,将分词后的词与预先建立的词库中的词进行匹配,以匹配得到对应的关键词,其中,关键词包括名词、动词、与色情、政治、广告、违法等相关的词等,根据该关键词分析每一句子的对应的核心观点信息,在一实施例中,可以直接将关键词组成新的语句,该语句的信息即为核心观点信息,根据预先建立的核心观点信息与内容敏感指数的关联关系获取该核心观点信息关联的内容敏感指数。其中,预先通过鉴定核心程序鉴定得出核心观点信息对应的内容敏感指数并存储在词库中。在一实施例中,核心观点信息为色情信息,其内容敏感指数对应为n1,核心观点信息为违法信息,其内容敏感指数对应为n2,核心观点信息为政治信息,其内容敏感指数对应为n3,核心观点信息为广告信息,其内容敏感指数对应为n4,n1≥n2≥n3≥n4。
在一具体的实例中,例如:对于用户在某个平台系统中发布的内容“***化妆品今日促销大优惠”,该语句经分词后得到“***化妆品”、“今日”、“促销”、“大优惠”,将这些分词与词库中的词进行匹配,得到的关键词为“化妆品”、“促销”、“大优惠”,根据这些关键词,可以分析出该语句的核心观点信息为“化妆品促销优惠”,其核心观点信息属于广告信息。
其中,用户历史行为指数为用户应对其他用户发布的内容的行为描述,在一实施例中,用户历史行为指数的基数为1,若用户有举报其他用户发布涉及敏感词汇或者敏感信息的行为,则用户历史行为指数为(1-0.2),若用户自己有发布涉及敏感词汇或者敏感信息的行为,则用户历史行为指数为(1+0.2)。
在获取业务系统中每一用户发布内容的内容敏感指数及用户历史行为指数之后,计算该用户的系统敏感指数=内容敏感指数*用户历史行为指数,将业务系统中所有用户的系统敏感指数相加得到系统敏感指数总和。
在其他实施例中,可对词库中的词进行维护,结合业务系统的运营情况,实时调整现有词库中核心观点信息对应的内容敏感指数的评定,其具体的调整算法包括:根据词汇的出现总频率、词汇的在各业务系统出现广度、运营人员的反馈评定等级、运营人员的反馈频率等进行综合评定,若上述的4个指标越高,则内容敏感指数越大。
步骤S3,计算业务系统对应的系统抗敏指数与系统敏感指数总和两者的差值,根据该差值确定是否发出预警。
在一实施例中,该步骤具体包括:
若所述差值大于预设的第一阈值,则确定该业务系统不发出预警;
若所述差值小于等于该第一阈值且大于预设的第二阈值,则确定该业务系统发出轻度预警;
若所述差值小于等于该第二阈值且大于预设的第三阈值,则确定该业务系统发出中度预警;
若所述差值小于等于该第三阈值,则确定该业务系统发出重度预警。
在一具体的实例中,若差值大于90,则确定该业务系统不发出预警;若所述差值小于等于90且大于60,则确定该业务系统发出轻度预警;若所述差值小于等于60且大于30,则确定该业务系统发出中度预警;若所述差值小于等于30,则确定该业务系统发出重度预警。
本发明针对不同的业务系统计算用以评判其抵抗敏感信息的能力的系统抗敏指数、计算用以评判用户的行为给业务系统带来的敏感影响程度的系统敏感指数总和,根据两者的差值确定该业务系统是否发出预警,本发明综合考虑在业务系统的实际应用中,各个业务系统对敏感信息的包容度不同,各个业务系统中的用户的严谨程度也不同,基于这两个方面从业务系统的实际应用角度出发,结合业务场景及用户行为对敏感信息进行层级化评判,对敏感信息进行更准确的预警。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有处理系统,所述处理系统被处理器执行时实现上述的系统敏感内容的预警方法的步骤。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种电子装置,其特征在于,所述电子装置包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:
抗敏指数处理步骤,获取业务系统对应的各个抗敏参数及各个抗敏参数对应的权重,根据各个抗敏参数及对应的权重计算业务系统的系统抗敏指数;
敏感指数处理步骤,获取业务系统中每一用户发布内容的内容敏感指数及用户历史行为指数,根据内容敏感指数及用户历史行为指数计算该用户的系统敏感指数,将业务系统中所有用户的系统敏感指数相加得到系统敏感指数总和;
确定预警步骤,计算业务系统对应的系统抗敏指数与系统敏感指数总和两者的差值,根据该差值确定是否发出预警。
2.根据权利要求1所述的电子装置,其特征在于,所述抗敏参数包括系统重要等级系数x1、用户量等级系数x2、系统信息传播系数x3、应急处理系数x4、敏感词汇关注度系数x5,所述系统重要等级系数x1、用户量等级系数x2、系统信息传播系数x3、应急处理系数x4、敏感词汇关注度系数x5的权重对应分别为w1、w2、w3、w4、w5,所述系统抗敏指数=x1*w1+x2*w2+x3*w3+x4*w4+x5*w5。
3.根据权利要求2所述的电子装置,其特征在于,所述系统重要等级系数x1根据该业务系统中各业务场景的权重及各业务场景对应的业务量计算得到,所述业务场景包括金融交易场景及普通交易场景,所述金融交易场景的权重为k1,所述普通交易场景的权重为k2,所述金融交易场景的业务量为c1,所述普通交易场景的的业务量为c2,所述业务系统的系统重要等级系数x1=(k1+k2)/((πk1/2arctan(c1/α)+πk2/2arctan(c2/α)),其中,所述α为该业务系统的业务场景的平均业务量,α=(c1+c2)/2。
4.根据权利要求1至3任一项所述的电子装置,其特征在于,所述内容敏感指数的获取过程包括:对用户发布内容以句子为单位进行分词,将分词后的词与预先建立的词库中的词进行匹配,以匹配得到对应的关键词,根据该关键词分析每一句子的对应的核心观点信息,根据预先建立的核心观点信息与内容敏感指数的关联关系获取该核心观点信息关联的内容敏感指数。
5.一种系统敏感内容的预警方法,其特征在于,所述系统敏感内容的预警方法包括:
S1,获取业务系统对应的各个抗敏参数及各个抗敏参数对应的权重,根据各个抗敏参数及对应的权重计算业务系统的系统抗敏指数;
S2,获取业务系统中每一用户发布内容的内容敏感指数及用户历史行为指数,根据内容敏感指数及用户历史行为指数计算该用户的系统敏感指数,将业务系统中所有用户的系统敏感指数相加得到系统敏感指数总和;
S3,计算业务系统对应的系统抗敏指数与系统敏感指数总和两者的差值,根据该差值确定是否发出预警。
6.根据权利要求5所述的系统敏感内容的预警方法,其特征在于,所述抗敏参数包括系统重要等级系数x1、用户量等级系数x2、系统信息传播系数x3、应急处理系数x4、敏感词汇关注度系数x5,所述系统重要等级系数x1、用户量等级系数x2、系统信息传播系数x3、应急处理系数x4、敏感词汇关注度系数x5的权重对应分别为w1、w2、w3、w4、w5,所述系统抗敏指数=x1*w1+x2*w2+x3*w3+x4*w4+x5*w5。
7.根据权利要求6所述的系统敏感内容的预警方法,其特征在于,所述系统重要等级系数x1根据该业务系统中各业务场景的权重及各业务场景对应的业务量计算得到,所述业务场景包括金融交易场景及普通交易场景,所述金融交易场景的权重为k1,所述普通交易场景的权重为k2,所述金融交易场景的业务量为c1,所述普通交易场景的的业务量为c2,所述业务系统的系统重要等级系数x1=(k1+k2)/((πk1/2arctan(c1/α)+πk2/2arctan(c2/α)),其中,所述α为该业务系统的业务场景的平均业务量,α=(c1+c2)/2。
8.根据权利要求5至7任一项所述的系统敏感内容的预警方法,其特征在于,所述内容敏感指数的获取过程包括:对用户发布内容以句子为单位进行分词,将分词后的词与预先建立的词库中的词进行匹配,以匹配得到对应的关键词,根据该关键词分析每一句子的对应的核心观点信息,根据预先建立的核心观点信息与内容敏感指数的关联关系获取该核心观点信息关联的内容敏感指数。
9.根据权利要求5至7任一项所述的系统敏感内容的预警方法,其特征在于,所述步骤S3,具体包括:
若所述差值大于预设的第一阈值,则确定该业务系统不发出预警;
若所述差值小于等于该第一阈值且大于预设的第二阈值,则确定该业务系统发出轻度预警;
若所述差值小于等于该第二阈值且大于预设的第三阈值,则确定该业务系统发出中度预警;
若所述差值小于等于该第三阈值,则确定该业务系统发出重度预警。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有处理系统,所述处理系统被处理器执行时实现如权利要求5至9中任一项所述的系统敏感内容的预警方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810182928.4A CN108446270B (zh) | 2018-03-06 | 2018-03-06 | 电子装置、系统敏感内容的预警方法及存储介质 |
PCT/CN2018/089460 WO2019169766A1 (zh) | 2018-03-06 | 2018-06-01 | 电子装置、系统敏感内容的预警方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810182928.4A CN108446270B (zh) | 2018-03-06 | 2018-03-06 | 电子装置、系统敏感内容的预警方法及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108446270A true CN108446270A (zh) | 2018-08-24 |
CN108446270B CN108446270B (zh) | 2021-06-08 |
Family
ID=63193761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810182928.4A Active CN108446270B (zh) | 2018-03-06 | 2018-03-06 | 电子装置、系统敏感内容的预警方法及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108446270B (zh) |
WO (1) | WO2019169766A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111966915A (zh) * | 2019-05-20 | 2020-11-20 | 腾讯科技(深圳)有限公司 | 信息巡检方法、计算机设备及存储介质 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111079029B (zh) * | 2019-12-20 | 2023-11-21 | 珠海格力电器股份有限公司 | 敏感账号的检测方法、存储介质和计算机设备 |
CN118820397A (zh) * | 2020-09-14 | 2024-10-22 | 支付宝(杭州)信息技术有限公司 | 一种待发布文本的风险检测方法、装置及设备 |
CN113779336A (zh) * | 2021-09-08 | 2021-12-10 | 五八同城信息技术有限公司 | 用户行为数据的处理方法及装置、电子设备 |
CN113891104A (zh) * | 2021-09-24 | 2022-01-04 | 北京沃东天骏信息技术有限公司 | 一种直播处理方法、直播平台、存储介质及电子设备 |
CN114238280B (zh) * | 2021-12-20 | 2024-07-16 | 中电金信软件有限公司 | 构建金融敏感信息标准库的方法、装置及电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104156365A (zh) * | 2013-05-14 | 2014-11-19 | 中国移动通信集团湖南有限公司 | 一种文件的监控方法、装置及系统 |
CN104417561A (zh) * | 2013-08-22 | 2015-03-18 | 通用汽车环球科技运作有限责任公司 | 情境感知威胁响应判定 |
CN106445998A (zh) * | 2016-05-26 | 2017-02-22 | 达而观信息科技(上海)有限公司 | 一种基于敏感词的文本内容审核方法及系统 |
CN106599713A (zh) * | 2016-11-11 | 2017-04-26 | 中国电子科技网络信息安全有限公司 | 一种基于大数据的数据库脱敏系统及方法 |
CN106777098A (zh) * | 2016-12-14 | 2017-05-31 | 齐雪成 | 一种智慧养老大数据舆情网路监控的方法及装置 |
CN206451332U (zh) * | 2017-01-22 | 2017-08-29 | 沈阳一通智能科技有限公司 | 一种智能网络报警设备 |
CN107633183A (zh) * | 2017-09-29 | 2018-01-26 | 东南大学 | 一种基于查询结果集敏感度的数据泄露检测方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8655939B2 (en) * | 2007-01-05 | 2014-02-18 | Digital Doors, Inc. | Electromagnetic pulse (EMP) hardened information infrastructure with extractor, cloud dispersal, secure storage, content analysis and classification and method therefor |
CN103268350B (zh) * | 2013-05-29 | 2017-02-08 | 安徽雷越网络科技有限公司 | 一种互联网舆情信息监测系统及监测方法 |
CN104933093B (zh) * | 2015-05-19 | 2018-08-07 | 武汉泰迪智慧科技有限公司 | 基于大数据的地区舆情监控及决策辅助系统和方法 |
CN107633084A (zh) * | 2017-09-28 | 2018-01-26 | 武汉虹旭信息技术有限责任公司 | 基于自媒体的舆情管控系统及其方法 |
-
2018
- 2018-03-06 CN CN201810182928.4A patent/CN108446270B/zh active Active
- 2018-06-01 WO PCT/CN2018/089460 patent/WO2019169766A1/zh active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104156365A (zh) * | 2013-05-14 | 2014-11-19 | 中国移动通信集团湖南有限公司 | 一种文件的监控方法、装置及系统 |
CN104417561A (zh) * | 2013-08-22 | 2015-03-18 | 通用汽车环球科技运作有限责任公司 | 情境感知威胁响应判定 |
CN106445998A (zh) * | 2016-05-26 | 2017-02-22 | 达而观信息科技(上海)有限公司 | 一种基于敏感词的文本内容审核方法及系统 |
CN106599713A (zh) * | 2016-11-11 | 2017-04-26 | 中国电子科技网络信息安全有限公司 | 一种基于大数据的数据库脱敏系统及方法 |
CN106777098A (zh) * | 2016-12-14 | 2017-05-31 | 齐雪成 | 一种智慧养老大数据舆情网路监控的方法及装置 |
CN206451332U (zh) * | 2017-01-22 | 2017-08-29 | 沈阳一通智能科技有限公司 | 一种智能网络报警设备 |
CN107633183A (zh) * | 2017-09-29 | 2018-01-26 | 东南大学 | 一种基于查询结果集敏感度的数据泄露检测方法 |
Non-Patent Citations (1)
Title |
---|
邱东: "多指标综合评价中合成方法的系统分析", 《财经问题研究》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111966915A (zh) * | 2019-05-20 | 2020-11-20 | 腾讯科技(深圳)有限公司 | 信息巡检方法、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2019169766A1 (zh) | 2019-09-12 |
CN108446270B (zh) | 2021-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108446270A (zh) | 电子装置、系统敏感内容的预警方法及存储介质 | |
Pruitt et al. | Institutional ownership and changes in the S&P 500 | |
JP5889300B2 (ja) | オンライン取引ユーザーの信頼性評価の方法およびシステム | |
Muris | The FTC and the Law of Monopolization | |
CN111489065A (zh) | 融合ict供应链网络拓扑和产品商业信息的节点风险评估 | |
CN109784633A (zh) | 企业风险评估的装置、方法及存储介质 | |
CN111754116A (zh) | 一种基于标签画像技术的信用评估方法及装置 | |
CN110362689A (zh) | 一种风险评估方法、装置、存储介质和服务器 | |
TW202418102A (zh) | 用於事件機器執行模型的系統及方法 | |
CN109615461B (zh) | 目标用户识别方法、违规商户识别方法和装置 | |
CN112241915A (zh) | 一种贷款产品的生成方法和装置 | |
CN112348659A (zh) | 用户风险识别策略的分配方法、装置及电子设备 | |
Saleh | Juridical Analysis of the Crime of Online Store Fraud in Indonesia | |
CN109918189B (zh) | 一种资源管理方法及相关设备 | |
CN113935844A (zh) | 一种基于大数据和人工智能的金融风控系统 | |
CN108805603A (zh) | 营销活动质量评估方法、服务器及计算机可读存储介质 | |
JP2016051396A (ja) | 取引管理システムおよび取引管理方法 | |
CN110321423B (zh) | 一种文本数据的风险识别方法及服务器 | |
CN112435097A (zh) | 一种交易过程中专利价格评估系统及评估方法 | |
CN112950250A (zh) | 房屋价值的评估方法、装置、存储介质和智能终端 | |
Japan Fair Trade Commission | Guidelines Concerning Abuse of a Superior Bargaining Position in Transactions between Digital Platform Operators and Consumers that Provide Personal Information, etc (2019) | |
CN108985946A (zh) | 一种保单的处理方法及服务器 | |
CN115660451A (zh) | 基于rpa的供应商风险预警方法、装置、设备及介质 | |
CN110602068B (zh) | 一种数据权限管理方法及相关产品 | |
CN111194441B (zh) | 一种基于区块链的数据管理方法及相关系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |