CN106878347A - 信息处理方法、系统、移动终端和服务器 - Google Patents
信息处理方法、系统、移动终端和服务器 Download PDFInfo
- Publication number
- CN106878347A CN106878347A CN201710297050.4A CN201710297050A CN106878347A CN 106878347 A CN106878347 A CN 106878347A CN 201710297050 A CN201710297050 A CN 201710297050A CN 106878347 A CN106878347 A CN 106878347A
- Authority
- CN
- China
- Prior art keywords
- information
- fingerprint
- vector
- server
- described information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 33
- 238000003672 processing method Methods 0.000 title claims abstract description 31
- 239000013598 vector Substances 0.000 claims abstract description 236
- 238000000034 method Methods 0.000 claims abstract description 73
- 238000012545 processing Methods 0.000 claims description 32
- 230000011218 segmentation Effects 0.000 claims description 29
- 239000011159 matrix material Substances 0.000 claims description 19
- 239000000284 extract Substances 0.000 claims description 11
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 238000002955 isolation Methods 0.000 claims description 2
- 238000007405 data analysis Methods 0.000 abstract description 4
- 238000013145 classification model Methods 0.000 description 16
- 238000004364 calculation method Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 241000700605 Viruses Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/12—Detection or prevention of fraud
- H04W12/128—Anti-malware arrangements, e.g. protection against SMS fraud or mobile malware
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/12—Detection or prevention of fraud
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/20—Network architectures or network communication protocols for network security for managing network security; network security policies in general
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/30—Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information
- H04L63/308—Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information retaining data, e.g. retaining successful, unsuccessful communication attempts, internet access, or e-mail, internet telephony, intercept related information or call content
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Technology Law (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明实施例公开了一种信息处理方法、系统、移动终端和服务器,其中应用于移动终端的方法,包括:接收至少一条信息,基于每条所述信息计算得到至少一个信息指纹,提取每条所述信息的特征得到特征向量;将所述信息指纹和特征向量发送到服务器,并接收服务器反馈的对应所述信息的安全等级;根据所述安全等级识别出所述信息是骚扰信息、诈骗信息或正常信息,并分别对所述信息执行相应处理。本发明通过发送信息指纹到服务器中判断信息的安全等级,可以保护用户隐私,并且服务器中可进行大数据分析,因此,得到的信息的安全等级更准确,并提供对应不同安全等级的多种处理,保证了用户得到最大便利。
Description
技术领域
本发明涉及信息安全技术领域,尤其是一种信息处理方法、系统、移动终端和服务器。
背景技术
现有技术中,移动终端设备经常会收到一些垃圾信息、诈骗信息等恶意信息,这些恶意信息对用户有危害的信息,当用户无法判断这些信息的安全级别时,有可能出现利益损失,给用户和运营商带来了极大的伤害。
而现有技术中对于恶意信息的处理通常是分析发送号码和关键字,需要人工手动编写规则,由于人工参与使处理复杂并且准确性不高。
发明内容
本发明实施例所要解决的一个技术问题是:提供一种自动实现对信息进行拦截的信息处理方法。
本发明实施例提供的一种应用于移动终端的信息处理方法,包括:
接收至少一条信息,基于每条所述信息计算得到至少一个信息指纹,提取每条所述信息的特征得到特征向量;
将所述信息指纹和特征向量发送到服务器,并接收服务器反馈的对应所述信息的安全等级;
根据所述安全等级识别出所述信息是骚扰信息、诈骗信息或正常信息,并分别对所述信息执行相应处理。
基于上述方法的另一实施例中,所述根据所述安全等级对所述信息执行相应处理,包括:
根据不同的安全等级对所述信息执行删除、隔离、提示或保留处理。
基于上述方法的另一实施例中,所述基于一条所述信息计算得到一个信息指纹,包括:
基于所述信息中包含的文本信息和数字信息以及信息的来源信息,计算得到对应所述信息对应的一个信息指纹。
基于上述方法的另一实施例中,所述提取所述信息的特征得到特征向量,包括:
对所述信息进行分词,得到词袋模型向量,获得所述信息所属的主题向量;
将词袋模型向量和主题向量进行组合生成特征向量。
基于上述方法的另一实施例中,所述对所述信息进行分词,得到词袋模型向量,包括:
通过分词器对所述信息进行分词,得到对应所述信息的词袋模型向量;其中,所述分词器是利用分词算法得到的。
基于上述方法的另一实施例中,所述获得所述信息所属的主题向量,包括:
对所述信息进行分词,将得到的所有分词输入LDA模型,得到分别对应每个分词的至少一个概率向量,其中所述概率向量表示其所属主题topic概率;
基于所有所述概率向量和所述LDA模型的主题矩阵计算得到所述信息的主题向量。
基于上述方法的另一实施例中,所述基于所有所述概率向量和所述LDA模型的主题矩阵计算得到所述信息的主题向量,包括:
将所有所述概率向量相加得到和向量,将所述和向量与所述LDA模型的主题矩阵相乘得到所述信息的主题向量。
根据本发明实施例的另一个方面,提供的一种应用于服务器的信息处理方法,包括:
接收移动终端发送的信息指纹和特征向量,将所述信息指纹与安全等级库中预存的所有信息指纹进行匹配;所述安全等级库中存储至少一个已知安全等级的信息指纹;
当所述安全等级库中存在与所述接收的信息指纹匹配的信息指纹,输出所述匹配的信息指纹对应的安全等级到移动终端。
根据本发明实施例的另一个方面,提供的一种移动终端,包括:
信息接收单元,用于接收至少一条信息,基于每条所述信息计算得到至少一个信息指纹,提取每条所述信息的特征得到特征向量;
发送单元,用于将所述信息指纹和特征向量发送到服务器,并接收服务器反馈的对应所述信息的安全等级;
处理单元,用于根据所述安全等级识别出所述信息是骚扰信息、诈骗信息或正常信息,并分别对所述信息执行相应处理。
根据本发明实施例的另一个方面,提供的一种服务器,包括:
接收匹配单元,用于接收移动终端发送的信息指纹和特征向量,将所述信息指纹与安全等级库中预存的所有信息指纹进行匹配;所述安全等级库中存储至少一个已知安全等级的信息指纹;
指纹匹配单元,用于当所述安全等级库中存在与所述接收的信息指纹匹配的信息指纹,输出所述匹配的信息指纹对应的安全等级到移动终端。
根据本发明实施例的另一个方面,提供的一种信息处理系统,包括一个如上所述的服务器和至少一个如上所述的移动终端。
基于本发明上述实施例提供的信息处理方法、系统、移动终端和服务器,通过发送信息指纹到服务器中判断信息的安全等级,可以保护用户隐私,并且服务器中可进行大数据分析,因此,得到的信息的安全等级更准确,并提供对应不同安全等级的多种处理,保证了用户得到最大便利。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
构成说明书的一部分的附图描述了本发明的实施例,并且连同描述一起用于解释本发明的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本发明,其中:
图1为本发明信息处理方法一个实施例的流程图。
图2为本发明移动终端一个实施例的结构示意图。
图3为本发明信息处理方法一个实施例的流程图。
图4为本发明服务器一个实施例的结构示意图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本发明实施例可以应用于计算机系统/服务器,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与计算机系统/服务器一起使用的众所周知的计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、胖客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
计算机系统/服务器可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
图1为本发明信息处理方法一个实施例的流程图。如图1所示,应用于移动终端,该实施例方法包括:
步骤101,接收至少一条信息,基于每条信息计算得到至少一个信息指纹,提取每条信息的特征得到特征向量。
对于移动移动终端来说,通常该信息指短信,短信的内容通常包括文字和数字,通过对短信进行计算得到一个信息指纹,该信息指纹就指代这条短信,对应这条短信的内容和发送号码。可以获得接收到的短信的发送方的电话号码,根据短信发送方的电话号码进行筛选,将陌生联系人发送的短信作为目标短信。在实现时,移动终端设备中的操作系统一般会为应用程序开放一些接口,供应用程序从系统中获取所需的信息。因此,在本发明实施例中,为了能够对通信终端的短信接收情况进行监测,可以在通信终端中运行一应用程序,然后就可以利用通信终端系统的这一特点,在操作系统中对应用程序进行注册。这样,当操作系统广播通知消息时,应用程序就能够收听到这种通知消息,并从中获取所需的信息。例如,当接收短信时,移动终端的操作系统就会广播该短信接收消息,并携带短信发送方的电话号码,这样,应用程序就能够监测到该事件,并从中获取到短信发送方的电话号码。
步骤102,将信息指纹和特征向量发送到服务器,并接收服务器反馈的对应信息的安全等级,其中同一信息的信息指纹和特征向量作为一个整体发送到服务器中。
移动终端设备需要定期向云端服务器上报所接收到的骚扰电话或短信的标识信息。具体地,终端设备上报骚扰电话可以采用两种方式:一种方式是,移动终端设备定期向云端服务器上报所接收到的所有已拨打电话,云端服务器将这些已拨打电话与云端数据库中记录的骚扰电话进行比对,从中提取出属于骚扰电话的已拨打电话;另一种方式是,如果移动终端设备中本地存储有骚扰电话本地数据库,移动终端设备根据该本地数据库识别出骚扰电话,将其上报给云端服务器。需要说明的是,对于以上两种方式的使用不做限制,可以单独应用其中的一个或两个,也可以将上述两种方法结合起来应用。例如,移动终端设备每天或每隔几天上报所接收到的骚扰电话和/或已拨打电话,云端服务器存储移动终端设备上报或自身识别的过去30天内已拨打骚扰电话。当定时时间到达时,云端服务器根据终端设备过去30天内所接收到的骚扰电话从云端数据库中提取与这些已拨打骚扰电话相关的骚扰电话。
在具体示例中,可以对骚扰电话列表进行升级,以提升骚扰电话列表(即骚扰短信黑名单)的时效性,其中,升级过程为:云端服务器每隔一段定时时间从云端数据库提取一次骚扰短信号码列表,然后再下发给移动终端设备。举例来说,设移动终端设备每天做一次骚扰电话列表的升级,对应的云端服务器每天提取一次最新的骚扰短信号码列表。比如,将每天晚上12点设为定时时间,云端服务器在该定时时间到达时,自动进行骚扰电话列表的提取。
步骤103,根据安全等级识别出信息是骚扰信息、诈骗信息或正常信息,并分别对信息执行相应处理。
识别该信息是否是骚扰信息或诈骗信息可以通过分类模型进行判断,所述分类模型的训练过程包括:收集多条已知诈骗短信作为训练样本,获取每条已知诈骗短信对应的特征向量和所属的诈骗类别,其中,每条已知诈骗短信对应的特征向量即为该训练样本的特征,每条已知诈骗短信所属的诈骗类别即为该训练样本的标签;根据多个训练样本的特征和标签进行训练,生成多分类模型,该多分类模型反映了每种诈骗类别与其他诈骗类别之间的划分界限。
基于生成的多分类模型,当接收到未知短信时,将该未知短信作为待预测数据,该未知短信对应的特征向量即为该待预测数据的特征,将待预测数据的特征输入到分类模型中,得到待预测数据的标签,即确定出未知短信是否为诈骗短信,以及当确定是诈骗短信是确定其所属的诈骗类别。
基于本发明上述实施例提供的信息处理方法,通过发送信息指纹到服务器中判断信息的安全等级,可以保护用户隐私,并且服务器中可进行大数据分析,因此,得到的信息的安全等级更准确,并提供对应不同安全等级的多种处理,保证了用户得到最大便利。
在上述信息处理方法实施例的一个具体示例中,上述步骤103对信息的处理方式可以包括:根据不同的安全等级对信息执行删除、隔离、提示或保留处理。
通常对于安全等级可以分三类或四类,三类包括安全、可疑和危险,对于这三类的处理方式可以包括:对安全级别的信息通常采用保留处理;对于可疑级别的信息(如骚扰短信或不明号码短信)可以采用隔离或提示用户处理的方式,用户可根据自身需求对该信息进行处理;对于危险级别的信息(如诈骗短信或病毒信息),通常的处理方式是删除,以保证用户的利益不受损害。而分成四类的情况下包括:安全、一般、可疑和危险,对于安全级别可疑级别和危险级别的信息的处理方式同三类安全等级的处理方式,对于一般级别的信息(如推销短信、通知信息),通常采用提示的方式,用户可以根据需要选择保留或删除。以上只是根据现有技术常见的几种类型的短信对信息的安全级别进行分类,并不用于限制本发明方法中的级别分类,本发明方法可根据实际情况改进分成更多或更少的安全级别,以便于根据不同的安全级别进行相应的处理。
在上述信息处理方法实施例的一个具体示例中,上述步骤101中基于信息计算信息指纹的过程可以包括:
基于信息中包含的文本信息和数字信息以及信息的来源信息,计算得到对应信息对应的一个信息指纹。
通常情况下,本发明所指信息为短信,短信的内容通常包括文本信息和数字信息,及其发送短信的号码信息,基于文本信息、数字信息和号码信息通过计算得到一个唯一对应该信息的信息指纹,其中采用的计算方法可以是现有技术中可以实现该步骤的任意一种方法。
本发明信息处理方法的另一个实施例中,在上述实施例的基础上,步骤101中提取信息的特征得到特征向量的过程可以包括:
对信息进行分词,得到词袋模型向量,获得信息所属的主题向量;
将词袋模型向量和主题向量进行组合生成特征向量。
在本实施例中,通过分词算法对信息进行分词,分词后直接得到该短信的一个词袋模型向量,并基于模型获得信息所述的主题向量,将词袋模型向量和主题向量组合即可获得特征向量,这个特征向量就可以表示该信息具有的特征,通过获得的特征向量在服务器中就可以分析对应信息的安全级别。
在上述信息处理方法实施例的一个具体示例中,对所述信息进行分词,得到词袋模型向量的具体过程可以包括:
通过分词器对信息进行分词,得到对应信息的词袋模型向量;其中,分词器是利用分词算法得到的。
本发明实施例可以采用Liblinear(线性分类库)构造多分类的短信分类器,或者采用Libsvm(支持向量机分类库)构造多分类的短信分类器。进一步,在采用Liblinear构造多分类的短信分类器时,可以调用Liblinear中的动态分类库,利用调用的动态分类库构造多分类的短信分类器,从而实现了从二类分类模型到多类分类模型的构造。
在上述信息处理方法实施例的一个具体示例中,获得信息所属的主题向量,包括:
对信息进行分词,将得到的所有分词输入LDA语义主题生成模型,得到分别对应每个分词的至少一个概率向量,其中概率向量表示其所属主题topic概率;
基于所有概率向量和LDA语义主题生成模型的主题矩阵计算得到信息的主题向量。
在具体应用中,信息通常指短信,该对短信分词的过程结合自然语言处理的算法,利用分词算法中的条件随机场算法得到一个分词器,短信和收集的语料都通过该分词器进行分词;分词后的直接得到该短信的一个词袋模型向量;同时通过LDA(Latent DirichletAllocation,语义主题生成模型)获得目标短信所属的主题向量即主题。将传统的词袋模型向量与主题向量进行组合生成新的向量特征,所有这些特征输入分类模块,将会得到一个分类模型;为了解决垃圾短信、诈骗短信危害程度不同,将得到用于不同危害程度识别的模型。
本申请实施例中采用预置的短信分类规则构造多分类短信分类模型时,可以采用Libsvm(支持向量机分类库)构造多分类的短信分类模型,也可以采用Liblinear(线性分类库)构造多分类的短信分类模型。在采用Liblinear构造多分类的短信分类模型时,可以调用Liblinear中的动态分类库,利用调用的动态分类库构造多分类的短信分类模型,从而实现了从二类分类模型到多类分类模型的构造。
短信分类模型为多分类,可以包含诈骗类、房产中介类、广告推销类、教育培训类、商家促销类、保险类等等。短信分类模型中各个参数依据短信的分词、词向量及主题向量等属性特征进行设置。具体的,可以根据各个分词出现在各个分类中的概率来设置各个参数,例如,收集“教育”出现在教育培训类的短信中概率为70%、出现在诈骗短信中的概率为20%,那么可以根据这个概率进行参数设置。根据词向量与各分类的参考词向量之间的余弦相似度来设置各个参数,参考词向量通过分类中关键分词的词向量与语料词矩阵获得,具体计算方法与短信的词向量相同。根据主题向量与各分类的参考主题向量之间的余弦相似度来设置各个参数,参考主题向量通过分类中包含的关键分词输入LDA模型获得。
在上述信息处理方法实施例的一个具体示例中,基于所有概率向量和LDA模型的主题矩阵计算得到信息的主题向量的过程可以包括:
将所有概率向量相加得到和向量,将和向量与LDA模型的主题矩阵相乘得到信息的主题向量。
具体应用过程中,通过LDA模型获得短信(信息)所属主题具体流程,将目标短信的所有分词输入LDA模型,LDA模型会对应每个分词获得表示其所属主题topic概率的向量,然后将输入的所有分词的表示其所属主题topic概率的向量相加,再将相加得到的向量与LDA模型的主题矩阵相乘获得目标短信的主题向量并输出。例如:假设LDA模型的主题矩阵为10*100的矩阵T1,若目标短信的有10个分词,m1~m10分别表示这10个分词所属主题topic概率的向量,将m1*m2*…m10相加然后再与主题矩阵T1相乘获得目标短信的主题向量,即目标短信的主题向量等于(m1+m2+…m10)*T1。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图2为本发明移动终端一个实施例的结构示意图。该实施例的移动终端可用于实现本发明上述各方法实施例。如图2所示,该实施例的移动终端包括:
信息接收单元21,用于接收至少一条信息,基于每条信息计算得到至少一个信息指纹,提取每条信息的特征得到特征向量;
发送单元22,用于将信息指纹和特征向量发送到服务器,并接收服务器反馈的对应信息的安全等级;
处理单元23,用于根据安全等级识别出信息是骚扰信息、诈骗信息或正常信息,并分别对信息执行相应处理。
基于本发明上述实施例提供的移动终端,通过发送信息指纹到服务器中判断信息的安全等级,可以保护用户隐私,并且服务器中可进行大数据分析,因此,得到的信息的安全等级更准确,并提供对应不同安全等级的多种处理,保证了用户得到最大便利。
在上述移动终端实施例的一个具体示例中,处理单元23具有用于,根据不同的安全等级对信息执行删除、隔离、提示或保留处理。
在上述移动终端实施例的一个具体示例中,信息接收单元21包括指纹模块,用于基于信息中包含的文本信息和数字信息以及信息的来源信息,计算得到对应所述信息对应的一个信息指纹。
本发明移动终端的另一个实施例中,在上述实施例的基础上,信息接收单元21包括:
主题向量模块,用于对信息进行分词,得到词袋模型向量,获得信息所属的主题向量;
特征向量模块,用于将词袋模型向量和主题向量进行组合生成特征向量。
在本实施例中,通过分词算法对信息进行分词,,分词后直接得到该短信的一个词袋模型向量,并基于模型获得信息所述的主题向量,将词袋模型向量和主题向量组合即可获得特征向量,这个特征向量就可以表示该信息具有的特征,通过获得的特征向量在服务器中就可以分析对应信息的安全级别。
在上述移动终端实施例的一个具体示例中,主题向量模块具体用于,通过分词器对信息进行分词,得到对应信息的词袋模型向量;其中,分词器是利用分词算法得到的。
在上述移动终端实施例的一个具体示例中,特征向量模块包括:
分词模块,用于对信息进行分词,将得到的所有分词输入LDA模型,得到分别对应每个分词的至少一个概率向量,其中概率向量表示其所属主题topic概率;
计算模块,用于基于所有概率向量和LDA模型的主题矩阵计算得到信息的主题向量。
在上述移动终端实施例的一个具体示例中,计算模块具有用于,将所有概率向量相加得到和向量,将和向量与LDA模型的主题矩阵相乘得到信息的主题向量。
本发明还提供了一种应用于服务器的信息处理方法,图3为本发明信息处理方法一个实施例的流程图。如图3所示,该实施例方法包括:
步骤301,接收移动终端发送的信息指纹和特征向量;
步骤302,将信息指纹与安全等级库中预存的所有信息指纹进行匹配,如果存在匹配,执行步骤303。
其中,安全等级库中存储至少一个已知安全等级的信息指纹。
步骤303,输出匹配的信息指纹对应的安全等级到移动终端。
基于本发明上述实施例提供的信息处理方法,服务器根据接收的信息指纹与安全等级库中预存的信息指纹进行匹配,根据安全等级库中匹配的信息指纹获得接收的信息指纹对应的安全等级,并将得到的安全等级反馈到移动终端,解决了快速自动识别信息的安全级别的问题。
在上述信息处理方法实施例的一个具体示例中,当步骤302中,当判断安全等级库中不存在与接收的信息指纹匹配的信息指纹时,本发明方法还包括:
步骤304,将特征向量与恶意特征库中预存的所有恶意特征向量进行匹配,如果恶意特征库中存在与特征向量匹配的恶意特征向量,执行305。
其中,恶意特征库中存储至少一个已知安全等级的恶意特征向量。
步骤305,输出对应恶意特征向量的安全等级到移动终端。
在上述信息处理方法实施例的一个具体示例中,当步骤304中,当判断恶意特征库中不存在与特征向量匹配的恶意特征向量时,本发明方法还包括:
步骤306,将特征向量输入等级预测模型,输出对应特征向量的安全等级到移动终端。
为了有效的保护用户隐私在移动终端对服务器进行查询的时候,本发明提出了基于信息指纹加恶意特征(特征向量)组合的查询方式。在移动终端接收到一条短信的时候,提取里面的URL、数字等关键特征、同时会对文本计算一个信息指纹,然后将信息指纹和特征向量发送到服务器进行比对。如果安全等级库中记录了相关的信息指纹,就直接下发安全等级到移动终端。经过长期的积累,安全等级库中累计超过百亿的信息指纹及其对应的安全级别数据。本实施例方法对短信中存在的数字,特别是电话号码、QQ号码、银行卡号会抽取作为可疑对象进行分析。利用短信发送与接收对象的分布特征、时间特征、发送量等特征建立模型,从而识别诈骗电话、诈骗QQ、诈骗银行卡号。短信在进行SimHash查询阶段,会在指纹查询后,查询这些号码是否为诈骗号码,从而给出判定等级。再之后,会结合短信的其它可疑特征,如短信接入基站变化等特征带入模型进行预测从而给出判定等级。对于每天的云查请求,建立了实时和离线两个流程进行更新。不断的补充和完善线上的指纹库、恶意特征库。
本发明信息处理方法的另一个实施例中,在上述实施例的基础上,本实施例方法包括:安全等级库中存储至少一条安全条目,每条安全条目中保存一个信息指纹和信息指纹对应的安全等级;
本实施例方法还包括:
当安全等级库中不存在与接收的信息指纹匹配的信息指纹,通过处理得到信息指纹的安全等级后,在安全等级库中为信息指纹建立一条安全条目,安全条目中保存信息指纹和处理得到的安全等级。
本实施例中实现了对安全等级库在运行过程中的实时更新,此更新维护无需人为操纵,而是通过在运行过程中自动生成的,当下次接收到同样的信息指纹时将能够直接从安全等级库中获得安全级别,使安全等级库更新后的适用范围更广。
本发明信息处理方法的还一个实施例中,在上述实施例的基础上,本实施例方法包括:恶意特征库中存储至少一条特征条目,每条特征条目中保存一个恶意特征和恶意特征对应的安全等级;
本实施例方法还包括:
当恶意特征库中不存在与特征向量匹配的恶意特征向量,通过处理得到特征向量的安全等级后,在恶意特征库中为特征向量建立一条特征条目,特征条目中保存特征向量和处理得到的安全等级。
本实施例中实现了对恶意特征库在运行过程中的实时更新,此更新维护无需人为操纵,而是通过在运行过程中自动生成的,当下次接收到同样的信息指纹时将能够直接从恶意特征库中获得安全级别,使恶意特征库更新后的适用范围更广。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图4为本发明服务器一个实施例的结构示意图。该实施例的服务器可用于实现本发明上述各方法实施例。如图4所示,该实施例的服务器包括:
接收匹配单元41,用于接收移动终端发送的信息指纹和特征向量,将信息指纹与安全等级库中预存的所有信息指纹进行匹配;其中,安全等级库中存储至少一个已知安全等级的信息指纹;
指纹匹配单元42,用于当安全等级库中存在与接收的信息指纹匹配的信息指纹,输出匹配的信息指纹对应的安全等级到移动终端。
基于本发明上述实施例提供的服务器,根据接收的信息指纹与安全等级库中预存的信息指纹进行匹配,根据安全等级库中匹配的信息指纹获得接收的信息指纹对应的安全等级,并将得到的安全等级反馈到移动终端,解决了快速自动识别信息的安全级别的问题。
在上述服务器实施例的一个具体示例中,还包括向量匹配单元43,用于当安全等级库中不存在与接收的信息指纹匹配的信息指纹,将特征向量与恶意特征库中预存的所有恶意特征向量进行匹配;其中,恶意特征库中存储至少一个已知安全等级的恶意特征向量;
向量判断单元44,用于当恶意特征库中存在与特征向量匹配的恶意特征向量,输出对应恶意特征向量的安全等级到移动终端。
在上述服务器实施例的一个具体示例中,还包括模型预测单元45,用于当恶意特征库中不存在与特征向量匹配的恶意特征向量,将特征向量输入等级预测模型,输出对应特征向量的安全等级到移动终端。
本发明服务器的另一个实施例中,在上述实施例的基础上,本实施例服务器包括:安全等级库中存储至少一条安全条目,每条安全条目中保存一个信息指纹和信息指纹对应的安全等级;
本服务器还包括:
等级库更新单元,用于当安全等级库中不存在与接收的信息指纹匹配的信息指纹,通过处理得到信息指纹的安全等级后,在安全等级库中为信息指纹建立一条安全条目,安全条目中保存信息指纹和处理得到的安全等级。
本实施例中实现了对安全等级库在运行过程中的实时更新,此更新维护无需人为操纵,而是通过在运行过程中自动生成的,当下次接收到同样的信息指纹时将能够直接从安全等级库中获得安全级别,使安全等级库更新后的适用范围更广。
本发明服务器的还一个实施例中,在上述实施例的基础上,本实施例服务器包括:恶意特征库中存储至少一条特征条目,每条特征条目中保存一个恶意特征和恶意特征对应的安全等级;
本服务器还包括:
特征库更新单元,用于当恶意特征库中不存在与特征向量匹配的恶意特征向量,通过处理得到特征向量的安全等级后,在恶意特征库中为特征向量建立一条特征条目,特征条目中保存特征向量和处理得到的安全等级。
本实施例中实现了对恶意特征库在运行过程中的实时更新,此更新维护无需人为操纵,而是通过在运行过程中自动生成的,当下次接收到同样的信息指纹时将能够直接从恶意特征库中获得安全级别,使恶意特征库更新后的适用范围更广。
根据本发明实施例的另一个方面,提供的一种信息处理系统,包括一个上述任意一个实施例所述的服务器和至少一个上述任意一个实施例所述的移动终端。
本实施例提供的信息处理系统,利用海量大数据平台,结合智能机器学习算法,将短信拦截由传统的发送号码加关键字提升为机器学习的拦截方式,彻底改变原来人工手动编写规则的局面。系统利用用户举报的短信,结合自然语言处理,机器学习的相关技术,训练得到一个识别垃圾短信、诈骗短信的模型,称为智能识别模型;机器学习也会结合短信中诈骗分子常用的诈骗手段,收集并建立恶意URL、恶意号码库;为了保护用户隐式,用户与云端交换的是恶意特征,以及短信指纹,移动终端程序计算出短信指纹、提取短信恶意特征,到云端就可以直接查询该短信是否是垃圾短信、诈骗短信。
1、一种信息处理方法,应用于移动终端,包括:
接收至少一条信息,基于每条所述信息计算得到至少一个信息指纹,提取每条所述信息的特征得到特征向量;
将所述信息指纹和特征向量发送到服务器,并接收服务器反馈的对应所述信息的安全等级;
根据所述安全等级识别出所述信息是骚扰信息、诈骗信息或正常信息,并分别对所述信息执行相应处理。
2、根据1所述的方法,所述根据所述安全等级对所述信息执行相应处理,包括:
根据不同的安全等级对所述信息执行删除、隔离、提示或保留处理。
3、根据1或2所述的方法,所述基于一条所述信息计算得到一个信息指纹,包括:
基于所述信息中包含的文本信息和数字信息以及信息的来源信息,计算得到对应所述信息对应的一个信息指纹。
4、根据1至3任意一项所述的方法,所述提取所述信息的特征得到特征向量,包括:
对所述信息进行分词,得到词袋模型向量,获得所述信息所属的主题向量;
将词袋模型向量和主题向量进行组合生成特征向量。
5、根据4所述的方法,所述对所述信息进行分词,得到词袋模型向量,包括:
通过分词器对所述信息进行分词,得到对应所述信息的词袋模型向量;其中,所述分词器是利用分词算法得到的。
6、根据4或5所述的方法,所述获得所述信息所属的主题向量,包括:
对所述信息进行分词,将得到的所有分词输入LDA模型,得到分别对应每个分词的至少一个概率向量,其中所述概率向量表示其所属主题topic概率;
基于所有所述概率向量和所述LDA模型的主题矩阵计算得到所述信息的主题向量。
7、根据6所述的方法,所述基于所有所述概率向量和所述LDA模型的主题矩阵计算得到所述信息的主题向量,包括:
将所有所述概率向量相加得到和向量,将所述和向量与所述LDA模型的主题矩阵相乘得到所述信息的主题向量。
8、一种信息处理方法,应用于服务器,包括:
接收移动终端发送的信息指纹和特征向量,将所述信息指纹与安全等级库中预存的所有信息指纹进行匹配;所述安全等级库中存储至少一个已知安全等级的信息指纹;
当所述安全等级库中存在与所述接收的信息指纹匹配的信息指纹,输出所述匹配的信息指纹对应的安全等级到移动终端。
9、根据8所述的方法,还包括:
当安全等级库中不存在与所述接收的信息指纹匹配的信息指纹,将所述特征向量与恶意特征库中预存的所有恶意特征向量进行匹配;所述恶意特征库中存储至少一个已知安全等级的恶意特征向量;
当所述恶意特征库中存在与所述特征向量匹配的恶意特征向量,输出对应所述恶意特征向量的安全等级到移动终端。
10、根据9所述的方法,还包括:
当所述恶意特征库中不存在与所述特征向量匹配的恶意特征向量,将所述特征向量输入等级预测模型,输出对应所述特征向量的安全等级到移动终端。
11、根据8至10任意一项所述的方法,所述安全等级库中存储至少一条安全条目,每条所述安全条目中保存一个信息指纹和所述信息指纹对应的安全等级;
本方法还包括:
当安全等级库中不存在与所述接收的信息指纹匹配的信息指纹,通过处理得到所述信息指纹的安全等级后,在所述安全等级库中为所述信息指纹建立一条安全条目,所述安全条目中保存所述信息指纹和处理得到的安全等级。
12、根据9或10所述的方法,所述恶意特征库中存储至少一条特征条目,每条所述特征条目中保存一个恶意特征和所述恶意特征对应的安全等级;
本方法还包括:
当所述恶意特征库中不存在与所述特征向量匹配的恶意特征向量,通过处理得到所述特征向量的安全等级后,在所述恶意特征库中为所述特征向量建立一条特征条目,所述特征条目中保存所述特征向量和处理得到的安全等级。
13、一种移动终端,包括:
信息接收单元,用于接收至少一条信息,基于每条所述信息计算得到至少一个信息指纹,提取每条所述信息的特征得到特征向量;
发送单元,用于将所述信息指纹和特征向量发送到服务器,并接收服务器反馈的对应所述信息的安全等级;
处理单元,用于根据所述安全等级识别出所述信息是骚扰信息、诈骗信息或正常信息,并分别对所述信息执行相应处理。
14、根据13所述的移动终端,所述处理单元具有用于,根据不同的安全等级对所述信息执行删除、隔离、提示或保留处理。
15、根据13或14所述的移动终端,所述信息接收单元包括指纹模块,用于基于所述信息中包含的文本信息和数字信息以及信息的来源信息,计算得到对应所述信息对应的一个信息指纹。
16、根据13至15任意一项所述的移动终端,所述信息接收单元包括:
主题向量模块,用于对所述信息进行分词,得到词袋模型向量,获得所述信息所属的主题向量;
特征向量模块,用于将词袋模型向量和主题向量进行组合生成特征向量。
17、根据16所述的移动终端,所述主题向量模块具体用于,通过分词器对所述信息进行分词,得到对应所述信息的词袋模型向量;其中,所述分词器是利用分词算法得到的。
18、根据16或17所述的移动终端,所述特征向量模块包括:
分词模块,用于对所述信息进行分词,将得到的所有分词输入LDA模型,得到分别对应每个分词的至少一个概率向量,其中所述概率向量表示其所属主题topic概率;
计算模块,用于基于所有所述概率向量和所述LDA模型的主题矩阵计算得到所述信息的主题向量。
19、根据18所述的移动终端,所述计算模块具有用于,将所有所述概率向量相加得到和向量,将所述和向量与所述LDA模型的主题矩阵相乘得到所述信息的主题向量。
20、一种服务器,包括:
接收匹配单元,用于接收移动终端发送的信息指纹和特征向量,将所述信息指纹与安全等级库中预存的所有信息指纹进行匹配;所述安全等级库中存储至少一个已知安全等级的信息指纹;
指纹匹配单元,用于当所述安全等级库中存在与所述接收的信息指纹匹配的信息指纹,输出所述匹配的信息指纹对应的安全等级到移动终端。
21、根据20所述的服务器,还包括向量匹配单元,用于当安全等级库中不存在与所述接收的信息指纹匹配的信息指纹,将所述特征向量与所述恶意特征库中预存的所有恶意特征向量进行匹配;所述恶意特征库中存储至少一个已知安全等级的恶意特征向量;
向量判断单元,用于当所述恶意特征库中存在与所述特征向量匹配的恶意特征向量,输出对应所述恶意特征向量的安全等级到移动终端。
22、根据21所述的服务器,还包括模型预测单元,用于当所述恶意特征库中不存在与所述特征向量匹配的恶意特征向量,将所述特征向量输入等级预测模型,输出对应所述特征向量的安全等级到移动终端。
23、根据20至22任意一项所述的服务器,所述安全等级库中存储至少一条安全条目,每条所述安全条目中保存一个信息指纹和所述信息指纹对应的安全等级;
本服务器还包括:
等级库更新单元,用于当安全等级库中不存在与所述接收的信息指纹匹配的信息指纹,通过处理得到所述信息指纹的安全等级后,在所述安全等级库中为所述信息指纹建立一条安全条目,所述安全条目中保存所述信息指纹和处理得到的安全等级。
24、根据21或22所述的服务器,所述恶意特征库中存储至少一条特征条目,每条所述特征条目中保存一个恶意特征和所述恶意特征对应的安全等级;
本服务器还包括:
特征库更新单元,用于当所述恶意特征库中不存在与所述特征向量匹配的恶意特征向量,通过处理得到所述特征向量的安全等级后,在所述恶意特征库中为所述特征向量建立一条特征条目,所述特征条目中保存所述特征向量和处理得到的安全等级。
25、一种信息处理系统,包括一个如20至24任意一项所述的服务器和至少一个如13至19任意一项所述的移动终端。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
可能以许多方式来实现本发明的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。
本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。
Claims (10)
1.一种信息处理方法,其特征在于,应用于移动终端,包括:
接收至少一条信息,基于每条所述信息计算得到至少一个信息指纹,提取每条所述信息的特征得到特征向量;
将所述信息指纹和特征向量发送到服务器,并接收服务器反馈的对应所述信息的安全等级;
根据所述安全等级识别出所述信息是骚扰信息、诈骗信息或正常信息,并分别对所述信息执行相应处理。
2.根据权利要求1所述的方法,其特征在于,所述根据所述安全等级对所述信息执行相应处理,包括:
根据不同的安全等级对所述信息执行删除、隔离、提示或保留处理。
3.根据权利要求1或2所述的方法,其特征在于,所述基于一条所述信息计算得到一个信息指纹,包括:
基于所述信息中包含的文本信息和数字信息以及信息的来源信息,计算得到对应所述信息对应的一个信息指纹。
4.根据权利要求1至3任意一项所述的方法,其特征在于,所述提取所述信息的特征得到特征向量,包括:
对所述信息进行分词,得到词袋模型向量,获得所述信息所属的主题向量;
将词袋模型向量和主题向量进行组合生成特征向量。
5.根据权利要求4所述的方法,其特征在于,所述对所述信息进行分词,得到词袋模型向量,包括:
通过分词器对所述信息进行分词,得到对应所述信息的词袋模型向量;其中,所述分词器是利用分词算法得到的。
6.根据权利要求4或5所述的方法,其特征在于,所述获得所述信息所属的主题向量,包括:
对所述信息进行分词,将得到的所有分词输入LDA模型,得到分别对应每个分词的至少一个概率向量,其中所述概率向量表示其所属主题topic概率;
基于所有所述概率向量和所述LDA模型的主题矩阵计算得到所述信息的主题向量。
7.一种信息处理方法,其特征在于,应用于服务器,包括:
接收移动终端发送的信息指纹和特征向量,将所述信息指纹与安全等级库中预存的所有信息指纹进行匹配;所述安全等级库中存储至少一个已知安全等级的信息指纹;
当所述安全等级库中存在与所述接收的信息指纹匹配的信息指纹,输出所述匹配的信息指纹对应的安全等级到移动终端。
8.一种移动终端,其特征在于,包括:
信息接收单元,用于接收至少一条信息,基于每条所述信息计算得到至少一个信息指纹,提取每条所述信息的特征得到特征向量;
发送单元,用于将所述信息指纹和特征向量发送到服务器,并接收服务器反馈的对应所述信息的安全等级;
处理单元,用于根据所述安全等级识别出所述信息是骚扰信息、诈骗信息或正常信息,并分别对所述信息执行相应处理。
9.一种服务器,其特征在于,包括:
接收匹配单元,用于接收移动终端发送的信息指纹和特征向量,将所述信息指纹与安全等级库中预存的所有信息指纹进行匹配;所述安全等级库中存储至少一个已知安全等级的信息指纹;
指纹匹配单元,用于当所述安全等级库中存在与所述接收的信息指纹匹配的信息指纹,输出所述匹配的信息指纹对应的安全等级到移动终端。
10.一种信息处理系统,其特征在于,包括一个如权利要求9所述的服务器和至少一个如权利要求8所述的移动终端。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710297050.4A CN106878347A (zh) | 2017-04-28 | 2017-04-28 | 信息处理方法、系统、移动终端和服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710297050.4A CN106878347A (zh) | 2017-04-28 | 2017-04-28 | 信息处理方法、系统、移动终端和服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106878347A true CN106878347A (zh) | 2017-06-20 |
Family
ID=59161284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710297050.4A Pending CN106878347A (zh) | 2017-04-28 | 2017-04-28 | 信息处理方法、系统、移动终端和服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106878347A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107135314A (zh) * | 2017-06-21 | 2017-09-05 | 北京奇虎科技有限公司 | 骚扰短信的检测方法、系统、移动终端和服务器 |
CN109462582A (zh) * | 2018-10-30 | 2019-03-12 | 腾讯科技(深圳)有限公司 | 文本识别方法、装置、服务器及存储介质 |
CN109544904A (zh) * | 2018-12-29 | 2019-03-29 | 上海易点时空网络有限公司 | 用于违章的信息处理方法及装置、服务器 |
CN109885826A (zh) * | 2019-01-07 | 2019-06-14 | 平安科技(深圳)有限公司 | 文本词向量获取方法、装置、计算机设备及存储介质 |
WO2020052547A1 (zh) * | 2018-09-14 | 2020-03-19 | 阿里巴巴集团控股有限公司 | 短信垃圾新词识别方法、装置及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101902523A (zh) * | 2010-07-09 | 2010-12-01 | 中兴通讯股份有限公司 | 一种移动终端及其短信的过滤方法 |
CN104462062A (zh) * | 2014-12-11 | 2015-03-25 | 珠海金山网络游戏科技有限公司 | 一种文本反垃圾的方法 |
CN104982011A (zh) * | 2013-03-08 | 2015-10-14 | 比特梵德知识产权管理有限公司 | 使用多尺度文本指纹的文档分类 |
CN105516499A (zh) * | 2015-12-14 | 2016-04-20 | 北京奇虎科技有限公司 | 一种对短信进行分类的方法、装置、通信终端及服务器 |
CN105704685A (zh) * | 2014-11-25 | 2016-06-22 | 中兴通讯股份有限公司 | 一种短信安全处理方法及装置 |
CN105959926A (zh) * | 2016-07-15 | 2016-09-21 | 北京奇虎科技有限公司 | 垃圾短信的过滤方法及过滤装置 |
-
2017
- 2017-04-28 CN CN201710297050.4A patent/CN106878347A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101902523A (zh) * | 2010-07-09 | 2010-12-01 | 中兴通讯股份有限公司 | 一种移动终端及其短信的过滤方法 |
CN104982011A (zh) * | 2013-03-08 | 2015-10-14 | 比特梵德知识产权管理有限公司 | 使用多尺度文本指纹的文档分类 |
CN105704685A (zh) * | 2014-11-25 | 2016-06-22 | 中兴通讯股份有限公司 | 一种短信安全处理方法及装置 |
CN104462062A (zh) * | 2014-12-11 | 2015-03-25 | 珠海金山网络游戏科技有限公司 | 一种文本反垃圾的方法 |
CN105516499A (zh) * | 2015-12-14 | 2016-04-20 | 北京奇虎科技有限公司 | 一种对短信进行分类的方法、装置、通信终端及服务器 |
CN105959926A (zh) * | 2016-07-15 | 2016-09-21 | 北京奇虎科技有限公司 | 垃圾短信的过滤方法及过滤装置 |
Non-Patent Citations (1)
Title |
---|
王丽娜,张焕国: "《信息隐藏技术与应用》", 31 May 2012 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107135314A (zh) * | 2017-06-21 | 2017-09-05 | 北京奇虎科技有限公司 | 骚扰短信的检测方法、系统、移动终端和服务器 |
WO2020052547A1 (zh) * | 2018-09-14 | 2020-03-19 | 阿里巴巴集团控股有限公司 | 短信垃圾新词识别方法、装置及电子设备 |
CN110909540A (zh) * | 2018-09-14 | 2020-03-24 | 阿里巴巴集团控股有限公司 | 短信垃圾新词识别方法、装置及电子设备 |
CN109462582A (zh) * | 2018-10-30 | 2019-03-12 | 腾讯科技(深圳)有限公司 | 文本识别方法、装置、服务器及存储介质 |
CN109462582B (zh) * | 2018-10-30 | 2020-11-20 | 腾讯科技(深圳)有限公司 | 文本识别方法、装置、服务器及存储介质 |
CN109544904A (zh) * | 2018-12-29 | 2019-03-29 | 上海易点时空网络有限公司 | 用于违章的信息处理方法及装置、服务器 |
CN109885826A (zh) * | 2019-01-07 | 2019-06-14 | 平安科技(深圳)有限公司 | 文本词向量获取方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Abdulhamid et al. | A review on mobile SMS spam filtering techniques | |
CN107566358B (zh) | 一种风险预警提示方法、装置、介质及设备 | |
US11063897B2 (en) | Method and system for analyzing electronic communications and customer information to recognize and mitigate message-based attacks | |
Ismail et al. | Efficient E‐Mail Spam Detection Strategy Using Genetic Decision Tree Processing with NLP Features | |
US8112484B1 (en) | Apparatus and method for auxiliary classification for generating features for a spam filtering model | |
US8489689B1 (en) | Apparatus and method for obfuscation detection within a spam filtering model | |
US20190163742A1 (en) | Method and apparatus for generating information | |
CN106878347A (zh) | 信息处理方法、系统、移动终端和服务器 | |
CN113011889B (zh) | 账号异常识别方法、系统、装置、设备及介质 | |
CN107943791A (zh) | 一种垃圾短信的识别方法、装置和移动终端 | |
US11481475B2 (en) | Computer-based systems configured for automated computer script analysis and malware detection and methods thereof | |
CN107135314A (zh) | 骚扰短信的检测方法、系统、移动终端和服务器 | |
US10956522B1 (en) | Regular expression generation and screening of textual items | |
CN107517463A (zh) | 一种电话号码的识别方法和装置 | |
CN112039874B (zh) | 一种恶意邮件的识别方法及装置 | |
Sajedi et al. | Sms spam filtering using machine learning techniques: A survey | |
CN105792152B (zh) | 伪基站短信识别方法和装置 | |
US20230246988A1 (en) | Bulk Messaging Detection and Enforcement | |
CN111680161A (zh) | 一种文本处理方法、设备以及计算机可读存储介质 | |
CN116150349A (zh) | 一种数据产品安全合规性检查方法、装置及服务器 | |
CN107644106B (zh) | 自动挖掘业务中间人的方法、终端设备及存储介质 | |
CN113704328B (zh) | 基于人工智能的用户行为大数据挖掘方法及系统 | |
CN112995414A (zh) | 基于语音通话的行为质检方法、装置、设备及存储介质 | |
CN114499980A (zh) | 一种钓鱼邮件检测方法、装置、设备及存储介质 | |
CN111259207A (zh) | 短信的识别方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170620 |