CN116881408A - 基于ocr和nlp的视觉问答防诈骗方法及系统 - Google Patents
基于ocr和nlp的视觉问答防诈骗方法及系统 Download PDFInfo
- Publication number
- CN116881408A CN116881408A CN202310474319.7A CN202310474319A CN116881408A CN 116881408 A CN116881408 A CN 116881408A CN 202310474319 A CN202310474319 A CN 202310474319A CN 116881408 A CN116881408 A CN 116881408A
- Authority
- CN
- China
- Prior art keywords
- information
- text
- nlp
- ocr
- fraud
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了一种基于OCR和NLP的视觉问答防诈骗方法及系统,属于数据处理技术领域,包括:S1、获取目标图片;S2、使用OCR提取图片中的文本;S3、对提取到的文本进行整合排版;S4、对得到的整合文本信息进行数据清洗;S5、利用NLP进行诈骗信息识别;S501、提取整合文本的文本信息,将文本信息中的关键信息进行语义抽取;S502、对文本信息中的关键信息进行信息整合,与语料库中的诈骗信息进行信息匹配,得到诈骗信息语义匹配结果;S6、根据匹配结果,进行结果输出。本发明将目标检测算法同文字识别结合,提取出文字内容,将文字内容输入NLP中进行语义抽取,与相关诈骗信息进行匹配,得到是否是欺诈信息的结果。
Description
技术领域
本发明属于数据处理技术领域,具体涉及一种基于OCR和NLP的视觉问答防诈骗方法及系统。
背景技术
目前的防诈骗技术主要通过钓鱼站点域名、发送欺诈信息的账号与手机号等信息,可以通过黑名单来进行简单有效的监管和防御。
然而对于未记录在案的欺诈,传统手段难以进行有效防御。随着机器学习技术的发展,通过机器学习技术发掘欺诈行为信息来源和信息内容的特征,作出实时、连续的准确判断,是目前欺诈检测手段的主要研究方向。
目前的主要手段如下:
1)通过电话检测手段;
目前的诈骗分子大多通过手机端电话,使用提前准备好的话术对号主进行欺诈。然而研究发现,类似的行为可以被检测,即将某种异常号码进行判定,对此异常号码之后的行为进行检查,若发现异常则及时对之后的用户发出预警。
2)非法钓鱼网站检测手段;
不法分子还会通过手机短信的形式,告知用户中奖了或者银行卡冻结了,随后让用户上他们的网站填写相关信息以及获取验证码。而就在这时,诈骗分子会截取信息内容,通过时间差将受害者的银行卡中的钱全部取出。对于此手段,目前的方案主要是针对异常的网站进行检测,将异常网站公布到相关平台中,通过相关平台的案例向广大民众发出警告以及提醒。
3)基于AI和数据挖掘的诈骗号码识别预警方法手段;
其技术主要通过对用户的行为画像进行监测,根据多特征选取用户,如入网时长、原始特征收集等特征,进行处理后,得到一种可用的分类模型。根据得到的分类模型,将目标用户输入到对应模型中得出目标用户的诈骗号码风险概率。
综上所述,现有技术存在如下的缺点:
1)针对目标区域范围窄:目前防范诈骗方式手段主要通过针对现有的欺诈用户群体的特征,如电话、短信等特征进行处理,然后以案例的形式对现有用户起到警示作用,而用户无法对现有的诈骗手段进行识别处理,若原案例中没有如此的诈骗手段,将难以对用户起到警示作用。
2)难以被高低龄人群接受或使用:现有的技术都是将目前的欺诈方法公布在平台中,用户可以通过平台了解欺诈手段,从而避免被不法分子欺骗,但此种方式对于高低龄人群来说并不能很好地被使用。
发明内容
本发明为解决公知技术中存在的上述技术问题,提供一种基于OCR和NLP的视觉问答防诈骗方法及系统。
本发明的第一目的是提供一种基于OCR和NLP的视觉问答防诈骗方法,包括:
S1、获取目标图片;
S2、使用OCR提取图片中的文本;具体包括:
S201、优化YOLOv5;将YOLOv5中的骨干网络替换为GCN;
S202、将目标图片建模为一张无向图,并输入到GCN中,提取文字框特征;
S203、将GCN提取得到的文字框特征输入到Yolov5的下游任务中,通过Yolov5的下游任务,得到文字检测框;
S204、使用了CRNN模型对文字检测框区域进行文字识别;
S205、将识别出的最高置信度文字返回到CRNN模型的输出结果,得到包含有文字位置信息以及该位置具体的文字信息,并输出至CRNN模型的末端;
S3、对提取到的文本进行整合排版;
S4、对得到的整合文本信息进行数据清洗;
S5、利用NLP进行诈骗信息识别;具体为:
S501、提取整合文本的文本信息,将文本信息中的关键信息进行语义抽取;
S502、对文本信息中的关键信息进行信息整合,与语料库中的诈骗信息进行信息匹配,得到诈骗信息语义匹配结果;
S6、根据匹配结果,进行结果输出。
优选地,在S4中,数据清洗包括:去除空格、换行符、标点符号和特殊字符。
优选地,所述OCR和NLP均设置在云端网络中。
本发明的第二目的是提供一种基于OCR和NLP的视觉问答防诈骗系统,包括:
数据获取模块:获取目标图片;
文本识别模块:使用OCR提取图片中的文本;具体包括:
优化单元、优化YOLOv5;将YOLOv5中的骨干网络替换为GCN;
特征提取单元、将目标图片建模为一张无向图,并输入到GCN中,提取文字框特征;
文字检测框获取单元:将GCN提取得到的文字框特征输入到Yolov5的下游任务中,通过Yolov5的下游任务,得到文字检测框;
文字识别单元:使用了CRNN模型对文字检测框区域进行文字识别;
文字信息获取单元:将识别出的最高置信度文字返回到CRNN模型的输出结果,得到包含有文字位置信息以及该位置具体的文字信息,并输出至CRNN模型的末端;
排版模块:对提取到的文本进行整合排版;
清洗模块:对得到的整合文本信息进行数据清洗:
识别模块:利用NLP进行诈骗信息识别;具体为:
语义抽取单元:提取整合文本的文本信息,将文本信息中的关键信息进行语义抽取;
信息匹配单元:对文本信息中的关键信息进行信息整合,与语料库中的诈骗信息进行信息匹配,得到诈骗信息语义匹配结果;
输出模块:根据匹配结果,进行结果输出。
优选地,数据清洗包括:去除空格、换行符、标点符号和特殊字符。
优选地,所述OCR和NLP均设置在云端网络中。
本发明的第三目的是提供一种信息数据处理终端,用于实现上述的基于OCR和NLP的视觉问答防诈骗方法。
本发明的第四目的是提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行实现上述的基于OCR和NLP的视觉问答防诈骗方法。
本发明具有的优点和积极效果是:
本发明对现有的通用目标检测方法进行改进并应用在更多的自然场景中,将目标检测算法同文字识别结合,提取出高可用的文字内容,将文字内容输入到云端的NLP模型当中进行语义抽取,与相关诈骗信息进行匹配,最终得到是否是欺诈信息的结果。用户通过小程序即可完成一键式完成图片上传、信息判别,语音播报的功能。
附图说明
图1为本发明优选实施例的流程图。
具体实施方式
为了使本发明的上述目的、设计的控制系及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
英文缩写解释说明:
OCR:Optical Character Recognition(光学字符识别),是一种将印刷体字符转换为可编辑文本的技术。
NLP:Natural Language Processing(自然语言处理),是一种计算机科学和人工智能领域的交叉学科,旨在使计算机能够理解、解释和生成人类语言。
YOLOV5:You Only Look Once Version 5,是一种基于深度学习的目标检测算法,可以实现实时高效的目标检测。
CRNN:Convolutional Recurrent Neural Network(卷积循环神经网络),是一种结合了卷积神经网络和循环神经网络的深度学习模型,常用于处理序列数据。
GCN:Graph Convolutional Network(图卷积网络),是一种用于处理图数据的深度学习模型,可以对节点和边进行特征提取和表示学习。
BERT:Bidirectional Encoder Representations from Transformers(双向训练Transformer的编码器表征预训练模型),是一种预训练的自然语言处理模型,可以用于各种NLP任务,如文本分类、问答系统等。
本发明利用现有的目标检测技术、文字识别技术以及自然语言处理技术,具体为通过OCR和NLP进行结合的反诈骗方式,可以通过直接输入图片来判断是否为诈骗短信、信息。
如图1所示:一种基于OCR和NLP的视觉问答防诈骗方法,包括:
S1、获取目标图片;目标图片的采集主要是使用配备高清摄像头的设备,例如用户的手机、平板电脑等,来得到需要提取的图片和文本信息。这些信息会被采集并上传到本方案所使用的网站或手机APP中,以便进行后续处理。在上传到网站之前,图片信息会被保存在内存中,等待后续处理。
S2、使用OCR提取图片中的文本;
文字检测是指将用户输入的目标图片保存在本地,并上传至云端的OCR模型,该模型可以识别当前图片文字的位置,通过文字的位置信息。在文字检测过程中,首先需要将用户提供的图片保存在本地,以便进行后续处理。接着,将图片上传到云端的OCR模型中,该模型会自动识别图片中的文字,并返回文字的位置信息。
在这一方面,本申请的做法如下:
首先,直接采用YOLOv5进行文字检测效果不佳,因此采用了对其中的骨干网络替换为最新的图神经网络方法,更具体地:
本申请采用了目前最新的图神经网络GCN进行处理,将输入的图片建模为一张无向图,输入到GCN当中提取文字框特征,最终将GCN提取得到的特征输入到Yolov5的下游任务当中。通过Yolov5下游任务,最终得到文字检测框。
模型的检测过程如下:将图片输入到我们修改之后的Yolov5模型当中,通过Yolov5模型输出的检测框,将文字位置信息保留下来,然后通过去重等操作得到高有效的检测框。
此检测框即代表了可能存在文字的位置,以便于进一步操作。
下一阶段:文字的识别,在得到检测文本框之后,本申请使用了CRNN模型对这些可能存在文字的区域进行识别,将从识别出属于最高置信度的文字返回到模型的输出结果,最终得到包含有文字位置信息以及该区域具体的文字信息输出至模型的末端,以等待之后模型的处理。
S2具体包括:
S201、优化YOLOv5;将YOLOv5中的骨干网络替换为GCN;
S202、将目标图片建模为一张无向图,并输入到GCN中,提取文字框特征;
S203、将GCN提取得到的文字框特征输入到Yolov5的下游任务中,通过Yolov5的下游任务,得到文字检测框;
S204、使用了CRNN模型对文字检测框区域进行文字识别;
S205、将识别出的最高置信度文字返回到CRNN模型的输出结果,得到包含有文字位置信息以及该位置具体的文字信息,并输出至CRNN模型的末端;
S3、对提取到的文本进行整合排版;得到数据之后,需要根据先前文字的位置信息,对提取后的有效文字进行整合排版,得到有效的一段文字,便于后续的文本处理模型。
S4、对得到的整合文本信息进行数据清洗;
对于获取得到用户输入图片的文字信息之后,该信息中可能包含有一些冗余信息、无用信息,而对于这些噪声数据,如果不加以清洗将会对模型的准确度产生影响。
对文字的清洗工作,主要的任务具体如下:
①去除空格和换行符:
考虑到空格和换行符可能会影响后续的文本处理,因此需要将其去除。
②去除标点符号和特殊字符:
在诈骗短信中,标点符号和特殊字符往往没有实际意义,需要将其去除。
通过以上手段,将这些冗余的信息通过数据的清洗阶段全部从原数据中进行去除,得到最终需的有效数据。
通过此有效的清洗、排版的数据,可以更好地用于下游NLP任务。
S5、利用NLP进行诈骗信息识别;
首先,OCR技术可以将图片中的文本转换为计算机可读的文本。得到文本后,可以通过云端NLP预训练模型来判断该文本是否属于诈骗信息。预训练模型是通过大量的数据进行训练,学习了一些通用的语言知识,可以用于自然语言处理任务,如分类、命名实体识别等。
在NLP模型当中,需要经过以下几个步骤,得到最终诈骗的识别结果:
①提取OCR所得文本的文本信息,将其中的关键信息进行语义抽取,以便后续的文本分析;
②对文本中的关键信息进行信息整合,与语料库中的诈骗信息进行信息匹配,得到诈骗信息语义匹配结果。
S5具体为:
S501、提取整合文本的文本信息,将文本信息中的关键信息进行语义抽取;
S502、对文本信息中的关键信息进行信息整合,与语料库中的诈骗信息进行信息匹配,得到诈骗信息语义匹配结果;
S6、根据匹配结果,进行结果输出。
根据S5得到的匹配结果,通过人为处理,将其有效地呈现给用户,提升用户的界面体验感。
综上所述,本申请的核心技术内容包括:
①文字检测:对通用目标检测算法YOLOV5改进成并适用于文字检测;
②文字识别:对得到的文字检测部分用CRNN算法进行文字识别;
③文字排版:对文字识别部分进行排版还原;
④语义抽取:对排版后的文字利用基于BERT模型的NLP算法进行关键语义信息抽取;
⑤信息匹配:对抽取后的信息与各种诈骗信息进行匹配。
⑥结果反馈:通过匹配相似度给出该信息为虚假信息的概率。
传统的诈骗识别方法通常需要人工参与,效率低下且易受主观因素影响。而这种结合使用的技术可以大大提高诈骗识别的效率和准确性,并且可以自动化处理大量数据,从而减轻人工工作量。我们通过此系统能够向用户提供反诈骗识别的智能服务系统,用户只需要将以图片作为载体的文字信息输入到系统中,系统便可告知用户是否是诈骗信息,以大大降低用户的被骗概率。
本方案的主要受众用户为老人或者小孩,通过简易、高可用的用户界面,对于高低龄用户有非常好的用户界面使用效果。
本发明的第二目的是提供一种基于OCR和NLP的视觉问答防诈骗系统,包括:
数据获取模块:获取目标图片;
文本识别模块:使用OCR提取图片中的文本;具体包括:
优化单元、优化YOLOv5;将YOLOv5中的骨干网络替换为GCN;
特征提取单元、将目标图片建模为一张无向图,并输入到GCN中,提取文字框特征;
文字检测框获取单元:将GCN提取得到的文字框特征输入到Yolov5的下游任务中,通过Yolov5的下游任务,得到文字检测框;
文字识别单元:使用了CRNN模型对文字检测框区域进行文字识别;
文字信息获取单元:将识别出的最高置信度文字返回到CRNN模型的输出结果,得到包含有文字位置信息以及该位置具体的文字信息,并输出至CRNN模型的末端;
排版模块:对提取到的文本进行整合排版;
清洗模块:对得到的整合文本信息进行数据清洗;数据清洗包括:去除空格、换行符、标点符号和特殊字符;
识别模块:利用NLP进行诈骗信息识别;具体为:
语义抽取单元:提取整合文本的文本信息,将文本信息中的关键信息进行语义抽取;
信息匹配单元:对文本信息中的关键信息进行信息整合,与语料库中的诈骗信息进行信息匹配,得到诈骗信息语义匹配结果;
输出模块:根据匹配结果,进行结果输出。
所述OCR和NLP均设置在云端网络中。
一种信息数据处理终端,用于实现上述基于OCR和NLP的视觉问答防诈骗方法。
一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述基于OCR和NLP的视觉问答防诈骗方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidStateDisk(SSD))等。
以上所述仅是对本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所做的任何简单修改,等同变化与修饰,均属于本发明技术方案的范围内。
Claims (8)
1.一种基于OCR和NLP的视觉问答防诈骗方法,其特征在于,包括:
S1、获取目标图片;
S2、使用OCR提取图片中的文本;具体包括:
S201、优化YOLOv5;将YOLOv5中的骨干网络替换为GCN;
S202、将目标图片建模为一张无向图,并输入到GCN中,提取文字框特征;
S203、将GCN提取得到的文字框特征输入到Yolov5的下游任务中,通过Yolov5的下游任务,得到文字检测框;
S204、使用了CRNN模型对文字检测框区域进行文字识别;
S205、将识别出的最高置信度文字返回到CRNN模型的输出结果,得到包含有文字位置信息以及该位置具体的文字信息,并输出至CRNN模型的末端;
S3、对提取到的文本进行整合排版;
S4、对得到的整合文本信息进行数据清洗;
S5、利用NLP进行诈骗信息识别;具体为:
S501、提取整合文本的文本信息,将文本信息中的关键信息进行语义抽取;
S502、对文本信息中的关键信息进行信息整合,与语料库中的诈骗信息进行信息匹配,得到诈骗信息语义匹配结果;
S6、根据匹配结果,进行结果输出。
2.根据权利要求1所述的基于OCR和NLP的视觉问答防诈骗方法,其特征在于,在S4中,数据清洗包括:去除空格、换行符、标点符号和特殊字符。
3.根据权利要求1所述的基于OCR和NLP的视觉问答防诈骗方法,其特征在于,所述OCR和NLP均设置在云端网络中。
4.一种基于OCR和NLP的视觉问答防诈骗系统,其特征在于,包括:
数据获取模块:获取目标图片;
文本识别模块:使用OCR提取图片中的文本;具体包括:
优化单元、优化YOLOv5;将YOLOv5中的骨干网络替换为GCN;
特征提取单元、将目标图片建模为一张无向图,并输入到GCN中,提取文字框特征;
文字检测框获取单元:将GCN提取得到的文字框特征输入到Yolov5的下游任务中,通过Yolov5的下游任务,得到文字检测框;
文字识别单元:使用了CRNN模型对文字检测框区域进行文字识别;
文字信息获取单元:将识别出的最高置信度文字返回到CRNN模型的输出结果,得到包含有文字位置信息以及该位置具体的文字信息,并输出至CRNN模型的末端;
排版模块:对提取到的文本进行整合排版;
清洗模块:对得到的整合文本信息进行数据清洗:
识别模块:利用NLP进行诈骗信息识别;具体为:
语义抽取单元:提取整合文本的文本信息,将文本信息中的关键信息进行语义抽取;
信息匹配单元:对文本信息中的关键信息进行信息整合,与语料库中的诈骗信息进行信息匹配,得到诈骗信息语义匹配结果;
输出模块:根据匹配结果,进行结果输出。
5.根据权利要求4所述基于OCR和NLP的视觉问答防诈骗系统,其特征在于,在S清洗模块中,数据清洗包括:去除空格、换行符、标点符号和特殊字符。
6.根据权利要求4所述基于OCR和NLP的视觉问答防诈骗系统,其特征在于,所述OCR和NLP均设置在云端网络中。
7.一种信息数据处理终端,其特征在于,用于实现权利要求1-3任一项所述的基于OCR和NLP的视觉问答防诈骗方法。
8.一种计算机可读存储介质,其特征在于,包括指令,当其在计算机上运行时,使得计算机执行实现权利要求1-3任一项所述的基于OCR和NLP的视觉问答防诈骗方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310474319.7A CN116881408A (zh) | 2023-04-27 | 2023-04-27 | 基于ocr和nlp的视觉问答防诈骗方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310474319.7A CN116881408A (zh) | 2023-04-27 | 2023-04-27 | 基于ocr和nlp的视觉问答防诈骗方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116881408A true CN116881408A (zh) | 2023-10-13 |
Family
ID=88266765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310474319.7A Pending CN116881408A (zh) | 2023-04-27 | 2023-04-27 | 基于ocr和nlp的视觉问答防诈骗方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116881408A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117874209A (zh) * | 2024-03-12 | 2024-04-12 | 深圳市诚立业科技发展有限公司 | 基于nlp的诈骗短信监控告警系统 |
-
2023
- 2023-04-27 CN CN202310474319.7A patent/CN116881408A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117874209A (zh) * | 2024-03-12 | 2024-04-12 | 深圳市诚立业科技发展有限公司 | 基于nlp的诈骗短信监控告警系统 |
CN117874209B (zh) * | 2024-03-12 | 2024-05-17 | 深圳市诚立业科技发展有限公司 | 基于nlp的诈骗短信监控告警系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020437B (zh) | 一种视频和弹幕相结合的情感分析及可视化方法 | |
US20200342314A1 (en) | Method and System for Detecting Fake News Based on Multi-Task Learning Model | |
CN111079444A (zh) | 一种基于多模态关系的网络谣言检测方法 | |
CN110704715B (zh) | 一种网络霸凌的检测方法及系统 | |
CN107357824B (zh) | 信息处理方法、服务平台及计算机存储介质 | |
CN110598070B (zh) | 应用类型识别方法及装置、服务器及存储介质 | |
CN112131881B (zh) | 信息抽取方法及装置、电子设备、存储介质 | |
CN109815485B (zh) | 一种微博短文本情感极性识别的方法、装置及存储介质 | |
CN111078978A (zh) | 一种基于网站文本内容的网贷网站实体识别方法及系统 | |
CN115982350A (zh) | 基于多模态Transformer的虚假新闻检测方法 | |
Anoop et al. | Leveraging heterogeneous data for fake news detection | |
CN116450829A (zh) | 医疗文本分类方法、装置、设备及介质 | |
CN107688630A (zh) | 一种基于语义的弱监督微博多情感词典扩充方法 | |
CN110610003A (zh) | 用于辅助文本标注的方法和系统 | |
CN116881408A (zh) | 基于ocr和nlp的视觉问答防诈骗方法及系统 | |
CN113705164A (zh) | 一种文本处理方法、装置、计算机设备以及可读存储介质 | |
CN110059189B (zh) | 一种游戏平台消息的分类系统及方法 | |
CN116579348A (zh) | 基于不确定语义融合的虚假新闻检测方法及系统 | |
Jia et al. | Sample generation of semi‐automatic pavement crack labelling and robustness in detection of pavement diseases | |
CN115731077A (zh) | 一种面向弥合数字鸿沟的数字素养教育系统及其应用 | |
CN115712869A (zh) | 基于分层注意力网络的多模态谣言检测方法及系统 | |
KR101379935B1 (ko) | 메시지 정보 추출 시스템 및 그 방법 | |
CN114067362A (zh) | 基于神经网络模型的手语识别方法、装置、设备及介质 | |
CN115329756B (zh) | 执行主体的提取方法、装置、存储介质和电子设备 | |
CN110276001A (zh) | 盘点页识别方法、装置、计算设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |