[go: up one dir, main page]

CN108595634A - 短信管理方法、装置及电子设备 - Google Patents

短信管理方法、装置及电子设备 Download PDF

Info

Publication number
CN108595634A
CN108595634A CN201810377060.3A CN201810377060A CN108595634A CN 108595634 A CN108595634 A CN 108595634A CN 201810377060 A CN201810377060 A CN 201810377060A CN 108595634 A CN108595634 A CN 108595634A
Authority
CN
China
Prior art keywords
short message
word
vector
message content
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810377060.3A
Other languages
English (en)
Other versions
CN108595634B (zh
Inventor
鲁梦平
麦金凯
马志豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810377060.3A priority Critical patent/CN108595634B/zh
Publication of CN108595634A publication Critical patent/CN108595634A/zh
Application granted granted Critical
Publication of CN108595634B publication Critical patent/CN108595634B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例提供了一种短信管理方法、装置及电子设备,该方法包括:获取接收到的短信内容;对短信内容进行分词处理,得到短信内容所包括的词语;对经过分词处理所得到的词语进行处理,得到词语对应的词语级向量;对词语级向量进行统计处理,得到短信内容对应的文本级向量,文本级向量用于表示短信内容的语义特征;调用短信分类模型对文本级向量进行处理,得到短信内容的分类。在本发明实施例中,由于按照从词语级向量到文本级向量的顺序由浅及深地对短信内容的语义特征进行提炼概括,从而使文本级向量能更好地表征短信的语义特征,后续对短信进行分类时的准确率得到提升。

Description

短信管理方法、装置及电子设备
技术领域
本申请实施例涉及互联网技术领域,特别涉及一种短信管理方法、装置及电子设备。
背景技术
目前,一些互联网厂商可以基于短信内容向用户提供增值服务,例如拦截垃圾短信、生成情景短信等。在实现上述增值服务之前,通常需要对短信进行语义分析,以便能够根据短信内容准确地向用户提供上述增值服务。
由于终端的内存以及计算资源的限制,目前终端通常基于关键词来确定短信的分类,以实现对短信的语义分析。具体地,终端存储有关键词与短信的分类之间的预设对应关系,短信应用程序先从短信中提取关键词,之后查找上述预设对应关系,进而确定短信的分类。
相关技术中确定短信的分类的准确率较低。
发明内容
本发明实施例提供了一种短信管理方法、装置及电子设备,可用于解决相关技术中确定短信内容的分类准确率较低问题。
一方面,本发明实施例提供了一种短信管理方法,所述方法包括:
获取接收到的短信内容;
对所述短信内容进行分词处理,得到所述短信内容所包括的词语;
对所述经过分词处理所得到的词语进行处理,得到所述词语对应的词语级向量;
对所述词语级向量进行统计处理,得到所述短信内容对应的文本级向量,所述文本级向量用于表示所述短信内容的语义特征;
调用短信分类模型对所述文本级向量进行处理,得到所述短信内容的分类。
另一方面,本发明实施例提供了一种情景短信显示方法,所述方法包括:
向服务器发送短信内容;
接收所述服务器发送的所述短信内容对应的情景短信,所述情景短信是将所述短信内容中的关键信息以文字、数字和图片中的至少一种来进行突出显示的多媒体短信,所述情景短信由所述服务器根据所述短信内容的分类生成,所述短信内容的分类由所述服务器调用短信分类模型对所述短信内容对应的文本级向量进行处理得到,所述文本级向量用于表示所述短信内容的语义特征,所述文本级向量由所述服务器根据对所述短信内容所包括的词语对应的词语级向量进行统计处理得到,,所述词向量由所述服务器对所述短信内容所包括的词语进行词向量处理得到;
在显示区域显示所述情景短信。
又一方面,本发明实施例提供了一种情景短信显示方法,所述方法包括:
向服务器发送短信内容;
接收所述服务器发送的所述短信内容的分类,所述短信内容的分类由所述服务器调用短信分类模型对所述短信内容对应的文本级向量进行处理得到,所述文本级向量用于表示所述短信内容的语义特征,所述文本级向量由所述服务器对所述短信内容所包括的词语对应的词语级向量进行统计处理得到,,所述词向量由所述服务器对所述短信内容所包括的词语进行词向量处理得到;
根据所述短信内容的分类生成所述短信内容对应的情景短信,所述情景短信是将所述短信内容中的关键信息以文字、数字和图片中的至少一种来进行突出显示的多媒体短信;
在显示区域显示所述情景短信。
又一方面,本发明实施例提供了一种短信管理装置,所述装置包括:
第一获取模块,用于获取接收到的短信内容;
分词处理模块,用于对所述短信内容进行分词处理,得到所述短信内容所包括的词语;
第二获取模块,用于对所述经过分词处理所得到的词语进行词向量处理,得到所述词语对应的词语级向量;
第三获取模块,用于对所述词语级向量进行统计处理,得到所述短信内容对应的文本级向量,所述文本级向量用于表示所述短信内容的语义特征;
分类确定模块,用于调用短信分类模型对所述文本级向量进行处理,得到所述短信内容的分类。
又一方面,本发明实施例提供了一种情景短信显示装置,所述装置包括:
第一发送模块,用于向服务器发送短信内容;
第一接收模块,用于接收所述服务器发送的所述短信内容对应的情景短信,所述情景短信是将所述短信内容中的关键信息以文字、数字和图片中的至少一种来进行突出显示的多媒体短信,所述情景短信由所述服务器根据所述短信内容的分类生成,所述短信内容的分类由所述服务器调用短信分类模型对所述短信内容对应的文本级向量进行处理得到,所述文本级向量用于表示所述短信内容的语义特征,所述文本级向量由所述服务器对所述短信内容所包括的词语对应的词语级向量进行统计处理得到,所述词向量由所述服务器对所述短信内容所包括的词语进行词向量处理得到;
第一显示模块,用于在显示区域显示所述情景短信。
又一方面,本发明实施例提供了一种情景短信显示装置,所述装置包括:
第二发送模块,用于向服务器发送短信内容;
第二接收模块,用于接收所述服务器发送的所述短信内容的分类,所述短信内容的分类由所述服务器调用短信分类模型对所述短信内容对应的文本级向量进行处理得到,所述文本级向量由所述服务器对所述短信内容所包括的词语对应的词语级向量进行统计处理得到,所述词向量由所述服务器对所述短信内容所包括的词语进行词向量处理得到;
短信生成模块,用于根据所述短信内容的分类生成所述短信内容对应的情景短信,所述情景短信是将所述短信内容中的关键信息以文字、数字和图片中的至少一种来进行突出显示的多媒体短信;
第二显示模块,用于在显示区域显示所述情景短信。
又一方面,本发明实施例提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述方面所述的短信管理方法,或,上述方面所述的情景短信显示方法。
又一方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述方面所述的短信管理方法,或,上述方面所述的情景短信显示方法。
又一方面,提供了一种计算机程序产品,当该计算机程序产品被执行时,其用于执行上述方面所述的短信管理方法,和/或,上述方面所述的情景短信显示方法。
本发明实施例提供的技术方案可以带来如下有益效果:
通过先对短信内容中的词语分别进行词向量处理,得到词语对应的词语级向量,然后对上述词语级向量进行统计处理,得到短信内容对应的文本级向量,最后调用短信分类模型对上述文本级向量进行处理,进而确定短信的分类;由于按照从词语级向量到文本级向量的顺序由浅及深地对短信内容的语义特征进行提炼概括,从而使文本级向量能较好地表征短信的语义特征,后续对短信进行分类时的准确率得到提升。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个示例性实施例示出的实施环境的示意图;
图2是本发明一个示例性实施例示出的短信管理方法的流程图;
图3是本发明一个示例性实施例示出的短信分类的示意图;
图4是本发明另一个示例性实施例示出的短信管理方法的流程图;
图5是本发明一个示例性实施例示出的对短信内容进行处理的示意图;
图6是本发明一个示例性实施例示出的情景短信的示意图;
图7是本发明一个示例性实施例示出的训练词向量模型的方法的流程图;
图8是本发明一个示例性实施例示出的训练短信分类模型的方法的流程图;
图9是本发明一个示例性实施例示出的情景短信显示方法的流程图;
图10是本发明一个示例性实施例示出的情景短信显示方法的流程图;
图11是本发明一个示例性实施例示出的短信管理装置的框图;
图12是本发明一个示例性实施例示出的情景短信显示装置的框图;
图13是本发明一个示例性实施例示出的情景短信显示装置的框图;
图14是本发明一个示例性实施例示出的电子设备的框图;
图15是本发明一个示例性实施例示出的终端的框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
本发明实施例提供了一种短信管理方法、情景短信显示方法、装置及电子设备,通过先对短信内容中的词语分别进行词向量处理,得到词语对应的词语级向量,然后对上述词语级向量确定进行统计处理,得到短信内容对应的文本级向量,最后调用短信分类模型对上述文本级向量进行处理,进而确定短信的分类;由于按照从词语级向量到文本级向量的顺序由浅及深地对短信内容的语义特征进行提炼概括,从而使文本级向量能较好地表征短信的语义特征,从而使后续对短信进行分类时的准确率得到提升。
在本发明实施例中,各步骤的执行主体可以是具备语义分析功能,以及短信管理功能的电子设备。该电子设备可以是服务器、计算机等等。当电子设备为服务器时,其可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。
请参考图1,其示出了本发明一个实施例提供的实施环境的示意图。该实施环境包括:终端10和服务器20。
终端10具有情景短信展示功能,还具有与其它设备进行数据交互的功能。可选地,终端10与服务器20之间能实现情景短信的收发。可选地,终端还具有情景短信生成功能。可选地,终端10中安装有指定应用程序,由该指定应用程序实现上述情景短信展示功能及情景短信生成功能。终端10可以是手机、平板电脑等便携式电子设备。
服务器20具备语义分析功能,以及对短信进行分类的功能。可选地,服务器20还具有情景短信生成功能。可选地,服务器20是终端10中所安装的指定应用程序所对应的后台服务器。服务器20可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。
终端10与服务器20之间通过有线网络或无线网络连接。
可选的,上述的有线或无线网络使用标准通信技术和/或协议。网络通常为因特网、但也可以是任何网络,包括但不限于局域网(Local Area Network,LAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合)。在一些实施例中,使用包括超文本标记语言(Hyper Text Mark-up Language,HTML)、可扩展标记语言(Extensible MarkupLanguage,XML)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(Secure Socket Layer,SSL)、传输层安全(Transport Layer Security,TLS)、虚拟专用网络(Virtual Private Network,VPN)、网际协议安全(Internet ProtocolSecurity,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
请参考图2,其示出了本发明一个实施例提供的短信管理方法的流程图。该方法可以包括如下步骤:
步骤201,获取接收到的短信内容。
短信内容是某个用户或者企业通过电信设备(例如手机、伪基站等)向终端发送的短信息的内容,其通常包括文字信息和/或数字信息。由于用户通过电信设备发送的短信息的随机性较大,其可能并不限于某个场景,因此在本发明实施例中,仅以短信息为企业通过电信设备发送的为例进行说明。
电子设备可以从数据库中读取短信内容,也可以从与电子设备建立通信连接的其它设备中获取短信内容。当电子设备(例如终端)中安装有短信应用程序时,还可以从短信应用程序中读取短信内容。
步骤202,对短信内容进行分词处理,得到短信内容所包括的词语。
分词处理是指将短信内容划分为一个个单独的词语,例如,对于短信内容“今天中午在肯德基吃饭吧”,对其进行分词处理,得到“今天”、“中午”、“在”、“肯德基”、“吃饭”、“吧”等六个词语。
对短信内容进行分词处理所采用的方法可以是基于字符串匹配的方法、基于理解的分词方法和基于统计的分词方法等等。本发明实施例对此不作限定。
步骤203,对经过分词处理所得到的词语进行词向量处理,得到词语对应的词语级向量。
词向量处理用于将词语转换成词语级向量。可选地,电子设备调用词向量模型对经过分词处理所得到的词语进行词向量处理。可选地,词向量模型是词语与词语级向量之间的对应关系。在本发明实施例中,词向量模型可以是word2vec模型。词语级向量是指能够表示单个词语的语义特征的向量,词语级向量可以是对单个词语的语义特征进行量化得到的。
可选地,电子设备将短信内容所包括的词语分别输入词向量模型,进而得到短信内容所包括的词语分别对应的词语级向量。
步骤204,对词语级向量进行统计处理,得到短信内容对应的文本级向量。
对词语级向量进行统计处理可以包括对短信所包括的词语分别对应的词语级向量进行求最大值、求均值、求方差等等,本发明实施例对此不作限定。文本级向量用于表示短信内容的语义特征。
步骤205,调用短信分类模型对文本级向量进行处理,得到短信内容的分类。
短信分类模型是采用具有分类标签的样本短信对CNN进行训练得到的。短信分类模型用于确定短信内容的分类。短信内容的分类可以包括出行类短信、快递类短信、话费类短信、消费类短信中的至少一种,本发明实施例对此不作限定。样本短信是指预先选定的,用于对CNN进行训练的短信。样本短信具有分类标签,样本短信的分类标签通常由人工确定,用于描述样本短信的分类。示例性地,分类标签可以是出行类短信、快递类短信、话费类短信、消费类短信等等,本发明实施例对此不作限定。
可选地,CNN可采用alexNet网络、VGG-16网络、GoogleNet网络等等,本发明实施例对此不作限定。另外,训练CNN得到短信分类模型时所采用的算法可以是反向传播算法(Back-Propagation,BP)、更快的区域卷积神经网络faster RCNN(faster Regions withConvolutional Neural Network,faster RCNN)算法等,本发明实施例对此不作限定。
可选地,短信分类模型包括:一个输入层、至少一个隐层、和一个输出层。输入层的输入数据为短信内容,输出层的输出结果是该短信内容的分类。短信分类过程如下:将短信内容输入至短信分类模型的输入层,由短信分类模型的隐层对上述第一向量进行特征提取,并对提取到的特征进行组合和抽象,得到适用于输出层进行分类的数据,最后由输出层输出该短信内容的分类。另外,在本发明实施例中,对隐层的具体结构不作限定。一般来说,卷积神经网络的层数越多,效果越好但计算时间也会越长,在实际应用中,可结合对分类精度和效率的要求,设计适当层数的卷积神经网络。
在本发明实施例中,电子设备将短信内容对应的文本级向量输入短信分类模型,短信分类模型输出该短信内容属于各个分类的概率,电子设备将概率最大的分类确定为该短信内容的分类。例如,该短信内容对应的第一向量属于消费类短信的概率为0.02、属于出行类短信的概率为0.87、属于快递类短信的概率为0.10,则该短信内容的分类为出行类短信。
结合参考图3,其示出了本发明一个示例性实施例示出的确定短信内容的分类的示意图。对于短信内容“您尾号1234广发卡09月人民币账单金额12352.1元”,电子设备采用JEBA工具对该短信内容进行分词处理后,得到短信内容所包括的词语“您,尾号,1234,广发卡,09,月,人民币,账单金额,12352.1,元”,之后电子设备基于词向量模型确定各个词语对应的词语级向量为{v1,v2.,…,vn},并基于上述各个词语对应的向量确定短信内容对应的文本级向量{v短信},电子设备将上述短信内容对应的向量{v短信}输入短信分类模型,短信分类模型输出短信内容属于账单类短信的概率为0.91、属于消费类短信的概率为0.03、属于出行类短信的概率为0.01,因此该短信内容的分类为账单类短信。
综上所述,本发明实施例提供的方法,通过对短信内容中的词语分别进行词向量处理,得到词语对应的词语级向量,然后基于上述词语级向量进行统计处理,得到短信内容对应的文本级向量,最后调用短信分类模型对上述文本级向量进行处理,进而确定短信的分类;由于按照从词语级向量到文本级向量的顺序由浅及深地对短信内容进行提炼概括,从而使文本级向量能较好地表征短信的特征,从而使后续对短信进行分类时的准确率得到提升。
可选地,电子设备根据词语级向量确定文本级向量具体实现为:先根据词语级向量确定出中间特征向量,之后根据中间特征向量确定文本级向量。下面对该种实现方式进行讲解。
请参考图4,其示出了本发明一个实施例提供的短信管理方法的流程图。该方法可以包括如下步骤:
步骤401,获取接收到的短信内容。
步骤402,对短信内容进行分词处理,得到短信内容所包括的词语。
步骤403,对词语进行聚合处理,得到聚合处理后的词语。
聚合处理是指将相同语义类型的至少两个词语采用一个类型标识来表示。例如,对于词语“09”、“月”,二者在同一短信内容中的语义类型均为日期,因此可以将“09”、“月”聚合处理,得到“日期”。另外,聚合处理还可以短信内容中的数字、网址、日期等采用统一的标识符来表示。示例性地,数字可以采用“Number”来表示、网址可以采用“Address”来表示、日期可以采用“Date”来表示。通过上述方式,可以使电子设备得到词语级向量、文本级向量所需的计算量减少,从而提升短信分类效率。另外,可以避免词向量模型对数字、网址、日期等进行向量转换。
结合参考图5,其示出了本发明一个示例性实施例示出的对短信内容进行处理的示意图。对于短信内容“您尾号1224广发卡09月人民币账单金额12252.1元”,对该短信内容进行分词处理后,得到短信内容所包括的词语“您,尾号,1224,广发卡,09,月,人民币,账单金额,12252.1,元”,对短信内容所包括的词语进行聚合处理后,得到聚合处理后的词语“您,尾号,Number,广发卡,Date,人民币,账单金额,Number,元”。
步骤404,对聚合处理后的词语进行词向量处理,得到聚合处理后的词语对应的词语级向量。
可选地,电子设备调用词向量模型对聚合处理后的词语进行词向量处理。
可选地,电子设备在采用词向量模型对词语进行处理,得到词语级向量之前,还可以对短信内容所包括的词语进行停用词过滤处理,停用词过滤处理用于过滤短信内容所包括的词语中的停用词,停用词是指没有实际含义的词语,比如语气词,例如,停用词可以是“吧”、“啊”、“的”。通过上述方式,可以减少电子设备得到词语级向量所需的计算量,从而提升短信分类效率。
步骤405,对词语级向量进行统计处理,得到中间特征向量。
中间特征向量包括均值特征向量、最大值特征向量、方差特征向量中的至少一种。
均值特征向量是对各个词语分别对应的词语级向量求平均值得到的。均值特征向量A可以采用如下第一公式表示:
其中,wi为任意一个第二向量,i的取值范围为1至N,N为第二向量的数量,N为正整数。
最大值特征向量是各个词语分别对应的词语级向量中最大的词语级向量。最大值特征向量B可以采用如下第二公式表示:
B=max(w1,w2,…,wN);
Max()表示对各个第二向量求最大值。
方差特征向量是对各个词语分别对应的词语级向量求方差得到的。方差特征向量C可以采用如下第三公式表示:
C=variance(w1,w2,…,wN);
Variance()表示对各个第二向量求方差。
步骤406,根据中间特征向量确定文本级向量;
当中间特征向量包括均值特征向量、最大值特征向量、方差特征向量中的任意一种时,电子设备将中间特征向量确定为文本级向量。可选地,电子设备可以直接将上述均值特征向量确定为文本级向量。可选地,电子设备也可以直接将上述最大值特征向量确定为文本级向量。可选地,电子设备还可以直接将上述方差特征向量确定为文本级向量。通过上述方式,计算中间特征向量所需的计算量较小,有助于节省电子设备的处理器资源。
当中间特征向量包括均值特征向量、最大值特征向量、方差特征向量中的至少两种时,电子设备对中间特征向量进行拼接处理,得到文本级向量。向量拼接是指将至少两个向量拼接成一个向量,拼接后的向量的维度应该大于拼接前的任意一个向量的维度。向量的维度用于指示该向量的表征能力,向量的维度越多时,向量的表征能力就越强。
在第一个示例中,电子设备将均值特征向量、最大值特征向量进行拼接,得到文本级向量。在第二个示例中,电子设备将均值特征向量、方差特征向量进行拼接,得到文本级向量。在第三个示例中,电子设备将方差特征向量、最大值特征向量进行拼接,得到文本级向量。在第四个示例中,电子设备将均值特征向量、最大值特征向量、方差特征向量进行拼接,得到文本级向量。
当电子设备采用前三个示例提供的方法获取文本级向量时,所需的计算量较小,有助于节省电子设备的处理资源。当采用第四个示例提供的方法获取文本级向量时,由于文本级向量是基于全部的特征向量拼接得到,因此文本级向量的维度越多,表征能力更强。
示例性地,电子设备将均值特征向量A和方差特征向量C拼接得到文本级向量X,文本级向量X可以采用如下公式表示:
步骤407,调用短信分类模型对文本级向量,得到短信内容的分类。
短信分类模型是采用具有分类标签的样本短信对CNN进行训练得到的。
短信内容的分类可以应用于生成情景短信,下面对根据短信内容的分类生成短信内容对应的情景短信的过程进行讲解。可选地,在步骤407之后,还包括如下几个步骤:
步骤408,根据短信内容的分类生成短信内容对应的情景短信。
短信内容对应的情景短信是指能够直观描述短信内容的场景的短信,因此也称场景短信。可选地,情景短信是将短信内容中的关键信息以文字、数字和图片中的至少一种来进行突出显示的多媒体短信。短信内容的关键信息根据短信内容的分类实际确定,不同的分类所对应的关键信息并不相同。当短信内容的分类为出行类短信,其关键信息包括乘客的身份信息(例如姓名、身份证号)、出行工具的相关信息(航班或车次、座位号),出发时间及地点、目的地点。当短信内容的分类为消费类短信,其关键信息包括消费时间、地点、金额等。当短信内容的分类为快递类短信时,其关键信息包括快递单号、投递时间、快递公司等。当短信内容的分类为账单类短信时,其关键信息包括账单金额,账单日期以及金融证件信息(例如银行卡号,银行卡号所属的银行)。
可选地,情景短信中不包括短信内容中除关键信息之外的冗余信息。可选地,情景短信是将短信内容中的关键信息覆盖到与该情景对应的情景图片上进行显示的多媒体短信。当情景短信是出行类短信时,情景图片包括汽车票图片、火车票图片或机票图片;当情景短信是快递类短信时,情景图片包括快递单图片、当情景短信是话费类短信时,情景图片包括话费清单图片;当情景短信是消费类短信时,情景图片包括帐单图片。在不同的实施例中,情景短信还可以称为卡片式短信或卡片短信。
结合参考图6,其示出了本发明一个实施例示出的短信内容对应的情景短信的示意图。其中,短信内容为“尊敬的旅客,您在南航官网订单A123456789Z支付成功,乘机人王丁丁,票号A13245789Z,4月17日航班F3214Z,无锡至厦门,飞机将于15:21分准时起飞。请至少提前45分钟前往硕放机场办理乘机手续。感谢您选择南航,祝您旅途愉快。温馨提示:您的托运行李中严禁携带充电宝”。
可选地,步骤408可以包括如下几个子步骤:
步骤408a,根据短信内容的分类获取所述短信内容的关键信息;
在本发明实施例中,电子设备根据短信内容的分类确定短信内容的关键信息,并从短信内容中提取关键信息。
步骤408b,对短信内容的关键信息进行整合,得到短信内容对应的情景短信。
电子设备将短信内容的关键信息按照预设排列规则添加至预设模板中,得到短信内容对应的情景短信。预设排列规则可以人为设定,也可以由电子设备根据短信内容的分类设定,本发明实施例对此不作限定。预设模板也可以是根据短信内容的分类设定的。可选地,电子设备存储有预设模板与短信内容的分类之间的预设对应关系,在确定出短信内容的分类之后,在预设对应关系中查找上述短信内容的分类对应的预设模板。
另外,对于关键信息中可以采用图片来表示的元素,则获取相应的图片,并将该图片添加至上述卡片中,进而得到情景短信。例如,短信内容的关键信息包括出行工具时,则采用图片来表示出行工具。再例如,短信内容的关键信息包括快递公司时,可以采用该快递公司的LOGO来表示。
综上所述,本发明实施例提供的方法,通过对短信内容中的词语分别进行词向量处理,得到词语对应的词语级向量,然后对上述词语级向量进行统计处理,得到短信内容对应的文本级向量,最后调用短信分类模型对上述文本级向量进行处理,进而确定短信的分类;由于按照从词语级向量到文本级向量的顺序由浅及深地对短信内容进行提炼概括,从而使文本级向量能较好地表征短信的特征,从而使后续对短信进行分类时的准确率得到提升。
另外,还通过对短信所包括相同语义类型的词语进行聚合处理,从而减少后续需要确定出的词语级向量的数量,从而减小电子设备确定词语级向量,以及后续确定文本级向量所需的计算量,提升短信分类的效率。
在图2和图4所示实施例中,电子设备可以通过词向量模型对词语进行词向量处理,以获取词语对应的词语级向量。在该步骤之前,需要先训练出词向量模型。下面将对词向量模型的训练过程进行讲解。
结合参考图7,其示出了本发明实施例示出的训练词向量模型的流程图。在基于图2或图4所示实施例提供的可选实施例中,在步骤203之前,或者,在步骤404之前,训练词向量模型可以包括如下步骤701至704。
步骤701,获取第一训练样本集。
第一训练样本集包括多个第一训练样本。在本发明实施例中,第一训练样本的数量可以根据训练精度及效率实际设定,例如,训练精度要求较高时,第一训练样本的数量也较高,再例如,训练效率要求较高时,则第一训练样本的数量较少。
第一训练样本可以是一条短信息。电子设备可以从数据库中直接读取第一训练样本,也可以从与电子设备建立有通信连接的其它电子设备处获取第一训练样本。可选地,终端中所安装的具备情景短信展示功能的应用程序在获取到短信权限后,将终端已接收的短信息作为第一训练样本发送至电子设备。可选地,上述应用程序在获取到短信权限后,将终端中指定电话号码发送的短信息作为第一训练样本发送至电子设备。其中,短信权限是指允许该应用程序读取终端中的短信息的权限,其可以由用户自定义设置,也可以由终端默认设置。可选地,指定电话号码是指能够生成相应的情景短信的短信内容对应的发送号码,例如各个企业所采用的号码,示例性地,指定电话号码是快递公司、运营商公司、银行等采用的号码。
每个第一训练样本包括至少一个词语和每个词语的上下文。词语的上下文是指在一个完整的句子中在该词语之前和之后出现的词语。例如,在句子“今天没有下雨”中,“没有”的上下文是“今天”和“下雨”。词语以及词语的上下文是由电子设备对第一训练样本所包括的句子进行分词处理得到的。
词语对应有向量,词语的上下文也对应有向量。词语对应的向量,以及词语的上下文对应的向量均是通过随机化的方式获取到的。
步骤702,对于多个第一训练样本中的每个第一训练样本,将词语的上下文对应的向量输入第一原始模型,得到第一训练结果。
第一原始模型可以是CBOW(Continuous Bag Of Words Model)模型,也可以是Skip-gram模型,本发明实施例对此不作限定。在本发明实施例中,仅以第一原始模型为CBOW模型为例进行解释说明。
第一训练结果包括每个词语的出现概率。每个词语的出现概率是指该词语出现在输入第一原始模型的向量对应的上下文之间的概率。
步骤703,根据第一训练结果调整词语的上下文对应的向量,并将调整后的向量再次输入第一原始模型,直至第一训练结果符合期望结果。
期望结果是指上下文对应的词语的出现概率符合第二预设条件。第二预设条件是指上下文对应的词语的出现概率最大。示例性地,“没有”在“今天”和“下雨”之间的出现概率应当最大。
电子设备可以检测第一训练结果是否符合期望结果,若第一训练结果不符合期望结果时,则相应地对输入第一原始模型的上下文对应的向量进行调整,之后重复步骤702和703,直到第一训练结果符合期望结果。
步骤704,当第一训练结果符合期望结果时,根据各个词语对应的向量生成词向量模型。
当第一训练结果符合期望结果时,此时输入第一原始模型的向量可以视为上下文对应的向量,当第一训练样本足够时,对于每个词语,均可以得到该词语对应的向量,词语与词语对应的向量之间的对应关系可以称之为词向量模型。词向量模型用于对经过分词处理所得到的词语,以及聚合处理后的词语进行词向量处理。
在图2和图4所示实施例中,电子设备基于短信分类模型确定短信内容的分类。在该步骤之前,需要先训练出短信分类模型。下面对短信分类模型的训练过程进行讲解。
结合参考图8,其示出了本发明实施例示出的训练短信分类模型的流程图。在基于图2或图4所示实施例提供的可选实施例中,在步骤205之前,或者,在步骤407之前,训练短信分类模型可以包括如下步骤801至804。
步骤801,获取第二训练样本集。
第二训练样本集包括多个第二训练样本,每个第二训练样本对应有分类标签。第二训练样本可以是短信息。在本发明实施例中,第二训练样本的数量可以根据训练精度及效率实际设定,例如,训练精度要求较高时,第二训练样本的数量也较高,再例如,训练效率要求较高时,则第二训练样本的数量较少。
第二训练样本可以是一条短信息。电子设备可以从数据库中直接读取第二训练样本,也可以从与电子设备建立有通信连接的其它电子设备处获取第二训练样本。电子设备获取第二训练样本的方式可以参考获取第一训练样本的方式,此处不再赘述。
第二训练样本对应的分类标签用于描述第二训练样本的分类,其可以由人工进行标注。第二训练样本对应的分类标签可以是快递类短信、话费类短信、账单类短信、出行类短信等等,本发明实施例对此不作限定。
步骤802,对于多个第二训练样本中的每个第二训练样本,将第二训练样本输入CNN,得到第二训练结果。
对于卷积神经网络的相关介绍,可以参考步骤202,此处不再赘述。第二训练结果为第二训练样本属于各个分类标签的概率。例如,对于第二训练样本A,其属于快递类短信、话费类短信、账单类短信、出行类短信的概率分别为0.42、0.14、0.23、0.04。
步骤803,将第二训练结果与分类标签进行比较,得到计算损失。
计算损失用于指示第二训练结果与分类标签之间的误差。
步骤804,根据多个第二训练样本各自对应的计算损失,采用误差反向传播算法训练得到短信分类模型。
可选地,电子设备通过反向传播算法根据计算损失确定短信分类模型的梯度方向,从短信分类模型的输出层逐层向前更新短信分类模型中的各个隐层的参数。电子设备根据各个第二训练样本对应的计算损失,调整卷积神经网络中各个隐层的参数,之后电子设备重复步骤402至404,直至每个第二训练样本各自对应的计算损失小于预设值,此时终端将当前的卷积神经网络确定为短信分类模型。预设值可以根据分类精度及效率实际设定,比如,分类精度较高时,则预设值较小,分类效率要求较高时,则预设值较大。
图9是本发明一个示例性实施例示出的情景短信显示方法的流程图。该方法可以应用于图1所示实施环境的终端中。在本发明实施例中,情景短信由服务器生成。该方法包括如下步骤:
步骤901,向服务器发送短信内容。
可选地,终端向服务器发送情景短信获取请求,该情景短信获取请求携带短信内容。情景短信获取请求用于请求获取短信内容对应的情景短信。
在一个示例中,终端在接收到短信息之后的预设时长向服务器发送携带短信内容的情景短信获取请求。预设时长可以根据实际需求设定,例如3秒,本发明实施例对此不作限定。通过上述方式,可以使终端能够及时获取到情景短信,从而保证时效性。
在另一个示例中,终端在检测到短信息对应的发送号码是预设号码时,向服务器发送携带短信内容的情景短信获取请求。可选地,终端中存储有号码列表,号码列表中包括能够生成情景短信的短信息对应的发送号码(例如,各个企业所采用的号码),终端在号码列表中查找到短信息对应的发送号码,则确定短信息对应的发送号码是预设号码。通过在终端在发送情景短信获取请求之前先对发送号码进行筛选,避免终端在每次接收到短信均向服务器发送情景短信获取请求,从而节省终端与服务器之间的通信资源,以及服务器的处理资源。
在又一个示例中,终端所安装的具有情景短信展示功能的应用程序提供有转换按钮,当终端接收到对应于该转换按钮的触发信号之后,显示短信息列表,短信息列表中包括终端接收到的短信息,在用户在短信息列表中选择出一条或多条短信息之后,由用户触发选择完成指示,之后终端向服务器发送情景短信获取请求。
相应地,服务器接收终端发送的短信内容。
步骤902,接收服务器发送的短信内容对应的情景短信。
短信内容对应的情景短信是将短信内容中的关键信息以文字、数字和图片中的至少一种来进行突出显示的多媒体短信。短信内容对应的情景短信由服务器根据短信内容的分类生成,短信内容的分类由服务器调用短信分类模型对短信内容对应的文本级向量进行处理得到,文本级向量用于表示短信内容的语义特征,文本级向量由服务器对短信内容所包括的词语对应的词语级向量对短信内容所包括的词语对应的词向量进行统计处理得到,词向量由服务器对短信内容所包括的词语进行词向量处理得到。上述短信内容对应的情景短信、短信内容的分类、文本级向量、词语级向量以及短信分类模型均可以通过图2或图4所示实施例提供的方法获取。
步骤903,在显示区域显示情景短信。
可选地,终端接收到短信内容对应的情景短信之后展示该情景短信。可选地,终端先向通知栏发送通知消息,该通知消息用于通知存在未读的情景短信,后续终端接收到对应于上述通知消息的触发信号之后,展示该情景短信。
综上所述,本发明实施例提供的方法,通过先根据词向量模型确定出短信内容中的词语分别进行词向量处理,得到词语对应的词语级向量,然后对上述词语级向量确定进行统计处理,得到短信内容对应的文本级向量,最后调用短信分类模型对上述文本级向量进行处理,进而确定短信的分类,并基于短信的分类生成情景短信;由于按照从词语级向量到文本级向量的顺序由浅及深地对短信内容进行提炼概括,从而使文本级向量能较好地表征短信的特征,后续对短信进行分类时的准确率得到提升,所生成的情景短信的准确度也得到相应地提升。
图10是本发明另一个示例性实施例示出的情景短信显示方法的流程图。该方法可以应用于图1所示实施环境的终端中。在本发明实施例中,情景短信由终端生成。该方法包括如下步骤:
步骤1001,向服务器发送短信内容。
可选地,终端向服务器发送短信分类请求,该短信分类请求携带短信内容。短信分类请求用于请求获取短信内容的分类。
终端发送短信分类请求的时机可以参考步骤901,此处不再赘述。
相应地,服务器接收终端发送的短信内容。
步骤1002,接收服务器发送的短信内容的分类。
短信内容的分类由服务器调用短信分类模型对短信内容对应的文本级向量进行处理得到,可以通过图2或图4所示实施例提供的方法获取。文本级向量用于表示短信内容的语义特征,文本级向量由服务器对短信内容所包括的词语对应的词语级向量对短信内容所包括的词语对应的词向量进行统计处理得到。词向量由服务器对短信内容所包括的词语进行词向量处理得到。
上述短信内容的分类、文本级向量、词语级向量以及短信分类模型均可以通过图2或图4所示实施例提供的方法获取。
步骤1003,根据短信内容的分类生成短信内容对应的情景短信。
短信内容对应的情景短信是将短信内容中的关键信息以文字、数字和图片中的至少一种来进行突出显示的多媒体短信。终端生成情景短信的方法可以参考服务器生成情景短信的方法,此处不再赘述。
步骤1004,在显示区域显示情景短信。
综上所述,本发明实施例提供的方法,通过先对短信内容中的词语进行词向量处理,得到对应的词语级向量,然后对上述词语级向量确定进行统计处理,得到短信内容对应的文本级向量,最后调用短信分类模型对上述文本级向量进行处理,进而确定短信的分类,并基于短信的分类生成情景短信;由于按照从词语级向量到文本级向量的顺序由浅及深地对短信内容的语义特征进行提炼概括,从而使文本级向量能较好地表征短信的语义特征,后续对短信进行分类时的准确率得到提升,所生成的情景短信的准确度也得到相应地提升。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
请参考图11,其示出了本发明一个实施例提供的短信管理装置的框图。该装置具有实现上述短信管理方法中的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以包括:第一获取模块1101、分词处理模块1102、第二获取模块1103、第三获取模块1104和分类确定模块1105。
第一获取模块1101,用于获取接收到的短信内容。
分词处理模块1102,用于对所述短信内容进行分词处理,得到所述短信内容所包括的词语。
第二获取模块1103,用于对所述经过分词处理所得到的词语进行词向量处理,得到所述词语对应的词语级向量。
第三获取模块1104,用于对所述词语级向量进行统计处理,得到所述短信内容对应的文本级向量,所述文本级向量用于表示所述短信内容的语义特征。
分类确定模块1105,用于调用短信分类模型对所述文本级向量进行处理,得到所述短信内容的分类。
综上所述,本发明实施例提供的装置,通过对短信内容中的词语分别进行词向量处理,得到词语对应的词语级向量,然后对上述词语级向量进行统计处理,得到短信内容对应的文本级向量,最后调用短信分类模型对上述文本级向量进行处理,进而确定短信的分类;由于按照从词语级向量到文本级向量的顺序由浅及深地对短信内容的语义特征进行提炼概括,从而使文本级向量能较好地表征短信的语义特征,从而使后续对短信进行分类时的准确率得到提升。
在基于图11所示实施例提供的一个可选实施例中,所述第三获取模块1104,用于:
对所述词语进行统计处理,得到中间特征向量,所述中间特征向量包括均值特征向量、最大值特征向量、方差特征向量中的至少一种;
根据所述中间特征向量确定所述文本级向量;
其中,所述均值特征向量是对各个所述词语分别对应的词语级向量求平均值得到的,所述最大值特征向量是各个所述词语分别对应的词语级向量中最大的词语级向量,所述方差特征向量是对各个所述词语分别对应的词语级向量求方差得到的。
可选地,所述第三获取模块1104,用于:
当所述中间特征向量包括均值特征向量、最大值特征向量、方差特征向量中的任意一种时,将所述中间特征向量确定为所述文本级向量;
当所述中间特征向量包括均值特征向量、最大值特征向量、方差特征向量中的至少两种时,对所述中间特征向量进行拼接处理,得到所述文本级向量。
在基于图11所示实施例提供的另一个可选实施例中,所述装置还包括:聚合处理模块(图中未示出)。
聚合处理模块,用于对所述词语进行聚合处理,得到聚合处理后的所述词语,所述聚合处理是指将相同语义类型的至少两个词语采用一个类型标识来表示。
所述第二获取模块1103,还用于基于对所述聚合处理后的所述词语进行词向量处理,得到所述聚合处理后的词语对应的词语级向量。
在基于图11所示实施例提供的另一个可选实施例中,所述装置还包括:第一生成模块(图中未示出)。
第一生成模块,用于根据所述短信内容的分类生成所述短信内容对应的情景短信,所述情景短信是将所述短信内容中的关键信息以文字、数字和图片中的至少一种来进行突出显示的多媒体短信。
可选地,所述第一生成模块,用于:
根据所述短信内容的分类获取所述短信内容的关键信息;
对所述短信内容的关键信息进行整合,得到所述短信内容对应的情景短信。
在基于图11所示实施例提供的另一个可选实施例中,所述装置还包括:第四获取模块、第五获取模块、向量调整模块和第二生成模块(图中未示出)。
第四获取模块,用于获取第一训练样本集,所述第一训练样本集包括多个第一训练样本,每个所述第一训练样本包括至少一个词语和每个词语的上下文,所述词语对应有向量,所述词语的上下文也对应有向量。
第五获取模块,用于对于所述多个第一训练样本中的每个第一训练样本,将所述词语的上下文对应的向量输入第一原始模型,得到第一训练结果,所述第一训练结果包括每个词语的出现概率。
向量调整模块,用于根据所述第一训练结果调整所述词语的上下文对应的向量,并将调整后的向量再次输入所述第一原始模型,直至所述第一训练结果符合期望结果,所述期望结果是指所述上下文对应的词语的出现概率符合预设条件。
第二生成模块,用于当所述第一训练结果符合所述期望结果时,根据各个词语对应的向量生成词向量模型,所述词向量模型用于对所述经过分词处理所得到的词语进行词向量处理。
在基于图11所示实施例提供的另一个可选实施例中,所述装置还包括:第六获取模块、第七获取模块、损失计算模块和第三生成模块(图中未示出)。
第六获取模块,用于获取第二训练样本集,所述第二训练样本集包括多个第二训练样本,每个所述第二训练样本对应有分类标签。
第七获取模块,用于对于所述多个第二训练样本中的每个第二训练样本,将所述第二训练样本输入第二原始模型,得到第二训练结果。
损失计算模块,用于将所述第二训练结果与所述分类标签进行比较,得到计算损失,所述计算损失用于指示所述第二训练结果与所述分类标签之间的误差。
第三生成模块,用于根据所述多个第二训练样本各自对应的计算损失,采用误差反向传播算法训练得到所述短信分类模型。
请参考图12,其示出了本发明一个实施例提供的情景短信显示装置的框图。该装置具有实现上述情景短信显示方法中的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以包括:第一发送模块1201、第一接收模块1202和第一显示模块1203。
第一发送模块1201,用于向服务器发送短信内容。
第一接收模块1202,用于接收所述服务器发送的所述短信内容对应的情景短信,所述情景短信是将所述短信内容中的关键信息以文字、数字和图片中的至少一种来进行突出显示的多媒体短信,所述情景短信由所述服务器根据所述短信内容的分类生成,所述短信内容的分类由所述服务器调用短信分类模型对所述短信内容对应的文本级向量进行处理得到,所述文本级向量用于表示所述短信内容的语义特征,所述文本级向量由所述服务器对所述短信内容所包括的词语对应的词语级向量进行统计处理得到,所述词向量由所述服务器对所述短信内容所包括的词语进行词向量处理得到。
第一显示模块1203,用于在显示区域显示所述情景短信。
综上所述,本发明实施例提供的装置,通过对短信内容中的词语分别进行词向量处理,得到词语对应的词语级向量,然后对上述词语级向量进行统计处理,得到短信内容对应的文本级向量,最后调用短信分类模型对上述文本级向量进行处理,进而确定短信的分类,并基于短信的分类生成情景短信;由于按照从词语级向量到文本级向量的顺序由浅及深地对短信内容的语义特征进行提炼概括,从而使文本级向量能较好地表征短信的语义特征,后续对短信进行分类时的准确率得到提升,所生成的情景短信的准确度也得到相应地提升。
请参考图13,其示出了本发明另一个实施例提供的情景短信显示装置的框图。该装置具有实现上述情景短信显示方法中的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以包括:第二发送模块1301、第二接收模块1302、第四生成模块1303和第二显示模块1304。
第二发送模块1301,用于向服务器发送短信内容。
第二接收模块1302,用于接收所述服务器发送的所述短信内容的分类,所述短信内容的分类由所述服务器调用短信分类模型对所述短信内容对应的文本级向量进行处理得到,所述文本级向量由所述服务器对所述短信内容所包括的词语对应的词语级向量进行统计处理得到,所述词向量由所述服务器对所述短信内容所包括的词语进行词向量处理得到;
第四生成模块1303,用于根据所述短信内容的分类生成所述短信内容对应的情景短信,所述情景短信是将所述短信内容中的关键信息以文字、数字和图片中的至少一种来进行突出显示的多媒体短信。
第二显示模块1304,用于在显示区域显示所述情景短信。
综上所述,本发明实施例提供的装置,通过对短信内容中的词语分别进行词向量处理,得到词语对应的词语级向量,然后对上述词语级向量进行统计处理,得到短信内容对应的文本级向量,最后调用文本级向量输入短信分类模型对上述文本级向量进行处理,进而确定短信的分类,并基于短信的分类生成情景短信;由于按照从词语级向量到文本级向量的顺序由浅及深地对短信内容的语义特征进行提炼概括,从而使文本级向量能较好地表征短信的语义特征,后续对短信进行分类时的准确率得到提升,所生成的情景短信的准确度也得到相应地提升。
请参考图14,其示出了本发明一个实施例提供的电子设备的结构示意图。该电子设备可以是服务器。该电子设备用于实施上述实施例中提供的短信管理方法和/或情景短信显示方法。具体来讲:
所述电子设备1400包括中央处理单元(CPU)1401、包括随机存取存储器(RAM)1402和只读存储器(ROM)1403的系统存储器1404,以及连接系统存储器1404和中央处理单元1401的系统总线1405。所述电子设备1400还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)1406,和用于存储操作系统1413、应用程序1414和其他程序模块1415的大容量存储设备1407。
所述基本输入/输出系统1406包括有用于显示信息的显示器1408和用于用户输入信息的诸如鼠标、键盘之类的输入设备1409。其中所述显示器1408和输入设备1409都通过连接到系统总线1405的输入输出控制器1410连接到中央处理单元1401。所述基本输入/输出系统1406还可以包括输入输出控制器1410以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器1410还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备1407通过连接到系统总线1405的大容量存储控制器(未示出)连接到中央处理单元1401。所述大容量存储设备1407及其相关联的计算机可读介质为电子设备1400提供非易失性存储。也就是说,所述大容量存储设备1407可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器1404和大容量存储设备1407可以统称为存储器。
根据本发明的各种实施例,所述电子设备1400还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即电子设备1400可以通过连接在所述系统总线1405上的网络接口单元1411连接到网络1412,或者说,也可以使用网络接口单元1411来连接到其他类型的网络或远程计算机系统(未示出)。
所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行。上述一个或者一个以上程序包含用于执行上述短信管理方法或情景短信显示方法的指令。
图15示出了本发明一个示例性实施例提供的终端1500的结构框图。该终端1500可以是:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio LayerIII,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group AudioLayer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1500还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端1500包括有:处理器1501和存储器1502。
处理器1501可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1501可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1501也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1501可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1501还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1502可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1502还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1502中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1501所执行以实现本申请中方法实施例提供的短信管理方法和/或情景短信显示方法。
在一些实施例中,终端1500还可选包括有:外围设备接口1503和至少一个外围设备。处理器1501、存储器1502和外围设备接口1503之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1503相连。具体地,外围设备包括:射频电路1504、触摸显示屏1505、摄像头1506、音频电路1507、定位组件1508和电源1509中的至少一种。
外围设备接口1503可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器1501和存储器1502。在一些实施例中,处理器1501、存储器1502和外围设备接口1503被集成在同一芯片或电路板上;在一些其他实施例中,处理器1501、存储器1502和外围设备接口1503中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1504用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1504通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1504将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1504包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1504可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1504还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1505用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1505是触摸显示屏时,显示屏1505还具有采集在显示屏1505的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1501进行处理。此时,显示屏1505还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1505可以为一个,设置终端1500的前面板;在另一些实施例中,显示屏1505可以为至少两个,分别设置在终端1500的不同表面或呈折叠设计;在再一些实施例中,显示屏1505可以是柔性显示屏,设置在终端1500的弯曲表面上或折叠面上。甚至,显示屏1505还可以设置成非矩形的不规则图形,也即异形屏。显示屏1505可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件1506用于采集图像或视频。可选地,摄像头组件1506包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1506还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1507可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1501进行处理,或者输入至射频电路1504以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1500的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1501或射频电路1504的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1507还可以包括耳机插孔。
定位组件1508用于定位终端1500的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件1508可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源1509用于为终端1500中的各个组件进行供电。电源1509可以是交流电、直流电、一次性电池或可充电电池。当电源1509包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端1500还包括有一个或多个传感器1510。该一个或多个传感器1510包括但不限于:加速度传感器1511、陀螺仪传感器1512、压力传感器1513、指纹传感器1514、光学传感器1515以及接近传感器1516。
加速度传感器1511可以检测以终端1500建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1511可以用于检测重力加速度在三个坐标轴上的分量。处理器1501可以根据加速度传感器1511采集的重力加速度信号,控制触摸显示屏1505以横向视图或纵向视图进行用户界面的显示。加速度传感器1511还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器1512可以检测终端1500的机体方向及转动角度,陀螺仪传感器1512可以与加速度传感器1511协同采集用户对终端1500的3D动作。处理器1501根据陀螺仪传感器1512采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器1513可以设置在终端1500的侧边框和/或触摸显示屏1505的下层。当压力传感器1513设置在终端1500的侧边框时,可以检测用户对终端1500的握持信号,由处理器1501根据压力传感器1513采集的握持信号进行左右手识别或快捷操作。当压力传感器1513设置在触摸显示屏1505的下层时,由处理器1501根据用户对触摸显示屏1505的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器1514用于采集用户的指纹,由处理器1501根据指纹传感器1514采集到的指纹识别用户的身份,或者,由指纹传感器1514根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1501授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1514可以被设置终端1500的正面、背面或侧面。当终端1500上设置有物理按键或厂商Logo时,指纹传感器1514可以与物理按键或厂商Logo集成在一起。
光学传感器1515用于采集环境光强度。在一个实施例中,处理器1501可以根据光学传感器1515采集的环境光强度,控制触摸显示屏1505的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏1505的显示亮度;当环境光强度较低时,调低触摸显示屏1505的显示亮度。在另一个实施例中,处理器1501还可以根据光学传感器1515采集的环境光强度,动态调整摄像头组件15015的拍摄参数。
接近传感器1516,也称距离传感器,通常设置在终端1500的前面板。接近传感器1516用于采集用户与终端1500的正面之间的距离。在一个实施例中,当接近传感器1516检测到用户与终端1500的正面之间的距离逐渐变小时,由处理器1501控制触摸显示屏1505从亮屏状态切换为息屏状态;当接近传感器1516检测到用户与终端1500的正面之间的距离逐渐变大时,由处理器1501控制触摸显示屏1505从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图15中示出的结构并不构成对终端1500的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
在示例性实施例中,还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由电子设备的处理器加载并执行以实现上述方法实施例中的短信管理方法和/或情景短信显示方法。
可选地,上述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本文中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上仅为本发明的示例性实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (15)

1.一种短信管理方法,其特征在于,所述方法包括:
获取接收到的短信内容;
对所述短信内容进行分词处理,得到所述短信内容所包括的词语;
对所述经过分词处理所得到的词语进行词向量处理,得到所述词语对应的词语级向量;
对所述词语级向量进行统计处理,得到所述短信内容对应的文本级向量,所述文本级向量用于表示所述短信内容的语义特征;
调用短信分类模型对所述文本级向量进行处理,得到所述短信内容的分类。
2.根据权利要求1所述的方法,其特征在于,所述对所述词语级向量进行统计处理,得到所述短信内容对应的文本级向量,包括:
对所述词语级向量进行统计处理,得到中间特征向量,所述中间特征向量包括均值特征向量、最大值特征向量、方差特征向量中的至少一种;
根据所述中间特征向量确定所述文本级向量;
其中,所述均值特征向量是对各个所述词语分别对应的词语级向量求平均值得到的,所述最大值特征向量是各个所述词语分别对应的词语级向量中最大的词语级向量,所述方差特征向量是对各个所述词语分别对应的词语级向量求方差得到的。
3.根据权利要求2所述的方法,其特征在于,所述根据所述中间特征向量确定所述文本级向量,包括:
当所述中间特征向量包括均值特征向量、最大值特征向量、方差特征向量中的任意一种时,将所述中间特征向量确定为所述文本级向量;
当所述中间特征向量包括均值特征向量、最大值特征向量、方差特征向量中的至少两种时,对所述中间特征向量进行拼接处理,得到所述文本级向量。
4.根据权利要求1所述的方法,其特征在于,所述对所述经过分词处理所得到的词语进行词向量处理,得到所述词语对应的词语级向量之前,还包括:
对所述词语进行聚合处理,得到聚合处理后的所述词语,所述聚合处理是指将相同语义类型的至少两个词语采用一个类型标识来表示;
所述对所述经过分词处理所得到的词语进行词向量处理,得到所述词语对应的词语级向量,包括:
对所述聚合处理后的所述词语进行词向量处理,得到所述聚合处理后的词语对应的词语级向量。
5.根据权利要求1所述的方法,其特征在于,所述调用短信分类模型对所述文本级向量进行处理,得到所述短信内容的分类之后,还包括:
根据所述短信内容的分类生成所述短信内容对应的情景短信,所述情景短信是将所述短信内容中的关键信息以文字、数字和图片中的至少一种来进行突出显示的多媒体短信。
6.根据权利要求5所述的方法,其特征在于,所述根据所述短信内容的分类生成所述短信内容的情景短信,包括:
根据所述短信内容的分类获取所述短信内容的关键信息;
对所述短信内容的关键信息进行整合,得到所述短信内容对应的情景短信。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述对所述经过分词处理所得到的词语进行词向量处理,得到所述词语对应的词语级向量之前,还包括:
获取第一训练样本集,所述第一训练样本集包括多个第一训练样本,每个所述第一训练样本包括至少一个词语和每个词语的上下文,所述词语对应有向量,所述词语的上下文也对应有向量;
对于所述多个第一训练样本中的每个第一训练样本,将所述词语的上下文对应的向量输入第一原始模型,得到第一训练结果,所述第一训练结果包括每个词语的出现概率;
根据所述第一训练结果调整所述词语的上下文对应的向量,并将调整后的向量再次输入所述第一原始模型,直至所述第一训练结果符合期望结果,所述期望结果是指所述上下文对应的词语的出现概率符合预设条件;
当所述第一训练结果符合所述期望结果时,根据各个词语对应的向量生成词向量模型,所述词向量模型用于对所述经过分词处理所得到的词语进行词向量处理。
8.根据权利要求1至6任一项所述的方法,其特征在于,所述调用短信分类模型对所述文本级向量进行处理,得到所述短信内容的分类之前,还包括:
获取第二训练样本集,所述第二训练样本集包括多个第二训练样本,每个所述第二训练样本对应有分类标签;
对于所述多个第二训练样本中的每个第二训练样本,将所述第二训练样本输入第二原始模型,得到第二训练结果;
将所述第二训练结果与所述分类标签进行比较,得到计算损失,所述计算损失用于指示所述第二训练结果与所述分类标签之间的误差;
根据所述多个第二训练样本各自对应的计算损失,采用误差反向传播算法训练得到所述短信分类模型。
9.一种情景短信显示方法,其特征在于,所述方法包括:
向服务器发送短信内容;
接收所述服务器发送的所述短信内容对应的情景短信,所述情景短信是将所述短信内容中的关键信息以文字、数字和图片中的至少一种来进行突出显示的多媒体短信,所述情景短信由所述服务器根据所述短信内容的分类生成,所述短信内容的分类由所述服务器调用短信分类模型对所述短信内容对应的文本级向量进行处理得到,所述文本级向量用于表示所述短信内容的语义特征,所述文本级向量由所述服务器对所述短信内容所包括的词语对应的词向量进行统计处理得到,所述词向量由所述服务器对所述短信内容所包括的词语进行词向量处理得到;
在显示区域显示所述情景短信。
10.一种情景短信显示方法,其特征在于,所述方法包括:
向服务器发送短信内容;
接收所述服务器发送的所述短信内容的分类,所述短信内容的分类由所述服务器调用短信分类模型对所述短信内容对应的文本级向量进行处理得到,所述文本级向量用于表示所述短信内容的语义特征,所述文本级向量由所述服务器对所述短信内容所包括的词语对应的词向量进行统计处理得到,所述词向量由所述服务器对所述短信内容所包括的词语进行词向量处理得到;
根据所述短信内容的分类生成所述短信内容对应的情景短信,所述情景短信是将所述短信内容中的关键信息以文字、数字和图片中的至少一种来进行突出显示的多媒体短信;
在显示区域显示所述情景短信。
11.一种短信管理装置,其特征在于,所述装置包括:
第一获取模块,用于获取接收到的短信内容;
分词处理模块,用于对所述短信内容进行分词处理,得到所述短信内容所包括的词语;
第二获取模块,用于对所述经过分词处理得到的词语进行词向量处理,得到所述词语对应的词语级向量;
第三获取模块,用于对所述词语级向量进行统计处理,得到所述短信内容对应的文本级向量,所述文本级向量用于表示所述短信内容的语义特征;
分类确定模块,用于调用所述短信分类模型对所述文本级向量进行处理,得到所述短信内容的分类。
12.一种情景短信显示装置,其特征在于,所述装置包括:
第一发送模块,用于向服务器发送短信内容;
第一接收模块,用于接收所述服务器发送的所述短信内容对应的情景短信,,所述情景短信是将所述短信内容中的关键信息以文字、数字和图片中的至少一种来进行突出显示的多媒体短信,所述情景短信由所述服务器根据所述短信内容的分类生成,所述短信内容的分类由所述服务器调用短信分类模型对所述短信内容对应的文本级向量进行处理得到,所述文本级向量由所述服务器对所述短信内容所包括的词语对应的词语级向量进行统计处理得到,所述词向量由所述服务器对所述短信内容所包括的词语进行词向量处理得到;
第一显示模块,用于在显示区域显示所述情景短信。
13.一种情景短信显示装置,其特征在于,所述装置包括:
第二发送模块,用于向服务器发送短信内容;
第二接收模块,用于接收所述服务器发送的所述短信内容的分类,所述短信内容的分类由所述服务器调用短信分类模型对所述短信内容对应的文本级向量进行处理得到,所述文本级向量由所述服务器对所述短信内容所包括的词语对应的词语级向量进行统计处理得到,所述词向量由所述服务器对所述短信内容所包括的词语进行词向量处理得到;
短信生成模块,用于根据所述短信内容的分类生成所述短信内容对应的情景短信,所述情景短信是将所述短信内容中的关键信息以文字、数字和图片中的至少一种来进行突出显示的多媒体短信;
第二显示模块,用于在显示区域显示所述情景短信。
14.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至8任一项所述的短信管理方法,或,如权利要求9所述的情景短信显示方法,或,如权利要求10所述的情景短信显示方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至8任一项所述的短信管理方法,或,如权利要求8所述的情景短信显示方法,或,如权利要求9所述的情景短信显示方法。
CN201810377060.3A 2018-04-25 2018-04-25 短信管理方法、装置及电子设备 Active CN108595634B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810377060.3A CN108595634B (zh) 2018-04-25 2018-04-25 短信管理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810377060.3A CN108595634B (zh) 2018-04-25 2018-04-25 短信管理方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN108595634A true CN108595634A (zh) 2018-09-28
CN108595634B CN108595634B (zh) 2023-05-30

Family

ID=63609492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810377060.3A Active CN108595634B (zh) 2018-04-25 2018-04-25 短信管理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN108595634B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109598479A (zh) * 2018-10-25 2019-04-09 北京奇虎科技有限公司 一种账单提取方法、装置、电子设备及介质
CN110019817A (zh) * 2018-12-04 2019-07-16 阿里巴巴集团控股有限公司 一种视频中文字信息的检测方法、装置及电子设备
CN110730270A (zh) * 2019-09-09 2020-01-24 上海凯京信达科技集团有限公司 一种短信分组方法、装置及计算机存储介质、电子设备
CN110798567A (zh) * 2019-08-14 2020-02-14 腾讯科技(深圳)有限公司 短信分类显示方法及装置、存储介质、电子设备
WO2020244336A1 (zh) * 2019-06-04 2020-12-10 深圳前海微众银行股份有限公司 一种告警分类方法、装置、电子设备及存储介质
CN112533155A (zh) * 2019-08-30 2021-03-19 腾讯科技(深圳)有限公司 一种短信清理方法、装置、服务器及存储介质
CN113761184A (zh) * 2020-09-29 2021-12-07 北京沃东天骏信息技术有限公司 文本数据的分类方法、设备及存储介质
CN116049358A (zh) * 2023-03-31 2023-05-02 得分数字科技(珠海)有限公司 发票信息近似度检测方法、存储介质及计算机设备
CN116456347A (zh) * 2023-06-16 2023-07-18 安徽创瑞信息技术有限公司 一种终端信息处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105451202A (zh) * 2015-05-28 2016-03-30 小米科技有限责任公司 短信处理方法及装置
CN105516499A (zh) * 2015-12-14 2016-04-20 北京奇虎科技有限公司 一种对短信进行分类的方法、装置、通信终端及服务器
CN105930318A (zh) * 2016-04-11 2016-09-07 深圳大学 一种词向量训练方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105451202A (zh) * 2015-05-28 2016-03-30 小米科技有限责任公司 短信处理方法及装置
CN105516499A (zh) * 2015-12-14 2016-04-20 北京奇虎科技有限公司 一种对短信进行分类的方法、装置、通信终端及服务器
CN105930318A (zh) * 2016-04-11 2016-09-07 深圳大学 一种词向量训练方法及系统

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109598479B (zh) * 2018-10-25 2024-04-05 三六零科技集团有限公司 一种账单提取方法、装置、电子设备及介质
CN109598479A (zh) * 2018-10-25 2019-04-09 北京奇虎科技有限公司 一种账单提取方法、装置、电子设备及介质
CN110019817A (zh) * 2018-12-04 2019-07-16 阿里巴巴集团控股有限公司 一种视频中文字信息的检测方法、装置及电子设备
WO2020244336A1 (zh) * 2019-06-04 2020-12-10 深圳前海微众银行股份有限公司 一种告警分类方法、装置、电子设备及存储介质
CN110798567A (zh) * 2019-08-14 2020-02-14 腾讯科技(深圳)有限公司 短信分类显示方法及装置、存储介质、电子设备
CN112533155A (zh) * 2019-08-30 2021-03-19 腾讯科技(深圳)有限公司 一种短信清理方法、装置、服务器及存储介质
CN112533155B (zh) * 2019-08-30 2022-06-07 腾讯科技(深圳)有限公司 一种短信清理方法、装置、服务器及存储介质
CN110730270A (zh) * 2019-09-09 2020-01-24 上海凯京信达科技集团有限公司 一种短信分组方法、装置及计算机存储介质、电子设备
CN113761184A (zh) * 2020-09-29 2021-12-07 北京沃东天骏信息技术有限公司 文本数据的分类方法、设备及存储介质
CN113761184B (zh) * 2020-09-29 2024-12-31 北京沃东天骏信息技术有限公司 文本数据的分类方法、设备及存储介质
CN116049358A (zh) * 2023-03-31 2023-05-02 得分数字科技(珠海)有限公司 发票信息近似度检测方法、存储介质及计算机设备
CN116456347A (zh) * 2023-06-16 2023-07-18 安徽创瑞信息技术有限公司 一种终端信息处理方法
CN116456347B (zh) * 2023-06-16 2023-09-08 安徽创瑞信息技术有限公司 一种终端信息处理方法

Also Published As

Publication number Publication date
CN108595634B (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
CN108595634A (zh) 短信管理方法、装置及电子设备
US11151360B2 (en) Facial attribute recognition method, electronic device, and storage medium
CN106713116B (zh) 信息处理方法、装置及系统
CN110209952A (zh) 信息推荐方法、装置、设备及存储介质
US11826661B2 (en) Information display method and apparatus for virtual object, terminal, server, and storage medium
CN108776568A (zh) 网页页面的显示方法、装置、终端及存储介质
CN110097428A (zh) 电子订单生成方法、装置、终端及存储介质
CN110020880A (zh) 广告投放方法、装置及设备
CN108536463A (zh) 获取资源包的方法、装置、设备及计算机可读存储介质
CN107967154A (zh) 提醒事项生成方法及装置
CN110400304A (zh) 基于深度学习的物体检测方法、装置、设备及存储介质
CN111159153B (zh) 业务数据校验方法、装置、计算机设备及存储介质
CN108959361A (zh) 表单管理的方法和装置
CN112036492B (zh) 样本集处理方法、装置、设备及存储介质
CN111078521A (zh) 异常事件的分析方法、装置、设备、系统及存储介质
CN109784351A (zh) 数据分类方法、分类模型训练方法及装置
CN110147503A (zh) 信息发布方法、装置、计算机设备和存储介质
CN111506758A (zh) 物品名称确定方法、装置、计算机设备及存储介质
CN108363982A (zh) 确定对象数量的方法及装置
CN110490389A (zh) 点击率预测方法、装置、设备及介质
CN110109608A (zh) 文本显示方法、装置、终端及存储介质
CN109992685A (zh) 一种检索图片的方法及装置
CN108922531A (zh) 槽位识别方法、装置、电子设备及存储介质
CN108111397A (zh) 转发通知消息的处理方法及装置
CN109085991A (zh) 应用程序控制方法及装置、终端、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant