[go: up one dir, main page]

CN108628863A - 信息获取方法和装置 - Google Patents

信息获取方法和装置 Download PDF

Info

Publication number
CN108628863A
CN108628863A CN201710153107.3A CN201710153107A CN108628863A CN 108628863 A CN108628863 A CN 108628863A CN 201710153107 A CN201710153107 A CN 201710153107A CN 108628863 A CN108628863 A CN 108628863A
Authority
CN
China
Prior art keywords
information
financial
ratio
default
events
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710153107.3A
Other languages
English (en)
Other versions
CN108628863B (zh
Inventor
杨兴
杨晓静
武熠阳
赵鑫
王江丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing duxiaoman Youyang Technology Co.,Ltd.
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710153107.3A priority Critical patent/CN108628863B/zh
Publication of CN108628863A publication Critical patent/CN108628863A/zh
Application granted granted Critical
Publication of CN108628863B publication Critical patent/CN108628863B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请公开了信息获取方法和装置。该方法的一具体实施方式包括:获取金融对象对应的实体对象的资讯信息,以及提取出资讯信息中的关键词;将关键词输入到预设逻辑回归模型,得到输出结果,其中,预设逻辑回归模型基于预先利用多个金融对象的特征信息进行训练而生成;基于输出结果,生成指示金融对象是否会发生预设金融事件的指示信息。实现了无需依靠财报数据,仅需从诸如新闻的资讯信提取出关键词,通过逻辑回归模型,即可完成对金融对象是否会发生预设金融事件的预测,从而及时地提供预测结果。

Description

信息获取方法和装置
技术领域
本申请涉及计算机领域,具体涉及数据分析领域,尤其涉及信息获取方法和装置。
背景技术
对金融对象(例如债券)是否会发生金融事件(例如违约事件)进行预测是金融对象的投资决策中最为关键的环节。目前,通常采用的方式为:根据金融对象对应的实体对象的财报数据,对金融对象是否会发生金融事件进行预测。
然而,由于财报数据具有滞后性,导致无法及时地得到金融对象是否会发生金融事件的预测结果,进而影响金融对象的投资决策。
发明内容
本申请提供了信息获取方法和装置,用于解决上述背景技术部分存在的技术问题。
第一方面,本申请提供了信息获取方法,该方法包括:获取金融对象对应的实体对象的资讯信息,以及提取出资讯信息中的关键词;将关键词输入到预设逻辑回归模型,得到输出结果,其中,预设逻辑回归模型基于预先利用多个金融对象的特征信息进行训练而生成,特征信息包括:指示金融对象是否发生过预设金融事件的标注信息、金融对象对应的实体对象的资讯信息中的预设金融事件关键词;基于输出结果,生成指示金融对象是否会发生预设金融事件的指示信息。
第二方面,本申请提供了信息获取装置,该装置包括:获取单元,配置用于获取金融对象对应的实体对象的资讯信息,以及提取出资讯信息中的关键词;预测单元,配置用于将关键词输入到预设逻辑回归模型,得到输出结果,其中,预设逻辑回归模型基于预先利用多个金融对象的特征信息进行训练而生成,特征信息包括:指示金融对象是否发生过预设金融事件的标注信息、金融对象对应的实体对象的资讯信息中的预设金融事件关键词;生成单元,配置用于基于输出结果,生成指示金融对象是否会发生预设金融事件的指示信息。
本申请提供的信息获取方法和装置,通过获取金融对象对应的实体对象的资讯信息,以及提取出资讯信息中的关键词;将关键词输入到预设逻辑回归模型,得到输出结果,其中,预设逻辑回归模型基于预先利用多个金融对象的特征信息进行训练而生成;基于输出结果,生成指示金融对象是否会发生预设金融事件的指示信息。实现了无需依靠财报数据,仅需从诸如新闻的资讯信提取出关键词,通过逻辑回归模型,即可完成对金融对象是否会发生预设金融事件的预测,从而及时地提供预测结果。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是可以应用于本申请的信息获取方法或装置的示例性系统架构图;
图2示出了根据本申请的信息获取方法一个实施例的流程图;
图3示出了构建预设逻辑回归模型的一个示例性流程图;
图4示出了根据本申请的信息获取装置的一个实施例的结构示意图;
图5是适于用来实现本申请实施例的信息获取方法的服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用于本申请的信息获取方法或装置的示例性系统架构。
如图1所示,系统架构可以包括服务器101、网络102、服务器103。网络102用以在服务器101和服务器103之间提供传输链路的介质。服务器103可以为提供网络资源例如财经新闻的服务器。服务器101可以采用网络爬虫获取服务器103上的网络资源例如发行债券的公司的新闻。
请参考图2,其示出了根据本申请的信息获取方法的一个实施例的流程图。该方法可以由服务器例如图1中的服务器101执行,相应地,装置可以设置于服务器例如图1中的服务器101中。该方法包括以下步骤:
步骤201,获取金融对象对应的实体对象的资讯信息,以及提取出资讯信息中的关键词。
在本实施例中,为预测金融对象是否会发生预设金融事件,可以首先获取金融对象对应的实体对象的资讯信息。例如,金融对象为债券,预设金融事件未违约事件,金融对象对应的实体对象为发行债券的公司,为预测债券是否会发生违约事件,资讯信息为发行债券的公司的新闻,可以首先获取发行债券的公司的新闻。
在本实施例中,在获取到资讯信息之后,可以提取出资讯信息中的关键词,关键词可以与金融对象对应的实体对象的运营状况相关联。以金融对象为债券,实体对象为发行债券的公司为例,发行债券的公司的新闻中,包含与公司的运营状况相关联的词语。例如,涉及到该公司投资项目的进展情况的新闻中记载该公司的一个项目进展缓慢,则可以提取出项目名称、进展、缓慢等关键词。
步骤202,将关键词输入到预设逻辑回归模型,得到输出结果。
在本实施例中,在通过步骤201提取出关键词之后,可以采用预设逻辑回归模型基于提取出的关键词,预测金融对象是否会发生预设金融事件。例如,金融对象为债券,预设金融事件为违约事件,可以根据提取出的关键词,预测债券是否会发生违约事件。
以金融对象为债券,预设金融事件为违约事件为例,可以预先获取多个债券的特征信息,债券的特征信息包括:指示债券是否发生过违约事件的标注信息、债券对应的实体对象例如发行债券的公司的新闻中的预设金融事件关键词。可以预先利用多个债券的特征信息,对逻辑回归模型进行训练,得到预设逻辑回归模型。经过训练之后,预设逻辑回归模型可以确定每一个预设金融事件关键词的权重即回归系数。每一个预设金融事件关键词的权重指示预设金融事件关键词对于判断债券是否会发生违约事件的重要程度。
在本实施例的一些可选的实现方式中,可以预先获取发生过预设金融事件的金融对象对应的实体对象的资讯信息;将资讯信息划分为多个资讯语句,以及对资讯语句进行分词,得到多个词语;对多个词语进行聚类分析,得到预设金融事件关键词。
以金融对象为债券,预设金融事件为违约事件为例,可以预先获取一定时间段内例如三年内发生过违约事件的债券的公司的新闻,将新闻划分为多个语句,对语句进行分词之后,可以得到多个词语。可以对多个词语进行聚类分析,得到与违约事件相关联的预设金融事件关键词。
在本实施例中,在将通过步骤201提取出的关键词输入到预设逻辑回归模型之后,预设逻辑回归模型根据与提取出的关键词匹配的预设金融事件关键词的权重即回归系数,得到输出结果。预设逻辑回归模型的输出结果可以为指示金融对象会发生预设金融事件的概率。
在本实施例的一些可选的实现方式中,可以采用以下方式预先构建预设逻辑回归模型:可以首先构建逻辑回归模型,获取多个金融对象的特征信息,以及将多个特征信息划分为用于训练的特征信息和用于验证的特征信息。多个金融对象中,包含发生过预设金融事件的金融对象和未发生过预设金融事件的金融对象。发生过预设金融事件的金融对象的特征信息包括:指示金融对象发生过预设金融事件的标注信息、该金融对象对应的实体对象的资讯信息中的预设金融事件关键词。未发生过预设金融事件的金融对象的特征信息包括:指示金融对象未发生过预设金融事件的标注信息、该金融对象对应的实体对象的资讯信息中的预设金融事件关键词。
在利用用于训练的金融对象的特征信息对逻辑回归模型进行训练时,可以将特征信息中的标注信息作为因变量的数值,例如,金融对象的特征信息中的标注信息为1,表示发生过预设金融事件,金融对象的特征信息中的标注信息为0,表示未发生过预设金融事件。将特征信息中的预设金融事件关键词作为自变量的数值,对逻辑回归模型进行训练,得到训练后的逻辑回归模型。用于训练的金融对象的特征信息中的每一个预设金融事件关键词对应一个回归系数,回归系数可以表示预设金融事件关键词对于判断金融对象是否会发生预设金融事件的重要程度。
然后,可以利用每一个用于验证的金融对象的特征信息中的预设金融事件关键词输入到训练后的逻辑回归模型,得到多个指示金融对象是否会发生预设金融事件的回归结果。用于验证的金融对象的特征信息中包含未发生过预设金融事件的金融对象的特征信息和发生过预设金融事件的金融对象的特征信息。可以将用于验证的金融对象的特征信息中发生过预设金融事件的金融对象的特征信息称之为第一特征信息,将用于验证的金融对象的特征信息中未发生过预设金融事件的金融对象的特征信息称之为第二特征信息。
在得到多个回归结果之后,可以计算所有第一特征信息中对应的回归结果与标注信息一致的第一特征信息的数量与所有第一特征信息的数量比例,将该比例称之为第一比例。换言之,第一比例为利用训练后的逻辑回归模型对所有用于验证的特征信息对应的金融对象中发生过预设金融事件的金融对象是否会发生预设金融事件进行预测,得到的回归结果为会发生预设金融事件的数量与发生过预设金融事件的金融对象的总数量的比例。
在得到多个回归结果之后,可以计算所有第二特征信息中对应的回归结果与标注信息一致的第二特征信息的数量与所有第二特征信息的数量比例,将该比例称之为第二比例。换言之,第二比例为利用训练后的逻辑回归模型对所有用于验证的特征信息对应的金融对象中未发生过预设金融事件的金融对象是否会发生预设金融事件进行预测,得到的回归结果为不会发生预设金融事件的数量与未发生过预设金融事件的金融对象的总数量的比例。
在计算出第一比例和第二比例之后,可以判断第一比例和第二比例是否满足预设条件,预设条件包括:第一比例和第二比例均大于比例阈值,当满足预设条件时,可以将训练后的逻辑回归模型作为预设逻辑回归模型。
当计算出的第一比例和第二比例不满足预设条件时,可以对回归结果进行贝叶斯分析,调整每一个预设金融事件关键词的回归系数直至满足预设条件;将调整预设金融事件关键词的回归系数后的逻辑回归模型作为预设逻辑回归模型。
请参考图3,其示出了构建预设逻辑回归模型的一个示例性流程图。
在本申请中,可以首先对负面样本聚类分析,得出金融事件关键词。例如,金融对象为债券,负面样本为发行发生过违约事件的债券的公司近三年内的新闻,对新闻中的语句进行分词,得到出现在新闻中的多个词语。可以对多个词语进行聚类分析,得到多个金融事件关键词。
建立基于金融事件关键词的逻辑回归模型,输出0-1之间的概率值。基于金融事件关键词的逻辑回归模型中,每一个金融事件关键词对应一个回归系数,该回归系数可以表示预设金融事件关键词对于判断金融对象是否会发生预设金融事件的重要程度。当判断当前金融对象是否会发生预设金融事件时,可以将从当前金融对象对应的实体对象的资讯信息中提取出的与实体对象的运营状态相关联的关键词输入到逻辑回归模型,逻辑回归模型输出指示当前金融对象会发生预设金融事件的概率。
对回归结果进行贝叶斯分析,并对回归系数进行调整。当建立的逻辑回归模型的输出结果不理想时,可以对回归结果进行贝叶斯分析,对预设金融事件关键词的回归系数进行调整。
步骤203,基于输出结果,生成指示金融对象是否会发生预设金融事件的指示信息。
在本实施例中,在通过步骤202将金融对象的关键词输入到预设逻辑回归模型,得到输出结果之后,可以根据输出结果,生成指示金融对象是否会发生预设金融事件的指示信息。例如,预设逻辑回归模型的输出结果为指示金融对象会发生预设金融事件的概率,可以根据该概率,确定金融对象是否会发生预设金融事件,生成指示金融对象是否会发生预设金融事件的指示信息。
在本实施例的一些可选的实现方式中,当预设逻辑回归模型的输出结果为指示金融对象会发生预设金融事件的概率,当预设逻辑回归模型输出的概率大于概率阈值时,可以生成指示金融对象会发生预设金融事件的指示信息。当预设逻辑回归模型输出的概率小于概率阈值时,可以生成指示金融对象不会发生预设金融事件的指示信息。
以金融对象为债券,预设金融事件为违约事件为例,当预设逻辑回归模型输出的概率大于概率阈值时,可以生成指示债券会发生违约事件的指示信息。当预设逻辑回归模型输出的概率小于概率阈值时,可以生成指示债券不会发生违约事件的指示信息。
请参考图4,其示出了根据本申请的信息获取装置的一个实施例的结构示意图,信息获取装置包括:获取单元401,预测单元402,生成单元403。其中,获取单元401配置用于获取金融对象对应的实体对象的资讯信息,以及提取出资讯信息中的关键词;预测单元402配置用于将关键词输入到预设逻辑回归模型,得到输出结果,其中,预设逻辑回归模型基于预先利用多个金融对象的特征信息进行训练而生成,特征信息包括:指示金融对象是否发生过预设金融事件的标注信息、金融对象对应的实体对象的资讯信息中的预设金融事件关键词;生成单元403配置用于基于输出结果,生成指示金融对象是否会发生预设金融事件的指示信息。
在本实施例的一些可选的实现方式中,生成单元403包括:指示信息生成子单元(未示出),配置用于当输出结果为指示金融对象会发生预设金融事件的概率,当概率大于概率阈值时,生成指示金融对象会发生预设金融事件的指示信息;当概率小于概率阈值时,生成指示金融对象不会发生预设金融事件的指示信息。
在本实施例的一些可选的实现方式中,信息获取装置还包括:第一模型生成单元(未示出),配置用于构建逻辑回归模型;获取多个金融对象的特征信息,以及将多个特征信息划分用于训练的特征信息和用于验证的特征信息;利用用于训练的特征信息,对逻辑回归模型进行训练,得到训练后的逻辑回归模型,其中,每一个用于训练的特征信息中的预设金融事件关键词对应一个回归系数;确定用于验证的特征信息中包含指示金融对象发生过预设金融事件的标注信息的第一特征信息的第一数量和包含指示金融对象未发生过预设金融事件的标注信息的第二特征信息的第二数量;将每一个用于验证的特征信息中的预设金融事件关键词输入到训练后的逻辑回归模型,得到多个指示金融对象是否会发生预设金融事件的回归结果;计算第一比例和第二比例,其中,第一比例为对应的回归结果与标注信息一致的第一特征信息的数量与第一数量的比例,第二比例为对应的回归结果与标注信息一致的第二特征信息的数量与第二数量的比例;判断第一比例和第二比例是否满足预设条件,预设条件包括:第一比例和第二比例均大于比例阈值;当第一比例和第二比例满足预设条件时,将训练后的逻辑回归模型作为预设逻辑回归模型;第二模型生成单元(未示出),配置用于当第一比例和第二比例不满足预设条件时,对回归结果进行贝叶斯分析,调整每一个预设金融事件关键词的回归系数直至满足预设条件;将调整预设金融事件关键词的回归系数后的逻辑回归模型作为预设逻辑回归模型;关键词获取单元(未示出),配置用于获取发生过预设金融事件的金融对象对应的实体对象的资讯信息;将资讯信息划分为多个资讯语句,以及对资讯语句进行分词,得到多个词语;对多个词语进行聚类分析,得到预设金融事件关键词。
本申请还提供了一种服务器,该服务器可以包括图4所描述的信息获取装置。该服务器可以配置有一个或多个处理器;存储器,用于存储一个或多个程序,一个或多个程序中可以包含用以执行上述步骤201-203中描述的操作的指令。当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行上述步骤201-203中描述的操作。
图5示出了适于用来实现本申请实施例的信息获取方法的服务器的结构示意图。
如图5所示,包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。CPU 501、ROM502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:输入部分506;输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
本申请中的上述各个步骤描述的过程可以被实现为计算机程序。该计算机程序可以承载在计算机可读介质上,该计算机程序包括用于执行流程图所示的方法的指令。该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。
本申请还提供了一种计算机可读介质,该计算机可读介质可以是服务器中所包括的;也可以是单独存在,未装配入服务器中。该计算机可读介质承载有一个或者多个程序,当一个或者多个程序被该服务器执行时,使得该服务器:获取金融对象对应的实体对象的资讯信息,以及提取出资讯信息中的关键词;将关键词输入到预设逻辑回归模型,得到输出结果,其中,预设逻辑回归模型基于预先利用多个金融对象的特征信息进行训练而生成,特征信息包括:指示金融对象是否发生过预设金融事件的标注信息、金融对象对应的实体对象的资讯信息中的预设金融事件关键词;基于输出结果,生成指示金融对象是否会发生预设金融事件的指示信息。
需要说明的是,上述计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包括或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以为多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包括的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离本申请的构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种信息获取方法,其特征在于,所述方法包括:
获取金融对象对应的实体对象的资讯信息,以及提取出所述资讯信息中的关键词;
将所述关键词输入到预设逻辑回归模型,得到输出结果,其中,预设逻辑回归模型基于预先利用多个金融对象的特征信息进行训练而生成,特征信息包括:指示金融对象是否发生过预设金融事件的标注信息、金融对象对应的实体对象的资讯信息中的预设金融事件关键词;
基于输出结果,生成指示金融对象是否会发生预设金融事件的指示信息。
2.根据权利要求1所述的方法,其特征在于,所述输出结果为指示金融对象会发生预设金融事件的概率;以及
基于输出结果,生成指示金融对象是否会发生预设金融事件的指示信息包括:
当所述概率大于概率阈值时,生成指示金融对象会发生预设金融事件的指示信息;
当所述概率小于概率阈值时,生成指示金融对象不会发生预设金融事件的指示信息。
3.根据权利要求2所述的方法,其特征在于,在获取金融对象对应的实体对象的资讯信息之前,所述方法还包括:
构建逻辑回归模型;
获取多个金融对象的特征信息,以及将多个特征信息划分用于训练的特征信息和用于验证的特征信息;
利用用于训练的特征信息,对逻辑回归模型进行训练,得到训练后的逻辑回归模型,其中,每一个用于训练的特征信息中的预设金融事件关键词对应一个回归系数;
确定用于验证的特征信息中包含指示金融对象发生过预设金融事件的标注信息的第一特征信息的第一数量和包含指示金融对象未发生过预设金融事件的标注信息的第二特征信息的第二数量;
将每一个用于验证的特征信息中的预设金融事件关键词输入到训练后的逻辑回归模型,得到多个指示金融对象是否会发生预设金融事件的回归结果;
计算第一比例和第二比例,其中,第一比例为对应的回归结果与标注信息一致的第一特征信息的数量与第一数量的比例,第二比例为对应的回归结果与标注信息一致的第二特征信息的数量与第二数量的比例;
判断第一比例和第二比例是否满足预设条件,预设条件包括:第一比例和第二比例均大于比例阈值;
当第一比例和第二比例满足预设条件时,将训练后的逻辑回归模型作为预设逻辑回归模型。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
当第一比例和第二比例不满足所述预设条件时,对回归结果进行贝叶斯分析,调整每一个预设金融事件关键词的回归系数直至满足预设条件;
将调整预设金融事件关键词的回归系数后的逻辑回归模型作为预设逻辑回归模型。
5.根据权利要求4所述的方法,其特征在于,在获取金融对象对应的实体对象的资讯信息之前,所述方法还包括:
获取发生过预设金融事件的金融对象对应的实体对象的资讯信息;
将所述资讯信息划分为多个资讯语句,以及对所述资讯语句进行分词,得到多个词语;
对多个词语进行聚类分析,得到预设金融事件关键词。
6.一种信息获取装置,其特征在于,所述装置包括:
获取单元,配置用于获取金融对象对应的实体对象的资讯信息,以及提取出所述资讯信息中的关键词;
预测单元,配置用于将所述关键词输入到预设逻辑回归模型,得到输出结果,其中,预设逻辑回归模型基于预先利用多个金融对象的特征信息进行训练而生成,特征信息包括:指示金融对象是否发生过预设金融事件的标注信息、金融对象对应的实体对象的资讯信息中的预设金融事件关键词;
生成单元,配置用于基于输出结果,生成指示金融对象是否会发生预设金融事件的指示信息。
7.根据权利要求6所述的装置,其特征在于,生成单元包括:
指示信息生成子单元,配置用于当所述输出结果为指示金融对象会发生预设金融事件的概率,当所述概率大于概率阈值时,生成指示金融对象会发生预设金融事件的指示信息;当所述概率小于概率阈值时,生成指示金融对象不会发生预设金融事件的指示信息。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第一模型生成单元,配置用于构建逻辑回归模型;获取多个金融对象的特征信息,以及将多个特征信息划分用于训练的特征信息和用于验证的特征信息;利用用于训练的特征信息,对逻辑回归模型进行训练,得到训练后的逻辑回归模型,其中,每一个用于训练的特征信息中的预设金融事件关键词对应一个回归系数;确定用于验证的特征信息中包含指示金融对象发生过预设金融事件的标注信息的第一特征信息的第一数量和包含指示金融对象未发生过预设金融事件的标注信息的第二特征信息的第二数量;将每一个用于验证的特征信息中的预设金融事件关键词输入到训练后的逻辑回归模型,得到多个指示金融对象是否会发生预设金融事件的回归结果;计算第一比例和第二比例,其中,第一比例为对应的回归结果与标注信息一致的第一特征信息的数量与第一数量的比例,第二比例为对应的回归结果与标注信息一致的第二特征信息的数量与第二数量的比例;判断第一比例和第二比例是否满足预设条件,预设条件包括:第一比例和第二比例均大于比例阈值;当第一比例和第二比例满足预设条件时,将训练后的逻辑回归模型作为预设逻辑回归模型;
第二模型生成单元,配置用于当第一比例和第二比例不满足所述预设条件时,对回归结果进行贝叶斯分析,调整每一个预设金融事件关键词的回归系数直至满足预设条件;将调整预设金融事件关键词的回归系数后的逻辑回归模型作为预设逻辑回归模型;
关键词获取单元,配置用于获取发生过预设金融事件的金融对象对应的实体对象的资讯信息;将所述资讯信息划分为多个资讯语句,以及对所述资讯语句进行分词,得到多个词语;对多个词语进行聚类分析,得到预设金融事件关键词。
9.一种服务器,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
10.一种可读计算机存储介质,其特征在于,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN201710153107.3A 2017-03-15 2017-03-15 信息获取方法和装置 Active CN108628863B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710153107.3A CN108628863B (zh) 2017-03-15 2017-03-15 信息获取方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710153107.3A CN108628863B (zh) 2017-03-15 2017-03-15 信息获取方法和装置

Publications (2)

Publication Number Publication Date
CN108628863A true CN108628863A (zh) 2018-10-09
CN108628863B CN108628863B (zh) 2021-07-20

Family

ID=63687386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710153107.3A Active CN108628863B (zh) 2017-03-15 2017-03-15 信息获取方法和装置

Country Status (1)

Country Link
CN (1) CN108628863B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110033284A (zh) * 2019-03-13 2019-07-19 平安城市建设科技(深圳)有限公司 房源验真方法、装置、设备及存储介质
CN111786802A (zh) * 2019-04-03 2020-10-16 北京嘀嘀无限科技发展有限公司 一种事件检测的方法及装置
CN112989165A (zh) * 2021-03-26 2021-06-18 杭州有数金融信息服务有限公司 一种计算舆情实体关联度的方法
CN113111635A (zh) * 2021-04-19 2021-07-13 中国工商银行股份有限公司 一种报表对比方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102135967A (zh) * 2010-01-27 2011-07-27 华为技术有限公司 网页关键词提取方法、装置及系统
CN103176983A (zh) * 2011-12-20 2013-06-26 中国科学院计算机网络信息中心 一种基于互联网信息的事件预警方法
US20140344130A1 (en) * 2001-01-30 2014-11-20 Goldman, Sachs & Co. Systems And Methods For Automated Political Risk Management
CN105528652A (zh) * 2015-12-03 2016-04-27 北京金山安全软件有限公司 一种预测模型的建立方法及终端
CN106372961A (zh) * 2016-08-23 2017-02-01 北京小米移动软件有限公司 商品推荐方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140344130A1 (en) * 2001-01-30 2014-11-20 Goldman, Sachs & Co. Systems And Methods For Automated Political Risk Management
CN102135967A (zh) * 2010-01-27 2011-07-27 华为技术有限公司 网页关键词提取方法、装置及系统
CN103176983A (zh) * 2011-12-20 2013-06-26 中国科学院计算机网络信息中心 一种基于互联网信息的事件预警方法
CN105528652A (zh) * 2015-12-03 2016-04-27 北京金山安全软件有限公司 一种预测模型的建立方法及终端
CN106372961A (zh) * 2016-08-23 2017-02-01 北京小米移动软件有限公司 商品推荐方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110033284A (zh) * 2019-03-13 2019-07-19 平安城市建设科技(深圳)有限公司 房源验真方法、装置、设备及存储介质
CN111786802A (zh) * 2019-04-03 2020-10-16 北京嘀嘀无限科技发展有限公司 一种事件检测的方法及装置
CN111786802B (zh) * 2019-04-03 2023-07-04 北京嘀嘀无限科技发展有限公司 一种事件检测的方法及装置
CN112989165A (zh) * 2021-03-26 2021-06-18 杭州有数金融信息服务有限公司 一种计算舆情实体关联度的方法
CN112989165B (zh) * 2021-03-26 2022-07-01 浙江有数数智科技有限公司 一种计算舆情实体关联度的方法
CN113111635A (zh) * 2021-04-19 2021-07-13 中国工商银行股份有限公司 一种报表对比方法及装置

Also Published As

Publication number Publication date
CN108628863B (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
CN114186563B (zh) 电子设备及其语义解析方法、介质和人机对话系统
CN109493977B (zh) 文本数据处理方法、装置、电子设备及计算机可读介质
US9489625B2 (en) Rapid development of virtual personal assistant applications
US20200050940A1 (en) Information processing method and terminal, and computer storage medium
CN111859960A (zh) 基于知识蒸馏的语义匹配方法、装置、计算机设备和介质
US20140337814A1 (en) Rapid development of virtual personal assistant applications
CN119668575A (zh) 自然语言到api转换
CN111104512A (zh) 游戏评论的处理方法及相关设备
CN108628863A (zh) 信息获取方法和装置
CN112395391B (zh) 概念图谱构建方法、装置、计算机设备及存储介质
CN109979439A (zh) 基于区块链的语音识别方法、装置、介质及电子设备
CN106356057A (zh) 一种基于计算机应用场景语义理解的语音识别系统
CN111710337A (zh) 语音数据的处理方法、装置、计算机可读介质及电子设备
CN110362800A (zh) 产品信息的配置方法、装置、电子设备及介质
CN109582788A (zh) 垃圾评论训练、识别方法、装置、设备及可读存储介质
CN112364136A (zh) 关键词生成方法、装置、设备及存储介质
CN110427454A (zh) 文本情绪分析方法及装置、电子设备和非暂态存储介质
CN113220828B (zh) 意图识别模型处理方法、装置、计算机设备及存储介质
CN113821587A (zh) 文本相关性确定方法、模型训练方法、装置及存储介质
JP2023017983A (ja) 情報生成モデルの訓練方法、情報生成方法、装置、電子機器、記憶媒体およびコンピュータプログラム
CN113470679B (zh) 基于无监督学习的语音唤醒方法、装置、电子设备及介质
CN110705308A (zh) 语音信息的领域识别方法、装置、存储介质及电子设备
CN116827894B (zh) 广播剧用户评论信息发送方法、装置、设备和介质
WO2024250814A1 (zh) 模态哈希网络的训练方法、跨模态检索方法、装置、计算机设备、存储介质和程序产品
CN115171660B (zh) 一种声纹信息处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20191122

Address after: 201210 room j1328, floor 3, building 8, No. 55, Huiyuan Road, Jiading District, Shanghai

Applicant after: SHANGHAI YOUYANG NEW MEDIA INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer three

Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20181009

Assignee: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Assignor: SHANGHAI YOUYANG NEW MEDIA INFORMATION TECHNOLOGY Co.,Ltd.

Contract record no.: X2020990000201

Denomination of invention: Network service description information acquisition method and network service description information acquisition device

License type: Exclusive License

Record date: 20200420

GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 401120 b7-7-2, Yuxing Plaza, No.5, Huangyang Road, Yubei District, Chongqing

Patentee after: Chongqing duxiaoman Youyang Technology Co.,Ltd.

Address before: 201210 room j1328, 3 / F, building 8, 55 Huiyuan Road, Jiading District, Shanghai

Patentee before: SHANGHAI YOUYANG NEW MEDIA INFORMATION TECHNOLOGY Co.,Ltd.