CN112905752A - 一种智能交互方法、装置、设备以及存储介质 - Google Patents
一种智能交互方法、装置、设备以及存储介质 Download PDFInfo
- Publication number
- CN112905752A CN112905752A CN202110340049.1A CN202110340049A CN112905752A CN 112905752 A CN112905752 A CN 112905752A CN 202110340049 A CN202110340049 A CN 202110340049A CN 112905752 A CN112905752 A CN 112905752A
- Authority
- CN
- China
- Prior art keywords
- target
- instant message
- core words
- question
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000003993 interaction Effects 0.000 title claims abstract description 39
- 238000004364 calculation method Methods 0.000 claims description 76
- 238000004458 analytical method Methods 0.000 claims description 43
- 238000004590 computer program Methods 0.000 claims description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 10
- 230000003287 optical effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及人工智能技术领域,公开了一种智能交互方法、装置、设备以及存储介质。获取用户发送的即时消息关联的至少两个核心词,并确定所述至少两个核心词的权重和所述至少两个核心词之间的关联关系;根据所述至少两个核心词、所述至少两个核心词的权重和关联关系,从已有问题库中选择所述即时消息的目标问题;获取所述目标问题关联的答案信息,作为所述即时消息的答复信息,并向用户反馈所述答复信息。通过上述技术方案,解决了传统搜索引擎答案范围过大的问题,提高了答案的匹配准确率,提升了用户体验,为智能交互的实现提供了一种新思路。
Description
技术领域
本申请实施例涉及人工智能技术领域,尤其涉及一种智能交互方法、装置、设备以及存储介质。
背景技术
随着互联网和人工智能技术的飞速发展,智能交互在用户体验及获取信息方面起到的作用越来越大,目前智能问答、信息检索等手段是比较典型的智能交互方式,但是智能问答对答案匹配较为严格,同时信息检索给出的内容又过于宽泛,用户从检索结果中获取所需信息需要一定的成本,因此需要构建一种新型的智能交互方法和流程,解决用户不同场景下精准获取信息的问题。
目前智能问答数据以及智能问答匹配度要求高,很多情况下对于用户的问题没有得到对应答案;其次,现有技术中,通过信息检索出来的结果内容比较多且宽泛,需要用户花时间成本进行阅读和再过滤,影响用户体验。
发明内容
本申请提供一种智能交互方法、装置、设备以及存储介质,以提高答案匹配准确率,提升用户体验。
第一方面,本申请实施例提供了一种智能交互方法,包括:
获取用户发送的即时消息关联的至少两个核心词,并确定所述至少两个核心词的权重和所述至少两个核心词之间的关联关系;
根据所述至少两个核心词、所述至少两个核心词的权重和关联关系,从已有问题库中选择所述即时消息的目标问题;
获取所述目标问题关联的答案信息,作为所述即时消息的答复信息,并向用户反馈所述答复信息。
第二方面,本申请实施例还提供了一种智能交互装置,包括:
核心信息确定模块,用于获取用户发送的即时消息关联的至少两个核心词,并确定所述至少两个核心词的权重和所述至少两个核心词之间的关联关系;
目标问题确定模块,用于根据所述至少两个核心词、所述至少两个核心词的权重和关联关系,从已有问题库中选择所述即时消息的目标问题;
答案信息获取模块,用于获取所述目标问题关联的答案信息,作为所述即时消息的答复信息,并向用户反馈所述答复信息。
第三方面,本申请实施例还提供了一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本申请任一实施例所提供的智能交互方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本申请任一实施例所提供的智能交互方法。
本申请通过获取用户发送的即时消息关联的至少两个核心词,并确定至少两个核心词的权重和至少两个核心词之间的关联关系,之后根据至少两个核心词、至少两个核心词的权重和关联关系,从已有问题库中选择即时消息的目标问题,进而获取目标问题关联的答案信息,作为即时消息的答复信息,并向用户反馈答复信息。上述技术方案,通过充分解析即时消息获取核心词,并结合核心词的权重和关联关系等,能够从已有问题库中精准定位即时消息关联的目标问题,即圈定了即时消息的答复信息的范围,相比于现有技术而言,解决了传统搜索引擎答案范围过大的问题,解决了传统搜索引擎答案范围过大的问题,提高了答案的匹配准确率,提升了用户体验,为智能交互的实现提供了一种新思路。
附图说明
图1是本申请实施例一提供的一种智能交互方法的流程图;
图2是本申请实施例二提供的一种智能交互方法的流程图;
图3是本申请实施例三提供的一种智能交互方法的流程图;
图4是本申请实施例四提供的一种智能交互方法的流程图;
图5是本申请实施例五提供的一种智能交互装置的结构示意图;
图6是本申请实施例六提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
实施例一
图1是本申请实施例一提供的一种智能交互方法的流程图;本实施例可适用于政务云、智能客服、智能外呼及智能资讯等场景中,该方法可以由智能交互装置来执行,该装置由软件/硬件实现,并可集成于承载智能交互功能的电子设备中,例如服务器中。
如图1所示,该方法具体可以包括:
S110、获取用户发送的即时消息关联的至少两个核心词,并确定至少两个核心词的权重和至少两个核心词之间的关联关系。
其中,即时消息是指在政务云、智能客服、智能外呼及智能资讯等场景中用户在交互界面输入的消息。核心词是用于表征即时消息中核心含义的词语,例如产品名称、概念、业务介绍、产品操作、时间、地点、指代信息等,其中,指代信息指结合历史对话记录得到的信息。核心词的权重用于表征核心词在即时消息中的重要程度,权重越大,核心词在即时消息中越重要。核心词之间的关联关系用于表征核心词之间的紧密程度,可以是或的关系、顺序关系、依赖关系等。
本实施例中,可以从即时消息中提取至少两个核心词。具体的,可以基于分词技术,从即时消息中提取核心词。还可以基于实体抽取技术,从即时消息中提取核心词。例如,用户发送的即时消息是“信用卡丢了怎么办?”,提取到的核心词为“信用卡”、“丢了”。
进一步的,可以从即时消息关联的当前场景下的历史对话记录中提取至少两个核心词,以充分了解用户的目的或者意图。具体的,基于动态内容生成器,从即时消息关联的当前场景下的历史对话记录中提取至少两个核心词。例如,用户输入的即时消息“如何补卡”关联的当前场景下的历史对话记录“用户:信用卡丢了怎么办?,机器人:信用卡挂失。用户:如何补卡呢”,提取到的核心词为“信用卡”、“补卡”。
示例性的,作为本申请实施例的又一种可选方式,为了进一步提高获取答案的准确度,本实施例优选可以同时从即时消息和即时消息关联的当前场景下的历史对话记录中提取核心词。
可选的,在确定即时消息关联的至少两个核心词之后,为了便于更好的理解即时消息,以便更准确获取即时消息的答复信息,本实施例可以确定每个核心词的权重。例如,可以结合即时消息的句式结构(主谓宾)、核心词的词性等,确定每个核心词的权重;还可以基于必要性模型,对至少两个核心词进行必要性判断,进而得到至少两个核心词的权重。其中,必要性模型可以通过卷积神经网络模型训练得到,具体的,利用已有数据集,通过输入句子中的核心词、词性、词频、互信息等,训练卷积神经网络模型,最终输出句子中核心词的权重。
可选的,还可以根据核心词的词性、互信息、核心词的权重等,确定至少两个核心词之间的关联关系。
可以理解的是,通过对即时消息的分析,获取与即时消息关联的核心词,以及核心词的权重和核心词之间的关联关系,为后续准确判断即时消息的目标问题奠定了基础。
S120、根据至少两个核心词、至少两个核心词的权重和关联关系,从已有问题库中选择即时消息的目标问题。
其中,目标问题是指已有问题中与用户的即时消息最匹配的问题。
本实施例中,根据至少两个核心词、至少两个核心词的权重和关联关系,基于机器学习算法,从已有问题库中选择即时消息的目标问题。
进一步的,为了准确确定即时消息所关联的目标问题,还可以根据至少两个核心词、至少两个核心词的权重和关联关系,以及即时消息关联的业务场景,从已有问题库中选择即时消息的目标问题。其中,即时消息关联的业务场景是指用户所咨询业务类型的场景,例如信用卡类业务、储蓄卡类业务等。
具体的,可以基于机器学习算法,根据至少两个核心词、至少两个核心词的权重和关联关系,以及即时消息关联的业务场景,从已有问题库中选择即时消息的目标问题。
可以理解的是,引入业务场景,更能够准确理解用户的意图,从已有问题库中选择用户即时消息的目标问题,满足用户需求。
需要说明的是,当从已有问题库中匹配到多个问题时,则需要更新核心词的权重,具体的,可以通过调整必要性模型的迭代次数等,重新训练必要性模块,然后根据必要性模块重新获取至少两个核心词的权重。进而,可根据重新获取的至少两个词核心词、至少两个核心词的权重和关联关系,从已有题库中重新确定目标问题。
S130、获取目标问题关联的答案信息,作为即时消息的答复信息,并向用户反馈答复信息。
其中,答案信息是指预先建立的与问题相对应的答案库中的答案信息,答案信息可以包括至少一条信息。
本实施例中,从答案库中获取目标问题关联的答案信息,具体的,可以以目标问题为索引,从答案库中查找到目标问题对应的答案信息。进而,将该答案信息作为用户即时消息的答复信息,并向用户反馈该答复信息。进一步的,当答案信息为多条时,可以将答案信息按照一定方式组装排序,将排序后的答案信息作为即时消息的答复信息,按顺序依次向用户展示。
本申请通过获取用户发送的即时消息关联的至少两个核心词,并确定至少两个核心词的权重和至少两个核心词之间的关联关系,之后根据至少两个核心词、至少两个核心词的权重和关联关系,从已有问题库中选择即时消息的目标问题,进而获取目标问题关联的答案信息,作为即时消息的答复信息,并向用户反馈答复信息。上述技术方案,通过充分解析即时消息获取核心词,并结合核心词的权重和关联关系等,能够从已有问题库中精准定位即时消息关联的目标问题,即圈定了即时消息的答复信息的范围,相比于现有技术而言,解决了传统搜索引擎答案范围过大的问题,提高了答案的匹配准确率,提升了用户体验,为智能交互的实现提供了一种新思路。
在上述技术方案的基础上,为了更准确的理解用户的即时消息的意图,作为本实施例的一种可选方式,在获取用户发送的即时消息关联的至少两个核心词之后,对核心词进行归一化处理。具体的,过滤掉无关词(客气词、虚词、无意义词等例如);如果即时消息中含有拼音或者首字母翻译成中文词汇,这里主要指业务词和常见词,比如xinyongka(信用卡)、xyk(信用卡);还可以进行别名或者同义短语补充,例如借记卡(信用卡),叫什么(名字)等;还可以进行错别字纠正,比如信用咔(信用卡)等。
实施例二
图2是本申请实施例二提供的一种智能交互方法的流程图;在上述实施例的基础上,对“根据至少两个核心词的权重和关联关系,从已有问题库中选择即时消息的目标问题”进一步优化,提供一种可选方案。
如图2所示,该方法具体可以包括:
S210、获取用户发送的即时消息关联的至少两个核心词,并确定至少两个核心词的权重和至少两个核心词之间的关联关系。
S220、根据至少两个核心词、至少两个核心词的权重和关联关系,以及即时消息关联的业务场景,从已有问题库中选择即时消息的目标问题。
本实施例中,可以基于设定问题解析模板,根据至少两个核心词、至少两个核心词的权重和关联关系、以及即时消息关联的业务场景,确定即时消息关联的目标解析信息。其中,设定问题解析模板是与问题关联的问题信息的解析模板,每个问题都对应一个设定问题解析模板,设定问题解析模板中包含解析信息,解析信息包含基础属性、关联属性、扩展属性中的至少一种,基础属性包括核心词、核心词的权重、业务场景等;关联属性包括核心词之间的关联关系,例如A、B两个核心词,A|B表示A和B没有顺序关系,A->B表示核心词A和核心词B有顺序关系,AB表示核心词A和核心词B有依赖关系;扩展属性是对核心词的扩展,比如语义关联信息、同义信息等,即根据即时消息当前场景中的历史对话记录中提取到的核心词。
具体的,可以将从即时消息中获取的至少两个核心词、至少两个核心词的权重和关联关系,以及即时消息关联的业务场景,分别填入设定问题解析模板,进而得到即时消息关联的目标解析信息。
进而,确定即时消息关联的目标解析信息之后,根据目标解析信息与已有问题库中已有问题关联的解析信息之间的匹配结果,从已有问题库中选择即时消息的目标问题。
具体的,可以以目标解析信息为索引,在已有问题库中进行检索,将与目标解析信息匹配的已有问题库中已有问题关联的解析信息对应的已有问题,作为即时消息的目标问题。
示例性的,还可以确定目标解析信息与已有问题库中已有问题关联的解析信息之间的相似度;根据相似度,从已有问题库中选择即时消息的目标问题。具体的,计算目标解析信息与已有问题库中已有问题关联的解析信息之间的相似度,从大于设定阈值的相似度中,选择最大的相似度对应的解析信息所关联的已有问题,作为即时消息的目标问题。若相似度小于设定阈值,则说明即时消息关联的目标解析信息不够准确,重新确定即时消息关联的目标解析信息。其中,设定阈值是本领域技术人员根据实际情况设定的。
可以理解的是,引入相似度,从已有问题库中的已有问题确定即时消息的关联问题,可以提高即时消息的目标问题确定的速度。
S230、获取目标问题关联的答案信息,作为即时消息的答复信息,并向用户反馈答复信息。
本实施例的技术方案,通过基于设定问题解析模板,根据至少两个核心词、至少两个核心词的权重和关联关系,以及即时消息关联的业务场景,确定即时消息关联的目标解析信息,进而根据目标解析信息与已有问题库中已有问题关联的解析信息之间的匹配结果,从已有问题库中选择即时消息的目标问题。引入设定问题解析模板,辅助确定即时消息关联的目标解析信息,进而确定即时消息的目标问题,提高了目标问题确定的准确性,进而为后续目标问题答案的获取提供了保障。
实施例三
图3是本申请实施例三提供的一种智能交互方法的流程图;在上述实施例的基础上,对“获取目标问题关联的答案信息”进一步优化,提供一种可选实施方案。
如图3所示,该方法具体可以包括:
S310、获取用户发送的即时消息关联的至少两个核心词,并确定至少两个核心词的权重和至少两个核心词之间的关联关系。
S320、根据至少两个核心词、至少两个核心词的权重和关联关系,从已有问题库中选择即时消息的目标问题。
S330、根据即时消息的目标问题,从可选计算引擎中确定目标计算引擎。
其中,计算引擎是指获取问题答案的工具,常用的计算引擎有专业计算引擎主要有TableQA(自然语言查询表格数据工具)、知识库问答(knowledge base questionanswering,KB-QA)、FAQ检索系统(Frequently Asked Questions,FAQ)和基于阅读理解的问答(Machine Reading Comprehension Question Answering,MRCQA)这四类。其中,TableQA是指根据意图理解模板自动生成SQL语句,也就是NLP2SQL,从数据库查询出答案,比如信用卡有多少用户这些问题通过TableQA来解决;KB-QA是指基于知识图谱的QA,通过图计算及推理能力得到答案,比如信用卡有哪些类别;FAQ具有一问一答功能,比如信用卡办理等导航功能;MRCQA是指基于阅读理解的QA,比如信用卡常识,通过DOCQA可以从信用卡相关的文档中找出信用卡相关的常识关键信息。不同问题的答案获取的计算引擎不同。所谓可选计算引擎为当前可供选择的计算引擎;目标计算引擎是指获取目标问题对应的答案所需的工具,即可选计算引擎中的一个。
本实施例中,以即时消息的目标问题为索引,依次与数据源中每一计算引擎关联的问题进行匹配,若匹配成功,则将该问题关联的计算引擎作为目标计算引擎。其中,数据源包含已有问题信息、业务功能、可选计算引擎等,是本领域技术人员根据大量的问题和获取问题答案的计算引擎确定的。
可选的,作为本申请实施例的一种可选方式,还可以根据即时消息的目标问题,从可选计算引擎中确定候选计算引擎,进而根据候选计算引擎,确定目标计算引擎。
具体的,可以基于深度学习技术,根据即时消息的目标问题,从可选计算引擎中确定候选计算引擎,进而根据候选计算引擎中各类计算引擎的数量,确定目标计算引擎。例如候选计算引擎中TableQA的数量为2;KB-QA的数量为1;FAQ的数量为3;MRCQA的数量为6,则将MRCQA作为目标计算引擎。
S340、通过目标计算引擎获取目标问题关联的答案信息。
本实施例中,通过目标计算引擎获取目标问题关联的答案信息。
S350、将答案信息作为即时消息的答复信息,并向用户反馈答复信息。
本实施例的技术方案,通过充分解析即时消息获取核心词,并结合核心词的权重和关联关系等,能够从已有问题库中精准定位即时消息关联的目标问题,即圈定了即时消息的答复信息的范围,相比于现有技术而言,解决了传统搜索引擎答案范围过大的问题,提高了答案的匹配准确率,提升了用户体验,为智能交互的实现提供了一种新思路。
实施例四
图4是本申请实施例四提供的一种智能交互方法的流程图;在上述实施例的基础上,对“根据即时消息的目标问题,从可选计算引擎中确定目标计算引擎”进行优化,提供一种可选实施方案。
如图4所示,该方法具体可以包括:
S410、获取用户发送的即时消息关联的至少两个核心词,并确定至少两个核心词的权重和至少两个核心词之间的关联关系。
S420、根据至少两个核心词、至少两个核心词的权重和关联关系,从已有问题库中选择即时消息的目标问题。
S430、根据即时消息的目标问题,从可选计算引擎中确定候选计算引擎。
本实施例中,根据即时消息的目标问题,从可选计算引擎中确定候选计算引擎可以是,从即时消息的目标问题中提取关键词,以关键词为索引,基于已构建的关键词倒排索引,从可选计算引擎中确定候选计算引擎。
其中,关键词是用于表征目标问题中核心含义的词语,也可以是即时消息关联的核心词。关键词倒排索引是本领域技术人员根据已有问题库和问答等预先构建好的。示例性的,关键词倒排索引可以通过如下方式构建:可以基于分词技术,从数据源的可选计算引擎关联的问题信息中提取关键词;根据关键词与可选计算引擎之间的关联关系,构建关键词倒排索引。其中,数据源中包含问题信息、可选计算引擎、业务功能等。关键词倒排索引包含关键词检索域和引擎编号,通过关键词在关键词检索域中进行检索,可以快速找到对应的引擎编号,进而确定对应的计算引擎,其中,引擎编号和计算引擎关联。
具体的,可以基于分词技术,从即时消息的目标问题中提取关键词。进而,以关键词为索引,输入已构建的关键词倒排索引,得到至少一个计算引擎;从可选计算引擎中查找是否存在所得到的至少一个计算引擎,若存在,则将所得到的至少一个计算引擎作为候选计算引擎。
进一步的,本实施例还可以根据数据源和历史问答数据,构建关键词倒排索引。具体可以是根据数据源构建了关键词倒排索引的第一关键词检索域,进而根据历史问答数据构建关键词倒排索引的第二关键词检索域。从历史问答数据中的每条数据中提取关键词,根据关键词与答案引擎之间的关联关系,构建键词倒排索引的第二关键词检索域。
进而,分别以关键词为索引,在已构建的关键词倒排索引中的第一关键词检索域进行检索,得到至少一个计算引擎,从可选计算引擎中查找是否存在所得到的至少一个计算引擎,若存在,则将所得到的至少一个计算引擎作为第一候选计算引擎;在已构建的关键词倒排索引中的第二关键词检索域进行检索,得到至少一个计算引擎,从可选计算引擎中查找是否存在所得到的至少一个计算引擎,若存在,则将所得到的至少一个计算引擎作为第二候选计算引擎。将第一候选计算引擎和第二候选计算引擎的交集,作为候选计算引擎。可选的,还可以将第一候选计算引擎和第二候选计算引擎的并集,作为候选计算引擎。
S440、根据候选计算引擎,确定目标计算引擎。
本实施例中,可以根据候选计算引擎的优先级、目标问题与候选计算引擎关联的问题信息之间的相似度、以及候选计算引擎中各类计算引擎的数量,确定目标计算引擎。其中,候选计算引擎的优先级越大,相应的计算引擎的得分越大。
具体的,根据候选计算引擎的优先级、目标问题与候选计算引擎关联的问题信息之间的相似度、候选计算引擎中各类计算引擎的数量、以及设定权值,确定目标计算引擎。例如,可以确定候选计算引擎中每类计算引擎的数量,目标问题与该类计算引擎关联的问题信息之间的相似度,该类计算引擎的优先级得分;将该类计算引擎的数量、相似度、优先级得分与设定阈值相乘,得到引擎得分,进而将候选计算引擎中各类计算引擎的引擎得分最高的计算引擎,作为目标计算引擎。
S450、通过目标计算引擎获取目标问题关联的答案信息。
S460、将答案信息作为即时消息的答复信息,并向用户反馈答复信息。
本实施例的技术方案,通过引入倒排索引,来确定候选计算引擎,进而确定目标计算引擎,提高了计算引擎的确定速度,进而也提高了答案的确定速度,提升了用户体验。
实施例五
图5是本申请实施例五提供的一种智能交互装置的结构示意图;本实施例可适用于政务云、智能客服、智能外呼及智能资讯等场景中,该装置由软件/硬件实现,并可集成于承载智能交互功能的电子设备中,例如服务器中。
如图5所示,该装置包括核心信息确定模块510、目标问题确定模块520和答案信息获取模块530,其中,
核心信息确定模块510,用于获取用户发送的即时消息关联的至少两个核心词,并确定至少两个核心词的权重和至少两个核心词之间的关联关系;
目标问题确定模块520,用于根据至少两个核心词、至少两个核心词的权重和关联关系,从已有问题库中选择即时消息的目标问题;
答案信息获取模块530,用于获取目标问题关联的答案信息,作为即时消息的答复信息,并向用户反馈答复信息。
本申请通过获取用户发送的即时消息关联的至少两个核心词,并确定至少两个核心词的权重和至少两个核心词之间的关联关系,之后根据至少两个核心词、至少两个核心词的权重和关联关系,从已有问题库中选择即时消息的目标问题,进而获取目标问题关联的答案信息,作为即时消息的答复信息,并向用户反馈答复信息。上述技术方案,通过充分解析即时消息获取核心词,并结合核心词的权重和关联关系等,能够从已有问题库中精准定位即时消息关联的目标问题,即圈定了即时消息的答复信息的范围,相比于现有技术而言,解决了传统搜索引擎答案范围过大的问题,解决了传统搜索引擎答案范围过大的问题,提高了答案的匹配准确率,提升了用户体验,为智能交互的实现提供了一种新思路。
进一步地,核心信息确定模块510包括核心词确定单元,该单元具体用于:
从即时消息中提取至少两个核心词;和/或,
从即时消息关联的当前场景下的历史对话记录中提取至少两个核心词。
进一步地,目标问题确定模块520具体用于:
根据至少两个核心词、至少两个核心词的权重和关联关系,以及即时消息关联的业务场景,从已有问题库中选择即时消息的目标问题。
进一步地,目标问题确定模块520包括目标解析信息确定单元和目标问题确定单元,其中,
目标解析信息确定单元,用于基于设定问题解析模板,根据至少两个核心词、至少两个核心词的权重和关联关系,以及即时消息关联的业务场景,确定即时消息关联的目标解析信息;
目标问题确定单元,用于根据目标解析信息与已有问题库中已有问题关联的解析信息之间的匹配结果,从已有问题库中选择即时消息的目标问题。
进一步地,目标问题确定单元包括相似度确定子单元和目标问题确定子单元,其中,
相似度确定子单元,用于确定目标解析信息与已有问题库中已有问题关联的解析信息之间的相似度;
目标问题确定子单元,用于根据相似度,从已有问题库中选择即时消息的目标问题。
进一步地,答案信息获取模块530包括目标计算引擎确定子模块和答案信息获取子模块,其中,
目标计算引擎确定子模块,用于根据即时消息的目标问题,从可选计算引擎中确定目标计算引擎;
答案信息获取子模块,用于通过目标计算引擎获取目标问题关联的答案信息。
进一步地,目标计算引擎确定子模块包括候选计算引擎确定单元和目标计算引擎确定单元,其中,
候选计算引擎确定单元,用于根据即时消息的目标问题,从可选计算引擎中确定候选计算引擎;
目标计算引擎确定单元,用于根据候选计算引擎,确定目标计算引擎。
进一步地,候选计算引擎确定单元包括关键词提取子单元和候选计算引擎确定子单元,其中,
关键词提取子单元,用于从即时消息的目标问题中提取关键词;
候选计算引擎确定子单元,用于以关键词为索引,基于已构建的关键词倒排索引,从可选计算引擎中确定候选计算引擎。
进一步地,候选计算引擎确定单元还包括倒排索引确定子单元,该排索引确定子单元具体用于:
从数据源的可选计算引擎关联的问题信息中提取关键词;
根据关键词与可选计算引擎之间的关联关系,构建关键词倒排索引。
进一步地,倒排索引确定子单元还用于:
根据数据源和历史问答数据,构建关键词倒排索引。
进一步地,目标计算引擎确定单元具体用于:
根据候选计算引擎的优先级、目标问题与候选计算引擎关联的问题信息之间的相似度、以及候选计算引擎中各类计算引擎的数量,确定目标计算引擎。
进一步地,核心信息确定模块510还包括权重确定单元,该权重确定单元具体用于:
基于必要性模型,对至少两个核心词进行必要性判断,得到至少两个核心词的权重。
上述智能交互装置可执行本申请任意实施例所提供的智能交互方法,具备执行方法相应的功能模块和有益效果。
实施例六
图6为本申请实施例六提供的一种电子设备的结构示意图,图6示出了适于用来实现本申请实施例实施方式的示例性设备的框图。图6显示的设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请实施例各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请实施例所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本申请实施例所提供的智能交互方法。
实施例七
本申请实施例七还提供一种计算机可读存储介质,其上存储有计算机程序(或称为计算机可执行指令),该程序被处理器执行时用于执行本申请实施例所提供的智能交互方法。
本申请实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请实施例进行了较为详细的说明,但是本申请实施例不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。
Claims (15)
1.一种智能交互方法,其特征在于,包括:
获取用户发送的即时消息关联的至少两个核心词,并确定所述至少两个核心词的权重和所述至少两个核心词之间的关联关系;
根据所述至少两个核心词、所述至少两个核心词的权重和关联关系,从已有问题库中选择所述即时消息的目标问题;
获取所述目标问题关联的答案信息,作为所述即时消息的答复信息,并向用户反馈所述答复信息。
2.根据权利要求1所述的方法,其特征在于,获取用户发送的即时消息关联的至少两个核心词,包括:
从所述即时消息中提取至少两个核心词;和/或,
从即时消息关联的当前场景下的历史对话记录中提取至少两个核心词。
3.根据权利要求1所述的方法,其特征在于,根据所述至少两个核心词、所述至少两个核心词的权重和关联关系,从已有问题库中选择所述即时消息的目标问题,包括:
根据所述至少两个核心词、所述至少两个核心词的权重和关联关系,以及所述即时消息关联的业务场景,从已有问题库中选择所述即时消息的目标问题。
4.根据权利要求3所述的方法,其特征在于,根据所述至少两个核心词、所述至少两个核心词的权重和关联关系,以及所述即时消息关联的业务场景,从已有问题库中选择所述即时消息的目标问题,包括:
基于设定问题解析模板,根据所述至少两个核心词、所述至少两个核心词的权重和关联关系,以及所述即时消息关联的业务场景,确定所述即时消息关联的目标解析信息;
根据所述目标解析信息与已有问题库中已有问题关联的解析信息之间的匹配结果,从已有问题库中选择所述即时消息的目标问题。
5.根据权利要求4所述的方法,其特征在于,根据所述目标解析信息与已有问题库中已有问题关联的解析信息之间的匹配结果,从已有问题库中选择所述即时消息的目标问题,包括:
确定所述目标解析信息与已有问题库中已有问题关联的解析信息之间的相似度;
根据所述相似度,从已有问题库中选择所述即时消息的目标问题。
6.根据权利要求1所述的方法,其特征在于,获取所述目标问题关联的答案信息,包括:
根据所述即时消息的目标问题,从可选计算引擎中确定目标计算引擎;
通过所述目标计算引擎获取所述目标问题关联的答案信息。
7.根据权利要求6所述的方法,其特征在于,根据所述即时消息的目标问题,从可选计算引擎中确定目标计算引擎,包括:
根据所述即时消息的目标问题,从所述可选计算引擎中确定候选计算引擎;
根据所述候选计算引擎,确定目标计算引擎。
8.根据权利要求7所述的方法,其特征在于,根据所述即时消息的目标问题,从所述可选计算引擎中确定候选计算引擎,包括:
从所述即时消息的目标问题中提取关键词;
以所述关键词为索引,基于已构建的关键词倒排索引,从所述可选计算引擎中确定候选计算引擎。
9.根据权利要求8所述的方法,其特征在于,还包括:
从数据源的可选计算引擎关联的问题信息中提取关键词;
根据所述关键词与可选计算引擎之间的关联关系,构建关键词倒排索引。
10.根据权利要求8所述的方法,其特征在于,还包括:
根据数据源和历史问答数据,构建关键词倒排索引。
11.根据权利要求7所述的方法,其特征在于,根据所述候选计算引擎,确定目标计算引擎,包括:
根据所述候选计算引擎的优先级、所述目标问题与所述候选计算引擎关联的问题信息之间的相似度、以及所述候选计算引擎中各类计算引擎的数量,确定所述目标计算引擎。
12.根据权利要求1所述的方法,其特征在于,确定所述至少两个核心词的权重,包括:
基于必要性模型,对所述至少两个核心词进行必要性判断,得到所述至少两个核心词的权重。
13.一种智能交互装置,其特征在于,包括:
核心信息确定模块,用于获取用户发送的即时消息关联的至少两个核心词,并确定所述至少两个核心词的权重和所述至少两个核心词之间的关联关系;
目标问题确定模块,用于根据所述至少两个核心词、所述至少两个核心词的权重和关联关系,从已有问题库中选择所述即时消息的目标问题;
答案信息获取模块,用于获取所述目标问题关联的答案信息,作为所述即时消息的答复信息,并向用户反馈所述答复信息。
14.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-12中任一项所述的智能交互方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-12中任一项所述的智能交互方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110340049.1A CN112905752A (zh) | 2021-03-30 | 2021-03-30 | 一种智能交互方法、装置、设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110340049.1A CN112905752A (zh) | 2021-03-30 | 2021-03-30 | 一种智能交互方法、装置、设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112905752A true CN112905752A (zh) | 2021-06-04 |
Family
ID=76109599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110340049.1A Pending CN112905752A (zh) | 2021-03-30 | 2021-03-30 | 一种智能交互方法、装置、设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112905752A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114840671A (zh) * | 2022-04-29 | 2022-08-02 | 北京百度网讯科技有限公司 | 对话生成方法、模型的训练方法、装置、设备及介质 |
-
2021
- 2021-03-30 CN CN202110340049.1A patent/CN112905752A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114840671A (zh) * | 2022-04-29 | 2022-08-02 | 北京百度网讯科技有限公司 | 对话生成方法、模型的训练方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110647614B (zh) | 智能问答方法、装置、介质及电子设备 | |
US11693894B2 (en) | Conversation oriented machine-user interaction | |
US11521603B2 (en) | Automatically generating conference minutes | |
CN108829682B (zh) | 计算机可读存储介质、智能问答方法及智能问答装置 | |
US11531693B2 (en) | Information processing apparatus, method and non-transitory computer readable medium | |
CN110162768B (zh) | 实体关系的获取方法、装置、计算机可读介质及电子设备 | |
CN114003709A (zh) | 一种基于问句匹配的智能问答系统和方法 | |
CN112699645B (zh) | 语料标注方法、装置及设备 | |
CN114547274B (zh) | 多轮问答的方法、装置及设备 | |
CN118296120A (zh) | 多模态多尺度多路召回的大型语言模型检索增强生成方法 | |
CN118377888B (zh) | 基于大语言模型的问答处理方法、系统、设备及介质 | |
CN117312509A (zh) | 一种海量信息下基于大语言模型的知识库问答方法及装置 | |
CN113157887B (zh) | 知识问答意图识别方法、装置、及计算机设备 | |
CN118051587A (zh) | 一种基于大模型的钢铁行业智能问答方法、设备及介质 | |
CN114153946A (zh) | 一种智能检索方法、装置、设备及存储介质 | |
CN112905752A (zh) | 一种智能交互方法、装置、设备以及存储介质 | |
CN113761104A (zh) | 知识图谱中实体关系的检测方法、装置和电子设备 | |
CN109684357B (zh) | 信息处理方法及装置、存储介质、终端 | |
CN118246474A (zh) | 工具路由方法及设备 | |
CN111881695A (zh) | 一种审计知识的检索方法及装置 | |
CN115563239A (zh) | 问答方法、装置及计算机可读存储介质 | |
CN112182182B (zh) | 多轮会话的实现方法、装置、设备及存储介质 | |
Abisha et al. | Resspar: AI-Driven Resume Parsing and Recruitment System using NLP and Generative AI | |
CN114818683B (zh) | 一种基于移动端的运维方法及装置 | |
CN119201986B (zh) | 用于检索信息的方法、装置、设备、介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |