[go: up one dir, main page]

CN112687388A - 一种基于文本检索的可解释性智慧医疗辅助诊断系统 - Google Patents

一种基于文本检索的可解释性智慧医疗辅助诊断系统 Download PDF

Info

Publication number
CN112687388A
CN112687388A CN202110021525.3A CN202110021525A CN112687388A CN 112687388 A CN112687388 A CN 112687388A CN 202110021525 A CN202110021525 A CN 202110021525A CN 112687388 A CN112687388 A CN 112687388A
Authority
CN
China
Prior art keywords
query
graph
word
module
medical record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110021525.3A
Other languages
English (en)
Other versions
CN112687388B (zh
Inventor
董守斌
刘晓峰
胡金龙
袁华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongshan Yishu Technology Co ltd
Original Assignee
Zhongshan Yishu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongshan Yishu Technology Co ltd filed Critical Zhongshan Yishu Technology Co ltd
Priority to CN202110021525.3A priority Critical patent/CN112687388B/zh
Publication of CN112687388A publication Critical patent/CN112687388A/zh
Application granted granted Critical
Publication of CN112687388B publication Critical patent/CN112687388B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明公开了一种基于文本检索的可解释性智慧医疗辅助诊断系统,包括:查询预处理模块,用于对病人病历进行预处理,得到与患病信息相关的查询词;知识图谱构建模块,用于与查询词结合形成一个新的关于特定疾病的知识图谱;文本检索模块,用于通过查询词以及新的知识图谱来检索医学数据库中与查询词相关的以往的病例及治疗方案;可解释的辅助诊断模块,用于解释检索出与病人病历相关的病例及治疗方案的原因。本发明可有效解决长文档长距离依赖的语义编码问题,以及将知识图谱很好地融入到查询词中,并通过知识图谱上和预训练的自注意力模型的权重值得到与查询词相关的实体信息或者文档片段,从而为智慧诊断提供更为精准的可解释性结果。

Description

一种基于文本检索的可解释性智慧医疗辅助诊断系统
技术领域
本发明涉及文本检索的技术领域,尤其是指一种基于文本检索的可解释性智慧医疗辅助诊断系统。
背景技术
随着计算机领域的飞速发展,各行业与计算机结合越来越深。借助计算机可以利用行业内的数据进行数据挖掘,数据分析。尤其是在医学领域,近年来计算机领域里的深度学习方法可以从海量数据中提取原始特征,然后发现这些原始特征背后的规律,从而解决复杂问题。随着技术的发展和计算能力的增强,深度学习在医疗领域的应用越来越广泛,智慧医疗已经在病例分析、疾病预测中获得初步成果,但深度学习模型属于黑盒子性质,即可解释性较差,不能给出哪些数据对于医疗诊断起了决定作用,因此医生对于医疗诊断结果不能完全相信,这样妨碍计算机技术用于生物医学领域。智慧医疗辅助诊断的可解释性模型就是提供疾病诊断结果的可解释性,即诊断疾病时,不仅仅是单纯给出诊断结果,还需要给出相关解释,例如诊断结果的由来,相关的案例等。
本专利运用文本检索技术,通过病例诊断结果或生物医学文献检索出相关的病例信息,从中找到以往的相似病例提供给医生。然而传统的检索方法,是对精准词的匹配,即使从生物医学知识库中加入词义相同的或者相关的词也不能很好解决,精准匹配带来的语义鸿沟问题。而最近深度学习技术应用于文本检索上,可以取得不错的效果,如将查询词或者拓展词与文档中的词通过神经网络映射到低维向量空间,从而更好比较两者的语义,找出具有相似语义但不完全匹配的词。除此之外,神经网络还可以通过深层的网络挖掘查询语句与文档整体语义匹配。然而大多数基于神经网络的检索模型并不能很好地解释检索结果,即只提供与查询相关的文章,而并不知道文档中哪些词或者哪些片段与查询语句有关,这还是会导致医生很难理解为什么得到这样的检索结果。此外,如果文档篇章过长,现有的神经网络不能很好地捕获文档中的语义信息,意味着不能很好地匹配文档与查询之间的语义关系。
文本检索可以提供病例诊断可解释性的结果,但可解释性的程度还不够,需要引入外部知识库以进一步解释检索结果。除此之外,最近比较流行的自注意模型也可以促进结果的可解释性。这种结构也可以用于解决文档过长所带来的长距离依赖的语义问题。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于文本检索的可解释性智慧医疗辅助诊断系统,可有效解决长文档长距离依赖的语义编码问题,以及将知识图谱很好地融入到查询词中,并通过知识图谱上和预训练的自注意力模型的权重值得到与查询词相关的实体信息或者文档片段,从而为智慧诊断提供更为精准的可解释性结果。
为实现上述目的,本发明所提供的技术方案为:一种基于文本检索的可解释性智慧医疗辅助诊断系统,包括:
查询预处理模块,用于对病人病历进行预处理,得到与患病信息相关的查询词;
知识图谱构建模块,用于与查询词结合形成一个新的关于特定疾病的知识图谱;
文本检索模块,用于通过查询词以及新的知识图谱来检索医学数据库中与查询词相关的以往的病例及治疗方案;
可解释的辅助诊断模块,用于解释检索出与病人病历相关的病例及治疗方案的原因。
进一步,所述查询预处理模块对病人病历进行的预处理包括分词、去标点符号、去停用词和拼写纠正,然后通过语法解析保留名词短语和动词短语,将其作为后续知识图谱融合的实体。
进一步,所述知识图谱构建模块通过从查询预处理模块中获得的名词短语和动词短语,从现有的生物医学领域知识图谱获得实体概念、语义解释和语义类型,通过知识融合,从现有的知识图谱中,抽取与查询词有关的子图,并融合形成新的特定疾病的知识图谱G,该知识图谱G定义为:
G={(h,r,t)|h,t∈ε,r∈R} (1)
式中,ε和R分别是集成图谱实体集合和关系集合;而三元组(h,r,t)表示这样的一条事实知识:头实体h与尾实体t之间存在着关系r。
进一步,所述文本检索模块包括词嵌入表示模块、图嵌入表示模块和文本匹配模块;
所述词嵌入表示模块利用预训练的自注意力模型来分别获得待检索病历与查询词的词嵌入表示;所述预训练的自注意力模型是一个12层的transformer的堆叠结构,其中第i层transformer的公式如(2)、(3)、(4)所示:
Figure BDA0002888777570000031
Mi=LN(Si-1+Oi) (3)
Figure BDA0002888777570000032
公式(2)中的Q、K、V是查询词或者待检索的病历,是一个二维矩阵,
Figure BDA0002888777570000033
分别是Q、K、V的二维的权重矩阵,dk
Figure BDA0002888777570000034
的其中一维的大小,是缩放值,softmax是归一化操作,Oi是通过词与词之间的相似度累加得到的序列向量;公式(3)中LN代表一个残差网络,Si-1是第i-1层的输入,在第一层指的是查询词或者待检索病历,Mi是残差网络的输出;公式(4)是两层全连接层,其中W1 i
Figure BDA0002888777570000041
是权重矩阵,
Figure BDA0002888777570000042
是偏置,ReLU是激活函数,Si是一层transformer的输出,即新的词向量嵌入表示;
所述图嵌入表示模块利用图注意力网络将特定疾病的知识图谱上查询词的词嵌入表示变为查询词的图嵌入表示,通过图注意力网络学习查询词在新的知识图谱的特征表示,其本质是图注意力网络通过对一个节点本身及在知识图谱上该节点的邻居给予不同的权重,学习得到一个新节点的特征表示;首先,知识图谱上所有节点的词向量嵌入表示H={h1,h2,...,ho},其中ho代表第o个节点的词向量嵌入,然后通过遮掩自注意力结构的方式将网络的关注点放在节点o的邻居节点集No,其中邻居节点集包括本身,这里节点代表查询词,具体公式如(5)所示:
Figure BDA0002888777570000043
式中,W、Wa是权重矩阵,ho、hj、hv分别是第o、j、v个节点,LeakyRelu给所有负值赋予一个非零的斜率,T是指对矩阵的转置,ao,j是节点o与节点j的相似度;最后通过对节点的邻居进行加权和得到节点在知识图谱上的图嵌入表示,公式如(6)所示:
Figure BDA0002888777570000044
式中,Wh是权重矩阵;最后通过图注意力网络将所有的查询词嵌入转为图嵌入表示序列Q=[q1,q2,...,qo],qo是第o个节点,即第o个查询词的图嵌入表示;
所述文本匹配模块将查询词的图嵌入表示平均池化以及待查询病历的词嵌入表示卷积和最大池化后,通过余弦计算来两者的相似度,得出查询词与待查询病历的匹配分数;其中,查询词的图嵌入表示平均池化公式如(7)所示:
Figure BDA0002888777570000051
式中,mean-pooling表示将Q进行平均操作,
Figure BDA0002888777570000052
是平均池化后的查询向量;待查询病历的卷积和最大池化公式如(8)、(9)、(10)所示
Figure BDA0002888777570000053
P=[p1,p2,...,pm] (9)
Figure BDA0002888777570000054
其中,由词嵌入表示模块得到的待检索病历的词嵌入表示序列D={d1,d2,...,dm},dm为待检索病历中第m个词的词嵌入,Dm-u:m+u为待检索病历中的第m-u到m+u的词,u是指卷积核的一半大小;公式(8)是卷积操作,bl是偏置,Wl是卷积核,l为第l个卷积核,
Figure BDA0002888777570000057
是点乘操作,pm,l是第l个卷积核得到的第m个标量;公式(9)是l个卷积核得到特征图P,pm是l个卷积核后得到的第m个向量;公式(10)max-pooling是最大池化操作,对特征图的每一列取最大值,得到待检索病历向量
Figure BDA0002888777570000055
所述文本匹配模块通过计算查询向量与待检索病历向量余弦值来得到两者的相似度分数score,公式如(11)所示:
Figure BDA0002888777570000056
进一步,所述可解释的辅助诊断模块将待检索病历与查询词匹配的分数进行排序,选取分数Top S个文档,S为选取文档的个数,通过可视化图注意力网络得到知识图谱上各个路径的权重值以及预训练的自注意力模型中查询词与文档中词语的权重值,标注出知识图谱上基于知识感知的传播路径以及文档中最相关的片段作为病例诊断的可解释结果。
本发明与现有技术相比,具有如下优点与有益效果:
1、结合图注意力网络,通过知识图谱对查询词的表征进行建模。不同于现有技术简单地拼接拓展词,本发明根据拓展词重要性不同,将拓展词的语义信息按照不同的比例编码进查询词的表征中,使得进行查询与文档匹配时更加精准。
2、利用预训练的自注意力机制加上Transformer结构对文档进行编码,这可以有效地解决了长文档所引起的长距离依赖的语义编码问题,同时这样的结构可以更好地匹配查询与文档之间的语义相似性。
3、利用图注意力网络与Transformer结构可以分别对知识图谱上的知识链路和查询的文档结果进行标注,得到最相关的信息片段,提供更加准确的可解释性结果。
附图说明
图1是可解释性智慧医疗辅助诊断系统的架构图。
图2是查询词与现有知识图谱的集成图。
图3是预训练的自注意力模型的结构示意图。
图4是图注意力网络的结构示意图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
如图1所示,本实施例所提供的基于文本检索的可解释性智慧医疗辅助诊断系统,包括以下功能模块:
查询预处理模块,用于对病人病历进行预处理,得到与患病信息相关的查询词;
知识图谱构建模块,用于与查询词结合形成一个新的关于特定疾病的知识图谱;
文本检索模块,用于通过查询词以及新的知识图谱来检索医学数据库中与查询词相关的以往的病例及治疗方案;
可解释的辅助诊断模块,用于解释检索出与病人病历相关的病例及治疗方案的原因。
所述查询预处理模块使用Spacy工具对查询词进行预处理,分词,去标点符号,去停用词,拼写纠正,然后通过语法解析保留名词短语、动词短语等与病例诊断相关的关键词信息。
查询词是和病人相关的信息,包括疾病名,基因名以及一些症状信息。预处理后如下所示:
疾病:急性髓性白血病
突变基因:ARCH
症状:出现乏力,伴有高热,最高体温40度,咳嗽。
所述知识图谱构建模块将上述预处理后的查询关键词与现有知识图谱,如UMLS、MeSH、NCBI等,进行知识融合,然后形成一个新的关于特定疾病的知识图谱。从现有的知识图谱中,抽取与查询词有关的子图,并融合形成新的特定疾病的知识图谱G,该知识图谱G定义为:
G={(h,r,t)|h,t∈ε,r∈R} (1)
式中,ε和R分别是集成图谱实体集合和关系集合;而三元组(h,r,t)表示这样的一条事实知识:头实体h与尾实体t之间存在着关系r。
具体过程使用MetaMap来提取每个查询词的UMLS概念。对于疾病方面的查询扩展可以借由Lexigram工具进行知识集成,对于基因方面的查询扩展可以通过NCBI进行实体提取,这些提取的概念及其名称变体都将被用于与查询词进行知识融合,如图2所示。图2描述了急性髓性白血病的一些相关症状,突变基因,以及与之相关的其它疾病。
所述文本检索模块包括词嵌入表示模块、图嵌入表示模块和文本匹配模块。
所述词嵌入表示模块利用预训练的自注意力模型来分别获得待检索病历与查询词的词嵌入表示;所述预训练的自注意力模型是一个12层的transformer的堆叠结构。如图3所示,公式(2)对应图中的多头注意力机制,公式(3)对应图中的残差网络,公式(4)对应图中的两层全连接层。查询向量与文档向量分别按照格式“[CLS]Q[SEP]”和“[CLS]D[SEP]”输入到transformer的公式中,
Figure BDA0002888777570000081
Mi=LN(Si-1+Oi) (3)
Figure BDA0002888777570000082
公式(2)中的Q、K、V是查询词或者待检索的病历,是一个二维矩阵,
Figure BDA0002888777570000083
分别是Q、K、V的二维的权重矩阵,dk
Figure BDA0002888777570000084
的其中一维的大小,是缩放值,softmax是归一化操作,Oi是通过词与词之间的相似度累加得到的序列向量;公式(3)中LN代表一个残差网络,Si-1是第i-1层的输入,在第一层指的是查询词或者待检索病历,Mi是残差网络的输出;公式(4)是两层全连接层,其中W1 i
Figure BDA0002888777570000085
是权重矩阵,
Figure BDA0002888777570000086
是偏置,ReLU是激活函数,Si是一层transformer的输出,即新的词向量嵌入表示。
输入查询词和待检索病历后分别得到H={h1,h2,...,hn}和D={d1,d2,...,dm},其中hn为第n个查询词的词嵌入,dm为待检索病历中第m个词的词嵌入。
所述图嵌入表示模块利用图注意力网络将特定疾病的知识图谱上查询词的词嵌入表示变为查询词的图嵌入表示。通过图注意力网络学习查询词在新的知识图谱的特征表示,其本质是图注意网络通过对一个节点本身及在知识图谱上该节点的邻居给予不同的权重,学习得到一个新节点的特征表示。首先知识图谱上节点的词向量嵌入表示:H={h1,h2,...,ho},其中ho代表第o个节点的词向量嵌入。然后通过遮掩自注意力机制的方式将网络的关注点放在节点o的邻居节点集No(邻居节点集包括本身),这里节点指查询词。图注意力网络结构如图4所示,节点o与节点j的相似度计算,具体公式如(5)所示:
Figure BDA0002888777570000091
式中,W、Wa是权重矩阵,ho,hj,ht分别是第o,j,v个节点。LeakyRelu给所有负值赋予一个非零的斜率,T是指对矩阵的转置,ao,j是节点o与节点j的相似度;最后通过对节点的邻居进行加权和得到节点在知识图谱上的图嵌入表示,公式如(6)所示:
Figure BDA0002888777570000092
式中,Wh是权重矩阵,ReLU属于激活函数;最后通过图注意力网络将所有的查询词嵌入转为图嵌入表示序列Q=[q1,q2,...,qo],qo是第o个节点,即第o个查询词的图嵌入表示。
所述文本匹配模块将查询词的图嵌入表示平均池化以及待查询病历的词嵌入表示卷积和最大池化后,通过余弦计算来两者的相似度,得出查询词与待查询病历的匹配分数。其中,查询词的图嵌入表示平均池化公式如(7)所示:
Figure BDA0002888777570000093
式中,mean-pooling表示将Q进行平均操作,
Figure BDA0002888777570000094
是平均池化后的查询向量;待查询病历的卷积和最大池化公式如(8),(9),(10)所示
Figure BDA0002888777570000101
P=[p1,p2,...,pm] (9)
Figure BDA0002888777570000102
其中,由词嵌入表示模块得到的待检索病历的词嵌入表示序列D={d1,d2,...,dm},dm为待检索病历中第m个词,Dm-u:m+u为待检索病历中的第m-u到m+u的词,u是指卷积核的一半大小;公式(8)是卷积操作,bl是偏置,Wr,l是卷积核,l为第l个卷积核,ReLU为激活函数,
Figure BDA0002888777570000105
是点乘操作,pm,l是第l个卷积核得到的第m个标量;公式(9)是l个卷积核得到特征图P,pm是l个卷积核后得到的第m个向量;公式(10)max-pooling是最大池化操作,对特征图的每一列取最大值,得到待检索病历向量
Figure BDA0002888777570000103
所述文本匹配模块通过计算查询向量与待检索病历向量余弦值来得到两者的相似度分数score。公式如(11)所示:
Figure BDA0002888777570000104
所述可解释的辅助诊断模块将待检索病历与查询词匹配的分数进行排序,选取Top S个文档,S为选取文档的个数,通过可视化图注意力网络得到知识图谱上各个路径的权重值,标注出知识图谱上基于知识感知的传播路径,如图2所示,图注意力网络可以自适应地为知识图谱中各个连接路径分配不同的注意力权重得分a1,a1,...a11。每个查询词周围邻居的权重值越大,则表明越重要,即与检索的结果更相关。也可通过预训练的自注意力模型中查询词与文档中词语的权重值以及文档中最相关的片段作为智慧病例诊断的可解释结果,如图1中可解释结果中的加粗字段所示。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (5)

1.一种基于文本检索的可解释性智慧医疗辅助诊断系统,其特征在于,包括:
查询预处理模块,用于对病人病历进行预处理,得到与患病信息相关的查询词;
知识图谱构建模块,用于与查询词结合形成一个新的关于特定疾病的知识图谱;
文本检索模块,用于通过查询词以及新的知识图谱来检索医学数据库中与查询词相关的以往的病例及治疗方案;
可解释的辅助诊断模块,用于解释检索出与病人病历相关的病例及治疗方案的原因。
2.根据权利要求1所述的一种基于文本检索的可解释性智慧医疗辅助诊断系统,其特征在于:所述查询预处理模块对病人病历进行的预处理包括分词、去标点符号、去停用词和拼写纠正,然后通过语法解析保留名词短语和动词短语,将其作为后续知识图谱融合的实体。
3.根据权利要求1所述的一种基于文本检索的可解释性智慧医疗辅助诊断系统,其特征在于:所述知识图谱构建模块通过从查询预处理模块中获得的名词短语和动词短语,从现有的生物医学领域知识图谱获得实体概念、语义解释和语义类型,通过知识融合,从现有的知识图谱中,抽取与查询词有关的子图,并融合形成新的特定疾病的知识图谱G,该知识图谱G定义为:
G={(h,r,t)|h,t∈ε,r∈R} (1)
式中,ε和R分别是集成图谱实体集合和关系集合;而三元组(h,r,t)表示这样的一条事实知识:头实体h与尾实体t之间存在着关系r。
4.根据权利要求1所述的一种基于文本检索的可解释性智慧医疗辅助诊断系统,其特征在于:所述文本检索模块包括词嵌入表示模块、图嵌入表示模块和文本匹配模块;
所述词嵌入表示模块利用预训练的自注意力模型来分别获得待检索病历与查询词的词嵌入表示;所述预训练的自注意力模型是一个12层的transformer的堆叠结构,其中第i层transformer的公式如(2)、(3)、(4)所示:
Figure FDA0002888777560000021
Mi=LN(Si-1+Oi) (3)
Figure FDA0002888777560000022
公式(2)中的Q、K、V是查询词或者待检索的病历,是一个二维矩阵,
Figure FDA0002888777560000023
分别是Q、K、V的二维的权重矩阵,dk
Figure FDA0002888777560000024
的其中一维的大小,是缩放值,softmax是归一化操作,Oi是通过词与词之间的相似度累加得到的序列向量;公式(3)中LN代表一个残差网络,Si-1是第i-1层的输入,在第一层指的是查询词或者待检索病历,Mi是残差网络的输出;公式(4)是两层全连接层,其中W1 i
Figure FDA0002888777560000025
是权重矩阵,
Figure FDA0002888777560000026
是偏置,ReLU是激活函数,Si是一层transformer的输出,即新的词向量嵌入表示;
所述图嵌入表示模块利用图注意力网络将特定疾病的知识图谱上查询词的词嵌入表示变为查询词的图嵌入表示,通过图注意力网络学习查询词在新的知识图谱的特征表示,其本质是图注意力网络通过对一个节点本身及在知识图谱上该节点的邻居给予不同的权重,学习得到一个新节点的特征表示;首先,知识图谱上所有节点的词向量嵌入表示H={h1,h2,...,ho},其中ho代表第o个节点的词向量嵌入,然后通过遮掩自注意力结构的方式将网络的关注点放在节点o的邻居节点集No,其中邻居节点集包括本身,这里节点代表查询词,具体公式如(5)所示:
Figure FDA0002888777560000031
式中,W、Wa是权重矩阵,ho、hj、hv分别是第o、j、v个节点,LeakyRelu给所有负值赋予一个非零的斜率,T是指对矩阵的转置,ao,j是节点o与节点j的相似度;最后通过对节点的邻居进行加权和得到节点在知识图谱上的图嵌入表示,公式如(6)所示:
Figure FDA0002888777560000032
式中,Wh是权重矩阵;最后通过图注意力网络将所有的查询词嵌入转为图嵌入表示序列Q=[q1,q2,...,qo],qo是第o个节点,即第o个查询词的图嵌入表示;
所述文本匹配模块将查询词的图嵌入表示平均池化以及待查询病历的词嵌入表示卷积和最大池化后,通过余弦计算来两者的相似度,得出查询词与待查询病历的匹配分数;其中,查询词的图嵌入表示平均池化公式如(7)所示:
Figure FDA0002888777560000033
式中,mean-pooling表示将Q进行平均操作,
Figure FDA0002888777560000034
是平均池化后的查询向量;待查询病历的卷积和最大池化公式如(8)、(9)、(10)所示
Figure FDA0002888777560000036
P=[p1,p2,...,pm] (9)
Figure FDA0002888777560000035
其中,由词嵌入表示模块得到的待检索病历的词嵌入表示序列D={d1,d2,...,dm},dm为待检索病历中第m个词的词嵌入,Dm-u:m+u为待检索病历中的第m-u到m+u的词,u是指卷积核的一半大小;公式(8)是卷积操作,bl是偏置,Wl是卷积核,l为第l个卷积核,
Figure FDA0002888777560000043
是点乘操作,pm,l是第l个卷积核得到的第m个标量;公式(9)是l个卷积核得到特征图P,pm是l个卷积核后得到的第m个向量;公式(10)max-pooling是最大池化操作,对特征图的每一列取最大值,得到待检索病历向量
Figure FDA0002888777560000041
所述文本匹配模块通过计算查询向量与待检索病历向量余弦值来得到两者的相似度分数score,公式如(11)所示:
Figure FDA0002888777560000042
5.根据权利要求1所述的一种基于文本检索的可解释性智慧医疗辅助诊断系统,其特征在于:所述可解释的辅助诊断模块将待检索病历与查询词匹配的分数进行排序,选取分数Top S个文档,S为选取文档的个数,通过可视化图注意力网络得到知识图谱上各个路径的权重值以及预训练的自注意力模型中查询词与文档中词语的权重值,标注出知识图谱上基于知识感知的传播路径以及文档中最相关的片段作为病例诊断的可解释结果。
CN202110021525.3A 2021-01-08 2021-01-08 一种基于文本检索的可解释性智慧医疗辅助诊断系统 Active CN112687388B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110021525.3A CN112687388B (zh) 2021-01-08 2021-01-08 一种基于文本检索的可解释性智慧医疗辅助诊断系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110021525.3A CN112687388B (zh) 2021-01-08 2021-01-08 一种基于文本检索的可解释性智慧医疗辅助诊断系统

Publications (2)

Publication Number Publication Date
CN112687388A true CN112687388A (zh) 2021-04-20
CN112687388B CN112687388B (zh) 2023-09-01

Family

ID=75456398

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110021525.3A Active CN112687388B (zh) 2021-01-08 2021-01-08 一种基于文本检索的可解释性智慧医疗辅助诊断系统

Country Status (1)

Country Link
CN (1) CN112687388B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157891A (zh) * 2021-05-07 2021-07-23 泰康保险集团股份有限公司 知识图谱路径排序方法、系统、设备及存储介质
CN113408298A (zh) * 2021-06-30 2021-09-17 北京百度网讯科技有限公司 语义解析方法、装置、电子设备及存储介质
CN113470811A (zh) * 2021-06-16 2021-10-01 广州中康健数智能科技有限公司 一种基于深度强化学习的辅助智能问诊系统
CN113535974A (zh) * 2021-06-28 2021-10-22 科大讯飞华南人工智能研究院(广州)有限公司 诊断推荐方法及相关装置、电子设备、存储介质
CN114388087A (zh) * 2021-12-23 2022-04-22 沈阳东软智能医疗科技研究院有限公司 信息处理方法、装置、可读存储介质及电子设备
CN114417016A (zh) * 2022-01-26 2022-04-29 中山大学 一种基于知识图谱的文本信息匹配方法、装置及相关设备
CN114491037A (zh) * 2022-01-26 2022-05-13 东软集团股份有限公司 基于知识图谱的故障诊断方法、装置、设备及介质
CN115050465A (zh) * 2022-04-29 2022-09-13 中国科学院自动化研究所 一种诊断数据分析方法及系统
CN115101212A (zh) * 2022-06-17 2022-09-23 中南大学湘雅三医院 一种肾脏病临床诊断服务系统及方法
CN116189843A (zh) * 2023-04-23 2023-05-30 索思(苏州)医疗科技有限公司 治疗方案推荐方法、装置、系统及存储介质
CN116631614A (zh) * 2023-07-24 2023-08-22 北京惠每云科技有限公司 治疗方案生成方法、装置、电子设备及存储介质
CN118094028A (zh) * 2024-04-28 2024-05-28 北方健康医疗大数据科技有限公司 一种疾病搜索排序方法、系统、终端及存储介质
CN118522469A (zh) * 2024-07-22 2024-08-20 宁波紫湾科技有限公司 一种大数据分析医疗决策方法及系统
CN118968099A (zh) * 2024-10-14 2024-11-15 中国科学院自动化研究所 相似病历检索模型的训练方法、检索方法及电子设备
CN119673429A (zh) * 2024-12-05 2025-03-21 济南凯信医疗科技有限公司 一种基于互联网的线上妇科疾病智能咨询系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110322959A (zh) * 2019-05-24 2019-10-11 山东大学 一种基于知识的深度医疗问题路由方法及系统
CN110334221A (zh) * 2019-07-18 2019-10-15 桂林电子科技大学 一种基于知识图谱路径的可解释性推荐方法
CN111241807A (zh) * 2019-12-31 2020-06-05 浙江大学 一种基于知识引导注意力的机器阅读理解方法
CN111597314A (zh) * 2020-04-20 2020-08-28 科大讯飞股份有限公司 推理问答方法、装置以及设备
CN111613339A (zh) * 2020-05-15 2020-09-01 山东大学 一种基于深度学习的相似病历查找方法与系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110322959A (zh) * 2019-05-24 2019-10-11 山东大学 一种基于知识的深度医疗问题路由方法及系统
CN110334221A (zh) * 2019-07-18 2019-10-15 桂林电子科技大学 一种基于知识图谱路径的可解释性推荐方法
CN111241807A (zh) * 2019-12-31 2020-06-05 浙江大学 一种基于知识引导注意力的机器阅读理解方法
CN111597314A (zh) * 2020-04-20 2020-08-28 科大讯飞股份有限公司 推理问答方法、装置以及设备
CN111613339A (zh) * 2020-05-15 2020-09-01 山东大学 一种基于深度学习的相似病历查找方法与系统

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157891A (zh) * 2021-05-07 2021-07-23 泰康保险集团股份有限公司 知识图谱路径排序方法、系统、设备及存储介质
CN113157891B (zh) * 2021-05-07 2023-11-17 泰康保险集团股份有限公司 知识图谱路径排序方法、系统、设备及存储介质
CN113470811A (zh) * 2021-06-16 2021-10-01 广州中康健数智能科技有限公司 一种基于深度强化学习的辅助智能问诊系统
CN113535974A (zh) * 2021-06-28 2021-10-22 科大讯飞华南人工智能研究院(广州)有限公司 诊断推荐方法及相关装置、电子设备、存储介质
CN113535974B (zh) * 2021-06-28 2024-04-09 科大讯飞华南人工智能研究院(广州)有限公司 诊断推荐方法及相关装置、电子设备、存储介质
CN113408298A (zh) * 2021-06-30 2021-09-17 北京百度网讯科技有限公司 语义解析方法、装置、电子设备及存储介质
CN113408298B (zh) * 2021-06-30 2024-05-31 北京百度网讯科技有限公司 语义解析方法、装置、电子设备及存储介质
CN114388087A (zh) * 2021-12-23 2022-04-22 沈阳东软智能医疗科技研究院有限公司 信息处理方法、装置、可读存储介质及电子设备
CN114491037A (zh) * 2022-01-26 2022-05-13 东软集团股份有限公司 基于知识图谱的故障诊断方法、装置、设备及介质
CN114417016A (zh) * 2022-01-26 2022-04-29 中山大学 一种基于知识图谱的文本信息匹配方法、装置及相关设备
CN115050465A (zh) * 2022-04-29 2022-09-13 中国科学院自动化研究所 一种诊断数据分析方法及系统
CN115050465B (zh) * 2022-04-29 2025-02-07 中国科学院自动化研究所 一种诊断数据分析方法及系统
CN115101212A (zh) * 2022-06-17 2022-09-23 中南大学湘雅三医院 一种肾脏病临床诊断服务系统及方法
CN116189843A (zh) * 2023-04-23 2023-05-30 索思(苏州)医疗科技有限公司 治疗方案推荐方法、装置、系统及存储介质
CN116631614A (zh) * 2023-07-24 2023-08-22 北京惠每云科技有限公司 治疗方案生成方法、装置、电子设备及存储介质
CN118094028A (zh) * 2024-04-28 2024-05-28 北方健康医疗大数据科技有限公司 一种疾病搜索排序方法、系统、终端及存储介质
CN118522469A (zh) * 2024-07-22 2024-08-20 宁波紫湾科技有限公司 一种大数据分析医疗决策方法及系统
CN118968099A (zh) * 2024-10-14 2024-11-15 中国科学院自动化研究所 相似病历检索模型的训练方法、检索方法及电子设备
CN118968099B (zh) * 2024-10-14 2025-04-29 中国科学院自动化研究所 相似病历检索模型的训练方法、检索方法及电子设备
CN119673429A (zh) * 2024-12-05 2025-03-21 济南凯信医疗科技有限公司 一种基于互联网的线上妇科疾病智能咨询系统

Also Published As

Publication number Publication date
CN112687388B (zh) 2023-09-01

Similar Documents

Publication Publication Date Title
CN112687388B (zh) 一种基于文本检索的可解释性智慧医疗辅助诊断系统
CN110298037B (zh) 基于增强注意力机制的卷积神经网络匹配的文本识别方法
CN112100346B (zh) 基于细粒度图像特征和外部知识相融合的视觉问答方法
CN112800292A (zh) 一种基于模态特定和共享特征学习的跨模态检索方法
CN116610778A (zh) 基于跨模态全局与局部注意力机制的双向图文匹配方法
CN114661933A (zh) 基于胎儿先心病超声图像—诊断报告的跨模态检索方法
CN111859938B (zh) 基于位置向量降噪和丰富语义的电子病历实体关系抽取方法
CN115017884B (zh) 基于图文多模态门控增强的文本平行句对抽取方法
CN112347780B (zh) 基于深度神经网络的司法事实查明生成方法、装置、介质
CN116049406A (zh) 一种基于对比学习的跨域情感分类方法
Zhang et al. Multi-head self-attention gated-dilated convolutional neural network for word sense disambiguation
CN114048314A (zh) 一种自然语言隐写分析方法
CN116775798A (zh) 一种基于图网络与模态间特征融合的跨模态哈希方法
CN114022687B (zh) 一种基于增强学习的图像描述对抗生成方法
CN111325036A (zh) 一种面向新兴技术预测的佐证事实的抽取方法及系统
CN118643833B (zh) 基于医疗字典知识增强的中文电子病历命名实体识别方法
CN107633259B (zh) 一种基于稀疏字典表示的跨模态学习方法
CN118782203A (zh) 一种基于信息检索的病理诊断报告生成方法
CN117558394B (zh) 一种基于跨模态网络的胸部x线影像报告生成方法
CN118484537A (zh) 一种基于对偶对比学习框架和交叉注意模块的零样本关系抽取方法及模型
CN117557803A (zh) 一种基于跨模态结构一致性和预训练技术的视觉语言对齐方法和系统
CN116976355A (zh) 一种面向图文模态的自适应的蒙古语情感分析方法
CN116502642A (zh) 一种基于视觉-语言结合的命名实体识别方法及装置
CN116956925A (zh) 电子病历命名实体识别方法和装置、电子设备及存储介质
CN115565007A (zh) 基于知识蒸馏的隐空间语义监督的跨模态检索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant