[go: up one dir, main page]

CN111599427A - 一种一元化诊断的推荐方法、装置、电子设备及存储介质 - Google Patents

一种一元化诊断的推荐方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111599427A
CN111599427A CN202010409050.0A CN202010409050A CN111599427A CN 111599427 A CN111599427 A CN 111599427A CN 202010409050 A CN202010409050 A CN 202010409050A CN 111599427 A CN111599427 A CN 111599427A
Authority
CN
China
Prior art keywords
diagnosis
disease
cluster
unified
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010409050.0A
Other languages
English (en)
Other versions
CN111599427B (zh
Inventor
陈静锋
丁素英
郭崇慧
张丽华
秦迁
杨阳
闫航
生士凤
李维康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
First Affiliated Hospital of Zhengzhou University
Original Assignee
Dalian University of Technology
First Affiliated Hospital of Zhengzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology, First Affiliated Hospital of Zhengzhou University filed Critical Dalian University of Technology
Priority to CN202010409050.0A priority Critical patent/CN111599427B/zh
Publication of CN111599427A publication Critical patent/CN111599427A/zh
Application granted granted Critical
Publication of CN111599427B publication Critical patent/CN111599427B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明涉及健康管理中疾病辅助诊断的技术领域,具体涉及一种一元化诊断的推荐方法、装置、电子设备及存储介质。根据受检者的诊断编码,确定所述诊断编码与簇Ck中的主/次要典型疾病诊断编码集的相似性度量结果;所述簇Ck是根据N个受检者诊断信息之间的相似性划分的K个簇;选择大于预设阈值的相似度值所属的簇,从一元化诊断库中获取每个簇所对应的疾病共现模式;将所获得的疾病共现模式结合所述诊断编码在ICD本体结构进行可视化分析,按照同一分支下所述诊断编码间的语义关系,识别最近父节点,得到疾病类型并重新排序得到该受检者的一元化诊断,解决了对于同一位受检者,不同主检医师给出的一元化诊断结果存在较大差异的技术问题。

Description

一种一元化诊断的推荐方法、装置、电子设备及存储介质
技术领域
本发明涉及健康管理中疾病辅助诊断的技术领域,具体涉及一种一元化诊断的推荐方法、装置、电子设备及存储介质。
背景技术
健康体检报告是健康管理(体检)机构给受检者出具的医学文书,包括健康体检报告首页、主检报告、体格检查记录、实验室和医学影像检查报告等。主检报告作为体检报告的核心组成部分,目前尚无具体实施细则可供参考,全国各地不同体检机构的书写方式各不相同,质量参差不齐。一元化诊断是主检报告的主要内容,主检医师应本着临床诊断思维的基本原则,特别是一元论原则,按照疾病系统合理归类,尽量用一种疾病去概括或解释疾病的多种临床表现,合理归类可以使主检报告条理清晰。目前各体检机构主检报告多借用相关软件完成,疾病的诊断结果多为各种阳性检查结果的罗列。
在实际工作中,主检医师通常需要严格核对受检者的基本信息,各项检查结果,总结主、次要诊断和阳性发现,结合自身医学知识,给出相应的诊断结果。
发明人在实践中,发现上述现有技术存在以下缺陷:
由于主检医师专业水平的差异、受检者的检查项目不同、主/次要诊断与阳性体征的变异,现有的仅依赖主检医师自身专业知识的一元化诊断方法耗时耗力,效率低、耗时长,同时对于同一位受检者的体检结论,不同主检医师给出的一元化诊断结果也存在较大差异。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种一元化诊断的推荐方法、装置、设备及存储介质,所采用的技术方案具体如下:
第一方面,本发明实施例提供了一种一元化诊断的推荐方法,该方法包括以下步骤:
根据受检者的诊断编码,确定所述诊断编码与簇Ck中的主/次要典型疾病诊断编码集的相似性度量结果;所述簇Ck是根据N个受检者诊断信息之间的相似性划分的K个簇;
选择大于预设阈值的相似度值所属的簇,从一元化诊断库中获取每个簇所对应的疾病共现模式;
将所获得的疾病共现模式结合所述诊断编码在ICD本体结构进行可视化分析,按照同一分支下所述诊断编码间的语义关系,识别最近父节点,得到疾病类型并重新排序得到该受检者的一元化诊断。
第二方面,本发明实施例提供了一种一元化诊断的推荐装置,所述装置包括:
相似性度量模块,用于根据受检者的诊断编码,确定所述诊断编码与簇Ck中的主/次要典型疾病诊断编码集的相似性度量结果;所述簇Ck是根据N个受检者诊断信息之间的相似性划分的K个簇;
匹配检测模块,用于选择大于预设阈值的相似度值所属的簇,从一元化诊断库中获取每个簇所对应的疾病共现模式;和
推荐模块,用于将所获得的疾病共现模式结合所述诊断编码在ICD本体结构进行可视化分析,按照同一分支下所述诊断编码间的语义关系,识别最近父节点,得到疾病类型并重新排序得到该受检者的一元化诊断。
第三方面,本发明实施例提供了一种电子设备,包括:
处理单元;
用于存储处理单元可执行指令的存储单元;
其中,所述处理单元被配置为:执行上述任意一项所述的方法。
第四方面,本发明实施例提供了一种存储介质,该存储介质中存储有计算机可读的程序指令,所述程序指令被处理单元执行时实现上述任意一项所述的方法。
本发明具有如下有益效果:
本发明实施例通过将受检者的诊断编码与主/次要典型疾病诊断编码集的相似性度量结果,从一元化诊断库中获取每个簇所对应的疾病共现模式,并对获取的疾病共现模式结合诊断编码在ICD本体结构进行可视化分析,进而得到疾病类型并重新排序得到该受检者的一元化诊断。针对受检者多种疾病诊断及阳性体征,为主检医师快速、自动化确定主要疾病的一元化诊断提供辅助参考,并根据一元化诊断及其排序结果可以让受检者清楚当前自身健康存在的主要问题与次要问题。解决了对于同一位受检者,不同主检医师给出的一元化诊断结果存在较大差异的技术问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种一元化诊断的推荐方法的流程图;
图2为本发明一个实施例所提供的关于一元化诊断库的构建方法的流程图;
图3为本发明一个实施例所提供的关于获得主/次要典型疾病诊断编码集的方法流程图;
图4为本发明一个实施例所提供的关于一元化诊断库的构建方法和一元化诊断的推荐方法的整体流程图;
图5为本发明一个实施例所提供的关于ICD-10疾病分类体系局部结构;
图6为本发明另一个实施例所提供的关于3个簇的典型疾病诊断编码集的结构示意图;
图7为本发明另一个实施例所提供的关于簇3的典型疾病共现模式的结构示意图;
图8为本发明另一个实施例所提供的关于该患者的一元化诊断结果的结构示意图;
图9为本发明一个实施例所提供的一种一元化诊断的推荐装置的结构框图;
图10为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种一元化诊断的推荐方法、装置、电子设备及存储介质,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明实施例所提供的一种一元化诊断的推荐方法、装置、电子设备及存储介质的具体方案。
请参阅图1,其示出了本发明实施例所提供的一种一元化诊断的推荐方法的流程图,为了解决不同的主检医师给出的一元化诊断结果存在较大差异的技术问题,本发明实施例通过疾病诊断编码的相似性度量、可视化分析与主检医师的评估,推荐合理的一元化诊断结果,该一元化诊断的推荐方法包括以下步骤:
步骤S001,根据受检者的诊断编码,确定所述诊断编码与簇Ck中的主/次要典型疾病诊断编码集的相似性度量结果;所述簇Ck是根据N个受检者诊断信息之间的相似性划分的 K个簇。
步骤S002,选择大于预设阈值的相似度值所属的簇,从一元化诊断库中获取每个簇所对应的疾病共现模式。
步骤S003,将所获取的疾病共现模式结合所述诊断编码在ICD本体结构进行可视化分析,按照同一分支下所述诊断编码间的语义关系,识别最近父节点,得到疾病类型并重新排序得到该受检者的疾病共现模式。
具体到本实施例中,当新受检者进行健康体检后,主检医师根据受检者本次的检查结果,确定一系列主/次要诊断和阳性发现的诊断编码,首先根据相似性度量方法计算该受检者与每个簇的主/次要典型疾病诊断编码集的相似度,得到一组相似性度量结果。将相似性度量结果进行排序,识别最高的相似度值或者排名前五的相似度值,将其所属簇的结果赋予该受检者,即将一元化诊断库中的典型疾病共现模式推荐给主检医师。将该受检者的疾病诊断编码与被推荐的典型疾病共现模式在ICD本体结构进行可视化分析,按照同一分支下疾病诊断编码间的概念语义关系,自动识别最近父节点,并定义新的疾病类型及其次序,确定该受检者的一元化诊断。主检医师根据自身领域知识,对得到的疾病共现模式进行校正、归类、评估与定义等操作,进而得到针对该受检者本次体检的一元化诊断结果。
综上所述,本发明实施例通过将受检者的诊断编码与主/次要典型疾病诊断编码集的相似性度量结果,从一元化诊断库中获取每个簇所对应的疾病共现模式,并对获取的疾病共现模式结合诊断编码在ICD本体结构进行可视化分析,进而得到疾病类型并重新排序得到该受检者的疾病共现模式。针对受检者多种疾病诊断及阳性体征,为主检医师快速、自动化确定主要疾病的一元化诊断提供辅助参考,并根据一元化诊断及其排序结果可以让受检者清楚当前自身健康存在的主要问题与次要问题。解决了对于同一位受检者,不同主检医师给出的一元化诊断结果存在较大差异的技术问题。
请参阅图2~4,作为本发明的一个优选实施例,以ICD-10疾病分类体系为例,上述步骤S002中的一元化诊断库的构建方法,包括以下步骤:
步骤S201,将受检者的主检报告映射到ICD疾病体系中,用疾病诊断编码表示。
具体的,在规范的主检报告中以疾病诊断编码(如ICD-10)的形式表示受检者的本次的主/次要诊断与阳性体征。通常一位受检者被标注为一系列疾病编码的集合,且编码具有一定的顺序性,越靠前的诊断编码表示受检者的主要疾病类型或者阳性特征。受检者的诊断信息定义为:
Di={(d1,Seq(d1)),(d2,Seq(d2)),…}
其中,d1表示受检者的疾病编码,Seq(d1)表示受检者的疾病编码的次序。
步骤S202,根据疾病诊断编码,在ICD疾病分类体系的基础上,构建疾病编码本体结构。
为了度量受检者诊断信息的相似度,需要在ICD疾病分类体系的基础上,构建疾病编码本体结构(树状结构)。以ICD-10为例,请参阅图5,其示出了ICD-10疾病分类体系局部结构,共包括22章(第一层level-1),262节(第二层level-2),2051个3位类目(第三层level-3),9505个4位亚目(第四层level-4),22908个6位扩展编码(第五层level-5)。
步骤S203,疾病诊断编码在疾病编码本体结构中的语义关系的相似性度量。
ICD-10疾病分类体系是一类具有分类体系的层次树,同一分支下的诊断编码具有一定的相似性,本发明实施例采用基于语义关系的相似性度量方法,该相似性度量方法包括疾病诊断编码的信息量度量、疾病诊断编码间的相似性度量以及疾病诊断编码集间的相似性度量。
针对疾病诊断编码信息量度量方法,具体的,在ICD-10疾病分类体系中,每一个编码表示一个概念,且分类概念之间存在语义相似性,同一分支下的概念比不同分支的概念语义更相似。本发明实施例采用层次深度度量方法,即每一层赋予一个特定的数值,概念层次越深数值越大。对于一个ICD-10编码d1信息量定义为:
IC(d1)=path(d1→r)
其中,r表示ICD-10疾病分类体系的根节点,path(·)定义为从ICD-10编码d1走到根节点r的路径长度。因此,根节点的信息量为0,第一层章的信息量为1,第二层节的信息量为2,第三层类目的信息量为3,第四层亚目的信息量为4,第五层扩展编码的信息量为5。
针对疾病诊断编码间相似性度量方法,具体的,根据疾病诊断编码的信息量度量两个编码之间的相似性。本发明实施例采用两个语义概念的最近父节点的方法来计算相似度,对于两个编码之间的相似性定义为:
Figure RE-GDA0002505428850000051
其中,d1与d2为ICD-10疾病分类体系中的两个疾病诊断编码,LCA(d1,d2)定义为疾病诊断编码d1与疾病诊断编码d2的最近父节点,若d1=d2,则LCA(d1,d2)=d1=d2,IC(LCA(d1,d2))= IC(d1)=IC(d2);若d1≠d2,且LCA(d1,d2)=根节点,则IC(LCA(d1,d2))=0。
针对疾病诊断编码集间相似性度量方法,具体的,在健康体检报告中,受检者通常被诊断为一组疾病诊断编码的集合,通过度量两个疾病诊断编码集的相似性来表示受检者疾病诊断信息的相似性。本发明实施例采用一种考虑最相似编码成对平均值来度量编码集间的相似性,假设受检者i和受检者j的诊断信息分别定义为Di′i={di1,di2,…,dig,…}和Di′j={dj1,dj2,…,djh,…}(这里不考虑疾病诊断编码的次序),则受检者i和受检者j的诊断信息相似度定义为:
Figure RE-GDA0002505428850000061
其中,Di′i|为受检者i疾病诊断信息中疾病诊断编码的个数,|Di′j|为受检者j疾病诊断信息中疾病诊断编码的个数,dig为受检者i的第g个疾病诊断编码,djh受检者j的第h个疾病诊断编码。
通过对所有体检人群的诊断信息进行两两相似度度量,得到该体检人群的相似度矩阵 S。
步骤S204,根据相似度度量结果,对受检者进行聚类,获得簇CK
在体检人群诊断信息相似度矩阵基础上,利用聚类算法将相似的受检者聚成一类,保证在一个簇内的受检者相似,簇外的受检者不相似。
聚类算法是一种有效的无监督学习算法,主要分为划分方法、层次方法、基于密度的方法等,最常见的为K-means、层次聚类、基于密度峰值的聚类等。本发明实施例以AP聚类(仿射传播聚类)为例,将体检人群划分为不同的簇中。
在AP聚类中,簇的数量选择由偏好参数p值控制,本发明实施例采用偏好系数pc来控制簇的数量:
p=mean(S)-pc·N
其中,S为所有体检人群诊断信息的相似度矩阵,N为受检者数量。
根据受检者的疾病诊断信息,将N个受检者划分为K个簇(C1,C2,…,CK)中,每个簇的受检者人数定义为:
Figure RE-GDA0002505428850000062
其中,Ck(Di′j)表示被划分到簇CK中的受检者j,E(CK)表示簇Ck的人群代表。λ(·)为示性函数,当受检者j被划分到簇Ck中,Ck(Di′j)=E(Ck),λ(Ck(Di′j),E(Ck))=1,否则λ(Ck(Di′j),E(Ck))=0。换句话说,当受检者j被划分到簇Ck中,被赋予该簇的类标签E(CK),即用该簇的代表人群表示这个受检者被划分到这个簇中。
步骤S205,获得主/次要典型疾病诊断编码集。
请参阅图3,获得主/次要典型疾病诊断编码集的方法,包括以下步骤:
步骤S301,在簇Ck中选择与受检者相似度大于相似度阈值的人群代表作为核心体检人群。
由于ICD-10疾病分类体系存在复杂的语义关系,不同层次间的编码之间存在明显的差异,使得简单采用人群代表的ICD-10疾病诊断编码不能完全描述所属簇的共性特征。本发明实施例采用从每个簇中定义核心区域,选择与该簇人群代表相似度大的受检者,分析其诊断信息并抽取高频繁的疾病诊断编码的方法,来表示该簇的共性特征。
定义簇Ck的核心区域,即核心体检人群的选择:
Corek={Di′j|S(Di′j,E(Ck))≥τk}
其中,E(Ck)表示簇Ck的人群代表,τk为提前设定的相似度阈值。
步骤S302,在核心体检人群中选择出现的频率大于频率阈值的受检者的诊断编码组成典型疾病诊断编码集。
疾病诊断编码dh在簇Ck中出现的频率定义为:
Figure RE-GDA0002505428850000071
其中,|Corek|为簇Ck核心体检人群的个数。λ(·)为示性函数,当疾病诊断编码dh属于第j位受检者的诊断编码时,λ(dh,Di′j)=1,否则λ(dh,Di′j)=0。
作为一个示例,簇Ck中有100位受检者,其中50位受检者都有高血压(dh)这种诊断编码,则返回概率为50/100=0.5。
通过设定疾病诊断编码出现频率阈值δ,定义簇Ck的典型疾病诊断编码集:
TICDSk={dh|Frequencyk(dh)>δ}
步骤S303,计算簇Ck中每种典型疾病诊断编码的平均次序。典型疾病诊断编码的平均次序越小,成为主要诊断的概率越大。
定义簇Ck中每种典型疾病诊断编码的平均次序:
Figure RE-GDA0002505428850000072
其中,H'为典型疾病诊断编码集的个数,
Figure RE-GDA0002505428850000073
为典型疾病诊断编码dh在受检者 j的诊断信息Dij中的次序。
步骤S304,根据所述平均次序,对簇Ck中抽取的所述典型疾病诊断编码集进行重新排序,得到簇Ck中主要的疾病诊断类型和次要的疾病诊断类型。
通过对簇Ck中抽取的典型疾病诊断编码集进行重新排序,可以识别出该簇中主要的疾病诊断类型,次要的疾病诊断类型。
定义排序函数Rank(·),得出具有次序特征的主/次要典型疾病诊断编码集:
Figure RE-GDA0002505428850000081
Averagek(d1)函数的返回值为正数。
作为一个示例,假如有A、B和C,3种疾病,相应的average分别为5.3、2.5、3.6,则经过Rank函数重新排序后,顺序依次为变为B、C、A,排序越靠前越可能是主要诊断。
步骤S206,在ICD本体结构中展示簇Ck的主/次要典型疾病诊断编码集,按照同一分支下疾病诊断编码间的概念语义关系,识别最近父节点,得到新疾病类型,将新疾病类型重新排序得到典型疾病共现模式。
具体的,结合可视化分析技术,在ICD-10疾病分类体系中展示簇Ck的主/次要典型疾病诊断编码集,按照同一分支下疾病的诊断编码间的语义关系,自动识别最近父节点,定义新的疾病类型ei,即
ei=LCA(d1,d2,…,dm)
其中,d1、d2……dm为m个ICD-10体系中的疾病诊断编码,LCA(d1,d2,…,dm)为编码d1、 d2……dm的最近父节点。
因此,簇Ck的主/次要典型疾病诊断编码集转换为一系列新疾病类型的集合{e1,e2,…,em0,},并通过重新排序,得到典型疾病共现模式,即一元化诊断的初步结果。
步骤S207,接收主检医师的辅助操作,对所述典型疾病共现模式进行调整,得到一元化诊断库。
主检医师根据自身领域知识,对识别的典型疾病共现模式进行校正、归类、评估与定义等操作,得到最终的一元化诊断结果。
通过对所有簇的典型疾病共现模式进行总结概况,构建针对所选体检人群的典型疾病共现模式库,即一元化诊断库。
下面以电子病历临床诊断数据为例,验证实验结果的可行性。
选择公开的MIMIC-III数据集中4418例尿毒症患者的诊断信息,该诊断信息以ICD-9 编码的形式表示(纯数字表示,无字母),通过诊断信息相似性度量、AP聚类、主/次要典型疾病诊断编码集抽取,最终确定3个簇,其中典型疾病诊断编码集如图6所示。
以簇3中的患者诊断信息为例,将典型疾病诊断编码集及其次序在ICD-9本体结构中进行可视化分析,如图7所示,其中一元化诊断为泌尿生殖系统疾病、循环系统疾病、以及急性呼吸衰竭,次要诊断(并发症)为脓毒症、败血症、以及贫血等。
对于新的入院患者,其诊断编码分别为519.09、518.81、491.21、38.9、995.92、785.52、 584.9、482.1、427.31、519.19,计算该患者的诊断信息与3个簇的典型疾病诊断编码集的相似性度量结果,发现与簇3的相似度最大,将簇3的一元化诊断推荐给该患者,因此该患者的一元化诊断结果是簇3诊断结果与本次检查诊断结果的融合,即主要诊断为呼吸系统疾病、泌尿系统疾病、以及循环系统疾病,次要诊断(并发症)为脓毒症、败血症、以及贫血等如图8所示。
请参阅图9,基于与上述方法实施例相同的发明构思,本发明另一个实施例还提供了一种一元化诊断的推荐装置,所述装置包括相似性度量模块901、匹配检测模块902和推荐模块903。
具体的,相似性度量模块901用于根据受检者的诊断编码,确定所述诊断编码与簇Ck中的主/次要典型疾病诊断编码集的相似性度量结果;所述簇Ck是根据N个受检者诊断信息之间的相似性划分的K个簇。匹配检测模块902用于选择大于预设阈值的相似度值所属的簇,从一元化诊断库中获取每个簇所对应的疾病共现模式。推荐模块903用于将所获得的疾病共现模式结合所述诊断编码在ICD本体结构进行可视化分析,按照同一分支下所述诊断编码间的语义关系,识别最近父节点,得到疾病类型并重新排序得到该受检者的疾病共现模式。
优选的,该装置还包括一元化诊断库构建模块,所述一元化诊断库构建模块包括典型疾病共现模式获取模块和一元化诊断库生成模块。具体的,典型疾病共现模式获取模块用于在ICD本体结构中展示所述主/次要典型疾病诊断编码集,按照同一分支下疾病诊断编码间的语义关系,识别最近父节点,得到新疾病类型,将新疾病类型重新排序得到典型疾病共现模式。一元化诊断库生成模块用于接收主检医师的辅助操作,对所述典型疾病共现模式进行调整,得到一元化诊断库。
优选的,该装置还包括主/次要典型疾病诊断编码集获取模块,主/次要典型疾病诊断编码集获取模块包括核心体检人群确定模块、典型疾病诊断编码集生成模块、平均次序计算模块和获取模块。具体的,核心体检人群确定模块用于在簇Ck中选择与受检者相似度大于相似度阈值的人群代表作为核心体检人群。典型疾病诊断编码集生成模块用于在所述核心体检人群中选择出现的频率大于频率阈值的受检者的诊断编码组成典型疾病诊断编码集。平均次序计算模块用于计算簇Ck中每种典型疾病诊断编码的平均次序。获取模块用于根据所述平均次序,对簇Ck中抽取的所述典型疾病诊断编码集进行重新排序,得到簇Ck中主要的疾病诊断类型和次要的疾病诊断类型。
优选的,该装置还包括相似性度量模块,所述相似性度量模块包括疾病诊断编码的信息量度量模块、疾病诊断编码间的相似性度量模块以及疾病诊断编码集间的相似性度量模块。
请参阅图10,图10示出了上述实施例中所涉及的电子设备的一种可能的结构示意图。该电子设备可以包括:处理单元1001、存储单元1002和通信单元1003。处理单元1001 可以设置为与存储单元1002通信。存储单元1002用于存储处理单元1001可执行指令和/ 或程序代码等,其中,处理单元被配置为执行上述任意一个方法实施例所提供的一种一元化诊断的推荐方法。该通信单元1003用于支持该电子设备与其他网络实体的通信,以实现数据交互等功能,如该通信模块1003支持电子设备与其他智能终端的通信,以实现数据交互功能。
其中,处理单元1001可以是处理器或控制器。通信模块1003可以是收发器、RF电路或通信接口等。存储单元1002可以是存储器。
图10仅仅是本申请实施例的一种可能的实现方式,在实际应用中,该电子设备还可以包括更多或更少的部件,这里不作限制。
需要说明的是,该电子设备可以是服务器,也可以是智能终端,该智能终端可以是计算机、平板电脑或者智能手机等。
本发明实施例还提供了一种存储介质,该存储介质中存储有计算机可读的程序指令,所述程序指令被处理单元执行时实现上述任意一个实施例中所提供的一种一元化诊断的推荐方法。例如,该计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、只读光盘(Compact Disc Read-OnlyMemory,CD-ROM)、磁带、软盘和光数据存储设备等。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置和服务器实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种一元化诊断的推荐方法,其特征在于,该方法包括以下步骤:
根据受检者的诊断编码,确定所述诊断编码与簇Ck中的主/次要典型疾病诊断编码集的相似性度量结果;所述簇Ck是根据N个受检者诊断信息之间的相似性划分的K个簇;
选择大于预设阈值的相似度值所属的簇,从一元化诊断库中获取每个簇所对应的疾病共现模式;
将所获得的疾病共现模式结合所述诊断编码在ICD本体结构进行可视化分析,按照同一分支下所述诊断编码间的语义关系,识别最近父节点,得到疾病类型并重新排序得到该受检者的一元化诊断。
2.根据权利要求1所述的一种一元化诊断的推荐方法,其特征在于,所述一元化诊断库的构建方法,包括以下步骤:
在ICD本体结构中展示所述主/次要典型疾病诊断编码集,按照同一分支下疾病诊断编码间的语义关系,识别最近父节点,得到新疾病类型,将新疾病类型重新排序得到典型疾病共现模式;
接收主检医师的辅助操作,对所述典型疾病共现模式进行调整,得到一元化诊断库。
3.根据权利要求1或者2中所述的一种一元化诊断的推荐方法,其特征在于,所述主/次要典型疾病诊断编码集的获得方法,包括以下步骤:
在簇Ck中选择与受检者相似度大于相似度阈值的人群代表作为核心体检人群;
在所述核心体检人群中选择出现的频率大于频率阈值的受检者的诊断编码组成典型疾病诊断编码集;
计算簇Ck中每种典型疾病诊断编码的平均次序;
根据所述平均次序,对簇Ck中抽取的所述典型疾病诊断编码集进行重新排序,得到簇Ck中主要的疾病诊断类型和次要的疾病诊断类型。
4.根据权利要求1或者2中所述的一种一元化诊断的推荐方法,其特征在于,所述相似性度量包括疾病诊断编码的信息量度量、疾病诊断编码间的相似性度量以及疾病诊断编码集间的相似性度量。
5.一种一元化诊断的推荐装置,其特征在于,所述装置包括:
相似性度量模块,用于根据受检者的诊断编码,确定所述诊断编码与簇Ck中的主/次要典型疾病诊断编码集的相似性度量结果;所述簇Ck是根据N个受检者诊断信息之间的相似性划分的K个簇;
匹配检测模块,用于选择大于预设阈值的相似度值所属的簇,从一元化诊断库中获取每个簇所对应的疾病共现模式;和
推荐模块,用于将所获得的疾病共现模式结合所述诊断编码在ICD本体结构进行可视化分析,按照同一分支下所述诊断编码间的语义关系,识别最近父节点,得到疾病类型并重新排序得到该受检者的一元化诊断。
6.根据权利要求5所述的一种一元化诊断的推荐装置,其特征在于,该装置还包括一元化诊断库构建模块,所述一元化诊断库构建模块包括:
典型疾病共现模式获取模块,用于在ICD本体结构中展示所述主/次要典型疾病诊断编码集,按照同一分支下疾病诊断编码间的语义关系,识别最近父节点,得到新疾病类型,将新疾病类型重新排序得到典型疾病共现模式;
一元化诊断库生成模块,用于接收主检医师的辅助操作,对所述典型疾病共现模式进行调整,得到一元化诊断库。
7.根据权利要求5或者6中所述的一种一元化诊断的推荐装置,其特征在于,该装置还包括主/次要典型疾病诊断编码集获取模块,所述主/次要典型疾病诊断编码集获取模块包括:
核心体检人群确定模块,用于在簇Ck中选择与受检者相似度大于相似度阈值的人群代表作为核心体检人群;
典型疾病诊断编码集生成模块,用于在所述核心体检人群中选择出现的频率大于频率阈值的受检者的诊断编码组成典型疾病诊断编码集;
平均次序计算模块,用于计算簇Ck中每种典型疾病诊断编码的平均次序;
获取模块,用于根据所述平均次序,对簇Ck中抽取的所述典型疾病诊断编码集进行重新排序,得到簇Ck中主要的疾病诊断类型和次要的疾病诊断类型。
8.根据权利要求5或者6中所述的一种一元化诊断的推荐装置,其特征在于,该装置还包括相似性度量模块,所述相似性度量模块包括疾病诊断编码的信息量度量模块、疾病诊断编码间的相似性度量模块以及疾病诊断编码集间的相似性度量模块。
9.一种电子设备,其特征在于,包括:
处理单元;
用于存储处理单元可执行指令的存储单元;
其中,所述处理单元被配置为:执行权利要求1至4中任意一项所述的方法。
10.一种存储介质,该存储介质中存储有计算机可读的程序指令,其特征在于,所述程序指令被处理单元执行时实现权利要求1至4中任意一项所述的方法。
CN202010409050.0A 2020-05-14 2020-05-14 一种一元化诊断的推荐方法、装置、电子设备及存储介质 Active CN111599427B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010409050.0A CN111599427B (zh) 2020-05-14 2020-05-14 一种一元化诊断的推荐方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010409050.0A CN111599427B (zh) 2020-05-14 2020-05-14 一种一元化诊断的推荐方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111599427A true CN111599427A (zh) 2020-08-28
CN111599427B CN111599427B (zh) 2023-03-31

Family

ID=72192212

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010409050.0A Active CN111599427B (zh) 2020-05-14 2020-05-14 一种一元化诊断的推荐方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111599427B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112017788A (zh) * 2020-09-07 2020-12-01 平安科技(深圳)有限公司 基于强化学习模型的疾病排序方法、装置、设备及介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWM478423U (zh) * 2013-11-29 2014-05-21 Univ Southern Taiwan Sci & Tec 病患疾病診斷探勘系統
CN104298344A (zh) * 2013-07-16 2015-01-21 精工爱普生株式会社 信息处理装置、信息处理方法以及信息处理系统
CN106934235A (zh) * 2017-03-09 2017-07-07 中国科学院软件研究所 一种基于迁移学习的疾病领域间病人相似性度量迁移系统
CN106951684A (zh) * 2017-02-28 2017-07-14 北京大学 一种医学疾病诊断记录中实体消歧的方法
US20170228507A1 (en) * 2014-08-08 2017-08-10 Icahn School Of Medicine At Mount Sinai Automatic disease diagnoses using longitudinal medical record data
CN108154928A (zh) * 2017-12-27 2018-06-12 北京嘉和美康信息技术有限公司 一种疾病诊断方法及装置
WO2019132685A1 (ru) * 2017-12-29 2019-07-04 Общество С Ограниченной Ответственностью "Интеллоджик" Способ и система поддержки принятия врачебных решений
CN110299209A (zh) * 2019-06-25 2019-10-01 北京百度网讯科技有限公司 相似病历查找方法、装置、设备及可读存储介质
CN110660459A (zh) * 2019-08-30 2020-01-07 腾讯科技(深圳)有限公司 用于病案质控的方法、装置、服务器以及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104298344A (zh) * 2013-07-16 2015-01-21 精工爱普生株式会社 信息处理装置、信息处理方法以及信息处理系统
TWM478423U (zh) * 2013-11-29 2014-05-21 Univ Southern Taiwan Sci & Tec 病患疾病診斷探勘系統
US20170228507A1 (en) * 2014-08-08 2017-08-10 Icahn School Of Medicine At Mount Sinai Automatic disease diagnoses using longitudinal medical record data
CN106951684A (zh) * 2017-02-28 2017-07-14 北京大学 一种医学疾病诊断记录中实体消歧的方法
CN106934235A (zh) * 2017-03-09 2017-07-07 中国科学院软件研究所 一种基于迁移学习的疾病领域间病人相似性度量迁移系统
CN108154928A (zh) * 2017-12-27 2018-06-12 北京嘉和美康信息技术有限公司 一种疾病诊断方法及装置
WO2019132685A1 (ru) * 2017-12-29 2019-07-04 Общество С Ограниченной Ответственностью "Интеллоджик" Способ и система поддержки принятия врачебных решений
CN110299209A (zh) * 2019-06-25 2019-10-01 北京百度网讯科技有限公司 相似病历查找方法、装置、设备及可读存储介质
CN110660459A (zh) * 2019-08-30 2020-01-07 腾讯科技(深圳)有限公司 用于病案质控的方法、装置、服务器以及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112017788A (zh) * 2020-09-07 2020-12-01 平安科技(深圳)有限公司 基于强化学习模型的疾病排序方法、装置、设备及介质
CN112017788B (zh) * 2020-09-07 2023-07-04 平安科技(深圳)有限公司 基于强化学习模型的疾病排序方法、装置、设备及介质

Also Published As

Publication number Publication date
CN111599427B (zh) 2023-03-31

Similar Documents

Publication Publication Date Title
US10929420B2 (en) Structured report data from a medical text report
CN108648827B (zh) 心脑血管疾病风险预测方法及装置
CN111933281B (zh) 一种疾病分型的确定系统、方法、装置及存储介质
CN111512322B (zh) 使用神经网络
Dack et al. Artificial intelligence and interstitial lung disease: diagnosis and prognosis
CN112633601B (zh) 疾病事件发生概率的预测方法、装置、设备及计算机介质
CN112151130B (zh) 一种基于文献检索的决策支持系统和构建方法
CN111243753B (zh) 一种面向医疗数据的多因素相关性交互式分析方法
JP2020518050A (ja) エンティティ間のコンテキスト的類似度の学習及び適用
CN112967803A (zh) 基于集成模型的急诊患者早期死亡率预测方法及系统
CN116884631B (zh) 基于ai和相似患者分析的综合肝衰竭预测与治疗参考系统
CN116434951A (zh) 疾病预警方法、装置、电子设备、存储介质以及程序产品
CN113128654A (zh) 一种用于冠心病预诊断中的改进型随机森林模型及其预诊断系统
CN110610766A (zh) 基于症状特征权重推导疾病概率的装置和存储介质
CN111640517B (zh) 病历编码方法、装置、存储介质及电子设备
CN111581969B (zh) 医疗术语向量表示方法、装置、存储介质及电子设备
Zhu et al. Severity detection of COVID-19 infection with machine learning of clinical records and CT images
CN111599427B (zh) 一种一元化诊断的推荐方法、装置、电子设备及存储介质
Zhang et al. Development of automated neural network prediction for echocardiographic left ventricular ejection fraction
CN110033862B (zh) 一种基于加权有向图的中医量化诊断系统及存储介质
Lin et al. Automatic mammographic breast density classification in Chinese women: clinical validation of a deep learning model
CN114201613A (zh) 试题生成方法、试题生成装置、电子设备以及存储介质
CN111445993A (zh) 疾病的层级关系处理方法、装置及电子设备
CN119324064B (zh) 冠脉狭窄严重程度确定方法、装置、电子设备及存储介质
JP2021507392A (ja) エンティティ間のコンテキスト的類似性の学習および適用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant