CN111785370B - 病历数据处理方法及装置、计算机存储介质、电子设备 - Google Patents
病历数据处理方法及装置、计算机存储介质、电子设备 Download PDFInfo
- Publication number
- CN111785370B CN111785370B CN202010632725.8A CN202010632725A CN111785370B CN 111785370 B CN111785370 B CN 111785370B CN 202010632725 A CN202010632725 A CN 202010632725A CN 111785370 B CN111785370 B CN 111785370B
- Authority
- CN
- China
- Prior art keywords
- disease
- target
- medical
- sequence
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/20—ICT specially adapted for the handling or processing of medical references relating to practices or guidelines
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Bioethics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开涉及数据处理技术领域,提供了一种病历数据处理方法、病历数据处理装置、计算机存储介质、电子设备,其中,病历数据处理方法包括:对包含目标疾病的医疗病历数据进行归类处理,得到整合数据集;步骤A:根据目标疾病的类型,从整合数据集中确定目标数据集;步骤B:对目标数据集进行序列模式挖掘,得到目标疾病对应的预测疾病序列。本公开中的病历数据处理方法能够以医疗病历数据为基础,快速挖掘特定疾病的发展演变规律,解决相关技术中仅靠临床医生的个人经验来预测患者病情的演变趋势所导致的准确度较低且覆盖面较小的技术问题,提高对病情预测的全面性,为医学科研及临床治疗提供有效参考。
Description
技术领域
本公开涉及数据处理技术领域,特别涉及一种病历数据处理方法、病历数据处理装置、计算机存储介质及电子设备。
背景技术
随着社会经济的发展,人们生活方式、生活习惯的改变,疾病谱发生极大的改变,许多新型疾病出现,对人们的生活、健康产生非常大的影响,部分传染性极强的疾病甚至无情夺走了人类的生命。因而,如何对患者的病情演变趋势进行有效预测成为相关技术人员关注的焦点问题。
传统方案中,一般是根据临床医生的个人经验和自身积累的医学知识来预测患者病情的演变趋势。然而,经验是一个长期积累的过程,且存在一定的主观性,并且,其覆盖面有限,预测结果不够全面。
鉴于此,本领域亟需开发一种新的病历数据处理方法及装置。
需要说明的是,上述背景技术部分公开的信息仅用于加强对本公开的背景的理解。
发明内容
本公开的目的在于提供一种病历数据处理方法、病历数据处理装置、计算机存储介质及电子设备,进而至少在一定程度上避免了相关技术中无法全面的预测患者的病情演变趋势的缺陷。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供一种病历数据处理方法,包括:对包含目标疾病的医疗病历数据进行归类处理,得到整合数据集;步骤A:根据所述目标疾病的类型,从所述整合数据集中确定目标数据集;步骤B:对所述目标数据集进行序列模式挖掘,得到所述目标疾病对应的预测疾病序列。
在本公开的示例性实施例中,在得到所述目标疾病对应的预测疾病序列之后,所述方法还包括:基于医学知识库判断所述预测疾病序列中是否存在指定疾病,所述指定疾病为与所述目标疾病不具备病理关联关系的疾病;若存在,则从所述整合数据集中剔除所述指定疾病;重复执行上述步骤A和步骤B,得到所述目标疾病对应的新的预测疾病序列。
在本公开的示例性实施例中,所述整合数据集中包括多个患者对应的多个医疗事件序列;所述根据所述目标疾病的类型,从所述整合数据集中确定目标数据集,包括:根据所述目标疾病的类型,从各所述医疗事件序列中分别选取一特征子序列;根据多个所述特征子序列,确定所述目标数据集。
在本公开的示例性实施例中,所述目标疾病的类型包括慢性疾病和恶性疾病;所述根据所述目标疾病的类型,从各所述医疗事件序列中分别选取一特征子序列,包括:当所述目标疾病的类型为慢性疾病时,从各所述医疗事件序列中选取确诊所述目标疾病之后的序列为所述特征子序列;当所述目标疾病的类型为恶性疾病时,从各所述医疗事件序列中选取确诊所述目标疾病之前的序列为所述特征子序列。
在本公开的示例性实施例中,所述对所述目标数据集进行序列模式挖掘,得到所述目标疾病对应的预测疾病序列,包括:基于序列模式挖掘算法对所述目标数据集进行序列模式挖掘,得到所述目标疾病对应的多个候选预测疾病序列;将出现频率大于频率阈值的候选预测疾病序列确定为所述目标疾病对应的所述预测疾病序列。
在本公开的示例性实施例中,在对包含目标疾病的医疗病历数据进行归类处理,得到整合数据集之前,所述方法还包括:获取各个患者对应的原始病历数据中的多个医疗事件,以及,确定各所述医疗事件对应的时间戳;根据所述时间戳从早到晚的顺序对所述多个医疗事件进行排序处理,得到医疗事件序列;将所述医疗事件序列确定为所述医疗病历数据。
在本公开的示例性实施例中,在得到医疗事件序列之后,所述方法还包括:当所述医疗事件序列中存在相同的多个目标医疗事件时,确定所述多个目标医疗事件中的无效医疗事件;所述无效医疗事件为第N次出现的所述目标医疗事件;对所述无效医疗事件进行剔除处理;N为大于1的正整数。
根据本公开的第二方面,提供一种病历数据处理装置,包括:归类处理模块,用于对包含目标疾病的医疗病历数据进行归类处理,得到整合数据集;确定模块,用于根据所述目标疾病的类型,从所述整合数据集中确定目标数据集;序列模式挖掘模块,用于对所述目标数据集进行序列模式挖掘,得到所述目标疾病对应的预测疾病序列。
根据本公开的第三方面,提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的病历数据处理方法。
根据本公开的第四方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述第一方面所述的病历数据处理方法。
由上述技术方案可知,本公开示例性实施例中的病历数据处理方法、病历数据处理装置、计算机存储介质及电子设备至少具备以下优点和积极效果:
在本公开的一些实施例所提供的技术方案中,一方面,对包含目标疾病的医疗病历数据进行归类处理,得到整合数据集,并根据目标疾病的类型,从整合数据集中确定目标数据集,能够针对不同的疾病类型,去除不符合疾病发展情况的冗余数据,保留符合疾病发展情况的目标数据集,从而保证后续数据处理速度和可信度。另一方面,对目标数据集进行序列模式挖掘,得到目标疾病对应的预测疾病序列,能够快速挖掘特定疾病的发展演变规律,解决相关技术中仅靠临床医生的个人经验来预测患者病情的演变趋势所导致的准确度较低且覆盖面较小的技术问题,提高预测全面性,为部分早期患者提供预防参考,为医学科研及临床治疗提供有效参考。
本公开应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本公开一示例性实施例中病历数据处理方法的流程示意图;
图2示出本公开一示例性实施例中病历数据处理方法的子流程示意图;
图3示出本公开一示例性实施例中病历数据处理方法的子流程示意图;
图4示出本公开一示例性实施例中病历数据处理方法的整体流程示意图;
图5示出本公开示例性实施例中病历数据处理装置的结构示意图;
图6示出本公开示例性实施例中计算机存储介质的结构示意图;
图7示出本公开示例性实施例中电子设备的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
本说明书中使用用语“一个”、“一”、“该”和“所述”用以表示存在一个或多个要素/组成部分/等;用语“包括”和“具有”用以表示开放式的包括在内的意思并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等;用语“第一”和“第二”等仅作为标记使用,不是对其对象的数量限制。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。
传统方案中,一般是根据临床医生的个人经验和自身积累的医学知识来预测患者病情的演变趋势。然而,经验是一个长期积累的过程,且存在一定的主观性。并且,其覆盖面有限,预测结果不够全面。
另外,对于一些发病率较低,且病因比较复杂的疑难杂症,其演变趋势仍处于未知状态,若仅根据临床医生的个人经验,则患者很难获知自身病情走向。
在本公开的实施例中,首先提供了一种病历数据处理方法,至少在一定程度上克服相关技术中无法全面的预测患者的病情演变趋势的缺陷。
图1示出本公开一示例性实施例中病历数据处理方法的流程示意图,该病历数据处理方法的执行主体可以是对病历数据进行处理的服务器。
参考图1,根据本公开的一个实施例的病历数据处理方法包括以下步骤:
步骤S110,对包含目标疾病的医疗病历数据进行归类处理,得到整合数据集;
步骤S120(步骤A),根据目标疾病的类型,从整合数据集中确定目标数据集;
步骤S130(步骤B),对目标数据集进行序列模式挖掘,得到目标疾病对应的预测疾病序列。
在图1所示实施例所提供的技术方案中,一方面,对包含目标疾病的医疗病历数据进行归类处理,得到整合数据集,并根据目标疾病的类型,从整合数据集中确定目标数据集,能够针对不同的疾病类型,去除不符合疾病发展情况的冗余数据,保留符合疾病发展情况的目标数据集,从而保证后续数据处理速度和可信度。另一方面,对目标数据集进行序列模式挖掘,得到目标疾病对应的预测疾病序列,能够快速挖掘特定疾病的发展演变规律,解决相关技术中仅靠临床医生的个人经验来预测患者病情的演变趋势所导致的准确度较低且覆盖面较小的技术问题,提高预测全面性,为部分早期患者提供预防参考,为医学科研及临床治疗提供有效参考。
以下对图1中的各个步骤的具体实现过程进行详细阐述:
在本公开的示例性实施例中,可以先获取多个患者的医疗病历数据。示例性的,可以参考图2,图2示出本公开一示例性实施例中医疗数据处理方法的子流程示意图,具体示出对原始病历数据进行处理,得到医疗病历数据的子流程示意图,包含步骤S201-S203,以下结合图2对具体的实施方式进行解释。
在步骤S201中,获取各个患者对应的原始病历数据中的多个医疗事件,以及,确定各医疗事件对应的时间戳。
原始病历数据可以是来源于医院数据库的历史就诊患者(多个患者)的电子病历数据,电子病历是一种用电子设备保存、管理、传输和重现的数字化的医疗记录,用以取代手写纸张病历的病历信息,主要包含医院诊断治疗全过程原始记录,举例而言,原始病历数据中可以包括:诊断信息(例如:头晕失眠、高血压、胃肠炎、高脂血等)、用药信息(例如:氢氯噻嗪、吲达帕胺等)、检查信息(例如:心电图、胸透、尿常规等)、手术信息(例如:白内障手术、心脏支架手术、心脏搭桥手术等)和费用信息。
其中,医疗事件可以是患者被确诊患某种疾病或患者出现的某种不良反应。举例而言,针对患者A,其对应的多个医疗事件可以是:确诊高血压、确诊高脂血、确诊胃肠炎。进而,示例性,可以确定医疗事件“头晕失眠”对应的时间戳为2014年6月,可以确定医疗事件“确诊高血压”对应的时间戳为2015年6月,医疗事件“确诊高脂血”对应的时间戳为2016年6月,医疗事件“确诊胃肠炎”对应的时间戳为2017年6月。
针对患者B,其对应的多个医疗事件可以是:消化不良、胃区灼烧感、胃癌晚期、消瘦。进而,示例性的,可以确定医疗事件“消化不良”对应的时间戳为2014年6月,医疗事件“胃区灼烧感”对应的时间戳为2015年6月,医疗事件“胃癌晚期”对应的时间戳为2016年6月,医疗事件“消瘦”对应的时间戳为2017年6月。
在步骤S202中,根据时间戳从早到晚的顺序对多个医疗事件进行排序处理,得到医疗事件序列。
在确定出各个患者对应的原始病历数据中的多个医疗事件,以及,确定出各医疗事件对应的时间戳之后,可以根据上述时间戳从早到晚的数据对多个医疗事件进行排序处理,得到医疗事件序列。
示例性的,参照上述步骤S201的相关解释,则患者A对应的医疗事件序列可以是:头晕失眠-高血压-高脂血-胃肠炎;患者B对应的医疗事件序列可以是:消化不良-胃区灼烧感-胃癌晚期-消瘦。
需要说明的是,当医疗事件序列中存在相同的多个目标医疗事件时,可以确定多个目标医疗事件中的无效医疗事件(无效医疗事件为第N次(N为大于1的正整数)出现的目标医疗事件),并对无效医疗事件进行剔除处理。举例而言,当得到的医疗事件序列为“头晕失眠-高血压-高脂血-胃肠炎-恶心乏力-胃肠炎”时,可以确定出第2次出现的目标医疗事件“胃肠炎”为无效医疗事件,进而,可以对第2次出现的无效医疗事件“胃肠炎”进行剔除处理,以将医疗事件序列处理为“头晕失眠-高血压-高脂血-胃肠炎-恶心乏力”。从而能够保留重要时间节点的医疗事件,避免无效数据对后续处理过程的干扰。
在步骤S203中,将医疗事件序列确定为医疗病历数据。
进而,可以将多个患者对应的多个医疗事件序列确定为医疗病历数据。
继续参考图1,在步骤S110中,对包含目标疾病的医疗病历数据进行归类处理,得到整合数据集。
在得到医疗病历数据之后,可以对包含目标疾病的医疗病历数据进行归类处理,得到整合数据集。其中,目标疾病可以是疾病发展趋势不明确的疾病、发病率较高的疾病、治愈率较低的疾病以及发病率较低但致死率较高的疾病等,均可以根据实际情况自行设定,属于本公开的保护范围。
示例性的,当目标疾病为高血压时,则可以筛选出包含高血压的多条医疗病历数据,并对该多条医疗病历数据进行整合,得到一整合数据集SG。当目标疾病为胃癌晚期时,则可以筛选出包含胃癌晚期的多条病历数据,并对该多条病历数据进行整合,得到另一整合数据集SW。
在步骤S120(步骤A)中,根据目标疾病的类型,从整合数据集中确定目标数据集。
在得到整合数据集之后,可以根据目标疾病的类型从上述整合数据集中确定目标数据集。其中,目标疾病的类型可以包括慢性疾病和恶性疾病。慢性疾病即长期患有而且很不容易治愈的部分疾病,一旦患有慢性疾病以后,就很难能够治愈,甚至是终生伴随,而且经过治疗可能需要终生服药,例如:高血压、糖尿病、冠心病等。恶性疾病即一旦确诊之后,患者生命就随时岌岌可危,且能在较短时间内导致患者死亡的疾病,例如:恶性肿瘤、肺癌晚期、胃癌晚期等。从而,能够针对不同的疾病类型,去除不符合疾病发展情况的冗余数据,保留符合疾病发展情况的目标数据集,从而保证后续数据处理速度和可信度。
进而,可以确定出目标疾病“高血压”为慢性疾病,目标疾病“胃癌晚期”为恶性疾病。
当目标疾病的类型为慢性疾病时,可以从各医疗事件序列中选取确诊目标疾病之后的序列为特征子序列,从而能够得到更加符合医生和相关慢病患者关注点的特征子序列,便于相关慢病患者了解疾病演变趋势。示例性的,参照上述步骤S202的相关解释,可以从患者A对应的医疗事件序列中选取特征子序列:高血压-高脂血-胃肠炎。而整合数据集SG中包括多个患者对应的多个医疗事件序列,则可以从各个患者的医疗事件序列中分别选取一特征子序列,并将得到的多个特征子序列确定为目标数据集。示例性的,可以参考表1,表1示意性示出多个特征子序列对应的目标数据集MG(包含目标疾病“高血压”)。
表1
当目标疾病的类型为恶性疾病时,可以从各医疗事件序列中选取确诊目标疾病之前的序列为特征子序列,从而能够为相关患轻度疾病的患者提供预防参考,避免患者在患轻度疾病时因大意疏忽而错过最佳治疗时间,导致恶性疾病的发生。示例性,参照上述步骤S202的相关解释,可以从患者B对应的医疗事件序列中选取特征子序列:消化不良-胃区灼烧感-胃癌晚期。而整合数据集SW中包括多个患者对应的多个医疗事件,则可以从各个患者的医疗事件序列中分别选取一特征子序列,并将得到的多个特征子序列确定为目标数据集。示例性的,可以参考表2,表2示意性示出多个特征子序列对应的目标数据集Mw(包含目标疾病“胃癌晚期”)。
表2
在步骤S130(步骤B)中,对目标数据集进行序列模式挖掘,得到目标疾病对应的预测疾病序列。
在得到目标数据集之后,可以基于序列模式挖掘算法(例如:prefixspan算法、GSP算法、SPADE算法、Disc-all算法等,可以根据实际情况自行设定,属于本公开的保护范围)对目标数据集进行序列模式挖掘,得到目标疾病对应的多个候选预测疾病序列。其中,序列模式挖掘是指从大量的序列数据中挖掘出频繁出现的“子序列”,候选预测疾病序列可以是频繁出现的多个疾病序列。
则示例性的,针对目标数据集MG,挖掘得到的多个候选预测疾病序列可以是“高血压-高脂血-胃肠炎(出现频率为90%)、高血压-结膜炎-胃肠炎(出现频率为76%)”。针对目标数据集Mw,挖掘得到的多个候选预测疾病序列可以是“消化不良-胃区灼烧感-胃癌晚期(出现频率为88%)、消化不良-恶心呕吐-胃癌晚期(出现频率为72%)”。从而,能够快速挖掘特定疾病的发展演变规律,解决相关技术中仅靠临床医生的个人经验来预测患者病情的演变趋势所导致的准确度较低且覆盖面较小的技术问题,提高预测全面性,为部分早期患者提供预防参考,为医学科研及临床治疗提供有效参考。
进而,可以设定一频率阈值(具体数值可以根据实际情况自行设定,属于本公开的保护范围),并将出现频率大于频率阈值的候选预测疾病序列确定为目标疾病对应的预测疾病序列。举例而言,当设定的频率阈值为80%时,则可以确定出目标疾病“高血压”对应的预测疾病序列为“高血压-高脂血-胃肠炎”,而目标疾病“胃癌晚期”对应的预测疾病序列为“消化不良-胃区灼烧感-胃癌晚期”。
而当设定的频率阈值为70%时,则可以确定出目标疾病“高血压”对应的预测疾病序列为“高血压-高脂血-胃肠炎”和“高血压-结膜炎-胃肠炎”。而目标疾病“胃癌晚期”对应的预测疾病序列为“消化不良-胃区灼烧感-胃癌晚期”和“消化不良-恶心呕吐-胃癌晚期”。
由此可见,当设定不同的频率阈值时,可以得到不同数量的预测疾病序列,以实现对患者病情演变趋势的全面预测,帮助患者提前预知疾病的演变趋势,从而,使得患者可以从饮食习惯、卫生习惯、生活方式等力所能及的小事做起,增强自身免疫力,预防疾病的发生,避免疾病的快速恶化。
在得到目标疾病对应的预测疾病序列之后,可以参考图3,图3示出本公开一示例性实施例中病历数据处理方法的子流程示意图,具体示出得到新的预测疾病序列的子流程示意图,包含步骤S301-步骤S303,以下结合图3对具体的实施方式进行解释。
在步骤S301中,基于医学知识库判断预测疾病序列中是否存在指定疾病,指定疾病为与目标疾病不具备病理关联关系的疾病。
示例性的,可以预先构建一医学知识库(即包含海量医学知识的数据库,示例性的,可以包含各种疾病的病因、病例、诊断方法、治疗方法、预防方法;各种疾病的治疗药物、用法用量、注意事项、用药说明;临床常见疾病知识、常见药物知识等),并基于医学知识库判断预测疾病序列中是否存在指定疾病,指定疾病可以是与上述目标疾病不具备病理关联关系的疾病。举例而言,当确定出目标疾病“高血压”对应的预测疾病序列为“高血压-高脂血-胃肠炎-感冒”时,则示例性的,可以基于上述医学知识库判断出“感冒”是与目标疾病不具备病理关联关系的指定疾病。
在步骤S302中,若存在,则从整合数据集中剔除指定疾病。
进而,可以从上述整合数据集SG中剔除上述指定疾病“感冒”。从而,能够对与目标疾病不具备病理关联关系的指定疾病进行剔除,避免指定疾病对数据处理结果的干扰,保证后续生成的新的预测疾病序列的可靠性。
在步骤S303中,重复执行上述步骤A和步骤B,得到目标疾病对应的新的预测疾病序列。
在从整合数据集中剔除指定疾病之后,可以重复执行上述步骤A和步骤B(即步骤S120和步骤S130),以迭代确定出目标疾病对应的新的预测疾病序列。从而,能够提高生成的新的预测疾病序列的可靠性,为相关疾病发展规律或成因的医学研究提供有力证据和可行性指导。
示例性的,可以参考图4,图4示出本公开一示例性实施例中病历数据处理方法的整体流程示意图,包含步骤S401-S404,以下结合图4对具体的实施方式进行解释。
在步骤S401中,数据处理(即对原始医疗数据中的医疗事件进行排序,得到医疗事件序列,并将医疗事件序列确定为医疗病历数据;对医疗病历数据进行归类处理,得到整合数据集;从整合数据集中确定目标数据集);
在步骤S402中,序列模式挖掘,得到目标疾病对应的预测疾病序列;
在步骤S403中,先验知识修正(基于医学知识库确定预测疾病序列中是否存在指定疾病,将指定疾病从整合数据集中剔除),并返回从整合数据集中确定目标数据集,以及,对目标数据集进行序列模式挖掘;
在步骤S404中,得到目标疾病的演变规律(新的预测疾病序列)。
基于上述技术方案,一方面,本公开能够针对不同的疾病类型,去除不符合疾病发展情况的冗余数据,保留符合疾病发展情况的目标数据集,从而保证后续数据处理速度和可信度。另一方面,能够快速挖掘特定疾病的发展演变规律,解决相关技术中仅靠临床医生的个人经验来预测患者病情的演变趋势所导致的准确度较低且覆盖面较小的技术问题,提高预测全面性,为部分早期患者提供预防参考,为医学科研及临床治疗提供有效参考。
本公开还提供了一种病历数据处理装置,图5示出本公开示例性实施例中病历数据处理装置的结构示意图;如图5所示,病历数据处理装置500可以包括归类处理模块501、确定模块502和序列模式挖掘模块503。其中:
归类处理模块501,用于对包含目标疾病的医疗病历数据进行归类处理,得到整合数据集。
在本公开的示例性实施例中,归类处理模块用于获取各个患者对应的原始病历数据中的多个医疗事件,以及,确定各医疗事件对应的时间戳;根据时间戳从早到晚的顺序对多个医疗事件进行排序处理,得到医疗事件序列;将医疗事件序列确定为医疗病历数据。
在本公开的示例性实施例中,归类处理模块还用于当医疗事件序列中存在相同的多个目标医疗事件时,确定多个目标医疗事件中的无效医疗事件;无效医疗事件为第N次出现的目标医疗事件;对无效医疗事件进行剔除处理;N为大于1的正整数。
确定模块502,用于根据目标疾病的类型,从整合数据集中确定目标数据集。
在本公开的示例性实施例中,确定模块用于根据目标疾病的类型,从各医疗事件序列中分别选取一特征子序列;根据多个特征子序列,确定目标数据集。
在本公开的示例性实施例中,目标疾病的类型包括慢性疾病和恶性疾病;确定模块还用于当目标疾病的类型为慢性疾病时,从各医疗事件序列中选取确诊目标疾病之后的序列为特征子序列;当目标疾病的类型为恶性疾病时,从各医疗事件序列中选取确诊目标疾病之前的序列为特征子序列。
序列模式挖掘模块503,用于对目标数据集进行序列模式挖掘,得到目标疾病对应的预测疾病序列。
在本公开的示例性实施例中,序列模式挖掘模块用于基于序列模式挖掘算法对目标数据集进行序列模式挖掘,得到目标疾病对应的多个候选预测疾病序列;将出现频率大于频率阈值的候选预测疾病序列确定为目标疾病对应的预测疾病序列。
在本公开的示例性实施例中,序列模式挖掘模块还用于基于医学知识库判断预测疾病序列中是否存在指定疾病,指定疾病为与目标疾病不具备病理关联关系的疾病;若存在,则从整合数据集中剔除指定疾病;重复执行上述确定目标数据集以及进行序列模式挖掘的步骤,得到目标疾病对应的新的预测疾病序列。
上述病历数据处理装置中各模块的具体细节已经在对应的病历数据处理方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
在本公开示例性实施方式中,还提供了一种能够实现上述方法的计算机存储介质。其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
参考图6所示,描述了根据本公开的实施方式的用于实现上述方法的程序产品600,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图7来描述根据本公开的这种实施方式的电子设备700。图7显示的电子设备700仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700以通用计算设备的形式表现。电子设备700的组件可以包括但不限于:上述至少一个处理单元710、上述至少一个存储单元720、连接不同系统组件(包括存储单元720和处理单元710)的总线730以及显示单元740。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元710执行,使得所述处理单元710执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,所述处理单元710可以执行如图1中所示的:步骤S110,对包含目标疾病的医疗病历数据进行归类处理,得到整合数据集;步骤S120(步骤A),根据目标疾病的类型,从整合数据集中确定目标数据集;步骤S130(步骤B),对目标数据集进行序列模式挖掘,得到目标疾病对应的预测疾病序列。
存储单元720可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)7201和/或高速缓存存储单元7202,还可以进一步包括只读存储单元(ROM)7203。
存储单元720还可以包括具有一组(至少一个)程序模块7205的程序/实用工具7204,这样的程序模块7205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线730可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备700也可以与一个或多个外部设备800(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备700交互的设备通信,和/或与使得该电子设备700能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口750进行。并且,电子设备700还可以通过网络适配器760与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器760通过总线730与电子设备700的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备700使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
Claims (7)
1.一种病历数据处理方法,其特征在于,包括:
获取各个患者对应的原始病历数据中的多个医疗事件,以及,确定各所述医疗事件对应的时间戳;
根据所述时间戳从早到晚的顺序对所述多个医疗事件进行排序处理,得到医疗事件序列;
将所述医疗事件序列确定为包含目标疾病的医疗病历数据;
对所述包含目标疾病的医疗病历数据进行归类处理,得到整合数据集;
步骤A:根据所述目标疾病的类型,从所述整合数据集中确定目标数据集;
所述整合数据集中包括多个患者对应的多个医疗事件序列;所述根据所述目标疾病的类型,从所述整合数据集中确定目标数据集,包括:根据所述目标疾病的类型,从各所述医疗事件序列中分别选取一特征子序列;根据多个所述特征子序列,确定所述目标数据集;
所述目标疾病的类型包括慢性疾病和恶性疾病;所述根据所述目标疾病的类型,从各所述医疗事件序列中分别选取一特征子序列,包括:当所述目标疾病的类型为慢性疾病时,从各所述医疗事件序列中选取确诊所述目标疾病之后的序列为所述特征子序列;当所述目标疾病的类型为恶性疾病时,从各所述医疗事件序列中选取确诊所述目标疾病之前的序列为所述特征子序列;
步骤B:对所述目标数据集进行序列模式挖掘,得到所述目标疾病对应的预测疾病序列。
2.根据权利要求1所述的方法,其特征在于,在得到所述目标疾病对应的预测疾病序列之后,所述方法还包括:
基于医学知识库判断所述预测疾病序列中是否存在指定疾病,所述指定疾病为与所述目标疾病不具备病理关联关系的疾病;
若存在,则从所述整合数据集中剔除所述指定疾病;
重复执行上述步骤A和步骤B,得到所述目标疾病对应的新的预测疾病序列。
3.根据权利要求1所述的方法,其特征在于,所述对所述目标数据集进行序列模式挖掘,得到所述目标疾病对应的预测疾病序列,包括:
基于序列模式挖掘算法对所述目标数据集进行序列模式挖掘,得到所述目标疾病对应的多个候选预测疾病序列;
将出现频率大于频率阈值的候选预测疾病序列确定为所述目标疾病对应的所述预测疾病序列。
4.根据权利要求1所述的方法,其特征在于,在得到医疗事件序列之后,所述方法还包括:
当所述医疗事件序列中存在相同的多个目标医疗事件时,确定所述多个目标医疗事件中的无效医疗事件;所述无效医疗事件为第N次出现的所述目标医疗事件;
对所述无效医疗事件进行剔除处理;
N为大于1的正整数。
5.一种病历数据处理装置,其特征在于,包括:
归类处理模块,用于获取各个患者对应的原始病历数据中的多个医疗事件,以及,确定各所述医疗事件对应的时间戳;根据所述时间戳从早到晚的顺序对所述多个医疗事件进行排序处理,得到医疗事件序列;将所述医疗事件序列确定为包含目标疾病的医疗病历数据;对所述包含目标疾病的医疗病历数据进行归类处理,得到整合数据集;
确定模块,用于根据所述目标疾病的类型,从所述整合数据集中确定目标数据集;所述整合数据集中包括多个患者对应的多个医疗事件序列;所述确定模块根据所述目标疾病的类型,从所述整合数据集中确定目标数据集,包括:根据所述目标疾病的类型,从各所述医疗事件序列中分别选取一特征子序列;根据多个所述特征子序列,确定所述目标数据集;
所述目标疾病的类型包括慢性疾病和恶性疾病;所述确定模块根据所述目标疾病的类型,从各所述医疗事件序列中分别选取一特征子序列,包括:当所述目标疾病的类型为慢性疾病时,从各所述医疗事件序列中选取确诊所述目标疾病之后的序列为所述特征子序列;当所述目标疾病的类型为恶性疾病时,从各所述医疗事件序列中选取确诊所述目标疾病之前的序列为所述特征子序列;
序列模式挖掘模块,用于对所述目标数据集进行序列模式挖掘,得到所述目标疾病对应的预测疾病序列。
6.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~4中任意一项所述的病历数据处理方法。
7.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1~4中任意一项所述的病历数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010632725.8A CN111785370B (zh) | 2020-07-01 | 2020-07-01 | 病历数据处理方法及装置、计算机存储介质、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010632725.8A CN111785370B (zh) | 2020-07-01 | 2020-07-01 | 病历数据处理方法及装置、计算机存储介质、电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111785370A CN111785370A (zh) | 2020-10-16 |
CN111785370B true CN111785370B (zh) | 2024-05-17 |
Family
ID=72759655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010632725.8A Active CN111785370B (zh) | 2020-07-01 | 2020-07-01 | 病历数据处理方法及装置、计算机存储介质、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111785370B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113096756B (zh) * | 2021-04-26 | 2023-12-22 | 讯飞医疗科技股份有限公司 | 病情演变分类方法、装置、电子设备和存储介质 |
CN114898887A (zh) * | 2022-06-09 | 2022-08-12 | 上海梅斯医药科技有限公司 | 一种低代码数字治疗系统 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106232831A (zh) * | 2013-11-06 | 2016-12-14 | 美国卫生和人力服务部 | 通过表达谱分析对淋巴瘤类型进行亚型分类的方法 |
CN106874632A (zh) * | 2017-04-06 | 2017-06-20 | 聂聪 | 慢病健康指数智能监控系统 |
CN107851464A (zh) * | 2015-08-17 | 2018-03-27 | 西门子保健有限责任公司 | 用于针对个体患者进行疾病进展建模和疗法优化的方法和系统 |
CN109036579A (zh) * | 2018-08-22 | 2018-12-18 | 泰康保险集团股份有限公司 | 基于区块链的信息预测方法、装置、介质及电子设备 |
CN109493979A (zh) * | 2018-10-23 | 2019-03-19 | 平安科技(深圳)有限公司 | 一种基于智能决策的疾病预测方法和装置 |
CN109659033A (zh) * | 2018-12-18 | 2019-04-19 | 浙江大学 | 一种基于循环神经网络的慢性疾病病情变化事件预测装置 |
WO2019132685A1 (ru) * | 2017-12-29 | 2019-07-04 | Общество С Ограниченной Ответственностью "Интеллоджик" | Способ и система поддержки принятия врачебных решений |
CN110085323A (zh) * | 2019-04-19 | 2019-08-02 | 北京工业大学 | 一种基于电子病历的诊疗路径发现方法 |
CN110211690A (zh) * | 2019-04-19 | 2019-09-06 | 平安科技(深圳)有限公司 | 疾病风险预测方法、装置、计算机设备及计算机存储介质 |
CN110277172A (zh) * | 2019-06-27 | 2019-09-24 | 齐鲁工业大学 | 一种基于高效的负序列挖掘模式的临床用药行为分析系统及其工作方法 |
CN110459324A (zh) * | 2019-06-27 | 2019-11-15 | 平安科技(深圳)有限公司 | 基于长短期记忆模型的疾病预测方法、装置和计算机设备 |
CN110781216A (zh) * | 2019-11-05 | 2020-02-11 | 广东工业大学 | 一种中医症状关联规则挖掘方法、装置及存储介质 |
CN111269945A (zh) * | 2020-02-25 | 2020-06-12 | 四川省人民医院 | 利用Gm20541基因构建视网膜色素变性疾病模型的方法和应用 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8170888B2 (en) * | 2006-02-13 | 2012-05-01 | Silverman David G | Method and system for assessing, quantifying, coding and communicating a patient's health and perioperative risk |
CN103329138A (zh) * | 2011-01-19 | 2013-09-25 | 皇家飞利浦电子股份有限公司 | 用于处理基因组数据的方法 |
US10963795B2 (en) * | 2015-04-28 | 2021-03-30 | International Business Machines Corporation | Determining a risk score using a predictive model and medical model data |
-
2020
- 2020-07-01 CN CN202010632725.8A patent/CN111785370B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106232831A (zh) * | 2013-11-06 | 2016-12-14 | 美国卫生和人力服务部 | 通过表达谱分析对淋巴瘤类型进行亚型分类的方法 |
CN107851464A (zh) * | 2015-08-17 | 2018-03-27 | 西门子保健有限责任公司 | 用于针对个体患者进行疾病进展建模和疗法优化的方法和系统 |
CN106874632A (zh) * | 2017-04-06 | 2017-06-20 | 聂聪 | 慢病健康指数智能监控系统 |
WO2019132685A1 (ru) * | 2017-12-29 | 2019-07-04 | Общество С Ограниченной Ответственностью "Интеллоджик" | Способ и система поддержки принятия врачебных решений |
CN109036579A (zh) * | 2018-08-22 | 2018-12-18 | 泰康保险集团股份有限公司 | 基于区块链的信息预测方法、装置、介质及电子设备 |
CN109493979A (zh) * | 2018-10-23 | 2019-03-19 | 平安科技(深圳)有限公司 | 一种基于智能决策的疾病预测方法和装置 |
CN109659033A (zh) * | 2018-12-18 | 2019-04-19 | 浙江大学 | 一种基于循环神经网络的慢性疾病病情变化事件预测装置 |
CN110085323A (zh) * | 2019-04-19 | 2019-08-02 | 北京工业大学 | 一种基于电子病历的诊疗路径发现方法 |
CN110211690A (zh) * | 2019-04-19 | 2019-09-06 | 平安科技(深圳)有限公司 | 疾病风险预测方法、装置、计算机设备及计算机存储介质 |
CN110277172A (zh) * | 2019-06-27 | 2019-09-24 | 齐鲁工业大学 | 一种基于高效的负序列挖掘模式的临床用药行为分析系统及其工作方法 |
CN110459324A (zh) * | 2019-06-27 | 2019-11-15 | 平安科技(深圳)有限公司 | 基于长短期记忆模型的疾病预测方法、装置和计算机设备 |
CN110781216A (zh) * | 2019-11-05 | 2020-02-11 | 广东工业大学 | 一种中医症状关联规则挖掘方法、装置及存储介质 |
CN111269945A (zh) * | 2020-02-25 | 2020-06-12 | 四川省人民医院 | 利用Gm20541基因构建视网膜色素变性疾病模型的方法和应用 |
Non-Patent Citations (2)
Title |
---|
时间序列相似性与预测算法研究及其应用;闫明月;博士电子期刊;1-124 * |
疾病时间序列研究中预测模型的应用;吴本璞;浙江医科大学学报;第第18卷卷(第第6期期);277-281 * |
Also Published As
Publication number | Publication date |
---|---|
CN111785370A (zh) | 2020-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cho et al. | Artificial intelligence algorithm for detecting myocardial infarction using six-lead electrocardiography | |
Nattinger et al. | An algorithm for the use of Medicare claims data to identify women with incident breast cancer | |
Wang et al. | A bias evaluation checklist for predictive models and its pilot application for 30-day hospital readmission models | |
US20130262140A1 (en) | Patient cohort matching | |
Nabi et al. | Coronary artery calcium scoring in the emergency department: identifying which patients with chest pain can be safely discharged home | |
Liu et al. | Evaluating large language models for radiology natural language processing | |
JP2005508557A (ja) | 患者データマイニング | |
Persson et al. | A machine learning sepsis prediction algorithm for intended intensive care unit use (NAVOY Sepsis): proof-of-concept study | |
US20190237200A1 (en) | Recording medium recording similar case retrieval program, information processing apparatus, and similar case retrieval method | |
Weissler et al. | Use of natural language processing to improve identification of patients with peripheral artery disease | |
CN114300141A (zh) | 患病风险等级预测方法及装置、可读存储介质及电子设备 | |
CN111785370B (zh) | 病历数据处理方法及装置、计算机存储介质、电子设备 | |
Sun et al. | Towards artificial intelligence-based learning health system for population-level mortality prediction using electrocardiograms | |
König et al. | Artificial intelligence-based identification of left ventricular systolic dysfunction from 12-lead electrocardiograms: External validation and advanced application of an existing model | |
Datta et al. | Predicting hypertension onset from longitudinal electronic health records with deep learning | |
Koloi et al. | Predicting early-stage coronary artery disease using machine learning and routine clinical biomarkers improved by augmented virtual data | |
Bernstorff et al. | Development and validation of a machine learning model for prediction of type 2 diabetes in patients with mental illness | |
Crespin et al. | Improved diagnostic performance of insertable cardiac monitors by an artificial intelligence-based algorithm | |
Park et al. | Artificial intelligence–enhanced electrocardiography analysis as a promising tool for predicting obstructive coronary artery disease in patients with stable angina | |
Wang et al. | Socio-economic factors and clinical context can predict adherence to incidental pulmonary nodule follow-up via machine learning models | |
Trivedi et al. | A practical guide to use of publicly available data sets for observational research in interventional radiology | |
US7324918B1 (en) | Forecasting outcomes based on analysis of text strings | |
Ahmad et al. | Differences in ischemic heart disease between males and females using predictive artificial intelligence models. | |
Landi et al. | The evolution of mining electronic health records in the era of deep learning | |
Abakasanga et al. | Equitable hospital length of stay prediction for patients with learning disabilities and multiple long-term conditions using machine learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |