[go: up one dir, main page]

CN117352182B - 血糖预测模型的训练方法、装置、设备及存储介质 - Google Patents

血糖预测模型的训练方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117352182B
CN117352182B CN202311211166.3A CN202311211166A CN117352182B CN 117352182 B CN117352182 B CN 117352182B CN 202311211166 A CN202311211166 A CN 202311211166A CN 117352182 B CN117352182 B CN 117352182B
Authority
CN
China
Prior art keywords
sample
blood glucose
sample data
data
medication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311211166.3A
Other languages
English (en)
Other versions
CN117352182A (zh
Inventor
王宏立
王鹏
张伟
邢磊洋
董玉珠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sinomedisite Bio Tech Co Ltd
Original Assignee
Beijing Sinomedisite Bio Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sinomedisite Bio Tech Co Ltd filed Critical Beijing Sinomedisite Bio Tech Co Ltd
Priority to CN202311211166.3A priority Critical patent/CN117352182B/zh
Publication of CN117352182A publication Critical patent/CN117352182A/zh
Application granted granted Critical
Publication of CN117352182B publication Critical patent/CN117352182B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本申请提供一种血糖预测模型的训练方法、装置、设备及存储介质,该方法包括确定待训练的血糖预测模型的使用场景信息;将所述使用场景信息输入到训练获得的数据分布预测模型中,得到与所述使用场景信息对应的数据分布比例;基于所述数据分布比例和所述第一样本数据集生成第二样本数据集;所述第二样本数据集为所述第一样本数据集的子集;基于所述第二样本数据集训练所述待训练的血糖预测模型,从而通过数据分布预测模型先确定血糖预测模型使用场景对应的数据分布比例,并根据该数据分布比例从第一样本数据集中筛选出第二样本数据集,并通过第二样本数据集训练血糖预测模型,在保证样本数据质量的同时,提高了血糖预测模型预测血糖的准确度。

Description

血糖预测模型的训练方法、装置、设备及存储介质
技术领域
本申请涉及血糖预测模型技术领域,尤其涉及一种血糖预测模型的训练方法、装置、电子设备及存储介质。
背景技术
随着高血糖人数的增加,血糖预测的研究越来越多,及时预测血糖数据,有效控制血糖波动成为糖尿病管理与控制的主要任务。目前相关技术中,一种方法是通过训练血糖预测模型来实现血糖的预测,而训练血糖预测模型时,往往需要大量的样本数据,而样本数据的质量会直接影响到最终训练获得的血糖预测模型的预测准确性,但是,由于血糖样本数据无法通过人工标注来大量获得,因此,相关技术中通过各种渠道收集的血糖样本数据虽然能够满足数量要求,但是无法保证样本数据的质量,进而导致血糖预测模型的预测准确度不高。
发明内容
有鉴于此,本申请的目的在于提出一种血糖预测模型的训练方法、装置、设备及存储介质以解决或部分解决上述技术问题。
基于上述目的,本申请的提供了一种血糖预测模型的训练方法,包括:
确定待训练的血糖预测模型的使用场景信息;所述使用场景信息包括医院等级、医院类型和医院所在城市等级;
将所述使用场景信息输入到训练获得的数据分布预测模型中,得到与所述使用场景信息对应的数据分布比例;
获取第一样本数据集,并基于所述数据分布比例和所述第一样本数据集生成第二样本数据集;所述第二样本数据集为所述第一样本数据集的子集;
基于所述第二样本数据集训练所述待训练的血糖预测模型。
基于同一个构思,本申请还提出了一种血糖预测模型的训练装置,包括:
确定模块,确定待训练的血糖预测模型的使用场景信息;所述使用场景信息包括医院等级、医院类型和医院所在城市等级;
分布模块,将所述使用场景信息输入到训练获得的数据分布预测模型中,得到与所述使用场景信息对应的数据分布比例;
生成模块,获取第一样本数据集,并基于所述数据分布比例和所述第一样本数据集生成第二样本数据集;所述第二样本数据集为所述第一样本数据集的子集;
训练模块,基于所述第二样本数据集训练所述待训练的血糖预测模型。
基于同一个构思,本申请还提出了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的血糖预测模型的训练方法。
基于同一个构思,本申请还提出了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行如上所述的血糖预测模型的训练方法。
从上面所述可以看出,本申请提供的血糖预测模型的训练方法、装置、设备及存储介质,确定待训练的血糖预测模型的使用场景信息;所述使用场景信息包括医院等级、医院类型和医院所在城市等级;将所述使用场景信息输入到训练获得的数据分布预测模型中,得到与所述使用场景信息对应的数据分布比例;获取第一样本数据集,并基于所述数据分布比例和所述第一样本数据集生成第二样本数据集;所述第二样本数据集为所述第一样本数据集的子集;基于所述第二样本数据集训练所述待训练的血糖预测模型,从而通过数据分布预测模型先确定血糖预测模型使用场景对应的数据分布比例,并根据该数据分布比例从第一样本数据集中筛选出第二样本数据集,并通过第二样本数据集训练血糖预测模型,在保证样本数据质量的同时,提高了血糖预测模型预测血糖的准确度。
附图说明
为了更清楚地说明本申请或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例的一种血糖预测模型的训练方法的流程示意图;
图2为本申请实施例的一种血糖预测模型的训练装置的结构示意图;
图3为本申请实施例的一种具体的电子设备硬件结构示意。
具体实施方式
可以理解的是,本技术方案所涉及的数据(包括但不限于数据本身、数据的获取或使用)应当遵循相应法律法规及相关规定的要求。
需要说明的是,除非另外定义,本申请实施例使用的技术术语或者科学术语应当为本申请所属领域内具有一般技能的人士所理解的通常意义。本申请中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,可以是直接连接,也可以是间接连接,可以包括有线连接,也可以包括无线连接。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。此外,在本申请的描述中,除非另有说明,术语“多个”是指两个或两个以上。术语“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
下面将参考若干示例性实施方式来描述本申请的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本申请,而并非以任何方式限制本申请的范围。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。
可以理解的是,在使用本申请中各个实施例的技术方案之前,均会通过恰当的方式对所涉及的个人信息的类型、使用范围、使用场景等告知用户,并获得用户的授权。
例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确的提示用户,其请求执行的操作将需要获取和使用到用户的个人信息。从而,使得用户可以根据提示信息来自主的选择是否向执行本申请技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。
作为一种可选的但非限定的实现方式,响应于接受到用户的主动请求,向用户发送提示信息的方式例如可以是弹窗的方式,弹窗中可以以文字的方式呈现提示信息。此外,弹窗中还可以承载供用户选择“同意”或者“不同意”向电子设备提供个人信息的选择控件。
可以理解的是,上述通知和获取用户授权过程仅是示意性的,不对本申请的实现方式构成限定,其他满足相关法律法规的方式也可应用于本申请的实现方式中。
在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
如背景技术部分所述,目前相关技术中,一种方法是通过训练血糖预测模型来实现血糖的预测,而训练血糖预测模型时,往往需要大量的样本数据,而样本数据的质量会直接影响到最终训练获得的血糖预测模型的预测准确性,但是,由于血糖样本数据无法通过人工标注来大量获得,因此,相关技术中通过各种渠道收集的血糖样本数据虽然能够满足数量要求,但是无法保证样本数据的质量,进而导致血糖预测模型的预测准确度不高。特别对于一些针对特殊场景使用的血糖预测模型,当样本数据来源与实际使用场景的数据分布相差较大时,血糖预测模型的预测准确度将会大大下降。例如,某血糖预测模型使用场景为某1线城市的三甲医院,而用于训练该血糖预测模型的样本数据来源于某4线城市的二乙医院,由于去1线城市的三甲医院看病的人群明显与去4线城市的二乙医院看病的人群不同,因此,若直接用从4线城市的二乙医院采集的样本数据训练的血糖预测模型去预测某1线城市的三甲医院的患者的血糖明显不够准确。但是,考虑到血糖样本数据的收集难度(无法像图像识别等样本数据可以由人工进行标注),若只在血糖预测模型对应的使用医院进行样本采集,明显速度较慢,而且很难达到模型训练要求的数据量。
综上所述,为了解决上述问题,本申请实施例提出了一种血糖预测模型的训练方法,包括:
确定待训练的血糖预测模型的使用场景信息;所述使用场景信息包括医院等级、医院类型和医院所在城市等级;将所述使用场景信息输入到训练获得的数据分布预测模型中,得到与所述使用场景信息对应的数据分布比例;获取第一样本数据集,并基于所述数据分布比例和所述第一样本数据集生成第二样本数据集;所述第二样本数据集为所述第一样本数据集的子集;基于所述第二样本数据集训练所述待训练的血糖预测模型,从而通过数据分布预测模型先确定血糖预测模型使用场景对应的数据分布比例,并根据该数据分布比例从第一样本数据集中筛选出第二样本数据集,并通过第二样本数据集训练血糖预测模型,在保证样本数据质量的同时,提高了血糖预测模型预测血糖的准确度。
参考图1,为本申请实施例的一种血糖预测模型的训练方法的流程示意图,可选的,该方法的执行主体可以但不限于是终端设备或服务器,该方法包括以下步骤:
S101,确定待训练的血糖预测模型的使用场景信息;所述使用场景信息包括医院等级、医院类型和医院所在城市等级。
具体实施时,为了提高血糖预测模型在使用时的准确度,本实施例将针对不同的使用场景分别训练不同的血糖预测模型。因此,每次训练一个新的血糖预测模型时,先确定待训练的血糖预测模型的使用场景信息,考虑到,医院作为糖尿病诊断和治疗的主要场所,而且不同类型的医院接诊的患者的类型分布差距较大,因此,本申请实施例确定的使用场景信息主要指医院场景信息,可选的,使用场景信息包括医院等级、医院类型和医院所在城市等级。其中,医院等级包括三级甲等、二级甲等、一级甲等、三级乙等、二级乙等、一级乙等等,医院类型包括综合医院、儿科医院、妇科医院、骨科医院等,所在城市等级包括1线城市、2线城市、3线城市、4线城市等。
需要说明的是,使用场景信息具体包括的内容可以根据需要进行设置,对此不做限定,例如,一些实施例中使用场景信息还可以包括医院科室信息等。
S102,将所述使用场景信息输入到训练获得的数据分布预测模型中,得到与所述使用场景信息对应的数据分布比例。
具体实施时,为了能够准确的得到待训练的血糖预测模型的使用场景对应的数据分布比例,可以通过预先训练的数据分布预测模型来确定。其中,数据分布预测模型的输入为医院等级、医院类型和医院所在城市等级这些使用场景信息,输出为使用场景信息对应的数据分布比例,即各种类型的样本数据的分布比例,具体的,数据分布比例可以是男女样本分布的比例,和/或不同年龄段的样本数据的分布比例,和/或1型糖尿病和2型糖尿病的样本的分布比例。例如,某医院对应的数据分布比例可以是男女样本数据的比例为0.8:1,且1型糖尿病和2型糖尿病的样本的分布比例为2:1,且30岁以上和30岁以下的样本数据的比例为1:2.5。
需要说明的是,具体训练数据分布预测模型的方法可以根据需要进行选择,可以参考相关技术中的任意一种方法,对此不做限定。例如,可以从相关技术中选择任意一种模型结构最为基准模型,例如可以选择卷积网络模型,然后,收集多家医院对应的使用场景信息(模型输入),以及这些医院的实际数据分布比例(模型校验结果),作为样本数据训练基准模型,并通过损失函数调节基准模型的参数,以使基准模型输出的数据分布比例与各医院实际的数据分布比例基本保持一致。
需要说明的是,与训练血糖预测模型的样本数据相比,训练数据分布预测模型的样本数据更容易获取,一般医院等级、医院类型和医院所在城市等级这些信息可以直接通过公开的网络信息查询到,而医院实际的数据分布比例也可以通过医院的挂号系统来获得。
S103,获取第一样本数据集,并基于所述数据分布比例和所述第一样本数据集生成第二样本数据集;所述第二样本数据集为所述第一样本数据集的子集。
具体实施时,在得到与所述使用场景信息对应的数据分布比例后,就可以通过任意一个血糖样本数据集,得到最终符合使用场景信息的第二样本数据集。可选的,第一样本数据集由于不再受到使用场景的限制,因此,可以通过大量的医院中的临床数据来获得,并且不再限制医院本身的类型。可选的,可以事先通过多家医院收集到大量的血糖样本数据组成第一样本数据集。
需要说明的是,所述第二样本数据集为所述第一样本数据集的子集,且一般情况下,由于第二样本数据集是根据第一样本数据集筛选之后得到的,所以第二样本数据集小于第一样本数据集。
在一些实施例中,基于所述数据分布比例和所述第一样本数据集生成第二样本数据集,具体包括:
确定所述第二样本数据集对应的样本数据的目标数量:
基于所述目标数量以及所述数据分布比例从所述第一样本数据集中确定目标样本数据;所述数据分布比例包括各种类型的样本数据的分布比例,所述样本数据的类型包括性别类型、和/或年龄类型、和/或糖尿病类型;
基于所述目标样本数据生成第二样本数据集。
具体实施时,第二样本数据集对应的样本数据的目标数量即训练血糖预测模型时需要的样本数据的总数量,例如,该目标数据可以是10万组,每组样本数据可以包括历史血糖数据、用户信息、用药时间、用药名称以及单次用药计量等。可选的,该目标数据可以根据用户的输入获得。在得到目标数据后,就可以根据该目标数量以及所述数据分布比例从所述第一样本数据集中确定目标样本数据,并根据所有的目标样本数据生成第二样本数据集。
S104,基于所述第二样本数据集训练所述待训练的血糖预测模型。
具体实施时,在得到所述第二样本数据集之后,由于该第二样本数据集完全符合待训练的血糖预测模型的使用场景信息对应的数据分布,因此,通过该第二样本数据集训练所述待训练的血糖预测模型可以保证血糖预测模型预测的准确性。需要说明的是,在本申请实施例中,对于血糖的预测主要指对于血糖浓度的预测。
需要说明的是,本申请实施例提高血糖预测模型识别准确度的手段,主要在于对样本数据集的优化,因此,训练血糖预测模型的其他步骤可以参考相关技术中对网络模型的训练过程,对此不做限定。可选的,在训练血糖预测模型时,模型的输入为用户信息、用药样本参数(所述用药时间、所述用药名称以及单次用药计量)等可能影响用户血糖的相关信息,输出为预测指定时间的血糖值,然后可以通过对应的历史血糖数据进行结果校验。
在一些实施例中,生成所述第一样本数据集的步骤包括:
获取样本用户的医嘱数据,所述医嘱数据包括用药名称、单次用药计量以及单日内用药次数;
获取所述样本用户的历史血糖数据和用户信息;所述用户信息包括性别信息、年龄信息、糖尿病类型信息;
基于所述历史血糖数据以及所述医嘱数据确定所述样本用户的用药时间;
基于所述用药时间、所述用药名称以及单次用药计量生成所述样本用户的用药样本参数;
基于所述用药样本参数、所述用户信息以及所述历史血糖数据生成第一样本数据,并基于所述第一样本数据生成所述第一样本数据集。
具体实施时,考虑到在血糖预测过程中,特别是对于一些糖尿病患者的血糖浓度的预测,降糖药物的使用极大的影响了血糖浓度的后续变化,因此,若想要准确的对用户的血糖浓度进行预测,需要获取到用户使用降糖药物的信息,即用药剂量、用药时间以及用药种类。而在生成第一样本数据集时,虽然对采集样本数据的医院的类型没有限定,但是在实际操作过程中,发明人发现,目前医院的临床数据中,没有明确的用药时间,特别是对于一些口服类降糖药物,一般都是由患者自行服用,因此,更加无法统计服药时间,这无疑给用药时间的采集增加了难度。在此基础上,发明人经过深入研究发现,现有的临床数据中在医嘱数据中有提到各种药物的使用说明,即单日内用药次数,例如,一般医嘱数据中会记录某某药物一日3次,每次2片。在此基础上,本申请的发明人经过深入思考找到了一种通过医嘱数据来确定用药时间的方法,在确定了用药时间后,就可以根据该用药时间、所述用药名称以及单次用药计量生成可以直接使用的样本用户的用药样本参数,然后基于所述用药样本参数、所述用户信息以及所述历史血糖数据生成第一样本数据,并基于所述第一样本数据生成所述第一样本数据集。
在一些实施例中,基于所述历史血糖数据以及所述医嘱数据确定所述样本用户的用药时间,具体包括:
基于所述单日内用药次数确定所述样本用户的初始用药时间;
基于所述历史血糖数据对所述初始用药时间进行调整,确定所述样本用户的用药时间。
具体实施时,在根据医嘱数据确定用药时间时,可以先根据单日内用药次数确定所述样本用户的初始用药时间,即可以预先为不同的单日内用药次数,预设不同的初始用药时间,例如,某单日内用药次数为3,即一日3次,则可以对应设置初始用药时间分别为:早上8点,中午12点,以及下午6点。若单日内用药次数为2,则可以对应设置初始用药时间分别为:早上8点和下午6点。这样就可以初步根据医嘱数据得到一个大概的用药时间,而为了进一步保证确定的样本用户的用药时间的准确性,可以进一步通过例如血糖数据来对初始用药时间进行调整。由于患者在使用降糖药物后,血糖浓度会在降糖药物发挥功效后出现明显下降,那么就可以根据患者在初始用药时间的附近时间的血糖浓度的变化来进一步将用药时间调整到合适的位置。例如,某初始用药时间为上午8点,但是根据历史血糖浓度,上午9点的时候血糖浓度明显开始下降,那么考虑到药效的发挥时间为半小时,则可以将用户的用药时间确定为8点半。
在一些实施例中,基于所述历史血糖数据对所述初始用药时间进行调整,确定所述样本用户的用药时间,具体包括:
确定所述样本用户的用餐时间;
基于所述用餐时间以及所述历史血糖数据对所述初始用药时间进行调整,确定所述样本用户的用药时间。
具体实施时,为了进一步的保证最终确定的用药时间的准确性,可以进一步考虑到用户的用餐时间,并根据用餐时间以及所述历史血糖数据对所述初始用药时间进行调整,确定所述样本用户的用药时间。对于糖尿病患者来说,用餐时间一般和用药时间有着紧密的联系,例如,一些降糖药物需要饭前服用,例如,胰岛素增敏剂、格列齐特、格列喹酮、格列吡嗪等药物。而二甲双胍类等药物,则需要在饭后服用。通过用餐时间可以进一步缩小用药时间的范围,从而可以更准确的获得最终的用药时间。例如,某初始用药时间为上午8点,但是在7点和9点这两个时刻均开始出现血糖浓度下降,这时可以进一步通过用餐时间来进行排查,若当前用餐时间为上午8点,使用的药物为二甲双胍,则当前的用药时间为8点半,而不是7点半。
在一些实施例中,基于所述用餐时间以及所述历史血糖数据对所述初始用药时间进行调整,确定所述样本用户的用药时间,具体包括:
基于所述历史血糖数据对所述用餐时间进行调整;
基于所述用药名称从预设关系列表中确定所述用餐时间与所述用药时间的时间关系;
基于调整后的所述用餐时间以及所述时间关系确定所述样本用户的用药时间。
具体实施时,考虑到用餐时间一般和用药时间有着紧密的时间关系,例如,用户一般会在餐前半小时打胰岛素,或者在饭后半小时服用二甲双胍,因此,当确定了用餐时间后,就可以根据用餐时间与时间关系得到最终的用药时间。为了保证使用的用餐时间的准确性,可以根据历史血糖数据对所述用餐时间进行调整,一般情况下,当血糖开始明显上升,说明患者吃的东西开始大量消化,一般这段时间可以设置为半小时,即可以通过血糖开始明显上升的时刻反向推导出用餐时间。或者用户一般用餐2小时后,血糖浓度会达到最高值,通过该血糖浓度最高值对应的时刻也可以推导出用餐时间,即完成对用餐时间的调整。可选的,预设关系列表可以根据不同降糖药物的使用说明进行设置,对此不做限定。
在一些实施例中,考虑到一些情况下,患者的病情不严重时,并不需要通过贴在用户手臂上的血糖仪进行实时血糖检测,而且,随着用户的病情的减弱也会减少检测血糖的频率,这时可能无法通过历史血糖数据来找到血糖开始明显下降到时刻,即无法直接通过历史血糖浓度对所述初始用药时间进行调整。这时,可以进一步通过用餐时间来帮助确定最终的用药时间。
在一些实施例中,确定所述样本用户的用餐时间,具体包括:
获取所述样本用户的体重信息和身高信息;
基于体重信息和身高信息从预设用餐时间范围内确定所述样本用户的用餐时间。
具体实施时,为了准确的确定样本用户的用餐时间,可以参考体脂率与用户的吃饭积极性的关系,一般的情况下,吃饭比较积极的人体重要高于吃饭不积极的人,即吃饭积极的人的体脂率要高于吃饭不积极的人的体脂率。因此,在确定用餐时间时,可以先确定一个预设用餐时间,该时间可以参照医院食堂的开饭时间范围,例如,早饭上午7点到9点,然后考虑到体脂率较高的人吃饭较为积极,所以吃饭时间应该靠近上午7点,对应的体脂率较低的人的吃饭时间应该靠近上午9点,在此基础上,就可以得到体脂率和吃饭时间的对应关系,根据该对应关系就可以从预设用餐时间范围内确定所述样本用户的用餐时间。可选的,用户的体脂率可以通过身高信息和体重信息来计算。可选的,可以通过体重与身高的比值来表示体脂率。
本申请提供的血糖预测模型的训练方法,确定待训练的血糖预测模型的使用场景信息;所述使用场景信息包括医院等级、医院类型和医院所在城市等级;将所述使用场景信息输入到训练获得的数据分布预测模型中,得到与所述使用场景信息对应的数据分布比例;获取第一样本数据集,并基于所述数据分布比例和所述第一样本数据集生成第二样本数据集;所述第二样本数据集为所述第一样本数据集的子集;基于所述第二样本数据集训练所述待训练的血糖预测模型,从而通过数据分布预测模型先确定血糖预测模型使用场景对应的数据分布比例,并根据该数据分布比例从第一样本数据集中筛选出第二样本数据集,并通过第二样本数据集训练血糖预测模型,在保证样本数据质量的同时,提高了血糖预测模型预测血糖的准确度。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种血糖预测模型的训练装置,所述装置应用于血糖仪中。
参考图2,所述血糖预测模型的训练装置,包括:
确定模块201,确定待训练的血糖预测模型的使用场景信息;所述使用场景信息包括医院等级、医院类型和医院所在城市等级;
分布模块202,将所述使用场景信息输入到训练获得的数据分布预测模型中,得到与所述使用场景信息对应的数据分布比例;
生成模块203,获取第一样本数据集,并基于所述数据分布比例和所述第一样本数据集生成第二样本数据集;所述第二样本数据集为所述第一样本数据集的子集;
训练模块204,基于所述第二样本数据集训练所述待训练的血糖预测模型。
在一些实施例中,所述训练模块204,具体用于:
确定所述第二样本数据集对应的样本数据的目标数量:
基于所述目标数量以及所述数据分布比例从所述第一样本数据集中确定目标样本数据;所述数据分布比例包括各种类型的样本数据的分布比例,所述样本数据的类型包括性别类型、和/或年龄类型、和/或糖尿病类型;
基于所述目标样本数据生成第二样本数据集。
在一些实施例中,所述装置还包括数据集创建模块,用于:
获取样本用户的医嘱数据,所述医嘱数据包括用药名称、单次用药计量以及单日内用药次数;
获取所述样本用户的历史血糖数据和用户信息;所述用户信息包括性别信息、年龄信息、糖尿病类型信息;
基于所述历史血糖数据以及所述医嘱数据确定所述样本用户的用药时间;
基于所述用药时间、所述用药名称以及单次用药计量生成所述样本用户的用药样本参数;
基于所述用药样本参数、所述用户信息以及所述历史血糖数据生成第一样本数据,并基于所述第一样本数据生成所述第一样本数据集。
在一些实施例中,所述数据集创建模块,具体用于:
基于所述单日内用药次数确定所述样本用户的初始用药时间;
基于所述历史血糖数据对所述初始用药时间进行调整,确定所述样本用户的用药时间。
在一些实施例中,所述数据集创建模块,具体用于:
确定所述样本用户的用餐时间;
基于所述用餐时间以及所述历史血糖数据对所述初始用药时间进行调整,确定所述样本用户的用药时间。
在一些实施例中,所述数据集创建模块,具体用于:
基于所述历史血糖数据对所述用餐时间进行调整;
基于所述用药名称从预设关系列表中确定所述用餐时间与所述用药时间的时间关系;
基于调整后的所述用餐时间以及时间关系得到样本用户的用药时间。
在一些实施例中,所述数据集创建模块,具体用于:
获取所述样本用户的体重信息和身高信息;
基于体重信息和身高信息从预设用餐时间范围内确定所述样本用户的用餐时间。
上述实施例的血糖检测装置用于实现前述任一实施例中相应的血糖预测模型的训练方法,并且具有相应的血糖预测模型的训练方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本公开还提供了一种血糖预测模型的训练方法的系统,所述系统包括服务器和血糖仪,其中,所述血糖仪能够执行上述血糖预测模型的训练方法。
上述实施例的系统用于实现前述任一实施例中相应的血糖预测模型的训练方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本公开还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的血糖预测模型的训练方法。
需要说明的是,本申请实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本申请实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本申请的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
图3示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图。该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
上述实施例的电子设备用于实现前述任一实施例中相应的血糖预测模型的训练方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本公开还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的血糖预测模型的训练方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的血糖预测模型的训练方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
为简化说明和讨论,并且为了不会使本申请实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本申请实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本申请实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本申请的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本申请实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本申请的具体实施例对本申请进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本申请的范围(包括权利要求)被限于这些例子;在本申请的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本申请的不同方面的许多其它变化,为了简明它们没有在细节中提供。
本申请实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本申请实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (8)

1.一种血糖预测模型的训练方法,其特征在于,包括:
确定待训练的血糖预测模型的使用场景信息;所述使用场景信息包括医院等级、医院类型和医院所在城市等级;
将所述使用场景信息输入到训练获得的数据分布预测模型中,得到与所述使用场景信息对应的数据分布比例;
获取第一样本数据集,并基于所述数据分布比例和所述第一样本数据集生成第二样本数据集;所述第二样本数据集为所述第一样本数据集的子集;
基于所述第二样本数据集训练所述待训练的血糖预测模型;
其中,生成所述第一样本数据集的步骤包括:
获取样本用户的医嘱数据,所述医嘱数据包括用药名称、单次用药剂量以及单日内用药次数;
获取所述样本用户的历史血糖数据和用户信息;所述用户信息包括性别信息、年龄信息、糖尿病类型信息;
基于所述历史血糖数据以及所述医嘱数据确定所述样本用户的用药时间;
基于所述用药时间、所述用药名称以及单次用药剂量生成所述样本用户的用药样本参数;
基于所述用药样本参数、所述用户信息以及所述历史血糖数据生成第一样本数据,并基于所述第一样本数据生成所述第一样本数据集;
其中,基于所述数据分布比例和所述第一样本数据集生成第二样本数据集,具体包括:
确定所述第二样本数据集对应的样本数据的目标数量:
基于所述目标数量以及所述数据分布比例从所述第一样本数据集中确定目标样本数据;所述数据分布比例包括各种类型的样本数据的分布比例,所述样本数据的类型包括性别类型、和/或年龄类型、和/或糖尿病类型;
基于所述目标样本数据生成第二样本数据集。
2.根据权利要求1所述的方法,其特征在于,基于所述历史血糖数据以及所述医嘱数据确定所述样本用户的用药时间,具体包括:
基于所述单日内用药次数确定所述样本用户的初始用药时间;
基于所述历史血糖数据对所述初始用药时间进行调整,确定所述样本用户的用药时间。
3.根据权利要求2所述的方法,其特征在于,基于所述历史血糖数据对所述初始用药时间进行调整,确定所述样本用户的用药时间,具体包括:
确定所述样本用户的用餐时间;
基于所述用餐时间以及所述历史血糖数据对所述初始用药时间进行调整,确定所述样本用户的用药时间。
4.根据权利要求3所述的方法,其特征在于,基于所述用餐时间以及所述历史血糖数据对所述初始用药时间进行调整,确定所述样本用户的用药时间,具体包括:
基于所述历史血糖数据对所述用餐时间进行调整;
基于所述用药名称从预设关系列表中确定所述用餐时间与所述用药时间的时间关系;
基于调整后的所述用餐时间以及所述时间关系确定所述样本用户的用药时间。
5.根据权利要求3所述的方法,其特征在于,确定所述样本用户的用餐时间,具体包括:
获取所述样本用户的体重信息和身高信息;
基于体重信息和身高信息从预设用餐时间范围内确定所述样本用户的用餐时间。
6.一种血糖预测模型的训练装置,其特征在于,包括:
确定模块,确定待训练的血糖预测模型的使用场景信息;所述使用场景信息包括医院等级、医院类型和医院所在城市等级;
分布模块,将所述使用场景信息输入到训练获得的数据分布预测模型中,得到与所述使用场景信息对应的数据分布比例;
生成模块,获取第一样本数据集,并基于所述数据分布比例和所述第一样本数据集生成第二样本数据集;所述第二样本数据集为所述第一样本数据集的子集;
训练模块,基于所述第二样本数据集训练所述待训练的血糖预测模型;
其中,所述装置还包括数据集创建模块,用于:
获取样本用户的医嘱数据,所述医嘱数据包括用药名称、单次用药剂量以及单日内用药次数;
获取所述样本用户的历史血糖数据和用户信息;所述用户信息包括性别信息、年龄信息、糖尿病类型信息;
基于所述历史血糖数据以及所述医嘱数据确定所述样本用户的用药时间;
基于所述用药时间、所述用药名称以及单次用药剂量生成所述样本用户的用药样本参数;
基于所述用药样本参数、所述用户信息以及所述历史血糖数据生成第一样本数据,并基于所述第一样本数据生成所述第一样本数据集;
其中,所述生成模块具体用于:
确定所述第二样本数据集对应的样本数据的目标数量:
基于所述目标数量以及所述数据分布比例从所述第一样本数据集中确定目标样本数据;所述数据分布比例包括各种类型的样本数据的分布比例,所述样本数据的类型包括性别类型、和/或年龄类型、和/或糖尿病类型;
基于所述目标样本数据生成第二样本数据集。
7.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至5任意一项所述的方法。
8.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行权利要求1至5任一所述的方法。
CN202311211166.3A 2023-09-19 2023-09-19 血糖预测模型的训练方法、装置、设备及存储介质 Active CN117352182B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311211166.3A CN117352182B (zh) 2023-09-19 2023-09-19 血糖预测模型的训练方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311211166.3A CN117352182B (zh) 2023-09-19 2023-09-19 血糖预测模型的训练方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN117352182A CN117352182A (zh) 2024-01-05
CN117352182B true CN117352182B (zh) 2024-12-17

Family

ID=89360291

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311211166.3A Active CN117352182B (zh) 2023-09-19 2023-09-19 血糖预测模型的训练方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117352182B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113679348A (zh) * 2021-08-26 2021-11-23 平安国际智慧城市科技股份有限公司 血糖预测方法、血糖预测装置、设备及存储介质
CN114429188A (zh) * 2022-01-26 2022-05-03 深圳前海微众银行股份有限公司 超参数搜索方法、系统、终端设备及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2918332C (en) * 2013-07-18 2023-08-08 Parkland Center For Clinical Innovation Patient care surveillance system and method
WO2015168250A2 (en) * 2014-04-30 2015-11-05 Battelle Memorial Institute Decision support system for hospital quality assessment
CN112819045A (zh) * 2021-01-20 2021-05-18 国家卫生健康委科学技术研究所 用于用户生理状态分类的方法、装置、电子设备及介质
CN112836830B (zh) * 2021-02-01 2022-05-06 广西师范大学 一种联邦梯度提升决策树投票并行训练方法
CN113792807B (zh) * 2021-09-16 2023-06-27 平安科技(深圳)有限公司 皮肤病分类模型训练方法、系统、介质和电子设备
CN114023441A (zh) * 2021-11-08 2022-02-08 中国人民解放军总医院 基于可解释机器学习模型的严重aki早期风险评估模型、装置及其开发方法
CN116313080A (zh) * 2022-12-22 2023-06-23 江苏鱼跃凯立特生物科技有限公司 一种基于迁移学习的葡萄糖浓度预测方法及设备
CN116579503B (zh) * 2023-07-07 2023-09-08 湖南尚医康医疗科技有限公司 一种5g智慧医院基础数据处理方法及数据库平台

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113679348A (zh) * 2021-08-26 2021-11-23 平安国际智慧城市科技股份有限公司 血糖预测方法、血糖预测装置、设备及存储介质
CN114429188A (zh) * 2022-01-26 2022-05-03 深圳前海微众银行股份有限公司 超参数搜索方法、系统、终端设备及存储介质

Also Published As

Publication number Publication date
CN117352182A (zh) 2024-01-05

Similar Documents

Publication Publication Date Title
CN111696675B (zh) 基于物联网数据的用户数据分类方法、装置及计算机设备
Dorsey et al. Novel methods and technologies for 21st-century clinical trials: a review
CN109523067B (zh) 基于预测模型的费用预测方法、装置、服务器及存储介质
Tsiouris et al. PD_Manager: an mHealth platform for Parkinson's disease patient management
Giometto et al. Paraneoplastic neurologic syndrome in the PNS Euronetwork database: a European study from 20 centers
RU2285442C2 (ru) Персональная система контроля состояния
US20180365385A1 (en) Monitoring and evaluating patient reactions to medications
CN111588384B (zh) 获得血糖检测结果的方法、装置及设备
CN105005685A (zh) 一种医嘱执行监督管理系统
CN109003660A (zh) 智能医疗服务预测管理方法及系统、可读存储介质和终端
Tonacci et al. An innovative, unobtrusive approach to investigate smartphone interaction in nonaddicted subjects based on wearable sensors: A pilot study
CN107358023A (zh) 生成医学报告、交互医学报告的方法、系统及设备
Pais et al. Acceptance of using an ecosystem of mobile apps for use in diabetes clinic for self-management of gestational diabetes mellitus
Harris et al. Specifying and pilot testing quality measures for the American Society of Addiction Medicine's standards of care
CN111863252A (zh) 健康监测方法、系统、计算机设备及存储介质
US11901074B2 (en) Medical information processing apparatus, medical information processing method, and non-transitory computer-readable storage medium storing program
Queen et al. Data‐driven specialisation of wound care through artificial intelligence
CN113436738A (zh) 管理风险用户的方法、装置、设备及存储介质
Brosnan et al. Screen use at bedtime and sleep duration and quality among youths
Signal et al. Complexity of continuous glucose monitoring data in critically ill patients: continuous glucose monitoring devices, sensor locations, and detrended fluctuation analysis methods
CN112842302A (zh) 身体信息的处理方法和系统、存储介质
CN117352182B (zh) 血糖预测模型的训练方法、装置、设备及存储介质
Dash et al. A comprehensive study of mobile computing in telemedicine
TWI749621B (zh) 用藥提醒與回報系統及其實施方法
CN113724818A (zh) 在诊疗过程中推送医嘱数据的方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant