CN115858509A

CN115858509A - 医疗数据波动率监测方法、装置、设备及可读存储介质

Info

Publication number: CN115858509A
Application number: CN202211443688.1A
Authority: CN
Inventors: 马晓璐; 张春梅; 段鹏飞; 洪思玉
Original assignee: Shenzhen Dashi Qiyun Health Technology Co ltd
Current assignee: Shenzhen Dashi Qiyun Health Technology Co ltd
Priority date: 2022-11-17
Filing date: 2022-11-17
Publication date: 2023-03-28

Abstract

本发明公开了一种医疗数据波动率监测方法、装置、设备及可读存储介质，该方法包括：获取医疗机构服务器发送的医疗数据，并确定所述医疗数据对应的波动率序列；根据所述波动率序列在多个预设时间序列模型中选择最优时间序列模型，将所述波动率序列输入至所述最优时间序列模型，输出得到预测序列；根据所述波动率序列和所述预测序列进行数据清洗，得到残差序列，并根据所述残差序列的绝对中位差构建标准波动区间；若所述波动率序列中的当前波动率不在所述标准波动区间内，则确定所述当前波动率为异常数据。本发明提高了监测医疗数据中异常数据的有效性。

Description

医疗数据波动率监测方法、装置、设备及可读存储介质

技术领域

本发明涉及数据处理技术领域，尤其涉及一种医疗数据波动率监测方法、装置、设备及可读存储介质。

背景技术

现阶段，医疗数据呈现诸多特点，比如门诊就诊量、就诊时间等存在一定的规律，通过对门诊量监测系统数据进行分析，可为医院管理部门合理调动分配门诊人力、物力等资源提供依据，以提高医院门诊服务水平。目前虽然有区间判定法进行监测医疗数据中的异常数据，但是区间判定法的主观性太强，容易受到测试人员人为的影响，导致最终得到数据分析结果的有效性低，从而使得医疗数据中异常数据监测的有效性变低。

发明内容

本发明的主要目的在于提供一种医疗数据波动率监测方法、装置、设备及可读存储介质，旨在解决如何提高监测医疗数据中异常数据的有效性的技术问题。

为实现上述目的，本发明提供一种医疗数据波动率监测方法，包括以下步骤：

获取医疗机构服务器发送的医疗数据，并确定所述医疗数据对应的波动率序列；

根据所述波动率序列在多个预设时间序列模型中选择最优时间序列模型，将所述波动率序列输入至所述最优时间序列模型，输出得到预测序列；

根据所述波动率序列和所述预测序列进行数据清洗，得到残差序列，并根据所述残差序列的绝对中位差构建标准波动区间；

若所述波动率序列中的当前波动率不在所述标准波动区间内，则确定所述当前波动率为异常数据。

可选地，确定所述医疗数据对应的波动率序列的步骤，包括：

若所述医疗数据存在更新，则确定所述医疗数据中的当前指标数据和历史指标数据之间的差值，并将所述差值和所述当前指标数据之间的比例值作为当前波动率；

将所述当前波动率添加至预设的历史波动率序列中，得到波动率序列。

可选地，确定所述医疗数据对应的波动率序列的步骤之后，包括：

根据预设的平稳性检验规则对所述波动率序列进行平稳性检验；

若所述平稳性检验未通过，则对所述波动率序列进行差分处理，以获取平稳后的波动率序列，并根据平稳后的所述波动率序列执行所述根据所述波动率序列在多个预设时间序列模型中选择最优时间序列模型的步骤。

可选地，确定所述医疗数据对应的波动率序列的步骤之后，还包括：

监测所述波动率序列中的所有波动率之间是否存在相关性；

若各所述波动率之间不存在相关性，则确定所述波动率序列为白噪声序列，并输出所述医疗数据波动率无相关的提示信息；

若各所述波动率之间存在相关性，则执行所述根据所述波动率序列在多个预设时间序列模型中选择最优时间序列模型的步骤。

可选地，根据所述波动率序列在多个预设时间序列模型中选择最优时间序列模型的步骤，包括：

计算所波动率序列对应的最优周期，并根据所述最优周期在多个预设时间序列模型中选择最小信息准则对应的预设时间序列模型作为最优时间序列模型。

可选地，根据所述最优周期在多个预设时间序列模型中选择最小信息准则对应的预设时间序列模型作为最优时间序列模型的步骤之后，还包括：

确定所述最优时间序列模型中的目标参数，并根据预设显著性检验规则对所述目标参数进行显著性检验；

若所述显著性检验的检验结果为参数不显著，则确定各所述预设时间序列模型中除所述最优时间序列模型之间的其他时间序列模型，并根据所述其他时间序列模型执行所述根据所述最优周期在多个预设时间序列模型中选择最小信息准则对应的预设时间序列模型作为最优时间序列模型的步骤；

若所述显著性检验的检验结果显著，则执行所述将所述波动率序列输入至所述最优时间序列模型，输出得到预测序列的步骤。

可选地，根据所述残差序列的绝对中位差构建标准波动区间的步骤，包括：

确定所述残差序列对应的移动中位数，并计算所述移动中位数和所述预测序列之间的第一和值；

确定预设常数值和所述绝对中位差之间的乘积，并将所述乘积与所述第一和值之间的和值作为动态上限值，将所述乘积与所述第一和值之间的差值作为动态下限值，将所述动态下限值到所述动态上限值之间的区间作为标准波动区间。

此外，为实现上述目的，本发明还提供一种医疗数据波动率监测装置，包括：

获取模块，用于获取医疗机构服务器发送的医疗数据，并确定所述医疗数据对应的波动率序列；

选择模块，用于根据所述波动率序列在多个预设时间序列模型中选择最优时间序列模型，将所述波动率序列输入至所述最优时间序列模型，输出得到预测序列；

构建模块，用于根据所述波动率序列和所述预测序列进行数据清洗，得到残差序列，并根据所述残差序列的绝对中位差构建标准波动区间；

确定模块，用于若所述波动率序列中的当前波动率不在所述标准波动区间内，则确定所述当前波动率为异常数据。

此外，为实现上述目的，本发明还提供一种医疗数据波动率监测设备，医疗数据波动率监测设备包括存储器、处理器及存储在存储器上并可在处理器上运行的医疗数据波动率监测程序，医疗数据波动率监测程序被处理器执行时实现如上述的医疗数据波动率监测方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，计算机可读存储介质上存储有医疗数据波动率监测程序，医疗数据波动率监测程序被处理器执行时实现如上述的医疗数据波动率监测方法的步骤。

本发明通过确定医疗机构服务器发送的医疗数据对应的波动率序列，然后在多个预设时间序列模型中选择最优时间序列模型，以便通过最优时间序列模型对波动率序列进行训练，得到预测序列，再根据波动率序列对预测序列进行数据清洗，得到残差序列，并根据残差序列的绝对中位差构建标准波动区间，若当前波动率不在标准波动区间内时，确定当前波动率为异常数据，从而可以避免现有技术中通过人为设置区间，再进行异常数据的检测，导致检测结果的有效性低的现象发生，并且本实施例中构建的标准波动区间并不受人为因素控制，从而使得最终预测的异常数据的准确性高，提高了监测医疗数据中异常数据的有效性。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的终端\装置结构示意图；

图2为本发明医疗数据波动率监测方法第一实施例的流程示意图；

图3为本发明医疗数据波动率监测装置的装置模块示意图；

图4为本发明医疗数据波动率监测方法中的标准波动区间示意图；

图5为本发明医疗数据波动率监测方法中整体流程示意图；

图6为本发明医疗数据波动率监测方法中模型选择构建示意图。

本发明目的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。

本发明实施例终端为医疗数据波动率监测设备。

如图1所示，该终端可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，终端还可以包括摄像头、RF(Radio Frequency，射频)电路，传感器、音频电路、WiFi模块等等。其中，传感器比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示屏的亮度，接近传感器可在终端设备移动到耳边时，关闭显示屏和/或背光。当然，终端设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及医疗数据波动率监测程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的医疗数据波动率监测程序，并执行以下操作：

参照图2，本发明提供一种医疗数据波动率监测方法，在医疗数据波动率监测方法的第一实施例中，医疗数据波动率监测方法包括以下步骤：

步骤S10，获取医疗机构服务器发送的医疗数据，并确定所述医疗数据对应的波动率序列；

由于目前的医疗数据虽然存在一定的规律，分析人员或者其他智能终端可以根据医疗数据的规律快速监测到异常数据，以便根据异常数据进行相应的异常处理，如告警处理等。但是目前的异常数据监控方式受监控人员的主观性太强，容易导致异常数据的错误判断，从而影响异常数据判定的有效性。因此在本实施例中，是通过确定一个符合标准的时间序列模型，然后再根据时间序列模型对医疗数据的波动进行预测，得到预测数据，并利用绝对中位差对预测值和真实值的差值进行异常检测，以得到较为准确的异常数据。

其中，医疗机构可以是进行疾病诊断、治疗的医院、疗养院、门诊部、诊所、卫生所以及急救站，医疗机构还可以是合法出售药品的药房。医疗数据具体为针对就诊病患在医疗机构就诊或购药出具的医疗详单或医疗病历，具体包括就诊医疗机构的医疗机构标识、就诊时间、入院时间、出院时间、参保人标识、参保人所患疾病信息等。并且在医疗机构服务器上安装有应用软件，以使得医疗机构服务器定时或实时向监控服务端发送医疗数据。监控服务端可以直接从自身存储器中获取应用软件上报的医疗数据；当监控服务端是专用的监控服务平台时，可以向医疗机构服务器发送请求以获取医疗数据，或由医疗机构服务器主动发送医疗数据给所述监控服务平台。医疗机构服务器定时发送医疗数据，可以是间隔固定时间发送医疗数据，例如：每天、每小时等。也可以是医疗机构工作人员输入相关数据后，实时发送医疗数据到监控服务端。其中，医疗数据可以包括一定时间范围内的门诊就诊量数据、就诊时间数据等。

并且在获取到医疗机构服务器发送的医疗数据后，就可以根据医疗数据进行异常数据的分析，以便根据分析结果能及时对异常数据进行相应处理。具体地，当医疗数据为门诊就诊量数据时，可以确定每个时间段内的门诊就诊量数据，并确定每个门诊就诊量数据对应的波动率数据，再根据各个波动率数据来构建医疗数据对应的波动率序列。其中，波动率序列是一个时间序列，包括一组按照时间顺序排列的数据。例如，获取医疗机构服务器发送的某指标近年来每日数据，比如门诊量每日数据{X_t}，然后再计算门诊量每日波动率数据，并根据计算的每日波动率数据构建波动率序列，如将最新计算的每日波动率数据添加至已存在的历史波动率序列中，得到波动率序列，当不存在历史波动率序列时，可以直接构建一个空序列，并将每日波动率数据添加至空序列中，得到波动率序列。

步骤S20，根据所述波动率序列在多个预设时间序列模型中选择最优时间序列模型，将所述波动率序列输入至所述最优时间序列模型，输出得到预测序列；

当获取到波动率序列后，由于波动率序列是一个时间序列，因此需要提前构建多个预设时间序列模型，其中，预设时间序列模型为提前构建且已训练好的时间序列模型。其中，时间序列模块可以是SARIMA模型(Seasonal Autoregressive Integrated MovingAverage，季节性差分自回归滑动平均模型)、ARMA模型(Autoregressive moving averagemodel，自回归滑动平均模型)、ARIMA模型(Autoregressive Integrated Moving Averagemode，差分整合移动平均自回归模型)，或者是其他时间序列模型，具体地在此不做限制。并且构建的每个时间序列模型的自回归参数和移动平均参数均不相同。

当即获取到需要进行异常数据检测的波动率序列，又已确定多个预设时间序列模型后，就需要在多个预设时间序列模型中选择一个效果最佳的预设时间序列模型作为最优时间序列模型，然后就可以直接将波动率序列输入到最优时间序列模型中进行模型训练，输出得到医疗数据对应的预测序列。例如，门诊量波动率对应的预测序列。此外进行预设时间序列模型选择时，可以根据波动率序列的最优周期来对预设时间序列模型中的所有参数进行AIC信息准则分析，并将最小的AIC信息准则对应的参数所在预设时间序列模型作为最优时间序列模型。

步骤S30，根据所述波动率序列和所述预测序列进行数据清洗，得到残差序列，并根据所述残差序列的绝对中位差构建标准波动区间；

在本实施例中，当通过最优时间序列模型进行模型训练得到预测序列后，为了更加精准地确定标准波动区间，以便根据标准波动区间来确定当前波动率是否为异常数据。此时就可以通过处理器根据波动率序列来对预测序列进行数据清洗，得到残差序列。其中，在进行数据清洗时，可以通过波动率序列减去预测序列，来得到残差序列。例如，若预测序列为P_t，波动率序列为Y_t，残差序列为e_t，则残差序列、波动率序列以及预测序列三者之间的关系可以是e_t＝P_t-Y_t。此外，还可以是将波动率序列存储在预测序列所在的存储器中，并通过处理器对存储器中的预测序列进行数据清洗，即通过波动率序列减去预测序列，来得到残差序列。

当获取到残差序列后，还需要计算残差序列的绝对中位差，例如，mad＝median(|e_t-median(e_t)|)。其中，mad为绝对中位差。median(e_t)为残差序列e_t的中位数。然后再根据绝对中位差来计算确定波动率数据(如每日波动率数据)对应的动态上下限值，根据动态上下限值构建标准波动区间。

步骤S40，若所述波动率序列中的当前波动率不在所述标准波动区间内，则确定所述当前波动率为异常数据。

在本实施例中，当确定标准波动区间后，还需要将波动率序列中最近一次添加进去的当前波动率(如当前日波动率数据)与标准波动区间内动态上下限值进行比较，若当前波动率不在标准波动区间内，则可以直接确定当前波动率为异常数据，也就可以确定当前时刻的医疗数据存在异常，从而可以通知用户及时进行处理。但是若当前波动率在标准波动区间内，则可以确定当前波动率为正常数据。例如，如图4所示，以时间为横轴，数量为横轴，构建坐标系。其中，时间可以为2022-03-17、2022-03-24、2022-03-31、2022-04-07。数量可以为-1.5、-1.0、-0.5、0.0、0.5、1.0、1.5、2.0。并且灰色区域的上边界为动态上限值，下边界为动态下限值，中间部分为正常区域(即标准波动区域)，在正常区域内的黑色点为正常值，超过正常区域的黑色点为异常值。

此外，为辅助理解本实施例中的医疗数据波动率监测方法，下面进行举例说明。

例如，如图5所示，可以是先获取指标数据，然后计算波动率数据，得到实际时序数据Y_t，再构建参数为(p，d，q，m)的SARIMA模型，计算模型预测值，计算模型残差序列et＝预测值-真实值，计算et的绝对中位差mad，计算时序数据的上下限值，进行指标监测。其中，构建SARIMA模型的过程可以参照图6所示，包括读取时序数据{Y_t}，再进行平稳性检验，若平稳，则差分次数d＝0，若非平稳，则进行差分运算，得到稳定时序数据{Yt’}，再进行平稳性检验。并在得到差分次数d后，进行白噪声检验，若是白噪声序列，则结束，若不是白噪声序列，则计算周期m，并进行差分计算，建立ARMA模型，确定自回归参数p，移动平均参数q，检测AIC信息准则是否通过，若是进行模型检验是否通过，若是，则结束，若否，则重新构建新的模型，直至结束。

在本实施例中，通过确定医疗机构服务器发送的医疗数据对应的波动率序列，然后在多个预设时间序列模型中选择最优时间序列模型，以便通过最优时间序列模型对波动率序列进行训练，得到预测序列，再根据波动率序列对预测序列进行数据清洗，得到残差序列，并根据残差序列的绝对中位差构建标准波动区间，若当前波动率不在标准波动区间内时，确定当前波动率为异常数据，从而可以避免现有技术中通过人为设置区间，再进行异常数据的检测，导致检测结果的有效性低的现象发生，并且本实施例中构建的标准波动区间并不受人为因素控制，从而使得最终预测的异常数据的准确性高，提高了监测医疗数据中异常数据的有效性。

进一步地，基于上述本发明的第一实施例，提出本发明医疗数据波动率监测方法的第二实施例，在本实施例中，上述实施例步骤S10，确定所述医疗数据对应的波动率序列的步骤的细化，包括：

步骤a，若所述医疗数据存在更新，则确定所述医疗数据中的当前指标数据和历史指标数据之间的差值，并将所述差值和所述当前指标数据之间的比例值作为当前波动率；

步骤b，将所述当前波动率添加至预设的历史波动率序列中，得到波动率序列。

在本实施例中，当获取到医疗机构服务器发送的医疗数据后，还需要判断医疗数据是否有更新，若医疗数据不存在更新，则可以不用进行异常数据分析，继续保留前一次基于未更新的医疗数据进行异常数据分析的异常结果即可。但是若医疗数据存在更新，则可以确定医疗数据存在波动变化，需要进行异常数据检测，确定当前波动是否正常。因此可以获取并确定医疗数据中当前时刻的指标数据并将其作为当前指标数据，如当天指标数据。并获取确定当前时刻之前的前一时刻的指标数据，并将其作为历史指标数据，如前一天指标数据。再计算当前指标数据和历史指标数据之间的差值，以根据差值确定新增的指标数据，并计算新增的指标数据在当前指标数据中所占据的比例，即差值和当前指标数据之间的比例值，将此比例值作为当前波动率。并且针对每个时间段都可以采用本实施例中的方式进行，以获取每个时间段对应的波动率。其中，指标数据的数据类型和医疗数据的数据类型一致，如门诊就诊量数据等。

此外，还需要获取当前时刻之间一定时间范围内的历史波动率序列，在历史波动率序列中包括有一定时间范围内每个时间段对应的波动率。然后将当前波动率加入到历史波动率序列中，得到波动率序列。其中，波动率序列中的每个波动率都是按照产生波动率的时间的先后顺序进行排序的。

在本实施例中，通过在医疗数据存在更新时，先确定当前指标数据和历史指标数据之间的差值，并将差值和当前指标数据之间的比例值作为当前波动率，再将当前波动率添加至历史波动率序列中，得到波动率序列，从而保障了获取到的波动率序列的准确有效性。

进一步地，确定所述医疗数据对应的波动率序列的步骤之后，包括：

步骤c，根据预设的平稳性检验规则对所述波动率序列进行平稳性检验；

步骤d，若所述平稳性检验未通过，则对所述波动率序列进行差分处理，以获取平稳后的波动率序列，并根据平稳后的所述波动率序列执行所述根据所述波动率序列在多个预设时间序列模型中选择最优时间序列模型的步骤。

在本实施例中，由于波动率序列是一个时间序列，因此需要对波动率序列进行平稳性检验，以满足后续进行模型训练的要求。其中，平稳性检验的方式可以是通过时序图和相关图来检验，如果观察时序图或相关图中的波动率序列不是在坐标轴附近上下波动而是存在一定的增长或下降趋势，则说明是非平稳数据序，此时就可以确定波动率序列的平稳性检验未通过。还可以是采用ADF检验的方式进行平稳性检验，如通过检验波动率序列中是否存在单位根，若存在单位根，则确定波动率序列的平稳性检验未通过。例如，若波动率序列为

则它的特征方程为

如果该方程的特征根都在单位圆内，即特征根：

|λ_i|<1(i＝1,2,...,p)，则确定波动率序列的平稳性检验通过，是平稳序列，反之则确定波动率序列的平稳性检验未通过。

在确定波动率序列的平稳性检验未通过时，可以先对波动率序列进行差分处理，以得到平稳后的波动率序列，然后再进行后续的异常数据判断过程。并且在进行差分处理时，可以按照差分计算公式进行，如

其中，Y_t为当前时刻的波动率数据，Y_t-1为前一时刻的波动率数据，统计波动率序列进行差分之后变化为平稳的序列的次数。

在本实施例中，通过对波动率序列进行平稳性检验，并且在波动率序列通过平稳性检验后，才能进行后续选择最优时间序列模型的过程，从而可以使得后续选择的最优时间序列模型能正常根据波动率序列进行预测。

进一步地，确定所述医疗数据对应的波动率序列的步骤之后，还包括：

步骤e，监测所述波动率序列中的所有波动率之间是否存在相关性；

步骤f，若各所述波动率之间不存在相关性，则确定所述波动率序列为白噪声序列，并输出所述医疗数据波动率无相关性的提示信息；

步骤g，若各所述波动率之间存在相关性，则执行所述根据所述波动率序列在多个预设时间序列模型中选择最优时间序列模型的步骤。

在本实施例中，在获取到波动率序列之后，除了需要对波动率序列进行平稳性检测，还需要对波动率序列进行白噪声检验，以确定波动率序列中各个波动率值是否存在相关性，若各个波动率序列之间不存在相关性，则可以确定波动率序列是一个没有记忆的序列，过去的行为对将来的发展预测没有丝毫影响，此时就可以将波动率序列作为白噪声序列，并向用户输出医疗数据波动率无相关性的提示信息。但是若各个波动率之间存在相关性，则可以继续进行异常数据预测的过程。

其中，在进行白噪声序列检测的过程时，可以通过LB统计量的方式进行检测，具体地，LB的计算方式如下：

γ(k)＝E(x_t+k-μ_t+k)(x_t-μ_t)；

其中，n为序列长度，EX_c＝μ_c为序列{x_r}在t时刻的均值函数，其中，x_t+k可以是波动率序列中第t+k个波动率。μ_t+k可以是波动率序列中在t+k时刻的均值函数，γ(k)为自协方差函数，ρ_k为自相关系数。b为延迟期数。γ(k)为在延迟期数为k时的序列协方差，γ(0)为在延迟期数为0时的序列协方差。x_r为波动率序列中第t个波动率。

在本实施例中，当波动率序列为平稳序列(即通过平稳性检验)，则可以确定波动率序列在任意时刻的均值为常数，由于自相关系数和自协方差函数只依赖于时间的平移长度(延迟期数k)，而与时间的起止点无关，因此在波动率序列中的所有波动率之间存在显著的相关关系时，则延迟期数会比较小，因此可以设置延迟期数小于或等于12期。

并且LB统计量近似服从自由度为b的卡方分布x²(b)，因此，可通过LB统计量的值查找卡方分布对应的概率P值。如果概率P值小于置信水平

α，则可判定波动率序列为非白噪声序列，反之为白噪声序列。例如，设定b＝12，置信水平α＝0.05，计算出序列{x_n}延迟12期的LB＝82.57，根据卡方分布求出的概率P＝0.00008，由于P<0.05,则波动率序列{x_n}为非白噪声序列。

在本实施例中，通过对波动率序列进行白噪声序列检测，并在波动率序列不为白噪声序列时，才进行后续选择最优时间序列模型的步骤，从而可以保障波动率序列中各个波动率之间具有关联性，从而可以使得后续检测的异常数据的有效性得到保障。

进一步地，根据所述波动率序列在多个预设时间序列模型中选择最优时间序列模型的步骤，包括：

步骤h，计算所波动率序列对应的最优周期，并根据所述最优周期在多个预设时间序列模型中选择最小信息准则对应的预设时间序列模型作为最优时间序列模型。

在本实施例中，在进行最优时间序列模型选择时，可以对波动率序列进行傅里叶变换，例如若波动率序列{x_r}的长度为N，则进行傅里叶变换后，得到：

其中，k＝0,1,2，...，N-1。再根据最小二乘法计算得到最优周期m。再对波动率序列{x_n}进行最优周期m步差分计算，其差分计算公式为：

若设定p∈(0.6).q∈(0.6),其中，p为自回归参数和q为移动平均参数。则波动率序列对应的预设时间序列模型为ARMA(p,q)模型。然后再计算每个预设时间序列模型的AIC信息准则，并选择最小AIC信息准则对应的参数p，q作为最优值，其对应的预设时间序列模型为最优时间序列模型。其中，AIC信息准则计算公式为：

其中，pres_i为模型预测值，即预测序列。

在本实施例中，通过根据波动率序列对应的最优周期在多个预设时间序列模型中选择最小信息准则对应的预设时间序列模型作为最优时间序列模型，从而可以使得进行预测的最优时间序列模型比较精简，节约了成本。

进一步地，根据所述最优周期在多个预设时间序列模型中选择最小信息准则对应的预设时间序列模型作为最优时间序列模型的步骤之后，还包括：

步骤i，确定所述最优时间序列模型中的目标参数，并根据预设显著性检验规则对所述目标参数进行显著性检验；

步骤j，若所述显著性检验的检验结果为参数不显著，则确定各所述预设时间序列模型中除所述最优时间序列模型之间的其他时间序列模型，并根据所述其他时间序列模型执行所述根据所述最优周期在多个预设时间序列模型中选择最小信息准则对应的预设时间序列模型作为最优时间序列模型的步骤；

步骤k，若所述显著性检验的检验结果显著，则执行所述将所述波动率序列输入至所述最优时间序列模型，输出得到预测序列的步骤。

在本实施例中，在确定最优时间序列模型后，还需要对最优时间序列模型的参数进行显著性检验，以确定每个未知参数是否显著为零。如果某个参数不显著，即表示该参数对应的自变量对因变量的影响不明显，需要重新选择一个不具有该参数的时间序列模型作为新的最优时间序列模型。其中，对最优时间序列模型中的目标参数进行显著检验时，可以根据提前设置的显著先检验规则进行检验。例如参数显著性检验统计量为T统计量，计算公式如下所示：

其中，β_j(1≤j≤s)为模型第j个参数的最小二乘估计值，a_jj为参数最小二乘估计方差矩阵的第j行第j列元素。T检验统计量服从自由度为(n-s)的t分布t(n-s)，因此，可通过T统计量的值查找t分布对应的概率P值。x_r为波动率序列中第t个波动率。如果概率P值小于置信水平α，则认为参数显著，反之参数不显著，应从模型中剔除该参数对应自变量，即重新选择一个模型。例如，一个时间序列如下所示：

其模型参数

对应的T检验统计量的值T＝3.5，查找对应的t分布，得到其概率P值为0.0005，小于置信水平α＝0.05，则认为参数

显著，其对应的自变量x_t-1应保留在模型中。

在本实施例中，通过对最优时间序列模型进行显著性检验，并在参数不显著时，重新选择新的时间序列模型，在显著性检验的检验结果显著后，才进行后续的预测异常数据的操作。

进一步地，根据所述残差序列的绝对中位差构建标准波动区间的步骤，包括：

步骤m，确定所述残差序列对应的移动中位数，并计算所述移动中位数和所述预测序列之间的第一和值；

步骤n，确定预设常数值和所述绝对中位差之间的乘积，并将所述乘积与所述第一和值之间的和值作为动态上限值，将所述乘积与所述第一和值之间的差值作为动态下限值，将所述动态下限值到所述动态上限值之间的区间作为标准波动区间。

在本实施例中，在构建标准波动区间时，需要先确定波动率序列对应的动态上限值和动态下限值，其计算方式可以按照如下方式进行计算。即：

u_t＝P_t+auto_median+3*mad；

l_t＝P_t+auto_median-3*mad；

其中，u_t为上限值，l_t为下限值，auto median为移动中位数，滑动窗口为周期m，mad为绝对中位差。P_t为预测序列。u₁为动态上限值。l_t为动态下限值。

在本实施例中，通过计算动态上限值和动态下限值，并将动态下限值到动态上限值之间的区间作为标准波动区间，从而保障了获取到的标准波动区间的有效性。

此外，参照图3，本发明实施例还提供一种医疗数据波动率监测装置，包括：

获取模块A10，用于获取医疗机构服务器发送的医疗数据，并确定所述医疗数据对应的波动率序列；

选择模块A20，用于根据所述波动率序列在多个预设时间序列模型中选择最优时间序列模型，将所述波动率序列输入至所述最优时间序列模型，输出得到预测序列；

构建模块A30，用于根据所述波动率序列和所述预测序列进行数据清洗，得到残差序列，并根据所述残差序列的绝对中位差构建标准波动区间；

确定模块A40，用于若所述波动率序列中的当前波动率不在所述标准波动区间内，则确定所述当前波动率为异常数据。

可选地，获取模块A10，用于：

可选地，选择模块A20，用于：

监测所述波动率序列中的所有波动率之间是否存在相关性；

可选地，选择模块A20，用于：

可选地，构建模块A30，用于：

其中，医疗数据波动率监测装置的各个功能模块实现的步骤可参照本发明医疗数据波动率监测方法的各个实施例，此处不再赘述。

此外，本发明还提供一种医疗数据波动率监测设备，所述医疗数据波动率监测设备包括：存储器、处理器及存储在所述存储器上的医疗数据波动率监测程序；所述处理器用于执行所述医疗数据波动率监测程序，以实现上述医疗数据波动率监测方法各实施例的步骤。

本发明还提供了一种可读存储介质，可以包括计算机可读存储介质，所述计算机可读存储介质存储有一个或者一个以上程序，所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述医疗数据波动率监测方法各实施例的步骤。

本发明计算机可读存储介质具体实施方式与上述医疗数据波动率监测方法各实施例基本相同，在此不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种医疗数据波动率监测方法，其特征在于，所述医疗数据波动率监测方法包括以下步骤：

2.如权利要求1所述的医疗数据波动率监测方法，其特征在于，所述确定所述医疗数据对应的波动率序列的步骤，包括：

3.如权利要求1所述的医疗数据波动率监测方法，其特征在于，所述确定所述医疗数据对应的波动率序列的步骤之后，包括：

4.如权利要求1所述的医疗数据波动率监测方法，其特征在于，所述确定所述医疗数据对应的波动率序列的步骤之后，还包括：

监测所述波动率序列中的所有波动率之间是否存在相关性；

5.如权利要求1所述的医疗数据波动率监测方法，其特征在于，所述根据所述波动率序列在多个预设时间序列模型中选择最优时间序列模型的步骤，包括：

6.如权利要求5所述的医疗数据波动率监测方法，其特征在于，所述根据所述最优周期在多个预设时间序列模型中选择最小信息准则对应的预设时间序列模型作为最优时间序列模型的步骤之后，还包括：

7.如权利要求1所述的医疗数据波动率监测方法，其特征在于，所述根据所述残差序列的绝对中位差构建标准波动区间的步骤，包括：

8.一种医疗数据波动率监测装置，其特征在于，所述医疗数据波动率监测装置包括：

9.一种医疗数据波动率监测设备，其特征在于，所述医疗数据波动率监测设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的医疗数据波动率监测程序，所述医疗数据波动率监测程序被所述处理器执行时实现如权利要求1至7中任一项所述的医疗数据波动率监测方法的步骤。

10.一种可读存储介质，其特征在于，所述可读存储介质上存储有医疗数据波动率监测程序，所述医疗数据波动率监测程序被处理器执行时实现如权利要求1至7中任一项所述的医疗数据波动率监测方法的步骤。