KR102287968B1 - Method for predicting of bacteremia risk and device for predicting of bacteremia risk using the same - Google Patents
Method for predicting of bacteremia risk and device for predicting of bacteremia risk using the same Download PDFInfo
- Publication number
- KR102287968B1 KR102287968B1 KR1020190097366A KR20190097366A KR102287968B1 KR 102287968 B1 KR102287968 B1 KR 102287968B1 KR 1020190097366 A KR1020190097366 A KR 1020190097366A KR 20190097366 A KR20190097366 A KR 20190097366A KR 102287968 B1 KR102287968 B1 KR 102287968B1
- Authority
- KR
- South Korea
- Prior art keywords
- bacteremia
- risk
- data
- predicting
- developing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7271—Specific aspects of physiological measurement analysis
- A61B5/7275—Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/01—Measuring temperature of body parts ; Diagnostic temperature sensing, e.g. for malignant or inflamed tissue
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/02—Detecting, measuring or recording for evaluating the cardiovascular system, e.g. pulse, heart rate, blood pressure or blood flow
- A61B5/021—Measuring pressure in heart or blood vessels
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/02—Detecting, measuring or recording for evaluating the cardiovascular system, e.g. pulse, heart rate, blood pressure or blood flow
- A61B5/024—Measuring pulse rate or heart rate
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/08—Measuring devices for evaluating the respiratory organs
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Veterinary Medicine (AREA)
- Biomedical Technology (AREA)
- Heart & Thoracic Surgery (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Physics & Mathematics (AREA)
- Physiology (AREA)
- Cardiology (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Psychiatry (AREA)
- Signal Processing (AREA)
- Vascular Medicine (AREA)
- Pulmonology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
본 명세서에서는, 프로세서에 의해 구현되는 균혈증 발병 위험도를 예측하는 방법으로서, 개체에 대한 생물학적 시험 데이터를 수신하는 단계, 생물학적 시험 데이터를 기초로 개체에 대한 균혈증 발병 위험도를 예측하도록 구성된 균혈증 예측 모델을 이용하여 개체의 균혈증 발병 위험도를 예측하는 단계를 포함하고, 생물학적 시험 데이터가 크레아틴 (Creatinine) 수치, 알부민 (Albumin) 수치, CRP (Creactive protein) 수치, WBC (white blood cell) 최소 수치, WBC 최고 수치, 혈소판 (Platelet) 수, 프로트롬빈 (Prothrombin) 시간 중 적어도 하나 및 ALP (Alkaline phosphatase) 수치를 포함하는, 균혈증 발병 위험도의 예측 방법 및 이를 이용한 균혈증 발병 위험도 예측용 디바이스가 제공된다.In the present specification, as a method of predicting the risk of developing bacteremia implemented by a processor, receiving biological test data for an individual, using a bacteremia prediction model configured to predict the risk of developing bacteremia for an individual based on the biological test data estimating the individual's risk of developing bacteremia, and the biological test data are creatine (Creatinine) level, albumin (Albumin) level, CRP (Creactive protein) level, WBC (white blood cell) minimum level, WBC maximum level, Provided are a method for predicting the risk of developing bacteremia, including at least one of a platelet count, a prothrombin time, and an alkaline phosphatase (ALP) level, and a device for predicting the risk of developing bacteremia using the same.
Description
본 발명은 균혈증 발병 위험도의 예측 방법 및 디바이스에 관한 것으로, 보다 구체적으로 개체로부터 획득한 다양한 임상 데이터를 기초로 균혈증 발병의 위험도를 예측하고 제공하도록 구성된 방법 및 이를 이용한 디바이스에 관한 것이다.The present invention relates to a method and a device for predicting the risk of developing bacteremia, and more particularly, to a method and a device using the same for predicting and providing the risk of developing bacteremia based on various clinical data obtained from an individual.
균혈증은 균이 혈액 속에 들어가서 온몸을 순환하고 있는 임상적 상태를 지칭할 수 있다. 이러한 균혈증은 세균이 세망 내피계의 제거 능력을 넘는 속도로 증식할 때 발생할 수 있다. Bacteremia may refer to a clinical condition in which bacteria enter the blood and circulate throughout the body. Such bacteremia can occur when the bacteria multiply at a rate that exceeds the clearing ability of the reticuloendothelial system.
이때, 균혈증은 임상적 양상에 따라, 일시적 균혈증과 간헐적 균혈증, 지속적 균혈증으로 구분될 수 있다. 보다 구체적으로, 일시적 균혈증은 전신성 또는 국소적 감염 초기에 발생하는 균혈증으로, 뇌막염, 폐렴, 화농성 관절염, 골수염, 임균 또는 수막구균 감염을 동반할 수 있다. 또한, 간헐적 균혈증은 복강, 골반강, 신장주위, 간, 전립선 등의 부위에 농양이 있을 때 발병될 수 있고, 지속적 균혈증은 세균성 심내막염과 혈관 내 카테테의 감염이 있을 때 발병될 수 있고 장티푸스, 부르셀라증을 동반할 수 있다. In this case, bacteremia may be divided into transient bacteremia, intermittent bacteremia, and persistent bacteremia according to clinical aspects. More specifically, transient bacteremia is bacteremia that occurs early in systemic or local infection, and may be accompanied by meningitis, pneumonia, suppurative arthritis, osteomyelitis, gonococcal or meningococcal infection. In addition, intermittent bacteremia can occur when there is an abscess in the abdominal cavity, pelvic cavity, perirenal, liver, prostate, etc., and persistent bacteremia can occur when bacterial endocarditis and intravascular catheter infection. It may accompany cellulosis.
한편, 균혈증의 치료 방법으로는 항생제의 사용이 있을 수 있으며 초기에 적절한 항생제를 경험적으로 사용하는 것이 균혈증에서 패혈증, 패혈성 쇼크로 진행하는 것을 막을 수 있다.On the other hand, as a treatment method for bacteremia, there may be the use of antibiotics, and the empirical use of appropriate antibiotics at an early stage can prevent bacteremia from progressing to sepsis and septic shock.
따라서, 균혈증의 발병 전 균혈증을 예측하는 것은 임상적으로 매우 중요할 수 있다.Therefore, predicting bacteremia before the onset of bacteremia may be of great clinical importance.
이에, 균혈증이 발생하기 전에 이를 미리 예측하고 빠른 조치를 취할 수 있는, 새로운 균혈증 발병 위험도 예측 시스템의 개발이 지속적으로 요구되고 있는 실정이다. Accordingly, there is a continuous need for the development of a new bacteremia risk prediction system that can predict bacteremia before it occurs and take quick measures.
발명의 배경이 되는 기술은 본 발명에 대한 이해를 보다 용이하게 하기 위해 작성되었다. 발명의 배경이 되는 기술에 기재된 사항들이 선행기술로 존재한다고 인정하는 것으로 이해되어서는 안 된다.
선행문헌: Bernard Hernanderz 외 7명, Supervised learning for infection risk inference using pathology data, BMC Medical Informatics and Decision Making (2017) 17:168The description underlying the invention has been prepared to facilitate understanding of the invention. It should not be construed as an admission that the matters described in the background technology of the invention exist as prior art.
Prior literature: Bernard Hernanderz et al. 7, Supervised learning for infection risk inference using pathology data, BMC Medical Informatics and Decision Making (2017) 17:168
한편, 본 발명의 발명자들은, 임상적으로 균혈증과 같은 어떠한 질환의 이환이 의심되는 상황이 도래되기 이전에 미리 인체의 생리학적 대응 반응의 일환으로 생체 신호들의 변화가 선행할 것이라는 점에 주목하였다. On the other hand, the inventors of the present invention noted that changes in biosignals will precede as a part of the physiological response of the human body in advance before a situation in which a morbidity of any disease, such as bacteremia, is clinically suspected.
보다 구체적으로, 본 발명의 발명자들은, 일반 병실 또는 중환자실에서 획득할 수 있는 다양한 임상 데이터의 변화가 균혈증과 같은 잠재적 질환과 연관성을 가질 수 있음에 주목하였다. More specifically, the inventors of the present invention noted that changes in various clinical data obtainable in a general ward or intensive care unit may be associated with a potential disease such as bacteremia.
특히, 본 발명의 발명자들은 균혈증이 외부적 환경에 의해 2 차적으로 야기될 수 있는 질환임에 주목하였고, 환자로부터 분리된 혈액과 같은 생물학적 시료의 분석 결과의 생물학적 시험 데이터뿐만 아니라, 다양한 생체 신호 데이터, 의료적 처치와 관련한 데이터들이 균혈증의 발병과 연관이 있음을 인지할 수 있었다.In particular, the inventors of the present invention have noted that bacteremia is a disease that can be caused secondary by an external environment, and not only biological test data of analysis results of biological samples such as blood isolated from a patient, but also various biosignal data , it could be recognized that the data related to medical treatment were related to the development of bacteremia.
나아가, 본 발명의 발명자들은, 혈액 속에서 균이 증식하여 발열, 저혈압 등의 중독 증상을 일으키는 패혈증과 구별되는, 균혈증의 예측의 정확도를 높이는 생물학적 특징을 탐색하고자 하였다. Furthermore, the inventors of the present invention tried to search for biological characteristics that increase the accuracy of prediction of bacteremia, which is distinguished from sepsis, which causes intoxication symptoms such as fever and low blood pressure by proliferation of bacteria in the blood.
그 결과, 본 발명의 발명자들은 개체로부터 획득한 생물학적 시험 데이터들 중 특히 ALP (Alkaline phosphatase) 수치와 함께 혈소판 수치가 균혈증의 발병과 연관이 있음을 발견할 수 있었다.As a result, the inventors of the present invention were able to discover that among the biological test data obtained from the subject, in particular, ALP (Alkaline phosphatase) and platelet levels were associated with the onset of bacteremia.
이에, 본 발명의 발명자들은, ALP (Alkaline phosphatase) 수치 및/또는 혈소판 수치를 포함하는 생물학적 시험 데이터와 함께 생체 신호 데이터, 임상적 특징 데이터들를 더욱 고려하여 균혈증 발병 위험도를 높은 신뢰도 및 정확도로 예측할 수 있는 균혈증 발병 위험도 예측 시스템을 개발하기에 이르렀다.Accordingly, the inventors of the present invention can predict the risk of developing bacteremia with high reliability and accuracy by further considering biosignal data and clinical characteristic data together with biological test data including ALP (Alkaline phosphatase) level and/or platelet level. We have developed a system for predicting the risk of developing bacteremia.
한편, 본 발명의 발명자들은, 새로운 균혈증 발병 위험도 예측 시스템에 생물학적 시험 데이터, 나아가 생체 신호 데이터, 임상적 특징 데이터들를 기초로 균혈증을 예측하도록 학습된 예측 모델을 적용할 수 있었다.Meanwhile, the inventors of the present invention were able to apply the learned predictive model to predict bacteremia based on biological test data, further biosignal data, and clinical feature data to a new bacteremia risk prediction system.
관련하여, 본 발명의 발명자들은, 다양한 임상 데이터 중 균혈증임을 예측하는 것에 영향력이 큰 임상 데이터 또는, 균혈증이 아닌 정상을 예측하는 것에 영향력이 큰 임상 데이터를 결정하도록 평가를 수행하였고, 이를 예측 모델의 학습에 적용하고자 하였다. 이를 통해, 본 발명의 발명자들은 예측 모델의 균혈증 예측의 진단 능력 향상을 기대할 수 있었다. In this regard, the inventors of the present invention performed evaluation to determine clinical data that has a large influence on predicting bacteremia among various clinical data or clinical data that has a large influence on predicting normal rather than bacteremia, and It was intended to be applied to learning. Through this, the inventors of the present invention could expect to improve the diagnostic ability of the predictive model to predict bacteremia.
결과적으로, 균혈증 예측 모델에 기초한 새로운 균혈증 발병 위험도 예측 시스템은, 개체에 대하여 정확도 및 신뢰도 높은 균혈증 진단 정보를 제공할 수 있었다.As a result, a new bacteremia risk prediction system based on a bacteremia prediction model could provide accurate and reliable bacteremia diagnosis information for an individual.
나아가, 본 발명의 발명자들은 이러한 균혈증 발병 위험도 예측 시스템 개발을 통해, 환자의 상태에 대하여 빠르게 감지하고 균혈증 발병 위험을 미리 인지하여, 환자에 대한 처치 시점을 앞당겨 균혈증의 치료 성과를 높일 수 있음을 기대할 수 있었다. 나아가, 본 발명의 발명자들은 균혈증 발병 위험도의 예측 시스템의 개발이 환자의 생존률 증가, 합병증 예방, 및 치료 비용의 감소 효과를 제공할 수 있다는 것을 더욱 기대할 수 있었다. Furthermore, the inventors of the present invention expect that, through the development of such a bacteremia risk prediction system, the patient's condition can be quickly sensed and the risk of bacteremia development can be recognized in advance, and the treatment time for the patient can be advanced to improve the treatment performance of bacteremia. could Furthermore, the inventors of the present invention could further expect that the development of a system for predicting the risk of developing bacteremia could provide the effects of increasing the survival rate of patients, preventing complications, and reducing treatment costs.
또한, 본 발명의 발명자들은, 보호자 또는 의료진이 중환자와 같은 지속적인 모니터링이 요구되는 개체에 대하여 보다 용이하게 균혈증 발병 고 위험군을 인지할 수 있도록, 개체에 대하여 예측 모델에 의해 균혈증이 예측될 경우, 알람을 제공하여 균혈증 발병 위험도를 알리도록 구성하였다. In addition, the inventors of the present invention, if bacteremia is predicted by the predictive model for the individual, so that the guardian or medical staff can more easily recognize the high-risk group for the occurrence of bacteremia for the individual requiring continuous monitoring, such as a critically ill patient, alarm provided to inform the risk of developing bacteremia.
이에, 본 발명이 해결하고자 하는 과제는, 수신된 개체에 대한 생물학적 시험 데이터, 나아가 생체 신호 데이터, 임상적 특징 데이터를 기초로, 균혈증 발병 위험도를 예측하도록 구성된 균혈증 예측 모델을 이용하여, 개체에 대한 균혈증 발병 위험도를 예측하도록 구성된, 균혈증 발병 위험도 예측 방법을 제공하는 것이다. Accordingly, the problem to be solved by the present invention is to use a bacteremia prediction model configured to predict the risk of developing bacteremia based on the received biological test data, further biosignal data, and clinical characteristic data for the individual, To provide a method for predicting the risk of developing bacteremia, configured to predict the risk of developing bacteremia.
본 발명이 해결하고자 하는 또 다른 과제는, 개체에 대한 생물학적 시험 데이터, 나아가 생체 신호 데이터, 임상적 특징 데이터를 수신하도록 구성된 수신부, 및 수신부와 통신하도록 연결되고 예측 모델에 기초하여 개체에 균혈증 발병 위험도를 예측하도록 구성된 프로세서를 포함하는, 균혈증 발병 위험도 예측용 디바이스를 제공하는 것이다. Another problem to be solved by the present invention is a receiving unit configured to receive biological test data for the subject, further biosignal data, clinical characteristic data, and the risk of developing bacteremia in the subject based on the predictive model and connected to communicate with the receiving unit It is to provide a device for predicting the risk of developing bacteremia, including a processor configured to predict.
본 발명의 과제들은 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The problems of the present invention are not limited to the problems mentioned above, and other problems not mentioned will be clearly understood by those skilled in the art from the following description.
전술한 바와 같은 과제를 해결하기 위해, 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측 방법이 제공된다. 이때, 본 발명의 균혈증 예측 방법은, 프로세서에 의해 구현되는 균혈증 발병 위험도를 예측하도록 구성된 것으로, 개체에 대한 생물학적 시험 데이터를 수신하는 단계, 생물학적 시험 데이터를 기초로 개체에 대한 균혈증 발병 위험도를 예측하도록 구성된 균혈증 예측 모델을 이용하여, 개체의 균혈증 발병 위험도를 예측하는 단계를 포함한다In order to solve the problems as described above, a method for predicting the risk of developing bacteremia according to an embodiment of the present invention is provided. At this time, the bacteremia prediction method of the present invention is configured to predict the risk of developing bacteremia implemented by the processor, receiving biological test data for the individual, and predicting the risk of developing bacteremia for the individual based on the biological test data predicting the risk of developing bacteremia in an individual using the constructed bacteremia prediction model.
이때 생물학적 시험 데이터는, 크레아틴 (Creatinine) 수치, 알부민 (Albumin) 수치, CRP (Creactive protein) 수치, WBC (white blood cell) 최소 수치, WBC 최고 수치, 혈소판 (Platelet) 수, 프로트롬빈 (Prothrombin) 시간 및 ALP (Alkaline phosphatase) 수치를 포함한다. In this case, the biological test data include Creatinine level, Albumin level, CRP (Creactive protein) level, WBC (white blood cell) minimum, WBC maximum, Platelet count, Prothrombin time and Includes alkaline phosphatase (ALP) levels.
본 발명의 특징에 따르면 본 발명의 균혈증 예측 방법은, 개체에 대한 생체 신호 데이터를 수신하는 단계를 더 포함할 수 있고, 균혈증 예측 모델은 생물학적 시험 데이터 및 생체 신호 데이터를 기초로 균혈증 발병 위험도를 예측하도록 더 구성될 수 있다. 이때, 생체 신호 데이터는, SBP (systolic blood pressure), DBP (diastolic blood pressure), 최고 체온, 최저 체온, 심박수 및 호흡수 중 적어도 하나일 수 있다.According to a feature of the present invention, the method for predicting bacteremia of the present invention may further include receiving biosignal data for an individual, and the bacteremia prediction model predicts the risk of developing bacteremia based on biological test data and biosignal data It can be further configured to do so. In this case, the biosignal data may be at least one of systolic blood pressure (SBP), diastolic blood pressure (DBP), maximum body temperature, minimum body temperature, heart rate, and respiration rate.
본 발명의 다른 특징에 따르면 본 발명의 균혈증 예측 방법은, 개체에 대한 임상적 특징 데이터를 수신하는 단계를 더 포함하고, 균혈증 예측 모델은 생물학적 시험 데이터 및 임상적 특징 데이터를 기초로 균혈증 발병 위험도를 예측하도록 더 구성될 수 있다. 이때, 임상적 특징 데이터는, 성별, 연령, 혈액 배양 기간, ICU (intensive care unit) 치료 여부, 중심 정맥 카테터 (Central venous catheter) 삽입 여부, 스테로이드 치료 여부 및 항생제 치료 여부 중 적어도 하나일 수 있다.According to another feature of the present invention, the bacteremia prediction method of the present invention further comprises the step of receiving clinical characteristic data for the subject, and the bacteremia prediction model determines the risk of developing bacteremia based on the biological test data and the clinical characteristic data. It may be further configured to predict. In this case, the clinical characteristic data may be at least one of gender, age, blood culture period, ICU (intensive care unit) treatment, central venous catheter insertion, steroid treatment, and antibiotic treatment.
본 발명의 또 다른 특징에 따르면, 생물학적 시험 데이터는, 크레아틴 수치, 알부민 수치, CRP 수치, WBC 최소 수치, WBC 최고 수치, 프로트롬빈 시간, 및 혈소판 수, ALP 수치를 포함할 수 있다.According to another feature of the present invention, the biological test data may include creatine level, albumin level, CRP level, WBC minimum level, WBC maximum level, prothrombin time, and platelet count, ALP level.
본 발명의 또 다른 특징에 따르면, 생물학적 시험 데이터는 ALT (alanine aminotransferase) 수치, 트롬포플라스틴 (thromboplastin) 의 응고 시간, AST (aspartate aminotransferase) 수치, CRP (C-reactive protein) 수치, 적혈구 침강 속도, FERR (ferritin) 수치, HMG (hemoglobin) 수치, PTINR (Prothrombin Time International Normalized Ratio), PTPER (Prothrombin Time (%)), PTSEC (Prothrombin Time (sec)), 적혈구 수치, TBIL (Total bilirubin) 수치, TCO2 (total carbon dioxide) 수치 및 백혈구 수치 중 적어도 하나를 더 포함According to another feature of the present invention, the biological test data are ALT (alanine aminotransferase) level, thromboplastin clotting time, AST (aspartate aminotransferase) level, CRP (C-reactive protein) level, erythrocyte sedimentation rate, FERR (ferritin) level, HMG (hemoglobin) level, PTINR (Prothrombin Time International Normalized Ratio), PTPER (Prothrombin Time (%)), PTSEC (Prothrombin Time (sec)), Red blood cell count, TBIL (Total bilirubin) level, TCO 2 (total carbon dioxide) and at least one of a white blood cell count
본 발명의 또 다른 특징에 따르면, 균혈증은, 급성 중증 균혈증 (acute severe bacteraemia) 일 수 있다.According to another feature of the present invention, the bacteremia may be acute severe bacteraemia.
본 발명의 또 다른 특징에 따르면, 균혈증 예측 모델은, MLP (multi-layer perceptron), SVM (support vector machine), RF (random forest), 및 복수의 모델의 조합으로 구성된 앙상블 모델, 선행 학습된 (pre-trained) 모델, Xgboost 모델 중 적어도 하나의 모델일 수 있다. According to another feature of the present invention, the bacteremia prediction model is an ensemble model consisting of a combination of multi-layer perceptron (MLP), support vector machine (SVM), random forest (RF), and a plurality of models, pre-trained ( It may be at least one of a pre-trained model and an Xgboost model.
본 발명의 또 다른 특징에 따르면, 균혈증 예측 모델은 또는 Xgboost 모델일 수 있다. 이때, MLP 모델은 128 노드 (nodes) 또는 256 노드를 갖는 단일의 히든 레이어 (hidden layer) 를 포함하거나, 단일의 히든 레이어가 복수로 존재하는 복수의 히든 레이어를 포함할 수 있다. According to another feature of the present invention, the bacteremia prediction model may be an Xgboost model. In this case, the MLP model may include a single hidden layer having 128 nodes or 256 nodes, or a plurality of hidden layers in which a single hidden layer exists in plurality.
본 발명의 또 다른 특징에 따르면, 균혈증 예측 모델은, 균혈증 발병 표본 개체 및 정상의 표본 개체에 대한 생물학적 실험 데이터, 생체 신호 데이터 및 임상적 특징 데이터로 구성된 학습용 데이터를 수신하는 단계, 및 학습용 데이터를 기초로, 균혈증 또는 정상을 예측하는 단계를 통해 학습된 모델일 수 있다. 이때, 정상의 표본 개체는, 임상적으로 균혈증 발생되지 않고 균혈증이 아닌 것으로 평가된 개체일 수 있다.According to another feature of the present invention, the bacteremia prediction model comprises the steps of: receiving learning data consisting of biological experimental data, biosignal data, and clinical characteristic data for a bacteremia-infected sample object and a normal sample object, and the learning data As a basis, it can be a model trained through the steps to predict bacteremia or normality. In this case, the normal sample subject may be an individual evaluated as not clinically bacteremia and not bacteremia.
본 발명의 또 다른 특징에 따르면, 본 발명의 균혈증 예측 방법은, 학습용 데이터를 수신하는 단계 이후에 수행되는 학습용 데이터를 평가하는 단계를 더 포함할 수 있다. 이때, 학습용 데이터를 평가하는 단계는, 학습용 데이터에 대하여 균혈증과의 관련도 (relevance) 점수를 산출하는 단계, 및 관련도 점수를 기초로, 미리 결정된 순위 내에 있는 균혈증 관련 학습용 데이터를 결정하는 단계를 포함할 수 있다.According to another feature of the present invention, the bacteremia prediction method of the present invention may further include the step of evaluating the learning data performed after the step of receiving the learning data. At this time, the step of evaluating the learning data includes calculating a relevance score with respect to the learning data, and determining the bacteremia-related learning data within a predetermined ranking based on the relevance score. may include
본 발명의 또 다른 특징에 따르면, 학습용 데이터를 평가하는 단계는, OOS (one-out search), LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), 및 SM (saliency map) 중 적어도 하나의 알고리즘에 기초하여, 학습용 데이터에 대하여 균혈증과의 관련도 점수를 산출하는 단계, 및 관련도 점수를 기초로, 미리 결정된 순위 내에 있는 균혈증 관련 학습용 데이터를 결정하는 단계를 포함할 수 있다.According to another feature of the present invention, the step of evaluating the learning data is OOS (one-out search), LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), and SM (saliency) map) based on at least one algorithm of, calculating a relevance score for the learning data with respect to bacteremia, and based on the relevance score, determining data for bacteremia-related learning within a predetermined ranking. can
본 발명의 또 다른 특징에 따르면, 본 발명의 균혈증 예측 방법은, 개체에 대하여 예측된 균혈증 발병 위험도를 제공하는 단계를 더 포함할 수 있다.According to another feature of the present invention, the method for predicting bacteremia of the present invention may further include providing a predicted risk of developing bacteremia for an individual.
본 발명의 또 다른 특징에 따르면, 균혈증 발병 위험도를 제공하는 단계는, 균혈증 예측 모델에 의해 개체에 대한 균혈증 발병 위험도가 예측될 경우, 위험 알림을 제공하는 단계를 포함할 수 있다.According to another feature of the present invention, the step of providing the risk of developing bacteremia may include providing a risk notification when the risk of developing bacteremia for an individual is predicted by the bacteremia prediction model.
본 발명의 또 다른 특징에 따르면, 균혈증 발병 위험도를 제공하는 단계는, 균혈증 예측 모델에 의해 개체에 대한 균혈증 발병 위험 확률을 산출하는 단계, 및 균혈증 발병 위험 확률을 제공하는 단계를 포함할 수 있다. According to another feature of the present invention, the step of providing the risk of developing bacteremia may include calculating a risk probability of developing bacteremia for an individual by a bacteremia prediction model, and providing the risk probability of developing bacteremia.
전술한 바와 같은 과제를 해결하기 위해, 본 발명의 다른 실시예에 따른 균혈증 발병 위험도의 예측용 디바이스가 제공된다. 이때, 본 발명의 균혈증 예측용 디바이스는, 개체에 대한 생물학적 시험 데이터를 수신하도록 구성된 수신부, 및 수신부와 연결된 프로세서를 포함한다. 이때, 프로세서는, 생물학적 시험 데이터를 기초로 개체에 대한 균혈증 발병 위험도를 예측하도록 구성된 균혈증 예측 모델을 이용하여, 개체의 균혈증 발병 위험도를 예측하도록 구성된다. 나아가, 생물학적 시험 데이터는, 크레아틴 (Creatinine) 수치, 알부민 (Albumin) 수치, CRP (Creactive protein) 수치, WBC (white blood cell) 최소 수치, WBC 최고 수치, 혈소판 (Platelet) 수, 프로트롬빈 (Prothrombin) 시간 및 ALP (Alkaline phosphatase) 수치를 포함한다.In order to solve the above problems, there is provided a device for predicting the risk of developing bacteremia according to another embodiment of the present invention. In this case, the device for predicting bacteremia of the present invention includes a receiver configured to receive biological test data for an individual, and a processor connected to the receiver. In this case, the processor is configured to predict the risk of developing bacteremia in the subject by using the bacteremia prediction model configured to predict the risk of developing bacteremia in the subject based on the biological test data. Furthermore, biological test data include Creatinine level, Albumin level, CRP (Creactive protein) level, WBC (white blood cell) minimum, WBC maximum, Platelet count, Prothrombin time. and Alkaline phosphatase (ALP) levels.
본 발명의 특징에 따르면, 수신부는, 개체에 대한 생체 신호 데이터를 수신하도록 더 구성되고, 균혈증 예측 모델은, 생물학적 시험 데이터 및 생체 신호 데이터를 기초로 균혈증 발병 위험도를 예측하도록 더 구성될 수 있다. 이때, 생체 신호 데이터는, SBP (systolic blood pressure), DBP (diastolic blood pressure), 최고 체온, 최저 체온, 심박수 및 호흡수 중 적어도 하나일 수 있다.According to a feature of the present invention, the receiving unit is further configured to receive biosignal data for the subject, and the bacteremia prediction model may be further configured to predict the risk of developing bacteremia based on the biological test data and the biosignal data. In this case, the biosignal data may be at least one of systolic blood pressure (SBP), diastolic blood pressure (DBP), maximum body temperature, minimum body temperature, heart rate, and respiration rate.
본 발명의 다른 특징에 따르면, 수신부는 개체에 대한 임상적 특징 데이터를 수신하도록 더 구성되고, 균혈증 예측 모델은 생물학적 시험 데이터 및 임상적 특징 데이터를 기초로 균혈증 발병 위험도를 예측하도록 더 구성될 수 있다. 이때, 임상적 특징 데이터는, 성별, 연령, 혈액 배양 기간, ICU (intensive care unit) 치료 여부, 중심 정맥 카테터 (Central venous catheter) 삽입 여부, 스테로이드 치료 여부 및 항생제 치료 여부 중 적어도 하나일 수 있다.According to another feature of the present invention, the receiving unit is further configured to receive clinical characteristic data for the subject, and the bacteremia prediction model may be further configured to predict the risk of developing bacteremia based on the biological test data and the clinical characteristic data. . In this case, the clinical characteristic data may be at least one of gender, age, blood culture period, ICU (intensive care unit) treatment, central venous catheter insertion, steroid treatment, and antibiotic treatment.
본 발명의 또 다른 특징에 따르면, 생물학적 시험 데이터는, 크레아틴 수치, 알부민 수치, CRP 수치, WBC 최소 수치, WBC 최고 수치, 프로트롬빈 시간, 및 혈소판 수, ALP 수치를 포함할 수 있다.According to another feature of the present invention, the biological test data may include creatine level, albumin level, CRP level, WBC minimum level, WBC maximum level, prothrombin time, and platelet count, ALP level.
본 발명의 또 다른 특징에 따르면, 생물학적 시험 데이터는, ALT 수치, 트롬포플라스틴의 응고 시간, AST 수치, CRP 수치, 적혈구 침강 속도, 페리틴 (Ferritin) 수치, 헤모글로빈 수치, PTINR, PTPER, PTSEC, 적혈구 수치, 총 빌리루빈 수치, TCO2 수치 및 백혈구 수치 중 적어도 하나를 더 포함할 수 있다.According to another feature of the present invention, the biological test data are: ALT level, thrompoplastin clotting time, AST level, CRP level, erythrocyte sedimentation rate, ferritin level, hemoglobin level, PTINR, PTPER, PTSEC, red blood cell It may further include at least one of a level, a total bilirubin level, a TCO 2 level, and a white blood cell level.
본 발명의 또 다른 특징에 따르면, 균혈증은, 급성 중증 균혈증 (acute severe bacteraemia) 일 수 있다.According to another feature of the present invention, the bacteremia may be acute severe bacteraemia.
본 발명의 또 다른 특징에 따르면, 균혈증 예측 모델은, MLP (multi-layer perceptron), SVM (support vector machine), RF (random forest), 및 복수의 모델의 조합으로 구성된 앙상블 모델, 선행 학습된 (pre-trained) 모델, Xgboost 모델 중 적어도 하나의 모델일 수 있다.According to another feature of the present invention, the bacteremia prediction model is an ensemble model consisting of a combination of multi-layer perceptron (MLP), support vector machine (SVM), random forest (RF), and a plurality of models, pre-trained ( It may be at least one of a pre-trained model and an Xgboost model.
본 발명의 또 다른 특징에 따르면, 균혈증 예측 모델은 MLP 모델 또는 Xgboost 모델일 수 있다. 이때, MLP 모델은 128 노드 (nodes) 또는 256 노드를 갖는 단일의 히든 레이어 (hidden layer) 를 포함하거나, 단일의 히든 레이어가 복수로 존재하는 복수의 히든 레이어를 포함할 수 있다.According to another feature of the present invention, the bacteremia prediction model may be an MLP model or an Xgboost model. In this case, the MLP model may include a single hidden layer having 128 nodes or 256 nodes, or a plurality of hidden layers in which a single hidden layer exists in plurality.
본 발명의 또 다른 특징에 따르면, 균혈증 예측 모델은, 균혈증 발병 표본 개체 및 정상의 표본 개체에 대한 생물학적 실험 데이터, 생체 신호 데이터 및 임상적 특징 데이터로 구성된 학습용 데이터를 수신하고, 학습용 데이터를 기초로, 균혈증 또는 정상을 예측하는 단계를 통해 학습된 모델일 수 있다. 이때, 정상의 표본 개체는, 임상적으로 균혈증 발생되지 않고 균혈증이 아닌 것으로 평가된 개체일 수 있다.According to another feature of the present invention, the bacteremia prediction model receives learning data consisting of biological experimental data, biosignal data, and clinical characteristic data for a bacteremia-infected sample object and a normal sample object, and based on the learning data, , it can be a model trained through the steps to predict bacteremia or normality. In this case, the normal sample subject may be an individual evaluated as not clinically bacteremia and not bacteremia.
본 발명의 또 다른 특징에 따르면, 개체에 대하여 예측된 균혈증 발병 위험도를 제공하도록 구성된 출력부를 더 포함할 수 있다.According to another feature of the present invention, it may further include an output unit configured to provide a predicted risk of developing bacteremia for the subject.
본 발명의 또 다른 특징에 따르면, 출력부는, 균혈증 예측 모델에 의해 개체에 대한 균혈증 발병 위험도가 예측될 경우, 위험 알림을 제공하도록 구성될 수 있다.According to another feature of the present invention, the output unit may be configured to provide a risk notification when the risk of developing bacteremia for an individual is predicted by the bacteremia prediction model.
본 발명의 또 다른 특징에 따르면, 균혈증 예측 모델은 개체에 대한 균혈증 발병 위험 확률을 산출하도록 더 구성될 수 있다. 나아가, 출력부는, 균혈증 발병 위험 확률을 제공하도록 더 구성될 수 있다. According to another feature of the present invention, the bacteremia prediction model may be further configured to calculate a risk probability of developing bacteremia for an individual. Furthermore, the output may be further configured to provide a probability of developing a bacteremia risk.
이하, 실시예를 통하여 본 발명을 보다 상세히 설명한다. 다만, 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것에 불과하므로 본 발명의 범위가 이들 실시예에 의해 한정되는 것으로 해석되어서는 아니 된다.Hereinafter, the present invention will be described in more detail through examples. However, since these examples are merely for illustrative purposes of the present invention, the scope of the present invention should not be construed as being limited by these examples.
본 발명은 개체에 대하여 약생물학적 시험 데이터, 나아가 생체 신호 데이터, 임상적 특징 데이터를 수신하고, 수신된 데이터 기반의 균혈증 발병 위험도 예측 시스템을 제공함으로써, 개체의 균혈증 발병 위험도에 대하여 빠르게 감지하고, 이와 연관된 정보를 제공할 수 있다. The present invention receives pharmacobiological test data, further biosignal data, and clinical characteristic data for an individual, and provides a system for predicting the risk of developing bacteremia based on the received data, thereby rapidly detecting the risk of developing bacteremia in an individual, Relevant information can be provided.
또한, 본 발명은, 생물학적 시험 데이터, 나아가 생체 신호 데이터, 임상적 특징 데이터들를 기초로 균혈증을 예측하도록 학습된 예측 모델을 적용한 예측 시스템을 제공함으로써, 정확도 및 신뢰도 높은 균혈증 발병의 예측 정보를 제공할 수 있다. In addition, the present invention provides a prediction system to which a prediction model learned to predict bacteremia based on biological test data, further biosignal data, and clinical characteristic data is applied, thereby providing predictive information of the onset of bacteremia with high accuracy and reliability. can
보다 구체적으로, 본 발명은, 다양한 임상 데이터 중 균혈증임을 예측하는 것에 영향력이 큰 임상 데이터 또는, 균혈증이 아닌 정상 상태를 예측하는 것에 영향력이 큰 임상 데이터를 결정하도록 평가를 수행하였고, 이를 예측 모델의 학습에 적용함으로써 균혈증 예측의 진단 능력 향상된 예측 시스템을 제공할 수 있다. More specifically, in the present invention, evaluation was performed to determine clinical data that has a large influence on predicting bacteremia among various clinical data or clinical data that has a large influence on predicting a normal state other than bacteremia, and By applying it to learning, it is possible to provide a predictive system with improved diagnostic ability of predicting bacteremia.
이에, 본 발명은, 패혈증과 구별되는 또는 패혈증과는 상이한 균혈증에 대하여 높은 신뢰도 및 정확도로 발병의 위험도를 예측할 수 있는 효과가 있다. Accordingly, the present invention has the effect of predicting the risk of onset with high reliability and accuracy for bacteremia that is distinct from sepsis or different from sepsis.
또한, 본 발명은, 개체에 대하여 예측 모델에 의해 균혈증이 예측될 경우, 알람을 제공하여 균혈증 발병 위험도를 알리도록 구성됨에 따라, 보호자 또는 의료진은 중환자와 같은 지속적인 모니터링이 요구되는 개체에 대하여 보다 용이하게 균혈증 발병 고 위험군을 인지할 수 있다.In addition, according to the present invention, when bacteremia is predicted by a predictive model for an individual, it is configured to provide an alarm to inform the risk of developing bacteremia. It is possible to recognize high-risk groups for developing bacteremia.
따라서, 본 발명은 균혈증에 대한 처치 시점을 앞당겨 치료에 대한 좋은 예후를 제공할 수 있다. Therefore, the present invention can provide a good prognosis for treatment by advancing the treatment time for bacteremia.
나아가, 본 발명은 균혈증 발병 개체의 생존률 증가, 합병증 예방, 및 치료 비용의 감소 효과를 제공할 수 있다.Furthermore, the present invention can provide the effects of increasing the survival rate of an individual with bacteremia, preventing complications, and reducing the cost of treatment.
본 발명에 따른 효과는 이상에서 예시된 내용에 의해 제한되지 않으며, 더욱 다양한 효과들이 본 명세서 내에 포함되어 있다.The effect according to the present invention is not limited by the contents exemplified above, and more various effects are included in the present specification.
도 1a는 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측 방법 및 디바이스에 기초한 균혈증 발병 위험도 예측 시스템을 예시적으로 도시한 것이다.
도 1b는 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측용 디바이스의 구성을 예시적으로 도시한 것이다.
도 2는 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측 방법의 절차를 예시적으로 도시한 것이다.
도 3a 및 3b는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 학습 데이터를 예시적으로 도시한 것이다.
도 3c는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 구성을 예시적으로 도시한 것이다.
도 3d는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 평가 방법을 예시적으로 도시한 것이다.
도 4a 및 4b는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대한 제1 평가 결과를 도시한 것이다.
도 4c 및 4d는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대한, 균혈증 예측의 영향력에 따른 임상 데이터들을 도시한 것이다.
도 4e 및 4f는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대한, 균혈증 예측의 영향력에 따른 임상 데이터들의 변화에 따른 성능 변화를 도시한 것이다.
도 5a 및 5b는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 제2 평가를 위한 학습 데이터 및 평가 데이터를 도시한 것이다.
도 5c 내지 5i는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대한 제2 평가 결과를 도시한 것이다.1A exemplarily illustrates a bacteremia risk prediction system based on a method and a device for predicting the risk of developing bacteremia according to an embodiment of the present invention.
1B exemplarily shows the configuration of a device for predicting the risk of developing bacteremia according to an embodiment of the present invention.
2 exemplarily shows a procedure of a method for predicting the risk of developing bacteremia according to an embodiment of the present invention.
3A and 3B exemplarily show training data of a bacteremia prediction model used in various embodiments of the present invention.
3C exemplarily shows the configuration of a bacteremia prediction model used in various embodiments of the present invention.
FIG. 3D exemplarily illustrates an evaluation method of a bacteremia prediction model used in various embodiments of the present invention.
4A and 4B show a first evaluation result for a bacteremia prediction model used in various embodiments of the present invention.
4c and 4d show clinical data according to the influence of bacteremia prediction on the bacteremia prediction model used in various embodiments of the present invention.
4e and 4f show performance changes according to changes in clinical data according to the influence of bacteremia prediction for the bacteremia prediction model used in various embodiments of the present invention.
5A and 5B show learning data and evaluation data for the second evaluation of the bacteremia prediction model used in various embodiments of the present invention.
5c to 5i show a second evaluation result for the bacteremia prediction model used in various embodiments of the present invention.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. Advantages and features of the present invention and methods of achieving them will become apparent with reference to the embodiments described below in detail in conjunction with the accompanying drawings. However, the present invention is not limited to the embodiments disclosed below, but will be implemented in various different forms, and only these embodiments allow the disclosure of the present invention to be complete, and common knowledge in the art to which the present invention pertains It is provided to fully inform those who have the scope of the invention, and the present invention is only defined by the scope of the claims.
본 발명의 실시예를 설명하기 위한 도면에 개시된 형상, 크기, 비율, 각도, 개수 등은 예시적인 것이므로 본 발명이 도시된 사항에 한정되는 것은 아니다. 또한, 본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명은 생략한다. 본 명세서 상에서 언급된 '포함한다', '갖는다', '이루어진다' 등이 사용되는 경우, '~만'이 사용되지 않는 이상 다른 부분이 추가될 수 있다. 구성요소를 단수로 표현한 경우에 특별히 명시적인 기재 사항이 없는 한 복수를 포함하는 경우를 포함한다.The shapes, sizes, proportions, angles, numbers, etc. disclosed in the drawings for explaining the embodiments of the present invention are exemplary, and thus the present invention is not limited to the illustrated matters. In addition, in describing the present invention, if it is determined that a detailed description of a related known technology may unnecessarily obscure the subject matter of the present invention, the detailed description thereof will be omitted. When 'including', 'having', 'consisting', etc. mentioned in this specification are used, other parts may be added unless 'only' is used. When a component is expressed in a singular, the case in which the plural is included is included unless otherwise explicitly stated.
구성요소를 해석함에 있어서, 별도의 명시적 기재가 없더라도 오차 범위를 포함하는 것으로 해석한다.In interpreting the components, it is interpreted as including an error range even if there is no separate explicit description.
본 발명의 여러 실시예들의 각각 특징들이 부분적으로 또는 전체적으로 서로 결합 또는 조합 가능하며, 당업자가 충분히 이해할 수 있듯이 기술적으로 다양한 연동 및 구동이 가능하며, 각 실시예들이 서로에 대하여 독립적으로 실시 가능할 수도 있고 연관 관계로 함께 실시 가능할 수도 있다.Each feature of the various embodiments of the present invention may be partially or wholly combined or combined with each other, and technically various interlocking and driving are possible, as will be fully understood by those skilled in the art, and each embodiment may be independently implemented with respect to each other, It may be possible to implement together in a related relationship.
본 명세서의 해석의 명확함을 위해, 이하에서는 본 명세서에서 사용되는 용어들을 정의하기로 한다.For clarity of interpretation of the present specification, terms used herein will be defined below.
본 명세서에서 사용되는 용어, "균혈증"은 혈류 속에 병원균이 살아서 순환하고 있는 임상적 상태를 의미한다. 이때, 균혈증은, 혈액 속에서 균이 증식하여 발열, 저혈압등의 중독 증상을 일으키는 '패혈증'과 상이하며 본 명세서에서는 패혈증과 균혈증을 구분된다.As used herein, the term “bacteremia” refers to a clinical condition in which pathogens live and circulate in the bloodstream. At this time, bacteremia is different from 'sepsis', in which bacteria proliferate in the blood and cause poisoning symptoms such as fever and low blood pressure, and in the present specification, sepsis and bacteremia are distinguished.
본 명세서에서 사용되는 용어, "개체"는 균혈증의 발병 위험도를 예측하고자 하는 대상을 의미할 수 있다. 한편, 본원 명세서 내에서 개체는 '환자' 또는 '중환자'일 수 있으나, 이에 제한되는 것은 아니며 균혈증 발병의 위험도를 예측하고자 하는 모든 대상을 포함할 수 있다.As used herein, the term "individual" may refer to a subject for which the risk of developing bacteremia is to be predicted. On the other hand, in the present specification, an individual may be a 'patient' or a 'critical patient', but is not limited thereto and may include any target for predicting the risk of developing bacteremia.
이때, 균혈증 발병 개체는 바실러스 종 (Bacillus spp.), 비리단스 그룹 스트렙토코커스 (Viridans group streptococci), CNS (coagulase-negative staphylococci) 등 샘플이 오염되는 경우 주로 나타나는 균들이 혈류에 존재하는 경우의 개체와는 상이할 수 있다.At this time, the bacteremia-infected subject is Bacillus spp. may be different.
본 명세서에서 사용되는 용어, "생물학적 시험 데이터"는 개체로부터 분리된 생물학적 시료, 예를 들어 혈액에 대한 임상 데이터를 의미할 수 있다.As used herein, the term “biological test data” may refer to clinical data on a biological sample isolated from a subject, for example, blood.
보다 구체적으로, 본원 명세서 내에 개시된 생물학적 시험 데이터는, 크레아틴 (Creatinine) 수치, 알부민 (Albumin) 수치, CRP (Creactive protein) 수치, WBC (white blood cell) 최소 수치, WBC 최고 수치, 혈소판 (Platelet) 수, 프로트롬빈 (Prothrombin) 시간 및 ALP (Alkaline phosphatase) 수치일 수 있다. More specifically, the biological test data disclosed in the present specification are, creatine (Creatinine) level, albumin (Albumin) level, CRP (Creactive protein) level, WBC (white blood cell) minimum level, WBC maximum level, platelet (Platelet) level , prothrombin time, and alkaline phosphatase (ALP) levels.
바람직하게 생물학적 시험 데이터는, ALP 수치, 혈소판 수치일 수 있으나, 이에 제한되는 것은 아니다. Preferably, the biological test data may be an ALP level or a platelet level, but is not limited thereto.
본 명세서에서 사용되는 용어, "생체 신호 데이터"는 활력 징후, 생명 징후로, 개체의 상태와 연관된 데이터를 의미할 수 있다. 이러한 생체 신호 데이터는, 개체의 균혈증 발병 위험도와 연관될 수 있다. As used herein, the term “biological signal data” refers to vital signs and vital signs, and may refer to data related to the condition of an individual. Such biosignal data may be correlated with the individual's risk of developing bacteremia.
이때, 생체 신호 데이터는 생체 신호 계측 장비로부터 측정된 개체에 대한 체온, 맥박, 산소 포화도, SBP (systolic blood pressure), DBP (diastolic blood pressure), 평균 혈압 및 호흡수일 수 있다. 바람직하게, 생체 신호 데이터는, SBP, 최고 체온, 최저 체온, 심박수 및 호흡수 중 적어도 하나일 수 있다. 그러나, 이에 제한되지 않고 생체 신호 데이터는, 개체의 건강 상태와 연관된 다양한 측정 데이터를 포함할 수 있다. In this case, the biosignal data may be body temperature, pulse, oxygen saturation, systolic blood pressure (SBP), diastolic blood pressure (DBP), mean blood pressure, and respiration rate of the individual measured by the biosignal measuring device. Preferably, the biosignal data may be at least one of SBP, maximum body temperature, minimum body temperature, heart rate, and respiration rate. However, the present invention is not limited thereto, and the biosignal data may include various measurement data related to a health state of an individual.
본 명세서에서 사용되는 용어, "임상적 특징 데이터"는 개체의 특징, 예를 들어 성별, 연령과 함께 약물 투여 여부, 의료적 처치 여부에 대한 데이터를 포괄하여 의미할 수 있다. As used herein, the term “clinical characteristic data” may encompass data on whether or not a drug is administered along with an individual's characteristics, for example, gender and age, and whether or not a medical treatment is performed.
한편, 본원 명세서 내 개시된 임상적 특징 데이터는, 성별, 연령, 혈액 배양 기간, ICU (intensive care unit) 치료 여부, 중심 정맥 카테터 (Central venous catheter) 삽입 여부, 스테로이드 치료 여부 및 항생제 치료 여부 중 적어도 하나일 수 있다. 그러나, 임상적 특징 데이터는 이에 제한되지 않고, 개체에 투여되는 약물, 개체에 대한 의료적 처치에 대한 보다 다양한 데이터를 포함할 수 있다. On the other hand, the clinical characteristic data disclosed in the present specification is at least one of sex, age, blood culture period, ICU (intensive care unit) treatment, central venous catheter insertion, steroid treatment, and antibiotic treatment. can be However, the clinical characteristic data is not limited thereto, and may include more diverse data about a drug administered to the subject and medical treatment for the subject.
예를 들어, 임상적 특징 데이터는, 카테터 (Catheter), 폴리 (Foley), 기계환기 (Mechanical ventilator), 리스트레인트 (Restraint), 배액 기기 (Drainage) 중 적어도 하나의 의료적 처치 여부에 대한 데이터, 나아가 울트라셋 (Ultracet), 미다졸람 (Midazolam), 울티바 (ultiva), 포폴 (pofol), 아티반 (ativan), 펜타닐 (fentanyl), 프리세덱스 (precedex), IR 코돈 (IR codon), 타진 20/10 (TARGIN 20/10), 페리돌 (peridol), 리스페달 (risperdal), 자이프렉사 (zyprexa), 쎄로켈 (seroquel), 아빌리파이 (abilify), 페티딘 (pethidine), 듀로제식 패치 (durogesic patch), 모르핀 (morphine) 및 마이폴 (mypol) 의 투여 데이터를 더 포함할 수도 있다. For example, the clinical characteristic data is data on whether at least one of a catheter, Foley, mechanical ventilator, restraint, and drainage device is medically treated. , Ultracet, Midazolam, Ultiva, Pofol, Ativan, Fentanyl, Precedex, IR codon,
본 명세서에서 사용되는 용어, "균혈증 예측 모델"은 생물학적 시험 데이터, 생체 신호 데이터 및 임상적 특징 데이터 중 적어도 하나의 임상 데이터를 기초로 균혈증 발병의 위험도를 예측하도록 학습된 모델일 수 있다.As used herein, the term "bacteremia prediction model" may be a model trained to predict the risk of developing bacteremia based on clinical data of at least one of biological test data, biosignal data, and clinical characteristic data.
예를 들어, 균혈증 예측 모델은, 균혈증이 발병하거나 발병하지 않은 표본 개체로부터, 미리 결정된 시간마다 획득한 임상 데이터를 기초로 균혈증 발병의 위험도를 예측하도록 학습된 모델일 수 있다.For example, the bacteremia prediction model may be a model trained to predict the risk of developing bacteremia based on clinical data acquired every predetermined time from a sample subject with or without bacteremia.
이때, 균혈증 예측 모델은, 생물학적 시험 데이터, 생체 신호 데이터 및 임상적 특징 데이터의 모든 임상 데이터를 기초로 균혈증 발병 위험도를 예측하도록 학습된 모델일 수 있다. 그러나, 학습에 이용되는 데이터는, 이에 제한되지 않으며 보다 다양한 임상 데이터들의 조합이 상기 예측 모델의 학습에 이용될 수 있다. In this case, the bacteremia prediction model may be a model trained to predict the risk of developing bacteremia based on all clinical data of biological test data, biosignal data, and clinical characteristic data. However, the data used for learning is not limited thereto, and a combination of more various clinical data may be used for learning the predictive model.
한편, 본 발명의 균혈증 예측 모델은, MLP (Multi-Layer Perceptron), SVM (support vector machine), RF (random forest), 및 MLP, SVM, RF의 조합으로 구성된 앙상블 모델, 선행 학습된 (pre-trained) 모델, Xgboost 모델 중 적어도 하나의 모델에 기초할 수 있다. On the other hand, the bacteremia prediction model of the present invention, MLP (Multi-Layer Perceptron), SVM (support vector machine), RF (random forest), and an ensemble model consisting of a combination of MLP, SVM, RF, pre-trained (pre- trained) model and Xgboost model.
바람직하게, 본 발명의 균혈증 예측 모델은, 하나인 MLP (Multi-Layer Perceptron) 에 기초한 예측 모델일 수 있다. 이때, MLP 모델이 기초한 본 발명의 균혈증 예측 모델은, 128 노드 (nodes) 또는 256 노드를 갖는 히든 레이어 (hidden layer) 를 포함할 수 있다.Preferably, the bacteremia prediction model of the present invention may be a prediction model based on one MLP (Multi-Layer Perceptron). In this case, the bacteremia prediction model of the present invention based on the MLP model may include a hidden layer having 128 nodes or 256 nodes.
예를 들어, 본 발명의 균혈증 예측 모델은, 생물학적 시험 데이터, 생체 신호 데이너 및 임상적 특징 데이터가 입력되는 입력 레이어 및 균혈증 또는 균혈증이 아닌 정상을 예측하는 출력 레이어와 이들 레이어 사이에 128 노드 또는 256 노드를 갖는 히든 레이어가 존재하는 다층 레이어 구조의 예측 모델일 수 있다.For example, the bacteremia prediction model of the present invention includes an input layer to which biological test data, biosignal data, and clinical characteristic data are input, and an output layer that predicts bacteremia or normal non-bacteremia, and 128 nodes or 256 nodes between these layers. It may be a predictive model of a multi-layered layer structure in which a hidden layer having nodes exists.
보다 구체적으로, 본 발명의 균혈증 예측 모델은 학습에 있어서 매개 변수를 갱신하는 최적화 함수로서 'rmsprop'를 이용하도록 구성될 수 있고, 다양한 임상 데이터들의 입력 값이 출력값에 전달되는 강도를 결정하는 함수로서 'relu'함수를 이용하도록 구성될 수 있다.More specifically, the bacteremia prediction model of the present invention can be configured to use 'rmsprop' as an optimization function to update parameters in learning, and as a function to determine the strength of the input value of various clinical data transmitted to the output value. It can be configured to use the 'relu' function.
그러나, 본 발명의 균혈증 예측 모델의 구성은 이에 제한되는 것이 아니다.However, the configuration of the bacteremia prediction model of the present invention is not limited thereto.
본 발명의 다른 실시예에 따르면, 본 발명의 균혈증 예측 모델은, 128 노드의 단일 노드를 갖는 MLP 모델일 수도 있다. 나아가, 본 발명의 균혈증 예측 모델은, 128 노드를 갖는 히든 레이어가 를 갖는 2 층의 히든 레이어를 갖는 MLP 모델일 수도 있다.According to another embodiment of the present invention, the bacteremia prediction model of the present invention may be an MLP model having a single node of 128 nodes. Furthermore, the bacteremia prediction model of the present invention may be an MLP model having two hidden layers in which a hidden layer having 128 nodes has .
본 발명의 또 다른 실시예에 따르면, 본 발명의 균혈증 예측 모델은, gbtree 레이어를 갖는 Xgbooxt 모델일 수도 있다.According to another embodiment of the present invention, the bacteremia prediction model of the present invention may be an Xgbooxt model having a gbtree layer.
그러나, 본 발명의 균혈증 예측 모델의 종류는 전술한 것에 제한되는 것이 아니다. 예를 들어, 상기 예측 모델은, 보다 다양한 ANN (Artificial Neural Network) 모델, 또는 DNN (Deep Neural Network), CNN Convolutional Neural Network), RNN (Recurrent Neural Network), DCNN (Deep Convolutional Neural Network), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), SSD (Single Shot Detector) 모델, U-net을 기반으로 하는 예측 모델일 수도 있다.However, the types of the bacteremia prediction model of the present invention are not limited to those described above. For example, the prediction model is a more diverse ANN (Artificial Neural Network) model, or DNN (Deep Neural Network), CNN Convolutional Neural Network), RNN (Recurrent Neural Network), DCNN (Deep Convolutional Neural Network), RBM ( Restricted Boltzmann Machine), DBN (Deep Belief Network), SSD (Single Shot Detector) model, it can also be a predictive model based on U-net.
한편, 본 발명의 균혈증 예측 모델의 학습에 있어서, 균혈증이 아닌 정상을 예측하는 것에 영향력이 큰 임상 데이터들이 결정되는 평가가 수행될 수 있다. 이때, 영향력 평가는 OOS (one-out search), LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), 및 SM (saliency map) 중 적어도 하나의 알고리즘에 기초하여 수행될 수 있다. On the other hand, in the learning of the bacteremia prediction model of the present invention, evaluation may be performed in which clinical data having a large influence on predicting normal, not bacteremia, is determined. At this time, the influence evaluation is to be performed based on at least one algorithm of OOS (one-out search), LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), and SM (saliency map). can
예를 들어, 상기 적어도 하나의 알고리즘에 의해 생물학적 시험 데이터, 생체 신호 데이터 및 임상적 특징 데이터의 다양한 임상 데이터 중 균혈증임을 예측하는 것에 영향력이 큰 임상 데이터 또는, 균혈증이 아닌 정상을 예측하는 것에 영향력이 큰 임상 데이터가 결정될 수 있다. For example, by the at least one algorithm, among various clinical data of biological test data, biosignal data, and clinical characteristic data, clinical data having a large influence on predicting bacteremia or predicting normality other than bacteremia has an influence. Large clinical data can be determined.
이러한 영향력이 큰 임상 데이터들이 상기 예측 모델의 학습에 입력 데이터로서 적용될 수 있음에 따라, 예측 모델은 다른 모델들 보다 균혈증 예측 능력이 향상된 모델일 수 있다. As the clinical data having a large influence can be applied as input data to the learning of the predictive model, the predictive model may be a model with improved bacteremia predictive ability than other models.
이하에서는 도 1a 및 1b를 참조하여, 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측용 디바이스 및 이를 이용한 균혈증 발병 위험도 예측 시스템에 관하여 구체적으로 설명한다.Hereinafter, a device for predicting the risk of developing bacteremia and a system for predicting the risk of developing bacteremia using the device according to an embodiment of the present invention will be described in detail with reference to FIGS. 1A and 1B .
도 1a는 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측 방법 및 디바이스에 기초한 균혈증 발병 위험도 예측 시스템을 예시적으로 도시한 것이다. 도 1b는 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측용 디바이스의 구성을 예시적으로 도시한 것이다.1A exemplarily illustrates a bacteremia risk prediction system based on a method and a device for predicting the risk of developing bacteremia according to an embodiment of the present invention. 1B exemplarily shows the configuration of a device for predicting the risk of developing bacteremia according to an embodiment of the present invention.
도 1a를 참조하면, 본 발명의 일 실시예에 따른 균혈증 발병 위험도 예측 시스템 (1000) 은, 균혈증 발병 위험도 예측용 디바이스 (100), 개체 (200) 에 대하여 획득된, 생물학적 시험 데이터 (310), 생체 신호 데이터 (320), 임상적 특징 데이터 (330) 를 포함하는 임상 데이터 (300), 의료적 처치 기구 (400) 및 의료진 디바이스 (500) 로 구성되어 있다.Referring to FIG. 1A , the bacteremia
이때, 임상 데이터 (300) 는 개체 (200) 로부터, 임의의 시점에서 평가된 데이터일 수 있다. 그러나, 이에 제한되는 것은 아니다.In this case, the
보다 구체적으로, 균혈증 발병 위험도 예측 시스템 (1000) 에서 균혈증 발병 위험도 예측용 디바이스 (100) 는, 개체 (200) 에 대하여 측정되거나 평가된 다양한 임상 데이터 (300) 를 수신하고, 이를 기초로 균혈증 발병 위험도를 예측하도록 구성될 수 있다. More specifically, the
이때, 의료적 처치 기구 (400) 는 개체 (200) 에 온도, 맥박, 산소 포화도, 수축기 혈압, 이완기 혈압, 평균 혈압 및 호흡수로 이루어진 그룹 중 적어도 하나의 생체 신호 데이터 (320) 를 제공할 수 있는 생체 신호 측정 디바이스일 수 있다. In this case, the
한편, 균혈증 발병 위험도 예측 시스템 (1000) 에서 생물학적 시험 데이터 (310), 나아가 임상적 특징 데이터 (330) 는 EMR (Electronic Medical Record) 시스템과 같은 외부 시스템으로부터 획득될 수도 있다.Meanwhile, in the bacteremia
보다 구체적으로, 도 1b를 참조하면, 균혈증 발병 위험도 예측용 디바이스 (100) 는 수신부 (110), 입력부 (120), 출력부 (130), 저장부 (140) 및 프로세서 (150) 를 포함한다. More specifically, referring to FIG. 1B , the
구체적으로 수신부 (110) 는 개체 (200) 에 대한 생물학적 시험 데이터 (310), 생체 신호 데이터 (320), 임상적 특징 데이터 (330) 를 포함하는 임상 데이터 (300) 를 수신하도록 구성될 수 있다. Specifically, the
본 발명의 특징에 따르면, 수신부 (110) 는 의료진 디바이스 (500) 에 대하여, 후술될 프로세서 (150) 에 의해 결정된 개체 (200) 에 대하여 예측된 결과를, 송신하도록 더 구성될 수 있다.According to a feature of the present invention, the receiving
입력부 (120) 는 키보드, 마우스, 터치 스크린 패널 등 제한되지 않는다. 입력부 (120) 는 균혈증 발병 위험도 예측용 디바이스 (100) 를 설정하고, 균혈증 발병 위험도 예측용 디바이스 (100) 의 동작을 지시할 수 있다. The
한편, 출력부 (130) 는 수신부 (110) 에 의해 수신된 다양한 임상 데이터 (300) 를 표시할 수 있다. 나아가, 출력부 (130) 는 프로세서 (150) 에 의해 예측된 균혈증 진단과 연관된 정보를 디스플레이 적으로 표시할 수 있다. 나아가, 출력부 (130) 는 프로세서 (150) 에 의해 균혈증 발병 위험도가 높은 것으로 결정될 경우, 알림 소리를 출력하도록 더 구성될 수 있다. Meanwhile, the
저장부 (140) 는 수신부 (110) 를 통해 수신한 개체 (200) 에 대한 다양한 임상 데이터 (300) 를 저장하고, 입력부 (120) 를 통해 설정된 균혈증 발병 위험도 예측용 디바이스 (100) 의 지시를 저장하도록 구성될 수 있다. 나아가, 저장부 (140) 는 후술될 프로세서 (150) 에 의해 생성된 개체 (200) 에 균혈증 예측 정보를 저장하도록 구성된다. 그러나, 전술한 것에 제한되지 않고 저장부 (140) 는 균혈증 발병 위험도 예측을 위해 프로세서 (150) 에 의해 결정된 다양한 정보들을 저장할 수 있다. The
프로세서 (150) 는 균혈증 발병 위험도 예측용 디바이스 (110) 의 정확한 예측 결과를 제공하기 위한 구성 요소일 수 있다. 이때, 정확한 균혈증 발병 위험도 예측을 위해 프로세서 (150) 는 다양한 임상 데이터 (300) 를 기초로 균혈증 발병 위험도를 예측하도록 구성된 예측 모델에 기초할 수 있다. The
한편, 프로세서 (150) 는, 개체 (200) 가 균혈증 예측 모델에 의해 균혈증 발병 고위험군으로 예측된 경우 의료진 디바이스 (500) 에 알림을 제공하도록 구성될 수도 있다. 이에, 의료진은 개체 (200) 에 대한 빠른 조치를 취할 수 있다. Meanwhile, the
이와 같이 본 발명의 균혈증 발병 위험도 예측 시스템 (1000) 은, 개체 (200) 에 대하여 균혈증의 조기 진단 및 균혈증의 조기 치료를 제공할 수 있음에 따라, 다양한 의료 시스템에 적용될 수 있다. As described above, the
이하에서는 도 2를 참조하여, 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측 방법을 구체적으로 설명한다. 도 2는, 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측 방법의 절차를 예시적으로 도시한 것이다.Hereinafter, a method of predicting the risk of developing bacteremia according to an embodiment of the present invention will be described in detail with reference to FIG. 2 . 2 exemplarily shows a procedure of a method for predicting the risk of developing bacteremia according to an embodiment of the present invention.
도 2를 참조하면, 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측 방법은, 먼저 개체로부터 생물학적 시험 데이터를 수신하고 (S210), 생물학적 시험 데이터를 기초로 균혈증 발병 위험도를 예측하도록 구성된 균혈증 예측 모델을 이용하여, 개체에 대한 균혈증 발병 위험도를 예측한다 (S220). 최종적으로 개체에 대하여 예측된 균혈증 발병 위험도를 제공한다 (S230).Referring to FIG. 2 , in the method of predicting the risk of developing bacteremia according to an embodiment of the present invention, first receiving biological test data from an individual (S210), and predicting bacteremia configured to predict the risk of developing bacteremia based on the biological test data Using the model, the risk of developing bacteremia for an individual is predicted (S220). Finally, it provides the predicted risk of developing bacteremia for the individual (S230).
보다 구체적으로, 데이터를 수신하는 단계 (S210) 에서, 크레아틴 (Creatinine) 수치, 알부민 (Albumin) 수치, CRP (Creactive protein) 수치, WBC (white blood cell) 최소 수치, WBC 최고 수치, 혈소판 (Platelet) 수, 프로트롬빈 (Prothrombin) 시간 중 적어도 하나 및 ALP (Alkaline phosphatase) 수치의 생물학적 시험 데이터가 수신될 수 있다.More specifically, in the step of receiving data (S210), creatine (Creatinine) level, albumin (Albumin) level, CRP (Creactive protein) level, WBC (white blood cell) minimum level, WBC maximum level, platelet (Platelet) Biological test data of at least one of water, Prothrombin time, and Alkaline phosphatase (ALP) levels may be received.
본 발명의 특징에 따르면, 데이터를 수신하는 단계 (S210) 에서, SBP (systolic blood pressure), 최고 체온, 최저 체온, 심박수 및 호흡수 중 적어도 하나의 생체 신호 데이터가 더 수신될 수 있다.According to a feature of the present invention, in the step of receiving the data ( S210 ), biosignal data of at least one of a systolic blood pressure (SBP), a maximum body temperature, a minimum body temperature, a heart rate, and a respiration rate may be further received.
본 발명의 다른 특징에 따르면, 데이터를 수신하는 단계 (S210) 에서, 성별, 연령, 혈액 배양 기간, ICU (intensive care unit) 치료 여부, 중심 정맥 카테터 (Central venous catheter) 삽입 여부, 스테로이드 치료 여부 및 항생제 치료 여부 중 적어도 하나의 임상적 특징 데이터가 더 수신될 수 있다. According to another feature of the present invention, in the step of receiving data (S210), gender, age, blood culture period, intensive care unit (ICU) treatment, central venous catheter insertion, steroid treatment, and At least one clinical characteristic data of whether antibiotic treatment is performed may be further received.
본 발명의 특징에 따르면, 데이터를 수신하는 단계 (S210) 에서 수신된 생체 신호 데이터는, ALP 수치, 혈소판 수일 수 있으나, 이에 제한되는 것은 아니다.According to a feature of the present invention, the biosignal data received in the step of receiving the data ( S210 ) may be an ALP level or a platelet count, but is not limited thereto.
다음으로, 균혈증 발병 위험도를 예측하는 단계 (S220) 에서는, 균혈증 발병 위험도를 예측하도록 구성된 균혈증 예측 모델에 의해 개체가 균혈증 또는 균혈증이 아닌 정상으로 결정될 수 있다.Next, in the step of predicting the risk of developing bacteremia ( S220 ), the subject may be determined to be normal, not bacteremia or bacteremia, by the bacteremia prediction model configured to predict the risk of developing bacteremia.
이때, 균혈증 예측 모델은, 데이터를 수신하는 단계 (S210) 에서 수신된, 생물학적 시험 데이터, 생체 신호 데이터, 및 임상적 특징 데이터 중 적어도 하나의 임상 데이터를 기초로 균혈증 발병의 위험도를 예측하도록 학습된 모델일 수 있다.At this time, the bacteremia prediction model is trained to predict the risk of developing bacteremia based on at least one clinical data of biological test data, biosignal data, and clinical characteristic data, received in the step of receiving data ( S210 ). can be a model.
예를 들어, 균혈증 예측 모델은 균혈증 발병 표본 개체 및 정상의 표본 개체에 대한 생물학적 시험 데이터, 생체 신호 데이터, 및 임상적 평가 데이터 중 적어도 하나의 학습용 데이터를 수신하고, 학습용 데이터를 기초로, 균혈증 또는 정상을 예측 또는 분류하는 단계를 통해 학습된 모델일 수 있다.For example, the bacteremia prediction model receives training data of at least one of biological test data, biosignal data, and clinical evaluation data for a sample subject having bacteremia and a sample subject to normal, and based on the training data, bacteremia or It may be a model trained through the step of predicting or classifying normal.
나아가, 균혈증 예측 모델은, 학습용 데이터에 대하여 균혈증과의 관련도 (relevance) 점수를 산출하고, 관련도 점수를 기초로, 미리 결정된 순위 내에 있는 균혈증 관련 학습용 데이터를 결정하는 단계를 통해 결정된 균혈증 관련 학습용 데이터를 기초로, 균혈증 발병 위험도를 예측하도록 구성된 모델일 수 있다.Furthermore, the bacteremia prediction model calculates a relevance score with bacteremia for the learning data, and, based on the relevance score, determines the bacteremia-related learning data within a predetermined rank for bacteremia-related learning determined through the steps Based on the data, it may be a model configured to predict the risk of developing bacteremia.
본 발명의 다른 특징에 따르면, 본 발명의 균혈증 예측 모델은, MLP (multi-layer perceptron), SVM (support vector machine), RF (random forest), 및 상기 MLP, 상기 SVM, 상기 RF의 조합으로 구성된 앙상블 모델 중 적어도 하나의 모델일 수 있다. According to another feature of the present invention, the bacteremia prediction model of the present invention is composed of a multi-layer perceptron (MLP), a support vector machine (SVM), a random forest (RF), and a combination of the MLP, the SVM, and the RF. It may be at least one model among ensemble models.
본 발명의 또 다른 특징에 따르면, 균혈증 예측 모델은, 128 노드 (nodes) 또는 256 노드를 갖는 히든 레이어 (hidden layer) 로 구성된 MLP 모델일 수 있으나, 이에 제한되는 것은 아니다. According to another feature of the present invention, the bacteremia prediction model may be an MLP model consisting of a hidden layer having 128 nodes or 256 nodes, but is not limited thereto.
마지막으로, 균혈증 발병 위험도를 제공하는 단계 (S230) 에서는, 전술한 균혈증 발병 위험도를 예측하는 단계 (S220) 에서 예측된 균혈증 진단에 관한 정보를 제공할 수 있다.Finally, in the step of providing the risk of developing bacteremia ( S230 ), information on the diagnosis of bacteremia predicted in the step of predicting the risk of developing bacteremia ( S220 ) may be provided.
본 발명의 다른 특징에 따르면, 균혈증 발병 위험도를 제공하는 단계 (S230) 에서는, 균혈증 발병 위험도를 예측하는 단계 (S220) 에서 균혈증 예측 모델에 의해 개체에 대한 균혈증 발병 위험도가 예측될 경우, 개체에 대한 균혈증 발병의 위험 알림이 제공될 수 있다. According to another feature of the present invention, in the step of providing the risk of developing bacteremia (S230), the risk of developing bacteremia for the individual is predicted by the bacteremia prediction model in the step (S220) of predicting the risk of developing bacteremia. A warning of the risk of developing bacteremia may be provided.
한편, 균혈증 발병 위험도를 제공하는 단계 (S230) 에서는, 전술한 것 이외에 보다 다양한 정보가 제공될 수 있다. 예를 들어, 균혈증 발병 위험도를 제공하는 단계 (S230) 에서는, 균혈증 교정에 효과적일 수 있는 추가적 처치 정보를 더 제공할 수 있다. On the other hand, in the step (S230) of providing the risk of developing bacteremia, a variety of information other than those described above may be provided. For example, in the step of providing the risk of developing bacteremia ( S230 ), additional treatment information that may be effective in correcting bacteremia may be further provided.
이상의 절차에 따라, 본 발명의 일 실시예에 따른 균혈증 발병 위험도 예측 방법은, 실시간으로 개체에 대한 균혈증 발병 여부를 결정하거나, 균혈증 발병의 위험도를 미리 예측하여, 균혈증 발병 위험도에 대한 정보, 나아가 균혈증 고위험군을 알리는 알람를 제공할 수 있다. 이에, 의료진은 개체에 대한 균혈증의 조기 진단이 가능할 수 있다. 나아가, 의료진은 균혈증 고위험군에 대한 빠른 조치를 취할 수 있다. According to the above procedure, the method for predicting the risk of developing bacteremia according to an embodiment of the present invention determines whether or not the onset of bacteremia for an individual in real time or predicts the risk of onset of bacteremia in advance, information on the risk of developing bacteremia, furthermore, bacteremia It can provide an alarm to notify the high-risk group. Accordingly, the medical staff may be able to diagnose bacteremia early in the subject. Furthermore, medical staff can take quick action for high-risk groups of bacteremia.
이하에서는, 도 3a 내지 3d를 참조하여, 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대하여 구체적으로 설명한다. Hereinafter, a bacteremia prediction model used in various embodiments of the present invention will be described in detail with reference to FIGS. 3A to 3D .
도 3a 및 3b는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 학습 데이터를 예시적으로 도시한 것이다.3A and 3B exemplarily show training data of a bacteremia prediction model used in various embodiments of the present invention.
도 3a를 참조하면, 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 학습을 위해 강남세브란스 병원으로부터 획득한 13402 명의 환자로부터 획득한 22332 개의 혈액 배양 에피소드 (episode) 를 수집하였고, 이들 중 1260 개의 균혈증 개체에 대한 에피소드 및 1260 개의 정상의 개체에 대한 에피소드를 학습용 데이터로 설정하였다. 이에, 본 발명의 균혈증 예측 모델은, 1 : 1 비율의 양성 결과 및 음성 결과 데이터를 기초로 균혈증을 예측하도록 학습되었다. Referring to FIG. 3A , 22332 blood culture episodes obtained from 13402 patients obtained from Gangnam Severance Hospital were collected for learning the bacteremia prediction model used in various embodiments of the present invention, and 1260 of them were collected. Episodes for bacteremia subjects and episodes for 1260 normal subjects were set as training data. Accordingly, the bacteremia prediction model of the present invention was trained to predict bacteremia based on positive and negative result data in a 1:1 ratio.
도 3b를 참조하면, 균혈증 발병 개체 및 정상 개체의 표본 개체로부터 획득된 학습용 데이터는, 생체 신호 데이터, 생물학적 시험 데이터, 및 임상적 특징 데이터로 구성된다. 이들 데이터 각각의 값은, 균혈증 발병 개체 및 정상 개체에 대하여 통계적으로 유의한 수준으로 차이나는 것으로 나타난다. Referring to FIG. 3B , learning data obtained from specimens of bacteremia-infected individuals and normal individuals are composed of biosignal data, biological test data, and clinical characteristic data. The values of each of these data appear to differ at a statistically significant level for bacteremia-affected individuals and normal individuals.
보다 구체적으로, 학습용 생체 신호 데이터는 SBP, 최고 체온, 최저 체온, 심박수 및 호흡수로 구성될 수 있다. 학습용 생물학적 시험 데이터는, 크레아틴 수치, 알부민 수치, CRP 수치, WBC 최소 수치, WBC 최고 수치, 혈소판 수, 프로트롬빈 시간 및 ALP 수치로 구성될 수 있다. 나아가, 임상적 특징 데이터는, 혈액 배양 기간, ICU 치료 여부, 중심 정맥 카테터 여부, 스테로이드 치료 여부, 항생제 치료 여부, 연령 및 성별로 구성될 수 있다. More specifically, the biosignal data for learning may include SBP, maximum body temperature, minimum body temperature, heart rate, and respiration rate. The learning biological test data may consist of creatine level, albumin level, CRP level, WBC minimum level, WBC maximum level, platelet count, prothrombin time and ALP level. Furthermore, the clinical characteristic data may consist of blood culture period, ICU treatment, central venous catheter, steroid treatment, antibiotic treatment, age and gender.
이때, 임상적 특징 데이터 중, ICU 치료 여부 및 중심 정맥 카테터 처치 여부는 혈액 배양 당시에 평가된 데이터일 수 있고, 항생제 치료 여부는 혈액 배양 3주 이전에 평가된 데이터일 수 있으며, 스테로이드 치료 여부는 혈액 배양 2주 이전에 평가된 데이터일 수 있다. 이때, 생체 신호 데이터 및 생물학적 시험 데이터는 혈액 배양 72 시간 이전에 평가된 데이터일 수 있다. At this time, among the clinical characteristic data, whether ICU treatment and central venous catheter treatment may be data evaluated at the time of blood culture, antibiotic treatment may be data evaluated 3 weeks before blood culture, and whether steroid treatment is blood It may be data evaluated before 2 weeks of culture. In this case, the biosignal data and the biological test data may be data evaluated before 72 hours of blood culture.
본 발명의 균혈증 예측 모델은 상기와 같은 학습용 데이터를 기초로 표본 개체에 대한 균혈증의 발병 여부를 결정하도록 학습될 수 있다.도 3c는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 구성을 예시적으로 도시한 것이다.The bacteremia prediction model of the present invention may be trained to determine whether or not the occurrence of bacteremia in a sample object is based on the learning data as described above. FIG. 3C illustrates the configuration of a bacteremia prediction model used in various embodiments of the present invention It is shown hostilely.
도 3c를 참조하면, 본 발명의 균혈증 예측 모델은 다층 인공 신경망인 MLP 알고리즘에 기초한 예측 모델일 수 있다. Referring to FIG. 3C , the bacteremia prediction model of the present invention may be a prediction model based on an MLP algorithm, which is a multilayer artificial neural network.
보다 구체적으로, 본 발명의 균혈증 예측 모델은, ALP 수치 또는 혈소판 수치와 같은 생물학적 시험 데이터와 최고 체온과 같은 생체 신호 데이터, 임상적 특징 데이터가 입력되는 입력 레이어 및 균혈증 또는 균혈증이 아닌 정상을 예측하는 출력 레이어와 이들 레이어 사이에 1 개의 히든 레이어가 존재하는 다층 구조의 예측 모델일 수 있다.More specifically, the bacteremia prediction model of the present invention is an input layer to which biological test data such as ALP level or platelet level, biosignal data such as maximum body temperature, and clinical characteristic data are input, and predicts bacteremia or normal other than bacteremia. It may be a prediction model of a multi-layer structure in which an output layer and one hidden layer exist between these layers.
이때, 본 발명의 균혈증 예측 모델은, 128 개 또는 256 개의 노드로 구성된 1 개의 히든 레이어를 포함하도록 구성될 수 있다. 나아가, 상기 예측 모델은, 균혈증의 예측 학습에 있어서 예측의 오차를 최소화하는 가중치를 찾기 위한 파라미터일 수 있는 학습 비율 (learning rate) 값이 0.1로 설정될 수 있다. 또한, 예측의 오차를 최소화하며 학습 속도를 증가시키기 위한 파라미터 값인 모멘텀 (momenteum) 값이 0.95로 설정될 수 있다. 또한, 본 발명의 균혈증 예측 모델은, 학습에 있어서 매개 변수를 갱신하는 최적화 함수로서 'adadelta'를 이용하도록 구성될 수 있고, 다양한 임상 데이터들의 입력 값이 출력값에 전달되는 강도를 결정하는 함수로서 'tanh'함수를 이용하도록 구성될 수 있다.In this case, the bacteremia prediction model of the present invention may be configured to include one hidden layer composed of 128 or 256 nodes. Furthermore, in the predictive model, a learning rate value that may be a parameter for finding a weight that minimizes a prediction error in predictive learning of bacteremia may be set to 0.1. In addition, a momentum value, which is a parameter value for minimizing prediction error and increasing the learning rate, may be set to 0.95. In addition, the bacteremia prediction model of the present invention can be configured to use 'adadelta' as an optimization function to update parameters in learning, and ' It can be configured to use the tanh' function.
그러나, 본 발명의 균혈증 예측 모델의 종류는 이에 제한되는 것이 아니다. 예를 들어, 상기 예측 모델은, SVM (support vector machine), RF (random forest), 및 MLP, SVM, RF의 조합으로 구성된 앙상블 모델 중 적어도 하나의 모델일 수 있고, DNN, CNN, RNN, DCNN, RBM, DBN, SSD 모델 또는 U-net을 기반으로 하는 예측 모델일 수도 있다.However, the type of the bacteremia prediction model of the present invention is not limited thereto. For example, the prediction model may be at least one of a support vector machine (SVM), a random forest (RF), and an ensemble model consisting of a combination of MLP, SVM, and RF, and DNN, CNN, RNN, DCNN , RBM, DBN, SSD model, or a predictive model based on U-net.
한편, 본 발명의 균혈증 예측 모델의 학습에 있어서, 균혈증이 아닌 정상을 예측하는 것에 영향력이 큰 임상 데이터들이 결정되는 평가가 수행될 수 있다. 이때, 영향력 평가는 OOS (one-out search), LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), 및 SM (saliency map) 중 적어도 하나의 알고리즘에 기초하여 수행될 수 있다. On the other hand, in the learning of the bacteremia prediction model of the present invention, evaluation may be performed in which clinical data having a large influence on predicting normal, not bacteremia, is determined. At this time, the influence evaluation is to be performed based on at least one algorithm of OOS (one-out search), LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), and SM (saliency map). can
도 3d는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 평가 방법을 예시적으로 도시한 것이다.FIG. 3D exemplarily illustrates an evaluation method of a bacteremia prediction model used in various embodiments of the present invention.
이때, LRP 알고리즘에 기초한 임상 데이터의 평가를 예로 들어 설명하나, 평가 알고리즘은 전술한 바와 같이 보다 다양한 알고리즘에 기초하여 수행될 수 있다.At this time, the evaluation of clinical data based on the LRP algorithm will be described as an example, but the evaluation algorithm may be performed based on more various algorithms as described above.
도 3d를 참조하면, 다양한 임상 데이터에 기초하여 균혈증 예측 모델에 의해 균혈증 예측 결과가 출력되면, LRP 알고리즘에 기초한 평가가 수행될 수 있다. Referring to FIG. 3D , when a bacteremia prediction result is output by a bacteremia prediction model based on various clinical data, an evaluation based on the LRP algorithm may be performed.
보다 구체적으로, 본 평가에서는, LRP 알고리즘에 의해 ALP 수치, 혈소판 수와 같은 생물학적 시험 데이터, 최고 체온과 같은 생체 신호 데이터, 나아가 임상적 특징 데이터의 다양한 임상 데이터의 입력값과 균혈증 또는 균혈증이 아닌 정상으로의 출력값의 관련도 (relevance) 가 추정될 수 있다.More specifically, in this evaluation, the input value of various clinical data of ALP level, biological test data such as platelet count, biosignal data such as maximum body temperature, and further clinical characteristic data by the LRP algorithm and normal values other than bacteremia or bacteremia The relevance of the output value to .
보다 구체적으로, 다양한 임상 데이터의 입력값과 균혈증 또는 균혈증이 아닌 정상으로의 출력값의 관련도는 하기 [수학식 1]로 산출될 수 있다.More specifically, the relationship between the input value of various clinical data and the output value of bacteremia or normal non-bacteremia can be calculated by the following [Equation 1].
[수학식 1][Equation 1]
여기서, L은, 출력 레이어 값을 의미하고, Z ji 는 l+1번째 레이어와 l번째 레이어의 가중치, 및 l번째 레이어 입력 값의 곱을 의미할 수 있다 (). 나아가, b j 는 j번째 노드의 편향값을 의미할 수 있다.Here, L may mean an output layer value, and Z ji may mean the product of the weight of the l +1th layer and the lth layer, and the input value of the lth layer ( ). Further, b j may mean a bias value of the j-th node.
산출된 관련도 점수에 의해 다양한 임상 데이터 중, 패혈증과 상이한 균혈증임을 예측하는 것에 관련도가 큰 임상 데이터 또는, 균혈증이 아닌 정상을 예측하는 것에 영향력이 큰 임상 데이터가 결정될 수 있다. According to the calculated relevance score, among various clinical data, clinical data having a high relevance to predicting bacteremia different from sepsis or clinical data having a large influence in predicting normality other than bacteremia may be determined.
이러한 영향력이 큰 임상 데이터들이 상기 예측 모델의 학습에 입력 데이터로서 적용될 수 있음에 따라, 균혈증의 예측에 있어서 본 발명의 예측 모델은 다른 모델들 보다 균혈증 예측 능력이 우수할 수 있다.As clinical data having such a large influence can be applied as input data to the learning of the predictive model, the predictive model of the present invention may have superior bacteremia predictive ability than other models in predicting bacteremia.
실시예 1: 본 발명의 다양한 실시예에 따른 균혈증 예측 모델의 제1 평가Example 1: First evaluation of a bacteremia prediction model according to various embodiments of the present invention
이하에서는 4a 내지 4f를 참조하여 본 발명의 다양한 실시예에서 이용되는 균혈증 예측 모델의 제1 평가 결과에 대하여 구체적으로 설명한다. 도 4a 및 4b는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대한 제1 평가 결과를 도시한 것이다. Hereinafter, the first evaluation result of the bacteremia prediction model used in various embodiments of the present invention will be described in detail with reference to 4a to 4f. 4A and 4B show a first evaluation result for a bacteremia prediction model used in various embodiments of the present invention.
먼저, 도 4a를 참조하면, 생물학적 시험 데이터, 생체 신호 데이터 및 데이터를 기초로 균혈증 또는 균혈증이 아닌 정상을 예측하도록 구성된 균혈증 예측 모델의 평가 결과가 도시된다.First, referring to FIG. 4A , evaluation results of a bacteremia prediction model configured to predict bacteremia or normal other than bacteremia based on biological test data, biosignal data, and data are shown.
이때, 본 발명의 균혈증 예측 모델은, 128 개의 노드를 갖는 히든 레이어로 구성된 MLP 모델 (본 발명의 균혈증 예측 모델 (A)), 256 개의 노드를 갖는 히든 레이어로 구성된 MLP 모델 (본 발명의 균혈증 예측 모델 (B)), 랜덤 포레스트의 분류 모델 (본 발명의 균혈증 예측 모델 (C)), SVM의 분류 모델 (본 발명의 균혈증 예측 모델 (D)) 및 128 개의 노드를 갖는 히든 레이어로 구성된 MLP 모델, 256 개의 노드를 갖는 히든 레이어로 구성된 MLP 모델 및 랜덤 포레스트 분류 모델이 결합된 앙상블 모델 (본 발명의 균혈증 예측 모델 (E)) 로 구성된다. 나아가, 각 변수가 계층화되어 섹션으로 나눈 후 균혈증에 대한 위험을 분석하도록 구성된 종래의 예측 모델 Nave Bayesian이 본 평가에 함께 이용되었다.At this time, the bacteremia prediction model of the present invention is an MLP model composed of a hidden layer having 128 nodes (bacteremia prediction model (A) of the present invention), an MLP model composed of a hidden layer having 256 nodes (bacteremia prediction of the present invention) Model (B)), classification model of random forest (bacteremia prediction model of the present invention (C)), classification model of SVM (bacteremia prediction model of the present invention (D)), and MLP model consisting of a hidden layer with 128 nodes , it is composed of an ensemble model (bacteremia prediction model (E) of the present invention) in which an MLP model consisting of a hidden layer having 256 nodes and a random forest classification model are combined. Furthermore, a conventional predictive model Na, configured to analyze the risk for bacteremia after each variable is stratified and divided into sections ve Bayesian was also used in this evaluation.
도 4a를 참조하면, MLP에 기초한, 본 발명의 균혈증 예측 모델 (A) 및 본 발명의 균혈증 예측 모델 (B) 의 민감도가 0.81로 나머지 모델에 비하여 가장 높은 것으로 나타난다. 나아가, 본 발명의 균혈증 예측 모델 (C) 의 특이도가 0.655로 나머지 모델에 비하여 가장 높은 것으로 나타난다. Referring to FIG. 4A , the sensitivity of the bacteremia prediction model (A) of the present invention and the bacteremia prediction model (B) of the present invention based on MLP is 0.81, which is the highest compared to the rest of the models. Furthermore, the specificity of the bacteremia prediction model (C) of the present invention is 0.655, which is the highest compared to the rest of the models.
특히, 도 4b를 함께 참조하면 본 발명의 균혈증 예측 모델 (A) 내지 (E) 의 진단 능력을 의미할 수 있는 AUC값은 평균 약 0.729로, 종래의 예측 모델인 Nave Bayesian에 비하여 높은 것으로 나타난다. 이때, AUC 값은 진단 능력과 연관이 있을 수 있다. 따라서, 본 발명의 다양한 실시예에 따른 균혈증 예측 모델은, 균혈증 진단 시스템에 적용될 경우, 개체에 대하여 균혈증의 발병 위험도를 높은 정확도로 미리 예측할 수 있다.In particular, referring together with FIG. 4b, the AUC value, which can mean the diagnostic ability of the bacteremia prediction models (A) to (E) of the present invention, is an average of about 0.729, and Na, which is a conventional predictive model ve appears to be higher than that of Bayesian. In this case, the AUC value may be related to the diagnostic ability. Therefore, when the bacteremia prediction model according to various embodiments of the present invention is applied to a bacteremia diagnosis system, it is possible to predict in advance the risk of developing bacteremia for an individual with high accuracy.
이상의 결과에 따르면, 본 발명의 다양한 실시예에 따른 균혈증 예측 모델이 종래의 예측 모델보다 균혈증 발병의 위험도를 높은 신뢰도로 예측하는 것으로 나타난다. 특히, MLP 기반의 균혈증 예측 모델의 경우, 다른 모델들 보다 높은 민감도를 유지하면서 높은 AUC 값을 갖는 것으로 나타난다. 이에, 본 발명의 균혈증 예측 모델은, MLP 기반의 예측 모델일 수 있으나 이에 제한되는 것은 아니다. According to the above results, it appears that the bacteremia prediction model according to various embodiments of the present invention predicts the risk of developing bacteremia with higher reliability than the conventional prediction model. In particular, the MLP-based bacteremia prediction model appears to have a high AUC value while maintaining high sensitivity than other models. Accordingly, the bacteremia prediction model of the present invention may be an MLP-based prediction model, but is not limited thereto.
도 4c 및 4d는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대한, 균혈증 예측의 영향력에 따른 임상 데이터들을 도시한 것이다. 4c and 4d show clinical data according to the influence of bacteremia prediction on the bacteremia prediction model used in various embodiments of the present invention.
도 4c를 참조하면, 본 발명의 다양한 실시예에서 이용되는 임상 데이터들 (생물학적 시험 데이터, 생체 신호 데이터 및 임상적 특징 데이터) 의 영향력 (관련도) 평가 결과가 도시된다. 본 평가에서는, 'One-out search' 및 'Gini Importance'에 기초하여 균혈증의 예측에 영향력이 높은 변수들의 순위를 평가하였다. 보다 구체적으로, MLP 기반의 예측 모델에 적용될 수 있는 One-out search의 순위 평가 결과에 따르면, 생물학적 시험 데이터 중 ALP 수치 및 혈소판 수와, 생체 신호 데이터 중 최고 체온이 균혈증의 발병 위험도를 예측하는 것에 있어서 높은 영향력이 있는 것으로 나타난다. 한편, 랜덤 포레스트 기반의 예측 모델에 이용될 수 있는 Gini Importance의 순위 평가 결과에 따르면, One-out search의 순위 평가 결과와 다소 상이하지만, One-out search에 의해 영향력이 높다고 평가된 ALP 수치, 혈소판 수 및 최고 체온이 균혈증을 분류 하는 것에 높은 영향력을 갖는 것으로 나타난다. Referring to FIG. 4C , the evaluation results of influence (relevance) of clinical data (biological test data, biosignal data, and clinical characteristic data) used in various embodiments of the present invention are shown. In this evaluation, the ranking of variables having a high influence on the prediction of bacteremia was evaluated based on 'One-out search' and 'Gini Importance'. More specifically, according to the ranking evaluation result of One-out search that can be applied to the MLP-based prediction model, the ALP level and platelet count in the biological test data, and the highest body temperature in the biosignal data predict the risk of bacteremia. appears to have a high influence. On the other hand, according to the ranking evaluation result of Gini Importance that can be used in the random forest-based prediction model, although it is somewhat different from the ranking evaluation result of one-out search, the ALP level and platelets evaluated as having high influence by the one-out search Number and peak body temperature appear to have a high influence on classifying bacteremia.
도 4d를 더욱 참조하면, 그레디언트 기반의 방법의 LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), 및 SM (saliency map) 에 기초하여 균혈증의 예측에 영향력이 높은 변수들의 순위를 평가한 결과가 도시된다. 보다 구체적으로, LRP, GI 및 IG의 순위 평가 결과에 따르면, 전술한 One-out search의 순위 평가 결과와 유사하게 ALP 수치가 균혈증의 발명 위험도를 예측하는 것에 높은 영향력을 갖는 것으로 나타난다. 또한, 혈소판 수가 균혈증의 발명 위험도를 예측하는 것에 높은 영향력을 갖는 것으로 나타난다. SM에 따른 순위 평가 결과에서도, 혈소판 수 및 ALP 수치가 균혈증의 발명 위험도를 예측하는 것에 높은 영향력을 갖는 것으로 나타난다.Referring further to FIG. 4D , a variable with a high influence on the prediction of bacteremia based on the gradient-based method LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), and SM (saliency map) The results of evaluating their rankings are shown. More specifically, according to the ranking evaluation results of LRP, GI, and IG, it appears that the ALP level has a high influence in predicting the risk of bacteremia inventing, similar to the ranking evaluation result of the one-out search described above. In addition, platelet count appears to have a high influence on predicting the risk of developing bacteremia. In the ranking evaluation results according to SM, platelet counts and ALP levels appear to have a high influence on predicting the risk of bacteremia.
이러한 결과는, 개체에 대한 임상 데이터를 기초로 균혈증을 예측 하는 것에 있어서, 생물학적 시험 데이터 중 ALP 수치 및 혈소판 수, 나아가 생체 신호 데이터 중 최고 체온이 균혈증 예측에 있어서 큰 영향력을 제공한다는 것을 의미할 수 있다. 즉, 본 발명의 균혈증 예측 모델은, 중 ALP 수치 및 혈소판 수, 나아가 최고 체온을 기초로 균혈증 발병 여부를 예측하도록 학습될 수 있어, 우수한 진단 능력으로 개체에 대한 균혈증 발병의 위험도를 예측할 수 있다. These results suggest that, in predicting bacteremia based on clinical data for an individual, the ALP level and platelet count among biological test data, and furthermore, the highest body temperature among biosignal data provides a great influence in predicting bacteremia. there is. That is, the bacteremia prediction model of the present invention can be learned to predict whether or not bacteremia will develop based on the middle ALP level and platelet count, and furthermore, the highest body temperature, and can predict the risk of developing bacteremia for an individual with excellent diagnostic ability.
도 4e 및 4f는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대한, 균혈증 예측의 영향력에 따른 임상 데이터들의 변화에 따른 성능 변화를 도시한 것이다. 4e and 4f show performance changes according to changes in clinical data according to the influence of bacteremia prediction for the bacteremia prediction model used in various embodiments of the present invention.
도 4e의 (a)를 참조하면, MLP의 ANN 머신 러닝 알고리즘에 대하여 변수의 평가를 위해 LRP, SM, OOS (one-out search), 및 교란-기반 방법의 Occlusion을 적용한 후, 영향력이 높다고 평가된 변수들을 영향력 순으로 누적하여 제외했을 때의 AUC값이 도시된다. 나아가, RF 기반의 예측 모델에 대하여 변수의 평가를 위해 Gini Importance 방법으로 영향력이 높다고 평가된 변수들을 영향력 순으로 누적하여 제외했을 때의 AUC값이 함께 도시된다.Referring to (a) of Figure 4e, after applying Occlusion of LRP, SM, one-out search (OOS), and perturbation-based method for the evaluation of variables for the ANN machine learning algorithm of MLP, the influence is evaluated as high The AUC values when accumulating and excluding variables in the order of influence are shown. Furthermore, for the evaluation of variables for the RF-based prediction model, the AUC values when variables evaluated as having high influence by the Gini Importance method are accumulated and excluded in the order of influence are shown together.
보다 구체적으로, 균혈증을 예측하는 것에 있어서 영향력이 높은 것으로 평가된 상위 변수들 (예를 들어, ALP 수치, 혈소판 수, 최고 체온 등) 이 제외됨에 따라, 균혈증 예측에 대한 AUC값이 감소하는 것으로 나타난다. 이는 영향력이 높은 임상 데이터들의 제외에 따른, 균혈증 예측의 성능 저하를 의미할 수 있다. More specifically, as the top variables evaluated as having a high influence in predicting bacteremia (eg, ALP level, platelet count, maximum body temperature, etc.) are excluded, the AUC value for predicting bacteremia appears to decrease. . This may mean a decrease in the performance of predicting bacteremia due to the exclusion of high-impact clinical data.
도 4e의 (b)를 참조하면, MLP의 ANN 머신 러닝 알고리즘에 대하여 변수의 평가를 위해 LRP, SM, OOS (one-out search), 및 교란-기반 방법의 Occlusion을 적용한 후, 영향력이 높다고 평가된 변수들을 영향력 순으로 누적하여 추가했을 때의 AUC값이 도시된다. 나아가, RF 기반의 예측 모델에 대하여 변수의 평가를 위해 Gini Importance 방법으로 영향력이 높다고 평가된 변수들을 영향력 순으로 누적하여 추가했을 때의 AUC값이 함께 도시된다.Referring to (b) of Figure 4e, after applying the occlusion of LRP, SM, one-out search (OOS), and disturbance-based method for the evaluation of variables for the ANN machine learning algorithm of MLP, the influence is evaluated as high. The AUC values when added variables are accumulated in the order of influence are shown. Furthermore, for the evaluation of variables in the RF-based prediction model, the AUC values when variables evaluated as having high influence by the Gini Importance method are accumulated and added in the order of influence are shown together.
보다 구체적으로, 균혈증을 예측하는 것에 있어서 영향력이 높은 것으로 평가된 상위 변수들 (예를 들어, ALP 수치, 혈소판 수, 최고 체온 등) 이 추가됨에 따라, 균혈증 예측에 대한 AUC값이 증가하는 것으로 나타난다. 이때, 상위 10 개의 변수를 추가한 이후 AUC 값의 변화는 미미한 것으로 나타난다. 이러한 결과는, 상위 10 개의 임상 데이터들이 균혈증을 예측하는 것에 있어서 영향력이 높은 것을 의미할 수 있다. 한편, OOS의 경우, 다른 평가 모델들보다 변수 추가에 따른 현저한 AUC 값의 증가가 나타난다. 이에, 본 발명의 다양한 실시예에 따른 균혈증 발병 위험도 예측 방법에 있어서, 다양한 임상적 변수들, 즉 생물학적 시험 데이터, 생체 신호 데이터 및 임상적 특징 데이터의 평가에 OOS 모델이 적용될 수 있으나, 이에 제한되는 것은 아니다. More specifically, as the top variables evaluated to have high influence in predicting bacteremia (eg, ALP level, platelet count, maximum body temperature, etc.) are added, the AUC value for predicting bacteremia appears to increase. . In this case, the change in the AUC value after adding the top 10 variables appears to be insignificant. These results may mean that the top 10 clinical data have a high influence in predicting bacteremia. On the other hand, in the case of OOS, there is a significant increase in the AUC value according to the addition of a variable compared to other evaluation models. Accordingly, in the method for predicting the risk of developing bacteremia according to various embodiments of the present invention, the OOS model may be applied to the evaluation of various clinical variables, that is, biological test data, biosignal data, and clinical characteristic data, but is limited thereto. it is not
도 4f의 (a)를 참조하면, RF 및 SVM의 비-ANN 머신 러닝 알고리즘에 대하여 변수의 평가를 위해 Gini Importance 방법, 또는 OOS을 적용한 후, 영향력이 높다고 평가된 변수들을 영향력 순으로 누적하여 제외했을 때의 AUC값이 도시된다.Referring to (a) of Figure 4f, after applying the Gini Importance method or OOS for the evaluation of variables to the non-ANN machine learning algorithm of RF and SVM, variables evaluated as having high influence are accumulated and excluded in the order of influence. The AUC value at the time is shown.
보다 구체적으로, 균혈증을 예측하는 것에 있어서 영향력이 높은 것으로 평가된 상위 변수들 (예를 들어, ALP 수치, 혈소판 수, 최고 체온 등) 이 제외됨에 따라, 균혈증 예측에 대한 AUC값이 감소하는 것으로 나타난다. 이는 영향력이 높은 임상 데이터들의 제외에 따른, 균혈증 예측의 성능 저하를 의미할 수 있다. More specifically, as the top variables evaluated as having a high influence in predicting bacteremia (eg, ALP level, platelet count, maximum body temperature, etc.) are excluded, the AUC value for predicting bacteremia appears to decrease. . This may mean a decrease in the performance of predicting bacteremia due to the exclusion of high-impact clinical data.
도 4f의 (b)를 참조하면, RF 및 SVM의 비-ANN 머신 러닝 알고리즘에 대하여 변수의 평가를 위해 Gini Importance 방법, 또는 OOS을 적용한 후, 영향력이 높다고 평가된 변수들을 영향력 순으로 누적하여 추가했을 때의 AUC값이 도시된다.Referring to (b) of FIG. 4f, after applying the Gini Importance method or OOS for the evaluation of variables for non-ANN machine learning algorithms of RF and SVM, variables evaluated as having high influence are accumulated and added in the order of influence. The AUC value at the time is shown.
보다 구체적으로, 균혈증을 예측하는 것에 있어서 영향력이 높은 것으로 평가된 상위 변수들 (예를 들어, ALP 수치, 혈소판 수, 최고 체온 등) 이 추가됨에 따라, 균혈증 예측에 대한 AUC값이 증가하는 것으로 나타난다. 이때, 상위 10 개의 변수를 추가한 이후 AUC 값의 변화는 미미한 것으로 나타난다. 이러한 결과는, 상위 10 개의 임상 데이터들이 균혈증을 예측하는 것에 있어서 영향력이 높은 것을 의미할 수 있다. 한편, OOS의 경우, 다른 평가 모델들보다 변수 추가에 따른 현저한 AUC 값의 증가가 나타난다. 이에, 본 발명의 다양한 실시예에 따른 균혈증 발병 위험도 예측 방법에 있어서, 다양한 임상적 변수들, 즉 생물학적 시험 데이터, 생체 신호 데이터 및 임상적 특징 데이터의 평가에 OOS 모델이 적용될 수 있으나, 이에 제한되는 것은 아니다. More specifically, as the top variables evaluated to have high influence in predicting bacteremia (eg, ALP level, platelet count, maximum body temperature, etc.) are added, the AUC value for predicting bacteremia appears to increase. . In this case, the change in the AUC value after adding the top 10 variables appears to be insignificant. These results may mean that the top 10 clinical data have a high influence in predicting bacteremia. On the other hand, in the case of OOS, there is a significant increase in the AUC value according to the addition of a variable compared to other evaluation models. Accordingly, in the method for predicting the risk of developing bacteremia according to various embodiments of the present invention, the OOS model may be applied to the evaluation of various clinical variables, that is, biological test data, biosignal data, and clinical characteristic data, but is limited thereto. it is not
한편, 본 발명의 다양한 실시예에서 이용되는 균혈증 예측 모델은, 균혈증 예측에 있어서 영향력이 큰 임상 데이터를 학습 데이터로 이용하도록 구성될 수 있다. 이에, 균혈증 예측 모델은, 균혈증 예측에 있어서 다른 예측 모델보다 향상된 진단 능력으로 균혈증 예측 결과를 제공할 수 있다. 이상의 실시예 1의 결과로, 본 발명의 다양한 실시예에서 이용된 균혈증 예측 모델이 균혈증 발병 위험도를 높은 정확도로 예측하는 것을 확인할 수 있었다. 나아가, 높은 AUC 값을 갖는 것으로 나타난 결과에 따라 본 발명의 예측 모델은 우수한 진단 능력을 가지는 것으로 확인할 수 있었다. On the other hand, the bacteremia prediction model used in various embodiments of the present invention may be configured to use clinical data having a large influence in predicting bacteremia as learning data. Accordingly, the bacteremia prediction model may provide a bacteremia prediction result with improved diagnostic ability than other predictive models in predicting bacteremia. As a result of Example 1 above, it was confirmed that the bacteremia prediction model used in various Examples of the present invention predicts the risk of developing bacteremia with high accuracy. Furthermore, according to the results shown to have a high AUC value, it was confirmed that the predictive model of the present invention has excellent diagnostic ability.
이에, 본 발명은 균혈증에 대한 처치 시점을 앞당겨 치료에 대한 좋은 예후를 제공할 수 있다. 나아가, 본 발명은, 패혈증과 상이한 균혈증에 대하여 높은 신뢰도 및 정확도로 발병의 위험도를 예측할 수 있는 효과가 있다.Accordingly, the present invention can provide a good prognosis for treatment by advancing the treatment time for bacteremia. Furthermore, the present invention has the effect of predicting the risk of onset with high reliability and accuracy for bacteremia different from sepsis.
특히, 본 발명은 개체로부터 빠르게 획득 가능한 임상 데이터에 기초한 균혈증 발병 위험도 예측 시스템을 제공함으로써, 개체에 대하여 균혈증 발병의 조기 진단을 제공할 수 있다. In particular, the present invention can provide an early diagnosis of the onset of bacteremia in a subject by providing a system for predicting the risk of developing bacteremia based on clinical data that can be quickly obtained from the subject.
이에, 본 발명은 균혈증 발병 개체의 생존률 증가, 합병증 예방, 및 치료 비용의 감소 효과를 제공할 수 있다.Accordingly, the present invention can provide the effects of increasing the survival rate of an individual with bacteremia, preventing complications, and reducing the cost of treatment.
또한, 본 발명은, 개체에 대하여 예측 모델에 의해 균혈증이 예측될 경우, 알람을 제공하여 균혈증 발병 위험도를 알리도록 구성됨에 따라, 보호자 또는 의료진은 중환자와 같은 지속적인 모니터링이 요구되는 개체에 대하여 보다 용이하게 균혈증 발병 고위험군을 인지할 수 있다.In addition, the present invention, when bacteremia is predicted by the predictive model for the subject, as it is configured to provide an alarm to inform the risk of developing bacteremia, caregivers or medical staff are easier for subjects requiring continuous monitoring, such as critically ill patients High-risk groups for developing bacteremia can be recognized.
실시예 2: 본 발명의 다양한 실시예에 따른 균혈증 예측 모델의 제2 평가 Example 2: Second evaluation of bacteremia prediction model according to various embodiments of the present invention
이하에서는 5a 내지 5i를 참조하여 본 발명의 다양한 실시예에서 이용되는 균혈증 예측 모델의 제2 평가 결과에 대하여 구체적으로 설명한다. 도 5a 및 5b는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 제2 평가를 위한 학습 데이터 및 평가 데이터를 도시한 것이다. 도 5c 내지 5i는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대한 제2 평가 결과를 도시한 것이다. Hereinafter, the second evaluation result of the bacteremia prediction model used in various embodiments of the present invention will be described in detail with reference to 5a to 5i. 5A and 5B show learning data and evaluation data for the second evaluation of the bacteremia prediction model used in various embodiments of the present invention. 5c to 5i show a second evaluation result for the bacteremia prediction model used in various embodiments of the present invention.
이때, 도 5a를 참조하면, 본 평가에서 균혈증 예측을 위해, 임상적 특징 데이터로서 연령, 성별이 특징 파라미터로 설정 되었고, 생체 신호 데이터로서 SBP (systolic blood pressure), DBP (diastolic blood pressure), 최고 체온, 최저 체온, 심박수 및 호흡수가 특징 파라미터로 설정 되었다. 나아가, 생물학적 시험 데이터로서 알부민 수치, ALT (alanine aminotransferase) 수치, 트롬포플라스틴 (thromboplastin) 의 응고 시간, AST (aspartate aminotransferase) 수치, CRP (C-reactive protein) 수치, 적혈구 침강 속도, FERR (ferritin) 수치, HMG (hemoglobin) 수치, PTINR (Prothrombin Time International Normalized Ratio), PTPER (Prothrombin Time (%)), PTSEC (Prothrombin Time (sec)), 적혈구 수치, TBIL (Total bilirubin) 수치, TCO2 (total carbon dioxide) 수치 및 백혈구 수치가 특징 파라미터로 설정되었다.At this time, referring to FIG. 5A , for bacteremia prediction in this evaluation, age and gender were set as characteristic parameters as clinical characteristic data, and SBP (systolic blood pressure), DBP (diastolic blood pressure), and highest as biosignal data. Body temperature, minimum body temperature, heart rate, and respiration rate were set as characteristic parameters. Furthermore, as biological test data, albumin level, ALT (alanine aminotransferase) level, thromboplastin clotting time, AST (aspartate aminotransferase) level, CRP (C-reactive protein) level, erythrocyte sedimentation rate, ferritin (FERR) Level, HMG (hemoglobin) level, PTINR (Prothrombin Time International Normalized Ratio), PTPER (Prothrombin Time (%)), PTSEC (Prothrombin Time (sec)), Red blood cell count, TBIL (Total bilirubin) level, TCO 2 (total carbon) dioxide) and white blood cell count were set as characteristic parameters.
이때, 생체 신호 데이터 및 생물학적 시험 데이터는, 3일 이내 측정된 최소값, 최대값, 또는 측정된 수치를 포함할 수 있다.In this case, the biosignal data and the biological test data may include a minimum value, a maximum value, or a measured value measured within 3 days.
보다 구체적으로, 도 5b를 참조하면, 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 제2 평가를 위해 이용된 데이터 세트 A, B 및 C의 구성이 도시된다.More specifically, referring to FIG. 5B , the configuration of data sets A, B, and C used for the second evaluation of the bacteremia prediction model used in various embodiments of the present invention is shown.
A 데이터 세트는, 트레이닝 및 검증을 위해 균혈증 양성 및 균혈증 음성 데이터가 1:1의 비율을 갖도록 구성되고, 테스트를 위해 균혈증 양성 및 균혈증 음성 데이터가 약 1:10의 비율을 갖도록 구성된다. 이때, A 데이터 세트는, 강남 세브란스 병원 및 신촌 세브란스 병원에서 2007년 내지 2018년 사이에 샘플링된 균혈증 양성 및 균혈증 음성 데이터로서, 트레이닝 및 검증을 위해 2007년 내지 2015년도의 데이터가, 테스트를 위해 2016년 내지 2018년 데이터가 이용될 수 있다.A data set is configured such that bacteremia positive and bacteremia negative data have a ratio of 1:1 for training and validation, and bacteremia positive and bacteremia negative data have a ratio of about 1:10 for testing. At this time, data set A is bacteremia-positive and bacteremia-negative data sampled between 2007 and 2018 at Gangnam Severance Hospital and Sinchon Severance Hospital, with data from 2007 to 2015 for training and validation, and 2016 for testing Data for years to 2018 are available.
B 데이터 세트는, 트레이닝 및 검증을 위해 균혈증 양성 및 균혈증 음성 데이터가 1:1의 비율을 갖도록 구성되고, 테스트를 위해 균혈증 양성 및 균혈증 음성 데이터가 약 1:7의 비율을 갖도록 구성된다. 이때, C 데이터 세트는, 강남 세브란스 병원 및 신촌 세브란스 병원에서 2007년 내지 2018년 사이에 샘플링된 균혈증 양성 및 균혈증 음성 데이터를 연도별로 병합한 후 랜덤 분할된 데이터일 수 있다.The B data set is configured such that bacteremia positive and bacteremia negative data have a ratio of 1:1 for training and validation, and bacteremia positive and bacteremia negative data have a ratio of about 1:7 for testing. In this case, the C data set may be randomly divided data after merging bacteremia positive and bacteremia negative data sampled between 2007 and 2018 at Gangnam Severance Hospital and Sinchon Severance Hospital by year.
C 데이터 세트는, 트레이닝 및 검증을 위해 균혈증 양성 및 균혈증 음성 데이터가 1:1의 비율을 갖도록 구성되고, 테스트를 위해 균혈증 양성 및 균혈증 음성 데이터가 약 1:7의 비율을 갖도록 구성된다. 이때, C 데이터 세트는, 강남 세브란스 병원 및 신촌 세브란스 병원에서 2007년 내지 2018년 사이에 샘플링된 균혈증 양성 및 균혈증 음성 데이터를 연도별로 병합한 후 랜덤 분할하고, 동일 환자 샘플이 각 세트별로 중복되지 않도록 구분되고, 동일 환자의 양성/음성 샘플이 동시에 존재하는 경우 음성 샘플이 제거된 데이터일 수 있다.The C data set is configured such that bacteremia positive and bacteremia negative data have a ratio of 1:1 for training and validation, and bacteremia positive and bacteremia negative data have a ratio of about 1:7 for testing. At this time, the C data set is randomly divided after merging the bacteremia-positive and bacteremia-negative data sampled between 2007 and 2018 at Gangnam Severance Hospital and Sinchon Severance Hospital by year, and the same patient sample is not duplicated for each set. It may be data from which a negative sample is removed if it is separated and positive/negative samples of the same patient exist at the same time.
도 5c를 참조하면, 전술한 A 데이터에 기초하여 학습된 균혈증 예측 모델에 대한 평가 결과가 도시된다. 이때, 128 개의 노드, 64 개의 노드, 25 개의 노드 및 128 개의 노드로 구성된 4 층의 복수의 레이어로 구성된 균혈증 예측 모델에 대하여, 선행 학습여부에 따른 균혈증 예측 진단 성능에 대한 평가가 수행되었다. 한편, 선행 학습된 균혈증 예측 모델은, 스스로 라벨 값을 학습하는 오터 인코더 (AutoEncoder) 에 대하여 가중치 이니셜라이징 (weight initializing) 이 적용되었다.Referring to FIG. 5C , an evaluation result for the bacteremia prediction model learned based on the aforementioned data A is shown. At this time, for the bacteremia prediction model consisting of a plurality of layers of 4 layers consisting of 128 nodes, 64 nodes, 25 nodes, and 128 nodes, evaluation of the bacteremia prediction diagnosis performance according to whether prior learning was performed was performed. On the other hand, in the pre-trained bacteremia prediction model, weight initializing was applied to an AutoEncoder that learns a label value by itself.
보다 구체적으로, 선행 학습된 본 발명의 균혈증 예측 모델 (pret) 의 경우, 균혈증 양성 또는 음성 예측의 정확도가 0.759, 민감도가 0.762로, 그렇지 않은 모델의 정확도 (0.729), 민감도 (0.75) 보다 높은 것으로 나타난다. 특히, 선행 학습된 본 발명의 균혈증 예측 모델 (pret) 의 진단 능력을 의미할 수 있는 AUC 값은 0.840으로, 그렇지 않은 모델의 AUC 값인 0.818보다 높은 것으로 나타난다.More specifically, in the case of the pre-trained bacteremia prediction model (pret) of the present invention, the accuracy of predicting positive or negative bacteremia is 0.759 and the sensitivity is 0.762, and the accuracy (0.729) and sensitivity (0.75) of the models that are not are higher than the accuracy (0.729) and sensitivity (0.75). appear. In particular, the AUC value, which can mean the diagnostic ability of the pre-trained bacteremia prediction model (pret) of the present invention, is 0.840, which is higher than the AUC value of the model that is not, 0.818.
이상의 결과에 따르면, 본 발명의 다양한 실시예에 따른 균혈증 예측 모델은, 높은 민감도를 유지하면서 높은 AUC 값을 갖는, 오터 인코더에 대하여 가중치 이니셜라이징이 적용된 모델일 수 있다. 그러나 이에 제한되는 것은 아니다. According to the above results, the bacteremia prediction model according to various embodiments of the present invention may be a model to which weight initialization is applied to the auto encoder, which has a high AUC value while maintaining high sensitivity. However, the present invention is not limited thereto.
도 5d 및 5e를 참조하면, 전술한 B 데이터 및 C 데이터에 기초하여 학습된 균혈증 예측 모델에 대한 레이어 사이즈에 따른 평가 결과가 도시된다. Referring to FIGS. 5D and 5E , evaluation results according to the layer size of the bacteremia prediction model learned based on the above-described B data and C data are shown.
먼저, 도 5d를 참조하면, 64 개의 노드 128 개의 노드 및 64 개의 노드 각각으로 구성된 3 층의 복수의 레이어 (64-128-64) 로 구성된 예측 모델, 64 개의 노드 128 개의 노드, 128 개의 노드 및 64 개의 노드 각각으로 구성된 4 층의 복수의 레이어 (64-128-128-64) 로 구성된 예측 모델에 대하여 전술한 B 데이터를 이용한 성능 평가 결과가 도시된다.First, referring to FIG. 5D , a prediction model consisting of 64 nodes, 128 nodes, and a plurality of layers (64-128-64) of 3 layers each consisting of 64 nodes, 64 nodes, 128 nodes, 128 nodes, and A performance evaluation result using the above-described B data is shown for a prediction model composed of a plurality of layers 64-128-128-64 of 4 layers each composed of 64 nodes.
이때, 64-128-64 예측 모델 및 64-128-128-64 예측 모델 각각은, 0.5 확률의 do (drop-out) 또는, bn (batch normalization) 이 적용되었다. In this case, do (drop-out) or bn (batch normalization) with a probability of 0.5 is applied to each of the 64-128-64 prediction model and the 64-128-128-64 prediction model.
보다 구체적으로, bn을 적용한 64-128-64 예측 모델 및 64-128-128-64 예측 모델 각각에 대한 균혈증 예측의 정확도는 0.735, 0.738로 레이어 사이즈의 변화에도 유사한 값을 갖는 것으로 나타난다. 또한, bn을 적용한 64-128-64 예측 모델 및 64-128-128-64 예측 모델 각각에 대한 균혈증 예측에 대한 AUC 값은 0.847, 0.859로 레이어 사이즈의 변화에도 유사한 값을 갖는 것으로 나타난다.More specifically, the bacteremia prediction accuracy for each of the 64-128-64 prediction model and the 64-128-128-64 prediction model to which bn is applied is 0.735 and 0.738, indicating that they have similar values even when the layer size changes. In addition, the AUC values for bacteremia prediction for the 64-128-64 prediction model and the 64-128-128-64 prediction model to which bn is applied are 0.847 and 0.859, indicating that they have similar values even when the layer size changes.
한편, 도 5e를 더욱 참조하면, 128 개의 노드로 구성된 단일 레이어 (128) 로 구성된 예측 모델, 64 개의 노드 128 개의 노드 및 64 개의 노드 각각으로 구성된 3 층의 복수의 레이어 (64-128-64) 로 구성된 예측 모델, 64 개의 노드 128 개의 노드, 128 개의 노드 및 64 개의 노드 각각으로 구성된 4 층의 복수의 레이어 (64-128-128-64) 로 구성된 예측 모델에 대하여 전술한 C 데이터를 이용한 성능 평가 결과가 도시된다.Meanwhile, further referring to FIG. 5E , a predictive model consisting of a
이때, 128 예측 모델에 대하여 0.5 확률의 do를 적용하였고, 64-128-64 예측 모델 및 64-128-128-64 예측 모델 각각에 대하여, 0.5 확률의 do 및/또는 bn이 적용되었다. At this time, a do of 0.5 probability was applied to the 128 prediction model, and do and/or bn of 0.5 probability was applied to each of the 64-128-64 prediction model and the 64-128-128-64 prediction model.
보다 구체적으로, 단일 레이어의 128 예측 모델의 경우 AUC 값은 0.751로 복수의 레이어를 갖는 64-128-64 예측 모델 및 64-128-128-64 예측 모델의 AUC 값보다 높은 것으로 나타난다. More specifically, the AUC value of the single-
이때, 64-128-64 예측 모델 및 64-128-128-64 예측 모델의 경우, 전술한 도 5d의 결과와 유사하게 bn을 적용했을 때의 균혈증 예측의 정확도, 민감도 및 AUC 값이 높은 것으로 나타난다.At this time, in the case of the 64-128-64 predictive model and the 64-128-128-64 predictive model, the accuracy, sensitivity, and AUC value of bacteremia prediction when bn is applied similarly to the result of FIG. 5d described above are high. .
이상의 결과에 따르면, 본 발명의 다양한 실시예에 따른 균혈증 예측 모델은, 레이어 사이즈의 변화에도 높은 민감도, 정확도 및 AUC 값을 갖는 것으로 나타난다. 이에, 본 발명의 다양한 실시예에 따른 균혈증 예측 모델은, 128 개의 노드로 구성된 단일 레이어를 갖거나, 64-128-64의 3층의 복수의 레이어를 갖거나, 64-128-128-64의 4층의 복수의 레이어를 갖고, bn이 적용된 모델일 수 있다. 그러나, 본 발명의 균혈증 예측 모델의 구조는 이에 제한되는 것은 아니다.According to the above results, it appears that the bacteremia prediction model according to various embodiments of the present invention has high sensitivity, accuracy, and AUC value even with a change in layer size. Accordingly, the bacteremia prediction model according to various embodiments of the present invention has a single layer composed of 128 nodes, has a plurality of three layers of 64-128-64, or has a 64-128-128-64 It may be a model to which bn has been applied and has a plurality of layers of 4 layers. However, the structure of the bacteremia prediction model of the present invention is not limited thereto.
도 5f 및 5g를 참조하면, 전술한 B 데이터 및 C 데이터에 기초하여 학습된 스태킹 앙상블 (stacking ensemble) 모델에 대한 평가 결과가 도시된다. Referring to FIGS. 5F and 5G , evaluation results for a stacking ensemble model learned based on the above-described B data and C data are shown.
먼저, 도 5f를 참조하면, 64 개의 노드 128 개의 노드 및 64 개의 노드 각각으로 구성된 3 층의 복수의 레이어 (64-128-64) 를 갖고, 스태킹 모델의 수가 10 개, 15 개 및 20 개인 앙상블 모델에 대한, 전술한 B 데이터를 이용한 성능 평가 결과가 도시된다.First, referring to FIG. 5F , an ensemble having a plurality of layers 64-128-64 of 3 layers consisting of 64 nodes, 128 nodes and 64 nodes, respectively, and having 10, 15 and 20 stacking models. The performance evaluation results using the above-described B data for the model are shown.
보다 구체적으로, B 데이터 세트를 적용하였을 때, 스태킹 모델의 수가 15 개인 앙상블 모델에 대한 AUC 값이 0.887로, 스태킹 모델의 수가 10 개인 앙상블 모델의 AUC 값 (0.865), 스태킹 모델의 수가 20 개인 앙상블 모델의 AUC 값 (0.873) 보다 높은 것으로 나타난다.More specifically, when data set B was applied, the AUC value for the ensemble model with 15 stacking models was 0.887, the AUC value for the ensemble model with 10 stacking models (0.865), and the ensemble with 20 stacking models. It appears to be higher than the AUC value of the model (0.873).
한편, 도 5g를 함께 참조하면, 128 개의 노드로 구성된 단일 레이어를 갖고, 스태킹 모델의 수가 10 개, 15 개 및 20 개인 앙상블 모델에 대한, 전술한 C 데이터를 이용한 성능 평가 결과가 도시된다.Meanwhile, referring to FIG. 5G , performance evaluation results using the aforementioned C data are shown for an ensemble model having a single layer composed of 128 nodes and having 10, 15, and 20 stacking models.
보다 구체적으로, C 데이터 세트를 적용하였을 때, 스태킹 모델의 수가 15 개 및 20 개인 앙상블 모델에 대한 AUC 값이 0.752로, 스태킹 모델의 수가 10 개인 앙상블 모델의 AUC 값 (0.750) 보다 높은 것으로 나타난다.More specifically, when the C data set is applied, the AUC value for the ensemble model with 15 and 20 stacking models is 0.752, which is higher than the AUC value for the ensemble model with 10 stacking models (0.750).
이상의 결과에 따르면, 본 발명의 다양한 실시예에 따른 균혈증 예측 모델은, 스태킹 모델의 수가 15 개 내지 20 개인 앙상블 모델일 수도 있다. 그러나, 본 발명의 균혈증 예측 모델의 구조는 이에 제한되는 것은 아니다.According to the above results, the bacteremia prediction model according to various embodiments of the present invention may be an ensemble model having 15 to 20 stacking models. However, the structure of the bacteremia prediction model of the present invention is not limited thereto.
도 5h 및 5i를 참조하면, 전술한 B 데이터 및 C 데이터에 기초하여 학습된, MLP 기반의 예측 모델 및 Xgboost 기반의 예측 모델에 대한 평가 결과가 도시된다. 5H and 5I , evaluation results of the MLP-based predictive model and the Xgboost-based predictive model learned based on the above-described B data and C data are shown.
먼저, 도 5h를 참조하면, 64 개의 노드 128 개의 노드 및 64 개의 노드 각각으로 구성된 3 층의 복수의 레이어 (64-128-64) 를 갖고, 스태킹 모델의 수가 15 개인 MLP 모델 및 gbtree 레이어로 구성된 Xgboost 모델에 대한, 전술한 B 데이터를 이용한 성능 평가 결과가 도시된다.First, referring to FIG. 5H , it has a plurality of layers 64-128-64 of 3 layers consisting of 64 nodes, 128 nodes and 64 nodes, respectively, and is composed of an MLP model with 15 stacking models and a gbtree layer. Performance evaluation results using the above-described B data for the Xgboost model are shown.
보다 구체적으로, B 데이터 세트를 적용하였을 때, Xgboost 모델 기반의 예측 모델의 AUC 값은 0.842, 민감도는 0.745로, MLP 기반의 예측 모델의 AUC 값 (0.887) 및 민감도 (0.801) 와 유사한 수준을 갖는 것으로 나타난다. More specifically, when the B data set was applied, the AUC value of the predictive model based on the Xgboost model was 0.842 and the sensitivity was 0.745, which was similar to the AUC value (0.887) and sensitivity (0.801) of the MLP-based predictive model. appears to be
한편, 도 5i를 함께 참조하면, 128 개의 노드로 구성된 단일 레이어를 갖고, 스태킹 모델의 20 개인 MLP 모델 및 gbtree 레이어로 구성된 Xgboost 모델에 대한, 전술한 C 데이터를 이용한 성능 평가 결과가 도시된다.Meanwhile, referring together with FIG. 5I, the performance evaluation results using the above-described C data are shown for the Xgboost model, which has a single layer composed of 128 nodes, and is composed of a 20-person MLP model of a stacking model and a gbtree layer.
보다 구체적으로, C 데이터 세트를 적용하였을 때, Xgboost 모델 기반의 예측 모델의 AUC 값은 0.745, 민감도는 0.635로, MLP 기반의 예측 모델의 AUC 값 (0.752) 및 민감도 (0.664) 와 유사한 수준을 갖는 것으로 나타난다. More specifically, when the C data set was applied, the AUC value of the predictive model based on the Xgboost model was 0.745 and the sensitivity was 0.635, and the AUC value (0.752) and sensitivity (0.664) of the MLP-based predictive model had similar levels. appears to be
이상의 결과에 따르면, 본 발명의 다양한 실시예에 따른 균혈증 예측 모델은, MLP 기반의 예측 모델 또는 Xgboost 기반의 예측 모델일 수 있다. 그러나, 본 발명의 균혈증 예측 모델은 이에 제한되지 않고 보다 다양한 예측 모델에 기초하여 균혈증 양성 또는 음성을 예측하도록 구성된 모델일 수 있다. According to the above results, the bacteremia prediction model according to various embodiments of the present invention may be an MLP-based prediction model or an Xgboost-based prediction model. However, the bacteremia prediction model of the present invention is not limited thereto, and may be a model configured to predict bacteremia positive or negative based on more various predictive models.
이상의 실시예 2의 결과로, 본 발명의 다양한 실시예에서 이용된 균혈증 예측 모델이 균혈증 발병 위험도를 높은 정확도로 예측하는 것을 확인할 수 있었다. 나아가, 높은 AUC 값을 갖는 것으로 나타난 결과에 따라 본 발명의 예측 모델은 우수한 진단 능력을 가지는 것으로 확인할 수 있었다. As a result of Example 2 above, it was confirmed that the bacteremia prediction model used in various Examples of the present invention predicted the risk of developing bacteremia with high accuracy. Furthermore, according to the results shown to have a high AUC value, it was confirmed that the predictive model of the present invention has excellent diagnostic ability.
이에, 본 발명은 균혈증에 대한 처치 시점을 앞당겨 치료에 대한 좋은 예후를 제공할 수 있다. 나아가, 본 발명은, 패혈증과 상이한 균혈증에 대하여 높은 신뢰도 및 정확도로 발병의 위험도를 예측할 수 있는 효과가 있다.Accordingly, the present invention can provide a good prognosis for treatment by advancing the treatment time for bacteremia. Furthermore, the present invention has the effect of predicting the risk of onset with high reliability and accuracy for bacteremia different from sepsis.
특히, 본 발명은 개체로부터 빠르게 획득 가능한 임상 데이터에 기초한 균혈증 발병 위험도 예측 시스템을 제공함으로써, 개체에 대하여 균혈증 발병의 조기 진단을 제공할 수 있다. In particular, the present invention can provide an early diagnosis of the onset of bacteremia in a subject by providing a system for predicting the risk of developing bacteremia based on clinical data that can be quickly obtained from the subject.
이에, 본 발명은 균혈증 발병 개체의 생존률 증가, 합병증 예방, 및 치료 비용의 감소 효과를 제공할 수 있다.Accordingly, the present invention can provide the effects of increasing the survival rate of an individual with bacteremia, preventing complications, and reducing the cost of treatment.
또한, 본 발명은, 개체에 대하여 예측 모델에 의해 균혈증이 예측될 경우, 알람을 제공하여 균혈증 발병 위험도를 알리도록 구성됨에 따라, 보호자 또는 의료진은 중환자와 같은 지속적인 모니터링이 요구되는 개체에 대하여 보다 용이하게 균혈증 발병 고위험군을 인지할 수 있다.In addition, according to the present invention, when bacteremia is predicted by a predictive model for an individual, it is configured to provide an alarm to inform the risk of developing bacteremia. High-risk groups for developing bacteremia can be recognized.
본 발명의 여러 실시예들의 각각 특징들이 부분적으로 또는 전체적으로 서로 결합 또는 조합 가능하며, 당업자가 충분히 이해할 수 있듯이 기술적으로 다양한 연동 및 구동이 가능하며, 각 실시예들이 서로에 대하여 독립적으로 실 시 가능할 수도 있고 연관 관계로 함께 실시 가능할 수도 있다. Each feature of the various embodiments of the present invention may be partially or wholly combined or combined with each other, and as those skilled in the art will fully understand, technically various interlocking and driving are possible, and each embodiment may be implemented independently of each other. and may be implemented together in a related relationship.
이상 첨부된 도면을 참조하여 본 발명의 실시예들을 더욱 상세하게 설명하였으나, 본 발명은 반드시 이러한 실시예로 국한되는 것은 아니고, 본 발명 의 기술사상을 벗어나지 않는 범위 내에서 다양하게 변형 실시될 수 있다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.Although the embodiments of the present invention have been described in more detail with reference to the accompanying drawings, the present invention is not necessarily limited to these embodiments, and various modifications may be made within the scope without departing from the technical spirit of the present invention. . Therefore, the embodiments disclosed in the present invention are not intended to limit the technical spirit of the present invention, but to explain, and the scope of the technical spirit of the present invention is not limited by these embodiments. Therefore, it should be understood that the embodiments described above are illustrative in all respects and not restrictive. The protection scope of the present invention should be construed by the following claims, and all technical ideas within the scope equivalent thereto should be construed as being included in the scope of the present invention.
100: 균혈증 발병 위험도 예측용 디바이스
110: 수신부
120: 입력부
130: 출력부
140: 저장부
150: 프로세서
200: 개체
300: 임상 데이터
310: 생물학적 시험 데이터
320: 생체 신호 데이터
330: 임상적 특징 데이터
400: 의료적 처치 기구
500: 의료진 디바이스
1000: 위험도 예측 시스템100: Device for predicting the risk of developing bacteremia
110: receiver
120: input unit
130: output unit
140: storage
150: processor
200: object
300: clinical data
310: biological test data
320: biosignal data
330: clinical characteristic data
400: medical treatment device
500: medical staff device
1000: risk prediction system
Claims (26)
상기 수신부를 통해, 개체에 대한 생물학적 시험 데이터를 수신하는 단계;
상기 프로세서를 통해, 상기 생물학적 시험 데이터를 기초로 상기 개체에 대한 균혈증 발병 위험도를 예측하도록 구성된 균혈증 예측 모델을 이용하여, 상기 개체의 균혈증 발병 위험도를 예측하는 단계를 포함하고,
상기 생물학적 시험 데이터는,
크레아틴 (Creatinine) 수치, 알부민 (Albumin) 수치, CRP (C-reactive protein) 수치, WBC (white blood cell) 최소 수치, WBC 최고 수치, 프로트롬빈 (Prothrombin) 시간 중 적어도 하나, 혈소판 (Platelet) 수 및 ALP (Alkaline phosphatase) 수치를 포함하고,
상기 수신부를 통해, 상기 개체에 대한 생체 신호 데이터를 수신하는 단계를 더 포함하고,
상기 균혈증 예측 모델은,
상기 생물학적 시험 데이터 및 상기 생체 신호 데이터를 기초로 균혈증 발병 위험도를 예측하도록 더 구성되고,
상기 생체 신호 데이터는,
SBP (systolic blood pressure), DBP (diastolic blood pressure), 최저 체온, 심박수 및 호흡수 중 적어도 하나, 및 최고 체온을 포함하는, 균혈증 발병 위험도의 예측 방법.In the method for predicting the risk of developing bacteremia implemented by the processor and the receiver,
receiving, through the receiver, biological test data for the subject;
Using the processor, using a bacteremia prediction model configured to predict the risk of developing bacteremia for the subject based on the biological test data, predicting the risk of developing bacteremia of the subject,
The biological test data,
At least one of Creatinine Level, Albumin Level, C-reactive Protein (CRP) Level, White Blood Cell (WBC) Minimum, WBC Maximum, Prothrombin Time, Platelet Count and ALP (Alkaline phosphatase) including levels,
Further comprising the step of receiving the biosignal data for the object through the receiving unit,
The bacteremia prediction model is,
Further configured to predict the risk of developing bacteremia based on the biological test data and the biosignal data,
The biosignal data is
A method of predicting a risk of developing bacteremia, comprising at least one of systolic blood pressure (SBP), diastolic blood pressure (DBP), minimum body temperature, heart rate and respiration rate, and maximum body temperature.
상기 수신부를 통해, 상기 개체에 대한 임상적 특징 데이터를 수신하는 단계를 더 포함하고,
상기 균혈증 예측 모델은,
상기 생물학적 시험 데이터 및 상기 임상적 특징 데이터를 기초로 균혈증 발병 위험도를 예측하도록 더 구성되고,
상기 임상적 특징 데이터는,
성별, 연령, 혈액 배양 기간, ICU (intensive care unit) 치료 여부, 중심 정맥 카테터 (Central venous catheter) 삽입 여부, 스테로이드 치료 여부 및 항생제 치료 여부 중 적어도 하나인, 균혈증 발병 위험도의 예측 방법. According to claim 1,
Further comprising the step of receiving, through the receiving unit, clinical characteristic data for the subject,
The bacteremia prediction model is,
Further configured to predict the risk of developing bacteremia based on the biological test data and the clinical characteristic data,
The clinical characteristic data is
A method of predicting the risk of developing bacteremia, which is at least one of gender, age, blood culture period, intensive care unit (ICU) treatment, central venous catheter insertion, steroid treatment, and antibiotic treatment.
상기 생물학적 시험 데이터는,
상기 크레아틴 수치, 상기 알부민 수치, 상기 CRP 수치, 상기 WBC 최소 수치, 상기 WBC 최고 수치, 상기 프로트롬빈 시간 중 적어도 하나, 및 상기 혈소판 수, 상기 ALP 수치를 포함하는, 균혈증 발병 위험도의 예측 방법.According to claim 1,
The biological test data,
At least one of the creatine level, the albumin level, the CRP level, the WBC minimum level, the WBC maximum level, the prothrombin time, and the platelet count and the ALP level, the method of predicting the risk of developing bacteremia.
상기 생물학적 시험 데이터는,
ALT (alanine aminotransferase) 수치, 트롬포플라스틴 (thromboplastin) 의 응고 시간, AST (aspartate aminotransferase) 수치, CRP (C-reactive protein) 수치, 적혈구 침강 속도, FERR (ferritin) 수치, HMG (hemoglobin) 수치, PTINR (Prothrombin Time International Normalized Ratio), PTPER (Prothrombin time (%)), PTSEC (Prothrombin time (sec)), 적혈구 수치, TBIL (Total bilirubin) 수치, TCO2 (total carbon dioxide) 수치 및 백혈구 수치 중 적어도 하나를 더 포함하는, 균혈증 발병 위험도의 예측 방법.According to claim 1,
The biological test data,
ALT (alanine aminotransferase) level, thromboplastin clotting time, AST (aspartate aminotransferase) level, CRP (C-reactive protein) level, erythrocyte sedimentation rate, FERR (ferritin) level, HMG (hemoglobin) level, PTINR At least one of (Prothrombin Time International Normalized Ratio), PTPER (Prothrombin time (%)), PTSEC (Prothrombin time (sec)), red blood cell count, TBIL (Total bilirubin) level, TCO 2 (total carbon dioxide) level, and white blood cell count Further comprising, a method of predicting the risk of developing bacteremia.
상기 균혈증은, 급성 중증 균혈증 (acute severe bacteraemia) 인, 균혈증 발병 위험도의 예측 방법. According to claim 1,
The bacteremia is, acute severe bacteraemia, a method of predicting the risk of developing bacteremia.
상기 균혈증 예측 모델은,
MLP (multi-layer perceptron), SVM (support vector machine), RF (random forest), 및 복수의 모델의 조합으로 구성된 앙상블 모델, 선행 학습된 (pre-trained) 모델, Xgboost 모델 중 적어도 하나의 모델인, 균혈증 발병 위험도의 예측 방법.According to claim 1,
The bacteremia prediction model is,
MLP (multi-layer perceptron), SVM (support vector machine), RF (random forest), and at least one model of an ensemble model consisting of a combination of a plurality of models, a pre-trained model, and an Xgboost model , a method of predicting the risk of developing bacteremia.
상기 균혈증 예측 모델은,
상기 MLP 모델 또는 상기 Xgboost 모델이고,
상기 MLP 모델은 128 노드 (nodes) 또는 256 노드를 갖는 단일의 히든 레이어 (hidden layer) 를 포함하거나,
상기 단일의 히든 레이어가 복수로 존재하는 복수의 히든 레이어를 포함하는, 균혈증 발병 위험도의 예측 방법. 8. The method of claim 7,
The bacteremia prediction model is,
The MLP model or the Xgboost model,
The MLP model includes a single hidden layer having 128 nodes or 256 nodes, or
A method for predicting the risk of developing bacteremia, including a plurality of hidden layers in which the single hidden layer is present in plurality.
상기 균혈증 예측 모델은,
상기 수신부를 통해, 균혈증 발병 표본 개체 및 정상의 표본 개체에 대한 생물학적 실험 데이터, 생체 신호 데이터 및 임상적 특징 데이터로 구성된 학습용 데이터를 수신하는 단계, 및
상기 프로세서를 통해, 상기 학습용 데이터를 기초로, 균혈증 또는 정상을 예측하는 단계를 통해 학습된 모델인, 균혈증 발병 위험도의 예측 방법.According to claim 1,
The bacteremia prediction model is,
Receiving, through the receiving unit, learning data consisting of biological experimental data, biosignal data, and clinical characteristic data for a bacteremia-infected sample object and a normal sample object, and
Through the processor, based on the learning data, the model learned through the step of predicting bacteremia or normal, a method of predicting the risk of bacteremia.
상기 학습용 데이터를 수신하는 단계 이후에 수행되는,
상기 학습용 데이터를 평가하는 단계를 더 포함하고,
상기 학습용 데이터를 평가하는 단계는,
상기 프로세서를 통해, 상기 학습용 데이터에 대하여 균혈증과의 관련도 (relevance) 점수를 산출하는 단계, 및
상기 관련도 점수를 기초로, 미리 결정된 순위 내에 있는 균혈증 관련 학습용 데이터를 결정하는 단계를 포함하는, 균혈증 발병 위험도의 예측 방법.10. The method of claim 9,
Performed after the step of receiving the learning data,
Further comprising the step of evaluating the learning data,
The step of evaluating the learning data is,
Calculating, through the processor, a relevance score with respect to the learning data with respect to bacteremia; and
Based on the relevance score, the method of predicting the risk of developing bacteremia, comprising the step of determining data for bacteremia-related learning within a predetermined rank.
상기 학습용 데이터를 평가하는 단계는,
상기 프로세서를 통해, OOS (one-out search), LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), 및 SM (saliency map) 중 적어도 하나의 알고리즘에 기초하여,
상기 학습용 데이터에 대하여 균혈증과의 관련도 점수를 산출하는 단계, 및
상기 관련도 점수를 기초로, 미리 결정된 순위 내에 있는 균혈증 관련 학습용 데이터를 결정하는 단계를 포함하는, 균혈증 발병 위험도의 예측 방법.11. The method of claim 10,
The step of evaluating the learning data is,
Through the processor, based on at least one algorithm of one-out search (OOS), Layer-wise Relevance Propagation (LRP), gradient input (GI), integrated gradients (IG), and saliency map (SM),
calculating a relevance score with respect to the learning data for bacteremia, and
Based on the relevance score, the method of predicting the risk of developing bacteremia, comprising the step of determining data for bacteremia-related learning within a predetermined rank.
상기 프로세서를 통해, 상기 개체에 대하여 예측된 상기 균혈증 발병 위험도를 제공하는 단계를 더 포함하는, 균혈증 발병 위험도의 예측 방법.According to claim 1,
Through the processor, the method of predicting the risk of developing bacteremia further comprising the step of providing the predicted risk of developing bacteremia for the individual.
상기 균혈증 발병 위험도를 제공하는 단계는,
상기 균혈증 예측 모델에 의해 개체에 대한 균혈증 발병 위험도가 예측될 경우,
상기 프로세서를 통해, 위험 알림을 제공하는 단계를 포함하는, 균혈증 발병 위험도의 예측 방법.13. The method of claim 12,
The step of providing the risk of developing bacteremia comprises:
When the risk of developing bacteremia for an individual is predicted by the bacteremia prediction model,
Through the processor, the method of predicting the risk of developing bacteremia, comprising the step of providing a risk notification.
상기 균혈증 발병 위험도를 제공하는 단계는,
상기 프로세서를 통해, 상기 균혈증 예측 모델에 의해 개체에 대한 균혈증 발병 위험 확률을 산출하는 단계, 및
상기 균혈증 발병 위험 확률을 제공하는 단계를 포함하는, 균혈증 발병 위험도의 예측 방법.13. The method of claim 12,
The step of providing the risk of developing bacteremia comprises:
Calculating a risk probability of developing bacteremia for an individual by the bacteremia prediction model through the processor, and
A method of predicting the risk of developing bacteremia, comprising the step of providing the probability of the risk of developing bacteremia.
상기 수신부와 연결된 프로세서를 포함하고,
상기 프로세서는, 상기 생물학적 시험 데이터를 기초로 상기 개체에 대한 균혈증 발병 위험도를 예측하도록 구성된 균혈증 예측 모델을 이용하여, 상기 개체의 균혈증 발병 위험도를 예측하도록 구성되고,
상기 생물학적 시험 데이터는,
크레아틴 (Creatinine) 수치, 알부민 (Albumin) 수치, CRP (C-reactive protein) 수치, WBC (white blood cell) 최소 수치, WBC 최고 수치, 프로트롬빈 (Prothrombin) 시간 중 적어도 하나, 혈소판 (Platelet) 수 및 ALP (Alkaline phosphatase) 수치를 포함하고,
상기 수신부는, 개체에 대한 생체 신호 데이터를 수신하도록 더 구성되고,
상기 균혈증 예측 모델은,
상기 생물학적 시험 데이터 및 상기 생체 신호 데이터를 기초로 균혈증 발병 위험도를 예측하도록 더 구성되고,
상기 생체 신호 데이터는,
SBP (systolic blood pressure), DBP (diastolic blood pressure), 최저 체온, 심박수 및 호흡수 중 적어도 하나, 및 최고 체온을 포함하는, 균혈증 발병 위험도의 예측용 디바이스.a receiver configured to receive biological test data for the subject; and
and a processor connected to the receiver;
The processor is configured to predict the risk of developing bacteremia in the subject by using a bacteremia prediction model configured to predict the risk of developing bacteremia in the subject based on the biological test data,
The biological test data,
At least one of Creatinine Level, Albumin Level, C-reactive Protein (CRP) Level, White Blood Cell (WBC) Minimum, WBC Maximum, Prothrombin Time, Platelet Count and ALP (Alkaline phosphatase) including levels,
The receiving unit is further configured to receive biosignal data for an object,
The bacteremia prediction model is,
Further configured to predict the risk of developing bacteremia based on the biological test data and the biosignal data,
The biosignal data is
A device for predicting the risk of developing bacteremia, including at least one of systolic blood pressure (SBP), diastolic blood pressure (DBP), minimum body temperature, heart rate and respiration rate, and maximum body temperature.
상기 수신부는 상기 개체에 대한 임상적 특징 데이터를 수신하도록 더 구성되고,
상기 균혈증 예측 모델은,
상기 생물학적 시험 데이터 및 상기 임상적 특징 데이터를 기초로 균혈증 발병 위험도를 예측하도록 더 구성되고,
상기 임상적 특징 데이터는,
성별, 연령, 혈액 배양 기간, ICU (intensive care unit) 치료 여부, 중심 정맥 카테터 (Central venous catheter) 삽입 여부, 스테로이드 치료 여부 및 항생제 치료 여부 중 적어도 하나인, 균혈증 발병 위험도의 예측용 디바이스.16. The method of claim 15,
The receiving unit is further configured to receive clinical characteristic data for the subject,
The bacteremia prediction model is,
Further configured to predict the risk of developing bacteremia based on the biological test data and the clinical characteristic data,
The clinical characteristic data is
A device for predicting the risk of developing bacteremia, which is at least one of gender, age, blood culture period, intensive care unit (ICU) treatment, central venous catheter insertion, steroid treatment, and antibiotic treatment.
상기 생물학적 시험 데이터는,
상기 크레아틴 수치, 상기 알부민 수치, 상기 CRP 수치, 상기 WBC 최소 수치, 상기 WBC 최고 수치, 상기 프로트롬빈 시간 중 적어도 하나, 및 상기 혈소판 수, 상기 ALP 수치를 포함하는, 균혈증 발병 위험도의 예측용 디바이스.16. The method of claim 15,
The biological test data,
At least one of the creatine level, the albumin level, the CRP level, the WBC minimum level, the WBC maximum level, the prothrombin time, and the platelet count, the ALP level, the device for predicting the risk of developing bacteremia.
상기 생물학적 시험 데이터는,
ALT (alanine aminotransferase) 수치, 트롬포플라스틴 (thromboplastin) 의 응고 시간, AST (aspartate aminotransferase) 수치, CRP (C-reactive protein) 수치, 적혈구 침강 속도, FERR (ferritin) 수치, HMG (hemoglobin) 수치, PTINR (Prothrombin Time International Normalized Ratio), PTPER (Prothrombin time (%)), PTSEC (Prothrombin time (sec)), 적혈구 수치, TBIL (Total bilirubin) 수치, TCO2 (total carbon dioxide) 수치 및 백혈구 수치 중 적어도 하나를 더 포함하는, 균혈증 발병 위험도의 예측용 디바이스.16. The method of claim 15,
The biological test data,
ALT (alanine aminotransferase) level, thromboplastin clotting time, AST (aspartate aminotransferase) level, CRP (C-reactive protein) level, erythrocyte sedimentation rate, FERR (ferritin) level, HMG (hemoglobin) level, PTINR At least one of (Prothrombin Time International Normalized Ratio), PTPER (Prothrombin time (%)), PTSEC (Prothrombin time (sec)), red blood cell count, TBIL (Total bilirubin) level, TCO 2 (total carbon dioxide) level, and white blood cell count Further comprising, a device for predicting the risk of developing bacteremia.
상기 균혈증은, 급성 중증 균혈증 (acute severe bacteraemia) 인, 균혈증 발병 위험도의 예측용 디바이스.16. The method of claim 15,
The bacteremia is, acute severe bacteraemia, a device for predicting the risk of developing bacteremia.
상기 균혈증 예측 모델은,
MLP (multi-layer perceptron), SVM (support vector machine), RF (random forest), 및 복수의 모델의 조합으로 구성된 앙상블 모델, 선행 학습된 (pre-trained) 모델, Xgboost 모델 중 적어도 하나의 모델인, 균혈증 발병 위험도의 예측용 디바이스.16. The method of claim 15,
The bacteremia prediction model is,
MLP (multi-layer perceptron), SVM (support vector machine), RF (random forest), and at least one model of an ensemble model consisting of a combination of a plurality of models, a pre-trained model, and an Xgboost model , A device for predicting the risk of developing bacteremia.
상기 균혈증 예측 모델은,
상기 MLP 모델 또는 상기 Xgboost 모델이고,
상기 MLP 모델은 128 노드 (nodes) 또는 256 노드를 갖는 단일의 히든 레이어 (hidden layer) 를 포함하거나,
상기 단일의 히든 레이어가 복수로 존재하는 복수의 히든 레이어를 포함하는, 균혈증 발병 위험도의 예측용 디바이스.22. The method of claim 21,
The bacteremia prediction model is,
The MLP model or the Xgboost model,
The MLP model includes a single hidden layer having 128 nodes or 256 nodes, or
A device for predicting the risk of developing bacteremia, comprising a plurality of hidden layers in which the single hidden layer is present in plurality.
상기 균혈증 예측 모델은,
균혈증 발병 표본 개체 및 정상의 표본 개체에 대한 생물학적 실험 데이터, 생체 신호 데이터 및 임상적 특징 데이터로 구성된 학습용 데이터를 수신하고, 상기 학습용 데이터를 기초로, 균혈증 또는 정상을 예측하는 단계를 통해 학습된 모델인, 균혈증 발병 위험도의 예측용 디바이스.16. The method of claim 15,
The bacteremia prediction model is,
A model trained through the steps of receiving training data consisting of biological experimental data, biosignal data, and clinical characteristic data for a bacteremia-infected sample object and a normal sample object, and predicting bacteremia or normality based on the training data A device for predicting the risk of developing phosphorus and bacteremia.
상기 개체에 대하여 예측된 상기 균혈증 발병 위험도를 제공하도록 구성된 출력부를 더 포함하는, 균혈증 발병 위험도의 예측용 디바이스.16. The method of claim 15,
The device for predicting the risk of developing bacteremia, further comprising an output unit configured to provide the predicted risk of developing bacteremia for the individual.
상기 출력부는,
상기 균혈증 예측 모델에 의해 개체에 대한 균혈증 발병 위험도가 예측될 경우,
위험 알림을 제공하도록 구성된, 균혈증 발병 위험도의 예측용 디바이스.25. The method of claim 24,
the output unit,
When the risk of developing bacteremia for an individual is predicted by the bacteremia prediction model,
A device for predicting the risk of developing bacteremia, configured to provide a risk alert.
상기 균혈증 예측 모델은,
상기 개체에 대한 균혈증 발병 위험 확률을 산출하도록 더 구성되고,
상기 출력부는,
상기 균혈증 발병 위험 확률을 제공하도록 더 구성된, 균혈증 발병 위험도의 예측용 디바이스.25. The method of claim 24,
The bacteremia prediction model is,
further configured to calculate a risk probability of developing bacteremia for the subject,
the output unit,
A device for predicting the risk of developing bacteremia, further configured to provide the probability of developing the bacteremia.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20190036982 | 2019-03-29 | ||
KR1020190036982 | 2019-03-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200114975A KR20200114975A (en) | 2020-10-07 |
KR102287968B1 true KR102287968B1 (en) | 2021-08-09 |
Family
ID=72883932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190097366A Active KR102287968B1 (en) | 2019-03-29 | 2019-08-09 | Method for predicting of bacteremia risk and device for predicting of bacteremia risk using the same |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102287968B1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117877649B (en) * | 2023-12-05 | 2024-05-31 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | A marker panel and system for predicting bacteremia in tumor patients |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008522604A (en) | 2004-12-09 | 2008-07-03 | イギリス国 | Early detection of sepsis |
JP2012502671A (en) | 2008-05-12 | 2012-02-02 | アーリーセンス エルティディ | Monitoring, prediction and treatment of clinical symptoms |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101903526B1 (en) * | 2015-08-19 | 2018-10-05 | 한국전자통신연구원 | Disease forecast device based on concentration information of biomaterial and forecasting method thereof |
-
2019
- 2019-08-09 KR KR1020190097366A patent/KR102287968B1/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008522604A (en) | 2004-12-09 | 2008-07-03 | イギリス国 | Early detection of sepsis |
JP2012502671A (en) | 2008-05-12 | 2012-02-02 | アーリーセンス エルティディ | Monitoring, prediction and treatment of clinical symptoms |
Non-Patent Citations (4)
Title |
---|
Athanasios Tsoukalas 외 2명, From Data to Optimal Decision Making: A Data-Driven, Probabilistic Machine Learning Approach to Decision Support for Patients With Sepsis, JMIR Med Inform 2015;3(1):e11 |
Bernard Hernanderz 외 7명, Supervised learning for infection risk inference using pathology data, BMC Medical Informatics and Decision Making (2017) 17:168 |
Cole Beeler, et al., Assessing patient risk of central line-associated bacteremia via machine learning, American Journal of Infection Control, Vol.46, Iss.9, September 2018, pp.986~991 |
Mical Paul, et al., Prediction of Bacteremia Using TREAT, a Computerized Decision-Support System, Clinical Infectious Diseases, Vol.42, Iss.9, 1 May 2006, pp.1274~1282 |
Also Published As
Publication number | Publication date |
---|---|
KR20200114975A (en) | 2020-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Song et al. | Comparison of machine learning and logistic regression models in predicting acute kidney injury: A systematic review and meta-analysis | |
KR102183744B1 (en) | Methods for pedicting risk of delirium and devices for pedicting risk of delirium using the same | |
Kijpaisalratana et al. | Machine learning algorithms for early sepsis detection in the emergency department: a retrospective study | |
Koyner et al. | Development of a multicenter ward–based AKI prediction model | |
KR102446376B1 (en) | Method for predicting of mortality risk or sepsis risk and device for predicting of mortality risk or sepsis risk using the same | |
Lyons et al. | Serum albumin as an outcome predictor in hospital emergency medical admissions | |
Ghassemi et al. | Predicting intervention onset in the ICU with switching state space models | |
US20200113503A1 (en) | Method For Predicting Of Mortality Risk Or Sepsis Risk And Device For Predicting Of Mortality Risk Or Sepsis Risk Using The Same | |
Yilmaz et al. | The diagnostic and prognostic significance of soluble urokinase plasminogen activator receptor in systemic inflammatory response syndrome | |
KR102257830B1 (en) | Methods for pedicting mortality risk and devices for pedicting mortality risk using the same | |
US20220323018A1 (en) | Automatic prediction of blood infections | |
Rodriguez et al. | Supervised classification techniques for prediction of mortality in adult patients with sepsis | |
Ding et al. | Mortality prediction for ICU patients combining just-in-time learning and extreme learning machine | |
Ozaydin et al. | Are scoring systems sufficient for predicting mortality due to sepsis in the emergency department? | |
Carrara et al. | Mortality prediction model of septic shock patients based on routinely recorded data | |
Effah et al. | Machine learning-assisted prediction of pneumonia based on non-invasive measures | |
Cheng et al. | Machine learning models for predicting in-hospital mortality in patient with sepsis: Analysis of vital sign dynamics | |
CN113057587A (en) | Disease early warning method and device, electronic equipment and storage medium | |
KR102310888B1 (en) | Methods for providing information of mortality risk and devices for providing information of mortality risk using the same | |
KR102287968B1 (en) | Method for predicting of bacteremia risk and device for predicting of bacteremia risk using the same | |
Fang et al. | Prediction of acute kidney injury after total aortic arch replacement with serum cystatin C and urine N-acetyl-β-d-glucosaminidase: a prospective observational study | |
Matsushita et al. | Complete blood count and C-reactive protein to predict positive blood culture among neonates using machine learning algorithms | |
Shakeri et al. | Exploring features contributing to the early prediction of sepsis using machine learning | |
Iqbal et al. | Application of artificial intelligence to predict the sepsis in neonates admitted in neonatal intensive care unit | |
Yang et al. | Development of a machine learning model for the prediction of the short-term mortality in patients in the intensive care unit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20190809 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210120 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20210714 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20210803 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20210803 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20240805 Start annual number: 4 End annual number: 4 |