KR101974769B1 - 앙상블-기반 연구 추천 시스템 및 방법 - Google Patents
앙상블-기반 연구 추천 시스템 및 방법 Download PDFInfo
- Publication number
- KR101974769B1 KR101974769B1 KR1020177027662A KR20177027662A KR101974769B1 KR 101974769 B1 KR101974769 B1 KR 101974769B1 KR 1020177027662 A KR1020177027662 A KR 1020177027662A KR 20177027662 A KR20177027662 A KR 20177027662A KR 101974769 B1 KR101974769 B1 KR 101974769B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- model
- trained
- clinical outcome
- ensemble
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011160 research Methods 0.000 title claims abstract description 68
- 238000000034 method Methods 0.000 title claims description 44
- 229940079593 drug Drugs 0.000 claims abstract description 65
- 239000003814 drug Substances 0.000 claims abstract description 65
- 230000004044 response Effects 0.000 claims abstract description 23
- 238000010801 machine learning Methods 0.000 claims abstract description 22
- 238000004422 calculation algorithm Methods 0.000 claims description 43
- 238000012549 training Methods 0.000 claims description 38
- 230000014509 gene expression Effects 0.000 claims description 20
- 238000005259 measurement Methods 0.000 claims description 13
- 108090000623 proteins and genes Proteins 0.000 claims description 13
- 238000012070 whole genome sequencing analysis Methods 0.000 claims description 13
- 238000002493 microarray Methods 0.000 claims description 11
- 102000004169 proteins and genes Human genes 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000003559 RNA-seq method Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 6
- 230000004083 survival effect Effects 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 201000010099 disease Diseases 0.000 claims description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 3
- 238000007482 whole exome sequencing Methods 0.000 claims description 3
- 238000012417 linear regression Methods 0.000 claims description 2
- 150000001875 compounds Chemical class 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 31
- 238000013210 evaluation model Methods 0.000 description 22
- ZBNZXTGUTAYRHI-UHFFFAOYSA-N Dasatinib Chemical compound C=1C(N2CCN(CCO)CC2)=NC(C)=NC=1NC(S1)=NC=C1C(=O)NC1=C(C)C=CC=C1Cl ZBNZXTGUTAYRHI-UHFFFAOYSA-N 0.000 description 15
- 239000002067 L01XE06 - Dasatinib Substances 0.000 description 15
- 229960002448 dasatinib Drugs 0.000 description 15
- 238000013459 approach Methods 0.000 description 11
- 238000012706 support-vector machine Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 9
- 206010028980 Neoplasm Diseases 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 241000288113 Gallirallus australis Species 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- 229940046176 T-cell checkpoint inhibitor Drugs 0.000 description 2
- 239000012644 T-cell checkpoint inhibitor Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 239000013610 patient sample Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 206010071602 Genetic polymorphism Diseases 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- OYONTEXKYJZFHA-SSHUPFPWSA-N PHA-665752 Chemical compound CC=1C(C(=O)N2[C@H](CCC2)CN2CCCC2)=C(C)NC=1\C=C(C1=C2)/C(=O)NC1=CC=C2S(=O)(=O)CC1=C(Cl)C=CC=C1Cl OYONTEXKYJZFHA-SSHUPFPWSA-N 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011338 personalized therapy Methods 0.000 description 1
- 230000002974 pharmacogenomic effect Effects 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000002924 silencing RNA Substances 0.000 description 1
- 238000005549 size reduction Methods 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229940121358 tyrosine kinase inhibitor Drugs 0.000 description 1
- 239000005483 tyrosine kinase inhibitor Substances 0.000 description 1
- 150000004917 tyrosine kinase inhibitor derivatives Chemical class 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Chemical & Material Sciences (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Business, Economics & Management (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
Description
도 2는 결과 예측 모델의 앙상블의 생성을 예시한다.
도 3a는 다양한 약물에 대한 검증 데이터 세트로부터 생성된 모델의 평균 정확도로 순위가 지정된 약물 반응의 예측성을 나타낸다.
도 3b는 다양한 약물에 대한 검증 데이터 세트로부터 생성된 모델의 평균 정확도 이득으로 순위가 재지정된 도 3a로부터의 약물 반응의 예측성을 나타낸다.
도 4a는 Dasatinib과 관련된 데이터를 나타내는 모델의 앙상블에서 모델의 평균 정확도의 막대그래프를 나타내며 Dasatinib이 관심있는 연구 대상이 되는 것을 제안한다.
도 4b는 Dasatinib과 관련된 데이터를 나타내는 모델의 앙상블에서 모델의 평균 정확도 이득의 막대그래프로서 4a로부터의 데이터를 나타낸다.
도 5a는 막대그래프 형태로 정확도 관점에서 Dasatinib에 대한 게놈 데이터 세트의 유형의 예측성을 나타낸다.
도 5b는 명료성을 위해 도 5a의 데이터를 정확도 막대 차트 형태로 나타낸다.
도 5c는 도 5a로부터의 데이터를 나타내고, 막대그래프 형태의 정확도 이득 관점으로부터 Dasatinib에 대한 게놈 데이터 세트의 유형의 예측성을 나타낸다.
도 5d는 명확성을 위해 도 5c로부터의 데이터를 정확도 이득 막대 차트 형태로 나타낸다.
Claims (31)
- 임상 연구 프로젝트 기계 학습 컴퓨터 시스템으로서,
적어도 하나의 프로세서;
상기 프로세서와 결합되는 적어도 하나의 메모리로서,
집단으로부터 추출한 조직 샘플을 나타내는 게놈 데이터 세트; 및
상기 집단과 연관되고 치료 후 상기 조직 샘플의 임상 결과를 나타내는 임상 결과 데이터 세트를 저장하도록 구성되고,
상기 게놈 데이터 세트 및 상기 임상 결과 데이터는 복수의 잠재적 연구 프로젝트에 관련되는, 적어도 하나의 메모리; 및
상기 적어도 하나의 메모리 내에 저장된 소프트웨어 명령에 따라 상기 적어도 하나의 프로세서상에서 실행가능한 적어도 하나의 모델링 엔진을 포함하며,
상기 적어도 하나의 모델링 엔진은:
한 세트의 예측 모델 템플릿을 획득하고;
상기 예측 모델 템플릿의 세트에 기초하여 그리고 상기 게놈 데이터 세트 및 상기 임상 결과 데이터 세트의 함수로서 훈련된(trained) 임상 결과 예측 모델의 앙상블을 생성하되, 각각의 상기 훈련된 임상 결과 예측 모델은 대응하는 훈련된 임상 결과 예측 모델의 속성을 나타내는 모델 특성 측정 기준을 포함하고;
상기 훈련된 임상 결과 예측 모델의 앙상블을 상기 속성에 기초하여 복수의 잠재적 연구 프로젝트와 상관시키고;
복수의 상기 훈련된 임상 결과 예측 모델의 예측 모델 특성 측정 기준에 따른 순위 지정 기준에 따라 상기 복수의 잠재적 연구 프로젝트로부터 선택된 잠재적 연구 프로젝트의 순위 지정 목록을 생성하고; 그리고
장치가 상기 잠재적 연구 프로젝트의 순위 지정 목록을 제공하도록;
상기 프로세서를 구성하는,
시스템. - 제 1 항에 있어서,
상기 예측 모델 템플릿의 세트는 적어도 10개의 예측 모델 유형을 포함하는,
시스템. - 제 1 항에 있어서,
상기 예측 모델 템플릿의 세트는 선형 회귀 알고리즘, 클러스터링 알고리즘, 인공 신경망, 및 분류자 알고리즘의 구현 중 적어도 하나를 포함하는,
시스템. - 제 3 항에 있어서,
상기 분류자 알고리즘의 구현 중 적어도 하나는,
준-감독 분류자, 분류자의 유형들인 선형 분류자, NMF-기반 분류자, 그래픽-기반 분류자, 트리-기반 분류자, 베이지안-기반 분류자, 규칙-기반 분류자, 넷-기반 분류자, 및 kNN 분류자
중 적어도 하나를 나타내는,
시스템. - 제 1 항에 있어서,
상기 모델 특성 측정 기준은 모델 정확도 측정을 포함하는,
시스템. - 제 5 항에 있어서,
상기 모델 정확도 측정은 모델 정확도 이득을 포함하는,
시스템. - 제 1 항에 있어서,
상기 모델 특성 측정 기준은 모델 성능(performance) 측정 기준들인: 곡선하 면적 (AUC) 측정 기준, R2 측정 기준, p-값, 및 실루엣 계수 중 적어도 하나를 포함하는,
시스템. - 제 1 항에 있어서,
상기 순위 지정 기준은 상기 모델 특성 측정 기준으로부터 유도된 앙상블 측정 기준에 따라 규정되는,
시스템. - 제 1 항에 있어서,
훈련된 임상 결과 예측 모델의 앙상블은 상기 게놈 데이터 세트 및 상기 임상 결과 데이터 세트로부터 선택되는 완료된 집단 데이터 세트 상에서 훈련되는 적어도 하나의 완전히 훈련된 임상 결과 예측 모델을 포함하는,
시스템. - 제 1 항에 있어서,
상기 임상 결과 데이터는 약물 반응 결과 데이터를 포함하는,
시스템. - 제 10 항에 있어서,
상기 약물 반응 결과 데이터는 복수의 약물에 대한: IC50 데이터, GI50 데이터, Amax 데이터, ACarea 데이터, 필터링된 ACarea 데이터 및 최대 투여량(dose) 데이터 중 적어도 하나를 포함하는,
시스템. - 제 10 항에 있어서,
상기 약물 반응 결과 데이터는 적어도 100개의 약물에 대한 데이터를 포함하는,
시스템. - 제 1 항에 있어서,
상기 게놈 데이터 세트는: 마이크로 어레이 발현 데이터, 마이크로 어레이 카피 수 데이터, PARADIGM 데이터, SNP 데이터, 전체 게놈 시퀀싱 (WGS) 데이터, RNAseq 데이터, 및 단백질 마이크로 어레이 데이터 중 적어도 하나를 포함하는,
시스템. - 제 1 항에 있어서,
상기 잠재적 연구 프로젝트에는 상기 게놈 데이터 세트와 관련하여 수집할 게놈 데이터의 유형을 포함하는,
시스템. - 제 14 항에 있어서,
상기 수집할 게놈 데이터의 유형은: 마이크로 어레이 발현 데이터, 마이크로 어레이 카피 수 데이터, PARADIGM 데이터, SNP 데이터, 전체 게놈 시퀀싱 (WGS) 데이터, 전체 엑솜 시퀀싱 데이터, RNAseq 데이터, 및 단백질 마이크로 어레이 데이터 중 적어도 하나를 포함하는,
시스템. - 제 1 항에 있어서,
상기 잠재적 연구 프로젝트는 상기 임상 결과 데이터 세트와 관련하여 수집할 임상 결과 데이터의 유형을 포함하는,
시스템. - 제 16 항에 있어서,
상기 수집할 임상 결과 데이터의 유형은: IC50 데이터, GI50 데이터, Amax 데이터, ACarea 데이터, 필터링된 ACarea 데이터 및 최대 투여량(dose) 데이터를 포함하는,
시스템. - 제 1 항에 있어서,
상기 잠재적 연구 프로젝트는 예측 연구의 유형을 포함하는,
시스템. - 제 18 항에 있어서,
상기 예측 연구의 유형은: 약물 반응 연구, 게놈 발현 연구, 생존성 연구, 하위 유형 분석 연구, 하위 유형 차이 연구, 분자 하위 유형 연구, 및 질병 상태 연구 중 적어도 하나를 포함하는,
시스템. - 제 1 항에 있어서,
상기 적어도 하나의 메모리는 디스크 어레이를 포함하는,
시스템. - 제 1 항에 있어서,
상기 적어도 하나의 프로세서는 네트워크를 통해 분산된 복수의 프로세서를 포함하는,
시스템. - 기계 학습 결과를 생성하는 방법으로서,
비-일시적 컴퓨터 판독 가능 메모리에, 훈련(training) 데이터 세트를 저장하는 단계로서, 상기 훈련 데이터 세트는:
a) 집단으로부터 추출한 조직 샘플을 나타내는 게놈 데이터 세트, 및
b) 상기 집단과 연관되고 치료 후 상기 조직 샘플의 임상 결과를 나타내는 임상 결과 데이터 세트를 포함하고,
상기 훈련 데이터 세트는 복수의 잠재적 연구 프로젝트와 관련되는, 단계;
모델링 컴퓨터를 통해, 한 세트의 예측 모델 템플릿을 획득하는 단계;
상기 모델링 컴퓨터를 통해, 상기 게놈 데이터 세트 및 상기 임상 결과 데이터 세트의 함수로서 상기 예측 모델 템플릿을 훈련함으로써 훈련된 임상 결과 예측 모델의 앙상블을 생성하는 단계로서, 각각의 상기 훈련된 임상 결과 예측 모델은 대응하는 훈련된 임상 결과 예측 모델의 속성을 나타내는 모델 특성 측정 기준을 포함하는, 단계;
상기 훈련된 임상 결과 예측 모델의 앙상블을 상기 속성에 기초하여 복수의 잠재적 연구 프로젝트와 상관시키는 단계;
상기 모델링 컴퓨터를 통해, 복수의 상기 훈련된 임상 결과 예측 모델의 예측 모델 특성 측정 기준에 따른 순위 지정 기준에 따라 상기 복수의 잠재적 연구 프로젝트로부터 선택된 잠재적 연구 프로젝트의 순위 지정 목록을 생성하는 단계; 및
상기 모델링 컴퓨터를 통해, 장치가 상기 잠재적 연구 프로젝트의 순위 지정 목록을 제공하도록 하는 단계를 포함하는,
방법. - 제 22 항에 있어서,
상기 훈련된 임상 결과 예측 모델의 앙상블을 생성하는 단계는 상기 게놈 데이터 세트 및 상기 임상 결과 데이터 세트에 대한 기계 학습 알고리즘의 복수의 구현을 훈련하는 단계를 포함하는,
방법. - 제 23 항에 있어서,
상기 기계 학습 알고리즘의 복수의 구현은 기계 학습 알고리즘의 적어도 10개의 상이한 유형을 포함하는,
방법. - 제 22 항에 있어서,
상기 예측 모델 특성 측정 기준은 성능 측정 기준들인: 곡선하 면적 (AUC) 측정 기준, R2 측정 기준, p-값, 정확도, 정확도 이득, 및 실루엣 계수 중 적어도 하나를 포함하는,
방법. - 제 22 항에 있어서,
상기 예측 모델 특성 측정 기준은 앙상블 측정 기준을 포함하는,
방법. - 제 26 항에 있어서,
잠재적 연구 프로젝트의 순위 지정 목록을 생성하는 단계는 상기 앙상블 측정 기준에 따라 상기 잠재적 연구 프로젝트의 순위를 지정하는 단계를 포함하는,
방법.
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562127546P | 2015-03-03 | 2015-03-03 | |
US62/127,546 | 2015-03-03 | ||
PCT/US2016/020742 WO2016141214A1 (en) | 2015-03-03 | 2016-03-03 | Ensemble-based research recommendation systems and methods |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197011738A Division KR20190047108A (ko) | 2015-03-03 | 2016-03-03 | 앙상블-기반 연구 추천 시스템 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180008403A KR20180008403A (ko) | 2018-01-24 |
KR101974769B1 true KR101974769B1 (ko) | 2019-05-02 |
Family
ID=56849144
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197011738A Withdrawn KR20190047108A (ko) | 2015-03-03 | 2016-03-03 | 앙상블-기반 연구 추천 시스템 및 방법 |
KR1020177027662A Active KR101974769B1 (ko) | 2015-03-03 | 2016-03-03 | 앙상블-기반 연구 추천 시스템 및 방법 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197011738A Withdrawn KR20190047108A (ko) | 2015-03-03 | 2016-03-03 | 앙상블-기반 연구 추천 시스템 및 방법 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20180039731A1 (ko) |
EP (1) | EP3265942A4 (ko) |
JP (2) | JP6356359B2 (ko) |
KR (2) | KR20190047108A (ko) |
CN (1) | CN107980162A (ko) |
AU (3) | AU2016226162B2 (ko) |
CA (1) | CA2978708A1 (ko) |
IL (2) | IL254279B (ko) |
WO (1) | WO2016141214A1 (ko) |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12027243B2 (en) | 2017-02-17 | 2024-07-02 | Hc1 Insights, Inc. | System and method for determining healthcare relationships |
US20200294642A1 (en) * | 2018-08-08 | 2020-09-17 | Hc1.Com Inc. | Methods and systems for a pharmacological tracking and reporting platform |
EP3248127A4 (en) | 2015-01-20 | 2018-08-08 | Nantomics, LLC | Systems and methods for response prediction to chemotherapy in high grade bladder cancer |
US10395759B2 (en) | 2015-05-18 | 2019-08-27 | Regeneron Pharmaceuticals, Inc. | Methods and systems for copy number variant detection |
CN108603922A (zh) | 2015-11-29 | 2018-09-28 | 阿特瑞斯公司 | 自动心脏体积分割 |
CN115273970A (zh) | 2016-02-12 | 2022-11-01 | 瑞泽恩制药公司 | 用于检测异常核型的方法和系统 |
US10552002B1 (en) * | 2016-09-27 | 2020-02-04 | Palantir Technologies Inc. | User interface based variable machine modeling |
US10552432B2 (en) | 2016-10-12 | 2020-02-04 | Salesforce.Com, Inc. | Ranking search results using hierarchically organized machine learning based models |
US11056241B2 (en) * | 2016-12-28 | 2021-07-06 | Canon Medical Systems Corporation | Radiotherapy planning apparatus and clinical model comparison method |
US10902598B2 (en) | 2017-01-27 | 2021-01-26 | Arterys Inc. | Automated segmentation utilizing fully convolutional networks |
US11062792B2 (en) | 2017-07-18 | 2021-07-13 | Analytics For Life Inc. | Discovering genomes to use in machine learning techniques |
US11139048B2 (en) | 2017-07-18 | 2021-10-05 | Analytics For Life Inc. | Discovering novel features to use in machine learning techniques, such as machine learning techniques for diagnosing medical conditions |
KR101953762B1 (ko) * | 2017-09-25 | 2019-03-04 | (주)신테카바이오 | 이종 특성정보 병합 데이터 기반 인공지능 딥러닝 모델을 이용한 약물 적응증 및 반응 예측 시스템 및 방법 |
WO2019103912A2 (en) * | 2017-11-22 | 2019-05-31 | Arterys Inc. | Content based image retrieval for lesion analysis |
KR102327062B1 (ko) * | 2018-03-20 | 2021-11-17 | 딜로이트컨설팅유한회사 | 임상시험 결과 예측 장치 및 방법 |
GB201805302D0 (en) * | 2018-03-29 | 2018-05-16 | Benevolentai Tech Limited | Ensemble Model Creation And Selection |
US11475995B2 (en) * | 2018-05-07 | 2022-10-18 | Perthera, Inc. | Integration of multi-omic data into a single scoring model for input into a treatment recommendation ranking |
US11574718B2 (en) | 2018-05-31 | 2023-02-07 | Perthera, Inc. | Outcome driven persona-typing for precision oncology |
US10922362B2 (en) * | 2018-07-06 | 2021-02-16 | Clover Health | Models for utilizing siloed data |
CN109064294B (zh) * | 2018-08-21 | 2021-11-12 | 重庆大学 | 一种融合时间因素、文本特征和相关性的药品推荐方法 |
US11250346B2 (en) * | 2018-09-10 | 2022-02-15 | Google Llc | Rejecting biased data using a machine learning model |
CA3119749A1 (en) * | 2018-11-15 | 2020-05-22 | Ampel Biosolutions, Llc | Machine learning disease prediction and treatment prioritization |
JP6737519B1 (ja) * | 2019-03-07 | 2020-08-12 | 株式会社テンクー | プログラム、学習モデル、情報処理装置、情報処理方法および学習モデルの生成方法 |
EP3745409A1 (en) * | 2019-05-29 | 2020-12-02 | Koninklijke Philips N.V. | Methods and apparatus for generating a graphical representation |
US11195270B2 (en) * | 2019-07-19 | 2021-12-07 | Becton Dickinson Rowa Germany Gmbh | Measuring and verifying drug portions |
KR102270303B1 (ko) | 2019-08-23 | 2021-06-30 | 삼성전기주식회사 | 적층형 커패시터 및 그 실장 기판 |
US20210110926A1 (en) * | 2019-10-15 | 2021-04-15 | The Chinese University Of Hong Kong | Prediction models incorporating stratification of data |
KR102120214B1 (ko) * | 2019-11-15 | 2020-06-08 | (주)유엠로직스 | 앙상블 기계학습 기법을 이용한 사이버 표적공격 탐지 시스템 및 그 탐지 방법 |
US11049590B1 (en) * | 2020-02-12 | 2021-06-29 | Peptilogics, Inc. | Artificial intelligence engine architecture for generating candidate drugs |
MX2022009999A (es) * | 2020-02-14 | 2023-01-19 | Caris Mpi Inc | Puntuacion de prevalencia genomica panomica. |
CN111367798B (zh) * | 2020-02-28 | 2021-05-28 | 南京大学 | 一种持续集成及部署结果的优化预测方法 |
US11308436B2 (en) * | 2020-03-17 | 2022-04-19 | King Fahd University Of Petroleum And Minerals | Web-integrated institutional research analytics platform |
CN113821332B (zh) * | 2020-06-19 | 2024-02-13 | 富联精密电子(天津)有限公司 | 自动机器学习系统效能调优方法、装置、设备及介质 |
CA3125861A1 (en) * | 2020-07-27 | 2021-10-06 | Thales Canada Inc. | Method of and system for online machine learning with dynamic model evaluation and selection |
CN111930350B (zh) * | 2020-08-05 | 2024-04-09 | 深轻(上海)科技有限公司 | 一种基于计算模板的精算模型建立方法 |
GB2622963A (en) * | 2021-05-06 | 2024-04-03 | January Inc | Systems, methods and devices for predicting personalized biological state with model produced with meta-learning |
US20220398055A1 (en) * | 2021-06-11 | 2022-12-15 | The Procter & Gamble Company | Artificial intelligence based multi-application systems and methods for predicting user-specific events and/or characteristics and generating user-specific recommendations based on app usage |
CN114707175B (zh) * | 2022-03-21 | 2024-07-23 | 西安电子科技大学 | 机器学习模型敏感信息的处理方法、系统、设备及终端 |
US20240161017A1 (en) * | 2022-05-17 | 2024-05-16 | Derek Alexander Pisner | Connectome Ensemble Transfer Learning |
US11881315B1 (en) | 2022-08-15 | 2024-01-23 | Nant Holdings Ip, Llc | Sensor-based leading indicators in a personal area network; systems, methods, and apparatus |
CN115458045B (zh) * | 2022-09-15 | 2023-05-23 | 哈尔滨工业大学 | 一种基于异构信息网络和推荐系统的药物对相互作用预测方法 |
KR20250056391A (ko) * | 2023-10-19 | 2025-04-28 | 주식회사 메인 | 임상시험 결과 예측 시스템 및 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060173663A1 (en) | 2004-12-30 | 2006-08-03 | Proventys, Inc. | Methods, system, and computer program products for developing and using predictive models for predicting a plurality of medical outcomes, for evaluating intervention strategies, and for simultaneously validating biomarker causality |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7370021B2 (en) * | 2002-03-15 | 2008-05-06 | Pacific Edge Biotechnology Ltd. | Medical applications of adaptive learning systems using gene expression data |
EP1579383A4 (en) * | 2002-10-24 | 2006-12-13 | Univ Duke | BINARY PREDICTION TREE MODELING WITH MANY PREDICTORS AND USES THEREOF FOR CLINICAL AND GENETIC APPLICATIONS |
US20050210015A1 (en) * | 2004-03-19 | 2005-09-22 | Zhou Xiang S | System and method for patient identification for clinical trials using content-based retrieval and learning |
TWI363309B (en) * | 2006-11-30 | 2012-05-01 | Navigenics Inc | Genetic analysis systems, methods and on-line portal |
US7899764B2 (en) * | 2007-02-16 | 2011-03-01 | Siemens Aktiengesellschaft | Medical ontologies for machine learning and decision support |
WO2010030794A1 (en) * | 2008-09-10 | 2010-03-18 | Digital Infuzion, Inc. | Machine learning methods and systems for identifying patterns in data |
US8484225B1 (en) * | 2009-07-22 | 2013-07-09 | Google Inc. | Predicting object identity using an ensemble of predictors |
AU2012225666A1 (en) * | 2011-03-04 | 2013-09-26 | Kew Group, Llc | Personalized medical management system, networks, and methods |
US9934361B2 (en) * | 2011-09-30 | 2018-04-03 | Univfy Inc. | Method for generating healthcare-related validated prediction models from multiple sources |
MX352274B (es) * | 2011-10-21 | 2017-11-16 | Nestec Sa | Metodos para mejorar el diagnostico de enfermedad inflamatoria intestinal. |
US9767526B2 (en) * | 2012-05-11 | 2017-09-19 | Health Meta Llc | Clinical trials subject identification system |
US20140143188A1 (en) * | 2012-11-16 | 2014-05-22 | Genformatic, Llc | Method of machine learning, employing bayesian latent class inference: combining multiple genomic feature detection algorithms to produce an integrated genomic feature set with specificity, sensitivity and accuracy |
US20140279754A1 (en) * | 2013-03-15 | 2014-09-18 | The Cleveland Clinic Foundation | Self-evolving predictive model |
-
2016
- 2016-03-03 AU AU2016226162A patent/AU2016226162B2/en active Active
- 2016-03-03 KR KR1020197011738A patent/KR20190047108A/ko not_active Withdrawn
- 2016-03-03 JP JP2017546211A patent/JP6356359B2/ja active Active
- 2016-03-03 EP EP16759516.4A patent/EP3265942A4/en not_active Withdrawn
- 2016-03-03 CA CA2978708A patent/CA2978708A1/en not_active Withdrawn
- 2016-03-03 US US15/555,290 patent/US20180039731A1/en active Pending
- 2016-03-03 CN CN201680025643.9A patent/CN107980162A/zh not_active Withdrawn
- 2016-03-03 KR KR1020177027662A patent/KR101974769B1/ko active Active
- 2016-03-03 WO PCT/US2016/020742 patent/WO2016141214A1/en active Application Filing
-
2017
- 2017-09-03 IL IL254279A patent/IL254279B/en active IP Right Grant
-
2018
- 2018-01-12 AU AU2018200276A patent/AU2018200276B2/en active Active
- 2018-04-02 IL IL258482A patent/IL258482A/en unknown
- 2018-06-13 JP JP2018112693A patent/JP2018173969A/ja not_active Abandoned
-
2019
- 2019-07-25 AU AU2019208223A patent/AU2019208223A1/en not_active Withdrawn
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060173663A1 (en) | 2004-12-30 | 2006-08-03 | Proventys, Inc. | Methods, system, and computer program products for developing and using predictive models for predicting a plurality of medical outcomes, for evaluating intervention strategies, and for simultaneously validating biomarker causality |
Non-Patent Citations (2)
Title |
---|
. Bayer 외 2인, "Prediction Errors in Learning Drug Response from Gene Expression Data - Influence of Labelling, Sample Size, and Machine Learning Algorithm", PLOS One, 8권, 7호, 2013.07. 1부.* |
H. J. Escalante 외 2인, "Ensemble Particle Swarm Model Selection", International Joint Conference on Neural Networks(IJCNN 2010), 2010.07.18. 1부.* |
Also Published As
Publication number | Publication date |
---|---|
AU2018200276B2 (en) | 2019-05-02 |
WO2016141214A1 (en) | 2016-09-09 |
US20180039731A1 (en) | 2018-02-08 |
AU2016226162A1 (en) | 2017-09-21 |
CA2978708A1 (en) | 2016-09-09 |
JP2018173969A (ja) | 2018-11-08 |
KR20180008403A (ko) | 2018-01-24 |
JP2018513461A (ja) | 2018-05-24 |
AU2019208223A1 (en) | 2019-08-15 |
IL254279A0 (en) | 2017-10-31 |
AU2016226162B2 (en) | 2017-11-23 |
IL258482A (en) | 2018-05-31 |
IL254279B (en) | 2018-05-31 |
KR20190047108A (ko) | 2019-05-07 |
JP6356359B2 (ja) | 2018-07-11 |
AU2018200276A1 (en) | 2018-02-22 |
CN107980162A (zh) | 2018-05-01 |
EP3265942A4 (en) | 2018-12-26 |
EP3265942A1 (en) | 2018-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101974769B1 (ko) | 앙상블-기반 연구 추천 시스템 및 방법 | |
Tran et al. | A benchmark of batch-effect correction methods for single-cell RNA sequencing data | |
JP6382459B1 (ja) | 細胞系ゲノミクスからの薬物応答の患者特異的予測のためのシステムおよび方法 | |
KR102100985B1 (ko) | 패러다임 약물 반응 네트워크 | |
JP2019526851A (ja) | 分散型機械学習システム、装置、および方法 | |
US20180039732A1 (en) | Dasatinib response prediction models and methods therefor | |
Çelik et al. | Diagnostic accuracy comparison of artificial immune algorithms for primary headaches | |
Rashid et al. | Knowledge management overview of feature selection problem in high-dimensional financial data: Cooperative co-evolution and MapReduce perspectives | |
KR20190143043A (ko) | 필터링된 데이터로 구성되는 게놈 모듈 네트워크에 기반한 샘플 데이터 분석 방법 | |
Saren et al. | Targeted drug delivery in cancer tissues by utilizing big data analytics: promising approach of AI | |
Yu et al. | scMinerva: an Unsupervised Graph Learning Framework with Label-efficient Fine-tuning for Single-cell Multi-omics Integrated Analysis | |
Haerianardakani | Identification of Essential Genes and Cancer-Related Modules Using Network-Based Unsupervised Learning: Development of a Python Toolkit | |
Levi | Analysis of network-based module discovery algorithms from the perspective of biological enrichment | |
Tingyang et al. | scMinerva: an Unsupervised Graph Learning Framework with Label-efficient Fine-tuning for Single-cell Multi-omics Integrated Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20170928 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PG1501 | Laying open of application | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20180703 Comment text: Request for Examination of Application |
|
PA0302 | Request for accelerated examination |
Patent event date: 20180703 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20181018 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20190218 |
|
PA0104 | Divisional application for international application |
Comment text: Divisional Application for International Patent Patent event code: PA01041R01D Patent event date: 20190423 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20190425 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20190425 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20220415 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20230413 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20240411 Start annual number: 6 End annual number: 6 |