KR102278727B1 - 대상 암 조직 및 세포 유리형 dna 유래 펩타이드 서열 및 hla 클래스 ii 대립유전자 서열을 이용하여 신생항원을 예측하는 방법 및 컴퓨터 프로그램 - Google Patents
대상 암 조직 및 세포 유리형 dna 유래 펩타이드 서열 및 hla 클래스 ii 대립유전자 서열을 이용하여 신생항원을 예측하는 방법 및 컴퓨터 프로그램 Download PDFInfo
- Publication number
- KR102278727B1 KR102278727B1 KR1020200119331A KR20200119331A KR102278727B1 KR 102278727 B1 KR102278727 B1 KR 102278727B1 KR 1020200119331 A KR1020200119331 A KR 1020200119331A KR 20200119331 A KR20200119331 A KR 20200119331A KR 102278727 B1 KR102278727 B1 KR 102278727B1
- Authority
- KR
- South Korea
- Prior art keywords
- hla class
- sequence
- neoantigen
- allele
- cancer tissue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 168
- 108700028369 Alleles Proteins 0.000 title claims abstract description 106
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000004590 computer program Methods 0.000 title claims description 6
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 97
- 201000011510 cancer Diseases 0.000 claims abstract description 97
- 230000036039 immunity Effects 0.000 claims abstract description 51
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 38
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 31
- 230000000694 effects Effects 0.000 claims description 30
- 238000012549 training Methods 0.000 claims description 21
- 210000004027 cell Anatomy 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000010801 machine learning Methods 0.000 claims description 8
- 210000004881 tumor cell Anatomy 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 3
- 210000005260 human cell Anatomy 0.000 claims description 3
- 102000043129 MHC class I family Human genes 0.000 claims description 2
- 108091054437 MHC class I family Proteins 0.000 claims description 2
- 230000008878 coupling Effects 0.000 abstract 1
- 238000010168 coupling process Methods 0.000 abstract 1
- 238000005859 coupling reaction Methods 0.000 abstract 1
- 210000001519 tissue Anatomy 0.000 description 64
- 230000035772 mutation Effects 0.000 description 17
- 230000008569 process Effects 0.000 description 15
- 238000013527 convolutional neural network Methods 0.000 description 14
- 150000001413 amino acids Chemical class 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 230000005847 immunogenicity Effects 0.000 description 11
- 108090000623 proteins and genes Proteins 0.000 description 11
- 108020004414 DNA Proteins 0.000 description 9
- 101000691214 Haloarcula marismortui (strain ATCC 43049 / DSM 3752 / JCM 8966 / VKM B-1809) 50S ribosomal protein L44e Proteins 0.000 description 9
- 235000001014 amino acid Nutrition 0.000 description 9
- 229940024606 amino acid Drugs 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 239000000427 antigen Substances 0.000 description 6
- 108091007433 antigens Proteins 0.000 description 6
- 102000036639 antigens Human genes 0.000 description 6
- 230000002163 immunogen Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 229940022399 cancer vaccine Drugs 0.000 description 5
- 238000009566 cancer vaccine Methods 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 210000000987 immune system Anatomy 0.000 description 5
- 238000011282 treatment Methods 0.000 description 5
- 206010069754 Acquired gene mutation Diseases 0.000 description 4
- 239000002246 antineoplastic agent Substances 0.000 description 4
- 229940041181 antineoplastic drug Drugs 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000028993 immune response Effects 0.000 description 4
- 235000018102 proteins Nutrition 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 230000037439 somatic mutation Effects 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 210000001808 exosome Anatomy 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 229940126528 Immuno-Oncology Drug Drugs 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000011269 treatment regimen Methods 0.000 description 2
- FDKWRPBBCBCIGA-REOHCLBHSA-N (2r)-2-azaniumyl-3-$l^{1}-selanylpropanoate Chemical compound [Se]C[C@H](N)C(O)=O FDKWRPBBCBCIGA-REOHCLBHSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 108010074708 B7-H1 Antigen Proteins 0.000 description 1
- 102000008096 B7-H1 Antigen Human genes 0.000 description 1
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 1
- 208000031404 Chromosome Aberrations Diseases 0.000 description 1
- 208000016718 Chromosome Inversion Diseases 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 208000034951 Genetic Translocation Diseases 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102000043131 MHC class II family Human genes 0.000 description 1
- 108091054438 MHC class II family Proteins 0.000 description 1
- 208000032818 Microsatellite Instability Diseases 0.000 description 1
- 208000002151 Pleural effusion Diseases 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 210000004252 chorionic villi Anatomy 0.000 description 1
- 208000037516 chromosome inversion disease Diseases 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003114 enzyme-linked immunosorbent spot assay Methods 0.000 description 1
- 210000003722 extracellular fluid Anatomy 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 230000004545 gene duplication Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 230000003169 placental effect Effects 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 description 1
- 235000016491 selenocysteine Nutrition 0.000 description 1
- 229940055619 selenocysteine Drugs 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Medicinal Chemistry (AREA)
- Software Systems (AREA)
- Pharmacology & Pharmacy (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Peptides Or Proteins (AREA)
Abstract
Description
도 2은 한국인들의 세포 안에 포함된 주요 HLA 클래스 II의 타입 정보에 대한 예시 도면이다.
도 3는 아미노산 간 특징의 유사성을 나타낸 blosum 매트릭스에 대한 예시 도면이다.
도 4는 HLA 대립유전자 클래스II의 구조를 나타내는 도면이다.
도 5는 HLA 클래스 II 알파 베타 체인 복합체에 대한 훈련 데이터 셋트이다.
도 6은 HLA 클래스 II 알파 또는 베타 단일 대립유전자 서열에 대한 훈련 데이터 셋트이다.
도 7, 도 8 및 도 9는 본 발명의 실시예들에 따른 면역성 예측부(121') 및 결합성 예측부(122')의 구현 예시 들에 대한 도면들이다.
도 10 내지 도 12은 본 발명의 실시예들에 따른 신생항원 결정 시스템의 구현 예시 들에 대한 도면들이다.
도 13은 면역성 예측 모델, 결합성 예측 모델, 면역 내성 예측 모델 등을 학습시키는 학습 서버(10)의 블록도이다.
Claims (12)
- 신생항원 결정 장치가 대상 암 조직으로부터 추출된 펩타이드 서열과 HLA 클래스 II 대립유전자 서열을 입력으로 수신하는 단계;
상기 신생항원 결정 장치가 상기 펩타이드 서열로부터 T 세포 활성 데이터를 획득하고, 상기 T 세포 활성 데이터를 면역성 예측 모델에 입력하여, 상기 펩타이드 서열의 면역성을 예측하는 제1 예측값을 출력하는 단계;
상기 신생항원 결정 장치가 상기 HLA 클래스 II 대립유전자 서열의 알파 베타 복합체 서열 데이터 및 펩타이드 서열 데이터를 결합성 예측 모델에 입력하여 상기 펩타이드 서열 및 상기 HLA 클래스 II 대립유전자 서열의 결합성을 예측하는 제2 예측값을 출력하는 단계;
상기 신생항원 결정 장치가 상기 HLA 클래스 II 대립유전자 서열의 알파 또는 베타 단일 서열 데이터 및 펩타이드 서열 데이터를 결합성 예측 모델에 입력하여 상기 펩타이드 서열 및 상기 HLA 클래스 II 대립유전자 서열의 결합성을 예측하는 제3 예측값을 출력하는 단계;
상기 신생항원 결정 장치가 상기 T 세포 활성 데이터 및 상기 제1 예측값 및 제2 예측값을 이용하여 상기 대상 암 조직의 펩타이드 서열이 신생항원인지 여부를 예측하는 제4 예측값을 출력하는 단계;
상기 신생항원 결정 장치가 상기 T 세포 활성 데이터 및 상기 제1 예측값 및 제3 예측값을 이용하여 상기 대상 암 조직의 펩타이드 서열이 신생항원인지 여부를 예측하는 제5 예측값을 출력하는 단계;
상기 신생항원 결정 장치가 상기 T 세포 활성 데이터 및 상기 제1 예측값 내지 제5 예측값을 이용하여 상기 대상 암 조직의 펩타이드 서열이 신생항원인지 여부를 포함하는 신생항원 정보를 생성하는 단계를 포함하는, 대상 암 조직 및 세포 유리형 DNA 유래 펩타이드 서열 및 HLA 클래스 II 대립유전자 서열을 이용하여 신생항원을 예측하는 방법. - 제1항에 있어서,
상기 대상 암 조직에 대한 신생항원 정보를 생성하는 단계에서는,
상기 T 세포 활성 데이터 및 상기 제1 예측값 내지 제5 예측값을 이용하여 상기 대상 암 조직의 펩타이드에 대한 신생항원 정보를 생성하는, 대상 암 조직 및 세포 유리형 DNA 유래 펩타이드 서열 및 HLA 클래스 II 대립유전자 서열을 이용하여 신생항원을 예측하는 방법. - 제1항에 있어서,
상기 면역성 예측 모델, 상기 결합성 예측 모델 중 적어도 하나는 복수의 대상 암 조직들에 존재하는 펩타이드 서열, HLA 클래스 II 대립유전자 서열의 알파 체인 데이터, 및 HLA 클래스 II 대립유전자 서열의 베타 체인 데이터을 포함하는 훈련 데이터 세트를 기반으로 기계학습 알고리즘에 의해 훈련되는, 대상 암 조직 및 세포 유리형 DNA 유래 펩타이드 서열 및 HLA 클래스 II 대립유전자 서열을 이용하여 신생항원을 예측하는 방법. - 제2항에 있어서,
상기 대상 암 조직은
단일 MHC 클래스 I 또는 클래스 II 대립 유전자를 발현하도록 조작된 세포를 포함하는, 대상 암 조직 및 세포 유리형 DNA 유래 펩타이드 서열 및 HLA 클래스 II 대립유전자 서열을 이용하여 신생항원을 예측하는 방법. - 제3항에 있어서,
상기 대상 암 조직은
복수의 환자로부터 수득되거나 이로부터 유래된 인간 세포를 포함하는, 대상 암 조직 및 세포 유리형 DNA 유래 펩타이드 서열 및 HLA 클래스 II 대립유전자 서열을 이용하여 신생항원을 예측하는 방법. - 제3항에 있어서,
상기 대상 암 조직은
복수의 환자로부터 수득된 신선한 또는 냉동된 종양 세포를 포함하는, 대상 암 조직 및 세포 유리형 DNA 유래 펩타이드 서열 및 HLA 클래스 II 대립유전자 서열을 이용하여 신생항원을 예측하는 방법. - 제3항에 있어서,
상기 대상 암 조직은
복수의 환자로부터 수득된 신선한 또는 냉동된 조직 세포를 포함하는, 대상 암 조직 및 세포 유리형 DNA 유래 펩타이드 서열 및 HLA 클래스 II 대립유전자 서열을 이용하여 신생항원을 예측하는 방법. - 제3항에 있어서,
상기 대상 암 조직은
T- 세포 분석을 사용하여 확인된 펩타이드를 포함하는, 대상 암 조직 및 세포 유리형 DNA 유래 펩타이드 서열 및 HLA 클래스 II 대립유전자 서열을 이용하여 신생항원을 예측하는 방법. - 제3항에 있어서,
상기 훈련 데이터 세트는
상기 대상 암 조직과 관련된 단백체 서열과 관련된 데이터, 상기 대상 암 조직과 관련된 MHC 펩타이드 서열과 관련된 데이터, 상기 대상 암 조직과 관련된 펩타이드와 HLA 클래스 II 대립유전자의 클래스 II 알파 체인 데이터 간의 결합 데이터, 상기 대상 암 조직과 관련된 펩타이드와 HLA 클래스 II 대립유전자의 클래스 II 베타 체인 데이터 간의 결합 데이터, 상기 대상 암 조직과 관련된 전사체와 관련된 데이터, 상기 대상 암 조직과 관련된 게놈과 관련된 데이터 중 적어도 하나를 포함하는, 대상 암 조직 및 세포 유리형 DNA 유래 펩타이드 서열 및 HLA 클래스 II 대립유전자 서열을 이용하여 신생항원을 예측하는 방법. - 제1항에 있어서,
상기 면역성 예측 모델은
펩타이드 서열로부터의 T 세포 활성 데이터를 입력으로, 상기 펩타이드 서열의 면역성을 출력으로 학습된 모델인, 대상 암 조직 및 세포 유리형 DNA 유래 펩타이드 서열 및 HLA 클래스 II 대립유전자 서열을 이용하여 신생항원을 예측하는 방법. - 제1항에 있어서,
상기 결합성 예측 모델은
HLA 클래스 II 대립유전자 서열의 알파 체인 데이터와 펩타이드 서열 사이의 제1 결합 데이터, HLA 클래스 II 대립유전자 서열의 베타 체인 데이터와 펩타이드 서열 사이의 제2 결합 데이터 및 HLA 클래스 II 대립 유전자 서열의 알파 베타 체인 복합체를 입력으로, 상기 펩타이드 서열 및 상기 HLA 클래스 II 대립유전자 서열의 결합성을 출력하도록 학습된 모델인, 대상 암 조직 및 세포 유리형 DNA 유래 펩타이드 서열 및 HLA 클래스 II 대립유전자 서열을 이용하여 신생항원을 예측하는 방법. - 컴퓨터를 이용하여 제1항 내지 제11항 중 어느 한 항의 방법을 실행시키기 위하여 컴퓨터 판독 가능한 저장 매체에 저장된 컴퓨터 프로그램.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200119331A KR102278727B1 (ko) | 2020-09-16 | 2020-09-16 | 대상 암 조직 및 세포 유리형 dna 유래 펩타이드 서열 및 hla 클래스 ii 대립유전자 서열을 이용하여 신생항원을 예측하는 방법 및 컴퓨터 프로그램 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200119331A KR102278727B1 (ko) | 2020-09-16 | 2020-09-16 | 대상 암 조직 및 세포 유리형 dna 유래 펩타이드 서열 및 hla 클래스 ii 대립유전자 서열을 이용하여 신생항원을 예측하는 방법 및 컴퓨터 프로그램 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102278727B1 true KR102278727B1 (ko) | 2021-07-19 |
Family
ID=77125729
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200119331A Active KR102278727B1 (ko) | 2020-09-16 | 2020-09-16 | 대상 암 조직 및 세포 유리형 dna 유래 펩타이드 서열 및 hla 클래스 ii 대립유전자 서열을 이용하여 신생항원을 예측하는 방법 및 컴퓨터 프로그램 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102278727B1 (ko) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102507111B1 (ko) * | 2022-03-29 | 2023-03-07 | 주식회사 네오젠티씨 | 데이터베이스에 저장된 면역 펩티돔 정보의 신뢰도를 결정하기 위한 방법 및 장치 |
KR102547966B1 (ko) * | 2022-07-28 | 2023-06-26 | 주식회사 네오젠티씨 | 인공지능 기술을 이용하여 pMHC와 TCR 간의 관계를 분석하기 위한 방법 및 장치 |
WO2024080783A1 (ko) * | 2022-10-14 | 2024-04-18 | 주식회사 네오젠티씨 | 인공지능 기술을 이용하여 pmhc에 대응되는 tcr 정보를 생성하기 위한 방법 및 장치 |
WO2024111786A1 (ko) * | 2022-11-25 | 2024-05-30 | 주식회사 테라젠바이오 | 다양한 길이의 펩타이드의 길이를 접힘으로 처리하여 신항원을 예측하는 방법 및 컴퓨터 프로그램 |
WO2025037838A1 (ko) * | 2023-08-16 | 2025-02-20 | 한국과학기술원 | B 세포 반응성 신생항원을 활용한 맞춤형 암백신 설계방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190133010A (ko) * | 2017-03-03 | 2019-11-29 | 트레오스 바이오 지알티 | 개인화된 면역원성 펩타이드 확인 플랫폼 |
-
2020
- 2020-09-16 KR KR1020200119331A patent/KR102278727B1/ko active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190133010A (ko) * | 2017-03-03 | 2019-11-29 | 트레오스 바이오 지알티 | 개인화된 면역원성 펩타이드 확인 플랫폼 |
Non-Patent Citations (1)
Title |
---|
B.Chen 외, Nature Biotechnology, 37권, pp.1332-1343, 2019.11. * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102507111B1 (ko) * | 2022-03-29 | 2023-03-07 | 주식회사 네오젠티씨 | 데이터베이스에 저장된 면역 펩티돔 정보의 신뢰도를 결정하기 위한 방법 및 장치 |
KR102547966B1 (ko) * | 2022-07-28 | 2023-06-26 | 주식회사 네오젠티씨 | 인공지능 기술을 이용하여 pMHC와 TCR 간의 관계를 분석하기 위한 방법 및 장치 |
WO2024080783A1 (ko) * | 2022-10-14 | 2024-04-18 | 주식회사 네오젠티씨 | 인공지능 기술을 이용하여 pmhc에 대응되는 tcr 정보를 생성하기 위한 방법 및 장치 |
WO2024111786A1 (ko) * | 2022-11-25 | 2024-05-30 | 주식회사 테라젠바이오 | 다양한 길이의 펩타이드의 길이를 접힘으로 처리하여 신항원을 예측하는 방법 및 컴퓨터 프로그램 |
WO2025037838A1 (ko) * | 2023-08-16 | 2025-02-20 | 한국과학기술원 | B 세포 반응성 신생항원을 활용한 맞춤형 암백신 설계방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102278727B1 (ko) | 대상 암 조직 및 세포 유리형 dna 유래 펩타이드 서열 및 hla 클래스 ii 대립유전자 서열을 이용하여 신생항원을 예측하는 방법 및 컴퓨터 프로그램 | |
KR102159921B1 (ko) | 펩타이드 서열 및 hla 대립유전자 서열을 이용하여 신생항원을 예측하는 방법 및 컴퓨터 프로그램 | |
Chen et al. | Predicting HLA class II antigen presentation through integrated deep learning | |
KR102330099B1 (ko) | Hla 클래스 i 또는 ii 대립유전자와 다양한 길이의 펩타이드를 대상으로 신생항원을 예측하는 방법 및 컴퓨터 프로그램 | |
Pogorelyy et al. | Detecting T cell receptors involved in immune responses from single repertoire snapshots | |
Afik et al. | Targeted reconstruction of T cell receptor sequence from single cell RNA-seq links CDR3 length to T cell differentiation state | |
KR102371953B1 (ko) | 서열 정렬 방법 및 시스템 | |
US11725237B2 (en) | Polymorphic gene typing and somatic change detection using sequencing data | |
JP2020536553A5 (ko) | ||
JP2018524008A (ja) | ネオアンチゲン分析 | |
CN110706742A (zh) | 泛癌种肿瘤新生抗原高通量预测方法及其应用 | |
Joshi et al. | Application Of Hmm-Viterbi Model For Identification Of Epitopic Signature Within Screened Protein-Antigens Of Hepatitis C Virus | |
KR102475794B1 (ko) | 합성 긴 펩타이드의 면역원성 예측 장치, 면역원성 예측 방법 및 컴퓨터 프로그램 | |
JP2025519177A (ja) | 多様な長さのペプチドの長さを折り畳みで処理して新抗原を予測する方法及びコンピュータプログラム | |
CN114333998A (zh) | 一种基于深度学习模型的肿瘤新抗原预测方法及新生抗原预测系统 | |
Yadav et al. | TCR-ESM: employing protein language embeddings to predict TCR-peptide-MHC binding | |
CN114882951A (zh) | 基于二代测序数据检测mhc ii型肿瘤新生抗原的方法和装置 | |
JP2022504635A (ja) | ネオ抗原ベースの免疫療法のためのエピトープを標的化する方法およびシステム | |
CN110462056B (zh) | 基于dna测序数据的样本来源检测方法、装置和存储介质 | |
WO2024032909A1 (en) | Methods and systems for cancer-enriched motif discovery from splicing variations in tumours | |
CN113851187A (zh) | 一种糖肽表位预测方法、存储介质及终端设备 | |
KR102227585B1 (ko) | 바이러스 치료를 위한 면역원을 예측하는 방법 및 컴퓨터 프로그램 | |
Xie et al. | Mhc2nnz: A novel peptide binding prediction approach for hla dq molecules | |
Gautam et al. | Major histocompatibility complex binding and various health parameters analysis | |
EP4379726A1 (en) | The method for predicting the occurrence of the off-target toxicity caused by similarity between a target epitope and putative off-target epitopes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20200916 |
|
PA0201 | Request for examination | ||
PA0302 | Request for accelerated examination |
Patent event date: 20200921 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination Patent event date: 20200916 Patent event code: PA03021R01I Comment text: Patent Application |
|
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210204 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20210609 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20210713 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20210713 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20240716 Start annual number: 4 End annual number: 6 |