[go: up one dir, main page]

KR20180087248A - 바이러스 네오에피토프 및 이의 용도 - Google Patents

바이러스 네오에피토프 및 이의 용도 Download PDF

Info

Publication number
KR20180087248A
KR20180087248A KR1020187013300A KR20187013300A KR20180087248A KR 20180087248 A KR20180087248 A KR 20180087248A KR 1020187013300 A KR1020187013300 A KR 1020187013300A KR 20187013300 A KR20187013300 A KR 20187013300A KR 20180087248 A KR20180087248 A KR 20180087248A
Authority
KR
South Korea
Prior art keywords
patient
nucleic acid
hla
neoepitope
neoepitopes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
KR1020187013300A
Other languages
English (en)
Other versions
KR102770755B1 (ko
Inventor
앤드류 응유옌
스티븐 찰스 벤츠
존 재커리 산본
Original Assignee
난토믹스, 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 난토믹스, 엘엘씨 filed Critical 난토믹스, 엘엘씨
Publication of KR20180087248A publication Critical patent/KR20180087248A/ko
Application granted granted Critical
Publication of KR102770755B1 publication Critical patent/KR102770755B1/ko
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G06F19/18
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/0005Vertebrate antigens
    • A61K39/0011Cancer antigens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/708Specific hybridization probes for papilloma
    • G06F19/26
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/40ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mechanical, radiation or invasive therapies, e.g. surgery, laser therapy, dialysis or acupuncture
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Microbiology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Primary Health Care (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Mycology (AREA)
  • Oncology (AREA)
  • Library & Information Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Virology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Surgery (AREA)

Abstract

고려되는 항바이러스/암 치료는 숙주 게놈 내로 통합된 바이러스 DNA로부터 네오에피토프의 분석, 및 이러한 네오에피토프에 대한 면역치료제의 설계를 포함한다.

Description

바이러스 네오에피토프 및 이의 용도
본원은 2015년 10월 12일에 출원된 미국 가출원 제62/240471호의 우선권의 이익을 주장한다.
본 발명의 분야는 바이러스 질환 및 신생물 질환의 치료에 관한 것이며, 특히 바이러스 관련 질환의 면역학적 치료에 관한 것이다.
배경기술 설명은 본 발명을 이해하는데 유용할 수 있는 정보를 포함한다. 그것은 본원에 제공된 임의의 정보가 선행기술이거나 현재 청구된 발명과 관련이 있거나 또는 명시적으로 또는 암시적으로 언급된 임의의 간행물이 선행기술임을 인정하는 것은 아니다.
인간 유두종 바이러스는 다양한 상피 조직을 감염시키는 비교적 작은 DNA 바이러스로서 피부 유형 및 점막 유형으로 분류될 수 있다. 또한, 인간 유두종 바이러스(HPV)는 감염 조직에서 악성 형질전환을 촉진하는 능력의 차이에 따라 저위험 및 고위험 유형으로도 분류될 수 있다. 예를 들면, HPV 유형 16 및 18은 99%가 넘는 자궁경부 암종과 관련된 점막 HPV이다. 이러한 암의 대부분에서, 바이러스 DNA 게놈이 숙주의 게놈에 통합된다. 대부분의 HPV 유형의 감염은 많은 경우에 스스로 제한된다. 그러나, 특히 고위험 유형 HPV로 감염된 환자 중 임상적으로 유의한 비율에서 지속적인 감염 및 신생물 형질전환이 관찰된다.
보다 최근에는, 가장 흔한 고위험 HPV 유형에 대해 백신 제제가 이용가능하게 되었다. 불행하게도, 백신 접종은 일반적으로 이미 확립된 감염에 효과적이지 못하다. 더욱이, 백신 접종은 바이러스가 충분한 유전적 변화를 겪은 경우 덜 효과적일 수도 있다. 효과적인 HPV 치료는 일반적으로 바이러스 단백질 E6 및 E7과 정상 DNA 손상 반응(전형적으로 숙주 p53 및 pRb 단백질을 통해 매개됨)과의 상호작용으로 인한 동시 게놈 불안정성에 의해 더 복잡해질 수 있다.
따라서, 개선된 치료 및 백신 접종에도 불구하고, HPV 감염, 및 특히 지속적인 HPV 감염의 몇 가지 문제점이 여전히 남아 있다. 따라서, HPV 감염의 치료를 개선하는 시스템 및 방법이 여전히 필요하다.
발명의 요약
본 발명자들은 오믹스(omics) 분석이 병원체 또는 질환에 대한 면역치료용 조성물의 효능을 확인하거나 증가시키는데 사용될 수 있음을 발견하였다. 바람직하게는, 환자로부터 얻어진 오믹스 데이터를 병원체 및/또는 질환에 대한 참조 오믹스 데이터와 비교하고, 환자의 오믹스 데이터로부터 환자의 HLA-유형에 대해 증가되거나 새로운 결합 친화도를 갖고/갖거나 병원체 및/또는 질환에 대한 참조 오믹스 데이터에서 발견된 에피토프와 비교하여 손실된 네오에피토프를 확인한다. 더욱이, 병원체 또는 질환의 오믹스 분석은 또한 환자의 HLA-유형에 대해 높은 친화도으로 결합할 것으로 예상되는 네오에피토프의 합리적인 설계를 가이드하는데 사용될 수 있고, 이렇게 확인된 네오에피토프는 발현을 위해 병든 세포 내로 발현/도입될 수 있다.
가장 바람직하게는, 오믹스 분석뿐만 아니라 HLA-타이핑 및 HLA-매칭 모두는 전체 게놈 시퀀싱 데이터를 사용하여 인실리코(in silico)로 수행된다. 더욱이, 바이러스 질환이 특히 고려되지만, 유전적 병인학을 갖는 다른 질환도 적합한 것으로 여겨진다.
HLA-타이핑, 특히 시퀀싱 기계로부터 DNA 및/또는 RNA 서열을 사용하는 HLA-타이핑은 환자 서열 데이터로부터 높은 정확도 변이 호출(variant calling)을 포함하는 것으로 고려된다. 일부 구현예에서, 환자의 HLA-유형의 결정은 HLA 참조 서열을 환자 오믹스 데이터와 매칭(matching)시키는 것을 포함한다. 오믹스 데이터는 환자의 건강한 조직으로부터 유래될 수 있지만, 바람직한 구현예에서 그것은 병든 조직으로부터 유래된다. HLA 참조 서열은 공지되고 구별되는 HLA 대립유전자의 복수의 서열을 포함한다. 환자 오믹스 데이터는 복수의 서열 리드(read)를 포함하는데, 이는 바람직하게는 복수의 각각의 k-mer 세트로 분할될 수 있다. HLA 참조 서열 및 복수의 각각의 k-mer 세트를 사용하여 복합 드 브뤼에인(de Bruijn) 그래프가 생성될 수 있다.
바람직한 구현예에서, 공지되고 구별되는 HLA 대립유전자 각각은 투표에 의해 계산된 복합 매칭 스코어를 사용하여 순위가 매겨진다. 투표는 공지되고 구별되는 HLA 대립유전자 내의 상응하는 분절과 매칭하는 각각의 k-mer에 대해 집계될 수 있고 대립유전자의 순위를 매기는데 사용될 수 있다. 상기 순위에서 최상위 대립유전자가 환자의 일차 HLA-유형으로서 확인되고, 이후 일차 HLA-유형과 매칭하는 k-mer에 대한 편향으로 나머지 대립유전자의 순위를 다시 매기면 환자의 이차 HLA-유형이 제공된다.
본 발명의 대상의 다양한 목적, 특징, 양태 및 장점은 첨부된 도면과 함께 바람직한 구현예의 다음의 상세한 설명으로부터 더욱 명백해질 것이며, 도면에서 동일한 번호는 동일한 구성요소를 나타낸다.
본 발명자들은 면역치료용 조성물의 효능이 치료 전에 쉽게 확인될 수 있고/있거나, 면역치료용 조성물이 환자에서 그리고 질환 특이적 방식으로 병든 조직을 특히 표적화하도록 제조될 수 있음을 발견하였다. 가장 전형적으로, 고려되는 조성물, 시스템, 및 방법은 질환 또는 병원체와 관련된 네오에피토프(neoepitope)의 검출에 의존하며, 상기 네오에피토프는 획득되고/되거나 인위적으로 도입된다. 예를 들어, 네오에피토프는 숙주 게놈 내로 DNA의 (예컨대, 레트로) 바이러스 삽입 및 부수적인 숙주 및 병원체의 게놈의 변화(예컨대, HPV 통합 후 증가된 돌연변이율 또는 게놈 불안정성을 통해)에 의해 획득될 수 있거나, 또는 네오에피토프(들)를 코딩하는 재조합 핵산의 표적화된 통합(예컨대, CRISPR/Cas9 또는 CRISPR/Cpf1 카세트를 통해)을 통해 숙주 내로 도입될 수 있다. 가장 바람직하게는, 표적화된 삽입은 병원체(예컨대, 바이러스) 또는 질환(예컨대, 종양원)과 관련된 핵산 서열 내에 또는 인접해 있다.
예를 들면, 그리고 본 발명의 대상의 하나의 특히 고려된 양태에서, 생검을 자궁경부 암종 또는 전-신생물 병변(또는 다른 바이러스 관련 종양)으로부터 채취하고, 전체 게놈 시퀀싱을 수행하여 병든 조직의 오믹스 데이터를 수득한다. 또한, 엑솜 분석 및/또는 RNA 분석이 발현된 유전자 및/또는 발현 수준을 확인하기 위해 수행될 수 있다. 이것은 종양에 인접한 하나 이상의 림프절, 및 원위 전이 또는 순환하는 종양 세포로부터의 생검을 부가적으로 포함한다. 또한, 오믹스 분석이 수행되는 것이 일반적으로 바람직하며, 여기서 환자 특이적 돌연변이 변화를 얻기 위해 오믹스 데이터가 환자 매칭된 정상 조직(즉, 동일한 환자로부터의 병들지 않은 조직)과 직접 비교된다.
대부분의 경우, 오믹스 데이터는 표준 조직 가공 프로토콜 및 시퀀싱 프로토콜에 따라 생검 샘플로부터 얻어진다. 본 발명의 대상로 제한되는 것은 아니지만, 데이터가 환자 매칭된 종양 데이터(예컨대, 종양 대 동일한 환자 정상)이고, 데이터 포맷이 SAM, BAM, GAR, 또는 VCF 포맷인 것이 전형적으로 바람직하다. 그러나, 비-매칭된 또는 매칭된 대 다른 참조(예컨대, 이전 환자 정상 또는 이전 환자 종양, 또는 호모 스타티스티쿠스(homo statisticus))가 또한 본원에서의 사용에 적합한 것으로 여겨진다. 따라서, 오믹스 데이터는 '신선한' 오믹스 데이터 또는 이전의 절차(또는 심지어 상이한 환자)로부터 수득된 오믹스 데이터일 수 있다.
추가로 고려되는 양태에서, 오믹스 분석은 또한 하나 이상의 바이러스 서열(예컨대, WO제2015/048546호에 기재된 바와 같은 상이한 바이러스 또는 혈청형의 집단으로부터)을 포함할 수 있는 하나 이상의 참조 핵산 서열을 사용할 것이다. 따라서, 오믹스 분석은 환자 천연 핵산 서열에 제한되지 않고, 이러한 오믹스 분석은 또한 비-환자 핵산, 및 가장 전형적으로 병원체 핵산(예컨대, 기생충, 바이러스, 세균, 진균 등)을 탐색하고 확인하는 것임이 이해되어야 한다. 또 다른 예에서, 참조 핵산은 또한 이전 생검으로부터의 핵산 서열, 및 특히 이전 종양원성 돌연변이를 포함하는 핵산 서열 데이터일 수 있음이 또한 이해되어야 한다. 따라서, 참조 서열은 또한 이전에 존재하지 않았거나 검출되지 않았던 종양에서의 클론 변이(clonal drift)의 확인 또는 새로운 돌연변이의 도입을 허용하기 위해 비록 다른 시점으로부터이긴 하지만 환자로부터 얻어질 수 있다.
또 다른 관점에서 볼 때, 신속한 분석이 인실리코로 참조 게놈(건강한 숙주 조직 또는 비-숙주 조직으로부터 수득될 수 있음)의 변형에 의해 달성될 수 있음이 고려되며, 여기서 하나 이상의 비-환자 게놈 서열(및 가장 바람직하게는 전체 바이러스 게놈)은 참조 게놈과 병합되어 키메라성 참조 핵산 서열을 형성한다.
결과적으로, 본 발명자들은 분석 엔진이 바이러스 관련 종양으로부터의 핵산 서열 및 키메라성 참조 핵산 서열을 저장하는 서열 데이터베이스에 정보적으로 결합되는 방법을 고려하며, 키메라성 참조 핵산 서열은 적어도 하나의 바이러스 핵산 서열 및 포유동물 핵산 서열을 포함한다. 일부 구현예에서, 키메라성 참조 핵산 서열은 대안적으로 또는 추가적으로 적어도 하나의 질환 특이적 핵산 서열을 포함한다. 이후, 분석 엔진은 키메라성 참조 핵산 서열 내의 바이러스 핵산 서열 중 적어도 일부와 바이러스 관련 종양으로부터의 핵산 서열 내의 대립유전자와의 통합을 확인하는데 사용된다.
키메라성 참조 핵산 서열에서 사용하기에 적합한 참조 게놈은 동일한 환자의 전체 게놈 핵산 서열을 포함하고 이는 전형적으로 병들지 않은 조직으로부터 수득된다. 예를 들면, 참조 게놈 핵산은 전혈로부터, 암성 조직에 인접한 조직으로부터 또는 구강 스왑 또는 생검으로부터 얻어질 수 있다. 대안적으로, 참조 게놈은 또한 앞서 환자로부터 채취된 샘플, 또는 이전의 전체 게놈 시퀀싱 시도로부터 수득될 수 있다. 추가의 대안적인 양태에서, 참조 게놈은 또한 바람직하게는 성별에 의해 계층화된 동일한 종(예컨대, 인간 또는 다른 포유동물)으로부터의 게놈 서열, 또는 동일한 종에 대한 평균 또는 공통 서열일 수 있다. 가장 전형적으로, 참조 게놈은 전체 게놈이거나 이를 포함할 것이다. 그러나, 게놈의 더 작은 부분이 또한 고려되며, 이는 적어도 하나의 염색체, 또는 2-5개의 염색체, 또는 5-10개의 염색체, 또는 10개 초과의 염색체를 포함한다. 대안적으로, 참조 게놈은 또한 전체 엑솜 또는 전체 전사체의 부분(예컨대, 1-10% 사이, 10-30% 사이, 30-60% 사이, 또는 60-90% 사이)만을 대표할 수 있다. 따라서, 그리고 또 다른 관점에서 볼 때, 참조 게놈은 전형적으로 인간(또는 다른 종)의 전체 게놈의 적어도 10%, 또는 적어도 30%, 또는 적어도 50%, 또는 적어도 70%를 포함할 것이다.
키메라성 참조 핵산 서열에서 사용하기에 적합한 비-환자 게놈은 적어도 하나의 바이러스, 및 보다 전형적으로 질환과 알려진 관련성이 있는 바이러스의 집합, 및 특히 종양 관련 바이러스(즉, 암성 질환과 관련된 것으로 알려진 바이러스)의 전체 게놈 핵산 서열을 포함한다. 예를 들면, 본원에서 사용하기에 적합한 것으로 여겨지는 바이러스의 게놈 서열은 HTLV-1(성인 T-세포 백혈병과 관련됨), HPV 바이러스(자궁경부암, 피부암, 두경부암, 및 항문생식기 암과 관련됨), HHV-8(카포시 육종, 원발성 삼출성 림프종, 캐슬만병과 관련됨), EBV(버킷 림프종, 비인두 암종, 이식후 림프종, 및 호지킨병과 관련됨), HBV 및 HCV(간세포 암종과 관련됨), SV40(뇌암, 골암, 중피종과 관련됨), BKV(전립선암과 관련됨), JCV(뇌암과 관련됨), HERV(생식 세포 종양, 유방암, 난소암, 및 흑색종과 관련됨), HMTV(유방암과 관련됨), KSHV(카포시 육종과 관련됨), 및 TTV(위장암, 폐암, 유방암, 및 골수종과 관련됨)로부터의 것을 포함한다. 그러나, 적합한 바이러스는 특정 질환 관련성에 대해 현재 알려지지 않은 것도 포함하는 것으로 이해되어야 한다.
한편, 본원에서 사용하는데 적합한 바이러스 서열은 또한 바이러스의 그룹 내에 기관 특이성(예컨대, HBV, HCV), 암 유형 특이성, 또는 위험-유형을 포함할 수 있는 하나 이상의 공통 분류기에 의해 계층화될 수 있다. 예를 들면, 바이러스가 HPV 바이러스인 경우, 적합한 비-환자 게놈 서열은 HPV 유형 16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, 68, 69, 73, 및/또는 82를 포함하는 자궁경부 또는 다른 비뇨생식기 암에 대한 고위험과 관련된 것을 포함할 수 있다. 가장 전형적으로, 비-환자 게놈은 전체 게놈이거나 이를 포함할 것이다. 그러나, 게놈의 더 작은 부분이 또한 고려되며, 비-환자 게놈의 부분, 예를 들면, 하나 이상의 단일 비-환자 유전자 또는 전사 단위, 또는 바이러스의 전체 게놈의 적어도 10%, 또는 적어도 30%, 또는 적어도 50%, 또는 적어도 70%를 포함한다.
키메라성 참조 핵산 서열에서 사용하기에 적합한 질환 특이적 핵산 서열은 적어도 하나의 질환 특이적인 공지된 네오에피토프, 스플라이스 변이, 또는 염색체 전좌를 포함하며, 보다 전형적으로 질환 특이적인 공지된 네오에피토프, 스플라이스 변이, 또는 염색체 전좌의 집합을 포함한다. 예를 들면, 질환 특이적인 공지된 네오에피토프는 당업계에 공지되거나 암 연구소의 펩타이드 데이터베이스, 면역 에피토프 데이터베이스, 암 면역체 아틀라스 등과 같은 이용가능한 데이터베이스에서 확인된 것을 포함할 수 있다. 질환 특이적 스플라이스 변이는 당업계에 공지된 것 또는 Ensembl, TCGA SpliceSeq 등과 같은 이용가능한 데이터베이스에서 확인된 것(예컨대, 자궁경부 암종 조직에서 KLHDC7B, sycp2, 또는 HMMR 유전자의 대안적인 스플라이싱)을 포함할 수 있는 것으로 이해되어야 한다. 질환 특이적 염색체 전좌는 당업계에 공지되거나 질환 관련된 염색체 재배열 온라인, 질환에서 염색체 재배열의 데이터베이스, 미텔만(Mitelman) 데이터베이스 등과 같은 이용가능한 데이터베이스에서 확인된 것(예컨대, 자궁경부 암종 조직에서 11q13 상의 2.3Mb 간격이 염색체 3으로 전좌되는 것)을 포함할 수 있는 것으로 고려된다.
키메라성 참조 핵산 서열이 참조 게놈 핵산 서열에 첨부되는 하나 이상의 개별 단위로서 비-환자 핵산 서열(들)을 포함하는 것이 특히 바람직하다. 가장 전형적으로, 각각의 비-환자 핵산 서열에 대한 개별 단위는 개별 염색체로서 조직화/표지화될 것이다. 다른 장점 중에서, 이러한 배열(특히 서열 비교가 증분 동기화 정렬을 사용하여 수행되는 경우)을 사용하는 것이 게놈 통합의 위치, 복제수 결정, 및 영향을 받은 대립유전자의 신속한 확인을 가능하게 할 것임에 유의해야 한다. 따라서, 비-환자 핵산 서열은 참조 게놈 핵산 서열과 동일한 포맷(예컨대, BAM, SAM, FASTA, 또는 FASTA 인덱스)으로 조직화될 것으로 또한 고려된다. 그러나, 대안적인 포맷이 명시적으로 제외되는 것은 아니다. 따라서, 상기에 비추어 볼 때, 포유동물에 대한 키메라성 참조 핵산 서열의 염색체 수가 바이러스 관련 종양으로부터의 핵산 서열의 염색체 수를 유의하게 초과할 수 있는 것으로 인식되어야 한다. 예를 들면, 키메라성 참조 핵산 서열의 염색체 수는 바이러스 관련 종양으로부터의 핵산 서열의 염색체 수를 적어도 1개, 적어도 5개, 적어도 10개, 적어도 20개, 적어도 50개, 및 심지어 그 이상으로 초과할 수 있다. 실제로, 정확한 염색체 수는 포함될 비-환자 게놈 서열의 수에 의해 결정될 것이다.
이를 위해, 본 발명자들은 환자의 병든 조직에서 비-환자 핵산의 존재를 확인하는 방법을 고려하며, 여기서 게놈 분석을 위한 참조 서열은 포유동물 조직으로부터의 하나 이상의 핵산 서열 및 각각의 구별되는 공급원(예컨대, 상이한 바이러스, 상이한 병원체, 상이한 세균, 이의 조합 등)으로부터의 하나 이상의 비-환자 핵산 서열을 저장하는 서열 데이터베이스에 편집 엔진을 정보적으로 연결함으로써 변형된다. 이후, 편집 엔진은 포유동물 조직으로부터의 핵산 서열(들)을 복수의 비-환자 핵산 서열과 단일 키메라성 핵산 서열 파일로 병합하는데 사용된다. 물론, 이러한 편집은 비교적 적은 수의 선택된 비-환자 게놈 서열을 수작업으로 사용하여, 또는 바이러스의 집단이 비교적 큰 경우 자동화된 방식으로 수행될 수 있음이 이해되어야 한다. 더욱이, 편집 엔진은 임의의 포맷의 비-환자 서열을 (예컨대, 포유동물/인간) 참조 서열에 병합할 수 있고, 비-환자 서열은 임의의 주어진 시간에 원하는 최종 포맷(예컨대, BAM, SAM, FASTA, 또는 FASTA 인덱스 포맷)으로 변형될 수 있음이 이해되어야 한다. 그러나, 비-환자 서열이 이미 원하는 최종 포맷(예컨대, BAM, SAM, FASTA, 또는 FASTA 인덱스 포맷)인 것이 일반적으로 바람직하다. 예를 들면, 참조 서열 또는 참조 서열들은 관련된 FASTA 인덱스를 갖는 FASTA 파일로 저장될 수 있고, 이후 상기 파일은 상기 기재된 바와 같이 하나 이상의 비-환자 게놈 서열과 병합될 수 있다. 원하거나 필요한 경우 BAM 포맷의 추가 변환이 수행될 수 있다. 또한, 비-환자 서열을 함유하는 환자의 병든 조직으로부터의 시퀀싱 데이터 역시 BAM 파일로 저장될 수 있다.
더욱이, 키메라성 핵산 서열의 구조와 관련하여, 포유동물 조직으로부터의 핵산 서열은 염색체 구조를 따르는 단일 키메라성 핵산 서열 파일(예를 들면, BAM 포맷의 경우에서와 같음)로 조직화되는 반면, 바이러스 핵산 서열은 각각의 단일 염색체로서 단일 키메라성 핵산 서열 파일로 조직화되는 것이 특히 바람직하다. 키메라성 핵산 서열 파일이 조립되면, 그렇게 생성된 키메라성 핵산 서열 파일을 이용하여 서열 데이터베이스가 업데이트되는 것이 바람직하다. 물론, 편집 엔진은 또한 포유동물 조직으로부터의 핵산 서열을 바이러스 게놈 서열의 라이브러리로부터의 하나 이상의 바이러스 핵산 서열과 즉각적으로 병합하는데 사용될 수 있고, 이로써 증분 동기화 정렬이 하기에 추가로 논의된 바와 같이 수행될 수 있는 것으로 또한 인식되어야 한다. 적합한 서열 및 이의 부분과 관련하여, 상기에서 이미 제공된 동일한 고려사항이 적용된다.
본 발명의 대상의 더욱 특히 바람직한 양태에서, 키메라성 참조 핵산 서열 및 바이러스 관련 종양으로부터의 핵산 서열은 통합, 동시 증폭, 및 게놈 교환의 위치의 신속한 확인을 가능하는 하는 증분 동기화 정렬을 사용하여 처리된다. 예를 들면, 그리고 본 발명의 대상를 제한하지 않지만, 키메라성 참조 핵산 서열(건강한 또는 참조 조직으로부터의 게놈 핵산 서열을 포함함)이 동기화되고 바이러스 관련 종양(또는 다른 병든 조직)으로부터의 핵산 서열과 증분적으로 비교되는 소프트웨어 도구를 사용하여 게놈 분석을 수행하는 것이 일반적으로 바람직하다. 특히 바람직한 한 가지 도구는 이전에 WO2013/074058호A1에 기재된 BAMBAM을 포함한다.
이러한 접근법을 사용하여, 종간(cross-species) 통합된 서열의 존재뿐만 아니라, 위치, 복제수, 돌연변이 등이 각각의 샘플(예컨대, 바이러스 및 환자)에서 발견될 수 있고, 이들 모두는 질환 존재, 진행, 및/또는 결과의 양태에서 유의한 영향을 미칠 수 있는 것으로 특히 이해되어야 한다. 특히, 환자 게놈에서 바이러스 서열의 통합이 게놈 돌연변이의 증가와 관련되는 경우, 환자 게놈 내로 통합된 바이러스 서열에서의 돌연변이가 또한 검출될 수 있다. 따라서, 본 발명자들은 하나 이상의 종간 통합 사건을 검출하는 방법뿐만 아니라, 치료 및 예후의 평가를 위한 기초로서 사용되는 이러한 사건의 특성을 고려한다
예를 들면, 본 발명자들은 분석 엔진이 환자의 자궁경부 종양으로부터의 핵산 서열 및 키메라성 참조 핵산 서열을 저장하는 서열 데이터베이스에 분석 엔진이 정보적으로 연결되는 방법을 추가로 고려하며, 키메라성 참조 핵산 서열은 환자로부터의 참조 서열(바람직하게는 매칭된 정상 핵산 서열) 및 HPV 바이러스의 하나 이상의 바이러스 핵산 서열을 포함한다. 이후, 분석 엔진은 키메라성 참조 핵산 서열 내의 바이러스 핵산 서열 중 적어도 일부와 자궁경부 종양으로부터의 핵산 서열 내의 종양유전자(예컨대, ERBB2를 포함하는 성장 인자 수용체를 코딩하는 유전자, 또는 종양 억제자 유전자, 세포 주기 조절에 관여하는 유전자, 및/또는 세포 분열에 관여하는 유전자)의 적어도 하나의 대립유전자와의 통합을 확인하는데 사용된다.
참조 서열은 복수의 에피토프를 계산하는데 사용되는 것이 일반적으로 바람직하다. 가장 전형적으로, 에피토프는 2-50개의 아미노산, 보다 전형적으로 5-30개의 아미노산, 및 가장 전형적으로 9-15개의 아미노산의 길이를 갖도록 계산될 것이다. 이러한 에피토프는 점진적으로 전체 참조 서열을 커버할 수 있거나, 특정 부분(예컨대, 엑손 단독)만을 커버할 수 있다. 마찬가지로, 비-환자 핵산은 이후에, 적어도 비-환자 핵산이 참조 서열과 상이한 위치에 대해, 복수의 네오에피토프를 계산하는데 사용된다. 이후, 이렇게 계산된 에피토프 및 네오에피토프는 하기에 더 상세히 추가로 기재된 바와 같은 환자 특이적 HLA-유형에 대한 친화도에 대해 인실리코로 분석된다.
이러한 네오에피토프에 대한 HLA 친화도의 지식은 적어도 2개의 가치있는 정보를 제공하는 것으로 이해되어야 한다: (a) 면역요법에 적합한 에피토프의 결실이 인식될 수 있고 이에 따라 면역요법이 상기 결실된 에피토프를 표적화하지 않도록 조정될 수 있음, 및 (b) 면역요법에 적합한 네오에피토프의 생성이 인식될 수 있고 이에 따라 면역요법이 네오에피토프를 표적화하도록 조정될 수 있음. 에피토프의 이러한 변화는 병원체에 대한 핵산(또는 종양유전자 또는 종양 억제자 유전자)이 돌연변이율 증가에 영향을 받는 질환과 특히 관련된다는 것이 추가로 인식되어야 한다. 이러한 돌연변이율 증가는 병원체 또는 다른 유전적 결함(예컨대, 바이러스 E6/E7 유전자 생성물의 간섭을 통해), 화학치료용 약물 또는 방사선에 대한 노출 등에 의해 도입될 수 있는 게놈 불안정성 때문일 수 있다. 상이한 관점에서 볼 때, 면역치료용 치료 선택사항은 조정되거나 예측될 수 있으므로 보다 효과적인 치료로 이어질 수 있다.
네오에피토프와 관련하여, 네오에피토프는 독특하고 종양 특이적 항원을 생성하는 종양 세포에서의 무작위 돌연변이로서 규명될 수 있는 것으로 이해되어야 한다. 따라서, 고처리량 게놈 시퀀싱은 환자 특이적 네오에피토프의 신속하고 특이적인 확인을 가능하게 해야 하며, 상기 분석은 또한 동일한 환자의 매칭된 정상 조직을 고려한다. 특히, 공동계류중인 미국 가출원 제62/144745호에도 개시된 바와 같이, 매우 적은 네오에피토프가 면역 반응을 유발하는데 필요한 것으로 보이며, 결과적으로 암 면역요법의 제조를 위한 독특한 기회를 제시한다.
특히 바람직한 양태에서, 종양-특이적 네오에피토프는 적어도 2개의 기준을 사용하여 확인된다: 첫째, 오믹스 데이터에서 비-환자(또는 이전에 돌연변이된 환자) 핵산의 존재를 검출하기 위해, 종양 게놈 샘플 내의 돌연변이는 환자의 매칭된 정상 샘플에 대해 확인되고, 둘째, 비-환자(또는 이전에 돌연변이된 환자) 핵산은 이후에 동일한 환자의 병원체 또는 이전 돌연변이된 핵산 서열의 참조 핵산과 상호관련된다. 물론, 발현이 확인된 서열이 일반적으로 후속 분석에 바람직하다는 것에 유의해야 한다.
물론, 암 및 환자 특이적 돌연변이에 기초하여 새로운 펩타이드 서열을 야기하는 것을 확인하기 위해 추가의 하류 분석이 또한 확인된 서열 차이에 대해 수행될 수 있음에 유의해야 한다. 즉, 침묵 돌연변이는 확인된 네오에피토프의 목록으로부터 제거될 수 있다. 따라서, 네오에피토프는 돌연변이의 유형(예컨대, 결실, 삽입, 전환, 전이, 전좌) 및 돌연변이(예컨대, 넌센스, 미스센스, 프레임 이동 등)의 영향을 고려하여 확인될 수 있고, 침묵 및 다른 비-관련(예컨대, 비-발현된) 돌연변이가 제거되는 제1 내용 필터로서 작용할 수 있다. 네오에피토프 서열은 비교적 짧은 길이(예컨대, 7-11 머)를 갖는 서열 구간으로서 정의될 수 있는 것으로 추가로 이해되어야 하며, 이러한 구간은 아미노산 서열의 변화(들)를 포함할 것이다. 가장 전형적으로, 변화된 아미노산은 중심 아미노산 위치에 또는 그 근처에 있을 것이다. 예를 들면, 전형적인 네오에피토프는 A4-N-A4, 또는 A3-N-A5, 또는 A2-N-A7, 또는 A5-N-A3, 또는 A7-N-A2의 구조를 가질 수 있으며, 상기 식에서 A는 아미노산이고, N은 변화된 아미노산(야생형 또는 매칭된 정상과 대비하여)이다.
본원에서 고려된 바와 같은 네오에피토프 서열은 비교적 짧은 길이(예컨대, 5-30 mer, 보다 전형적으로 7-11 mer, 또는 12-25 mer)를 갖는 서열 구간으로서 정의될 수 있는 것으로 추가로 이해되어야 하며, 상기 구간은 아미노산 서열의 변화(들)를 포함한다. 가장 전형적으로, 변화(들)는 중심에 또는 중심 근처(예컨대, 중심 위치로부터 4개 미만, 또는 5개 미만, 또는 6개 미만 아미노산)에 위치한다. 따라서, 그리고 다른 관점에서 볼 때, 본원에서 고려되는 네오에피토프 서열은 매칭된 정상 서열에 대해 단일 아미노산이 교환되고, 변화된 아미노산의 위치가 중심에 또는 네오에피토프 서열의 중심 근처(예컨대, 9-mer에서, 변화된 아미노산은 위치 2, 3, 4, 또는 5, 및 보다 전형적으로 위치 3, 4, 또는 5, 및 가장 전형적으로 위치 4 또는 5에 있음)에 위치한 것을 특히 포함할 것이다. 따라서, 변화된 아미노산의 위치에 따라, 단일 아미노산 변화가 변화된 아미노산을 포함하는 많은 네오에피토프 서열에서 제시될 수 있는 것으로 이해되어야 한다. 유리하게도, 이러한 서열 가변성은 네오에피토프의 다중 선택을 가능하게 하여 이후에 하나 이상의 바람직한 형질(예컨대, 환자 HLA-유형에 대한 가장 높은 친화도, 가장 높은 구조적 안정성 등)에 기초하여 선택될 수 있는 잠재적으로 유용한 표적의 수를 증가시킨다. 가장 전형적으로, 네오에피토프는 2-50개의 아미노산, 보다 전형적으로 5-30개의 아미노산, 및 가장 전형적으로 9-15개의 아미노산의 길이를 갖도록 계산될 것이며, 변화된 아미노산은 바람직하게는 중심에 위치하거나 주요 조직적합성 복합체(MHC)에 대한 결합을 향상시키는 방식으로 위치한다.
예를 들면, 에피토프가 MHC-I 복합체에 의해 제시되는 경우, 전형적인 에피토프 길이는 약 8-11개의 아미노산일 것이며, 반면 MHC-II 복합체를 통해 제시하기 위한 전형적인 에피토프 길이는 약 13-17개의 아미노산의 길이를 가질 것이다. 쉽게 이해될 바와 같이, 네오에피토프 내의 변화된 아미노산의 위치는 중심 이외일 수 있으므로, 실제 펩타이드 서열 및 네오에피토프의 실제 위상은 상당히 달라질 수 있다. 더욱이, 네오에피토프가 합성 펩타이드로서 면역 적격(또는 다른) 세포에 제시되는 경우, 상기 합성 펩타이드는 세포에서 단백질분해 처리를 가능하게 하기 위해 MHC-I 또는 MHC-II 시스템에 의해 궁극적으로 결합된 펩타이드 부분보다 유의하게 더 길 수 있는 것으로 이해되어야 한다. 따라서, 예를 들면, 고려된 합성 펩타이드는 변화된 아미노산의 상류 및 하류에 8 내지 15개의 아미노산을 가질 수 있다.
컴퓨터를 이용한 분석을 용이하게 하는 바람직한 구현예에서(및 상기 언급된 바와 같이), 에피토프 및 네오에피토프의 분석은 항체 결합에 필요한 최소 크기(예컨대, 적어도 5-6개의 아미노산) 및 20개의 아미노산의 최대 크기(및 일부 경우에 더 길다)를 갖는 비교적 작은 단편에 국한될 것으로 고려된다. 따라서, 에피토프 및 네오에피토프는 바람직하게는 7-12개의 아미노산의 길이를 가질 것이다. 예를 들면, 적합한 네오에피토프는 변화된 아미노산을 포함하여, 9개의 아미노산의 길이를 가질 수 있다.
게놈 분석이 많은 분석 방법에 의해 수행될 수 있음이 일반적으로 고려되나, 특히 바람직한 분석 방법은 종양 및 매칭된 정상 샘플 모두의 WGS(전체 게놈 시퀀싱) 및 엑솜 시퀀싱을 포함한다. 마찬가지로, 서열 데이터의 컴퓨터를 이용한 분석은 많은 방식으로 수행될 수 있다. 그러나, 가장 바람직한 방법에서, 분석은, 예를 들면, BAM 파일 및 BAM 서버를 사용하여 US 제2012/0059670호A1 및 US 제2012/0066001호A1에 개시된 바와 같이, 종양 및 정상 샘플의 위치 유도 동기화 정렬에 의해 인실리코로 수행된다. 컴퓨터에 지시하는 임의의 언어는 개별적으로 또는 집합적으로 작동하는 서버, 인터페이스, 시스템, 데이터베이스, 에이전트, 피어, 엔진, 컨트롤러, 또는 다른 유형의 컴퓨팅 장치를 포함하는, 컴퓨팅 장치의 임의의 적합한 조합을 포함하도록 읽혀야 함에 유의해야 한다. 컴퓨팅 장치는 유형의 비-일시적 컴퓨터 해독가능한 저장 매체(예컨대, 하드 드라이브, 솔리드 스테이트 드라이브, RAM, 플래시, ROM 등)에 저장된 소프트웨어 지시를 실행하도록 구성된 프로세서를 포함한다는 것을 이해해야 한다. 소프트웨어 지시는 바람직하게는 개시된 장치와 관련하여 하기에 논의된 바와 같은 역할, 책임, 또는 다른 기능을 제공하는 컴퓨팅 장치를 구성한다. 또한, 개시된 기술은 프로세서가 컴퓨터 기반 알고리즘, 공정, 방법, 또는 다른 지시의 구현과 관련된 개시된 단계를 실행하게 하는 소프트웨어 지시를 저장하는 비-일시적 컴퓨터 해독가능한 매체를 포함하는 컴퓨터 프로그램 제품으로서 구현될 수 있다. 특히 바람직한 구현예에서, 다양한 서버, 시스템, 데이터베이스, 또는 인터페이스는, 아마도 HTTP, HTTPS, AES, 공공-개인 키 교환, 웹 서비스 API, 공지된 금융 거래 프로토콜, 또는 다른 전자 정보 교환 방법에 기초하여, 표준화된 프로토콜 또는 알고리즘을 사용하여 데이터를 교환한다. 장치간 데이터 교환은 패킷-교환 네트워크, 인터넷, LAN, WAN, VPN, 또는 다른 유형의 패킷 교환 네트워크; 회로 교환 네트워크; 셀 교환 네트워크; 또는 다른 유형의 네트워크를 통해 전달될 수 있다.
결과적으로, 환자 및 암 특이적 네오에피토프는 환자 및 종양 유형에 독특한 잠재적인 에피토프 또는 네오에피토프를 궁극적으로 예측하는 배타적인 인실리코 환경에서 확인될 수 있는 것으로 인식되어야 한다. 이후, 이렇게 확인되고 선택된 에피토프 또는 네오에피토프는 확인된 환자 HLA-유형에 대해 인실리코로 추가로 필터링될 수 있다. 이러한 HLA-매칭은 MHC 복합체에 대한 에피토프 또는 네오에피토프의 강한 결합을 보장하고 따라서 에피토프 또는 네오에피토프에 대한 면역 반응을 유발하는데 도움을 주는 것으로 생각된다. 선택되거나 확인된 네오에피토프가 환자에게 비천연일 수 있는 것으로 추가로 이해되어야 한다. 그러나, 대안적인 또는 추가의 필터링 방법이 관심 에피토프 및 네오에피토프를 확인하는데 사용될 수 있는 것으로 이해되어야 한다.
확인된 네오에피토프를 필터링하는 것과 관련하여, 오믹스(또는 다른) 분석이 네오에피토프가 실제 발현되는 것을 밝히는 경우 네오에피토프가 본원에서 사용하기에 특히 적합한 것으로 일반적으로 고려된다. 네오에피토프의 발현 및 발현 수준의 확인은 당업계에 알려진 모든 방식으로 수행될 수 있고, 바람직한 방법은 RNA-seq, 정량적 RNA(hnRNA 또는 mRNA) 분석 및/또는 정량적 프로테오믹스 분석을 포함한다. 가장 전형적으로, 네오에피토프의 포함을 위한 임계 수준은 상응하는 매칭된 정상 서열의 적어도 20%의 발현 수준, 및 보다 전형적으로 적어도 50%의 발현 수준일 것이므로, (네오)에피토프가 면역 시스템에 적어도 잠재적으로 '가시적'이라는 것을 보장한다. 결과적으로, 오믹스 분석은 또한 돌연변이를 갖는 유전자의 발현 수준을 확인하는데 도움을 주는 유전자 발현의 분석(전사체 분석)을 포함하는 것이 일반적으로 바람직하다. 당업계에 공지된 많은 전사체 분석 방법이 있으며, 공지된 방법 모두는 본원에서 사용하는데 적합한 것으로 여겨진다. 예를 들면, 바람직한 물질은 mRNA 및 일차 전사체(hnRNA)를 포함하고, RNA 서열 정보는 결국 동일한 환자의 종양 샘플 및 매칭된 정상(건강한) 샘플로부터 수득되는 역전사된 폴리A+-RNA로부터 수득될 수 있다. 마찬가지로, 폴리A+-RNA는 전형적으로 전사체의 대표로서 선호되지만, RNA의 다른 형태(hn-RNA, 비-폴리아데닐화 RNA, siRNA, miRNA 등) 역시 본원에서 사용하는데 적합한 것으로 여겨진다는 것에 유의해야 한다. 바람직한 방법은 정량적 RNA(hnRNA 또는 mRNA) 분석 및/또는 정량적 프로테오믹스 분석을 포함한다. 가장 전형적으로, RNA 정량 및 시퀀싱은 qPCR 및/또는 rtPCR 기반 방법을 사용하여 수행되나, 다른 방법(예컨대, 고상 혼성화-기반 방법) 역시 적합한 것으로 여겨진다. 또 다른 관점에서 볼 때, 전사체 분석은 암 및 환자 특이적 돌연변이를 갖는 유전자를 확인하고 정량하는데 적합할 수 있다(단독으로 또는 게놈 분석과 조합으로).
따라서, 상기를 고려할 때, 종양 및 매칭된 정상 조직으로부터의 DNA 및 RNA를 포함하는 환자 샘플이 특이적 돌연변이를 확인하고 이러한 돌연변이를 정량화하는데 사용될 수 있는 것으로 이해되어야 한다.
유사하게, 프로테오믹스 분석은 네오에피토프의 발현을 확인하기 위해 많은 방식으로 수행될 수 있고, 모든 공지된 방식 또는 프로테오믹스 분석이 본원에서 고려된다. 그러나, 특히 바람직한 프로테오믹스 방법은 항체 기반 방법 및 질량 분광 방법(예컨대, SRM, CRM, MRM)을 포함한다. 더욱이, 프로테오믹스 분석은 단백질 자체에 관한 정성적 또는 정량적 정보를 제공할 수 있을 뿐만 아니라, 단백질이 촉매 활성 또는 다른 기능적 활성을 갖는 경우 단백질 활성 데이터를 포함할 수 있음에 유의해야 한다. 프로테오믹스 분석을 수행하기 위한 기술의 한 가지 예는 2004년 3월 10일에 출원된 "Liquid Tissue Preparation from Histopathologically Processed Biological Samples, Tissues, and Cells"라는 명칭의 미국 특허 제7,473,532호(Darfler et al.)를 포함한다.
또한, 네오에피토프는 또한 미리 정의된 구조적 및/또는 세포내 위치 매개변수를 사용하여 상세한 분석 및 필터링이 수행될 수 있다. 예를 들면, 네오에피토프 서열이 막 관련된 위치를 갖는 것으로 확인된 경우(예컨대, 세포의 세포막의 외부에 위치하는 경우) 및/또는 인실리코 구조 계산이 네오에피토프가 용매에 노출되거나 구조적으로 안정한 에피토프 등을 제시할 가능성이 있음을 확인시켜 주는 경우 네오에피토프 서열이 추가 사용을 위해 선택되는 것으로 고려된다.
필터링의 또 다른 양태에서, 네오에피토프는 인간-동일 서열의 사용을 피하기 위해 공지된 인간 서열을 함유하는 데이터베이스와 비교될 수 있다. 더욱이, 필터링은 또한 환자에서 SNP로 인한 네오에피토프 서열의 제거를 포함할 수 있다. 예를 들면, 단일 뉴클레오타이드 다형성 데이터베이스(dbSNP)는 국립 인간 게놈 연구소(NHGRI)와 공동으로 국립생물공학정보센터(NCBI)에 의해 개발되고 주최된 상이한 종 내 및 종 간에서의 유전적 변이에 대한 무료 공개 보관소이다. 데이터베이스의 이름이 한 가지 계열의 다형성 단독의 집합(즉, 단일 뉴클레오타이드 다형성(SNP))을 의미하지만, 그것은 실제로는 비교적 광범위한 분자 변이를 함유한다: (1) SNP, (2) 짧은 결실 및 삽입 다형성(indel/DIP), (3) 미세위성 마커 또는 짧은 탠덤 반복(STR), (4) 다중뉴클레오타이드 다형성(MNP), (5) 이종접합 서열, 및 (6) 지정된 변이. dbSNP는 명백하게 중립 다형성, 알려진 표현형에 상응하는 다형성, 및 변화가 없는 영역을 수용한다. 이러한 데이터베이스를 사용하여, 환자 및 종양 특이적 네오에피토프는 이러한 공지된 서열을 제거하기 위해 추가로 필터링되어, 복수의 네오에피토프 서열을 갖는 치료 서열 세트를 생성할 수 있다.
일부 구현예에서, 네오에피토프는 가능성 스코어를 얻기 위해 100만개의 수당 전사체를 곱한 대립유전자 빈도에 기초하여 스코어/순위가 매겨질 수 있다. 이후, 이 스코어는 환자의 HLA 유형에 대한 HLA 정보 및 계산된 또는 실제의 결합 친화도를 사용하여 추가로 증가될 수 있다. 예를 들면, 예시적인 순위 포맷은 다음과 같을 수 있다:
Figure pct00001
여기서, 파일은 FASTA 포맷 파일이고, 엔트리는 단지 샘플 정보를 보고하는 '>' 문자로 시작한다. 다음 줄은 네오에피토프이다. 샘플에서 정보 줄은 샘플을 나타내는데 사용되는 수(예컨대, 254), Refseq 유전자 ID(예컨대, NM_001000.3), HUGO 일반 명칭(예컨대, RPL39), 변이 분류(예컨대, 미스센스), 단백질 변화(예컨대, p.M29K), 염기쌍 변화(예컨대, A->T), 정상 에피토프(예컨대, 정상: WIRMKTGNK), 대립유전자 빈도(예컨대, AF: 0.179104477612), 이 유전자에 대한 100만개당 전사체(예컨대, TPM: 1023.96), 모든 유전자의 중간 발현 수준인 TPM_MEDIAN(예컨대, TPM_MEDIAN: 7.35), 단지 AF x TPM인 LL 스코어(예컨대, LL: 183.395820896), netMHC 예측된 결합 값(예컨대, netMHC: 242.96), 및 네오에피토프가 결합하는 특이적 HLA 대립유전자(예컨대, 대립유전자: HLA-A0301)를 함유한다. 이후, 다음 줄은 네오에피토프이다(예컨대, WIRKKTGNK).
동기화된 증분 분석 및 엄청난 크기의 서열 파일이 본 발명의 대상의 방법을 인간 실행에 완전히 부적합하게 만들 것으로 인식되어야 하는데, 하루당 10,000s 염기를 분석한다 하더라도 이러한 파일 분석은 인간의 수명을 쉽게 초과할 것이기 때문이다. 더욱이, 게놈 배열에 대한 해답의 계산은 인간 행위의 불가능성을 더욱 증가시킬 것이다. 또한, 키메라성 참조 핵산(즉, 병합된 바이러스 핵산 서열 및 포유동물 핵산 서열, 바이러스 서열은 개별 염색체로서 조직화/색인됨)의 특정 파일 구조는 분석 시간을 현저히 개선하는 기술적 효과를 가질 것임이 지적되어야 하는데, 이러한 파일 구조가 (a) 전체 서열을 메모리에 로딩하는 것에 비해 많은 메모리 요구 없이 신속하게 처리될 수 있기 때문이고, (b) 에피토프 또는 네오에피토프의 게놈 통합 및 확인의 신속한 분석을 가능하게 하는데, 이러한 방법이 비-환자 오믹스에 대한 출처의 수에 의해 지시된 바와 같이 3개 이상이 아닌 2개의 서열 파일의 분석만을 필요로 하기 때문이다.
HLA 결정은 당업계에 널리 알려진 습식 화학의 다양한 방법을 사용하여 수행될 수 있고, 이들 방법 모두는 본원에서 사용하는데 적합한 것으로 여겨진다. 그러나, 특히 바람직한 방법에서, HLA-유형은 또한 하기에 보다 상세히 나타낸 바와 같이 공지되고/되거나 공통된 HLA-유형의 대부분 또는 모두를 함유하는 참조 서열을 사용하여 인실리코로 오믹스 데이터로부터 예측될 수 있다. 요약하면, 환자의 HLA-유형이 확인되고(습식 화학 또는 인실리코 결정을 사용하여), HLA-유형에 대한 구조적 해법이 계산되거나 데이터베이스로부터 얻어지고, 이는 이후에, HLA 구조적 해법에 대한 네오에피토프의 결합 친화도를 결정하기 위한 인실리코 도킹 모델로서 사용된다. 결합 친화도의 결정을 위한 적합한 시스템은 NetMHC 플랫폼(예컨대, Nucleic Acids Res. 2008 Jul 1; 36(Web Server issue): W509-W512.)을 포함한다. 이전에 결정된 HLA-유형에 대해 높은 친화도(예컨대, 100 nM 미만, 75 nM 미만, 50 nM 미만)을 갖는 네오에피토프가 이후에 선택된다. 가장 높은 친화도를 계산할 때, 바이러스에서 발현된 네오에피토프의 HLA-유형에 대한 결합을 더 증가시키기 위해 네오에피토프에 대한 변형은 에피토프에 N- 및/또는 C-말단 변형을 부가함으로써 구현될 수 있다. 따라서, 네오에피토프는 확인된 바와 같이 천연이거나 특정 HLA-유형에 더 잘 매칭하도록 더 변형될 수 있다.
일부 양태에서, HLA 타이핑은 환자에 대한 HLA-유형을 인실리코로 예측하는 방법을 포함하고, 공지되고 구별되는 HLA 대립유전자의 복수의 서열을 포함하는 참조 서열이 제공되고, 복수의 환자 서열 리드가 제공되며, 환자 서열 리드 중 적어도 일부는 환자 특이적 HLA를 코딩하는 서열을 포함한다. 추가의 단계에서, 환자 서열 리드는 복수의 각각의 k-mer 세트로 분해되고, 이후 복합 드 브뤼에인(De Bruijn) 그래프가 참조 서열 및 복수의 각각의 k-mer 세트를 사용하여 생성된다. 공지되고 구별되는 HLA 대립유전자 각각은 복수의 환자 서열 리드의 각각의 투표로부터 계산된 복합 매칭 스코어를 사용하여 순위가 매겨지는 것으로 추가로 고려되며, 각 투표는 공지되고 구별되는 HLA 대립유전자 내의 상응하는 분절과 매칭하는 k-mer를 사용한다.
바람직한 구현예에서, 오믹스 데이터는 착색된 드 브뤼에인 그래프를 사용하여 분석될 수 있는데, 에지는 k-mer가 어떤 입력 소스에서 발견되는지(예컨대, 참조, 정상 샘플, 및/또는 종양 샘플, 상이한 시간 또는 연령에서 채취한 샘플, 상이한 환자 또는 대상 그룹으로부터의 샘플 등) 확인하는 "색상"을 갖는 k-mer(k=15)이며, 각각의 에지는 인접한 에지에 연결된다. 예시적인 시스템 및 방법은 미국 가출원 제62/209858호에 기재되어 있다. 예를 들면, 게놈 내의 k-mer 위치를 저장하기 위해 참조 서열로부터 제1 그래프가 제작될 수 있다. 이 참조 서열은 모든 공지된 것(또는 적어도 모든 공통 HLA-유형 서열)으로부터 만들어진다는 점에 유의해야 한다. 바람직하게는, 그리고 요구되는 특정 과제에 따라, k-mer는 3 내지 300개 염기, 보다 바람직하게는 10-100개 염기, 및 가장 바람직하게는 10-20개 또는 13-18개 염기의 길이를 가질 것이다(예컨대, k=13). 제1 그래프가 확립되면, 게놈의 주어진 영역에 위치한 종양 및 정상 원시 시퀀싱 데이터로부터의 k-mer(맵핑되지 않은 고정된 리드 포함)가 부가된다. 필요에 따라, 최대 지원이 특정 사용자 정의된 임계(예컨대, k=13인 경우, 임계는 8임) 미만인 리드를 제거하기 위해 약한 에지가 그래프로부터 제거될 수 있다. 이러한 제거는 전형적으로 서열 예측/정렬의 정확도를 증가시킬 것이다.
추가의 단계에서, 이렇게 제작된 복합 그래프는 종양 및 참조가 발산하는 접합부에 대해 분석된다. 각 발산에 대해, 깊이 우선 탐색(depth-first search)을 사용하여 참조와 함께 수렴하는 종양을 야기하는 종양 에지를 통과하는 모든 독특한 경로를 식별하며, 이는 버블로서 표현될 수 있다(k-mer를 사용하여 서열 정보의 차이에 의해 발생한 발산 및 수렴의 지점).
이후, 각 버블 해법의 말단으로부터의 통계학적 분석이 가장 가능성 있는 정렬 및/또는 서열을 확인하는데 사용될 수 있다. 대부분의 전형적인 구현예에서, 서열은 단순한 원시 서열 리드가 아니라 주석이 달린 SAM 또는 BAM 파일이기 때문에, 통계학적 분석은 각각의 리드에 대한 메타데이터에 기초한 리드 특이적 매개변수를 포함할 수 있다. 따라서, 통계학적 분석은 최대 지원, k-mer에 대한 맵핑/염기 품질, 매칭된-정상에서의 지원 등을 포함할 수 있다. 결과적으로, 참조 서열을 재구성하기 위해 참조 에지를 따른 역추적 및 게놈 내의 위치의 결정은 전형적으로 사용자 정의 기준(예컨대, 최소 지원 > X 리드, 정상에서 최대 지원 < Y 리드 등)을 충족하는 그래프의 경로에 대해 수행될 수 있음이 인식되어야 한다. 이후, 이렇게 재구성된 서열 및/또는 구조는 특정 변이를 분류하는데 사용될 수 있다. 바람직하게는, 변이 분류는 VCF 포맷으로 제공되지만, 다른 포맷이 또한 고려된다.
전술한 바와 같이, HLA/MHC 참조 서열은 전형적으로 공지된 대립유전자의 라이브러리를 포함하며, 이는 이후에 참조 그래프를 형성하는데 사용되고, 이는 이후에 환자 DNA 또는 RNA를 사용하여 복합 그래프를 만드는데 사용된다. 예를 들면, 환자 샘플에 대한 HLA 예측을 위해, 주어진 HLA 유형(A, B, C, G, DRB1,...)에 대한 모든 대립유전자로부터의 그래프가 제작된다. 본 발명의 대상에 제한되지는 않지만, 단일 환자 BAM 파일로부터 쌍으로 된 시퀀싱 리드는 단편으로서 연결되고 HLA-A 그래프를 통해 "스레드(thread)"되며 순위가 매겨져 최적 적합을 확립한다. 예를 들면, 문제의 단편과 최상의(또는 동등한) 유사성을 갖는 HLA 대립유전자(공유된 k-mer의 분획으로서 정의됨)는 각각의 공유된 k-mer에 대해 이들의 스코어를 1씩 증가시키고, 이후, 최상위 HLA 대립유전자가 이들의 스코어에 따라 선택될 수 있다. 물론, 다른 측정기준이 또한 수집되고(예컨대, 전체 커버리지 깊이, 그래프 에지, 단편에 의해 커버된 HLA 서열의 분획 등) 스코어링에 사용될 수 있음에 유의해야 한다.
가장 전형적으로, HLA-참조 서열은 적어도 1%의 대립유전자 빈도를 갖는 적어도 하나의 HLA 유형에 대한 대립유전자를 포함하거나, 참조 서열은 적어도 하나의 HLA 유형에 대한 적어도 10개의 상이한 대립유전자, 및/또는 적어도 2개의 구별되는 HLA 유형에 대한 대립유전자를 포함한다. HLA 유형에 대하여, 적합한 HLA-유형은 HLA-A 유형, HLA-B 유형, HLA-C 유형, HLA-DRB-1 유형, 및/또는 HLA-DQB-1 유형을 포함하는 것으로 고려된다.
본 발명의 대상의 하나의 예시적인 양태에서, 염색체 6p21.3(또는 HLA 대립유전자가 발견되는 위치 또는 그 근처의 임의의 다른 위치)로의 비교적 많은 수의 환자 서열 리드 맵핑은 데이터베이스 또는 시퀀싱 기계에 의해 제공된다. 가장 전형적으로 서열 리드는 약 100-300개의 염기의 길이를 가지며, 리드 품질, 정렬 정보, 배향, 위치 등을 포함하는 메타데이터를 포함한다. 예를 들면, 적합한 포맷은 SAM, BAM, FASTA, GAR 등을 포함한다. 본 발명의 대상에 제한되지 않지만, 환자 서열 리드가 적어도 5x, 보다 전형적으로 적어도 10x, 보다 전형적으로 적어도 20x, 및 가장 전형적으로 적어도 30x의 커버리지의 깊이를 제공하는 것이 일반적으로 바람직하다.
환자 서열 리드 외에도, 고려된 방법은 공지되고 구별되는 HLA 대립유전자의 복수의 서열을 포함하는 하나 이상의 참조 서열을 추가로 사용한다. 예를 들면, 전형적인 참조 서열은 그 HLA-유형의 다수의 HLA-대립유전자를 갖는 적어도 하나의 HLA-유형의 서열 분절을 포함하는 합성(상응하는 인간 또는 다른 포유동물 대응물이 없음) 서열일 수 있다. 예를 들면, 적합한 참조 서열은 HLA-A의 적어도 50개의 상이한 대립유전자에 대한 공지된 게놈 서열의 집합을 포함한다. 대안적으로, 또는 추가적으로, 참조 서열은 또한 HLA-A의 적어도 50개의 상이한 대립유전자에 대한 공지된 RNA 서열의 집합을 포함할 수 있다. 물론, 그리고 하기에 보다 상세히 추가로 설명된 바와 같이, 참조 서열은 HLA-A의 50개의 대립유전자에 제한되지 않지만, 대립유전자의 수/조성에 대하여 대안적인 조성을 가질 수 있다. 가장 전형적으로, 참조 서열은 컴퓨터 해독가능한 포맷일 것이며 데이터베이스 또는 다른 데이터 저장 장치로부터 제공될 것이다. 예를 들면, 적합한 참조 서열 포맷은 FASTA, FASTQ, EMBL, GCG, 또는 GenBank 포맷을 포함하고, 공공 데이터 저장소(예컨대, IMGT, 국제 ImMunoGeneTics 정보 시스템, 또는 대립유전자 빈도 네트 데이터베이스, EUROSTAM, www.allelefrequencies.net)의 데이터로부터 직접 수득되거나 만들어질 수 있다. 대안적으로, 참조 서열은 또한 대립유전자 빈도, 인종 대립유전자 분포, 공통 또는 희귀 대립유전자 유형 등과 같은 하나 이상의 미리 결정된 기준에 기초하여 개별 공지된 HLA-대립유전자로부터 만들어질 수 있다.
참조 서열을 사용하여, 환자 서열 리드는 최상 적합을 갖는 대립유전자를 확인하기 위해 드 브뤼에인 그래프를 통해 스레딩될 수 있다. 이 문맥에서, 각 개인은 각각의 HLA-유형에 대해 2개의 대립유전자를 보유하고, 이러한 대립유전자는 매우 유사할 수 있거나 일부 경우 동일할 수도 있다는 점에 유의해야 한다. 이러한 고도의 유사성은 전통적인 정렬 방식에 중요한 문제를 제기한다. HLA 대립유전자, 및 심지어 매우 밀접하게 관련된 대립유전자는 서열 리드를 비교적 작은 k-mer(전형적으로 10-20개의 염기의 길이를 가짐)로 분해하고 대립유전자의 서열과 매칭하는 서열 리드의 k-mer에 기초하여 각 대립유전자에 대한 투표("정량적 리드 지원")를 제공하는 가중화된 투표 과정을 구현함으로써 드 브뤼에인 그래프가 제작되는 접근법을 사용하여 분해될 수 있음이 고려된다. 이후, 대립유전자에 대한 누적으로 가장 높은 투표는 가장 가능성이 있는 예측된 HLA 대립유전자를 나타낸다. 또한, 대립유전자에 매칭하는 각 단편이 또한 그 대립유전자에 대한 전체 커버리지 및 커버리지의 깊이를 계산하는데 사용되는 것이 일반적으로 바람직하다. 높은 정확도 인실리코 HLA 타이핑을 위한 추가적인 양태, 적합한 방법 및 고려사항이 공유된 국제 PCT/US16/48768호에 기재되어 있다.
스코어링은, 필요한 경우, 특히 많은 상위 히트가 유사한 경우(예컨대, 이들의 스코어의 중요 부분이 고도로 공유된 k-mer 세트로부터 유래되는 경우), 추가로 개선되거나 개량될 수 있다. 예를 들면, 스코어 개량은 현재의 상위 히트와 실질적으로 유사한(예컨대, > 99%, 또는 다른 미리 결정된 값) 대립유전자가 추후의 고려로부터 제거되는 가중치 부여 체계를 포함할 수 있다. 이후, 현재의 상위 히트에 의해 사용된 k-mer에 대한 수가 인자(예컨대, 0.5)에 의해 다시 가중되고, 이러한 가중된 수를 합함으로써 각 HLA 대립유전자에 대한 스코어가 재계산된다. 이러한 선택 과정은 새로운 최상 히트를 찾기 위해 반복된다. 상기 방법의 정확도는 때로는 DNA에 존재하는 2개의 대립유전자 중 단지 1개일 수 있는 종양에 의해 발현된 대립유전자의 확인을 가능하게 하는 RNA 서열 데이터를 사용하여 더욱 개선될 수 있다. 고려된 시스템 및 방법의 추가의 유리한 양태에서, DNA 또는 RNA, 또는 DNA 및 RNA 모두의 조합은 매우 정확한 HLA 예측을 하기 위해 처리될 수 있고, 종양 또는 혈액 DNA 또는 RNA로부터 유래될 수 있다.
이러한 개량은 DNA 및/또는 RNA 시퀀싱 정보로부터 HLA 결정에 특히 유리한데, 각각의 HLA-유형은 많은 종종 매우 유사한 대립유전자를 갖고 전통적인 정렬 방법은 전형적으로 서열이 고도의 유사성을 갖는 경우 유의한 구별 능력을 갖지 못하기 때문이다.
물론, 분석 및 HLA 예측이 상기 나타낸 특정 HLA-유형에 제한될 필요는 없지만, 모든 HLA-유형 및 대립유전자 변이체가 본원에서 고려되는 것으로 이해되어야 하며, 이는 HLA-E, HLA-F, HLA-G, HLA-H, HLA-J, HLA-K, HLA-L, HLA-V, HLA-DQA1, HLA-DMA, HLA-DMB, HLA-DOA, HLA-DOB, HLA-DPA1, HLA-DPB1, HLA-DRA, HLA-DRB345, HLA-MICA, HLA-MICB, HLA-TAP1, HLA-TAP2, 및 심지어 새로 발견된 HLA 유형 및 이들의 상응하는 대립유전자를 포함한다. 더욱이, 분석이 단일 HLA-유형에 제한될 필요는 없지만, 다중 HLA-유형이 본원에서 사용하는데 적합한 것으로 이해되어야 한다. 결과적으로, 참조 서열은 각각의 HLA-유형에 대한 대립유전자의 집합과 함께, 2개, 3개, 4개 이상의 HLA-유형을 포함할 수 있다. 각각의 HLA-유형이 상당수의 대립유전자를 가지기 때문에, 공지된 대립유전자 모두가 참조 서열에 포함될 필요가 없는 것으로 고려된다. 예를 들면, 참조 서열은 적어도 0.1%, 또는 적어도 0.5%, 또는 적어도 1%, 또는 적어도 2%, 또는 적어도 5%의 대립유전자 빈도와 같은 특정 임계를 초과하는 대립유전자 빈도를 갖는 대립유전자를 포함할 수 있다. 따라서, 그리고 다른 관점에서 볼 때, 적합한 참조 서열은 적어도 하나의 HLA 유형에 대해 적어도 10개, 또는 적어도 30개, 또는 적어도 50개, 또는 적어도 100개, 또는 적어도 200개 또는 적어도 500개, 또는 심지어 더 상이한 대립유전자를 포함할 수 있다.
환자 및 종양 특이적 네오에피토프 및 HLA-유형이 확인되면, 네오에피토프를 HLA에 도킹시키고 최상의 결합물질(예컨대, 가장 낮은 KD, 예를 들면, 50nM 미만)을 결정함으로써 컴퓨터를 이용한 분석이 수행될 수 있다. 이러한 접근법은 환자 및 종양에 진정한 특이적 네오에피토프뿐만 아니라, 세포 상에서 제시될 가능성이 가장 높고 치료 효과로 면역 반응을 이끌어낼 가능성이 가장 높은 네오에피토프를 확인할 것으로 이해되어야 한다. 물론, 이렇게 확인된 HLA-매칭된 네오에피토프는 또한 하기에 더 논의된 바와 같이 페이로드(payload)로서 에피토프를 코딩하는 핵산을 바이러스 내로 포함시키기 전에 시험관내에서 생화학적으로 평가될 수 있는 것으로 이해되어야 한다.
물론, 환자의 HLA-유형을 환자- 및 암-특이적 네오에피토프에 매칭시키는 것이 NetMHC 이외의 시스템을 사용하여 수행될 수 있고, 적합한 시스템은 NetMHC II, NetMHCpan, IEDB 분석 자원(URL immuneepitope.org), RankPep, PREDEP, SVMHC, Epipredict, HLABinding 등(예컨대, J Immunol Methods 2011;374:1-4 참고)을 포함하는 것으로 이해되어야 한다. 가장 높은 친화도를 계산할 때, 변화된 아미노산의 위치가 이동된(상기) 네오에피토프 서열의 집합이 사용될 수 있음에 유의해야 한다. 대안적으로, 또는 추가적으로, 네오에피토프에 대한 변형은 N- 및/또는 C-말단 변형을 부가하여 환자의 HLA-유형에 대한 발현된 네오에피토프의 결합을 더 증가시킴으로써 구현될 수 있다. 따라서, 네오에피토프는 확인된 바와 같이 천연일 수 있거나 특정 HLA-유형에 더 잘 매칭되도록 추가로 변형될 수 있다.
더욱이, 원하는 경우, 높은 차등 친화도를 보장하기 위해 상응하는 야생형 서열(즉, 아미노산 변화가 없는 네오에피토프 서열)의 결합이 계산될 수 있다. 예를 들면, 네오에피토프 및 그의 상응하는 야생형 서열 사이의 MHC 결합에서 특히 바람직한 높은 차등 친화도은 적어도 2배, 적어도 5배, 적어도 10배, 적어도 100배, 적어도 500배, 적어도 1000배 등이다.
이러한 방법은 특정 환자 게놈 내로 통합된 바이러스 서열의 특정 돌연변이를 포함하는 특정 환자 게놈 내의 특정 돌연변이에 기초하여 면역요법을 위한 새로운 바이러스 에피토프를 확인하는 장점을 제공하는 것으로 이해되어야 한다. 이러한 바이러스 에피토프는 "전통적인" 백신 접종 프로토콜에 의해 확인될 수 없다.
유전적으로 변형된 아데노바이러스의 '페이로드'와 관련하여, 하나를 초과하는 네오에피토프, 예를 들면 2개, 3개, 4개, 5개, 및 그 이상의 발현이 바람직한 것으로 고려되며, 이는 다수의 구별되는 변형된 바이러스, 또는 하나를 초과하는 네오에피토프 서열(예컨대, 연쇄체성(concatemeric) 또는 키메라성 서열로서)을 갖는 바이러스를 사용하여 달성될 수 있다.
이후, 확인된 HLA-매칭된 네오에피토프는 바람직하게는 하나 이상의 유형의 환자-, 종양-, 및 위치-특이적 면역요법에서 사용될 것이다. 예를 들면, 면역요법은 면역 반응을 유발하기 위해 발현을 위한 바이러스 매개 암 항원 전달을 포함할 수 있고, 이는 체크포인트 억제제를 이용하여 더 증가될 수 있다. 한편, 이렇게 확인된 네오에피토프에 대한 환자-, 종양-, 및 위치-특이적 항체(또는 합성 항체)는 약물 또는 방사성 화학물질을 위한 표적화 모이어티로서 사용될 수 있거나, 세포독성 T-세포 반응을 유발하는 NK 세포와 함께 사용될 수 있다.
재조합 바이러스가 사용되는 경우, 재조합 바이러스를 제조하는 모든 공지된 방식이 본원에 사용하기에 적합한 것으로 여겨지지만, 특히 바람직한 바이러스는 아데노바이러스, 아데노-관련 바이러스, 알파바이러스, 헤르페스 바이러스, 렌티바이러스 등을 포함하는, 유전자 요법에서 이미 확립된 것인 것으로 고려된다. 그러나, 다른 적절한 선택 중에서, 아데노바이러스가 특히 바람직하다. 더욱이, 상기 바이러스는 전형적으로 선택된 바이러스 단백질(예컨대, E1, E3 단백질)의 표적화된 결실에 의해 달성되는 복제 결핍 및 비-면역원성 바이러스인 것이 더 일반적으로 바람직하다. 이러한 바람직한 특성은 E2b 유전자 기능을 결실시킴으로써 더 향상될 수 있고, 높은 역가의 재조합 바이러스는 최근 보고된 유전적으로 변형된 인간 293 세포를 사용하여 달성될 수 있다(예컨대, J Virol. 1998 Feb; 72(2): 926-933). 가장 전형적으로, 원하는 핵산 서열(바이러스 감염된 세포로부터의 발현을 위해)은 당업계에 널리 알려진 적절한 조절 요소의 제어하에 있다.
가장 바람직하게는, 재조합 핵산(들)의 치료 제제는 배열에서 암 관련된 또는 암-특이적 에피토프, 또는 환자 특이적 네오에피토프를 코딩하며, 이로써 상기 에피토프는 MHC-I 및/또는 MHC-II 제시 경로로 향한다. 이러한 면역 자극은 더 강한 면역 반응을 야기하는 것으로 여겨지며, 이는 공동-자극(co-stimulatory) 분자 및/또는 체크포인트 억제제의 피하 전달 또는(보다 전형적으로) 발현에 의해 더 증가된다. 물론, 이러한 재조합 핵산(들)의 모든 전달 방식은 적합한 것으로 여겨지며, 상기 재조합 핵산(들)은 DNA 백신으로서 제제화될 수 있고, 재조합 바이러스 게놈의 일부이거나, 또는 형질감염 조성물로 전달될 수 있는 것으로 이해되어야 한다. 더욱이, 바이러스 비히클(및 선택적 체크포인트 억제제, 예컨대 펨브롤리주맙, 니볼루맙, 이필리무맙)의 피하 투여는 적절한 B-세포 반응 및 수반되는 IgG1 생산으로 이어질 것이고, 이는 주사된 NK 세포를 사용하여 증폭될 수 있다. 가장 바람직하게는, 변형된 NK 세포는 고친화도 Fcγ 수용체(CD16)를 포함할 것이고, 이는 키메라성 항원 수용체(종양 관련된 에피토프 및/또는 네오에피토프에 대해 높은 특이성을 가짐)를 추가로 발현할 수 있다.
바이러스는, 전형적으로 투여 단위당 104-1011 바이러스 입자의 바이러스 역가를 갖는 멸균 주사용 조성물로서 제제화된, 약제학적 조성물에서의 치료 백신으로서 개별적으로 또는 조합하여 사용될 수 있다. 그러나, 대안적인 제제 역시 본원에 사용하기에 적합한 것으로 여겨지며, 투여의 모든 알려진 경로 및 방식이 본원에서 고려된다. 본원에 사용된 바와 같이, 용어 약제학적 조성물 또는 약물을 "투여하는"은 약제학적 조성물 또는 약물의 직접 및 간접 투여 모두를 지칭하며, 약제학적 조성물 또는 약물의 직접 투여는 전형적으로 건강 관리 전문가(예컨대, 의사, 간호사 등)에 의해 수행되고, 간접 투여는 약제학적 조성물 또는 약물을 직접 투여(예컨대, 주사, 주입, 경구 전달, 국소 전달 등을 통해)를 위한 건강 관리 전문가에게 제공하거나 이용가능하게 만드는 단계를 포함한다.
가장 바람직한 양태에서, 신호 펩타이드는 엔도솜 및 리소좀 구획으로의 수송을 위해 또는 세포질 공간에서의 체류를 위해 사용될 수 있다. 예를 들어, 펩타이드가 전서열을 표적화하는 엔도솜 및 리소좀 구획으로 내보내지는 경우, 내부 표적화 펩타이드가 사용될 수 있다. 표적화 펩타이드의 전서열은 바람직하게는 N-말단에 부가되고 6-136개의 염기성 및 소수성 아미노산을 포함한다. 퍼옥시좀 표적화의 경우, 표적화 서열은 C-말단에 있을 수 있다. 다른 신호(예컨대, 신호 패치)가 사용될 수 있고, 펩타이드 서열에서 분리되고 적절한 펩타이드 폴딩시 기능적으로 되는 서열 요소를 포함한다. 또한, 당화와 같은 단백질 변형은 표적화를 유도할 수 있다. 다른 적합한 표적화 신호 중에서, 본 발명자들은 퍼옥시좀 표적화 신호 1(PTS1), C-말단 트리펩타이드, 및 퍼옥시좀 표적화 신호 2(PTS2)를 고려하며, 이는 N-말단 근처에 위치한 노나펩타이드이다. 또한, 당백질을 엔도솜 및 리소좀으로 분류하는 것은 또한 전형적으로 짧은 선형 서열을 포함하는 단백질의 세포질 도메인 내의 신호에 의해 매개될 수 있다. 일부 신호는 티로신 기반 분류 신호로 지칭되고 NPXY 또는 YXXØ 공통 모티프를 준수한다. 디류신 기반 신호로 알려진 다른 신호는 [DE]XXXL[LI] 또는 DXXLL 공통 모티프에 적합하다. 이러한 신호 모두는 막의 세포질 표면과 말초적으로 결합된 단백질 코트의 성분에 의해 인식된다. YXXØ 및 [DE]XXXL[LI] 신호는 어댑터 단백질(AP) 복합체 AP-1, AP-2, AP-3, 및 AP-4에 의한 특징적인 미세한 특이성으로 인식되는 반면, DXXLL 신호는 GGA로 알려진 어댑터의 또 다른 부류에 의해 인식된다. 또한 액포 단백질 분류 및 엔도솜 기능과 관련된 FYVE 도메인이 부가될 수 있다. 추가의 양태에서, 엔도솜 구획은 또한 인간 CD1 테일 서열을 사용하여 표적화될 수 있다(예컨대, Immunology, 122, 522-531 참고).
이러한 방법은, 펩타이드가 그 MHC 하위유형에 의해 제시되지 않더라도, 펩타이드를 상기 펩타이드와 가장 높은 친화도를 갖는 MHC 하위유형으로 특이적으로 전달시키는 것으로 이해되어야 한다.
세포질 구획으로의 수송 또는 세포질 구획에서의 체류는 반드시 하나 이상의 특정 서열 요소가 필요한 것은 아닐 수 있다. 그러나, 적어도 일부 양태에서, 막-고정된 단백질 또는 막-고정된 단백질의 막 고정 도메인을 포함하는, N- 또는 C-말단 세포질 체류 신호가 부가될 수 있다. 예를 들면, 막-고정된 단백질은 SNAP-25, 신탁신(syntaxin), 시냅토프레빈(synaptoprevin), 시냅토타그민(synaptotagmin), 소포 관련 막 단백질(VAMP), 시냅스 소포 당단백질(SV2), 고친화도 콜린 수송체, 뉴렉신(Neurexin), 전압 의존성 칼슘 채널, 아세틸콜린에스터라아제, 및 NOTCH를 포함한다.
추가로 고려되는 양태에서, 다양한 네오에피토프는 많은 방식으로 배열될 수 있고, 전사 또는 번역 단위는 전형적으로 짧은 링커(예컨대, 4 내지 20개의 아미노산을 갖는 가요성 링커)에 의해 분리된 다수의 에피토프의 연쇄체성 배열을 가질 수 있으며, 이는 프로테아제 절단 부위를 추가로 포함할 수 있음을 유의해야 한다. 이러한 연쇄체는 1 내지 20개의 네오에피토프(전형적으로 바이러스를 통해 전달될 수 있는 재조합 핵산의 크기에 의해 제한됨)를 가질 수 있고, 연쇄체는 MHC-I 및 MHC-II 복합체로의 전달에 대해 동일하거나 상이할 수 있음을 유의해야 한다. 따라서, MHC-I 및/또는 MHC-II를 통한 우선적 또는 훨씬 특이적 제시를 달성하기 위해 다양한 펩타이드가 특정 세포 구획으로 전달될 수 있는 것으로 이해되어야 한다. 또 다른 관점에서 볼 때, 종양 관련 항원 및 네오에피토프는 두 가지 제시 경로를 통해, 또는 동시에 또는 이후의 치료 라운드에서 선택적으로 하나 또는 다른 경로로 제공될 수 있음이 이해되어야 한다. 추가의 적합한 형태 및 발현 카세트와 관련하여, 2016년 2월 11일경에 출원된, "Compositions And Methods For Coordinated Antigen Presentation"라는 명칭의 공동 계류 중인 미국 가출원을 참고한다.
본 발명의 대상에 제한되는 것은 아니지만, 네오에피토프 서열이 탠덤 미니유전자(예컨대, aa12-네오에피토프12-aa12)로서, 또는 단일 전사 단위로서 구성되는 것이 일반적으로 바람직하며, 이는 키메라성 단백질로 번역되거나 번역되지 않을 수 있다. 따라서, 에피토프는 단량체로서, 다량체로서, 개별으로 또는 연쇄체로서, 또는 상기에 이미 논의된 N- 및/또는 C-말단 펩타이드와의 혼성체 서열로서 제시될 수 있는 것으로 이해되어야 한다. 가장 전형적으로, 핵산 서열은 바이러스 및/또는 숙주 코돈 선호도를 수용하기 위해 적합한 코돈 용법을 사용하여 역 번역되는 것이 바람직하다. 그러나, 대체 코돈 용법 또는 비-매칭된 코돈 용법도 적절한 것으로 여겨진다.
부가적으로, 바이러스 전달 비히클은 또한 감염된 수지상 세포 및 T-세포 사이의 상호작용을 향상시키기 위해 적어도 하나, 보다 전형적으로 적어도 2개, 보다 더 전형적으로 적어도 3개, 및 가장 전형적으로 적어도 4개의 공동-자극 분자를 코딩하는 것이 바람직하다. 예를 들면, 적합한 공동-자극 분자는 특히 B7.1(CD80) 및/또는 B7.2(CD86)와 조합된, ICAM-1(CD54), ICOS-L, 및 LFA-3(CD58)을 포함한다. 추가로 고려되는 공동-자극 분자는 4-1BBL, CD30L, CD40, CD40L, CD48, CD70, CD112, CD155, GITRL, OX40L, 및 TL1A를 포함한다. 더욱이, 공동-자극 분자의 발현은 바람직하게는 항원 및/또는 네오에피토프가 하나 이상의 공동-자극 분자와 함께 제시되도록 조정될 것임이 이해되어야 한다. 따라서, 공동-자극 분자는 내부 리보솜 진입 부위 또는 2A 서열을 사용하여 단일 전사체로부터, 또는 다중 전사체로부터 생산되는 것으로 전형적으로 고려된다.
마찬가지로, 바이러스 벡터는 체크포인트 수용체에 결합하는 하나 이상의 펩타이드 리간드를 코딩하는 서열 부분을 추가로 포함할 것임이 고려된다. 가장 전형적으로, 결합은 수용체를 통한 신호전달을 억제하거나 적어도 감소시킬 것이며, 특히 고려되는 수용체는 CTLA-4(특히 CD8+ 세포의 경우) PD-1(특히 CD4+ 세포의 경우)를 포함한다. 예를 들면, 펩타이드 결합제는 항체 단편 및 특히 scF뿐만 아니라, 수용체에 특이적으로 결합하는 작은 분자 펩타이드 리간드를 포함할 수 있다. 다시 한번, 펩타이드 분자의 발현은 바람직하게는 항원 및/또는 네오에피토프가 하나 이상의 펩타이드 분자와 함께 제시되도록 조정될 것으로 이해되어야 한다. 따라서, 펩타이드 분자가 내부 리보솜 진입 부위 또는 2A 서열을 사용하여 단일 전사체로부터, 또는 다중 전사체로부터 생산되는 것으로 전형적으로 고려된다.
마지막으로, 바이러스가 다수의 네오에피토프를 코딩하는 핵산 페이로드를 포함하는 경우, 다수의 네오에피토프가 적어도 부가적으로 또는 상승적으로 숙주 면역 반응을 향상시킬 수 있는 것으로 고려된다는 점에 유의해야 한다. 유사하게, 각각 상이한 네오에피토프를 갖는 다수의 바이러스가 사용되는 경우, 다수의 네오에피토프가 적어도 부가적으로 또는 상승적으로 숙주 면역 반응을 향상시킬 수 있는 것으로 고려된다. 이러한 부가적인 또는 상승적인 효과는 특정 종양 또는 병기에 대해 진짜일 수 있거나, 또는 특정 환자 매개변수(예컨대, 연령, 성별, 이전 치료 등)에 특이적일 수 있다.
하나 이상의 환자 및 바이러스 특이적 네오에피토프에 대한 합성 항체는 n-mer 길이(전형적으로 7-11 mer)를 갖는 독특한 네오에피토프 서열을 수득하기 위해 오믹스 데이터의 인실리코 분석(전형적으로 전체 게놈 시퀀싱 및 발현 프로파일링)에 의해 생성될 수 있다. 이들 서열은 이후에 실제 펩타이드 서열을 제조하는데 사용된다. 예를 들면, 암 네오에피토프 서열을 갖는 펩타이드는 고상에서(예컨대, 메리필드(Merrifield) 합성을 사용하여), 액상 합성을 통해, 또는 더 작은 펩타이드 단편으로부터 제조될 수 있다. 덜 바람직한 양태에서, 펩타이드는 또한 적합한 숙주에서 재조합 핵산의 발현에 의해 생산될 수 있다(특히, 선택적으로 네오에피토프 또는 절단 부위 사이에 스페이서를 갖는, 다수의 네오에피토프가 단일 펩타이드 사슬 상에 있는 경우). 펩타이드는 고상에 고정화되고 네오에피토프에 대해 특이적 결합 친화도를 갖는 항체를 낚시하기 위한 미끼로서 사용된다. 이후, 항체는 분석되고, 분석 결과를 사용하여 합성 재조합 항체가 제조된다. 이렇게 생산된 합성 항체('신바디(synbody)')는 결과적으로 환자 특이적 에피토프에 높은 특이성으로 결합할 것으로 예상된다. 가장 주목할만하게도, 이러한 신바디는 환자 돌연변이의 컴퓨터를 이용한 분석으로부터 얻은 정보만을 사용하여 완전히 인공적으로 생성된다.
예를 들면, 하나 이상의 펩타이드 네오에피토프(예컨대, 9-mer)는 고체 캐리어(예컨대, 자성 또는 색상 코드 비드) 상에 고정화될 수 있고 표면에 제시된 항체 단편 또는 항체에 결합하기 위한 미끼로서 사용될 수 있다. 가장 전형적으로, 이러한 표면 제시된 항체 단편 또는 항체는 M13 파아지(예컨대, 단백질 III, VIII 등)와 결합하며, 항체 단편에 대한 많은 라이브러리는 당업계에 공지되어 있고 본원에 제공된 교시와 관련하여 적합하다. 원하는 경우, 더 작은 라이브러리가 또한 사용될 수 있고 당업계에 널리 알려진 방법을 사용하여 결합 친화도 및/또는 동역학을 개선하기 위해 친화도 성숙이 수행될 수 있다(예컨대, Briefings in functional genomics and proteomics. Vol 1. No 2. 189-203. July 2002 참고). 또한, 항체 라이브러리가 일반적으로 바람직하지만, 다른 스캐폴드 역시 적합하다고 여겨질 수 있고, 이는 베타 배럴, 리보솜 디스플레이, 세포 표면 디스플레이 등을 포함한다는 것에 유의한다(예컨대, Protein Sci. 2006 Jan; 15(1): 14-27). 그러나, 합성 네오에피토프를 사용하여, 단클론 항체를 포함하는 항체를 제조하는 다른 전통적인 방식이 또한 본원에서 명확히 고려된다.
일부 구현예에서, 합성 펩타이드(암 네오에피토프를 포함하거나 이와 상응하는)가 고상에 고정화되는 경우, 네오에피토프에 대한 친화도 제제, 및 특히 항체가 단리되고/되거나 정제될 수 있다. 가장 바람직하게는, 이러한 단리는 미리 제작된 높은 다양성 항체 라이브러리를 포함할 것이다. 본원에 사용된 바와 같이, 그리고 문맥이 달리 언급하지 않는 한, 용어 "항체" 또는 "항체들"은 항체의 모든 아이소타입 및 하위유형(예컨대, IgG, IgM, IgE 등) 뿐만 아니라 1가 IgG, F(ab')2, Fab', Fab, scFv, scFv-Fc, VhH 등을 포함하는 모든 단편을 포함한다. 더욱이, 고려된 항체는 인간화되거나, 인간 또는 비-인간(예컨대, 설치류) 기원이거나, 또는 키메라성일 수 있다. 전형적인 방법에서, 높은 다양성 라이브러리는 전형적으로 M13 파아지 및 pIII, pVIII, pVI, 또는 pIX를 통한 디스플레이에 기초하여, 또는 T7 파아지 및 유전자 10 캡시드 단백질에 기초하여, 적어도 109 다양한 구성원, 또는 적어도 1010 다양한 구성원, 또는 그 이상의 다양성을 갖는 파아지 디스플레이 라이브러리일 수 있다. 쉽게 이해될 바와 같이, 큰 다양성 라이브러리의 사용은 최상의 결합물질에 대해 추가로 선택될 수 있는 몇 가지 결합 후보 항체를 비교적 짧은 시간 내에 제공할 것이다. 실제로, 고정화된 합성 펩타이드에 대한 결합 친화도가 원하는 것보다 적으면, 친화도가 당업계에 널리 알려진 프로토콜을 사용하여 친화도 성숙을 통해 개선될 수 있음이 인식되어야 한다. 예를 들면, 낮은 친화도(KD>10-7 M) 결합물질 또는 더 작은 라이브러리의 구성원은 당업계에 널리 알려진 방법을 사용하여 결합 친화도 및/또는 동역학을 개선하기 위해 친화도 성숙이 수행될 수 있다(예컨대, Briefings In Functional Genomics And Proteomics. Vol 1. No 2. 189-203. July 2002 참고). 또한, 항체 라이브러리가 일반적으로 바람직하지만, 다른 스캐폴드가 또한 적합하다고 여겨질 수 있음에 유의해야 하며, 이는 베타 배럴, 리보솜 디스플레이, 세포 표면 디스플레이 등을 포함한다(예컨대, Protein Sci. 2006 Jan; 15(1): 14-27). 따라서, 바람직한 양태에서 합성 펩타이드가 고친화도 결합(KD<10-7 M, 및 보다 전형적으로 KD<10-8 M) 항체를 확인하기 위해 항체의 라이브러리에서 미끼로서 사용되는 것으로 이해되어야 한다.
항체는 이들 항체를 코딩하는 핵산을 갖는 세포에 직접 결합하기 때문에, 이후에 이러한 핵산은 분석되어 경쇄 및 중쇄에 대한 각각 초가변 루프, CDR1, CDR2, 및 CDR3, 및/또는 SDR(특이성 결정 잔기)를 코딩하는 서열 요소를 확인할 수 있는 것으로 추가로 이해되어야 한다. 가장 전형적으로, 결정은 표준 시퀀싱 방법을 사용하여 수행된다. 일단 결정되면, 초가변 루프, 또는 CDR1-H, CDR2-H, 및/또는 CDR3-H 및/또는 CDR1-L, CDR2-L, 및/또는 CDR3-L, 및/또는 SDR은 인간 또는 인간화된 항체 스캐폴드 또는 항체에 이식되는 것으로 고려된다. 쉽게 이해될 바와 같이, 이식은 인간 또는 인간화된 항체 스캐폴드 또는 항체를 코딩하는 핵산의 유전적 조작에 의해 수행될 수 있다. 예를 들면, 각 CDR 내에는, 항원과의 상호작용에 직접 관여하는 보다 가변적인 위치, 즉, 특이성-결정 잔기(SDR)가 있는 반면, CDR 루프의 형태를 유지하는 보다 보존된 잔기가 있다. SDR은 항원-항체 복합체의 3D 구조 및/또는 CDR의 돌연변이 분석으로부터 확인될 수 있다. SDR-이식된 인간화 항체는 SDR 및 CDR의 형태를 유지하는 잔기를 인간 주형에 이식함으로써 제작된다. 결과적으로, 암 네오에피토프에 대해 특이성을 갖는 인간 또는 인간화된 항체는 이전에 항원과 접촉하지 않은 세포에서 항체가 발현되는 완전 합성 방식으로 제조될 수 있는 것으로 인식되어야 한다. 더욱이, 고려된 방법은 네오에피토프에 대하여 항체를 생산하거나 효과적으로 사용하지 못한 환자의 치료를 위한 환자 및 암 특이적 항체의 생산을 가능하게 한다.
본 발명의 대상에 제한되지 않지만, 이렇게 제조된 합성 항체는 단독으로 또는 치료제 또는 진단제와 함께 직접적으로 IgG(또는 다른 아이소타입)로서, 단편(예컨대, 이중특이적 Fab 또는 다른 이중특이적 단편)으로서, 및/또는 키메라성 단백질(예컨대, 키메라성 T 세포 수용체에서 엑토도메인으로서 scFv)로서, 및/또는 항체가 세포에 막 고정되는 것을 보장하기 위해 막투과 도메인을 갖는 혼성체 단백질로서 사용될 수 있다.
네오에피토프 서열에 상응하거나 이를 포함하는 합성 펩타이드의 구조는 X-L1-(An-L2)m-Q일 수 있음이 고려되며, 상기 식에서 X는 합성 펩타이드를 고상에 공유 또는 비공유 결합시키는데 적합한 선택적인 연결 그룹 또는 모이어티이고, L1은 합성 펩타이드를 고상 또는 연결 그룹에 공유 결합시키는 선택적인 링커이다. An은 네오에피토프 서열을 갖는 합성 펩타이드이고, A는 천연(단백질생성) 아미노산이며, n은 7 내지 30, 및 가장 전형적으로 7 내지 11 또는 15-25의 정수이다. L2는, 특히 다수의 합성 펩타이드 서열(동일하거나 상이한)이 상기 구조물 내에 있는 경우, 존재할 수 있는 선택적인 링커이며, m은 정수, 전형적으로 1 내지 30, 및 가장 전형적으로 2 내지 15이다. 마지막으로, Q는 말단 합성 펩타이드의 말단을 고상(예컨대, 펩타이드를 입체적으로 구속하기 위해) 또는 리포터 그룹(예컨대, 형광 마커) 또는 다른 기능적 모이어티(예컨대, 친화도 마커)에 연결하는데 사용될 수 있는 말단 그룹이다. 결과적으로, 합성 펩타이드가 직접적인 MHC-I 결합에 사용되는 경우, 전체 길이는 8 내지 10개의 아미노산일 것임에 유의해야 한다. 유사하게, 합성 펩타이드가 직접적인 MHC-II 결합에 사용되는 경우, 전체 길이는 14 내지 20개의 아미노산일 것이다. 한편, 합성 펩타이드가 MHC 제시 전에 세포에서 처리되는 경우(전형적으로 프로테아솜 가공을 통해), 전체 길이는 전형적으로 10 내지 40개의 아미노산일 것이고, 합성 펩타이드에서 중심 위치 또는 그 근처에 변화된 아미노산을 갖는다.
예를 들면, X는 고상의 상응하는 결합제(예컨대, 아비딘)에 결합하는 비-공유 친화도 모이어티(예컨대, 바이오틴), 또는 펩타이드의 N- 또는 C-말단 아미노 또는 카르복실 그룹과 반응하는 화학적 그룹(스페이서를 갖거나 갖지 않음), 또는 펩타이드 또는 링커 L1에서 설프하이드릴 그룹과 반응하는 선택적 반응성 그룹(예컨대, 아이오도아세틸 또는 말레이미드 그룹)일 수 있다. L1은 고상으로부터 합성 펩타이드의 거리를 증가시키는데 사용될 수 있고, 따라서 전형적으로 약 2-20개 탄소-탄소 결합과 동등한 길이(예컨대, 0.3 nm 내지 3 nm)를 갖는 가요성 선형 모이어티(예컨대, 글리콜 그룹, 알콕시 그룹, 글리신 등을 포함함)를 포함한다. 물론, 또한 합성 펩타이드는 펩타이드가 생성된 고상을 사용할 수 있고 이와 같이 별도의 연결 그룹 또는 링커를 필요로 하지 않을 수 있는 것으로 이해되어야 한다.
특정 합성 펩타이드 및 연결 방법에 따라, 고상의 특성이 상당히 달라질 수 있고, 펩타이드의 부착을 위한 모든 공지된 고상이 본원에서 사용하는데 적합한 것으로 여겨지는 것으로 이해되어야 한다. 예를 들면, 적합한 고상은 아가로스 비드, 중합체 비드(착색되거나 개별적으로 어드레서블), 마이크로타이터 플레이트 내의 웰의 벽 표면, 종이, 니트로셀룰로오스, 유리 등을 포함한다. 당업자는 고상 및 부착 화학의 적합한 선택을 쉽게 평가할 수 있을 것이다. 추가의 바람직한 양태에서, 고상은 일반적으로 파아지(또는 다른 스캐폴드 캐리어) 상에 제공된 펩타이드가 합성 펩타이드를 통해 고상에 가역적으로 결합하는 것과 같은 파아지 디스플레이 방법와 관련된 프로토콜에 적합할 것임에 또한 유의한다. 추가로 고려된 용도에서, 고상은, 특히 합성 단백질이 포유동물에서 백신으로서 또는 항체 생산을 위한 비-인간 포유동물에서 면역원성 화합물로서 사용되는 경우 백신 접종(예컨대, 알부민, KLH, 파상풍 톡소이드, 디프테리아 독소 등)에서 사용된 캐리어 단백질일 수 있음이 또한 인식되어야 한다. 마찬가지로, 합성 단백질은 또한 임의의 캐리어가 없는 백신 또는 면역원성 화합물로서 사용될 수 있다.
합성 네오에피토프에 결합하는 항체 단편 또는 항체를 확인하는 특정 방식에 관계없이, 디스플레이된 항체 단편 또는 항체는 그의 제시 구조(예컨대, 세포 또는 파아지)를 통해 디스플레이된 항체의 생산을 야기하는 상응하는 유전적 정보, 및 이를 이용하여, 결합 포켓을 형성하는데 필요한 뉴클레오타이드 서열에 대한 정보를 제공할 것임이 이해되어야 한다. 예를 들면, 디스플레이된 구조가 항체 단편 또는 항체인 경우, 핵산 서열은 각각 경쇄 및 중쇄의 상보성 결정 영역 CDR1, CDR2, 및 CDR3 도메인에 대한 서열 정보를 제공할 것이다. 이후, 이 정보는 각각 경쇄 및 중쇄의 CDR1, CDR2, 및 CDR3 도메인에 대한 서열 정보가 이식된 핵산 서열을 시험관내에서 생성하는데 사용될 수 있다. 이후, 적합한 시스템 내로의 형질감염은 동일한 결합 특성을 갖는 합성 항체('신바디')를 발현 및 생산시킬 것이다. 물론, 용어 항체는 전장 항체뿐만 아니라 이의 단편/부분을 포함한다는 것에 유의해야 한다.
이후, 이렇게 생산된 항체 단편 또는 항체는 치료 또는 진단 약물을 생산하기 위해 추가로 변형될 수 있다. 예를 들면, 항체 단편 또는 항체가 (예컨대, PET 또는 SPECT-활성) 동위원소로 표지되는 경우, 변형된 항체 단편 또는 항체가 영상화에 사용될 수 있다. 한편, 항체 단편 또는 항체가 방사성 핵종 또는 화학치료제로 표지되는 경우, 변형된 항체 단편 또는 항체는 표적화된 화학요법에 사용될 수 있다. 추가의 고려된 양태에서, 항체 단편 또는 항체는 또한 면역원성 항원인 것으로 알려진 항원으로 변형될 수 있다. 이러한 변형은 환자가 동일한 항원으로 이전에 면역화된 경우 특히 유리하다. 이러한 시나리오에서, 네오에피토프를 갖는 암세포가 면역원성 항원을 제시하는 변형된 항체로 페인트되는 것으로 고려되며, 이는 원래의 네오에피토프에 대한 면역 반응이 면역원성이 아니거나 억제된 경우 특히 유리하다.
본 출원인은 환자의 벌크 백혈구 세포(WBC)가 본 발명의 대상에 의해 확인된 펩타이드(예컨대, TAA, 네오에피토프 등)와 함께 배양될 수 있음을 추가로 인식하였다. 이러한 접근법은 벌크 WBC에서 항원 제시 세포에 의해 원하는 MHC/네오에피토프 복합체의 생산을 유발할 것으로 예상된다. 따라서, 환자의 대식세포, 수지상 세포, 및 B-세포는 NK 세포 및 T-세포에 명령을 제공하여 이들이 병든 조직을 표적화하는 원하는 특성을 갖도록 한다.
본 발명의 기술의 또 다른 양태은 T-세포(예컨대, CD4+ T-세포, CD8+ T-세포 등)와 관련된 하나 이상의 특징을 검출하는 방법을 포함한다. 보다 구체적으로, 시험은 네오에피토프/MHC 단백질 복합체에 대한 특이적 T-세포 수용체를 갖는 네오에피토프 반응성 T-세포의 확인에 사용될 수 있는 특정 네오에피토프(예컨대, MHC I에 대해 8-mer 내지 12-mer, MHC II에 대해 12-mer 내지 25-mer 등)를 제공할 수 있다. 따라서, 상기 방법은 네오에피토프 반응성 T-세포를 수확하는 것을 포함할 수 있다. 상기 수확된 T-세포는 환자에게 재도입하기 위해 제제에서 생체내에서 성장하거나 확장될 수 있다. 대안적으로, 상기 수확된 T-세포 내의 T-세포 수용체 유전자는 단리되고 바이러스, 또는 다른 입양 세포 요법 시스템(예컨대, CAR-T, CAR-TANK 등) 내로 전달될 수 있다. 네오에피토프 외에도, 본 발명의 대상의 방법은 또한 하나 이상의 종양 관련된 항원(TAA)을 제공할 수 있다. 따라서, 또한 시험으로부터 확인된 TAA에 민감한 수용체를 갖는 T 세포를 수확할 수 있다. 이들은 또한 상기 논의된 바와 같은 유사한 치료 방식으로 생체외에서 성장되거나 배양되고 사용될 수 있다. T-세포는 펩타이드의 합성 형태를 생산하고 이를 상업적으로 생산된 MHC 또는 MHC-유사 단백질과 결합시킨 다음, 이러한 생체외 복합체를 사용하여 표적 T-세포에 결합시킴으로써 확인될 수 있다. 상기 수확된 T-세포는 질환에 대한 환자의 면역 반응에 의해 활성화된 T 세포, 탈진된 T-세포, 또는 논의된 특징에 반응하는 다른 T-세포를 포함할 수 있는 것으로 이해되어야 한다.
또 다른 관점에서 볼 때, 네오에피토프에 대한 항체는 NK 세포, 및 특히 NK-92 세포(고친화도 Fc-세포 수용체를 나타내기 위해 추가로 변형될 수 있음)를 사용하여 표적화 약물로서 사용될 수 있다. 따라서, 본 발명의 대상의 추가의 고려된 양태에서, 항체 단편 또는 항체는 또한 T-세포, 및 특히 NK-세포에 결합하여 네오에피토프를 디스플레이하는 세포에 대한 면역 반응을 자극 및 유도할 수 있다. 결과적으로, 암 네오에피토프에 대한 효과적인 면역 반응이 환자 또는 다른 유기체에서 면역화를 필요로 하지 않는 공정을 사용하여 유발되어, 치료용 항체의 반응 시간 및 이용가능성을 현저히 감소시킬 수 있는 것으로 인식되어야 한다.
탈진된 T-세포는 몇 가지 상이한 경로를 통해 재활성화될 수 있는 것으로 추가로 고려된다. 하나의 경로는 수확된 탈진된 T-세포에 사이토카인(예컨대, IL-2, IL-12, IL-15 등)을 외인성으로 첨가하는 것을 사용하여 세포를 재활성화시키는 것을 포함한다. 이후, 상기 재활성화된 T-세포는 아마도 체크포인트 억제제(예컨대, 이필리무맙 등)와 함께 환자에게 다시 도입될 수 있다. 또 다른 경로는 체크포인트 억제를 차단함으로써 탈진을 예방하는 것이며, 이는 표적 네오에피토프를 갖는 맞춤형 바이러스를 적절한 억제제(예컨대, LAG3 등)와 함께 투여하는 것을 통해 달성될 수 있다.
실시예
본 발명의 대상의 방법의 일 예로서, 자궁경부 암종을 갖는 HPV16을 보유하는 환자를 생체검사하고, 조직 샘플을 상기 기재된 바와 같이 분석하였다. 비-환자 참조 서열은 HPV16 참조 서열을 포함하는 HPV 서열을 포함하였다. 특히, 서열 분석은 또한 4개의 네오에피토프를 야기하는, 바이러스 게놈 내의 몇 가지 돌연변이를 밝혀내었다. 보다 구체적으로, 4개의 변이체가 E6 유전자에서 발견되었고, 하나의 변이체가 E7 유전자에서 발견되었다. 바이러스 참조 서열을 사용한 HPV16 바이러스에 대한 백신의 인실리코 생성은 E6 및 E7에 대해 242개의 가능한 에피토프를 생성하였다. 또한, 환자의 오믹 서열 데이터를 사용하여 HLA-유형을 예측하였고, 결과가 하기 표 1에 나타나 있으며, HLA-유형에 대한 에피토프의 결합뿐만 아니라 환자의 HLA-유형에 대한 네오에피토프의 결합을 계산하였다. 이후, 이 두 번째 계산을 사용하여 HPV16의 변이체가 환자가 결합할 수 있는 에피토프에 유의하게 영향을 미치는지 여부를 결정하였다.
Figure pct00002
도 1의 표는 예측된 HLA-유형과 관련된 결합 에피토프 및 네오에피토프에 대한 예시적인 결과를 나타내며, 예측된 결합된 에피토프 및 네오에피토프가 강조되어 있다. 첫 번째 컬럼(Entry)은 평가된 242개의 가능한 에피토프 및 네오에피토프 중 일부에 대한 식별자를 열거한다. 두 번째 컬럼(펩타이드)은 E6 및 E7에 대한 야생형 에피토프 및 네오에피토프의 아미노산 서열을 열거한다. 3번째 내지 7번째 컬럼(HLA-A02:01; HLA-A68:01; HLA-B44:02; HLA-B44:03; 및 HLA-C05:01)은 환자의 예측된 HLA 유형 중 일부에 대한 상기 열거된 에피토프 및 네오에피토프의 예측된 결합 친화도(nM)을 열거한다. 주목할 만하게도, 이 실시예에서, 높은 예측된 결합 친화도(<500 nM)을 갖는 에피토프 및 네오에피토프가 강조되어 있다. 8번째 컬럼(유전자)은 에피토프 및 네오에피토프가 어떤 참조 유전자 내에서 확인되었는지(여기서 HPV16의 E6 유전자 및 E7 유전자)를 확인한다. 9번째 컬럼(영향을 받은 변이체)은 아미노산 서열에 의해 네오에피토프를 확인하며, 네오에피토프는 2번째 컬럼으로부터의 야생형 에피토프 또는 네오에피토프의 돌연변이이다.
특히, Entry_70은 검출된 HPV16 변이체에 의해 유의하게 변화된 도 1에 도시된 유일한 에피토프이다. 또 다른 관점에서 볼 때, 본 발명의 대상의 방법은 환자의 게놈에서 HPV16 서열의 돌연변이, 여기서 KLPQLCTEL에서 KLPDLCTEL로의 HPV16 참조 아미노산 서열의 돌연변이를 포함하는 환자 및 바이러스 특이적 네오에피토프를 성공적으로 확인하였다.
도 2는 강조표시된 환자 HLA 유형에 대한 높은 결합 친화도를 갖는 예측된 결합된 변이체 에피토프(네오에피토프)를 나타낸다. 특히 HPV16 참조 게놈을 기초로 하거나 건강한 조직 오믹스와 병든 조직 오믹스와의 비교에 기초한 개인화된 HPV 백신은 도 2의 2개의 변이체 에피토프(네오에피토프)를 표적화할 수 없었을 것으로 이해되어야 한다. 또 다른 관점에서 볼 때, 도 2에 열거된 네오에피토프의 확인은 바이러스 참조 게놈과 환자의 게놈에서 특이적으로 통합된(및 잠재적으로 이후에 돌연변이된) 바이러스 서열과의 비교 없이 가능하지 않다. 유리하게도, 환자에서 네오에피토프를 야기하는 미스센스 돌연변이는 도 2에 열거된 바와 같이 환자의 HLA 유형 중 적어도 하나에 결합하는 것으로 예측되었다.
구체적으로, 도 2에 나타낸 바와 같이, 네오에피토프 KLPDLCTEL은 구아닌에서 티민으로의 야생형 E6 핵산 서열의 염기 변화로부터 비롯되어, 야생형 글루타민에서 돌연변이체 아스파트산으로의 아미노산 변화를 일으킨다. 유리하게도, 네오에피토프 KLPDLCTEL은 12 nM의 HLA-A02:01에 대한 매우 높은 예측된 결합 친화도를 갖는다. 또한, 네오에피토프 FQDPQERPI는 구아닌에서 티민으로의 야생형 E6 핵산 서열의 염기 변화로부터 비롯되어, 야생형 아르기닌에서 돌연변이체 이소류신으로의 아미노산 변화를 일으킨다. FQDPQERPI 네오에피토프는 299 nM의 HLA-C05:01에 대한 높은 예측된 결합 친화도를 갖는다.
따라서, 바이러스 DNA가 본 발명의 대상의 방법을 사용하여 비교적 높은 돌연변이율 및/또는 게놈 불안정성을 겪는 경우에 백신 효능이 예측될 수 있는 것으로 인식되어야 한다. 또한 여기에 제공된 데이터로부터 취할 수 있는 바와 같이, 환자의 HLA 유형에 결합할 18개의 총 예측된 에피토프가 확인된 반면, 하나의 에피토프는 비-결합 변이체의 생성으로 인해 더 이상 존재하지 않았고, 2개의 네오에피토프가 이러한 변이체로 인해 생성되었다(그렇지 않은 경우 손실됨).
본 발명의 대상의 또 다른 양태에서, 그리고 상기에 이미 간략하게 언급된 바와 같이, 네오에피토프는 또한 인실리코로 계산된 후 영향을 받은 조직에서 하나 이상의 재조합 핵산으로부터 발현될 수 있으며, 핵산의 전달은 바람직하게는 유전자 및/또는 세포 특이적 방식으로 수행된다. 예를 들면, 병든 조직이 통합된 바이러스 DNA를 함유하는 경우, 비-환자 DNA는 RNA-가이드된 CRISPR/Cas9 또는 CRISPR/Cpf1 뉴클레아제 복합체의 아데노바이러스 벡터 전달을 사용하여 특이적으로 변화되어 숙주에서 면역원성인 것으로 알려지거나 의심되는 에피토프(전형적으로 HLA-매칭된)를 갖는 바이러스 DNA를 제공한다. 이러한 전달을 위한 예시적인 프로토콜은 문헌[Nature, Scientific Reports 4, Article number: 5105 (2014)]에서 발견될 수 있다. 병든 조직이 종양유전자 또는 종양 억제자 유전자의 돌연변이된 형태를 함유하는 경우, DNA는 면역원성 네오에피토프를 세포에 도입하도록 전달될 수 있다.
일부 구현예에서, 본 발명의 특정 구현예를 기술하고 청구하는데 사용된, 성분의 양, 특성, 예컨대 농도, 반응 조건 등을 표현하는 숫자는 일부 경우에 용어 "약"에 의해 변형되는 것으로 이해되어야 한다. 따라서, 일부 구현예에서, 서술된 설명 및 첨부된 청구범위에 제공된 수치 매개변수는 특정 구현예에 의해 수득되고자 하는 원하는 특성에 따라 달라질 수 있는 근사치이다. 일부 구현예에서, 수치 매개변수는 보고된 유효 자릿수의 수에 비추어 그리고 통상의 반올림 기법을 적용하여 해석되어야 한다.
본원의 설명에서 그리고 하기의 청구범위 전반에 사용된 바와 같이, 부정관사 및 정관사의 의미는 문맥이 달리 명시하지 않는 한 복수 참조를 포함한다. 또한, 본원 설명에서 사용된 바와 같이, "에서"의 의미는 문맥이 달리 명시하지 않는 한 "에서" 및 "상에서"를 포함한다. 문맥이 달리 명시하지 않는 한, 본원에 제공된 모든 범위는 이들의 종점을 포함하는 것으로 해석되어야 하며, 개방 범위는 상업적으로 실용적인 값을 포함하는 것으로 해석되어야 한다. 유사하게, 모든 값의 목록은 문맥이 달리 나타내지 않는 한 중간 값을 포함하는 것으로 간주되어야 한다.
본원에 기재된 모든 방법은 본원에서 달리 나타내지 않는 한 또는 문맥에 의해 부인되지 않는 한 임의의 적합한 순서로 수행될 수 있다. 본원의 특정 구현예와 관련하여 제공된 임의의 및 모든 예, 또는 예시적인 언어(예컨대 "와 같은")의 사용은 단지 본 발명을 더 잘 나타내고자 하는 것이며 청구된 발명의 범위를 제한하지 않는다. 명세서 내의 표현은 본 발명의 실시에 필수적인 청구되지 않은 요소를 나타내는 것으로 해석되지 않아야 한다.
본원의 본 발명의 개념으로부터 벗어나지 않으면서 이미 기술된 것 이외의 많은 변형이 가능하다는 것이 당업자에게 명백할 것이다. 따라서, 본 발명의 대상는 첨부된 청구 범위를 제외하고 제한되지 않는다, 더욱이, 명세서 및 청구범위 모두를 해석함에 있어서, 모든 용어는 문맥에 매칭하는 가장 넓은 가능한 방식으로 해석되어야 한다. 특히, 용어 "포함하다" 및 "포함하는"은 요소, 성분, 또는 단계를 비배타적인 방식으로 언급하는 것으로 해석되어야 하며, 이는 언급된 요소, 성분, 또는 단계가 명시적으로 언급되지 않은 다른 요소, 성분, 또는 단계와 함께 존재하거나, 이용되거나, 또는 조합될 수 있음을 나타낸다. 명세서 청구범위가 A, B, C .... 및 N으로 구성된 군으로부터 선택된 어느 것 중 적어도 하나를 지칭하는 경우, 본문은 그룹 중 단지 하나의 요소, A와 N, 또는 B와 N 등이 아닌, 그룹으로부터 하나의 요소만을 필요로 하는 것으로 해석되어야 한다

Claims (33)

  1. 하기를 포함하는, 환자로부터의 오믹스 데이터(omics data)를 분석하는 방법:
    환자의 병든 조직(diseased tissue)의 오믹스 데이터를 분석하고, 상기 오믹스 데이터에서 비-환자 핵산의 존재를 확인하는 단계;
    상기 비-환자 핵산을 병원체의 참조 핵산과 상호관련시키는 단계;
    상기 병원체의 참조 핵산에 대하여 복수의 에피토프를 확인하고, 상기 비-환자 핵산 내의 네오에피토피를 확인하는 단계;
    상기 복수의 에피토프 및 네오에피토프에 대해 각각의 HLA-매칭 스코어를 계산하는 단계;
    상기 복수의 에피토프 및 네오에피토프에 대한 상기 각각의 HLA-매칭 스코어를 사용하여 환자 특이적 면역치료용 조성물을 생성하는 단계.
  2. 제1항에 있어서, 상기 오믹스 데이터가 전체 게놈 시퀀싱을 통해 수득되는 것인 방법.
  3. 제1항 또는 제2항에 있어서, 상기 오믹스 데이터가 동일한 환자의 병들지 않은 조직에 대해 매칭(matching)되는 것인 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 병원체가 바이러스인 것인 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 병원체가 병원체 게놈의 적어도 일부를 상기 환자의 게놈 내로 통합시키는 병원체인 것인 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 참조 핵산에 대한 복수의 에피토프가 상기 병원체의 적어도 하나의 발현된 유전자에 대해 계산되는 것인 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 병든 조직의 오믹스 데이터를 사용하여 상기 환자의 HLA-유형을 인실리코로 결정하는 단계를 추가로 포함하는 것인 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 하기의 단계에 의해 상기 환자의 HLA-유형을 결정하는 단계를 추가로 포함하는 것인 방법:
    공지되고 구별되는 HLA 대립유전자의 복수의 서열을 포함하는 HLA 참조 서열을 제공하는 단계;
    상기 오믹스 데이터를 복수의 각각의 k-mer 세트로 분해하는 단계;
    상기 HLA 참조 서열 및 복수의 각각의 k-mer 세트를 사용하여 복합 드 브뤼에인(composite de Bruijn) 그래프를 생성하는 단계; 및
    상기 공지되고 구별되는 HLA 대립유전자에서 상응하는 분절에 매칭하는 k-mer에 의해 각각의 투표로부터 계산된 복합 매칭 스코어를 사용하여 공지되고 구별되는 HLA 대립유전자 각각의 순위를 매기는 단계; 및
    최고 순위의 HLA 대립유전자를 상기 환자의 HLA-유형으로서 확인하는 단계.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 복수의 에피토프 및 네오에피토프에 대한 각각의 HLA-매칭 스코어는 MHC-I 및 MHC-II 하위유형에 대한 매칭-스코어 사이에서 구별되는 것인 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 환자 특이적 면역치료용 조성물이 MHC-II와 매칭된 에피토프 또는 네오에피토프를 MHC-II 제시 경로로 유도하고, 상기 에피토프 또는 네오에피토프의 MHC-II 제시는 100 nM 이하의 계산된 해리 상수를 갖는 것인 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 환자 특이적 면역치료용 조성물이 100 nM 이하의 계산된 해리 상수를 갖는 HLA-매칭된 에피토프를 사용하여 생성되는 것인 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 환자 특이적 면역치료용 조성물이 100 nM 이하의 계산된 해리 상수를 갖는 배타적으로 HLA-매칭된 에피토프를 사용하여 생성되는 것인 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 환자 특이적 면역치료용 조성물이 100 nM 이하의 계산된 해리 상수를 갖는 HLA-매칭된 네오에피토프를 사용하여 생성되는 것인 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 환자 특이적 면역치료용 조성물이 100 nM 이하의 계산된 해리 상수를 갖는 배타적으로 HLA-매칭된 네오에피토프를 사용하여 생성되는 것인 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 환자 특이적 면역치료용 조성물이 암을 치료하기 위해 환자에게 투여되는 것인 방법.
  16. 하기를 포함하는, 환자로부터의 오믹스 데이터를 사용하는 방법:
    환자의 병든 조직의 오믹스 데이터를 분석하고, 상기 오믹스 데이터에서 비-환자 핵산 또는 질환 특이적 핵산의 존재를 확인하는 단계;
    상기 비-환자 핵산 또는 질환 특이적 핵산을 병원체의 참조 핵산 또는 질환의 참조 핵산과 상호관련시키는 단계;
    상기 비-환자 핵산 또는 질환 특이적 핵산에 대한 복수의 네오에피토프를 인실리코로 생성하는 단계;
    상기 복수의 네오에피토프에 대한 HLA-매칭 스코어를 계산하는 단계; 및
    100 nM 이하의 계산된 해리 상수를 갖는 HLA-매칭된 네오에피토프를 코딩하는 핵산을 사용하여 HLA-매칭된 네오에피토프를 코딩하는 핵산을 환자에게 전달할 수 있는 핵산 구조물(nucleic acid construct)을 생성하는 단계.
  17. 제16항에 있어서, 상기 비-환자 핵산이 바이러스 핵산인 것인 방법.
  18. 제16항 또는 제17항에 있어서, 상기 복수의 네오에피토프가 상기 질환의 병원체 핵산의 발현된 유전자에 대해 생성되는 것인 방법.
  19. 제16항 내지 제18항 중 어느 한 항에 있어서, 상기 핵산 구조물이 아데노바이러스를 포함하는 것인 방법.
  20. 제16항 내지 제19항 중 어느 한 항에 있어서, 상기 핵산 구조물이 CRISPR/Cas9 카세트를 포함하는 것인 방법.
  21. 제20항에 있어서, 상기 핵산 구조물이 상기 비-환자 핵산 또는 질환 특이적 핵산에 배타적으로 특이적인 가이드 RNA를 추가로 포함하는 것인 방법.
  22. 하기를 포함하는, 환자로부터의 오믹스 데이터를 사용하여 암을 치료하는 방법:
    환자의 병든 조직의 오믹스 데이터를 분석하고, 상기 오믹스 데이터에서 비-환자 핵산 또는 질환 특이적 핵산의 존재를 확인하는 단계;
    상기 비-환자 핵산 또는 질환 특이적 핵산을 병원체의 참조 핵산 또는 질환의 참조 핵산과 상호관련시키는 단계;
    상기 비-환자 핵산 또는 질환 특이적 핵산에 대한 복수의 네오에피토프를 인실리코로 생성시키는 단계;
    상기 복수의 네오에피토프에 대한 HLA-매칭 스코어를 계산하는 단계;
    100 nM 이하의 계산된 해리 상수를 갖는 HLA-매칭된 네오에피토프를 코딩하는 핵산을 생성하여 HLA-매칭된 네오에피토프를 코딩하는 핵산을 환자에게 전달할 수 있는 핵산 구조물을 생성하는 단계; 및
    상기 핵산 구조물을 포함하는 면역치료용 조성물을 암을 가진 환자에게 투여하는 단계.
  23. 제22항에 있어서, 상기 오믹스 데이터가 전체 게놈 시퀀싱을 통해 수득되는 것인 방법.
  24. 제22항 또는 제23항에 있어서, 상기 오믹스 데이터가 동일한 환자의 병들지 않은 조직에 대해 매칭되는 것인 방법.
  25. 제22항 내지 제24항 중 어느 한 항에 있어서, 상기 병원체가 바이러스인 것인 방법.
  26. 제22항 내지 제25항 중 어느 한 항에 있어서, 상기 병원체가 상기 병원체 게놈의 적어도 일부를 상기 환자의 게놈 내로 통합시키는 병원체인 것인 방법.
  27. 제22항 내지 제26항 중 어느 한 항에 있어서, 상기 비-환자 핵산 또는 질환 특이적 핵산에 대한 상기 복수의 네오에피토프가 병원체의 적어도 하나의 발현된 유전자에 대해 생성되는 것인 방법.
  28. 제22항 내지 제27항 중 어느 한 항에 있어서, 상기 병든 조직의 오믹스 데이터를 사용하여 상기 환자의 HLA-유형을 인실리코로 결정하는 단계를 추가로 포함하는 것인 방법.
  29. 제22항 내지 제28항 중 어느 한 항에 있어서, 하기의 단계에 의해 상기 환자의 HLA-유형을 결정하는 단계를 추가로 포함하는 것인 방법:
    공지되고 구별되는 HLA 대립유전자의 복수의 서열을 포함하는 HLA 참조 서열을 제공하는 단계;
    상기 오믹스 데이터를 복수의 각각의 k-mer 세트로 분해하는 단계;
    상기 HLA 참조 서열 및 복수의 각각의 k-mer 세트를 사용하여 복합 드 브뤼에인 그래프를 생성하는 단계; 및
    공지되고 구별되는 HLA 대립유전자에서 상응하는 분절과 매칭하는 k-mer에 의해 각각의 투표로부터 계산된 복합 매칭 스코어를 사용하여 공지되고 구별되는 HLA 대립유전자 각각의 순위를 매기는 단계; 및
    최고 순위의 HLA 대립유전자를 상기 환자의 HLA-유형으로서 확인하는 단계.
  30. 제22항 내지 제29항 중 어느 한 항에 있어서, 상기 복수의 네오에피토프에 대한 각각의 HLA-매칭 스코어는 MHC-I 및 MHC-II 하위유형에 대한 매칭-스코어 사이에서 구별되는 것인 방법.
  31. 제22항 내지 제30항 중 어느 한 항에 있어서, 상기 면역치료용 조성물이 MHC-II와 매칭된 네오에피토프를 MHC-II 제시 경로로 유도하고, 상기 네오에피토프의 MHC-II 제시는 100 nM 이하의 계산된 해리 상수를 갖는 것인 방법.
  32. 제22항 내지 제31항 중 어느 한 항에 있어서, 상기 면역치료용 조성물이 100 nM 이하의 계산된 해리 상수를 갖는 HLA-매칭된 네오에피토프를 사용하여 생성되는 것인 방법.
  33. 제22항 내지 제32항 중 어느 한 항에 있어서, 상기 면역치료용 조성물이 100 nM 이하의 계산된 해리 상수를 갖는 배타적으로 HLA-매칭된 네오에피토프를 사용하여 생성되는 것인 방법.
KR1020187013300A 2015-10-12 2016-10-12 바이러스 네오에피토프 및 이의 용도 Active KR102770755B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562240471P 2015-10-12 2015-10-12
US62/240,471 2015-10-12
PCT/US2016/056594 WO2017066290A1 (en) 2015-10-12 2016-10-12 Viral neoepitopes and uses thereof

Publications (2)

Publication Number Publication Date
KR20180087248A true KR20180087248A (ko) 2018-08-01
KR102770755B1 KR102770755B1 (ko) 2025-02-21

Family

ID=57882798

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187013300A Active KR102770755B1 (ko) 2015-10-12 2016-10-12 바이러스 네오에피토프 및 이의 용도

Country Status (10)

Country Link
US (3) US10339274B2 (ko)
EP (1) EP3362929B1 (ko)
JP (1) JP6991967B2 (ko)
KR (1) KR102770755B1 (ko)
CN (1) CN108604257B (ko)
AU (1) AU2016338947B2 (ko)
CA (1) CA3003304A1 (ko)
IL (1) IL258682B (ko)
MX (1) MX387275B (ko)
WO (1) WO2017066290A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210132323A (ko) * 2020-04-27 2021-11-04 한림대학교 산학협력단 Sars-cov-2 바이러스에 대한 에피토프 기반 펩타이드 백신의 개발 방법
US12080382B2 (en) 2015-10-12 2024-09-03 Nantomics, Llc Viral neoepitopes and uses thereof

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102833333B1 (ko) 2016-01-08 2025-07-11 니코데 테라퓨틱스 에이에스에이 치료적 항암 네오에피토프 백신
US10776966B2 (en) * 2017-04-28 2020-09-15 Oracle International Corporation Graph processing system that allows flexible manipulation of edges and their properties during graph mutation
EP3935638A4 (en) * 2019-03-08 2023-01-25 Nantomics, LLC SYSTEM AND PROCEDURES FOR VARIANT CALLING

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014168874A2 (en) * 2013-04-07 2014-10-16 The Broad Institute, Inc. Compositions and methods for personalized neoplasia vaccines

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004080579A2 (en) 2003-03-10 2004-09-23 Expression Pathology, Inc. Liquid tissue preparation from histopatologically processed biological samples, tissues and cells
DK2436696T3 (en) * 2007-01-05 2017-09-04 Univ Zuerich Anti-beta-amyloid antibody and uses thereof
CA2735677A1 (en) * 2008-08-22 2010-02-25 Novartis Ag Use of a cox-2 inhibitor for the treatment of a cox-2 dependent disorder in a patient not carrying hla alleles associated with hepatotoxicity
GB201006360D0 (en) * 2010-04-16 2010-06-02 Immatics Biotechnologies Gmbh Method for differentially quantifying naturally processed HLA-restricted peptides for cancer, autoimmune and infectious diseases immunotherapy development
BR122021014039B1 (pt) * 2010-05-14 2021-12-14 Dana-Farber Cancer Institute, Inc. Método de identificação de neoantígenos específicos de tumor
CN103384887B (zh) 2010-05-25 2017-01-18 加利福尼亚大学董事会 Bambam:高通量测序数据的平行比较分析
US9646134B2 (en) 2010-05-25 2017-05-09 The Regents Of The University Of California Bambam: parallel comparative analysis of high-throughput sequencing data
DK3892295T3 (da) * 2011-05-24 2023-05-15 BioNTech SE Individualiserede vacciner mod cancer
ES2647900T3 (es) * 2011-08-12 2017-12-27 Oncotherapy Science, Inc. Péptidos MPHOSPH1 y vacunas que incluyen los mismos
CA2849624C (en) * 2011-09-23 2021-05-25 Oxford Nanopore Technologies Limited Analysis of a polymer comprising polymer units
HUE035207T2 (en) * 2012-01-13 2018-05-02 Univ Wuerzburg J Maximilians Dual antigen-induced two-part functional complementation
EP2802347B1 (en) * 2012-01-13 2019-01-09 Memorial Sloan Kettering Cancer Center Immunogenic wt-1 peptides and methods of use thereof
JP2015533473A (ja) * 2012-07-12 2015-11-26 ペルシミューン,インコーポレイテッド 個別のがんワクチン及び適応免疫細胞療法
CN103320522B (zh) * 2013-07-16 2016-03-30 深圳华大基因研究院 确定人宫颈癌样本基因组中hpv整合位点的方法和系统
JP2015035212A (ja) * 2013-07-29 2015-02-19 アジレント・テクノロジーズ・インクAgilent Technologies, Inc. ターゲットシークエンシングパネルから変異を見つける方法
AU2014324729B2 (en) * 2013-09-26 2019-08-22 Five3 Genomics, Llc Systems, methods, and compositions for viral-associated tumors
WO2015095811A2 (en) 2013-12-20 2015-06-25 The Board Institute Inc. Combination therapy with neoantigen vaccine
AU2014374020A1 (en) * 2014-01-02 2016-08-18 Memorial Sloan Kettering Cancer Center Determinants of cancer response to immunotherapy
MA43362A (fr) * 2015-05-26 2018-10-10 Advaxis Inc Immunothérapie à base de vecteurs d'administration personnalisés, et leurs utilisations
GB201511191D0 (en) * 2015-06-25 2015-08-12 Immatics Biotechnologies Gmbh T-cell epitopes for the immunotherapy of myeloma
MX387275B (es) 2015-10-12 2025-03-18 Nantomics Llc Neoepítopos virales y sus usos

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014168874A2 (en) * 2013-04-07 2014-10-16 The Broad Institute, Inc. Compositions and methods for personalized neoplasia vaccines

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Antonia L. Pritchard 외, Exome Sequencing to Predict Neoantigens in Melanoma, Cancer Immunology Research, 2015.09.01., Vol.3, No.9, pp.992-998.* *
Kathrin Schumann 외, Generation of knock-in primary human T cells using Cas9 ribonucleoproteins, PNAS, 2015.08.18., Vol.112, No.33, pp.10437-10442.* *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12080382B2 (en) 2015-10-12 2024-09-03 Nantomics, Llc Viral neoepitopes and uses thereof
KR20210132323A (ko) * 2020-04-27 2021-11-04 한림대학교 산학협력단 Sars-cov-2 바이러스에 대한 에피토프 기반 펩타이드 백신의 개발 방법

Also Published As

Publication number Publication date
US20170032103A1 (en) 2017-02-02
WO2017066290A1 (en) 2017-04-20
MX2018004542A (es) 2018-11-22
AU2016338947A1 (en) 2018-05-10
EP3362929B1 (en) 2020-08-12
HK1258093A1 (en) 2019-11-01
AU2016338947B2 (en) 2020-06-04
CA3003304A1 (en) 2017-04-20
US20190287656A1 (en) 2019-09-19
KR102770755B1 (ko) 2025-02-21
JP2018536225A (ja) 2018-12-06
JP6991967B2 (ja) 2022-01-13
MX387275B (es) 2025-03-18
IL258682B (en) 2022-03-01
EP3362929A4 (en) 2019-06-19
CN108604257B (zh) 2022-12-13
EP3362929A1 (en) 2018-08-22
US20240321392A1 (en) 2024-09-26
CN108604257A (zh) 2018-09-28
US10339274B2 (en) 2019-07-02
US12080382B2 (en) 2024-09-03

Similar Documents

Publication Publication Date Title
US20230293651A1 (en) Iterative Discovery Of Neoepitopes And Adaptive Immunotherapy And Methods Therefor
US11623001B2 (en) Compositions and methods for viral cancer neoepitopes
US20240321392A1 (en) Viral Neoepitopes and Uses Thereof
HK1258093B (en) Viral neoepitopes and uses thereof

Legal Events

Date Code Title Description
PA0105 International application

Patent event date: 20180510

Patent event code: PA01051R01D

Comment text: International Patent Application

PG1501 Laying open of application
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20201022

Comment text: Request for Examination of Application

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20230321

Patent event code: PE09021S01D

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20230921

Patent event code: PE09021S01D

E90F Notification of reason for final refusal
PE0902 Notice of grounds for rejection

Comment text: Final Notice of Reason for Refusal

Patent event date: 20240509

Patent event code: PE09021S02D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20241120

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20250217

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20250218

End annual number: 3

Start annual number: 1

PG1601 Publication of registration