ES2959360T3 - Mejora del cribado del cáncer mediante ácidos nucleicos víricos acelulares - Google Patents
Mejora del cribado del cáncer mediante ácidos nucleicos víricos acelulares Download PDFInfo
- Publication number
- ES2959360T3 ES2959360T3 ES18838558T ES18838558T ES2959360T3 ES 2959360 T3 ES2959360 T3 ES 2959360T3 ES 18838558 T ES18838558 T ES 18838558T ES 18838558 T ES18838558 T ES 18838558T ES 2959360 T3 ES2959360 T3 ES 2959360T3
- Authority
- ES
- Spain
- Prior art keywords
- methylation
- dna
- subjects
- sites
- ebv
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/70—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/70—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
- C12Q1/701—Specific hybridization probes
- C12Q1/705—Specific hybridization probes for herpetoviridae, e.g. herpes simplex, varicella zoster
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/70—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
- C12Q1/701—Specific hybridization probes
- C12Q1/706—Specific hybridization probes for hepatitis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/70—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
- C12Q1/701—Specific hybridization probes
- C12Q1/708—Specific hybridization probes for papilloma
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Immunology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Virology (AREA)
- Pathology (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Communicable Diseases (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Se pueden analizar moléculas de ADN libres de células en una mezcla de una muestra biológica para detectar ADN viral. Se puede determinar la metilación de moléculas de ADN viral en uno o más sitios del genoma viral. Los niveles de metilación de la mezcla se pueden medir basándose en una o más cantidades de la pluralidad de moléculas de ADN libres de células metiladas en un conjunto de sitios del genoma viral particular. El nivel o los niveles de metilación de la mezcla se pueden determinar de varias maneras, por ejemplo, como una densidad de moléculas de ADN libres de células que están metiladas en un sitio o a través de múltiples sitios o regiones. Los niveles de metilación de la mezcla se pueden comparar con los niveles de metilación de referencia, por ejemplo, determinados a partir de al menos dos cohortes de otros sujetos. Las cohortes pueden tener diferentes clasificaciones (incluida la primera condición) asociadas con el genoma viral particular. Se puede determinar una primera clasificación de si el sujeto tiene la primera condición basándose en la comparación. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Mejora del cribado del cáncer mediante ácidos nucleicos víricos acelulares
El descubrimiento de que las células tumorales liberan ADN tumoral en el torrente circulatorio ha impulsado el desarrollo de métodos no invasivos capaces de determinar la presencia, la ubicación y/o el tipo de tumor en un sujeto utilizando muestras acelulares (por ejemplo, plasma). Muchos tumores pueden ser tratables si se detectan en una fase temprana de su desarrollo. Sin embargo, los métodos actuales pueden carecer de la sensibilidad y/o la especificidad necesarias para detectar un tumor en una fase temprana, y pueden arrojar un gran número de resultados falsos positivos o falsos negativos. Por ejemplo, ciertos virus están asociados al cáncer, pero puede detectarse el ADN vírico en sujetos que no padecen cáncer, causando de este modo resultados falsos positivos.
La sensibilidad de una prueba puede referirse a la probabilidad de que un sujeto que sea positivo para una afección dé positivo para dicha afección. La especificidad de una prueba puede referirse a la probabilidad de que un sujeto que sea negativo para una afección dé negativo para esa afección. Los problemas de sensibilidad y especificidad pueden ser exagerados en los ensayos para la detección precoz de tumores, por ejemplo, porque las muestras sobre las que se realizan dichos métodos de detección de tumores pueden tener unas cantidades relativamente pequeñas de ADN tumoral, y porque la propia enfermedad puede tener una prevalencia relativamente baja entre los individuos sometidos a pruebas en la fase temprana. Por consiguiente, existe una necesidad clínica de métodos que tengan una mayor sensibilidad y/o especificidad para la detección de tumores. El documento US 2015/361505 A1 (SONG WEI [US] ET AL) describe un método para detectar la presencia o ausencia de carcinoma hepatocelular (CHC) asociado al virus de la hepatitis B (VHB) en un mamífero, que comprende la cuantificación del nivel de metilación de una o más regiones del ADN del VHB en el ADN de uno o más líquidos corporales de dicho mamífero. KANAKRY J. A. ET AL (BLOOD, vol. 122, n.° 21,4232-4232, 15 de noviembre de 2013) describe la metilación diferencial del ADN del VEB en distintos tumores relacionados con el VEB.
De acuerdo con la presente invención, se proporciona un método para analizar una muestra biológica de un sujeto que es un animal, incluyendo la muestra biológica una mezcla de moléculas de ADN acelular de una genoma del sujeto y de uno o más de otros genomas, método que comprende: analizar una pluralidad de moléculas de ADN acelular de la muestra biológica, en donde el análisis de la pluralidad de moléculas de ADN acelular incluye: identificar una ubicación de la molécula de ADN acelular en un genoma vírico particular; y determinar si la molécula de ADN acelular está metilada en uno o más sitios del genoma vírico particular; medir un nivel de metilación de la mezcla tomando como base las cantidades de la pluralidad de moléculas de ADN acelulares metiladas en un conjunto de sitios del genoma vírico particular, en donde el conjunto de sitios está en una pluralidad de regiones; comparar el nivel de metilación de la mezcla con uno o más niveles de metilación de referencia determinados a partir de al menos dos cohortes de otros sujetos, en donde las al menos dos cohortes tienen diferentes clasificaciones asociadas al genoma vírico particular, incluyendo las diferentes clasificaciones una primera afección; y determinar una primera clasificación de si el sujeto padece la primera afección tomando como base la comparación.
Las realizaciones proporcionan sistemas, aparatos y métodos para analizar una muestra biológica de un sujeto, por ejemplo, en el reino animal, tal como un ser humano. Las moléculas de ADN acelulares de una mezcla de la muestra biológica pueden analizarse para detectar ADN vírico, por ejemplo, determinando una ubicación en un genoma vírico particular. Se puede determinar un estado de metilación del ADN vírico en uno o más sitios del genoma vírico. El nivel o niveles de metilación de la mezcla pueden medirse tomando como base una o más cantidades de la pluralidad de moléculas de ADN acelulares metiladas en un conjunto de sitio o sitios del genoma vírico particular. El nivel o niveles de metilación de la mezcla pueden determinarse de varias maneras, por ejemplo, como porcentaje/densidad de moléculas de ADN acelulares que están metiladas en un sitio particular o en múltiples sitios, y potencialmente en múltiples regiones, incluyendo cada una uno o más sitios.
El nivel o niveles de metilación de la mezcla pueden compararse con el nivel o niveles de metilación de referencia, por ejemplo, determinados a partir de al menos dos cohortes de otros sujetos. Las cohortes pueden tener diferentes clasificaciones (incluyendo la primera afección) asociadas al genoma vírico particular. Otra cohorte o cohortes pueden corresponder a otras afecciones. La comparación puede realizarse de varias formas, por ejemplo, formando un punto multidimensional de N niveles de metilación y determinando las diferencias con N niveles de metilación de referencia. Una primera clasificación de si el sujeto padece la primera afección puede determinarse tomando como base la comparación.
Estas y otras realizaciones de la divulgación se describen en detalle a continuación. Por ejemplo, otras realizaciones se refieren a sistemas, dispositivos y medios informáticos asociados a los métodos descritos en el presente documento.
Se puede obtener una mejor comprensión de la naturaleza y las ventajas de las realizaciones de la presente divulgación con referencia a la siguiente descripción detallada y los dibujos adjuntos, en los que:
La FIG. 1 muestra el diseño de sondas de captura para la secuenciación con bisulfito dirigida de acuerdo con las realizaciones de la presente divulgación.
La FIG. 2 muestra las densidades de mutilación de sitios CpG en todo el genoma del virus de Epstein-Barr (VEB) en pacientes con mononucleosis infecciosa, carcinoma nasofaríngeo (CNF) y linfoma de linfocitos T citolíticos naturales de acuerdo con las realizaciones de la presente divulgación.
La FIG. 3 muestra los perfiles de metilación del ADN del VEB plasmático en un paciente (AL038) de una cohorte de cribado con CNF en estadio temprano (estadio I) de acuerdo con las realizaciones de la presente divulgación.
La FIG. 4 muestra las diferencias en las densidades de metilación de los sitios CpG en todo el genoma del VEB entre dos pacientes con diferentes afecciones de acuerdo con las realizaciones de la presente divulgación.
La FIG. 5 muestra las diferencias en las densidades de metilación de los sitios CpG en todo el genoma del VEB entre dos pacientes con CNF (TBR1392 y TBR1416) de acuerdo con las realizaciones de la presente divulgación.
La FIG. 6 muestra las diferencias en los patrones de metilación del ADN del VEB plasmático entre un paciente con CNF en estadio temprano (AO050) y un sujeto con resultado falso positivo de ADN del VEB plasmático (HB002) de acuerdo con las realizaciones de la presente divulgación.
Las FIGS. 7A-7C son gráficos de puntos que muestran la densidad de metilación de un sitio CpG en todo el genoma del VEB en un paciente (en el eje x) y la densidad de metilación correspondiente del mismo sitio CpG en el otro paciente (en el eje y) de acuerdo con las realizaciones de la presente divulgación.
La FIG. 8 muestra los porcentajes de metilación del ADN del VEB plasmático tomando como base los sitios CpG del genoma del VEB en sujetos con mononucleosis infecciosa (MI) (n = 2), linfoma asociado al VEB (n = 3), ADN del VEB plasmático transitoriamente positivo (n = 3), ADN del VEB plasmático persistentemente positivo (n = 3) y CNF (n = 6) de acuerdo con las realizaciones de la presente divulgación.
La FIG. 9 ilustra la prospección de regiones metiladas diferencialmente (DMR) que cumplen los primeros criterios de selección de acuerdo con las realizaciones de la presente divulgación.
La FIG. 10 es una tabla que indica las coordenadas genómicas de las regiones metiladas diferencialmente que cumplen los criterios descritos en la FIG. 9.
La FIG. 11 muestra los porcentajes de metilación del ADN del VEB plasmático tomando como base los 821 sitios de CpG dentro de las 39 DMR descritas en la FIG. 10 en los sujetos con mononucleosis infecciosa (MI) (n = 2), Linfoma asociado al VEB (n = 3), ADN del VEB plasmático transitoriamente positivo (n = 3), ADN del VEB plasmático persistentemente positivo (n = 3) y CNF (n = 6) de acuerdo con las realizaciones de la presente divulgación.
La FIG. 12 ilustra la prospección de regiones metiladas diferencialmente (DMR) que cumplen el segundo criterio de selección de acuerdo con las realizaciones de la presente divulgación.
La FIG. 13 muestra los porcentajes de metilación del ADN del VEB plasmático tomando como base las 46 DMR definidas en la FIG. 12 en los sujetos sin CNF con ADN del VEB plasmático transitoriamente positivo, sujetos sin CNF con ADN del VEB plasmático persistentemente positivo, y pacientes con CNF de acuerdo con las realizaciones de la presente divulgación.
La FIG. 14 ilustra la prospección de regiones consenso de metilación representativas que cumplen los terceros criterios de selección de acuerdo con las realizaciones de la presente divulgación
La FIG. 15 muestra los porcentajes de metilación del ADN del VEB plasmático tomando como base los sitios CpG "representativos" descritos en la FIG. 12 en el mismo grupo de sujetos con mononucleosis infecciosa (MI) (n = 2), Linfoma asociado al VEB (n = 3), ADN del VEB plasmático transitoriamente positivo (n = 3), ADN del VEB plasmático persistentemente positivo (n = 3) y CNF (n = 6) de acuerdo con las realizaciones de la presente divulgación.
La FIG. 16 muestra ejemplos de sitios CpG con los porcentajes de metilación sobre los sitios superiores al 80 % en los datos de secuenciación agrupados de los 3 casos con ADN del VEB plasmático persistentemente positivo y una media inferior al 20 % en los 3 sujetos con CNF de acuerdo con las realizaciones de la presente divulgación.
La FIG. 17 muestra ejemplos de sitios CpG con los porcentajes de metilación sobre los sitios inferiores al 20 % en los datos de secuenciación agrupados de los 3 casos con ADN del VEB plasmático persistentemente positivo y superiores al 80 % en los 3 sujetos con CNF de acuerdo con las realizaciones de la presente divulgación.
La FIG. 18 muestra un dendrograma de conglomerados con el análisis jerárquico de conglomerados basado en el análisis del patrón de metilación del ADN del VEB plasmático para 6 pacientes con CNF (incluyendo 4 pacientes con enfermedad en estadio temprano de nuestra cohorte de cribado), 2 pacientes con linfoma extraganglionar de linfocitos T citolíticos naturales y 2 pacientes con mononucleosis infecciosa de acuerdo con las realizaciones de la presente divulgación.
La FIG. 19 muestra un dendrograma de conglomerados con el análisis de conglomerados jerárquico basado en el análisis del patrón de metilación del ADN del VEB plasmático para 6 pacientes con CNF (incluyendo 4 pacientes con CNF en estadio temprano de nuestra cohorte de cribado) y 3 sujetos sin CNF con ADN del VEB plasmático persistentemente positivo de acuerdo con las realizaciones de la presente divulgación.
La FIG. 20 muestra una matriz cromática 2000 que ilustra los niveles de metilación de todas las regiones no superpuestas de 500 pb del genoma completo del VEB para pacientes con carcinoma nasofaríngeo, linfoma de linfocitos T citolíticos naturales y mononucleosis infecciosa.
La FIG. 21 muestra los perfiles de distribución de tamaños de fragmentos de ADN plasmático secuenciados cartografiados con el genoma del VEB y el genoma humano en 2 pacientes con CNF (TBR1392 y TBR1416) y 2 pacientes con mononucleosis infecciosa (TBR1610 y TBR1661), y 3 sujetos sin CNF con ADN del VEB plasmático persistentemente positivo en análisis seriados (AF091, HB002 y HF020) de acuerdo con las realizaciones de la presente divulgación.
La FIG. 22 muestra la relación de tamaño en 6 pacientes con CNF y 3 sujetos persistentemente positivos para el ADN del VEB plasmático de acuerdo con las realizaciones de la presente divulgación.
La FIG. 23 muestra las relaciones de tamaño del ADN del VEB en los sujetos sin CNF con ADN del VEB plasmático transitoriamente positivo, sujetos sin CNF con ADN del VEB plasmático persistentemente positivo, y pacientes con CNF de acuerdo con las realizaciones de la presente divulgación.
La FIG. 24 muestra la proporción de lecturas de ADN del VEB plasmático (lecturas de ADN plasmático cartografiadas en el genoma del VEB) entre todas las lecturas de ADN plasmático secuenciadas en los sujetos sin CNF con ADN del VEB plasmático transitoriamente positivo, sujetos sin CNF con ADN del VEB plasmático persistentemente positivo, y pacientes con CNF de acuerdo con las realizaciones de la presente divulgación.
La FIG. 25 es un gráfico de las proporciones de las lecturas de ADN del VEB plasmático y los correspondientes valores de la relación de tamaño para los pacientes con CNF, los sujetos sin c Nf transitoriamente positivos y con ADN del VEB plasmático persistentemente positivo de acuerdo con las realizaciones de la presente divulgación.
La FIG. 26 es un gráfico de las proporciones de las lecturas de ADN del VEB plasmático y los correspondientes valores del porcentaje de metilación para los pacientes con CNF, los sujetos sin CNF transitoriamente positivos y con ADN del VEB plasmático persistentemente positivo de acuerdo con las realizaciones de la presente divulgación.
Las FIGS. 27A y 27B muestran un gráfico tridimensional de las proporciones de las lecturas de ADN del VEB plasmático y los correspondientes valores de la relación de tamaño y el porcentaje de metilación para los pacientes con CNF, los sujetos sin CNF transitoriamente positivos y con ADN del VEB plasmático persistentemente positivo de acuerdo con las realizaciones de la presente divulgación.
Las FIGS. 28A y 28B muestran un análisis de la curva de eficacia diagnóstica (ROC) para varias combinaciones de análisis basados en recuento, en tamaño y en metilación de acuerdo con las realizaciones de la presente divulgación.
La FIG. 29 muestra el estadio clínico de los 5 casos de carcinoma epidermoide de cabeza y cuello positivos para el VPH (CECC positivo para el VPH).
La FIG. 30 muestra los perfiles de metilación del ADN del VPH plasmático en pacientes individuales con carcinoma epidermoide de cabeza y cuello positivo para el VPH (CECC positivo para el VPH) de acuerdo con las realizaciones de la presente divulgación.
La FIG. 31 muestra el nivel de metilación de todos los sitios CpG en todo el genoma del VPH en dos pacientes con CECC positivo para el VPH de acuerdo con las realizaciones de la presente divulgación.
Las FIGS. 32A y 32B muestran las proporciones de lecturas de ADN del virus de la hepatitis B (VHB) (lecturas de ADN plasmático cartografiadas en el genoma del VHB) y los porcentajes de metilación de todos los sitios CpG en todo el genoma del VHB para 9 pacientes con infección crónica por el virus de la hepatitis B (VHB) y 10 pacientes con carcinoma hepatocelular (CHC) de acuerdo con las realizaciones de la presente divulgación.
La FIG. 33 es un diagrama de flujo que ilustra un método de análisis de una muestra biológica de un sujeto que es un animal para determinar una clasificación de una primera afección de acuerdo con las realizaciones de la presente divulgación.
La FIG. 34 ilustra un sistema de acuerdo con una realización de la presente invención.
La FIG. 35 muestra un diagrama de bloques de un sistema informático ilustrativo que puede utilizarse con el sistema y los métodos de acuerdo con las realizaciones de la presente invención.
El apéndice A muestra la lista de sitios CpG individuales en todo el genoma del VEB con niveles de metilación diferenciales, cuando las diferencias en los porcentajes de metilación en todos estos sitios CpG entre los datos de secuenciación agrupados de 3 sujetos con ADN del VEB persistentemente positivo y los de 3 pacientes con CNF son superiores al 20 %. Los sitios marcados con * tienen una diferencia en los porcentajes de metilación superior al 40 %, ** tienen una diferencia superior al 60 %, y *** tienen una diferencia superior al 80 %.
Se entiende que las expresiones "muestra", "muestra biológica" o "muestra de paciente" incluyen cualquier tejido o material derivado de un sujeto vivo o muerto. Una muestra biológica puede ser una muestra acelular, que puede incluir una mezcla de moléculas de ácidos nucleicos del sujeto y potencialmente moléculas de ácidos nucleicos de un patógeno, por ejemplo, un virus. Una muestra biológica comprende generalmente un ácido nucleico (por ejemplo, ADN o ARN) o un fragmento del mismo. La expresión "ácido nucleico" puede referirse generalmente al ácido desoxirribonucleico (ADN), al ácido ribonucleico (ARN) o a cualquier híbrido o fragmento de los mismos. El ácido nucleico de la muestra puede ser un ácido nucleico acelular. Una muestra puede ser una muestra líquida o una muestra sólida (por ejemplo, una muestra celular o tisular). La muestra biológica puede ser un líquido corporal, tal como sangre, plasma, suero, orina, líquido vaginal, líquido de un hidrocele (por ejemplo, de los testículos), líquidos de un lavado vaginal, líquido pleural, líquido ascítico, líquido cefalorraquídeo, saliva, sudor, lágrimas, esputo, líquido de lavado broncoalveolar, líquido galactorreico, líquido de aspiración de diferentes partes del cuerpo (por ejemplo, tiroides, mama), etc. También pueden utilizarse muestras de heces. En varias realizaciones, la mayoría del ADN de una muestra biológica que se ha enriquecido con ADN acelular (por ejemplo, una muestra de plasma obtenida a través de un protocolo de centrifugación) puede ser acelular (por ejemplo, más del 50 %, 60 %, 70 %, 80 %, 90 %, 95 % o 99 % del ADN puede ser acelular). El protocolo de centrifugación puede incluir, por ejemplo, 3000 g x 10 minutos, obtener la parte líquida y volver a centrifugar a, por ejemplo, 30000 g durante otros 10 minutos para eliminar las células residuales.
El término "fragmento" (por ejemplo, un fragmento de ADN), como se utiliza en el presente documento, puede referirse a una porción de una secuencia polinucleotídica o polipeptídica que comprende al menos 3 nucleótidos consecutivos. Un fragmento de ácido nucleico puede conservar la actividad biológica y/o algunas características del polipéptido precursor. Un fragmento de ácido nucleico pueden ser bicatenario o monocatenario, metilado o no metilado, intacto o mellado, complejado o no complejado con otras macromoléculas, por ejemplo, partículas lipídicas, proteínas. En un ejemplo, las células del cáncer nasofaríngeo pueden liberar fragmentos de ADN del virus de Epstein-Barr (VEB) en el torrente circulatorio de un sujeto, por ejemplo, un paciente. Estos fragmentos pueden comprender uno o más fragmentos de secuencia BamHI-W, que puede utilizarse para detectar el nivel de ADN tumoral en el plasma. El fragmento de secuencia BamHI-W corresponde a una secuencia que puede ser reconocida y/o digerida utilizando la enzima de restricción Bam-HI. La secuencia BamHI-W puede referirse a la secuencia 5'-GGATCC-3'.
Un ácido nucleico tumoral puede referirse a cualquier ácido nucleico liberado desde una célula tumoral, incluyendo ácidos nucleicos patógenos de patógenos en una célula tumoral. Por ejemplo, puede liberarse el ADN del virus de Epstein-Barr (VEB) desde una célula cancerosa de un sujeto con carcinoma nasofaríngeo (CNF).
El término "ensayo" se refiere generalmente a una técnica para determinar una propiedad de un ácido nucleico. Un ensayo (por ejemplo, un primer ensayo o un segundo ensayo) se refiere generalmente a una técnica para determinar la cantidad de ácidos nucleicos en una muestra, la identidad genómica de los ácidos nucleicos de una muestra, la variación en el número de copias de los ácidos nucleicos de una muestra, el estado de metilación de los ácidos nucleicos de una muestra, la distribución del tamaño de los fragmentos de los ácidos nucleicos de una muestra, el estado mutacional de los ácidos nucleicos de una muestra o el patrón de fragmentación de los ácidos nucleicos de una muestra. Para detectar cualquiera de las propiedades de los ácidos nucleicos mencionadas en el presente documento puede utilizarse cualquier ensayo conocido por un experto habitual en la materia. Las propiedades de los ácidos nucleicos incluyen una secuencia, una cantidad, una identidad genómica, un número de copias, un estado de metilación en una o más posiciones nucleotídicas, un tamaño del ácido nucleico, una mutación en el ácido nucleico en una o más posiciones nucleotídicas y el patrón de fragmentación de un ácido nucleico (por ejemplo, la posición o posiciones nucleotídicas en las que se fragmenta un ácido nucleico). El término "ensayo" se puede usar indistintamente con el término "método". Un ensayo o método puede tener una sensibilidad y/o una especificidad particulares, y su utilidad relativa como herramienta de diagnóstico puede medirse utilizando la estadística de ROC-AU<c>.
La expresión "secuenciación aleatoria", como se utiliza en el presente documento, se refiere en general a la secuenciación en la que los fragmentos de ácidos nucleicos secuenciados no se han identificado o predeterminado específicamente antes del procedimiento de secuenciación. No se requieren cebadores específicos de secuencia para dirigirse a locus de genes específicos. En algunas realizaciones, los adaptadores se añaden al final de un fragmento y los cebadores para la secuenciación se fijan a los adaptadores. Por lo tanto, se puede secuenciar cualquier fragmento con el mismo cebador que se fija al mismo adaptador universal, y por lo tanto, la secuenciación puede ser aleatoria. La secuenciación masiva en paralelo se puede realizar usando una secuenciación aleatoria.
Una"lectura de secuencia"se refiere en general a una cadena de nucleótidos secuenciada de cualquier parte o de la totalidad de una molécula completa de ácido nucleico. Por ejemplo, una lectura de secuencia puede ser una cadena corta de nucleótidos (por ejemplo, 20-150 bases) secuenciados a partir de un fragmento de ácido nucleico, una cadena corta de nucleótidos en uno o ambos extremos de un fragmento de ácido nucleico o la secuenciación de todo el fragmento de ácido nucleico que existe en la muestra biológica. Una lectura de secuencia puede obtenerse de diversos modos, por ejemplo, mediante técnicas de secuenciación o utilizando sondas, por ejemplo, en matrices de hibridación o sondas de captura, o técnicas de amplificación, tales como la reacción en cadena de la polimerasa (PCR) o la amplificación lineal con un único cebador o la amplificación isotérmica, tomando como base mediciones biofísicas, tales como la espectrometría de masas.
Un"metiloma"proporciona una medida de la cantidad de metilación del ADN en una pluralidad de sitios o locus en un genoma (por ejemplo, un genoma humano o de otro animal o un genoma vírico). El metiloma puede corresponder a todo el genoma, a una parte sustancial del genoma o a una porción o porciones relativamente pequeñas del genoma. Algunos ejemplos de metilomas de interés son los metilomas de células tumorales (por ejemplo, carcinoma nasofaríngeo, carcinoma hepatocelular, carcinoma cervicouterino), metilomas víricos (por ejemplo, del VEB residente en las células sanas o tumorales de un sujeto); metilomas bacterianos, y órganos (por ejemplo, metilomas de células cerebrales, huesos, los pulmones, el corazón, los músculos y los riñones, etc.) que pueden aportar ADN a un líquido corporal (por ejemplo, plasma, suero, sudor, saliva, orina, secreciones genitales, semen, líquido de las heces, líquido diarreico, líquido cefalorraquídeo, secreciones del tubo digestivo, líquido ascítico, líquido pleural, líquido intraocular, líquido de un hidrocele (por ejemplo, de los testículos), líquido de un quiste, secreciones pancreáticas, secreciones intestinales, esputo, lágrimas, líquidos de aspiración de mama y tiroides, etc.). Los órganos pueden ser órganos trasplantados. El metiloma de un feto es otro ejemplo.
Un"metiloma de plasma"es un metiloma determinado a partir del plasma o el suero de un animal (por ejemplo, un ser humano). El metiloma de plasma es un ejemplo de un metiloma acelular ya que el plasma y el suero incluyen ADN acelular. El metiloma de plasma también es un ejemplo de metiloma mixto, ya que es una mezcla de metiloma fetal/materno, metiloma del tumor/del paciente, ADN derivado de diferentes tejidos u órganos, metiloma del donante/del receptor en el contexto o el trasplante de órganos y/o una mezcla de ADN de diferentes genomas (por ejemplo, genoma animal y genomas bacterianos/víricos).
Un"sitio"(también denominado"sitio genómico")corresponde a un único sitio, que puede ser una única posición de base o un grupo de posiciones de bases correlacionadas, por ejemplo, un sitio CpG o un grupo más grande de posiciones de bases correlacionadas. Un "locus" puede corresponder a una región que incluye múltiples sitios. Un locus puede incluir únicamente un sitio, lo que haría que el locus fuera equivalente a un sitio en ese contexto.
El"índice de metilación"para cada sitio genómico (por ejemplo, un sitio CpG) puede referirse a la proporción de fragmentos de ADN (por ejemplo, determinados a partir de lecturas de secuencia o sondas) que muestran metilación en el sitio sobre el número total de lecturas que cubren ese sitio. Una "lectura" puede corresponder a información (por ejemplo, estado de metilación en un sitio) obtenida de un fragmento de ADN. Se puede obtener una lectura utilizando reactivos (por ejemplo, cebadores o sondas) que hibriden preferentemente con fragmentos de ADN de un estado de metilación particular. Normalmente, dichos reactivos se aplican después del tratamiento con un proceso que modifica o reconoce diferencialmente las moléculas de ADN dependiendo de su estado de metilación, por ejemplo, conversión con bisulfito o enzima de restricción sensible a la metilación, o proteínas de unión a la metilación, o anticuerpos antimetilcitosina. En otra realización, pueden utilizarse técnicas de secuenciación de una sola molécula que reconocen metilcitosinas e hidroximetilcitosinas para dilucidar el estado de metilación y para determinar un índice de metilación.
La"densidad de metilación"de una región puede referirse al número de lecturas en sitios dentro de la región que muestran metilación dividido por el número total de lecturas que cubren los sitios en la región. Los sitios pueden tener características específicas, por ejemplo, que son sitios CpG. Por lo tanto, la "densidad de metilación de CpG" de una región puede referirse al número de lecturas que muestran la metilación de CpG dividido por el número total de lecturas que cubren los sitios CpG en la región (por ejemplo, un sitio CpG particular, sitios CpG dentro de una isla de CpG o una región más grande). Por ejemplo, la densidad de metilación para cada grupo de 100 kb en el genoma humano se puede determinar a partir del número total de citosinas no convertidas después del tratamiento con bisulfito (que corresponde a la citosina metilada) en los sitios CpG como una proporción de todos los sitios CpG cubiertos por las lecturas de secuencia asignadas a la región de 100 kb. Este análisis también se puede realizar para otros tamaños de grupos, por ejemplo, 500 pb, 5 kb, 10 kb, 50 kb o 1 Mb, etc. Una región podría ser el genoma completo o un cromosoma o parte de un cromosoma (por ejemplo, un brazo cromosómico). El índice de metilación de un sitio CpG es el mismo que la densidad de metilación de una región cuando la región solo incluye ese sitio CpG. La "proporción de citosinas metiladas" puede referirse al número de sitios de citosina, "C", que se muestra que están metilados (por ejemplo, no convertidos después de la conversión con bisulfito) sobre el número total de restos de citosina analizados, es decir, incluyendo citosinas fuera del contexto de CpG, en la región. El índice de metilación, la densidad de metilación y la proporción de citosinas metiladas son ejemplos de"niveles de metilación",que puede incluir otras relaciones que impliquen recuentos de lecturas metiladas en los sitios. Aparte de la conversión con bisulfito, se pueden utilizar otros procesos conocidos por los expertos en la materia para explorar el estado de mutilación de las moléculas de ADN, incluyendo, pero sin limitación, enzimas sensibles al estado de metilación (por ejemplo, enzimas de restricción sensibles a la metilación), proteínas de unión a metilación, secuenciación de una sola molécula utilizando una plataforma sensible al estado de metilación (por ejemplo, secuenciación de nanoporos (Schreiberet al.Proc Natl Acad Sci 2013; 110: 18910-18915) y por el análisis en tiempo real de una sola molécula de Pacific Biosciences (Flusberget al.Nat Methods 2010; 7: 461-465)).
Un "perfil de metilación"(también denominado estado de metilación) incluye información relacionada con la metilación del ADN para una región. La información relacionada con la metilación del ADN puede incluir, pero sin limitación, un índice de metilación de un sitio CpG, una densidad de metilación de los sitios CpG en una región, una distribución de sitios CpG en una región contigua, un patrón o nivel de metilación para cada sitio CpG individual dentro de una región que contiene más de un sitio CpG y metilación distinta de CpG. Un perfil de metilación de una parte sustancial (por ejemplo, que abarque más del 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 % o 90 %) del genoma puede considerarse equivalente al metiloma. La"metilación del ADN"en los genomas de mamíferos normalmente se refiere a la adición de un grupo metilo al carbono 5' de los restos de citosina (es decir, 5-metilcitosinas) entre los dinucleótidos CpG. La metilación del ADN puede producirse en citosinas en otros contextos, por ejemplo, CHG y CHH, donde H es adenina, citosina o timina. La metilación de citosina también puede ser en forma de 5-hidroximetilcitosina. También se ha informado de metilación no citosínica, tal como N6-metiladenina.
La"secuenciación con determinación de metilación"se refiere a cualquier método de secuenciación que permita determinar el estado de metilación de una molécula de ADN durante un proceso de secuenciación, incluyendo, pero sin limitación, secuenciación con bisulfito o secuenciación precedida por digestión con enzimas de restricción sensibles a la metilación, inmunoprecipitación usando anticuerpo antimetilcitosina o proteína de unión a metilación, o secuenciación de una sola molécula que permite dilucidar el estado de metilación. Un"ensayo con determinación de metilación"o"ensayo sensible a la metilación"puede incluir tanto métodos basados en secuenciación como métodos no basados en secuenciación, tales como MSP, exploración basada en sondas, hibridación, digestión con enzimas de restricción seguida de mediciones de densidad, inmunoensayos antimetilcitosina, exploración por espectrometría de masas de la proporción de citosinas metiladas o hidroximetilcitosinas, inmunoprecipitación no seguida de secuenciación, etc.
Un "tejido" corresponde a un grupo de células que se agrupan como una unidad funcional. En un mismo tejido pueden encontrarse más de un tipo de células. Los distintos tipos de tejidos pueden estar formados por diferentes tipos de células (por ejemplo, hepatocitos, células alveolares o células sanguíneas), pero también pueden corresponder a tejidos de organismos diferentes (hospedador frente a virus) o a células sanas frente a células tumorales. El término "tejido" puede referirse en general a cualquier grupo de células que se encuentren en el cuerpo humano (por ejemplo, tejido cardíaco, tejido pulmonar, tejido renal, tejido nasofaríngeo, tejido orofaríngeo). En algunos aspectos, las expresiones "tejido" o "tipo de tejido" pueden utilizarse para referirse a un tejido del que procede un ácido nucleico acelular. En un ejemplo, los fragmentos de ácidos nucleicos víricos pueden derivar del tejido sanguíneo, por ejemplo, particularmente el virus de Epstein-Barr (VEB). En otro ejemplo, los fragmentos de ácidos nucleicos víricos pueden proceder de tejido tumoral, por ejemplo, VEB o infección por el virus del papiloma humano (VPH).
Un"valor de separación"(o abundancia relativa) corresponde a una diferencia o una relación entre dos valores, por ejemplo, dos cantidades de moléculas de ADN, dos contribuciones fraccionarias o dos niveles de metilación, tales como un nivel de metilación de una muestra (mezcla) y un nivel de metilación de referencia. El valor de separación puede ser una simple diferencia o relación. Como ejemplos, una relación directa de x/y es un valor de separación, así como x/(x+y). El valor de separación puede incluir otros factores, por ejemplo, factores multiplicativos. Como otros ejemplos, se puede utilizar una diferencia o relación de funciones de los valores, por ejemplo, una diferencia o relación de los logaritmos neperianos (In) de los dos valores. Un valor de separación puede incluir una diferencia y/o una relación. Un nivel de metilación es un ejemplo de una abundancia relativa, por ejemplo, entre moléculas de ADN metiladas (por ejemplo, en sitios particulares) y otras moléculas de ADN (por ejemplo, todas las demás moléculas de ADN en sitios particulares o únicamente moléculas de ADN no metiladas). La cantidad de otras moléculas de ADN puede actuar como factor de normalización. Como otro ejemplo, se puede determinar la intensidad de las moléculas de ADN metiladas (por ejemplo, la intensidad fluorescente o eléctrica) en relación con la intensidad de todas las moléculas de ADN o de las no metiladas. La abundancia relativa también puede incluir una intensidad por volumen.
El término"clasificación",como se utiliza en el presente documento, se refiere a cualquier número u otros caracteres distintos que se asocian a una propiedad particular de una muestra. Por ejemplo, un símbolo "+" (o la palabra "positivo") podría significar que una muestra se clasifica con un nivel particular de una afección (por ejemplo, cáncer). La clasificación puede ser binaria (por ejemplo, positivo o negativo) o tener más niveles de clasificación (por ejemplo, una escala de 1 a 10 o de 0 a 1).
Las expresiones"valorde corte", "umbral",o valor de referencia pueden referirse a un número predeterminado utilizado en una operación. Un valor umbral o de referencia puede ser un valor por encima o por debajo del cual se aplica una determinada clasificación, por ejemplo, la clasificación de una afección, tal como si un sujeto padece una afección, o la gravedad de la afección. Se puede predeterminar un valor de corte con o sin referencia a las características de la muestra o del sujeto. Por ejemplo, los valores de corte se pueden elegir en función de la edad o el sexo del sujeto analizado. Se puede elegir un valor de corte después y en función del resultado de los datos de prueba. Por ejemplo, se pueden usar determinados valores de corte cuando la secuenciación de una muestra alcanza una determinada profundidad. Como otro ejemplo, se pueden utilizar sujetos de referencia con clasificaciones conocidas de una o más afecciones y valores característicos medidos (por ejemplo, un nivel de metilación) para determinar niveles de referencia que permitan discriminar entre las diferentes afecciones y/o clasificaciones de una afección (por ejemplo, si el sujeto padece la afección). Cualquiera de estas expresiones puede utilizarse en cualquiera de estos contextos.
Las expresiones "controlar", "muestra de control", "referencia", "muestra de referencia", "normal" y "muestra normal" pueden utilizarse indistintamente para describir en general una muestra que no presenta una afección particular o que, por lo demás, está sana. En un ejemplo, un método como el divulgado en el presente documento puede realizarse en un sujeto que tenga un tumor, donde la muestra de referencia es una muestra tomada de un tejido sano del sujeto. En otro ejemplo, la muestra de referencia es una muestra tomada de un sujeto con la enfermedad, por ejemplo, cáncer o un estadio particular de cáncer. Una muestra de referencia puede obtenerse del sujeto o de una base de datos. La referencia se refiere generalmente a un genoma de referencia que se utiliza para cartografiar las lecturas de las secuencias obtenidas a partir de la secuenciación de una muestra del sujeto. Un genoma de referencia se refiere generalmente a un genoma haploide o diploide cuyas lecturas de secuencia de la muestra biológica y la muestra constitutiva se pueden alinear y comparar. Para un genoma haploide, hay únicamente un nucleótido en cada locus. Para un genoma diploide, se pueden identificar los locus heterocigotos, teniendo dichos locus dos alelos, donde cualquiera de los alelos puede permitir una coincidencia para la alineación con los locus. Un genoma de referencia puede corresponder a un virus, por ejemplo, mediante la inclusión de uno o más genomas víricos.
La expresión "sano", como se utiliza en el presente documento, se refiere generalmente a un sujeto que posee buena salud. Dicho sujeto muestra ausencia de cualquier enfermedad maligna o no maligna. Un "individuo sano" puede tener otras enfermedades o afecciones, sin relación con la afección que se está ensayando, que normalmente pueden no considerarse "sanos".
Los términos "cáncer'' o "tumor" pueden utilizarse indistintamente y se refieren en general a una masa anormal de tejido en donde el crecimiento de la masa supera y no se coordina con el crecimiento del tejido normal. Un cáncer o un tumor puede definirse como "benigno" o "maligno" dependiendo de las siguientes características: grado de diferenciación celular, incluyendo morfología y funcionalidad, tasa de crecimiento, invasión local y metástasis. Un tumor "benigno" generalmente está bien diferenciado, tiene un crecimiento característicamente más lento que un tumor maligno y permanece localizado en el sitio de origen. Además, un tumor benigno no tiene capacidad de infiltrar, invadir o metastatizar en sitios distantes. Un tumor "maligno" generalmente está poco diferenciado (anaplasia), tiene un crecimiento característicamente rápido acompañado de una progresiva infiltración, invasión y destrucción del tejido circundante. Adicionalmente, un tumor maligno tiene la capacidad de metastatizar a sitios distantes. "Estadio" puede utilizarse para describir el grado de avance de un tumor maligno. Un cáncer o una neoplasia en estadio temprano se asocia a una menor carga tumoral en el organismo, generalmente con menos síntomas, con mejor pronóstico y con mejor resultado del tratamiento que una neoplasia en estadio tardío. Un cáncer o una neoplasia en estadio tardío o avanzado suele asociarse a metástasis a distancia y/o diseminación linfática.
La expresión"nivel de cáncer"(o más generalmente"nivel de enfermedad"o"nivel de afección")puede referirse a la existencia o no de cáncer (es decir, presencia o ausencia), un estadio de un cáncer, un tamaño de tumor, si hay metástasis, la carga tumoral total del organismo, la respuesta del cáncer al tratamiento y/u otra medida de la gravedad de un cáncer (por ejemplo, recaída de un cáncer). El nivel de cáncer puede ser un número u otros indicios, tales como símbolos, letras del alfabeto y colores. El nivel puede ser cero. El nivel de cáncer también puede incluir afecciones premalignas o precancerosas (estados). El nivel de cáncer puede usarse de diversas maneras. Por ejemplo, el cribado puede comprobar si el cáncer está presente en una persona que no se sabe que haya tenido cáncer con anterioridad. La evaluación puede investigar a una persona a la que se le ha diagnosticado un cáncer para supervisar la evolución del mismo a lo largo del tiempo, estudiar la eficacia de las terapias o determinar el pronóstico. En una realización, el pronóstico puede expresarse como la probabilidad de que un paciente muera de cáncer o la probabilidad de que el cáncer progrese después de una duración o tiempo específicos, o la probabilidad de que el cáncer metastatice. La detección puede significar "cribar" o puede significar comprobar si alguien, con características indicativas de cáncer (por ejemplo, síntomas u otras pruebas positivas), tiene cáncer. Un "nivel de patología" puede referirse al nivel de patología asociado a un patógeno, donde el nivel puede ser como se ha descrito anteriormente para el cáncer. El nivel de enfermedades/afección también puede ser como se ha descrito anteriormente para el cáncer. Cuando el cáncer está asociado con un patógeno, un nivel de cáncer puede ser un tipo de un nivel de patología.
Las expresiones "perfil de tamaño" y "distribución de tamaño" se refieren generalmente a los tamaños de los fragmentos de ADN en una muestra biológica. Un perfil de tamaño puede ser un histograma que proporciona una distribución de una cantidad de fragmentos de ADN en una variedad de tamaños. Diversos parámetros estadísticos (también denominados parámetros de tamaño o simplemente parámetro) pueden distinguir un perfil de tamaño de otro. Un parámetro es el porcentaje de fragmento de ADN de un tamaño o intervalo de tamaños particular en relación con todos los fragmentos de ADN o en relación con fragmentos de ADN de otro tamaño o intervalo.
El término "falso positivo" (FP) puede referirse a sujetos que no padecen una afección. Falso positivo se refiere generalmente a los sujetos que no tienen un tumor, un cáncer, una afección precancerosa (por ejemplo, una lesión precancerosa), un cáncer localizado o metastatizado, una enfermedad no maligna, o que por lo demás están sanos. El término falso positivo se refiere generalmente a los sujetos que no padecen una afección, pero se identifican como afectados por la afección mediante un ensayo o un método de la presente divulgación.
Las expresiones "sensibilidad" o "tasa de verdaderos positivos" (TPR) pueden referirse al número de verdaderos positivos dividido por la suma del número de verdaderos positivos y falsos negativos. La sensibilidad puede caracterizar la capacidad de un ensayo o un método para identificar correctamente una proporción de la población que realmente padece una afección. Por ejemplo, la sensibilidad puede caracterizar la capacidad de un método para identificar correctamente el número de sujetos de una población que padecen cáncer. En otro ejemplo, la sensibilidad puede caracterizar la capacidad de un método para identificar correctamente uno o más marcadores indicativos de cáncer.
Las expresiones "especificidad" o "tasa de verdaderos negativos" (TNR) pueden referirse al número de verdaderos negativos dividido por la suma del número de verdaderos negativos y falsos positivos. La especificidad puede caracterizar la capacidad de un ensayo o un método para identificar correctamente una proporción de la población que realmente padece una afección. Por ejemplo, la especificidad puede caracterizar la capacidad de un método para identificar correctamente el número de sujetos de una población que no padecen cáncer. En otro ejemplo, la especificidad puede caracterizar la capacidad de un método para identificar correctamente uno o más marcadores indicativos de cáncer.
La expresión "ROC" o "curva ROC" puede referirse a la curva de eficacia diagnóstica. La curva ROC puede ser una representación gráfica del rendimiento de un sistema clasificador binario. Para cualquier método dado, se puede generar una curva ROC representando gráficamente la sensibilidad frente a la especificidad con varios ajustes del umbral. La sensibilidad y la especificidad de un método para detectar la presencia de un tumor en un sujeto pueden determinarse a varias concentraciones de un ácido nucleico derivado del tumor en la muestra de plasma del sujeto. Adicionalmente, si se proporciona al menos uno de los tres parámetros (por ejemplo, sensibilidad, especificidad y el ajuste del umbral) y la curva ROC, se puede determinar el valor o el valor esperado para cualquier parámetro desconocido. El parámetro desconocido puede determinarse mediante una curva ajustada a la curva ROC. La expresión "AUC" o "ROC-AUC" se refiere generalmente al área bajo una curva de eficacia diagnóstica. Este parámetro puede proporcionar una medida de la utilidad diagnóstica de un método, teniendo en cuenta tanto la sensibilidad como la especificidad del método. En general, la ROC-AUC oscila entre 0,5 y 1,0, donde un valor cercano a 0,5 indica que el método tiene una utilidad diagnóstica limitada (por ejemplo, menor sensibilidad y/o especificidad) y un valor cercano a 1,0 indica que el método tiene una mayor utilidad diagnóstica (por ejemplo, mayor sensibilidad y/o especificidad). Véase, por ejemplo, Pepe et al, "Limitations of the Odds Ratio in Gauging the Performance of a Diagnostic, Prognostic, or Screening Marker", Am. J. Epidemiol 2004, 159 (9): 882-890. Algunos enfoques adicionales para caracterizar la utilidad diagnóstica usando funciones de probabilidad, razones de posibilidades, teoría de la información, valores predictivos, medidas de calibración (incluida la bondad de ajuste) y de reclasificación se resumen de acuerdo con Cook, "Use and Misuse of the Receiver Operating Characteristic Curve in Risk Prediction", Circulation 2007, 115: 928 935.
El término "aproximadamente" puede significar dentro de un intervalo de error aceptable para el valor particular determinado por un experto en la materia, que dependerá en parte de cómo se mida o determine el valor, es decir, de las limitaciones del sistema de medición. Por ejemplo, "aproximadamente" puede significar dentro de 1 o más de 1 desviación estándar, según la practica en la técnica. Alternativamente, "aproximadamente" puede significar un intervalo de hasta el 20 %, hasta el 10 %, hasta el 5 % o hasta el 1 % de un valor dado. Alternativamente, particularmente con respecto a los sistemas o procesos biológicos, el término "aproximadamente" puede significar dentro de un orden de magnitud, dentro de 5 veces, y más preferentemente dentro de 2 veces, de un valor. Cuando se describan valores particulares en la solicitud y en las reivindicaciones, a menos que se indique lo contrario, debe asumirse el término "aproximadamente" dentro de un intervalo de error aceptable para el valor particular. El término "aproximadamente" puede tener el significado comprendido normalmente por el experto habitual en la materia. El término "aproximadamente" puede referirse a ±10 %. El término "aproximadamente" puede referirse a ±5 %.
La terminología utilizada en el presente documento es con el fin de describir casos particulares únicamente y no pretende ser limitante. Como se utilizan en el presente documento, las formas en singular "un/a", "uno/una" y "el/la" pretenden incluir también las formas en plural, salvo que el contexto indique claramente lo contrario. Se entiende que el uso de "o" hace referencia a un "o inclusivo", y no a un "o exclusivo", a menos que se indique específicamente lo contrario. La expresión "tomando como base" significa "basado al menos en parte en". Adicionalmente, en la medida en que las expresiones "que incluye", "incluye", "que tiene", "tiene", "con" o variantes de las mismas se usan en la descripción detallada y/o en las reivindicaciones, dichos términos pretenden ser inclusivos de una manera similar a la expresión "que comprende".
En la presente divulgación, describimos un enfoque para diferenciar entre las diferentes enfermedades asociadas al VEB, neoplasias malignas, estados o individuos completamente sanos tomando como base el análisis de los patrones de metilación de los fragmentos circulantes de ADN del VEB en sangre. Existen varias aplicaciones o utilidades para el análisis de los patrones de metilación de las moléculas de ADN del VEB acelular. La viabilidad del análisis de metilación de moléculas víricas acelulares de forma no invasiva mejoraría las aplicaciones clínicas en el contexto del cribado, la medicina predictiva, la estratificación del riesgo, la vigilancia y el pronóstico.
Las realizaciones pueden diferenciar sujetos con diferentes afecciones asociadas al virus (por ejemplo, pacientes con CNF) y sujetos aparentemente sanos con ADN del VEB plasmático detectable, incluso con un análisis de un solo punto temporal, por ejemplo, de una sola extracción de sangre. Las realizaciones también pueden utilizarse para cribar o detectar si un sujeto padece una enfermedad o un cáncer, para controlar la enfermedad en un paciente con cáncer, para el pronóstico y para la predicción del riesgo de enfermedad o de cáncer (es decir, para predecir si un sujeto puede desarrollar una enfermedad o cáncer en el futuro). Este enfoque también puede generalizarse a otros virus distintos del VEB. Se trata, por tanto, de un enfoque general para la identificación de biomarcadores basados en ADN vírico.
I. CÁNCER Y VIRUS
Se ha demostrado que tanto los virus de ADN como los de ARN son capaces de provocar cáncer en los seres humanos. En algunas realizaciones, un sujeto puede tener un cáncer causado por un virus (por ejemplo, un oncovirus). En algunas realizaciones, un sujeto puede tener un cáncer, y el cáncer puede ser detectable mediante el ADN vírico. Para el análisis del ARN, los ácidos nucleicos existirían como ADN complementario (ADNc), que se copia del ARN y es el medio de replicación en las células hospedadoras. Estos ADNc podrían tener metilación y utilizarse en las realizaciones.
Varias infecciones víricas están asociadas a varios tipos de cáncer u otras afecciones patológicas. Por ejemplo, la infección por el VEB está estrechamente asociada con el CNF y el linfoma de linfocitos T citolíticos naturales (NK), linfoma de Hodgkin, cáncer gástrico y mononucleosis infecciosa. La infección por el virus de la hepatitis B (VHB) y la infección por el virus de la hepatitis C (VHC) se asocian a un mayor riesgo de desarrollar carcinoma hepatocelular (CHC). La infección por el virus del papiloma humano (VPH) se asocia a un mayor riesgo de desarrollar cáncer cervicouterino (CC) y carcinoma epidermoide de cabeza y cuello (CECC). Aunque los ejemplos se centran más en el VEB, las técnicas son igualmente aplicables para el cáncer y otras afecciones relacionadas con el VPH, el VEB y otros virus, particularmente aquellos asociados con cáncer.
A. VEB
Se ha estimado que el 95 % de la población mundial tiene una infección asintomática de por vida por el virus de Epstein-Barr (VEB), de modo que el virus permanece latente en los linfocitos B de memoria de los individuos sanos y persiste en el organismo (Younget al.Nat Rev Cancer 2016 16 (12): 789-802). Una pequeña proporción de sujetos desarrolla una infección sintomática, presentándose como mononucleosis infecciosa con la infección vírica. El VEB también se considera un virus oncogénico por su asociación con una serie de neoplasias malignas o síndromes pseudocancerosos de origen epitelial y hematológico, incluyendo carcinoma nasofaríngeo (CNF), carcinoma gástrico, linfoma de Burkitt, linfoma de Hodgkin, linfoma de linfocitos T citolíticos naturales (linfocitos T NK) y trastorno linfoproliferativo postrasplante (TLPT).
Se ha explorado el ADN circulante del VEB por su papel diagnóstico y pronóstico en pacientes con neoplasias malignas asociadas al VEB. A este respecto, el ADN del VEB plasmático se ha establecido como biomarcador del CNF (Loet al.Cancer Res 1999; 59: 1188-91). Se recomienda la vigilancia periódica con ADN del VEB plasmático en pacientes con diagnóstico confirmado de CNF para la detección de la enfermedad residual y de recidivas (Loet al.Cancer Res 1999; 59: 5452-5, Chanet al.J Natl Cancer Inst 2002; 94: 1614-9, Leunget al.Cancer 2003, 98 (2), 288-91 & Leunget al.Ann Oncol 2014; 25 (6): 1204-8). También se ha demostrado que el ADN del VEB plasmático tiene importancia pronóstica en otras neoplasias malignas asociadas al VEB, incluyendo el linfoma de Hodgkin (Kanakryet al.Blood 2013; 121 (18): 3547-3553), el linfoma extraganglionar de linfocitos T citolíticos naturales (Wanget al.Oncotarget 2015; 6 (30): 30317-26, Kwonget al.Leukemia 2014; 28 (4): 865-870) y TLPT (Gulley y Tang. Clin Microbiol Rev 2010; 23 (2): 350-66).
Sin embargo, no todos los sujetos que tengan dicha infección desarrollarán un cáncer asociado. La fuente del ADN del VEB plasmático debe ser diferente en las personas sin CNF. A diferencia de la liberación persistente de ADN del VEB a la circulación desde las células del CNF, la fuente de ADN del VEB sólo aporta dicho ADN de forma transitoria en las personas sin CNF
B. Falsos positivos
En el contexto del cribado del cáncer, recientemente hemos llevado a cabo un estudio prospectivo a gran escala sobre el cribado del CNF mediante el análisis del ADN del VEB plasmático por PCR cuantitativa (qPCR) (Chanet al.N Engl J Med 2017; 377: 513-522). Analizamos el nivel de ADN del VEB plasmático en todos los sujetos seleccionados (cohorte de cribado) que eran asintomáticos para el CNF en el momento de la inscripción. Los sujetos con una cantidad detectable de ADN del VEB plasmático volvieron a someterse a la prueba del ADN del VEB 4 semanas después de la prueba inicial. Entre los 20 174 sujetos seleccionados, 1112 tenían ADN del VEB plasmático detectable en su primera prueba. Hubo 309 sujetos que dieron un positivo persistente en la prueba de seguimiento basada en la medición de una cantidad de ADN del<v>E<b>plasmático. Posteriormente, se confirmó mediante endoscopia y resonancia magnética (RM) que 34 sujetos con resultados persistentemente positivos de ADN del VEB plasmático tenían CNF. Como se ha mencionado, se pudo detectar ADN del VEB plasmático en individuos aparentemente sanos sin CNF ni otras neoplasias malignas asociadas al VEB.
En los 20 174 sujetos que se sometieron al cribado de CNF, la tasa de falsos positivos para el ADN del VEB plasmático fue de aproximadamente el 5 % tomando como base el análisis de un único punto temporal ((1112-34) / (20174-34) = 5,3 %). La tasa de falsos positivos se redujo al 1,5 % con análisis seriados del ADN del VEB en dos ocasiones. Sin embargo, la prueba secuencial del ADN del VEB plasmático requiere la recogida de una muestra de sangre adicional de los sujetos con resultados iniciales positivos, lo que puede presentar problemas logísticos. También, una proporción sustancial de sujetos que tienen resultados positivos de ADN del VEB plasmático no tienen CNF (el 96 % de los sujetos que muestran resultados positivos en el análisis de un único punto temporal no tienen CNF, determinado como (1112-34)/1112). Los sujetos con resultados falsos positivos necesitarían evaluaciones seriadas e investigaciones innecesarias, incluyendo una endoscopia y una resonancia magnética, para un diagnóstico definitivo. Todo ello provocaría ansiedad en el paciente y mayores costes de seguimiento. Por consiguiente, nuestro objetivo es distinguir a los pacientes con CNF de los sujetos con resultados falsos positivos de ADN del VEB plasmático con un análisis de sangre de un único punto temporal. En este ejemplo, una tasa positiva falsa de ADN del VEB plasmático puede considerarse una tasa positiva sin CNF o también denominada tasa positiva única.
C. Uso de la metilación
Estudios anteriores han descrito diferentes tipos de latencia vírica (los tipos 0, I, II y III), que se definen por patrones de transcripción de genes víricos asociados a la latencia, encontrados en diferentes neoplasias malignas asociadas al VEB (Younget al.Nat Rev Cancer 2016; 16 (12): 789-802). La latencia vírica se define por los patrones de transcripción génica asociados a la latencia. Por consiguiente, los virus en diferentes tipos de latencia vírica tienen diferentes patrones de transcripción de los genes víricos. Diferentes enfermedades o afecciones asociadas al VEB con el mismo tipo de latencia vírica pueden tener unos patrones de transcripción de los genes víricos similares.
Entre los distintos tipos de latencia, existen diferentes perfiles de expresión de los genes víricos y diferentes estados de metilación de los diferentes promotores de los genes víricos, incluyendo el origen de la replicación, el promotor C, el promotor W, el promotor Q y los promotores LMP1/2 (Woelleret al.Curr Opin Virol 2013; 3 (3): 260-5). Se ha sugerido que la metilación del ADN contribuye a regular la expresión génica y que existen patrones de metilación específicos de la latencia (Lieberman. Nat Rev Microbiol 2013; 11 (12): 863-75). En un ejemplo, un estudio anterior descubrió un estado metilado del promotor C, lo que es compatible con el patrón de metilación específico del tipo II de latencia, en el ADN del VEB de muestras de citología por cepillado nasofaríngeo de pacientes con CNF mediante una PCR específica de metilación (Ramayantiet al.Int J Cancer 140, 149-162). Sin embargo, diferentes enfermedades o afecciones asociadas al VEB pueden tener el mismo tipo de latencia vírica y, por lo tanto, presentarían unos patrones de transcripción de genes víricos similares (ejemplos descritos en el párrafo siguiente). Por lo tanto, la latencia vírica no tiene correlación con el estadio de la enfermedad o del cáncer.
Es de esperar que diferentes enfermedades asociadas al VEB con el mismo tipo de latencia vírica presenten unos patrones de metilación similares (Temperaet al.Semin Cancer Biol 2014; 26: 22-9, Fejeret al.J Gen Virol 2008; 89: 1364-70). En un ejemplo, un estudio anterior ha mostrado un patrón de metilación similar en todas las regiones promotoras víricas del VEB tanto en linfocitos B de individuos sanos seropositivos para el VEB como en tejidos tumorales de linfomas positivos para el VEB, presentando ambos una latencia de tipo I, utilizando una PCR específica de metilación (Paulsonet al.J Virol 1999; 73: 9959-68).
Un estudio anterior también ha intentado estudiar los perfiles de metilación del VEB mediante la secuenciación de amplicones del ADN convertido con bisulfito a partir de estirpes celulares y muestras tisulares de diferentes enfermedades asociadas al VEB (Fernandexet al.Genome Res 2009; 19 (3): 438-51). Los 77 amplicones diseñados cubrían los sitios de inicio de la transcripción de 94 genes latentes y líticos diferentes del VEB y de dos ARN estructurales,FBFR1yEBER2.Se evaluó el estado de metilación, metilado o no metilado, de todos los sitios de inicio de la transcripción en todo el genoma del VEB. Estos resultados únicamente demostraron que el ADN vírico libre carecía de metilación del ADN, por oposición a la cuantificación, y el ADN vírico de las estirpes celulares o las muestras tisulares de neoplasias malignas asociadas al VEB presentaba un gran número de sitios de inicio de la transcripción del VEB metilados. De forma importante, las muestras con diferentes afecciones neoplásicas malignas (es decir, CNF y diferentes linfomas) se agruparon con el análisis de agrupamiento basado en los patrones de metilación de los sitios de inicio de la transcripción, y no se identificaron los sujetos transitoriamente positivos o persistentemente positivos. Tomando como base sus patrones de metilación, no se pudieron diferenciar las distintas afecciones malignas.
La mayoría de los estudios anteriores se han centrado en el análisis de los perfiles de metilación vírica en muestras tumorales y de estirpes celulares. Estas muestras tumorales deben obtenerse mediante procedimientos invasivos, por ejemplo, biopsias quirúrgicas. Esto puede limitar las aplicaciones de diagnóstico, por ejemplo, para el cribado y el seguimiento en serie. Y, los estudios anteriores se han centrado en aspectos cualitativos y no en resultados cuantitativos.
A pesar de los datos comunicados anteriormente, investigamos la viabilidad de diferenciar entre distintas enfermedades asociadas al VEB que presentan el mismo tipo de latencia vírica. A diferencia de los datos comunicados anteriormente, describimos métodos basados en el análisis de los perfiles de mutilación de las secuencias de ADN del VEB plasmático que podrían diferenciar entre diferentes enfermedades relacionadas con el VEB o estadios de enfermedades. Por ejemplo, en lugar de analizar únicamente el estado de metilación (metilado o no metilado) de los promotores de los genes víricos, estudiamos el nivel de metilación de cada sitio CpG de las moléculas de ADN del VEB acelulares a mayor resolución en todo el genoma. Notablemente, nuestros datos revelan que podríamos diferenciar entre distintas afecciones y neoplasias malignas asociadas al VEB con el mismo tipo de latencia tomando como base el análisis de metilación de las moléculas de ADN del VEB acelulares. Por lo tanto, nuestros datos proporcionan nueva información sobre los patrones de metilación del ADN del VEB acelular más allá de la variabilidad específica del tipo de latencia.
Las realizaciones pueden analizar los patrones de metilación de las moléculas de ADN del VEB acelulares en sangre (por ejemplo, en plasma o en suero). Las realizaciones de la presente divulgación también pueden utilizarse en otros líquidos corporales que contengan moléculas de ADN del VEB acelulares, por ejemplo, orina (Chanet al.Clin Cancer Res 2008; 14 (15): 4809-13), suero, líquido vaginal, líquidos de un lavado uterino o vaginal, líquido pleural, líquido ascítico, líquido cefalorraquídeo, saliva, sudor, lágrimas, esputo, líquido de lavado broncoalveolar, etc. También pueden utilizarse muestras de heces. Los retos técnicos son la escasa abundancia y la naturaleza fragmentada de las moléculas víricas, en comparación con el análisis del ADN tumoral en muestras tisulares. Nuestra presente divulgación demuestra la viabilidad del análisis de metilación de moléculas víricas acelulares de una forma no invasiva.
II. MEDICION DE LA METILACION DE LAS MOLECULAS DE ADN DEL VEB ACELULARES
El nivel o niveles de metilación pueden medirse en varios sitios de un genoma, por ejemplo, animal (tal como ser un humano), vírico u otros. Los niveles de metilación pueden determinarse utilizando la información de metilación en uno o más sitios, por ejemplo, sitios CpG. La información de metilación puede incluir recuentos de moléculas de ADN metiladas en un sitio dado o señales de intensidad correspondientes a una cantidad de moléculas de ADN metiladas/no metiladas. El nivel de metilación puede proporcionar una abundancia relativa entre las moléculas de ADN metiladas y las moléculas de ADN no metiladas, por ejemplo, cuando la cantidad de todas las moléculas o de las de ADN o no metilado en los sitios puede actuar como factor de normalización.
Para un genoma vírico, la densidad media de CpG metilados (también llamada densidad de metilación, DM) de locus específicos en todo el genoma vírico en el plasma puede calcularse utilizando la ecuación:
DM = M
M+U
donde M es el recuento de lecturas víricas metiladas y U es el recuento de lecturas víricas no metiladas en los sitios CpG dentro de locus genéticos en todo el genoma vírico. Si existe más de un sitio CpG dentro de un locus, entonces M y U corresponden a los recuentos de lecturas metiladas y no metiladas, respectivamente, en todos los sitios. Como ejemplos, dichos recuentos de fragmentos individuales de ADN metilados o no metilados pueden determinarse mediante secuenciación o PCR digital. Como otro ejemplo, la densidad de metilación también puede determinarse mediante una PCR en tiempo real para obtener una relación de intensidad de las señales (por ejemplo, una relación entre la intensidad metilada y la intensidad no metilada), por oposición al recuento de cantidades específicas de lecturas. Por lo tanto, el análisis de los ácidos nucleicos puede realizarse de forma conjunta, donde una señal de intensidad corresponde a múltiples ácidos nucleicos. La forma particular del nivel de metilación puede variar, por ejemplo, una proporción, como anteriormente, o una relación entre M y U.
A. Varias técnicas para evaluar los niveles de metilación
Se pueden utilizar diferentes enfoques para determinar los niveles de metilación, por ejemplo, para determinar un perfil de metilación que abarque la totalidad o una parte sustancial de un genoma, por ejemplo, un genoma humano o un genoma vírico. Para explorar exhaustivamente un perfil de metilación, las realizaciones ilustrativas pueden utilizar la secuenciación masiva en paralelo (MPS) del ADN convertido con bisulfito para proporcionar información de todo el genoma y evaluar cuantitativamente el nivel de metilación por nucleótido y por alelo. Se podría utilizar cualquier ensayo sensible a la metilación para determinar los niveles de metilación de los sitios CpG seleccionados. Otras técnicas ilustrativas incluyen la secuenciación de una sola molécula (por ejemplo, la secuenciación por nanoporos (Simpsonet al.Nat Methods 2017; 14 (4): 407-410)), la PCR específica de metilación (Hermanet al.Proc Natl Acad Sci EE.UU.
1996; 93 (18): 9821-9826), el tratamiento con enzimas que modifican diferencialmente las moléculas de ADN en función de su estado de metilación (por ejemplo, enzimas de restricción sensibles a la metilación), proteínas de unión a la metilación (por ejemplo, anticuerpos), o métodos basados en la espectrometría de masas (por ejemplo, Linet al.Anal Chem 2016; 88 (2): 1083-7).
Se pueden analizar varios tipos de metilación. En algunas realizaciones, hemos utilizado la metilación en 5 de residuos de citosina como ejemplo. También se pueden utilizar otros tipos de cambios por metilación del ADN detectables, por ejemplo, hidroximetilación o metilación de adenina. Por consiguiente, también pueden utilizarse tecnologías para detectar la hidroximetilación, por ejemplo, la secuenciación con bisulfito oxidativa (Boothet al.Science 2012; 336 (6083): 934-7) y la secuenciación con bisulfito asistida por Tet (Nat Protoc 2012; 7 (12): 2159-70). Se pueden encontrar más detalles para la determinación y el uso de un perfil de mutilación en las Publicaciones de Patentes de EE.UU.
2015/0011403 y 2016/0017419 y 2017/0029900.
Durante la modificación con bisulfito, las citosinas no metiladas se convierten en uracilos y posteriormente en timinas tras la amplificación por PCR, mientras que las citosinas metiladas permanecerían intactas (Frommer M,et al.Proc Natl Acad Sci EE.UU. 1992; 89: 1827-31). Tras la secuenciación y la alineación, la metilación de un sitio CpG individual podría inferirse por tanto a partir del recuento de lecturas de secuencia metiladas "M" (metilada) y del recuento de lecturas de secuencia no metiladas "U" (no metilada) en el resto de citosina del sitio CpG. Utilizando los datos de la secuenciación con bisulfito, se pudieron construir metilomas víricos a partir del plasma de sujetos con diferentes afecciones asociadas a virus.
Como se ha descrito anteriormente, el perfil de metilación puede realizarse mediante una secuenciación masiva paralela (MPS) de ADN convertido con bisulfito. La MPS del ADN convertido con bisulfito puede realizarse de forma aleatoria o indiscriminada, o de forma dirigida. Por ejemplo, la región o regiones de interés del ADN convertido con bisulfito pueden capturarse mediante un proceso basado en la hibridación en fase sólida o en fase de solución, seguido por la MPS.
La MPS puede realizarse utilizando una plataforma de secuenciación por síntesis (por ejemplo, la plataforma HiSeq o NextSeq o NovaSeq de Illumina), una plataforma de secuenciación por ligación (por ejemplo, la plataforma SOLiD de Life Technologies), un sistema de secuenciación basado en semiconductores (por ejemplo, las plataformas Ion Torrent o Ion Proton de Life Technologies), la tecnología GenapSys Gene Electronic Nano-Integrated Ultra-Sensitive (GENIUS), un sistema de secuenciación de una sola molécula (por ejemplo, el sistema Helicos o el sistema Pacific Biosciences) o un sistema de secuenciación basado en nanoporos (por ejemplo, de Oxford Nanopore Technologies o la plataforma Genia de Roche (sequencing.roche.com/research-development/nanopore-sequencing.html)). Secuenciación basada en nanoporos, incluyendo los nanoporos construidos con bicapas lipídicas y nanoporos de proteínas, y los nanoporos de estado sólido (tales como aquellos basados en grafeno). Dado que las plataformas de secuenciación de una sola molécula seleccionadas permitirían conocer el estado de metilación de las moléculas de ADN (incluyendo N6-metiladenina, 5-metilcitosina y 5-hidroximetilcitosina) para ser dilucidadas directamente sin conversión con bisulfito (B.A. Flusberget al.2010 Nat Methods; 7: 461-465; J. Shimet al.2013 Sci Rep: 3: 1389. doi: 10.1038/srep01389), el uso de dichas plataformas permitiría analizar el estado de metilación del ADN de muestras no convertidas con bisulfito (por ejemplo, ADN de plasma o de suero). La secuencia puede incluir la secuenciación por ambos extremos o proporcionar una única lectura de secuencia para toda la molécula de ADN.
Además de la secuenciación, pueden utilizarse otras técnicas, por ejemplo, como se ha mencionado anteriormente. En una realización, el perfil de metilación puede realizarse mediante una PCR específica de metilación o una digestión con una enzima de restricción sensible a la metilación seguida de PCR o reacción en cadena de la ligasa seguida de PCR. En otras realizaciones más, la PCR es una forma de PCR de una sola molécula o digital (B. Vogelsteinet al.
1999 Proc Natl Acad Sci EE.UU.; 96: 9236-9241). En otras realizaciones adicionales, la PCR puede ser una PCR en tiempo real (Loet al.Cancer Res 1999; 59 (16): 3899-903 y Eadset al.Nucleic Acids Res 2000; 28 (8): E32). En otras realizaciones, la PCR puede ser una PCR múltiple. En una realización, el perfil de metilación puede realizarse utilizando tecnologías basadas en micromatrices.
Después de la secuenciación, las lecturas de la secuencia pueden procesarse enMethyl-Pipe,un proceso de análisis de los datos de metilación (Jianget al.PLoS One 2014; 9: e100360) y se cartografió con una secuencia de referencia combinada artificialmente que consiste en el genoma humano completo (hg19), el genoma del VEB completo (AJ507799.2), el genoma del VHB completo y el genoma del VPH completo. Se pueden utilizar diferentes secuencias de referencia, y se puede realizar el cartografiado para cada uno de los genomas por separado, en lugar de combinarse en una secuencia de referencia. Las lecturas secuenciadas que cartografían una posición única en la secuencia genómica combinada pueden utilizarse para análisis posteriores.
B. Secuenciación con bisulfito dirigida utilizando sondas de captura
Ciertas realizaciones pueden explorar regiones específicas para los patrones de metilación de las moléculas de ADN del VEB plasmático. En una realización, puede utilizarse una secuenciación con bisulfito dirigida con enriquecimiento por captura para analizar las moléculas de ADN vírico acelulares en la circulación de sujetos con diferentes enfermedades o afecciones asociadas al VEB. Por ejemplo, las sondas de captura pueden diseñarse para cubrir todos o algunos de los sitios CpG del genoma del VEB. Este enfoque puede utilizarse también para otros virus. Por consiguiente, las sondas de captura también pueden diseñarse para cubrir todos o algunos de los sitios CpG del genoma del virus de la hepatitis B (VHB), del genoma del virus del papiloma humano (VPH) y de otros genomas víricos/bacterianos. En el mismo análisis, también pueden incluirse sondas de captura dirigidas a regiones genómicas del genoma humano.
En algunas realizaciones, para tener en cuenta las diferencias de tamaño entre un genoma vírico y el genoma humano, se pueden diseñar más sondas para hibridar con secuencias genómicas víricas que utilizar regiones genómicas humanas de interés. En otra realización, se puede dirigir a genomas víricos enteros, por ejemplo, diseñando una media de 200 sondas de hibridación que cubran cada región genómica vírica con un tamaño de ~200 pb (por ejemplo, sondas de captura en pliegues 200X). En un ejemplo realización y como un ejemplo, para las regiones de interés del genoma humano, diseñamos una media de 5 sondas de hibridación que cubrían cada región con un tamaño de ~200 pb (por ejemplo, sondas de captura en pliegues 5X). Como una ilustración, las sondas de captura pueden diseñarse de acuerdo con la FIG. 1.
La FIG. 1 muestra el diseño de sondas de captura para la secuenciación con bisulfito dirigida de acuerdo con las realizaciones de la presente divulgación. La FIG. 1 proporciona información sobre las sondas de captura, por ejemplo, el tamaño de las regiones de captura y la cantidad de pliegues cubiertos por las sondas. Las sondas de captura pueden tener varias longitudes y superponerse entre sí. Dichas sondas de captura pueden utilizar el sistema SeqCap-Epi (Nimblegen). Otras realizaciones pueden no utilizar dichas sondas de captura.
La columna 101 identifica el tipo de secuencia, es decir, los autosomas de los objetivos humanos o víricos. La columna 102 identifica la secuencia particular (por ejemplo, de un cromosoma o de un genoma vírico particular). La columna 103 proporciona la longitud total en pares de bases (pb) que abarcan las sondas de captura. Las sondas de captura pueden no abarcar toda la secuencia (por ejemplo, como se muestra para los autosomas), pero puede abarcar toda la secuencia, por ejemplo, para un genoma vírico. La columna 104 proporciona la profundidad de la sonda de captura, denominado también llenado de los pliegues de la sonda. Estos números indican el número de sondas que cubren cualquier posición dada. Para los autosomas, las sondas de captura proporcionan 5x pliegues de media. Para los objetivos víricos, las sondas de captura proporcionan 200x pliegues de media. Por lo tanto, el número de sondas para el vírico es un porcentaje o una proporción superior por unidad de longitud que para los autosomas. Dicho mayor nivel de concentración de las sondas de captura para los objetivos víricos puede ayudar a maximizar la posibilidad de capturar el ADN vírico.
NI. NIVELES DE METILACIÓN DEL ADN DEL VEB PLASMÁTICO PARA DIFERENTES AFECCIONES
Hemos analizado los patrones de metilación de las moléculas de ADN del VEB plasmático en pacientes con varias enfermedades/afecciones asociadas al VEB, por ejemplo, CNF, mononucleosis infecciosa, linfoma de Hodgkin, linfoma de linfocitos T citolíticos naturales e individuos aparentemente sanos con ADN del VEB plasmático detectable. Los sujetos aparentemente sanos con ADN del VEB plasmático detectable se obtuvieron de una cohorte de sujetos seleccionados para el cribado del CNF y se clasificaron en 2 grupos. El primer grupo incluía a los sujetos que tenían niveles detectables de ADN del VEB plasmático en la prueba inicial, pero niveles indetectables en la prueba de seguimiento y se denominaron "transitoriamente positivos". El segundo grupo incluía a los sujetos que tenían niveles detectables de ADN del VEB plasmático tanto en la prueba inicial como en la de seguimiento y se denominaron "persistentemente positivos".
Se utilizó la secuenciación con bisulfito dirigida con enriquecimiento de captura mediante sondas de captura diseñadas específicamente. Para cada muestra de plasma analizada, el ADN se extrajo a partir de 4 ml de plasma utilizando el minikit de ADN en sangre QIAamp DSP. Para cada caso, todo el ADN extraído se utilizó para la preparación de la genoteca de secuenciación utilizando el kit de preparación de genotecas KAPA (Roche) o el kit de preparación de genotecas sin PCR TruSeq (Illumina). Los productos de ADN ligados a un adaptador se sometieron a dos rondas de tratamiento con bisulfito utilizando un kit EpiTect Bisulfite (Qiagen). Se realizaron de doce a quince ciclos de amplificación por PCR en las muestras convertidas con bisulfito utilizando el kit de PCR KAPA HiFi HotStart Uracil+ ReadyMix (Roche). La primera amplificación por PCR puede aumentar la cantidad de ADN para la captura del objetivo. Se puede sugerir una cantidad de aporte de ADN para la reacción de captura del objetivo. La cantidad de ADN aportada procedente del plasma (sin amplificación) puede no ser suficiente para la captura del objetivo.
A continuación, los productos de la amplificación se capturaron con el sistema SeqCap-Epi (Nimblegen) utilizando las sondas diseñadas a medida que abarcaban las regiones genómicas víricas y humanas indicadas anteriormente (FIG.
1). Puede producirse una "pérdida de ADN" sustancial en la etapa de captura. La cantidad de ADN tras la reacción de captura del objetivo puede ser inferior a la necesaria para la secuenciación. Por consiguiente, una segunda fase de amplificación (por ejemplo, mediante PCR) puede amplificar la cantidad de ADN para la etapa de secuenciación posterior. Por lo tanto, en algunas realizaciones, tras la captura del objetivo, los productos capturados se enriquecieron mediante 14 ciclos de PCR para generar genotecas. Las genotecas secuenciaron en una plataforma NextSeq (Illumina). Para cada tanda de secuenciación, se secuenciaron de cuatro a seis muestras con códigos de barras de muestra únicos utilizando el modo de ambos extremos. De cada fragmento de ADN, se secuenciaron 75 nucleótidos de cada uno de los dos extremos, pero se pueden secuenciar otras cantidades de nucleótidos.
A. Perfiles de metilación del ADN del VEB plasmático en diferentes afecciones asociadas al VEB
La FIG. 2 muestra las densidades de metilación de sitios CpG en todo el genoma del VEB en pacientes con mononucleosis infecciosa, CNF y linfoma de linfocitos T citolíticos naturales de acuerdo con las realizaciones de la presente divulgación. Los perfiles de metilación del ADN del VEB se generaron mediante la secuenciación con bisulfito de la captura dirigida de fragmentos de ADN del VEB plasmático. El eje horizontal proporciona las coordenadas genómicas en el genoma de referencia del VEB. El eje vertical proporciona la densidad de metilación a una resolución de un único sitio CpG.
Las densidades de mutilación de los sitios CpG en todo el genoma del VEB se obtuvieron con la fórmula descrita anteriormente:
Nosotrospudimos observar diferentes patrones de densidad de metilación del ADN del VEB plasmático entre los distintos sujetos. Estas diferencias en los perfiles de metilación del ADN podrían analizarse a nivel global o en locus específicos. Por ejemplo, a nivel global, observamos un nivel de metilación total inferior en el paciente con mononucleosis infecciosa (TBR1610) (densidad de metilación del 57,3 %) que en los dos pacientes con CNF (TBR1392 y TBR1416) (densidades de metilación del 83,8 % y el 81,3 %). El nivel de metilación global utiliza mediciones de metilación de sitios de todo el genoma para determinar un valor único.
También a un nivel relativamente macroscópico, el paciente con linfoma de linfocitos T citolíticos naturales (TBR1629) mostró una mayor heterogeneidad en los niveles de metilación en todo el genoma del VEB que los dos pacientes con CNF (TBR1392 y TBR1416), por ejemplo, entre las coordenadas genómicas 50000 a 100000. La heterogeneidad se muestra como caídas en el gráfico de densidad de metilación. Las pacientes con CNF tienen una densidad relativamente uniforme, mientras que el paciente con linfoma muestra muchos valles diminutos donde la densidad desciende significativamente, proporcionando de este modo una estructura en forma de peine.
Los patrones de metilación del ADN también podrían analizarse a nivel de locus específico o de región específica. Estos locus pueden ser de cualquier tamaño y de al menos 1 sitio CpG. Estos locus pueden estar asociados o no a algún gen vírico comentado. Dichos niveles de metilación específicos de una región pueden tener valores similares en diferentes sujetos con la misma afección, pero tienen valores diferentes en relación con otros sujetos con una afección diferente.
En la FIG. 2, definimos 4 regiones genómicas, a saber, la región 201 (7000-13000), la región 202 (138000-139000), la región 203 (143000-145000) y la región 204 (169000-170000). Las densidades de metilación específicas de las regiones 201 y 204 fueron mayores en los dos casos de CNF (TBR 1392 y TBR 1416) que en el caso de mononucleosis infecciosa (t Br 1610). La densidad de metilación específica de la región 203 fue, por el contrario, menor en los dos casos de CNF que en el caso de mononucleosis infecciosa. La densidad de metilación del ADN específica de la región 203 fue mayor en el caso del linfoma de linfocitos T citolíticos naturales (TBR 1629) que en los demás casos de CNF y de mononucleosis infecciosa. Dichos resultados demuestran que existen diferentes patrones de perfiles de metilación de los fragmentos de ADN del VEB plasmático a nivel global y de locus específicos en pacientes con diferentes afecciones asociadas al VEB.
Por consiguiente, un bajo nivel de metilación en la región 201 puede indicar que un sujeto padece mononucleosis infecciosa. Un alto nivel de metilación en la región 204 puede indicar que el sujeto padece CNF. Y, un alto nivel de metilación en la región 203 puede indicar que el sujeto padece un linfoma de linfocitos T citolíticos naturales. Los valores específicos del umbral que definen lo que es alto o bajo (o un intervalo intermedio) pueden determinarse para cada región tomando como base mediciones del tipo mostrado en la FIG. 2. Dichas regiones pueden seleccionarse analizando los perfiles de metilación de los sujetos con las diferentes afecciones y eligiendo regiones que tengan unas densidades de metilación diferentes para las diferentes afecciones. Además, pueden combinarse las mediciones de múltiples regiones, por ejemplo, mediante técnicas de agrupamiento o un árbol de decisiones.
B. CNF en estadio temprano
La FIG. 3 muestra los perfiles de metilación del ADN del VEB plasmático en un paciente (AL 038) de nuestra cohorte de cribado con un CNF en estadio temprano (estadio I) y una baja concentración de ADN del VEB plasmático (8 copias/ml de plasma de acuerdo con las mediciones mediante PCR cuantitativa). El ADN plasmático se extrajo de la muestra de sangre inicial. A los sujetos con una prueba inicial (situación inicial) positiva se les repitió la prueba 4 semanas después, y eso se consideró una prueba de seguimiento. Este paciente no presentaba síntomas de CNF en el momento de la extracción de las muestras de sangre, y el cáncer se detectó mediante un cribado utilizando un análisis mediante PCR en tiempo real del ADN del VEB plasmático con un análisis en dos fases. Los sujetos con ADN del VEB plasmático persistentemente positivo mediante PCR en tiempo real se confirmaron además mediante endoscopia nasal y RMN.
La FIG. 3 muestra que la señal es más ruidosa, por ejemplo, algunos sitios tienen una densidad de metilación del 100 % y otros tienen una densidad de metilación muy baja, tal como cero. Para eliminar dicho comportamiento ruidoso, las realizaciones pueden utilizar los niveles de metilación de la región que se miden utilizando la densidad de metilación combinada de todas las lecturas de secuencia en los sitios dentro de la ventana. Por ejemplo, puede utilizarse una ventana de 200 pb, lo que puede reducir el ruido y proporcionar datos más uniformes. Por consiguiente, incluso con una baja concentración de secuencias de ADN del VEB en la muestra, los niveles de metilación pueden medirse y utilizarse para distinguir diferentes afecciones. A continuación se proporcionan más datos que demuestran dicha capacidad para distinguir las afecciones.
En este paciente, la cantidad de fragmentos plasmáticos de ADN del VEB capturados fue comparativamente inferior a la de los otros dos pacientes (TBR1392 y TBR1416) con CNF en estadio avanzado y concentraciones elevadas de ADN del VEB plasmático. Como se mencionó anteriormente, esto ilustra un caso donde el nivel o niveles de metilación pueden seguir utilizándose para identificar una afección concreta, CNF en este caso, aunque la concentración de VEB sea baja. Además, la cantidad de VEB plasmático puede utilizarse como parte de la determinación de un nivel de enfermedad (por ejemplo, un nivel de cáncer).
C. Valores de diferencia en los perfiles de metilación entre pacientes
Una diferencia en los perfiles de metilación puede proporcionar una comparación entre los pacientes con CNF y mononucleosis infecciosa Como se muestra anteriormente en la FIG. 2, existen diferentes patrones de metilación del ADN del VEB plasmático entre los pacientes con diferentes afecciones asociadas al VEB. Analizamos la diferencia en los patrones de metilación comparando las densidades de metilación de los sitios CpG en todo el genoma del VEB entre estos diferentes pacientes.
1. Diferentes afecciones
La FIG. 4 muestra las diferencias en las densidades de metilación de los sitios CpG en todo el genoma del VEB entre dos pacientes con diferentes afecciones de acuerdo con las realizaciones de la presente divulgación. El eje horizontal es la coordenada genómica en el genoma del VEB. El eje vertical muestra la diferencia por sitio en la metilación entre los dos pacientes. La mediana de la diferencia de metilación entre el CNF (TBR1392) y la mononucleosis infecciosa (TBR1610) fue del 23,9 % (IQR (recorrido intercuartílico): 14,8-39,3 %), lo que sugiere que el nivel de metilación del CNF en los sitios CpG del genoma del VEB fue sistemáticamente mayor en el CNF que en la mononucleosis infecciosa. Se observaron unos patrones similares de diferencia de metilación (mediana: 22,9 %; IQR: 13,3-37,8 %) en otra comparación entre el CNF (TBR1416) y la mononucleosis infecciosa (TBR1610).
El diagrama superior muestra las diferencias en las densidades de metilación entre un paciente con CNF (TBR1392) y un paciente con mononucleosis infecciosa (TBR1610). Un valor positivo en un sitio CpG indica una mayor densidad de metilación en el caso TBR1392 que en el caso TBR1610 en ese sitio particular. Un valor negativo indica una menor densidad de metilación en el caso TBR1392 que en el caso TBR1610 en ese sitio CpG.
El diagrama inferior muestra las diferencias en las densidades de metilación entre otro paciente con CNF (TBR1416) y el mismo paciente con mononucleosis infecciosa (TBR1610). Esta presentación gráfica ilustra un ejemplo de análisis y comparación de los patrones de metilación del ADN del VEB plasmático en diferentes afecciones asociadas al VEB.
En general, los pacientes con CNF presentan una metilación más elevada, y las diferencias en la metilación tienen unos valores significativos. Dichas diferencias pueden cuantificarse de varias formas, por ejemplo, sumándolas para obtener un valor de diferencia global. Este valor de diferencia global puede actuar como distancia entre dos sujetos, ya que puede usarse en el agrupamiento, donde cada valor de metilación (por ejemplo, como un índice por sitio o un nivel por región) es un punto de datos en un punto de datos multidimensional.
2. Misma afección
La FIG. 5 muestra las diferencias en las densidades de metilación de los sitios CpG en todo el genoma del VEB entre dos pacientes con el mismo diagnóstico de CNF (TBR1392 y TBR1416) de acuerdo con las realizaciones de la presente divulgación. En general, existen diferencias menores en las densidades de metilación en los genomas completos del VEB, en comparación con análisis anteriores para pacientes con dos enfermedades diferentes (FIG. 4). La mediana de la diferencia de metilación entre dos sujetos con CNF (TBR1392 frente a TBR1416) fue del 0,3 % (IQR: -1,2-2,5 %). Esto sugiere que los pacientes con el mismo diagnóstico de enfermedad asociada al VEB tendrían unos patrones de metilación similares del ADN del VEB plasmático. La diferencia en las densidades de metilación podría tener implicaciones en algunas características de la enfermedad específicas del caso particular y proporcionar información adicional de diagnóstico o de pronóstico.
3. CNF y falsos positivos
La FIG. 6 muestra las diferencias en los patrones de metilación del ADN del VEB plasmático entre un paciente con CNF en estadio temprano (AO050) y un sujeto con resultado falso positivo de ADN del VEB plasmático (HB002) de acuerdo con las realizaciones de la presente divulgación. Esta comparación muestra los patrones de metilación del ADN del VEB plasmático entre un paciente con CNF en estadio temprano y un sujeto sin CNF, pero que fue persistentemente positivo para el ADN del VEB plasmático en pruebas seriadas. Ambos pertenecían a nuestra cohorte de cribado. El ADN plasmático se extrajo de sus muestras de sangre iniciales en el momento de la selección.
Como se muestra en la FIG. 6, existen diferencias en los patrones de metilación del ADN del VEB plasmático entre la paciente con un CNF en estadio temprano (AO050) y el sujeto con un resultado falso positivo del ADN del VEB plasmático (HB002). Pero, el número y el tamaño de las diferencias es menor que en los gráficos de la FIG. 4, entre un sujeto con CNF y un sujeto con MI. Por lo tanto, el hecho de que existan diferencias entre el sujeto con CNF y el sujeto falso positivo indica una capacidad para aumentar la precisión del cribado del cáncer. Y, el hecho de que las diferencias sean de una escala diferente a la del sujeto con MI indica cualquier capacidad para distinguir a los sujetos que presentan cualquiera de las tres afecciones. Tomando como base esta observación, exploramos la utilidad diagnóstica para diferenciar los dos grupos (sujetos con CNF en estadio temprano y resultados falsos positivos) utilizando los patrones de metilación del ADN del VEB plasmático, para los que se proporcionan datos en una sección posterior.
D. Correlación entre las densidades de metilación de pacientes similares y diferentes
Además de analizar los valores de diferencia entre las densidades de metilación en diferentes sitios, las densidades de metilación pueden representarse gráficamente juntas para identificar una correlación o la falta de ella. Por ejemplo, cada punto de datos de un gráfico bidimensional puede incluir las dos densidades de metilación de dos sujetos en un mismo sitio. Si las densidades de metilación están correlacionadas (por ejemplo, los dos sujetos tienen la misma afección, entonces el gráfico presentará un comportamiento lineal. Si las densidades de metilación no están correlacionadas (por ejemplo, los dos sujetos tienen la misma afección), entonces el gráfico no mostrará un comportamiento lineal.
Las FIGS. 7A-7C ilustran las diferencias en los perfiles de metilación del ADN del VEB plasmático entre dos casos clínicos. En las FIG. 7A-7C, cada punto de datos de los tres gráficos representa la densidad de metilación de un sitio CpG en todo el genoma del VEB en un paciente (en el eje x) y la densidad de metilación correspondiente del mismo sitio CpG en el otro paciente (en el eje y).
Las FIG. 7A y 7B muestran las densidades de metilación entre dos pacientes de enfermedades diferentes (una CNF y una mononucleosis infecciosa). Como puede verse, las densidades de metilación no están correlacionadas. Los sujetos con CNF presentan, coherentemente, una densidad de metilación elevada (por ejemplo, superior al 80 %) que no coincide con la del sujeto con MI, provocando así una banda horizontal a lo largo de la parte superior. Dicho comportamiento indica que los dos sujetos son diferentes, por ejemplo, diferentes afecciones. Las diferentes afecciones pueden incluir uno con enfermedad y otro sin enfermedad.
La FIG. 7C muestra las densidades de metilación entre dos pacientes diferentes con CNF. En la FIG. 7C, podemos observar una línea de tendencia diagonal (cuya pendiente es aproximadamente igual a 1), lo que sugiere que la densidad de metilación de cada sitio CpG es similar entre dos pacientes diferentes con CNF. Este patrón gráfico no se observa en las FIG. 7A y 7B. Estos resultados sugieren de nuevo que los pacientes con diferentes enfermedades asociadas al VEB tienen diferentes perfiles de metilación de los fragmentos de ADN del VEB plasmático. Las realizaciones pueden utilizar esas diferentes propiedades de metilación de los sitios (o de regiones de sitios) para identificar los sitios/regiones que tienen diferentes densidades de metilación entre las diferentes afecciones, y utilizar esos sitios/regiones para determinar un(os) nivel(es) de metilación para discriminar entre las afecciones.
IV. DISCRIMINACIÓN ENTRE AFECCIONES ASOCIADAS AL VEB MEDIANTE PATRONES DE METILACIÓN DEL ADN DEL VEB PLASMÁTICO
Para una comparación sistemática de los perfiles de metilación del ADN del VEB plasmático en diferentes afecciones asociadas al VEB, utilizamos un "porcentaje de metilación" (un ejemplo de un tipo de "densidad de metilación"), para cada caso. El porcentaje de metilación de los fragmentos de ADN del VEB plasmático puede obtenerse mediante la ecuación:
Metilaciónen % = -M-r-+--U--r
dondeM'es el recuento de lecturas metiladas yU'es el recuento de lecturas no metiladas en uno o más sitios CpG, que se pueden seleccionar previamente. El porcentaje de metilación puede calcularse tomando como base todos los sitios CpG o en algunos sitios CpG dentro del genoma del VEB cubiertos por nuestras sondas de captura. También se pueden utilizar otros ejemplos de niveles de metilación.
A. Nivel de metilación total en todo el genoma
Como ejemplo, se puede determinar un único nivel de metilación en todo el genoma del VEB. Puede utilizarse el número total de moléculas de ADN del VEB metiladas en un conjunto específico de sitios CpG para determinar el porcentaje de metilación como nivel de metilación en todo el genoma, con una normalización por una cantidad medida que incluye otras moléculas de ADN, por ejemplo, como medida de volumen, una intensidad correspondiente a las otras moléculas de ADN o un recuento de las otras moléculas de ADN. En una realización, calculamos el porcentaje de metilación de las moléculas de ADN del VEB plasmático tomando como base los sitios CpG dentro del genoma del VEB cubiertos por nuestras sondas de captura.
La FIG. 8 muestra los porcentajes de metilación del ADN del VEB plasmático tomando como base todos los sitios CpG cubiertos en sujetos con mononucleosis infecciosa (MI) (número de pacientes n = 2), Linfoma asociado al VEB (n = 3), ADN del VEB plasmático transitoriamente positivo (n = 3), ADN del VEB plasmático persistentemente positivo (n = 3) y CNF (n = 6) de acuerdo con las realizaciones de la presente divulgación. La FIG. 8 muestra diagramas de cajas y bigotes para las cinco diferentes afecciones. Como puede verse, los valores medianos están suficientemente separados para discriminar entre las diferentes afecciones. Por ejemplo, un nivel de referencia de aproximadamente el 79 % puede discriminar entre los pacientes que son persistentemente positivos para el VEB y los que tienen CNF.
Globalmente, pudimos diferenciar entre distintas enfermedades/afecciones asociadas al VEB mediante el análisis del porcentaje de metilación total del genoma del ADN del VEB plasmático (valor dep= 8,52e-05, análisis unifactorial de la varianza). Cuatro de los seis pacientes con CNF pertenecían a la cohorte de cribado y presentaban un CNF en estadio temprano (estadio I o II). Por lo tanto, incluso en los primeros estadios de una afección pueden discriminarse de los sujetos que no padecen la afección (por ejemplo, incluso los sujetos persistentemente positivos). Se pueden utilizar diferentes niveles de referencia para discriminar entre diferentes afecciones, por ejemplo, inferior a aproximadamente el 57 % puede utilizarse para identificar la MI, y entre el 57 % y el 63 % puede utilizarse para identificar sujetos transitoriamente positivos. En algunas realizaciones, se puede identificar más de una afección de un conjunto mayor de afecciones para un nivel de metilación dado (por ejemplo, el linfoma y el transitoriamente positivo podrían identificarse en el intervalo del 57 % al 63 %). En dicha situación, se puede asignar una probabilidad a cada una de las afecciones. Por ejemplo, la metilación de un sujeto analizado puede compararse con la de dos grupos de sujetos de referencia, un grupo padece la afección A (por ejemplo, linfoma) y el otro padece la afección B (por ejemplo, mononucleosis infecciosa). Se puede determinar el número de desviaciones estándar de las medias de los dos grupos de sujetos de referencia. Tomando como base el número de desviaciones estándar, se pueden calcular las probabilidades de padecer las dos afecciones. Estas probabilidades pueden utilizarse para determinar la probabilidad relativa de padecer estas dos afecciones.
El valor o valores de referencia específicos seleccionados pueden depender de la forma específica en que se determine el nivel de metilación. Por ejemplo, un porcentaje de metilación tendría niveles de referencia diferentes si se divide el número de moléculas de ADN metiladas M (por ejemplo, según se determine utilizando un número de lecturas o una intensidad) por el número de moléculas de ADN no metiladas U (por ejemplo, según se determine utilizando un número de lecturas o una intensidad), por ejemplo, M/U. Otros factores de escala o factores aditivos modificarían los valores de referencia particulares. Siempre que el nivel de metilación de una muestra actual se determine de la misma manera que los niveles de metilación de las muestras de referencia, entonces serán aplicables los niveles de referencia seleccionados. Los niveles de referencia también pueden depender de los sitios seleccionados para medir el nivel de metilación, como se muestra en resultados posteriores.
La capacidad de discriminar entre diferentes afecciones utilizando un nivel de metilación puede depender del número de moléculas de ADN detectadas en los sitios, pero los resultados presentados en el presente documento muestran que el número de moléculas de ADN del VEB puede ser relativamente bajo. Por ejemplo, en la FIG. 8, el percentil 5 de las moléculas de ADN del VEB plasmático analizadas en los distintos sujetos es 44, siendo el mínimo de 26. En varias realizaciones, el número de moléculas de ADN vírico acelular puede incluir al menos 10 moléculas de ADN acelular, por ejemplo, 20, 30, 40, 50, 100 o 500). En otras realizaciones, el número total de moléculas de ADN acelulares analizadas para el sujeto y el genoma vírico particular puede ser de al menos 1000 moléculas de ADN acelulares o más (por ejemplo, al menos 10000, al menos 100000 o al menos 1000000).
B. Regiones metiladas diferencialmente (DMR)
En lugar de utilizar todos los sitios cubiertos por las sondas de captura, únicamente pueden utilizarse ciertos sitios. Estos sitios pueden determinarse analizando todos los sitios y seleccionando a continuación los que tengan unas propiedades determinadas, por ejemplo, los que tengan diferentes niveles de metilación entre ciertas afecciones. Los sitios pueden analizarse individual o colectivamente por regiones, por ejemplo, se puede asignar más de un sitio a una región y determinar un nivel de metilación para esa región. Los sitios y regiones pueden ser de todo el genoma si se abarca todo el genoma vírico, por ejemplo, no se limita a un solo sitio/región. Por ejemplo, se puede utilizar al menos un sitio/región por cada 1 kb, 2 kb, 5 kb o 10 kb.
Por consiguiente, algunas realizaciones pueden calcular los porcentajes de metilación tomando como base los sitios CpG dentro de las regiones metiladas diferencialmente (DMR). Hemos demostrado anteriormente que los patrones de metilación del ADN del VEB plasmático son diferentes en las distintas enfermedades asociadas al VEB. Por consiguiente, deben existir DMR dentro de los cuales los niveles de metilación sean diferentes entre las distintas enfermedades/afecciones. Además de utilizar sitios individuales, se pueden utilizar ventanas no superpuestas de diferentes tamaños. Por ejemplo, los tamaños de las regiones no superpuestas podrían fijarse en, pero sin limitación, 50 pb, 100 pb, 200 pb, 300 pb, 400 pb, 500 pb, 600 pb, 800 pb y 1000 pb. En otro ejemplo, cada sitio CpG puede analizarse por separado, por ejemplo, sin el uso de regiones que combinan sitios.
Las DMR pueden seleccionarse para que tengan unos niveles de metilación particulares en sujetos con diferentes afecciones. Por ejemplo, la DMR podría definirse si los porcentajes de metilación de los sitios CpG dentro de la región son inferiores al 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 % o 90 % en uno o más casos de una enfermedad/afección, y superiores al 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 % o 90 % en un caso de otra enfermedad/afección. En otra realización más, se puede utilizar más de un caso por enfermedad para definir la DMR.
Y, se pueden utilizar criterios de corte para más de dos enfermedades/afecciones, por ejemplo, diferentes intervalos de niveles de metilación para cada una de las afecciones.
1. DMR que utilizan MI<50 % y CNF>80 %
Para demostrar la prospección de dichas DMR, seleccionamos al azar a un paciente con mononucleosis infecciosa (TBR1610) y otro con CNF (TBR1392). Aquí, establecimos en primer lugar ventanas no superpuestas de 500 pares de bases (pb) de tamaño en todo el genoma del VEB, por ejemplo, grupos de posiciones 1-500, 501-1000, etc. Dentro de las regiones de 500 pb, calculamos los porcentajes medios de metilación de todos los sitios CpG dentro de la región en el paciente con MI (TBR1610) y con CNF (TBR1392). En este ejemplo, la región de 500 pb cumpliría unos primeros criterios de selección para la DMR si los porcentajes medios de metilación de todos los sitios CpG dentro de la región son inferiores al 50 % en el caso de la mononucleosis infecciosa (TBR1610) y superiores al 80 % en el caso del CNF (TBR1392).
La FIG. 9 ilustra la prospección de regiones metiladas diferencialmente (DMR) que cumplen los primeros criterios de selección de acuerdo con las realizaciones de la presente divulgación. La FIG. 9 corresponde a los dos casos mostrados en la FIG. 7A. Cada punto de datos de la FIG. 9 representa el porcentaje de metilación de una región de 500 pb en todo el genoma del VEB en el sujeto con MI (en el eje x) y el porcentaje de metilación correspondiente de la misma región de 500 pb en el sujeto con CNF (en el eje y). Con estos primeros criterios de selección definidos anteriormente, identificamos un total de 39 DMR que comprendían 821 sitios CpG (aproximadamente el 10 % del total de sitios CpG dentro del genoma del VEB capturados con nuestras sondas). Estas 39 DMR son las que se encuentran en la esquina superior izquierda de la FIG. 9.
En la FIG. 9, el porcentaje de metilación para el sujeto con CNF se muestra en el eje vertical, y el porcentaje de metilación para el sujeto con MI se muestra en el eje horizontal. La línea vertical 901 muestra el valor de corte del 50 % para el porcentaje de metilación en el caso de la MI. La línea horizontal 902 muestra el valor de corte del 80 % en el caso del CNF. Por lo tanto, las regiones de la parte superior izquierda (marcadas generalmente como 910) corresponden a las DMR de este ejemplo.
La FIG. 10 es una tabla que indica las coordenadas genómicas de las 39 regiones metiladas diferencialmente que cumplen los criterios descritos en la FIG. 9. La columna 1001 indica el genoma vírico, que es el VEB para este ejemplo. La columna 1002 proporciona la coordenada genómica inicial en el genoma de referencia del VEB. La columna 1003 proporciona la coordenada genómica final en el genoma de referencia del VEB. Columna 1004 la densidad de metilación en el sujeto con MI y en el sujeto con CNF.
Estas DMR pueden utilizarse a continuación para determinar el nivel o niveles de metilación en otros sujetos. En una realización, el estado de metilación de cada lectura de secuencia que cubre un sitio en uno de este conjunto de DMR se utiliza para determinar un porcentaje de metilación que corresponde al conjunto de DMR. Este porcentaje de metilación puede determinarse de una forma similar a la de la FIG. 8, pero se utiliza un subconjunto de lecturas de secuencia, a saber, aquellas correspondientes a los sitios en el conjunto de DMR. En otras realizaciones, se pueden determinar los niveles individuales de metilación para cada una de las DMR. Los niveles de metilación de un sujeto pueden formar un punto de datos multidimensional, por ejemplo, donde las técnicas de agrupamiento o los planos de referencia (hiperplanos en el espacio multidimensional) pueden separar a los sujetos con diferentes afecciones o diferentes clasificaciones/niveles de una afección. Pueden utilizarse otros métodos analíticos para diferenciar estas afecciones, por ejemplo, pero sin limitación, Naive Bayes, bosque aleatorio, árbol de decisiones, máquinas de vectores de apoyo, k vecinos más cercanos, agrupamiento K-means, modelo mixto gausiano (GMM), agrupamiento espacial basado en densidad, agrupamiento jerárquico, clasificadores de regresión logística y otros métodos de clasificación o de regresión supervisados y no supervisados.
La FIG. 11 muestra los porcentajes de metilación del ADN del VEB plasmático tomando como base los 821 sitios CpG dentro de las 39 DMR definidas anteriormente (FIG. 8) en el mismo grupo de sujetos con mononucleosis infecciosa (MI) (n = 2), linfoma asociado al VEB (n = 3), ADN del Ve B plasmático transitoriamente positivo (n = 3), ADN del VEB plasmático persistentemente positivo(n = 3) y CNF (n = 6) de acuerdo con las realizaciones de la presente divulgación. Estos son los mismos sujetos utilizados en la FIG. 8. Los porcentajes de metilación se determinan como un valor único utilizando lecturas de secuencia que corresponden (por ejemplo, se alinean) a los 821 sitios en el conjunto de 39 DMR.
La FIG. 11 muestra diagramas de cajas y bigotes para las cinco diferentes afecciones. Como puede verse, los valores medianos pueden discriminar entre las distintas afecciones. Por ejemplo, un nivel de referencia de aproximadamente el 75 % puede discriminar entre los pacientes que son persistentemente positivos para el VEB y los que tienen CNF. Pudimos observar una diferencia estadísticamente significativa en los porcentajes de metilación entre los diferentes grupos (valor dep= 1,83e-05, análisis unifactorial de la varianza), que es mejor que la FIG. 8.
La FIG. 11 tiene algunas diferencias con respecto a la FIG. 8. Por ejemplo, la dispersión de los valores para la MI y el CNF son menores, resultante de que las DMR se seleccionen específicamente para que estén en un intervalo particular para esos sujetos. Dicho resultado indica que los criterios de diferentes intervalos de niveles de metilación indicativos de diferentes afecciones pueden proporcionar técnicas más selectivas que discriminen entre diferentes clasificaciones de sujetos. Adicionalmente, la diferencia entre los sujetos con CNF y los persistentemente positivos es mayor que en la FIG. 8.
2. DMR que utilizan MI<80 % y CNF>90 %
Como en la sección anterior, realizamos un análisis para el uso de los porcentajes de metilación tomando como base regiones metiladas diferenciadas para distinguir a los pacientes con c Nf precoz de los sujetos sin CNF con ADN del VEB plasmático detectable. Todos los pacientes con CNF y los sujetos sin CNF analizados se identificaron mediante una cohorte de cribado prospectiva (Chanet al.N Engl J Med 2017; 377: 513-522). Para prospectar las DMR, seleccionamos al azar a dos pacientes con CNF (TBR1416 y FD089) y a un paciente con mononucleosis infecciosa (TBR1748). En otra realización más, podría utilizarse otra enfermedad o afección asociada al VEB, incluyendo un sujeto sin VEB con ADN del VEB plasmático detectable, para la prospección de las DMR. Establecimos ventanas no superpuestas de 500 pares de bases (pb) de tamaño en todo el genoma del VEB.
La FIG. 12 ilustra la prospección de regiones metiladas diferencialmente (DMR) que cumplen el segundo criterio de selección de acuerdo con las realizaciones de la presente divulgación. Al contrario que en la sección anterior, hemos incluido más de un caso por enfermedad (CNF en este análisis) para la prospección de las DMR. Los segundos criterios de selección corresponden a: (1) ventana contigua no superpuesta de 500 pb de tamaño, y (2) porcentajes de metilación de los sitios CpG dentro de la región inferiores al 80 % en el caso seleccionado de mononucleosis infecciosa (TBR1748) y superiores al 90 % en ambos casos de carcinoma nasofaríngeo (TBR1416 y FD089). Cada punto de datos de la FIG. 12 representa el porcentaje medio de metilación de todos los sitios CpG dentro de las regiones de 500 pb en todo el genoma del VEB en el sujeto con MI (en el eje x) y el correspondiente porcentaje medio de metilación de la misma región en los dos sujetos con CNF (en el eje y).
En la FIG. 12, el porcentaje de metilación para el sujeto con CNF se muestra en el eje vertical, y el porcentaje de metilación para el sujeto con MI se muestra en el eje horizontal. La línea vertical 1201 muestra el valor de corte del 80 % para el porcentaje de metilación en el caso de la MI. La línea horizontal 902 muestra el valor de corte del 90 % en el caso del CNF. Con estos segundos criterios de selección definidos anteriormente, identificamos un total de 46 DMR que comprendían 1520 sitios CpG (aproximadamente el 20 % del total de sitios CpG dentro del genoma del VEB capturados con nuestras sondas). Las 46 DMR se muestran en la sección superior izquierda (marcada generalmente como región 1210).
La FIG. 13 muestra los porcentajes de metilación del ADN del VEB plasmático tomando como base las 46 DMR definidas en la FIG. 12 en los sujetos sin CNF con ADN del VEB plasmático transitoriamente positivo, sujetos sin CNF con ADN del VEB plasmático persistentemente positivo, y pacientes con CNF de acuerdo con las realizaciones de la presente divulgación. Cada punto de datos corresponde a un sujeto diferente. Las clasificaciones de transitoriamente positivo y persistentemente positivo se determinan como se ha descrito anteriormente, es decir, tomando como base el número de lecturas de ADN del VEB tomadas de las muestras en dos momentos.
Analizamos 117 sujetos sin CNF con ADN del VEB plasmático transitoriamente positivo, 39 sujetos sin CNF con ADN del VEB plasmático persistentemente positivo y 30 pacientes con CNF mediante secuenciación con bisulfito dirigida. Todos los sujetos sin CNF y los pacientes con CNF fueron seleccionados de la cohorte de cribado prospectiva. Comparamos los porcentajes de metilación del ADN del VEB plasmático tomando como base las DMR definidas anteriormente (FIG. 12) entre los tres grupos. Los porcentajes de metilación se determinan como un valor único utilizando lecturas de secuencia que corresponden (por ejemplo, se alinean) a los 1.520 sitios en el conjunto de 46 DMR.
En una realización, se podría asignar una ponderación diferente a las distintas DMR para el cálculo del porcentaje de metilación total. Dichas ponderaciones pueden implementarse de diferentes maneras, por ejemplo, un factor de escala para cada lectura de secuencia metilada en un sitio (por ejemplo, multiplicando por un factor mayor que 1 cuando una región debe ponderarse más) o puede aplicarse un factor de escala a los porcentajes de metilación de la región, proporcionando de este modo una media ponderada de los porcentajes de metilación de la región. En este ejemplo, aplicamos la misma ponderación para todas las DMR definidas.
El porcentaje medio de metilación del ADN del VEB plasmático tomando como base las 46 DMR para el grupo con CNF (media = 88,3 %) fue significativamente superior a los porcentajes medios de metilación de los otros dos grupos sin CNF con ADN del VEB plasmático transitoriamente positivo (media = 65,3 %) y persistentemente positivo (media = 71,1 %) (p < 0,0001, prueba de Kruskal-Wallis). Por consiguiente, los pacientes con CNF podrían diferenciarse de los sujetos sin CNF con ADN del VEB plasmático detectable (transitoria o persistentemente positivo) tomando como base la diferencia en los perfiles de metilación del ADN del VEB plasmático (por ejemplo, según los porcentajes de metilación del ADN del VEB plasmático tomando como base las DMR).
En este ejemplo y en otras realizaciones descritas en el presente documento, los niveles de referencia para discriminar entre clasificaciones pueden determinarse de varias maneras. En una realización, el valor de corte (nivel de referencia) utilizado para discriminar entre un sujeto que tiene CNF y uno que no tiene CNF puede ser el valor más bajo en los porcentajes de metilación del ADN del VEB entre los pacientes con CNF analizados (conjunto de entrenamiento). En otras realizaciones, los valores de corte pueden determinarse, por ejemplo, como los porcentajes medios de metilación del ADN del VEB de los pacientes con CNF menos una desviación estándar (DE), media menos dos DE, media menos tres DE. En otras realizaciones más, el valor de corte puede determinarse mediante curvas de eficacia diagnóstica (ROC) o mediante métodos no paramétricos, por ejemplo, pero sin limitación, incluyendo el 100 %, 95 %, 90 %, 85 %, 80 % de los pacientes con CNF analizados.
En el ejemplo actual, puede fijarse un valor de corte del 80 % en el porcentaje de metilación para lograr una sensibilidad superior al 95 % en la detección del CNF. Utilizando este valor de corte del 80 %, 29 de los 30 pacientes con CNF, 16 de 119 sujetos sin CNF con ADN del VEB plasmático transitoriamente positivo, y 6 de 39 sujetos sin CNF con ADN del VEB plasmático persistentemente positivo tenían sus porcentajes de metilación del a Dn del VEB plasmático determinados dentro de las 46 DMR definidas mediante secuenciación con bisulfito dirigida, superiores al valor de corte (80 %). La sensibilidad, la especificidad y el valor predictivo positivo calculados fueron del 96,7 %, 85,9 % y 58,5 %, respectivamente.
C. Regiones consenso de metilación representativas de la misma afección
En los siguientes ejemplos, nos propusimos identificar las regiones que tienen unas densidades de metilación similares en todos los sujetos con una misma afección. Definimos dichas regiones como regiones consenso de metilación representativas de una afección. En algunas implementaciones, dichos criterios también pueden combinarse con criterios de metilación diferencial entre afecciones.
Para demostrar la identificación de regiones consenso de metilación "representativas", seleccionamos al azar a dos pacientes con CNF (TBR1392 y TBR1416). Aquí, dividimos el genoma del VEB en regiones no superpuestas de 500 pb. En otras realizaciones, se pueden establecer diferentes tamaños de regiones superpuestas. Como ejemplos, los tamaños de las regiones superpuestas podrían fijarse en 50 pb, 100 pb, 200 pb, 300 pb, 400 pb, 600 pb, 800 pb y 1000 pb. Dentro de las regiones de 500 pb, calculamos los porcentajes medios de metilación de todos los sitios CpG dentro de la región en los dos pacientes con CNF (TBR1392 y TBR1416).
La FIG. 14 ilustra la prospección de regiones consenso de metilación representativas que cumplen los terceros criterios de selección de acuerdo con las realizaciones de la presente divulgación. Los terceros criterios de selección corresponden a: (1) ventana contigua no superpuesta de 500 pb de tamaño, (2) diferencias en la densidad de metilación global de la región inferiores al 1 % entre los dos casos de CNF, y (3) densidad de metilación global de la región superior al 80 % para ambos casos.
En otras realizaciones, la región consenso de metilación "representativa" podría definirse si las diferencias en los porcentajes de metilación entre los dos pacientes con CNF son inferiores al 2 %, 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 9 % o 10 % entre los dos casos de CNF, y los porcentajes de metilación son superiores al 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 % o 90 %. Se pueden utilizar más de dos sujetos por enfermedad para definir las regiones consenso de metilación "representativas", por ejemplo, si los porcentajes de metilación de cada uno de los sujetos se encuentran dentro del valor de corte de similitud especificado (por ejemplo, 1 %) y dentro de un intervalo especificado para el porcentaje de metilación (por ejemplo, superior al 80 %).
Cada punto de datos de la FIG. 14 representa el porcentaje de metilación de una región de 500 pb de todo el genoma del VEB en un sujeto con CNF (en el eje x) y el correspondiente porcentaje de metilación de la misma región en el otro sujeto con CNF (en el eje y). Con los criterios de selección definidos anteriormente, hemos identificado 79 regiones. Estas 79 DMR pueden encontrarse en la región 1410 de la FIG. 14.
En la FIG. 14, el porcentaje de metilación para el primer sujeto con CNF se muestra en el eje vertical, y el porcentaje de metilación para el segundo sujeto con CNF se muestra en el eje horizontal. La línea vertical 1401 muestra el valor de corte del 80 % para el porcentaje de metilación en el caso de la MI. La línea horizontal 1402 muestra el valor de corte del 80 % en el caso del CNF. Por lo tanto, las regiones de la parte superior derecha (marcadas generalmente como región 1410) corresponden a las DMR de este ejemplo.
La FIG. 15 muestra las densidades de metilación del ADN del VEB plasmático tomando como base las regiones consenso de metilación "representativas" definidas anteriormente (FIG. 12) en el mismo grupo de sujetos con mononucleosis infecciosa (MI) (n = 2), Linfoma asociado al VEB (n = 3), ADN del VEB plasmático transitoriamente positivo (n = 3), ADN del VEB plasmático persistentemente positivo (n = 3) y CNF (n = 6) de acuerdo con las realizaciones de la presente divulgación. Pudimos observar una diferencia estadísticamente significativa en los porcentajes de metilación entre los grupos (valor dep= 0,00371, análisis unifactorial de la varianza). Tomando como base estos datos, se puede determinar el estado de una muestra analizada analizando las densidades de metilación del ADN plasmático para las regiones consenso de metilación representativas. Por ejemplo, una densidad de metilación del 90 % indicaría que la muestra procede de un paciente con CNF, mientras que una densidad de metilación del 80 % sugiere que la muestra procede de un paciente con linfoma positivo para el VEB.
D. Análisis de sitio CpG único
Además de calcular un nivel de mutilación total tomando como base un conjunto de sitios (por ejemplo, como se describe en las secciones anteriores), las realizaciones pueden calcular el porcentaje de metilación tomando como base sitios CpG individuales dentro del genoma del VEB. Para identificar sitios CpG individuales con niveles diferenciales de metilación en distintas enfermedades asociadas al VEB, agrupamos los datos de secuenciación de las lecturas de ADN plasmático de 3 sujetos con ADN del VEB persistentemente positivo, pero sin CNF, dando una profundidad de secuenciación de 7x. A continuación, comparamos los porcentajes de metilación de todos los sitios CpG entre los datos de secuenciación agrupados de 3 sujetos con ADN del VEB persistentemente positivo y 3 pacientes con CNF (AO050, TBR1392 y TBR1416). El agrupamiento de los datos de secuenciación significa que el porcentaje de metilación se determinó como si todas las lecturas de secuencia procedieran de un mismo sujeto.
En varias realizaciones, estos sitios CpG individuales con niveles de metilación diferenciales podrían definirse si los porcentajes de metilación de los sitios CpG fueran inferiores al 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 % o 90 % en un caso (sujeto) de una enfermedad, y superiores al 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 % o 90 % en un caso de otra enfermedad. Los criterios pueden aplicarse a más de un caso por enfermedad para definir la DMR, por ejemplo, como se ha descrito anteriormente para los ejemplos que utilizan regiones, como puede hacerse con diferentes intervalos para diferentes afecciones, así como separaciones específicas entre sujetos con una afección diferente (mayor que) o igual (dentro de un umbral).
El apéndice A muestra la lista de sitios CpG individuales en todo el genoma del VEB con niveles de metilación diferenciales, cuando las diferencias en los porcentajes de metilación en todos estos sitios CpG entre los datos de secuenciación agrupados de 3 sujetos con ADN del VEB persistentemente positivo y los de 3 pacientes con CNF son superiores al 20 %. Los sitios marcados con * tienen una diferencia superior al 40 %, ** tienen una diferencia superior al 60 % y *** tienen una diferencia superior al 80 %. En otras realizaciones, los sitios CpG con niveles de metilación diferenciales podrían definirse con una diferencia en los porcentajes de metilación superior al 20 %, 30 %, 50 %, 70 % o 90 %. Ahora se analizan algunos sitios ilustrativos con una diferencia superior al 60 %.
La FIG. 16 muestra ejemplos de sitios CpG con los porcentajes de metilación sobre los sitios superiores al 80 % en los datos de secuenciación agrupados de los 3 casos con a Dn del VEB plasmático persistentemente positivo y una media inferior al 20 % en los 3 sujetos con CNF de acuerdo con las realizaciones de la presente divulgación. También se incluyeron los porcentajes de metilación en estos sitios de dos pacientes con mononucleosis infecciosa. Los porcentajes de metilación se proporcionan en el eje vertical, y el eje horizontal indica 8 sitios individuales que satisfacen los criterios. Los sitios están etiquetados con números secuenciales.
Como puede verse, todos los sitios proporcionan una buena separación entre los sujetos sin CNF (incluidos los persistentemente positivos y los MI) y dos de los sujetos con CNF (TBR1416 y TBR1392). Para el sujeto con CNF AO050, los sitios 1-4, 7 y 8 proporcionan una buena separación, pero los sitios 5 y 6 no. Por lo tanto, los sitios individuales metilados diferencialmente (por ejemplo, no sólo como una región) determinados para discriminar entre dos afecciones también pueden utilizarse para discriminar entre una afección (CNF) y dos o más afecciones.
La FIG. 17 muestra ejemplos de sitios CpG con los porcentajes de metilación sobre los sitios inferiores al 20 % en los datos de secuenciación agrupados de los 3 casos con ADN del VEB plasmático persistentemente positivo y superiores al 80 % en los 3 sujetos con CNF de acuerdo con las realizaciones de la presente divulgación. También se muestran los porcentajes de metilación en estos sitios de dos pacientes con mononucleosis infecciosa. Estos criterios son opuestos a los utilizados para la FIG. 16. Los porcentajes de metilación se proporcionan en el eje vertical, y el eje horizontal indica 22 sitios individuales que satisfacen los criterios. Los sitios están etiquetados con números secuenciales.
Como puede verse, todos los sitios proporcionan una buena separación entre los sujetos sin CNF (incluyendo los persistentemente positivos y los MI) y los sujetos con CNF. Esto demuestra que los sitios individuales pueden utilizarse para discriminar entre clasificaciones. Y, los sitios pueden seleccionarse de todo el genoma vírico, en lugar de estar dentro de una misma región contigua de una longitud específica. Se pueden seleccionar más sitios para obtener una mayor precisión estadística, por ejemplo, para que se puedan detectar más fragmentos de ADN del VEB.
En una realización, se eligen múltiples sitios CpG con niveles de metilación diferenciales (por ejemplo, los definidos en el Apéndice A y en las FIGS. 16 y 17) para que se encuentren a una distancia específica entre sí. De esta manera, los fragmentos individuales de ADN vírico pueden cubrir cada uno de los múltiples sitios. Por ejemplo, la distancia específica puede ser de 150 pb porque éste es aproximadamente el tamaño representativo de una molécula de ADN plasmático. En dicha situación, sería posible la amplificación dirigida de la región particular con múltiples sitios CpG metilados diferencialmente mediante una amplificación por PCR. Este análisis dirigido tendría un coste inferior al de utilizar el enfoque de análisis de todo el genoma.
Por consiguiente, en varias realizaciones, el análisis del patrón de metilación puede basarse en las regiones genómicas de todo el genoma vírico o en sitios CpG individuales. En dicho análisis de la región, el genoma vírico puede dividirse en diferentes regiones tomando como base las coordenadas genómicas, incluyendo cada región todos los sitios CpG dentro de dicha región. Alternativamente, se pueden seleccionar en primer lugar los sitios CpG metilados diferencialmente, y fusionarlos a continuación dentro de una región para formar una DMR. En otro ejemplo, pueden incluirse todos los sitios CpG en el cálculo de la densidad de mutilación de la región sin una selección previa de los informativos.
E. Análisis de agrupamiento jerárquico
Algunas realizaciones pueden utilizar algo más que el nivel de metilación para discriminar entre clasificaciones. En un ejemplo, pueden utilizarse técnicas de agrupamiento. En dichas técnicas de agrupamiento, se pueden determinar múltiples niveles de metilación para cada sujeto, por ejemplo, niveles de metilación para diferentes regiones (incluyendo cada una uno o más sitios), niveles de metilación para sitios individuales, o combinaciones de los mismos. En algunas realizaciones, el agrupamiento puede ser jerárquico.
El conjunto de niveles de metilación puede formar un vector que represente un punto de datos multidimensional que tenga una longitud igual al número de niveles de metilación. Las regiones (grupos) pueden ser de varios tamaños, como se describe en el presente documento. Y, el análisis de agrupamiento se puede basar en grupos contiguos no superpuestos de diferentes tamaños. Como ejemplos, el tamaño de los grupos podría definirse en 50 pb, 100 pb, 200 pb, 300 pb, 400 pb, 500 pb, 600 pb, 700 pb, 800 pb, 900 pb o 1000 pb. Por consiguiente, el análisis de agrupamiento se puede basar en comparaciones de los niveles de metilación para diferentes sitios/grupos con los correspondientes niveles de metilación entre los diferentes sujetos.
La FIG. 18 muestra un dendrograma de conglomerados con el análisis jerárquico de conglomerados basado en el análisis del patrón de metilación del ADN del VEB plasmático para 6 pacientes con CNF (incluyendo 4 pacientes con enfermedad en estadio temprano de nuestra cohorte de cribado), 2 pacientes con linfoma extraganglionar de linfocitos T citolíticos naturales y 2 pacientes con mononucleosis infecciosa de acuerdo con las realizaciones de la presente divulgación. En este ejemplo, el análisis de agrupamiento jerárquico se basó en la comparación de los porcentajes de metilación de los sitios CpG dentro de regiones contiguas no superpuestas de 500 pb de tamaño. El agrupamiento agrupa los diferentes sujetos tomando como base las diferencias en los porcentajes de metilación para las diferentes regiones, donde las diferencias pueden combinarse para proporcionar una distancia.
En la FIG. 18, la distancia se muestra a lo largo del eje horizontal superior. La distancia puede determinarse como la suma de las diferencias entre cada una de las densidades de metilación (porcentajes), por ejemplo, cuando las densidades de metilación en diferentes locus corresponden a un vector que representa un punto multidimensional, donde la distancia es entre dos puntos multidimensionales. Dos sujetos se combinan en un punto igual a la distancia entre ellos. Cuando se analiza un nuevo paciente, se utiliza el nuevo punto multidimensional de porcentajes de metilación (u otro nivel) para determinar uno de los sujetos de referencia más cercanos (por ejemplo, los que se muestran en la FIG. 18) o un subgrupo más cercano, como se representa en un nodo, por ejemplo, los nodos 1801 o 1802. La identificación de un sujeto de referencia o nodo de referencia más cercano puede proporcionar la clasificación.
El dendrograma de agrupamientos 1800 muestra que los sujetos con CNF se agrupan de forma creciente, agrupándose todos los sujetos con CNF en un subgrupo en el nodo 1803, que no incluye a sujetos con otras afecciones. Esto demuestra la capacidad para discriminar los sujetos con CNF de los sujetos con MI y de los sujetos con linfoma. De forma similar, los sujetos con MI se agrupan. Como observación, los dos pacientes con linfoma de linfocitos T citolíticos naturales no estaban agrupados. El paciente 1629 tenía una enfermedad en estadio IV, y el paciente 1713 en estadio I. Esto podría indicar que el patrón de metilación progresaría a lo largo de los diferentes estadios de la misma enfermedad. Una posible aplicación de esto sería utilizar el perfil de metilación para la estadificación y el pronóstico de los pacientes.
Hemos demostrado la viabilidad de diferenciar entre distintas enfermedades asociadas al VEB tomando como base el análisis de agrupamiento a través de los patrones de metilación del ADN del VEB plasmático. Por ejemplo, después de identificar un cierto patrón, las realizaciones pueden confirmar o descartar una enfermedad. Otros algoritmos de clasificación que incluyen, pero sin limitación, análisis de componentes principales, análisis discriminante lineal, regresión logística, modelos de aprendizaje automático, agrupamiento K-means, también podrían utilizarse k vecinos más cercanos y bosques de decisión aleatorios.
La FIG. 19 muestra un dendrograma de conglomerados con el análisis de conglomerados jerárquico basado en el análisis del patrón de metilación del ADN del VEB plasmático para 6 pacientes con CNF (incluyendo 4 pacientes con CNF en estadio temprano de nuestra cohorte de cribado) y 3 sujetos sin CNF con ADN del VEB plasmático persistentemente positivo de acuerdo con las realizaciones de la presente divulgación. El ADN plasmático se extrajo de sus primeras muestras de sangre en el momento de la selección. En este ejemplo, el análisis de agrupamiento jerárquico se basó en la comparación de los porcentajes de metilación de los sitios CpG dentro de grupos contiguos no superpuestos de 500 pb de tamaño.
En la FIG. 19, la distancia también se muestra a lo largo del eje horizontal superior. La distancia se puede determinar como se ha descrito anteriormente. De forma similar a la FIG. 18, dos sujetos pueden combinarse en un punto igual a la distancia entre ellos. Como se muestra, los sujetos con CNF se agrupan con otros sujetos con CNF, por ejemplo, en los nodos 1901 y 1902. El dendrograma de agrupamientos 1900 muestra que los sujetos con CNF se agrupan de forma creciente, agrupándose todos los sujetos con CNF en un subgrupo en el nodo 1903, que no incluye sujetos con otras afecciones (es decir, persistentemente positivos para este ejemplo). De forma similar, los sujetos persistentemente positivos se agrupan primero. Esto demuestra una capacidad para discriminar a los sujetos con CNF de los sujetos persistentemente positivos.
Por consiguiente, hemos demostrado la viabilidad de diferenciar a los pacientes con CNF en estadio inicial de los sujetos sin CNF con resultados falsos positivos de ADN del VEB plasmático tomando como base el análisis del patrón de metilación del ADN del VEB plasmático de la primera muestra de sangre sin necesidad de análisis seriados. Es decir, puede hacerse una clasificación precisa con una única medición, en lugar de requerir múltiples mediciones en diferentes momentos. Esto ahorraría potencialmente los costes médicos en la disposición logística para los análisis de sangre en serie y las investigaciones posteriores con fines confirmatorios.
La FIG. 20 muestra una matriz cromática 2000 que ilustra los niveles de metilación de todas las regiones no superpuestas de 500 pb del genoma completo del VEB para pacientes con carcinoma nasofaríngeo, linfoma de linfocitos T citolíticos naturales y mononucleosis infecciosa. El nivel de metilación de cada ventana se calculó como la media de las densidades de metilación de todos los sitios CpG (sin selección) dentro de la ventana. Analizamos los patrones de metilación del ADN del VEB plasmático de 5 pacientes con CNF, 3 pacientes con linfoma de linfocitos T citolíticos naturales y 3 pacientes con mononucleosis infecciosa. En el ejemplo actual, el patrón de metilación se analiza a través de los porcentajes de metilación en todas las ventanas de 500 pb no superpuestas. La clave de color/histograma 2050 muestra diferentes colores para diferentes porcentajes de metilación, siendo el blanco cercano a cero, siendo el amarillo (gris claro) bajo (por ejemplo, ~20 %), siendo el naranja (gris medio) medio (por ejemplo, ~50 %) y siendo el rojo (gris oscuro) alto (por ejemplo, ~80 % y superior). La clave de color/histograma 2050 también muestra un histograma para el número de regiones que tienen un nivel de metilación particular.
La matriz cromática 2000 muestra los niveles de metilación en toda la ventana no superpuesta de 500 pb en el genoma del VEB para todos los casos. Cada fila representa una región de 500 pb y el color representa su nivel de metilación. Cada columna representa un caso. El dendrograma de agrupamientos 2010 muestra el agrupamiento de los diferentes casos. Se agruparon diferentes casos con el mismo diagnóstico. Por ejemplo, todos los casos de CNF están agrupados a la derecha y presentan altos niveles de metilación, como demuestra el rojo oscuro (gris oscuro). Los sujetos con linfoma se agrupan en el centro y presentan una mezcla entre amarillo (gris claro) (niveles de metilación bajos) y rojo (gris oscuro) (niveles de metilación altos). El grupo de muestras de mononucleosis infecciosa se muestra a la izquierda y presenta unos niveles de metilación relativamente bajos, como demuestra el amarillo claro (gris claro).
La FIG. 20 muestra la viabilidad de predecir las enfermedades asociadas al VEB mediante el análisis de los patrones de metilación del ADN del VEB plasmático. Además, se observa una mayor precisión utilizando las DMR por oposición a todas las regiones que abarcan el genoma del VEB.
En otras realizaciones, los patrones de metilación pueden derivarse a través de los porcentajes de metilación en todos los sitios CpG de todo el genoma del VEB (como análisis de todo el genoma), por ejemplo, por sitio. En otra realización, se podría asignar una ponderación diferente a cualquier sitio o sitios CpG y/o DMR individuales para la predicción de las enfermedades o afecciones asociadas al VEB. Dichas ponderaciones pueden implementarse de diferentes maneras, como se ha descrito anteriormente, por ejemplo, aplicando factores de escala (ponderaciones) a los niveles de metilación intermedios para obtener una media ponderada para una región o para todo el genoma. Aquí, asignamos la misma ponderación a todos los sitios CpG analizados.
V. USO DE RECUENTOS Y TAMAÑO
Además de utilizar los niveles de metilación de los fragmentos de ADN vírico acelular en una muestra acelular para discriminar entre sujetos con diferentes afecciones y/o niveles de una afección, algunas realizaciones pueden utilizar los tamaños de los fragmentos de ADN vírico acelulares en una muestra acelular. Algunas realizaciones también pueden utilizar un número (por ejemplo, una proporción) de fragmentos de ADN vírico acelular en una muestra acelular. Varias realizaciones pueden utilizar combinaciones de diferentes técnicas, por ejemplo, requiriendo una misma clasificación para un sujeto utilizando cada una de las técnicas. Por ejemplo, cualquier combinación de a) la proporción de fragmentos de ADN plasmático que se alinean con el VEB, b) el perfil de tamaño de los fragmentos de ADN del VEB plasmático y c) el perfil de metilación del ADN del VEB plasmático, se puede usar para la clasificación. Pueden adoptarse diferentes umbrales para la clasificación cuando se combinan diferentes técnicas para lograr la sensibilidad y especificidad diagnósticas deseadas.
A. Análisis del perfil de tamaño de los fragmentos de ADN del VEB plasmático
Además de la viabilidad del análisis de metilación de los fragmentos de ADN del VEB plasmático, el tamaño de cada fragmento de ADN del VEB plasmático se dedujo tomando como base las coordenadas del nucleótido más externo de los dos extremos en el genoma del VEB. Las distribuciones de tamaño de los fragmentos de ADN del VEB acelulares varían en función de las diferentes afecciones (es decir, diferentes patrones), permitiendo así la discriminación entre sujetos con diferentes afecciones y, por tanto, los niveles de una afección. Estos diferentes patrones de tamaño pueden cuantificarse en varios parámetros de tamaño, por ejemplo, relaciones de tamaño de una cantidad de ADN vírico de un tamaño (por ejemplo, un primer intervalo de tamaños) con respecto a una cantidad de ADN vírico de otro tamaño (por ejemplo, un segundo intervalo de tamaños). Por ejemplo, se puede utilizar una relación de tamaño para comparar la proporción de lecturas de ADN del VEB plasmático dentro de un cierto intervalo de tamaños (por ejemplo, entre 80 y 110 pares de bases) normalizado a la cantidad de fragmentos de ADN autosómico dentro del mismo intervalo de tamaños entre sujetos con diferentes afecciones.
La FIG. 21 muestra los perfiles de distribución de tamaños de fragmentos de ADN plasmático secuenciados cartografiados con el genoma del VEB y el genoma humano en 2 pacientes con CNF (TBR1392 y TBR1416) y 2 pacientes con mononucleosis infecciosa (TBR1610 y TBR1661), y 3 sujetos sin CNF con ADN del VEB plasmático persistentemente positivo en análisis seriados (AF091, HB002 y HF020) de acuerdo con las realizaciones de la presente divulgación. Los gráficos muestran un tamaño (pb) a lo largo del eje horizontal y la frecuencia (proporción) de ADN de un tamaño dado en el eje vertical. Las distribuciones de tamaño del ADN genómico humano se muestran en azul (gris), por ejemplo, en la distribución de tamaños 2104. Las distribuciones de tamaño del VEB se muestran en rojo (negro), por ejemplo, la distribución del tamaño 2103.
Se observó una diferencia en el patrón del perfil de tamaño entre los fragmentos de ADN del VEB plasmático alineados con el genoma del VEB y los alineados con el genoma autosómico. Por ejemplo, los sujetos con CNF presentan un desplazamiento hacia fragmentos más pequeños de ADN del VEB acelular en el pico alrededor de 160 pb con una cantidad similar de fragmentos en el extremo inferior como el ADN humano, mientras que los sujetos con MI tienen una mayor cantidad de ADN del VEB que de ADN humano por debajo de 100 pb. Los sujetos persistentemente positivos presentan unas fluctuaciones significativas hacia arriba y hacia abajo a medida que aumenta el tamaño, así como un desplazamiento más pronunciado del pico en relación con los sujetos con CNF. Estas diferencias pueden utilizarse para diferenciar a los sujetos con diferentes afecciones, por ejemplo, para diferenciar los sujetos con CNF de los sujetos con resultados falsos positivos del ADN del VEB plasmático.
Para comparar la proporción de lecturas de ADN del VEB plasmático dentro de un cierto intervalo de tamaños (por ejemplo, entre 80 y 110 pb) entre individuos, la cantidad de fragmentos de ADN del VEB plasmático puede normalizarse con respecto a la cantidad de fragmentos de ADN autosómico dentro del mismo intervalo de tamaños. Este parámetro es un ejemplo de relación de tamaño. Una relación de tamaño puede definirse por la proporción de fragmentos de ADN del VEB plasmático dentro de un cierto intervalo de tamaños dividida por la proporción de un conjunto de secuencias de referencia (por ejemplo, fragmentos de ADN de los autosomas humanos) dentro del correspondiente intervalo de tamaños. Se pueden utilizar diferentes criterios de tamaño. Por ejemplo, una relación de tamaño de los fragmentos entre 80 y 110 pares de bases sería:
Relación de tamaño80-110pb = P r o p o r c ió n d e f r a g m e n t o s de AD N de l VEB d e n t r o d e<80 - 1 10 pb>
P r o p o r c ió n de f r a g m e n t o s d e ADN a u to s ó m ic o d e n t r o de80y110pb
La FIG. 22 muestra la relación de tamaño en 6 pacientes con CNF y 3 sujetos persistentemente positivos para el ADN del VEB plasmático de acuerdo con las realizaciones de la presente divulgación. Pudimos observar una diferencia estadísticamente significativa entre la relación de tamaño de los dos grupos de sujetos (valor de p=0,02, prueba de Mann-Whitney). Los valores de tamaño de referencia ilustrativos para discriminar entre sujetos con CNF y sujetos persistentemente positivos pueden estar entre 2-4 (por ejemplo, 3) para esta relación de tamaño particular.
La FIG. 23 muestra las relaciones de tamaño del ADN del VEB en los sujetos sin CNF con ADN del VEB plasmático transitoriamente positivo, sujetos sin CNF con ADN del VEB plasmático persistentemente positivo, y pacientes con CNF de acuerdo con las realizaciones de la presente divulgación. La relación media del tamaño del<a>DN del VEB (80 110 pb) para el grupo con CNF (media=1,9) fue significativamente inferior a las relaciones medias del tamaño de los otros dos grupos sin CNF con ADN del VEB plasmático transitoriamente positivo (media=4,3) y persistentemente positivo (media=4,8) (p<0,0001, prueba de Kruskal-Wallis).
Por consiguiente, Los pacientes con CNF pudieron diferenciarse de los sujetos sin CNF con ADN del VEB plasmático detectable (transitoria o persistentemente positivo) tomando como base la diferencia de los perfiles de tamaño del ADN del VEB plasmático, por ejemplo, representados por las relaciones de tamaño del ADN del VEB. En el ejemplo actual, se utilizó un valor de corte de 3 para lograr una sensibilidad de detección del 90 %. Utilizando un valor de corte de 3, 27 de 30 pacientes con CNF, 23 de 117 sujetos sin CNF con ADN del VEB plasmático transitoriamente positivo y 7 de 39 sujetos sin CNF con ADN del VEB plasmático persistentemente positivo superaron el valor de corte y sus relaciones de tamaño de ADN del VEB plasmático fueron inferiores al valor de corte. La sensibilidad, la especificidad y el valor predictivo positivo calculados fueron del 90 %, 80,8 % y 49,2 %, respectivamente.
La selección del valor de corte (de referencia) puede determinarse de varias formas. En una realización, se puede seleccionar un valor de corte para las relaciones de tamaño del ADN del VEB como cualquier valor por encima del valor más alto en las relaciones de tamaño del ADN del VEB entre los pacientes con CNF analizados (por ejemplo, en un conjunto de entrenamiento). En otras realizaciones, pueden determinarse unos valor de corte, por ejemplo, como las relaciones medias de tamaño del ADN del VEB de los pacientes con CNF más una desviación estándar (DE), media más dos DE, media más tres DE. En otras realizaciones más, el valor de corte puede determinarse mediante curvas de eficacia diagnóstica (ROC) o mediante métodos no paramétricos, por ejemplo, incluyendo 100 %, 95 %, 90 %, 85 %, 80%de los pacientes con CNF analizados.
Otras definiciones de una relación de tamaño u otros valores estadísticos de la distribución de tamaño darían lugar a valores diferentes para cada uno de los sujetos y, por tanto, tendrían valores de referencia diferentes para discriminar entre sujetos. Por ejemplo, se puede utilizar un intervalo de tamaños diferente, o un subconjunto de cromosomas para los fragmentos de ADN autosómico, o no utilizar ADN autosómico en absoluto. Pueden determinarse diferentes valores estadísticos de una distribución de tamaños de los fragmentos de ácidos nucleicos. Por ejemplo, se puede utilizar un promedio, una moda, una mediana o una media de una distribución de tamaños. Se pueden utilizar otros valores estadísticos, por ejemplo, una frecuencia acumulada para un tamaño dado o diferentes relaciones de cantidad de fragmentos de ácidos nucleicos de diferentes tamaños. Una frecuencia acumulada puede corresponder a una proporción (por ejemplo, un porcentaje) de fragmentos de ADN que tienen un tamaño dado o menor, o mayor que un tamaño dado. Por consiguiente, cualquier factor de normalización (si se utiliza uno) en el denominador puede ser para una cantidad de ADN del VEB para un intervalo de tamaños diferente. Los valores estadísticos proporcionan información sobre la distribución de los tamaños de los fragmentos de ADN para su comparación con uno o varios umbrales de tamaño para sujetos sanos de control u otras afecciones. Un experto en la materia sabrá cómo determinar dichos umbrales tomando como base la presente divulgación. Pueden encontrarse otros ejemplos de relaciones de tamaño en las Publicaciones de Patentes de EE.UU. 2011/0276277, 2013/0237431 y 2016/0217251.
B. Recuento
Además del análisis de los porcentajes de metilación del ADN del VEB plasmático, analizamos la proporción de lecturas de ADN del VEB plasmático procedentes de la secuenciación con bisulfito dirigida. La proporción de lecturas DMA del VEB acelular puede determinarse de varias formas, por ejemplo, como una proporción de todas las lecturas de ADN del genoma humano y de varios genomas víricos o sólo del genoma humano y del genoma vírico analizados. En el ejemplo previo, una secuencia de referencia combinada puede comprender el genoma humano completo (hg19), el genoma completo del VEB (AJ507799.2), el genoma completo del VHB y el genoma completo del VPH. En varios ejemplos, la proporción puede determinarse tomando como base los recuentos de lecturas que se alinean con el genoma vírico analizado en relación con el resto de lecturas de ADN o sólo con las que podrían alinearse (por ejemplo, de forma única o con un número especificado de desemparejamientos). Utilizando un genoma de referencia del genoma humano y varios genomas víricos, comparamos la proporción de lecturas de ADN del VEB plasmático entre los tres grupos de pacientes con CNF, sujetos sin CNF con ADN del VEB plasmático transitoriamente positivo y sujetos sin CNF con ADN del VEB plasmático persistentemente positivo.
La FIG. 24 muestra la proporción de lecturas de ADN del VEB plasmático (lecturas de ADN plasmático cartografiadas en el genoma del VEB) entre todas las lecturas de ADN plasmático secuenciadas en los sujetos sin CNF con ADN del VEB plasmático transitoriamente positivo, sujetos sin CNF con ADN del VEB plasmático persistentemente positivo, y pacientes con CNF de acuerdo con las realizaciones de la presente divulgación. La proporción media de lecturas de ADN del VEB plasmático del grupo con CNF (media = 0,075 %) fue significativamente superior a las proporciones medias de los otros dos grupos sin CNF con ADN del VEB plasmático transitoriamente positivo (media = 0,003 %) y persistentemente positivo (media = 0,052 %) (p<0,0001, prueba de Kruskal-Wallis). Por consiguiente, Los pacientes con CNF podrían diferenciarse de los sujetos sin CNF con ADN del VEB plasmático detectable (transitoria o persistentemente positivo) en función de la diferencia en la cantidad de ADN del VEB plasmático (es decir, la proporción de ADN del VEB plasmático).
En el ejemplo actual, usando un valor de corte de 4,5 x 10-6, la totalidad de los 30 pacientes con CNF, 79 de 119 sujetos sin CNF con ADN del VEB plasmático transitoriamente positivo y 34 de 39 sujetos sin CNF con ADN del VEB plasmático persistentemente positivo tenían sus proporciones de ADN del VEB plasmático por secuenciación con bisulfito dirigida superiores a este valor de corte. La sensibilidad, la especificidad y el valor predictivo positivo calculados fueron del 100 %, 27,6 % y 22,1 %, respectivamente
La selección del valor de corte (de referencia) puede determinarse de varias formas. En una realización, el valor de corte para la proporción de ADN del VEB plasmático puede seleccionarse como cualquier valor por debajo del valor más bajo de la proporción entre los pacientes con CNF analizados. El valor de corte puede fijarse para capturar todos los pacientes con CNF y lograr la máxima sensibilidad. En otras realizaciones, los valores de corte pueden determinarse, por ejemplo, como la proporción media de lecturas de ADN del VEB plasmático de los pacientes con CNF menos una desviación estándar (DE), media menos dos DE, media menos tres DE. En el ejemplo actual, se fijó un valor de corte en la media de las proporciones de lecturas de ADN del VEB plasmático entre todos los pacientes con CNF menos tres DE. En otras realizaciones más, el valor de corte puede determinarse tras la transformación logarítmica de la proporción de fragmentos de ADN plasmático cartografiados con el genoma del VEB y, a continuación, seleccionarse de una forma similar (por ejemplo, utilizando una media, etc.). En otras realizaciones más, el valor de corte puede determinarse mediante curvas de eficacia diagnóstica (ROC) o mediante métodos no paramétricos, por ejemplo, incluyendo 100 %, 95 %, 90 %, 85 %, 80 % de los pacientes con CNF analizados.
C. Análisis combinados
Estas tres técnicas pueden combinarse para proporcionar una mayor precisión. Por ejemplo, los parámetros para cada una de las técnicas (cada técnica incluye potencialmente múltiples parámetros, por ejemplo, múltiples niveles de mutilación) pueden compararse con los respectivos valores de referencia para clasificar a un sujeto, por ejemplo, como puede hacerse en un árbol de decisión o para identificar al sujeto como correspondiente a una sección particular (cuadrante) de un gráfico de valores de entrenamiento. También se pueden utilizar técnicas de agrupamiento, por ejemplo, como se ha descrito anteriormente.
Evaluamos el valor de combinar los análisis de las proporciones de ADN del VEB plasmático (cuantificación) y las relaciones de tamaño para la identificación del CNF. También evaluamos el valor de combinar los análisis de las proporciones de ADN del VEB plasmático (cuantificación) y los porcentajes de metilación para la identificación del CNF, y a continuación, los tres juntos.
La FIG. 25 es un gráfico de las proporciones de las lecturas de ADN del VEB plasmático y los correspondientes valores de la relación de tamaño para los pacientes con CNF, los sujetos sin CNF transitoriamente positivos y con ADN del VEB plasmático persistentemente positivo de acuerdo con las realizaciones de la presente divulgación. Los mismos valores de corte en las relaciones de tamaño del ADN del VEB y la proporción de lecturas de ADN del VEB plasmático definidos en las FIGS. 23 y 24 se indican mediante las líneas punteadas grises. El óvalo destaca el cuadrante 2510 que superó los análisis combinados.
En este análisis combinado, se consideró que una muestra de plasma era positiva si sus datos de secuenciación superaban simultáneamente los valores de corte en ambos análisis de las proporciones y las relaciones de tamaño del ADN del VEB plasmático. Utilizando los valores de corte definidos anteriormente, la sensibilidad, la especificidad y el valor predictivo positivo para la detección del CNF fueron del 90 %, 88,5 % y 61,7 %, respectivamente.
La FIG. 26 es un gráfico de las proporciones de las lecturas de ADN del VEB plasmático y los correspondientes valores del porcentaje de metilación para los pacientes con CNF, los sujetos sin CNF transitoriamente positivos y con ADN del VEB plasmático persistentemente positivo de acuerdo con las realizaciones de la presente divulgación. Los mismos valores de corte en los porcentajes de metilación del ADN del VEB dentro de las 46 DMR y la proporción de lecturas de ADN del VEB plasmático, como se definen respectivamente en las FIGS. 13 y 24, se indican mediante las líneas grises discontinuas. El óvalo destaca el cuadrante 2610 que superó los análisis combinados.
En este análisis combinado, se consideró que una muestra de plasma era positiva si sus datos de secuenciación superaban simultáneamente los valores de corte en ambos análisis de las proporciones y los porcentajes de metilación del ADN del VEB plasmático (tomando como base la DMR definida en la FIG.). Utilizando los valores de corte definidos anteriormente, la sensibilidad, la especificidad y el valor predictivo positivo para la detección del CNF fueron del 96,7 %, 89,1 % y 64,6 %, respectivamente.
Las FIGS. 27A y 27B muestran un gráfico tridimensional de las proporciones de las lecturas de ADN del VEB plasmático y los correspondientes valores de la relación de tamaño y el porcentaje de metilación para los pacientes con CNF, los sujetos sin CNF transitoriamente positivos y con ADN del VEB plasmático persistentemente positivo de acuerdo con las realizaciones de la presente divulgación. Evaluamos el valor de combinar los tres parámetros, las proporciones de ADN del VEB plasmático (cuantificación), las relaciones de tamaño y los porcentajes de metilación para la identificación de CNF. Las proporciones se determinaron de la misma manera que en la FIG 24. Las relaciones de tamaño se determinaron de la misma manera que en la FIG 23. Y, los niveles de metilación se determinan utilizando las 46 DMR utilizadas para la FIG. 13.
En la FIG. 27A, la superficie púrpura 2710 indica una superficie tridimensional ajustada que diferencia a los pacientes con CNF de los sujetos sin c Nf con ADN VEB plasmático transitoria y persistentemente positivo en el espacio tridimensional. El uso de una superficie ajustada ilustra que los valores de referencia para diferenciar entre sujetos pueden ser más complejos que los valores constantes. Por ejemplo, en la FIG. 26, el valor de corte para el porcentaje de metilación podría variar con la proporción de lecturas de secuencia. Dicha flexibilidad en la determinación de la clasificación puede proporcionar una mayor precisión. El ajuste puede seleccionarse para optimizar varios parámetros de precisión, por ejemplo, especificidad, sensibilidad, o alguna media de ambas. Dicho ajuste puede realizarse utilizando máquinas de vectores de apoyo. La FIG. 27B muestra los mismos datos que en la FIG. 27A, pero sin la superficie 2710, y con los ejes etiquetados en un recuadro alrededor de los datos.
Las FIGS. 28A y 28B muestran un análisis de las curvas de eficacia diagnóstica (ROC) para varias combinaciones basadas en el recuento, basadas en el tamaño y basadas en la metilación de acuerdo con las realizaciones de la presente divulgación. La precisión se refiere a la clasificación correcta de sujetos con CNF y sin CNF. Los parámetros (es decir, las proporciones, las relaciones de tamaño y los niveles de metilación) se determinaron de la misma manera que en las FIGS. 27A y 27B. Se variaron los valores de corte, provocando de este modo un cambio en la sensibilidad y en la especificidad. La FIG. 27A muestra una comparación de las tres técnicas utilizadas individualmente. Se muestran los valores del área bajo la curva (AUC). Los valores del AUC fueron de 0,905, 0,942 y 0,979, respectivamente, para sólo el recuento, sólo el tamaño y sólo la metilación. La metilación proporciona los mejores resultados. La FIG. 28B muestra una comparación de tres técnicas combinadas. El valor de AUC para el recuento y el tamaño es de 0,97. El valor de AUC para el recuento y la metilación es de 0,985. El uso de las tres técnicas proporciona la mejor precisión con 0,989.
VI. Otros ejemplos víricos
Otros virus también están asociados al cáncer. Por ejemplo, el virus del papiloma humano (VPH) está asociado al carcinoma epidermoide de cabeza y cuello (CECC). Y, el virus de la hepatitis B (VHB) está asociado al carcinoma hepatocelular (CHC). Los resultados que se muestran a continuación demuestran que las realizaciones pueden utilizar el nivel o niveles de metilación de otro ADN vírico acelular para clasificar los niveles de una afección de forma similar a como se utilizó el nivel o niveles de metilación para el ADN acelular del VEB.
A. VPH
La FIG. 29 muestra el estadio clínico de los 5 casos de carcinoma epidermoide de cabeza y cuello positivos para el VPH (CECC positivo para el VPH). Los casos se estadificaron de acuerdo con la 8a edición del AJCC Cancer Staging Manual. Hemos analizado los perfiles de metilación de las lecturas del ADN plasmático del virus del papiloma humano (VPH) de estos 5 pacientes con carcinoma epidermoide de cabeza y cuello positivo para el VPH (CECC positivo para el VPH) mediante una secuenciación con bisulfito dirigida del ADN plasmático. Los 5 pacientes presentaban enfermedades en estadio temprano (estadio I o II). Todos ellos tenían fragmentos de ADN del VPH detectables en sus muestras de ADN plasmático.
Para cada caso clínico, se extrajo ADN plasmático a partir de 4 ml de plasma utilizando el minikit de ADN en sangre QIAamp DSP. Para cada caso, todo el ADN extraído se utilizó para la preparación de la genoteca de secuenciación utilizando el kit de preparación de genotecas de ADN sin PCR TruSeq (Illumina). Los productos de ADN ligados a un adaptador se sometieron a dos rondas de tratamiento con bisulfito utilizando un kit EpiTect Bisulfite (Qiagen). Se realizaron de doce a quince ciclos de amplificación por PCR en las muestras convertidas con bisulfito utilizando el kit de PCR KAPA HiFi HotStart Uracil+ ReadyMix (Roche). A continuación, los productos de la amplificación se capturaron con el sistema SeqCap-Epi (Nimblegen) utilizando las sondas diseñadas a medida que abarcaban las regiones genómicas víricas y humanas indicadas anteriormente (FIG. 1).
Tras la captura del objetivo, los productos capturados se enriquecieron mediante 14 ciclos de PCR para generar genotecas. Las genotecas secuenciaron en una plataforma NextSeq (Illumina). Para cada tanda de secuenciación, se secuenciaron de cuatro a seis muestras con códigos de barras de muestra únicos utilizando el modo de ambos extremos. Para cada fragmento de ADN, se secuenciaron 75 nucleótidos de cada uno de los dos extremos. Después de la secuenciación, las lecturas de secuencia se procesaron enMethyl-Pipe,un proceso de análisis de los datos de metilación (Jianget al.PLoS One 2014; 9: e l 00360), y se cartografió con una secuencia de referencia combinada artificialmente que comprende el genoma humano completo (hg19), el genoma del VEB completo (AJ507799.2), el genoma del VHB completo y el genoma del VPH completo. Las lecturas secuenciadas cartografiadas a posiciones únicas (aunque se pueden permitir desemparejamientos en otras realizaciones) en la secuencia genómica combinada se utilizaron para un análisis posterior.
La FIG. 30 muestra los perfiles de metilación del ADN del VPH plasmático en pacientes individuales con carcinoma epidermoide de cabeza y cuello positivo para el VPH (CECC positivo para el VPH) de acuerdo con las realizaciones de la presente divulgación. Los perfiles de metilación del ADN del VPH se generaron mediante la secuenciación con bisulfito de captura dirigida del ADN plasmático de estos pacientes. La FIG. 30 muestra que la metilación del VPH16 (serotipo 16 del VPH) puede detectarse en las moléculas de ADN del VPH16 en plasma de pacientes con CECC. Se determinó la densidad de metilación de todos los sitios CpG del genoma del VPH.
La densidad de metilación DM de locus específicos en todo el genoma vírico en el plasma puede calcularse utilizando la ecuación: DM = M/(M+U), donde M es el recuento de lecturas víricas metiladas y U es el recuento de lecturas víricas no metiladas en los sitios CpG dentro de locus genéticos en todo el genoma vírico. En un nivel específico del locus, estos locus podrían ser de cualquier tamaño y de al menos 1 sitio CpG (1 pb). Si existe más de un sitio CpG dentro de un locus, entonces M y U corresponde a los recuentos en todos los sitios. Estos locus podían estar y no estar asociados a ningún gen vírico comentado.
Pudimos observar patrones similares de los perfiles de metilación del ADN del VPH plasmático entre diferentes pacientes. Normalmente no hay VPH en los sujetos sin cáncer. Definimos dos regiones genómicas, a saber, la región 3001 y la región 3002. La densidad de metilación específica de la región 3001 era coherentemente superior a la de la región 3002 en los 5 casos de CECC positivo para el VPH. Estas similitudes en los patrones entre sujetos con la misma afección y las diferencias en los patrones entre sujetos con diferentes afecciones de perfiles de metilación podrían analizarse a nivel global o específico de locus. Las densidades de metilación de dichas regiones predefinidas podrían predecir el cuadro clínico inicial, por ejemplo, para el estadio de cáncer, la respuesta al tratamiento y el riesgo de recidiva.
La FIG. 31 muestra el nivel de metilación de todos los sitios CpG en todo el genoma del VPH en dos pacientes con CECC positivo para el VPH de acuerdo con las realizaciones de la presente divulgación. Un primer paciente se muestra en negro y está en la parte inferior, como se representa en 3101. Un segundo paciente está en gris, y cuando es más grande se puede ver, como en 3102. Como puede verse, los dos pacientes tienen unos niveles de metilación apreciables en locus similares, y muchos locus tienen valores similares para los niveles de mutilación. Comparando el nivel de metilación a nivel global o específico de locus entre los casos, las realizaciones pueden identificar que un sujeto padece CECC.
B. VHB
Se realizó la secuenciación con bisulfito dirigida del ADN plasmático de 9 pacientes con infección crónica por hepatitis B y 10 pacientes con CHC. También analizamos el perfil de metilación de las lecturas del VHB plasmático de estos pacientes con infección crónica por hepatitis B y CHC.
Las FIGS. 32A y 32B muestran las proporciones de lecturas de ADN del virus de la hepatitis B (VHB) (lecturas de ADN plasmático cartografiadas en el genoma del VHB) y los porcentajes de metilación de todos los sitios CpG en todo el genoma del VHB para 9 pacientes con infección crónica por el virus de la hepatitis B (VHB) y 10 pacientes con carcinoma hepatocelular (CHC) de acuerdo con las realizaciones de la presente divulgación.
En la FIG. 32A, se determinó el porcentaje de fragmentos de ADN que se alineaban con el genoma del VHB en relación con el genoma humano. En este ejemplo particular, el número de fragmentos de ADN acelular que se alineaban de forma única con el genoma del v Hb se dividió por el número de fragmentos de ADN acelular que se alineaban de forma única con un genoma de referencia combinado que comprendía los genomas del ser humano, el VHB, el VPH y el VEB, como se indica en la FIG. 1. Se observó una mayor proporción promedio de lecturas de ADN del VHB en los pacientes con CHC (media = 0,006 %) que en los pacientes con infección crónica por el VHB (media = 0,03 %), pero no se alcanzó una significación estadística (p= 0,07, prueba de latde Student). Como puede observarse, las medias de los sujetos con CHC y los sujetos con VHB son similares. Por lo tanto, una técnica basada en el recuento tiene una capacidad de predicción relativamente baja.
En la FIG. 32B, el porcentaje de metilación del VHB se determinó como un nivel de metilación global en todos los sitios CpG del genoma del VHB. Observamos un porcentaje de metilación del ADN del VHB plasmático significativamente mayor en los pacientes con CHC (media = 1,7 %) que en los pacientes con infección crónica por hepatitis B (media = 23 %) (p = 0,03, prueba de latde Student). Dicha separación indica una mayor capacidad para discriminar entre los sujetos que tienen el VHB pero sin CHC y los sujetos que tienen CHC. Por lo tanto, las realizaciones pueden clasificar los niveles de la afección CHC (por ejemplo, con CHC o sin CHC). Por consiguiente, las realizaciones podrían predecir el riesgo de CHC tomando como base el nivel de metilación total genómica del ADN del VHB plasmático de la muestra.
Otras realizaciones pueden implementar otros tipos de niveles de metilación, por ejemplo, como se describe en el presente documento. Por ejemplo, la clasificación podría basarse en los niveles de metilación dentro de regiones metiladas diferenciadas con unos criterios predefinidos.
VII. MÉTODO QUE UTILIZA LA METILACIÓN DEL ADN VÍRICO ACELULAR
Como se ha descrito anteriormente, las realizaciones pueden medir uno o más niveles de metilación en una muestra de ADN acelular, incluyendo ADN vírico acelular y ADN genómico humano acelular. Los niveles de metilación pueden clasificar el nivel de una afección mediante el análisis del nivel o niveles de metilación del ADN de un virus particular que está asociado a la afección. También pueden utilizarse técnicas basadas en el recuento y en el tamaño para complementar las técnicas de metilación.
Como ejemplos, el nivel de la afección puede ser si la afección existe, una gravedad de una afección, un estadio de la afección, un pronóstico de la enfermedad, la respuesta de la afección al tratamiento u otra medida de la gravedad o la progresión de la afección. Como ejemplos de cáncer, el nivel de cáncer puede referirse ser si existe cáncer, un estadio del cáncer (por ejemplo, estadio inicial y estadio avanzado), un tamaño de tumor, la respuesta del cáncer al tratamiento u otra medida de la gravedad o la progresión del cáncer.
Para el VEB, algunas afecciones ilustrativas pueden incluir mononucleosis infecciosa (MI), carcinoma nasofaríngeo (CNF), linfoma de linfocitos T citolíticos naturales (NK) y sujetos sin estas afecciones, pero que pueden mostrar un número apreciable de fragmentos de ADN del VEB acelulares en la muestra. Para el VPH, algunas afecciones ilustrativas pueden incluir carcinoma epidermoide de cabeza y cuello (CECC) y un sujeto que presenta una cantidad apreciable de fragmentos de ADN del VPH acelulares, pero no tiene CECC. Para el VHB, algunas afecciones ilustrativas pueden incluir carcinoma hepatocelular (CHC) y unos sujetos que tengan una cantidad apreciable de fragmentos de ADN del VHB acelulares, pero no se tienen CHC.
A. Utilizar los niveles de metilación para clasificar la afección
La FIG. 33 es un diagrama de flujo que ilustra un método de análisis 3300 de una muestra biológica de un sujeto que es un animal para determinar una clasificación de una primera afección de acuerdo con las realizaciones de la presente divulgación. La muestra puede incluir una mezcla de moléculas de ADN del sujeto y, potencialmente, moléculas de ADN de un virus. El método 3300 puede incluir etapas clínicas, de laboratorio e informáticas. El método 3300 puede realizarse como parte de un cribado de sujetos, por ejemplo, para el cribado del cáncer. Por lo tanto, el sujeto puede ser asintomático para la afección.
En el bloque 3310, la muestra biológica se obtiene a partir del sujeto. Como ejemplos, la muestra biológica puede ser sangre, plasma, suero, orina, saliva, sudor, lágrimas y esputo, así como otros ejemplos proporcionados en el presente documento. La muestra biológica puede incluir una mezcla de moléculas de ADN acelulares procedentes de un genoma del sujeto y de uno o más de otros genomas. Por ejemplo, el uno o más de otros genomas pueden incluir genomas víricos, tales como, genomas del VEB, el VPH y/o el VHB. En algunas realizaciones (por ejemplo, para la sangre), la muestra biológica puede purificarse para la mezcla de moléculas de ADN acelulares, por ejemplo, centrifugar la sangre para obtener plasma.
En el bloque 3320, se analiza una pluralidad de moléculas de ADN acelular de la muestra biológica. El análisis de una molécula de ADN acelular puede incluir la identificación de una ubicación de la molécula de ADN acelular en un genoma vírico particular y la determinación de si la molécula de ADN acelular está metilada en uno o más sitios del genoma vírico particular. Se pueden analizar diferentes números de moléculas de ADN acelulares (humanas y víricas), por ejemplo, al menos 1000, identificándose diferentes números como del genoma vírico particular (por ejemplo, 10, 20, 30, 50, 100, 200, 500 o 1.000, o más).
El estado de metilación de los sitios de la lectura de secuencia puede obtenerse como se describe en el presente documento. Por ejemplo, las moléculas de ADN pueden analizarse utilizando lecturas de secuencia de las moléculas de ADN, donde la secuenciación es sensible a la metilación. También se pueden utilizar otros ensayos sensibles a la metilación. Cada una de las lecturas de secuencia puede incluir un estado de metilación de las moléculas de ADN acelular de la muestra biológica. El estado de metilación puede incluir si un resto de citosina particular es 5-metilcitosina o 5-hidroximetilcitosina. Las lecturas de secuencia puede obtenerse de varias formas, cada una como diferentes técnicas de secuenciación, técnicas de PCR (por ejemplo, en tiempo real o digital), matrices y otras técnicas adecuadas para identificar secuencias de fragmentos. La<p>C<r>en tiempo real es un ejemplo de análisis colectivo de un grupo de ADN, por ejemplo, como una señal de intensidad proporcional a la cantidad de ADN metilado en un sitio. Una lectura de secuencia puede cubrir más de un sitio dependiendo de la proximidad de los dos sitios entre sí y de la longitud de la lectura de secuencia.
El análisis puede realizarse recibiendo lecturas de secuencia de una secuenciación sensible a la metilación, y por tanto, el análisis puede realizarse únicamente sobre los datos obtenidos previamente del ADN. En otras realizaciones, el análisis puede incluir la secuenciación real u otras etapas activas para realizar las mediciones de las propiedades de las moléculas de ADN. La secuenciación se puede realizar de diversas formas, por ejemplo, utilizando una secuenciación paralela masiva o una secuenciación de nueva generación, utilizando la secuenciación de una única molécula y/o utilizando protocolos de preparación de genotecas de secuenciación de ADN bi- o monocatenario, y otras técnicas descritas en el presente documento. Como parte de la secuenciación, es posible que algunas de las lecturas de secuencia correspondan a ácidos nucleicos celulares.
La secuenciación puede ser una secuenciación dirigida, por ejemplo, como se describe en el presente documento. Por ejemplo, la muestra biológica puede estar enriquecida en moléculas de ácidos nucleicos del virus. El enriquecimiento de la muestra biológica en moléculas de ácidos nucleicos del virus puede incluir el uso de sondas de captura que se unen a una porción, o a todo el genoma de, el virus. Otras realizaciones pueden utilizar cebadores específicos para un locus particular del virus. La muestra biológica puede estar enriquecida en moléculas de ácidos nucleicos de una porción de un genoma humano, por ejemplo, regiones de autosomas. La FIG. 1 proporciona ejemplos de dichas sondas de captura. En otras realizaciones, la secuenciación puede incluir una secuenciación aleatoria.
Después de la secuenciación con un dispositivo de secuenciación, las lecturas de secuencia pueden ser recibidas por un sistema informático, que puede estar acoplado en comunicación con un dispositivo de secuenciación que haya realizado la secuenciación, por ejemplo, a través de comunicaciones por cable o inalámbricas o a través de un dispositivo de memoria extraíble. En algunas realizaciones, se pueden recibir una o más lecturas de secuencia que incluyan ambos extremos del fragmento de ácido nucleico. La ubicación de una molécula de ADN puede determinarse cartografiando (alineando) la una o más lecturas de secuencia de la molécula de ADN con las respectivas partes del genoma humano, por ejemplo, con regiones específicas, tales como regiones de metilación diferencial (DMR). En una implementación, si una lectura no corresponde a una región de interés, entonces se puede ignorar la lectura. En otras realizaciones, una sonda particular (por ejemplo, tras una PCR u otro tipo de amplificación) puede indicar una ubicación, tal como, por ejemplo, a través de un color fluorescente particular. La identificación puede consistir en que la molécula de ADN acelular corresponda a uno del conjunto de uno o más sitios, es decir, puede que no se conozca el sitio particular, ya que la cantidad de ADN metilado en uno o más sitios es todo lo que se necesita.
En el bloque 3330, se miden uno o más niveles de metilación de la mezcla tomando como base una o más cantidades de la pluralidad de moléculas de ADN acelulares metiladas en un conjunto de uno o más sitios del genoma vírico particular. Un nivel de metilación de la mezcla puede ser una densidad o porcentaje de metilación (por ejemplo, como se describe en el presente documento) para las moléculas de ADN acelular del conjunto de sitios o de un subconjunto de sitios. Por ejemplo, el nivel de metilación puede corresponder a una densidad de metilación que se determina tomando como base el número de moléculas de ADN correspondientes al conjunto de sitios y el número metilado. El número puede determinarse tomando como base la alineación de las lecturas de secuencia con el genoma vírico, en combinación con el estado de mutilación de una lectura de secuencia dada en uno o más sitios.
Se puede determinar un número respectivo de moléculas de ADN que están metiladas en el sitio para cada uno del conjunto de sitios. En una realización, los sitios son sitios CpG, y pueden ser únicamente ciertos sitios CpG, según se seleccione utilizando uno o más de los criterios mencionados en el presente documento. El número de moléculas de ADN que están metiladas equivale a determinar el número que no están metiladas una vez que se realiza la normalización utilizando un número total de moléculas de ADN analizadas en un sitio particular, por ejemplo, a número total de lecturas de secuencia. Por ejemplo, un aumento de la densidad de metilación de CpG de una región equivale a una disminución de la densidad de CpG no metilados de la misma región.
Cuando el conjunto de uno o más sitios incluye al menos dos sitios, se puede determinar un nivel de metilación de una mezcla en los al menos dos sitios. Por ejemplo, el nivel de metilación se puede calcular como una densidad de metilación total para todas las moléculas de ADN acelular del primer conjunto. En otro ejemplo, se pueden calcular densidades de metilación individuales para cada sitio o región(es) de uno o más sitios, proporcionando de este modo N (por ejemplo, un entero de 2 o más) niveles de metilación de la mezcla como un punto multidimensional, por ejemplo, como se describe en las secciones IV.B-IV.E. Las densidades de metilación individuales pueden combinarse para obtener el nivel de metilación de la mezcla, por ejemplo, un promedio de las densidades de metilación individuales.
En otras realizaciones, los niveles de metilación individuales pueden conservarse para un análisis posterior, por ejemplo, utilizando el agrupamiento y otras técnicas descritas en el presente documento. Por ejemplo, el punto multidimensional (N niveles de metilación de la mezcla) puede compararse con N niveles de metilación de referencia para obtener N diferencias, que puede utilizarse para determinar si el sujeto pertenece a una de las al menos dos cohortes. Las FIGS. 18-20 proporcionan dichos ejemplos de análisis de agrupamiento jerárquico. Las regiones pueden estar predeterminadas, por ejemplo, como se ha descrito anteriormente para regiones predeterminadas que tengan un tamaño de entre 50 bases y 1000 bases, siendo los tamaños iguales o variando entre las regiones.
Si se determina más de un nivel de metilación de la mezcla, los diferentes niveles pueden corresponder a diferentes subconjuntos del conjunto de sitios. Por ejemplo, los niveles de metilación pueden determinarse para diferentes regiones, cada una de las cuales puede incluir uno o más sitios. Las regiones pueden abarcar todo el genoma vírico o corresponder únicamente a algunas partes, por ejemplo, como puede hacerse cuando se seleccionan regiones particulares. Dichas regiones pueden seleccionarse por estar metiladas diferencialmente de acuerdo con uno o más criterios, por ejemplo, como se describe en el presente documento. Dichos criterios pueden corresponder a que los niveles de metilación en una cohorte de sujetos con una misma afección se encuentren dentro de un intervalo específico, y que potencialmente presenten una diferencia dentro de un umbral con respecto a otros sujetos de la cohorte. Por lo tanto, los criterios para las regiones o para cada uno de los sitios pueden incluir (1) una diferencia en el nivel de metilación entre múltiples sujetos de una misma cohorte y/o (2) una diferencia en el nivel de metilación entre un sujeto de una cohorte y un sujeto de otra cohorte.
En el bloque 3340, el uno o más niveles de metilación de la mezcla se comparan con uno o más niveles de metilación de referencia determinados a partir de al menos dos cohortes de otros sujetos. Las al menos dos cohortes pueden tener diferentes clasificaciones asociadas al genoma vírico particular, donde las diferentes clasificaciones incluyen una primera afección. Algunos ejemplos de dichas afecciones se han proporcionado anteriormente, por ejemplo, CNF, MI, linfoma y estados sin CNF relacionados con la positividad transitoria o persistente del número de moléculas de ADN del VEB. En las FIGS. 8, 11, 13, 15 y 18-20 se proporcionan ejemplos de cohortes y niveles de metilación de referencia.
La comparación puede adoptar diversas formas. Por ejemplo, se puede determinar un valor de separación, tal como una relación o una diferencia entre un nivel de metilación de la mezcla y un nivel de metilación de referencia. Se pueden definir diferentes valores de separación, incluir definiciones que incluyan relaciones y diferencias, y funciones de ambas. La comparación puede incluir además una comparación del valor de separación con un valor de corte para determinar una diferencia estadísticamente significativa. Por ejemplo, el nivel de metilación de referencia puede ser una media para una cohorte, y una diferencia entre el nivel de metilación de la mezcla de una muestra y la media para la cohorte puede compararse con un valor de corte, que puede determinarse tomando como base una desviación estándar de los niveles de metilación medidos para las muestras de referencia utilizadas en la cohorte.
En algunas realizaciones que implican múltiples niveles de metilación y múltiples niveles de referencia, los múltiples niveles de metilación pueden corresponder a un punto multidimensional de la muestra (por ejemplo, N niveles formando un vector) correspondiendo los múltiples niveles de referencia a una superficie (por ejemplo, un hiperplano) de N-1 dimensiones, donde la superficie puede ser una superficie cerrada, por ejemplo, como una esfera en la que los puntos de datos corresponden a una misma afección. Como otro ejemplo, la comparación de los niveles de metilación múltiple con los niveles de referencia puede implementarse determinando una distancia entre el punto multidimensional de la muestra y un punto multidimensional representativo (de referencia) de un sujeto de referencia. El punto multidimensional de referencia puede corresponder a un único sujeto de referencia, por ejemplo, el paciente AL038. Como otro ejemplo, el punto multidimensional representativo (de referencia) puede ser un centroide de un agrupamiento de puntos multidimensionales de referencia de sujetos con la misma afección.
Como otro ejemplo, la comparación del nivel o niveles de metilación de la mezcla con el nivel o niveles de metilación de referencia puede incluir la introducción de los uno o más niveles de mutilación de la mezcla en un modelo de aprendizaje automático que se haya entrenado utilizando el uno o más niveles de metilación de referencia determinados a partir de las al menos dos cohortes de otros sujetos. Por ejemplo, los niveles de referencia pueden ser los niveles de metilación medidos en los otros sujetos, y se puede entrenar un modelo de agrupamiento utilizando esos niveles de referencia. Por ejemplo, se puede seleccionar un centroide para el agrupamiento de sujetos correspondiente a una cohorte particular.
En el bloque 3350, una primera clasificación de si el sujeto padece la primera afección se determina tomando como base la comparación. La primera clasificación puede adoptar diversas formas, por ejemplo, un resultado binario o un valor de probabilidad. En algunas realizaciones, la primera clasificación puede proporcionar un nivel de la primera afección, por ejemplo, un tamaño de un tumor, una gravedad o un estadio del cáncer.
Las diferentes clasificaciones de las al menos dos cohortes también pueden incluir una segunda afección, donde la comparación con el uno o más niveles de referencia puede determinar una segunda clasificación de si el sujeto padece la segunda afección. Por ejemplo, un único nivel de referencia puede discriminar entre MI y linfoma, o entre CNF y sujetos persistentemente positivos.
El uno o más niveles de metilación de la mezcla pueden compararse con una pluralidad de niveles de metilación de referencia. Como ejemplo de utilización de un nivel de metilación pero de múltiples niveles de metilación de referencia, diferentes niveles de referencia pueden discriminar entre diferentes afecciones. Por ejemplo, el primer nivel de metilación de referencia puede determinar la primera clasificación de si el sujeto tiene la primera afección (por ejemplo, discriminar entre tener MI y no tener MI), y el segundo nivel de metilación de referencia puede determinar la segunda clasificación de si el sujeto tiene la segunda afección (por ejemplo, discriminar entre tener CNF y no tener CNF), por ejemplo, que se representa en las FIGS. 8, 11 y 15. Por lo tanto, las realizaciones pueden utilizar un nivel de referencia diferente para determinar una segunda clasificación de si el sujeto padece una segunda afección tomando como base la comparación.
El método puede incluir además el tratamiento del sujeto para la afección sensible a la clasificación de que el sujeto padece la afección, mejorando de este modo la afección (por ejemplo, para eliminar la afección o reducir su gravedad). Si la afección es cáncer, el tratamiento puede incluir cirugía, radioterapia, quimioterapia, inmunoterapia, terapia dirigida, terapia hormonal, trasplante de células madre o medicina de precisión. Tomando como base el nivel de afección determinado, se puede desarrollar un plan de tratamiento para disminuir el riesgo de daño al sujeto. Los métodos pueden incluir además el tratamiento del sujeto de acuerdo con el plan de tratamiento.
Las muestras biológicas pueden obtenerse en varios puntos temporales y analizarse independientemente en esos puntos temporales, o junto con las mediciones y clasificaciones en los otros puntos temporales. Algunos ejemplos de dichos puntos temporales incluyen antes y después del tratamiento del cáncer (por ejemplo, terapia dirigida, inmunoterapia, quimioterapia, cirugía), diferentes puntos temporales tras el diagnóstico de cáncer, antes y después de la progresión del cáncer, antes y después del desarrollo de metástasis, antes y después del aumento de la gravedad de la enfermedad o antes y después del desarrollo de complicaciones.
B. Utilización de los niveles de metilación en combinación con el tamaño/recuento
Como se describe en la sección V, las técnicas basadas en el recuento y/o en el tamaño pueden utilizarse en combinación con las técnicas de metilación. Dichas técnicas pueden implementarse de forma independiente, por ejemplo, proporcionando cada una de ellas una clasificación individual. A cada una de esas clasificaciones independientes se le puede exigir que proporcione un mismo resultado para poder ofrecer una clasificación final de ese resultado. En otras realizaciones, los valores de referencia de las diferentes técnicas pueden depender de los parámetros de otra técnica, por ejemplo, el valor de referencia del tamaño puede depender de un nivel de metilación medido para la muestra dada, como se ha descrito anteriormente para la FIG 27. En algunas implementaciones, cada parámetro (por ejemplo, un nivel de metilación) puede ser un elemento diferente de un vector, creando de este modo un punto de datos multidimensional a partir de los parámetros de una muestra dada. Cada uno de las parámetros puede determinarse a partir de la misma muestra o de muestras individuales, por ejemplo, que pueden obtenerse del sujeto aproximadamente al mismo tiempo.
En algunas realizaciones, la técnica basada en el tamaño puede implementarse del siguiente modo para analizar una muestra biológica del sujeto. La muestra puede ser la misma o una diferente a la utilizada para el análisis de metilación. La muestra biológica puede incluir una mezcla de moléculas de ADN acelulares procedentes de un genoma del sujeto y de uno o más de otros genomas (por ejemplo, un genoma vírico). Para cada una de una pluralidad de moléculas de ADN acelular de la muestra biológica, se puede determinar un tamaño y una ubicación, por ejemplo, como se describe en el presente documento. Por ejemplo, se pueden secuenciar ambos extremos de las moléculas de ADN (por ejemplo, para proporcionar una lectura de secuencia para toda la molécula de ADN o un par de lecturas de secuencia para los dos extremos) y alinear la(s) lectura(s) de secuencia con un genoma de referencia para determinar el tamaño. Por lo tanto, las realizaciones pueden medir un tamaño de la molécula de ADN e identificar una ubicación de la molécula de ADN en el genoma vírico particular. Estas moléculas de ADN acelular pueden ser las mismas que se utilizaron para el análisis de metilación, por ejemplo, donde se utilice una secuenciación sensible a la metilación. Los tamaños de la pluralidad de moléculas de ADN pueden formar una distribución de tamaños.
Puede determinarse un valor estadístico (por ejemplo, una relación de tamaño) de la distribución de tamaños. El valor estadístico puede compararse con un valor de tamaño de referencia determinado a partir de al menos dos cohortes de otros sujetos, que pueden ser las mismas dos cohortes utilizadas para el análisis de metilación. Las al menos dos cohortes pueden tener diferentes clasificaciones asociadas al genoma vírico particular, incluyendo una primera afección. Una clasificación basada en el tamaño de si el sujeto padece la primera afección puede determinarse tomando como base la comparación. La clasificación basada en el tamaño y la clasificación basada en la metilación pueden utilizarse conjuntamente para proporcionar una clasificación final. En las FIGS. 22, 23, 25 y 27 se proporcionan ejemplos de valores de tamaño de referencia.
En algunas realizaciones, la técnica basada en el recuento puede implementarse del siguiente modo para analizar una muestra biológica del sujeto. La muestra puede ser la misma o una diferente a la utilizada para el análisis de metilación. La muestra biológica puede incluir una mezcla de moléculas de ADN acelulares procedentes de un genoma del sujeto y de uno o más de otros genomas (por ejemplo, un genoma vírico).
Se puede determinar una cantidad de moléculas de ADN acelulares derivadas del genoma vírico particular en una muestra. En algunas realizaciones, para cada una de una pluralidad de moléculas de ADN acelular de la muestra biológica, se determina si la molécula deriva del genoma vírico particular, por ejemplo, mediante secuenciación o sondas, potencialmente junto con amplificaciones, tales como PCR. Por ejemplo, puede determinarse una ubicación, por ejemplo, ya sea de un genoma humano o de un genoma vírico particular. La ubicación puede determinarse utilizando una pluralidad de lecturas de secuencia obtenidas a partir de una secuenciación de la mezcla de ADN acelular. Puede determinarse una cantidad de la pluralidad de lecturas de secuencia que se alinean con el genoma vírico particular. Por ejemplo, se puede determinar una proporción de lecturas de secuencia alineadas con el genoma vírico en relación con un número total de lecturas de secuencia. El número total de lecturas de secuencia puede ser una suma de las lecturas de secuencia que se alinearon con un genoma de referencia correspondiente al virus y las lecturas de secuencia que se alinearon con un genoma humano. También pueden utilizarse otras relaciones descritas en el presente documento, por ejemplo, cantidad de lecturas del genoma vírico particular dividida por la cantidad de lecturas humanas.
La cantidad de lecturas de secuencia que se alinean con el genoma de referencia puede compararse con un valor de referencia determinado a partir de al menos dos cohortes de otros sujetos, que pueden ser las mismas dos cohortes utilizadas para el análisis de metilación y/o de tamaño. Las al menos dos cohortes pueden tener diferentes clasificaciones asociadas al genoma vírico particular, incluyendo una primera afección. Una clasificación basada en el recuento de si el sujeto padece la primera afección puede determinarse tomando como base la comparación. La clasificación basada en el recuento y la clasificación basada en la metilación pueden utilizarse conjuntamente para proporcionar una clasificación final. En las FIGS. 24-27 y 32A se proporcionan ejemplos de valores de recuento de referencia.
VIII. SISTEMAS ILUSTRATIVOS
La FIG. 34 ilustra un sistema 3400 de acuerdo con una realización de la presente invención. El sistema como se muestra incluye una muestra 3405, tal como moléculas de ADN acelular dentro de un portamuestras 3410, donde la muestra 3405 puede ponerse en contacto con un ensayo 3408 para proporcionar una señal de una característica física 3415. Un ejemplo de un portamuestras puede ser una celda de flujo que incluya sondas y/o cebadores de un ensayo o un tubo a través del cual se desplace una gota (gota que incluye el ensayo). Las características físicas 3415, tales como un valor de la intensidad de fluorescencia, de la muestra se detectan mediante el detector 3420. El detector 3420 puede realizar una medición a intervalos (por ejemplo, intervalos periódicos) para obtener puntos de datos que conformen una señal de datos. En una realización, un convertidor de analógico a digital convierte una señal analógica del detector a una forma digital en una pluralidad de momentos. El portamuestras 3410 y el detector 3420 pueden formar un dispositivo de ensayo, por ejemplo, un dispositivo de secuenciación que realiza la secuenciación de acuerdo con las realizaciones descritas en el presente documento. Se envía una señal de datos 3425 desde el detector 3420 al sistema lógico 3430. La señal de datos 3425 puede almacenarse en una memoria local 3435, una memoria externa 3440 o un dispositivo de almacenamiento 3445.
El sistema lógico 3430 puede ser, o puede incluir, un sistema informático, un circuito Integrado para aplicaciones específicas (ASIC, por sus siglas en inglés), un microprocesador, etc. También puede incluir o estar acoplado a una pantalla (por ejemplo, un monitor, una pantalla LED, etc.) y un dispositivo de entrada para el usuario (por ejemplo, ratón, teclado, botones, etc.). El sistema lógico 3430 y los demás componentes pueden formar parte de un sistema informático autónomo o estar conectados a una red, o pueden estar directamente acoplados o incorporados a un dispositivo termociclador. El sistema lógico 3430 también puede incluir un programa informático de optimización que se ejecuta en un procesador 3450. El sistema lógico 3430 puede incluir un medio informático que almacene instrucciones para controlar el sistema 3400 para que realice cualquiera de los métodos descritos en el presente documento.
Cualquiera de los sistemas informáticos mencionados en el presente documento puede utilizar cualquier número adecuado de subsistemas. En la FIG. 35, en el sistema informático 10, se muestran ejemplos de dichos subsistemas. En algunas realizaciones, un sistema informático incluye un único aparato informático, donde los subsistemas pueden ser los componentes del aparato informático. En otras realizaciones, un sistema informático puede incluir varios aparatos informáticos, siendo cada uno de ellos un subsistema, con componentes internos. Un sistema informático puede incluir ordenadores de escritorio y portátiles, tabletas, teléfonos móviles y otros dispositivos móviles.
Los subsistemas mostrados en la FIG. 35 están interconectados a través de un bus de sistema 75. Se muestran subsistemas adicionales tales como una impresora 74, un teclado 78, uno o varios dispositivos de almacenamiento 79, un monitor 76, que está acoplado a un adaptador de pantalla 82, y otros. Los dispositivos periféricos y de entrada/salida (I/O, por sus siglas en inglés), que se acoplan al controlador de entrada/salida 71, pueden conectarse al sistema informático mediante cualquier tipo de medio conocido en la técnica, tal como el puerto de entrada/salida 77 (por ejemplo, USB, FireWire). Por ejemplo, el puerto de entrada/salida 77 o la interfaz externa 81 (por ejemplo, Ethernet, Wi-Fi, etc.) pueden utilizarse para conectar el sistema informático 10 a una red de área amplia, tal como Internet, un dispositivo de entrada de ratón o un escáner. La interconexión mediante el bus de sistema 75 permite que el procesador central 73 se comunique con cada subsistema y así controlar la ejecución de una pluralidad de instrucciones procedentes de la memoria del sistema 72 o del dispositivo o dispositivos de almacenamiento 79 (por ejemplo, un disco fijo, tal como un disco duro o un disco óptico), así como el intercambio de información entre subsistemas. La memoria del sistema 72 y/o el o los dispositivos de almacenamiento 79 pueden ser realizaciones de un medio informático. Otro subsistema es un dispositivo de recogida de datos 85, tal como una cámara, micrófono, acelerómetro y similares. Cualquiera de los datos mencionados en el presente documento puede ser la salida de un componente a otro componente y puede ser la salida al usuario.
Un sistema informático puede incluir una pluralidad de los mismos componentes o subsistemas, por ejemplo, conectados entre sí por la interfaz externa 81, mediante una interfaz interna, o a través de dispositivos de almacenamiento extraíbles que pueden conectarse y desconectarse de un componente a otro componente. En algunas realizaciones, los sistemas, subsistemas o aparatos informáticos pueden comunicarse a través de una red. En dichos casos, un ordenador puede considerarse como cliente y otro ordenador como servidor, donde cada uno puede formar parte de un mismo sistema informático. Un cliente y un servidor pueden incluir cada uno múltiples sistemas, subsistemas o componentes.
Algunos aspectos de las realizaciones pueden implementarse en forma de lógica de control utilizando circuitos de un equipo físico (por ejemplo, un circuito integrado de aplicación específica o una matriz de puertas lógicas programables en campo) y/o utilizando programas informáticos con un procesador generalmente programable de forma modular o integrada. Como se utilizan en el presente documento, un procesador puede incluir un procesador de un solo núcleo, un procesador de varios núcleos en un mismo chip integrado, o múltiples unidades de procesamiento en una sola placa de circuito o en red, así como un equipo físico dedicado. Tomando como base la divulgación y las enseñanzas proporcionadas en el presente documento, un experto habitual en la materia conocerá y percibirá otras formas y/o métodos para implementar las realizaciones de la presente invención utilizando equipos físicos y una combinación de equipos físicos y programas informáticos.
Puede implementarse cualquiera de los componentes o las funciones de programas informáticos descritos en esta solicitud como código de programación para su ejecución mediante un procesador utilizando cualquier lenguaje informático adecuado, tal como, por ejemplo, Java, C, C++, C#, Objective-C, Swift o un lenguaje de guiones tal como Perl o Python utilizando, por ejemplo, técnicas convencionales u orientadas a objetos. El código de programación puede almacenarse como una serie de instrucciones o comandos en un medio informático para su almacenamiento y/o transmisión. Un medio informático no transitorio adecuado puede incluir una memoria de acceso aleatorio (RAM), una memoria de solo lectura (ROM), un medio magnético tal como un disco duro o un disquete, o un medio óptico tal como un disco compacto (CD) o un DVD (disco digital versátil), memoriaflashy similares. El medio informático puede ser cualquier combinación de tales dispositivos de almacenamiento o transmisión.
Dichos programas también pueden codificarse y transmitirse utilizando señales portadoras adaptadas para la transmisión a través de redes cableadas, ópticas y/o inalámbricas que se ajusten a una variedad de protocolos, incluyendo Internet. Como tal, se puede crear un medio informático utilizando una señal de datos codificada con dichos programas. Los medios informáticos codificados con el código del programa pueden empaquetarse con un dispositivo compatible o proporcionarse por separado de otros dispositivos (por ejemplo, a través de una descarga desde Internet). Cualquier medio informático puede residir en o dentro de un solo producto informático (por ejemplo, un disco duro, un CD o un sistema informático completo) y puede estar presente en o dentro de diferentes productos informáticos dentro de un sistema o una red. Un sistema informático puede incluir un monitor, una impresora u otro dispositivo de presentación adecuado para proporcionar a un usuario cualquiera de los resultados mencionados en el presente documento.
Cualquiera de los métodos descritos en el presente documento puede realizarse total o parcialmente con un sistema informático que incluya uno o más procesadores, que pueden configurarse para realizar las etapas. Por lo tanto, las realizaciones pueden dirigirse a sistemas informáticos configurados para realizar las etapas de cualquiera de los métodos descritos en el presente documento, potencialmente con diferentes componentes que realizan una etapa o un grupo de etapas respectivas. Aunque se presentan como etapas numeradas, las etapas de los métodos del presente documento pueden realizarse al mismo tiempo o en momentos diferentes o un orden diferente. Adicionalmente, pueden usarse partes de estas etapas con partes de otras etapas de otros métodos. También, la totalidad de una etapa o partes de la misma pueden ser opcionales. Adicionalmente, cualquiera de las etapas de cualquiera de los métodos puede realizarse con módulos, unidades, circuitos u otros medios de un sistema para realizar estas etapas.
Las realizaciones de la invención pueden dirigirse a realizaciones específicas relativas a cada aspecto individual, o a combinaciones específicas de estos aspectos individuales.
La descripción anterior de las realizaciones ilustrativas de la invención se ha presentado con fines ilustrativos y descriptivos. No pretende ser exhaustiva ni limitar la invención a la forma precisa descrita, y son posibles muchas modificaciones y variaciones a la luz de las enseñanzas anteriores. La invención está limitada, sin embargo, por el contenido de las reivindicaciones adjuntas.
Claims (14)
1. Un método de análisis de una muestra biológica de un sujeto que es un animal, incluyendo la muestra biológica una mezcla de moléculas de ADN acelular de una genoma del sujeto y de uno o más de otros genomas, método que comprende:
analizar una pluralidad de moléculas de ADN acelular de la muestra biológica, en donde el análisis de la pluralidad de moléculas de ADN acelular incluye:
identificar una ubicación de la molécula de ADN acelular en un genoma vírico particular; y
determinar si la molécula de ADN acelular está metilada en uno o más sitios del genoma vírico particular;
medir un nivel de metilación de la mezcla tomando como base las cantidades de la pluralidad de moléculas de ADN acelulares metiladas en un conjunto de sitios del genoma vírico particular, en donde el conjunto de sitios está en una pluralidad de regiones; comparar el nivel de metilación de la mezcla con uno o más niveles de metilación de referencia determinados a partir de al menos dos cohortes de otros sujetos, en donde las al menos dos cohortes tienen diferentes clasificaciones asociadas al genoma vírico particular, incluyendo las diferentes clasificaciones una primera afección; y
determinar una primera clasificación de si el sujeto padece la primera afección tomando como base la comparación.
2. El método de la reivindicación 1, en donde las diferentes clasificaciones de las al menos dos cohortes incluyen además una segunda afección, comprendiendo el método además:
determinar una segunda clasificación de si el sujeto padece la segunda afección tomando como base la comparación.
3. El método de la reivindicación 2, en donde el nivel de metilación de la mezcla se compara con una pluralidad de niveles de metilación de referencia que incluyen un primer nivel de metilación de referencia y un segundo nivel de metilación de referencia, en donde el primer nivel de metilación de referencia se utiliza para determinar la primera clasificación de si el sujeto padece la primera afección, y en donde el segundo nivel de metilación de referencia se utiliza para determinar la segunda clasificación de si el sujeto padece la segunda afección.
4. El método de la reivindicación 3, en donde el genoma vírico particular es del virus de Epstein-Barr y el sujeto es un ser humano, en donde la primera afección es cáncer nasofaríngeo, y en donde la segunda afección es mononucleosis infecciosa.
5. El método de una cualquiera de las reivindicaciones anteriores, en donde el genoma vírico particular es del virus de Epstein-Barr y el sujeto es un ser humano, y en donde la primera afección es un cáncer nasofaríngeo.
6. El método de una cualquiera de las reivindicaciones anteriores, en donde
la etapa de medir un nivel de metilación de la mezcla comprende medir N niveles de metilación de la mezcla, siendo N un número entero mayor de uno, en donde el nivel de metilación de la mezcla es uno de los N niveles de metilación de la mezcla, en donde cada uno de los N niveles de metilación de la mezcla se mide utilizando un conjunto respectivo de sitios a lo largo de una pluralidad respectiva de regiones, y
la etapa de comparar el nivel de metilación de la mezcla con uno o más niveles de metilación de referencia comprende comparar los N niveles de metilación de la mezcla con N niveles de metilación de referencia mediante:
la medición de las diferencias entre los N niveles de metilación de la mezcla y los N niveles de metilación de referencia; y
la determinación de si el sujeto pertenece a una de las al menos dos cohortes utilizando las diferencias.
7. El método de una cualquiera de las reivindicaciones anteriores, en donde el conjunto de sitios reside en una pluralidad de regiones que satisfacen, cada una, uno o más criterios, que incluyen (1) una diferencia en el nivel de metilación entre múltiples sujetos de una misma cohorte y/o (2) una diferencia en el nivel de metilación entre un sujeto de una cohorte y un sujeto de otra cohorte.
8. El método de una cualquiera de las reivindicaciones anteriores, en donde la comparación del nivel de metilación de la mezcla con el uno o más niveles de metilación de referencia determinados a partir de al menos dos cohortes de otros sujetos comprende:
la introducción del nivel de metilación de la mezcla en un modelo de aprendizaje automático que se haya entrenado utilizando el uno o más niveles de metilación de referencia determinados a partir de las al menos dos cohortes de otros sujetos.
9. El método de una cualquiera de las reivindicaciones anteriores, que comprende además:
para cada sitio del conjunto de sitios:
determinar un número respectivo de moléculas de ADN que están metiladas en el sitio, determinando de este modo las cantidades de la pluralidad de moléculas de ADN acelulares metiladas en el conjunto de sitios del genoma vírico particular, y el método comprende además:
realizar la secuenciación sensible a la metilación de la pluralidad de moléculas de ADN acelular para obtener lecturas de secuencia; y
alinear las lecturas de la secuencia con el genoma vírico particular para determinar el número respectivo de moléculas de ADN que están metiladas en cada sitio del conjunto de sitios.
10. El método de una cualquiera de las reivindicaciones anteriores, en donde un grupo de la pluralidad de moléculas de ADN acelulares se analizan colectivamente para determinar las cantidades de la pluralidad de moléculas de ADN acelulares metiladas en el conjunto de sitios del genoma vírico particular.
11. El método de una cualquiera de las reivindicaciones anteriores, en donde el genoma vírico particular corresponde al virus de Epstein-Barr, el virus del papiloma humano o el virus de la hepatitis B.
12. El método de una cualquiera de las reivindicaciones anteriores, que comprende además:
para cada una de un conjunto de moléculas de ADN acelular de una muestra:
medir un tamaño de la molécula de ADN acelular; e
identificar una ubicación de la molécula de ADN acelular en el genoma vírico particular, formando los tamaños del conjunto de moléculas de ADN acelulares una distribución de tamaños, siendo la muestra la muestra biológica o una muestra diferente que incluya una mezcla de moléculas de ADN acelulares procedentes del genoma del sujeto y del uno o más de otros genomas;
determinar un valor estadístico de la distribución de tamaños;
comparar el valor estadístico con un valor de tamaño de referencia determinado a partir de las al menos dos cohortes de otros sujetos; determinar una segunda clasificación de si el sujeto padece la primera afección tomando como base la comparación del valor estadístico con el valor del tamaño de referencia; y
determinar una clasificación final utilizando la primera clasificación y la segunda clasificación.
13. El método de una cualquiera de las reivindicaciones anteriores, que comprende además:
determinar una cantidad de moléculas de ADN acelulares derivadas del genoma vírico particular en una muestra, siendo la muestra la muestra biológica o una muestra diferente que incluya una mezcla de moléculas de ADN acelulares procedentes del genoma del sujeto y del uno o más de otros genomas;
comparando la cantidad con un valor de referencia determinado a partir de las al menos dos cohortes de otros sujetos;
determinar una segunda clasificación de si el sujeto padece la primera afección tomando como base la comparación de la cantidad con el valor de referencia; y
determinar una clasificación final utilizando la primera clasificación y la segunda clasificación.
14. Un programa informático que comprende una pluralidad de instrucciones que pueden ejecutarse en un sistema informático que, cuando se ejecutan, controlan el sistema informático para que realice las etapas informáticas del método de una cualquiera de las reivindicaciones anteriores.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762537328P | 2017-07-26 | 2017-07-26 | |
PCT/CN2018/097072 WO2019020057A1 (en) | 2017-07-26 | 2018-07-25 | ENHANCING CANCER SCREENING WITH ACELLULAR VIRAL NUCLEIC ACIDS |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2959360T3 true ES2959360T3 (es) | 2024-02-23 |
Family
ID=65039389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES18838558T Active ES2959360T3 (es) | 2017-07-26 | 2018-07-25 | Mejora del cribado del cáncer mediante ácidos nucleicos víricos acelulares |
Country Status (14)
Country | Link |
---|---|
US (3) | US10731224B2 (es) |
EP (2) | EP4234723A3 (es) |
JP (2) | JP2020527958A (es) |
KR (1) | KR20200035427A (es) |
CN (1) | CN111051536A (es) |
AU (2) | AU2018305609B2 (es) |
CA (1) | CA3070898A1 (es) |
DK (1) | DK3658684T3 (es) |
ES (1) | ES2959360T3 (es) |
IL (2) | IL272030B2 (es) |
PH (1) | PH12020500156A1 (es) |
SG (1) | SG11202000609SA (es) |
TW (1) | TWI860979B (es) |
WO (1) | WO2019020057A1 (es) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3535415A4 (en) | 2016-10-24 | 2020-07-01 | The Chinese University of Hong Kong | TUMOR DETECTION METHODS AND SYSTEMS |
DK3574108T3 (da) | 2017-01-25 | 2024-09-16 | Univ Hong Kong Chinese | Diagnostisk anvendelse ved brug af nukleinsyrefragment |
AU2018305609B2 (en) * | 2017-07-26 | 2023-01-19 | The Chinese University Of Hong Kong | Enhancement of cancer screening using cell-free viral nucleic acids |
WO2020206041A1 (en) * | 2019-04-02 | 2020-10-08 | Grail, Inc. | Stratification of risk of virus associated cancers |
EP4168592A1 (en) * | 2020-06-20 | 2023-04-26 | Grail, LLC | Detection and classification of human papillomavirus associated cancers |
EP4247979A4 (en) * | 2020-11-18 | 2024-09-25 | Ultima Genomics, Inc. | METHODS AND SYSTEMS FOR DETECTION OF RESIDUAL DISEASE |
CN114457192B (zh) * | 2021-07-07 | 2023-02-07 | 中山大学 | 对唾液中EB病毒CpG位点进行甲基化分型的试剂在制备鼻咽癌诊断试剂盒中的应用 |
US20230313314A1 (en) * | 2022-02-07 | 2023-10-05 | Centre For Novostics Limited | Fragmentation for measuring methylation and disease |
CN116694762B (zh) * | 2023-05-06 | 2025-03-28 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 一种检测鼻咽癌的试剂盒 |
CN120048351A (zh) * | 2025-04-22 | 2025-05-27 | 深圳市睿法生物科技有限公司 | 基于靶标区域甲基化分析的测序数据处理方法及系统 |
Family Cites Families (84)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL354348A1 (en) | 1999-04-02 | 2004-01-12 | Corixa Corporation | Compounds and methods for therapy and diagnosis of lung cancer |
US20030219765A1 (en) | 2000-03-23 | 2003-11-27 | Jose Costa | Methods for evaluating cancer risk |
EP1468104A4 (en) | 2002-01-18 | 2006-02-01 | Genzyme Corp | METHODS FOR DETECTION OF FETAL DNA AND QUANTIFICATION OF ALLELES |
ES2253461T3 (es) | 2002-03-05 | 2006-06-01 | Epigenomics Ag | Procedimiento y dispositivo para la determinacion de la especificidad del tejido y del adn que flota libre en tejidos corporales. |
US7704687B2 (en) | 2002-11-15 | 2010-04-27 | The Johns Hopkins University | Digital karyotyping |
US8394582B2 (en) | 2003-03-05 | 2013-03-12 | Genetic Technologies, Inc | Identification of fetal DNA and fetal cell markers in maternal plasma or serum |
PL201608B1 (pl) | 2003-06-13 | 2009-04-30 | Cezary Cybulski | Sposób i zestaw do wykrywania wysokiej genetycznie uwarunkowanej predyspozycji do raka prostaty oraz zastosowanie zmiany germinalnej w obrębie genu NBS1 |
DE60328193D1 (de) | 2003-10-16 | 2009-08-13 | Sequenom Inc | Nicht invasiver Nachweis fötaler genetischer Merkmale |
EP1751306A1 (en) | 2004-04-30 | 2007-02-14 | Yale University | Methods and compositions for cancer diagnosis |
CN1790021A (zh) | 2004-12-15 | 2006-06-21 | 杨华显 | 利用循环伊波病毒dna对前癌、原位癌和癌病灶的筛查 |
US20070122823A1 (en) | 2005-09-01 | 2007-05-31 | Bianchi Diana W | Amniotic fluid cell-free fetal DNA fragment size pattern for prenatal diagnosis |
EP2423334A3 (en) | 2006-02-02 | 2012-04-18 | The Board of Trustees of The Leland Stanford Junior University | Non-invasive fetal genetic screening by digital analysis |
DK2351858T3 (da) | 2006-02-28 | 2015-04-07 | Univ Louisville Res Found | Påvisning af føtale kromosomabnormiteter ved anvendelse af tandem-enkeltnukleotid-polymorfismer |
WO2008024009A1 (fr) | 2006-08-15 | 2008-02-28 | Institut Molekulyarnoi Genetiki Rossiiskoi Akademii Nauk (Img Ran) | Niveau de transcription du gène timp3 utilisé en tant que marqueur servant à diagnostiquer le cancer du poumon non à petites cellules |
US7842482B2 (en) | 2007-02-26 | 2010-11-30 | The Chinese University Of Hong Kong | Methods and kits for diagnosis, prognosis or monitoring of Epstein-Barr virus (EBV)-associated cancer |
EP2535425A1 (en) | 2007-05-25 | 2012-12-19 | Decode Genetics EHF. | Variantes génétiques sur les chr 10q26 utilisées comme marqueurs dans l'évaluation, le diagnostic, le pronostic et le traitement d'un risque de cancer du sein |
US12180549B2 (en) | 2007-07-23 | 2024-12-31 | The Chinese University Of Hong Kong | Diagnosing fetal chromosomal aneuploidy using genomic sequencing |
EP2557518B1 (en) | 2007-07-23 | 2017-03-15 | The Chinese University of Hong Kong | Determining a nucleic acid sequence imbalance |
US20090053719A1 (en) | 2007-08-03 | 2009-02-26 | The Chinese University Of Hong Kong | Analysis of nucleic acids by digital pcr |
US20100041048A1 (en) | 2008-07-31 | 2010-02-18 | The Johns Hopkins University | Circulating Mutant DNA to Assess Tumor Dynamics |
US8835110B2 (en) | 2008-11-04 | 2014-09-16 | The Johns Hopkins University | DNA integrity assay (DIA) for cancer diagnostics, using confocal fluorescence spectroscopy |
US20100136560A1 (en) | 2008-12-02 | 2010-06-03 | The Johns Hopkins University | Integrated Analyses of Breast and Colorectal Cancers |
CA2757131A1 (en) | 2009-03-31 | 2010-10-07 | Marcus Otte | Method for diagnosis of cancer and monitoring of cancer treatments |
EP2483426A4 (en) | 2009-10-02 | 2013-04-10 | Ct For Addiction And Mental Health | METHOD FOR ANALYZING DNA METHYLATION PROFILES OF CELL-FREE CIRCULATING DNA IN BODY FLUIDS |
CA2778926C (en) | 2009-10-26 | 2018-03-27 | Lifecodexx Ag | Means and methods for non-invasive diagnosis of chromosomal aneuploidy |
WO2011053790A2 (en) | 2009-10-30 | 2011-05-05 | Fluidigm Corporation | Assay of closely linked targets in fetal diagnosis and coincidence detection assay for genetic analysis |
AU2010315037B9 (en) | 2009-11-05 | 2015-04-23 | Sequenom, Inc. | Fetal genomic analysis from a maternal biological sample |
ES3026544T3 (en) | 2009-11-06 | 2025-06-11 | Univ Hong Kong Chinese | Size-based genomic analysis for prenatal diagnosis |
GB0922006D0 (en) | 2009-12-17 | 2010-02-03 | Genome Res Ltd | Diagnostic |
CA2786564A1 (en) | 2010-01-19 | 2011-07-28 | Verinata Health, Inc. | Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing |
PL2366031T3 (pl) | 2010-01-19 | 2015-08-31 | Verinata Health Inc | Metody sekwencjonowania w diagnostyce prenatalnej |
EP2536854B1 (en) | 2010-02-18 | 2017-07-19 | The Johns Hopkins University | Personalized tumor biomarkers |
US10047397B2 (en) | 2010-04-16 | 2018-08-14 | Chronix Biomedical | Breast cancer associated circulating nucleic acid biomarkers |
EP2426217A1 (en) * | 2010-09-03 | 2012-03-07 | Centre National de la Recherche Scientifique (CNRS) | Analytical methods for cell free nucleic acids and applications |
KR102333664B1 (ko) | 2010-11-30 | 2021-12-01 | 더 차이니즈 유니버시티 오브 홍콩 | 암과 연관된 유전적 또는 분자적 이상들의 검출 |
US20120190020A1 (en) | 2011-01-25 | 2012-07-26 | Aria Diagnostics, Inc. | Detection of genetic abnormalities |
US20140178348A1 (en) | 2011-05-25 | 2014-06-26 | The Regents Of The University Of California | Methods using DNA methylation for identifying a cell or a mixture of cells for prognosis and diagnosis of diseases, and for cell remediation therapies |
WO2013015793A1 (en) | 2011-07-26 | 2013-01-31 | Verinata Health, Inc. | Method for determining the presence or absence of different aneuploidies in a sample |
CN113388606A (zh) | 2011-09-26 | 2021-09-14 | 凯杰有限公司 | 用于分离细胞外核酸的快速方法 |
WO2013052913A2 (en) | 2011-10-06 | 2013-04-11 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
ES2729554T3 (es) | 2011-10-21 | 2019-11-04 | Chronix Biomedical | Biomarcadores de ácidos nucleicos en circulación asociados al cáncer colorrectal |
WO2013060762A1 (en) | 2011-10-25 | 2013-05-02 | Roche Diagnostics Gmbh | Method for diagnosing a disease based on plasma-dna distribution |
US10214775B2 (en) | 2011-12-07 | 2019-02-26 | Chronix Biomedical | Prostate cancer associated circulating nucleic acid biomarkers |
US9892230B2 (en) | 2012-03-08 | 2018-02-13 | The Chinese University Of Hong Kong | Size-based analysis of fetal or tumor DNA fraction in plasma |
CA2867293C (en) | 2012-03-13 | 2020-09-01 | Abhijit Ajit PATEL | Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing |
US11261494B2 (en) | 2012-06-21 | 2022-03-01 | The Chinese University Of Hong Kong | Method of measuring a fractional concentration of tumor DNA |
WO2014004726A1 (en) | 2012-06-26 | 2014-01-03 | Caifu Chen | Methods, compositions and kits for the diagnosis, prognosis and monitoring of cancer |
US10988803B2 (en) | 2014-12-29 | 2021-04-27 | Life Genetics Lab, Llc | Multiplexed assay for quantitating and assessing integrity of cell-free DNA in biological fluids for cancer diagnosis, prognosis and surveillance |
WO2014039556A1 (en) | 2012-09-04 | 2014-03-13 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
US9732390B2 (en) * | 2012-09-20 | 2017-08-15 | The Chinese University Of Hong Kong | Non-invasive determination of methylome of fetus or tumor from plasma |
PL2898100T5 (pl) | 2012-09-20 | 2023-11-06 | The Chinese University Of Hong Kong | Nieinwazyjny sposób określania metylomu płodu lub guza z wykorzystaniem osocza |
GB2526736A (en) | 2013-02-21 | 2015-12-02 | Toma Biosciences Inc | Methods, compositions, and kits for nucleic acid analysis |
CA2906818C (en) | 2013-03-15 | 2022-08-16 | Verinata Health, Inc. | Generating cell-free dna libraries directly from blood |
US10174375B2 (en) | 2013-09-20 | 2019-01-08 | The Chinese University Of Hong Kong | Sequencing analysis of circulating DNA to detect and monitor autoimmune diseases |
US10262755B2 (en) | 2014-04-21 | 2019-04-16 | Natera, Inc. | Detecting cancer mutations and aneuploidy in chromosomal segments |
AU2014332241B2 (en) | 2013-10-07 | 2021-04-29 | Sequenom, Inc. | Methods and processes for non-invasive assessment of chromosome alterations |
US20150119260A1 (en) | 2013-10-18 | 2015-04-30 | National Taiwan University | Circulating cancer biomarker and its use |
DK4026917T5 (da) | 2014-04-14 | 2024-07-15 | Yissum Research And Development Company Of The Hebrew Univ Of Jerusalem Ltd | Fremgangsmåde og kit til bestemmelse af cellers eller vævs død eller dna's vævs- eller celleoprindelse ved dna-methyleringsanalyse |
CN107223159A (zh) | 2014-05-09 | 2017-09-29 | 科戴克斯生命股份公司 | 源自特定细胞类型的dna的检测及相关方法 |
US9840742B2 (en) * | 2014-06-16 | 2017-12-12 | JBS Science Inc. | Detection of hepatitis B virus (HBV) DNA and methylated HBV DNA in urine of patients with HBV-associated hepatocellular carcinoma |
US20160002717A1 (en) | 2014-07-02 | 2016-01-07 | Boreal Genomics, Inc. | Determining mutation burden in circulating cell-free nucleic acid and associated risk of disease |
EP3169813B1 (en) * | 2014-07-18 | 2019-06-12 | The Chinese University Of Hong Kong | Methylation pattern analysis of tissues in dna mixture |
HRP20220045T1 (hr) | 2014-07-25 | 2022-04-15 | Bgi Genomics Co., Limited | Postupak za određivanje frakcije slobodnih fetalnih nukleinskih kiselina u uzorku periferne krvi trudnice i njihova uporaba |
JP2017522908A (ja) | 2014-07-25 | 2017-08-17 | ユニヴァーシティ オブ ワシントン | セルフリーdnaを生じる組織及び/又は細胞タイプを決定する方法、並びにそれを用いて疾患又は異常を識別する方法 |
HUE049094T2 (hu) | 2014-10-01 | 2020-09-28 | Chronix Biomedical | Sejtmentes DNS kvantifikálási módszerei |
WO2016085876A1 (en) | 2014-11-25 | 2016-06-02 | The Broad Institute Inc. | Clonal haematopoiesis |
CA2967447A1 (en) | 2014-12-05 | 2016-06-09 | Foundation Medicine, Inc. | Multigene analysis of tumor samples |
EP3502273B1 (en) | 2014-12-12 | 2020-07-08 | Verinata Health, Inc. | Cell-free dna fragment |
EP3240911B1 (en) | 2014-12-31 | 2020-08-26 | Guardant Health, Inc. | Detection and treatment of disease exhibiting disease cell heterogeneity and systems and methods for communicating test results |
US11242559B2 (en) | 2015-01-13 | 2022-02-08 | The Chinese University Of Hong Kong | Method of nuclear DNA and mitochondrial DNA analysis |
US10364467B2 (en) | 2015-01-13 | 2019-07-30 | The Chinese University Of Hong Kong | Using size and number aberrations in plasma DNA for detecting cancer |
US10319463B2 (en) | 2015-01-23 | 2019-06-11 | The Chinese University Of Hong Kong | Combined size- and count-based analysis of maternal plasma for detection of fetal subchromosomal aberrations |
CN107771221B (zh) | 2015-02-10 | 2021-11-02 | 香港中文大学 | 用于癌症筛查和胎儿分析的突变检测 |
CN107750279A (zh) | 2015-03-16 | 2018-03-02 | 个人基因组诊断公司 | 核酸分析系统和方法 |
EP4063517A1 (en) * | 2015-07-20 | 2022-09-28 | The Chinese University Of Hong Kong | Methylation pattern analysis of haplotypes in tissues in dna mixture |
ES2960201T3 (es) | 2015-07-23 | 2024-03-01 | Univ Hong Kong Chinese | Análisis de los patrones de fragmentación del ADN acelular |
WO2017019751A1 (en) * | 2015-07-27 | 2017-02-02 | The Johns Hopkins University | Method to use viral and host methylation markers for cervical cancer screening and triage in liquid prep, serum/plasma, and urine: pcr and sequencing based process methods |
EP3390657B1 (en) * | 2015-12-17 | 2020-09-16 | Illumina, Inc. | Distinguishing methylation levels in complex biological samples |
CN108603236A (zh) * | 2015-12-18 | 2018-09-28 | 路胜基因(新加坡)私人有限公司 | 检测和定量微生物的靶核酸序列 |
US10095831B2 (en) | 2016-02-03 | 2018-10-09 | Verinata Health, Inc. | Using cell-free DNA fragment size to determine copy number variations |
EP3885447B1 (en) | 2016-05-30 | 2024-01-10 | The Chinese University Of Hong Kong | Detecting hematological disorders using cell-free dna in blood |
EP3535415A4 (en) | 2016-10-24 | 2020-07-01 | The Chinese University of Hong Kong | TUMOR DETECTION METHODS AND SYSTEMS |
DK3574108T3 (da) | 2017-01-25 | 2024-09-16 | Univ Hong Kong Chinese | Diagnostisk anvendelse ved brug af nukleinsyrefragment |
AU2018305609B2 (en) * | 2017-07-26 | 2023-01-19 | The Chinese University Of Hong Kong | Enhancement of cancer screening using cell-free viral nucleic acids |
-
2018
- 2018-07-25 AU AU2018305609A patent/AU2018305609B2/en active Active
- 2018-07-25 CN CN201880055081.1A patent/CN111051536A/zh active Pending
- 2018-07-25 IL IL272030A patent/IL272030B2/en unknown
- 2018-07-25 EP EP23171661.4A patent/EP4234723A3/en active Pending
- 2018-07-25 KR KR1020207005415A patent/KR20200035427A/ko active Pending
- 2018-07-25 SG SG11202000609SA patent/SG11202000609SA/en unknown
- 2018-07-25 CA CA3070898A patent/CA3070898A1/en active Pending
- 2018-07-25 ES ES18838558T patent/ES2959360T3/es active Active
- 2018-07-25 DK DK18838558.7T patent/DK3658684T3/da active
- 2018-07-25 IL IL316163A patent/IL316163A/en unknown
- 2018-07-25 EP EP18838558.7A patent/EP3658684B1/en active Active
- 2018-07-25 JP JP2020503956A patent/JP2020527958A/ja active Pending
- 2018-07-25 WO PCT/CN2018/097072 patent/WO2019020057A1/en unknown
- 2018-07-26 US US16/046,795 patent/US10731224B2/en active Active
- 2018-07-26 TW TW107125941A patent/TWI860979B/zh active
-
2020
- 2020-01-21 PH PH12020500156A patent/PH12020500156A1/en unknown
- 2020-06-25 US US16/912,410 patent/US12234515B2/en active Active
-
2023
- 2023-04-14 AU AU2023202318A patent/AU2023202318A1/en active Pending
- 2023-08-03 JP JP2023126899A patent/JP2023145696A/ja active Pending
-
2024
- 2024-12-31 US US19/007,260 patent/US20250137071A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
IL272030B2 (en) | 2025-03-01 |
EP3658684B1 (en) | 2023-08-30 |
WO2019020057A1 (en) | 2019-01-31 |
EP4234723A3 (en) | 2023-09-20 |
TW201920683A (zh) | 2019-06-01 |
IL272030A (en) | 2020-03-31 |
JP2020527958A (ja) | 2020-09-17 |
US12234515B2 (en) | 2025-02-25 |
US20250137071A1 (en) | 2025-05-01 |
US20200325546A1 (en) | 2020-10-15 |
US10731224B2 (en) | 2020-08-04 |
IL272030B1 (en) | 2024-11-01 |
CN111051536A (zh) | 2020-04-21 |
PH12020500156A1 (en) | 2020-09-14 |
KR20200035427A (ko) | 2020-04-03 |
JP2023145696A (ja) | 2023-10-11 |
AU2023202318A1 (en) | 2023-05-11 |
AU2018305609B2 (en) | 2023-01-19 |
IL316163A (en) | 2024-12-01 |
US20190032145A1 (en) | 2019-01-31 |
EP3658684A4 (en) | 2021-04-14 |
EP4234723A2 (en) | 2023-08-30 |
DK3658684T3 (da) | 2023-10-09 |
CA3070898A1 (en) | 2019-01-31 |
EP3658684A1 (en) | 2020-06-03 |
TWI860979B (zh) | 2024-11-11 |
SG11202000609SA (en) | 2020-02-27 |
AU2018305609A1 (en) | 2020-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2959360T3 (es) | Mejora del cribado del cáncer mediante ácidos nucleicos víricos acelulares | |
US20230132951A1 (en) | Methods and systems for tumor detection | |
AU2018212272B2 (en) | Diagnostic applications using nucleic acid fragments | |
TWI858044B (zh) | 與病毒相關的癌症的風險分級 | |
US20230103637A1 (en) | Sequencing of viral dna for predicting disease relapse | |
HK40029037B (en) | Enhancement of cancer screening using cell-free viral nucleic acids | |
HK40029037A (en) | Enhancement of cancer screening using cell-free viral nucleic acids | |
HK40023330A (en) | Enhancement of cancer screening using cell-free viral nucleic acids | |
HK40063165A (en) | Stratification of risk of virus associated cancers | |
HK40006242A (zh) | 用於腫瘤檢測的方法和系統 |