[go: up one dir, main page]

ES2523140T3 - Aumento de la confianza en las identificaciones de alelos con el recuento molecular - Google Patents

Aumento de la confianza en las identificaciones de alelos con el recuento molecular Download PDF

Info

Publication number
ES2523140T3
ES2523140T3 ES11810645.9T ES11810645T ES2523140T3 ES 2523140 T3 ES2523140 T3 ES 2523140T3 ES 11810645 T ES11810645 T ES 11810645T ES 2523140 T3 ES2523140 T3 ES 2523140T3
Authority
ES
Spain
Prior art keywords
dbr
sample
adapter
polynucleotides
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11810645.9T
Other languages
English (en)
Inventor
James Casbon
Sydney Brenner
Robert Osborne
Conrad Lichtenstein
Andreas Claas
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Population Genetics Technologies Ltd
Original Assignee
Population Genetics Technologies Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=45498036&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2523140(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Population Genetics Technologies Ltd filed Critical Population Genetics Technologies Ltd
Application granted granted Critical
Publication of ES2523140T3 publication Critical patent/ES2523140T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Virology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Un método de estimación del número de moléculas de polinucleótidos de partida secuenciadas a partir de múltiples muestras, comprendiendo el método: unir un adaptador a las moléculas de polinucleótidos de partida de múltiples muestras diferentes, en donde el adaptador para cada muestra comprende: una marca de un único identificador multiplex (MID) específico para la muestra, haciendo posible la marca del identificador multiplex la identificación de la muestra a partir de la cual se deriva un polinucleótido; y una región de bases degeneradas (DBR) que comprende al menos una base de nucleótidos seleccionada de: R, Y, S, W, K, M, B, D, H, V, N, y las versiones modificadas de las mismas, siendo la degeneración de las DBR de tal modo que es probable que cada polinucleótido individual tenga una DBR diferente; reunir las múltiples muestras unidas a adaptadores diferentes para generar una muestra conjunta; amplificar los polinucleótidos unidos al adaptador en la muestra conjunta; secuenciar una pluralidad de los polinucleótidos amplificados unidos al adaptador, en donde se obtiene la secuencia del MID, de la DBR y de al menos una porción del polinucleótido, para cada uno de la pluralidad de polinucleótidos unidos al adaptador; y determinar el número de secuencias de DBR definidas presentes en la pluralidad de polinucleótidos secuenciados unidos al adaptador a partir de cada muestra, para determinar el número de polinucleótidos de partida de cada muestra que fueron secuenciados en la etapa de secuenciación

Description

Aumento de la confianza en las identificaciones de alelos con el recuento molecular
Antecedentes
El genotipado es una técnica importante de la investigación genética para la cartografía de un genoma y la localización de genes que están ligados a características hereditarias (por ejemplo, enfermedades genéticas). El genotipo de un sujeto generalmente incluye la determinación de los alelos para uno o más locus genómicos en base a los datos de secuenciación obtenidos a partir del ADN del sujeto. Los genomas diploides (p. ej., los genomas humanos) se pueden clasificar, por ejemplo, como homocigóticos o heterocigóticos en un locus genómico dependiendo del número de alelos diferentes que tienen para ese locus, donde los individuos heterocigóticos tienen dos alelos diferentes para un locus y los individuos homocigóticos tienen dos copias del mismo alelo para el locus. El genotipado apropiado de las muestras es crucial cuando se realizan estudios en las grandes poblaciones que se necesitan para relacionar el genotipo con el fenotipo con alta confianza estadística.
En el análisis de genotipado de los genomas diploides por secuenciación, se utiliza la cobertura (número de lecturas de secuenciación) para un locus genómico particular, para establecer la confianza de una identificación de alelos. Sin embargo, la confianza en la identificación de alelos se reduce significativamente cuando se introduce un sesgo durante la preparación de la muestra, p. ej., cuando la muestra de partida está en cantidades limitantes y/o cuando se emplean una o más reacciones de amplificación para preparar la muestra para la secuenciación. Así, en las muestras que tienen cantidades limitadas de ADN, se puede ver una alta cobertura (es decir, un alto número de lecturas de secuenciación) para un alelo de un cromosoma por encima del alelo de un cromosoma diferente debido al sesgo de la amplificación (por ejemplo, amplificación de solamente algunas, o incluso de solamente una molécula de polinucleótido). En este caso, la cobertura por sí sola puede ser engañosa cuando se mide la confianza en una identificación de alelos.
La presente invención encuentra utilidad para aumentar la confianza en la identificación de alelos así como en otras aplicaciones basadas en el análisis de secuencias de ácido nucleico, especialmente en el contexto de estudio de genotipos en una población grande de muestras.
Sumario de la invención
Algunos aspectos de la presente invención incluyen métodos y composiciones para determinar el número de moléculas de polinucleótidos individuales que se originan a partir de la misma región genómica de la misma muestra original que han sido secuenciadas en una configuración o procedimiento particular de análisis de secuencias. En estos aspectos de la invención, una región de bases degeneradas (DBR) se une a las moléculas de polinucleótidos de partida que se secuencian posteriormente (p. ej., después de que se hayan llevado a cabo ciertas etapas del procedimiento, p. ej., amplificación y/o enriquecimiento). El número de secuencias de DBR diferentes presentes en un ciclo de secuenciación se puede utilizar para determinar/estimar el número de moléculas de polinucleótidos individuales que se originan a partir de la misma región genómica de la misma muestra original que han sido secuenciadas en una configuración o procedimiento particular de análisis de secuencias. Las DBR se pueden utilizar para mejorar el análisis de muchas aplicaciones diferentes de secuenciación de ácidos nucleicos. Por ejemplo, las DBR permiten la determinación de un valor estadístico para una identificación de alelos en ensayos de genotipado que no se pueden derivar sólo del número de lecturas.
Según un aspecto de la presente invención, se proporciona un método para estimar el número de moléculas de polinucleótidos de partida secuenciadas a partir de múltiples muestras como se especifica en la reivindicación 1.
El adaptador puede comprender además una secuencia refleja y/o un sitio promotor.
La etapa de secuenciación puede comprender la realización de un procedimiento de secuenciación de nueva generación.
Las múltiples muestras diferentes pueden ser muestras de ADN genómico derivadas de diferentes sujetos.
El método se puede diseñar para determinar la heterogeneidad genética de los polinucleótidos de la muestra, o de múltiples muestras diferentes.
Breve descripción de los dibujos
La invención se entenderá mejor a partir de la siguiente descripción detallada cuando se lea conjuntamente con los dibujos que la acompañan. En los dibujos se incluyen las siguientes figuras:
Figura 1 que muestra la relación de alelos para cada MID en muestras preparadas a partir de la cantidad indicada de material de partida (parte superior de cada panel; en nanogramos).
Figura 2 que muestra la fracción de secuencias de DBR para cada MID asociadas con cada alelo en una posición polimórfica sintética. Se prepararon muestras a partir de la cantidad indicada de material de partida (parte superior de cada panel; en nanogramos).
Figura 3 que muestra los productos producidos en los dos primeros ciclos de la PCR utilizando cebadores que tienen secuencias de DBR.
Definiciones
A menos que se defina otra cosa, todos los términos técnicos y científicos usados en este documento tienen el mismo significado que es entendido comúnmente por los expertos en la técnica a la que pertenece esta invención. Sin embargo, ciertos elementos se definen en aras de la claridad y facilidad de referencia.
Los términos y símbolos de la química del ácido nucleico, bioquímica, genética y biología molecular que se utilizan aquí siguen los de los tratados y textos estándar de la materia, p. ej., Kornberg and Baker, DNA Replication, Second Edition (W.H. Freeman, New York, 1992); Lehninger, Biochemistry, Second Edition (Worth Publishers, New York, 1975); Strachan and Read, Human Molecular Genetics, Second Edition (Wiley-Liss, New York, 1999); Eckstein, editor, Oligonucleotides and Analogs: A practical Approach (Oxford University Press, New York, 1991); Gait, editor, Oligonucleotide Synthesis: A Practical Approach (IRL Press, Oxford, 1984); y similares.
"Amplicón", significa el producto de una reacción de amplificación de polinucleótidos. Es decir, es una población de polinucleótidos, normalmente de doble cadena, que se replican a partir de una o más secuencias de partida. Las una
o más secuencias de partida pueden ser una o más copias de la misma secuencia, o pueden ser una mezcla de diferentes secuencias. Los amplicones se pueden producir por una variedad de reacciones de amplificación cuyos productos son múltiples replicados de uno o más ácidos nucleicos diana. En general, las reacciones de amplificación que producen amplicones están "basadas en moldes" porque el apareamiento de bases de los reactantes, ya sean nucleótidos u oligonucleótidos, tienen en un polinucleótido molde los complementos que se requieren para la creación de los productos de reacción. En un aspecto, las reacciones basadas en moldes son extensiones de cebadores con una polimerasa de ácido nucleico o ligamientos de oligonucleótidos con una ligasa de ácido nucleico. Dichas reacciones incluyen, pero no se limitan a, reacciones en cadena de la polimerasa (PCR), reacciones lineales de la polimerasa, amplificación basada en secuencias de ácido nucleico (NASBA), amplificaciones por círculo rodante, y similares, descritas en las siguientes referencias: Mullis et al., patentes de Estados Unidos 4.683.195; 4.965.188; 4.683.202; 4.800.159 (PCR); Gelfand et al., patente de Estados Unidos 5.210.015 (PCR en tiempo real con sondas "TAQMAN™"); Wittwer et al., patente de Estados Unidos 6.174.670; Kacian et al., patente de Estados Unidos 5.399.491 ("NASBA"); Lizardi, patente de Estados Unidos 5.854.033; Aono et al., publicación de patente japonesa JP 4-262799 (amplificación por círculo rodante); y similares. En un aspecto, los amplicones de la invención son producidos por las PCR. Una reacción de amplificación puede ser una amplificación "en tiempo real" si existe disponible una química de detección que permita medir un producto de reacción mientras progresa la reacción de amplificación, p. ej., "PCR en tiempo real" descrita a continuación, o "NASBA en tiempo real", tal como se describe en Leone et al., Nucleic Acids Research, 26: 2150-2155 (1998), y referencias similares. Tal como se utiliza aquí, el término "amplificar" significa realizar una reacción de amplificación. Una "mezcla de reacción" significa una solución que contiene todos los reactantes necesarios para realizar una reacción, que pueden incluir, pero no se limita a agentes tampones para mantener el pH a un nivel seleccionado durante una reacción, sales, cofactores, limpiadores, y similares.
El término "evaluar" incluye cualquier forma de medida, e incluye determinar si un elemento está presente o no. Los términos "determinar", "medir", "evaluar", "estimar", "calcular" y "ensayar" se usan de modo intercambiable, e incluyen las determinaciones cuantitativas y cualitativas. La evaluación puede ser relativa o absoluta. "Evaluar la presencia de" incluye determinar la cantidad de algo presente, y/o determinar si algo está presente o ausente.
Los polinucleótidos que son "marcados asimétricamente" tienen dominios de adaptadores a izquierda y derecha que no son idénticos. Este procedimiento se denomina genéricamente como de unión de adaptadores que marcan asimétrica o asimétricamente un polinucleótido, p. ej., un fragmento de polinucleótido. Se puede conseguir de cualquier manera conveniente la producción de polinucleótidos que tengan terminales de adaptadores asimétricos. Ejemplos de adaptadores asimétricos están descritos en: las patentes de Estados Unidos 5.712.126 y 6.372.434; publicaciones de patentes de Estados Unidos 2007/0128624 y 2007/0172839; y la publicación PCT WO 2009/032167. En ciertas realizaciones, los adaptadores asimétricos empleados son los descritos en la patente WO 2009/133466, presentada el 29 de abril de 2009.
Como ejemplo, un usuario de la presente invención puede utilizar un adaptador asimétrico para marcar los polinucleótidos. Un "adaptador asimétrico" es uno que, cuando se liga a ambos extremos de un fragmento de ácido nucleico de doble cadena, dará lugar a la producción de productos de extensión o amplificación de cebadores que tienen secuencias no idénticas que flanquean el inserto genómico de interés. El ligamiento va generalmente seguido por etapas de procedimiento posteriores de modo que se generan las secuencias de adaptadores de terminales no idénticos. Por ejemplo, la replicación de un fragmento o fragmentos unidos a un adaptador asimétrico da como resultado productos polinucleótidos en los que hay al menos una diferencia en la secuencia de ácido nucleico, o modificación de nucleótido/nucleósido, entre las secuencias terminales del adaptador. La unión de adaptadores
asimétricamente a los polinucleótidos (p. ej., fragmentos de polinucleótidos) da como resultado polinucleótidos que tienen una o más secuencias de adaptador en un extremo (p. ej., una o más regiones o dominios, p. ej., un sitio de unión del cebador) que están o no presentes o que tienen una secuencia de ácido nucleico diferente en comparación con la secuencia del adaptador en el otro extremo. Se observa que un adaptador que se denomina "adaptador asimétrico" no es necesariamente estructuralmente asimétrico por sí mismo, ni el mero acto de unir un adaptador asimétrico a un fragmento de polinucleótido le vuelve inmediatamente asimétrico. Más bien, un polinucleótido unido a un adaptador asimétrico, que tiene un adaptador asimétrico idéntico en cada extremo, produce productos de replicación (o polinucleótidos aislados de cadena simple) que son asimétricos con respecto a las secuencias del adaptador de los extremos opuestos (p. ej., después de una ronda al menos de amplificación/extensión del cebador).
En la práctica de la presente invención se puede emplear, cualquier adaptador asimétrico conveniente, o cualquier procedimiento para unir adaptadores asimétricamente. Ejemplos de adaptadores asimétricos se describen en: patentes de Estados Unidos 5.712.126 y 6.372.434; publicaciones de patentes de Estados Unidos 2007/0128624 y 2007/0172839; y la publicación PCT WO 2009/032167. En ciertas realizaciones, los adaptadores asimétricos empleados son los descritos en la patente WO 2009/133466, presentada el 29 de abril de 2009.
"Complementario" o "sustancialmente complementario" se refiere a la hibridación o apareamiento de bases o a la formación de un dúplex entre nucleótidos o ácidos nucleicos, tales como, por ejemplo, entre las dos cadenas de una molécula de ADN bicatenario o entre un cebador de oligonucleótidos y un sitio de unión del cebador en un ácido nucleico monocatenario. Los nucleótidos complementarios son, en general, A y T (o A y U), o C y G. Se dice que dos moléculas de ARN o ADN monocatenarios son sustancialmente complementarias cuando los nucleótidos de una cadena, alineados óptimamente y comparados con inserciones o deleciones de nucleótidos apropiados, se aparean con al menos aproximadamente el 80 % de los nucleótidos de la otra cadena, normalmente con al menos aproximadamente el 90 % al 95 %, y más preferiblemente con aproximadamente el 98 al 100 %. Alternativamente, existe complementariedad sustancial cuando una cadena de ARN o ADN se pueda hibridar en condiciones de hibridación selectivas con su complemento. Típicamente, la hibridación selectiva se producirá cuando exista al menos aproximadamente el 65 % de complementariedad en un tramo de al menos 14 a 25 nucleótidos, preferiblemente al menos aproximadamente el 75 %, más preferiblemente al menos aproximadamente el 90 % de complementariedad. Véase, M. Kanehisa Nucleic Acids Res. 12: 203 (1984).
"Dúplex" significa al menos dos oligonucleótidos y/o polinucleótidos que son total o parcialmente complementarios, sometidos a apareamiento de bases de tipo Watson-Crick entre todos o la mayor parte de sus nucleótidos de manera que se forma un complejo estable. Los términos "anillamiento" e "hibridación" se usan de modo intercambiable para referirse a la formación de un dúplex estable. "Perfectamente ajustado" en referencia a un dúplex significa que las cadenas de polinucleótidos u oligonucleótidos que constituyen el dúplex forman entre sí una estructura de doble cadena de tal manera que todos los nucleótidos de cada cadena experimentan el apareamiento de bases de Watson-Crick con un nucleótido de la otra cadena. Un dúplex estable puede incluir apareamiento de bases de Watson-Crick y/o apareamiento de bases que no es de Watson-Crick entre las cadenas del dúplex (donde el apareamiento de bases significa la formación de enlaces de hidrógeno). En ciertas realizaciones, un par de bases que no es de Watson-Crick incluye un análogo de nucleósido, tal como desoxiinosina, 2,6-diaminopurina, los PNA, LNA y similares. En ciertas realizaciones, un par de bases que no es de Watson-Crick incluye una "base oscilante", tal como desoxiinosina, 8-oxo-dA, 8-oxo-dG y similares, donde por "base oscilante" se entiende una base de ácido nucleico que puede formar un par de bases con una primera base de nucleótido en una cadena complementaria de ácido nucleico, pero que, cuando se emplea como una cadena molde para la síntesis de ácido nucleico, lleva a la incorporación de una segunda base de nucleótido diferente a la cadena de síntesis (las bases oscilantes se describen en más detalle a continuación). Un "desajuste" en un dúplex entre dos oligonucleótidos o polinucleótidos significa que un par de nucleótidos en el dúplex no experimenta la unión de Watson-Crick.
"Locus genético", "locus", o "locus de interés", en referencia a un genoma o polinucleótido diana, significa una subregión o segmento contiguos del genoma o del polinucleótido diana. Como se usa en este documento, locus genético, locus o locus de interés se puede referir a la posición de un nucleótido, un gen o una porción de un gen en un genoma, incluyendo el ADN mitocondrial u otro ADN no cromosómico (p. ej., plásmido bacteriano), o se puede referir a cualquier porción contigua de la secuencia genómica lo mismo que esté o no dentro o asociada con un gen. Un locus genético, locus o locus de interés puede tener desde un solo nucleótido hasta un segmento de unos cientos o unos miles de nucleótidos de longitud o más. En general, un locus de interés tendrá una secuencia de referencia asociada con el mismo (véase la descripción de "secuencia de referencia" más adelante).
"Kit" se refiere a cualquier sistema de suministro para suministrar materiales o reactivos para llevar a cabo un método de la invención. En el contexto de los ensayos de reacción, dichos sistemas de suministro incluyen sistemas que permiten el almacenaje, transporte o suministro de los reactivos de reacción (p. ej., sondas, enzimas, etc., en los recipientes apropiados) y/o de los materiales de soporte (p. ej., tampones, instrucciones escritas para realizar el ensayo, etc.) de un lugar a otro. Por ejemplo, los kits incluyen uno o más dispositivos cerrados (p. ej., cajas) que contienen los reactivos de reacción y/o los materiales de soporte pertinentes. Dichos contenidos se pueden suministrar al receptor propuesto juntos o por separado. Por ejemplo, un primer recipiente puede contener una enzima para su uso en un ensayo, mientras que un segundo recipiente contiene sondas.
"Ligamiento" significa formar un enlace o unión covalente entre los extremos de dos o más ácidos nucleicos, p. ej., oligonucleótidos y/o polinucleótidos. La naturaleza del enlace o unión puede variar ampliamente y el ligamiento se puede llevar a cabo por medios enzimáticos o químicos. Como se usa en este documento, los ligamientos se realizan normalmente por medios enzimáticos para formar un enlace fosfodiéster entre el carbono 5’ de un nucleótido terminal de un oligonucleótido con el carbono 3’ de otro oligonucleótido. En las siguientes referencias se describen diversas reacciones de ligamiento basadas en moldes: Whiteley et al., patente de Estados Unidos 4.883.750; Letsinger et al., patente de Estados Unidos 5.476.930; Fung et al., patente de Estados Unidos 5.593.826; Kool, patente de Estados Unidos 5.426.180; Landegren et al., patente de Estados Unidos 5.871.921; Xu and Kool, Nucleic Acids Research, 27: 875-881 (1999); Higgins et al., Methods in Enzymology, 68: 50-71 (1979); Engler et al., The Enzymes, 15: 3-29 (1982); y Namsaraev, publicación de patente de Estados Unidos 2004/0110213.
"Identificador multiplex" (MID) tal como se utiliza aquí se refiere a una marca o combinación de marcas asociadas con un polinucleótido cuya identidad (p. ej., la marca de una secuencia de ADN) se puede utilizar para diferenciar polinucleótidos en una muestra. En ciertas realizaciones, se utiliza el MID sobre un polinucleótido para identificar la fuente de la cual se deriva el polinucleótido. Por ejemplo, una muestra de ácido nucleico puede ser una agrupación de polinucleótidos derivados de diferentes fuentes, (p. ej., polinucleótidos derivados de diferentes individuos, diferentes tejidos o células, o polinucleótidos aislados a diferentes tiempos), donde los polinucleótidos de cada fuente diferente se marcan con un único MID. Como tal, un MID proporciona una correlación entre un polinucleótido y su fuente. En ciertas realizaciones, los MID se emplean para marcar de forma única cada polinucleótido individual en una muestra. La identificación del número de los MID únicos en una muestra puede proporcionar una lectura de cuántos polinucleótidos individuales están presentes en la muestra (o de cuántos polinucleótidos originales se ha derivado una muestra de polinucleótido manipulado; véase, p. ej., la patente de Estados Unidos 7.537.897, expedida el 26 de mayo de 2009). Los MID comprenden típicamente bases nucleotídicas y pueden variar en longitud de 2 a 100 bases de nucleótidos o más, y pueden incluir múltiples subunidades, donde cada MID diferente tiene una identidad y/o un orden de subunidades definidos. Ejemplos de marcas de ácido nucleico que encuentran utilidad como MID se describen en la patente de Estados Unidos 7.544.473, expedida el 6 de junio 2009, y titulada "Nucleic Acid Analysis Using Sequence Tokens", así como la patente de Estados Unidos 7.393.665, expedida el 1 de julio 2008, y titulada "Methods and Compositions for Tagging and Identifying Polynucleotides". En ciertas realizaciones, un conjunto de MID empleados para marcar una pluralidad de muestras no necesita tener ninguna propiedad particular común (p. ej., Tm, longitud, composición de bases, etc.), ya que los métodos descritos en el presente documento se pueden adaptar a una amplia variedad de conjuntos de MID únicos. Se destaca aquí que los MID solamente necesitan ser únicos dentro de un experimento dado. Por lo tanto, el mismo MID se puede utilizar para marcar una muestra diferente que está siendo procesada en un experimento diferente. Además, en ciertos experimentos, el usuario puede utilizar el mismo MID para marcar un subconjunto de muestras diferentes dentro del mismo experimento. Por ejemplo, todas las muestras derivadas de individuos que tienen un fenotipo específico pueden ser marcadas con el mismo MID, p. ej., todas las muestras derivadas de sujetos testigos (o de tipo natural) se pueden marcar con un primer MID mientras que los sujetos que tienen una enfermedad se pueden marcar con un segundo MID (diferente del primer MID). Como otro ejemplo, puede ser deseable marcar diferentes muestras derivadas de la misma fuente con diferentes MID (por ejemplo, muestras derivadas a lo largo del tiempo o derivadas de diferentes sitios dentro de un tejido). Además, los MID se pueden generar en una variedad de diferentes maneras, p. ej., mediante un método combinatorio de marcado en el que un MID se une mediante ligamiento y un segundo MID se une por extensión del cebador. Por lo tanto, los MID se pueden diseñar e implementar en una variedad de maneras diferentes para hacer un seguimiento de los fragmentos de polinucleótidos durante el procesado y el análisis, y por lo tanto no se pretende ninguna limitación a este respecto.
"Secuenciación de nueva generación" (NGS), como se usa aquí se refiere a las tecnologías de secuenciación que tienen la capacidad de secuenciar polinucleótidos a velocidades que no tienen precedentes utilizando los métodos de secuenciación convencionales (por ejemplo, métodos estándar de secuenciación de Sanger o Maxam-Gilbert). Estas velocidades sin precedentes se alcanzan mediante la realización y lectura de miles a millones de reacciones de secuenciación en paralelo. Las plataformas de secuenciación por NGS incluyen, pero no se limitan a las siguientes: Massively Parallel Signature Sequencing (Lynx Therapeutics); 454 pyro-sequencing (454 Life Sciences/Roche Diagnostics); secuenciación con terminador de tinte reversible, en fase sólida (Solexa/Illumina); Tecnología SOLiD (Applied Biosystems); secuenciación de semiconductor iónico (Ion Torrent); y la secuenciación del ADN Nanoball (Complete Genomics). Descripciones de ciertas plataformas de NGS se pueden encontrar en lo siguiente: Shendure, et al., "Next-generation DNA sequencing", Nature, 2008, vol. 26, No. 10, 1135-1145; Mardis, "The impact of next-generation sequencing technology on genetics" Trends in Genetics, 2007, vol. 24, No. 3, pp 133141; Su, et al., "Next-generation sequencing and its applications in molecular diagnostics" Expert Rev Mol Diagn, 2011, 11(3): 333-43; y Zhang et al., "The impact of next-generation sequencing on genomics", J Genet Genomics, 2011, 38(3): 95-109.
"Nucleósido" tal como se usa en el presente documento incluye los nucleósidos naturales, incluyendo las formas 2'desoxi y 2'-hidroxilo, p. ej., como se describe en Kornberg and Baker, DNA Replication, 2nd Ed. (Freeman, San Francisco, 1992). "Análogos" en referencia a los nucleósidos incluye nucleósidos sintéticos que tienen restos de bases modificadas y/o restos de azúcar modificado, p. ej., descritos por Scheit, Nucleotide Analogs (John Wiley, New York, 1980); Uhlman and Peyman, Chemical Reviews, 90: 543-584 (1990), o similares, con la condición de que sean capaces de hibridación específica. Dichos análogos incluyen nucleósidos sintéticos diseñados para mejorar las
propiedades de unión, reducir la complejidad, aumentar la especificidad, y similares. Polinucleótidos que comprenden análogos con mejores propiedades de hibridación o de resistencia a la nucleasa están descritos en Uhlman and Peyman (citado anteriormente); Crooke et al., Exp. Opin. Ther. Patents, 6: 855-870 (1996); Mesmaeker et al., Current Opinion in Structural Biology, 5: 343-355 (1995); y similares. Los ejemplos de tipos de polinucleótidos que son capaces de mejorar la estabilidad del dúplex incluyen N3 '→P5' fosforamidatos de oligonucleótidos (denominados aquí "amidatos"), ácidos nucleicos peptídicos (denominados aquí "PNA"), oligo-2'-Oalquilrribonucleótidos, polinucleótidos que contienen propinilpirimidinas C-5, ácidos nucleicos bloqueados ("LNA"), y compuestos similares. Tales oligonucleótidos o bien están disponibles comercialmente o bien se pueden sintetizar utilizando métodos descritos en la literatura.
"Reacción en cadena de la polimerasa" o "PCR", significa una reacción para la amplificación in vitro de secuencias específicas de ADN mediante la extensión simultánea del cebador de cadenas complementarias de ADN. En otras palabras, la PCR es una reacción para fabricar múltiples copias o replicados de un ácido nucleico diana flanqueado por sitios de unión de cebadores, comprendiendo dicha reacción una o más repeticiones de las siguientes etapas: (i) desnaturalización del ácido nucleico diana, (ii) hibridación de los cebadores a los sitios de unión del cebador, y (iii) extensión de los cebadores por medio de una polimerasa de ácido nucleico en presencia de trifosfatos de nucleósidos. Normalmente, la reacción se hace en ciclos a través de diferentes temperaturas optimizadas para cada etapa en un instrumento termociclador. Las temperaturas concretas, las duraciones de cada etapa, y las velocidades de cambio entre etapas dependen de muchos factores bien conocidos por los expertos en la técnica, p. ej., ejemplificados por las referencias: McPherson et al., editors, PCR: A practical Approach and PCR2: A practical Approach (IRL Press, Oxford, 1991 y 1995, respectivamente). Por ejemplo, en una PCR convencional que utiliza la ADN polimerasa Taq, se puede desnaturalizar un ácido nucleico diana de doble cadena a una temperatura >90 ºC, los cebadores se pueden hibridar a una temperatura en el intervalo de 50-75 ºC, y los cebadores se extienden a una temperatura en el intervalo 72-78 ºC. El término "PCR" engloba formas derivadas de la reacción, que incluyen pero no se limitan a, RT-PCR, PCR en tiempo real, PCR anidada, PCR cuantitativa, PCR multiplexada, y similares. Los volúmenes de reacción varían desde algunos nanolitros, p. ej., 2 nL, a unos centenares de µL, p. ej. 200 µL. "PCR de transcripción inversa," o "RT-PCR", significa una PCR que va precedida por una reacción de transcripción inversa que convierte un ARN diana en un ADN complementario de cadena simple, que se amplifica entonces, p. ej., Tecott et al., patente de Estados Unidos 5.168.038. "PCR en tiempo real" significa una PCR para la cual la cantidad del producto de reacción, es decir, el amplicón, se monitoriza conforme avanza la reacción. Hay muchas formas de PCR en tiempo real que difieren principalmente en la química de detección utilizada para la monitorización del producto de reacción, p. ej., Gelfand et al., patente de Estados Unidos 5.210.015 ("TAQMAN™"); Wittwer et al., patentes de Estados Unidos 6.174.670 y 6.569.627 (tintes intercalantes); Tyagi et al., patente de Estados Unidos 5.925.517 (balizas moleculares). La química de detección para la PCR en tiempo real se revisa en Mackay et al., Nucleic Acids Research, 30: 1292-1305 (2002). "PCR anidada" significa una PCR de dos fases en donde el amplicón de una primera PCR se convierte en la muestra para una segunda PCR que utiliza un nuevo conjunto de cebadores, uno de los cuales al menos se une en una localización interior del primer amplicón. Como se usa aquí, "cebadores iniciales" en referencia a una reacción de amplificación anidada significan los cebadores usados para generar un primer amplicón, y "cebadores secundarios" significan los uno o más cebadores utilizados para generar un segundo amplicón, o amplicón anidado. “PCR multiplexada" significa una PCR en la que múltiples secuencias diana (o una sola secuencia diana y una o más secuencias de referencia) se llevan a cabo simultáneamente en la misma mezcla de reacción, p. ej., Bernard et al., Anal. Biochem., 273: 221-228 (1999) (PCR de dos colores en tiempo real). Usualmente, se emplean distintos conjuntos de cebadores para cada secuencia que se amplifica.
"Polinucleótido" u "oligonucleótido" se utilizan de modo intercambiable y cada uno significa un polímero lineal de monómeros nucleotídicos. Los monómeros que constituyen los polinucleótidos y oligonucleótidos son capaces de unirse específicamente a un polinucleótido natural, por medio de un patrón regular de interacciones monómero a monómero, tales como el apareamiento de bases de tipo Watson-Crick, apilamiento de bases, apareamiento de bases de tipos Hoogsteen o Hoogsteen inverso, apareamiento de bases oscilantes, o similares. Como se describe en detalle a continuación, por "base oscilante" se entiende una base de ácido nucleico que puede formar un par de bases con una primera base de nucleótido en una cadena complementaria de ácido nucleico, pero que, cuando se emplea como una cadena molde para la síntesis de ácido nucleico, lleva a la incorporación de una segunda base de nucleótidos diferente a la cadena de síntesis. Dichos monómeros y sus uniones internucleosídicas pueden ser de origen natural o pueden ser análogos de los mismos, p. ej., análogos de origen natural o no natural. Los análogos que no son naturales pueden incluir ácidos nucleicos peptídicos (los PNA, p. ej., como se describen en la patente de Estados Unidos 5.539.082), ácidos nucleicos bloqueados (los LNA, p. ej., como se describe en la patente de Estados Unidos 6.670.461), uniones internucleosídicas de fosforotioato, bases que contienen grupos de unión que permiten la fijación de etiquetas, tales como fluoróforos, o haptenos y similares. Siempre que el uso de un oligonucleótido o polinucleótido requiera un procesamiento enzimático, tal como extensión por una polimerasa, ligamiento por una ligasa, o similares, un experto debe entender que los oligonucleótidos o polinucleótidos en estos casos no deben contener ciertos análogos de uniones internucleosídicas, restos de azúcar, o bases en todas o algunas posiciones. Los polinucleótidos normalmente varían de tamaño desde algunas unidades monoméricas, p. ej., 5-40, cuando se denominan usualmente "oligonucleótidos", hasta varios miles de unidades monoméricas. Siempre que un polinucleótido u oligonucleótido esté representado por una secuencia de letras (mayúsculas o minúsculas), tal como "ATGCCTG", se entenderá que los nucleótidos están en orden 5 '→ 3', de izquierda a derecha y que "A" indica desoxiadenosina, "C" indica desoxicitidina, "G" indica desoxiguanosina, y "T" indica timidina, "I"
indica desoxiinosina, "U" indica uridina, salvo que se indique otra cosa o se deduzca del contexto. A menos que se indique otra cosa los convenios de la terminología y de la numeración de átomos seguirán los descritos en Strachan and Read, Human Molecular Genetics 2 (Wiley-Liss, New York, 1999). Normalmente, los polinucleótidos comprenden los cuatro nucleósidos naturales (por ejemplo, desoxiadenosina, desoxicitidina, desoxiguanosina, desoxitimidina para el ADN o sus análogos de ribosa para el ARN) unidos por enlaces de fosfodiéster; sin embargo, también pueden comprender análogos de nucleótidos no naturales, p. ej., que incluye bases modificadas, azúcares,
o uniones internucleosídicas. Es claro para los expertos en la técnica que, cuando una enzima tiene requisitos específicos de sustrato de oligonucleótidos o polinucleótidos para su actividad, p. ej., ADN monocatenario, dúplex de ARN/ADN, o similares, entonces la selección de la composición apropiada para los sustratos de oligonucleótidos o polinucleótidos está efectivamente dentro de los conocimientos de un experto, especialmente con la guía de tratados tales como Sambrook et al., Molecular Cloning, Second Edition (Cold Spring Harbor Laboratory, New York, 1989), y referencias similares.
"Cebador" significa un oligonucleótido, ya sea natural o sintético, que, al formar un dúplex con un molde de polinucleótido, es capaz de actuar como un punto de iniciación de la síntesis de ácido nucleico y de extenderse desde su extremo 3' a lo largo del molde de modo que se forma un dúplex extendido. La secuencia de nucleótidos añadida durante el proceso de extensión está determinada por la secuencia del polinucleótido de molde. Normalmente, los cebadores se extienden por una ADN polimerasa. Los cebadores tienen generalmente una longitud compatible con su uso en la síntesis de productos de extensión del cebador, y normalmente están en el intervalo de entre 8 a 100 nucleótidos de longitud, tal como 10 a 75, 15 a 60, 15 a 40, 18 a 30, 20 a 40, 21 a 50, 22 a 45, 25 a 40, y así sucesivamente, más típicamente en el intervalo de entre 18-40, 20-35, 21-30 nucleótidos de largo, y cualquier longitud entre los intervalos indicados. Los cebadores típicos pueden estar en el intervalo de entre 10-50 nucleótidos de longitud, tal como 15-45, 18-40, 20-30, 21-25 y así sucesivamente, y cualquier longitud entre los intervalos indicados. En algunas realizaciones, los cebadores normalmente no tienen más de aproximadamente 10, 12, 15, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65 o 70 nucleótidos de longitud.
Los cebadores son normalmente de una sola cadena para una máxima eficiencia en la amplificación, pero pueden ser alternativamente de doble cadena. Si es de doble cadena, el cebador generalmente se trata en primer lugar para separar sus cadenas antes de ser utilizado para preparar productos de extensión. Esta etapa de desnaturalización se ve típicamente afectada por el calor, pero alternativamente se puede llevar a cabo utilizando un álcali, seguido por neutralización. Por lo tanto, un "cebador" es complementario de un molde, y se compleja mediante enlace de hidrógeno o hibridación con el molde para dar un complejo cebador/molde para la iniciación de la síntesis por una polimerasa, que se extiende por la adición de bases unidas covalentemente ligadas en su extremo 3' complementario al molde en el proceso de síntesis de ADN.
Un "par de cebadores" como se usa aquí, se refiere a los cebadores primero y segundo que tienen la secuencia de ácido nucleico adecuada para la amplificación a base de ácido nucleico de un ácido nucleico diana. Dichos pares de cebadores generalmente incluyen un primer cebador que tiene una secuencia que es la misma o similar a la de una primera porción de un ácido nucleico diana, y un segundo cebador que tiene una secuencia que es complementaria a una segunda porción de un ácido nucleico diana para proporcionar la amplificación del ácido nucleico diana o de un fragmento del mismo. La referencia a cebadores "primero" y "segundo" en este documento es arbitraria, a menos que se indique específicamente otra cosa. Por ejemplo, el primer cebador puede ser diseñado como un "cebador directo" (que inicia la síntesis de ácido nucleico a partir de un extremo 5' del ácido nucleico diana) o como un "cebador inverso" (que inicia la síntesis de ácido nucleico a partir de un extremo 5' del producto de extensión producido a partir de la síntesis iniciada a partir del cebador directo). Asimismo, el segundo cebador puede ser diseñado como un cebador directo o como un cebador inverso.
"Lectura" significa un parámetro o parámetros, que se miden y/o se detectan, que se pueden convertir en un número
o valor. En algunos contextos, la lectura se puede referir a una representación numérica real de dichos datos recogidos o registrados. Por ejemplo, una lectura de las señales de intensidad fluorescente procedentes de una micromatriz es la dirección y la intensidad de fluorescencia de una señal que se genera en cada sitio de hibridación de la micromatriz; por lo tanto, una lectura de este tipo puede ser registrada o almacenada de diversas formas, por ejemplo, como una imagen de la micromatriz, como una tabla de números, o similares.
"Sitio reflejo", "secuencia refleja" y equivalentes se utilizan para indicar una o más secuencias presentes en un polinucleótido que se emplean para mover un dominio intra-molecularmente desde su localización inicial a una localización diferente en el polinucleótido. El uso de secuencias reflejas se describe en detalle en la solicitud PCT número de serie PCT/IB2010/02243 titulada "Compositions and Methods for Intramolecular Nucleic Acid Rearrangement", publicada el 24 de febrero de 2011 como WO/2011/021102. En ciertas realizaciones, se elige una secuencia refleja de manera que sea distinta de otras secuencias del polinucleótido (es decir, con poca homología de secuencia con otras secuencias que puedan estar presentes en el polinucleótido, p. ej., secuencias genómicas o sub-genómicas a procesar). Como tal, una secuencia refleja se debe seleccionar de manera que no se hibride con ninguna secuencia excepto su complemento en las condiciones empleadas en los procedimientos reflejos. La secuencia refleja puede ser una secuencia sintética o generada artificialmente (p. ej., añadida a un polinucleótido en un dominio de adaptador) o una secuencia presente normalmente en un polinucleótido a ensayar (por ejemplo, una secuencia presente dentro de una región de interés en un polinucleótido a ensayar). En el sistema reflejo, está
presente un complemento de la secuencia refleja (p. ej., insertado en un dominio de adaptador) en la misma cadena del polinucleótido que la secuencia refleja (p. ej., la misma cadena de un polinucleótido de doble cadena o en el mismo polinucleótido de cadena simple), donde el complemento se coloca en una localización particular a fin de facilitar un suceso de unión y polimerización intramolecular sobre dicha cadena particular. Las secuencias reflejas empleadas en el procedimiento reflejo descrito en este documento pueden tener por tanto un amplio intervalo de longitudes y secuencias. Las secuencias reflejas pueden variar de 5 a 200 bases nucleotídicas de longitud.
"Soporte sólido", "soporte ", y "soporte en fase sólida" se usan de modo intercambiable y se refieren a un material o grupo de materiales que tienen una superficie o superficies rígidas o semi-rígidas. En muchas realizaciones, al menos una superficie del soporte sólido será sustancialmente plana, aunque en algunas realizaciones puede ser deseable separar físicamente regiones de síntesis para diferentes compuestos, por ejemplo, con pocillos, regiones elevadas, pernos, zanjas grabadas, o similares. Según otras realizaciones, el soporte o soportes sólidos tendrán la forma de perlas, resinas, geles, microesferas, u otras configuraciones geométricas. Las micromatrices comprenden usualmente al menos un soporte en fase sólida planar, tal como un portaobjetos de microscopio de vidrio.
"Específica" o "especificidad", en referencia a la unión de una molécula con otra molécula, tal como una secuencia diana marcada para una sonda, significa el reconocimiento, contacto y formación de un complejo estable entre las dos moléculas, junto con sustancialmente menos reconocimiento, contacto o formación de complejos de esa molécula con otras moléculas. En un aspecto, "específica" en referencia a la unión de una primera molécula con una segunda molécula significa que en la medida en que la primera molécula reconoce y forma un complejo con otra molécula en una reacción o muestra, ella forma el mayor número de los complejos con la segunda molécula. Preferiblemente, este mayor número es al menos el cincuenta por ciento. Generalmente, las moléculas implicadas en un suceso de unión específica tienen zonas en sus superficies o en cavidades que dan lugar al reconocimiento específico entre las moléculas que se unen entre sí. Los ejemplos de unión específica incluyen interacciones anticuerpo-antígeno, interacciones enzima-sustrato, formación de dúplex o tríplex entre polinucleótidos y/o oligonucleótidos, interacciones de biotina-avidina o biotina-estreptavidina, interacciones receptor-ligando, y similares. Como se usa en la presente memoria, "contacto", en referencia a la especificidad o unión específica significa que dos moléculas están lo suficientemente próximas para que interacciones químicas no covalentes débiles, tales como las fuerzas de Van der Waals, enlaces de hidrógeno, interacciones en apilamiento de bases, interacciones iónicas e hidrófobas, y similares, dominen en la interacción de las moléculas.
Tal como se utiliza aquí, el término "Tm" se utiliza en referencia a la "temperatura de fusión". La temperatura de fusión es la temperatura (p. ej., medida en ºC) a la que una población de moléculas de ácido nucleico de doble cadena llega a ser semi-disociada en cadenas simples. Son conocidas en la técnica varias ecuaciones para calcular la Tm de ácidos nucleicos (véase, p. ej., Anderson and Young, Quantitative Filter Hybridization, in Nucleic Acid Hybridization (1985). Otras referencias (p. ej., Allawi, H.T. & SantaLucia, J., Jr., Biochemistry 36, 10581-94 (1997)) incluyen métodos alternativos de cálculo que tienen en cuenta, para el cálculo de Tm, las características estructurales y ambientales, así como las características de las secuencias.
"Muestra" significa una cantidad de material procedente de una fuente biológica, ambiental, médica, o de pacientes en la que se busca la detección, medida, o marcado de los ácidos nucleicos diana. Por un lado, se pretende incluir un espécimen o cultivo (p. ej., cultivos microbiológicos). Por otra parte, se pretende incluir tanto las muestras biológicas como las ambientales. Una muestra puede incluir un espécimen de origen sintético. Las muestras biológicas pueden ser animales, incluyendo de seres humanos, fluidos, sólidos (p. ej., heces) o tejidos, así como alimentos líquidos y sólidos y productos e ingredientes alimentarios tales como productos lácteos, verduras, carne y subproductos cárnicos y residuos. Las muestras biológicas pueden incluir materiales tomados de un paciente, que incluyen pero no se limitan a los cultivos, sangre, saliva, líquido cefalorraquídeo, fluido pleural, leche, linfa, esputos, semen, aspirados por punción con aguja, y similares. Las muestras biológicas se pueden obtener de todas las diversas familias de animales domésticos, así como de animales silvestres o salvajes, que incluyen, pero no se limitan a animales tales como ungulados, osos, peces, roedores, etc. Las muestras ambientales incluyen material ambiental tal como muestras de materia superficial, suelo, agua y muestras industriales, así como las muestras obtenidas de los instrumentos, aparatos, equipo, utensilios, artículos desechables y no desechables, para el procesamiento de alimentos y productos lácteos. Estos ejemplos no se deben interpretar como limitantes de los tipos de muestra aplicables a la presente invención.
Los términos "aguas arriba" y "aguas abajo" en la descripción de la orientación y/o polimerización de la molécula de ácido nucleico se utilizan en el presente documento como son entendidos por los expertos en la técnica. Como tal, "aguas abajo" generalmente significa proceder en la dirección 5' a 3', es decir, la dirección en la que una polimerasa de nucleótido normalmente extiende una secuencia, y "aguas arriba" generalmente significa lo contrario. Por ejemplo, un primer cebador que se hibrida "aguas arriba" de un segundo cebador sobre la misma molécula de ácido nucleico diana está localizado en el lado 5' del segundo cebador (y por lo tanto la polimerización del ácido nucleico a partir del primer cebador se dirige hacia el segundo cebador).
Se observa, además, que las reivindicaciones se pueden redactar para excluir cualquier elemento opcional. Por lo tanto, esta declaración tiene por objeto servir como base antecedente para el uso de una terminología tan exclusiva como "únicamente", "solamente" y similares en relación con el detalle de los elementos reivindicados, o el uso de una limitación "negativa".
Descripción detallada de la invención
Antes de que se describa la presente invención, se debe entender que esta invención no se limita a las realizaciones particulares descritas, ya que estas pueden, por supuesto, variar. Se debe entender también que la terminología usada en este documento tiene el propósito de describir realizaciones particulares solamente, y no se pretende que sea limitante, ya que el alcance de la presente invención estará únicamente limitado por las reivindicaciones adjuntas.
Cuando se proporciona un intervalo de valores, se entiende que cada valor intermedio, hasta la décima de la unidad del límite inferior a menos que el contexto dicte claramente otra cosa, entre los límites superior e inferior de ese intervalo está también específicamente descrito. Cada intervalo más pequeño entre cualquier valor establecido o valor intermedio en un intervalo establecido y cualquier otro valor establecido o valor intermedio en dicho intervalo establecido está incluido dentro de la invención. Los límites superior e inferior de estos intervalos más pequeños pueden estar independientemente incluidos o excluidos del intervalo, y cada intervalo en el que cualquiera, ninguno
o ambos límites están incluidos en los intervalos más pequeños está también incluido dentro de la invención, sujeto a cualquier límite específicamente excluido en el intervalo establecido. Cuando el intervalo establecido incluye uno o ambos límites, los intervalos que excluyen cualquiera o ambos de dichos límites incluidos, están incluidos también en la invención.
A menos que se defina otra cosa, todos los términos técnicos y científicos usados en este documento tienen el mismo significado que es entendido comúnmente por los expertos en la técnica a la que pertenece esta invención. Aunque en la práctica o ensayo de la presente invención se pueden utilizar cualquier método y materiales similares o equivalentes a los descritos aquí, se describen ahora algunos métodos y materiales potenciales y preferidos. Todas las publicaciones mencionadas en el presente documento describen los métodos y/o los materiales en relación a los cuales se citan las publicaciones. Se entiende que la presente descripción reemplaza cualquier descripción de una publicación incorporada en la medida en que haya una contradicción.
Se debe observar que, como se usa aquí y en las reivindicaciones adjuntas, las formas singulares "un", "uno", “una” y "el", “la” incluyen los plurales referentes a menos que el contexto dicte claramente otra cosa. Así, por ejemplo, la referencia a "un ácido nucleico" incluye una pluralidad de dichos ácidos nucleicos y la referencia a "el compuesto" incluye la referencia a uno o más compuestos y equivalentes de los mismos conocidos por los expertos en la técnica, y así sucesivamente.
La práctica de la presente invención puede emplear, a menos que se indique otra cosa, técnicas y descripciones convencionales de la química orgánica, tecnología de polímeros, biología molecular (incluyendo técnicas recombinantes), biología celular, bioquímica e inmunología, que están dentro de la experiencia de la técnica. Tales técnicas convencionales incluyen la síntesis de matrices de polímeros, hibridación, ligamiento, y detección de la hibridación utilizando una etiqueta. Ilustraciones específicas de técnicas adecuadas se pueden haber tomado como referencia para el ejemplo que sigue. Sin embargo, también se pueden utilizar por supuesto, otros procedimientos convencionales equivalentes. Tales técnicas y descripciones convencionales se pueden encontrar en manuales de laboratorio estándar, tales como Genome Analysis: A Laboratory Manual Series (Vols I-IV.), Using Antibodies: A Laboratory Manual, Cells: A Laboratory Manual, PCR Primer: A Laboratory Manual, and Molecular Cloning: A Laboratory Manual (todos de Cold Spring Harbor Laboratory Press), Stryer, L. (1995) Biochemistry (4th Ed.) Freeman, New York, Gait, "Oligonucleotide Synthesis: A Practical Approach" 1984, IRL Press, London, Nelson and Cox (2000), Lehninger, A., Principles of Biochemistry 3rd Ed., W. H. Freeman Pub., New York, N.Y. y Berg et al. (2002) Biochemistry, 5th Ed., W.H. Freeman Pub., New York, N. Y.
Las publicaciones expuestas en el presente documento se proporcionan únicamente para su descripción antes de la fecha de presentación de la presente solicitud. Nada en este documento se debe interpretar como una admisión de que la presente invención no tiene derecho a anteceder a dicha publicación en virtud de una invención anterior. Además, las fechas de publicación proporcionadas pueden ser diferentes de las fechas de publicación reales que puede ser necesario que sean confirmadas de forma independiente.
Como se ha resumido antes, algunos aspectos de la presente invención se dirigen al uso de bases de nucleótidos degeneradas (p. ej., en una región de bases degeneradas, o DBR) añadidas a los polinucleótidos sometidos a análisis de secuencias que se utilizan en el establecimiento del número de moléculas de polinucleótidos individuales procedentes de la misma región genómica de la misma muestra original que han sido secuenciadas en una configuración o proceso particular de análisis de secuencias. La inclusión de una DBR en los polinucleótidos sometidos a análisis de secuenciación se utiliza en una variedad de análisis genéticos, incluyendo el aumento de la confianza en la identificación de alelos al proporcionar un mecanismo para determinar un valor estadístico para una identificación de alelos, un valor que no se puede derivar del número de lecturas solo. La DBR se puede añadir a un polinucleótido de cualquier manera conveniente, incluyéndola como parte de un adaptador (o conjunto de adaptadores) unido a los polinucleótidos a secuenciar, p. ej., la DBR puede estar en un adaptador que incluye también un sitio del cebador de secuenciación, o la DBR puede estar presente en un cebador de síntesis de ácido nucleico, p. ej., un cebador de PCR, de tal manera que la DBR se añade a un polinucleótido diana cuando se utiliza el cebador en una reacción de polimerización.
Las DBR también encuentran utilidad en la realización de análisis genéticos en muestras agrupadas de polinucleótidos en las que cada polinucleótido de la muestra conjunta incluye un MID específico para su muestra de origen (descrito en detalle más adelante). Esto permite al usuario determinar la cobertura de secuencia de una especie específica de polinucleótidos (o múltiples especies) de cada una de las muestras de origen que se reunieron para generar la muestra conjunta. Por lo tanto, las realizaciones de la presente invención incluyen análisis de secuencia de polinucleótidos en una muestra conjunta, donde cada polinucleótido contiene un MID y una DBR.
Ácidos nucleicos
La presente invención (como se describe en detalle más adelante) se puede emplear para la manipulación y análisis de secuencias de ácido nucleico de interés (o polinucleótidos) procedentes de prácticamente cualquier fuente de ácido nucleico, que incluyen pero no se limitan a ADN genómico, ADN complementario (ADNc), ARN (p. ej., ARN mensajero, ARN ribosomial, ARN interferente corto, microARN, etc.), ADN plasmídico, ADN mitocondrial, ADN sintético, etc. Además, cualquier organismo, material orgánico o sustancia que contiene ácido nucleico se puede utilizar como una fuente de ácidos nucleicos para ser procesada de acuerdo con la presente invención, que incluyen, pero no se limitan a, plantas, animales (p. ej., reptiles, mamíferos, insectos, gusanos, peces, etc.), muestras de tejidos, bacterias, hongos (p. ej., levaduras), fagos, virus, tejido cadavérico, muestras arqueológicas/antiguas, etc. En ciertas realizaciones, los ácidos nucleicos en la muestra de ácido nucleico se derivan de un mamífero, y en determinadas realizaciones, el mamífero es un ser humano.
En ciertas realizaciones, las secuencias de ácidos nucleicos están enriquecidas. Por enriquecido se entiende que los ácidos nucleicos (p. ej., en una muestra de polinucleótidos) se someten a un proceso que reduce la complejidad de los ácidos nucleicos, generalmente aumentando la concentración relativa de una especie particular de ácido nucleico en la muestra (p. ej., que tiene un locus específico de interés, que incluye una secuencia específica de ácido nucleico, que carece de un locus o secuencia, que está dentro de un intervalo de tamaño específico, etc.). Hay una amplia variedad de formas de enriquecer los ácidos nucleicos que tienen una característica o características de secuencia específicas, y por tanto se puede emplear cualquier método conveniente para conseguir esto. El enriquecimiento (o reducción de la complejidad) puede tener lugar en cualquiera de una serie de etapas del proceso, y será determinado por deseo del usuario. Por ejemplo, el enriquecimiento puede tener lugar en muestras parentales individuales (p. ej., ácidos nucleicos sin marcar antes del ligamiento al adaptador) o en muestras multiplexadas (p. ej., ácidos nucleicos marcados con secuencias de adaptadores que codifican MID; los MID se describen con más detalle más adelante).
En ciertas realizaciones, los ácidos nucleicos de la muestra de ácido nucleico se amplifican antes del análisis. En algunas de estas realizaciones, la reacción de amplificación sirve también para enriquecer una muestra de ácido nucleico de partida en una secuencia o locus de interés. Por ejemplo, una muestra de ácido nucleico de partida se puede someter a una reacción en cadena de la polimerasa (PCR) que amplifica una o más regiones de interés. En ciertas realizaciones, la reacción de amplificación es una reacción de amplificación exponencial, mientras que en otras realizaciones particulares, la reacción de amplificación es una reacción de amplificación lineal. En la práctica de la presente invención, se puede utilizar cualquier método conveniente para llevar a cabo las reacciones de amplificación en una muestra de ácido nucleico de partida. En ciertas realizaciones, la polimerasa de ácido nucleico empleada en la reacción de amplificación es una polimerasa que tiene la capacidad de corrección de pruebas (p. ej., ADN polimerasa phi29, ADN polimerasa de Thermococcus litoralis, ADN polimerasa de Pyrococcus furiosus, etc.).
En ciertas realizaciones, la muestra de ácido nucleico a analizar se deriva de una única fuente (p. ej., un único organismo, virus, tejido, célula, sujeto, etc.), mientras que en otras realizaciones, la muestra de ácido nucleico es un conjunto de ácidos nucleicos extraídos de una pluralidad de fuentes (p. ej., un conjunto de ácidos nucleicos procedentes de una pluralidad de organismos, tejidos, células, sujetos, etc.), donde por "pluralidad" se entiende dos
o más. Como tal, en ciertas realizaciones, una muestra de ácido nucleico puede contener ácidos nucleicos procedentes de 2 o más fuentes, 3 o más fuentes, 5 o más fuentes, 10 o más fuentes, 50 o más fuentes, 100 o más fuentes, 500 o más fuentes, 1000 o más fuentes, 5000 o más fuentes, 10.000 o más fuentes, 25.000 o más fuentes, etc.
En ciertas realizaciones, los fragmentos de ácido nucleico que se van a reunir con fragmentos de ácido nucleico se derivan de una pluralidad de fuentes (p. ej., una pluralidad de organismos, tejidos, células, sujetos, etc.), donde por "pluralidad" se entiende dos o más. En tales realizaciones, los ácidos nucleicos derivados de cada fuente incluyen un identificador multiplex (MID) de tal modo que se puede determinar la fuente de la que se deriva cada fragmento de ácido nucleico marcado. En tales realizaciones, cada fuente de la muestra de ácido nucleico se correlaciona con un MID único, donde por MID único se entiende que cada MID diferente empleado se puede diferenciar de cualquier otro MID empleado en virtud de al menos una característica, p. ej., la secuencia de ácido nucleico del MID. Se puede utilizar cualquier tipo de MID, incluyendo pero sin limitarse a los descritos en la patente WO 2007/087310 también en tramitación, presentada el 22 de enero de 2007, así como en la patente de Estados Unidos 7.393.665, expedida el 1 de julio de 2008, y titulada "Methods and Compositions for Tagging and Identifying Polynucleotides”. En ciertas realizaciones, un conjunto de MIDs empleados para marcar una pluralidad de muestras no necesita tener ninguna propiedad particular común (p. ej., Tm, longitud, composición de bases, etc.), ya que los métodos de marcado asimétrico (y muchos métodos de lectura de la marca, que incluyen pero no se limitan a la secuenciación de la marca o la medida de la longitud de la marca) pueden contener una amplia variedad de conjuntos de MID únicos.
Región de bases degeneradas (DBR)
Algunos aspectos de la presente invención incluyen métodos y composiciones para determinar o estimar el número de moléculas de polinucleótidos individuales procedentes de la misma región genómica de la misma muestra original que han sido secuenciadas en una configuración o proceso particular de análisis de secuencias. En estos aspectos de la invención, una región de bases degeneradas (DBR) se une a las moléculas de polinucleótidos de partida que se secuencian posteriormente (p. ej., después de que se realicen ciertas etapas del proceso, p. ej., la amplificación y/o el enriquecimiento, p. ej., la PCR). Como se detalla a continuación, la evaluación del número (y en algunos casos, la combinación) de diferentes secuencias de DBR presentes en una ronda de secuenciación permite el establecimiento del número (o número mínimo) de diferentes polinucleótidos de partida que han sido secuenciados para un polinucleótido particular (o región de interés; ROI). Este número se puede utilizar, por ejemplo, para dar una medida estadística de la confianza en las identificaciones de alelos, aumentando de este modo la confianza en la realización de tales determinaciones de alelos (p. ej., cuando se identifican alelos homocigóticos). Las DBR permiten también la identificación de errores potenciales de secuenciación o amplificación que impactan negativamente en el análisis genético si no son detectados.
La secuenciación del ADN incluye típicamente un etapa de unión de un adaptador a los polinucleótidos en una muestra a secuenciar, donde el adaptador contiene un sitio del cebador de la secuenciación (p. ej., mediante ligamiento). Como se usa en el presente documento, un "sitio del cebador de secuenciación" es una región de un polinucleótido que es o bien idéntica o bien complementaria a la secuencia de un cebador de secuenciación (cuando está en la forma de cadena simple) o una región de cadena doble formada entre una secuencia del cebador de secuenciación y su complemento. La orientación específica de un sitio del cebador de secuenciación puede ser deducida por los expertos en la técnica a partir de las características estructurales del polinucleótido específico que contiene el sitio del cebador de secuenciación.
En adición al sitio del cebador de secuenciación, también está unida a los polinucleótidos una región de bases degeneradas (DBR), ya sea como parte del adaptador que contiene el sitio del cebador de secuenciación o de forma independiente (p. ej., en un segundo adaptador unido al polinucleótido). Se puede emplear cualquier método conveniente para la unión o adición de una DBR a los polinucleótidos. Una DBR es una región que puede tener una composición o secuencia de bases variable (que se puede considerar como "aleatoria") en comparación con otros polinucleótidos marcados de la muestra. El número de DBR diferentes en una población de polinucleótidos de una muestra dependerá del número de bases en la DBR, así como del número potencial de diferentes bases que pueden estar presentes en cada posición. Por lo tanto, una población de polinucleótidos que tiene unidas DBR con dos posiciones de bases, donde cada posición puede ser una cualquiera de A, C, G y T, tendrá potencialmente 16 DBR diferentes (AA, AC, AG, etc.). Las DBR pueden incluir por lo tanto 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más bases, incluyendo 15 o más, 20 o más, etc. En ciertas realizaciones, la DBR tiene de 3 a 10 bases de longitud. Además, cada posición en una DBR puede tener una composición de bases diferente. Por ejemplo, una DBR de 4 bases puede tener cualquiera de las siguientes composiciones: NNNN; NRSN; SWSW; BDHV (véase la Tabla 1 a continuación para el código de nucleótidos según la IUPAC). Se observa además que en ciertas realizaciones, una base en una DBR puede variar en virtud de tener una modificación detectable u otro resto unido a la misma. Por ejemplo, se pueden utilizar ciertas plataformas de secuenciación de nueva generación (p. ej., Pacific Biosciences™) para detectar diferencias de metilación en las bases durante el proceso de secuenciación. Como tal, una base no metilada en una DBR se podría distinguir de una base metilada en una DBR. Por lo tanto, no se pretende ninguna limitación con respecto a la longitud o composición de las bases de una DBR.
Código de nucleótidos según IUPAC
Base
A
Adenina
C
Citosina
G
Guanina
T (o U)
Timina (o uracilo)
R
A o G
Y
C o T
S
G o C
W
A o T
K
G o T
M
A o C
B
C o G o T
D
A o G o T
H
A o C o T
V
A o C o G
N
cualquier base
Se observa aquí que una DBR puede ser una única región (es decir, que tiene todas las bases de nucleótidos adyacentes entre sí) o puede estar presente en diferentes localizaciones en un polinucleótido (es decir, las bases de
11 10
la DBR están separadas por secuencias no DBR, llamada también una DBR dividida). Por ejemplo, una DBR puede tener una o más bases en un primer adaptador en una primera localización en un polinucleótido y una o más bases en un segundo adaptador en una segunda localización en el mismo polinucleótido (p. ej., la DBR puede tener bases presentes en ambos extremos de un polinucleótido marcado asimétricamente, es decir, un polinucleótido que tiene adaptadores asimétricos). No se pretende ninguna limitación a este respecto.
Las DBR se pueden diseñar para facilitar la detección de los errores que se producen en las DBR durante los procesos de amplificación que se llevan a cabo antes del análisis de secuencia y/o los errores que se producen en la propia reacción de secuenciación. En tales realizaciones, las secuencias de DBR empleadas se diseñan de tal manera que un error en una secuencia de DBR no lleva necesariamente a la generación de otra posible secuencia de DBR (produciendo de ese modo la identificación incorrecta de replicones derivados del mismo molde como si fueran de un molde diferente debido a una mutación de la DBR). Considérese, por ejemplo, el uso de una DBR con la secuencia N. Un error en N convertiría una DBR en otra, lo que podría llevar a sobreestimar la probabilidad de que se estaba asignando correctamente un genotipo. Compárese esto con una DBR con secuencia Y. Si se ve una R en esta posición se sabe que ha habido un error. Aunque la DBR correcta no puede ser necesariamente asignada a esta DBR que contiene errores, se puede detectar que esto es debido a un error (p. ej., en la secuenciación o amplificación).
En algunas realizaciones, se pueden utilizar las secuencias de bases degeneradas como una combinación de MID-DBR que puede tanto (1) asignar la identidad de la muestra como (2) rastrear/contar las moléculas. Considérese, por ejemplo, dos muestras, una marcada con YYY y la otra marcada con RRR. En la reacción de secuenciación se observa una MID-DBR con la secuencia TAT, que no se ajusta a ninguna de las estructuras de la secuencia combinada de MID-DBR. Se requiere una mutación para convertir YYY en TAT. Se necesitan dos mutaciones para convertir RRR en TAT. Por lo tanto se podría decir que hay una mayor probabilidad de que la MID-DBR sea YYY en lugar de RRR.
La descripción de ejemplos de secuencias que identifican errores (o que corrigen errores) se puede encontrar en la literatura (p. ej., se describen en las publicaciones de la solicitud de patente de Estados Unidos 2010/0323348, titulada “Method and compositions for using error-detecting and/or error-correcting barcodes in nucleic acid amplification process”, y de la US2009/0105959, titulada “System and method for identification of individual samples from a multiplex mixture".
En ciertas realizaciones en las que está presente la DBR dentro de una población de adaptadores que incluye otros dominios funcionales (p. ej., sitio del cebador de secuenciación, MID, secuencia refleja), los dominios funcionales en la población de adaptadores serán idénticos entre sí mientras que la DBR variará. En otras palabras, a diferencia de los otros dominios en una población de adaptadores, la DBR tiene una composición de bases variable (o aleatoria). Por "población adaptadora", "población de adaptadores", y similares, se entiende una muestra de moléculas de adaptadores que están diseñadas para unirse a los polinucleótidos en una muestra.
La generación de adaptadores que tienen una DBR se puede conseguir de cualquier manera conveniente, p. ej., utilizando métodos de síntesis de ADN bien conocidos en la técnica (véase las citas en la sección de definiciones anterior).
Una vez unidos a los polinucleótidos en la muestra parental, los polinucleótidos se pueden someter a un proceso adicional y, finalmente, se pueden secuenciar. Las etapas de proceso que se pueden realizar incluyen cualquier etapa de proceso que desee el usuario, p. ej., enriquecimiento, amplificación, y similares. En la etapa de secuenciación, se obtiene la secuencia de la DBR, así como la de una porción del polinucleótido (p. ej., que contiene una región de interés). Una vez que se obtienen las secuencias, se determina el número de diferentes DBR unidas a un polinucleótido de interés. Este número se puede emplear para determinar, o estimar, el número de diferentes polinucleótidos de interés procedentes de la muestra parental de partida, que se representan en los resultados de la secuenciación, donde en algunas realizaciones, el número determinado es el número mínimo de diferentes polinucleótidos de interés procedentes de la muestra parental de partida que se representan en los resultados de la secuenciación.
Considérese, por ejemplo, una DBR de dos bases que tiene una composición de bases NN (donde N es cualquier base de desoxinucleótido, es decir, A, G, C o T) empleada en la secuenciación de un locus para realizar una identificación de alelos para una muestra particular del sujeto (es decir, si un sujeto es homocigótico o heterocigótico en el locus). Aunque puede haber algunos sesgos desde la síntesis de oligonucleótidos, se puede esperar que haya 16 DBR diferentes en la población de adaptadores con aproximadamente la misma probabilidad (como se ha descrito antes). Cuando se identifica la posibilidad de identificación de un alelo homocigótico, la determinación del número de las DBR presentes en el ciclo de secuenciación se puede utilizar para determinar/estimar el número (o número mínimo) de moléculas de polinucleótidos que fueron secuenciadas en realidad (y por tanto el número de las que fueron amplificadas durante la etapas de proceso).
Para genomas diploides, la identificación de alelos (en el caso ideal o teórico) puede ser modelada por la distribución binomial. Dado que las dos copias de alelos (X e Y) difieren en algún sitio, la probabilidad de observar todos X o todos Y viene dada por la fórmula (½)c, donde c es el número de observaciones (lecturas) del sitio. Si se observa X
diez veces en un sitio (y no se observa Y), se puede decir que probablemente la muestra es homocigótica para el tipo X. Por lo tanto, la probabilidad de un error en esta determinación es (½)10 (algo menos de uno en mil).
Los experimentos de esta invención demuestran que bajas cantidades de ADN en la fase inicial de preparación de la muestra pueden dar lugar a una alta cobertura de lecturas que corresponden todas a un alelo, y que esto puede ocurrir muchas más veces de lo que se debería esperar de acuerdo con la distribución binomial. Esto es debido a la amplificación de algunas moléculas de ADN (o incluso de una sola molécula) que da como resultado un gran número de lecturas derivadas de un locus genético en un único cromosoma (es decir, sólo uno de los dos cromosomas diploides realmente presentes en la muestra de interés). El resultado de esto es que el error como una función de la cobertura se desvía totalmente del error binomial pronosticado.
El uso de una DBR como se describe aquí aumentará la confianza en la realización de identificaciones de alelos procedentes de muestras que tienen cantidades limitadas de ADN. Por ejemplo, si 16 lecturas de secuenciación de un alelo de un locus genético contienen todas la secuencia GA de DBR, entonces es probable que todas estas lecturas procedan de la misma molécula de polinucleótido parental (y por lo tanto no está justificada una identificación de un alelo homocigótico). Sin embargo, si las 16 lecturas de secuenciación tienen cada una, una secuencia de DBR diferente, se puede realizar una identificación homocigótica con más confianza, ya que cada lectura proviene de una molécula de polinucleótido parental diferente.
Se observa aquí que en muchas realizaciones, no es posible llegar a la conclusión de que los polinucleótidos que tienen secuencias de DBR idénticas se derivan de la misma molécula de polinucleótido parental, ya que múltiples DBR idénticas pueden estar presentes en los polinucleótidos unidos a la DBR. Por ejemplo, si una población de adaptadores que contiene una DBR de dos bases N se utiliza para marcar una muestra que contiene más de 16 polinucleótidos, un subconjunto de los polinucleótidos marcados tendrá idénticas DBR, y por lo tanto no será posible determinar que sus secuencias fueron derivadas de diferentes moléculas del polinucleótido parental.
Una manera a modo de ejemplo para determinar más exactamente el número real de moléculas de partida o moléculas parentales debería ser aumentar la degeneración de las DBR (es decir, aumentar el número de secuencias únicas en la DBR utilizadas para marcar la muestra particular de interés) de modo que es probable que cada molécula única tenga una DBR diferente. En cualquier caso, en métodos a modo de ejemplo, se puede utilizar el número de DBR observadas o también la distribución de probabilidad del número esperado de lecturas para producir muy probablemente el número observado de las DBR.
Cuando se calculan estimados de si una identificación de alelo particular es un heterocigoto o un homocigoto, se puede crear/emplear una función apropiada L(r,v) que restituye la probabilidad de un genotipo con las lecturas de referencia r y variante v. Cuando se emplean las DBR como se describe aquí, se puede utilizar una función modificada para el cálculo de los estimados L(r',v'), donde r' es el número de DBR únicas para la lectura de referencia y v' es el número de DBR únicas para la lectura variante. Se puede emplear cualquier función conveniente para realizar identificaciones de alelos y se puede modificar para emplear los datos relativos a las lecturas de DBR como se describe aquí.
Se observa aquí, que se pueden utilizar aspectos de la invención para aumentar la confianza en la identificación de las variaciones del número de copias en una muestra de polinucleótidos, p. ej., una muestra genómica. Las variaciones del número de copias pueden incluir reordenamientos genómicos tales como deleciones, duplicaciones, inversiones y translocaciones o aneuploidías cromosómicas enteras tales como monosomías, disomías, trisomías, tetrasomías y pentasomías. Considérese, por ejemplo, un suceso de duplicación donde los padres tienen genotipos CA y CC en un SNP dado, y el probando tiene genotipo ACC. En el padre con el genotipo AC, con suficiente profundidad de cobertura de secuenciación (es decir, suficientes lecturas de secuenciación), se espera que el número de las DBR asociadas con el alelo C y con el alelo A sea similar. En el probando, con suficiente profundidad de cobertura de secuenciación, se espera que el número de las DBR asociadas con el alelo C sea 2 veces el número de las DBR asociadas con el alelo A, lo que proporciona la prueba de un caso de duplicación que engloba el alelo C. El uso de las DBR, más que el número de lecturas de secuenciación, proporciona más confianza en la identificación de una variación del número de copias ya que la DBR se puede utilizar para identificar lecturas que se derivan de diferentes moléculas de polinucleótidos.
Ejemplos de aplicaciones de las DBR
Como se ha detallado antes, las DBR permiten la validación estadística de las variantes de secuencia en una muestra heterogénea, incluyendo genomas o conjuntos de genomas complejos. Por ejemplo, las DBR encuentran uso en el análisis de genomas complejos en muestras de tumores, muestras microbianas, muestras ambientales, etc.
A continuación se proporcionan ejemplos de métodos estadísticos y ejemplos de aplicaciones de las DBR. Las descripciones que siguen se indican sólo a modo de ejemplos y no pretenden limitar el alcance del empleo de las DBR en los análisis de polinucleótidos.
Métodos Estadísticos
Como se ha descrito antes, en aspectos de la presente invención, las rondas de bases degeneradas (las DBR) se utilizan para estimar, o para obtener una medida cuantitativa del número real de moléculas molde secuenciadas o analizadas en un proceso dado. Dos lecturas pueden tener la misma DBR ya sea porque las lecturas proceden de la misma molécula molde o porque las moléculas han recibido la misma DBR por casualidad. El número potencial de distintas moléculas molde secuenciadas varía del número de las DBR al número de lecturas. La distribución de las DBR desde un número de moléculas de partida viene dada por la distribución de ocupación [véase C.A. Charalambides and C.A. Charalambides. Combinatorial methods in discrete distributions. John Wiley and Sons, 2005]. Dado un número observado de DBR, el número probable de moléculas de partida se puede calcular utilizando la estimación de máxima probabilidad, u otras técnicas adecuadas. Alternativamente, para cada DBR, la molécula molde más probable se puede estimar utilizando la secuencia de consenso de todas las lecturas con esa particular DBR. Los métodos se pueden combinar para generar estimados exactos del número de moléculas molde asociadas con variantes particulares.
Las DBR en la amplificación por PCR
Las DBR se pueden utilizar para estimar o para obtener una medida del número de moléculas de partida utilizadas como moldes para una reacción de PCR. Por ejemplo, una muestra de polinucleótido de partida puede ser amplificada por PCR en el primer ciclo, o los primeros ciclos, utilizando un par de cebadores de la PCR en los que uno de los cebadores (o ambos) incluyen una secuencia de cebador genérico y una DBR 5' hasta la secuencia diana específica. Después del ciclo o ciclos iniciales, este par de cebadores de PCR que contienen la DBR puede ser eliminado o inactivado y reemplazado con cebadores de PCR que no tienen una DBR para los ciclos restantes. La eliminación/inactivación de los cebadores que contienen DBR se puede llevar a cabo de cualquier manera conveniente, por ejemplo, por medios físicos o bioquímicos. Por ejemplo, los cebadores que contienen DBR pueden tener unido a los mismos un primer miembro de un par de unión (por ejemplo, biotina), facilitando de este modo la eliminación de estos cebadores al poner en contacto la muestra con el compañero de unión unido a un soporte sólido (por ejemplo, estreptavidina unida a un soporte sólido) y recogiendo la fracción no unida. Alternativamente, los cebadores libres que contienen DBR se pueden eliminar tratando la muestra con una exonucleasa específica de cadena simple (por ejemplo, exonucleasa I), haciendo a los cebadores incapaces de participar en otras etapas de extensión del cebador (p. ej., mediante la incorporación de un didesoxinucleótido en el extremo 3'), o por un proceso de inmovilización reversible de fase sólida (SPR1) (por ejemplo, Agencourt AMPure XP-PCR Purification, Beckman Coulter). Los segundos cebadores de PCR se diseñan para comprender las secuencias presentes en el extremo 5' de cada uno del primer conjunto de cebadores de manera que se replique la DBR en moldes generados a partir de los cebadores de PCR que contienen DBR utilizados en el primero o primeros ciclos. Por lo tanto, los ciclos restantes de la PCR amplificarán sólo los productos del primero o primeros ciclos que contienen las DBR. En otra realización, los cebadores que contienen la DBR pueden ser diseñados para tener una Tm más alta que el segundo conjunto de cebadores que no contienen la DBR (es decir, la Tm de la secuencia específica diana de los primeros cebadores de la PCR es más alta que la de los segundos cebadores de la PCR específica para las secuencias del cebador genérico en 5'). En este escenario a modo de ejemplo, los cebadores que contienen DBR pueden estar presentes en cantidades limitantes y el primero o primeros ciclos de la PCR se llevan a cabo a la Tm más alta de tal modo que sólo los cebadores que contienen DBR se hibridan y participan en la síntesis del ácido nucleico. Debido a que los cebadores que contienen DBR están presentes en cantidades limitantes, se utilizarán sólo en el primero o primeros ciclos de la PCR. La realización de los ciclos de PCR restantes a una Tm más baja permitirá una amplificación adicional mediante el segundo conjunto de cebadores de la PCR que no incluyen las DBR pero que replicarán las DBR procedentes de los productos del primero o primeros ciclos (como se ha descrito antes).
Se observa que hay muchas combinaciones diferentes de cebadores de la PCR y condiciones de amplificación que se pueden emplear para llevar a cabo la amplificación por PCR con las DBR descrita anteriormente. Por ejemplo, tales reacciones pueden incluir 3 cebadores, en donde el cebador 1 (cebador directo específico para el polinucleótido diana y que contiene una DBR y una secuencia de cebado genérico en 5') y el cebador 2 (cebador específico inverso para el polinucleótido diana y sin ninguna DBR) se utilizan para amplificar la diana en el primero o primeros ciclos, y el cebador 3 (cebador directo específico para la secuencia de cebado genérico en 5' del cebador 1) y el cebador 2 se utilizan para los ciclos restantes.
Se observa, además, que el marcado de los dos extremos de un producto de la PCR con una DBR (es decir, donde ambos cebadores utilizados en el primero/primeros ciclos incluyen una DBR) puede proporcionar una mayor confianza en la estimación del número de polinucleótidos de partida amplificados. Se observa que si se utilizan más de 2 ciclos de PCR para unir las DBR, entonces es necesario tomar precauciones adicionales durante el análisis de los datos cuando se utilizan las DBR para rastrear la molécula molde inicial (o de partida) a partir de la cual se amplificaron los productos. Esto es debido a la posibilidad de que en el tercer ciclo de la PCR, un cebador de PCR que tiene una DBR se puede unir a un sitio de DBR existente en un producto de la PCR generado previamente, introduciendo de este modo una nueva secuencia de DBR. Como se indica a continuación, el análisis teórico de los tres primeros ciclos de PCR demuestra que es posible rastrear el linaje de una molécula. Se observa que el análisis que sigue podría ser utilizado teóricamente para cualquier número de ciclos de PCR para la adición de las secuencias de DBR, aunque la profundidad de la secuenciación tendría que ser suficiente.
El método descrito a continuación permite lecturas de una a un grupo de secuencias después de >1 ciclo de adición
de DBR utilizando cebadores de PCR que contienen DBR. La Tabla I muestra cada uno de los productos de la PCR
generados en cada uno de tres ciclos de PCR a partir de un único molde de doble cadena (el molde que tiene en la
parte superior la cadena A y en la parte inferior la cadena B, como se señala en el ciclo 0 de la Figura 3). En la Tabla
5 I, se muestra cada cadena presente en cada ciclo (señalada con las letras A a P) junto con su respectiva cadena
molde (es decir, la cadena que sirvió como molde durante la síntesis de la cadena indicada), y la DBR 5' y la DBR 3'
presentes en la cadena, si hay alguna (indicadas con los números 1 a 14). Por "DBR 5'" se entiende una secuencia
de DBR que fue incorporada como parte de un cebador de PCR. Por "DBR 3'" se entiende una secuencia
complementaria de una secuencia DBR 5' (es decir, generada como resultado de la extensión del cebador a lo largo 10 de una secuencia existente de DBR 5'). En el ciclo 3, se puede ver que se puede producir una sobreescritura de
DBR (indicada en la columna más a la derecha; véase, p. ej., las cadenas K y N producidas en el ciclo 3).
Tabla I. Marcado de DBR en los ciclos 0 a 3 de una reacción de PCR para un único molde de doble cadena (A y B).
Ciclo
Cadena DBR 5' nº DBR 3' nº Cadena molde Sobreescritura de DBR
Ciclo 0
A - - -
B
- - -
Ciclo 1
A - - -
B
- - -
C
1 - A
D
2 - B
Ciclo 2
A - - -
B
- - -
C
1 - A
D
2 - B
E
3 - A
F
4 1 C
G
5 2 D
H
6 - B
Ciclo 3
A - - -
B
- - -
C
1 - A
D
2 - B
E
3 - A
F
4 1 C
G
5 2 D
H
6 - B
I
7 - A
J
8 3 E
K
9 4 F sobreescritura de DBR 1 con DBR 9
L
10 1 C
M
11 2 D
N
12 5 G sobreescritura de DBR 2 con DBR 12
O
13 6 H
P
14 - B
La Tabla I anterior y la Figura 3 muestran las cadenas que se han acumulado durante todo el proceso de la PCR.
15 (Debe observarse el arrastre de las cadenas A y B del ciclo 0 a los ciclos 1, 2, y 3; el arrastre de las cadenas C y D del ciclo 1 a los ciclos 2 y 3; etc.).
Dada la suficiente profundidad de secuenciación, las DBR se pueden utilizar para rastrear la molécula de origen, incluso si se ha producido una sobreescritura de la DBR. Por ejemplo, la cadena K tiene DBR 5' nº 9 y DBR 3' nº 4. La DBR nº 4 se comparte con la cadena F, que tiene DBR 5' nº 4 y DBR 3' nº 1. La DBR nº 1 se comparte con la
20 cadena C. Por lo tanto las cadenas K y F se derivan originalmente de la cadena C. Del mismo modo, la cadena N tiene DBR 5' nº 12 y DBR 3' nº 5. La DBR nº 5 se comparte con la cadena G, que tiene DBR 5' nº 5 y DBR 3' nº 2. La DBR nº 2 se comparte con la cadena D. Por lo tanto las cadenas N y G se derivan originalmente de la cadena D.
Como se ha expuesto anteriormente, los cebadores de la PCR que contienen DBR se eliminan después de los primeros ciclos (p. ej., después de la finalización del ciclo 3 como se muestra en la Tabla I).
La Figura 3 muestra un esquema para los 2 primeros ciclos de PCR para un único molde de cadena doble como se muestra en la Tabla I. En el ciclo 0, sólo las cadenas molde de doble cadena están presentes, es decir, la cadena A de la parte superior y la cadena B de la parte inferior. Obsérvese que la dirección de las flechas sobre cada cadena en la Figura 3 indica la dirección 5' a 3'. En el primer ciclo de la PCR (ciclo 1), se producen 2 productos mediante el par de cebadores de la PCR (ambos miembros del par de cebadores incluyen una secuencia de DBR), la primera cadena (C) que tiene DBR nº 1 ("1" como se muestra en la figura) y la segunda (D) que tiene DBR2 ("2" como se muestra en la figura). En el segundo ciclo de la PCR (ciclo 2), los cuatro moldes (A, B, C y D) producen 4 productos (E, F, G y H), que tiene cada uno, una subsiguiente DBR unida (DBR nº 3, nº 4, nº 5 y nº 6, respectivamente). Se debe observar que los productos generados a partir de los moldes C y D (F y G) tienen ahora las DBR en ambos extremos. El ciclo 3 (que no se muestra en la Figura 3) utiliza entonces los 8 moldes del ciclo 2 para producir 8 productos, que tiene cada uno DBR adicionales unidas (véase los productos que se muestran en la Tabla I). El ciclo 3 es el primer ciclo en el que puede ocurrir una sobreescritura de la DBR (es decir, el cebado y la extensión de los moldes F y G con los cebadores de PCR marcados con subsiguientes DBR sobrescribirán la DBR nº 1 y la DBR nº 2; estas se muestran en la Tabla I como cadenas K y N).
En el análisis de las DBR de polinucleótidos en los que es posible la sobreescritura de las DBR, las lecturas se agrupan de acuerdo con las secuencias 5' y 3' de DBR y se rastrea el linaje de la molécula parental.
Como se desprende de la descripción anterior, la DBR es útil (1) para la identificación de los errores de la PCR que se presentan durante los primeros ciclos y (2) para la exactitud de la determinación de la identificación/número de copias de un alelo. Para la identificación de errores, es claramente permisible agrupar sucesos de cebado independientes. La exactitud de los cálculos de la identificación de alelos aumentó ligeramente en complejidad dado que los sucesos de cebado no representan necesariamente moléculas de partida independientes. Sin embargo, es una suposición razonable que los sucesos de cebado son igualmente probables en cualquier alelo, y por lo tanto este análisis es útil para mejorar la exactitud de la identificación de alelos.
Para copias muy bajas del molde inicial, el uso de múltiples ciclos de adición de DBR puede ser ventajoso. Por ejemplo, a concentraciones muy bajas de ADN no se podría recuperar un número suficiente de las DBR para dar un genotipo exacto utilizando métodos estándar. El permitir múltiples casos de cebado en la misma molécula molde puede dar, en este caso, suficiente confianza para realizar una identificación de alelos al proporcionar más datos.
Se puede utilizar el análisis de las DBR en los productos de amplificación final para estimar el número de moléculas de partida amplificadas en la reacción. Dicho análisis permitirá al usuario determinar si los productos de la reacción de la PCR representan la amplificación selectiva de sólo algunos (o incluso uno) polinucleótidos de partida y/o ayudar en la determinación de los errores de la PCR que se han producido durante la amplificación (p. ej., como se ha descrito antes).
Las DBR en muestras de tumores heterogéneos
Las DBR también se utilizan en la evaluación de la heterogeneidad de anomalías cromosómicas en muestras de tumores, p. ej., dentro de un único tumor o entre tumores diferentes en un sujeto. Por ejemplo, se pueden obtener una o más muestras tumorales a partir de un único tumor (p. ej., en diferentes localizaciones dentro o alrededor del tumor) y/o de diferentes tumores en un sujeto y se pueden analizar en cuanto a la variación genética en una o más localizaciones cromosómicas. En ciertas realizaciones, se pueden obtener muestras de un tumor (o sujeto) a lo largo del tiempo. Tales variaciones pueden incluir cambios específicos de bases, deleciones, inserciones, inversiones, duplicaciones, etc., que son conocidos en la técnica. Las DBR se pueden emplear para marcar los polinucleótidos en la muestra o muestras tumorales antes de identificar las variaciones genéticas específicas, proporcionando así una manera de realizar los análisis estadísticos para validar todas las variantes identificadas. Por ejemplo, se puede utilizar el análisis estadístico para determinar si una variación detectada representa una mutación en un subconjunto de células del tumor, si es una variación que es específica para un tumor particular del sujeto, si es una variación que se encuentra en células no tumorales del individuo, o si es un artefacto del procedimiento por el cual se identificó la variante (p. ej., un artefacto de PCR).
Las DBR en la evaluación de la diversidad microbiana
El análisis de las DBR también se puede utilizar en la determinación de la variación/diversidad genética de una población de microbios/virus en una única muestra o entre muestras diferentes (p. ej., muestras recogidas a diferentes puntos de tiempo o de diferentes localizaciones). Por ejemplo, las muestras recogidas de un individuo a lo largo de una infección pueden ser analizadas en cuanto a la variación genética durante el proceso de infección utilizando las DBR como se describe aquí. Sin embargo, no se pretende ninguna limitación en el tipo de muestra microbiana/viral, y como tal, la muestra puede ser de cualquier fuente, p. ej., de un sujeto con una infección, de una fuente ambiental (suelo, agua, plantas, animales o productos de desechos animales, etc.), de una fuente de alimentos, o cualquier otra muestra para la que se desea la determinación de la diversidad genética de los microorganismos de la muestra, en uno o más locus o regiones genéticas. En la práctica de los métodos, los
polinucleótidos derivados de la muestra se marcan con las DBR como se describe en la presente memoria (ya sea antes o después de una etapa de enriquecimiento) y se procesan para identificar variaciones genéticas en uno o más sitios genéticos o locus de interés. El análisis de las DBR se puede llevar a cabo entonces para proporcionar un aumento de la confianza en la determinación de la diversidad genética de los microbios de la muestra en el locus de interés. Dicho análisis se puede realizar sobre muestras recogidas de diversas fuentes y/o en diversos puntos de tiempo desde una fuente. Los ejemplos de locus genéticos que se pueden utilizar en la evaluación de la diversidad microbiana incluyen, pero no se limitan a, ARN ribosómico, por ejemplo, ARN ribosómico 16S, genes de resistencia a antibióticos, genes de enzimas metabólicas, etc.
Las DBR en la evaluación de los niveles de diferentes especies de polinucleótidos en una muestra
El análisis de las DBR se puede utilizar también en la evaluación de los niveles de diferentes especies de polinucleótidos en una muestra. En concreto, debido a que el análisis de las DBR puede determinar (o estimar) el número de polinucleótidos parentales en una muestra, se pueden evaluar la cantidad relativa o cuantitativa de las especies de polinucleótidos específicos y la confianza en la determinación de dichas especies. Por ejemplo, el análisis de una muestra de ADNc utilizando las DBR se puede emplear para evaluar los niveles relativos o cuantitativos de diferentes especies de ADNc en la muestra, proporcionando así una manera de determinar sus niveles relativos de expresión génica.
Las DBR en el análisis de muestras conjuntas
Otra aplicación de las DBR es en la realización de análisis genéticos sobre muestras reunidas de polinucleótidos en las que cada polinucleótido de la muestra conjunta incluye un MID específico para su muestra de origen (descrito en detalle anteriormente). Esto permite al usuario determinar la cobertura de secuencia de una especie de polinucleótidos específicos (o múltiples especies) de cada una de las muestras de origen que se reúnen para generar la muestra conjunta. Esto proporciona un mecanismo para asegurar que los polinucleótidos de cada muestra de partida en la muestra conjunta están representados adecuadamente. Por lo tanto, las realizaciones de la presente invención incluyen análisis de secuencias de polinucleótidos en una muestra conjunta, donde cada polinucleótido contiene un MID y una DBR. Se observa que en estas realizaciones, se puede usar el mismo diseño de DBR en conjunción con todas las muestras parentales/MIDs, ya que esta es la combinación de MID/DBR que se utiliza en el análisis de secuencias de la muestra específica.
Los análisis de la muestra conjunta utilizando los MID y DBR se utilizan en numerosos análisis genéticos, incluyendo la realización de identificaciones de alelos, la corrección de errores de secuencias, los análisis relativos y cuantitativos de la expresión génica, y similares. Se observa que al analizar polinucleótidos en una muestra conjunta de acuerdo con aspectos de la presente invención, es importante mantener tanto los dominios de MID como los dominios de DBR en cada etapa del flujo de trabajo que se emplea, ya que la pérdida de uno u otro dominio tendrá un impacto negativo sobre la confianza en los resultados obtenidos.
Se observa, además, que el uso de los dominios de MID y DBR en el análisis genético es especialmente potente cuando se combina con plataformas de secuenciación de nueva generación (NGS), muchas de las cuales proporcionan datos de secuencias para cada polinucleótido individual presente en la muestra a ser secuenciada. En contraste con los métodos convencionales de secuenciación en los que los clones individuales de los polinucleótidos se secuencian de forma independiente, las plataformas de secuenciación de nueva generación proporcionan secuencias de múltiples polinucleótidos diferentes en una muestra de forma simultánea. Esta diferencia permite que se hagan análisis estadísticos específicos de la muestra que no están limitados por tener que clonar y secuenciar de forma independiente cada polinucleótido. Por lo tanto, los análisis del dominio MID/DBR descritos en la presente memoria son sinérgicos con las plataformas de secuenciación de nueva generación, proporcionando mejores métodos estadísticos para analizar las cantidades muy grandes de datos de las secuencias de las muestras conjuntas.
Kits y sistemas
Se proporcionan también mediante la presente invención kits y sistemas para la práctica de los métodos propuestos, es decir, para el uso de las DBR para determinar el número (o mínimo número), de diferentes polinucleótidos de partida que han sido secuenciados para un polinucleótido particular. Como tales, los sistemas y kits pueden incluir polinucleótidos que contienen las DBR (p. ej., adaptadores), así como cualquier otro dominio funcional de interés como se describe en el presente documento (p. ej., sitios de los cebadores de secuenciación, MID, secuencias reflejas, etc.). Los sistemas y kits pueden incluir también reactivos para llevar a cabo todas las etapas para unir los adaptadores a los polinucleótidos de una muestra parental, preparar una muestra parental para la unión adaptador/DBR, y/o reactivos para llevar a cabo las reacciones de secuenciación (p. ej., ligasas, enzimas de restricción, nucleótidos, polimerasas, cebadores, cebadores de secuenciación, dNTPs, ddNTPs, exonucleasas, etc.). Los diversos componentes de los sistemas y kits pueden estar presentes en recipientes separados o ciertos componentes compatibles pueden ser pre-reunidos en un único recipiente, según se desee.
Los presentes sistemas y kits pueden incluir también uno o más de otros reactivos para preparar o procesar una muestra de ácido nucleico de acuerdo con los métodos propuestos. Los reactivos pueden incluir una o más matrices,
disolventes, reactivos de preparación de muestras, tampones, reactivos de desalación, reactivos enzimáticos, reactivos desnaturalizantes, donde los estándares de calibración, tales como los controles positivos y negativos se pueden proporcionar también. Así pues, los kits pueden incluir uno o más recipientes tales como viales o frascos, conteniendo cada recipiente un componente separado para llevar a cabo una etapa de procesamiento o preparación de una muestra según la presente invención.
Además de los componentes mencionados antes, los presentes kits incluyen típicamente además instrucciones para utilizar los componentes del kit para practicar los métodos propuestos, p. ej., para emplear las DBR como se ha descrito anteriormente. Las instrucciones para la práctica de los métodos de la invención generalmente se registran en un medio de registro adecuado. Por ejemplo, las instrucciones se pueden imprimir sobre un sustrato, tal como papel o plástico, etc. Como tales, las instrucciones pueden estar presentes en los kits como un prospecto, en el etiquetado del recipiente del kit o de sus componentes (es decir, asociado con el empaquetado o sub-empaquetado), etc. En otras realizaciones, las instrucciones están presentes como un archivo electrónico de almacenamiento de datos presente en un medio de almacenamiento legible por un ordenador adecuado, por ejemplo, CD-ROM, disquete, etc. Todavía en otras realizaciones, las instrucciones reales no están presentes en el kit, pero se proporcionan medios para obtener las instrucciones de una fuente remota, p. ej., a través de Internet. Un ejemplo de esta realización es un kit que incluye una dirección web en la que se pueden ver las instrucciones y/o de la que se pueden descargar las instrucciones. Al igual que con las instrucciones, este medio para obtener las instrucciones se registra en un sustrato adecuado.
Además de esta base de datos, programación e instrucciones, los kits pueden incluir también una o más muestras control y reactivos, p. ej., dos o más muestras control para utilizar en el ensayo del kit.
Ejemplos
Métodos
Dos muestras idénticas de ADN genómico de ratón se marcaron con adaptadores. Una de las muestras utilizó un adaptador que tiene una región sintetizada de forma redundante que consiste en 7 bases (RYBDHVB), cada una de las cuales podría ser una de dos bases (para las posiciones R e Y) o de tres bases (para las posiciones B, D, H o V) (o un total de 972 secuencias diferentes), seguida por las bases ACA; la segunda muestra utilizó un adaptador que tiene una región sintetizada de forma redundante que consiste en 7 bases (RYBDHVB), cada una de las cuales podría ser una de dos bases (para las posiciones R e Y) o de tres bases (para las posiciones B, D, H o V) (o un total de 972 secuencias diferentes) seguida por las bases ACG. Nótese que las bases en negrita y subrayadas corresponden a un sitio polimórfico sintético. En estos adaptadores, la secuencia RYB sirve como la región DBR y la DHVB sirve como el MID. Por lo tanto, había presentes 12 posibles códigos de DBR (2 × 2 × 3) y 81 diferentes MID (3 × 3 × 3 × 3).
Se mezclaron después las dos muestras juntas en cantidades iguales para crear, en efecto, un perfecto heterocigoto 50/50 de tres bases A y G aguas abajo del MID (es decir, la secuencia DHVB). Diferentes cantidades de la mezcla (100 ng, 300 ng, 600 ng, 2500 ng, 5000 ng, y 10.000 ng) se sometieron a reacciones de interacción (pull-down) de hibridación seguidas por la amplificación a través de 10 ciclos de PCR con cebadores TiA y TiB. Las sondas de captura empleadas fueron oligonucleótidos purificados en cartucho en fase inversa de 60 meros 5'-biotinilados (Biosearch). Después de la amplificación con TiA y TiB, se utilizó una reacción secundaria de PCR con TiA y un cebador específico de la secuencia con cola de TiB (5'-CCTATCCCCTGTGTGCCTTGGCAGTCTCAGGGACACCCAGCCAAGACAGC-3') (SEQ ID NO: 1) para amplificar un fragmento específico. El fragmento de PCR generado a partir de cada muestra en la hibridación pulldown/PCR fue enviado para secuenciación con Shot 454 Ti para determinar la DBR, el MID y los alelos A/G.
La secuencia del amplicón procedente de la hibridación pull down/PCR se muestra a continuación (SEQ ID NO: 2). La región DBR está subrayada, el MID está en negrita, y el alelo (R, que corresponde a A o G) está en negrita y subrayado.
CCATCTCATCCCTGCGTGTCTCCGACTCAGRYBDHVBACRTAGAATGTGCATGGATCGTATGAGCACCTGTGGG CAGGGCAAGTGGCAGATGCCTTAGTGGATCTCACTGGAAGCCTGGCAGAAAGGTGGAGCTTGAAGGATGTAAC GAAAGCCAGCGGCCAGCAGGACAGACCCAGTGGTGGGGAGCACAGAACTTGTCGGCAGCTACTCCACCTGAA GGACCGGTGTCTAATCAGCTGCTCTGTGCTTAGCCCCAGAGCAGGTACAGCTATGGCTACAACTCCCTCCACCA TTAGCTTGTTACAGAGAAGGAAATCGGTCCTTGAGAGGCTGTCTTGGCTGGGTGTCCCTGAGACTGCCAAGGCA CACAGGGGATAGG
Resultados
La Figura 1 muestra la relación de alelos para cada MID en la muestra. Los números en la parte superior de cada uno de los 6 paneles muestran la masa de entrada de ADN genómico utilizada (en nanogramos). El eje de abscisas muestra, para cualquier MID particular, la fracción de las lecturas de secuenciación de A, o calls (en inglés), (es decir, el número de lecturas de una de las bases polimórficas en la posición del SNP sintético) frente al número total de lecturas, por ejemplo, la relación de (lecturas de A)/(lecturas de A + lecturas de G). Esto se denomina la relación
de alelos. El eje de ordenadas es el número de los MID observados con una relación particular de alelos (el número total de los MID, como se señaló anteriormente, es 81). Debido a que era sabido que el ADN de entrada tenía una relación de A/G 50/50, la relación de alelos para cada muestra debería ser 0,5.
Para una masa de entrada baja, la relación de alelos se distorsiona - demasiado alta o demasiado baja - debido a que las moléculas de entrada a la primera etapa de la PCR eran limitantes y por lo tanto se observó preferentemente uno de los dos alelos. Como la masa aumenta en la primera etapa, se observan ambos alelos y están cada vez más próximos a la relación esperada de 0,5. Este análisis demuestra que hubo una considerable caída de los alelos a 100 ng, 300 ng y 600 ng, mientras que hubo una pequeña o ninguna caída de los alelos en los niveles de entrada más altos.
La Figura 2 muestra la fracción de secuencias de DBR para cada MID asociada con cada alelo. Dado que el material de entrada es nominalmente A y G a 50/50 en la posición polimórfica sintética, es de esperar que cada uno de los 81 MID efectivos esté asociado con las lecturas del 50 % de A y 50 % de G (como se señaló anteriormente). Además, puesto que las 12 DBR son aleatorias y se asocian con cada uno de los 81 MID diferentes, se podría esperar, con suficientes copias de ADN de entrada, que las 12 DBR se observarían para el alelo A y las 12 para el alelo G. Por lo tanto, la fracción de las DBR observada para una base particular en el caso ideal debería ser 12/24 o 0,5 para cada alelo. En la medida en que un número insuficiente de moléculas entre en los etapas de proceso, puede haber menos de 12 DBR para cada alelo de MID, y así la relación se puede desviar de la ideal.
En la Figura 2, el eje de abscisas muestra, para cualquier MID particular, la proporción de las DBR realmente observadas para cada alelo dividida por el número total de las DBR realmente observadas. El eje de ordenadas es el número de los MID observados con una proporción particular o las DBR asociadas con un alelo. Se ven, y se deberían ver, un total de 81 MID diferentes. Se observa que en una masa de entrada baja, se puede ver con frecuencia una proporción distorsionada, demasiado alta o demasiado baja. Esto es debido probablemente al número limitante de moléculas de entrada en la primera etapa de la PCR, y por lo tanto se observó preferentemente uno de los dos alelos. Como aumenta la masa en la primera etapa, se observan ambos alelos con más frecuencia y se asocia con cada alelo una observación de cada vez más de las DBR, y por lo tanto una proporción más cerca del 0,5.
Una comparación de los datos en las figuras 1 y 2 muestra una característica adicional del empleo de las DBR como se describe aquí. Para un heterocigoto verdadero, se empieza a ver antes (es decir, a una masa más baja) en el análisis de DBR (Figura 2) que los grupos de distribución están alrededor de la relación esperada de 0,5. Esto tiene sentido porque, por ejemplo, la observación de 6 de las 12 DRB para el alelo A y 4 de las 12 DBR del alelo G se traduciría en una proporción de (6/[6 + 4]) = 0,60 que, de hecho, está bastante cerca de la esperada 0,5. El efecto neto es que el uso de las DBR da mucha mayor confianza en presencia de un verdadero heterocigoto o un verdadero homocigoto.
Aunque la invención precedente se ha descrita en algún detalle a modo de ilustración y ejemplo con fines de claridad de comprensión, es fácilmente evidente para los expertos en la técnica a la luz de las enseñanzas de esta invención que se pueden hacer ciertos cambios y modificaciones de la misma sin apartarse del alcance de las reivindicaciones adjuntas.
Por consiguiente, el texto precedente simplemente ilustra los principios de la invención. Se debe apreciar que los expertos en la técnica serán capaces de idear diversos arreglos que, aunque no se describan ni se muestren explícitamente en el presente documento, incorporan los principios de la invención y están incluidos dentro de su alcance. Además, todos los ejemplos y el lenguaje condicional presentados en este documento tienen como principal objetivo ayudar al lector en la comprensión de los principios de la invención y los conceptos aportados por la invención para la promoción de la técnica, y se deben interpretar como no limitados a dichos ejemplos y condiciones específicamente indicados. Por lo tanto, no se pretende que el alcance de la presente invención se limite a las realizaciones mostradas como ejemplos y descritas en el presente documento. Más bien, el alcance de la presente invención se materializa en las reivindicaciones adjuntas.

Claims (15)

  1. REIVINDICACIONES
    1. Un método de estimación del número de moléculas de polinucleótidos de partida secuenciadas a partir de múltiples muestras, comprendiendo el método:
    unir un adaptador a las moléculas de polinucleótidos de partida de múltiples muestras diferentes, en donde el adaptador para cada muestra comprende:
    una marca de un único identificador multiplex (MID) específico para la muestra, haciendo posible la marca del identificador multiplex la identificación de la muestra a partir de la cual se deriva un polinucleótido; y
    una región de bases degeneradas (DBR) que comprende al menos una base de nucleótidos seleccionada de: R, Y, S, W, K, M, B, D, H, V, N, y las versiones modificadas de las mismas, siendo la degeneración de las DBR de tal modo que es probable que cada polinucleótido individual tenga una DBR diferente;
    reunir las múltiples muestras unidas a adaptadores diferentes para generar una muestra conjunta;
    amplificar los polinucleótidos unidos al adaptador en la muestra conjunta;
    secuenciar una pluralidad de los polinucleótidos amplificados unidos al adaptador, en donde se obtiene la secuencia del MID, de la DBR y de al menos una porción del polinucleótido, para cada uno de la pluralidad de polinucleótidos unidos al adaptador; y
    determinar el número de secuencias de DBR definidas presentes en la pluralidad de polinucleótidos secuenciados unidos al adaptador a partir de cada muestra, para determinar el número de polinucleótidos de partida de cada muestra que fueron secuenciados en la etapa de secuenciación.
  2. 2.
    Un método según la reivindicación 1, en donde el adaptador comprende además un sitio del cebador de la secuenciación.
  3. 3.
    Un método según la reivindicación 1, en donde la DBR comprende al menos 2 bases de nucleótidos, en donde cada una de las al menos 2 bases de nucleótidos se seleccionan de: R, Y, S, W, K, M, B, D, H, V, y N.
  4. 4.
    Un método según la reivindicación 3, en donde la DBR comprende de 3 a 20 bases de nucleótidos, en donde cada una de las 3 a 20 bases de nucleótidos se selecciona de: R, Y, S, W, K, M, B, D, H, V, y N.
  5. 5.
    Un método según la reivindicación 1, en donde el número determinado de polinucleótidos de cada muestra que fueron secuenciados en la etapa de secuenciación se emplea en un método para la identificación de alelos.
  6. 6.
    Un método según la reivindicación 1, en donde cada una de las múltiples muestras es una muestra de ADN genómico.
  7. 7.
    Un método según la reivindicación 6, en donde cada una de las múltiples muestras de ADN genómico diferente se deriva de un sujeto humano diferente.
  8. 8.
    Un método según la reivindicación 1, en donde además se enriquece la muestra para una región de interés antes de la etapa de unión.
  9. 9.
    Un método según la reivindicación 1, que comprende además enriquecer los polinucleótidos unidos al adaptador para una región de interés.
  10. 10.
    Un método según la reivindicación 3, en donde el adaptador es un adaptador asimétrico, en donde un primer dominio del adaptador está presente en un primer extremo del polinucleótido y un segundo dominio del adaptador está presente en un segundo extremo del polinucleótido, en donde la DBR es una DBR dividida que comprende una
    o más de las al menos 2 bases de nucleótidos en el primer dominio del adaptador y una o más de las al menos 2 bases de nucleótidos en el segundo dominio del adaptador.
  11. 11.
    Un método según la reivindicación 1, en donde el adaptador se une a las moléculas de polinucleótido en una reacción de amplificación, en donde la DBR está presente en un cebador de síntesis empleado en la reacción de amplificación.
  12. 12.
    Un método según la reivindicación 11, en donde la reacción de amplificación es una PCR.
  13. 13.
    Un método según la reivindicación 11, en donde el método comprende además determinar el número de polinucleótidos de partida amplificados en la reacción PCR.
  14. 14.
    Un método según la reivindicación 1, en donde el método se dirige a la determinación de la heterogeneidad genética de los polinucleótidos en la muestra, en donde la muestra comprende polinucleótidos derivados de tejido tumoral, microorganismos y/o virus.
  15. 15. Un método según la reivindicación 1, en donde el método se dirige a la determinación de la heterogeneidad genética de los polinucleótidos presentes en las múltiples muestras diferentes, en donde las múltiples muestras diferentes se derivan de diferentes secciones de un tumor, en donde las múltiples muestras diferentes se derivan de diferentes tumores de un sujeto, o en donde las múltiples muestras diferentes se derivan de un sujeto a lo largo del tiempo o en donde el sujeto tiene una infección.
ES11810645.9T 2010-09-21 2011-09-20 Aumento de la confianza en las identificaciones de alelos con el recuento molecular Active ES2523140T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US38500110P 2010-09-21 2010-09-21
US385001P 2010-09-21
US201161432119P 2011-01-12 2011-01-12
US201161432119P 2011-01-12
PCT/IB2011/003160 WO2012038839A2 (en) 2010-09-21 2011-09-20 Increasing confidence of allele calls with molecular counting

Publications (1)

Publication Number Publication Date
ES2523140T3 true ES2523140T3 (es) 2014-11-21

Family

ID=45498036

Family Applications (3)

Application Number Title Priority Date Filing Date
ES16170857.3T Active ES2690753T3 (es) 2010-09-21 2011-09-20 Aumento de la confianza en las identificaciones de alelos con el recuento molecular
ES13164430.4T Active ES2595433T3 (es) 2010-09-21 2011-09-20 Aumento de la confianza en las identificaciones de alelos con el recuento molecular
ES11810645.9T Active ES2523140T3 (es) 2010-09-21 2011-09-20 Aumento de la confianza en las identificaciones de alelos con el recuento molecular

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES16170857.3T Active ES2690753T3 (es) 2010-09-21 2011-09-20 Aumento de la confianza en las identificaciones de alelos con el recuento molecular
ES13164430.4T Active ES2595433T3 (es) 2010-09-21 2011-09-20 Aumento de la confianza en las identificaciones de alelos con el recuento molecular

Country Status (9)

Country Link
US (7) US8481292B2 (es)
EP (3) EP2619327B1 (es)
JP (2) JP5992911B2 (es)
CN (2) CN103154273A (es)
CA (1) CA2811185C (es)
DK (1) DK2623613T3 (es)
ES (3) ES2690753T3 (es)
PT (1) PT2623613T (es)
WO (1) WO2012038839A2 (es)

Families Citing this family (381)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060030036A1 (en) 2004-05-28 2006-02-09 Victor Joseph Chips for multiplex analyses
ATE406463T1 (de) 2005-04-06 2008-09-15 Maurice Stroun Methode zur krebsdiagnose mittels nachweis von dna und rna im kreislauf
US20100130369A1 (en) * 2007-04-23 2010-05-27 Advanced Liquid Logic, Inc. Bead-Based Multiplexed Analytical Methods and Instrumentation
US9528160B2 (en) 2008-11-07 2016-12-27 Adaptive Biotechnolgies Corp. Rare clonotypes and uses thereof
US9506119B2 (en) 2008-11-07 2016-11-29 Adaptive Biotechnologies Corp. Method of sequence determination using sequence tags
US9365901B2 (en) 2008-11-07 2016-06-14 Adaptive Biotechnologies Corp. Monitoring immunoglobulin heavy chain evolution in B-cell acute lymphoblastic leukemia
EP3699296A1 (en) 2008-11-07 2020-08-26 Adaptive Biotechnologies Corporation Methods of monitoring conditions by sequence analysis
US9394567B2 (en) 2008-11-07 2016-07-19 Adaptive Biotechnologies Corporation Detection and quantification of sample contamination in immune repertoire analysis
US8628927B2 (en) 2008-11-07 2014-01-14 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US8748103B2 (en) 2008-11-07 2014-06-10 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
DK2387627T3 (en) 2009-01-15 2016-07-04 Adaptive Biotechnologies Corp Adaptive immunity profiling and methods for producing monoclonal antibodies
US9085798B2 (en) 2009-04-30 2015-07-21 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
RU2539032C2 (ru) 2009-06-25 2015-01-10 Фред Хатчинсон Кансэр Рисёч Сентер Способ измерения искусственного иммунитета
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US9315857B2 (en) 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
US10787701B2 (en) 2010-04-05 2020-09-29 Prognosys Biosciences, Inc. Spatially encoded biological assays
EP2556171B1 (en) 2010-04-05 2015-09-02 Prognosys Biosciences, Inc. Spatially encoded biological assays
US20190300945A1 (en) 2010-04-05 2019-10-03 Prognosys Biosciences, Inc. Spatially Encoded Biological Assays
ES2690753T3 (es) * 2010-09-21 2018-11-22 Agilent Technologies, Inc. Aumento de la confianza en las identificaciones de alelos con el recuento molecular
EP3702475A1 (en) * 2010-10-22 2020-09-02 Cold Spring Harbor Laboratory Varietal counting of nucleic acids for obtaining genomic copy number information
WO2012129363A2 (en) 2011-03-24 2012-09-27 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
EP3246416B1 (en) 2011-04-15 2024-06-05 The Johns Hopkins University Safe sequencing system
CA2834291A1 (en) 2011-04-25 2012-11-01 Biorad Laboratories, Inc. Methods and compositions for nucleic acid analysis
US10385475B2 (en) 2011-09-12 2019-08-20 Adaptive Biotechnologies Corp. Random array sequencing of low-complexity libraries
CA2852949A1 (en) 2011-10-19 2013-04-25 Nugen Technologies, Inc. Compositions and methods for directional nucleic acid amplification and sequencing
US9279159B2 (en) 2011-10-21 2016-03-08 Adaptive Biotechnologies Corporation Quantification of adaptive immune cell genomes in a complex mixture of cells
EP3388535B1 (en) 2011-12-09 2021-03-24 Adaptive Biotechnologies Corporation Diagnosis of lymphoid malignancies and minimal residual disease detection
US9499865B2 (en) 2011-12-13 2016-11-22 Adaptive Biotechnologies Corp. Detection and measurement of tissue-infiltrating lymphocytes
CN105861487B (zh) 2012-01-26 2020-05-05 纽亘技术公司 用于靶向核酸序列富集和高效文库产生的组合物和方法
LT3363901T (lt) 2012-02-17 2021-04-12 Fred Hutchinson Cancer Research Center Kompozicijos ir būdai, skirti tiksliam mutacijų nustatymui
US11177020B2 (en) 2012-02-27 2021-11-16 The University Of North Carolina At Chapel Hill Methods and uses for molecular tags
EP3321378B1 (en) 2012-02-27 2021-11-10 Becton, Dickinson and Company Compositions for molecular counting
EP2820155B1 (en) 2012-02-28 2017-07-26 Population Genetics Technologies Ltd. Method for attaching a counter sequence to a nucleic acid sample
US10077478B2 (en) 2012-03-05 2018-09-18 Adaptive Biotechnologies Corp. Determining paired immune receptor chains from frequency matched subunits
WO2013138510A1 (en) 2012-03-13 2013-09-19 Patel Abhijit Ajit Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing
DK2828218T3 (da) 2012-03-20 2020-11-02 Univ Washington Through Its Center For Commercialization Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing
US9150905B2 (en) 2012-05-08 2015-10-06 Adaptive Biotechnologies Corporation Compositions and method for measuring and calibrating amplification bias in multiplexed PCR reactions
WO2013191775A2 (en) 2012-06-18 2013-12-27 Nugen Technologies, Inc. Compositions and methods for negative selection of non-desired nucleic acid sequences
US20150011396A1 (en) 2012-07-09 2015-01-08 Benjamin G. Schroeder Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US10273541B2 (en) 2012-08-14 2019-04-30 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
EP2885418A4 (en) 2012-08-14 2016-03-02 10X Genomics Inc MICROCAPSE COMPOSITIONS AND METHOD THEREFOR
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10584381B2 (en) 2012-08-14 2020-03-10 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10221442B2 (en) 2012-08-14 2019-03-05 10X Genomics, Inc. Compositions and methods for sample processing
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
EP4424826A3 (en) 2012-09-04 2024-11-27 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US11913065B2 (en) 2012-09-04 2024-02-27 Guardent Health, Inc. Systems and methods to detect rare mutations and copy number variation
US10876152B2 (en) 2012-09-04 2020-12-29 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
EP3330384B1 (en) 2012-10-01 2019-09-25 Adaptive Biotechnologies Corporation Immunocompetence assessment by adaptive immune receptor diversity and clonality characterization
ES3019910T3 (en) 2012-10-17 2025-05-21 10X Genomics Sweden Ab Methods and product for optimising localised or spatial detection of gene expression in a tissue sample
EP2912468B1 (en) 2012-10-29 2018-09-12 The Johns Hopkins University Papanicolaou test for ovarian and endometrial cancers
CN104903466B (zh) 2012-11-05 2016-11-23 鲁比康基因组学公司 条形编码核酸
WO2014093676A1 (en) 2012-12-14 2014-06-19 10X Technologies, Inc. Methods and systems for processing polynucleotides
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9523121B2 (en) 2013-01-13 2016-12-20 Uni Taq Bio Methods and compositions for PCR using blocked and universal primers
CA2900481A1 (en) 2013-02-08 2014-08-14 10X Genomics, Inc. Polynucleotide barcode generation
EP2774998A1 (en) 2013-03-08 2014-09-10 Roche Diagniostics GmbH Improved sequence tags
EP2971168B1 (en) 2013-03-15 2021-05-05 Guardant Health, Inc. Method of detecting cancer
US10119134B2 (en) 2013-03-15 2018-11-06 Abvitro Llc Single cell bar-coding for antibody discovery
EP2971130A4 (en) * 2013-03-15 2016-10-05 Nugen Technologies Inc SEQUENTIAL SEQUENCING
CN105473744B (zh) 2013-06-25 2020-06-19 普罗格诺西斯生物科学公司 采用微流控装置的空间编码生物分析
US9708657B2 (en) 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
EP3722442B1 (en) 2013-08-05 2023-04-05 Twist Bioscience Corporation De novo synthesized gene libraries
ES2711168T3 (es) 2013-08-28 2019-04-30 Becton Dickinson Co Análisis masivo en paralelo de células individuales
US10395758B2 (en) 2013-08-30 2019-08-27 10X Genomics, Inc. Sequencing methods
JP2017504307A (ja) 2013-10-07 2017-02-09 セルラー リサーチ, インコーポレイテッド アレイ上のフィーチャーをデジタルカウントするための方法およびシステム
WO2015069374A1 (en) 2013-11-07 2015-05-14 Agilent Technologies, Inc. Plurality of transposase adapters for dna manipulations
US9546399B2 (en) * 2013-11-13 2017-01-17 Nugen Technologies, Inc. Compositions and methods for identification of a duplicate sequencing read
DK3077539T3 (en) 2013-12-02 2018-11-19 Personal Genome Diagnostics Inc Procedure for evaluating minority variations in a sample
US9824068B2 (en) 2013-12-16 2017-11-21 10X Genomics, Inc. Methods and apparatus for sorting data
EP3378952B1 (en) 2013-12-28 2020-02-05 Guardant Health, Inc. Methods and systems for detecting genetic variants
AU2015209079B2 (en) 2014-01-27 2021-07-15 Archerdx, Llc Methods of preparing nucleic acids for sequencing
CN104834833B (zh) * 2014-02-12 2017-12-05 深圳华大基因科技有限公司 单核苷酸多态性的检测方法及装置
US9745614B2 (en) 2014-02-28 2017-08-29 Nugen Technologies, Inc. Reduced representation bisulfite sequencing with diversity adaptors
CA2941612A1 (en) 2014-03-05 2015-09-11 Adaptive Biotechnologies Corporation Methods using randomer-containing synthetic molecules
US10066265B2 (en) 2014-04-01 2018-09-04 Adaptive Biotechnologies Corp. Determining antigen-specific t-cells
US9694361B2 (en) 2014-04-10 2017-07-04 10X Genomics, Inc. Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same
ES2777529T3 (es) 2014-04-17 2020-08-05 Adaptive Biotechnologies Corp Cuantificación de genomas de células inmunitarias adaptativas en una mezcla compleja de células
US20150360226A1 (en) 2014-06-12 2015-12-17 Wafergen, Inc. Single cell capture with polymer capture films
US9757707B2 (en) 2014-06-12 2017-09-12 Takara Bio Usa, Inc. Single cell capture with capture chips
US10839939B2 (en) 2014-06-26 2020-11-17 10X Genomics, Inc. Processes and systems for nucleic acid sequence assembly
US12312640B2 (en) 2014-06-26 2025-05-27 10X Genomics, Inc. Analysis of nucleic acid sequences
EP3161160B1 (en) 2014-06-26 2021-10-13 10X Genomics, Inc. Methods of analyzing nucleic acids from individual cells or cell populations
CN106536756A (zh) 2014-06-26 2017-03-22 10X基因组学有限公司 核酸序列的分析
WO2016002875A1 (ja) * 2014-07-02 2016-01-07 株式会社Dnaチップ研究所 核酸分子数計測法
CN107075581B (zh) 2014-08-06 2022-03-18 纽亘技术公司 由靶向测序进行数字测量
US20160053301A1 (en) 2014-08-22 2016-02-25 Clearfork Bioscience, Inc. Methods for quantitative genetic analysis of cell free dna
US10590483B2 (en) 2014-09-15 2020-03-17 Abvitro Llc High-throughput nucleotide library sequencing
ES2784343T3 (es) 2014-10-29 2020-09-24 Adaptive Biotechnologies Corp Detección simultánea altamente multiplexada de ácidos nucleicos que codifican heterodímeros de receptores inmunes adaptativos emparejados de muchas muestras
CA2964472A1 (en) 2014-10-29 2016-05-06 10X Genomics, Inc. Methods and compositions for targeted nucleic acid sequencing
US9975122B2 (en) 2014-11-05 2018-05-22 10X Genomics, Inc. Instrument systems for integrated sample processing
US10246701B2 (en) 2014-11-14 2019-04-02 Adaptive Biotechnologies Corp. Multiplexed digital quantitation of rearranged lymphoid receptors in a complex mixture
AU2015353581A1 (en) 2014-11-25 2017-06-15 Adaptive Biotechnologies Corporation Characterization of adaptive immune response to vaccination or infection using immune repertoire sequencing
CN107427808B (zh) 2015-01-12 2020-10-23 10X基因组学有限公司 用于制备核酸测序文库的方法和系统以及用其制备的文库
KR20170106979A (ko) 2015-01-13 2017-09-22 10엑스 제노믹스, 인크. 구조 변이 및 위상 조정 정보를 시각화하기 위한 시스템 및 방법
WO2016115550A1 (en) * 2015-01-16 2016-07-21 Seqwell, Inc. Normalized iterative barcoding and sequencing of dna collections
EP3763825B1 (en) * 2015-01-23 2023-10-04 Qiagen Sciences, LLC High multiplex pcr with molecular barcoding
WO2016118883A1 (en) * 2015-01-23 2016-07-28 Washington University Detection of rare sequence variants, methods and compositions therefor
US10669304B2 (en) 2015-02-04 2020-06-02 Twist Bioscience Corporation Methods and devices for de novo oligonucleic acid assembly
MX2017010142A (es) 2015-02-09 2017-12-11 10X Genomics Inc Sistemas y metodos para determinar variacion estructural y ajuste de fases con datos de recuperacion de variantes.
US10421993B2 (en) 2015-02-11 2019-09-24 Paragon Genomics, Inc. Methods and compositions for reducing non-specific amplification products
WO2016134078A1 (en) 2015-02-19 2016-08-25 Becton, Dickinson And Company High-throughput single-cell analysis combining proteomic and genomic information
US10641772B2 (en) 2015-02-20 2020-05-05 Takara Bio Usa, Inc. Method for rapid accurate dispensing, visualization and analysis of single cells
EP3591074B1 (en) 2015-02-24 2024-10-23 Adaptive Biotechnologies Corp. Methods for diagnosing infectious disease and determining hla status using immune repertoire sequencing
WO2016137973A1 (en) 2015-02-24 2016-09-01 10X Genomics Inc Partition processing methods and systems
US10557134B2 (en) 2015-02-24 2020-02-11 Trustees Of Boston University Protection of barcodes during DNA amplification using molecular hairpins
BR112017018054A2 (pt) 2015-02-24 2018-07-24 10X Genomics Inc métodos para a cobertura de sequências de ácidos nucleicos direcionadas
ES2836802T3 (es) 2015-02-27 2021-06-28 Becton Dickinson Co Códigos de barras moleculares espacialmente direccionables
ES2934982T3 (es) 2015-03-30 2023-02-28 Becton Dickinson Co Métodos para la codificación con códigos de barras combinatorios
AU2016242967B2 (en) 2015-04-01 2021-07-01 Adaptive Biotechnologies Corp. Method of identifying human compatible T cell receptors specific for an antigenic target
CN113186256B (zh) 2015-04-10 2025-05-23 十程基因技术瑞典公司 生物样本的空间区别、多重核酸分析
WO2016168286A1 (en) * 2015-04-13 2016-10-20 Alnylam Pharmaceuticals, Inc. Angiopoietin-like 3 (angptl3) irna compositions and methods of use thereof
US9981239B2 (en) 2015-04-21 2018-05-29 Twist Bioscience Corporation Devices and methods for oligonucleic acid library synthesis
WO2016172373A1 (en) 2015-04-23 2016-10-27 Cellular Research, Inc. Methods and compositions for whole transcriptome amplification
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
WO2016181128A1 (en) 2015-05-11 2016-11-17 Genefirst Ltd Methods, compositions, and kits for preparing sequencing library
US11124823B2 (en) 2015-06-01 2021-09-21 Becton, Dickinson And Company Methods for RNA quantification
JP6698708B2 (ja) 2015-06-09 2020-05-27 ライフ テクノロジーズ コーポレーション 分子タグ付けのための方法、システム、組成物、キット、装置、及びコンピュータ可読媒体
GB2539675B (en) 2015-06-23 2017-11-22 Cs Genetics Ltd Libraries of multimeric barcoding reagents and kits thereof for labelling nucleic acids for sequencing
WO2017027653A1 (en) 2015-08-11 2017-02-16 The Johns Hopkins University Assaying ovarian cyst fluid
US12540351B2 (en) 2015-09-02 2026-02-03 Guardant Health, Inc. Identification of somatic mutations versus germline variants for cell-free DNA variant calling applications
US11302416B2 (en) 2015-09-02 2022-04-12 Guardant Health Machine learning for somatic single nucleotide variant detection in cell-free tumor nucleic acid sequencing applications
CA2997929A1 (en) 2015-09-08 2017-03-16 Cold Spring Harbor Laboratory Genetic copy number determination using high throughput multiplex sequencing of smashed nucleotides
EP3347465B1 (en) 2015-09-11 2019-06-26 Cellular Research, Inc. Methods and compositions for nucleic acid library normalization
CA2998169A1 (en) 2015-09-18 2017-03-23 Twist Bioscience Corporation Oligonucleic acid variant libraries and synthesis thereof
US11512347B2 (en) 2015-09-22 2022-11-29 Twist Bioscience Corporation Flexible substrates for nucleic acid synthesis
US10465232B1 (en) 2015-10-08 2019-11-05 Trace Genomics, Inc. Methods for quantifying efficiency of nucleic acid extraction and detection
WO2017087873A1 (en) * 2015-11-18 2017-05-26 Wafergen, Inc. Systems and methods for pooling samples from multi-well devices
US11371094B2 (en) 2015-11-19 2022-06-28 10X Genomics, Inc. Systems and methods for nucleic acid processing using degenerate nucleotides
CN108603307A (zh) 2015-12-01 2018-09-28 特韦斯特生物科学公司 功能化表面及其制备
PT3882357T (pt) 2015-12-04 2022-09-05 10X Genomics Inc Métodos e composições para análise de ácidos nucleicos
ES2911421T3 (es) 2015-12-08 2022-05-19 Twinstrand Biosciences Inc Adaptadores, métodos y composiciones mejorados para secuenciación dúplex
WO2017106768A1 (en) 2015-12-17 2017-06-22 Guardant Health, Inc. Methods to determine tumor gene copy number by analysis of cell-free dna
JP6735348B2 (ja) 2016-02-11 2020-08-05 10エックス ジェノミクス, インコーポレイテッド 全ゲノム配列データのデノボアセンブリのためのシステム、方法及び媒体
EP4198146A3 (en) * 2016-03-25 2023-08-23 Karius, Inc. Methods using synthetic nucleic acid spike-ins
WO2017176630A1 (en) 2016-04-07 2017-10-12 The Board Of Trustees Of The Leland Stanford Junior University Noninvasive diagnostics by sequencing 5-hydroxymethylated cell-free dna
US11384382B2 (en) 2016-04-14 2022-07-12 Guardant Health, Inc. Methods of attaching adapters to sample nucleic acids
US20190085406A1 (en) 2016-04-14 2019-03-21 Guardant Health, Inc. Methods for early detection of cancer
JP7129343B2 (ja) 2016-05-02 2022-09-01 ベクトン・ディキンソン・アンド・カンパニー 正確な分子バーコーディング
WO2017192974A1 (en) 2016-05-06 2017-11-09 Regents Of The University Of Minnesota Analytical standards and methods of using same
WO2017197343A2 (en) 2016-05-12 2017-11-16 10X Genomics, Inc. Microfluidic on-chip filters
WO2017197338A1 (en) 2016-05-13 2017-11-16 10X Genomics, Inc. Microfluidic systems and methods of use
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
EP3465502B1 (en) 2016-05-26 2024-04-10 Becton, Dickinson and Company Molecular label counting adjustment methods
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
US11098360B2 (en) 2016-06-01 2021-08-24 Roche Sequencing Solutions, Inc. Immuno-PETE
US11066704B2 (en) 2016-06-10 2021-07-20 Seegene, Inc. Methods for preparing tagging oligonucleotides
EP3831958B1 (en) 2016-06-30 2023-09-06 Grail, LLC Differential tagging of rna for preparation of a cell-free dna/rna sequencing library
ES2855748T3 (es) 2016-07-12 2021-09-24 Hoffmann La Roche Enriquecimiento de diana de extensión de cebador
US11460405B2 (en) 2016-07-21 2022-10-04 Takara Bio Usa, Inc. Multi-Z imaging and dispensing with multi-well devices
CN109996876A (zh) 2016-08-22 2019-07-09 特韦斯特生物科学公司 从头合成的核酸文库
CN110248724B (zh) 2016-09-21 2022-11-18 特韦斯特生物科学公司 基于核酸的数据存储
US10428325B1 (en) 2016-09-21 2019-10-01 Adaptive Biotechnologies Corporation Identification of antigen-specific B cell receptors
EP3516400B1 (en) 2016-09-26 2023-08-16 Becton, Dickinson and Company Measurement of protein expression using reagents with barcoded oligonucleotide sequences
US9850523B1 (en) 2016-09-30 2017-12-26 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
ES2840003T3 (es) 2016-09-30 2021-07-06 Guardant Health Inc Métodos para análisis multi-resolución de ácidos nucleicos libres de células
US10190155B2 (en) 2016-10-14 2019-01-29 Nugen Technologies, Inc. Molecular tag attachment and transfer
ES2848715T3 (es) * 2016-10-24 2021-08-11 Ontera Inc Abundancia fraccional de secuencias de polinucleótidos en una muestra
CN110312825A (zh) * 2016-10-24 2019-10-08 吉内恩福赛克公司 隐藏核酸内存在的信息
CN109844137B (zh) 2016-10-31 2022-04-26 豪夫迈·罗氏有限公司 用于鉴定嵌合产物的条形码化环状文库构建
EP3539035B1 (en) 2016-11-08 2024-04-17 Becton, Dickinson and Company Methods for expression profile classification
KR102790039B1 (ko) 2016-11-08 2025-04-04 벡톤 디킨슨 앤드 컴퍼니 세포 표지 분류 방법
CN110366613A (zh) 2016-12-16 2019-10-22 特韦斯特生物科学公司 免疫突触的变体文库及其合成
US10011872B1 (en) 2016-12-22 2018-07-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10815525B2 (en) 2016-12-22 2020-10-27 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
GB201622219D0 (en) 2016-12-23 2017-02-08 Cs Genetics Ltd Methods and reagents for molecular barcoding
GB201622222D0 (en) 2016-12-23 2017-02-08 Cs Genetics Ltd Reagents and methods for molecular barcoding of nucleic acids of single cells
WO2018132459A1 (en) 2017-01-10 2018-07-19 Paragon Genomics, Inc. Methods and compositions for reducing redundant molecular barcodes created in primer extension reactions
CN110573253B (zh) 2017-01-13 2021-11-02 赛卢拉研究公司 流体通道的亲水涂层
AU2018210188B2 (en) * 2017-01-18 2023-11-09 Illumina, Inc. Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths
US12264411B2 (en) 2017-01-30 2025-04-01 10X Genomics, Inc. Methods and systems for analysis
CN117512066A (zh) 2017-01-30 2024-02-06 10X基因组学有限公司 用于基于微滴的单细胞条形编码的方法和系统
US11319583B2 (en) 2017-02-01 2022-05-03 Becton, Dickinson And Company Selective amplification using blocking oligonucleotides
US10995333B2 (en) 2017-02-06 2021-05-04 10X Genomics, Inc. Systems and methods for nucleic acid preparation
SG11201907713WA (en) 2017-02-22 2019-09-27 Twist Bioscience Corp Nucleic acid based data storage
CN110352251A (zh) 2017-03-08 2019-10-18 豪夫迈·罗氏有限公司 引物延伸靶标富集及对其的包括同时富集dna和rna的改进
US12297491B2 (en) 2017-03-08 2025-05-13 Roche Sequencing Solutions, Inc. Primer extension target enrichment and improvements thereto including simultaneous enrichment of DNA and RNA
AU2018234629A1 (en) 2017-03-15 2019-10-17 Twist Bioscience Corporation Variant libraries of the immunological synapse and synthesis thereof
WO2018183942A1 (en) 2017-03-31 2018-10-04 Grail, Inc. Improved library preparation and use thereof for sequencing-based error correction and/or variant identification
US12492430B2 (en) 2017-04-11 2025-12-09 Tecan Genomics, Inc. Library quantitation and qualification
ES3035812T3 (en) 2017-04-17 2025-09-09 Genefirst Ltd Methods and kits for preparing nucleic acid libraries
EP3625715A4 (en) 2017-05-19 2021-03-17 10X Genomics, Inc. DATA SET ANALYSIS SYSTEMS AND METHODS
US20180340169A1 (en) 2017-05-26 2018-11-29 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
EP3445876B1 (en) 2017-05-26 2023-07-05 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
CA3059559A1 (en) 2017-06-05 2018-12-13 Becton, Dickinson And Company Sample indexing for single cells
IL271205B2 (en) 2017-06-12 2025-02-01 Twist Bioscience Corp Methods for assembling continuous nucleic acids
WO2018231864A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
WO2018231818A1 (en) 2017-06-16 2018-12-20 Life Technologies Corporation Control nucleic acids, and compositions, kits, and uses thereof
US11505826B2 (en) 2017-07-12 2022-11-22 Agilent Technologies, Inc. Sequencing method for genomic rearrangement detection
CA3072195A1 (en) 2017-08-07 2019-04-04 The Johns Hopkins University Methods and materials for assessing and treating cancer
WO2019051501A1 (en) 2017-09-11 2019-03-14 Twist Bioscience Corporation PROTEINS BINDING TO GPCR AND METHODS OF SYNTHESIS
EP3682025A1 (en) 2017-09-14 2020-07-22 H. Hoffnabb-La Roche Ag Novel method for generating circular single-stranded dna libraries
WO2019053215A1 (en) 2017-09-15 2019-03-21 F. Hoffmann-La Roche Ag HYBRIDIZATION-EXTENSION-LIGATURE STRATEGY TO GENERATE CIRCULAR SINGLE-STRAND DNA BANKS
US11447818B2 (en) 2017-09-15 2022-09-20 Illumina, Inc. Universal short adapters with variable length non-random unique molecular identifiers
US10837047B2 (en) 2017-10-04 2020-11-17 10X Genomics, Inc. Compositions, methods, and systems for bead formation using improved polymers
CN111164219A (zh) 2017-10-06 2020-05-15 豪夫迈·罗氏有限公司 用于单分子测序样品制备的环化方法
EP3697529B1 (en) 2017-10-20 2023-05-24 Twist Bioscience Corporation Heated nanowells for polynucleotide synthesis
US11099202B2 (en) 2017-10-20 2021-08-24 Tecan Genomics, Inc. Reagent delivery system
WO2019084043A1 (en) 2017-10-26 2019-05-02 10X Genomics, Inc. METHODS AND SYSTEMS FOR NUCLEIC ACID PREPARATION AND CHROMATIN ANALYSIS
EP3700672B1 (en) 2017-10-27 2022-12-28 10X Genomics, Inc. Methods for sample preparation and analysis
WO2019086531A1 (en) 2017-11-03 2019-05-09 F. Hoffmann-La Roche Ag Linear consensus sequencing
EP3704265A4 (en) * 2017-11-03 2021-09-29 Guardant Health, Inc. CORRECTION OF SEQUENCE ERRORS INDUCED BY DESAMINATION
US11739367B2 (en) 2017-11-08 2023-08-29 Twinstrand Biosciences, Inc. Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters
EP3625361A1 (en) 2017-11-15 2020-03-25 10X Genomics, Inc. Functionalized gel beads
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
US11254980B1 (en) 2017-11-29 2022-02-22 Adaptive Biotechnologies Corporation Methods of profiling targeted polynucleotides while mitigating sequencing depth requirements
WO2019108851A1 (en) 2017-11-30 2019-06-06 10X Genomics, Inc. Systems and methods for nucleic acid preparation and analysis
CN111699388B (zh) 2017-12-12 2024-08-02 10X基因组学有限公司 用于单细胞处理的系统和方法
WO2019126209A1 (en) 2017-12-19 2019-06-27 Cellular Research, Inc. Particles associated with oligonucleotides
CN111757934A (zh) 2017-12-21 2020-10-09 豪夫迈·罗氏有限公司 通过单向双重探针引物延伸的靶标富集
WO2019126789A1 (en) 2017-12-22 2019-06-27 10X Genomics, Inc. Systems and methods for processing nucleic acid molecules from one or more cells
WO2019136058A1 (en) 2018-01-02 2019-07-11 The Regents Of The University Of Michigan Multi-droplet capture
CA3088911A1 (en) 2018-01-04 2019-07-11 Twist Bioscience Corporation Dna-based storage device and method for synthesizing polynucleotides using the device
ES2936478T3 (es) 2018-02-05 2023-03-17 Hoffmann La Roche Generación de moldes de ADN circular monocatenario para secuenciación de molécula individual
EP3752832A1 (en) 2018-02-12 2020-12-23 10X Genomics, Inc. Methods characterizing multiple analytes from individual cells or cell populations
CN112105626A (zh) 2018-02-14 2020-12-18 蓝星基因组股份有限公司 用于dna、特别是细胞游离dna的表观遗传学分析的方法
US11639928B2 (en) 2018-02-22 2023-05-02 10X Genomics, Inc. Methods and systems for characterizing analytes from individual cells or cell populations
WO2019169028A1 (en) 2018-02-28 2019-09-06 10X Genomics, Inc. Transcriptome sequencing through random ligation
JP2021514651A (ja) 2018-03-02 2021-06-17 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 単一分子配列決定のための一本鎖環状dna鋳型の作成
GB201804641D0 (en) 2018-03-22 2018-05-09 Inivata Ltd Methods of sequencing nucleic acids and error correction of sequence reads
GB2587939B (en) 2018-04-02 2023-06-14 Grail Llc Methylation markers and targeted methylation probe panels
WO2019191900A1 (en) 2018-04-03 2019-10-10 Burning Rock Biotech Compositions and methods for preparing nucleic acid libraries
CN112262218B (zh) 2018-04-06 2024-11-08 10X基因组学有限公司 用于单细胞处理中的质量控制的系统和方法
JP7358388B2 (ja) 2018-05-03 2023-10-10 ベクトン・ディキンソン・アンド・カンパニー 反対側の転写物末端における分子バーコーディング
ES2945191T3 (es) 2018-05-03 2023-06-29 Becton Dickinson Co Análisis de muestras multiómicas de alto rendimiento
WO2019215223A1 (en) 2018-05-08 2019-11-14 F. Hoffmann-La Roche Ag Method of cancer prognosis by assessing tumor variant diversity by means of establishing diversity indices
WO2019217758A1 (en) 2018-05-10 2019-11-14 10X Genomics, Inc. Methods and systems for molecular library generation
IL278771B2 (en) 2018-05-18 2025-09-01 Twist Bioscience Corp Polynucleotides, reagents and methods for nucleic acid hybridization
US11932899B2 (en) 2018-06-07 2024-03-19 10X Genomics, Inc. Methods and systems for characterizing nucleic acid molecules
JP7145980B2 (ja) 2018-06-15 2022-10-03 エフ.ホフマン-ラ ロシュ アーゲー 腫瘍浸潤リンパ球にて発現するt細胞受容体により認識される抗原を識別するためのシステム
US11703427B2 (en) 2018-06-25 2023-07-18 10X Genomics, Inc. Methods and systems for cell and bead processing
KR20210059694A (ko) 2018-07-12 2021-05-25 트윈스트랜드 바이오사이언시스, 인코포레이티드 게놈 편집, 클론 팽창 및 연관된 분야를 규명하기 위한 방법 및 시약
US12188014B1 (en) 2018-07-25 2025-01-07 10X Genomics, Inc. Compositions and methods for nucleic acid processing using blocking agents
WO2020021119A1 (en) 2018-07-27 2020-01-30 F. Hoffmann-La Roche Ag Method of monitoring effectiveness of immunotherapy of cancer patients
US20200032335A1 (en) 2018-07-27 2020-01-30 10X Genomics, Inc. Systems and methods for metabolome analysis
US12163179B2 (en) 2018-08-03 2024-12-10 10X Gemomics, Inc. Methods and systems to minimize barcode exchange
US12065688B2 (en) 2018-08-20 2024-08-20 10X Genomics, Inc. Compositions and methods for cellular processing
WO2020041148A1 (en) 2018-08-20 2020-02-27 10X Genomics, Inc. Methods and systems for detection of protein-dna interactions using proximity ligation
US11519033B2 (en) 2018-08-28 2022-12-06 10X Genomics, Inc. Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample
EP3853362A1 (en) 2018-09-21 2021-07-28 F. Hoffmann-La Roche AG System and method for modular and combinatorial nucleic acid sample preparation for sequencing
CA3111887A1 (en) 2018-09-27 2020-04-02 Grail, Inc. Methylation markers and targeted methylation probe panel
US11639517B2 (en) 2018-10-01 2023-05-02 Becton, Dickinson And Company Determining 5′ transcript sequences
JP7618548B2 (ja) 2018-11-08 2025-01-21 ベクトン・ディキンソン・アンド・カンパニー ランダムプライミングを使用した単一細胞の全トランスクリプトーム解析
CA3118990A1 (en) 2018-11-21 2020-05-28 Karius, Inc. Direct-to-library methods, systems, and compositions
US11459607B1 (en) 2018-12-10 2022-10-04 10X Genomics, Inc. Systems and methods for processing-nucleic acid molecules from a single cell using sequential co-partitioning and composite barcodes
CN113767177B (zh) 2018-12-10 2025-01-14 10X基因组学有限公司 生成用于空间分析的捕获探针
US12529094B2 (en) 2018-12-10 2026-01-20 10X Genomics, Inc. Imaging system hardware
US11492660B2 (en) 2018-12-13 2022-11-08 Becton, Dickinson And Company Selective extension in single cell whole transcriptome analysis
US12357959B2 (en) 2018-12-26 2025-07-15 Twist Bioscience Corporation Highly accurate de novo polynucleotide synthesis
WO2020142768A1 (en) 2019-01-04 2020-07-09 Northwestern University Storing temporal data into dna
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
US12169198B2 (en) 2019-01-08 2024-12-17 10X Genomics, Inc. Systems and methods for sample analysis
US11845983B1 (en) 2019-01-09 2023-12-19 10X Genomics, Inc. Methods and systems for multiplexing of droplet based assays
WO2020150356A1 (en) 2019-01-16 2020-07-23 Becton, Dickinson And Company Polymerase chain reaction normalization through primer titration
EP4242322B1 (en) 2019-01-23 2024-08-21 Becton, Dickinson and Company Oligonucleotides associated with antibodies
EP4567131A3 (en) 2019-01-31 2025-09-03 Guardant Health, Inc. Compositions and methods for isolating cell-free dna
EP4674961A2 (en) 2019-02-12 2026-01-07 10X Genomics, Inc. Methods for processing nucleic acid molecules
US12275993B2 (en) 2019-02-12 2025-04-15 10X Genomics, Inc. Analysis of nucleic acid sequences
US11851683B1 (en) 2019-02-12 2023-12-26 10X Genomics, Inc. Methods and systems for selective analysis of cellular samples
WO2020167862A1 (en) 2019-02-12 2020-08-20 10X Genomics, Inc. Systems and methods for transfer of reagents between droplets
US12305239B2 (en) 2019-02-12 2025-05-20 10X Genomics, Inc. Analysis of nucleic acid sequences
US11467153B2 (en) 2019-02-12 2022-10-11 10X Genomics, Inc. Methods for processing nucleic acid molecules
WO2020167866A1 (en) 2019-02-12 2020-08-20 10X Genomics, Inc. Systems and methods for transposon loading
WO2020167920A1 (en) 2019-02-14 2020-08-20 Cellular Research, Inc. Hybrid targeted and whole transcriptome amplification
US11655499B1 (en) 2019-02-25 2023-05-23 10X Genomics, Inc. Detection of sequence elements in nucleic acid molecules
KR20210143766A (ko) 2019-02-26 2021-11-29 트위스트 바이오사이언스 코포레이션 Glp1 수용체에 대한 변이체 핵산 라이브러리
US11492728B2 (en) 2019-02-26 2022-11-08 Twist Bioscience Corporation Variant nucleic acid libraries for antibody optimization
EP3938537A1 (en) 2019-03-11 2022-01-19 10X Genomics, Inc. Systems and methods for processing optically tagged beads
US11965208B2 (en) 2019-04-19 2024-04-23 Becton, Dickinson And Company Methods of associating phenotypical data and single cell sequencing data
WO2020243579A1 (en) 2019-05-30 2020-12-03 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
JP2022550497A (ja) 2019-06-21 2022-12-02 ツイスト バイオサイエンス コーポレーション バーコードに基づいた核酸配列アセンブリ
CN114051534B (zh) 2019-07-22 2025-02-21 贝克顿迪金森公司 单细胞染色质免疫沉淀测序测定
EP4017977A1 (en) 2019-08-19 2022-06-29 F. Hoffmann-La Roche AG Single tube preparation of dna and rna for sequencing
US12235262B1 (en) 2019-09-09 2025-02-25 10X Genomics, Inc. Methods and systems for single cell protein analysis
WO2021053008A1 (en) 2019-09-20 2021-03-25 F. Hoffmann-La Roche Ag Immune repertoire profiling by primer extension target enrichment
EP4464827A3 (en) 2019-09-23 2025-02-26 Twist Bioscience Corporation Variant nucleic acid libraries for crth2
WO2021061842A1 (en) 2019-09-23 2021-04-01 Twist Bioscience Corporation Variant nucleic acid libraries for single domain antibodies
EP4527945A3 (en) 2019-11-06 2025-06-18 The Board of Trustees of the Leland Stanford Junior University Methods and systems for analyzing nucleic acid molecules
JP7522189B2 (ja) 2019-11-08 2024-07-24 ベクトン・ディキンソン・アンド・カンパニー 免疫レパートリーシーケンシングのための完全長v(d)j情報を得るためのランダムプライミングの使用
WO2021092433A2 (en) 2019-11-08 2021-05-14 10X Genomics, Inc. Enhancing specificity of analyte binding
FI3891300T3 (fi) 2019-12-23 2023-05-10 10X Genomics Inc Menetelmät spatiaalista analyysiä varten rna-templatoitua ligaatiota käyttäen
US12241890B2 (en) 2019-12-23 2025-03-04 10X Genomics, Inc. Methods for generating barcoded nucleic acid molecules using fixed cells
US11649497B2 (en) 2020-01-13 2023-05-16 Becton, Dickinson And Company Methods and compositions for quantitation of proteins and RNA
US12365942B2 (en) 2020-01-13 2025-07-22 10X Genomics, Inc. Methods of decreasing background on a spatial array
US12405264B2 (en) 2020-01-17 2025-09-02 10X Genomics, Inc. Electrophoretic system and method for analyte capture
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US20210230681A1 (en) 2020-01-24 2021-07-29 10X Genomics, Inc. Methods for spatial analysis using proximity ligation
CN115335520A (zh) 2020-01-29 2022-11-11 贝克顿迪金森公司 用于通过测序对单细胞进行空间映射的条形码化的孔
US12076701B2 (en) 2020-01-31 2024-09-03 10X Genomics, Inc. Capturing oligonucleotides in spatial transcriptomics
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US12059674B2 (en) 2020-02-03 2024-08-13 Tecan Genomics, Inc. Reagent storage system
US12110541B2 (en) 2020-02-03 2024-10-08 10X Genomics, Inc. Methods for preparing high-resolution spatial arrays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
WO2021158925A1 (en) 2020-02-07 2021-08-12 10X Genomics, Inc. Quantitative and automated permeabilization performance evaluation for spatial transcriptomics
US12449419B1 (en) 2020-02-12 2025-10-21 10X Genomics, Inc. Methods for detecting binding of peptide-MHC monomers to T cells
CN115428088A (zh) 2020-02-13 2022-12-02 10X基因组学有限公司 用于基因表达和dna染色质可及性的联合交互式可视化的系统和方法
MX2022010038A (es) 2020-02-14 2022-09-05 Univ Johns Hopkins Metodos y materiales para la evaluacion de acidos nucleicos.
US12281357B1 (en) 2020-02-14 2025-04-22 10X Genomics, Inc. In situ spatial barcoding
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11891654B2 (en) 2020-02-24 2024-02-06 10X Genomics, Inc. Methods of making gene expression libraries
EP4111168A1 (en) 2020-02-25 2023-01-04 Becton Dickinson and Company Bi-specific probes to enable the use of single-cell samples as single color compensation control
JP7490071B2 (ja) 2020-03-11 2024-05-24 エフ. ホフマン-ラ ロシュ アーゲー シーケンシングのための新規核酸鋳型構造
CN115380119A (zh) 2020-04-03 2022-11-22 豪夫迈·罗氏有限公司 一种检测基因组中的结构重排的方法
EP4139485B1 (en) 2020-04-22 2023-09-06 10X Genomics, Inc. Methods for spatial analysis using targeted rna depletion
US11851700B1 (en) 2020-05-13 2023-12-26 10X Genomics, Inc. Methods, kits, and compositions for processing extracellular molecules
CN115605614A (zh) 2020-05-14 2023-01-13 贝克顿迪金森公司(Us) 用于免疫组库谱分析的引物
US10941453B1 (en) 2020-05-20 2021-03-09 Paragon Genomics, Inc. High throughput detection of pathogen RNA in clinical specimens
EP4153775B1 (en) 2020-05-22 2024-07-24 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
EP4153776B1 (en) 2020-05-22 2025-03-05 10X Genomics, Inc. Spatial analysis to detect sequence variants
WO2021242834A1 (en) 2020-05-26 2021-12-02 10X Genomics, Inc. Method for resetting an array
US12157913B2 (en) 2020-06-02 2024-12-03 Becton, Dickinson And Company Oligonucleotides and beads for 5 prime gene expression assay
US12031177B1 (en) 2020-06-04 2024-07-09 10X Genomics, Inc. Methods of enhancing spatial resolution of transcripts
CN115698337A (zh) 2020-06-08 2023-02-03 豪夫迈·罗氏有限公司 用于检测基因组中的结构重排的方法和组合物
ES2981265T3 (es) 2020-06-08 2024-10-08 10X Genomics Inc Métodos para determinar un margen quirúrgico y métodos de uso del mismo
ES2999535T3 (en) 2020-06-10 2025-02-26 10X Genomics Inc Methods for determining a location of an analyte in a biological sample
EP4172362B1 (en) 2020-06-25 2024-09-18 10X Genomics, Inc. Spatial analysis of dna methylation
US11981960B1 (en) 2020-07-06 2024-05-14 10X Genomics, Inc. Spatial analysis utilizing degradable hydrogels
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US12209280B1 (en) 2020-07-06 2025-01-28 10X Genomics, Inc. Methods of identifying abundance and location of an analyte in a biological sample using second strand synthesis
JP7587013B2 (ja) 2020-07-08 2024-11-19 エフ. ホフマン-ラ ロシュ アーゲー 次世代シーケンシングライブラリーの標的捕捉中の、ポイズンプライマーを使用した非標的ライブラリー分子の標的化された枯渇
WO2022008649A1 (en) 2020-07-08 2022-01-13 F. Hoffmann-La Roche Ag Spatial analysis of multiple targets in tissue samples
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
WO2022026909A1 (en) 2020-07-31 2022-02-03 Becton, Dickinson And Company Single cell assay for transposase-accessible chromatin
US11981958B1 (en) 2020-08-20 2024-05-14 10X Genomics, Inc. Methods for spatial analysis using DNA capture
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
US12084715B1 (en) 2020-11-05 2024-09-10 10X Genomics, Inc. Methods and systems for reducing artifactual antisense products
US12480158B1 (en) 2020-11-05 2025-11-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
CN116635533A (zh) 2020-11-20 2023-08-22 贝克顿迪金森公司 高表达的蛋白和低表达的蛋白的谱分析
US12378596B2 (en) 2020-12-03 2025-08-05 Roche Sequencing Solutions, Inc. Whole transcriptome analysis in single cells
CN116685850A (zh) 2020-12-15 2023-09-01 贝克顿迪金森公司 单细胞分泌组分析
WO2022140028A1 (en) 2020-12-21 2022-06-30 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
CN112466405B (zh) * 2020-12-23 2021-06-22 阅尔基因技术(苏州)有限公司 一种制备测序用分子标签库的方法
US12037640B2 (en) 2021-01-08 2024-07-16 Agilent Technologies, Inc. Sequencing an insert and an identifier without denaturation
US12398262B1 (en) 2021-01-22 2025-08-26 10X Genomics, Inc. Triblock copolymer-based cell stabilization and fixation system and methods of use thereof
WO2022171606A2 (en) 2021-02-09 2022-08-18 F. Hoffmann-La Roche Ag Methods for base-level detection of methylation in nucleic acids
CN116964221A (zh) 2021-02-18 2023-10-27 豪夫迈·罗氏有限公司 阻止测序期间核酸模板穿过纳米孔的结构
CN117015617B (zh) 2021-02-23 2025-04-04 10X基因组学有限公司 基于探针的核酸和蛋白质分析
US11280028B1 (en) * 2021-02-24 2022-03-22 Agency For Science, Technology And Research (A*Star) Unbiased and simultaneous amplification method for preparing a double-stranded DNA library from a sample of more than one type of nucleic acid
CN117062902A (zh) 2021-03-03 2023-11-14 豪夫迈·罗氏有限公司 用于从生物学样品中电泳提取核酸的装置和方法
EP4308723B1 (en) 2021-03-15 2025-04-23 F. Hoffmann-La Roche AG Targeted next-generation sequencing via anchored primer extension
EP4314337A1 (en) 2021-04-01 2024-02-07 F. Hoffmann-La Roche AG Immune cell counting of sars-cov-2 patients based on immune repertoire sequencing
EP4305196B1 (en) 2021-04-14 2025-04-02 10X Genomics, Inc. Methods of measuring mislocalization of an analyte
US11783912B2 (en) 2021-05-05 2023-10-10 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for analyzing nucleic acid molecules
WO2022236054A1 (en) 2021-05-06 2022-11-10 10X Genomics, Inc. Methods for increasing resolution of spatial analysis
WO2022248237A1 (en) 2021-05-24 2022-12-01 F. Hoffmann-La Roche Ag Enhancer oligonucleotides for nucleic acid hybridization
WO2022256503A1 (en) 2021-06-03 2022-12-08 10X Genomics, Inc. Methods, compositions, kits, and systems for enhancing analyte capture for spatial analysis
GB202108427D0 (en) 2021-06-14 2021-07-28 Fu Guoliang Methods, compositions, and kits for preparing sequencing library
EP4355898A1 (en) 2021-06-18 2024-04-24 CS Genetics Limited Reagents and methods for molecular barcoding
WO2023034489A1 (en) 2021-09-01 2023-03-09 10X Genomics, Inc. Methods, compositions, and kits for blocking a capture probe on a spatial array
JP7787988B2 (ja) 2021-10-04 2025-12-17 エフ. ホフマン-ラ ロシュ アーゲー オンラインベースコール圧縮
WO2023086880A1 (en) 2021-11-10 2023-05-19 10X Genomics, Inc. Methods, compositions, and kits for determining the location of an analyte in a biological sample
EP4305195A2 (en) 2021-12-01 2024-01-17 10X Genomics, Inc. Methods, compositions, and systems for improved in situ detection of analytes and spatial analysis
WO2023107899A2 (en) 2021-12-07 2023-06-15 Caribou Biosciences, Inc. A method of capturing crispr endonuclease cleavage products
CN114561453A (zh) * 2022-01-28 2022-05-31 赛纳生物科技(北京)有限公司 一种通过简并测序对目标样品定性分析或定量分析的方法
US12091715B2 (en) 2022-04-21 2024-09-17 Paragon Genomics, Inc. Methods and compositions for reducing base errors of massive parallel sequencing using triseq sequencing
US11680293B1 (en) 2022-04-21 2023-06-20 Paragon Genomics, Inc. Methods and compositions for amplifying DNA and generating DNA sequencing results from target-enriched DNA molecules
WO2023242075A1 (en) 2022-06-14 2023-12-21 F. Hoffmann-La Roche Ag Detection of epigenetic cytosine modification
JP2025522981A (ja) 2022-07-14 2025-07-17 エフ. ホフマン-ラ ロシュ アーゲー 一方向性デュアルプローブプライマー伸長によるバリアント対立遺伝子の濃縮
EP4573207A1 (en) 2022-08-18 2025-06-25 F. Hoffmann-La Roche AG Detection of epigenetic modifications
CN119895049A (zh) 2022-09-02 2025-04-25 豪夫迈·罗氏有限公司 对下一代靶标富集性能的改进
GB202308392D0 (en) 2023-06-06 2023-07-19 Fu Guoliang Methods, compositions, and kits for preparing library and targeted sequencing
WO2024256358A2 (en) 2023-06-14 2024-12-19 F. Hoffmann-La Roche Ag Accelerated marking of 5-formyl cytosine and use in nucleic acid methylation sequencing
WO2025024676A1 (en) 2023-07-26 2025-01-30 Caribou Biosciences, Inc. In vitro validation methods for cd19-targeting cell therapies
WO2025078657A1 (en) 2023-10-13 2025-04-17 F. Hoffmann-La Roche Ag Amplification-free target enrichment workflow for direct detection of nucleic acid modifications
WO2025193609A1 (en) 2024-03-11 2025-09-18 Caribou Biosciences, Inc. Methods and compositions for cost-effective assessment of nucleic acid transcripts and isoforms in cells
WO2025212586A1 (en) 2024-04-02 2025-10-09 Roche Sequencing Solutions, Inc. High throughput inramolecular consensus reads
WO2025210056A1 (en) 2024-04-03 2025-10-09 Roche Sequencing Solutions, Inc. In vitro amplification of dna methylation patterns
WO2025231432A1 (en) 2024-05-03 2025-11-06 Caribou Biosciences, Inc. In vivo gene editing with crispr systems
WO2025240460A2 (en) 2024-05-14 2025-11-20 Roche Molecular Systems, Inc. Assay for detection of mutations conferring resistance to treatment with an immunotherapeutic agent

Family Cites Families (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4883750A (en) 1984-12-13 1989-11-28 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4725536A (en) 1985-09-19 1988-02-16 Genetics Institute, Inc. Reagent polynucleotide complex with multiple target binding regions, and kit and methods
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US6150517A (en) 1986-11-24 2000-11-21 Gen-Probe Methods for making oligonucleotide probes for the detection and/or quantitation of non-viral organisms
US5149625A (en) 1987-08-11 1992-09-22 President And Fellows Of Harvard College Multiplex analysis of DNA
US5124246A (en) 1987-10-15 1992-06-23 Chiron Corporation Nucleic acid multimers and amplified nucleic acid hybridization assays using same
US5656731A (en) 1987-10-15 1997-08-12 Chiron Corporation Nucleic acid-amplified immunoassay probes
US5168038A (en) 1988-06-17 1992-12-01 The Board Of Trustees Of The Leland Stanford Junior University In situ transcription in cells and tissues
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US6040138A (en) 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US5424186A (en) 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
US5871928A (en) 1989-06-07 1999-02-16 Fodor; Stephen P. A. Methods for nucleic acid analysis
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US6309822B1 (en) 1989-06-07 2001-10-30 Affymetrix, Inc. Method for comparing copy number of nucleic acid sequences
US6551784B2 (en) 1989-06-07 2003-04-22 Affymetrix Inc Method of comparing nucleic acid sequences
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5925525A (en) 1989-06-07 1999-07-20 Affymetrix, Inc. Method of identifying nucleotide differences
CA2020958C (en) 1989-07-11 2005-01-11 Daniel L. Kacian Nucleic acid sequence amplification methods
US5200314A (en) 1990-03-23 1993-04-06 Chiron Corporation Polynucleotide capture assay employing in vitro amplification
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
AU1248292A (en) 1990-12-06 1992-07-08 Affymax Technologies N.V. Sequencing by hybridization of a target nucleic acid to a matrix of defined oligonucleotides
JP3080178B2 (ja) 1991-02-18 2000-08-21 東洋紡績株式会社 核酸配列の増幅方法およびそのための試薬キット
US5426180A (en) 1991-03-27 1995-06-20 Research Corporation Technologies, Inc. Methods of making single-stranded circular oligonucleotides
US5539082A (en) 1993-04-26 1996-07-23 Nielsen; Peter E. Peptide nucleic acids
US5981179A (en) 1991-11-14 1999-11-09 Digene Diagnostics, Inc. Continuous amplification reaction
US5424413A (en) 1992-01-22 1995-06-13 Gen-Probe Incorporated Branched nucleic acid probes
US5573905A (en) 1992-03-30 1996-11-12 The Scripps Research Institute Encoded combinatorial chemical libraries
US5981176A (en) 1992-06-17 1999-11-09 City Of Hope Method of detecting and discriminating between nucleic acid sequences
US5593826A (en) 1993-03-22 1997-01-14 Perkin-Elmer Corporation, Applied Biosystems, Inc. Enzymatic ligation of 3'amino-substituted oligonucleotides
CA2160016C (en) 1993-04-12 2008-06-03 Robert L. Letsinger Method of forming oligonucleotides
EP0705271B1 (en) 1993-06-25 2002-11-13 Affymetrix, Inc. (a Delaware Corporation) Hybridization and sequencing of nucleic acids
US5500356A (en) 1993-08-10 1996-03-19 Life Technologies, Inc. Method of nucleic acid sequence selection
US6309823B1 (en) 1993-10-26 2001-10-30 Affymetrix, Inc. Arrays of nucleic acid probes for analyzing biotransformation genes and methods of using the same
US5925517A (en) 1993-11-12 1999-07-20 The Public Health Research Institute Of The City Of New York, Inc. Detectably labeled dual conformation oligonucleotide probes, assays and kits
US5681697A (en) 1993-12-08 1997-10-28 Chiron Corporation Solution phase nucleic acid sandwich assays having reduced background noise and kits therefor
SE9400522D0 (sv) 1994-02-16 1994-02-16 Ulf Landegren Method and reagent for detecting specific nucleotide sequences
US5714330A (en) 1994-04-04 1998-02-03 Lynx Therapeutics, Inc. DNA sequencing by stepwise ligation and cleavage
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5695934A (en) 1994-10-13 1997-12-09 Lynx Therapeutics, Inc. Massively parallel sequencing of sorted polynucleotides
WO1998053300A2 (en) 1997-05-23 1998-11-26 Lynx Therapeutics, Inc. System and apparaus for sequential processing of analytes
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US6013445A (en) 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
US6600996B2 (en) 1994-10-21 2003-07-29 Affymetrix, Inc. Computer-aided techniques for analyzing biological sequences
DE69535240T2 (de) 1994-10-28 2007-06-06 Gen-Probe Inc., San Diego Zusammensetzungen und Verfahren für die gleichzeitige Detektion und Quantifizierung von einer Mehrheit spezifischer Nuklein Säure Sequenzen
US5968740A (en) 1995-07-24 1999-10-19 Affymetrix, Inc. Method of Identifying a Base in a Nucleic Acid
US5712126A (en) 1995-08-01 1998-01-27 Yale University Analysis of gene expression by display of 3-end restriction fragments of CDNA
US5763175A (en) 1995-11-17 1998-06-09 Lynx Therapeutics, Inc. Simultaneous sequencing of tagged polynucleotides
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
US6458530B1 (en) 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
US6174670B1 (en) 1996-06-04 2001-01-16 University Of Utah Research Foundation Monitoring amplification of DNA during PCR
US5935793A (en) 1996-09-27 1999-08-10 The Chinese University Of Hong Kong Parallel polynucleotide sequencing method using tagged primers
US6124092A (en) 1996-10-04 2000-09-26 The Perkin-Elmer Corporation Multiplex polynucleotide capture methods and compositions
US6117631A (en) 1996-10-29 2000-09-12 Polyprobe, Inc. Detection of antigens via oligonucleotide antibody conjugates
US6046005A (en) 1997-01-15 2000-04-04 Incyte Pharmaceuticals, Inc. Nucleic acid sequencing with solid phase capturable terminators comprising a cleavable linking group
US6794499B2 (en) 1997-09-12 2004-09-21 Exiqon A/S Oligonucleotide analogues
AU1603199A (en) 1997-12-03 1999-06-16 Curagen Corporation Methods and devices for measuring differential gene expression
US6653077B1 (en) 1998-09-04 2003-11-25 Lynx Therapeutics, Inc. Method of screening for genetic polymorphism
US6287825B1 (en) 1998-09-18 2001-09-11 Molecular Staging Inc. Methods for reducing the complexity of DNA sequences
US6629040B1 (en) 1999-03-19 2003-09-30 University Of Washington Isotope distribution encoded tags for protein identification
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
CA2304260C (en) * 1999-04-20 2009-03-24 Japan Bioindustry Association Method for determining a concentration of target nucleic acid molecules, nucleic acid probes for the method and method for analyzing data obtained by the method
US6326148B1 (en) 1999-07-12 2001-12-04 The Regents Of The University Of California Detection of copy number changes in colon cancer
US6440706B1 (en) 1999-08-02 2002-08-27 Johns Hopkins University Digital amplification
US6489114B2 (en) 1999-12-17 2002-12-03 Bio Merieux Process for labeling a ribonucleic acid, and labeled RNA fragments which are obtained thereby
DE60136166D1 (de) 2000-02-07 2008-11-27 Illumina Inc Nukleinsäure-nachweisverfahren mit universellem priming
US20020072058A1 (en) 2000-03-24 2002-06-13 Voelker Leroy L. Method for amplifying quinolone-resistance-determining-regions and identifying polymorphic variants thereof
US20030207300A1 (en) 2000-04-28 2003-11-06 Matray Tracy J. Multiplex analytical platform using molecular tags
CA2426824A1 (en) 2000-10-24 2002-07-25 The Board Of Trustees Of The Leland Stanford Junior University Direct multiplex characterization of genomic dna
US20020142345A1 (en) 2000-12-22 2002-10-03 Nelsen Anita J. Methods for encoding and decoding complex mixtures in arrayed assays
US20030049616A1 (en) 2001-01-08 2003-03-13 Sydney Brenner Enzymatic synthesis of oligonucleotide tags
CA2344599C (en) 2001-05-07 2011-07-12 Bioneer Corporation Selective polymerase chain reaction of dna of which base sequence is completely unknown
US20030186251A1 (en) 2002-04-01 2003-10-02 Brookhaven Science Associates, Llc Genome sequence tags
EP1551986B1 (en) 2002-09-30 2014-08-27 Affymetrix, Inc. Polynucleotide synthesis and labeling by kinetic sampling ligation
US7822555B2 (en) 2002-11-11 2010-10-26 Affymetrix, Inc. Methods for identifying DNA copy number changes
CA2505472A1 (en) 2002-11-11 2004-05-27 Affymetrix, Inc. Methods for identifying dna copy number changes
US7704687B2 (en) 2002-11-15 2010-04-27 The Johns Hopkins University Digital karyotyping
JP2004177290A (ja) * 2002-11-27 2004-06-24 Sangaku Renkei Kiko Kyushu:Kk 遺伝子解析データの処理方法
US20040259118A1 (en) 2003-06-23 2004-12-23 Macevicz Stephen C. Methods and compositions for nucleic acid sequence analysis
EP1641809B2 (en) 2003-07-05 2018-10-03 The Johns Hopkins University Method and compositions for detection and enumeration of genetic variations
EP1709203A2 (en) 2004-01-23 2006-10-11 Lingvitae AS Improving polynucleotide ligation reactions
EP1713936B1 (en) 2004-02-12 2009-12-09 Population Genetics Technologies Ltd Corporation of Great Britain Genetic analysis by sequence-specific sorting
US20100216153A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
WO2005111242A2 (en) 2004-05-10 2005-11-24 Parallele Bioscience, Inc. Digital profiling of polynucleotide populations
CN101087890A (zh) * 2004-07-26 2007-12-12 帕拉列勒生物科学公司 多个基因组的同时分析
US20060035258A1 (en) 2004-08-06 2006-02-16 Affymetrix, Inc. Methods for identifying DNA copy number changes
EP1647600A3 (en) 2004-09-17 2006-06-28 Affymetrix, Inc. (A US Entity) Methods for identifying biological samples by addition of nucleic acid bar-code tags
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
WO2006099604A2 (en) 2005-03-16 2006-09-21 Compass Genetics, Llc Methods and compositions for assay readouts on multiple analytical platforms
EP1861512A4 (en) 2005-03-18 2009-12-09 Fluidigm Corp THERMAL REACTION DEVICE AND USE METHOD THEREFOR
US20060263789A1 (en) 2005-05-19 2006-11-23 Robert Kincaid Unique identifiers for indicating properties associated with entities to which they are attached, and methods for using
US20070020640A1 (en) * 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
WO2007087312A2 (en) 2006-01-23 2007-08-02 Population Genetics Technologies Ltd. Molecular counting
EP1987162A4 (en) 2006-01-23 2009-11-25 Population Genetics Technologi NUCLEIC ACID ANALYSIS ABOUT SEQUENCE TOKENS
US20070172839A1 (en) 2006-01-24 2007-07-26 Smith Douglas R Asymmetrical adapters and methods of use thereof
US20080194414A1 (en) 2006-04-24 2008-08-14 Albert Thomas J Enrichment and sequence analysis of genomic regions
EP2518162B1 (en) 2006-11-15 2018-03-07 Biospherex LLC Multitag sequencing and ecogenomics analysis
WO2008150432A1 (en) 2007-06-01 2008-12-11 454 Life Sciences Corporation System and meth0d for identification of individual samples from a multiplex mixture
EP2191011B1 (en) 2007-08-29 2017-03-29 Illumina Cambridge Limited Method for sequencing a polynucleotide template
US20110003701A1 (en) * 2008-02-27 2011-01-06 454 Life Sciences Corporation System and method for improved processing of nucleic acids for production of sequencable libraries
DE102008025656B4 (de) 2008-05-28 2016-07-28 Genxpro Gmbh Verfahren zur quantitativen Analyse von Nukleinsäuren, Marker dafür und deren Verwendung
US20090298709A1 (en) 2008-05-28 2009-12-03 Affymetrix, Inc. Assays for determining telomere length and repeated sequence copy number
US20100069250A1 (en) 2008-08-16 2010-03-18 The Board Of Trustees Of The Leland Stanford Junior University Digital PCR Calibration for High Throughput Sequencing
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
US20100323348A1 (en) 2009-01-31 2010-12-23 The Regents Of The University Of Colorado, A Body Corporate Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process
US9085798B2 (en) 2009-04-30 2015-07-21 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
US8298767B2 (en) 2009-08-20 2012-10-30 Population Genetics Technologies Ltd Compositions and methods for intramolecular nucleic acid rearrangement
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US9315857B2 (en) 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
ES2704701T3 (es) 2010-01-19 2019-03-19 Verinata Health Inc Nuevo protocolo de preparación de bibliotecas de secuenciación
EP2513341B1 (en) 2010-01-19 2017-04-12 Verinata Health, Inc Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
ES2690753T3 (es) 2010-09-21 2018-11-22 Agilent Technologies, Inc. Aumento de la confianza en las identificaciones de alelos con el recuento molecular
WO2012042374A2 (en) 2010-10-01 2012-04-05 Anssi Jussi Nikolai Taipale Method of determining number or concentration of molecules
GB2512213B (en) 2010-10-08 2015-02-11 Harvard College High-throughput single cell barcoding
WO2012129363A2 (en) 2011-03-24 2012-09-27 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
EP3246416B1 (en) 2011-04-15 2024-06-05 The Johns Hopkins University Safe sequencing system
CA2834291A1 (en) 2011-04-25 2012-11-01 Biorad Laboratories, Inc. Methods and compositions for nucleic acid analysis
EP2710172B1 (en) 2011-05-20 2017-03-29 Fluidigm Corporation Nucleic acid encoding reactions
WO2013019075A2 (ko) 2011-08-01 2013-02-07 연세대학교산학협력단 핵산분자의 제조방법

Also Published As

Publication number Publication date
US8481292B2 (en) 2013-07-09
WO2012038839A3 (en) 2012-06-21
EP2623613B1 (en) 2016-07-06
PT2623613T (pt) 2016-10-11
EP2623613A1 (en) 2013-08-07
ES2595433T3 (es) 2016-12-30
ES2690753T3 (es) 2018-11-22
US8715967B2 (en) 2014-05-06
EP2619327B1 (en) 2014-10-22
US9670536B2 (en) 2017-06-06
EP3115468B1 (en) 2018-07-25
US8685678B2 (en) 2014-04-01
JP2013539970A (ja) 2013-10-31
CA2811185C (en) 2020-09-22
US20130210643A1 (en) 2013-08-15
US20130237458A1 (en) 2013-09-12
JP2017012185A (ja) 2017-01-19
JP6327652B2 (ja) 2018-05-23
US20120071331A1 (en) 2012-03-22
EP2623613B8 (en) 2016-09-07
EP2619327A2 (en) 2013-07-31
CA2811185A1 (en) 2012-03-29
DK2623613T3 (en) 2016-10-03
US20130224743A1 (en) 2013-08-29
US20130267424A1 (en) 2013-10-10
US8722368B2 (en) 2014-05-13
US20130203047A1 (en) 2013-08-08
US8741606B2 (en) 2014-06-03
CN103154273A (zh) 2013-06-12
CN110878345A (zh) 2020-03-13
EP3115468A1 (en) 2017-01-11
US20150031559A1 (en) 2015-01-29
JP5992911B2 (ja) 2016-09-14
US8728766B2 (en) 2014-05-20
WO2012038839A2 (en) 2012-03-29

Similar Documents

Publication Publication Date Title
ES2523140T3 (es) Aumento de la confianza en las identificaciones de alelos con el recuento molecular
US20240084384A1 (en) Methods for analyzing nucleic acids
ES2741099T3 (es) Método de fijación de una secuencia de recuento para una muestra de ácido nucleico
ES2810300T3 (es) Etiquetado y evaluación de una secuencia diana
ES2874143T3 (es) Métodos y composiciones para reducir códigos de barras, moleculares redundantes creados en reacciones de prolongación de cebadores
JP7362054B2 (ja) High Resolution Melting(HRM)解析によるマグロ類の遺伝的性判別方法