[go: up one dir, main page]

ES2866044T3 - Métodos y composiciones para la elaboración de perfiles de ADN - Google Patents

Métodos y composiciones para la elaboración de perfiles de ADN Download PDF

Info

Publication number
ES2866044T3
ES2866044T3 ES15708379T ES15708379T ES2866044T3 ES 2866044 T3 ES2866044 T3 ES 2866044T3 ES 15708379 T ES15708379 T ES 15708379T ES 15708379 T ES15708379 T ES 15708379T ES 2866044 T3 ES2866044 T3 ES 2866044T3
Authority
ES
Spain
Prior art keywords
primers
nucleic acid
amplification
dna
snp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15708379T
Other languages
English (en)
Inventor
Kathryn M Stephens
Cydne Holt
Carey Davis
Anne Jager
Paulina Walichiewicz
Yonmee Han
David Silva
Min-Jui Richard Shen
Sasan Amini
Frank Steemers
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Inc
Original Assignee
Illumina Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Inc filed Critical Illumina Inc
Application granted granted Critical
Publication of ES2866044T3 publication Critical patent/ES2866044T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2522/00Reaction characterised by the use of non-enzymatic proteins
    • C12Q2522/10Nucleic acid binding proteins
    • C12Q2522/101Single or double stranded nucleic acid binding proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/155Modifications characterised by incorporating/generating a new priming site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/161Modifications characterised by incorporating target specific and non-target specific sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/204Modifications characterised by specific length of the oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/107Temperature of melting, i.e. Tm
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/143Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Saccharide Compounds (AREA)

Abstract

Un método para construir un perfil de ADN que comprende: proporcionar una muestra de ácido nucleico, amplificar la muestra de ácido nucleico con una mezcla de cebadores que comprende una pluralidad de cebadores que se hibridan específicamente con al menos una secuencia diana que comprende un polimorfismo de un solo nucleótido (SNP) y al menos una secuencia diana que comprende una repetición en tándem en una reacción múltiplex para generar productos de amplificación, en el que cada uno de la pluralidad de cebadores tiene una temperatura de fusión que es menor que 60 ºC, tiene una longitud de al menos 24 nucleótidos que se hibridan con la secuencia diana, y es rico en AT con un contenido en AT mayor del 60 %, opcionalmente en el que cada uno de la pluralidad de cebadores comprende una secuencia de nucleótidos de homopolímero; y determinar los genotipos de dicho al menos un SNP y dicha al menos una repetición en tándem en los productos de amplificación, construyendo así el perfil de ADN de la muestra de ácido nucleico.

Description

DESCRIPCIÓN
Métodos y composiciones para la elaboración de perfiles de ADN
Campo de la descripción
Las realizaciones proporcionadas en este documento se refieren a métodos y composiciones para la elaboración de perfiles de ADN. Algunas realizaciones se refieren a métodos de amplificación de secuencias diana de tamaños variables en una única reacción, seguida de la secuenciación posterior del banco.
Antecedentes de la descripción
Históricamente, el uso de un subconjunto de marcadores en un genoma humano se ha utilizado para determinar la identidad personal de un individuo, o su huella o perfil de ADN. Estos marcadores incluyen ubicaciones o loci de secuencias repetidas en tándem cortas (STR) y secuencias repetidas en tándem intermedias (ITR) que, en combinación, son útiles para identificar un individuo de otro a ni vel genético. El análisis de estos marcadores se ha normalizado en el análisis del ADN encontrado en escenas de crímenes. Por ejemplo, en los Estados Unidos, varias de estas secuencias repetidas se han combinado para crear un sistema de índice de ADN combinado (“Combined DNA Index System”, CODIS), que sirve como patrón de laboratorio para la elaboración de perfiles de ADN en crímenes. De manera similar, otros países han adoptado un sistema convencional para la elaboración de perfiles de ADN. Estos sistemas también se han utilizado para determinar la paternidad y las relaciones familiares. Sin embargo, los sistemas actuales se basan todos en la separación por tamaño de estos loci repetidos en un sistema electroforético y, por lo tanto, se limitan al número de loci que puede diferenciarse en tal sistema. Por ejemplo, algunos de los sistemas comerciales actuales para la elaboración de perfiles de ADN con fines forenses diferencian solo 16 marcadores debido a las limitaciones de los métodos de detección electroforética.
El documento WO2006/004659A1 describe métodos para genotipificar una muestra que comprende un ácido nucleico, comprendiendo los métodos analizar los loci STR y SNP. El documento WO2012/155084A1 describe métodos para la amplificación por PCR múltiplex de loci STR que pueden usarse para generar rápidamente un perfil de STR específico a partir de ácidos nucleicos diana. Rook et al., Am. J. Pathol., 164 (1), 2004, 23-33., describen un método de amplificación del genoma completo para amplificar el ADN de células cancerosas microdiseccionadas por captura con láser para la genotipificación de SNP y STR de alto rendimiento. Fraige et al., Brazilian Archives of Biology and Technology, 56 (2), 2013, 213-221, describen el análisis de siete loci humanos STR para pruebas de paternidad mediante electroforesis de microchip. Teemu et al., Nature Methods, 9 (1), 2012, 72-74, describen un método de secuenciación de ARNm y cariotipificación humana a escala genómica en Drosophila melanogasterutilizando identificadores moleculares exclusivos para diferenciar cada molécula de la población.
Resumen de la descripción
Las realizaciones se refieren a métodos que no están limitados por contenido y que reúnen diferentes piezas de información genética sobre un individuo para proporcionar un perfil de ADN más completo y exhaustivo de un individuo. La presente descripción describe métodos y composiciones que permiten obtener este perfil de un individuo, avanzando así en los campos de la genómica personal y forense.
La elaboración de perfiles de ADN utiliza actualmente marcadores biológicos seleccionados para determinar la identidad de una muestra de ADN. Por ejemplo, el análisis más común para determinar un perfil de ADN es determinar el perfil de una serie de secuencias cortas repetidas en tándem (STR) que se encuentran en el genoma de un organismo. El análisis consiste en amplificar secuencias STR definidas que pueden tener hasta 400 pb de longitud que se pueden diferenciar por tamaño en un gel electroforético o mediante electroforesis capilar (CE). La electroforesis se usa para detectar cambios de tamaño debido a diferencias en el número de STR repetidas en un locus dado y, como tal, la longitud de los amplicones de PCR, que para el sistema CE está entre 50-500 pb. Para ayudar a superar los límites impuestos por las metodologías de diferenciación de tamaño (es decir, las STR de tamaño de amplicón solapantes no se pueden diferenciar), los métodos actuales de elaboración de perfiles de ADN utilizan diferentes conjuntos de cebadores marcados, de modo que los amplicones que se solapan en tamaño se pueden marcar con diferentes tintes fluorescentes, por lo cual, tras la excitación, los espectros de emisión difieren, lo que permite diferenciar los amplicones solapantes utilizando diferencias en los espectros de excitación y emisión del tinte. Utilizando el marcaje diferenciado, los métodos actuales permiten la multiplexación de 24 loci STR diferentes utilizando 6 tintes detectables de forma diferente en una prueba de elaboración de perfiles de ADN.
Existen muchas limitaciones para las metodologías actuales de elaboración de perfiles de ADN. Como se mencionó anteriormente, los sistemas diferenciados por tamaño limitan el número de loci que pueden determinarse discretamente en un momento dado. Otra limitación de los métodos establecidos para la elaboración de perfiles de ADN es que el ADN que se analizará a menudo está degradado, y el intervalo de tamaño de algunos de los marcadores no se adapta al ADN degradado, por ejemplo, los amplicones pueden ser más grandes que el tamaño de los fragmentos del ADN degradado. Para el a Dn degradado, los amplicones de 400 pb se consideran muy largos y pueden resultar en la pérdida de amplificación de esos loci más largos. Cuando los analistas de ADN amplifican muestras de ADN degradado para identificar su perfil de STR, por ejemplo, una muestra encontrada en la escena de un crimen, a menudo no pueden detectar todos los loci, lo que da como resultado un perfil parcial que puede dificultar o imposibilitar la correspondencia entre un sospechoso en la escena del crimen con un crimen. Por defecto, con tales muestras, un analista de ADN tiene pocas opciones y si queda alguna muestra, se deben realizar ensayos adicionales para identificar otros marcadores que podrían dar una pista sobre la identidad del individuo, como análisis de polimorfismos de un solo nucleótido (SNP), mini-STR o ADN mitocondrial (ADNmt). Sin embargo, se debe gastar una muestra valiosa en cada ensayo sin certeza de éxito en la identificación final de un individuo. La figura 1A demuestra los diferentes caminos potenciales para la identificación del ADN, todos los cuales son flujos de trabajo separados y requieren partes alícuotas de muestras valiosas. Cuando uno o más flujos de trabajo simples deben combinarse y posiblemente repetirse varias veces, el proceso resultante ya no es simple ni se usa de modo eficaz una muestra valiosa.
Las descripciones en la presente solicitud proporcionan métodos, composiciones y sistemas para determinar el perfil de ADN de un individuo u organismo mediante secuenciación de última generación (NGS) proporcionando así una solución a los problemas y limitaciones de las metodologías actuales para la elaboración de perfiles de ADN. La figura 1B muestra un ejemplo de un flujo de trabajo de los métodos descritos en una realización. En este documento se describen métodos y composiciones para combinar una multitud de marcadores pertinentes desde un punto de vista forense en un ensayo que incluyen, entre otros, repeticiones en tándem cortas (STR), repeticiones en tándem intermedias (ITR), polimorfismos de un solo nucleótido informativos de identidad (iSNP), polimorfismos de un solo nucleótido informativos de ascendencia (aSNP) y polimorfismos de un solo nucleótido informativos de fenotipo (pSNP).
La presente descripción describe ensayos que superan las limitaciones de las metodologías actuales para la elaboración de perfiles de ADN. Las realizaciones descritas proporcionan métodos para la amplificación múltiplex, preparación de bancos y secuenciación de STR, ITR, iSNP, aSNP y pSNP combinados procedentes de una muestra de ácido nucleico en una única reacción múltiplex. Los métodos descritos analizan una pluralidad de marcadores en un ensayo experimental con una manipulación mínima de la muestra, utilizando pequeñas cantidades de ADN de muestra, incluido ADN degradado. Algunas realizaciones descritas se pueden utilizar para construir bancos de datos de perfiles de ADN y/o perfiles de ADN que se pueden usar para la investigación de crímenes. Algunas realizaciones proporcionan composiciones y métodos de PCR desarrollados para ser lo suficientemente sensibles como para detectar cantidades de ADN inferiores a nanogramos. Además, los parámetros de diseño de cebadores no convencionales permiten una PCR altamente multiplexada para la identificación de STR, ITR y SNP en una reacción múltiplex. Para la investigación trabajo de crímenes, los presentes métodos y composiciones incorporan identificadores de moléculas exclusivos (UMI) que ayudan a eliminar, por ejemplo, errores de PCR y de secuenciación, tartamudeo y similares de los resultados de secuenciación. Ver Kivioja et al., Nat. Meth., 9, 72-74 (2012). Además, los resultados de los métodos y las composiciones descritos en este documento son compatibles con las bases de datos existentes.
Por lo tanto, las realizaciones descritas en este documento proporcionan métodos para construir un perfil de ADN que comprenden: proporcionar una muestra de ácido nucleico, amplificar la muestra de ácido nucleico con una pluralidad de cebadores que se hibridan específicamente con al menos una secuencia diana que comprende un polimorfismo de un solo nucleótido (SNP) y al menos una secuencia diana que comprende una repetición en tándem en una reacción múltiplex para generar productos de amplificación, y determinar los genotipos del al menos un SNP y dicha al menos una repetición en tándem en los productos de amplificación, construyendo así el perfil de ADN de la muestra de ácido nucleico.
En algunas realizaciones, los métodos comprenden generar un banco de ácidos nucleicos a partir de los productos de amplificación. En algunas realizaciones, los métodos comprenden determinar las secuencias del banco de ácidos nucleicos. En algunas realizaciones, la muestra de ácido nucleico proviene de un ser humano. En algunas realizaciones, la muestra de ácido nucleico proviene de una muestra ambiental, una planta, un animal no humano, una bacteria, una arquea, un hongo o un virus. En algunas realizaciones, el perfil de ADN se usa para uno o más diagnósticos o pronósticos de enfermedades, identificación de biomarcadores del cáncer, identificación de anomalías genéticas o análisis de diversidad genética. En algunas realizaciones, el perfil de ADN se usa para uno o más de construcción de bancos de datos, análisis forense, investigación de crímenes, paternidad o identificación personal. En algunas realizaciones, dicha al menos un SNP indica la ascendencia o una característica fenotípica de la fuente de la muestra de ácido nucleico. Cada uno de la pluralidad de cebadores tiene una temperatura de fusión baja y una longitud de al menos 24 nucleótidos. En algunas realizaciones, cada uno de la pluralidad de cebadores tiene una temperatura de fusión inferior a 60 °C. Cada uno de la pluralidad de cebadores tiene una longitud de al menos 24 nucleótidos. En algunas realizaciones, cada uno de la pluralidad de cebadores tiene una longitud de 24 nucleótidos a aproximadamente 38 nucleótidos. En algunas realizaciones, cada uno de la pluralidad de cebadores comprende una secuencia de nucleótidos de homopolímero. En algunas realizaciones, la muestra de ácido nucleico se amplifica mediante una reacción en cadena de la polimerasa (PCR). En algunas realizaciones, la muestra de ácido nucleico se amplifica en un tampón de amplificación que tiene una concentración de sales que es mayor, en comparación con la concentración de sales de un tampón de amplificación usado junto con cebadores diseñados de modo convencional. En algunas realizaciones, la sal comprende KCl, LiCl, NaCl o una combinación de las mismas. En algunas realizaciones, la sal comprende KCl. En algunas realizaciones, la concentración de KCl en el tampón de amplificación es de aproximadamente 100 mM a aproximadamente 200 mM. En algunas realizaciones, la concentración de KCl en el tampón de amplificación es menor que aproximadamente 150 mM. En algunas realizaciones, la concentración de KCl en el tampón de amplificación es de aproximadamente 145 mM. En algunas realizaciones, el SNP es un SNP de ascendencia, un SNP fenotípico, un SNP de identidad o una combinación de los mismos. En algunas realizaciones, la pluralidad de cebadores se hibrida específicamente con al menos 30 SNP. En algunas realizaciones, la pluralidad de cebadores se hibrida específicamente con al menos 50 SNP. En algunas realizaciones, la repetición en tándem es una repetición en tándem corta (STR), una repetición en tándem intermedia (ITR) o una variante de la misma. En algunas realizaciones, la pluralidad de cebadores se híbrida específicamente con al menos 24 secuencias repetidas en tándem. En algunas realizaciones, la pluralidad de cebadores se hibrida específicamente con al menos 60 secuencias repetidas en tándem. En algunas realizaciones, la muestra de ácido nucleico comprende de aproximadamente 10 pg a aproximadamente 100 pg de ADN. En algunas realizaciones, la muestra de ácido nucleico comprende de aproximadamente 5 pg a aproximadamente 10 pg de ADN. En algunas realizaciones, la muestra de ácido nucleico comprende ADN genómico. En algunas realizaciones, el ADN genómico proviene de una muestra forense. En algunas realizaciones, el ADN genómico comprende ADN degradado. En algunas realizaciones, se determinan al menos 50 % de los genotipos de dicho al menos un SNP y al menos una repetición en tándem. En algunas realizaciones, se determinan al menos el 80 % de los genotipos de dicho al menos un SNP y al menos una repetición en tándem. En algunas realizaciones, se determinan al menos el 90 % de los genotipos de dicho al menos un SNP y al menos una repetición en tándem. En algunas realizaciones, se determinan al menos el 95 % de los genotipos de dicho al menos un SNP y al menos una repetición en tándem. En algunas realizaciones, cada uno de la pluralidad de cebadores comprende una o más secuencias de marcador. En algunas realizaciones, una o más secuencias de marcador comprenden un marcador de cebador, un marcador de captura, un marcador de secuenciación, un marcador de identificador molecular exclusivo o una combinación de los mismos. En algunas realizaciones, dichas una o más secuencias de marcador comprenden un marcador de cebador. En algunas realizaciones, dichas una o más secuencias de marcador comprenden un marcador de identificador molecular exclusivo.
Las presentes descripciones proporcionan métodos para construir un banco de ácidos nucleicos que comprenden: proporcionar una muestra de ácido nucleico y amplificar la muestra de ácido nucleico con una pluralidad de cebadores que se hibridan específicamente con al menos una secuencia diana que comprende un polimorfismo de un solo nucleótido (SNP) y al menos una secuencia diana que comprende una secuencia repetida en tándem en una reacción múltiplex para generar productos de amplificación.
En algunas realizaciones, la muestra de ácido nucleico no se fragmenta antes de la amplificación. En algunas realizaciones, las secuencias diana no se enriquecen antes de la amplificación. En algunas realizaciones, dicho al menos un SNP indica la ascendencia o una característica fenotípica de la fuente de la muestra de ácido nucleico. En algunas realizaciones, cada uno de la pluralidad de cebadores comprende una o más secuencias de marcador. En algunas realizaciones, una o más secuencias de marcador comprenden un marcador de cebador, un marcador de captura, un marcador de secuenciación o un marcador de identificación molecular exclusivo, o una combinación de los mismos. En algunas realizaciones, los métodos incluyen amplificar los productos de amplificación con una segunda pluralidad de cebadores. En algunas realizaciones, cada uno de la segunda pluralidad de cebadores comprende una porción correspondiente al marcador del cebador de la pluralidad de cebadores y una o más secuencias de marcador. En algunas realizaciones, una o más secuencias de marcador de la segunda pluralidad de cebadores comprende un marcador de captura, un marcador de secuenciación o una combinación de los mismos. En algunas realizaciones, los métodos incluyen la adición de proteína de unión monocatenaria (SSB) a los productos de amplificación. En algunas realizaciones, la muestra de ácido nucleico y/o los productos de amplificación se amplifican mediante la reacción en cadena de la polimerasa (PCR). En algunas realizaciones, la muestra de ácido nucleico y/o los productos de amplificación se amplifican en un tampón de amplificación que tiene una concentración de sales más alta, en comparación con la concentración de sales de un tampón de amplificación usado junto con cebadores diseñados de modo convencional. En algunas realizaciones, la sal comprende KCl, LiCl, NaCl o una combinación de las mismas. En algunas realizaciones, la sal comprende KCl. En algunas realizaciones, la concentración de KCl en el tampón de amplificación es de aproximadamente 100 mM a aproximadamente 200 mM. En algunas realizaciones, la concentración de KCl en el tampón de amplificación es menor que aproximadamente 150 mM. En algunas realizaciones, la concentración de KCl en el tampón de amplificación es de aproximadamente 145 mM.
Las presentes descripciones proporcionan un banco de ácidos nucleicos que comprende una pluralidad de moléculas de ácidos nucleicos, en el que la pluralidad de moléculas de ácidos nucleicos comprende al menos una secuencia repetida en tándem flanqueada por un primer par de secuencias de marcador y al menos una secuencia de polimorfismo de un solo nucleótido (SNP) flanqueada por un segundo par de secuencias de marcador. Se proporciona además un banco de ácidos nucleicos construido usando los métodos y las composiciones descritos en este documento. En algunas realizaciones, dicho al menos un SNP indica la ascendencia o una característica fenotípica de la fuente de la pluralidad de moléculas de ácidos nucleicos.
Las presentes descripciones proporcionan una pluralidad de cebadores que se hibridan específicamente con al menos una secuencia diana corta y al menos una secuencia diana larga en una muestra de ácidos nucleicos, en la que la amplificación de la muestra de ácidos nucleicos usando la pluralidad de cebadores en una única reacción múltiplex da como resultado en al menos un producto de amplificación corto y al menos un producto de amplificación largo, en la que cada uno de la pluralidad de cebadores comprende una o más secuencias de marcador.
En algunas realizaciones, la secuencia diana corta comprende un polimorfismo de un solo nucleótido (SNP) y la secuencia diana larga comprende una repetición en tándem. En algunas realizaciones, una o más secuencias de marcador comprenden un marcador de cebador, un marcador de captura, un marcador de secuenciación, un marcador de identificación molecular exclusivo o una combinación de los mismos. Cada uno de la pluralidad de cebadores tiene una temperatura de fusión baja de menos de 60 °C y una longitud de al menos 24 nucleótidos. En algunas realizaciones, cada uno de la pluralidad de cebadores tiene una longitud de 24 nucleótidos a aproximadamente 38 nucleótidos. En algunas realizaciones, cada uno de la pluralidad de cebadores comprende una secuencia de nucleótidos de homopolímero. En algunas realizaciones, la muestra de ácido nucleico se amplifica mediante la reacción en cadena de la polimerasa (PCR). En algunas realizaciones, el SNP es un SNP de ascendencia, un SNP fenotípico, un SNP de identidad o una combinación de los mismos. En algunas realizaciones, la pluralidad de cebadores se hibrida específicamente con al menos 30 SNP. En algunas realizaciones, la pluralidad de cebadores se hibrida específicamente con al menos 50 SNP. En algunas realizaciones, la repetición en tándem es una repetición en tándem corta (STR), una repetición en tándem intermedia (ITR) o una variante de la misma. En algunas realizaciones, la pluralidad de cebadores se hibrida específicamente con al menos 24 secuencias repetidas en tándem. En algunas realizaciones, la pluralidad de cebadores se hibrida específicamente con al menos 60 secuencias repetidas en tándem.
Las descripciones de este documento proporcionan kits que comprenden al menos un medio de recipiente, en el que dicho al menos un medio de recipiente comprende una pluralidad de cebadores descritos en el presente documento.
En algunas descripciones, los kits incluyen un reactivo para una reacción de amplificación. En algunas realizaciones, el reactivo es un tampón de amplificación para la reacción en cadena de la polimerasa (PCR). En algunas realizaciones, el tampón de amplificación comprende una concentración de sales que aumenta en comparación con la concentración de sales de un tampón de amplificación usado junto con cebadores diseñados de modo convencional. En algunas realizaciones, la sal comprende KCl, LiCl, NaCl o una combinación de las mismas. En algunas realizaciones, la sal comprende KCl. En algunas realizaciones, la concentración de KCl en el tampón de amplificación es de aproximadamente 100 mM a aproximadamente 200 mM. En algunas realizaciones, la concentración de KCl en el tampón de amplificación es menor que aproximadamente 150 mM. En algunas realizaciones, la concentración de KCl en el tampón de amplificación es de aproximadamente 145 mM.
Breve descripción de los dibujos
La figura 1A y la figura 1B muestran las diferencias en el flujo de trabajo actual A) para la elaboración de perfiles de ADN frente a B) el de un ejemplo de una realización de la presente descripción.
La figura 2 muestra un ejemplo de realización de un método para crear un banco útil para la elaboración de perfiles de ADN.
La figura 3 muestra otro ejemplo de realización de un método para crear un banco útil para la elaboración de perfiles de ADN.
La figura 4A, la figura 4B, la figura 4C y la figura 4D son gráficos lineales que ilustran los resultados del electroferograma de cómo un pareja de cebadores diseñado por métodos tradicionales y siguiendo los protocolos y limitaciones de diseño de cebadores de PCR establecidos pueden causar una amplificación no específica de dianas genómicas y el oscurecimiento de la detección de amplicones deseados cuando se combinan con cebadores diseñados siguiendo los métodos de la presente descripción; A) 10 parejas de cebadores diseñados por métodos de la presente descripción dirigidos a loci SNP, B) y D) los 10 cebadores más un pareja de cebadores adicional diseñado por métodos tradicionales que demuestra que el pareja de cebadores adicional interfiere con los 10 parejas de cebadores durante la amplificación, y C) los 10 parejas de cebadores más un pareja de cebadores adicional, en el que el pareja de cebadores adicional también se diseñó siguiendo los métodos de la presente descripción, dando como resultado una amplificación exitosa de todos los SNP diana. El eje X es el tamaño de los fragmentos del banco (pb) y el eje Y son las unidades de fluorescencia (FU) de los picos amplificados de los fragmentos amplificados.
La figura 5A, la figura 5B, la figura 5C, la figura 5D y la figura 5E son diagramas de cajas que muestran ejemplos de resultados para un experimento que sigue el flujo de trabajo esbozado en la figura 2, que se utilizó para identificar un panel de 56 STR y una combinación de 75 SNP informativos de identidad (iSNP), SNP informativos de ascendencia (aSNP) y SNP informativos de fenotipo (pSNP) en una reacción de secuenciación y amplificación múltiplex de una muestra. Se indican los resultados replicados que demuestran la amplificación y secuenciación exitosa de los loci STR del panel; A) diagrama de cajas que demuestra el equilibrio intralocus para 25 STR heterocigóticos del panel, B) diagrama de cajas que demuestra un bajo tartamudeo para la mayoría de los 56 loci STR, C) diagrama de cajas que demuestra la cobertura de secuenciación para los loci STR, D) diagrama de cajas que demuestra la cobertura de secuencia para los SNP, y E) diagrama de cajas que demuestra el equilibrio para 22 SNP heterocigóticos del panel. La barra de error inferior indica el valor mínimo, la barra de error superior indica el valor máximo, la caja inferior indica el 25° percentil y la caja superior indica el 75° percentil, siendo la media la intersección entre las cajas superior e inferior.
La figura 6 muestra una serie de gráficos de barras que muestran ejemplos de gráficos de loci STR del experimento de la figura 5. Los gráficos muestran diferentes llamadas alélicas para los STR en el panel de la figura 5.
La figura 7A, la figura 7B, la figura 7C, la figura 7D y la figura 7E son diagramas de cajas que muestran ejemplos de resultados para un experimento que sigue el flujo de trabajo esbozado en la figura 3, que se utilizó para identificar un panel de 26 STR y una mezcla de 94 iSNP, aSNP y pSNP en una reacción de secuenciación y amplificación múltiplex de una muestra. Se indican los resultados replicados que demuestran la amplificación y secuenciación exitosa de los STR del panel; A) diagrama de cajas que demuestra el equilibrio intralocus para 21 loci STR heterocigóticos del panel, B) diagrama de cajas que demuestra un bajo tartamudeo para los 26 loci STR (39 de los 47 alelos de los 26 loci no mostraron tartamudeo), C) diagrama de cajas que demuestra la cobertura de secuenciación para los loci STR (números de lectura normalizados utilizando los uMl), D) diagrama de cajas que demuestra la cobertura de secuencia para los SNP y E) diagrama de cajas que demuestra el equilibrio para 21 iSNP heterocigotos del panel. La barra de error inferior indica el valor mínimo, la barra de error superior indica el valor máximo, la caja inferior indica el 25° percentil y la caja superior indica el 75° percentil, siendo la media la intersección entre las cajas superior e inferior. La figura 8 muestra una serie de gráficos de barras que muestran ejemplos de gráficos de loci STR del experimento de la figura 7. Los gráficos muestran diferentes llamadas alélicas para los STR en el panel de la figura 7.
La figura 9 muestra gráficos de barras de muestras analizadas sin UMI y con UMI. El panel izquierdo de cada conjunto representa las muestras analizadas sin UMI y el panel derecho de cada conjunto representa las muestras analizadas con UMI. El eje X designa el número de repeticiones del STR y el eje Y designa el número de recuento del alelo en particular. Las líneas de error dentro de las barras separan el error de secuencia (parte superior de la barra) de la secuencia correcta (parte inferior de la barra) dentro de la secuencia STR.
La figura 10A y la figura 10B muestran ejemplos de resultados de un experimento en el que la proporción de ADN era de 90:10 hembra:macho. A) Un subconjunto de resultados de llamadas de loci STR para loci STR cuando se usan los métodos actuales de elaboración de perfiles de ADN de electroforesis capilar, y B) varios resultados de llamadas de loci STR para varios loci STR cuando se usan los métodos de la presente solicitud. Tanto los métodos de CE como los métodos de la presente solicitud detectaron el bajo nivel de contaminación del ADN masculino.
La figura 11 muestra gráficos de barras que demuestran que se detectaron loci STR específicos del cromosoma Y en el experimento de la figura 9, lo que demuestra además que la presente solicitud puede detectar ADN masculino contaminante y loci STR específicos de ese ADN masculino, mientras que, con las metodologías actuales de CE, sería necesario realizar dos experimentos.
La figura 12 es una tabla que muestra ejemplos de resultados de secuenciación de alto nivel de un experimento con 12 individuos de muestra y un individuo de referencia, lo que demuestra la coherencia de las llamadas STR y SNP entre dos réplicas.
La figura 13 es una tabla que muestra ejemplos de estadísticas de población del experimento mostrado en la figura 12. La figura 14 es una tabla que muestra ejemplos de predicciones de fenotipo basadas en el genotipo de pSNP del experimento mostrado en la figura 12.
La figura 15 es un gráfico que muestra un ejemplo de un cartografiado de ascendencia basado en el genotipo de aSNP del experimento mostrado en la figura 12.
La figura 16A, la figura 16B, la figura 16C, la figura 16D y la figura 16E son gráficos de barras que muestran ejemplos de gráficos de loci STR del experimento de la figura 12.
La figura 17A y la figura 17B son gráficos de barras que muestran ejemplos de gráficos de SNP del experimento de la figura 12.
La figura 18A y la figura 18B muestran diagramas de cajas que muestran el equilibrio intralocus de ejemplos de loci STR y SNP del experimento de la figura 12.
La figura 19A y la figura 19B son gráficos que muestran análisis de tartamudeo de ejemplos de loci STR del experimento de la figura 12.
La figura 20 es una tabla que muestra ejemplos de heterocigotos isométricos en loci STR del experimento de la figura 12. La figura 21 es un diagrama de bloques que muestra un ejemplo de diagrama de herencia basado en variantes en el STR D8S1179 del experimento de la figura 12.
La figura 22 es un diagrama de bloques que muestra un ejemplo de diagrama de herencia basado en variantes en el STR D13S317 del experimento de la figura 12.
La figura 23 es una tabla que muestra ejemplos de resultados de genotipificación utilizando ADN degradado.
La figura 24A y la figura 24B muestran resultados de ejemplos de genotipificación de STR y equilibrio intralocus en diferentes entradas de ADN.
La figura 25A y la figura 25B muestran resultados de ejemplos de genotipificación de SNP y equilibrio intralocus en diferentes entradas de ADN.
Descripción detallada
Definiciones
Como se usa en este documento, las formas singulares "un", "una", "el" y “la” incluyen las referencias en plural a menos que se indique lo contrario, expresamente o por contexto. Por ejemplo, "un" dímero incluye uno o más dímeros, a menos que se indique lo contrario, expresamente o por contexto.
Como se usa en el presente documento, las expresiones "perfil de ADN", "huella genética" y "perfil genotípico" se usan indistintamente en el presente documento para referirse a las variaciones alélicas en una colección de loci polimórficos, tales como una repetición en tándem, un polimorfismo de un solo nucleótido (SNP), etc. Un perfil de ADN es útil en medicina forense para identificar a un individuo basándose en una muestra de ácido nucleico. El perfil de ADN, como se usa en este documento, también se puede usar para otras aplicaciones, como el diagnóstico y pronóstico de enfermedades que incluyen cáncer, identificación de biomarcadores del cáncer, análisis de herencia, análisis de diversidad genética, identificación de anomalías genéticas, construcción de bancos de datos, análisis forense, investigaciones de crímenes, paternidad, identificación personal, etc.
Los términos y expresiones "polinucleótido", "oligonucleótido", "ácido nucleico" y "molécula de ácido nucleico" se usan indistintamente en este documento para referirse a una forma polimérica de nucleótidos de cualquier longitud y pueden comprender ribonucleótidos, desoxirribonucleótidos, análogos de los mismos o mezclas de los mismos. Estos términos y expresiones se refieren solo a la estructura primaria de la molécula. Por tanto, los términos y expresiones incluyen ácido desoxirribonucleico ("ADN") de cadena triple, doble y sencilla, así como ácido ribonucleico ("ARN") de cadena triple, doble y sencilla.
Como se usa en el presente documento, "identidad de secuencia" o "identidad" u "homología" en el contexto de dos secuencias de nucleótidos incluye la referencia a los restos en las dos secuencias que son iguales cuando se alinean para una correspondencia máxima en una ventana de comparación especificada. La porción de la secuencia de nucleótidos en la ventana de comparación puede comprender adiciones o deleciones (es decir, espacios) en comparación con la secuencia de referencia para el alineamiento óptimo de las dos secuencias. El porcentaje se calcula determinando el número de posiciones en las que aparece el resto de base de ácido nucleico idéntico en ambas secuencias para obtener el número de posiciones concordantes, dividiendo el número de posiciones concordantes entre el número total de posiciones en la ventana de comparación y multiplicando el resultado por 100 para producir el porcentaje de identidad de secuencia.
Como se usa en el presente documento, "sustancialmente complementario o sustancialmente concordante" significa que dos secuencias de ácido nucleico tienen al menos un 90 % de identidad de secuencia. Preferiblemente, las dos secuencias de ácido nucleico tienen al menos 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia. Como alternativa, "sustancialmente complementario o sustancialmente concordante" significa que dos secuencias de ácido nucleico se pueden hibridar bajo condiciones de alta rigurosidad.
Se entiende que los aspectos y las realizaciones de la invención descrita en este documento incluyen aspectos y realizaciones "que consisten" y/o "que consisten esencialmente en".
Otros objetos, ventajas y características de la presente invención resultarán evidentes a partir de la siguiente memoria descriptiva tomada junto con los dibujos adjuntos.
Métodos para construir un perfil de ADN
Las metodologías establecidas para determinar el perfil de ADN están limitadas de varias maneras. Por ejemplo, los métodos actuales detectan cambios de tamaño de loci amplificados que difieren debido a cambios en la longitud de las secuencias repetidas en tándem que se encuentran en una muestra de ADN. Para multiplexar amplificaciones de STR para la visualización, las amplificaciones deben diseñarse para espaciar los diferentes tamaños de amplicones dentro de los límites de separación por tamaño del sistema electroforético, que para CE es de aproximadamente 50­ 500 pb. Como tal, solo se puede visualizar un número limitado de secuencias repetidas en un ensayo. Por ejemplo, el kit de amplificación GLOBALFILER PCR (APPLIED BIOSYSTEMS) es capaz de diferenciar 24 loci STR mediante el uso de 6 tintes diferentes. Además, tales métodos tienen problemas cuando el ADN de la muestra está degradada, tal como es habitual con las muestras de ADN de la escena de un crimen, de modo que no es posible obtener productos de amplificación más largos, lo que da como resultado un perfil de ADN incompleto. Los métodos actuales tampoco suelen ser lo suficientemente sensibles como para detectar pequeñas cantidades de ADN contaminante, por lo que una muestra mixta puede pasar desapercibida y no ser referida, lo cual podría ser crucial para la investigación de crímenes. Como tal, los métodos actuales pueden conducir a unos resultados incompletos que conducen a unos resultados no concluyentes, lo que puede ser perjudicial para la elaboración de perfiles de ADN.
Además, las dianas actuales no incluyen información sobre la ascendencia de la muestra, rasgos fenotípicos como el posible color de ojos y otra información de la muestra individualizada. Algunas metodologías de secuenciación han intentado incluir detección de STR y SNP. Por ejemplo, se ha intentado la preparación de un banco, seguida de un enriquecimiento personalizado para los STR y SNP; aunque no se cubren completamente todos los STR, ya que los métodos de preparación del banco generalmente implican el cizallamiento de muestras que puede borrar la secuencia diana. Además, los métodos y protocolos de diseño de cebadores establecidos pueden proporcionar conjuntos de cebadores para amplificar secuencias largas (por ejemplo, STR) o secuencias cortas (por ejemplo, SNP), pero las combinaciones de ambos en una reacción no han tenido éxito.
La presente descripción describe soluciones a los problemas y limitaciones de los sistemas de perfiles de ADN actuales. Los métodos y las composiciones descritos en este documento permiten la combinación de STR y SNP en un ensayo usando PCR para amplificar las dianas y generar bancos para la secuenciación. Mientras se desarrollaban los presentes ensayos, se descubrió inesperadamente que, por ejemplo, cuando se utiliza un diseño de cebadores no convencional y contrario a la intuición, tanto los STR como los SNP pueden amplificarse en una reacción que permite determinar la secuencia para todos los loci diana. Sorprendentemente, cuando se diseñaron cebadores de amplificación utilizando parámetros contrarios al dogma actual que rodea al diseño de cebadores, se crearon cebadores que permitieron que las regiones STR más largas se amplificaran y que las regiones SNP cortas se amplificaran de una manera más o menos equilibrada, lo que permitió que ambos STR y SNP pudieran amplificarse juntos en una reacción múltiplex.
Los métodos y las composiciones descritos en este documento para determinar el perfil de ADN de un organismo se pueden usar siempre que se deseen conjuntos de amplicones de diferentes tamaños a partir de una reacción de amplificación fuera de la elaboración de perfiles de ADN. Por ejemplo, si las dianas de interés para la PCR incluyen tanto regiones de genes grandes como regiones SNP cortas que pueden dar como resultado amplicones que varían en tamaño de cientos a miles de pares de bases, frente a amplicones de menos de 100 pares de bases, respectivamente, entonces los métodos y las composiciones descritos en el presente documento podrían permitir la amplificación simultánea con éxito de las dianas del gen y de SNP, lo que no habría sido posible sin la práctica de los métodos descritos. Además, los métodos y las composiciones descritos en este documento pueden aplicarse a cualquier organismo, por ejemplo, seres humanos, primates no humanos, animales, plantas, virus, bacterias, hongos y similares. Como tales, los presentes métodos y composiciones no solo son útiles para la elaboración de perfiles de ADN (por ejemplo, análisis forense, paternidad, identificación individual, etc.) y humanos como genoma diana, sino que también podrían usarse para otras dianas tales como marcadores del cáncer y de enfermedades, marcadores de anomalías genéticas y/o cuando el genoma diana no es humano.
Por lo tanto, las realizaciones descritas en este documento proporcionan métodos para construir un perfil de ADN que comprenden: proporcionar una muestra de ácido nucleico, amplificar la muestra de ácido nucleico con una pluralidad de cebadores que se hibridan específicamente con al menos una secuencia diana que comprende un polimorfismo de un solo nucleótido (SNP) y al menos una secuencia diana que comprende una repetición en tándem, y determinar los genotipos de dicho al menos un SNP y al menos una repetición en tándem en los productos de amplificación, construyendo así el perfil de ADN de la muestra de ácido nucleico.
Los expertos en la técnica apreciarán que se puede usar cualquier técnica adecuada para determinar los genotipos de las secuencias diana que incluye, pero no se limita a hibridación basada en matrices, secuenciación o similares. Por lo tanto, en algunas realizaciones, los métodos descritos en este documento pueden comprender generar un banco de ácidos nucleicos, tal como un banco de secuenciación, a partir de los productos de amplificación y determinar las secuencias del banco de ácidos nucleicos.
En algunas realizaciones, la presente descripción proporciona métodos y composiciones para la elaboración de perfiles de ADN que comprenden la identificación concurrente de STR e iSNP, por ejemplo, para su uso en la construcción de bancos de datos de población o personales. En tales bancos de datos, los datos personales no son forzosamente necesarios, ya que normalmente se conoce a las personas. Sin embargo, si se desea información adicional, se pueden agregar dianas de información adicionales para la identificación concurrente. Las repeticiones cortas en tándem son bien conocidas en la técnica y consisten en secuencias repetidas de di- o trinucleótidos. Las repeticiones en tándem intermedias se consideran típicamente secuencias repetidas de entre 4 y 7 secuencias de nucleótidos. Los SNP utilizados en este documento pueden ser de cualquier forma que pueda ofrecer información sobre las características físicas de una persona. Los ejemplos en el presente documento son SNP que proporcionan pistas sobre la ascendencia o herencia (aSNP) y aquellos que proporcionan pistas sobre características fenotípicas (SNP informativos de fenotipos). En los métodos descritos en el presente documento, un ensayo de perfil de ADN podría incluir cualquier número de estos SNP en combinación con determinaciones de loci STR e ITR.
Por ejemplo, la presente descripción proporciona métodos y composiciones adicionales en los que, junto con STR y iSNPS, se incluyen dianas adicionales. Si se desea obtener más información sobre un individuo, por ejemplo, cuando una muestra pertenece a un individuo o grupo de individuos desconocido, como puede ser el caso de las investigaciones de crímenes, los otros marcadores de información se pueden agregar al STR e iSNP, tales como SNP relacionados con la ascendencia (aSNP) y SNP relacionados con variantes fenotípicas (SNP informativo de fenotipo). La información adicional se puede utilizar para ayudar a los investigadores, por ejemplo, proporcionando información sobre la herencia, el color de ojos, el color del cabello y similares de un individuo desconocido. Como tal, la adición de toda la información combinada puede proporcionar un perfil de ADN más completo de un individuo que no se conocía anteriormente utilizando los métodos actuales de elaboración de perfiles de ADN.
Los métodos y las composiciones descritos en este documento están diseñados para ser lo suficientemente sensibles como para detectar cantidades inferiores a nanogramos de moléculas de ácidos nucleicos. Además, los métodos y las composiciones descritos en este documento pueden ser útiles para amplificar una muestra de ácido nucleico preparada con moléculas de ácidos nucleicos de baja calidad, como ADN genómico degradado y/o fragmentado de una muestra forense. La muestra de ácido nucleico puede ser una muestra purificada o un lisado que contiene ADN bruto, por ejemplo, derivado de un frotis bucal, papel, tela u otro sustrato que puede estar impregnado con saliva, sangre u otros fluidos corporales. Como tal, en algunas realizaciones, la muestra de ácido nucleico puede comprender pequeñas cantidades o porciones fragmentadas de ADN, tal como ADN genómico. Por ejemplo, la muestra de ácido nucleico puede comprender una cantidad de ácido nucleico (por ejemplo, ADN genómico) que es, que es aproximadamente o que es menor que 1 pg, 2 pg, 3 pg, 4 pg, 5 pg, 6 pg, 7 pg, 8 pg, 9 pg, 10 pg, 11 pg, 12 pg, 13 pg, 14 pg, 15 pg, 16 pg, 17 pg, 18 pg, 19 pg, 20 pg, 30 pg, 40 pg, 50 pg, 60 pg, 70 pg, 80 pg, 90 pg, 100 pg, 200 pg, 300 pg, 400 pg, 500 pg, 600 pg, 700 pg, 800 pg, 900 pg, 1 ng, 10 ng, 100 ng o está en un intervalo definido por dos de estos valores, por ejemplo, 10 pg a 100 pg, 10 pg a 1 ng, 100 pg a 1 ng, 1 ng a 10 ng, 10 ng a 100 ng, etc. En algunas realizaciones, la muestra de ácido nucleico puede comprender una cantidad de ácido nucleico (por ejemplo, ADN genómico) de aproximadamente 100 pg a aproximadamente 1 ng. En algunas realizaciones, la muestra de ácido nucleico puede comprender una cantidad de ácido nucleico (por ejemplo, ADN genómico) que es más de aproximadamente 62,5 pg. En algunas realizaciones, las etapas de fragmentación adicionales, tales como sonicación o digestión con endonucleasas, no se incluyen en los procedimientos de fragmentación.
En algunas realizaciones, los métodos y las composiciones descritos en este documento son capaces de determinar con éxito los genotipos de una o más de las secuencias diana, por ejemplo, SNP, STR, etc., incluso con cantidades inferiores a nanogramos y/o muestras de ácido nucleico degradadas. Por ejemplo, los métodos y las composiciones descritos en este documento son capaces de determinar con éxito el genotipo que es, que es aproximadamente o que es más del 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %. , 90 %, 95 %, 96 %, 97 %, 98 %, 99 %, 100 %, o un intervalo entre dos cualesquiera de los valores anteriores, de las secuencias diana. En algunas realizaciones, los métodos y las composiciones descritos en este documento son capaces de determinar con éxito el genotipo de más de aproximadamente 50 %, 80 %, 90 %, 95 %, 98 % o más de las secuencias diana. En algunas realizaciones, los métodos y las composiciones descritos en este documento son capaces de lograr un equilibrio intralocus de más de aproximadamente 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 %, 100 %, o una intervalo entre dos cualesquiera de los valores anteriores, de las secuencias diana.
Para la investigación forense, la pluralidad de cebadores puede incorporar identificadores de moléculas exclusivos (UMI) que ayudan a eliminar, por ejemplo, errores de PCR y de secuenciación, tartamudeo y similares de los resultados de secuenciación. Ver Kivioja et al., supra. Como se analiza con más detalle en otra parte de esta descripción, la inclusión de UMI en los cebadores también permite la identificación de variantes dentro de los loci de repetición en tándem, mejorando aún más la utilidad de los métodos y las composiciones actuales para la elaboración de perfiles de ADN y otros fines, tales como el análisis de inherencia.
Por consiguiente, en algunas realizaciones, los genotipos de las secuencias de repetición en tándem como se describen en el presente documento pueden incluir variantes de secuencia dentro de los loci de repetición en tándem. Por lo tanto, un homocigoto para una repetición en tándem (por ejemplo, 13, 13 para D9S1122) que usa el método tradicional puede identificarse como un heterocigoto isométrico basado en variantes de secuencia dentro de la repetición en tándem. Como apreciarán los expertos en la técnica, tener en cuenta las variantes de secuencia intralocus mejoraría enormemente la utilidad de los métodos descritos en este documento, por ejemplo, para el análisis de herencia.
Métodos para construir un banco de ácidos nucleicos
Las realizaciones descritas en este documento proporcionan métodos para construir un banco de ácidos nucleicos que comprenden: proporcionar una muestra de ácido nucleico y amplificar la muestra de ácido nucleico con una pluralidad de cebadores que se hibridan específicamente con al menos una secuencia diana que comprende un polimorfismo de un solo nucleótido (SNP) y al menos una secuencia diana que comprende una secuencia repetida en tándem.
Los métodos y las composiciones descritos en este documento están diseñados para ser lo suficientemente sensibles como para detectar cantidades inferiores a nanogramos de moléculas de ácidos nucleicos. Además, los métodos y las composiciones descritos en este documento pueden ser útiles para amplificar una muestra de ácido nucleico que consiste en moléculas de ácidos nucleicos de baja calidad, como ADN genómico degradado y/o fragmentado de una muestra forense. La muestra de ácido nucleico puede estar purificada o ser un lisado que contiene ADN bruto, por ejemplo, derivado de un frotis bucal, papel, tela u otro sustrato que puede estar impregnado con saliva, sangre u otros fluidos corporales. Como tal, en algunas realizaciones, la muestra de ácido nucleico puede comprender una cantidad baja de ADN fragmentado, tal como ADN genómico. Por ejemplo, la muestra de ácido nucleico puede comprender una cantidad de ácido nucleico (por ejemplo, ADN genómico) que es, que es aproximadamente o que es menor que 1 pg, 2 pg, 3 pg, 4 pg, 5 pg, 6 pg, 7 pg, 8 pg, 9 pg, 10 pg, 11 pg, 12 pg, 13 pg, 14 pg, 15 pg, 16 pg, 17 pg, 18 pg, 19 pg, 20 pg, 30 pg, 40 pg, 50 pg, 60 pg, 70 pg, 80 pg, 90 pg, 100 pg, 200 pg, 300 pg, 400 pg, 500 pg, 600 pg, 700 pg, 800 pg, 900 pg, 1 ng, 10 ng, 100 ng o está en un intervalo definido por dos de estos valores, por ejemplo, 10 pg a 100 pg, 10 pg a 1 ng, 100 pg a 1 ng, 1 ng a 10 ng, 10 ng a 100 ng, etc. En algunas realizaciones, la muestra de ácido nucleico puede comprender una cantidad de ácido nucleico (por ejemplo, ADN genómico) de aproximadamente 100 pg a aproximadamente 1 ng. En algunas realizaciones, la muestra de ácido nucleico puede comprender una cantidad de ácido nucleico (por ejemplo, ADN genómico) que es más de aproximadamente 62,5 pg. En algunas realizaciones, no se incluyen etapas de fragmentación adicionales, como sonicación o digestión con endonucleasas.
En algunas realizaciones, los métodos descritos en el presente documento comprenden la amplificación y la preparación de bancos en previsión de la secuenciación paralela corriente abajo. Un ensayo puede incluir dos mezclas maestras de PCR, dos polimerasas termoestables, dos mezclas de cebadores y adaptadores de bancos. En algunas realizaciones, se puede amplificar una muestra de ADN durante varios ciclos utilizando un primer conjunto de cebadores de amplificación que comprenden regiones específicas de la diana y regiones de marcador no específicas de diana y una primera mezcla maestra de PCR. La región de marcador puede ser cualquier secuencia, tal como una región de marcador universal, una región de marcador de captura, una región de marcador de amplificación, una región de marcador de secuenciación, una región de marcador UMI y similares. Por ejemplo, una región de marcador puede ser el molde para los cebadores de amplificación utilizados en una segunda ronda de amplificación o posterior, por ejemplo, para la preparación de bancos. En algunas realizaciones, los métodos comprenden la adición de proteína de unión monocatenaria (SSB) a los primeros productos de amplificación. Una parte alícuota de la primera muestra amplificada se puede extraer y amplificar una segunda vez usando un segundo conjunto de cebadores de amplificación que son específicos de la región de marcador por ejemplo, una región de marcador universal o una región de marcador de amplificación, de los primeros cebadores de amplificación, que pueden comprender de una o más secuencias de marcador adicionales, tales como marcadores de secuencia específicas para uno o más flujos de trabajo de secuenciación corriente abajo, y la misma o una segunda mezcla maestra de PCR. Como tal, un banco de la muestra de ADN original estará listo para secuenciar.
Un método alternativo podría comprender que la primera amplificación se realice en un volumen pequeño (por ejemplo, 15 al) y en lugar de transferir una parte alícuota a una nueva ubicación para una segunda ronda de amplificación, se podrían agregar al tubo reactivos adicionales para realizar una segunda ronda de amplificación.
Una vez que se crea el banco, este se puede purificar y cuantificar. En algunos ejemplos, la purificación se puede realizar procesando la muestra a través de un sustrato como AMPURE XP Beads (Beckman Coulter) que actúa para purificar los fragmentos de ADN de los componentes de reacción. Otro método podría ser la incorporación de un resto de purificación, tal como un resto de hapteno, en el segundo conjunto de cebadores de amplificación. Por ejemplo, si se incorporó una biotina en uno de los cebadores del segundo conjunto de cebadores de amplificación, entonces los fragmentos del banco podrían capturarse utilizando un resto de estreptavidina en una esfera, por ejemplo. Utilizando la estrategia de captura, los bancos también podrían normalizarse y cuantificarse mediante la normalización basada en esferas (“Bead Based Normalization”, BBN). Sin embargo, los bancos se pueden purificar y cuantificar, o agrupar y cuantificar si se realizan múltiples reacciones, sin el uso de BBN. Por ejemplo, los bancos también podrían cuantificarse mediante métodos electroforéticos en gel, BioAnalyzer, qPCR, métodos espectrofotométricos, kits de cuantificación (por ejemplo, PicoGreen, etc.) y similares como se conoce en la técnica. Después de la cuantificación, el banco puede secuenciarse mediante secuenciación paralela.
En algunas realizaciones, el primer conjunto de cebadores de amplificación utilizados para amplificar un ADN diana se proporciona en una concentración tan limitada que cuando se agrega una parte alícuota de la primera reacción de amplificación a un nuevo tubo y se agregan los reactivos de la segunda reacción de amplificación, se produce una amplificación de arrastre de mínima a indetectable resultante del primer conjunto de cebadores de amplificación, y no es necesaria una etapa de limpieza entre la primera reacción de amplificación y la segunda reacción de amplificación. En algunos ejemplos, la concentración de los cebadores de amplificación para una primera PCR es, es aproximadamente o es menor que 0,5 nM, 0,6 nM, 0,7 nM, 0,8 nM, 0,9 nM, 1,0 nM, 1,5 nM, 2,0 nM, 3,0 nM , 4,0 nM, 5,0 nM, 6,0 nm, 7,0 nm, 8,0 nm, 9,0 nm 10,0 nm, 11,0 nm 12,0 nm, o un intervalo entre cualquiera de estos valores, por ejemplo, 0,5 nM a 1,0 nM, 1,0 nM a 12 nM, 0,8 nM a 1,5 nM, etc. En algunas realizaciones, la concentración de los cebadores de amplificación para una primera PCR es de aproximadamente 0,9 nM a aproximadamente 10 nM.
La figura 2 muestra un ejemplo de un flujo de trabajo de los métodos descritos en la presente en una realización. Una secuencia de ADN genómico diana se amplifica usando un primer conjunto de cebadores que comprende una región que flanquea la secuencia diana y las regiones de marcador de amplificación (que pueden ser iguales o diferentes) dando como resultado amplicones que comprenden la secuencia diana y marcadores en ambos extremos. Una parte alícuota de los amplicones de la primera PCR se amplifica adicionalmente usando un segundo conjunto de cebadores específicos para las primeras secuencias de marcador que comprenden además secuencias de cebadores de secuenciación (secuencias de adaptadores i5 e i7), generando así un banco que comprende la secuencia de ADN diana flanqueada por secuencias utilizadas en una secuenciación paralela, en este caso las secuencias i5 e i7 se utilizan en secuencia mediante métodos de síntesis popularizados por Illumina, Inc.
Un ejemplo de un flujo de trabajo alternativo para determinar un perfil de ADN a partir de una muestra se describe en la figura 3. En este ejemplo, una diana de ADN se amplifica con un primer pareja de cebadores que comprende secuencias que flanquean la secuencia diana, secuencias de marcador que no son diana (iguales o diferentes) y otras secuencias de identificadores moleculares exclusivos o UMI, que comprenden bases aleatorizadas. Los UMI se pueden usar, por ejemplo, para disminuir o eliminar bioinformáticamente los errores que aparecen durante los procesos de preparación de bancos (por ejemplo, artefactos de PCR o incorporaciones erróneas, etc.). El uso de UMI puede ser importante para la elaboración de perfiles de ADN, pero es de particular importancia para ayudar a eliminar errores cuando las muestras se secuencian para la investigación de crímenes. En este ejemplo, la primera ronda de amplificación se realiza durante 2 ciclos, a lo que sigue la adición de una proteína de unión monocatenaria (SSB) y la incubación a 37 °C durante 15 minutos, seguida de una inactivación a 95 °C/5 minutos que extingue con eficacia la amplificación adicional del primer conjunto de cebadores de amplificación durante la segunda ronda de amplificación. Aunque se desconoce el mecanismo, se contempla que la adición de SSB une irreversiblemente los primeros cebadores de amplificación monocatenarios y evita que participen en reacciones de amplificación posteriores. Después de la incubación con SSB, se agrega un segundo conjunto de cebadores que comprenden marcadores de secuencia y una segunda mezcla de PCR, lo que da como resultado el banco de secuenciación.
Bancos de ácidos nucleicos
Las presentes descripciones proporcionan bancos de ácidos nucleicos, que pueden usarse para secuenciación. En algunas realizaciones, los bancos de ácidos nucleicos descritos en este documento pueden comprender una pluralidad de moléculas de ácidos nucleicos, en los que la pluralidad de moléculas de ácidos nucleicos comprende al menos una secuencia repetida en tándem flanqueada por un primer par de secuencias de marcador y al menos una secuencia de un polimorfismo de un solo nucleótido (SNP) flanqueada por un segundo par de secuencias de marcador.
Como se describe en este documento, el tamaño de las moléculas de ácidos nucleicos puede variar mucho usando los métodos y las composiciones descritos en este documento. Los expertos en la técnica apreciarán que las moléculas de ácidos nucleicos amplificadas a partir de una secuencia diana que comprende una repetición en tándem (por ejemplo, STR) pueden tener un tamaño grande, mientras que las moléculas de ácidos nucleicos amplificadas a partir de una secuencia diana que comprende un SNP pueden tener un tamaño pequeño. Por ejemplo, las moléculas de ácidos nucleicos pueden comprender desde menos de cien nucleótidos hasta cientos o incluso miles de nucleótidos.
Por lo tanto, el tamaño de las moléculas de ácidos nucleicos puede estar en un intervalo entre dos valores cualesquiera de aproximadamente 50 pb, aproximadamente 60 pb, aproximadamente 70 pb, aproximadamente 80 pb, aproximadamente 90 pb, aproximadamente 100 pb, aproximadamente 110 pb, aproximadamente 120 pb, aproximadamente 130 pb, aproximadamente 140 pb, aproximadamente 150 pb, aproximadamente 200 pb, aproximadamente 300 pb, aproximadamente 400 pb, aproximadamente 500 pb, aproximadamente 600 pb, aproximadamente 700 pb, aproximadamente 800 pb, aproximadamente 900 pb, aproximadamente 1 kb, o más. En algunas realizaciones, el tamaño mínimo de las moléculas de ácidos nucleicos puede ser una longitud que sea, que sea aproximadamente o que sea menor que 50 pb, 60 pb, 70 pb, 80 pb, 90 pb o 100 pb. En algunas realizaciones, el tamaño máximo de las moléculas de ácidos nucleicos puede ser una longitud que sea, que sea aproximadamente o que sea más de 100 pb, 150 pb, 200 pb, 250 pb, 300 pb, 350 pb, 400 pb, 450 pb , 500 pb o 1 kb.
Para la generación de agrupaciones, los fragmentos del banco se inmovilizan sobre un sustrato, por ejemplo, un portaobjetos, que comprende secuencias de oligonucleótidos homólogas para capturar e inmovilizar los fragmentos del banco de ADN. Los fragmentos del banco de ADN inmovilizados se amplifican utilizando metodologías de amplificación de agrupaciones como se ejemplifica en las descripciones de las patentes de EE. UU. n.os 7.985.565 y 7.115.400. Las patentes de EE. UU. n.os 7.985.565 y 7.115.400 describen métodos de amplificación de ácidos nucleicos en fase sólida que permiten inmovilizar productos de amplificación sobre un soporte sólido para formar matrices compuestas por agrupaciones o "colonias" de moléculas de ácidos nucleicos inmovilizadas. Cada grupo o colonia sobre dicha matriz se forma a partir de una pluralidad de cadenas polinucleotídicas inmovilizadas idénticas y una pluralidad de cadenas polinucleotídicas complementarias inmovilizadas idénticas. Las matrices así formadas se denominan generalmente "matrices agrupadas". Los productos de reacciones de amplificación en fase sólida como las descritas en las patentes de EE. UU. n.os 7.985.565 y 7.115.400 son las denominadas estructuras "con puente" formadas por la asociación de pares de cadenas polinucleotídicas inmovilizadas y cadenas complementarias inmovilizadas, estando ambas cadenas inmovilizadas sobre el soporte sólido en el extremo 5', preferiblemente mediante una unión covalente. Las metodologías de amplificación de agrupaciones son ejemplos de métodos en los que se usa un molde de ácido nucleico inmovilizado para producir amplicones inmovilizados. También pueden usarse otras metodologías adecuadas para producir amplicones inmovilizados a partir de fragmentos de ADN inmovilizados producidos de acuerdo con los métodos proporcionados en este documento. Por ejemplo, se pueden formar una o más agrupaciones o colonias mediante PCR en fase sólida, tanto si uno o ambos cebadores de cada pareja de cebadores de amplificación están inmovilizados. Sin embargo, los métodos descritos en este documento no se limitan a ninguna metodología de preparación de secuenciación o plataforma de secuenciación particular y pueden adaptarse a otros métodos de preparación de plataformas de secuenciación paralela y plataformas de secuenciación asociadas.
Cebadores
Las realizaciones descritas en este documento proporcionan una pluralidad de cebadores que se hibridan específicamente con al menos una secuencia diana corta y al menos una secuencia diana larga en una muestra de ácido nucleico, en la que la amplificación de la muestra de ácido nucleico usando la pluralidad de cebadores en una única reacción múltiplex da como resultado al menos un producto de amplificación corto y al menos un producto de amplificación largo, en la que cada uno de la pluralidad de cebadores comprende una o más secuencias de marcador.
En el presente documento se describe además una pluralidad de cebadores que tienen las secuencias expuestas en las tablas 1-2.
Para la amplificación múltiplex de una secuencia diana grande (por ejemplo, STR, ITR) y una secuencia diana pequeña (por ejemplo, SNP), se diseñan cebadores que permitan una amplificación equilibrada en todos los tipos de diana. Los métodos y las composiciones descritos en este documento pueden usarse para amplificar múltiples secuencias diana repetidas en tándem en una única reacción múltiplex. Por ejemplo, la pluralidad de cebadores puede hibridarse específicamente con una serie de secuencias repetidas en tándem que son, que son aproximadamente o que son más de 4, 6, 8, 10, 12, 14, 16, 18, 24, 30, 40, 50. , 60, 70, 80, 90, 100, o un intervalo entre cualquiera de los dos valores, como 4 a 12, 10 a 24, 30 a 100, etc. En algunas realizaciones, la pluralidad de cebadores puede hibridarse específicamente a al menos 24 secuencias repetidas en tándem. En algunas realizaciones, la pluralidad de cebadores puede hibridarse específicamente con al menos 60 secuencias repetidas en tándem. Los métodos y las composiciones descritos en este documento pueden usarse para amplificar múltiples secuencias diana SNP en una sola reacción.
Por ejemplo, la pluralidad de cebadores puede hibridarse específicamente con una serie de secuencias SNP que son, que son aproximadamente o que son más de 4, 6, 8, 10, 12, 14, 16, 18, 24, 30, 40, 50, 60, 70, 80, 90, 100 o un intervalo entre cualquiera de los dos valores, como 4 a 12, 10 a 24, 30 a 100, etc. En algunas realizaciones, la pluralidad de cebadores puede hibridarse específicamente con al menos 30 secuencias SNP. En algunas realizaciones, la pluralidad de cebadores puede hibridarse específicamente con al menos 50 secuencias SNP.
Se descubrió durante la experimentación que las secuencias diana de SNP cortas se amplificaban preferentemente frente a las secuencias diana STR más largas cuando se usaban cebadores que se diseñaban siguiendo los criterios establecidos y la sabiduría para el diseño exitoso de cebadores. Además, al menos en el flujo de trabajo de secuencia por síntesis, en el que se generan agrupaciones y las agrupaciones se secuencian en sí mismas (por ejemplo, cuando se utiliza la secuencia por síntesis (SBS, descrita aquí en otro punto) asociada con los secuenciadores de Illumina, Inc.), también aparece una amplificación de agrupación preferencial de los fragmentos de SNP del banco más cortos. Para superar estos dos sesgos, se necesitaba una nueva estrategia para el diseño de cebadores que permitiera una amplificación equilibrada entre las secuencias diana SNP cortas y las secuencias diana STR largas.
Una de las estrategias incluyó el diseño de cebadores para la amplificación de STR. Con las STR, las secuencias repetidas a menudo están incluidas dentro de regiones repetidas más grandes; por lo tanto, el diseño de cebadores específicos para la amplificación de STR puede resultar problemático. Además, las STR y sus regiones flanqueantes a menudo son ricas en AT. En un caso, los cebadores se diseñaron para las regiones problemáticas utilizando una estrategia de diseño contraria a los criterios de diseño de PCR convencionales y bien establecidos. Los criterios establecidos para el diseño de cebadores de PCR indican que, entre otros criterios, 1) la longitud óptima para los cebadores es de 18 a 22 nucleótidos, 2) la Tm debe estar en el intervalo de 55-58 °C, 3) el contenido de GC debe ser de aproximadamente 40-60 %, 4) y las regiones de dinucleótidos AT repetidas deben evitarse, siendo <4 repeticiones de dinucleótidos AT el máximo. Se diseñaron cebadores que eran más largos que los cebadores de PCR típicos, por ejemplo, de 23 a 35 nucleótidos de longitud en lugar de 18 a 22 nucleótidos, que tenían bajas temperaturas de fusión (Tm), por ejemplo, aproximadamente 54 °C en lugar de aproximadamente 58 °C, y los cebadores eran ricos en AT, tres parámetros que los criterios de PCR establecidos convencionales indican que deben evitarse para un diseño de cebador óptimo. En efecto, se diseñaron cebadores no óptimos. Sorprendentemente, se descubrió que estos cebadores largos, ricos en AT y con baja Tm en realidad multiplexaban los STR mejor que los cebadores cortos, de alta Tm y bajo contenido en AT. Aunque no se pretenda limitación alguna por la teoría , se contempla que los cebadores más cortos que se diseñaron siguiendo los criterios de diseño de PCR establecidos podrían formar dímeros que tenían altas temperaturas de fusión y, por lo tanto, forman dímeros de manera eficiente en condiciones normales de PCR, mientras que los cebadores más largos y de Tm baja podrían formar dímeros a una Tm realmente baja y, por lo tanto, no serían estables para la formación de dímeros, lo que permite una mayor participación de los cebadores más largos y de Tm baja en condiciones normales de amplificación en comparación con los cebadores cortos de Tm alta (por ejemplo, 18-22 nucleótidos, Tm de 60 °C, 50 % de contenido de G c ) .
Los cebadores más largos, de baja Tm y ricos en AT para la amplificación de STR se multiplexaron luego con los cebadores más cortos de alta Tm diseñados de modo convencional que se dirigían a los SNP. Sin embargo, las reacciones de amplificación múltiplex una vez más no tuvieron éxito en proporcionar una amplificación equilibrada de STR y SNP en una reacción múltiplex. Se contempló que quizás la aplicación del diseño de cebador no convencional para amplificar dianas no problemáticas, por ejemplo, para amplificar las dianas SNP, podría producir amplificaciones múltiplex exitosas. Como tal, los mismos criterios utilizados para diseñar cebadores no óptimos para STR se aplicaron al diseño de cebadores para SNP (largos, Tm baja, ricos en AT). Sorprendentemente, los nuevos cebadores diseñados dieron como resultado un mejor equilibrio entre la amplificación de STR y SNP en una reacción múltiplex.
La figura 4 muestra ejemplos de la interacción entre los cebadores de diseño convencional y no convencional en una reacción múltiplex. En la figura 4A, una reacción múltiplex de 10 SNP diana muestra una amplificación esperada en el intervalo deseado de aproximadamente 200-350 pb para el banco. Los cebadores utilizados para amplificar los 10 SNP en el múltiplex se diseñaron para ser más largos, tener una Tm más baja y ser más ricos en AT, tal como lo aconsejan los criterios de diseño de cebadores de PCR establecidos. Cuando se diseña un 11° pareja de cebadores utilizando los criterios de diseño de PCR establecidos, es decir, los cebadores son cortos, tienen Tm alta y no son ricos en AT, y sumados a los 10 pares, el múltiplex resultante muestra una amplificación no específica del ADN diana. Como se ve en la figura 4B y 4D, la adición de un 11° pareja de cebadores diseñado convencionalmente interfiere con el 10-plex de parejas de cebadores no convencionales y da como resultado una amplificación múltiplex infructuosa de los SNP diana. Sin embargo, la adición de un 11° pareja de cebadores que también se diseña de manera no convencional siguiendo los mismos criterios que el 10-plex de parejas de cebadores da como resultado la amplificación exitosa de las dianas de SNP (figura 4C).
Por consiguiente, cada uno de la pluralidad de cebadores tiene una temperatura de fusión baja de menos de 60 °C y tiene una longitud de al menos 24 nucleótidos, por ejemplo, de 24 nucleótidos a aproximadamente 38 nucleótidos. En algunas realizaciones, cada uno de la pluralidad de cebadores comprende una secuencia de nucleótidos de homopolímero.
En algunos ejemplos, los cebadores diseñados de manera no convencional comprenden secuencias que flanquean los STR y SNP diana y secuencias adicionales sin molde. Las secuencias adicionales pueden ser, por ejemplo, secuencias de marcador que sirven para un propósito durante la preparación de bancos o metodologías de secuenciación. Por ejemplo, una secuencia de marcador puede ser una secuencia de captura, tal como un resto hapteno que puede ser capturado por un resto compañero inmovilizado para purificar fragmentos de banco. Un ejemplo de un resto hapteno es la biotina que puede ser capturada por estreptavidina para fragmentos de banco aislados de componentes de reacción y similares. Una secuencia de marcador también podría ser una secuencia de amplificación, por ejemplo, que sea complementaria a un cebador de amplificación y se use en una o más reacciones de amplificación. Las figuras 2 y 3 muestran ejemplos de secuencias de marcador que se utilizan en una segunda ronda de amplificación después de una primera ronda de amplificación. Una secuencia de marcador también podría ser un marcador de secuencia. Las figuras 2 y 3 también muestran ejemplos de marcadores de secuencia, el adaptador i5 y el adaptador i7 que se utilizan en la secuenciación como cebadores de hibridación, de generación de agrupaciones y de secuenciación durante las reacciones de secuencia por síntesis como se describe en el presente documento. Otro ejemplo de una secuencia de marcador es un identificador molecular exclusivo, o UMI, como se muestra en la figura 3.
Un UMI comprende un tramo aleatorio de nucleótidos que se puede usar durante la secuenciación para corregir errores de secuenciación y PCR, agregando así una capa adicional de corrección de errores a los resultados de secuenciación. Los UMI pueden tener una longitud, por ejemplo, de 3-10 nucleótidos, aunque el número dependerá de la cantidad de ADN de entrada. Por ejemplo, si se utiliza 1 ng de ADN para dirigirse a aproximadamente 250 sitios, se prevé que se necesitarían aproximadamente 350 copias x 250 dianas, por lo que serían aproximadamente 90.000 UMI diferentes. Si se utiliza más ADN, por ejemplo, 10 ng, se podrían necesitar aproximadamente 1 millón de UMI diferentes. Todas las réplicas de PCR de la misma reacción de PCR tendrían la misma secuencia de UMI, por lo que las réplicas se pueden comparar y cualquier error en la secuencia, tales como sustituciones, deleciones, inserciones de una sola base (es decir, tartamudeo en PCR), puede excluirse bioinformáticamente de los resultados de la secuenciación. Los identificadores moleculares exclusivo también se pueden utilizar en el análisis de una muestra mixta. Las muestras mixtas, por ejemplo, una muestra de ADN femenino que está contaminada con ADN masculino, se pueden desconvolucionar para indicar las contribuciones de ADN femenino y masculino utilizando secuencias UMI. Por ejemplo, podría haber un total de cuatro números repetidos diferentes para dos ADN mixtos; sin embargo, podría haber menos de cuatro si la mezcla de dos muestras comparte alelos en un locus particular. Estos alelos compartidos se pueden distinguir y se pueden determinar sus porcentajes aproximados utilizando las UMI para determinar el número de alelos diferentes en la población inicial de moléculas de ADN. Por ejemplo, las moléculas iniciales podrían contarse y si un contribuyente menor estuviera presente, por ejemplo, al 5 %, entonces 5 % de los UMI identificaría un genotipo y el 95 % identificaría un segundo genotipo. Después de la PCR, si uno de los alelos (o quizás más) estuviera sesgado tras la amplificación, no se observaría esa proporción de 5:95. Sin embargo, utilizando UMI, podría corregirse una proporción sesgada después de condensar las réplicas de PCR mediante detección y corrección de UMI. Esto es importante cuando se trata de diferenciar un artefacto de tartamudeo de la PCR y un verdadero contribuyente menor.
Un cebador de los presentes métodos puede comprender una o más secuencias de marcador. Las secuencias de marcador pueden ser una o más de las secuencias de cebadores que no son homólogas con la secuencia diana, pero, por ejemplo, pueden usarse como moldes para una o más reacciones de amplificación. La secuencia de marcador puede ser una secuencia de captura, por ejemplo, una secuencia de hapteno, tal como biotina, que puede usarse para purificar amplicones de los componentes de la reacción. Las secuencias de marcador pueden ser secuencias, tales como secuencias de adaptador, que son ventajosas para capturar los amplicones del banco sobre un sustrato, por ejemplo, para la amplificación en puente en anticipación de las tecnologías de secuencia como se describe en este documento. Además, las secuencias de marcador pueden ser marcadores de identificación molecular exclusivos típicamente de entre, por ejemplo, 3-10 nucleótidos que comprenden un tramo aleatorio de nucleótidos que se pueden usar para la corrección de errores durante la preparación del banco y/o los métodos de secuenciación.
Además, es ventajoso que una reacción de PCR multiplexada contenga cebadores oligonucleotídicos para sustancialmente todas las dianas reunidas en una mezcla. Sin embargo, como se describe en el presente documento, los oligonucleótidos son inusualmente más largos que los cebadores diseñados usando parámetros tradicionales. La adición adicional de secuencias de marcador a los cebadores, tal como la adición de UMI, que agregan una secuencia específica de un gen diana, crea secuencias de cebadores aún más largas. En algunas realizaciones, se puede añadir glicina betaína (aproximadamente 1,5 M) a la pluralidad de cebadores. Por ejemplo, en algunas realizaciones, los tampones de amplificación usados en reacciones de amplificación con cebadores no convencionales, como se describe en este documento, comprenden una concentración de betaína que es, que es aproximadamente o que es mayor que 100 mM, 200 mM, 300 mM, 400 mM, 500 mM, 600 mM, 700 mM, 800 mM, 900 mM, 1 M, 1,2 M, 1,3 M, 1,4 M, 1,5 M, 1,6 M, 1,7 M, 1,8 M, 1,9 M, 2 M, 3 M, 4 M, 5 M, 6 M, 7 M, 8 M, 9 M, 10 M o un intervalo entre dos de estos valores, por ejemplo, de 500 mM a 2 M, de 1 M a 1,5 M, etc. Como tal, una mezcla de cebadores como se describe en el presente documento suplementada con betaína, por ejemplo, a aproximadamente 1,5 M, sería ventajosa cuando se practican los métodos de la presente descripción. En algunas realizaciones, se puede añadir glicerol a la pluralidad de cebadores. Por ejemplo, en algunas realizaciones, los tampones de amplificación utilizados en reacciones de amplificación con cebadores no convencionales, como se describe en el presente documento, comprenden una concentración de glicerol que es, que es aproximadamente o que es mayor que 100 mM, 200 mM, 300 mM, 400 mM, 500 mM, 600 mM, 700 mM, 800 mM, 900 mM, 1 M, 1,2 M, 1,3 M, 1,4 M, 1,5 M, 1,6 M, 1,7 M, 1,8 M, 1,9 M, 2 M, 3 M, 4 M, 5 M, 6 M, 7 M, 8 M, 9 M, 10 M o un intervalo entre dos de estos valores, por ejemplo, de 500 mM a 2 M, de 1 M a 1,5 M, etc. Como tal, una mezcla de cebadores como se describe en el presente documento suplementada con glicerol, por ejemplo, a aproximadamente 1,5 M, sería ventajosa cuando se practican los métodos de la presente descripción.
En algunas realizaciones, también se pueden modificar los tampones asociados con un diseño de cebadores no convencional usado en los métodos de amplificación de la presente descripción. Por ejemplo, en algunas realizaciones, las concentraciones de sales, tales como KCl, LiCl, NaCl o una combinación de las mismas, del tampón de amplificación aumentan en comparación con la concentración de sales de un tampón de amplificación usado junto con cebadores diseñados de modo convencional. En algunas realizaciones, los tampones de amplificación usados en reacciones de amplificación con cebadores no convencionales como se describe en este documento comprenden una concentración de KCl que es, que es aproximadamente o que es mayor que 60 mM, 70 mM, 80 mM, 90 mM, 100 mM, 110 mM, 120 mM, 130 mM, 140 mM, 150 mM, 160 mM, 170 mM, 180 mM, 190 mM, 200 mM, 250 mM, 300 mM, 400 mM, 500 mM o un intervalo entre dos de estos valores, por ejemplo, de 60 mM a 200 mM, de 100 mM a 250 mM, etc. En algunas realizaciones, los tampones de amplificación usados en reacciones de amplificación con cebadores no convencionales como se describe en el presente documento comprenden una concentración de KCl que es aproximadamente 145 mM. En algunas realizaciones, los tampones de amplificación usados en reacciones de amplificación con cebadores no convencionales como se describe en este documento comprenden una concentración de LiCl que es, que es aproximadamente o que es mayor que 60 mM, 70 mM, 80 mM, 90 mM, 100 mM, 110 mM, 120 mM, 130 mM, 140 mM, 150 mM, 160 mM, 170 mM, 180 mM, 190 mM, 200 mM, 250 mM, 300 mM, 400 mM, 500 mM o un intervalo entre dos de estos valores, por ejemplo, de 60 mM a 200 mM, de 100 mM a 250 mM, etc. En algunas realizaciones, los tampones de amplificación usados en reacciones de amplificación con cebadores no convencionales, como se describe en el presente documento, comprenden una concentración de LiCl que es aproximadamente 145 mM. En algunas realizaciones, los tampones de amplificación usados en reacciones de amplificación con cebadores no convencionales como se describe en este documento comprenden una concentración de NaCl que es, que es aproximadamente o que es mayor que 60 mM, 70 mM, 80 mM, 90 mM, 100 mM, 110 mM, 120 mM, 130 mM, 140 mM, 150 mM, 160 mM, 170 mM, 180 mM, 190 mM, 200 mM, 250 mM, 300 mM, 400 mM, 500 mM o un intervalo entre dos de estos valores, por ejemplo, de 60 mM a 200 mM, de 100 mM a 250 mM, etc. En algunas realizaciones, los tampones de amplificación usados en reacciones de amplificación con cebadores no convencionales como se describe en el presente documento comprenden una concentración de NaCl que es aproximadamente 145 mM.
En algunas realizaciones, los tampones de amplificación usados en reacciones de amplificación con cebadores no convencionales como se describe en este documento pueden comprender MgSO4, MgCl2 , o una combinación de los mismos.
Kits
Las realizaciones descritas en el presente documento proporcionan kits que comprenden al menos un medio de recipiente, en el que dicho al menos un medio de recipiente comprende una pluralidad de cebadores como se describe en el presente documento. En algunas realizaciones, el medio de recipiente puede ser un tubo, un pocillo, una placa de microtitulación, etc. En algunas realizaciones, la pluralidad de cebadores puede hibridarse específicamente con una serie de secuencias repetidas en tándem que es, que es aproximadamente o que es mayor que 4 , 6 , 8, 10, 12, 14, 16, 18, 24, 30, 40, 50, 60, 70, 80, 90, 100 o un intervalo entre cualquiera de los dos valores, como 4 a 12, 10 a 24, 30 a 100, etc. En algunas realizaciones, la pluralidad de cebadores puede hibridarse específicamente con al menos 24 secuencias repetidas en tándem. En algunas realizaciones, la pluralidad de cebadores puede hibridarse específicamente con al menos 60 secuencias repetidas en tándem. Los métodos y las composiciones descritos en este documento pueden usarse para amplificar múltiples secuencias diana SNP en una sola reacción. Por ejemplo, la pluralidad de cebadores puede hibridarse específicamente con una serie de secuencias SNP que es, que es aproximadamente o que es mayor que 4, 6, 8, 10, 12, 14, 16, 18, 24, 30, 40, 50, 60, 70, 80, 90, 100 o un intervalo entre cualquiera de los dos valores, como 4 a 12, 10 a 24, 30 a 100, etc. En algunas realizaciones, la pluralidad de cebadores puede hibridarse específicamente con al menos 30 secuencias SNP. En algunas realizaciones, la pluralidad de cebadores puede hibridar específicamente con al menos 50 secuencias SNP.
En algunas realizaciones, dicho al menos un medio de recipiente comprende un tampón de amplificación. En algunas realizaciones, también se pueden modificar los tampones asociados con un diseño de cebador no convencional usado en los métodos de amplificación de la presente descripción. Por ejemplo, en algunas realizaciones, las concentraciones de sales, tales como KCl, LiCl, NaCl o una combinación de las mismas, del tampón de amplificación aumentan en comparación con la concentración de sales de un tampón de amplificación usado junto con cebadores diseñados de modo convencional. En algunas realizaciones, los tampones de amplificación usados en reacciones de amplificación con cebadores no convencionales como se describe en este documento comprenden una concentración de KCl, NaCl o LiCl que es, que es aproximadamente o que es mayor que 60 mM, 70 mM, 80 mM, 90 mM, 100 mM, 110 mM, 120 mM, 130 mM, 140 mM, 150 mM, 160 mM, 170 mM, 180 mM, 190 mM, 200 mM, 250 mM, 300 mM, 400 mM, 500 mM o un intervalo entre dos de estos valores , por ejemplo, de 60 mM a 200 mM, de 100 mM a 250 mM, etc. En algunas realizaciones, los tampones de amplificación usados en reacciones de amplificación con cebadores no convencionales como se describe aquí comprenden una concentración de KCl, NaCl o LiCl que es aproximadamente 145 mM.
En algunas realizaciones, los tampones de amplificación usados en reacciones de amplificación con cebadores no convencionales como se describe en este documento pueden comprender MgSO4, MgCl2 , o una combinación de los mismos.
Métodos de secuenciación
Los presentes métodos no se limitan a ninguna plataforma de secuenciación particular, sin embargo, se ejemplifican aquí con respecto a SBS, o secuencia por síntesis, un tipo de secuenciación paralela. Las técnicas particularmente aplicables son aquellas en las que los ácidos nucleicos se unen en ubicaciones fijas en una matriz de modo que sus posiciones relativas no cambien y en las que se forman imágenes repetidamente de la matriz. Son particularmente aplicables los ejemplos en los que se obtienen imágenes en diferentes canales de color, por ejemplo, coincidiendo con diferentes marcadores utilizados para distinguir un tipo de base de nucleótidos de otro.
Las técnicas de SBS generalmente implican la extensión enzimática de una hebra de ácido nucleico naciente mediante la adición iterativa de nucleótidos contra una cadena de molde. En los métodos tradicionales de SBS, se puede proporcionar un monómero de un solo nucleótido a un nucleótido diana en presencia de una polimerasa en cada suministro. Sin embargo, en los métodos descritos en el presente documento, se puede proporcionar más de un tipo de monómero nucleotídico a un ácido nucleico diana en presencia de una polimerasa en un suministro.
Las técnicas de SBS pueden utilizar monómeros de nucleótidos que tienen un resto marcador o que carecen de un resto marcador. Por consiguiente, los acontecimientos de incorporación pueden detectarse basándose en una característica del marcador, como la fluorescencia del marcador; una característica del monómero de nucleótido, como el peso molecular o la carga; un subproducto de la incorporación del nucleótido, como la liberación de pirofosfato; o similar. En algunos ejemplos en los que dos o más nucleótidos diferentes están presentes en un reactivo de secuenciación, los diferentes nucleótidos pueden distinguirse entre sí o, como alternativa, los dos o más marcadores diferentes pueden ser indistinguibles según las técnicas de detección que se utilizan. Por ejemplo, los diferentes nucleótidos presentes en un reactivo de secuenciación pueden tener diferentes marcadores y se pueden distinguir usando ópticas apropiadas como se ejemplifica mediante los métodos de secuenciación desarrollados por Solexa (ahora Illumina, Inc.).
Algunos ejemplos incluyen técnicas de pirosecuenciación. La pirosecuenciación detecta la liberación de pirofosfato inorgánico (PPi) a medida que se incorporan nucleótidos particulares en la hebra naciente (Ronaghi, M., Karamohamed, S., Pettersson, B., Uhlen, M. y Nyren, P. (1996), "Real-time DNA sequencing using detection of pyrophosphate release ", Analytical Biochemistry, 242 (1), 84-9; Ronaghi, M. (2001), "Pyrosequencing sheds light on DNA sequencing ", Genome Res., 11 (1), 3-11; Ronaghi, M., Uhlen, M. y Nyren, P. (1998), "A sequencing method based on real-time pyrophosphate ", Science, 281 (5375), 363; patente de EE. UU. n.° 6.210.891; patente de EE. UU. n.° 6.258.568 y patente de EE. UU. n.° 6.274.320). En la pirosecuenciación, el PPi liberado puede detectarse por ser inmediatamente convertido en adenosina trifosfato (ATP) por la ATP sulfurilasa, y el nivel de ATP generado se detecta mediante fotones producidos por luciferasa. Los ácidos nucleicos que se van a secuenciar se pueden unir a características en una matriz y se pueden formar imágenes de la matriz para capturar las señales quimioluminiscentes que se producen debido a la incorporación de nucleótidos en las características de la matriz. Se puede obtener una imagen después de que la matriz se trate con un tipo de nucleótido particular (por ejemplo, A, T, C o G). Las imágenes obtenidas después de la adición de cada tipo de nucleótido diferirán con respecto a las características de la matriz que se detecten. Estas diferencias en la imagen reflejan el contenido de secuencia diferente de las características en la matriz. Sin embargo, las ubicaciones relativas de cada característica permanecerán sin cambios en las imágenes. Las imágenes pueden almacenarse, procesarse y analizarse utilizando los métodos establecidos en este documento. Por ejemplo, las imágenes obtenidas después del tratamiento de la matriz con cada tipo de nucleótido diferente se pueden manipularse de la misma manera que se ejemplifica en el presente documento para imágenes obtenidas de diferentes canales de detección para métodos de secuenciación basados en terminadores reversibles.
En otro ejemplo de SBS, la secuenciación del ciclo se logra mediante la adición discontinua de nucleótidos terminadores reversibles que contienen, por ejemplo, un marcador de colorante escindible o fotoblanqueable como se describe, por ejemplo, en el documento WO 04/018497 y la patente de EE. UU. n.° 7.057.026. Esta estrategia está siendo comercializado por Solexa (ahora Illumina Inc.), y también se describe en los documentos WO 91/06678 y WO 07/123,744. La disponibilidad de terminadores marcados con fluorescencia en los que la terminación puede revertirse y el marcador fluorescente puede escindirse facilita la secuenciación de terminación cíclica reversible (CRT) eficiente. Las polimerasas también pueden diseñarse conjuntamente para incorporar y extenderse eficazmente a partir de estos nucleótidos modificados. Se describen ejemplos de sistemas y métodos de SBS adicionales que se pueden utilizar con los métodos y sistemas descritos en este documento en la publicación de solicitud de patente de EE. UU. n.° 2007/0166705, la publicación de solicitud de patente de EE. UU. n.° 2006/0188901, la publicación de solicitud de patente de EE. UU. n.° 7.057.026, la publicación de solicitud de patente de EE. UU. n.° 2006/0240439, la publicación de solicitud de patente de EE. UU. n.° 2006/0281109, la publicación PCT n.° WO 05/065814, la publicación de solicitud de patente de EE. UU. n.° 2005/0100900, la publicación PCT n.° WO 06/064199, la publicación PCT n.° WO 07/010.251, la publicación de solicitud de patente de EE. UU. n.° 2012/0270305 y la publicación de solicitud de patente de EE. UU. n.22013/0260372.
Algunos ejemplos pueden utilizar la detección de cuatro nucleótidos diferentes usando menos de cuatro marcadores diferentes. Por ejemplo, la SBS se puede realizar utilizando métodos y sistemas descritos en los materiales incorporados de la publicación de solicitud de patente de EE. UU. n.° 2013/0079232. Como primer ejemplo, se puede detectar un par de tipos de nucleótidos en la misma longitud de onda, pero distinguirlos en función de la diferencia de intensidad de un miembro del par en comparación con el otro, o en función de un cambio en un miembro del par (por ejemplo, mediante modificación química, modificación fotoquímica o modificación física) que hace que la señal aparente aparezca o desaparezca en comparación con la señal detectada para el otro miembro del par. Como segundo ejemplo, se pueden detectar tres de cuatro tipos de nucleótidos diferentes en condiciones particulares, mientras que un cuarto tipo de nucleótidos carece de un marcador que sea detectable en esas condiciones, o se detecta mínimamente en esas condiciones (por ejemplo, una detección mínima debido a la fluorescencia de fondo, etc.). La incorporación de los primeros tres tipos de nucleótidos en un ácido nucleico se puede determinar basándose en la presencia de sus respectivas señales, y la incorporación del cuarto tipo de nucleótido en el ácido nucleico se puede determinar basándose en la ausencia o la detección mínima de cualquier señal. Como tercer ejemplo, un tipo de nucleótido puede incluir uno o más marcadores que se detectan en dos canales diferentes, mientras que otros tipos de nucleótidos se detectan en no más de uno de los canales. Los tres ejemplos de configuraciones mencionados anteriormente no se consideran mutuamente excluyentes y pueden usarse en varias combinaciones. Un ejemplo de realización que combina los tres ejemplos es un método SBS basado en fluorescencia que usa un primer tipo de nucleótido que se detecta en un primer canal (por ejemplo, dATP que contiene un marcador que se detecta en el primer canal cuando se excita con una primera longitud de onda de excitación), un segundo tipo de nucleótido que se detecta en un segundo canal (por ejemplo, dCTP que tiene un marcador que se detecta en el segundo canal cuando es excitado por una segunda longitud de onda de excitación), un tercer tipo de nucleótido que se detecta en el primer y el segundo canal ( por ejemplo, dTTP que tiene al menos un marcador que se detecta en ambos canales cuando se excita con la primera y/o segunda longitud de onda de excitación) y un cuarto tipo de nucleótido que carece de un marcador que no se detecta en ninguno de los canales o se detecta mínimamente (por ejemplo, dGTP que no tiene marcador).
Además, como se describe en la publicación de solicitud de patente de EE. UU. n.° 2013/0079232, los datos de secuenciación se pueden obtener utilizando un solo canal. En las llamadas estrategias de secuenciación de un colorante, el primer tipo de nucleótido se marca, pero el marcador se elimina después de que se genere la primera imagen, y el segundo tipo de nucleótido se marca solo después de que se genere una primera imagen. El tercer tipo de nucleótido conserva su marcador tanto en la primera como en la segunda imagen, y el cuarto tipo de nucleótido permanece sin marcar en ambas imágenes.
Algunos ejemplos pueden utilizar la secuenciación mediante técnicas de acoplamiento. Tales técnicas utilizan ADN ligasa para incorporar oligonucleótidos e identificar la incorporación de tales oligonucleótidos. Los oligonucleótidos tienen típicamente diferentes marcadores que se correlacionan con la identidad de un nucleótido particular en una secuencia con la que se hibridan los oligonucleótidos. Al igual que con otros métodos de SBS, se pueden obtener imágenes tras el tratamiento de una matriz de características de ácidos nucleicos con los reactivos de secuenciación marcados. Cada imagen mostrará características de ácidos nucleicos que han incorporado marcadores de un tipo particular. Diferentes características estarán presentes o ausentes en las diferentes imágenes debido al contenido de secuencia diferente de cada característica, pero la posición relativa de las características permanecerá sin cambios en las imágenes. Las imágenes obtenidas a partir de métodos de secuenciación basados en el acoplamiento se pueden almacenar, procesar y analizar como se establece en este documento. Se describen ejemplos de sistemas y métodos de SBS que se pueden utilizar con los métodos y sistemas descritos en este documento en la patente de EE. UU. n.° 6.969.488, la patente de EE. UU. n.° 6.172.218, y la patente de EE. UU. n.° 6.306.597.
Algunos ejemplos pueden utilizar la secuenciación de nanoporos (Deamer, D. W. y Akeson, M., "Nanopores and nucleic acids: prospects for ultrarapid sequencing", Trends Biotechnol., 18, 147-151 (2000); Deamer, D. y D. Branton, "Characterization of individual polynucleotide molecules using a membrane channel", Acc. Chem. Res., 35: 817-825 (2002)); Li, J., M. Gershow, D. Stein, E. Brandin y J. A. Golovchenko, "DNA molecules and configurations in a solidstate nanopore microscope", Nat. Mater., 2: 611-615 (2003))). En tales realizaciones, el ácido nucleico diana pasa a través de un nanoporo. El nanoporo puede ser un poro sintético o una proteína de membrana biológica, como la a-hemolisina. A medida que el ácido nucleico diana pasa a través del nanoporo, cada par de bases se puede identificar midiendo las fluctuaciones en la conductancia eléctrica del poro (patente de EE. UU. n.° 7.001.792; Soni, G. V. y Meller, "Progress toward ultrafast DNA sequencing using solid-state nanopores", Clin. Chem., 53, 1996-2001 (2007); Healy, K., "Nanopore-based single-molecule DNA analysis", Nanomed., 2, 459 a 481 (2007); Cockroft, S. L., Chu, J., Amorin, M. y Ghadiri, M. R., "A single-molecule nanopore device detects DNA polymerase activity with singlenucleotide resolution", J. Am. Chem. Soc. ,130, 818-820 (2008)). Los datos obtenidos de la secuenciación de nanoporos se pueden almacenar, procesar y analizar como se establece en este documento. En particular, los datos pueden tratarse como una imagen de acuerdo con el ejemplo de tratamiento de imágenes ópticas y otras imágenes que se expone en este documento.
Algunos ejemplos pueden utilizar métodos que implican el seguimiento en tiempo real de la actividad de la ADN polimerasa. Las incorporaciones de nucleótidos se pueden detectar mediante interacciones de transferencia de energía por resonancia de fluorescencia (FRET) entre una polimerasa que porta un fluoróforo y nucleótidos marcados con Y-fosfato como se describe, por ejemplo, en la patente de EE. UU. n.° 7.329.492 y la patente de EE. UU. n.° 7.211.414, o pueden detectarse incorporaciones de nucleótidos con guías de onda de modo cero como se describe, por ejemplo, en la patente de EE. UU. n.° 7.315.019 y usando análogos de nucleótidos fluorescentes y polimerasas modificadas como se describe, por ejemplo, en la patente de EE. UU. n.° 7.405.281 y la publicación de solicitud de patente de EE. UU. n.° 2008/0108082. La iluminación se puede restringir a un volumen de escala de zeptolitros alrededor de una polimerasa unida a la superficie de modo que se pueda observar la incorporación de nucleótidos marcados con fluorescencia con un fondo bajo (Levene, M. J. et al., "Zero-mode waveguides for single-molecule analysis at high concentrations", Science, 299, 682-686 (2003); Lundquist, P. M. et al., "Parallel confocal detection of single molecules in real time", Opt. Ltt., 33, 1026-1028 (2008); Korlach, J. et al., "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nanostructures", Proc. Natl. Acad. Sci. U.S.A., 105, 1176-1181 (2008)). Las imágenes obtenidas de dichos métodos pueden almacenarse, procesarse y analizarse como se establece en este documento.
Algunas realizaciones de SBS incluyen la detección de un protón liberado tras la incorporación de un nucleótido en un producto de extensión. Por ejemplo, la secuenciación basada en la detección de protones liberados puede utilizar un detector eléctrico y técnicas asociadas que están disponibles comercialmente en Ion Torrent (Guilford, CT, una subdivisión de Life Technologies) o métodos y sistemas de secuenciación descritos en los documentos US 2009/0026082 A1; US 2009/0127589 A1; US 2010/0137143 A1; o US 2010/0282617 A1. Los métodos aquí expuestos para amplificar ácidos nucleicos diana usando la exclusión cinética pueden aplicarse fácilmente a sustratos usados para detectar protones. Más específicamente, los métodos establecidos en el presente documento pueden usarse para producir poblaciones clonales de amplicones que se usan para detectar protones.
Los métodos de SBS anteriores se pueden llevar a cabo ventajosamente en formatos múltiplex de modo que se manipulen simultáneamente múltiples ácidos nucleicos diana diferentes. En realizaciones particulares, se pueden tratar diferentes ácidos nucleicos diana en un recipiente de reacción común o sobre una superficie de un sustrato particular. Esto permite la administración conveniente de reactivos de secuenciación, la eliminación de reactivos que no han reaccionado y la detección de acontecimientos de incorporación de una manera múltiplex. En realizaciones que usan ácidos nucleicos diana unidos a una superficie, los ácidos nucleicos diana pueden estar en un formato de matriz. En un formato de matriz, los ácidos nucleicos diana se pueden unir típicamente a una superficie de una manera espacialmente distinguible. Los ácidos nucleicos diana pueden unirse mediante unión covalente directa, unión a una esfera u otra partícula, o unión a una polimerasa u otra molécula que esté unida a la superficie. La matriz puede incluir una única copia de un ácido nucleico diana en cada sitio (también denominado característica) o pueden estar presentes múltiples copias que tienen la misma secuencia en cada sitio o característica. Pueden producirse múltiples copias mediante métodos de amplificación tales como amplificación en puente o PCR en emulsión como se describe con más detalle a continuación.
Los métodos de la presente descripción utilizan la tecnología de Illumina, Inc. para secuenciar los bancos de perfiles de ADN creados mediante la práctica de los métodos descritos en este documento. El instrumento de secuenciación MiSeq se utilizó para agrupar y secuenciar los ejemplos descritos en este documento. Sin embargo, como se indicó anteriormente y como entenderán los expertos en la técnica, los presentes métodos no están limitados por el tipo de plataforma de secuenciación utilizada.
Ejemplos
Los siguientes ejemplos describen varios métodos y materiales para la elaboración de perfiles de ADN. Estos métodos y materiales pueden modificarse manteniendo el alcance de la invención. Tales modificaciones resultarán evidentes para los expertos en la técnica a partir de la consideración de esta descripción o la práctica de los métodos aquí descritos. En consecuencia, no se pretende que estos métodos o materiales se limiten a los ejemplos específicos descritos en este documento, sino que cubran todas las modificaciones y alternativas que caen dentro del alcance de las reivindicaciones.
Ejemplo 1: Diseño de cebadores no convencional
El programa de diseño informático DesignStudio de Illumina, Inc. (San Diego, CA) fue modificado y utilizado para el diseño de cebadores. Los expertos en la técnica comprenderán, por supuesto, que también se pueden usar programas de diseño de cebadores alternativos, como Primer3, y que los parámetros predeterminados se restablecen para imitar la intención de los parámetros modificados para el diseño de cebadores. La configuración generalmente se restablece en el archivo config.xml que se incluye en el software; sin embargo, esto puede diferir cuando se usa un software diferente y es una práctica común consultar los materiales específicos para acceder a los parámetros predeterminados de cada software. Los siguientes parámetros se pueden restablecer en el software de diseño de cebadores:
1) El amplicón de longitud mínima deseada se restablece a >60<
2) El amplicón de longitud máxima deseada se restablece a >120<
3) El espaciado de candidatos ajustado se restablece a >3< (el valor predeterminado es 30 pb)
4) El porcentaje máximo en GC de la sonda se restablece a >60< para permitir un mayor número de tramos repetidos ricos en AT
5) La Tm promedio se restablece a >57< (59 °C predeterminado) para reducir la Tm promedio
6) La Tm máxima se restablece a >60< (predeterminada 71)
7) La Tm mínima se restablece a >51< (predeterminado 55)
8) La longitud promedio de la sonda se restablece a >28< (predeterminado 27)
9) La longitud máxima de la sonda se restablece a >38< (predeterminado 30)
10) La longitud mínima de la sonda se restablece a >25< (por defecto 22)
Para diseñar los cebadores de SNP, el intervalo para dirigirse al extremo 3' del cebador se estableció en "pequeño" para mantener los cebadores a aproximadamente 1 pb de distancia para el SNP diana. Una vez que se restablecen todos los parámetros, el programa de diseño de cebadores se puede ejecutar en la secuencia para determinar el pareja de cebadores candidatos que se encuentran dentro de los nuevos parámetros. Por ejemplo, un usuario del software puede generar una lista de dianas que indica al software dónde buscar en el genoma para diseñar los cebadores. En el presente ejemplo, las regiones diana se copiaron y pegaron en la aplicación de interfaz gráfica de usuario que usa el software DesignStudio para orientar y dirigirse al diseño del cebador. Una vez que las regiones diana se ingresan en el programa, el programa se dirige al archivo de creación de un diseño para iniciar la herramienta y crear los diseños de cebadores. En el presente ejemplo, la salida principal es un archivo .txt que incluye las secuencias de cebadores y/o algunas de las regiones que contienen fallos y son "indeseables", y en este momento las secuencias objetivo deben redefinirse y volver a ejecutarse. El software utilizado en este experimento proporcionó los cebadores diseñados que se cartografiaron sobre la secuencia que se especificó como la región diana. Siguiendo los parámetros de restablecimiento, se diseñaron cebadores que no siguieron los criterios convencionales para el diseño de cebadores para la amplificación; sin embargo, estos permitieron la amplificación múltiplex de STR largos y SNP cortos.
Los ejemplos de cebadores dirigidos a STR diseñados ventajosos en los métodos descritos en este documento incluyen los enumerados en la tabla 1. Los ejemplos de cebadores dirigidos a SNP ventajosos en los métodos descritos aquí incluyen los enumerados en la tabla 2.
Tabla 1- Cebadores dirigidos a STR sin marcadores y tamaños de amplicón
Figure imgf000018_0001
Figure imgf000019_0001
Figure imgf000020_0001
Figure imgf000021_0001
Tabla 2 - Cebadores dirigidos a SNP
Figure imgf000021_0002
Figure imgf000022_0001
Figure imgf000023_0001
Figure imgf000024_0001
Figure imgf000025_0001
Figure imgf000026_0001
Figure imgf000027_0001
Figure imgf000028_0001
Ejemplo 2: Elaboración de perfiles de ADN para un banco de datos
Este ejemplo describe un experimento que sigue el flujo de trabajo de la figura 2. Este ejemplo no utiliza UMI, ya que se considera que las muestras obtenidas son de individuos cuya identidad ya se conoce.
Para este experimento, las STR se multiplexan con iSNP como se muestra en la tabla 3.
Tabla 3 - SNP y STR informativos de identidad
Figure imgf000028_0002
Figure imgf000028_0003
Figure imgf000029_0002
Figure imgf000029_0004
Figure imgf000029_0001
Figure imgf000029_0003
Por supuesto, se podrían agregar SNP y STR adicionales a la lista anterior. Los ejemplos de otras dianas posibles incluyen, entre otros, los marcadores que se encuentran en la tabla 4.
Tabla 4 - Ejemplos de STR y SNP adicionales para la multiplexación
Figure imgf000029_0005
Figure imgf000029_0006
Figure imgf000030_0002
Figure imgf000030_0001
Los cebadores se diseñaron para contener una secuencia de cebador de PCR específica de gen en el extremo 3' y una secuencia de marcador adaptador en el extremo 5'. En este experimento, los cebadores directos contienen la secuencia de marcador para los adaptadores TruSeq Custom Amplicon i5 y los cebadores inversos contienen la secuencia de marcador para los adaptadores TruSeq Small RNA kit i7. Los marcadores se pueden usar como sitios de cebadores de amplificación, así como sitios de cebadores de secuenciación.
Figure imgf000030_0003
Para equilibrar la amplificación entre los STR y los SNP en el múltiplex, se modificaron los parámetros de diseño de cebadores para los SNP como se describe en el ejemplo 1. El conjunto original de cebadores de SNP diseñados con Design Studio de Illumina eran cebadores de PCR clásicos: secuencias cortas con altas temperaturas de fusión. y poca o ninguna estructura secundaria. Design Studio se utilizó para diseñar las sondas de amplicón personalizadas TruSeq y para crear el complemento inverso de la sonda cadena abajo para preparar el cebador de PCR inverso. Sin embargo, estos cebadores no se multiplexaron bien y un cebador malo podía convertir el ensayo de bueno a malo (por ejemplo, todo dímeros de cebadores y ningún producto) (figura 4). En un intento por crear mejores cebadores para multiplexar, se usó Primer3 (shareware) que contiene una función de banco de cebado incorrecto. Se descubrió que los cebadores diseñados con Primer3 funcionaron incluso peor en el ensayo múltiplex que los cebadores de Design Studio. Sorprendentemente, se estaban generando datos que mostraban que los cebadores de STR se multiplexaban bien. Se observó que los parejas de cebadores mal diseñados dirigidos a dianas STR no causaron fallos de multiplexación, como sí lo hicieron los cebadores de SNP. Los cebadores de STR son largos, ricos en AT y tienen bajas temperaturas de fusión, al contrario de lo que se conoce como un cebador "bueno".
Los cebadores de SNP se rediseñaron siguiendo los parámetros del ejemplo 1. Los cebadores se mezclaron para todas las dianas. Para este ejemplo, se mezclaron parejas de cebadores para 56 STR con parejas de cebadores para 75 iSNP, aSNP y SNP informativos de fenotipo. Se añadió polimerasa (Hot-start Phusion II en este ejemplo) a una mezcla maestra de todos los componentes necesarios para la PCR y se añadieron los cebadores. La mezcla se pipeteó hacia los pocillos de una placa de PCR, pero la amplificación también se pudo realizar en tubos, etc. Se añadió ADN a la placa como ADN purificado en un volumen de 15 microlitros; sin embargo, también se pueden utilizar extractos lisados de muestras de sangre o bucales de hisopos o papel de filtro no tratado, o directamente de muestras de sangre o bucales en tarjetas FTA, etc. Para este experimento, se utilizó ADN de control 2800M purificado a 1 ng y 100 pg. Las reacciones se sometieron a PCR durante un número determinado de ciclos (en el caso del ejemplo, 25 ciclos) siguiendo el protocolo:
Figure imgf000030_0004
Después de ciclar, las placas se retiraron del termociclador. La reacción se llevó a 50 microlitros con polimerasa (Kapa HiFi, Kapa Biosystems), mezcla maestra de PCR que contenía todos los componentes necesarios para la PCR y un par de adaptadores (un adaptador i7 y un adaptador i5). Se realizó una segunda ronda de PCR para un número determinado de ciclos (10 ciclos en el caso del ejemplo) para generar los bancos de secuenciación, siguiendo el protocolo:
Figure imgf000031_0001
Después de ciclar, la placa que contenía los bancos completados se retiró del termociclador. En este momento, las muestras pueden agruparse por volumen y purificarse como una sola muestra utilizando, por ejemplo, esferas magnéticas (SPRI). Las muestras también se pueden purificar individualmente. La reunión o los bancos individuales se pueden cuantificar utilizando un método basado en qPCR, utilizando un analizador de fragmentos o un bioanalizador, o utilizando PicoGreen y un lector de placas (como en el caso del ejemplo). Los expertos en la técnica conocerán la gran cantidad de opciones para la cuantificación de bancos. Si los bancos se purifican individualmente, cada concentración puede normalizarse a 2 nM y reunirse por volumen.
Las reuniones de bancos purificados se desnaturalizaron, se diluyeron, se agruparon y se secuenciaron en el instrumento de secuenciación MiSeq con una ejecución de secuenciación de 350 ciclos y las dos lecturas de índice. Después de la secuenciación, las muestras se desmultiplexaron de acuerdo con las secuencias de adaptador y se analizaron a través del canal de Forensics Genomics (Illumina, Inc.). Las lecturas de STR se separaron de las lecturas de SNP y se analizaron de forma independiente. Las STR se analizaron utilizando el algoritmo descrito en una solicitud de patente anterior (PCT/US2013/30867). Los números de repeticiones y cualquier variación de secuencia se indicaron junto con los números leídos. Los SNP se analizaron mediante un manifiesto y las llamadas se indicaron junto con los números leídos. Se calculó el equilibrio relativo entre los alelos (% mínimo/máximo), el equilibrio entre los loci (% CV), las tasas de error y las tasas de tartamudeo para los loci STR. Los resultados de las STR en el múltiplex del banco de datos inicial se muestran en la figura 5A-C. El equilibrio (equilibrio promedio 80 %), el tartamudeo (aproximadamente 3 %) y las tasas de error (menos del 5 %) cumplen los requisitos de entrada del diseño para los loci incluidos en este ejemplo. El porcentaje de CV (~142%) se calculó utilizando los 56 loci. Aunque los cebadores utilizados muestran equilibrio entre locus (interlocus), se prevé una mayor optimización del cebador para mejorar el equilibrio entre locus. Las llamadas para los loci conocidos coinciden con los resultados publicados para 2800M. Los resultados de los SNP se muestran en la figura 5D-E. La cobertura, llamadas de alelos, tartamudeo y otros artefactos para los 56 loci STR en el múltiplex grande se muestran en la figura 6. Estos gráficos imitan los electroferogramas generados por la tecnología CE. Las barras son análogas a los picos del alelo definido (eje X), y los recuentos leídos (eje Y) son análogos a RFU. La cobertura de los SNP oscilaba entre 10 y 2500X, según el SNP, sin embargo, cada SNP que se multiplexó se contó y proporcionó llamadas precisas.
Ejemplo 3: Elaboración de perfiles de ADN para crímenes
Este ejemplo describe un experimento que sigue el flujo de trabajo de la figura 3. Este ejemplo incorpora UMI en los cebadores, ya que se considera que las muestras obtenidas son de individuos cuya identidad aún no se conoce.
Para este experimento, las STR se multiplexaron con iSNP, aSNP y SNP informativos de fenotipo como se muestra en la tabla 5.
Tabla 5 - Investigaciones con STR y SNP
Figure imgf000031_0002
Figure imgf000031_0003
Figure imgf000032_0002
Figure imgf000032_0005
Figure imgf000032_0001
Figure imgf000032_0003
Figure imgf000032_0004
Figure imgf000032_0006
Figure imgf000033_0001
Este ejemplo incluye UMI para los cebadores de STR. Para estos ejemplos, solo los cebadores de STR contienen UMI, sin embargo, tanto los cebadores de STR como de SNP podrían incluir UMI si se desea y esta opción no está excluida de la práctica. Sin embargo, para este ejemplo, solo los cebadores de STR incorporan UMI con fines de demostración. Se introdujeron identificadores de moléculas exclusivos durante dos ciclos de PCR (figura 3). En primer lugar, como en el ejemplo 2, los cebadores de PCR contienen una secuencia de cebador de PCR específica de gen en el extremo 3' y una secuencia de marcador adaptador en el extremo 5', lo mismo que para las secuencias de marcador utilizadas en el ejemplo 2 para las secuencias i5 e i7. En este experimento, los UMI se colocan entre la secuencia del cebador específico del gen y la secuencia de marcador. En el caso de este ejemplo, se utilizaron cinco bases aleatorias para el UMI en los cebadores directo e inverso. Los cebadores se mezclaron para todas las dianas. La mezcla de cebadores constaba de 26 parejas de cebadores de STR autosómicos y 86 parejas de cebadores de SNP (92 SNP cubiertos). Se añadió polimerasa (Hot-start Phusion II en este ejemplo) a una mezcla maestra de todos los componentes necesarios para la PCR y se añadieron los cebadores. La mezcla se pipeteó hacia los pocillos de una placa de PCR. Se añadió ADN a la placa como ADN purificado, óptimamente 1 ng. Como en el ejemplo 2, el ADN purificado del control 2800M se ensayó a 1 ng. La mezcla de reacción múltiplex se sometió a dos ciclos de PCR siguiendo el protocolo:
Figure imgf000033_0002
Después de ciclar, las muestras se retiraron del termociclador y se añadió a la reacción proteína de unión a ADN monocatenario (SSB) de E. coli. Se contempló que la SSB reduce los dímeros de cebadores mediante los cebadores específicos de genes marcados no utilizados y evita cualquier amplificación posterior de estos cebadores. La SSB se incubó con la muestra en hielo, y como alternativa también se podría usar incubación a TA o 37 °C. Después de esta incubación, se agregó polimerasa (Hot-start Phusion II en este ejemplo) a una mezcla maestra de todos los componentes necesarios para la PCR, y la mezcla maestra se agregó a la muestra con un par de adaptadores (adaptadores i7 e i5) y se cicló un número determinado de ciclos (en este experimento 34 ciclos), siguiendo el protocolo:
Figure imgf000033_0003
Las muestras se purificaron con esferas SPRI y los bancos individuales se pudieron cuantificar utilizando un método basado en qPCR, utilizando un analizador de fragmentos (como en el caso del ejemplo) o BioAnalyzer, o utilizando PicoGreen y un lector de placas. Cada concentración de los bancos se normalizó a 2 nM y estos se combinaron por volumen.
Los grupos de bancos purificados se desnaturalizaron, se diluyeron, se agruparon y se secuenciaron utilizando MiSeq con una ejecución de secuenciación de 350x100 ciclos y las dos lecturas de índice. Después de la secuenciación, los datos se determinaron como se informa en el ejemplo 2. Sin embargo, dado que los cebadores contienen UMI, los UMI se usaron para colapsar los datos empleando réplicas de PCR para eliminar los errores y artefactos de secuenciación y de PCR. Los SNP se analizaron mediante un manifiesto, y las llamadas se indicaron junto con los números leídos. Se calculó el equilibrio relativo entre los alelos (% mínimo/máximo), el equilibrio entre loci (% CV), las tasas de error y las tasas de tartamudeo (solo STR). Los resultados del múltiplex de investigaciones inicial se muestran en la figura 7A-E. La cobertura, las llamadas de alelos, el tartamudeo y otros artefactos para los 26 loci STR en el múltiplex grande se muestran en la figura 8. Estos gráficos imitan los electroferogramas generados por CE. Las barras son análogas a los picos y los recuentos de lectura son análogos a RFU. La cobertura de los SNP oscila entre 10 y 5500X, dependiendo del SNP, sin embargo, cada SNP que se multiplexó se contó y proporcionó resultados útiles.
Un resultado que se generó con estos estudios fue que se demostró que el tartamudeo era un artefacto de la PCR. Muchos investigadores han planteado la hipótesis de esto (y el deslizamiento de la polimerasa se ha indicado en los cánceres de colon humanos), pero esto no se ha demostrado en los ensayos forenses. Los UMI se pueden utilizar para demostrar que el tartamudeo es de hecho un artefacto de PCR. Los productos con n+1 o n-1 repeticiones tienen los mismos UMI que los productos con el número correcto de repeticiones (figura 9). En la figura 9A, cada locus muestra los resultados sin corrección de UMI en comparación con la figura 9B, en la que se realiza la corrección de UMI. Como se demostró, sin la corrección de UMI, el equilibrio entre los alelos no es tan bueno como cuando se realiza la corrección de UMI. Además, hay considerablemente más tartamudeo, que es evidente sin la corrección de UMI. La parte de la barra sobre la línea entre barras representa el error de secuenciación, mientras que debajo de la línea representa la secuencia correcta dentro de la secuencia STR. El error se reduce considerablemente con la corrección de UMI. Por ejemplo, el locus SE33 tiene un error que se elimina con la corrección de UMI. La corrección de errores puede ser extremadamente importante para que la investigación de crímenes proporcione el perfil de ADN más preciso posible.
Ejemplo 4: Elaboración de perfiles de ADN usando 12 individuos de muestra
Métodos y materiales
Se ensayó el ADN de 12 individuos de muestra (muestra n.°: 1, 3, 4, 5, 6, 7, 10, 13, 14, 15, 16, 17) y un genoma de referencia (2800M) siguiendo el flujo de trabajo de la figura 3. Este experimento incorpora UMI en los cebadores de STR como se describe en el ejemplo 3. Se analizaron dos réplicas de cada muestra con el kit de preparación de bancos de firmas de ADN ForenSeq de Illumina® en el secuenciador MiSeq. Se usó 1 ng de ADN para cada réplica utilizando la mezcla de cebadores de ADN B: mezcla de muestras recolectadas, que contiene cebadores para 61 STR más amelogenina, 95 SNP informativos de identidad, 56 SNP informativos de ascendencia, 22 SNP informativos de fenotipo (también se emplearon 2 SNP de ascendencia para la predicción del fenotipo).
Configuración por defecto
STR: umbral analítico = 6,5 %; umbral de interpretación = 15 %. SNP: umbral analítico = 3 %; umbral de interpretación = 15 %.
Las llamadas de secuenciación de alto nivel, como la cobertura y los loci llamados, para la elaboración de perfiles de ADN de los 12 individuos de muestra se muestran en la figura 12. Como puede verse, cada locus fue cubierto por al menos 100.000 lecturas en ambas repeticiones. Solo dos muestras dieron como resultado una llamada de STR fallida (1 de 61). Todos los 173 SNP fueron llamados con éxito en todos los individuos en ambas réplicas. Las llamadas de STR de muestra de dos individuos de la muestra se muestran en la figura 16. Las llamadas de SNP de muestra de dos individuos de muestra se muestran en la figura 17. La figura 13 muestra las estadísticas de población, como la probabilidad de apareamiento aleatorio (RMP) de los auto-STR del National Institute of Standards and Technology (NIST), la frecuencia de haplotipos con confianza del 95 % de los NIST Y-STR, el RMP de los iSNP de dbSNP y el RMP de los STR de la base de datos de US Y-STR.
Los fenotipos, como el color de los ojos y el color del cabello, de los 12 individuos de la muestra y el individuo de referencia se predijeron basándose en el genotipo de pSNP en el experimento, y se compararon con los fenotipos autoinformados (figura 14). Se observó un alto grado de correlación entre los fenotipos predichos e informados.
La ascendencia de los 12 individuos de la muestra se predijo utilizando el genotipo de 56 aSNP en el experimento. Se calcularon las puntuaciones de PCA1 y PCA3 de cada individuo de la muestra y se trazaron frente a muestras de referencia en una gráfica de ascendencia. Como se muestra en la figura 15, la ascendencia de los individuos de la muestra se puede predecir en función de la ubicación en la gráfica de ascendencia. Se incluyeron catorce puntos centroides en la gráfica de ascendencia (círculos). Sobre la base del punto centroide más cercano, se predijo la ascendencia de cada individuo de la muestra.
El experimento de elaboración de perfiles de ADN también mostró un alto nivel de equilibrio intralocus tanto en los loci STR como en los loci SNP, como puede verse en la figura 18, y bajo nivel de tartamudeo, como puede verse en la figura 19.
Seis de los 12 individuos más 2800M tienen al menos un locus heterocigótico isométrico, que se muestra en la figura 20. Un locus heterocigótico isométrico se define como un STR que tiene el mismo número de repeticiones, dos secuencias diferentes, que están igualmente equilibradas. Usando la información sobre los variantes en el STR D8S1179, el alelo 13 de la muestra 15 se rastreó hasta la abuela, muestra 17 (figura 21). Se usó una información de variantes similar en el STR D13S317 para rastrear los alelos de la muestra 15. Sin embargo, en este caso no se puede determinar el origen de ninguno de los alelos (figura 22).
Ejemplo 5: Elaboración de perfiles de ADN para su uso en investigación, análisis forense o de paternidad
Este ejemplo se basa en el flujo de trabajo descrito en ForenSeq ™ DNA Signature Prep Guide (Illumina, San Diego, CA). Para este ejemplo se puede usar ADN purificado o lisado bruto. Para el ADN purificado, cada muestra de 1 ng se diluye hasta 0,2 ng/ql con agua sin nucleasas. Para el lisado bruto, cada muestra de 2 ql se diluye con 3 ql de agua sin nucleasas. Se configura una mezcla maestra para ocho o más reacciones. Para cada reacción, se añaden 5,4 ql de ForenSeq PCR1 Reaction Mix, 0,4 ql de ForenSeq Enzyme Mix y 5,8 ql de mezcla de cebadores de ADN (A o B) en un tubo de microcentrífuga de 1,5 ml. Se transfieren 10 ql de Master Mix a cada pocillo de la placa de PCR y se agrega el ADN o el lisado. La mezcla de reacción múltiplex se somete a PCR siguiendo el protocolo:
98 °C durante 3 min.
8 ciclos de:
96 °C durante 45 seg.
80 °C durante 30 seg.
54 °C durante 2 min., con modo de pendiente especificado
68 °C durante 2 min., con modo de pendiente especificado
10 ciclos de:
96 °C durante 30 seg.
68 °C durante 3 min., con modo de pendiente especificado
68 °C durante 10 min.
Mantenimiento a 10 °C.
Después de ciclar, las muestras se retiran del termociclador. La mezcla de reacción ForenSeq PCR2 se agrega a las muestras con un par de adaptadores (adaptadores i7 e i5) y se cicla durante 15 ciclos, siguiendo el protocolo:
98 °C durante 30 seg.
15 ciclos de:
98 °C durante 20 seg.
66 °C durante 30 seg.
68 °C durante 90 seg.
68 °C durante 10 min.
Mantenimiento a 10 °C.
Las muestras se purifican con esferas de purificación de muestras y los bancos se normalizan y se agrupan por volumen. Los bancos agrupados se diluyen en tampón de hibridación (HT1), se añaden con control de secuenciación humana (HSC) y se desnaturalizan por calor en preparación para la secuenciación.
Ejemplo 6: Genotipificación con ADN degradado
La figura 23 muestra los resultados de la genotipificación utilizando ADN cortado y/o tratado con ADNasa que representa ADN degradado. Como se muestra, más del 50 % de los loci de STR y SNP fueron llamados correctamente con el ADN cortado. Se logró una probabilidad de coincidencia aleatoria (RMP) de 10-19 con ADN de menos de 100 pb. También se predijo la ascendencia correcta utilizando ADN degradado.
Ejemplo 7: Sensibilidad de la genotipificación
Las figuras 24 y 25 muestran los resultados de la sensibilidad de la genotipificación a niveles de entrada de ADN inferiores a nanogramos de 7,82 pg a 1 ng. Como se muestra, el 100 % de los alelos fueron llamados con éxito a 125 ng de ADN de entrada tanto para STR como para SNP. Más del 50 % de los alelos fueron llamados con éxito a tan

Claims (14)

REIVINDICACIONES
1. Un método para construir un perfil de ADN que comprende: proporcionar una muestra de ácido nucleico,
amplificar la muestra de ácido nucleico con una mezcla de cebadores que comprende una pluralidad de cebadores que se hibridan específicamente con al menos una secuencia diana que comprende un polimorfismo de un solo nucleótido (SNP) y al menos una secuencia diana que comprende una repetición en tándem en una reacción múltiplex para generar productos de amplificación, en el que cada uno de la pluralidad de cebadores tiene una temperatura de fusión que es menor que 60 °C, tiene una longitud de al menos 24 nucleótidos que se hibridan con la secuencia diana, y es rico en AT con un contenido en AT mayor del 60 %, opcionalmente en el que cada uno de la pluralidad de cebadores comprende una secuencia de nucleótidos de homopolímero; y
determinar los genotipos de dicho al menos un SNP y dicha al menos una repetición en tándem en los productos de amplificación, construyendo así el perfil de ADN de la muestra de ácido nucleico.
2. El método según la reivindicación 1, en el que el método comprende amplificar los productos de amplificación con una segunda pluralidad de cebadores.
3. - El método de la reivindicación 1 o la reivindicación 2, que comprende además generar un banco de ácidos nucleicos a partir de los productos de amplificación, en el que el método comprende opcionalmente determinar las secuencias del banco de ácidos nucleicos.
4. El método de una cualquiera de las reivindicaciones 1-3, en el que la muestra de ácido nucleico es de un ser humano, una muestra ambiental, una planta, un animal no humano, una bacteria, una arquea, un hongo o un virus.
5. El método de una cualquiera de las reivindicaciones 1 -4, en el que dicho al menos un SNP indica la ascendencia o una característica fenotípica de la fuente de la muestra de ácido nucleico.
6. El método de una cualquiera de las reivindicaciones 1-5, en el que el perfil de ADN es adecuado para su uso en uno o más diagnósticos o pronósticos de enfermedades, identificación de biomarcadores del cáncer, identificación de anomalías genéticas o análisis de diversidad genética, construcción de banco de datos, análisis forense, investigación de crímenes, paternidad, o identificación personal.
7. El método de una cualquiera de las reivindicaciones 1-6, en el que la muestra de ácido nucleico se amplifica mediante la reacción en cadena de la polimerasa (PCR).
8. - El método de la reivindicación 7, en el que la muestra de ácido nucleico se amplifica en un tampón de amplificación, en el que el tampón de amplificación comprende KCl en una concentración en el intervalo de 60 mM a 500 mM, LiCl en una concentración en el intervalo de 60 mM a 500 mM, NaCl en una concentración en el intervalo de 60 mM a 500 mM, o una combinación de los mismos.
9. El método de una cualquiera de las reivindicaciones 1-8, en el que el SNP es un SNP de ascendencia, un SNP fenotípico, un SNP de identidad o una combinación de los mismos; y/o en el que la pluralidad de cebadores se hibrida específicamente con al menos 30 SNP o con al menos 50 SNP; y/o en el que la repetición en tándem es una repetición en tándem corta (STR), una repetición en tándem intermedia (ITR) o una variante de las mismas; y/o en el que la pluralidad de cebadores se hibrida específicamente con al menos 24 secuencias repetidas en tándem o con al menos 60 secuencias repetidas en tándem; y/o en el que la muestra de ácido nucleico comprende de 100 pg a 100 ng de ADN, o de 10 pg a 100 pg de ADN, o de 5 pg a 10 pg de ADN; y/o en el que la muestra de ácido nucleico comprende ADN genómico; y/o en el que se determinan al menos el 50 %, 80 %, 90 % o 95 % de los genotipos de dicho al menos un SNP y al menos una repetición en tándem.
10. El método de una cualquiera de las reivindicaciones 1-9, en el que cada uno de la pluralidad de cebadores comprende una o más secuencias de marcador que no son homólogas con la secuencia diana, en el que opcionalmente dichas una o más secuencias de marcador comprenden un marcador de cebador, un marcador de captura, un marcador de secuenciación, un marcador de identificación molecular exclusivo o una combinación de los mismos.
11. Un método para construir un banco de ácidos nucleicos que comprende:
proporcionar una muestra de ácido nucleico, y
amplificar la muestra de ácido nucleico con una mezcla de cebadores que comprende una pluralidad de cebadores que se hibridan específicamente con al menos una secuencia diana que comprende un polimorfismo de un solo nucleótido (SNP) y al menos una secuencia diana que comprende una secuencia repetida en tándem en una reacción múltiplex para generar productos de amplificación , en el que cada uno de la pluralidad de cebadores tiene una temperatura de fusión inferior a 60 °C, tiene una longitud de al menos 24 nucleótidos que se hibridan con la secuencia diana y es rico en AT con un contenido en AT superior al 60 %, opcionalmente en el que cada uno de la pluralidad de cebadores comprende una secuencia de nucleótidos de homopolímero.
12. El método de la reivindicación 11, en el que la muestra de ácido nucleico no se fragmenta antes de la amplificación; y/o en el que las secuencias diana no se enriquecen antes de la amplificación; y/o en el que dicho al menos un SNP indica la ascendencia o una característica fenotípica de la fuente de la muestra de ácido nucleico; y/o en el que cada uno de la pluralidad de cebadores comprende una o más secuencias de marcador que no son homólogas con la secuencia diana; y/o en el que el método comprende además amplificar los productos de amplificación con una segunda pluralidad de cebadores.
13. El método de la reivindicación 11 o la reivindicación 12, en el que la muestra de ácido nucleico y/o los productos de amplificación se amplifican mediante la reacción en cadena de la polimerasa (PCR).
14. El método de la reivindicación 13, en el que la muestra de ácido nucleico y/o los productos de amplificación se amplifican en un tampón de amplificación, en el que el tampón de amplificación comprende KCI en una concentración en el intervalo de 60 mM a 500 mM, LiCI en una concentración en el intervalo de 60 mM a 500 mM, NaCl a una concentración en el intervalo de 60 mM a 500 mM, o una combinación de los mismos.
ES15708379T 2014-02-18 2015-02-13 Métodos y composiciones para la elaboración de perfiles de ADN Active ES2866044T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201461940942P 2014-02-18 2014-02-18
US201462043060P 2014-08-28 2014-08-28
US201562103524P 2015-01-14 2015-01-14
PCT/US2015/015939 WO2015126766A1 (en) 2014-02-18 2015-02-13 Methods and compositions for dna profiling

Publications (1)

Publication Number Publication Date
ES2866044T3 true ES2866044T3 (es) 2021-10-19

Family

ID=52629678

Family Applications (1)

Application Number Title Priority Date Filing Date
ES15708379T Active ES2866044T3 (es) 2014-02-18 2015-02-13 Métodos y composiciones para la elaboración de perfiles de ADN

Country Status (22)

Country Link
US (2) US10422002B2 (es)
EP (2) EP3910069A1 (es)
JP (3) JP7011392B2 (es)
CN (1) CN106164298B (es)
AU (2) AU2015219289B2 (es)
BR (2) BR112016019267B8 (es)
CA (1) CA2940048C (es)
DK (1) DK3108009T3 (es)
ES (1) ES2866044T3 (es)
HR (1) HRP20210953T1 (es)
HU (1) HUE055256T2 (es)
LT (1) LT3108009T (es)
MX (1) MX2016010717A (es)
MY (1) MY182415A (es)
NZ (1) NZ723399A (es)
PL (1) PL3108009T3 (es)
PT (1) PT3108009T (es)
RS (1) RS61976B1 (es)
RU (2) RU2708337C2 (es)
SA (1) SA516371691B1 (es)
SI (1) SI3108009T1 (es)
WO (1) WO2015126766A1 (es)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TR201905313T4 (tr) * 2013-03-15 2019-05-21 Abbvie Deutschland Anti-EGFR antikoru ilaç konjugat formülasyonları.
EP3910069A1 (en) * 2014-02-18 2021-11-17 Illumina, Inc. Methods and composition for dna profiling
US10006910B2 (en) 2014-12-18 2018-06-26 Agilome, Inc. Chemically-sensitive field effect transistors, systems, and methods for manufacturing and using the same
US9859394B2 (en) 2014-12-18 2018-01-02 Agilome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
EP3235010A4 (en) 2014-12-18 2018-08-29 Agilome, Inc. Chemically-sensitive field effect transistor
US9857328B2 (en) 2014-12-18 2018-01-02 Agilome, Inc. Chemically-sensitive field effect transistors, systems and methods for manufacturing and using the same
US9618474B2 (en) 2014-12-18 2017-04-11 Edico Genome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US10020300B2 (en) 2014-12-18 2018-07-10 Agilome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
CN107849603B (zh) * 2015-04-24 2022-01-28 阿提拉生物系统公司 利用有限核苷酸组成的引物扩增
CN105755129B (zh) * 2016-03-21 2020-03-31 北京市理化分析测试中心 基于新一代测序的基因座d8s1179的str分型方法
US9963750B2 (en) 2016-05-13 2018-05-08 Colorado State University Research Foundation High throughput method to genotype plants
US10811539B2 (en) 2016-05-16 2020-10-20 Nanomedical Diagnostics, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US10822647B2 (en) * 2016-07-12 2020-11-03 Biodynamics S.R.L. Methods for using long ssDNA polynucleotides as primers (superprimers) in PCR assays
CA3041645C (en) * 2016-10-24 2021-11-02 Geneinfosec, Inc. Concealing information present within nucleic acids
ES2929281T3 (es) * 2017-03-23 2022-11-28 Univ Washington Métodos para el enriquecimiento de secuencias de ácidos nucleicos dirigidos con aplicaciones para la secuenciación de ácidos nucleicos con corrección de errores
CN106835292B (zh) * 2017-04-05 2019-04-09 北京泛生子基因科技有限公司 一步法快速构建扩增子文库的方法
GB2577214B (en) 2017-05-05 2021-10-06 Scipio Bioscience Methods for trapping and barcoding discrete biological units in hydrogel
MX2019013993A (es) * 2017-05-23 2020-07-28 Harvard College Amplificación de etiquetado extremo múltiple de ácidos nucleicos.
CN111032882A (zh) * 2017-06-20 2020-04-17 伊鲁米那股份有限公司 解决扩增反应中低效的方法和组合物
WO2019033065A1 (en) 2017-08-11 2019-02-14 Atila Biosystems, Inc. DIGITAL AMPLIFICATION WITH LIMITED NUCLEOTIDE COMPOSITION PRIMERS
CN107868837B (zh) * 2017-12-12 2019-03-01 苏州普瑞森基因科技有限公司 一种用于分析肠道微生物的引物组合物及其应用
CN109988826A (zh) * 2017-12-30 2019-07-09 安诺优达基因科技(北京)有限公司 一种基于str计算混合样本嵌合比例的方法以及系统
EP3517629A1 (en) * 2018-01-30 2019-07-31 Myway Genetics S.r.L. Use of cfdna fragments as biomarkers in patients after organ transplantation
CN108342469A (zh) * 2018-02-27 2018-07-31 广州中安基因科技有限公司 一种皮肤基因检测的基因芯片
EP3768852B1 (en) 2018-03-22 2023-08-30 President and Fellows of Harvard College Methods and compositions for molecular authentication
JP6646120B1 (ja) * 2018-10-01 2020-02-14 日本ソフトウェアマネジメント株式会社 分解されたdnaで個体識別可能なdna鑑定方法
KR102097721B1 (ko) * 2019-01-24 2020-04-06 주식회사 시선바이오머티리얼스 태그서열 snp를 이용한 단일 검출 프로브 기반 다중 표적 검출방법
CN111485024B (zh) * 2019-01-29 2024-04-26 深圳华大法医科技有限公司 用于个体特征确认的引物组合、及其应用
KR102351579B1 (ko) * 2019-06-25 2022-01-17 대한민국 상염색체 str 좌위를 포함한 ngs 패널 및 다중증폭 시스템
CN114364812A (zh) * 2019-09-11 2022-04-15 帕兰卡有限公司 一种制备测序文库的多重方法
CN112592981B (zh) * 2020-12-01 2023-06-20 广州精科医学检验所有限公司 用于dna档案建库的引物组、试剂盒和方法
CN112342303A (zh) * 2020-12-04 2021-02-09 郑州高新生物技术有限公司 一种基于ngs的人类y染色体str和snp遗传标记联合检测体系及检测方法
CN112852970A (zh) * 2020-12-31 2021-05-28 百特元生物科技(北京)有限公司 一种同时扩增人37个y-str基因座的引物组、试剂盒及其应用
AU2022220689A1 (en) * 2021-02-12 2023-08-03 Verogen, Inc. Methods and compositions for dna based kinship analysis
CN113293205B (zh) * 2021-05-24 2024-11-26 深圳市真迈生物科技有限公司 测序方法
KR102337267B1 (ko) * 2021-06-01 2021-12-08 주식회사 다우진유전자연구소 유전자 감식을 위한 24개의 str 유전자 마커를 이용한 pcr 다중증폭 시스템
CN113930490B (zh) * 2021-09-27 2024-09-10 江汉大学 二代测序平台中利用分子特异性条形码评估str滑脱的方法及其应用
EP4272764A1 (en) 2022-05-03 2023-11-08 Scipio Bioscience Method of complexing biological units with particles
WO2024040078A1 (en) 2022-08-16 2024-02-22 Verogen, Inc. Methods and systems for kinship evaluation for missing persons and disaster/conflict victims

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1991006678A1 (en) 1989-10-26 1991-05-16 Sri International Dna sequencing
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
ES2563643T3 (es) 1997-04-01 2016-03-15 Illumina Cambridge Limited Método de secuenciación de ácido nucleico
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
GB9929381D0 (en) * 1999-12-10 2000-02-09 Pyrosequencing Ab A method of assessing the amount of nucleic acid in a sample
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
CN100462433C (zh) 2000-07-07 2009-02-18 维西根生物技术公司 实时序列测定
EP1354064A2 (en) 2000-12-01 2003-10-22 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US7078168B2 (en) * 2001-02-27 2006-07-18 Biotage Ab Method for determining allele frequencies
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
DK3363809T3 (da) 2002-08-23 2020-05-04 Illumina Cambridge Ltd Modificerede nukleotider til polynukleotidsekvensering
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
EP3175914A1 (en) 2004-01-07 2017-06-07 Illumina Cambridge Limited Improvements in or relating to molecular arrays
WO2006004659A1 (en) * 2004-06-30 2006-01-12 Applera Corporation Methods for analyzing short tandem repeats and single nucleotide polymorphisms
US20060057595A1 (en) * 2004-09-16 2006-03-16 Applera Corporation Compositions, methods, and kits for identifying and quantitating small RNA molecules
US20060062531A1 (en) 2004-09-17 2006-03-23 Stephen Turner Fabrication of optical confinements
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
WO2006120433A1 (en) 2005-05-10 2006-11-16 Solexa Limited Improved polymerases
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
WO2007123744A2 (en) 2006-03-31 2007-11-01 Solexa, Inc. Systems and devices for sequence by synthesis analysis
WO2007147018A1 (en) * 2006-06-14 2007-12-21 Cellpoint Diagnostics, Inc. Analysis of rare cell-enriched samples
AU2007309504B2 (en) 2006-10-23 2012-09-13 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
GB2457851B (en) 2006-12-14 2011-01-05 Ion Torrent Systems Inc Methods and apparatus for measuring analytes using large scale fet arrays
US9434997B2 (en) * 2007-08-24 2016-09-06 Lawrence Livermore National Security, Llc Methods, compounds and systems for detecting a microorganism in a sample
US20090163366A1 (en) * 2007-12-24 2009-06-25 Helicos Biosciences Corporation Two-primer sequencing for high-throughput expression analysis
US8709726B2 (en) * 2008-03-11 2014-04-29 Sequenom, Inc. Nucleic acid-based tests for prenatal gender determination
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
EP2513341B1 (en) 2010-01-19 2017-04-12 Verinata Health, Inc Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
EP3447147A1 (en) 2011-05-12 2019-02-27 NetBio, Inc. Methods and compositions for rapid multiplex amplification of str loci
HRP20211523T1 (hr) 2011-09-23 2021-12-24 Illumina, Inc. Pripravci za sekvenciranje nukleinske kiseline
ES2949570T3 (es) 2012-04-03 2023-09-29 Illumina Inc Cabezal integrado de lectura optoelectrónica y cartucho de fluidos útiles para la secuenciación de ácidos nucleicos
EP3910069A1 (en) * 2014-02-18 2021-11-17 Illumina, Inc. Methods and composition for dna profiling

Also Published As

Publication number Publication date
RS61976B1 (sr) 2021-07-30
RU2708337C2 (ru) 2019-12-05
AU2021203877A1 (en) 2021-07-08
BR112016019267A2 (pt) 2017-10-10
JP7011392B2 (ja) 2022-01-26
EP3108009B1 (en) 2021-03-24
PL3108009T3 (pl) 2021-10-11
EP3910069A1 (en) 2021-11-17
BR122022007092B8 (pt) 2023-01-31
CA2940048A1 (en) 2016-08-27
AU2015219289A1 (en) 2016-09-08
US10422002B2 (en) 2019-09-24
HRP20210953T1 (hr) 2021-09-03
RU2019138698A3 (es) 2020-06-19
PT3108009T (pt) 2021-05-10
RU2016133987A (ru) 2018-03-27
JP2021177777A (ja) 2021-11-18
SI3108009T1 (sl) 2021-09-30
US20150232929A1 (en) 2015-08-20
AU2015219289B2 (en) 2021-05-06
RU2752700C2 (ru) 2021-07-30
BR112016019267B1 (pt) 2022-06-28
BR112016019267B8 (pt) 2023-01-10
NZ723399A (en) 2020-08-28
CN106164298B (zh) 2020-02-21
CA2940048C (en) 2023-03-14
RU2016133987A3 (es) 2018-12-19
JP2017509329A (ja) 2017-04-06
CN106164298A (zh) 2016-11-23
RU2019138698A (ru) 2020-01-27
AU2021203877B2 (en) 2023-11-23
HUE055256T2 (hu) 2021-11-29
LT3108009T (lt) 2021-07-12
NZ761724A (en) 2024-04-26
WO2015126766A1 (en) 2015-08-27
SA516371691B1 (ar) 2022-03-20
US11530446B2 (en) 2022-12-20
EP3108009A1 (en) 2016-12-28
MX2016010717A (es) 2017-04-27
US20200224268A1 (en) 2020-07-16
WO2015126766A8 (en) 2016-11-03
MY182415A (en) 2021-01-25
JP2024059651A (ja) 2024-05-01
BR122022007092B1 (pt) 2022-07-19
DK3108009T3 (da) 2021-06-07

Similar Documents

Publication Publication Date Title
ES2866044T3 (es) Métodos y composiciones para la elaboración de perfiles de ADN
US10704091B2 (en) Genotyping by next-generation sequencing
ES2873850T3 (es) Bibliotecas de secuenciación de próxima generación
US20180195118A1 (en) Systems and methods for detection of genomic copy number changes
ES2877205T3 (es) Preparación de muestras para la amplificación de ácido nucleico
US20230235394A1 (en) Chimeric amplicon array sequencing
Burkart-Waco et al. Next-generation sequencing for targeted discovery of rare mutations in rice
WO2016040602A1 (en) Reduced representation bisulfite sequencing using uracil n-glycosylase (ung) and endonuclease iv
WO2018236631A1 (en) METHODS AND COMPOSITIONS FOR RESOLVING INEFFICIENCY IN AMPLIFICATION REACTIONS
Jain et al. Emerging Tools for Generating Genomics Data
Barbaro Overview of NGS platforms and technological advancements for forensic applications
Pal et al. RNA Sequencing (RNA-seq)
Sathyanarayana et al. Applications of Long-Read Sequencing Technology in Clinical Genomics
Cain Targeted STR and SNP in-field sequencing by Oxford Nanopore MinION™ for the identification of an individual in a military scenario
US20140274750A1 (en) Sequence assembly using optical maps
Cluny Estudo Exploratório dos Padrões Epigenómicos Associados ao Envelhecimento
Tommas et al. Innovative technology for cancer risk analysis
Tucker et al. Massively parallel sequencing