[go: up one dir, main page]

ES2281426T3 - Procedimiento para el analisis de secuencias. - Google Patents

Procedimiento para el analisis de secuencias. Download PDF

Info

Publication number
ES2281426T3
ES2281426T3 ES01949637T ES01949637T ES2281426T3 ES 2281426 T3 ES2281426 T3 ES 2281426T3 ES 01949637 T ES01949637 T ES 01949637T ES 01949637 T ES01949637 T ES 01949637T ES 2281426 T3 ES2281426 T3 ES 2281426T3
Authority
ES
Spain
Prior art keywords
sequence
indicator
mold
base
nucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES01949637T
Other languages
English (en)
Inventor
Raj Amersham Pharmacia Biotech UK Ltd ODEDRA
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GE Healthcare UK Ltd
Original Assignee
GE Healthcare UK Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GE Healthcare UK Ltd filed Critical GE Healthcare UK Ltd
Application granted granted Critical
Publication of ES2281426T3 publication Critical patent/ES2281426T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

Un procedimiento para determinar la secuencia de un ácido nucleico en el que se añaden nucleótidos secuencialmente a un cebador en un molde, estando dicho molde unido a un soporte sólido, que comprende las etapas de a) hibridar un cebador al molde, comprendiendo dicho molde el ácido nucleico para el que se requiere la secuencia, para formar un complejo de molde-cebador, b) asignar uno o más nucleótidos marcados, que comprenden uno o más de A, C, G o T, y extender el cebador mediante una ADN polimerasa o una ligasa intentando añadir el nucleótido marcado único, proporcionándose el marcaje mediante un resto indicador, c) determinar el tipo o identidad del nucleótido marcado con indicador añadido al cebador, de manera que se identifica un nucleótido en la secuencia del molde, d) eliminar o neutralizar el resto indicador, e) repetir las etapas b) a d) secuencialmente en cada ciclo siguiente y registrar el orden de incorporación de nucleótidos marcados con indicador, f) determinar si un resto indicador puede detectarse en la etapa c) de cada ciclo, g) si el resto indicador no puede detectarse en la etapa c) de cada ciclo, introduciendo un indicador de detención en la secuencia para proporcionar una indicación de una base desconocida, h) si el resto indicador no puede detectarse, determinar si el número de indicadores de detención consecutivos supera un umbral predeterminado y, en ese caso, asignar un señalizador de apareamiento erróneo, i) si el resto indicador puede detectarse en la etapa c) y no se ha identificado en la iteración anterior de las etapas b) a d) o si no se detecta señalizador de apareamiento erróneo, asignar la base correspondiente a la secuencia, j) si el resto indicador puede detectarse en la etapa c) y se ha identificado en la iteración anterior de las etapas b) a d) y si se detecta el señalizador de apareamiento erróneo, sustituir la base previamente asignada con un código IUB para todas las demás bases, y k) si no puede detectarse el resto indicador en la etapa c) y si se observa ausencia del resto indicador para menos de un número umbral predeterminado de una o más iteraciones de las etapas b) a d) entonces el nucleótido correspondiente al indicador en la iteración actual de las etapas b) a d) se incorpora a la secuencia de manera contigua a la base previamente incorporada.

Description

Procedimiento para el análisis de secuencias.
Campo de la invención
La presente invención se refiere a un procedimiento de secuenciación y aparato que permite la corrección de errores durante la secuenciación de moléculas individuales.
Antecedentes de la invención
La secuenciación se realiza de manera rutinaria mediante el procedimiento de la terminación de cadenas y separación en gel, esencialmente tal como se describe por Sanger, F., S. Nicklen, y A. Coulson (Proc Natl Acad Sci USA, 1977. 74(12); págs. 5463-7). El procedimiento se basa en la generación de una población mixta de fragmentos de ADN que representan terminaciones en cada base en la secuencia. Entonces se determina la secuencia mediante separación electroforética de estos fragmentos.
Esfuerzos recientes para aumentar el rendimiento de secuenciación han dado como resultado el desarrollo de procedimientos alternativos que eliminan la etapa de separación electroforética. Varios de estos procedimientos utilizan la extensión de bases (es decir, adición de bases) y se han descrito, por ejemplo, en los documentos WO 93/21340, US 5.302.509 y US 5.547.839. En estos procedimientos, los moldes o cebadores se inmovilizan sobre una superficie sólida antes de la exposición a reactivos para su secuenciación. Las moléculas inmovilizadas se incuban en presencia de análogos de nucleótidos que tienen una modificación en el carbono en 3' del residuo de azúcar que bloquea reversiblemente el grupo hidroxilo en esa posición. La incorporación de tales nucleótidos modificados por una polimerasa garantiza que sólo se añade un nucleótido durante cada ciclo de extensión de bases. Entonces se detecta la base añadida en virtud de una etiqueta que se ha incorporado en el grupo bloqueante en 3'. Tras la detección, el grupo bloqueante se elimina (o "corta"), normalmente por medios fotoquímicos para exponer un grupo hidroxilo libre que está disponible para la adición de bases durante el siguiente ciclo.
Generalmente, los enfoques no basados en la separación se basan en la presencia de grandes números de moléculas de molde para cada secuencia diana para generar una secuencia consenso a partir de una diana dada. Por tanto, por ejemplo, pueden aplicarse reacciones de extensión de bases a múltiples moldes analizando puntos diferenciados de ácido nucleico, que comprenden cada uno una multiplicidad de moléculas, inmovilizado en una red espacialmente direccionable.
Sin embargo, las reacciones de incorporación de terminador/corte, o escisión de bases son propensas a errores. Por ejemplo, tal como se describió anteriormente, las estrategias de extensión de bases han utilizado generalmente análogos de nucleótidos que combinan las funciones de una molécula indicadora, normalmente un flúor, con las de un terminador que ocupa la posición en 3' en un resto de azúcar. La naturaleza voluminosa del grupo y su posición hacen estos compuestos sustratos sumamente ineficaces para polimerasas. Además, el corte del grupo terminador para permitir las adiciones posteriores también está sometido a ineficacias. En presencia de miles, o preferiblemente millones, de moléculas para cada diana, incluso errores modestos de menos del 5% dan como resultado una pérdida acumulativa de sincronía, entre la multiplicidad de las cadenas que representan cada molécula, dentro de un pequeño número de ciclos. Por tanto, con cada ciclo de secuenciación el ruido de fondo aumenta progresivamente con un deterioro consecuente de la señal con cada adición. Esto significa que el número de bases de datos de secuencia que pueden obtenerse está limitado antes de que la señal específica no pueda distinguirse del fondo.
Avances recientes en procedimientos de detección de moléculas individuales (descritos, por ejemplo, en Trabesinger, W., et al., Anal Chem., 1999. 71(1); págs. 279-83 y el documento WO 00/06770) hacen posible aplicar estrategias de secuenciación a moléculas individuales. Sin embargo, la secuenciación, cuando se aplica a poblaciones clonales de moléculas, es un procedimiento estocástico que da como resultado que algunas moléculas experimenten reacciones mientras que otras permanezcan sin modificarse. Por tanto, en procedimientos de secuenciación convencionales, los errores tales como incorporaciones erróneas no son normalmente de significación grave ya que los grandes números de moléculas presentes garantizan que se obtiene una señal consenso. Cuando estas reacciones se aplican a moléculas individuales, los resultados se cuantifican eficazmente.
Uno de tales procedimientos de secuenciación de moléculas individuales se basa en la escisión de bases y se describe, por ejemplo, en Hawkins, G. y L. Hoffman, Nature Biotechnology, 1997. vol. 15; págs. 803-804 y el documento US 5.674.743. Con esta estrategia, se generan moléculas de molde individuales de tal manera que cada base está marcada con un indicador apropiado. Las moléculas de molde se digieren con exonucleasa y se monitorizan e identifican las bases escindidas. Ya que estos procedimientos utilizan enzimas sumamente procesivas tales como Lambda exonucleasa, hay potencial para analizar moldes grandes de varios kilobases de longitud. Sin embargo, la monitorización continua de bases escindidas a partir de cada molécula de molde en tiempo real limita el número de moléculas que pueden analizarse en paralelo. Además, hay dificultades para generar un molde en el que cada base está marcada con un indicador apropiado de tal manera que las bases escindidas pueden detectarse basándose en las propiedades ópticas o químicas intrínsecas.
\newpage
También se han adaptado procedimientos basados en la extensión de bases (tales como BASS) al enfoque de moléculas únicas.
Sin embargo, estas técnicas son propensas a errores. En particular, la incorporación de nucleótidos modificados puede fallar, por ejemplo, como resultado de la disminución de la eficacia de la acción de la polimerasa con nucleótidos modificados. Cuando la molécula indicadora es una molécula fluorescente, también pueden producirse errores mediante el fallo de la fluorescencia debido a que se pierde, se daña, se blanquea o se desexcita el flúor. Al nivel de moléculas únicas, los fallos tales como estos darán como resultado que no pueda obtenerse una secuencia adecuada.
Es un objeto de la presente invención proporcionar un procedimiento de secuenciación que permite que se detecten los errores. Es un objeto adicional de la presente invención permitir el análisis y la prevención de errores, o corrección, monitorizando el destino de moléculas individuales mediante reacciones de secuenciación.
Sumario de la invención
La invención en sus diversos aspectos se define en las reivindicaciones independientes siguientes, a las que debe hacerse referencia ahora. Se exponen características ventajosas en las reivindicaciones adjuntas.
Brevemente, en una realización preferida de la invención que toma la forma de un procedimiento de análisis de una secuencia de nucleótidos, se obtiene una secuencia de bases a partir de un molde, y se identifica una base en la secuencia como una base desconocida. Se incluye un indicador "desconocido" en la secuencia en la posición correspondiente a la base desconocida, y se genera una secuencia de salida que contiene el indicador de base desconocido. En la realización preferida, la secuencia de bases se obtiene a partir del molde mediante evaluación de un indicador y asignación de las bases según el mismo. Se realiza una determinación sobre si el indicador procede de un ciclo precedente de determinación de bases, y si el indicador procede de un ciclo precedente de determinación de bases, se descarta la asignación de bases.
La secuencia de nucleótidos que debe analizarse puede ser una secuencia de ARN o de ADN.
Breve descripción del dibujo
Ahora se describirá la invención en más detalle a modo de ejemplo con referencia al dibujo adjunto en el que:
la figura 1 es un diagrama de flujo que ilustra un procedimiento de análisis de datos obtenidos durante una reacción para determinar la secuencia de una molécula biológica, tal como una molécula de ácido nucleico, y formar una realización preferida de la invención.
Descripción detallada de la realización preferida
La figura 1 muestra un diagrama que ejemplifica un procedimiento de obtención de una información de secuencia a partir de un molde. El procedimiento compensa los errores (a) identificando bases que se transfieren a partir de un ciclo anterior y (b) detectando moléculas detenidas que pueden producirse a partir de un fallo de marcaje o incorporación errónea de bases. El procedimiento de análisis de datos emplea una reacción de secuenciación convencional que se realiza tal como sigue. En primer lugar, una molécula de ácido nucleico para la que se requieren datos de secuencia, un molde, se une a una superficie sólida tal como un portaobjetos de microscopio. El molde puede marcarse de manera que pueda determinarse su posición cuando se observa el portaobjetos a través de un explorador de microscopio fluorescente, por ejemplo. Se consulta la primera base o nucleótido, es decir, A, C, G, o T, en la secuencia del molde mediante reacción química añadiendo una base fluorescentemente marcada o una etiqueta que representa esa base. Puede ser una de A, C, G o T, o las cuatro marcadas con cuatro etiquetas distinguibles diferentes. La primera base en el molde se unirá a su base complementaria de una manera bien conocida; es decir, A se une a T, y C se une a G, y viceversa. La incorporación de bases puede realizarse extendiendo el molde con una enzima de polimerasa o ligando un oligonucleótido marcado con una ligasa. La incorporación de la base marcada se detecta y se determina su identidad.
Entonces se elimina la etiqueta de esa base. Entonces se repite esta serie de etapas para las bases sucesivas en el molde.
Reacciones de secuenciación convencionales adecuadas que implican incorporación/adición de bases incluyen reacciones de extensión de bases tales como las descritas en los documentos WO 93/21340, US 5.302.509 y US 5.547.839 y técnicas tales como las descritas en los documentos US 5.763.175, US 5.599.675, US 5.856.093 y US 5.715.330 en los que las rondas de secuenciación sucesivas implican escisión de bases del molde antes de la incorporación de la base posterior.
Cuando se realiza esta reacción de secuenciación, pueden producirse errores. Por ejemplo, (i) puede incorporarse incorrectamente una base, es decir, se incorpora erróneamente, o (ii) puede no conseguir eliminarse una etiqueta de un ciclo antes de realizar el siguiente ciclo, o (iii) puede fallar la incorporación de una base en un ciclo cualquiera. En la realización preferida de la invención que va a describirse, los datos de las reacciones de secuencia se asimilan de tal manera que los efectos de estos errores pueden reducirse.
Los procedimientos para la deposición y fijación de moléculas sobre fases sólidas se conocen bien en la técnica. Los procedimientos para unir ácidos nucleicos, por ejemplo, se revisan en Schena (ed.), DNA Microarrays: A practical approach, Oxford University Press (1999) ISBN: 0199637768. Normalmente, la fase sólida será vidrio, aunque pueden usarse otros materiales tales como plásticos o silicio amorfo o cristalino.
Puede unirse una pluralidad de moléculas a la fase sólida en una red ordenada pero, más preferiblemente, se unirán de una manera aleatoria. Una unión aleatoria de moléculas puede comprender cualquier número de moléculas, distribuidas preferiblemente con una densidad apropiada para la resolución óptica de la información de secuencia.
Un resto indicador adecuado puede ser uno cualquiera de varios sistemas indicadores conocidos. Puede ser un radioisótopo por medio del que se hace fácilmente detectable el análogo de nucleósido incorporado, por ejemplo ^{32}P, ^{33}P, ^{35}S incorporados en un grupo fosfato o tiofosfato o H-fosfonato o alternativamente ^{3}H o ^{14}C o un isótopo de yodo. Puede ser un isótopo detectable mediante espectrometría de masas o RMN. Puede ser un resto de señal, por ejemplo, una enzima, hapteno, fluoróforo, cromóforo, grupo quimioluminiscente, etiqueta de Raman, etiqueta electroquímica, o compuesto señal adaptado para la detección mediante espectrometría de masas.
Cada etapa de secuenciación dará como resultado la unión de moléculas indicadoras a moldes individuales y la detección del resto indicador incorporado permitirá asignar la identidad de la base. En el caso de indicadores fluorescentes, estas moléculas se identificarán entonces, por ejemplo, mediante microscopía de fluorescencia (por ejemplo, usando PMT o CCD) y la propiedad de fluorescencia del indicador permitirá la asignación de identidad a la base incorporada en la reacción de secuenciación.
Con el fin de recoger datos a partir de rondas secuenciales de ciclos de secuenciación, debe localizarse el molde. Esto puede lograrse simultáneamente con el primer ciclo de secuenciación en el que la molécula indicadora en la primera base identifica la ubicación del molde o el propio molde y/o cebador puede estar marcado con un resto indicador de tal manera que puede detectarse su ubicación sobre la fase sólida mucho antes que la reacción de ciclación de la secuencia. Conocer la ubicación de cada molécula de molde hace posible monitorizar el estado de cada molécula tras todos los acontecimientos posteriores durante los ciclos de secuenciación. El fallo de adición posterior, por ejemplo, se manifiesta por sí mismo mediante una falta de fluorescencia en una ubicación que se sabe que contiene un molde. El fallo del indicador debido o bien a una falta de estímulo, o bien a un daño químico, también puede determinarse una vez que se ha determinado la ubicación del molde. Estas reacciones fallidas pueden rastrearse y tratarse en la secuencia final como posibles huecos debido a fallo del indicador. Si estas moléculas reanudan la participación en ciclos posteriores, esto también puede rastrearse y obtenerse una secuencia con sentido. Pueden identificarse puntos individuales de huecos de una única base y, cuando se han dispuesto en red múltiples secuencias idénticas sobre la superficie sólida, puede construirse una secuencia consenso mediante comparaciones con cadenas de referencia tales como secuencias de otras copias de moldes en la red de secuenciación. Alternativamente, pueden identificarse huecos de una única base mediante comparación con una cadena de referencia que puede ser la secuencia conocida (por ejemplo en la aplicación de esta técnica a la detección de mutaciones).
Por tanto, se ha apreciado que en este sistema es posible corregir errores, particularmente errores asociados a la secuenciación de moléculas individuales. Los errores que necesitan corregirse son el fallo en el corte y eliminación de indicador antes del siguiente ciclo, fallo de incorporación, daño al indicador (por ejemplo, daño al flúor), e incorporación errónea.
Una vez localizada, todos los resultados de ciclo de secuenciación para la molécula localizada podrán medirse. El uso de dos conjuntos de análogos de nucleótidos permite la identificación del indicador que se ha transferido desde un ciclo anterior. Por tanto, la recurrencia de un indicador del ciclo anterior puede identificarse y monitorizarse.
Conocer la ubicación de la molécula de molde también permite la identificación de moldes que no parecen haberse extendido. Tal como se trató anteriormente, el fallo para observar una molécula de indicador puede deberse a la falta de incorporación, pero también puede deberse al daño al resto indicador. Sin embargo, ya que puede minimizarse eficazmente la presencia de moléculas dañadas mediante un procedimiento de purificación durante la síntesis de nucleótidos modificados en los que pueden identificarse y eliminarse productos de ruptura y productos de reacciones secundarias, la ausencia de fluorescencia se debe por tanto más posiblemente a un resultado de fallo al incorporar un nucleótido modificado.
Si, tras cualquier ciclo de secuenciación, una molécula de molde no está asociada con ningún indicador, la secuencia se marca en consecuencia en este punto para indicar una "detención". En la siguiente ronda de secuenciación, la molécula de molde puede asociarse entonces con un indicador, es decir, la molécula "detenida" reanuda la extensión permitiendo obtenerse datos de secuencia. Sin embargo, la molécula de molde puede seguir careciendo de asociación con ningún indicador durante más de un ciclo, y la secuencia se marcará como una detención para cada ciclo respectivo.
Un marcador posicional generado durante la secuenciación será útil para interpretar huecos en las alineaciones cuando se compare con la secuencia generada con secuencias de referencia o con otras secuencias generadas durante el procedimiento de secuenciación usando uno de los algoritmos de alineación conocidos por los expertos en la técnica.
Es posible predecir posiciones de incorporación errónea conociendo las propiedades inherentes de las ligasas y polimerasas pertinentes usadas. Por ejemplo, los expertos en la técnica conocen que las secuencias cebadoras que contienen una base terminal con apareamiento erróneo son moldes peores para polimerasas, con eficacias de extensión de entre 10^{2} a 10^{6} veces inferiores a las secuencias apareadas (véase Huang, M., N. Arnheim, y M. Goodman, Nucleic Acids Res, 1992. 20(17): págs. 4567-73., Tindall KR, K. T., Biochemistry, 1988. 27(16): págs. 6008-13, Esteban, J., M. Salas, y L. Blanco, J Biol Chem,1993. 268(4): págs. 2719-26). Las moléculas que permanecen detenidas durante varios ciclos, o al final del protocolo de secuenciación, tienen por tanto una posibilidad mucho mayor de contener un apareamiento erróneo terminal. Por tanto, se marcan los moldes que experimentan tales detenciones en la posición de llamada de última base como terminaciones posibles debidas a apareamientos erróneos. La identificación del fragmento secuenciado se logra entonces mediante alineamiento con una secuencia de referencia y otros moldes secuenciados a partir de la misma muestra. Los apareamientos erróneos que se producen en posiciones marcadas es más probable que resulten de incorporaciones erróneas en vez de representar la verdadera secuencia y por tanto pueden interpretarse en consecuencia.
El número de ciclos para el que se detiene una molécula de molde puede contarse mediante detección sucesiva de una falta de indicador incorporado. Puede fijarse un umbral para la posibilidad de detenciones sucesivas resultantes por casualidad durante en análisis de los datos de secuencia. El umbral sobre el que las detenciones sucesivas pueden clasificarse como que resultan de un apareamiento erróneo dependerá de la eficacia de marcaje o bien mediante extensión de bases dependiente de polimerasa, o bien mediante ligación dependiente de secuencia. Por ejemplo, si el umbral para la posibilidad de detenciones sucesivas resultantes por casualidad se fija al 1x10^{-6}% se contarán los siguientes números de detenciones, teniendo en cuenta diferentes eficacias de marcaje, antes de contar la detención como un apareamiento erróneo.
Eficacia de marcaje por extensión de cebador, o ligación Número de detenciones encontradas antes de superar un
de términos cohesivos punto de corte de posibilidad del 1x10^{-6}%
99,9% 3
99,5% 4
99% 4
95% 5
90% 6
80% 8
Para una mayor certeza, puede aumentarse el umbral apropiadamente. El grado de certeza requerido dependerá de la tolerancia de la aplicación de secuenciación; puede tolerarse un punto de corte menos riguroso si el objetivo es simplemente identificar los fragmentos de molde, en vez de determinar con precisión las diferencias de secuencia. El efecto de una eficacia inferior de una incorporación de etiqueta también puede compensarse mediante el grado redundancia de secuenciación. La probabilidad de una incorporación errónea, en este caso, se trata de manera estadística.
La formación de imágenes y localización de moléculas individuales, principalmente mediante fluorescencia, es familiar para los expertos en la técnica (véase Trabesinger, W., et al., Anal Chem., 1999. 71(1): págs. 279-83, Harms, G., et al., Biophys. J., 1999. 177: págs. 2864-2870, Deschryver, F., Pure & Appl. Chem, 1998. 70: págs. 2147-2156., Bartko, A. y R. Dickson, J Phys Chem B, 1999. 103: págs. 11237-11241). Por tanto, se generan fácilmente archivos de datos que contienen información referente a la ubicación y tipo de etiqueta. En una realización de esta invención, el análisis de los datos de secuencia se realiza al final del procedimiento de secuenciación y después de haber adquirido todos los datos de secuenciación. Estos datos, en uno o más archivos, pueden analizarse para determinar las ubicaciones de moldes e identificar cualquier indicador unido en estas posiciones. Tales datos se someten entonces a un análisis secundario para construir secuencias para todos los moldes localizados.
Preferiblemente, se realizan de manera simultánea ciclos de reacción de secuenciación y análisis de datos. En este caso, los datos generados de cada ciclo se analizan para localizar moléculas indicadoras, estas ubicaciones se correlacionan entonces con las ubicaciones de los moldes. Las secuencias para cada molde localizado pueden construirse en cada ciclo sucesivo.
El procedimiento preferido de realización de la invención se describirá ahora haciendo referencia a la figura 1.
En el sistema ilustrado en la figura 1, las moléculas que deben secuenciarse se han fijado sobre fases sólidas mediante procedimientos convencionales tal como se describe en la técnica. (Revisado en Schena (ed.), DNA Microarrays: A practical approach, Oxford University Press (1999) ISBN: 0199637768). El molde, unido a una superficie sólida tal como un portaobjetos de microscopio, se marca de manera que puede determinarse su posición cuando se observa el portaobjetos a través de un explorador de microscopio fluorescente, por ejemplo. En la etapa 10, se localiza en primer lugar un molde relevante.
Ahora se realizan, etapa 12, las reacciones de secuenciación que implican la incorporación de bases que puede realizarse extendiendo el molde con una enzima polimerasa o ligando un oligonucleótido marcado con una ligasa.
Tal como se describió anteriormente, la etapa de secuenciación dará como resultado la unión de una molécula indicadora a la primera base en la secuencia del molde, y la detección del resto indicador que se incorpora permite asignar la identidad de la base que debe asignarse, etapa 14. La siguiente etapa, etapa 16, es correlacionar las ubicaciones de base y molde; en este primer ciclo ésta es una etapa trivial. Entonces se realiza una determinación sobre si la molécula de molde está asociada con un indicador. Es decir, en la etapa 18 se realiza una prueba sobre si el molde objeto tiene un indicador o no. Si tras la operación de secuenciación el molde está asociado con un indicador, el procedimiento avanza hacia la etapa 20. Aquí, se realiza una prueba para determinar si el indicador procede de un ciclo previo. Si no es así, entonces se identifica y se asigna una nueva base, etapa 22. Por tanto, se ha identificado correctamente la base y todo está bien.
Entonces el procedimiento avanza hacia la etapa 24 en la que se realiza una prueba sobre si hay más moldes. En ese caso, el procedimiento se repite desde la etapa 18.
Si en la etapa 20 se determina que el indicador asociado a la base procede de un ciclo anterior, entonces no se asigna ninguna base, etapa 26, y el procedimiento avanza directamente hacia la etapa 24 y hacia el siguiente molde, si lo hay.
Si en la etapa 18 se encuentra que el molde no tiene un indicador, en la etapa 50 se realiza una comprobación sobre si el señalizador de apareamiento erróneo está encendido. El señalizador de apareamiento erróneo se activa cuando el número de detenciones consecutivas supera el máximo predeterminado, según una prueba realizada en la etapa 30. Si el señalizador de apareamiento erróneo no está encendido, el procedimiento avanza hacia la etapa 28, y se inserta una detención D en la secuencia. Además, se aumenta en uno un contador de detenciones, que monitoriza el número de detenciones consecutivas que se producen. Se realiza una prueba en la etapa 30 para determinar si el número de detenciones consecutivas supera un umbral o valor máximo predeterminado. En caso contrario, el procedimiento avanza hacia la etapa 24 dejando la detención en la secuencia. Si el número de detenciones consecutivas supera el máximo predeterminado, entonces se puntúa la base anterior como con apareamiento erróneo y se activa el señalizador de apareamiento erróneo, etapa 32, y entonces el procedimiento avanza hacia la etapa 24.
El indicador de detención sirve para la función de proporcionar una indicación de una base desconocida. Puede resultar ser una cualquiera de las bases A, C, G y T, o de hecho puede resultar no ser ninguna base. Al prever la posibilidad de una base desconocida, no se descarta completamente la información para ese molde. En vez de eso, todavía puede usarse, por ejemplo con respecto a una secuencia de referencia, tal como se describe en los ejemplos siguientes.
Si en la etapa 20 se determina que el indicador procede de un ciclo anterior, en la etapa 52 se realiza una comprobación sobre si el señalizador de apareamiento erróneo está encendido. Si el señalizador de apareamiento erróneo no está encendido, entonces el procedimiento avanza hacia la etapa 22 y se asigna una base. Entonces el procedimiento avanza hacia la etapa 24 para determinar si hay otro molde para tratar.
Si el señalizador de apareamiento erróneo está encendido, en la etapa 54 se sustituye la base previamente asignada con un código IUB que representa todas las otras bases excepto la que estaba apareada erróneamente. Esto es porque si la base anterior estaba marcada como "C" pero se sabe que esto era un apareamiento erróneo, queda claro que la base es A, G o T.
Cuando no hay más moldes, la prueba en la etapa 24 tiene el resultado NO, y el procedimiento avanza hacia la etapa 34, en la que se realiza una determinación sobre si hay más ciclos que deben completarse, es decir, si hay más bases para esa molécula. Si las hay, el procedimiento avanza hacia los datos para el siguiente ciclo, etapa 36, tras lo cual el procedimiento avanza de nuevo desde la etapa 16, con correlación de las ubicaciones de molde y base.
Eventualmente, la prueba en la etapa 34 tendrá el resultado NO, y esto conduce al final del procedimiento, etapa 38.
Pueden aplicarse tratamientos posteriores a la secuencia tal como se produce por el sistema de la figura 1, por ejemplo para comparar la secuencia encontrada mediante el procedimiento con una secuencia de referencia. A continuación se describen ejemplos de esto.
Las etapas mostradas en la figura 1, posteriores a las etapas 10 a 14 que implican reacciones químicas, se realizan en un ordenador digital tal como un ordenador personal (PC). Se muestran dos ejemplos en más detalle a modo de pseudocódigo en el apéndice de esta memoria descriptiva. El primer pseudocódigo supone que se requieren los nucleótidos por una mezcla de las cuatro bases A, C, G, y T, y el segundo pseudocódigo es para su uso cuando las cuatro bases se usan por separado en la secuencia.
La presente invención tiene muchas aplicaciones, algunas de las cuales se facilitan en el presente documento. Por ejemplo, puede determinarse la secuencia de genomas de ADN y ARN usando este procedimiento. Además, pueden identificarse las variaciones de secuencia en regiones o genomas enteros, representaciones de ARNm de regiones o genomas enteros o en representaciones generadas artificialmente de un genoma (por ejemplo, productos de PCR de regiones de un genoma) que resultan de substituciones, deleciones o inserciones de una o más bases.
\global\parskip0.950000\baselineskip
La presente invención tiene aplicación en la determinación de haplotipo (determinación de diferencias de secuencia entre pares de cromosomas en un individuo) y también en el análisis de la expresión de ARNm cuantitativa, por ejemplo para comparar niveles de expresión de ARNm entre muestras derivadas de distintos tipos celulares (tejidos) o células tratadas de manera diferente. Esta técnica también puede aplicarse para identificar secuencias derivadas de genomas de patógenos para su uso en la detección e identificación de patógenos.
Ahora se facilitan ejemplos del modo en que se tratan secuencias específicas por el sistema de tal manera que se reducen errores en la secuencia determinada.
Ejemplo 1
La siguiente secuencia se obtiene a partir de una reacción de secuenciación:
GATCGGCTGACCATGGAC1
en la que 1 indica que se ha incorporado una T (y 2=C, 3=A, 4=G).
Un fallo de extensión adicional para el número de ciclos umbral da como resultado el marcaje de la secuencia para indicar que se ha incorporado erróneamente una base antes del número de detenciones umbral. Aquí, un 1 (uno) indica que se ha incorporado una T antes de un número de detenciones por encima del nivel de umbral determinado y por tanto es probable que se haya incorporado erróneamente. Por tanto, puede descartarse la secuencia. Haciendo referencia a la figura 1, el procedimiento sigue la ruta 28, 30 durante un número predeterminado de etapas, hasta que el resultado en la etapa 30 es SÍ, y la base anterior se marca como con apareamiento erróneo en la etapa 32. En lugar de un 1, para las otras bases se usa 2, 3 ó 4, indicando 2 una C, indicando 3 una A, e indicando 4 una G.
Ejemplo 2
Las siguientes secuencias se obtienen de una reacción de secuenciación. La primera es una secuencia recién determinada y la segunda es una secuencia de referencia:
GATCGGCTGACCATGGACC1CTGACAGT
GATCGGCTGACCATGGACCTCTGACAGT
Detener durante más tiempo que el número de ciclos umbral marca un 1 para T como una incorporación errónea. En este caso, la secuenciación se ha reanudado tras el número de secuencias umbral. Cuando la secuencia obtenida se compara con la secuencia de referencia, la alineación de secuencias demuestra una alineación T.1 en la posición detenida. Por tanto, puede descartarse como una diferencia de base real con la secuencia de referencia. La alineación de secuencias representa una fase adicional al tratamiento ilustrado en la figura 1.
Ejemplo 3
Cuando se encuentra una detención durante la secuenciación, su posición se marca como D. Si se obtienen las siguientes secuencias nueva y de referencia:
GATCGGCTGACCATGGADCCTCTGACAGT
GATCGGCTGACCATGGACCTCTGACAGT
la alineación de secuencias con la secuencia de referencia en presencia o ausencia de un hueco en la posición marcada con una D revela que era una detención. Por tanto, toda la secuencia es contigua y útil. La alineación de secuencias representa de nuevo una fase adicional al tratamiento ilustrado en la figura 1.
Ejemplo 4
Se obtiene la siguiente secuencia en una reacción de secuenciación:
GATCGGCTGACCATGGDCCTCTGACAGT
GATCGGCTGACCATGGACCTCTGACAGT
La posición marcada como D es la incorporación de una base con un indicador que ha fallado. La alineación de secuencias con una secuencia de referencia en presencia o ausencia de un hueco en la posición marcada revela que esto representa un hueco en la secuencia. La secuencia extraída sigue siendo útil. En este caso, la D puede sustituirse con una "N" para representar un hueco en la secuencia. La alineación de secuencias representa de nuevo una fase adicional al tratamiento ilustrado en la figura 1.
100
101

Claims (8)

1. Un procedimiento para determinar la secuencia de un ácido nucleico en el que se añaden nucleótidos secuencialmente a un cebador en un molde, estando dicho molde unido a un soporte sólido, que comprende las etapas de
a)
hibridar un cebador al molde, comprendiendo dicho molde el ácido nucleico para el que se requiere la secuencia, para formar un complejo de molde-cebador,
b)
asignar uno o más nucleótidos marcados, que comprenden uno o más de A, C, G o T, y extender el cebador mediante una ADN polimerasa o una ligasa intentando añadir el nucleótido marcado único, proporcionándose el marcaje mediante un resto indicador,
c)
determinar el tipo o identidad del nucleótido marcado con indicador añadido al cebador, de manera que se identifica un nucleótido en la secuencia del molde,
d)
eliminar o neutralizar el resto indicador,
e)
repetir las etapas b) a d) secuencialmente en cada ciclo siguiente y registrar el orden de incorporación de nucleótidos marcados con indicador,
f)
determinar si un resto indicador puede detectarse en la etapa c) de cada ciclo,
g)
si el resto indicador no puede detectarse en la etapa c) de cada ciclo, introduciendo un indicador de detención en la secuencia para proporcionar una indicación de una base desconocida,
h)
si el resto indicador no puede detectarse, determinar si el número de indicadores de detención consecutivos supera un umbral predeterminado y, en ese caso, asignar un señalizador de apareamiento erróneo,
i)
si el resto indicador puede detectarse en la etapa c) y no se ha identificado en la iteración anterior de las etapas b) a d) o si no se detecta señalizador de apareamiento erróneo, asignar la base correspondiente a la secuencia,
j)
si el resto indicador puede detectarse en la etapa c) y se ha identificado en la iteración anterior de las etapas b) a d) y si se detecta el señalizador de apareamiento erróneo, sustituir la base previamente asignada con un código IUB para todas las demás bases, y
k)
si no puede detectarse el resto indicador en la etapa c) y si se observa ausencia del resto indicador para menos de un número umbral predeterminado de una o más iteraciones de las etapas b) a d) entonces el nucleótido correspondiente al indicador en la iteración actual de las etapas b) a d) se incorpora a la secuencia de manera contigua a la base previamente incorporada.
2. Procedimiento según la reivindicación 1, en el que se anota un marcador posicional en la secuencia entre el nucleótido incorporado en la iteración actual de b) a d) y el nucleótido que lo precede para indicar un posible hueco en la secuencia.
3. Procedimiento según la reivindicación 1 ó 2, que comprende adicionalmente la etapa de determinar la posición del molde detectando la ubicación del resto indicador.
4. Procedimiento según la reivindicación 3, en el que la ubicación del molde se determina detectando el resto indicador unido al molde.
5. Procedimiento según la reivindicación 3, en el que la ubicación del molde se determina detectando un resto indicador unido al cebador.
6. Procedimiento según la reivindicación 1, en el que cualquier adición posterior se considera una continuación de la secuencia.
7. Procedimiento según la reivindicación 6 en el que se anota un marcador posicional en la secuencia entre el nucleótido incorporado en la iteración actual de b) a d) y el nucleótido que lo precede para indicar un posible hueco en la secuencia.
8. Un medio de código de programa informático para realizar todas las etapas según una cualquiera de las reivindicaciones 1 a 7, cuando se ejecuta dicho programa en un ordenador.
ES01949637T 2000-07-05 2001-07-02 Procedimiento para el analisis de secuencias. Expired - Lifetime ES2281426T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0016472 2000-07-05
GBGB0016472.3A GB0016472D0 (en) 2000-07-05 2000-07-05 Sequencing method and apparatus

Publications (1)

Publication Number Publication Date
ES2281426T3 true ES2281426T3 (es) 2007-10-01

Family

ID=9895041

Family Applications (1)

Application Number Title Priority Date Filing Date
ES01949637T Expired - Lifetime ES2281426T3 (es) 2000-07-05 2001-07-02 Procedimiento para el analisis de secuencias.

Country Status (11)

Country Link
US (1) US7133782B2 (es)
EP (1) EP1297484B1 (es)
JP (1) JP2004501669A (es)
AT (1) ATE353455T1 (es)
AU (1) AU2001270760A1 (es)
CA (1) CA2412973A1 (es)
DE (1) DE60126491T2 (es)
ES (1) ES2281426T3 (es)
GB (1) GB0016472D0 (es)
IL (1) IL153472A0 (es)
WO (1) WO2002003305A2 (es)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7875440B2 (en) 1998-05-01 2011-01-25 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US6780591B2 (en) 1998-05-01 2004-08-24 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US7056661B2 (en) 1999-05-19 2006-06-06 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
US7501245B2 (en) 1999-06-28 2009-03-10 Helicos Biosciences Corp. Methods and apparatuses for analyzing polynucleotide sequences
EP1354064A2 (en) 2000-12-01 2003-10-22 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
WO2002072892A1 (en) 2001-03-12 2002-09-19 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences by asynchronous base extension
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
WO2005080605A2 (en) 2004-02-19 2005-09-01 Helicos Biosciences Corporation Methods and kits for analyzing polynucleotide sequences
CA2566806A1 (en) 2004-05-25 2006-01-19 Helicos Biosciences Corporation Methods and devices for nucleic acid sequence determination
US7476734B2 (en) 2005-12-06 2009-01-13 Helicos Biosciences Corporation Nucleotide analogs
AU2005296200B2 (en) 2004-09-17 2011-07-14 Pacific Biosciences Of California, Inc. Apparatus and method for analysis of molecules
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
US7220549B2 (en) 2004-12-30 2007-05-22 Helicos Biosciences Corporation Stabilizing a nucleic acid for nucleic acid sequencing
US7482120B2 (en) 2005-01-28 2009-01-27 Helicos Biosciences Corporation Methods and compositions for improving fidelity in a nucleic acid synthesis reaction
US7805081B2 (en) * 2005-08-11 2010-09-28 Pacific Biosciences Of California, Inc. Methods and systems for monitoring multiple optical signals from a single source
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
US7405281B2 (en) * 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
US7763423B2 (en) * 2005-09-30 2010-07-27 Pacific Biosciences Of California, Inc. Substrates having low density reactive groups for monitoring enzyme activity
US7998717B2 (en) * 2005-12-02 2011-08-16 Pacific Biosciences Of California, Inc. Mitigation of photodamage in analytical reactions
US7692783B2 (en) * 2006-02-13 2010-04-06 Pacific Biosciences Of California Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources
US7995202B2 (en) * 2006-02-13 2011-08-09 Pacific Biosciences Of California, Inc. Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources
US7715001B2 (en) * 2006-02-13 2010-05-11 Pacific Biosciences Of California, Inc. Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources
CA2637617C (en) * 2006-02-16 2018-09-18 454 Life Sciences Corporation System and method for correcting primer extension errors in nucleic acid sequence data
US8364417B2 (en) 2007-02-15 2013-01-29 454 Life Sciences Corporation System and method to correct out of phase errors in DNA sequencing data by use of a recursive algorithm
US7397546B2 (en) 2006-03-08 2008-07-08 Helicos Biosciences Corporation Systems and methods for reducing detected intensity non-uniformity in a laser beam
US8975216B2 (en) * 2006-03-30 2015-03-10 Pacific Biosciences Of California Articles having localized molecules disposed thereon and methods of producing same
US20080050747A1 (en) * 2006-03-30 2008-02-28 Pacific Biosciences Of California, Inc. Articles having localized molecules disposed thereon and methods of producing and using same
US7563574B2 (en) 2006-03-31 2009-07-21 Pacific Biosciences Of California, Inc. Methods, systems and compositions for monitoring enzyme activity and applications thereof
US8053191B2 (en) 2006-08-31 2011-11-08 Westend Asset Clearinghouse Company, Llc Iterative nucleic acid assembly using activation of vector-encoded traits
AU2007289057C1 (en) * 2006-09-01 2014-01-16 Pacific Biosciences Of California, Inc. Substrates, systems and methods for analyzing materials
US8207509B2 (en) 2006-09-01 2012-06-26 Pacific Biosciences Of California, Inc. Substrates, systems and methods for analyzing materials
US20080080059A1 (en) * 2006-09-28 2008-04-03 Pacific Biosciences Of California, Inc. Modular optical components and systems incorporating same
US20100167413A1 (en) * 2007-05-10 2010-07-01 Paul Lundquist Methods and systems for analyzing fluorescent materials with reduced autofluorescence
US20080277595A1 (en) * 2007-05-10 2008-11-13 Pacific Biosciences Of California, Inc. Highly multiplexed confocal detection systems and methods of using same
US7811810B2 (en) 2007-10-25 2010-10-12 Industrial Technology Research Institute Bioassay system including optical detection apparatuses, and method for detecting biomolecules
US7767441B2 (en) * 2007-10-25 2010-08-03 Industrial Technology Research Institute Bioassay system including optical detection apparatuses, and method for detecting biomolecules
CN102084001B (zh) 2008-03-28 2015-03-18 加利福尼亚太平洋生物科学股份有限公司 用于核酸测序的组合物和方法
US8808986B2 (en) 2008-08-27 2014-08-19 Gen9, Inc. Methods and devices for high fidelity polynucleotide synthesis
CA2974241C (en) 2008-09-16 2020-01-07 Pacific Biosciences Of California, Inc. Substrates and optical systems and methods of use thereof
US8501406B1 (en) 2009-07-14 2013-08-06 Pacific Biosciences Of California, Inc. Selectively functionalized arrays
US10207240B2 (en) 2009-11-03 2019-02-19 Gen9, Inc. Methods and microfluidic devices for the manipulation of droplets in high fidelity polynucleotide assembly
US9216414B2 (en) 2009-11-25 2015-12-22 Gen9, Inc. Microfluidic devices and methods for gene synthesis
US9217144B2 (en) 2010-01-07 2015-12-22 Gen9, Inc. Assembly of high fidelity polynucleotides
US9646134B2 (en) 2010-05-25 2017-05-09 The Regents Of The University Of California Bambam: parallel comparative analysis of high-throughput sequencing data
CA2797645C (en) 2010-05-25 2020-09-22 The Regents Of The University Of California Bambam: parallel comparative analysis of high-throughput sequencing data
EP2952590B1 (en) 2010-06-11 2017-07-26 Life Technologies Corporation Alternative nucleotide flows in sequencing-by-synthesis methods
US8834847B2 (en) 2010-08-12 2014-09-16 Pacific Biosciences Of California, Inc. Photodamage mitigation compounds and systems
US10273540B2 (en) 2010-10-27 2019-04-30 Life Technologies Corporation Methods and apparatuses for estimating parameters in a predictive model for use in sequencing-by-synthesis
EP2633470B1 (en) 2010-10-27 2016-10-26 Life Technologies Corporation Predictive model for use in sequencing-by-synthesis
JP6118725B2 (ja) 2010-11-12 2017-04-19 ジェン9・インコーポレイテッドGen9,INC. 核酸合成のための方法およびデバイス
WO2012064975A1 (en) 2010-11-12 2012-05-18 Gen9, Inc. Protein arrays and methods of using and making the same
US9594870B2 (en) 2010-12-29 2017-03-14 Life Technologies Corporation Time-warped background signal for sequencing-by-synthesis operations
US20130060482A1 (en) 2010-12-30 2013-03-07 Life Technologies Corporation Methods, systems, and computer readable media for making base calls in nucleic acid sequencing
EP3582224A1 (en) 2010-12-30 2019-12-18 Life Technologies Corporation Models for analyzing data from sequencing-by-synthesis operations
WO2012092515A2 (en) 2010-12-30 2012-07-05 Life Technologies Corporation Methods, systems, and computer readable media for nucleic acid sequencing
EP3366782B1 (en) 2011-04-08 2021-03-10 Life Technologies Corporation Phase-protecting reagent flow orderings for use in sequencing-by-synthesis
US9752176B2 (en) 2011-06-15 2017-09-05 Ginkgo Bioworks, Inc. Methods for preparative in vitro cloning
US20130059296A1 (en) 2011-08-26 2013-03-07 Gen9, Inc. Compositions and Methods For High Fidelity Assembly of Nucleic Acids
US20150087537A1 (en) 2011-08-31 2015-03-26 Life Technologies Corporation Methods, Systems, Computer Readable Media, and Kits for Sample Identification
US10704164B2 (en) 2011-08-31 2020-07-07 Life Technologies Corporation Methods, systems, computer readable media, and kits for sample identification
KR101295784B1 (ko) * 2011-10-31 2013-08-12 삼성에스디에스 주식회사 목표 유전체 서열 내의 신규서열 생성 장치 및 방법
US9150853B2 (en) 2012-03-21 2015-10-06 Gen9, Inc. Methods for screening proteins using DNA encoded chemical libraries as templates for enzyme catalysis
EP4001427A1 (en) 2012-04-24 2022-05-25 Gen9, Inc. Methods for sorting nucleic acids and multiplexed preparative in vitro cloning
US9646132B2 (en) 2012-05-11 2017-05-09 Life Technologies Corporation Models for analyzing data from sequencing-by-synthesis operations
AU2013280661A1 (en) 2012-06-25 2015-01-22 Gen9, Inc. Methods for nucleic acid assembly and high throughput sequencing
US10329608B2 (en) 2012-10-10 2019-06-25 Life Technologies Corporation Methods, systems, and computer readable media for repeat sequencing
US20140296080A1 (en) 2013-03-14 2014-10-02 Life Technologies Corporation Methods, Systems, and Computer Readable Media for Evaluating Variant Likelihood
US9926597B2 (en) 2013-07-26 2018-03-27 Life Technologies Corporation Control nucleic acid sequences for use in sequencing-by-synthesis and methods for designing the same
WO2015051338A1 (en) 2013-10-04 2015-04-09 Life Technologies Corporation Methods and systems for modeling phasing effects in sequencing using termination chemistry
US10676787B2 (en) 2014-10-13 2020-06-09 Life Technologies Corporation Methods, systems, and computer-readable media for accelerated base calling
US10978174B2 (en) 2015-05-14 2021-04-13 Life Technologies Corporation Barcode sequences, and related systems and methods
US10619205B2 (en) 2016-05-06 2020-04-14 Life Technologies Corporation Combinatorial barcode sequences, and related systems and methods

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5302509A (en) * 1989-08-14 1994-04-12 Beckman Instruments, Inc. Method for sequencing polynucleotides
EP0450060A1 (en) * 1989-10-26 1991-10-09 Sri International Dna sequencing
WO1993005183A1 (en) 1991-09-09 1993-03-18 Baylor College Of Medicine Method and device for rapid dna or rna sequencing determination by a base addition sequencing scheme
GB9208733D0 (en) * 1992-04-22 1992-06-10 Medical Res Council Dna sequencing method
US5552278A (en) 1994-04-04 1996-09-03 Spectragen, Inc. DNA sequencing by stepwise ligation and cleavage

Also Published As

Publication number Publication date
AU2001270760A1 (en) 2002-01-14
CA2412973A1 (en) 2002-01-10
WO2002003305A2 (en) 2002-01-10
DE60126491T2 (de) 2007-11-15
DE60126491D1 (de) 2007-03-22
US7133782B2 (en) 2006-11-07
EP1297484A2 (en) 2003-04-02
EP1297484B1 (en) 2007-02-07
US20030186276A1 (en) 2003-10-02
JP2004501669A (ja) 2004-01-22
GB0016472D0 (en) 2000-08-23
IL153472A0 (en) 2003-07-06
ATE353455T1 (de) 2007-02-15
WO2002003305A3 (en) 2002-08-01

Similar Documents

Publication Publication Date Title
ES2281426T3 (es) Procedimiento para el analisis de secuencias.
ES2961338T3 (es) Supresión de errores en fragmentos de ADN secuenciados utilizando lecturas redundantes con índices moleculares únicos (UMI)
US11761035B2 (en) Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths
ES2989056T3 (es) Método de secuenciación usando adaptadores cortos universales para la indexación de muestras de polinucleótidos
ES2986436T3 (es) Sistema de secuenciación segura
CN110997937A (zh) 具有可变长度非随机独特分子标识符的通用短衔接子
BR112021006402A2 (pt) Ferramenta baseada em sequência-gráfico para determinar a variação em regiões curtas de repetição em tandem
RU2799654C2 (ru) Инструмент на основе графов последовательностей для определения вариаций в областях коротких тандемных повторов
BR122024025321A2 (pt) Método para alinhar leituras de sequência com uma região genômica
BR122021025693B1 (pt) Supressão de erro em fragmentos de dna sequenciados utilizando leituras redundantes com índices moleculares únicos (umis)
BR112017024118B1 (pt) Supressão de erro em fragmentos de dna sequenciados utilizando leituras redundantes com índices moleculares únicos (umis)
NZ795518A (en) Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths