ES2281426T3 - Procedimiento para el analisis de secuencias. - Google Patents
Procedimiento para el analisis de secuencias. Download PDFInfo
- Publication number
- ES2281426T3 ES2281426T3 ES01949637T ES01949637T ES2281426T3 ES 2281426 T3 ES2281426 T3 ES 2281426T3 ES 01949637 T ES01949637 T ES 01949637T ES 01949637 T ES01949637 T ES 01949637T ES 2281426 T3 ES2281426 T3 ES 2281426T3
- Authority
- ES
- Spain
- Prior art keywords
- sequence
- indicator
- mold
- base
- nucleotide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Un procedimiento para determinar la secuencia de un ácido nucleico en el que se añaden nucleótidos secuencialmente a un cebador en un molde, estando dicho molde unido a un soporte sólido, que comprende las etapas de a) hibridar un cebador al molde, comprendiendo dicho molde el ácido nucleico para el que se requiere la secuencia, para formar un complejo de molde-cebador, b) asignar uno o más nucleótidos marcados, que comprenden uno o más de A, C, G o T, y extender el cebador mediante una ADN polimerasa o una ligasa intentando añadir el nucleótido marcado único, proporcionándose el marcaje mediante un resto indicador, c) determinar el tipo o identidad del nucleótido marcado con indicador añadido al cebador, de manera que se identifica un nucleótido en la secuencia del molde, d) eliminar o neutralizar el resto indicador, e) repetir las etapas b) a d) secuencialmente en cada ciclo siguiente y registrar el orden de incorporación de nucleótidos marcados con indicador, f) determinar si un resto indicador puede detectarse en la etapa c) de cada ciclo, g) si el resto indicador no puede detectarse en la etapa c) de cada ciclo, introduciendo un indicador de detención en la secuencia para proporcionar una indicación de una base desconocida, h) si el resto indicador no puede detectarse, determinar si el número de indicadores de detención consecutivos supera un umbral predeterminado y, en ese caso, asignar un señalizador de apareamiento erróneo, i) si el resto indicador puede detectarse en la etapa c) y no se ha identificado en la iteración anterior de las etapas b) a d) o si no se detecta señalizador de apareamiento erróneo, asignar la base correspondiente a la secuencia, j) si el resto indicador puede detectarse en la etapa c) y se ha identificado en la iteración anterior de las etapas b) a d) y si se detecta el señalizador de apareamiento erróneo, sustituir la base previamente asignada con un código IUB para todas las demás bases, y k) si no puede detectarse el resto indicador en la etapa c) y si se observa ausencia del resto indicador para menos de un número umbral predeterminado de una o más iteraciones de las etapas b) a d) entonces el nucleótido correspondiente al indicador en la iteración actual de las etapas b) a d) se incorpora a la secuencia de manera contigua a la base previamente incorporada.
Description
Procedimiento para el análisis de
secuencias.
La presente invención se refiere a un
procedimiento de secuenciación y aparato que permite la corrección
de errores durante la secuenciación de moléculas individuales.
La secuenciación se realiza de manera rutinaria
mediante el procedimiento de la terminación de cadenas y separación
en gel, esencialmente tal como se describe por Sanger, F., S.
Nicklen, y A. Coulson (Proc Natl Acad Sci USA, 1977. 74(12);
págs. 5463-7). El procedimiento se basa en la
generación de una población mixta de fragmentos de ADN que
representan terminaciones en cada base en la secuencia. Entonces se
determina la secuencia mediante separación electroforética de estos
fragmentos.
Esfuerzos recientes para aumentar el rendimiento
de secuenciación han dado como resultado el desarrollo de
procedimientos alternativos que eliminan la etapa de separación
electroforética. Varios de estos procedimientos utilizan la
extensión de bases (es decir, adición de bases) y se han descrito,
por ejemplo, en los documentos WO 93/21340, US 5.302.509 y US
5.547.839. En estos procedimientos, los moldes o cebadores se
inmovilizan sobre una superficie sólida antes de la exposición a
reactivos para su secuenciación. Las moléculas inmovilizadas se
incuban en presencia de análogos de nucleótidos que tienen una
modificación en el carbono en 3' del residuo de azúcar que bloquea
reversiblemente el grupo hidroxilo en esa posición. La incorporación
de tales nucleótidos modificados por una polimerasa garantiza que
sólo se añade un nucleótido durante cada ciclo de extensión de
bases. Entonces se detecta la base añadida en virtud de una etiqueta
que se ha incorporado en el grupo bloqueante en 3'. Tras la
detección, el grupo bloqueante se elimina (o "corta"),
normalmente por medios fotoquímicos para exponer un grupo hidroxilo
libre que está disponible para la adición de bases durante el
siguiente ciclo.
Generalmente, los enfoques no basados en la
separación se basan en la presencia de grandes números de moléculas
de molde para cada secuencia diana para generar una secuencia
consenso a partir de una diana dada. Por tanto, por ejemplo, pueden
aplicarse reacciones de extensión de bases a múltiples moldes
analizando puntos diferenciados de ácido nucleico, que comprenden
cada uno una multiplicidad de moléculas, inmovilizado en una red
espacialmente direccionable.
Sin embargo, las reacciones de incorporación de
terminador/corte, o escisión de bases son propensas a errores. Por
ejemplo, tal como se describió anteriormente, las estrategias de
extensión de bases han utilizado generalmente análogos de
nucleótidos que combinan las funciones de una molécula indicadora,
normalmente un flúor, con las de un terminador que ocupa la
posición en 3' en un resto de azúcar. La naturaleza voluminosa del
grupo y su posición hacen estos compuestos sustratos sumamente
ineficaces para polimerasas. Además, el corte del grupo terminador
para permitir las adiciones posteriores también está sometido a
ineficacias. En presencia de miles, o preferiblemente millones, de
moléculas para cada diana, incluso errores modestos de menos del 5%
dan como resultado una pérdida acumulativa de sincronía, entre la
multiplicidad de las cadenas que representan cada molécula, dentro
de un pequeño número de ciclos. Por tanto, con cada ciclo de
secuenciación el ruido de fondo aumenta progresivamente con un
deterioro consecuente de la señal con cada adición. Esto significa
que el número de bases de datos de secuencia que pueden obtenerse
está limitado antes de que la señal específica no pueda
distinguirse del fondo.
Avances recientes en procedimientos de detección
de moléculas individuales (descritos, por ejemplo, en Trabesinger,
W., et al., Anal Chem., 1999. 71(1); págs.
279-83 y el documento WO 00/06770) hacen posible
aplicar estrategias de secuenciación a moléculas individuales. Sin
embargo, la secuenciación, cuando se aplica a poblaciones clonales
de moléculas, es un procedimiento estocástico que da como resultado
que algunas moléculas experimenten reacciones mientras que otras
permanezcan sin modificarse. Por tanto, en procedimientos de
secuenciación convencionales, los errores tales como
incorporaciones erróneas no son normalmente de significación grave
ya que los grandes números de moléculas presentes garantizan que se
obtiene una señal consenso. Cuando estas reacciones se aplican a
moléculas individuales, los resultados se cuantifican
eficazmente.
Uno de tales procedimientos de secuenciación de
moléculas individuales se basa en la escisión de bases y se
describe, por ejemplo, en Hawkins, G. y L. Hoffman, Nature
Biotechnology, 1997. vol. 15; págs. 803-804 y el
documento US 5.674.743. Con esta estrategia, se generan moléculas de
molde individuales de tal manera que cada base está marcada con un
indicador apropiado. Las moléculas de molde se digieren con
exonucleasa y se monitorizan e identifican las bases escindidas. Ya
que estos procedimientos utilizan enzimas sumamente procesivas
tales como Lambda exonucleasa, hay potencial para analizar moldes
grandes de varios kilobases de longitud. Sin embargo, la
monitorización continua de bases escindidas a partir de cada
molécula de molde en tiempo real limita el número de moléculas que
pueden analizarse en paralelo. Además, hay dificultades para generar
un molde en el que cada base está marcada con un indicador
apropiado de tal manera que las bases escindidas pueden detectarse
basándose en las propiedades ópticas o químicas intrínsecas.
\newpage
También se han adaptado procedimientos basados
en la extensión de bases (tales como BASS) al enfoque de moléculas
únicas.
Sin embargo, estas técnicas son propensas a
errores. En particular, la incorporación de nucleótidos modificados
puede fallar, por ejemplo, como resultado de la disminución de la
eficacia de la acción de la polimerasa con nucleótidos modificados.
Cuando la molécula indicadora es una molécula fluorescente, también
pueden producirse errores mediante el fallo de la fluorescencia
debido a que se pierde, se daña, se blanquea o se desexcita el
flúor. Al nivel de moléculas únicas, los fallos tales como estos
darán como resultado que no pueda obtenerse una secuencia
adecuada.
Es un objeto de la presente invención
proporcionar un procedimiento de secuenciación que permite que se
detecten los errores. Es un objeto adicional de la presente
invención permitir el análisis y la prevención de errores, o
corrección, monitorizando el destino de moléculas individuales
mediante reacciones de secuenciación.
La invención en sus diversos aspectos se define
en las reivindicaciones independientes siguientes, a las que debe
hacerse referencia ahora. Se exponen características ventajosas en
las reivindicaciones adjuntas.
Brevemente, en una realización preferida de la
invención que toma la forma de un procedimiento de análisis de una
secuencia de nucleótidos, se obtiene una secuencia de bases a partir
de un molde, y se identifica una base en la secuencia como una base
desconocida. Se incluye un indicador "desconocido" en la
secuencia en la posición correspondiente a la base desconocida, y
se genera una secuencia de salida que contiene el indicador de base
desconocido. En la realización preferida, la secuencia de bases se
obtiene a partir del molde mediante evaluación de un indicador y
asignación de las bases según el mismo. Se realiza una determinación
sobre si el indicador procede de un ciclo precedente de
determinación de bases, y si el indicador procede de un ciclo
precedente de determinación de bases, se descarta la asignación de
bases.
La secuencia de nucleótidos que debe analizarse
puede ser una secuencia de ARN o de ADN.
Ahora se describirá la invención en más detalle
a modo de ejemplo con referencia al dibujo adjunto en el que:
la figura 1 es un diagrama de flujo que ilustra
un procedimiento de análisis de datos obtenidos durante una
reacción para determinar la secuencia de una molécula biológica, tal
como una molécula de ácido nucleico, y formar una realización
preferida de la invención.
La figura 1 muestra un diagrama que ejemplifica
un procedimiento de obtención de una información de secuencia a
partir de un molde. El procedimiento compensa los errores (a)
identificando bases que se transfieren a partir de un ciclo
anterior y (b) detectando moléculas detenidas que pueden producirse
a partir de un fallo de marcaje o incorporación errónea de bases.
El procedimiento de análisis de datos emplea una reacción de
secuenciación convencional que se realiza tal como sigue. En primer
lugar, una molécula de ácido nucleico para la que se requieren
datos de secuencia, un molde, se une a una superficie sólida tal
como un portaobjetos de microscopio. El molde puede marcarse de
manera que pueda determinarse su posición cuando se observa el
portaobjetos a través de un explorador de microscopio fluorescente,
por ejemplo. Se consulta la primera base o nucleótido, es decir, A,
C, G, o T, en la secuencia del molde mediante reacción química
añadiendo una base fluorescentemente marcada o una etiqueta que
representa esa base. Puede ser una de A, C, G o T, o las cuatro
marcadas con cuatro etiquetas distinguibles diferentes. La primera
base en el molde se unirá a su base complementaria de una manera
bien conocida; es decir, A se une a T, y C se une a G, y viceversa.
La incorporación de bases puede realizarse extendiendo el molde con
una enzima de polimerasa o ligando un oligonucleótido marcado con
una ligasa. La incorporación de la base marcada se detecta y se
determina su identidad.
Entonces se elimina la etiqueta de esa base. Entonces se repite esta serie de etapas para las bases sucesivas en el molde.
Entonces se elimina la etiqueta de esa base. Entonces se repite esta serie de etapas para las bases sucesivas en el molde.
Reacciones de secuenciación convencionales
adecuadas que implican incorporación/adición de bases incluyen
reacciones de extensión de bases tales como las descritas en los
documentos WO 93/21340, US 5.302.509 y US 5.547.839 y técnicas
tales como las descritas en los documentos US 5.763.175, US
5.599.675, US 5.856.093 y US 5.715.330 en los que las rondas de
secuenciación sucesivas implican escisión de bases del molde antes
de la incorporación de la base posterior.
Cuando se realiza esta reacción de
secuenciación, pueden producirse errores. Por ejemplo, (i) puede
incorporarse incorrectamente una base, es decir, se incorpora
erróneamente, o (ii) puede no conseguir eliminarse una etiqueta de
un ciclo antes de realizar el siguiente ciclo, o (iii) puede fallar
la incorporación de una base en un ciclo cualquiera. En la
realización preferida de la invención que va a describirse, los
datos de las reacciones de secuencia se asimilan de tal manera que
los efectos de estos errores pueden reducirse.
Los procedimientos para la deposición y fijación
de moléculas sobre fases sólidas se conocen bien en la técnica. Los
procedimientos para unir ácidos nucleicos, por ejemplo, se revisan
en Schena (ed.), DNA Microarrays: A practical approach, Oxford
University Press (1999) ISBN: 0199637768. Normalmente, la fase
sólida será vidrio, aunque pueden usarse otros materiales tales
como plásticos o silicio amorfo o cristalino.
Puede unirse una pluralidad de moléculas a la
fase sólida en una red ordenada pero, más preferiblemente, se
unirán de una manera aleatoria. Una unión aleatoria de moléculas
puede comprender cualquier número de moléculas, distribuidas
preferiblemente con una densidad apropiada para la resolución óptica
de la información de secuencia.
Un resto indicador adecuado puede ser uno
cualquiera de varios sistemas indicadores conocidos. Puede ser un
radioisótopo por medio del que se hace fácilmente detectable el
análogo de nucleósido incorporado, por ejemplo ^{32}P, ^{33}P,
^{35}S incorporados en un grupo fosfato o tiofosfato o
H-fosfonato o alternativamente ^{3}H o ^{14}C o
un isótopo de yodo. Puede ser un isótopo detectable mediante
espectrometría de masas o RMN. Puede ser un resto de señal, por
ejemplo, una enzima, hapteno, fluoróforo, cromóforo, grupo
quimioluminiscente, etiqueta de Raman, etiqueta electroquímica, o
compuesto señal adaptado para la detección mediante espectrometría
de masas.
Cada etapa de secuenciación dará como resultado
la unión de moléculas indicadoras a moldes individuales y la
detección del resto indicador incorporado permitirá asignar la
identidad de la base. En el caso de indicadores fluorescentes,
estas moléculas se identificarán entonces, por ejemplo, mediante
microscopía de fluorescencia (por ejemplo, usando PMT o CCD) y la
propiedad de fluorescencia del indicador permitirá la asignación de
identidad a la base incorporada en la reacción de
secuenciación.
Con el fin de recoger datos a partir de rondas
secuenciales de ciclos de secuenciación, debe localizarse el molde.
Esto puede lograrse simultáneamente con el primer ciclo de
secuenciación en el que la molécula indicadora en la primera base
identifica la ubicación del molde o el propio molde y/o cebador
puede estar marcado con un resto indicador de tal manera que puede
detectarse su ubicación sobre la fase sólida mucho antes que la
reacción de ciclación de la secuencia. Conocer la ubicación de cada
molécula de molde hace posible monitorizar el estado de cada
molécula tras todos los acontecimientos posteriores durante los
ciclos de secuenciación. El fallo de adición posterior, por
ejemplo, se manifiesta por sí mismo mediante una falta de
fluorescencia en una ubicación que se sabe que contiene un molde.
El fallo del indicador debido o bien a una falta de estímulo, o
bien a un daño químico, también puede determinarse una vez que se ha
determinado la ubicación del molde. Estas reacciones fallidas
pueden rastrearse y tratarse en la secuencia final como posibles
huecos debido a fallo del indicador. Si estas moléculas reanudan la
participación en ciclos posteriores, esto también puede rastrearse
y obtenerse una secuencia con sentido. Pueden identificarse puntos
individuales de huecos de una única base y, cuando se han dispuesto
en red múltiples secuencias idénticas sobre la superficie sólida,
puede construirse una secuencia consenso mediante comparaciones con
cadenas de referencia tales como secuencias de otras copias de
moldes en la red de secuenciación. Alternativamente, pueden
identificarse huecos de una única base mediante comparación con una
cadena de referencia que puede ser la secuencia conocida (por
ejemplo en la aplicación de esta técnica a la detección de
mutaciones).
Por tanto, se ha apreciado que en este sistema
es posible corregir errores, particularmente errores asociados a la
secuenciación de moléculas individuales. Los errores que necesitan
corregirse son el fallo en el corte y eliminación de indicador
antes del siguiente ciclo, fallo de incorporación, daño al indicador
(por ejemplo, daño al flúor), e incorporación errónea.
Una vez localizada, todos los resultados de
ciclo de secuenciación para la molécula localizada podrán medirse.
El uso de dos conjuntos de análogos de nucleótidos permite la
identificación del indicador que se ha transferido desde un ciclo
anterior. Por tanto, la recurrencia de un indicador del ciclo
anterior puede identificarse y monitorizarse.
Conocer la ubicación de la molécula de molde
también permite la identificación de moldes que no parecen haberse
extendido. Tal como se trató anteriormente, el fallo para observar
una molécula de indicador puede deberse a la falta de
incorporación, pero también puede deberse al daño al resto
indicador. Sin embargo, ya que puede minimizarse eficazmente la
presencia de moléculas dañadas mediante un procedimiento de
purificación durante la síntesis de nucleótidos modificados en los
que pueden identificarse y eliminarse productos de ruptura y
productos de reacciones secundarias, la ausencia de fluorescencia se
debe por tanto más posiblemente a un resultado de fallo al
incorporar un nucleótido modificado.
Si, tras cualquier ciclo de secuenciación, una
molécula de molde no está asociada con ningún indicador, la
secuencia se marca en consecuencia en este punto para indicar una
"detención". En la siguiente ronda de secuenciación, la
molécula de molde puede asociarse entonces con un indicador, es
decir, la molécula "detenida" reanuda la extensión permitiendo
obtenerse datos de secuencia. Sin embargo, la molécula de molde
puede seguir careciendo de asociación con ningún indicador durante
más de un ciclo, y la secuencia se marcará como una detención para
cada ciclo respectivo.
Un marcador posicional generado durante la
secuenciación será útil para interpretar huecos en las alineaciones
cuando se compare con la secuencia generada con secuencias de
referencia o con otras secuencias generadas durante el
procedimiento de secuenciación usando uno de los algoritmos de
alineación conocidos por los expertos en la técnica.
Es posible predecir posiciones de incorporación
errónea conociendo las propiedades inherentes de las ligasas y
polimerasas pertinentes usadas. Por ejemplo, los expertos en la
técnica conocen que las secuencias cebadoras que contienen una base
terminal con apareamiento erróneo son moldes peores para
polimerasas, con eficacias de extensión de entre 10^{2} a
10^{6} veces inferiores a las secuencias apareadas (véase Huang,
M., N. Arnheim, y M. Goodman, Nucleic Acids Res, 1992.
20(17): págs. 4567-73., Tindall KR, K. T.,
Biochemistry, 1988. 27(16): págs. 6008-13,
Esteban, J., M. Salas, y L. Blanco, J Biol Chem,1993. 268(4):
págs. 2719-26). Las moléculas que permanecen
detenidas durante varios ciclos, o al final del protocolo de
secuenciación, tienen por tanto una posibilidad mucho mayor de
contener un apareamiento erróneo terminal. Por tanto, se marcan los
moldes que experimentan tales detenciones en la posición de llamada
de última base como terminaciones posibles debidas a apareamientos
erróneos. La identificación del fragmento secuenciado se logra
entonces mediante alineamiento con una secuencia de referencia y
otros moldes secuenciados a partir de la misma muestra. Los
apareamientos erróneos que se producen en posiciones marcadas es
más probable que resulten de incorporaciones erróneas en vez de
representar la verdadera secuencia y por tanto pueden interpretarse
en consecuencia.
El número de ciclos para el que se detiene una
molécula de molde puede contarse mediante detección sucesiva de una
falta de indicador incorporado. Puede fijarse un umbral para la
posibilidad de detenciones sucesivas resultantes por casualidad
durante en análisis de los datos de secuencia. El umbral sobre el
que las detenciones sucesivas pueden clasificarse como que resultan
de un apareamiento erróneo dependerá de la eficacia de marcaje o
bien mediante extensión de bases dependiente de polimerasa, o bien
mediante ligación dependiente de secuencia. Por ejemplo, si el
umbral para la posibilidad de detenciones sucesivas resultantes por
casualidad se fija al 1x10^{-6}% se contarán los siguientes
números de detenciones, teniendo en cuenta diferentes eficacias de
marcaje, antes de contar la detención como un apareamiento
erróneo.
Eficacia de marcaje por extensión de cebador, o ligación | Número de detenciones encontradas antes de superar un |
de términos cohesivos | punto de corte de posibilidad del 1x10^{-6}% |
99,9% | 3 |
99,5% | 4 |
99% | 4 |
95% | 5 |
90% | 6 |
80% | 8 |
Para una mayor certeza, puede aumentarse el
umbral apropiadamente. El grado de certeza requerido dependerá de
la tolerancia de la aplicación de secuenciación; puede tolerarse un
punto de corte menos riguroso si el objetivo es simplemente
identificar los fragmentos de molde, en vez de determinar con
precisión las diferencias de secuencia. El efecto de una eficacia
inferior de una incorporación de etiqueta también puede compensarse
mediante el grado redundancia de secuenciación. La probabilidad de
una incorporación errónea, en este caso, se trata de manera
estadística.
La formación de imágenes y localización de
moléculas individuales, principalmente mediante fluorescencia, es
familiar para los expertos en la técnica (véase Trabesinger, W.,
et al., Anal Chem., 1999. 71(1): págs.
279-83, Harms, G., et al., Biophys. J., 1999.
177: págs. 2864-2870, Deschryver, F., Pure &
Appl. Chem, 1998. 70: págs. 2147-2156., Bartko, A.
y R. Dickson, J Phys Chem B, 1999. 103: págs.
11237-11241). Por tanto, se generan fácilmente
archivos de datos que contienen información referente a la ubicación
y tipo de etiqueta. En una realización de esta invención, el
análisis de los datos de secuencia se realiza al final del
procedimiento de secuenciación y después de haber adquirido todos
los datos de secuenciación. Estos datos, en uno o más archivos,
pueden analizarse para determinar las ubicaciones de moldes e
identificar cualquier indicador unido en estas posiciones. Tales
datos se someten entonces a un análisis secundario para construir
secuencias para todos los moldes localizados.
Preferiblemente, se realizan de manera
simultánea ciclos de reacción de secuenciación y análisis de datos.
En este caso, los datos generados de cada ciclo se analizan para
localizar moléculas indicadoras, estas ubicaciones se correlacionan
entonces con las ubicaciones de los moldes. Las secuencias para cada
molde localizado pueden construirse en cada ciclo sucesivo.
El procedimiento preferido de realización de la
invención se describirá ahora haciendo referencia a la figura
1.
En el sistema ilustrado en la figura 1, las
moléculas que deben secuenciarse se han fijado sobre fases sólidas
mediante procedimientos convencionales tal como se describe en la
técnica. (Revisado en Schena (ed.), DNA Microarrays: A practical
approach, Oxford University Press (1999) ISBN: 0199637768). El
molde, unido a una superficie sólida tal como un portaobjetos de
microscopio, se marca de manera que puede determinarse su posición
cuando se observa el portaobjetos a través de un explorador de
microscopio fluorescente, por ejemplo. En la etapa 10, se localiza
en primer lugar un molde relevante.
Ahora se realizan, etapa 12, las reacciones de
secuenciación que implican la incorporación de bases que puede
realizarse extendiendo el molde con una enzima polimerasa o ligando
un oligonucleótido marcado con una ligasa.
Tal como se describió anteriormente, la etapa de
secuenciación dará como resultado la unión de una molécula
indicadora a la primera base en la secuencia del molde, y la
detección del resto indicador que se incorpora permite asignar la
identidad de la base que debe asignarse, etapa 14. La siguiente
etapa, etapa 16, es correlacionar las ubicaciones de base y molde;
en este primer ciclo ésta es una etapa trivial. Entonces se realiza
una determinación sobre si la molécula de molde está asociada con
un indicador. Es decir, en la etapa 18 se realiza una prueba sobre
si el molde objeto tiene un indicador o no. Si tras la operación de
secuenciación el molde está asociado con un indicador, el
procedimiento avanza hacia la etapa 20. Aquí, se realiza una prueba
para determinar si el indicador procede de un ciclo previo. Si no
es así, entonces se identifica y se asigna una nueva base, etapa
22. Por tanto, se ha identificado correctamente la base y todo está
bien.
Entonces el procedimiento avanza hacia la etapa
24 en la que se realiza una prueba sobre si hay más moldes. En ese
caso, el procedimiento se repite desde la etapa 18.
Si en la etapa 20 se determina que el indicador
asociado a la base procede de un ciclo anterior, entonces no se
asigna ninguna base, etapa 26, y el procedimiento avanza
directamente hacia la etapa 24 y hacia el siguiente molde, si lo
hay.
Si en la etapa 18 se encuentra que el molde no
tiene un indicador, en la etapa 50 se realiza una comprobación
sobre si el señalizador de apareamiento erróneo está encendido. El
señalizador de apareamiento erróneo se activa cuando el número de
detenciones consecutivas supera el máximo predeterminado, según una
prueba realizada en la etapa 30. Si el señalizador de apareamiento
erróneo no está encendido, el procedimiento avanza hacia la etapa
28, y se inserta una detención D en la secuencia. Además, se aumenta
en uno un contador de detenciones, que monitoriza el número de
detenciones consecutivas que se producen. Se realiza una prueba en
la etapa 30 para determinar si el número de detenciones
consecutivas supera un umbral o valor máximo predeterminado. En
caso contrario, el procedimiento avanza hacia la etapa 24 dejando la
detención en la secuencia. Si el número de detenciones consecutivas
supera el máximo predeterminado, entonces se puntúa la base anterior
como con apareamiento erróneo y se activa el señalizador de
apareamiento erróneo, etapa 32, y entonces el procedimiento avanza
hacia la etapa 24.
El indicador de detención sirve para la función
de proporcionar una indicación de una base desconocida. Puede
resultar ser una cualquiera de las bases A, C, G y T, o de hecho
puede resultar no ser ninguna base. Al prever la posibilidad de una
base desconocida, no se descarta completamente la información para
ese molde. En vez de eso, todavía puede usarse, por ejemplo con
respecto a una secuencia de referencia, tal como se describe en los
ejemplos siguientes.
Si en la etapa 20 se determina que el indicador
procede de un ciclo anterior, en la etapa 52 se realiza una
comprobación sobre si el señalizador de apareamiento erróneo está
encendido. Si el señalizador de apareamiento erróneo no está
encendido, entonces el procedimiento avanza hacia la etapa 22 y se
asigna una base. Entonces el procedimiento avanza hacia la etapa 24
para determinar si hay otro molde para tratar.
Si el señalizador de apareamiento erróneo está
encendido, en la etapa 54 se sustituye la base previamente asignada
con un código IUB que representa todas las otras bases excepto la
que estaba apareada erróneamente. Esto es porque si la base
anterior estaba marcada como "C" pero se sabe que esto era un
apareamiento erróneo, queda claro que la base es A, G o T.
Cuando no hay más moldes, la prueba en la etapa
24 tiene el resultado NO, y el procedimiento avanza hacia la etapa
34, en la que se realiza una determinación sobre si hay más ciclos
que deben completarse, es decir, si hay más bases para esa
molécula. Si las hay, el procedimiento avanza hacia los datos para
el siguiente ciclo, etapa 36, tras lo cual el procedimiento avanza
de nuevo desde la etapa 16, con correlación de las ubicaciones de
molde y base.
Eventualmente, la prueba en la etapa 34 tendrá
el resultado NO, y esto conduce al final del procedimiento, etapa
38.
Pueden aplicarse tratamientos posteriores a la
secuencia tal como se produce por el sistema de la figura 1, por
ejemplo para comparar la secuencia encontrada mediante el
procedimiento con una secuencia de referencia. A continuación se
describen ejemplos de esto.
Las etapas mostradas en la figura 1, posteriores
a las etapas 10 a 14 que implican reacciones químicas, se realizan
en un ordenador digital tal como un ordenador personal (PC). Se
muestran dos ejemplos en más detalle a modo de pseudocódigo en el
apéndice de esta memoria descriptiva. El primer pseudocódigo supone
que se requieren los nucleótidos por una mezcla de las cuatro bases
A, C, G, y T, y el segundo pseudocódigo es para su uso cuando las
cuatro bases se usan por separado en la secuencia.
La presente invención tiene muchas aplicaciones,
algunas de las cuales se facilitan en el presente documento. Por
ejemplo, puede determinarse la secuencia de genomas de ADN y ARN
usando este procedimiento. Además, pueden identificarse las
variaciones de secuencia en regiones o genomas enteros,
representaciones de ARNm de regiones o genomas enteros o en
representaciones generadas artificialmente de un genoma (por
ejemplo, productos de PCR de regiones de un genoma) que resultan de
substituciones, deleciones o inserciones de una o más bases.
\global\parskip0.950000\baselineskip
La presente invención tiene aplicación en la
determinación de haplotipo (determinación de diferencias de
secuencia entre pares de cromosomas en un individuo) y también en
el análisis de la expresión de ARNm cuantitativa, por ejemplo para
comparar niveles de expresión de ARNm entre muestras derivadas de
distintos tipos celulares (tejidos) o células tratadas de manera
diferente. Esta técnica también puede aplicarse para identificar
secuencias derivadas de genomas de patógenos para su uso en la
detección e identificación de patógenos.
Ahora se facilitan ejemplos del modo en que se
tratan secuencias específicas por el sistema de tal manera que se
reducen errores en la secuencia determinada.
La siguiente secuencia se obtiene a partir de
una reacción de secuenciación:
- GATCGGCTGACCATGGAC1
en la que 1 indica que se ha incorporado una T
(y 2=C, 3=A, 4=G).
Un fallo de extensión adicional para el número
de ciclos umbral da como resultado el marcaje de la secuencia para
indicar que se ha incorporado erróneamente una base antes del número
de detenciones umbral. Aquí, un 1 (uno) indica que se ha
incorporado una T antes de un número de detenciones por encima del
nivel de umbral determinado y por tanto es probable que se haya
incorporado erróneamente. Por tanto, puede descartarse la
secuencia. Haciendo referencia a la figura 1, el procedimiento sigue
la ruta 28, 30 durante un número predeterminado de etapas, hasta
que el resultado en la etapa 30 es SÍ, y la base anterior se marca
como con apareamiento erróneo en la etapa 32. En lugar de un 1,
para las otras bases se usa 2, 3 ó 4, indicando 2 una C, indicando
3 una A, e indicando 4 una G.
Las siguientes secuencias se obtienen de una
reacción de secuenciación. La primera es una secuencia recién
determinada y la segunda es una secuencia de referencia:
- GATCGGCTGACCATGGACC1CTGACAGT
- GATCGGCTGACCATGGACCTCTGACAGT
Detener durante más tiempo que el número de
ciclos umbral marca un 1 para T como una incorporación errónea. En
este caso, la secuenciación se ha reanudado tras el número de
secuencias umbral. Cuando la secuencia obtenida se compara con la
secuencia de referencia, la alineación de secuencias demuestra una
alineación T.1 en la posición detenida. Por tanto, puede
descartarse como una diferencia de base real con la secuencia de
referencia. La alineación de secuencias representa una fase
adicional al tratamiento ilustrado en la figura 1.
Cuando se encuentra una detención durante la
secuenciación, su posición se marca como D. Si se obtienen las
siguientes secuencias nueva y de referencia:
- GATCGGCTGACCATGGADCCTCTGACAGT
- GATCGGCTGACCATGGACCTCTGACAGT
la alineación de secuencias con la secuencia de
referencia en presencia o ausencia de un hueco en la posición
marcada con una D revela que era una detención. Por tanto, toda la
secuencia es contigua y útil. La alineación de secuencias
representa de nuevo una fase adicional al tratamiento ilustrado en
la figura 1.
Se obtiene la siguiente secuencia en una
reacción de secuenciación:
- GATCGGCTGACCATGGDCCTCTGACAGT
- GATCGGCTGACCATGGACCTCTGACAGT
La posición marcada como D es la incorporación
de una base con un indicador que ha fallado. La alineación de
secuencias con una secuencia de referencia en presencia o ausencia
de un hueco en la posición marcada revela que esto representa un
hueco en la secuencia. La secuencia extraída sigue siendo útil. En
este caso, la D puede sustituirse con una "N" para
representar un hueco en la secuencia. La alineación de secuencias
representa de nuevo una fase adicional al tratamiento ilustrado en
la figura 1.
Claims (8)
1. Un procedimiento para determinar la
secuencia de un ácido nucleico en el que se añaden nucleótidos
secuencialmente a un cebador en un molde, estando dicho molde unido
a un soporte sólido, que comprende las etapas de
- a)
- hibridar un cebador al molde, comprendiendo dicho molde el ácido nucleico para el que se requiere la secuencia, para formar un complejo de molde-cebador,
- b)
- asignar uno o más nucleótidos marcados, que comprenden uno o más de A, C, G o T, y extender el cebador mediante una ADN polimerasa o una ligasa intentando añadir el nucleótido marcado único, proporcionándose el marcaje mediante un resto indicador,
- c)
- determinar el tipo o identidad del nucleótido marcado con indicador añadido al cebador, de manera que se identifica un nucleótido en la secuencia del molde,
- d)
- eliminar o neutralizar el resto indicador,
- e)
- repetir las etapas b) a d) secuencialmente en cada ciclo siguiente y registrar el orden de incorporación de nucleótidos marcados con indicador,
- f)
- determinar si un resto indicador puede detectarse en la etapa c) de cada ciclo,
- g)
- si el resto indicador no puede detectarse en la etapa c) de cada ciclo, introduciendo un indicador de detención en la secuencia para proporcionar una indicación de una base desconocida,
- h)
- si el resto indicador no puede detectarse, determinar si el número de indicadores de detención consecutivos supera un umbral predeterminado y, en ese caso, asignar un señalizador de apareamiento erróneo,
- i)
- si el resto indicador puede detectarse en la etapa c) y no se ha identificado en la iteración anterior de las etapas b) a d) o si no se detecta señalizador de apareamiento erróneo, asignar la base correspondiente a la secuencia,
- j)
- si el resto indicador puede detectarse en la etapa c) y se ha identificado en la iteración anterior de las etapas b) a d) y si se detecta el señalizador de apareamiento erróneo, sustituir la base previamente asignada con un código IUB para todas las demás bases, y
- k)
- si no puede detectarse el resto indicador en la etapa c) y si se observa ausencia del resto indicador para menos de un número umbral predeterminado de una o más iteraciones de las etapas b) a d) entonces el nucleótido correspondiente al indicador en la iteración actual de las etapas b) a d) se incorpora a la secuencia de manera contigua a la base previamente incorporada.
2. Procedimiento según la reivindicación 1,
en el que se anota un marcador posicional en la secuencia entre el
nucleótido incorporado en la iteración actual de b) a d) y el
nucleótido que lo precede para indicar un posible hueco en la
secuencia.
3. Procedimiento según la reivindicación 1
ó 2, que comprende adicionalmente la etapa de determinar la
posición del molde detectando la ubicación del resto indicador.
4. Procedimiento según la reivindicación 3,
en el que la ubicación del molde se determina detectando el resto
indicador unido al molde.
5. Procedimiento según la reivindicación 3,
en el que la ubicación del molde se determina detectando un resto
indicador unido al cebador.
6. Procedimiento según la reivindicación 1,
en el que cualquier adición posterior se considera una continuación
de la secuencia.
7. Procedimiento según la reivindicación 6
en el que se anota un marcador posicional en la secuencia entre el
nucleótido incorporado en la iteración actual de b) a d) y el
nucleótido que lo precede para indicar un posible hueco en la
secuencia.
8. Un medio de código de programa
informático para realizar todas las etapas según una cualquiera de
las reivindicaciones 1 a 7, cuando se ejecuta dicho programa en un
ordenador.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB0016472 | 2000-07-05 | ||
GBGB0016472.3A GB0016472D0 (en) | 2000-07-05 | 2000-07-05 | Sequencing method and apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2281426T3 true ES2281426T3 (es) | 2007-10-01 |
Family
ID=9895041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES01949637T Expired - Lifetime ES2281426T3 (es) | 2000-07-05 | 2001-07-02 | Procedimiento para el analisis de secuencias. |
Country Status (11)
Country | Link |
---|---|
US (1) | US7133782B2 (es) |
EP (1) | EP1297484B1 (es) |
JP (1) | JP2004501669A (es) |
AT (1) | ATE353455T1 (es) |
AU (1) | AU2001270760A1 (es) |
CA (1) | CA2412973A1 (es) |
DE (1) | DE60126491T2 (es) |
ES (1) | ES2281426T3 (es) |
GB (1) | GB0016472D0 (es) |
IL (1) | IL153472A0 (es) |
WO (1) | WO2002003305A2 (es) |
Families Citing this family (73)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7875440B2 (en) | 1998-05-01 | 2011-01-25 | Arizona Board Of Regents | Method of determining the nucleotide sequence of oligonucleotides and DNA molecules |
US6780591B2 (en) | 1998-05-01 | 2004-08-24 | Arizona Board Of Regents | Method of determining the nucleotide sequence of oligonucleotides and DNA molecules |
US7056661B2 (en) | 1999-05-19 | 2006-06-06 | Cornell Research Foundation, Inc. | Method for sequencing nucleic acid molecules |
US6818395B1 (en) | 1999-06-28 | 2004-11-16 | California Institute Of Technology | Methods and apparatus for analyzing polynucleotide sequences |
US7501245B2 (en) | 1999-06-28 | 2009-03-10 | Helicos Biosciences Corp. | Methods and apparatuses for analyzing polynucleotide sequences |
EP1354064A2 (en) | 2000-12-01 | 2003-10-22 | Visigen Biotechnologies, Inc. | Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity |
WO2002072892A1 (en) | 2001-03-12 | 2002-09-19 | California Institute Of Technology | Methods and apparatus for analyzing polynucleotide sequences by asynchronous base extension |
US7169560B2 (en) | 2003-11-12 | 2007-01-30 | Helicos Biosciences Corporation | Short cycle methods for sequencing polynucleotides |
WO2005080605A2 (en) | 2004-02-19 | 2005-09-01 | Helicos Biosciences Corporation | Methods and kits for analyzing polynucleotide sequences |
CA2566806A1 (en) | 2004-05-25 | 2006-01-19 | Helicos Biosciences Corporation | Methods and devices for nucleic acid sequence determination |
US7476734B2 (en) | 2005-12-06 | 2009-01-13 | Helicos Biosciences Corporation | Nucleotide analogs |
AU2005296200B2 (en) | 2004-09-17 | 2011-07-14 | Pacific Biosciences Of California, Inc. | Apparatus and method for analysis of molecules |
US7170050B2 (en) | 2004-09-17 | 2007-01-30 | Pacific Biosciences Of California, Inc. | Apparatus and methods for optical analysis of molecules |
US7220549B2 (en) | 2004-12-30 | 2007-05-22 | Helicos Biosciences Corporation | Stabilizing a nucleic acid for nucleic acid sequencing |
US7482120B2 (en) | 2005-01-28 | 2009-01-27 | Helicos Biosciences Corporation | Methods and compositions for improving fidelity in a nucleic acid synthesis reaction |
US7805081B2 (en) * | 2005-08-11 | 2010-09-28 | Pacific Biosciences Of California, Inc. | Methods and systems for monitoring multiple optical signals from a single source |
US7666593B2 (en) | 2005-08-26 | 2010-02-23 | Helicos Biosciences Corporation | Single molecule sequencing of captured nucleic acids |
US7405281B2 (en) * | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
US7763423B2 (en) * | 2005-09-30 | 2010-07-27 | Pacific Biosciences Of California, Inc. | Substrates having low density reactive groups for monitoring enzyme activity |
US7998717B2 (en) * | 2005-12-02 | 2011-08-16 | Pacific Biosciences Of California, Inc. | Mitigation of photodamage in analytical reactions |
US7692783B2 (en) * | 2006-02-13 | 2010-04-06 | Pacific Biosciences Of California | Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources |
US7995202B2 (en) * | 2006-02-13 | 2011-08-09 | Pacific Biosciences Of California, Inc. | Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources |
US7715001B2 (en) * | 2006-02-13 | 2010-05-11 | Pacific Biosciences Of California, Inc. | Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources |
CA2637617C (en) * | 2006-02-16 | 2018-09-18 | 454 Life Sciences Corporation | System and method for correcting primer extension errors in nucleic acid sequence data |
US8364417B2 (en) | 2007-02-15 | 2013-01-29 | 454 Life Sciences Corporation | System and method to correct out of phase errors in DNA sequencing data by use of a recursive algorithm |
US7397546B2 (en) | 2006-03-08 | 2008-07-08 | Helicos Biosciences Corporation | Systems and methods for reducing detected intensity non-uniformity in a laser beam |
US8975216B2 (en) * | 2006-03-30 | 2015-03-10 | Pacific Biosciences Of California | Articles having localized molecules disposed thereon and methods of producing same |
US20080050747A1 (en) * | 2006-03-30 | 2008-02-28 | Pacific Biosciences Of California, Inc. | Articles having localized molecules disposed thereon and methods of producing and using same |
US7563574B2 (en) | 2006-03-31 | 2009-07-21 | Pacific Biosciences Of California, Inc. | Methods, systems and compositions for monitoring enzyme activity and applications thereof |
US8053191B2 (en) | 2006-08-31 | 2011-11-08 | Westend Asset Clearinghouse Company, Llc | Iterative nucleic acid assembly using activation of vector-encoded traits |
AU2007289057C1 (en) * | 2006-09-01 | 2014-01-16 | Pacific Biosciences Of California, Inc. | Substrates, systems and methods for analyzing materials |
US8207509B2 (en) | 2006-09-01 | 2012-06-26 | Pacific Biosciences Of California, Inc. | Substrates, systems and methods for analyzing materials |
US20080080059A1 (en) * | 2006-09-28 | 2008-04-03 | Pacific Biosciences Of California, Inc. | Modular optical components and systems incorporating same |
US20100167413A1 (en) * | 2007-05-10 | 2010-07-01 | Paul Lundquist | Methods and systems for analyzing fluorescent materials with reduced autofluorescence |
US20080277595A1 (en) * | 2007-05-10 | 2008-11-13 | Pacific Biosciences Of California, Inc. | Highly multiplexed confocal detection systems and methods of using same |
US7811810B2 (en) | 2007-10-25 | 2010-10-12 | Industrial Technology Research Institute | Bioassay system including optical detection apparatuses, and method for detecting biomolecules |
US7767441B2 (en) * | 2007-10-25 | 2010-08-03 | Industrial Technology Research Institute | Bioassay system including optical detection apparatuses, and method for detecting biomolecules |
CN102084001B (zh) | 2008-03-28 | 2015-03-18 | 加利福尼亚太平洋生物科学股份有限公司 | 用于核酸测序的组合物和方法 |
US8808986B2 (en) | 2008-08-27 | 2014-08-19 | Gen9, Inc. | Methods and devices for high fidelity polynucleotide synthesis |
CA2974241C (en) | 2008-09-16 | 2020-01-07 | Pacific Biosciences Of California, Inc. | Substrates and optical systems and methods of use thereof |
US8501406B1 (en) | 2009-07-14 | 2013-08-06 | Pacific Biosciences Of California, Inc. | Selectively functionalized arrays |
US10207240B2 (en) | 2009-11-03 | 2019-02-19 | Gen9, Inc. | Methods and microfluidic devices for the manipulation of droplets in high fidelity polynucleotide assembly |
US9216414B2 (en) | 2009-11-25 | 2015-12-22 | Gen9, Inc. | Microfluidic devices and methods for gene synthesis |
US9217144B2 (en) | 2010-01-07 | 2015-12-22 | Gen9, Inc. | Assembly of high fidelity polynucleotides |
US9646134B2 (en) | 2010-05-25 | 2017-05-09 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
CA2797645C (en) | 2010-05-25 | 2020-09-22 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
EP2952590B1 (en) | 2010-06-11 | 2017-07-26 | Life Technologies Corporation | Alternative nucleotide flows in sequencing-by-synthesis methods |
US8834847B2 (en) | 2010-08-12 | 2014-09-16 | Pacific Biosciences Of California, Inc. | Photodamage mitigation compounds and systems |
US10273540B2 (en) | 2010-10-27 | 2019-04-30 | Life Technologies Corporation | Methods and apparatuses for estimating parameters in a predictive model for use in sequencing-by-synthesis |
EP2633470B1 (en) | 2010-10-27 | 2016-10-26 | Life Technologies Corporation | Predictive model for use in sequencing-by-synthesis |
JP6118725B2 (ja) | 2010-11-12 | 2017-04-19 | ジェン9・インコーポレイテッドGen9,INC. | 核酸合成のための方法およびデバイス |
WO2012064975A1 (en) | 2010-11-12 | 2012-05-18 | Gen9, Inc. | Protein arrays and methods of using and making the same |
US9594870B2 (en) | 2010-12-29 | 2017-03-14 | Life Technologies Corporation | Time-warped background signal for sequencing-by-synthesis operations |
US20130060482A1 (en) | 2010-12-30 | 2013-03-07 | Life Technologies Corporation | Methods, systems, and computer readable media for making base calls in nucleic acid sequencing |
EP3582224A1 (en) | 2010-12-30 | 2019-12-18 | Life Technologies Corporation | Models for analyzing data from sequencing-by-synthesis operations |
WO2012092515A2 (en) | 2010-12-30 | 2012-07-05 | Life Technologies Corporation | Methods, systems, and computer readable media for nucleic acid sequencing |
EP3366782B1 (en) | 2011-04-08 | 2021-03-10 | Life Technologies Corporation | Phase-protecting reagent flow orderings for use in sequencing-by-synthesis |
US9752176B2 (en) | 2011-06-15 | 2017-09-05 | Ginkgo Bioworks, Inc. | Methods for preparative in vitro cloning |
US20130059296A1 (en) | 2011-08-26 | 2013-03-07 | Gen9, Inc. | Compositions and Methods For High Fidelity Assembly of Nucleic Acids |
US20150087537A1 (en) | 2011-08-31 | 2015-03-26 | Life Technologies Corporation | Methods, Systems, Computer Readable Media, and Kits for Sample Identification |
US10704164B2 (en) | 2011-08-31 | 2020-07-07 | Life Technologies Corporation | Methods, systems, computer readable media, and kits for sample identification |
KR101295784B1 (ko) * | 2011-10-31 | 2013-08-12 | 삼성에스디에스 주식회사 | 목표 유전체 서열 내의 신규서열 생성 장치 및 방법 |
US9150853B2 (en) | 2012-03-21 | 2015-10-06 | Gen9, Inc. | Methods for screening proteins using DNA encoded chemical libraries as templates for enzyme catalysis |
EP4001427A1 (en) | 2012-04-24 | 2022-05-25 | Gen9, Inc. | Methods for sorting nucleic acids and multiplexed preparative in vitro cloning |
US9646132B2 (en) | 2012-05-11 | 2017-05-09 | Life Technologies Corporation | Models for analyzing data from sequencing-by-synthesis operations |
AU2013280661A1 (en) | 2012-06-25 | 2015-01-22 | Gen9, Inc. | Methods for nucleic acid assembly and high throughput sequencing |
US10329608B2 (en) | 2012-10-10 | 2019-06-25 | Life Technologies Corporation | Methods, systems, and computer readable media for repeat sequencing |
US20140296080A1 (en) | 2013-03-14 | 2014-10-02 | Life Technologies Corporation | Methods, Systems, and Computer Readable Media for Evaluating Variant Likelihood |
US9926597B2 (en) | 2013-07-26 | 2018-03-27 | Life Technologies Corporation | Control nucleic acid sequences for use in sequencing-by-synthesis and methods for designing the same |
WO2015051338A1 (en) | 2013-10-04 | 2015-04-09 | Life Technologies Corporation | Methods and systems for modeling phasing effects in sequencing using termination chemistry |
US10676787B2 (en) | 2014-10-13 | 2020-06-09 | Life Technologies Corporation | Methods, systems, and computer-readable media for accelerated base calling |
US10978174B2 (en) | 2015-05-14 | 2021-04-13 | Life Technologies Corporation | Barcode sequences, and related systems and methods |
US10619205B2 (en) | 2016-05-06 | 2020-04-14 | Life Technologies Corporation | Combinatorial barcode sequences, and related systems and methods |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5302509A (en) * | 1989-08-14 | 1994-04-12 | Beckman Instruments, Inc. | Method for sequencing polynucleotides |
EP0450060A1 (en) * | 1989-10-26 | 1991-10-09 | Sri International | Dna sequencing |
WO1993005183A1 (en) | 1991-09-09 | 1993-03-18 | Baylor College Of Medicine | Method and device for rapid dna or rna sequencing determination by a base addition sequencing scheme |
GB9208733D0 (en) * | 1992-04-22 | 1992-06-10 | Medical Res Council | Dna sequencing method |
US5552278A (en) | 1994-04-04 | 1996-09-03 | Spectragen, Inc. | DNA sequencing by stepwise ligation and cleavage |
-
2000
- 2000-07-05 GB GBGB0016472.3A patent/GB0016472D0/en not_active Ceased
-
2001
- 2001-07-02 US US10/312,048 patent/US7133782B2/en not_active Expired - Fee Related
- 2001-07-02 IL IL15347201A patent/IL153472A0/xx unknown
- 2001-07-02 WO PCT/GB2001/002985 patent/WO2002003305A2/en active IP Right Grant
- 2001-07-02 EP EP01949637A patent/EP1297484B1/en not_active Expired - Lifetime
- 2001-07-02 ES ES01949637T patent/ES2281426T3/es not_active Expired - Lifetime
- 2001-07-02 AU AU2001270760A patent/AU2001270760A1/en not_active Abandoned
- 2001-07-02 JP JP2002507300A patent/JP2004501669A/ja active Pending
- 2001-07-02 AT AT01949637T patent/ATE353455T1/de not_active IP Right Cessation
- 2001-07-02 CA CA002412973A patent/CA2412973A1/en not_active Abandoned
- 2001-07-02 DE DE60126491T patent/DE60126491T2/de not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
AU2001270760A1 (en) | 2002-01-14 |
CA2412973A1 (en) | 2002-01-10 |
WO2002003305A2 (en) | 2002-01-10 |
DE60126491T2 (de) | 2007-11-15 |
DE60126491D1 (de) | 2007-03-22 |
US7133782B2 (en) | 2006-11-07 |
EP1297484A2 (en) | 2003-04-02 |
EP1297484B1 (en) | 2007-02-07 |
US20030186276A1 (en) | 2003-10-02 |
JP2004501669A (ja) | 2004-01-22 |
GB0016472D0 (en) | 2000-08-23 |
IL153472A0 (en) | 2003-07-06 |
ATE353455T1 (de) | 2007-02-15 |
WO2002003305A3 (en) | 2002-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2281426T3 (es) | Procedimiento para el analisis de secuencias. | |
ES2961338T3 (es) | Supresión de errores en fragmentos de ADN secuenciados utilizando lecturas redundantes con índices moleculares únicos (UMI) | |
US11761035B2 (en) | Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths | |
ES2989056T3 (es) | Método de secuenciación usando adaptadores cortos universales para la indexación de muestras de polinucleótidos | |
ES2986436T3 (es) | Sistema de secuenciación segura | |
CN110997937A (zh) | 具有可变长度非随机独特分子标识符的通用短衔接子 | |
BR112021006402A2 (pt) | Ferramenta baseada em sequência-gráfico para determinar a variação em regiões curtas de repetição em tandem | |
RU2799654C2 (ru) | Инструмент на основе графов последовательностей для определения вариаций в областях коротких тандемных повторов | |
BR122024025321A2 (pt) | Método para alinhar leituras de sequência com uma região genômica | |
BR122021025693B1 (pt) | Supressão de erro em fragmentos de dna sequenciados utilizando leituras redundantes com índices moleculares únicos (umis) | |
BR112017024118B1 (pt) | Supressão de erro em fragmentos de dna sequenciados utilizando leituras redundantes com índices moleculares únicos (umis) | |
NZ795518A (en) | Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths |