ES2903425T3 - Análisis de expresión génica en células individuales - Google Patents
Análisis de expresión génica en células individuales Download PDFInfo
- Publication number
- ES2903425T3 ES2903425T3 ES18201978T ES18201978T ES2903425T3 ES 2903425 T3 ES2903425 T3 ES 2903425T3 ES 18201978 T ES18201978 T ES 18201978T ES 18201978 T ES18201978 T ES 18201978T ES 2903425 T3 ES2903425 T3 ES 2903425T3
- Authority
- ES
- Spain
- Prior art keywords
- cdna
- strt
- cells
- cell
- mrna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1096—Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Un método para preparar una biblioteca de ADNc a partir de una pluralidad de células individuales, el método comprendiendo las etapas de: (i) liberar ARNm de cada célula para proporcionar una pluralidad de muestras de ARNm individuales, en donde el ARNm en cada muestra de ARNm individual es de una célula individual; (ii) sintetizar una primera hebra de ADNc a partir del ARNm en cada muestra de ARNm individual con un cebador de síntesis de ADNc de primera cadena (CDS) que comprende una secuencia de cebador de amplificación en 5' (APS) y una secuencia complementaria de ARN (RCS) que es al menos parcialmente complementaria a uno o más ARNm en una muestra de ARNm individual, e incorporar un marcador distinto o una combinación distinta de marcadores en cada muestra de ADNc individual para proporcionar una pluralidad de muestras de ADNc marcadas, en donde el ADNc en cada muestra de ADNc marcada es complementario al ARNm de una célula individual; (iii) agrupar las muestras de ADNc marcadas; (iv) amplificar las muestras de ADNc agrupadas para generar una biblioteca de ADNc que comprende ADNc bicatenario; y (v) purificar las muestras de ADNc marcadas.
Description
DESCRIPCIÓN
Análisis de expresión génica en células individuales
Campo de la invención
La presente divulgación se refiere al análisis de la expresión génica en células individuales. En particular, la divulgación se refiere a un método para preparar una biblioteca de ADNc a partir de una pluralidad de células individuales y a una biblioteca de ADNc producida por este método. Las bibliotecas de ADNc preparadas mediante el método de la invención son adecuadas para el análisis de la expresión génica mediante secuenciación.
Antecedentes de la invención
La determinación del contenido de ARNm de una célula o tejido (es decir, "perfil de expresión génica") proporciona un método para el análisis funcional de tejidos y órganos normales y enfermos. Por ejemplo, el perfil de expresión génica se puede utilizar en el estudio de la embriogénesis; para la caracterización de muestras de tumores primarios; para el análisis de biopsias de tejido enfermo y normal en, por ejemplo, psoriasis; para el análisis comparativo de tipos de células de diferentes especies para delinear la evolución del desarrollo; como sistema de ensayo para diagnóstico; como un sistema de control de calidad en la terapia de reemplazo celular (es decir, para asegurar que un cultivo de células sea suficientemente puro y las células se diferencian correctamente); y como una herramienta in vitro para medir el efecto de un gen transfectado o ARNip en dianas posteriores a pesar de una eficacia de transfección inferior al 100 %.
El perfil de expresión génica se realiza generalmente aislando ARNm de muestras de tejido y sometiendo este ARNm a hibridación de micromatrices. Sin embargo, dichos métodos solo permiten analizar genes previamente conocidos y no pueden usarse para analizar cortes y empalmes alternativos, promotores y señales de poliadenilación.
Por lo tanto, secuenciación directa de todo, o partes, del contenido de ARNm de un tejido se utiliza cada vez más (Cloonan et al., Nat Methods 5(7):613-9 (2008)). Sin embargo, los métodos actuales para analizar el contenido de ARNm de las células mediante secuenciación directa se basan en el análisis de ARNm a granel obtenido de muestras de tejido que normalmente contienen millones de células. Esto significa que gran parte de la información funcional presente en las células individuales se pierde o se vuelve borrosa cuando la expresión génica se analiza en el ARNm a granel. Además, procesos dinámicos, como el ciclo celular, no se pueden observar en promedios poblacionales. De manera análoga, los distintos tipos de células en un tejido complejo (por ejemplo, el cerebro) solo pueden estudiarse si las células se analizan individualmente.
La expresión génica en células individuales se ha analizado previamente utilizando una variedad de métodos (véase, por ejemplo, Brail et al., Mutat Res 406(2-4):45-54 (1999); Levsky et al., Science 297(5582):836-40 (2002); Bengtsson et al. Genome Res 15(10):1388-92 (2005); Esumi et al., Nat Genet 37(2):171-6 (2005). En particular, la expresión de genes unicelulares en células neurales se ha estudiado mediante análisis de micromatrices (véase Esumi et al. Neurosci Res 60(4):439-51(2008)). Sin embargo, estos métodos requieren que cada célula sea analizada individualmente y tratada por separado durante todo el procedimiento, lo cual requiere mucho tiempo y es costoso. Además, la preparación y amplificación de muestras a partir de células individuales introduce potencialmente una variación de célula a célula de forma independiente. Además, ya que el ADNc de cada célula debe amplificarse a una cantidad que pueda manipularse razonablemente para el análisis posterior, existe un posible sesgo de amplificación. Por ejemplo, una sola célula contiene aproximadamente 0,3 pg de ARNm, y normalmente se necesitan al menos 300 ng para el análisis posterior por secuenciación. Por lo tanto, se requiere una amplificación de al menos un millón de veces.
De manera adicional, las micromatrices tienen dos deficiencias principales: están vinculadas a genes conocidos y tienen una sensibilidad y un rango dinámico limitados. La secuenciación de ARN (RNA-Seq) supera estos problemas secuenciando ARN directamente (Ozsolak et al., Nature 461:814-818 (2009)) o después de la transcripción inversa a ADNc (Cloonan et al., Nat. Methods 5:613-619 (2008); Mortazavi et al., Nat. Methods 5:621-628 (2008); Wang et al., Nature 456:470-476 (2008)). Las lecturas de secuencia se asignan al genoma para revelar los sitios de transcripción, y la cuantificación se basa simplemente en recuentos de aciertos, con gran sensibilidad y rango dinámico casi ilimitado.
Los tejidos rara vez son homogéneos, sin embargo, y por tanto, cualquier perfil de expresión basado en una muestra de tejido, biopsia o cultivo celular confundirán los verdaderos perfiles de expresión de sus células constituyentes. Una forma de solucionar este problema sería analizar células individuales en lugar de poblaciones celulares y, de hecho, se han desarrollado métodos unicelulares para ambas micromatrices (Esumi et al., Neurosci. Res. 60:439-451 (2008) y Kurimoto et al., Nucleic Acids Res. 34:42 (2006)). Estos métodos son adecuados para el análisis de pequeñas cantidades de células individuales y, en particular, pueden utilizarse para estudiar células que son difíciles de obtener en grandes cantidades, como los ovocitos y las células del embrión temprano. Las células pueden aislarse, por ejemplo, mediante microdisección por captura con láser, o mediante microcapilar, y pueden usarse genes marcadores
para localizar células de interés. Sin embargo, la transcriptómica unicelular debe afrontar dos grandes retos. En primer lugar, los marcadores adecuados para el aislamiento prospectivo de poblaciones celulares definidas no están disponibles para todos los tipos de células, reflejando el hecho de que pocos tipos de células están claramente definidos en términos moleculares. En segundo lugar, la abundancia de transcritos varía mucho de una célula a otra. Por ejemplo, (el contenido de ARNm de p-actina (Actb) varía más de tres órdenes de magnitud entre las células de los islotes pancreáticos (Bengtsson et al., Genome Res. 15:1388-1392 (2005)). Se han documentado resultados similares, utilizando una variedad de métodos de detección, para la ARN polimerasa II (Raj et al., PLoS Biol 4:309 (2006)), GAPDH (Lagunavicius et al., RNA 15:765-771 (2009) y Warren et al., Proc. Natl. Acad. Sci. U.S.A. 103:17807-17812 (2006)), PU.1 (Warren et al., citado anteriormente) y ARNm de TBP, B2M, SDHA y EE1FG (Taniguchi et al., Nat Methods 6:503-506 (2009)), y en la actualidad parece ser una característica común del transcriptoma.
La mayor parte de la variación puede ser intrínseca, causada por la activación estocástica en forma de ráfaga de la transcripción, donde los episodios breves de síntesis de ARNm que duran unos minutos están separados por períodos de silencio transcripcional de duración similar (Chubb et al., Curr Biol 16:1018-1025 (2006)). Cada explosión daría lugar a una densa población de ARNm en el núcleo, que luego se exporta al citoplasma y se descompone rápidamente. En consecuencia, una muestra aleatoria de células mostraría una gran variación en su contenido de ARNm particulares, que van desde aquellas células que acaban de sufrir una explosión, a aquellos que han degradado casi por completo su ARNm; esto se ha observado directamente para la transcripción de la ARN polimerasa II in situ utilizando una sonda fluorescente dirigida a la repetición de 52 copias en ese gen (Raj et al., PLoS Biol 4:309 (2006)).
En resumen, a menudo no hay marcadores de superficie celular adecuados para usar en el aislamiento de células individuales para su estudio, e incluso cuando los hay, una pequeña cantidad de células individuales no es suficiente para capturar el rango de variación natural en la expresión génica. La presente invención tiene como objetivo superar o reducir, estos problemas al proporcionar un método para preparar bibliotecas de ADNc que se pueden usar para analizar la expresión génica en una pluralidad de células individuales.
Sumario de la invención
La divulgación proporciona un método para preparar una biblioteca de ADNc a partir de una pluralidad de células individuales. En un aspecto, el método incluye las etapas de liberar ARNm de cada célula para proporcionar una pluralidad de muestras de ARNm individuales, sintetizar una primera hebra de ADNc a partir del ARNm en cada muestra de ARNm individual e incorporar un marcador en el ADNc para proporcionar una pluralidad de muestras de ADNc marcadas, agrupar las muestras de ADNc marcadas y amplificar las muestras de ADNc agrupadas para generar una biblioteca de ADNc que tiene ADNc bicatenario. La invención también proporciona una biblioteca de ADNc producida mediante los métodos descritos en el presente documento. La divulgación proporciona además métodos para analizar la expresión génica en una pluralidad de células mediante la preparación de una biblioteca de ADNc como se describe en el presente documento y la secuenciación de la biblioteca.
Breve descripción de los dibujos
La Figura 1, paneles A-F, muestra una descripción general de un método para analizar la expresión génica en una pluralidad de células individuales. (A) se disecciona el tejido de interés; (B) se selecciona una pluralidad de células individuales; (C) se colocan células individuales en pocillos separados de una placa de 96 pocillos y se lisan; la transcripción inversa marcada se realiza en cada muestra para producir ADNc; (D) las muestras de ADNc se agrupan y amplifican; (E) la secuenciación se realiza para obtener 100 millones de lecturas; y (F) identificación de genes expresados e identificación de células de las que se originaron.
La Figura 2 muestra la síntesis de ADNc por cambio de molde.
La Figura 3 muestra un ejemplo de un oligonucleótido de cambio de molde que comprende una secuencia de cebador de amplificación 5' (APS), un marcador de célula y una secuencia 3' para el cambio de molde.
La Figura 4 muestra un ejemplo de un cebador de síntesis de ADNc (CDS) que comprende una secuencia de cebador de amplificación 5' (APS), un marcador celular y una secuencia complementaria de ARN 3' (RCS).
La Figura 5 muestra la visualización de las muestras de ADNc L001 y L002 después de la amplificación de ADNc de longitud completa mediante PCR. Carril 1: marcador de 100 pb; carriles 2-3: 25 ciclos; carriles 4-5: 30 ciclos; carriles 6-7: 35 ciclos. Los carriles pares contienen la muestra L001 y los carriles impares contienen la muestra L002.
La Figura 6 muestra una serie de diluciones de una prueba de PCR utilizando la muestra L001 (carriles 3-10). Los carriles 2 y 11 contienen un marcador de 100 pb como marcador de tamaño.
La Figura 7, paneles A y B, muestra la separación por electroforesis en gel y el aislamiento de bibliotecas de ADNc.
El panel A muestra una biblioteca de ADNc después de la amplificación final por PCR (16 ciclos) (carriles 5 y 6). El panel B muestra que se ha eliminado la región de 125-200 pb. Los carriles 3 y 8 contienen una escalera de 100 pb como marcador de tamaño.
La Figura 8 muestra un ejemplo de una molécula de ADNc secuenciada de una biblioteca de ADNc marcada. Las secuencias de cebadores para la secuenciación de SOLiD (PI y P2) están subrayadas. El marcador específico de la célula está en un recuadro. Las 2-5 G del mecanismo de cambio de molde están sombreadas por un cuadro gris. La secuencia del vector de clonación TOPO se muestra en cursiva. La inserción en este caso es tubulina beta 2c.
La Figura 9 muestra una representación gráfica de los resultados de una PCR cuantitativa en tiempo real que compara el ADNc a granel (eje horizontal) frente al ADNc marcado de 96 células (eje vertical). Cada círculo representa un par de cebadores de PCR dirigido contra los genes indicados. Las unidades son arbitrarias y se derivan del valor de los ciclos al umbral, CT.
La Figura 10, paneles A-E, muestra una descripción general del método de transcripción inversa marcada de una sola célula (STRT) y resultados ilustrativos. (A) Descripción general del método, que ilustra cómo se rastrearon las células individuales. Se incorporaron códigos de barras específicos de pocillo (y por lo tanto específicos de células) durante la síntesis de ADNc, dando como resultado una biblioteca donde cada molécula lleva un código de barras que identifica la célula de origen. (B) Ejemplo de lecturas asignadas a ambas cadenas del locus Pou5f1 de 5 kb, se muestra como un gráfico de cobertura. Las lecturas fueron específicas de la hebra y se asignaron principalmente a los exones. El fondo sin ARNm fue mínimo a juzgar por los accesos a los intrones en la hebra directa (carril superior) o en la hebra inversa (carril inferior). (C) Comparación con RNA-Seq estándar (Cloonan et al. Nat. Methods 5:613-619 (2008)) para el locus Nanog de 6 kb. Dado que la síntesis de ADNc se cebó a partir de la cola de poli(A), las lecturas se agruparon típicamente en el extremo 3' (carril superior). La 3'UTR extendida de Nanog (azul claro) fue claramente detectada por ambos métodos. SQRL lee exones extendidos a 5', pero mostró un trasfondo más intrónico. (D) El genoma mitocondrial. Como se esperaba, la transcripción se detectó casi exclusivamente en la cadena H (arriba), con solo unos pocos transcritos truncados (flecha) que se originan en la hebra L. Los genes que codifican proteínas se indican en la parte inferior. (E) Expresión génica en el cromosoma 19. La cobertura en las hebras directa (carril superior) e inversa (centro) estaba altamente correlacionada con la densidad de genes locales (abajo). Los genes se muestran como barras apiladas horizontales. Por claridad, las escalas verticales en (B-E) se truncan en los valores semimáximos.
La Figura 11, paneles A-F, muestra una representación gráfica de las etapas que se utilizan opcionalmente en el método STRT. El panel A muestra una etapa de transcripción inversa. Un cebador oligo-dT con cola dirige la síntesis de una cadena de ADNc. Cuando se alcanza el final del molde de ARN, la transcriptasa inversa agrega 3 4 C en 3' de la cadena de ADNc (debido a su actividad transferasa terminal). El panel B muestra una etapa de cambio de molde. El oligo auxiliar con código de barras hibrida transitoriamente y la síntesis de ADNc procede utilizando el oligo como molde. En consecuencia, el extremo 3' del ADNc llevará el código de barras (XXXX), secuencias de reconocimiento de BtsCI (Bts) e hibridación de cebadores (Pr). El panel C muestra una etapa de PCR de un solo cebador. Los extremos del ADNc tienen secuencias idénticas y se amplifican utilizando un solo cebador de PCR, lo que ayuda a suprimir los amplicones cortos. El panel D muestra una etapa de fragmentación. La biblioteca amplificada se fragmenta a 200 - 300 pb usando digestión controlada de desoxirribonucleasa. El panel E muestra un paso de inmovilización y reparación de extremos. Ambos fragmentos de 5' (con código de barras (Br) y sitio BtsCI (Bts)) y 3' están unidos a perlas, mientras que los fragmentos internos se lavan. El panel F muestra la liberación de fragmentos y la ligadura del adaptador. Los fragmentos 5' son liberados por digestión con BtsCI, dejando solo el código de barras (Bc) y el inserto (área blanca). Los fragmentos de 3' permanecen adheridos a las perlas. Los adaptadores compatibles de extremo emparejado de Genome Analyzer (PI y P2) están ligados. La biblioteca se secuencia a partir del cebador PI (y, opcionalmente, se podría secuenciar también a partir de P2). Las lecturas de PI comienzan con un código de barras de 5 pb, seguido de 3-4 G, seguido del inserto de ADNc. Las lecturas P2 producirían solo la secuencia de ADNc.
La Figura 12, paneles A-D, muestran una representación gráfica de la ausencia de motivos que rodean el sitio de cambio de molde. Todas las lecturas se examinaron en la muestra L006 para detectar la presencia de cualquier motivo alrededor del sitio de cambio de molde (es decir, alrededor del extremo 5' de cada lectura). Se muestran los logotipos de secuencia para las 20 bases de la secuencia genómica aguas arriba y aguas abajo del primer nucleótido (flecha) de cada lectura mapeada. Como se ejemplifica en A y B, en casos típicos (92 de 96), no se detectó un motivo fuerte, indicando la ausencia de eventos importantes de cebado incorrecto, que habría generado un motivo aguas arriba complementario al cebador. En cuatro casos (C y D), hubo una preferencia general por las secuencias ricas en T, particularmente en las primeras 20 bases de la lectura. Esto ocurrió en pozos con un número muy pequeño de lecturas, indicando una reacción fallida. Sin embargo, en un solo caso se observó el motivo rico en T a pesar de un gran número de lecturas.
La Figura 13, paneles A y B, muestran una representación gráfica de puntos de acceso para el cambio de molde.
(A) El locus Actb se expresa a partir de la hebra inferior (inversa), de derecha a izquierda en la figura. Las dos pistas superiores muestran impactos agregados en las hebras directa e inversa, respectivamente, demostrando especificidad de hebra y falta de antecedentes en intrones. La pista del medio (azul) muestra la estructura exón/intrón del gen. La pista inferior muestra aciertos individuales de células individuales. Cada fila de píxeles representa los resultados de una sola célula como puntos negros. Hay 96 filas de píxeles en total. (B) Se hizo el mismo análisis para Sox2, un gen de un solo exón transcrito en la hebra directa (superior), mostrando el sesgo habitual de 3'. Tanto en (A) como en (B), los puntos calientes eran claramente visibles y se compartían entre las células, sugiriendo que representan sitios estructurales en el ARNm que favorecen la terminación de la síntesis de ADNc, la hidrólisis de ARN y/o el cambio de molde.
La Figura 14, paneles A y B, muestran una representación gráfica de la nueva tasa de descubrimiento. (A) muestra la tasa de descubrimiento de distintas lecturas de mapeo en función del número total de lecturas. Ninguna de las muestras fue secuenciada hasta la saturación, y la mayoría de las bibliotecas probablemente contendrían al menos 3 millones de moléculas distintas, lo que indica que, en promedio, al menos 30.000 moléculas distintas por célula se convirtieron con éxito en ADNc amplificable. Las curvas se mueven debido a la falta de homogeneidad en los datos, presumiblemente causada por imperfecciones en el proceso de PCR de conglomerados que pueden generar duplicados locales y, por lo tanto, un muestreo menos que aleatorio. En (B) la tasa de descubrimiento de distintas características anotadas se muestra como una función del número de lecturas mapeadas (para la muestra L006). La saturación se alcanzó rápidamente, mostrando que la mayoría de las características presentes en la muestra podrían descubrirse a una profundidad de muestreo modesta.
La Figura 15 muestra una representación gráfica para distinguir la expresión de genes solapantes. Debido a la especificidad de hebra del mecanismo de cambio de molde, el varamiento podría mantenerse durante todo el protocolo. Esto fue especialmente importante para genes con exones superpuestos. Representado en la figura es un ejemplo de tal par de genes, Catepsina A (Ctsa) y proteína de transferencia de fosfolípidos (Pltp), cuyos últimos exones se solapan. Sin información de hebra, las lecturas en los últimos cuatro exones de Pltp no pudieron distinguirse de las lecturas que se originaron en el último exón de Ctsa. Hay alrededor de 3.000 genes con exones 3' solapantes similares.
La Figura 16 muestra una representación gráfica del sesgo de longitud de los transcritos. Para detectar cualquier sesgo contra las transcripciones cortas o largas, el nivel de expresión promedio se calculó como una función de la longitud del ARNm (en contenedores de 200 pb) para la muestra L019. Cada barra muestra el nivel de expresión de genes con transcritos más cortos que la longitud indicada (por lo tanto, la primera barra contiene transcritos de 0 a 200 pb de longitud). En una amplia gama de longitudes de ARNm, no hubo diferencia evidente en los niveles de expresión medidos. Los transcritos más cortos (<200 pb) presumiblemente fueron suprimidos por la etapa de purificación en gel donde se seleccionaron insertos > 100 pb. La aparente sobreexpresión de genes en el rango de 400 a 800 pb posiblemente se puede explicar por un cambio de molde más eficaz en este rango, donde la síntesis de ADNc a menudo alcanzaría el límite 5' de ARNm. Como alternativa, puede deberse simplemente a la presencia de unos pocos genes muy expresados en este rango, incluyendo Dppa5 e Rps14.
La Figura 17, paneles A-E, muestra una representación gráfica de la precisión cuantitativa del método STRT. (A) Distribución de los niveles de expresión génica, en transcritos por millón (t.p.m.) mostró una expresión predominantemente baja, en el rango de 10 a 100 t.p.m. (B) Comparación de la secuencia de dos células a una profundidad de aproximadamente 500000 lecturas/célula. En este caso, los genes por debajo de 100 t.p.m. podrían cuantificarse con precisión. (C) Comparación de dos células secuenciadas a aproximadamente 100 000 lecturas/célula. En este caso, la sensibilidad se redujo a aproximadamente 1000 t.p.m. (D) Probabilidad de detección en función del nivel de expresión. Cada punto muestra un gen, con un nivel de expresión promedio dado (en todas las células) y una fracción de células que tienen una expresión de este gen distinta de cero. La distribución se aproxima al límite teórico del muestreo aleatorio dada la profundidad real de secuenciación utilizada en el presente documento (línea discontinua). (E) Comparación con PCR cuantitativa en tiempo real para las cuatro células madre embrionarias que se muestran en (B) y (C), utilizando marcadores selectos de pluripotencia y diferenciación. En general, la precisión cuantitativa fue buena, con un único falso positivo afín (Eomes en célula ES n.° 4). Sin embargo, este fue un evento raro y no se observó para este gen en ninguna de las otras 160 células ES examinadas. Los niveles de Q-PCR se convirtieron en t.p.m. mediante la normalización del par de cebadores Actb/1081 con las células ES n.° 1 y n.° 2. A continuación, se midió la actina de forma independiente utilizando un par de cebadores diferente (Actb/1832) para confirmar la precisión de la normalización.
La Figura 18 muestra una comparación gráfica entre los análisis de STRT, Q-PCR y micromatrices. Se espera que los genes que se van a expresar (Actb, Pou5f1, Zfp42, Sox2, Klf4, Nanog, Plk1, Zic3) o que no se van a expresar (Gata4, Brachyury, Eomes, Otx1, Cdx2, Gata5, Calb1, Gfap, Dppa3 y NeuroD1) en células ES indiferenciadas se analicen por STRT, PCR cuantitativa en tiempo real (Q-PCR) y micromatriz Illumina. Hubo una buena correlación entre STRt y Q-PCR, y en menor medida con los datos de micromatrices. En particular, Sox2 fue subestimado en la micromatriz, mientras que Otx1 y Dppa3 fueron aparentes falsos positivos. Los datos de la micromatriz son la media de dos reacciones de hibridación, Se realizó Q-PCR por duplicado y se repitió una vez para confirmación, y
los datos de STRT son la media de 160 células madre embrionarias individuales.
La Figura 19, paneles A y B, muestra una representación gráfica de la distribución de la expresión génica en las células. (A) muestra la distribución de los niveles de expresión de Actb en todas las células usando STRT. (B) muestra la expresión de Actb en células de islotes pancreáticos de Bengtsson et al. Genome Res 15(10):1388-92 (2005) para comparación.
La Figura 20 muestra un análisis de componentes principales. Para descubrir y agrupar tipos de células en función de los datos de expresión, las cinco muestras de 96 células preparadas independientemente se sometieron a análisis de componentes principales. Los tres tipos de células (ES, Neuro-2A y MEF) claramente se agruparon por separado, aunque los MEF no formaron un grupo muy distinto. Además, las células madre embrionarias preparadas de forma independiente agrupadas, que muestran que el PCA no se limitó a detectar diferencias en la preparación de muestras. Esto demuestra que los datos de expresión de una sola célula se pueden utilizar para clasificar con precisión los tipos de células.
La Figura 21, paneles A-C, muestra una visualización basada en gráficos ("mapa de células") del patrón de expresión. (A) Las células, representadas por los nodos del gráfico (círculos) se distribuyeron al azar, y los bordes se dibujaron de cada célula a las otras cinco células con las que estaba más altamente correlacionada. (B) Se utilizó un diseño dirigido por la fuerza para trazar el gráfico en un plano. En este diseño, las células se repelieron uniformemente, pero se mantenían unidos por bordes que actuaban como resortes elásticos. El mapa visual resultante fue consistente con las identidades celulares conocidas (células ES frente a células Neuro-2A), con algunas células secuenciadas menos profundamente que muestran una separación deficiente. (C) La adición de más células ES y fibroblastos (MEF) expandió el mapa y demostró que las células ES preparadas de forma independiente se agruparon con precisión.
La Figura 22 muestra la visualización de la expresión génica en un mapa celular de la Figura 21. Cada mapa conserva su diseño de la Figura 21C, pero las células están sombreadas de acuerdo con la expresión del gen indicado. Se utilizó una escala logarítmica (arriba a la derecha). El ARN ribosómico mitocondrial 2 (mt_Rnr2) fue el gen más expresado de todos. Se detectaron genes de constitutivos como la actina (Actb) y la proteína ribosómica L4 (Rpl4) en todos los tipos de células, pero no en todas las células individuales. El poder del perfil de expresión de una célula individual de escopeta se reveló para genes de baja expresión como K-ras (Kras), que se detectó solo en aproximadamente la mitad de todas las células, pero aún expresado claramente en todos los tipos de células. Calbindin (Calb1) estaba ausente, como se esperaba y se confirmó por Q-PCR. Un conjunto de marcadores de células ES bien conocidos (Dppa5, Sox2, Sall4, Pou5f1, Nanog, Zfp42, Zic3 y Esrrb) se expresaron claramente específicamente en el grupo de células ES, mientras que Klf4, Myc y Klf2 se distribuyeron más ampliamente. No se detectó Dppa3, según lo confirmado por Q-PCR (Figura 18)
Descripción detallada de la invención
La presente divulgación proporciona métodos y composiciones para el análisis de la expresión génica en células individuales o en una pluralidad de células individuales. En particular, la divulgación proporciona métodos para preparar una biblioteca de ADNc a partir de una pluralidad de células individuales. Los métodos se basan en determinar los niveles de expresión génica de una población de células individuales, que se puede utilizar para identificar variaciones naturales en la expresión génica de una célula a otra. Los métodos también pueden usarse para identificar y caracterizar la composición celular de una población de células en ausencia de marcadores de superficie celular adecuados. Los métodos descritos en el presente documento también proporcionan la ventaja de generar una biblioteca de ADNc representativa del contenido de ARN en una población celular mediante el uso de células individuales, mientras que las bibliotecas de ADNc preparadas por métodos clásicos requieren típicamente ARN total aislado de una gran población (véase el Ejemplo I). Por lo tanto, una biblioteca de ADNc producida usando los métodos de la invención proporciona al menos una representación equivalente del contenido de ARN en una población de células utilizando una subpoblación más pequeña de células individuales junto con ventajas adicionales como se describe en el presente documento.
Las realizaciones también proporcionan muestreo de un gran número de células individuales. Usando similitud de patrones de expresión, se puede construir un mapa de células que muestre cómo se relacionan las células. Este mapa se puede utilizar para distinguir tipos de células por simulación computacional, detectando grupos de células estrechamente relacionadas (véase el Ejemplo II). Al muestrear no solo unas pocas, sino una gran cantidad de células individuales, la similitud de patrones de expresión se puede utilizar para construir un mapa de células y cómo se relacionan. Este método permite el acceso a datos de expresión no diluidos de cada tipo distinto de célula presente en una población, sin necesidad de una purificación previa de esos tipos de células. Además, donde estén disponibles marcadores conocidos, estos se pueden usar por simulación computacional para delinear las células de interés. La validez de este enfoque se muestra en el Ejemplo II, que analiza una colección de células extraídas de tres tipos de células distintos (células madre embrionarias de ratón, fibroblastos embrionarios y células de neuroblastoma) de distintos orígenes embrionarios (células madre pluripotentes frente a capas germinales mesodérmicas y ectodérmicas)
y estado patológico (normal frente a transformadas).
Las realizaciones proporcionan un método para preparar una biblioteca de ADNc a partir de una pluralidad de células individuales liberando ARNm de cada célula individual para proporcionar una pluralidad de muestras individuales, donde el ARNm en cada muestra de ARNm individual es de una sola célula, sintetizar una primera hebra de ADNc a partir del ARNm en cada muestra de ARNm individual e incorporar un marcador en el ADNc para proporcionar una pluralidad de muestras de ADNc marcadas, en donde el ADNc en cada muestra de ADNc marcada es complementario al ARNm de una sola célula que agrupa las muestras de ADNc marcadas y amplifica las muestras de ADNc agrupadas para generar una biblioteca de ADNc que comprende ADNc bicatenario. Al utilizar el método anterior, es factible preparar muestras para secuenciar de varios cientos de células individuales en poco tiempo y con una cantidad mínima de trabajo. Los métodos tradicionales para preparar una biblioteca de fragmentos a partir de ARN para la secuenciación incluyen etapas de escisión en gel que son laboriosas. En ausencia de equipo especial, no conviene preparar más de un puñado de muestras en paralelo. En algunos aspectos de los métodos descritos en el presente documento, se prepara un conjunto de 96 células como una sola muestra (después de la síntesis de ADNc), lo que hace posible preparar varios cientos de células para la secuenciación. De manera adicional, la variación técnica se minimiza porque cada conjunto de 96 células se prepara en conjunto (en un solo tubo).
En algunos aspectos de la invención, cada muestra de ADNc obtenida de una sola célula está marcada, lo que permite analizar la expresión génica a nivel de una sola célula. Esto permite procesos dinámicos, como el ciclo celular, para estudiar y distintos tipos de células en un tejido complejo (por ejemplo, el cerebro) para analizar. En algunos aspectos de la invención, las muestras de ADNc se pueden combinar antes del análisis. La combinación de las muestras simplifica el manejo de las muestras de cada célula y reduce el tiempo necesario para analizar la expresión génica en las células individuales, lo que permite un análisis de alto rendimiento de la expresión génica. La combinación de las muestras de ADNc antes de la amplificación también proporciona la ventaja de que prácticamente se elimina la variación técnica entre las muestras. Además, ya que las muestras de ADNc se agrupan antes de la amplificación, se requiere menos amplificación para generar cantidades suficientes de ADNc para el análisis posterior en comparación con la amplificación y el tratamiento de muestras de ADNc de cada célula individual por separado. Esto reduce el sesgo de amplificación y también significa que cualquier sesgo será similar en todas las células utilizadas para proporcionar muestras de ADNc agrupadas. La purificación por ARN, el almacenamiento y la manipulación tampoco son necesarios, lo que ayuda a eliminar los problemas causados por la naturaleza inestable del ARN.
Dado que las bibliotecas de ADNc producidas por el método de la invención son adecuadas para el análisis de los perfiles de expresión génica de células individuales mediante secuenciación directa, es posible utilizar estas bibliotecas para estudiar la expresión de genes que no se conocían previamente y también para analizar cortes y empalmes alternativos, promotores y señales de poliadenilación. Preparar las bibliotecas de ADNc como se describe en el presente documento, proporciona un método sensible para detectar un transcrito de ARN de copia única o baja. La sensibilidad del método se muestra en la Figura 17D y se describe en el Ejemplo II. Por ejemplo, los genes expresados a 100 transcritos por millón (t.p.m.) se detectan aproximadamente el 50% de las veces. Sin embargo, como se muestra en la Figura 14A, las muestras no estaban saturadas, por lo que existe una sensibilidad adicional que se puede lograr con una secuenciación más profunda de las muestras. En consecuencia, el método para preparar las bibliotecas de ADNc como se describe en el presente documento detecta un transcrito de ARN de copia única o baja al menos el 30% del tiempo o, como alternativa, al menos el 40% del tiempo, o al menos el 50% del tiempo, o como alternativa, al menos el 60% del tiempo, o como alternativa, al menos el 70% del tiempo, o como alternativa, al menos el 80% del tiempo o como alternativa al menos el 90% del tiempo, o como alternativa, al menos el 95% del tiempo.
Las realizaciones también proporcionan un método para identificar un solo tipo de célula a partir de una muestra y/o determinar el transcriptoma de una sola célula mediante la preparación de una biblioteca de ADNc como se describe en el presente documento, determinando los niveles de expresión de células individuales en una población y mapeando las células individuales basándose en la similitud de los patrones de expresión. Se puede realizar el mapeo de células individuales por simulación computacional por un experto en la técnica y, en particular, utilizando los métodos descritos en el presente documento, tal como se muestra en el Ejemplo II. El número de células necesarias para determinar la frecuencia de un tipo de célula dado en la pluralidad de células seguirá una distribución binomial. Por ejemplo, se puede muestrear un número predeterminado de células individuales de modo que se espere que se detecten al menos diez del tipo deseado. En consecuencia, si la frecuencia del tipo de célula en la muestra es del 10%, será necesario preparar y analizar una biblioteca de ADNc de aproximadamente 100 células como se describe en el presente documento.
La expresión "biblioteca de ADNc" se refiere a una colección de fragmentos de ADN complementario (ADNc) clonados, que en conjunto constituyen una parte del transcriptoma de una sola célula o una pluralidad de células individuales. El ADNc se produce a partir del ARNm completamente transcrito que se encuentra en una célula y, por lo tanto, contiene solo los genes expresados de una sola célula o cuando se combinan los genes expresados de una pluralidad de células individuales.
Tal como se utiliza en el presente documento, una "pluralidad" se refiere a una población de células y puede incluir
cualquier número de células que se desee analizar. En algunos aspectos de la invención, una pluralidad de células incluye al menos 10 células, o como alternativa al menos 25 células, o como alternativa al menos 50 células, o como alternativa al menos 100 células, o como alternativa al menos 200 células, o como alternativa al menos 500 células, o como alternativa al menos 1000 células, o como alternativa 5.000 células o como alternativa 10.000 células. En otro aspecto de la invención, una pluralidad de células incluye de 10 a 100 células, o como alternativa, de 50 a 200 células, como alternativa, de 100 a 500 células, o como alternativa de 100 a 1000, o como alternativa de 1000 a 5000 células.
La expresión "amplificación" o "amplificar" se refiere a un proceso mediante el cual se forman copias adicionales o múltiples de un polinucleótido particular. La amplificación incluye métodos como PCR, amplificación por ligación (o reacción en cadena de ligasa, LCR) y métodos de amplificación. Estos métodos son conocidos y se practican ampliamente en la técnica. Véase, por ejemplo, las patentes de EE. UU. N.° 4.683.195 y 4.683.202 e Innis et al., "PCR protocols: a guide to method and applications" Academic Press, Incorporated (1990) (para PCR); y Wu et al. (1989) Genomics 4:560-569 (para LCR). En general, el procedimiento de PCR describe un método de amplificación de genes que se compone de (i) hibridación de secuencia específica de cebadores con genes específicos dentro de una muestra de ADN (o biblioteca), (ii) amplificación posterior que implica múltiples rondas de hibridación, elongación y desnaturalización usando una a Dn polimerasa, y (iii) cribado de los productos de PCR para una banda del tamaño correcto. Los cebadores utilizados son oligonucleótidos de longitud suficiente y secuencia apropiada para proporcionar el inicio de la polimerización, es decir, cada cebador está diseñado específicamente para ser complementario de cada hebra del locus genómico que se va a amplificar.
Los reactivos y el hardware para realizar la reacción de amplificación están disponibles comercialmente. Los cebadores útiles para amplificar secuencias de una región genética particular son preferiblemente complementarios y se hibridan específicamente con secuencias en la región diana o en sus regiones flanqueantes y se pueden preparar usando las secuencias polinucleotídicas proporcionadas en el presente documento. Las secuencias de ácido nucleico generadas por amplificación se pueden secuenciar directamente.
Cuando la hibridación ocurre en una configuración antiparalela entre dos polinucleótidos monocatenarios, la reacción se denomina "hibridación" y esos polinucleótidos se describen como "complementarios". Un polinucleótido bicatenario puede ser complementario u homólogo a otro polinucleótido, si puede producirse la hibridación entre una de las cadenas del primer polinucleótido y el segundo. La complementariedad u homología (el grado en que un polinucleótido es complementario con otro) es cuantificable en términos de la proporción de bases en hebras opuestas que se espera que formen enlaces de hidrógeno entre sí, de acuerdo con las reglas de emparejamiento de bases generalmente aceptadas.
Tal como se utiliza en el presente documento, una "célula individual" se refiere a una célula. Las células individuales útiles en los métodos descritos en el presente documento pueden obtenerse de un tejido de interés, o de una biopsia, muestra de sangre o cultivo celular. De manera adicional, células de órganos específicos, tejidos, tumores, pueden obtenerse y usarse neoplasmas o similares en los métodos descritos en el presente documento. Además, en general, se pueden utilizar células de cualquier población en los métodos, tales como una población de organismos unicelulares procariotas o eucariotas que incluyen bacterias o levaduras. En algunos aspectos de la invención, el método de preparación de la biblioteca de ADNc puede incluir la etapa de obtener células individuales. Se puede obtener una suspensión de una sola célula usando métodos estándar conocidos en la técnica que incluyen, por ejemplo, el uso enzimáticamente tripsina o papaína para digerir proteínas que conectan células en muestras de tejido o liberan células adherentes en cultivo, o separan mecánicamente células en una muestra. Las células individuales se pueden colocar en cualquier recipiente de reacción adecuado en el que las células individuales se puedan tratar individualmente. Por ejemplo, una placa de 96 pocillos, de manera que cada célula se coloque en un solo pocillo.
Los métodos para manipular células individuales se conocen en la técnica e incluyen clasificación de células activadas por fluorescencia (FACS), micromanipulación y el uso de recolectores de células semiautomáticos (por ejemplo, el sistema de transferencia de células Quixell™ de Stoelting Co.). Las células individuales pueden, por ejemplo, ser seleccionadas individualmente basándose en características detectables por observación microscópica, como la ubicación, morfología o expresión del gen indicador.
En algunos aspectos de la invención, el ARNm se puede liberar de las células al lisar las células. La lisis se puede lograr mediante, por ejemplo, calentamiento de las células, o mediante el uso de detergentes u otros métodos químicos, o mediante una combinación de estos. Sin embargo, se puede utilizar cualquier método de lisis adecuado conocido en la técnica. Se puede usar ventajosamente un procedimiento de lisis suave para prevenir la liberación de cromatina nuclear, evitando así la contaminación genómica de la biblioteca de ADNc, y para minimizar la degradación del ARNm. Por ejemplo, calentar las células a 72 °C durante 2 minutos en presencia de Tween-20 es suficiente para lisar las células sin producir una contaminación genómica detectable de la cromatina nuclear. Como alternativa, las células se pueden calentar a 65 °C durante 10 minutos en agua (Esumi et al., Neurosci Res 60(4):439-51 (2008)); o 70 °C durante 90 segundos en tampón de PCR II (Applied Biosystems) suplementado con NP-40 al 0,5 % (Kurimoto et al., Nucleic Acids Res 34(5):e42 (2006)); o la lisis se puede lograr con una proteasa como la proteinasa K o mediante el uso de sales caotrópicas como el isotiocianato de guanidina (publicación de EE.UU. n.° 2007/0281313).
La síntesis de ADNc a partir de ARNm en los métodos descritos en el presente documento se puede realizar directamente en lisados celulares, de modo que una mezcla de reacción para la transcripción inversa se agregue directamente a los lisados celulares. Como alternativa, el ARNm se puede purificar después de su liberación de las células. Esto puede ayudar a reducir la contaminación mitocondrial y ribosómica. La purificación del ARNm se puede lograr mediante cualquier método conocido en la técnica, por ejemplo, uniendo el ARNm a una fase sólida. Los métodos de purificación comúnmente utilizados incluyen perlas paramagnéticas (por ejemplo, Dynabeads). Como alternativa, contaminantes específicos, como el ARN ribosómico se puede eliminar selectivamente usando purificación por afinidad.
El ADNc se sintetiza típicamente a partir del ARNm mediante transcripción inversa. Los métodos para sintetizar ADNc a partir de pequeñas cantidades de ARNm, incluso de células individuales, han sido descritos previamente (Kurimoto et al., Nucleic Acids Res 34(5):e42 (2006); Kurimoto et al., Nat Protoc 2(3):739-52 (2007); y Esumi et al., Neurosci Res 60(4):439-51 (2008)). Para generar un ADNc amplificable, estos métodos introducen una secuencia de hibridación de cebadores en ambos extremos de cada molécula de ADNc de tal manera que la biblioteca de ADNc se puede amplificar usando un solo cebador. El método Kurimoto utiliza una polimerasa para agregar una cola poli-A en 3' a la cadena de ADNc, que luego se puede amplificar usando un cebador oligo-T universal. En cambio, el método Esumi utiliza un método de cambio de molde para introducir una secuencia arbitraria en el extremo 3' del ADNc, que está diseñado para ser complementario inverso a la cola 3' del cebador de síntesis de ADNc. De nuevo, la biblioteca de ADNc se puede amplificar mediante un solo cebador de PCR. La PCR de cebador único aprovecha el efecto de supresión de la PCR para reducir la amplificación de amplicones y dímeros de cebadores contaminantes cortos (Dai et al., J Biotechnol 128(3):435-43 (2007)). Como los dos extremos de cada amplicón son complementarios, los amplicones cortos formarán horquillas estables, que son moldes deficientes para la PCR. Esto reduce la cantidad de ADNc truncado y mejora el rendimiento de moléculas de ADNc más largas.
En algunos aspectos de la invención, la síntesis de la primera hebra del ADNc puede ser dirigida por un cebador de síntesis de ADNc (CDS) que incluye una secuencia complementaria de ARN (RCS). En algunos aspectos de la invención, la RCS es al menos parcialmente complementaria a uno o más ARNm en una muestra de ARNm individual. Esto permite que el cebador, que es típicamente un oligonucleótido, para hibridar con al menos algo de ARNm en una muestra de ARNm individual para dirigir la síntesis de ADNc usando el ARNm como molde. La RCS puede comprender oligo (dT), o ser específico de una familia de genes, como una secuencia de ácidos nucleicos presente en todos o en la mayoría de los genes relacionados, o puede estar compuesta por una secuencia aleatoria, como hexámeros aleatorios. Para evitar que el CDS se cebe sobre sí mismo y genere productos secundarios no deseados, se puede utilizar una secuencia semialeatoria no autocomplementaria. Por ejemplo, se puede excluir una letra del código genético, o se puede utilizar un diseño más complejo mientras se restringe el CDS para que no sea autocomplementario.
Los términos "oligonucleótido" y "polinucleótido" se usan indistintamente y se refieren a una forma polimérica de nucleótidos de cualquier longitud, ya sean desoxirribonucleótidos o ribonucleótidos o análogos de los mismos. Los polinucleótidos pueden tener cualquier estructura tridimensional y pueden realizar cualquier función, conocida o desconocida. Los siguientes son ejemplos no limitantes de polinucleótidos: un gen o fragmento génico (por ejemplo, una sonda, cebador, marcador EST o SAGE), exones, intrones, ARN mensajero (ARNm), ARN de transferencia, ARN ribosómico, ribozimas, ADNc, polinucleótidos recombinantes, polinucleótidos ramificados, plásmidos, vectores, ADN aislado de cualquier secuencia, ARN aislado de cualquier secuencia, sondas de ácido nucleico y cebadores. Un polinucleótido puede comprender nucleótidos modificados, tales como nucleótidos metilados y análogos de nucleótidos. El término también se refiere a moléculas bicatenarias y monocatenarias. A menos que se especifique o requiera lo contrario, cualquier realización de la presente invención que comprenda un polinucleótido abarca tanto la forma bicatenaria como cada una de las dos formas complementarias monocatenarias conocidas o predichas para formar la forma bicatenaria.
Un polinucleótido está compuesto por una secuencia específica de cuatro bases de nucleótidos: adenina (A); citosina (C); guanina (G); timina (T); y uracilo (U) para timina cuando el polinucleótido es ARN. Por lo tanto, el término secuencia de polinucleótidos es la representación alfabética de una molécula de polinucleótido. Esta representación alfabética puede introducirse en bases de datos en una computadora que tenga una unidad central de procesamiento y usarse para aplicaciones bioinformáticas tales como genómica funcional y búsqueda de homología.
Un "cebador" es un polinucleótido corto, generalmente con un grupo 3'-OH libre que se une a una diana o molde potencialmente presente en una muestra de interés hibridando con la diana, y luego promoviendo la polimerización de un polinucleótido complementario a la diana. Los cebadores de la presente invención se componen de nucleótidos que varían de 17 a 30 nucleótidos. En un aspecto, el cebador tiene al menos 17 nucleótidos, o como alternativa, al menos 18 nucleótidos, o como alternativa, al menos 19 nucleótidos, o como alternativa, al menos 20 nucleótidos, o como alternativa, al menos 21 nucleótidos, o como alternativa, al menos 22 nucleótidos, o como alternativa, al menos 23 nucleótidos, o como alternativa, al menos 24 nucleótidos, o como alternativa, al menos 25 nucleótidos, o como alternativa, al menos 26 nucleótidos, o como alternativa, al menos 27 nucleótidos, o como alternativa, al menos 28
nucleótidos, o como alternativa, al menos 29 nucleótidos, o como alternativa, al menos 30 nucleótidos, o como alternativa, al menos 50 nucleótidos, o como alternativa, al menos 75 nucleótidos, o como alternativa, al menos 100 nucleótidos.
El RCS también puede ser al menos parcialmente complementario a una porción de la primera hebra de ADNc, de manera que sea capaz de dirigir la síntesis de una segunda hebra de ADNc utilizando la primera hebra de ADNc como molde. Por lo tanto, después de la síntesis de la primera hebra, puede añadirse una enzima ribonucleasa (por ejemplo, una enzima que tiene actividad ribonucleasaH) después de la síntesis de la primera hebra de ADNc para degradar la hebra de ARN y permitir que el CDS se hibride de nuevo en la primera hebra para dirigir la síntesis de una segunda hebra de ADNc. Por ejemplo, la RCS podría comprender hexámeros aleatorios, o una secuencia semialeatoria no autocomplementaria (que minimiza la autohibridación del CDS).
Puede añadirse un oligonucleótido de cambio de molde (TSO) que incluye una porción que es al menos parcialmente complementaria a una porción del extremo 3' de la primera hebra de ADNc a cada muestra de ARNm individual en los métodos descritos en el presente documento. Dicho método de cambio de molde se describe en (Esumi etal., Neurosci Res 60(4):439-51 (2008)) y permite sintetizar el ADNc de longitud completa que comprende el extremo 5' completo del ARNm. Como la actividad de la transferasa terminal de la transcriptasa inversa normalmente hace que se incorporen de 2 a 5 citosinas en el extremo 3' de la primera hebra de ADNc sintetizado a partir de ARNm, la primera hebra de ADNc puede incluir una pluralidad de citosinas, o análogos de citosina que se emparejan con guanosina, en su extremo 3' (véase el documento US 5.962.272). En un aspecto de la invención, la primera hebra de ADNc puede incluir una porción 3' que comprende al menos 2, al menos 3, al menos 4, al menos 5 o 2, 3, 4 o 5 citosinas o análogos de citosina que se emparejan con la guanosina. Un ejemplo no limitante de un análogo de citosina que forma pares de bases con guanosina es 5-aminoalil-2'-desoxicitidina.
En un aspecto de la invención, el TSO puede incluir una porción 3' que comprende una pluralidad de guanosinas o análogos de guanosina que se emparejan con la citosina. Los ejemplos no limitantes de guanosinas o análogos de guanosina útiles en los métodos descritos en el presente documento incluyen, pero sin limitación, desoxirriboguanosina, riboguanosina, ácido nucleico bloqueado-guanosina y péptido ácido nucleico-guanosina. Las guanosinas pueden ser ribonucleósidos o monómeros de ácido nucleico bloqueados.
Un ácido nucleico bloqueado (LNA) es un nucleótido de ARN modificado. El resto de ribosa de un nucleótido de LNA se modifica con un puente adicional que conecta el oxígeno 2' y el carbono 4'. El puente "bloquea" la ribosa en la conformación 3'-endo (norte). Algunas de las ventajas de usar LNA en los métodos de la invención incluyen el aumento de la estabilidad térmica de los dúplex, aumento de la especificidad de la diana y la resistencia de exo y endonucleasas.
Un ácido nucleico peptídico (PNA) es un polímero sintetizado artificialmente similar al ADN o al ARN, en donde la estructura principal está compuesta por unidades repetidas de N-(2-aminoetil)-glicina unidas por enlaces peptídicos. La estructura principal de un PNA es sustancialmente no iónica en condiciones neutrales, a diferencia de la cadena principal de fosfodiéster altamente cargado de ácidos nucleicos naturales. Esto proporciona dos ventajas no limitantes. En primer lugar, la cadena principal de PNA exhibe mejor cinética de hibridación. En segundo lugar, los PNA tienen cambios más grandes en la temperatura de fusión (Tm) para pares de bases mal emparejados respecto a perfectamente emparejados. El ADN y el ARN presentan típicamente una disminución de 2-4 °C en Tm por un desajuste interno. Con la cadena principal de PNA no iónico, la caída está más cerca de 7-9 °C. Esto puede proporcionar una mejor discriminación de secuencia. De manera análoga, debido a su naturaleza no iónica, la hibridación de las bases unidas a estas cadenas principales es relativamente insensible a la concentración salina.
Un ácido nucleico útil en la invención puede contener un resto de azúcar no natural en la estructura principal. Las modificaciones de azúcar ilustrativas incluyen pero no se limitan a modificaciones en 2' tales como adición de halógeno, alquilo, alquilo sustituido, SH, SCH3, OcN, Cl, Br, CN, CF3, OCF3, SO2CH3, OSO2, SO3, CH3, ONO2, NO2, N3, NH2, sililo sustituido y similares. También pueden producirse modificaciones similares en otras posiciones en el azúcar, particularmente, la posición 3' del azúcar en el nucleótido 3' terminal o en oligonucleótidos enlazados en 2'-5' y la posición 5' del nucleótido 5' terminal. Los ácidos nucleicos, los análogos de nucleósidos o los análogos de nucleótidos que tienen modificaciones de azúcar pueden modificarse adicionalmente para incluir un grupo de bloqueo reversible, marcador con péptido enlazado o ambos. En aquellas realizaciones en las que están presentes las modificaciones 2' descritas anteriormente, la base puede tener un marcador enlazado a un péptido.
Un ácido nucleico usado en la invención también puede incluir bases naturales o no naturales. En este sentido, un ácido desoxirribonucleico natural puede tener una o más bases seleccionadas entre el grupo que consiste en adenina, timina, citosina o guanina y un ácido ribonucleico puede tener una o más bases seleccionadas entre el grupo que consiste en uracilo, adenina, citosina o guanina. Las bases no naturales ilustrativas que se pueden incluir en un ácido nucleico, ya sea que tengan una estructura principal o análoga natural, incluyen, sin limitación, inosina, xatanina, hipoxatina, isocitosina, isoguanina, 5-metilcitosina, 5-hidroximetil-citosina, 2-aminoadenina, 6-metiladenina, 6-metil guanina, 2-propil guanina, 2-propil adenina, 2-tiouracilo, 2-tiotimina, 2-tiocitosina, 15-halouracilo, 15-halocitosina, 5-propinil uracilo, 5-propinil citosina, 6-azo uracilo, 6-azocitosina, 6-azotimina, 5-uracilo, 4-tiouracilo, 8-haloadenina o
guanina, 8-aminoadenina o guanina, 8-tioladenina o guanina, 8-tioalquiladenina o guanina, 8-hidroxiladenina o guanina, uracilo o citosina 5-halo sustituido, 7-metilguanina, 7-metiladenina, 8-azaguanina, 8-azaadenina, 7-desazaguanina, 7-desazaadenina, 3-desazaguanina, 3-deazaadenina o similares. Una realización particular puede utilizar isocitosina e isoguanina en un ácido nucleico para reducir la hibridación inespecífica, tal como se describe de manera general en la patente de EE.UU. n.° 5.681.702.
Una base no natural utilizada en un ácido nucleico puede tener actividad de emparejamiento de bases universal, en donde es capaz de emparejarse con cualquier otra base de origen natural. Las bases ilustrativas que tienen actividad de emparejamiento de bases universal incluyen 3-nitropirrol y 5-nitroindol. Otras bases que se pueden usar incluyen aquellas que tienen actividad de emparejamiento de bases con un subconjunto de las bases naturales como la inosina, que empareja sus bases con citosina, adenina o uracilo.
En un aspecto de la invención, el TSO puede incluir una porción de 3' que incluya al menos 2, al menos 3, al menos 4, al menos 5, o 2, 3, 4 o 5, o 2-5 guanosinas, o análogos de guanosina que se emparejan con la citosina. La presencia de una pluralidad de guanosinas (o análogos de guanosina que se emparejan con la citosina) permite que el TSO se hibride transitoriamente con las citosinas expuestas en el extremo 3' de la primera hebra de ADNc. Esto hace que la transcriptasa inversa cambie de molde y continúe sintetizando una hebra complementaria al TSO. En un aspecto de la invención, el extremo 3' del TSO puede estar bloqueado, por ejemplo por un grupo fosfato 3', para evitar que el TSO funcione como cebador durante la síntesis de ADNc.
En un aspecto de la invención, el ARNm se libera de las células mediante lisis celular. Si la lisis se consigue parcialmente mediante calentamiento, luego, el CDS y/o el TSO se pueden agregar a cada muestra de ARNm individual durante la lisis celular, ya que esto ayudará a la hibridación de los oligonucleótidos. En algunos aspectos, se puede añadir transcriptasa inversa después de la lisis celular para evitar la desnaturalización de la enzima. En algunos aspectos de la invención, se puede incorporar un marcador al ADNc durante su síntesis. Por ejemplo, el CDS y/o el TSO pueden incluir un marcador, tal como una secuencia de nucleótidos particular, que puede ser al menos 4, al menos 5, al menos 6, al menos 7, al menos 8, al menos 9, al menos 10, al menos 15 o al menos 20 nucleótidos de longitud. Por ejemplo, el marcador puede ser una secuencia de nucleótidos de 4-20 nucleótidos de longitud, por ejemplo, 4, 5, 6, 7, 8, 9, 10, 15 o 20 nucleótidos de longitud. Como el marcador está presente en el CDS y/o el t So , se incorporará al ADNc durante su síntesis y, por lo tanto, puede actuar como un "código de barras" para identificar el ADNc. Tanto el CDS como el TSO pueden incluir un marcador. El CDS y el TSO pueden incluir cada uno un marcador diferente, de manera que la muestra de ADNc marcada comprenda una combinación de marcadores. Cada muestra de ADNc generada por el método anterior puede tener un marcador distinto, o una combinación distinta de marcadores, de modo que una vez que se hayan agrupado las muestras de ADNc marcadas, el marcador se puede usar para identificar qué célula individual de cada muestra de ADNc se originó. Por lo tanto, cada muestra de ADNc se puede vincular a una célula individual, incluso después de que las muestras de ADNc marcadas se hayan agrupado en los métodos descritos en el presente documento.
Antes de que se agrupen las muestras de ADNc marcadas, se puede detener la síntesis de ADNc, por ejemplo, eliminando o inactivando la transcriptasa inversa. Esto evita que la síntesis de ADNc por transcripción inversa continúe en las muestras agrupadas. Las muestras de ADNc marcadas se pueden purificar opcionalmente antes de la amplificación, antes o después de que se agrupen.
Las muestras de ADNc reunidas se pueden amplificar mediante la reacción en cadena de la polimerasa (PCR), incluida la PCR en emulsión y la PCR con un solo cebador en los métodos descritos en el presente documento. Por ejemplo, las muestras de ADNc pueden amplificarse mediante PCR de cebador único. El CDS puede comprender una secuencia de cebador de amplificación 5' (APS), que posteriormente permite amplificar la primera hebra de ADNc por PCR utilizando un cebador que es complementario del 5' APS. El TSO también puede comprender un 5' APS, que puede ser al menos un 70 % idéntico, al menos un 80 % idéntico, al menos un 90 % idéntico, al menos un 95 % idéntico, o 70 %, 80 %, 90 % o 100 % idéntico al 5' APS en el CDS. Esto significa que las muestras de ADNc agrupadas se pueden amplificar mediante PCR utilizando un solo cebador (es decir, mediante PCR con un solo cebador), que aprovecha el efecto de supresión de la PCR para reducir la amplificación de amplicones contaminantes cortos y dímeros de cebadores (Dai et al., J Biotechnol 128(3):435-43 (2007)). Como los dos extremos de cada amplicón son complementarios, los amplicones cortos formarán horquillas estables, que son moldes deficientes para la PCR. Esto reduce la cantidad de ADNc truncado y mejora el rendimiento de moléculas de ADNc más largas. El 5' APS puede diseñarse para facilitar el procesamiento posterior de la biblioteca de ADNc. Por ejemplo, si la biblioteca de ADNc se va a analizar mediante un método de secuenciación particular, por ejemplo, la tecnología de secuenciación SOLiD de Applied Biosystems o el analizador de genoma de Illumina, el 5'a Ps puede diseñarse para que sea idéntico a los cebadores utilizados en estos métodos de secuenciación. Por ejemplo, el 5'APS puede ser idéntico al cebador SOLiD PI, y/o una secuencia SOLiD P2 insertada en el CDS, de modo que las secuencias P1 y P2 necesarias para la secuenciación de SOLiD son parte integral de la biblioteca amplificada. Otro método ilustrativo para amplificar el ADNc agrupado incluye la PCR. La PCR es una reacción en la que se hacen copias replicadas de un polinucleótido diana utilizando un par de cebadores o un conjunto de cebadores que consta de un cebador aguas arriba y uno aguas abajo, y un catalizador de polimerización, como una ADN polimerasa, y típicamente una enzima polimerasa térmicamente
estable. Los métodos para PCR son bien conocidos en la técnica y se enseñan, por ejemplo en MacPherson et al. (1991) PCR 1: A Practical Approach (IRL Press en Oxford University Press). Todos los procesos de producción de copias replicadas de un polinucleótido, como PCR o clonación de genes, se denominan colectivamente en el presente documento replicación. También se puede utilizar un cebador como sonda en reacciones de hibridación, tales como análisis de transferencia de Southern o de Northern.
Para PCR en emulsión, se crea una reacción de PCR en emulsión agitando vigorosamente o agitando una mezcla de "agua en aceite" para generar millones de compartimentos acuosos del tamaño de una micra. La biblioteca de ADN se mezcla en una dilución limitante con las perlas antes de la emulsión o directamente en la mezcla de emulsión. La combinación del tamaño del compartimento y la dilución limitante de perlas y moléculas diana se utiliza para generar compartimentos que contienen, en promedio, solo una molécula de ADN y una perla (en la dilución óptima, muchos compartimentos tendrán perlas sin ninguna diana). Para facilitar la eficiencia de la amplificación, en la mezcla de reacción se incluyen cebadores de PCR aguas arriba (concentración baja, coincide con la secuencia del cebador en la perla) y cebadores de PCR aguas abajo (concentración alta). Dependiendo del tamaño de los compartimentos acuosos generados durante la etapa de emulsificación, hasta 3x109 reacciones de PCR individuales por pl se pueden realizar simultáneamente en el mismo tubo. Esencialmente, cada pequeño compartimento de la emulsión forma un micro reactor de PCR. El tamaño medio de un compartimento en una emulsión varía desde submicrómetros de diámetro hasta más de 100 micrómetros, dependiendo de las condiciones de emulsificación. "Identidad", "homología" o "similitud" se usan indistintamente y se refieren a la similitud de secuencia entre dos moléculas de ácido nucleico. La identidad se puede determinar comparando una posición en cada secuencia que se puede alinear a efectos de comparación. Cuando una posición en la secuencia comparada está ocupada por la misma base o aminoácido, entonces las moléculas son homólogas en esa posición. El grado de identidad entre secuencias depende del número de posiciones coincidentes o idénticas compartidas por las secuencias. Una secuencia no relacionada o no homóloga comparte menos del 40% de identidad, o como alternativa menos del 25% de identidad, con una de las secuencias de la presente divulgación.
Un polinucleótido tiene un cierto porcentaje (por ejemplo, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 % o 99 %) de "identidad de secuencia" con otra secuencia significa que, cuando se alinean, ese porcentaje de bases es el mismo al comparar las dos secuencias. Esta alineación y el porcentaje de identidad de secuencia u homología se pueden determinar usando programas informáticos conocidos en la técnica, por ejemplo los descritos en Ausubel et al., Current Protocols in Molecular Biology, John Wiley y Sons, Nueva York, N.Y., (1993). Preferentemente, se usan parámetros predeterminados para la alineación. Un programa de alineación es BLAST, usando parámetros predeterminados. En particular, los programas son BLASTN y BLASTP, usando los parámetros predeterminados siguientes: Código genético= estándar; filtro = ninguno; hebra = ambas; umbral = 60; expectativa = 10; Matriz = BLOSUM62; Descripciones = 50 secuencias; clasificación por = PUNTUACIÓN ALTA; Bases de datos = no redundantes, GenBank EMBL DDBJ PDB traducciones de CDS de GenBank SwissProtein SPupdate PIR. Los detalles de estos programas se pueden encontrar en el National Center for Biotechnology Information. El método de preparación de una biblioteca de ADNc descrito en el presente documento puede comprender además procesar la biblioteca de ADNc para obtener una biblioteca adecuada para la secuenciación. Tal como se utiliza en el presente documento, una biblioteca es adecuada para secuenciar cuando la complejidad, el tamaño, la pureza o similar de una biblioteca de ADNc es adecuada para el método de cribado deseado. En particular, la biblioteca de ADNc se puede procesar para hacer que la muestra sea adecuada para cualquier método de detección de alto contenido, como la tecnología de secuenciación SOLiD de Applied Biosystems o el analizador de genomas de Illumina. De este modo, la biblioteca de ADNc se puede procesar fragmentando la biblioteca de ADNc (por ejemplo, con desoxirribonucleasa) para obtener una biblioteca de fragmentos cortos en el extremo 5'. Se pueden agregar adaptadores al ADNc, por ejemplo, en uno o ambos extremos para facilitar la secuenciación de la biblioteca. La biblioteca de ADNc se puede ampliar aún más, por ejemplo, mediante PCR, para obtener una cantidad suficiente de ADNc para la secuenciación.
Las realizaciones proporcionan una biblioteca de ADNc producida por cualquiera de los métodos descritos en el presente documento. Esta biblioteca de ADNc se puede secuenciar para proporcionar un análisis de la expresión génica en células individuales o en una pluralidad de células individuales.
Las realizaciones de la invención también proporcionan un método para analizar la expresión génica en una pluralidad de células individuales, comprendiendo el método las etapas de preparar una biblioteca de ADNc usando el método descrito en el presente documento y secuenciar la biblioteca de ADNc. Un "gen" se refiere a un polinucleótido que contiene al menos un marco de lectura abierto (ORF) que es capaz de codificar un polipéptido o proteína particular después de transcribirse y traducirse. Cualquiera de las secuencias de polinucleótidos descritas en el presente documento puede usarse para identificar fragmentos más grandes o secuencias codificantes de longitud completa del gen con el que están asociadas. Los expertos en la técnica conocen métodos para aislar secuencias de fragmentos más grandes.
Tal como se utiliza en el presente documento, "expresión" se refiere al proceso mediante el cual los polinucleótidos se transcriben en ARNm y/o el proceso mediante el cual el ARNm transcrito se traduce posteriormente en péptidos,
polipéptidos o proteínas. Si el polinucleótido deriva de ADN genómico, la expresión puede incluir el corte y empalme del ARNm en una célula eucariota.
La biblioteca de ADNc se puede secuenciar mediante cualquier método de cribado adecuado. En particular, la biblioteca de ADNc se puede secuenciar utilizando un método de cribado de alto rendimiento, como la tecnología de secuenciación SOLiD de Applied Biosystems o el analizador de genomas de Illumina. En un aspecto de la invención, la biblioteca de ADNc se puede secuenciar como una escopeta. El número de lecturas puede ser al menos 10.000, al menos 1 millón, al menos 10 millones, al menos 100 millones o al menos 1000 millones. En otro aspecto, el número de lecturas puede ser de 10.000 a 100.000, o como alternativa de 100.000 a 1 millón, o como alternativa de 1 millón a 10 millones, o como alternativa de 10 millones a 100 millones, o como alternativa de 100 millones a 1000 millones. Una "lectura" es una longitud de secuencia de ácido nucleico continua obtenida mediante una reacción de secuenciación.
"Secuenciación de escopeta" (en inglés “shotgun sequencing") se refiere a un método utilizado para secuenciar una gran cantidad de ADN (como el genoma completo). En este método, el ADN que se va a secuenciar se tritura primero en fragmentos más pequeños que se pueden secuenciar individualmente. Las secuencias de estos fragmentos se vuelven a ensamblar en su orden original en función de sus secuencias solapantes, produciendo así una secuencia completa. La "trituración" del ADN se puede realizar usando varias técnicas de diferencia que incluyen digestión con enzimas de restricción o cizallamiento mecánico. Las secuencias solapantes se alinean típicamente mediante una computadora programada adecuadamente. Los métodos y programas para la secuenciación rápida de una biblioteca de ADNc son bien conocidos en la técnica.
Una realización del método de la divulgación se resume en la Figura 1. Las células se obtienen de un tejido de interés y se obtiene una suspensión unicelular. Se coloca una célula individual en un pocillo de una placa de 96 pocillos en Cell Capture Mix. Las células se lisan y la mezcla de reacción de transcripción inversa se agrega directamente a los lisados sin purificación adicional. Esto da como resultado la síntesis de ADNc a partir de ARNm celular y la incorporación de un marcador en el ADNc. Las muestras de ADNc marcadas se agrupan y amplifican y luego se secuencian para producir 100 millones de lecturas. Esto permite la identificación de genes que se expresan en cada célula.
Los siguientes ejemplos pretender ilustrar, pero no limitar, la presente invención.
EJEMPLO I
Transcripción inversa marcada de una célula única (STRT)
Una realización del método de la invención puede denominarse "transcripción inversa marcada de una célula única" (STRT) y se describe en detalle a continuación.
Recolección y lisis de células
Se preparó una placa de 96 pocillos que contenía Cell Capture Mix tomando alícuotas de 5 pl/pocillo de la placa maestra de captura celular (véase la Tabla 1 a continuación) en una placa AbGene Thermo-Fast.
Se mezclaron 27,5 pl de STRT-T30-BIO (100 pM) con 1375 pl de tampón STRT 5x y 4,9 ml de agua libre de ribonucleasa/desoxirribonucleasa. Se tomaron alícuotas de 57,5 pl de esta solución en cada pocillo de una placa de 96 pocillos y se añadieron 5 pl/pocillo de STRT-FW-n (de la placa madre de 5 pM), es decir, un oligo diferente en cada pocillo.
La secuencia de STRT-T30-BIO (que es un CDS) es:
5'-BIO-AAGCAGTGGTATCAACGCAGAGTaoVN-3',
y la secuencia de STRT-FW-n (que es un TSO) es:
5 '-AAGCAGTGGTATCAACGCAGAGTGGATGCTXXXXXrGrGrG-3 '(X=marcador de células)
BtsCI-> 2/0
n es 1-96 y cada oligonucleótido tiene un marcador celular distinto, de manera que se agregue un oligonucleótido diferente a cada pocillo que contiene una célula individual.
Se cultivaron células madre embrionarias de ratón (R1) sin células alimentadoras, se tripsinizó, se aclararon a través del colador de células y se resuspendieron en 1x PBS. Luego, las células fueron recogidas por FACS en la placa de captura, colocando una célula individual en cada pocillo. La placa de captura se transfirió a un termociclador de PCR y se incubó a 72 °C durante 2 minutos, y luego se enfrió a 4°C durante 5 minutos para permitir que ocurriera la hibridación. El detergente en el tampón s Tr T ayuda a reducir la adsorción de ARNm y ADNc a las paredes del tubo de reacción durante las etapas posteriores y también mejora la lisis de las células. La etapa de calentamiento hace que la célula se lise completamente y libere su ARN. Cuando la temperatura se reduce, el cebador oligo (dT) hibrida.
Transcripción inversa
Se agregaron 5 pl/pocillo de mezcla RT (véase la Tabla 2 a continuación) y la placa se incubó a 42 °C durante 45 minutos, sin tapa calefactada.
Tabla 2 Com osición de la mezcla RT
Cuando se agrega la mezcla RT, la enzima transcriptasa inversa (Superscript II RT) sintetiza una primera hebra y el oligo de cambio de molde marcado introduce una secuencia de cebador aguas arriba.
La Figura 2 muestra la síntesis de ADNc por cambio de molde. El extremo 5' del ADNc (que corresponde al extremo 3' del ARNm) se puede controlar añadiendo una cola (que es oligo-dT en este caso) al cebador de síntesis de ADNc (CDS). El extremo 3' del ADNc se puede controlar utilizando el oligo de cambio de molde (TSO). Cuando la transcriptasa inversa alcanza el extremo 5' del molde de ARNm, agrega preferentemente 2-5 citosinas. El oligo de cambio de molde, que tiene 2-5 guanosinas, hibrida transitoriamente, y la transcriptasa inversa luego cambia el molde y sintetiza la hebra complementaria. Mediante este mecanismo, ambos extremos del ADNc pueden controlarse arbitrariamente.
La estructura de un GRT típico se muestra en la Figura 3. En este TSO en particular, la secuencia de cambio de molde en 3' incluye tres riboguaninas (rG). El marcador celular se muestra como "XXXXX" y, en general, puede tener cualquier longitud o composición de nucleótidos. Se puede insertar una secuencia arbitraria en el extremo 5' del TSO, después del 5' APS, o después del marcador celular, pero no en el extremo 3'.
La estructura de un CDS típico se muestra en la Figura 4. El RCS es oligo-dT con un nucleótido de anclaje (V = A, C, G degenerado). El marcador celular "XXXXX" puede tener cualquier longitud o composición de nucleótidos. Se pueden insertar secuencias arbitrarias adicionales en el extremo 5', después del 5' APS, o después del marcador celular.
Purificación de ADNc
Se añadieron 50 pl de PBI (Qiaquick PCR Purification Kit) a cada pocillo para inactivar la transcriptasa inversa. El PBI inactiva la transcriptasa inversa y luego se combinó el ADNc de todos los pocillos. La adición de PBI antes de la agrupación evita que continúe la síntesis de ADNc una vez que se han agrupado las muestras de ADNc. El ADNc combinado se cargó en una única columna Qiaquick y el ADNc purificado se eluyó en 30 pl de tampón EB en un tubo
Beckman Polyallomer. La etapa de purificación elimina los cebadores (<40 pb), así como las proteínas y otros desechos.
Amplificación de ADNc de longitud completa
El ADNc se amplificó mediante PCR agregando los reactivos que se muestran en la Tabla 3.
Tabla 3. Reactivos utilizados para la amplificación de ADNc de longitud completa.
La secuencia de STRT-PCR es:
5'-BIO-AAGCAGTGGTATCAACGCAGAGT-3'
La PCR se realizó usando una tapa calentada de la siguiente manera: 1 min a 95 °C, 25 ciclos de [5 s a 95 °C, 5 s a 65 °C, 6 min a 68 °C], 4 °C para siempre.
Se transfirieron 30 pl de la reacción a un nuevo tubo de PCR, etiquetado "Optimización". Los 70 pl restantes se almacenaron a 4 °C hasta más tarde. Se retiraron 10 pl del tubo de optimización y el resto de la muestra se analizó durante tres ciclos más. Esto se repitió para obtener alícuotas de 25, 28 y 31 ciclos. Se utilizó un gel de agarosa de diagnóstico al 2% para determinar el número de ciclo óptimo (que es el ciclo justo antes de la saturación de la PCR), así como para visualizar el rango de tamaños del producto (véase la Figura 5). Normalmente, el número óptimo de ciclos fue de alrededor de 28. Se procesaron los 70 pl restantes de reacción para alcanzar el número óptimo de ciclos (además de los 25 ciclos ya ejecutados).
El producto de PCR se purificó usando una columna Qiaquick (kit de purificación de PCR) y se eluyó en 50 pl de EB en un tubo de polialómero Beckman. La concentración esperada en esta etapa fue de aproximadamente 20-40 ng/pl (rendimiento total de 1-2 pg).
Tratamiento con desoxirribonucleasa
La muestra se trató con desoxirribonucleasa I en presencia de Mn2+ para generar roturas de doble hebra y reducir el tamaño. En primer lugar, los siguientes componentes se mezclaron en el orden que se muestra en la Tabla 4.
La desoxirribonucleasa I diluida (0,01 unidades/pl) se preparó justo antes de su uso de la siguiente manera: 40 pl 10x de tampón desoxirribonucleasa I, 318 pl de agua, 40 pl de MnCh 100 mM y 2 pl de desoxirribonucleasa I (2 U/pl).
Se añadieron 4 pl de esta desoxirribonucleasa I diluida a la mezcla de reacción descrita en la Tabla 4 y se incubó a
TA durante exactamente 10 minutos. A continuación, se detuvo la reacción añadiendo 600 |jl de PBI.
La muestra se purificó en una columna Qiaquick y se eluyó en 30 j l de EB.
Captura de perlas y reparación de extremos/traducción de mellas
A continuación, los fragmentos se unieron a perlas para capturar los extremos 5' y 3', y luego se trataron con TaqExpress para reparar los extremos deshilacliados y las mellas. Se lavaron 30 j l de Dynabeads MyOne C1 Streptavidin dos veces en 2x B&W (Dynal), luego se agregó a la muestra tratada con desoxirribonucleasa, se incubó durante 10 minutos y luego se lavó 3 veces en 1x B&W. Aproximadamente el 10% de la muestra se unió a las perlas (es decir, aproximadamente 30 - 60 ng), ya que los fragmentos internos no estaban biotinilados.
Las perlas se lavaron una vez en tampón TaqExpress 1x y se resuspendieron en la mezcla de reacción que se muestra en la Tabla 5:
Tabla 5 ^ mellas.
La reacción se incubó a 37 °C durante 30 minutos y luego se lavó tres veces en tampón NEB4 1x.
Liberación de fragmentos y ligadura del adaptador RDV/FDV
Los fragmentos se liberaron mediante digestión con BtsCI y se ligaron simultáneamente a los adaptadores FDV y RDV.
A continuación, las perlas se resuspendieron en la mezcla de reacción que se muestra en la Tabla 6.
T l . M z l r i n r l r n i n l rl .
La secuencia de STRT-FDV, realizada hibridando STRT-ADP1U y STRT-ADP1L, fue:
5 '-----CCACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGATCT-3'
3'-PHO-GGTGATGCGGAGGCGAAAGGAGAGATACCCGTCAGCCACTA-PHO-5'
La secuencia de STRT-RDV-A, hecho por hibridación de STRT-ADP2U-T y STRT-ADP2L fue:
5 '----- AACTGCCCCGGGTTCCTCATTCTCTT-3'
3'-PHO-TTGACGGGGCCCAAGGAGTAAGAGA-PHO-5'
Las perlas se incubaron durante 30 min a 37 °C. La reacción se detuvo añadiendo 200 |jl de PBI, mientras que las perlas se sostuvieron en el imán. El sobrenadante se cargó en una columna Qiaquick, se purificó y se eluyó en 30 j l de EB en un tubo de polialómero Beckman. La concentración del ADNc fue de aproximadamente 1-2 ng/jl.
Amplificación por PCR de biblioteca
Se establecieron ocho reacciones usando alícuotas de 4, 2, 1, 1/2, 1/4, 1/8, 1/16 y 1/32 j l de la biblioteca adaptada, cada una en 4 jl. Cada biblioteca se amplificó utilizando la mezcla de reacción de PCR que se muestra en la Tabla 7.
Tabla^ 7. Mezcla de reacción de PCR ara la am lificación de la biblioteca de ADNc.
La secuencia de SOLID-PI fue:
5'-CCACTACGCCTCCGCTTTCCTCTCTATG-3'
La secuencia de SOLID-P2 fue:
5'-CTGCCCCGGGTTCCTCATTCTCT-3'
La PCR se ejecutó con una tapa calentada: 5 min a 94 °C, 18 ciclos de [15 s a 94 °C, 15 s a 68 °C], 5 min a 70 °C. Las ocho reacciones se cargaron en un gel E al 2%, 10 j l 10 j l de agua para determinar qué reacción estaba apenas saturada (véase la Figura 6).
A continuación, se realizó una nueva reacción de PCR utilizando el número óptimo de ciclos y material de partida. Por ejemplo, si 1/4 j l fue óptimo en 18 ciclos, luego se realizaron 14 ciclos.
El producto de PCR se cargó en un gel E al 2%, se cortó la región de 125-200 pb del gel y se purificó mediante el kit de extracción de gel de Qiagen (véase la Figura 7). El ADNc purificado se eluyó en 50 j l de e B.
La biblioteca de ADNc se preparó ahora para la secuenciación de SOLiD y podría pasar directamente a la PCR en emulsión.
Para verificar la calidad de la biblioteca de ADNc, se clonó una alícuota usando el kit de clonación Invitrogen TOPO TA y se secuenció mediante secuenciación Sanger. La Figura 8 muestra un resultado típico que demuestra la presencia de secuencias de cebadores para SOLiD (PI y P2; subrayados), el marcador específico de la célula (recuadrado) y las 2-5 G (sombreadas en un recuadro gris) del mecanismo de cambio de molde. De 22 secuencias de Sanger, 7 no se podían asignar a nada en GenBank. Todos excepto uno de estos fueron errores de los adaptadores SOLiD, que se puede rediseñar para evitar que esto suceda. En experimentos separados, los presentes inventores no encontraron adaptadores mal ligados después de bloquear sus extremos romos con fosfato 3'. Como alternativa, los extremos 3' no ligados podrían bloquearse usando didesoxinucleótidos o diseñando una hebra sobresaliente incompatible con los extremos ligados de los adaptadores.
De las 15 secuencias restantes, uno era un ARN ribosómico (45S), que no está poliadenilado. Probablemente ocurrió debido a una falta de cebado interno durante la síntesis de la primera hebra. Las 14 lecturas restantes fueron todas de ARNm poliadenilado, en la orientación correcta y con los marcadores de célula correctos.
Para resumir este conjunto de datos, 15 de 22 lecturas fueron asignables y 14 de estas 15 fueron marcadores de transcripción correctos. Todos las transcritos que se ven en el conjunto de datos de secuencia de Sanger se enumeran
a continuación:
Gen Longitud (de ARNm)
Proteína ribosómica L35 452
B2_Mm2 ~200
Tubulina beta 2c 1561
B2_Mm1 ~195
Gen RIKEN 1110008L16 3 127
Sod2 661
Chchd2 910
mt-Cox2 947
Hnrnpab 2 545
Proteína ribosómica L24 558
Proteína ribosómica S18 524
RIKEN 2700060E02 941
B2_Mm1 ~195
Proteína ribosómica S28 356
Como se esperaba, la lista estaba dominada por genes altamente expresados como las proteínas ribosómicas. Varias transcritos largos estaban presentes en esta muestra, lo que indica que no hubo un fuerte sesgo (si lo hubiera) hacia los ARNm cortos.
De manera interesante, se observaron tres copias de repeticiones B2 (de las subfamilias Mm1 y Mm2). Estas son repeticiones de la familia SINE expresadas a partir de un promotor pol III (no pol II como la mayoría de los ARNm), pero con fuertes señales de poliadenilación. Se ha demostrado que se expresan a niveles extremadamente altos en células ES, juntos comprenden más del 10% de todo el ARNm. Aún más interesante, alcanzan su punto máximo justo antes de la fase S en células en división y, por lo tanto, son una indicación temprana de que será posible caracterizar el ciclo celular en células primarias no sincronizadas utilizando este método.
Control de calidad mediante PCR cuantitativa en tiempo real
Para verificar que las bibliotecas fueran representativas del contenido de ARNm de la población de células ES original, se realizó una PCR cuantitativa en tiempo real frente a un conjunto de marcadores de pluripotencia, así como marcadores de tejidos diferenciados. Se comparó una biblioteca de ADNc preparada según métodos clásicos a partir de 1 |jg de ARN total (~ 100.000 células) con la biblioteca preparada a partir de 96 células individuales utilizando el protocolo STRT.
Marcadores bien conocidos de pluripotencia, tales como Sox2, Oct4 y Nanog se detectaron en niveles similares en ambas muestras, mientras que los marcadores de diferenciación de la capa germinal como Brachyury, Gata4 y Eomes se detectaron solo a niveles muy bajos en ambas muestras (véase la Figura 9). La correlación cuantitativa fue buena (coeficiente de correlación de Pearson 0,84), con la excepción de Plk1, que no se detectó en células individuales en este experimento.
Reactivos usados
Tabla 8. Lista de reactivos usados en el método descrito anteriormente.
continuación
EJEMPLO II
Caracterización del paisaje transcripcional de una sola célula por ARN-Seq altamente multiplexada
El análisis de la expresión génica a gran escala ha ayudado enormemente a comprender el desarrollo y el mantenimiento de los tejidos. Sin embargo, los tejidos son invariablemente complejos, consistiendo en múltiples tipos de células en una diversidad de estados moleculares. Como resultado, el análisis de expresión de un tejido confunde los verdaderos patrones de expresión de los tipos de células que lo constituyen. En el presente documento se describe una estrategia novedosa, denominada perfil de expresión unicelular de escopeta, que se utilizó para acceder a muestras tan complejas. Es un método simple y altamente multiplexado que se utiliza para generar cientos de perfiles de expresión de ARN-Seq de una célula individual. Luego, las células se agrupan en función de sus perfiles de expresión, formando un mapa de células bidimensional sobre el que se pueden proyectar datos de expresión. El mapa celular resultante integra tres niveles de organización: toda la población de células, las subpoblaciones funcionalmente distintas que contiene y las células individuales en sí mismas, todo sin necesidad de marcadores conocidos para clasificar los tipos de células. La viabilidad de la estrategia se demuestra analizando los transcriptomas completos de 436 células individuales de tres tipos distintos. Esta estrategia permite el descubrimiento imparcial y el análisis de tipos de células naturales durante el desarrollo, fisiología y enfermedad del adulto.
MÉTODOS
Cultivo celular
Las células ES R1 se cultivaron como se describió previamente (Moliner et al., Stem Cells Dev. 17:233-243 (2008)). Las células MEF y Neuro-2A se cultivaron en DMEM con FBS al 10%, 1x de penicilina/estreptomicina, 1x de Glutamax y 2-mercaptoetanol 0,05 mM. Todos los reactivos de cultivo fueron de Gibco.
PCR cuantitativa en tiempo real (Q-PCR)
Se aisló ARN usando Trizol (Invitrogen) y se transcribió inversamente 1 |jg de ARN total con Superscript III (Invitrogen) y cebador oligo-(dT). Se mezclaron SYBR Green Master Mix (Applied Biosystems) y una cantidad de ADNc correspondiente a 5 ng de ARN con 4 cebadores pmol (Eurofins MWG Operon, Alemania) en un volumen total de 10
|j|, y se analizaron en un termociclador 7900HT en tiempo real (Applied Biosystems). Se utilizó una serie de diluciones del molde para determinar la eficacia del cebador.
Transcripción inversa marcada de una célula única (STRT)
Las células se disociaron enzimáticamente usando TrypLE Express (Invitrogen), se lavaron y se resuspendieron en solución salina tamponada con fosfato (PBS). Se recogió una sola célula en cada pocillo de una placa de captura de 96 pocillos (AbGene Thermo-Fast 96 N.° de cat. 0600) mediante clasificación de células activadas por fluorescencia (FACS), y la placa se congeló inmediatamente en hielo seco. El FACS se utilizó solo para recolectar células individuales y para rechazar células muertas y desechos basados en la dispersión de la luz; no se utilizó ningún indicador fluorescente y, por tanto, las células recogidas representarían una muestra aleatoria de la población. La placa de captura de células contenía una sola célula por pocillo en 5 j l de tampón STRT (Tris-HCl 20 mM a pH 8,0, KCl 75 mM, MgCh 6 mM, 0,02% de Tween-20) con 400 nM de STRT-T30-BIO (5'-biotina-AAGCAGTGGTATCAACGCAGAGT30VN-3 '; este y todos los demás oligos eran del operón Eurofins MWG) y STRT-FW-n 400 nM
(5'-AAGCAGTGGTATCAACGCAGAGTGGATGCTXXXXXrGrGrG-3', donde "rG" denota un ribonucleótido guanina y "XXXXX" era un código de barras). Cada pocillo de la placa de captura contenía un oligo auxiliar de cambio de molde diferente (STRT-FW-n) con un código de barras distinto. Por ejemplo, el pocillo A01 recibió STRT-FW-1 con secuencia 5'-AAGcAGTGGTATCAACGCAGAGTGGATGCTCAGAArGrGrG-3' que tiene la secuencia de código de barras CAGAA. Los 96 códigos de barras y las secuencias de oligonucleótidos auxiliares se muestran en la Tabla 9.
T l . i rr n i li n l i xili r .
(continuación)
(continuación)
(continuación)
La placa de captura de células se descongeló y luego se calentó para lisar las células (20 °C durante 5 minutos, 72 °C durante 4 minutos, 10 °C durante 5 minutos en un termociclador). 5 j l de mezcla de transcripción inversa (DTT 4 mM, dNTP 2 mM, 5 U /jl de Superscript II en tampón STRT) a cada pocillo y la placa se incubó (10 °C durante 10 minutos, 42 °C durante 45 minutos) para completar la transcripción inversa y el cambio de molde.
Para purificar el ADNc y eliminar los cebadores que no han reaccionado, se añadieron 50 j l de PB (Qiaquick PCR Purification Kit, Qiagen) a cada pocillo. Las 96 reacciones se combinaron y purificaron en una sola columna Qiaquick. El ADNc se eluyó en 30 j l de EB en un tubo de polialómero de 1,5 ml (Beckman).
La muestra completa de ADNc de 96 células se amplificó en un solo tubo en 100 j l de dNTP 200 jM , cebador STRT-PCR 200 jM (5'-biotina-AAGCAGTGGTATCAACGCAGAGT-3'; operón Eurofins MWG), 1x de mezcla de ADN polimerasa Advantage2 (Clontech) en 1x de tampón de PCR Advantage2 (Clontech) con 1 min a 94 °C seguido de 25 ciclos de 15 s a 95 °C, 30 s a 65 °C, 3 min a 68 °C, con tapa calefactada. Se visualizó una alícuota en un gel E de agarosa al 1,2% (Invitrogen) y la muestra se amplificó de 1 a 5 ciclos adicionales si era necesario. El producto se purificó (Qiaquick PCR Purification Kit, Qiagen) y se cuantificó mediante fluorimetría (Qubit, Invitrogen). Los rendimientos típicos fueron de 0,5 a 1 jg en total. Se tomaron alícuotas en esta etapa para análisis de micromatrices y Q-PCR.
Preparación de muestras para secuenciación de alto rendimiento
El ADNc amplificado fue fragmentado por desoxirribonucleasa I en presencia de Mn2+, lo que provoca una preferencia por las roturas de doble hebra. Se fragmentaron 50 j l de ADNc en tampón de desoxirribonucleasa I complementado con MnCL210 mM y desoxirribonucleasa I diluida a 0,0003 U /jl en un volumen total de 120 j l durante exactamente seis minutos a temperatura ambiente. La reacción se detuvo mediante la adición de 600 j l de PB (Qiaquick PCR Purification Kit, Qiagen), se purificó y se eluyó en 30 j l de EB en un tubo polialomérico (Beckman).
Los fragmentos 3' y 5' se inmovilizaron en 30 j l de perlas paramagnéticas recubiertas con estreptavidina (Dynabeads MyOne C1, Invitrogen), luego se resuspendió en 30 j l de tampón TaqExpress (Genetix, Reino Unido). Se repararon los extremos y se generaron salientes A individuales incubando las perlas en 40 j l de dNTP 200 jM , 0,25 U /jl de TaqExpress (Genetix, Reino Unido) en tampón TaqExpress a 37 °C durante 30 minutos, seguido de tres lavados en NEBuffer 4 (New England Biolabs).
Los fragmentos 5' que contenían códigos de barras e inserciones de ADNc se liberaron de las perlas mediante digestión con BtsCI, y los adaptadores se ligaron simultáneamente para generar una muestra adecuada para secuenciar en el analizador de genoma Illumina. Las perlas se resuspendieron en 40 j l de ATP 1 mM, adaptador SOLEXA-ADP1 de 1 jM
(5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCG ATCT-3' y 3'-PHO-TTACTATGCCGCTGGTGGCTCTAGATGTGAGAAAGGGATGTGCTGCGAGAAG GCTA-PHO-5'), adaptador SOLEXA-ADP2 de 1 jM
(5'-CAAGCAGAAGACGGCATACGAGCTCTTCCGATCT-3' y
3'-PHO-GTTCGTCTTCTGCCGTATGCTCGAGAAGGCTAG-PHO-5'), 0,25 U /jl de T4 ADNligasa (Invitrogen), 1 U /jl de BtsCI (New England Biolabs) en 1x NEBuffer 4, y se incubó durante 30 minutos a 37 °C. Las perlas se retiraron y el sobrenadante se purificó usando AmPure (Agencourt) y se eluyó en 40 j l de EB (Qiagen).
La muestra se cargó en un gel E SizeSelect al 2% y se recogió el intervalo de 200 a 300 pb. Se amplificó una alícuota de 4 j l en 50 j l de volumen total que contenía 200 jM de dNTP, 400 nM de cada cebador (5'-AATGATACGGCGACCACCGA-3 'y 5'-CAAGCAGAAGACGGCATACGAG-3') y 0,15 U /jl de polimerasa Phusion en tampón Phusion HF (New England Biolabs) con 30 s a 98 °C, 14-18 ciclos de [10 s a 98 °C, 30 s a 65 °C, 30 s a 72 °C] seguido de 5 min a 70 °C. Se utilizaron amplificaciones de prueba para determinar el número mínimo de ciclos necesarios. La muestra amplificada se purificó mediante Qiaquick PCR Purification seguida de un gel E SizeSelect al 2%, nuevamente recolectando la región de 200-300 pb. La concentración se midió con Qubit (Invitrogen) y fue típicamente de 5 ng/jl. Se clonaron alícuotas (TOPO, Invitrogen) y se secuenciaron mediante secuenciación de Sanger para verificar la calidad de la muestra y determinar la longitud promedio del fragmento. Basándose en esta información,
la concentración molar se pudo determinar con precisión y estaba generalmente por encima de 10 nM. La formación de grupos y la secuenciación por síntesis se realizó en un analizador de genomas IIx según los protocolos del fabricante (Illumina, Inc., San Diego, EE. UU.) en un proveedor de servicios comerciales (Fastens SA, Ginebra, Suiza).
Mapeo, cuantificación y visualización
Las lecturas sin procesar se clasificaron por código de barras (primeras cinco bases) y se recortaron para eliminar hasta cinco 5' G introducidas por cambio de molde, y 3' A que a veces se daban cuando una lectura se extendía hacia la cola de poli(A). Solo se permitían códigos de barras exactos, y los códigos de barras se diseñaron para que ningún error único pudiera convertir un código de barras válido en otro. Luego, las lecturas se asignaron al genoma del ratón utilizando Bowtie (Langmead et al., Genome Biol. 10:R25 (2009)) con la configuración predeterminada. Se descartaron las lecturas no mapeadas. Entonces, para cada característica anotada en el ensamblaje NCBI 37.1, todas las lecturas de mapeo se contaron para generar un recuento sin procesar. Es decir, todas las lecturas que se asignaron a cualquiera de los exones de un gen se asignaron a ese gen; no se distinguieron isoformas. Finalmente, las lecturas sin procesar de cada célula se normalizaron a transcritos por millón (t.p.m.). Los pocillos con menos de 1000 lecturas mapeadas se omitieron del análisis adicional; presumiblemente, estos incluían casos en los que el equipo de FACS no había alcanzado la gota de reactivo mientras se recogían las células.
Para visualizar células en un paisaje bidimensional, primero se calcularon todas las similitudes por pares. La distancia de Bray-Curtis se utilizó como métrica de similitud porque tendía a manejar bien el ruido en genes de baja expresión. La correlación estándar arrojó resultados similares, pero con algunas células más fuera de lugar (datos no mostrados). Luego se construyó un gráfico de similitud permitiendo que los nodos representen células y conectando cada célula con sus cinco células más similares (para mayor claridad, se omitieron las células con menos de 10.000 lecturas, ya que eran propensos a generar bordes falsos). Por lo tanto, cada nodo
(célula) tenía cinco bordes salientes y un número variable de bordes entrantes. Luego se usó el diseño dirigido por la fuerza para proyectar el gráfico en dos dimensiones, revelando la estructura interna basada en similitudes célulacélula. Se utilizó la función GraphPlot del programa Mathematica (Wolfram Research Inc., EE. UU.) con la opción "SpringElectricalEmbedding".
RESULTADOS
Se recogieron los datos de 436 células individuales de tres tipos diferentes de células de ratón: células madre embrionarias (ES R1, Wood et al., Nature 365: 87-89 (1993)), una línea de células tumorales de neuroblastoma (Neuro-2A, Olmsted et al., Proc. Natl. Acad. Sci EE. UU. 65:129-136 (1970)) y fibroblastos embrionarios (MEF) fueron documentados. En resumen, cada muestra se preparó recogiendo células individuales mediante clasificación de células activadas por fluorescencia (FACS) en los pocillos de una placa de PCR de 96 pocillos precargada con tampón de lisis; calentando la placa para completar la lisis, luego se agregan reactivos de transcripción inversa para generar una primera hebra de ADNc. Para incorporar un código de barras específico de pocillo (y por lo tanto específico de célula), el mecanismo de cambio de molde de la transcriptasa inversa (Schmidt et al., Nucleic Acids Res. 27: e31 (1999)) mediante el cual un oligo auxiliar dirige la incorporación de una secuencia específica en el extremo 3' de la molécula de ADNc (Figura 10A). Se utilizó un oligo auxiliar diferente en cada pocillo, con distintos códigos de barras de cinco bases y secuencia de cebador universal. Después de la síntesis de ADNc, las 96 reacciones se agruparon, se purificaron y se amplificaron por PCR de un solo cebador en un solo tubo. De este modo, se redujo el sesgo de amplificación de célula a célula, y el número de ciclos de PCR se pudo mantener bajo ya que la amplificación comenzó con 96 veces más material. A continuación, las muestras amplificadas se adaptaron para secuenciar utilizando métodos convencionales. El procedimiento se denominó "STRT" (transcripción inversa marcada de una célula individual). Para obtener detalles, véase la sección de Métodos y la Figura 11.
Por lo general, se obtuvieron de 5 a 12 millones de lecturas sin procesar por línea de secuenciación en un analizador del genoma IIx de Illumina, y cada muestra se analizó en hasta ocho carriles (pero generalmente uno o dos). Las lecturas sin un código de barras adecuado, causadas principalmente por errores en la preparación de la muestra, como adaptadores mal colocados, fueron eliminadas. Del 79 ± 11% de las lecturas restantes (media ± d.e.), aproximadamente tres cuartas partes (75 ± 12%) podrían colocarse en el genoma del ratón, lo que permite hasta dos errores de secuenciación, resultando en éxitos a 14,718 ± 3,006 características distintas (incluyendo ARNm, ARN mitocondrial y repeticiones expresadas). Estos resultados se resumen en la Tabla 10
Los éxitos abarcaron algunos transcritos (Figura 10B), pero se encontraban más comúnmente en una región de aproximadamente 200 a 1500 pb desde el extremo 3' de cada gen, como se ilustra en la Figura 10C. Esto se esperaba porque se usó un cebador oligo (dT) para generar ADNc desde el extremo 3' y es probable que el ARNm se degrade parcialmente durante la lisis celular por hidrólisis a alta temperatura en presencia de Mg2+. Los antecedentes de, por ejemplo, la contaminación del ADN genómico, juzgado por aciertos a una secuencia no anotada, fueron mínimos (<10 3 lecturas por millón por kilobase), como se ve claramente en la Figura 10B y la Figura 10C. Nótese la escasez de aciertos en la hebra inversa y en los intrones tanto para Pou5f1 como para Nanog; otros loci eran similares.
Al examinar los datos mapeados, no se encontró evidencia de cebado incorrecto u otras reacciones secundarias no deseadas. Los experimentos de control mostraron que tanto el ARN, la transcriptasa inversa y el oligo de cambio de molde se requirieron individualmente para producir el producto (datos no mostrados). La gran mayoría de las lecturas mapeadas tenían un código de barras orientado correctamente, lo que indica que se cebaron a partir del cebador oligodT y se cambiaron correctamente de molde. No se encontró evidencia de un motivo complementario a ninguno de los cebadores cerca de los sitios de mapeo de lectura o, de hecho, de cualquier otro motivo, excepto por un sesgo T general débil en casos raros (Figura 12). Por otro lado, había frecuentes puntos críticos de cambio de molde (Figura 13), lo que indica limitaciones estructurales en el ARN que afectan la síntesis de ADNc y/o cambio de molde en sitios particulares. Los puntos calientes fueron consistentes entre las células y, por lo tanto, no deberían afectar las comparaciones cuantitativas.
Para caracterizar la complejidad de la muestra y determinar la profundidad de secuenciación necesaria para muestrear la mayor parte de la complejidad disponible, se estudió la tasa de "nuevos descubrimientos" en función de la profundidad de lectura. En otras palabras, se determinó el número de moléculas nuevas y distintas que se descubrieron a medida que se añadían más secuencias. Cabe señalar que, como máximo, se generó un clon amplificable a partir de cada molécula de ARN poliadenilado y luego este clon se amplificó y secuenció desde su extremo 5'. Por lo tanto, el mapeo de lecturas en distintas ubicaciones debe haberse generado a partir de distintas moléculas de ARNm. Por otro lado, las lecturas que mapean en la misma ubicación pueden haberse generado coincidentemente a partir de dos moléculas de ARNm, o pueden representar copias del clon inicial de la muestra. El número de lecturas de mapeo distintivo fue, por lo tanto, un límite inferior en la verdadera complejidad de la muestra. Como se muestra en la Figura 14A, ninguna de las muestras informadas en el presente documento se secuenciaron hasta la saturación, incluso con 21 millones de lecturas mapeadas, pero el rendimiento de nuevas moléculas tendió a disminuir después de aproximadamente 5 a 10 millones de lecturas. Al proyectar las curvas a una profundidad de lectura infinita, la mayoría de las muestras parecen contener al menos tres millones de moléculas distintas, o unas 30.000 por célula. Suponiendo 105 - 106 moléculas de ARNm por célula, esto sugeriría que el método convirtió con éxito entre el 3 y el 30% del ARNm en lecturas mapeables, como un límite inferior (muy) conservador. La proporción real probablemente fue significativamente mayor, ya que muchas lecturas coincidentes (descartadas en este análisis) se generarían a partir de puntos calientes de cambio de molde, tal como se ha mencionado anteriormente.
En cambio, la tasa de descubrimiento de características distintas disminuyó rápidamente, y el 86% de todas las características distintas se detectaron en las primeras lecturas del 14% (Figura 14B). Esto sugiere que el método recuperó con éxito la mayoría de las características expresadas presentes en las muestras, incluso a una profundidad de lectura relativamente baja.
A menudo se requiere información de cadena para asignar correctamente lecturas a unidades transcripcionales, ya que los genes se solapan con frecuencia en hebras opuestas. Por ejemplo, más de 3000 genes humanos se solapan de esta manera (Yelin et al., Nat. Biotechnol. 21:379-386 (2003)). Debido a que el mecanismo de cambio de molde utilizado para introducir un código de barras se produce de forma direccional, el varamiento podría conservarse a lo largo del protocolo. Para confirmar esto, se examinó el genoma mitocondrial, que se expresa como un único transcrito largo de una hebra (la hebra H), y posteriormente se escinde para escindir los transcritos de ARNt localizados entre genes que codifican proteínas. A continuación, solo se poliadenilan los genes que codifican proteínas. Una único transcrito que codifica una proteína, ND6, se genera a partir de la hebra L, pero está muy débilmente expresado y poliadenilado irregularmente (Slomovic et al., Mol. Cell. Biol. 25:6427-6435 (2005)). Como se muestra en la Figura 10D, se observó una especificidad de cadena muy fuerte (> 99% de lecturas en la cadena H) y no se detectó expresión significativa de genes de ARNt, lo que confirma que el método era específico de poli(A). El pequeño número de aciertos en la hebra L se produjo principalmente cerca del promotor de la hebra L, que puede explicarse por la poliadenilación de los transcritos de la hebra L abortados (Slomovic et al., anteriormente citado). De manera análoga, la aparente expresión de ND6 en la hebra incorrecta probablemente se explica por la poliadenilación natural de ND5 aguas abajo de su marco de lectura abierto (Slomovic et al., anteriormente citado). La especificidad de la hebra les permitió a los presentes inventores asignar lecturas sin ambigüedades a los transcritos expresados, incluso en los casos en que se coexpresaron dos genes solapantes (Figura 15).
En la escala más grande de los cromosomas nucleares, los aciertos se distribuyeron aproximadamente por igual en las hebras directa e inversa. La densidad de lectura se correlacionó fuertemente con la densidad de genes como se muestra para el cromosoma 19 en la Figura 10E, nuevamente, lo que indica que la mayoría de las lecturas se originaron específicamente a partir de transcritos expresados y se mapearon con precisión al genoma.
Para generar una medida cuantitativa de la expresión génica, se contó el número de visitas a cada característica anotada, normalizada a transcritos por millón (t.p.m.). Suponiendo 105 a 106 transcritos por célula, 1 a 10 t.p.m. corresponde a una sola molécula de ARNm por célula.
La longitud del transcrito (como en la medida RPKM (Mortazavi et al., Nat. Methods 5:621-628 (2008))) no se utilizó para normalizar porque se generó una única molécula amplificable del extremo 3' para cada molécula de ARNm de entrada, independientemente de su longitud. Una ventaja de este enfoque fue la falta de sesgo contra los transcritos cortos (que deben muestrearse más profundamente para generar un valor de RPKM detectable) o transcritos largos (que de otro modo podrían suprimirse durante la PCR). De hecho, y en contraste con la ARN-Seq estándar (Oshlack et al., Biol. Direct 4:14 (2009)), no se observó ningún sesgo dependiente de la longitud para los transcritos de más de 800 nucleótidos (Figura 16). Los transcritos de menos de 200 nucleótidos fueron subestimados, probablemente porque solo se seleccionaron en gel las muestras superiores a 100 pb. De manera adicional, los transcritos alrededor de 600 nucleótidos estaban ligeramente sobrerrepresentadas, posiblemente debido a la mayor eficacia del cambio de molde en la caperuza de 5' del ARNm (Schmidt et al., Nucleic Acids Res. 27:e31 (1999)) o debido a la presencia de unos pocos genes muy expresados en este rango (por ejemplo, Dppa5 y Rps14).
Los niveles de expresión abarcaron cuatro órdenes de magnitud en células individuales (aproximadamente 1 -10.000 t.p.m.), con la mayoría de los genes expresados a niveles bajos (<100 t.p.m.; Figura 17A). Dada la profundidad relativamente baja de secuenciación utilizada en el presente documento, los genes expresados por debajo de 10 t.p.m. eran generalmente indetectables únicamente debido al límite de muestreo. Dado que el ADNc de una célula individual se combinó antes de la amplificación, los rendimientos de diferentes células no pudieron normalizarse posteriormente. En consecuencia, las células se muestrearon de manera desigual y el límite de detección varió. Por ejemplo, comparar dos células muestreadas a 500.000 lecturas (Figura 17B) y 100.000 lecturas (Figura 17C). En el primer caso, el límite de detección aparente fue de alrededor de 10 t.p.m., mientras que en el último caso generalmente no se detectaron genes por debajo de 100 t.p.m. Sin embargo, en ambos casos, los genes por encima del límite de detección se cuantificaron de forma reproducible en células individuales (el coeficiente de variación fue del 46% a 500.000 lecturas; y del 72% a 100.000 lecturas). La extensión de este análisis a todas las células y genes mostró que la sensibilidad se acercaba al límite teórico impuesto por la profundidad de muestreo (Figura 17D); la diferencia se puede explicar por pérdidas en la transcripción inversa, cambio de molde y manipulación de muestras. Los niveles de expresión medidos fueron generalmente precisos, tal como se determina por comparación con Q-PCR (Figura 17E) y la hibridación de micromatrices (Figura 18). De acuerdo con informes publicados basados en Q-PCR (Bengtsson et al., Genome Res.
15:1388-1392 (2005)), La abundancia de ARNm de Actb mostró una distribución aproximadamente log-normal a través de las células (Figura 19). La ARN polimerasa II (subunidad grande) se expresó a 25 ± 123 t.p.m. en células ES, comparable a los 27 RPKM encontrados por ARN-Seq (Cloonan et al., Nat. Methods 5:613-619 (2008)) y a las 33 ± 79 t.p.m. encontradas en células CHO por detección directa in situ (suponiendo 300.000 transcritos por célula) (Raj et al., PLoS Biol 4:309 (2006)).
Se visualizaron las relaciones célula-célula en un mapa bidimensional, de modo que las células más estrechamente relacionadas se ubicarían cerca unas de otras. De este modo, los tipos de células basados únicamente en datos de expresión pudieron ser detectados y distinguidos, sin depender de marcadores preexistentes. Un análisis de componentes principales convencional (PCA) reveló tres grupos distintos de células, como se esperaba (Figura 20). Sin embargo, se logró una separación más completa en distintos grupos de tipos de células utilizando un método basado en gráficos (véase Métodos). En resumen, se construyó un gráfico con nodos que representan células y bordes que representan la similitud del patrón de expresión célula-célula (Figura 21A). Se utilizó un diseño dirigido a la fuerza para proyectar el gráfico en dos dimensiones. En este caso de prueba, utilizando solo dos tipos de células (células Es y Neuro2A), se logró una separación casi perfecta (Figura 21B). Un mapa más grande que incorpora células MEF y ES adicionales mostró una buena separación (Figura 21C); demostrando que los perfiles de expresión de una célula individual contenían suficiente información para distinguir los tipos de células de novo. Tanto el análisis PCA como el análisis basado en gráficos distinguieron claramente los tipos de células probados en el presente documento, pero el método basado en gráficos generó grupos más homogéneos, bien separados. Ambos métodos agruparon con precisión las células madre embrionarias preparadas de forma independiente a diferencia de los otros tipos de células, mostrando que los grupos no representaban artefactos de preparación de muestras.
Los datos de expresión génica se proyectaron en el mapa, que proporcionó una manera fácil de comprender rápidamente los patrones de expresión génica tanto en células individuales como en los grupos que representan los tipos de células (Figura 22). Un conjunto de marcadores de células ES bien conocidos (Dppa5, Sox2, Sall4, Pou5f1, Nanog, Zfp42, Zic3, Esrrb) se expresaron claramente de forma específica en células ES, aunque sus niveles de expresión variaron ampliamente de una célula a otra (observe la escala de color logarítmica). Algunos genes importantes para la pluripotencia (Klf4, Myc y Klf2) se expresaron de forma más amplia. El poder del análisis unicelular a gran escala fue evidente en el hecho de que, si bien no todas las células expresaron todos los marcadores, los patrones de actividad genética fueron muy consistentes a nivel de grupo. Por ejemplo, incluso un gen citoesquelético altamente expresado como Actb no siempre se detectó, pero su expresión en cada uno de los tres grupos principales era obvia. De manera correspondiente, los factores de transcripción expresados más bajos característicos de las
células ES pasaron desapercibidos en algunas células ES individuales, pero el patrón general de expresión en el grupo de células ES no fue ambiguo y consistente con su identidad como células ES. En general, ya que los niveles de expresión promedio disminuyeron de 45000 t.p.m. (mt_Rnr2) a 1700 (Actb), 850 (Rpl4), 73 (Kras) y 0 t.p.m. (Calb1), el número de células que expresan también disminuyó, reflejando la naturaleza estocástica de la expresión génica, así como los límites de sensibilidad del método.
La representación del mapa celular demostró que (1) las células individuales mostraban patrones de expresión muy variables, sin embargo, su patrón general de expresión fue suficiente para agrupar células de un tipo como un grupo; (2) una vez que se formó un grupo de células, que representa un tipo de célula distinto, los patrones de expresión génica (a nivel de grupo) no eran ambiguos. Por lo tanto, el perfil de expresión de una sola célula es una estrategia eficaz para acceder a los datos de expresión de una sola célula en poblaciones heterogéneas de células.
DISCUSIÓN
En el presente documento se describe un método fiable y preciso para obtener perfiles de transcripción de ARN-Seq de cientos de células individuales, y se muestra que los perfiles de expresión de células individuales pueden usarse para formar agrupaciones específicas de tipos de células. Esto permite el análisis de patrones de expresión génica específicos del tipo celular tanto a nivel de una célula individual como a nivel de población, sin la necesidad de marcadores conocidos o incluso un conocimiento previo de que existe un determinado tipo de célula. Esta estrategia general se puede ampliar para estudiar todo tipo de muestras mixtas. Por ejemplo, podría aplicarse para controlar la aparición de tipos de células específicos durante la organogénesis, sin la necesidad de purificar esos tipos de células utilizando marcadores de superficie celular. De manera análoga, podría usarse para estudiar pequeñas poblaciones de células madre incrustadas en tejidos adultos, como las células madre que mantienen las criptas intestinales. El método también podría aplicarse a enfermedades, incluida la caracterización de muestras heterogéneas de células tumorales o las raras células cancerosas en circulación que pueden contribuir a la metástasis.
Lo que une todas estas líneas científicas dispares de investigación es la necesidad de desmezclar poblaciones heterogéneas de células. En la actualidad, la desmezcla se logra principalmente aislando físicamente las células basándose en marcadores de superficie celular conocidos, o marcando genéticamente las células deseadas para que puedan aislarse basándose, por ejemplo, en la expresión de GFP. Sin embargo, el uso de marcadores previamente conocidos impide el descubrimiento de nuevos tipos de células y siempre corre el riesgo de generar datos mixtos si los marcadores no son verdaderamente específicos. En cambio, los métodos descritos en el presente documento han demostrado que las células de distintos tipos pueden estar sin mezclar puramente por simulación computacional, siempre que se generen un gran número de perfiles de expresión de células individuales.
De manera importante, entonces, se requiere un método escalable de muy alto rendimiento para la generación de perfiles de expresión de una célula individual. Por lo tanto, se desarrolló un método para preparar una muestra de ADNc unicelular con código de barras a partir de 96 células en una sola etapa de incubación. En consecuencia, 96 células podrían agruparse y tratarse como una sola muestra durante todo el procedimiento, lo que aumentó considerablemente el rendimiento y redujo los costos. También puede reducir el sesgo de amplificación, ya que las 96 células se amplificaron en un solo tubo cerrado. Todo el procedimiento tarda dos días en realizarse, desde 96 células vivas hasta muestras terminadas cargadas en el analizador de genoma. El costo, incluidos todos los reactivos y consumibles para generar entre 10 y 15 millones de lecturas de 36 pb utilizando servicios comerciales, fue de aproximadamente $3500 (es decir, aproximadamente $35/célula).
La fecha generada en este documento estaba en una gran cantidad de células individuales, cada una analizada a una profundidad de cobertura relativamente baja. Esto permitió la generación de datos en muchas más células individuales de las que se han informado en un solo estudio (no se han publicado experimentos de transcriptomas unicelulares con más de una docena de células) y producir un mapa celular con alta resolución. De hecho, siempre que cada célula se muestree con la profundidad suficiente para agruparse correctamente, a menudo, tendría más sentido analizar un número mayor de células que analizar cada célula con mayor profundidad. Cuantas más células se agreguen, más precisos serán los datos agregados obtenidos de cada tipo de célula (grupo) distinto, y mejor será la resolución en el "espacio de tipo de célula". Por ejemplo, muchas de las células ES en el presente documento se muestrearon a menos de 100.000 lecturas/célula, pero en total se identificaron 160 células ES en el mapa celular, que comprende más de 1,5 millones de lecturas. El muestreo de una gran cantidad de células será especialmente importante cuando el enfoque se aplique a tejidos complejos, donde algunos tipos de células pueden estar presentes solo en una pequeña minoría. Además, a medida que los costos de secuenciación continúan disminuyendo, la compensación entre el número de células y el número de lecturas será menos urgente.
Se prevé el uso de perfiles transcripcionales unicelulares a muy gran escala para construir un mapa detallado de los tipos de células naturales, lo que daría un acceso sin precedentes a la maquinaria genética activa en cada tipo de célula en cada etapa de desarrollo. La misma estrategia se puede utilizar para diseccionar la heterogeneidad mutacional de las neoplasias a nivel unicelular.
LISTADO DE SECUENCIAS
<110> Illumina, Inc.
<120> Análisis de expresión génica en células individuales <130>ILU100303PEP
<150> PCT/US2010/028361
<151> 23/03/2010
<150> US61/164.759
<151> 30/03/2009
<160> 111
<170> BiSSAP 1.3.2
<210> 1
<211> 23
<212> ADN
<213> Secuencia Artificial
<223> "cebador STRT-T30-BIO"
<220>
<223> cebador STRT-T30-BIO
<400> 1
aagcagtggt atcaacgcag agt 23
<210> 2
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-n"
<220>
<223> STRT-FW-n
<220>
<221> misc_feature
<222> 31..35
<223> /nota="n es a, c, g o t"
<400> 2
aagcagtggt atcaacgcag agtggatgct nnnnnggg 38 <210> 3
<211> 23
<212> ADN
<213> Secuencia Artificial
<223> "cebador STRT-PCR"
<220>
<223> cebador STRT-PCR
<400> 3
aagcagtggt atcaacgcag agt 23
<210> 4
<211> 43
<212> ADN
<213> Secuencia Artificial
<223> "STRT-ADP1U"
<220>
<223> STRT-ADP1U
<400> 4
ccactacgcc tccgctttcc tctctatggg cagtcggtga tct 43 <210>5
<211> 41
<212>ADN
<213> Secuencia Artificial
<223> "STRT-ADP1L"
<220>
<223> STRT-ADP1L
<400> 5
ggtgatgcgg aggcgaaagg agagataccc gtcagccact a41 <210>6
<211> 26
<212> ADN
<213> Secuencia Artificial
<223> "STRT-ADP2U-T"
<220>
<223> STRT-ADP2U-T
<400> 6
aactgccccg ggttcctcat tctctt 26
<210>7
<211> 25
<212>ADN
<213> Secuencia Artificial
<223> "STRT-ADP2L"
<220>
<223> STRT-ADP2L
<400> 7
ttgacggggc ccaaggagta agaga 25
<210>8
<211> 28
<212>ADN
<213> Secuencia Artificial
<223> "SOLID-P1"
<220>
<223> SOLID-P1
<400> 8
ccactacgcc tccgctttcc tctctatg 28
<210>9
<211> 23
<212>ADN
<213> Secuencia Artificial
<223> "SOLID-P2"
<220>
<223> SOLID-P2
<400>9
ctgccccggg ttcctcattc tct 23
<210> 10
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-1"
<220>
<223> STRT-FW-1
<400> 10
aagcagtggt atcaacgcag agtggatgct cagaaggg 38 <210> 11
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-2"
<220>
<223> STRT-FW-2
<400> 11
aagcagtggt atcaacgcag agtggatgct catacggg 38 <210> 12
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-3"
<220>
<223> STRT-FW-3
<400> 12
aagcagtggt atcaacgcag agtggatgct caaagggg 38 <210> 13
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-4"
<220>
<223> STRT-FW-4
<400> 13
aagcagtggt atcaacgcag agtggatgct cacatggg 38 <210> 14
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-5"
<220>
<223> STRT-FW-5
<400> 14
aagcagtggt atcaacgcag agtggatgct catcaggg 38 <210> 15
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-6"
<220>
<223> STRT-FW-6
<400> 15
aagcagtggt atcaacgcag agtggatgct cagccggg 38
<210> 16
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-7"
<220>
<223> STRT-FW-7
<400> 16
aagcagtggt atcaacgcag agtggatgct caccgggg 38
<210> 17
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-8"
<220>
<223> STRT-FW-8
<400> 17
aagcagtggt atcaacgcag agtggatgct caactggg 38
<210> 18
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-9"
<220>
<223> STRT-FW-9
<400> 18
aagcagtggt atcaacgcag agtggatgct caagaggg 38
<210> 19
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-10"
<220>
<223> STRT-FW-10
<400> 19
aagcagtggt atcaacgcag agtggatgct cacgcggg 38
<210> 20
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-11"
<220>
<223> STRT-FW-11
<400> 20
aagcagtggt atcaacgcag agtggatgct catgtggg 38 <210> 21
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-12"
<220>
<223> STRT-FW-12
<400> 21
aagcagtggt atcaacgcag agtggatgct cactaggg 38 <210> 22
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-13"
<220>
<223> STRT-FW-13
<400> 22
aagcagtggt atcaacgcag agtggatgct caatcggg 38 <210> 23
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-14"
<220>
<223> STRT-FW-14
<400> 23
aagcagtggt atcaacgcag agtggatgct cattgggg 38 <210> 24
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-15"
<220>
<223> STRT-FW-15
<400> 24
aagcagtggt atcaacgcag agtggatgct cagttggg 38 <210> 25
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-16"
<220>
<223> STRT-FW-16
<400> 25
aagcagtggt atcaacgcag agtggatgct cctaaggg 38 <210> 26
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-17"
<220>
<223> STRT-FW-17
<400> 26
aagcagtggt atcaacgcag agtggatgct ccgacggg 38 <210> 27
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-18"
<220>
<223> STRT-FW-18
<400> 27
aagcagtggt atcaacgcag agtggatgct ccaatggg 38 <210> 28
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-19"
<220>
<223> STRT-FW-19
<400> 28
aagcagtggt atcaacgcag agtggatgct ccgcaggg 38 <210> 29
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-20"
<220>
<223> STRT-FW-20
<400> 29
aagcagtggt atcaacgcag agtggatgct cctccggg 38 <210> 30
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-21"
<220>
<223> STRT-FW-21
<400> 30
aagcagtggt atcaacgcag agtggatgct ccacgggg 38 <210> 31
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-22"
<220>
<223> STRT-FW-22
<400> 31
aagcagtggt atcaacgcag agtggatgct ccagcggg 38
<210> 32
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-23"
<220>
<223> STRT-FW-23
<400> 32
aagcagtggt atcaacgcag agtggatgct cctggggg 38
<210> 33
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-24"
<220>
<223> STRT-FW-24
<400> 33
aagcagtggt atcaacgcag agtggatgct ccggtggg 38
<210> 34
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-25"
<220>
<223> STRT-FW-25
<400> 34
aagcagtggt atcaacgcag agtggatgct ccataggg 38
<210> 35
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-26"
<220>
<223> STRT-FW-26
<400> 35
aagcagtggt atcaacgcag agtggatgct ccgtgggg 38
<210> 36
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-27"
<220>
<223> STRT-FW-27
<400> 36
aagcagtggt atcaacgcag agtggatgct cctttggg 38 <210> 37
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-28"
<220>
<223> STRT-FW-28
<400> 37
aagcagtggt atcaacgcag agtggatgct cgaaaggg 38 <210> 38
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-29"
<220>
<223> STRT-FW-29
<400> 38
aagcagtggt atcaacgcag agtggatgct cgcacggg 38 <210> 39
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-30"
<220>
<223> STRT-FW-30
<400> 39
aagcagtggt atcaacgcag agtggatgct cggagggg 38 <210> 40
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-31"
<220>
<223> STRT-FW-31
<400> 40
aagcagtggt atcaacgcag agtggatgct cgtatggg 38 <210> 41
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-32"
<220>
<223> STRT-FW-32
<400> 41
aagcagtggt atcaacgcag agtggatgct cgccaggg 38 <210> 42
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-33"
<220>
<223> STRT-FW-33
<400> 42
aagcagtggt atcaacgcag agtggatgct cgaccggg 38 <210> 43
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-34"
<220>
<223> STRT-FW-34
<400> 43
aagcagtggt atcaacgcag agtggatgct cgtcgggg 38 <210> 44
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-35"
<220>
<223> STRT-FW-35
<400> 44
aagcagtggt atcaacgcag agtggatgct cggctggg 38 <210> 45
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-36"
<220>
<223> STRT-FW-36
<400> 45
aagcagtggt atcaacgcag agtggatgct cgggaggg 38 <210> 46
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-37"
<220>
<223> STRT-FW-37
<400> 46
aagcagtggt atcaacgcag agtggatgct cgtgcggg 38 <210> 47
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-38"
<220>
<223> STRT-FW-38
<400> 47
aagcagtggt atcaacgcag agtggatgct cgaggggg 38
<210> 48
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-39"
<220>
<223> STRT-FW-39
<400> 48
aagcagtggt atcaacgcag agtggatgct cgcgtggg 38
<210> 49
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-40"
<220>
<223> STRT-FW-40
<400> 49
aagcagtggt atcaacgcag agtggatgct cgttaggg 38
<210> 50
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-41"
<220>
<223> STRT-FW-41
<400> 50
aagcagtggt atcaacgcag agtggatgct cggtcggg 38
<210> 51
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-42"
<220>
<223> STRT-FW-42
<400> 51
aagcagtggt atcaacgcag agtggatgct cgctgggg 38
<210> 52
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-43"
<220>
<223> STRT-FW-43
<400> 52
aagcagtggt atcaacgcag agtggatgct cgattggg 38 <210> 53
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-44"
<220>
<223> STRT-FW-44
<400> 53
aagcagtggt atcaacgcag agtggatgct ctcaaggg 38 <210> 54
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-45"
<220>
<223> STRT-FW-45
<400> 54
aagcagtggt atcaacgcag agtggatgct ctaacggg 38 <210> 55
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-46"
<220>
<223> STRT-FW-46
<400> 55
aagcagtggt atcaacgcag agtggatgct cttagggg 38 <210> 56
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-47"
<220>
<223> STRT-FW-47
<400> 56
aagcagtggt atcaacgcag agtggatgct ctgatggg 38 <210> 57
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-48"
<220>
<223> STRT-FW-48
<400> 57
aagcagtggt atcaacgcag agtggatgct ctacaggg 38 <210> 58
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-49"
<220>
<223> STRT-FW-49
<400> 58
aagcagtggt atcaacgcag agtggatgct ctgcgggg 38 <210> 59
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-50"
<220>
<223> STRT-FW-50
<400> 59
aagcagtggt atcaacgcag agtggatgct cttctggg 38 <210> 60
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-51"
<220>
<223> STRT-FW-51
<400> 60
aagcagtggt atcaacgcag agtggatgct cttgaggg 38 <210> 61
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-52"
<220>
<223> STRT-FW-52
<400> 61
aagcagtggt atcaacgcag agtggatgct ctggcggg 38 <210> 62
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-53"
<220>
<223> STRT-FW-53
<400> 62
aagcagtggt atcaacgcag agtggatgct ctcggggg 38 <210> 63
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-54"
<220>
<223> STRT-FW-54
<400> 63
aagcagtggt atcaacgcag agtggatgct ctagtggg 38
<210> 64
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-55"
<220>
<223> STRT-FW-55
<400> 64
aagcagtggt atcaacgcag agtggatgct ctgtaggg 38
<210> 65
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-56"
<220>
<223> STRT-FW-56
<400> 65
aagcagtggt atcaacgcag agtggatgct ctttcggg 38
<210> 66
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-57"
<220>
<223> STRT-FW-57
<400> 66
aagcagtggt atcaacgcag agtggatgct ctatgggg 38
<210> 67
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-58"
<220>
<223> STRT-FW-58
<400> 67
aagcagtggt atcaacgcag agtggatgct ctcttggg 38
<210> 68
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-59"
<220>
<223> STRT-FW-59
<400> 68
aagcagtggt atcaacgcag agtggatgct gacaaggg 38 <210> 69
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-60"
<220>
<223> STRT-FW-60
<400> 69
aagcagtggt atcaacgcag agtggatgct gaaacggg 38 <210> 70
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-61"
<220>
<223> STRT-FW-61
<400> 70
aagcagtggt atcaacgcag agtggatgct gatagggg 38 <210> 71
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-62"
<220>
<223> STRT-FW-62
<400> 71
aagcagtggt atcaacgcag agtggatgct gagatggg 38 <210> 72
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-63"
<220>
<223> STRT-FW-63
<400> 72
aagcagtggt atcaacgcag agtggatgct gaacaggg 38 <210> 73
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-64"
<220>
<223> STRT-FW-64
<400> 73
aagcagtggt atcaacgcag agtggatgct gagcgggg 38 <210> 74
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-65"
<220>
<223> STRT-FW-65
<400> 74
aagcagtggt atcaacgcag agtggatgct gatctggg 38 <210> 75
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-66"
<220>
<223> STRT-FW-66
<400> 75
aagcagtggt atcaacgcag agtggatgct gatgaggg 38 <210> 76
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-67"
<220>
<223> STRT-FW-67
<400> 76
aagcagtggt atcaacgcag agtggatgct gaggcggg 38 <210> 77
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-68"
<220>
<223> STRT-FW-68
<400> 77
aagcagtggt atcaacgcag agtggatgct gacggggg 38 <210> 78
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-69"
<220>
<223> STRT-FW-69
<400> 78
aagcagtggt atcaacgcag agtggatgct gaagtggg 38 <210> 79
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-70"
<220>
<223> STRT-FW-70
<400> 79
aagcagtggt atcaacgcag agtggatgct gagtaggg 38
<210> 80
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-71"
<220>
<223> STRT-FW-71
<400> 80
aagcagtggt atcaacgcag agtggatgct gattcggg 38
<210> 81
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-72"
<220>
<223> STRT-FW-72
<400> 81
aagcagtggt atcaacgcag agtggatgct gaatgggg 38
<210> 82
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-73"
<220>
<223> STRT-FW-73
<400> 82
aagcagtggt atcaacgcag agtggatgct gacttggg 38
<210> 83
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-74"
<220>
<223> STRT-FW-74
<400> 83
aagcagtggt atcaacgcag agtggatgct gcaaaggg 38
<210> 84
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-75"
<220>
<223> STRT-FW-75
<400> 84
aagcagtggt atcaacgcag agtggatgct gccacggg 38 <210> 85
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-76"
<220>
<223> STRT-FW-76
<400> 85
aagcagtggt atcaacgcag agtggatgct gcgagggg 38 <210> 86
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-77"
<220>
<223> STRT-FW-77
<400> 86
aagcagtggt atcaacgcag agtggatgct gctatggg 38 <210> 87
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-78"
<220>
<223> STRT-FW-78
<400> 87
aagcagtggt atcaacgcag agtggatgct gcaccggg 38 <210> 88
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-79"
<220>
<223> STRT-FW-79
<400> 88
aagcagtggt atcaacgcag agtggatgct gctcgggg 38 <210> 89
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-80"
<220>
<223> STRT-FW-80
<400> 89
aagcagtggt atcaacgcag agtggatgct gcgctggg 38 <210> 90
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-81"
<220>
<223> STRT-FW-81
<400> 90
aagcagtggt atcaacgcag agtggatgct gcggaggg 38 <210> 91
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-82"
<220>
<223> STRT-FW-82
<400> 91
aagcagtggt atcaacgcag agtggatgct gctgcggg 38 <210> 92
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-83"
<220>
<223> STRT-FW-83
<400> 92
aagcagtggt atcaacgcag agtggatgct gcaggggg 38 <210> 93
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-84"
<220>
<223> STRT-FW-84
<400> 93
aagcagtggt atcaacgcag agtggatgct gccgtggg 38 <210> 94
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-85"
<220>
<223> STRT-FW-85
<400> 94
aagcagtggt atcaacgcag agtggatgct gcttaggg 38 <210> 95
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-86"
<220>
<223> STRT-FW-86
<400> 95
aagcagtggt atcaacgcag agtggatgct gcgtcggg 38
<210> 96
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-87"
<220>
<223> STRT-FW-87
<400> 96
aagcagtggt atcaacgcag agtggatgct gcctgggg 38
<210> 97
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-88"
<220>
<223> STRT-FW-88
<400> 97
aagcagtggt atcaacgcag agtggatgct gcattggg 38
<210> 98
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-89"
<220>
<223> STRT-FW-89
<400> 98
aagcagtggt atcaacgcag agtggatgct ggtaaggg 38
<210> 99
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-90"
<220>
<223> STRT-FW-90
<400> 99
aagcagtggt atcaacgcag agtggatgct ggcagggg 38
<210> 100
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-91"
<220>
<223> STRT-FW-91
<400> 100
aagcagtggt atcaacgcag agtggatgct ggaatggg 38 <210> 101
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-92"
<220>
<223> STRT-FW-92
<400> 101
aagcagtggt atcaacgcag agtggatgct ggtccggg 38 <210> 102
<211> 38
<212> ADN
<213> Secuencia Artificial
<223> "STRT-FW-93"
<220>
<223> STRT-FW-93
<400> 102
aagcagtggt atcaacgcag agtggatgct ggacgggg 38 <210> 103
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-94"
<220>
<223> STRT-FW-94
<400> 103
aagcagtggt atcaacgcag agtggatgct ggcctggg 38 <210> 104
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-95"
<220>
<223> STRT-FW-95
<400> 104
aagcagtggt atcaacgcag agtggatgct ggcgaggg 38 <210> 105
<211> 38
<212>ADN
<213> Secuencia Artificial
<223> "STRT-FW-96"
<220>
<223> STRT-FW-96
<400> 105
aagcagtggt atcaacgcag agtggatgct ggagcggg 38
<210> 106
<211> 58
<212>ADN
<213> Secuencia Artificial
<223> "hebra adaptadora de ADP1"
<220>
<223> hebra adaptadora de ADP1
<400> 106
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58 <210> 107
<211> 56
<212> ADN
<213> Secuencia Artificial
<223> "hebra adaptadora 2 de ADP1"
<220>
<223> hebra adaptadora 2 de ADP1
<400> 107
ttactatgcc gctggtggct ctagatgtga gaaagggatg tgctgcgaga aggcta 56 <210> 108
<211> 34
<212> ADN
<213> Secuencia Artificial
<223> "hebra adaptadora de ADP2"
<220>
<223> hebra adaptadora de ADP2
<400> 108
caagcagaag acggcatacg agctcttccg atct 34
<210> 109
<211> 33
<212> ADN
<213> Secuencia Artificial
<223> "hebra adaptadora 2 de ADP2"
<220>
<223> hebra adaptadora 2 de ADP2
<400> 109
gttcgtcttc tgccgtatgc tcgagaaggc tag 33
<210> 110
<211> 20
<212> ADN
<213> Secuencia Artificial
<223>"Cebador 1"
<220>
<223> Cebador 1
<400> 110
aatgatacgg cgaccaccga 20
<210> 111
<211> 22
<212>ADN
<213> Secuencia Artificial <223>"Cebador 2"
<220>
<223> Cebador 2
<400> 111
caagcagaag acggcatacg ag 22
Claims (15)
1. Un método para preparar una biblioteca de ADNc a partir de una pluralidad de células individuales, el método comprendiendo las etapas de:
(i) liberar ARNm de cada célula para proporcionar una pluralidad de muestras de ARNm individuales, en donde el ARNm en cada muestra de ARNm individual es de una célula individual;
(ii) sintetizar una primera hebra de ADNc a partir del ARNm en cada muestra de ARNm individual con un cebador de síntesis de ADNc de primera cadena (CDS) que comprende una secuencia de cebador de amplificación en 5' (APS) y una secuencia complementaria de ARN (RCS) que es al menos parcialmente complementaria a uno o más ARNm en una muestra de ARNm individual, e incorporar un marcador distinto o una combinación distinta de marcadores en cada muestra de ADNc individual para proporcionar una pluralidad de muestras de ADNc marcadas, en donde el ADNc en cada muestra de ADNc marcada es complementario al ARNm de una célula individual;
(iii) agrupar las muestras de ADNc marcadas;
(iv) amplificar las muestras de ADNc agrupadas para generar una biblioteca de ADNc que comprende ADNc bicatenario; y
(v) purificar las muestras de ADNc marcadas.
2. El método de acuerdo con la reivindicación 1, en donde en la etapa (ii) el marcador se incorpora al ADNc durante su síntesis.
3. El método de acuerdo con cualquiera de las reivindicaciones 1-2, en donde el RCS es al menos parcialmente complementario a una porción de la primera hebra de ADNc, de manera que sea capaz de dirigir la síntesis de una segunda hebra de ADNc utilizando la primera hebra de ADNc como molde, o
en donde se añade un oligonucleótido de cambio de molde (TSO) a cada muestra de ARNm individual, en donde dicho TSO comprende una porción que es al menos parcialmente complementaria a una porción en el extremo 3' de la primera hebra de ADNc, en donde opcionalmente el CDS o el TSO incluye un marcador, en donde preferentemente el marcador es una secuencia de nucleótidos de 4-20 nucleótidos de longitud, o
en donde opcionalmente tanto el CDS como el TSO incluyen un marcador, en donde preferentemente el CDS y el TSO incluyen cada uno un marcador diferente, de manera que la muestra de ADNc marcada comprenda una combinación de marcadores.
4. El método de acuerdo con cualquiera de las reivindicaciones 1-3, en donde la primera hebra de ADNc incluye una porción en 3' que comprende una pluralidad de citosinas o análogos de citosina que emparejan sus bases con guanosina, donde opcionalmente el TSO incluye una porción en 3' que comprende una pluralidad de guanosinas o análogos de guanosina que emparejan sus bases con citosina, en donde preferentemente las guanosinas son ribonucleósidos o monómeros de ácido nucleico bloqueados.
5. El método de acuerdo con cualquiera de las reivindicaciones 1-4, en donde el CDS comprende un RCS en 3', en donde el RCS comprende opcionalmente oligo(dT), una secuencia específica de la familia de genes, una secuencia aleatoria o una secuencia semialeatoria no autocomplementaria.
6. El método de acuerdo con cualquiera de las reivindicaciones anteriores, en donde el CDS está definido por la secuencia 5'-BIO-AAGCAGTGGTa Tc AACGCAGAGT3üVN-3', en donde BIO es un marcador de biotina y en donde V es A, C o G; y en donde N puede ser cualquier nucleobase.
7. El método de acuerdo con cualquiera de las reivindicaciones 1-6, en donde el TSO incluye un APS en 5', en donde opcionalmente el APS en 5' del t So es al menos un 80% idéntico al APS en 5' del CDS, o donde el APS en 5' del TSO es 100% idéntico al APS en 5' del CDS.
8. El método de acuerdo con cualquiera de las reivindicaciones 3-7, en donde el TSO se define por la secuencia: 5'-AAGCAGTGGTATCAACGCAGAGTGGATGCTXXXXXrGrGrG-3'; en donde X es una nucleobase aleatoria y en donde rG es riboguanina.
9. El método de acuerdo con cualquiera de las reivindicaciones 1-8, en donde las células se lisan para liberar ARNm, y/o en donde el ARNm se purifica después de la etapa (i), y/o en donde la síntesis de ADNc a partir del ARNm se detiene antes de que se agrupen las muestras de ADNc marcadas, y/o en donde las muestras de ADNc marcadas se purifican antes de la amplificación del ADNc.
10. El método de acuerdo con la reivindicación 1, en donde en la etapa (iv) las muestras de ADNc agrupadas se amplifican mediante PCR, en donde, opcionalmente, las muestras de ADNc agrupadas se amplifican mediante PCR en emulsión, en donde preferentemente las muestras de ADNc agrupadas se amplifican mediante PCR de cebador
único, en donde opcionalmente el cebador único comprende biotina.
11. El método de acuerdo con cualquiera de las reivindicaciones 1-10, en donde el método comprende además procesar la biblioteca de ADNc para obtener una biblioteca adecuada para la secuenciación, en donde, opcionalmente, el método comprende fragmentar la biblioteca de ADNc y/o en donde el procesamiento incluye la etapa de añadir un adaptador al ADNc, y/o en donde se amplifica la biblioteca de ADNc.
12. Un método para obtener una biblioteca de ADNc adecuada para la secuenciación, que comprende
a) preparar una biblioteca de ADNc a partir de una pluralidad de células individuales de acuerdo con el método de cualquiera de las reivindicaciones 1 a 10,
b) procesar la biblioteca de ADNc para obtener una biblioteca adecuada para la secuenciación, que comprende (i) fragmentar la biblioteca de ADNc con DNasa;
(ii) capturar los extremos 5' y 3' en perlas;
(iii) tratar los fragmentos para reparar los extremos;
(iv) liberar los fragmentos 5' para obtener una biblioteca del extremo 5' de fragmentos cortos;
(v) añadir un adaptador a los fragmentos, obteniendo así una biblioteca de ADNc adecuada para la secuenciación.
13. Una biblioteca de ADNc producida mediante el método de cualquiera de las reivindicaciones 1 a 12.
14. Un método para analizar la expresión génica en una pluralidad de células individuales, comprendiendo el método las etapas de:
(i) preparar una biblioteca de ADNc de acuerdo con el método de cualquiera de las reivindicaciones 1 a 12; y (ii) secuenciar la biblioteca de ADNc.
15. El método de acuerdo con la reivindicación 14, en donde la secuenciación es por secuenciación de escopeta, en donde, opcionalmente, la biblioteca de ADNc se secuencia para obtener al menos 10.000, al menos 1 millón, al menos 10 millones, al menos 100 millones, o al menos 1 billón de lecturas, en donde una lectura es una longitud de ácido nucleico continuo obtenido mediante una reacción de secuenciación.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16475909P | 2009-03-30 | 2009-03-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2903425T3 true ES2903425T3 (es) | 2022-04-01 |
Family
ID=42936790
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES18201978T Active ES2903425T3 (es) | 2009-03-30 | 2010-03-23 | Análisis de expresión génica en células individuales |
ES15190426T Active ES2706227T3 (es) | 2009-03-30 | 2010-03-23 | Análisis de expresión génica en células individuales |
ES10762102.1T Active ES2555389T3 (es) | 2009-03-30 | 2010-03-23 | Análisis de expresión génica en células individuales |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES15190426T Active ES2706227T3 (es) | 2009-03-30 | 2010-03-23 | Análisis de expresión génica en células individuales |
ES10762102.1T Active ES2555389T3 (es) | 2009-03-30 | 2010-03-23 | Análisis de expresión génica en células individuales |
Country Status (6)
Country | Link |
---|---|
US (1) | US20120010091A1 (es) |
EP (4) | EP3002337B1 (es) |
DK (3) | DK2414548T3 (es) |
ES (3) | ES2903425T3 (es) |
HK (1) | HK1221266A1 (es) |
WO (1) | WO2010117620A2 (es) |
Families Citing this family (203)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005118773A2 (en) | 2004-05-28 | 2005-12-15 | Wafergen, Inc. | Apparatus and methods for multiplex analyses |
ES2903425T3 (es) | 2009-03-30 | 2022-04-01 | Illumina Inc | Análisis de expresión génica en células individuales |
CA2757560C (en) | 2009-04-02 | 2018-11-13 | Fluidigm Corporation | Multi-primer amplification method for barcoding of target nucleic acids |
WO2011021102A2 (en) | 2009-08-20 | 2011-02-24 | Population Genetics Technologies Ltd | Compositions and methods for intramolecular nucleic acid rearrangement |
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
US9315857B2 (en) | 2009-12-15 | 2016-04-19 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse label-tags |
US10787701B2 (en) | 2010-04-05 | 2020-09-29 | Prognosys Biosciences, Inc. | Spatially encoded biological assays |
US9650629B2 (en) * | 2010-07-07 | 2017-05-16 | Roche Molecular Systems, Inc. | Clonal pre-amplification in emulsion |
US9902950B2 (en) * | 2010-10-08 | 2018-02-27 | President And Fellows Of Harvard College | High-throughput single cell barcoding |
ES2687761T3 (es) * | 2011-01-31 | 2018-10-29 | F. Hoffmann-La Roche Ag | Métodos de identificación de múltiples epítopos en células |
WO2012112804A1 (en) | 2011-02-18 | 2012-08-23 | Raindance Technoligies, Inc. | Compositions and methods for molecular labeling |
WO2012129363A2 (en) | 2011-03-24 | 2012-09-27 | President And Fellows Of Harvard College | Single cell nucleic acid detection and analysis |
GB201106254D0 (en) * | 2011-04-13 | 2011-05-25 | Frisen Jonas | Method and product |
CN103748236B (zh) | 2011-04-15 | 2018-12-25 | 约翰·霍普金斯大学 | 安全测序系统 |
PT3415619T (pt) * | 2011-04-28 | 2021-03-22 | Univ Leland Stanford Junior | Identificação de polinucleótidos associados a uma amostra |
SG194745A1 (en) | 2011-05-20 | 2013-12-30 | Fluidigm Corp | Nucleic acid encoding reactions |
EP2739587B1 (en) | 2011-08-01 | 2020-05-27 | Denovo Sciences | Cell capture system |
US10466160B2 (en) | 2011-08-01 | 2019-11-05 | Celsee Diagnostics, Inc. | System and method for retrieving and analyzing particles |
US9404864B2 (en) | 2013-03-13 | 2016-08-02 | Denovo Sciences, Inc. | System for imaging captured cells |
WO2013096839A1 (en) | 2011-12-22 | 2013-06-27 | Somagenics, Inc. | Methods of constructing small rna libraries and their use for expression profiling of target rnas |
US11177020B2 (en) | 2012-02-27 | 2021-11-16 | The University Of North Carolina At Chapel Hill | Methods and uses for molecular tags |
EP3321378B1 (en) * | 2012-02-27 | 2021-11-10 | Becton, Dickinson and Company | Compositions for molecular counting |
EP3495503A1 (en) * | 2012-03-05 | 2019-06-12 | President and Fellows of Harvard College | Systems and methods for epigenetic sequencing |
JP6433893B2 (ja) * | 2012-07-03 | 2018-12-05 | インテグレイテツド・デイー・エヌ・エイ・テクノロジーズ・インコーポレイテツド | Tm増強ブロッキングオリゴヌクレオチド、ならびに標的濃縮の改善およびオフターゲット選択の低減のためのベイト |
US9951386B2 (en) | 2014-06-26 | 2018-04-24 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10752949B2 (en) | 2012-08-14 | 2020-08-25 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US9701998B2 (en) | 2012-12-14 | 2017-07-11 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US11591637B2 (en) | 2012-08-14 | 2023-02-28 | 10X Genomics, Inc. | Compositions and methods for sample processing |
US10323279B2 (en) | 2012-08-14 | 2019-06-18 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10221442B2 (en) | 2012-08-14 | 2019-03-05 | 10X Genomics, Inc. | Compositions and methods for sample processing |
US10400280B2 (en) | 2012-08-14 | 2019-09-03 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10273541B2 (en) | 2012-08-14 | 2019-04-30 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
CN104769127A (zh) | 2012-08-14 | 2015-07-08 | 10X基因组学有限公司 | 微胶囊组合物及方法 |
EP2898096B1 (en) | 2012-09-21 | 2024-02-14 | The Broad Institute, Inc. | Methods for labeling of rnas |
CA2886974C (en) | 2012-10-17 | 2021-06-29 | Spatial Transcriptomics Ab | Methods and product for optimising localised or spatial detection of gene expression in a tissue sample |
EP2912197B1 (en) * | 2012-10-24 | 2019-08-07 | Takara Bio USA, Inc. | Template switch-based methods for producing a product nucleic acid |
US11525163B2 (en) | 2012-10-29 | 2022-12-13 | The Johns Hopkins University | Papanicolaou test for ovarian and endometrial cancers |
AU2013359165B2 (en) | 2012-12-14 | 2019-09-12 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10533221B2 (en) | 2012-12-14 | 2020-01-14 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US9752181B2 (en) | 2013-01-26 | 2017-09-05 | Denovo Sciences, Inc. | System and method for capturing and analyzing cells |
AU2014214682B2 (en) | 2013-02-08 | 2018-07-26 | 10X Genomics, Inc. | Polynucleotide barcode generation |
US9233305B2 (en) * | 2013-02-13 | 2016-01-12 | Unity Technologies Finland Oy | System and method for managing game-playing experiences |
US9707562B2 (en) | 2013-03-13 | 2017-07-18 | Denovo Sciences, Inc. | System for capturing and analyzing cells |
JP6453300B2 (ja) | 2013-03-14 | 2019-01-16 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | 細胞内分析のためのナノピペット装置および方法 |
US10119134B2 (en) | 2013-03-15 | 2018-11-06 | Abvitro Llc | Single cell bar-coding for antibody discovery |
US9255265B2 (en) | 2013-03-15 | 2016-02-09 | Illumina, Inc. | Methods for producing stranded cDNA libraries |
US9856535B2 (en) | 2013-05-31 | 2018-01-02 | Denovo Sciences, Inc. | System for isolating cells |
US10391490B2 (en) | 2013-05-31 | 2019-08-27 | Celsee Diagnostics, Inc. | System and method for isolating and analyzing cells |
WO2014201273A1 (en) * | 2013-06-12 | 2014-12-18 | The Broad Institute, Inc. | High-throughput rna-seq |
CN111500680B (zh) | 2013-06-25 | 2024-04-16 | 普罗格诺西斯生物科学公司 | 检测样品中生物靶标的空间分布的方法和系统 |
EP3036336B1 (en) * | 2013-08-23 | 2020-09-30 | Ludwig Institute For Cancer Research Ltd. | Methods and compositions for cdna synthesis and single-cell transcriptome profiling using template switching reaction |
DK3039158T3 (en) | 2013-08-28 | 2019-03-04 | Becton Dickinson Co | MASSIVE PARALLEL SINGLE CELL CELL ANALYSIS |
US10395758B2 (en) | 2013-08-30 | 2019-08-27 | 10X Genomics, Inc. | Sequencing methods |
US9582877B2 (en) | 2013-10-07 | 2017-02-28 | Cellular Research, Inc. | Methods and systems for digitally counting features on arrays |
JP6602294B2 (ja) * | 2013-10-17 | 2019-11-06 | タカラ バイオ ユーエスエー, インコーポレイテッド | アダプタを核酸に追加する方法、及びこの方法を実行するための組成物 |
EP3058100A4 (en) | 2013-10-18 | 2017-04-19 | California Institute of Technology | Enhanced nucleic acid identification and detection |
US9824068B2 (en) | 2013-12-16 | 2017-11-21 | 10X Genomics, Inc. | Methods and apparatus for sorting data |
WO2015094861A1 (en) | 2013-12-17 | 2015-06-25 | Clontech Laboratories, Inc. | Methods for adding adapters to nucleic acids and compositions for practicing the same |
WO2015157567A1 (en) | 2014-04-10 | 2015-10-15 | 10X Genomics, Inc. | Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same |
US20150298091A1 (en) | 2014-04-21 | 2015-10-22 | President And Fellows Of Harvard College | Systems and methods for barcoding nucleic acids |
SG10201912516SA (en) * | 2014-04-29 | 2020-02-27 | Illumina Inc | Multiplexed single cell gene expression analysis using template switch and tagmentation |
US10975371B2 (en) * | 2014-04-29 | 2021-04-13 | Illumina, Inc. | Nucleic acid sequence analysis from single cells |
US9757707B2 (en) | 2014-06-12 | 2017-09-12 | Takara Bio Usa, Inc. | Single cell capture with capture chips |
JP2017518752A (ja) | 2014-06-12 | 2017-07-13 | ウエハージェン インコーポレイテッド | 捕捉用重合体膜を用いた単細胞捕捉 |
JP6838969B2 (ja) | 2014-06-26 | 2021-03-03 | 10エックス ジェノミクス, インコーポレイテッド | 個々の細胞または細胞集団由来の核酸の分析方法 |
WO2015200869A1 (en) | 2014-06-26 | 2015-12-30 | 10X Genomics, Inc. | Analysis of nucleic acid sequences |
AU2015318011B2 (en) * | 2014-09-15 | 2020-07-23 | Abvitro Llc | High-throughput nucleotide library sequencing |
US20160122817A1 (en) | 2014-10-29 | 2016-05-05 | 10X Genomics, Inc. | Methods and compositions for targeted nucleic acid sequencing |
CA2966575A1 (en) | 2014-11-05 | 2016-06-02 | California Institute Of Technology | Microfluidic measurements of the response of an organism to a drug |
US9975122B2 (en) | 2014-11-05 | 2018-05-22 | 10X Genomics, Inc. | Instrument systems for integrated sample processing |
US10584366B2 (en) | 2014-12-03 | 2020-03-10 | IsoPlexis Corporation | Analysis and screening of cell secretion profiles |
CA2972969A1 (en) | 2015-01-12 | 2016-07-21 | 10X Genomics, Inc. | Processes and systems for preparing nucleic acid sequencing libraries and libraries prepared using same |
EP3766988B1 (en) | 2015-02-19 | 2024-02-14 | Becton, Dickinson and Company | High-throughput single-cell analysis combining proteomic and genomic information |
CN107407685B (zh) | 2015-02-20 | 2021-08-03 | 宝生物工程(美国)有限公司 | 快速精确分配、可视化和分析单个细胞的方法 |
MX2017010857A (es) | 2015-02-24 | 2017-12-11 | 10X Genomics Inc | Metodos para la cobertura de secuencia de acidos nucleicos seleccionados como diana. |
WO2016137973A1 (en) | 2015-02-24 | 2016-09-01 | 10X Genomics Inc | Partition processing methods and systems |
JP2018509896A (ja) * | 2015-02-27 | 2018-04-12 | フリューダイム・コーポレイション | 高処理能力研究用の単一細胞核酸 |
EP3262192B1 (en) | 2015-02-27 | 2020-09-16 | Becton, Dickinson and Company | Spatially addressable molecular barcoding |
EP3277843A2 (en) | 2015-03-30 | 2018-02-07 | Cellular Research, Inc. | Methods and compositions for combinatorial barcoding |
AU2016248995B2 (en) | 2015-04-17 | 2022-04-28 | President And Fellows Of Harvard College | Barcoding systems and methods for gene sequencing and other applications |
EP3286326B1 (en) | 2015-04-23 | 2025-01-22 | Becton, Dickinson and Company | Method for whole transcriptome amplification |
US11124823B2 (en) | 2015-06-01 | 2021-09-21 | Becton, Dickinson And Company | Methods for RNA quantification |
WO2017027653A1 (en) | 2015-08-11 | 2017-02-16 | The Johns Hopkins University | Assaying ovarian cyst fluid |
US11248262B2 (en) | 2015-08-24 | 2022-02-15 | Qiagen Gmbh | Method for generating a RNA-sequencing library |
EP3341494B1 (en) | 2015-08-28 | 2024-08-07 | Illumina, Inc. | Nucleic acid sequence analysis from single cells |
ES2745694T3 (es) | 2015-09-11 | 2020-03-03 | Cellular Res Inc | Métodos y composiciones para normalización de biblioteca de ácido nucleico |
KR20180097536A (ko) | 2015-11-04 | 2018-08-31 | 아트레카, 인크. | 단일 세포와 연관된 핵산의 분석을 위한 핵산 바코드의 조합 세트 |
US11371094B2 (en) | 2015-11-19 | 2022-06-28 | 10X Genomics, Inc. | Systems and methods for nucleic acid processing using degenerate nucleotides |
CN115369161A (zh) | 2015-12-04 | 2022-11-22 | 10X 基因组学有限公司 | 用于核酸分析的方法和组合物 |
CN108603224B (zh) | 2015-12-16 | 2022-06-28 | 富鲁达公司 | 高水平多路复用扩增 |
WO2017112666A1 (en) | 2015-12-21 | 2017-06-29 | Somagenics, Inc. | Methods of library construction for polynucleotide sequencing |
WO2017138984A1 (en) | 2016-02-11 | 2017-08-17 | 10X Genomics, Inc. | Systems, methods, and media for de novo assembly of whole genome sequence data |
US10633648B2 (en) | 2016-02-12 | 2020-04-28 | University Of Washington | Combinatorial photo-controlled spatial sequencing and labeling |
JP7129343B2 (ja) | 2016-05-02 | 2022-09-01 | ベクトン・ディキンソン・アンド・カンパニー | 正確な分子バーコーディング |
WO2017197338A1 (en) | 2016-05-13 | 2017-11-16 | 10X Genomics, Inc. | Microfluidic systems and methods of use |
US10301677B2 (en) | 2016-05-25 | 2019-05-28 | Cellular Research, Inc. | Normalization of nucleic acid libraries |
EP3465502B1 (en) | 2016-05-26 | 2024-04-10 | Becton, Dickinson and Company | Molecular label counting adjustment methods |
US10202641B2 (en) | 2016-05-31 | 2019-02-12 | Cellular Research, Inc. | Error correction in amplification of samples |
US10640763B2 (en) | 2016-05-31 | 2020-05-05 | Cellular Research, Inc. | Molecular indexing of internal sequences |
WO2018017892A1 (en) | 2016-07-21 | 2018-01-25 | Takara Bio Usa, Inc. | Multi-z imaging and dispensing with multi-well devices |
US20200166518A1 (en) | 2016-09-12 | 2020-05-28 | IsoPlexis Corporation | System and methods for multiplexed analysis of cellular and other immunotherapeutics |
US11168347B2 (en) | 2016-09-23 | 2021-11-09 | California Institute Of Technology | Digital quantification of DNA replication and/or chromosome segregation based determination of antimicrobial susceptibility |
JP7091348B2 (ja) | 2016-09-26 | 2022-06-27 | ベクトン・ディキンソン・アンド・カンパニー | バーコード付きオリゴヌクレオチド配列を有する試薬を用いたタンパク質発現の測定 |
US11854666B2 (en) * | 2016-09-29 | 2023-12-26 | Myriad Women's Health, Inc. | Noninvasive prenatal screening using dynamic iterative depth optimization |
AU2017359047C1 (en) | 2016-11-08 | 2024-10-24 | Becton, Dickinson And Company | Methods for cell label classification |
US11164659B2 (en) | 2016-11-08 | 2021-11-02 | Becton, Dickinson And Company | Methods for expression profile classification |
EP3538891B1 (en) | 2016-11-11 | 2022-01-05 | Isoplexis Corporation | Compositions and methods for the simultaneous genomic, transcriptomic and proteomic analysis of single cells |
CN110226084A (zh) | 2016-11-22 | 2019-09-10 | 伊索普莱克西斯公司 | 用于细胞捕获的系统、装置和方法,以及其制造方法 |
US20180163201A1 (en) * | 2016-12-12 | 2018-06-14 | Grail, Inc. | Methods for tagging and amplifying rna template molecules for preparing sequencing libraries |
US10815525B2 (en) | 2016-12-22 | 2020-10-27 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10011872B1 (en) | 2016-12-22 | 2018-07-03 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10550429B2 (en) | 2016-12-22 | 2020-02-04 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
JP7104048B2 (ja) | 2017-01-13 | 2022-07-20 | セルラー リサーチ, インコーポレイテッド | 流体チャネルの親水性コーティング |
CN110214186B (zh) | 2017-01-30 | 2023-11-24 | 10X基因组学有限公司 | 用于基于微滴的单细胞条形编码的方法和系统 |
US12264411B2 (en) | 2017-01-30 | 2025-04-01 | 10X Genomics, Inc. | Methods and systems for analysis |
EP3577232A1 (en) | 2017-02-01 | 2019-12-11 | Cellular Research, Inc. | Selective amplification using blocking oligonucleotides |
US10995333B2 (en) | 2017-02-06 | 2021-05-04 | 10X Genomics, Inc. | Systems and methods for nucleic acid preparation |
CN107083423B (zh) * | 2017-03-27 | 2022-01-28 | 北京极客基因科技有限公司 | 一种药物靶点预测和药物全方面评价方法 |
WO2018204423A1 (en) | 2017-05-01 | 2018-11-08 | Illumina, Inc. | Optimal index sequences for multiplex massively parallel sequencing |
SG11201910070PA (en) * | 2017-05-08 | 2019-11-28 | Illumina Inc | Universal short adapters for indexing of polynucleotide samples |
CN116064732A (zh) | 2017-05-26 | 2023-05-05 | 10X基因组学有限公司 | 转座酶可接近性染色质的单细胞分析 |
MA49352A (fr) | 2017-05-26 | 2020-04-08 | Abvitro Llc | Séquençage de bibliothèque de polynucléotides à haut rendement et analyse de transcriptome |
US20180340169A1 (en) | 2017-05-26 | 2018-11-29 | 10X Genomics, Inc. | Single cell analysis of transposase accessible chromatin |
CA3059559A1 (en) | 2017-06-05 | 2018-12-13 | Becton, Dickinson And Company | Sample indexing for single cells |
US10636512B2 (en) | 2017-07-14 | 2020-04-28 | Cofactor Genomics, Inc. | Immuno-oncology applications using next generation sequencing |
IL319255A (en) | 2017-08-07 | 2025-04-01 | Univ Johns Hopkins | Methods and materials for cancer assessment and treatment |
EP3651903A4 (en) | 2017-08-29 | 2021-06-16 | Bio-Rad Laboratories, Inc. | SYSTEM AND METHOD FOR ISOLATING AND ANALYZING CELLS |
US10837047B2 (en) | 2017-10-04 | 2020-11-17 | 10X Genomics, Inc. | Compositions, methods, and systems for bead formation using improved polymers |
EP3695009A4 (en) | 2017-10-11 | 2021-08-11 | California Institute of Technology | Antibiotic susceptibility of microorganisms and related compositions, methods and systems |
WO2019084043A1 (en) | 2017-10-26 | 2019-05-02 | 10X Genomics, Inc. | METHODS AND SYSTEMS FOR NUCLEIC ACID PREPARATION AND CHROMATIN ANALYSIS |
CN111479631B (zh) | 2017-10-27 | 2022-02-22 | 10X基因组学有限公司 | 用于样品制备和分析的方法和系统 |
WO2019099751A1 (en) | 2017-11-15 | 2019-05-23 | 10X Genomics, Inc. | Functionalized gel beads |
US10829815B2 (en) | 2017-11-17 | 2020-11-10 | 10X Genomics, Inc. | Methods and systems for associating physical and genetic properties of biological particles |
WO2019108851A1 (en) | 2017-11-30 | 2019-06-06 | 10X Genomics, Inc. | Systems and methods for nucleic acid preparation and analysis |
CN108048915A (zh) * | 2017-12-01 | 2018-05-18 | 北京科迅生物技术有限公司 | 用于ctDNA文库构建的接头混合物、包括其的试剂盒及应用 |
CA3084439A1 (en) | 2017-12-07 | 2019-06-13 | Massachusetts Institute Of Technology | Single cell analyses |
WO2019126209A1 (en) | 2017-12-19 | 2019-06-27 | Cellular Research, Inc. | Particles associated with oligonucleotides |
CN118547046A (zh) | 2017-12-22 | 2024-08-27 | 10X基因组学有限公司 | 用于处理来自一个或多个细胞的核酸分子的系统和方法 |
WO2019136058A1 (en) | 2018-01-02 | 2019-07-11 | The Regents Of The University Of Michigan | Multi-droplet capture |
WO2019157529A1 (en) | 2018-02-12 | 2019-08-15 | 10X Genomics, Inc. | Methods characterizing multiple analytes from individual cells or cell populations |
US11639928B2 (en) | 2018-02-22 | 2023-05-02 | 10X Genomics, Inc. | Methods and systems for characterizing analytes from individual cells or cell populations |
WO2019169028A1 (en) | 2018-02-28 | 2019-09-06 | 10X Genomics, Inc. | Transcriptome sequencing through random ligation |
WO2019195166A1 (en) | 2018-04-06 | 2019-10-10 | 10X Genomics, Inc. | Systems and methods for quality control in single cell processing |
EP4234717A3 (en) | 2018-05-03 | 2023-11-01 | Becton, Dickinson and Company | High throughput multiomics sample analysis |
EP4545647A2 (en) | 2018-05-03 | 2025-04-30 | Becton, Dickinson and Company | Molecular barcoding on opposite transcript ends |
WO2019217758A1 (en) | 2018-05-10 | 2019-11-14 | 10X Genomics, Inc. | Methods and systems for molecular library generation |
US11932899B2 (en) | 2018-06-07 | 2024-03-19 | 10X Genomics, Inc. | Methods and systems for characterizing nucleic acid molecules |
US11703427B2 (en) | 2018-06-25 | 2023-07-18 | 10X Genomics, Inc. | Methods and systems for cell and bead processing |
US12188014B1 (en) | 2018-07-25 | 2025-01-07 | 10X Genomics, Inc. | Compositions and methods for nucleic acid processing using blocking agents |
US20200032335A1 (en) | 2018-07-27 | 2020-01-30 | 10X Genomics, Inc. | Systems and methods for metabolome analysis |
CN112703252B (zh) | 2018-08-03 | 2024-09-10 | 10X基因组学有限公司 | 用于最小化条形码交换的方法和系统 |
WO2020041148A1 (en) | 2018-08-20 | 2020-02-27 | 10X Genomics, Inc. | Methods and systems for detection of protein-dna interactions using proximity ligation |
US12065688B2 (en) | 2018-08-20 | 2024-08-20 | 10X Genomics, Inc. | Compositions and methods for cellular processing |
CN112805389B (zh) | 2018-10-01 | 2024-08-06 | 贝克顿迪金森公司 | 确定5’转录物序列 |
JP7618548B2 (ja) * | 2018-11-08 | 2025-01-21 | ベクトン・ディキンソン・アンド・カンパニー | ランダムプライミングを使用した単一細胞の全トランスクリプトーム解析 |
US11459607B1 (en) | 2018-12-10 | 2022-10-04 | 10X Genomics, Inc. | Systems and methods for processing-nucleic acid molecules from a single cell using sequential co-partitioning and composite barcodes |
EP3894552A1 (en) | 2018-12-13 | 2021-10-20 | Becton, Dickinson and Company | Selective extension in single cell whole transcriptome analysis |
WO2020142768A1 (en) | 2019-01-04 | 2020-07-09 | Northwestern University | Storing temporal data into dna |
US12169198B2 (en) | 2019-01-08 | 2024-12-17 | 10X Genomics, Inc. | Systems and methods for sample analysis |
US11845983B1 (en) | 2019-01-09 | 2023-12-19 | 10X Genomics, Inc. | Methods and systems for multiplexing of droplet based assays |
US11371076B2 (en) | 2019-01-16 | 2022-06-28 | Becton, Dickinson And Company | Polymerase chain reaction normalization through primer titration |
US11661631B2 (en) | 2019-01-23 | 2023-05-30 | Becton, Dickinson And Company | Oligonucleotides associated with antibodies |
US12275993B2 (en) | 2019-02-12 | 2025-04-15 | 10X Genomics, Inc. | Analysis of nucleic acid sequences |
US11467153B2 (en) | 2019-02-12 | 2022-10-11 | 10X Genomics, Inc. | Methods for processing nucleic acid molecules |
US11851683B1 (en) | 2019-02-12 | 2023-12-26 | 10X Genomics, Inc. | Methods and systems for selective analysis of cellular samples |
US11584953B2 (en) | 2019-02-12 | 2023-02-21 | 10X Genomics, Inc. | Methods for processing nucleic acid molecules |
CN113454234B (zh) | 2019-02-14 | 2025-03-18 | 贝克顿迪金森公司 | 杂合体靶向和全转录物组扩增 |
US11655499B1 (en) | 2019-02-25 | 2023-05-23 | 10X Genomics, Inc. | Detection of sequence elements in nucleic acid molecules |
US11920183B2 (en) | 2019-03-11 | 2024-03-05 | 10X Genomics, Inc. | Systems and methods for processing optically tagged beads |
US10633693B1 (en) | 2019-04-16 | 2020-04-28 | Celsee Diagnostics, Inc. | System and method for leakage control in a particle capture system |
US11965208B2 (en) | 2019-04-19 | 2024-04-23 | Becton, Dickinson And Company | Methods of associating phenotypical data and single cell sequencing data |
US10900032B2 (en) | 2019-05-07 | 2021-01-26 | Bio-Rad Laboratories, Inc. | System and method for automated single cell processing |
US11273439B2 (en) | 2019-05-07 | 2022-03-15 | Bio-Rad Laboratories, Inc. | System and method for target material retrieval from microwells |
KR20220033484A (ko) | 2019-06-14 | 2022-03-16 | 바이오 래드 래버러토리스 인코오포레이티드 | 자동화된 단일 세포 처리 및 분석을 위한 시스템 및 방법 |
CN114051534B (zh) | 2019-07-22 | 2025-02-21 | 贝克顿迪金森公司 | 单细胞染色质免疫沉淀测序测定 |
US12235262B1 (en) | 2019-09-09 | 2025-02-25 | 10X Genomics, Inc. | Methods and systems for single cell protein analysis |
US11773436B2 (en) | 2019-11-08 | 2023-10-03 | Becton, Dickinson And Company | Using random priming to obtain full-length V(D)J information for immune repertoire sequencing |
CN115038794A (zh) | 2019-12-23 | 2022-09-09 | 10X基因组学有限公司 | 在基于分区的测定中使用固定生物样品的组合物和方法 |
US11104961B2 (en) | 2020-01-13 | 2021-08-31 | Fluent Biosciences Inc. | Single cell sequencing |
CN115244184A (zh) | 2020-01-13 | 2022-10-25 | 贝克顿迪金森公司 | 用于定量蛋白和rna的方法和组合物 |
CA3167729A1 (en) | 2020-01-13 | 2021-07-22 | Fluent Biosciences Inc. | Emulsion based drug screening |
WO2021146166A1 (en) * | 2020-01-13 | 2021-07-22 | Fluent Biosciences Inc. | Methods and systems for single cell gene profiling |
EP4471155A3 (en) | 2020-01-29 | 2024-12-18 | Becton, Dickinson and Company | Barcoded wells for spatial mapping of single cells through sequencing |
CN115427584A (zh) * | 2020-01-31 | 2022-12-02 | 贝克顿迪金森公司 | 嗜中温dna聚合酶延伸阻断物 |
CN115151810A (zh) | 2020-02-25 | 2022-10-04 | 贝克顿迪金森公司 | 实现使用单细胞样品作为单色补偿对照的双特异性探针 |
US11926863B1 (en) | 2020-02-27 | 2024-03-12 | 10X Genomics, Inc. | Solid state single cell method for analyzing fixed biological cells |
US11504719B2 (en) | 2020-03-12 | 2022-11-22 | Bio-Rad Laboratories, Inc. | System and method for receiving and delivering a fluid for sample processing |
CA3175931A1 (en) | 2020-03-16 | 2021-09-23 | Fluent Biosciences Inc. | Multi-omic analysis in monodisperse droplets |
US11851700B1 (en) | 2020-05-13 | 2023-12-26 | 10X Genomics, Inc. | Methods, kits, and compositions for processing extracellular molecules |
EP4150118A1 (en) | 2020-05-14 | 2023-03-22 | Becton Dickinson and Company | Primers for immune repertoire profiling |
EP4153775B1 (en) | 2020-05-22 | 2024-07-24 | 10X Genomics, Inc. | Simultaneous spatio-temporal measurement of gene expression and cellular activity |
EP4157300A4 (en) * | 2020-05-29 | 2024-07-17 | BioHSV Holdings, Inc. | MASS NUCLEIC ACID TEST |
EP4158055B1 (en) | 2020-06-02 | 2024-03-27 | Becton, Dickinson and Company | Oligonucleotides and beads for 5 prime gene expression assay |
US12265079B1 (en) | 2020-06-02 | 2025-04-01 | 10X Genomics, Inc. | Systems and methods for detecting analytes from captured single biological particles |
US11932901B2 (en) | 2020-07-13 | 2024-03-19 | Becton, Dickinson And Company | Target enrichment using nucleic acid probes for scRNAseq |
EP4182477A4 (en) | 2020-07-15 | 2024-09-11 | Fluent Biosciences Inc. | MULTI-LEVEL LIGATION OLIGOS |
BR112023002051A2 (pt) | 2020-08-06 | 2023-04-18 | Illumina Inc | Preparação de bibliotecas de sequenciamento de rna e dna usando transpossomos ligados a microesferas |
WO2022069039A1 (en) * | 2020-09-30 | 2022-04-07 | Ecole Polytechnique Federale De Lausanne (Epfl) | METHOD OF PREPARATION OF cDNA LIBRARY USEFUL FOR EFFICIENT mRNA SEQUENCING AND USES THEREOF |
US12084715B1 (en) | 2020-11-05 | 2024-09-10 | 10X Genomics, Inc. | Methods and systems for reducing artifactual antisense products |
CN116635533A (zh) | 2020-11-20 | 2023-08-22 | 贝克顿迪金森公司 | 高表达的蛋白和低表达的蛋白的谱分析 |
EP4298244A1 (en) | 2021-02-23 | 2024-01-03 | 10X Genomics, Inc. | Probe-based analysis of nucleic acids and proteins |
EP4196605B1 (en) | 2021-09-01 | 2024-12-04 | 10X Genomics, Inc. | Methods for blocking a capture probe on a spatial array |
EP4435114A1 (en) | 2023-03-24 | 2024-09-25 | Miltenyi Biotec B.V. & Co. KG | Syntheis of highly multiplexed oligo-barcoded fluorescent beads for single cell seq applications |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
US5681702A (en) | 1994-08-30 | 1997-10-28 | Chiron Corporation | Reduction of nonspecific hybridization by using novel base-pairing schemes |
US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
US5962271A (en) | 1996-01-03 | 1999-10-05 | Cloutech Laboratories, Inc. | Methods and compositions for generating full-length cDNA having arbitrary nucleotide sequence at the 3'-end |
US6265163B1 (en) | 1998-01-09 | 2001-07-24 | Lynx Therapeutics, Inc. | Solid phase selection of differentially expressed genes |
US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
US6480791B1 (en) * | 1998-10-28 | 2002-11-12 | Michael P. Strathmann | Parallel methods for genomic analysis |
US6197554B1 (en) | 1998-11-20 | 2001-03-06 | Shi-Lung Lin | Method for generating full-length cDNA library from single cells |
JP2004504059A (ja) * | 2000-07-21 | 2004-02-12 | グローバル ジェノミクス アクティエボラーグ | 転写された遺伝子を分析、及び同定するための方法、及びフインガープリント法 |
US6706476B1 (en) | 2000-08-22 | 2004-03-16 | Azign Bioscience A/S | Process for amplifying and labeling single stranded cDNA by 5′ ligated adaptor mediated amplification |
US20030077611A1 (en) | 2001-10-24 | 2003-04-24 | Sention | Methods and systems for dynamic gene expression profiling |
JP5695287B2 (ja) | 2002-10-02 | 2015-04-01 | カリフォルニア インスティテュート オブ テクノロジー | 微小流体の核酸解析 |
GB0319332D0 (en) * | 2003-08-16 | 2003-09-17 | Astrazeneca Ab | Amplification |
JP5171037B2 (ja) | 2003-09-10 | 2013-03-27 | アルセア・ディーエックス,インク. | マイクロアレイを用いた発現プロファイリング |
WO2006015326A2 (en) | 2004-07-30 | 2006-02-09 | Agencourt Bioscience Corporation | Methods of isolating nucleic acids using multifunctional group-coated solid phase carriers |
US7393665B2 (en) | 2005-02-10 | 2008-07-01 | Population Genetics Technologies Ltd | Methods and compositions for tagging and identifying polynucleotides |
CA2620081A1 (en) | 2005-09-16 | 2007-03-29 | 454 Life Sciences Corporation | Cdna library preparation |
JP5073967B2 (ja) | 2006-05-30 | 2012-11-14 | 株式会社日立製作所 | 単一細胞の遺伝子発現定量方法 |
WO2007147079A2 (en) * | 2006-06-14 | 2007-12-21 | Living Microsystems, Inc. | Rare cell analysis using sample splitting and dna tags |
US20080108804A1 (en) | 2006-11-02 | 2008-05-08 | Kabushiki Kaisha Dnaform | Method for modifying RNAS and preparing DNAS from RNAS |
EP2164985A4 (en) | 2007-06-01 | 2014-05-14 | 454 Life Sciences Corp | SYSTEM AND METHOD FOR IDENTIFYING INDIVIDUAL SAMPLES FROM A MULTIPLEX MIXTURE |
US8039214B2 (en) | 2007-06-29 | 2011-10-18 | Cellscript, Inc. | Synthesis of tagged nucleic acids |
US20100035249A1 (en) | 2008-08-05 | 2010-02-11 | Kabushiki Kaisha Dnaform | Rna sequencing and analysis using solid support |
ES2903425T3 (es) | 2009-03-30 | 2022-04-01 | Illumina Inc | Análisis de expresión génica en células individuales |
-
2010
- 2010-03-23 ES ES18201978T patent/ES2903425T3/es active Active
- 2010-03-23 DK DK10762102.1T patent/DK2414548T3/en active
- 2010-03-23 EP EP15190426.5A patent/EP3002337B1/en not_active Revoked
- 2010-03-23 EP EP18201978.6A patent/EP3495498B1/en active Active
- 2010-03-23 DK DK15190426.5T patent/DK3002337T3/en active
- 2010-03-23 DK DK18201978.6T patent/DK3495498T3/da active
- 2010-03-23 ES ES15190426T patent/ES2706227T3/es active Active
- 2010-03-23 WO PCT/US2010/028361 patent/WO2010117620A2/en active Application Filing
- 2010-03-23 EP EP21204801.1A patent/EP3998346A1/en active Pending
- 2010-03-23 ES ES10762102.1T patent/ES2555389T3/es active Active
- 2010-03-23 US US13/255,433 patent/US20120010091A1/en not_active Abandoned
- 2010-03-23 EP EP10762102.1A patent/EP2414548B1/en not_active Revoked
-
2016
- 2016-08-09 HK HK16109461.3A patent/HK1221266A1/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
US20120010091A1 (en) | 2012-01-12 |
EP3495498B1 (en) | 2021-10-27 |
EP3998346A1 (en) | 2022-05-18 |
ES2706227T3 (es) | 2019-03-27 |
DK2414548T3 (en) | 2015-12-21 |
WO2010117620A3 (en) | 2011-02-17 |
EP2414548A2 (en) | 2012-02-08 |
EP2414548A4 (en) | 2012-10-10 |
DK3495498T3 (da) | 2022-01-17 |
EP3002337A1 (en) | 2016-04-06 |
EP2414548B1 (en) | 2015-10-21 |
WO2010117620A2 (en) | 2010-10-14 |
EP3002337B1 (en) | 2018-10-24 |
ES2555389T3 (es) | 2015-12-30 |
DK3002337T3 (en) | 2019-02-18 |
HK1221266A1 (zh) | 2017-05-26 |
EP3495498A1 (en) | 2019-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2903425T3 (es) | Análisis de expresión génica en células individuales | |
US20210388435A1 (en) | Compositions and methods for accurately identifying mutations | |
CA3067435C (en) | High-throughput single-cell sequencing with reduced amplification bias | |
CN116391046A (zh) | 通过寡杂交和基于pcr扩增进行核酸检测的方法 | |
WO2024033411A1 (en) | Methods for determining the location of a target sequence and uses |