ES2887593T3

ES2887593T3 - Bibliotecas de polipéptidos modulares y métodos para elaborarlas y usarlas

Info

Publication number: ES2887593T3
Application number: ES16842929T
Authority: ES
Inventors: Wendell A Lim; Scott M Coyle; Russell M Gordley; Kole T Roybal
Original assignee: University of California Berkeley; University of California San Diego UCSD
Current assignee: University of California Berkeley; University of California San Diego UCSD
Priority date: 2015-09-01
Filing date: 2016-08-31
Publication date: 2021-12-23
Anticipated expiration: 2036-08-31
Also published as: EP3344803B1; AU2016315941A1; IL257453B; KR20240056636A; JP7397821B2; US20200224191A1; CN114657173A; AU2016315941B2; SG10201913915WA; MX2022007861A; CA2995389C; JP2018525992A; JP6878408B2; MX2018002596A; WO2017040694A2; CN108138362B; US11560561B2; EP3344803A4; EP3954772B1; EP3954772C0

Abstract

Un método para identificar un fenotipo seleccionado asociado a un polipéptido modular sintético en una célula ex vivo/in vivo, comprendiendo el método: a) introducir una biblioteca con código de barras de ácidos nucleicos en las células huésped, generando así una población heterogénea de células huésped modificadas genéticamente, donde la biblioteca con código de barras de ácidos nucleicos comprende múltiples miembros, cada uno de los múltiples miembros comprende una secuencia de nucleótidos que codifica un polipéptido modular sintético diferente, comprendiendo la secuencia de nucleótidos: una región de codificación que comprende dos o más secuencias de codificación que codifican dos o más módulos variables, en donde las dos o más secuencias de codificación están en marco entre sí; y una región de código de barras que comprende dos o más códigos de barras únicos, en donde cada módulo variable en la región de codificación está correlacionado con un código de barras único específico en la región del código de barras; b) identificar una célula huésped modificada genéticamente dentro de la población heterogénea que muestra el fenotipo seleccionado en respuesta a un estímulo; y c) a partir de la célula huésped identificada de (b), identificar y/o cuantificar la región del código de barras mediante secuenciación, identificando así el polipéptido modular sintético y/o módulo del mismo que produce el fenotipo seleccionado.

Description

DESCRIPCIÓN

Bibliotecas de polipéptidos modulares y métodos para elaborarlas y usarlas

INTRODUCCIÓN

Muchas proteínas eucariotas funcionan a través de dominios o motivos modulares que controlan o facilitan las funciones de entrada y salida de la proteína en su totalidad. La reorganización y recombinación de los dominios modulares de proteínas eucariotas ya han comenzado a proporcionar nuevas proteínas con relaciones de entrada/salida alteradas y funciones generales completamente nuevas. La modificación genética exitosa de las proteínas modulares individuales mediante la recombinación simple de dominios de entrada y salida ha servido como prueba de concepto de este enfoque modular para el desarrollo de nuevas proteínas.

La construcción de nuevas proteínas sintéticas, por ejemplo, para usar en células terapéuticas, se ha realizado hasta el momento sobre la base de una construcción en construcción. Asimismo, la transfección y cribado de dichas proteínas sintéticas se ha realizado también en un enfoque de poco rendimiento, usando construcciones individuales analizadas una a la vez o, en algunos casos, una pequeña cantidad de construcciones individuales analizadas en paralelo. El cribado paralelo, si bien es más eficiente que cribar construcciones individuales de a una, tiene escalabilidad limitada debido al requisito de que las construcciones individuales deben permanecer separadas físicamente para facilitar la identificación de etapa final de construcciones que realizan pozos. El cribado individual de grandes cantidades de nuevas proteínas es oneroso cuando se realiza en un ensayo in vitro, pero se vuelve incluso más oneroso y costoso de forma prohibitiva cuando se lo somete a prueba en ensayos realizados en modelos in vivo. Dicha producción individual y cribado separado limita en gran medida la velocidad de desarrollo de nuevas proteínas sintéticas. DUONG ET AL, PLOS ONE, vo. 8, n.° 5, 7 de mayo de 2013, págs.. 1-10 se refiere al diseño genético de la función de linfocitos T usando receptores de antígeno quimérico identificados usando una estrategia de biblioteca de ADN.

Sumario

La presente invención se define mediante las reivindicaciones adjuntas. La presente descripción proporciona bibliotecas de polipéptidos modulares sintéticos y ácidos nucleicos que codifican dichas bibliotecas de polipéptidos modulares sintéticos. Además, se proporcionan métodos para realizar bibliotecas de polipéptidos modulares sintéticos y ácidos nucleicos que codifican dichas bibliotecas de polipéptidos modulares sintéticos. Se proporcionan también métodos para cribar una biblioteca de polipéptidos modulares sintéticos para identificar un fenotipo seleccionado que se asocia con un miembro de una biblioteca de polipéptidos modulares sintéticos donde los métodos se utilizan tanto en ensayos in vivo como in vitro.

Se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, tal método comprende: a) introducir una biblioteca con código de barra de ácidos nucleicos en las células huésped, por lo cual se genera de ese modo una población heterogénea de células huésped modificadas genéticamente, donde la bibliotecas con código de barra de ácidos nucleicos comprende múltiples miembros, cada uno de los múltiples miembros comprende una secuencia de nucleótidos que codifica un polipéptido modular sintético diferente; y b) identificar una célula huésped genéticamente modificada dentro de la población heterogénea que muestra el fenotipo seleccionado en respuesta a un estímulo.

También se proporciona un método, donde el polipéptido modular sintético es un polipéptido des receptores de antígenos quiméricos (CAR, por sus siglas en inglés) y donde el estímulo es una célula presentadora de antígenos que muestra sobre su superficie un antígeno que se une mediante el CAR.

Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el estímulo está en contacto con una molécula coestimuladora.

Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el polipéptido modular sintético es un polipéptido receptor modular.

Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el polipéptido de receptor sintético es un polipéptido receptor Notch quimérico.

Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el estímulo es un ligando para el polipéptido receptor Notch quimérico.

Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el polipéptido modular sintético es una proteína de andamiaje modular.

Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el polipéptido modular sintético es una proteína cinasa modular o proteína fosfatasa.

Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el polipéptido modular sintético es una proteína reguladora de transcripción modular.

Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el polipéptido modular sintético es una proteína reguladora epigenética modular.

Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el polipéptido modular sintético es una proteína nucleasa o recombinasa modular.

Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el fenotipo seleccionado comprende una firma fenotípica que comprende dos o más fenotipos.

Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula que comprende secuenciar el código de barras de la célula huésped modificada genéticamente para identificar el polipéptido modular sintético que se asocia con el fenotipo.

Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, que comprende cuantificar el polipéptido modular sintético que se asocia con el fenotipo.

Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, que comprende cuantificar un módulo individual de los polipéptidos modulares sintéticos de la biblioteca de códigos de barras de ácidos nucleicos que se asocia con el fenotipo.

Además se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde cada secuencia de nucleótidos que codifica un polipéptido modular sintético diferente comprende una secuencia que codifica un indicador detectable en enlace operable con la secuencia de nucleótidos que codifica el polipéptido modular sintético y el método comprende además dividir la población heterogénea de células huésped modificadas genéticamente de acuerdo con el indicador detectable expresado.

Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde la identificación se realiza in vitro o ex vivo.

Además, se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el fenotipo es uno o más de: a) proliferación; b) producción de citocinas; c) expresión de un marcador de superficie celular; d) expresión de una proteína indicadora.

Además, se proporciona un método para identificar un fenotipo seleccionado con un polipéptido modular sintético en una célula, donde el método incluye una biblioteca de códigos de barras de ácidos nucleicos que comprende 100 o más miembros únicos y la identificación comprende cribar 100 o más miembros únicos de la biblioteca para el fenotipo seleccionado.

Además se proporciona un método para identificar un fenotipo seleccionado que se asocia con un polipéptido modular sintético en una célula, donde el método incluye una biblioteca de códigos de barras de ácidos nucleicos que comprende múltiples miembros, donde los múltiples miembros comprenden una secuencia de nucleótidos que codifica un polipéptido modular sintético que comprende un dominio modular que se selecciona del grupo que consiste en: un dominio de unión al antígeno, un dominio de unión específica o una proteína compañera de unión específica, un dominio coestimulador, un dominio coinhibidor, un dominio se señalización intracelular, un dominio transmembrana, un dominio de proteína de andamiaje, un dominio de proteína de la proteína cinasa, un dominio de proteína de la proteína fosfatasa, un dominio de proteína del receptor de tirosina quinasa, un dominio de proteína quinasa lípida, un dominio de proteína fosfatasa lípida, un dominio de proteína ubiquitinilasa, un dominio de la proteína deubiquitinilasa, un dominio de la proteína SUMOilasa, un dominio de proteína acetilasa, un dominio de la proteína deacetilasa, un dominio de la proteína metilasa, un dominio de la proteína demetilasa, un dominio de la proteína nucleasa, un dominio de la proteína recombinasa, un dominio de proteína del factor de transcripción y combinaciones de estos.

Se proporciona una biblioteca de códigos de barra de ácidos nucleicos, tal biblioteca comprende: múltiples polinucleótidos únicos que comprenden cada uno una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde cada polinucleótido único comprende: i) una región de codificación que codifica el único polipéptido modular sintético que comprende una primera secuencia de codificación que codifica un primer módulo unido dentro del marco con una segunda secuencia de codificación que codifica un segundo módulo, ii) una región de código de barras que comprende un primer código de barras específico para una primera secuencia de codificación unida a un segundo código de barras, donde el primer y segundo código de barras se encuentran en el orden 5' a 3' invertido en comparación con la primera y segunda secuencia de codificación; y donde secuenciar la región de código de barras permite la identificación de cada polipéptido modular sintético.

Además, se proporciona una biblioteca de códigos de barras de ácidos nucleicos, donde las primeras y segundas secuencia de codificación se unen directamente sin ningún nucleótido no codificador interviniente.

Además, se proporciona una biblioteca de códigos de barras de ácidos nucleicos, donde las múltiples polinucleótidos únicos comprenden al menos 1000 polinucleótidos únicos.

Además, se proporciona una biblioteca de códigos de barra de ácidos nucleicos, donde la región del código de barras se encuentra 5' de la región de codificación.

Además, se proporciona una biblioteca de códigos de barra de ácidos nucleicos, donde la región de codificación se encuentra 5' de la región de códigos de barras.

Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos que incluye múltiples polinucleótidos únicos que comprenden cada uno una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde el único polipéptido modular sintético comprende un dominio coestimulador.

Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos la cual incluye múltiples polinucleótidos únicos que comprenden cada uno una secuencia de nucleótidos que codifica un único polipéptido modular sintético que incluye un primer y segundo módulo donde el primer y segundo módulo comprende diferentes dominios coestimuladores.

Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos, la cual incluye múltiples polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un polipéptido modular sintético donde cada polinucleótido único comprende una secuencia promotora que se une de forma operativa a la región de codificación y una secuencia indicadora que codifica un polipéptido detectable, donde el polipéptido detectable es un polipéptido ópticamente detectable que incluye, por ejemplo, un polipéptido fluorescente ópticamente detectable.

Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos, la cual incluye múltiples de polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un único polipéptido modular sintético que incluye una región de codificación donde la región de codificación comprende además una tercera secuencia de codificación que codifica un tercer módulo unido dentro del marco con una segunda secuencia de codificación y la región de códigos de barras comprende un tercer código de barras específico para la tercera secuencia de codificación unido al segundo código de barras, donde el primer, segundo y tercer códigos de barras se encuentran en un orden 5' a 3' inverso en comparación con la primera, segunda y tercera secuencia de codificación.

Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos la cual incluye múltiples polinucleótidos únicos que comprenden cada uno una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde los únicos polipéptidos modulares sintéticos codificados por un único polinucleótido de la multiplicidad son polipéptidos del receptor de antígeno quimérico (CAR).

Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos la cual incluye múltiples polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde los únicos polipéptidos modulares sintéticos codificados por cada polinucleótido único de la multiplicidad son polipéptidos del receptor modular.

Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos que codifica polipéptidos del receptor modular, donde los polipéptidos del receptor modular son polipéptidos del receptor Notch quimérico.

Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos la cual incluye múltiples polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde los únicos polipéptidos modulares sintéticos codificados por cada polinucleótido único de la multiplicidad son proteínas de andamiaje modular.

Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos la cual incluye múltiples polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde los únicos polipéptidos modulares sintéticos codificados por cada polinucleótido único de la multiplicidad son proteínas cinasas modulares o proteínas fosfatasa.

Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos la cual incluye múltiples polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde los únicos polipéptidos modulares sintéticos codificados por cada polinucleótido único de la multiplicidad son proteínas reguladoras de transcripción modulares.

Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos la cual incluye múltiples polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde los únicos polipéptidos modulares sintéticos codificados por cada polinucleótido único de la multiplicidad son proteínas reguladoras epigenéticas modulares.

Se proporciona también una biblioteca de códigos de barras de ácidos nucleicos la cual incluye múltiples polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde los únicos polipéptidos modulares sintéticos codificados por cada polinucleótido único de la multiplicidad son proteínas nucleasas o recombinasas modulares.

Además se proporciona una biblioteca de códigos de barras de ácidos nucleicos, la cual incluye múltiples polinucleótidos únicos que comprenden, cada uno, una secuencia de nucleótidos que codifica un polipéptido modular sintético donde los únicos polipéptidos modulares sintéticos codificados por cada polinucleótido único de la multiplicidad comprende un dominio modular que se selecciona del grupo que consiste en: un dominio de unión al antígeno, un dominio de unión específica o una proteína compañera de unión específica, un dominio coestimulador, un dominio coinhibidor, un dominio se señalización intracelular, un dominio transmembrana, un dominio de proteína de andamiaje, un dominio de proteína de la proteína cinasa, un dominio de proteína de la proteína fosfatasa, un dominio de proteína del receptor de tirosina quinasa, un dominio de proteína quinasa lípida, un dominio de proteína fosfatasa lípida, un dominio de proteína ubiquitinilasa, un dominio de la proteína deubiquitinilasa, un dominio de la proteína SUMOilasa, un dominio de proteína acetilasa, un dominio de la proteína deacetilasa, un dominio de la proteína metilasa, un dominio de la proteína demetilasa, un dominio de la proteína nucleasa, un dominio de la proteína recombinasa, un dominio de proteína del factor de transcripción y combinaciones de estos.

Se proporciona una biblioteca celular, tal biblioteca comprende: múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde cada polinucleótido único comprende: i) una región de codificación que codifica el único polipéptido modular sintético que comprende una primera secuencia de codificación que codifica un primer módulo unido dentro del marco a una segunda secuencia de codificación que codifica un segundo módulo, ii) una región de código de barras que comprende un primer código de barras específico para una primera secuencia de codificación unida a un segundo código de barras específico para la segunda secuencia de codificación, donde el primer y segundo código de barras se encuentran en el orden 5' a 3' invertido en comparación con la primera y segunda secuencia de codificación; y donde secuenciar la región de código de barras permite la identificación de cada polipéptido modular sintético de cada célula de la biblioteca.

Se proporciona también una biblioteca celular donde las células son células procariotas o células eucariotas. Se proporciona también una biblioteca celular donde las células eucariotas son células humanas. Se proporciona también una biblioteca celular donde las células humanas son linfocitos T humanos.

Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de codificación que codifica un único polipéptido modular sintético que incluye una región de codificación que codifica el único polipéptido modular sintético que comprende una primera secuencia de codificación que codifica un primer módulo unido dentro del marco a una segunda secuencia de codificación que codifica un segundo módulo donde la primera y segunda secuencia de codificación están directamente unidas sin ningún nucleótido no codificador interviniente.

Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de codificación que codifica un único polipéptido modular sintético que incluye una región de codificación que codifica el único polipéptido modular sintético que comprende una primera secuencia de codificación que codifica un primer módulo unido dentro del marco a una segunda secuencia de codificación que codifica un segundo módulo, donde la región de codificación comprende además una secuencia de codificación indicadora que codifica un indicador unido dentro del marco a una segunda secuencia de codificación.

Se proporciona también una biblioteca celular que incluye una secuencia de codificación indicadora que codifica un indicador unido dentro del marco a la segunda secuencia de codificación donde el indicador es una etiqueta del epítopo.

Se proporciona también una biblioteca celular que incluye una secuencia de codificación indicadora que codifica un indicador unido dentro del marco a la segunda secuencia de codificación donde el indicador es una proteína fluorescente.

Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde las múltiples células comprenden al menos 1000 polinucleótidos únicos.

Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que incluye una región de codificación que codifica un único polipéptido modular sintético, donde la región de codificación comprende además una tercera secuencia de codificación que codifica un tercer módulo unido dentro del marco a una segunda secuencia de codificación y la región de códigos de barras comprende un tercer código de barras específico para la tercera secuencia de codificación unido al segundo código de barras, donde el primer, segundo y tercer código de barras se encuentran en un orden 5' a 3' inverso en comparación con la primera, segunda y tercera secuencia de codificación.

Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético, donde los únicos polipéptidos modulares sintéticos codificados por un único polinucleótido de la multiplicidad son polipéptidos del receptor de antígeno quimérico (CAR).

Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético, donde los únicos polipéptidos modulares sintéticos codificados por un único polinucleótido de la multiplicidad son células son polinucleótidos del receptor modular.

Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético donde los polipéptidos del receptor modular son polipéptidos del receptor Notch quiméricos.

Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético, donde los únicos polipéptidos modulares sintéticos codificados por un único polinucleótido de la multiplicidad de células son células son proteínas de andamiaje modular.

Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético, donde los únicos polipéptidos modulares sintéticos codificados por un único polinucleótido de la multiplicidad de células son células son proteínas fosfatasas o proteínas cinasas modulares.

Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético, donde los únicos polipéptidos modulares sintéticos codificados por un único polinucleótido de la multiplicidad de células son células son proteínas reguladoras de transcripción modulares.

Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético, donde los únicos polipéptidos modulares sintéticos codificados por un único polinucleótido de la multiplicidad de células son células son proteínas reguladoras epigenéticas modulares.

Se proporciona también una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético, donde los únicos polipéptidos modulares sintéticos codificados por un único polinucleótido de la multiplicidad de células son células son proteínas nucleasas o recombinasas modulares.

Además se proporciona una biblioteca celular, la cual incluye múltiples células que comprenden, cada una, un único polinucleótido que comprende una secuencia de nucleótidos que codifica un único polipéptido modular sintético, donde el único polipéptido modular sintético codificado por cada polinucleótido único de la multiplicidad de células comprende un dominio modular que se selecciona del grupo que consiste en: un dominio de unión al antígeno, un dominio de unión específica o una proteína compañera de unión específica, un dominio coestimulador, un dominio coinhibidor, un dominio se señalización intracelular, un dominio transmembrana, un dominio de proteína de andamiaje, un dominio de proteína de la proteína cinasa, un dominio de proteína de la proteína fosfatasa, un dominio de proteína del receptor de tirosina quinasa, un dominio de proteína quinasa lípida, un dominio de proteína fosfatasa lípida, un dominio de proteína ubiquitinilasa, un dominio de la proteína deubiquitinilasa, un dominio de la proteína SUMOilasa, un dominio de proteína acetilasa, un dominio de la proteína deacetilasa, un dominio de la proteína metilasa, un dominio de la proteína demetilasa, un dominio de la proteína nucleasa, un dominio de la proteína recombinasa, un dominio de proteína del factor de transcripción y combinaciones de estos.

Se proporciona un método para elaborar una biblioteca de códigos de barras de ácidos nucleicos que codifican cada uno, un único polipéptido modular sintético, tal método comprende: poner en contacto un primer polinucleótido que comprende una primera secuencia de codificación de módulo unida a una primera secuencia de códigos de barras con un segundo polinucleótido que comprende una segunda secuencia de codificación de módulo a una segunda secuencia de códigos de barras en condiciones suficientes para insertar el primer polinucleótido en el segundo polinucleótido en la unión entre la segunda secuencia de codificación y la segunda secuencia de códigos de barras generando así un polinucleótido bimodular de códigos de barras, donde el polinucleótido bimodular de códigos de barras comprende la segunda secuencia de codificación modular unida dentro del marco a la primera secuencia de codificación modular unida a la primera secuencia de códigos de barras unida a la segunda secuencia de código de barras.

Se proporciona también un método para elaborar una biblioteca de códigos de barras de ácidos nucleicos que codifican cada uno, un único polipéptido modular sintético, donde el método comprende además poner en contacto el primer y segundo polinucleótido con un tercer polinucleótido que comprende una tercera secuencia de codificación del módulo donde el tercer polinucleótido se inserta en el primer polinucleótido en la unión entre la primera secuencia de codificación y la primera secuencia de códigos de barras generando así un polinucleótido bimodular con código de barras, donde el polinucleótido trimodular con código de barras comprende la segunda secuencia de codificación modular unida dentro del marco a la primera secuencia de codificación modular unida dentro del marco a la tercera secuencia de codificación modular unida a la tercera secuencia de código de barras unida a la primera secuencia de códigos de barras unida a la segunda secuencia de códigos de barras.

Además, se proporciona un método para elaborar una biblioteca de códigos de barras de ácidos nucleicos que codifican, cada uno, un único polipéptido modular sintético donde las primeras y segundas secuencia de codificación modulares están directamente unidas dentro del marco sin ningún nucleótido no codificador interviniente.

Además, se proporciona un método para elaborar una biblioteca con código de barras de ácidos nucleicos que codifican, cada uno, un único polipéptido modular sintético donde la biblioteca con código de barras comprende 1000 o más ácidos nucleicos únicos que codifican cada uno un polipéptido modular sintético.

Además, se proporciona un método para elaborar una biblioteca con código de barras de ácidos nucleicos que codifican, cada uno, un único polipéptido modular sintético donde las secuencias de código de barras se encuentran 5' con respecto a las secuencias de codificación del módulo o 3' con respecto a las secuencias de codificación del módulo.

Se proporciona también un método para elaborar una biblioteca de códigos de barras de ácidos nucleicos que codifican, cada uno, un único polipéptido modular sintético, donde la inserción del primer polinucleótido en el segundo polinucleótido en la unión entre la segunda secuencia de codificación y la segunda secuencia de códigos de barras está mediada por la actividad de una enzima de restricción que reconoce un sitio de reconocimiento de enzimas de restricción en el segundo polinucleótido e hibrida el segundo polinucleótido entre la segunda secuencia de codificación y la segunda secuencia de códigos de barras, que incluye, donde la enzima de restricción utilizada es una enzima de restricción de tipo II, lo que incluye donde la enzima de restricción utilizada es una enzima de restricción de tipo IIS.

Además, se proporciona un método para elaborar una biblioteca de códigos de barras de ácidos nucleicos que codifican, cada uno, un único polipéptido modular sintético donde el primer polinucleótido comprende también el sitio de reconocimiento de enzimas de restricción que está presente en el segundo polinucleótido.

Se proporciona también un método para elaborar una biblioteca de códigos de barras de ácidos nucleicos que codifican cada uno, un único polipéptido modular sintético, donde el método comprende además poner en contacto los polinucleótidos bimodulares con un indicador que codifica el polinucleótido en condiciones suficientes para la inserción del indicador que codifica el polinucleótido en el polinucleótido bimodular de código de barras en la unión entre la primera secuencia de codificación modular y la primera secuencia de códigos de barras generando así un polinucleótido bimodular con código de barras unido al indicador, donde el polinucleótido bimodular con código de barras unido al indicador comprende la segunda secuencia de codificación modular unida dentro del marco a la primera secuencia de codificación modular unida dentro del marco es decir que la secuencia de codificación indicadora está unida a la primera secuencia de codificación con códigos de barras unida a la segunda secuencia de códigos de barras. Se proporciona también un método para elaborar una biblioteca con código de barras donde la secuencia de codificación indicadora codifica una etiqueta de epítopo o un indicador fluorescente.

Se proporciona un receptor de antígenos quiméricos (CAR) identificado mediante el cribado de una biblioteca de ácidos nucleicos que codifican polipéptidos modulares sintéticos CAR, donde el CAR comprende al menos un dominio comodulador que se enumera en la Tabla 3 o la Tabla 4.

Se proporciona también un CAR identificado mediante el cribado de una biblioteca de ácidos nucleicos que codifican el polipéptido modular sintético CAR, donde el CAR comprende un dominio de unión al antígeno anti-CD19.

Se proporciona también un CAR identificado mediante el cribado de una biblioteca de ácidos nucleicos que codifican el polipéptido modular sintético CAR, donde el CAR comprende un dominio de señalización primario zeta CD3.

Se proporciona también un CAR identificado mediante el cribado de una biblioteca de ácidos nucleicos que codifican el polipéptido modular sintético CAR, donde el CAR estimula la actividad de los linfocitos T y comprende al menos un dominio coestimulador que se enumera en la Tabla 3.

Se proporciona también un CAR identificado mediante el cribado de una biblioteca de ácidos nucleicos que codifican el polipéptido modular sintético CAR, donde el CAR inhibe la actividad de los linfocitos T y comprende al menos un dominio coinhibidor que se enumera en la Tabla 4.

Se proporciona también un ácido nucleico que codifica un CAR identificado mediante el cribado de una biblioteca de ácidos nucleicos que codifican el polipéptido modular sintético CAR, que incluye, por ejemplo, cualquiera de los CAR descritos en la presente.

Breve descripción de las figuras

La figura 1 ilustra una secuencia de módulo con código de barras subclonada para el ensamblaje de biblioteca de acuerdo con una modalidad de la descripción.

La figura 2 ilustra la secuencia de módulo con códigos de barras de la figura 1 después de la digestión de enzimas de restricción de tipo IIS en preparación para el ensamblaje de la biblioteca.

La figura 3 ilustra un fragmento de secuencia de ejemplo de acuerdo con la figura 1 (antes de la digestión de las enzimas de restricción (RE) de tipo IIS; SEQ ID N.°: 16) y la figura 2 (después de la digestión RE de tipo IIS; SEQ ID N.^ 17) que contiene la secuencia que codifica un dominio coestimulador CD28 (traducción del fragmento digerido RE de tipo IIS; SEQ ID N.o 18).

La figura 4 proporciona la Tabla 1. Los identificadores de secuencia para las secuencias en la Tabla 1 son los siguientes: índice 1 - SEQ ID N.^ 19; índice 2 - SEQ ID N.o:20; índice 3 - SEQ ID N.o: 21; índice 4 - SEQ ID N^ 22; índice 5 - SEQ ID N.o 23; índice 6 - SEQ ID N.o:24; índice 7 - SEQ ID N.3: 25; índice 8 - SEQ ID N^ 26; índice 9 - SEQ ID N.^ 27; índice 10 - SEQ ID N.^ índice 11 - SEQ ID N.o 29; índice 12 - SEQ ID N^ 30; índice 13 - SEQ ID N^ : 31 índice 14 - SEQ ID N^ : 32 índice 15 -S E Q ID N^ : 33 índice 16 - SEQ ID N^ : 34; índice 17 - SEQ ID N^ : 35 índice 18 -S E Q ID N^ : 36 índice 19 - SEQ ID N^ :3 7 índice 20 - SEQ ID N^ : 38; índice 21 - SEQ ID N^ : 39 índice 22 -S E Q ID N^ : 40 índice 23 -S E Q ID N^ : 41 índice 24 - SEQ ID N^ : 42; índice 25 - SEQ ID N^ : 43 índice 26 - SEQ ID N^ : 44 índice 27 -S E Q ID N^ : 45 índice 28 - SEQ ID N^ : 46; índice 29 - SEQ ID N^ : 47 índice 30 - SEQ ID N^ : 48 índice 31 - SEQ ID N^ : 49 índice 32 - SEQ ID N^ : 50; índice 33 - SEQ ID N^ : 51 índice 34 - SEQ ID N^ : 52 índice 35 - SEQ ID N^ : 53 índice 36 - SEQ ID N^ : 54; índice 37 - SEQ ID N^ : 55 índice 38 - SEQ ID N^ : 56 índice 39 - SEQ ID N^ : 57 índice 40 - SEQ ID N^ : 58; índice 41 - SEQ ID N^ : 59 índice 42 - SEQ ID N^ : 60 índice 43 - SEQ ID N^ : 61 índice 44 - SEQ ID N^ : 62; índice 45 - SEQ ID N^ : 63 índice 46 - SEQ ID N^ : 64 índice 47 - SEQ ID N^ : 65 índice 48 - SEQ ID N^ : 66; índice 49 - SEQ ID N^ : 67 índice 50 - SEQ ID N^ : 68 índice 51 - SEQ ID N^ : 69 índice 52 - SEQ ID N^ : 70; índice 53 - SEQ ID N.^ 71; índice 54 - SEQ ID N.^ 72; índice 55 -S E Q ID N N.5: 73; índice 56 -S E Q ID N^ : 74; índice 57 - SEQ ID N^ índice 58 - SEQ ID N^ : 76 índice 59 - SEQ ID N^ : 77 índice 60 - SEQ ID N^ : 26; índice 61 - SEQ ID N.^ 26; índice 62 - SEQ ID N.^ 26.

La figura 5 ilustra el esquema general del ensamblaje gradual de una biblioteca de módulos coestimuladora bidimensional con códigos de barras de acuerdo con una modalidad de la presente descripción.

La figura 6 ilustra el esquema general de la generación de una biblioteca de módulos coestimuladora bidimensional 62 por 62 de acuerdo con una modalidad de la presente descripción.

La figura 7 ilustra la configuración general de los miembros de una biblioteca de receptores de antígenos quiméricos (CAR) unidimensionales de acuerdo con una modalidad de la presente descripción.

La figura 8 ilustra la clasificación funcional (es decir, agrupamiento) de linfocitos T que expresan CAR estimuladas de acuerdo con el nivel resultante de activación.

La figura 9 ilustra la cuantificación de la influencia relativa en la actividad de los linfocitos T de cada dominio coestimulador de la biblioteca según se realiza mediante la secuenciación de forma cuantitativa de los códigos de barras específicos para el módulo.

La figura 10 ilustra las características de la respuesta a la dosis de seis dominios comoduladores a lo largo de tres niveles crecientes de entrada de antígenos obtenidos usando una biblioteca unidimensional de 62 miembros. La figura 11 ilustra un ejemplo no taxativo de una biblioteca de CAR, que indica donde se pueden variar diversos dominios del CAR dentro de la biblioteca, de acuerdo con una modalidad de la presente descripción.

La figura 12 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.

La figura 13 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.

La figura 14 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.

La figura 15 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.

La figura 16 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.

La figura 17 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.

La figura 18 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.

La figura 19 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.

La figura 20 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.

La figura 21 ilustra una estrategia de ensamblaje de secuencias de codificación de módulos con códigos de barras esquematizada como se describe en la presente.

La figura 22 ilustra una estrategia esquematizada para el ensamblaje anidado combinatorio de una biblioteca de receptores de antígenos quiméricos (CAR) de acuerdo con una modalidad de la presente descripción.

La figura 23 ilustra la producción esquematizada de una biblioteca de CAR modulares celulares agrupados de acuerdo con una modalidad de la presente descripción.

La figura 24 ilustra un ejemplo esquematizado de un método de identificación de polipéptidos modulares y detección de fenotipos integrados para su uso in vitro y/o in vivo de acuerdo con una modalidad de la presente descripción.

La figura 25 proporciona la Tabla 2.

La figura 26 ilustra la representación completa de cada miembro de una biblioteca bidimensional de 61 x 61 como se determina mediante la secuenciación profunda de la biblioteca ensamblada.

La figura 27 ilustra la secuenciación de la cuantificación de los miembros de una biblioteca de ácidos nucleicos combinatoria prenormalizada como se describe en la presente.

La figura 28 ilustra una ecuación lineal utilizada para calcular los ajustes de normalización relacionados con los miembros de la biblioteca que se cuantifica en la figura 27.

La figura 29 muestra la previsibilidad de los ajustes de normalización realizados de acuerdo con el método que se describe en la presente.

DEFINICIONES

Las expresiones “polinucleótido” y “ácido nucleico”, que se utilizan de manera indistinta en la presente, se refieren a una forma polimérica de nucleótidos de cualquier longitud, ya sean ribonucleótidos o desoxirribonucleótidos. Por lo tanto, esta expresión incluye, de modo no taxativo, ADN o ARN de cadena simple, doble o múltiple, ADN genómico, ADNc, híbridos de ADN-ARn o un polímero que comprende bases de purina y pirimidina u otras bases de nucleótidos naturales, modificadas químicamente o biológicamente, no naturales o derivadas.

Los términos “polipéptido”, “péptido” y “proteína”, que se utilizan de manera indistinta en la presente, se refieren a una forma polimérica de aminoácidos de cualquier longitud, que puede incluir aminoácidos codificados genéticamente y no codificados genéticamente, aminoácidos modificados o derivados de forma química o bioquímica, y polipéptidos con estructuras principales de péptidos modificados. El término incluye proteínas de fusión, que incluyen, de modo no taxativo, proteínas de fusión con una secuencia de aminoácidos heteróloga, fusiones con secuencias líder heterólogas y homólogas, con o sin residuos de metionina en el extremo N; proteínas marcadas inmunológicamente; y similares.

Los términos “dominio” y “motivo”, se utilizan de forma intercambiable en la presente, hacen referencia a dominios estructurados que tienen una o más funciones particulares y segmentos no estructurados de un polipéptido que, aunque no estructurado, conserva una o más funciones particulares. Por ejemplo, un dominio estructurado puede abarcar, de modo no taxativo, múltiples aminoácidos continuos y discontinuos, o partes de estos, en un polipéptido plegado que comprende una estructura tridimensional que contribuye a una función particular del polipéptido. En otros casos, un dominio puede incluir un segmento no estructurado de un polipéptido que comprende múltiples de dos o más aminoácidos o partes de estos, que mantiene una función particular del polipéptido no plegado o desordenado. Además, se incluyen dentro de esta definición dominios que se pueden desordenar o no estructurar pero que se vuelven estructurados u ordenados tras su asociación con un objetivo o compañero de unión. Los ejemplos no taxativos de dominios intrínsecamente no estructurados y los dominios de proteínas intrínsecamente no estructuradas se describen, por ejemplo, en Dyson & Wright. Nature Reviews Molecular Cell Biology 6:197-208.

El término “módulo”, tal como se utiliza en la presente, hace referencia a una secuencia de polipéptidos contiguos, o fragmento de esta, que se asocia con alguna función, particularmente una función biológica.

Las expresiones “receptor de antígeno quimérico” y “CAR”, que se utilizan de manera indistinta en la presente, se refieren a moléculas artificiales de múltiples módulos capaces de activar o inhibir la activación de una célula inmunitaria que generalmente, si bien no exclusivamente, comprende un dominio extracelular (por ejemplo, un dominio de unión al antígeno/ligando), un dominio transmembrana y uno o más dominios de señalización intracelular. El término CAR no se limita específicamente a las moléculas de CAR sino también incluye variantes de CAR. Las variantes de CAR incluyen CAR divididos donde la parte extracelular (por ejemplo, la parte de unión al ligando) y la parte intracelular (por ejemplo, la parte de señalización intracelular) de un c Ar están presentes en dos moléculas separadas. Las variantes de CAR también incluyen CAR con conmutador ON y CAR con conmutador OFF que son CAR activables/represibles de forma condicional, por ejemplo, que comprenden un CAR dividido donde la heterodimerización condicional de las dos partes del CAR dividido se controla farmacológicamente. Las variantes de CAR también incluyen CAR biespecíficos, que incluyen un dominio de unión a CAR secundario que puede amplificar o inhibir la actividad de un CAR primario. Las variantes de CAR también incluyen receptores de antígeno quiméricos inhibidores (iCAR) que pueden utilizarse, por ejemplo, como un componente de un sistema de CAR biespecíficos, donde la unión de un dominio de unión de CAR secundario provoca la inhibición de la activación del CAR primario. Las moléculas de CAR y los derivados de estas (es decir, variantes de CAR) se describen, por ejemplo, en la solicitud de PCT n.° US2014/016527; Fedorov et ál. Sci Transl Med (2013) ;5(215):215ra172; Glienke et ál. Front Pharmacol (2015) 6:21; Kakarla & Gottschalk 52 Cáncer J (2014) 20(2):151-5; Riddell etál. Cáncer J (2014) 20(2):141-4; Pegram et ál. Cáncer J (2014) 20(2):127-33; Cheadle et ál. Immunol Rev (2014) 257(1):91-106; Barrett et ál. Annu Rev Med (2014) 65:333-47; Sadelain et ál. Cáncer Discov (2013) 3(4):388-98; Cartellieri et ál., J Biomed Biotechnol (2010) 956304.

El término “gen” hace referencia a una unidad particular de herencia presente en un locus particular dentro del componente genético de un organismo. Un gen puede ser una secuencia de ácido nucleico, por ejemplo, una secuencia de ADN o ARN, presente en un genoma de ácido nucleico, un genoma de ADN o ARN, de un organismo y, en algunos casos, puede estar presente en un cromosoma. Un gen puede ser una secuencia de ADN que codifica un ARNm que codifica una proteína. Un gen puede estar compuesto por un único exón y ningún intrón o puede incluir múltiples exones y uno o más intrones. Una o de dos o más formas alternativas o idénticas de un gen presente en un locus particular se denomina “alelo” y, por, un organismo diploide tendrá normalmente dos alelos de un gen particular. Se pueden generar nuevos alelos de un gen particular ya sea de forma natural o artificial a través de una mutación inducida o natural y se pueden propagar a través de la reproducción o clonación. Es posible aislar un gen o alelo del genoma de un organismo y replicarse y/o manipularse o un gen o alelo puede ser modificado in situ a través de métodos de terapia génica. El locus de un gene o alelo puede tener elementos reguladores asociados y terapia génica, en algunos casos, puede incluir la modificación de elementos reguladores de un gen o alelo mientras que deja sin modificar las secuencias de codificación del gen o alelo.

“Enlazado/a operativamente” se refiere a una yuxtaposición donde los componentes descritos de esta manera se encuentran en una relación que les permite funcionar de la manera prevista. Por ejemplo, un promotor está unido de manera operativa a una secuencia codificante si el promotor afecta su transcripción o expresión.

Un “vector” o “vector de expresión” es un replicón, tal como un plásmido, fago, virus o cósmido, al que se puede unir otro segmento de ADN, es decir, un “ inserto”, para producir la replicación del segmento unido en una célula.

“Heterólogo/a”, tal como se usa en la presente, significa una secuencia de nucleótidos o polipéptidos que no se encuentra en el ácido nucleico o proteína natural (por ejemplo, de origen natural), respectivamente.

Los términos “anticuerpos” e “ inmunoglobulina” incluyen anticuerpos o inmunoglobulinas de cualquier isotipo, fragmentos de anticuerpos que retienen la unión específica al antígeno, que incluyen, de modo no taxativo, fragmentos Fab, Fv, scFv y Fd, anticuerpos quiméricos, anticuerpos humanizados, anticuerpos de cadena simple y proteínas de fusión que comprenden una parte de unión al antígeno de un anticuerpo y una proteína que no es anticuerpo.

Los “fragmentos de anticuerpo” comprenden una parte de un anticuerpo intacto, por ejemplo, la región variable o de unión al antígeno del anticuerpo intacto. Los ejemplos de fragmentos de anticuerpos incluyen fragmentos Fab, Fab', F(ab')2 y Fv; diacuerpos; anticuerpos lineales (Zapata et ál., Protein Eng. 8(10): 1057-1062 (1995)); moléculas de anticuerpo de cadena simple y anticuerpos multiespecíficos formados a partir de fragmentos de anticuerpo. La digestión de papaína de los anticuerpos produce dos fragmentos de unión al antígeno idénticos, denominados fragmentos “Fab”, cada uno con un solo sitio de unión a antígeno, y un fragmento “Fc” residual, una designación que refleja la capacidad de cristalizarse fácilmente. El tratamiento de pepsina proporciona un fragmento F(ab')2 que tiene dos sitios de unión a antígeno y es aun capaz de entrecruzar el antígeno.

Los fragmentos de anticuerpo “Fv de cadena simple” o “sFv” comprenden los dominios Vh y Vl del anticuerpo, donde estos dominios están presentes en una cadena de polipéptidos simple. En algunas modalidades, el polipéptido Fv comprende adicionalmente un enlace polipeptídico entre los dominios Vh y Vl, que permite que el sFv forme la estructura deseada para la unión al antígeno. Para acceder a un cribado de sFv, véase Pluckthun in The Pharmacology of Monoclonal Antibodies, vol. 113, Rosenburg y Moore eds., Springer-Verlag, Nueva York, págs. 269-315 (1994).

Tal como se usa en la presente, el término “afinidad” se refiere a la constante de equilibrio para la unión reversible de dos agentes y se expresa como una constante de disociación (Kd). La afinidad puede ser al menos 1 vez mayor, al menos 2 veces mayor, al menos 3 veces mayor, al menos 4 veces mayor, al menos 5 veces mayor, al menos 6 veces mayor, al menos 7 veces mayor, al menos 8 veces mayor, al menos 9 veces mayor, al menos 10 veces mayor, al menos 20 veces mayor, al menos 30 veces mayor, al menos 40 veces mayor, al menos 50 veces mayor, al menos 60 veces mayor, al menos 70 veces mayor, al menos 80 veces mayor, al menos 90 veces mayor, al menos 100 veces mayor, o al menos 1000 veces mayor, o más, que la afinidad de un anticuerpo para secuencias de aminoácidos no relacionadas. La afinidad de un anticuerpo con respecto a una proteína diana puede ser, por ejemplo, de aproximadamente 100 nanomolar (nM) a aproximadamente 0.1 nM, de aproximadamente 100 nM a aproximadamente 1 picomolar (pM), o de aproximadamente 100 nM a aproximadamente 1 femtomolar (fM) o más.

El término “unión” se refiere a una asociación directa entre dos moléculas, debido a, por ejemplo, interacciones covalentes, electrostáticas, hidrofóbicas e iónicas y/o de enlaces de hidrógeno, que incluyen interacciones tales como puentes de sal y puentes de agua. La unión no específica haría referencia a la unión con una afinidad menor que aproximadamente 10'7 M, por ejemplo, unión con una afinidad de 10'6 M, 10'5 M, 10'4 M, etc.

Tal como se usa en la presente, la expresión “células inmunitarias” generalmente incluye glóbulos blancos (leucocitos) que derivan de células madre hematopoyéticas (HSC, por sus siglas en inglés) producidas en la médula ósea. Las “células inmunitarias” incluyen, por ejemplo, linfocitos (linfocitos T, linfocitos B, linfocitos citolíticos (NK, por sus siglas en inglés)) y células derivadas de mieloide (neutrófilo, eosinófilo, basófilo, monocito, macrófago, células dendríticas).

“Linfocito T” incluye todos los tipos de células inmunitarias que expresan CD3 incluidos los linfocitos T auxiliares (linfocitos CD4+), linfocitos T citotóxicos (linfocitos CD8+), linfocitos T reguladores (Treg) y linfocitos T gamma-delta.

Una “célula citotóxica” incluye linfocitos T CD8+, linfocitos citolíticos (NK) y neutrófilos, que son capaces de mediar las respuestas de citotoxicidad.

Tal como se usa en la presente, la expresión “célula madre” generalmente incluye células madre pluripotentes o multipotentes. Las “células madre” incluyen, por ejemplo, células madre embrionarias (ES, por sus siglas en inglés); células madre mesenquimales (MSC, por sus siglas en inglés); células madre pluripotentes inducidas (iPS, por sus siglas en inglés); y células progenitoras comprometidas (células madre hematopoyéticas (HSC); células derivadas de la médula ósea, etc.).

Tal como se usa en la presente, el término “tratamiento”, “que trata” y similares, hace referencia a obtener un efecto farmacológico y/o fisiológico deseado. El efecto puede ser profiláctico en términos de prevenir total o parcialmente una enfermedad o síntoma o de esta y/o puede ser terapéutico en términos de una cura parcial o total de una enfermedad y/o efecto adverso atribuible a la enfermedad. “Tratamiento”, tal como se usa en la presente, abarca cualquier tratamiento de una enfermedad en un mamífero, particularmente, en un ser humano, e incluye: (a) prevenir que la enfermedad tenga lugar en un sujeto que puede estar predispuesto a la enfermedad, pero aún no tiene un diagnóstico de que la padece; (b) inhibir la enfermedad, es decir, detener su desarrollo; y (c) aliviar la enfermedad, es decir, provocar el retroceso de la enfermedad.

Los términos “ individuo”, “sujeto”, “huésped” y “paciente” usados de manera intercambiable en la presente, hacen referencia a un mamífero, que incluye, de modo no taxativo, murinos (por ejemplo, ratas, ratones), lagomorfos (por ejemplo, conejos), primates no humanos, humanos, caninos, felinos, ungulados (por ejemplo, equinos, bovinos, ovinos, porcinos, caprinos), etc.

Una “cantidad terapéuticamente eficaz” o “cantidad eficaz” se refiere a la cantidad de un agente, o cantidades combinadas de dos agentes que, cuando se administra a un mamífero u otro sujeto para tratar una enfermedad, es suficiente para efectuar dicho tratamiento para la enfermedad. La “cantidad terapéuticamente eficaz” variará dependiendo de los agentes, la enfermedad y su gravedad y la edad, peso, etc., del sujeto que se tratará.

Las expresiones “control”, “reacción de control”, “ensayo de control” y similares, hacen referencia a una reacción, prueba u otra parte de un procedimiento experimental o de diagnóstico o diseño experimental para el cual se conoce un resultado esperado con gran certeza, por ejemplo, con el fin de indicar si los resultados obtenidos a partir de las muestras experimentales asociadas son confiables, indicar hasta qué grado de confianza los resultados experimentales asociados indican un resultado verdadero, y/o permitir la calibración de resultados experimentales. Por ejemplo, en algunos casos, un control puede ser un “control negativo” es decir que un componente esencial del ensayo se excluye de la reacción de control negativo de modo que un investigador puede tener un grado elevado de certeza de que la reacción de control negativo no producirá un resultado positivo. En algunos casos, un control puede ser un “control positivo” de modo que se conocen y caracterizan todos los componentes de un ensayo particular, cuando se combinan, para producir un resultado particular en un ensayo que se está realizando de manera que un investigador puede tener un grado elevado de certeza de que la reacción de control positivo no producirá un resultado negativo positivo.

El término “cebador” o “cebador de oligonucleótidos”, tal como se usa en la presente, se refiere a un oligonucleótido que se actúa para iniciar la síntesis de una cadena de ácido nucleico complementaria cuando se coloca en condiciones en las que se induce la síntesis de un producto de extensión de cebadores, por ejemplo, en presencia de nucleótidos y un agente de inducción de la polimerización, tal como una ADN o ARN polimerasa y a una temperatura, pH, concentración de metales y concentración de sales adecuada. Los cebadores tienen generalmente una longitud compatible con su uso en la síntesis de productos de extensión de cebadores y puede estar en el intervalo de entre 8 y 100 nucleótidos de longitud, tal como 10 y 75, 15 y 60, 15 y 40, 18 y 30, 20 y 40, 21 y 50, 22 y 45, 25 y 40, y así sucesivamente, lo que incluye en el intervalo de entre 18-40, 20-35, 21-30 nucleótidos de longitud y cualquier longitud entre los intervalos establecidos. En algunos casos, los cebadores pueden estar en el intervalo de entre 10-50 nucleótidos de longitud, tal como 15-45, 18-40, 20-30, 21-25 y así sucesivamente y cualquier longitud entre los intervalos establecidos. En algunas modalidades, los cebadores generalmente tienen una longitud no superior a 10, 12, 15, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65, o 70 de nucleótidos.

Los términos “hibridar” e “hibridación” se refieren a la formación de complejos entres secuencias de nucleótidos que tienen suficiente complementariedad para formar complejos por medio de formación de bases de pares de Watson-Crick. Por ejemplo, cuando un cebador “se hibrida” con el objetivo (plantilla), dichos complejos (o híbridos) son suficientemente estables para realizar la función de cebador requerida por medio de, por ejemplo, la ADN polimerasa para iniciar la síntesis del ADN.

Una “muestra biológica” abarca varios tipos de muestras obtenidas de un individuo o una población de individuos y se puede utilizar en un ensayo de diagnóstico, monitoreo o cribado. La definición comprende sangre y otras muestras líquidas de origen biológico, muestras de tejido sólido tales como muestras de biopsia o cultivos de tejido o células derivadas de estos y su progenie. La definición incluye también muestras que ha sido manipuladas de cualquier modo después de su adquisición, tal como mediante la mezcla o agrupamiento de muestras individuales, tratamiento con reactivos, solubilización, o enriquecimiento para determinados componentes, tales como células, polinucleótidos, polipéptidos, etc. La expresión “muestra biológica” abarca una muestra clínica y también incluye células en cultivo, sobrenadantes celulares, lisados celulares, suero, plasma, fluido biológico, y muestras de tejido. La expresión “muestra biológica” incluye orina, saliva, fluido cerebroespinal, fluido intersticial, fluido ocular, fluido sinovial, fracciones de sangre tal como plasma y suero, y similares. La expresión “muestra biológica” también incluye muestras de tejido sólido, muestras de cultivo de tejido y muestras celulares.

El término “evaluar” incluye cualquier forma de medición e incluye determinar si un elemento está presente o no. Los términos “determinar”, “medir”, “evaluar”, “valorar” y “ensayar” se usan de manera intercambiable e incluyen determinaciones cualitativas y cuantitativas. Evaluar puede relativo o absoluto. “Evaluar la presencia de” incluye determinar la cantidad de algo presente y/o determinar si está presente o ausente. Tal como se utiliza en la presente, los términos “determinar”, “medir”, “evaluar” y “ensayar” se usan de manera intercambiable e incluyen determinaciones cualitativas y cuantitativas.

Antes de describir la presente invención en mayor detalle, se deberá entender que esta invención no se limita a las modalidades particulares descritas, ya que estas pueden evidentemente variar. También debe entenderse que la terminología usada en la presente tiene el fin de describir solamente modalidades particulares y no pretende ser limitativa ya que el alcance de la presente invención estará limitado solamente por las reivindicaciones adjuntas.

Mientras que se proporciona un intervalo de valores, se deberá entender que cada valor involucrado, hasta la décima de la unidad de menor límite salvo que el contexto claramente establezca lo contrario, entre el límite superior e inferior de ese intervalo y cualquier otro valor establecido o involucrado en ese intervalo establecido, están comprendidos dentro de la invención. Los límites superior e inferior de estos intervalos más pequeños pueden estar incluidos independientemente en los intervalos más pequeños y también están comprendidos dentro de la invención, sujeto a cualquier límite específicamente excluido en el intervalo establecido. Cuando el intervalo establecido incluye uno o ambos de los límites, los intervalos que excluyan cualesquiera o ambos límites incluidos también se incluyen en la invención.

A menos que se defina lo contrario, todos los términos técnicos y científicos utilizados en la presente tienen el mismo significado comúnmente entendido por un experto en la técnica a la que pertenece la presente invención. Si bien en la práctica o la evaluación de la presente invención también puede utilizarse cualquier método y material similar o equivalente a los descritos en la presente, a continuación, se describen los métodos y materiales preferidos. Todas las publicaciones que se mencionan en la presente para divulgar y describir los métodos y/o materiales en relación con los cuales se citan las publicaciones.

Debe observarse que tal como se usa aquí y en las reivindicaciones adjuntas, las formas singulares “un”, “una” y “el/la”, incluyen los referentes plurales salvo que se exprese claramente lo contrario en el contexto. Por consiguiente, por ejemplo, la referencia a “un polipéptido” incluye una pluralidad de dichos polipéptidos y la referencia al “antígeno” incluye la referencia a uno o más antígenos y equivalentes de estos que los expertos en la técnica conocen, y así sucesivamente. Se observa además que las reivindicaciones pueden ser redactadas de forma que excluyan cualquier elemento opcional. Como tal, esto pretende servir como base antecedente para el uso de dicha terminología exclusiva tal como “solamente”, “únicamente” y similares con relación a la enumeración de los elementos de las reivindicaciones o el uso de una limitación “negativa”.

Se aprecia que determinadas características de la invención que se describen, por motivos de claridad, en el contexto de modalidades independientes, también se pueden proporcionar en combinación en una sola modalidad. Por el contrario, diversas características de la invención que, por motivos de brevedad, se describen en el contexto de una sola modalidad, también pueden proporcionarse de forma independiente o en cualquier subcombinación adecuada. Todas las combinaciones de las modalidades que pertenecen a la invención se encuentran específicamente comprendidas en la presente invención y se describen en la presente como si cada combinación se describiera de forma individual y específica. Además, todas las subcombinaciones de las diversas modalidades y elementos de estas también se encuentran específicamente comprendidas en la presente invención y se describen en la presente como si cada una de dichas subcombinaciones se describiera de forma individual y específica.

Las publicaciones que se analizan en la presente se proporcionan únicamente para su divulgación antes de la fecha de presentación de la presente solicitud. Nada en la presente debe interpretarse como una admisión de que esta invención no tiene derecho a preceder a dicha publicación en virtud de la invención previa. Adicionalmente, las fechas de publicación proporcionadas pueden ser distintas de las fechas de publicación reales, que pueden requerir una confirmación individual.

Descripción detallada

La presente descripción proporciona bibliotecas de polipéptidos modulares sintéticos y ácidos nucleicos que codifican dichas bibliotecas de polipéptidos modulares sintéticos. Además, se proporcionan métodos para realizar bibliotecas de polipéptidos modulares sintéticos y ácidos nucleicos que codifican dichas bibliotecas de polipéptidos modulares sintéticos. Se proporcionan también métodos para cribar una biblioteca de polipéptidos modulares sintéticos para identificar un fenotipo seleccionado que se asocia con un miembro de una biblioteca de polipéptidos modulares sintéticos donde los métodos se utilizan tanto en ensayo in vivo como in vitro.

BIBLIOTECAS

Los aspectos de la presente descripción se refieren a bibliotecas con códigos de barras de ácidos nucleicos que codifican múltiples polipéptidos modulares sintéticos. Los aspectos de la presente descripción incluyen también bibliotecas de células donde cada célula expresa un ácido nucleico con código de barras individual que codifica un único polipéptido modular sintético o múltiples de dichos ácidos nucleicos con códigos de barras individuales. Como se describirá más detalladamente a continuación, los aspectos de la descripción incluyen también métodos para elaborar dichas bibliotecas y métodos para cribar dichas bibliotecas para detectar fenotipos particulares.

Las bibliotecas de ácidos nucleicos de la presente descripción se ensamblan generalmente de forma combinatoria a partir de componentes modulares e incluyen un código de barras de múltiples unidades que se puede utilizar para identificar tanto la identidad como la configuración de los componentes modulares de cada miembro de la biblioteca. Como tal, cada miembro individual de la biblioteca de ácidos nucleicos contendrá al menos una región de codificación y una región de códigos de barras. Tal como se utiliza en la presente, en lo que se refiere a los miembros individuales de una biblioteca de ácidos nucleicos, la expresión “región de codificación” hace referencia a la región de cada ácido nucleico que codifica un polipéptido sintético de interés, por ejemplo, un polipéptido sintético que tiene uno o más módulos de polipéptidos que se pueden cribar para que tengan influencia en un fenotipo deseado o no deseado particular. En algunos casos, la región de codificación puede incluir además una secuencia que codifica una molécula indicadora, por ejemplo, como se utiliza para detectar y/o medir la expresión del polipéptido sintético de interés.

La región de codificación codificará generalmente un polipéptido modular único, que se describe más detalladamente a continuación, sin embargo, esta descripción no excluye bibliotecas donde la región de codificación de cada miembro de la biblioteca codifica dos o más polipéptidos modulares separados. Dichos miembros de la biblioteca pueden incluir una única región de codificación que es multicistrónica (por ejemplo, bicistrónica, policistrónica, etc.), por ejemplo, a través de la inclusión de un enlazador separable (por ejemplo, un sitio interno de entrada al ribosoma (IRES, por sus siglas en inglés), una secuencia de desviación ribosómica, un ácido nucleico que codifica un péptido autoescindible, etc.) entre las secuencias que codifican polipéptidos de módulo separable. Una región de codificación que comprende la secuencia que codifica dos o más polipéptidos modulares separados será contigua y se ensamblará y cribará de acuerdo con los métodos descritos en la presente para construcciones polipeptídicas modulares únicas.

La región de codificación contendrá módulos variables y módulos no variable, donde si una parte particular de un polipéptido modular sintético es variable o no variable dependerá del uso previsto de la biblioteca. Los módulos variables de la región de codificación son generalmente esos módulos que se están analizando de forma individual o combinatoria, para una propiedad funcional y/o influencia en un fenotipo de interés. En general, los módulos variables se asociarán con un código de barras que identifica un módulo y los módulos no variables no se asociarán a un código de barras. Cualquier módulo puede servir como un módulo variable o uno no variable dependiendo de la construcción de la biblioteca particular y/o la pantalla con el cual se asocia la biblioteca.

Como ejemplo no taxativo, en determinadas modalidades, cuando la región de codificación codifica un receptor de antígenos quiméricos (CAR), cualquier módulo del CAR puede servir como un módulo variable dependiendo de la actividad de CAR que se esté analizando, lo que incluye, de modo no taxativo, el dominio extracelular, el dominio coregulador o el dominio de señalización primario. Por ejemplo, la figura 11 ilustra un único miembro de una biblioteca de CAR donde cada miembro de la biblioteca contiene un dominio extracelular, un dominio coregulador y un dominio de señalización primario y proporciona ejemplos no taxativos de casos en los que cada dominio puede servir como un módulo variable.

En algunos casos, el dominio extracelular puede ser un módulo variable, por ejemplo, en el que el direccionamiento de antígenos es de interés, en el que la resistencia de la interacción entre el antígeno y el dominio extracelular son de interés, etc. En algunos casos, el dominio coregulador puede ser un módulo variable, por ejemplo, en el que se deben cribar dominios correguladores individuales o combinaciones de estos para determinar la comodulación de la actividad funcional. En algunos casos, el dominio de señalización primario puede ser un módulo variable, por ejemplo, en el que se deben cribar diferentes actividades de señalización intracelulares.

Como ejemplo no taxativo, en algunos casos, un polipéptido modular sintético codificado puede ser un polipéptido receptor Notch quimérico que tiene un dominio de unión extracelular, un dominio de polipéptidos receptores Notch escindibles (que incluye un sitio de escisión accionado por la unión) y un dominio intracelular. Los polipéptidos receptores Notch quiméricos útiles, y dominios de estos, incluyen, de modo no taxativo, por ejemplo, aquellos que se describen en la solicitud PCT estadounidense n.° US2016/019188. En algunos casos, uno o más dominios del polipéptido receptor Notch quimérico sirve como un dominio variable que incluye, de modo no taxativo, por ejemplo, el dominio de unión extracelular, el dominio de polipéptidos receptores Notch, el dominio intracelular, el dominio de unión extracelular y el dominio de polipéptidos receptores Notch, el dominio de unión extracelular y el dominio intracelular o el dominio de polipéptidos receptores Notch y el dominio intracelular.

Los módulos no variables incluidos en la región de codificación se seleccionarán cuando se desee que todos miembros de la biblioteca tengan la función del módulo no variable, es decir, cuando la función suministrada por el módulo no variable se mantenga constante a lo largo de todos los miembros de la biblioteca. Como ejemplos no taxativos, en algunos casos, el dominio extracelular, el dominio coregulador o el dominio de señalización primario, como se describió anteriormente, pueden ser módulos no variables en los que se desea o un ensayo exige que todos los miembros de la biblioteca tengan la función del dominio extracelular, el dominio coregulador o el dominio de señalización primario. Como ejemplos no taxativos, en algunos casos, el dominio de unión extracelular, el dominio de polipéptidos receptores Notch escindibles o el dominio intracelular, como se describió anteriormente, pueden ser módulos no variables en los que se desea o un ensayo exige que todos los miembros de la biblioteca tengan la función del dominio de unión extracelular, el dominio de polipéptidos receptores Notch escindibles o el dominio intracelular.

Dependiendo de los módulos particulares utilizados y el ensayo de cribado para el cual se utiliza la biblioteca en cuestión, la región de codificación de cada miembro de la biblioteca puede codificar cualquier combinación de módulos variables y no variables, es decir que la región de codificación más simple codifica solamente un módulo variable. En algunos casos, cada miembro de la biblioteca individual, por ejemplo, cada vector, en el cual se inserta un módulo variable puede contener, antes de la inserción del módulo variable, una o más secuencias de codificación de manera que tras la inserción del módulo variable la región de codificación comprende el módulo variable y las secuencias de codificación preexistentes, las cuales pueden comprender o no un módulo no variable y/o una secuencia de codificación sin módulo. En algunos casos, dicha secuencia de codificación preexistente que está presente en todos los miembros de la biblioteca se puede denominar “dominio constante”.

En algunos casos, la región de codificación puede codificar dos o más módulos variables que incluyen, de modo no taxativo, por ejemplo, tres o más módulos variables, cuatro o más módulos variables, cinco o más módulos variables, seis o más módulos variables, siete o más módulos variables, ocho o más módulos variables, etc. En algunos casos, la región de codificación puede codificar dos o más módulos no variables que incluyen, de modo no taxativo, por ejemplo, tres o más módulos no variables, cuatro o más módulos no variables, cinco o más módulos no variables, seis o más módulos no variables, siete o más módulos no variables, ocho o más módulos no variables, etc. La cantidad de módulos variables y no variables dentro de una región de codificación puede limitarse por restricciones prácticas de la clonación de secuencia de codificación y construcción de bibliotecas.

La cantidad de miembros de biblioteca únicos que codifican polipéptidos modulares sintéticos únicos dependerá de la cantidad de módulos variables utilizados en la construcción de la biblioteca y la complejidad prevista general de la biblioteca. En algunas modalidades en la presente, la complejidad de la biblioteca se puede describir en términos de dimensionalidad de la biblioteca donde la dimensionalidad de una biblioteca se correlaciona con la cantidad de secuencias de codificación de módulo variable presentes en la región de codificación de los miembros de la biblioteca. Por lo tanto, una biblioteca unidimensional contiene una secuencia de codificación de módulo variable en cada región de codificación de cada miembro de la biblioteca, una biblioteca bidimensional contiene dos secuencias de codificación de módulo variable en cada región de codificación de cada miembro de la biblioteca, una biblioteca tridimensional contiene tres secuencias de codificación de módulo variable en cada región de codificación de cada miembro de la biblioteca, una biblioteca de cuatro dimensiones contiene cuatro secuencias de codificación de módulo variable en cada región de codificación de cada miembro de la biblioteca, y así sucesivamente.

La dimensionalidad de una biblioteca no necesita ser uniforme en toda la biblioteca completa y, por lo tanto, en algunos casos una biblioteca puede tener una dimensionalidad mezclada. Por “dimensionalidad mezclada” se entiende que la biblioteca contiene miembros de más de una dimensión, como se describió anteriormente. Por ejemplo, una biblioteca puede ser parcialmente unidimensional, parcialmente bidimensional, parcialmente tridimensional, etc. Dichas bibliotecas con dimensionalidad mezclada pueden ser bibliotecas unidimensionales o bidimensionales mezcladas, bibliotecas bidimensionales o tridimensionales, bibliotecas unidimensionales, bidimensionales y tridimensionales, y así sucesivamente. Dichas descripciones de bibliotecas con dimensiones mezcladas no pretenden ser taxativas y el experto en la técnica comprenderá fácilmente que la variedad de bibliotecas con dimensiones mezcladas que se incluyen en la presente se extiende más allá de aquellas que se describieron explícitamente.

Como tal, variará la cantidad de miembros únicos de la biblioteca que codifican los polipéptidos modulares sintéticos y será el producto de la dimensionalidad de la biblioteca y la cantidad de módulos utilizados en la construcción de la biblioteca. Por ejemplo, una biblioteca unidimensional construida con 20 módulos variables únicos contendrá 20 miembros únicos de la biblioteca. Una biblioteca bidimensional construida con 20 módulos variables únicos contendrá 20 por 20 miembros únicos de la biblioteca (es decir, 400). Una biblioteca tridimensional construida con 20 módulos variables únicos contendrá 20 por 20 por 20 miembros únicos de la biblioteca (es decir, 8000). En algunos casos, un miembro único de la biblioteca de una biblioteca de múltiples dimensiones puede contener dos o más secuencias que codifican el mismo módulo variable.

En algunos casos, cuando cada miembro de la biblioteca tiene dos o más módulos variables, los módulos pueden ser específicos para la posición, lo que significa que un subconjunto de módulos variables puede colocarse solamente en una ubicación particular dentro del polipéptido modular sintético con respecto a los otros módulos variables. Por ejemplo, un polipéptido modular sintético que tiene dos módulos variables puede contener un primer conjunto y un segundo conjunto de módulos variables donde los módulos del primer conjunto se encuentran siempre en una ubicación particular con respecto a los módulos del segundo conjunto. Como tal, una biblioteca bidimensional construida, de una manera específica para la posición, de 30 módulos variables únicos, que incluye un primer conjunto de 10 módulos variables únicos y un segundo conjunto de 20 módulos variables únicos, puede contener 10 por 20 (es decir, 200) miembros únicos de la biblioteca.

Un experto en la técnica entenderá fácilmente la gran variabilidad de las configuraciones de bibliotecas dada la dimensionalidad variable descrita anteriormente y las cantidades variables de módulos que se pueden combinar, específicamente para la posición o no, en la configuración de bibliotecas de la presente descripción. Como tal, la cantidad total de miembros únicos de la biblioteca variará en gran medida y puede variar de menos de 20 a 50,000 o más, lo que incluye de modo no taxativo, por ejemplo, 20 o más, 30 o más, 40 o más, 50 o más, 60 o más, 70 o más, 80 o más, 90 o más, 100 o más, 150 o más, 200 o más, 250 o más, 300 o más, 350 o más, 400 o más, 450 o más, 500 o más, 550 o más, 600 o más, 650 o más, 700 o más, 750 o más, 800 o más, 850 o más, 900 o más, 950 o más, 1,000 o más, 1,500 o más, 2,000 o más, 2,500 o más, 3,000 o más, 3,500 o más, 4,000 o más, 4,500 o más, 5,000 o más, 5,500 o más, 6,000 o más, 6,500 o más, 7,000 o más, 7,500 o más, 8,000 o más, 8,500 o más, 9,000 o más, 9,500 o más, 10,000 o más, 20,000 o más, 30,000 o más, 40,000 o más, 50,000 o más, etc.

En los casos donde las bibliotecas de múltiples dimensiones se construyen en un ensamblaje agrupado, la cantidad total de miembros únicos de la biblioteca dentro del conjunto puede variar en gran medida y puede variar en menos de 20 a 50,000 o más, como se describió anteriormente, y a grados elevados de diversidad que incluye, de modo no taxativo, por ejemplo, 105 o más, 106 o más, 107 o más, 108 o más, o 109 o más.

Los miembros únicos de las bibliotecas descritos en la presente no necesitan ser organizados físicamente a efectos de la construcción o cribado de bibliotecas. Como se describirá más detalladamente a continuación, el ensamblaje combinatorio de componentes de ácido nucleico que codifican cada polipéptido modular sintético y el coensamblaje del código de barras de múltiples unidades de una manera que registra la identidad y orientación de los módulos ensamblados, permite la síntesis de un solo paso y el cribado agrupado de las bibliotecas descritas en la presente. Como tal, la biblioteca, y los múltiples miembros únicos de la biblioteca pueden estar presentes en una única solución adecuada y/o presentes en un único recipiente adecuado.

Polipéptidos modulares sintéticos

Se proporcionan bibliotecas de polipéptidos modulares sintéticos y polipéptidos modulares sintéticos que codifican ácidos nucleicos. Por “polipéptido modular” se entiende una proteína funcional que tiene dos o más componentes modulares unidos de forma operativa de forma que los módulos se unen de forma física y funcionan juntos en una única molécula de polipéptidos. Los módulos de un polipéptido modular pueden tener funciones o actividades relacionadas o no relacionadas. En muchas modalidades, al menos dos de los compuestos modulares de polipéptidos modulares sintéticos derivan de las proteínas separadas. Los módulos que provienen de “proteínas separadas” pueden provenir de distintas proteínas que están relacionadas funcionalmente o no están relacionadas funcionalmente y pueden provenir de distintas especies de organismo, la misma especie de organismo, diferentes proteínas ortólogas, diferentes proteínas parálogas, etc.

En determinadas modalidades, los miembros individuales de la biblioteca de una biblioteca de polipéptidos modulares sintéticos, como se describe en la presente, incluirán, como mínimo, un módulo que es un miembro de un par de unión específica (por ejemplo, un par de unión de antígeno-anticuerpo, un par de unión ligando-receptor, etc.) y un módulo funcional o de señalización que funciona para inducir una respuesta celular. En algunos casos, un miembro de un par de unión específica puede denominarse en la presente como dominio extracelular o dominio de reconocimiento extracelular. En algunos casos, un miembro de un par de unión específica puede hacer referencia a una proteína implicada en una interacción de señalización de proteínas-proteínas o una proteína implicada en una interacción de señalización de proteínas-lípidos.

En muchas modalidades, un miembro de un par de unión específica que puede encontrar utilidad en los miembros individuales de la biblioteca puede incluir un dominio de unión al antígeno. Un dominio de unión al antígeno adecuado para usar en los miembros de la biblioteca de la presente descripción puede ser cualquier polipéptido de unión al antígeno, de los cuales se conoce una gran variedad en la técnica. En algunos casos, el dominio de unión al antígeno es un Fv de cadena simple (scFv). Otros dominios de reconocimiento basados en anticuerpos VHH cAb (dominios variables de anticuerpos de camélidos) y versiones humanizadas, VH IgNAR (dominios variables de anticuerpos de tiburón) y versiones humanizadas, VH sdAb (dominios variables de anticuerpos de dominio simple) y dominios variables de anticuerpos “camelizados” son adecuados para su uso. En algunos casos, los dominios de reconocimiento basados en receptores de linfocitos T (TCR) tales como TCR de cadena simple (scTv, TCR de dos dominios de cadena simple que contiene VaVp) también son adecuados para su uso.

Un dominio de unión al antígeno adecuado para usar en los miembros de la biblioteca de la presente descripción puede tener varias especificidades de unión al antígeno. En algunos casos, el dominio de unión al antígeno es específico para un epítopo presente en un antígeno que se expresa mediante (se sintetiza mediante) una célula cancerosa, es decir, un antígeno asociado a células cancerosas. El antígeno asociado células cancerosas puede ser un antígeno asociado a, por ejemplo, una célula de cáncer de mama, un linfoma de células B, una célula de linfoma de Hodgkin, una célula de cáncer de ovarios, una célula de cáncer de próstata, un mesotelioma, una célula de cáncer de pulmón (por ejemplo, una célula de cáncer de pulmón microcítico), una célula de linfoma de células B no Hodgkin (B-NHL), una célula de cáncer de ovarios, una célula de cáncer de próstata, un mesotelioma, una célula de cáncer de pulmón (por ejemplo, una célula de cáncer de pulmón microcítico), una célula de melanoma, una célula de leucemia linfocítica crónica, una célula de leucemia linfocítica aguda, una célula de neuroblastoma, un glioma, una glioblastoma, un meduloblastoma, una célula de cáncer colorrectal, etc. Un antígeno asociado a células cancerosas también puede ser expresado por una célula no cancerosa.

Los ejemplos no taxativos de antígenos al cual se puede unir un dominio de unión al antígeno de un CAR de la presente incluye, por ejemplo, CD19, CD20, CD38, CD30, Her2/neu, ERBB2, CA125, MUC-1, antígeno de membrana específico de la próstata (PSMA, por sus siglas en inglés), molécula de adhesión superficial CD44, mesotelina, antígeno carcinoembrionario (CEA, por sus siglas en inglés), receptor del factor de crecimiento epidérmico (EGFR, por sus siglas en inglés), EGFRvIII, receptor del factor de crecimiento del endotelio vascular 2 (VEGFR2, por sus siglas en inglés), antígeno asociado a melanoma de alto peso molecular (HMW-MAA, por sus siglas en inglés), MAGE-A1, IL-13R-a2, GD2, y similares.

En algunos casos, un miembro de un par de unión específica adecuado para usar en los miembros de la biblioteca de una biblioteca en cuestión es un ligando para un receptor. Los ligandos incluyen, de modo no taxativo, citocinas (por ejemplo, IL-13, etc.); factores de crecimiento (por ejemplo, heregulina; factor de crecimiento del endotelio vascular (VEGF); y similares); un péptido de unión a integrina (por ejemplo, un péptido que comprende la secuencia Arg-Gly-Asp); ligandos Notch (por ejemplo, Delta, Serrate, similar a Delta, X-Delta, irregular, etc. y homólogos y ortólogos de estos) y similares.

Cuando el miembro de un par de unión específica en miembros de la biblioteca de la biblioteca en cuestión es un ligando, el miembro de la biblioteca específica puede activarse en presencia de un segundo miembro del par de unión específica, donde el segundo miembro del par de unión específica es un receptor para el ligando. Por ejemplo, cuando el ligando es VEGF, el segundo miembro del par de unión específica puede ser un receptor de VEGF, que incluye un receptor de VEGF soluble. En otro ejemplo, cuando el ligando es un ligando Notch, el segundo miembro del par de unión específica puede ser un receptor Notch, parte de unión de ligando de este. Como otro ejemplo, cuando el ligando es heregulina, el segundo miembro del par de unión específica puede ser Her2.

En algunos casos, el miembro de un par de unión específica que está incluido en los miembros de una biblioteca en cuestión es un receptor, por ejemplo, un receptor para un ligando, un correceptor, etc. El receptor puede ser un fragmento de unión al ligando de un receptor. Los receptores adecuados incluyen, de modo no taxativo, un receptor de factor de crecimiento (por ejemplo, un receptor de VEGF); una subfamilia K de receptores similares a lectina de linfocitos citolíticos, polipéptido miembro 1 (NKG2D) (receptor para MICA, MICB y ULB6); un receptor de citocina (por ejemplo, un receptor de IL-13; un receptor de IL-2; etc.); Her2; CD27; un receptor de citotoxicidad natural (NCR, por sus siglas en inglés) (por ejemplo, NKP30 (NCR3/CD337) polipéptido (receptor para la transcripción 3 asociada con HLA-B (BAT3) y b 7-H6); etc.); un receptor Notch (por ejemplo, NOTCH1 humano, NOTCH2 humano, NOTCH3 humano, NOTCH4 humano, etc.) y similares.

Los pares de dímeros también se encuentran comprendidos dentro de los compañeros de unión específica. Los miembros únicos de pares de dímeros son adecuados para usar en un miembro de la biblioteca de la biblioteca en cuestión e incluyen, de modo no taxativo, pares de unión al dimerizador. Los pares de unión al dimerizador se unen a un sitio diferente de la misma molécula (denominado en la presente “dimerizador”). En presencia de un dimerizador, los dos miembros del par de unión al dimerizador se unen a un sitio diferente del dimerizador y, por lo tanto, y por lo tanto se aproximan entre sí. En algunas modalidades, la unión al dimerizador es reversible. En algunas modalidades, la unión al dimerizador es irreversible. En algunas modalidades, la unión al dimerizador es no covalente. En algunas modalidades, la unión al dimerizador es covalente.

Otros pares de dímeros adecuados para utilizarse incluyen pares de unión al dimerizador que se dimerizan tras la unión de un primer miembro de un par de dímeros a un agente dimerizante, donde el agente dimerizante induce un cambio conformacional en el primer miembro del par de dímeros, y donde el cambio conformacional permite que el primer miembro del par de dímeros se una (de manera covalente o no covalente) a un segundo miembro del par de dímeros. Otros pares de dímeros adecuados para utilizarse incluyen pares de dímeros en los cuales la exposición a la luz (por ejemplo, luz azul) induce la dimerización del par de dímeros.

En algunos casos, un miembro de un par de unión específica puede incluir una proteína implicada en una interacción de señalización de proteínas-proteínas o una interacción de señalización de proteínas-lípidos y, por lo tanto, los polipéptidos modulares sintéticos, como se describe en la presente, pueden incluir uno o más dominios de interacción de proteínas-proteínas o dominios de interacción de proteínas-lípidos. Dichos dominios de interacción de proteínas proteínas o dominios de interacción de proteínas-lípidos incluyen, de modo no taxativo, por ejemplo, un dominio 14-3 3 (por ejemplo, como se encuentra presente en PDB (Banco de Datos de Proteínas RCSB disponible en línea en www(punto)rcsb(punto)org) estructura 2B05), un dominio del factor de despolimerización de actina (ADF, por sus siglas en inglés) (por ejemplo, como se encuentra presente en la estructura 1CFY del PDB), un dominio ANK (por ejemplo, como se encuentra presente en la estructura 1SW6 del PDB), un dominio ANTH (homología de extremo N AP180) (por ejemplo, como se encuentra presente en la estructura 5AHV del PDB), un dominio Armadillo (ARM) (por ejemplo, como se encuentra presente en la estructura 1BK6 del PDB), un dominio BAR (Bin/Amfifisina/Rvs) (por ejemplo, como se encuentra presente en la estructura 1I4D del PDB), un domino BEACH (beige y CHS) (por ejemplo, como se encuentra presente en la estructura 1MI1 del PDB), un dominio BH (homología de Bcl-2) (BH1, BH2, BH3 y BH4) (por ejemplo, como se encuentra presente en la estructura 1BXL del PDB), un dominio de repetición IAP del baculovirus (BIR) (por ejemplo, como se encuentra presente en la estructura 1G73 del PDB), un dominio BRCT (extremo C de BRCA1) (por ejemplo, como se encuentra presente en la estructura 1T29 del PDB), un bromodominio (por ejemplo, como se encuentra presente en la estructura 1E6I del PDB), un dominio BTB (BR-C, ttk y bab) (por ejemplo, como se encuentra presente en la estructura 1R2B del PDB), un dominio C1 (por ejemplo, como se encuentra presente en la estructura 1PTQ del PDB), un dominio C2 (por ejemplo, como se encuentra presente en la estructura 1A25 del PDB), dominios de captación de caspasa (CARD) (por ejemplo, como se encuentra presente en la estructura 1CWW del PDB), un dominio de bobinas enrolladas (CC) (por ejemplo, como se encuentra presente en la estructura 1QEY del PDB), un dominio CALM (mieloide linfoide de ensamblaje de clatrina) (por ejemplo, como se encuentra presente en la estructura 1HFA del PDB), un dominio de homología de calponina (CH) (por ejemplo, como se encuentra presente en la estructura 1BKR del PDB), un dominio modificador de organización de cromatina (cromo) (por ejemplo, como se encuentra presente en la estructura 1KNA del PDB), un dominio CUE (por ejemplo, como se encuentra presente en la estructura 1OTR del PDB), un dominio de muerte (DD) (por ejemplo, como se encuentra presente en la estructura 1FAD del PDB), un dominio efector de muerte (DED) (por ejemplo, como se encuentra presente en la estructura 1A1W del PDB), un dominio de EGL-10 y pleckstrina (DEP) (por ejemplo, como se encuentra presente en la estructura 1FSH del PDB), un dominio de homología Dbl (DH) (por ejemplo, como se encuentra presente en la estructura 1FOE del PDB), un dominio en mano EF (EFh) (por ejemplo, como se encuentra presente en la estructura 2PMY del PDB), un dominio de homología- Eps15 (EH) (por ejemplo, como se encuentra presente en la estructura 1EH2 del PDB), un dominio de homología de extremo NH2 de epsina (ENTH) (por ejemplo, como se encuentra presente en la estructura 1EDU del PDB), un dominio 1 de homología Ena/Vasp (EVH1) (por ejemplo, como se encuentra presente en la estructura 1QC6 del PDB), un dominio F-box por ejemplo, como se encuentra presente en la estructura 1FS1 del PDB), un dominio FERM (Band 4.1, Ezrina, Radixina, Moesina) (por ejemplo, como se encuentra presente en la estructura 1GC6 del PDB), un dominio FF (por ejemplo, como se encuentra presente en la estructura 1UZC del PDB), un dominio de homología-2 de formina (FH2) (por ejemplo, como se encuentra presente en la estructura 1UX4 del PDB), un dominio asociado a Forkhead (FHA) (por ejemplo, como se encuentra presente en la estructura 1G6G del Pd B), un dominio FYVE (Fab-1, YGL023, Vps27 y EEA1) (por ejemplo, como se encuentra presente en la estructura 1VFY del PDB), un dominio GAT (GGA y Tom1) (por ejemplo, como se encuentra presente en la estructura 1O3X del PDB), un dominio de homología de gelsolina (GEL) (por ejemplo, como se encuentra presente en la estructura 1H1V del PDB), un dominio GLUE (unión de ubiquitina similar a GRAM en EAP45) (por ejemplo, como se encuentra presente en la estructura 2CAY del PDB), un dominio GRAM (de las glucosiltransferasas, activadores GTPase similar a Rab y miotubularinas) (por ejemplo, como se encuentra presente en la estructura 1LW3 del PDB), un dominio GRIP (por ejemplo, como se encuentra presente en la estructura 1UPT del PDB), un dominio de glicina-tirosina-fenilalanina (GYF) (por ejemplo, como se encuentra presente en la estructura 1GYF del PDB), un dominio HEAT (Huntington, factor 3 de elongación, PR65/A, TOR) (por ejemplo, como se encuentra presente en la estructura 1IBR del PDB), un dominio homólogo con respecto al extremo carboxilo E6-AP (HECT) (por ejemplo, como se encuentra presente en la estructura 1C4Z del PDB), un dominio IQ (por ejemplo, como se encuentra presente en la estructura 1N2D del PDB), un dominio LIM (Lin-1, Isl-1 y Mec-3) (por ejemplo, como se encuentra presente en la estructura 1QLI del PDB), un dominio de repeticiones rico en leucinas (LRR) (por ejemplo, como se encuentra presente en la estructura 1YRG del PDB), un dominio de tumor cerebral maligno (MBT) (por ejemplo, como se encuentra presente en la estructura 1OYX del PDB), un dominio MH1 (homología 1 Mad) (por ejemplo, como se encuentra presente en la estructura 1OZJ del PDB), un dominio MH2 (homología 2 Mad) (por ejemplo, como se encuentra presente en la estructura 1DEV del PDB), un dominio MIU (motivo que interactúa con la ubiquitina) (por ejemplo, como se encuentra presente en la estructura 2C7M del PDB), un dominio NZF (dedo de cinc Npl4) (por ejemplo, como se encuentra presente en la estructura 1Q5W del PDB), un dominio PAS (Per-ARNT-Sim) (por ejemplo, como se encuentra presente en la estructura 1P97 del PDB), un dominio Phox y Bem1 (PB1) (por ejemplo, como se encuentra presente en la estructura 1IPG del PDB), un dominio PDZ (densidad postsináptica 95, PSD-85; discos grandes, Dlg; uniones ocluyentes-1, ZO-1) (por ejemplo, como se encuentra presente en la estructura 1BE9 del PDB), un dominio de homología de pleckstrina (PH) (por ejemplo, como se encuentra presente en la estructura 1MAI del PDB), un dominio Polo-Box (por ejemplo, como se encuentra presente en la estructura 1Q4K del PDB), un dominio de unión a la fosfotirosina (p Tb ) (por ejemplo, como se encuentra presente en la estructura 1SHC del PDB), un dominio Pumilio/Puf (PUF) (por ejemplo, como se encuentra presente en la estructura 1M8W del PDB), un dominio PWWP (por ejemplo, como se encuentra presente en la estructura 1KHC del PDB), un dominio de homología Phox (PX) (por ejemplo, como se encuentra presente en la estructura 1H6H del PDB), un dominio RGS (regulador de señalización de proteína G) (por ejemplo, como se encuentra presente en la estructura 1AGR del PDB), un dominio RING (por ejemplo, como se encuentra presente en la estructura 1FBV del PDB), un dominio SAM (motivo estéril alfa) (por ejemplo, como se encuentra presente en la estructura 1B0X del PDB), un dominio cromo sombreado (SC) (por ejemplo, como se encuentra presente en la estructura 1E0B del PDB), un dominio Src-homología 2 (SH2) (por ejemplo, como se encuentra presente en la estructura 1SHB del PDB), un dominio Src-homología 3 (SH3) (por ejemplo, como se encuentra presente en la estructura 3SEM del PDB), un dominio SOCS (supresores de señalización de citocinas) (por ejemplo, como se encuentra presente en la estructura 1VCB del PDB), un dominio SPRY (por ejemplo, como se encuentra presente en la estructura 2AFJ del PDB), un dominio de transferencia de lípidos que se relaciona con la proteína reguladora aguda esteroidogénica (StAR) (START) (por ejemplo, como se encuentra presente en la estructura 1EM2 del PDB), un dominio SWIRM (por ejemplo, como se encuentra presente en la estructura 2AQF del PDB), un dominio del receptor Toll/Il-1 (TIR) (por ejemplo, como se encuentra presente en la estructura 1FYV del PDB), un dominio de repetición de tetratricopéptidos (TPR) (por ejemplo, como se encuentra presente en la estructura 1ELW del PDB), un dominio TRAF (factores asociados con receptor del factor de necrosis tumoral (TNF) (por ejemplo, como se encuentra presente en la estructura 1F3V del PDB), un domino tSNARE (SNARE (receptor de proteína de acoplamiento NSF soluble (SNAP)) (por ejemplo, como se encuentra presente en la estructura 1SFC del PDB), un dominio Tubby (por ejemplo, como se encuentra presente en la estructura 1I7E del PDB), un dominio TUDOR (por ejemplo, como se encuentra presente en la estructura 2GFA del PDB), un dominio asociado a la ubiquitina (UBA) (por ejemplo, como se encuentra presente en la estructura 1IFY del PDB), un dominio UEV (variante E2 de ubiquitina) (por ejemplo, como se encuentra presente en la estructura 1S1Q del PDB), un dominio de motivo que interactúa con la ubiquitina (UIM) (por ejemplo, como se encuentra presente en la estructura 1Q0W del PDB), un dominio VHL (por ejemplo, como se encuentra presente en la estructura 1LM8 del PDB), un dominio VHS (Vps27p, Hrs y STAM) (por ejemplo, como se encuentra presente en la estructura 1ELK del PDB), un dominio WD40 (por ejemplo, como se encuentra presente en la estructura 1NEX del PDB), un dominio WW (por ejemplo, como se encuentra presente en la estructura 1I6C del PDB) y similares.

Los miembros individuales de la biblioteca de la biblioteca en cuestión, como se describe en la presente, pueden incluir un dominio modulador. Los dominios moduladores incluyen dominios con funciones estimuladoras e inhibidoras y dominios que modulan la activación y/o funciones inhibidoras de otros dominios de señalización “corriente arriba”. En algunos casos, los dominios moduladores incluyen dominios coestimuladores. En algunos casos, los dominios moduladores incluyen dominios coinhibidores.

Un dominio modulador adecuado para la inclusión en miembros de la biblioteca de una biblioteca en cuestión puede ser cualquier unidad funcional de un polipéptido tan corta como un motivo lineal de 3 aminoácidos y tan larga como una proteína completa, cuando solamente se restringe el tamaño del dominio modulador considerando que el dominio debe ser lo suficientemente largo como para conservar su función y lo suficientemente pequeño para que sea compatible con el método de ensamblaje deseado. Por consiguiente, un dominio modulador puede variar en cuanto a su tamaño entre 3 aminoácidos de longitud y 1000 aminoácidos o más y, en algunos casos, pueden tener una longitud entre aproximadamente 30 aminoácidos y aproximadamente 70 aminoácidos (aa), por ejemplo, un dominio modulador puede tener una longitud de entre aproximadamente 30 aa y aproximadamente 35 aa, entre aproximadamente 35 aa y aproximadamente 40 aa, entre aproximadamente 40 aa y aproximadamente 45 aa, entre aproximadamente 45 aa y aproximadamente 50 aa, entre aproximadamente 50 aa y aproximadamente 55 aa, entre aproximadamente 55 aa y aproximadamente 60 aa, entre aproximadamente 60 aa y aproximadamente 65 aa, o entre aproximadamente 65 aa y aproximadamente 70 aa. En otros casos, el dominio modulador puede tener una longitud entre aproximadamente 70 aa y aproximadamente 100 aa, entre aproximadamente 100 aa y aproximadamente 200 aa o mayor que 200 aa.

En algunos casos, los “dominios coestimuladores” se utilizan en miembros individuales de biblioteca de una biblioteca de la presente descripción. Coestimulación hace referencia generalmente a un mecanismo de activación no específico secundario a través del cual se propaga una simulación específica primaria. Los ejemplos de coestimulación incluyen la coestimulación de linfocitos T no específicos después de la señalización específica para el antígeno a través del receptor de linfocitos T y la coestimulación de linfocitos T no específica para el antígeno después de la señalización a través del receptor de linfocitos B. La coestimulación, por ejemplo, la coestimulación de linfocitos T y los factores implicados se describieron en Chen & Flies. Nat Rev Immunol (2013) 13(4):227-42. Los dominios coestimuladores son generalmente polipéptidos que derivan de receptores. En algunas modalidades, los dominios coestimuladores se homodimerizan. Un dominio coestimulador de la presente puede ser una parte intracelular de una proteína transmembrana (es decir, el dominio coestimulador puede derivar de una proteína transmembrana). Los ejemplos no taxativos de polipéptidos coestimuladores adecuados incluyen, de modo no taxativo, 4-1BB (CD137), c D28, ICOS, OX-40, BTLA, CD27, CD30, GITR y HVEM. En algunos casos, un dominio estimulador, por ejemplo, como se utiliza en un miembro de la biblioteca de la presente descripción puede incluir un dominio coestimulador que se enumera en la Tabla 1. En algunos casos, un dominio coestimulador de un miembro individual de una biblioteca comprende una secuencia de aminoácidos que tiene al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 %, o 100 % de identidad de secuencia de aminoácidos con respecto a un dominio coestimulador que se describe en la presente.

En algunos casos, los “dominios coinhibidores” se utilizan en miembros individuales de biblioteca de una biblioteca de la presente descripción. Dichos dominios coinhibidores son generalmente polipéptidos que derivan de receptores. La coinhibición hace referencia generalmente a la inhibición secundaria de mecanismos de activación específicos para antígenos primarios que previene la coestimulación. La coinhibición, por ejemplo, la coinhibición de linfocitos T y los factores implicados se describieron en Chen & Flies. Nat Rev Immunol (2013) 13(4):227-42 y Thaventhiran et ál. J Clin Cell Immunol (2012) S12, cuyas descripciones se incorporan a la presente mediante esta referencia en su totalidad.

En algunas modalidades, los dominios coinhibidores se homodimerizan. Un dominio coinhibidor en cuestión puede ser una parte intracelular de una proteína transmembrana (es decir, el dominio coinhibidor puede derivar de una proteína transmembrana). Los ejemplos no taxativos de polipéptidos coinhibidores adecuados incluyen, de modo no taxativo, CTLA-4 y PD-1. En algunos casos, un dominio coinhibidor, por ejemplo, como se utiliza en un miembro de la biblioteca de la presente descripción puede incluir un dominio coinhibidor que se enumera en la Tabla 1. En algunos casos, un dominio coestimulador de un miembro individual de una biblioteca comprende una secuencia de aminoácidos que tiene al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 %, o 100 % de identidad de secuencia de aminoácidos con respecto a un dominio coestimulador que se describe en la presente.

En algunos casos, los miembros individuales de biblioteca de una biblioteca de polipéptidos modulares sintéticos pueden incluir un módulo de dominio de señalización intracelular. Los dominios de señalización intracelular adecuados para usar como módulos de la biblioteca presente descripción incluyen cualquier dominio de señalización deseado que proporcione una señal perceptible y detectable (por ejemplo, producción aumentada de una o más citocinas por parte de la célula; cambio en la transcripción de un gen objetivo; cambio en la actividad de una proteína; cambio en el comportamiento celular, por ejemplo, muerte celular; proliferación celular; diferenciación celular; supervivencia celular; modulación de las respuestas a la señalización celular; etc.) en respuesta a la activación de un miembro individual de la biblioteca. El dominio de señalización intracelular puede o no unirse de forma covalente a los miembros individuales de la biblioteca, por ejemplo, cuando todos los miembros de la biblioteca utilizan un dominio de señalización intracelular común, el dominio de señalización intracelular puede no unirse a los miembros de la biblioteca, por ejemplo, difundidos en el citoplasma.

En algunos casos, los miembros individuales de la biblioteca de una biblioteca en cuestión de la presente descripción incluirán un dominio transmembrana para la inserción en una membrana de célula eucariota. El dominio transmembrana puede estar presente en cualquier ubicación conveniente dentro de los miembros de la biblioteca, por ejemplo, en el extremo N con respecto a los componentes modulares de la biblioteca, en el extremo C con respecto a los componentes modulares de la biblioteca, interpuesto entre al menos dos componentes modulares de la biblioteca (por ejemplo, entre el dominio de unión al antígeno y el dominio coestimulador de los miembros de una biblioteca modular CAR), etc.

Cualquier dominio transmembrana (TM) que proporciona la inserción de un polipéptido dentro de la membrana celular de una célula eucariota (por ejemplo, de mamífero) es adecuada para su uso. Como ejemplo no taxativo, se puede utilizar la secuencia TM IYIw A p lAg TCGVLLLSLVITLYC (SEQ ID N.°: 1). Los ejemplos no taxativos adicionales de secuencias TM adecuadas incluyen: a) derivada de CD8 beta: LGLLVa Gv LVLLVs Lg VAIHLCC (SEQ ID N.^ 2); b) CD4 derivado: ALIVLGGVAGLLLFIGLGIFFCVRC (SEQ ID N N.o 3); c) CD3 zeta derivado: LCYLLDGILFIYGVILTALFLRV (SEQ ID N.o 4); d) CD28 derivado: WVLWVGGVLACYSLLVTVAFMFWV (SEQ ID N.o 5); e) CD134 (OX40) derivado: VAAILGLGLVLGLLGPLAILLALYLL (SEQ ID N.o 6); y f) CD7 derivado: ALPAALAVISFLLGLGLGVACVLA (SEQ ID N.o 7).

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más elementos modulares adicionales. Por ejemplo, en los casos donde la biblioteca es una biblioteca de receptores de antígenos quiméricos (CAR), los miembros individuales de la biblioteca se pueden configurar para que contengan uno o más componentes adicionales como se describe en, por ejemplo, la publicación de solicitud de patente PCT N^ WO2014/127261.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína de andamiaje de múltiples dominios. La expresión “proteínas de andamiaje”, tal como se utiliza en la presente, incluye proteínas de anclaje y proteínas adaptadoras. Dichas proteínas contienen múltiples dominios de unión que captan o anclan cada uno miembros específicos de una vía de señalización, por ejemplo, inmovilizándolos en complejos, ubicándolos dentro de una señalización de modulación o célula (por ejemplo, controlar la retroalimentación positiva y/o negativa, estabilizar los componentes de señalización activados a partir de la inactivación, etc.). Como tales, los dominios de proteínas de andamiaje de múltiples dominios y las proteínas de anclaje de múltiples dominios y las proteínas adaptadoras de múltiples dominios incluyen generalmente dominios de unión a miembros de la vía de señalización.

Los ejemplos no taxativos de proteínas de andamiaje y las vías dentro de las cuales estas funcionan, incluye, por ejemplo, andamiaje Ste5 de la vía de proteína cinasa activada por mitógenos (MAPK); proteínas de anclaje A-cinasa (AKAP) de la vía de señalización de la proteína cinasa A (PKA); supresor cinasa de Ras 1(KSR) de la vía MAPK; linfoma de linfocitos B 10 (BCL-10) de la vía cinasa de extremo N JUN (JNK) y la vía MAPK; proteína cinasa, cinasa 1 activada por mitógenos (MEKK1) de la vía JNK y la vía MAPK; AHNAK-1 de la vía de señalización del calcio; HOMER de la vía de señalización del calcio; proteínas Pellino de la vía de señalización inmunitaria innata; familia NLR, proteínas que contienen el dominio de pirina (NLRP) de la vía de señalización inmunitaria innata; homología 1 de discos grandes (DLG1) de la vía de señalización del receptor de linfocitos T; Espinofilina de la vía de señalización de células dendríticas; y similares. Las proteínas de andamiaje incluyen también, de modo no taxativo, por ejemplo, aquellas que se describen en Buday & Tompa. FEBS Journal (2010) 277:4348-4355. En algunos casos, una proteína de andamiaje puede ser una proteína asociada con los términos de la Ontología Génica (OG) “andamiaje del complejo de proteínas” (OG:0032947), y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a proteínas cinasas, que incluyen secuencias, por ejemplo, en línea a www(punto)ebi(punto)ac(punto)uk/QuickGO.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína cinasa. Las proteínas cinasas son aquellas proteínas que funcionan mediante la adición de grupos fosfato a las proteínas sustrato para dirigir la actividad de la proteína sustrato, la asociación con otras proteínas y/o la localización. Las proteínas cinasas pueden incluir aquellas proteínas que se asocian con las expresiones de la OG “fosforilación de proteínas” (OG:0006468), “actividad de las proteínas cinasas” (OG:0004672), “actividad de la serina/treonina proteína cinasa” (OG:0004674), “actividad cinasa” (OG:0016301), y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a las proteínas cinasas que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO. Las proteínas cinasas contienen uno o más dominios cinasa que contienen la función catalítica de la proteína cinasa. Los dominios de proteínas cinasas se asocian con el identificador PF00069 de Pfam que se puede utilizar para recuperar los dominios de proteínas cinasas, esas proteínas contienen dominios de proteínas cinasas, que incluyen secuencias y estructuras en línea, por ejemplo, en pfam(punto)xfam(punto)org.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína fosfatasa. Las proteínas fosfatasas son aquellas proteínas que funcionan quitando un grupo fosfato del residuo de aminoácidos fosforilado de su proteína sustrato lo que da lugar a la desfosforilación para dirigir la actividad de la proteína sustrato y actuar en oposición a las proteínas cinasas. Las proteínas fosfatasas se agrupan en tres clases: fosfoproteína fosfatasas (por ejemplo, PPP1CA, PPP1CB, PPP1CC, PPP2CA, PPP2CB, PPP3CA, PPP3CB, PPP3CC, PPP4C, PPP5C, PPP6C, etc.), proteína Tyr fosfatasas (por ejemplo, CDC14A, CDC14B, CDC14C, CDKN3, PTEN, SSH1, SSH2, SSH3, etc.) y proteína fosfatasas de especificidad dual (por ejemplo, DUSP1, DUSP2, DUSP3, DUSP4, DUSP5, DUSP6, DUSP7, DUSP8, DUSP9, DUSP10, DUSP11, DUSP12, DUSP13, DUSP14, DUSP15, DUSP16, DUSP18, DUSP19, DUSP21, DUSP22, DUSP23, DUSP26, DUSP27, DUSP28, etc.), sin embargo, algunas proteína fosfatasas permanecen sin agrupar. Las proteínas fosfatasas pueden incluir esas proteínas que se asocian con la expresión de la OG “actividad de la fosfatasa” (OG:0016791), y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a proteínas fosfatasas, que incluyen secuencias, por ejemplo, en línea a www(punto)ebi(punto)ac(punto)uk/QuickGO. Las proteínas fosfatasas contienen uno o más dominios fosfatasas que contienen la función de desfosforilación de la proteína fosfatasa. Los dominios de proteínas fosfatasas se asocian con el identificador PF15698 de Pfam que se puede utilizar para recuperar los dominios de proteínas fosfatasas, esas proteínas contienen dominios de proteínas fosfatasas, que incluyen secuencias, por ejemplo, en pfam(punto)xfam(punto)org.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína del receptor de tirosina cinasa, también llamado receptor de tirosina cinasas (RTK). Los RTK son receptores de superficie celular que se asocian a membranas. Una subclase de proteína tirosina cinasas, RTK, los cuales funcionan a través de la unión de ligando extracelular y fosforilación posterior de la parte citoplasmática de la proteína. Los RTK se pueden dividir en familias que incluyen, por ejemplo, la familia del receptor del factor de crecimiento epidérmico, la familia del receptor del factor de crecimiento de fibroblastos (FGFR), la familia del receptor del factor de crecimiento endotelial vascular (VEGFR), la familia del receptor RET y la familia del receptor de dominio de discoidina (DDR). Los RTK pueden incluir aquellas proteínas que se asocian con las expresiones de la OG “actividad de la proteína tirosina cinasa del receptor de transmembrana” (OG:0004714), “vía de señalización de la proteína tirosina cinasa del receptor de transmembrana” (OG:0007169), y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a los RTK que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO. Los RTK contienen uno o más dominios de tirosina cinasa que contienen la función cinasa del r Tk . Los dominios cinasa de RTK se asocian con el identificador PF07714 de Pfam que se puede utilizar para recuperar los dominios cinasas de RTK y esos dominios cinasa de RTK que contienen proteínas, que incluyen secuencias y estructuras, por ejemplo, en pfam(punto)xfam(punto)org.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína cinasa lipídica. Las proteínas cinasas lipídicas fosforilan los lípidos celulares que dan lugar a la modulación de la reactividad del lípido, transducción de señales y/o localización de lípidos. Las cinasas lipídicas se pueden dividir en familias que incluyen, por ejemplo, fosfatidilinositol cinasas y esfingosina cinasas. Las cinasas lipídicas pueden incluir aquellas proteínas que se asocian con la expresión de la OG “actividad de la cinasa lipídica” (OG:0001727), “fosforilación de lípidos” (OG:0046834) y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a cinasas lipídicas, que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína fosfatasa lipídica. Las proteínas fosfatasas lipídicas desfosforilan los lípidos celulares, los cuales actúan para revertir la actividad de las cinasas lipídicas, lo cual da lugar a la modulación de la reactividad del lípido, transducción de señales y/o localización de lípidos. Las fosfatasas lipídicas pueden incluir aquellas proteínas que se asocian con la expresión de la OG “actividad de la fosfatasa lipídica” (OG:0042577), “desfosforilación de fosfolípidos” (OG:0046839) y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a fosfatasas lipídicas, que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína de la ubiquitinilasa. La proteína de la ubiquitinilasa son aquellas proteínas que median la modificación postraduccional de la ubiquitinación, el acoplamiento de la ubiquitina a una proteína sustrato. La ubiquitinación de una proteína sustrato puede dar lugar a la degradación de la proteína sustrato, la relocalización de la proteína sustrato, la modulación de la actividad de la proteína sustrato, la modulación de la interacción de proteína-proteína de la proteína sustrato, etc. Las ubiquitinilasas pueden incluir aquellas proteínas que se asocian con los términos de la OG “ubiquitinación de proteínas” (OG:0016567), “actividad de la proteína transferasaubiquitina” (OG:0004842), y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a las ubiquitinilasas, que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína de la desubiquitinilasa. La proteína de la desubiquitinilasa son aquellas proteínas que median la anulación de la ubiquitinación, la remoción de la ubiquitina de una proteína sustrato. La desubiquitinación de una proteína sustrato puede revertir los efectos de las ubiquitinilasas y prevenir la degradación de una proteína sustrato, revertir la ubiquitina que se asocia con la relocalización de la proteína sustrato, revertir la modulación asociada con la ubiquitina de la actividad de una proteína sustrato, revertir la modulación asociada con la ubiquitina de la interacción de proteína-proteína de una proteína sustrato, etc. Las desubiquitinilasas pueden incluir aquellas proteínas que se asocian con los términos de la OG “desubiquitinación de proteínas” (OG:0016579) y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a las desubiquitinilasas, que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína SUMOilasa. Las proteínas SUMOilasa son aquellas proteínas que median la modificación postraduccional de la SUMOilación, la adición de una proteína del modificador similar a la ubiquitina pequeña (SUMO) con una proteína sustrato. La SUMOilación puede modular diversas funciones de proteínas que incluyen la estabilidad de la proteína, el transporte nuclear-citosólico, regulación transcripcional, etc. Las SUMOilasas pueden incluir aquellas proteínas que se asocian con la expresión de la OG “sumoilación de proteínas” (OG:0016925), y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a la SUMOilación, que incluyen secuencias, por ejemplo, en línea a www(punto)ebi(punto)ac(punto)uk/QuickGO.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína acetilasa, también llamadas acetiltransferasas. Las acetiltransferasas son enzimas transferasa que catalizan la transferencia de un grupo acetilo a una proteína sustrato y están implicadas en la modulación transcripcional y epigenética. Las acetiltransferasas se pueden categorizar en grupos que incluye, por ejemplo, histona acetiltransferasas, colina acetiltransferasas, cloramfenicol acetiltransferasas, serotonina N-acetiltransferasas, NatA acetiltransferasas, NatB acetiltransferasas. Las acetiltransferasas pueden incluir aquellas proteínas que se asocian con la expresión de la OG “actividad de la acetiltransferasa” (OG:0016407), y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a las acetiltransferasas, que incluyen secuencias, por ejemplo, en línea a www(punto)ebi(punto)ac(punto)uk/QuickGO.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína deacetilasa. Las proteínas deactilasas revierten los efectos de las acetiltransferasas y quitan los grupos acetilo transferidos a una proteína sustrato y, por lo tanto, están implicadas además en la modulación transcripcional y epigenética. Las deactilasas incluyen, por ejemplo, histona deactilasas y sirtuinas. Las proteínas fosfatasas pueden incluir esas proteínas que se asocian con la expresión de la OG “actividad de la fosfatasa” (OG:0019213), y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a proteínas fosfatasas, que incluyen secuencias, por ejemplo, en línea a www(punto)ebi(punto)ac(punto)uk/QuickGO.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína metilasa, también llamadas metiltransferasas. Las metiltransferasas alquilan los sustratos sustrato (que incluyen sustratos de ácido nucleico y proteína) mediante transferencia de un grupo metilo al sustrato y están implicadas en la modulación transcripcional y epigenética. Las metiltransferasas se pueden categorizar en clases de acuerdo con su estructura que incluye, por ejemplo, la Clase I, Clase II, Clase III y se pueden agrupar de acuerdo con sus sustratos o modo de metilación que incluye, por ejemplo, proteína metiltransferasas, ADN metiltransferasas, metiltransferasas de productos naturales y metiltransferasas dependientes de no SAM. Las metiltransferasas pueden incluir aquellas proteínas que se asocian con la expresión de la OG “actividad de la ADN-metiltransferasa” (o G:0009008), “actividad de la histona metiltransferasa” (OG:0042054) y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a metiltransferasas, que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína demetilasa. Las demetilasas revierten los efectos de las metiltransferasas y catalizan la remoción de grupos metilo de sustratos (que incluyen sustratos de ácido nucleico y proteína) y, por lo tanto, están implicadas en la modulación transcripcional y epigenética. Las demetilasas pueden incluir aquellas proteínas que se asocian con la expresión de la OG “actividad de la demetilasa” (OG:0032451), “actividad de la ADN demetilasa” (OG:0035514), “actividad de la histona demetilasa” (OG:0032452) y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a demetilasas, que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína nucleasa. Las nucleasas catalizan la escisión de los enlaces fosfodiéster entre las subunidades de nucleótidos de sustratos de ácidos nucleicos. Las nucleasas se pueden subdividir en categorías no mutuamente exclusivas tales como endonucleasas y exonucleasas. Las nucleasas pueden incluir aquellas proteínas que se asocian con la expresión de la OG “actividad de la nucleasa” (OG:0004518), “actividad de la desoxirribonucleasa I” (OG:0004530), “actividad de la ribonucleasa híbrida ARN-ADN” (OG:0004523), “hidrólisis de enlace fosfodiéster de ácido nucleico” (OG:0090305), “actividad de la endonucleasa” (OG:0004519), “actividad de la exonucleasa” (OG:0004527) y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a nucleasas, que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína recombinasa. Las recombinasas catalizan las reacciones de intercambio de ácido nucleicos sentibles de forma direccional entre secuencias de sitio objetivo específicas para cada recombinasa que da lugar a la escisión/inserción, inversión, traslocación e intercambio de fragmentos de ácidos nucleicos. Los ejemplos de recombinasas incluyen, de modo no taxativo, recombinasa Cre, recombinasa Hin, recombinasa Tre, recombinasa FLP y similares. Las recombinasas pueden incluir aquellas proteínas que se asocian con la expresión de la OG “actividad de la recombinasa” (OG:0000150), “recombinación de ADN” (OG:0006310) y términos sinónimos, que se pueden utilizar para recuperar información que se refiere a recombinasas, que incluyen secuencias, por ejemplo, en línea en www(punto)ebi(punto)ac(punto)uk/QuickGO.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales pueden configurarse para que incluyan uno o más módulos de una proteína del factor de transcripción. Los factores de transcripción son aquellas proteínas que se unen a secuencias de ADN específicas y transcripción de control. Los factores de transcripción pueden ser activadores, que dan lugar a la regulación por incremento de la transcripción o represores que dan lugar a la regulación por disminución de la transcripción. Los factores de transcripción se pueden clasificar por la estructura de sus dominios de unión al ADN en superclases que incluyen, por ejemplo, factores de transcripción de dominio básico, factores de transcripción de dominio de unión al ADN que coordina cinc, factores de transcripción de hélice-giro-hélice, factores de transcripción de factores beta-andamiaje y aquellos factores de transcripción que no están incluidos en una de las superclases anteriores (véase, por ejemplo, Stegmaier et ál. Genome Inform (2004) 15(2):276-86). Los factores de transcripción contienen uno o más dominios de unión al ADN. Los dominios de unión al ADN de factores de transcripción pueden ser uno o más dominios de unión al ADN que se asocian con los identificadores PF00010, PF00170, PF00172, PF00046, PF00319, PF08279, PF00096, PF00105 de Pfam, y similares, que se pueden utilizar para recuperar secuencias de dominios y estructuras, por ejemplo, en pfam(punto)xfam(punto)org. Los factores de transcripción pueden contener también uno o más dominios activadorestrans, uno o más dominios de detección de señales. Los factores de transcripción pueden incluir aquellas proteínas que se asocian con la expresión de la OG “complejo del factor de transcripción” (OG:0005667), y términos sinónimos y relacionados, que se pueden utilizar para recuperar información que se refiere a los factores de transcripción, que incluyen secuencias, por ejemplo, en línea a www(punto)ebi(punto)ac(punto)uk/QuickGO.

Otros dominios de unión al ADN, por ejemplo, dominios de unión al ADN no derivados de factores de transcripción o dominios de unión al ADN de factores de no transcripción, se pueden utilizar, en algunos casos, en uno o más módulos de miembros de la biblioteca de polipéptidos modulares sintéticos individuales como se describe en la presente. Dichos dominios de unión al ADN de factores de no transcripción incluyen dominios de polipéptidos sintéticos y naturales que se unen de no forma no específica al ADN o se unen a secuencias específicas del ADN. Los dominios de unión al ADN de factores de no transcripción pueden incluir, de modo no taxativo, por ejemplo, el dominio de unión al ADN modificado o natural de un polipéptido de endonucleasa de dedos de cinc, el dominio de unión al ADN modificado o natural de un polipéptido de nucleasa efectora similar al activador de transcripción (TALEN), el dominio de unión al ADN modificado o natural de un polipéptido Cas9 (que incluye, por ejemplo, Cas9 carente de nucleasa (dCas9) y similares), etc.

En algunos casos, los miembros de la biblioteca de polipéptidos modulares sintéticos individuales se pueden configurar para que incluyan uno o más módulos como se describe en la Publicación de PCT N.° WO 2005/010198.

La configuración de módulos en polipéptidos modulares sintéticos, como se describe en la presente, generará una biblioteca que contiene múltiples proteínas funcionales modulares individuales que pueden, pero no necesariamente, compartir una función común. Por ejemplo, los miembros individuales de la biblioteca pueden comprender o consistir en polipéptidos modulares sintéticos que son proteínas de andamiaje, polipéptidos modulares sintéticos que son proteínas receptoras, polipéptidos modulares sintéticos que son proteínas cinasas o proteínas fosfatasas, polipéptidos modulares sintéticos que son proteínas reguladoras transcripcionales modulares, polipéptidos modulares sintéticos que son proteínas reguladoras epigenéticas, polipéptidos modulares sintéticos que son proteínas nucleasas o recombinasas sintéticas, etc. Dichas bibliotecas se pueden cribar para un fenotipo deseado, por ejemplo, de acuerdo con los métodos descritos en la presente.

Indicadores

Las bibliotecas que se describen en la presente incluyen proteínas que producen señales detectables que se expresan a partir de secuencias de ácido nucleico que las codifican. Las proteínas que producen señales detectables particulares utilizadas en los sistemas de biblioteca, como se describe en la presente, variarán y dependerá, en parte, del método preferido de detección de la señal producida. Por ejemplo, cuando la señal se detecta de forma óptica, por ejemplo, a través del uso de microscopía fluorescente o citometría de flujo (incluida la clasificación de células activadas por fluorescencia (FACS), se utiliza un indicador fluorescente.

Las proteínas que producen señales detectables adecuadas incluyen, por ejemplo, proteínas fluorescentes, enzimas que catalizan una reacción que genera una señal detectable como un producto, etiquetas de epítopos, marcadores de superficie y similares. Las proteínas que producen señales detectables se pueden detectar de forma directa o detectar de forma indirecta. Por ejemplo, cuando se utiliza un indicador fluorescente, se puede detectar la fluorescencia del indicador. En algunos casos, cuando se utiliza una etiqueta del epítopo o un marcador de superficie, la etiqueta del epítopo o marcador de superficie se puede detectar de forma indirecta, por ejemplo, a través del uso de un agente de unión detectable que se une específicamente a la etiqueta del epítopo o el marcador de superficie, por ejemplo, un anticuerpo etiquetado de forma fluorescente que se une específicamente a la etiqueta del epítopo o marcador de superficie. En algunos casos, un indicador que se detecta comúnmente de forma indirecta, por ejemplo, una etiqueta del epítopo o marcador de superficie, se puede dirigir de forma directa o un indicador que se detecta comúnmente de forma directa se puede detectar de forma indirecta, por ejemplo, a través del uso de un anticuerpo detectable que se une específicamente a un indicador fluorescente.

Las proteínas fluorescentes adecuadas incluyen, de modo no taxativo, proteína verde fluorescente (GFP, por sus siglas en inglés) o variantes de esta, variante azul fluorescente de GFP (BFP, por sus siglas en inglés), variante cian fluorescente de GFP (CFP, por sus siglas en inglés), variante amarillo fluorescente de GFP (YFP, por sus siglas en inglés), GFP mejorada (EGFP, por sus siglas en inglés), CFP mejorada (ECFP, por sus siglas en inglés), YFP mejorada (EYFP, por sus siglas en inglés), GFPS65T, esmeralda, topacio (TYFP), Venus, Citrino, mCitrino, GFPuv, EGFP desestabilizada (dEGFP), ECFP desestabilizada (dECFP), EYFP desestabilizada (dEYFP), mCFPm, Cerúleo, T-Sapphire, CyPet, YPet, mKO, HcRed, t-HcRed, DsRed, DsRed2, DsRed-monómero, J-Red, dimer2, t-dimer2(12), mRFP1, pociloporina, Renilla GFP, Monster GFP, paGFP, proteína Kaede y proteína kindling, ficobiliproteínas y conjugados de ficobiliproteínas que incluyen B-ficoeritrina, R-ficoeritrina y Aloficocianina. Otros ejemplos de proteínas fluorescentes incluyen mRocíodemiel, mBanana, mNaranja, dTomate, tdTomate, mTanjarina, mFrutilla, mCereza, mUva1, mFrambuesa, mUva2, mCiruela (Shaner et ál. (2005) Nat. Methods 2:905-909), y similares. Cualquiera de varias proteínas fluorescentes y coloreadas de la especie Anthozoan, tal como se describe en, por ejemplo, Matz et ál. (1999) Nature Biotechnol. 17:969-973, es adecuada para su uso.

Las enzimas adecuadas incluyen, de modo no taxativo, peroxidasa de rábano picante (HRP), fosfatasa alcalina (AP), beta-galactosidasa (GAL), glucosa-6-fosfato deshidrogenasa, beta-N-acetilglucosaminidasa, p-glucuronidasa, invertasa, xantina oxidasa, luciferasa de luciérnaga, glucosa oxidasa (GO), y similares.

Enlazadores y uniones

Dentro de los miembros individuales de la biblioteca, las uniones entre los componentes modulares que codifican un polipéptido único se mantendrán generalmente “en el marco”, lo que significa que el marco de lectura de codones de la secuencia de codificación de múltiples módulos se mantiene de una unidad de módulo a la siguiente. Dichas uniones en la presente se pueden denominar uniones en el marco y/o enlaces en el marco. Los enlazadores entre los componentes del módulo de los polipéptidos de múltiples módulos serán generalmente flexibles y/o contendrán residuos de aminoácidos que interfieren con la función de los dominios modulares.

Dichas uniones en el marco se pueden lograr, como se describirá más detalladamente a continuación, mediante cualquier método conveniente para configurar la secuencia de codificación y el ensamblaje anidado de los componentes modulares para que contengan un enlazador en el marco.

Los espaciadores adecuados se pueden seleccionar fácilmente y pueden tener cualquiera de una cantidad de longitudes adecuadas, tal como de 1 aminoácido (por ejemplo, Gly) a 20 aminoácidos, de 2 aminoácidos a 15 aminoácidos, de 3 aminoácidos a 12 aminoácidos, que incluye 4 aminoácidos a 10 aminoácidos, 5 aminoácidos a 9 aminoácidos, 6 aminoácidos a 8 aminoácidos o 7 aminoácidos a 8 aminoácidos, y puede ser de 1, 2, 3, 4, 5, 6 o 7 aminoácidos.

Los espaciadores de ejemplo incluyen polímeros de glicina (G)n, polímeros de glicina-serina (que incluyen, por ejemplo, (GS)n, (GSGGS)n (SEQ ID N.o: 8) y (GGGS)n (SEQ ID N.o: 9), donde n es un número entero de al menos uno), polímeros de glicina-alanina, polímeros de alanina-serina, y otros enlazadores flexibles conocidos en la técnica. Se pueden usar polímeros de glicina y glicina-serina; ambos, Gly y Ser, son relativamente no estructurados y, por lo tanto, pueden funcionar como una ligadura neutra entre componentes. Se pueden usar polímeros de glicina; la glicina accede al espacio phi-psi de forma más significativa incluso que la alanina, y está mucho menos restringida que los residuos con cadenas laterales más largas (véase Scheraga, Rev. Computational Chem. 11173-142 (1992)). Los espaciadores de ejemplo pueden comprender secuencias de aminoácidos que incluyen, de modo no taxativo, GGSG (SEQ ID N.o:10), GGSGG (SEQ ID N.o:11), GSGSG (SEQ ID N.o:12), GSGGG (SEQ ID N.o:13), GGGSG (SEQ ID N.o:14), GSSSG (SEQ ID N.o:15), y similares.

En algunos casos, un enlazador comprende la secuencia de sitio de reconocimiento de restricción BamHI con fines de clonación y como parte de un enlazador porque el sitio BamHI codifica GS.

En algunos casos, las secuencias enlazadoras se pueden eliminar a través de una o más etapas de clonación (por ejemplo, a través del uso de endonucleasas de restricción de tipo IIS o recombinación homóloga) o a través de digestión directa (por ejemplo, digestión BamHI).

En algunos casos, se logra una unión en el marco a través de la ausencia del enlazador en la unión de dos componentes modulares. Como tal, una unión en el marco puede, en algunos casos, comprender ningún ácido nucleico interviniente que codifica aminoácidos entre las secuencias de codificación del módulo. En algunos casos, una unión en el marco puede comprender dos o pocos pares de bases de ácido nucleico interviniente entre la secuencia de codificación del módulo. En algunos casos, una unión en el marco puede comprender uno o pocos pares de bases de ácido nucleico interviniente entre la secuencia de codificación del módulo. En algunos casos, una unión en el marco puede comprender ningún par de bases de ácido nucleico interviniente entre la secuencia de codificación del módulo.

Códigos de barras

Los códigos de barras de ácidos nucleicos son secuencias de ácido nucleico específicas únicas que se pueden identificar mediante cualquier método conveniente de identificación de secuencias de ácido nucleico que incluye, de modo no taxativo, por ejemplo, identificación basada en hibridación (es decir, hibridación in situ), identificación basada en amplificación (es decir, identificación basada en PCR) y secuenciación de ácidos nucleicos. Los códigos de barras de la presente descripción pueden ser códigos de barras específicos para el módulo, lo cual significa que cada módulo único de una biblioteca de múltiples módulos se correlaciona con un código de barras único específico de modo que la identificación de un código de barras particular es equivalente con la identificación positiva de la secuencia de codificación del módulo asociada.

Un código de barras específico para el módulo, como se describe en la presente, estará limitado por el método de ensamblaje de bibliotecas que se utilice. Por ejemplo, cuando se logra el ensamblaje anidado de construcciones de múltiples módulos por medio de un método basado en enzimas de restricción, los códigos de barras excluirán cualquier secuencia que constituya un sitio de reconocimiento de enzimas de restricción de las enzimas de restricción utilizadas en el ensamblaje. Como tal, en algunos casos, las secuencias de código de barras no contendrán secuencias de reconocimiento de enzimas de restricción. Como tal, en algunos casos, las secuencias de código de barras no contendrán secuencias de reconocimiento de enzimas de restricción de tipo IIS.

En los casos en los que la identificación y/o cuantificación de código de barras se realiza mediante secuenciación, lo que incluye, por ejemplo, métodos de secuenciación de última generación, se aplicarán consideraciones convencionales para códigos de barras detectados mediante secuenciación. En algunos casos, se pueden utilizar o modificar códigos de barras y/o kits que contienen códigos de barras y/o adaptadores de códigos de barras disponibles en el mercado para su uso en los métodos descritos en la presente, lo que incluye, por ejemplo, aquellos códigos de barras y/o kits adaptadores de códigos de barras disponibles en el mercado a través de proveedores tales como, de modo no taxativo, por ejemplo, New England Biolabs (Ipswich, MA), Illumina, Inc. (Hayward, CA), Life Technologies, Inc. (Grand Island, NY), Bioo Scientific Corporation (Austin, TX) y similares, o se pueden fabricar de forma personalizada, por ejemplo, según se encuentran disponibles en, por ejemplo, Integrated DNA Technologies, Inc. (Coralville, IA).

La longitud del código de barras variará y dependerá de la complejidad de la biblioteca y el método de detección de códigos de barras utilizado. Como los códigos de barras de ácidos nucleicos (por ejemplo, códigos de barras de ADN) son muy conocidos, el diseño, la síntesis y el uso de los códigos de barras de ácidos nucleicos se encuentra dentro la habilidad del experto en la técnica pertinente.

En algunos casos, la longitud de los códigos de barras utilizados dependerá además de la probabilidad en la que una secuencia de códigos de barras individual aparece por casualidad en algún otro componente de la biblioteca, lo que incluye, de modo no taxativo, por ejemplo, una secuencia de codificación del módulo, un vector, un componente del vector, etc., o una unión de dos unidades de códigos de barras. Por ejemplo, en algunos casos, cuando hay una probabilidad considerable de que una secuencia sin código de barras pueda detectarse de forma inadvertida como una secuencia de código de barras, por ejemplo, como en bibliotecas sumamente complejas, se pueden utilizar unidades de códigos de barras de mayor longitud. En algunos casos, el método de detección de códigos de barras puede tener en cuenta cuándo determinar la longitud del código de barras necesaria, por ejemplo, en los casos en los que se utiliza la detección de códigos de barras por hibridación, se pueden emplear códigos de barras más extensos en comparación con cuando se utiliza secuenciación con cebadores de secuenciación específica.

Tal como se utiliza en la presente, en lo que se refiere a los miembros individuales de una biblioteca de ácido nucleico, la expresión “región de códigos de barras” hace referencia a la región de cada ácido nucleico que contiene una secuencia de ácido nucleico específica para la parte modular variable del polipéptido sintético. En algunos casos, la región de códigos de barras se puede utilizar para identificar específicamente el módulo o módulos variables presentes en la región de codificación de un miembro particular de una biblioteca. En algunos casos, la región de códigos de barras se puede utilizar para identificar específicamente el módulo o los módulos variables e identificar el orden de módulos variables presentes en la región de codificación de un miembro particular de una biblioteca (es decir, arquitectura). En algunos casos, la región de codificación se puede utilizar para cuantificar, por ejemplo, de forma semicuantitativa, la frecuencia de un miembro particular de la biblioteca o la frecuencia de un módulo particular dentro de una población que contiene múltiples miembros de la biblioteca.

Dentro de un polipéptido de módulo sintético con códigos de barras de una biblioteca, como se describe en la presente, las unidades de códigos de barras de la región de codificación estarán en una orientación opuesta en comparación con las secuencias de codificación del módulo. Además, las unidades de códigos de barras de la región de códigos de barras estarán en un orden inverso en comparación con su secuencia de codificación de módulo asociada respectiva. Sin embargo, en relación con el polipéptido codificado, la región de códigos de barras se puede colocar en el “extremo N” o “extremo C” con respecto a la secuencia de ácido nucleico que codifica el polipéptido modular sintético.

Elementos específicos del vector

Por “elementos específicos para el vector” se entiende que son elementos que se utilizan para elaborar, construir, propagar, mantener y/o probar el vector antes, durante o después de su construcción. Dichos elementos específicos para el vector incluyen, de modo no taxativo, por ejemplo, elementos del vector necesarios para la propagación, clonación y selección del vector durante su uso y pueden incluir, de modo no taxativo, por ejemplo, un origen de replicación, un sitio de clonación múltiple, un promotor procariota, un promotor de fagos, un marcador seleccionable (por ejemplo, un gen con resistencia antibiótica, una proteína enzimática codificada, una proteína cromogénica o fluorescente codificada, etc.) y similares. Se puede utilizar cualquier elemento específico para el vector conveniente, según sea necesario, en los vectores como se describe en la presente.

En la técnica se conocen los elementos promotores y potenciadores adecuados útiles como elementos específicos para el vector. Para la expresión en una célula bacteriana, los promotores adecuados incluyen, de modo no taxativo, lacI, lacZ, T3, T7, gpt, lambda P y trc. Para la expresión en una célula eucariota, los promotores adecuados incluyen, de modo no taxativo, elementos potenciadores y promotores del gen de inmunoglobulina de cadena pesada y/o ligera; promotor temprano inmediato de citomegalovirus; promotor de timidina cinasa del herpes simple; promotores temprano y tardío de SV40; promotor presente en repeticiones terminales largas de retrovirus; promotor de la metalotioneína I de ratón; y varios promotores específicos de tejido conocidos en la técnica.

En la técnica se conocen los promotores reversibles adecuados, que incluyen los promotores inducibles. Dichos promotores reversibles se pueden aislar y pueden derivan de muchos organismos, por ejemplo, eucariotas y procariotas. La modificación de los promotores reversibles derivados de un primer organismo para usar en el segundo organismo, por ejemplo, un primer procariota y una segunda eucariota, un primer eucariota y una segunda procariota, etc., es conocida en la técnica. Dichos promotores reversibles, y sistemas basados en dichos promotores reversibles pero que también comprenden proteínas de control adicionales incluyen, de modo no taxativo, promotores regulados por alcohol (por ejemplo, promotor de gen de alcohol deshidrogenasa I (alcA), promotores que responden a proteínas transactivadoras de alcohol (AlcR), etc.), promotores regulados por tetraciclina, (por ejemplo, sistemas promotores que incluyen TetActivators, TetON, TetOFF, etc.), promotores regulados por esteroides (por ejemplo, sistemas promotores del receptor de glucocorticoides de rata, sistemas promotores del receptor de estrógeno humano, sistemas promotores de retinoides, sistemas promotores de tiroides, sistemas promotores de ecdisona, sistemas promotores de mifepristona, etc.), promotores regulados por metal (por ejemplo, sistemas promotores de metalotioneína, etc.), promotores regulados relacionados a la patogénesis (por ejemplo, promotores regulados por ácido salicílico, promotores regulados por etileno, promotores regulados por benzotiadiazolo, etc.), promotores regulados por temperatura (por ejemplo, promotores inducibles por choque térmico (por ejemplo, HSP-70, HSP-90, promotor de choque térmico de soja, etc.), promotores regulados por luz, promotores inducibles sintéticos, y similares.

En algunos casos, el lugar o construcción o transgén que contiene el promotor adecuado se conmuta de forma irreversible mediante la inducción de un sistema inducible. Los sistemas adecuados para la inducción de una conmutación irreversible son conocidos en la técnica, por ejemplo, la inducción de una conmutación irreversible puede utilizar una recombinación mediada por Cre-lox (véase, por ejemplo, Fuhrmann-Benzakein, et ál., PNAS (2000) 28:e99). Se puede utilizar cualquier combinación adecuada de recombinasa, endonucleasa, ligasa, sitios de recombinación, etc. conocida en la técnica para generar un promotor conmutable de forma irreversible. Los métodos, mecanismos y requisitos para realizar una recombinación específica del sitio, descrita en otra parte de la presente, son útiles para generar promotores conmutados de forma irreversible y son conocidos en la técnica, véase, por ejemplo, Grindley et ál. (2006) Annual Review of Biochemistry, 567-605 y Tropp (2012) Molecular Biology (Jones & Bartlett Publishers, Sudbury, MA).

MÉTODOS PARA REALIZAR BIBLIOTECAS

La presente descripción proporciona métodos para elaborar bibliotecas de polipéptidos modulares sintéticos que codifican ácidos nucleicos en los que cada ácido nucleico de la biblioteca incluye un código de barras de múltiples unidades que identifica el o los módulos variables del polipéptido modular y, en los que múltiples módulos variables se encuentran presentes, su orientación unos respecto a otros. En diversas modalidades, la presente descripción proporciona métodos de ensamblaje combinatorios graduales de polipéptidos modulares sintéticos a partir de ácidos nucleicos que codifican el módulo con código de barras de manera que los ácidos nucleicos resultantes que codifican los polipéptidos modulares sintéticos cada uno comprende una región de codificación de módulos en el marco y un código de barras de múltiples unidades donde la configuración de las unidades de códigos de barras corresponde a la configuración de los módulos en el marco. En general, cuando los módulos variables múltiples se incluyen en cada miembro de una biblioteca, el código de barras de múltiples unidades coensambladas proporciona un registro del ensamblaje de los módulos variables de cada miembro de la biblioteca.

Sin limitarnos a ninguna teoría, el ensamblaje combinatorio gradual de los polipéptidos modulares sintéticos, como se presenta en la presente, proporciona la construcción de bibliotecas más grandes y más complejas de lo que sería posible o práctico usando métodos convencionales de modificación de polipéptidos individuales (es decir, “uno a la vez”). Los presentes inventores reconocieron que la modificación convencional de polipéptidos modulares sintéticos representó un obstáculo técnico considerable para el cribado de alto rendimiento de polipéptidos modulares sintéticos. El ensamblaje coordinado de cada polipéptido sintético de múltiples módulos y con un código de barras de múltiples unidades correspondiente, como se presenta en la presente, supera este obstáculo y permite el “ensamblaje de un solo paso” de múltiples ácidos nucleicos únicos que codifican los polipéptidos modulares sintéticos analizables. Dicho ensamblaje de un solo paso de alto rendimiento podría realizarse con una modificación de polipéptidos convencional.

Los presentes inventores reconocieron también que las bibliotecas de polipéptidos sintéticos colocados de forma física convencional presentan también obstáculos técnicos importantes para el cribado de alto rendimiento. En particular, cuando se analizan las bibliotecas grandes, la cantidad de cámaras de reacción separadas físicamente y la variabilidad en las condiciones de ensayo entre cada cámara presenta dificultades técnicas considerables cuando se intenta realizar un cribado de la complejidad completa de una biblioteca grande y cribar los datos producidos. Los presentes inventores reconocieron que el cribado de bibliotecas agrupadas podría solucionar este problema, pero presenta otros obstáculos significativos, tales como, la dificultad o impracticabilidad de identificar y/o cuantificar los polipéptidos individuales que producen un fenotipo deseado en una pantalla a partir de un conjunto mezclado complejo de polipéptidos modulares únicos. El uso del código de barras de múltiples unidades corto soluciona este problema, lo cual permite la identificación y/o cuantificación positiva eficiente post hoc de polipéptidos modulares, sintéticos, únicos e individuales que producen un fenotipo deseado dentro del conjunto complejo mediante la secuenciación solamente del código de barras de múltiples unidades.

Estrategias de clonación

En general, la presente descripción proporciona un método para elaborar bibliotecas, como se describe en la presente, mediante el ensamblaje anidado de ácidos nucleicos que codifican módulos de polipéptidos unidos por códigos de barras. Por ejemplo, como se muestra en la figura 12, un vector de ácido nucleico (100) que contiene una secuencia que codifica un módulo de polipéptidos (101) unido a un código de barras específico para el módulo (102) se lineariza (103) mediante la escisión del enlace entre la secuencia que codifica un módulo de polipéptidos y el código de barras específico para el módulo. Después de la linearización del vector que contiene la primera secuencia de codificación del módulo y el primer código de barras específico para el módulo, se inserta (es decir, se anida) ácido nucleico que contiene una segunda secuencia de codificación del módulo (104) y un segundo código de barras (105) específico para el segundo módulo entre la primera secuencia de codificación del módulo y el primer código de barras (106). El ácido nucleico ensamblado contiene una región de codificación que codifica un polipéptido modular sintético y una región de códigos de barras que contiene un código de barras de múltiples unidades (es decir, “códigos de barras” (BCs)). En algunos casos, las secuencias de codificación del módulo se ensamblan de manera que estas se unen por medio de una secuencia que codifica un enlazador deseado, como se describe en la presente. En determinados casos, las secuencias de codificación del módulo se ensamblan de manera que estas se unen sin usar una secuencia enlazadora, por ejemplo, sin la secuencia enlazadora que codifica uno o más aminoácidos, sin ningún nucleótido no codificador interviniente entre la primera y la segunda secuencia de codificación del módulo, etc. Como tal, la designación de una “secuencia enlazadora deseada” o “enlazador”, particularmente como se utiliza en las figuras, abarca la ausencia completa de un enlazador o secuencia enlazadora y la unión directa de los módulos de polipéptidos y las secuencias de codificación del módulo.

La linearización de la secuencia del vector mediante escisión entre la primera secuencia de codificación del módulo y el primer código de barras específico para el módulo se puede lograr mediante cualquier medio adecuado o conveniente. Por ejemplo, el polinucleótido que contiene la secuencia de codificación del módulo y el código de barras se puede configurar para que contenga un sitio de escisión de enzimas de restricción (es decir, endonucleasa de restricción) entre la secuencia de codificación del módulo y el código de barras. El sitio de escisión puede ser un sitio de escisión de enzimas de restricción de tipo IIS y, más específicamente, puede ser un sitio de escisión incluido dentro de la secuencia de reconocimiento de la enzima de restricción de tipo II. Se puede utilizar cualquier enzima de restricción de tipo II conveniente que se escinda dentro de su secuencia de reconocimiento para los efectos descritos, incluidas aquellas enzimas de restricción de tipo II que se escinden dentro de sus secuencias de reconocimiento que se conocen en la técnica. En algunos casos, el sitio de escisión puede ser el sitio de escisión de BamHI el cual tiene la secuencia de reconocimiento de 5'-GGATCC-3' y se escinde después de la primera G de la secuencia de reconocimiento en ambas cadenas dejando un saliente 5'-GATC-3'. Otras enzimas de restricción que se pueden utilizar para esta finalidad incluyen, de modo no taxativo, por ejemplo,

En algunos casos, el ensamblaje anidado se logra a través del uso de dos sitios de enzimas de restricción (RE1 y RE2) colocados entre la primera secuencia de codificación del módulo y el primer código de barras específico para el módulo y que flanquea la segunda secuencia de codificación del módulo con código de barras. 13). En esta estrategia de ensamblaje de dos enzimas de restricción, la digestión de RE1 y RE2 provoca la linearización del vector y la liberación de un fragmento que contiene la segunda secuencia de codificación del módulo con código de barras. Tras la unión del vector linearizado y el fragmento liberado, una secuencia enlazadora deseada está presente entre la primera y segunda secuencia de codificación del módulo y el primer y segundo código de barras se encuentran en una orientación opuesta en comparación con la primera y la segunda secuencia de codificación del módulo.

En algunos casos, el ensamblaje anidado se logra a través del uso de cuatro sitios de enzimas de restricción (RE1, RE2, RE3 y RE4), donde RE1 y RE2 se colocan entre ambas secuencias de codificación del módulo y sus respectivos códigos de barras, y RF3 y RF4 se colocan flanqueando la segunda secuencia de codificación del módulo con código de barras (figura 14). En esta estrategia de ensamblaje de cuatro enzimas de restricción, la digestión separada del primer vector, en RE1 y RE2, y el segundo vector, en RE3 y RE4, provoca la linearización del vector y la liberación de un fragmento que contiene la segunda secuencia de codificación del módulo con código de barras. Tras la ligación del vector linearizado y el fragmento liberado, una secuencia enlazadora deseada está presente entre la primera y segunda secuencia de codificación del módulo y el primer y segundo código de barras se encuentran en una orientación opuesta en comparación con la primera y la segunda secuencia de codificación del módulo.

En algunos casos, las enzimas de restricción se seleccionan específicamente de manera que, tras la ligación, las uniones entre la primera y la segunda secuencia de codificación del módulo y el primer y el segundo código de barras no contienen las secuencias de reconocimiento de enzimas de restricción RE1, RE2, RE3 o RE4. Generalmente, de acuerdo con esta estrategia, los sitios RE1, RE2, RE3 y RE4 se inactivan después de la ligación de manera que el vector resultante contiene solamente sitios RE1 y RE2 activos entre la segunda secuencia de codificación del módulo y su código de barras respectivo. Por lo tanto, esta estrategia permite el ensamblaje anidado más allá de una construcción bidimensional mediante linearización repetida del vector resultante mediante digestión restrictiva en RE1 y RE2 de la secuencia de codificación del módulo con código de barras insertada más recientemente.

En este método de cuatro enzimas de restricción, se selecciona RE1, de manera que, tras la digestión, el extremo resultante del vector linearizado es compatible (es decir, capaz de ligarse) con el extremo del fragmento liberado generado mediante digestión con RE3. Se selecciona RE2, de manera que, tras la digestión, el extremo resultante del vector linearizado es compatible (es decir, capaz de ligarse y/o capaz de hibridarse completamente o al menos parcialmente) con el extremo del fragmento liberado generado mediante digestión con RE4. En algunos casos, se pueden modificar uno o más extremos generados mediante digestión con RE1, RE2, RE3 o RE4, por ejemplo, mediante la adición o eliminación de uno o más nucleótidos u otra modificación química, con el fin de generar extremos compatibles entre RE1 y RE3 o RE2 y RE4. Se puede utilizar cualquier método conveniente de modificación de extremos para generar extremos compatibles que incluyen aquellos métodos de modificación de extremos que se conocen bien en la técnica, que incluyen, de modo no taxativo, por ejemplo, despuntamiento de extremos, fosforilación, desfosforilación, etc.

En algunos casos, el ensamblaje anidado se logra a través del uso de una secuencia de reconocimiento de enzimas de restricción de tipo IIS (RE1), donde están presentes dos sitios RE1 entre la primera secuencia de codificación del módulo y su código de barras y dos sitios RE1 flanquean la segunda secuencia de codificación del módulo con código de barras (figura 15). En esta estrategia mediada por enzimas de restricción de tipo IIS, la digestión en sitios adyacentes a los sitios de reconocimiento de RE1 provoca la linearización del vector y la liberación de un fragmento que contiene la segunda secuencia de codificación del módulo con código de barras. Los sitios de escisión adyacentes a los sitios de reconocimiento de RE1 se configuran de manera que, tras la escisión, el extremo 3' del vector sea compatible con el extremo 5' del fragmento y el extremo 5' del vector sea compatible con el extremo 3' del fragmento. En algunos casos, estos extremos compatibles se pueden denominar “salientes” compatibles. Por lo tanto, tras la ligación del vector linearizado y el fragmento liberado, una secuencia enlazadora deseada está presente entre la primera y segunda secuencia de codificación del módulo y el primer y segundo código de barras se encuentran en una orientación opuesta en comparación con la primera y la segunda secuencia de codificación del módulo.

Se puede utilizar cualquier enzima de restricción de tipo IIS conveniente en las estrategias de ensamblaje que utilizan dichas enzimas, como se describe en la presente, incluidas, de modo no taxativo, por ejemplo, AceIII, AcuI, AlwI, AarI, BbsI, BbvI, BbvII, BccI, Bce83I, BceAI, BcefI, BciVI, BfuAI, BmrI, BmuI, BpmI, BpuEI, BsaI, BsbI, BseRI, BsgI, BslFI, BsmAI, BsmFI, BsoMAI, BspCNI, BspGI, BspMI, BspNCI, BspQI, BsrDI, Bst71I, BtgZI, BtsCI, BtsI, BveI, DrdII, EarI, EciI, Faql, FinI, Fokl, Hgal, Hin4N, Hphl, HpyAV, LguI, MboII, Mmel, MnlI, NmeAIII, Plel, SapI, SfaNI, Sgel y similares.

En algunos casos, una enzima de restricción utilizada, por ejemplo, en la linearización del vector y/o la liberación del segundo fragmento que contiene el módulo, es una enzima de restricción que se escinde en ambos lados de su sitio de reconocimiento. Se puede utilizar cualquier enzima de restricción conveniente con dicha funcionalidad en los métodos de ensamblaje descritos en la presente, incluida, de modo no taxativo, por ejemplo, BcgI.

En algunos casos, el ensamblaje anidado se logra a través del uso de múltiples secuencias de reconocimiento de enzimas de restricción de tipo IIS, por ejemplo, secuencias de reconocimiento de enzimas de restricción de tipo IIS (RE1 y RE2), donde están presentes dos sitios RE1 entre la secuencia de codificación del módulo y sus respectivos códigos de barras y dos sitios RE2 flanquean la segunda secuencia de codificación del módulo con código de barras (figura 16). En esta estrategia de dos enzimas de restricción de tipo IIS, la digestión separada del primer vector, en los sitios RE1, y el segundo vector, en los sitios RE2, provoca la linearización del vector y la liberación de un fragmento que contiene la segunda secuencia de codificación del módulo con código de barras. Tras la ligación del vector linearizado y el fragmento liberado, una secuencia enlazadora deseada está presente entre la primera y segunda secuencia de codificación del módulo y el primer y segundo código de barras se encuentran en una orientación opuesta en comparación con la primera y la segunda secuencia de codificación del módulo.

Generalmente, de acuerdo con esta estrategia, los sitios RE1 y RE2 utilizados en la primera ronda de linearización y liberación de fragmentos están perdidos para el vector e inserción de manera que el vector resultante contiene solamente sitios RE1 entre la segunda secuencia de codificación del módulo y su respectivo código de barras. Por lo tanto, esta estrategia permite el ensamblaje anidado más allá de una construcción bidimensional mediante linearización repetida del vector resultante mediante digestión restrictiva usando los sitios de reconocimiento RE1 de la secuencia de codificación del módulo con código de barras insertada más recientemente.

En este método de dos enzimas de restricción de tipo IIS, los sitios de escisión adyacentes a las secuencias de reconocimiento RE1 y RE2 se configuran de manera que, tras la digestión, los extremos resultantes del vector linearizado sean compatibles (es decir, capaces de ligarse) con los extremos del fragmento liberado. En algunos casos, se pueden modificar uno o más extremos generados mediante digestión con RE1 y/o RE2, por ejemplo, mediante la adición o eliminación de uno o más nucleótidos u otra modificación química, con el fin de generar extremos compatibles. Se puede utilizar cualquier método conveniente de modificación de extremos para generar extremos compatibles que incluyen aquellos métodos de modificación de extremos que se conocen bien en la técnica, que incluyen, de modo no taxativo, por ejemplo, despuntamiento de extremos, fosforilación, desfosforilación, etc.

En algunos casos, los extremos compatibles se pueden generar a través del uso de una enzima con actividad exonucleasa, por ejemplo, una exonucleasa. Por ejemplo, en algunas modalidades, el primer vector y el segundo vector o fragmento de ácido nucleico se configuran de manera que tras la digestión de enzimas de restricción del primer vector con una primera enzima de restricción (RE1) y el segundo vector o ácido nucleico con una segunda enzima de restricción (RE2), los extremos recién generados son compatibles para la ligación después del uso de una enzima con actividad endonucleasa. Los métodos para generar extremos compatibles a través del uso de una enzima con actividad exonucleasa son muy conocidos en la técnica e incluyen, de modo no taxativo, por ejemplo, clonación en fusión, ensamblaje Gibson y similares.

En algunos casos, el ensamblaje del primer vector digerido de enzima de restricción y un segundo ácido nucleico, por ejemplo, un segundo vector de fragmento de ácido nucleico, se logra a través del uso de una reacción en Fusión y, en dichos casos, a los extremos compatibles generados a través del uso de una enzima con actividad exonucleasa se les puede llamar salientes en fusión (saliente IF) (figura 17). La unión de dos salientes IF se puede configurar para generar enlazadores deseados y/o secuencias enlazadoras deseada entre dos extremos unidos de ácido nucleico. Por ejemplo, las salientes IF entre una primera secuencia de codificación del módulo y una segunda secuencia de codificación se pueden configurar de manera que el primer y segundo módulos se encuentran en el marco. Como se describe más detalladamente en la presente, las secuencias de codificación del módulo en el marco pueden o no pueden estar separadas por una secuencia que codifica uno o más aminoácidos enlazadores. Por ejemplo, como se muestra en la figura 17, la digestión de un primer vector en el sitio de reconocimiento (RE1) de una primera enzima de restricción genera extremos que se encuentran en fusión compatibles con los extremos generados mediante digestión de un segundo vector o fragmento de ácido nucleico por una enzima de restricción de tipo IIS en los sitios de escisión determinados por los sitios de reconomiento (RE2) presentes en el segundo vector o fragmento de ácido nucleico. Los extremos compatibles están ligados a través de una reacción en fusión, lo cual da lugar a una secuencia enlazadora deseable entre la primera y la segunda secuencia de codificación del módulo y un código de barras de múltiples unidades que tiene las primeras y segundas unidades de código de barras que se encuentran en orientación opuesta en comparación la primera y la segunda secuencia de codificación del módulo. En algunos casos, después del ensamblaje en fusión de una primera y segunda secuencia de codificación del módulo y un código de barras de múltiples unidades, está presente un sitio de enzimas de restricción entre la región de codificación y la región de códigos de barras con el fin de permitir la inserción de secuencias de codificación del módulo y unidades de códigos de barras.

En algunos casos, tras la ligación de un ácido nucleico que contiene una primera secuencia de codificación del módulo con un segundo ácido nucleico que contiene una segunda secuencia de codificación del módulo, la primera y segunda secuencia de codificación del módulo se unen de manera que no está presente ningún enlazador ni ningún nucleótido no codificador entre la primera y la segunda secuencia de codificación del módulo. En un ejemplo no taxativo, un primer vector que contiene una primera secuencia de codificación del módulo y su código de barras respectivo se une sin un enlazador o nucleótido no codificador interviniente a un segundo vector o fragmento de ácido nucleico que contiene una segunda secuencia de codificación del módulo y su respectivo código de barras por medio de digestión de enzimas de restricción (figura 18). Tanto el primer vector como el segundo vector o fragmento de ácido nucleico se digieren usando dos enzimas de restricción de tipo IIS diferentes que tienen dos sitios de reconocimiento diferentes (RE1 y RE2), donde el primera enzima de restricción escinde ambas cadenas del ácido nucleico en la misma posición en alguna distancia de su sitio de reconocimiento (RE1) dejando un “extremo romo” y la segunda enzima de restricción escinde ambas cadenas del ácido nucleico en distintas posiciones a alguna distancia de su sitio de reconocimiento (RE2) dejando una saliente o “extremo cohesivo”. Los ácidos nucleicos de partida se configuran de modo que tras la escisión del primer vector y el segundo vector con la segunda enzima de restricción, los extremos cohesivos generados sean compatibles para la ligación. Por lo tanto, tras la ligación de los extremos romos y extremos cohesivos generados, el vector resultante contiene una primera secuencia de codificación del módulo fusionada directamente, sin ningún enlazador o ácido nucleico no codificador interviniente, a una segunda secuencia de codificación del módulo y un código de barras de múltiples unidades que contiene el código de barras de la primera secuencia de codificación del módulo y el código de barras de la segunda secuencia de codificación del módulo en orientación opuesta en comparación con la primera y la segunda secuencia de codificación del módulo.

Se puede utilizar cualquier enzima de restricción de tipo IIS conveniente que dé lugar a extremos romos después de la digestión en los métodos descritos en la presente que utilizan ligadura de extremo romo, incluidas aquellas que son muy conocidas en la técnica, incluidas, de modo no taxativo, por ejemplo, SlyI, MlyI, etc. Además, los métodos para generar un extremo romo después de la digestión con una endonucleasa de restricción que no genera extremos romos, es decir, “despuntamiento”, se pueden utilizar cuando sea necesario, lo cual incluye, de modo no taxativo, “relleno de extremos” con una ADN polimerasa, tal como, por ejemplo, fragmento grande de la ADN polimerasa I (es decir, Klenow), ADN polimerasa T4, nucleasa de frijol mungo, etc. o se pueden quitar los nucleótidos no emparejados terminales por medio de una enzima con actividad exonucleasa.

En algunos casos, cuando está presente la secuencia compatible con una enzima de restricción que no es de tipo IIS en el extremo terminal de una secuencia que codifica un módulo, la digestión se pueden realizar con una enzima de restricción que no sea del tipo IIS, por ejemplo, una enzima de restricción de tipo II que se escinde dentro de su secuencia de reconocimiento. En dichos casos, se puede utilizar una enzima de restricción que produce un extremo romo en el extremo terminal de la secuencia de codificación del módulo donde la secuencia de codificación del módulo contiene toda la secuencia de reconocimiento de la enzima de restricción, o una parte de esta, en su extremo 3' o 5'. En algunos casos, cuando la secuencia de codificación del módulo contiene toda la secuencia de reconocimiento de una enzima de restricción o una parte de esta que corta dentro de su secuencia de reconocimiento y no produce un extremo romo, se pueden utilizar una enzima de restricción de extremo no romo y la saliente generada se puede redondear, por ejemplo, a través de cualquier método conveniente que incluya, de modo no taxativo, por ejemplo, aquellos métodos descritos en la presente.

Dado que las secuencias en los extremos de las secuencias de codificación del módulo estarán limitadas por los aminoácidos terminales del módulo, casos en los que se encuentran presenten o se puede modificar para que estén presentes de forma conveniente secuencias de reconocimiento de enzimas de restricción adecuadas en uno o más extremos terminales de la secuencia de codificación del módulo para permitir la escisión y/o generación adecuada de un extremo romo puede no ser frecuente dependiendo del módulo particular empleado. Por lo tanto, en muchos casos, la generación eficiente de una biblioteca grande o multidimensional de polipéptidos modulares sintéticos dependerá de los sitios de reconocimiento de enzimas que están presentes fuera de la secuencia de codificación del módulo. Como tal, en algunos casos, estarán presentes una o más, incluidas todas las secuencias de reconocimiento de enzimas utilizadas en el ensamblaje de bibliotecas fuera de la secuencia de codificación del módulo. En algunos casos, estarán presentes una o más, incluidas todas las secuencias de reconocimiento de enzimas utilizadas en el ensamblaje de bibliotecas fuera de la secuencia de códigos de barras.

En algunos casos, se genera un polipéptido modular sintético donde las secuencias de codificación del módulo se unen sin dificultades a los extremos de un dominio enlazador de manera que no se encuentra presente ninguna secuencia interviniente entre las secuencias de codificación del módulo y sus respectivas uniones con el dominio enlazador. En un ejemplo no taxativo, dicha unión sin dificultades de una secuencia de codificación del módulo a un dominio enlazador la facilita un vector o un fragmento de ácido nucleico configurado para que contenga una parte de una secuencia enlazadora deseable unida sin dificultades a cualquier extremo de una segunda secuencia de codificación del módulo. Por ejemplo, se puede configurar un primer vector para que contenga una primera secuencia de codificación del módulo unida sin dificultades a una primera parte de un dominio enlazador que se liga a un segundo vector o fragmento de ácido nucleico del dominio enlazador unido sin dificultades a una segunda secuencia de codificación del módulo (figura 19). El primer vector se puede configurar para que contenga dos de un primer sitio de reconocimiento de enzimas de restricción de tipo IIS (RE1) entre la secuencia de codificación del módulo y sus respectivos códigos de barras. El segundo vector o fragmento de ácido nucleico se puede configurar para que contenga dos de un segundo sitio de reconocimiento de enzimas de restricción de tipo IIS (RE2) que flanquea la segunda secuencia de codificación del módulo con código de barras. Se puede utilizar un tercer vector o fragmento de ácido nucleico que contiene lo que resta, por ejemplo, la parte “media” del dominio enlazador que está flanqueado por dos del segundo sitio de reconocimiento de enzimas de restricción de tipo IIS (RE2). La secuencia de los vectores y/o fragmentos de ácido nucleico predigeridos se configura de manera que, tras la digestión, se generen extremos compatibles entre la primera parte del dominio enlazador y la parte media del dominio enlazador, la segunda parte del dominio enlazador y la parte media del dominio enlazador y los dos códigos de barras. Tras la digestión y ligación, el vector resultante contiene la primera secuencia de codificación del módulo unida al dominio enlazador unido sin dificultades a la segunda secuencia de codificación del módulo que contiene el primer y segundo código de barras en una orientación opuesta en comparación con la primera y segunda secuencia de codificación del módulo (figura 19). El ensamblaje sin dificultades, por ejemplo, entre los módulos y dominios enlazadores, se puede lograr con o sin el uso del ensamblaje mediado por exonucleasas (por ejemplo, clonación en fusión, ensamblaje Gibson, etc.).

Las estrategias de ensamblaje basadas en la digestión descritas anteriormente, en algunos casos, se pueden combinar en su totalidad o en parte, de cualquier manera, conveniente y adecuada para llegar a un método útil para producir una biblioteca de polipéptidos modulares sintéticos como se describe en la presente. Además, cuando se conocen en la técnica los métodos sustitutos del ensamblaje basado en la digestión y serían compatibles con los métodos descritos en la presente, dichos métodos sustitutos se pueden utilizar en el ensamblaje de una biblioteca de polipéptidos modulares sintéticos como se describe en la presente. En algunos casos, las estrategias basadas en la digestión descritas se pueden combinar, en su totalidad o en parte, con métodos basados en la no digestión del ensamblaje de ácidos nucleicos.

El ensamblaje de los ácidos nucleicos que codifican una biblioteca de polipéptidos modulares sintéticos como se describe en la presente no se limita a las estrategias de ensamblaje basadas en la digestión, por ejemplo, basadas en enzimas de restricción. En algunos casos, los métodos basados en la no digestión se pueden utilizar en el ensamblaje de una biblioteca como se describe en la presente, lo que incluye, de modo no taxativo, por ejemplo, estrategias basadas en la amplificación, estrategias basadas en la recombinación, etc. Los métodos basados en la no digestión se pueden utilizar en lugar de las estrategias basadas en la digestión, es decir, de manera que la estrategia completa de ensamblaje en su totalidad no implica la digestión de enzimas de restricción o se puede utilizar en combinación con estrategias basadas en la digestión, es decir, de manera que la estrategia de ensamblaje en su totalidad implica tanto métodos basados en la digestión como métodos basados en la no digestión de enzimas de restricción.

En algunos casos, una biblioteca de polipéptidos modulares sintéticos, como se describe en la presente, se puede ensamblar, en su totalidad o en parte, usando el ensamblaje basado en la amplificación, lo que incluye, de modo no taxativo, por ejemplo, clonación por PCR, clonación TA, extensión de salientes por PCR y similares. Dichas estrategias basadas en la amplificación variarán, pero generalmente utilizarán múltiples sitios de unión a cebadores dentro de los vectores de partida y/o fragmentos de ácido nucleico. Dichos sitios de unión a cebadores, dependiendo del producto final deseado, se pueden agregar específicamente a los vectores y/o fragmentos de ácido nucleico o la presencia de secuencias preexistentes en un vector o fragmento de ácido nucleico se puede utilizar como sitio de unión a cebadores de acuerdo con diversas estrategias de ensamblaje basadas en la amplificación. Los sitios de unión a cebadores se pueden colocar en cualquier configuración y/u orientación conveniente que sea suficiente para producir el producto clonado deseado, lo que incluye, de modo no taxativo: colocados entre una secuencia de codificación del módulo y su código de barras respectivo en una orientación 5' a 3' hacia la secuencia de codificación del módulo; colocado entre una secuencia de codificación del módulo y su código de barras respectivo en una orientación 5' a 3' hacia el código de barras; colocado antes (es decir, 5') de la secuencia de codificación del módulo en una orientación 5' a 3' hacia la secuencia de codificación del módulo; colocado posterior (es decir, 3') a la secuencia de código de barras del módulo en una orientación 5' a 3' hacia la secuencia de código de barras del módulo y similares. Las primeras secuencias del sitio de unión se pueden configurar de modo que luego de la clonación basada en la amplificación, lo que incluye después de una ronda de clonación basada en la amplificación, una o más secuencias enlazadoras deseadas estén presentes entre los elementos ensamblados que incluyen, por ejemplo, secuencias de codificación del módulo ensambladas, secuencias de código de barras ensambladas, etc.

Como ejemplo no taxativo de estrategias de ensamblaje basadas en la amplificación, se puede utilizar una estrategia de extensión de salientes por PCR (figura 20) donde un primer vector contiene un primer sitio de unión a cebadores (PBS1) y un segundo sitio de unión a cebadores (PBS2) colocados, en una orientación opuesta 5' a 3', entre una secuencia de codificación del módulo y su respectiva secuencia de código de barras. Se utiliza un segundo vector o fragmento de ácido nucleico que tiene una segunda secuencia de codificación del módulo con código de barras y un segundo sitio de unión a cebadores (PBS1 y PBS2). Tras la extensión y amplificación mediante PCR de extensión de salientes usando los cebadores que se hibridan específicamente con los sitios PBS1 y PBS2, se produce un producto ensamblado donde la primera secuencia de codificación del módulo se une con un enlazador deseado a la segunda secuencia de codificación del módulo que se une a un código de barras de múltiples unidades que contiene el primer y segundo código de barras en una orientación opuesta en comparación con sus respectivas secuencias de codificación del módulo (figura 20).

En vista de las estrategias de ensamblaje descritas anteriormente, los expertos en la técnica comprenderán fácilmente cómo cualquiera de las estrategias descritas anteriormente se puede combinar en su totalidad o en parte para provocar un resultado deseado y/o maximizar las ventajas y/o minimizar las desventajas de las técnicas de clonación particulares de acuerdo con el ensamblaje con una biblioteca y/o componente de biblioteca deseado. Como ejemplo no taxativo, las estrategias basadas en la amplificación se pueden combinar con las estrategias basadas en la digestión, donde la combinación de dichas estrategias da lugar al ensamblaje de una biblioteca y/o componentes de biblioteca deseados. Por ejemplo, como se muestra en la figura 21, la digestión de enzimas de restricción de un primer vector de acuerdo con un sitio de reconocimiento de restricción (RE1) colocado entre una primera secuencia de codificación del módulo y su código de barras se puede combinar con la amplificación basada en PCR mediante el uso de sitios de unión a cebadores que flanquean una segunda secuencia de codificación del módulo con código de barras incluida dentro de un segundo vector o fragmento de ácido nucleico para permitir el ensamblaje anidado. Tras el ensamblaje de la estrategia de ensamblaje híbrida descrita, se produce un producto ensamblado donde la primera secuencia de codificación del módulo se une con un enlazador deseado a la segunda secuencia de codificación del módulo que se une a un código de barras de múltiples unidades que contiene el primer y segundo código de barras en una orientación opuesta en comparación con sus respectivas secuencias de codificación del módulo (figura 21).

Las estrategias híbridas no se limitan a la combinación de estrategias basadas en la digestión y amplificación y pueden incluir otros métodos de biología sintéticos y/o clonación en su totalidad o en parte, lo que incluye, de modo no taxativo, por ejemplo, estrategias de clonación basadas en la recombinación (lo que incluye, de modo no taxativo, por ejemplo, estrategias de clonación basadas en puertas, clonación basada en la recombinasa Cre/Flp (que incluye cuando el sitio se inactiva tras la recombinación), etc.), ensamblaje de secuencias de novo, síntesis de ácidos nucleicos de novo y similares. En algunos casos, las estrategias de clonación basadas en la recombinación, el ensamblaje de secuencias de novo, la síntesis de ácidos nucleicos de novo y similares se pueden utilizar de forma independiente, es decir, solas como una estrategia de clonación separada y no como parte de una estrategia de clonación híbrida.

En algunos casos, cuando la estrategia de clonación particular empleada provoca la presencia de una secuencia interviniente no deseada entre dos elementos clonados, conocidas también como cicatrices o costuras de clonación, dichas cicatrices de clonación se pueden reducir y/o quitar a través de escisión unimolecular y religación del vector que contiene cicatrices. La escisión unimolecular y religación se pueden lograr a través de cualquier método conveniente incluido, de modo no taxativo, por ejemplo, escisión unimolecular mediada por enzimas de restricción y religación tal como, por ejemplo, escisión unimolecular de tipo IIS y religación. Por ejemplo, en algunos casos, se posible quitar una costura, en parte o en su totalidad, que incluye todo un sitio de recombinación o parte de este de un ensamblaje basado en la recombinación a través de la escisión unimolecular y religación. En algunos casos, se posible quitar una costura, en parte o en su totalidad, de escisión que incluye todo un sitio de reconocimiento de enzimas de restricción, o parte de este, de un ensamblaje basado en la digestión a través de la escisión unimolecular y religación. En algunos casos, se posible quitar una costura, en parte o en su totalidad, que incluye todo un sitio de unión a cebadores, o parte de este, de un ensamblaje basado en la digestión a través de la escisión unimolecular y religación.

En una modalidad no taxativa, se produce una biblioteca combinatoria mediante clonación iterativa de cada dimensión de los componentes de la biblioteca a través del uso la clonación basada en la digestión y clonación en fusión. Por ejemplo, como se detalla en la figura 22, en una etapa, un ácido nucleico de partida (por ejemplo, un vector) que contiene una secuencia de codificación ScFv y un enlazador Gly/Ser adyacente se digiere en un sitio BamHI dentro del enlazador Gly/Ser o adyacente a este. En la etapa dos, un fragmento de ácido nucleico que contiene una primera secuencia de codificación del módulo unida a un segundo enlazador Gly/Ser fusionado con un primer código de barras específico para el módulo se clona en el sitio BamHI digerido mediante clonación en fusión. Después de la ligación mediante clonación en fusión se mantiene un enlazador Gly/Ser entre el ScFv y la primera secuencia de codificación del módulo. En la tercera etapa, el ácido nucleico ensamblado en la etapa 2 se digiere en un sitio BamHI importado dentro del enlazador Gly/Ser o adyacente a este del primer fragmento de ácido nucleico de la secuencia de codificación del módulo y se repite la clonación en fusión con un segundo fragmento de ácido nucleico que contiene una segunda secuencia de codificación del módulo unida a un tercer enlazador Gly/Ser fusionado con un segundo código de barras específico para el módulo. Similar a la etapa 2, después de la ligación mediante clonación en fusión se mantiene un enlazador Gly/Ser entre la primera y segunda secuencia de codificación del módulo. Cuando se deseen miembros de biblioteca de mayor dimensión, la etapa 3 se puede repetir de forma reiterada. En la etapa cuatro, la digestión en un sitio BamHI importado dentro del enlazador Gly/Ser o adyacente a este de la última secuencia de codificación del módulo agregada que contiene ácido nucleico permite la clonación en fusión de una secuencia indicadora terminal (por ejemplo, una secuencia de codificación de GFP que también contiene una secuencia de señales de “detención” (por ejemplo, un codón de detención”)) entre la secuencia de codificación del módulo final y la secuencia de código de barras de múltiples unidades posterior. En esta modalidad, cada miembro de la biblioteca resultante contiene un CAR en el marco combinatorio y un código de barras combinatorio que describe la arquitectura del CAR en el marco combinatorio.

Bibliotecas agrupadas

La presente descripción proporciona métodos para elaborar bibliotecas agrupadas de polipéptidos modulares sintéticos con código de barras. Por biblioteca agrupada se entiende que los miembros de la biblioteca están presentes en un recipiente común y/o solución común y los miembros individuales de la biblioteca no necesitan separarse de forma física en el espacio, por ejemplo, los miembros individuales de la biblioteca se pueden agrupar durante la construcción de la biblioteca (por ejemplo, como en un ensamblaje de “un solo paso”) o después de la construcción de los miembros individuales de la biblioteca. Por ejemplo, en el caso de una biblioteca de polipéptidos modulares sintéticos agrupada construida mediante el ensamblaje anidado combinatorio, los componentes de la biblioteca se pueden agrupar durante el ensamblaje de los miembros de la biblioteca, antes de la terminación del ensamblaje de los miembros de la biblioteca y/o después de la terminación del ensamblaje de los miembros de la biblioteca, etc. Las bibliotecas agrupadas como se utiliza en la presente, no se limitan a bibliotecas de polipéptidos modulares sintéticos desnudos sino también incluyen bibliotecas agrupadas de polipéptidos modulares sintéticos que expresan células, bibliotecas agrupadas de polipéptidos modulares sintéticos que codifican ácidos nucleicos y similares.

Por consiguiente, en algunos casos, los componentes de ácido nucleico individuales utilizados para ensamblar los miembros de la biblioteca se pueden agrupar antes del ensamblaje y pueden permanecer agrupados durante el ensamblaje de los miembros de la biblioteca. En otros casos, los miembros de la biblioteca ensamblados se pueden mezclar después del ensamblaje para generar una biblioteca agrupada.

Dado que las bibliotecas y los métodos de ensamblaje de bibliotecas que se describen en la presente implican la producción de miembros de la biblioteca que se puedan identificar mediante secuenciación de la región de códigos de barras asociada, los ácidos nucleicos individuales se pueden agrupar en cualquier punto antes, durante o después del ensamblaje e identificación y la cuantificación de miembros individuales de la biblioteca en ensayos posteriores sigue siendo posible. En algunos casos, la dimensionalidad final de una biblioteca se puede manipular mediante la agrupación de los componentes de la biblioteca en puntos particulares durante el ensamblaje. Por ejemplo, se puede obtener una biblioteca con dimensiones mixtas al ensamblar de forma separada las bibliotecas parciales de diferente dimensionalidad y posteriormente agrupar las bibliotecas parciales (por ejemplo, usando un ensamblaje de “dividir y agrupar”). En algunos casos, por ejemplo, luego de agrupar las bibliotecas parciales de diferente dimensionalidad, se puede realizar el ensamblaje adicional, lo que incluye la adición de dominios variables adicionales.

En una modalidad no taxativa, tal como se ilustra en la figura 23, una biblioteca agrupada de ácidos nucleicos que codifican el polipéptido CAR modular sintético se transforma en lote en linfocitos T primarios humanos para generar linfocitos T primarios que expresan el polipéptido CAR modular sintético. Opcionalmente, cuando los miembros de la biblioteca de polipéptidos CAR modulares sintéticos incluyen uno o más módulos indicadores, los linfocitos T transformados se pueden clasificar de acuerdo con su expresión del módulo indicador (lo cual sirve para indicar la expresión del polipéptido CAR modular sintético) con el fin de aislar las células transformadas con expresión uniforme de los miembros de la biblioteca de polipéptidos CAR modulares sintéticos. Dichos linfocitos T transformados que se expresan de forma uniforme y clasificados representan una biblioteca agrupada de linfocitos T que expresan polipéptidos CAR modulares sintéticos.

En algunos casos, se modula la eficiencia de la transformación de los ácidos nucleicos que expresan polipéptidos CAR modulares sintéticos y/o linfocitos T humanos primarios. Dicha modulación se puede realizar por diversos motivos prácticos, por ejemplo, para controlar la probabilidad de expresión de cada miembro de la biblioteca y/o para controlar la probabilidad que cada célula exprese como máximo un miembro de la biblioteca. Dicha modulación se puede lograr a través de cualquier método conveniente que incluya, de modo no taxativo, por ejemplo, modular la cantidad inicial de ácido nucleico que codifica el polipéptido CAR modular sintético presente durante la transformación, controlar la cantidad inicial de linfocitos T primarios presentes durante la transformación, controlar la relación del ácido nucleico codificador con respecto a los linfocitos T primarios durante la transformación y similares. Como tal, en algunos casos, se modula la eficiencia de la transformación de manera que esencialmente cada linfocito T expresa un único polipéptido CAR modular sintético. En algunos casos, se pueden cultivar, expandir, almacenar, etc., bibliotecas celulares agrupadas resultantes que expresan polipéptidos CAR modulares sintéticos únicos, de acuerdo con los requisitos de los ensayos corriente abajo.

Dichas bibliotecas agrupadas, ya sea de ácidos nucleicos agrupados, polipéptidos modulares agrupados, células transducidas agrupadas, etc., no se limitan a polipéptidos CAR modulares sintéticos que codifican ácidos nucleicos, polipéptidos CAR modulares sintéticos o polipéptidos CAR modulares sintéticos que expresan células (por ejemplo, linfocitos T). En la presente se puede agrupar cualquier biblioteca de polipéptidos modulares que codifican ácidos nucleicos, polipéptidos modulares y/o polipéptidos modulares que expresan células transducidas adecuados y producidos de acuerdo con los métodos, como se describe en la presente, de modo similar para generar una biblioteca agrupada útil, por ejemplo, en ensayos de cribado.

Los miembros individuales de las bibliotecas agrupadas, como se describe en la presente, se pueden identificar de forma positiva en virtud del código de barras con múltiples unidades específico que se asocia con cada miembro de la biblioteca. Debido al ensamblaje anidado combinatorio específico que provoca una relación posicional predecible entre cada secuencia de codificación del módulo y su respectiva secuencia de código de barras, la identidad y arquitectura de cada polipéptido modular sintético se puede reconstruir mediante la secuenciación simple del código de barras con múltiples unidades asociado. Como tal, en algunos casos, es posible determinar las identidades y/o la arquitectura de los miembros individuales de una biblioteca de polipéptidos modulares sintéticos a partir de la información de secuencia relacionada con las regiones con código de barras de los miembros de la biblioteca. Por ejemplo, en algunos casos, la complejidad y/o cada miembro individual de una biblioteca agrupada, como se describe en la presente, se puede determinar, por ejemplo, después de la construcción de la biblioteca, después del uso de la biblioteca en un ensayo particular, etc.

Componentes compartimentados de la biblioteca

Los miembros individuales de ácido nucleico que comprenden una región de codificación y una región de código de barras pueden, en algunos casos, estar compartimentados. No es necesario que las bibliotecas agrupadas y las bibliotecas con componentes compartimentados sean mutuamente exclusivas y, por lo tanto, una biblioteca puede, en algunos casos, estar agrupada y contener componentes compartimentados en distintos momentos, por ejemplo, se puede construir una biblioteca, los miembros de la biblioteca se pueden ensamblar, como un conjunto, por ejemplo, como en un ensamblaje de un solo recipiente, y luego se pueden compartimentar posteriormente, por ejemplo, mediante transfección de los miembros de la biblioteca de ácido nucleico en células individuales o compartimentos no celulares. En otros casos, los miembros se pueden compartimentar durante una parte de su ensamblaje y luego agruparse posteriormente para procesos adicionales que incluyen, de modo no taxativo, por ejemplo, ensamblaje o cribado adicional. En general, los ácidos nucleicos que codifican el polipéptido sintético con código de barras ensamblados de acuerdo con el ensamblaje anidado y las estrategias de clonación, como se describe en la presente, se ensamblan como un grupo y se pueden compartimentar o no posteriormente.

La compartimentación de ácidos nucleicos que codifican los polipéptidos sintéticos con código de barras ensamblados se puede lograr mediante cualquier método conveniente que permita la transcripción y traducción a partir de miembros individuales de la biblioteca de ácidos nucleicos de manera que el miembro de la biblioteca de ácidos nucleicos permanece asociado con el producto codificado de este. En algunos casos, como se describirá más detalladamente a continuación, la compartimentación se puede lograr a través de la creación de las bibliotecas celulares, donde las células individuales sirven como el “compartimento” y proporciona la traducción y transcripción a partir de los miembros de la biblioteca de ácidos nucleicos.

En algunos casos, la compartimentación se puede lograr a través de la creación de bibliotecas no celulares, por ejemplo, bibliotecas basadas en la encapsulación. Las bibliotecas basadas en la encapsulación libres de células incluirán generalmente una emulsión de dos o más líquidos inmiscibles donde los miembros de la biblioteca de ácidos nucleicos son solubles en un primer líquido, por ejemplo, un líquido acuoso tal como agua o amortiguador acuoso, e insolubles en un segundo líquido, por ejemplo, un aceite u otro solvente orgánico, de manera que el primer líquido forma compartimentos, por ejemplo, gotitas, que contienen miembros individuales de la biblioteca. Se puede configurar una biblioteca que contiene emulsiones de manera que cada compartimento tiene cualquier cantidad deseada de miembros individuales de la biblioteca, lo que incluye, de modo no taxativo, como máximo un miembro por compartimento. Los miembros de ácido nucleico de bibliotecas encapsuladas se pueden transcribir (por ejemplo, transcribir in vitro) y traducir (por ejemplo, traducir in vitro) en condiciones de modo que los productos de transcripción y traducción permanezcan asociados, es decir, permanezcan dentro del compartimento, con el miembro individual de la biblioteca de ácidos nucleicos a partir del cual se codifican. Se puede utilizar cualquier método conveniente y adecuado para generar una biblioteca encapsulada de polipéptidos codificados por ácidos nucleicos en los métodos descritos en la presente, incluidos, de modo no taxativo, por ejemplo, aquellos descrios en Bernath et ál. Anal Biochem. (2004) 325(1):151-7.

Después de la producción del producto codificado del miembro de la biblioteca dentro del compartimento, el miembro de la biblioteca de ácidos nucleicos y el polipéptido modular sintético codificado se pueden unir o no físicamente. Por ejemplo, en algunos casos, el miembro de la biblioteca de ácidos nucleicos y el producto codificado puede estar unido, por ejemplo, a través de cualquier método adecuado y conveniente que incluya el enlace químico o conjugación (es decir, la generación de un enlace covalente entre el miembro de la biblioteca de ácidos nucleicos y el polipéptido modular sintético codificado) o a través de la unión molecular (por ejemplo, a través de la unión directa entre el miembro de la biblioteca y el polipéptido modular sintético codificado o a través de la unión indirecta entre el miembro de la biblioteca y el producto codificado mediado por uno o más intermedios de unión (por ejemplo, compañeros de unión, sustratos, etc.). Es posible utilizar cualquier método conveniente y adecuado para unir polipéptidos codificados compartimentados a miembros de la biblioteca de ácidos nucleicos en los métodos descritos en la presente que incluyen, de modo no taxativo, por ejemplo, el uso de un sustrato que comprende un agente de unión a la etiqueta del epítopo acoplado que se une específicamente a una etiqueta del epítopo codificada por el miembro de la biblioteca de ácidos nucleicos, por ejemplo, como se describe en Griffiths & Tawfik. EMBO J (2003022(1):24-35. En algunos casos, después de la unión los miembros de la biblioteca de ácidos nucleicos se pueden compartimentar, por ejemplo, agrupar y cribar además como una biblioteca agrupada.

En algunos casos, el miembro de la biblioteca de ácidos nucleicos y el producto codificado permanecen lo suficientemente asociados sin estar unidos físicamente, por ejemplo, a través de la compartimentación dentro del compartimento, lo que incluye compartimentos celulares y no celulares.

La compartimentación, ya sea celular o no celular, permite generalmente la identificación del polipéptido modular sintético o parte de este, que se correlaciona con un fenotipo detectado a través de la secuenciación de la región de códigos de barras del ácido nucleico del miembro individual de la biblioteca que codifica el polipéptido modular sintético el cual permanece asociado con el polipéptido modular sintético por la naturaleza de su compartimentación o como resultado de un enlace físico formado durante su compartimentación.

Bibliotecas celulares

Como se describe en algunos detalles anteriores, las bibliotecas como se utiliza en la presente, incluyen bibliotecas celulares donde las células de la biblioteca expresan polipéptidos modulares sintéticos. La transformación de polipéptidos modulares sintéticos que codifican ácidos nucleicos se puede realizar mediante cualquier método que incluye, de modo no taxativo, por ejemplo, transfección viral, electroporación, lipofección, bombardeo, transformación química, uso de un portador transducible (por ejemplo, una proteína portadora transducible) y similares. En algunos casos, la célula en la que se transforma un ácido nucleico que codifica un polipéptido modular sintético se denomina en la presente célula huésped.

Las células huésped pueden expresar un único ácido nucleico individual con código de barras que codifica un único polipéptido modular y pueden expresar múltiples, incluso dos o más ácidos nucleicos individuales que codifican polipéptidos modulares sintéticos únicos. Se entenderá que se puede controlar la cantidad de ácidos nucleicos con código de barras individuales expresados por una célula huésped, por ejemplo, mediante el control de la frecuencia o probabilidad de suministro de los ácidos nucleicos en cuestión en la célula huésped, por ejemplo, mediante la modulación de los parámetros del método de suministro. En algunos casos, la cantidad resultante de ácidos nucleicos con código de barras individuales que codifican polipéptidos modulares sintéticos únicos presentes en una célula huésped se la conoce como la multiplicidad de infección (MOI, por sus siglas en inglés) y se puede definir como la relación de ácidos nucleicos con respecto a las células huésped antes o después del suministro. Los métodos de modulación de MOI convencionales, por ejemplo, al aumentar o disminuir la relación de ácidos nucleicos con respecto a las células huésped antes del suministro, se pueden emplear para obtener una cantidad final deseada de ácidos nucleicos con código de barras individuales que codifican polipéptidos modulares sintéticos únicos por célula huésped después del suministro.

Los ácidos nucleicos que codifican polipéptidos modulares sintéticos se pueden transformar en cualquier célula huésped o línea celular, incluidas, por ejemplo, células procariotas y eucariotas. La selección de un tipo de célula huésped dependerá de una cantidad de factores, que incluyen el tipo de biblioteca de polipéptidos modulares sintéticos a cribar y el ensayo de cribado particular. En algunos casos, una célula huésped puede ser una célula procariota, que incluye, de modo no taxativo, Ácidobacterias, Actinobacterias, Acuíficas, Bacteroidetes, Caldiserica, Clamidias, Chlorobi, Chloroflexi, Crisiogenetas, Cianobacterias, Deferribacteres, Deinococcus-Thermus, Dictioglomi, Elusimicrobios, Fibrobacterias, Firmicutes, Fusobacterias, Gemmatimonadetes, Lentisfaeras, Nitrospira, Planctomicetos, Proteobacterias, Espiroquetas, Synergistetes, Tenericutes, Termodesulfobacterias, Termotogas y Verrucomicrobios. En determinadas modalidades, una célula huésped puede ser una célula bacteriana, por ejemplo, E. coli. En algunos casos, se puede utilizar una cepa bacteriana convencional, que incluye, de modo no taxativo, por ejemplo, aquellas que se encuentran disponibles a través de proveedores tales como la American Type Culture Collection (ATCC) (Colección de Cultivos Tipo de Estados Unidos) (Manassas, VA), Life Technologies, Inc. (Grand Island, NY) y similares.

Las células eucariotas adecuadas incluyen células primarias y células cultivadas derivadas originalmente de un animal huésped que incluyen, de modo no taxativo, por ejemplo, mamíferos (incluidos, por ejemplo, humanos, primates, monos, ungulados, caninos, felinos, conejos, roedores, etc.), reptiles, anfibios, (por ejemplo, xenopus, salamandra, tritón, etc.) peces (por ejemplo, pez zebra, etc.), aves (por ejemplo, gallinas, etc.), invertebrados (por ejemplo, insectos (por ejemplo, mosca de la fruta, etc.) gusanos (por ejemplo, nematodos, etc.) invertebrados marinos (por ejemplo, erizo de mar, etc.), etc.), levadura y similares. En determinadas modalidades, las células pueden ser células de roedores primarias o células de roedores cultivadas derivadas de un ratón o rata. En otras modalidades, las células pueden ser células humanas primarias o células humanas cultivadas. Se puede utilizar cualquier célula eucariota conveniente como célula huésped dependiendo de la biblioteca particular a cribar y el ensayo de cribado particular, donde en algunos casos, se pueden utilizar líneas celulares eucariotas convencionales, lo que incluye, de modo no taxativo, por ejemplo, aquellas disponibles en el mercado a través de proveedores tales como la American Type Culture Collection (ATCC) (Manassas, VA), Life Technologies, Inc. (Grand Island, NY) y similares.

En algunos casos, las células de una biblioteca celular son células primarias (por ejemplo, monocitos primarios, linfocitos primarios (por ejemplo, linfocitos T primarios, linfocitos B primarios, linfocitos citolíticos espontáneos, etc.), células dendríticas primarias, etc.), células endoteliales primarias, células epiteliales primarias, fibroblastos primarios, células madre hematopoyéticas primarias, queratinocitos primarios, melanocitos primarios, células madre mesenquimales primarias, preadipocitos primarios, células musculares primarias, (por ejemplo, células del músculo liso primarias, células del músculo esquelético, etc.), etc. En algunos casos, las células de una biblioteca celular se establecen en líneas celulares (por ejemplo, células Jurkat, etc.). En algunos casos, las células de una biblioteca celular son células específicas para el paciente (células inmunes específicas para el paciente (por ejemplo, linfocitos T primarios, etc.), células madre específicas para el paciente (por ejemplo, células madre hematopoyéticas, células madre mesenquimales, células madre derivadas adiposas, etc.), células cancerosas específicas para el paciente (por ejemplo, células tumorales, células de cáncer sanguíneo, etc.).

Las células de mamífero adecuadas incluyen células primarias y líneas celulares inmortalizadas. Las líneas celulares de mamífero incluyen líneas celulares humanas, líneas celulares de primates no humanos, líneas celulares de roedores (por ejemplo, ratón, rata) y similares. Las líneas celulares de mamífero adecuadas incluyen, de modo no taxativo, células HeLa (por ejemplo, Colección Americana de Cultivos Tipo (ATCC) n.° CCL-2), células CHO (por ejemplo, ATCC n.° CRL9618, CCL61, CRL9096), células 293 (por ejemplo, ATCC n.° CRL-1573), células Vero, NIH células 3T3 (por ejemplo, ATCC n.° CRL-1658), células Huh-7, células BHK (por ejemplo, ATCC n.° CCL10), células PC12 (ATCC n.° CRL1721), células COS, células COS-7 (ATCC n.° CRL1651), células RAT1, células L de ratón (ATCC n.° CCLI.3), células de riñón embrionario humano (HEK) (ATCC n.° CRL1573), células HLHepG2, Hut-78, Jurkat, HL-60, líneas celulares NK (por ejemplo, NKL, NK92, e YTS), y similares.

En algunos casos, la célula no es una línea celular inmortalizada, sino que es una célula (por ejemplo, una célula primaria) obtenida de un individuo. Por ejemplo, en algunos casos, la célula es una célula inmunitaria obtenida de un individuo. Como ejemplo, la célula es un linfocito T obtenido de un individuo. Como otro ejemplo, la célula es una célula citotóxica obtenida de un individuo. Como otro ejemplo, la célula es una célula madre o célula progenitora obtenida de un individuo.

Después de la transformación de múltiples ácidos nucleicos que codifican polipéptidos modulares sintéticos de una biblioteca las células huésped transformadas se pueden clasificar de acuerdo con su expresión de polipéptidos modulares sintéticos, por ejemplo, para quitar aquellas células que no expresan polipéptidos modulares sintéticos a partir de la biblioteca, para aislar aquellas células que expresan polipéptidos modulares sintéticos por encima de un umbral de expresión particular, para aislar solamente aquellas células que expresan polipéptidos modulares sintéticos por debajo de un umbral de expresión particular, para aislar solamente aquellas células que expresan polipéptidos modulares sintéticos dentro de un intervalo particular de expresión, etc. En algunos casos, clasificar las células transformadas de acuerdo con la expresión se puede realizar con el fn de aislar solamente aquellas células en la biblioteca que tienen expresión uniforme, donde la expresión uniforme puede variar de acuerdo con las aplicaciones particulares y puede, en algunos casos, definirse como un nivel de expresión dentro de un intervalo particular por encima y debajo de la expresión media de la población.

En determinadas modalidades, la clasificación de las células transformadas de acuerdo con su expresión de los miembros de la biblioteca, por ejemplo, la clasificación de las células que tienen expresión o expresión aproximadamente igual de miembros de la biblioteca, permite una mejor evaluación de la influencia del miembro de la biblioteca y/o los módulos incluidos allí. Por ejemplo, al aislar solamente aquellas células que expresan los miembros de la biblioteca dentro de un intervalo definido, la identificación de los miembros de la biblioteca como la influencia de un fenotipo particular se basará en la función real de los miembros de la biblioteca y aquellos módulos incluidos allí en vez de cuán bien se expresa el miembro de la biblioteca particular. En algunas modalidades, por ejemplo, cuando se realiza un cribado semicuantitativo de la frecuencia de los miembros individuales de la biblioteca y/o los módulos de estos, clasificar la célula que expresa los miembros de la biblioteca dentro de un intervalo predefinido permite el cribado cuantitativo más preciso y la cuantificación de esos miembros y/o módulos de la biblioteca de acuerdo con su influencia en un fenotipo particular y no en su nivel de expresión relativo.

Además, clasificar permite la identificación de miembros de la biblioteca y módulos de esta que funcionan para producir o influenciar un fenotipo particular cuando se expresa dentro de un intervalo de expresión particular por encima o por debajo de un umbral particular incluso, por ejemplo, cuando se expresa a un nivel bajo o cuando se expresa a un nivel alto.

Normalización de bibliotecas

Las bibliotecas de la presente descripción se pueden normalizar o no dependiendo del contexto en el cual se elabora la biblioteca y/o el uso final previsto de la biblioteca. Por “normalizado/a”, tal como se utiliza en la presente, en referencia a las bibliotecas descritas, se entiende que las cantidades relativas de cada miembro de la biblioteca se ajustan al menos para que estén más cerca de lo que estaban las cantidades relativas de cada miembro de la biblioteca antes del ajuste. En algunos casos, la normalización de una biblioteca hace que una biblioteca tenga un intervalo más pequeño entre la cantidad de los miembros más representados de la biblioteca y la cantidad de los miembros menos representados de la biblioteca. En algunos casos, la normalización provoca un aumento en la cantidad de los miembro/s menos representados de la biblioteca. En algunos casos, la normalización provoca una disminución en la cantidad de los miembro/s más representados de la biblioteca.

En algunos casos, la normalización de la biblioteca puede incluir cuantificar la totalidad o la mayoría del muestreo representativo (o la totalidad o la mayoría de un muestreo representativo) de los miembros de la biblioteca para determinar la cantidad relativa de cada miembro de la biblioteca dentro de la biblioteca. Después de la cuantificación, se realiza un ajuste de acuerdo con la cuantificación para equilibrar la presencia relativa de cada miembro de la biblioteca dentro de la biblioteca. Dependiendo del contexto, dicho ajuste se puede realizar directamente en la biblioteca ya producida de manera que la biblioteca se normaliza directamente. De manera alternativa, se puede realizar un ajuste en el método de preparación de bibliotecas de manera que se normalizará la siguiente biblioteca preparada.

Se puede normalizar cualquier biblioteca de la presente descripción, incluidas, de modo no taxativo, por ejemplo, bibliotecas de ácidos nucleicos, bibliotecas de polipéptidos, bibliotecas encapsuladas no celulares, bibliotecas celulares, etc., y dependiendo de la biblioteca a normalizar, se pueden utilizar diversos métodos. Por ejemplo, dependiendo del tipo de biblioteca a normalizar, se pueden utilizar diversos métodos para cuantificar las cantidades relativas de los miembros de la biblioteca. Se pueden utilizar diversos métodos para cuantificar los miembros de una biblioteca de ácidos nucleicos que incluyen, de modo no taxativo, por ejemplo, secuenciación cuantitativa (por ejemplo, secuenciación de última generación), PCR cuantitativa, hibridación cuantitativa (por ejemplo, micromatriz) y similares. Se pueden utilizar diversos métodos para cuantificar los miembros de una biblioteca de polipéptidos que incluyen, de modo no taxativo, por ejemplo, espectrometría de masas cuantitativa, ELISA y similares. Se pueden utilizar diversos métodos para cuantificar los miembros de una biblioteca celular que incluyen, de modo no taxativo, por ejemplo, citometría de flujo, inmunohistoquímica, secuenciación cuantitativa (por ejemplo, secuenciación de última generación), PCR cuantitativa, hibridación cuantitativa (por ejemplo, micromatriz) y similares.

En algunos casos, una vez que los miembros de una biblioteca se cuantifican, se pueden calcular el o los ajustes necesarios para su normalización. Se puede emplear cualquier método conveniente y adecuado de cálculo de normalización dependiendo del tipo de biblioteca y/o el tamaño de la biblioteca. En algunos casos, se puede utilizar una ecuación lineal, que incluye, de modo no taxativo, por ejemplo, la ecuación lineal que se presenta en la figura 28.

En algunos casos, una vez que se calcula la normalización para cada miembro de la biblioteca, la biblioteca se puede ajustar. Se pueden emplear diversos métodos para el ajuste directo de una biblioteca. Por ejemplo, en algunos casos, una biblioteca celular se puede normalizar usando FACS para clasificar una cantidad igual de células que representan cada miembro de la biblioteca ya sea en un grupo o en compartimentos direccionables de forma individual. En algunos casos, cuando una biblioteca ya está compartimentada, la biblioteca se puede normalizar ajustando el volumen de cada compartimento que incluye, por ejemplo, cuando concentraciones diferentes de miembros de la biblioteca en cada compartimento se normalizan agregando un volumen específico de líquido a cada compartimento suficiente para equilibrar las concentraciones.

En algunos casos, se puede realizar la normalización de una biblioteca agrupada de ácidos nucleicos. Las bibliotecas agrupadas de ácidos nucleicos se pueden normalizar por distintos motivos. En una modalidad, se puede normalizar una biblioteca agrupada de ácidos nucleicos para compensar la infrarrepresentación o sobrerrepresentación de los miembros individuales de la biblioteca dentro de la biblioteca, por ejemplo, debido la incorporación eficiente excedente o faltante de módulos de ácidos nucleicos en los miembros de la biblioteca durante un ensamblaje combinatorio.

En algunos casos, es posible cuantificar los miembros de una biblioteca de ácido nucleico y/o módulos de ácido nucleico que constituyen los miembros de la biblioteca (por ejemplo, mediante secuenciación cuantitativa). Después de dicha cuantificación, se calcula el ajuste de cada miembro necesario para la normalización. En una modalidad, se puede aplicar el ajuste calculado al siguiente ensamblaje combinatorio de la biblioteca, por ejemplo, se puede ajustar la cantidad de cada módulo de ácido nucleico para ensamblar la biblioteca de ácido nucleico de acuerdo con la representación relativa de ese módulo en la biblioteca cuantificada. Por lo tanto, mediante el ajuste de la cantidad inicial de módulos de ácido nucleico antes del siguiente ensamblaje de la biblioteca, se normalizará la biblioteca combinatoria resultante. Por consiguiente, en algunos casos, la normalización de una biblioteca descrita en la presente puede incluir el ensamblaje de la biblioteca, seguido de la cuantificación de la biblioteca ensamblada y el reensamblaje de una versión normalizada de la biblioteca que se basa en la cuantificación.

MÉTODOS DE CRIBADO

Se proporcionan métodos para cribar bibliotecas de polipéptidos modulares sintéticos que incluyen, de modo no taxativo, por ejemplo, métodos de cribado in vitro y métodos de cribado in vivo. Por “cribado in vivo” se entiende generalmente que se analiza una biblioteca que contiene múltiples polipéptidos modulares sintéticos únicos dentro del contexto biológico de un organismo viviente. Los organismos vivientes que se analizan in vivo de acuerdo con los métodos descritos en la presente incluyen organismos unicelulares y multicelulares.

El cribado in vivo de un organismo unicelular implica generalmente poner en contacto un organismo unicelular con una biblioteca de polipéptidos modulares sintéticos, donde la biblioteca de polipéptidos modulares sintéticos puede ser una biblioteca de polipéptidos o una biblioteca celular que expresa polipéptidos modulares sintéticos y detectar un fenotipo en el organismo unicelular. En otros casos, el cribado in vivo de un organismo unicelular puede incluir poner en contacto un organismo unicelular o múltiples organismos unicelulares con una biblioteca de ácidos nucleicos que codifica polipéptidos modulares sintéticos en condiciones suficientes para la expresión de los polipéptidos modulares sintéticos codificados por organismos unicelulares.

El cribado in vivo de un organismo multicelular implica generalmente poner en contacto un organismo multicelular con una biblioteca de polipéptidos modulares sintéticos, donde la biblioteca de polipéptidos modulares sintéticos puede ser una biblioteca de polipéptidos o una biblioteca celular que expresa polipéptidos modulares sintéticos y detectar un fenotipo en el organismo multicelular. En otros casos, el cribado in vivo de un organismo multicelular puede incluir poner en contacto un organismo multicelular o múltiples organismos multicelulares con una biblioteca de ácidos nucleicos que codifica polipéptidos modulares sintéticos en condiciones suficientes para la expresión de los polipéptidos modulares sintéticos codificados por el o los organismos multicelulares. Es posible emplear un organismo multicelular conveniente en el cribado in vivo de una biblioteca como se describe en la presente, dependiendo de la biblioteca particular a cribar y el ensayo in vivo particular utilizado, donde los organismos multicelulares particulares incluyen, de modo no taxativo, por ejemplo, mamíferos (por ejemplo, ratones, ratas, etc.).

Por “cribado in vitro” se entiende generalmente que se analiza una biblioteca que contiene múltiples polipéptidos modulares sintéticos únicos fuera del contexto biológico normal, por ejemplo, fuera de los módulos de polipéptidos de la biblioteca, del material biológico utilizado en la prueba o el fenotipo utilizado. Por ejemplo, en algunos casos, el cribado in vitro se puede realizar usando un contexto artificial o experimental sintético que incluye, de modo no taxativo, por ejemplo, una muestra aislada, una célula aislada, un cultivo celular, un tejido disecado o aislado, una muestra definida, un medio definido, un tejido artificial, un órgano artificial, un extracto celular, un extracto de tejido, un conjunto de muestras, etc. El cribado in vitro se puede realizar en cualquier recipiente conveniente y adecuado lo cual incluye, de modo no taxativo, por ejemplo, un recipiente de reacción, un cámara de reacción, un tubo, un matraz, una placa, un frasco, un disco, un portaobjetos y similares.

El cribado in vitro de una muestra, que incluye una muestra celular o una muestra no celular, implica generalmente poner en contacto una muestra con una biblioteca de polipéptidos modulares sintéticos, donde la biblioteca de polipéptidos modulares sintéticos puede ser una biblioteca de polipéptidos o una biblioteca celular que expresa polipéptidos modulares sintéticos y detectar un fenotipo u otra reacción o fenotipo molecular. Se puede utilizar cualquier muestra conveniente en el cribado in vitro de una biblioteca, como se describe en la presente, dependiendo de la biblioteca particular a cribar y del ensayo in vitro particular utilizado, donde las muestras particulares incluyen, de modo no taxativo, por ejemplo, muestras biológicas, muestras celulares, muestras de polipéptidos, muestras de ácido nucleico, muestras químicas y similares.

En algunos casos, las bibliotecas de polipéptidos modulares sintéticos libres de células se pueden cribar in vitro. Por ejemplo, se puede cribar una biblioteca de polipéptidos modulares sintéticos compartimentada en busca de un fenotipo al poner en contacto la biblioteca de polipéptidos modulares sintéticos compartimentada con uno o más agentes con los cuales se pronostica reaccionar los miembros individuales de la biblioteca. Es posible utilizar cualquiera de los métodos convenientes para cribar bibliotecas de polipéptidos libres de células, ya sea encapsuladas o agrupadas, en los métodos descritos en la presente, que incluyen, de modo no taxativo, por ejemplo, detección basada en citometría de flujo o detección basada en FACS de un fenotipo en ensayos basados en encapsulación libre de células, por ejemplo, como se describe en Griffiths & Tawfik. EMBO J (2003) 22(1):24-35 y Bernath et ál. Anal Biochem (2004) 325(1):151-7.

Fenotipos y métodos de identificación

Los métodos para cribar, ya sea in vivo o in vitro, implicarán generalmente la detección de un fenotipo y la identificación de uno o más miembros de la biblioteca que se asocian con el fenotipo. Tal como se utiliza en la presente, la expresión “fenotipo” hace referencia generalmente a una característica de una molécula, una célula, un tejido, un órgano o un organismo que se detecta en un ensayo particular y, por lo tanto, puede incluir, de modo no taxativo, por ejemplo, fenotipos moleculares, fenotipos celulares, fenotipos de organismos, fenotipos de tejido, fenotipos de órganos, fenotipos de organismos, etc. Un fenotipo detectado en un ensayo particular puede ser un fenotipo predeterminado, por ejemplo, un fenotipo conocido o esperado (por ejemplo, que incluye un nivel conocido o esperado de una característica particular, la presencia o ausencia de una característica de nivel conocida o esperada, etc.), o puede ser identificado en el momento del ensayo, por ejemplo, un fenotipo recién detectado o previamente no determinado (por ejemplo, que incluye un nivel recién detectado o previamente no determinado de una característica particular, la presencia o ausencia de una característica recién detectada o previamente no determinada, etc.). Es posible utilizar cualquier ensayo conveniente para detectar un fenotipo importante para una biblioteca de polipéptidos modulares sintéticos, como se describe en la presente, al cribar dichas bibliotecas.

El cribado de una biblioteca de polipéptidos modulares sintéticos o ácidos nucleicos que codifican una biblioteca de polipéptidos modulares sintéticos permite la identificación de polipéptidos y/o partes de módulos de estos que producen eficazmente un fenotipo deseado. Por consiguiente, la presente descripción incluye generalmente polipéptidos identificados mediante el cribado de las bibliotecas descritas en la presente.

En algunos casos, se detecta un fenotipo celular después de poner en contacto una población de células con una biblioteca, como se describe en la presente. Los fenotipos celulares pueden incluir, de modo no taxativo, por ejemplo, comportamientos celulares (que incluyen, de modo no taxativo, por ejemplo, viabilidad celular, proliferación celular, activación celular, morfología celular, migración celular, adherencia celular, diferenciación celular, pluripotencia celular, etc.), expresión celular, expresión de proteínas, expresión de ARN no codificador, activación génica, represión génica, etc.), expresión del indicador (lo que incluye, de modo no taxativo, por ejemplo, expresión indicadora del transgén, expresión de marcadores) y similares.

En algunos casos, se detecta un tejido, órgano o fenotipo de organismos después de poner en contacto un tejido, un órgano u organismo con una biblioteca, como se describe en la presente. Los fenotipos del tejido incluyen, de modo no taxativo, por ejemplo, viabilidad tisular, morfología tisular, características físicas del tejido (lo que incluye, de modo no taxativo, por ejemplo, función de barrera, resistencia mecánica, elasticidad, etc.), expresión del tejido (lo que incluye, de modo no taxativo, por ejemplo, expresión génica tisular, expresión proteica tisular, etc.), expresión indicadora tisular (lo que incluye, de modo no taxativo, por ejemplo, expresión indicadora del transgén, expresión de marcadores) y similares. Los fenotipos de órganos incluyen, de modo no taxativo, por ejemplo, apariencia del órgano, viabilidad del órgano, morfología del órgano, función del órgano (lo que incluye, de modo no taxativo, por ejemplo, biomolécula (por ejemplo, enzima, metabolito, proteína, etc.) producción, filtración, función mecánica, etc.). Los fenotipos de organismos incluyen, de modo no taxativo, por ejemplo, la apariencia del organismo, la viabilidad del organismo (por ejemplo, vida útil), fisiología del organismo, fertilidad/fecundidad del organismo, comportamiento del organismo, etc.

En algunos casos, se puede cribar un fenotipo en relación con un estado de la enfermedad donde el estado de la enfermedad puede ser un estado de la enfermedad modelado (por ejemplo, una célula, tejido u organismo que ha sido alterado o tratado para que muestre características de una enfermedad particular) o puede ser un estado de la enfermedad clínica (por ejemplo, un organismo que muestre características de una enfermedad o al que se le ha diagnosticado una enfermedad o células o tejido derivados de esta). Se pueden cribar fenotipos relacionados con la enfermedad en cualquier nivel conveniente que incluye, de modo no taxativo, por ejemplo, el nivel celular, el nivel tisular, el nivel del órgano, el nivel de organismos. En algunos casos, los fenotipos de la enfermedad analizados pueden ser fenotipos de la enfermedad que provocan el propio agente lo que incluye, de modo no taxativo, por ejemplo, fenotipos tumorales, fenotipos de células cancerosas, fenotipos de células autoinmunes, fenotipos de agentes infecciosos (bacterianos, virales, etc.), etc. En otros casos, los fenotipos de la enfermedad analizados pueden ser fenotipos de la célula, tejido u organismo afectados por la enfermedad o asociados con el modelo de la enfermedad que proporciona información sobre la presencia y/o avance de la enfermedad, lo cual incluye, de modo no taxativo, por ejemplo, activación celular (por ejemplo, activación de células autoinmunes), respuesta de la enfermedad (por ejemplo, respuesta inmunitaria) biomarcadores, conteos celulares, fisiología del organismo, resultados clínicos, etc.

En algunos casos, la evaluación de un fenotipo se puede realizar a nivel de la población, por ejemplo, se puede evaluar una población de células, se evalúa una población de organismos, etc. En algunos casos, en una evaluación de fenotipos basada en la población, se puede medir el efecto de un miembro de la biblioteca particular en la presencia o ausencia de un fenotipo de la población. Por ejemplo, se puede evaluar el efecto de un miembro de la biblioteca particular en un fenotipo celular de una población de células. En otros casos, se puede evaluar el efecto de un miembro de la biblioteca particular en un fenotipo del organismo de una población de organismos.

En algunas modalidades, se evalúa el fenotipo en respuesta a un estímulo aplicado donde la aplicación del estímulo incluye, de modo no taxativo, por ejemplo, poner en contacto las células con el estímulo, poner en contacto el tejido con el estímulo, poner en contacto un órgano con el estímulo, poner en contacto un organismo con el estímulo, etc. Como tal una muestra de prueba o sujeto de prueba se puede poner en contacto con un estímulo in vitro o in vivo dependiendo del ensayo empleado, dependiendo del estímulo y dependiendo de la biblioteca particular que se analice. Se pueden utilizar diferentes estímulos solos o en combinación. Un estímulo puede ser un estímulo libre (por ejemplo, un estímulo soluble, un ligando libre, etc.), unido (por ejemplo, unido a un soporte sólido), estímulo expresado celular (por ejemplo, una molécula coestimuladora expresada, un antígeno expresado, un ligando celular expresado, etc.) y similares.

En algunas modalidades, una población de linfocitos T que expresa una biblioteca de CAR modulares sintéticos se pone en contacto in vitro con un estímulo y se detecta un fenotipo resultante. Los estímulos in vitro útiles en el cribado de una biblioteca celular que expresa CAR modulares sintéticos serán generalmente antígenos que incluyen, por ejemplo, antígeno libre, antígeno unido, antígeno expresado celular (por ejemplo, expresado en una célula presentadora de antígenos, expresado en una célula diana, etc.) etc. Los antígenos útiles variarán dependiendo de la biblioteca CAR particular a cribar y del resultado deseado del cribado. Los ejemplos no taxativos de antígenos incluyen, de modo no taxativo, por ejemplo, antígeno soluble, antígeno unido al soporte sólido (por ejemplo, antígeno unido a la placa, antígeno unido a perlas, antígeno unido al portaobjetos, etc.), antígeno expresado (por ejemplo, una célula transgénica que expresa un antígeno, una célula que expresa naturalmente un antígeno (por ejemplo, una célula que expresa antígenos naturales, una célula cancerosa que expresa un antígeno del cáncer, etc.). Las células que expresan antígenos naturales útiles en el cribado de una biblioteca in vitro variarán y pueden incluir, de modo no taxativo, por ejemplo, células tumorales sin tratar (por ejemplo, obtenidas de una biopsia tumoral).

En algunas modalidades, una población de linfocitos T que expresa una biblioteca de CAR modulares sintéticos se pone en contacto in vivo con un estímulo y se detecta un fenotipo resultante. El contexto in vivo del cribado de biblioteca de CAR modulares sintéticos variará en gran medida y puede incluir, de modo no taxativo, modelos animales. En algunos casos, se puede realizar el cribado in vivo en modelos animales pequeños tales como, por ejemplo, modelos de roedores que incluyen, de modo no taxativo, por ejemplo, modelos de ratones, modelos de ratas, etc. En algunos casos, el cribado in vivo se realiza en un modelo tumoral de ratón, lo que incluye modelos tumorales de ratones transgénicos y no transgénicos.

En algunos casos, un modelo utilizado puede ser un módulo de xenoinjerto. Por ejemplo, un modelo utilizado puede ser un modelo “humanizado” en el que dichos modelos humanizados se definen como que tienen uno o más componentes derivados humanos, por ejemplo, un sistema inmunitario humanizado, linfocitos T humanizados, que expresan una proteína humana, células cancerosas humanas, etc. Como tal, los modelos humanizados pueden estar total o parcialmente humanizados. En otros casos, el modelo puede no estar total o parcialmente humanizado, pero en vez de eso se puede introducir simplemente con células humanas o tejido humano a través de inyección o trasplante. Por ejemplo, en algunos casos, las células cancerosas humanas o células de una línea celular cancerosa humana se introducen en un modelo animal. Se puede utilizar cualquier célula tumoral humana o línea celular tumoral humana conveniente en dichos modelos que incluyen, de modo no taxativo, por ejemplo, células K562, células del linfoma de Daudi, etc.

Los modelos de animales y/o células o tejidos introducidos en los modelos de animales puede ser transgénicos o no, por ejemplo, modificados para expresar uno o más transgenes. Por ejemplo, en algunos casos, un modelo animal puede ser modificado transgénicamente para expresar un gen heterólogo, por ejemplo, un gen indicador (por ejemplo, para identificar células del animal huésped), un gen diana (por ejemplo, un gen que codifica un producto génico que se debe dirigir en un cribado in vivo). En algunos casos, una célula introducida en un modelo animal puede ser modificada transgénicamente para expresar un gen heterólogo, por ejemplo, un gen indicador (por ejemplo, para identificar la célula introducida), un gen diana (por ejemplo, un gen que codifica un producto génico que se debe dirigir en un cribado in vivo). Como ejemplo no taxativo, se puede cribar un modelo tumoral de ratón, de acuerdo con los métodos, como se describe en la presente, donde las células tumorales humanas que expresan un transgén diana del cáncer (por ejemplo, CD19, mesotelina, etc.) se introducen en el ratón.

Los miembros de la biblioteca, introducidos en sistemas in vivo, se pueden cribar en busca de cualquier fenotipo conveniente donde el fenotipo puede depender de la biblioteca particular que se analiza, el contexto in vivo particular (por ejemplo, el modelo animal), etc. En algunos casos, por ejemplo, donde el sistema in vivo es un modelo tumoral animal, la biblioteca se puede cribar en busca de fenotipos relacionados a la selectividad del tumor de los miembros de la biblioteca, por ejemplo, al introducir la biblioteca en un modelo animal que contiene dos tumores diferentes, al introducir la biblioteca en un modelo animal o múltiples modelos animales que contiene tumores que expresan diferentes niveles de antígeno tumoral, etc. Se puede utilizar cualquier método para probar el fenotipo, incluidos aquellos métodos moleculares/bioquímicos y celulares que se describen en la presente, para evaluar sistemas in vivo en los que las evaluaciones generalmente implican obtener una muestra biológica del modelo animal. En algunos casos, una muestra biológica útil para evaluar un modelo in vivo puede incluir una muestra de tejido (por ejemplo, sangre, tumor, etc.) o muestra de órgano (por ejemplo, bazo).

En algunos casos, se puede cribar una biblioteca in vitro o in vivo de acuerdo con un fenotipo de linfocitos T. Los fenotipos de linfocitos T variarán e incluirán fenotipos de linfocitos T estimulados, es decir, respuesta al antígeno. Los ejemplos no taxativos de fenotipos de linfocitos T incluyen, de modo no taxativo, por ejemplo, proliferación de linfocitos T, producción de citocinas (por ejemplo, IL-2, IFN-y, TNF, LT-a, IFN-y, LT-a, TNF IL-4, IL-5, IL-6, IL-13, IL-9, IL-10, IL-17A, IL-17F, IL-21, IL-22, IL-26, TNF, CCL20, IL-21, TGF-p, IL-10, etc.), expresión de marcadores de superficie de linfocitos T (por ejemplo, CD3, CD4, CD8, etc.), marcadores de activación de linfocitos T (por ejemplo, CD69, etc.), marcadores de señalización intracelular (por ejemplo, ERK1/2, fosforilado, p38MAPK fosforilado, etc.) y similares.

Los fenotipos de linfocitos T se pueden cribar in vitro e in vivo y pueden detectarse a través de cualquier método conveniente. En algunos casos, se puede utilizar un contador de células o citómetro de flujo para cribar un fenotipo de linfocitos T que incluye, por ejemplo, proliferación de linfocitos T y/o cuantificación de linfocitos T. Por ejemplo, la proliferación de linfocitos T se puede cribar mediante dilución de colorantes con traza celular usando citometría de flujo. En algunos casos, la expresión de marcadores de superficie celular se puede cribar también mediante citometría de flujo. La expresión de marcadores intracelulares se puede determinar mediante métodos celulares (por ejemplo, citometría de flujo, flujo fosfato, citometría de flujo intracelular, inmunofluorescencia, hibridación in situ, hibridación fluorescente in situ, etc.) o se puede cribar mediante métodos moleculares y/o bioquímicos (por ejemplo, ELISA, captura de citocinas, métodos basados en la amplificación (por ejemplo, PCR cuantitativa), métodos basados en la secuenciación (por ejemplo, secuenciación cuantitativa), espectrometría de masas cuantitativa, etc.).

En algunos casos, los linfocitos T se pueden cribaren busca de un fenotipo de activación “citolítica natural”. Se puede cribar cualquier método conveniente para evaluar la activación citolítica natural en dichos ensayos. Por ejemplo, los linfocitos T se pueden cribar para determinar la expresión de CD107a/b, por ejemplo, mediante citometría de flujo.

En algunos casos, los linfocitos T se pueden cribar en busca de uno o más fenotipos de diferenciación. Se puede cribar cualquier método conveniente para evaluar la diferenciación en dichos ensayos. Por ejemplo, se puede evaluar la diferenciación con respecto al linfocito T de memoria, por ejemplo, a través del cribado de marcadores de linfocitos T de memoria (por ejemplo, Th1, Th2, Th17, Treg, etc.) usando cualquier método molecular/bioquímico o celular. En algunos casos, se puede evaluar la expresión de uno o más factores de transcripción intracelular indicadores de la diferenciación de linfocitos T de memoria (por ejemplo, Gata3, Tbet, RORyt, FoxP3, Bcl-6, CCR7, CD45RO, CD45RA, CD69, etc.).

El cribado de una biblioteca de polipéptidos CAR modulares sintéticos o ácidos nucleicos que codifican una biblioteca de polipéptidos CAR modulares sintéticos permite la identificación de CAR y/o partes de estos (por ejemplo, dominios de unión al antígeno, dominios de señalización primarios, dominios comoduladores, etc.) que producen eficazmente un fenotipo de linfocitos T deseado. Por consiguiente, la presente descripción incluye CAR identificados mediante el cribado de las bibliotecas descritas en la presente, así como también, ácidos nucleicos que codifican dichos CAR. La presente descripción incluye también c Ar que contienen módulos CAR útiles (por ejemplo, dominios de unión al antígeno, dominios de señalización primarios, dominios coestimuladores, etc.) identificados mediante el cribado de las bibliotecas descritas en la presente, así como también, ácidos nucleicos que codifican dichos CAR.

En algunos casos, un CAR de la presente descripción puede incluir uno o más de los dominios comoduladores identificados como estimuladores de linfocitos T o inhibidores de linfocitos T a partir del cribado de una biblioteca de polipéptidos CAR modulares sintéticos o ácidos nucleicos que codifican polipéptidos CAR modulares sintéticos como se describe en la presente. Por consiguiente, el fenotipo de linfocitos T general de un CAR puede ser para estimular la actividad de linfocitos T o para inhibir la actividad de linfocitos T. Las actividades de linfocitos T que se pueden estimular o inhibir incluyen, de modo no taxativo, por ejemplo, aquellas actividades de linfocitos T descritas en la presente.

En algunos casos, un CAR identificado mediante el cribado de una biblioteca puede incluir al menos un dominio comodulador que se enumera en la Tabla 3 o Tabla 4 , lo que incluye, de modo no taxativo, por ejemplo, dominios comoduladores que comprenden una secuencia de aminoácidos que tiene al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % de identidad de secuencia con respecto a una secuencia de dominio enumerada. En algunos casos, un CAR identificado mediante el cribado de una biblioteca puede incluir dos o más un dominios comoduladores de aquellos que se enumeran en la Tabla 3 y Tabla 4 , lo que incluye, de modo no taxativo, por ejemplo, dominios comoduladores que comprenden una secuencia de aminoácidos que tiene al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % de identidad de secuencia con respecto a una secuencia de dominio enumerada. En algunos casos, un CAR de la presente descripción puede incluir un dominio comodulador identificado en un cribado descrito en la presente como un dominio coestimulador que incluye, de modo no taxativo, por ejemplo, aquellos que se enumeran en la Tabla 3 lo que incluye, de modo no taxativo, por ejemplo, dominios comoduladores que comprenden una secuencia de aminoácidos que tiene al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % de identidad de secuencia con respecto a una secuencia de dominio enumerada. En algunos casos, un CAR de la presente descripción puede incluir un dominio comodulador identificado en un cribado descrito en la presente como un dominio coinhibidor que incluye, de modo no taxativo, por ejemplo, aquellos que se enumeran en la Tabla 4 , lo que incluye, de modo no taxativo, por ejemplo, dominios comoduladores que comprenden una secuencia de aminoácidos que tiene al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % de identidad de secuencia con respecto a una secuencia de dominio enumerada. En algunos casos, un CAR que incluye uno o más dominios coinhibidores puede ser un iCAR.

En algunos casos, un CAR que tiene dos o más dominios comoduladores puede incluir dos dominios coestimuladores que incluyen, de modo no taxativo, por ejemplo, dos o más dominios coestimuladores que se enumeran en la Tabla 3. En algunos casos, un CAR que tiene dos o más dominios comoduladores puede incluir dos dominios coinhibidores que incluyen, de modo no taxativo, por ejemplo, dos o más dominios coinhibidores que se enumeran en la Tabla 4. En algunos casos, un CAR que tiene dos o más dominios comoduladores puede incluir una mezcla de dominios coestimuladores y coinhibidores que incluyen, de modo no taxativo, al menos un dominio coestimulador que se enumera en la Tabla 3 y al menos un dominio coinhibidor que se enumera en la Tabla 4.

Tabla 3: Dominios comoduladores ue muestran la función estimuladora dominios coestimuladores

Un CAR identificado mediante el cribado de una biblioteca CAR de polipéptidos modulares sintéticos o una biblioteca de polipéptidos CAR modulares sintéticos que codifica ácidos nucleicos puede incluir cualquier dominio de unión al antígeno útil que incluye, de modo no taxativo, por ejemplo, aquellos que se utilizan clínicamente en diversas construcciones CAR que incluyen, por ejemplo, un dominio de unión al antígeno anti-BCMA, un dominio de unión al antígeno anti-CD123, un dominio de unión al antígeno anti-CD138, un dominio de unión al antígeno anti-CD171, un dominio de unión al antígeno anti-CD19, un dominio de unión al antígeno anti-CD22, un dominio de unión al antígeno anti-CD30, un dominio de unión al antígeno anti-CD33, un dominio de unión al antígeno anti-CD7, un dominio de unión al antígeno anti-CD70, un dominio de unión al antígeno anti-CEA, un dominio de unión al antígeno anti-EGFRvIII, un dominio de unión al antígeno anti-EPCAM , un dominio de unión al antígeno anti-EphA2, un dominio de unión al antígeno anti-ErbB, un dominio de unión al antígeno anti-FAP, un dominio de unión al antígeno anti-GD2, un dominio de unión al antígeno anti-GPC3, un dominio de unión al antígeno anti-HER2, un dominio de unión al antígeno anti-IL1RAP, un dominio de unión al antígeno anti-Kappa, un dominio de unión al antígeno anti-LeY, un dominio de unión al antígeno anti-Meso, un dominio de unión al antígeno anti-MG7, un dominio de unión al antígeno anti-MUC1, un dominio de unión al antígeno anti-NKG2D, un dominio de unión al antígeno anti-PSCA, un dominio de unión al antígeno anti-ROR1 y similares.

Un CAR identificado mediante el cribado de una biblioteca de polipéptidos CAR modulares sintéticos o una biblioteca de polipéptidos CAR modulares sintéticos que codifica ácidos nucleicos puede incluir cualquier dominio de señalización primario útil (también llamado en el presente dominio de señalización intracelular) que incluye, de modo no taxativo, por ejemplo, aquellos que incluyen uno o más motivos de activación basados en tirosina del inmunoreceptor.

Un dominio de señalización intracelular adecuado puede ser una parte que contiene un motivo ITAM que se obtiene a partir de un polipéptido que contiene un motivo ITAm . Por ejemplo, un dominio de señalización intracelular adecuado puede ser un dominio que contiene un motivo ITAM de cualquier proteína que contiene un motivo ITAM. Por lo tanto, no es necesario que un dominio de señalización intracelular adecuado contenga la secuencia completa de la proteína completa de la cual se obtiene. Los ejemplos de polipéptidos que contienen motivos ITAM adecuados incluyen, de modo no taxativo: DAP12; FCER1G (cadena gamma del receptor épsilon I de Fc); CD3D (CD3 delta); CD3E (CD3 épsilon); CD3G (CD3 gamma); CD3Z (CD3 zeta); y CD79A (cadena alfa de la proteína asociada al complejo de receptor y antígeno).

En algunos casos, el dominio de señalización intracelular se obtiene a partir de DAP12 (también conocida como TYROBP; proteína de unión a la proteína tirosina cinasa TYRO; KARAP; PLOSL; proteína de activación de DNAX 12; proteína asociada a KAR; proteína de unión a la proteína tirosina cinasa TYRO; proteína asociada al receptor de activación de destrucción; proteína asociada al receptor de activación de destrucción; etc.). Por ejemplo, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos (4 isoformas):

MGGLEPCSRLLLLPLLLAVSGLRPVQAQAQSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGRLVPRGRGAAE AATRKQRITETESPYQELQGQRSDVYSDLNTQRPYYK (SEQ ID N.°: 107);

MGGLEPCSRLLLLPLLLAVSGLRPVQAQAQSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGRLVPRGRGAAE ATRKQRITETESPYQELQGQRSDVYSDLNTQRPYYK (SEQ ID N.°: 108);

MGGLEPCSRLLLLPLLLAVSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGRLVPRGRGAAEAATRKQRITETE SPYQELQGQRSDVYSDLNTQRPYYK (SEQ ID N.°: 109); o

MGGLEPCSRLLLLPLLLAVSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGRLVPRGRGAAEATRKQRITETES PYQELQGQRSDVYSDLNTQRPYYK (SEQ ID N.°: 110), donde los motivos ITAM están en negrita y subrayados.

Asimismo, un polipéptido del dominio de señalización intracelular puede comprender una parte que contiene el motivo ITAM de la secuencia de aminoácidos de DAP12 de longitud completa. Por lo tanto, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos:

ESPYQELQGQRSDVYSDLNTQ (SEQ ID N.°: 111), donde los motivos ITAM están en negrita y subrayados.

En algunos casos, el dominio de señalización intracelular se obtiene a partir de FCER1G (también conocida como FCRG; cadena gamma del receptor épsilon I de Fc; cadena gamma del receptor de Fc; fc-épsilon RI-gamma; fcRgamma; fceRI gamma; subunidad gamma del receptor épsilon de inmunoglobulina de alta afinidad; cadena gamma del receptor de inmunoglobulina E de alta afinidad; etc.). Por ejemplo, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a las siguientes secuencias de aminoácidos:

MIPAVVLLLLLLVEQAAALGEPQLCYILDAILFLYGIVLTLLYCRLKIQVRKAAITSYEKSDGVYTGLSTRNQETYETLKHE KPPQ (SEQ ID N.°: 112), donde los motivos de ITAM están en negrita y subrayados.

Asimismo, un polipéptido del dominio de señalización intracelular puede comprender una parte que contiene el motivo ITAM de la secuencia de aminoácidos de FCER1G de longitud completa. Por lo tanto, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos:

DGVYTGLSTRNQETYETLKHE (SEQ ID N.o 113), donde los motivos de ITAM están en negrita y subrayados.

En algunos casos, el dominio de señalización intracelular se obtiene a partir de la cadena delta CD3 de la glicoproteína superficial de linfocitos T (también conocida como CD3D; CD3-DELTA; T3D; antígeno de CD3, subunidad delta; CD3 delta; antígeno de CD3d, polipéptido delta (complejo TiT3); OKT3, cadena delta; cadena delta T3 del receptor de linfocitos T; cadena delta Cd 3 de glicoproteínas superficiales de linfocitos T; etc.). Por ejemplo, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 115 aa a aproximadamente 120 aa, de aproximadamente 120 aa a aproximadamente 130 aa, de aproximadamente 130 aa a aproximadamente 140 aa, de aproximadamente 140 aa a aproximadamente 150 aa o de aproximadamente 150 aa a aproximadamente 170 aa, de cualquiera de las siguientes secuencias de aminoácidos (2 isoformas):

MEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLGKRILDPRGIYRCNGTDIYKD KESTVQVHYRMCQSCVELDPATVAGIIVTDVIATLLLALGVFCFAGHETGRLSGAADTQALLRNDQVYQPLRDRDDAQ YSHLGGNWARNK (SEQ ID N.o 114) o MEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLGKRILDPRGIYRCNGTDIYKD KESTVQVHYRTADTQALLRNDQVYQPLRDRDDAQYSHLGGNWARNK (SEQ ID N.o 115), donde los motivos ITAM están en negrita y subrayados.

Asimismo, un polipéptido del dominio de señalización intracelular puede comprender una parte que contiene el motivo ITAM de la secuencia de aminoácidos delta CD3 de longitud completa. Por lo tanto, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos:

DQVYQPLRDRDDAQYSHLGGN (SEQ ID N.^ 116), los motivos de ITAM están en negrita y subrayados.

En algunos casos, el dominio de señalización intracelular se obtiene a partir de la cadena épsilon CD3 de glicoproteínas superficiales de linfocitos T (también conocida como CD3e, cadena épsilon T3/Leu-4 de antígenos superficiales de linfocitos T, cadena épsilon CD3 de glicoproteínas superficiales de linfocitos T, AI504783, CD3, CD3épsilon, T3e, etc.). Por ejemplo, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 115 aa a aproximadamente 120 aa, de aproximadamente 120 aa a aproximadamente 130 aa, de aproximadamente 130 aa a aproximadamente 140 aa, de aproximadamente 140 aa a aproximadamente 150 aa o de aproximadamente 150 aa a aproximadamente 205 aa, de cualquiera de las siguientes secuencias de aminoácidos (2 isoformas):

MQSGTHWRVLGLCLLSVGVWGQDGNEEMGGITQTPYKVSISGTTVILTCPQYPGSEILWQHNDKNIGGDEDDKNIGS DEDHLSLKEFSELEQSGYYVCYPRGSKPEDANFYLYLRARVCENCMEMDVMSVATIVIVDICITGGLLLLVYYWSKNR KAKAKPVTRGAGAGGRQRGQNKERPPPVPNPDYEPIRKGQRDLYSGLNQRRI (SEQ ID N.o 117), donde los motivos de ITAM están en negrita y subrayados.

Asimismo, un polipéptido del dominio de señalización intracelular puede comprender una parte que contiene el motivo ITAM de la secuencia de aminoácidos épsilon CD3 de longitud completa. Por lo tanto, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos:

NPDYEPIRKGQRDLYSGLNQR (SEQ ID N.^ 118), donde los motivos de ITAM están en negrita y subrayados.

En algunos casos, el dominio de señalización intracelular se obtiene a partir de la cadena gamma CD3 de glicoproteínas superficiales de linfocitos T (también conocida como CD3G, cadena gamma T3 de receptores de linfocitos T, CD3-GAMMA, T3G, polipéptido gamma (complejo TiT3), etc.). Por ejemplo, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 115 aa a aproximadamente 120 aa, de aproximadamente 120 aa a aproximadamente 130 aa, de aproximadamente 130 aa a aproximadamente 140 aa, de aproximadamente 140 aa a aproximadamente 150 aa o de aproximadamente 150 aa a aproximadamente 180 aa, de la siguiente secuencia de aminoácidos:

MEQGKGLAVLILAIILLQGTLAQSIKGNHLVKVYDYQEDGSVLLTCDAEAKNITWFKDGKMIGFLTEDKKKWNLGSNAK DPRGMYQCKGSQNKSKPLQVYYRMCQNCIELNAATISGFLFAEIVSIFVLAVGVYFIAGQDGVRQSRASDKQTLLPND QLYQPLKDREDDQYSHLQGNQLRRN (SEQ ID N.°: 119), los motivos de ITAM están en negrita y subrayados.

Asimismo, un polipéptido del dominio de señalización intracelular puede comprender una parte que contiene el motivo ITAM de la secuencia de aminoácidos gamma CD3 de longitud completa. Por lo tanto, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos:

DQLYQPLKDREDDQYSHLQGN (SEQ ID N.°: 120), los motivos de ITAM están en negrita y subrayados.

En algunos casos, el dominio de señalización intracelular se obtiene a partir de la cadena CD3 zeta de glicoproteínas superficiales de linfocitos T (también conocida como CD3Z, cadena T3 zeta de receptores de linfocitos T, CD247, CD3-ZETA, CD3H, CD3Q, T3Z, TCRZ, etc.). Por ejemplo, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 115 aa a aproximadamente 120 aa, de aproximadamente 120 aa a aproximadamente 130 aa, de aproximadamente 130 aa a aproximadamente 140 aa, de aproximadamente 140 aa a aproximadamente 150 aa o de aproximadamente 150 aa a aproximadamente 160 aa, de cualquiera de las siguientes secuencias de aminoácidos (2 isoformas):

MKWKALFTAAILQAQLPITEAQSFGLLDPKLCYLLDGILFIYGVILTALFLRVKFSRSADAPAYQQGQNQLYNELNLG RREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKD TYDALHMQALPPR (SEQ ID N.o 121) o

MKWKALFTAAILQAQLPITEAQSFGLLDPKLCYLLDGILFIYGVILTALFLRVKFSRSADAPAYQQGQNQLYNELNLGRR EEYDVLDKRRGRDPEMGGKPQRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYD A LHMQALPPR (SEQ ID N.^ 122), donde los motivos de ITAM están en negrita y subrayado.

Asimismo, un polipéptido del dominio de señalización intracelular puede comprender una parte que contiene el motivo ITAM de la secuencia de aminoácidos zeta CD3 de longitud completa. Por lo tanto, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos:

RVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYS EIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR (SEQ ID N.o 123);

NQLYNELNLGRREEYDVLDKR (SEQ ID N.o 124); EGLYNELQKDKMAEAYSEIGMK (SEQ ID N.o 125); o DGLYQGLSTATKDTYDALHMQ (SEQ ID N.^ 126), donde los motivos de ITAM están en negrita y subrayado.

En algunos casos, el dominio de señalización intracelular se obtiene a partir de CD79A (también conocido como cadena alfa de la proteína asociada al complejo de receptor y antígeno de linfocitos B; antígeno CD79a (alfa asociada a inmunoglobulina); glicoproteína de membrana MB-1; ig-alfa; proteína asociada a la inmunoglobulina unida a la membrana; proteína asociada a la IgM superficial; etc.). Por ejemplo, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 115 aa a aproximadamente 120 aa, de aproximadamente 120 aa a aproximadamente 130 aa, de aproximadamente 130 aa a aproximadamente 150 aa, de aproximadamente 150 aa a aproximadamente 200 aa o de aproximadamente 200 aa a aproximadamente 220 aa, de cualquiera de las siguientes secuencias de aminoácidos (2 isotermas):

MPGGPGVLQALPATIFLLFLLSAVYLGPGCQALWMHKVPASLMVSLGEDAHFQCPHNSSNNANVTWWRVLHGN

YTWPPEFLGPGEDPNGTLIIQNVNKSHGGIYVCRVQEGNESYQQSCGTYLRVRQPPPRPFLDMGEGTKNRIITAE GIILLFCAVVPGTLLLFRKRWQNEKLGLDAGDEYEDENLYEGLNLDDCSMYEDISRGLQGTYQDVGSLNIGDVQLE KP (SEQ ID N.°: 127); o

MPGGPGVLQALPATIFLLFLLSAVYLGPGCQALWMHKVPASLMVSLGEDAHFQCPHNSSNNANVTWWRVLHGNYT WPPEFLGPGEDPNEPPPRPFLDMGEGTKNRIITAEGIILLFCAVVPGTLLLFRKRWQNEKLGLDAGDEYEDENLYEGL NLDDCSMYEDISRGLQGTYQDVGSLNIGDVQLEKP (SEQ ID N.o 128), donde los motivos de ITAM están en negrita y subrayado.

Asimismo, un polipéptido del dominio de señalización intracelular puede comprender una parte que contiene el motivo ITAM de la secuencia de aminoácidos de CD79A de longitud completa. Por lo tanto, un polipéptido del dominio de señalización intracelular adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos: ENLYEGLNLDDCSMYEDISRG (SEQ ID N.^ 129), donde los motivos ITAM están en negrita y subrayados.

Los dominios de señalización intracelular adecuados para usar en un CAR de la presente descripción incluyen una cadena de señalización tipo DAP10/CD28.

Un ejemplo de una cadena de señalización DAP10 es la secuencia de aminoácidos: RPRRSPAQDGKVYINMPGRG (SEQ ID N.^ 130). En algunas modalidades, un dominio de señalización intracelular adecuado comprende una secuencia de aminoácidos con al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 %, al menos aproximadamente 99 %, de identidad de secuencia de aminoácidos con respecto a la longitud completa de la secuencia de aminoácidos RPRRSPAQDGKVYINMPGRG (SEQ ID N.o 130).

Un ejemplo de cadena de señalización CD28 es la secuencia de aminoácidos FWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRS (SEQ ID N.o 131). En algunas modalidades, un dominio de señalización intracelular adecuado comprende una secuencia de aminoácidos con al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 %, al menos aproximadamente 99 %, de identidad de secuencia de aminoácidos con respecto a la longitud completa de la secuencia de aminoácidos FWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRS (SEQ ID N.o 131).

Los dominios de señalización intracelular adecuados para usar en un CAR de la presente descripción incluyen un polipéptido de ZAP70, por ejemplo, un polipéptido que comprende una secuencia de aminoácidos que tiene al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 %, al menos aproximadamente 99% o 100 % de identidad de secuencia de aminoácido con respecto a una extensión contigua de entre aproximadamente 300 aminoácidos y aproximadamente 400 aminoácidos, de entre aproximadamente 400 aminoácidos y aproximadamente 500 aminoácidos, o de entre aproximadamente 500 aminoácidos y 619 aminoácidos de la siguiente secuencia de aminoácidos:

MPDPAAHLPFFYGSISRAEAEEHLKLAGMADGLFLLRQCLRSLGGYVLSLVHDVRFHHFPIERQLNGTYAIAGGKA HCGPAELCEFYSRDPDGLPCNLRKPCNRPSGLEPQPGVFDCLRDAMVRDYVRQTWKLEGEALEQAIISQAPQVE

KLIATTAHERMPWYHSSLTREEAERKLYSGAQTDGKFLLRPRKEQGTYALSLIYGKTVYHYLISQDKAGKYCIPEG

TKFDTLWQLVEYLKLKADGLIYCLKEACPNSSASNASGAAAPTLPAHPSTLTHPQRRIDTLNSDGYTPEPARITSPD KPRPMPMDTSVYESPYSDPEELKDKKLFLKRDNLLIADIELGCGNFGSVRQGVYRMRKKQIDVAIKVLKQGTEKAD TEEMMREAQIMHQLDNPYIVRLIGVCQAEALMLVMEMAGGGPLHKFLVGKREEIPVSNVAELLHQVSMGMKYLEE

KNFVHRDLAARNVLLVNRHYAKISDFGLSKALGADDSYYTARSAGKWPLKWYAPECINFRKFSSRSDVWSYGVT

MWEALSYGQKPYKKMKGPEVMAFIEQGKRMECPPECPPELYALMSDCWIYKWEDRPDFLTVEQRMRACYYSLA SKVEGPPGSTQKAEAACA (SEQ ID N.o:132).

En algunos casos, un CAR identificado mediante el cribado de una biblioteca de polipéptidos CAR modulares sintéticos o una biblioteca de polipéptidos CAR modulares sintéticos que codifica ácidos nucleicos, que incluye un CAR que tiene al menos uno o dos o más de los dominios comoduladores que se enumeran en la Tabla 3 y la Tabla 4, se puede dividir en dos cadenas de polipéptidos que se pueden unir en presencia de un dimerizador, mediante un dominio de dimerizador presente en cada cadena. Dichos CAR de división son condicionalmente activos y farmacológicamente inducibles/represibles tales como, por ejemplo, aquellos descritos en la publicación de solicitud de patente PCT WO 2014/127261.

Por consiguiente, en algunos casos, cada polipéptido de la versión de CAR de división de un CAR identificado mediante el cribado de una biblioteca, como se describe en la presente, puede incluir una mitad de un par de dimerización (también llamado par de unión al dimerizador). Los ejemplos no taxativos de dímeros adecuados (por ejemplo, pares de unión al dimerizador) incluyen, de modo no taxativo: a) proteína de unión FK506 (FKBP) y FKBP; b) FKBP y subunidad catalítica de calcineurina A (CnA); c) FKBP y ciclofilina; d) FKBP y proteína asociada a la rapamicina-FKBP (FRB); e) girasa B (GyrB) y GyrB; f) dihidrofolato reductasa (Dh Fr ) y DHFR; g) DmrB y DmrB; h) PYL y ABI; i) Cry2 y CIB1; y j) GAI y GID1.

En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) de un CAR de la presente deriva de FKBP. Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a las siguientes secuencias de aminoácidos:

MGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKFDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQR

AKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID N.°: 78).

En algunos casos, un miembro de un par de unión al dimerizador de un CAR de la presente deriva de la subunidad A catalítica de calcineurina (también conocida como PPP3CA; CALN; CALNA; CALNA1; CCN1; CNA1; PPP2B; subunidad catalítica de CAM-PRP; calcineurina A alfa; subunidad A de calcineurina isoforma alfa dependiente de calmodulina; isoforma alfa de subunidad catalítica de la proteína fosfatasa 2B; etc.). Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a la siguiente secuencia de aminoácidos (dominio PP2Ac):

LEESVALRIITEGASILRQEKNLLDIDAPVTVCGDIHGQFFDLMKLFEVGGSPANTRYLFLGDYVDRGYFSIECVLYLWA LKILYPKTLFLLRGNHECRHLTEYFTFKQECKIKYSERVYDACMDAFDCLPLAALMNQQFLCVHGGLSPEINTLDDIRKL DRFKEPPAYGPMCDILWSDPLEDFGNEKTQEHFTHNTVRGCSYFYSYPAVCEFLQHNNLLSILRAHEAQDAGYRMY RKSQTTGFPSLITIFSAPNYLDVYNNKAAVLKYENNVMNIRQFNCSPHPYWLPNFM (SEQ ID N.°: 79).

En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de ciclofilina (también conocida como ciclofilina A, PPIA, CYPA, Cy p H, PPIasa A, etc.). Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a las siguientes secuencias de aminoácidos:

MVNPTVFFDIAVDGEPLGRVSFELFADKVPKTAENFRALSTGEKGFGYKGSCFHRIIPGFMCQGGDFTRHNGTGGKSI YGEKFEDENFILKHTGPGILSMANAGPNTNGSQFFICTAKTEWLDGKHVVFGKVKEGMNIVEAMERFGSRNGKTSKKI TIADCGQLE (SEQ ID N.°: 80).

En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de MTOR (también conocida como proteína asociada a FKBP-rapamicina; proteína 12 de unión a FK506-proteína 1 asociada a rapamicina; proteína 12 de unión a FK506-proteína 2 asociada a rapamicina; proteína 12 de unión a FK506-proteína 1 asociada a complejo de rapamicina; FRAP; FRAP1; FRAP2; RAFT1; y RAPT1). Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a la siguiente secuencia de aminoácidos (conocida también como “Frb”: Dominio de unión a rapamicina-FKBP):

MILWHEMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQAYGRDLMEAQEWCRKYMKS GNVKDLLQAWDLYYHVFRRISK (SEQ ID N.°: 81).

En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de GyrB (también conocida como subunidad B de ADN girasa). Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 200 aminoácidos (aa), de aproximadamente 200 aa a aproximadamente 300 aa, de aproximadamente 300 aa a aproximadamente 400 aa, de aproximadamente 400 aa a aproximadamente 500 aa, de aproximadamente 500 aa a aproximadamente 600 aa, de aproximadamente 600 aa a aproximadamente 700 aa o de aproximadamente 700 aa a aproximadamente 800 aa, de la siguiente secuencia de aminoácidos GyrB de Escherichia coli (o con respecto a la secuencia de la subunidad B de la ADN girasa de cualquier organismo):

MSNSYDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDNAIDEALAGHCKEIIVTIHADNSVSVQDDGRGIP TGIHPEEGVSAAEVIMTVLHAGGKFDDNSYKVSGGLHGVGVSVVNALSQKLELVIQREGKIHRQIYEHGVPQAPLAVT GETEKTGTMVRFWPSLETFTNVTEFEYEILAKRLRELSFLNSGVSIRLRDKRDGKEDHFHYEGGIKAFVEYLNKNKTPI HPNIFYFSTEKDGIGVEVALQWNDGFQENIYCFTNNIPQRDGGTHLAGFRAAMTRTLNAYMDKEGYSKKAKVSATGD DAREGLIAWSVKVPDPKFSSQTKDKLVSSEVKSAVEQQMNELLAEYLLENPTDAKIWGKIIDAARAREAARRAREMT RRKGALDLAGLPGKLADCQERDPALSELYLVEGDSAGGSAKQGRNRKNQAILPLKGKILNVEKARFDKMLSSQEVAT LITALGCGIGRDEYNPDKLRYHSIIIMTDADVDGSHIRTLLLTFFYRQMPEIVERGHVYIAQPPLYKVKKGKQEQYIKDDE AMDQYQISIALDGATLHTNASAPALAGEALEKLVSEYNATQKMINRMERRYPKAMLKELIYQPTLTEADLSDEQTVTR WVNALVSELNDKEQHGSQWKFDVHTNAEQNLFEPIVRVRTHGVDTDYPLDHEFITGGEYRRICTLGEKLRGLLEEDA FIERGERRQPVASFEQALDWLVKESRRGLSIQRYKGLGEMNPEQLWETTMDPESRRMLRVTVKDAIAADQLFTTLMG DAVEPRRAFIEENALKAANIDI (SEQ ID N.°: 82). En algunos casos, un miembro de un par de unión al dimerizador adecuado comprende una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a los aminoácidos 1-220 de la secuencia de aminoácidos GyrB que se enumera anteriormente de la Escherichia coli.

En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de DHFR (también conocida como dihidrofolato reductasa, DHFRP1 y DYR). Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a las siguientes secuencias de aminoácidos:

MVGSLNCIVAVSQNMGIGKNGDLPWPPLRNEFRYFQRMTTTSSVEGKQNLVIMGKKTWFSIPEKNRPLKGRINLVLS RELKEPPQGAHFLSRSLDDALKLTEQPELANKVDMVWIVGGSSVYKEAMNHPGHLKLFVTRIMQDFESDTFFPEIDLE KYKLLPEYPGVLSDVQEEKGIKYKFEVYEKND (SEQ ID N.o 83).

En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva del dominio de unión a DmrB (es decir, dominio de homodimerización de DmrB). Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a las siguientes secuencias de aminoácidos:

MASRGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQ RAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID N.o 84).

En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de una proteína PYL (también conocida como receptor de ácido abscísico y como RCAR). Por ejemplo, un miembro de un par de unión al dimerizador de la presente puede derivar de proteínas tales como las de Arabidopsis thaliana: PYR1, RCAR1(PYL9), PYL1, PYL2, PYL3, PYL4, PYL5, PYL6, PYL7, PYL8 (RCAR3), PYL10, PYL11, PYL12, PYL13. Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a cualquiera de las siguientes secuencias de aminoácidos:

PYL10:

MNGDETKKVESEYIKKHHRHELVESQCSSTLVKHIKAPLHLVWSIVRRFDEPQKYKPFISRCVVQGKKLEVGSVREVD LKSGLPATKSTEVLEILDDNEHILGIRIVGGDHRLKNYSSTISLHSETIDGKTGTLAIESFVVDVPEGNTKEETCFFVEALI QCNLNSLADVTERLQAESMEKKI (SEQ ID N.o 85).

PYL11:

METSQKYHTCGSTLVQTIDAPLSLVWSILRRFDNPQAYKQFVKTCNLSSGDGGEGSVREVTVVSGLPAEFSRERLDE LDDESHVMMISIIGGDHRLVNYRSKTMAFVAADTEEKTVWESYWDVPEGNSEEETTSFADTIVGFNLKSLAKLSERV AHLKL (SEQ ID N.o 86)

PYL12:

MKTSQEQHVCGSTVVQTINAPLPLVWSILRRFDNPKTFKHFVKTCKLRSGDGGEGSVREVTVVSDLPASFSLERLDEL DDESHVMVISMGGDHRLVNYQSKTTVFVAAEEEKTWVESYWDVPEGNTEEETTLFADTIVGCNLRSLAKLSEKMME LT (SEQ ID N.o 87).

PYL13:

MESSKQKRCRSSVVETIEAPLPLVWSILRSFDKPQAYQRFVKSCTMRSGGGGGKGGEGKGSVRDVTLVSGFPADFS TERLEELDDESHVMWSIIGGNHRLVNYKSKTKWASPEDMAKKTVWESYWDVPEGTSEEDTIFFVDNNRYNLTSLA KLTKKMMK (SEQ ID N.°: 88).

PYL1:

MANSESSSSPVNEEENSQRISTLHHQTMPSDLTQDEFTQLSQSIAEFHTYQLGNGRCSSLLAQRIHAPPETVWSVVR RFDRPQIYKHFIKSCNVSEDFEMRVGCTRDVNVISGLPANTSRERLDLLDDDRRVTGFSITGGEHRLRNYKSVTTVHR FEKEEEEERIWTVVLESYVVDVPEGNSEEDTRLFADTVIRLNLQKLASITEAMNRNNNNNNSSQVR (SEQ ID N.°: 89). PYL2:

MSSSPAVKGLTDEEQKTLEPVIKTYHQFEPDPTTCTSLITQRIHAPASVVWPLIRRFDNPERYKHFVKRCRLISGDGDV GSVREVTVISGLPASTSTERLEFVDDDHRVLSFRVVGGEHRLKNYKSVTSVNEFLNQDSGKVYTVVLESYTVDIPEGN TEEDTKMFVDTVVKLNLQKLGVAATSAPMHDDE (SEQ ID N.°: 90).

PYL3:

MNLAPIHDPSSSSTTTTSSSTPYGLTKDEFSTLDSIIRTHHTFPRSPNTCTSLIAHRVDAPAHAIWRFVRDFANPNKYKH FIKSCTIRVNGNGIKEIKVGTIREVSVVSGLPASTSVEILEVLDEEKRILSFRVLGGEHRLNNYRSVTSVNEFVVLEKDKK KRVYSVVLESYIVDIPQGNTEEDTRMFVDTVVKSNLQNLAVISTASPT (SEQ ID N.°: 91).

PYL4:

MLAVHRPSSAVSDGDSVQIPMMIASFQKRFPSLSRDSTAARFHTHEVGPNQCCSAVIQEISAPISTVWSVVRRFDNPQ AYKHFLKSCSVIGGDGDNVGSLRQVHVVSGLPAASSTERLDILDDERHVISFSVVGGDHRLSNYRSVTTLHPSPISGT VVVESYVVDVPPGNTKEETCDFVDVIVRCNLQSLAKIAENTAAESKKKMSL (SEQ ID N.°: 92).

PYL5:

MRSPVQLQHGSDATNGFHTLQPHDQTDGPIKRVCLTRGMHVPEHVAMHHTHDVGPDQCCSSVVQMIHAPPESVWA LVRRFDNPKVYKNFIRQCRIVQGDGLHVGDLREVMVVSGLPAVSSTERLEILDEERHVISFSVVGGDHRLKNYRSVTT LHASDDEGTVVVESYIVDVPPGNTEEETLSFVDTIVRCNLQSLARSTNRQ (SEQ ID N.°: 93).

PYL6:

MPTSIQFQRSSTAAEAANATVRNYPHHHQKQVQKVSLTRGMADVPEHVELSHTHVVGPSQCFSVVVQDVEAPVSTV WSILSRFEHPQAYKHFVKSCHVVIGDGREVGSVREVRVVSGLPAAFSLERLEIMDDDRHVISFSVVGGDHRLMNYKS VTTVHESEEDSDGKKRTRVVESYVVDVPAGNDKEETCSFADTIVRCNLQSLAKLAENTSKFS (SEQ ID N.°: 94).

PYL7:

MEMIGGDDTDTEMYGALVTAQSLRLRHLHHCRENQCTSVLVKYIQAPVHLVWSLVRRFDQPQKYKPFISRCTVNGDP EIGCLREVNVKSGLPATTSTERLEQLDDEEHILGINIIGGDHRLKNYSSILTVHPEMIDGRSGTMVMESFVVDVPQGNT KDDTCYFVESLIKCNLKSLACVSERLAAQDITNSIATFCNASNGYREKNHTETNL (SEQ ID N.°: 95).

PYL8:

MEANGIENLTNPNQEREFIRRHHKHELVDNQCSSTLVKHINAPVHIVWSLVRRFDQPQKYKPFISRCVVKGNMEIGTV REVDVKSGLPATRSTERLELLDDNEHILSIRIVGGDHRLKNYSSIISLHPETIEGRIGTLVIESFVVDVPEGNTKDETCYFV EALIKCNLKSLADISERLAVQDTTESRV (SEQ ID N.°: 96).

PYL9:

MMDGVEGGTAMYGGLETVQYVRTHHQHLCRENQCTSALVKHIKAPLHLVWSLVRRFDQPQKYKPFVSRCTVIGDPE IGSLREVNVKSGLPATTSTERLELLDDEEHILGIKIIGGDHRLKNYSSILTVHPEIIEGRAGTMVIESFWDVPQGNTKDET CYFVEALIRCNLKSLADVSERLASQDITQ (SEQ ID N.°: 97).

PYR1:

MPSELTPEERSELKNSIAEFHTYQLDPGSCSSLHAQRIHAPPELVWSIVRRFDKPQTYKHFIKSCSVEQNFEMRVGCT RDVIVISGLPANTSTERLDILDDERRVTGFSIIGGEHRLTNYKSVTTVHRFEKENRIWTWLESYWDMPEGNSEDDTR MFADTVVKLNLQKLATVAEAMARNSGDGSGSQVT (SEQ ID N.°: 98).

En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de una proteína ABI (también conocida como insensible a ácido abscísico). Por ejemplo, un miembro de un par de unión al dimerizador de la presente puede derivar de proteínas tales como las de Arabidopsis thaliana: ABI1 (también conocida como insensible a ácido abscísico 1, proteína fosfatasa 2C 56, AtPP2C56, P2C56 y PP2C ABI1) y/o ABI2 (también conocida como P2C77, proteína fosfatasa 2C 77, AtPP2C77, insensible a ácido abscísico 2, proteína fosfatasa 2C ABI2 y PP2C ABI2). Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 115 aa a aproximadamente 120 aa, de aproximadamente 120 aa a aproximadamente 130 aa, de aproximadamente 130 aa a aproximadamente 140 aa, de aproximadamente 140 aa a aproximadamente 150 aa, de aproximadamente 150 aa a aproximadamente 160 aa, de aproximadamente 160 aa a aproximadamente 170 aa, de aproximadamente 170 aa a aproximadamente 180 aa, de aproximadamente 180 aa a aproximadamente 190 aa, o de aproximadamente 190 aa a aproximadamente 200 aa de cualquiera de las siguientes secuencias de aminoácidos:

ABI1:

MEEVSPAIAGPFRPFSETQMDFTGIRLGKGYCNNQYSNQDSENGDLMVSLPETSSCSVSGSHGSESRKVLISRINSP NLNMKESAAADIVVVDISAGDEINGSDITSEKKMISRTESRSLFEFKSVPLYGFTSICGRRPEMEDAVSTIPRFLQSSSG SMLDGRFDPQSAAHFFGVYDGHGGSQVANYCRERMHLALAEEIAKEKPMLCDGDTWLEKWKKALFNSFLRVDSEIE SVAPETVGSTSVVAVVFPSHIFVANCGDSRAVLCRGKTALPLSVDHKPDREDEAARIEAAGGKVIQWNGARVFGVLA MSRSIGDRYLKPSIIPDPEVTAVKRVKEDDCLILASDGVWDVMTDEEACEMARKRILLWHKKNAVAGDASLLADERRK EGKDPAAMSAAEYLSKLAIQRGSKDNISVVVVDLKPRRKLKSKPLN (SEQ ID N.°: 99).

ABI2:

MDEVSPAVAVPFRPFTDPHAGLRGYCNGESRVTLPESSCSGDGAMKDSSFEINTRQDSLTSSSSAMAGVDISAGDEI NGSDEFDPRSMNQSEKKVLSRTESRSLFEFKCVPLYGVTSICGRRPEMEDSVSTIPRFLQVSSSSLLDGRVTNGFNP HLSAHFFGVYDGHGGSQVANYCRERMHLALTEEIVKEKPEFCDGDTWQEKWKKALFNSFMRVDSEIETVAHAPETV GSTSVVAVVFPTHIFVANCGDSRAVLCRGKTPLALSVDHKPDRDDEAARIEAAGGKVIRWNGARVFGVLAMSRSIGD RYLKPSVIPDPEVTSVRRVKEDDCLILASDGLWDVMTNEEVCDLARKRILLWHKKNAMAGEALLPAEKRGEGKDPAA MSAAEYLSKMALQKGSKDNISVVVVDLKGIRKFKSKSLN (SEQ ID N.°: 100).

En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de una proteína Cry2 (también conocida como criptocromo 2). Por ejemplo, un miembro de un dímero de la presente (por ejemplo, un par de unión al dimerizador) puede derivar de proteínas Cry2 de cualquier organismo (por ejemplo, una planta) tal como, de modo no taxativo, las de Arabidopsis thaliana. Por ejemplo, un par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 115 aa a aproximadamente 120 aa, de aproximadamente 120 aa a aproximadamente 130 aa, de aproximadamente 130 aa a aproximadamente 140 aa, de aproximadamente 140 aa a aproximadamente 150 aa, de aproximadamente 150 aa a aproximadamente 160 aa, de aproximadamente 160 aa a aproximadamente 170 aa, de aproximadamente 170 aa a aproximadamente 180 aa, de aproximadamente 180 aa a aproximadamente 190 aa, o de aproximadamente 190 aa a aproximadamente 200 aa de cualquiera de las siguientes secuencias de aminoácidos:

Cry2 (Arabidopsis thaliana) MKMDKKTIVWFRRDLRIEDNPALAAAAHEGSVFPVFIWCPEEEGQFYPGRASRWWMKQSLAHLSQSLKALGSDLTLI KTHNTISAILDCIRVTGATKVVFNHLYDPVSLVRDHTVKEKLVERGISVQSYNGDLLYEPWEIYCEKGKPFTSFNSYWK KCLDMSIESVMLPPPWRLMPITAAAEAIWACSIEELGLENEAEKPSNALLTRAWSPGWSNADKLLNEFIEKQLIDYAKN SKKVVGNSTSLLSPYLHFGEISVRHVFQCARMKQIIWARDKNSEGEESADLFLRGIGLREYSRYICFNFPFTHEQSLLS HLRFFPWDADVDKFKAWRQGRTGYPLVDAGMRELWATGWMHNRIRVIVSSFAVKFLLLPWKWGMKYFWDTLLDAD LECDILGWQYISGSIPDGHELDRLDNPALQGAKYDPEGEYIRQWLPELARLPTEWIHHPWDAPLTVLKASGVELGTNY AKPIVDIDTARELLAKAISRTREAQIMIGAAPDEIVADSFEALGANTIKEPGLCPSVSSNDQQVPSAVRYNGSKRVKPEE EEERDMKKSRGFDERELFSTAESSSSSSVFFVSQSCSLASEGKNLEGIQDSSDQITTSLGKNGCK (SEQ ID N.°: 101).

En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de la proteína CIB1 de Arabidopsis thaliana (también conocida como factor de transcripción bHLH63). Por ejemplo, un dímero adecuado (por ejemplo, un par de unión al dimerizador) puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 115 aa a aproximadamente 120 aa,

aproximadamente 120 aa a aproximadamente 130 a aproximadamente 130 aa a aproximadamente 140 aa,

aproximadamente 140 aa a aproximadamente 150 a aproximadamente 150 aa a aproximadamente 160 aa, de aproximadamente 160 aa a aproximadamente 170 a aproximadamente 170 aa a aproximadamente 180 aa, de aproximadamente 180 aa a aproximadamente 190 aa, o de aproximadamente 190 aa a aproximadamente 200 aa de la siguiente secuencia de aminoácidos:

MNGAIGGDLLLNFPDMSVLERQRAHLKYLNPTFDSPLAGFFADSSMITGGEMDSYLSTAGLNLPMMYGETTVEGDSR LSISPETTLGTGNFKKRKFDTETKDCNEKKKKMTMNRDDLVEEGEEEKSKITEQNNGSTKSIKKMKHKAKKEENNFSN DSSKVTKELEKTDYIHVRARRGQATDSHSIAERVRREKISERMKFLQDLVPGCDKITGKAGMLDEIINYVQSLQRQIEFL SMKLAIVNPRPDFDMDDIFAKEVASTPMTVVPSPEMVLSGYSHEMVHSGYSSEMVNSGYLHVNPMQQVNTSSDPLS CFNNGEAPSMWDSHVQNLYGNLGV (SEQ ID N.°: 102).

En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de la proteína de

GAI Arabidopsis thaliana (también conocida como proteína DELLA e insensible al ácido giberélico GAI). Por ejemplo,

un miembro de par de unión al dimerizador adecuado puede comprender una secuencia de aminoácidos con al menos

aproximadamente 75 %, al menos aproximadamente 80 %, al menos aproximadament

aproximadamente 90 %, al menos aproximadamente 95 %, al menos aproximadamente 98 %

de secuencia de aminoácidos con respecto a una extensión contigua de aproximadament

aproximadamente 110 aminoácidos (aa), de aproximadamente 110 aa a aproximada

aproximadamente 115 aa a aproximadamente 120 aa, de aproximadamente 120 damente 130 a aproximadamente 130 aa a aproximadamente 140 aa,

aproximadamente 140 damente 150 a aproximadamente 150 aa a aproximadamente 160 aa, de aproximadamente 160

damente 170 a aproximadamente 170 aa a aproximadamente 180 aa, de aproximadamente 180 aa a 190 aa, o de aproximadamente 190 aa a aproximadamente 200 aa de la siguiente secuencia de aminoácidos:

MKRDHHHHHHQDKKTMMMNEEDDGNGMDELLAVLGYKVRSSEMADVAQKLEQLEVMMSNVQEDDLSQLATETVH YNPAELYTWLDSMLTDLNPPSSNAEYDLKAIPGDAILNQFAIDSASSSNQGGGGDTYTTNKRLKCSNGVVETTTATAE STRHVVLVDSQENGVRLVHALLACAEAVQKENLTVAEALVKQIGFLAVSQIGAMRKVATYFAEALARRIYRLSPSQSPI DHSLSDTLQMHFYETCPYLKFAHFTANQAILEAFQGKKRVHVIDFSMSQGLQWPALMQALALRPGGPPVFRLTGIGP PAPDNFDYLHEVGCKLAHLAEAIHVEFEYRGFVANTLADLDASMLELRPSEIESVAVNSVFELHKLLGRPGAIDKVLGV VNQIKPEIFTVVEQESNHNSPIFLDRFTESLHYYSTLFDSLEGVPSGQDKVMSEVYLGKQICNVVACDGPDRVERHET LSQWRNRFGSAGFAAAHIGSNAFKQASMLLALFNGGEGYRVEESDGCLMLGWHTRPLIATSAWKLSTN (SEQ ID N.°:

103).

En algunos casos, un miembro de un dímero (por ejemplo, un par de unión al dimerizador) deriva de la proteína GID1

de Arabidopsis thaliana (también conocida como receptor de la giberelina GID1). Por ejemplo, un miembro del dímero

adecuado puede comprender una secuencia de aminoácidos con al menos aproximadamente 75 %, al menos

aproximadamente 80 %, al menos aproximadamente 85 %, al menos aproximadamente 90 %, al menos

aproximadamente 95 %, al menos aproximadamente 98 % o 100 % de identidad de secuencia de aminoácidos con

respecto a una extensión contigua de aproximadamente 100 aminoácidos a aproximadamente 110 a

de aproximadamente 110 aa a aproximadamente 115 aa, de aproximadamente 1 imadamente de aproximadamente 120 aa

aproximadamente 130 aa, de aproximadamente 1 imadamente de aproximadamente 140 aa

aproximadamente 150 aa, de aproximadamente 1 imadamente de aproximadamente 160 aa a aproximadamente 170 aa, de aproximadamente 1

imadamente de aproximadamente 180 aa a aproximadamente 190 aa, o de aproximadamente 190 aa a aproxima

de cualquiera de las siguientes secuencias de aminoácidos:

GID1A:

MAASDEVNLIESRTVVPLNTWVLISNFKVAYNILRRPDGTFNRHLAEYLDRKVTANANPVDGVFSFDVLIDRRINLLSRV YRPAYADQEQPPSILDLEKPVDGDIVPVILFFHGGSFAHSSANSAIYDTLCRRLVGLCKCVVVSVNYRRAPENPYPCAY DDGWIALNWVNSRSWLKSKKDSKVHIFLAGDSSGGNIAHNVALRAGESGIDVLGNILLNPMFGGNERTESEKSLDGK YFVTVRDRDWYWKAFLPEGEDREHPACNPFSPRGKSLEGVSFPKSLVVVAGLDLIRDWQLAYAEGLKKAGQEVKLM HLEKATVGFYLLPNNNHFHNVMDEISAFVNAEC (SEQ ID N.°: 104).

GID1B:

MAGGNEVNLNECKRIVPLNTWVLISNFKLAYKVLRRPDGSFNRDLAEFLDRKVPANSFPLDGVFSFDHVDSTTNLLTRI YQPASLLHQTRHGTLELTKPLSTTEIVPVLIFFHGGSFTHSSANSAIYDTFCRRLVTICGVVVVSVDYRRSPEHRYPCAY DDGWNALNWVKSRVWLQSGKDSNVYVYLAGDSSGGNIAHNVAVRATNEGVKVLGNILLHPMFGGQERTQSEKTLD GKYFVTIQDRDWYWRAYLPEGEDRDHPACNPFGPRGQSLKGVNFPKSLVVVAGLDLVQDWQLAYVDGLKKTGLEV NLLYLKQATIGFYFLPNNDHFHCLMEELNKFVHSIEDSQSKSSPVLLTP (SEQ ID N.°: 105)

GID1C:

MAGSEEVNLIESKTVVPLNTWVLISNFKLAYNLLRRPDGTFNRHLAEFLDRKVPANANPVNGVFSFDVIIDRQTNLLSR VYRPADAGTSPSITDLQNPVDGEIVPVIVFFHGGSFAHSSANSAIYDTLCRRLVGLCGAVVVSVNYRRAPENRYPCAY DDGWAVLKWVNSSSWLRSKKDSKVRIFLAGDSSGGNIVHNVAVRAVESRIDVLGNILLNPMFGGTERTESEKRLDGK YFVTVRDRDWYWRAFLPEGEDREHPACSPFGPRSKSLEGLSFPKSLVVVAGLDLIQDWQLKYAEGLKKAGQEVKLL YLEQATIGFYLLPNNNHFHTVMDEIAAFVNAECQ (SEQ ID N.°: 106).

Como se entenderá fácilmente, un CAR identificado mediante el cribado de una biblioteca del polipéptido CAR modular sintético que codifica ácidos nucleicos o una biblioteca de polipéptidos CAR modulares sintéticos se puede modificar, por ejemplo, mediante la adición de uno o más dominios (por ejemplo, dominios comoduladores), mediante la remoción de uno o más dominios (por ejemplo, la remoción de un indicador fluorescente utilizado en el procedimiento de cribado), mediante la división del CAR en dos polipéptidos (y agregando un dominio de dimerización), mediante el rearreglo de los dominios, etc.

En algunos casos, se puede cribar una biblioteca en busca de un fenotipo relacionado con una respuesta celular para un entorno celular particular. Como tal, se puede definir un fenotipo celular mediante una respuesta de la célula (por ejemplo, activación o inhibición) con respecto a la exposición a un entorno particular. Por ejemplo, se puede evaluar una respuesta de los linfocitos T de acuerdo con la exposición a un entorno celular particular. En algunas modalidades, la inhibición de linfocitos T se puede evaluar en respuesta a la exposición a un entorno tumoral.

En algunos casos, se puede cribar una biblioteca en busca de un fenotipo relacionado con una localización celular, por ejemplo, en función de la anidación o direccionamiento celular. Como tal, se puede cribar la influencia de los miembros de la biblioteca en el direccionamiento celular. Por ejemplo, se puede introducir una biblioteca celular en un organismo huésped y se pueden recuperar las células de la biblioteca de una ubicación dirigida del organismo huésped después de algún lapso de tiempo con el fin de evaluar qué células se dirigieron con éxito a la ubicación dirigida. En algunos casos, se pueden cribar los linfocitos T para su direccionamiento a un tumor in vivo.

En algunos casos, se puede cribar una biblioteca en busca de un fenotipo para una afección específica del paciente. Las afecciones específicas del paciente analizadas de esta manera variarán en gran medida y pueden incluir afecciones relacionadas con un estado de la enfermedad particular de un paciente e implican el cribado de una biblioteca para identificar el o los miembros de la biblioteca particular que muestran un fenotipo aumentado u óptimo para la afección específica del paciente. En algunos casos, la localización de miembros de la biblioteca celular se puede evaluar después de la exposición a un explante o xenoinjerto derivado del paciente. Por ejemplo, se puede evaluar la localización de linfocitos T de una biblioteca de linfocitos T celular que expresa CAR después de la exposición a un xenoinjerto tumoral específico del paciente. En algunos casos, la proliferación de miembros de la biblioteca celular se puede evaluar después de la exposición a un explante o xenoinjerto derivado del paciente. Por ejemplo, se puede evaluar la proliferación de linfocitos T de una biblioteca de linfocitos T celular que expresa CAR después de la exposición a un xenoinjerto tumoral específico del paciente. En algunos casos, se puede evaluar un explante o xenoinjerto específico del paciente para determinar un aumento o disminución en la viabilidad después de la exposición a una biblioteca celular o miembros de la biblioteca celular particular. Por ejemplo, se puede evaluar la eliminación de linfocitos T de una biblioteca de linfocitos T celular que expresa CAR después de la exposición a un xenoinjerto tumoral específico del paciente. Como tal, se puede cribar una biblioteca para identificar el o los miembros óptimos de la biblioteca para tratar un paciente particular.

En algunos casos, se pueden evaluar los fenotipos in vitro mediante provocación con antígenos dinámicos. Por provocación con antígenos dinámicos se entiende que se evalúa el fenotipo más allá de la mera presencia o ausencia del antígeno y, por lo tanto, el antígeno puede variarse dinámicamente, por ejemplo, variarse dinámicamente a lo largo de un intervalo de concentraciones, variarse dinámicamente a lo largo de un intervalo de tiempo, etc. Por ejemplo, se pueden valorar los niveles de antígenos (por ejemplo, a través de diversas concentraciones) con el fin de evaluar el fenotipo de prueba en diversas dosis, es decir, para evaluar la respuesta a la dosis. El antígeno puede estar presente en diferentes concentraciones mediante cualquier medio conveniente. Como ejemplo no taxativo, las distintas cantidades de antígeno pueden estar presentes usando células que expresan el antígeno a distintos niveles que incluyen un intervalo de niveles. En algunos casos, es posible variar dinámicamente el tiempo de la aplicación del antígeno, por ejemplo, con el fin de evaluar el fenotipo en un ensayo de punto de tiempo o para evaluar la cinética del fenotipo analizado.

En algunos casos, se puede cribar una biblioteca en busca de una característica fenotípica. La expresión “característica fenotípica”, tal como se utiliza en la presente, hace referencia generalmente a una combinación de fenotipos individuales. Por ejemplo, en algunos casos, una célula puede tener una característica fenotípica que incluye una morfología particular combinada con la expresión de un marcador particular. Una característica fenotípica puede combinar fenotipos de categorías fenotípicas similares o diferentes, por ejemplo, una característica fenotípica puede incluir la expresión de dos marcadores de superficie celular relacionados pero diferentes o una característica fenotípica puede incluir la expresión de un marcador de superficie celular y un marcador de proliferación celular o una característica fenotípica puede incluir la expresión de un marcador de superficie celular y un marcador secretado particular (por ejemplo, una citocina) o una característica fenotípica puede incluir la expresión de dos citocinas diferentes, etc. Se puede utilizar cualquier fenotipo conveniente, que incluye aquellos que se describen en la presente, como un componente de una característica fenotípica.

Identificar polipéptidos modulares sintéticos asociados al fenotipo

La presente descripción incluye métodos para identificar los miembros de la biblioteca que se asocian con un fenotipo detectado particular. Sin limitarnos a ninguna teoría, el ensamblaje coordinado de cada polipéptido sintético de múltiples módulos junto con cada código de barras con múltiples unidades correspondiente permite el ensamblaje y posterior identificación de cada polipéptido modular sintético único. Como se describió anteriormente, la región del código de barras de cada ácido nucleico que codifica polipéptidos modulares sintéticos proporciona no solo la identidad de los módulos individuales que constituyen cada polipéptido modular sintético, sino que también la configuración específica (llamada en la presente arquitectura) de los módulos. Como tal, la identidad y arquitectura de cada miembro de la biblioteca se puede determinar al secuenciar la región del código de barras.

Por consiguiente, no es necesario hacer el cribado de la biblioteca con miembros de la biblioteca separados físicamente y los miembros de la biblioteca se pueden “agrupar” y “cribar” de forma simultánea. La agrupación de los miembros de la biblioteca se puede realizar in vitro, por ejemplo, en un tubo de ensayo o en una muestra de células fuera de un organismo asociado o in vivo, en un animal o en un tejido. Después del cribado simultáneo, es posible identificar los miembros de la biblioteca asociados al fenotipo y/o módulos de estos mediante la identificación y/o cuantificación de la región del código de barras asociada. En algunos casos, el cribado agrupado permite el cribado de grandes cantidades de miembros únicos de la biblioteca que no se lleva a la práctica mediante cribado paralelo o secuencial convencional. La cantidad de miembros único de la biblioteca que se puede cribar en busca de un fenotipo dependerá del tamaño y complejidad de la biblioteca y, por lo tanto, puede variar pero puede variar de 96 o menos a millones o más, lo que incluye de modo no taxativo, por ejemplo, 100 o más, 200 o más, 300 o más, 400 o más, 500 o más, 1000 o más, 2000 o más, 3000 o más, 4000 o más, 5000 o más, 6000 o más, 7000 o más, 8000 o más, 9000 o más, 10,000 o más, 20,000 o más, 30,000 o más, 40,000 o más, 50,000 o más, 60,000 o más, 70,000 o más, 80,000 o más, 90,000 o más, 100,000 o más, etc.

En algunos casos, se puede medir la cantidad o frecuencia de un código de barras particular para identificar un módulo muy representado. Por ejemplo, la frecuencia de cada código de barras se puede cuantificar a partir de una muestra agrupada que contiene miembros de la biblioteca y ácidos nucleicos asociados que codifican los miembros de la biblioteca de manera que los códigos de barras con la frecuencia más alta identifican aquellos módulos más representados en la muestra. En determinadas modalidades, dichas muestras pueden ser muestras celulares.

En algunos casos, se puede medir la cantidad o frecuencia de un código de barras con múltiples unidades particular (por ejemplo, región del código de barras) para identificar un polipéptido modular muy representado. Por ejemplo, la frecuencia de cada código de barras con múltiples unidades se puede cuantificar a partir de una muestra agrupada que contiene miembros de la biblioteca y los ácidos nucleicos asociados que codifican los miembros de la biblioteca de manera que los códigos de barras con múltiples unidades con la frecuencia más alta identifican aquellos polipéptidos modulares más representados en la muestra. En determinadas modalidades, dichas muestras pueden ser muestras celulares.

En algunos casos, la detección del fenotipo Y la identificación de los miembros de la biblioteca y sus componentes se puede realizar como parte de un método integrado. Por ejemplo, en algunos casos, se puede seleccionar el fenotipo mediante citometría de flujo y los miembros de la biblioteca se pueden identificar mediante secuenciación. Dichos métodos integrados se pueden realizar junto con ensayos in vitro y/o in vivo, por ejemplo, como se ilustra en la figura 24 donde se utiliza FLOW-Seq como un ejemplo no taxativo de un método integrado.

Como se utiliza en la presente, la expresión “FLOW-seq” hace referencia generalmente a la combinación de la clasificación de los métodos de citometría de flujo (por ejemplo, FACS) con métodos de secuenciación (por ejemplo, secuenciación de última generación) en un único proceso de trabajo unido. Se puede utilizar cualquier método conveniente y adecuado para clasificar la citometría de flujo y cualquier método de secuenciación conveniente y adecuado en dicho método FLOW-Seq. Por ejemplo, en algunos casos, una biblioteca celular que expresa polipéptidos modulares sintéticos con código de barras, como se describe en la presente, se puede cribar en busca de un fenotipo mediante citometría de flujo y se pueden clasificar aquellas células que tienen un fenotipo particular y sus códigos de barras se secuencian posteriormente para identificar miembros particulares de la biblioteca y/o cuantificar la frecuencia de los miembros particulares de la biblioteca y/o los módulos de estos que aparecen en las células clasificadas. La clasificación se puede realizar de cualquier manera conveniente y adecuada lo que incluye, por ejemplo, clasificar uno o más recipientes de acuerdo con un fenotipo detectado por citometría de flujo. Después de la clasificación, se puede realizar la secuenciación directamente en la muestra clasificada y/o célula clasificada o la muestra clasificada y/o la célula clasificada se puede expandir y/o cultivar antes de la clasificación, por ejemplo, para aumentar las copias de los ácidos nucleicos que codifican los miembros de la biblioteca. Se utilizaron métodos FLOW-seq, por ejemplo, para medir fenotípicamente los niveles de proteína e identificar los elementos genéticos relacionados en las bacterias (véase, por ejemplo, Kosuri et ál. Proc Natl Acad Sci EUA (2013) 110(34):14024-9 y Goodman et ál. Science (2013) 342(6157):475-479) además se realizó el acoplamiento de secuenciación con FACS para correlacionar los linfocitos T clasificados de acuerdo con la función con sus respectivos receptores de linfocitos T secuenciados (véase, por ejemplo, Han et ál. Nature Biotechnology (2014) 32:684-692).

En algunos casos, la identificación de un polipéptido modular sintético asociado con un fenotipo particular puede implicar el aislamiento quirúrgico de un tejido u órgano de un modelo in vivo en el cual se ha introducido la biblioteca. Por ejemplo, en algunos casos, después de un tiempo suficiente para el ensayo, se puede quitar un órgano o tejido de un animal huésped y los ácidos nucleicos presentes en el órgano o tejido se pueden secuenciar con el fin de identificar miembros individuales de la biblioteca presentes en el órgano o tejido. En otros casos, el ácido nucleico aislado de un órgano o tejido o un animal huésped se puede secuenciar cuantitativamente, incluso, semicuantitativamente, con el fin de cuantificar la frecuencia relativa o presencia de un miembro particular de la biblioteca en el órgano o tejido. En incluso otros casos, el ácido nucleico aislado de un órgano o tejido o un animal huésped se puede secuenciar cuantitativamente, lo que incluye semicuantitativamente con el fin de cuantificar la frecuencia relativa o presencia de un módulo particular en el órgano o tejido.

En algunos casos, por ejemplo, cuando un módulo particular está muy representado después de la semicuantificación o se identifica un módulo individual como que contribuye con un fenotipo deseado, se puede realizar una ronda posterior del nuevo ensamblaje de la biblioteca donde el módulo identificado se incluye en todos los miembros de la biblioteca recién producidos (es decir, el módulo variable identificado se utiliza posteriormente como un módulo no variable) y la biblioteca recién generada se analiza para identificar módulos adicionales que influyen cooperativamente en el fenotipo junto con el módulo identificado originalmente. El experto en la técnica entenderá fácilmente donde se puede realizar el ensamblaje y cribado de la biblioteca repetido para producir bibliotecas e miembros individuales de la biblioteca con fenotipos deseados.

Ejemplos

Los siguientes ejemplos se brindan a efectos de proporcionarles a los expertos en la técnica una divulgación y descripción completa de cómo elaborar y utilizar la presente invención y no se pretende que limiten el alcance de lo que los inventores consideran la invención ni pretenden establecer que los experimentos a continuación son todos o los únicos experimentos realizados. Se ha intentado asegurar la exactitud de los números que se utilizan (por ejemplo, cantidades, temperaturas, etc.), pero se deben tener en cuenta un margen de error y desvío experimental. A menos que se indique lo contrario, las partes son partes en peso, el peso molecular es el peso molecular promedio en peso, la temperatura se indica en grados Celsius y la presión es atmosférica o similar. Se pueden utilizar abreviaturas estándares, por ejemplo, pb: par o pares de bases, kb: kilobases; pl: picolitros, s o seg: segundos, min: minutos, h: horas, aa: aminoácidos, kb: kilobases, pb: par o pares de bases, nt: nucleótidos, i.m.: intramuscular o por vía intramuscular, i.p.: intraperitoneal o por vía intraperitoneal, s.c: subcutánea o por vía subcutánea y similares.

Ejemplo 1: Construcción y cribado de bibliotecas modulares de dominio comodulador

Para preparar fragmentos de ácido nucleico que codifican el módulo con código de barras que contiene los elementos necesarios para la construcción de bibliotecas, los ácidos nucleicos que codifican los módulos de polipéptidos (de decir, dominios comoduladores (de decir, coestimuladores o coinhibidores) se subclonaron en un vector de clonación adecuado para secuenciar y la digestión de enzimas de restricción de tipo IIS. Después de la subclonación el vector incluyó: la secuencia de codificación del módulo, secuencias enlazadoras Gly/Ser óptimas que flanquean la secuencia de codificación del módulo, una secuencia con código de barras específica para el módulo, brazos de homología de clonación 3' que flanquean la secuencia con código de barras específica para el módulo, un sitio de restricción de BamHI entre la secuencia de codificación del módulo y la secuencia con código de barras específica para el módulo y los sitios de enzimas de restricción de tipo IIS en el extremo 5' de la secuencia de codificación del módulo y el extremo 3' de la secuencia con código de barras específica para el módulo (figura 1). Se secuenciaron las inserciones del vector subclonado para confirmar la identidad de los dominios comoduladores insertados. Los dominios comoduladores utilizados en esta biblioteca combinatoria y sus respectivas secuencias proteicas se proporcionan en la Tabla 1.

Los vectores de clonación que contienen la secuencia de codificación del módulo con código de barras se digirieron usando la enzima de restricción de tipo IIS para liberar los ácidos nucleicos de “secuencia perfecta” que codifican el módulo de polipéptidos (figura 2). Se proporciona un ejemplo de una parte de un vector de clonación que contiene los miembros descritos y la secuencia que codifica un dominio coestimulador de CD28 antes y después de la digestión de enzimas de restricción de tipo IIS (figura 3) y representa la configuración general de cada plásmido/fragmento del módulo utilizado en la construcción de la biblioteca.

La preparación del vector de expresión (es decir, pHR del vector de envasado lentiviral (también llamado vector receptor) se realizó mediante digestión de enzimas de restricción en el sitio BamHI 3' del promotor del virus formador de foco en el bazo (pSFFV). Las construcciones del miembro de la biblioteca se ensamblaron de manera gradual (figura 5). Se utilizó por primera vez la clonación en fusión para insertar en el vector de expresión la secuencia que codifica el fragmento variable de cadena simple (scFv) y los dominios transmembrana (TM) (scFV-TM) comunes a todos los miembros de la biblioteca. La mezcla de reacción en fusión se transformó en E. coli competente. Las células transformadas se colocaron en placas. Las colonias se seleccionaron y se realizaron minipreps para extraer el ADN para recuperar el plásmido construido. Después de la construcción exitosa del scFV-TM que contiene el plásmido de expresión, cada componente sucesivo del polipéptido de múltiples módulos, lo que incluye el indicador de EGFP, se insertó 3' con respecto al componente previo en etapas individuales de acuerdo con la figura 5. Cada etapa incluyó la digestión con BamHI y el ensamblaje en fusión seguido de la transfección de la reacción en fusión, selección de colonias y purificación de plásmidos.

Como se muestra en la figura 5 , cada miembro de la biblioteca resultante de la reacción en fusión final incluyó el scFV-TM común unido a una combinación específica del miembro de dos dominios comoduladores unidos al indicador común (CD3z-EGFP) y un par de códigos de barras específico para el módulo en orientación opuesta relativa a los dominios comoduladores. Los códigos de barras se flanquearon mediante sitios de unión de cebadores que permiten la amplificación y/o secuenciación de la combinación de códigos de barras particular que corresponde a la combinación específica del miembro de la biblioteca de dominios comodulador.

Después de la competición de la biblioteca del plásmido final, los miembros individuales de la biblioteca se transfectaron en células HEK-293 y se generó el lentivirus mediante medios convencionales. El lentivirus generado se utilizó para infectar los linfocitos T para producir células inmunitarias modificadas que expresan los polipéptidos multimodulares.

Las células inmunitarias modificadas se clasificaron por FACS de acuerdo con la expresión de EGFP del indicador. Se realizó la clasificación para aislar una población de células modificadas con niveles de expresión uniforme. Las células clasificadas con expresión uniforme de los polipéptidos multimodulares se utilizaron en cribado funcionales posteriores.

Esta estrategia general se utilizó para generar cuatro bibliotecas separadas. Se construyeron bibliotecas unidimensionales (es decir, donde cada miembro de la biblioteca incluyó un dominio comodulador único) y bibliotecas bidimensionales (es decir, donde cada miembro de la biblioteca incluyó dos dominios comoduladores). Los miembros de las bibliotecas bidimensionales se ensamblaron de acuerdo con el esquema general presentado en la figura 6. Las cuatro bibliotecas y cribado asociados realizados fueron los siguientes:

1) Se construyó una biblioteca unidimensional de 20 miembros y se utilizó para probar la viabilidad del cribado FLOWseq de la función de linfocitos T. Cada miembro de la biblioteca se configuró para que contenga un dominio CD8 fusionado con un módulo de dominio comodulador fusionado con un dominio CD3Z. Los linfocitos T modificados se categorizaron de acuerdo con su expresión del indicador mediante FACS y se analizó la biblioteca para medir la respuesta a la dosis de la activación de linfocitos T (CD69) con respecto a los antígenos unidos a la placa.

2) Se construyó una biblioteca de anti-CD19 unidimensional de 62 miembros y se analizó en un modelo tumoral de ratón in vivo. Cada miembro de la biblioteca se configuró para que contenga un dominio anti-CD19 fusionado con un módulo de dominio comodulador fusionado con un dominio CD3Z fusionado con el indicador de EGFP.

3) Se construyó una biblioteca bidimensional de 62 por 62 miembros. Cada miembro de la biblioteca incluyó un dominio anti-CD19 fusionado con un primer módulo de dominio comodulador fusionado con un segundo módulo de dominio comodulador fusionado con un dominio CD3Z fusionado con el indicador de EGFP.

4) Se construyó una biblioteca anti-mesotelina unidimensional de 62 miembros. Cada miembro de la biblioteca incluyó un dominio anti-mesotelina fusionado con un módulo de dominio comodulador fusionado con un dominio CD3Z fusionado con el indicador de EGFP.

La biblioteca anti-CD19 unidimensional de 62 miembros agrupada se analizó funcionalmente para secuencias comoduladoras alternativas en receptores de antígenos quiméricos (CAR). Cada miembro de la biblioteca incluyó un scFv anti-CD19 que especifica el antígeno de célula cancerosa objetivo, uno de los módulos del dominio comodulador de la Tabla 1 y un dominio de señalización primario CD3Z (figura 7).

Después de la estimulación de antígenos (en 32 ng/ml, 125 ng/ml y 1000 ng/ml de antígeno) de los linfocitos T modificados de la biblioteca agrupada, los linfocitos T se clasificaron funcionalmente mediante FACS en recipientes “bajos” o “altos” de acuerdo con la expresión de CD69 (figura 8). Se cuantificó el enriquecimiento relativo de códigos de barras específicos que corresponden a dominios comoduladores individuales en los recipientes de alta y baja estimulación, mediante secuenciación (a nivel de antígeno de 1000 ng/ml) (figura 9). Este enfoque permitió la comparación del resultado estimulador e inhibidor de cada dominio comodulador dentro del CAR anti-CD19-CD3Z y en el contexto particular de la simulación de antígenos utilizada. Por ejemplo, los resultados del cribado se cribaron además a lo largo de los distintos niveles de entrada de antígenos, permitiendo la rápida evaluación de la respuesta a la dosis de dominios comoduladores individuales (figura 10).

Ejemplo 2: Confirmación del ensamblaje completo de una biblioteca bidimensional de 61 por 61

Se ensamblaron sesenta y un módulos CAR variables (Tabla 2 , proporcionados en la figura 25) en una biblioteca de ácidos nucleicos con código de barras que codifica dos polipéptidos CAR modulares sintéticos bidimensionales (2D) por ensamblaje anidado. La biblioteca se secuenció de forma profunda mediante un método de secuenciación por síntesis (SBS) que utiliza un sistema MiSeq (Illumina Inc., Hayward, CA) y se determinó el conteo de lectura de cada miembro de la biblioteca ensamblada. 26).

Claims

REIVINDICACIONES

1. Un método para identificar un fenotipo seleccionado asociado a un polipéptido modular sintético en una célula ex vivo/in vivo, comprendiendo el método:

a) introducir una biblioteca con código de barras de ácidos nucleicos en las células huésped, generando así una población heterogénea de células huésped modificadas genéticamente, donde la biblioteca con código de barras de ácidos nucleicos comprende múltiples miembros, cada uno de los múltiples miembros comprende una secuencia de nucleótidos que codifica un polipéptido modular sintético diferente, comprendiendo la secuencia de nucleótidos: una región de codificación que comprende dos o más secuencias de codificación que codifican dos o más módulos variables, en donde las dos o más secuencias de codificación están en marco entre sí; y una región de código de barras que comprende dos o más códigos de barras únicos, en donde cada módulo variable en la región de codificación está correlacionado con un código de barras único específico en la región del código de barras;

b) identificar una célula huésped modificada genéticamente dentro de la población heterogénea que muestra el fenotipo seleccionado en respuesta a un estímulo; y

c) a partir de la célula huésped identificada de (b), identificar y/o cuantificar la región del código de barras mediante secuenciación, identificando así el polipéptido modular sintético y/o módulo del mismo que produce el fenotipo seleccionado.

2. El método de la reivindicación 1, donde el polipéptido modular sintético es:

a) un polipéptido del receptor modular, opcionalmente un polipéptido del receptor de antígenos quiméricos (CAR) o un polipéptido del receptor Notch quimérico;

b) una proteína de andamiaje modular,

c) una proteína cinasa o proteína fosfatasa modular,

d) una proteína reguladora transcripcional modular,

e) una proteína reguladora epigenética modular, o

f) una proteína recombinasa o nucleasa modular.

3. El método de la reivindicación 2, donde el polipéptido modular sintético es un CAR y el estímulo es una célula presentadora de antígenos que muestra en su superficie un antígeno que está unido por el CAR.

4. El método de cualquiera de las reivindicaciones anteriores, donde el fenotipo es uno o más de:

a) proliferación;

b) producción de citocinas;

c) expresión de un marcador de superficie celular;

d) expresión de una proteína indicadora.

5. El método de cualquiera de las reivindicaciones anteriores, donde los múltiples miembros comprenden una secuencia de nucleótidos que codifica un polipéptido modular sintético que comprende un dominio modular que se seleccionan del grupo que consiste en: un dominio de unión al antígeno, un dominio de unión específica o una proteína compañera de unión específica, un dominio coestimulador, un dominio coinhibidor, un dominio se señalización intracelular, un dominio transmembrana, un dominio de proteína de andamiaje, un dominio de proteínas de la proteína cinasa, un dominio de proteína de la proteína fosfatasa, un dominio de proteína del receptor de tirosina quinasa, un dominio de proteína quinasa lípida, un dominio de proteína fosfatasa lípida, un dominio de proteína ubiquitinilasa, un dominio de la proteína deubiquitinilasa, un dominio de la proteína SUMOilasa, un dominio de proteína acetilasa, un dominio de la proteína deacetilasa, un dominio de la proteína metilasa, un dominio de la proteína demetilasa, un dominio de la proteína nucleasa, un dominio de la proteína recombinasa, un dominio de proteína del factor de transcripción y combinaciones de estos.

6. Una biblioteca con código de barras de ácidos nucleicos, comprendiendo la biblioteca:

múltiples polinucleótidos únicos que comprende cada uno una secuencia de nucleótidos que codifica un polipéptido modular sintético único donde cada polinucleótido único comprende:

i) una región de codificación que codifica el polipéptido modular sintético único que comprende una primera secuencia de codificación que codifica un primer módulo unido en el marco a una segunda secuencia de codificación que codifica un segundo módulo,

ii) una región del código de barras de múltiples unidades que comprende un primer código de barras específico para la primera secuencia de codificación unida a un segundo código de barras específico para la segunda secuencia de codificación, donde el primer y el segundo código de barras se encuentran en el orden inverso 5' a 3' en comparación con la primera y la segunda secuencia de codificación; y

donde secuenciar cada región con código de barras de múltiples unidades permite la identificación de cada polipéptido modular sintético único.

7. La biblioteca de la reivindicación 6, donde la primera y la segunda secuencia de codificación están unidas directamente sin ningún nucleótido no codificador interviniente.

8. La biblioteca de las reivindicaciones 6 o 7, donde el polipéptido modular sintético único comprende un dominio coestimulador, opcionalmente, donde el primer y el segundo módulo comprenden diferentes dominios coestimuladores.

9. La biblioteca de las reivindicaciones 6-8, donde los polipéptidos modulares sintéticos únicos codificados por cada polinucleótido único de la multiplicidad son:

a) polipéptidos receptores modulares, opcionalmente polipéptidos del receptor de antígeno quimérico (CAR) o polipéptidos del receptor Notch;

b) proteínas de andamiaje modulares;

c) proteínas cinasas o proteínas fosfatasas modulares,

d) proteínas reguladoras de transcripción modulares,

e) proteínas reguladoras epigenéticas modulares, o

f) proteínas nucleasas o recombinasas modulares.

10. La biblioteca de cualquiera de las reivindicaciones 6-9, donde los polipéptidos modulares sintéticos únicos codificados por cada polinucleótido único de la multiplicidad comprenden un dominio modular que se seleccionan del grupo que consiste en: un dominio de unión al antígeno, un dominio de unión específica o una proteína compañera de unión específica, un dominio coestimulador, un dominio coinhibidor, un dominio se señalización intracelular, un dominio transmembrana, un dominio de proteína de andamiaje, un dominio de proteínas de la proteína cinasa, un dominio de proteína de la proteína fosfatasa, un dominio de proteína del receptor de tirosina quinasa, un dominio de proteína quinasa lípida, un dominio de proteína fosfatasa lípida, un dominio de proteína ubiquitinilasa, un dominio de la proteína deubiquitinilasa, un dominio de la proteína SUMOilasa, un dominio de proteína acetilasa, un dominio de la proteína deacetilasa, un dominio de la proteína metilasa, un dominio de la proteína demetilasa, un dominio de la proteína nucleasa, un dominio de la proteína recombinasa, un dominio de proteína del factor de transcripción y combinaciones de estos.

11. Una biblioteca celular, comprendiendo la biblioteca:

una pluralidad de células que comprenden cada una un polinucleótido único de la biblioteca de códigos de barras de ácidos nucleicos según cualquiera de las reivindicaciones 6 a 10, en donde la secuenciación de cada región de código de barras permite la identificación de cada polipéptido modular sintético único de cada célula de la biblioteca.

12. Un método para elaborar una biblioteca con código de barras de ácidos nucleicos que codifica cada uno un polipéptido modular sintético único, comprendiendo el método:

poner en contacto un primer polinucleótido que comprende una primera secuencia de codificación del módulo unida a una primera secuencia con código de barras con un segundo polinucleótido que comprende una segunda secuencia de codificación del módulo unida a una segunda secuencia con código de barras en condiciones suficientes para la inserción del primer polinucleótido en el segundo polinucleótido en la unión entre la segunda secuencia de codificación y la segunda secuencia con código de barras, generando así un polinucleótido bimodular con código de barras,

donde el polinucleótido bimodular con código de barras comprende la segunda secuencia de codificación modular unida en el marco con la primera secuencia de codificación modular unida a la primera secuencia con código de barras unida a la segunda secuencia con código de barras.