BR112019027614B1 - SHORT DANGLING ARM BINDERS TO NUCLEOTIDES IN SEQUENCING APPLICATIONS - Google Patents
SHORT DANGLING ARM BINDERS TO NUCLEOTIDES IN SEQUENCING APPLICATIONS Download PDFInfo
- Publication number
- BR112019027614B1 BR112019027614B1 BR112019027614-9A BR112019027614A BR112019027614B1 BR 112019027614 B1 BR112019027614 B1 BR 112019027614B1 BR 112019027614 A BR112019027614 A BR 112019027614A BR 112019027614 B1 BR112019027614 B1 BR 112019027614B1
- Authority
- BR
- Brazil
- Prior art keywords
- compound
- nucleotides
- nucleotide
- oligonucleotide
- sequencing
- Prior art date
Links
Abstract
A presente divulgação se refere a novos compostos nucleotídicos e oligonucleotídicos esuas utilizações em aplicações de sequenciamento de ácidos nucleicos.The present disclosure relates to novel nucleotide and oligonucleotide compounds and their uses in nucleic acid sequencing applications.
Description
[0001] O presente pedido reivindica benefício de prioridade ao Pedido do Reino Unido (GB) No. 1711219.4, depositado em 12 de Julho de 2017, o qual é incorporado por referência na sua totalidade.[0001] This application claims the benefit of priority to United Kingdom (GB) Application No. 1711219.4, filed on 12 July 2017, which is incorporated by reference in its entirety.
[0002] A presente divulgação refere-se a novos compostos nucleotídicos e oligonucleotídicos e suas utilizações em aplicações de sequenciamento de ácidos nucleicos.[0002] The present disclosure relates to novel nucleotide and oligonucleotide compounds and their uses in nucleic acid sequencing applications.
[0003] À medida que a tecnologia de sequenciamento avança, desenvolveu-se uma necessidade de reagentes de sequenciamento aprimorados que são particularmente favoráveis a métodos moleculares de alto rendimento, tal como sequenciamento de fase sólida e similar.[0003] As sequencing technology advances, a need has developed for improved sequencing reagents that are particularly amenable to high-throughput molecular methods such as solid-phase sequencing and the like.
[0004] Em certos tipos de sequenciamento de alto rendimento, os nucleotídeos utilizados contêm fluoróforos que identificam especificamente a base incorporada. O fluoróforo pode ser ligado à base nucleotídica através de um ligante clivável. Portanto, depois que a base incorporada é identificada, o ligante pode ser clivado, permitindo que o fluoróforo seja removido, pronto para a próxima base a ser ligada e identificada. Tal clivagem deixa uma porção de "cicatriz" ou "braço pendente" localizada em cada uma das nucleobases detectadas. Embora seja possível projetar reagentes que não deixam qualquer traço após a clivagem, estes tendem a ser lentos para clivar e, portanto, não são particularmente eficazes. É necessário encontrar um equilíbrio entre a incorporação eficiente dos nucleotídeos marcados, a clivagem eficiente para remover todos os marcadores incorporados e a incorporação eficiente do nucleotídeo seguinte. Aqui são descritas estruturas otimizadas de nucleotídeos que melhoram o desempenho de nucleotídeos da técnica anterior em ciclos de Sequenciamento por Síntese (SBS).[0004] In certain types of high-throughput sequencing, the nucleotides used contain fluorophores that specifically identify the incorporated base. The fluorophore can be attached to the nucleotide base via a cleavable linker. Therefore, once the incorporated base is identified, the linker can be cleaved, allowing the fluorophore to be removed, ready for the next base to be attached and identified. Such cleavage leaves a "scar" or "dangling arm" located at each of the detected nucleobases. Although it is possible to design reagents that leave no trace after cleavage, these tend to be slow to cleave and therefore are not particularly effective. A balance must be struck between efficient incorporation of the labeled nucleotides, efficient cleavage to remove all incorporated labels, and efficient incorporation of the next nucleotide. Optimized nucleotide structures that improve prior art nucleotide performance in Sequencing by Synthesis (SBS) cycles are described here.
[0005] Ligantes de nucleotídeos adequados estão descritos, por exemplo, no documento WO2004/018493. Os compostos aqui divulgados são mostrados como exemplo de fórmula (e):em que B é uma base nucleosídica; e Fl é um fluoróforo conectado através de um ligante opcional. Este é clivadopara deixar uma porção de braço pendente de fórmula (ei): [0005] Suitable nucleotide ligands are described, for example, in WO2004/018493. The compounds disclosed herein are shown as an example of formula (e): where B is a nucleoside base; and Fl is a fluorophore connected via an optional linker. This is cleaved to leave a pendant arm moiety of formula (ei):
[0006] A Requerente percebeu que alterações nobraço pendente podem fornecer melhorias para os dados de sequenciamento obtidos.[0006] The Applicant realized that changes in the hanging arm may provide improvements to the sequencing data obtained.
[0007] Aqui são descritas estruturas nucleotídicasaprimoradas e suas utilizações no sequenciamento. As moléculas descritas podem ser incorporadas em fitas de ácidos nucleicos. Também são descritas cadeias de ácidos nucleicos com certas modificações que permitem uma incorporação mais eficiente de nucleotídeos. Também são descritos arranjos de ácidos nucleicos e sua utilização no sequenciamento. Melhorias particulares podem ser observadas no que tange a eficiência da incorporação de nucleotídeos marcados, no comprimento e na precisão de leitura do sequenciamento obtido através dos novos construtos. As moléculas descritas abaixo são particularmente vantajosas em situações em que comprimentos de leitura longos são necessários ou em que tempos mais curtos de incorporação de nucleotídeos são vantajosos, fontes de excitação de alta potência são usadas. SUMÁRIO[0007] Improved nucleotide constructs and their uses in sequencing are described herein. The molecules described can be incorporated into nucleic acid strands. Also described are nucleic acid strands with certain modifications that allow for more efficient nucleotide incorporation. Also described are nucleic acid arrays and their uses in sequencing. Particular improvements can be observed in the efficiency of incorporation of labeled nucleotides, in the length and in the sequencing read accuracy obtained through the new constructs. The molecules described below are particularly advantageous in situations where long read lengths are required or where shorter nucleotide incorporation times are advantageous, and high-power excitation sources are used. SUMMARY
[0008] A presente divulgação refere-se a reagentesaprimorados para sequenciamento de ácidos nucleicos. Durante ciclos repetidos de sequenciamento por síntese (SBS), em que os nucleotídeos marcados com fluorescência são incorporados em uma fita estendida de ácido nucleico, é produzido um iniciador: molde de DNA "cicatrizado". A"cicatriz" ou "braço pendente" é uma fração localizada em cada uma das nucleobases detectadas, resultante da clivagem química do fluoróforo da nucleobase à qual está ligada. Esses braços pendentes se acumulam no iniciador:molde de DNA ao longo dos ciclos repetidos de SBS, produzindo uma molécula de iniciador:molde de DNA com estrutura molecular que difere em relação ao iniciador:molde de DNA natural. Esses braços pendentes residuais retardam a incorporação do novo nucleotídeo recebido e, portanto, aumentam a taxa de erro e diminuem a qualidade dos dados, especialmente nos estágios posteriores de uma execução de sequenciamento e em longas execuções de sequenciamento. A presente divulgação visa minimizar o tamanho do braço pendente deixado no iniciador: molde de DNA durante o sequenciamento.[0008] The present disclosure relates to improved reagents for nucleic acid sequencing. During repeated cycles of sequencing by synthesis (SBS), in which fluorescently labeled nucleotides are incorporated into an extended strand of nucleic acid, a "scarred" primer:DNA template is produced. The "scar" or "dangling arm" is a moiety located on each of the detected nucleobases, resulting from the chemical cleavage of the fluorophore from the nucleobase to which it is attached. These dangling arms accumulate on the primer:DNA template over repeated cycles of SBS, producing a primer:DNA template molecule with a molecular structure that differs from the natural primer:DNA template. These residual dangling arms slow the incorporation of the new incoming nucleotide and therefore increase the error rate and decrease data quality, especially in the later stages of a sequencing run and in long sequencing runs. The present disclosure aims to minimize the size of the overhanging arm left in the primer:DNA template during sequencing.
[0009] De acordo com um primeiro aspecto, a presente divulgação fornece compostos de fórmula (I):em que B é uma base nucleosídica; e Fl é um fluoróforo conectado através de um ligante opcional.[0009] According to a first aspect, the present disclosure provides compounds of formula (I): where B is a nucleoside base; and Fl is a fluorophore connected through an optional linker.
[00010] Os nucleosídeos são compostos que possuem uma ribose de carboidrato ligada a uma nucleobase. A nucleobase pode ser uma purina ou uma pirimidina. As purinas comuns de ocorrência natural são adenina (A) e guanina (G). As pirimidinas comuns de ocorrência natural são citidina (C) e timina (T) nas cadeias de DNA ou uracila (U) nas cadeias de RNA. A ribose pode ser uma 2'- desoxirribose (no DNA). Um nucleosídeo com uma porção fosfato ligado ao mesmo é um nucleotídeo e, portanto, os compostos aqui descritos podem estar na forma de um nucleotídeo. Em qualquer formulação como aqui descrita, B representa uma base nucleotídica.[00010] Nucleosides are compounds that have a carbohydrate ribose attached to a nucleobase. The nucleobase may be a purine or a pyrimidine. Common naturally occurring purines are adenine (A) and guanine (G). Common naturally occurring pyrimidines are cytidine (C) and thymine (T) in DNA strands or uracil (U) in RNA strands. The ribose may be a 2'-deoxyribose (in DNA). A nucleoside with a phosphate moiety attached thereto is a nucleotide and therefore the compounds described herein may be in the form of a nucleotide. In any formulation as described herein, B represents a nucleotide base.
[00011] Em quaisquer fórmulas aqui descritas, B pode representar uma base de pirimidina. A base B pode assumir a forma de qualquer uma das quatro bases naturais comuns, A, G, C ou T/U. A porção fosfato pode ser uma porção trifosfato, que pode ser ligada à posição 5'- da ribose. Os compostos da presente divulgação podem incluir compostos de fórmula (c), fórmula (t) ou fórmula (a): em que P é um grupo trifosfato; e Fl é um fluoróforo conectado através de um ligante opcional.[00011] In any formulas described herein, B may represent a pyrimidine base. Base B may take the form of any of the four common natural bases, A, G, C, or T/U. The phosphate moiety may be a triphosphate moiety, which may be attached to the 5'-position of ribose. Compounds of the present disclosure may include compounds of formula (c), formula (t), or formula (a): where P is a triphosphate group; and Fl is a fluorophore connected through an optional linker.
[00012] A porção trifosfato permite a incorporação do composto nucleotídico em um ácido nucleico. A extensão que utiliza uma polimerase de ácido nucleico permite a ligação do composto ao 3'-OH de um iniciador de ácido nucleico. Assim, os compostos da presente divulgação podem ser ligados a um ácido oligonucleico. O oligonucleotídeo pode assumir a forma de um iniciador de ácido nucleico que foi submetido à extensão de polimerase para incorporar um composto da presente divulgação. Assim, é divulgado um oligonucleotídeo que compreende um composto conforme aqui divulgado.[00012] The triphosphate moiety allows for incorporation of the nucleotide compound into a nucleic acid. Extension utilizing a nucleic acid polymerase allows for attachment of the compound to the 3'-OH of a nucleic acid primer. Thus, compounds of the present disclosure can be attached to an oligonucleic acid. The oligonucleotide can take the form of a nucleic acid primer that has been subjected to polymerase extension to incorporate a compound of the present disclosure. Thus, an oligonucleotide comprising a compound as disclosed herein is disclosed.
[00013] É divulgado um composto nucleotídico ligado a um oligonucleotídeo. Quando o composto é marcado com fluorescência, geralmente apenas um único composto modificado seria ligado a cada oligonucleotídeo. Assim, é divulgado um oligonucleotídeo em que o 3'-nucleotídeo é um composto de fórmula (I):em que B é uma base nucleosídica; e Fl é um fluoróforo conectado através de um ligante opcional.[00013] Disclosed is a nucleotide compound linked to an oligonucleotide. When the compound is fluorescently labeled, generally only a single modified compound would be linked to each oligonucleotide. Thus, disclosed is an oligonucleotide wherein the 3'-nucleotide is a compound of formula (I): where B is a nucleoside base; and Fl is a fluorophore connected through an optional linker.
[00014] Para evitar dúvidas, é apreciado que, após incorporação, o grupo trifosfato é convertido em um diéster de monofosfato. Assim, é divulgado um oligonucleotídeo em que o 3'-nucleotídeo é um composto de fórmula (c), fórmula(t) ou fórmula (a): em que P é um grupo monofosfato; e Fl é um fluoróforo conectado através de um ligante opcional.[00014] For the avoidance of doubt, it is appreciated that upon incorporation, the triphosphate group is converted to a monophosphate diester. Thus, disclosed is an oligonucleotide wherein the 3'-nucleotide is a compound of formula (c), formula (t) or formula (a): where P is a monophosphate group; and Fl is a fluorophore connected through an optional linker.
[00015] Os compostos acima podem alternativamente ser representados como um oligonucleotídeo, em que o 3'- nucleotídeo é um composto de fórmula (c), fórmula (t) ou fórmula (a): em que Oln é um oligonucleotídeo; e Fl é um fluoróforoconectado através de um ligante opcional.[00015] The above compounds may alternatively be represented as an oligonucleotide, wherein the 3'-nucleotide is a compound of formula (c), formula (t) or formula (a): where Oln is an oligonucleotide; and Fl is a fluorophore connected via an optional linker.
[00016] Após a detecção da nucleobase incorporada, o marcador fluorescente e o ligante opcional podem ser removidos. A remoção é realizada pela redução do grupo azido, levando à fragmentação da porção O-CHNH2-. Após clivagem, um grupo hidroxil é deixado ligado à nucleobase e a fração fluorescente é destacada.[00016] After detection of the incorporated nucleobase, the fluorescent label and optional linker can be removed. Removal is accomplished by reduction of the azido group, leading to fragmentation of the O-CHNH2- moiety. After cleavage, a hydroxyl group is left attached to the nucleobase and the fluorescent moiety is highlighted.
[00017] Assim, é divulgado um composto de fórmula (II):em que B é uma base nucleotídica.[00017] Thus, a compound of formula (II) is disclosed: where B is a nucleotide base.
[00018] A nucleobase pode ser uma purina ou uma pirimidina. As purinas comuns de ocorrência natural são adenina (A) e guanina (G). As pirimidinas comuns de ocorrência natural são citidina (C) e timina (T) nas cadeias de DNA ou uracila (U) nas cadeias de RNA. A ribose pode ser uma 2'-desoxirribose (no DNA).[00018] The nucleobase may be a purine or a pyrimidine. Common naturally occurring purines are adenine (A) and guanine (G). Common naturally occurring pyrimidines are cytidine (C) and thymine (T) in DNA strands or uracil (U) in RNA strands. The ribose may be a 2'-deoxyribose (in DNA).
[00019] O composto de fórmula II pode ser ligado a um oligonucleotídeo. Assim, a porção B pode ser uma base ligada a outras bases. Assim, é divulgado umoligonucleotídeo em que o 3'-nucleotídeo é um composto de fórmula (ci), fórmula (ti) ou fórmula (ai): em que Oln é um oligonucleotídeo.[00019] The compound of formula II may be linked to an oligonucleotide. Thus, the B moiety may be a base linked to other bases. Thus, disclosed is an oligonucleotide wherein the 3'-nucleotide is a compound of formula (ci), formula (ti), or formula (ai): where Oln is an oligonucleotide.
[00020] O oligonucleotídeo que possui o braçopendente hidroxil pode possuir vários braços pendentes nomesmo oligonucleotídeo. As bases modificadas com os braçospendentes normalmente seriam contíguas em uma sequência. Édivulgado um oligonucleotídeo que compreende duas ou maiscópias de um composto de acordo com a fórmula (II). Édivulgado um oligonucleotídeo que compreende dez ou maiscópias de uma composição de acordo com a fórmula (II). Édivulgado um oligonucleotídeo que compreende cem ou maiscópias de um composto de acordo com a fórmula (II).[00020] The oligonucleotide having the hydroxyl pendant arm may have multiple pendant arms within the same oligonucleotide. The modified bases with the pendant arms would typically be contiguous in a sequence. An oligonucleotide comprising two or more copies of a compound according to formula (II) is disclosed. An oligonucleotide comprising ten or more copies of a composition according to formula (II) is disclosed. An oligonucleotide comprising one hundred or more copies of a compound according to formula (II) is disclosed.
[00021] A incorporação de nucleotídeos pode ser realizada usando soluções com mais de um tipo de nucleotídeo. É divulgado um kit que compreende dois ou mais nucleotídeos, em que pelo menos um nucleotídeo é um nucleotídeo marcado conforme aqui descrito. O kit pode compreender dois ou mais nucleotídeos, em que pelo menos dois nucleotídeos são nucleotídeos marcados, conforme descrito aqui. O kit pode compreender quatro nucleotídeos em que pelo menos dois nucleotídeos são nucleotídeos marcados, conforme descrito aqui.[00021] Nucleotide incorporation can be accomplished using solutions with more than one type of nucleotide. Disclosed is a kit comprising two or more nucleotides, wherein at least one nucleotide is a labeled nucleotide as described herein. The kit may comprise two or more nucleotides, wherein at least two nucleotides are labeled nucleotides as described herein. The kit may comprise four nucleotides wherein at least two nucleotides are labeled nucleotides as described herein.
[00022] Os nucleosídeos, nucleotídeos, oligonucleotídeos e kits, tal como aqui descritos, podem ser utilizados no sequenciamento, análise de expressão, análise de hibridação, análise genética, análise de RNA, ou ensaios de ligação proteica, ou combinações dos mesmos.[00022] The nucleosides, nucleotides, oligonucleotides, and kits as described herein can be used in sequencing, expression analysis, hybridization analysis, genetic analysis, RNA analysis, or protein binding assays, or combinations thereof.
[00023] A Figura 1 ilustra a formação do iniciador:molde de DNA cicatrizado ou pendente durante o sequenciamento.[00023] Figure 1 illustrates the formation of the primer:template scarred or overhanging DNA during sequencing.
[00024] A Figura 2 ilustra um exemplo da estrutura do nucleotídeo totalmente funcionalizado (ffN) do braço pendente curto usado durante o sequenciamento.[00024] Figure 2 illustrates an example of the fully functionalized nucleotide (ffN) structure of the short overhanging arm used during sequencing.
[00025] A Figura 3 ilustra exemplos de quatro nucleotídeos de braço pendente curto para sequenciamento de SBS de 2 canais.[00025] Figure 3 illustrates examples of four short overhanging arm nucleotides for 2-channel SBS sequencing.
[00026] As Figuras de 4A a 4C ilustram um exemplo das métricas de sequenciamento observados com o padrão e os nucleotídeos de braço pendente curto em um Hiseq® modificado de 2 canais com duas polimerases diferentes (PolA e PolB) e duas bibliotecas de moldes diferentes (PhiX e humano).[00026] Figures 4A through 4C illustrate an example of the sequencing metrics observed with the standard and short overhanging arm nucleotides on a modified 2-channel Hiseq® with two different polymerases (PolA and PolB) and two different template libraries (PhiX and human).
[00027] As Figuras 5A e 5B demonstram um exemplo dasmétricas de sequenciamento observadas com o nucleotídeo padrão ou com o nucleotídeo de braço pendente curto em umMiseq® modificado de 2 canais.[00027] Figures 5A and 5B demonstrate an example of the sequencing metrics observed with the standard nucleotide or the short overhanging arm nucleotide on a modified 2-channel Miseq®.
[00028] A presente divulgação fornece novoscompostos particularmente adequados para métodos de detecção de fluorescência e sequenciamento por síntese. Os compostos que possuem um braço pendente residual reduzido melhoram certas aplicações de sequenciamento de ácidos nucleicos.[00028] The present disclosure provides novel compounds particularly suitable for fluorescence detection and sequencing-by-synthesis methods. Compounds having a reduced residual overhanging arm improve certain nucleic acid sequencing applications.
[00029] De acordo com um primeiro aspecto, a presente divulgação fornece compostos de fórmula (I):em que B é uma base nucleosídica; e Fl é um fluoróforo conectado através de um ligante opcional.[00029] According to a first aspect, the present disclosure provides compounds of formula (I): where B is a nucleoside base; and Fl is a fluorophore connected through an optional linker.
[00030] Os nucleosídeos são compostos que possuem uma ribose de carboidrato ligada a uma nucleobase. A nucleobase pode ser uma purina ou uma pirimidina. As purinas comuns de ocorrência natural são adenina (A) e guanina (G). As pirimidinas comuns de ocorrência natural são citidina (C) e timina (T) nas cadeias de DNA ou uracila (U) nas cadeias de RNA. A ribose pode ser uma 2'- desoxirribose (no DNA). Um nucleosídeo com uma porção fosfato ligada a mesma é um nucleotídeo e, portanto, os compostos aqui descritos podem estar na forma de um nucleotídeo. Em qualquer formulação como aqui descrita, B representa uma base nucleotídica.[00030] Nucleosides are compounds that have a carbohydrate ribose attached to a nucleobase. The nucleobase may be a purine or a pyrimidine. Common naturally occurring purines are adenine (A) and guanine (G). Common naturally occurring pyrimidines are cytidine (C) and thymine (T) in DNA strands or uracil (U) in RNA strands. The ribose may be a 2'-deoxyribose (in DNA). A nucleoside with a phosphate moiety attached thereto is a nucleotide, and therefore the compounds described herein may be in the form of a nucleotide. In any formulation as described herein, B represents a nucleotide base.
[00031] Fl é um fluoróforo. Assim, os compostos da presente divulgação são marcados com fluorescência. A natureza do fluoróforo não é importante e pode incluir compostos selecionados a partir de qualquer espécie fluorescente conhecida, por exemplo, rodaminas ou cianinas. O fluoróforo pode ser ligado à nucleobase através de um ligante opcional. A função do ligante é geralmente auxiliar a ligação química do fluoróforo ao nucleotídeo. O ligante pode ser, por exemplo, uma cadeia alquil opcionalmente possuindo uma ou mais substituições de heteroátomo. O ligante pode conter grupos amida ou éster para facilitar as reações de acoplamento químico. O ligante pode ser sintetizado usando química de cliques. O ligante pode conter grupos triazol. O ligante pode conter outros grupos aril.[00031] Fl is a fluorophore. Thus, the compounds of the present disclosure are fluorescently labeled. The nature of the fluorophore is not important and may include compounds selected from any known fluorescent species, for example, rhodamines or cyanines. The fluorophore may be linked to the nucleobase via an optional linker. The function of the linker is generally to aid in the chemical attachment of the fluorophore to the nucleotide. The linker may be, for example, an alkyl chain optionally having one or more heteroatom substitutions. The linker may contain amide or ester groups to facilitate chemical coupling reactions. The linker may be synthesized using click chemistry. The linker may contain triazole groups. The linker may contain other aryl groups.
[00032] Exemplos de ligantes podem incluir espécies como as seguintes:onde n é um número inteiro de 2 a 6 e Fl é um fluoróforo.[00032] Examples of ligands may include species such as the following: where n is an integer from 2 to 6 and Fl is a fluorophore.
[00033] A porção ribose do nucleosídeo ou nucleotídeo pode ser uma ribose ou desoxirribose. A ribose pode ter um ou mais grupos de bloqueio 2' ou 3' com o intuito de limitar a incorporação a um único nucleotídeo. O grupo de bloqueio pode ser um grupo azidometil. A ribose pode ser uma 2'-desoxirribose que possui um grupo de bloqueio 3'-azidometil. O grupo de bloqueio pode ser um grupo alil. A ribose pode ser uma 2'-desoxirribose com um grupo de bloqueio 3'-alil.[00033] The ribose moiety of the nucleoside or nucleotide may be a ribose or a deoxyribose. The ribose may have one or more 2' or 3' blocking groups intended to limit incorporation to a single nucleotide. The blocking group may be an azidomethyl group. The ribose may be a 2'-deoxyribose that has a 3'-azidomethyl blocking group. The blocking group may be an allyl group. The ribose may be a 2'-deoxyribose with a 3'-allyl blocking group.
[00034] Em quaisquer fórmulas aqui descritas, B pode representar uma base de pirimidina. A base B pode assumir a forma de qualquer uma das quatro bases naturais comuns, A, G, C ou T/U. A porção fosfato pode ser uma porção trifosfato, que pode ser ligada à posição 5'- da ribose. Os compostos da presente divulgação podem incluir compostos de fórmula (cl), fórmula (tl) ou fórmula (al): em que P é um grupo trifosfato; n é um número inteiro de 2 a 6; e Fl é um fluoróforo.[00034] In any formulas described herein, B may represent a pyrimidine base. Base B may take the form of any of the four common natural bases, A, G, C or T/U. The phosphate moiety may be a triphosphate moiety, which may be attached to the 5'-position of ribose. Compounds of the present disclosure may include compounds of formula (cl), formula (tl) or formula (al): where P is a triphosphate group; n is an integer from 2 to 6; and Fl is a fluorophore.
[00035] A fração trifosfato permite a incorporação do composto nucleotídico em um ácido nucleico. A extensão utilizando uma polimerase de ácido nucleico permite a ligação do composto ao 3'-OH de um iniciador de ácido nucleico. Assim, os compostos da presente divulgação podem ser ligados a um ácido oligonucleico. O oligonucleotídeo pode assumir a forma de um iniciador de ácido nucleico que foi submetido à extensão de polimerase para incorporar um composto da presente divulgação. Assim, é divulgado aqui é um oligonucleotídeo que compreende um composto, conforme divulgado aqui.[00035] The triphosphate moiety allows for incorporation of the nucleotide compound into a nucleic acid. Extension using a nucleic acid polymerase allows for attachment of the compound to the 3'-OH of a nucleic acid primer. Thus, compounds of the present disclosure can be attached to an oligonucleic acid. The oligonucleotide can take the form of a nucleic acid primer that has been subjected to polymerase extension to incorporate a compound of the present disclosure. Thus, disclosed herein is an oligonucleotide comprising a compound as disclosed herein.
[00036] É divulgado um composto nucleotídico ligado a um oligonucleotídeo. Quando o composto é marcado com fluorescência, geralmente apenas um único composto modificado seria ligado a cada oligonucleotídeo. Assim, é divulgado um oligonucleotídeo em que o 3'-nucleotídeo é um composto de fórmula (III):em que B é uma base nucleosídica; n é um número inteiro de 2 a 6; e Fl é um fluoróforo.[00036] Disclosed is a nucleotide compound linked to an oligonucleotide. When the compound is fluorescently labeled, generally only a single modified compound would be linked to each oligonucleotide. Thus, disclosed is an oligonucleotide wherein the 3'-nucleotide is a compound of formula (III): where B is a nucleoside base; n is an integer from 2 to 6; and Fl is a fluorophore.
[00037] Para evitar dúvidas, é apreciado que, apósincorporação, o grupo trifosfato é convertido em um diésterde monofosfato. Assim, é divulgado um oligonucleotídeo emque o 3'-nucleotídeo é um composto de fórmula (cl), fórmula(tl) ou fórmula (al): em que P é um grupo monofosfato; n é um número inteiro de 2 a 6; e Fl é um fluoróforo.[00037] For the avoidance of doubt, it is appreciated that upon incorporation, the triphosphate group is converted to a monophosphate diester. Thus, disclosed is an oligonucleotide wherein the 3'-nucleotide is a compound of formula (cl), formula (tl) or formula (al): where P is a monophosphate group; n is an integer from 2 to 6; and Fl is a fluorophore.
[00038] Os compostos acima podem alternativamenteser representados como um oligonucleotídeo em que o 3'-nucleotídeo é um composto de fórmula (cl), fórmula (tl) oufórmula (al): em que Oln é um oligonucleotídeo; n é um número inteiro de 2 a 6; e Fl é um fluoróforo.[00038] The above compounds may alternatively be represented as an oligonucleotide wherein the 3'-nucleotide is a compound of formula (cl), formula (tl) or formula (al): where Oln is an oligonucleotide; n is an integer from 2 to 6; and Fl is a fluorophore.
[00039] Em qualquer um dos exemplos disponibilizados n pode ser de 2 a 6. Em qualquer um dos exemplos disponibilizados n pode ser igual a 2. Em qualquer um dos exemplos disponibilizados n pode ser igual a 3. Em qualquer um dos exemplos disponibilizados n pode ser igual a 4. Em qualquer um dos exemplos disponibilizados n pode ser igual a 5. Em qualquer um dos exemplos disponibilizados n pode ser igual a 6.[00039] In any of the examples provided n may be from 2 to 6. In any of the examples provided n may be equal to 2. In any of the examples provided n may be equal to 3. In any of the examples provided n may be equal to 4. In any of the examples provided n may be equal to 5. In any of the examples provided n may be equal to 6.
[00040] Após a detecção da nucleobase incorporada, o marcador fluorescente e o ligante opcional podem ser removidos. A remoção é realizada pela redução do grupo azido, levando à fragmentação da porção O-CHNH2-. Após clivagem, um grupo hidroxil é deixado ligado à nucleobase e a fração fluorescente é destacada.[00040] After detection of the incorporated nucleobase, the fluorescent label and optional linker can be removed. Removal is accomplished by reduction of the azido group, leading to fragmentation of the O-CHNH2- moiety. After cleavage, a hydroxyl group is left attached to the nucleobase and the fluorescent moiety is highlighted.
[00041] Assim, é divulgado um composto de fórmula(II):em que B é uma base nucleotídica.[00041] Thus, a compound of formula (II) is disclosed: where B is a nucleotide base.
[00042] A nucleobase pode ser uma purina ou uma pirimidina. As purinas comuns de ocorrência natural são adenina (A) e guanina (G). As pirimidinas comuns de ocorrência natural são citidina (C) e timina (T) nas cadeias de DNA ou uracila (U) nas cadeias de RNA. A ribose pode ser uma 2'-desoxirribose (no DNA).[00042] The nucleobase may be a purine or a pyrimidine. Common naturally occurring purines are adenine (A) and guanine (G). Common naturally occurring pyrimidines are cytidine (C) and thymine (T) in DNA strands or uracil (U) in RNA strands. The ribose may be a 2'-deoxyribose (in DNA).
[00043] O composto de fórmula II pode ser ligado aum oligonucleotídeo. Assim, a porção B pode ser uma baseligada a outras bases. Assim, é divulgado umoligonucleotídeo em que o 3'-nucleotídeo é um composto defórmula (ci), fórmula (ti) ou fórmula (ai) em que Oln é um oligonucleotídeo.[00043] The compound of formula II may be linked to an oligonucleotide. Thus, the B moiety may be a base linked to other bases. Thus, disclosed is an oligonucleotide wherein the 3'-nucleotide is a compound of formula (ci), formula (ti), or formula (ai). where Oln is an oligonucleotide.
[00044] O oligonucleotídeo que possui o braço pendente hidroxil pode possuir vários braços pendentes no mesmo oligonucleotídeo. As bases modificadas com os braços pendentes normalmente seriam contíguas em uma sequência. É divulgado um oligonucleotídeo que compreende duas ou mais cópias de um composto de acordo com a fórmula (II). É divulgado um oligonucleotídeo que compreende dez ou mais cópias de uma composição de acordo com a fórmula (II). É divulgado um oligonucleotídeo que compreende cem ou mais cópias de um composto de acordo com a fórmula (II).[00044] The oligonucleotide having the hydroxyl pendant arm may have multiple pendant arms on the same oligonucleotide. The modified bases with the pendant arms would typically be contiguous in a sequence. An oligonucleotide comprising two or more copies of a compound according to formula (II) is disclosed. An oligonucleotide comprising ten or more copies of a composition according to formula (II) is disclosed. An oligonucleotide comprising one hundred or more copies of a compound according to formula (II) is disclosed.
[00045] A incorporação de nucleotídeos pode ser realizada usando soluções com mais de um tipo de nucleotídeo. Assim, é divulgado um kit que compreende dois ou mais nucleotídeos, em que pelo menos um nucleotídeo é um nucleotídeo marcado conforme aqui descrito. O kit pode compreender dois ou mais nucleotídeos, em que pelo menos dois nucleotídeos são nucleotídeos marcados conforme descrito aqui. O kit pode compreender quatro nucleotídeos em que pelo menos dois nucleotídeos são nucleotídeos marcados conforme descrito aqui.[00045] Nucleotide incorporation can be performed using solutions with more than one type of nucleotide. Thus, a kit comprising two or more nucleotides is disclosed, wherein at least one nucleotide is a labeled nucleotide as described herein. The kit may comprise two or more nucleotides, wherein at least two nucleotides are labeled nucleotides as described herein. The kit may comprise four nucleotides wherein at least two nucleotides are labeled nucleotides as described herein.
[00046] Os nucleosídeos, nucleotídeos, oligonucleotídeos e kits, tal como aqui descritos, podem ser utilizados no sequenciamento, análise de expressão, análise de hibridação, análise genética, análise de RNA, ou ensaios de ligação proteica, ou combinações dos mesmos.[00046] The nucleosides, nucleotides, oligonucleotides, and kits as described herein can be used in sequencing, expression analysis, hybridization analysis, genetic analysis, RNA analysis, or protein binding assays, or combinations thereof.
[00047] São aqui fornecidos kits incluindo dois ou mais nucleotídeos, em que pelo menos um nucleotídeo é um nucleotídeo da presente divulgação. O kit pode incluir dois ou mais nucleotídeos marcados. Os nucleotídeos podem ser marcados com dois ou mais marcadores fluorescentes. Duas ou mais marcações podem ser excitadas usando uma única fonte de excitação, que pode ser um laser. Por exemplo, as bandas de excitação para os dois ou mais marcadores podem estar pelo menos parcialmente sobrepostas, de modo que a excitação na região de sobreposição do espectro faça com que ambos os marcadores emitam fluorescência. Em concretizações particulares, a emissão dos dois ou mais marcadores ocorrerá em diferentes regiões do espectro, de modo que a presença de pelo menos um dos marcadores possa ser determinada pela distinção óptica da emissão.[00047] Provided herein are kits including two or more nucleotides, wherein at least one nucleotide is a nucleotide of the present disclosure. The kit may include two or more labeled nucleotides. The nucleotides may be labeled with two or more fluorescent labels. The two or more labels may be excited using a single excitation source, which may be a laser. For example, the excitation bands for the two or more labels may be at least partially overlapping, such that excitation in the overlapping region of the spectrum causes both labels to emit fluorescence. In particular embodiments, emission from the two or more labels will occur in different regions of the spectrum, such that the presence of at least one of the labels may be determined by optical distinction of the emission.
[00048] O kit pode conter quatro nucleotídeos marcados, em que o primeiro dos quatro nucleotídeos é conforme aqui divulgado. Nesse kit, o segundo, terceiro e quarto nucleotídeos podem ser marcados com um composto que é opcionalmente espectralmente diferente do marcador no primeiro nucleotídeo e opcionalmente espectralmente diferente dos marcadores entre si. Assim, um ou mais dos compostos podem ter um máximo de absorbância e/ou máximo de emissão distinto(s), de modo que o(s) composto(s) é(são) distinguível(s) em relação aos outros compostos. Por exemplo, cada composto pode ter um máximo de absorbância e/ou máximo de emissão distinta, de modo que cada um dos compostos seja distinguível em relação aos outros três compostos. Será entendido que parte do espectro de absorbância e/ou espectro de emissão diferentes dos máximos podem diferir e essas diferenças podem ser exploradas para distinguir os compostos. O kit pode ser tal que dois ou mais dos compostos tenham uma absorbância distinta máxima acima de 600 nm. Os compostos da invenção absorvem tipicamente luz na região acima de 640 nm.[00048] The kit may contain four labeled nucleotides, wherein the first of the four nucleotides is as disclosed herein. In such a kit, the second, third and fourth nucleotides may be labeled with a compound that is optionally spectrally different from the label on the first nucleotide and optionally spectrally different from the labels on each other. Thus, one or more of the compounds may have a distinct absorbance maximum and/or emission maximum, such that the compound(s) is/are distinguishable from the other compounds. For example, each compound may have a distinct absorbance maximum and/or emission maximum, such that each of the compounds is distinguishable from the other three compounds. It will be understood that some of the absorbance spectrum and/or emission spectrum other than the maxima may differ and these differences may be exploited to distinguish the compounds. The kit may be such that two or more of the compounds have a distinct absorbance maximum above 600 nm. The compounds of the invention typically absorb light in the region above 640 nm.
[00049] Os compostos, nucleotídeos ou kits aqui apresentados podem ser utilizados para detectar, medir ou identificar um sistema biológico (incluindo, por exemplo, processos ou componentes dos mesmos). Técnicas exemplificativas que podem empregar os compostos, nucleotídeos ou kits incluem sequenciamento, análise de expressão, análise de hibridação, análise genética, análise de RNA, ensaio celular (por exemplo, ligação celular ou análise da função celular), ou ensaio de proteínas (por exemplo, ensaio de ligação proteica ou ensaio de atividade proteica). O uso pode estar em um instrumento automatizado para concretizar uma técnica específica, tal como um instrumento de sequenciamento automatizado. O instrumento de sequenciamento pode conter dois lasers operando em diferentes comprimentos de onda.[00049] The compounds, nucleotides or kits presented herein can be used to detect, measure or identify a biological system (including, for example, processes or components thereof). Exemplary techniques that can employ the compounds, nucleotides or kits include sequencing, expression analysis, hybridization analysis, genetic analysis, RNA analysis, cellular assay (e.g., cell binding or cell function analysis), or protein assay (e.g., protein binding assay or protein activity assay). The use can be in an automated instrument to perform a specific technique, such as an automated sequencing instrument. The sequencing instrument can contain two lasers operating at different wavelengths.
[00050] A presente divulgação fornece conjugados de nucleosídeos e nucleotídeos (nucleotídeos modificados) marcados com fluorescência. Os nucleosídeos e nucleotídeos marcados são úteis para a marcação de polinucleotídeos formados por síntese enzimática, tal como, a título de exemplo não limitativo, na amplificação por PCR, amplificação isotérmica, amplificação de fase sólida, sequenciamento de polinucleotídeos (por exemplo,sequenciamento de fase sólida), reações de conversão de níquel e similares.[00050] The present disclosure provides fluorescently labeled nucleotide-nucleoside conjugates (modified nucleotides). The labeled nucleosides and nucleotides are useful for labeling polynucleotides formed by enzymatic synthesis, such as, by way of non-limiting example, in PCR amplification, isothermal amplification, solid phase amplification, polynucleotide sequencing (e.g., solid phase sequencing), nickel conversion reactions, and the like.
[00051] Os nucleosídeos e nucleotídeos podem ser marcados em sítios no açúcar ou nas nucleobases. Tal como conhecido na arte, um "nucleotídeo" consiste em uma base nitrogenada, um açúcar e um ou mais grupos fosfato. No RNA,o açúcar é uma ribose e, no DNA, é uma desoxirribose, ou seja, um açúcar sem um grupo hidroxila que está presente naribose. A base nitrogenada é um derivado da purina ou pirimidina. As purinas podem ser adenina (A) ou guanina (G), e as pirimidinas podem ser citosina (C), timina (T) ou, no contexto do RNA, uracila (U). O átomo C-1 da desoxirribose está ligado a N-1 de uma pirimidina ou N-9 de uma purina. Um nucleotídeo também é um éster fosfato de um nucleosídeo, com esterificação ocorrendo no grupo hidroxila ligado ao C-3 ou C-5 do açúcar. Os nucleotídeos são geralmente mono, di ou trifosfatos.[00051] Nucleosides and nucleotides can be labeled at sites on the sugar or nucleobases. As known in the art, a "nucleotide" consists of a nitrogenous base, a sugar, and one or more phosphate groups. In RNA, the sugar is a ribose, and in DNA, it is a deoxyribose, that is, a sugar lacking a hydroxyl group that is present in ribose. The nitrogenous base is a derivative of a purine or pyrimidine. Purines can be adenine (A) or guanine (G), and pyrimidines can be cytosine (C), thymine (T), or, in the context of RNA, uracil (U). The C-1 atom of deoxyribose is bonded to N-1 of a pyrimidine or N-9 of a purine. A nucleotide is also a phosphate ester of a nucleoside, with esterification occurring at the hydroxyl group attached to C-3 or C-5 of the sugar. Nucleotides are usually mono-, di-, or triphosphates.
[00052] Um "nucleosídeo" é estruturalmentesemelhante a um nucleotídeo, mas sem a presença das porções fosfato. Um exemplo de um análogo de nucleosídeo seria aquele em que o marcador está ligado à base e não há grupo fosfato ligado à molécula de açúcar.[00052] A "nucleoside" is structurally similar to a nucleotide, but without the presence of the phosphate moieties. An example of a nucleoside analogue would be one in which the label is attached to the base and there is no phosphate group attached to the sugar molecule.
[00053] Embora a base seja geralmente referida como purina ou pirimidina, o técnico na arte apreciará que existem derivados e análogos que não alteram a capacidade do nucleotídeo ou nucleosídeo de sofrer o pareamento de bases de Watson-Crick. "Derivado" ou "análogo" significa um composto ou molécula cuja estrutura principal é a mesma ou que se assemelha à de um composto equivalente, mas que possui uma modificação química ou física, tal como, por exemplo, um grupo lateral diferente ou adicional, que permite que o nucleotídeo ou nucleosídeo derivado seja ligado à outra molécula. Por exemplo, a base pode ser uma deazapurina. Em concretizações particulares, os derivados são capazes de sofrer o pareamento de Watson-Crick. "Derivado" e "análogo" também incluem, por exemplo, um nucleotídeo sintético ou nucleosídeo derivado com porções de base modificadas e/ou porções de açúcar modificadas. Tais derivados e análogos são discutidos, por exemplo, em Scheit, Nucleotide analogs (John Wiley & Son, 1980) e Uhlman et al., Chemical Reviews 90:543-584, 1990. Os análogos de nucleotídeos também podem ter ligações fosfodiéster modificadas, incluindo ligações fosforotioato, fosforoditioato, alquilfosfonato, fosforanilidato, fosforamidato e similares.[00053] Although the base is generally referred to as a purine or pyrimidine, one skilled in the art will appreciate that there are derivatives and analogues that do not alter the ability of the nucleotide or nucleoside to undergo Watson-Crick base pairing. "Derivative" or "analog" means a compound or molecule whose main structure is the same as or resembles that of an equivalent compound, but which has a chemical or physical modification, such as, for example, a different or additional side group, that allows the derivative nucleotide or nucleoside to be attached to another molecule. For example, the base may be a deazapurine. In particular embodiments, the derivatives are capable of undergoing Watson-Crick base pairing. "Derivative" and "analog" also include, for example, a synthetic nucleotide or derivative nucleoside with modified base moieties and/or modified sugar moieties. Such derivatives and analogues are discussed, for example, in Scheit, Nucleotide analogues (John Wiley & Son, 1980) and Uhlman et al., Chemical Reviews 90:543-584, 1990. Nucleotide analogues may also have modified phosphodiester linkages, including phosphorothioate, phosphorodithioate, alkylphosphonate, phosphoranilidate, phosphoramidate, and the like.
[00054] O fluoróforo pode estar ligado a qualquer posição em uma base nucleotídica, por exemplo, através de um ligante. Em concretizações particulares, a base de Watson-Crick ainda pode ser realizada para o análogo resultante. Os sítios de marcação de nucleobases específicos incluem a posição C5 de uma base de pirimidina ou a posição C7 de uma base de 7-deszapurina. Tal como descrito acima, um grupo ligante pode ser usado para ligar covalentemente um corante ao nucleosídeo ou nucleotídeo. Em concretizações particulares, o nucleosídeo ou nucleotídeo marcado pode ser enzimaticamente incorporável e enzimaticamente extensível. Consequentemente, uma porção ligante pode possuir comprimento suficiente para conectar o nucleotídeo ao composto, de modo que o composto não interfira significativamente com a ligação geral e o reconhecimento do nucleotídeo por uma enzima de replicação de ácido nucleico. Assim, o ligante também pode compreender uma unidade de espaçamento. A unidade de espaçamento distancia, por exemplo, a base do nucleotídeo em relação a um sítio ou marcação de clivagem.[00054] The fluorophore may be attached to any position on a nucleotide base, for example, via a linker. In particular embodiments, Watson-Crick basing may further be performed for the resulting analogue. Specific nucleobase labeling sites include the C5 position of a pyrimidine base or the C7 position of a 7-dezapurine base. As described above, a linker group may be used to covalently attach a dye to the nucleoside or nucleotide. In particular embodiments, the labeled nucleoside or nucleotide may be enzymatically incorporable and enzymatically extensible. Accordingly, a linker moiety may be of sufficient length to connect the nucleotide to the compound, such that the compound does not significantly interfere with the overall binding and recognition of the nucleotide by a nucleic acid replication enzyme. Thus, the linker may also comprise a spacer unit. The spacing unit distances, for example, the nucleotide base from a cleavage site or marker.
[00055] Os nucleosídeos ou nucleotídeos marcados de acordo com a divulgação podem possuir a fórmula:em que Dye (corante) é um composto fluorescente, B é uma nucleobase, tal como, por exemplo, uracila, timina, citosina, adenina, guanina e semelhantes e L é um grupo de ligação opcional que pode ou não estar presente. R' pode ser H, monofosfato, difosfato, trifosfato, tiofosfato, um análogo de éster de fosfato, -O- ligado a um grupo contendo fósforo reativo ou -O- protegido por um grupo de bloqueio. R'' pode ser H, OH, um fosforamidita ou um grupo de bloqueio 3'OH e R''' é H ou OH. R'' é fosforamidita, R' é um grupo protetor de hidroxila clivável por ácido que permite subsequente acoplamento de monômero sob condições de síntese automatizada.[00055] The labeled nucleosides or nucleotides according to the disclosure may have the formula: where Dye is a fluorescent compound, B is a nucleobase such as, for example, uracil, thymine, cytosine, adenine, guanine and the like, and L is an optional linking group which may or may not be present. R' can be H, monophosphate, diphosphate, triphosphate, thiophosphate, a phosphate ester analogue, -O- linked to a reactive phosphorus-containing group, or -O- protected by a blocking group. R'' can be H, OH, a phosphoramidite or a 3'OH blocking group and R''' is H or OH. R'' is phosphoramidite, R' is an acid-cleavable hydroxyl protecting group that allows subsequent monomer coupling under automated synthesis conditions.
[00056] Em outra concretização alternativa, não há grupo de bloqueio no carbono 3' do açúcar pentose e o corante (ou construto de corante e ligante) fixado à base, por exemplo, pode ser de tamanho ou estrutura suficiente para agir como um bloco para a incorporação de outro nucleotídeo. Assim, o bloco pode ser devido ao obstáculo estérico ou devido a uma combinação de tamanho, carga e estrutura, independentemente de o corante estar ou não ligado à posição 3' do açúcar.[00056] In another alternative embodiment, there is no blocking group at the 3' carbon of the pentose sugar and the dye (or dye and linker construct) attached to the base, for example, may be of sufficient size or structure to act as a block for the incorporation of another nucleotide. Thus, the block may be due to steric hindrance or due to a combination of size, charge, and structure, regardless of whether or not the dye is attached to the 3' position of the sugar.
[00057] Em outra concretização alternativa, o grupo de bloqueio está presente no carbono 2' ou 4' do açúcar pentose e pode ser de tamanho ou estrutura suficiente para atuar como um bloco para a incorporação de um nucleotídeo adicional.[00057] In another alternative embodiment, the blocking group is present on the 2' or 4' carbon of the pentose sugar and may be of sufficient size or structure to act as a block for the incorporation of an additional nucleotide.
[00058] O uso de um grupo de bloqueio permite que a polimerização seja controlada, tal como interromper a extensão quando um nucleotídeo modificado é incorporado. Se o efeito de bloqueio for reversível, por exemplo, a título de exemplo não limitativo, pela alteração das condições químicas ou pela remoção de um bloco químico, a extensão poderá ser interrompida em determinados pontos e, em seguida, autorizada a continuar.[00058] The use of a blocking group allows polymerization to be controlled, such as by stopping extension when a modified nucleotide is incorporated. If the blocking effect is reversible, for example, by way of non-limiting example, by changing the chemical conditions or by removing a chemical block, extension can be stopped at certain points and then allowed to continue.
[00059] Em outra concretização particular, um grupo de bloqueio 3'OH compreenderá porções divulgadas no documento WO2004/018497. Por exemplo, o grupo de bloqueio pode ser azidometil (CH2N3) ou alil.[00059] In another particular embodiment, a 3'OH blocking group will comprise moieties disclosed in WO2004/018497. For example, the blocking group may be azidomethyl (CH2N3) or allyl.
[00060] Em uma concretização específica, um ligante (entre o corante e o nucleotídeo) e um grupo de bloqueio estão presentes e são porções separadas. Em concretizações particulares, o ligante e o grupo de bloqueio são cliváveis sob condições substancialmente semelhantes. Assim, os processos de desproteção e desbloqueio podem ser mais eficientes, uma vez que apenas um único tratamento será necessário para remover o composto corante e o bloco. No entanto, em algumas modalidades, um ligante e um grupo de bloqueio não precisam ser cliváveis sob condições semelhantes, estes podem ser individualmente cliváveis sob condições distintas.[00060] In a specific embodiment, a linker (between the dye and the nucleotide) and a blocking group are present and are separate moieties. In particular embodiments, the linker and the blocking group are cleavable under substantially similar conditions. Thus, the deprotection and deblocking processes may be more efficient, since only a single treatment will be required to remove the dye compound and the block. However, in some embodiments, a linker and a blocking group need not be cleavable under similar conditions, they may be individually cleavable under distinct conditions.
[00061] A presente divulgação também abrange polinucleotídeos que incorporam compostos fluorescentes. Tais polinucleotídeos podem ser DNA ou RNA compreendidos respectivamente de desoxirribonucleotídeos ou ribonucleotídeos unidos na ligação fosfodiéster. Os polinucleotídeos de acordo com a divulgação podem compreender nucleotídeos de ocorrência natural, nucleotídeos de ocorrência não natural (ou modificados) que não sejam os nucleotídeos modificados da presente divulgação ou qualquer combinação dos mesmos, em combinação com pelo menos um nucleotídeo modificado (por exemplo, marcado com um composto corante) definido aqui adiante. Os polinucleotídeos de acordo com a divulgação também podem incluir ligações de cadeia principal não naturais e/ou modificações químicas não nucleotídicas. Estruturas quiméricas constituídas por misturas de ribonucleotídeos e desoxirribonucleotídeos compreendendo pelo menos um nucleotídeo modificado de acordo com a invenção são também contempladas.[00061] The present disclosure also encompasses polynucleotides incorporating fluorescent compounds. Such polynucleotides may be DNA or RNA comprised respectively of deoxyribonucleotides or ribonucleotides joined at the phosphodiester bond. Polynucleotides according to the disclosure may comprise naturally occurring nucleotides, non-naturally occurring (or modified) nucleotides other than the modified nucleotides of the present disclosure, or any combination thereof, in combination with at least one modified nucleotide (e.g., labeled with a dye compound) defined hereinafter. Polynucleotides according to the disclosure may also include non-natural backbone linkages and/or non-nucleotide chemical modifications. Chimeric structures comprised of mixtures of ribonucleotides and deoxyribonucleotides comprising at least one modified nucleotide according to the invention are also contemplated.
[00062] Os nucleotídeos (ou nucleosídeos)modificados compreendendo um composto fluorescente de acordo com a presente divulgação podem ser utilizados em qualquer método de análise, tais como métodos que incluem a detecção de uma marcação fluorescente ligada a um nucleotídeo ou nucleosídeo, por si só, incorporado, ou associado a uma estrutura molecular maior ou conjugada. Neste contexto, o termo "incorporado a um polinucleotídeo" pode significar que o fosfato 5' está unido na ligação fosfodiéster ao grupo hidroxila 3' de um segundo nucleotídeo (modificado ou não modificado), que pode ele próprio fazer parte de uma cadeia polinucleotídica mais longa. A extremidade 3' de um nucleotídeo modificado apresentado aqui pode ou não ser unida na ligação fosfodiéster ao fosfato 5' de outro nucleotídeo (modificadoou não modificado). Assim, em uma concretização não limitativa, a divulgação fornece um método para detectar umnucleotídeo modificado incorporado em um polinucleotídeo que compreende: (a) incorporar pelo menos um nucleotídeomodificado da presente divulgação em um polinucleotídeo e (b) detectar o(s) nucleotídeo(s) modificado(s)incorporado(s) no polinucleotídeo através da detecção do sinal fluorescente do composto corante ligado ao(s) referido(s) nucleotídeo(s) modificado(s).[00062] Modified nucleotides (or nucleosides) comprising a fluorescent compound according to the present disclosure may be used in any method of analysis, such as methods that include the detection of a fluorescent label attached to a nucleotide or nucleoside, either by itself, incorporated into, or associated with a larger molecular structure, or conjugated. In this context, the term "incorporated into a polynucleotide" may mean that the 5' phosphate is phosphodiester-linked to the 3' hydroxyl group of a second nucleotide (modified or unmodified), which may itself be part of a longer polynucleotide chain. The 3' end of a modified nucleotide disclosed herein may or may not be phosphodiester-linked to the 5' phosphate of another nucleotide (modified or unmodified). Thus, in a non-limiting embodiment, the disclosure provides a method for detecting a modified nucleotide incorporated into a polynucleotide comprising: (a) incorporating at least one modified nucleotide of the present disclosure into a polynucleotide and (b) detecting the modified nucleotide(s) incorporated into the polynucleotide by detecting the fluorescent signal of the dye compound bound to said modified nucleotide(s).
[00063] Este método pode incluir: uma etapasintética (a) na qual um ou mais nucleotídeos modificados de acordo com a divulgação são incorporados em um polinucleotídeo e uma etapa de detecção (b) na qual um ou mais nucleotídeos modificados incorporados ao polinucleotídeo são detectados, através da detecção ou medição quantitativa de sua(s) fluorescência(s).[00063] This method may include: a synthetic step (a) in which one or more modified nucleotides according to the disclosure are incorporated into a polynucleotide and a detection step (b) in which one or more modified nucleotides incorporated into the polynucleotide are detected, by detecting or quantitatively measuring their fluorescence(s).
[00064] Em uma concretização da presente divulgação, pelo menos um nucleotídeo modificado é incorporado em um polinucleotídeo em uma etapa sintética pela ação de uma enzima polimerase. No entanto, podem ser utilizados outros métodos para ligar nucleotídeos modificados a polinucleotídeos, como por exemplo, síntese química de oligonucleotídeos ou ligação de oligonucleotídeos marcados a oligonucleotídeos não marcados. Portanto, o termo "incorporando", quando usado em referência a um nucleotídeo e polinucleotídeo, pode abranger a síntese de polinucleotídeos por métodos químicos, bem como por métodos enzimáticos.[00064] In one embodiment of the present disclosure, at least one modified nucleotide is incorporated into a polynucleotide in a synthetic step by the action of a polymerase enzyme. However, other methods for attaching modified nucleotides to polynucleotides may be used, such as chemical synthesis of oligonucleotides or ligation of labeled oligonucleotides to unlabeled oligonucleotides. Therefore, the term "incorporating", when used in reference to a nucleotide and polynucleotide, may encompass the synthesis of polynucleotides by chemical methods as well as by enzymatic methods.
[00065] Em uma concretização específica, uma etapa sintética é realizada e pode opcionalmente compreender a incubação de um molde de fita polinucleotídica com uma mistura de reação compreendendo nucleotídeos modificados marcados com fluorescência da presente divulgação. Uma polimerase também pode ser fornecida sob condições que permitem a formação de uma ligação fosfodiéster entre um grupo hidroxila 3' livre em uma fita polinucleotídica anelada no molde de fita polinucleotídica e um grupo fosfato 5' no nucleotídeo modificado. Assim, uma etapa sintética pode incluir a formação de uma fita polinucleotídica, conforme direcionado pelo pareamento complementar de bases de nucleotídeos com um molde de fita.[00065] In a specific embodiment, a synthetic step is performed and may optionally comprise incubating a polynucleotide strand template with a reaction mixture comprising fluorescently labeled modified nucleotides of the present disclosure. A polymerase may also be provided under conditions that allow for the formation of a phosphodiester bond between a free 3' hydroxyl group on a polynucleotide strand annealed on the polynucleotide strand template and a 5' phosphate group on the modified nucleotide. Thus, a synthetic step may include forming a polynucleotide strand as directed by complementary base pairing of nucleotides with a strand template.
[00066] Em todas as concretizações do método, a etapa de detecção pode ser realizada enquanto a fita polinucleotídica, na qual os nucleotídeos modificados são incorporados, é anelada a uma molde de fita, ou após uma etapa de desnaturação na qual as duas fitas são separadas.Etapas adicionais, por exemplo, etapas de reação química ouenzimática ou etapas de purificação, podem ser incluídas entre uma etapa sintética e uma etapa de detecção. Em particular, a fita alvo que incorpora o(s) nucleotídeo(s) modificado(s) pode ser isolada ou purificada e depois adicionalmente processada, ou usada em uma análise subsequente. A título de exemplo, os polinucleotídeos alvo marcados com nucleotídeo(s) modificado(s) em uma etapa sintética podem ser subsequentemente utilizados como sondas ou iniciadores marcados. Em outras modalidades, o produto de uma etapa sintética aqui apresentada pode estar sujeito a outras etapas da reação e, se desejado, o produto dessas etapas subsequentes pode ser purificado ou isolado.[00066] In all embodiments of the method, the detection step may be performed while the polynucleotide strand, into which the modified nucleotides are incorporated, is annealed to a strand template, or after a denaturation step in which the two strands are separated. Additional steps, e.g., chemical or enzymatic reaction steps or purification steps, may be included between a synthetic step and a detection step. In particular, the target strand incorporating the modified nucleotide(s) may be isolated or purified and then further processed, or used in a subsequent analysis. By way of example, target polynucleotides labeled with modified nucleotide(s) in a synthetic step may subsequently be used as labeled probes or primers. In other embodiments, the product of a synthetic step presented herein may be subjected to further reaction steps and, if desired, the product of these subsequent steps may be purified or isolated.
[00067] As condições adequadas para uma etapa sintética serão bem conhecidas dos familiarizados com as técnicas padrão de biologia molecular. Em uma modalidade, uma etapa sintética pode ser análoga a uma reação padrão de extensão do iniciador usando precursores de nucleotídeos, incluindo nucleotídeos modificados aqui apresentados, para formar uma fita alvo estendida complementar ao molde de fita na presença de uma enzima polimerase adequada. Em outras modalidades, uma etapa sintética pode ela própria fazer parte de uma reação de amplificação produzindo um produto de amplificação de fita dupla marcado, composto por fitas complementares pareadas derivadas da cópia de molde de fitas polinucleotídicas e alvo. Outras etapas sintéticas exemplares incluem tradução de Nick, polimerização por deslocamento de cadeia, marcação aleatória de DNA primed, etc. Uma enzima polimerase particularmente útil para uma etapa sintética é aquela que é capaz de catalisar a incorporação de um ou mais dos nucleotídeos modificados estabelecidos aqui. Pode ser utilizada uma variedade de polimerases de ocorrência natural ou modificadas. A título de exemplo, uma polimerase termoestável pode ser utilizada para uma reação sintética realizada através da utilização de condições de termociclagem, enquanto que uma polimerase termoestável também pode não ser desejada para reações de extensão isotérmica do iniciador. Polimerases termoestáveis adequadas que são capazes de incorporar os nucleotídeos modificados de acordo com a divulgação incluem aquelas descritas nos documentos WO 2005/024010 ou WO06120433. Em reações sintéticas realizadas com temperaturas mais baixas, tal 37°C, as enzimas polimerase não precisam necessariamente ser polimerases termoestáveis, portanto, a escolha da polimerase dependerá de vários fatores, tais como temperatura da reação, pH, atividade de desalinhamento da cadeia e similares.[00067] Suitable conditions for a synthetic step will be well known to those skilled in the art of molecular biology. In one embodiment, a synthetic step may be analogous to a standard primer extension reaction using nucleotide precursors, including modified nucleotides set forth herein, to form an extended target strand complementary to the template strand in the presence of a suitable polymerase enzyme. In other embodiments, a synthetic step may itself be part of an amplification reaction producing a labeled double-stranded amplification product composed of paired complementary strands derived from template copying of polynucleotide and target strands. Other exemplary synthetic steps include Nick translation, strand displacement polymerization, random labeling of primed DNA, etc. A particularly useful polymerase enzyme for a synthetic step is one that is capable of catalyzing the incorporation of one or more of the modified nucleotides set forth herein. A variety of naturally occurring or engineered polymerases may be used. By way of example, a thermostable polymerase may be used for a synthetic reaction carried out using thermocycling conditions, whereas a thermostable polymerase may also not be desired for isothermal primer extension reactions. Suitable thermostable polymerases that are capable of incorporating the modified nucleotides according to the disclosure include those described in WO 2005/024010 or WO06120433. In synthetic reactions carried out at lower temperatures, such as 37°C, the polymerase enzymes do not necessarily need to be thermostable polymerases, therefore the choice of polymerase will depend on several factors, such as reaction temperature, pH, strand unalignment activity and the like.
[00068] Em concretizações específicas não limitativas, a divulgação abrange métodos de sequenciamento de ácidos nucleicos, resequenciamento, sequenciamento de genoma inteiro, pontuação de polimorfismo de nucleotídeo único ou qualquer outra aplicação que envolva a detecção do nucleotídeo modificado ou nucleosídeo marcado com corantes estabelecidos aqui quando incorporado em um polinucleotídeo. Qualquer uma de várias outras aplicações que se beneficiam do uso de polinucleotídeos marcados com os nucleotídeos modificados compreendendo fluoróforos podem utilizar nucleotídeos modificados ou nucleosídeos marcados com corantes aqui estabelecidos.[00068] In specific non-limiting embodiments, the disclosure encompasses methods of nucleic acid sequencing, resequencing, whole genome sequencing, single nucleotide polymorphism scoring, or any other application involving detection of the modified nucleotide or nucleoside labeled with dyes set forth herein when incorporated into a polynucleotide. Any of a number of other applications that benefit from the use of polynucleotides labeled with the modified nucleotides comprising fluorophores may utilize modified nucleotides or nucleosides labeled with dyes set forth herein.
[00069] Em uma concretização específica, a divulgação fornece o uso de nucleotídeos modificados de acordo com a divulgação em uma reação de sequenciamento por síntese de polinucleotídeo. O sequenciamento por síntese geralmente envolve a adição sequencial de um ou mais nucleotídeos ou oligonucleotídeos a uma cadeia polinucleotídica crescente na direção 5' a 3' usando uma polimerase ou ligase, com o intuito de formar uma cadeia polinucleotídica estendida complementar ao molde de ácido nucleico a ser sequenciado. A identidade da base presente em um ou mais nucleotídeo(s) adicionado(s) pode ser determinada em uma etapa de detecção ou "de imagem". A identidade da base adicionada pode ser determinada após cada etapa de incorporação do nucleotídeo. A sequência do molde pode então ser inferida usando regras convencionais de pareamento de bases de Watson-Crick. O uso dos nucleotídeos modificados marcados com corantes aqui apresentados para determinação da identidade de uma única base pode ser útil, por exemplo, na classificação de polimorfismos de nucleotídeo único, e essas reações de extensão de base única estão dentro do escopo da presente divulgação.[00069] In a specific embodiment, the disclosure provides the use of modified nucleotides according to the disclosure in a polynucleotide sequencing by synthesis reaction. Sequencing by synthesis generally involves the sequential addition of one or more nucleotides or oligonucleotides to a growing polynucleotide chain in the 5' to 3' direction using a polymerase or ligase, in order to form an extended polynucleotide chain complementary to the nucleic acid template to be sequenced. The identity of the base present in the one or more added nucleotide(s) can be determined in a detection or "imaging" step. The identity of the added base can be determined after each nucleotide incorporation step. The sequence of the template can then be inferred using conventional Watson-Crick base pairing rules. The use of the dye-labeled modified nucleotides disclosed herein for determining the identity of a single base may be useful, for example, in classifying single nucleotide polymorphisms, and such single base extension reactions are within the scope of the present disclosure.
[00070] Em uma concretização da presente divulgação, a sequência de um molde de polinucleotídeo é determinada pela detecção da incorporação de um ou mais nucleotídeos emuma fita nascente complementar ao molde de polinucleotídeoa ser sequenciado através da detecção de marcador(es) fluorescente(s) ligado(s) ao(s) nucleotídeo(s)incorporado(s). O sequenciamento do molde depolinucleotídeo pode ser iniciado com um iniciador adequado(ou preparado como uma construção tipo harpin que conterá oiniciador como parte do harpin), e a fita nascente é estendida de maneira gradual através da adição de nucleotídeos a extremidade 3' do iniciador em uma reação catalisada por polimerase.[00070] In one embodiment of the present disclosure, the sequence of a polynucleotide template is determined by detecting the incorporation of one or more nucleotides into a nascent strand complementary to the polynucleotide template to be sequenced by detecting fluorescent label(s) bound to the incorporated nucleotide(s). Sequencing of the polynucleotide template may be initiated with a suitable primer (or prepared as a harpin-like construct that will contain the primer as part of the harpin), and the nascent strand is extended in a stepwise manner by adding nucleotides to the 3' end of the primer in a polymerase-catalyzed reaction.
[00071] Em concretizações particulares, cada um dos diferentes trifosfatos de nucleotídeos (A, T, G e C) pode ser marcado com um fluoróforo exclusivo e também compreende um grupo de bloqueio na posição 3' para prevenir a polimerização descontrolada. Alternativamente, um dos quatro nucleotídeos pode não estar marcado (escuro). A enzima polimerase incorpora um nucleotídeo na fita nascente complementar ao molde de polinucleotídeo, e o grupo de bloqueio impede a incorporação adicional de nucleotídeos. Quaisquer nucleotídeos não incorporados podem ser lavados e o sinal fluorescente de cada nucleotídeo incorporado pode ser "lido" opticamente por meios adequados, tal como um dispositivo acoplado de carga usando excitação a laser e filtros de emissão adequados. O grupo de bloqueio 3' e os compostos fluoróforo podem então ser removidos(desprotegidos), (simultaneamente ou sequencialmente) para expor a fita nascente para posterior incorporação de nucleotídeos. Tipicamente, a identidade do nucleotídeo incorporado será determinada após cada etapa de incorporação, mas isso não é estritamente essencial. Da mesma forma, a Patente Norte Americana No. 5.302.509 descreve um método para sequenciar polinucleotídeos imobilizados em um suporte sólido.[00071] In particular embodiments, each of the different nucleotide triphosphates (A, T, G and C) may be labeled with a unique fluorophore and also comprise a blocking group at the 3' position to prevent runaway polymerization. Alternatively, one of the four nucleotides may be unlabeled (dark). The polymerase enzyme incorporates a nucleotide into the nascent strand complementary to the polynucleotide template, and the blocking group prevents further nucleotide incorporation. Any unincorporated nucleotides may be washed away and the fluorescent signal from each incorporated nucleotide may be "read" optically by suitable means, such as a charge-coupled device using laser excitation and suitable emission filters. The 3' blocking group and the fluorophore compounds may then be removed (deprotected), (simultaneously or sequentially) to expose the nascent strand for further nucleotide incorporation. Typically, the identity of the incorporated nucleotide will be determined after each incorporation step, but this is not strictly essential. Similarly, U.S. Patent No. 5,302,509 describes a method for sequencing polynucleotides immobilized on a solid support.
[00072] O método, tal como exemplificado acima, utiliza a incorporação de nucleotídeos A, G, C e T bloqueados em 3’, marcados com fluorescência em uma fita crescente complementar ao polinucleotídeo imobilizado, na presença de DNA polimerase. A polimerase incorpora uma base complementar ao polinucleotídeo alvo, mas é impedida de exercer adição adicional pelo grupo de bloqueio 3'. O marcador do nucleotídeo incorporado pode então ser determinado e o grupo de bloqueio removido por clivagem química para permitir que ocorra polimerização adicional. O molde de ácido nucleico a ser sequenciado em uma reação de sequenciamento por síntese pode ser qualquer polinucleotídeo que se deseja sequenciar. O molde de ácido nucleico para uma reação de sequenciamento compreenderá tipicamente uma região de fita dupla com um grupo hidroxila 3' livre que serve como um iniciador ou ponto de iniciação para a adição de nucleotídeos adicionais na reação de sequenciamento. A região do molde a ser sequenciado ultrapassará esse grupo hidroxila 3' livre na cadeia complementar. A região pendente do molde a ser sequenciado pode ser de cadeia simples, mas pode ser de cadeia dupla, desde que um "nick esteja presente" na cadeia complementar à cadeia do molde a ser sequenciado para fornecer um grupo 3' OH livre para iniciação da reação de sequenciamento. Em tais modalidades, o sequenciamento pode ser processado pelo deslocamento da fita. Em certas modalidades, um iniciador contendo o grupo hidroxila 3' livre pode ser adicionado como um componente separado (por exemplo, um oligonucleotídeo curto) que hibridiza com uma região de fita simples do molde a ser sequenciado. Alternativamente, o iniciador e o molde de fita a ser sequenciada podem formar parte de uma cadeia de ácido nucleico parcialmente auto-complementar capaz de formar um duplex intra- molecular, tal como, por exemplo, uma estrutura de laço de harpin. Os polinucleotídeos e os métodos harpin pelos quais eles podem ser ligados a suportes sólidos são divulgados nas publicações de patentes internacionais Nos. WO0157248 e WO2005/047301. Os nucleotídeos podem ser adicionados sucessivamente a um iniciador em crescimento, resultando na síntese de uma cadeia polinucleotídica na direção 5' para 3'. A natureza da base que foi adicionada pode ser determinada, particularmente, mas não necessariamente, após cada adição de nucleotídeo, fornecendo assim informações de sequência para o molde de ácido nucleico. Assim, um nucleotídeo é incorporado em uma fita de ácido nucleico (ou polinucleotídeo) pela união do nucleotídeo ao grupo hidroxila 3' livre da fita de ácido nucleico através da formação de uma ligação fosfodiéster com o grupo fosfato 5' do nucleotídeo.[00072] The method, as exemplified above, utilizes the incorporation of fluorescently labeled, 3'-blocked A, G, C, and T nucleotides into a growing strand complementary to the immobilized polynucleotide, in the presence of DNA polymerase. The polymerase incorporates a base complementary to the target polynucleotide, but is prevented from further addition by the 3'-blocking group. The label of the incorporated nucleotide can then be determined and the blocking group removed by chemical cleavage to allow further polymerization to occur. The nucleic acid template to be sequenced in a sequencing-by-synthesis reaction can be any polynucleotide that is desired to be sequenced. The nucleic acid template for a sequencing reaction will typically comprise a double-stranded region with a free 3' hydroxyl group that serves as a primer or initiation point for the addition of additional nucleotides in the sequencing reaction. The region of the template to be sequenced will extend beyond this free 3' hydroxyl group onto the complementary strand. The overhang region of the template to be sequenced may be single-stranded, but may be double-stranded, provided that a nick is present on the strand complementary to the template strand to be sequenced to provide a free 3' OH group for initiation of the sequencing reaction. In such embodiments, sequencing may be processed by strand displacement. In certain embodiments, a primer containing the free 3' hydroxyl group may be added as a separate component (e.g., a short oligonucleotide) that hybridizes to a single-stranded region of the template to be sequenced. Alternatively, the primer and the template strand to be sequenced may form part of a partially self-complementary nucleic acid strand capable of forming an intramolecular duplex, such as, for example, a harpin loop structure. Harpin polynucleotides and methods by which they may be attached to solid supports are disclosed in International Patent Publication Nos. WO0157248 and WO2005/047301. Nucleotides can be added successively to a growing primer, resulting in the synthesis of a polynucleotide chain in the 5' to 3' direction. The nature of the base that has been added can be determined, particularly, but not necessarily, after each nucleotide addition, thus providing sequence information for the nucleic acid template. Thus, a nucleotide is incorporated into a nucleic acid strand (or polynucleotide) by the attachment of the nucleotide to the free 3' hydroxyl group of the nucleic acid strand through the formation of a phosphodiester bond with the 5' phosphate group of the nucleotide.
[00073] O molde de ácido nucleico a ser sequenciado pode ser DNA ou RNA, ou mesmo uma molécula híbrida composta por desoxinucleotídeos e ribonucleotídeos. O molde de ácido nucleico pode compreender nucleotídeos de ocorrência natural e/ou não natural e ligações de cadeia principal naturais ou não naturais, desde que eles não impeçam a cópia do molde na reação de sequenciamento.[00073] The nucleic acid template to be sequenced may be DNA or RNA, or even a hybrid molecule composed of deoxynucleotides and ribonucleotides. The nucleic acid template may comprise naturally occurring and/or non-naturally occurring nucleotides and natural or non-natural backbone linkers, provided that they do not impede copying of the template in the sequencing reaction.
[00074] Em certas modalidades, o molde de ácido nucleico a ser sequenciado pode ser ligado a um suporte sólido por meio de qualquer método de ligação adequado conhecido na arte, por exemplo, através da ligação covalente. Em certas modalidades, os moldes de polinucleotídeos podem ser ligados diretamente a um suporte sólido (por exemplo, um suporte à base de sílica). No entanto, em outras concretizações da presente divulgação, a superfície do suporte sólido pode ser modificada de alguma maneira para permitir a ligação covalente direta do molde de polinucleotídeos ou para imobilizar os moldes de polinucleotídeos através de uma multicamada de hidrogel ou polieletrólito, que por si só pode ser não covalentemente ligado ao suporte sólido.[00074] In certain embodiments, the nucleic acid template to be sequenced may be attached to a solid support via any suitable attachment method known in the art, e.g., via covalent attachment. In certain embodiments, the polynucleotide templates may be attached directly to a solid support (e.g., a silica-based support). However, in other embodiments of the present disclosure, the surface of the solid support may be modified in some manner to allow direct covalent attachment of the polynucleotide template or to immobilize the polynucleotide templates via a hydrogel or polyelectrolyte multilayer, which itself may be non-covalently attached to the solid support.
[00075] Os arranjos em que os polinucleotídeos foram diretamente ligados aos suportes à base de sílica são aqueles, por exemplo, descritos em WO00006770, em que os polinucleotídeos são imobilizados sobre um suporte de vidro, através de reação entre um grupo epóxido pendente no vidro com um grupo amino interno sobre o polinucleotídeo. Além disso, os polinucleotídeos podem ser ligados a um suporte sólido por reação de um nucleófilo à base de enxofre com o suporte sólido, por exemplo, tal como descrito no documento WO2005/047301. Outro exemplo de molde de polinucleotídeos com suporte sólido é aquele em que os moldes de polinucleotídeos são conectados ao hidrogel suportado em suportes à base de sílica ou outros suportes sólidos, por exemplo, conforme descrito nos documentos W000/31148, W001/01143, W002/12566, W003/014392, Patente Norte Americana No. 6.465.178 e W000/53812.[00075] Arrangements in which the polynucleotides have been directly attached to silica-based supports are those, for example, described in WO00006770, in which the polynucleotides are immobilized on a glass support by reaction between an epoxide group pendant on the glass with an internal amino group on the polynucleotide. Furthermore, the polynucleotides may be attached to a solid support by reaction of a sulfur-based nucleophile with the solid support, for example, as described in WO2005/047301. Another example of a solid supported polynucleotide template is one in which the polynucleotide templates are attached to the hydrogel supported on silica-based supports or other solid supports, for example, as described in WO00/31148, WO001/01143, WO002/12566, WO003/014392, U.S. Patent No. 6,465,178 and WO000/53812.
[00076] Uma superfície particular, na qual os moldes de polinucleotídeos podem ser imobilizados, é um hidrogel de poliacrilamida. Os hidrogéis de poliacrilamida são descritos nas referências citadas acima e no documento WO2005/065814.[00076] A particular surface on which polynucleotide templates may be immobilized is a polyacrylamide hydrogel. Polyacrylamide hydrogels are described in the references cited above and in WO2005/065814.
[00077] Moldes de moléculas de DNA podem ser ligadas a esferas ou micropartículas. A ligação a esferas ou micropartículas pode ser útil para aplicações de sequenciamento. As bibliotecas de esferas podem ser preparadas onde cada esfera contém diferentes sequências de DNA. Bibliotecas e métodos exemplificativos para suas criações são descritos em Nature. 437, 376-380 (2005); Science. 309, 5741, 1728-1732 (2005). O sequenciamento de arranjos de tais esferas utilizando nucleotídeos aqui apresentados está dentro do escopo da presente divulgação.[00077] Templates of DNA molecules can be attached to beads or microparticles. Attachment to beads or microparticles can be useful for sequencing applications. Libraries of beads can be prepared where each bead contains different DNA sequences. Exemplary libraries and methods for their creation are described in Nature. 437, 376-380 (2005); Science. 309, 5741, 1728-1732 (2005). Sequencing arrays of such beads using nucleotides presented herein is within the scope of the present disclosure.
[00078] O(s) molde(s) a ser(serem) sequenciado(s) pode(m) fazer parte de um "arranjo" em um suporte sólido; nesse caso, o arranjo pode assumir qualquer forma conveniente. Assim, o método da presente divulgação é aplicável a todos os tipos de arranjos de alta densidade, incluindo arranjos de molécula única, arranjos agrupados e arranjos de esferas. Os nucleotídeos modificados marcados com compostos corantes da presente divulgação podem ser utilizados para sequenciar moldes em essencialmente qualquer tipo de arranjos, incluindo, mas não se limitando a, aqueles formados pela imobilização de moléculas de ácido nucleico em um suporte sólido.[00078] The template(s) to be sequenced may be part of an "array" on a solid support; in this case, the array may take any convenient form. Thus, the method of the present disclosure is applicable to all types of high-density arrays, including single-molecule arrays, clustered arrays, and bead arrays. The modified nucleotides labeled with dye compounds of the present disclosure may be used to sequence templates on essentially any type of array, including, but not limited to, those formed by immobilizing nucleic acid molecules on a solid support.
[00079] No entanto, os nucleotídeos modificados da presente divulgação são particularmente vantajosos no contexto de sequenciamento de arranjos agrupados. Em arranjos agrupados, regiões distintas no arranjo (muitas vezes referidas como sítios ou características) compreendem vários moldes de moléculas polinucleotídicas. Geralmente, as múltiplas moléculas de polinucleotídeo não são individualmente resolvíveis por meios ópticos e, em vez disso, são detectadas como um conjunto. Dependendo de como o arranjo é formado, cada sítio do arranjo pode compreender várias cópias de uma molécula de polinucleotídeo individual (por exemplo, o sítio é homogêneo para uma determinada espécie de ácido nucleico de fita simples ou dupla) ou até várias cópias de um pequeno número de moléculas polinucleotídicas diferentes (por exemplo, cópias múltiplas de duas espécies diferentes de ácidos nucleicos). Arranjos agrupados de moléculas de ácido nucleico podem ser produzidos usando técnicas geralmente conhecidas na arte. A título de exemplo, os documentos WO 98/44151 e WO00/18957, cada um dos quais incorporados aqui, descrevem métodos de amplificação de ácidos nucleicos nos quais os moldes e os produtos de amplificação permanecem imobilizados em um suporte sólido, com o intuito de formar arranjos compostos de agrupamentos ou "colônias" de moléculas imobilizadas de ácido nucleico. As moléculas de ácido nucleico presentes nos arranjos agrupados preparados de acordo com esses métodos são moldes adequados para sequenciamento usando os nucleotídeos modificados marcados com compostos corantes da presente divulgação.[00079] However, the modified nucleotides of the present disclosure are particularly advantageous in the context of pooled array sequencing. In pooled arrays, distinct regions on the array (often referred to as sites or features) comprise multiple templates of polynucleotide molecules. Generally, the multiple polynucleotide molecules are not individually resolvable by optical means and are instead detected as a set. Depending on how the array is formed, each site on the array may comprise multiple copies of an individual polynucleotide molecule (e.g., the site is homogeneous for a given single- or double-stranded nucleic acid species) or even multiple copies of a small number of different polynucleotide molecules (e.g., multiple copies of two different nucleic acid species). Pooled arrays of nucleic acid molecules can be produced using techniques generally known in the art. By way of example, WO 98/44151 and WO00/18957, each of which is incorporated herein, describe methods of nucleic acid amplification in which the templates and amplification products are immobilized on a solid support to form arrays composed of clusters or "colonies" of immobilized nucleic acid molecules. The nucleic acid molecules present in the clustered arrays prepared according to these methods are suitable templates for sequencing using the modified nucleotides labeled with dye compounds of the present disclosure.
[00080] Os nucleotídeos modificados da presente divulgação também são úteis no sequenciamento de moldes em arranjos de moléculas únicas. O termo "arranjo de molécula única" ou "SMA", conforme usado aqui, refere-se a uma população de moléculas de polinucleotídeos, distribuída (ou arranjada) sobre um suporte sólido, em que o espaçamento de qualquer polinucleotídeo individual em relação aos outros da população é tal que é possível resolver individualmente as moléculas polinucleotídicas individuais. As moléculas de ácido nucleico alvo imobilizadas na superfície do suporte sólido podem assim ser capazes de serem resolvidas por meios ópticos em algumas modalidades. Isto significa que um ou mais sinais distintos, cada um representando um polinucleotídeo, ocorrerão dentro da área resolvível do dispositivo de imagem usado.[00080] The modified nucleotides of the present disclosure are also useful in sequencing templates in single molecule arrays. The term "single molecule array" or "SMA" as used herein refers to a population of polynucleotide molecules, distributed (or arranged) on a solid support, wherein the spacing of any individual polynucleotide relative to the others in the population is such that it is possible to individually resolve the individual polynucleotide molecules. The target nucleic acid molecules immobilized on the surface of the solid support may thus be capable of being resolved by optical means in some embodiments. This means that one or more distinct signals, each representing a polynucleotide, will occur within the resolvable area of the imaging device used.
[00081] A detecção de molécula única pode ser alcançada onde o espaçamento entre as moléculas de polinucleotídeo adjacentes em um arranjo é de pelo menos 100 nm, mais particularmente pelo menos 250 nm, ainda mais particularmente pelo menos 300 nm, ainda mais particularmente pelo menos 350 nm. Assim, cada molécula é individualmente resolvível e detectável como um ponto fluorescente de molécula única, e a fluorescência a partir do referido ponto fluorescente de molécula única também exibe fotodegradação em uma única etapa.[00081] Single molecule detection may be achieved where the spacing between adjacent polynucleotide molecules in an array is at least 100 nm, more particularly at least 250 nm, even more particularly at least 300 nm, even more particularly at least 350 nm. Thus, each molecule is individually resolvable and detectable as a single molecule fluorescent spot, and the fluorescence from said single molecule fluorescent spot also exhibits photobleaching in a single step.
[00082] Os termos "resolvido individualmente" e "resolução individual" são aqui usados para especificar que, quando visualizada, é possível distinguir uma molécula no arranjo a partir de suas moléculas vizinhas. A separação entre moléculas individuais no arranjo será determinada, em parte, pela técnica específica usada para resolver as moléculas individuais. As características gerais dos arranjos de moléculas únicas serão entendidas por referência aos pedidos WO00/06770 e WO 01/57248. Embora o uso dos nucleotídeos modificados da presente divulgação seja aplicado em reações de sequenciamento por síntese, a utilidade dos nucleotídeos modificados não está limitada a esses métodos. De fato, os nucleotídeos podem ser utilizados vantajosamente em qualquer metodologia de sequenciamento que exija a detecção de marcadores fluorescentes ligados a nucleotídeos incorporados em um polinucleotídeo.[00082] The terms "individually resolved" and "individual resolution" are used herein to specify that, when visualized, it is possible to distinguish a molecule in the array from its neighboring molecules. The separation between individual molecules in the array will be determined, in part, by the specific technique used to resolve the individual molecules. The general characteristics of single molecule arrays will be understood by reference to WO00/06770 and WO 01/57248. Although the use of the modified nucleotides of the present disclosure is applied in sequencing-by-synthesis reactions, the utility of the modified nucleotides is not limited to these methods. Indeed, the nucleotides may be advantageously utilized in any sequencing methodology that requires the detection of fluorescent labels attached to nucleotides incorporated into a polynucleotide.
[00083] Em particular, os nucleotídeos modificados da presente divulgação podem ser utilizados em protocolos automatizados de sequenciamento de fluorescência, particularmente sequenciamento de ciclo de fluoróforo- terminador com base no método de sequenciamento de terminação em cadeia de Sanger. Tais métodos geralmente usam enzimas e sequenciamento de ciclo para incorporar didesoxi-nucleotídeos marcados com fluorescência em uma reação de sequenciamento de extensão do iniciador. Os chamados métodos de sequenciamento de Sanger e protocolos relacionados (tipo Sanger) utilizam terminação de cadeia aleatória com didesoxi-nucleotídeos marcados.[00083] In particular, the modified nucleotides of the present disclosure can be used in automated fluorescence sequencing protocols, particularly fluorophore-terminator cycle sequencing based on the Sanger chain termination sequencing method. Such methods generally use enzymes and cycle sequencing to incorporate fluorescently labeled dideoxynucleotides into a primer extension sequencing reaction. So-called Sanger sequencing methods and related (Sanger-like) protocols utilize random chain termination with labeled dideoxynucleotides.
[00084] A presente divulgação também fornece kits que incluem nucleosídeos e/ou nucleotídeos modificados marcados com fluoróforos. Tais kits geralmente incluem pelomenos um nucleotídeo modificado ou nucleosídeo marcado, tal como estabelecido aqui juntamente com pelo menos um componente adicional. O(s) componente(s) adicional(ais) pode(m) ser um ou mais dos componentes identificados em um método estabelecido acima ou na seção de Exemplos abaixo. Alguns exemplos não limitativos de componentes que podem ser combinados em um kit da presente divulgação são apresentados abaixo.[00084] The present disclosure also provides kits that include fluorophore-labeled modified nucleosides and/or nucleotides. Such kits generally include at least one modified nucleotide or labeled nucleoside as set forth herein along with at least one additional component. The additional component(s) may be one or more of the components identified in a method set forth above or in the Examples section below. Some non-limiting examples of components that may be combined in a kit of the present disclosure are set forth below.
[00085] Em uma concretização particular, um kit pode incluir pelo menos um nucleotídeo ou nucleosídeo modificado marcado como estabelecido aqui juntamente com nucleotídeos ou nucleosídeos modificados ou não modificados. Por exemplo, nucleotídeos modificados marcados de acordo com a presente divulgação podem ser fornecidos em conjunto com nucleotídeos não marcados ou nativos e/ou com nucleotídeos marcados com fluorescência ou qualquer combinação dos mesmos. Consequentemente, os kits podem compreender nucleotídeos modificados marcados com corantes de acordo com a presente divulgação e nucleotídeos modificados marcados com outros, por exemplo, compostos corantes presentes na técnica anterior. As combinações de nucleotídeos podem ser fornecidas como componentes individuais separados (por exemplo, um tipo de nucleotídeo por recipiente ou tubo) ou como misturas de nucleotídeos (por exemplo, dois ou mais nucleotídeos misturados no mesmo recipiente ou tubo).[00085] In a particular embodiment, a kit may include at least one labeled modified nucleotide or nucleoside as set forth herein together with modified or unmodified nucleotides or nucleosides. For example, labeled modified nucleotides according to the present disclosure may be provided together with unlabeled or native nucleotides and/or with fluorescently labeled nucleotides or any combination thereof. Accordingly, kits may comprise modified nucleotides labeled with dyes according to the present disclosure and modified nucleotides labeled with other, e.g., dye compounds present in the prior art. The nucleotide combinations may be provided as separate individual components (e.g., one type of nucleotide per container or tube) or as mixtures of nucleotides (e.g., two or more nucleotides mixed in the same container or tube).
[00086] Onde os kits compreendem uma pluralidade, particularmente dois, mais particularmente quatro,nucleotídeos modificados marcados com um composto corante, os diferentes nucleotídeos podem ser marcados com diferentes compostos corantes, ou um pode ser escuro, sem compostos de corante. Quando os diferentes nucleotídeos são marcados com diferentes compostos corantes, é uma característica dos kits que os referidos compostos corantes sejam fluoróforos espectralmente distinguíveis. Tal como usado aqui, o termo "fluoróforos espectralmentedistinguíveis" refere-se à fluoróforos que emitem energia fluorescente em comprimentos de onda que podem ser distinguidos por equipamento de detecção de fluorescência (por exemplo, uma plataforma comercial de sequenciamento de DNA baseada em capilares) quando dois ou mais desses corantes estão presentes em uma amostra. Quando dois nucleotídeos modificados marcados com compostos fluoróforos são fornecidos em forma de kit, é uma característica de algumas concretizações que os fluoróforos espectralmente distinguíveis possam ser excitados no mesmo comprimento de onda, tal como, por exemplo, pelo mesmo laser. Quando quatro nucleotídeos modificados marcados com compostos fluoróforos são fornecidos em forma de kit, é uma característica de algumas concretizações que dois dos fluoróforos espectralmente distinguíveis possam ser excitados em um comprimento de onda e os outros dois corantes espectralmente distinguíveis possam ser excitados em outro comprimento de onda. Comprimentos específicos de onda de excitação são 532 nm, 630 nm a 700 nm, particularmente 660 nm.[00086] Where the kits comprise a plurality, particularly two, more particularly four, modified nucleotides labelled with a dye compound, the different nucleotides may be labelled with different dye compounds, or one may be dark, without dye compounds. Where the different nucleotides are labelled with different dye compounds, it is a feature of the kits that said dye compounds are spectrally distinguishable fluorophores. As used herein, the term "spectrally distinguishable fluorophores" refers to fluorophores that emit fluorescent energy at wavelengths that can be distinguished by fluorescence detection equipment (e.g., a commercial capillary-based DNA sequencing platform) when two or more such dyes are present in a sample. When two modified nucleotides labeled with fluorophoric compounds are provided in kit form, it is a feature of some embodiments that the spectrally distinguishable fluorophores can be excited at the same wavelength, such as, for example, by the same laser. When four modified nucleotides labeled with fluorophoric compounds are provided in kit form, it is a feature of some embodiments that two of the spectrally distinguishable fluorophores can be excited at one wavelength and the other two spectrally distinguishable dyes can be excited at another wavelength. Specific excitation wavelengths are 532 nm, 630 nm to 700 nm, particularly 660 nm.
[00087] Em uma modalidade, um kit inclui um nucleotídeo modificado marcado com um composto da presente divulgação e um segundo nucleotídeo modificado marcado com um segundo corante, em que os corantes têm uma diferença na absorbância máxima de pelo menos 10 nm, particularmente de 20 nm a 50 nm. Mais particularmente, os dois compostos corantes têm desvios de Stokes entre 15 nm e 40 nm, onde o "desvio de Stokes" é a distância entre o pico de absorção e o comprimento de onda do pico emissão.[00087] In one embodiment, a kit includes a modified nucleotide labeled with a compound of the present disclosure and a second modified nucleotide labeled with a second dye, wherein the dyes have a difference in maximum absorbance of at least 10 nm, particularly from 20 nm to 50 nm. More particularly, the two dye compounds have Stokes shifts between 15 nm and 40 nm, where the "Stokes shift" is the distance between the absorption peak and the wavelength of the emission peak.
[00088] Em uma concretização adicional, um kit pode incluir ainda dois outros nucleotídeos modificados marcados com fluoróforos, em que os corantes são excitados pelo mesmo laser de 488 nm a 550 nm, particularmente 532 nm. Os corantes podem ter uma diferença na absorbância máxima de pelo menos 10 nm, particularmente 20 nm a 50 nm. Mais particularmente, os dois compostos corantes podem ter desvios de Stokes entre 20 nm e 40 nm. Ainda mais particularmente, os dois compostos corantes podem ter uma absorbância máxima diferente abaixo de 640 nm, particularmente abaixo de 600 nm. Corantes particulares que são espectralmente distinguíveis dos corantes de polimetina da presente divulgação e que atendem aos critérios acima são os análogos de polimetina, tais como descrito na Patente Norte Americana No. 5.268.486 (por exemplo Cy3) ou WO 0226891 (Alexa 532; Molecular Probes A20106) ou polimetinas assimétricas, tal como divulgadas na Patente Norte Americana No. 6.924.372. Corantes alternativos incluem análogos de rodamina, por exemplo, tetrametil rodamina e análogos dos mesmos.[00088] In a further embodiment, a kit may further include two further modified nucleotides labelled with fluorophores, wherein the dyes are excited by the same laser from 488 nm to 550 nm, particularly 532 nm. The dyes may have a difference in maximum absorbance of at least 10 nm, particularly 20 nm to 50 nm. More particularly, the two dye compounds may have Stokes shifts between 20 nm and 40 nm. Even more particularly, the two dye compounds may have a different maximum absorbance below 640 nm, particularly below 600 nm. Particular dyes that are spectrally distinguishable from the polymethine dyes of the present disclosure and that meet the above criteria are polymethine analogs such as described in U.S. Patent No. 5,268,486 (e.g. Cy3) or WO 0226891 (Alexa 532; Molecular Probes A20106) or asymmetric polymethines such as disclosed in U.S. Patent No. 6,924,372. Alternative dyes include rhodamine analogs, e.g. tetramethyl rhodamine and analogs thereof.
[00089] Em uma concretização alternativa, os kits da presente divulgação podem conter nucleotídeos onde a mesma base é marcada com dois compostos diferentes. Um primeiro nucleotídeo pode ser marcado com um primeiro composto fluorescente, por exemplo, um fluoróforo 'vermelho' absorvendo a mais de 650 nm. Um segundo nucleotídeo pode ser marcado com um composto espectralmente distinto, por exemplo, um fluoróforo 'verde' absorvendo a menos de 600 nm. Um terceiro nucleotídeo pode ser marcado como uma mistura do primeiro fluoróforo e o composto espectralmente distinto, e o quarto nucleotídeo pode ser 'escuro' e não conter marcador. Em termos simples, os nucleotídeos de 1 a 4 podem ser marcados como 'verde', 'vermelho', 'vermelho/verde' e escuro. Para simplificar ainda mais a instrumentação, quatro nucleotídeos podem ser marcados com dois corantes excitados com um único laser e, portanto, a marcação dos nucleotídeos de 1 a 4 pode ser 'vermelho 1', 'vermelho 2,' 'vermelho 1/vermelho 2' e escuro ou 'verde 1', 'verde 2' 'verde 1/verde 2' e escuro.[00089] In an alternative embodiment, the kits of the present disclosure may contain nucleotides where the same base is labeled with two different compounds. A first nucleotide may be labeled with a first fluorescent compound, e.g., a 'red' fluorophore absorbing at greater than 650 nm. A second nucleotide may be labeled with a spectrally distinct compound, e.g., a 'green' fluorophore absorbing at less than 600 nm. A third nucleotide may be labeled as a mixture of the first fluorophore and the spectrally distinct compound, and the fourth nucleotide may be 'dark' and contain no label. In simple terms, nucleotides 1 through 4 may be labeled as 'green', 'red', 'red/green', and dark. To further simplify instrumentation, four nucleotides can be labeled with two dyes excited with a single laser, and thus the labeling of nucleotides 1 through 4 can be 'red 1,' 'red 2,' 'red 1/red 2' and dark or 'green 1,' 'green 2,' 'green 1/green 2' and dark.
[00090] Embora os kits sejam exemplificados acima em relação às configurações com nucleotídeos diferentes que são marcados com diferentes compostos corantes, deverá ser entendido que os kits podem incluir 2, 3, 4 ou mais nucleotídeos diferentes que possuem o mesmo composto corante.[00090] Although the kits are exemplified above with respect to configurations with different nucleotides that are labeled with different dye compounds, it should be understood that the kits may include 2, 3, 4 or more different nucleotides that have the same dye compound.
[00091] Em concretizações particulares, um kit pode incluir uma enzima polimerase capaz de catalisar a incorporação dos nucleotídeos modificados em um polinucleotídeo. Outros componentes a serem incluídos em tais kits podem incluir tampões e similares. Os nucleotídeos modificados marcados com corantes de acordo com a divulgação e outros componentes de nucleotídeos, incluindo misturas de diferentes nucleotídeos, podem ser fornecidos no kit em uma forma concentrada a ser diluída antes do uso. Em tais modalidades, um tampão de diluição adequado também pode ser incluído. Novamente, um ou mais dos componentes identificados em um método estabelecido neste relatório descritivo podem ser incluídos em um kit da presente divulgação.[00091] In particular embodiments, a kit may include a polymerase enzyme capable of catalyzing the incorporation of the modified nucleotides into a polynucleotide. Other components to be included in such kits may include buffers and the like. The dye-labeled modified nucleotides according to the disclosure and other nucleotide components, including mixtures of different nucleotides, may be provided in the kit in a concentrated form to be diluted prior to use. In such embodiments, a suitable dilution buffer may also be included. Again, one or more of the components identified in a method set forth in this specification may be included in a kit of the present disclosure.
[00092] Observa-se que, conforme usado nesta especificação e nas reivindicações anexas, as formas singulares "um/uma", e "o/a" incluem referentes plurais, a menos que expressa e inequivocamente limitada a um referente. Será evidente para os técnicos na arte que várias modificações e variações podem ser feitas em várias concretizações descritas neste documento sem se afastar do espírito ou escopo dos presentes ensinamentos. Assim, pretende-se que as várias concretizações descritas aqui abranjam outras modificações e variações dentro do escopo das reivindicações anexas e seus equivalentes.[00092] It is noted that, as used in this specification and the appended claims, the singular forms "a", "a", and "the" include plural referents unless expressly and unambiguously limited to one referent. It will be apparent to those skilled in the art that various modifications and variations may be made to various embodiments described herein without departing from the spirit or scope of the present teachings. Thus, it is intended that the various embodiments described herein encompass other modifications and variations within the scope of the appended claims and their equivalents.
[00093] Concretizações adicionais são divulgadas em mais detalhes nos exemplos a seguir, que não têm a intenção de limitar o escopo das reivindicações.Exemplo 1. Síntese de trifosfato de nucleotídeo de braço pendente curto [00093] Additional embodiments are disclosed in greater detail in the following examples, which are not intended to limit the scope of the claims. Example 1. Synthesis of Short Dangling Arm Nucleotide Triphosphate
[00094] O material de partida L1 (1,07 g, 4 mmol) foi dissolvido em DMF anidro (15 mL), depois colocado em nitrogênio a 0°C em um banho de gelo. Adicionou-se N,N- diisopropiletilamina (884 μL, 4,8 mmol), seguido de PyBOP (2,29 g, 4,4 mmol). A reação foi agitada em nitrogênio a 0°C por 20 minutos. Em seguida, foi adicionado sal de N-(5- aminopentil)-2,2,2-trifluoroacetamida, trifluoroacetato(1,5 g, 4,8 mmol), seguido por N,N-diisopropiletilamina (1 mL, 5,4 mmol). A reação foi removida do banho de gelo e agitada à temperatura ambiente por 3 horas. O solvente foi removido sob pressão reduzida e o resíduo dissolvido em acetato de etila (100 mL). A solução foi extraída com 3x 100 mL de KHSO4 aquoso diluído (pH = 1), 1x 50 mL de água,2x 100 mL de NaHCO3 saturado aquoso. A fase orgânica foi seca em Na2SO4 anidro e o solvente foi removido sob pressão reduzida. O produto bruto foi purificado por cromatografia flash em gel de sílica (gradiente linear de acetato de etila em DCM, de 50% a 100%). L2 foi isolado como um óleo viscoso claro (1,60 g, 3,59 mmol, 90%). 1H RMN (400 MHz,CDCl3): δ (ppm) 7,45 (m, 1H, Ar CH), 7,33 (m, 2H, Ar CH),7,07 (m, 2H, Ar CH, NH), 6,57 (t, J = 5,6 Hz, 1H, NH), 4,85(t, J = 4,9 Hz, 1H, CH-N3), 4,22 (dd, J = 10,4, 5,1 Hz, 1H,CH2-OAr), 4,16 (dd, J = 10,5, 4,7 Hz, 1H, CH2-OAr), 4,00(ddd, J = 10,1, 4,9, 2,9 Hz, 1H, CH2-O), 3,83 (m, 2H, CH2-OH), 3,75 (ddd, J = 9,8, 6,6, 3,0 Hz, 1H, CH2-O), 3,45 (q, J = 6,7 Hz, 2H, CH2-NH), 3,36 (q, J = 6,6 Hz, 2H, CH2-NH),2,78 (t, J = 6,2 Hz, 1H, OH), 1,65 (m, 4H, CH2-CH2-NH),1,41 (p, J = 7,4, 6,9 Hz, 2H, CH2-CH2-CH2-NH). 19F RMN(376,5 MHz, CDCl3): δ (ppm) -75,7. 13C RMN (100 MHz, CDCl3):δ (ppm) 167,5 (s), 158,2 (s), 137,5 (s), 135,9 (s), 129,7(d), 128,2 (d), 119,6 (d), 118,5 (d), 113,2 (d), 89,9 (d),71,4 (t), 69,4 (t), 61,6 (t), 39,7 (t), 39,4 (t), 29,0 (t),28,1 (t), 23,6 (t). LC-MS (ES e CI): (-ve) m/z 446 (M-H+);(+ve) m/z 448 (M+H+), 470 (M+Na+).[00094] Starting material L1 (1.07 g, 4 mmol) was dissolved in anhydrous DMF (15 mL), then placed in nitrogen at 0 °C in an ice bath. N,N-Diisopropylethylamine (884 μL, 4.8 mmol) was added, followed by PyBOP (2.29 g, 4.4 mmol). The reaction was stirred in nitrogen at 0 °C for 20 min. Next, N-(5-aminopentyl)-2,2,2-trifluoroacetamide trifluoroacetate salt (1.5 g, 4.8 mmol) was added, followed by N,N-diisopropylethylamine (1 mL, 5.4 mmol). The reaction was removed from the ice bath and stirred at room temperature for 3 h. The solvent was removed under reduced pressure and the residue dissolved in ethyl acetate (100 mL). The solution was extracted with 3x 100 mL dilute aqueous KHSO4 (pH = 1), 1x 50 mL water, 2x 100 mL saturated aqueous NaHCO3. The organic phase was dried over anhydrous Na2SO4 and the solvent was removed under reduced pressure. The crude product was purified by flash chromatography on silica gel (linear gradient of ethyl acetate in DCM, 50% to 100%). L2 was isolated as a clear viscous oil (1.60 g, 3.59 mmol, 90%). 1H NMR (400 MHz,CDCl3): δ (ppm) 7.45 (m, 1H, Ar CH), 7.33 (m, 2H, Ar CH),7.07 (m, 2H, Ar CH, NH), 6.57 (t, J = 5.6 Hz, 1H, NH), 4.85 (t, J = 4.9 Hz, 1H, CH-N3), 4.22 (dd, J = 10.4, 5.1 Hz, 1H,CH2-OAr), 4.16 (dd, J = 10.5, 4.7 Hz, 1H, CH2-OAr), 4.00(ddd, J = 10.1, 4.9, 2.9 Hz, 1H, CH2-O), 3.83 (m, 2H, CH2-OH), 3.75 (ddd, J = 9.8, 6.6, 3.0 Hz, 1H, CH2-O), 3.45 (q, J = 6.7 Hz, 2H, CH2-NH), 3.36 (q, J = 6.6 Hz, 2H, CH2-NH), 2.78 (t, J = 6.2 Hz, 1H, OH), 1.65 (m, 4H, CH2-CH2-NH),1.41 (p, J = 7.4, 6.9 Hz, 2H, CH2-CH2-CH2-NH). 19F NMR(376.5 MHz, CDCl3): δ (ppm) -75.7. 13C NMR (100 MHz, CDCl3) (t), 69.4 (t), 61.6 (t), 39.7 (t), 39.4 (t), 29.0 (t),28.1 (t), 23.6 (t). LC-MS (ES and CI): (-ve) m/z 446 (M-H+); (+ve) m/z 448 (M+H+), 470 (M+Na+).
[00095] O álcool L2 (500 mg, 1,12 mmol) foi dissolvido em acetonitrila (15 mL), depois TEMPO (70 mg, 0,448 mmol) foi adicionado. NaH2PO4^2H2O (1,1 g, 7,2 mmol) eNaClO2 (405 mg, 4,48 mmol) foram dissolvidos em 10 mL deágua e adicionados à reação. Então NaClO aquoso (14,5% de cloro disponível, 1,32 mL, 2,24 mmol) foi adicionado e a solução ficou imediatamente marrom escura. A reação foi agitada à temperatura ambiente por 6 horas. Durante esse período, a cor marrom desbotou para laranja. A reação foiextinta com concentrado aquoso de Na2S2Oa até a reação ficarincolor. A acetonitrila foi evaporada sob pressão reduzidae a solução foi diluída com 20 mL de água, e misturada comtrietilamina (aprox. 1 mL). A solução foi extraída com 10 mL de acetato de etila e a fase aquosa foi concentrada sobpressão reduzida. O sPA LN3 TFA bruto foi purificado por cromatografia de fase reversa em C18 (gradiente linear de acetonitrila em água de 0% a 30%) e isolado como um óleo transparente (438 mg, 0,95 mmol, 85%). RP-HPLC: tR = 17,9min (gradiente TEAB 0,1 M/acetonitrila de 5% a 50%, em coluna analítica YMC-C18). 1H RMN (400 MHz, CD3CN): δ (ppm) 8,03 (br s, 1H, NH), 7,63 (s, 1H, NH), 7,54 (s, 1H, Ar),7,42 (d, J = 7,7 Hz, 1H, Ar), 7,34 (t, J = 7,9 Hz, 1H, Ar),7,08 (d, J = 8,1 Hz, 1H, Ar), 5,10 (m, 1H, CH-N3), 4,35(dd, J = 10,9, 3,7 Hz, 1H, CH2O), 4,18 (dd, J = 10,8, 6,1Hz, 1H, CH2O), 4,09 (m, 2H, CH2O), 3,32 (m, 2H, CH2-NH),3,27 (m, 2H, CH2-NH), 3,02 (q, J = 7,3 Hz, 2H, Et3N), 1,60(m, 4H, CH2-CH2-NH), 1,39 (m, 2H, CH2-CH2-CH2-NH), 1,21 (t,J = 7,3 Hz, 2H, Et3N). 19F RMN (376,5 MHz, CD3CN): δ (ppm) - 76,5. 13C RMN (100 MHz, CD3OD): δ (ppm) 173,1 (s), 170,0(s), 159,9 (s), 137,5 (s), 131,0 (d), 125,7 (d), 121,4 (d),119,2 (d), 114,5 (d), 90,8 (d), 70,5 (t), 66,7 (t), 41,0(t), 40μ.8 (t), 30,2 (t), 29,7 (t), 25,4 (t). LC-MS (ES eCI): (-ve) m/z 460 (M-H+). (+ve) m/z 484 (M+Na+), 561(M+Et3NH+).[00095] Alcohol L2 (500 mg, 1.12 mmol) was dissolved in acetonitrile (15 mL), then TEMPO (70 mg, 0.448 mmol) was added. NaH2PO4^2H2O (1.1 g, 7.2 mmol) and NaClO2 (405 mg, 4.48 mmol) were dissolved in 10 mL of water and added to the reaction. Then aqueous NaClO (14.5% available chlorine, 1.32 mL, 2.24 mmol) was added, and the solution immediately turned dark brown. The reaction was stirred at room temperature for 6 h. During this time, the brown color faded to orange. The reaction was quenched with concentrated aqueous Na2S2Oa until the reaction was colorless. Acetonitrile was evaporated under reduced pressure and the solution was diluted with 20 mL of water, and mixed with triethylamine (approx. 1 mL). The solution was extracted with 10 mL of ethyl acetate and the aqueous phase was concentrated under reduced pressure. The crude sPA LN3 TFA was purified by C18 reversed-phase chromatography (linear gradient of acetonitrile in water from 0% to 30%) and isolated as a clear oil (438 mg, 0.95 mmol, 85%). RP-HPLC: tR = 17.9 min (0.1 M TEAB/acetonitrile gradient from 5% to 50%, on a YMC-C18 analytical column). 1H NMR (400 MHz, CD3CN): δ (ppm) 8.03 (br s, 1H, NH), 7.63 (s, 1H, NH), 7.54 (s, 1H, Ar),7.42 (d, J = 7.7 Hz, 1H, Ar), 7.34 (t, J = 7.9 Hz, 1H, Ar),7.08 (d, J = 8.1 Hz, 1H, Ar), 5.10 (m, 1H, CH-N3), 4.35(dd, J = 10.9, 3.7 Hz, 1H, CH2O), 4.18 (dd, J = 10.8, 6.1Hz, 1H, CH2O), 4.09 (m, 2H, CH2O), 3.32 (m, 2H, CH2-NH) 19F NMR (376.5 MHz, CD3CN): δ (ppm) - 76.5. 13C NMR (100 MHz, CD3OD): δ (ppm) 173.1 (s), 170.0 (s), 159.9 (s), 137.5 (s), 131.0 (d), 125.7 (d), 121.4 (d), 119.2 (d), 114.5 (d), 90.8 (d), 70.5 (t), 66.7 (t), 41.0(t), 40μ.8 (t), 30.2 (t), 29.7 (t), 25.4 (t). LC-MS (ES eCI): (-ve) m/z 460 (M-H+). (+ve) m/z 484 (M+Na+), 561(M+Et3NH+).
[00096] O material de partida L1 (658 mg, 2,46 mmol) foi dissolvido em DMF anidro (10 mL), depois colocado sob nitrogênio a 0°C em um banho de gelo. Adicionou-se N,N-di- isopropiletilamina (544 μL, 2,95 mmol), seguido de PyBOP (1,41 g, 2,71 mmol). A reação foi agitada sob nitrogênio a 0°C por 20 minutos, depois foi adicionou-se N-(2- aminoetil)-2,2,2-trifluoroacetamida, sal detrifluoroacetato (796 mg, 2,95 mmol), seguido por N,N- diisopropiletilamina (589 μL, 3,2 mmol). A reação foi removida do banho de gelo e agitada à temperatura ambiente por 3 horas. O solvente foi removido sob pressão reduzida e o resíduo dissolvido em acetato de etila (100 mL). A solução foi extraída com 3x 100 mL de KHSO4 aquoso diluído (pH = 1), 1x 50 mL de água, 2x 100 mL de solução NaHCO3saturado aquoso. A fase orgânica foi seca sobre Na2SO4 anidro e o solvente foi removido sob pressão reduzida. O produto bruto foi purificado por cromatografia "flash" em gel de sílica (gradiente linear de acetato de etila em DCM,de 50% a 100%) e isolado como um óleo viscoso (0,91 g, 2,24mmol, 91%). 1H RMN (400 MHz, CDCl3): δ (ppm) 8,19 (br s,1H, NH), 7,39 (d, J = 1,7 Hz, 1H, Ar CH), 7,38 - 7,30 (m,2H, Ar), 7,24 (t, J = 5,5 Hz, 1H, Ar CH), 7,07 (dt, J =7,2, 2,1 Hz, 1H, Ar CH), 4,84 (t, J = 4,9 Hz, 1H, CH-N3),4,20 (dd, J = 10,5, 5,1 Hz, 1H, CH2-OAr), 4,15 (dd, J =6,0, 4,5 Hz, 1H, CH2-OAr), 4,00 (ddd, J = 10,2, 4,8, 3,0Hz, 1H, CH2-O), 3,88 - 3,79 (m, 2H, CH2-OH), 3,74 (ddd, J =9,8, 6,4, 3,2 Hz, 1H, CH2-O), 3,65 (m, 2H, CH2-NH), 3,58(m, 2H, CH2-NH), 2,82 (t, J = 5,6 Hz 1H, OH). 19F RMN (376,5MHz, CDCl3): δ (ppm) -75,9. LC-MS (ES e CI): (-ve) m/z 404 (M-H+); (+ve) m/z 406 (M+H+), 428 (M+Na+).[00096] Starting material L1 (658 mg, 2.46 mmol) was dissolved in anhydrous DMF (10 mL), then placed under nitrogen at 0 °C in an ice bath. N,N-Diisopropylethylamine (544 μL, 2.95 mmol) was added, followed by PyBOP (1.41 g, 2.71 mmol). The reaction was stirred under nitrogen at 0 °C for 20 min, then N-(2-aminoethyl)-2,2,2-trifluoroacetamide trifluoroacetate salt (796 mg, 2.95 mmol) was added, followed by N,N-diisopropylethylamine (589 μL, 3.2 mmol). The reaction was removed from the ice bath and stirred at room temperature for 3 h. The solvent was removed under reduced pressure and the residue dissolved in ethyl acetate (100 mL). The solution was extracted with 3x 100 mL dilute aqueous KHSO4 (pH = 1), 1x 50 mL water, 2x 100 mL saturated aqueous NaHCO3 solution. The organic phase was dried over anhydrous Na2SO4 and the solvent was removed under reduced pressure. The crude product was purified by flash chromatography on silica gel (linear gradient of ethyl acetate in DCM, 50% to 100%) and isolated as a viscous oil (0.91 g, 2.24 mmol, 91%). 1H NMR (400 MHz, CDCl3): δ (ppm) 8.19 (br s,1H, NH), 7.39 (d, J = 1.7 Hz, 1H, Ar CH), 7.38 - 7.30 (m,2H, Ar), 7.24 (t, J = 5.5 Hz, 1H, Ar CH), 7.07 (dt, J =7.2, 2.1 Hz, 1H, Ar CH), 4.84 (t, J = 4.9 Hz, 1H, CH-N3), 4.20 (dd, J = 10.5, 5.1 Hz, 1H, CH2-OAr), 4.15 (dd, J =6.0, 4.5 Hz, 1H, CH2-OAr), 4.00 (ddd, J = 10.2, 4.8, 3.0Hz, 1H, CH2-O), 3.88 - 3.79 (m, 2H, CH2-OH), 3.74 (ddd, J =9.8, 6.4, 3.2 Hz, 1H, CH2-O), 3.65 (m, 2H, CH2-NH), 3.58(m, 2H, CH2-NH), 2.82 (t, J = 5.6 Hz 1H, OH). 19F NMR (376.5MHz, CDCl3): δ (ppm) -75.9. LC-MS (ES and CI): (-ve) m/z 404 (M-H+); (+ve) m/z 406 (M+H+), 428 (M+Na+).
[00097] O álcool L3 (230 mg, 0,567 mmol) foi dissolvido em acetonitrila (10 mL), depois, TEMPO (35 mg, 0,27 mmol) foi adicionado. NaH2PO4^2H2O (575 mg, 3,68 mmol) e NaClO2 (205 mg, 2,26 mmol) foram dissolvidos em 10 mL deágua e adicionados à reação. Então NaClO aquoso (14,5% de teor de cloro, 0,671 mL, 1,13 mmol) foi adicionado e a solução ficou imediatamente marrom escura. A reação foi mantida à temperatura ambiente por 18 horas. Durante esse período, a cor marrom desbotou para laranja. A reação foi extinta com Na2S2O3 concentrado aquoso até ficar incolor. Acetonitrila foi evaporada sob pressão reduzida e a solução foi diluída com 10 mL de água, basificada com trietilamina (aprox. 0,6 mL) e extraída com 10 mL de acetato de etila. A fase aquosa foi concentrada sob pressão reduzida. sPA2 LN3 TFA bruto foi purificado por cromatografia de fase reversa em C18 (gradiente linear de acetonitrila em água de 0% a 20%) e isolado como óleo transparente (224 mg como sal de trietilamônio, 0,43 mmol, 77%). RP-HPLC: tR = 17,9 min(gradiente TEAB 0,1 M/acetonitrila de 5% a 40%, em coluna analítica YMC-C18). 1H RMN (400 MHz, CD3CN): δ (ppm) 8,52(br s, 1H, NH), 8,34 (br s, 1H, NH), 7,77 (s, 1H, Ar), 7,49(dt, J = 7,7, 1,1 Hz, 1H, Ar), 7,38 (t, J = 7,9 Hz, 1H,Ar), 7,10 (ddd, J = 8,2, 2,6, 1,0 Hz, 1H, Ar), 5,14 (dd, J= 6,7, 3,4 Hz, 1H, CH-N3), 4,48 (dd, J = 11,5, 3,4 Hz, 1H,CH2O), 4,20 (dd, J = 11,5, 6,7 Hz, 1H, CH2O), 4,11 (d, J =1,4 Hz, 2H, CH2O), 3, 66 — 3,42 (m, 4H, CH2-NH), 3,05 (q, J= 7,3 Hz, 5H, Et3N), 1,22 (t, J = 7,3 Hz, 8H, Et3N). 19F RMN(376,5 MHz, CD3CN): δ (ppm) -76,3. 13C RMN (101 MHz, CD3CN):δ (ppm) 173,1 (s), 166,9 (s), 157,6 (s), 135,7 (s), 129,3(d), 120,0 (d), 118,0 (d), 117,0 (s), 112,1 (d), 88,4 (d),68,8 (t), 67,6 (t), 45,1 (t), 39,2 (t), 38,4 (t), 7,5 (q).LC-MS (ES e CI): (-ve) m/z 418 (M-H+).[00097] Alcohol L3 (230 mg, 0.567 mmol) was dissolved in acetonitrile (10 mL), then TEMPO (35 mg, 0.27 mmol) was added. NaH2PO4^2H2O (575 mg, 3.68 mmol) and NaClO2 (205 mg, 2.26 mmol) were dissolved in 10 mL of water and added to the reaction. Then aqueous NaClO (14.5% chlorine content, 0.671 mL, 1.13 mmol) was added, and the solution immediately turned dark brown. The reaction was kept at room temperature for 18 h. During this time, the brown color faded to orange. The reaction was quenched with concentrated aqueous Na2S2O3 until colorless. Acetonitrile was evaporated under reduced pressure and the solution was diluted with 10 mL of water, basified with triethylamine (approx. 0.6 mL) and extracted with 10 mL of ethyl acetate. The aqueous phase was concentrated under reduced pressure. Crude sPA2 LN3 TFA was purified by C18 reversed-phase chromatography (linear gradient of acetonitrile in water from 0% to 20%) and isolated as a clear oil (224 mg as triethylammonium salt, 0.43 mmol, 77%). RP-HPLC: tR = 17.9 min (0.1 M TEAB/acetonitrile gradient from 5% to 40%, on YMC-C18 analytical column). 1H NMR (400 MHz, CD3CN): δ (ppm) 8.52(br s, 1H, NH), 8.34 (br s, 1H, NH), 7.77 (s, 1H, Ar), 7.49(dt, J = 7.7, 1.1 Hz, 1H, Ar), 7.38 (t, J = 7.9 Hz, 1H,Ar) 6.7Hz, 1H, CH2O), 4.11 (d, J = 1.4 Hz, 2H, CH2O), 3. 66 — 3.42 (m, 4H, CH2-NH), 3.05 (q, J = 7.3 Hz, 5H, Et3N), 1.22 (t, J = 7.3 Hz, 8H, Et3N). 19F NMR(376.5 MHz, CD3CN): δ (ppm) -76.3. 13C NMR (101 MHz, CD3CN):δ (ppm) 173.1 (s), 166.9 (s), 157.6 (s), 135.7 (s), 129.3 (d), 120.0 (d), 118.0 (d), 117.0 (s), 112.1 (d), 88.4 (d), 68.8 (t), 67.6 (t), 45.1 (t), 39.2 (t), 38.4 (t), 7.5 (q).LC-MS (ES and CI): (-ve) m/z 418 (M-H+).
[00098] O ligante (sPA-LN3-TFA ou sPA2-LN3-TFA, 0,089 mmol) foi coevaporado com 2x 2 mL de N, N'- dimetilformamida (DMF) anidro, e depois dissolvido em 2 mL em DMF anidro. Adicionou-se N,N-diisopropiletilamina (33 μL, 0,178 mmol), seguido por tetrafluoroborato de O-(N- succinimidil)-N,N,N',N'-tetrametilurônio (TSTU, 32 mg, 0,106 mmol). A reação foi agitada com nitrogênio à temperatura ambiente durante 1 hora. Enquanto isso, uma solução aquosa de trifosfato PA-TTP (0,1 mmol) foi evaporada até a secura sob pressão reduzida e ressuspensa em 300 μL de solução de bicarbonato de trietilamônio (TEAB) 0,1 M em água. A solução ligante foi adicionada ao trifosfato e a reação foi agitada à temperatura ambiente durante 18 horas. Em seguida, o solvente foi evaporado sob pressão reduzida e o resíduo dissolvido em 1 mL de metanol e 3 mL de hidróxido de amônio aquoso a 33%. A solução foi agitada à temperatura ambiente durante 7 horas, depois foi evaporada até à secura. O produto bruto foi purificado por RP-HPLC em escala preparativa usando uma coluna YMC-Pack- Pro C18 eluindo com TEAB 0,1 M e acetonitrila. pppT-sPA: Rendimento: 67%. RP-HPLC: tR = 16,9 min (gradiente TEAB 0,1 M/acetonitrila de 5% a 35%, em coluna analítica YMC-C18). LC-MS (ES e CI): (-ve) m/z 922 (M-H+), 461 (M-2H+). pppT- sPA2: Rendimento: 65%. RP-HPLC: tR = 17,5 min (gradiente TEAB 0,1 M/acetonitrila de 5% a 30%, em coluna analítica YMC-C18). LC-MS (ES e CI): (-ve) m/z 880 (M-H+), 440 (M- 2H+).[00098] The ligand (sPA-LN3-TFA or sPA2-LN3-TFA, 0.089 mmol) was coevaporated with 2x 2 mL of anhydrous N,N'-dimethylformamide (DMF), and then dissolved in 2 mL in anhydrous DMF. N,N-Diisopropylethylamine (33 μL, 0.178 mmol) was added, followed by O-(N-succinimidyl)-N,N,N',N'-tetramethyluronium tetrafluoroborate (TSTU, 32 mg, 0.106 mmol). The reaction was stirred with nitrogen at room temperature for 1 h. Meanwhile, an aqueous solution of PA-TTP triphosphate (0.1 mmol) was evaporated to dryness under reduced pressure and resuspended in 300 μL of 0.1 M triethylammonium bicarbonate (TEAB) solution in water. The ligand solution was added to the triphosphate, and the reaction was stirred at room temperature for 18 h. Then, the solvent was evaporated under reduced pressure, and the residue dissolved in 1 mL of methanol and 3 mL of 33% aqueous ammonium hydroxide. The solution was stirred at room temperature for 7 h, then evaporated to dryness. The crude product was purified by preparative-scale RP-HPLC using a YMC-Pack-Pro C18 column eluting with 0.1 M TEAB and acetonitrile. pppT-sPA: Yield: 67%. RP-HPLC: tR = 16.9 min (0.1 M TEAB/acetonitrile gradient from 5% to 35%, on YMC-C18 analytical column). LC-MS (ES and CI): (-ve) m/z 922 (M-H+), 461 (M-2H+). pppT- sPA2: Yield: 65%. RP-HPLC: tR = 17.5 min (0.1 M TEAB/acetonitrile gradient from 5% to 30%, on YMC-C18 analytical column). LC-MS (ES and CI): (-ve) m/z 880 (M-H+), 440 (M- 2H+).
[00099] Carboxilato de fluoróforo (Fl, 0,0105 mmol) foi coevaporado com 2x 2 mL de N,N’-dimetilformamida (DMF) anidro, em seguida, dissolvido em 2 mL de N,N'- dimetilacetamida (DMA) anidro. Adicionou-se N,N-di- isopropiletilamina (15 μL, 0,084 mmol), seguido por tetrafluoroborato de O-(N-succinimidil)-N,N,N',N'- tetrametilurônio (TSTU, 0,012 mmol). A reação foi agitada com nitrogênio à temperatura ambiente por 45 minutos. Enquanto isso, uma solução aquosa de trifosfato pppT-sPA ou pppT-sPA2 (0,084 mmol) foi evaporada até a secura sob pressão reduzida e ressuspensa em 300 μL de solução de bicarbonato de trietilamônio (TEAB) 0,1 M em água. A solução de éster NHS-fluoróforo foi adicionada ao trifosfato e a reação foi agitada à temperatura ambiente durante 18 horas. O produto bruto foi purificado por cromatografia de troca iônica em DEAE-Sephadex (gradiente TEAB 0,1 M a TEAB 1 M, com 20% de acetonitrila) e por escala preparativa RP-HPLC (coluna YMC-Pack-Pro C18, eluindo com TEAB 0,1 M e acetonitrila).Síntese geral de N-(aminoalquil)-2,2,2- trifluoroacetamida [00099] Fluorophore carboxylate (Fl, 0.0105 mmol) was coevaporated with 2x 2 mL of anhydrous N,N'-dimethylformamide (DMF) then dissolved in 2 mL of anhydrous N,N'-dimethylacetamide (DMA). N,N-Diisopropylethylamine (15 μL, 0.084 mmol) was added, followed by O-(N-succinimidyl)-N,N,N',N'-tetramethyluronium tetrafluoroborate (TSTU, 0.012 mmol). The reaction was stirred with nitrogen at room temperature for 45 min. Meanwhile, an aqueous solution of pppT-sPA or pppT-sPA2 triphosphate (0.084 mmol) was evaporated to dryness under reduced pressure and resuspended in 300 μL of 0.1 M triethylammonium bicarbonate (TEAB) solution in water. The NHS ester-fluorophore solution was added to the triphosphate, and the reaction was stirred at room temperature for 18 h. The crude product was purified by ion-exchange chromatography on DEAE-Sephadex (gradient 0.1 M TEAB to 1 M TEAB, with 20% acetonitrile) and by preparative scale RP-HPLC (YMC-Pack-Pro C18 column, eluting with 0.1 M TEAB and acetonitrile). General synthesis of N-(aminoalkyl)-2,2,2-trifluoroacetamide
[000100] terc-butil (aminoalquil)carbamato (48 mmol) foi dissolvido em DCM anidro (60 mL) e colocado em banho de gelo com nitrogênio. Adicionou-se trietilamina (103 mmol), seguido por anidrido trifluoroacético (53 mmol) gota a gota. A reação foi removida do banho de gelo e agitada à temperatura ambiente durante 1 hora. A reação foi diluída com 200 mL de DCM e extraída com 2x 200 mL de solução saturada aquosa de NaHCO3. A fase orgânica foi seca sobre MgSO4 anidro e concentrada sob pressão reduzida. O produto bruto foi purificado por cromatografia "flash" em sílica gel (éter de petróleo / acetato de etila 3:7).[000100] tert-Butyl(aminoalkyl)carbamate (48 mmol) was dissolved in anhydrous DCM (60 mL) and placed in an ice-nitrogen bath. Triethylamine (103 mmol) was added, followed by trifluoroacetic anhydride (53 mmol) dropwise. The reaction was removed from the ice bath and stirred at room temperature for 1 h. The reaction was diluted with 200 mL of DCM and extracted with 2x 200 mL of saturated aqueous NaHCO3 solution. The organic phase was dried over anhydrous MgSO4 and concentrated under reduced pressure. The crude product was purified by flash chromatography on silica gel (petroleum ether/ethyl acetate 3:7).
[000101] terc-butil(5-(2,2,2- trifluoroacetamido)pentil) carbamato (n = 5): 1H RMN (400 MHz, CDCl3): δ (ppm) 6,40 (br s, 1H, NH), 4,49 (br s, 1H, NH), 3,30 (q, J = 6,8 Hz, 2H, CH2-NH), 3,06 (q, J = 6,6 Hz, 2H, CH2-NH), 1,56 (p, J = 7,2 Hz, 2H, CH2-CH2-NH), 1,45 (p,J = 7,0 Hz, 2H, CH2-CH2-NH), 1,37 (m, 9H, CH3), 1,31 (m, 2H,CH2-CH2- CH2-NH).19F RMN (376,5 MHz, CDCl3): δ (ppm) -75,8.[000101] tert-butyl(5-(2,2,2-trifluoroacetamido)pentyl) carbamate (n = 5): 1H NMR (400 MHz, CDCl3): δ (ppm) 6.40 (br s, 1H, NH), 4.49 (br s, 1H, NH), 3.30 (q, J = 6.8 Hz, 2H, CH2-NH), 3.06 (q, J = 6.6 Hz, 2H, CH2-NH), 1.56 (p, J = 7.2 Hz, 2H, CH2-CH2-NH), 1.45 (p,J = 7.0 Hz, 2H, CH2-CH2-NH), 1.37 (m, 9H, CH3), 1.31 (m, 2H,CH2-CH2- CH2-NH).19F NMR (376.5 MHz, CDCl3): δ (ppm) -75.8.
[000102] terc-butil(2- (2,2,2- trifluoroacetamido)etil) carbamato (n = 2): 1H RMN (400MHz, CDCI3): δ (ppm) 7,72 (br s, 1H, NH), 4,86 (br s, 1H, NH), 3,39 (m, 2H, CH2-NH), 3,31 (m, 2H, CH2-NH), 1,38 (s,9H, CH3). 19F RMN (376,5 MHz, CDCl3): δ (ppm) -76,1.[000102] tert-butyl(2- (2,2,2-trifluoroacetamido)ethyl) carbamate (n = 2): 1H NMR (400MHz, CDCI3): δ (ppm) 7.72 (br s, 1H, NH), 4.86 (br s, 1H, NH), 3.39 (m, 2H, CH2-NH), 3.31 (m, 2H, CH2-NH), 1.38 (s,9H, CH3). 19F NMR (376.5 MHz, CDCl3): δ (ppm) -76.1.
[000103] terc-butil(2-(2,2,2-trifluoroacetamido)alquil) carbamato (44 mmol) foidissolvido em DCM anidro (40 mL) e ácido trifluoroacético (40 mL). A reação foi agitada à temperatura ambiente, aberta ao ar por 1 hora. Os voláteis foram removidos sob pressão reduzida. O resíduo foi dissolvido em água e extraído com 50 mL de DCM, depois a fase aquosa foi evaporada até à secura. O resíduo foi co-evaporado com 100 mL de etanol e 4x 100 mL de acetonitrila.[000103] tert-Butyl(2-(2,2,2-trifluoroacetamido)alkyl)carbamate (44 mmol) was dissolved in anhydrous DCM (40 mL) and trifluoroacetic acid (40 mL). The reaction was stirred at room temperature, open to air for 1 h. Volatiles were removed under reduced pressure. The residue was dissolved in water and extracted with 50 mL DCM, then the aqueous phase was evaporated to dryness. The residue was co-evaporated with 100 mL ethanol and 4x 100 mL acetonitrile.
[000104] N-(5-aminopentil)-2,2,2-trifluoroacetamida (n = 5): 1H RMN (400 MHz, d6-DMSO): δ (ppm) 9,44 (br s, 1H,NH), 7,75 (br s, 3H, NH), 3,17 (q, J = 6,7 Hz, 2H, CH2-NH),2,77 (m, 2H, CH2-NH), 1,57-1,45 (m, 4H, CH2-CH2-NH), 1,29(m, 2H, CH2-CH2- CH2-NH).19F RMN (376,5 MHz, d6-DMSO): δ(ppm) -74,4, -74,7.[000104] N-(5-aminopentyl)-2,2,2-trifluoroacetamide (n = 5): 1H NMR (400 MHz, d6-DMSO): δ (ppm) 9.44 (br s, 1H,NH), 7.75 (br s, 3H, NH), 3.17 (q, J = 6.7 Hz, 2H, CH2-NH),2.77 (m, 2H, CH2-NH), 1.57-1.45 (m, 4H, CH2-CH2-NH), 1.29(m, 2H, CH2-CH2-CH2-NH).
[000105] N-(2-aminoetil)-2,2,2-trifluoroacetamida (n = 2): 1H RMN (400 MHz, d6-DMSO): δ (ppm) 9,58 (br t, 1H,NHCO), 8,04 (br s, 3H, NH), 3,45 (m, 2H, CH2NHCO), 2,98 (m, 2H, CH2NH). 19F RMN (376,5 MHz, d6-DMSO): δ (ppm) -74,0, - 74,4.[000105] N-(2-aminoethyl)-2,2,2-trifluoroacetamide (n = 2): 1H NMR (400 MHz, d6-DMSO): δ (ppm) 9.58 (br t, 1H,NHCO), 8.04 (br s, 3H, NH), 3.45 (m, 2H, CH2NHCO), 2.98 (m, 2H, CH2NH). 19F NMR (376.5 MHz, d6-DMSO): δ (ppm) -74.0, - 74.4.
[000106] O desempenho de sequenciamento dos nucleotídeos de braços pendentes curto foi comparado contra o desempenho de nucleotídeos padrão em SBS, os nucleotídeos continham os mesmos grupos fluorescentes sobre um agente de ligação clivável padrão. Quatro nucleotídeos de braços pendentes curtos (dois As, C, T) marcados com fluoróforos adequados para o sequenciamento de SBS em 2 canais (Figura 3) e G escuro foram incluídos em uma solução compreendendo uma DNA polimerase e um tampão de incorporação, ambos usados em Hiseq® modificado de 2 canais ou Miseq® modificado de 2 canais para sequenciar em duas leituras de 150 ciclos cada. As métricas de sequenciamento (por exemplo, faseamento, pré-faseamento, taxa de erro % e Q30 %) foram comparadas entre experimentos realizados usando todos os quatro nucleotídeos de braços pendentes curtos ou todos os nucleotídeos padrão, nas mesmas condições (por exemplo, temperatura de incorporação, tempo de incorporação, polimerase, biblioteca de molde). Os resultados são mostrados nas Figuras de 4A a 4C e Figuras 5A e 5B.[000106] The sequencing performance of short overhanging arm nucleotides was compared against the performance of standard nucleotides in SBS, the nucleotides containing the same fluorescent groups on a standard cleavable linker. Four short overhanging arm nucleotides (two As, C, T) labeled with fluorophores suitable for 2-channel SBS sequencing (Figure 3) and dark G were included in a solution comprising a DNA polymerase and an incorporation buffer, both used in a 2-channel modified Hiseq® or 2-channel modified Miseq® to sequence in two reads of 150 cycles each. Sequencing metrics (e.g., phasing, pre-phasing, % error rate, and Q30%) were compared between experiments performed using all four short overhang arm nucleotides or all standard nucleotides, under the same conditions (e.g., incorporation temperature, incorporation time, polymerase, template library). Results are shown in Figures 4A–4C and Figures 5A and 5B.
[000107] As Figuras de 4A a 4C demonstram um exemplo das métricas de sequenciamento (faseamento, pré-faseamento, taxa de erro %, Q30 %) observadas com o nucleotídeo padrão e o nucleotídeo de braço pendente curto em um Hiseq® modificado de 2 canais, usando temperatura de incorporação igual a 50°C e tempo de incorporação igual a 10 segundos, com duas polimerases diferentes (PolA e PolB) e duas bibliotecas de moldes diferentes (PhiX e humano). Quando os nucleotídeos de braços pendentes curtos foram utilizados, observou-se uma redução no feaseamento e na taxa de erro %, e um aumento de Q30 %, independentemente da polimerase ou molde utilizado.[000107] Figures 4A-4C demonstrate an example of the sequencing metrics (phasing, pre-phasing, % error rate, Q30%) observed with the standard nucleotide and the short overhang nucleotide on a modified 2-channel Hiseq®, using an embedding temperature of 50°C and an embedding time of 10 seconds, with two different polymerases (PolA and PolB) and two different template libraries (PhiX and human). When the short overhang nucleotides were used, a reduction in phasing and % error rate, and an increase in Q30%, were observed, regardless of the polymerase or template used.
[000108] As Figuras 5A e 5B demonstram um exemplo de métricas de sequenciamento (faseamento e taxa de erro %) observadas com nucleotídeo padrão ou nucleotídeo de braço pendente curto em um Miseq® modificado de 2 canais com temperatura de incorporação igual a 60°C, em um molde PhiX, permitindo tempos de incorporação diferentes.[000108] Figures 5A and 5B demonstrate an example of sequencing metrics (phasing and error rate %) observed with standard nucleotide or short overhang nucleotide in a modified 2-channel Miseq® with embedding temperature equal to 60°C, in a PhiX template, allowing different embedding times.
[000109] Os nucleotídeos de braços pendentes curtos permitiram uma redução aproximada de 50% no que tange o tempo de incorporação sem um impacto significativo sobre a taxa de erro percentual. No menor tempo de incorporação testado (10 + 5s), a taxa de erro percentual ainda era <1%, em comparação a taxa de erro de 2,5% com os nucleotídeos padrão.FIGURASFigura 1 Figura 2Figura 3Figuras 4A - 4CFigura 5A Figura 5B [000109] The short overhanging arm nucleotides allowed an approximate 50% reduction in incorporation time without a significant impact on the percent error rate. At the shortest incorporation time tested (10 + 5 s), the percent error rate was still <1%, compared to an error rate of 2.5% with the standard nucleotides.FIGURESFigure 1 Figure 2 Figure 3 Figures 4A - 4C Figure 5A Figure 5B
Claims (25)
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| GBGB1711219.4A GB201711219D0 (en) | 2017-07-12 | 2017-07-12 | Short pendant arm linkers for nucleotides in sequencing applications |
| GB1711219.4 | 2017-07-12 | ||
| PCT/EP2018/069030 WO2019012080A1 (en) | 2017-07-12 | 2018-07-12 | Short pendant arm linkers for nucleotides in sequencing applications |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| BR112019027614A2 BR112019027614A2 (en) | 2020-07-07 |
| BR112019027614B1 true BR112019027614B1 (en) | 2025-04-15 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11981955B2 (en) | Polymethine compounds and their use as fluorescent labels | |
| JP6514364B2 (en) | Polymethine compounds having long Stokes shift and their use as fluorescent labels | |
| US12071662B2 (en) | Short pendant arm linkers for nucleotides in sequencing applications | |
| CA2902982C (en) | Polymethine compounds and their use as fluorescent labels | |
| US9156987B2 (en) | Polymethine compounds and their use as fluorescent labels | |
| ES2702662T3 (en) | Polymethine compounds and their use as fluorescent labels | |
| CN115996937A (en) | Alkylpyridinium cationic coumarin dyes and use in sequencing applications | |
| BR112019027614B1 (en) | SHORT DANGLING ARM BINDERS TO NUCLEOTIDES IN SEQUENCING APPLICATIONS | |
| NZ759350B2 (en) | Short pendant arm linkers for nucleotides in sequencing applications |