CZ392697A3 - Oligonukleotidové značky pro stanovení druhu a identifikaci - Google Patents
Oligonukleotidové značky pro stanovení druhu a identifikaci Download PDFInfo
- Publication number
- CZ392697A3 CZ392697A3 CZ973926A CZ392697A CZ392697A3 CZ 392697 A3 CZ392697 A3 CZ 392697A3 CZ 973926 A CZ973926 A CZ 973926A CZ 392697 A CZ392697 A CZ 392697A CZ 392697 A3 CZ392697 A3 CZ 392697A3
- Authority
- CZ
- Czechia
- Prior art keywords
- oligonucleotide
- tags
- tag
- repertoire
- nucleotides
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01J—CHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
- B01J19/00—Chemical, physical or physico-chemical processes in general; Their relevant apparatus
- B01J19/0046—Sequential or parallel reactions, e.g. for the synthesis of polypeptides or polynucleotides; Apparatus and devices for combinatorial chemistry or for making molecular arrays
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6809—Methods for determination or identification of nucleic acids involving differential detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6834—Enzymatic or biochemical coupling of nucleic acids to a solid phase
- C12Q1/6837—Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B80/00—Linkers or spacers specially adapted for combinatorial chemistry or libraries, e.g. traceless linkers or safety-catch linkers
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01J—CHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
- B01J2219/00—Chemical, physical or physico-chemical processes in general; Their relevant apparatus
- B01J2219/00274—Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
- B01J2219/00277—Apparatus
- B01J2219/00497—Features relating to the solid phase supports
- B01J2219/005—Beads
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01J—CHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
- B01J2219/00—Chemical, physical or physico-chemical processes in general; Their relevant apparatus
- B01J2219/00274—Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
- B01J2219/00277—Apparatus
- B01J2219/0054—Means for coding or tagging the apparatus or the reagents
- B01J2219/00572—Chemical means
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01J—CHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
- B01J2219/00—Chemical, physical or physico-chemical processes in general; Their relevant apparatus
- B01J2219/00274—Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
- B01J2219/00583—Features relative to the processes being carried out
- B01J2219/00603—Making arrays on substantially continuous surfaces
- B01J2219/00605—Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01J—CHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
- B01J2219/00—Chemical, physical or physico-chemical processes in general; Their relevant apparatus
- B01J2219/00274—Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
- B01J2219/00583—Features relative to the processes being carried out
- B01J2219/00603—Making arrays on substantially continuous surfaces
- B01J2219/00605—Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
- B01J2219/0061—The surface being organic
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01J—CHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
- B01J2219/00—Chemical, physical or physico-chemical processes in general; Their relevant apparatus
- B01J2219/00274—Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
- B01J2219/00583—Features relative to the processes being carried out
- B01J2219/00603—Making arrays on substantially continuous surfaces
- B01J2219/00605—Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
- B01J2219/00612—Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports the surface being inorganic
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01J—CHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
- B01J2219/00—Chemical, physical or physico-chemical processes in general; Their relevant apparatus
- B01J2219/00274—Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
- B01J2219/00583—Features relative to the processes being carried out
- B01J2219/00603—Making arrays on substantially continuous surfaces
- B01J2219/00605—Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
- B01J2219/00623—Immobilisation or binding
- B01J2219/00626—Covalent
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01J—CHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
- B01J2219/00—Chemical, physical or physico-chemical processes in general; Their relevant apparatus
- B01J2219/00274—Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
- B01J2219/00583—Features relative to the processes being carried out
- B01J2219/00603—Making arrays on substantially continuous surfaces
- B01J2219/00605—Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
- B01J2219/00623—Immobilisation or binding
- B01J2219/0063—Other, e.g. van der Waals forces, hydrogen bonding
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01J—CHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
- B01J2219/00—Chemical, physical or physico-chemical processes in general; Their relevant apparatus
- B01J2219/00274—Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
- B01J2219/00583—Features relative to the processes being carried out
- B01J2219/00603—Making arrays on substantially continuous surfaces
- B01J2219/00605—Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
- B01J2219/00632—Introduction of reactive groups to the surface
- B01J2219/00637—Introduction of reactive groups to the surface by coating it with another layer
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01J—CHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
- B01J2219/00—Chemical, physical or physico-chemical processes in general; Their relevant apparatus
- B01J2219/00274—Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
- B01J2219/00583—Features relative to the processes being carried out
- B01J2219/00603—Making arrays on substantially continuous surfaces
- B01J2219/00639—Making arrays on substantially continuous surfaces the compounds being trapped in or bound to a porous medium
- B01J2219/00641—Making arrays on substantially continuous surfaces the compounds being trapped in or bound to a porous medium the porous medium being continuous, e.g. porous oxide substrates
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01J—CHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
- B01J2219/00—Chemical, physical or physico-chemical processes in general; Their relevant apparatus
- B01J2219/00274—Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
- B01J2219/00583—Features relative to the processes being carried out
- B01J2219/00603—Making arrays on substantially continuous surfaces
- B01J2219/00646—Making arrays on substantially continuous surfaces the compounds being bound to beads immobilised on the solid supports
- B01J2219/00648—Making arrays on substantially continuous surfaces the compounds being bound to beads immobilised on the solid supports by the use of solid beads
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01J—CHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
- B01J2219/00—Chemical, physical or physico-chemical processes in general; Their relevant apparatus
- B01J2219/00274—Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
- B01J2219/00583—Features relative to the processes being carried out
- B01J2219/00603—Making arrays on substantially continuous surfaces
- B01J2219/00659—Two-dimensional arrays
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01J—CHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
- B01J2219/00—Chemical, physical or physico-chemical processes in general; Their relevant apparatus
- B01J2219/00274—Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
- B01J2219/00718—Type of compounds synthesised
- B01J2219/0072—Organic compounds
- B01J2219/00722—Nucleotides
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B70/00—Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Plant Pathology (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Dc Digital Transmission (AREA)
- Transition And Organic Metals Composition Catalysts For Addition Polymerization (AREA)
Description
Oblast techniky
Tento vynález se obecně týká způsobů identifikace, stanovení druhů a/nebo sledování molekul, zejména polynukleotidů, pomocí oligonukleotidových značek a zvláště způsobu stanovení druhu a analýzy takových označkovaných polynukleotidů specifickou hybridizací značek s jejich komplementy.
Dosavadní stav techniky
Specifická hybridizace oligonukleotidů a jejich analogů je základním postupem užívaným v širokém rozsahu výzkumných lékařských a průmyslových aplikací včetně identifikace polynukleotidů ve vztahu k onemocněním při diagnostických vyšetřeních, screeningu klonů nových cílových polynukleotidů, identifikace specifických polynukleotidů ve skvrnách směsí polynukleotidů, amplifikace specifických cílových polynukleotidů, terapeutického blokování nesprávně exprimovaných genů, sekvenováni DNA a podobně, např. Sambrook a kol., Molecular Cloning: A Laboratory Manual, 2. vydání (Cold Spring Harbor Laboratory, New York, 1989), Keller a Manak, DNA Probes, 2. vydání (Stockton Press, New York, 1993), Milligan a kol., J. Med. Chem., 36, 1923-1937 (1993), Drmanac a kol., Science, 260, 1649-1652 (1993), Bains, J. DNA Sequencing and Mapping, 4, 143-150 (1993).
Byla též navržena specifická hybridizace jako metoda sledování, získávání a identifikace sloučenin označených oligonukleotidovými úseky (značkami). Například v multiplexním
- 2 • · • · e · ·· · • · · · ······ • · · ······ • · · ·· ······ ···· · • · · ··· · · · • · · ··· ·· · ··9 9 sekvenování DNA se užívá oligonukleotidové značkování pro identifikaci elektroforeticky separovaných pruhů na gelu, který obsahuje fragmenty DNA vytvořené v téže sekvenovací reakci. Tímto způsobem se fragmenty DNA z mnoha sekvenovacích reakcí oddělí na téže dráze gelu, který se poté zachytí různými pevnými materiály, na kterých se pásy fragmentů z jednotlivých sekvenovacích reakcí vizualizují oligonukleotidovými sondami, které specificky hybridizují s komplementárními značkami, Church a kol., Science, 240, 185-188 (1988). Byla též navržena podobná použití oligonukleotidových značek pro identifikaci výbušnin, potenciálních látek znečisťujících ovzduší, jako je ropa, a oběživ za účelem prevence a detekce padělků, jak přehledně zpracoval např. Dollinger, str. 265-274 v Mullis a kol., redaktoři, The Polymerase Chain Reaction (Birkhauser, Boston, 1994).
V nedávnějších pracích byly též navrženy systémy využívající oligonukleotidových značek jako prostředků manipulace a identifikace jednotlivých molekul v komplexních kombinatorických chemických knihovnách, například jako pomůcky při screeningu takových knihoven při vyhledávání kandidátů na léky, Brenner a Lerner, Proč. Nati. Acad. Sci., 89, 5381-5383 (1992), Alper. Science, 264, 1399-1401 (1994) a Needels a kol., Proč. Nati. Acad. Sci., 90, 10700-10704 (1993) .
Úspěšné uplatnění takových schémat značkování závisí do značné míry na úspěchu při dosahování specifické hybridizace mezi značkou a její komplementární sondou. To znamená, že je třeba minimalizovat falešně pozitivní a falešně negativní signály pro dosažení toho, aby oligonukleotidová značka úspěšně identifikovala určitou látku. Takové falešné signály naneštěstí nejsou neobvyklé, neboť volné energie párování baží a stakingu baží se v širokých mezích mění
- 3 v rámci nukleotidů v určité duplexní či triplexní struktuře. Například duplex skládající se z opakované sekvence deoxyadenosinu (A) a thymidinu (T) vázaného na jeho komplement může mít nižší stabilitu než duplex o stejné délce skládající se z opakované sekvence deoxyguanosinu (G) a deoxycytidinu (C) vázaného na parciálně komplementární cíl obsahující chybné párování. Proto, pokud by se některá žádaná sloučenina z velké kombinatorické chemické knihovny označila prvním z uvedených oligonukleotidů, byla by zde významná možnost, že by se za navržených podmínek hybridizace pro detekci přesně spárovaných duplexů bohatých na AT detekovaly nežádoucí sloučeniny značené oligonukleotidem bohatým na GC
- dokonce i v chybně spárovaném duplexu - spolu s přesně spárovanými duplexy skládajícími se ze značky bohaté na AT.
V systému molekulárního označování navrženém Brennerem a kol. (citováno výše) se podobný problém chybných hybridizací těsně příbuzných značek řešil použitím tak zvaného kódu comma-less, který zajišťuje, že určitá sonda, která je mimo rejstřík (nebo sonda s posunem čtecího rámečku) vzhledem ke své komplementární značce, by vedla k duplexu s alespoň jedním chybným spárováním pro každé ze svých pěti nebo více tříbázových slov nebo kodonů.
Dokonce i když jsou k dispozici činidla, jako je tetrametylamoniumchlorid, pro negaci bázově specifických stabilitních rozdílů oligonukleotidových duplexů, účinek takových činidel je často omezený a jejich přítomnost může být nekompatibilní s dalšími manipulacemi se zvolenými sloučeninami, nebo je může činit obtížnějšími, např. při amplifikaci polymerázovou řetězovou reakcí (PCR) nebo podobně.
Takové problémy učinily současné použití sond pro • · ·· · · · ·· ·· • · · · ··· · · · « ·· · · · · * ···· • · · · · · ···· · ··· · · ··· · · · · · » • · · · · · ·· · ·· ·· vícečetnou hybridizaci v analýze mnohotných či komplexních genetických míst, např. přes multiplexní PCR, reverzní blotování skrvny (reverse dot blotting) či podobně, velice obtížným. Následkem toho bylo podpořeno přímé sekvenování určitých míst, např. genů HLA, jako spolehlivá alternativa nepřímých metod využívajících specifické hybridizace pro identifikaci genotypů, např. Gyllensten a kol., Proč. Nati. Acad. Sci., 85, 7652-7656 (1988).
Schopnost třídit klonované a identicky označené fragmenty DNA na rozdílných pevných nosičích by umožnila takové sekvenování, zejména ve spojení se sekvenční metodologií, která není založena na použití gelu, aplikovatelnou současně pro mnoho paralelních vzorků.
Z hlediska toho, co bylo řečeno výše, by bylo užitečné mít k dispozici systém pro značkování založený na polynukleotidech, který by zajišťoval velký repertoár značek, avšak který by též minimalizoval výskyt falešně pozitivních a falešně negativních signálů bez potřeby užívat speciální činidla pro úpravu rozdílů párování a stakingu přírodních bází. Takový systém značkování by nacházel svá použití v mnoha oblastech včetně vytváření a užívání kombinačních chemických knihoven, mapování a sekvenování DNA ve velkém měřítku, genetické identifikace, lékařské diagnostiky a podobně.
Podstata vynálezu
Předmětem tohoto vynálezu je zajistit molekulární značkovací systém pro sledování, získávání a identifikaci sloučenin.
Dalším předmětem tohoto vynálezu je zajistit metodu • · · · · · · · · · · • · « ···· · · · · pro určení druhu identických molekul nebo podtříd molekul, zejména polynukleotidú na površích pevných materiálů specifickou hybridizací oligonukleotidových značek a jejich komplementů.
Dalším předmětem tohoto vynálezu je zajistit postup analýzy typů genové exprese v patolologických a normálních tkáních.
Dalším předmětem tohoto vynálezu je zajistit systém pro značkování a určování druhu mnoha tisíců fragmentů, zejména náhodně se překrývajících fragmentů cílového polynukleotidu pro současnou analýzu a/nebo sekvenování.
Dalším předmětem tohoto vynálezu je zajistit rychlý a spolehlivý způsob sekvenování cílových polynukleotidú majících délku v rozmezí několika set párů bází až několika desítek tisíc párů bází.
Dalším předmětem tohoto vynálezu je zajistit způsob pro snížení počtu jednotlivých stupňů přípravy matrice požadovaných v programech sekvenování ve velkém měřítku s použitím Sangerových sekvenovacích metod.
Tento vynález dosahuje tyto a další cíle zajišťováním metody a materiálů pro sledování identifikace a/nebo třídění skupin či subpopulací molekul s použitím oligonukleotidových značek. Důležitou vlastností tohoto vynálezu je, že oligonukleotidové značky jsou členy minimálně zkříženě hybridizujícího souboru oligonukleotidů. Sekvence oligonukleotidů takového souboru se liší od sekvencí každého dalšího členu téhož souboru nejméně o dva nukleotidy. Proto žádný člen takového souboru nemůže vytvářet duplex (nebo triplex) s komplementem jakéhokoliv jiného členu s méně než dvěma • φ • · · φ
chybnými spárováními. Komplementy oligonukleotidových značek dle tohoto vynálezu uváděné zde jako komplementy značky mohou zahrnovat přírodní nukleotidy nebo nepřírodní analogy nukleotidů. Komplementy značky jsou přednostně připojeny k pevným nosičům. Takové oligonukleotidové značky při použití s jejich odpovídajícími komplementy značky zajišťují prostředek pro zvýšení specifičnosti hybridizace pro třídění, sledování či značení molekul, zejména polynukleotidů.
Minimálně zkříženě hybridizující soubory oligonukleotidových značek a komplementů značek se mohou syntetizovat buď v kombinaci nebo jednotlivě v závislosti na velikosti žádaného souboru a stupni, do kterého se má zkřížená hybridizace minimalizovat (nebo vyjádřeno jiným způsobem do stupně, na který se má zvýšit specifičnost). Například se může minimálně zkříženě hybridizující soubor skládat ze souboru jednotlivě syntetizovaných 10-merních sekvencí, které se navzájem liší nejméně o 4 nukleotidy, přičemž takový soubor má maximální velikost 332 (při složení ze 3 druhů nukleotidů a výpočtech s použitím počítačového programu, jako je ukázáno v dodatku Ic). Alternativně se může též minimálně zkříženě hybridizující soubor oligonukleotidových značek skládat kombinačně z podjednotek, které jsou samy o sobě zvoleny z minimálně zkříženě hybridizujíčího souboru. Například určitý soubor minimálně křížově hybridizujících 12-merů lišících se navzájem nejméně o 3 nukleotidy se může syntetizovat shromážděním 3 podjednotek zvolených z určitého souboru minimálně křížově hybridizujících 4-merů, které se všechny liší navzájem o 3 nukleotidy. Takové začlenění poskytuje soubor o maximální velikosti 93 nebo-li 729 12-merů. Číslo 9 je počet oligonukleotidů uvedených v počítačovém programu podle dodatku Ia, který předpokládá, stejně jako u 10-merů, že se použijí pouze 3 ze 4 roz• · · • · · • · · · v · · · · · • · · ·· • ·
- 7 dílných typů nukleotidů. Soubor se popisuje jako maximální, jelikož počítačové programy dodatku Ia až lc zajišťují největší soubor pro daný vstup (např. délka, složení, rozdíl počtu nukleotidů mezi členy). Přídavné minimálně zkříženě hybridizující soubory se mohou vytvořit z podsouborů takto počítaných souborů.
Oligonukleotidové značky mohou být jednovláknové a mohou být navrženy pro specifickou hybridizaci na jednovláknové komplementy značek tvorbou duplexů nebo pro specifickou hybridizaci na dvouvláknové komplementy značek tvorbou triplexů. Oligonukleotidové značky mohou být též dvouvláknové a mohou být navrženy pro specifickou hybridizaci na jednovláknové komplementy značek tvorbou triplexů.
Při kombinatorické syntéze je nejvhodnější, aby oligonukleotidové označení podle vynálezu sestávalo z plurality podjednotek, kde se každá podjednotka skládá z určitého oligonukleotidu o délce 3 až 9 nukleotidů, přičemž se každá podjednotka zvolí ze stejného minimálně zkříženě hybridizujícího souboru. V takových začleněních závisí počet oligonukleotidových značek, které jsou k dispozici, na počtu podjednotek na jednu značku a na délce podjednotek. Počet je obecně mnohem menší než počet všech možných sekvencí délky značky, a byl by pro značku o délce n nukleotidů 4n.
V jednom aspektu tohoto vynálezu se používají komplementy oligonukleotidové značky připojené k pevnému nosiči pro třídění nukleotidů ze směsi polynukleotidů, kde každý obsahuje určitou značku. V tomto způsobu použití se komplementy oligonukleotidových značek syntetizují na povrchu pevného nosiče, jako je mikroskopická kulička nebo specifické umístění na dvojrozměrném (mřížkovém) uspořádání míst syntézy na jednotlivém nosiči, takže populace identických sekvencí se vytvářejí ve specifických oblastech. To znamená, že povrch každého nosiče v případě kuličky nebo každé oblasti v případě dvojrozměrného uspořádání se derivatizuje pouze jedním typem komplementu, který má danou sekvenci. Populace takových kuliček či oblastí obsahuje repertoár komplementů s rozdílnými sekvencemi. Při použití zde pro odvolání na oligonukleotidové značky a komplementy značek znamená termín repertoár soubor minimálně zkříženě hybridizující skupiny oligonukleotidů, který vytváří značky v daném začlenění odpovídajícího souboru komplementů značek.
Každý z polynukleotidů, které mají být tříděny, má připojenou oligonukleotidovou značku, takže různé polynukleotidy mají různé značky. Jak je vysvětleno úplnějším způsobem níže, tohoto stavu se dosahuje použitím repertoáru značek podstatně většího, než je populace polynukleotidů a užitím dostatečně malého vzorku označených polynukleotidů z celého souboru označených polynukleotidů. Po takovém odebrání vzorků, když jsou populace nosičů a polynukleotidů smíseny za podmínek, které umožňují specifickou hybridizaci oligonukleotidových značek s odpovídajícími komplementy, se identické polynukleotidy třídí na daných kuličkách či v daných oblastech. S vytříděnými populacemi polynukleotidů lze poté manipulovat na pevném nosiči pomocí mikrobiochemických metod.
Obecně zahrnuje postup podle tohoto vynálezu následující kroky: (a) připojení oligonukleotidové značky z repertoáru značek ke každé molekule v populaci molekul (i) takové, že v podstatě všechny rozdílné molekuly či rozdílné subpopulace molekul v populaci mají připojené odlišné oligo • · nukleotidové značky a (ii) takových, že každá oligonukleotidová značka z repertoáru se zvolí ze stejného minimálně zkříženě hybridizujíčího souboru; a (b) třídění molekul populace na jednom nebo více pevných nosičích specifickou hybridizací oligonukleotidových značek s jejich příslušnými komplementy připojenými k takovým nosičům.
Důležitým aspektem tohoto vynálezu je použití oligonukleotidových značek pro třídění polynukleotidů pro paralelní stanovení sekvence. Nejlépe se takové sekvenování provádí následujícími kroky: (a) vytvoření plurality fragmentů z cílového polynukleotidu, které pokrývají cílový polynukleotid; (b) připojení oligonukleotidové značky z repertoáru značek ke každému fragmentu této plurality (i) tak, že v podstatě všechny různé fragmenty mají připojené různé oligonukleotidové značky a (ii) tak, že každá oligonukleotidové značka z repertoáru je zvolena ze stejného minimálně zkříženě hybridizujíčího souboru; (c) tříděni fragmentů na jednom či více pevných nosičích specifickou hybridizací oligonukleotidových značek s jejich příslušnými komplementy připojenými k pevným nosičům; (d) stanovení nukleotidové sekvence podílu každého z fragmentů dané plurality, nejlépe metodou jednobázového sekvenování, jak je popsáno níže; (e) stanovení nukleotidové sekvence cílového polynukleotidu utříděním sekvencí fragmentu.
Jiným důležitým aspektem tohoto vynálezu je stanovení profilu nebo frekvenční distribuce genů exprimovaných v dané tkáni nebo daném typu buněk, kde každý takový gen je identifikován částí své sekvence. Nejlépe se taková frekvenční distribuce určí následujícím postupem: (a) vytvoření knihovny cDNA z populace molekul mRNA, kde každá molekula cDNA v knihovně cDNA má připojenou oligonukleotidovou značku • · • · (i) takovou, že v podstatě všechny různé molekuly cDNA mají připojené různé oligonukleotidové značky a (ii) takovou, že každá oligonukleotidová značka z repertoáru se zvolí ze stejného minimálně zkříženě hybridizujícího souboru; (b) vytřídění molekul cDNA specifickou hybridizací oligonukleotidových značek s jejich odpovídajícími komplementy připojenými k alespoň jednomu z pevných nosičů; (c) stanovení nukleotidové sekvence podílu každé z tříděných molekul cDNA; a (d) vytvoření frekvenční distribuce molekul mRNA z nukleotidových sekvencí podílů tříděných molekul cDNA.
Tento vynález překonává klíčový nedostatek současných metod označování či značení molekul pomocí oligonukleotidů: kódováním sekvencí značek v souladu s tímto vynálezem je stabilita jakéhokoliv chybně spárovaného duplexu či triplexu mezi označením a komplementem jiné značky mnohem nižší než je tomu v případě jakéhokoliv dokonale spárovaného duplexu mezi značkou a jejím vlastním komplementem. Tím se eliminuje problém nesprávného třídění následkem chybného spárování duplexů značek bohatých na GC, které jsou stabilnější než dokonale spárovaná označení bohatá na AT.
Při použití v kombinaci s pevnými nosiči, jako jsou mikroskopické kuličky, zajišťuje tento vynález pohotově automatizovaný systém pro manipulaci a třídění polynukleotidů, který je zejména užitečný v paralelních operacích ve velkém měřítku, jako je sekvenování DNA, při kterém se mnoho cílových polynukleotidů a mnoho segmentů cílového polynukleotidu sekvenuje a/nebo analyzuje současně.
Přehled obrázků na výkresech • ·
Obr. 1 ukazuje proudový diagram ilustrující obecný algoritmus pro vytvoření minimálně zkříženě hybridizujících souborů.
Obr. 2 ilustruje schematicky zařízení pro provádění paralelních operací, jako je polynukleotidové sekvenování podle tohoto vynálezu.
Obr. 3 ilustruje ztělesnění pro určování genotypu tříděním sond navázaných na pevný nosič.
Dále jsou definovány použité pojmy.
Komplement nebo komplement značky, jak se užívá zde v odkazu na oligonukleotidové značky, se vztahuje k oligonukleotidu, na který oligonukleotidová značka specificky hybridizuje pro vytvoření dokonale spárovaného duplexu či triplexu. V začlenění, kde specifická hybridizace vede k triplexu, může být oligonukleotidová značka zvolena bud’ jako dvouvláknová nebo jako jedno vláknová. Proto tam, kde jsou vytvářeny triplexy, je termín komplement míněn tak, že zahrnuje bud dvouvláknový komplement jednovláknové oligonukleotidové značky nebo jednovláknový komplement dvouvláknové oligonukleotidové značky.
Pojem oligonukleotid tak, jak se užívá zde, zahrnuje lineární oligomery přirozených či modifikovaných monomerů nebo spojení včetně deoxyribonukleosidú, ribonukleosidů, jejich anomerních forem, peptidových nukleových kyselin (PNAs) a podobně, schopných specifické vazby na určitý cílový polynukleotid způsobem pravidelného typu interakcí monomeru s monomerem, jako je Watson-Crickův typ párování bází, staking bází, Hoogsteenovo nebo reverzní Hoogsteenovo páro • · vání bází či podobně. Obvykle se monomery spojují fosfodiesterovými vazbami nebo jejich analogy s vytvořením oligonukleotidů o rozměrech od několika málo monomerních jednotek, např. 3-4, do několika desítek monomerních jednotek. Pokud bude určitý oligonukleotid reprezentován nějakou sekvencí písmen, jako je ATGCCTG, bude to znamenat, že nukleotidy jsou v pořadí 5 —>3 zleva doprava a že A” znamená deoxyadenosin, C znamená deoxycytidin, G znamená deoxyguanosin a T znamená thymidin, pokud není uvedeno jinak. Analogy fosfodiesterových spojení zahrnují fosforothioát, fosforodithioát, fosforanilidát, fosforamidát a podobně. Obvykle zahrnují oligonukleotidy podle tohoto vynálezu čtyři přirozené nukleotidy, avšak mohou též zahrnovat nepřirozené analogy nukleotidů. Pro toho, kdo má zkušenosti v oboru, je zřejmé, kdy se mohou použít oligonukleotidy mající přirozené či nepřirozené nukleotidy, např. při zpracování enzymů jsou obvykle požadovány oligonukleotidy skládající se z přirozených nukleotidů.
Dokonale spárované ve vztahu k duplexu znamená, že póly- nebo oligonukleotidové vlákna tvořící duplex vytvářejí dvouvláknovou strukturu spolu navzájem tak, že každý nukleotid v každém vláknu se podrobí Watsonovu-Crickovu párování bází s určitým nukleotidem v druhém vláknu. Tento termín též zahrnuje párování nukleosidových analogů, jako je deoxyinosin, nukleosidy s 2-aminopurinovými bázemi a podobně, které lze užít. Při odkazu na triplex tento termín znamená, že se tento triplex skládá z dokonale spárovaného duplexu a třetího vlákna, ve kterém se každý nukleotid podrobí Hoogsteenově nebo reverzní Hoogsteenově asociaci se základním párem dokonale spárovaného duplexu. Opačně chybné (nedokonalé) spárování v duplexu mezi značkou a některým oligonukleotidem znamená, že jeden pár nebo triplet nukleotidů v duplexu nebo triplexu selhal pří podrobení se Watsonově-Crickovu a/nebo
Hoogsteenovu a/nebo reverznímu Hoogsteenovu spojování.
Pojem nukleosid, jak se zde užívá, zahrnuje přirozené nukleosidy včetně 2 -deoxy a 2 -hydroxylových forem, např. jak je popsáno v Kornberg a Baker, DNA Replication, 2. vydání (Freeman, San Francisco, 1992). Analogy v odkazu na nukleosidy zahrnují syntetické nukleosidy mající modifikované zbytky bází a/nebo modifikované zbytky cukru, popsané např. Scheitem, Nucleotide Analogs (John Wiley, New York, 1980), Uhlman a Peyman, Chemical Reviews, 90, 543-584 (1990) nebo podobně, s jedinou výhradou, že jsou schopny specifické hybridizace. Takové analogy zahrnují syntetické nukleosidy navržené pro zvýšení schopnosti vazby, snížení komplexity, zvýšení specifičnosti a podobně.
Stanovení sekvence, jak se užívá zde nebo stanovení nukleotidové sekvence ve vztahu k polynukleotidům, zahrnuje stanovení částečné jakož i úplné informace o sekvenci polynukleotidú. To znamená, že tento termín zahrnuje sekvenční srovnávání, otisky prstů (fingerprinting) a podobné hladiny informací o cílovém polynukleotidú stejně tak jako výslovnou identifikaci a uspořádání nukleosidů, obvykle každého nukleosidu, v cílovém nukleotidu. Tento termín též zahrnuje stanovení identifikace, uspořádání a umístění jednoho, dvou nebo tří ze čtyř typů nukleotidů v rámci cílového polynukleotidú. Například v určitých začleněních se může stanovení sekvence uplatnit identifikací pořadí a umístěním jednotlivého typu nukleotidu, např. cytosinů, v rámci cílového polynukleotidú CATCGC takže jeho sekvence je vyjádřena jako binární kód, např. 100101 ... pro C-(nikoliv C)-(nikoliv C)-C-(nikoliv C)-C ... a podobně.
Termín komplexita tak, jak se užívá zde v odkazu na populaci polynukleotidů, znamená počet různých druhů molekul přítomných v této populaci.
Dále bude uveden podrobný popis tohoto vynálezu.
Tento vynález poskytuje metodu značení a třídění molekul, zejména polynukleotidů, s použitím značek oligonukleotidů. Značky oligonukleotidů podle vynálezu patří k minimálně zkříženě hybridizujícím souborům oligonukleotidů. Proto sekvence jakýchkoliv dvou oligonukleotidových značek repertoáru nebude nikdy těsnější než s rozdílem o dva nukleotidy. V konkrétních začleněních mohou být sekvence jakýchkoliv dvou oligonukleotidových značek repertoáru dokonce vzdálenější například navržením minimálně zkříženě hybridizujícího souboru takového, že oligonukleotidy nemohou vytvářet duplex nebo triplex s komplementem jiného členu téhož souboru s méně než 3 chybně spárovanými nukleotidy, atd. V takových začleněních se dosahuje vyšší specifičnosti, avšak celkový repertoár označení je menší. Proto, je pro označení dané délky třeba zvažovat mezi stupněm žádané specifičnosti a velkostí žádaného repertoáru. Tento vynález je zvláště užitečný při značení a třídění polynukleotidů pro paralelní operace, jako je sekvenování, otisky prstů nebo další typy analýzy.
Oligonukleotidové značky a komplementy značek
Nukleotidové sekvence oligonukleotidů minimálně zkříženě hybridizujícího souboru se konvenčně počítají jednoduchými počítačovými programy podle obecného algoritmu,
·· φ· • tototo • ·9 •to · • toto ·· 9 • to· * · ·» • to · · · ·t který je zobrazen na obr. 3 a doložen příkladem programů, jejichž strojové kódy jsou uvedeny v dodatcích Ia a Ib. Program minhx dodatku Ia počítá všechny minimálně zkříženě hybridizující soubory mající 4-merové podjednotky složené ze tří typů nukleotidů. Program tagN dodatku Ib vypočítává delší oligonukleotidy minimálně zkříženě hybridizujíčího souboru. Podobné algoritmy a počítačové programy se snadno přepíší pro poskytnutí seznamu oligonukleotidů minimálně zkříženě hybridizujících souborů pro jakýkoliv způsob provedení dle tohoto vynálezu. Tabulka 1 uvedená níže zajišťuje vodítko, pokud jde o velikosti souborů minimálně zkříženě hybridizujících oligonukleotidů pro udané délky a hodnoty nukleotidových diferencí. Výše uvedené počítačové programy byly užity pro generování počtů.
Tabulka 1
Délka | Nukleo- | Maximální | Velikost | Velikost |
slova | tidová | velikot | repertoáru | reperto- |
oligo- | diferen- | minimálně | se čtyřmi | áru s |
nukleotidu | ce mezi | zkříženě | slovy | pěti |
oligo- | hybridizu- | slovy | ||
nukleo- | jícího | |||
tidy minimálně zkří- | souboru | |||
ženě hybridizujícího souboru | ||||
4 | 3 | 9 | 6561 | 5,90xl04 |
6 | 3 | 27 | 5,3xl03 | 1,43x10 |
7 | 4 | 27 | 5,3xl03 | 1,43x10 |
7 | 5 | 8 | 4096 | 3,28xl04 |
8 | 3 | 190 | l,30xl09 | 2,48x1ο11 |
8 | 4 | 62 | 1,48X10 | 9,16X1O8 |
8 | 5 | 18 | 1,O5X1O3 | 1,89X1O6 |
9 | 5 | 39 | 2,31X106 | 9,02x10 |
10 | 5 | 332 | l,21X1010 | |
10 | 6 | 28 | 6,15xl03 | 1,72X10 |
11 | 5 | 187 | ||
18 | 6 | «25000 | ||
18 | 12 | 24 |
Pro některá ztělesnění (tj. případy použití) vynálezu, kde nejsou požadovány mimořádně velké repertoáry značek, lze oddělené syntetizovat oligonukleotidové značky minimálně zkříženě hybridizujícího souboru. Soubory obsahující několik stovek až několik tisíc nebo dokonce několik desítek tisíc oligonukleotidů se mohou syntetizovat přímo řadou přístupů paralelní syntézy, např. jak uveřejnili Frank a kol., US patent č. 4 689 405, Frank a kol., Nucleic ♦ 9
Acids Research, 11, 4365-4377 (1983), Matson a kol., Anal. Biochem., 224, 110-116 (1995), Fodor a kol., mezinárodní patentová přihláška PCT US93/04145, Pease a kol., Proč. Nati. Acad. Sci., 91, 5022-5026 (1994), Southern a kol., J. Biotechnology, 35, 217-227 (1994), Brennan, mezinárodní patentová přihláška PCT/US94/05896, Lashkari a kol., Proč. Nati. Acad. Sci., 92, 7912-7915 (1995) a podobně.
Je nejvhodnější, když se značky nukleotidů podle tohoto vynálezu syntetizují kombinatoricky z podjednotek o délce mezi třemi a šesti nukleotidy a vyberou ze stejného minimálně zkříženě hybridizujícího souboru. Pro oligonukleotidy v tomto rozmezí se mohou složky takových souborů vypočítávat počítačovým programem na základě algoritmu uvedeného na obr.
3.
Algoritmus dle obr. 3 se provádí nejprve definováním charakteristik podjednotek minimálně zkříženě hybridizujícího souboru, to jest délky, hodnoty diferencí bází mezi členy a složení, například tak, že se skládají ze dvou, tří nebo čtyř typů bází. Generuje se tabulka n=l (100), která se skládá ze všech možných sekvencí dané délky a složení. Počáteční pod jednotka S-|_ se zvolí a srovnává (120) s po sobě následujícími podjednotkami S^ pro i=n+l až do konce tabulky. Když má následná podjednotka požadovaný počet chybných spárování k tomu, aby byla členem minimálně zkříženě hybridizujícího souboru, uloží se do nové tabulky Mn+1 (125), která rovněž obsahuje dříve zvolené podjednotky v předchozích průchodech krokem 120. Například v prvním souboru srovnávání bude M2 obsahovat S-^; v druhém souboru srovnávání bude M3 obsahovat S-l a S2; ve třetím souboru srovnávání bude M4 obsahovat Sj, S2 a S, atd. Podobně se srovnávání v tabulce Mj provedou mezi Sj a všemi následnými • · podjednotkami v Mj. Povšimněte si, že každá následná tabulka Mn+1 je menší než předchozí, neboť v následných průchodech krokem 130 se podjednotky eliminují. Po srovnání každé podjednotky tabulky Mn (140) se stará tabulka nahradí novou tabulkou Mn+1 a začne další kolo srovnávání. Postup se zastaví (160), když se dosáhne tabulky Mn, která neobsahuje žádné následné podjednotky pro srovnání se zvolenou podjednotkou Sx, to jest Mn=Mn+1.
Je nejvhodnější, zahrnují-li minimálně zkříženě hybridizující soubory podjednotky, přinášející zhruba ekvivalentní příspěvky k duplexní stabilitě jako každá jiná podjednotka v souboru. Tímto způsobem je stabilita dokonale spárovaných duplexů mezi každou podjednotkou a jeho komplementem zhruba stejná. Vodítko pro volbu takových souborů je zajištěno publikovanými metodami pro volbu optimálních primerů PCR a výpočet duplexních stabilit, např. Rychlík a kol., Nucleic Acids Research, 17, 8543-8551 (1989) a 18, 6409-6412 (1990), Breslauer a kol., Proč. Nati. Acad. Sci., 83, 3746-3750 (1986), Wetmur, Crit. Rev. Biochem. Mol.
Biol., 26.,227-259 (1991) a podobně. Pro kratší značky, např. okolo 30 nukleotidů nebo méně, je nejvhodnější algoritmus popsaný Rychlíkem a Wetmurem a pro delší značky, např. okolo 30 až 35 nukleotidů nebo více, je možno vhodným způsobem použít algoritmus uveřejněný Suggsem a kol. str. 683-693 v Brown, redaktor, ICN-UCLA Symp. Dev. Biol., sv. 23 (Academie
Press, New York, 1981). Je zřejmé, že pro toho, kdo má zkušenosti v oboru pro navrhování souborů minimálně zkříženě hybridizujících podjednotek v rámci tohoto vynálezu, jsou k dispozici četné přístupy. Například pro minimalizaci nepříznivého vlivu různých energií stakingu bází terminálních nukleotidů při shromažďování podjednotek je možno zajistit podjednotky tak, aby měly stejné terminální nukleotidy.
Tímto způsobem bude při spojování podjednotek součet energií stakingu bází všech připojených terminálních nukleotidů stejný, čímž se snižuje či eliminuje variabilita teplot tání značek.
Slovo terminálních nukleotidů, které je uvedeno níže kurzívou, se může též přidat na konec každé značky tak, aby bylo vždy vytvořeno dokonalé párování mezi ním a podobným terminálním slovem ne některém jiném komplementu značky. Taková rozšířená značka by byla ve formě:
¥ WT W2 ¥ Wx W2 Wk-1 Wk Wk-1 Wk kde prvotní W značí komplementy. S konci značek, které tvoří vždy dokonale spárované duplexy, budou všechna chybně spárovaná slova vnitřními chybnými spárováními, čímž se snižuje stabilita duplexů značka-komplement, které by jinak měla chybně spárovaná slova na svých koncích. Je dobře známo, že duplexy s vnitřním chybným spárováním jsou významně méně stabilní než duplexy se stejným chybným spárováním na konci.
Nejvhodnějším provedením minimálně zkříženě hybridizujících souborů jsou takové soubory, jejichž podjednotky jsou představovány třemi nebo čtyřmi přirozenými nukleotidy. Jak bude níže diskutováno úplněji, nepřítomnost jednoho typu nukleotidů v oligonukleotidových značkách umožňuje, aby byly cílové polynukleotidy dodávány na pevné nosiče s použitím 5 —>3 exonukleázové aktivity DNA polymerázy. Následuje příklad minimálně zkříženě hybridizujícího souboru podjedno20 • · ·· · · 4 99·· • ♦ · · · 4 44··· • · 4 · · · 4 « ··· • · · f · · 4444 4 444 44
4 4 4 9 · 4 ·4 ······ 44 4 4444 tek, kde každá zahrnuje 4 nukleotidy zvolené ze skupiny skládající se z A, G a T:
Tabulka 2
Slovo: Sekvence: | W1 GATT | w2 TGAT | W3 TAGA | w4 TTTG |
Slovo: Sekvence: | Wg GTAA | w6 AGTA | w7 ATGT | w8 AAAG |
V tomto souboru by každá složka tvořila duplex mající tři chybně spárované báze s komplementem každé další složky.
Další příklady minimálně zkřížené hybridizujících souborů jsou uvedeny níže v tabulce 3. Je zřejmé, že přídavné soubory mohou být generovány substitucí různých skupin nukleotidů nebo použitím podsouborů známých minimálně zkříženě hybridizujících souborů.
Tabulka 3
Příklady minimálně zkříženě hybridizující soubory 4-merních podj ednotek
Set 1 | Set 2 | Set 3 | Set 4 | Set 5 | Set 6 |
CATT | ACCC | AAAC | AAAG | AACA | AACG |
CTAA | AGGG | ACCA | ACCA | ACAC | ACAA |
TCAT | CACG | AGGG | AGGC | AGGG | AGGC |
ACTA | CCGA | CACG | CACC | CAAG | CAAC |
TACA | CGAC | CCGC | CCGG | CCGC | CCGG |
TTTC | GAGC | CGAA | CGAA | CGCA | CGCA |
ATCT | GCAG | GAGA | GAGA | GAGA | GAGA |
.AAAC | GGCA | GCAG | GCAC | GCCG | GCCC |
AAAA | GGCC | GGCG | GGAC | GGAG | |
Set-7 | Set 8 | Set 9 | Set 10 | Set 11 | Set 12 |
AAGA | AAGC | AAGG | ACAG | ACCG | ACGA |
ACAC | ACAA | ACAA | AACA | AAAA | AAAC |
AGCG | AGCG | AGCC | AGGC | AGGC | AGCG |
CAAG | CAAG | CAAC | CAAC | CACC | CACA |
CCCA | CCCC | CCCG | CCGA | CCGA ' | CCAG |
CGGC | CGGA | CGGA | CGCG | CGAG | LuksC |
GACC | GACA | GACA | ksAGG | GAGG | GAGG |
GCGG | GCGG | GCGC | GCCC | GCAC | |
GGAA | GGAC | GGAG | * a | GGCA | GGAA |
Oligonukleotidové značky podle tohoto vynálezu a jejich
9 9
9 9
99 99
9 9
9 « komplementy mohou být vhodným způsobem syntetizovány na automatizovaném syntetizátoru DNA, např. Applied Biosystems, lne. (Foster City, Kalifornie) model 392 nebo 394 syntetizátoru DNA/RNA s použitím standardních chemických prostředků, jako je fosforamidit, jako je např. uveřejněno v následujících citacích: Beaucage a Iyer, Tetrahedron. 48, 2223-2311 (1992), Molko a kol., US patent č. 4 980 460, Koster a kol., US patent č. 4 725 677, Caruthers a kol., US patenty č.
415 732, 4 458 066 a 4 973 679 a podobně. Lze též použít alternativní chemické prostředky, které jsou například výsledkem nepřirozených skupin hlavního řetězce, jako např. fosforothioát, fosforamidát a podobně s tím, že výsledné oligonukleotidy jsou schopné specifické hybridizace.
V některých konkrétních formách mohou značky zahrnovat přirozeně se vyskytující nukleotidy, které umožňují zpracování či manipulaci pomocí enzymů, zatímco odpovídající komplementy značek mohou zahrnovat nepřirozené nukleotidové analogy, jako jsou peptidové nukleové kyseliny nebo jako sloučeniny, které napomáhají k vytvoření stabilnějších duplexů během třídění.
Když jsou jako nosiče použity mikročástice, mohou se repertoáry oligonukleotidových značek a komplementů značek vytvářet způsobem syntézy podjednotek pomocí metod split and mix, např. jak je publikováno v Shortle a kol., mezinárodní patentová přihláška PCT/US93/03418 nebo Lyttle a kol., Biotechniques, 19, 274-280 (1995). Stručně řečeno, základní jednotkou syntézy je podjednotka oligonukleotidové značky. Nejlépe je použít fosforamiditu a připravit 3'-fosforamiditové oligonukleotidy pro každou podjednotku v minimálně
- 22 zkříženě hybridizujícím souboru, např. pro první ze souborů uvedených výše by existovalo osm 4-merních 3'-fosforamiditů. Syntéza postupuje tak, jak ji uveřejnil Shortle a kol. nebo v přímé analogii s metodami použitými k vytvoření různých knihoven oligonukleotidů s pomocí nukleosidových monomerů, např. jak je uveřejněno v Telenius a kol., Genomics, 13, 718-725 (1992), Welsh a kol., Nucleic Acids Research, 19. 5275-5279 (1991), Grothues a kol., Nucleic Acids Reseach, 21, 1321-1322 (1993), Hartley, evropská patentová přihláška č. 90304496.4, Lam a kol., Nátuře, 354, 82-84 (1991), Zuckerman a kol., Int. J. Pept. Protein Research, 40. 498-507 (1992) a podobně. Obecně tyto metody jednoduše vyžadují použití směsí aktivovaných monomerů pro rostoucí oligonukleotid během kroků spojování. Nejvhodnější je syntetizovat oligonukleotidové značky a komplementy značek na syntetizátoru DNA, který má počet syntetických komor větší než nebo rovnající se počtu různých typů slov užitých ve vytvoření značek. To znamená, že je nej lepší, jestliže existuje syntetická komora odpovídající každému typu slova. V tomto způsobu použití se slova přidávají po jednotlivých nukleotidech, takže kdyby se slovo skládalo z pěti nukleotidů, je v každé syntetické komoře pět monomerních spojení. Po úplném syntetizování slova se nosiče syntézy odstraní z komor, smísí a znovu umístí do komor pro další cyklus přidávání slov. Tento druhý způsob provedení využívá vysokých výtěžků spojování při adici monomeru, např. v fosforamiditových chemických systémech.
Dvouvláknové formy značek se mohou připravit oddělenou syntézou komplementárních vláken následovanou míšením za podmínek umožňujících vytvoření duplexu. Alternativně se mohou dvouvláknové značky vytvořit tak, že se nejprve syntetizuje jednovláknový repertoár spřažený se známou oligo• · • · · · · nukleotidovou sekvencí, která slouží jako vazebné místo priméru (matrice). Druhé vlákno se poté syntetizuje kombinací jednovláknového repertoáru s matricí a rozšířením pomocí polymerázy. Tento druhý přístup je popsán v Oliphant a kol., Gene, 44, 177-183 (1986). Takové duplexní značky mohou být potom vloženy do klonovacích vektorů spolu s cílovými polynukleotidy pro třídění a manipulaci cílového polynukleotidů v souladu s tímto vynálezem.
Když se použijí komplementy značek, které jsou připraveny z nukleotidů majících zvýšené charakteristiky vazby, jako jsou PNA nebo oligonukleotid N3 —>P5 fosforamidáty, může se třídění provést vytvářením smyček D mezi značkami zahrnujícími přirozené nukleotidy a jejich PNA nebo fosforamidátovými komplementy jako alternativa stripping reakce s použitím 3 —>5 exonukleásové aktivity DNA polymerázy, aby byla značka učiněna jednovláknovou.
Oligonukleotidové značky podle vynálezu se mohou pohybovat v rozmezí délky od 12 do 60 nukleotidů nebo párů bází. Nejvhodnější rozmezí délek oligonukleotidu je od 18 do 40 nukleotidů nebo párů bází. Ještě vhodnější je, když je rozmezí délek značení oligonukleotidů od 25 do 40 nukleotidů nebo párů bází. Ve smyslu preferovaných a více preferovaných počtů podjednotek je možno tato rozmezí vyjádřit následujícím způsobem:
Tabulka 4
Počty podjednotek ve značkách při preferovaných ztělesněních
Monomerů Nukleotidů v oligonukleotidové v podjed- značce
notce | (12-60) | (18-40) | (25-40) | |
3 | 4-20 | podj edn. | 6-13 podjedn. | 8-13 podjedn. |
4 | 3-15 | podj edn. | 4-10 podjedn. | 6-10 podjedn. |
5 | 2-12 | podjedn. | 3-8 podjedn. | 5-8 podjedn. |
6 | 2-10 | podjedn. | 3-6 podjedn. | 4-6 podjedn. |
Nejvhodnější je, když jsou oligonukleotidové značky jednovláknové a specifická hybridizace nastává prostřednictvím Watsonova-Crickova párování s komplementem značky.
Je vhodné, aby repertoáry jednovláknových oligonukleotidových značek podle tohoto vynálezu obsahovaly nejméně 100 složek. Ještě vhodnější jsou repertoáry takových značek obsahující nejméně 1000 složek. A nejvhodnější jsou repertoáry takových značek obsahující alespoň 10 000 členů.
Triplexní značky
Ve způsobech použití, ve kterých nastává specifická hybridizace přes vytvoření triplexu, sleduje kódování sekvencí značek stejné principy jako při značkách tvořících duplex. Avšak existují další omezení volby sekvencí podjednotek. Obecně je asociace třetího vlákna prostřednictvím Hoogsteenova typu vazby nejstabilnější podél homopyrimi• · • · • · · ·<···· ··· dinových-homopurinových drah v dvouvláknovém cíli. Obvykle vytvářejí triplety bází motivy T-A*T nebo C-G*C (kde znamenají Watsonovo-Crickovo párování a znamenají Hoogsteenův typ vazby); avšak jiné motivy jsou rovněž možné. Například Hoogsteenovo párování bází umožňuje paralelní a antiparalelní orientace mezi třetím vláknem (Hoogsteenovo vlákno) a vláknem bohatým na purin duplexu, ke kterému se váže třetí vlákno v závislosti na podmínkách a složení vláken. V literatuře existují rozsáhlá vodítka pro volbu příslušných sekvencí, orientace, podmínek, typu nukleosidu (např. zda se použijí nukleosidy s ribózou či deoxyribózou), modifikací bází (např. metylovaný cytosin a podobně) pro maximalizaci nebo jinou regulaci triplexní stability, jak je žádáno v konkrétních způsobech použití, např. Roberts a kol., Proč. Nati. Acad. Sci., 88, 9397-9401 (1991), Roberts a kol., Science, 258, 1463-1466 (1992), Roberts a kol., Proč. Nati. Acad. Sci., 93, 4320-4325 (1996),
Distefano a kol., Proč. Nati. Acad. Sci., 90, 1179-1183 (1993 ), Mergny a kol., Biochemistry, 30., 9791-9798 (1991), Cheng a kol., J. Am. Chem. Soc., 114, 4465-4474 (1992), Beal a Dervan, Nucleic Acid Research, 20, 2773-2776 (1992), Beal a Dervan, J. Am. Chem. Soc., 114, 4976-4982 (1992),
Giovannangeli a kol., Proč. Nati. Acad. Sci., 89, 8631-8635 (1992), Moser a Dervan, a kol., J. Biol. Chem.,
Proč. Nati. Acad. Sci.,
Nucleic Acids Research,
Science, 238, 645-650 (1987), 267, 5712-5721 (1992), Yoon a (1992), Blume a (1992), Thuong
89, 3840-3844
20, 1777-1784
McShan kol., kol., a Helene, Angew. Chem. Int. Ed. Engl.
Escude a kol., Proč. Nati. Acad. Sci.
32, 666-690 (1993),
93, 4365-4369 (1996) a podobně. Podmínky pro anelování (asociaci) jedno vláknových nebo duplexních značek na jejich jednovláknové nebo duplexní komplementy jsou dobře známy - např. Ji a kol., Anal. Chem., 65, 1323-1328 (1993), Cantor a kol., • · · · ·
US patent č. 5 482 836 a podobně. Použití triplexních označení má tu výhodu, že nevyžaduje stripping reakci s polymerázou pro exponování značky za účelem jejího anelování na tento komplement.
Je vhodné, když oligonukleotidové značky podle vynálezu s použitím triplexní hybridizace jsou dvouvláknové DNA a odpovídající komplementy značky jsou jednovláknové. Ještě vhodnější je použít 5-metylcytosin namísto cytosinu v komplementech značky pro rozšíření rozmezí stability vůči pH vytvářeného triplexu mezi značkou a jejím komplementem. Přednostně používané podmínky pro vytvoření triplexů jsou plně publikovány ve výše uvedených odkazech. Stručně řečeno, hybridizace nastává v koncentrovaném roztoku soli, např. v roztoku chloridu sodného 1,0 mol/dm3, octanu draselného 1,0 mol/dm3 a podobně při pH pod 5,5 (nebo 6,5, jestliže se používá 5-metylcytosin). Teplota hybridizace závisí na délce a složení značky, avšak pro 18 až 20-merní značku je hybridizace při teplotě místnosti adekvátní. Promytí může být provedeno méně koncentrovanými roztoky solí, např. roztokem octanu sodného 10 mmol/dm3, chloridu hořečnatého 100 mmol/dm3, pH 5,8, při teplotě místnosti. Značky mohou být eluovány ze svých komplementů značek inkubací v podobném roztoku soli při pH 9,0.
Minimálně zkříženě hybridizující soubory oligonukleotidových značek, které vytvářejí komplexy, mohou být generovány počítačovým programem uvedeným v dodatku Ic nebo podobnými programy. Příklad souboru dvouvláknových 8-merních slov je uveden níže velkými písmeny s odpovídajícími komplementy malými písmeny. Každé takové slovo se liší od každého z ostatních slov v souboru třemi páry bází.
Tabulka 5
Příklad minimálně zkříženě hybridizujícího souboru dvouvláknových 8-merních označení
5'-AAGGAGAG 3'-TTCCTCTC 3'-ctcctctc | 5'-AAAGGGGA 3'-TTTCCCCT 3'-cttcccct | 5'-AGAGAAGA 3'-TCTCTTCT 3'-tctcttct | □' -AGGGGGGG 3'-TCCCCCCC 3'-tcoccccc |
5'-ΆΑΑΑΑΑΑΑ 3'-TTTTTTTT 3'-tttttttt | 5'-AAGAGAGA 3'-TTCTCTCT 3'-ttctctct | 5'-AGGAAAAG 3'-TCCTTTTC 3'-tcctcttc | 5'-GAAAGGAG 3'-CTTTCCTC 3'-c-ttcccc |
5'-AAAAAGGG 3<-TTTTTCCC 3'-tttttccc | 5'-AGAAGAGG 3'-TCTTCTCC 3'-tcttctcc | 5'-AGGAAGGA 3'-TCCTTCCT 3'-tCCCtCCt | 5' -GAAGAAGG 3'-CTTCTTCC |
J C. ~ W L. 1. ς. č . | |||
5'-AAAGGAAG 3'-TTTCCTTC 3'--ctcccztc | 5'-AGAAGGAA 3'-TCTTCCTT 3'-tcztcctt | 5'-AGGGGAAA 3'-TCCCCTTT 3'-tccccttt | c 7“GAAGAGAA 3'-CTTCTCTT 3'-czzczzzz |
• ·
Tabulka 6
Velikost repertoáru různých dvouvláknových značek, které vytvářejí triplexy se svými komplementy značek ·· · • ·
Délka- | Nukleo- | Maximální | Velikost | Velikost |
slova | tidová | velikot | repertoáru | reperto- |
oligonu- | diferen- | minimálně | se čtyřmi | áru s |
kleotidu | ce mezi | zkříženě | slovy | pěti |
oligo- | hybridizu- | slovy | ||
nukleo- | jícího | |||
tidy minimálně zkří- | souboru | |||
ženě hybridizujícího souboru | ||||
4 | 2 | 8 | 4096 | 3,2X1O4 |
6 | 3 | 8 | 4096 | 3,2xl04 |
8 | 3 | 16 | 6,5X1O4 | 1,05x10® |
10 | 5 | 8 | 4096 | |
15 | 5 | 92 | ||
20 | 6 | 765 | ||
20 | 8 | 92 | ||
20 | 10 | 22 |
Je vhodné, aby repertoáry dvouvláknových oligonukleotidových značek podle tohoto vynálezu obsahovaly nejméně 10 členů. Vhodnější je, obsahují-li repertoáry takových značek nejméně 100 členů. Jě vhodné, aby pro kombinatoricky syntetizované dvouvláknové oligonukleotidové značky byla použita slova o délce 4 až 8 nukleotidů a oligonukleotidové značky měly délku mezi 12 a 60 páry bází. Ještě vhodnější je, mají-li takové značky délku mezi 18 a 40 páry bází.
Pevné nosiče pro užití s tímto vynálezem mohou vyka-
• 9·· • · ·· • ♦ ·· • · · ·· • · · ·· ··
Pevné nosiče zovat široký rozsah forem včetně mikročástic, kuliček a membrán, sklíček, destiček, mikroobrobených úlomků a podobně. Podobně mohou pevné nosiče dle vynálezu zahrnovat široké rozmezí složení včetně skla, plastu, silikonu, zlata derivátizováného alkantiolátem, celulózy, zesilovaného a vysoce zesilovaného polystyrénu, silikagelu, polyamidu a podobně. Je vhodné použít populaci diskrétních částic tak, aby vytvořila jednotný povlak nebo populaci komplementárních sekvencí stejného označení (a nikoliv jiného) nebo se používají jednotlivé nosiče či malé množství nosičů s prostorově diskrétními oblastmi, kde každá obsahuje jednotný povlak nebo populaci komplementárních sekvencí stejného označení (a nikoliv jiného). Ve druhém způsobu použití se může rozsah oblastí měnit podle konkrétních aplikací. Obvykle je rozsah plochy oblastí od několika μπι2, např. od 3 až 5 do několika set μιη2, např. 100 až 500. Je vhodné, aby takové oblasti byly prostorově diskrétní tak, aby signály generované událostmi, např. fluorescenční emise v přilehlých oblastech, mohly být rozlišeny použitým detekčním systémem. V některých aplikacích mohou být požadovány oblasti s jednotnými povlaky více než jednoho komplementu značky, například pro současnou sekvenční analýzu nebo pro uvedení odděleně označených molekul do těsné blízkosti.
Komplementy značek mohou být použity s pevným nosičem, na kterém jsou syntetizovány nebo mohou být syntetizovány odděleně a připojeny pro použití k pevnému nosiči, např. jak je publikováno Lundem a kol., Nucleic Acids Research, 16, 10861-10880 (1988), Albretsenem a kol., Anal. Biochem., 189, 40-50 (1990), Wolfem a kol., Nucleic Acids • · • ·
Research, 15, 2911-2926 (1987) nebo Ghoshem a kol., Nucleic Acids Research, 15, 5353-5372 (1987). Nejvhodnější je syntetizovat a užívat komplementy značek se stejným pevným nosičem, který může zahrnovat řadu forem a různé vazebné zbytky. Takové nosiče mohou zahrnovat mikročástice či plošná uspořádání nebo matrice oblastí, kde se syntetizují jednotné populace komplementů značek. Při tomto vynálezu lze použít široký rozsah mikročásticových nosičů včetně mikročástic skla s kontrolovanými póry (CPG), vysoce zesilovaného polystyrénu, akrylových kopolymerů, celulózy, nylonu, dextranu, latexu, polyakroleinu a podobně, popsaných v následujících odkazech uvedených jako příklady: Meth. Enzymol., Section A, str. 11-147, díl 44 (Academie Press, New York, 1976), US patenty č. 4 678 814, 4 413 070 a 4 046 720, Pon, kapitola v Agrawal, redaktor, Methods in Molecular Biology, díl (Human Press, Totowa, NJ, 1993). Mikročásticové nosiče dále zahrnují komerčně dostupné CPG derivatizované nukleosidem a polystyrénové kuličky (k dodání např. od Applied Biosystems, Foster City, CA), derivatizované magnetické kuličky, polystyrén roubovaný polyetylenglykolem (např. TentaGel™, Rapp Polymere, Tubingen, NSR) a podobně.
Volba vlastností nosiče, jako je materiál, poréznost, rozměr, tvar a podobně a typ použitého spojovacího zbytku závisí na podmínkách, za kterých jsou značky použity. Například při aplikacích zahrnujících následné zpracování enzymy se dává přednost nosičům a linkerům) vazebným látkám, které minimalizují stérické zábrany enzymů a usnadňují přístup k substrátu. Dalšími důležitými faktory, které je třeba brát v úvahu při volbě nejvhodnějšího mikročásticového nosiče, zahrnují jednotnost rozměru, účinnost funkce nosiče syntézy, stupeň do kterého je znám povrch a optické vlastnosti, např. jak je vyloženo úplněji níže, čiré hladké kuličky poskytují instrumentální výhody při zacházení s většími počty kuliček na určitém povrchu.
Příklady spojovacích zbytků pro připojení a/nebo syntézu označení na mikročásticových površích jsou publikovány v Pon a kol., Biotechniques, 6, 768-775 (1988), Webb, US patent č. 4 659 774, Barany a kol., mezinárodní patentová přihláška PCT/US91/06103, Brown a kol., J. Chem. Soc. Commun., 891-893 (1989), Damha a kol., Nucleic Acids Research, 18, 3813-3821 (1990), Beattie a kol., Clinical Chemistry, 39., 719-722 (1993), Maskos a Southern, Nucleic Acids Research, 20., 1679-1684 (1992), a podobně.
Jak je zmíněno výše, mohou být komplementy značek též syntetizovány na jednom pevném nosiči (nebo na několika málo nosičích) pro vytvoření uspořádáni oblastí jednotně povlečených komplementy značek. To znamená, že v každé oblasti takového uspořádání je syntetizován jeden komplement značky. Techniky pro syntézu, jako je použití těchto uspořádání, jsou publikovány v McGall a kol., mezinárodní patentová přihláška PCT/US93/03767, Pease a kol., Proč. Nati. Acad. Sci., 21/ 5022-5026 (1994), Southern a Maskos, mezinárodní patentová přihláška PCT/GB89/01114, Maskos a Southern (citováno výše), Southern a kol., Genomics, 13., 1008-1017 (1992) a Maskos a Southern, Nucleic Acids Research, 21, 4663-4669 (1993).
Nejvhodnější je uplatňovat provedení vynálezu s mikročásticemi či kuličkami jednotně povlečenými komplementy téže sekvence značek. Jsou dobře známy mikročásticové nosiče a metody kovalentně a nekovalentně se připojujících oligonukleotidů k jejich povrchům, jak je uvedeno na příkladech v následujících odkazech: Beaucage a Iyer (citováno výše), Gait, redakce, Oligonucleotide Synthesis: A Practical Approach (IRL Press, Oxford, 1984) a v odkazech citovaných • · výše. Obecně není rozměr a tvar mikročástice kritický, avšak mikročástice v rozmezí velikostí několika např. 1 až 2 až několik set, např. 200 až 1000 μπι v průměru jsou nejvhodnější, neboť umožňují konstrukci a manipulaci velkých repertoárů oligonukleotidových značek s minimem použitého činidla a vzorku.
V některých aplikacích, kterým se dává přednost, se v tomto vynálezu používají komerčně dostupné nosiče ze skla s kontrolovanými póry (CPG) nebo polystyrénu jako pevné nosiče. Takové nosiče se obdrží spolu s bázově labilními linkery a počátečními nukleosidy, např. u Applied Biosystems (Foster City, CA). Nejvhodnější jsou mikročástice mající velikosti póru mezi 50 a 100 nm.
V ostatních aplikacích, kterým se dává přednost, se používají neporézní mikročástice pro optické vlastnosti, které mohou být s výhodou použity při sledování velkých počtů mikročástic na plochých nosičích, jako je mikroskopické sklíčko. Zvláště preferovanými neporézními částicemi jsou zrnka glycidovaného metakrylátu (GMA), která lze obdržet od Bangs Laboratořies (Carmel, IN). Takové mikročástice jsou užitečné v řadě rozměrů a jsou derivatizovány řadou vazebných skupin pro syntézu značek nebo komplementů značek. Nejlépe je použít pro masivní paralelní manipulace označených mikročástic zrnka (kuličky) GMA o průměru 5 μπι.
Připojení značek k polynukleotidům pro třídění na pevných nosičích
Důležitým aspektem vynálezu je třídění a připojení populací polynukleotidů, například z knihovny cDNA k mikročásticím nebo jednotlivým oblastem pevného nosiče takovým způso33
0
0
• 0 0 0 0 0 « 0 0 0
0000
0 0 0000 0 0 0 0
0 00 0 0 0 0 0
0 0
0 0 0 bem, že každá mikročástice či oblast má v podstatě pouze jeden druh připojeného polynukleotidů. Tento záměr je uplatněn zajištěním toho, že v podstatě všechny různé polynukleotidy mají připojeny různé značky. Takového stavu se opět dosahuje odebráním vzorku z plného souboru konjugátů polynukleotidů se značkou pro analýzu. (Je možno připustit, aby měly identické polynúkleotidy různé značky, nebot to pouze vede k tomu, že tentýž nukleotid se zpracovává či analyzuje dvakrát ve dvou různých místech). Takové odebírání vzorků se může provádět buď přímo - např. odebráním malého objemu z velké směsi - po připojení značky k polynukleotidům, dále se může uskutečnit jako vedlejší výsledek postupů použitých ke zpracování polynukleotidů a značek anebo se může provádět jak přímo tak jako součást kroků pro zpracovánání.
Je nejvhodnější, když se při tvorbě knihovny cDNA, kde v podstatě všechny různé cDNA mají různé značky, užije repertoár značek, jehož komplexnost či počet různých značek značně převyšuje celkový počet mRNA extrahovaných z buňky nebo vzorku tkáně. Je vhodné, aby komplexnost repertoáru značek činila nejméně desetinásobek repertoáru populace polynukleotidů a ještě vhodnější je, když je komplexnost repertoáru značek nejméně lOOx vyšší než komplexnost populace polynukleotidů. Níže je ukázán protokol pro tvorbu knihovny cDNA s použitím směsi primerů, která obsahuje úplný repertoár příkladů značek o 9 slovech. Taková směs primerů obsahujících značky má komplexnost 89 nebo okolo 1,34 χ 108. Jak ukázal Winslow a kol., Nucleic Acid Research, 19, 3251-3253 (1991), může být mRNA pro tvorbu knihovny odebrána již z 10 až 100 savčích buněk. Jelikož jedna savčí buňka obsahuje okolo 5 χ 105 kopií molekul mRNA ve zhruba 3,4 x 104 různých druzích, může se standardními metodami izolovat mRNA zhruba ze 100 buněk nebo (teoreticky) zhruba ·· ·*
• | ♦> | • · |
• | • | • |
• | 9 | « · |
• | • | • |
·· | *··· |
·♦ · • · · · • ····· • · · »*» · ···♦ • · ♦· •· ·« • ·· · V· • ·« ···· ζ 5 χ ΙΟ7 molekul mRNA. Srovnání této hodnoty s komplexností směsi primerů ukazuje, že bez dalších přídavných kroků a dokonce za předpokladu, že mRNA jsou převedeny na cDNA s dokonalou účinností (přiměřenější je 1% účinnost nebo méně), postup tvorby knihovny cDNA vede k populaci obsahující ne více než 37 % celkového počtu různých značek. To znamená, že bez jakéhokoliv kroku přímého odebírání vzorků vede tento postup k vytvoření vzorku, který zahrnuje 37 % či méně z repertoáru značek. Pravděpodobnost obdržení dvojice za těchto podmínek je okolo 5 %, což je v preferovaném rozmezí. Při mRNA z 10 buněk se frakce odebraného repertoáru značek redukuje na pouhých 3,7 % dokonce i za předpokladu, že všechny kroky zpracování nastaly s účinností 100 %. Ve skutečnosti jsou účinnosti kroků zpracování pro tvorbu knihoven cDNA velmi nízké, přičemž pravidlo palce říká, že dobrá knihovna by měla obsahovat okolo 108 klonů cDNA z mRNA extrahované z 10 savčích buněk.
Při použití větších množství mRNA ve výše uvedeném postupu nebo větších množství polynukleotidů obecně, kde počet takových molekul překračuje komplexnost repertoáru značek, obsahuje směs konjugátu značka-polynukleotid potenciálně každé možné párování značek a typů mRNA nebo polynukleotidu. V takových případech lze použít přímé odebrání vzorků odstraněním objemu vzorku po sériovém zředění počáteční směsi konjugátů značka-polynukleotid. Míra požadovaného zředění závisí na množství výchozího materiálu a na účinnostech kroků zpracování, které lze snadno zjistit.
Kdyby byla mRNA extrahována z 106 buněk [což by odpovídalo zhruba 0,5 p.g póly (A) RNA)], a kdyby byly primery přítomny zhruba v 10-násobném až 100-násobném koncentračním přebytku - jak je žádáno v obvyklém postupu (např. Sambrook ·· ♦ a kol., Molecular Cloning, druhé vydání, str. 8.61 [10 μΐ 1,8 kb mRNA při 1 mg/ml se rovná 1,68 x ΙΟ-3·1 mol a 10 μΐ 18-merního primerů při 1 mg/ml se rovná zhruba 1,68 x 10“9 mol], potom by celkový počet konjugátů polynuklidů se značkou v knihovně cDNA byl jednoduše roven nebo by byl menší než počáteční počet mRNA neboli okolo 5 x 10^ vektorů obsahujících konjugáty polynukleotidů se značkou, což opět předpokládá, že každý krok tvorby cDNA - syntéza prvního vlákna, syntéza druhého vlákna, napojení na vektor - nastává s dokonalou účinností, což je velice konzervativní odhad. Skutečný počet je významně nižší.
Když je vzorek n konjugátů značka-polynukleotid náhodně odebrán z reakční směsi, jak lze provést odebráním objemu vzorku, je pravděpodobnost odebrání konjugátů se stejnou značkou popsána Poissonovou distribucí P(r) = e“laInbda( lambda/rt kde r je počet konjugátů majících stejnou značku a lambda = np, kde p je pravděpodobnost výběru dané značky. Jestliže η = 106 a p = 1/(1,34 x 108), potom lambda = 0,00746 a P(2) = 2,76 x 10-5. Tím vzorek o milionu molekul poskytne vznik očekávaného počtu dublů, který dobře zapadá do vhodného rozmezí. Takový vzorek se snadno obdrží následujícím způsobem: předpokládejme, ze 5 x 10 mRNA je dokonale převedeno na 5 x 10 vektoru s konjugáty značka-cDNA, a že v reakčním roztoku mající objem 100 μΐ je 5 x 1011 vektorů. Lze provést 4 desetinásobná sériová zředění převedením 10 μΐ z původního roztoku do nádoby obsahující 10 μΐ příslušného ústojného roztoku, jako je TE. Tento postup se může opakovat pro tři další zředění pro obdržení 100 μΐ roztoku obsahujícího 5 x 105 molekul vektoru na μΐ. Alikvót 2 μΐ z tohoto roztoku poskytuje 106 vektorů obsahujících konjugáty značka-cDNA jako vložené složky. Tento vzorek je potom amplifikován přímou transformací kompetentní hostitelské buňky vpřed s následující kultivací.
Ovšem, jak bylo zmínéno výše, žádný krok ve výše uvedeném postupu neprobíhá s dokonalou účinností. Zejména pokud jsou k amplifikací vzorku konjugátů značka-polynukleotid použity vektory, je krok transformace hostitele velice neúčinný. Obvykle není hostitelem vychytáno a replikováno více než 1 % vektorů. Proto by se pro takovou metodu amplifikace požadovala dokonce i menší zředění pro obdržení vzorku obsahujícího 106 konjugátů.
Určitý repertoár oligonukleotidových značek se může konjugovat na populaci polynukleotidů řadou způsobů včetně přímého enzymatického navázání, amplifikace, např. přes PCR, s použitím primerů obsahujících sekvence značek a podobně. Počáteční krok navázání poskytuje velmi početnou populaci konjugátů značka-polynukleotid, takže se obecně jednotlivá značka připojuje k mnoha různým polynukleotidům. Avšak, jak bylo poznamenáno výše, odebráním dostatečně malého vzorku konjugátů se může pravděpodobnost obdržení dublů, to jest stejná značka na dvou různých polynukleotidech, učinit zanedbatelnou. Obecně, čím větší je vzorek, tím vyšší je pravděpodobnost obdržení dublu. Proto existuje kompromis návrhu mezi volbou velkého vzorku konjugátu značka-polynukleotid, který například zajišťuje adekvátní pokrytí cílového polynukleotidu v sekvenovací operaci nebo adekvátní reprezentaci rychle se měnícího poolu mRNA, a volbou malého vzorku, který zajištuje přítomnost minimálního počtu dublů. Ve většině provedení přítomnost dublů prostě přináší přídavný zdroj šumu nebo v případě sekvenování drobnou komplikaci při snímání a zpracování signálu, neboř mikročástice mající vícečetné fluorescenční signály mohou být prostě ignorovány.
• · • · · t ·φ · ·· * · · · φ · · · « · · • t φ · φ φ φ · · φφ $ 9 Φ Φ Φ Φ ΦΦΦΦ Φ ΦΦΦ Φ Φ
Φ φφ · · · ·♦· ··«·«· · · φ «I φ-φ
Termín v podstatě veškeré, jak se užívá zde v odkazu na připojování značek k molekulám, zejména polynukleotidům, se míní tak, že odráží statistickou povahu použitého postupu odběru vzorků pro obdržení populace konjugátů molekul se značkou v podstatě neobsahujících dubly. Smysl v podstatě veškeré při vyjádření ve skutečných procentech konjugátů značka-molekula závisí na tom, jak se značky používají. Pro sekvenování nukleových kyselin je vhodné použít v podstatě všech prostředků, při kterých se k polynukleotidům připojí nejméně v 80 % jedinečné značky. Ještě vhodnější je, jestliže se k polynukleotidům připojí nejméně 90 % jedinečných značek. Ještě více vhodné je, jestliže se k polynukleotidům připojí nejméně 95 % jedinečných značek a úplně nejvhodnější je, jestliže se k polynukleotidům připojí nejméně 99 % jedinečných značek.
Je vhodné, pokud se populace polynukleotidů skládá z mediátorové RNA (mRNA), aby byly oligonukleotidové značky připojeny reverzní transkripcí mRNA souborem primerů, přednostně takových, které obsahuji komplementy sekvencí značek. Příklad souboru takových primerů by měl mít následuj ící sekvenci:
-mRNA- [A]n - 3 [T]19GG[W,W,W,C]qACCAGCTGATC-5 -biotin kde [W,W,W,C]g představuje sekvenci oligonukleotidové značky o devíti podjednotkách, každá se čtyřmi nukleotidy a [W,W,W,C] představuje sekvence podjednotek uvedené výše, to jest W znamená T nebo A. Podtržené sekvence identifikují zvolené restrikční endonukleázové místo, které může být použito k uvolnění polynukleotidu z připojení na pevný nosič
prostřednictvím biotinu. Pro výše uvedený primer by mohl mít komplement připojený k mikročástici formu:
-[G,W,W,W]gTGG-linker-mikročástice
Po reverzní transkripci se odstraní mRNA, například RNázovou H digescí, a druhé vlákno cDNA se syntetizuje například s použitím primeru v následující formě:
-NRRGATCYNNN-3 kde N je kterýkoliv z A, T, G nebo C; R je nukleotid obsahující purin a Y je nukleotid obsahující pyrimidin. Tento konkrétní primer vytváří restrikční místo Bst Yl ve výsledné dvouvláknové DNA, které spolu s místem Sal I usnadňuje klonování na vektor např. s místy Bam HI a Xho I. Po digescí Bst Yl a Sal I by byl konjugát například ve formě:
-RCGACCA[C,W,W,W]9GG[T]19- CDNA -NNNR GGT[G,W,W,W]9CC[A]19- rDNA -NNNYCTAG-5
Pro manipulaci s konjugáty značka-polynukleotid se mohou potom použít standardní molekulární biologické metody. Např. výše uvedený konjugát, který je ve skutečnosti směsí, se může vložit do komerčně dostupných klonovacích vektorů, např. Stratagene Cloning Systém (La Jolla, CA) a přenést na hostitele, jako jsou komerčně dostupné hostitelské bakterie, který se poté kultivuje pro zvýšení počtu konjugátů. Klonovací vektory se mohou poté izolovat s použitím standardních metod, např. Sambrook a kol.., Molecular Cloning, druhé vydání (Cold Spring Harbor Laboratory, New York, 1989). Alternativně se mohou použít příslušné adaptéry a primery tak, aby se mohla populace konjugátů zvýšit pomocí PCR.
• · · · · · · • · 0 · · 0 · 000 6 •0 0 · 0 · 0 · 0 00 • Ί · · 0 00000 ¼ 0000 0 • · · · 0 0 0 0 3 • 0 0000 00 0 <0 00
Přednostně jsou při použití metody sekvenování založené na ligáze fragmenty Bst Yl a Sal I po digesci klonovány na Bam HI-/Xho I-digerovaný vektor mající následující restrikční místa s jednou kopií:
-GAGGATGCCTTTATGGATCCACTCGAGATCCCAATCCA- 3
Fokl BamHI Xhol
Tím se přidává místo Fok I, které umožní iniciaci postupu sekvenování, který je úplněji diskutován níže.
Značky se mohou konjugovat na cDNA existujících knihoven standardními klonovacími metodami. cDNA jsou vyříznuty ze svého daného vektoru, izolovány a potom navázány na vektor obsahující repertoár značek. Je vhodné linearizovat vektor obsahující značky štěpením dvěma restrikčními enzymy tak, aby se mohly odříznuté cDNA navázat v předem určené orientaci. Koncentrace linearizovaného vektoru obsahujícího značky je v dostatečném přebytku oproti vloženým cDNA, takže navázání zajišřuje odebrání vzorků značek v rámci postupu.
Obecně metoda pro expozici jednovláknové značky po amplifikaci zahrnuje digesci cílového konjugátu obsahujícího polynukleotid s 5 —>3 exonukleázovou aktivitou T4 DNA polymerázy nebo podobného enzymu. Při použití v přítomnosti jednotlivého deoxynukleosidtrifosfátu, bude taková polymeráza štěpit nukleotidy od recesivních konců 3 přítomných na nematricovém vláknu dvouvláknového fragmentu až do dosažení komplementu jednotlivého deoxynukleosidtrifosfátu na matricovém vláknu. Po dosažení takového nukleotidu, digesce 5 —>3 efektivně vymizí, jelikož polymerázová prodlužovací aktivita přidává nukleotidy s vyšší rychlostí, než jak je
• 9 | • 9 | 9 9 | • | • 9 | 4 9 |
9 9 | • 9 | « 9 | 9 | • · | 9 · |
• · | 9 | 9 9 | 9 · | • 9 | 9 9 |
• f | • 9 | 9 9 | 9 99 9 | * 9 · 9 | 9 9 |
• < | 9 | 9 9 | 9 | • | 9 9 |
• Λ | 9999 | • 9 | • | 4 9 | 9 9 |
odstraňuje aktivita excize. Následkem toho lze jednovláknové značky vytvořené s třemi nukleotidy snadno připravit pro nasazení na pevné nosiče.
Tento postup se též může použít k preferenční metylaci vnitřních míst Fok I cílového polynukleotidů s ponecháním jednoho místa Fok I na konci polynukleotidů nemetylovaného. Nejprve se terminální místo Fok I učiní jednovláknovým s použitím polymerázy s deoxycytidintrifosfátem. Dvouvláknová část fragmentu se potom metyluje, načež se jednovláknový konec naplní DNA polymerázou v přítomnosti všech čtyř nukleosidtrifosfátů, čímž se regeneruje místo Fok I. Tento postup se může zobecnit na jiné endonukleázy než Fok I.
Po přípravě oligonukleotidových značek pro specifickou hybridizaci, například tím, že se učiní jednovláknovými, jak je popsáno výše, jsou polynukleotidy smíseny s mikročásticemi obsahujícími komplementární sekvence značek za podmínek, které upřednostňuj í vytvoření dokonale spárovaných duplexů mezi značkami a jejich komplementy. V literatuře existují rozsáhlá vodítka pro vytvoření těchto podmínek. Příklady odkazů zajišťující taková vodítka zahrnují práce Wetmura, Critical Reviews in Biochemistry and Molecular Biology, 26, 227-259 (1991), Sambrooka a kol.,Molecular Cloning: A Laboratory Manual, druhé vydání (Cold Spring Harbor Laboratory, New York, 1989) a podobně. Přednostně by měly být hybridizační podmínky dostatečně přísné tak, aby se stabilní duplexy vytvářely pouze dokonale spárovanými sekvencemi. Za takových podmínek se mohou polynukleotidy specificky hybridi zované svými značkami vázat na komplementární sekvence připojené k mikročásticím. Konečně se mikročástice promyjí k odstranění polynukleotidů s nenavázanými a/nebo nesprávně spárovanými značkami.
4 · | • 9 | • | • 9 | • · | ||||||
• | •j | • · | • · | • | 4 | • | • | • | ||
• | • | • | • | 9 | • · | • | • | • · | ||
• | • | • · | • | • | • ••9 | • · · | • | • | • | |
* | • | 9 | • 9 | 9 | 9 | 9 | 9 | |||
• é | • 99 9 | i 9 | • | « · |
Když se konvenčně používají jako nosiče mikročástice CPG, je obvykle hustota komplementů značek na povrchu mikročástic větší, než je nezbytné pro některé sekvenovací postupy. To znamená, že v sekvenovacích postupech, které vyžadují následné zpracování připojených polynukleotidů řadou enzymů, mohou hustě rozmístěné polynukleotidy vykazovat tendenci k inhibici přístupu relativně objemných enzymů k těmto polynukleotidům. V takových případech je nejlépe mísit tyto polynukleotidy s mikročásticemi tak, aby byly komplementy značek přítomny ve významném přebytku, např. od 10:1 do 100:1 nebo více oproti polynukleotidům. To zajišťuje, aby hustota polynukleotidů na povrchu mikročástice nebyla tak vysoká, že by mohla inhibovat přistup enzymu. Nejvhodnější je, jsou-li průměrné vzdálenosti mezi polynukleotidy na povrchu mikročástice řádu 30 až 100 nm. Návody pro volbu poměrů standardních nosičů CPG a Ballotiniho kuliček (typ pevného skleněného nosiče) lze nalézt u Maskose a Southerna, Nucleic Acids Research, 20, 1679-1684 (1992). Pro sekvenovací aplikace jsou nejvhodnější kuličky CPG o průměru v rozmezí 20 až 50 gm s množstvím okolo 105 polynukleotidů a kuličky GMA o průměru v rozmezí 5 až 10 gm s několika desítkami tisíc polynukleotidů, např. 4 x 104 až 6 x 104.
V preferovaném způsobu použití se komplementy značek syntetizují na mikročásticích kombinatoricky a proto na konci takové syntézy obdržíme komplexní směs mikročástic, ze které se odebírá vzorek pro nasazení označených polynukleotidů. Velikost vzorku mikročástic bude záviset na několika faktorech včetně velikosti repertoáru komplementů značek, povahy zařízení pro použití při pozorování mikročástic s nasazenými polynukleotidy - např. na kapacitě, toleranci pro vícečetné kopie mikročástic se stejným komplementem značky * » • · · • · · · 9 (to jest dubly kuliček) a podobně. Následující tabulka poskytuje vodítko ohledně velikosti vzorku mikročástic, prů-
měru mikročástic a přibližných fyzických rozměrů naplněného plošného uspořádání mikročástic o různých průměrech. | ||||
Průměr mikročástice | 5 μπι | 10 μη | 20 μπι | 40 μπι |
Maximální počet nukleotidů nasazených při 1 na 10“15 m2 | 3xl05 | 1,26x10® | 5x10® | |
Přibližná plocha monovrstvy 10® mikročástic | 45x45 cm | lxl cm | 2x2 cm | 4x4 cm |
Pravděpodobnost, že vzorek mikročástic obsahuje daný komplement značky nebo je přítomen ve vícečetných kopiích, je popsána Poissonovým rozdělením, jak je ukázáno v následující tabulce.
• ·
Tabulka 7 | |
Počet mikročástic ve vzorku (jako zlomek velikosti repertoáru) | Frakce repertoáru komplementů značek přítomná ve vzorku |
m | l-em |
1,000 | 0,63 |
0,693 | 0,50 |
0,405 | 0,33 |
0,285 | 0,25 |
0,223 | 0,20 |
0,105 | 0,10 |
0,010 | 0,01 |
Frakce mikro částic ve vzorku s jedinečným připojeným komplementem značky m(em)/2 | Frakce mikročástic ve vzorku nesoucím stejný komplement značky jako jedna jiná mikročástice ve vzorku (dubly kuliček) m2(e“m)/2 |
0,37 | 0,18 |
0,35 | 0,12 |
0,27 | 0,05 |
0,21 | 0,03 |
0,18 | 0,02 |
0,09 | 0,005 |
0,01 |
Vysoce specifické třídění a panning
Kinetika třídění závisí na rychlosti hybridizace oligonukleotidových značek s jejich komplementy značek, která opět závisí na komplexnosti značek v hybridizační reakci. Proto existuje taková možnost použití rychlosti třídění a komplexnosti značek, při které lze dosáhnout zvýšení rychlosti třídění na účet snížení komplexnosti značek, které se používají v hybridizační reakci. Jak je vysvětleno níže, účinky tohoto kompromisu se mohou zlepšit pomocí panningu.
Specifičnost hybridizací se může zvyšovat použitím dostatečně malého vzorku tak, aby bylo vysoké procento s jedinečnou značkou ve vzorku a aby se nejbližší sousedící anebo v podstatě všechny značky vzorku lišily nejméně o dvě slova. Tato druhá podmínka může být splněna použitím vzorku, který obsahuje počet konjugátů polynukleotidu se značkou činící okolo 0,1 % nebo méně velikosti používaného repertoáru. Například když se značka vytvoří s osmi slovy zvolenými z tabulky 2, vznikne repertoár 88 neboli okolo 1,67 x 107 značek a komplementů značek. V knihovně konjugátů značek s cDNA, jak je popsáno výše, 0,1% vzorek znamená, že je přítomno okolo 16700 různých značek. Kdyby se tyto značky přímo nanesly na repertoárový ekvivalent mikročástic neboli v tomto případě na vzorek 1,67 x 107 mikročástic, potom by obsadil pouze řídký podsoubor odebraných mikročástic. Hustota obsazených mikročástic se může zvýšit, např. pro účinnější sekvenování, použitím postupu panningu, při kterém se použijí vzorkované konjugáty značek s cDNA pro separaci obsazených mikročástic od neobsazených. Proto v případu uvedeném výše, i když 0,l% vzorek obsahuje pouze 16700 cDNA, je možno opakovat kroky odebrání vzorku a panningu až do shromáždění tolika obsazených částic, kolik je žádáno.
Krok panningu se může provést zajištěním vzorku konjugátů značek s cDNA, kde každý obsahuje zachycovací zbytek na opačném konci neboli distálně k oligonukleotidové značce. Přednostně je zachycovací zbytek typu, který se může uvolnit z konjugátů značky s cDNA, takže konjugáty značek s cDNA se mohou sekvenovat s použitím jednobázové sekvenovací metody. Takové zbytky mohou zahrnovat biotin, digoxigenin či podobné ligandy a triplexní vazebnou oblast nebo podobně. Přednostně obsahuje takový záchytový zbytek biotinovou složku. Biotin může být připojen ke konjugátům značka-cDNA pomocí řady standardních metod. Jestliže se adaptéry vazebných míst primeru PCR připojují ke konjugátům značka-cDNA, může být biotin připojen s použitím biotinylovaného primeru • · · · ♦ · · · 9 9 · · 9 9 9 99
9 9 9 9 9 99999 • · · «· ·····*> 999 9·
9 9 9 9 9 9 99
9 9999 99 9 · ·· · při amplifikaci po odebrání vzorku. Alternativně, jsou-li konjugáty značka-cDNA vložené složky klonujících vektorů, může se biotin připojit po excizi konjugátů značka-cDNA digescí s příslušným restrikčním enzymem následovanou izolací a plněním ve vláknu pronikajícím distálně ke značkám s DNA polymerázou v přítomnosti biotinylovaného uridintrifosfátu.
Po zachycení konjugátu značka-cDNA, se může tento konjugát uvolnit z biotinového zbytku řadou způsobů, jako je chemické připojení, které se štěpí redukcí, např. Herman a kol., Anal. Biochem., 156, 48-55 (1986), fotochemicky, např. Olejnik a kol., Nucleid Acids Research, 24., 361-366 (1996) nebo enzymaticky uvedením restrikčního místa v primerů PCR. Poslední způsob použití lze uvést pro příklad úvahou knihovny konjugátů značka-polynukleotid, jak je popsáno výše:
-RCGACCA [C,W,W,W]9GG[T]19- cDNA -NNNR
GGT [G,W,W,W]9CC[A]19- rDNA -NNNYCTAG-5
Ke koncům těchto fragmentů se mohou pro umožnění amplifikace pomocí PCR vázat následující adaptéry:
- XXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXYGAT
Pravý adaptér
GATCZZACTAGTZZZZZZZZZZZZ-3
ZZTGATCAZZZZZZZZZZZZ
Levý adaptér « ·
9 9 99 9
9 9 9 9 9 9 9 9 99
9 99999999
9 9 99 999999 99999
9 9 9 9 9 9 99
999999 9 9 9 · ·9 9
ZZTGATCAZZZZZZZZZZZZ-5 -biotin
Levý primer kde ACTAGT je místo rozpoznání Spe I (které ponechává střídavě uspořádané štěpení připravené pro jednobázové sekvenování) a X a Z jsou nukleotidy zvolené takovým způsobem, že teploty připojování a disociace příslušných primerů jsou zhruba stejné. Po navázání adaptérů a amplifikaci pomocí PCR s použitím biotinylovaného primerů se značky a konjugáty učiní jednovláknovými exonukleázovou aktivitou T4 DNA polymerázy a konjugáty se spojují se vzorkem mikročástic, např. ekvivalentním repertoáru s připojenými komplementy značek. Po spojování za přísných podmínek (k minimalizaci nesprávného připojení značky) se konjugáty přednostně napojují na své komplementy značek a obsazené mikročástice se oddělí od neobsazených mikročástic zachycením pomocí aktivovaných magnetických kuliček nebo jinou metodou zachycování .
Při návratu k danému příkladu vede tento postup k akumulaci okolo 10500 (=16700 x 0,63) obsazených mikročástic s různými značkami, které se mohou uvolnit z magnetických kuliček štěpením pomocí Spe I. Opakováním tohoto postupu 40 až 50-krát s novými vzorky mikročástic a konjugáty značka-cDNA lze nahromadit 4-5 x 105 cDNA poolováním uvolněných mikročástic. Poolované mikročástice mohou být potom současně sekvenovány jednobázovou sekvenovací metodou.
Stanovení toho, kolikrát je třeba opakovat postupy odebrání vzorků a panningu, nebo obecněji stanovení, kolik cDNA je třeba analyzovat, závisí na daném záměru. Jestliže • 0 0 0 • 0 0 · • 0 0 0 • · 0 0
• · *·
0· ···
0
0 0 0 0 0 je záměrem monitorovat změny ve výskytu relativně běžných sekvencí, např. činících 5 nebo více procent populace, potom mohou relativně malé vzorky, to jest malý podíl rozměru populace, umožňovat statisticky významná určení relativních výskytů. Na druhé straně, jestliže se snažíme monitorovat výskyty vzácných sekvencí, např. činících 0,1 % nebo méně z populace, potom jsou požadovány větší vzorky. Obecně existuje přímý vztah mezi rozměrem vzorku a spolehlivostí odhadů relativních výskytů založených na vzorku. V literatuře jsou rozsáhlá vodítka ohledně stanovení příslušných rozměrů vzorků pro zajištění spolehlivých statistických odhadů, např. Koller a kol., Nucleic Acids Research, 23, 185-191 (1994), Good, Biometrika, 40, 16-264 (1953), Bunge a kol., J. Am. Stát. Assoc., 88, 364-373 (1993), a podobně. Přednostně se pro monitorování změn v genové expresi na základě analýzy řady knihoven cDNA obsahujících 105 až 108 nezávislých klonů o 3,0 až 3,5 x 104 různých sekvencích akumuluje vzorek o nejméně 104 sekvencích pro analýzu každé knihovny. Vhodnější je akumulovat vzorek o nejméně 105 sekvencích pro analýzu každé knihovny a nejvhodnější je akumulovat vzorek o alespoň 5 x 105 sekvencích pro analýzu každé knihovny. Alternativně počet sekvencí, které se odebírají, je přednostně dostatečný pro určení relativního výskytu sekvence přítomné při frekvenci v rozmezí 0,1 % až 5 % s 95% mezí spolehlivosti ne větší než 0,1 % velikosti populace.
Jednobázové sekvenování DNA
Současný vynález se může použít spolu s konvenčními metodami sekvenování DNA, např. jak publikoval Hultman a kol., Nucleic Acids Research, 17, 4937-4946 (1989). Avšak pro paralelní či simultánní sekvenování vícečetných polynu • 0 • · » · « > · 0 · • 0 · 0 0 0 0 • 0 · «· 0 0 0 0 0
0 0 0 0 0
0000 · · 0 kleotidů se dává přednost metodě sekvenování DNA, která nevyžaduje ani elektroforetickou separaci fragmentů DNA o blízkém rozměru ani analýzu štěpených nukleotidů odděleným analytickým postupem jako při sekvenování peptidů. Přednostně tato metoda umožňuje postupnou identifikaci nukleotidů, obvykle vždy jednoho v pořadí v následném cyklu zpracování a detekce. Takové metodologie se zde uvádějí jako jednobázové sekvenovací metody. Jednobázové přístupy jsou popsány v následujících odkazech: Cheeseman, US patent č. 5 302 509, Tsien a kol., mezinárodní patentová přihláška WO 91/06678, Rosenthal a kol., mezinárodní patentová přihláška WO 93/21340, Canard a kol., Gene, 148, 1-6 (1994) a Metzker a kol., Nucleic acids Research, 22., 4259-4267 (1994).
Jednobázová metoda sekvenování DNA, která je vhodná pro užiti v souvislosti s tímto vynálezem, a která nevyžaduje žádné elektroforetické dělení fragmentů DNA, je popsána v mezinárodní patentové přihlášce PCT/US95/03678. Stručně řečeno, tato metoda zahrnuje následující kroky: (a) navázání sondy ke konci polynukleotidů majícího vyčnívající vlákno pro vytvoření navázaného komplexu, kde sonda má komplementární vyčnívající vlákno k vláknu polynukleotidů a nukleázové rozpoznávací místo, (b) odstranění nenavázané sondy od navázaného komplexu, (c) identifikace jednoho nebo více nukleotidů ve vyčnívajícím vláknu polynukleotidů podle identity navázané sondy, (d) štěpení navázaného komplexu nukleázou a (e) opakování kroků (a) až (d) tak dlouho, až se určí sekvence polynukleotidů nebo její část.
Zbytek vyvolávající signál, jako je jednotlivé fluorescenční barvivo, se může použít při sekvenování několika různých cílových polynukleotidů připojených k různým prostorově dosažitelným pevným nosičům, jako jsou fixované mikro• ♦ částice při paralelním sekvenovacím postupu. To lze uskutečnit zajištěním čtyř souborů sond, které se postupně aplikují na pluralitu cílových polynukleotidů na různých mikročásticích. Příkladný soubor takových sond je ukázán níže:
Soubor 1 Soubor 2 Soubor 3 Soubor 4 • 9
99·
k | ANNNN.. N. . | • NN | dANNNN. d N. | . .NN | dANNNN. N. | . .NN | dANNNN. N. | . . NN | ||||
.NNTT.. | • T« | ..NNTT. | . .T | ..NNTT. | . .T | ..NNTT. | • -T | |||||
dCNNNN. N. | . . NN . .NNTT. | . . T | CNNNN.. N. . | .NN •NNTT.. | • T* | dCNNNN. N. | . .NN ..NNTT. | . .T | dCNNNN. N. | . .NN ..NNTT. | . .T | |
- | dGNNNN. N. | . .NN . .NNTT. | . .T | dGNNNN. N. | . .NN ..NNTT. | . .T | GNNNN.. N. . | .NN .NNTT.. | • T’ | dGNNNN. N. | . .NN ..NNTT. | . .T- |
- | dTNNNN. N. | . .NN ..NNTT. | . .T | dTNNNN. N. | . .NN ..NNTT. | . .T | dTNNNN. N. | . .NN ..NNTT. | . .T | TNNNN.. N. . | • NN NNTT | .T· |
kde každá z uvedených sond představuje směs 4* 3=64 nukleotidů takových, že identita terminálního nukleotidu 3 vrchního vlákna je fixována a ostatní polohy ve vyčnívajícím vláknu jsou obsazené 3-merní permutací nukleotidů nebo analogy snižujícími komplexnost. Uvedené sondy se též vyskytují s jednovláknovým chvostem poly-T se zbytkem vytvářejícím signál připojeným k terminálnímu thymidinu označenému jako T . Symboly d na neoznačených sondách určují vazebný-blokující zbytek nebo absenci 3 -hydroxylu bránící vazbě neoznačených sond. Přednostně jsou takovými
-terminálními nukleotidy dideoxynukleotidy. V tomto způsobu provedení se sondy souboru 1 nejprve aplikují na pluralitu cílových polynukleotidů a zpracují ligázou, takže se naváží cílové polynukleotidy mající thymidin komplementární 3 -terminálnímu adenosinu značených sond. Neznačené • · • ···· · sondy se současně aplikují pro minimalizaci nepříslušných vazeb. Umístění cílových polynukleotidů vytvářejí navázané komplexy se sondami končícími v A, jsou identifikována signálem vytvořeným značkou nesenou na sondě. Po promyt! a štěpení se použijí sondy souboru 2. V tomto případě se identifikují cílové polynukleotidy vytvářející komplexy se sondami končícími v C. Podobně se aplikují sondy souborů 3 a 4 a identifikují se místa pozitivních signálů. Tento postup sekvenční aplikace 4 souborů sond pokračuje až do identifikace žádaného počtu nukleotidů na cílových polynukleotidech. Je zřejmé, že ten, kdo má běžnou zkušenost, by mohl vytvořit podobné soubory sond, které by mohly mít mnoho variaci, jako v tom smyslu, že mají vyčnívající vlákna různých délek, různé zbytky pro blokování navázání neznačených sond, různé prostředky pro značkovací sondy a podobně.
Zařízení pro pozorování enzymatických postupů a/nebo vazebných událostí na površích mikročástic
Záměrem tohoto vynálezu je roztřídit identické molekuly, zejména polynukleotidy na površích mikročástic specifickou hybridizaci značek a jejich komplementů. Když došlo k takovému roztřídění, lze detekovat přítomnost molekul nebo operace, které s nimi byly provedeny, řadou způsobů v závislosti na povaze označené molekuly, na tom, zda se mikročástice detekují odděleně nebo v šaržích, zda jsou žádána opakovaná měření a podobně. Obvykle se tříděné molekuly exponují vazebným ligandům, např. při vývoji léků, nebo se podrobí chemickým či enzymatickým postupům, např. při polynukleotidovém sekvenování. V obou těchto případech použití se často požaduje současné pozorování signálů odpovídajících takovým událostem nebo postupům na velkém počtu mikročástic. Mikročástice nesoucí tříděné molekuly (zde uváděné jako ·· *9
• · • ♦ obsazené mikročástice) se propůjčuji tak velké škále paralelních operací, jak např. prokázal Lam a kol. (citováno výše).
• · • ·· ·
Pokud se pro detekci událostí či procesů používají signály generující světlo, např. chemiluminiscenční, fluorescenční či podobně, je nejvhodnější rozprostřít obsazené mikročástice na rovné podložce, např. na skleněném sklíčku, pro zkoumání pomocí snímacího systému, jako je popsán v mezinárodních patentových přihláškách PCT/US91/09217, PCT/NL90/00081 a PCT/US95/01886. Snímací systém by měl být schopen reprodukovatelné snímat podložku a definovat polohy každé mikročástice v předem určené oblasti pomocí souřadnicového systému. V polynukleotidových sekvenovacích aplikacích je důležité, aby byla identifikace polohy mikročástic v následných krocích snímání reprodukovatelná.
Takový snímací systém může být sestaven z komerčně dostupných komponent, např. posunovací stolek x-y ovládaný číslicovým počítačem použitý s detekčním systémem zahrnujícím jeden nebo více fotonásobičů nebo alternativně plošné uspořádání CCD a příslušná optika, např. pro excitaci, sběr a třídění fluorescenčních signálů. V určitých způsobech provedení může být žádoucí konfokální optický systém. Příklad snímacího systému vhodného pro užití při čtyřbarevném sekvenování je schematicky znázorněn na obr. 5. Podložka 300, např. mikroskopické sklíčko s fixovanými částicemi je umístěna na posuvném stolku x-y 302. který je připojen k příslušně programovanému číslicovému počítači 304 a je jím řízen, přičemž tímto počítačem může být kterýkoliv z komerčně dostupných osobních počítačů, např. 486 nebo PowerPC model 7100 či 8100, který lze obdržet od Apple Computer (Cupertino, CA). Počítačové programové 'vybavení pro posun • · · · 0 0 · 0 * * 0
9 9 9 9 9 9 9 9 99
9 9 9 9 9 9 9 999
9999 9999 0 999 99
9 9 9 9 9 9 99
9999 99 9 9999 stolku a funkce sběru dat lze realizovat komerčně dostupným laboratorním programovým vybavením, jako je Lab Windows, které lze obdržet od National Instruments.
Podložka 300 a stolek 302 jsou provozně spojeny s mikroskopem 306 majícím jednu nebo více objektivních čoček 308. které jsou schopné sběru a dodávky světla k mikročásticím fixovaným na podložce 300. Excitační svazek 310 ze světelného zdroje 312, kterým je přednostně laser, se zaměřuje na dělič 314 svazku, např. dichroické zrcadlo, které zaměřuje zpět svazek mikroskopem 306 a objektivními čočkami 308, které opět fokusují svazek na podložku 300. Čočka 308 sbírá fluorescenci 316 emitovanou z mikročástic a zaměřuje ji přes dělič svazku 314 na optiku 318 distribuce signálu, která opět zaměřuje fluorescenci na jedno nebo více vhodných optoelektronických zařízení pro konverzi určitých fluorescenčních charakteristik, např. intenzity, doby života a podobně na elektrický signál. Optika 318 distribuce signálu může zahrnovat řadu standardních komponent, jako jsou pásmové filtry, vláknová optika, rotační zrcadla, zrcadla a čočky fixované polohy, difrakční mřížky a podobné. Jak je ukázáno na obr. 5, optika 318 distribuce signálu zaměřuje fluorescenci 316 na čtyři oddělené fotonásobiče 330, 332, 334 a 336, jejichž výstup je potom spojen s předzesilovači a čítači fotonů 350, 352, 354 a 356. Výstup čítačů fotonů se sbírá počítačem 304, kde může být uložen, analyzován a pozorován na videu 360. Alternativně může být optikou 318 distribuce signálu difrakční mřížka, která zaměřuje fluorescenční signál 318 na dvourozměrné uspořádání CCD.
Stabilita a reprodukovatelnost polohové lokalizace při snímání určí do značné míry rozlišení pro oddělení těsně sousedících mikročástic. Přednostně by měly být snímací
9 9
99999 9 • · • · ·
9 ····
99
9·99 systémy schopny rozlišit těsné vedle sebe umístěné mikročástice vzdálené např. o průměr částice nebo méně. Proto pro většinu aplikací, např. použití mikročástic CPG, by měl mít snímací systém nejméně schopnost rozlišení objektů řádu 10 až 100 m. V určitých způsobech použití může být potřebné i vyšší rozlišení, avšak se zvýšeným rozlišením vzroste čas požadovaný pro plné snímání podložky a proto je u některých způsobů použití třeba učinit kompromis mezi rychlostí a rozlišením. Vzrůsty času snímání lze dosáhnout systémem, který snímá pouze polohy, kde je známo, že jsou umístěny mikročástice, například na základě počátečního plného snímání. Přednostně se vybírá rozměr mikročástic a rozlišení snímacího systému tak, aby se umožnilo rozlišení fluorescenčně značených mikročástic náhodně rozprostřených v rovině při hustotě mezi zhruba deseti tisíci a jedním stem tisíců mikročástic na
Při aplikacích sekvenování mohou být obsazené částice fixovány k povrchu podložky různými způsoby. Fixace by měla být dostatečně pevná, aby umožnila částicím podrobení následným cyklům expozice činidlům a promytí bez význačné ztráty. Když je podložkou sklo, může být jeho povrch derivatizován alkylaminovým linkerem s použitím komerčně dostupných činidel, např. Pierce Chemical, které opět mohou být sřetězeny s avidinem s použitím konvenčních chemických systémů pro vytvoření povrchu zpracovaného avidinem. Biotinové zbytky se mohou přivést k obsazeným mikročásticím řadou způsobů. Například frakce s 10 až 15 % klonovacích vektorů užitých pro připojení značky k polynukleotidům je vyvinuta tak, aby obsahovala jedno unikátní místo restrikce (zajišťující lepivé konce při digesci) bezprostředně přiléhající k polynukleotidové vložce na jednom konci polynukleotidu protějším vůči značce. Toto místo je vyříznuto s polynukleo54 tidem a značkou pro naneseni na mikročástice. Po nanesení bude mít okolo 10 až 15 % obsazených polynukleotidů jedinečné restrikční místo distálně od povrchu mikročástice. Po digescí připojenou restrikční endonukleázou se příslušný dvouvláknový adaptér obsahující biotinový zbytek naváže na lepivý konec. Výsledné mikročástice se potom rozprostřou na skleněném povrchu ošetřeném avidinem, kde se fixují pomocí spojů biotin-avidin.
V případě sekvenování navázáním se v počátečním stupni navázání alternativně a přednostně aplikuje směs sond na obsazenou mikročástici: určitá frakce sond obsahuje typ místa rozpoznání restrikce lis, jak se požaduje při postupu sekvenování, a určitý podíl sond nemá takové rozpoznávací místo, avšak namísto toho obsahuje biotinový zbytek jako jeho konec, který se nenavazuje. Přednostně obsahuje směs okolo 10 až 15 % biotinylované sondy.
V další alternativě, když se aplikují mikročástice obsazené DNA na skleněnou podložku, se může DNA nespecificky adsorbovat na skleněný povrch po dobu několika hodin, např. 24 hodin inkubace k vytvoření dostatečně pevné vazby, která umožňuje opakované expozice činidlům a promývání bez významné ztráty mikročástic. Přednostně je takovou skleněnou podložkou průtoková kyveta, která může zahrnovat kanál naleptaný ve skleněném sklíčku. Nejlépe je takový kanál uzavřen tak, aby mohly být tímto kanálem čerpány kapaliny a má hloubku dostatečně blízkou k průměru mikročástic, takže se zde zachytí monovrstva mikročástic v rámci definované oblasti pozorování.
Paralelní sekvenování • · · ···* · ··« • · · · · · ···« · ·«· · * • · · ··· · · · ······ ·· · · · ··
Značkovácí systém podle vynálezu může se použít spolu s metodami jednobázového sekvenování pro sekvenování polynukleotidů o délce až několik kilobází. Značkovací systém umožňuje třídění mnoha tisíc fragmentů cílového polynukleotidu na jeden nebo více pevných nosičů se současným sekvenováním. V souladu s preferovaným provedením metody se podíl každého tříděného fragmentu sekvenuje postupným způsobem na každé z mnoha tisíc obsazených mikročástic, které jsou fixovány k běžné podložce, jako je mikroskopické sklíčko spojené se snímacím systémem nebo se systémem analýzy obrazu, jak je popsáno výše. Velikost podílu sekvenovaných fragmentů závisí na několika faktorech, jako je počet vytvořených a tříděných fragmentů, délka cílového polynukleotidů, rychlost a přesnost použité jednobázové metody, počet mikročástic a/nebo diskrétních oblastí, které se mohou současně monitorovat a podobně. Přednostně se identifikuje 12 až 50 bází na každé mikročástici nebo oblasti a ještě vhodnější je identifikovat 18 až 30 bází na každé mikročástici či oblasti. S touto informací se určí sekvence cílového polynukleotidů utříděním 12-50 fragmentů bází prostřednictvím jejich překrývajících se oblastí, např. jak popisuje US patent č. 5 002 867. Následující odkaz zajišťuje přídavné vodítko při stanovení podílu fragmentů, které musí být sekvenovány pro úspěšnou rekonstrukci cílového polynukleotidů dané délky: Lander a Waterman, Genomics, 2, 231-239 (1988), Drmanac a kol., Genomics, 4, 114-128 (1989), Bains, DNA Sequencing and Mapping, 4, 143-150 (1993), Bains, Genomics, 11, 294-301 (1991), Drmanac a kol., J. Biomolecular Structure and Dynamics, 8, 1085-1102 (1991) a Pevzner, J. Biomolecular Structure and Dynamics, 7, 63-73 (1989). Přednostně má být délka cílového polynukleotidů mezi 1 kilobází a 50 kilobázemi. Ještě lepší je délka mezi 10 kilobázemi a 40 kilobázemi. Lander a Waterman (citováno výše) poskytují návod týkající se vztahu mezi počtem sekvenovaných fragmentů (to jest rozměrem vzorku), množstvím sekvenční informace obdržené od každého fragmentu a pravděpodobností možnosti rekonstruovat cílový polynukleotid z částečných frekvencí bez mezer nebo ostrůvků. Pro tento vynález jsou maximální rozměry polynukleotidů, které lze obdržet pro dané velikosti vzorků a velikosti sekvencí fragmentů ukázány níže:
Velikost vzorku Přibližná maximální délka cílového polynukleotidů
30 bází/fragment | 50 bází/fragment | |
1000 | 3 kilobáze | 4 kilobáze |
10000 | 22 kilobází | 32 kilobází |
20000 | 40 kilobází | 65 kilobází |
30000 | 60 kilobází | 85 kilobází |
100000 | 180 kilobází | 300 kilobází |
Fragmenty se mohou vytvářet z cílového polynukleotidů řadou způsobů včetně tak zvaných zaměřených přístupů, kdy se snažíme vytvořit soubory fragmentů pokrývajících cílový polynukleotid s minimálním překrýváním a tak zvané přístupy shotgun, kde se tvoří náhodně se překrývající fragmenty. Přednostně se pro vytvoření fragmentů používají přístupy shotgun díky jejich jednoduchosti a dostatečné rezervě, která je jim vlastní. Například náhodně se překrývající fragmenty, které pokrývají určitý cílový polynukleotid, se vytvoří následujícím konvenčním postupem sekvenování shotgun, např. jak je publikováno Sambrookem a kol. (citováno výše). Ve smyslu, jak je zde použito, znamená pokrývání v tomto kontextu, že každý podíl sekvence cílového polynukleotidů je ·** 9 9999
999· · · ····· ·· · ···· · · ·· • · · 9 · · ···· · ··· ··
9·· 9 · ···· ····<· ·· 9 ···♦ reprezentován v každém rozmezí rozměrů, např. všechny fragmenty o délce mezi 100 až 200 párů bází vytvořených fragmentů. Stručně řečeno, počínaje cílovým polynukleotidem jako vloženou složkou v příhodném klonovacím vektoru, např. fágu, se vektor expanduje, čistí a digeruje příslušnými restrikčními enzymy pro získáni okolo 10 až 15 μg čištěné vkládané složky. Obvykle postup vede zhruba k 500 až 1000 subklonům na mikrogram počáteční DNA. Vložená složka se separuje od fragmentů vektoru preparační gelovou elektroforézou, odstraňuje z gelu konvenčními metodami a resuspenduje se ve standardním pufru (ústojném roztoku), jako je TE (Tris-EDTA). Restrikční enzymy vybrané pro excizi vložené složky z vektoru přednostně ponechávají lepivé konce na vložené složce, takže ta může být sama navázána při přípravě na vytvoření náhodně se překrývajících fragmentů. Jak bylo vyloženo Sambrookem a kol. (citováno výše), poskytuje cirkularizovaná DNA lepší náhodnou distribuci fragmentů než lineární DNA ve fragmentačních metodách použitých níže. Po samonavázání vložené složky, např. pomocí T4 ligázy s použitím konvenčních postupů, se čištěná navázaná vložená složka fragmentuje podle standardního postupu, například působením ultrazvuku nebo digescí DNázou I v přítomnosti manganatých iontů. Po fragmentaci se konce fragmentů opraví, např. jak popisuje Sambrook a kol. (citováno výše) a opravené fragmenty se separují s použitím gelové elektroforézy. Fragmenty v rozmezí 300 až 500 párů bázi se vyberou a eluují z gelu konvenčními prostředky a naváží do vektoru nesoucího značku, jak je popsáno výše pro vytvoření knihovny konjugátů značka-fragment.
Jak bylo popsáno výše, vzorek obsahující několik tisíc konjugátů značka-fragment se odebere z knihovny a expanduje, načež se vložené složky značka-fragment
·· | • 0 | ·♦ | • | ·· | ·· | |||
• · | • · | • | • | • | • · | • | • | |
• | • | • | • | • · | • · | ·· | ||
• | • | • · | • | • | ···· | » ·· · | • | • |
• · | • | • · | • | • | • | • | ||
• · | ···· | • 4 | • | ·· |
vyříznou z vektoru a připraví pro specifickou hybridizaci s komplementy značky na mikročásticích podle popisu výše. V závislosti na velikosti cílového polynukleotidu lze odebrat z knihovny značka-fragment více vzorků a odděleně je expandovat, nanést na mikročástice a sekvenovat. Jak bylo diskutováno výše, bude počet zvolených dublů záviset na frakci repertoáru značky zastoupené ve vzorku. (Pravděpodobnost obdržení trojic - tří různých nukleotidů se stejnou značkou - nebo většího počtu lze bezpečně ignorovat). Jak je zmíněno výše, pravděpodobnost dublů ve vzorku lze určit z Poissonovy distribuce p(dubl)=m2e”m/2, kde m je frakce repertoáru značky ve vzorku. Tabulka 8 níže uvádí pravděpodobnosti obdržení dublů v určitém vzorku pro danou velikost značky, rozměr vzorku a diverzitu repertoáru.
• · *« · · · * · · · ···· ··· ···· • < · · · · « · · · · • · · · · ······ ···· · ··· · · · · · <b>
• · · · · · ·» · ® ♦ e ·
Tabulka 8 | Velikost vzorku | Odebraná frakce repertoáru | Pravděpodobnost dublu | |
Počet slov ve značce ze souboru 8 slov | Velikost repertoáru značek | |||
7 | 2,1 x 106 | 3000 | 1,43 x 10“3 | 106 |
8 | 1,68 X 107 | 3 x 104 3000 | 1,78 x 10“3 1,78 x 104 | 1,6 x 10’6 1,6 X 10“8 |
9 | 1,34 X 108 | 3 X 105 3 X 104 | 2,24 x 103 2,24 x 10“4 | 2,5 X 106 2,5 X 10-8 |
10 | 1,07 X 109 | 3 X 106 3 X 105 | 2,8 X 103 2,8 X 10~4 | 3,9 x 10“6 3,9 X 10“8 |
V každém případě se nanesené mikročástice poté dispergují a fixují na skleněné mikroskopické sklíčko, nejlépe pomocí vazby avidin-biotin. Nejlépe se současně sekvenuje nejméně 15 až 20 nukleotidů každého z náhodných fragmentů pomocí jednobázové metody. Sekvence cílového polynukleotidu se potom rekonstruuje sběrem parciálních sekvencí náhodných fragmentů metodou jejich překrývajících se částí s použitím algoritmů podobných těm, které se používají pro shromažďování contigs nebo, jak byly vyvinuty pro sekvenování hybridizací publikované v citacích výše.
Soupravy pro provedení způsobu podle tohoto vynálezu
Tento vynález zahrnuje soupravy pro provádění různých ztělesnění tohoto vynálezu. Přednostně zahrnují soupravy podle tohoto vynálezu repertoár komplementů značky přípoje• · « ·
- 60 ných k pevnému nosiči. Navíc mohou soupravy podle tohoto vynálezu zahrnovat odpovídající repertoár značek, např. jako primery pro amplifikaci polynukleotidů, jež se mají třídit nebo jako elementy klonujících vektorů, které se mohou též použít pro amplifikaci tříděných polynukleotidů. Přednostně se repertoár komplementů značky připojuje na mikročástice. Soupravy mohou též obsahovat příslušné pufry pro enzymatické zpracování, detekční chemické systémy, např. fluorescenční či chemiluminiscenční značky a podobně, instrukce pro použití, enzymy pro zpracování, jako jsou ligázy, polymerázy, transferázy, atd. V důležitém způsobu použití pro sekvenování mohou soupravy též zahrnovat substráty, jako jsou mikroskopická sklíčka zpracovaná avidinem pro fixaci nanesených mikročástic pro zpracování.
Identifikace nových polynukleotidů v knihovnách cDNA
Nové polynukleotidy v určité knihovně cDNA mohou být identifikovány vytvořením knihovny molekul cDNA připojených k mikročásticím, jak bylo popsáno výše. Velký podíl této knihovny nebo dokonce celá knihovna, se potom může částečně sekvenovat paralelně. Po izolaci mRNA a případné normalizaci populace, jak informují Soares a kol., Proč. Nati. Acad. Sci., 91, 9228-9232 (1994) nebo jiné odkazy, se může následující primer hybridizovat na polyA chvosty pro syntézu prvního vlákna s reverzní transkriptázou s použitím konvenčních postupů:
-mRNA- [A]n - 3 [T]ig-[místo primeru]-GG[W,W,W,C]gACCAGCTGATC-5 kde [W,W,W,C]g představuje značku, jak bylo popsáno výše, ACCAGCTGATC je zvolená sekvence tvořící restrikční místo v dvouvláknové formě a místo primerů je sekvence společná pro všechny členy knihovny, která se dále používá jako vazebné místo primerů pro amplifikaci daných polynukleotidů pomocí PCR.
φ φφ Φ· i φ φ · • · ·· • · · · · • · φ • φ φφ
Po reverzní transkripci a syntéze druhého vlákna kon venčními technikami se dvouvláknové fragmenty vkládají do klonovacího vektoru, jak bylo popsáno výše, a amplifikují. Z amplifikované knihovny se potom odebírá vzorek a ten se amplifikuje. Klonovací vektory z amplifikovaného vzorku se izolují a označené fragmenty cDNA se vyříznou a čisti. Poté co byly značky učiněny jednovláknovými pomocí polymerázy, jak bylo popsáno výše, se fragmenty metylují a třídí na mikročásticích v souladu s vynálezem. Přednostně, jak bylo popsáno výše, se klonovací vektor konstruuje tak, že mohou být označené cDNA vyříznuty pomocí endonukleázy jako Fok I, což umožní okamžité sekvenování preferovanou jednobázovou metodou po třídění a navázání na mikročástice.
Postupné sekvenování se potom provádí současně na celé knihovně nebo na jedné či více velkých frakcích knihovny v souladu s vynálezem až do identifikace dostatečného počtu nukleotidů na každé cDNA pro jedinečnou reprezentaci v genomu organismu, od kterého je knihovna odvozena. Např. jestliže je knihovna odvozena od savčí mRNA, potom se očekává, že náhodně zvolená sekvence dlouhá 14 až 15 nukleotidů bude mít jedinečné zastoupení mezi 2 až 3 tisíci megabází typického savčího genomu. Identifikace mnohem menšího počtu nukleotidů bude ovšem postačovat pro jedinečnou reprezentaci v knihovně odvozené od bakterií nebo jiných nižších organismů. Přednostně se identifikuje nejméně 20 až 30 nukleotidů pro zajištění reprezentace a pro umožnění tvorby vhodného primerů, jak je popsáno níže. Tabulované sekvence mohou být potom srovnávány se známými sekvencemi pro identifikaci jedinec62 • to • · · · ných cDNA.
Jedinečné cDNA se poté izolují konvenčními metodami, např. vytvořením sondy z amplikonu PCR produkovaného primery namířenými na první místo a podílu cDNA, jejíž sekvence se určovala. Sonda může potom být použita pro identifikaci cDNA v knihovně s použitím konvenčního screeningového postupu.
Výše uvedený postup pro identifikaci nových cDNA se též může použít pro fingerprint populací mRNA bud v izolovaných měřeních nebo v kontextu dynamicky se měnící populace. Parciální sekvenční informace se obdrží současně z velkého vzorku, např. 10 až 100 tisíc nebo více cDNA připojených k odděleným mikročásticím, jak je popsáno v postupu výše. Frekvenční distribuce parciálních sekvencí může identifikovat populace mRNA z různých typů buněk či tkání stejně tak jako z patologických tkání, jako jsou nádory. Takové fingerprints mRNA jsou užitečné při monitorování a diagnóze chorobných stavů, například mezinárodní patentová přihláška PCT/US95/21944, která popisuje použití expresních sekvenčních značek (EST) pro tentýž účel.
Sekvenování cyklu na mikročásticích s nanesenými tříděnými polynukleotidy
Paralelní sekvenování lze též uskutečnit v souladu s vynálezem konvenčními sekvenovacími metodami, které vyžadují vytvoření a separaci značených fragmentů DNA. Zejména se mohou použít izolované mikročástice s nanesenou jednotnou populací matric pro vytvoření značených produktů rozšíření sekvenováním cyklu. Sekvenování cyklu je dobře známá varianta základního Sangerova přístupu sekvenování DNA, která je úplně popsána v následujících odkazech: Craxton, Methods, sv. 2 (únor 1991), Wozny, evropská patentová publikace č.
409 078 A2 (23. ledna 1991), Fuller, Mezinárodní patentová přihláška PCT/US92/07303, a Fuller, Mezinárodní patentová přihláška PCT/US94/03264. Stručně řečeno, ve standardní sekvenovací reakční směsi se užívá termostabilní polymeráza, takže lze provést opakované rozšiřovací reakce na téže matrici. To umožňuje, aby malá množství matrice vytvořila dostatečná množství produktu extenze pro detekci po separaci elektroforézou. Obvykle zahrnuje sekvenování cyklu kroky (a) zajištující pro směs sekvenovací reakce matrici, primer, nukleosidtrifosfáty, nukleosidtrifosfáty zakončující řetězec a termostabilní DNA polymerázu, (b) denaturaci matrice, (c) připojení primerů k denaturované matrici, (d) extenzi příměru k vytvoření produktů extenze a (e) opakování kroků (b) až (d) do nahromadění dostatečných množství produktů extenze tak, že je možná jejich detekce při separaci. Počet opakování cyklů závisí na mnoha faktorech včetně množství a kvality počáteční matrice, použitého detekčního systému, použitého separačního systému a podobně. Jak je obvyklou praxí, opakuje se cyklus extenze většinou lOx až lOOx, množství matrice je v rozmezí pouhých několik desítek femtomolů až několik desítek pikomolů, denaturační stupeň se provádí zahříváním reakční směsi na teplotu v rozmezí 92 až 95°C, stupeň připojování nastává při teplotě v rozmezí 35 až 75°C a stupeň extenze nastává při teplotách v rozmezí 65 až 85°C s termostabilní DNA polymerázou, jako je Taq nebo Vent (k obdržení od Perkin-Elmer Corp., Norwalk, CT respektive New England Biolabs).
Komplementy značky lze připravit na magnetických mikročásticích, jak popsal Albretsen a kol., Anal. Biochem., 189, 40-50 (1990), což umožňuje dodání několika fentomolů komplementů značek na magnetické kuličky o průměru 4,5 μιη.
Komplementy značek lze připojit k mikročásticím konci nebo 3 . Jestliže se připojí konci 5 , potom mohou být matrice tříděny specifickou hybridizaci značek při koncích . V tomto způsobu provedení má matrice komplement primeru při svém konci 5 , jak je ukázáno níže:
-[značka oligonukleotidu]-[matrice]-[komplement primeru]-5
Komplement označení se poté prodlouží na délku matrice, takže se obdrží komplement matrice, který se kovalentně připojí k mikročástici. Matrice se potom odstraní zahříváním a mikročástice se promyjí. Po separaci mikročástic, např. proudovým tříděním, se provedou opakované cykly připojování primerů, extenze a denaturace.
Jestliže se komplementy značky připojují na mikročástice svými konci 3 , což umožňuje provádět vhodnou syntézu přímo na mikročásticích, je pořadí komplementu oligonukleotidové značky a primeru převráceno, jak je ukázáno níže:
-[značka oligonukleotidu]-[matrice]-[komplement primeru]-3
Konec 5 komplementu značky se též fosforyluje, např. s použitím komerčně dostupných činidel. Po specifické hybridizaci přes označení oligonukleotidu se primer připojí na komplement primeru na konci 3 matrice a podrobí extenzi DNA polymerázou bez nukleázové aktivity 3 —> 5 . Zářez po této reakci extenze se potom připojí a původní matrice se odstraní zahříváním. Po oddělení mikročástic lze provést sekvenování cyklů jako výše.
Separaci obsazených mikročástic lze provést proudovým tříděním, kde jsou suspendované mikročástice unášeny, aby ·· prošly tryskou, a v kapalném proudu, který je rozbit na pravidelnou řadu nabitých částic, které jsou zaměřeny na předem určené cílové nádoby, jamky či jiná reakční místa na podložce. Mikročástice se vhodným způsobem detekují v proudu na základě rozptylu světla a velikost rozptylu se používá k určení, zda kapička obsahuje žádnou, jednu nebo více mikročástic. Zvláště užitečný přístroj pro takové třídění proudu a dodávku sekvenovacího činidla je publikován v Brennan, mezinárodní přihláška PCT/US94/05896. Když se jednotlivé obsazené mikročástice distribuují na více reakčních míst nebo jamkách s příslušnými sekvenovacími činidly, lze sbírku reakcí termálně cyklovat dohromady pro vytvoření produktů extenze. Po dokončení cyklování se produkty extenze separují elektroforézou. Přednostně se elektroforetické dělení provádí kapilární elektroforézou v separačním médiu bez gelu, což umožňuje vhodné dodávání a rychlou separaci extenzních fragmentů. Je též k dispozici přístroj, který umožňuje detekci čtyřbarevnou fluorescencí velkého množství vzorků v podstatě současně, např. typ popsaný Mathiesem a Huangem, Nátuře, 359, 167-169 (1992), Huangem a kol., Anal. Chem., 64, 2149-2154 (1992), Huangem a kol., Anal. Chem., 64, 967-972 (1992) či podobné. Je vhodné provádět současně několik tisíc reakcí sekvenování cyklu. Ještě vhodnější je vytřídit směsi matric na populaci mikročástic mající repertoár značek oligonukleotidů mezi 1000 a 10000 různými typy·
Třídění sond pro více umístění pro genotypickou analýzu
Mnoho chorobných stavů a/nebo náchylností vůči nemoci je spojeno s komplexními genetickými znaky a/nebo typy mutace, např. typ HLA, typ mutace genu p53 při mnoha typech rakoviny, gen cystické fibrózy, Leschův-Nyhanův syndrom,
Duchennova svalová dystrofie a podobně. Lander a kol., Science, 265, 2037-2048 (1994), Collins, Science, 256, 774-779 (1992), Tsui a kol., mezinárodni patentová přihláška PCT/CA90/00267, Hedrum a kol., Biotechniques, 17, 118-129 (1994), Santamaria a kol., mezinárodní patentová přihláška PCT/US92/01675, Chamberlain a kol., Nucleic Acids Research, 16, 11141-11156 (1988) a podobně. Jeden z přístupů k vytvoření vhodných rozborů pro takové komplexní genetické znaky spočíval v použití tak zvaných multiplexních PCR nebo multiplexních ligačních rozborů, jak popsal Chamberlain a kol. (citováno výše) nebo Grossman a kol., mezinárodní patentová přihláška PCT/US93/03229. Takové techniky obvykle žádají současnou amplifikaci více genetických sekvencí ve stejné reakční směsi s následnou specifickou detekcí daných sekvencí. Oligonukleotidové značky podle tohoto vynálezu mohou zajistit jednoduché a vhodné prostředky pro identifikaci genetických sekvencí, které se v takových rozborech amplifikují. Ve své nejjednodušší formě se může provedení tohoto vynálezu uplatnit připojením oligonukleotidových značek k primerům PCR užitým v multiplexním PCR. Jeden primer páru nese oligonukleotidovou značku a druhý primer páru nese záchytný zbytek, jak bylo popsáno výše, který umožňuje izolaci a následné uvolnění úspěšně amplifikovaných sekvencí. Po uvolnění se sekvence aplikují na pevný nosič mající soubor komplementů značek připojených na předem definovaných prostorových adresách. Typ specifické hybridizace značek se potom detekuje pro identifikaci genotypu vzorku.
V preferovaném způsobu provedení se užívá PCR pro amplifikaci dané genetické sekvence, která obsahuje více cílových míst, to jest více míst, kde se vyskytují mutace nebo sekvence vztahující se k onemocnění. Přednostně se užívají pouze dva nebo velice málo párů primerů pro amplifi«· · · ·» · • · * · * ·· • · · · ·· • · φ « ·· ·
• · * « 0 * · kaci cílové sekvence, aby se předešlo obtížím spojeným s multiplexním PCR, jako je vyrovnávání cílových délek, teploty připojování primerů a podobně. Po amplifikaci se detekují specifické genotypy způsobem analogickým metodě popsané Grossmanem a kol. (citováno výše) a Grossmanem a kol., US patent č. 5 514 543, kde odkazy zajištují vodítko při volbě PCR a podmínek reakce připojování, rozměrů sondy připojování a podobně. V těchto odkazech se cílová sekvence amplifikuje podobně, načež se aplikuje soubor ligačních sond v přítomnosti DNA ligázy. Ligační sondy se skládají ze dvou oddělených sekvencí, které jsou obě komplementární k cíli, který je potenciálně přítomen v analyzovaném vzorku: jedna se připojí k elektrickému modifikátorú pohyblivosti a druhá k fluorescenční značce. Jestliže tyto dvě sondy vytvářejí dokonalé duplexy s cílovou frekvencí ve vzorku, připojí se tak, že zbytek modifikující pohyblivost je nyní připojen k fluorescenční značce přes navázané sekvence komplementární k cíli. Komponenty směsi se potom elektroforeticky separují tak, že typ fluorescenčních pásů na gelu je indikativní pro genotyp přítomného terče ve vzorku. Jak je vidět na obr. 3, mohou se místo modifikátorú elektrické pohyblivosti použít oligonuleotidové značky podle tohoto vynálezu a prostorové separace lze dosáhnout tříděním navázaných sekvencí na jednotlivá umístění na pevném nosiči. Návrat k obr. 3 ukazuje, že se cílová sekvence 200 amplifikuje, nejlépe pomocí PCR, načež se aplikuje 204 soubor sond 206 až 216 k denaturovanému amplikonu. V tomto způsobu použití zahrnují ligační sondy 206 oligonukleotidové značky, první sekvenci 208 komplementární k cílové sekvenci a druhou sekvenci 210 komplementární k cílové sekvenci a blízkou k první sekvenci (tak, že pokud jsou obě dokonale komplementární k cílové sekvenci, jsou schopny připojení), chvost 212 nesoucí prostředky pro vytváření signálu 214. Nej lepším prostřed68 kem tvorby signálu 214 je fluorescenční značka. Je nejvhodnější, jsou-li první a druhá sekvence ligačních sond navázány DNA ligázou, proto musí být konec 5 přiléhajících sekvencí 216 fosforylován, např. fosforylačním činidlem popsaných v Urdea a kol., US patent č. 5 332 845. Po použití ligačních sond a ligázy se sondy tvořící dokonale spárované duplexy s cílovou sekvencí kovalentně spojí 218 a 220. Duplexy sonda-cíl se potom denaturují a aplikují pod 222 na pevný nosič, který má komplement značky připojený k dobře definovaným prostorovým umístěním pro každé označení tx až tk. Po vymytí nespecificky vázaných sekvencí se prostorová umístění odpovídající komplementům oligonukleotidových značek tx a t j , které byly navázány na fluorescenční značky, osvětlí, jak je ukázáno na obr. 3 pod 226 a 228. Obraz osvětlených fluoroforů na pevném nosiči ukazuje genotyp cílové sekvence ve vzorku. V tomto způsobu použití tohoto vynálezu je nejvhodnějši, když existuje korespondence jeden na jeden mezi značkou a prostorovou adresou na pevném nosiči. Další preferencí tohoto způsobu použití je současná identifikace nejméně 20 genových čílů a ještě lépe použití na současnou detekci nejméně 50 genových cílů.
Obecně se může tento způsob použití tohoto vynálezu provést následujícími kroky pro detekci přítomnosti či nepřítomnosti plurality zvolených cílových sekvencí v cílovém polynukleotidú: (1) přídavek plurality ligačních sond k cílovému polynukleotidú, kde každá ligační sonda zahrnuje první oligonukleotid a druhý nukleotid, které jsou komplementární v sekvenci k přilehlým částem toho, který byl zvolen pro cílové sekvence v cílovém polynukleotidú, přičemž první oligonukleotid má připojenou oligonukleotidovou značku a každá oligonukleotidová značka je zvolena pro stejný minimálně zkříženě hybridizující soubor a každá ligační sonda má ·· ·· « · · 9 ·· · • 9 9
99
9 9 99 9
9 99
99
999 jinou oligonukleotidou značku; (2) hybridizace ligačních sond cílovým polynukleotidem; (3) zpracování hybridizovaného prvního a druhého oligonukleotidu za podmínek efektivních pro navázání prvního a druhého oligonukleotidu, jakmile první a druhý oligonukleotid vytváří dokonale spárované duplexy s přilehlými cílovými sekvencemi; (4) separace navázaného prvního a druhého oligonukleotidu od nenavázaného prvního a druhého oligonukleotidu; (5) třídění navázaného prvního a druhého oligonukleotidu specifickou hybridizací oligonukleotidových značek s jejich odpovídajícími komplementy, kde odpovídající komplementy jsou připojeny jako jednotné populace v podstatě identických oligonukleotidů v prostorově diskrétních oblastech na jednom nebo více pevných nosičích a (6) detekce přítomnosti či nepřítomnosti zvolených cílových sekvencí na základě přítomnosti či nepřítomnosti navázaného prvního a druhého oligonukleotidu na jeden nebo více pevných nosičů.
Příklady provedení vynálezu
Příklad 1
Třídění vícečetných cílových polynukleotidů odvozených od pUC19
Směs tří konjugátů cílový polynukleotid-značka se obdrží následujícím způsobem: nejprve se syntetizuje následujících šest oligonukleotidů a kombinují se po párech k vytvoření značky 1, značky 2 a značky 3:
-pTCGACC (w1) (w2) (w3) (w4) (w5) (w6) (w?) (wg) (w3) A
GG (**) (**) (**) (**) (**) (**) (**) (**) (**) TTCGAp-5
Značka 1
5 -pTCGACC GG | (w6) (**) | (w7) (**) | (Wg) (**) | (WjJ (**) Značka | (w2) (**) 2 | (W6) (**) | (w4) (**) | (w2) (**) | (w-J (**) | A TTCGAp-5 |
5 -pTCGACC | (w3) | (w2) | (w-J | (w-J | (w5) | (Wg) | (Wg) | (w4) | (w4) | A |
GG | (**) | (**) | (**) | (**) | (**) | (**) | (**) | (**) | (**) | TTCGAp-5 |
Značka 3 kde p značí monofosfát, Wznačí podjednotky definované v tabulce 2 a symboly ( ) představují jejich odpovídající komplementy. pUC19 se digeruje pomocí Sal I a Hind III, velký fragment se čistí a odděleně naváže ke značkám 1, a 3 k vytvoření pUC19-l, pUC19-2 respektive pUC19-3. Tyto tři rekombinanty se odděleně amplifikují a izolují, načež se pUC19-l digeruje pomocí Hind III a Aat I, pUC19-2 se digeruje pomocí Hind III a Sssp I a pUC19-3 se digeruje pomocí Hind III a Xmn I. Malé fragmenty se izolují s použitím konvenčních postupů k obdržení tří dvouvláknových fragmentů o délce okolo 250, 375 respektive 575 párů bází, kde každý má recesované vlákno 3 přilehlé ke značce a tupé nebo vyčnívající vlákno 3 na opačném konci. Zhruba 12 mmolů každého fragmentu se smísí s 5 jednotkami T4 DNA polymerázy v reakčním ústojném roztoku doporučeném výrobcem obsahujícím 33 M deoxycytosintrifosfátu. Reakční směs se inkubuje při 37 °C po dobu 30 minut, načež se reakce zastaví umístěním na led. Fragmenty se poté čistí konvenčními prostředky.
Mikročástice CPG (rozměr částice 37-74 mm, velikost pórů 50 nm, Pierce Chemical), jsou derivatizovány linkerem publikovaným Maskosem a Southernem, Nucleic Acids Research, 20, 1679-1684 (1992). Po rozdělení na tři alikvóty se komplementy značek 1, 2 a 3 syntetizují na mikročásticích
- 71 ·· ·· · ·· •· ·· • Φ · ·· • ·· s použitím konvenčního automatizovaného syntetizátoru DNA, např. syntetizátor modelu 392 DNA (Applied Biosystems, Foster City, CA). Zhruba 1 mg každých z rozdílně derivatizovaných mikročástic se umístí do oddělených nádob.
Fragmenty zpracované T4 DNA polymerázou vyříznuté z pUC19-l, -2 a -3 se resuspendují v 50 1 ústojného roztoku doporučeného výrobcem pro Taq DNA ligázu (New England Biolabs). Směs se potom rozdělí stejným dílem mezi tři nádoby, kde každá obsahuje 1 mg derivatizovaných mikročástic CPG. 5 jednotek Taq DNA ligázy se přidá do každé nádoby, načež se tyto nádoby inkubují při 55 °C po dobu 15 minut. Reakce se zastaví umístěním na led a mikročástice se několikrát promyjí opakovanou centrifugací a resuspendováním v TE. Konečně se mikročástice resuspendují v reakčním ústojném roztoku Nde I (New England Biolabs), kde se připojené polynukleotidy digerují. Po oddělení od mikročástic se fragmenty polynukleotidů uvolněné digescí Nde I fluorescenčně značí inkubací se sekvenční DNA polymerázou a fluoresceinem značeným thymidinfosfátem (Applied Biosystems, Foster City, CA). Tyto fragmenty se potom oddlělené analyzují na nedenaturujícím polyakrylamidovém gelu s použitím sekvenovacího zařízení Applied Biosystems model 374 DNA.
Příklad 2
Paralelní sekvenování fragmentů SV40
Repertoár 36-merních značek skládajících se z devíti 4-nukleotidových podjednotek zvolených z tabulky 2 se připraví oddělenou syntézou značek a komplementů značek postupem štěpení a míšení, jak je popsáno výše. Tento repertoár se též syntetizuje tak, aby byla umožněna ligace do Srna I/Hind III digerovaného M13mpl9. Proto, jako v příkladu 1, • · • · ···· · jeden soubor oligonukleotidů začíná přídavkem A s následujícími devíti běhy syntézy štěpení a míšení, kde dochází k extenzi oligonukleotidu podjednotkovým způsobem pomocí 4-merů derivatizovaných 3 -fosforamiditem odpovídajících podjednotkám z tabulky 2. Syntéza se potom ukončí přídavkem jednoho nukleotidu po druhém na jednu polovinu rozpoznávacího místa Sma I (GGG), dvou C a 5 -monofosfátu, např. přes činidlo Phosphate-ON, které lze obdržet od Clontech Laboratories (Palo Alto, CA). Další soubor oligonukleotidů začíná přídavkem tří C (místo rozpoznání části Sma I) a dvou G s následujícími devíti koly syntézy štěpení a míšení, kde dochází k extenzi oligonukleotidu o 4-mery derivatizované 3 -fosforamiditem odpovídající komplementům podjednotek v tabulce 2. Syntéza se dokončí přídavkem rozpoznávacího místa Hind III po jednotlivých nukleotidech a 5 -monofosfátu. Po oddělení z nosičů syntézy se oligonukleotidy smísí za podmínek, které umožňují vytvoření následujících duplexů:
-pGGGCC (w±) (w-J (wp (WjJ (w±) (WjJ (w±) (W.J A
CCCGG (**) () (**) (**) (**) (**) (**) (**) (“) TTCGAp-5
Směs duplexů se potom naváže na M13mpl9 digerovaný Sma I/Hind III. Repertoár komplementů značek se syntetizuje na mikročásticích CPG, jak je popsáno výše.
Připraví se následující adaptér, který obsahuje místo Fok I a podíly míst Eco RI a Sma I:
-pAATTCGGATGATGCATGCATCGACCC GCCTACTACGTACGTAGCTGGGp-5
ECO RI Fok I
Sma I ·· ·· ·· · ·· ·· • · 9 · ······« • · · 9 9 9 9 9 999
9 · 9 9 999999 99999
9 9 9 9 9 9 99
9999 99 9 9999
Tento adaptér se potom naváže do M13 digerovaného Eco Rl/Sma, jak je popsáno výše.
Odděleně se fragmentuje SV40 DNA účinkem ultrazvuku podle postupu udaného Sambrookem a kol. (citováno výše). Výsledné fragmenty se opětovně páruji s použitím standardních postupů a rozdělují podle velikosti. Fragmenty v rozmezí 300 až 500 párů bází se volí a navazují na M13 digerovaný Srna I, jak je popsáno výše, pro vytvoření knihovny konjugátů fragment-značka s následující amplifikací. Odebere se vzorek obsahující několik tisíc různých konjugátů fragment-značka z knihovny, provede se další amplifikace a vložené složky fragment-značka se vyříznou digescí pomocí Eco RI a Hind
III. Vyříznuté konjugáty fragment-značka se zpracují pomocí T4 DNA polymerázy v přítomnosti deoxycytidintrifosfátu, jak je popsáno v příkladu 1 pro expozici oligonukleotidových značek pro specifickou hybridizaci na mikročástice CPG.
Po hybridizaci a navázání, jak je popsáno v příkladu 1, se obsazené mikročástice zpracují pomocí Fok I pro získání 4-nukleotidového vyčnívajícího vlákna o předem určené sekvenci. Směs 10:1 (sonda 1:sonda 2) následujících sond se navazuje na polynukleotidy na mikročásticích.
Sonda 1 FAM- ATCGGATGAC
TAGCCTACTGAGCT
Sonda 2 biotin- ATCCAATGAC
TAGGTTACTGAGCT
FAM znamená fluorescenční barvivo připojené na 5 -hydroxyl na vrchním vláknu sondy 1 přes aminofosfátový linker, který lze obdržet od Applied Biosystems (Aminolinker). Biotin může • · · · být též připojen přes aminolinkerový zbytek a na základě volby může být dále prodloužen polyetylenoxidovými linkery, např. Jaschke a kol. (citováno výše).
Obsazené mikročástice se potom deponují na povrchu sklíčka zpracovaného avidinem, na které a ze kterého lze dodat a odstranit činidla a promývací roztoky. Sklíčko zpracované avidinem s připojenými mikročásticemi se zkoumá pomocí snímacího fluorescenčního mikroskopu (např. Zeiss Axioskop vybavený řadičem Newport Model PM500-C, argonovým iontovým laserem Spectra-Physics Model 2020 poskytujícím excitační svazek 488 nm a emisním filtrem 520 nm, nebo jiné zařízení). Excitační svazek a fluorescenční emise se přivádějí respektive sbírají přes stejné objektivní čočky. Excitační svazek a sbíraná fluorescence jsou odděleny dichroickým zrcadlem, které zaměřuje sbíranou fluorescenci přes řadu pásmových filtrů a k zařízením pro počítání fotonů odpovídajícím monitorovaným fluoroforům, např. zahrnujícím fotonásobiče Hamamatsu model 9403-02, zesilovač Stanford Research Systems model SR445 a mnohokanálový čítač SR430 a digitální počítač, např. počítač na bázi 486. Počítač vytváří dvourozměrnou mapu, sklíčka s registrací umístění mikročástic.
Po štěpení pomocí Fok I pro odstranění počáteční sondy se polynukleotidy na připojených mikročásticích podrobí 20 cyklům navázání sondy, promytí, detekce, štěpení a promytí v souladu s preferovanou metodou jednobázového sekvenování popsanou níže. Při každém detekčním kroku zaznamenává snímací systém fluorescenční emisi odpovídající bázi identifikované na každé mikročástici. Reakce a promytí uvedené níže se obecně provádějí pomocí ústojných roztoků doporučených výrobci (New England Biolabs) pro použité enzymy, pokud není uvedeno jinak. Standardní ústojné roztoky jsou také popsány Sambrookem a kol. (citováno výše).
Jsou k dispozici následující čtyři soubory směsných sond pro přidání k cílovým polynukleotidům:
TAMRA- ATCGGATGACATCAAC
TAGCCTACTGTAGTTGANNN
FAM- ATCGGATGACATCAAC
TAGCCTACTGTAGTTGCNNN
ROX- ATCGGATGACATCAAC
TAGCCTACTGTAGTTGGNNN
JOE- ATCGGATGACATCAAC
TAGCCTACTGTAGTTGTNNN kde TAMRA, FAM, ROX a JOE jsou spektrálně rozlišitelné fluorescenční značky připojené pomocí Aminolinkeru II (vše lze obdržet od Applied Biosystems, lne., Foster City, Kalifornie); polotučně vytištěné nukleotidy jsou místem rozpoznání pro Fok I endonukleázu a N znamená jeden z těchto čtyř nukleotidů A, C, G, T. TAMRA (tetrametylrhodamin), FAM (fluorescein), ROX (rhodamin X) a JOE (2 ,7 -dimetoxy-4 ,5 -dichlórfluorescein) a jejich připojení na oligonukleotidy jsou též popsány Fungem a kol., US patent Č. 4 855 225.
Výše uvedené sondy se inkubují ve zhruba 5-molárním přebytku konců cílového polynukleotidu následujícím způsobem: sondy se inkubují po dobu 60 minut při 16°C s 200 jednotkami T4 DNA ligázy a ukotveným cílovým polynukleotidem v T4 DNA ligázovém ústojném roztoku. Po promytí se cílový polynukleotid inkubuje se 100 jednotkami T4 polynukleotidki-
• · · · ·· φφ • · · · φ φ φ φφφ φφφ • φ ♦♦ φ · φ « φ názy v ústojném roztoku doporučeném výrobcem po dobu 30 minut při 37°C, promyje a opět inkubuje po dobu 30 minut při 16°C pomocí 200 jednotek T4 DNA ligázy a ukotveného cílového polynukleotidu v T4 DNA ligázovém ústojném roztoku. Promytí se dosáhne následnými proudícími objemy promývacího ústojněho roztoku přes sklíčko, např. TE, publikováno v Sambrook a kol. (citováno výše). Po cyklu navázání-fosforylace-navázání a konečném promytí se připojené mikročástice snímají ohledně přítomnosti fluorescenční značky, jejíž polohy a charakteristiky se zaznamenávají snímacím systémem. Značený cílový polynukleotid, to jest navázaný komplex, se poté inkubuje s 10 jednotkami Fok I v ústojném roztoku doporučeném výrobcem po dobu 30 minut při 37°C s následujícím promytím v TE. Výsledkem je, že se cílový polynukleotid zkrátí o jeden nukleotid na každém vlákně a je připraven pro příští cyklus navázání a štěpení. Tento proces pokračuje až do dosažení identifikace 20 nukleotidů.
Příklad 3
Tvorba knihovny označení
Příklad knihovny označení se vytvoří následujícím způsobem pro obdržení chemicky syntetizovaných 9-slovních značek nukleotidů A, G a T definovaných vzorcem:
-TGGC-[4(A,G,T)g]-CCCCp kde [4(A,G,T)9] znamená směs značek, ve které se každá značka skládá z devíti 4-merních slov A, G a T a p značí 5 -fosfát. Tato směs se naváže na následující levou a pravou oblast primerů:
• 9 99 • 9 9 9
9« 9 • 9 9
- AGTGGCTGGGCATCGGACCG
TCACCGACCCGTAGCCp
- GGGGCCCAGTCAGCGTCGAT
GGGTCAGTCGCAGCTA
LEVÁ
PRAVÁ
Levá a pravá vazebná oblast primeru se naváže k výše uvedené směsi značek, načež se jednovláknová část navázané struktury naplní DNA polymerázou, potom se smísí s levým a pravým primerem uvedeným níže a amplifikuje pro získání knihovny navá zání
Levý primer
- AGTGGCTGGGCATCGGACCG
- AGTGGCTGGGCATCGGACCG- [4)(A,G,T)9J-GGGGCCCAGTCAGCGTCGAT
TCACCGACCCGTAGCCTGGC- [4^(A,G,T)9]-CCCCGGGTCAGTCGCAGCTA
CCCCGGGTCAGTCGCAGCTA-5
Pravý primer
Podtržená část vazebné oblasti levého primeru ukazuje místo rozpoznání Rsr II. Nejlevější podtržená oblast vazebné oblasti pravého primeru ukazuje místa rozpoznání pro Bsp 1201, Apa I a Eco O 1091 a místo štěpení pro Hga I.
Nejpravější podtržená oblast pravé vazebné oblasti primeru ukazuje místo rozpoznání Hga I. Na přání lze syntetizovat pravé a levé primery s připojeným biotinem (s užitím konvenčních činidel, která jsou např. k dostání od Clontech Laboratories, Palo Alto, CA) pro usnadnění čištění po amplifikaci a/nebo štěpení.
Příklad 4
Tvorba knihovny plasmidů konjugátů značka-polynukleotid pro • · • · • · sekvenování podpisu cDNA cDNA se vytvoří ze vzorku mRNA konvenčními postupy s použitím pGGCCCT15(A nebo G nebo C) jako primeru pro syntézu prvního vlákna ukotveného na rozhraní oblasti póly A na mRNA a Ng(A nebo T)GATC jako primeru pro syntézu druhého vlákna. To znamená, že oba jsou primery degenerované takovým způsobem, že primer druhého vlákna je přítomen ve dvou formách a primer prvního vlákna je přítomen ve třech formách. Sekvence GATC v primeru druhého vlákna odpovídá místu rozpoznání Mbo I; ostatní čtyři místa rozpoznání bází by mohla být též použita, jako např. pro Bam Hl, Sph I, Eco RI nebo podobně. Přítomnost A a T přiléhajících k místu restrikce primeru druhého vlákna zajišťuje, že se reakce strippingu a výměny může použít v příštím stupni ke tvorbě pětibázového převisu 5 GGCCC. Primer prvního vlákna se připojí ke vzorku mRNA a prodlouží pomocí reverzní transkriptázy, načež se vlákno RNA degraduje aktivitou RNázy H reverzní transkriptázy s ponecháním jednovláknové cDNA. Vlákno druhého primeru se připojuje a prodlužuje DNA polymerázou s použitím konvenčních postupů. Po syntéze druhého vlákna se výsledné cDNA metylují CpG metylázou (New England Biolabs, Beverly, MA) s použitím postupů dle výrobce. Vlákna 3 cDNA se poté odříznou výše zmíněnou strippingovou a výměnnou reakcí s použitím T4 DNA polymerázy v přítomnosti dATP a dTTP, načež se cDNA napojují na knihovnu značek příkladu 3 po předchozím štěpení pomocí Hga I k obdržení následující struktury:
-biotinvazebné místo primeru
TAG | Apa I | cDNA |
ΐ
Místo Mbo I
Místo Rsr II
Odděleně se vytváří následující klonovací vektor, to jest počínaje komerčně dostupným plasmidem, jako je Bluescript phagemid (Stratagene, La Jo11a, CA).
vazebné místo primeru místo Ppu MI (plasmid)-5 -AAAAGGAGGAGGCCTTGATAGAGAGGACCT GTTTAAAC-
-CAAATTTG-CCTAGG-AGAAGGAGAAGGAGAAGGmísto Bam H1 místo Pme I
Plasmid se štěpí pomocí Ppu Ml a Pme I (pro poskytnutí konce kompatibilního s Rsr II a konce flush, takže vložená složka se orientuje) a potom se metyluje DAM metylázou. Struktura obsahující značky se štěpí pomocí Rsr II a potom se navazuje na otevřený plasmid, načež se konjugát štěpí pomocí Mbo I a Bam HI pro umožnění ligace a uzavření plasmidu. Plasmid se potom amplifikuje a izoluje a používá v souladu s tímto vynálezem.
• · « φ
Dodatek Ia
Příklad počítačového programu pro tvorbu minimálně zkříženě hybridizujících souborů (jednovláknová značka/j ednovláknový komplement)
Program minxh c
c c
celé číslo*2 podj (6), msoubl (1000,6),msoub2 (1000,6) rozměr nbáze(6) c
c napište (*,*) VLOŽTE DÉLKU PODJEDNOTKY čtěte (*,100)npodj
100 formátujte(il) otevřete(1,soub=podj4.dat,form=formátován, stav=nový) c
c nsoub=0 proveďte 7000 ml = 1,3 proveďte 7000 m2=l,3 proveďte 7000 m3=l,3
proveďte 7000 m4=l,3 |
podj (l)=ml |
podj (2)=m2 |
podj (3)=m3 |
podj (4)=m4 |
ndiff=3 c
c c Vytvořte soubor podjednotek lišící se od c podjl nejméně o ndiff nukleotidů. Uložte v c msoubl.
c
c.
jj=l proveďte 900 j=l, npodj
900 msoubl(1,j)=podjl (j) c
c proveďte 1000 kl=l,3 proveďte 1000 k2=l,3 proveďte 1000 k3=l,3 proveďte 1000 k4=l,3 c c
nbáze (l)=kl nbáze (2)=k2 nbáze (3)=k3 nbáze (4)=k4 c
n=0 proveďte 1200 j=l,npodj
jestliže: podjl(j).eq.l | .a. nbáze(j).ne.1.nebo | |
1 | podjl(j).eq.2 | .a. nbáze(j).ne.2.nebo |
3 | podj1(j).eq.3 | .a. nbáze(j).ne.3.potom |
n=n+l | ||
endif | ||
1200 | pokračujte |
c • 9 • · jestliže(n.ge.ndiff) potom c
c c
c c
c c
1100
Jestliže je počet chybných spárování vyšší než nebo roven ndiff, potom zaznamenejte podj v msoub matice. | |
jj=jj+i proveďte endif | 1100 i=l,npodj msoubl(j j,i)=nbáze(i) |
1000 pokračujte c
1325 c c c c c c c c c c c c proveďte 1325 j2=l,npodj msoub2(1, j 2 )=msoubl(1,j 2) msoub2(2,j 2)=msoubl(2, j 2)
Srovnejte podjednotku 2 z msoubl s každou následnou podjednotkou v msoubl, to jest
3, 4, 5, ... atd. Uložte ty, které mají chybné spárování .ge. ndiff v matici msoub2 počínaje polohou 2.
Potom přeneste obsahy msoub2 do msoubl a zahajte opět srovnávání, v tomto případě
*· ·· ··· · · ·♦ • · · t · · · · · · · — — ······· «·«· ·· ············«· • · · ··· ··· ·· · · β · ·· * ·· ·· |
c | počínaje podjednotkou 3. |
c c
c | Pokračujte, až do podrobení |
c c | všech podjednotek srovnávání. nprůch=O |
c c
1700 | pokračujte kk=nprůch+2 nprůch=nprůch+1 |
c c
2 | proveďte 1500 m=nprůch=2,jj n=0 proveďte 1600 j=l,npodj jestliže msoubl(nprůch=l,j).eq.1 a.msoubl(m,j).ne.1.nebo msoubl(nprůch=l,j).eq.2 a.msoubl(m,j).ne.2.nebo |
2 | msoubl(nprůch=l,j).eq.3 a.msoubl(m,j).ne.3 potom n=n+l endif |
1600 | pokračujte jestliže (n.ge.ndiff) potom kk=kk+l |
1625 | proveďte 1625 i=l, npodj msoub2(kk,i)=msoubl(m,i) |
1500 | endif pokračujte |
c c
c | kk je počet podjednotek |
c | uložených v msoub2 |
c | |
c | Převeďte obsahy msoub2 do |
c | msoubl pro další průchod. |
c |
proveďte 2000 k=l,kk proveďte 2000 m=l, npodj 2000 msoubl(k,m)=msoub2(k,m) jestliže(kk.It.jj) potom jj=kk přejděte k 1700 endif c
c nsoub=nsoub+l napište(1,7009)
7009 formátujte(/) proveďte 7008 k=l,kk
7008 napište(1,7010)[msoubl(k,m),m=l,npodj]
7010 formátujte(4il) napište(*,*) napište(*,120) kk,nsoub
120 formátujte(lx,Podjednotky v soub=,i5,2x,Soub č.=,i5) 7000 pokračujte uzavřete(l) c
c konec ************************** c
************************** c
♦ · ·· 99 · ···· • · · W ···««·« • · · · « · ♦ ····
9 · · · · ···· fr ··· ·« • · · · * * ··« ······ 9 9 9. 9 99 9
Dodatek lb
Příklad počítačového programu pro tvorbu minimálně zkříženě hybridizu~j ících souborů (jednovláknová značka/jednovláknový komplement značky)
Program tagN c
c Program tagN vytváří minimálně zkříženě c hybridizující soubory podjednotek dané i) délky c N—podjednotky a ii) počáteční sekvence c podjednotky. tagN předpokládá, že ve značkách c jsou použity pouze 3 ze čtyř přirozených c nukleotidů.
c znak*l podj(20) celé číslo*2 msoub(10000,20), nbáze(20) c
c napište(*,*)VLOŽTE DÉLKU PODJEDNOTKY čtěte(*,100)npodj
100 formátujte(i2) c
c napište(*,*)VLOŽTE SEKVENCI PODJEDNOTKY čtěte(*,110)(podj1(k),k=l,npodj)
100 formátujte(20al) c
c ndiff=10 c
c « · • · · · · · ·
9 9 9 9 9 9 9 9 99
9 9 9 9 9 9 9 999
9 9 9 9 9 9 999 9 999 99
9 9 9 9 9 9 99
999 9 9 9 9 9999 c Položte a=l c=2 g=3 a t=4 c
c proveďte 800 kk=l,npodj jestliže[podjl(kk).eq.a], potom msoub(1,kk)=l endif jestliže[podjl(kk).eq.c], potom msoub(1,kk)=2 endif jestliže[podj(kk).eq.g], potom msoub(1,kk)=3 endif jestliže[podj(kk).eq.t], potom msoub(1,kk)=4 endif
800 pokračujte c
c c Vytvořte soubor podjednotek lišících se c od podjl nejméně o ndif nukleotidů.
c c
jj=l c
c proveďte 1000 kl=l,3 proveďte 1000 k2=l,3 proveďte 1000 k3=l,3 proveďte 1000 k4=l,3 proveďte 1000 k5=l,3 proveďte 1000 k6=l,3 proveďte 1000 k7=l,3 proveďte 1000 k8=l,3 proveďte 1000 k9=l,3 proveďte 1000 kl0=l,3 proveďte 1000 kll=l,3 proveďte 1000 kl2=l,3 proveďte 1000 kl3=l,3 proveďte 1000 kl4=l,3 proveďte 1000 kl5=l,3 proveďte 1000 kl6=l,3 proveďte 1000 kl7=l,3 proveďte 1000 kl8=l,3 proveďte 1000 kl9=l,3 proveďte 1000 k20=l,3 nbáze(l)=kl nbáze(2)=k2 nbáze(3)=k3 nbáze(4)=k4 nbáze(5)=k5 nbáze(6)=k6 nbáze(7)=k7 nbáze(8)=k8 nbáze(9)=k9 nbáze(10)=kl0 nbáze(ll)=kll nbáze(12)=kl2 nbáze(13)=kl3 nbáze(14)=kl4 nbáze(15)=kl5 nbáze(16)=kl6 nbáze(17)=kl7 nbáze(18)=kl8 • ·
c | nbáze(19)=kl9 nbáze(20)=k20 |
c | proveďte 1250 nn=l,jj |
c | |
n=0 | |
proveďte 1200 j=l,npodj | |
jestliže mpodj(nn,j).eq.l .a. nbáze(j).ne.l . nebo. | |
1 | mpodj(nn,j).eq.2 .a. nbáze(j).ne.2 . nebo. |
2 | mpodj(nn,j).eq.3 .a. nbáze(j).ne.3 . nebo. |
3 | mpodj(nn,j).eq.4 .a. nbáze(j).ne.4 ., potom |
n=n+l endif
1200 pokračujte c
c jestliže(n.lt.ndif) potom přejděte na 1000 endif
1250 pokračujte c
c jj=jj+l napište(*,130)(nbáze(i),i=l,npodj],jj proveďte 1100 i=l, npodj msoub(jj,i)=nbáze(i)
1100 pokračuj te c
c
1000 pokračujte c
c • · • · ·· ·· ♦ • · · · ··· · « · · • 4 · · · · · a ·»· • · · · 4 ····»· ··· «· • 4 4 *··φ·« • · · Μ · · · · ♦ ···
130
120
C c
c c
c napište(*,*) formátujte(lOx,20(lx,il),5x,i5) napište(*,*) napište(*,120) jj formátujte(lx,Počet slov=,i5) konec ********************************* ********************************* « ·
Dodatek Ic
Příklad počítačového programu pro tvorbu minimálně zkříženě hybridi zu~i í cích souborů (dvouvláknová značka/jednovláknový komplement značky)
Program 3tagN c
c Program 3tagN vytváří minimálně zkříženě c hybridizující soubory duplexních podjednotek c dané i) délky N—podjednotky a ii) počáteční c homopurinové sekvence.
c c
znak*l podj(20) celé číslo*2 msoub(10000,20), nbáze(20) c
c napište(*,*)VLOŽTE DÉLKU PODJEDNOTKY čtěte(*,100)npodj
100 formátujte(i2) c
c napište(*,*)VLOŽTE SEKVENCI PODJEDNOTKY (pouze a a g). čtěte(*,110)(podjl(k),k=l,npodj)
100 formátujte(20al) c
c ndiff=10 c
c c Položte a=l a=2 g=2 c
• · c
proveďte 800 kk=l,npodj jestliže[podjl(kk).eq.a], potom msoub(1,kk)=l endif jestliže[podjl(kk).eq.g], potom msoub(l,kk)=2 nedif
800 pokračuj te c
c jj=l c
c proveďte 1000 kl=l,3 proveďte 1000 k2=l,3 proveďte 1000 k3=l,3 proveďte 1000 k4=l,3 proveďte 1000 k5=l,3 proveďte 1000 k6=l,3 proveďte 1000 k7=l,3 proveďte 1000 k8=l,3 proveďte 1000 k9=l,3 proveďte 1000 kl0=l,3 proveďte 1000 kll=l,3 proveďte 1000 kl2=l,3 proveďte 1000 kl3=l,3 proveďte 1000 kl4=l,3 proveďte 1000 kl5=l,3 proveďte 1000 kl6=l,3 proveďte 1000 kl7=l,3 proveďte 1000 kl8=l,3 proveďte 1000 kl9=l,3 proveďte 1000 k20=l,3 • φ ·«·· φ c c nbáze(1)=kl nbáze(2)=k2 nbáze(3)=k3 nbáze(4)=k4 nbáze(5)=k5 nbáze(6)=k6 nbáze(7)=k7 nbáze(8)=k8 nbáze(9)=k9 nbáze(10)=kl0 nbáze(ll)=kll nbáze(12)=kl2 nbáze(13)=kl3 nbáze(14)=kl4 nbáze(15)=kl5 nbáze(16)=kl6 nbáze(17)=kl7 nbáze(18)=kl8 nbáze(19)=kl9 nbáze(20)=k20 c c
proveďte 1250 nn=l,jj c n=0 proveďte 1200 j=l,npodj
jestliže(mpodj(nn,j).eq.1 | .a. | nbáze(j).ne.1 | . nebo. |
mpod j(nn,j).eq.2 | .a. | nbáze(j).ne.2 | . nebo. |
mpod j(nn,j).eq.3 | .a. | nbáze(j).ne.3 | . nebo. |
mpodj(nn,j).eq.4 | .a. | nbáze(j).ne.4 | ., potom |
n=n+l endif
1200 pokračujte c
c jestliže(n.lt.ndif), potom přejděte na 1000 endif
1250 pokračujte c
c jj=jj+1 napište( ,130)(nbáze(i),i=l,npodj),jj proveďte 1100 i=l, npodj msoub(j j,i)=nbáze(i)
1100 | pokračujte |
c | |
1000 /-« | pokračujte |
L* | napište(*,*) |
130 | formátujte(10x,20(lx,il),5x,i5 |
napište(*,*) | |
napište(*,120) jj | |
120 | formátujte(lx,Počet slov=,i5 |
konec
- 94 SEZNAM SEKVENCÍ (1) OBECNÉ INFORMACE:
(i) PŘIHLAŠOVATEL: Sydney Brenner (ii) NÁZEV VYNÁLEZU: Oligonukleotidové značky pro stanovení druhu a identifikaci (iii) POČET SEKVENCÍ: 16 (iv) ADRESA PRO KORESPONDENCI:
(A) ADRESÁT: Stephen C. Macevicz, Spectragen, lne.
(B) ULICE: 3832 Bay Center Plače (C) MĚSTO: Hayward (D) STÁT: Kalifornie (E) ZEMĚ: USA (F) POŠTOVNÍ KÓD: 94545 (v) FORMA PRO ČTENÍ NA POČÍTAČI:
(A) TYP MÉDIA: disketa 3,5 palce (B) POČÍTAČ: kompatibilní s IBM (C) OPERAČNÍ SYSTÉM: Windows 3.1 (D) PROGRAMOVÉ VYBAVENÍ: Microsoft Word 5.1 (vi) SOUČASNÉ ÚDAJE O PŘIHLÁŠCE:
(A) ČÍSLO PŘIHLÁŠKY:
(B) DATUM REGISTRACE:
(C) KLASIFIKACE:
(vii) ÚDAJE O PRIORITNÍ PŘIHLÁŠCE:
(A) ČÍSLO PŘIHLÁŠKY: PCT/US95/12791 (B) DATUM PODÁNÍ: 12. října 1995 • · • · (vii) ÚDAJE O PRIORITNÍ PŘIHLÁŠCE:
(A) ČÍSLO PŘIHLÁŠKY: 08/478,238 (B) DATUM PODÁNÍ: 7. června 1995 (vii) ÚDAJE O PRIORITNÍ PŘIHLÁŠCE:
(A) ČÍSLO PŘIHLÁŠKY: 08/485,105 (B) DATUM PODÁNÍ: 7. června 1995 (vii) ÚDAJE O PRIORITNÍ PŘIHLÁŠCE:
(A) ČÍSLO PŘIHLÁŠKY: PCT/US95/12791 (B) DATUM PODÁNÍ: 12. října 1995 (viii) ÚDAJE O ZMOCNĚNCI:
(A) JMÉNO: Stephen C. Macevicz (B) ČÍSLO REGISTRACE: 30 285 (C) REFERENČNÍ ČÍSLO PRO ODKAZ: cbd4wo (ix) TELEKOMUNIKAČNÍ INFORMACE:
(A) TELEFON: (510) 670-9365 (B) FAX: (510) 670-9302 (2) INFORMACE O SEKVENCI IDENTIFIKAČNÍ ČÍSLO 1:
(i) SEKVENČNÍ CHARAKTERISTIKY:
(A) DÉLKA: 38 nukleotidů (B) TYP: nukleová kyselina (C) POČET VLÁKEN: jedno (D) TOPOLOGIE: lineární (xi) POPIS SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: 1:
GAGGATGCCT TTATGGATCC ACTCGAGATC CCAATCCA (2) INFORMACE PRO SEKVENCI IDENTIFIKAČNÍ ČÍSLO: 2:
φφ ·· φ φφ φφ φφφφ φφφ φφφφ • Φ · φφφφ φφφφ φ φ φφφφ φφφφ φ φφφ φ φ • Φφ φφφ φφφ
Φ9 ·ΦΦΦ ΦΦ φ φφ φφ (i) SEKVENČNÍ CHARAKTERISTIKY:
(A) DÉLKA: 26 nukleotidů (B) TYP: nukleová kyselina (C) POČET VLÁKEN: jedno (D) TOPOLOGIE: 1ineární (xi) POPIS SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: 2:
AATTCGGATG ATGCATGCAT CGACCC (2) INFORMACE PRO SEKVENCI IDENTIFIKAČNÍ ČÍSLO: 3:
(i) SEKVENČNÍ CHARAKTERISTIKY:
(A) DÉLKA: 14 nukleotidů (B) TYP: nukleová kyselina (C) POČET VLÁKEN: jedno (D) TOPOLOGIE: lineární (xi) POPIS SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: 3:
TAGCCTACTG AGCT (2) INFORMACE PRO SEKVENCI IDENTIFIKAČNÍ ČÍSLO: 4:
(i) SEKVENČNÍ CHARAKTERISTIKY:
(A) DÉLKA: 16 nukleotidů (B) TYP: nukleová kyselina (C) POČET VLÁKEN: dvě (D) TOPOLOGIE: lineární ·· «9
9 9 · • 9 99
999 · · •«99
9999 ·· ·· ·· • · · · ·· • · · ·· • · · · · · e · ·· •9 999999 •9 •999 (xi) POPIS SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: 4:
ATCGGATGAC ATCAAC 16
(2) | INFORMACE PRO SEKVENCI IDENTIFIKAČNÍ ČÍSLO: | 5: | |
(i) | SEKVENČNÍ CHARAKTERISTIKY: | ||
(A) | DÉLKA: 11 nukleotidů | ||
(B) | TYP: nukleová kyselina | ||
(C) | POČET VLÁKEN: dvě | ||
(D) | TOPOLOGIE: lineární | ||
(xi) | POPIS | SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: 5: | |
ACCAGCTGAT C | 11 | ||
2) | INFORMACE PRO SEKVENCI IDENTIFIKAČNÍ ČÍSLO: | 5: | |
(i) | SEKVENČNÍ CHARAKTERISTIKY: | ||
(A) | DÉLKA: 11 nukleotidů | ||
(B) | TYP: nukleová kyselina | ||
(c) | POČET VLÁKEN: jedno | ||
(D) | TOPOLOGIE: lineární | ||
(Xi) | POPIS | SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: 5: | |
CTAGTCGACC A | 11 | ||
2) | INFORMACE PRO SEKVENCI IDENTIFIKAČNÍ ČÍSLO: | 6: | |
(i) | SEKVENČNÍ CHARAKTERISTIKY: | ||
(A) | DÉLKA: 11 nukleotidů | ||
(B) | TYP: nukleová kyselina |
0 0 0 090 · ♦, β · • 000 · 0 · 0 0 0 0 • 0 · 0000 0000 • 0 » 0 0 0 0000 0 000 0 0 • · 0 *00 000 00 0000 <0 0 00 «» (C) POČET VLÁKEN: jedno (D) TOPOLOGIE: lineární (xi) POPIS SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: 6:
NRRGATCYNN N 11
2) INFORMACE PRO SEKVENCI IDENTIFIKAČNÍ ČÍSLO: 7:
(i) SEKVENČNÍ CHARAKTERISTIKY:
(A) DÉLKA: 22 nukleotidů (B) TYP: nukleová kyselina (C) POČET VLÁKEN: jedno (D) TOPOLOGIE: lineární (xi) POPIS SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: 7:
GGGTCGATGC ATGCATCATC CG
2) INFORMACE PRO SEKVENCI IDENTIFIKAČNÍ ČÍSLO: 8:
(i) SEKVENČNÍ CHARAKTERISTIKY:
(A) DÉLKA: 10 nukleotidů (B) TYP: nukleová kyselina (C) POČET VLÁKEN: jedno (D) TOPOLOGIE: lineární (xi) POPIS SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: 8:
ATCGGATGAC
2)
INFORMACE PRO SEKVENCI IDENTIFIKAČNÍ ČÍSLO: 9 ·· · (i) SEKVENČNÍ CHARAKTERISTIKY:
(A) DÉLKA: 10 nukleotidů (B) TYP: nukleová kyselina (C) POČET VLÁKEN: jedno (D) TOPOLOGIE: lineární (xi) POPIS SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: 9:
ATCNNNNNAC 10
2) INFORMACE PRO SEKVENCI IDENTIFIKAČNÍ ČÍSLO: 10:
(i) SEKVENČNÍ CHARAKTERISTIKY:
(A) DÉLKA: 14 nukleotidů (B) TYP: nukleová kyselina (C) POČET VLÁKEN: jedno (D) TOPOLOGIE: lineární (xi) POPIS SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: 10:
TCGAGTNNNN NGAT
2) INFORMACE PRO SEKVENCI IDENTIFIKAČNÍ ČÍSLO: 11:
(i) SEKVENČNÍ CHARAKTERISTIKY:
(A) DÉLKA: 16 nukleotidů (B) TYP: nukleová kyselina (C) POČET VLÁKEN: jedno (D) TOPOLOGIE: lineární (xi) POPIS SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: 11:
ATCGGATGAC ATCAAC *
100
2) | INFORMACE PRO SEKVENCI IDENTIFIKAČNÍ ČÍSLO: 12 | |
(i) | SEKVENČNÍ CHARAKTERISTIKY: | |
(A) | DÉLKA: 20 nukleotidů | |
(B) | TYP: nukleová kyselina | |
(C) | POČET VLÁKEN: jedno | |
(D) | TOPOLOGIE: lineární | |
(xi) | POPIS | SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: |
NNNAGTTGAT GTCATCCGAT 20
2) INFORMACE PRO SEKVENCI IDENTIFIKAČNÍ ČÍSLO: 13:
(i) SEKVENČNÍ CHARAKTERISTIKY:
(A) DÉLKA: 20 nukleotidů (B) TYP: nukleová kyselina (C) POČET VLÁKEN: jedno (D) TOPOLOGIE: lineární (xi) POPIS SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: 13:
NNNCGTTGAT GTCATCCGAT 20
2) INFORMACE PRO SEKVENCI IDENTIFIKAČNÍ ČÍSLO: 14:
(i) SEKVENČNÍ CHARAKTERISTIKY:
(A) DÉLKA: 20 nukleotidů (B) TYP: nukleová kyselina (C) POČET VLÁKEN: jedno (D) TOPOLOGIE: lineární • · • <►
101 (xi) POPIS SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: 14:
NNNCGTTGAT GTCATCCGAT 20
2) INFORMACE PRO SEKVENCI IDENTIFIKAČNÍ ČÍSLO: 15:
(i) SEKVENČNÍ CHARAKTERISTIKY:
(A) DÉLKA: 20 nukleotidů (B) TYP: nukleová kyselina (C) POČET VLÁKEN: jedno (D) TOPOLOGIE: lineární (xi) POPIS SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: 15:
NNNTGTTGAT GTCATCCGAT 20
2) INFORMACE PRO SEKVENCI IDENTIFIKAČNÍ ČÍSLO: 16:
(i) SEKVENČNÍ CHARAKTERISTIKY:
(A) DÉLKA: 37 nukleotidů (B) TYP: nukleová kyselina (C) POČET VLÁKEN: dvě (D) TOPOLOGIE: lineární (xi) POPIS SEKVENCE: SEKVENCE IDENTIFIKAČNÍ ČÍSLO: 16:
NNNNNGGATG NNNNNNNNNN NNNTNNNNNN NNNNNNN • to
102 • to
* to <<· · ·· to A to to ··· · to · · ••••to · ····· • » · to ·· ·· · ·· ··
Claims (72)
- PATENTOVÉ NÁROKY1. Způsob určování druhů polynukleotidů z populace polynukleotidů na jednom nebo více pevných nosičích, vyznačující se tím, že se skládá z těchto kroků:(a) připojení oligonukleotidové značky z repertoáru značek ke každému polynukleotidu v populaci polynukleotidů tak, že každá oligonukleotidová značka z repertoáru je vybrána ze stejného minimálně zkříženě hybridizujícího souboru, (b) odebírání vzorků populace polynukleotidů tak, že v podstatě všechny odlišné polynukleotidy v populaci mají připojené odlišné oligonukleotidové značky a (c) určování druhů polynukleotidů z populace specifickou hybridizací oligonukleotidových značek s jejich příslušnými komplementy, kde příslušné komplementy jsou připojeny jako jednotné populace v podstatě identických oligonukleotidů v prostorově diskrétních oblastech na jednom nebo více pevných nosičích.
- 2. Způsob podle nároku 1, vyznačuj ící se t í m, že uvedená oligonukleotidová značka je j ednovláknová.
- 3. Způsob podle nároku 2, vyznačuj ící se t í m, že uvedený komplement uvedené oligonukleotidové značky je jednovláknový.
- 4. Způsob podle nároku 3, vyznačuj ící se t í m, že uvedená oligonukleotidová značka se skládá z plurality podjednotek, kde každá podjednotka se skládá z oligonukleotidů o délce 3 až 9 nukleotidů a každá podjednotka • · * • ·103 je volena ze stejného minimálně zkříženě hybridizujícího souboru.
- 5. Způsob podle nároku 4, vyznačuj ící se t í m, že uvedený repertoár uvedených oligonukleotidových značek obsahuje nejméně 1000 uvedených oligonukleotidových značek.
- 6. Způsob podle nároku 5, vyznačuj ící se t í m, že každá z uvedených oligonukleotidových značek je odlišná od jakékoliv jiné oligonukleotidové značky uvedeného minimálně zkříženě hybridizujíčího souboru nejméně o tři nukleotidy.
- 7. Způsob podle nároku 6, vyznačuj ící se t í m, že každá z uvedených oligonukleotidových značek má délku v rozmezí od 12 do 60 nukleotidů.
- 8. Způsob podle nároku 7, vyznačuj ící se t í m, že uvedený jeden nebo více pevných nosičů je tvořen mikročásticemi.
- 9. Způsob podle nároku 8,vyznačuj ící se t í m, že uvedené mikročástice mají průměr v rozmezí od 5 do 40 μιη.
- 10. Způsob podle nároku 9, vyznačuj ící se t i m, že uvedený repertoár obsahuje nejméně 10000 uvedených oligonukleotidových značek.
- 11. Způsob podle nároku 7, vyznačuj ící se tím, že každý z uvedeného jednoho či více pevných nosičů je substrátem uspořádaným v rovině majícím pluralituΦ · • ·104 prostorově diskrétních povrchových oblastí, kde každá taková povrchová oblast má k sobě připojenou jednotnou populaci v podstatě identických uvedených komplementů.
- 12. Způsob podle nároku 11, vyznačuj ící se tím, tím, že každá z uvedených diskrétních povrchových oblastí má plochu v rozmezí od 10 do 1000 pm2.
- 13. Způsob podle nároku 13, vyznačuj ící se t í m, že každá z uvedených oligonukleotidových značek zahrnuje oligonukleotid mající délku mezi 12 a 30 nukleotidy.
- 14. Způsob podle nároku 3, vyznačuj ící se t í m, že uvedený repertoár obsahuje nejméně 100 oligonukleotidových značek.
- 15. Způsob podle nároku 14,vyznačuj ící se t í m, že se každá z uvedených oligonukleotidových značek liší od každé jiné oligonukleotidové značky nejméně o 6 nukleotidů.
- 16. Způsob podle nároku 15, vyznačuj ící se t í m, že se každá z uvedených oligonukleotidových značek skládá z oligonukleotidu o délce mezi 15 až 24 nukleotidy.
- 17. Způsob podle nároku 16, vyznačuj ící se t í m, že uvedený repertoár obsahuje nejméně 1000 uvedených oligonukleotidových značek.
- 18. Způsob podle nároku 1, vyznačuj ící se t í m, že uvedená oligonukleotidová značka je dvouvláknová.105 ♦ ·
- 19. Způsob podle nároku 18, vyznačuj ící se t í m, že uvedená oligonukleotidová značka má první vlákno a druhé vlákno takové, že prvním vláknem je homopyrimidin a druhým vláknem je homopurin.
- 20. Způsob podle nároku 19,vyznačuj ící se t í m, že uvedeným komplementem je homopyrimidin.
- 21. Způsob podle nároku 20, vyznačuj ící se t í m, že se uvedená oligonukleotidová značka skládá z plurality podjednotek, kde každá podjednotka se skládá z oligonukleotidu o délce 4 až 10 párů bází a každá podjednotka je zvolena ze stejného minimálně zkříženě hybridizujíčího souboru.
- 22. Způsob podle nároku 21, vyznačuj ící se t í m, že uvedený repertoár uvedených oligonukleotidových značek obsahuje nejméně 100 uvedených oligonukleotidových značek.
- 23. Způsob podle nároku 22, vyznačuj ící se t í m, že každá z uvedených oligonukleotidových značek se odlišuje od každé jiné oligonukleotidové značky uvedeného minimálně zkříženě hybridizujícího souboru nejméně o 3 páry bází.
- 24. Způsob podle nároku 23,vyznačuj ící se t í m, že každá z uvedených oligonukleotidových značek má délku v rozmezí 12 až 60 nukleotidů.
- 25. Způsob podle nároku 24, vyznačuj ící se t í m, že jeden nebo více pevných nosičů je tvořen106 mikročásticemi.
- 26. Způsob podle nároku 25, vyznačuj ící se t í m, že uvedené mikročástice mají průměr v rozmezí od 5 do 40 μπι.
- 27. Způsob podle nároku 26, vyznačuj ící se t í m, že uvedený repertoár obsahuje nejméně 1000 uvedených oligonukleotidových značek.
- 28. Způsob podle nároku 24, vyznačuj ící se t í m, že každý z jednoho či více pevných nosičů je plošným substrátem majícím pluralitu prostorově diskrétních povrchových oblastí, kde každá taková povrchová oblast má k sobě připojenou jednotnou populaci v podstatě identických uvedených komplementů.
- 29. Způsob podle nároku 28, vyznačuj ící se t í m, že každá z uvedených prostorově diskrétních povrchových oblastí má plochu v rozmezí od 10 do 1000 μιη2.
- 30. Způsob podle nároku 20, vyznačuj ící se t í m, že se každá z uvedených oligonukleotidových značek skládá z oligonukleotidu o délce mezi 12 a 30 páry bází.
- 31. Způsob podle nároku 30, vyznačující se t í m, že uvedený repertoár obsahuje nejméně 10 uvedených oligonukleotidových značek.
- 32. Způsob podle nároku 31, vyznačující se t í m, že se každá uvedená oligonukleotidové značka liší od každé jiné oligonukleotidové značky nejméně o 6 párů « ·107 • ♦ · · ··· · · · 4» • · · » · » » ···· • ♦ ♦ ♦ · · ···· · ·«· « « ·♦· · Φ · · · » ·· ···· ·» « ® * bází.
- 33. Způsob podle nároku 32, vyznačující se t í m, že se každá z uvedených značek skládá z oligonukleotidu majícího délku mezi 15 a 24 párů bází.
- 34. Způsob podle nároku 33, vyznačuj ící se t í m, že uvedený repertoár obsahuje nejméně 100 uvedených oligonukleotidových značek.
- 35. Způsob identifikace populace molekul mRNA, vyznačující se tím, že zahrnuje kroky:vytvoření populace molekul cDNA z populace molekul mRNA takové, že každá molekula cDNA má připojenou oligonukleotidovou značku, přičemž oligonukleotidové značky jsou zvoleny ze stejného minimálně zkříženě hybridizujícího souboru, odebrání vzorku populace molekul cDNA takové, že v podstatě všechny odlišné molekuly cDNA mají připojené odlišné oligonukleotidové značky, určení druhu molekul cDNA specifickou hybridizací oligonukleotidových značek s jejich příslušnými komplementy, kde jsou příslušné komplementy připojeny jako jednotné populace v podstatě identických komplementů v prostorově diskrétních oblastech na jednom nebo více pevných nosičích;stanovení nukleotidové sekvence části z každé z tříděných molekul cDNA a identifikace populace molekul mRNA frekvenční distribucí podílů sekvencí molekul cDNA.
- 36. Způsob podle nároku 35, vyznačuj ící se t í m, že uvedená oligonukleotidová značka je j ednovláknová.108
- 37. Způsob podle nároku 36, vyznačuj ící se t í m, že uvedený komplement uvedené oligonukleotidové značky je jednovláknový.
- 38. Způsob podle nároku 37, vyznačuj ící se t i m, že se uvedená oligonukleotidové značka skládá z plurality podjednotek, kde každá podjednotka obsahuje oligonukleotid o délce 3 až 9 nukleotidů a každá podjednotka je zvolena ze stejného minimálně zkříženě hybridizujícího souboru.
- 39. Způsob podle nároku 38, vyznačuj ící se t i m, že v podstatě všechny z uvedených rozdílných oligonukleotidových značek se navzájem liší tím, že mají nejméně dvě z uvedených podjednotek rozdílné.
- 40. Způsob podle nároku 39, vyznačuj ící se t i m, že jeden nebo více pevných nosičů jsou tvořeny mikročásticemi a dále uvedený krok tříděni uvedených molekul cDNA na mikročásticích poskytuje subpopulaci obsazených mikročástic a subpopulaci neobsazených mikročástic.
- 41. Způsob podle nároku 40, vyznačuj ící se t i m, že zahrnuje krok separace uvedených obsazených částic od uvedených neobsazených částic.
- 42. Způsob podle nároku 41,vyznačuj ící se t i m, že zahrnuje krok opakování uvedených stupňů odběru vzorků, třídění a separace až do nahromadění nejméně 10 000 uvedených obsazených částic.- 109 -
- 43. Způsob podle nároku 42, vyznačuj ící se t i m, že počet obsazených mikročástic je nejméně 100 000.
- 44. Způsob podle nároku 43, vyznačuj ící se t i m, že uvedený počet obsazených částic je nejméně 500 000.
- 45. Způsob podle nároku 41,vyznačuj ící se t í m, že dále zahrnuje postup opakování uvedených kroků odběru vzorků, třídění a separace až do nahromadění potřebného počtu uvedených obsazených mikročástic pro stanoveni relativního výskytu molekuly cDNA přítomné v uvedené populaci při frekvenci s rozmezím od 0,1 do 5 % s 95% mezí spolehlivosti ne větší než 0,1 % uvedené populace.
- 46. Způsob detekce přítomnosti či nepřítomnosti plurality zvolených cílových sekvencí v cílovém polynukleotidů, vyznačující se tím, že se skládá z kroků:přidání k cílovému polynukleotidů plurality ligačních sond, kde každá ligační sonda zahrnuje některý první oligonukleotid a druhý oligonukleotid, které jsou komplementární ve své sekvenci k přilehlým částem sekvence zvolené z cílových sekvencí v cílovém polynukleotidů, kde první oligonukleotid má připojenou oligonukleotidovou značku, přičemž každá každá oligonukleotidová značka je zvolena ze stejného minimálně zkříženě hybridizujícího souboru a každá ligační sonda má jinou oligonukleotidovou značku, hybridizace ligačních sond s cílovým polynukleotidem, zpracování prvního a druhého hybridizovaného oligonukleotidu za podmínek, které jsou účinné pro navázání prvního a druhého oligonukleotidu, jakmile první a druhý- 110 oligonukleotid vytvoří dokonale spárované duplexy s přilehlými cílovými sekvencemi, separace prvního a druhého navázaného oligonukleotidu z nenavázaného prvního a druhého oligonukleotidu, vytřídění navázaného prvního a druhého oligonukleotidu specifickou hybridizací oligonukleotidových značek s jejich příslušnými komplementy, přičemž příslušné komplementy jsou připojeny jako jednotné populace v podstatě identických oligonukleotidů v prostorově diskrétních oblastech na jednom nebo více pevných nosičích a detekce přítomnosti či nepřítomnosti zvolených cílových sekvencí na základě přítomnosti či nepřítomnosti prvního a druhého navázaného oligonukleotidu na jednom nebo více pevných nosičích.
- 47. Způsob podle nároku 46, vyznačuj íci se t i m, že druhý oligonukleotid zahrnuje záchytný zbytek a záznamový zbytek.
- 48. Způsob podle nároku 47, vyznačuj íci se t i m, že jeden nebo více pevných nosičů jsou představovány plošným substrátem majícím pluralitu prostorově adresovatelných diskrétních povrchových oblastí, kde každá z takových povrchových oblastí má k sobě připojenou jednotnou populaci v podstatě identických uvedených komplementů.
- 49. Způsob podle nároku 48, vyznačuj íci se t i m, že záchytným zbytkem je biotin.
- 50. Způsob podle nároku 49, vyznačuj íci se t i m, že každá z uvedených prostorově adresovatelných diskrétních povrchových oblastí má plochu v rozmezí od 10 do 1000 μπι2.111 ♦ · φ 0 0 ·· » » · · * Φ· • Φ Φ Φ Φ Φ·Φ Φ Φ φ Φ Φ ΦΦΦΦ • Φ Φ Φ Φ Φ0000 · · 0
- 51. Způsob podle nároku 50, vyznačuj ící se t i ii, že uvedená pluralita je nejméně 20.
- 52. Způsob identifikace polynukleotidů, vyznačující se tím, že zahrnuje dva kroky:(a) poskytnutí repertoáru oligonukznaček, který má v podstatě vyšší komplexitu než je komplexita populace polynukleotidů, přičemž polynukleotidové značky jsou zvoleny ze stejného minimálně zkříženě hybridizujícího souboru, (b) navázání repertoáru oligonukleotidových značek k populaci polynukleotidů za vzniku směsi konjugátů značka-polynukleotid, (c) odebrání vzorku směsi konjugátů značka-polynukleotid pro obdržení subpopulace konjugátů značka-polynukleotid takové, že v podstatě všechny konjugáty značka-polynukleotid mající různé polynukleotidy mají různé oligonukleotidové značky a (d) identifikace polynukleotidů subpopulace konjugátů značka-polynukleotid specifickou hybridizací oligonukleotidových značek s jejich příslušnými komplementy.
- 53. Způsob podle nároku 53, vyznačuj ící se t í m, že uvedená oligonukleotidová značka je j ednovláknová.
- 54. Způsob podle nároku 53, vyznačuj ící se t í m, že uvedený komplement uvedené oligonukleotidové značky je jednovláknový.
- 55. Způsob podle nároku 54, vyznačuj ící se t í m, že uvedená oligonukleotidová značka obsahuje pluralitu podjednotek, přičemž každá podjednotka se skládá z- 112 - oligonukleotidů o délce 3 až 9 nukleotidů a každá podjednotka je zvolena ze stejného minimálně zkříženě hybridizujícího souboru.
- 56. Způsob podle nároku 55, vyznačuj ící se t í m, že uvedená komplexnost uvedeného repertoáru je nejméně desetkrát vyšší než uvedená komplexnost uvedené populace polynukleotidů.
- 57. Způsob podle nároku 56, vyznačuj ící se t í m, že každá z uvedených oligonukleotidových značek má délku v rozmezí od 12 do 60 nukleotidů.
- 58. Způsob podle nároku 57, vyznačuj ící se t í m, že jeden nebo více uvedených pevných nosičů je tvořen mikročásticemi.
- 59. Způsob podle nároku 57, vyznačuj ící se t í m, že každý z uvedeného jednoho či více pevných nosičů je rovinným substrátem majícím pluralitu prostorově diskrétních povrchových oblastí, přičemž každá z takových povrchových oblastí má k sobě připojenou jednotnou populaci v podstatě identických uvedených komplementů.
- 60. Způsob podle nároku 54, vyznačuj ící se t í m, že každá z uvedených oligonukleotidových značek má délku v rozmezí od 12 do 30 nukleotidů.
- 61. Způsob podle nároku 60, vyznačuj ící se t í m, že každá z uvedených oligonukleotidových značek se odlišuje od každé jiné oligonukleotidové značky nejméně o 6 nukleotidů.113 • · ···· ·
- 62. Způsob podle nároku 61, vyznačuj ící se t í m, že se každá z uvedených oligonukleotidových značek skládá z oligonukleotidu o délce 15 až 24 nukleotidů.
- 63. Způsob podle nároku 62,vyznačuj lei se t í m, že uvedené komplementy uvedených oligonukleotidových značek jsou připojeny jako jednotné populace v podstatě identických oligonukleotidů v prostorově adresovatelných oblastech jednoho nebo více pevných nosičů.
- 64. Způsob podle nároku 52, vyznačující se tím, že uvedená oligonukleotidové značka je dvouvláknová.
- 65. Způsob podle nároku 64, vyznačuj ící se t i m, že uvedená oligonukleotidové značka má první vlákno a druhé vlákno takové, že první vlákno je homopyrimidinové a druhé vlákno je homopurinové.
- 66. Způsob podle nároku 65,vyznačuj ící se t í m, že uvedeným komplementem je homopyrimidin.
- 67. Způsob podle nároku 66, vyznačuj ící se t í m, že uvedená oligonukleotidové značka obsahuje pluralitu podjednotek, přičemž každá podjednotka se skládá z oligonukleotidu o délce 4 až 10 párů bází a každá podjednotka je zvolena ze stejného minimálně zkříženě hybridizujícího souboru.
- 68. Způsob podle nároku 67, vyznačuj ící se tím, že každá z uvedených oligonukleotidových značek obsahuje oligonukleotid o délce mezi 12 a 30 párů bází.114 • «
- 69. Repertoár oligonukleotidových značek, vyznačující se tím, že je zvolen ze skupiny obsahující oligonukleotidy ve formě: kde každý člen z S-l až Sn je podjednotkou skládající se z oligonukleotidů o délce tří až devíti nukleotidů zvolený z minimálně zkříženě hybridizujícího souboru, n je rozmezí od 4 do 10 s podmínkou, že oligonukleotidové značky repertoáru mají délku v rozmezí 12 až 60 nukleotidů nebo párů bází, a kde v repertoáru je nejméně 100 oligonukleotidových značek.
- 70. Repertoár oligonukleotidových značek, vyznačující se tím, že má délku v rozmezí mezi 12 a 30 nukleotidů nebo párů bází, přičemž oligonukleotidové značky repertoáru jsou zvoleny ze stejného minimálně zkříženě hybridizujícího souboru a oligonukleotidové značky z repertoáru se liší jedna od druhé nejméně o šest nukleotidů či párů bází.
- 71. Repertoár podle nároku 70, vyznačuj ící se t í m, že má komplexnost nejméně jedno sto.
- 72. Repertoár podle nároku 71,vyznačuj ící se t í m, že má komplexnost nejméně jeden tisíc.TU 3 °i Z.• · ·· · *· ·· • 9·· · > · · • · · ···· · » · · • · · · · · ··«· · ··· · · • · · ··· · · · ······ · · · »« ·«
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/478,238 US5635400A (en) | 1994-10-13 | 1995-06-07 | Minimally cross-hybridizing sets of oligonucleotide tags |
PCT/US1995/012791 WO1996012014A1 (en) | 1994-10-13 | 1995-10-12 | Molecular tagging system |
Publications (1)
Publication Number | Publication Date |
---|---|
CZ392697A3 true CZ392697A3 (cs) | 1998-06-17 |
Family
ID=23899104
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CZ973926A CZ392697A3 (cs) | 1995-06-07 | 1996-06-06 | Oligonukleotidové značky pro stanovení druhu a identifikaci |
Country Status (10)
Country | Link |
---|---|
EP (1) | EP1967592B1 (cs) |
JP (2) | JP4293634B2 (cs) |
CN (1) | CN1146668C (cs) |
AT (2) | ATE466109T1 (cs) |
AU (1) | AU718357B2 (cs) |
CA (2) | CA2332731A1 (cs) |
CZ (1) | CZ392697A3 (cs) |
DE (2) | DE69637285T2 (cs) |
HK (1) | HK1015417A1 (cs) |
PL (1) | PL324000A1 (cs) |
Families Citing this family (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2335951C (en) | 1998-06-24 | 2013-07-30 | Mark S. Chee | Decoding of array sensors with microspheres |
CA2372131A1 (en) * | 1999-02-22 | 2000-08-31 | Sydney Brenner | Polymorphic dna fragments and uses thereof |
EP2325336B1 (en) * | 2001-01-25 | 2014-06-11 | Luminex Molecular Diagnostics, Inc. | Polynucleotides for use as tags and tag complements |
ATE541054T1 (de) * | 2004-05-12 | 2012-01-15 | Nanosphere Inc | Bio-barcode erkennung für zielmoleküle |
CN100510105C (zh) * | 2006-02-08 | 2009-07-08 | 博奥生物有限公司 | 一种序列特异性寡核苷酸探针及其应用 |
US9029085B2 (en) | 2007-03-07 | 2015-05-12 | President And Fellows Of Harvard College | Assays and other reactions involving droplets |
JP5738597B2 (ja) | 2007-12-21 | 2015-06-24 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 核酸の配列決定のためのシステムおよび方法 |
US20110218123A1 (en) | 2008-09-19 | 2011-09-08 | President And Fellows Of Harvard College | Creation of libraries of droplets and related species |
EP3290531B1 (en) | 2008-12-19 | 2019-07-24 | President and Fellows of Harvard College | Particle-assisted nucleic acid sequencing |
KR101793744B1 (ko) | 2009-03-13 | 2017-11-03 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 유동 포커싱 미세유동 장치의 규모 확장 |
US20120211084A1 (en) | 2009-09-02 | 2012-08-23 | President And Fellows Of Harvard College | Multiple emulsions created using jetting and other techniques |
EP3842150A1 (en) | 2009-10-27 | 2021-06-30 | President and Fellows of Harvard College | Droplet creation techniques |
CN102732512B (zh) * | 2011-04-08 | 2014-02-12 | 博奥生物有限公司 | 一种寡核苷酸标签及其应用 |
KR20140034242A (ko) | 2011-05-23 | 2014-03-19 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 다중 에멀젼을 포함하는 에멀젼의 제어 |
US10221442B2 (en) | 2012-08-14 | 2019-03-05 | 10X Genomics, Inc. | Compositions and methods for sample processing |
US9567631B2 (en) | 2012-12-14 | 2017-02-14 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US11591637B2 (en) | 2012-08-14 | 2023-02-28 | 10X Genomics, Inc. | Compositions and methods for sample processing |
US10752949B2 (en) | 2012-08-14 | 2020-08-25 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10400280B2 (en) | 2012-08-14 | 2019-09-03 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US9701998B2 (en) | 2012-12-14 | 2017-07-11 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
CN113528634A (zh) | 2012-08-14 | 2021-10-22 | 10X基因组学有限公司 | 微胶囊组合物及方法 |
US10273541B2 (en) | 2012-08-14 | 2019-04-30 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US9951386B2 (en) | 2014-06-26 | 2018-04-24 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10323279B2 (en) | 2012-08-14 | 2019-06-18 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10533221B2 (en) | 2012-12-14 | 2020-01-14 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
EP3862435A1 (en) | 2013-02-08 | 2021-08-11 | 10X Genomics, Inc. | Polynucleotide barcode generation |
US9328382B2 (en) | 2013-03-15 | 2016-05-03 | Complete Genomics, Inc. | Multiple tagging of individual long DNA fragments |
US10395758B2 (en) | 2013-08-30 | 2019-08-27 | 10X Genomics, Inc. | Sequencing methods |
EP3065712A4 (en) | 2013-11-08 | 2017-06-21 | President and Fellows of Harvard College | Microparticles, methods for their preparation and use |
US9824068B2 (en) | 2013-12-16 | 2017-11-21 | 10X Genomics, Inc. | Methods and apparatus for sorting data |
US9694361B2 (en) | 2014-04-10 | 2017-07-04 | 10X Genomics, Inc. | Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same |
SG11201610691QA (en) | 2014-06-26 | 2017-01-27 | 10X Genomics Inc | Processes and systems for nucleic acid sequence assembly |
KR20170026383A (ko) | 2014-06-26 | 2017-03-08 | 10엑스 제노믹스, 인크. | 핵산 서열의 분석 |
MX2016016902A (es) | 2014-06-26 | 2017-03-27 | 10X Genomics Inc | Metodos para analizar acidos nucleicos de celulas individuales o poblaciones de celulas. |
MX2017005267A (es) | 2014-10-29 | 2017-07-26 | 10X Genomics Inc | Metodos y composiciones para la secuenciacion de acidos nucleicos seleccionados como diana. |
US9975122B2 (en) | 2014-11-05 | 2018-05-22 | 10X Genomics, Inc. | Instrument systems for integrated sample processing |
BR112017014902A2 (pt) | 2015-01-12 | 2018-03-13 | 10X Genomics Inc | processos e sistemas para a preparação de bibliotecas de sequenciamento de ácido nucleico e bibliotecas preparadas usando os mesmos |
CN107209814B (zh) | 2015-01-13 | 2021-10-15 | 10X基因组学有限公司 | 用于使结构变异和相位信息可视化的系统和方法 |
CN107208156B (zh) | 2015-02-09 | 2021-10-08 | 10X基因组学有限公司 | 用于使用变异识别数据来确定结构变异和定相的系统和方法 |
MX2017010857A (es) | 2015-02-24 | 2017-12-11 | 10X Genomics Inc | Metodos para la cobertura de secuencia de acidos nucleicos seleccionados como diana. |
EP4286516A3 (en) | 2015-02-24 | 2024-03-06 | 10X Genomics, Inc. | Partition processing methods and systems |
CN108289797B (zh) | 2015-10-13 | 2022-01-28 | 哈佛学院院长及董事 | 用于制备和使用凝胶微球的系统和方法 |
US11371094B2 (en) | 2015-11-19 | 2022-06-28 | 10X Genomics, Inc. | Systems and methods for nucleic acid processing using degenerate nucleotides |
SG10202108763UA (en) | 2015-12-04 | 2021-09-29 | 10X Genomics Inc | Methods and compositions for nucleic acid analysis |
WO2017138984A1 (en) | 2016-02-11 | 2017-08-17 | 10X Genomics, Inc. | Systems, methods, and media for de novo assembly of whole genome sequence data |
WO2017197338A1 (en) | 2016-05-13 | 2017-11-16 | 10X Genomics, Inc. | Microfluidic systems and methods of use |
US10550429B2 (en) | 2016-12-22 | 2020-02-04 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10815525B2 (en) | 2016-12-22 | 2020-10-27 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10011872B1 (en) | 2016-12-22 | 2018-07-03 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
CN117512066A (zh) | 2017-01-30 | 2024-02-06 | 10X基因组学有限公司 | 用于基于微滴的单细胞条形编码的方法和系统 |
US10995333B2 (en) | 2017-02-06 | 2021-05-04 | 10X Genomics, Inc. | Systems and methods for nucleic acid preparation |
CN110870018B (zh) | 2017-05-19 | 2024-11-22 | 10X基因组学有限公司 | 用于分析数据集的系统和方法 |
EP4230746A3 (en) | 2017-05-26 | 2023-11-01 | 10X Genomics, Inc. | Single cell analysis of transposase accessible chromatin |
US20180340169A1 (en) | 2017-05-26 | 2018-11-29 | 10X Genomics, Inc. | Single cell analysis of transposase accessible chromatin |
CN107299151B (zh) * | 2017-08-28 | 2020-06-09 | 华中农业大学 | 用于鉴别稻米脂肪酸品质的dna分子标记及其应用 |
US20190210018A1 (en) | 2017-09-25 | 2019-07-11 | Plexium, Inc. | Oligonucleotide encoded chemical libraries |
US10837047B2 (en) | 2017-10-04 | 2020-11-17 | 10X Genomics, Inc. | Compositions, methods, and systems for bead formation using improved polymers |
WO2019084043A1 (en) | 2017-10-26 | 2019-05-02 | 10X Genomics, Inc. | METHODS AND SYSTEMS FOR NUCLEIC ACID PREPARATION AND CHROMATIN ANALYSIS |
EP3700672B1 (en) | 2017-10-27 | 2022-12-28 | 10X Genomics, Inc. | Methods for sample preparation and analysis |
WO2019099751A1 (en) | 2017-11-15 | 2019-05-23 | 10X Genomics, Inc. | Functionalized gel beads |
US10829815B2 (en) | 2017-11-17 | 2020-11-10 | 10X Genomics, Inc. | Methods and systems for associating physical and genetic properties of biological particles |
WO2019108851A1 (en) | 2017-11-30 | 2019-06-06 | 10X Genomics, Inc. | Systems and methods for nucleic acid preparation and analysis |
WO2019126789A1 (en) | 2017-12-22 | 2019-06-27 | 10X Genomics, Inc. | Systems and methods for processing nucleic acid molecules from one or more cells |
CN112005115A (zh) | 2018-02-12 | 2020-11-27 | 10X基因组学有限公司 | 表征来自单个细胞或细胞群体的多种分析物的方法 |
US11639928B2 (en) | 2018-02-22 | 2023-05-02 | 10X Genomics, Inc. | Methods and systems for characterizing analytes from individual cells or cell populations |
WO2019169028A1 (en) | 2018-02-28 | 2019-09-06 | 10X Genomics, Inc. | Transcriptome sequencing through random ligation |
EP3775271B1 (en) | 2018-04-06 | 2025-03-12 | 10X Genomics, Inc. | Systems and methods for quality control in single cell processing |
WO2019217452A1 (en) * | 2018-05-08 | 2019-11-14 | Mgi Tech Co., Ltd. | Single tube bead-based dna co-barcoding for accurate and cost-effective sequencing, haplotyping, and assembly |
WO2019217758A1 (en) | 2018-05-10 | 2019-11-14 | 10X Genomics, Inc. | Methods and systems for molecular library generation |
US11932899B2 (en) | 2018-06-07 | 2024-03-19 | 10X Genomics, Inc. | Methods and systems for characterizing nucleic acid molecules |
US11703427B2 (en) | 2018-06-25 | 2023-07-18 | 10X Genomics, Inc. | Methods and systems for cell and bead processing |
US12188014B1 (en) | 2018-07-25 | 2025-01-07 | 10X Genomics, Inc. | Compositions and methods for nucleic acid processing using blocking agents |
US20200032335A1 (en) | 2018-07-27 | 2020-01-30 | 10X Genomics, Inc. | Systems and methods for metabolome analysis |
US12163179B2 (en) | 2018-08-03 | 2024-12-10 | 10X Gemomics, Inc. | Methods and systems to minimize barcode exchange |
US12065688B2 (en) | 2018-08-20 | 2024-08-20 | 10X Genomics, Inc. | Compositions and methods for cellular processing |
WO2020041148A1 (en) | 2018-08-20 | 2020-02-27 | 10X Genomics, Inc. | Methods and systems for detection of protein-dna interactions using proximity ligation |
US11459607B1 (en) | 2018-12-10 | 2022-10-04 | 10X Genomics, Inc. | Systems and methods for processing-nucleic acid molecules from a single cell using sequential co-partitioning and composite barcodes |
US12169198B2 (en) | 2019-01-08 | 2024-12-17 | 10X Genomics, Inc. | Systems and methods for sample analysis |
US11845983B1 (en) | 2019-01-09 | 2023-12-19 | 10X Genomics, Inc. | Methods and systems for multiplexing of droplet based assays |
US11584953B2 (en) | 2019-02-12 | 2023-02-21 | 10X Genomics, Inc. | Methods for processing nucleic acid molecules |
US11851683B1 (en) | 2019-02-12 | 2023-12-26 | 10X Genomics, Inc. | Methods and systems for selective analysis of cellular samples |
US11467153B2 (en) | 2019-02-12 | 2022-10-11 | 10X Genomics, Inc. | Methods for processing nucleic acid molecules |
US11655499B1 (en) | 2019-02-25 | 2023-05-23 | 10X Genomics, Inc. | Detection of sequence elements in nucleic acid molecules |
WO2020185791A1 (en) | 2019-03-11 | 2020-09-17 | 10X Genomics, Inc. | Systems and methods for processing optically tagged beads |
US12235262B1 (en) | 2019-09-09 | 2025-02-25 | 10X Genomics, Inc. | Methods and systems for single cell protein analysis |
US11851700B1 (en) | 2020-05-13 | 2023-12-26 | 10X Genomics, Inc. | Methods, kits, and compositions for processing extracellular molecules |
US12084715B1 (en) | 2020-11-05 | 2024-09-10 | 10X Genomics, Inc. | Methods and systems for reducing artifactual antisense products |
AU2022227563A1 (en) | 2021-02-23 | 2023-08-24 | 10X Genomics, Inc. | Probe-based analysis of nucleic acids and proteins |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4458066A (en) | 1980-02-29 | 1984-07-03 | University Patents, Inc. | Process for preparing polynucleotides |
US4973679A (en) | 1981-03-27 | 1990-11-27 | University Patents, Inc. | Process for oligonucleo tide synthesis using phosphormidite intermediates |
US4415732A (en) | 1981-03-27 | 1983-11-15 | University Patents, Inc. | Phosphoramidite compounds and processes |
DE3329892A1 (de) | 1983-08-18 | 1985-03-07 | Köster, Hubert, Prof. Dr., 2000 Hamburg | Verfahren zur herstellung von oligonucleotiden |
FR2596761B1 (fr) | 1986-04-08 | 1988-05-20 | Commissariat Energie Atomique | Derives de nucleosides et leur utilisation pour la synthese d'oligonucleotides |
GB9017788D0 (en) | 1990-08-14 | 1990-09-26 | Medical Res Council | Method for preparing,isolating and sequencing polynucleotides |
US5482836A (en) | 1993-01-14 | 1996-01-09 | The Regents Of The University Of California | DNA purification by triplex-affinity capture and affinity capture electrophoresis |
US5695934A (en) * | 1994-10-13 | 1997-12-09 | Lynx Therapeutics, Inc. | Massively parallel sequencing of sorted polynucleotides |
US5604097A (en) * | 1994-10-13 | 1997-02-18 | Spectragen, Inc. | Methods for sorting polynucleotides using oligonucleotide tags |
WO1997013877A1 (en) * | 1995-10-12 | 1997-04-17 | Lynx Therapeutics, Inc. | Measurement of gene expression profiles in toxicity determination |
CZ397998A3 (cs) * | 1996-06-06 | 1999-07-14 | Lynx Therapeutics, Inc. | Způsob sekvenční analýzy ligací kódovaného adaptoru |
-
1996
- 1996-06-06 CA CA002332731A patent/CA2332731A1/en not_active Abandoned
- 1996-06-06 CN CNB96196135XA patent/CN1146668C/zh not_active Expired - Lifetime
- 1996-06-06 EP EP07018707A patent/EP1967592B1/en not_active Expired - Lifetime
- 1996-06-06 CZ CZ973926A patent/CZ392697A3/cs unknown
- 1996-06-06 PL PL96324000A patent/PL324000A1/xx unknown
- 1996-06-06 AU AU61020/96A patent/AU718357B2/en not_active Ceased
- 1996-06-06 AT AT07018707T patent/ATE466109T1/de not_active IP Right Cessation
- 1996-06-06 CA CA002222581A patent/CA2222581C/en not_active Expired - Fee Related
- 1996-06-06 DE DE69637285T patent/DE69637285T2/de not_active Expired - Lifetime
- 1996-06-06 JP JP50181897A patent/JP4293634B2/ja not_active Expired - Lifetime
- 1996-06-06 AT AT96918333T patent/ATE375402T1/de not_active IP Right Cessation
- 1996-06-06 DE DE69638179T patent/DE69638179D1/de not_active Expired - Lifetime
-
1999
- 1999-01-16 HK HK99100227A patent/HK1015417A1/xx not_active IP Right Cessation
-
2005
- 2005-10-07 JP JP2005295790A patent/JP2006025801A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
HK1015417A1 (en) | 1999-10-15 |
ATE375402T1 (de) | 2007-10-15 |
JPH11507528A (ja) | 1999-07-06 |
EP1967592A1 (en) | 2008-09-10 |
AU718357B2 (en) | 2000-04-13 |
JP2006025801A (ja) | 2006-02-02 |
ATE466109T1 (de) | 2010-05-15 |
CA2222581C (en) | 2004-05-11 |
CN1193357A (zh) | 1998-09-16 |
AU6102096A (en) | 1996-12-30 |
CA2222581A1 (en) | 1996-12-19 |
PL324000A1 (en) | 1998-04-27 |
DE69638179D1 (de) | 2010-06-10 |
DE69637285D1 (de) | 2007-11-22 |
CA2332731A1 (en) | 1996-12-19 |
EP1967592B1 (en) | 2010-04-28 |
JP4293634B2 (ja) | 2009-07-08 |
DE69637285T2 (de) | 2008-07-10 |
CN1146668C (zh) | 2004-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1967592B1 (en) | Method of improving the efficiency of polynucleotide sequencing | |
US6235475B1 (en) | Oligonucleotide tags for sorting and identification | |
US6280935B1 (en) | Method of detecting the presence or absence of a plurality of target sequences using oligonucleotide tags | |
EP0832287B1 (en) | Oligonucleotide tags for sorting and identification | |
JP4206130B2 (ja) | 分子タグ化システム | |
EP0952216B1 (en) | Solid phase supports with PNA and amidate tag compliments | |
US5763175A (en) | Simultaneous sequencing of tagged polynucleotides |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PD00 | Pending as of 2000-06-30 in czech republic |