[go: up one dir, main page]

DE69827154T2 - Polymorphismuserkennung mit hilfe cluster-analyse - Google Patents

Polymorphismuserkennung mit hilfe cluster-analyse Download PDF

Info

Publication number
DE69827154T2
DE69827154T2 DE69827154T DE69827154T DE69827154T2 DE 69827154 T2 DE69827154 T2 DE 69827154T2 DE 69827154 T DE69827154 T DE 69827154T DE 69827154 T DE69827154 T DE 69827154T DE 69827154 T2 DE69827154 T2 DE 69827154T2
Authority
DE
Germany
Prior art keywords
hybridization
clusters
cluster
nucleic acid
hybridization affinity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69827154T
Other languages
English (en)
Other versions
DE69827154D1 (de
Inventor
Anthony Berno
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Affymetrix Inc
Original Assignee
Affymetrix Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Affymetrix Inc filed Critical Affymetrix Inc
Publication of DE69827154D1 publication Critical patent/DE69827154D1/de
Application granted granted Critical
Publication of DE69827154T2 publication Critical patent/DE69827154T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Control By Computers (AREA)
  • Image Analysis (AREA)
  • Holo Graphy (AREA)

Description

  • HINTERGRUND DER ERFINDUNG
  • Die Erfindung betrifft das Erkennen von Unterschieden in Polymeren. Sie betrifft insbesondere das Erkennen von Polymorphismen in Testnukleinsäuresequenzen durch Clustern der Hybridisierungsaffinitätsdatensätze.
  • Es gibt Vorrichtungen und Computersysteme zur Bildung und Verwendung von Material-Gruppierungen auf einem Chip oder Substrat. Die PCT-Anmeldungen WO92/10588 und 95/11995 beschreiben beispielsweise Techniken zur Sequenzierung oder Sequenzüberprüfung von Nukleinsäuren und anderen Materialien. Gruppierungen zur Durchführung dieser Arbeitsschritte können beispielsweise gemäß den Verfahren der Pioniertechniken erzeugt werden, die in den US-Patenten 5 445 934, 5 384 261 und US 5 571 639 offenbart sind.
  • Gemäß einem Aspekt der hier beschriebenen Techniken werden Nukleinsäuresonden an bekannten Stelen auf einem Chip gruppiert. Eine markierte Nukleinsäure wird dann mit dem Chip zusammengebracht, und ein Scanner erzeugt eine Bilddatei, die diejenigen Stellen anzeigt, an denen die markierten Nukleinsäuren an dem Chip gebunden sind. Mit Hilfe der Bilddatei und der Identitäten der Sonden an bestimmten Stellen lässt sich Information, wie die Nukleotid- oder Monomersequenz von DNA oder RNA, erhalten. Mit diesen Systemen werden beispielsweise DNA-Gruppierungen erzeugt, die sich zur Untersuchung und zur Erkennung von Mutationen verwenden lassen, die für genetische Erkrankungen, Krebserkrankungen, Infektionserkrankungen, HIV und andere genetische Eigenschaften wichtig sind.
  • Die VLSIPSTM Technologie bietet Verfahren zur Herstellung sehr großer Gruppierungen von Oligonukleotidsonden auf sehr kleinen Chips. Siehe US-Patent 5 143 854 und PCT-Patentveröffentlichungen Nr. WO 90/15070 und 92/10092. Die Oligonukleotidsonden auf der DNA-Sondengruppierung werden zum Erkennen komplementärer Nukleinsäuresequenzen in einer interessierenden Testnukleinsäureprobe (der "Ziel"-Nukleinsäure) verwendet.
  • Für Sequenz-Überprüfungsanwendungen kann der Chip für eine spezifische Zielnukleinsäuresequenz kachelförmig unterteilt sein. Der Chip kann beispielsweise Sonden enthalten, die zur Zielsequenz vollständig komplementär sind, und Sonden, die sich von der Zielsequenz um eine einzige Basen-Fehlpaarung unterscheiden. Für De-novo-Sequenzier-Anwendungen kann der Chip sämtliche möglichen Sonden einer spezifischen Länge enthalten. Die Sonden sind auf einem Chip in Reihen und Spalten von Zellen angeordnet, wobei jede Zelle mehrere Kopien einer bestimmten Sonde enthält. Zusätzlich können "leere" Zellen auf dem Chip vorhanden sein, die keinerlei Sonden aufweisen. Da die Leerzellen keine Sonden aufweisen, sollten markierte Ziele nicht spezifisch an den Chip in diesem Bereich binden. Somit liefert die Leerzelle ein Maß für die Hintergrundintensität.
  • Die Interpretation für die Hybridisierungsdaten von hybridisierten Chips kann mehrere Schwierigkeiten aufwerfen. Statistische Fehler, wie physikalische Fehler auf dem Chip, können dazu führen, dass einzelne Sonden oder räumlich verwandte Gruppen von Sonden anormal hybridisieren (beispielsweise eine anormale Fluoreszenz aufweisen). Systematische Fehler, wie die Bildung von Sekundärstrukturen in den Sonden oder dem Ziel, können auch reproduzierbare, aber dennoch irreführende Hybridisierungsdaten ergeben.
  • Für viele Anwendungen möchte man bestimmen, ob es Unterschiede zwischen und unter Testnukleinsäuresequenzen, wie Polymorphismen an einer Basenposition, gibt. Man möchte zum Erkennen dieser Unterschiede gerne solche Systeme und Verfahren besitzen, die nicht übermäßig von statistischen und systematischen Fehlern beeinträchtigt sind.
  • WO 97/29212 offenbart Oligonukleotidgruppierungen und Verfahren zur artenbildenden Phänotypbestimmung von Organismen. Die Gruppen oder Arten, denen ein Organismus angehört, können bestimmt werden, indem man die Hybridisierungsmuster einer Zielnukleinsäure aus den Organismen mit Hybridisierungsmustern in einer Datenbank vergleicht.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die Erfindung stellt innovative Systeme und Verfahren zur Erkennung von Unterschieden in Testpolymeren, wie Nukleinsäuresequenzen, bereit. Die Hybridisierungsaffinitätsdaten für die Testpolymere werden derart geclustert, dass möglicherweise vorhandene Unterschiede zwischen oder unter Testpolymeren leicht identifiziert werden können. Durch Clustern der Hybridisierungsaffinitätsdaten der Probenpolymere können Unterschiede zwischen den Testpolymeren sogar bei Vorhandensein von statistischen und systematischen Fehlern genau erfasst werden. Außerdem können Polymorphismen in den Testnukleinsäuren erkannt werden, unabhängig davon, was das Basecalling ergeben hat.
  • Bei einer Ausführungsform stellt die Erfindung ein Verfahren zum Erkennen von Polymorphismen in Testnukleinsäuresequenzen bereit. Mehrfache Hybridisierungsaffinitätsdatensätze werden eingegeben, wobei jeder Hybridisierungsdatensatz Hybridisierungsaffinitäten zwischen einer Testnukleinsäuresequenz und Nukleinsäuresonden beinhaltet. Die mehrfachen Hybridisierungsdaten sätze sind hierarchisch in eine Anzahl von Clustern gegliedert, so dass die Hybridisierungsaffinitätsdatensätze in den Clustern alle untereinander ähnlicher sind als zu den Hybridisierungsaffinitätsdatensätzen anderer Cluster. Die Mehrfach-Cluster können dann zur Bestimmung einer Anzahl enger Cluster analysiert werden, wobei ein enger Cluster ein Cluster ist, bei dem die durchschnittliche Distanz zwischen dem Clustermittel und den Mitteln seiner Subcluster geringer ist als die Distanz zum nächsten Schwestercluster, und zwar über einen Ähnlichkeitsfaktor, der derart ist, dass die Anzahl enger Cluster anzeigt, ob ein Polymorphismus in den Test-Nukleinsäuresequenzen vorliegt. Die Polymorphismen können Mutationen, Insertionen und Deletionen beinhalten.
  • Andere Aufgaben und Vorteile der Erfindung werden dem Fachmann beim Durchlesen der folgenden eingehenden Beschreibung zusammen mit den beigefügten Zeichnungen ersichtlich.
  • KURZE BESCHREIBUNG DER ZEICHUNGEN
  • Es zeigt:
  • 1 ein Beispiel für ein Computersystem, das zur Ausführung der Software einer Ausführungsform der Erfindung verwendet werden kann;
  • 2. ein System-Blockdiagramm des Computersystems von 1;
  • 3 ein Gesamtsystem zur Erzeugung und Analyse von Gruppierungen biologischer Materialien, wie DNA oder RNA.
  • 4 das Konzept der Bindung von Sonden auf Chips;
  • 5 ein High-Level-Fließschema eines Verfahrens zur Analyse von Testpolymeren;
  • 6 ein Fließschema eines Verfahrens zum Clustern von Hybridisierungsaffinitätsdaten;
  • 7 ein Fließschema eines Verfahren zur Analyse von Testnukleinsäuresequenzen;
  • 8 graphisch wie die Normalisierung die Hybridisierungsaffinitäten beeinflusst;
  • 9 eine Bildschirmanzeige mit einem Dendrogramm, welches zeigt, dass kein Polymorphismus an der interessierenden Basenposition zu sein scheint;
  • 10 das Dendrogramm von 9;
  • 11 ein Dendrogramm, welches zeigt, dass wahrscheinlich ein Polymorphismus an der interessierenden Basenposition vorliegt;
  • 12 ein Dendrogramm, welches zeigt, dass wahrcheinlich mehr als ein Polymorphismus an der interessierenden Basenposiotion vorliegt.
  • EINGEHENDE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
  • In der folgenden Beschreibung wird die Erfindung anhand bevorzugter Ausführungsformen, die die VLSIPSTM-Technologie zur Erzeugung sehr großer Gruppierungen von Olignonukleotidsonden auf Chips verwenden, erläutert. Die Erfindung ist jedoch nicht auf Nukleinsäuren oder auf diese Technologie eingeschränkt und kann vorteilhafterweise bei anderen Polymeren und Herstellungsverfahren angewendet werden. Daher dient die folgende Beschreibung der Ausführungsformen lediglich Veranschaulichungszwecken und nicht der Einschränkung.
  • 1 veranschaulicht ein Beispiel für ein Computersystem, das zur Ausführung der Software einer erfindungsgemäßen Ausführungsform verwendet wird. 1 zeigt ein Computersystem 1, das eine Anzeige 3, einen Bildschirm 5, ein Gehäuse 7, eine Tastatur 9 und eine Maus 11 umfasst. Die Maus 11 kann einen oder mehrere Knöpfe aufweisen, die mit der Grafik-Benutzerschnittstelle interagieren. Das Gehäuse 7 birgt ein CD-ROM-Laufwerk 13, System-Speicher und ein Festplattenlaufwerk (siehe 2), die zum Speichern und Aufrufen von Softwareprogrammen verwendet werden können, die den Computercode zur Durchführung der Erfindung, Daten zur erfindungsgemäßen Verwendung und dergleichen beinhalten. Es ist zwar ein CD-ROM 15 als beispielhaftes computerlesbares Speichermedium gezeigt, jedoch können andere Speichermedien verwendet werden, wie Floppy-Disk, Band, Flash-Memory, System-Memory und Hard-Drive. Zusätzlich kann ein Datensignal, das in einer Trägerwelle (beispielsweise in einem Netzwerk, wie dem Internet) aufgenommen ist, ein computerlesbares Speichermedium sein.
  • 2 zeigt ein System-Blockdiagramm von Computersystem 1, das zur Ausführung der Software einer erfindungsgemäßen Ausführungsform verwendet wird. Wie in 1 beinhaltet das Computersystem 1 den Monitor 3 und die Tastatur 9 sowie Maus 11. Das Computersystem 1 beinhaltet weiterhin Untersysteme, wie den Zentralprozessor 51, System-Memory 53, Festspeicher 55 (beispielsweise Festplattenlaufwerk), Wechselspeichermedium 57 (beispielsweise CD-ROM-Laufwerk), Display-Adapter 59, Sound-Karte 61, Lautsprecher 63 und Netzwerk-Schnittstelle 65. Andere Computersysteme, die sich zur erfindungsgemäßen Verwendung eignen, können zusätzliche oder wenigere Untersysteme umfassen. Ein anderes Computersystem kann mehr als einen Prozessor 51 (d.h. ein Multiprozessorsystem) oder ein Cache-Speicher umfassen.
  • Die Systembus-Architektur von Computersystem 1 wird durch die Pfeile 67 veranschaulicht. Diese Pfeile veranschaulichen aber jedes Zwischenverbindungsschema, das dazu dient, die Untersysteme miteinander zu koppeln. Ein Local Bus kann beispielsweise zur Verbindung von Zentralprozessor mit dem Systemspeicher und Anzeigeadapter verwendet werden. Das in 2 gezeigte Computersystem 1 ist aber lediglich ein Beispiel für ein Computersystem, das sich zur erfindungsgemäßen Verwendung eignet. Andere Computer-Architekturen mit verschiedenen Konfigurationen der Untersysteme können ebenfalls eingesetzt werden.
  • Die Erfindung ist für Veranschaulichungszwecke als Teil eines Computersystems beschrieben, das eine Chip-Maske entwirft, die Sonden auf dem Chip synthetisiert, die Nukleinsäuren markiert und die hybridisierten Nukleinsäuresonden durchmustert. Ein solches System ist vollständig in US-Patent 5 571 639 beschrieben. Die Erfindung kann jedoch gesondert von dem Gesamtsystem zur Analyse der durch solche Systeme erzeugten Daten verwendet werden.
  • 3 veranschaulicht ein computergesteuertes System zum Erzeugen und Analysieren von Gruppierungen biologischer Materialien, wie RNA oder DNA. Ein Computer 100 wird zum Entwerfen von Gruppierungen biologischer Polymere, wie RNA und DNA, verwendet. Der Computer 100 kann beispielsweise eine geeignet programmierte Sun-Workstation oder ein Personal Computer oder eine Workstation sein, wie ein IBM PC-Äquivalent, mit einem geeigneten Speicher und einer CPU, wie in den 1 und 2 gezeigt. Das Computersystem 100 erhält Eingaben von einem Anwender in Bezug auf die Eigenschaften eines interessierenden Gens, sowie andere Dateneingaben, die die gewünschten Eigenschaften der Gruppierung betreffen. Das Computersystem kann gegebenenfalls Information erhalten, die eine bestimmte interessierende Gensequenz von einer externen oder internen Datenbank 102, wie GenBank, betreffen. Die Ausgabe des Computersystems 100 ist ein Satz von Chip-Design-Computerdateien 104, beispielsweise in der Form einer Switch-Matrix, wie sie in der PCT-Anmeldung WO 92/10092 beschrieben ist, und anderen angegliederten Computerdateien.
  • Die Chip-Design-Dateien werden einem System 106 zugeführt, das die lithographischen Masken entwirft, die bei der Herstellung von Gruppierungen von Molekülen, wie DNA, verwendet werden. Das System oder das Verfahren 106 kann eine Hardware enthalten, die zur Herstellung der Masken 110 nötig ist, und auch die nötige Computer-Hardware und Software 108, die zum Auflegen der Maskenmuster auf der Maske auf effiziente Weise nötig ist. Entsprechend der anderen Eigenschaften in 3 kann sich eine solche Ausrüstung an der gleichen physikalischen Stelle befinden oder nicht, ist aber zur einfacheren Veranschaulichung in 3 zusammen gezeigt. Das System 106 erzeugt die Masken 110 oder andere Synthesemuster, wie Chrom-auf-Glas-Masken zur Verwendung bei der Herstellung von Polymergruppierungen.
  • Die Masken 110, sowie die ausgewählte Information in Bezug auf das Design der Chips aus System 100 werden in einem Synthesesystem 112 verwendet. Das Synthesesystem 112 beinhaltet die notwendige Hard- und Software, die zur Herstellung von Polymergruppierungen auf einem Substrat oder einem Chip 114 verwendet werden. Das Synthesegerät 112 beinhaltet eine Lichtquelle 116 und eine chemische Fließzelle 118, auf der das Substrat oder Chip 114 untergebracht wird. Die Maske 110 wird zwischen der Lichtquelle und dem Substrat bzw. Chip untergebracht, und die beiden werden bei geeigneten Zeiten zum Entfernen des Schutzes ausgewählter Bereiche des Chips in Bezug zueinander verschoben. Ausgewählte chemische Reagenzien werden durch die Fließzelle 118 zum Kuppeln an die Bereiche, bei denen der Schutz entfernt wurde, sowie für Wasch- und andere Vorgänge geleitet. Sämtliche Vorgänge werden vorzugsweise durch einen geeignet programmierten Computer 119 gesteuert, der der gleiche Computer wie der oder die Computer sein kann, wie sie zum Masken-Entwurf und zur Maskenherstellung verwendet werden.
  • Die durch das Synthesesystem 112 hergestellten Substrate werden gegebenenfalls zu kleineren Chips geschnitten und Markerzielen ausgesetzt. Die Ziele können zu einem oder mehreren Molekülen auf dem Substrat komplementär sein oder nicht. Die Ziele werden mit einer Markierung, wie einer Fluorescein-Markierung (angegeben mit einem Stern in 3), markiert und in einem Scanningsystem 120 untergebracht. Die bevorzugten Ausführungsformen verwenden zwar Fluoreszenzmarker, jedoch können andere Marker eingesetzt werden, die Unterschiede in der Radioaktivitätsintensität, Lichtstreuung, Brechungsindex, Leitfähigkeit, Elektrolumineszenz oder anderen Erkennungsdaten großer Moleküle bereitstellen. Daher ist die Erfindung nicht auf die Analyse von Hybridisierungs-Fluoreszenzmessungen eingeschränkt, sondern sie kann leicht zur Analyse anderer Hybridisierungsmessungen verwendet werden.
  • Das Scanningsystem 120 wirkt wiederum unter der Steuerung eines geeignet programmierten Digitalcomputers 122, der ebenfalls der gleiche Computer sein kann wie die Computer, die bei der Synthese, Masken-Herstellung und Masken-Design verwendet werden, oder nicht. Der Scanner 120 umfasst eine Erkennungsvorrichtung 124, wie ein Konfokal-Mikroskop oder eine CCD (ladungsgekoppelte Vorrichtung), die zur Erkennung der Stelle verwendet wird, an der das markierte Ziel (*) an das Substrat gebunden ist. Der Ausgang von Scanner 120 ist ein bzw. mehrere Bilddateien, die im Fall eines fluoresceinmarkierten Ziels die Fluoreszenzintensität (Photonenzahlen oder eine andere ähnliche Messung, wie Spannung) als Funktion der Position auf dem Substrat anzeigt. Da höhere Photonenzahlen beobachtet werden wo die markierten Ziele stärker an die Gruppierung der Polymere gebunden sind (beispielsweise DNA-Sonden an das Substrat), und da die Monomersequenz der Polymere auf dem Substrat als Funktion der Position bekannt ist, lässt bzw. lassen sich die Sequenzen) von dem oder den Polymeren auf dem Substrat bestimmen, die komplementär zum Ziel sind.
  • Die Bilddatei 124 wird einem Analysesystem 126 eingegeben, das die erfindungsgemäßen Syntheseintegritätsbewertungstechniken enthält. Wiederum kann das Analysesystem aus einer großen Anzahl von einem oder mehreren Computersystemen ausgewählt werden, jedoch beruht das Analysesystem bei einer bevorzugten Ausführungsform auf der WINDOWS NT Workstation oder einem Äquivalent. Das Analysesystem kann die Bilddateien) analysieren und den geeigneten Ausgang 128, wie die Identität spezifischer Mutationen in einem Ziel wie DNA oder RNA, erzeugen.
  • 4 veranschaulicht die Bindung einer bestimmten Ziel-DNA an eine Gruppierung von DNA-Sonden 114. Wie in diesem einfachen Beispiel gezeigt werden die folgenden Sonden in der Gruppierung gebildet:
    Figure 00070001
  • Wird demzufolge das fluoresceinmarkierte (oder sonst wie markierte) Ziel 5'-TCTTGCA der Gruppierung ausgesetzt, ist es nur komplementär zur Sonde 3'-AGAACGT, und Fluorescein findet sich vorwiegend auf der Oberfläche desjenigen Chips, auf dem sich 3'-AGAACGT befindet. Der Chip enthält Zellen, die mehrere Kopien einer bestimmten Sonde enthalten, und die Zellen können quadratische Bereiche auf dem Chip sein.
  • 5 ist ein High-Level-Fließschema eines Verfahrens zur Analyse von Testpolymeren, wie Nukleinsäuresequenzen. Bei Schritt 201 werden Hybridisierungsaffinitätsdatensätze in ein Computersystem eingegeben. Die Hybridisierungsaffinitätsdaten können in einer beliebigen Zahl von Formen vorliegen, einschließlich Fluoreszenz-, Radioaktivitäts- oder anderer Daten. Die Hybridisierungsaffinitätsdaten können ohne Modifikation als Eingabe für die Clusterinformation verwendet werden. Die Variationen der Daten können reduziert werden, indem man sie normalisiert.
  • Die Hybridisierungsaffinitätsdaten von jedem Satz werden bei Schritt 203 normalisiert. Mit Hilfe der Normalisierung lassen sich übereinstimmendere Daten zwischen und innerhalb der Experimente schaffen. Die Normalisierung kann beispielsweise das Dividieren jedes Hybridisierungsaffinitätswertes durch die Summe sämtlicher anderer Hybridierungsaffinitätswerte beinhalten, so dass jeder Hybridisierungsaffinitätswert auf einen Wert zwischen 0 und 1 reduziert wird. Die Normalisierung kann zwar bei einigen Anwendungen vorteilhaft sein, ist aber nicht erforderlich. Daher veranschaulichen die in den Fließdiagrammen gezeigten Schritte spezifische Ausführungsformen, und Schritte können im Geist und Schutzbereich der Erfindung wegegelassen, hinzugefügt, kombiniert und modifiziert werden.
  • Bei Schritt 205 werden die Hybridisierungsaffinitätsdatensätze geclustert. Clusteranalyseverfahren akzeptieren als Eingabe gewöhnlich Mehrfachdatenmuster (beispielsweise dargestellt durch Vektoren von Fließkommazahlen) und ordnen die Muster zu Clustern mit ähnlichen Mustern um. Bevorzugte Ausführungsformen gruppieren Datenmuster zu hierarchischen Clustern, wobei jeder Cluster Cluster beinhaltet, die einander ähnlicher sind als zu anderen Clustern.
  • Sobald die Cluster gebildet wurden, können sie einem Anwender auf dem Bildschirm zur Analyse bei Schritt 207 angezeigt werden. Zusätzlich zur Anzeige der Cluster kann das Computersystem ebenfalls die Cluster interpretieren und dem Anwender die Anzahl der gefundenen unterschiedlichen Cluster ausgeben. 5 wurde bei High Level beschrieben, damit der Leser ein anfängliches Verständnis der Erfindung erhält, und die folgende Beschreibung erläutert die Erfindung eingehender.
  • 6 zeigt ein Fließschema eines Verfahrens, das Hybridisierungsaffinitätsdaten clustert. Bei Schritt 301 wird überprüft, ob die Hybridisierungsaffinitätsdatensätze zu einem einzelnen Root-Cluster geclustert wurden. Ein Cluster kann ein oder mehrere Untercluster enthalten, und ein Root-Cluster ist ein Cluster, der nicht in einem anderen Cluster enthalten ist. In der folgenden Beschreibung kann ein Cluster (oder Untercluster) ein einzelner Hybridisierungsaffinitätsdatensatz sein, oder er kann mehrere Sätze aufweisen.
  • Zu Beginn wird jeder Hybridiserungsaffinitätsdatensatz als Einzelcluster angesehen. Mit fortschreitendem Clustern werden Cluster, die für ähnlich genug befunden werden, zu einem neuen Cluster zusammengefasst. Wird bestimmt, dass sämtliche Hybridisierungsaffinitätsdatensätze zu einem einzelnen Root-cluster in Schritt 303 geclustert werden, ist das Clustern beendet.
  • Ansonsten werden die zwei engsten Cluster bei Schritt 305 gefunden. Der Begriff "am engsten sein" bedeutet, dass ein metrisches Maß angibt, dass zwei der Cluster Daten enthalten, die einander ähnlicher sind als die anderen Cluster untereinander. Eine Anzahl verschiedener metrischer Abstände kann verwendet werden, einschließlich der euklidischen Strecke, die eingehender anhand der 7 beschrieben wird. Am stärksten bevorzugt erfüllt der metrische Abstand die Dreicksungleichung insofern als f(a,c)<= f(a,b) + f(b,c) für jeden Datenmustersatz {a,b,c} gilt.
  • In den hier beschriebenen Ausführungsformen beinhaltet ein Cluster bis zu zwei Hybridisierungsaffinitätsdatensätze. Es ist jedoch nicht erforderlich, dass die Cluster auf diese Weise eingeschränkt werden. Die Erfindung kann beispielsweise vorteilhaft bei Clustern angewendet werden, die durch eine Erweiterung der hier beschriebenen Prinzipien bis zu drei oder mehr Hybridisierungsaffinitätsdatensätze enthalten können.
  • Bei Schritt 307 wird ein neuer Cluster erzeugt, der die zwei engsten Cluster enthält. Zum Vergleichen des neuen Clusters mit anderen Clustern sollte ein Wert berechnet werden, der die Daten in dem neuen Cluster darstellt. Bei einer Ausführungsform wird der Durchschnitt der beiden engsten Cluster für den neuen Cluster bei Schritt 309 mit dem Computer berechnet. Nach dem Erzeugen des neuen Clusters läuft der Fluss zu Schritt 301, und es wird überprüft, ob nur ein Root-Cluster übrig bleibt.
  • Die 7 zeigt ein Fließdiagramm eines Verfahrens zur Analyse von Testnukleinsäuresequenzen. Für diese Ausführungsform werden Hybridisierungsdaten von einem Chip mit Sense- und Antisense-Sonden verwendet. Fragmente der Sense- und Antisense-Stränge eines Ziels werden markiert und dem Chip ausgesetzt, was zu vier Hybridisierungsaffinitätsmessungen für den Sense-Strang und vier Hybridisierungsaffinitätsmessungen für den Antisense-Strang bei jeder Abfrageposition führt.
  • Ist beispielsweise der Sense-Strang einer Zielsequenz (oder eines Abschnitts davon) 5'-GTAACGTTG, dann würden die folgenden Sense-Sonden die unterstrichene Basenposition abfragen:
    Figure 00100001
  • Der Antisense-Strang der Zielsequenz (oder eines Abschnitts davon) ist 3'-CATTGCAAC, und die folgenden Sense-Sonden fragen die unterstrichene Basenposition für den Antisense-Strang ab:
    Figure 00100002
  • Folglich gibt es in dieser Ausführungsform acht Hybridisierungsaffinitäten, und zwar eine für jede Sonde bei jeder Abfrageposition.
  • Bei Schritt 401 werden die Hybridisierungsaffinitätsdatensätze in ein Computersystem eingegeben. Dies kann das Lesen einer Datei beinhalten, die die Hybridisierungsaffinitätsdaten für jede Basenposition enthält, die in dem Ziel abgefragt wird. Wie vorstehend erörtert können die Hybridisierungsaffinitätsdaten für eine Basenposition 8 gemessene Hybridisierungsaffinitäten beinhalten. Die 8 gemessenen Hybridisierungsaffinitäten können als Satz oder Muster von 8 Werten (beispielsweise Photonenzahl), wie {A1, A2, ..., A8} gespeichert werden.
  • Die Hybridisierungsaffinitätsdaten jedes Satzes werden bei Schritt 403 normalisiert. Die Normalisierung der Hybridisierungsaffinitätsdaten kann die Bedeutung der Unterschiede, die sich nicht direkt auf die Zielsequenz-Zusammensetzung beziehen, mindern. Eine effiziente Strategie zur Normalisierung der Hybridisierungsaffinitäten eines Satzes ist es, erst den Durchschnitt der Hybridisierungsaffinitäten für einen Satz zu berechnen und diesen Durchschnitt von jeder Hybridisierungsaffinität in dem Satz zu subtrahieren. Dann wird jede Hybridisierungsaffinität, von der der Durchschnitt subtrahiert wurde, durch die Quadratwurzel der Summe der quadrierten Hybridisierungsaffinitäten des Satzes abzüglich der durchschnittlichen Hybridisierungsaffinität dividiert. Mit anderen Worten wird die folgende Formel zur Normalisierung jeder Hybridisierungsaffinität eines Satzes verwendet. Al = (Al – Ā)/Quadratwurzel ((A1 – Ā)2 + (A2 – Ā)2 + ... +(A8 – Ā)2), wobei 1 von 1 bis 8 reicht, und Ā der Durchschnitt von A1, A2, ..., A8 ist.
  • 8 zeigt graphisch, wie die Normalisierung die Hybridisierungsaffinitäten beeinflussen kann. Die Hybridisierungsaffinitäten 451 sind die von dem Chip gemessenen Rohdaten, und die Höhe der Balken zeigt die relative gemessene Hybridisierungsaffinität.
  • Die Hybridisierungsaffinitäten 453, von denen der Durchschnitt subtrahiert wurde, zeigen, dass die Hybridisierungsaffinitäten nun Vektoren in zwei möglichen Richtungen sind. Die Hybridisierungen, von denen der Durchschnitt subtrahiert wurde, werden in einem Zwischenvektormuster 455 vereinigt. Die Normalisierung des Vektormusters 455 wird beendet, indem die Vektoren jeweils durch den vorstehenden Nenner geteilt werden, so dass ein endgültiges normalisiertes Vektormuster 457 erhalten wird.
  • Die Normalisierung kann verschiedene Hintergründe und Gesamthybridisierungsaffinitätswerte korrigieren, während die Stellung jeder Hybridisierungsaffinität in dem Satz sowie der Unterschied der Gesamthybridisierungsaffinitätzwischen den Sense- und Antisense-Sonden beibehalten werden. Zudem wird durch Normalisieren des Satzes von 8 Werten in der beschriebenen Weise die Distanz zwischen zwei Mustern auf (0,2) begrenzt, so dass eine konsistente Skala erhalten wird, auf der die Musterunterschiede bewertet werden können.
  • Ebenfalls in 7 werden die Hybridisierungsaffinitätsdatensätze bei Schritt 405 hierarchisch geclustert. Es kann jede Zahl von Clusteralgorithmen verwendet werden. Bei bevorzugten Ausführungsformen wird eine Modifikation des mittleren Linkage-Clusteralgorithmus verwendet. Der Wert für einen Cluster, der nur einen einzigen Satz von Hybridisierungsaffinitäten enthält, ist das Muster von 8 Hybridisierungsaffinitäten. Der Wert von einem Cluster C, der zwei Cluster A und B enthält, ist wie folgt: Cl = Durchschnitt (Al, Bl), wobei l von 1 bis 8 reicht. Somit wird jedes Cluster durch ein 8-Werte-Muster dargestellt. Andere Linkage-Berechnungen lassen sich verwenden, einschließlich des herkömmlichen mittleren Linkage, wobei das Mittel der Distanzen zwischen den einzelnen Mitglieder eines Musters verwendet wird. Zusätzlich kann die größte (oder kleinste) Distanz zwischen den beiden Mitgliedern von mindestens 2 Clustern als Linkage-Formel verwendet werden.
  • Die Distanz zwischen den beiden Clustern wird gewöhnlich durch einen metrischen Abstand bestimmt. Viele verschiedene metrische Abstände können verwendet werden, einschließlich der euklidischen Distanz, City-Block-Distanz Korrelationsdistanz, Winkeldistanz und dergleichen. Am stärksten bevorzugt wird die euklidische Strecke verwendet, die wie folgt berechnet wird: DAB = Quadratwurzel ((A1 – B1)2 + (A2 – B2)2 + ... + (A8 – B8)2)wobei lvon 1 bis 8 reicht. Die Cityblock-Distanz kann wie folgt errechnet werden: DAB = |(A1 – B1)| + |(A2 – B2)| + ... + |(A8 – B8)|wobei lvon 1 bis 8 reicht, und |(X)| der absolute Wert von X ist.
  • Bei Schritt 407 wird die Anzahl "enger" Cluster gezählt. Ein "enger" Cluster ist definiert als ein beliebiger Cluster, bei dem die mittlere Distanz zwischen dem Clustermittel und den Mitteln seiner Untercluster geringer ist als die Distanz zum nächsten Schwestercluster, und zwar über einen Ähnlichkeitsfaktor (beispielsweise einen Faktor von 3). Für den Anwender ist es ziemlich einfach, optisch Cluster zu identifizieren, aber die Anzahl enger Cluster kann als berechnete Bestimmung der Anzahl von Clustern verwendet werden. Gibt es zwei oder mehrere enge Cluster, ist die Abfrageposition wahrscheinlich polymorph. Man beachte, dass die Steigerung der Zahl der Dimensionen in einem Eingabemuster die Möglichkeit stark senkt, dass zwei Muster zufällig ähnlich sind, und der Wert des Ähnlichkeitsfaktors kann entsprechend eingestellt werden.
  • Die Cluster werden bei Schritt 409 angezeigt. Die Cluster können auf beliebige Weise angezeigt werden, aber in bevorzugten Ausführungsformen werden sie als Dendrogramme angezeigt. Dendrogramme sind Diagramme, die Cluster darstellen. Die Distanz zwischen den Clustern kann auf dem Dendrogramm dargestellt werden, so dass der Anwender die Cluster leichter identifizieren kann, die einen Polymorphismus anzeigen, wie eine Mutation, Insertion oder Deletion. Mit anderen Worten variiert die Distanz zwischen den Clustern mit der Ähnlichkeit der Cluster.
  • 9 veranschaulicht beispielsweise eine Bildschirmanzeige mit einem Dendrogramm, das anzeigt, dass kein Polymorphismus an der interessierenden Position zu sein scheint. Eine Bildschirmanzeige 501 beinhaltet ein Dendrogramm 503. Das Dendrogramm wird anhand der 10 eingehender beschrieben.
  • Die Bildschirmanzeige 501 beinhaltet Rohdaten 505 und die angezeigten Basenaufrufe. Ein Plot 507 der Hybridisierungsaffinitäten gegen die Basenposition ist sowohl für Sense- als auch Antisense-Stränge zur Mustererkennung gezeigt. Eine Tabelle 509 beinhaltet die Information über die Basenpositionen für den Chip. Zusätzlich bietet ein Bild 511 Information für die Abschätzung des Anteils der Mutanten. Das Dendrogramm 503 (und andere) ist das Thema der folgenden Absätze.
  • Die 10 zeigt ein Dendrogramm von 9, das 8 Hybridisierungsaffinitätsdatensätze (dargestellt durch den Zielnamen) clustert. Eine optische Untersuchung von Dendrogramm 503 ergibt, dass die Distanz zwischen den Clustern (veranschaulicht durch die horizontale Länge des Dendrogramms) relativ konstant ist. Dies zeigt, dass die Muster relativ konstant sind und daher wahrscheinlich kein Polymorphismus an der Abfrageposition vorliegt.
  • 11 veranschaulicht ein Dendrogramm, das anzeigt, dass wahrscheinlich ein Polymorphismus an der interessierenden Position vorliegt. Das Dendrogramm 603 zeigt das Clustern von 8 Hybridisierungsaffinitätsdatensätzen. Eine optische Begutachtung des Dendrogramms ergibt, dass es zwei Cluster 605 und 607 zu geben scheint, wobei die Distanz zwischen den Mitgliedern eines Clusters viel geringer ist als die Distanz zwischen Mitgliedern anderer Cluster. Da die Muster in zwei Cluster fallen, liegt wahrscheinlich ein Polymorphismus an der Abfrageposition vor.
  • Als weiteres Beispiel veranschaulicht 12 eine Bildschirmanzeige mit einem Dendrogramm, das zeigt, dass wahrscheinlich mehr als ein Polymorphismus an der interessierenden Basenposition vorliegt. Ein Dendrogramm 703 zeigt die Clusterung von 8 Hybridisierungsaffinitätsdatensätzen. Eine optische Untersuchung des Dendrogramms ergibt, dass es drei Cluster 705, 707 und 709 zu geben scheint, bei denen die Distanz zwischen den Mitgliedern eines Clusters viel geringer ist, als die Distanz zwischen den Mitgliedern anderer Cluster. Da die Muster in drei Cluster fallen, gibt es wahrscheinlich 2 Polymorphismen an der Abfrageposition.
  • Erfindungsgemäß lassen sich Erscheinungen erkennen, die durch Untersuchung einer einzelnen Hybridisierungsreaktion nicht erkennbar sind. Die Anzahl und die Diversität von Sonden zum Erkennen einer bestimmten Klasse von Erscheinungen kann reduziert werden. Mutationen im BRCA-Gen sind beispielsweise so divers, dass die Konstruktion eines Satzes von Sonden, die jeden möglichen Polymorphismus abdecken würden, unpraktisch ist. Die Erfindung kann zur Erkennung solcher Polymorphismen selbst in Abwesenheit solcher Sonden verwendet werden.
  • Das Clustern kann zudem zur Analyse oder Bewertung der Effektivität von Versuchssystemen verwendet werden, z.B. von Genotypbestimmungs-Chips, wobei geeignete Ergebnisse von der Erkennung einer festen Anzahl stark reproduzierbarer Klassen in den resultierenden Daten abhängen. Im Fall der Genotypbestimmung erwartet man drei dicht geclusterte Klassen, die den homozygoten Wildtyp, die homozygote Mutante bzw. die heterozygoten Genotypen veranschaulichen. Metrische Abstände, die mit der Hierarchie von Mustern errechnet werden, und die durch einen Clustering-Algorithmus erzeugt werden, können eine quantitative Bestimmung der Spezifität und der Reproduzierbarkeit des Genotyp-Bestimmungsverfahrens bieten.
  • Das Vorstehende ist zwar eine vollständige Beschreibung der bevorzugten Ausführungsformen der Erfindung, jedoch können verschiedene Alternativen, Modifikationen und Äquivalente verwendet werden. Es sollte ersichtlich sein, dass die Erfindung sich gleichermaßen durch geeignetes Modifizieren der vorstehend beschriebenen Ausführungsformen anwenden lässt. Die Erfindung wurde beispielsweise in Bezug auf Nukleinsäuresonden beschrieben, die auf einem Chip synthetisiert werden. Die Erfindung kann jedoch vorteilhafterweise auf andere Monomere (beispielsweise Aminosäuren und Saccharide) sowie andere Hybridisierungstechniken angewendet werden, z.B. solche, bei denen die Sonden nicht an ein Substrat gebunden sind.

Claims (16)

  1. Verfahren zum Erkennen von Polymorphismen in Testnukleinsäuresequenzen, umfassend Eingeben einer Anzahl Datensätze zu Hybridisierungsaffinitäten, wobei die Hybridisierungsaffinitätsdatensätze die Hybridisierungsaffinitäten zwischen einer Testnukleinsäuresequenz und den Nukleinsäureproben enthalten; hierarchisches Clustern der Anzahl Hybridisierungsaffinitätsdatensätze in eine Anzahl Cluster, so dass die Hybridisierungsaffinitätsdatensätze in den Clustern alle untereinander ähnlicher sind als zu den Hybridisierungsaffinitätsdatensätzen anderer Cluster; und Analysieren der Anzahl Cluster zur Bestimmung einer Zahl enger Cluster, wobei ein enger Cluster ein Cluster ist, bei dem die durchschnittliche Distanz zwischen dem Clustermittel und den Mitteln seiner Untercluster geringer ist als die Distanz zum nächsten Schwestercluster und zwar über einen Ähnlichkeitsfaktor, der derart ist, dass die Anzahl enger Cluster anzeigt, ob ein Polymorphismus in den Testnukleinsäuresequenzen vorliegt.
  2. Verfahren nach Anspruch 1, wobei die Testnukleinsäurequenz und die Nukleinsäureproben sowohl Sense- als auch Antisense-Stränge enthält.
  3. Verfahren nach Anspruch 2, wobei die Hybridisierungsaffinitätsdaten vier Hybridisierungsaffinitäten für die Sensestränge darstellen und vier Hybridisierungsaffinitäten für die Antisense-Stränge.
  4. Verfahren nach Anspruch 3, wobei die vier Hybridisierungsaffinitäten für die Antisense-Stränge die Hybridisierungsaffinitäten zwischen den Nukleinsäureproben darstellen, die durch mindestens eine Nukleinsäure an der Abfrageposition verschieden sind.
  5. Verfahren nach Anspruch 3, wobei die vier Hybridisierungsaffinitäten für die Antisense-Stränge Hybridisierungsaffinitäten darstellen zwischen Nukleinsäureproben, die durch mindestens eine Nukleinsäure an der Abfrageposition verschieden sind.
  6. Verfahren nach Anspruch 1, wobei die Polymorphismen Mutationen, Deletionen und Insertionen an der Abfrageposition aufweisen.
  7. Verfahren nach Anspruch 1, zudem umfassend die normalisierten Hybridisierungsaffinitätsdaten für jeden Satz und umfassend das hierarchische Clustern der normalisierten Hybridisierungsaffinitätsdaten.
  8. Verfahren nach Anspruch 7, wobei das Normalisieren der Hybridisierungsaffinitätsdaten für jeden Satz beinhaltet das Abziehen einer mittleren Hybridisierungsaffinität von den Hybridisierungsaffinitäten und das Teilen der jeweiligen Hybridisierungsaffinität durch die Quadratwurzel der Summe der quadrierten Abweichungen der Hybridisierungsaffinitäten.
  9. Verfahren nach Anspruch 1, wobei der Schritt des Clusterns der Anzahl Hybridisierungsaffinitätsdatensätze beinhaltet das Berechnen einer mittleren Clusterverknüpfung der Cluster.
  10. Verfahren nach Anspruch 9, wobei die mittlere Clusterverknüpfung der Proben einen metrischen Abstand für die Unterschiede zwischen den Clustern verwendet.
  11. Verfahren nach Anspruch 10, wobei der metrische Abstand eine euklidische Strecke oder eine Cityblock-Distanz ist.
  12. Verfahren nach Anspruch 1, zudem umfassend das Darstellen einer Baumstruktur der Anzahl Cluster.
  13. Verfahren nach Anspruch 12, wobei die Strecke zwischen den Clustern sich mit der Ähnlichkeit der Cluster ändert.
  14. Computerprogramm, umfassend Kodiereinrichtungen zur Durchführung all der Schritte des Verfahrens nach einem der Ansprüche 1 bis 13, sofern auf einem Datenverarbeitungssystem vorgenommen.
  15. Computerlesbares Medium mit einer Computercodeeinrichtung darauf, das die Schritte des Verfahrens nach einem der Ansprüche 1 bis 13 vornimmt, wenn auf einem Datenverarbeitungssystem ausgeführt.
  16. Computerlesbares Medium nach Anspruch 15, wobei das computerlesbare Medium ausgewählt ist aus der Gruppe Floppy-Disk, Band, Flash-Memory, System-Memory, Hard-Drive und Datensignal auf einer Trägerwelle.
DE69827154T 1997-08-15 1998-08-14 Polymorphismuserkennung mit hilfe cluster-analyse Expired - Lifetime DE69827154T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US5593997P 1997-08-15 1997-08-15
US55939P 1997-08-15
PCT/US1998/016971 WO1999009218A1 (en) 1997-08-15 1998-08-14 Polymorphism detection utilizing clustering analysis

Publications (2)

Publication Number Publication Date
DE69827154D1 DE69827154D1 (de) 2004-11-25
DE69827154T2 true DE69827154T2 (de) 2006-03-09

Family

ID=22001120

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69827154T Expired - Lifetime DE69827154T2 (de) 1997-08-15 1998-08-14 Polymorphismuserkennung mit hilfe cluster-analyse

Country Status (8)

Country Link
US (3) US6223127B1 (de)
EP (1) EP1019536B1 (de)
JP (1) JP2001514907A (de)
AT (1) ATE280246T1 (de)
AU (1) AU9198298A (de)
CA (1) CA2299625A1 (de)
DE (1) DE69827154T2 (de)
WO (1) WO1999009218A1 (de)

Families Citing this family (125)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5830655A (en) 1995-05-22 1998-11-03 Sri International Oligonucleotide sizing using cleavable primers
CA2299625A1 (en) * 1997-08-15 1999-02-25 Affymetrix, Inc. Polymorphism detection utilizing clustering analysis
US6979728B2 (en) 1998-05-04 2005-12-27 Baylor College Of Medicine Articles of manufacture and methods for array based analysis of biological molecules
US6699659B2 (en) * 1998-06-01 2004-03-02 Affymetrix, Inc. Products and methods for analyzing nucleic acids including identification of substitutions, insertions and deletions
US20040111219A1 (en) * 1999-02-22 2004-06-10 Sandeep Gulati Active interferometric signal analysis in software
US6142681A (en) 1999-02-22 2000-11-07 Vialogy Corporation Method and apparatus for interpreting hybridized bioelectronic DNA microarray patterns using self-scaling convergent reverberant dynamics
US6245511B1 (en) * 1999-02-22 2001-06-12 Vialogy Corp Method and apparatus for exponentially convergent therapy effectiveness monitoring using DNA microarray based viral load measurements
US6136541A (en) 1999-02-22 2000-10-24 Vialogy Corporation Method and apparatus for analyzing hybridized biochip patterns using resonance interactions employing quantum expressor functions
US7179638B2 (en) 1999-07-30 2007-02-20 Large Scale Biology Corporation Microarrays and their manufacture by slicing
US6713309B1 (en) 1999-07-30 2004-03-30 Large Scale Proteomics Corporation Microarrays and their manufacture
US20020052692A1 (en) * 1999-09-15 2002-05-02 Eoin D. Fahy Computer systems and methods for hierarchical cluster analysis of large sets of biological data including highly dense gene array data
WO2001029257A2 (en) * 1999-10-22 2001-04-26 Genset Methods of genetic cluster analysis
JP3563315B2 (ja) 1999-12-14 2004-09-08 日立ソフトウエアエンジニアリング株式会社 樹状図表示方法及び樹状図表示システム
AU2001231064A1 (en) * 2000-01-21 2001-07-31 Lion Bioscience Ag Data analysis software
US6958214B2 (en) 2000-07-10 2005-10-25 Sequenom, Inc. Polymorphic kinase anchor proteins and nucleic acids encoding the same
US20040101878A1 (en) * 2000-12-22 2004-05-27 Jones Michael H. High-throughput screening system by microarrays
US20020183936A1 (en) * 2001-01-24 2002-12-05 Affymetrix, Inc. Method, system, and computer software for providing a genomic web portal
WO2003005628A2 (en) * 2001-07-06 2003-01-16 Lipomics Technologies, Inc. Generating, viewing, interpreting, and utilizing a quantitative database of metabolites
US6799122B2 (en) 2001-08-31 2004-09-28 Conagra Grocery Products Company Method for identifying polymorphic markers in a population
AU2002348574A1 (en) * 2001-09-24 2003-04-07 Lipomics Technologies, Inc. Methods of using quantitative lipid metabolome data
US7439346B2 (en) 2001-10-12 2008-10-21 Perkinelmer Las Inc. Nucleic acids arrays and methods of use therefor
AU2002367886B8 (en) 2001-10-12 2008-08-14 Perkinelmer Las, Inc. Compilations of nucleic acids and arrays and methods of using them
CN1281324C (zh) * 2001-12-19 2006-10-25 阿菲梅特里克斯公司 阵列板和阵列板的构建方法
US7272506B2 (en) * 2002-03-01 2007-09-18 Applera Corporation Computer algorithm for automatic allele determination from fluorometer genotyping device
EP1501863A4 (de) 2002-05-03 2007-01-24 Sequenom Inc Kinaseankerproteinmuteine, peptide davon und damit im zusammenhang stehende verfahren
US7006680B2 (en) * 2002-05-03 2006-02-28 Vialogy Corp. System and method for characterizing microarray output data
US20050089909A1 (en) * 2002-05-31 2005-04-28 Mcgill University PTHrP-based prediction and diagnosis of bone disease
US7504215B2 (en) 2002-07-12 2009-03-17 Affymetrix, Inc. Nucleic acid labeling methods
EP2112229A3 (de) 2002-11-25 2009-12-02 Sequenom, Inc. Verfahren zum Identifizieren des Brustkrebsrisikos und zugehörige Behandlungen
EP2316973A1 (de) 2003-06-10 2011-05-04 The Trustees Of Boston University Nachweismethoden für Lungenerkrankungen
US7259258B2 (en) * 2003-12-17 2007-08-21 Illumina, Inc. Methods of attaching biological compounds to solid supports using triazine
US20050191682A1 (en) 2004-02-17 2005-09-01 Affymetrix, Inc. Methods for fragmenting DNA
US7035740B2 (en) * 2004-03-24 2006-04-25 Illumina, Inc. Artificial intelligence and global normalization methods for genotyping
US20050282174A1 (en) * 2004-06-19 2005-12-22 Webb Peter G Methods and systems for selecting nucleic acid probes for microarrays
EP1773860A4 (de) * 2004-07-22 2009-05-06 Sequenom Inc Verfahren zur identifizierung des risikos von typ-ii-diabetes und zur behandlung davon
EP1792263A2 (de) * 2004-09-02 2007-06-06 Vialogy Corporation Erkennung von interessensereignissen unter verwendung von quantenresonanzinterferometrie
EP1647600A3 (de) 2004-09-17 2006-06-28 Affymetrix, Inc. (A US Entity) Verfahren zur Kennzeichnung von biologischen Proben durch Hinzufügung von Nukleinsäre "bar-code" Markierungen
EP1645640B1 (de) 2004-10-05 2013-08-21 Affymetrix, Inc. Verfahren zur Detektion von chromosomalen Translokationen
CA2524964A1 (en) 2004-10-29 2006-04-29 Affymetrix, Inc. Automated method of manufacturing polymer arrays
US7682782B2 (en) 2004-10-29 2010-03-23 Affymetrix, Inc. System, method, and product for multiple wavelength detection using single source excitation
EP2360278A1 (de) 2005-04-14 2011-08-24 Trustees Of Boston University Diagnose für Lungenerkrankungen mittels Klassenvorhersage
US20070173139A1 (en) * 2006-01-24 2007-07-26 Charles Gierke Fishing assembly
US20090061454A1 (en) 2006-03-09 2009-03-05 Brody Jerome S Diagnostic and prognostic methods for lung disorders using gene expression profiles from nose epithelial cells
WO2007140417A2 (en) 2006-05-31 2007-12-06 Sequenom, Inc. Methods and compositions for the extraction and amplification of nucleic acid from a sample
WO2007140599A1 (en) 2006-06-05 2007-12-13 Cancer Care Ontario Assessment of risk for colorectal cancer
JP5244103B2 (ja) 2006-08-09 2013-07-24 ホームステッド クリニカル コーポレイション 器官特異的蛋白質およびその使用方法
US9845494B2 (en) 2006-10-18 2017-12-19 Affymetrix, Inc. Enzymatic methods for genotyping on arrays
EP2092074A4 (de) 2006-11-02 2010-06-09 Univ Yale Beurteilung der befruchtungsfähigkeit von eizellen
US8293684B2 (en) * 2006-11-29 2012-10-23 Exiqon Locked nucleic acid reagents for labelling nucleic acids
US7902345B2 (en) 2006-12-05 2011-03-08 Sequenom, Inc. Detection and quantification of biomolecules using mass spectrometry
JP2010517539A (ja) 2007-02-05 2010-05-27 アプライド バイオシステムズ, エルエルシー ショートリード配列決定を用いたインデル識別のためのシステムおよび方法
EP2118298B1 (de) 2007-02-08 2013-01-09 Sequenom, Inc. Tests auf nukleinsäurebasis für rhd-typisierung
CA2679954A1 (en) 2007-03-05 2008-09-12 Cancer Care Ontario Assessment of risk for colorectal cancer
CA2680588A1 (en) 2007-03-26 2008-10-02 Sequenom, Inc. Restriction endonuclease enhanced polymorphic sequence detection
US8200440B2 (en) 2007-05-18 2012-06-12 Affymetrix, Inc. System, method, and computer software product for genotype determination using probe array data
WO2009032781A2 (en) 2007-08-29 2009-03-12 Sequenom, Inc. Methods and compositions for universal size-specific polymerase chain reaction
KR101030476B1 (ko) * 2008-03-11 2011-04-25 국립암센터 Snp 어레이를 이용한 염색체, 유전자, 또는 특정 뉴클레오티드 서열의 카피 수 측정방법
WO2009114543A2 (en) 2008-03-11 2009-09-17 Sequenom, Inc. Nucleic acid-based tests for prenatal gender determination
AU2009228312B2 (en) 2008-03-26 2015-05-21 Sequenom, Inc. Restriction endonuclease enhanced polymorphic sequence detection
US8962247B2 (en) * 2008-09-16 2015-02-24 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non invasive prenatal diagnoses
US8476013B2 (en) * 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
WO2010054189A1 (en) 2008-11-06 2010-05-14 University Of Miami Role of soluble upar in the pathogenesis of proteinuric kidney disease
CA2749103A1 (en) 2009-01-07 2010-07-15 Steve Stone Cancer biomarkers
CN104878086A (zh) 2009-02-11 2015-09-02 卡里斯Mpi公司 肿瘤的分子谱分析
US20100279295A1 (en) * 2009-03-18 2010-11-04 Sequenom, Inc. Use of thermostable endonucleases for generating reporter molecules
EP2414545B1 (de) 2009-04-03 2017-01-11 Sequenom, Inc. Zusammensetzungen und verfahren für die herstellung von nukleinsäuren
EP2494077A4 (de) 2009-10-27 2013-08-21 Caris Mpi Inc Molekulare profilierung für personalisierte medizin
US20110201008A1 (en) * 2009-12-01 2011-08-18 University Of Miami Assays, methods and kits for measuring response to therapy and predicting clinical outcome in patients with b-cell lymphoma
US8501122B2 (en) 2009-12-08 2013-08-06 Affymetrix, Inc. Manufacturing and processing polymer arrays
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
EP2516680B1 (de) 2009-12-22 2016-04-06 Sequenom, Inc. Verfahren und kits zur identifizierung von aneuploidie
US9798855B2 (en) 2010-01-07 2017-10-24 Affymetrix, Inc. Differential filtering of genetic data
US9216189B2 (en) 2010-01-25 2015-12-22 Icahn School Of Medicine At Mount Sinai Antibodies which bind type I cannabinoid receptor/angiotensis II receptor heteromers
CA2797093C (en) 2010-04-26 2019-10-29 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of cysteinyl-trna synthetase
AU2011248614B2 (en) 2010-04-27 2017-02-16 Pangu Biopharma Limited Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of isoleucyl tRNA synthetases
US8993723B2 (en) 2010-04-28 2015-03-31 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of alanyl-tRNA synthetases
EP2563912B1 (de) 2010-04-29 2018-09-05 aTyr Pharma, Inc. Innovative entdeckung therapeutischer, diagnostischer und antikörperhaltiger zusammensetzungen im zusammenhang mit proteinfragmenten von asparaginyl-trna-synthetasen
EP2563383B1 (de) 2010-04-29 2017-03-01 Atyr Pharma, Inc. Innovative entdeckung therapeutischer, diagnostischer und antikörperhaltiger zusammensetzungen im zusammenhang mit proteinfragmenten von valyl-trna-synthetasen
WO2011137368A2 (en) 2010-04-30 2011-11-03 Life Technologies Corporation Systems and methods for analyzing nucleic acid sequences
AU2011248227B2 (en) 2010-05-03 2016-12-01 Pangu Biopharma Limited Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of phenylalanyl-alpha-tRNA synthetases
AU2011248355B2 (en) 2010-05-03 2017-01-19 Pangu Biopharma Limited Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of Arginyl-tRNA synthetases
CA2797978C (en) 2010-05-03 2019-12-03 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of methionyl-trna synthetases
CA2798139C (en) 2010-05-04 2019-09-24 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of p38 multi-trna synthetase complex
WO2011143482A2 (en) 2010-05-14 2011-11-17 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of phenylalanyl-beta-trna synthetases
JP6046607B2 (ja) 2010-05-27 2016-12-21 エータイアー ファーマ, インコーポレイテッド グルタミニルtRNA合成酵素のタンパク質フラグメントに関連した治療用、診断用および抗体組成物の革新的発見
CN103118694B (zh) 2010-06-01 2016-08-03 Atyr医药公司 与赖氨酰-tRNA合成酶的蛋白片段相关的治疗、诊断和抗体组合物的发现
EP3812469A1 (de) 2010-07-07 2021-04-28 Myriad Genetics, Inc. Gensignaturen für krebsprognosen
CA2804416C (en) 2010-07-12 2020-04-28 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of glycyl-trna synthetases
US9029506B2 (en) 2010-08-25 2015-05-12 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of tyrosyl-tRNA synthetases
CA2834218C (en) 2011-04-29 2021-02-16 Sequenom, Inc. Quantification of a minority nucleic acid species using inhibitory oligonucleotides
CA2862499C (en) 2012-01-24 2020-10-27 Cd Diagnostics, Inc. System for detecting infection in synovial fluid
JP6170077B2 (ja) 2012-02-16 2017-07-26 エータイアー ファーマ, インコーポレイテッド 自己免疫および炎症疾患を処置するためのヒスチジルtRNA合成酵素
EP2820158B1 (de) 2012-02-27 2018-01-10 Cellular Research, Inc. Zusammensetzungen und kits zur molekularen zählung
EP2820174B1 (de) 2012-02-27 2019-12-25 The University of North Carolina at Chapel Hill Verfahren und verwendung für molekulare tags
EP3757210B1 (de) 2012-03-02 2022-08-24 Sequenom, Inc. Verfahren zur anreicherung von krebsnukleinsäure aus einer biologischen probe
US9920361B2 (en) 2012-05-21 2018-03-20 Sequenom, Inc. Methods and compositions for analyzing nucleic acid
US10504613B2 (en) 2012-12-20 2019-12-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
JP2015521862A (ja) 2012-07-13 2015-08-03 セクエノム, インコーポレイテッド 非侵襲性の出生前診断に有用な母体サンプル由来の胎児核酸のメチル化に基づく富化のためのプロセスおよび組成物
ES2938766T3 (es) 2012-11-16 2023-04-14 Myriad Genetics Inc Firmas génicas para el pronóstico de cáncer
MX367366B (es) 2012-11-27 2019-08-16 Univ Pontificia Catolica Chile Composiciones y metodos para diagnosticar tumores de tiroides.
US9896728B2 (en) 2013-01-29 2018-02-20 Arcticrx Ltd. Method for determining a therapeutic approach for the treatment of age-related macular degeneration (AMD)
US11060145B2 (en) 2013-03-13 2021-07-13 Sequenom, Inc. Methods and compositions for identifying presence or absence of hypermethylation or hypomethylation locus
EP3798316A3 (de) 2013-03-15 2021-06-09 Myriad Genetics, Inc. Gene und gensignaturen zur diagnose und behandlung von melanomen
US10535420B2 (en) 2013-03-15 2020-01-14 Affymetrix, Inc. Systems and methods for probe design to detect the presence of simple and complex indels
US20140274749A1 (en) 2013-03-15 2014-09-18 Affymetrix, Inc. Systems and Methods for SNP Characterization and Identifying off Target Variants
BR112016002845A2 (pt) 2013-08-12 2017-09-12 Genentech Inc composições e métodos para tratar condições associadas ao complemento
SG11201606490YA (en) 2014-02-08 2016-09-29 Genentech Inc Methods of treating alzheimer's disease
US11365447B2 (en) 2014-03-13 2022-06-21 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
AU2015249739B2 (en) 2014-04-22 2021-08-05 Envirologix, Inc. Compositions and methods for enhancing and/or predicting DNA amplification
CA2947624A1 (en) 2014-05-13 2015-11-19 Myriad Genetics, Inc. Gene signatures for cancer prognosis
EP3164508B1 (de) 2014-07-02 2023-06-07 Myriad myPath, LLC Gene und gensignaturen zur diagnose und behandlung von melanomen
JP2017536813A (ja) 2014-10-20 2017-12-14 エンバイロロジックス インコーポレイテッド Rnaウイルスを検出するための組成物及び方法
ES2993457T3 (en) 2015-01-30 2024-12-30 Envirologix Inc A substrate for a nicking and extension reaction comprising a nucleic acid duplex
CA2994416A1 (en) 2015-08-04 2017-02-09 Cd Diagnostics, Inc. Methods for detecting adverse local tissue reaction (altr) necrosis
KR20180071299A (ko) 2015-10-18 2018-06-27 아피메트릭스, 인코포레이티드 단일 뉴클레오타이드 다형 및 인델의 다대립유전자 유전자형분석
CA3005119A1 (en) 2015-11-19 2017-05-26 Myriad Genetics, Inc. Signatures for predicting cancer immune therapy response
EP3400312A4 (de) 2016-01-06 2019-08-28 Myriad Genetics, Inc. Gene und gensignaturen zur diagnose und behandlung von melanomen
WO2017193062A1 (en) 2016-05-06 2017-11-09 Myriad Genetics, Inc. Gene signatures for renal cancer prognosis
CA3066745A1 (en) 2017-06-26 2019-01-03 Ivan LIACHKO A method for the clustering of dna sequences
EP3728321A1 (de) 2017-12-22 2020-10-28 F. Hoffmann-La Roche AG Verwendung von pilra-bindenden mitteln zur behandlung einer erkrankung
US20210269862A1 (en) 2018-06-18 2021-09-02 Igenomix, S.L. Methods for assessing endometrial transformation
CA3115922A1 (en) 2018-10-09 2020-04-16 Genecentric Therapeutics, Inc. Detecting cancer cell of origin
WO2020113237A1 (en) 2018-11-30 2020-06-04 Caris Mpi, Inc. Next-generation molecular profiling
BR112021020779A8 (pt) 2019-04-17 2022-01-25 Igenomix S L Métodos aperfeiçoados para diagnóstico precoce de leiomiomas e leiomiossarcomas uterinos
MX2022006589A (es) 2019-12-02 2023-01-11 Caris Mpi Inc Predictor de respuesta de platino pan-cancer.

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5837832A (en) 1993-06-25 1998-11-17 Affymetrix, Inc. Arrays of nucleic acid probes on biological chips
EP0730663B1 (de) * 1993-10-26 2003-09-24 Affymetrix, Inc. Felder von nukleinsaeuresonden auf biologischen chips
US5830645A (en) * 1994-12-09 1998-11-03 The Regents Of The University Of California Comparative fluorescence hybridization to nucleic acid arrays
GB9521089D0 (en) * 1995-10-14 1995-12-20 Aromascan Plc Cluster analysis
JP2002515738A (ja) 1996-01-23 2002-05-28 アフィメトリックス,インコーポレイティド 核酸分析法
WO1997029212A1 (en) * 1996-02-08 1997-08-14 Affymetrix, Inc. Chip-based speciation and phenotypic characterization of microorganisms
CA2299625A1 (en) * 1997-08-15 1999-02-25 Affymetrix, Inc. Polymorphism detection utilizing clustering analysis

Also Published As

Publication number Publication date
US20040024537A1 (en) 2004-02-05
AU9198298A (en) 1999-03-08
CA2299625A1 (en) 1999-02-25
US6584410B2 (en) 2003-06-24
EP1019536A1 (de) 2000-07-19
US6223127B1 (en) 2001-04-24
US20010041965A1 (en) 2001-11-15
EP1019536B1 (de) 2004-10-20
WO1999009218A1 (en) 1999-02-25
EP1019536A4 (de) 2002-08-14
ATE280246T1 (de) 2004-11-15
JP2001514907A (ja) 2001-09-18
DE69827154D1 (de) 2004-11-25

Similar Documents

Publication Publication Date Title
DE69827154T2 (de) Polymorphismuserkennung mit hilfe cluster-analyse
DE69627122T2 (de) Nachweis von Polymorphismus
DE69827913T2 (de) Systeme und Verfahren zur Ausrichtung eines abgetasteten Bildes
DE69823206T2 (de) Verfahren zur herstellung einer bio-informatik-datenbank
DE69737215T2 (de) Auf die ähnlichkeit der ausrichtung basiertes zählverfahren zum quantifizieren der unterschiede zwischen verwandten biopolymersequenzen
Williams et al. Power of variance component linkage analysis to detect quantitative trait loci
DE69920032T2 (de) Methoden, software und apparate zur identifizierung genomischer bereiche, die ein gen umfassen, das mit einem nachweisbaren merkmal assoziiert ist
DE69733958T2 (de) Verfahren zur positionierung von klonen mittels molekularen kaemmens
DE69503126T2 (de) Repetitive oligonukleotide matrix
DE68909514T2 (de) Verfahren zur gleichzeitigen Bestimmung von DNS-Sequenzvariationen von zahlreichen Stellen und ein Satz dafür.
DE69904165T2 (de) Verfahren zur bewertung chemischer und biologischer tests
EP0438512B1 (de) Verfahren zur analyse von längenpolymorphismen in dna-bereichen
US8204695B2 (en) Techniques for identifying, confirming, mapping, and categorizing polymers
US20060161355A1 (en) Computer-aided probability base calling for arrays of nucleic acid probes on chips
Amaratunga et al. Exploration and analysis of DNA microarray and other high-dimensional data
DE60038109T2 (de) Verfahren zur Analyse von AFLP Reaktionsmischungen unter Verwendung von Primer Verlängerungstechniken
JP2002517207A (ja) ポリマーの試料混合物中におけるモノマーの識別
DE102022119636A1 (de) System und Verfahren zum Vorhersagen eines durch genetische Varianten verursachten Funktionsverlusts
DE60023496T2 (de) Mathematische analyse für die schätzung von veränderungen des niveaus der gen-expression
DE69432316T2 (de) Automatische erbgut bestimmung
DE69829493T2 (de) Techniken zur identifizierung, bestätigung, kartierung und kategorisierung von polymeren
DE102005015000A1 (de) Verfahren und System zur Analyse von arraybasierten Komparativhybridisierungsdaten
DE60103682T2 (de) Systeme und Verfahren zur Genexpressionsanalyse
WO2003012135A2 (de) Verfahren zur konfigurierung paralleler nukleinsäureanalyseverfahren zur sequenzmengenklassifikation
DE102004049891B4 (de) Verfahren zum Identifizieren von geeigneten Nukleinsäurenormalisierungssondensequenzen zur Verwendung bei Nukleinsäurearrays

Legal Events

Date Code Title Description
8327 Change in the person/name/address of the patent owner

Owner name: AFFYMETRIX, INC. (N.D.GES.D.STAATES DELAWARE), SAN

8328 Change in the person/name/address of the agent

Representative=s name: HASELTINE LAKE PARTNERS GBR, 81669 MUENCHEN

8364 No opposition during term of opposition