Verfahren zur Kalibrierung und Kontrolle von Methylie- rungsanalyse-Methoden mit Hilfe von nicht-methylierter DNA
Hintergrund der Erfindung
Die vorliegende Erfindung betrifft die Verwendung von DNA, in der 5-Methylc tosin nicht auftritt. Solche nicht- methylierte DNA ist insbesondere als Kontrolle für eine verläßliche und sensitive Analyse von Cytosinmethylierun- gen erforderlich.
5-Methylcytosin ist die häufigste kovalent modifizierte Base in der DNA eukaryotischer Zellen. Sie spielt eine wichtige biologische Rolle, u.a. bei der Transkriptions- regulation, beim genetischen I printing und in der Tumorgenese (zur Übersicht: Millar et al . : Five not four: Hi- story and significance of the fifth base. In: The Epige- nome, S. Beck and A. Olek (eds.), Wiley-VCH Verlag Weinheim 2003, S. 3-20). Die Identifizierung von 5- Methylcytosin als Bestandteil genetischer Information ist daher von erheblichen Interesse. Ein Nachweis der Methy- lierung ist allerdings schwierig, da Cytosin und 5- Methylcytosin das gleiche Basenpaarungsverhalten aufweisen. Viele der herkömmlichen, auf Hybridisierung beruhenden Nachweisverfahren vermögen daher nicht zwischen Cytosin und Methylcytosin zu unterscheiden. Zudem geht die MethylierungsInformation bei einer PCR-Aplifikation vollständig verloren.
Die herkömmlichen Methoden zur Methylierungsanalyse arbeiten im wesentlichen nach zwei unterschiedlichen Prin-
zipien. Zum einen werden methylierungsspezifische Restriktionsenzyme benutzt, zum anderen erfolgt eine selektive chemische Umwandlung von nicht-methylierten Cytosi- nen in Uracil (sog. : Bisulfit-Behandlung, siehe etwa: DE 101 54 317 AI; DE 100 29 915 AI) . Die enzymatisch oder chemisch vorbehandelte DNA wird dann meist amplifiziert und kann auf unterschiedliche Weise analysiert werden (zur Übersicht: WO 02/072880 S. 1 ff). Von großem Interesse sind dabei Verfahren, die in der Lage sind, Methy- lierung sensitiv und quantitativ zu detektieren. Dies gilt aufgrund der wichtigen Rolle der Cytosin- Methylierung in der Krebsentstehung insbesondere in Hinblick auf diagnostische Anwendungen. Die herkömmlichen Verfahren gewährleisten eine sensitive und quantitative Methylierungsanalyse bisher nur beschränkt.
Zur sensitiven Analyse wird die chemisch vorbehandelte DNA üblicherweise mittels eines PCR-Verfahrens amplifiziert. Über die Verwendung methylierungsspezifischer Pri- mer oder Blocker wird dann eine selektive Aplifikation nur der methylierten (bzw. bei umgekehrten Ansatz: unme- thylierten) DNA gewährleistet. Der Einsatz methylierungsspezifischer Primer ist als sog. „methylierungsspezifische PCR" bekannt („MSP"; Herman et al . : Methyla- tion-specific PCR: a novel PCR assay for methylation Status of CpG islands. Proc Natl Acad Sei U S A. 1996 Sep 3; 93 (18) :9821-6) . Hiermit gelingt vor allem der qualitative Nachweis von methylierter DNA geringer Konzentration. Ein vergleichbar sensitives Verfahren ist die soge- nannte „HeavyMethyl"-Methode. Dabei wird eine spezifische Amplifizierung nur der ursprünglich methylierten (bzw. unmethylierten) DNA durch Einsatz von nicht-
methylierungsspezifischen Blocker-Oligomeren erreicht (also Blocker-Oligomere, die spezifisch an umgewandelte ehemals unmethylierte Nukleinsäuren hybridisieren; zur
Übersicht: WO 02/072880; Cottrell et al . : Ä real-time PCR assay for DNA-methylation using methylation-specific blockers. Nucl . Acids . Res . 2004 32: elO) . Sowohl MSP als auch HeavyMethyl sind als quantifizierbare „Real-Time-
Varianten" anwendbar. Diese ermöglichen es, den Methylie- rungsstatus von Positionen direkt im Verlauf der PCR nachzuweisen, ohne dass eine nachfolgende Analyse der
Produkte erforderlich wäre („MethyLight" - WO00/70090; US
6,331,393) .
Eine verläßliche Quantifizierung des MethylierungsStatus über einen linearen Bereich ist mit den oben beschriebenen Verfahren bisher jedoch nur begrenzt möglich. Hierfür ist erforderlich, dass die Assays sowohl mit vollmethylierter wie auch mit nicht- ethylierter DNA kalibriert werden (vgl . : Trinh et al . : DNA methylation analysis by MethyLight technology. Methods . 2001 Dec; 25(4): 456-62). Die Herstellung vollmethylierter DNA ist relativ einfach über die Verwendung der Sssl-Methylase möglich. Dieses Enzym überführt im Sequenzkontext 5'-CG-3' alle nicht-me- thylierten Cytosine in 5-Methylcytosin. Problematisch ist allerdings die Herstellung von vollständig nicht- methylierter DNA. Denn ein der Sssl-Methylase entsprechendes Enzym, das quantitativ alle Methylgruppen entfernt, steht nicht zur Verfügung. Bisher wird zur Kalibrierung Sperma-DNA verwandt, die über einen geringen Me- thylierungsgrad verfügt (vgl.: Trinh et al . 2001, a.a.O.). Jedoch ist die Sperma-DNA teilweise methyliert und eignet sich daher als verläßlicher Standard nur be-
dingt. Auch künstlich hergestellte, kurze unmethylierte Sequenzen wie PCR-Amplifikate sind nur begrenzt einsetzbar, etwa für die Analyse einzelner, definierter Positionen. Für Multiplex-Reaktionen können diese Standards nicht verwendet werden, da die Komplexität der Reaktion dann zu hoch wäre. Zudem erfordert die Entwicklung eines jeden neuen Nachweis-Assays die Herstellung eines neuen definierten Standards. Dagegen würde ein unmethylierter Standard, der die gesamte genomische DNA oder einen re- präsentativen Teil hiervon abdeckt, eine zuverlässig quantifizierbare Methylierungsanalyse erlauben. Zudem wäre eine standardisierte und damit einfache, kostengünstige und schnelle Entwicklung neuer Nachweis ssays möglich. Aufgrund der besonderen biologischen und medizinischen Bedeutung der Cytosin-Methylierung und aufgrund der oben erwähnten Nachteile der zur Zeit verwendeten Standards besteht ein großes technisches Bedürfnis an Methoden, die genomische DNA in vollständig nicht-methylierter Form zur Verfügung stellen. Im folgenden ist ein solches - überra- sehend einfaches - Verfahren beschrieben.
Erfindungsgemäß werden zur Herstellung nicht-methylierter DNA sogenannte genomweite Amplifikationsverfahren verwendet (WGA - whole geno e amplification, zur Übersicht: Ha- wkins et al.: Whole genome amplification--applications and advances. Curr Opin Biotechnol. 2002 Feb; 13(1): 65- 7) . In diesen Verfahren wird ein großer Teil der genomischen DNA mittels einer DNA-Poly erase und „Random"- oder degenerierter Primer vervielfältigt. Unter „Random" Pri- ern sind solche Primer zu verstehen, die nicht spezifisch an bestimmte Nukleinsäuren, sondern an eine Vielzahl von Nukleinsäuren binden. Dazu gehören Primer die
entweder sehr kurz sind (zwischen 5 und 10 bp) oder Primer die als „degenerierte Primer" bezeichnet werden. Unter degenerierten Primern sind solche Primer zu verstehen, die nicht spezifisch an bestimmte Nukleinsäuren bin- den, weil sie entweder Universalbasen enthalten, die an mehrere verschiedene Nukleotide binden oder aber es wird eine Mischung aus Primern verwendet, die sich jeweils in den „degenerierten" Positionen unterscheiden. Unter Universalbasen versteht man Basen, die an mehrere verschie- dene Nukleotide binden (siehe z.B. Katalog Pro ega : Py- rimidin- oder Purin- spezifische Universalbasen) . Beides wird im folgenden als „degenerierter Primer" verstanden. Dabei werden in den Amplifikationen nur nicht-methylierte Cytosintriphosphate angeboten, so dass die Amplifikate vollständig unmethyliert synthetisiert werden. Nach mehreren Amplifikationsrunden tritt die Menge der partiell methylierten Matrizen-DNA im Vergleich zu den neu hergestellten, nicht-methylierten Nukleinsäuren vollständig in den Hintergrund.
Bisher sind unterschiedliche WGA- erfahren beschrieben. Bei der sog. Primer-Extensions-Präamplifikation (PEP: primer extension preamplification) wird die Amplifikation mittels einer Taq-Polymerase und einer zufälligen Mi- schung von Oligonukleotidprimern mit einer Länge von etwa 15 Nukleotiden durchgeführt (Zhang et al . : Whole genome amplification from a Single cell: implications for gene- tic analysis. Proc Natl Acad Sei U S A. 1992 Jul 1; 89(13): 5847-51). Bei der DOP-PCR (degenerate oligonu- cleotide pri ed polymerase chain reaction) wird dagegen nur ein degenerierter Primer eingesetzt (vgl.: Telenius et al.: Degenerate oligonucleotide-primed PCR: general
amplification of target DNA by a Single degenerate primer. Genomics . 1992 Jul; 13(3): 718-25). Ein weiteres WGA-Verfahren ist die sog. Linker-Adaptor-PCR. Dabei wird die DNA zunächst mittels eines Restriktionsenzyms ver- daut. Anschließend werden an die Restriktionsfragemente Linker ligiert. In der folgenden Amplifikation werden Primer eingesetzt, die spezifisch an die Linker binden (zur Übersicht: Cheung and Nelson: Whole genome amplification using a degenerate oligonucleotide primer allows hundreds of genotypes to be performed on less than one nanogram of genomic DNA. Proc Natl Acad Sei U S A. 1996 Dec 10; 93(25): 14676-9 m.w.N. ) . Die oben beschriebenen, auf PCR-basierenden WGA-Verfahren haben allerdings mehrere Nachteile. So kann es etwa zur Generierung unspezifi- scher Amplifikationsartefakte kommen. Zudem erfolgt oft nur eine unvollständige Abdeckung aller Genombereiche. Weiterhin entstehen teilweise nur kurze DNA-Fragmente mit einer Länge von weniger als 1 kB. (vgl.: Dean et al . : Comprehensive human genome amplification using multiple displacement amplification. Proc Natl Acad Sei U S A. 2002 Apr 16; 99(8): 5261-6 m.w.N.). Das zur Zeit schlagkräftigste Verfahren zur genomweiten Amplifikation ist daher die isotherme "Multiple Displacement Amplification" (MDA, vgl.: Dean et al . 2002 a.a.O.; US Patent 6,124,120). Hierbei wird die genomische DNA mit „Random"- Primern und eine DNA-Poly erase umgesetzt. Es werden dabei Poly erasen eingesetzt, die in der Lage sind, den Nicht-Templat-Strang des DNA-Doppelstrangs während der Amplifikation zu verdrängen (etwa eine φ29 Polymerase) . Die verdrängten Stränge dienen wiederum als Matrize für die Extension weiterer Primer. Mit diesem Verfahren ist es möglich, aus nur 1-10 Kopien menschlicher genomischer
DNA etwa 20-30 μg DNA herzustellen. Dies entspricht einer mehr als 5000-fachen Amplifikation. Die durchschnittliche Produktlänge beträgt dabei mehr als 10 kB, wobei die Amplifikation relativ gleichmäßig über das gesamte Genom erfolgt. Die Reaktion kann direkt aus biologischen Proben erfolgen, etwa aus Blut oder Zellkulturen. Kommerzielle Kits zur MDA sind zur Zeit über zwei Anbieter verfügbar („GenomiPhi" von Amersham Biosciences, www4.amershambiosciences.com; „Repli-g" von Molecular Staging, www.molecularstaging.com) . Auch bereits amplifi- zierte DNA ist über diese Anbieter erhältlich. Die mittels MDA hergestellte DNA wird in vielfältigen Anwendungen eingesetzt, etwa im Genotyping von Einzelnukleotidpo- lymorphismen (SNP) , im „Chromosomen-Painting" , in der Re- striktionsfragmentlängenpolymorphismus-Analyse, in der Subklonierung und in der DNA-Sequenzierung. Die MDA ist so insbesondere für genetische, forensische und diagnostische Untersuchungen verwendbar (vgl.: Dean et al . 2002, a.a.O. ) .
Die Verwendung von durch WGA-Methoden hergestellten DNA als Standard in Verfahren zum Nachweis von 5- Methylcytosin ist bisher noch nicht bekannt. Die im folgenden genauer beschriebenen Anwendungen eröffnen der Me- thylierungsanalyse daher erstmals Zugang zu genomischer, nicht-methylierter DNA. Aufgrund der besonderen Bedeutung der Cytosinmethylierung und aufgrund der beschriebenen Nachteile des Standes der Technik stellt das Eröffnen dieser vorteilhaften, neuen Technologie einen wichtigen technischen Fortschritt dar.
Ein weiterer Aspekt der Erfindung besteht in der Verwendung von KaiibrierungsStandards, die unmethylierte DNA enthalten, für Verfahren zur Methylierungsanalyse, die auf Verwendung von Mikroarrays basieren, welche dadurch gekennzeichnet sind, dass an ihnen Detektionsoligomere immobilisiert sind. Erfindungsgemäß ist demnach ein auf Mikroarraybenutzung basierendes Verfahren zur Bestimmung des Methylierungsgrades von DNA unter Verwendung von Kalibrierungsstandards, die einerseits unmethylierte DNA und andererseits spezifisch aufmethylierte DNA enthalten. Wobei „spezifisch aufmethylierte" DNA solche DNA bezeichnet, die zu einem bekannten Grad methyliert ist, also eine bekannte Methylierungsrate aufweist. Dieses Verfahren ist dadurch gekennzeichnet, dass anhand der Hybridisie- rungswerte, die in einem mehrstufigen Prozeß, um ihr Rauschen korrigiert, normalisiert und varianzstabilisert werden, anhand einer berechneten Kaiibrierungskurve absolute Werte über die Methylierungsrate erhalten werden können. Als Quelle solcher DNA kann z.B. Spermien-DNA genommen werden. Da diese aber nicht vollständig unmethyliert ist, ist es bevorzugt hierfür die bereits beschriebene genomische nicht-methylierte DNA zu verwenden. Besonders bevorzugt ist hierbei die Verwendung der nach den beschriebe- nen Verfahren hergestellten genomischen nicht- methylierten DNA als KaiibrierungsStandard Für diesen erfinderischen Aspekt ist es jedoch auch denkbar für die Kalibrierung nicht-methylierte DNA aus anderen Quellen zu verwenden, solange sie nachgewiesenermaßen unmethyliert ist(z.B Spermien DNA).
Methoden zur Analyse von Mikroarray-Experimenten, in denen Oligonukleotide zur Detektion von Nukleinsäuren, wie beispielsweise mRNA oder ESTs, oder eben Amplifikate auf einer Oberfläche immobilisiert werden, sind beschrieben. Ein Problem der Analyse von Genexpressions- Mikroarraydaten besteht darin, daß die Variation der Expression unter konstanten Bedingungen von Gen zu Gen nicht konstant ist. (David M. Rocke (2003) Heterogeneity of Variance in Gene Expression Microarray Data. Dieser Artikel ist als Vorabdruck (preprint) erhältlich auf http: //www. cipic.ucdavis.edu/~dmrocke/preprints .html datiert: March 15, 2003) .
Ein weiteres Problem ergibt sich jedoch aus der Unver- gleichbarkeit von Expressions-Mikroarraydaten aus verschiedenen Mikroarray-Experimenten, weil sich diese nur sehr schwer kalibrieren lassen. Der Ansatz sogenannte „housekeeping" genes als Positivkontrollen zu verwenden, erlaubt zwar eine Aussage darüber, ob eine Hybridisierung tatsächlich erfolgt ist (getestet wird somit nur, ob die Hybridisierungsbedingungen ausreichend waren, um eine Hybridisierung des Analyts zu erlauben) , aber eine absolute Quantifizierbarkeit der Expressionsdaten ist damit nicht möglich. Das liegt zum einen daran, daß nicht klar defi- niert ist, welches Gen unter welchen Bedingungen ein „housekeeping-Gen" darstellt und zum anderen daran, daß es nicht möglich ist, eine bestimmte Menge bekannter DNA zuzugeben, und damit einen absoluten Wert (zum Kalibrieren) zu generieren, weil man dazu im Voraus wissen müßte, wieviele der in der zu untersuchenden Probe vorhandenen Nukleinsäuren tatsächlich an Detektionsoligomer A binden würde, die entsprechende Menge bekannter Zusatz-
DNA entspräche dann einer Signalintensität von 100% für genau jenes Detektionsoligomers . In anderen Worten, es ist nicht klar, wieviel Test-DNA bekannter Sequenz (Standard) man einem Experiment zugeben müßte, um einen zum Kalibrieren nötigen Wert (eben entsprechend einem bestimmten definierten Anteil) zu generieren. Daher sind ExpressionsStudien immer auf die Angabe relativer Aussagen limitiert. Es läßt sich auch nicht bestimmen, wie groß der Anteil der in der Probe expri ierten mRNA ist, die mit einem bestimmten Oligomer, z.B. Oligo X, hybridisiert, weil die Gesamtheit der Signale nicht der Gesamtheit der enthaltenen mRNAs entsprechen muß.
Bei der hier erwähnten Mikroarray-Methylierungsanalyse (siehe auch Adorjan et al . : Tumour class prediction and discovery by microarray-based DNA methylation analysis. Nucleic Acids Res . 2002 Mar 1; 30(5): e21) sind Oligomere zur Detektion von methylierten (CG-Oligos) und /oder un- methylierten (TG-Oligos) CpG Positionen immobilisiert. Oft werden dedizierte Paare von CG- und TG-Oligos benutzt und ins Verhältnis gesetzt um einen Methylierungsindex zu berechnen. Adorjan et al benutzen log (CG/TG) , Gitan et al.(Gitan et al. (2002) Mehylation specific oligonucleo- tide microarray: a new potential for highthroughput e- thylation analysis. Genome Res., 12, 158-164) benutzen log(CG) / (log(CG) +log(TG) . Somit erhält man Abschätzungen darüber welche CpG Position welcher Probe mehr oder weniger stark methyliert vorliegt. Um statistisch signifikante Marker zu finden reicht diese Methode aus . Eigentlich will man aber echte Methylierungsraten bestimmen, also absolute Werte ermitteln. Dies ist insbesondere wichtig für die anschließende Wahl der Detektionsmethode, für das
sogenannte Assay-Format, insbesondere zur Analyse von Proben, die nur wenig DNA beinhalten. Bei den dann zur Anwendung kommenden sogenannten „sensitive detection" Verfahren ist es von Bedeutung ob ein niedriger Wert ei- ner 0-5% Methylierungsrate oder einer 15%-20% Methylierungsrate entspricht .
Bei den genannten Mikroarrays, weiß man, welche Nukleinsäuren (Amplifikate) in der zu hybridisierenden Probe enthalten sind (nur nicht, ob diese ein C oder ein G in der Abfrageposition tragen) , und es gibt nur zwei Zustände in denen sie sich unterscheiden können, so daß die Gesamtheit der Signale eines CG- und eines TG- Detektionsoligos konstant ist. Das in einem Erfindungsaspekt hierin vorgestellte Verfah- ren zur Kalibrierung von diesen Mikroarray-Chips hat den Vorteil, erstmalig Zugang zu absoluten Angaben über das Ausmaß der Methylierung bzw. den Grad der Methylierung (level of methylation) zu untersuchender Amplifikate machen zu können.
Sie ist insbesondere geeignet zur Methylierungsanalyse, die dadurch gekennzeichnet ist, daß Mikroarrays verwendet werden, an die pro Abfrageposition im zu detektierenden Amplifikat mindestens zwei Oligonukleotide immobilisiert sind. Außerdem ist sie dadurch gekennzeichnet, daß die gegen die Oligonukleotide zu hybridisierenden Nukleinsäuren (Amplifikate) in ihrer Sequenz an sich bekannt sind, mit Ausnahme von 1 bis drei Abfragepositionen, die aber ihrerseits nur in zwei verschiedenen Varianten auftauchen können. Diese zwei Detektionsoligos unterscheiden sich dadurch, daß sie in der Abfrageposition entweder ein Cytosin oder ein Thymin aufweisen, analog, bei der Analy-
se des Gegenstranges, entweder ein Guanin oder ein Adenin aufweisen.
Es ist bekannt, daß Hybridisierungsdaten von Mikroarray- Hybridisierungen zunächst hintergrund-korrigiert und dann normalisiert werden, ebenso ist es bekannt, daß diese Daten umgewandelt werden, was als Datentransformation bezeichnet wird, um damit eine Varianzstabilisierung zu erreichen. Varianzstabilisierte Daten sind damit üblichen statistischen Auswertungen zugänglich. Der aktuelle Stand der Forschung auf diesem Gebiet läßt sich zum Beispiel den verschiedenen Arbeiten von Durbin und Rocke oder den anderen hierin aufgeführten Artikeln entnehmen: - Rocke DM und Lorenzato S (1995) , A two-component model for measurement error in analytical chemistry, Technometrics . 37, 176-184; - Durbin BP et al . (2002), A variance stabilizing transformation for gene-expression microarray data. Bioinformatics . 18(1), 105-110; - Geller SC et al . (2003), Transformation and Normali- zation of oligonucleotide microarray data. Bioinforma tics , 19(14) ,1817-1823; - Durbin BP and Rocke DR (2003), Estimation of trans- foramtion parameters for microarray data. Bioinfor- ma tics, 19(11) ,1360-1367 ; - Durbin BP and Rocke MR (2003), Approximate variance- stabilizing transformations for gene-expression microarray data, Bioinformatics, 19(8), 966-972; - Durbin BP and Rocke MR (2004) , Variance-stabilizing transformations for two-color icroarrays, Bioinforma tics, 20(5), 660-667.
Ein weiterer Aspekt der Erfindung ist hingegen der Schritt der Kalibrierung der Mikroarraydaten unter Verwendung unmethylierter und damit auch -nun zugänglich gewordener- zu definierten Anteilen -also spezifisch- auf- methylierter DNA, wie im Folgenden näher beschrieben.
Beschreibung
Erfindungsgemäß wird die durch genomweite Amplifizie- rungsverfahren hergestellte DNA als Standard in der Methylierungsanalyse verwendet. Erfindungsgemäß ist weiterhin ein Verfahren zur Methylierungsanalyse, das dadurch gekennzeichnet ist, dass a) eine genomweite Amplifikation durchgeführt wird, b) die daraus hervorgegangenen Amplifikate in der Methylierungsanalyse als Standard verwendet werden.
Prinzipiell können erfindungsgemäß alle oben beschriebenen WGA-Verfahren eingesetzt werden. Die Reaktionsbedin- gungen der PEP, DOP-PCR und Linker-PCR gehören zum Stand der Technik (s.o.) . Aufgrund der oben beschriebenen Nachteile der auf PCR basierenden WGA-Verfahren wird erfindungsgemäß bevorzugt eine MDA durchgeführt . Auch die Reaktionsbedingungen für ein MDA-Verfahren sind hinreichend bekannt (vgl.: Dean et al 2002, a.a.O.; US-Patente 6,124,120; 6,280,949; 6,642,034; US-Anmeldung 20030143536; Produktinformationen zu den oben erwähnten Genomiphi und Repli-g-Kits) . Auch andere Variationen der WGA, insbesondere des ?MDA-Verfahrens , können erfindungs- gemäß zur Herstellung nicht-methylierter DNA verwendet werden. So ist es etwa möglich, die DNA zunächst zu fragmentieren und an die Fragmente Linker zu ligieren. An-
schließend werden die Fragmente in Concatamere überführt, die dann über eine MDA amplifiziert werden (multiple Strand displacement amplification of concatenated DNA - MDA-CA ; vgl.: US 6,124,120).
Erfindungsgemäß bevorzugt wird jedoch eine herkömmliche MDA benutzt . Vorzugsweise werden zwei Sets von Primern verwendet. Jeweils ein Primerset ist komplementär zu einen Strang der zu amplifizierenden DNA. Bei den Primer- sets kann es sich um Random-Primer oder degenerierte Primer handeln. Einzelheiten zur Anzahl, Länge und zur Struktur der Primer sind vielfach beschrieben (vgl.: US 6,124,120). So ist etwa bekannt, dass Primer verwendet werden können, die am 5 '-Ende nicht komplementär zu der Zielsequenz sind. Hiermit wird die Verdrängung der Primer durch die Polymerase erleichtert. Die 5 ' -Region der Primer kann zudem funktionale Sequenzen, etwa für einen Promotor tragen (vgl.: US 6,124,120). Der optimale Aufbau der Primer hängt von der Art der verwendeten Polymerase ab, insbesondere von ihrer Prozessivität (vgl.: US 6,124,120). Besonders bevorzugt werden Hexamer-Primer benutzt. Verschiedene Polymerasen sind in der ?MDA-Reaktion einsetzbar. Die Enzyme müssen entweder alleine oder in Kombination mit Hilfsfaktoren (etwa Helikasen) in der La- ge sein, während der Replikation den Nicht-Matrizenstrand der zu replizierenden DNA-Doppelhelix zu verdrängen. Dabei werden bevorzugt Polymerasen eingesetzt, die über keine 5 '-3 '-Exonuklease-Aktivität verfügen. Alternativ können allerdings auch Primer eingesetzt werden, die am 5 'Ende blockiert und daher von den Polymerasen nicht degradierbar sind. Als Polymerase wird besonders bevorzugt die φ29-Polymerase verwendet. Diese verfügt über eine
sehr hohe Prozessivität, die es ihr erlaubt, sehr effektiv DNA zu synthetisieren, auch wenn extreme Basenzusammensetzungen, kurze Tandemwiederholungen (short tandem repeats) oder SekundärStrukturen in der DNA auftreten. In dem US-Patent 6,124,120 und in der US-Patenanmeldung 2003/0143536 AI sind weitere einsetzbare Polymerasen aufgeführt, etwa Bst, Bca oder Phage M2-DNA-Polymerase. Die für die Amplifikation erforderlichen Reaktionsbedingungen sind von der Auswahl der Polymerasen und der Primer ab- hängig und ergeben sich ebenfalls aus den oben genannten Referenzen. Es ist u.a. auch bekannt, dass über unterschiedliche Methoden eine Detektion und Quantifizierung der amplifizierten DNA erreicht werden kann, etwa über den Einbau markierter Nukleotide, über Verwendung beson- derer Detektionssonden oder über Festphasendetektoren (Vgl. : 6,124,120) .
In einer bevorzugten Ausführungsform der Erfindung werden die kommerziell erhältlichen Kits zur Synthese der nicht- methylierten DNA verwendet. Besonders bevorzugt werden die Kits „GenomiPhi" (Amersham Biosciences) oder „Repli- g" (Molecular Staging) verwendet. Die Amplifikation erfolgt dabei nach Herstellerangaben. Im wesentlichen wird dabei die zu amplifizierende DNA mit einem Probenpuffer und Random Hexamer Primern versetzt. Die Mischung wird hitzedenaturiert und anschließend gekühlt, so dass es zu einer Bindung der Primer an die DNA kommen kann. Danach werden die verbleibenden Reaktionskomponenten, insbesondere die Desoxynukleosidtriphosphate und die φ29- Polymerase hinzugefügt. Die Reaktionsmischung wird dann für etwa 30 Stunden bei 30°C inkubiert. Als Ausgangsmaterial kann etwa DNA verwandt werden, die über die kommer-
ziell verfügbaren Aufreinigungsmethoden isoliert wurde. Für zelluläre Proben wie Blutproben oder Primärzellen aus klinischen Proben kann auch eine alkalische Lyse mit nachfolgender Neutralisation ausreichend sein (vgl . : Pro- duktinformation von Amersham zum GenomiPhi-DNA- Amplifikationskit) .
In einer besonders bevorzugten Ausführungsform der Erfindung wird als Standard kommerziell erhältliche, über MDA hergestellte DNA verwendet (s.o.). Dies hat den Vorteil, dass die DNA aufgrund der standardisierten Herstellungsprozesse von gleichbleibender Konzentration und Qualität ist.
Die über die oben beschriebenen Verfahren hergestellte oder käuflich erworbene DNA kann in einer Vielzahl von Methylierungsanalyseverfahren als Standard verwendet werden. Hierzu gehören sowohl Verfahren, die auf dem Einsatz von Restriktionsenzymen beruhen, wie auch Verfahren, die auf einer Bisulfitbehandlung der DNA basieren (vgl.: Fra- ga and Esteller: DNA Methylation: A Profile of Methods and Applications. Biotechniques 33:632-649, September 2002) . Bevorzugt wird zunächst eine Bisulfitumwandlung durchgeführt. Die Bisulfitumwandlung ist dem Fachmann in unterschiedlichen Variationen bekannt (siehe etwa: Frommer et al . : A genomic sequencing protocol that yields a positive display of 5-methylcytosine residues in indivi- dual DNA Strands. Proc Natl Acad Sei U S A. 1992 Mar 1;89 (5) .1827-31; Olek, A modified and improved method for bisulphite based cytosine methylation analysis. Nucleic Acids Res. 1996 Dec 15;24 (24) :5064-6. ; DE 100 29 915; DE 100 29 915) . Besonders bevorzugt erfolgt die Bisulfitum-
Wandlung in Gegenwart von denaturierenden Lösemitteln, etwa Dioxan, und eines Radikalfängers (vgl.: DE 100 29 915) . In einer anderen bevorzugten Ausführungsform wird die DNA nicht chemisch, sondern enzymatisch umgewandelt. Dies ist etwa durch Einsatz von Cytidin-Deaminasen denkbar, die' unmethylierte Cytidine schneller umsetzen als methylierte Cytidine. Ein entsprechendes Enzym ist kürzlich identifiziert worden (Bransteitter et al . : Activati- on-induced cytidine deaminase deaminates deoxycytidine on single-stranded DNA but requires the action of RNase. Proc Natl Acad Sei U S A. 2003 Apr 1;100(7) : 4102-7) .
Die umgewandelte DNA kann anhand gängiger molekularbiologischer Verfahren analysiert werden, etwa über Hybidisie- rung oder Sequenzierung. In einer bevorzugten Variante wird die umgewandelte DNA zunächst amplifiziert . Hierzu sind dem Fachmann unterschiedliche Verfahren bekannt, etwa Ligasekettenreaktionen. Vorzugsweise wird die DNA allerdings über eine Polymerasereaktion amplifiziert . Hier- zu sind verschiedene Ausgestaltungen denkbar, etwa die Verwendung isothermer Amplifikationsverfahren. Besonders bevorzugt sind allerdings Polymerasekettenreaktionen (PCR) . In einer ganz besonders bevorzugten Ausführungsform erfolgt die PCR unter Verwendung von Primern, die spezifisch nur an Positionen der umgewandelten Sequenz binden, die vorher entweder methyliert oder (bei umgekehrtem Ansatz) unmethyliert) waren (MSP, s.o.). In einer anderen ganz besonders bevorzugten Ausführungsform wird die umgewandelte DNA mit Hilfe von methylierungs- bzw. un-methylierungs-spezifischen Blockern analysiert („Hea- vyMethyl"-Methode, s.o.). Die Detektion der PCR- Amplifikate kann über herkömmliche Verfahren erfolgen,
etwa über Methoden der Längenmessung wie Gelelektrophorese, Kapillargelelektrophorese und Chromatographie (z.B. HPLC) . Auch Massenspektrometrie und Methoden zur Sequenzierung wie die Sanger-Methode, die Maxam-Gilbert-Methode und Sequencing by Hybridisation (SBH) können verwendet werden. In einer bevorzugten Ausführungsform werden die Amplifikate durch Primer-Extension-Verfahren nachgewiesen oder durch methylierungsspezifische Ligationsverfahren (siehe etwa: Gonzalgo & Jones: Rapid quantitation of me- thylation differences at specific Sites using methylati- on-sensitive Single nucleotide primer extension (Ms- SNuPE) . Nucleic Acids Res. 1997 Jun 15;25 (12) :2529-31; DE 100 10 282; DE 100 10 280). In einer anderen bevorzugten Ausführungsform werden die Amplifikate mittels Hybridi- sierung an Oligomer-Mikroarrays analysiert (vgl.: Adorjan et al . : Tumour class prediction and discovery by microar- ray-based DNA methylation analysis. Nucleic Acids Res. 2002 Mar 1; 30(5): e21) . In einer weiteren besonders bevorzugten Ausführungsform werden die Amplifikate unter Verwendung von PCR-Real-Time-Varianten analysiert (vgl.: Heid et al.: Real time quantitative PCR. Genome Res. 1996 Oct;6(10) :986-94, US Patent No. 6,331,393 „MethyLight" ) . Dabei wird die Amplifikation in Gegenwart eines methylierungsspezifischen, fluoreszenzmarkierten Reporteroligonu- kleotids durchgeführt. Das Reporteroligonukleotid bindet dann bevorzugt an die zu untersuchende DNA und zeigt deren Amplifikation durch Zunahme oder Abnahme der Fluoreszenz an. Dabei ist es besonders vorteilhaft, wenn die Fluoreszenzveränderung direkt zur Analyse benutzt wird und aus dem Fluorenzenzsignal auf einen Methylierungszustand geschlossen wird. Eine besonders bevorzugte Variante ist dabei das „Taq an"-Verfahren. In einer anderen be-
sonders bevorzugten Ausführungsform wird ein zusätzliches fluoreszenzmarkiertes Oligomer verwendet, das in unmittelbarer Nähe zu dem ersten Reporteroligonukleotid hybridisiert und sich diese Hybridisierung mittels Fluores- zenz-Resonanz-Energietransfer nachweisen läßt („Lightcy- cler"-Verfahren) .
Eine bevorzugte Ausführungsform der Erfindung ist es, mehrere Fragmente gleichzeitig mittels einer Multiplex- PCR zu amplifizieren. Bei deren Design muss darauf geachtet werden, daß nicht nur die Primer, sondern auch die weiteren eingesetzten Oligonukleotide nicht zueinander komplementär sein dürfen, so daß eine hochgradige Multi- plexierung in diesem Fall schwieriger ist als üblich. Er- schwerend ist hierbei auch, daß die Bisulfit-bedingte Konversion der Nukleinsäuren deren Komplexität herabsetzt. Jedoch hat man bei der chemisch vorbehandelten DNA den Vorteil, daß aufgrund des unterschiedlichen G- und C- Gehaltes der beiden DNA-Stränge ein Forward-Primer nie- mals auch als Reverse-Primer fungieren kann, was die Mul- tiplexierung wiederum erleichtert und den oben beschriebenen Nachteil im wesentlichen ausgleicht. Die Detektion der Amplifikate ist wiederum über unterschiedliche Verfahren möglich. Denkbar ist dabei etwa die Verwendung von Real-Time-Varianten. Für Amplifikationen von mehr als vier Genen empfiehlt es sich aber, die Amplifikate auf andere Weise zu detektieren. Bevorzugt ist dabei eine Analyse über Mikroarrays (s.o.) .
Eine aktuelle Übersicht über weitere mögliche Methoden zur Methylierungsanalyse findet sich in: Fraga and Estel-

In den unterschiedlichen Methoden zur Methylierungsanalyse kann die MDA-DNA auf unterschiedliche Weise als Standard eingesetzt werden. Unter Standard ist dabei zum ei- nen jegliche Art der Negativkontrolle oder Positivkontrolle im Falle des Nachweises von nicht-methylierter DNA zu verstehen. Dies ist insbesondere bei Technologien der Fall, die kleinste Mengen methylierter DNA in einem großen Hintergrund von nicht-methylierter DNA nachweisen und umgekehrt. Dieser Fall wird auch als sogenannte „sensitive detection" bezeichnet. Hier dient die unmethylierte MDA-ΩNA während der Assay-Entwicklung als Kontrolle der Spezifität des Assays für methylierte DNA und in der Anwendung des Assays als Negativkontrolle. Erfindungsgemäß bevorzugt ist aber auch, ein Gemisch aus nicht- methylierter DNA und methylierter DNA zu verwenden. Besonders bevorzugt ist es, unterschiedliche Gemische (also bestehend aus unterschiedlichen Anteilen) aus nicht- methylierter und methylierter DNA zu verwenden. Hiermit können dann Kalibrierungskurven erstellt werden. Um diese Gemische herzustellen, verwendet man als Basis bevorzugt die durch MDA hergestellte unmethylierte DNA. Diese Gesamtmenge der Kontroll-DNA wird geteilt und ein Teil davon mittels einer Sssl-Methylase methyliert (s.o.). Da- bei wird der andere Teil der nicht-methylierten DNA ebenfalls mit allen Reaktionskomponenten des Methylierungsan- satzes bis auf die Methylase umgesetzt. So ist sichergestellt, dass die DNA-Konzentration in beiden Ansätzen identisch ist, und in beiden Ansätzen die gleichen Reak- tionskomponenten anwesend sind. Anschließend werden nicht-methylierte und methylierte DNA in unterschiedlichen Verhältnissen gemischt, etwa im Verhältnis 4:0 für
0%, 3:1 für 25%, 2:2 für 50%, 1:3 für 75%, 0:4 für 100%. Für die Entwicklung von Assays für die sensitive Detektion kann es bevorzugt sein, Mischungen mit sehr geringen Konzentrationen an methylierter DNA (etwa 1: 2000- 1:10000) herzustellen.
Indem der Quotient der Signale, die für den methylierten Zustand detektiert werden, und der Signale, die für den unmethylierten Zustand detektiert werden, gebildet wird, erhält man die gemessene Methylierungsrate. Trägt man diese gegen die theoretischen Methylierungraten (entsprechend dem Anteil methylierter DNA in den definierten Mischungen) auf und ermittelt die Regression, die durch die Messpunkte geht, erhält man eine Kalibrierungskurve. An- hand dieser Kalibrierungkurve lässt sich über die gemessene Methylierungsrate der Methylierungsgrad der unbekannten Proben bestimmen.
Für Assays die Methylierung über Hybridisierung einer fluoreszierenden Meßsonde quantifizieren (Mikroarrays, MethyLight, andere Hybridisierungsassays in Lösung) ist das gemessene Fluoreszenszsignal über einen weiten Bereich linear von der Konzentration methylierter DNA (wenn die Sonde spezifisch an -vor der Umwandlung- methylierte Nukleinsäuren hybridisiert) abhängig, (JG Wet ur, Hybri- dization and renaturation kinetics of nucleic acids, An- nual Reviews, 1976) . Diese Assays können daher kalibriert werden, indem lediglich die unspezifische Hintergrundhy- bridisierung und der dynamische Bereich der Meßsonden bestimmt wird. Dies kann mit Hilfe von künstlich herge- stellter unmethylierter und methylierter DNA geschehen. Die eigentliche Methylierungsrate kann dann durch einfache lineare Interpolation zwischen der Fluoreszenzinten-
sität der unmethylierten DNA (0% Methylierung) und der Fluoreszenzintensitaet der methylierten DNA (100% Methylierung) bestimmt werden. Es ist besonders bevorzugt, dass diese Bestimmung der Methylierungsrate einer gegebe- nen Probe (sample) aus mehreren wiederholten Messungen erfolgt und die statistische Verteilung des Messrauschens berücksichtigt wird (DM Rocke and S Lorenzato, A two- component model for measurement error in analytical che- mistry, Tecϊmometrics, 1995, 37, 176-184) . Dies wird be- vorzugt mit Hilfe klassischer statistischer Verfahren wie der „Maximum Likelihood" oder „Varianzstabilisierung" realisiert.
Im Folgenden wir dieses besonders bevorzugte erfindungsgemäße Verfahren zur Umwandlung von Signalintensitäten aus Methylierungs-Mikroarray- Hybridisierungsexperimenten beschrieben. Die Durchführung solcher methylierungsspezifischen Mikroarray- Hybridisierungsexperimente wurde bereits anderweitig ausführlich beschrieben zum Beispiel von Adorjan et al . (Nucleic Acids Res. 2002 Mar 1; 30 (5) :e21) . Die Umwandlung der Signalintensitäten in Methylierungswerte jedoch, erfolgt bei Adorjan et al . nach einem anderen Verfahren.
Das neue Verfahren ist charakterisiert durch die Verwendung von erfindungsgemäß unmethylierter DNA in einem wesentlichen Schritt, nämlich der Kalibrierung der zuvor vom Hintergrund-Rauschen korrigierten, normalisierten und varianzstabilisierten Hybridisierungsdaten, wie sie insbesondere bei der Methylierungsanalyse mit sogenannten CG- und TG-Oligos vorkommen. Erst die durch die Verwendung unmethylierter DNA ermöglichte Kalibrierung erlaubt letztlich die
akkurate Zuordnung von Methylierungs-Signalen, die sich aus Signalintensitäten berechnen lassen, in tatsächliche Methylierungsraten.
Es ist also ein weiterer erfindungsgemäßer Aspekt, ein Verfahren bereitzustellen, dass dadurch gekennzeichnet ist, dass es Kalibrierungsstandards zur Auswertung der Hybridisierungsdaten aus Mikroarray-Versuchen benutzt, wobei ein Standard keine methylierte DNA enthält, und der andere Standard DNA eines definierten Grades an Methylierung (z.B. 100%) enthält, um dadurch tatsächliche Methylierungsraten zu bestimmen. Der methylierte Standard wird bevorzugt wie oben beschrieben durch Aufmethylierung mit der Sssl-Methylase hergestellt. Zur Verwendung als Standard, der keine methylierte DNA enthält, wird bevorzugt unmethylierte DNA verwendet. Besonders bevorzugt ist hierbei die Verwendung von nach dem oben beschriebenen Verfahren hergestellter genomischer unmethylierter DNA.
Bevorzugt, aber nicht unbedingt notwendig für die Erstellung einer Kalibrierungskurve, ist die Verwendung mehrerer zu unterschiedlichen Graden methylierter DNA.
Besonders bevorzugt ist jedoch ein Verfahren dass es erlaubt eine akkurate Zuordnung der absoluten Werte anhand einer Kalibrierungskurve zu ermitteln, die unter Zuhilfenahme nur zweier KaiibrierungsStandards (besonders bevorzugt sind hierbei 0% und 100%) berechnet wurde.
Hierbei bezeichnet die Methylierungsrate einen Wert von 0 bis 100, der das Verhältnis der Anteile der tasächlich methylierten DNA und der unmethylierten DNA zueinander in der analysierten Probe (sample) pro Oligonukleotidsonden-
Paar (oder pro Abfrageposition (= CpG oder TpG) , falls das Oligo nur eine CpG-Site abdeckt) angibt. Erfindungsgemäß werden die KaiibrierungsStandards benutzt, um eine Kalibrierungskurve zu erstellen, anhand derer -wie im Folgenden näher erläutert- die tatsächlichen Methylierungsraten der untersuchten Proben abgelesen werden können. Erfindungsgemäß ist demnach das konkrete Verfahren der Umwandlung der erhaltenen Hybridisierungswerte in absolute Methylierungsraten. Dies wird im Folgenden näher erläutert. Bevor die Methylierungsdaten eines Methylierungs- experiments (basierend auf Mikroarrays) überhaupt kalibriert werden' können, müssen die rohen PIXEL Intensitäts-Angaben der Mikroarray-Laser-Scan-Abbildungen für jedes Oligonukleotidsonden-Paar in Methylierungs- Signalwerte überführt werden. Die rohen Meßdaten einzelner Oligonukleotid-Spotting-Positionen müssen also in Methylierungs-Signale [methyla tion signal ) pro Oligonukleotidsonden-Paar (bzw. pro Abfrageposition) der Detektions-Sonden umgewandelt werden. Eine Abfrageposition ist immer jeweils das zu untersuchende Cytosin (oder Thymin) vor einem Guanin (innerhalb eines CpG Dinukleotids) . Da Detektions-Oligonukleotidsonden aber auch mehrere solcher CpG-Stellen enthalten können, werden Methylierungssignale im Weiteren pro Oligonukleotidsonden-Paar angegeben und nicht pro Abfrageposition. Das erfindungsgemäße Auswerteverfahren sei im Folgenden näher erläutert : • Der erste Schritt ist die Korrektur um das Hintergrundrauschen (background correction) : Für jeden
Spot, also jedes lokalisierte Detektionsoligo, wird der Mediän der Hintergrundpixel-Intensitäten vom Mediän der Vordergrundpixel-Intensitäten subtrahiert. Das ergibt eine robuste Abschätzung der Hintergrund-korrigierten Oligonukleotid-Hybridisierungsintensitäten. Dies kann zum Beispiel aber auch über die Verwendung der Formel : X = Imeth- * r2 geschehen.
Der zweite Schritt kann als Daten-Normalisierung (normalization of data) bezeichnet werden: Hierzu werden generell klassische Methoden benutzt, die allerdings für die Anwendung auf Methylierungs-Mikroarray-Experimente optimiert werden können, indem von der Annahme ausgegangen wird, daß die Summe der CG-Signale und der TG-Signale innerhalb einer Probe, konstant ist, und zwar über mehrere Mikroarrays hinweg, oder auch nur über mehrere Amplifikate innerhalb eines Mikroarrays hinweg. Dies ist der inhärente Vorteil der Methylierungsanalyse mit CG- und TG-Oligosonden, wie bereits anderweitig beschrieben. Die hintergrund-korrigierten redundanten CG- und TG-Detektionsoligo-Spot-Intensitäten jedes Mikroarrays werden linear skaliert, so daß die Gesamtverteilung der Intensitäten jedes Mikroarrays möglichst identisch sind (einfachster Fall: Mediän der CG+TG Intensitäten ist identisch für alle Mikroarrays) . Die Intensitäten sind bevorzugt redundant, was bedeutet, daß sich auf einem Mikroarray Spots (eine definiert aufgetragene Menge) derselben Sonde mehrfach befinden.
Der dritte Schritt stellt eine Datentransformation dar, der die Varianzstabilisierung zum Ziel hat.
Varianzstabilisierung meint hier das Generieren varianz-
stabilisierter Methylierungssignale im generalisierten logarithmischem Raum. Dies wurde bisher dadurch erreicht, dass, der Logarithmus des Verhältnisses von durch Cytosin (CG) und Thymin (TG) Oligonukleotiden generierten Meßdaten gebildet wurde (wie zuvor von Adorjan et al. Nucleic Acids Res. 2002 Mar l;30(5):e21. beschrieben). Die generierten Daten sollten varianzstabilisiert sein, damit die Voraussetzungen zur Anwendung etablierter statistischer Auswertemethoden, wie der „maximum likelihood algorithm (ML) " erfüllt sind. Statt der Verwendung des einfachen Logarithmus wird hierfür jedoch bevorzugt das generative Modell von Rocke verwendet, welches das spezifische (intensitätsabhängige, durch die Verwendung von Fluoreszenzintensitäten bedingte) Rauschen, das diesem Meßprozeß inhärent ist, berücksichtigt. Die Verwendung einer generalisierten log Skala anstelle des Logarithmus hat den Vorteil, daß auch negative Intensitätswerte, wie sie bei der Korrektur um das Hintergrundrauschen entstehen können, berücksichtigt werden können und sehr geringe Intensitäten stärker berücksichtigt werden.
Zur näheren Erläuterung der generalisierten log Skala sei hiermit auf die entsprechenden Veröffentlichungen von Rocke in der Fachzeitschrift „Bioinformatics" hingewiesen (Durbin B and Rocke DR (2003) Estimation of transforamtion parameters for microarray data. Bioinformatics vol 19, no 11, pages 1360-1367).
Basierend auf der Verwendung von Negativkontrolloligos, und den damit generierten Intensitätsdaten kann eine globale (also mindestens für alle auf dem Mikroarray immobilisierten Oligonukleotidsondenpaare geltende)
Hintergrund-Hybridisierungs-Intensitätsverteilung geschätzt werden. Negativkontrolloligos sind Detektionsoligos, die so entworfen werden, daß sie an keines der zu untersuchenden Amplifikate hybridisieren, die ja bei diesen Hybridisierungsexperimenten zur Methylierungsanalyse im Gegensatz zu Hybridisierungsexperimenten zur Expressionsanalyse bekannt sind. Der Mittelwert (μ, mean) und die Varianz (σ2 , variance) für die Normalverteilung (z.B. nach Gauss) werden geschätzt. Eine zuerst von Durbin und Rocke beschriebene varianzstabilisierende Transformation (Durbin BP et al .
(2002) . A variance stabilizing transforamtion for gene expression microarray data Bioinformatics, 18(1), 105-
110) wird benutzt, um damit CG- und TG-Methylierungs- Meßwerte (=Intensitäten) pro Oligonukleotidsondenpaar in ein Methylierungs-Signal auf einer generalisierten log- Skala zu transformieren. Wie bereits erwähnt, ermöglicht diese generalisierten log Skala eine konsistente Behandlung bzw. Bewertung von niedrigen oder sogar negativen Intensitätssignalen. Diese so erhaltenen
Methylierungs-Signale (methylation Signals) erfüllen damit nun hinreichend die Voraussetzung zur Anwendung der üblichen Standard-Methoden der Statistik, wie statistischen Tests (zum Beispiel: dem „Student t-test" oder dem „Hotelling multivariate T2 test") und rechtferigen somit deren Verwendung.
Das Methylierungs-Signal hat die Eigenschaft, daß das Hybridisierungsrauschen eine nahezu konstante Varianz über den vollen Bereich aller möglichen Methylierungsniveaus zeigt. Es ist jedoch nur begrenzt aussagekräftig, um Aussagen über absolute
Methylierungswerte und daraus abgeleitete Vergleiche zwischen verschiedenen Detektionsoligo-Familien zu machen.
Der vierte Schritt aber, die eigentliche Kalibrierung der nun varianzstabilisierten Daten, hat es zum Ziel, die Methylierungs-Signale (methylation Signals) in Methylierungs-Raten (mehylation rates) zu verwandeln.
Die Methylierungs-Signale werden in diesem Schritt der Kalibrierung auf Kontroll-DNA Meßsignale (g log scores) geeicht. Diese werden unter erfindungsgemäßer Verwendung unmethylierter Kontroll-DNA und definierter Anteile aufmethylierter Kontroll-DNA in separaten mehrfach wiederholten Mikroarray-Hybridisierungen generiert. Dabei werden die Methylierungs-Signale bestimmt, die den Eichwerten (z.B. 0%, 10%, 90% und 100%) zugeordnet werden. Besonders bevorzugt ist hierbei die Ausführungsform in der nur die Kontroll-DNA-Meßsignale, die den Eichwerten 0% und 100% entsprechen produziert, oder benutzt werden. Mittels „maximum likelihood (ML) " Abschätzung können nun kalibrierte Methylierungs-Raten erhalten werden. Das kalibrierte Methylierungs-Signal ist somit die Methylierungs-Rate und quantifiziert den absoluten Anteil an methylierter DNA im Gemisch aus methylierter und unmethylierter DNA. Während bisher per Mikroarray-Hybridisierung nur bestimmt werden konnte, ob ein Oligonukleotidsondenpaar in verschiedenen Proben signifikant unterschiedlich methyliert war, ist es jetzt möglich, Aussagen beispielsweise darüber zu treffen, ob diese signifikanten Unterschiede von beispielsweise 25% im hohen oder niedrigen Methylierungsniveau liegen, also ob sich der Unterschied aus einer 95%igen Methylierung im
einen Fall und einer 70%igen Methlyierung im anderen Fall ergibt, oder aber aus einer 45%igen Methylierung gegenüber einen 20%igen Methylierung.
Erfindungsgemäß ist demnach ein Verfahren zur Bestimmung von Methylierungsraten von DNA Proben mit Hilfe von Mikroarrays, welche CG- und TG-Oligomere enthalten, welches dadurch gekennzeichnet ist dass, die Arrays mit zwei Kalibrierungstandards hybridi- siert werden, die definierte Methylierungsraten aufweisen; anhand der erhaltenen Hybridisierungswerte mit Hilfe einer geeigneten Berechnungsmethode eine Kalibrierungs- kurve ermittelt wird, und anhand dieser erstellten Kalibrierungskurve die tatsächlichen Methylierungsraten der untersuchten DNA Proben bestimmt werden.
Bevorzugt ist dieses Verfahren wobei die zwei Kalibrie- rungsStandards Methylierungsraten von 0% und 100% aufweisen, bzw, repräsentieren.
Ferner ist ein Verfahren nach Anspruch 18, bevorzugt, in welchem mehr als zwei Kalibrierungstandards verwendet werden, die unterschiedliche Methylierungsraten aufweisen.
Eine besonders bevorzugte Ausführungsform ist ein Verfahren nach Anspruch 18, welches dadurch gekennzeichnet ist, dass die tatsächlichen Methylierungsraten in einem mehrstufigen Berechnungsprozeß bestimmt werden, der aus folgenden Schritten besteht:
a) es wird eine Normalisierung der Hybridisierungswerte durchgeführt wird, wodurch Methylierungssignale ermittelt werden, b) eine Transformation dieser Signale mit dem Ziel ei- ner Varianzstabilisierung wird durchgeführt, c) die Methylierungsraten werden unter Verwendung der KaiibrierungsStandards und eines geeigneten maxi- mum-likelihood-algorithmus bestimmt .
Besonders bevorzugt ist dieses Verfahren, wenn vor der Normalisierung der Hybridisierungswerte, diese um das der Meßmethode inhärente Hintergrundrauschen korrigiert werden.
Die weiter oben beschriebenen Kontrollen oder Standards lassen sich bei allen Methoden der quantitativen Methy- 1ierungsanalyse verwenden: u.a. bei MS-SnuPE, bei Hybri- disierung auf Mikroarrays, Hybridisierungsassays in Lösung, direkte Bisulfit-Sequenzierung, bei Real Time PCR (z.B. Heavy Methyl, MSP. vgl. zu den PMR-Werten: Eads et al., CANCER RESEARCH 61, 3410-3418, April 15, 2001),
Eine besonders bevorzugte Verwendung der durch WGA- Verfahren hergestellten DNA und des erfindungsgemäßen Verfahrens liegt in der Diagnose von Krebserkrankungen oder anderen mit einer Veränderung des MethylierungsStatus assoziierten Krankheiten. Hierzu gehören u.a. CNS- Fehlfunktionen, Aggressionssymptome oder Verhaltensstörungen; klinische, psychologische und soziale Konsequenzen von Gehirnschädigungen; psychotische Störungen und
PersönlichkeitsStörungen; Demenz und/oder assoziierte Syndrome; kardiovaskuläre Krankheit, Fehlfunktion und Schädigung; Fehlfunktion, Schädigung oder Krankheit des gastrointestinalen Traktes; Fehlfunktion, Schädigung oder Krankheit des AtmungsSystems; Verletzung, Entzündung, Infektion, Immunität und/oder Rekonvaleszenz; Fehlfunktion, Schädigung oder Krankheit des Körpers als Abweichung im Entwicklungsprozess; Fehlfunktion, Schädigung oder Krankheit der Haut, der Muskeln, des Bindegewebes oder der Knochen; endokrine und metabölische Fehlfunktion, Schädigung oder Krankheit; Kopfschmerzen oder sexuelle Fehlfunktion. Das erfindungsgemäße Verfahren eignet sich außerdem zur Vorhersage von unerwünschten Arzneimittelwirkungen und zur Unterscheidung von Zeiltypen oder Geweben oder zur Untersuchung der Zelldifferenzierung.
Erfindungsgemäß ist weiterhin ein Kit, der aus Reagenzien zur Durchführung eines WGA-Verfahrens oder aus bereits über ein WGA-Verfahren amplifizierter DNA sowie aus Rea- genzien zur Durchführung einer Bisulfitumwandlung besteht, und optional auch eine Polymerase, Primer und/oder Sonden für eine Amplifikation und Detektion enthält.
Erfindungsgemäß ist auch vollständig methylierte DNA, die über ein WGA-Verfahren hergestellt und anschließend mittels eines Enzyms, bevorzugt der Sssl Methylase, methy- liert wurde. Erfindungsgemäß ist schließlich auch ein Gemisch aus methylierter und nicht-methylierter, über ein genomweites Amplifikationsverfahren hergestellter DNA. Die Verwendung eines solchen Gemisches insbesondere als
Standard in der Methylierungsanalyse ist ein wesentlicher Teil der vorliegenden Erfindung. Es ist bevorzugt, daß
die Herstellung des Gemisches erfolgt, wie oben beschrieben.
Bevorzugt sind Gemische mit einem Anteil von 1%, 2%, 5%, 10%, 25%, 50%, methylierter DNA, sowie Gemische mit einem Anteil von 99%, 98%, 95%, 90%, 75%, 50%. Für die Verwendung in der Mikroarray-Anwendung sind neben der Verwendung der Standards 0% und 100% eher niedrig konzentrierte Mischungen, also 1%, 2%, 5%, 10%, 25% und 50% , bevorzugt . Bevorzugt ist auch die Verwendung von Mischungen im hohen Konzentrationsbereich, also 99%, 98%, 95%, 90%, 75% und 50%. Besonders bevorzugt ist jedoch die vorteilhafte gleichzeitige Verwendung von Mischungen im hohen Konzentrati- onsbereich sowie im niedrigen Konzentrationsbereich.
Bevorzugt ist auch die Verwendung von 100% unmethylierter und 100% methylierter DNA. Für die Verwendung im „sensitive detection" Bereich, zum Beispiel mit Assays wie HeavyMethyl und MSP ist es bevor-
- zugt, daß folgende Mischungsverhältnisse benutzt werden: 1:10000, 1:5000, 1:2500, 1:1000, 1:500, 1:200, 1:100. Für MSP-Assays werden entsprechend kleinere Konzentrationen bevorzugt verwendet etwa 1:10000, 1:5000, 1:2500, 1:1000, 1:500, 1:200, 1:100.
Beispiele: Beispiel 1: Verwendung von MDA-DNA für Kalibrierungen Der Methylierungsgrad einer DNA aus abdominalem Fettgewebe soll mittels Oligonukleotid-Mikroarrays und
zum Vergleich mittels des MS-SNuPE-Verfahrens bestimmt werden. Hierzu wird die DNA aus der biologischen Probe mit Hilfe des QIAamp Mini Kits (Qiagen) nach Herstellerangaben extrahiert. Zur Aufnahme einer Kalibrierungskurve werden unterschiedliche Mischungen methylierter und nicht-methylierter DNA hergestellt (0%, 25%, 50%, 75%, 100% methylierter DNA) . Die nicht- methylierte DNA wurde über Molecular Staging bezogen, wo sie über eine MDA-Reaktion aus humaner genomischer DNA aus ganzem Blut hergestellt worden war. Bei einer MDA- Reaktion werden alle MethylierungsSignale gelöscht (s.o.) . Die vollständig methylierte DNA wird aus der MDA- DNA mittels einer Sssl-Methylase (New England Biolabs) hergestellt. Die Synthese erfolgt nach Herstellerangaben. Die übrige nicht-methylierte DNA wird dabei ebenso mit allen Reagenzien bis auf die Sssl-Methylase umgesetzt. So ist sichergestellt, dass die DNA-Konzentration in beiden Ansätzen identisch ist, und in beiden Ansätzen die gleichen Reaktionskomponenten anwesend sind. Anschließend werden nicht-methylierte und methylierte DNA in folgenden Verhältnissen gemischt: 4:0 für 0%, 3:1 für 25%, 2:2 für 50%, 1:3 für 75%, 0:4 für 100%. Die DNA wird anschließend in Gegenwart von Dioxan als denaturiendem Lösemittel Bisulfit-umgewandelt (vgl.: DE 10029 915 Al; deutsche Anmeldung: AZ : 10347396.3). Anschließend werden die erstellten DNA-Gemische und die DNA aus der biologischen Probe (sample) in einer Multiplex-PCR eingesetzt. Dabei werden jeweils 8 Fragmente amplifiziert . Als Primer werden die in Tabelle 1 aufgeführten Oligonukleotide verwendet. Die Amplifikationen werden mittels des QIAGEN HotStarTaq-Kits im wesentlichen nach Herstellerangaben und mit dem folgenden Temperaturprofil durchgeführt:
95°C: 15 min; 45 mal:(95°C: 15sec; 55°C: 30sec; 72°C: 60 sec) ; 72°C : 10 min. Die Multiplex-PCR-Produkte werden anschließend an ein Oligomer-Mikroarray hybridisiert. Die Sonden-Oligonukleotide sind in Tabelle 2 angegeben. Die Hybridisierung und die Methylierungs-Signal-Ermittlung erfolgen dabei wie bei Adorjan et al., 2002 (a.a.O.) beschrieben. Für jede Probe und jeden Kalibierungsmix werden acht Hybridisierungen durchgeführt. Für die Erstellung von Kalibrierungskurven für eine CpG-Position wird die gemessene Methylierungsrate gegen die theoretische Methylierungsrate aufgetragen. Die gemessene Methylierungsrate ergibt sich aus der Signalintensität einer Oligonukleotidsonde, die für den methylierten Status spezifisch ist, dividiert durch die Gesamtintensität dieser Sonde + einer dazu passenden (also die gleiche CpG-Position abdeckenden) Sonde, die spezifisch ist für den nicht-methylierten Status. Der theoretische Methylierungsstatus entspricht den
Methylierungsniveaus der. verwendeten definierten Mischungen. Oligonukleotidsonden-Paare, die für
Kalibrierungszwecke geeignet sind, weisen monoton steigende Kalibrierungskurven auf. Für die Ms-SNuPE- Reaktion werden die Proben mit den oben aufgeführten primern in einzelnen PCR-Reaktionen amplifiziert . Die Reaktionsbedingungen sind die gleichen wie für die Multiplex-PCR (s.o.). In der Extensionsreaktion werden als Primer-Bindungsstellen Positionen verwendet, die direkt flankierend zu CpG-Positionen liegen, die denen der Oligonukleotid-Mikroarrays entsprechen. Der Ms-SnuPE- Assay wird entsprechend den Herstellerangaben des
MegaBace-SNuPE-Kits durchgeführt. Für die beiden möglichen Varianten des einzubauenden Nucleotides werden
mit unterschiedlichen Farbstoffen markierte ddNTPs verwendet. Für jeden SNuPE-Assay werden vier Messungen parallel durchgeführt. Die von der SNP-Profile-Software (Amersham) ermittelten Signalintensitäten (Imeth- für unmethyliert-spezifische Sonden und Imeth+ für methyliert-spezifische Sonden) der beiden verwendeten Farbstoffe werden entsprechend des Quotienten Imeth"1"/ (Imeth" + Imeth+ verwendet, um die gemessene Methylierungsrate zu ermittlen. Durch das Auftragen dieser Werte gegen die theoretische Methylierungsrate erhält man wiederum eine Kalibrierungskurve, die monoton steigend sein sollte. Die so erzeugten monoton steigenden Kalibrierungskurven werden verwendet, um aus der gemessenen Methylierungsrate von Proben-DNA die tatsächliche Methylierung zu ermitteln.
Die mit den beiden Methoden Mikroarray-Analyse (chip) und SNuPE ermittelten und an entsprechenden Kalibrierungskurven korrigierten Methylierungsraten in Proben-DNA stimmen für die gezeigten CpG-Positionen gut überein. Diese Daten zeigen, dass die über MDA- hergestellte nicht-methylierte DNA bzw. entsprechende Gemische mit- methylierter DNA sehr gut als Standard in der Methylierungsanalyse verwendet werden kann.
Beispiel 2:
Die Ergebnisse eines analog durchgeführten Experimentes mit jedoch zum Teil differierenden Oligosequenzen sind in Abbildung 1 dargestellt. Die y-Achse zeigt den Prozentsatz an Methylierung, die x-Achse die Hybridisierung an verschiedene Oligonukleotide bzw. verschiedene SNuPE-Assays .
Abbi1düngen
Abbildung 1 :
Die Abbildung 1 zeigt die Ergebnisse eines analog zu Beispiel 1 beschriebenen Experimentes. Die y-Achse zeigt den ermittelten Prozentsatz an Methylierung, die x-Achse gibt an dass verschiedene Amplifikate (1-5) untersucht wurden. Die verschiedenen Schraffüren zeigen an mit welcher Methode dieser Wert bestimmt worden ist. Die Hybridisierung an verschiedene immobilisierte Oligonukleotide wird hierin als „chip" indiziert und die alternativ eingesetzte Methode ist der SNuPE-Assay, bezeichnet als „SnuPE". Weiterhin ist angegeben, ob es sich um 100% aufmethylierte DNA (100%), 0% methylierte also unmethylierte DNA (0%) oder natürlicherweise vorkommende DNA aus dem menschlichen Abdominalgewebe handelt. Die mit den beiden Methoden ermittelten und an entsprechenden Kalibrierungskurven korrigierten Methylierungsraten in Proben-DNA stimmen für die gezeigten CpG-Positionen gut überein.
Die Abbildungen 2 und 3 zeigen Plots, die an der Y-Achse die absoluten Methylierungsraten (methylation levels) in Brustkrebsproben und Lymphozyten Proben angeben. Für jedes Detektionsoligo sind Minimum- und Maximum- Hybridisierungsintensitäten bestimmt worden. Dies gelang durch Hybridisierung mit völlig unmethylierter
menschlicher DNA (Molecular Staging, new haven, CT) einerseits und enzymatisch methylierter Kontroll-DNA (Sssl; New England Biomedical) , als KaiibrierungsStandards, andererseits. Der Anteil der Methylierung einer Probe an einer bestimmten CpG Position wird ermittelt durch lineare Interpolation zwischen der entsprechenden Minimumintensität (0% Methylierung von CG- Oligos, 100% Methylierung für TG-oligos) und der Maximumintensität (100% Methylierung von CG-Oligos, 0% Methylierung für TG-oligos) . Die lineare Interpolation wird durch Anwendung eines „Maximum Likelihood Algorithmus" durchgeführt, der die hybridisierungsspezifische Fehlerverteilung (siehe hierzu Rocke and Durbin, (2001) A model for measurement error for gene expression arrays, Journal of Computational
Biology, 8, 557-569) berücksichtigt. Wahrscheinlichkeiten (likelihoods) von CG- und TG-Oligomeren derselben CpG
Position werden kombiniert in einen Wert für den
Methylierungsanteil . Abbildungen 2 und 3 zeigen die Verteilung von ermittelten Methylierungsraten für jede CpG Position, in der Reihenfolge geordnet nach dem Mediän der Methylierungsrate.
In Abbildung 2 sind Ergebnisse von Lymphozyten Proben gezeigt. In Abbildung 3 sind Ergebnisse von Brustkrebsdaten gezeigt.
Tabelle 2: Oligonukleotidsonden
Alle in dieser Beschreibung angegebenen Literaturstellen und Referenzen werden hiermit in ihrem vollen Umfang in den Offenbarungsgehalt der vorliegenden Anmeldung eingeschlossen