Ansprüche
1. Isolierte Nucleinsäure, die eine Nucleinsäureseauenz
umfaßt, die aus der Gruppe ausgewählt ist, die besteht aus:
a. Nucleinsäuresequenzen, die der Nucleinsäure von SEQ ID
NO:1 entsprechen;
b. Nucleinsäuresequenzen, die den Nucleinsäuresequenzen entsprechen, die aus der Gruppe ausgewählt sind, die besteht
aus SEQ ID NO:3; SEQ ID NO:5, SEQ ID NO:7;
c. Nucleinsäuresequenzen, die der Nucleinsäuresequenz von SEQ ID NO:9 entsprechen; und
d. Nucleinsäuresequenzen, die den Nucleinsäuresequenzen entsprechen, die aus der Gruppe ausgewählt sind, die besteht
aus SEQ ID NO:10, SEQ ID NO:11 und SEQ ID NO:12.
2. Nucleinsäure nach Anspruch 1, wobei die Nucleinsäure Genom DNA ist.
3. Nucleinsäure nach Anspruch 2, wobei die DNA cDNA ist.
4. Nucleinsäure nach Anspruch 1, wobei die Nucleinsäure eine Nucleinsäuresequenz ist, die der Nucleinsäure von SEQ
ID NO:1 entspricht.
5. Nucleinsäure nach Anspruch 1, wobei die Nucleinsäure eine Nucleinsäuresequenz ist, die der Nucleinsäuresequenz
von SEQ ID NO:9 entspricht.
6. Nucleinsäure nach Anspruch 1, wobei die Nucleinsäure eine Nucleinsäuresequenz ist, die einer Nucleinsäuresequenz
entspricht, die aus der Gruppe ausgewählt isc, die besteht aus SEQ ID NO:3, SEQ ID NO:5 und SEQ NO:7.
7. Nucleinsäure nach Anspruch 1, wobei die Nucleinsäure eine Nucleinsäureseauenz ist, die einer Nucleinsäure ent-
spricht, die aus der Gruppe ausgewählt ist, die besteht aus SEQ ID NO:10, SEQ ID NO:11 und SEQ ID NO:12.
8. Nucleinsäure, die ein RNA-Äquivalent der Nucleinsäure
von Anspruch 1 umfaßt.
9. Klonierungsvektor, der eine codierende Sequenz aus
einer Nucleinsäure aufweist, wie sie in irgendeinem der Ansprüche 1 bis 7 aufgeführt ist, sowie ein Replikon, das in
einer Wirtszelle für den Vektor wirksam ist.
10. Expressionsvektor, der eine codierenden Sequenz aus einer Nucleinsäure aufweist, wie sie in irgendeinem der
Ansprüche 1 bis 7 aufgeführt ist, die funktional mit einer Promotorsequenz verknüpft ist, die in der Lage ist, die
Expression der Codiersequenz in einer Wirtszelle für den Vektor zu steuern.
11. Wirtszelle, die mit einem Vektor transformiert ist, wie er in irgendeinem der Ansprüche 9 und 10 aufgeführt ist.
12. Verfahren zur Herstellung eines mutanten HH-Polypeptids,
das umfaßt:
a. Transformieren von Wirtszellen mit einem Vektor, der in der Lage ist, ein Polypeptid auf der Grundlage einer
Nucleinsäuresequenz zu exprimieren, wie sie in irgendeinem der Ansprüche 6 und 7 aufgeführt ist;
b. Kultivieren der Zellen unter Bedingungen, die für die Produktion des Polypeptids geeignet sind; und
c. Gewinnen des Polypeptids.
13. Peptidprodukt, das aus der Gruppe ausgewählt ist, die
besteht aus:
a. einem Polypeptid, das die Aminosäuresequenz aufweist, die der Sequenz SEQ ID NO:2 entspricht;
· &Idigr; J ·
b. einem Polypeptid, das die Aminosäuresequenz aufweist, die der Sequenz SEQ ID NO:4, SEQ ID NO:6 oder SEQ ID NO:8
entspricht,
c. einem Peptid, das wenigstens 6 Aminosäurereste aufweist, die der Sequenz von SEQ ID NO:2 entsprechen; und
d. einem Peptid, das wenigstens 6.Aminosäurereste aufweist,
die der Sequenz von SEQ ID NO:4, SEQ ID NO:6 und SEQ
ID NO:8 entsprechen.
14. Peptidprodukt nach Anspruch 13, wobei das Peptid markiert ist.
15. Peptidprodukt nach Anspruch 13, wobei das Peptid ein Fusionsprotein ist.
16. Verwendung von Peptiden, wie sie in irgendeinem der Ansprüche 13 bis 15 aufgeführt sind, als ein Immunogen zur
Erzeugung von Antikörpern.
17. Antikörper, der gemäß Anspruch 16 hergestellt wurde.
18. Antikörper nach Anspruch 17, wobei der Antikörper markiert ist.
19. Antikörper nach Anspruch 17, wobei der Antikörper an einen festen Träger gebunden ist.
20. Antikörper nach Anspruch 17, wobei der Antikörper monoklonal ist.
21. Verfahren zur Bestimmung des Vorliegens oder des Fehlens der verbreiteten Mutation des Gens der hereditären
Hämochromatose (HH) bei einem Individuum, das umfaßt:
Gewinnen einer DNA oder RNA des Individuums; und Untersuchen der DNA oder RNA auf das Vorliegen oder
Fehlen des HH-assoziierten Alleis A einer Basenpaarmutation, die hierin als 24dl bezeichnet wird,
DE/EP O 954 4Ö2T1
wobei, im Ergebnis, die Abwesenheit des Alieis auf das Fehlen der HH-Genmutation im Genom des Individuums hinweist,
und das Vorliegen des Alieis auf das Vorliegen der HH-Genmutation im Genom des Individuums hinweist.
22. Verfahren nach Anspruch 21, bei dem das Verfahren außerdem die Untersuchung der RNA oder DNA auf das Vorliegen
von 24d2 umfaßt.
23. Verfahren nach Anspruch 21, wobei das Verfahren außerdem die Untersuchung der RNA oder DNA auf das Vorliegen von
wenigstens einem der Polymorphismen HHP-I, HHP-19 oder HHP-29,
oder der Mikrosatelliten-Repeatallele 19D9:205; 18B4:235; 1A2:239; 1E4:271; 24E2:245; 2B8:206; 3321-1:98;
4073-1:182; 4440-1:180; 4440-2:139; 731-1:177; 5091-1:148; 3216-1:221; 4072-2:170; 950-1:142; 950-2:164, 950-3:165;
950-4:128; 950-6:151; 950-8:137; 63-1:151; 63-2:113; 63-3:169; 65-1:206; 65-2:159; 68-1:167; 241-5:108; 241-29:113;
373-8:151; und 373-29:113, D6S258:199, D6S265:122, D6S105:124; D6S306:238; D6S464:206 und D6S1001:180 umfaßt.
24. Verfahren nach Anspruch 22, wobei das Verfahren außerdem die Untersuchung der RNA oder DNA auf das Vorliegen von
wenigstens einem der Polymorphismen HHP-I, HHP-19 oder HHP-29, oder der Mikrosatelliten-Repeatallele 19D9:205;
18B4:235; 1A2:239; 1E4:271; 24E2:245; 2B8:206; 3321-1:98; 4073-1:182; 4440-1:180; 4440-2:139;. 731-1:177; 5091-1:148;
3216-1:221; 4072-2:170; 950-1:142; 950-2:164, 950-3:165; 950-4:128; 950-6:151; 950-8:137; 63-1:151; 63-2:113; 63-3:169;
65-1:206; 65-2:159; 68-1:167; 241-5:108; 241-29:113; 373-8:151; und 373-29:113, D6S258:199, D6S265:122,
D6S105:124; D6S306:238; D6S464:206 und D6S1001:180 umfaßt.
25. Verfahren zur Diagnose, ob ein Patient an der hereditären Hämochromatose (HH)-Krankheit leidet, das umfaßt:
a. Inkontaktbringen von Zellen des Patienten mit Antikörpern, die gegen ein Epitop auf einem HH-Proteinprodukt
• ·
DE/EP O 954 6.02 T1
gerichtet sind, das im wesentlichen SEQ ID NO:2 entspricht,
und
b. Beobachten, ob die Antikörper sich an den Zellen anordnen,
wobei, im Beobachtungsschritt, dann, wenn sich die Antikörper nicht an der Zelle ansammeln, es wahrscheinlich
ist, daß der Patient an HH leidet.
25. Verfahren nach Anspruch 25, wobei das Verfahren in
vitro durchgeführt wird.
27. Verfahren nach Anspruch 25, wobei das Verfahren in vivo durchgeführt wird.
28. Verfahren zur Behandlung eines Patienten, bei dem die Diagnose ergab, daß er die hereditäre Hämochromatose (HH) Krankheit
hat und homozygot für eine 24dl(A)-Mutation ist, das die Verabreichung eines Polypeptids umfaßt, das der
Aminosäuresequenz von SEQ ID NO:2 entspricht, an Gewebe des Patienten.
29. Verfahren nach Anspruch 28, bei dem das Polypeptid indirekt an die Gewebe verabreicht wird.
30. Verfahren nach Anspruch 28, bei dem das Polypeptid intravenös verabreicht wird.
31. Verfahren nach Anspruch 28, bei dem das Polypeptid mittels Gentherapie an die Gewebe verabreicht wird.
32. Tiermodell für die hereditäre Hämochromatose (HH)-Krankheit, das ein Säugetier umfaßt, das ein mutantes oder
stillgelegtes HH-Gen aufweist.
33. Metallchelatisierungsmittel, die sich von Nucleinsäuresequenzen
gemäß Anspruch 1 oder von einem Peptidprodukt gemäß Anspruch 13 ableiten, in einem physiologisch annehmbaren
Träger.
34. Chelatisierungsmittel nach Anspruch 33, bei dem das
Metall ausgewählt ist aus der Gruppe, die besteht aus Eisen, Quecksilber, Cadmium, Blei und Zink.
35. Verfahren zum Screenen von Säugetieren auf ihre Empfindlichkeit gegenüber Metall-Toxizitäten, das das
Screenen derartiger Säugetiere auf eine Mutation im HH-Gen umfaßt, und wobei diejenigen Säugetiere, bei denen festgestellt
wurde, dass sie eine Mutation aufweisen, empfindlicher gegenüber Metalltoxizitäten sind als Säugetiere,
bei denen eine Mutation nicht festgestellt wurde.
36. Verfahren nach Anspruch 35, bei dem das Metall aus der Gruppe ausgewählt ist, die besteht aus Eisen, Quecksilber,
Cadmium, Blei und Zink.
37. Verfahren zum Selektieren von Patienten, die mit dem Hepatitisvirus infiziert sind, für eine a-Interferon-Behandlung,
das das Screenen derartiger Patienten auf eine Mutation im HH-Gen umfaßt, wobei diejenigen Patienten, bei denen
nicht festgestellt wurde, daß sie eine Mutation aufweisen, für eine Weiterbehandlung mittels einer a-Interferon-Behandlung
ausgewählt werden, während diejenigen, bei denen eine Mutation festgestellt wurde, ausgewählt werden, sich vor
einer &agr;-Interferon-Behandlung einer Phlebotomie zu unterziehen.
38. T-ZeIl-Differenzierungsfaktor, der eine Einheit aufweist,
die aus der Gruppe ausgewählt ist, die aus Molekülen besteht, die sich von Nucleinsäuresequenzen gemäß Anspruch
und einem Peptidprodukt gemäß Anspruch 13 ableiten.
39. Verfahren zum Screenen von potentiellen therapeutischer. Mitteln auf eine Aktivität im Zusammenhang mit der HH-Krankheit,
das umfaßt:
Bereitstellen eines Screening-Werkzeugs, das aus der
Gruppe ausgewählt ist, die besteht aus einer Zellinie, einem
zellfreien Extrakt sowie einem Säugetier, die ein defektes
HH-Gen oder -Genprodukt enthalten oder exprimieren;
Inkontaktbringen des Screening-Werkzeugs mit dem potientiellen therapeutischen Mittel; und
Untersuchen des Screening-Werkzeugs auf eine Aktivität, die aus der Gruppe ausgewählt ist, die besteht aus Falten
des HH-Proteins, Eisenaufnahme, Eisentransport, Eisenstoffwechsel, rezeptorähnlichen Aktivitäten, Stromauf-Prozessen,
Stromab-Prozessen, Gentranskription und Signalereignissen.
40. Therapeutisches Mittel zur Minderung einer Schädigung aufgrund oxidativer Prozesse in vivo, das eine Einheit
umfaßt, die aus der Gruppe ausgewählt ist, die aus Molekülen besteht, die sich ableiten von Nucleinsäuresequenzen gemäß
Anspruch 1 und einem Peptidprodukt gemäß Anspruch 13.
41. Verfahren zur Diagnostizierung eines Patienten als einem, der ein erhöhtes Risiko zur Entwicklung der HH-Krankheit
aufweist, das umfaßt:
Gewinnen von DNA oder RNA des Individuums; und Untersuchen der DNA oder RNA auf die Anwesenheit oder
das Fehlen des HH-assoziierten Allels A oder einer hierin 24dl genannten Basenmutation in Kombination mit der Untersuchung
der DNA oder RNA auf das HH-assoziierte Allel G oder
eine Basenmutation, die hierin 24d2 genannt wird,
wobei, im Ergebnis, die Abwesenheit der Allele auf das Fehlen der HH-Genmutation im Genom des Individuums hinweist,
und das Vorliegen der Allele auf das Vorliegen der HH-Genmutation im Genom des Individuums und ein erhöhtes Risiko
zur Entwicklung der HH-Krankheit hinweist.
42. Verfahren nach Anspruch 41, wobei das Verfahren außerdem die Untersuchung der RNA oder DNA auf die Anwesenheit
von wenigstens einem von den Polymorphismen HHP-I, HHP-19
oder HHP-29, oder der Mikrosatelliten-Repeatallele 19D9-.205;
18B4:235; 1A2:239; 1E4:271; 24E2:245; 2B8:206; 3321-1:98; 4073-1:182; 4440-1:180; 4440-2:139; 731-1:177; 5091-1:148;
-&bgr;- DE/EP O 954602T1
3216-1:221; 4072-2:170; 950-1:142; 950-2:164, 950-3:165; 950-4:128; 950-6:151; 950-8:137; 63-1:151; 63-2:113; 63-3:169;
65-1:206; 65-2:159; 68-1:167; 241-5:108; 241-29:113; 373-8:151; und 373-29:113, D6S258:199, D6S265:122,
D6S105:124; D6S306:238; D6S464:206 und D6S1001:180 umfaßt.
43. Therapeutisches Mittel zur Milderung einer Eisenüberlastung,
das eine Einheit aufweist, die aus der Gruppe ausgewählt ist, die aus Molekülen besteht, die sich von
Nucleinsäuresequenzen gemäß Anspruch 1 und einem Peptidprodukt gemäß Anspruch 13 ableiten.
44. Verfahren zur Behandlung der hereditären Hämochromatose (HH)-Krankheit, das umfaßt:
Bereitstellen eines Antikörpers, der gegen eine HH-
Proteinsequenz oder ein Peptidprodukt gerichtet ist; und
Verabreichung des Antikörpers an betroffene Gewebe oder Zellen eines Patienten, der HH hat.
45. Antisens-Oligonucleotid, das gegen ein Transkriptionsprodukt einer Nucleinsäuresequenz gerichtet ist, die ausgewählt
ist aus der Gruppe, die besteht aus SEQ ID NO:1, SEQ
ID NO:3, SEQ ID NO:5 , SEQ ID NO:7, SEQ ID NO:9, SEQ ID
NO:10, SEQ ID NO:11 und SEQ ID. NO:12.
46. . Oligonucleotid mit einer Länge von wenigstens 8 Nucleotiden,
die ausgewählt sind aus den Nucleotiden
1-46, 48-123; 120-369; 365-394; 390-540; 538-646; 643-1004; 1001-1080;
1083-1109; 1106-1304; 1301-1366; 1363-1386; 1389-1514; 1516-1778; 1773-1917; 1921-2010;
2051-2146; 2154-2209; 2234-2368; 2367-2422; 2420-2464; 2465-2491; 2488-2568; 2872-2901; 2902-2934; 2936-2954; 2449-3001; 3000-3042; 3420-3435; 3451-3708; 3703-3754;
3750-3770; 3774-3840; 3840-3962; 3964-3978; 3974-3992; 3990-4157; 4153-4251; 4257-4282; 4284-4321; 4316-4333; 4337-4391; 4386-4400; 4398-4436; 4444-4547; 4572-4714;
4709-4777; 5165-5397; 5394-6582; 5578-5696; 5691-5709; 5708-5773; 5773-5816; 5818-5849; 5889-6045; 6042-6075; 6073-6108; 6113-6133; 6150-6296; 6292-6354; 6356-
DE/EP O 954-602 T1
6555; 6555-6575; 6575-6616; 6620-6792; 6788-6917; 6913-7027; 7023-7061; 7056-7124;
7319-7507; 7882-8000; 7998-8072; 8073-8098; 9000-9037; 9486-9502; 9743-9811; 9808-9831;
9829-9866; 9862-9986; 9983-10075; 10072-10091; 10091-10195; 10247-10263; 10262-10300; 10299-10448; 10448-10539; 10547-10564; 10580-10612; 10608-10708;
10703-10721; 10716-10750; 10749-10774; 10774-10800; and 10796-10825 of SEQ ID
NO:1,3, 5, oder 7.
47. Oligonucleotidpaar, das ein Oligonucleotid von Anspruch 46 und ein Oligonucleotid mit einer Länge von wenigstens 8
Nucleotiden aufweist, die ausgewählt sind aus SEQ ID NO: 1, 3, 5 oder 7.
48. Oligonucleotid mit einer Länge von wenigstens 9 Nucleotiden,
die ausgewählt sind aus den Nucleotiden
1-47; 47-124: 119-370; 364-395; 389-541; 537-647; 642-1005; 1000-1081;
1082-1110; 1105-1305; 1300-1367; 1362-1387; 1388-1515; 1515-1918; 1920-2011; 2050
2147; 2153-2210; 2233-2369; 2366-2423; 2419-2465; 2464-2492; 2487-2569; 2871-2935
2935-3002; 2999-3043; 3419-3436; 3450-3755; 3749-3771; 3773-3841; 3839-3963; 3963
3979; 3973-3993; 3989-4158; 4152-4252; 4256-4283; 4283-4334; 4336-4401; 4397-4437
4443-4548; 4571-4778; 5164-5398; 5393-5583; 5577-5710; 5707-5774; 5772-5817; 5817-5850;
5888-6046; 6041-6076; 6072-6109; 6112-6134; 6149-6355; 6355-6556; 6554-6576
6574-6793; 6787-7125; 7318-7508; 7881-8001; 7997-8073; 8072-8099; 8999-9038; 9485-9503;
9742-9812; 9807-9832; 9828-9867; 9861-9987; 9982-10076; 10071-10092; 10090-10196;
10246-10264; 10261-10301; 10298-10449; 10447-10540; 10546-10565; 10579-10751; 10748-10775; 10773-10801; and 10795-10825 of SEQID N0:l, 3, 5, oder 7·
49. Oligonucleotidpaar, das ein Oligonucleotid von Anspruch
48 und ein Oligonucleotid mit einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1, 3,
5 oder 7.
DE/EP O 954602T
50. Oligonucleotid von wenigstens 10 Nucleotiden, die
ausgewählt sind aus den Nucleotiden
1-48; 46-125; 118-1006; 999-1082; 1081-1111; 1104-1306; 1299-1368; 1361-ioöö;
1387-1516; 1514-1919; 1919-2012; 2049-2148; 2152-2211; 2232-2370 2365-2424; 2418-2466; 2463-2493; 2486-2570; 2870-2936; 2934-3003; 2998-3044; 3418-3437; 3449-3772;
3772-3842; 3838-3964; 3962-3994; 3988-4284; 4282-4335; 4335-4402; 4396-4438;
4442-4549; 4570-4779; 5163-5711; 5706-5775; 5771-5818; 5816-5851; 5867-6047; 6040-6077;
6071-6110; 6111-6135; 6148-6356; 6354-6577; 6573-7126; 7317-7509; 7880-8074; 8071-8100; 8998-9039; 9484-9504; 9741-9813; 9806-9833; 9827-9988; 9981-10093;
10089-10197; 10245-10265; 10260-10302; 10297-10450; 10446-10541; 10545-10566;
10578-10752; 10747-10776; und 10772-10825 von SEQ ID NO:1,
3, 5 oder 7.
51. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 50 und ein Oligonucleotid einer Länge von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1,
3, 5 oder 7.
52. Oligonucleotid mit einer Länge von wenigstens 11
Nucleotiden, die ausgewählt sind aus den Nucleotiden
1-49; 45-1389; 1386-1517, 1513-1920; 1918-2013; 2048-2149; 2151-2212;
2231-2371; 2364-2425; 2417-2467; 2462-2571; 2869-2937; 2933-3004; 2997-3045; 3417-3438;
3448-3773; 3771-3843; 3837-3965; 3961-3995; 3987-4285; 4281-4336; 4334-4403; 4395-4439; 4441-4550; 4569-4780; 5162-5712; 5705-5776; 5770-5819; 5815-5852; 5886-6111;
6100-6136; 6147-6357; 6353-6578; 6572-7127-; 7316-7510; 7879-8075; 8070-8101; 8997-9040; 9483-9505; 9740-10198; 10244-10266; 10257-10303; 10296-10451; 10445-
10542; 10544-10567; 10577-10753; 10746-10777; und 10771-10825
von SEQ ID NO:1, 3, 5 oder 7.
53. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 26 und ein Oligonucleotid einer Länge von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1,
3, 5 oder 7.
11 - DE/EP O 354 602 T1
54. Oligonucleotid mit einer Länge von wenigstens 12 Nucleotiden, die ausqewählt sind aus den Nucleotiden
1-50,44-1390; 1385-1518; 1512-1921; 1917-2014; 2047-2150; 2150-2213;
2230-2372; 2363-2468; 2461-2572; 2868-2938; 2932-3005; 2996-3046; 3416-3439; 3447-3774;
3770-3844; 3836-3966; 3960-4286; 4280-4337; 4333-4440; 4440-4551; 4568-4781·
5161-5713; 5704-5777; 5669-5820; 5814-5853; 5885-6112; 6109-6137; 6146-6358; 6352-6579;
6571-7128; 7315-7511; 7878-8076; 8069-8102; 8996-9041; 9482-9506; 9739-10199;
10243-10267; 10256-10304; 10295-10452; 10444-10543; 10543-10566; 10576-10754;
10745-10778; und 10770-10825 von SEQ ID NO:1, 3, 5 oder 7.
55. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 54 und ein Oligonucleotid einer Länge von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1, 3, 5 oder 7.
56. Oligonucletid mit einer Länge von wenigstens 13 Nucleotiden, die ausgewählt sind aus den Nucleotiden
1-51; 43-1391; 1384-1519; 1511-1922; 1916-2015; 2046-2151; 2149-2214; 2229-2469; 2460-2573; 2867-2939; 2931-3047; 3415-3440; 3446-3775; 3769-3845; 3835-3967;
3959-4287; 4279-4338; 4332-4441; 4439-4552; 4567-4782; 5160-5778; 5668-5821;
5813-5854; 5884-6113; 6108-6138; 6145-6359; 6351-6580; 6570-7129; 7314-7512; 7877-8077;
8068-8103; 8995-9042; 9481-9507; 9738-10200; 10242-10453; 10443-10544;
10542-10567; 10575-10779; und 10769-10825 von SEQ ID NO:1,
3, 5 oder 7.
57. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 56 und ein Oligonucleotid einer Länge von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ id NO: 1, 3, 5 oder 7 .
58. Oligonucleotid mit einer Länge von wenigstens 14 Nucleotiden, die ausgewählt sind aus den Nucleotiden
1-52; 42-1392; 1383-1520; 1510-1923; 1915-2016; 2045-2152; 2148-2215; 2228-2574; 2866-2940; 2930-3048; 3414-3441; 3445-3776; 3768-3968; 3959-4288; 4278-
- 12 -
4339; 4331-4442; 4438-4553; 4566-4783; 5159-580:^812*855;
6144-6360; 6350-6581; 6569-7130; 7313-7513; 7876-8078; 8067-8104; 8994-9043; 9480-9508;
9737-10201; 10241-10454; 10442-10545; 10541-10568; und 10574-10825 von SEQ IC NO:1, 3, 5 oder 7.
59. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 58 und ein Oligonucleotid einer Länger von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1, 3, 5 oder 7.
60. Oligonucleotid mit einer Länge von wenigstens 5 Nucleotiden,
die ausgewählt sind aus den Nucleotiden 1-53; 41-1393; 1382-1521; 1509-1924; 1914-2017; 2044-2153; 2147-2216;
2227-2575; 2865-2942; 2929-3049; 3413-3442; 3444-3777; 3767-3969; 3958^289; 4277-4340;
4330-4443; 4437-4554; 4565-4784; 5158-5823; 5811-5856; 5882-6115; 6106-6140;
6143-6361; 6349-7131; 7312-7514; 7875-8105; 8993-9044; 9479-9509; 9736-10202;
10240-10546; 10540-10569; und 10573-10825 von SEQ ID NO:1,
3, 5 oder 7.
61. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 60 und ein Oligonucleotid einer Länge von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1, 3, 5 oder 7.
62. Oligonucleotid mit einer Länge von wenigstens 16
Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-1394; 1381-1925; 1913-2018; 2043-2154; 2146-2217; 2226-2576; 2864-3050;
3412-3443; 3443-3778; 3766-4341; 4329-4444; 4436-4555; 4564-4785; 5157-5857;
5881-6116; 6105-6141; 6142-7132; 7311-7515; 7874-8106; 8992-9045; 9478-9510; 9735-
10203; 10239-10547; 10539-10570: und 10572-10825 von SEQ ID
NO:1, 3, 5, oder 7.
63. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 62 und ein Oligonucleotid einer Länge von wenigstens
- 13 - DE/EP O 954 602 T1
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1,
3, 5 oder 7.
64. Oligonucleotid mit einer Länge von wenigstens 17 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-192 6;
1912-2019; 2042-2155; 2145-2218; 2225-2577; 2863-3051; 3411-3779; 3765-4342; 4329-4445; 4435-4556; 4563-4786; 5156-5858; 5880-6117; 6104-6142;
6141-7133; 7310-7516; 7873-8107; 8991-9046; 9477-9511; 9734-10204; 10238-10548; 10538-10571; und 10571-10825 von SEQ ID NO:1, 3, 5 oder 7.
65. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch
64 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1,
3, 5 oder 7.
66. Oligonucleotid mit einer Länge von wenigstens 18
Nucleotiden, die ausgewählt sind aus den Nucleotiden
1-2020; 2041-2156; 2144-2219; 2224-2578; 2862-3052; 3410-3780; 3764-
4446; 4434-4557; 4562-4787; 5155-5859; 5879-6118; 6103-6143; 6140-7134; 7309-7517;
7872-8108; 8990-9047; 9476-9512; 9733-10205; 10237-10549; 10537-10572; and 10570-
10825 von SEQ ID NO:1, 3, 5 oder 7.
67. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 66 und ein Oligonucleotid einer Länge von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1,
3, 5 oder 7.
68. Oligonucleotid mit einer Länge von wenigstens 8 Nucleotiden,
die ausgewählt sind aus den Nucleotiden 1-55; 55-251; 250-306; 310-376; 380-498; 500-528; 516-543; 541-578; 573- 592; 590-609; 611-648; 642-660; 664-717; 712-727; 725-763; 772-828; 813-874; 872-
928; 913-942; 940-998; 997-1046; 1054-1071; 1076-1116; 1115-1182; 1186-1207: 1440-
1483; 1482-1620; 2003-2055; 2057-2107; 2116-2200; und 2453-2469
von SEQ ID NO:9, 10, 11 oder 12.
DE/EPO 954 602 Tl
.rqonucleotid gemäß An-
69. Oligonucleotidpaar, das ein Olrgonucleotid gemäß Anspruch
68 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:9,
10, 11 oder 12.
70. Oligonucleotid mit einer Länge von wenigstens 9 Nucleotiden, die ausgewählt sind aus den Nucleotiden
1-56; 54-252; 249-307; 309-377; 379-499; 499-529; 515-544; 540-579; 572-593;
589-610; 610-649; 641-661; 663-718; 711-728; 724-764; 771-829; 812-875; 871-929;
912-943; 939-999; 996-1047; 1053-1072; 1075-1117; 1114-1183; 1185-1208; 1439-1484;
1481-1629; 2002-2056; 2056-2108; 2115-2201; und 2452-2470 von SEQ ID NO: 9, 10, 11 oder 12.
71. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 70 und ein Oligonucleotid einer Länge von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:9, 10, 11 oder 12.
72. Oligonucleotid mit einer Länge von wenigstens 9 Nucleotiden,
die ausgewählt sind aus den Nucleotiden
1-57; 53-253; 248-308; 308-378; 378-500; 498-530; 514-545; 539-580; 571-594;
588-611; 609-662; 662-729; 723-765; 770-876; 870-944; 938-1000; 995-1048; 1052-1073;
1074-1118; 1113-1184; 1184-1209; 1438-1485; 1480-1630; 2001-2057; 2055-2109;
2114-2202; und 2451-2471 von SEQ ID NO:9, 10, 11 oder 12.
73. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 72 und ein Oligonucleotid einer Länge von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:9,
10, 11 oder 12.
74. Oligonucleotid mit einer Länge von wenigstens 11 Nucleotiden, die ausgewählt sind aus den Nucleotiden
1-58; 52-254; 247-309; 307-379; 377-501; 497-531; 513-546; 538-595; 587-612;'608-663;
661-730; 722-766; 769-877; 869-1049; 1051-1074; 1073-1119; 1112-1185;
1183-1210; 1437-1486; 1479-1631; 2000-2058; 2054-2110; 2113-2203;
und 2450-2472 von SEQ ID NO:9, 10, 11 oder 12.
- 15 DE / EP O 954 602 &Tgr;1
75. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 74 und ein Oligonucleotid einer Länge von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO: 9, 10, 11 oder 12.
76. Oligonucleotid mit einer Länge von wenigstens 12 Nucleotiden, die ausgewählt sind aus den Nucleotiden
1-255; 246-310; 306-380; 376-502; 496-596; 586-613; 607-664; 660-767; 768-1050; 1050-1075; 072-1120; 1111-1186; 1182-1211; 1436-1487; 1478-1632; 1999-2059;
2053-2121; 2112-2204; und 2449-2473 von SEQ ID NO:9,
10, 11 oder 12.
77. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 76 und ein Oligonucleotid einer Länge von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO: 9, 10, 11 oder 12.
78. Oligonucleotid mit einer Länge von wenigstens 13
Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-311; 305-381; 375-503; 495-614; 606-665; 659-768; 767-1051; 1049-1076;
1071-1121; 1110-1187; 1181-1212; 1435-1633; 1998-2060; 2052-2205 und 2488-2474 von SEQ ID NO:9, 10, 11 oder 12.
79. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 78 und ein Oligonucleotid einer Länge von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO: 9, 10, 11 oder 12.
80. Oligonucleotid mit einer Länge von wenigstens 14 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-312;
304-382; 374-504; 494-615; 605-666; 658-769; 766-1052; 1048-1077; 1070-1188; 1180-1213; 1434-1634; 1997-2061; 2051-2206;
und 2447-2475 von SEQ ID NO:9, 10, 11 oder 12.
81. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 80 und ein Oligonucleotid einer Länge von wenigstens
16 DE/EP Ö '954"6Ö2 T1
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO: 9, 10, 11 oder 12.
82. Oligonucleotid mit einer Länge von wenigstens 14 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-313;
303-383; 373-505; 493-616; 604-667; 657-770; 765-1053; 1047-1078; 1069-1189; 1179-1214; 1433-1635; 1996-2062; 2050-2207;
und 2446-2476 von SEQ ID NO:9, 10, 11 oder 12.
83. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 82 und ein Oligonucleotid einer Länge von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO: 9, 10, 11 oder 12.
84. Oligonucleotid mit einer Länge von wenigstens 16 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-314;
302-384; 372-668; 656-771; 764-1054, 1046-1079; 1068-1190; 1178-1215; 1432-1636; 1995-2208; und 2445-2477 von SEQ ID
NO:9, 10, 11 oder 12.
85. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 84 und ein Oligonucleotid einer Länge von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO: 9,
10, 11 oder 12.
86. Oligonucleotid mit einer Länge von wenigstens 17 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-315;
301-385; 371-669; 655-772; 763-1055; 1045-1080; 1067-1191; 1177-1216; 1431-1637; 1994-2209; und 2444-2478 von SEQ ID
NO:9, 10, 11 oder 12.
87. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch
86 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO: 9,
10, 11 oder 12.
-17- D E 7 E P O" 9 5"VBD 2 T1
88. Oligonucleotid mit einer Länge von wenigstens 18 Nucleotiden, die ausgewählt sind aus den Nucleotiden l-773;
762-1056; 1044-1081; 1066-1192; 1176-1217; 1430-1638; 1993-2210; und 2443-2479 von SEQ ID NO:9, 10, 11 oder 12.
89. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 88 und ein Oligonucleotid einer Länge von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO: 9, 10, 11 oder 12.
90. Kit zum Nachweis eines Polymorphismus im HH-Gen in
einer Patientenprobe, wobei der Kit wenigstens ein Oligonucleotid mit einer Länge von wenigstens 8 Nucleotiden
umfaßt, die aus ,der Gruppe ausgewählt sind, die besteht aus SEQ ID NOS:1, 3, 5, 7, 9, 10, 11 oder 12, wobei das Oligonucleotid
dazu verwendet wird, einen Abschnitt von HH DNA oder RNA in einer Patientenprobe zu vervielfältigen.
91. Kit nach Anspruch 90, der außerdem wenigstens ein zweites Oligonucleotid umfaßt, das ausgewählt ist aus der
Gruppe, die besteht aus SEQ ID NOS:1, 3, 5, 7, 9, 10, 11
oder 12, wobei die ersten und zweiten Oligonucleotide ein
Primer-Paar umfassen.
1/44
DE/EPO 954 602 Tl
SEQUENZLISTE zu EP 97918642 (EP O 954 602)
3705
(2) INFORMATION FOR SEQ ID NO:1:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 10825 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: join(361..436, 3762. .4025, 4235. .4510, 5606. .5381,
6040..6153, 7107..7147)
(D) OTHER INFORMATION: /product= "Hereditary Hemochromatosis
(HH) protein"
/note= "Normal or wild-type (unaffected) Hereditary Hemochromatosis (HH) gene
allele"
(ix) FEATURE:
(A) NAME/KEY: -
(5) LOCATION: 140..7319
(D) OTHER INFORMATION: /note= "start and stop positions for
normal or wild-type (unaffected) allele
CDNA (SEQ ID NO:9)"
(ix) FEATURE:
(A) NAME/KEY: -
(B) LOCATION: 3S52..3891
(D) OTHER INFORMATION: /note= "start and stop positions for
normal or wild-type (unaffected) genonic sequence surrounding variant for 24d2(C)
allele (SEQ ID NO:41)"
(Lx) FEATURE:
(A) NAME/KEY: -
(B) LOCATION: 5507. .6023 DE/EP O 954 602 T
(D) OTHER INFORMATION: /note= "start and stop positions for
normal or wild-type (unaffected) genomic sequence surrounding variant for 24dl(G)
allele (SEQ ID NO:20)"
(ix) FEATURE:
(A) NAME/KEY: allele
(B) LOCATION: replace(3872, "c")
(D) OTHER INFORMATION: /phenotype= "normal or wild-type
(unaffected)" /label= 24d2
(ix) FEATURE:
(A) NAME/KEY: allele
(B) LOCATION: replace(3373 , "a")
(D) OTHER INFORMATION: /phenotype= "normal or wild-type
(unaffected)" /label= 24d7
(ix) FEATURE:
(A) NAME/KEY: allele
(B) LOCATION: replace(5834, "g")
(D) OTHER INFORMATION: /phenotype= "normal or wild-type
(unaffected)" • /label= 24dl
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:1:
TCTAAGGTTG AGATAAAATT TTTAAATGTA TGATTGAATT TTGAAAATCA TAAATATTTA 60
AATATCTAAA GTTCAGATCA GAACATTGCG AAGCTACTTT CCCCAATCAA CAACACCCCT 12 0
TCAGGATTTA AAAACCAAGG GGGACACTGG ATCACCTAGT GTTTCACAAG CAGGTACCTT 18 0
CTGCTGTAGG AGAGAGAGAA CTAAAGTTCT GAAAGACCTG TTGCTTTTCA CCAGGAAGTT 24 0
TTACTGGGCA TCTCCTGAGC CTAGGCAATA GCTGTAGGGT GACTTCTGGA GCCATCCCCG 3 00
TTTCCCCGCC CCCCAAAAGA AGCGGAGATT TAACGGGGAC GTGCGGCCAG AGCTGGGGAA 3 60
ATG GGC CCG CGA GCC AGG CCG GCG CTT CTC CTC CTG ATG CTT TTG CAG 4 08
Met GIy Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu GIn
15 10 15
ACC GCG GTC CTG CAG GGG CGC TTG CTG C GTGAGTCCGA GGGCTGCGGG 4 56
Thr Ala VaI Leu GIn Gly Arg Leu Leu
20 25
CGAACTAGGG GCGCGGCGGG GGTGGAAAAA TCGAAACTAG CTTTTTCTTT GCGCTTGGGA 516
GTTTGCTAAC TTTGGAGGAC CTGCTCAACC CTATCCGCAA GCCCCTCTCC CTACTTTCTG 57 6
CGTCCAGACC CCGTGAGGGA GTGCCTACCA CTGAACTGCA GATAGGGGTC CCTCGCCCCA 63 6
GGACCTGCCC CCTCCCCCGG CTGTCCCGGC TCTGCGGAGT GACTTTTGGA ACCGCCCACT 696
CCCTTCCCCC AACTAGAATG CTTTTAAATA AATCTCGTAG TTCCTCACTT GAGCTGAGCT 756
AAGCCTGGGG CTCCTTGAAC CTGGAACTCG GGTTTATTTC CAATGTCAGC TGTGCAGTTT S16
TTTCCCCAGT CATCTCCAAA CAGGAAGTTC TTCCCTGAGT GCTTGCCGAG AAGGCTGAGC 87 6
3/44
AAACCCACAG CAGGATCCGC ACGGGGTTTC CACCTCAGAA CGAATGCGTT GGGCGGTGGG GGCGCGAAAG AGTGGCGTTG GGGATCTGAA TTCTTCACCA TTCCACCCAC TTTTGGTGAG
ACCTGGGGTG GAGGTCTCTA GGGTGGGAGG CTCCTGAGAG AGGCCTACCT CGGGCCTTTC CCCACTCTTG GCAATTGTTC TTTTGCCTGG AAAATTAAGT ATATGTTAGT TTTGAACGTT
TGAACTGAAC AATTCTCTTT TCGGCTAGGC TTTATTGATT TGCAATGTGC TGTGTAATTA AGAGGCCTCT CTACAAAGTA CTGATAATGA ACATGTAAGC AATGCACTCA CTTCTAAGTT
ACATTCATAT CTGATCTTAT TTGATTTTCA CTAGGCATAG GGAGGTAGGA GCTAATAATA CGTTTATTTT ACTAGAAGTT AACTGGAATT CAGATTATAT AACTCTTTTC AGGTTACAAA
GAACATAAAT AATCTGGTTT TCTGATGTTA TTTCAAGTAC TACAGCTGCT TCTAATCTTA GTTGACAGTG ATTTTGCCCT GTAGTGTAGC ACAGTGTTCT GTGGGTCACA CGCCGGCCTC
AGCACAGCAC TTTGAGTTTT GGTACTACGT GTATCCACAT TTTACACATG ACAAGAATGA GGCATGGCAC GGCCTGCTTC CTGGCAAATT TATTCAATGG TACACTGGGC TTTGGTGGCA
GAGCTCATGT CTCCACTTCA TAGCTATGAT TCTTAAACAT CACACTGCAT TAGAGGTTGA &Agr;&Tgr;&Agr;&Agr;&Tgr;&Agr;&Agr;&Agr;&Agr;&Tgr; TTCATGTTGA GCAGAAATAT TCATTGTTTA CAAGTGTAAA TGAGTCCCAG
CCATGTGTTG CACTGTTCAA GCCCCAAGGG AGAGAGCAGG GAAACAAGTC TTTACCCTTT GATATTTTGC ATTCTAGTGG GAGAGATGAC AATAAGCAAA TGAGCAGAAA GATATACAAC
ATCAGGAAAT CATGGGTGTT GTGAGAAGCA GAGAAGTCAG GGCAAGTCAC TCTGGGGCTG ACACTTGAGC AGAGACATGA AGGAAATAAG AATGATATTG ACTGGGAGCA GTATTTCCCA
GGCAAACTGA GTGGGCCTGG CAAGTTGGAT TAAAAAGCGG GTTTTCTCAG CACTACTCAT
GTGTGTGTGT GTGGGGGGGG GGGGCGG<
GGGGGTGGGA AGGGGGACTA CCATCTGCAT
GTAGGATGTC TAGCAGTATC CTGTCCTCCC TACTCACTAG GTGCTAGGAG CACTCCCCCA GTCTTGACAA CCAAAAATGT CTCTAAACTT TGCCACATGT CACCTAGTAG ACAAACTCCT
GGTTAAGAAG CTCGGGTTGA AAAAAATAAA CAAGTAGTGC TGGGGAGTAG AGGCCAAGAA GTAGGTAATG GGCTCAGAAG AGGAGCCACA AACAAGGTTG TGCAGGCGCC TGTAGGCTGT
GGTGTGAATT CTAGCCAAGG AGTAACAGTG ATCTGTCACA GGCTTTTAAA AGATTGCTCT GGCTGCTATG TGGAAAGCAG AATGAAGGGA GCAACAGTAA AAGCAGGGAG CCCAGCCAGG
AAGCTGTTAC ACAGTCCAGG CAAGAGGTAG TGGAGTGGGC TGGGTGGGAA CAGAAAAGGG AGTGACAAAC CATTGTCTCC TGAATATATT CTGAAGGAAG TTGCTGAAGG ATTCTATGTT
GTGTGAGAGA AAGAGAAGAA TTGGCTGGGT GTAGTAGCTC ATGCCAAGGA GGAGGCCAAG GAGAGCAGAT TCCTGAGCTC AGGAGTTCAA GACCAGCCTG GGCAACACAG CAAAACCCCT
TCTCTACAAA AAATACAAAA ATTAGCTGGG TGTGGTGGCA TGCACCTGTG ATCCTAGCTA CTCGGGAGGC TGAGGTGGAG GGTATTGCTT GAGCCCAGGA AGTTGAGGCT GCAGTGAGCC
936 996 1056 1116 1176 1236 1296 1356 1416 1476 1536 1596 1656 1716
1776 1836 1896 1956 2016 2076 2136 2196 2256 2316 2376 2436 2496 2556 2616 2676 2736
2796
JA
4/44
ATGACTGTGC CACTGTACTT CAGCCTAGGT GACAGAGCAA GACCCTGTCT CCCCTGACCC CCTGAAAAAG AGAAGAGTTA AAGTTGACTT TGTTCTTTAT TTTAATTTTA TTGGCCTGAG
CAGTGGGGTA ATTGGCAATG CCATTTCTGA GATGGTGAAG GCAGAGGAAA GAGCAGTTTG GGGTAAATCA AGGATCTGCA TTTGGGACAT GTTAAGTTTG AGATTCCAGT CAGGCTTCCA
AGTGGTGAGG CCACATAGGC AGTTCAGTGT AAGAATTCAG GACCAAGGCT GGGCACGGTG GCTCACTTCT GTAATCCCAG CACTTTGGTG GCTGAGGCAG GTAGATCATT TGAGGTCAGG
AGTTTGAGAC AAGCTTGGCC AACATGGTGA AACCCCATGT CTACTAAAAA TACAAAAATT AGCCTGGTGT GGTGGCGCAC GCCTATAGTC CCAGGTTTTC AGGAG-GCTTa GGTAGGAGAA
TCCCTTGAAC CCAGGAGGTG CAGGTTGCAG TGAGCTGAGA TTGTGCCACT GCACTCCAGC CTGGGTGATA GAGTGAGACT CTGTCTCAAA AAAAAAAAAA AAAAAAAAAA AAAAAACTGA
AGGAATTATT CCTCAGGATT TGGGTCTAAT TTGCCCTGAG CACCAACTCC TGAGTTCAAC TACCATGGCT AGACACACCT TAACATTTTC TAGAATCCAC CAGCTTTAGT GGAGTCTGTC
TAATCATGAG TATTGGAATA GGATCTGGGG GCAGTGAGGG GGTGGCAGCC ACGTGTGGCA GAGAAAAGCA CACAAGGAAA GAGCACCCAG GACTGTCATA TGGAAGAAAG ACAGGACTGC
AACTCACCCT TCACAAAATG AGGACCAGAC ACAGCTGATG GTATGAGTTG ATGCAGGTGT GTGGAGCCTC AACATCCTGC TCCCCTCCTA CTACACATGG TTAAGGCCTG TTGCTCTGTC
TCCAG GT TCA CAC TCT CTG CAC TAC CTC TTC ATG GGT GCC TCA GAG Arg Ser His Ser Leu His. Tyr Leu Phe Met GIy Ala Ser GIu
30 35
CAG GAC CTT GGT CTT TCC TTG TTT GAA GCT TTG GGC TAC GTG GAT GAC
Gin Asp Leu GIy Leu Ser Leu Phe GIu AIa Leu GIy Tyr VaI Asp Aso
40 45 50 55
CAG CTG TTC GTG TTC TAT GAT CAT GAG AGT CGC CGT GTG GAG CCC CGA Gin Leu Phe VaI Phe Tyr Asp His GIu Ser Arg Arg VaI GIu Pro Arg
60 65 70
ACT CCA TGG GTT TCC AGT AGA ATT TCA AGC CAG ATG TGG CTG CAG CTG Thr Pro Trp VaI Ser Ser Arg He Ser Ser Gin Met Trp Leu Gin Leu
75 80 35
AGT CAG AGT CTG AAA GGG TGG GAT CAC ATG TTC ACT GTT GAC TTC TGG Ser GIn Ser Leu Lys GIy Trp Asp Kis Mec ?he Thr VaI Asp Phe Trp
90 ' 95 100
ACT ATT ATG GAA AAT CAC AAC CAC AGC AAG G GTATGTGGAG AGGGGGCCTC Thr Ha Mat CIu Acn His Asn His Ser Lys
105. HO
ACCTTCCTGA GGTTGTCAGA GCTTTTCATC TTTTCATGCA TCTTGAAGGA AACAGCTGGA AGTCTGAGGT CTTGTGGGAG CAGGGAAGAG GGAAGGAATT TGCTTCCTGA C-ATCATTTGG
TCCTTGGGGA TGGTGGAAAT AGGGACCTAT TCCTTTGGTT GCAGTTAACA AGGCTGGGGA
TTTTTCCAG AG TCC CAC ACC CTG CAG GTC ATC CTG GGC TGT GAA ATG GIu Ser His Thr Leu Gin VaI He Leu GIy Cys GIu Met
3 03 6 3096 3156 3 216 3 27 6 3 336
3 396 34 56
3516 3 576 -3636 3 696 3756 3 802
4105 4165 4 2 25 4 2 72
115 120 125
CAA GAA GAC AAC AGT ACC GAG GGC TAC TGG AAG TAC GGG TAT GAT GGG
Gin GIu Asp Asn Ser Thr GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy
130 135 140
CAG GAC CAC CTT GAA TTC TGC CCT GAC ACA CTG GAT TGG AGA GCA GCA Gin Asp His Leu GIu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala
145 150 ' 155
GAA CCC AGG GCC TGG CCC ACC AAG CTG GAG TGG GAA AGG CAC AAG ATT GIu Pro Arg Ala Trp Pro Thr Lys Leu GIu Trp GIu Arg His Lys lie
160 165 170
CGG GCC AGG CAG AAC AGG GCC TAC CTG GAG AGG GAC TGC CCT GCA CAG
Arg Ala Arg Gin Asn Arg Ala Tyr Leu GIu Arg Asp Cys Pro Ala Gin
175 180 185 190
CTG CAG CAG TTG CTG GAG CTG GGG AGA GGT GTT TTG GAC CAA CAA G Leu GIn Gin Leu Leu GIu Leu GIy Arg GIy VaI Leu Asp Gin Gin
195 200 205
G1TATGGTGGA AACACACTTC TGCCCCTATA CTCTAGTGGC AGAGTGGAGG AGGTTGCAGG
GCACGGAATC CCTGGTTGGA GTTTCAGAGG TGGCTGAGGC TGTGTGCCTC TCCAAATTCT GGGAAGGGAC TTTCTCAATC CTAGAGTCTC TACCTTATAA TTGAGATGTA TGAGACAGCC
ACAAGTCATG GGTTTAATTT CTTTTCTCCA TGCATATGGC TCAAAGGGAA GTGTCTATGG CCCTTGCTTT TTATTTAACC AATAATCTTT TGTATATTTA TACCTGTTAA AAATTCAGAA
ATGTCAAGGC CGGGCACGGT GGCTCACCCC TGTAATCCCA GCACTTTGGG AGGCCGAGGC GGGTGGTCAC AAGGTCAGGA GTTTGAGACC AGCCTGACCA ACATGGTGAA ACCCGTCTCT
AAAAAAATAC AAAAATTAGC TGGTCACAGT CATGCGCACC TGTAGTCCCA GCTAATTGGA AGGCTGAGGC AGGAGCATCG CTTGAACCTG GGAAGCGGAA GTTGCACTGA GCCAAGATCG
CGCCACTGCA CTCCAGCCTA GGCAGCAGAG TGAGACTCCA TCTTAAAAAA AAAAAAAAAA AAAAAAAGAG AATTCAGAGA TCTCAGCTAT CATATGAATA CCAGGACAAA ATATCAAGTG
AGGCCACTTA TCAGAGTAGA AGAATCCTTT AGGTTAAAAG TTTCTTTCAT AGAACATAGC AATAATCACT GAAGCTACCT ATCTTACAAG TCCGCTTCTT ATAACAATGC CTCCTAGGTT
GACCCAGGTG AAACTGACCA TCTGTATTCA ATCATTTTCA ATGCACATAA AGGGCAATTT TATCTATCAG AACAAAGAAC ATGGGTAACA GATATGTATA TTTACATGTG AGGAGAACAA
GCTGATCTGA CTGCTCTCCA AGTGACACTG TGTTAGAGTC CAATCTTAGG ACACAAAATG GTGTCTCTCC TGTAGCTTGT TTTTTTCTGA AAAGGGTATT TCCTTCCTCC AACCTATAGA
AGGAAGTGAA AGTTCCAGTC TTCCTGGCAA GGGTAAACAG ATCCCCTCTC CTCATCCTTC CTCTTTCCTG TCAAG TG CCT CCT TTG GTG AAG GTG ACA CAT CAT GTG ACC
VaI Pro Pro Leu VaI Lys VaI Thr His His VaI Thr
210 215
TCT TCA GTG ACC ACT CTA CGG TGT CGG GCC TTG AAC TAC TAC CCC CAG
Ser Ser Vai Thr Thr Leu Arg Cys Arg AIa Leu Asn Tyr Tyr Pro GIn
4320 4363 4416 4464 4510
4570 4630 • 4690 4750 4810 4370 4930 4990 5050 5110 5170 5230
5290 5350 5410 5470 5530 5590 5640
6/44
2 &Tgr;1
225
230
AAC ATC ACC ATG AAG TGG CTG AAG GAT AAG CAG CCA ATG GAT GCC AAG 57 3 6
Asn He Thr Met Lys Trp Leu Lys Asp Lys Gin Pro Met Asp Ala Lys 235 240 245
GAG TTC GAA CCT AAA GAC GTA TTG CCC .AAT GGG GAT GGG ACC TAC CAG 5734
Glu Phe Glu Pro Lys Asp VaI Leu Pro Asn GIy Asp GIy Thr Tyr Gin
250 255 260 265
GGC TGG ATA ACC TTG GCT GTA CCC CCT GGG GAA GAG CAG AGA TAT ACG 53 3 2
GIy Trp He Thr Leu Ala VaI Pro Pro GIv Giu Glu Gin Arg Tyr Thr
270 275 230
TGC CAG GTG GAG CAC CCA GGC CTG GAT CAG CCC CTC ATT GTG ATC TGG G 5331
Cys Gin VaI Glu His Pro GIy Leu Asp Gin Pro Leu He VaI He Trp
2S5 290 295 '
GTATGTGACT GATGAGAGCC AGGAGCTGAG AAAATCTATT GGGGGTTGAG AGGAGTGCCT 5941
GAGGAGGTAA TTATGGCAGT GAGATGAGGA TCTGCTCTTT GTTAGGGGGT GGGCTGAGGG 6001
TGGCAATCAA AGGCTTTAAC TTGCTTTTTC TGTTTTAG AG CCC TCA CCG TCT 6053
Glu Pro Ser Pro Ser 300
GGC ACC CTA GTC ATT GGA GTC ATC AGT GGA ATT GCT GTT TTT GTC GTC . 6101
GIy Thr Leu VaI He GIy VaI He Ser GIy He Ala VaI Phe VaI VaI
305 310 315
ATC TTG TTC ATT GGA ATT TTG TTC ATA ATA TTA AGG AAG AGG CAG GGT 6149
He Leu Phe He GIy He Leu Phe He He Leu Arg Lys Arg Gin GIy
320 325 330
TCA A GTGAGTAGGA ACAAGGGGGA AGTCTCTTAG TACCTCTGCC CCAGGGCACA 62 03
GTGGGAAGAG GGGCAGAGGG GATCTGGCAT CCATGGGAAG CATTTTTCTC ATTTATATTC 6263
TTTGGGGACA CCAGCAGCTC CCTGGGAGAC AGAAAATAAT GGTTCTCCCC AGAATGAAAG 63 2 3
TCTCTAATTC AACAAACATC TTCAGAGCAC CTACTATTTT GCAAGAGCTG TTTAAGGTAG 633 3
TACAGGGGCT TTGAGGTTGA GAAGTCACTG TGGCTATTCT CAGAACCCAA ATCTGGTAGG 64 4 3
GAATGAAATT GATAGCAAGT AAATGTAGTT AAAGAAGACC CCATGAGGTC CTAAAGCAGG 6 50 3
CAGGAAGCAA ATGCTTAGGG TGTCAAAGGä AAGAATGATC ACATTCAGCT GGGGATCAAG 6563
ATAGCCTTCT GGATCTTGAA GGAGAAGCTG GATTCCATTA GGTGAGGTTG AAGATGATGG 6 62 3
GAGGTCTACA CAGACGGAGC AACCATGCCA AGTAGGAGAG TATAAGGCAT ACTGGGAGAT 6 63 3
TAGAAATAAT TACTGTACCT TAACCCTGAG TTTGCGTAGC TATCACTCAC CAATTATGCA 674 3
TTTCTACCCC CTGAACATCT GTGGTGTAGG GAAAAGAGAA TCAGAAAGAA GCCAGCTCAT 53 0 3
ACAGAGTCCA AGGGTCTTTT GGGATATTGG GTTATGATCA CTGGGGTGTC ATTGAAGGAT 63 6 3
CCTAAGAAAG GAGGACCACG ATCTCCCTTA TATGGTGAAT GTGTTGTTAA GAAGTTAGAT 69 2 3
GAGAGGTGAG GAGACCAGTT AGAAAGCCAA TAAGCATTTC CAGATGAGAG ATAATGGTTC 69 8 3
7/44
TTGAAATCCA ATAGTGCCCA GGTCTAAATT GAGATGGGTG AATGAGGAAA ATAAGGAAGA
GAGAAGAGGC AAGATGGTGC CTAGGTTTGT GATGCCTCTT TCCTGGGTCT CTTGTCTCCA
CAG GA GGA GCC ATG GGG CAC TAC GTC TTA GCT GAA CGT GAG
Arg GIy Ala Met GIy His Tyr VaI Leu Ala GIu Arg GIu
340 " 345
TGACACGCAG CCTGCAGACT CACTGTGGGA AGGAGACAAA ACTAGAGACT CAAAGAGGGA
GTGCATTTAT GAGCTCTTCA TGTTTCAGGA GAGAGTTGAA CCTAAACATA GAAATTGCCT
GACGAACTCC TTGATTTTAG CCTTCTCTGT TCATTTCCTC AAAAAGATTT CCCCATTTAG
GTTTCTGAGT TCCTGCATGC CGGTGATCCC TAGCTGTGAC CTCTCCCCTG GAACTGTCTC
TCATGAACCT CAAGCTGCAT CTAGAGGCTT CCTTCATTTC CTCCGTCACC TCAGAGACAT
ACACCTATGT CATTTCATTT CCTATTTTTG GAAGAGGACT CCTTAAATTT GGGGGACTTA
catgattcat tttaacatct gagaaaagct ttgaaccctg ggacgtggct agtcataacc
ttaccagatt tttacacatg tatctatgca ttttctggac ccgttcaact tttcctttga
atcctctctc tgtgttaccc agtaactcat ctgtcaccaa gccttgggga ttcttccatc
tgattgtgat gtgagttgca cagctatgaa ggctgtacac tgcacgaatg gaagaggcac
ctgtcccaga aaaagcatca tggctatctg tgggtagtat gatgggtgtt tttagcaggt
aggaggcaaa tatcttgaaa ggggttgtga agaggtgttt tttctaattg gcatgaaggt
gtcatacaga tttgcaaagt ttaatggtgc cttcatttgg gatgctactc tagtattcca
GACCTGAAGA ATCACAATAA TTTTCTACCT GGTCTCTCCT TGTTCTGATA ATGAAAATTA
tgataaggat gataaaagca cttacttcgt gtccgactct tctgagcacc tacttacatg
cattactgca tgcacttctt acaataattc tatgagatag gtactattat ccccatttct
tttttaaatg aagaaagtga agtaggccgg gcacggtggc tcacgcctgt aatcccagca
ctttgggagg ccaaagcggg tggatcacga ggtcaggaga tcgagaccat cctggctaac
ATGGTGAAAC CCCATCTCTA ATAAAAATAC AAAAAATTAG CTGGGCGTGG TGGCAGACGC
CTGTAGTCCC AGCTACTCGG AAGGCTGAGG CAGGAGAATG GCATGAACCC AGGAGGCAGA
GCTTGCAGTG AGCCGAGTTT GCGCCACTGC ACTCCAGCCT AGGTGACAGA GTGAGACTCC
ATCTCAAAAA AATAAAAATA AAAATAAAAA AATGAAAAAA AAAAGAAAGT GAAGTATAGA
GTATCTCATA GTTTGTCAGT GATAGAAACA GGTTTCAAAC TCAGTCAATC TGACCGTTTG
ATACATCTCA GACACCACTA CATTCAGTAG TTTAGATGCC TAGAATAAAT AGAGAAGGAA
GGAGATGGCT CTTCTCTTGT CTCATTGTGT TTCTTCTGAG TGAGCTTGAA TCACATGAAG
GGGAACAGCA GAAAACAACC AACTGATCCT CAGCTGTCAT GTTTCCTTTA AAAGTCCCTG
AAGGAAGGTC CTGGAATGTG ACTCCCTTGC TCCTCTGTTG CTCTCTTTGG CATTCATTTC
TTTGGACCCT ACGCAAGGAC TGTAATTGGT GGGGACAGCT AGTGGCCCTG CTGGGCTTCA
7043 7103
7144
7204 7264 7324 7334 7444 7504 7564 7624 7684 • 7744 7304
7864 7924 7984 8044 8104 3164 8224 8234 8344 8404 8464
3524 3534 3644 3704 3764 3824
8/44
* 4 * I
CACACGGTGT CCTCCCTAGG CCAGTGCCTC TGGAGTCAGA ACTCTGGTGG TATTTCCCTC AATGAAGTGG AGTAAGCTCT CTCATTTTGA GATGGTATAA TGGAAGCCAC CAAGTGGCTT
AGAGGATGCC CAGGTCCTTC CATGGAGCCA CTGGGGTTCC GGTGCACATT AAAAAAAAAA TCTAACCAGG ACATTCAGGA ATTGCTAGAT TCTGGGAAAT CAGTTCACCA TGTTCAAAAG
AGTCTTTTTT TTTTTTTTGA GACTCTATTG CCCAGGCTGG AGTGCAATGG CATGATCTCG GCTCACTGTA ACCTCTGCCT CCCAGGTTCA AGCGATTCTC CTGTCTCAGC CTCCCAAGTA
GCTGGGATTA CAGGCGTGCA CCACCATGCC CGGCTAATTT TTGTATTTTT AGTAGAGACA GGGTTTCACC ATGTTGGCCA GGCTGGTCTC GAACTCTCCT GACCTCGTGA TCCGCCTGCC
TCGGCCTCCC AAAGTGCTGA GATTACAGGT GTGAGCCACC CTGCCCAGCC GTCAAAAGAG TCTTAATATA TATATCCAGA TGGCATGTGT TTACTTTATG TTACTACATG CACTTGGCTG
CATAAATGTG GTACAAGCAT TCTGTCTTGA AGGGCAGGTG CTTCAGGATA CCATATACAG CTCAGAAGTT TCTTCTTTAG GCATTAAATT TTAGCAAAGA TATCTCATCT CTTCTTTTAA
ACCATTTTCT TTTTTTGTGG TTAGAAAAGT TATGTAGAAA AAAGTAAATG TGATTTACGC TCATTGTAGA AAAGCTATAA AATGAATACA ATTAAAGCTG TTATTTAATT AGCCAGTGAA
AAACTATTAA CAACTTGTCT ATTACCTGTT AGTATTATTG TTGCäTTAAä AATGCATATA CTTTAATAAA TGTATATTGT ATTGTATACT GCATGATTTT ATTGAAGTTC TTGTTCATCT
TGTGTATATA CTTAATCGCT TTGTCATTTT GGAGACATTT ATTTTGCTTC TAATTTCTTT ACATTTTGTC TTACGGAATA TTTTCATTCA ACTGTGGTAG CCGAATTAAT CGTGTTTCTT
CACTCTAGGG ACATTGTCGT CTAAGTTGTA AGACATTGGT TATTTTACCA GCAAACCATT CTGAAAGCAT ATGACAAATT ATTTCTCTCT TAATATCTTA CTATACTGAA AGCAGACTGC
TATAAGGCTT CACTTACTCT TCTACCTCAT AAGGAATATG TTACAATTAA TTTATTAGGT AAGCATTTGT TTTATATTGG TTTTATTTCA CCTGGGCTGA GATTTCAAGA AACACCCCAG
TCTTCACAGT AACACATTTC ACTAACACAT TTACTAAACA TCäGCäACTG TGGCCTGTTA ATTTTTTTAA TAGAAATTTT AAGTCCTCAT TTTCTTTCGG TGTTTTTTAA GCTTAATTTT
TCTGGCTTTA TTCATAAATT CTTAAGGTCA ACTACATTTG AAAAATCAAA GACCTGCATT TTAAATTCTT ATTCACCTCT GGCAAAACCA TTCACAAACC ATGGTAGTAA AGAGAAGGGT
GACACCTGGT GGCCATAGGT AAATGTACCA CGGTGGTCCG GTGACCAGAG ATGCAGCGCT GAGGGTTTTC CTGAAGGTAA AGGAATAAAG AATGGGTGGA GGGGCGTGCA CTGGAAATCA
CTTGTAGAGA AAAGCCCCTG AAAATTTGAG AAAACAAACA AGAAACTACT TACCAGCTAT TTGAATTGCT GGAATCACAG GCCATTGCTG AGCTGCCTGA ACTGGGAACA CAACAGAAGG
AAAACAAACC ACTCTGATA-A TCATTGAGTC AAGTACAGCA GGTGATTGAG GACTGCTGAG AGGTACAGGC CAAAATTCTT ATGTTGTATT ATAATAATGT CATCTTATAA TACTGTCAGT
8884 3944 9004 9004 9124 9184 9244 9304
9364 9424 9434 9544 9604 . 9664 9724 9734 9844
9904 9964 10024 10084 10144 10204 10264 10324 10384 10444
10504 10554 10524 10634
JDEV EP- Q 95&Lgr;.6&Ogr;2 T1
ATTTTATAAA ACATTCTTCA CAAACTCACA CACATTTAAA AACAAAACAC TGTCTCTAAA IOS04
ATCCCCAAAT TTTTCATAAA C- 10825
(2) INFORMATION FOR SEQ ID NO:2:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 348 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(Xi) SEQUENCE DESCRIPTION: SEQ ID NO:2:
Met GIy Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu Gin
15 10 15
Thr Ala VaI Leu Gin GIy Arg Leu Leu Arg Ser His Ser Leu His Tyr
20 25 30
Leu Phe Met GIy AIa Ser GIu Gin Asp Leu GIy Leu Ser Leu Phe GIu
35 40 45
AIa Leu GIy Tyr VaI Asp Asp Gin Leu Phe VaI Phe Tyr Asp His GIu
50 55 60
Ser Arg Arg VaI GIu Pro Arg Thr Pro Trp VaI Ser Ser Arg He Ser
65 70 75 80
Ser GIn Met Trp Leu GIn Leu Ser Gin Ser Leu Lys GIy Trp Asp His
85 90 95
Met Phe Thr VaI Asp Phe Trp Thr He Met GIu Asn His Asn His Ser
100 105 HO
Lys GIu Ser His Thr Leu Gin VaI He Leu GIy Cys GIu Met Gin GIu
115 120 125
Asp Asn Ser Thr GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy Gin Asp
130 135 140
His Leu GIu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala GIu Pro
145 150 155 160
Arg Ala Trp Pro Thr Lys Leu GIu Trp GIu Arg His Lys He Arg Ala
165 170 175
Arg Gin Asn Arg Ala Tyr Leu GIu Arg Asp Cys Pro Ala Gin Leu Gin
180 185 190
Gin Leu Leu Glu Leu GIy Arg GIy VaI Leu Asp Gin Gin VaI Pro Pro
195 2&Pgr;0 205
Leu VaI Lys VaI Thr His His VaI Thr Ser Ser VaI Thr Thr Leu Arg
210 215 220
Cys Arg AIa Leu Asn Tyr Tyr Pro GIn Asn He Thr Met Lys Trp Leu
225 230 235 · 240
Lys Asp Lys GIn Pro Met Asp Ala Lys GIu Phe GIu Pro Lys Asp VaI
245 250 * 255
10/44
Leu Pro Asn GIy Asp GIy Thr Tyr Gin GIy Trp He Thr Leu Ala VaI
260 265 270
Pro Pro GIy GIu GIu GIn Arg Tyr Thr Cys Gin VaI GIu His Pro GIy
' 230 285
Leu Asp Gin Pro Leu He VaI He Trp GIu Pro Ser Pro Ser GIy Thr
90 295 300
Leu VaI He Gly VaI He Ser GIy He Ala VaI Phe VaI VaI He Leu
310 315 320
Phe He Gly He Leu Phe He He Leu Arg Lys Arg Gin GIy Ser Arg
325 330 335
Gly AIa Met Gly His Tyr VaI Leu Ala GIu Arg GIu
340 345
(2) INFORMATION FOR SEQ ID NO:3:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 10825 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: join(361..436, 3762..4025, 4235..4510, 5606..5881,
6040. .6153, 7107. .7147)
(D) OTHER INFORMATION: /product= "Hereditary Hemochromatosis
(HH) protein containing the 24dl mutation"
/note= "Hereditary Hemochromatosis (HH) gene 24dl allele"
(ix) FEATURE:
(A) NAME/KEY: -
(B) LOCATION: 140..7319
(D) OTHER INFORMATION: /note= "start and stop positions for
24dl allele CDNA (SEQ ID NO:10)"
(ix) FEATURE:
(A) NAME/KEY: -
(B) LOCATION: 3852..3391
(D) OTHER INFORMATION: /note= "start and stop positions for
genomic sequence surrounding variant for 24d2(C) allele (SEQ ID NO:41)"
(ix) FEATURE:
(A) NAME/KEY: -
(B) LOCATION: 5507..6023
(D) OTHER INFORMATION: /note= "start and stop positions for
genomic sequence surrounding variant for 24dl(A) allele (SEQ ID NO:21)"
(ix) FEATURE:
(A) NAME/KEY: allele
(B) LOCATION: replace(5334, "a")
(D) OTHER INFORMATION: /phenotype= "Hereditary Hemochromatosis
, ·· ItIl
11/44
DE/EP O 954602&Tgr;1
(HH) "
/label= 24dl
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:3:
TCTAAGGTTG AGATAAAATT TTTAAATGTA TGATTGAATT TTGAAAATCA TAAATATTTA 6 0
AATATCTAAA GTTCAGATCA GAACATTGCG AAGCTACTTT CCCCAATCAA CAACACCCCT 120
TCAGGATTTA AAAACCAAGG GGGACACTCG ATCACCTAGT GTTTCACAAG CAGGTACCTT 13 0
CTGCTGTAGG AGAGAGAGAA CTAAAGTTCT GAAAGACCTG TTGCTTTTCA CCAGGAAGTT 240
TTACTGGGCA TCTCCTGAGC CTAGGCAATA GCTGTAGGGT GACTTCTGGA GCCATCCCCG 3 00
TTTCCCCGCC CCCCAAAAGA AGCGGAGATT TAACGGGGAC GTGCGGCCAG AGCTGGGGAA 3 60
ATG GGC CCG CGA GCC AGG CCG GCG CTT CTC CTC CTG ATG CTT TTG CAG 403
Met GIy Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu Gin
15 10 15
ACC GCG GTC CTG CAG GGG CGC TTG CTG C GTGAGTCCGA GGGCTGCGGG 456
Thr Ala VaI Leu Gin GIy Arg Leu Leu
20 25
CGAACTAGGG GCGCGGCGGG GGTGGAAAAA TCGAAACTAG CTTTTTCTTT GCGCTTGGGA . 516
GTTTGCTAAC TTTGGAGGAC CTGCTCAACC CTATCCGCAA GCCCCTCTCC CTACTTTCTG 57 6
CGTCCAGACC CCGTGAGGGA GTGCCTACCA CTGAACTGCA GATAGGGGTC CCTCGCCCCA 63 6
GGACCTGCCC CCTCCCCCGG CTGTCCCGGC TCTGCGGAGT GACTTTTGGA ACCGCCCACT 69 6
CCCTTCCCCC AACTAGAATG CTTTTAAATA AATCTCGTAG TTCCTCACTT GAGCTGAGCT 756
AAGCCTGGGG CTCCTTGAAC CTGGAACTCG GGTTTATTTC CAATGTCAGC TGTGCAGTTT 816
TTTCCCCAGT CATCTCCAAA CAGGAAGTTC TTCCCTGAGT GCTTGCCGAG AAGGCTGAGC 876
AAACCCACAG CAGGATCCGC ACGGGGTTTC CACCTCAGAA CGAATGCGTT GGGCGGTGGG 93 6
GGCGCGAAAG AGTGGCGTTG GGGATCTGAA TTCTTCACCA TTCCACCCAC TTTTGGTGAG 996
ACCTGGGGTG GAGGTCTCTA GGGTGGGAGG CTCCTGAGAG AGGCCTACCT CGGGCCTTTC 10 56
CCCACTCTTG GCAATTGTTC TTTTGCCTGG AAAATTAAGT ATATGTTAGT TTTGAACGTT 1116
TGAACTGAAC AATTCTCTTT TCGGCTAGGC TTTATTGATT TGCAATGTGC TGTGTAATTA 117 6
AGAGGCCTCT CTACAAAGTA CTGATAATGA ACATGTAAGC AATGCACTCA CTTCTAAGTT 12 3 6
ACATTCATAT CTGATCTTAT TTGATTTTCA CTAGGCATAG GGAGGTAGGA GCTAATAATA 12 96
CGTTTATTTT ACTAGAAGTT AACTGGAATT CAGATTATAT AACTCTTTTC AGGTTACAAA 13 5 6
GAACATAAAT AATCTGGTTT TCTGATGTTA TTTCAAGTAC TACAGCTGCT TCTAATCTTA 1416
GTTGACAGTG ATTTTGCCCT GTAGTGTAGC ACAGTGTTCT GTGGGTCACA CGCCGGCCTC 14 7 6
AGCACAGCAC TTTGAGTTTT GGTACTACGT GTATCCACAT TTTACACATG ACAAGAATGA 153 6
GGCATGGCAC GGCCTGCTTC CTGGCAAATT TATTCAATGG TACACTGGGC TTTGGTGGCA 159 6
D£i.E:e:0:.,95.f.502T1
GAGCTCATGT CTCCACTTCA TAGCTATGAT TCTTA-AACAT CACACTGCAT TAGAGGTTGA 1656
ATAATAAAAT TTCATGTTGA GCAGAAATAT TCATTGTTTA CAAGTGTAAA TGAGTCCCAG 1716
CCATGTGTTG CACTGTTCAA GCCCCAAGGG AGAGAGCAGG GAAACAAGTC TTTACCCTTT 17 7 6
GATATTTTGC ATTCTAGTGG GAGAGATGAC AATAAGCAAA TGAGCAGAA-A GATATACAAC 18 3 6
ATCAGGAAAT CATGGGTGTT GTGAGAAGCA GAGAAGTCAG GGCAAGTCAC TCTGGGGCTG 1896
ACACTTGAGC AGAGACATGA AGGAAATAAG AATGATATTG ACTGGGAGCA GTATTTCCCA 19 56
GGCAAACTGA GTGGGCCTGG CAAGTTGGAT TAAAAAGCGG GTTTTCTCAG CACTACTCAT 2 016
GTGTGTGTGT GTGGGGGGGG GGGGCGGCGT GGGGGTGGGA AGGGGGACTA CCATCTGCAT 2 07 6
GTAGGATGTC TAGCAGTATC CTGTCCTCCC TACTCACTAG GTGCTAGGAG CACTCCCCCA 213 6
GTCTTGACAA CCAAAAATGT CTCTAAACTT TGCCACATGT CACCTAGTAG ACAAACTCCT 219 6
GGTTAAGAAG CTCGGGTTGA AAAAAATAAA CAAGTAGTGC TGGGGAGTAG AGGCCAAGAA 2 2 56
GTAGGTAATG GGCTCAGAAG AGGAGCCACA AACAAGGTTG TGCAGGCGCC TGTAGGCTGT 2316
GGTGTGAATT CTAGCCAAGG AGTAACAGTG ATCTGTCACA GGCTTTTAAA AGATTGCTCT 2376
GGCTGCTATG TGGAAAGCAG AATGAAGGGA GCAACAGTAA AAGCAGGGAG CCCAGCCAGG . 243 6
AAGCTGTTAC ACAGTCCAGG CAAGAGGTAG TGGAGTGGGC TGGGTGGGAA CAGAAAAGGG 2496
AGTGACAAAC CATTGTCTCC TGAATATATT CTGAAGGAAG TTGCTGAAGG ATTCTATGTT 2556
GTGTGAGAGA AAGAGAAGAA TTGGCTGGGT GTAGTAGCTC ATGCCAAGGA GGAGGCCAAG 2 616
GAGAGCAGAT TCCTGAGCTC AGGAGTTCAA GACCAGCCTG GGCAACACAG CAAAACCCCT 2 676
TCTCTACAAA AAATACAAAA ATTAGCTGGG TGTGGTGGCA TGCACCTGTG ATCCTAGCTA 27 3 6
CTCGGGAGGC TGAGGTGGAG GGTATTGCTT GAGCCCAGGA AGTTGAGGCT GCAGTGAGCC 27 9 6
ATGACTGTGC CACTGTACTT CAGCCTAGGT GACAGAGCAA GACCCTGTCT CCCCTGACCC 23 56
CCTGAAAAAG AGAAGAGTTA AAGTTGACTT TGTTCTTTAT TTTAATTTTA TTGGCCTGAG 2916
CAGTGGGGTA ATTGGCAATG CCATTTCTGA GATGGTGAAG GCAGAGGAAA GAGCAGTTTG 29 7 6
GGGTAAATCA AGGATCTGCA TTTGGGACAT GTTäAGTTTG AGATTCCAGT CAGGCTTCCA 303 6
AGTGGTGAGG CCACATAGGC AGTTCAGTGT AAGAATTCAG GACCAAGGCT GGGCACGGTG 3 09 6
GCTCACTTCT GTAATCCCAG CACTTTGGTG GCTGAGGCAG GTAGATCATT TGAGGTCAGG 3156
AGTTTGAGAC AAGCTTGGCC AACATGGTGA AACCCCATGT CTACTAAAAA TACAAAAATT 3216
AGCCTGGTGT GGTGGCGCAC GCCTATAGTC CCAGGTTTTC AGGAGGCTTA GGTAGGAGAA 3 27 6
TCCCTTGAAC CCAGGAGGTG CAGGTTGCAG TGAGCTGAGA TTGTGCCACT GCACTCCAGC 33 3 6
CTGGGTGATA GAGTGAGACT CTGTCTCAAA AAAAAAAAAA AAAAAAAAAA AAAAAJiCTGA 3 3 96
AGGAATTATT CCTCAGGATT TGGGTCTAAT TTGCCCTGAG CACCAACTCC TGAGTTCA1AC 3 4 55
TACCATGGCT AGACACACCT TAACATTTTC TAGAATCCAC CAGCTTTAGT GGAGTCTGTC 3 516
TAATCATGAG TATTGGAATA GGATCTGGGG GCAGTGAGGG GGTGGCAGCC ACGTGTGGCA 3 576
GAGAAAAGCA CACAAGGAAA GAGCACCCAG GACTGTCATA TGGAAGAAAG ACAGGACTGC 3 63 6
AACTCACCCT TCACAAAATG AGGACCAGAC ACAGCTGATG GTATGAGTTG ATGCAGGTGT 3 69 6
GTGGAGCCTC AACATCCTGC TCCCCTCCTA CTACACATGG TTAAGGCCTG TTGCTCTGTC 3 756
TCCAG GT TCA CAC TCT CTG CAC TAC CTC TTC ATG GGT GCC TCA GAG 3 3 02
Arg Ser His Ser Leu His Tyr Leu Phe Met GIy Ala Ser GIu
30 35
CAG GAC CTT GGT CTT TCC TTG TTT GAA GCT TTG GGC TAC GTG GAT GAC 3350
Gin Asp Leu GIy Leu Ser Leu Phe GIu Ala Leu GIy Tyr VaI Asp Asp
40 45 50 55
CAG CTG TTC GTG TTC TAT GAT CAT GAG AGT CGC CGT GTG GAG CCC CGA 3 3 93
Gin Leu Phe VaI Phe Tyr Asp His GIu Ser Arg Arg VaI GIu Pro Arg
60 65 70
ACT CCA TGG GTT TCC AGT AGA ATT TCA AGC CAG ATG TGG CTG CAG CTG 3 94 6
Thr Pro Trp VaI Ser Ser Arg He Ser Ser Gin Met Trp Leu GIn Leu
75 80 85
AGT CAG AGT CTG AAA GGG TGG GAT CAC ATG TTC ACT GTT GAC TTC TGG 3 994
Ser Gin Ser Leu Lys GIy Trp Asp His Met Phe Thr VaI Asp Phe Trp
90 95 100
ACT ATT ATG GAA AAT CAC AAC CAC AGC AAG G GTATGTGGAG AGGGGGCCTC 4 04 5
Thr He Met GIu Asn His Asn His Ser Lys
105 110
ACCTTCCTGA GGTTGTCAGA GCTTTTCATC TTTTCATGCA TCTTGAAGGA AACAGCTGGA 4105
AGTCTGAGGT CTTGTGGGAG CAGGGAAGAG GGAAGGAATT TGCTTCCTGA GATCATTTGG 4165 TCCTTGGGGA TGGTGGAAAT AGGGACCTAT TCCTTTGGTT GCAGTTAACA AGGCTGGGGA 4225
TTTTTCCAG AG TCC CAC ACC CTG CAG GTC ATC CTG GGC TGT GAA ATG 4272 GIu Ser His Thr Leu Gin VaI He Leu GIy Cys GIu Met
115 120 125
CAA GAA GAC AAC AGT ACC GAG GGC TAC TGG AAG TAC GGG TAT GAT GGG 4320
Gin GIu Asp Asn Ser Thr GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy
130 135 140
CAG GAC CAC CTT GAA TTC TGC CCT GAC ACA CTG GAT TGG AGA GCA GCA 43 63
Gin Asp His Leu GIu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala AIa
145 150 155
GAA CCC AGG GCC TGG CCC ACC AAG CTG GAG TGG GAA AGG CAC AAG ATT 4416
GIu Pro Arg AIa Trp Pro Thr Lys Leu GIu Trp GIu Arg His Lys He
160 165 170
CGG GCC AGG CAG AAC AGG GCC TAC CTG GAG AGG GAC TGC CCT GCA CAG 44 6 4
Arg AIa Arg Gin Asn Arg AIa Tyr Leu GIu Arg Asp Cys Pro Ala GIn
175 130 135 190
CTG CAG CAG TTG CTG GAG CTG GGG AGA GGT GTT TTG GAC CAA CAA G 4 510
Leu Gin GIn Leu Leu GIu Leu GIy Arg GIy VaI Leu Asp Gin Gin
195 200 205
GTATGGTGGA AACACACTTC TGCCCCTATA CTCTAGTGGC AGAGTGGAGG AGGTTGCAGG 4 57 0
3A
Q:E:-/-E.P.4:95-A-G02T1
GCACGGAATC CCTGGTTGGA GTTTCAGAGG TGGCTGAGGC TGTGTGCCTC TCCAAATTCT GGGi1AGGGAC TTTCTCAATC CTAGAGTCTC TACCTTATAA TTGAGATGTA TGAGACAGCC
ACAAGTCATG GGTTTAATTT CTTTTCTCCA TGCATATGGC TCAAAGGGAA GTGTCTATGG
CCCTTGCTTT TTATTTAACC AATAATCTTT TGTATATTTA TACCTGTTAA AAATTCAGAA
ATGTCAAGGC CGGGCACGGT GGCTCACCCC TGTAATCCCA GCACTTTGGG AGGCCGAGGC
GGGTGGTCAC AAGGTCAGGA GTTTGAGACC AGCCTGACCA ACATGGTGAA ACCCGTCTCT
AAAAAAATAC AAAAATTAGC TGGTCACAGT CATGCGCACC TGTAGTCCCA GCTAATTGGA
AGGCTGAGGC AGGAGCATCG CTTGAACCTG GGAAGCGGAA GTTGCACTGA GCCAAGATCG
CGCCACTGCA CTCCAGCCTA GGCAGCAGAG TGAGACTCCA TCTTAAAAAA AAAAAAAAAA
AAAfAAAGAG AATTCAGAGA TCTCAGCTAT CATATGAATA CCAGGACAAA ATATCAAGTG AGGCCACTTA TCAGAGTAGA AGAATCCTTT AGGTTAAAAG TTTCTTTCAT AGAACATAGC
AATAATCACT GAAGCTACCT ATCTTACAAG TCCGCTTCTT ATAACAATGC CTCCTAGGTT
GACCCAGGTG AAACTGACCA TCTGTATTCA ATCATTTTCA ATGCACATAA AGGGCAATTT
TATCTATCAG AACAAAGAAC ATGGGTAACA GATATGTATA TTTACATGTG AGGAGAACAA
GCTGATCTGA CTGCTCTCCA AGTGACACTG TGTTAGAGTC CAATCTTAGG ACACAAAATG
GTGTCTCTCC TGTAGCTTGT TTTTTTCTGA AAAGGGTATT TCCTTCCTCC AACCTATAGA
aggaagtgaa agttccagtc ttcctggcaa gggtaaacag atcccctctc ctcatccttc
ctctttcctg tcaag tg cct cct ttg gtg aag gtg aca cat cat gtg acc
VaI Pro Pro Leu VaI Lys VaI Thr His His VaI Thr
210 215
TCT TCA GTG ACC ACT CTA CGG TGT CGG GCC TTG AAC TAC TAC.CCC CAG
Ser Ser VaI Thr Thr Leu Arg Cys Arg AIa Leu Asn Tyr Tyr Pro GIn
220 225 230
AAC ATC ACC ATG AAG TGG CTG AAG GAT AAG CAG CCA ATG GAT GCC AAG Asn He Thr Met Lys Trp Leu Lys Asp Lys GIn Pro Met Asp Ala Lys
235 240 245
GAG TTC GAA CCT AAA GAC GTA TTG CCC AAT GGG GAT GGG ACC TAC CAG GIu Phe GIu Pro Lys Asp VaI Leu Pro Asn GIy Asp GIy Thr Tyr GIn
250 255 260 265
GGC TGG ATA ACC TTG GCT GTA CCC CCT GGG GAA GAG CAG AGA TAT ACG GIy Trp He Thr Leu Ala VaI Pro Pro GIy GIu GIu GIn Arg Tyr Thr
270 275 280
TAC CAG GTG GAG CAC CCA GGC CTG GAT CAG CCC CTC ATT GTG ATC TGG G Tyr Gin VaI GIu His Pro GIy Leu Asp Gin Pro Leu He VaI He Trp
235 290 295
GTATGTGACT GATGAGAGCC AGGAGCTGAG AAAATCTATT GGGGGTTGAG AGGAGTGCCT GAGGAGGTAA TTATGGCAGT GAGATGAGGA TCTGCTCTTT GTTAGGGGGT GGGCTGAGGG
TGGCAATCAA AGGCTTTAAC TTGCTTTTTC TGTTTTAG AG CCC TCA CCG TCT
GIu Pro Ser Pro Ser
5688 5736 5784 5832 5381
32 .p.E/££..0.35.4 602 T1
15/44
300
GGC ACC CTA GTC ATT GGA 'GTC ATC AGT GGA ATT GCT GTT TTT GTC GTC 6101
GIy Thr Leu VaI lie GIy VaI lie Ser GIy lie Ala VaI Phe VaI VaI
305 310 315
ATC TTG TTC ATT GGA ATT TTG TTC ATA ATA TTA AGG AAG AGG CAG GGT 6149
lie Leu Phe lie GIy lie Leu Phe lie lie Leu Arg Lys Arg Gin GIy
320 325 330 ,
TCA A GTGAGTAGGA ACAAGGGGGA AGTCTCTTAG TACCTCTGCC CCAGGGCACA 62 03
GTGGGAAGAG GGGCAGAGGG GATCTGGCAT CCATGGGAAG CATTTTTCTC ATTTATATTC 62 63
TTTGGGGACA CCAGCAGCTC CCTGGGAGAC AGAAAATAAT GGTTCTCCCC AGAATGAAAG 63 23
TCTCTAATTC AACAAACATC TTCAGAGCAC CTACTATTTT GCAAGAGCTG TTTAAGGTAG 63 83
TACAGGGGCT TTGAGGTTGA GAAGTCACTG TGGCTATTCT CAGAACCCAA ATCTGGTAGG 64 43
GAATGAAATT GATAGCAAGT AAATGTAGTT AAAGAAGACC CCATGAGGTC CTAAAGCAGG 6503
CAGGAAGCAA ATGCTTAGGG TGTCAAAGGA AAGAATGATC ACATTCAGCT GGGGATCAAG 6563
ATAGCCTTCT GGATCTTGAA GGAGAAGCTG GATTCCATTA GGTGAGGTTG AAGATGATGG · 662 3
GAGGTCTACA CAGACGGAGC AACCATGCCA AGTAGGAGAG TATAAGGCAT ACTGGGAGAT 6683
TAGAAATAAT TACTGTACCT TAACCCTGAG TTTGCGTAGC TATCACTCAC CAATTATGCA 674 3
TTTCTACCCC CTGAACATCT GTGGTGTAGG GAAAAGAGAA TCAGAAAGAA GCCAGCTCAT 6803.
ACAGAGTCCA AGGGTCTTTT GGGATATTGG GTTATGATCA CTGGGGTGTC ATTGAAGGAT 6863
CCTAAGAAAG GAGGACCACG ATCTCCCTTA TATGGTGAAT GTGTTGTTAA GAAGTTAGAT 6923
GAGAGGTGAG GAGACCAGTT AGAAAGCCAA TAAGCATTTC CAGATGAGAG ATAATGGTTC 6983
TTGAAATCCA ATAGTGCCCA GGTCTAAATT GAGATGGGTG AATGAGGAAA ATAAGGAAGA 7043
GAGAAGAGGC AAGATGGTGC CTAGGTTTGT GATGCCTCTT TCCTGGGTCT CTTGTCTCCA 7103
CAG GA GGA GCC ATG GGG CAC TAC GTC TTA GCT GAA CGT GAG 7144 Arg GIy Ala Met GIy His Tyr VaI Leu Ala GIu Arg GIu
340 345
TGACACGCAG CCTGCAGACT CACTGTGGGA AGGAGACAAA ACTAGAGACT CAAAGAGGGA 72 04
GTGCATTTAT GAGCTCTTCA TGTTTCAGGA GAGAGTTGAA CCTAAACATA GAAATTGCCT 72 64
GACGAACTCC TTGATTTTAG CCTTCTCTGT TCATTTCCTC AAAAAGATTT CCCCATTTAG 7 3 24
GTTTCTGAGT TCCTGCATGC CGGTGATCCC TAGCTGTGAC CTCTCCCCTG GAACTGTCTC 7 334
TCATGAACCT CAAGCTGCAT CTAGAGGCTT CCTTCATTTC CTCCGTCACC TCAGAGACAT 74 4 4
ACACCTATGT CATTTCATTT CCTATTTTTG GAAGAGGACT CCTTAAATTT GGGGGACTTA 7504
CATGATTCAT TTTAACATCT GAGAAAAGCT TTGAACCCTG GGACGTGGCT AGTCATAACC 7564
TTACCAGATT TTTACACATG TATCTATGCA TTTTCTGGAC CCGTTCAACT TTTCCTTTGA 7 624
• · 4 · · »··■ 'ft
ATCCTCTCTC TGTGTTACCC AGTAACTCAT CTGTCACCAA GCCTTGGGGA TTCTTCCATC 7684
TGATTGTGAT GTGAGTTGCA CAGCTATGAA GGCTGTACAC TGCACGAATG GAAGAGGCAC 77 4 4
CTGTCCCAGA AAAAGCATCA TGGCTATCTG TGGGTAGTAT GATGGGTGTT TTTAGCAGGT 78 04
AGGAGGCAAA TATCTTGAAA GGGGTTGTGA AGAGGTGTTT TTTCTAATTG GCATGAAGGT 78 64
GTCATACAGA TTTGCAAAGT TTAATGGTGC CTTCATTTGG GATGCTACTC TAGTATTCCA 7924
GACCTGAAGA ATCACAATAA TTTTCTACCT GGTCTCTCCT TGTTCTGATA ATGAAAATTA 798 4
TGATAAGGAT GATAAAAGCA CTTACTTCGT GTCCGACTCT TCTGAGCACC TACTTACATG 8 04 4
CATTACTGCA TGCACTTCTT ACAATAATTC TATGAGATAG GTACTATTAT CCCCATTTCT 8104
TTTTTAAATG AAGAAAGTGA AGTAGGCCGG GCACGGTGGC TCACGCCTGT AATCCCAGCA 8164
CTTTGGGAGG CCAAAGCGGG TGGATCACGA GGTCAGGAGA TCGAGACCAT CCTGGCTAAC 8224
ATGGTGAAAC CCCATCTCTA ATAAAAATAC AAAAAATTAG CTGGGCGTGG TGGCAGACGC 3 2 84
CTGTAGTCCC AGCTACTCGG AAGGCTGAGG CAGGAGAATG GCATGAACCC AGGAGGCAGA 83 4 4
GCTTGCAGTG AGCCGAGTTT GCGCCACTGC ACTCCAGCCT AGGTGACAGA GTGAGACTCC 84 04
ATCTCAAAAA AATAAAAATA AAAATAAAAA AATGAAAAAA AAAAGAAAGT GAAGTATAGA -3464
GTATCTCATA GTTTGTCAGT GATAGAAACA GGTTTCAAAC TCAGTCAATC TGACCGTTTG 852 4
ATACATCTCA GACACCACTA CATTCAGTAG TTTAGATGCC TAGAATAAAT AGAGAAGGAA 8534
GGAGATGGCT CTTCTCTTGT CTCATTGTGT TTCTTCTGAG TGAGCTTGAA TCACATGAAG 8644
GGGAACAGCA GAAAACAACC AACTGATCCT CAGCTGTCAT GTTTCCTTTA AAAGTCCCTG 87 04
AAGG,\AGGTC CTGGAATGTG ACTCCCTTGC TCCTCTGTTG CTCTCTTTGG CATTCATTTC 87 64
TTTGGACCCT ACGCAAGGAC TGTAATTGGT GGGGACAGCT AGTGGCCCTG CTGGGCTTCA 8824
CACACGGTGT CCTCCCTAGG CCAGTGCCTC TGGAGTCAGA ACTCTGGTGG TATTTCCCTC 8884
AATGAAGTGG AGTAAGCTCT CTCATTTTGA GATGGTATAA TGGAAGCCAC CAAGTGGCTT 894 4
AGAGGATGCC CAGGTCCTTC CATGGAGCCA CTGGGGTTCC GGTGCACATT AAAAAAAAAA 9 0 04
TCTAACCAGG ACATTCAGGA ATTGCTAGAT TCTGGGAAAT CAGTTCACCA TGTTCAAAAG 9 0 64
AGTCTTTTTT TTTTTTTTGA GACTCTATTG CCCAGGCTGG AGTGCAATGG CATGATCTCG 9124
GCTCACTGTA ACCTCTGCCT CCCAGGTTCA AGCGATTCTC CTGTCTCAGC CTCCCAAGTA 9184
GCTGGGATTA CAGGCGTGCA CCACCATGCC CGGCTAATTT TTGTATTTTT AGTAGAGACA 9244
GGGTTTCACC ATGTTGGCCA GGCTGGTCTC GAACTCTCCT GACCTCGTGA TCCGCCTGCC 9 3 04
TCGGCCTCCC AAAGTGCTGA GATTACAGGT GTGAGCCACC CTGCCCAGCC GTCAAAAGAG 9 3 64
TCTTAATATA TATATCCAGA TGGCATGTGT TTACTTTATG TTACTACATG CACTTGGCTG 94 24
CATAAATGTG GTACAAGCAT TCTGTCTTGA AGGGCAGGTG CTTCAGGATä CCATATACAG 9 4 34
CTCAGAAGTT TCTTCTTTAG GCATTAAATT TTAGCAAAGA TATCTCATCT CTTCTTTTAA 9 54 4
D€t/EP.0:95-4.a02 Tl
17/44
ACCATTTTCT TTTTTTGTGG TTAGAAAAGT TATGTAGAAA ÄAAGTAAATG TGATTTACGC
TCATTGTAGA AAAGCTATAA AATGAATACA ATTAAAGCTG TTATTTAATT AGCCAGTGAA
AAACTATTAA CAACTTGTCT ATTACCTGTT AGTATTATTG TTGCATTAAA AATGCATATA
CTTTAATAAA TGTATATTGT ATTGTATACT GCATGATTTT ATTGAAGTTC TTGTTCATCT
tgtgtatata cttaatcgct ttgtcatttt ggagacattt attttgcttc taatttcttt
ACATTTTGTC TTACGGAATA TTTTCATTCA ACTGTGGTAG CCGAATTAAT CGTGTTTCTT
CACTCTAGGG ACATTGTCGT CTAAGTTGTA AGACATTGGT TATTTTACCA GCAAACCATT
CTGAAAGCAT ATGACAAATT ATTTCTCTCT TAATATCTTA CTATACTGAA AGCAGACTGC
TATAAGGCTT CACTTACTCT TCTACCTCAT AAGGAATATG TTACAATTAA TTTATTAGGT
AAGCATTTGT TTTATATTGG TTTTATTTCA CCTGGGCTGA GATTTCAAGA AACACCCCAG
TCTTCACAGT AACACATTTC ACTAACACAT TTACTAAACA TCAGCAACTG TGGCCTGTTA
atttttttaa tagaaatttt aagtcctcat tttctttcgg tgttttttaa gcttaatttt
tctggcttta ttcataaatt cttaaggtca actacatttg aaaaatcaaa gacctgcatt
TTAAATTCTT ATTCACCTCT GGCAAAACCA TTCACAAACC ATGGTAGTAA AGAGAAGGGT
GACACCTGGT GGCCATAGGT AAATGTACCA CGGTGGTCCG GTGACCAGAG ATGCAGCGCT
GAGGGTTTTC CTGAAGGTAA AGGAATAAAG AATGGGTGGA GGGGCGTGCA CTGGAAATCA
cttgtagaga aaagcccctg aaaatttgag aaaacaaaca agaaactact taccagctat
ttgaattgct ggaatcacag gccattgctg agctgcctga actgggaaca caacagaagg
aaaacaaacc actctgataa tcattgagtc aagtacagca ggtgattgag gactgctgag
aggtacaggc caaaattctt atgttgtatt ataataatgt catcttataa tactgtcagt
attttataaa acattcttca caaactcaca cacatttaaa aacaaaacac tgtctctaaa
atccccaaat ttttcataaa c
(2) information for seq id no: 4:
(i) sequence characteristics:
(A) LENGTH: 34S amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:4:
Met GIy Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu Gin
15 10 15
Thr Ala VaI Leu Gin GIy Arg Leu Leu Arg Ser His Ser Leu His Tyr
20 25 30
9604 9664 9724 9784 9344 9 9.04 9964 10024 10034 10144 10204 10264
10324 •10334 10444 10504 10564 10624 10684 10744 10304 10325
Leu Phe Met GIy AIa Ser GIu Gin Asp Leu GIy Leu Ser Leu ?he GIu
35 40 45
Ala Leu GIy Tyr VaI Asp Asp Gin Leu Phe VaI Phe Tyr Asp His GIu
50 55 60
Ser Arg Arg VaI GIu Pro Arg Thr Pro Trp VaI Ser Ser Arg He Ser
65 70 75 so
Ser Gin Met Trp Leu GIn Leu Ser GIn Ser Leu Lys GIy Trp Asp His
35 90 95
Met Phe Thr VaI Asp Phe Trp Thr lie Met GIu Asn His Asn His Ser
100 * 105 HO
Lys GIu Ser His Thr Leu Gin VaI He Leu GIy Cys GIu Met Gin GIu
115 120 * 125
Asp Asn Ser Thr GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy Gin Asp
130 135 140
His Leu GIu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala GIu Pro
145 150 155 160
Arg Ala Trp Pro Thr Lys Leu GIu Trp GIu Arg His Lys He Arg Ala
165 170 175
Arg Gin Asn Arg Ala Tyr Leu GIu Arg Asp Cys Pro Ala Gin Leu Gin
ISO 135 190
Gin Leu Leu GIu Leu Gly Arg GIy VaI Leu Asp Gin Gin VaI Pro Pro
195 200 205
Leu VaI Lys VaI Thr His His VaI Thr Ser Ser VaI Thr Thr Leu Arg
210 215 220
Cys Arg AIa Leu Asn Tyr Tyr Pro GIn Asn He Thr Met Lys Trp Leu
225 230 235 240
Lys Asp Lys Gin Pro Met Asp Ala Lys GIu Phe GIu Pro Lys Asp VaI
245 250 255
Leu Pro Asn Gly Asp GIy Thr Tyr Gin GIy Trp He Thr Leu Ala VaI
260 265 270
Pro Pro Gly GIu GIu GIn Arg Tyr Thr Tyr Gin VaI GIu His Pro Gly
275 280 235
Leu Asp GIn Pro Leu He VaI He Trp GIu Pro Ser Pro Ser Gly Thr
290 295 300
Leu VaI He Gly VaI He Ser Gly He Ala VaI Phe VaI VaI He Leu
305 310 315 320
Phe He Gly He Leu Phe He He Leu Arg Lys Arg Gin Gly Ser Arg
325 330 * 335 '
Gly AIa Met Gly His Tyr VaI Leu Ala GIu Arg GIu
340 345
(2) INFORMATION FOR SEQ ID NO:5:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 10325 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
19/·4&ngr;
DE/EPO 954602T1
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: join(361..436, 3762..4025, 4235. .4510, 5606. .583"
6040..6153, 7107..7147)
(D) OTHER INFORMATION: /product= "Hereditary Hemochromatosis
(HH) protein containing the 24d2 mutation"
/note= "Hereditary Hemochromatosis (HH) gene 24d2 allele"
(ix) FEATURE:
(A) NAME/KEY: -
(B) LOCATION: 140..7319
(D) OTHER INFORMATION: /note= "start and stop positions for
24d2 allele cDNA (SEQ ID NO:!!)"
(ix) FEATURE:
(A) NAME/KEY: -
(B) LOCATION: 3352..3S91
(D) OTHER INFORMATION: /note= "start and stop positions for
genomic sequence surrounding variant for 24d2(G) allele (SEQ ID NO:42)" ·
(ix) FEATURE:
(A) NAME/KEY: -
(B) LOCATION: 5507..6023
(D) OTHER INFORMATION: /note= "start and stop positions for
genomic sequence surrounding variant for 24dl(G) allele (SEQ ID NO:20)"
(ix) FEATURE:
(A) NAME/KEY: allele
(B) LOCATION: replace(3372, "g")
(D) OTHER INFORMATION: /phenotype= "Hereditary Hemochroinatosis
(HH) »
/label= 24d2
(Xi) SEQUENCE DESCRIPTION: SEQ ID NO:5:
TCTAAGGTTG AGATAAAATT TTTAAATGTA TGATTGAATT TTGAAAATCA TAAATATTTA 60
AATATCTAAA GTTCAGATCA GAACATTGCG AAGCTACTTT CCCCAATCAA CAACACCCCT 12 0
TCAGGATTTA AAAACCAAGG GGGACACTGG ATCACCTAGT GTTTCACAAG CAGGTACCTT 13 0
CTGCTGTAGG AGAGAGAGAA CTAAAGTTCT GAAAGACCTG TTGCTTTTCA CCAGGAAGTT 240
TTACTGGGCA TCTCCTGAGC CTAGGCAATA GCTGTAGGGT GACTTCTGGA GCCATCCCCG 3 00
TTTCCCCGCC CCCCAAAAGA AGCGGAGATT TAACGGGGAC GTGCGGCCAG AGCTGGGGAA 3 60
ATG GGC CCG CGA GCC AGG CCG GCG CTT CTC CTC CTG ATG CTT TTG CAG 4 03
Met GIy Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu GIn
5 10 15
ACC GCG GTC CTG CAG GGG CGC TTG CTG C GTGAGTCCGA GGGCTGCGGG 45 6
Thr Ala VaI Leu Gin GIy Arg Leu Leu
20 25
CGAACTAGGG GCGCGGCGGG GGTGGAAAAA TCGAAACTAG CTTTTTCTTT GCGCTTGGGA GTTTGCTAAC TTTGGAGGAC CTGCTCAACC CTATCCGCAA GCCCCTCTCC CTACTTTCTG
CGTCCAGACC CCGTGAGGGA GTGCCTACCA CTGAACTGCA GATAGGGGTC CCTCGCCCCA GGACCTGCCC CCTCCCCCGG CTGTCCCGGC TCTGCGGAGT GACTTTTGGA ACCGCCCACT
CCCTTCCCCC AACTAGAATG CTTTTAAATA AATCTCGTAG TTCCTCACTT GAGCTGAGCT AAGCCTGGGG CTCCTTGAAC CTGGAACTCG GGTTTATTTC CAATGTCAGC TGTGCAGTTT
TTTCCCCAGT CATCTCCAAA CAGGAAGTTC TTCCCTGAGT GCTTGCCGAG AAGGCTGAGC AAACCCACAG CAGGATCCGC äCGGGGTTTC CACCTCAGAA CGAATGCGTT GGGCGGTGGG
GGCGCGAAAG AGTGGCGTTG GGGATCTGAA TTCTTCACCA TTCCACCCAC TTTTGGTGAG ACCTGGGGTG GAGGTCTCTA GGGTGGGAGG CTCCTGAGAG AGGCCTACCT CGGGCCTTTC
CCCACTCTTG GCAATTGTTC TTTTGCCTGG AAAATTAAGT ATATGTTAGT TTTGAACGTT TGAACTGAAC AATTCTCTTT TCGGCTAGGC TTTATTGATT TGCAATGTGC TGTGTAATTA
AGAGGCCTCT CTACAAAGTA CTGATAATGA ACATGTAAGC AATGCACTCA CTTCTAAGTT ACATTCATAT CTGATCTTAT TTGATTTTCA CTAGGCATAG GGAGGTAGGA GCTAATAATA
CGTTTATTTT ACTAGAAGTT AACTGGAATT CAGATTATAT AACTCTTTTC AGGTTACAAA GAACATAAAT AATCTGGTTT TCTGATGTTA TTTCAAGTAC TACAGCTGCT TCTAATCTTA
GTTGACAGTG ATTTTGCCCT GTAGTGTAGC ACAGTGTTCT GTGGGTCACA CGCCGGCCTC AGCACAGCAC TTTGAGTTTT GGTACTACGT GTATCCACAT TTTACACATG ACAAGAATGA
GGCATGGCAC GGCCTGCTTC CTGGCAAATT TATTCAATGG TACACTGGGC TTTGGTGGCA GAGCTCATGT CTCCACTTCA TAGCTATGAT TCTTAAACAT CACACTGCAT TAGAGGTTGA
ATAATAAAAT TTCATGTTGA GCAGAAATAT TCATTGTTTA CAAGTGTAAA TGAGTCCCAG CCATGTGTTG CACTGTTCAA GCCCCAAGGG AGAGAGCAGG GAAACAAGTC TTTACCCTTT
GATATTTTGC ATTCTAGTGG GAGAGATGAC AATAAGCAAA TGAGCAGAAA GATATACAAC ATCAGGAAAT CATGGGTGTT GTGAGAAGCA GAGAAGTCAG GGCAAGTCAC TCTGGGGCTG
ACACTTGAGC AGAGACATGA AGGAAATAAG AATGATATTG ACTGGGAGCA GTATTTCCCA GGCAAACTGA GTGGGCCTGG CAAGTTGGAT TAAAAAGCGG GTTTTCTCAG CACTACTCAT
GTGTGTGTGT GTGGGGGGGG GGGGCGGCCT GGGGGTGGGA AGGGGGACTA CCATCTGCAT
GTAGGATGTC TAGCAGTATC CTGTCCTCCC TACTCACTAG GTGCTAGGAG CACTCCCCCA GTCTTGACAA CCAAAAATGT CTCTAAACTT TGCCACATGT CACCTAGTAG ACAAACTCCT
GGTTAAGAAG CTCGGGTTGA AAAAAATAAA CAAGTAGTGC TGGGGAGTAG AGGCCAAGAA GTAGGTAATG GGCTCAGAAG AGGAGCCACA AACAAGGTTG TGCAGGCGCC TGTAGGCTGT
GGTGTGAATT CTAGCCAAGG AGTAACAGTG ATCTGTCACA GGCTTTTAAA AGATTGCTCT
602T1
516 576 636 696 756 316 376 936 996 1056 1116 1176 1236 1296 1356 1416
1476 1536 1596 1656 1716 1776 1336 1896 1956 2016 2076 2136 2196 2256
2316 2376
21/44
DE/EP O 954602T1
(A) NAME/KEY: -
(B) LOCATION: 3S52..3891
(D) OTHER INFORMATION: /note= "start and stop positions for
genomic sequence surrounding variant
for 24d2(G) allele (SEQ ID NO:42)"
(ix) FEATURE:
(A) NAME/KEY: -
(B) LOCATION: 5507..6023
(D) OTHER INFORMATION: /note= "start and stop positions for
genoinic sequence surrounding variant
for 24dl(A) allele (SEQ ID NO:21)"
(ix) FEATURE:
(A) NAME/KEY: allele
(B) LOCATION: replace(3872, "g")
(D) OTHER INFORMATION: /phenotype= "Hereditary Hemochromatosis
(HH)"
/label= 24d2
(ix) FEATURE:
(A) NAME/KEY: allele
(B) LOCATION: replace(5834, "a")
(D) OTHER INFORMATION: /phenotype= "Hereditary Hemochromatosis
(HH) "
/label= 24dl
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:7:
TCTAAGGTTG AGATAAAATT TTTAAATGTA TGATTGAATT TTGAAAATCA TAAATATTTA 60
AATATCTAAA GTTCAGATCA GAACATTGCG AAGCTACTTT CCCCAATCAA CAACACCCCT 120
TCAGGATTTA AAAACCAAGG GGGACACTGG ATCACCTAGT GTTTCACAAG CAGGTACCTT 130
CTGCTGTAGG AGAGAGAGAA CTAAAGTTCT GAAAGACCTG TTGCTTTTCA CCAGGAAGTT 24 0
TTACTGGGCA TCTCCTGAGC CTAGGCAATA GCTGTAGGGT GACTTCTGGA GCCATCCCCG 3 00
TTTCCCCGCC CCCCAAAAGA AGCGGAGATT TAACGGGGAC GTGCGGCCAG AGCTGGGGAA 3 60
ATG GGC CCG CGA GCC AGG CCG GCG CTT CTC CTC CTG ATG CTT TTG CAG 4 08
Met GIy Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu GIn
15 10 15
ACC GCG GTC CTG CAG GGG CGC TTG CTG C GTGAGTCCGA GGGCTGCGGG 4 56
Thr Ala VaI Leu Gin GIy Arg Leu Leu
20 25
CGAACTAGGG GCGCGGCGGG GGTGGAAAAA TCGAAACTAG CTTTTTCTTT GCGCTTGGGA 516
GTTTGCTAAC TTTGGAGGAC CTGCTCAACC CTATCCGCAA GCCCCTCTCC CTACTTTCTG 57 6
CGTCCAGACC CCGTGAGGGA GTGCCTACCA CTGAACTGCA GATAGGGGTC CCTCGCCCCA 63 6
GGACCTGCCC CCTCCCCCGG CTGTCCCGGC TCTGCGGAGT GACTTTTGGA ACCGCCCACT 696
CCCTTCCCCC AACTAGAATG CTTTTAAATA AATCTCGTAG TTCCTCACTT GAGCTGAGCT 7 56
AAGCCTGGGG CTCCTTGAAC CTGGAACTCG GGTTTATTTC CAATGTCAGC TGTGCAGTTT 316
TTTCCCCAGT CATCTCCAAA CAGGAAGTTC TTCCCTGAGT GCTTGCCGAG AAGGCTGAGC 87 6
22/44
AAACCCACAG CAGGATCCGC ACGGGGTTTC CACCTCAGAA CGAATGCGTT GGGCGGTGGG GGCGCGAAAG AGTGGCGTTG GGGATCTGAA TTCTTCACCA TTCCACCCAC TTTTGGTGAG
ACCTGGG
GAGGTCTCTA GGGTGGGAGG CTCCTGAGAG AGGCCTACCT CGGGCCTTTC
CCCACTCTTG GCAATTGTTC TTTTGCCTGG AAAATTAAGT ATATGTTAGT TTTGAACGTT
TGAACTGAAC AATTCTCTTT TCCGCTAGGC TTTATTGATT TGCAATGTGC TGTGTAATTA
AGAGGCCTCT CTACAAAGTA CTGATAATGA ACATGTAAGC AATGCACTCA CTTCTAAGTT ACATTCATAT CTGATCTTAT TTGATTTTCA CTAGGCATAG GGAGGTAGGA GCTAATAATA
CGTTTATTTT ACTAGAAGTT AACTGGAATT CAGATTATAT AACTCTTTTC AGGTTACÄAA
GAACATAAAT AATCTGGTTT TCTGATGTTA TTTCAAGTAC TACAGCTGCT TCTAATCTTA GTTGACAGTG ATTTTGCCCT GTAGTGTAGC ACAGTGTTCT GTGGGTCACA CGCCGGCCTC
AGCACAGCAC TTTGAGTTTT GGTACTACGT GTATCCACAT TTTACACATG ACAAGAATGA GGCATGGCAC GGCCTGCTTC CTGGCAAATT TATTCAATGG TACACTGGGC TTTGGTGGCA
GAGCTCATGT CTCCACTTCA TAGCTATGAT TCTTAAACAT CACACTGCAT TAGAGGTTGA ATAATAAAAT TTCATGTTGA GCAGAAATAT TCATTGTTTA CAAGTGTAAA TGAGTCCCAG
CCATGTGTTG CACTGTTCAA GCCCCAAGGG AGAGAGCAGG GAAACAAGTC TTTACCCTTT GATATTTTGC ATTCTAGTGG GAGAGATGAC AATAAGCAAA TGAGCAGAAA GATATACAAC
ATCAGGAAAT CATGGGTGTT GTGAGAAGCA GAGAAGTCAG GGCAAGTCAC TCTGGGGCTG ACACTTGAGC AGAGACATGA AGGAAATAAG AATGATATTG ACTGGGAGCA GTATTTCCCA
GGCAAACTGA GTGGGCCTGG CAAGTTGGAT TAAAAAGCGG GTTTTCTCAG CACTACTCAT
GTGTGTGTGT GTGGGGGGGG GGGGCGGCGT GGGGGTGGGA AGGGGGACTA CCATCTGCAT GTAGGATGTC TAGCAGTATC CTGTCCTCCC TACTCACTAG GTGCTAGGAG CACTCCCCCA
GTCTTGACAA CCAAAAATGT CTCTAAACTT TGCCACATGT CACCTAGTAG ACAAACTCCT
GGTTAAGAAG CTCGGGTTGA AAAAAATAAA CAAGTAGTGC TGGGGAGTAG AGGCCAAGAA GTAGGTAATG GGCTCAGAAG AGGAGCCACA AACAAGGTTG TGCAGGCGCC TGTAGGCTGT
GGTGTGAATT CTAGCCAAGG AGTAACAGTG ATCTGTCACA GGCTTTTAAA AGATTGCTCT GGCTGCTATG TGGAAAGCAG AATGAAGGGA GCAACAGTAA AAGCAGGGAG CCCAGCCAGG
AAGCTGTTAC ACAGTCCAGG CAAGAGGTAG TGGAGTGGGC TGGGTGGGAA CAGAAAAGGG AGTGACAAAC CATTGTCTCC TGAATATATT CTGAAGGAAG TTC-CTGAAGG ATTCTATGTT
GTGTGAGAGA AAC-AC-AAGAA TTGGCTGGGT GTAGTAGCTC ÄTGCCAAGGA GGAGGCCAAG
GAGAGCAGAT TCCTGAGCTC AGGAGTTCAA GACCAGCCTG GGCAACACAG CAAAACCCCT TCTCTACAAA AA.ATACAAAA ATTAGCTGGG TGTGGTGGCA TGCACCTGTG ATCCTAGCTA
CTCGGGAGGC TGAGGTGGAG GGTATTGCTT GAGCCCAGGA AGTTGAGGCT GCAGTGAGCC
936 99 6 105 6 1116 1176 12 3 6
12 9 6
13 5 6 1416 1476 153 6 159 6 1656 1716 1776 183 6 18 9 6 1956 2016
2 07 6 213 6 219 6 2 2 56 2 316 2 37 6 24 3 6 2 4 96 2 55 6 2 616 2 676
2 73 6 2 79 6
GGCTGCTATG TGGAAAGCAG AATGAAGGGA GCAACAGTAA AAGCAGGGAG CCCAGCCAGG 243 6
AAGCTGTTAC ACAGTCCAGG CAAGAGGTAG TGGAGTGGGC TGGGTGGGAA CAGAAAAGGG 2 496
AGTGACAAAC CATTGTCTCC TGAATATATT CTGAAGGAAG TTGCTGAAGG ATTCTATGTT 2 556
GTGTGAGAGA AAGAGAAGAA TTGGCTGGGT GTAGTAGCTC ATGCCAAGGA GGAGGCCAAG 2 616
GAGAGCAGAT TCCTGAGCTC AGGAGTTCAA GACCAGCCTG GGCAACACAG CAAAACCCCT 2 67 6
TCTCTACAAA AAATACAAAA ATTAGCTGGG TGTGGTGGCA TGCACCTGTG ATCCTAGCTA 27 3 6
CTCGGGAGGC TGAGGTGGAG GGTATTGCTT GAGCCCAGGA AGTTGAGGCT GCAGTGAGCC 2 79 6
ATGACTGTGC CACTGTACTT CAGCCTAGGT GACAGAGCAA GACCCTGTCT CCCCTGACCC 23 56
CCTGAAAAAG AGAÄGAGTTA AAGTTGACTT TGTTCTTTAT TTTAATTTTA TTGGCCTGAG 2916
CAGTGGGGTA ATTGGCAATG CCATTTCTGA GATGGTGAAG GCAGAGGAAA GAGCAGTTTG 297 6
GGGTAAATCA AGGATCTGCA TTTGGGACAT GTTAAGTTTG AGATTCCAGT CAGGCTTCCA 3 03 6
AGTGGTGAGG CCACATAGGC AGTTCAGTGT AAGAATTCAG GACCAAGGCT GGGCACGGTG 3 09 6
GCTCACTTCT GTAATCCCAG CACTTTGGTG GCTGAGGCAG GTAGATCATT TGAGGTCAGG 3156
AGTTTGAGAC AAGCTTGGCC AACATGGTGA AACCCCATGT CTACTAAAAA TACAAAAATT ■ 3216
AGCCTGGTGT GGTGGCGCAC GCCTATAGTC CCAGGTTTTC AGGAGGCTTA GGTAGGAGAA 3 276
TCCCTTGAAC CCAGGAGGTG CAGGTTGCAG TGAGCTGAGA TTGTGCCACT GCACTCCAGC 333 6
CTGGGTGATA GAGTGAGACT CTGTCTCAAA AAAAAAAAAA AAAAAAAAAA AAAAAACTGA 3 3 96
AGGAATTATT CCTCAGGATT TGGGTCTAAT TTGCCCTGAG CACCAACTCC TGAGTTCAAC 3 4 56
TACCATGGCT AGACACACCT TAACATTTTC TAGAATCCAC CAGCTTTAGT GGAGTCTGTC 3516
TAATCATGAG TATTGGAATA GGATCTGGGG GCAGTGAGGG GGTGGCAGCC ACGTGTGGCA 3 57 6
GAGAAAAGCA CACAAGGAAA GAGCACCCAG GACTGTCATA TGGAAGAAAG ACAGGACTGC 3 63 6
AACTCACCCT TCACAAAATG AGGACCAGAC ACAGCTGATG GTATGAGTTG ATGCAGGTGT 3 69 6
GTGGAGCCTC AACATCCTGC TCCCCTCCTA CTACACATGG TTAAGGCCTG TTGCTCTGTC 37 56
TCCAG GT TCA CAC TCT CTG CAC TAC CTC TTC ATG GGT GCC TCA GAG 3 3 02
Arg Ser His Ser Leu His Tyr Leu Phe Met GIy AIa Ser GIu
30 35
CAG GAC CTT GGT CTT TCC TTG TTT GAA GCT TTG GGC TAC GTG GAT GAC 3 3 50
Gin Asp Leu GIy Leu Ser Leu Phe GIu AIa Leu GIy Tyr VaI Asp Asp
4 0 45 50 55
CAG CTG TTC GTG TTC TAT GAT GAT GAG AGT CGC CC-T GTG GAG CCC CGA 3393
GIn Leu Phe VaI Phe Tyr Asp Asp GIu Ser Arg Arg VaI GIu Pro Arg
60 65 70
ACT CCA TGG GTT TCC AGT AGA ATT TCA AGC CAG ATG TGG CTG CAG CTG 3946
Thr Pro Trp VaI Ser Ser Arg lie Ser Ser Gin Met Trp Leu Gin Leu
75 30 35
AGT CAG AGT CTG AAA GGG TGG GAT CAC ATG TTC ACT GTT GAC TTC TGG 3994
Ser Gin Ser Leu Lys GIy Trp Asp His Met Phe Thr VaI Asp Phe Trp
24/44
100
ACT ATT ATG GAA AAT CAC AAC CAC AGC AAG G GTATGTGGAG AGGGGGCCTC Thr lie Met GIu Asn His Asn His Ser Lys
105 110
ACCTTCCTGA GGTTGTCAGA GCTTTTCATC TTTTCATGCA TCTTGAAGGA AACAGCTGGA
AGTCTGAGGT CTTGTGGGAG CAGGGAAGAG GGAAGGAATT TGCTTCCTGA GATCATTTGG
TCCTTGGGGA TGGTGGAAAT AGGGACCTAT TCCTTTGGTT GCAGTTAACA AGGCTGGGGA
TTTTTCCAG AG TCC CAC ACC CTG CAG GTC ATC CTG GGC TGT GAA ATG GIu Ser His Thr Leu Gin VaI lie Leu GIy Cys GIu Met
115 120 125
CAA GAA GAC AAC AGT ACC GAG GGC TAC TGG AAG TAC GGG TAT GAT GGG
Gin GIu Asp Asn Ser Thr GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy
130 135 140
CAG GAC CAC CTT GAA TTC TGC CCT GAC ACA CTG GAT TGG AGA GCA GCA
Gin Asp His Leu GIu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala
145 150 155
GAA CCC AGG GCC TGG CCC ACC AAG CTG GAG TGG GAA AGG CAC AAG ATT GIu Pro Arg Ala Trp Pro Thr Lys Leu GIu Trp GIu Arg His Lys lie
160 165 170
CGG GCC AGG CAG AAC AGG GCC TAC CTG GAG AGG GAC TGC CCT GCA CAG Arg Ala Arg Gin Asn Arg Ala Tyr Leu GIu Arg Asp Cys Pro Ala Gin
175 180 185 190
CTG CAG CAG TTG CTG GAG CTG GGG AGA GGT GTT TTG GAC CAA CAA G
Leu GIn Gin Leu Leu GIu Leu GIy Arg GIy VaI Leu Asp Gin Gin
195 200 205
GTATGGTGGA AACACACTTC TGCCCCTATA CTCTAGTGGC AGAGTGGAGG AGGTTGCAGG GCACGGAATC CCTGGTTGGA GTTTCAGAGG TGGCTGAGGC TGTGTGCCTC TCCAAATTCT
GGGAAGGGAC TTTCTCAATC CTAGAGTCTC TACCTTATAA TTGAGATGTA TGAGACAGCC ACAAGTCATG GGTTTAATTT CTTTTCTCCA TGCATATGGC TCAAAGGGAA GTGTCTATGG
CCCTTGCTTT TTATTTAACC AATAATCTTT TGTATATTTA TACCTGTTAA AAATTCAGAA ATGTCAAGGC CGGGCACGGT GGCTCACCCC TGTAATCCCA GCACTTTGGG AGGCCGAGGC
GGGTGGTCAC AAGGTCAGGA GTTTGAGACC AGCCTGACCA ACATGGTGAA ACCCGTCTCT AAAAAAATAC AAAAATTAGC TGGTCACAGT CATGCGCACC TGTAGTCCCA GCTAATTGGA
AGGCTGAGGC AGGAGCATCG CTTGAACCTG GGAAGCGGAA GTTGCACTGA GCCAAGATCG CGCCACTGCA CTCCAGCCTA GGCAGCAGAG TGAGACTCCA TCTTAAAAAA AAAAAAAAAA
AAAAAAAGAG. AATTCAGAGA TCTCAGCTAT CATATGAATA CCAGGACAAA ATATCAAGTG AGGCCACTTA TCAGAGTAGA AGAATCCTTT AGGTTAAAAG TTTCTTTCAT AGAACATAGC
AATAATCACT GAAGCTACCT ATCTTACAAG TCCGCTTCTT ATAACAATGC CTCCTAGGTT GACCCAGGTG AAACTGACCA TCTGTATTCA ATCATTTTCA ATGCACATAA AGGGCAATTT
4045
4105 4165 4225 4272
4320 4368 4416 4464 4510
4570 4630 4690 4750 4810 4870 4930 4990 5050 5110 5170 5230 5290 5350
ki j).£·/E-P-D 9·5&Agr; 602 T1
• ·
25/44
TATCTATCAG AACAAAGAAC ATGGGTAACA GATATGTATA TTTACATGTG AGGAGAACAA GCTGATCTGA CTGCTCTCCA AGTGACACTG TGTTAGAGTC CAATCTTAGG ACACAAAATG
GTGTCTCTCC TGTAGCTTGT TTTTTTCTGA AAAGGGTATT TCCTTCCTCC AACCTATAGA AGGAAGTGAA AGTTCCAGTC TTCCTGGCAA GGGTAAACAG ATCCCCTCTC CTCATCCTTC
CTCTTTCCTG TCAAG TG CCT CCT TTG GTG AAG GTG ACA CAT CAT GTG ACC
VaI Pro Pro Leu VaI Lys VaI Thr His His VaI Thr
210 215
TCT TCA GTG ACC ACT CTA CGG TGT CGG GCC TTG AAC TAC TAC CCC CAG Ser Ser VaI Thr Thr Leu Arg Cys Arg Ala Leu Asn Tyr Tyr Pro Gin
220 225 230
AAC ATC ACC ATG AAG TGG CTG AAG GAT AAG CAG CCA ATG GAT GCC AAG Asn lie Thr Met Lys Trp Leu Lys Asp Lys Gin Pro Met Asp Ala Lys
235 240 245
GAG TTC GAA CCT AAA GAC GTA TTG CCC AAT GGG GAT GGG ACC TAC CAG GIu Phe GIu Pro Lys Asp VaI Leu Pro Asn GIy Asp GIy Thr Tyr Gin
250 255 260 265
GGC TGG ATA ACC TTG GCT GTA CCC CCT GGG GAA GAG CAG AGA TAT ACG GIy Trp lie Thr Leu Ala VaI Pro Pro GIy GIu GIu Gin Arg Tyr Thr
270 275 280
TGC CAG GTG GAG CAC CCA GGC CTG GAT CAG CCC CTC ATT GTG ATC TGG G Cys Gin VaI GIu His Pro GIy Leu Asp Gin. Pro Leu lie VaI lie Trp
285 290 295
GTATGTGACT GATGAGAGCC AGGAGCTGAG AAAATCTATT GGGGGTTGAG AGGAGTGCCT GAGGAGGTAA TTATGGCAGT GAGATGAGGA TCTGCTCTTT GTTAGGGGGT GGGCTGAGGG
TGGCAATCAA AGGCTTTAAC TTGCTTTTTC TGTTTTAG AG CCC TCA CCG TCT
GIu Pro Ser Pro Ser 300
GGC ACC CTA GTC ATT GGA GTC ATC AGT GGA ATT GCT GTT TTT GTC GTC GIy Thr Leu VaI lie GIy VaI He Ser GIy lie Ala VaI Phe VaI VaI
305 310 315
ATC TTG TTC ATT GGA ATT TTG TTC ATA ATA TTA AGG AAG AGG CAG GGT lie Leu Phe He GIy He Leu Phe He He Leu Arg, Lys Arg Gin GIy
320 325 330
TCA A GTGAGTAGGA ACAAGGGGGA AGTCTCTTAG TACCTCTGCC CCAGGGCACA
GTGGGAAGAG GGGCAGAGGG GATCTGGCAT CCATGGGAAG CATTTTTCTC ATTTATATTC TTTGGGGACA CCAGCAGCTC CCTGGGAGAC AGAAAATAAT GGTTCTCCCC AGAATGAAAG
TCTCTAATTC AACAAACATC TTCAGAGCAC CTACTATTTT GCAAGAGCTG TTTAAGGTAG TACAGGGGCT TTGAGGTTGA GAAGTCACTG TGGCTATTCT CAGAACCCAA ATCTGGTAGG
GAATGAAATT GATAGCAAGT AA-ATGTAGTT AAAGAAGACC CCATGAGGTC CTAAAGCAGG
CAGGAAGCAA ATGCTTAGGG TGTCAAAGGA AAGAATGATC ACATTCAGCT GGGGATCAAG
5638 57 3 6 573 4 53 3 2 5881
ATAGCCTTCT GGATCTTGAA GGAGAAGCTG GATTCCATTA GGTGAGGTTG AAGATGATGG 662 3
GAGGTCTACA CAGACGGAGC AACCATGCCA AGTAGGAGAG TATAAGGCAT ACTGGGAGAT 6633
TAGAAATAAT TACTGTACCT TAACCCTGAG TTTGCGTÄGC TATCACTCAC CAATTATGCA 674 3
TTTCTACCCC CTGAACATCT GTGGTGTAGG GAAAAGAGAA TCAGAAAGAA GCCAGCTCAT 68 03
ACAGAGTCCA AGGGTCTTTT GGGATATTGG GTTATGATCA CTGGGGTGTC ATTGAAGGAT 63 6 3
CCTAAGAAAG GAGGACCACG ATCTCCCTTA TATGGTGAAT GTGTTGTTAA. GAAGTTAGAT 69 2 3
GAGAGGTGAG GAGACCAGTT AGAAAGCCAA TAAGCATTTC CAGATGAGAG ATAATGGTTC 6933
TTGAAATCCA ATAGTGCCCA GGTCTAAATT GAGATGGGTG AATGAGGAAA ATAAGGAAGA 7 04 3
GAGAAGAGGC AAGATGGTGC CTAGGTTTGT GATGCCTCTT TCCTGGGTCT CTTGTCTCCA 7103
CAG GA GGA GCC ATG GGG CAC TAC GTC TTA GCT GAA CGT GAG 714 4 Arg GIy Ala Met GIy His Tyr VaI Leu Ala GIu Arg GIu
340 345
TGACACGCAG CCTGCAGACT CACTGTGGGA AGGAGACAAA ACTAGAGACT CAAAGAGGGA 72 04
GTGCATTTAT GAGCTCTTCA TGTTTCAGGA GAGAGTTGAA CCTAAACATA GAAATTGCCT 72 64
GACGAACTCC TTGATTTTAG CCTTCTCTGT TCATTTCCTC AAAAAGATTT CCCCATTTAG ■ 73 2 4
GTTTCTGAGT TCCTGCATGC CGGTGATCCC TAGCTGTGAC CTCTCCCCTG GAACTGTCTC 73 84
TCATGAACCT CAAGCTGCAT CTAGAGGCTT CCTTCATTTC CTCCGTCACC TCAGAGACAT 7444
ACACCTATGT CATTTCATTT CCTATTTTTG GAAGAGGACT CCTTAAATTT GGGGGACTTA 7 504
CATGATTCAT TTTAACATCT GAGAAAAGCT TTGAACCCTG GGACGTGGCT AGTCATAACC 7564
TTACCAGATT TTTACACATG TATCTATGCA TTTTCTGGAC CCGTTCAACT TTTCCTTTGA 7624
ATCCTCTCTC TGTGTTACCC AGTAACTCAT CTGTCACCAA GCCTTGGGGA TTCTTCCATC 7 634
TGATTGTGAT GTGAGTTGCA CAGCTATGAA GGCTGTACAC TGCACGAATG GAAGAGGCAC 774 4
CTGTCCCAGA AAAAGCATCA TGGCTATCTG TGGGTAGTAT GATGGGTGTT TTTAGCAGGT 73 04
AGGAGGCAAA TATCTTGAAA GGGGTTGTGA AGAGGTGTTT TTTCTAATTG GCATGAAGGT 73 64
GTCATACAGA TTTGCAAAGT TTAATGGTGC CTTCATTTGG GATGCTACTC TAGTATTCCA 79 2 4
GACCTGAAGA ATCACAATAA TTTTCTACCT GGTCTCTCCT TGTTCTGATA ATGAAAATTA 7 93 4
TGATAAGGAT GATAAAAGCA CTTACTTCGT GTCCGACTCT TCTGAGCACC TACTTACATG 3 04 4
CATTACTGCA TGCACTTCTT ACAATAATTC TATGAGATAG GTACTATTAT CCCCATTTCT 8104
TTTTTAAATG AAGAAAGTGA AGTAGGCCGG GCACGGTGGC TCACGCCTGT AATCCCAGCA 3164
CTTTGGGAGG CCAAAGCGGG TGGATCACGA GGTCAGGAGA TCGAGACCAT CCTGGCTAAC 3 2 24
ATGGTGAAAC CCCATCTCTA ATAAAAATAC AAAAAATTAG CTGGGCCTGG TGGCAGACGC 3234
CTGTAGTCCC AGCTACTCGG AAGGCTGAGG CAGGAGAATG GCATGAACCC AGGAGGCAGA 3 3 44
GCTTGCAGTG AGCCGAGTTT GCGCCACTGC ACTCCAGCCT AGGTGACAGA GTGAGACTCC 3404
27/44
DE7e>095T6O2T1
ATCTCAAAAA AATAAAAATA AAAATAAAAA AATGAAAAAA AAAAGAAAGT GAAGTATAGA 84 64
GTATCTCATA GTTTGTCAGT GATAGAAACA GGTTTCAAAC TCAGTCAATC TGACCGTTTG 852 4
ATACATCTCA GACACCACTA CATTCAGTAG TTTAGATGCC TAGAATAAAT AGAGAAGGAA 8 584
GGAGATGGCT CTTCTCTTGT CTCATTGTGT TTCTTCTGAG TGAGCTTGAA TCACATGAAG 8 64 4
GGGAACAGCA GAAAACAACC AACTGATCCT CAGCTGTCAT GTTTCCTTTA AAAGTCCCTG 87 04
AAGGAAGGTC CTGGAATGTG ACTCCCTTGC TCCTCTGTTG CTCTCTTTGG CATTCATTTC 87 64
TTTGGACCCT ACGCAAGGAC TGTAATTGGT GGGGACAGCT AGTGGCCCTG CTGGGCTTCA 8824
CACACGGTGT CCTCCCTAGG CCAGTGCCTC TGGAGTCAGA ACTCTGGTGG TATTTCCCTC 8884
AATGAAGTGG AGTAAGCTCT CTCATTTTGA GATGGTATAA TGGAAGCCAC CAAGTGGCTT 894 4
AGAGGATGCC CAGGTCCTTC CATGGAGCCA CTGGGGTTCC GGTGCACATT AAAAAAAAAA 9004
TCTAACCAGG ACATTCAGGA ATTGCTAGAT TCTGGGAAAT CAGTTCACCA TGTTCAAAAG 9064
AGTCTTTTTT TTTTTTTTGA GACTCTATTG CCCAGGCTGG AGTGCAATGG CATGATCTCG 9124
GCTCACTGTA ACCTCTGCCT CCCAGGTTCA AGCGATTCTC CTGTCTCAGC CTCCCAAGTA 9184
GCTGGGATTA CAGGCGTGCA CCACCATGCC CGGCTAATTT TTGTATTTTT AGTAGAGACA · 9244
GGGTTTCACC ATGTTGGCCA GGCTGGTCTC GAACTCTCCT GACCTCGTGA TCCGCCTGCC 93 04
TCGGCCTCCC AAAGTGCTGA GATTACAGGT GTGAGCCACC CTGCCCAGCC GTCAAAAGAG 93 64
TCTTAATATA TATATCCAGA TGGCATGTGT TTACTTTATG TTACTACATG CACTTGGCTG 9424
CATAAATGTG GTACAAGCAT TCTGTCTTGA AGGGCAGGTG CTTCAGGATA CCATATACAG 94 84
CTCAGAAGTT TCTTCTTTAG GCATTAAATT TTAGCAAAGA TATCTCATCT CTTCTTTTAA 9544
ACCATTTTCT TTTTTTGTGG TTAGAAAAGT TATGTAGAAA AAAGTAAATG TGATTTACGC 9 604
TCATTGTAGA AAAGCTATAA AATGAATACA ATTAAAGCTG TTATTTAATT AGCCAGTGAA 9664
AAACTATTAA CAACTTGTCT ATTACCTGTT AGTATTATTG TTGCATTAAA AATGCATATA 97 2 4
CTTTAATAAA TGTATATTGT ATTGTATACT GCATGATTTT ATTGAAGTTC TTGTTCATCT 9784
TGTGTATATA CTTAATCGCT TTGTCATTTT GGAGACATTT ATTTTGCTTC TAATTTCTTT 98 4 4
ACATTTTGTC TTACGGAATA TTTTCATTCA ACTGTGGTAG CCGAATTAAT CGTGTTTCTT 99 04
CACTCTAGGG ACATTGTCGT CTAAGTTGTA AGACATTGGT TATTTTACCA GCAAACCATT 99 64
CTGAAAGCAT ATGACAAATT ATTTCTCTCT TAATATCTTA CTATACTGAA AGCAGACTGC 1002 4
TATAAGGCTT CACTTACTCT TCTACCTCAT AAGGAATATG TTACAATTAA TTTATTAGGT 10084
AAGCATTTGT TTTATATTGG TTTTATTTCA CCTGGGCTGA GATTTCAAGA AACACCCCAG 1014 4
TCTTCACAGT AACACATTTC ACTAACACAT TTACTAAACA TCAGCAACTG TGGCCTGTTA 10204
ATTTTTTTAA TAGAAATTTT AAGTCCTCAT TTTCTTTCGG TGTTTTTTAA GCTTAATTTT 102 64
TCTGGCTTTA TTCATAAATT CTTAAGGTCA ACTACATTTG AAAAATCAAA GACCTGCATT 103 2 4
TTAAATTCTT
GACACCTGGT
GAGGGTTTTC
CTTGTAGAGA
TTGAATTGCT
AAAACAAACC
AGGTACAGGC
ATTTTATAAA
ATCCCCAAAT
ATTCACCTCT GGCCATAGGT CTGAAGGTAA AAAGCCCCTG GGAATCACAG ACTCTGATAA CAAAATTCTT
ACATTCTTCA TTTTCATAAA
GGCAAAACCA AAATGTACCA AGGAATAAAG AAAATTTGAG GCCATTGCTG TCATTGAGTC ATGTTGTATT
CAAACTCACA C
28/44
TTCACAAACC CGGTGGTCCG AATGGGTGGA AAAACAAACA AGCTGCCTGA AAGTACAGCA ATAATAATGT
CACATTTAAA
&udigr;&Ggr;/ E
ATGGTAGTAA
GTGACCAGAG
GGGGCGTGCA
AGAAACTACT
ACTGGGAACA
GGTGATTGAG
CATCTTATAA
AACAAAACAC
AGAGAAGGGT 10384
ATGCAGCGCT 10444
CTGGAAATCA 10504
TACCAGCTAT 10564
CAACAGAAGG 10624
GACTGCTGAG 10634
TACTGTCAGT 10744
TGTCTCTAAA 108 04 10825
(2) INFORMATION FOR SEQ ID NO: 6:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 348 amino acids
(B) TYPE: amino acid (D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein (Xi) SEQUENCE DESCRIPTION: SEQ ID NO:6:
Met GIy Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu Gin
1 5 10 15
Thr Ala VaI Leu Gin GIy Arg Leu Leu Arg Ser His Ser Leu His Tyr
20 25 30
Leu Phe Met GIy AIa Ser GIu Gin Asp Leu GIy Leu Ser Leu Phe GIu
35 40 45
AIa Leu GIy Tyr VaI Asp Asp Gin Leu Phe VaI Phe Tyr Asp Asp GIu
50 55 60
Ser Arg Arg VaI GIu Pro Arg Thr Pro Trp VaI Ser Ser Arg He Ser
65 70 75 80
Ser Gin Met Trp Leu GIn Leu Ser GIn Ser Leu Lys GIy Trp Asp His
35 90 95
Met Phe Thr VaI Asp Phe Trp Thr lie Met GIu Asn His Asn His Ser
100 105 110
Lys GIu Ser His Thr Leu Gin VaI He Leu GIy Cys GIu Met Gin GIu
115 120 125
Asp Asn Ser Thr GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy Gin Asp
130 135 140
His Leu GIu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala GIu Pro
145 150 * 155 160
Arg AIa Trp Pro Thr Lys Leu GIu Trp GIu Arg His Lys He Arg AIa
165 170 175
Arg Gin Asn Arg AIa Tyr Leu GIu Arg Asp Cys Pro Ala GIn Leu Gin
180 185 190
Gin Leu Leu GIu Leu GIy Arg GIy VaI Leu Asp Gin Gin VaI Pro Pro
195 200 205
Leu VaI Lys VaI Thr His His VaI Thr Ser Ser VaI Thr Thr Leu Arg
210 215 220
Cys Arg AIa Leu Asn Tyr Tyr Pro GIn Asn He Thr Met Lys Trp Leu
22 5 230 235 240
Lys Asp Lys GIn Pro Met Asp Ala Lys GIu Phe GIu Pro Lys Asp VaI
245 250 255
Leu Pro Asn GIy Asp GIy Thr Tyr Gin GIy Trp He Thr Leu Ala VaI
260 265 270
Pro Pro GIy GIu GIu Gin Arg Tyr Thr Cys Gin VaI GIu His Pro GIy
275 280 285
Leu Asp Gin Pro Leu He VaI He Trp GIu Pro Ser Pro Ser GIy Thr
290 295 300
Leu VaI He GIy VaI He Ser GIy He Ala VaI Phe VaI VaI He Leu
305 310 315 320
Phe He GIy He Leu Phe He He Leu Arg Lys Arg Gin GIy Ser Arg
325 330 335
GIy AIa Met GIy His Tyr VaI Leu Ala GIu Arg GIu
340 345
(2) INFORMATION FOR SEQ ID NO:7:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 10825 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: join(361..436, 3762..4025, 4235..4510, 5606..5881,
6040. .6153, 7107. .7147)
(D) OTHER INFORMATION: /product= "Hereditary Hemochromatosis
(HH) protein containing both the 24dl and 24d2 mutations"
/note= "Hereditary Hemochromatosis (HH) gene containing a combination of both
24dl and 24d2 aileles"
(ix) FEATURE:
(A) NAME/KEY: -
(B) LOCATION: 140..7319
(D) OTHER INFORMATION: /note= "start and stop positions for
cDNA containing a combination of both 24dl and 24d2 aileles
(SEQ ID NO:12)"
(ix) FEATURE:
ATGACTGTGC CACTGTACTT CAGCCTAGGT GACAGAGCAA GACCCTGTCT CCCCTGACCC CCTGAAAAAG AGAAGAGTTA AAGTTGACTT TGTTCTTTAT TTTAATTTTA TTGGCCTGAG
CAG1TC-GGGTA ATTGGCAATG CCATTTCTGA GATGGTGAAG GCAGAGGAAA GAGCAGTTTG
GGGTAAATCA AGGATCTGCA TTTGGGACAT GTTAAGTTTG AGATTCCAGT CAGGCTTCCA AGTGGTGAGG CCACATAGGC AGTTCAGTGT AAGAATTCAG GACCAAGGCT GGGCACGGTG
GCTCACTTCT GTAATCCCAG CACTTTGGTG GCTGAGGCAG GTAGATCATT TGAGGTCAGG AGTTTGAGAC AAGCTTGGCC AACATGGTGA AACCCCATGT CTACTAAAAA TACAAAAATT
AGCCTGGTGT GGTGGCGCAC GCCTATAGTC CCAGGTTTTC AGGAGGCTTA GGTAGGAGAA TCCCTTGAAC CCAGGAGGTG CAGGTTGCAG TGAGCTGAGA TTGTGCCACT GCACTCCAGC
CTGGGTGATA GAGTGAGACT CTGTCTCAAA AAAAAAAAAA AAAAAAAAAA AAAAAACTGA AGGAATTATT CCTCAGGATT TGGGTCTAAT TTGCCCTGAG CACCAACTCC TGAGTTCAAC
TACCATGGCT AGACACACCT TAACATTTTC TAGAATCCAC CAGCTTTAGT GGAGTCTGTC TAATCATGAG TATTGGAATA GGATCTGGGG GCAGTGAGGG GGTGGCAGCC ACGTGTGGCA
GAGAAAAGCA CACAAGGAAA GAGCACCCAG GACTGTCATA TGGAAGAAAG ACAGGACTGC AACTCACCCT TCACAAAATG AGGACCAGAC ACAGCTGATG GTATGAGTTG ATGCAGGTGT
GTGGAGCCTC AACATCCTGC TCCCCTCCTA CTACACATGG TTAAGGCCTG TTGCTCTGTC
TCCAG GT TCA CAC TCT CTG CAC TAC CTC TTC ATG GGT GCC TCA GAG
Arg Ser His Ser Leu His Tyr Leu Phe Met GIy Ala Ser GIu
30 * 35
CAG GAC CTT GGT CTT TCC TTG TTT GAA GCT TTG GGC TAC GTG GAT GAC
Gin Asp Leu GIy Leu Ser Leu Phe GIu AIa Leu GIy Tyr VaI Asp Asp
40 45 50 55
CAG CTG TTC GTG TTC TAT GAT GAT GAG AGT CGC CGT GTG GAG CCC CGA GIn Leu Phe VaI Phe Tyr Asp Asp GIu Ser Arg Arg VaI GIu Pro Arg
00 65 70
ACT CCA TGG GTT TCC AGT AGA ATT TCA AGC CAG ATG TGG CTG CAG CTG Thr Pro Trp VaI Ser Ser Arg He Ser Ser GIn Met Trp Leu Gin Leu
75 30 35
AGT CAG AGT CTG AAA GGG TGG GAT CAC ATG TTC ACT GTT GAC TTC TGG Ser Gin Ser Leu Lys GIy Trp Asp His Met Phe Thr VaI Asp Phe Trp
90 9*5 100
ACT ATT ATG GAA AAT CAC AAC CAC AGC AAG G GTATGTGGAG AGGGGGCCTC Thr He Met GIu Asr. Mis Asr. ULs 3er Lys
105 HO
ACCTTCCTGA GGTTGTCAGA GCTTTTCATC TTTTCATGCA TCTTGAAGGA AACAGCTGGA AGTCTGAGGT CTTGTGGGAG CAGGGAAGAG GGAAGGAATT TGCTTCCTGA GATCATTTGG
TCCTTGGGGA TGGTGGAAAT AGGGACCTAT TCCTTTGGTT GCAGTTAACA AGGCTGGGGA
TTTTTCCAG AG TCC CAC ACC CTG CAG GTC ATC CTG GGC TGT GAA ATG GIu Ser His Thr Leu Gin VaI He Leu GIy Cys GIu Met
3 03 6 3 09 6 3156 3 216 3 27 6 3 33 6 3396 34 56 3 516
3 57 6 3 63 6 3 696 3756 3 3 02
4105 4165 42 2 5 42 7 2
31/44
• · ft · «.ft
DE/EP O 954 602 Tl
115
120
125
CAA GAA GAC AAC AGT ACC GAG GGC TAC TGG AAG TAC GGG TAT GAT GGG
Gin GIu Asp Asn Ser Thr GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy
130 135 140
CAG GAC CAC CTT GAA TTC TGC CCT GAC ACA CTG GAT TGG AGA GCA GCA
Gin Asp His Leu GIu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala
145 150 155
GAA
AGG GCC TGG CCC ACC AAG CTG GAG TGG GAA AGG CAC AAG ATT
GIu Pro Arg Ala Trp Pro Thr Lys Leu GIu Trp GIu Arg His Lys lie
160 165 170
CGG GCC AGG CAG AAC AGG GCC TAC CTG GAG AGG GAC TGC CCT GCA CAG Arg Ala Arg Gin Asn Arg Ala Tyr Leu Glu Arg Asp Cys Pro Ala Gin
175 180 135 190
CTG CAG CAG TTG CTG GAG CTG GGG AGA GGT GTT TTG GAC CAA CAA G Leu Gin GIn Leu Leu Glu Leu GIy Arg GIy VaI Leu Asp Gin Gin
195 200 205
GTATGGTGGA AACACACTTC TGCCCCTATA CTCTAGTGGC AGAGTGGAGG AGGTTGCAGG GCACGGAATC CCTGGTTGGA GTTTCAGAGG TGGCTGAGGC TGTGTGCCTC TCCAAATTCT
GGGAAGGGAC TTTCTCAATC CTAGAGTCTC TACCTTATAA TTGAGATGTA TGAGACAGCC ACAAGTCATG GGTTTAATTT CTTTTCTCCA TGCATATGGC TCAAAGGGAA GTGTCTATGG
CCCTTGCTTT TTATTTAACC AATAATCTTT TGTATATTTA TACCTGTTAA AAATTCAGAA ATGTCAAGGC CGGGCACGGT GGCTCACCCC TGTAATCCCA GCACTTTGGG AGGCCGAGGC
GGGTGGTCAC AAGGTCAGGA GTTTGAGACC AGCCTGACCA ACATGGTGAA ACCCGTCTCT AAAAAAATAC AAAAATTAGC TGGTCACAGT CATGCGCACC TGTAGTCCCA GCTAATTGGA
AGGCTGAGGC AGGAGCATCG CTTGAACCTG GGAAGCGGAA GTTGCACTGA GCCAAGATCG CGCCACTGCA CTCCAGCCTA GGCAGCAGAG TGAGACTCCA TCTTAAAAAA AAAAAAAAAA
AAAAAAAGAG AATTCAGAGA TCTCAGCTAT CATATGAATA CCAGGACAAA ATATCAAGTG AGGCCACTTA TCAGAGTAGA AGAATCCTTT AGGTTAAAAG TTTCTTTCAT AGAACATAGC
AATAATCACT GAAGCTACCT ATCTTACAAG TCCGCTTCTT ATAACAATGC CTCCTAGGTT GACCCAGGTG AAACTGACCA TCTGTATTCA ATCATTTTCA ATGCACATAA AGGGCAATTT
TATCTATCAG AACAAAGAAC ATGGGTAACA GATATGTATA TTTACATGTG AGGAGAACAA GCTGATCTGA CTGCTCTCCA AGTGACACTG TGTTAGAGTC CAATCTTAGG ACACAAAATG
GTGTCTCTCC TGTAGCTTGT TTTTTTCTGA AAAGGGTATT TCCTTCCTCC AACCTATAGA AGGAAGTGAA AGTTCCAGTC TTCCTGGCAA GGGTAAACAG ATCCCCTCTC CTCATCCTTC
CTCTTTCCTG TCAAG TG CCT CCT TTG GTG AAG GTG ACA CAT CAT GTG ACC
VaI Pro Pro Leu VaI Lys VaI Thr His His VaI Thr
210 215
TCT TCA GTG ACC ACT CTA CGG TGT CGG GCC TTG AAC TAC TAC CCC CAG Ser Ser VaI Thr Thr Leu Arg Cys Arg Ala Leu Asn Tyr Tyr Pro Gin
4320 4363 4416 4464 4510
4570
4630
4690
4750
4810
4870
4930
4990
5050
5110
5170
5230
5290
5350
5410
5470
5530
5590
5640
5683
kfi
220
225
ll
AAC ATC ACC ATG AAG TGG CTG AAG GAT AAG CAG CCA ATG GAT GCC AAG 573 6
Asn He Thr Met Lys Trp Leu Lys Asp Lys Gin Pro Met Asp Ala Lys
235 240 245
GAG TTC GAA CCT AAA GAC GTA TTG CCC AAT GGG GAT GGG ACC TAC CAG 5784
GIu Phe GIu Pro Lys Asp VaI Leu Pro Asn GIy Asp GIy Thr Tyr Gin
250 255 260 265
GGC TGG ATA ACC TTG GCT GTA CCC CCT GGG GAA GAG CAG AGA TAT ACG 53 3 2
GIy Trp He Thr Leu Ala VaI Pro Pro GIy GIu GIu GIn Arg Tyr Thr
270 275 280
TAC CAG GTG GAG CAC CCA GGC CTG GAT CAG CCC CTC ATT GTG ATC TGG G 58 31
Tyr Gin VaI GIu His Pro GIy Leu Asp Gin Pro Leu He VaI He Trp
235 290 295
GTATGTGACT GATGAGAGCC AGGAGCTGAG AAAATCTATT GGGGGTTGAG AGGAGTGCCT 59 41
GAGGAGGTAA TTATGGCAGT GAGATGAGGA TCTGCTCTTT GTTAGGGGGT GGGCTGAGGG 6001 TGGCAATCAA AGGCTTTAAC TTGCTTTTTC TGTTTTAG AG CCC TCA CCG TCT 6053
GIu Pro Ser Pro Ser 300
GGC ACC CTA GTC ATT GGA GTC ATC AGT GGA ATT GCT GTT TTT GTC GTC · 6101
GIy Thr Leu VaI He GIy VaI He Ser GIy He Ala VaI Phe VaI VaI
305 310 315
ATC TTG TTC ATT GGA ATT TTG TTC ATA ATA TTA AGG AAG AGG CAG GGT 614 9
He Leu Phe He GIy He Leu Phe He He Leu Arg Lys Arg Gin GIy
320 325 330
TCA A GTGAGTAGGA ACAAGGGGGA AGTCTCTTAG TACCTCTGCC CCAGGGCACA 62 03
GTGGGAAGAG GGGCAGAGGG GATCTGGCAT CCATGGGAAG CATTTTTCTC ATTTATATTC 62 6 3
TTTGGGGACA CCAGCAGCTC CCTGGGAGAC AGAAAATAAT GGTTCTCCCC AGAATGAAAG 63 2 3
TCTCTAATTC AACAAACATC TTCAGAGCAC CTACTATTTT GCAAGAGCTG TTTAAGGTAG 63 8 3
TACAGGGGCT TTGAGGTTGA GAAGTCACTG TGGCTATTCT CAGAACCCAA ATCTGGTAGG 644 3
GAATGAAATT GATAGCAAGT AAATGTAGTT AAAGAAGACC CCATGAGGTC CTAAAGCAGG 6 50 3
CAGGAAGCAA ATGCTTAGGG TGTCAAAGGA AAGAATGATC ACATTCAGCT GGGGATCAAG 65 6 3
ATAGCCTTCT GGATCTTGAA GGAGAAGCTG GATTCCATTA GGTGAGGTTG AAGATGATGG 6 62 3
GAGGTCTACA CAGACGGAGC AACCATGCCA AGTAGGAGAG TATAAGGCAT ACTGGGAGAT 6 63 3
TAGAAATAAT TACTGTACCT TAACCCTGAG TTTGCGTAGC TATCACTCAC CAATTATGCA 674 3
TTTCTACCCC CTGAACATCT GTGGTGTAGG GAAAAGAGAA TCAGAAAGAA GCCAGCTCAT 63 03
ACAGAGTCCA AGGGTCTTTT GGGATATTGG GTTATGATCA CTGGGGTGTC ATTGAAGGAT 68 63
CCTAAGAAAG GAGGACCACG ATCTCCCTTA TATGGTGAAT GTGTTGTTAA GAAGTTäGAT 692 3
. GAGAGGTGAG GAGACCAGTT AGAAAGCCAA TAAGCATTTC CAGATGAGAG ATA2VTGGTTc 6933
So
&Ogr;&Egr;7&egr;&Rgr;"&Oacgr;9"5*?&Iacgr;&Bgr;02&Tgr;1
33/44
TTGAAATCCA ATAGTGCCCA GGTCTAAATT GAGATGGGTG AATGAGGAAA ATAAGGAAGA 704 3
GAGAAGAGGC AAGATGGTGC CTAGGTTTGT GATGCCTCTT TCCTGGGTCT CTTGTCTCCA 7103
CAG GA GGA GCC ATG GGG CAC TAC GTC TTA GCT GAA CGT GAG 714 4 Arg GIy Ala Met GIy His Tyr VaI Leu Ala GIu Arg GIu
340 345
TGACACGCAG CCTGCAGACT CACTGTGGGA AGGAGACAAA ACTAGAGACT CAAAGAGGGA 7204
GTGCATTTAT GAGCTCTTCA TGTTTCAGGA GAGAGTTGAA CCTAAACATA GAAATTGCCT 7 2 64
GACGAACTCC TTGATTTTAG CCTTCTCTGT TCATTTCCTC AAAAAGATTT CCCCATTTAG 73 2 4
GTTTCTGAGT TCCTGCATGC CGGTGATCCC TAGCTGTGAC CTCTCCCCTG GAACTGTCTC 7334
TCATGAACCT CAAGCTGCAT CTAGAGGCTT CCTTCATTTC CTCCGTCACC TCAGAGACAT 74 4 4
ACACCTATGT CATTTCATTT CCTATTTTTG GAAGAGGACT CCTTAAATTT GGGGGACTTA 7504
CATGATTCAT TTTAACATCT GAGAAAAGCT TTGAACCCTG GGACGTGGCT AGTCATAACC 7 5 64
TTACCAGATT TTTACACATG TATCTATGCA TTTTCTGGAC CCGTTCAACT TTTCCTTTGA 762 4
ATCCTCTCTC TGTGTTACCC AGTAACTCAT CTGTCACCAA GCCTTGGGGA TTCTTCCATC 7 634
TGATTGTGAT GTGAGTTGCA CAGCTATGAA GGCTGTACAC TGCACGAATG GAAGAGGCAC ■ 77 44
CTGTCCCAGA AAAAGCATCA TGGCTATCTG TGGGTAGTAT GATGGGTGTT TTTAGCAGGT 7304
AGGAGGCAAA TATCTTGAAA GGGGTTGTGA AGAGGTGTTT TTTCTAATTG GCATGAAGGT 78 64
GTCATACAGA TTTGCAAAGT TTAATGGTGC CTTCATTTGG GATGCTACTC TAGTATTCCA 7924
GACCTGAAGA ATCACAATAA TTTTCTACCT GGTCTCTCCT TGTTCTGATA ATGAAAATTA 7984
TGATAAGGAT GATAAAAGCA CTTACTTCGT GTCCGACTCT TCTGAGCACC TACTTACATG 8 044
CATTACTGCA TGCACTTCTT ACAATAATTC TATGAGATAG GTACTATTAT CCCCATTTCT 8104
TTTTTAAATG AAGAAAGTGA AGTAGGCCGG GCACGGTGGC TCACGCCTGT AATCCCAGCA 8164
CTTTGGGAGG CCAAAGCGGG TGGATCACGA GGTCAGGAGA TCGAGACCAT CCTGGCTAAC 8 2 24
ATGGTGAAAC CCCATCTCTA ATAAAAATAC AAAAAATTAG CTGGGCGTGG TGGCAGACGC 8234
CTGTAGTCCC AGCTACTCGG AAGGCTGAGG CAGGAGAATG GCATGAACCC AGGAGGCAGA 8 34 4
GCTTGCAGTG AGCCGAGTTT GCGCCACTGC ACTCCAGCCT AGGTGACAGA GTGAGACTCC 3 4 04
ATCTCAAAAA AATAAAAATA AAAATAAAAA AATGAAAAAA AAAAGAAAGT GAAGTATAGA 3 4 64
GTATCTCATA GTTTGTCAGT GATAGAAACA GGTTTCAAAC TCAGTCAATC TGACCGTTTG 3 52 4
ATACATCTCA GACACCACTA CATTCAGTAG TTTAGATGCC TAGAATAAAT AGAGAAGGAA 3 53 4
GGAGATGGCT CTTCTCTTGT CTCATTGTGT TTCTTCTGAG TGAGCTTGAA TCACATGAAG 864 4
GGGAACAGCA GAAAACAACC AACTGATCCT CAGCTGTCAT GTTTCCTTTA .AAAGTCCCTG 3 7 04
AAGGAAGGTC CTGGAATGTG ACTCCCTTGC TCCTCTGTTG CTCTCTTTGG CATTCATTTC 3 7 64
TTTGGACCCT ACGCAAGGAC TGTAATTGGT GGGGACAGCT AGTGGCCCTG CTGGGCTTCA 33 2 4
CACACGGTGT CCTCCCTAGG CCAGTGCCTC TGGAGTCAGA ACTCTGGTGG TATTTCCCTC 8884
AATGAAGTGG AGTAAGCTCT CTCATTTTGA GATGGTATAA TGGAAGCCAC CAAGTGGCTT 894 4
AGAGGATGCC CAGGTCCTTC CATGGAGCCA CTGGGGTTCC GGTGCACATT AAAAAAAAAA 9 004
TCTAACCAGG ACATTCAGGA ATTGCTAGAT TCTGGGAAAT CAGTTCACCA TGTTCAAAAG 9 064
AGTCTTTTTT TTTTTTTTGA GACTCTATTG CCCAGGCTGG AGTGCAATGG CATGATCTCG 9124
GCTCACTGTA ACCTCTGCCT CCCAGGTTCA AGCGATTCTC CTGTCTCAGC CTCCCAAGTA 913 4
GCTGGGATTA CAGGCGTGCA CCACCATGCC CGGCTAATTT TTGTATTTTT AGTAGAGACA 9244
GGGTTTCACC ATGTTGGCCA GGCTGGTCTC GAACTCTCCT GACCTCGTGA TCCGCCTGCC 9 3 04
TCGGCCTCCC AAAGTGCTGA GATTACAGGT GTGAGCCACC CTGCCCAGCC GTCAAAAGAG 93 64
TCTTAATATA TATATCCAGA TGGCATGTGT TTACTTTATG TTACTACATG CACTTGGCTG 94 24
CATAAATGTG GTACAAGCAT TCTGTCTTGA AGGGCAGGTG CTTCAGGATA CCATATACAG 94 8 4
CTCAGAAGTT TCTTCTTTAG GCATTAAATT TTAGCAAAGA TATCTCATCT CTTCTTTTAA 954 4
ACCATTTTCT TTTTTTGTGG TTAGAAAAGT TATGTAGAAA AAAGTAAATG TGATTTACGC 9 604
TCATTGTAGA AAAGCTATAA AATGAATACA ATTAAAGCTG TTATTTAATT AGCCAGTGAA · .9 664
AAACTATTAA CAACTTGTCT ATTACCTGTT AGTATTATTG TTGCATTAAA AATGCATATA 97 2 4
CTTTAATAAA TGTATATTGT ATTGTATACT GCATGATTTT ATTGAAGTTC TTGTTCATCT 978 4
TGTGTATATA CTTAATCGCT TTGTCATTTT GGAGACATTT ATTTTGCTTC TAATTTCTTT 984 4
ACATTTTGTC TTACGGAATA TTTTCATTCA ACTGTGGTAG CCGAATTAAT CGTGTTTCTT 99 04
CACTCTAGGG ACATTGTCGT CTAAGTTGTA AGACATTGGT TATTTTACCA GCAAACCATT 99 64
CTGAAAGCAT ATGACAAATT ATTTCTCTCT TAATATCTTA CTATACTGAA AGCAGACTGC 1002 4
TATAAGGCTT CACTTACTCT TCTACCTCAT AAGGAATATG TTACAATTAA TTTATTAGGT 1003 4
AAGCATTTGT TTTATATTGG TTTTATTTCA CCTGGGCTGA GATTTCAAGA AACACCCCAG 1014 4
TCTTCACAGT AACACATTTC ACTAACACAT TTACTAAACA TCAGCAACTG TGGCCTGTTA 102 04
ATTTTTTTAA TAGAAATTTT AAGTCCTCAT TTTCTTTCGG TGTTTTTTAA GCTTAATTTT 102 64
TCTGGCTTTA TTCATAAATT CTTAAGGTCA ACTACATTTG AAAAATCAAA GACCTGCATT 103 2 4
TTAAATTCTT ATTCACCTCT GGCAAAACCA TTCACAAACC ATGGTAGTAA AGAGAAGGGT 10334
GACACCTGGT GGCCATAGGT AAATGTACCA CGGTGGTCCG GTGACCAGAG ATGCAGCGCT 104 4 4
GAGGGTTTTC CTGAAGGTAA AGGAATAAAG AATGGGTGGA GGGGCGTGCA CTGGAAATCA 10504
CTTGTAGAGA AAAGCCCCTG AAAATTTGAG AAAACA.AACA AGAAACTACT TACCAGCTAT 105 64
TTGAATTGCT GGAATCACAG GCCATTGCTG AGCTGCCTGA ACTGGGAACA CAAGAGAAGG 10624
AAAACAAACC ACTCTGATAA TCATTGAGTC AAGTACAGCA GGTGATTGAG GACTGCTGAG 10 63 4
AGGTACAGGC CAAAATTCTT ATGTTGTATT ATAATAATGT CATCTTATAA TACTGTCAGT 107 4 4
Sl
35/44
ATTTTATAAA ACATTCTTCA CAAACTCACA CACATTTAAA AACAAAACAC TGTCTCTAAA 103
ATCCCCAAAT TTTTCATAAA C ■ 1082
(2) INFORMATION FOR SEQ ID NO:3:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 348 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:8:
Met GIy Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu GIn
15 10 15
Thr Ala VaI Leu Gin GIy Arg Leu Leu Arg Ser His Ser Leu His Tyr
20 25 30
Leu Phe Met GIy AIa Ser GIu Gin Asp Leu GIy Leu Ser Leu Phe GIu
35 40 45
AIa Leu GIy Tyr VaI Asp Asp Gin Leu Phe VaI Phe Tyr Asp Asp GIu
50 55 60
Ser Arg Arg VaI GIu Pro Arg Thr Pro Trp VaI Ser Ser Arg lie Ser
65 70 75 80
Ser Gin Met Trp Leu Gin Leu Ser Gin Ser Leu Lys GIy Trp Asp His
85 90 95
Met Phe Thr VaI Asp Phe Trp Thr lie Met GIu Asn His Asn His Ser
100 105 110
Lys GIu Ser His Thr Leu Gin VaI He Leu GIy Cys GIu Met Gin GIu
115 120 125
Asp Asn Ser Thr GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy Gin Asp
130 135 . 140
His Leu GIu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala GIu Pro
145 150 155 160
Arg Ala Trp Pro Thr Lys Leu GIu Trp GIu Arg His Lys He Arg Ala
165 170 175
Arg Gin Asn Arg Ala Tyr Leu GIu Arg Asp Cys Pro Ala Gin Leu Gin
180 135 190
Gin Leu Leu GIu Leu GIy Arg GIy VaI Leu Asp Gin Gin VaI Pro Pro
195 200 * 205
Leu VaT Lys VaI Thr His His VaI Thr Ser Ser VaI Thr Thr Leu Arg
210 215 220
Cys Arg AIa Leu Asn Tyr Tyr Pro GIn Asn He Thr Met Lys Trp Leu
225 230 235 240
Lys Asp Lys Gin Pro Met Asp Ala Lys GIu Phe GIu Pro Lys Asp VaI
245 250 255
Leu Pro Asn GIy Asp GIy Thr Tyr Gin GIy Trp He Thr Leu Ala VaI
260 265 270
Pro Pro GIy GIu GIu Gin Arg Tyr Thr Tyr Gin VaI GIu His Pro GIy
280 285
Leu Asp Gin Pro Leu lie VaI He Trp GIu Pro Ser Pro Ser GIy Thr
295 300
Leu VaI He GIy VaI He Ser GIy He Ala VaI Phe VaI VaI He Leu
310 315 320
Phe He GIy He Leu Phe He He Leu Arg Lys Arg Gin GIy Ser Arg
325 330 335
GIy AIa Met GIy His Tyr VaI Leu Ala GIu Arg GIu
340 345
(2) INFORMATION FOR SEQ ID NO:9:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1440 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: 222..1263
(ix) FEATURE:
(A) NAME/KEY: allele
(B) LOCATION: replace(408, "c")
(D) OTHER INFORMATION: /phenotype= "normal or wild-type
(unaffected)" /label= 24d2
(ix) FEATURE:
(A) NAME/KEY: allele
(B) LOCATION: replace(414, "a")
(D) OTHER INFORMATION: /phenotype= "normal or wild-type
(unaffected)" /label= 24d7
(ix) FEATURE:
(A) NAME/KEY: allele
(B) LOCATION: replace(1066, "g")
(D) OTHER INFORMATION: /phenotype= "normal or wild-type
/label= 24dl
(Xi) SEQUENCE DESCRIPTION: SEQ ID NO:9:
GGGGACACTG GATCACCTAG TGTTTCACAA GCAGGTACCT TCTGCTGTAG GAGAGAGAGA 6
ACTiUVAGTTC TGAAAGACCT GTTGCTTTTC ACCAGGAAGT TTTACTGGGC ATCTCCTGAG 12
CCTAGGCAAT AGCTGTAGGG TGACTTCTGG AGCCATCCCC GTTTCCCCGC CCCCCAAAAG 18
AAGCGGAGAT TTAACGGGGA CGTGCGGCCA GAGCTGGGGA A ATG GGC CCG CGA 23
Met GIy Pro Arg 1
GCC AGG CCG GCG CTT CTC CTC CTG ATG CTT TTG CAG ACC GCG GTC CTG AIa Arg Pro AIa Leu Leu Leu Leu Met Leu Leu Gin Thr Ala VaI Leu
5 10 15 20
CAG GGG CGC TTG CTG CGT TCA CAC TCT CTG CAC TAC CTC TTC ATG GGT Gin GIy Arg Leu Leu Arg Ser His Ser Leu His Tyr Leu Phe Met GIy
25 30 * 35
GCC TCA GAG CAG GAC CTT GGT CTT TCC TTG TTT GAA GCT TTG GGC TAC 3 Ala Ser GIu GIn Asp Leu GIy Leu Ser Leu Phe GIu AIa Leu GIy Tyr
40 45 50
GTG GAT GAC CAG CTG TTC GTG TTC TAT GAT CAT GAG AGT CGC CGT GTG VaI Asp Asp GIn Leu Phe VaI Phe Tyr Asp His GIu Ser Arg Arg VaI
55 60 65
GAG CCC CGA ACT CCA TGG GTT TCC AGT AGA ATT TCA AGC CAG ATG TGG 47
GIu Pro Arg Thr Pro Trp VaI Ser Ser Arg He Ser Ser GIn Met Trp
70 75 80
CTG CAG CTG AGT CAG AGT CTG AAA GGG TGG GAT CAC ATG TTC ACT GTT Leu Gin Leu Ser GIn Ser Leu Lys GIy Trp Asp His Met Phe Thr VaI
85 90 95 100
GAC TTC TGG ACT ATT ATG GAA AAT CAC AAC CAC AGC AAG GAG TCC CAC Asp Phe Trp Thr He Met GIu Asn His Asn His Ser Lys GIu Ser His
105 HO 115
ACC CTG CAG GTC ATC CTG GGC TGT GAA ATG CAA GAA GAC AAC AGT ACC Thr Leu Gin VaI He Leu GIy Cys GIu Met Gin GIu Asp Asn Ser Thr
120 125 130
GAG GGC TAC TGG AAG TAC GGG TAT GAT GGG CAG GAC CAC CTT GAA TTC GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy Gin Asp His Leu GIu Phe
135 140 145
TGC CCT GAC ACA CTG GAT TGG AGA GCA GCA GAA CCC AGG GCC TGG CCC Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala GIu Pro Arg AIa Trp Pro
150 155 160
ACC AAG CTG GAG TGG GAA AGG CAC AAG ATT CGG GCC AGG CAG AAC AGG Thr Lys Leu GIu Trp GIu Arg His Lys He Arg AIa Arg GIn Asn Arg
165 170 175 180
GCC TAC CTG GAG AGG GAC TGC CCT GCA CAG CTG CAG CAG TTG CTG GAG 8 AIa Tyr Leu GIu Arg Asp Cys Pro AIa Gin Leu GIn Gin Leu Leu GIu
1S5 190 195
CTG GGG AGA GGT GTT TTG GAC CAA CAA GTG CCT CCT TTG GTG AAG GTG 8 Leu GIy Arg Clv VaI Leu Asp Gin Gin VaI Pro Pro Leu VaI Lys VaI
200 205 210
ACA CAT CAT GTG ACC TCT TCA GTG ACC ACT CTA CGG TGT CGG GCC TTG
Thr His His VaI Thr Ser Ser VaI Thr Thr Leu Arg Cys Arg AIa Leu
215 220 225
AAC TAC TAC CCC CAG AAC ATC ACC ATG AAG TGG CTG AAG GAT AAG CAG Asn Tyr Tyr Pro GIn Asn He Thr Met Lys Trp Lau Lys Asp Lys Gin
230 235 240
0^:7:* 1V
CCA ATG GAT GCC AAG GAG TTC GAA CCT AAA GAC GTA TTG CCC AAT GGG 1001
Pro Met Asp Ala Lys GIu Phe GIu Pro Lys Asp VaI Leu Pro Asn Gly
245 250 255 260
GAT GGG ACC TAC CAG GGC TGG ATA ACC TTG GCT GTA CCC CCT GGG GAA 104 9
Asp Gly Thr Tyr Gin Gly Trp He Thr Leu Ala VaI Pro Pro Gly GIu
265 270 275
GAG CAG AGA TAT ACG TGC CAG GTG GAG CAC CCA GGC CTG GAT CAG CCC 1097
GIu Gin Arg Tyr Thr Cys Gin VaI GIu His Pro Gly Leu Asp Gin Pro
230 235 290
CTC ATT GTG ATC TGG GAG CCC TCA CCC TCT GGC ACC CTA GTC ATT GGA 114 5
Leu He VaI He Trp GIu Pro Ser Pro Ser Gly Thr Leu VaI He Gly
295 300 305
GTC ATC AGT GGA ATT GCT GTT TTT GTC GTC ATC TTG'TTC ATT GGA ATT 119 3
VaI He Ser Gly He Ala VaI Phe VaI VaI He Leu Phe He Gly He
310 315 320
TTG TTC ATA ATA TTA AGG AAG AGG CAG GGT TCA AGA GGA GCC ATG GGG 12 41
Leu Phe He He Leu Arg Lys Arg Gin Gly Ser Arg Gly Ala Met GIy
325 330 335 340
CAC TAC GTC TTA GCT GAA CGT GAG TGACACGCAG CCTGCAGACT CACTGTGGGA 129 5
His Tyr VaI Leu Ala GIu Arg GIu
345
AGGAGACAAA ACTAGAGACT CAAAGAGGGA GTGCATTTAT GAGCTCTTCA TGTTTCAGGA 13 55
GAGAGTTGAA CCTAAACATA GAAATTGCCT GACGAACTCC TTGATTTTAG CCTTCTCTGT 1415 TCATTTCCTC AAAAAGATTT CCCCA 14 4 0
(2) INFORMATION FOR SEQ ID NO:10:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1440 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(ix) FEATURE:
(A) NAME/KEY: CDS
(3) LOCATION: 222..1263
(ix) FEATURE:
(A) NAME/KEY: ailele
(B) LOCATION: replace(1066, "a")
(D) OTHER INFORMATION: /phenotype= "Hereditary Hemochromatosis
(HH)"
/label= 24dl
(Xi) SEQUENCE DESCRIPTION: SEQ ID NO:10:
GGGGACACTG GATCACCTAG TGTTTCACAA GCAGGTACCT TCTGCTGTAG GAGAGAGAGA 60
ACTAAAGTTC TGAAAGACCT GTTGCTTTTC ACCAGGAAGT TTTACTGGGC ATCTCCTGAG 12 0
u D|/,£R.4.95i SD2T1
39/44 *·
CCTAGGCAAT AGCTGTAGGG TGACTTCTGG AGCCATCCCC GTTTCCCCGC CCCCCAAAAG
AAGCGGAGAT TTAACGGGGA CGTGCGGCCA GAGCTGGGGA A ATG GGC CCG CGA
Met GIy Pro Arg 1
CCC AGG CCG GCG CTT CTC CTC CTG ATG CTT TTG CAG ACC GCG GTC CTG
AIa Arg Pro AIa Leu Leu Leu Leu Met Leu Leu Gin Thr Ala VaI Leu
5 10 15 20
CAG GGG CGC TTG CTG CGT TCA CAC TCT CTG CAC TAC CTC TTC ATG GGT 3 Gin GIy Arg Leu Leu Arg Ser His Ser Leu His Tyr Leu Phe Met GIy
25 30 35
GCC TCA GAG CAG GAC CTT GGT CTT TCC TTG TTT GAA GCT TTG GGC TAC 3 AIa Ser GIu Gin Asp Leu GIy Leu Ser Leu Phe GIu AIa Leu GIy Tyr
40 45 50
GTG GAT GAC CAG CTG TTC GTG TTC TAT GAT CAT GAG AGT CGC CGT GTG 42
VaI Asp Asp Gin Leu Phe VaI Phe Tyr Asp His GIu Ser Arg Arg VaI
55 60 65
GAG CCC CGA ACT CCA TGG GTT TCC AGT AGA ATT TCA AGC CAG ATG TGG
GIu Pro Arg Thr Pro Trp VaI Ser Ser Arg He Ser Ser GIn Met Trp
70 75 80
CTG CAG CTG AGT CAG AGT CTG AAA GGG TGG GAT' CAC ATG TTC ACT GTT ·
Leu Gin Leu Ser GIn Ser Leu Lys GIy Trp Asp His Met Phe Thr VaI
85 90 95 100
GAC TTC TGG ACT ATT ATG GAA AAT CAC AAC CAC AGC AAG GAG TCC CAC Asp Phe Trp Thr He Met GIu Asn His Asn His Ser Lys GIu Ser His
105 110 115
ACC CTG CAG GTC ATC CTG GGC TGT GAA ATG CAA GAA GAC AAC AGT ACC Thr Leu Gin VaI He Leu GIy Cys GIu Met Gin GIu Asp Asn Ser Thr
120 125 130
GAG GGC TAC TGG AAG TAC GGG TAT GAT GGG CAG GAC CAC CTT GAA TTC 6 GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy Gin Asp His Leu GIu Phe
135 140 145
TGC CCT GAC ACA CTG GAT TGG AGA GCA GCA GAA CCC AGG GCC TGG CCC Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala GIu Pro Arg AIa Trp Pro
150 155 160
ACC AAG CTG GAG TGG GAA AGG CAC AAG ATT CGG GCC AGG CAG AAC AGG Thr Lys Leu GIu Trp GIu Arg His Lys He Arg AIa Arg Gin Asn Arg
165 " 170 175 180
GCC TAC CTG GAG AGG GAC TGC CCT GCA CAG CTG CAG CAG TTG CTG GAG 8 AIa Tyr Leu GIu Arg Asp Cys Pro Ala GLn Leu Gin GIn Leu Leu GIu
185 190 195
CTG GGG AGA GGT GTT TTG GAC CAA CAA GTG CCT CCT TTG GTG AAG GTG 3
Leu GIy Arg GIy VaI Leu Asp Gin Gin VaI Pro Pro Leu VaI Lys VaI
200 205 210
ACA CAT CAT GTG ACC TCT TCA GTG ACC ACT CTA CGG TGT CGG GCC TTG Thr His His VaI Thr Ser Ser VaI Thr Thr Leu Arg Cys Arg AIa Leu
215 220 225
AAC TAC TAC CCC CAG AAC ATC ACC ATG AAG TGG CTG AAG GAT AAG CAG 9
Asn Tyr Tyr Pro GIn Asn He Thr Met Lys Trp Leu Lys Asp Lys GIn
5?
40/44
235
DE / EP 0 954 602Tl
24V *~ '
CCA ATG GAT GCC AAG GAG TTC GAA CCT AAA GAC GTA TTG CCC AAT GGG 1001
Pro Met Asp Ala Lys GIu Phe GIu Pro Lys Asp VaI Leu Pro Asn GIy
245 250 * 255 260
GAT GGG ACC TAC CAG GGC TGG ATA ACC TTG GCT GTA CCC CCT GGG GAA 104 9
Asp GIy Thr Tyr Gin GIy Trp Ils Thr Leu Ala VaI Pro Pro GIy GIu
265 270 275
GAG CAG AGA TAT ACG TAC CAG GTG GAG CAC CCA GGC CTG GAT CAG CCC 1097
Glu Gin Arg Tyr Thr Tyr Gin VaI GIu His Pro GIy Leu Asp Gin Pro
230 235 290
CTC ATT GTG ATC TGG GAG CCC TCA CCG TCT GGC ACC CTA GTC ATT GGA 114 5
Leu lie VaI He Trp Glu Pro Ser Pro Ser GIy Thr Leu VaI He GIy
295 300 305
GTC ATC AGT GGA ATT GCT GTT TTT GTC GTC ATC TTG TTC ATT GGA ATT 119 3
VaI He Ser GIy He Ala VaI Phe VaI VaI He Leu Phe He GIy He
; 310 315 320
TTG TTC ATA ATA TTA AGG AAG AGG CAG GGT TCA AGA GGA GCC ATG GGG 1241
Leu Phe He He Leu Arg Lys Arg Gin GIy Ser Arg GIy Ala Met GIy
325 330 ' 335 ' 340
CAC TAC GTC TTA GCT GAA CGT GAG TGACACGCAG CCTGCAGACT CACTGTGGGA · 1295
His Tyr VaI Leu AIa Glu Arg Glu
345
AGGAGACAAA ACTAGAGACT CAAAGAGGGA GTGCATTTAT GAGCTCTTCA TGTTTCAGGA 1355
GAGAGTTGAA CCTAAACATA GAAATTGCCT GACGAACTCC TTGATTTTAG CCTTCTCTGT 1415 TCATTTCCTC AAAAAGATTT CCCCA 144 0
(2) INFORMATION FOR SEQ ID NO:11:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1440 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: 222..1263
(ix) FEATURE:
(A) NAME/KEY: allele
(B) LOCATION: replace (403, "g")
(D) OTHER INFORMATION: /phenotype= "Hereditary Hemochromatosis
(HH)"
/label= 24d2
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:11:
GGGGACACTG GATCACCTAG TGTTTCACAA GCAGGTACCT TCTGCTGTAG GAGAGAGAGA
60
41/44 "
ACTAAAGTTC TGAAAGACCT GTTGCTTTTC ACCAGGAAGT TTTACTGGGC ATCTCCTGAG
CCTAGGCAAT AGCTGTAGGG TGACTTCTGG AGCCATCCCC GTTTCCCCGC CCCCCAAAAG 18
AAGCGGAGAT TTAACGGGGA CGTGCGGCCA GAGCTGGGGA A ATG GGC CCG CGA 23
Met GIy Pro Arg 1
GCC AGG CCG GCG CTT CTC CTC CTG ATG CTT TTG CAG ACC GCG GTC CTG
AIa Arg Pro AIa Leu Leu Leu Leu Met Leu Leu Gin Thr Ala VaI Leu
5 10 15 20
CAG GGG CGC TTG CTG CGT TCA CAC TCT CTG CAC TAC CTC TTC ATG GGT 3 Gin GIy Arg Leu Leu Arg Ser His Ser Leu His Tyr Leu Phe Met GIy
25 30 35
GCC TCA GAG CAG GAC CTT GGT CTT TCC TTG TTT GAA GCT TTG GGC TAC AIa Ser GIu GIn Asp Leu GIy Leu Ser Leu Phe GIu AIa Leu GIy Tyr
40 45 50
GTG GAT GAC CAG CTG TTC GTG TTC TAT GAT GAT GAG AGT CGC CGT GTG 42
VaI Asp Asp GIn Leu Phe VaI Phe Tyr Asp Asp GIu Ser Arg Arg VaI
55 60 65
GAG CCC CGA ACT CCA TGG GTT TCC AGT AGA ATT TCA AGC CAG ATG TGG GLu Pro Arg Thr Pro Trp VaI Ser Ser Arg He Ser Ser Gin Met Trp
70 75 30
CTG CAG CTG AGT CAG AGT CTG AAA GGG TGG GAT CAC ATG TTC ACT GTT
Leu GIn Leu Ser GIn Ser Leu Lys GIy Trp Asp His Met Phe Thr VaI
85 90 95 100
GAC TTC TGG ACT ATT ATG GAA AAT CAC AAC CAC AGC AAG GAG TCC CAC Asp Phe Trp Thr He Met GIu Asn His Asn His Ser Lys GIu Ser His
105 110 115
ACC CTG CAG GTC ATC CTG GGC TGT GAA ATG CAA GAA GAC AAC AGT ACC Thr Leu Gin VaI He Leu GIy Cys GIu Met Gin GIu Asp Asn Ser Thr
120 125 130
GAG GGC TAC TGG AAG TAC GGG TAT GAT GGG CAG GAC CAC CTT GAA TTC GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy Gin Asp His Leu GIu Phe
135 140 145
TGC CCT GAC ACA CTG GAT TGG AGA GCA GCA GAA CCC AGG GCC TGG CCC Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala GIu Pro Arg AIa Trp Pro
150 155 160
ACC AAG CTG GAG TGG GAA AGG CAC AAG ATT CGG GCC AGG CAG AAC AGG Thr Lys Leu GIu Trp GIu Arg His Lys He Arg AIa Arg Gin Asn Arg
165 170 175 ISO
GCC TAC CTG GAG AGG GAC TGC CCT GCA CAG CTG CAG CAG TTG CTG GAG 3 AIa Tyr Leu GIu Arg Asp Cys Pro Ala GIn Leu Gin GIn Leu Leu GIu
135 190 195
CTG GGG AGA GGT GTT TTG GAC CAA CAA GTG CCT CCT TTG GTG AAG GTG 3 Leu GIy Arg GIy VaI Leu Asp Gin Gin VaI Pro Pro Leu VaI Lys VaI
200 205 210
ACA CAT CAT GTG ACC TCT TCA GTG ACC ACT CTA CGG TGT CGG GCC TTG 90
Thr His His VaI Thr Ser Ser VaI Thr Thr Leu Arg Cys Arg AIa Leu
215 220 225
42/44
AAC TAC TAC CCC CAG AAC ATC ACC ATG AAG TGG CTG AAG GAT AAG CAG 953
Asn Tyr Tyr Pro Gin Asn He Thr Met Lys Trp Leu Lys Asp Lys Gin
230 235 240
CCA ATG GAT GCC AAG GAG TTC GAA CCT AAA GAC GTA TTG CCC AAT GGG 1001
Pro Met Asp Ala Lys GIu Phe C-Iu Pro Lys Asp VaI Leu Pro Asn GIy
245 250 255 260
GAT GGG ACC TAC CAG GGC TGG ATA ACC TTG GCT GTA CCC CCT GGG GAA 1049
Asp GIy Thr Tyr Gin GIy Trp He Thr Le,u Ala VaI Pro Pro GIy GIu
2 65 270 .275
GAG CAG AGA TAT ACG TGC CAG GTG GAG CAC CCA GGC CTG GAT CAG CCC 1097
GIu Gin Arg Tyr Thr Cys Gin VaI GIu His Pro GIy Leu Asp Gin Pro
230 235 " 290
CTC ATT GTG ATC TGG GAG CCC TCA CCG TCT GGC ACC CTA GTC ATT GGA 114 5
Leu He VaI He Trp GIu Pro Ser Pro Ser GIy Thr Leu VaI He GIy
295 300 305
GTC ATC AGT GGA ATT GCT GTT TTT GTC GTC ATC TTG TTC ATT GGA ATT 119 3
VaI He Ser GIy He Ala VaI Phe VaI VaI He Leu Phe He GIy He
310 315 320
TTG TTC ATA ATA TTA AGG AAG AGG CAG GGT TCA AGA GGA GCC ATG GGG 1241
Leu Phe He He Leu Arg Lys Arg Gin GIy Ser Arg Gly Ala Met GIy
325 330 335 340
CAC TAC GTC TTA GCT GAA CGT GAG TGACACGCAG CCTGCAGACT CACTGTGGGA 12 95
His Tyr VaI Leu Ala GIu Arg GIu
345
AGGAGACAAA ACTAGAGACT CAAAGAGGGA GTGCATTTAT GAGCTCTTCA TGTTTCAGGA 13 55
GAGAGTTGAA CCTAAACATA GAAATTGCCT GACGAACTCC TTGATTTTAG CCTTCTCTGT 1415 TCATTTCCTC AAAAAGATTT CCCCA 14 4 0
(2) INFORMATION FOR SEQ ID NO:12:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1440 base pairs
(3) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: 222..1263
(ix) FEATURE:
(A) NAME/KEY: allele
(B) LOCATION: replace(403, "g")
(D) OTHER INFORMATION: /phenotype= "Hereditary Hemochroinatosis
(HH) »
/label= 24d2
(ix) FEATURE:
(A) NAME/KEY: allele
43/44
• · t · « at·» ·
OE/EP O 954 802 Tl
(B) LOCATION: replace(1066, "a")
(D) OTHER INFORMATION: /phenotype= "Hereditary Hemochromatosis
(HH)"
/label= 24dl
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:12:
GGGGACACTG GATCACCTAG TGTTTCACAA GCAGGTACCT TCTGCTGTAG GAGAGAGAGA 60
ACTAAAGTTC TGAAAGACCT GTTGCTTTTC ACCAGGAAGT TTTACTGGGC ATCTCCTGAG 120
CCTAGGCAAT AGCTGTAGGG TGACTTCTGG AGCCATCCCC GTTTCCCCGC CCCCCAAAAG 130
AAGCGGAGAT TTAACGGGGA CGTGCGGCCA GAGCTGGGGA A ATG GGC CCG CGA 23 3
Met GIy Pro Arg 1
GCC AGG CCG GCG CTT CTC CTC CTG ATG CTT TTG CAG ACC GCG GTC CTG 281
AIa Arg Pro AIa Leu Leu Leu Leu Met Leu Leu Gin Thr Ala VaI Leu
5 10 15 20
CAG GGG CGC TTG CTG CGT TCA CAC TCT CTG CAC TAC CTC TTC ATG GGT 329
Gin GIy Arg Leu Leu Arg Ser His Ser Leu His Tyr Leu Phe Met GIy
25 30 * 35
GCC TCA GAG CAG GAC CTT GGT CTT TCC TTG TTT GAA GCT TTG GGC TAC - 3 77
AIa Ser GIu Gin Asp Leu GIy Leu Ser Leu Phe GIu AIa Leu GIy Tyr
40 45 50
GTG GAT GAC CAG CTG TTC GTG TTC TAT GAT GAT GAG AGT CGC CGT GTG 425
VaI Asp Asp Gin Leu Phe VaI Phe Tyr Asp Asp GIu Ser Arg Arg VaI
55 60 65
GAG CCC CGA ACT CCA TGG GTT TCC AGT AGA ATT TCA AGC CAG'ATG TGG 473
GIu Pro Arg Thr Pro Trp VaI Ser Ser Arg He Ser Ser GIn Met Trp
70. 75 80
CTG CAG CTG AGT CAG AGT CTG AAA GGG TGG GAT CAC ATG TTC ACT GTT 521
Leu GIn Leu Ser GIn Ser Leu Lys GIy Trp Asp His Met Phe Thr VaI
85 90 95 100
GAC TTC TGG ACT ATT ATG GAA AAT CAC AAC CAC AGC AAG GAG TCC CAC 569
Asp Phe Trp Thr He Met GIu Asn His Asn His Ser Lys GIu Ser His
105 HO 115
ACC CTG CAG GTC ATC CTG GGC TGT GAA ATG CAA GAA GAC AAC AGT ACC . 617
Thr Leu Gin VaI He Leu GIy Cys GIu Met Gin GIu Asp Asn Ser Thr
120 125 130
GAG GGC TAC TGG AAG TAC GGG TAT GAT GGG CAG GAC CAC CTT GAA TTC 6 65
GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy Gin Asp His Leu GIu Phe
135 140 * 145
TGC CCT GAC ACA CTG GAT TGG AGA GCA GCA GAA CCC AGG GCC TGG CCC 713
Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala GIu Pro Arg AIa Trp Pro
150 155 160
ACC AAG CTG GAG TGG GAA AGG CAC AAG ATT CGG GCC AGG CAG AAC AGG 761
Thr Lys Leu GIu Trp GIu Arg His Lys He Arg AIa Arg GIn Asn Arg
165 170 175 180
GCC TAC CTG GAG AGG GAC TGC CCT GCA CAG CTG CAG CAG TTG CTG GAG 3 09
AIa Tyr Leu GIu Arg Asp Cys Pro Ala GIn Leu Gin GIn Leu Leu GIu
44/44 DE/EP O 954 602 T1
185 190 195
CTG GGG AGA GGT GTT TTG GAC CAA CAA GTG CCT CCT TTG GTG AAG GTG 3 5f
Leu GIy Arg GIy VaI Leu Asp Gin Gin VaI Pro Pro Leu VaI Lvs VaI
200 205 210
ACA CAT CAT GTG ACC TCT TCA GTG ACC ACT CTA CGG TGT CGG GCC TTG 9 05
Thr His His VaI Thr Ser Ser VaI Thr Thr Leu Arg Cys Arg Ala Leu
215 220 225
AAC TAC TAC CCC CAG AAC ATC ACC ATG AAG TGG CTG AAG GAT AAG CAG 35J
Asn Tyr Tyr Pro Gin Asn lie Thr Met Lys Trp Leu Lys Asp Lys Gin
230 235 240
CCA ATG GAT GCC AAG GAG TTC GAA CCT AAA GAC GTA TTG CCC AAT GGG 1001
Pro Met Asp Ala Lys GIu Phe GIu Pro Lys Asp VaI Leu Pro Asn GIy
245 250 255 260
GAT GGG ACC TAC CAG GGC TGG ATA ACC TTG GCT GTA CCC CCT GGG GAA 104 9
Asp GIy Thr Tyr Gin GIy Trp lie Thr Leu Ala VaI Pro Pro GIy GIu
265 270 275
GAG CAG AGA TAT ACG TAC CAG GTG GAG CAC CCA GGC CTG GAT CAG CCC 109 7
GIu Gin Arg Tyr Thr Tyr Gin VaI GIu His Pro GIy Leu Asp Gin Pro
280 235 290
CTC ATT GTG ATC TGG GAG CCC TCA CCG TCT GGC ACC CTA GTC ATT GGA · 114 5
Leu lie VaI lie Trp Glu Pro Ser Fro Ser GIy Thr Leu VaI lie GIy
295 300 305
GTC ATC AGT GGA ATT GCT GTT TTT GTC GTC ATC TTG TTC ATT GGA ATT 119 3
VaI lie Ser GIy lie Ala VaI Phe VaI VaI He Leu Phe He GIy He
310 315 320
TTG TTC ATA ATA TTA AGG AAG AGG CAG GGT TCA AGA GGA GCC ATG GGG 12 41
Leu Phe He He Leu Arg Lys Arg Gin GIy Ser Arg GIy Ala Met GIy
325 330 335 340
CAC TAC GTC TTA GCT GAA CGT GAG TGACACGCAG CCTGCAGACT CACTGTGGGA 12 9 5
His Tyr VaI Leu AIa Glu Arg GIu
345
AGGAGACAAA ACTAGAGACT CAAAGACGGA GTGCATTTAT GAGCTCTTCA TGTTTCAGGA 13 5 5
GAGAGTTGAA CCTAAACATA GAAATTGCCT-..GACGAACTCC ..TTGATTTTAG CCTTCTCTGT 1415
TCATTTCCTC AAAAAGATTT CCCCA 14 4 0