DE954602T1

DE954602T1 - Erbliches hemochromatosis-gen

Info

Publication number: DE954602T1
Application number: DE0954602T
Authority: DE
Inventors: Dennis Drayna; John Feder; Andreas Gnirke; David Ruddy; Winston Thomas; Zenta Tsuchihashi; Roger Wolff
Original assignee: Bio Rad Laboratories Inc
Current assignee: Bio Rad Laboratories Inc
Priority date: 1996-04-04
Filing date: 1997-04-04
Publication date: 2002-08-22
Also published as: EP0954602A1; EP0954602A4; CA2253240A1; CA2253240C; ATE298002T1; EP1591537B1; DE69733572T2; AU733459B2; AU2670197A; US6228594B1; EP1591537A3; WO1997038137A1; DE69733572D1; US6025130A; EP1591537A2; EP0954602B1

Claims

Ansprüche

1. Isolierte Nucleinsäure, die eine Nucleinsäureseauenz umfaßt, die aus der Gruppe ausgewählt ist, die besteht aus:

a. Nucleinsäuresequenzen, die der Nucleinsäure von SEQ ID NO:1 entsprechen;

b. Nucleinsäuresequenzen, die den Nucleinsäuresequenzen entsprechen, die aus der Gruppe ausgewählt sind, die besteht aus SEQ ID NO:3; SEQ ID NO:5, SEQ ID NO:7;

c. Nucleinsäuresequenzen, die der Nucleinsäuresequenz von SEQ ID NO:9 entsprechen; und

d. Nucleinsäuresequenzen, die den Nucleinsäuresequenzen entsprechen, die aus der Gruppe ausgewählt sind, die besteht aus SEQ ID NO:10, SEQ ID NO:11 und SEQ ID NO:12.

2. Nucleinsäure nach Anspruch 1, wobei die Nucleinsäure Genom DNA ist.

3. Nucleinsäure nach Anspruch 2, wobei die DNA cDNA ist.

4. Nucleinsäure nach Anspruch 1, wobei die Nucleinsäure eine Nucleinsäuresequenz ist, die der Nucleinsäure von SEQ ID NO:1 entspricht.

5. Nucleinsäure nach Anspruch 1, wobei die Nucleinsäure eine Nucleinsäuresequenz ist, die der Nucleinsäuresequenz von SEQ ID NO:9 entspricht.

6. Nucleinsäure nach Anspruch 1, wobei die Nucleinsäure eine Nucleinsäuresequenz ist, die einer Nucleinsäuresequenz entspricht, die aus der Gruppe ausgewählt isc, die besteht aus SEQ ID NO:3, SEQ ID NO:5 und SEQ NO:7.

7. Nucleinsäure nach Anspruch 1, wobei die Nucleinsäure eine Nucleinsäureseauenz ist, die einer Nucleinsäure ent-

spricht, die aus der Gruppe ausgewählt ist, die besteht aus SEQ ID NO:10, SEQ ID NO:11 und SEQ ID NO:12.

8. Nucleinsäure, die ein RNA-Äquivalent der Nucleinsäure von Anspruch 1 umfaßt.

9. Klonierungsvektor, der eine codierende Sequenz aus einer Nucleinsäure aufweist, wie sie in irgendeinem der Ansprüche 1 bis 7 aufgeführt ist, sowie ein Replikon, das in einer Wirtszelle für den Vektor wirksam ist.

10. Expressionsvektor, der eine codierenden Sequenz aus einer Nucleinsäure aufweist, wie sie in irgendeinem der Ansprüche 1 bis 7 aufgeführt ist, die funktional mit einer Promotorsequenz verknüpft ist, die in der Lage ist, die Expression der Codiersequenz in einer Wirtszelle für den Vektor zu steuern.

11. Wirtszelle, die mit einem Vektor transformiert ist, wie er in irgendeinem der Ansprüche 9 und 10 aufgeführt ist.

12. Verfahren zur Herstellung eines mutanten HH-Polypeptids, das umfaßt:

a. Transformieren von Wirtszellen mit einem Vektor, der in der Lage ist, ein Polypeptid auf der Grundlage einer Nucleinsäuresequenz zu exprimieren, wie sie in irgendeinem der Ansprüche 6 und 7 aufgeführt ist;

b. Kultivieren der Zellen unter Bedingungen, die für die Produktion des Polypeptids geeignet sind; und

c. Gewinnen des Polypeptids.

13. Peptidprodukt, das aus der Gruppe ausgewählt ist, die besteht aus:

a. einem Polypeptid, das die Aminosäuresequenz aufweist, die der Sequenz SEQ ID NO:2 entspricht;

· &Idigr; J ·

b. einem Polypeptid, das die Aminosäuresequenz aufweist, die der Sequenz SEQ ID NO:4, SEQ ID NO:6 oder SEQ ID NO:8 entspricht,

c. einem Peptid, das wenigstens 6 Aminosäurereste aufweist, die der Sequenz von SEQ ID NO:2 entsprechen; und

d. einem Peptid, das wenigstens 6.Aminosäurereste aufweist, die der Sequenz von SEQ ID NO:4, SEQ ID NO:6 und SEQ ID NO:8 entsprechen.

14. Peptidprodukt nach Anspruch 13, wobei das Peptid markiert ist.

15. Peptidprodukt nach Anspruch 13, wobei das Peptid ein Fusionsprotein ist.

16. Verwendung von Peptiden, wie sie in irgendeinem der Ansprüche 13 bis 15 aufgeführt sind, als ein Immunogen zur Erzeugung von Antikörpern.

17. Antikörper, der gemäß Anspruch 16 hergestellt wurde.

18. Antikörper nach Anspruch 17, wobei der Antikörper markiert ist.

19. Antikörper nach Anspruch 17, wobei der Antikörper an einen festen Träger gebunden ist.

20. Antikörper nach Anspruch 17, wobei der Antikörper monoklonal ist.

21. Verfahren zur Bestimmung des Vorliegens oder des Fehlens der verbreiteten Mutation des Gens der hereditären Hämochromatose (HH) bei einem Individuum, das umfaßt: Gewinnen einer DNA oder RNA des Individuums; und Untersuchen der DNA oder RNA auf das Vorliegen oder

Fehlen des HH-assoziierten Alleis A einer Basenpaarmutation, die hierin als 24dl bezeichnet wird,

DE/EP O 954 4Ö2T1

wobei, im Ergebnis, die Abwesenheit des Alieis auf das Fehlen der HH-Genmutation im Genom des Individuums hinweist, und das Vorliegen des Alieis auf das Vorliegen der HH-Genmutation im Genom des Individuums hinweist.

22. Verfahren nach Anspruch 21, bei dem das Verfahren außerdem die Untersuchung der RNA oder DNA auf das Vorliegen von 24d2 umfaßt.

23. Verfahren nach Anspruch 21, wobei das Verfahren außerdem die Untersuchung der RNA oder DNA auf das Vorliegen von wenigstens einem der Polymorphismen HHP-I, HHP-19 oder HHP-29, oder der Mikrosatelliten-Repeatallele 19D9:205; 18B4:235; 1A2:239; 1E4:271; 24E2:245; 2B8:206; 3321-1:98; 4073-1:182; 4440-1:180; 4440-2:139; 731-1:177; 5091-1:148; 3216-1:221; 4072-2:170; 950-1:142; 950-2:164, 950-3:165; 950-4:128; 950-6:151; 950-8:137; 63-1:151; 63-2:113; 63-3:169; 65-1:206; 65-2:159; 68-1:167; 241-5:108; 241-29:113; 373-8:151; und 373-29:113, D6S258:199, D6S265:122, D6S105:124; D6S306:238; D6S464:206 und D6S1001:180 umfaßt.

24. Verfahren nach Anspruch 22, wobei das Verfahren außerdem die Untersuchung der RNA oder DNA auf das Vorliegen von wenigstens einem der Polymorphismen HHP-I, HHP-19 oder HHP-29, oder der Mikrosatelliten-Repeatallele 19D9:205; 18B4:235; 1A2:239; 1E4:271; 24E2:245; 2B8:206; 3321-1:98; 4073-1:182; 4440-1:180; 4440-2:139;. 731-1:177; 5091-1:148; 3216-1:221; 4072-2:170; 950-1:142; 950-2:164, 950-3:165; 950-4:128; 950-6:151; 950-8:137; 63-1:151; 63-2:113; 63-3:169; 65-1:206; 65-2:159; 68-1:167; 241-5:108; 241-29:113; 373-8:151; und 373-29:113, D6S258:199, D6S265:122, D6S105:124; D6S306:238; D6S464:206 und D6S1001:180 umfaßt.

25. Verfahren zur Diagnose, ob ein Patient an der hereditären Hämochromatose (HH)-Krankheit leidet, das umfaßt:

a. Inkontaktbringen von Zellen des Patienten mit Antikörpern, die gegen ein Epitop auf einem HH-Proteinprodukt

• ·

DE/EP O 954 6.02 T1

gerichtet sind, das im wesentlichen SEQ ID NO:2 entspricht, und

b. Beobachten, ob die Antikörper sich an den Zellen anordnen, wobei, im Beobachtungsschritt, dann, wenn sich die Antikörper nicht an der Zelle ansammeln, es wahrscheinlich ist, daß der Patient an HH leidet.

25. Verfahren nach Anspruch 25, wobei das Verfahren in vitro durchgeführt wird.

27. Verfahren nach Anspruch 25, wobei das Verfahren in vivo durchgeführt wird.

28. Verfahren zur Behandlung eines Patienten, bei dem die Diagnose ergab, daß er die hereditäre Hämochromatose (HH) Krankheit hat und homozygot für eine 24dl(A)-Mutation ist, das die Verabreichung eines Polypeptids umfaßt, das der Aminosäuresequenz von SEQ ID NO:2 entspricht, an Gewebe des Patienten.

29. Verfahren nach Anspruch 28, bei dem das Polypeptid indirekt an die Gewebe verabreicht wird.

30. Verfahren nach Anspruch 28, bei dem das Polypeptid intravenös verabreicht wird.

31. Verfahren nach Anspruch 28, bei dem das Polypeptid mittels Gentherapie an die Gewebe verabreicht wird.

32. Tiermodell für die hereditäre Hämochromatose (HH)-Krankheit, das ein Säugetier umfaßt, das ein mutantes oder stillgelegtes HH-Gen aufweist.

33. Metallchelatisierungsmittel, die sich von Nucleinsäuresequenzen gemäß Anspruch 1 oder von einem Peptidprodukt gemäß Anspruch 13 ableiten, in einem physiologisch annehmbaren Träger.

34. Chelatisierungsmittel nach Anspruch 33, bei dem das Metall ausgewählt ist aus der Gruppe, die besteht aus Eisen, Quecksilber, Cadmium, Blei und Zink.

35. Verfahren zum Screenen von Säugetieren auf ihre Empfindlichkeit gegenüber Metall-Toxizitäten, das das Screenen derartiger Säugetiere auf eine Mutation im HH-Gen umfaßt, und wobei diejenigen Säugetiere, bei denen festgestellt wurde, dass sie eine Mutation aufweisen, empfindlicher gegenüber Metalltoxizitäten sind als Säugetiere, bei denen eine Mutation nicht festgestellt wurde.

36. Verfahren nach Anspruch 35, bei dem das Metall aus der Gruppe ausgewählt ist, die besteht aus Eisen, Quecksilber, Cadmium, Blei und Zink.

37. Verfahren zum Selektieren von Patienten, die mit dem Hepatitisvirus infiziert sind, für eine a-Interferon-Behandlung, das das Screenen derartiger Patienten auf eine Mutation im HH-Gen umfaßt, wobei diejenigen Patienten, bei denen nicht festgestellt wurde, daß sie eine Mutation aufweisen, für eine Weiterbehandlung mittels einer a-Interferon-Behandlung ausgewählt werden, während diejenigen, bei denen eine Mutation festgestellt wurde, ausgewählt werden, sich vor einer &agr;-Interferon-Behandlung einer Phlebotomie zu unterziehen.

38. T-ZeIl-Differenzierungsfaktor, der eine Einheit aufweist, die aus der Gruppe ausgewählt ist, die aus Molekülen besteht, die sich von Nucleinsäuresequenzen gemäß Anspruch und einem Peptidprodukt gemäß Anspruch 13 ableiten.

39. Verfahren zum Screenen von potentiellen therapeutischer. Mitteln auf eine Aktivität im Zusammenhang mit der HH-Krankheit, das umfaßt:

Bereitstellen eines Screening-Werkzeugs, das aus der Gruppe ausgewählt ist, die besteht aus einer Zellinie, einem

zellfreien Extrakt sowie einem Säugetier, die ein defektes HH-Gen oder -Genprodukt enthalten oder exprimieren;

Inkontaktbringen des Screening-Werkzeugs mit dem potientiellen therapeutischen Mittel; und

Untersuchen des Screening-Werkzeugs auf eine Aktivität, die aus der Gruppe ausgewählt ist, die besteht aus Falten des HH-Proteins, Eisenaufnahme, Eisentransport, Eisenstoffwechsel, rezeptorähnlichen Aktivitäten, Stromauf-Prozessen, Stromab-Prozessen, Gentranskription und Signalereignissen.

40. Therapeutisches Mittel zur Minderung einer Schädigung aufgrund oxidativer Prozesse in vivo, das eine Einheit umfaßt, die aus der Gruppe ausgewählt ist, die aus Molekülen besteht, die sich ableiten von Nucleinsäuresequenzen gemäß Anspruch 1 und einem Peptidprodukt gemäß Anspruch 13.

41. Verfahren zur Diagnostizierung eines Patienten als einem, der ein erhöhtes Risiko zur Entwicklung der HH-Krankheit aufweist, das umfaßt:

Gewinnen von DNA oder RNA des Individuums; und Untersuchen der DNA oder RNA auf die Anwesenheit oder das Fehlen des HH-assoziierten Allels A oder einer hierin 24dl genannten Basenmutation in Kombination mit der Untersuchung der DNA oder RNA auf das HH-assoziierte Allel G oder eine Basenmutation, die hierin 24d2 genannt wird,

wobei, im Ergebnis, die Abwesenheit der Allele auf das Fehlen der HH-Genmutation im Genom des Individuums hinweist, und das Vorliegen der Allele auf das Vorliegen der HH-Genmutation im Genom des Individuums und ein erhöhtes Risiko zur Entwicklung der HH-Krankheit hinweist.

42. Verfahren nach Anspruch 41, wobei das Verfahren außerdem die Untersuchung der RNA oder DNA auf die Anwesenheit von wenigstens einem von den Polymorphismen HHP-I, HHP-19 oder HHP-29, oder der Mikrosatelliten-Repeatallele 19D9-.205; 18B4:235; 1A2:239; 1E4:271; 24E2:245; 2B8:206; 3321-1:98; 4073-1:182; 4440-1:180; 4440-2:139; 731-1:177; 5091-1:148;

-&bgr;- DE/EP O 954602T1

3216-1:221; 4072-2:170; 950-1:142; 950-2:164, 950-3:165; 950-4:128; 950-6:151; 950-8:137; 63-1:151; 63-2:113; 63-3:169; 65-1:206; 65-2:159; 68-1:167; 241-5:108; 241-29:113; 373-8:151; und 373-29:113, D6S258:199, D6S265:122, D6S105:124; D6S306:238; D6S464:206 und D6S1001:180 umfaßt.

43. Therapeutisches Mittel zur Milderung einer Eisenüberlastung, das eine Einheit aufweist, die aus der Gruppe ausgewählt ist, die aus Molekülen besteht, die sich von Nucleinsäuresequenzen gemäß Anspruch 1 und einem Peptidprodukt gemäß Anspruch 13 ableiten.

44. Verfahren zur Behandlung der hereditären Hämochromatose (HH)-Krankheit, das umfaßt:

Bereitstellen eines Antikörpers, der gegen eine HH-

Proteinsequenz oder ein Peptidprodukt gerichtet ist; und

Verabreichung des Antikörpers an betroffene Gewebe oder Zellen eines Patienten, der HH hat.

45. Antisens-Oligonucleotid, das gegen ein Transkriptionsprodukt einer Nucleinsäuresequenz gerichtet ist, die ausgewählt ist aus der Gruppe, die besteht aus SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5 , SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11 und SEQ ID. NO:12.

46. . Oligonucleotid mit einer Länge von wenigstens 8 Nucleotiden, die ausgewählt sind aus den Nucleotiden

1-46, 48-123; 120-369; 365-394; 390-540; 538-646; 643-1004; 1001-1080; 1083-1109; 1106-1304; 1301-1366; 1363-1386; 1389-1514; 1516-1778; 1773-1917; 1921-2010; 2051-2146; 2154-2209; 2234-2368; 2367-2422; 2420-2464; 2465-2491; 2488-2568; 2872-2901; 2902-2934; 2936-2954; 2449-3001; 3000-3042; 3420-3435; 3451-3708; 3703-3754; 3750-3770; 3774-3840; 3840-3962; 3964-3978; 3974-3992; 3990-4157; 4153-4251; 4257-4282; 4284-4321; 4316-4333; 4337-4391; 4386-4400; 4398-4436; 4444-4547; 4572-4714; 4709-4777; 5165-5397; 5394-6582; 5578-5696; 5691-5709; 5708-5773; 5773-5816; 5818-5849; 5889-6045; 6042-6075; 6073-6108; 6113-6133; 6150-6296; 6292-6354; 6356-

DE/EP O 954-602 T1

6555; 6555-6575; 6575-6616; 6620-6792; 6788-6917; 6913-7027; 7023-7061; 7056-7124; 7319-7507; 7882-8000; 7998-8072; 8073-8098; 9000-9037; 9486-9502; 9743-9811; 9808-9831; 9829-9866; 9862-9986; 9983-10075; 10072-10091; 10091-10195; 10247-10263; 10262-10300; 10299-10448; 10448-10539; 10547-10564; 10580-10612; 10608-10708; 10703-10721; 10716-10750; 10749-10774; 10774-10800; and 10796-10825 of SEQ ID NO:1,3, 5, oder 7.

47. Oligonucleotidpaar, das ein Oligonucleotid von Anspruch 46 und ein Oligonucleotid mit einer Länge von wenigstens 8 Nucleotiden aufweist, die ausgewählt sind aus SEQ ID NO: 1, 3, 5 oder 7.

48. Oligonucleotid mit einer Länge von wenigstens 9 Nucleotiden, die ausgewählt sind aus den Nucleotiden

1-47; 47-124: 119-370; 364-395; 389-541; 537-647; 642-1005; 1000-1081; 1082-1110; 1105-1305; 1300-1367; 1362-1387; 1388-1515; 1515-1918; 1920-2011; 2050 2147; 2153-2210; 2233-2369; 2366-2423; 2419-2465; 2464-2492; 2487-2569; 2871-2935 2935-3002; 2999-3043; 3419-3436; 3450-3755; 3749-3771; 3773-3841; 3839-3963; 3963 3979; 3973-3993; 3989-4158; 4152-4252; 4256-4283; 4283-4334; 4336-4401; 4397-4437 4443-4548; 4571-4778; 5164-5398; 5393-5583; 5577-5710; 5707-5774; 5772-5817; 5817-5850; 5888-6046; 6041-6076; 6072-6109; 6112-6134; 6149-6355; 6355-6556; 6554-6576 6574-6793; 6787-7125; 7318-7508; 7881-8001; 7997-8073; 8072-8099; 8999-9038; 9485-9503; 9742-9812; 9807-9832; 9828-9867; 9861-9987; 9982-10076; 10071-10092; 10090-10196; 10246-10264; 10261-10301; 10298-10449; 10447-10540; 10546-10565; 10579-10751; 10748-10775; 10773-10801; and 10795-10825 of SEQID N0:l, 3, 5, ^{oder 7}·

49. Oligonucleotidpaar, das ein Oligonucleotid von Anspruch 48 und ein Oligonucleotid mit einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1, 3, 5 oder 7.

DE/EP O 954602T

50. Oligonucleotid von wenigstens 10 Nucleotiden, die
ausgewählt sind aus den Nucleotiden

1-48; 46-125; 118-1006; 999-1082; 1081-1111; 1104-1306; 1299-1368; 1361-ioöö; 1387-1516; 1514-1919; 1919-2012; 2049-2148; 2152-2211; 2232-2370 2365-2424; 2418-2466; 2463-2493; 2486-2570; 2870-2936; 2934-3003; 2998-3044; 3418-3437; 3449-3772; 3772-3842; 3838-3964; 3962-3994; 3988-4284; 4282-4335; 4335-4402; 4396-4438; 4442-4549; 4570-4779; 5163-5711; 5706-5775; 5771-5818; 5816-5851; 5867-6047; 6040-6077; 6071-6110; 6111-6135; 6148-6356; 6354-6577; 6573-7126; 7317-7509; 7880-8074; 8071-8100; 8998-9039; 9484-9504; 9741-9813; 9806-9833; 9827-9988; 9981-10093;
10089-10197; 10245-10265; 10260-10302; 10297-10450; 10446-10541; 10545-10566;

10578-10752; 10747-10776; und 10772-10825 von SEQ ID NO:1,
3, 5 oder 7.

51. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 50 und ein Oligonucleotid einer Länge von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1,

3, 5 oder 7.

52. Oligonucleotid mit einer Länge von wenigstens 11
Nucleotiden, die ausgewählt sind aus den Nucleotiden
1-49; 45-1389; 1386-1517, 1513-1920; 1918-2013; 2048-2149; 2151-2212;
2231-2371; 2364-2425; 2417-2467; 2462-2571; 2869-2937; 2933-3004; 2997-3045; 3417-3438; 3448-3773; 3771-3843; 3837-3965; 3961-3995; 3987-4285; 4281-4336; 4334-4403; 4395-4439; 4441-4550; 4569-4780; 5162-5712; 5705-5776; 5770-5819; 5815-5852; 5886-6111; 6100-6136; 6147-6357; 6353-6578; 6572-7127-; 7316-7510; 7879-8075; 8070-8101; 8997-9040; 9483-9505; 9740-10198; 10244-10266; 10257-10303; 10296-10451; 10445-

10542; 10544-10567; 10577-10753; 10746-10777; und 10771-10825 von SEQ ID NO:1, 3, 5 oder 7.

53. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 26 und ein Oligonucleotid einer Länge von wenigstens
8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1,

3, 5 oder 7.

¹¹ - DE/EP O 354 602 T1

54. Oligonucleotid mit einer Länge von wenigstens 12 Nucleotiden, die ausqewählt sind aus den Nucleotiden 1-50,44-1390; 1385-1518; 1512-1921; 1917-2014; 2047-2150; 2150-2213; 2230-2372; 2363-2468; 2461-2572; 2868-2938; 2932-3005; 2996-3046; 3416-3439; 3447-3774; 3770-3844; 3836-3966; 3960-4286; 4280-4337; 4333-4440; 4440-4551; 4568-4781· 5161-5713; 5704-5777; 5669-5820; 5814-5853; 5885-6112; 6109-6137; 6146-6358; 6352-6579; 6571-7128; 7315-7511; 7878-8076; 8069-8102; 8996-9041; 9482-9506; 9739-10199; 10243-10267; 10256-10304; 10295-10452; 10444-10543; 10543-10566; 10576-10754; 10745-10778; und 10770-10825 von SEQ ID NO:1, 3, 5 oder 7.

55. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 54 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1, 3, 5 oder 7.

56. Oligonucletid mit einer Länge von wenigstens 13 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-51; 43-1391; 1384-1519; 1511-1922; 1916-2015; 2046-2151; 2149-2214; 2229-2469; 2460-2573; 2867-2939; 2931-3047; 3415-3440; 3446-3775; 3769-3845; 3835-3967; 3959-4287; 4279-4338; 4332-4441; 4439-4552; 4567-4782; 5160-5778; 5668-5821; 5813-5854; 5884-6113; 6108-6138; 6145-6359; 6351-6580; 6570-7129; 7314-7512; 7877-8077; 8068-8103; 8995-9042; 9481-9507; 9738-10200; 10242-10453; 10443-10544;

10542-10567; 10575-10779; und 10769-10825 von SEQ ID NO:1, 3, 5 oder 7.

57. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 56 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ id NO: 1, 3, 5 oder 7 .

58. Oligonucleotid mit einer Länge von wenigstens 14 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-52; 42-1392; 1383-1520; 1510-1923; 1915-2016; 2045-2152; 2148-2215; 2228-2574; 2866-2940; 2930-3048; 3414-3441; 3445-3776; 3768-3968; 3959-4288; 4278-

- 12 -

4339; 4331-4442; 4438-4553; 4566-4783; 5159-580:^812*855; 6144-6360; 6350-6581; 6569-7130; 7313-7513; 7876-8078; 8067-8104; 8994-9043; 9480-9508; 9737-10201; 10241-10454; 10442-10545; 10541-10568; und 10574-10825 von SEQ IC NO:1, 3, 5 oder 7.

59. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 58 und ein Oligonucleotid einer Länger von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1, 3, 5 oder 7.

60. Oligonucleotid mit einer Länge von wenigstens 5 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-53; 41-1393; 1382-1521; 1509-1924; 1914-2017; 2044-2153; 2147-2216; 2227-2575; 2865-2942; 2929-3049; 3413-3442; 3444-3777; 3767-3969; 3958^289; 4277-4340; 4330-4443; 4437-4554; 4565-4784; 5158-5823; 5811-5856; 5882-6115; 6106-6140; 6143-6361; 6349-7131; 7312-7514; 7875-8105; 8993-9044; 9479-9509; 9736-10202;

10240-10546; 10540-10569; und 10573-10825 von SEQ ID NO:1, 3, 5 oder 7.

61. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 60 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1, 3, 5 oder 7.

62. Oligonucleotid mit einer Länge von wenigstens 16 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-1394; 1381-1925; 1913-2018; 2043-2154; 2146-2217; 2226-2576; 2864-3050; 3412-3443; 3443-3778; 3766-4341; 4329-4444; 4436-4555; 4564-4785; 5157-5857; 5881-6116; 6105-6141; 6142-7132; 7311-7515; 7874-8106; 8992-9045; 9478-9510; 9735-

10203; 10239-10547; 10539-10570: und 10572-10825 von SEQ ID NO:1, 3, 5, oder 7.

63. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 62 und ein Oligonucleotid einer Länge von wenigstens

- ¹³ - DE/EP O 954 602 T1

8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1, 3, 5 oder 7.

64. Oligonucleotid mit einer Länge von wenigstens 17 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-192 6; 1912-2019; 2042-2155; 2145-2218; 2225-2577; 2863-3051; 3411-3779; 3765-4342; 4329-4445; 4435-4556; 4563-4786; 5156-5858; 5880-6117; 6104-6142; 6141-7133; 7310-7516; 7873-8107; 8991-9046; 9477-9511; 9734-10204; 10238-10548; 10538-10571; und 10571-10825 von SEQ ID NO:1, 3, 5 oder 7.

65. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 64 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1, 3, 5 oder 7.

66. Oligonucleotid mit einer Länge von wenigstens 18 Nucleotiden, die ausgewählt sind aus den Nucleotiden

1-2020; 2041-2156; 2144-2219; 2224-2578; 2862-3052; 3410-3780; 3764- 4446; 4434-4557; 4562-4787; 5155-5859; 5879-6118; 6103-6143; 6140-7134; 7309-7517; 7872-8108; 8990-9047; 9476-9512; 9733-10205; 10237-10549; 10537-10572; and 10570-

10825 von SEQ ID NO:1, 3, 5 oder 7.

67. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 66 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:1,

3, 5 oder 7.

68. Oligonucleotid mit einer Länge von wenigstens 8 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-55; 55-251; 250-306; 310-376; 380-498; 500-528; 516-543; 541-578; 573- 592; 590-609; 611-648; 642-660; 664-717; 712-727; 725-763; 772-828; 813-874; 872- 928; 913-942; 940-998; 997-1046; 1054-1071; 1076-1116; 1115-1182; 1186-1207: 1440-

1483; 1482-1620; 2003-2055; 2057-2107; 2116-2200; und 2453-2469 von SEQ ID NO:9, 10, 11 oder 12.

DE/EPO 954 602 Tl

.rqonucleotid gemäß An-

69. Oligonucleotidpaar, das ein Olrgonucleotid gemäß Anspruch 68 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:9, 10, 11 oder 12.

70. Oligonucleotid mit einer Länge von wenigstens 9 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-56; 54-252; 249-307; 309-377; 379-499; 499-529; 515-544; 540-579; 572-593; 589-610; 610-649; 641-661; 663-718; 711-728; 724-764; 771-829; 812-875; 871-929; 912-943; 939-999; 996-1047; 1053-1072; 1075-1117; 1114-1183; 1185-1208; 1439-1484; 1481-1629; 2002-2056; 2056-2108; 2115-2201; und 2452-2470 von SEQ ID NO: 9, 10, 11 oder 12.

71. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 70 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:9, 10, 11 oder 12.

72. Oligonucleotid mit einer Länge von wenigstens 9 Nucleotiden, die ausgewählt sind aus den Nucleotiden

1-57; 53-253; 248-308; 308-378; 378-500; 498-530; 514-545; 539-580; 571-594; 588-611; 609-662; 662-729; 723-765; 770-876; 870-944; 938-1000; 995-1048; 1052-1073; 1074-1118; 1113-1184; 1184-1209; 1438-1485; 1480-1630; 2001-2057; 2055-2109; 2114-2202; und 2451-2471 von SEQ ID NO:9, 10, 11 oder 12.

73. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 72 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO:9, 10, 11 oder 12.

74. Oligonucleotid mit einer Länge von wenigstens 11 Nucleotiden, die ausgewählt sind aus den Nucleotiden

1-58; 52-254; 247-309; 307-379; 377-501; 497-531; 513-546; 538-595; 587-612;'608-663; 661-730; 722-766; 769-877; 869-1049; 1051-1074; 1073-1119; 1112-1185;

1183-1210; 1437-1486; 1479-1631; 2000-2058; 2054-2110; 2113-2203; und 2450-2472 von SEQ ID NO:9, 10, 11 oder 12.

- ¹⁵ DE / EP O 954 602 &Tgr;1

75. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 74 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO: 9, 10, 11 oder 12.

76. Oligonucleotid mit einer Länge von wenigstens 12 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-255; 246-310; 306-380; 376-502; 496-596; 586-613; 607-664; 660-767; 768-1050; 1050-1075; 072-1120; 1111-1186; 1182-1211; 1436-1487; 1478-1632; 1999-2059; 2053-2121; 2112-2204; und 2449-2473 von SEQ ID NO:9, 10, 11 oder 12.

77. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 76 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO: 9, 10, 11 oder 12.

78. Oligonucleotid mit einer Länge von wenigstens 13 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-311; 305-381; 375-503; 495-614; 606-665; 659-768; 767-1051; 1049-1076; 1071-1121; 1110-1187; 1181-1212; 1435-1633; 1998-2060; 2052-2205 und 2488-2474 von SEQ ID NO:9, 10, 11 oder 12.

79. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 78 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO: 9, 10, 11 oder 12.

80. Oligonucleotid mit einer Länge von wenigstens 14 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-312; 304-382; 374-504; 494-615; 605-666; 658-769; 766-1052; 1048-1077; 1070-1188; 1180-1213; 1434-1634; 1997-2061; 2051-2206; und 2447-2475 von SEQ ID NO:9, 10, 11 oder 12.

81. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 80 und ein Oligonucleotid einer Länge von wenigstens

¹⁶ DE/EP Ö '954"6Ö2 T1

8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO: 9, 10, 11 oder 12.

82. Oligonucleotid mit einer Länge von wenigstens 14 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-313; 303-383; 373-505; 493-616; 604-667; 657-770; 765-1053; 1047-1078; 1069-1189; 1179-1214; 1433-1635; 1996-2062; 2050-2207; und 2446-2476 von SEQ ID NO:9, 10, 11 oder 12.

83. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 82 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO: 9, 10, 11 oder 12.

84. Oligonucleotid mit einer Länge von wenigstens 16 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-314; 302-384; 372-668; 656-771; 764-1054, 1046-1079; 1068-1190; 1178-1215; 1432-1636; 1995-2208; und 2445-2477 von SEQ ID NO:9, 10, 11 oder 12.

85. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 84 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO: 9, 10, 11 oder 12.

86. Oligonucleotid mit einer Länge von wenigstens 17 Nucleotiden, die ausgewählt sind aus den Nucleotiden 1-315; 301-385; 371-669; 655-772; 763-1055; 1045-1080; 1067-1191; 1177-1216; 1431-1637; 1994-2209; und 2444-2478 von SEQ ID NO:9, 10, 11 oder 12.

87. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 86 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO: 9, 10, 11 oder 12.

-¹⁷- D E 7 E P O" 9 5"VBD 2 T1

88. Oligonucleotid mit einer Länge von wenigstens 18 Nucleotiden, die ausgewählt sind aus den Nucleotiden l-773_; 762-1056; 1044-1081; 1066-1192; 1176-1217; 1430-1638; 1993-2210; und 2443-2479 von SEQ ID NO:9, 10, 11 oder 12.

89. Oligonucleotidpaar, das ein Oligonucleotid gemäß Anspruch 88 und ein Oligonucleotid einer Länge von wenigstens 8 Nucleotiden umfaßt, die ausgewählt sind aus SEQ ID NO: 9, 10, 11 oder 12.

90. Kit zum Nachweis eines Polymorphismus im HH-Gen in einer Patientenprobe, wobei der Kit wenigstens ein Oligonucleotid mit einer Länge von wenigstens 8 Nucleotiden umfaßt, die aus ,der Gruppe ausgewählt sind, die besteht aus SEQ ID NOS:1, 3, 5, 7, 9, 10, 11 oder 12, wobei das Oligonucleotid dazu verwendet wird, einen Abschnitt von HH DNA oder RNA in einer Patientenprobe zu vervielfältigen.

91. Kit nach Anspruch 90, der außerdem wenigstens ein zweites Oligonucleotid umfaßt, das ausgewählt ist aus der Gruppe, die besteht aus SEQ ID NOS:1, 3, 5, 7, 9, 10, 11 oder 12, wobei die ersten und zweiten Oligonucleotide ein Primer-Paar umfassen.

1/44

DE/EPO 954 602 Tl

SEQUENZLISTE zu EP 97918642 (EP O 954 602)

3705

(2) INFORMATION FOR SEQ ID NO:1:

(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 10825 base pairs

(B) TYPE: nucleic acid

(C) STRANDEDNESS: single

(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(ix) FEATURE:

(A) NAME/KEY: CDS

(B) LOCATION: join(361..436, 3762. .4025, 4235. .4510, 5606. .5381,

6040..6153, 7107..7147)

(D) OTHER INFORMATION: /product= "Hereditary Hemochromatosis

(HH) protein"

/note= "Normal or wild-type (unaffected) Hereditary Hemochromatosis (HH) gene allele"

(ix) FEATURE:

(A) NAME/KEY: -

(5) LOCATION: 140..7319

(D) OTHER INFORMATION: /note= "start and stop positions for

normal or wild-type (unaffected) allele

CDNA (SEQ ID NO:9)"

(ix) FEATURE:

(A) NAME/KEY: -

(B) LOCATION: 3S52..3891

(D) OTHER INFORMATION: /note= "start and stop positions for

normal or wild-type (unaffected) genonic sequence surrounding variant for 24d2(C) allele (SEQ ID NO:41)"

(Lx) FEATURE:

(A) NAME/KEY: -

(B) LOCATION: 5507. .6023 DE/EP O 954 602 T

(D) OTHER INFORMATION: /note= "start and stop positions for

normal or wild-type (unaffected) genomic sequence surrounding variant for 24dl(G) allele (SEQ ID NO:20)"

(ix) FEATURE:

(A) NAME/KEY: allele

(B) LOCATION: replace(3872, "c")

(D) OTHER INFORMATION: /phenotype= "normal or wild-type

(unaffected)" /label= 24d2

(ix) FEATURE:

(A) NAME/KEY: allele

(B) LOCATION: replace(3373 , "a")

(D) OTHER INFORMATION: /phenotype= "normal or wild-type

(unaffected)" /label= 24d7

(ix) FEATURE:

(A) NAME/KEY: allele

(B) LOCATION: replace(5834, "g")

(D) OTHER INFORMATION: /phenotype= "normal or wild-type

(unaffected)" • /label= 24dl

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:1:

TCTAAGGTTG AGATAAAATT TTTAAATGTA TGATTGAATT TTGAAAATCA TAAATATTTA 60

AATATCTAAA GTTCAGATCA GAACATTGCG AAGCTACTTT CCCCAATCAA CAACACCCCT 12 0

TCAGGATTTA AAAACCAAGG GGGACACTGG ATCACCTAGT GTTTCACAAG CAGGTACCTT 18 0

CTGCTGTAGG AGAGAGAGAA CTAAAGTTCT GAAAGACCTG TTGCTTTTCA CCAGGAAGTT 24 0

TTACTGGGCA TCTCCTGAGC CTAGGCAATA GCTGTAGGGT GACTTCTGGA GCCATCCCCG 3 00

TTTCCCCGCC CCCCAAAAGA AGCGGAGATT TAACGGGGAC GTGCGGCCAG AGCTGGGGAA 3 60

ATG GGC CCG CGA GCC AGG CCG GCG CTT CTC CTC CTG ATG CTT TTG CAG 4 08 Met GIy Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu GIn 15 10 15

ACC GCG GTC CTG CAG GGG CGC TTG CTG C GTGAGTCCGA GGGCTGCGGG 4 56

Thr Ala VaI Leu GIn Gly Arg Leu Leu
20 25

CGAACTAGGG GCGCGGCGGG GGTGGAAAAA TCGAAACTAG CTTTTTCTTT GCGCTTGGGA 516

GTTTGCTAAC TTTGGAGGAC CTGCTCAACC CTATCCGCAA GCCCCTCTCC CTACTTTCTG 57 6

CGTCCAGACC CCGTGAGGGA GTGCCTACCA CTGAACTGCA GATAGGGGTC CCTCGCCCCA 63 6

GGACCTGCCC CCTCCCCCGG CTGTCCCGGC TCTGCGGAGT GACTTTTGGA ACCGCCCACT 696

CCCTTCCCCC AACTAGAATG CTTTTAAATA AATCTCGTAG TTCCTCACTT GAGCTGAGCT 756

AAGCCTGGGG CTCCTTGAAC CTGGAACTCG GGTTTATTTC CAATGTCAGC TGTGCAGTTT S16

TTTCCCCAGT CATCTCCAAA CAGGAAGTTC TTCCCTGAGT GCTTGCCGAG AAGGCTGAGC 87 6

3/44

AAACCCACAG CAGGATCCGC ACGGGGTTTC CACCTCAGAA CGAATGCGTT GGGCGGTGGG GGCGCGAAAG AGTGGCGTTG GGGATCTGAA TTCTTCACCA TTCCACCCAC TTTTGGTGAG ACCTGGGGTG GAGGTCTCTA GGGTGGGAGG CTCCTGAGAG AGGCCTACCT CGGGCCTTTC CCCACTCTTG GCAATTGTTC TTTTGCCTGG AAAATTAAGT ATATGTTAGT TTTGAACGTT TGAACTGAAC AATTCTCTTT TCGGCTAGGC TTTATTGATT TGCAATGTGC TGTGTAATTA AGAGGCCTCT CTACAAAGTA CTGATAATGA ACATGTAAGC AATGCACTCA CTTCTAAGTT ACATTCATAT CTGATCTTAT TTGATTTTCA CTAGGCATAG GGAGGTAGGA GCTAATAATA CGTTTATTTT ACTAGAAGTT AACTGGAATT CAGATTATAT AACTCTTTTC AGGTTACAAA GAACATAAAT AATCTGGTTT TCTGATGTTA TTTCAAGTAC TACAGCTGCT TCTAATCTTA GTTGACAGTG ATTTTGCCCT GTAGTGTAGC ACAGTGTTCT GTGGGTCACA CGCCGGCCTC AGCACAGCAC TTTGAGTTTT GGTACTACGT GTATCCACAT TTTACACATG ACAAGAATGA GGCATGGCAC GGCCTGCTTC CTGGCAAATT TATTCAATGG TACACTGGGC TTTGGTGGCA GAGCTCATGT CTCCACTTCA TAGCTATGAT TCTTAAACAT CACACTGCAT TAGAGGTTGA &Agr;&Tgr;&Agr;&Agr;&Tgr;&Agr;&Agr;&Agr;&Agr;&Tgr; TTCATGTTGA GCAGAAATAT TCATTGTTTA CAAGTGTAAA TGAGTCCCAG CCATGTGTTG CACTGTTCAA GCCCCAAGGG AGAGAGCAGG GAAACAAGTC TTTACCCTTT GATATTTTGC ATTCTAGTGG GAGAGATGAC AATAAGCAAA TGAGCAGAAA GATATACAAC ATCAGGAAAT CATGGGTGTT GTGAGAAGCA GAGAAGTCAG GGCAAGTCAC TCTGGGGCTG ACACTTGAGC AGAGACATGA AGGAAATAAG AATGATATTG ACTGGGAGCA GTATTTCCCA GGCAAACTGA GTGGGCCTGG CAAGTTGGAT TAAAAAGCGG GTTTTCTCAG CACTACTCAT

GTGTGTGTGT GTGGGGGGGG GGGGCGG<

GGGGGTGGGA AGGGGGACTA CCATCTGCAT

GTAGGATGTC TAGCAGTATC CTGTCCTCCC TACTCACTAG GTGCTAGGAG CACTCCCCCA GTCTTGACAA CCAAAAATGT CTCTAAACTT TGCCACATGT CACCTAGTAG ACAAACTCCT GGTTAAGAAG CTCGGGTTGA AAAAAATAAA CAAGTAGTGC TGGGGAGTAG AGGCCAAGAA GTAGGTAATG GGCTCAGAAG AGGAGCCACA AACAAGGTTG TGCAGGCGCC TGTAGGCTGT GGTGTGAATT CTAGCCAAGG AGTAACAGTG ATCTGTCACA GGCTTTTAAA AGATTGCTCT GGCTGCTATG TGGAAAGCAG AATGAAGGGA GCAACAGTAA AAGCAGGGAG CCCAGCCAGG AAGCTGTTAC ACAGTCCAGG CAAGAGGTAG TGGAGTGGGC TGGGTGGGAA CAGAAAAGGG AGTGACAAAC CATTGTCTCC TGAATATATT CTGAAGGAAG TTGCTGAAGG ATTCTATGTT GTGTGAGAGA AAGAGAAGAA TTGGCTGGGT GTAGTAGCTC ATGCCAAGGA GGAGGCCAAG GAGAGCAGAT TCCTGAGCTC AGGAGTTCAA GACCAGCCTG GGCAACACAG CAAAACCCCT TCTCTACAAA AAATACAAAA ATTAGCTGGG TGTGGTGGCA TGCACCTGTG ATCCTAGCTA CTCGGGAGGC TGAGGTGGAG GGTATTGCTT GAGCCCAGGA AGTTGAGGCT GCAGTGAGCC

936 996 1056 1116 1176 1236 1296 1356 1416 1476 1536 1596 1656 1716 1776 1836 1896 1956 2016 2076 2136 2196 2256 2316 2376 2436 2496 2556 2616 2676 2736 2796

JA

4/44

ATGACTGTGC CACTGTACTT CAGCCTAGGT GACAGAGCAA GACCCTGTCT CCCCTGACCC CCTGAAAAAG AGAAGAGTTA AAGTTGACTT TGTTCTTTAT TTTAATTTTA TTGGCCTGAG CAGTGGGGTA ATTGGCAATG CCATTTCTGA GATGGTGAAG GCAGAGGAAA GAGCAGTTTG GGGTAAATCA AGGATCTGCA TTTGGGACAT GTTAAGTTTG AGATTCCAGT CAGGCTTCCA AGTGGTGAGG CCACATAGGC AGTTCAGTGT AAGAATTCAG GACCAAGGCT GGGCACGGTG GCTCACTTCT GTAATCCCAG CACTTTGGTG GCTGAGGCAG GTAGATCATT TGAGGTCAGG AGTTTGAGAC AAGCTTGGCC AACATGGTGA AACCCCATGT CTACTAAAAA TACAAAAATT AGCCTGGTGT GGTGGCGCAC GCCTATAGTC CCAGGTTTTC AGGAG_-GCTTa GGTAGGAGAA TCCCTTGAAC CCAGGAGGTG CAGGTTGCAG TGAGCTGAGA TTGTGCCACT GCACTCCAGC CTGGGTGATA GAGTGAGACT CTGTCTCAAA AAAAAAAAAA AAAAAAAAAA AAAAAACTGA AGGAATTATT CCTCAGGATT TGGGTCTAAT TTGCCCTGAG CACCAACTCC TGAGTTCAAC TACCATGGCT AGACACACCT TAACATTTTC TAGAATCCAC CAGCTTTAGT GGAGTCTGTC TAATCATGAG TATTGGAATA GGATCTGGGG GCAGTGAGGG GGTGGCAGCC ACGTGTGGCA GAGAAAAGCA CACAAGGAAA GAGCACCCAG GACTGTCATA TGGAAGAAAG ACAGGACTGC AACTCACCCT TCACAAAATG AGGACCAGAC ACAGCTGATG GTATGAGTTG ATGCAGGTGT GTGGAGCCTC AACATCCTGC TCCCCTCCTA CTACACATGG TTAAGGCCTG TTGCTCTGTC

TCCAG GT TCA CAC TCT CTG CAC TAC CTC TTC ATG GGT GCC TCA GAG Arg Ser His Ser Leu His. Tyr Leu Phe Met GIy Ala Ser GIu

30 35

CAG GAC CTT GGT CTT TCC TTG TTT GAA GCT TTG GGC TAC GTG GAT GAC

Gin Asp Leu GIy Leu Ser Leu Phe GIu AIa Leu GIy Tyr VaI Asp Aso

40 45 50 55

CAG CTG TTC GTG TTC TAT GAT CAT GAG AGT CGC CGT GTG GAG CCC CGA Gin Leu Phe VaI Phe Tyr Asp His GIu Ser Arg Arg VaI GIu Pro Arg

60 65 70

ACT CCA TGG GTT TCC AGT AGA ATT TCA AGC CAG ATG TGG CTG CAG CTG Thr Pro Trp VaI Ser Ser Arg He Ser Ser Gin Met Trp Leu Gin Leu 75 80 35

AGT CAG AGT CTG AAA GGG TGG GAT CAC ATG TTC ACT GTT GAC TTC TGG Ser GIn Ser Leu Lys GIy Trp Asp Kis Mec ?he Thr VaI Asp Phe Trp 90 ' 95 100

ACT ATT ATG GAA AAT CAC AAC CAC AGC AAG G GTATGTGGAG AGGGGGCCTC Thr Ha Mat CIu Acn His Asn His Ser Lys
105. HO

ACCTTCCTGA GGTTGTCAGA GCTTTTCATC TTTTCATGCA TCTTGAAGGA AACAGCTGGA AGTCTGAGGT CTTGTGGGAG CAGGGAAGAG GGAAGGAATT TGCTTCCTGA C-ATCATTTGG TCCTTGGGGA TGGTGGAAAT AGGGACCTAT TCCTTTGGTT GCAGTTAACA AGGCTGGGGA

TTTTTCCAG AG TCC CAC ACC CTG CAG GTC ATC CTG GGC TGT GAA ATG GIu Ser His Thr Leu Gin VaI He Leu GIy Cys GIu Met

3 03 6 3096 3156 3 216 3 27 6 3 336 3 396 34 56

3516 3 576 -3636 3 696 3756 3 802

4105 4165 4 2 25 4 2 72

115 120 125

CAA GAA GAC AAC AGT ACC GAG GGC TAC TGG AAG TAC GGG TAT GAT GGG Gin GIu Asp Asn Ser Thr GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy 130 135 140

CAG GAC CAC CTT GAA TTC TGC CCT GAC ACA CTG GAT TGG AGA GCA GCA Gin Asp His Leu GIu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala 145 150 ' 155

GAA CCC AGG GCC TGG CCC ACC AAG CTG GAG TGG GAA AGG CAC AAG ATT GIu Pro Arg Ala Trp Pro Thr Lys Leu GIu Trp GIu Arg His Lys lie 160 165 170

CGG GCC AGG CAG AAC AGG GCC TAC CTG GAG AGG GAC TGC CCT GCA CAG Arg Ala Arg Gin Asn Arg Ala Tyr Leu GIu Arg Asp Cys Pro Ala Gin 175 180 185 190

CTG CAG CAG TTG CTG GAG CTG GGG AGA GGT GTT TTG GAC CAA CAA G Leu GIn Gin Leu Leu GIu Leu GIy Arg GIy VaI Leu Asp Gin Gin

195 200 205

G¹TATGGTGGA AACACACTTC TGCCCCTATA CTCTAGTGGC AGAGTGGAGG AGGTTGCAGG GCACGGAATC CCTGGTTGGA GTTTCAGAGG TGGCTGAGGC TGTGTGCCTC TCCAAATTCT GGGAAGGGAC TTTCTCAATC CTAGAGTCTC TACCTTATAA TTGAGATGTA TGAGACAGCC ACAAGTCATG GGTTTAATTT CTTTTCTCCA TGCATATGGC TCAAAGGGAA GTGTCTATGG CCCTTGCTTT TTATTTAACC AATAATCTTT TGTATATTTA TACCTGTTAA AAATTCAGAA ATGTCAAGGC CGGGCACGGT GGCTCACCCC TGTAATCCCA GCACTTTGGG AGGCCGAGGC GGGTGGTCAC AAGGTCAGGA GTTTGAGACC AGCCTGACCA ACATGGTGAA ACCCGTCTCT AAAAAAATAC AAAAATTAGC TGGTCACAGT CATGCGCACC TGTAGTCCCA GCTAATTGGA AGGCTGAGGC AGGAGCATCG CTTGAACCTG GGAAGCGGAA GTTGCACTGA GCCAAGATCG CGCCACTGCA CTCCAGCCTA GGCAGCAGAG TGAGACTCCA TCTTAAAAAA AAAAAAAAAA AAAAAAAGAG AATTCAGAGA TCTCAGCTAT CATATGAATA CCAGGACAAA ATATCAAGTG AGGCCACTTA TCAGAGTAGA AGAATCCTTT AGGTTAAAAG TTTCTTTCAT AGAACATAGC AATAATCACT GAAGCTACCT ATCTTACAAG TCCGCTTCTT ATAACAATGC CTCCTAGGTT GACCCAGGTG AAACTGACCA TCTGTATTCA ATCATTTTCA ATGCACATAA AGGGCAATTT TATCTATCAG AACAAAGAAC ATGGGTAACA GATATGTATA TTTACATGTG AGGAGAACAA GCTGATCTGA CTGCTCTCCA AGTGACACTG TGTTAGAGTC CAATCTTAGG ACACAAAATG GTGTCTCTCC TGTAGCTTGT TTTTTTCTGA AAAGGGTATT TCCTTCCTCC AACCTATAGA AGGAAGTGAA AGTTCCAGTC TTCCTGGCAA GGGTAAACAG ATCCCCTCTC CTCATCCTTC CTCTTTCCTG TCAAG TG CCT CCT TTG GTG AAG GTG ACA CAT CAT GTG ACC

VaI Pro Pro Leu VaI Lys VaI Thr His His VaI Thr

210 215

TCT TCA GTG ACC ACT CTA CGG TGT CGG GCC TTG AAC TAC TAC CCC CAG Ser Ser Vai Thr Thr Leu Arg Cys Arg AIa Leu Asn Tyr Tyr Pro GIn

4320 4363 4416 4464 4510

4570 4630 • 4690 4750 4810 4370 4930 4990 5050 5110 5170 5230 5290 5350 5410 5470 5530 5590 5640

6/44

2 &Tgr;1

225

230

AAC ATC ACC ATG AAG TGG CTG AAG GAT AAG CAG CCA ATG GAT GCC AAG 57 3 6 Asn He Thr Met Lys Trp Leu Lys Asp Lys Gin Pro Met Asp Ala Lys 235 240 245

GAG TTC GAA CCT AAA GAC GTA TTG CCC .AAT GGG GAT GGG ACC TAC CAG 5734 Glu Phe Glu Pro Lys Asp VaI Leu Pro Asn GIy Asp GIy Thr Tyr Gin 250 255 260 265

GGC TGG ATA ACC TTG GCT GTA CCC CCT GGG GAA GAG CAG AGA TAT ACG 53 3 2 GIy Trp He Thr Leu Ala VaI Pro Pro GIv Giu Glu Gin Arg Tyr Thr

270 275 230

TGC CAG GTG GAG CAC CCA GGC CTG GAT CAG CCC CTC ATT GTG ATC TGG G 5331 Cys Gin VaI Glu His Pro GIy Leu Asp Gin Pro Leu He VaI He Trp 2S5 290 295 '

GTATGTGACT GATGAGAGCC AGGAGCTGAG AAAATCTATT GGGGGTTGAG AGGAGTGCCT 5941

GAGGAGGTAA TTATGGCAGT GAGATGAGGA TCTGCTCTTT GTTAGGGGGT GGGCTGAGGG 6001

TGGCAATCAA AGGCTTTAAC TTGCTTTTTC TGTTTTAG AG CCC TCA CCG TCT 6053

Glu Pro Ser Pro Ser 300

GGC ACC CTA GTC ATT GGA GTC ATC AGT GGA ATT GCT GTT TTT GTC GTC . 6101 GIy Thr Leu VaI He GIy VaI He Ser GIy He Ala VaI Phe VaI VaI 305 310 315

ATC TTG TTC ATT GGA ATT TTG TTC ATA ATA TTA AGG AAG AGG CAG GGT 6149 He Leu Phe He GIy He Leu Phe He He Leu Arg Lys Arg Gin GIy 320 325 330

TCA A GTGAGTAGGA ACAAGGGGGA AGTCTCTTAG TACCTCTGCC CCAGGGCACA 62 03

GTGGGAAGAG GGGCAGAGGG GATCTGGCAT CCATGGGAAG CATTTTTCTC ATTTATATTC 6263

TTTGGGGACA CCAGCAGCTC CCTGGGAGAC AGAAAATAAT GGTTCTCCCC AGAATGAAAG 63 2 3

TCTCTAATTC AACAAACATC TTCAGAGCAC CTACTATTTT GCAAGAGCTG TTTAAGGTAG 633 3

TACAGGGGCT TTGAGGTTGA GAAGTCACTG TGGCTATTCT CAGAACCCAA ATCTGGTAGG 64 4 3

GAATGAAATT GATAGCAAGT AAATGTAGTT AAAGAAGACC CCATGAGGTC CTAAAGCAGG 6 50 3

CAGGAAGCAA ATGCTTAGGG TGTCAAAGGä AAGAATGATC ACATTCAGCT GGGGATCAAG 6563

ATAGCCTTCT GGATCTTGAA GGAGAAGCTG GATTCCATTA GGTGAGGTTG AAGATGATGG 6 62 3

GAGGTCTACA CAGACGGAGC AACCATGCCA AGTAGGAGAG TATAAGGCAT ACTGGGAGAT 6 63 3

TAGAAATAAT TACTGTACCT TAACCCTGAG TTTGCGTAGC TATCACTCAC CAATTATGCA 674 3

TTTCTACCCC CTGAACATCT GTGGTGTAGG GAAAAGAGAA TCAGAAAGAA GCCAGCTCAT 53 0 3

ACAGAGTCCA AGGGTCTTTT GGGATATTGG GTTATGATCA CTGGGGTGTC ATTGAAGGAT 63 6 3

CCTAAGAAAG GAGGACCACG ATCTCCCTTA TATGGTGAAT GTGTTGTTAA GAAGTTAGAT 69 2 3

GAGAGGTGAG GAGACCAGTT AGAAAGCCAA TAAGCATTTC CAGATGAGAG ATAATGGTTC 69 8 3

7/44

TTGAAATCCA ATAGTGCCCA GGTCTAAATT GAGATGGGTG AATGAGGAAA ATAAGGAAGA GAGAAGAGGC AAGATGGTGC CTAGGTTTGT GATGCCTCTT TCCTGGGTCT CTTGTCTCCA

CAG GA GGA GCC ATG GGG CAC TAC GTC TTA GCT GAA CGT GAG
Arg GIy Ala Met GIy His Tyr VaI Leu Ala GIu Arg GIu

340 " 345

TGACACGCAG CCTGCAGACT CACTGTGGGA AGGAGACAAA ACTAGAGACT CAAAGAGGGA GTGCATTTAT GAGCTCTTCA TGTTTCAGGA GAGAGTTGAA CCTAAACATA GAAATTGCCT GACGAACTCC TTGATTTTAG CCTTCTCTGT TCATTTCCTC AAAAAGATTT CCCCATTTAG GTTTCTGAGT TCCTGCATGC CGGTGATCCC TAGCTGTGAC CTCTCCCCTG GAACTGTCTC TCATGAACCT CAAGCTGCAT CTAGAGGCTT CCTTCATTTC CTCCGTCACC TCAGAGACAT ACACCTATGT CATTTCATTT CCTATTTTTG GAAGAGGACT CCTTAAATTT GGGGGACTTA catgattcat tttaacatct gagaaaagct ttgaaccctg ggacgtggct agtcataacc

ttaccagatt tttacacatg tatctatgca ttttctggac ccgttcaact tttcctttga

atcctctctc tgtgttaccc agtaactcat ctgtcaccaa gccttgggga ttcttccatc

tgattgtgat gtgagttgca cagctatgaa ggctgtacac tgcacgaatg gaagaggcac

ctgtcccaga aaaagcatca tggctatctg tgggtagtat gatgggtgtt tttagcaggt

aggaggcaaa tatcttgaaa ggggttgtga agaggtgttt tttctaattg gcatgaaggt

gtcatacaga tttgcaaagt ttaatggtgc cttcatttgg gatgctactc tagtattcca

GACCTGAAGA ATCACAATAA TTTTCTACCT GGTCTCTCCT TGTTCTGATA ATGAAAATTA tgataaggat gataaaagca cttacttcgt gtccgactct tctgagcacc tacttacatg cattactgca tgcacttctt acaataattc tatgagatag gtactattat ccccatttct tttttaaatg aagaaagtga agtaggccgg gcacggtggc tcacgcctgt aatcccagca ctttgggagg ccaaagcggg tggatcacga ggtcaggaga tcgagaccat cctggctaac ATGGTGAAAC CCCATCTCTA ATAAAAATAC AAAAAATTAG CTGGGCGTGG TGGCAGACGC CTGTAGTCCC AGCTACTCGG AAGGCTGAGG CAGGAGAATG GCATGAACCC AGGAGGCAGA GCTTGCAGTG AGCCGAGTTT GCGCCACTGC ACTCCAGCCT AGGTGACAGA GTGAGACTCC ATCTCAAAAA AATAAAAATA AAAATAAAAA AATGAAAAAA AAAAGAAAGT GAAGTATAGA GTATCTCATA GTTTGTCAGT GATAGAAACA GGTTTCAAAC TCAGTCAATC TGACCGTTTG ATACATCTCA GACACCACTA CATTCAGTAG TTTAGATGCC TAGAATAAAT AGAGAAGGAA GGAGATGGCT CTTCTCTTGT CTCATTGTGT TTCTTCTGAG TGAGCTTGAA TCACATGAAG GGGAACAGCA GAAAACAACC AACTGATCCT CAGCTGTCAT GTTTCCTTTA AAAGTCCCTG AAGGAAGGTC CTGGAATGTG ACTCCCTTGC TCCTCTGTTG CTCTCTTTGG CATTCATTTC TTTGGACCCT ACGCAAGGAC TGTAATTGGT GGGGACAGCT AGTGGCCCTG CTGGGCTTCA

7043 7103

7144

7204 7264 7324 7334 7444 7504 7564 7624 7684 • 7744 7304 7864 7924 7984 8044 8104 3164 8224 8234 8344 8404 8464 3524 3534 3644 3704 3764 3824

8/44

* 4 * I

CACACGGTGT CCTCCCTAGG CCAGTGCCTC TGGAGTCAGA ACTCTGGTGG TATTTCCCTC AATGAAGTGG AGTAAGCTCT CTCATTTTGA GATGGTATAA TGGAAGCCAC CAAGTGGCTT AGAGGATGCC CAGGTCCTTC CATGGAGCCA CTGGGGTTCC GGTGCACATT AAAAAAAAAA TCTAACCAGG ACATTCAGGA ATTGCTAGAT TCTGGGAAAT CAGTTCACCA TGTTCAAAAG AGTCTTTTTT TTTTTTTTGA GACTCTATTG CCCAGGCTGG AGTGCAATGG CATGATCTCG GCTCACTGTA ACCTCTGCCT CCCAGGTTCA AGCGATTCTC CTGTCTCAGC CTCCCAAGTA GCTGGGATTA CAGGCGTGCA CCACCATGCC CGGCTAATTT TTGTATTTTT AGTAGAGACA GGGTTTCACC ATGTTGGCCA GGCTGGTCTC GAACTCTCCT GACCTCGTGA TCCGCCTGCC TCGGCCTCCC AAAGTGCTGA GATTACAGGT GTGAGCCACC CTGCCCAGCC GTCAAAAGAG TCTTAATATA TATATCCAGA TGGCATGTGT TTACTTTATG TTACTACATG CACTTGGCTG CATAAATGTG GTACAAGCAT TCTGTCTTGA AGGGCAGGTG CTTCAGGATA CCATATACAG CTCAGAAGTT TCTTCTTTAG GCATTAAATT TTAGCAAAGA TATCTCATCT CTTCTTTTAA ACCATTTTCT TTTTTTGTGG TTAGAAAAGT TATGTAGAAA AAAGTAAATG TGATTTACGC TCATTGTAGA AAAGCTATAA AATGAATACA ATTAAAGCTG TTATTTAATT AGCCAGTGAA AAACTATTAA CAACTTGTCT ATTACCTGTT AGTATTATTG TTGCäTTAAä AATGCATATA CTTTAATAAA TGTATATTGT ATTGTATACT GCATGATTTT ATTGAAGTTC TTGTTCATCT TGTGTATATA CTTAATCGCT TTGTCATTTT GGAGACATTT ATTTTGCTTC TAATTTCTTT ACATTTTGTC TTACGGAATA TTTTCATTCA ACTGTGGTAG CCGAATTAAT CGTGTTTCTT CACTCTAGGG ACATTGTCGT CTAAGTTGTA AGACATTGGT TATTTTACCA GCAAACCATT CTGAAAGCAT ATGACAAATT ATTTCTCTCT TAATATCTTA CTATACTGAA AGCAGACTGC TATAAGGCTT CACTTACTCT TCTACCTCAT AAGGAATATG TTACAATTAA TTTATTAGGT AAGCATTTGT TTTATATTGG TTTTATTTCA CCTGGGCTGA GATTTCAAGA AACACCCCAG TCTTCACAGT AACACATTTC ACTAACACAT TTACTAAACA TCäGCäACTG TGGCCTGTTA ATTTTTTTAA TAGAAATTTT AAGTCCTCAT TTTCTTTCGG TGTTTTTTAA GCTTAATTTT TCTGGCTTTA TTCATAAATT CTTAAGGTCA ACTACATTTG AAAAATCAAA GACCTGCATT TTAAATTCTT ATTCACCTCT GGCAAAACCA TTCACAAACC ATGGTAGTAA AGAGAAGGGT GACACCTGGT GGCCATAGGT AAATGTACCA CGGTGGTCCG GTGACCAGAG ATGCAGCGCT GAGGGTTTTC CTGAAGGTAA AGGAATAAAG AATGGGTGGA GGGGCGTGCA CTGGAAATCA CTTGTAGAGA AAAGCCCCTG AAAATTTGAG AAAACAAACA AGAAACTACT TACCAGCTAT TTGAATTGCT GGAATCACAG GCCATTGCTG AGCTGCCTGA ACTGGGAACA CAACAGAAGG AAAACAAACC ACTCTGATA-A TCATTGAGTC AAGTACAGCA GGTGATTGAG GACTGCTGAG AGGTACAGGC CAAAATTCTT ATGTTGTATT ATAATAATGT CATCTTATAA TACTGTCAGT

8884 3944 9004 9004 9124 9184 9244 9304 9364 9424 9434 9544 9604 . 9664 9724 9734 9844 9904 9964 10024 10084 10144 10204 10264 10324 10384 10444 10504 10554 10524 10634

JDEV EP- Q 95&Lgr;.6&Ogr;2 T1

ATTTTATAAA ACATTCTTCA CAAACTCACA CACATTTAAA AACAAAACAC TGTCTCTAAA IOS04 ATCCCCAAAT TTTTCATAAA C- 10825

(2) INFORMATION FOR SEQ ID NO:2:

(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 348 amino acids

(B) TYPE: amino acid
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO:2:

Met GIy Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu Gin 15 10 15

Thr Ala VaI Leu Gin GIy Arg Leu Leu Arg Ser His Ser Leu His Tyr 20 25 30

Leu Phe Met GIy AIa Ser GIu Gin Asp Leu GIy Leu Ser Leu Phe GIu 35 40 45

AIa Leu GIy Tyr VaI Asp Asp Gin Leu Phe VaI Phe Tyr Asp His GIu 50 55 60

Ser Arg Arg VaI GIu Pro Arg Thr Pro Trp VaI Ser Ser Arg He Ser 65 70 75 80

Ser GIn Met Trp Leu GIn Leu Ser Gin Ser Leu Lys GIy Trp Asp His

85 90 95

Met Phe Thr VaI Asp Phe Trp Thr He Met GIu Asn His Asn His Ser 100 105 HO

Lys GIu Ser His Thr Leu Gin VaI He Leu GIy Cys GIu Met Gin GIu 115 120 125

Asp Asn Ser Thr GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy Gin Asp 130 135 140

His Leu GIu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala GIu Pro 145 150 155 160

Arg Ala Trp Pro Thr Lys Leu GIu Trp GIu Arg His Lys He Arg Ala 165 170 175

Arg Gin Asn Arg Ala Tyr Leu GIu Arg Asp Cys Pro Ala Gin Leu Gin 180 185 190

Gin Leu Leu Glu Leu GIy Arg GIy VaI Leu Asp Gin Gin VaI Pro Pro 195 2&Pgr;0 205

Leu VaI Lys VaI Thr His His VaI Thr Ser Ser VaI Thr Thr Leu Arg 210 215 220

Cys Arg AIa Leu Asn Tyr Tyr Pro GIn Asn He Thr Met Lys Trp Leu 225 230 235 · 240

Lys Asp Lys GIn Pro Met Asp Ala Lys GIu Phe GIu Pro Lys Asp VaI 245 250 * 255

10/44

Leu Pro Asn GIy Asp GIy Thr Tyr Gin GIy Trp He Thr Leu Ala VaI 260 265 270

Pro Pro GIy GIu GIu GIn Arg Tyr Thr Cys Gin VaI GIu His Pro GIy ' 230 285

Leu Asp Gin Pro Leu He VaI He Trp GIu Pro Ser Pro Ser GIy Thr 90 295 300

Leu VaI He Gly VaI He Ser GIy He Ala VaI Phe VaI VaI He Leu 310 315 320

Phe He Gly He Leu Phe He He Leu Arg Lys Arg Gin GIy Ser Arg 325 330 335

Gly AIa Met Gly His Tyr VaI Leu Ala GIu Arg GIu 340 345

(2) INFORMATION FOR SEQ ID NO:3:

(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 10825 base pairs

(B) TYPE: nucleic acid

(C) STRANDEDNESS: single

(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(ix) FEATURE:

(A) NAME/KEY: CDS

(B) LOCATION: join(361..436, 3762..4025, 4235..4510, 5606..5881,

6040. .6153, 7107. .7147)

(D) OTHER INFORMATION: /product= "Hereditary Hemochromatosis

(HH) protein containing the 24dl mutation"

/note= "Hereditary Hemochromatosis (HH) gene 24dl allele"

(ix) FEATURE:

(A) NAME/KEY: -

(B) LOCATION: 140..7319

(D) OTHER INFORMATION: /note= "start and stop positions for

24dl allele CDNA (SEQ ID NO:10)"

(ix) FEATURE:

(A) NAME/KEY: -

(B) LOCATION: 3852..3391

(D) OTHER INFORMATION: /note= "start and stop positions for

genomic sequence surrounding variant for 24d2(C) allele (SEQ ID NO:41)"

(ix) FEATURE:

(A) NAME/KEY: -

(B) LOCATION: 5507..6023

(D) OTHER INFORMATION: /note= "start and stop positions for

genomic sequence surrounding variant for 24dl(A) allele (SEQ ID NO:21)"

(ix) FEATURE:

(A) NAME/KEY: allele

(B) LOCATION: replace(5334, "a")

(D) OTHER INFORMATION: /phenotype= "Hereditary Hemochromatosis

, ·· ItIl

11/44

DE/EP O 954602&Tgr;1

(HH) "
/label= 24dl

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:3:

TCTAAGGTTG AGATAAAATT TTTAAATGTA TGATTGAATT TTGAAAATCA TAAATATTTA 6 0

AATATCTAAA GTTCAGATCA GAACATTGCG AAGCTACTTT CCCCAATCAA CAACACCCCT 120

TCAGGATTTA AAAACCAAGG GGGACACTCG ATCACCTAGT GTTTCACAAG CAGGTACCTT 13 0

CTGCTGTAGG AGAGAGAGAA CTAAAGTTCT GAAAGACCTG TTGCTTTTCA CCAGGAAGTT 240

TTACTGGGCA TCTCCTGAGC CTAGGCAATA GCTGTAGGGT GACTTCTGGA GCCATCCCCG 3 00

TTTCCCCGCC CCCCAAAAGA AGCGGAGATT TAACGGGGAC GTGCGGCCAG AGCTGGGGAA 3 60

ATG GGC CCG CGA GCC AGG CCG GCG CTT CTC CTC CTG ATG CTT TTG CAG 403 Met GIy Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu Gin 15 10 15

ACC GCG GTC CTG CAG GGG CGC TTG CTG C GTGAGTCCGA GGGCTGCGGG 456 Thr Ala VaI Leu Gin GIy Arg Leu Leu
20 25

CGAACTAGGG GCGCGGCGGG GGTGGAAAAA TCGAAACTAG CTTTTTCTTT GCGCTTGGGA . 516

GTTTGCTAAC TTTGGAGGAC CTGCTCAACC CTATCCGCAA GCCCCTCTCC CTACTTTCTG 57 6

CGTCCAGACC CCGTGAGGGA GTGCCTACCA CTGAACTGCA GATAGGGGTC CCTCGCCCCA 63 6

GGACCTGCCC CCTCCCCCGG CTGTCCCGGC TCTGCGGAGT GACTTTTGGA ACCGCCCACT 69 6

CCCTTCCCCC AACTAGAATG CTTTTAAATA AATCTCGTAG TTCCTCACTT GAGCTGAGCT 756

AAGCCTGGGG CTCCTTGAAC CTGGAACTCG GGTTTATTTC CAATGTCAGC TGTGCAGTTT 816

TTTCCCCAGT CATCTCCAAA CAGGAAGTTC TTCCCTGAGT GCTTGCCGAG AAGGCTGAGC 876

AAACCCACAG CAGGATCCGC ACGGGGTTTC CACCTCAGAA CGAATGCGTT GGGCGGTGGG 93 6

GGCGCGAAAG AGTGGCGTTG GGGATCTGAA TTCTTCACCA TTCCACCCAC TTTTGGTGAG 996

ACCTGGGGTG GAGGTCTCTA GGGTGGGAGG CTCCTGAGAG AGGCCTACCT CGGGCCTTTC 10 56

CCCACTCTTG GCAATTGTTC TTTTGCCTGG AAAATTAAGT ATATGTTAGT TTTGAACGTT 1116

TGAACTGAAC AATTCTCTTT TCGGCTAGGC TTTATTGATT TGCAATGTGC TGTGTAATTA 117 6

AGAGGCCTCT CTACAAAGTA CTGATAATGA ACATGTAAGC AATGCACTCA CTTCTAAGTT 12 3 6

ACATTCATAT CTGATCTTAT TTGATTTTCA CTAGGCATAG GGAGGTAGGA GCTAATAATA 12 96

CGTTTATTTT ACTAGAAGTT AACTGGAATT CAGATTATAT AACTCTTTTC AGGTTACAAA 13 5 6

GAACATAAAT AATCTGGTTT TCTGATGTTA TTTCAAGTAC TACAGCTGCT TCTAATCTTA 1416

GTTGACAGTG ATTTTGCCCT GTAGTGTAGC ACAGTGTTCT GTGGGTCACA CGCCGGCCTC 14 7 6

AGCACAGCAC TTTGAGTTTT GGTACTACGT GTATCCACAT TTTACACATG ACAAGAATGA 153 6

GGCATGGCAC GGCCTGCTTC CTGGCAAATT TATTCAATGG TACACTGGGC TTTGGTGGCA 159 6

D£i.E_:e_:0_:.,95.f.502T1

GAGCTCATGT CTCCACTTCA TAGCTATGAT TCTTA-AACAT CACACTGCAT TAGAGGTTGA 1656

ATAATAAAAT TTCATGTTGA GCAGAAATAT TCATTGTTTA CAAGTGTAAA TGAGTCCCAG 1716

CCATGTGTTG CACTGTTCAA GCCCCAAGGG AGAGAGCAGG GAAACAAGTC TTTACCCTTT 17 7 6

GATATTTTGC ATTCTAGTGG GAGAGATGAC AATAAGCAAA TGAGCAGAA-A GATATACAAC 18 3 6

ATCAGGAAAT CATGGGTGTT GTGAGAAGCA GAGAAGTCAG GGCAAGTCAC TCTGGGGCTG 1896

ACACTTGAGC AGAGACATGA AGGAAATAAG AATGATATTG ACTGGGAGCA GTATTTCCCA 19 56

GGCAAACTGA GTGGGCCTGG CAAGTTGGAT TAAAAAGCGG GTTTTCTCAG CACTACTCAT 2 016

GTGTGTGTGT GTGGGGGGGG GGGGCGGCGT GGGGGTGGGA AGGGGGACTA CCATCTGCAT 2 07 6

GTAGGATGTC TAGCAGTATC CTGTCCTCCC TACTCACTAG GTGCTAGGAG CACTCCCCCA 213 6

GTCTTGACAA CCAAAAATGT CTCTAAACTT TGCCACATGT CACCTAGTAG ACAAACTCCT 219 6

GGTTAAGAAG CTCGGGTTGA AAAAAATAAA CAAGTAGTGC TGGGGAGTAG AGGCCAAGAA 2 2 56

GTAGGTAATG GGCTCAGAAG AGGAGCCACA AACAAGGTTG TGCAGGCGCC TGTAGGCTGT 2316

GGTGTGAATT CTAGCCAAGG AGTAACAGTG ATCTGTCACA GGCTTTTAAA AGATTGCTCT 2376 GGCTGCTATG TGGAAAGCAG AATGAAGGGA GCAACAGTAA AAGCAGGGAG CCCAGCCAGG . 243 6

AAGCTGTTAC ACAGTCCAGG CAAGAGGTAG TGGAGTGGGC TGGGTGGGAA CAGAAAAGGG 2496

AGTGACAAAC CATTGTCTCC TGAATATATT CTGAAGGAAG TTGCTGAAGG ATTCTATGTT 2556

GTGTGAGAGA AAGAGAAGAA TTGGCTGGGT GTAGTAGCTC ATGCCAAGGA GGAGGCCAAG 2 616

GAGAGCAGAT TCCTGAGCTC AGGAGTTCAA GACCAGCCTG GGCAACACAG CAAAACCCCT 2 676

TCTCTACAAA AAATACAAAA ATTAGCTGGG TGTGGTGGCA TGCACCTGTG ATCCTAGCTA 27 3 6

CTCGGGAGGC TGAGGTGGAG GGTATTGCTT GAGCCCAGGA AGTTGAGGCT GCAGTGAGCC 27 9 6

ATGACTGTGC CACTGTACTT CAGCCTAGGT GACAGAGCAA GACCCTGTCT CCCCTGACCC 23 56

CCTGAAAAAG AGAAGAGTTA AAGTTGACTT TGTTCTTTAT TTTAATTTTA TTGGCCTGAG 2916

CAGTGGGGTA ATTGGCAATG CCATTTCTGA GATGGTGAAG GCAGAGGAAA GAGCAGTTTG 29 7 6

GGGTAAATCA AGGATCTGCA TTTGGGACAT GTTäAGTTTG AGATTCCAGT CAGGCTTCCA 303 6

AGTGGTGAGG CCACATAGGC AGTTCAGTGT AAGAATTCAG GACCAAGGCT GGGCACGGTG 3 09 6

GCTCACTTCT GTAATCCCAG CACTTTGGTG GCTGAGGCAG GTAGATCATT TGAGGTCAGG 3156

AGTTTGAGAC AAGCTTGGCC AACATGGTGA AACCCCATGT CTACTAAAAA TACAAAAATT 3216

AGCCTGGTGT GGTGGCGCAC GCCTATAGTC CCAGGTTTTC AGGAGGCTTA GGTAGGAGAA 3 27 6

TCCCTTGAAC CCAGGAGGTG CAGGTTGCAG TGAGCTGAGA TTGTGCCACT GCACTCCAGC 33 3 6

CTGGGTGATA GAGTGAGACT CTGTCTCAAA AAAAAAAAAA AAAAAAAAAA AAAAAJiCTGA 3 3 96

AGGAATTATT CCTCAGGATT TGGGTCTAAT TTGCCCTGAG CACCAACTCC TGAGTTCA₁AC 3 4 55

TACCATGGCT AGACACACCT TAACATTTTC TAGAATCCAC CAGCTTTAGT GGAGTCTGTC 3 516

TAATCATGAG TATTGGAATA GGATCTGGGG GCAGTGAGGG GGTGGCAGCC ACGTGTGGCA 3 576

GAGAAAAGCA CACAAGGAAA GAGCACCCAG GACTGTCATA TGGAAGAAAG ACAGGACTGC 3 63 6

AACTCACCCT TCACAAAATG AGGACCAGAC ACAGCTGATG GTATGAGTTG ATGCAGGTGT 3 69 6

GTGGAGCCTC AACATCCTGC TCCCCTCCTA CTACACATGG TTAAGGCCTG TTGCTCTGTC 3 756

TCCAG GT TCA CAC TCT CTG CAC TAC CTC TTC ATG GGT GCC TCA GAG 3 3 02 Arg Ser His Ser Leu His Tyr Leu Phe Met GIy Ala Ser GIu

30 35

CAG GAC CTT GGT CTT TCC TTG TTT GAA GCT TTG GGC TAC GTG GAT GAC 3350 Gin Asp Leu GIy Leu Ser Leu Phe GIu Ala Leu GIy Tyr VaI Asp Asp 40 45 50 55

CAG CTG TTC GTG TTC TAT GAT CAT GAG AGT CGC CGT GTG GAG CCC CGA 3 3 93 Gin Leu Phe VaI Phe Tyr Asp His GIu Ser Arg Arg VaI GIu Pro Arg

60 65 70

ACT CCA TGG GTT TCC AGT AGA ATT TCA AGC CAG ATG TGG CTG CAG CTG 3 94 6 Thr Pro Trp VaI Ser Ser Arg He Ser Ser Gin Met Trp Leu GIn Leu 75 80 85

AGT CAG AGT CTG AAA GGG TGG GAT CAC ATG TTC ACT GTT GAC TTC TGG 3 994 Ser Gin Ser Leu Lys GIy Trp Asp His Met Phe Thr VaI Asp Phe Trp 90 95 100

ACT ATT ATG GAA AAT CAC AAC CAC AGC AAG G GTATGTGGAG AGGGGGCCTC 4 04 5 Thr He Met GIu Asn His Asn His Ser Lys
105 110

ACCTTCCTGA GGTTGTCAGA GCTTTTCATC TTTTCATGCA TCTTGAAGGA AACAGCTGGA 4105 AGTCTGAGGT CTTGTGGGAG CAGGGAAGAG GGAAGGAATT TGCTTCCTGA GATCATTTGG 4165 TCCTTGGGGA TGGTGGAAAT AGGGACCTAT TCCTTTGGTT GCAGTTAACA AGGCTGGGGA 4225

TTTTTCCAG AG TCC CAC ACC CTG CAG GTC ATC CTG GGC TGT GAA ATG 4272 GIu Ser His Thr Leu Gin VaI He Leu GIy Cys GIu Met 115 120 125

CAA GAA GAC AAC AGT ACC GAG GGC TAC TGG AAG TAC GGG TAT GAT GGG 4320 Gin GIu Asp Asn Ser Thr GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy 130 135 140

CAG GAC CAC CTT GAA TTC TGC CCT GAC ACA CTG GAT TGG AGA GCA GCA 43 63 Gin Asp His Leu GIu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala AIa 145 150 155

GAA CCC AGG GCC TGG CCC ACC AAG CTG GAG TGG GAA AGG CAC AAG ATT 4416 GIu Pro Arg AIa Trp Pro Thr Lys Leu GIu Trp GIu Arg His Lys He 160 165 170

CGG GCC AGG CAG AAC AGG GCC TAC CTG GAG AGG GAC TGC CCT GCA CAG 44 6 4 Arg AIa Arg Gin Asn Arg AIa Tyr Leu GIu Arg Asp Cys Pro Ala GIn 175 130 135 190

CTG CAG CAG TTG CTG GAG CTG GGG AGA GGT GTT TTG GAC CAA CAA G 4 510 Leu Gin GIn Leu Leu GIu Leu GIy Arg GIy VaI Leu Asp Gin Gin

195 200 205

GTATGGTGGA AACACACTTC TGCCCCTATA CTCTAGTGGC AGAGTGGAGG AGGTTGCAGG 4 57 0

3A

Q_:E:-/-E.P.4_:95-A-G02T1

GCACGGAATC CCTGGTTGGA GTTTCAGAGG TGGCTGAGGC TGTGTGCCTC TCCAAATTCT GGGi¹AGGGAC TTTCTCAATC CTAGAGTCTC TACCTTATAA TTGAGATGTA TGAGACAGCC ACAAGTCATG GGTTTAATTT CTTTTCTCCA TGCATATGGC TCAAAGGGAA GTGTCTATGG CCCTTGCTTT TTATTTAACC AATAATCTTT TGTATATTTA TACCTGTTAA AAATTCAGAA ATGTCAAGGC CGGGCACGGT GGCTCACCCC TGTAATCCCA GCACTTTGGG AGGCCGAGGC GGGTGGTCAC AAGGTCAGGA GTTTGAGACC AGCCTGACCA ACATGGTGAA ACCCGTCTCT AAAAAAATAC AAAAATTAGC TGGTCACAGT CATGCGCACC TGTAGTCCCA GCTAATTGGA AGGCTGAGGC AGGAGCATCG CTTGAACCTG GGAAGCGGAA GTTGCACTGA GCCAAGATCG CGCCACTGCA CTCCAGCCTA GGCAGCAGAG TGAGACTCCA TCTTAAAAAA AAAAAAAAAA AAAfAAAGAG AATTCAGAGA TCTCAGCTAT CATATGAATA CCAGGACAAA ATATCAAGTG AGGCCACTTA TCAGAGTAGA AGAATCCTTT AGGTTAAAAG TTTCTTTCAT AGAACATAGC AATAATCACT GAAGCTACCT ATCTTACAAG TCCGCTTCTT ATAACAATGC CTCCTAGGTT GACCCAGGTG AAACTGACCA TCTGTATTCA ATCATTTTCA ATGCACATAA AGGGCAATTT TATCTATCAG AACAAAGAAC ATGGGTAACA GATATGTATA TTTACATGTG AGGAGAACAA GCTGATCTGA CTGCTCTCCA AGTGACACTG TGTTAGAGTC CAATCTTAGG ACACAAAATG GTGTCTCTCC TGTAGCTTGT TTTTTTCTGA AAAGGGTATT TCCTTCCTCC AACCTATAGA aggaagtgaa agttccagtc ttcctggcaa gggtaaacag atcccctctc ctcatccttc ctctttcctg tcaag tg cct cct ttg gtg aag gtg aca cat cat gtg acc

VaI Pro Pro Leu VaI Lys VaI Thr His His VaI Thr 210 215

TCT TCA GTG ACC ACT CTA CGG TGT CGG GCC TTG AAC TAC TAC.CCC CAG Ser Ser VaI Thr Thr Leu Arg Cys Arg AIa Leu Asn Tyr Tyr Pro GIn 220 225 230

AAC ATC ACC ATG AAG TGG CTG AAG GAT AAG CAG CCA ATG GAT GCC AAG Asn He Thr Met Lys Trp Leu Lys Asp Lys GIn Pro Met Asp Ala Lys 235 240 245

GAG TTC GAA CCT AAA GAC GTA TTG CCC AAT GGG GAT GGG ACC TAC CAG GIu Phe GIu Pro Lys Asp VaI Leu Pro Asn GIy Asp GIy Thr Tyr GIn 250 255 260 265

GGC TGG ATA ACC TTG GCT GTA CCC CCT GGG GAA GAG CAG AGA TAT ACG GIy Trp He Thr Leu Ala VaI Pro Pro GIy GIu GIu GIn Arg Tyr Thr

270 275 280

TAC CAG GTG GAG CAC CCA GGC CTG GAT CAG CCC CTC ATT GTG ATC TGG G Tyr Gin VaI GIu His Pro GIy Leu Asp Gin Pro Leu He VaI He Trp 235 290 295

GTATGTGACT GATGAGAGCC AGGAGCTGAG AAAATCTATT GGGGGTTGAG AGGAGTGCCT GAGGAGGTAA TTATGGCAGT GAGATGAGGA TCTGCTCTTT GTTAGGGGGT GGGCTGAGGG TGGCAATCAA AGGCTTTAAC TTGCTTTTTC TGTTTTAG AG CCC TCA CCG TCT

GIu Pro Ser Pro Ser

5688 5736 5784 5832 5381

32 .p.E/££..0.35.4 602 T1

15/44

300

GGC ACC CTA GTC ATT GGA 'GTC ATC AGT GGA ATT GCT GTT TTT GTC GTC 6101 GIy Thr Leu VaI lie GIy VaI lie Ser GIy lie Ala VaI Phe VaI VaI 305 310 315

ATC TTG TTC ATT GGA ATT TTG TTC ATA ATA TTA AGG AAG AGG CAG GGT 6149 lie Leu Phe lie GIy lie Leu Phe lie lie Leu Arg Lys Arg Gin GIy 320 325 330 ,

TCA A GTGAGTAGGA ACAAGGGGGA AGTCTCTTAG TACCTCTGCC CCAGGGCACA 62 03

GTGGGAAGAG GGGCAGAGGG GATCTGGCAT CCATGGGAAG CATTTTTCTC ATTTATATTC 62 63

TTTGGGGACA CCAGCAGCTC CCTGGGAGAC AGAAAATAAT GGTTCTCCCC AGAATGAAAG 63 23

TCTCTAATTC AACAAACATC TTCAGAGCAC CTACTATTTT GCAAGAGCTG TTTAAGGTAG 63 83

TACAGGGGCT TTGAGGTTGA GAAGTCACTG TGGCTATTCT CAGAACCCAA ATCTGGTAGG 64 43

GAATGAAATT GATAGCAAGT AAATGTAGTT AAAGAAGACC CCATGAGGTC CTAAAGCAGG 6503

CAGGAAGCAA ATGCTTAGGG TGTCAAAGGA AAGAATGATC ACATTCAGCT GGGGATCAAG 6563 ATAGCCTTCT GGATCTTGAA GGAGAAGCTG GATTCCATTA GGTGAGGTTG AAGATGATGG · 662 3

GAGGTCTACA CAGACGGAGC AACCATGCCA AGTAGGAGAG TATAAGGCAT ACTGGGAGAT 6683

TAGAAATAAT TACTGTACCT TAACCCTGAG TTTGCGTAGC TATCACTCAC CAATTATGCA 674 3

TTTCTACCCC CTGAACATCT GTGGTGTAGG GAAAAGAGAA TCAGAAAGAA GCCAGCTCAT 6803.

ACAGAGTCCA AGGGTCTTTT GGGATATTGG GTTATGATCA CTGGGGTGTC ATTGAAGGAT 6863

CCTAAGAAAG GAGGACCACG ATCTCCCTTA TATGGTGAAT GTGTTGTTAA GAAGTTAGAT 6923

GAGAGGTGAG GAGACCAGTT AGAAAGCCAA TAAGCATTTC CAGATGAGAG ATAATGGTTC 6983

TTGAAATCCA ATAGTGCCCA GGTCTAAATT GAGATGGGTG AATGAGGAAA ATAAGGAAGA 7043

GAGAAGAGGC AAGATGGTGC CTAGGTTTGT GATGCCTCTT TCCTGGGTCT CTTGTCTCCA 7103

CAG GA GGA GCC ATG GGG CAC TAC GTC TTA GCT GAA CGT GAG 7144 Arg GIy Ala Met GIy His Tyr VaI Leu Ala GIu Arg GIu

340 345

TGACACGCAG CCTGCAGACT CACTGTGGGA AGGAGACAAA ACTAGAGACT CAAAGAGGGA 72 04

GTGCATTTAT GAGCTCTTCA TGTTTCAGGA GAGAGTTGAA CCTAAACATA GAAATTGCCT 72 64

GACGAACTCC TTGATTTTAG CCTTCTCTGT TCATTTCCTC AAAAAGATTT CCCCATTTAG 7 3 24

GTTTCTGAGT TCCTGCATGC CGGTGATCCC TAGCTGTGAC CTCTCCCCTG GAACTGTCTC 7 334

TCATGAACCT CAAGCTGCAT CTAGAGGCTT CCTTCATTTC CTCCGTCACC TCAGAGACAT 74 4 4

ACACCTATGT CATTTCATTT CCTATTTTTG GAAGAGGACT CCTTAAATTT GGGGGACTTA 7504

CATGATTCAT TTTAACATCT GAGAAAAGCT TTGAACCCTG GGACGTGGCT AGTCATAACC 7564

TTACCAGATT TTTACACATG TATCTATGCA TTTTCTGGAC CCGTTCAACT TTTCCTTTGA 7 624

• · 4 · · »··■ 'ft

ATCCTCTCTC TGTGTTACCC AGTAACTCAT CTGTCACCAA GCCTTGGGGA TTCTTCCATC 7684

TGATTGTGAT GTGAGTTGCA CAGCTATGAA GGCTGTACAC TGCACGAATG GAAGAGGCAC 77 4 4

CTGTCCCAGA AAAAGCATCA TGGCTATCTG TGGGTAGTAT GATGGGTGTT TTTAGCAGGT 78 04

AGGAGGCAAA TATCTTGAAA GGGGTTGTGA AGAGGTGTTT TTTCTAATTG GCATGAAGGT 78 64

GTCATACAGA TTTGCAAAGT TTAATGGTGC CTTCATTTGG GATGCTACTC TAGTATTCCA 7924

GACCTGAAGA ATCACAATAA TTTTCTACCT GGTCTCTCCT TGTTCTGATA ATGAAAATTA 798 4

TGATAAGGAT GATAAAAGCA CTTACTTCGT GTCCGACTCT TCTGAGCACC TACTTACATG 8 04 4

CATTACTGCA TGCACTTCTT ACAATAATTC TATGAGATAG GTACTATTAT CCCCATTTCT 8104

TTTTTAAATG AAGAAAGTGA AGTAGGCCGG GCACGGTGGC TCACGCCTGT AATCCCAGCA 8164

CTTTGGGAGG CCAAAGCGGG TGGATCACGA GGTCAGGAGA TCGAGACCAT CCTGGCTAAC 8224

ATGGTGAAAC CCCATCTCTA ATAAAAATAC AAAAAATTAG CTGGGCGTGG TGGCAGACGC 3 2 84

CTGTAGTCCC AGCTACTCGG AAGGCTGAGG CAGGAGAATG GCATGAACCC AGGAGGCAGA 83 4 4

GCTTGCAGTG AGCCGAGTTT GCGCCACTGC ACTCCAGCCT AGGTGACAGA GTGAGACTCC 84 04

ATCTCAAAAA AATAAAAATA AAAATAAAAA AATGAAAAAA AAAAGAAAGT GAAGTATAGA -3464

GTATCTCATA GTTTGTCAGT GATAGAAACA GGTTTCAAAC TCAGTCAATC TGACCGTTTG 852 4

ATACATCTCA GACACCACTA CATTCAGTAG TTTAGATGCC TAGAATAAAT AGAGAAGGAA 8534

GGAGATGGCT CTTCTCTTGT CTCATTGTGT TTCTTCTGAG TGAGCTTGAA TCACATGAAG 8644

GGGAACAGCA GAAAACAACC AACTGATCCT CAGCTGTCAT GTTTCCTTTA AAAGTCCCTG 87 04

AAGG,\AGGTC CTGGAATGTG ACTCCCTTGC TCCTCTGTTG CTCTCTTTGG CATTCATTTC 87 64

TTTGGACCCT ACGCAAGGAC TGTAATTGGT GGGGACAGCT AGTGGCCCTG CTGGGCTTCA 8824

CACACGGTGT CCTCCCTAGG CCAGTGCCTC TGGAGTCAGA ACTCTGGTGG TATTTCCCTC 8884

AATGAAGTGG AGTAAGCTCT CTCATTTTGA GATGGTATAA TGGAAGCCAC CAAGTGGCTT 894 4

AGAGGATGCC CAGGTCCTTC CATGGAGCCA CTGGGGTTCC GGTGCACATT AAAAAAAAAA 9 0 04

TCTAACCAGG ACATTCAGGA ATTGCTAGAT TCTGGGAAAT CAGTTCACCA TGTTCAAAAG 9 0 64

AGTCTTTTTT TTTTTTTTGA GACTCTATTG CCCAGGCTGG AGTGCAATGG CATGATCTCG 9124

GCTCACTGTA ACCTCTGCCT CCCAGGTTCA AGCGATTCTC CTGTCTCAGC CTCCCAAGTA 9184

GCTGGGATTA CAGGCGTGCA CCACCATGCC CGGCTAATTT TTGTATTTTT AGTAGAGACA 9244

GGGTTTCACC ATGTTGGCCA GGCTGGTCTC GAACTCTCCT GACCTCGTGA TCCGCCTGCC 9 3 04

TCGGCCTCCC AAAGTGCTGA GATTACAGGT GTGAGCCACC CTGCCCAGCC GTCAAAAGAG 9 3 64

TCTTAATATA TATATCCAGA TGGCATGTGT TTACTTTATG TTACTACATG CACTTGGCTG 94 24

CATAAATGTG GTACAAGCAT TCTGTCTTGA AGGGCAGGTG CTTCAGGATä CCATATACAG 9 4 34

CTCAGAAGTT TCTTCTTTAG GCATTAAATT TTAGCAAAGA TATCTCATCT CTTCTTTTAA 9 54 4

D€t/EP.0:95-4.a02 Tl

17/44

ACCATTTTCT TTTTTTGTGG TTAGAAAAGT TATGTAGAAA ÄAAGTAAATG TGATTTACGC TCATTGTAGA AAAGCTATAA AATGAATACA ATTAAAGCTG TTATTTAATT AGCCAGTGAA AAACTATTAA CAACTTGTCT ATTACCTGTT AGTATTATTG TTGCATTAAA AATGCATATA CTTTAATAAA TGTATATTGT ATTGTATACT GCATGATTTT ATTGAAGTTC TTGTTCATCT tgtgtatata cttaatcgct ttgtcatttt ggagacattt attttgcttc taatttcttt ACATTTTGTC TTACGGAATA TTTTCATTCA ACTGTGGTAG CCGAATTAAT CGTGTTTCTT CACTCTAGGG ACATTGTCGT CTAAGTTGTA AGACATTGGT TATTTTACCA GCAAACCATT CTGAAAGCAT ATGACAAATT ATTTCTCTCT TAATATCTTA CTATACTGAA AGCAGACTGC TATAAGGCTT CACTTACTCT TCTACCTCAT AAGGAATATG TTACAATTAA TTTATTAGGT AAGCATTTGT TTTATATTGG TTTTATTTCA CCTGGGCTGA GATTTCAAGA AACACCCCAG TCTTCACAGT AACACATTTC ACTAACACAT TTACTAAACA TCAGCAACTG TGGCCTGTTA atttttttaa tagaaatttt aagtcctcat tttctttcgg tgttttttaa gcttaatttt tctggcttta ttcataaatt cttaaggtca actacatttg aaaaatcaaa gacctgcatt TTAAATTCTT ATTCACCTCT GGCAAAACCA TTCACAAACC ATGGTAGTAA AGAGAAGGGT GACACCTGGT GGCCATAGGT AAATGTACCA CGGTGGTCCG GTGACCAGAG ATGCAGCGCT GAGGGTTTTC CTGAAGGTAA AGGAATAAAG AATGGGTGGA GGGGCGTGCA CTGGAAATCA cttgtagaga aaagcccctg aaaatttgag aaaacaaaca agaaactact taccagctat ttgaattgct ggaatcacag gccattgctg agctgcctga actgggaaca caacagaagg aaaacaaacc actctgataa tcattgagtc aagtacagca ggtgattgag gactgctgag aggtacaggc caaaattctt atgttgtatt ataataatgt catcttataa tactgtcagt attttataaa acattcttca caaactcaca cacatttaaa aacaaaacac tgtctctaaa atccccaaat ttttcataaa c

(2) information for seq id no: 4:

(i) sequence characteristics:

(A) LENGTH: 34S amino acids

(B) TYPE: amino acid
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:4:

Met GIy Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu Gin 15 10 15

Thr Ala VaI Leu Gin GIy Arg Leu Leu Arg Ser His Ser Leu His Tyr 20 25 30

9604 9664 9724 9784 9344 9 9.04 9964 10024 10034 10144 10204 10264 10324 •10334 10444 10504 10564 10624 10684 10744 10304 10325

Leu Phe Met GIy AIa Ser GIu Gin Asp Leu GIy Leu Ser Leu ?he GIu 35 40 45

Ala Leu GIy Tyr VaI Asp Asp Gin Leu Phe VaI Phe Tyr Asp His GIu 50 55 60

Ser Arg Arg VaI GIu Pro Arg Thr Pro Trp VaI Ser Ser Arg He Ser 65 70 75 so

Ser Gin Met Trp Leu GIn Leu Ser GIn Ser Leu Lys GIy Trp Asp His

35 90 95

Met Phe Thr VaI Asp Phe Trp Thr lie Met GIu Asn His Asn His Ser 100 * 105 HO

Lys GIu Ser His Thr Leu Gin VaI He Leu GIy Cys GIu Met Gin GIu 115 120 * 125

Asp Asn Ser Thr GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy Gin Asp 130 135 140

His Leu GIu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala GIu Pro 145 150 155 160

Arg Ala Trp Pro Thr Lys Leu GIu Trp GIu Arg His Lys He Arg Ala

165 170 175

Arg Gin Asn Arg Ala Tyr Leu GIu Arg Asp Cys Pro Ala Gin Leu Gin ISO 135 190

Gin Leu Leu GIu Leu Gly Arg GIy VaI Leu Asp Gin Gin VaI Pro Pro 195 200 205

Leu VaI Lys VaI Thr His His VaI Thr Ser Ser VaI Thr Thr Leu Arg 210 215 220

Cys Arg AIa Leu Asn Tyr Tyr Pro GIn Asn He Thr Met Lys Trp Leu 225 230 235 240

Lys Asp Lys Gin Pro Met Asp Ala Lys GIu Phe GIu Pro Lys Asp VaI

245 250 255

Leu Pro Asn Gly Asp GIy Thr Tyr Gin GIy Trp He Thr Leu Ala VaI 260 265 270

Pro Pro Gly GIu GIu GIn Arg Tyr Thr Tyr Gin VaI GIu His Pro Gly 275 280 235

Leu Asp GIn Pro Leu He VaI He Trp GIu Pro Ser Pro Ser Gly Thr 290 295 300

Leu VaI He Gly VaI He Ser Gly He Ala VaI Phe VaI VaI He Leu 305 310 315 320

Phe He Gly He Leu Phe He He Leu Arg Lys Arg Gin Gly Ser Arg

325 330 * 335 '

Gly AIa Met Gly His Tyr VaI Leu Ala GIu Arg GIu 340 345

(2) INFORMATION FOR SEQ ID NO:5:

(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 10325 base pairs

(B) TYPE: nucleic acid

(C) STRANDEDNESS: single

_19/·₄&ngr;

DE/EPO 954602T1

(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)

(ix) FEATURE:

(A) NAME/KEY: CDS

(B) LOCATION: join(361..436, 3762..4025, 4235. .4510, 5606. .583"

6040..6153, 7107..7147)

(D) OTHER INFORMATION: /product= "Hereditary Hemochromatosis

(HH) protein containing the 24d2 mutation"

/note= "Hereditary Hemochromatosis (HH) gene 24d2 allele"

(ix) FEATURE:

(A) NAME/KEY: -

(B) LOCATION: 140..7319

(D) OTHER INFORMATION: /note= "start and stop positions for

24d2 allele cDNA (SEQ ID NO:!!)"

(ix) FEATURE:

(A) NAME/KEY: -

(B) LOCATION: 3352..3S91

(D) OTHER INFORMATION: /note= "start and stop positions for

genomic sequence surrounding variant for 24d2(G) allele (SEQ ID NO:42)" ·

(ix) FEATURE:

(A) NAME/KEY: -

(B) LOCATION: 5507..6023

(D) OTHER INFORMATION: /note= "start and stop positions for

genomic sequence surrounding variant for 24dl(G) allele (SEQ ID NO:20)"

(ix) FEATURE:

(A) NAME/KEY: allele

(B) LOCATION: replace(3372, "g")

(D) OTHER INFORMATION: /phenotype= "Hereditary Hemochroinatosis

(HH) »
/label= 24d2

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO:5:

TCTAAGGTTG AGATAAAATT TTTAAATGTA TGATTGAATT TTGAAAATCA TAAATATTTA 60

AATATCTAAA GTTCAGATCA GAACATTGCG AAGCTACTTT CCCCAATCAA CAACACCCCT 12 0

TCAGGATTTA AAAACCAAGG GGGACACTGG ATCACCTAGT GTTTCACAAG CAGGTACCTT 13 0

CTGCTGTAGG AGAGAGAGAA CTAAAGTTCT GAAAGACCTG TTGCTTTTCA CCAGGAAGTT 240

TTACTGGGCA TCTCCTGAGC CTAGGCAATA GCTGTAGGGT GACTTCTGGA GCCATCCCCG 3 00

TTTCCCCGCC CCCCAAAAGA AGCGGAGATT TAACGGGGAC GTGCGGCCAG AGCTGGGGAA 3 60

ATG GGC CCG CGA GCC AGG CCG GCG CTT CTC CTC CTG ATG CTT TTG CAG 4 03 Met GIy Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu GIn 5 10 15

ACC GCG GTC CTG CAG GGG CGC TTG CTG C GTGAGTCCGA GGGCTGCGGG 45 6

Thr Ala VaI Leu Gin GIy Arg Leu Leu
20 25

CGAACTAGGG GCGCGGCGGG GGTGGAAAAA TCGAAACTAG CTTTTTCTTT GCGCTTGGGA GTTTGCTAAC TTTGGAGGAC CTGCTCAACC CTATCCGCAA GCCCCTCTCC CTACTTTCTG CGTCCAGACC CCGTGAGGGA GTGCCTACCA CTGAACTGCA GATAGGGGTC CCTCGCCCCA GGACCTGCCC CCTCCCCCGG CTGTCCCGGC TCTGCGGAGT GACTTTTGGA ACCGCCCACT CCCTTCCCCC AACTAGAATG CTTTTAAATA AATCTCGTAG TTCCTCACTT GAGCTGAGCT AAGCCTGGGG CTCCTTGAAC CTGGAACTCG GGTTTATTTC CAATGTCAGC TGTGCAGTTT TTTCCCCAGT CATCTCCAAA CAGGAAGTTC TTCCCTGAGT GCTTGCCGAG AAGGCTGAGC AAACCCACAG CAGGATCCGC äCGGGGTTTC CACCTCAGAA CGAATGCGTT GGGCGGTGGG GGCGCGAAAG AGTGGCGTTG GGGATCTGAA TTCTTCACCA TTCCACCCAC TTTTGGTGAG ACCTGGGGTG GAGGTCTCTA GGGTGGGAGG CTCCTGAGAG AGGCCTACCT CGGGCCTTTC CCCACTCTTG GCAATTGTTC TTTTGCCTGG AAAATTAAGT ATATGTTAGT TTTGAACGTT TGAACTGAAC AATTCTCTTT TCGGCTAGGC TTTATTGATT TGCAATGTGC TGTGTAATTA AGAGGCCTCT CTACAAAGTA CTGATAATGA ACATGTAAGC AATGCACTCA CTTCTAAGTT ACATTCATAT CTGATCTTAT TTGATTTTCA CTAGGCATAG GGAGGTAGGA GCTAATAATA CGTTTATTTT ACTAGAAGTT AACTGGAATT CAGATTATAT AACTCTTTTC AGGTTACAAA GAACATAAAT AATCTGGTTT TCTGATGTTA TTTCAAGTAC TACAGCTGCT TCTAATCTTA GTTGACAGTG ATTTTGCCCT GTAGTGTAGC ACAGTGTTCT GTGGGTCACA CGCCGGCCTC AGCACAGCAC TTTGAGTTTT GGTACTACGT GTATCCACAT TTTACACATG ACAAGAATGA GGCATGGCAC GGCCTGCTTC CTGGCAAATT TATTCAATGG TACACTGGGC TTTGGTGGCA GAGCTCATGT CTCCACTTCA TAGCTATGAT TCTTAAACAT CACACTGCAT TAGAGGTTGA ATAATAAAAT TTCATGTTGA GCAGAAATAT TCATTGTTTA CAAGTGTAAA TGAGTCCCAG CCATGTGTTG CACTGTTCAA GCCCCAAGGG AGAGAGCAGG GAAACAAGTC TTTACCCTTT GATATTTTGC ATTCTAGTGG GAGAGATGAC AATAAGCAAA TGAGCAGAAA GATATACAAC ATCAGGAAAT CATGGGTGTT GTGAGAAGCA GAGAAGTCAG GGCAAGTCAC TCTGGGGCTG ACACTTGAGC AGAGACATGA AGGAAATAAG AATGATATTG ACTGGGAGCA GTATTTCCCA GGCAAACTGA GTGGGCCTGG CAAGTTGGAT TAAAAAGCGG GTTTTCTCAG CACTACTCAT GTGTGTGTGT GTGGGGGGGG GGGGCGGCCT GGGGGTGGGA AGGGGGACTA CCATCTGCAT GTAGGATGTC TAGCAGTATC CTGTCCTCCC TACTCACTAG GTGCTAGGAG CACTCCCCCA GTCTTGACAA CCAAAAATGT CTCTAAACTT TGCCACATGT CACCTAGTAG ACAAACTCCT GGTTAAGAAG CTCGGGTTGA AAAAAATAAA CAAGTAGTGC TGGGGAGTAG AGGCCAAGAA GTAGGTAATG GGCTCAGAAG AGGAGCCACA AACAAGGTTG TGCAGGCGCC TGTAGGCTGT GGTGTGAATT CTAGCCAAGG AGTAACAGTG ATCTGTCACA GGCTTTTAAA AGATTGCTCT

602T1

516 576 636 696 756 316 376 936 996 1056 1116 1176 1236 1296 1356 1416 1476 1536 1596 1656 1716 1776 1336 1896 1956 2016 2076 2136 2196 2256 2316 2376

21/44

DE/EP O 954602T1

(A) NAME/KEY: -

(B) LOCATION: 3S52..3891

(D) OTHER INFORMATION: /note= "start and stop positions for

genomic sequence surrounding variant
for 24d2(G) allele (SEQ ID NO:42)"

(ix) FEATURE:

(A) NAME/KEY: -

(B) LOCATION: 5507..6023

(D) OTHER INFORMATION: /note= "start and stop positions for

genoinic sequence surrounding variant
for 24dl(A) allele (SEQ ID NO:21)"

(ix) FEATURE:

(A) NAME/KEY: allele

(B) LOCATION: replace(3872, "g")

(D) OTHER INFORMATION: /phenotype= "Hereditary Hemochromatosis

(HH)"
/label= 24d2

(ix) FEATURE:

(A) NAME/KEY: allele

(B) LOCATION: replace(5834, "a")

(D) OTHER INFORMATION: /phenotype= "Hereditary Hemochromatosis

(HH) "
/label= 24dl

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:7:

TCTAAGGTTG AGATAAAATT TTTAAATGTA TGATTGAATT TTGAAAATCA TAAATATTTA 60

AATATCTAAA GTTCAGATCA GAACATTGCG AAGCTACTTT CCCCAATCAA CAACACCCCT 120

TCAGGATTTA AAAACCAAGG GGGACACTGG ATCACCTAGT GTTTCACAAG CAGGTACCTT 130

CTGCTGTAGG AGAGAGAGAA CTAAAGTTCT GAAAGACCTG TTGCTTTTCA CCAGGAAGTT 24 0

TTACTGGGCA TCTCCTGAGC CTAGGCAATA GCTGTAGGGT GACTTCTGGA GCCATCCCCG 3 00

TTTCCCCGCC CCCCAAAAGA AGCGGAGATT TAACGGGGAC GTGCGGCCAG AGCTGGGGAA 3 60

ATG GGC CCG CGA GCC AGG CCG GCG CTT CTC CTC CTG ATG CTT TTG CAG 4 08 Met GIy Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu GIn
15 10 15

ACC GCG GTC CTG CAG GGG CGC TTG CTG C GTGAGTCCGA GGGCTGCGGG 4 56

Thr Ala VaI Leu Gin GIy Arg Leu Leu
20 25

CGAACTAGGG GCGCGGCGGG GGTGGAAAAA TCGAAACTAG CTTTTTCTTT GCGCTTGGGA 516

GTTTGCTAAC TTTGGAGGAC CTGCTCAACC CTATCCGCAA GCCCCTCTCC CTACTTTCTG 57 6

CGTCCAGACC CCGTGAGGGA GTGCCTACCA CTGAACTGCA GATAGGGGTC CCTCGCCCCA 63 6

GGACCTGCCC CCTCCCCCGG CTGTCCCGGC TCTGCGGAGT GACTTTTGGA ACCGCCCACT 696

CCCTTCCCCC AACTAGAATG CTTTTAAATA AATCTCGTAG TTCCTCACTT GAGCTGAGCT 7 56

AAGCCTGGGG CTCCTTGAAC CTGGAACTCG GGTTTATTTC CAATGTCAGC TGTGCAGTTT 316

TTTCCCCAGT CATCTCCAAA CAGGAAGTTC TTCCCTGAGT GCTTGCCGAG AAGGCTGAGC 87 6

22/44

AAACCCACAG CAGGATCCGC ACGGGGTTTC CACCTCAGAA CGAATGCGTT GGGCGGTGGG GGCGCGAAAG AGTGGCGTTG GGGATCTGAA TTCTTCACCA TTCCACCCAC TTTTGGTGAG

ACCTGGG

GAGGTCTCTA GGGTGGGAGG CTCCTGAGAG AGGCCTACCT CGGGCCTTTC

CCCACTCTTG GCAATTGTTC TTTTGCCTGG AAAATTAAGT ATATGTTAGT TTTGAACGTT TGAACTGAAC AATTCTCTTT TCCGCTAGGC TTTATTGATT TGCAATGTGC TGTGTAATTA AGAGGCCTCT CTACAAAGTA CTGATAATGA ACATGTAAGC AATGCACTCA CTTCTAAGTT ACATTCATAT CTGATCTTAT TTGATTTTCA CTAGGCATAG GGAGGTAGGA GCTAATAATA CGTTTATTTT ACTAGAAGTT AACTGGAATT CAGATTATAT AACTCTTTTC AGGTTACÄAA GAACATAAAT AATCTGGTTT TCTGATGTTA TTTCAAGTAC TACAGCTGCT TCTAATCTTA GTTGACAGTG ATTTTGCCCT GTAGTGTAGC ACAGTGTTCT GTGGGTCACA CGCCGGCCTC AGCACAGCAC TTTGAGTTTT GGTACTACGT GTATCCACAT TTTACACATG ACAAGAATGA GGCATGGCAC GGCCTGCTTC CTGGCAAATT TATTCAATGG TACACTGGGC TTTGGTGGCA GAGCTCATGT CTCCACTTCA TAGCTATGAT TCTTAAACAT CACACTGCAT TAGAGGTTGA ATAATAAAAT TTCATGTTGA GCAGAAATAT TCATTGTTTA CAAGTGTAAA TGAGTCCCAG CCATGTGTTG CACTGTTCAA GCCCCAAGGG AGAGAGCAGG GAAACAAGTC TTTACCCTTT GATATTTTGC ATTCTAGTGG GAGAGATGAC AATAAGCAAA TGAGCAGAAA GATATACAAC ATCAGGAAAT CATGGGTGTT GTGAGAAGCA GAGAAGTCAG GGCAAGTCAC TCTGGGGCTG ACACTTGAGC AGAGACATGA AGGAAATAAG AATGATATTG ACTGGGAGCA GTATTTCCCA GGCAAACTGA GTGGGCCTGG CAAGTTGGAT TAAAAAGCGG GTTTTCTCAG CACTACTCAT GTGTGTGTGT GTGGGGGGGG GGGGCGGCGT GGGGGTGGGA AGGGGGACTA CCATCTGCAT GTAGGATGTC TAGCAGTATC CTGTCCTCCC TACTCACTAG GTGCTAGGAG CACTCCCCCA GTCTTGACAA CCAAAAATGT CTCTAAACTT TGCCACATGT CACCTAGTAG ACAAACTCCT GGTTAAGAAG CTCGGGTTGA AAAAAATAAA CAAGTAGTGC TGGGGAGTAG AGGCCAAGAA GTAGGTAATG GGCTCAGAAG AGGAGCCACA AACAAGGTTG TGCAGGCGCC TGTAGGCTGT GGTGTGAATT CTAGCCAAGG AGTAACAGTG ATCTGTCACA GGCTTTTAAA AGATTGCTCT GGCTGCTATG TGGAAAGCAG AATGAAGGGA GCAACAGTAA AAGCAGGGAG CCCAGCCAGG AAGCTGTTAC ACAGTCCAGG CAAGAGGTAG TGGAGTGGGC TGGGTGGGAA CAGAAAAGGG AGTGACAAAC CATTGTCTCC TGAATATATT CTGAAGGAAG TTC-CTGAAGG ATTCTATGTT GTGTGAGAGA AAC-AC-AAGAA TTGGCTGGGT GTAGTAGCTC ÄTGCCAAGGA GGAGGCCAAG GAGAGCAGAT TCCTGAGCTC AGGAGTTCAA GACCAGCCTG GGCAACACAG CAAAACCCCT TCTCTACAAA AA.ATACAAAA ATTAGCTGGG TGTGGTGGCA TGCACCTGTG ATCCTAGCTA CTCGGGAGGC TGAGGTGGAG GGTATTGCTT GAGCCCAGGA AGTTGAGGCT GCAGTGAGCC

93₆ 99 6 105 6 1116 1176 12 3 6

12 9 6

13 5 6 1416 1476 153 6 159 6 1656 1716 1776 183 6 18 9 6 1956 2016 2 07 6 213 6 219 6 2 2 56 2 316 2 37 6 24 3 6 2 4 96 2 55 6 2 616 2 676 2 73 6 2 79 6

GGCTGCTATG TGGAAAGCAG AATGAAGGGA GCAACAGTAA AAGCAGGGAG CCCAGCCAGG 243 6

AAGCTGTTAC ACAGTCCAGG CAAGAGGTAG TGGAGTGGGC TGGGTGGGAA CAGAAAAGGG 2 496

AGTGACAAAC CATTGTCTCC TGAATATATT CTGAAGGAAG TTGCTGAAGG ATTCTATGTT 2 556

GTGTGAGAGA AAGAGAAGAA TTGGCTGGGT GTAGTAGCTC ATGCCAAGGA GGAGGCCAAG 2 616

GAGAGCAGAT TCCTGAGCTC AGGAGTTCAA GACCAGCCTG GGCAACACAG CAAAACCCCT 2 67 6

TCTCTACAAA AAATACAAAA ATTAGCTGGG TGTGGTGGCA TGCACCTGTG ATCCTAGCTA 27 3 6

CTCGGGAGGC TGAGGTGGAG GGTATTGCTT GAGCCCAGGA AGTTGAGGCT GCAGTGAGCC 2 79 6

ATGACTGTGC CACTGTACTT CAGCCTAGGT GACAGAGCAA GACCCTGTCT CCCCTGACCC 23 56

CCTGAAAAAG AGAÄGAGTTA AAGTTGACTT TGTTCTTTAT TTTAATTTTA TTGGCCTGAG 2916

CAGTGGGGTA ATTGGCAATG CCATTTCTGA GATGGTGAAG GCAGAGGAAA GAGCAGTTTG 297 6

GGGTAAATCA AGGATCTGCA TTTGGGACAT GTTAAGTTTG AGATTCCAGT CAGGCTTCCA 3 03 6

AGTGGTGAGG CCACATAGGC AGTTCAGTGT AAGAATTCAG GACCAAGGCT GGGCACGGTG 3 09 6

GCTCACTTCT GTAATCCCAG CACTTTGGTG GCTGAGGCAG GTAGATCATT TGAGGTCAGG 3156

AGTTTGAGAC AAGCTTGGCC AACATGGTGA AACCCCATGT CTACTAAAAA TACAAAAATT ■ 3216

AGCCTGGTGT GGTGGCGCAC GCCTATAGTC CCAGGTTTTC AGGAGGCTTA GGTAGGAGAA 3 276

TCCCTTGAAC CCAGGAGGTG CAGGTTGCAG TGAGCTGAGA TTGTGCCACT GCACTCCAGC 333 6

CTGGGTGATA GAGTGAGACT CTGTCTCAAA AAAAAAAAAA AAAAAAAAAA AAAAAACTGA 3 3 96

AGGAATTATT CCTCAGGATT TGGGTCTAAT TTGCCCTGAG CACCAACTCC TGAGTTCAAC 3 4 56

TACCATGGCT AGACACACCT TAACATTTTC TAGAATCCAC CAGCTTTAGT GGAGTCTGTC 3516

TAATCATGAG TATTGGAATA GGATCTGGGG GCAGTGAGGG GGTGGCAGCC ACGTGTGGCA 3 57 6

GAGAAAAGCA CACAAGGAAA GAGCACCCAG GACTGTCATA TGGAAGAAAG ACAGGACTGC 3 63 6

AACTCACCCT TCACAAAATG AGGACCAGAC ACAGCTGATG GTATGAGTTG ATGCAGGTGT 3 69 6

GTGGAGCCTC AACATCCTGC TCCCCTCCTA CTACACATGG TTAAGGCCTG TTGCTCTGTC 37 56

TCCAG GT TCA CAC TCT CTG CAC TAC CTC TTC ATG GGT GCC TCA GAG 3 3 02 Arg Ser His Ser Leu His Tyr Leu Phe Met GIy AIa Ser GIu

30 35

CAG GAC CTT GGT CTT TCC TTG TTT GAA GCT TTG GGC TAC GTG GAT GAC 3 3 50 Gin Asp Leu GIy Leu Ser Leu Phe GIu AIa Leu GIy Tyr VaI Asp Asp 4 0 45 50 55

CAG CTG TTC GTG TTC TAT GAT GAT GAG AGT CGC CC-T GTG GAG CCC CGA 3393 GIn Leu Phe VaI Phe Tyr Asp Asp GIu Ser Arg Arg VaI GIu Pro Arg

60 65 70

ACT CCA TGG GTT TCC AGT AGA ATT TCA AGC CAG ATG TGG CTG CAG CTG 3946 Thr Pro Trp VaI Ser Ser Arg lie Ser Ser Gin Met Trp Leu Gin Leu 75 30 35

AGT CAG AGT CTG AAA GGG TGG GAT CAC ATG TTC ACT GTT GAC TTC TGG 3994 Ser Gin Ser Leu Lys GIy Trp Asp His Met Phe Thr VaI Asp Phe Trp

24/44

100

ACT ATT ATG GAA AAT CAC AAC CAC AGC AAG G GTATGTGGAG AGGGGGCCTC Thr lie Met GIu Asn His Asn His Ser Lys
105 110

ACCTTCCTGA GGTTGTCAGA GCTTTTCATC TTTTCATGCA TCTTGAAGGA AACAGCTGGA AGTCTGAGGT CTTGTGGGAG CAGGGAAGAG GGAAGGAATT TGCTTCCTGA GATCATTTGG TCCTTGGGGA TGGTGGAAAT AGGGACCTAT TCCTTTGGTT GCAGTTAACA AGGCTGGGGA

TTTTTCCAG AG TCC CAC ACC CTG CAG GTC ATC CTG GGC TGT GAA ATG GIu Ser His Thr Leu Gin VaI lie Leu GIy Cys GIu Met 115 120 125

CAA GAA GAC AAC AGT ACC GAG GGC TAC TGG AAG TAC GGG TAT GAT GGG Gin GIu Asp Asn Ser Thr GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy 130 135 140

CAG GAC CAC CTT GAA TTC TGC CCT GAC ACA CTG GAT TGG AGA GCA GCA Gin Asp His Leu GIu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala 145 150 155

GAA CCC AGG GCC TGG CCC ACC AAG CTG GAG TGG GAA AGG CAC AAG ATT GIu Pro Arg Ala Trp Pro Thr Lys Leu GIu Trp GIu Arg His Lys lie 160 165 170

CGG GCC AGG CAG AAC AGG GCC TAC CTG GAG AGG GAC TGC CCT GCA CAG Arg Ala Arg Gin Asn Arg Ala Tyr Leu GIu Arg Asp Cys Pro Ala Gin 175 180 185 190

CTG CAG CAG TTG CTG GAG CTG GGG AGA GGT GTT TTG GAC CAA CAA G Leu GIn Gin Leu Leu GIu Leu GIy Arg GIy VaI Leu Asp Gin Gin

195 200 205

GTATGGTGGA AACACACTTC TGCCCCTATA CTCTAGTGGC AGAGTGGAGG AGGTTGCAGG GCACGGAATC CCTGGTTGGA GTTTCAGAGG TGGCTGAGGC TGTGTGCCTC TCCAAATTCT GGGAAGGGAC TTTCTCAATC CTAGAGTCTC TACCTTATAA TTGAGATGTA TGAGACAGCC ACAAGTCATG GGTTTAATTT CTTTTCTCCA TGCATATGGC TCAAAGGGAA GTGTCTATGG CCCTTGCTTT TTATTTAACC AATAATCTTT TGTATATTTA TACCTGTTAA AAATTCAGAA ATGTCAAGGC CGGGCACGGT GGCTCACCCC TGTAATCCCA GCACTTTGGG AGGCCGAGGC GGGTGGTCAC AAGGTCAGGA GTTTGAGACC AGCCTGACCA ACATGGTGAA ACCCGTCTCT AAAAAAATAC AAAAATTAGC TGGTCACAGT CATGCGCACC TGTAGTCCCA GCTAATTGGA AGGCTGAGGC AGGAGCATCG CTTGAACCTG GGAAGCGGAA GTTGCACTGA GCCAAGATCG CGCCACTGCA CTCCAGCCTA GGCAGCAGAG TGAGACTCCA TCTTAAAAAA AAAAAAAAAA AAAAAAAGAG. AATTCAGAGA TCTCAGCTAT CATATGAATA CCAGGACAAA ATATCAAGTG AGGCCACTTA TCAGAGTAGA AGAATCCTTT AGGTTAAAAG TTTCTTTCAT AGAACATAGC AATAATCACT GAAGCTACCT ATCTTACAAG TCCGCTTCTT ATAACAATGC CTCCTAGGTT GACCCAGGTG AAACTGACCA TCTGTATTCA ATCATTTTCA ATGCACATAA AGGGCAATTT

4045

4105 4165 4225 4272

4320 4368 4416 4464 4510

4570 4630 4690 4750 4810 4870 4930 4990 5050 5110 5170 5230 5290 5350

^ki j).£·/E-P-D 9·5&Agr; 602 T1

• ·

25/44

TATCTATCAG AACAAAGAAC ATGGGTAACA GATATGTATA TTTACATGTG AGGAGAACAA GCTGATCTGA CTGCTCTCCA AGTGACACTG TGTTAGAGTC CAATCTTAGG ACACAAAATG GTGTCTCTCC TGTAGCTTGT TTTTTTCTGA AAAGGGTATT TCCTTCCTCC AACCTATAGA AGGAAGTGAA AGTTCCAGTC TTCCTGGCAA GGGTAAACAG ATCCCCTCTC CTCATCCTTC CTCTTTCCTG TCAAG TG CCT CCT TTG GTG AAG GTG ACA CAT CAT GTG ACC

VaI Pro Pro Leu VaI Lys VaI Thr His His VaI Thr

210 215

TCT TCA GTG ACC ACT CTA CGG TGT CGG GCC TTG AAC TAC TAC CCC CAG Ser Ser VaI Thr Thr Leu Arg Cys Arg Ala Leu Asn Tyr Tyr Pro Gin 220 225 230

AAC ATC ACC ATG AAG TGG CTG AAG GAT AAG CAG CCA ATG GAT GCC AAG Asn lie Thr Met Lys Trp Leu Lys Asp Lys Gin Pro Met Asp Ala Lys 235 240 245

GAG TTC GAA CCT AAA GAC GTA TTG CCC AAT GGG GAT GGG ACC TAC CAG GIu Phe GIu Pro Lys Asp VaI Leu Pro Asn GIy Asp GIy Thr Tyr Gin 250 255 260 265

GGC TGG ATA ACC TTG GCT GTA CCC CCT GGG GAA GAG CAG AGA TAT ACG GIy Trp lie Thr Leu Ala VaI Pro Pro GIy GIu GIu Gin Arg Tyr Thr

270 275 280

TGC CAG GTG GAG CAC CCA GGC CTG GAT CAG CCC CTC ATT GTG ATC TGG G Cys Gin VaI GIu His Pro GIy Leu Asp Gin. Pro Leu lie VaI lie Trp 285 290 295

GTATGTGACT GATGAGAGCC AGGAGCTGAG AAAATCTATT GGGGGTTGAG AGGAGTGCCT GAGGAGGTAA TTATGGCAGT GAGATGAGGA TCTGCTCTTT GTTAGGGGGT GGGCTGAGGG TGGCAATCAA AGGCTTTAAC TTGCTTTTTC TGTTTTAG AG CCC TCA CCG TCT

GIu Pro Ser Pro Ser 300

GGC ACC CTA GTC ATT GGA GTC ATC AGT GGA ATT GCT GTT TTT GTC GTC GIy Thr Leu VaI lie GIy VaI He Ser GIy lie Ala VaI Phe VaI VaI 305 310 315

ATC TTG TTC ATT GGA ATT TTG TTC ATA ATA TTA AGG AAG AGG CAG GGT lie Leu Phe He GIy He Leu Phe He He Leu Arg, Lys Arg Gin GIy 320 325 330

TCA A GTGAGTAGGA ACAAGGGGGA AGTCTCTTAG TACCTCTGCC CCAGGGCACA

GTGGGAAGAG GGGCAGAGGG GATCTGGCAT CCATGGGAAG CATTTTTCTC ATTTATATTC TTTGGGGACA CCAGCAGCTC CCTGGGAGAC AGAAAATAAT GGTTCTCCCC AGAATGAAAG TCTCTAATTC AACAAACATC TTCAGAGCAC CTACTATTTT GCAAGAGCTG TTTAAGGTAG TACAGGGGCT TTGAGGTTGA GAAGTCACTG TGGCTATTCT CAGAACCCAA ATCTGGTAGG GAATGAAATT GATAGCAAGT AA-ATGTAGTT AAAGAAGACC CCATGAGGTC CTAAAGCAGG CAGGAAGCAA ATGCTTAGGG TGTCAAAGGA AAGAATGATC ACATTCAGCT GGGGATCAAG

5638 57 3 6 573 4 53 3 2 5881

ATAGCCTTCT GGATCTTGAA GGAGAAGCTG GATTCCATTA GGTGAGGTTG AAGATGATGG 662 3

GAGGTCTACA CAGACGGAGC AACCATGCCA AGTAGGAGAG TATAAGGCAT ACTGGGAGAT 6633

TAGAAATAAT TACTGTACCT TAACCCTGAG TTTGCGTÄGC TATCACTCAC CAATTATGCA 674 3

TTTCTACCCC CTGAACATCT GTGGTGTAGG GAAAAGAGAA TCAGAAAGAA GCCAGCTCAT 68 03

ACAGAGTCCA AGGGTCTTTT GGGATATTGG GTTATGATCA CTGGGGTGTC ATTGAAGGAT 63 6 3

CCTAAGAAAG GAGGACCACG ATCTCCCTTA TATGGTGAAT GTGTTGTTAA. GAAGTTAGAT 69 2 3

GAGAGGTGAG GAGACCAGTT AGAAAGCCAA TAAGCATTTC CAGATGAGAG ATAATGGTTC 6933

TTGAAATCCA ATAGTGCCCA GGTCTAAATT GAGATGGGTG AATGAGGAAA ATAAGGAAGA 7 04 3

GAGAAGAGGC AAGATGGTGC CTAGGTTTGT GATGCCTCTT TCCTGGGTCT CTTGTCTCCA 7103

CAG GA GGA GCC ATG GGG CAC TAC GTC TTA GCT GAA CGT GAG 714 4 Arg GIy Ala Met GIy His Tyr VaI Leu Ala GIu Arg GIu

340 345

TGACACGCAG CCTGCAGACT CACTGTGGGA AGGAGACAAA ACTAGAGACT CAAAGAGGGA 72 04

GTGCATTTAT GAGCTCTTCA TGTTTCAGGA GAGAGTTGAA CCTAAACATA GAAATTGCCT 72 64

GACGAACTCC TTGATTTTAG CCTTCTCTGT TCATTTCCTC AAAAAGATTT CCCCATTTAG ■ 73 2 4

GTTTCTGAGT TCCTGCATGC CGGTGATCCC TAGCTGTGAC CTCTCCCCTG GAACTGTCTC 73 84

TCATGAACCT CAAGCTGCAT CTAGAGGCTT CCTTCATTTC CTCCGTCACC TCAGAGACAT 7444

ACACCTATGT CATTTCATTT CCTATTTTTG GAAGAGGACT CCTTAAATTT GGGGGACTTA 7 504

CATGATTCAT TTTAACATCT GAGAAAAGCT TTGAACCCTG GGACGTGGCT AGTCATAACC 7564

TTACCAGATT TTTACACATG TATCTATGCA TTTTCTGGAC CCGTTCAACT TTTCCTTTGA 7624

ATCCTCTCTC TGTGTTACCC AGTAACTCAT CTGTCACCAA GCCTTGGGGA TTCTTCCATC 7 634

TGATTGTGAT GTGAGTTGCA CAGCTATGAA GGCTGTACAC TGCACGAATG GAAGAGGCAC 774 4

CTGTCCCAGA AAAAGCATCA TGGCTATCTG TGGGTAGTAT GATGGGTGTT TTTAGCAGGT 73 04

AGGAGGCAAA TATCTTGAAA GGGGTTGTGA AGAGGTGTTT TTTCTAATTG GCATGAAGGT 73 64

GTCATACAGA TTTGCAAAGT TTAATGGTGC CTTCATTTGG GATGCTACTC TAGTATTCCA 79 2 4

GACCTGAAGA ATCACAATAA TTTTCTACCT GGTCTCTCCT TGTTCTGATA ATGAAAATTA 7 93 4

TGATAAGGAT GATAAAAGCA CTTACTTCGT GTCCGACTCT TCTGAGCACC TACTTACATG 3 04 4

CATTACTGCA TGCACTTCTT ACAATAATTC TATGAGATAG GTACTATTAT CCCCATTTCT 8104

TTTTTAAATG AAGAAAGTGA AGTAGGCCGG GCACGGTGGC TCACGCCTGT AATCCCAGCA 3164

CTTTGGGAGG CCAAAGCGGG TGGATCACGA GGTCAGGAGA TCGAGACCAT CCTGGCTAAC 3 2 24

ATGGTGAAAC CCCATCTCTA ATAAAAATAC AAAAAATTAG CTGGGCCTGG TGGCAGACGC 3234

CTGTAGTCCC AGCTACTCGG AAGGCTGAGG CAGGAGAATG GCATGAACCC AGGAGGCAGA 3 3 44

GCTTGCAGTG AGCCGAGTTT GCGCCACTGC ACTCCAGCCT AGGTGACAGA GTGAGACTCC 3404

27/44

DE7e>095T6O2T1

ATCTCAAAAA AATAAAAATA AAAATAAAAA AATGAAAAAA AAAAGAAAGT GAAGTATAGA 84 64

GTATCTCATA GTTTGTCAGT GATAGAAACA GGTTTCAAAC TCAGTCAATC TGACCGTTTG 852 4

ATACATCTCA GACACCACTA CATTCAGTAG TTTAGATGCC TAGAATAAAT AGAGAAGGAA 8 584

GGAGATGGCT CTTCTCTTGT CTCATTGTGT TTCTTCTGAG TGAGCTTGAA TCACATGAAG 8 64 4

GGGAACAGCA GAAAACAACC AACTGATCCT CAGCTGTCAT GTTTCCTTTA AAAGTCCCTG 87 04

AAGGAAGGTC CTGGAATGTG ACTCCCTTGC TCCTCTGTTG CTCTCTTTGG CATTCATTTC 87 64

TTTGGACCCT ACGCAAGGAC TGTAATTGGT GGGGACAGCT AGTGGCCCTG CTGGGCTTCA 8824

CACACGGTGT CCTCCCTAGG CCAGTGCCTC TGGAGTCAGA ACTCTGGTGG TATTTCCCTC 8884

AATGAAGTGG AGTAAGCTCT CTCATTTTGA GATGGTATAA TGGAAGCCAC CAAGTGGCTT 894 4

AGAGGATGCC CAGGTCCTTC CATGGAGCCA CTGGGGTTCC GGTGCACATT AAAAAAAAAA 9004

TCTAACCAGG ACATTCAGGA ATTGCTAGAT TCTGGGAAAT CAGTTCACCA TGTTCAAAAG 9064

AGTCTTTTTT TTTTTTTTGA GACTCTATTG CCCAGGCTGG AGTGCAATGG CATGATCTCG 9124

GCTCACTGTA ACCTCTGCCT CCCAGGTTCA AGCGATTCTC CTGTCTCAGC CTCCCAAGTA 9184

GCTGGGATTA CAGGCGTGCA CCACCATGCC CGGCTAATTT TTGTATTTTT AGTAGAGACA · 9244

GGGTTTCACC ATGTTGGCCA GGCTGGTCTC GAACTCTCCT GACCTCGTGA TCCGCCTGCC 93 04

TCGGCCTCCC AAAGTGCTGA GATTACAGGT GTGAGCCACC CTGCCCAGCC GTCAAAAGAG 93 64

TCTTAATATA TATATCCAGA TGGCATGTGT TTACTTTATG TTACTACATG CACTTGGCTG 9424

CATAAATGTG GTACAAGCAT TCTGTCTTGA AGGGCAGGTG CTTCAGGATA CCATATACAG 94 84

CTCAGAAGTT TCTTCTTTAG GCATTAAATT TTAGCAAAGA TATCTCATCT CTTCTTTTAA 9544

ACCATTTTCT TTTTTTGTGG TTAGAAAAGT TATGTAGAAA AAAGTAAATG TGATTTACGC 9 604

TCATTGTAGA AAAGCTATAA AATGAATACA ATTAAAGCTG TTATTTAATT AGCCAGTGAA 9664

AAACTATTAA CAACTTGTCT ATTACCTGTT AGTATTATTG TTGCATTAAA AATGCATATA 97 2 4

CTTTAATAAA TGTATATTGT ATTGTATACT GCATGATTTT ATTGAAGTTC TTGTTCATCT 9784

TGTGTATATA CTTAATCGCT TTGTCATTTT GGAGACATTT ATTTTGCTTC TAATTTCTTT 98 4 4

ACATTTTGTC TTACGGAATA TTTTCATTCA ACTGTGGTAG CCGAATTAAT CGTGTTTCTT 99 04

CACTCTAGGG ACATTGTCGT CTAAGTTGTA AGACATTGGT TATTTTACCA GCAAACCATT 99 64

CTGAAAGCAT ATGACAAATT ATTTCTCTCT TAATATCTTA CTATACTGAA AGCAGACTGC 1002 4

TATAAGGCTT CACTTACTCT TCTACCTCAT AAGGAATATG TTACAATTAA TTTATTAGGT 10084

AAGCATTTGT TTTATATTGG TTTTATTTCA CCTGGGCTGA GATTTCAAGA AACACCCCAG 1014 4

TCTTCACAGT AACACATTTC ACTAACACAT TTACTAAACA TCAGCAACTG TGGCCTGTTA 10204

ATTTTTTTAA TAGAAATTTT AAGTCCTCAT TTTCTTTCGG TGTTTTTTAA GCTTAATTTT 102 64

TCTGGCTTTA TTCATAAATT CTTAAGGTCA ACTACATTTG AAAAATCAAA GACCTGCATT 103 2 4

TTAAATTCTT
GACACCTGGT
GAGGGTTTTC
CTTGTAGAGA
TTGAATTGCT
AAAACAAACC
AGGTACAGGC
ATTTTATAAA
ATCCCCAAAT

ATTCACCTCT GGCCATAGGT CTGAAGGTAA AAAGCCCCTG GGAATCACAG ACTCTGATAA CAAAATTCTT ACATTCTTCA TTTTCATAAA

GGCAAAACCA AAATGTACCA AGGAATAAAG AAAATTTGAG GCCATTGCTG TCATTGAGTC ATGTTGTATT CAAACTCACA C

28/44

TTCACAAACC CGGTGGTCCG AATGGGTGGA AAAACAAACA AGCTGCCTGA AAGTACAGCA ATAATAATGT CACATTTAAA

&udigr;&Ggr;/ E

ATGGTAGTAA
GTGACCAGAG
GGGGCGTGCA
AGAAACTACT
ACTGGGAACA
GGTGATTGAG
CATCTTATAA
AACAAAACAC

AGAGAAGGGT 10384

ATGCAGCGCT 10444

CTGGAAATCA 10504

TACCAGCTAT 10564

CAACAGAAGG 10624

GACTGCTGAG 10634

TACTGTCAGT 10744

TGTCTCTAAA 108 04 10825

(2) INFORMATION FOR SEQ ID NO: 6:

(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 348 amino acids

(B) TYPE: amino acid (D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein (Xi) SEQUENCE DESCRIPTION: SEQ ID NO:6:

Met GIy Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu Gin 1 5 10 15

Thr Ala VaI Leu Gin GIy Arg Leu Leu Arg Ser His Ser Leu His Tyr 20 25 30

Leu Phe Met GIy AIa Ser GIu Gin Asp Leu GIy Leu Ser Leu Phe GIu 35 40 45

AIa Leu GIy Tyr VaI Asp Asp Gin Leu Phe VaI Phe Tyr Asp Asp GIu 50 55 60

Ser Arg Arg VaI GIu Pro Arg Thr Pro Trp VaI Ser Ser Arg He Ser 65 70 75 80

Ser Gin Met Trp Leu GIn Leu Ser GIn Ser Leu Lys GIy Trp Asp His

35 90 95

Met Phe Thr VaI Asp Phe Trp Thr lie Met GIu Asn His Asn His Ser 100 105 110

Lys GIu Ser His Thr Leu Gin VaI He Leu GIy Cys GIu Met Gin GIu 115 120 125

Asp Asn Ser Thr GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy Gin Asp 130 135 140

His Leu GIu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala GIu Pro 145 150 * 155 160

Arg AIa Trp Pro Thr Lys Leu GIu Trp GIu Arg His Lys He Arg AIa

165 170 175

Arg Gin Asn Arg AIa Tyr Leu GIu Arg Asp Cys Pro Ala GIn Leu Gin

180 185 190

Gin Leu Leu GIu Leu GIy Arg GIy VaI Leu Asp Gin Gin VaI Pro Pro 195 200 205

Leu VaI Lys VaI Thr His His VaI Thr Ser Ser VaI Thr Thr Leu Arg 210 215 220

Cys Arg AIa Leu Asn Tyr Tyr Pro GIn Asn He Thr Met Lys Trp Leu 22 5 230 235 240

Lys Asp Lys GIn Pro Met Asp Ala Lys GIu Phe GIu Pro Lys Asp VaI

245 250 255

Leu Pro Asn GIy Asp GIy Thr Tyr Gin GIy Trp He Thr Leu Ala VaI 260 265 270

Pro Pro GIy GIu GIu Gin Arg Tyr Thr Cys Gin VaI GIu His Pro GIy 275 280 285

Leu Asp Gin Pro Leu He VaI He Trp GIu Pro Ser Pro Ser GIy Thr 290 295 300

Leu VaI He GIy VaI He Ser GIy He Ala VaI Phe VaI VaI He Leu 305 310 315 320

Phe He GIy He Leu Phe He He Leu Arg Lys Arg Gin GIy Ser Arg

325 330 335

GIy AIa Met GIy His Tyr VaI Leu Ala GIu Arg GIu
340 345

(2) INFORMATION FOR SEQ ID NO:7:

(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 10825 base pairs

(B) TYPE: nucleic acid

(C) STRANDEDNESS: single

(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(ix) FEATURE:

(A) NAME/KEY: CDS

(B) LOCATION: join(361..436, 3762..4025, 4235..4510, 5606..5881,

6040. .6153, 7107. .7147)

(D) OTHER INFORMATION: /product= "Hereditary Hemochromatosis

(HH) protein containing both the 24dl and 24d2 mutations"

/note= "Hereditary Hemochromatosis (HH) gene containing a combination of both 24dl and 24d2 aileles"

(ix) FEATURE:

(A) NAME/KEY: -

(B) LOCATION: 140..7319

(D) OTHER INFORMATION: /note= "start and stop positions for

cDNA containing a combination of both 24dl and 24d2 aileles
(SEQ ID NO:12)"

(ix) FEATURE:

ATGACTGTGC CACTGTACTT CAGCCTAGGT GACAGAGCAA GACCCTGTCT CCCCTGACCC CCTGAAAAAG AGAAGAGTTA AAGTTGACTT TGTTCTTTAT TTTAATTTTA TTGGCCTGAG CAG¹TC-GGGTA ATTGGCAATG CCATTTCTGA GATGGTGAAG GCAGAGGAAA GAGCAGTTTG GGGTAAATCA AGGATCTGCA TTTGGGACAT GTTAAGTTTG AGATTCCAGT CAGGCTTCCA AGTGGTGAGG CCACATAGGC AGTTCAGTGT AAGAATTCAG GACCAAGGCT GGGCACGGTG GCTCACTTCT GTAATCCCAG CACTTTGGTG GCTGAGGCAG GTAGATCATT TGAGGTCAGG AGTTTGAGAC AAGCTTGGCC AACATGGTGA AACCCCATGT CTACTAAAAA TACAAAAATT AGCCTGGTGT GGTGGCGCAC GCCTATAGTC CCAGGTTTTC AGGAGGCTTA GGTAGGAGAA TCCCTTGAAC CCAGGAGGTG CAGGTTGCAG TGAGCTGAGA TTGTGCCACT GCACTCCAGC CTGGGTGATA GAGTGAGACT CTGTCTCAAA AAAAAAAAAA AAAAAAAAAA AAAAAACTGA AGGAATTATT CCTCAGGATT TGGGTCTAAT TTGCCCTGAG CACCAACTCC TGAGTTCAAC TACCATGGCT AGACACACCT TAACATTTTC TAGAATCCAC CAGCTTTAGT GGAGTCTGTC TAATCATGAG TATTGGAATA GGATCTGGGG GCAGTGAGGG GGTGGCAGCC ACGTGTGGCA GAGAAAAGCA CACAAGGAAA GAGCACCCAG GACTGTCATA TGGAAGAAAG ACAGGACTGC AACTCACCCT TCACAAAATG AGGACCAGAC ACAGCTGATG GTATGAGTTG ATGCAGGTGT GTGGAGCCTC AACATCCTGC TCCCCTCCTA CTACACATGG TTAAGGCCTG TTGCTCTGTC

TCCAG GT TCA CAC TCT CTG CAC TAC CTC TTC ATG GGT GCC TCA GAG Arg Ser His Ser Leu His Tyr Leu Phe Met GIy Ala Ser GIu

30 * 35

CAG GAC CTT GGT CTT TCC TTG TTT GAA GCT TTG GGC TAC GTG GAT GAC

Gin Asp Leu GIy Leu Ser Leu Phe GIu AIa Leu GIy Tyr VaI Asp Asp

40 45 50 55

CAG CTG TTC GTG TTC TAT GAT GAT GAG AGT CGC CGT GTG GAG CCC CGA GIn Leu Phe VaI Phe Tyr Asp Asp GIu Ser Arg Arg VaI GIu Pro Arg

00 65 70

ACT CCA TGG GTT TCC AGT AGA ATT TCA AGC CAG ATG TGG CTG CAG CTG Thr Pro Trp VaI Ser Ser Arg He Ser Ser GIn Met Trp Leu Gin Leu 75 30 35

AGT CAG AGT CTG AAA GGG TGG GAT CAC ATG TTC ACT GTT GAC TTC TGG Ser Gin Ser Leu Lys GIy Trp Asp His Met Phe Thr VaI Asp Phe Trp 90 9*5 100

ACT ATT ATG GAA AAT CAC AAC CAC AGC AAG G GTATGTGGAG AGGGGGCCTC Thr He Met GIu Asr. Mis Asr. ULs 3er Lys
105 HO

ACCTTCCTGA GGTTGTCAGA GCTTTTCATC TTTTCATGCA TCTTGAAGGA AACAGCTGGA AGTCTGAGGT CTTGTGGGAG CAGGGAAGAG GGAAGGAATT TGCTTCCTGA GATCATTTGG TCCTTGGGGA TGGTGGAAAT AGGGACCTAT TCCTTTGGTT GCAGTTAACA AGGCTGGGGA

TTTTTCCAG AG TCC CAC ACC CTG CAG GTC ATC CTG GGC TGT GAA ATG GIu Ser His Thr Leu Gin VaI He Leu GIy Cys GIu Met

3 03 6 3 09 6 3156 3 216 3 27 6 3 33 6 3396 34 56 3 516 3 57 6 3 63 6 3 696 3756 3 3 02

4105 4165 42 2 5 42 7 2

31/44

• · ft · «.ft

DE/EP O 954 602 Tl

115

120

125

CAA GAA GAC AAC AGT ACC GAG GGC TAC TGG AAG TAC GGG TAT GAT GGG

Gin GIu Asp Asn Ser Thr GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy 130 135 140

CAG GAC CAC CTT GAA TTC TGC CCT GAC ACA CTG GAT TGG AGA GCA GCA

Gin Asp His Leu GIu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala 145 150 155

GAA

AGG GCC TGG CCC ACC AAG CTG GAG TGG GAA AGG CAC AAG ATT

GIu Pro Arg Ala Trp Pro Thr Lys Leu GIu Trp GIu Arg His Lys lie 160 165 170

CGG GCC AGG CAG AAC AGG GCC TAC CTG GAG AGG GAC TGC CCT GCA CAG Arg Ala Arg Gin Asn Arg Ala Tyr Leu Glu Arg Asp Cys Pro Ala Gin 175 180 135 190

CTG CAG CAG TTG CTG GAG CTG GGG AGA GGT GTT TTG GAC CAA CAA G Leu Gin GIn Leu Leu Glu Leu GIy Arg GIy VaI Leu Asp Gin Gin

195 200 205

GTATGGTGGA AACACACTTC TGCCCCTATA CTCTAGTGGC AGAGTGGAGG AGGTTGCAGG GCACGGAATC CCTGGTTGGA GTTTCAGAGG TGGCTGAGGC TGTGTGCCTC TCCAAATTCT GGGAAGGGAC TTTCTCAATC CTAGAGTCTC TACCTTATAA TTGAGATGTA TGAGACAGCC ACAAGTCATG GGTTTAATTT CTTTTCTCCA TGCATATGGC TCAAAGGGAA GTGTCTATGG CCCTTGCTTT TTATTTAACC AATAATCTTT TGTATATTTA TACCTGTTAA AAATTCAGAA ATGTCAAGGC CGGGCACGGT GGCTCACCCC TGTAATCCCA GCACTTTGGG AGGCCGAGGC GGGTGGTCAC AAGGTCAGGA GTTTGAGACC AGCCTGACCA ACATGGTGAA ACCCGTCTCT AAAAAAATAC AAAAATTAGC TGGTCACAGT CATGCGCACC TGTAGTCCCA GCTAATTGGA AGGCTGAGGC AGGAGCATCG CTTGAACCTG GGAAGCGGAA GTTGCACTGA GCCAAGATCG CGCCACTGCA CTCCAGCCTA GGCAGCAGAG TGAGACTCCA TCTTAAAAAA AAAAAAAAAA AAAAAAAGAG AATTCAGAGA TCTCAGCTAT CATATGAATA CCAGGACAAA ATATCAAGTG AGGCCACTTA TCAGAGTAGA AGAATCCTTT AGGTTAAAAG TTTCTTTCAT AGAACATAGC AATAATCACT GAAGCTACCT ATCTTACAAG TCCGCTTCTT ATAACAATGC CTCCTAGGTT GACCCAGGTG AAACTGACCA TCTGTATTCA ATCATTTTCA ATGCACATAA AGGGCAATTT TATCTATCAG AACAAAGAAC ATGGGTAACA GATATGTATA TTTACATGTG AGGAGAACAA GCTGATCTGA CTGCTCTCCA AGTGACACTG TGTTAGAGTC CAATCTTAGG ACACAAAATG GTGTCTCTCC TGTAGCTTGT TTTTTTCTGA AAAGGGTATT TCCTTCCTCC AACCTATAGA AGGAAGTGAA AGTTCCAGTC TTCCTGGCAA GGGTAAACAG ATCCCCTCTC CTCATCCTTC CTCTTTCCTG TCAAG TG CCT CCT TTG GTG AAG GTG ACA CAT CAT GTG ACC

VaI Pro Pro Leu VaI Lys VaI Thr His His VaI Thr 210 215

TCT TCA GTG ACC ACT CTA CGG TGT CGG GCC TTG AAC TAC TAC CCC CAG Ser Ser VaI Thr Thr Leu Arg Cys Arg Ala Leu Asn Tyr Tyr Pro Gin

4320 4363 4416 4464 4510

4570

4630

4690

4750

4810

4870

4930

4990

5050

5110

5170

5230

5290

5350

5410

5470

5530

5590

5640

5683

kfi

220

225

ll

AAC ATC ACC ATG AAG TGG CTG AAG GAT AAG CAG CCA ATG GAT GCC AAG 573 6 Asn He Thr Met Lys Trp Leu Lys Asp Lys Gin Pro Met Asp Ala Lys 235 240 245

GAG TTC GAA CCT AAA GAC GTA TTG CCC AAT GGG GAT GGG ACC TAC CAG 5784 GIu Phe GIu Pro Lys Asp VaI Leu Pro Asn GIy Asp GIy Thr Tyr Gin 250 255 260 265

GGC TGG ATA ACC TTG GCT GTA CCC CCT GGG GAA GAG CAG AGA TAT ACG 53 3 2 GIy Trp He Thr Leu Ala VaI Pro Pro GIy GIu GIu GIn Arg Tyr Thr

270 275 280

TAC CAG GTG GAG CAC CCA GGC CTG GAT CAG CCC CTC ATT GTG ATC TGG G 58 31 Tyr Gin VaI GIu His Pro GIy Leu Asp Gin Pro Leu He VaI He Trp 235 290 295

GTATGTGACT GATGAGAGCC AGGAGCTGAG AAAATCTATT GGGGGTTGAG AGGAGTGCCT 59 41 GAGGAGGTAA TTATGGCAGT GAGATGAGGA TCTGCTCTTT GTTAGGGGGT GGGCTGAGGG 6001 TGGCAATCAA AGGCTTTAAC TTGCTTTTTC TGTTTTAG AG CCC TCA CCG TCT 6053

GIu Pro Ser Pro Ser 300

GGC ACC CTA GTC ATT GGA GTC ATC AGT GGA ATT GCT GTT TTT GTC GTC · 6101 GIy Thr Leu VaI He GIy VaI He Ser GIy He Ala VaI Phe VaI VaI 305 310 315

ATC TTG TTC ATT GGA ATT TTG TTC ATA ATA TTA AGG AAG AGG CAG GGT 614 9 He Leu Phe He GIy He Leu Phe He He Leu Arg Lys Arg Gin GIy 320 325 330

TCA A GTGAGTAGGA ACAAGGGGGA AGTCTCTTAG TACCTCTGCC CCAGGGCACA 62 03

GTGGGAAGAG GGGCAGAGGG GATCTGGCAT CCATGGGAAG CATTTTTCTC ATTTATATTC 62 6 3

TTTGGGGACA CCAGCAGCTC CCTGGGAGAC AGAAAATAAT GGTTCTCCCC AGAATGAAAG 63 2 3

TCTCTAATTC AACAAACATC TTCAGAGCAC CTACTATTTT GCAAGAGCTG TTTAAGGTAG 63 8 3

TACAGGGGCT TTGAGGTTGA GAAGTCACTG TGGCTATTCT CAGAACCCAA ATCTGGTAGG 644 3

GAATGAAATT GATAGCAAGT AAATGTAGTT AAAGAAGACC CCATGAGGTC CTAAAGCAGG 6 50 3

CAGGAAGCAA ATGCTTAGGG TGTCAAAGGA AAGAATGATC ACATTCAGCT GGGGATCAAG 65 6 3

ATAGCCTTCT GGATCTTGAA GGAGAAGCTG GATTCCATTA GGTGAGGTTG AAGATGATGG 6 62 3

GAGGTCTACA CAGACGGAGC AACCATGCCA AGTAGGAGAG TATAAGGCAT ACTGGGAGAT 6 63 3

TAGAAATAAT TACTGTACCT TAACCCTGAG TTTGCGTAGC TATCACTCAC CAATTATGCA 674 3

TTTCTACCCC CTGAACATCT GTGGTGTAGG GAAAAGAGAA TCAGAAAGAA GCCAGCTCAT 63 03

ACAGAGTCCA AGGGTCTTTT GGGATATTGG GTTATGATCA CTGGGGTGTC ATTGAAGGAT 68 63

CCTAAGAAAG GAGGACCACG ATCTCCCTTA TATGGTGAAT GTGTTGTTAA GAAGTTäGAT 692 3

. GAGAGGTGAG GAGACCAGTT AGAAAGCCAA TAAGCATTTC CAGATGAGAG ATA²VTGGTTc 6933

So

&Ogr;&Egr;7&egr;&Rgr;"&Oacgr;9"5*?&Iacgr;&Bgr;02&Tgr;1

33/44

TTGAAATCCA ATAGTGCCCA GGTCTAAATT GAGATGGGTG AATGAGGAAA ATAAGGAAGA 704 3

GAGAAGAGGC AAGATGGTGC CTAGGTTTGT GATGCCTCTT TCCTGGGTCT CTTGTCTCCA 7103

CAG GA GGA GCC ATG GGG CAC TAC GTC TTA GCT GAA CGT GAG 714 4 Arg GIy Ala Met GIy His Tyr VaI Leu Ala GIu Arg GIu 340 345

TGACACGCAG CCTGCAGACT CACTGTGGGA AGGAGACAAA ACTAGAGACT CAAAGAGGGA 7204

GTGCATTTAT GAGCTCTTCA TGTTTCAGGA GAGAGTTGAA CCTAAACATA GAAATTGCCT 7 2 64

GACGAACTCC TTGATTTTAG CCTTCTCTGT TCATTTCCTC AAAAAGATTT CCCCATTTAG 73 2 4

GTTTCTGAGT TCCTGCATGC CGGTGATCCC TAGCTGTGAC CTCTCCCCTG GAACTGTCTC 7334

TCATGAACCT CAAGCTGCAT CTAGAGGCTT CCTTCATTTC CTCCGTCACC TCAGAGACAT 74 4 4

ACACCTATGT CATTTCATTT CCTATTTTTG GAAGAGGACT CCTTAAATTT GGGGGACTTA 7504

CATGATTCAT TTTAACATCT GAGAAAAGCT TTGAACCCTG GGACGTGGCT AGTCATAACC 7 5 64

TTACCAGATT TTTACACATG TATCTATGCA TTTTCTGGAC CCGTTCAACT TTTCCTTTGA 762 4

ATCCTCTCTC TGTGTTACCC AGTAACTCAT CTGTCACCAA GCCTTGGGGA TTCTTCCATC 7 634

TGATTGTGAT GTGAGTTGCA CAGCTATGAA GGCTGTACAC TGCACGAATG GAAGAGGCAC ■ 77 44

CTGTCCCAGA AAAAGCATCA TGGCTATCTG TGGGTAGTAT GATGGGTGTT TTTAGCAGGT 7304

AGGAGGCAAA TATCTTGAAA GGGGTTGTGA AGAGGTGTTT TTTCTAATTG GCATGAAGGT 78 64

GTCATACAGA TTTGCAAAGT TTAATGGTGC CTTCATTTGG GATGCTACTC TAGTATTCCA 7924

GACCTGAAGA ATCACAATAA TTTTCTACCT GGTCTCTCCT TGTTCTGATA ATGAAAATTA 7984

TGATAAGGAT GATAAAAGCA CTTACTTCGT GTCCGACTCT TCTGAGCACC TACTTACATG 8 044

CATTACTGCA TGCACTTCTT ACAATAATTC TATGAGATAG GTACTATTAT CCCCATTTCT 8104

TTTTTAAATG AAGAAAGTGA AGTAGGCCGG GCACGGTGGC TCACGCCTGT AATCCCAGCA 8164

CTTTGGGAGG CCAAAGCGGG TGGATCACGA GGTCAGGAGA TCGAGACCAT CCTGGCTAAC 8 2 24

ATGGTGAAAC CCCATCTCTA ATAAAAATAC AAAAAATTAG CTGGGCGTGG TGGCAGACGC 8234

CTGTAGTCCC AGCTACTCGG AAGGCTGAGG CAGGAGAATG GCATGAACCC AGGAGGCAGA 8 34 4

GCTTGCAGTG AGCCGAGTTT GCGCCACTGC ACTCCAGCCT AGGTGACAGA GTGAGACTCC 3 4 04

ATCTCAAAAA AATAAAAATA AAAATAAAAA AATGAAAAAA AAAAGAAAGT GAAGTATAGA 3 4 64

GTATCTCATA GTTTGTCAGT GATAGAAACA GGTTTCAAAC TCAGTCAATC TGACCGTTTG 3 52 4

ATACATCTCA GACACCACTA CATTCAGTAG TTTAGATGCC TAGAATAAAT AGAGAAGGAA 3 53 4

GGAGATGGCT CTTCTCTTGT CTCATTGTGT TTCTTCTGAG TGAGCTTGAA TCACATGAAG 864 4

GGGAACAGCA GAAAACAACC AACTGATCCT CAGCTGTCAT GTTTCCTTTA .AAAGTCCCTG 3 7 04

AAGGAAGGTC CTGGAATGTG ACTCCCTTGC TCCTCTGTTG CTCTCTTTGG CATTCATTTC 3 7 64

TTTGGACCCT ACGCAAGGAC TGTAATTGGT GGGGACAGCT AGTGGCCCTG CTGGGCTTCA 33 2 4

CACACGGTGT CCTCCCTAGG CCAGTGCCTC TGGAGTCAGA ACTCTGGTGG TATTTCCCTC 8884

AATGAAGTGG AGTAAGCTCT CTCATTTTGA GATGGTATAA TGGAAGCCAC CAAGTGGCTT 894 4

AGAGGATGCC CAGGTCCTTC CATGGAGCCA CTGGGGTTCC GGTGCACATT AAAAAAAAAA 9 004

TCTAACCAGG ACATTCAGGA ATTGCTAGAT TCTGGGAAAT CAGTTCACCA TGTTCAAAAG 9 064

AGTCTTTTTT TTTTTTTTGA GACTCTATTG CCCAGGCTGG AGTGCAATGG CATGATCTCG 9124

GCTCACTGTA ACCTCTGCCT CCCAGGTTCA AGCGATTCTC CTGTCTCAGC CTCCCAAGTA 913 4

GCTGGGATTA CAGGCGTGCA CCACCATGCC CGGCTAATTT TTGTATTTTT AGTAGAGACA 9244

GGGTTTCACC ATGTTGGCCA GGCTGGTCTC GAACTCTCCT GACCTCGTGA TCCGCCTGCC 9 3 04

TCGGCCTCCC AAAGTGCTGA GATTACAGGT GTGAGCCACC CTGCCCAGCC GTCAAAAGAG 93 64

TCTTAATATA TATATCCAGA TGGCATGTGT TTACTTTATG TTACTACATG CACTTGGCTG 94 24

CATAAATGTG GTACAAGCAT TCTGTCTTGA AGGGCAGGTG CTTCAGGATA CCATATACAG 94 8 4

CTCAGAAGTT TCTTCTTTAG GCATTAAATT TTAGCAAAGA TATCTCATCT CTTCTTTTAA 954 4

ACCATTTTCT TTTTTTGTGG TTAGAAAAGT TATGTAGAAA AAAGTAAATG TGATTTACGC 9 604

TCATTGTAGA AAAGCTATAA AATGAATACA ATTAAAGCTG TTATTTAATT AGCCAGTGAA · .9 664

AAACTATTAA CAACTTGTCT ATTACCTGTT AGTATTATTG TTGCATTAAA AATGCATATA 97 2 4

CTTTAATAAA TGTATATTGT ATTGTATACT GCATGATTTT ATTGAAGTTC TTGTTCATCT 978 4

TGTGTATATA CTTAATCGCT TTGTCATTTT GGAGACATTT ATTTTGCTTC TAATTTCTTT 984 4

ACATTTTGTC TTACGGAATA TTTTCATTCA ACTGTGGTAG CCGAATTAAT CGTGTTTCTT 99 04

CACTCTAGGG ACATTGTCGT CTAAGTTGTA AGACATTGGT TATTTTACCA GCAAACCATT 99 64

CTGAAAGCAT ATGACAAATT ATTTCTCTCT TAATATCTTA CTATACTGAA AGCAGACTGC 1002 4

TATAAGGCTT CACTTACTCT TCTACCTCAT AAGGAATATG TTACAATTAA TTTATTAGGT 1003 4

AAGCATTTGT TTTATATTGG TTTTATTTCA CCTGGGCTGA GATTTCAAGA AACACCCCAG 1014 4

TCTTCACAGT AACACATTTC ACTAACACAT TTACTAAACA TCAGCAACTG TGGCCTGTTA 102 04

ATTTTTTTAA TAGAAATTTT AAGTCCTCAT TTTCTTTCGG TGTTTTTTAA GCTTAATTTT 102 64

TCTGGCTTTA TTCATAAATT CTTAAGGTCA ACTACATTTG AAAAATCAAA GACCTGCATT 103 2 4

TTAAATTCTT ATTCACCTCT GGCAAAACCA TTCACAAACC ATGGTAGTAA AGAGAAGGGT 10334

GACACCTGGT GGCCATAGGT AAATGTACCA CGGTGGTCCG GTGACCAGAG ATGCAGCGCT 104 4 4

GAGGGTTTTC CTGAAGGTAA AGGAATAAAG AATGGGTGGA GGGGCGTGCA CTGGAAATCA 10504

CTTGTAGAGA AAAGCCCCTG AAAATTTGAG AAAACA.AACA AGAAACTACT TACCAGCTAT 105 64

TTGAATTGCT GGAATCACAG GCCATTGCTG AGCTGCCTGA ACTGGGAACA CAAGAGAAGG 10624

AAAACAAACC ACTCTGATAA TCATTGAGTC AAGTACAGCA GGTGATTGAG GACTGCTGAG 10 63 4

AGGTACAGGC CAAAATTCTT ATGTTGTATT ATAATAATGT CATCTTATAA TACTGTCAGT 107 4 4

Sl

35/44

ATTTTATAAA ACATTCTTCA CAAACTCACA CACATTTAAA AACAAAACAC TGTCTCTAAA 103 ATCCCCAAAT TTTTCATAAA C ■ 1082

(2) INFORMATION FOR SEQ ID NO:3:

(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 348 amino acids

(B) TYPE: amino acid
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:8:

Met GIy Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu GIn 15 10 15

Thr Ala VaI Leu Gin GIy Arg Leu Leu Arg Ser His Ser Leu His Tyr 20 25 30

Leu Phe Met GIy AIa Ser GIu Gin Asp Leu GIy Leu Ser Leu Phe GIu 35 40 45

AIa Leu GIy Tyr VaI Asp Asp Gin Leu Phe VaI Phe Tyr Asp Asp GIu 50 55 60

Ser Arg Arg VaI GIu Pro Arg Thr Pro Trp VaI Ser Ser Arg lie Ser 65 70 75 80

Ser Gin Met Trp Leu Gin Leu Ser Gin Ser Leu Lys GIy Trp Asp His

85 90 95

Met Phe Thr VaI Asp Phe Trp Thr lie Met GIu Asn His Asn His Ser 100 105 110

Lys GIu Ser His Thr Leu Gin VaI He Leu GIy Cys GIu Met Gin GIu 115 120 125

Asp Asn Ser Thr GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy Gin Asp 130 135 . 140

His Leu GIu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala GIu Pro 145 150 155 160

Arg Ala Trp Pro Thr Lys Leu GIu Trp GIu Arg His Lys He Arg Ala

165 170 175

Arg Gin Asn Arg Ala Tyr Leu GIu Arg Asp Cys Pro Ala Gin Leu Gin 180 135 190

Gin Leu Leu GIu Leu GIy Arg GIy VaI Leu Asp Gin Gin VaI Pro Pro 195 200 * 205

Leu VaT Lys VaI Thr His His VaI Thr Ser Ser VaI Thr Thr Leu Arg 210 215 220

Cys Arg AIa Leu Asn Tyr Tyr Pro GIn Asn He Thr Met Lys Trp Leu 225 230 235 240

Lys Asp Lys Gin Pro Met Asp Ala Lys GIu Phe GIu Pro Lys Asp VaI

245 250 255

Leu Pro Asn GIy Asp GIy Thr Tyr Gin GIy Trp He Thr Leu Ala VaI 260 265 270

Pro Pro GIy GIu GIu Gin Arg Tyr Thr Tyr Gin VaI GIu His Pro GIy 280 285

Leu Asp Gin Pro Leu lie VaI He Trp GIu Pro Ser Pro Ser GIy Thr 295 300

Leu VaI He GIy VaI He Ser GIy He Ala VaI Phe VaI VaI He Leu 310 315 320

Phe He GIy He Leu Phe He He Leu Arg Lys Arg Gin GIy Ser Arg 325 330 335

GIy AIa Met GIy His Tyr VaI Leu Ala GIu Arg GIu 340 345

(2) INFORMATION FOR SEQ ID NO:9:

(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 1440 base pairs

(B) TYPE: nucleic acid

(C) STRANDEDNESS: single

(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: cDNA

(ix) FEATURE:

(A) NAME/KEY: CDS

(B) LOCATION: 222..1263

(ix) FEATURE:

(A) NAME/KEY: allele

(B) LOCATION: replace(408, "c")

(D) OTHER INFORMATION: /phenotype= "normal or wild-type

(unaffected)" /label= 24d2

(ix) FEATURE:

(A) NAME/KEY: allele

(B) LOCATION: replace(414, "a")

(D) OTHER INFORMATION: /phenotype= "normal or wild-type

(unaffected)" /label= 24d7

(ix) FEATURE:

(A) NAME/KEY: allele

(B) LOCATION: replace(1066, "g")

(D) OTHER INFORMATION: /phenotype= "normal or wild-type

/label= 24dl

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO:9:

GGGGACACTG GATCACCTAG TGTTTCACAA GCAGGTACCT TCTGCTGTAG GAGAGAGAGA 6

ACTiUVAGTTC TGAAAGACCT GTTGCTTTTC ACCAGGAAGT TTTACTGGGC ATCTCCTGAG 12

CCTAGGCAAT AGCTGTAGGG TGACTTCTGG AGCCATCCCC GTTTCCCCGC CCCCCAAAAG 18

AAGCGGAGAT TTAACGGGGA CGTGCGGCCA GAGCTGGGGA A ATG GGC CCG CGA 23

Met GIy Pro Arg 1

GCC AGG CCG GCG CTT CTC CTC CTG ATG CTT TTG CAG ACC GCG GTC CTG AIa Arg Pro AIa Leu Leu Leu Leu Met Leu Leu Gin Thr Ala VaI Leu 5 10 15 20

CAG GGG CGC TTG CTG CGT TCA CAC TCT CTG CAC TAC CTC TTC ATG GGT Gin GIy Arg Leu Leu Arg Ser His Ser Leu His Tyr Leu Phe Met GIy

25 30 * 35

GCC TCA GAG CAG GAC CTT GGT CTT TCC TTG TTT GAA GCT TTG GGC TAC 3 Ala Ser GIu GIn Asp Leu GIy Leu Ser Leu Phe GIu AIa Leu GIy Tyr 40 45 50

GTG GAT GAC CAG CTG TTC GTG TTC TAT GAT CAT GAG AGT CGC CGT GTG VaI Asp Asp GIn Leu Phe VaI Phe Tyr Asp His GIu Ser Arg Arg VaI 55 60 65

GAG CCC CGA ACT CCA TGG GTT TCC AGT AGA ATT TCA AGC CAG ATG TGG 47 GIu Pro Arg Thr Pro Trp VaI Ser Ser Arg He Ser Ser GIn Met Trp 70 75 80

CTG CAG CTG AGT CAG AGT CTG AAA GGG TGG GAT CAC ATG TTC ACT GTT Leu Gin Leu Ser GIn Ser Leu Lys GIy Trp Asp His Met Phe Thr VaI 85 90 95 100

GAC TTC TGG ACT ATT ATG GAA AAT CAC AAC CAC AGC AAG GAG TCC CAC Asp Phe Trp Thr He Met GIu Asn His Asn His Ser Lys GIu Ser His

105 HO 115

ACC CTG CAG GTC ATC CTG GGC TGT GAA ATG CAA GAA GAC AAC AGT ACC Thr Leu Gin VaI He Leu GIy Cys GIu Met Gin GIu Asp Asn Ser Thr 120 125 130

GAG GGC TAC TGG AAG TAC GGG TAT GAT GGG CAG GAC CAC CTT GAA TTC GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy Gin Asp His Leu GIu Phe 135 140 145

TGC CCT GAC ACA CTG GAT TGG AGA GCA GCA GAA CCC AGG GCC TGG CCC Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala GIu Pro Arg AIa Trp Pro 150 155 160

ACC AAG CTG GAG TGG GAA AGG CAC AAG ATT CGG GCC AGG CAG AAC AGG Thr Lys Leu GIu Trp GIu Arg His Lys He Arg AIa Arg GIn Asn Arg 165 170 175 180

GCC TAC CTG GAG AGG GAC TGC CCT GCA CAG CTG CAG CAG TTG CTG GAG 8 AIa Tyr Leu GIu Arg Asp Cys Pro AIa Gin Leu GIn Gin Leu Leu GIu

1S5 190 195

CTG GGG AGA GGT GTT TTG GAC CAA CAA GTG CCT CCT TTG GTG AAG GTG 8 Leu GIy Arg Clv VaI Leu Asp Gin Gin VaI Pro Pro Leu VaI Lys VaI 200 205 210

ACA CAT CAT GTG ACC TCT TCA GTG ACC ACT CTA CGG TGT CGG GCC TTG Thr His His VaI Thr Ser Ser VaI Thr Thr Leu Arg Cys Arg AIa Leu 215 220 225

AAC TAC TAC CCC CAG AAC ATC ACC ATG AAG TGG CTG AAG GAT AAG CAG Asn Tyr Tyr Pro GIn Asn He Thr Met Lys Trp Lau Lys Asp Lys Gin 230 235 240

⁰^:⁷:* ¹V

CCA ATG GAT GCC AAG GAG TTC GAA CCT AAA GAC GTA TTG CCC AAT GGG 1001 Pro Met Asp Ala Lys GIu Phe GIu Pro Lys Asp VaI Leu Pro Asn Gly 245 250 255 260

GAT GGG ACC TAC CAG GGC TGG ATA ACC TTG GCT GTA CCC CCT GGG GAA 104 9 Asp Gly Thr Tyr Gin Gly Trp He Thr Leu Ala VaI Pro Pro Gly GIu

265 270 275

GAG CAG AGA TAT ACG TGC CAG GTG GAG CAC CCA GGC CTG GAT CAG CCC 1097 GIu Gin Arg Tyr Thr Cys Gin VaI GIu His Pro Gly Leu Asp Gin Pro 230 235 290

CTC ATT GTG ATC TGG GAG CCC TCA CCC TCT GGC ACC CTA GTC ATT GGA 114 5 Leu He VaI He Trp GIu Pro Ser Pro Ser Gly Thr Leu VaI He Gly 295 300 305

GTC ATC AGT GGA ATT GCT GTT TTT GTC GTC ATC TTG'TTC ATT GGA ATT 119 3 VaI He Ser Gly He Ala VaI Phe VaI VaI He Leu Phe He Gly He 310 315 320

TTG TTC ATA ATA TTA AGG AAG AGG CAG GGT TCA AGA GGA GCC ATG GGG 12 41 Leu Phe He He Leu Arg Lys Arg Gin Gly Ser Arg Gly Ala Met GIy 325 330 335 340

CAC TAC GTC TTA GCT GAA CGT GAG TGACACGCAG CCTGCAGACT CACTGTGGGA 129 5 His Tyr VaI Leu Ala GIu Arg GIu

345

AGGAGACAAA ACTAGAGACT CAAAGAGGGA GTGCATTTAT GAGCTCTTCA TGTTTCAGGA 13 55 GAGAGTTGAA CCTAAACATA GAAATTGCCT GACGAACTCC TTGATTTTAG CCTTCTCTGT 1415 TCATTTCCTC AAAAAGATTT CCCCA 14 4 0

(2) INFORMATION FOR SEQ ID NO:10:

(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 1440 base pairs

(B) TYPE: nucleic acid

(C) STRANDEDNESS: single

(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: cDNA

(ix) FEATURE:

(A) NAME/KEY: CDS

(3) LOCATION: 222..1263

(ix) FEATURE:

(A) NAME/KEY: ailele

(B) LOCATION: replace(1066, "a")

(D) OTHER INFORMATION: /phenotype= "Hereditary Hemochromatosis

(HH)"
/label= 24dl

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO:10:

GGGGACACTG GATCACCTAG TGTTTCACAA GCAGGTACCT TCTGCTGTAG GAGAGAGAGA 60 ACTAAAGTTC TGAAAGACCT GTTGCTTTTC ACCAGGAAGT TTTACTGGGC ATCTCCTGAG 12 0

^u D|/,£R.4.95i SD2T1

39/44 *·

CCTAGGCAAT AGCTGTAGGG TGACTTCTGG AGCCATCCCC GTTTCCCCGC CCCCCAAAAG

AAGCGGAGAT TTAACGGGGA CGTGCGGCCA GAGCTGGGGA A ATG GGC CCG CGA

Met GIy Pro Arg 1

CCC AGG CCG GCG CTT CTC CTC CTG ATG CTT TTG CAG ACC GCG GTC CTG AIa Arg Pro AIa Leu Leu Leu Leu Met Leu Leu Gin Thr Ala VaI Leu 5 10 15 20

CAG GGG CGC TTG CTG CGT TCA CAC TCT CTG CAC TAC CTC TTC ATG GGT 3 Gin GIy Arg Leu Leu Arg Ser His Ser Leu His Tyr Leu Phe Met GIy

25 30 35

GCC TCA GAG CAG GAC CTT GGT CTT TCC TTG TTT GAA GCT TTG GGC TAC 3 AIa Ser GIu Gin Asp Leu GIy Leu Ser Leu Phe GIu AIa Leu GIy Tyr 40 45 50

GTG GAT GAC CAG CTG TTC GTG TTC TAT GAT CAT GAG AGT CGC CGT GTG 42 VaI Asp Asp Gin Leu Phe VaI Phe Tyr Asp His GIu Ser Arg Arg VaI 55 60 65

GAG CCC CGA ACT CCA TGG GTT TCC AGT AGA ATT TCA AGC CAG ATG TGG GIu Pro Arg Thr Pro Trp VaI Ser Ser Arg He Ser Ser GIn Met Trp 70 75 80

CTG CAG CTG AGT CAG AGT CTG AAA GGG TGG GAT' CAC ATG TTC ACT GTT · Leu Gin Leu Ser GIn Ser Leu Lys GIy Trp Asp His Met Phe Thr VaI 85 90 95 100

GAC TTC TGG ACT ATT ATG GAA AAT CAC AAC CAC AGC AAG GAG TCC CAC Asp Phe Trp Thr He Met GIu Asn His Asn His Ser Lys GIu Ser His

105 110 115

ACC CTG CAG GTC ATC CTG GGC TGT GAA ATG CAA GAA GAC AAC AGT ACC Thr Leu Gin VaI He Leu GIy Cys GIu Met Gin GIu Asp Asn Ser Thr 120 125 130

GAG GGC TAC TGG AAG TAC GGG TAT GAT GGG CAG GAC CAC CTT GAA TTC 6 GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy Gin Asp His Leu GIu Phe 135 140 145

TGC CCT GAC ACA CTG GAT TGG AGA GCA GCA GAA CCC AGG GCC TGG CCC Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala GIu Pro Arg AIa Trp Pro 150 155 160

ACC AAG CTG GAG TGG GAA AGG CAC AAG ATT CGG GCC AGG CAG AAC AGG Thr Lys Leu GIu Trp GIu Arg His Lys He Arg AIa Arg Gin Asn Arg 165 " 170 175 180

GCC TAC CTG GAG AGG GAC TGC CCT GCA CAG CTG CAG CAG TTG CTG GAG 8 AIa Tyr Leu GIu Arg Asp Cys Pro Ala GLn Leu Gin GIn Leu Leu GIu

185 190 195

CTG GGG AGA GGT GTT TTG GAC CAA CAA GTG CCT CCT TTG GTG AAG GTG 3 Leu GIy Arg GIy VaI Leu Asp Gin Gin VaI Pro Pro Leu VaI Lys VaI 200 205 210

ACA CAT CAT GTG ACC TCT TCA GTG ACC ACT CTA CGG TGT CGG GCC TTG Thr His His VaI Thr Ser Ser VaI Thr Thr Leu Arg Cys Arg AIa Leu 215 220 225

AAC TAC TAC CCC CAG AAC ATC ACC ATG AAG TGG CTG AAG GAT AAG CAG 9 Asn Tyr Tyr Pro GIn Asn He Thr Met Lys Trp Leu Lys Asp Lys GIn

5?

40/44

235

DE / EP 0 954 602Tl

24V *~ '

CCA ATG GAT GCC AAG GAG TTC GAA CCT AAA GAC GTA TTG CCC AAT GGG 1001 Pro Met Asp Ala Lys GIu Phe GIu Pro Lys Asp VaI Leu Pro Asn GIy 245 250 * 255 260

GAT GGG ACC TAC CAG GGC TGG ATA ACC TTG GCT GTA CCC CCT GGG GAA 104 9 Asp GIy Thr Tyr Gin GIy Trp Ils Thr Leu Ala VaI Pro Pro GIy GIu

265 270 275

GAG CAG AGA TAT ACG TAC CAG GTG GAG CAC CCA GGC CTG GAT CAG CCC 1097 Glu Gin Arg Tyr Thr Tyr Gin VaI GIu His Pro GIy Leu Asp Gin Pro 230 235 290

CTC ATT GTG ATC TGG GAG CCC TCA CCG TCT GGC ACC CTA GTC ATT GGA 114 5 Leu lie VaI He Trp Glu Pro Ser Pro Ser GIy Thr Leu VaI He GIy 295 300 305

GTC ATC AGT GGA ATT GCT GTT TTT GTC GTC ATC TTG TTC ATT GGA ATT 119 3 VaI He Ser GIy He Ala VaI Phe VaI VaI He Leu Phe He GIy He ^; 310 315 320

TTG TTC ATA ATA TTA AGG AAG AGG CAG GGT TCA AGA GGA GCC ATG GGG 1241 Leu Phe He He Leu Arg Lys Arg Gin GIy Ser Arg GIy Ala Met GIy 325 330 ' 335 ' 340

CAC TAC GTC TTA GCT GAA CGT GAG TGACACGCAG CCTGCAGACT CACTGTGGGA · 1295 His Tyr VaI Leu AIa Glu Arg Glu

345

AGGAGACAAA ACTAGAGACT CAAAGAGGGA GTGCATTTAT GAGCTCTTCA TGTTTCAGGA 1355 GAGAGTTGAA CCTAAACATA GAAATTGCCT GACGAACTCC TTGATTTTAG CCTTCTCTGT 1415 TCATTTCCTC AAAAAGATTT CCCCA 144 0

(2) INFORMATION FOR SEQ ID NO:11:

(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 1440 base pairs

(B) TYPE: nucleic acid

(C) STRANDEDNESS: single

(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: cDNA

(ix) FEATURE:

(A) NAME/KEY: CDS

(B) LOCATION: 222..1263

(ix) FEATURE:

(A) NAME/KEY: allele

(B) LOCATION: replace (403, "g")

(D) OTHER INFORMATION: /phenotype= "Hereditary Hemochromatosis

(HH)"
/label= 24d2

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:11:
GGGGACACTG GATCACCTAG TGTTTCACAA GCAGGTACCT TCTGCTGTAG GAGAGAGAGA

60

41/44 "

ACTAAAGTTC TGAAAGACCT GTTGCTTTTC ACCAGGAAGT TTTACTGGGC ATCTCCTGAG CCTAGGCAAT AGCTGTAGGG TGACTTCTGG AGCCATCCCC GTTTCCCCGC CCCCCAAAAG 18

AAGCGGAGAT TTAACGGGGA CGTGCGGCCA GAGCTGGGGA A ATG GGC CCG CGA 23

Met GIy Pro Arg 1

GCC AGG CCG GCG CTT CTC CTC CTG ATG CTT TTG CAG ACC GCG GTC CTG AIa Arg Pro AIa Leu Leu Leu Leu Met Leu Leu Gin Thr Ala VaI Leu 5 10 15 20

CAG GGG CGC TTG CTG CGT TCA CAC TCT CTG CAC TAC CTC TTC ATG GGT 3 Gin GIy Arg Leu Leu Arg Ser His Ser Leu His Tyr Leu Phe Met GIy

25 30 35

GCC TCA GAG CAG GAC CTT GGT CTT TCC TTG TTT GAA GCT TTG GGC TAC AIa Ser GIu GIn Asp Leu GIy Leu Ser Leu Phe GIu AIa Leu GIy Tyr 40 45 50

GTG GAT GAC CAG CTG TTC GTG TTC TAT GAT GAT GAG AGT CGC CGT GTG 42 VaI Asp Asp GIn Leu Phe VaI Phe Tyr Asp Asp GIu Ser Arg Arg VaI 55 60 65

GAG CCC CGA ACT CCA TGG GTT TCC AGT AGA ATT TCA AGC CAG ATG TGG GLu Pro Arg Thr Pro Trp VaI Ser Ser Arg He Ser Ser Gin Met Trp 70 75 30

CTG CAG CTG AGT CAG AGT CTG AAA GGG TGG GAT CAC ATG TTC ACT GTT Leu GIn Leu Ser GIn Ser Leu Lys GIy Trp Asp His Met Phe Thr VaI 85 90 95 100

GAC TTC TGG ACT ATT ATG GAA AAT CAC AAC CAC AGC AAG GAG TCC CAC Asp Phe Trp Thr He Met GIu Asn His Asn His Ser Lys GIu Ser His

105 110 115

ACC CTG CAG GTC ATC CTG GGC TGT GAA ATG CAA GAA GAC AAC AGT ACC Thr Leu Gin VaI He Leu GIy Cys GIu Met Gin GIu Asp Asn Ser Thr 120 125 130

GAG GGC TAC TGG AAG TAC GGG TAT GAT GGG CAG GAC CAC CTT GAA TTC GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy Gin Asp His Leu GIu Phe 135 140 145

TGC CCT GAC ACA CTG GAT TGG AGA GCA GCA GAA CCC AGG GCC TGG CCC Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala GIu Pro Arg AIa Trp Pro 150 155 160

ACC AAG CTG GAG TGG GAA AGG CAC AAG ATT CGG GCC AGG CAG AAC AGG Thr Lys Leu GIu Trp GIu Arg His Lys He Arg AIa Arg Gin Asn Arg 165 170 175 ISO

GCC TAC CTG GAG AGG GAC TGC CCT GCA CAG CTG CAG CAG TTG CTG GAG 3 AIa Tyr Leu GIu Arg Asp Cys Pro Ala GIn Leu Gin GIn Leu Leu GIu

135 190 195

CTG GGG AGA GGT GTT TTG GAC CAA CAA GTG CCT CCT TTG GTG AAG GTG 3 Leu GIy Arg GIy VaI Leu Asp Gin Gin VaI Pro Pro Leu VaI Lys VaI 200 205 210

ACA CAT CAT GTG ACC TCT TCA GTG ACC ACT CTA CGG TGT CGG GCC TTG 90 Thr His His VaI Thr Ser Ser VaI Thr Thr Leu Arg Cys Arg AIa Leu 215 220 225

42/44

AAC TAC TAC CCC CAG AAC ATC ACC ATG AAG TGG CTG AAG GAT AAG CAG 953 Asn Tyr Tyr Pro Gin Asn He Thr Met Lys Trp Leu Lys Asp Lys Gin 230 235 240

CCA ATG GAT GCC AAG GAG TTC GAA CCT AAA GAC GTA TTG CCC AAT GGG 1001 Pro Met Asp Ala Lys GIu Phe C-Iu Pro Lys Asp VaI Leu Pro Asn GIy 245 250 255 260

GAT GGG ACC TAC CAG GGC TGG ATA ACC TTG GCT GTA CCC CCT GGG GAA 1049 Asp GIy Thr Tyr Gin GIy Trp He Thr Le,u Ala VaI Pro Pro GIy GIu

2 65 270 .275

GAG CAG AGA TAT ACG TGC CAG GTG GAG CAC CCA GGC CTG GAT CAG CCC 1097 GIu Gin Arg Tyr Thr Cys Gin VaI GIu His Pro GIy Leu Asp Gin Pro 230 235 " 290

CTC ATT GTG ATC TGG GAG CCC TCA CCG TCT GGC ACC CTA GTC ATT GGA 114 5 Leu He VaI He Trp GIu Pro Ser Pro Ser GIy Thr Leu VaI He GIy 295 300 305

GTC ATC AGT GGA ATT GCT GTT TTT GTC GTC ATC TTG TTC ATT GGA ATT 119 3 VaI He Ser GIy He Ala VaI Phe VaI VaI He Leu Phe He GIy He 310 315 320

TTG TTC ATA ATA TTA AGG AAG AGG CAG GGT TCA AGA GGA GCC ATG GGG 1241 Leu Phe He He Leu Arg Lys Arg Gin GIy Ser Arg Gly Ala Met GIy 325 330 335 340

CAC TAC GTC TTA GCT GAA CGT GAG TGACACGCAG CCTGCAGACT CACTGTGGGA 12 95 His Tyr VaI Leu Ala GIu Arg GIu
345

AGGAGACAAA ACTAGAGACT CAAAGAGGGA GTGCATTTAT GAGCTCTTCA TGTTTCAGGA 13 55 GAGAGTTGAA CCTAAACATA GAAATTGCCT GACGAACTCC TTGATTTTAG CCTTCTCTGT 1415 TCATTTCCTC AAAAAGATTT CCCCA 14 4 0

(2) INFORMATION FOR SEQ ID NO:12:

(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 1440 base pairs
(3) TYPE: nucleic acid

(C) STRANDEDNESS: single

(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: cDNA

(ix) FEATURE:

(A) NAME/KEY: CDS

(B) LOCATION: 222..1263

(ix) FEATURE:

(A) NAME/KEY: allele

(B) LOCATION: replace(403, "g")

(D) OTHER INFORMATION: /phenotype= "Hereditary Hemochroinatosis

(HH) »
/label= 24d2

(ix) FEATURE:

(A) NAME/KEY: allele

43/44

• · t · « at·» ·

OE/EP O 954 802 Tl

(B) LOCATION: replace(1066, "a")

(D) OTHER INFORMATION: /phenotype= "Hereditary Hemochromatosis

(HH)"

/label= 24dl

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:12:

GGGGACACTG GATCACCTAG TGTTTCACAA GCAGGTACCT TCTGCTGTAG GAGAGAGAGA 60

ACTAAAGTTC TGAAAGACCT GTTGCTTTTC ACCAGGAAGT TTTACTGGGC ATCTCCTGAG 120

CCTAGGCAAT AGCTGTAGGG TGACTTCTGG AGCCATCCCC GTTTCCCCGC CCCCCAAAAG 130

AAGCGGAGAT TTAACGGGGA CGTGCGGCCA GAGCTGGGGA A ATG GGC CCG CGA 23 3

Met GIy Pro Arg 1

GCC AGG CCG GCG CTT CTC CTC CTG ATG CTT TTG CAG ACC GCG GTC CTG 281 AIa Arg Pro AIa Leu Leu Leu Leu Met Leu Leu Gin Thr Ala VaI Leu 5 10 15 20

CAG GGG CGC TTG CTG CGT TCA CAC TCT CTG CAC TAC CTC TTC ATG GGT 329 Gin GIy Arg Leu Leu Arg Ser His Ser Leu His Tyr Leu Phe Met GIy

25 30 * 35

GCC TCA GAG CAG GAC CTT GGT CTT TCC TTG TTT GAA GCT TTG GGC TAC - 3 77 AIa Ser GIu Gin Asp Leu GIy Leu Ser Leu Phe GIu AIa Leu GIy Tyr 40 45 50

GTG GAT GAC CAG CTG TTC GTG TTC TAT GAT GAT GAG AGT CGC CGT GTG 425 VaI Asp Asp Gin Leu Phe VaI Phe Tyr Asp Asp GIu Ser Arg Arg VaI 55 60 65

GAG CCC CGA ACT CCA TGG GTT TCC AGT AGA ATT TCA AGC CAG'ATG TGG 473 GIu Pro Arg Thr Pro Trp VaI Ser Ser Arg He Ser Ser GIn Met Trp 70. 75 80

CTG CAG CTG AGT CAG AGT CTG AAA GGG TGG GAT CAC ATG TTC ACT GTT 521 Leu GIn Leu Ser GIn Ser Leu Lys GIy Trp Asp His Met Phe Thr VaI 85 90 95 100

GAC TTC TGG ACT ATT ATG GAA AAT CAC AAC CAC AGC AAG GAG TCC CAC 569 Asp Phe Trp Thr He Met GIu Asn His Asn His Ser Lys GIu Ser His

105 HO 115

ACC CTG CAG GTC ATC CTG GGC TGT GAA ATG CAA GAA GAC AAC AGT ACC . 617 Thr Leu Gin VaI He Leu GIy Cys GIu Met Gin GIu Asp Asn Ser Thr 120 125 130

GAG GGC TAC TGG AAG TAC GGG TAT GAT GGG CAG GAC CAC CTT GAA TTC 6 65 GIu GIy Tyr Trp Lys Tyr GIy Tyr Asp GIy Gin Asp His Leu GIu Phe 135 140 * 145

TGC CCT GAC ACA CTG GAT TGG AGA GCA GCA GAA CCC AGG GCC TGG CCC 713 Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala GIu Pro Arg AIa Trp Pro 150 155 160

ACC AAG CTG GAG TGG GAA AGG CAC AAG ATT CGG GCC AGG CAG AAC AGG 761 Thr Lys Leu GIu Trp GIu Arg His Lys He Arg AIa Arg GIn Asn Arg 165 170 175 180

GCC TAC CTG GAG AGG GAC TGC CCT GCA CAG CTG CAG CAG TTG CTG GAG 3 09 AIa Tyr Leu GIu Arg Asp Cys Pro Ala GIn Leu Gin GIn Leu Leu GIu

^44/44 DE/EP O 954 602 T1

185 190 195

CTG GGG AGA GGT GTT TTG GAC CAA CAA GTG CCT CCT TTG GTG AAG GTG 3 5f Leu GIy Arg GIy VaI Leu Asp Gin Gin VaI Pro Pro Leu VaI Lvs VaI 200 205 210

ACA CAT CAT GTG ACC TCT TCA GTG ACC ACT CTA CGG TGT CGG GCC TTG 9 05 Thr His His VaI Thr Ser Ser VaI Thr Thr Leu Arg Cys Arg Ala Leu 215 220 225

AAC TAC TAC CCC CAG AAC ATC ACC ATG AAG TGG CTG AAG GAT AAG CAG 35J Asn Tyr Tyr Pro Gin Asn lie Thr Met Lys Trp Leu Lys Asp Lys Gin 230 235 240

CCA ATG GAT GCC AAG GAG TTC GAA CCT AAA GAC GTA TTG CCC AAT GGG 1001 Pro Met Asp Ala Lys GIu Phe GIu Pro Lys Asp VaI Leu Pro Asn GIy 245 250 255 260

GAT GGG ACC TAC CAG GGC TGG ATA ACC TTG GCT GTA CCC CCT GGG GAA 104 9 Asp GIy Thr Tyr Gin GIy Trp lie Thr Leu Ala VaI Pro Pro GIy GIu

265 270 275

GAG CAG AGA TAT ACG TAC CAG GTG GAG CAC CCA GGC CTG GAT CAG CCC 109 7 GIu Gin Arg Tyr Thr Tyr Gin VaI GIu His Pro GIy Leu Asp Gin Pro 280 235 290

CTC ATT GTG ATC TGG GAG CCC TCA CCG TCT GGC ACC CTA GTC ATT GGA · 114 5 Leu lie VaI lie Trp Glu Pro Ser Fro Ser GIy Thr Leu VaI lie GIy 295 300 305

GTC ATC AGT GGA ATT GCT GTT TTT GTC GTC ATC TTG TTC ATT GGA ATT 119 3 VaI lie Ser GIy lie Ala VaI Phe VaI VaI He Leu Phe He GIy He 310 315 320

TTG TTC ATA ATA TTA AGG AAG AGG CAG GGT TCA AGA GGA GCC ATG GGG 12 41 Leu Phe He He Leu Arg Lys Arg Gin GIy Ser Arg GIy Ala Met GIy 325 330 335 340

CAC TAC GTC TTA GCT GAA CGT GAG TGACACGCAG CCTGCAGACT CACTGTGGGA 12 9 5 His Tyr VaI Leu AIa Glu Arg GIu

345

AGGAGACAAA ACTAGAGACT CAAAGACGGA GTGCATTTAT GAGCTCTTCA TGTTTCAGGA 13 5 5 GAGAGTTGAA CCTAAACATA GAAATTGCCT-..GACGAACTCC ..TTGATTTTAG CCTTCTCTGT 1415 TCATTTCCTC AAAAAGATTT CCCCA 14 4 0