[go: up one dir, main page]

CZ288789B6 - Polynukleotidová sekvence kódující protokadherin, DNA vektor, hostitelská buňka, protokadherin, způsob jeho produkce, protilátková substance, buněčná linie a způsob modulace vazebné aktivity protokadherinu - Google Patents

Polynukleotidová sekvence kódující protokadherin, DNA vektor, hostitelská buňka, protokadherin, způsob jeho produkce, protilátková substance, buněčná linie a způsob modulace vazebné aktivity protokadherinu Download PDF

Info

Publication number
CZ288789B6
CZ288789B6 CZ1996482A CZ48296A CZ288789B6 CZ 288789 B6 CZ288789 B6 CZ 288789B6 CZ 1996482 A CZ1996482 A CZ 1996482A CZ 48296 A CZ48296 A CZ 48296A CZ 288789 B6 CZ288789 B6 CZ 288789B6
Authority
CZ
Czechia
Prior art keywords
protocadherin
seq
sequence
human
asp
Prior art date
Application number
CZ1996482A
Other languages
English (en)
Other versions
CZ48296A3 (en
Inventor
Suzuki Shinatro
Original Assignee
Doheny Eye Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Doheny Eye Institute filed Critical Doheny Eye Institute
Publication of CZ48296A3 publication Critical patent/CZ48296A3/cs
Publication of CZ288789B6 publication Critical patent/CZ288789B6/cs

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Zoology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Veterinary Medicine (AREA)
  • Cell Biology (AREA)
  • Toxicology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Steroid Compounds (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

Purifikovan a izolovan polynukleotidov sekvence k duj c hum nn protokadherin zvolen² ze souboru sest vaj c ho z hum nn ho protokadherinu pc3 o sekvenci SEQ ID NO: 110, hum nn ho protokadherinu pc4 o sekvenci SEQ ID NO: 115 a krys ho protokadherinu pc5 o sekvenci SEQ ID NO: 112 a z jejich polypeptidov²ch analog , v nich je jedna nebo v ce specifikovan²ch aminokyselin vypuÜt na nebo nahrazena, nebo v nich je p°id na jedna nebo v ce aminokyselin, kter nejsou p° rodn k dov ny, a to 1) beze ztr ty jedn nebo v ce biologick²ch aktivit nebo imunologick²ch vlastnost specifick²ch pro p° sluÜn² protokadherin nebo 2) se specifick²m zneschopn n m ur it vazebn funkce ligand/antiligand p° sluÜn ho protokadherinu. Biologicky funk n DNA vektor obsahuj c uvedenou polynukleotidovou sekvenci, hostitelsk bu ka transformovan nebo transfekovan touto sekvenc DNA, purifikovan² a izolovan² protokadherinov² polypeptid uveden² v²Üe a zp sob jeho produkce, protil tkov substance specifick pro u\

Description

(57) Anotace:
Purifikovaná a izolovaná polynukleotidová sekvence kódující humánní protokadherin zvolený ze souboru sestávajícího z humánního protokadherinu pc3 o sekvenci SEQ ID NO: 110, humánního protokadherinu pc4 o sekvenci SEQ ID NO: 115 a krysího protokadherinu pc5 o sekvenci SEQ ID NO: 112 a z jejich polypeptidových analogů, v nichž je jedna nebo více specifikovaných aminokyselin vypuštěna nebo nahrazena, nebo v nichž je přidána jedna nebo více aminokyselin, které nejsou přírodně kódovány, a to I) beze ztráty jedné nebo více biologických aktivit nebo imunologických vlastností specifických pro příslušný protokadherin nebo 2) se specifickým zneschopněním určité vazebné funkce ligand/antiligand příslušného protokadherinu. Biologicky funkční DNA vektor obsahující uvedenou polynukleotidovou sekvenci, hostitelská buňka transformovaná nebo transfekovaná touto sekvencí DNA, purifikovaný a izolovaný protokadherinový polypeptid uvedený výše a způsob jeho produkce, protilátková substance specifická pro uvedený protokadherin, hybridomální buněčná linie produkující monoklonální protilátku specifickou pro uvedený protokadherin a způsob modulace vazebné aktivity (13) Druh dokumentu: B6 (51) Intel’:
C 12 N 15/12
C 12 N 15/85
C12N 5/10
C 07 K 14/705
C 07 K 16/28
A61K 39/395 protokadherinu kontaktováním protokadherinu s protilátkovou substancí.
/
Polynukleotidová sekvence kódující protokadherin, DNA vektor, hostitelská buňka, protokadherin, způsob jeho produkce, protilátková substance, buněčná linie a způsob modulace vazebné aktivity protokadherinu
Oblast techniky
Vynález se obecně týká látek a způsobů, které se vztahují k adhezi buňka-buňka. Zejména se vynález týká adhezivních proteinů označovaných názvem protokadheriny a polynukleotidových sekvencí, které tyto protokadheriny kódují. Dále se vynález také týká DNA vektorů, hostitelských buněk a způsobů produkce těchto protokadherinů, protilátkových substancí, hybridomálních buněčných linií a způsobů inhibice vazby protokadherinů kjejich přirozeným ligandům/antiligandům.
Dosavadní stav techniky
In vivo hraje intercelulámí adheze důležitou úlohu při značném počtu procesů, jako je morfogeneze a tvorba orgánů, extravazace leukocytů, metastázy a invaze nádorů a tvorba buněčných spojení. Adheze buňka-buňka má navíc rozhodující význam pro udržení integrity tkáně.
Mezibuněčná adheze je zprostředkována specifickými adhezivními molekulami na povrchu buňky. Adhezivní molekuly buňky byly roztříděny přinejmenším do čtyř skupin zahrnujících nadtřídu imunoglobulinů, nadtřídu integrinů, třídu selektinů a nadtřídu kadherinů. Všechny typy buněk vytvářející tuhé tkáně exprimují některé členy supertřídy kadherinů, z čehož vyplývá, že se kadheriny podílejí na selektivní adhezi většiny typů buněk.
Kadheriny jsou obvykle popisovány jako glykosylované integrální membránové proteiny obsahující N-terminální extracelulámí doménu (N-terminálních 113 aminokyselin této domény se pravděpodobně přímo podílí na vazbě) skládající se z pěti subdomén, charakterizovaných jedinečnými sekvencemi kadherinů, hydrofobní membránovou vyztužující doménu a Cterminální cytoplazmatickou doménu, která interaguje s cytoskeletem prostřednictvím kateninů a jiných proteinů spojených s cytoskeletem. Některé kadheriny však neobsahují cytoplazmatickou doménu, a zdá se, že se při adhezi buňka-buňka uplatňují odlišným mechanismem než kadheriny s cytoplazmatickou doménou. Cytoplazmatická doména je potřebná pro adhezivní funkci extracelulámí domény v kadherinech, které takovou cytoplazmatickou doménu obsahují. Vazba mezi členy třídy kadherinů exprimovaných na různých buňkách je homofilní (tj. člen třídy kadherinů se váže ke kadherinům ze stejné nebo příbuzné podtřídy) a Ca2+-dependentní. Nedávno zveřejněný přehled kadherinů je uveden v publikaci Takeichi, Annu. Rev. Biochem., 59: 237 až 252 (1990) a Takeichi, Science, 251: 1451 až 1455 (1991). První popsané kadheriny (E-kadherin v myších epithelových buňkách, L-CAM v ptačích játrech, uvomorulin v myší blastocystě a CAM 120/80 v humánních epithelových buňkách) byly identifikovány na základě svého podílu na Ca2+-dependentní adhezi buněk a na základě svých jedinečných imunologických vlastností a lokalizace vtkáni. Když byl později imunologicky identifikován N-kadherin, u něhož bylo zjištěno odlišné rozdělení v tkáni než v případě E-kadherinu, stalo se zřejmým, že byla objevena nová třída Ca2+-dependentních adhezivních molekul buňka-buňka.
Molekulární klonování genů kódujících E-kadherin (viz Nagafuchi et al., Nátuře, 329: 341 až 343 (1987)), N-kadherin (Hatta et al., J. Cell. Biol. 106: 873 až 882 (1988)) a P-kadherinu (Nose et al., EMBO J. 6:3655 až 3661 (1987)) poskytlo strukturní důkaz, že kadheriny představují třídu molekul zprostředkovávajících adhezi buněk. Klonování L-CAM (Gallin et al., Proč. Nati. Acad. Sci. USA, 84: 2808 až 2812 (1987)) a uvomorulinu (Ringwald et al., EMBO J. 6: 3647 až 3653 (1986)) ukázalo, že tyto látky jsou identické s E-kadherinem. Porovnání aminokyselinových sekvenci Ε-, N- a P-kadherinu ukázalo, že stupeň podobnosti mezi těmito třemi podtřídami činí
-1 CZ 288789 B6 přibližně 45 až 58 %. Liaw et al. (EMBO J., 9: 2701 až 2708 (1990)) popisuje použití PCR s degenerovanými oligonukleotidy založenými na konzervovaných oblastech Ε-, N- a Pkadherinu pro amplifikaci N- a P-kadherinu zcDNA pocházející z hovězí mikrovaskulámí endotheliální buňky.
Izolaci osmi dalších kadherinů pomocí PCR oznámili Suzuki et al. (Cell Regulation, 2: 261 až 270 (1991)). Později bylo popsáno několik dalších kadherinů, včetně R-kadherinu (Inuzuka et al., Neuron, 7: 69 až 79 (1991)), M-kadherinu (Donalies, Proč. Nati. Acad. Sci. USA, 88: 8024 až 8028 (1991)), B-kadherinu (Napolitano, J. Cell Biol., 113: 893 až 905 (1991)) a T-kadherinu 10 (Ranscht, Neuron, 7:391 až 402 (1991)).
Dále byly popsány také proteiny, které jsou vzdáleně příbuzné kadherinům, jako je desmoglein (Goodwin et al., Biochem. Biophys. Res. Commun., 173: 1224 až 1230 (1990) a Koch et al., Eur. J. Cell Biol., 53: 1 až 12 (1990)) a desmokolliny (Holton et al., J. Cell Science, 97: 239 až 246 15 (1990)). Extracelulámí domény těchto molekul jsou strukturně příbuzné extracelulámím doménám typických kadherinů, ale každá z nich obsahuje jedinečnou cytoplazmatickou doménu. Mahoney et al. (Cell, 67: 853 až 868 (1991)) popisuje gen supresoru tumoru zDrosophila, o názvu „fat“, který také kóduje protein příbuzný kadherinů. Supresor tumoru fat obsahuje 34 subdomén podobných kadherinů, po nichž následují 4 repetice typu EGF, transmembránová 20 doména a nová cytoplazmatická doména. Identifikace těchto proteinů příbuzných kadherinů představuje důkaz, že existuje velká nadtřída, pro niž je charakteristická přítomnost motivu kadherinové extracelulámí domény.
Studie exprese různých proteinů příbuzných kadherinů vtkáni ukazují, že každá podtřída 25 molekul vykazuje jedinečný druh rozdělení vtkáni. Tak například E-kadherin se vyskytuje v epithelových buňkách, zatímco N-kadherin je obsažen v nervových a svalových buňkách. Exprese proteinů příbuzných kadherinů se zdá být také prostorově a časově regulována v průběhu vývoje, poněvadž jednotlivé proteiny jsou zřejmě exprimovány specifickými buňkami a tkáněmi ve specifických stádiích vývoje (přehled viz výše citovaná publikace Takeichi z roku 1991). 30 Ektopická exprese proteinů příbuzných kadherinů a inhibice nativní exprese proteinů příbuzných kadherinů brání tvorbě normální struktury tkáně (Detrick et al., Neuron, 4: 493 až 506 (1990); Fujimori et al., Development, 110: 97 až 104 (1990); Kintner, Cell, 69: 225 až 236 (1992)). Jedinečné rozdělení exprese různých kadherinů a proteinů podobných kadherinům v čase a místě tkáně je obzvláště významné, vezme-li se v úvahu úloha, jakou může každá podtřída proteinů 35 hrát in vivo za normálních okolností (například při udržování intestinální epithelové bariéry) a za abnormálních okolností (například při metastáze nádorů nebo zánětech). Různé podtřídy nebo kombinace podtříd proteinů příbuzných kadherinů jsou pravděpodobně zodpovědné za různé jevy adheze buňka-buňka, u nichž může být žádoucí terapeutická detekce a/nebo intervence. Tak například auto-protilátky od pacientů postižených pemphigus vulgaris, což je autoimunitní kožní 40 choroba, charakteristická tvorbou puchýřů způsobených ztrátou buněčné adheze, reagují s proteinem příbuzným kadherinů, což představuje přímou podporu pro adhezní funkce kadherinů in vivo (Amagai et al., Cell, 67: 869 až 877 (1991)). Studie také ukázaly, že kadheriny a proteiny podobné kadherinům mohou mít kromě adhezivní účinnosti také regulační funkce. Matsunafa et al. (Nátuře, 334: 62 až 64 (1988)) uvádějí, že N-kadherin vykazuje aktivitu podporující 45 přerůstání neuritů. Gen supresoru nádoru Drosophila fat zřejmě reguluje růst buněk a potlačuje invazi nádorů, podobně jako to činí savčí E-kadherin (viz Mahoney et al., výše uvedená citace; Frixen et al., J. Cell. Biol., 113: 173 až 185 (1991); Chen et al., J. Cell. Biol., 114: 319 až 327 (1991) a Vlemincky et al., Cell, 66: 107 až 119 (1991)). Může být tedy žádoucí terapeutická intervence do regulačních aktivit proteinů podobných kadherinů exprimovaných ve specifických 50 tkáních.
Přetrvává tedy v tomto oboru potřeba identifikovat a charakterizovat další proteiny příbuzné kadherinů, které se podílejí na adhezi buňka-buňka a/nebo na regulačních aktivitách. S ohledem na to, že proteiny příbuzné kadherinů by se mohly stát základem pro vývoj terapeutických a 55 diagnostických činidel, je dále také důležité, aby byly geny kódující tyto proteiny klonovány.
-2CZ 288789 B6
Informace o DNA sekvencích a aminokyselinových sekvencích kódujících proteiny příbuzné kadherinu by umožnily produkci těchto proteinů ve velkém měřítku rekombinantními technologiemi a také by umožnily identifikaci tkání a buněk, v nichž jsou tyto proteiny přirozeně produkovány. Informace o sekvencích by také umožnily přípravu látek typu protilátek nebo jiných nových vazebných molekul specificky reaktivních s proteiny příbuznými kadherinu. Takové látky typu protilátek by mohly být užitečné při modulaci přirozených vazebných reakcí ligand/antiligand, na nichž se tyto proteiny podílejí.
Podstata vynálezu
Předmětem vynálezu jsou obecně látky příbuzné kadherinu a způsoby vztahující se k adhezi buňka-buňka.
Jedním aspektem tohoto vynálezu je purifikovaná a izolovaná polynukleotidová sekvence kódující protokadherin zvolený ze souboru sestávajícího z
a) humánního protokadherinu pc3 o sekvenci SEQ ID NO: 110 nebo jeho polypeptidového analogu, v němž je jedna nebo více specifikovaných aminokyselin vypuštěna nebo nahrazena, nebo v němž je přidána jedna nebo více aminokyselin, které nejsou přírodně kódovány, a to 1) beze ztráty jedné nebo více biologických aktivit nebo imunologických vlastností specifických pro protokadherin pc3 nebo 2) se specifickým zneschopněním určité vazebné funkce ligand/antiligand protokadherinu pc3;
b) humánního protokadherinu pc4 o sekvenci SEQ ID NO: 115 nebo jeho polypeptidového analogu, v němž je jedna nebo více specifikovaných aminokyselin vypuštěna nebo nahrazena, nebo v němž je přidána jedna nebo více aminokyselin, které nejsou přírodně kódovány, a to 1) beze ztráty jedné nebo více biologických aktivit nebo imunologických vlastností specifických pro protokadherin pc4 nebo 2) se specifickým zneschopněním určité vazebné funkce ligand/antiligand protokadherinu pc4; a
c) krysího protokadherinu pc5 o sekvenci SEQ ID NO: 112 nebo jeho polypeptidového analogu, v němž je jedna nebo více specifikovaných aminokyselin vypuštěna nebo nahrazena, nebo v němž je přidána jedna nebo více aminokyselin, které nejsou přírodně kódovány, a to 1) beze ztráty jedné nebo více biologických aktivit nebo imunologických vlastností specifických pro protokadherin pc5 nebo 2) se specifickým zneschopněním určité vazebné funkce ligand/antiligand protokadherinu pc5.
Přednostní polynukleotidové sekvence podle vynálezu zahrnují genomové a cDNA sekvence, jakož i úplně nebo zčásti syntetizovaná DNA sekvence a jejich biologické repliky (tj. kopie sekvencí zhotovených in vitro). Sem také spadají biologicky aktivní vektory obsahující tyto polynukleotidové sekvence.
Jako specifické ilustrativní protokadherinové polynukleotidové sekvence podle tohoto vynálezu je možno uvést inserty vplazmidech pRC/RSV-pc42 a pRC/RSV-pc43, které byly uloženy v Americké sbírce typových kultur (Američan Type Culture Collection - ATCC), 12301 Parklawn Drive, Rockville, Maryland 2085 16. prosince 1992 a bylo jim přiděleno přírůstkové číslo ATCC 69162 a 69163).
Vědecká hodnota informací, na nichž se podílí publikace DNA a aminokyselinových sekvencí podle tohoto vynálezu je nabíledni. Tak například znalost sekvence části nebo celé DNA kódující protokadherin umožňuje izolaci celé sekvence cDNA nebo genomové DNA kódující protein (nebo jeho varianty) a v případě sekvencí genomové DNA, které specifikují protokadherinspecifické regulační sekvence, jako jsou promotory, posilovače transkripce (enhancery) apod. pomocí standardních technologií hybridizace DNA/DNA nebo PCR. Alternativně lze sekvence
-3CZ 288789 B6
DNA podle vynálezu chemicky syntetizovat konvenčními technikami. Hybridizace a PCR techniky umožňují také izolovat DNA kódující heterologické proteiny, které jsou homologické vůči protokadherinům specificky ilustrovaným v tomto popisu.
Dalším aspektem tohoto vynálezu jsou hostitelské buňky, zejména eukaryontní a prokaryontní buňky, které jsou stabilně transformovány nebo transfekovány polynukleotidovými sekvencemi podle vynálezu způsobem, který umožňuje expresi protokadherinových polypeptidů v těchto buňkách. Hostitelské buňky exprimující protokadherinové polypeptidové produkty jsou při pěstování ve vhodném kultivačním médiu užitečné pro velkovýrobu protokadherinových polypeptidů, jejich fragmentů a variant umožňující izolovat požadované polypeptidové produkty z buněk nebo z růstového média, v němž byly buňky pěstovány.
Nové protokadherinové proteinové produkty podle vynálezu je možno získat jako izoláty z přírodní tkáně, jakožto zdroje, ale přednostně se získávají rekombinantními postupy za použití hostitelských buněk podle vynálezu. Tyto produkty je možno získat ve zcela nebo zčásti glykosylované formě, zčásti nebo zcela deglykosylované formě nebo neglykosylované formě, podle toho, jaká hostitelská buňka byla zvolena,, nebo jak byla rekombinantní produkce a/nebo následná izolace prováděna.
Do rozsahu vynálezu spadají také „protilátkové substance“, tj. látky typu protilátek (například monoklonální a polyklonální protilátky, chimérické a humanizované protilátky, protilátkové domény, včetně Fab, Fab', F(ab')2· Fv nebo jednotlivých variabilních domén a jednořetězcové protilátky), které jsou specifické pro protokadheriny podle vynálezu. Protilátkové substance je možno vyvíjet za použití izolovaných přírodních, rekombinantních nebo syntetických protokadherinových polypeptidových produktů nebo hostitelských buněk, které na svém povrchu exprimují takové produkty. Protilátkových substancí je možno použít pro purifikaci protokadherinových polypeptidů podle vynálezu, pro stanovení exprese polypeptidů v tkáni a jako antagonistů vazebných aktivit typu ligand/antiligand protokadherinů. Jako specifické ilustrativní monoklonální protilátky podle vynálezu je možno uvést protokadherin-43 specifické monoklonální protilátky produkované hybridomovou buněčnou linií označenou 3812C, která byla uložena ve sbírce ATCC 2. prosince 1992, přičemž jí bylo přiděleno přístupové číslo ATCC HB 11207.
Řada dalších aspektů a výhod tohoto vynálezu bude zřejmá z následujícího podrobného popisu příkladných provedení tohoto vynálezu, v němž jsou uvedeny odkazy na přiložené obrázky.
Přehled obr, na výkresech
Na obr. IA až 1C jsou uvedeny protokadherinové aminokyselinové sekvence podle vynálezu v zákrytu s aminokyselinovými sekvencemi N-kadherinu a supresoru tumoru Drosophila fat.
Vynález je ilustrován v následujících příkladech. Tyto příklady mají výhradně ilustrativní charakter a rozsah vynálezu v žádném ohledu neomezují.
Příklady provedení vynálezu
Příklady 1, 2 a 3 popisují izolaci pomocí PCR protokadherinových polynukleotidových sekvencí. Příklad 3 také popisuje lokalizaci několika protokadherinových genů podle vynálezu v chromozomu. Příklad 4 popisuje izolaci dalších protokadherinových polynukleotidových sekvencí podle vynálezu za použití techniky hybridizace DNA/DNA. Příklad 5 ukazuje konstrukci expresních plazmidů zahrnujících polynukleotidy kódující protokadherin-42 nebo protokadherin-43 a transfekci L buněk těmito plazmidy. Tvorba protilátek vůči protokadherinu-42 a protokadherinu43 je popsána v příkladu 6. Příklad 7 uvádí výsledky imunoesejů s transfekovanými L buňkami
-4CZ 288789 B6 při expresi protokadherinu-42 nebo protokadherinu-43. Příklad 8 popisuje agregační vlastnosti L buněk transfekovaných protokadherinem-42, protokadherinem—43 nebo chimérickou molekulou protokadherin-43/E-kadherin. Vazebné vlastnosti pro vápník v případě pc43 jsou popsány v příkladu 9. Výsledky zkoušek exprese protokadherinu-42 a protokadherinu-43 v různých tkáních a buněčných liniích pomocí analýzy Northem blot, Western blot a in šitu hybridizace jsou uvedeny v příkladech 10, 11 a 12. Příklad 13 popisuje imunoprecipitační pokusy, při je identifikován 120kDa protein, který se sráží současně s protokadherinem-43.
Příklad I
Pro izolaci nových krysích cDNA fragmentů kódujících polypeptidy příbuzné kadherinu bylo použito polymerázové řetězové reakce (PCR).
Konstrukce PCR primerů
Dvě oblasti konzervované aminokyselinové sekvence, z nichž jedna pochází z prostřední části třetí kadherinové extracelulámí subdomény (EC-3) a druhá pochází od C-konce čtvrté extracelulámí subdomény (EC-4) byly identifikovány na základě porovnání publikovaných aminokyselinových sekvencí pro L-CAM (Gallin et al., výše uvedená citace), E-kadherin (Nagafuchi et al., výše uvedená citace), myší P-kadherin (Nose et al., výše uvedená citace), uvomorulin (Ringwald et al., výše uvedená citace), kuřecí N-kadherin (Hatta et al., výše uvedená citace), myší N-kadherin (Miyatani et al., Science, 245: 631 až 635 (1989)) a humánní Pkadherin (Shimoyama et al., J. Cell. Biol., 109: 1787 až 1794 (1989)) a byly zkonstruovány odpovídající degenerované oligonukleotidy uvedené níže v IUPAC-IUB biochemickém názvosloví pro použití jako PCR primery.
Primerl (SEQ ID NO: 1)
5' AARSSNNTNGAYTRYGA 3'
Primer 2 (SEQ ID NO: 2)
3' TTRCTRTTRCGNGGNNN 5'
Degenerované oligonukleotidy byly syntetizovány za použití syntetizátoru Applied Biosystems Model 380B DNA synthesizer (Foster City, Kalifornie, USA).
Klonování cDNA sekvencí pomocí PCR
Reakce PCR byla prováděna podobným způsobem, jaký je popsán v publikaci Suzuki et al., Cell Regulation, 2: 261 až 270 (1991) na cDNA preparátu z krysího mozku. Úplná RNA byla připravena z krysího mozku za použití metody s guanidiniumisothiokyanátem a chloridem česným, která je popsána v Maniatis et al., Molecular Cloning: (A Laboratory Manual, str. 196, Cold Spring Harbor, New York, USA, Cold Spring Harbor Laboratory (1982)). Mozkové poly(A)+ RNA byly potom izolovány za použití soupravy FastTrack® (Invitrogen, San Diego, Kalifornie, USA) a cDNA byla připravena za použití soupravy pro syntézu cDNA (Boehringer Mannheim, Biochemicals, Indianapolis, Indiana, USA). Reakce PCR byla iniciována přídavkem 2,5 j. Taq DNA polymerázy (Boehringer Mannheim Biochemicals) ke 100 ng templátové cDNA a 10 pg každého z primerů. Potom bylo provedeno 35 reakčních cyklů denaturace při 94 °C o délce 1,5 minuty, teplotní hybridizace při 45 °C o délce 2 minut a polymerace při 72 °C o délce 3 minuty. Při elektroforéze produktů PCR reakce na agarosovém gelu byly nalezeny dva hlavní pásy, z nichž jeden odpovídá asi 450 bázovým párům (bp) a druhý 130 bp. Pás látky o velikosti 450 bp odpovídá očekávané délce mezi místy dvou primerů, která odpovídají prostřední části třetí kadherinové extracelulámí subdomény (EC-3) a karboxylovému konci čtvrté kadherinové extracelulámí subdomény (EC-4). Pás o velikosti 130 bp nebylo možno předvídat na základě žádné z dříve identifikovaných sekvencí kadherinu. Pásy o velikosti 450 bp a 130 bp byly extrahovány metodou zmrazování - tavení. Výsledné fragmenty byly fosforylovány na 5' konci
-5CZ 288789 B6
T4 polynukleotid kinasou a subklonovány ligací tupých konců do místa Smál M13mpl8 (Boehringen Mannheim Biochemicals) s ligací tupých konců pro analýzu sekvence. Sekvenování fragmentů bylo prováděno metodou terminace dideoxynukleotidového řetězce za použití soupravy Sequenase (United States Biochemicals, Cleveland, Ohio, USA). DNA a aminokyselinový sekvence byly analyzovány za použití programu Beckman Microgenie (Fullerton, Kalifornie, USA).
Analýza cDNA sekvencí
Bylo izolováno 19 nových částečných cDNA klonů. DNA a dedukované aminokyselinové sekvence těchto klonů (včetně sekvencí odpovídajících PCR primerům jsou následující: RAT-123 (SEQ ID NO: 3 a 4), RAT-212 (SEQ ID NO: 5 a 6),
RAT-214 (SEQ ID NO: 7 a 8), RAT-216 (SEQ ID NO: 9 a 10), RAT-218 (SEQ ID NO: 11 a 12), RAT-224 (SEQ ID NO: 13 a 14), RAT-312 (SEQ ID NO: 15 a 16), RAT-313 (SEQ ID NO: 17 a 18), RAT-314 (SEQ ID NO: 19 a 20), RAT-315 (SEQ ID NO: 21 a 22), RAT-316 (SEQ ID NO: 23 a 24), RAT-317 (SEQ ID NO: 25 a 26), RAT-321 (SEQ ID NO: 27 a 28), RAT-323 (SEQ ID NO: 29 a 30), RAT-336 (SEQ ID NO: 31 a 32), RAT-352 (SEQ ID NO: 33 a 34), RAT-411 (SEQ ID NO: 35 a 36), RAT-413 (SEQ ID NO: 37 a 38) a RAT-551 (SEQ ID NO: 39 a 40).
Dedukované aminokyselinové sekvence cDNA klonů jsou homologické vzhledem ke známým kadherinům, ale liší se od nich. Až dosud popsané kadheriny obsahují vysoce konzervované krátké aminokyselinové sekvence ve třetí extracelulámí subdoméně (EC-3), včetně konvenční sekvence D-Y-E nebo D-F-E umístěné v prostřední oblasti této subdomény a konvenční sekvence D-X-N-E-X-P-X-F (SEQ ID NO: 41) nebo D-X-D-E-X-P-X-F (SEQ ID NO: 42) na jejím konci (Hatta et al., výše uvedená citace), zatímco odpovídající sekvence jiných subdomén s výjimkou páté extracelulámí subdomény (EC-5) jsou D-R-E a D-X-N-D-N-X-PX-F (SEQ ID NO: 43). Naproti tomu dedukované aminokyselinové sekvence nových klonů odpovídajících katherinovým extracelulámím subdoménám zahrnují sekvence D-Y-E nebo DF-E na jednom konci, ale obsahují sekvenci D-X-N-D-N-X-P-X-F místo sekvence D-X-NE-X-P-X-F nebo D-X-D-E-X-P-X-F na druhém konci. Polypeptidy kódované částečnými klony jsou homologické s dříve identifikovanými kadheriny, ale nevykazují významnou homologii sjakýmikoliv jinými sekvencemi v genové knihovně. Parciální cDNA proto zřejmě představují novou podtřídu molekul příbuzných katherinu.
Příklad 2
Pomocí PCR za použití primeru 1 a 2 (viz příklad 1) byly z cDNA přípravků z mozku člověka, myši a Xenopus a z celého těla Drosophila a C. elegans izolovány různé fragmenty cDNA strukturně podobné krysím cDNA popsaným v příkladu 1. DNA a dedukované aminokyselinové sekvence výsledných PCR fragmentů (včetně sekvencí odpovídajících PCR primerům) jsou uvedeny dále:
MOUSE-321 (SEQ ID NO: 44 a 45), MOUSE-322 (SEQ ID NO: 46 a 47), MOUSE-324 (SEQ ID NO: 48 a 49), MOUŠE 326 (SEQ ID NO: 50 a 51), HUMAN-11 (SEQ ID NO: 52 a 53), HUMAN-13 (SEQ ID NO: 54 a 55), HUMAN-21 (SEQ ID NO: 56 a 57), HUMAN-24 (SEQ ID NO: 58 a 59), HUMAN-32 (SEQ ID NO: 60 a 61), HUMAN-42 (SEQ ID NO: 62 a 63), HUMAN-43 (SEQ ID NO: 64 a 65), HUMAN-212 (SEQ ID NO: 66 a 67), HUMAN-213 (SEQ ID NO: 68 a 69), HUMAN-215 (SEQ ID NO: 70 a 71), HUMAN-223 (SEQ ID NO: 72 a 73), HUMAN-410 (SEQ ID NO: 74 a 75), HUMAN-A43 (SEQ ID NO: 76 a 77), XENOPUS-21 (SEQ ID NO: 78 a 79), XENOPUS-23 (SEQ ID NO: 80 a 81), XENOPUS-25 (SEQ ID NO: 82 a 83), XENOPUS-31 (SEQ ID NO: 84 a 85), DROSOPHILA-12 (SEQ ID NO: 86 a 87), DROSOPHILA-13 (SEQ ID NO: 88 a 89), DROSOPHILA-14 (SEQ ID NO: 90 a 91), a
-6CZ 288789 B6
C.ELEGANS-41 (SEQ ID NO: 92 a 93). Porovnání dedukovaných aminokyselinových sekvencí ukazuje, významnou podobnost mezi soubory těchto klonů. Vyskytují se zde zejména tři soubory klonů, které se zdají být mezidruhovými homology: RAT-218, MOUSE-322 a HUMAN-43; RAT-314, MOUSE-321 a HUMAN-11; a MOUSE-326 a HUMAN-42.
Příklad 3
Pro zjištění úplné struktury nových proteinů definovaných PCR produkty byly izolovány dvě humánní cDNA o plné délce odpovídající parciálním cDNA HUMAN-42 a HUMAN-43.
Izolace humánních cDNA o plné délce
Humánní fetální mozková cDNA knihovna (Stratagene, La Jolla, Kalifornie, USA) byla v lamdaZapII vektoru podrobena screeningu metodou hybridizace plaků (tato metoda je popsána v publikaci Ausubel et al., Eds. Current Protocols in Molecular Biology, sekce 6.1.1 at 6.1.4 a 6.2.1 až 6.2.3, John Wiley & Sons, New York (1987)) za použití 32P-značených DNA fragmentů HUMAN-42 a HUMAN-43. Pozitivní klony byly plakově purifikovány a za použití pomocného viru byly vyštěpeny inserty metodou in vivo ve formě plazmidu Bluescript SK (+). Sekvence insertu byly potom subklonovány do vektoru Ml3 (Boehringer Mannheim Biochemicals) pro sekvenování. Několik překrývajících se cDNA klonů bylo izolováno, přičemž každá próba obsahovala dvě cDNA obsahující předpokládané úplné kódující sekvence dvou nových proteinů označených názvem protokadherin-42 (pc42) a protokadherin-43 (pc43). Sekvence DNA a dedukovaná aminokyselinová sekvence pc42 jsou uvedeny pod označením SEQ ID NO: 94 a 95, zatímco sekvence DNA a dedukovaná aminokyselinová sekvence pc43 jsou uvedeny pod označením SEQ ID NO: 96 a 97.
Popis klonujících protokadherinových sekvencí podle vynálezu byl publikován v Sáno et al., The EMBO Joumal, 12(6): 2249 až 2256 (1993), tedy po datu podání prioritní přihlášky, o kterou se tento popis opírá. Dedukovaná aminokyselinová sekvence pc43 byla nedávno (9. 12. 1991) zveřejněna na setkání Americké společnosti pro buněčnou biologii (Američan Society for Cell Biology). Abstrakt příslušného vystoupení byl publikován v Suzuki et al., J. Cell. Biol. 115: 72a (Abstrakt 416) (9. prosince 1991).
Analýza humánních klonů o plné délce
Porovnání cDNA sekvencí z pc42 a pc43 o plné délce se sekvencemi různých DNA fragmentů získaných původně pomocí PCR ukazuje, že MOUSE-326 a HUMAN-42 odpovídají části čtvrté extracelulámí subdomény (EC-4) zpc-42; RAT-314, MOUSE-321 a HUMAN-11 odpovídají části třetí extracelulámí subdomény (EC-3) zpc-43 a RAT-218, MOUSE-322 a HUMAN-43 odpovídají části páté extracelulámí domény (EC—5) z pc-43.
Celková struktura pc-42 a pc-43 se podobá struktuře typických kadherinů, ale nové molekuly mají také odlišné znaky. Obě protokadherinové cDNA sekvence obsahují předpokládaná místa iniciace translace a přeložené aminokyselinové sekvence začínají typickými signálními sekvencemi, ale tyto klony neobsahují prosekvence, které jsou přítomny ve všech známých prekursorech kadherinů. cDNA kódují proteiny obsahující N-terminální extracelulámí doménu a poměrně krátkou C-terminální cytoplazmatickou doménu, které jsou spojeny transmembránovou sekvencí. Extracelulámí domény pc-42 a pc-43 mají odlišnou délku a pc-42 obsahuje 7 subdomén, které se velmi těsně podobají typické extracelulámí subdoméně kadherinů. pc-43 obsahuje 6 takových subdomén. Velikosti těchto protokadherinových cytoplazmatických domén jsou podobné typickým kadherinům, ale sekvence nevykazují žádnou významnou homologii se sekvencemi známých kadherinů nebo proteinů příbuzných kadherinů.
Stanovení totožnosti aminokyselin mezi extracelulámími subdoménami humánního pc42 a pc43 a myším N-kadherinem (SEQ ID NO: 98) (který je považován za příklad typického kadherinu) a 18. extracelulámí subdoména supresoru nádoru Drosophila fat (EC-18, SEQ ID NO: 99) (18. extracelulámí subdoména fat je prototypem subdomény fat) jsou uvedeny v tabulce 1, kde například označení „N-EC-1 x pc-42“ znamená, že byla první extracelulámí subdoména Nkadherinu porovnávána s extracelulámí subdoménou pc-42 označenou na horizontální ose.
Tabulka 1
EC-1 EC-2 EC-3 EC-4 EC-5 EC-6 EC-7
N-EC-1 x pc42 20 27 26 26 31 29 17
N-EC-1 xpc43 31 23 23 26 31 24
N-EC-2 x pc42 28 30 32 30 37 31 19
N-EC-2 x pc43 30 28 30 36 29 30
N-EC-3 x pc42 21 26 30 29 31 30 22
N-EC-3 x pc43 25 18 26 28 28 25
N-EC—4 x pc42 28 28 26 25 29 27 17
N-EC-4 x pc43 21 25 28 28 29 24
N-EC-5 x pc42 24 21 25 24 24 19 12
N-EC-5 x pc43 15 21 20 20 25 16
Fat EC-18 x pc42 22 35 32 34 42 35 19
Fat EC-18 x pc43 32 30 36 36 33 29
Stupeň identity aminokyselin mezi extracelulámími subdoménami pc42 a pc43, N-kadherinem EC-1 až EC-5 a Drosophila fat EC-18 je většinou nižší než 40 %. Tento stupeň totožnosti je srovnatelný s hodnotami mezi subdoménami jiných podtříd kadherinu. Vyšší stupně identity ukazují, že pc42 a pc43 jsou příbuznější fat než N-kadherin.
Stanovení totožnosti aminokyselin mezi extracelulámími subdoménami humánního pc42 a pc43 jsou uvedeny v tabulce 2.
Tabulka 2
pc43 EC-1 EC-2 EC-3 EC-4 EC-5 EC-6 EC-7
EC-1 33 27 29 26 25 26 25
EC-2 26 38 29 33 34 28 21
EC-3 26 32 41 30 32 31 22
EC-4 25 34 30 41 39 31 18
EC-5 23 32 29 27 36 34 16
EC-6 25 25 26 25 28 23 26
Stupeň totožnosti mezi příslušnými subdoménami EC-1, EC-2, EC-3, EC-4 a EC-5 a posledními subdoménami pc42 a pc43 je obvykle vyšší než je hodnota získaná při porovnávání protokadherinů s N-kadherinem. Tyto výsledky ukazují, že vzájemná příbuznost pc42 a pc43 je bližší než jejich příbuznost s klasickými kadheriny.
Na obr. 1A až 1C jsou protokadherinové aminokyselinové sekvence podle vynálezu uvedeny v zákrytu s aminokyselinovými sekvencemi N-kadherinu a supresoru tumoru Drosophila fat.
Na obr. 1A až 1C jsou uvedeny v zákrytu dedukované aminokyselinové sekvence extracelulárních subdomén pc42 (EC-1 až EC-7), pc43 (EC-1 až EC-6), myšího N-kadherinu (EC-1 až EC-5) v Drosophila fat EC-18. Sekvence na určitém řádku v obr. 1A pokračuje na stejném řádku v obr. 1B a 1C. Mezery byly zavedeny za účelem maximalizace homologie. Aminokyselinové zbytky popsané velkými písmeny v řádku označeném „MOTIV“ jsou přítomny ve více než jedné polovině subdomén N-kadherinu, pc42 a pc43 a Drosophila fat.
-8CZ 288789 B6
Aminokyselinové zbytky v motivu popsané malými písmeny jsou méně konzervovány v humánním pc42, pc43 a Drosophila fat. Obr. 1A až 1C ukazují, že mnohé aminokyseliny charakteristické pro jiné repetice v extracelulámích doménách kadherinu jsou konzervovány v sekvencích pc43 a pc43 včetně motivů sekvence kadherinu DXD, DRE a DXNDNXPXF (SEQ ID NO: 43), dvou glycinových zbytků a jednoho zbytku kyseliny glutamové. Kromě toho pc42 a pc43 sdílejí jedinečné znaky ve srovnání s N-kadherinem. Mezi pc42 a pc43 je konzervováno více aminokyselin na specifických místech, jako je motiv sekvence protokadherinu DXDXGXN (SEQ ID NO: 100) v blízkosti aminokonce subdomén pc42 a pc43 a motiv sekvence AXDXGXP (SEQ ID NO: 101) v blízkosti karboxylového konce těchto subdomén. Kromě toho oba protokadheriny mají shodné oblasti, které nevykazují významnou homologii s typickým motivem kadherinu (N-kadherinu) v blízkosti karboxylového konce EC-1, uprostřed EC-2 a EC-4 a u karboxylového konce poslední repetice. Cysteinový zbytek je umístěn v podobné poloze uprostřed EC-4 z pc42 a pc43. Obecně jsou extracelulámí subdomény pc42 a pc43 podobnější EC-18 fat než extracelulámí subdomény N-kadherinu.
Možný alternativní sestřih
Analýza sekvence různých překrývajících se cDNA klonů protokadherinu ukázala, že některé klony obsahují jedinečné sekvence u 3' konce, zatímco sekvence u 5' konce jsou totožné s jinými klony. Sekvence vytvářející hranice oblastí u 3' konce jsou konsistentní s konvenční sekvencí sestřihu mRNA, což ukazuje, že tyto klony mohou odpovídat alternativně sestřiženým mRNA. Sekvence DNA a dedukovaná aminokyselinová sekvence jednoho možného produktu alternativního sestřihu pc42 mRNA jsou uvedeny v SEQ ID NO: 102 a 103. Sekvence DNA a dedukovaná aminokyselinová sekvence dvou možných produktů alternativního sestřihu pc43 mRNA jsou uvedeny v SEQ ID NO: 104 a 105 a SEQ ID NO: 106 a 107.
Lokalizace v chromosomu
Umístění genu protokadherinu 413 (SEQ ID NO: 37) a genů pc42 a pc43 bylo stanoveno konvenčními metodami.
V krátkosti lze tento postup charakterizovat takto: myši C3H/HeJ-gld a Mus spretus (Španělsko) a mezidruhově zpětně křížené myši [(C3H/HeJ-gld x Mus spretus) Fj x C3H/HeJ-gld] se rozmnožují a chovají způsobem popsaným v Seldin et al., J. Exp. Med. 167: 688 až 693 (1988). Mus spretus byla zvolena jako druhý rodič při křížení s ohledem na relativní snadnost detekce informativních variant délky restrikčních fragmentů (RFLV) ve srovnání s křížením za použití konvenčních inbredních laboratorních kmenů. Spojení genů bylo stanoveno segregační analýzou.
Genomová DNA izolovaná z myších orgánů standardními technikami byla rozštěpena restrikčními endonukleasami a 10 pg vzorky byly podrobeny elektroforéze na 0,9% agarosovém gelu. DNA byla přenesena na membrány Nytran (Schleicher & Schull, lne., Keene, NH, USA), hybridizována s vhodnou próbou při 65 °C a promyta za stringentních podmínek, vše podle výše uvedené publikace Maniatis et al. Pro lokalizaci genu pc42 bylo použito próby s myší sekvencí odpovídající nukleotidům 1419 až 1906 z SEQ ID NO: 94 a pro lokalizaci genu pc43 bylo použito próby s krysí sekvencí odpovídající nukleotidům 1060 až 1811 z SEQ ID NO: 96. Pro lokalizaci genu prokadherinu 413 bylo použito próby obsahující sekvenci uvedenou v SEQ ID NO: 37. Jiné klony použité jako próby při této studii a různé RFLV použité pro detekci anonymních míst DNA byly všechny dříve popsány [Chromosom 7, segment DNA, Washington 12 (D7Wasl2); parathyroidní hormon (Pth); kalcinonin (Calc.); hemoglobin, βřetězec (Hbb); metallothionein-I (Mt-1); adenin fosforibosyltransferasa (Aprt); receptor růstového hormonu (Ghr); receptor prostaglandinu E subtypu EP2 (Ptgerep2); dihydrofolát reduktasa-2 (Dhfr2); růstový faktor (a) fibroblastů (Fgfa) a receptor-1 glukokortikoidu (Grl-1).
Porovnání hyplotypové distribuce genů protokadherinu s geny určenými pro místa v myším genomu umožnilo umístit tyto geny do specifických oblastí mapy myších chromosomů.
-9CZ 288789 B6
Pravděpodobnost spojení byla vyšší než 99 % a jak gen pro pc42, tak gen pro pc43 byl přidělen do chromosomu 18. Gen protokadherinu 413 byl lokalizován vchromosomu 7. Oblast chromosomu 18, do níž byly zamapovány geny pc42 a pc43 odpovídá místům ataxie (ax) [Buřt, Anat. Rec., 196: 61 až 69 (1980) a Lyon, J. Hered. 46: 77 až 80 (1955) a místům twirler (Tw) [Lyon, J. Embryol. Exp. Morphol., 6:105 až 116 (1958)], zatímco oblast chromosomu 7, do níž byl zamapován gen protokadherinu 413 odpovídá místu shaker (sh-1) [Kikuchi et al., Acta OtoLaryngol., 60: 287 až 303 (1965 a Lord et al., Am. Nat., 63: 453 až 442 (1929)]. Byl učiněn předpoklad, že tato místa se podílejí na dědičné nervově chorobě myši. Tento výsledek je konsistentní s výsledky hybridizace in šitu (viz příklad 12), které ukazují, že pc42 a pc43 jsou silně exprimovány v mozku a zejména v cerebellu.
Příklad 4
Byly připraveny dvě další nové humánní cDNA protokadherinu a za použití fragmentů krysího protokadherinu popsaných v příkladu 1, jako prób, byla izolována jedna další nová krysí protokadherinová cDNA.
Nejprve se krysího klonu RAT-214 (SEQ ID NO: 7) použilo jako próby pro screening krysí mozkové cDNA knihovny (Stratagene, La Jolla, Kalifornie, USA). Poslední promývací stupeň byl proveden 2 x při 50 °C v 0,1 X SSC s 0,1 % SDS během 15 minut. Byly identifikovány různé klony obsahující parciální cDNA inserty kódující příbuzné aminokyselinové sekvence protokadherinu. Nukleotidová sekvence jednoho nového krysího klonu označeného šifrou # 6-2 je uvedena v SEQ ID NO: 108. Prvních 15 nukleotidů SEQ ID NO: 108 představuje sekvenci linkeru, která není součástí krysího klonu # 6-2.
Humánní fetální mozková cDNA knihovna získaná od firmy Stratagene byla podrobena screeningu pomocí 0,7kbp Pstl fragmentu klonu # 6-2. Zdá se, že tento fragment kóduje EC-2 a EC-3 krysího protokadherinu. Po screeningu přibližně 2 x 106 fágů bylo izolováno 11 pozitivních klonů. Sekvenováním těchto klonů byla identifikována nová cDNA humánního protokadherinu o plné délce označená názvem humánní pc3. Nukleotidová sekvence a dedukovaná aminokyselinová sekvence humánního pc3 jsou uvedeny v SEQ ID NO: 109 a 110.
0,7kbp Pstl fragmentu krysího klonu # 6-2 bylo také použito pro nový screening krysí mozkové cDNA knihovny od firmy Stratagene na krysí cDNA klony o plné délce. Byl izolován klon obsahující insert kódující novou protokadherinovou cDNA o plné délce. Nukleotidová sekvence a dedukovaná aminokyselinová sekvence insertu jsou uvedeny v SEQ ID NO: 111 a 112. Krysí cDNA o plné délce byla označena názvem pc5, poněvadž se na základě porovnání sekvencí nezdá být homologickou s humánním klonem pc3.
Pro screening humánní cDNA knihovny od firmy Stratagene na humánní protokadherinové cDNA o plné délce se současně provede pomocí 0,8kbp EcoRI-Pstl fragmentu parciální krysí cDNA označené # 43 (SEQ ID NO; 113), který byl získán screeningem krysí mozkové cDNA knihovny od firmy Stratagene pomocí próby obsahující humánní pc43 cytoplazmatickou doménu. Použitý fragment zřejmě kóduje EC-3 prostřednictvím začátku EC-6 klonu # 43. Jeden identifikovaný parciální klon kóduje nový humánní protokadherin označený názvem humánní pc4. Nukleotidová sekvence a dedukovaná aminokyselinová sekvence humánního klonu pc4 jsou uvedeny v SEQ ID NO: 114 a 115. Aminokyselinová sekvence kódovaná klonem pc4 zřejmě začíná uprostřed EC-2 z pc4 a pokračuje cytoplazmatickou oblastí protokadherinu.
-10CZ 288789 B6
Příklad 5
Humánní cDNA o plné délce kódující pc42 a pc43 byly exprimovány v buňkách (ATCC CCL 1) za použití expresního vektoru pRC/RSV (Invitrogen, San Diego, Kalifornie, USA). Jednotlivé cDNA byly izolovány z klonů Bluescript SK(+) popsaných v příkladu 2 štěpením SspI a následujícím tupým zakončením pomocí DNA polymerázy a štěpením pomocí Xbal (pro pc42) nebo dvojnásobným štěpením pomocí Spěl a EcoRV (pro pc43). Expresní vektor pRC/RSV byl rozštěpen HindlII a poté bylo provedeno zakončení tupými konci a nové štěpení Xbal za účelem vložení sekvencí pc42 nebo byl rozštěpen Xbal, poté bylo provedeno zakončení tupými konci a dále následovalo nové štěpení s Spěl za účelem vložení sekvencí pc43. Izolované protokadherinové DNA byly ligovány do linearizovaného vektoru pRC/RSV. Výsledný expresní plazmid pc42 označený zkratkou pRC/RSV-pc42 (ATCC 69162) a expresní plazmid pc43 označený zkratkou pRC/RSV-pc43 (ATCC 69163) byl purifíkován odstřeďováním s gradientem chloridu česného a transfekován do L-buněk Ca-fosfátovou metodou.
Transfektanty pc42 a pc43 jsou morfologicky podobné rodičovským buňkám. Analýza Northem blot L-buněk transfekovaných sekvencemi DNA pc42 nebo pc43 ukázala, že transfekované buňky exprimují mRNA s očekávanými velikostmi pro kódování příslušných protokadherinů.
Příklad 6
Byly generovány králičí polyklonální protilátky specifické pro pc42 a pc43 a dále též myší monoklonální protilátka specifická pro pc43.
Příprava polyklonálních protilátek specifických pro pc42 a pc43
Sekvence DNA kódující části extracelulámí domény pc42 a pc43 byly fúzovány se sekvencí kódující protein vázající maltosu a exprimovány v bakterii. Konkrétně byly pomocí PCR připraveny DNA odpovídající EC-4 až EC-7 z pc42 a EC-3 až EC-5 z pc43 a subklonovány ve správném čtecím rámci do multiklonovacího místa expresního vektoru pMal (New England Biolabs, Beverly, Massachusetts USA), který obsahuje sekvence kódující protein vázající maltosu umístěné bezprostředně před multiklonovacím místem. Výsledné plazmidy byly potom zavedeny do buněk E. coli NM522 (Invitrogen, San Diego, Kalifornie, USA) jednostupňovou transformační metodou. Exprese fúzovaných proteinů byla indukována přídavkem IPTG a fúzované proteiny byly purifikovány z buněčných extraktů afinitní chromatografií na amylosové pryskyřici (New England Biolabs) podle instrukcí výrobce. Fúzovaných proteinů bylo potom bez další purifikace použito pro imunizaci králíků.
Polyklonální prostředky byly připraveny v králících imunizací ve čtyřech subkutánních místech za použití 500 pg purifikovaného fúzovaného proteinu ve Freundově úplném adjuvans. Následující očkování za použití 100 pg fúzovaného proteinu bylo prováděno ve Freundově neúplném adjuvans. Imunní sérum bylo necháno projít přes Sepharose s kopulovaným proteinem vázajícím maltosu (New England Biolabs) a polyklonální protilátky byly purifikovány z imunního séra za použití afinitních sloupců Sepharose připravených reakcí purifikovaného fúzovaného proteinu s CNBr Sepharose (Pharmacia). Byla potvrzena reaktivita polyklonálního séra s purifikovaným fúzovaným proteinem pc42 a extrakty buněk transfekovaných pc42 (viz příklad 5).
Příprava monoklonálních protilátek specifických pro pc43
Fúzovaného proteinu pc43 (obsahující subdoménu pc43 EC-3 až EC-5) bylo použito pro vytvoření monoklonálních protilátek v myších způsobem popsaným vKennett, Methods in Enzymol., 58: 345 až 359 (1978). Použitý postup lze v krátkosti popsat takto: myši byly imunizovány fúzovaným proteinem pc43 (100 pg) ve dvou subkutánních místech. Slezina z myši
-11CZ 288789 B6 snejvyšším titrem byla fúzována k buněčné linii myelomu NS1. Supematanty výsledného hybridomu byly podrobeny screeningu pomocí stanovení ELISA na reaktivitu s fúzovaným proteinem pc43 a proteinem vázajícím maltosu. Obsah jamek s fúzovaným produktem s nejvyšší reaktivitou vůči extracelulámím doménám pc43 byl subklonován. Buněčná linie hybridomu označená zkratkou 38I2C (ATCCHB 11207) produkovala monoklonální protilátku specifickou pro pc43 podtypu IgG]. Reaktivita monoklonální protilátky produkované hybridomovou buněčnou linií 38I2C vůči pc43 byla potvrzena imunoblotováním transfektantů L-buněk pomocí pc43 (viz příklad 5). Monoklonální protilátka 38I2C je specifická pro humánní pc43.
Příklad 7
L-buňky transfekované sekvencemi DNA kódujícími pc42 a pc43 vyrobené způsobem podle příkladu 5 byly zkoušeny na expresi protokadherinů imunoblotovou a imunofluorescenční mikroskopií.
Imunoblotovaná analýza
Extrakty z buněk transfekovaných pc42 a pc43 byly podrobeny zpracování SDS-PAGE a potom elektroforeticky blotovány na membránu zPVDF (Millipore, Bedford, Massachusetts, USA). Membrány byly inkubovány s 5% odstředěným mlékem v Tris-pufrovaném roztoku chloridu sodného (TBS) po dobu 2 hodin a potom buď s polyklonálním sérem pc42 nebo monoklonální protilátkou pc43 po dobu 1 hodiny. Potom byly membrány 3 x promyty (vždy 5 minut) pomocí TBS s obsahem 0,05 % smáčedla Tween20 inkubovány s konjugátem alkalické fosfatázy buď s anti—králičí IgG protilátkou (v případě pc42), nebo protimyší IgG protilátkou (v případě pc43) (Promega, Madison, Wisconsin, USA) ve stejném pufru po dobu 1 hodiny. Po promytí membrán TBS s obsahem 0,05 % Tween 20 byly reaktivní pásy vizualizovány za použití roztoku Western Blue (Promega).
Anti-pc42 polyklonální protilátky vybarvily pás o molekulové hmotnosti asi 170 kDa vpc42transfekovaných buňkách, ale nikoliv v rodičovských L-buňkách. pc43-Specifická monoklonální protilátka (38I2C) a polyklonální protilátky vybarvily dva sousední pásy o molekulové hmotnosti asi 150 kDa vpc43 transfekovaných buňkách. pc43 Protilátky neobarvily pásy v rodičovských L-buňkách. Hodnoty molekulové hmotnosti zjištěné pomocí vybarvení pásů pc42 a pc43 protilátkami jsou podstatně vyšší než předvídané hodnoty molekulové hmotnosti pro dedukované aminokyselinové sekvence. Tento rozdíl v molekulové hmotnosti je mezi různými proteiny příbuznými kadherinu obvyklý a je možno ho vysvětlit glykosylací a/nebo kadherin-specifickými strukturními vlastnostmi. pc42 Protilátka také obarvila menší pásy, což mohou být proteolytické degradační produkty.
Transfekované buňky byly zpracovány trypsinem a byl z nich vyroben buněčný extrakt. Tento extrakt byl zpracován metodou SDS/PAGE a imunoblotován s vhodnou protilátkou. Bylo zjištěno, že exprese polypeptidů pc42 a pc43 transfekovanými buňkami je vysoce citlivá k proteolýze, přičemž působením 0,01% trypsinu došlo snadno ke štěpení těchto polypeptidů. Na rozdíl od klasických kadherinů však tyto proteiny nejsou chráněny před štěpením za přítomnosti 1 až 5mM koncentrace vápenatých iontů.
Imunofluorescenční mikroskopie
Transfekované buňky byly pěstovány na krycím proužku předem potaženém fíbronektinem a byly fixovány 4% paraformaldehydem 5 minut při teplotě místnosti nebo chladným methanolem na ledu po dobu 10 minut s následnou fixací 4% paraformaldehydem. Buňky byly promyty TBS a potom inkubovány s TBS s obsahem 1 % BSA po dobu 30 minut a potom s polyklonální protilátkou anti-pc42 nebo monoklonální protilátkou anti-pc43 v TBS s obsahem 1 % BSA 1 hodinu při teplotě místnosti. Krycí proužky potom byly opláchnuty pomocí TBS s obsahem
-12CZ 288789 B6
0,01% BSA a inkubovány s FITC-konjugovanou protikráličí protilátkou nebo protimyší protilátkou (Cappel, Durham, North Carolina, USA) po dobu 60 minut při teplotě místnosti. Buňky byly znovu promyty TBS s obsahem 0,01 % BSA a potom podrobeny fluorescenční mikroskopii. Jak pc42-specifická, tak pc-43-specifická polyklonální protilátka barvily obvod transfekovaných buněk exprimujících protokadherinové proteiny, zejména v místech vzájemného styku buněk. Protilátky nebarvily rodičovské L-buňky a ani králičí preimunní sérum nebarvilo pc42 a pc43 transfektanty.
Příklad 8
Byly zkoumány agregační vlastnosti transfekovaných L-buněk exprimujících protokadherinové proteiny. Transfekované L-buňky byly kultivovány vDulbeccem modifikovaném Eaglesově médiu (DMEM) (Gibco, Grand Island, New York, USA) doplněném 10 % fetálního hovězího séra při 37 °C v atmosféře obsahující 5 % oxidu uhličitého. Buňky narostlé do blízkosti konfluence byly zpracovány 0,01% trypsinem za přítomnosti lmM EGTA 25 minut v rotační třepačce při 37 °C a potom byly shromážděny centrifugách Buňky byly promyty třikrát HEPESpufrovaným roztokem chloridu sodného bez vápenatých iontů (HBS), potom byl přidán inhibitor sójového trypsinu a buňky byly resuspendovány v HBS s obsahem 1 % BSA. Zkouška agregace buněk (Urushihara et al., Dev. Biol., 70: 206 až 216 (1979)) byla prováděna inkubací resuspendovaných buněk ve směsi DMEM a HBS s obsahem 1 % BSA, 2mM chloridu vápenatého a 20 pg/ml deoxyribonukleasy (poměr DMEM : HBS je 1 : 1) v rotační třepačce při 37 °C po dobu 30 minut až 6 hodin.
pc42 a pc43 transfektanty nevykazovaly žádnou významnou aktivitu agregace buněk při inkubaci prováděné kratší dobu než 1 hodinu. Tento výsledek kontrastuje s agregací buněk, k níž dochází při podobných experimentech za použití klasických kadherinů (Nagafuchi et al., výše uvedená citace a Hatta et al., výše uvedená citace). Při prodloužené inkubaci transfekovaných buněk (po dobu delší než 1 až 2 hodiny) docházelo k postupné reagregaci buněk do malých agregátů. Podobných výsledků bylo dosaženo v případě, že byly suspenze jednotlivých transfekovaných buněk připraveny zpracováním trypsinem za přítomnosti vápenatých iontů. Žádná reagregace nebyla pozorována za stejných podmínek v případě zkoušení netransfekovaných L-buněk nebo L-buněk transfekovaných samotným vektorem pRC/RSV. Pokud byly pc43 transfektanty označené DiO (Molecular Probes, Eugene, OR, USA) inkubovány s neznačenými pc42 transfektanty při zkoušce agregace buněk, byly vzájemná agregace značených a neznačených buněk téměř vyloučena, což ukazuje, že vazba protokadherinu je homofilní.
S ohledem na skutečnost, že cytoplazmatické domény protokadherinu nevykazují zřejmou homologii s doménami kadherinů, byly provedeny pokusy, jejichž cílem bylo zjistit, zda rozdíl v cytoplazmatických doménách může být příčinou rozdílů v aktivitě při agregaci buněk, které byly pozorovány u kadherinových a protokadherinových transfektantů. Cytoplazmatická doména v pc43 byla nahrazena cytoplazmatickou doménou E-kadherinu a byla analyzována agregace buněk transfekovaných tímto chimérickým konstruktem.
Klon Bluescript SK(+) popsaný v příkladu 2 obsahující celou kódující sekvenci pc43 byl štěpen EcoRV a potom částečně štěpen Xbal za účelem odstranění sekvence odpovídající cytoplazmatické doméně. Plazmidová DNA byla purifikována elektroforézou na agarosovém gelu. Byla syntetizována cDNA odpovídající cytoplazmatické doméně myšího E-kadherinu technikou PCR za použití myší cDNA získané zmRNA z myších plic, jako templátu a specifických primerů odpovídajících oblasti blízké N-konci sekvence cytoplazmatické domény nebo oblasti obsahující stop kodon myšího E-kadherinu (Nagafuchi et al., výše uvedená citace).
Sekvence Xbal byla zahrnuta u 5' konce předního primeru. cDNA E-kadherinové cytoplazmatické domény byla potom subklonována do linearizovaného klonu pc43 Bluescript. DNA obsahující celou výslednou chimérickou sekvenci byla vyštěpena pomocí Spěl a EcoRV a
-13CZ 288789 B6 subklonována do Spel-otupeného místa Xbal expresního vektoru pRC/RSV. Nakonec byly Lbuňky transfekovány výsledným konstruktem za použití kalciumfosfátové metody. Po asi 10 denním screeningu za použití G418 byly transfektanty obarveny FITC-značenou 38I2C antipc43 protilátkou a podrobeny analýze FACS. Část vysoce značených buněk byla izolována a klonována. Transfektanty vykazovaly morfologii podobnou morfologii rodičovských buněk a exprimovaný protein byl lokalizován na obvodu buněk za použití pc43 protilátky při imunofluorescenční mikroskopii.
Agregace buněk, tj. získaných chimérických transfektantů byla analyzována takto: chimérické pc43 transfektanty byly označeny DiO 20 minutovým zpracováním při teplotě místnosti. Získané buňky byly zpracovány trypsinem za přítomnosti lmM EGTA a byly převedeny na suspenzi jednotlivých buněk. Potom byly buňky smíchány s neznačeným jiným typem transfektantů a 2 hodin inkubovány v rotační třepačce. Výsledky byly zjišťovány mikroskopicky na základě fluorescence a kontrastu fází. Inhibice protilátky při agregaci buněk byla zkoumána inkubací transfektantů za přítomnosti polyklonální anti-pc43 protilátky (lOOng/ml) ve standardním zkouškovém médiu.
Při zkoušce agregace buněk vykazovaly chimérické pc43 transfektanty jasnou Ca2+-dependentní agregaci buněk do 40 minut inkubace. Agregace buněk byla inhibována přídavkem pc43 specifické polyklonální protilátky.
Příklad 9
Pro stanovení Ca2+-dependentních vazebných vlastností pc43 analýzou Western blot za přítomnosti nebo nepřítomnosti vápníku-45 bylo použito postupů popsaných v Maruyama et al., J. Biochem. 95: 511 až 519 (1984). pc43 fúzovaný protein popsaný v příkladu 6 obsahující subdomény EC-3 až EC-5 z pc43 byl porovnáván s proteinem vázajícím vápník, kalmodulinem. Vzorky purifikováného pc43 fúzovaného proteinu byly zpracovány na SDS/PAGE a elektroforeticky přeneseny na membránu zPVDF. Vazba 45Ca2’ kpc43 fúzovanému proteinu byla detegována autoradiografíí a zjistilo se, že je téměř tak silná jako vazba 45Ca2+ ke kalmodulinu. Naproti tomu nedošlo k žádné vazbě vápníku k purifikovanému proteinu vázajícímu maltosu, který neobsahuje pc43 extracelulámí doménu. Subdomény EC-3 až EC-5 z pc43 obsahující sekvence, které jsou vysoce homologické s předpokládanými Ca2+-vazebnými motivy vyskytujícími se v E-kadherinu (viz Ringwald et al., EMBO, J., 6: 3647 až 3653 (1987)).
Příklad 10
Byla sledována exprese mRNA kódující pc42 a pc43 v různých tkáních a buněčných liniích pomocí analýzy Northem blot.
Úplné RNA byly připraveny guanidiumisothiokyanátovou metodou a poly(A)+RNA byly izolovány za použití soupravy FastTrack® (Invitrogen, San Diego, Kalifornie, USA). Přípravky RNA byly podrobeny elektroforéze na 0,8% agarosovém gelu za denaturačních podmínek a přeneseny na nitrocelulosový filtr kapilární metodou. Analýzy Northem blot byly prováděny způsobem popsaným v Thomas, Proč. Nati. Acad. Sci. USA, 77: 5201 až 5205 (1980). Poslední promývání bylo prováděno 0,2 X standardním citrátovým roztokem chloridu sodného s obsahem 0,1 % dodecylsulfátu sodného při 65 °C po dobu 10 minut.
Exprese mRNA protokadherinu v tkáních dospělých krys
Přípravky celkové mRNA z krysích tkání (z mozku, srdce, jater, plic, kůže, ledvin a svalů) byly odděleny elektroforeticky za denaturačních podmínek (10 μg mRNA/dráha) a přeneseny na nitrocelulosové filtry. Filtry byly hybridizovány s 32P-značenými cDNA fragmenty MOUSE-326
-14CZ 288789 B6 (které odpovídají EC-4 humánního pc42) a RAT-218 (které odpovídají EC-5 humánního pc43), mRNA obou protokadherinů byly intenzivně exprimovány v mozku. Pomocí pc42 próby byl detegován hlavní pás o velikosti 7 kb a menší pás o velikosti 4 kb, které pravděpodobně představují produkty alternativního sestřihu. pc43 próba se hybridizovala s hlavním pásem o velikosti 5 kb a s menšími pásy o menších velikostech.
Vývojová exprese mRNA protokadherinů v krysím mozku
Pro stanovení vývojové regulace exprese mRNA protokadherinů byla připravena mRNA z mozku krysích embryí o stáří 17 až 20 dnů, neonatálních krys o stáří 5 a 11 dnů a z dospělých krys a podrobena analýze Northem blot popsané výše pro jiné krysí tkáně. Jako vnitřního standardu bylo použito β-aktinu. Hladina mRNA pro pc42 a pc43 proteiny se zvyšovala v průběhu embryonálního vývoje mozku ve srovnání s expresí β-aktinu.
Exprese mRNA protokadherinů v humánních buněčných liniích
Několik neuronálních a gliálních buněčných linií (včetně buněčných linií z humánního SK-NSH neuroblastomu, humánního U251 gliomu a myšího Neuro-2a neuroblastomu) bylo analyzováno metodou Northem blot za použití 32P- značení pro expresi pc42 a pc43 mRNA. Humánní buněčné linie byly podrobeny zkoumání za použití cDNA fragmentové próby HUMAN-42 (která odpovídá EC-4 humánního pc42) a HUMAN-43 (která odpovídá EC-5 humánního pc43). Myší buněčná linie byla zkoumána pomocí cDNA fragmentové próby MOUSE-326 (která odpovídá EC-4 humánního pc42) a RAT-322 (která odpovídá EC-5 humánního pc43). Zjistilo se, že buňky SK-N-SH humánního neuroblastomu a buňky U-251 humánního gliomu exprimují pc43 mRNA a dále že buňky Neuro-2a myšího neuroblastomu exprimují mRNA pc42.
Příklad 11
Exprese proteinu pc43 v různých tkáních, extraktech a buňkách byla zkoumána analýzou Western blot a imunofluorescenční mikroskopií.
Exprese v extraktech krysího srdečního svalu
Extrakt z krysího srdce získaný za použití neiontového detergentu byl připraven zmrazením vyjmutého srdce v kapalném dusíku, zpracováním na prášek v třecí misce, krátkým rozmělňováním v zařízení Polytron za použití 0,5% Nonidetu P40 v lOmM PIPES o pH 6,8 (50mM chlorid sodný, 250mM síran amonný, 300mM sacharosa, 3mM chlorid hořečnatý) a odstředěním v mikrocentrifuze. Vzorky byly odděleny metodou SDS/PAGE a elektroforeticky přeneseny na nitrocelulosu (Towbin et al., PNAS 76: 4350 až 4354 (1979)). Dva pásy pc43 proteinu o molekulových hmotnostech 150 kDa a 140 kDa byly detegovány za použití králičích polyklonálních protilátek vůči pc43 imunoblotovou metodou popsanou v příkladu 7.
Exprese v tkáňových řezech a buňkách
Pro lokalizaci protokadherinů v různých tkáních byly dospělým lidem a krysám odebrány tkáně, a tyto tkáně byly inkubovány v 30% sacharose v PBS po dobu 30 minut při 4 °C, uloženy do látky OCT Compound (Tissue - Tek, Elkhart, Indiana, USA) v kryoformách a rychle zmrazený. Dále byly vyroben 6pm řezy, které byly umístěny na preparační sklíčka. Sklíčka byla opláchnuta PBS a fixována 3% p-formaldehydem po dobu 5 minut. Sklíčka byla na 10 minut ponořena do acetonu o teplotě -20 °C a potom usušena na vzduchu, aby došlo k permeabilizaci tkáňových řezů. Řezy byly blokovány 2% kozím sérem a 1% BSA v PBS po dobu 30 minut a potom inkubovány s králičím anti-pc43 polyklonálním antisérem 1 hodinu při teplotě místnosti. Potom byly řezy 3 x opláchnuty PBS s obsahem 0,1 % BSA a inkubovány s biotinylovaným antikráličím
-15CZ 288789 B6 (Vector Laboratories, Burlingame, Kalifornie, USA) v 1% BAS vPBS po dobu 30 minut. Po trojnásobném opláchnutí byl na dobu 30 minut přidán strepavidin konjugovaný s FITC (Vector Laboratories) a preparát byl znovu třikrát opláchnut. Pro ko-lokalizační studie bylo použito vhodné primární protilátky s TRITC-konjugovanou sekundární protilátkou.
A. Sval
Imunolokalizace pc43 v krysím srdečním svalu ukazuje, že pc43 je umístěn v podobě repetic, což je konsistentní s asociací pc43 se sarkomery. Sarkomery jsou opakující se kontraktilní jednotky mezi fascia adherens v kosterním a srdečním svalu. Ko-lokalizace s cytoskeletálními proteiny ukazuje, že pc43 je přítomen na koncích sarkomerů v liniích Z, které jsou asociovány s desminem a proteinem vázajících aktin, vinkulinem, jakož i α-aktininem. Tenká mikrovlákna F-aktinu jsou asociovány s tlustými vlákny myosinu mezi liniemi Z. Naproti tomu N-kadherin je umístěn na koncích srdečních myocytů u spojení fascia adherens na místech styku myocytmyocyt. Umístění pc43 v srdečním svalu ukazuje, že pc43 může hrát určitou roli při kontrakci svalu při kotvení kontraktilního aparátu k plazmatické membráně.
Podobné umístění pc43 bylo pozorováno u krysího kosterního svalu. Ultrastruktumí studie ukázaly, že dystrofm, což je genový produkt chybějící při Duchennebo muskulámí dystrofíi, je složkou sarkolemu (Porter et al., J. Cel. Biol., 117: 997 až 105 (1992)). Sarkolem je připojen ke kontraktilnímu aparátu v liniích M a Z, kde je umístěn pc43.
B. Mozek
Reaktivita anti-pc43 polyklonální protilátky vůči zmrazenému řezu krysího cerebella a reaktivita monoklonální protilátky 38I2C vůči zmrazenému řezu humánního cerebella ukazuje, že hlavní místa exprese pc43 jsou v Purkyněho buňkách a v granulované buněčné vrstvě obsahující četné malé neurony.
C. Placenta
Silná reaktivita monoklonální protilátky 38I2C s humánními syncytiotrofoblasty byla také pozorována při vývoji placenty v časných stádiích (5 až 7 týdnů těhotenství). Ukázalo se, že exprese postupně klesá, což naznačuje, že pc43 se může podílet na implantaci oplodněných vajíček v placentě.
D. Buňky neuroblastomu a astrocytomu
Imunocytochemická lokalizace pc43 v buňkách Sk-N-SH neuroblastomu a buňkách UW28 atrocytomu za použití anti-pc43 protilátek ukazuje bodové rozdělení pc43 na povrchu buněk. V některých buňkách je pc43 umístěn na konci spodních výběžků neuronů. V místech styku buňka-buňka u buněk astrocytomu UW28 je pc43 organizován v řadě rovnoběžných linií. Tyto linie začínají v místě styku a zasahují přibližně do vzdálenosti 5 gm. Pomocí rhodaminfalloidinu (Molecular Probes, Eugene, Oregon, USA), použitého podle instrukcí výrobce, byla identifikována mikrovlákna F-aktinu, což ukazuje, že mikrovlákna v buňce zřejmě končí v lineárních strukturách pc43 protažených od okraje buněk v místech vzájemného styku buněk.
Imunoblotové studie za použití pc43 specifických protilátek ukázaly, že protein s molekulovou hmotností 140 kDa je rozpoznáván v humánních buňkách neuroblastomu Sk-N-SH a buňkách astrocytomu UW28.
E. Osteoblasty
Imunocytochemická lokalizace pc43 za použití monoklonální protilátky 38I2C v buněčných liniích humánního ostogenního sarkomu [SaOs (ATCC HTB 85) a MG-63 (ATCC CRL 1427)] a
-16CZ 288789 B6 v kulturách normálních humánních trabekulámích osteoblastů [tento kultivační systém je popsán vCivitelli et al., J. Clin. Invest. 91: 1888 až 1896 (1993)] ukazuje, že pc43 se exprimuje v osteoblastech způsobem, který se podobá expresi pozorované v buňkách astrocytomu UW28. V místech styku buňka-buňka je pc43 organizován v řadách rovnoběžných linií, které zřejmě odpovídají napěťovým vláknům aktinu. Kromě toho v některých buňkách se zdá být pc43 umístěn na koncích stýkajících se výběžků buněk. Analýzy Northem blot poskytuje další důkaz, že se pc43 exprimuje v normálních humánních trabekulámích osteoblastech. Ve vzorcích poly-A mRNA izolované z normálních humánních trebekulámích osteoblastů se próba pc43-specifické DNA hybridizuje s hlavním pásem o velikosti 5 kb.
Příklad 12
Na kryořezech krysí tkáně byly provedeny pokusy s in šitu hybridizací za použití protokadherinspecifických RNA, jako prób.
Standardním postupem popsaným vPromega (Madison, Wisconsin, USA) byly vyrobeny negativní a pozitivní 35S-ribopróby. Jako pc42-specifické próby bylo použito přibližně 400bp fragmentu EcoRI-Xbal z myšího cDNA klonu MOUSE-326. Tento fragment kóduje prostřední část EC-3 až ke konci EC-4 v pc42. Jako pc43-specifícké próby bylo použito přibližně 700bp fragmentu Smál z cDNA klonu RAT-218. Tento fragment kóduje konec EC-3 až ke konci EC-5 v pc43.
Dospělým krysám byly odebrány vhodné tkáně a ihned uloženy do látky OCT Compound (Tissue-Tek) v kryoformách a rychle zmrazený v lázni z 95% ethanolu a suchého ledu. Zmrazené bloky byly uchovávány při -80 °C až do přípravy řezů. Za použití kryostatu (Reichert - Jung, Model # 2800 Frigocut N, Leica, lne., Gilroy, Kalifornie, USA) byly zhotoveny 6pm tkáňové řezy. Tkáňové řezy byly skladovány při -80 °C.
Použitý in šitu protokol představuje obměnu protokolu popsaného v Angerer et al., Methods in Enzymology, 152: 649 až 660 (1987). Všechny roztoky byly zpracovány diethylpyrokarbonátem (DEPC, Sigma, St. Louis, Missouri, USA), za účelem odstranění kontaminace RNasou. Tkáňové řezy byly nejprve fixovány 4% paraformaldehydem 20 minut při 4 °C. Nadbytek paraformaldehydu byl odstraněn a zastavení fixace tkáně bylo provedeno opláchnutím preparátů na sklíčcích v PBS (fosfátem pufrovaný roztok chloridu sodného) a potom byla provedena denaturace pomocí alkoholu s odstupňovanou koncentrací (70, 95 a 100 %) a vysušení. Aby se zabránilo uvolnění tkáně ze sklíčka v průběhu in šitu postupu, byly tkáňové řezy ošetřeny roztokem poly-L-lysinu (Sigma) při teplotě místnosti během 10 minut. Denaturace veškeré RNA vtkáni byla provedena umístěním řezů do roztoku 70% formamidu/2X SSC (0,15M chlorid sodný/0,3M citran sodný, pH 7,0) o teplotě 70 °C na dobu 2 minut, načež byly preparáty opláchnuty vychlazeným 2X SSC, odvodněny v alkoholu s odstupňovanou koncentrací a vysušeny. Po vysušení byly řezy prehybridizovány v hybridizačním pufru [50% formamid/50mM DTT (dithiothreitol)/0,3M chlorid sodný/20mM Tris, pH 8,0/5mM EDTA/1X Denhardt (0,02% Ficoll Typu 400/0,02% polyvinylpyrrolidon/0,02% BSA)/10% Dextran Sulfáte] při konečné hybridizační teplotě po dobu asi 4 hodin. Po prehybridizaci bylo ke každému řezu přidáno přibližně 1 x 106 cpm příslušného ribopróby. Řezy byly obvykle hybridizovány při 45 °C přes noc (12 až 16 hodin). Pro zajištění specifičnosti pozorované hybridizace byla v některých pokusech hybridizační stringence zvýšena zvýšením hybridizační teploty na 50 °C. Vzhledem k tomu, že pokusy při 45 a 50 °C poskytly srovnatelné výsledky, bylo používáno standardní hybridizační teploty 45 °C.
Pro odstranění nadbytku nehybridizované próby byly řezy podrobeny sérii promývání. Nejprve byly řezy promyty v 4X SSC, aby se odstranila hlavní část hybridizačního roztoku a próby. Potom následovalo 15-minutové promývání v 4X SSC/50mM DTT při teplotě místnosti. Také bylo použito promývání se zvyšující se stringencí. Po 40-minutovém promývání v 50% formamidu/2X SSC/50mM DTT při 60 °C následovalo čtyřnásobné promývání při teplotě
-17CZ 288789 B6 místnosti (vždy 10 minut), a to 2promývání za použití 2X SSC a 2 promývání za použití O,1XSSC. Promyté preparáty byly odvodněny v alkoholu s odstupňovanou koncentrací a vysušeny.
Pro vizualizaci hybridizované próby byly preparáty máčeny v emulzi Kodak NTB2 Nuclear Emulsion (Intemational Biotechnology, New Haven, Connecticut, USA) zředěné v poměru 1 : 1 dH2O. Po vysušení byly preparáty uloženy při 4 °C ve světlotěsných krabicích po vhodnou dobu expozice. In šitu preparáty byly nezávisle vizuálně vyhodnocovány dvěma osobami, přičemž byly klasifikovány jako pozitivní nebo negativní, pokud se týče přítomnosti hybridizačního 10 signálu.
Všechny in šitu hybridizační studie byly prováděny na kiysí tkáni. Jelikož výsledky pokusů Northem blot (viz příklad 9) ukázaly, že v mozku dospělých se exprimuje jak pc42, tak pc43, byly in šitu hybridizační studie zaměřeny na lokalizaci exprese těchto molekul ve specifických 15 typech mozkových buněk. Hybridizace pozorovaná v mozku normální dospělé krysy byly specifická (nebyla pozorována žádná hybridizace pozadí s negativními próbami) a vyskytovala se ve specifických oblastech mozku. Celkové rozložení exprese pozorované u pc42 a pc43 bylo velmi podobné, přičemž hlavní rozdíl byl v úrovni exprese. pc43 se zdá být exprimován na nižší úrovni než pc42. Obě molekuly jsou exprimovány v germinálních a pyramidálních buňkách 20 hypokampu, Purkyněho buňkách v cerebellu a neuronech v šedé hmotě. pc42 je kromě toho exprimován v gliálních buňkách v bílé hmotě, ale na rozdíl od exprese pc43 v buněčných liniích gliomu (viz příklad 9) exprese pc43 v normálních gliálních buňkách nebyla pozorována. V míše jsou oba protokadheriny exprimovány v motorických neuronech šedé hmoty a pc42 je exprimován v gliálních buňkách bílé hmoty.
Když byla analyzována exprese obou protokadherinových molekul v mozku a míše krysy postižené EAE (exprimentální alergická encefalomyelitis) [Vandenbark et al., Cell. Immunol. 12: 85 až 93 (1974)] byly jako pozitivní nalezeny stejné struktury jaké jsou popsány výše. Kromě toho byla exprese pc42 pozorována v leukocytických infiltrátech v EAE tkáních. Exprese pc42 30 v leukocytech byla potvrzena in šitu hybridizační analýzou dvou leukocytických buněčných linií,
RBL-lay3.
Exprese obou protokadherinů, tj. pc42 a pc43 byla pozorována ve vyvíjejícím se mozku krysích embryí, a to ve všech zkoušených stádiích embryonálního vývoje, tj. 15. až 19. dne (El5 až El9). 35 Protokadherin 43 byl kromě toho pozorován v krysím srdci, a to ve všech zkoušených stádiích embryonálního vývoje (E13 až E19). Toto zjištění je konsistentní s imunohistochemickými výsledky, které potvrzují expresi protokadherinů 43 v dospělém srdci.
Pro stanovení možných rolí protokadherinů při vývoji nervového systému byly také in šitu 40 hybridizací zkoumány expresní profily protokadherinových členů ve vyvíjejícím se krysím mozku a dospělém mozku krysy. Série koronálních, sagitálních a horizontálních řezů krysího mozku v postnatálních dnech 0, 6, 14 a 30 (PO až P30) a ve stáří 3 měsíců (mladý dospělec) byly hybridizovány se značenými cRNA próbami odpovídajícími různým protokadherinům podle vynálezu, včetně pc42, pc43, RAT-212, RAT-411 a RAT-418. Ve vyvíjejícím se mozku byl 45 RAT-411 exprimován na vysoké úrovni v neuronech bulbus olfactorius, tj. mitrálních buňkách a periglomerulámích buňkách. Exprese RAT-411 mRNA byla transientní; exprese v mozku byla pozorována v PO, nej vyšší hodnoty bylo dosaženo v P6, v P14 bylo pozorováno snížení a v P30 a u dospělce již tato exprese nebyla detegovatelná. V dospělém mozku byla exprese pc43 mRNA zjištěna převážně v Purkyněho buňkách v cerebellu. Exprese pc42 mRNA v Purkyněho buňkách 50 byla pozorována od počátku diferenciace Purkyněho buněk okolo dne P6. Jiné protokadherinové molekuly byly exprimovány ve velmi nízké koncentraci v různých oblastech vyvíjejícího se a dospělého mozku. Tyto výsledky ukazují, že protokadheriny jsou různým způsobem exprimovány v průběhu vývoje centrálního nervového systému a ukazuje se, že RAT-411 má specifickou roli při vývoji neuronů bulbus olfactorium a pc43 má specifickou roli při vývoji 55 Purkyněho buněk.
-18CZ 288789 B6
Příklad 13
Pro identifikaci proteinů interagujících s pc43 v transfektantech L-buněk byly provedeny konvenční imunoprecipitace za použití pc43-specifických polyklonálních protilátek a monoklonální protilátky 38I2C.
pc43 a chimérické pc43-transfektanty byly metabolicky označeny inkubací těchto buněk v Dulbeccem modifikovaném Eaglově médiu obsahujícím [35S]methionin (50 pCi/ml) přes noc. Po promytí byly transfektanty lyžovány PBS s obsahem Tritonu XI00 a inkubovány s anti-pc43 protilátkou. Shromáždění imunokomplexů bylo provedeno za použití Sepharosových perel s proteinem A. Výsledné perly byly 5 x promyty promývacím pufrem (50mM Tris-HCl o pH 8,0 s obsahem chloridu sodného (0,5M), ovalbuminu (0,1%), NP-40 (0,5%). Tritonu XI00 (0,5%) a EDTA (lmM)) při teplotě místnosti. Protein byl oddělen metodou SDS/PAGE a podroben autoradiografii.
Chimérický pc43 se společně vysrážel se 105kDA a 95kDa pásem, které pravděpodobně odpovídají jednak α-kateninu (105kDa) a jednak β-kateninu (96kDa), poněvadž anti-p-kateninové a anti-fL-kateninové protilátky barví srovnatelné pásy. pc43 se naproti tomu společně vysrážel se 120kDa pásem.
Vynález byl sice popsán na specifických postupech a látkách, ale je samozřejmé, že do rozsahu ochrany spadají i nejrůznější obměny a modifikace, které jsou v rozsahu zkušeností odborníků v tomto oboru. Pro rozsah vynálezu jsou rozhodující přiložené nároky.
Seznam sekvencí (1) OBECNÉ INFORMACE:
(i) PŘIHLAŠOVATEL: Suzuki, Shintaro (ii) NÁZEV VYNÁLEZU: Protocadherin Materials and Methods (Protokadherinové látky a jejich použití) (iii) POČET SEKVENCÍ: 115 (iv) ADRESA PRO KORESPONDENCI:
(A) ADRESÁT: Marshall, O'Toole, Gerstein, Murray & Borun (B) ULICE: 6300 Sears Tower, 233 S. Wacker Drive (C) MĚSTO: Chicago (D) STÁT: Illinois (E) ZEMĚ: USA (F) PSČ: 60606 (ZIP) (v) STROJNĚ ČITELNÁ FORMA:
(A) TYP MEDIA: Disketa (B) POČÍTAČ: IBM PC kompatibilní (C) OPERAČNÍ SYSTÉM: PC-DOS/MS-DOS (D) SOFTWARE: Patentin Release #1.0, verze #1.25 (vi) DATA VZTAHUJÍCÍ SE K TÉTO PŘIHLÁŠCE:
(A) ČÍSLO PŘIHLÁŠKY:
(B) DATUM PODÁNÍ:
(C) ZATŘÍDĚNÍ:
(vii) DATA VZTAHUJÍCÍ SE K DŘÍVĚJŠÍ PŘIHLÁŠCE:
(A) ČÍSLO PŘIHLÁŠKY: PCT/US93/12588 (B) DATUM PODÁNÍ: 23. prosince 1993 (vii) DATA VZTAHUJÍCÍ SE K DŘÍVĚJŠÍ PŘIHLÁŠCE:
(A) ČÍSLO PŘIHLÁŠKY: US 07/998 003 (B) DATUM PODÁNÍ: 29. prosince 1992
-19CZ 288789 B6 (viii) INFORMACE O ZÁSTUPCI:
(A) JMÉNO: Noland, Greta E.
(B) ČÍSLO LICENCE: 35,302 (C) SPISOVÁ ZNAČKA: 32149 (ix) INFORMACE O TELEKOMUNIKAČNÍM SPOJENÍ (A) TELEFON: 312/474-6300 (B) TELEFAX: 312/474-0448 (C) TELEX: 25-3856 (2) INFORMACE O SEQ ID NO: 1:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 17 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (xi) POPIS SEKVENCE: SEQ ID NO: 1:
AARSSNNTNG AYTRYGA 17 (2) INFORMACE O SEQ ID NO:2:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 17 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (xi) POPIS SEKVENCE: SEQ ID NO:2:
TTRCTRTTC GNGGNNN 17 (2) INFORMACE O SEQ ID NO:3:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:3:
AAGGGAGTGG actttgagga gcagcctgag cttagtctca tcctcacggc tttggatgga GGGACTCCAT CCAGGTCTGG GACTGCATTG GTTCAAGTGG AAGTCATAGA TGCCAATGAC AACGCACCGT A (2) INFORMACE O SEQ ID NO:4:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:4:
120
131
-20CZ 288789 B6
Lys Cly Val Asp Phe Glu Glu Gin Pro Glu Leu Ser Leu Ile Leu Thr
1 5 10 15
Ala Leu Asp Gly Gly Thr Pro Ser Arg Ser Gly Thr Ala Leu Val Gin
20 25 30
Val Glu Val Ile Asp Ala Asn Asp Asn Ala Pro
40 (2) INFORMACE O SEQ ID NO:5:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:5:
AAACGCATGG ATTTCGAGGA GTCTTCCTCC TACCAGATCT ATGTCCAAGC TACTGACCGG
GGACCAGTAC CCATGGCGGG TCATTGCAAG GTGTTGGTGG ACATTATAGA TGTGAACGAC 120
AACGCACCTA A (2) INFORMACE O SEQ ID NO:6:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:6:
Lys 1 Ala Met Asp Phe 5 Glu Glu Ser Ser Ser Tyr Gin Ile Tyr Val Gin
10 15
Ala Thr Asp Arg Gly Pro Val Pro Het Ala Gly His Cys Lys Val Leu
20 25 30
Val Asp Ile Ile Asp Val Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:7:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:7:
AAGCGACTGG ACTTTGAGAC CCTGCAGACC TTCGAGTTCA GCGTGGGTGC CACAGACCAT60
GGCTCCCCCT CGCTCCGCAG TCAGGCTCTG GTGCGCGTGG TGGTGCTGGA CCACAATGAC120
AATGCCCCCA A131
-21CZ 288789 B6 (2) INFORMACE O SEQ ID NO:8:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:8:
Lys 1 Arg Leu Asp Phe Glu Thr Leu Gin Thr Phe Glu Phe Ser Val 15 Gly
5 10
Ala Thr Asp His Gly Ser Pro Ser Leu Arg Ser Gin Ala Leu Val Arg
20 25 30
Val Val Val Leu Asp His Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:9:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:9:
AAGGGCCTGG ATTACGAGGC ACTGCAGTCC TTCGAGTTCT ACGTGGGCGC TACAGATGGA60
GGCTCACCCG CGCTCAGCAG CCAGACTCTG GTGCGGATGG TGGTGCTGGA TGACAACGAC120
AACGCCCCTA A131 (2) INFORMACE O SEQ ID NO: 10:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 10:
Lys Gly Leu Asp Tyr Glu Ala Leu Gin ser Phe Glu Phe Tyr Val Gly
1 5 10 15
Ala Thr Asp Gly Gly Ser Pro Ala Leu Ser Ser Gin Thr Leu Val Arg
20 25 30
Het Val Val Leu Asp Asp Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO: 11:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec
-22CZ 288789 B6 (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO: 11:
AAGGCGTTTG ATTTTGAGGA TCAGAGAGAG TTCCAGCTAA CCGCTCATAT AAACGACGGA 60
GGTACCCCGG TTTTGGCCAC CAACATCAGC GTGAACATAT TTGTTACTGA CCGCAATGAC 120
AACGCCCCGC A 131
(2) INFORMACE O SEQ ID NO: 12:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 12:
Lya Ala Phe 1 Asp Phe 5 Glu Asp Gin Arg Glu 10 Phe Gin Leu Thr Ala 15 His
Ile Asn Asp Gly Gly Thr Pro Val Leu Ala Thr Αβη Ile Ser Val Asn
20 25 30
Ile Phe Val Thr Asp Arg Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO: 13:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO: 13:
AAGGCGGTGG ATTACGAAAT CACCAAGTCC TATGAGATAG ATGTTCAAGC CCAAGATCTG
GGTCCCAATT CTATTCCTGC TCATTGCAAA ATTATAATTA AGGTCGTGGA TGTCAACGAC
AACGCTCCCA A (2) INFORMACE O SEQ ID NO: 14:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 14:
120
131
-23CZ 288789 B6
Lys Ala Val Asp 1 Tyr Glu 5 Xle Thr Lys Ser 10 Tyr Glu Xle Asp Val Gin 15
Ala Gin Asp Leu Gly Pro Asn Ser Xle Pro Ala His Cys Lys Xle Ile
20 25 30
Ile Lys Val Val Asp Val Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID ŇO: 15:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 135 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO: 15:
TATGACCATG ATTACGAGAC AACCAAAGAA TATACACTGC GGATCCGGGC CCAGGATGGT 60 120
GGCCGGACTC CACTTTCCAA CGTCTCCGGT CTAGTAACCG TGCAGGTCCT AGACATCAAC
GACAATGCCC CCCCA 135
(2) INFORMACE O SEQ ID NO: 16:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 44 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 16:
Tyr 1 Asp His Asp Tyr Glu Thr Thr Lys Glu Tyr Thr Leu Arg Ile Arg
5 10 15
Ala Gin Asp Gly Gly Arg Thr Pro Leu Ser Asn Val Ser Gly Leu Val
20 25 30
Thr Val Gin Val Leu Asp Ile Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO: 17:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 129 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO: 17:
GGGGGGTCGA TTACGAGGAG AACGGCATGT TAGAGATCGA CGTGCAGGCC AGAGACCTAG 60
GACCTAACCC AATTCCAGCC CATTGCAAGG TCACAGTCAA CCTCATCGAC CGCAATGATA 120
ACGCCCCCA 129
-24CZ 288789 B6 (2) INFORMACE O SEQ ID NO: 18:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 18:
Arg Gly Val Asp Tyr Glu Glu Asn Gly Met Leu Glu Ile Asp Val Gin
1 5 10 15
Ala Arg Asp Leu Gly Pro Asn Pro Ile Pro Ala His Cys Lys Val Thr
20 25 30
Val Lys Leu Ile Asp Arg Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO: 19:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO: 19:
AAGGGGTTGG ACTACGAAGA CACCAAACTC CATGAGATTT ACATCCAGGC CAAAGACAAA60
GGTGCCAATC CGGAAGGAGC GCATTGCAAA GTACTGGTAG AGGTTGTGGA CGTTAACGAC120
AATGCCCCTC A131 (2) INFORMACE O SEQ ID NO:20:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:20:
Lye Gly Leu Asp Tyr Glu Asp Thr Lys Leu His Glu Ile Tyr Ile Gin
1 5 10 15
Ala Lys Asp Lys Gly Ala Asn Pro Glu Gly Ala His Cys Lys Val Leu
20 25 30
Val Glu Val Val Asp Val Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:21:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina
-25CZ 288789 B6 (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:21:
AAGGGTTTGG ACTTTGAGCA AGTAGATGTC TACAAAATCC GCGTTGACGC GACGGACAAA
GGACACCCTC CGATGGCAGG CCATTGCACT GTTTTAGTGA GGGTATTGGA TGAAAACGAC 120
AATGCGCCTC T 13 (2) INFORMACE O SEQ ID NO:22:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:22:
Lye Gly
Ala Thr
Val Arg
Leu Aep
Asp Lys 20
Val Leu
Phe Clu
Gly Ηχε
Αερ Glu
Gin Val
Pro Pro
Αεη Αερ 40
Asp Val
Met Ala
Αεη Ala
Tyr Lye
Gly His
Pro
Zle Arg
Cys Thr 30
Val Aep
Val Leu (2) INFORMACE O SEQ ID NO:23:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 134 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:23:
AAGGGTATAG ACTTCGAGCA GATCAAGGAC TTCAGCTTTC AAGTGGAAGC CCGGGACGCC
GGCAGTCCCC AGGCGCTGTC CGGCAACTGC ACTGTCAACA TCTTGATAGT GGATCAGAAC
120
GACAACGCCC CTAA
134 (2) INFORMACE O SEQ ID NO:24:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 44 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:24:
-26CZ 288789 B6
Lys Gly Ile Asp Phe Glu Gin Ile Lys Asp Phe Ser Phe Gin Val Glu 15 1015
Ala Arg ABp Ala Gly ser Pro Gin Ala Leu Ala Gly Asn Thr Thr Val 20 2530
Aen Ile Leu Ile Val Asp Gin Asn Asp Asn Ala Pro 3540 (2) INFORMACE O SEQ ID NO:25:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 134 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:25:
AAGCCGTTCG ACTATCAGCA AACCGCCAAC ACGCTGGCAC AGATTGACGC CGTGCTGGAA 60
AAACAGGGCA GCAATAAATC GAGCATTCTG GATGCCACCA TTTTCCTGGC CGATAAAAAC 120
GACAATGCGC CAGA 134
(2) INFORMACE O SEQ ID NO:26:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 44 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:26:
Lys Pro Phe Asp Tyr Glu Gin Thr Ala Asn Thr Leu Ala Gin Ile Asp
1 5 10 15
Ala Val Leu Glu Lye Gin Gly Ser Asn Lys Ser Ser Ile Leu Asp Ala
20 25 30
Thr Ile Phe Leu Ala Asp Lys Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ IDNO:27:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:27:
AAGCGGCTGG ATTŤCGAACA GTTCCAGCAG CACAAGCTGC TCGTAAGGGC TGTTGATGGA60
GGAATGCCGC CACTGAGCAG CGATGTGGTC GTCACTGTGG ATGTCACCGA CCTCAACGAT120
AACGCGCCCT A131
-27CZ 288789 B6 (2) INFORMACE O SEQ ID NO:28:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:28:
Lys Arg Leu Asp Phe Glu Gin Phe Gin Gin His Lys Leu Leu Val Arg
1 5 10 15
Ala Val Asp Gly Gly Met Pro Pro Leu Ser Ser Asp Val Val Val Thr
20 25 30
Val Aap Val Thr Asp Leu Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:29:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) .TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:29:
AAGGGGATAG ACTTTGAGAG TGAGAATTAC TATGAATTTG ATGTGCGGGC TCGCGATGGG
GGTTCTCCAG CCATGGAGCA ACATTGCAGC CTTCGAGTGG ATCTGCTGGA CGTAAATGAC
AACGCCCCAC T (2) INFORMACE O SEQ ID NO:30:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:30:
120
131 (Xi) POPIS SEKVENCE: SEQ ID NO:30:
Lys Gly Ile Asp Phe Glu Ser Glu Asn Tyr Tyr Glu Phe Asp Val Arg
1 5 10 15
Ala Arg Asp Gly Gly Ser Pro Ala Met Glu Gin His Cys Ser Leu Arg
20 25 30
Val Asp Leu Leu Asp Val Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:31:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina
-28CZ 288789 B6 (C) ŘETĚZCOV OST: j eden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:31:
(xi) POPIS SEKVENCE: SEQ ID NO:31:
AAGGCATTGG ACTTTGAGGC CCGGCGACTG TATTCGCTGA CAGTTCAGGC CACGGACCGA 60
GGCGTGCCCT CGCTCACCGG GCGTGCCGAA GCGCTTATCC AGCTGCTAGA TGTCAACGAC
AACGCACCCA T (2) INFORMACE O SEQ ID NO:32:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:32:
120
131
Lye Ala Leu Aap Phe Glu Ala Arg Arg Leu Tyr Ser Leu Thr Val Gin
1 5 10 15
Ala Thr Asp Arg Gly Val Pro Ser Leu Thr Gly Arg Ala Glu Ala Leu
20 25 30
Ile Gin Leu Leu Asp Val Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:33:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 125 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:33:
AAGCCAATTG ATTACGAGGC AACTCCATAC TATAACATGG AAATTGTAGC CACAGACAGC 60
GGAGGTCTTT CGGGAAAATG CACTGTGTCT ATACAGGTGG TGGATGTGAA CGACAACGCC 120
CCCAA
125 (2) INFORMACE O SEQ ID NO:34:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 41 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:34:
-29CZ 288789 B6
Lys 1 Pro Ile Asp Tyr Glu 5 Ala Thr Pro Tyr Tyr 10 Asn Met Glu Ile 15 Val
Ala Thr Aep Ser Gly Gly Leu Ser Gly Lys Cys Thr Val Ser Xle Gin
20 25 30
Val Val Asp Val Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:35:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 446 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:35:
AAGCGGGTAC ACTTCGAAAT GTGCAAAAGA TTTTACCTTG TGGTGGAAGC TAAAGACGGA 60
GGCACCCCAG· CCCTCAGCAC GGCAGCCACT GTCAGCATCG ACCTCACAGA TGTGAATGAT 120
AACCCTCCTC GGTTCAGCCA AGATGTCTAC AGTGCTGTCA TCAGTGAGGA TGCCTTAGAG 1B0
GGGGACTCTG TCATTCTGCT GATAGCAGAA GATGTGGATA GCAAGCCTAA TGGACAGATT 240
CGGTTTTCCA TCGTGGGTGG AGATAGGGAC AATGAATTTG CTGTCGATCC AATCTTGGGA 300
CTTGTGAAAG TTAAGAAGAA ACTGGACCGG GAGCGGGTGT CAGGATACTC CCTGCTCATC 360
CAGGCAGTAG ATAGTGGCAT TCCTGCAATG TCCTCAACGA CAACTGTCAA CATTGATATT 420
TCTCATGTGA ACGACAACGC CCCCCT 446
(2) INFORMACE O SEQ ID NO:36:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 148 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:36:
-30CZ 288789 B6
Lys Arg 1 Val Asp Phe Glu Het Cya Lye Arg Phe Tyr Leu Val Val 15 Glu
5 10
Ala Lye Asp Gly Gly Thr Pro Ala Leu Ser Thr Ala Ala Thr Val Ser
20 25 30
Ile Asp Leu Thr Asp Val Asn Aep Asn Pro Pro Arg Phe Ser Gin Asp
35 40 45
Val Tyr Asp Ala Val Ile Ser Glu Asp Ala Leu Glu Gly Asp Ser Val
50 55 60
Ile Leu Leu Ile Ala Glu Asp Val Asp Ser Lys Pro Asn Gly Gin Ile
65 70 75 80
Arg Phe Ser Ile Val Gly Gly Asp Arg Asp Asn Glu Phe Ala Val Asp
85 90 .95
Pro Ile Leu Gly Leu Val Lys Val Lys Lys Lys Leu Asp Arg Glu Arg
100 105 110
Val Ser Cly Tyr Ser Leu Leu Ile Gin Ala Val Αβρ Ser Gly Ile Pro
115 120 125
Ala Het Ser Ser Thr Thr Thr Val Asn Ile Asp Ile Ser Asp Val Asn
130 135 140
Asp Asn Ala Pro
145 (2) INFORMACE O SEQ ID NO:37:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 440 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:37:
AAGGGGGTTG ATTATGAGAC AAACCCACGG CTACGACTGG TGCTACAGGC AGAGAGTGGA 60
GGAGCCTTTG CTTTCTCGGT GCTGACCCTG ACCCTTCAAG ATGCCAATGA CAATGCTCCC 120
CGTTTCCTGC AGCCTCACTA CGTGGCTTTC CTGCCAGAGT CCCGACCCTT GGAAGGGCCC 1Θ0
CTGCTGCAGG TGGAAGCAGA CGACCTGGAT CAAGGCTCTG CAGGACAGAT CTCCTACAGT 240
CTGGCTGCAT CCCAGCCAGC ACGGGGCTTG TTCCATGTAG ACCCAGCCAC AGGCACTATC 300
ACTACCACAG CCATCCTGGA CCGGGAAATC TGGGCTGAAA CACGGCTGGT ACTGATGGCC 360
ACAGACAGAG GAAGCCCAGC ATTGGTGGGC TCAGCTACCC TGACAGTGAT CGTCATCGAT 420
ACCAACGACA ATGCTCCCCT 440
(2) INFORMACE O SEQ ID NO:38:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 146 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:38:
-31CZ 288789 B6
Lys Gly Val Aep Tyr Glu Thr Asn Pro Arg Leu Arg Leu Val Leu Gin
1 5 10 15
Ala Glu Ser Gly Gly Ala Phe Ala Phe Ser Val Leu Thr Leu Thr Leu
20 25 30
Gin Asp Ala Asn Asp Asn Ala Pro Arg Phe Leu Gin Pro Hie Tyr Val
35 40 45
Ala Phe Leu Pro Glu Ser Arg Pro Leu Glu Gly Pro Leu Leu Gin Val
50 55 60
Glu Ala Asn Asp Leu Asp Gin Gly Ser Gly Gly Gin Ile Ser Tyr Ser
65 70 75 80
Leu Ala Ala Ser Gin Pro Ala Arg Gly Leu Phe His Val Asp Pro Ala
85 90 95
Thr Gly Thr Ile Thr Thr Thr Ala Xle Leu Asp Arg Glu Ile Trp Ala
100 105 110
Glu Thr Arg Leu Val Leu Met Ala Thr Asp Arg Gly Ser Pro Ala Leu
115 120 125
Val Gly Ser Ala Thr Leu Thr Val Met Val Ile Asp Thr Asn Asp Asn
130 135 140
Ala Pro
145
(2) INFORMACE O SEQ ID NO:39: 4P
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 124 bázových párů
(B) TYP: nukleová kyselina
(C) ŘETĚZCOVOST: jeden řetězec
(D) TOPOLOGIE: lineární
(ii) TYP MOLEKULY: cDNA
(xi) POPIS SEKVENCE: SEQ ID NO:39:
AAGGTCTCGA TTATGAGGCA ACTCCATATT ATAACGTCGA AATTGTAGCC ACAGATCGTG
GGGGCCTTTC AGGAAAATGC ACTGTGGCTA TAGAAGTGGT GGATGTGAAC GACGGCGCTC
CAAT
120
124 (2) INFORMACE O SEQ ID NO:40:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 41 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:40:
-32CZ 288789 B6
Lys Gly Leu Asp Tyr Glu Ala Thr Pro Tyr Tyr Asn Val Glu Ile Val
1 5 10 15
Ala Thr Asp Gly Gly Ala Phe Asp Glu Asn Cys Thr Val Ala Ile Glu
20 25 30
Val Val Asp Val Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:41:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 8 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (xi) POPIS SEKVENCE: SEQ ID NO:41:
Asp Xaa Asn Glu Xaa Pro Xaa Phe 1 5 (2) INFORMACE O SEQ ID NO:42:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 8 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: QNA (xi) POPIS SEKVENCE: SEQ ID NO:42:
Asp Xaa Asp Glu Xaa Pro Xaa Phe
5 (2) INFORMACE O SEQ ID NO:43:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 9 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA (xi) POPIS SEKVENCE: SEQ ID NO:43:
Asp Xaa Asn Asp Asn Xaa Pro Xaa Phe 1 5 (2) INFORMACE O SEQ ID NO:44:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:44:
-33CZ 288789 B6
AAGCGGATGG ATTTTGAAGA CACCAAACTC CATGAGATTT ACATCCAGGC CAAAGACAAA
CGTGCCAATC CCGAAGGAGC GCATTGCAAA GTACTTGTAG AGGTTGTAGA CGTAAACGAC
120
XACGCCCCAG T
131 (2) INFORMACE O SEQ ID NO:45:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:45:
Leu 1 Arg Met Aep Phe Glu 5 Asp Thr Lye Leu His 10 Glu Xle Tyr Ile 15 Gin
Ala Lys Asp Lys Cly Ala Asn Pro Clu Cly Ala His Cys Lys Val Leu
20 25 30
Val Glu Val Val Aep Val Asn Aep Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:46:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:46:
AAGGCTTTGG ATTACGAGGA TCAGAGAGAG TTCCAACTAA CAGCTCATAT AAACGACGGA 60
GGTACCCCAG TCTTAGCCAC CAACATCAGC GTGAACGTAT TTGTTACTGA CCGCAATGAT 120
AACGCCCCCT A
131 (2) INFORMACE O SEQ ID NO:47:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:47:
Lys 1 Ala Leu Asp Tyr Glu Asp Gin Arg Glu Phe Gin Leu Thr Ala His
5 10 15
Ile Asn Asp Gly Gly Thr Pro Val Leu Ala Thr Asn Ile Ser Val Asn
20 25 30
Val Phe Val Thr Aep Arg Asn Asp Asn Ala Pro
35 40
-34CZ 288789 B6 (2) INFORMACE O SEQ ID NO:48:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:48:
AAGCGCTTGG ACTACGAGGA GAGTAACAAT TATGAAATTC ACGTGGATGC TACAGATAAA
GGATACCCAC CTATGGTTGC TCACTGCACC GTACTCGTGG GAATCTTGGA TGAAAATGAC
AACGCACCCA T (2) INFORMACE O SEQ ID NO:49:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:49:
120
131
Lys 1 Arg Leu Asp Tyr Glu Glu Ser Asn Asn Tyr Clu Ile His Val Asp
5 10 15
Ala Thr Asp Lys Gly Tyr Pro Pro Het Val Ala His Cys Thr Val Leu
20 25 30
Val Gly Ile Leu Asp Glu Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:50:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:50:
AAACCGGTGG ACTACGAGAA AGTCAAAGAC TATACCATCG AGATCGTGGC TGTGGATTCC
GGCAACCCTC CACTCTCTAG CACCAACTCC CTCAAGGTGC AGGTGGTAGA CGTCAACGAT
AACGCCCCTC T (2) INFORMACE O SEQ ID NO:51:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární
120
131
-35CZ 288789 B6 (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:51:
Lye Pro Val Asp Tyr Glu Lys Val Lys Asp Tyr Thr Ile Glu Ile Val
1 5 10 15
Ala Val Asp Ser Gly Asn Pro Pro Leu Ser Ser Thr Asn Ser Leu Lys
20 25 30
Val Gin Val Val Asp Val Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:52:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:52:
AAGCCTTTTG ATTTCGAGGA CACCAAACTC CATGAGATTT ACATCCAGGC CAAAGACAAG GGCGCCAATC CCGAAGGAGC ACATTGCAAA GTGTTGGTGG AGGTTGTGGA TGTGAACGAC (2) INFORMACE O SEQ ID NO:53:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:53:
Lye Pro Phe Asp 1
Ala Lys Asp Lys
Phe Clu Asp Thr
Gly Ala Asn Pro
Lys Leu His Glu 10
Glu Gly Ala His
Ile Tyr Ile Gin
CyB Lys Val Leu 30
Val Glu Val Val Asp Val Asn Asp Asn Ala Pro ·» = an (2) INFORMACE O SEQ ID NO:54:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 122 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:54:
-36CZ 288789 B6
AAAGGTGTCG ATTACGAGGT GAGTCCACGG CTGCGACTGG TGCTGCAGGC AGAGAGTCGA60
GGAGCCTTTG CCTTCACTGT GCTGACCCTG ACCCTGCAAG ATGCCAACGA CAACGCCCCG120
AG122 (2) INFORMACE O SEQ ID NO:55:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 40 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:55:
Lys Gly Val Αερ Tyr Glu Val Ser Pro Arg Leu Arg Leu Val Leu Gin
1 5 10 15
Ala Glu Ser Arg Gly Ala Phe Ala Phe Thr Val Leu Thr Leu Thr Leu
20 25 30
Gin Aep Ala Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:56:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:56:
AAAGGGATTG ATTACGAGCA GTTGAGAGAC CTACAGCTGT GGGTGACAGC CAGCGACAGC 60
GGGGACCCGC CTCTTAGCAG CAACGTGTCA CTGAGCCTGT TTGTGCTGGA CCAGAACGAC 120
AACGCCCCCC T 131
(2) INFORMACE O SEQ ID NO:57:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:57:
Lys Gly Ile Asp Tyr Glu Gin Leu Arg Asp Leu Gin Leu Trp Val Thr
1 5 10 15
Ala Ser Asp Ser Gly Asp Pro Pro Leu Ser Ser Asn Val Ser Leu Ser
20 25 30
Leu Phe Val Leu Asp Gin Asn Asp Asn Ala Pro
35 40
-37CZ 288789 B6 (2) INFORMACE O SEQ ID NO:58:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 125 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:58:
AAGGCGGTCG ATTTTGAGCG CACATCCTCT TATCAACTCA TCATTCAGGC CACCAATATG 60
GCAGGAATGG CTTCCAATGC TACAGTCAAT ATTCAGATTG TTGATGAAAA CGACAACGCC 120
CCCCA 125
(2) INFORMACE O SEQ ID NO:59: (i) CHARAKTERISTIKA SEKVENCE: (A) DÉLKA: 41 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:59:
Lya 1 Ala Val Aap Phe 5 Glu Arg Thr Ser Ser Tyr 10 Gin Leu Ile Ile 15 Gin
Ala Thr Asn Met Ala Gly Met Ala Ser Asn Ala Thr Val Asn Ile Gin
20 25 30
Ile Val Asp Glu Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:60:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:60:
AAACGGCTAG ACTTTGAAAA GATACAAAAA TATGTTGTAT GGATAGAGGC CAGAGATGGT
GGTTTCCCTC CTTTCTCCTC TTACGAGAAA CTTGATATAA CAGTATTAGA TGTCAACGAT
AACGCGCCTA A
120
131 (2) INFORMACE O SEQ ID NO:61:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:61:
-38CZ 288789 B6
Lys Arg Leu Asp Phe Glu Lye Ile Gin Lys Tyr Val Val Trp Ile Glu
1 5 10 15
Ala Arg Asp Gly Gly Phe Pro Pro Phe Ser Ser Tyr Glu Ly6 Leu Aep
20 25 30
Ile Thr Val Leu Asp Val Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:62:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ĚETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:62:
AAGGGGATCG ATTATGAGAA GGTCAAAGAC TACACCATTG AGATTGTGGC TGTGGACTCT
GGCAACCCCC CACTCTCCAG CACTAACTCC CTCAAGGTGC AGGTGGTGGA CGTCAATGAC
120
AACGCACCGT G
131 (2) INFORMACE O SEQ ID NO:63:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ĚETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:63:
Lys Gly
Ala Val
Val Gin
Ile Asp
Asp Ser
Val Val
Tyr Glu
Gly Asn
Asp Val
Lys Val
Pro Pro
Asn Asp
Lys Asp
Leu Ser 25
Asn Ala
Tyr Thr
Ser Thr
Pro
Ile Glu
Αβπ Ser 30
Ile Val
Leu Lys (2) INFORMACE O SEQ ID NO:64:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ĚETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:64:
-39CZ 288789 B6
AAGGGACTCG ACTACGAGGA TCGGCGGGAA TTTGAATTAA CAGCTCATAT CAGCGATGGG 60
GGCACCCCGG TCCTAGCCAC CAACATCAGC CTGAACATAT TTGTCACTGA TCGCAACGAT 120
AATGCCCCCG T 131
(2) INFORMACE O SEQ ID NO:65: (i) CHARAKTERISTIKA SEKVENCE: (A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:65:
Lyo Gly Leu Aep Tyr Glu Asp Arg Arg Glu Phe Glu Leu Thr Ala His
1 5 10 15
Ile Ser Asp Gly Gly Thr Pro Val Leu Ala Thr Asn Ile Ser Val ΑΒΠ
20 25 30
Ile Phe Val Thr Asp Arg Aen Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:66:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 470 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:66:
AAGGGTTTGG ACTACGAGAC CACACAGGCC TACCAGCTCA CGGTCAACGC CACAGATCAA 60
GACAACACCA GGCCTCTGTC CACCCTGGCC AACTTGGCCA TCATCATCAC AGATGTCCAG 120
GACATGGACC CCATCTTCAT CAACCTGCCT TACAGCACCA ACATCTACGA GCATTCTCCT 180
CCGGGCACGA CGGTGCGCAT CATCACCGCC ATAGACCAGG ATCAAGGACG TCCCCGGGGC 240
ATTGGCTACA CCATCGTTTC AGGGAATACC AACAGCATCT TTGCCCTGGA CTACATCAGC 300
GGAGTGCTGA CCTTGAATGG CCTGCTGGAC CGGGAGAACC CCCTGTACAG CCATGGCTTC 360
ATCCTGACTG TGAAGGGCAC GGAGCTGAAC GATGACCGCA CCCCATCTGA CGCTACAGTC 420
ACCACGACCT TCAATATCCT GGTTATTGAC ATCAACGACA ÁCGCCCCACT 470
(2) INFORMACE O SEQ ID NO:67:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 156 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:67:
-40CZ 288789 B6
Lys Gly Leu 1 Asp Tyr Clu 5 Thr Thr Gin Ala 10 Tyr Gin Leu Thr Val 15 Asn
Ala Thr Aap Gin Asp Asn Thr Arg Pro Leu Ser Thr Leu Ala Asn Leu
20 25 30
Ala Ile Ile Ile Thr Asp Val Gin Asp Het Asp Pro Ile Phe Ile Asn
35 40 45
Leu Pro Tyr Ser Thr Asn Ile Tyr Clu His Ser Pro Pro Gly Thr Thr
50 55 60
Val Arg Ile Ile Thr Ala Ile Asp Gin Asp Gin Gly Arg Pro Arg Gly
65 70 75 80
Ile Gly Tyr Thr Ile Val Ser Gly Asn Thr Asn Ser Ile Phe Ala Leu
65 90 95
Asp Tyr Ile Ser Gly Val Leu Thr Leu Αβπ Gly Leu Leu Asp Arg Glu
100 105 110
Α8Π Pro Leu Tyr Ser Gly Gly Phe Ile Leu Thr Val Lys Gly Thr Glu
115 120 125
Leu Asn Asp Asp Arg Thr Pro Ser Asp Ala Thr Val Thr Thr Thr Phe
130 135 140
Aan Ile Leu Val Ile Asp Ile Asn Asp Asn Ala Pro
145 150 155 (2) INFORMACE O SEQ ID NO:68:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:68:
AAGGGGGTCG ATTACGAGGT ACTACAGGCC TTTGAGTTCC ACGTGAGCGC cacagaccga 60
GGCTCACCGG GGCTCAGCAG CCAGGCTCTG GTGCGCGTGG TGGTGCTGGA CGACAATGAC 120
AACGCTCCCG T 131
(2) INFORMACE O SEQ ID NO:69:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:69:
-41CZ 288789 B6
Lys Cly Val Asp Tyr Clu Val Leu Gin Ala Phe Clu Phe His Val Ser
1 5 10 15
Ala Thr Asp Arg Gly Ser Pro Gly Leu Ser Ser Gin Ala Leu Val Arg
20 25 30
Val Val Val Leu Asp Asp Asn Asp Asn Ala Pro
40 (2) INFORMACE O SEQ ID NO:70:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:70:
AAGGGGCTGG ATTATGAGCA GTTCCAGACC CTACAACTGG GAGTGACCGC TAGTGACAGT 60
GGAAACCCAC CATTAAGAAG CAATATTTCA CTGACCCTTT TCGTGCTGGA CCAGAATGAT 120
AACGCCCCAA A (2) INFORMACE O SEQ ID NO:71:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:71:
Lys 1 Gly Leu Asp Tyr Glu Gin Phe Gin Thr Leu Gin Leu Gly Val Thr
5 10 15
Ala Ser Asp Ser Gly Asn Pro Pro Leu Arg Ser Asn Ile Ser Leu Thr
20 25 30
Leu Phe Val Leu Asp Gin Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:72:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:72:
AAGCGGGTTG ATTACGAGGA TGTCCAGAAA TACTCGCTGA GCATTAAGGC CCAGGATGGG
CGGCCCCCGC TCATCAATTC TTCAGGGGTG GTGTCTGTGC AGGTGCTGGA TGTCAACGAC
AATGCCCCGG A
120
131
-42CZ 288789 B6 (2) INFORMACE O SEQ ID NO:73:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: peptid (xi) POPIS SEKVENCE: SEQ ID NO:73:
Lye Arg Val Asp Tyr Glu Asp Val Gin Lys Tyr Ser Leu Ser Ile Lys
1 5 10 15
Ala Gin Asp Gly Arg Pro Pro Leu Ile Asn Ser Ser Gly Val Val Ser
20 25 30
Val Gin Val Leu Asp Val Asn Asp Asn Ala Pro
(2) INFORMACE O SEQ ID NO:74: (i) (ii) (xi)
CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 125 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární TYP MOLEKULY: cDNA
POPIS SEKVENCE: SEQ ID NO:74:
AAACCGGTAG ACTTTGAGCT ACAGCAGTTC TATGAAGTAG CTGTGGTGGC TTGGAACTCT60
GAGGGATTTC ATGTCAAAAG GGTCATTAAA GTGCAACTTT TAGATGACAA CGACAATGCC120
CCGAT125 (2) INFORMACE O SEQ ID NO:75:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 41 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:75:
Lys 1 Pro Val Asp Phe 5 Glu Leu Gin Gin Phe 10 Tyr Glu Val Ala Val 15 Val
Ala Trp Asn Ser Glu Gly Phe His Val Lys Arg Val Ile Lys Val Gin
20 25 30
Leu Leu Asp Asp Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:76:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 125 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec
-43CZ 288789 B6 (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:76:
AAGGGATTAG ATTTTGAAAC TTTGCCCATT TACACATTGA TAATACAAGG AACTAACATG 60
GCTGGTTTGT CCACTAATAC AACGGTTCTA GTTCACTTGC AGGATGAGAA TGATAACGCC 120
CCAAA
125 (2) INFORMACE O SEQ ID NO:77:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 41 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:77:
Lys 1 Gly Leu Asp Phe 5 Glu Thr Leu Pro Ile Tyr 10 Thr Leu Ile Ile 15 Gin
Cly Thr Asn Met Ala Cly Leu Ser Thr Asn Thr Thr Val Leu Val His
20 25 30
Leu Gin Asp Glu Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:78:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 134 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:78:
AAGCGGGCGG ATTTCGAGGC GATCCGGGAG TACAGTCTGA GGATCAAAGC GCAGGACGGG 60
GGGCGGCCTC CCCTCAGCAA CACCACGGGC ATGGTCACAG TGCAGGTCGT GGACGTCAAT
GACAACGCAC CCCT (2) INFORMACE O SEQ ID NO:79:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 44 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:79:
120
134
-44CZ 288789 B6
Lys Arg Ala Asp Phe Glu Ala Ile Arg Glu Tyr Ser Leu Arg Ile LyB
1 5 10 15
Ala Gin Asp Gly Gly Arg Pro Pro Leu Ser Asn Thr Thr Gly Met Val
20 25 30
Thr Val Gin Val Val Asp Val Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:80:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:80:
AAGCGGTTGG ATTACGAAAA GGCATCGGAA TATGAAATCT ATGTTCAAGC CGCTGACAAA60
GGCGCTGTCC CTATGCCTGG CCATTGCAAA GTGTTGCTGG AGATCGTGGA TGTCAACGAC120
AACGCCCCCT T131 (2) INFORMACE O SEQ ID NO:81:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:81:
Lys Arg Leu Asp Tyr Glu Lys Ala Ser Glu Tyr Glu Ile Tyr Val Gin
1 5 10 15
Ala Ala Asp Lys Gly Ala Val Pro Met Ala Gly Hie Cys Lys Val Leu
20 25 30
Leu Glu Ile Val Asp Val Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:82:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:82:
AAGGGGATCG ATTATGAGGA TCAGGTCTCT TACACATTAG CAGTAACAGC ACATGACTAT
GGCATCCCTC AAAAATCAGA CACTACCTAT TTGGAAATCT TAGTAATTGA TGTTAACGAC
120
AACGCGCCCC A
131
-45CZ 288789 B6 (2) INFORMACE O SEQ ID NO:83:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:83:
Lys Gly Ile Asp Tyr Glu Asp Gin Val Ser Tyr Thr Leu Ala Val Thr
1 S 10 15
Ala His Asp Tyr Gly Ile Pro Gin Lys Ser Asp Thr Thr Tyr Leu Glu
20 25 30
Ile Leu Val Ile Asp Val Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:84:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:84:
AAAGGGTTAG ATTTCGAGGG CACTAAAGAT TCAGCGTTTA AAATAGTGGC AGCTGACACA
GGGAAGCCCA GCCTCAACCA GACAGCCCTG GTGAGAGTAG AGCTGGAGGA TGAGAACGAC
AACGCCCCAA T (2) INFORMACE O SEQ ID NO:85:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:85:
120
131
Lya 1 Gly Leu Asp Phe 5 Glu Gly Thr Lys Asp Ser 10 Ala Phe Lys Ile 15 Val
Ala Ala Asp Thr Gly Lys Pro Ser Leu Asn Gin Thr Ala Leu Val Arg
20 25 30
Val Glu Leu Glu Asp Glu Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:86:
(i) CHARAKTERISTIKA SEKVENCE: (A) DÉLKA: 130 bázových párů
-46CZ 288789 B6 (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:86:
AAGGGTGTGG ATTTTGAAAG TGTGCGTAGC TACAGGCTGG TTATTCGTGC TCAAGATGGA
GGCAGCCCCT CCAGAAGTAA CACCACCCAG CTCTTGGTCA ACGTCATCGA TCGAATGACA
120
ATGCGCCGCT
130 (2) INFORMACE O SEQ ID NO:87:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:87:
Lys Cly Val Asp Phe Glu Ser Val Arg Ser Tyr Arg Leu Val Ile Arg
1 5 10 15
Ala Gin Asp Gly Gly Ser Pro Ser Arg Ser Asn Thr Thr Gin Leu Leu
20 25 30
Val Aen Val Ile Asp Val Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:88:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:88:
AACGCTGTCG ACTTCGACCT CACACATCTG TATGAGATTT CGATTGAGGC TGCCGATGGA
GACACGCCAA GTCTGCGTAG TGTAACTCTT ATAACGCTCA ACGTAACGGA TGCCAATGAC
120
AATGCTCCCA A
131 (2) INFORMACE O SEQ ID NO:89:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:89:
-47CZ 288789 B6
Lye Gly Val Asp Phe Glu Leu Thr His Leu Tyr Glu Ile Trp Ile Glu
1 5 10 15
Ala Ala Asp Gly Asp Thr Pro Ser Leu Arg Ser Val Thr Leu Ile Thr
20 25 30
Leu Asn Val Thr Asp Ala Asn Asp Asn Ala Pro
35 40
(2) INFORMACE O SEQ ID NO:90:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 441 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:90:
CAAGGCGTTT GATTTTGAAG AGACAAGTAG ATATCTGTTG AGTGTGGAAG CTAAGGATGG 60
AGGAGTACAC ACAGCTCACT GTAATGTTCA AATAGAAATT GTTGACGAGA ATGACAATGC 120
CCCAGAGGTG ACATTCATGT CCTTCTCTAA CCAGATTCCA GAGGATTCAG ACCTTGGAAC 180
TGTAATAGCC CTCATAAAAG TGCGAGACAA GGATTCTGGG CAAAATGGCA TCGTGACATG 240
CTATACTCAG GAAGAAGTTC CTTTCAAATT AGAATCCACC TCGAAGAATT ATTACAAGCT 300
GGTGATTGCT GGAGCCCTAA ACCGGGAGCA GACAGCAGAC TACAACGTCA CAATCATAGC 360
CACCGACAAG GGCAAACCAG CCCTTTCCTC CAGGACAAGC ATCACCCTGC ACATCTCCGA 420
CATCAACGAT AATGCCCCCG T 441
(2) INFORMACE O SEQ ID NO:91:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 146 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:91:
-48CZ 288789 B6
Lys Ala 1 Phe Asp Phe Glu Glu Thr Ser Arg Tyr Val Leu Ser Val 15 Glu
5 10
Ala Lys Asp Gly Gly Val His Thr Ala Hie Cys Asn Val Gin lle Glu
20 25 30
lle Val Asp Glu Asn Asp Asn Ala Pro Glu Val Thr Phe Het Ser Phe
35 40 45
Ser Αβπ Gin lle Pro Glu Asp Ser Asp Leu Gly Thr Val lle Ala Leu
50 55 60
lle Lys Val Arg Asp Lys Asp Ser Gly Gin Asn Gly Met Val Thr Cys
65 70 75 80
Tyr Thr Gin Glu Glu Val Pro Phe Ly6 Leu Glu Ser Thr Ser Lys Asn
85 90 95
Tyr Tyr Lys Leu Val lle Ala Gly Ala Leu Asn Arg Glu Gin Thr Ala
100 105 110
Asp Tyr Asn Val Thr lle lle Ala Thr Asp Lys Gly Lys Pro Ala Leu
115 120 125
Ser Ser Arg Thr Ser lle Thr Leu His lle Ser Asp lle Asn Asp Asn
130 135 140
Ala Pro
145 (2) INFORMACE O SEQ ID NO:92:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 131 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:92:
AAGCGAGTGG ATTACGAGGC CACTCGGAAT TATAAGCTGA GAGTTAAGGC TACTGATCTT
GGGATTCCAC CGAGATCTTC TAACATGACA CTGTTCATTC ATGTCCTTGA TGTTAACGAC
AACGCTCCCT T
120
131 (2) INFORMACE O SEQ ID NO:93:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 43 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:93:
-49CZ 288789 B6
Lys 1 Arg Val Asp Tyr Glu Ala Thr Arg Asn Tyr Lys Leu Arg Val Lys
5 10 15
Ala Thr Asp Leu Gly Ile Pro Pro Arg Ser Ser Aen Met Thr Leu Phe
20 25 30
Ile His Val Leu Asp Val Asn Asp Asn Ala Pro
35 40
-50CZ 288789 B6 (2) INFORMACE O SEQ ID NO:94:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 4104 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 495..3572 (xi) POPIS SEKVENCE: SEQ ID NO:94:
CCTCTATTCG ACATTCTCTT TGGATTGTTT ACGAAACTGT CATCTGTTTC CGCCAAACTG TTCGAGACTT GCTGACTTCT TTCATCCCCC TTTTGCTCTA AGTCCTATGC TTCAGTCAGG TCATGAAGCC TTTGATCACT GATAGTTCTT ACAGTTAATA TTTAGTATCT CTACTCATCT CGTTTTCGTA CCTCTTCATG CTGATGGGCA CTCCTCATGA TGCTTCACAT CTGGCAGGCG
TGCTATAACT TCAAATTTGG CATCTCACAA 60 TGGTTCTGCT AATCTCCCAG GCTCGCAGCA 120 ACTCTTTTCA CCTCAAATTC CTTTCCTTGG 180 GGCCÁACCAA ATCTCACTGC CTCCTTTTTA 240 TTTATATCTT GAAAAATCAC CCTTCCCAGT 300 TGGCACTTAC TCACAGCTCC ATAATTCAGT 360 GCCCTTTGGA GGTGGTGACT GTGCTTTATA 420 TGGAGTGCCC GGAGGCGGCC CTCCTGATTC 480
TGGGGCCTCC CAGG ATG Met GAG CCC CTG AGG CAC AGC CCA CCC Cly CCT GGC GGG 530
Glu Pro Leu Arg 5 His Ser Pro Pro 10 Gly Cly
1
CAA CGG CTA CTG CTG CCC tcc ATG CTG CTA CCA CTG CTG CTC CTG CTG 578
Gin Arg Leu Leu Leu Pro Ser Met Leu Leu Ala Leu Leu Leu Leu Leu
15 20 25
GCT CCA TCC CCA GGC CAC GCC ACT CGG CTA GTG TAC AAG GTG CCG CAG 626
Ala Pro Ser Pro Gly His Ala Thr Arg Val Val Tyr Lys Val Pro Glu
30 35 40
GAA CAG CCA CCC AAC ACC CTC ATT GGG AGC CTC CCA GCC GAC TAT GGT 674
Glu Cln Pro Pro Asn Thr Leu Ile Gly Ser Leu Ala Ala Asp Tyr Cly
45 50 55 60
TTT CCA GAT GTG GGG CAC CTG TAC AAG CTA GAG GTG GGT CCC CCG TAC 722
Phe Pro Aep Val Gly His Leu Tyr Lys Leu Glu Val Gly Ala Pro Tyr
65 70 75
CTT CCC CTG GAT GGC AAG ACA GGT CAC ATT TTC ACC ACC CAG ACC TCC 770
Leu Arg Val Aep Gly Lys Thr Gly Asp Ile Phe Thr Thr Clu Thr Ser
80 85 90
ATC GAC CGT GAG GGG CTC CGT GAA TCC CAG AAC CAG CTC CCT GGT GAT 818
Ile Asp Arg Glu Gly Leu Arg Clu Cys Gin Asn Gin Leu Pro Gly Asp
95 100 105
CCC TCC ATC CTG GAG TTT GAG GTA TCT ATC ACA GAC CTC GTG CAG AAT 866
Pro Cys Ile Leu Glu Phe Glu Val Ser Ile Thr Asp Leu Val Gin Asn
110 115 120
GCG AGC CCC CGG CTG CTA GAG GGC CAG ATA GAA GTA CAA GAC ATC AAT 914
Ala Ser Pro Arg Leu Leu Glu Gly Gin Ile Glu val Gin Asp Ile Asn
125 130 135 140
GAC AAC ACA CCC AAC TTC GCC TCA CCA GTC ATC ACT CTG GCC ATC CCT 962
Asp Asn Thr Pro Asn Phe Ala Ser Pro Val Ile Thr Leu Ala Ile Pro
145 150 155
GAG AAC ACC AAC ATC GGC TCA CTC TTC CCC ATC CCC CTG GCT TCA GAC 1010
Glu Asn Thr Asn Ile Gly Ser Leu Phe Pro Ile Pro Leu Ala Ser Asp
160 165 170
-51CZ 288789 B6
CCT GAT GCT GGT CCC AAC GGT GTG GCA TCC TAT GAG CTG CAG GTG CCA 1058
Arg Asp Ala Gly Pro Asn Gly Val 180 Ala Ser Tyr Clu Leu cín 185 Val Ala
175
GAG GAC CAG GAG GAG AAG CAA CCA CAG CTC ATT GTG ATG CGC AAC CTG 1106
Glu Asp Gin Glu Glu Lys Gin Pro Gin Leu Ile Val Met Gly Asn Leu
190 195 200
GAC CGT GAG CGC TGG CAC TCC TAT GAC CTC ACC ATC AAC GTG CAG GAT 1154
Asp Arg Glu Arg Trp Asp Ser Tyr Asp Leu Thr Ile Lys Val Gin Asp
205 210 215 220
GGC GGC AGC CCC CCA CGC GCC ACG AGT GCC CTG CTG CGT GTC ACC GTG 1202
Gly Gly Ser Pro Pro Arg Ala Thr Ser Ala Leu Leu Arg Val Thr Val
225 230 235
CTT GAC ACC AAT GAC AAC GCC CCC AAG TTT GAG CGG CCC TCC TAT GAC 1250
Leu Asp Thr Asn Αβρ Asn Ala Pro Lye Phe Clu Arg Pro Ser Tyr Glu .
240 245 250
GCC GAA CTA TCT GAG AAT AGC CCC ATA CCC CAC TCG GTC ATC CAG GTC 1298
Ala Glu Leu Ser Glu Asn Ser Pro Ile Cly His Ser Val Ile Gin Val
255 260 265
AAG GCC AAT GAC TCA GAC CAA CGT GCC AAT CCA GAA ATC GAA TAC ACA 1346
Lys Ala Asn Asp Ser Asp Gin Cly Ala Asn Ala Glu Ile Glu Tyr Thr
270 275 280
TTC CAC CAG GCG CCC GAA GTT GTG AGG CGT CTT CTT CCA CTG CAC AGG 1394
Phe His Gin Ala Pro Glu Val Val Arg Arg Leu Leu Arg Leu Asp Arg
285 290 295 300
AAC ACT GCA CTT ATC ACT GTT CAG CGC CCC CTC CAC CGT GAG CAC CTA 1442
Asn Thr Gly Leu Ile Thr Val Gin Cly Pro Val Asp Arg Clu Asp Leu
305 310 315
AGC ACC CTG CGC TTC TCA GTG CTT CCT AAC GAC CGA GGC ACC AAC CCC 1490
Ser Thr Leu Arg Phe Ser Val Leu Ala Lys Asp Arg Gly Thr Asn Pro
320 325 330
AAG AGT GCC CGT GCC CAG CTG CTT GTG ACC GTG AAG GAC. ATG AAT .GAC 1538
Lye Ser Ala Arg Ala Gin Val Val Val Thr Val Lys Asp Met Asn Asp
335 340 345
AAT GCC CCC ACC ATT GAG ATC CGG GGC ATA GGG CTA CTG ACT CAT CAA 1586
Asn Ala Pro Thr Zle Glu Ile Arg Cly Ile Gly Leu Val Thr His Gin
350 355 360
GAT CGG ATG GCT AAC ATC TCA CAG CAT CTC CCA GAC GAC ACA GCT GTG 1634
Asp Gly Met Ala Asn Ile Ser Glu Asp Val Ala Glu Glu Thr Ala val
365 370 375 380
GCC CTG GTG CAG GTG TCT GAC CGA GAT CAG GGA GAC AAT CCA GCT GTC 1682
Ala Leu Val Gin Val Ser Asp Arg Asp Glu Gly Clu Asn Ala Ala Val
385 390 395
ACC TGT GTG GTG GCA GGT GAT CTG CCC TTC CAG CTG CGC CAG GCC AGT 1730
Thr Cys Val Val Ala Gly Asp Val Pro Phe Gin Leu Arg Gin Ala Ser
400 405 410
-52CZ 288789 B6
GAG ACA GGC AGT GAC AGC AAG AAG AAG TAT TTC CTG CAG ACT ACC ACC 1778
Glu Thr Gly Ser Asp ser Lys Lys 420 Lys Tyr Phe Leu Gin Thr 425 Thr Thr
415
CCG CTA GAC TAC GAG AAG GTC AAA GAC TAC ACC ATT GAG ATT GTG GCT 1B26
Pro Leu Aep Tyr Glu Lys Val Lye Asp Tyr Thr Ile Glu Ile Val Ala
430 435 440
GTG GAC TCT GGC AAC CCC CCA CTC TCC AGC ACT AAC TCC CTC AAG GTG 1874
Val Asp Ser Gly Asn Pro Pro Leu Ser Ser Thr Aen Ser Leu LyB Val
445 450 455 460
CAG GTG GTG GAC GTC AAT GAC AAC GCA CCT GTC TTC ACT. CAG AGT GTC 1922
Cln Val Val Asp Val Asn Αβρ Asn Ala Pro Val Phe Thr Gin Ser Val
465 470 475
ACT GAG GTC GCC TTC CCG GAA AAC AAC AAG CCT GGT GAA GTG ATT CCT 1970
Thr Glu Val Ala Phe Pro Glu Asn Asn Lys Pro Gly Glu Val Ile Ala
480 485 490
GAG ATC ACT GCC AGT GAT GCT GAC TCT GGC TCT AAT GCT GAG CTG GTT 2018
Glu Ile Thr Ala Ser Asp Ala Asp Ser Gly Ser Asn Ala Glu Leu Val
495 500 505
TAC TCT CTG GAG CCT GAG CCG GCT GCT AAG GGC CTC TTC ACC ATC TCA 2066
Tyr Ser Leu Glu Pro Glu Pro Ala Ala Lye Gly Leu Phe Thr Ile Ser
510 515 520
ccc GAG ACT GGA GAG ATC CAG GTG AAC ACA TCT CTG GAT CGG GAA CAG 2114
Pro Glu Thr Gly Glu Ile Cln Val Lys Thr Ser Leu Asp Arg Glu Gin
525 530 535 540
CGG GAG AGC TAT GAG TTG AAG GTG GTG GCA GCT GAC CGG GGC AGT CCT 2162
Arg Glu Ser Tyr Glu Leu Lye Val Val Ala Ala Asp Arg Gly Ser Pro
545 550 555
AGC CTC CAG GGC ACA GCC ACT GTC CTT GTC AAT GTG CTG GAC TGC AAT 2210
Ser Leu Gin Gly Thr Ala Thr Val Leu Val Aen val Leu Asp Cys Asn
560 565 570
GAC AAT GAC CCC AAA TTT ATG CTG AGT CCC TAC AAC TTC TCA GTG ATG 2258
Asp Αβπ Aep Pro Lys Phe Met Leu Ser Cly Tyr Asn Phe Ser Val Met
575 580 585
GAG AAC ATG CCA CCA CTG AGT CCA GTG GGC ATG GTG ACT GTC ATT GAT 2306
Glu Aen Met Pro Ala Leu Ser Pro Val Gly Met Val Thr Val Ile Asp
590 595 600
GGA GAC AAG GGG GAG AAT GCC CAG GTG CAG CTC TCA GTG GAG CAG GAC 2354
Cly Aep Lys Gly Glu Asn Ala Gin Val Gin Leu ser Val Glu Gin Asp
605 610 615 620
AAC GGT GAC TTT GTT ATC CAG AAT GGC ACA GGC ACC ATC CTA TCC AGC 2402
Αβη Gly Aep Phe Val Ile Gin Aen Gly Thr Gly Thr Ile Leu Ser Ser
625 630 635
CTG AGC TTT GAT CGA GAG CAA CAA AGC ACC TAC ACC TTC CAG CTG AAG 2450
Leu Ser Phe Asp Arg Glu Gin Gin Ser Thr Tyr Thr Phe Gin Leu Lys
640 645 650
-53CZ 288789 B6
GCA GTG CAT CGT GGC GTC CCA CCT CGC TCA GCT TAC GTT GGT CTC ACC Thr 2498
Ala Val Aep Gly Gly Val Pro Pro 660 Arg Ser Ala Tyr Val 665 Gly Val
655
ATC AAT GTG CTG GAC GAG AAT GAC AAC GCA CCC TAT ATC ACT CCC CCT 2546
Ile Asn Val Leu Asp Glu Asn Asp Asn Ala Pro Tyr Ile Thr Ala Pro
670 675 680
TCT AAC ACC TCT CAC AAG CTG CTG ACC CCC CAG ACA CGT CTT GGT GAG 2594
Ser Aen Thr Ser His Lys Leu Leu Thr Pro Gin Thr Arg Leu Cly Clu
685 690 695 700
ACG GTC AGC CAG GTG GCA GCC CAG GAC TTT GAC TCT CGT GTC AAT CCC 2642
Thr Val Ser Gin Val Ala Ala Glu Asp Phe Asp Ser Gly Val Asn Ala
705 710 715
GAG CTG ATC TAC AGC ATT GCA GGT GGC AAC CCT TAT GGA CTC TTC CAG 2690
Glu Leu Ile Tyr Ser Ile Ala Gly Cly Asn Pro Tyr Gly Leu Phe Gin
720 725 730
ATT GGG TCA CAT TCA GGT GCC ATC ACC CTG GAC AAC CAG ATT CAC CGC 2738
Ile Gly Ser Hle Ser Gly Ala Ile Thr Leu Glu Lys Glu Ile Clu Arg
735 740 745
CGC CAC CAT GGG CTA CAC CGC CTG GTG GTG AAG GTC AGT CAC CGC GGC 2786
Arg Hle His Gly Leu His Arg Leu Val Val Lys Val Ser Asp Arg Gly
750 755 760
AAG CCC CCA CGC TAT GGC ACA CCC TTG GTC CAT CTT TAT CTC AAT GAG 2834
Lys Pro Pro Arg Tyr Gly Thr Ala Leu Val His Leu Tyr Val Asn Glu
765 770 775 780
ACT CTG GCC AAC CGC ACG CTG CTG GAG ACC CTC CTG GGC CAC AGC CTG 2882
Thr Leu Ala Asn Arg Thr Leu Leu Glu Thr Leu Leu Gly His Ser Leu
785 790 795
GAC ACG CCG CTG GAT ATT GAC ATT CCT GCG GAT CCA GAA TAT CAG CGC 2930
Aep Thr Pro Leu Asp Ile Asp Ile Ala Gly Asp Pro Glu Tyr Clu Arg
800 805 810
TCC AAG CAG CGT GGC AAC ATT CTC TTT GGT CTG GTC GCT GCT CTG CTG 2978
Ser Lye Gin Arg Gly Asn Ile Leu Phe Gly Val Val Ala Gly Val Val
815 820 825
GCC GTG GCC TTG CTC ATC GCC CTG GCG GTT CTT GTG CGC TAC TGC AGA 3026
Ala Val Ala Leu Leu Ile Ala Leu Ala Val Leu Val Arg Tyr Cys Arg
830 835 840
CAG CGG GAG GCC AAA AGT GGT TAC CAG GCT GGT AAG AAG GAG ACC AAG 3074
Gin Arg Glu Ala Lys Ser Gly Tyr Gin Ala Gly Lys Lys G1U Thr Lys
845 850 855 860
GAC CTG TAT GCC CCC AAG CCC AGT GGC AAG GCC TCC AAG GGA AAC AAA 3122
Asp Leu Tyr Ala Pro Lys Pro Ser Gly Lys Ala ser Lys Cly Asn Lys
865 870 875
AGC AAA GGC AAG AAG AGC AAG TCC CCA AAG CCC GTG AAG CCA CTG GAG 3170
Ser Lys Gly Lys Lys Ser Lys Ser Pro Lye Pro Val Lys Pro Val G1U
880 885 890
-54CZ 288789 B6
GAC Aep GAG GAT GAG GCC CGG CTG CAG AAG TCC CTC AAG TTC AAC CTG ATG Het 3218
Glu Aep 695 Glu Ala Gly Leu Gin 900 Lys Ser Leu Lys Phe 905 Asn Leu
AGC GAT GCC CCT CGG GAC AGT CCC CGC ATC CAC CTG CCC CTC AAC TAC 3266
Ser Aep Ala Pro Gly Aep Ser Pro Arg Ile His Leu Pro Leu Αβη Tyr
910 915 920
CCA CCA GGC AG C; CCT GAC CTG GGC CGC CAC TAT CGC TCT AAC TCC CCA 3314
Pro Pro Gly Sér Pro Aap Leu Gly Arg His Tyr Arg Ser Asn Ser Pro
925 930 935 940
CTG CCT TCC ATC CAG CTG CAG CCC CAG TCA CCC TCA GCC TCC AAG AAG 3362
Leu Pro Ser Ile Gin Leu Gin Pro Gin Ser Pro Ser Ala Ser Lys Lys
945 950 955
CAC CAG GTG GTA CAG GAC CTG CCA CCT CCA AAC ACA TTC GTG GGC ACC 3410
His Gin Val Val Gin Asp Leu Pro Pro Ala Aen Thr Phe Val Gly Thr
960 965 970
CGG GAC ACC ACG TCC ACG GGC TCT GAG CAG TAC TCC GAC TAC AGC TAC 3458
Gly Asp Thr Thr Ser Thr Gly Ser Glu Gin Tyr Ser Asp Tyr Ser Tyr
975 980 985
CGC ACC AAC CCC CCC AAA TAC CCC AGC AAG CAG GTA GGC CAG CCC TTT 3506
Arg Thr Aen Pro Pro Lys Tyr Pro Ser Lys Gin Val Gly Gin Pro Phe
990 995 1000
CAG CTC AGC ACA CCC CAG CCC CTA CCC CAC CCC TAC CAC CGA GCC ATC 3554
Gin Leu Ser Thr Pro Gin Pro Leu Pro His Pro Tyr His Gly Ala Ile
1005 1010 1015 1020
TGG ACC GAG GTG TGG GAG TGATGGAGCA GGTTTACTGT GCCTGCCCGT Trp Thr Glu Val Trp Glu
1025
3602
GTTGGGGGCC AGCCTGAGCC AGCAGTGGGA GGTGGGGCCT TAGTGCCTCA CCGGGCACAC 3662
GGATTAGGCT GAGTGAAGAT TAAGGGAGGG TGTGCTCTGT GGTCTCCTCC CTGCCCTCTC 3722
CCCACTGGGG AGAGACCTGT GATTTGCCAA GTCCCTGGAC CCTGGACCAG CTACTGGGCC 37B2
TTATGGGTTG GGGGTGGTAG GCAGGTGAGC GTAAGTGGGG AGGGAAATGG GTAAGAAGTC 3842
TACTCCAAAC CTAGGTCTCT ATGTCAGACC ACACCTAGGT GCTTCTCTAG GAGGGAAACA 3902
GGGAGACCTG GGGTCCTGTG GATAACTGAG TGGGGAGTCT GCCAGGGGAG GGCACCTTCC 3962
CATTCTGCCT TCTGTGTGTA TTGTGCATTA ACCTCTTCCT CACCACTAGG CTTCTGGGGC 4022
TGGGTCCCAC ATGCCCTTGA CCCTGACAAT AAAGTTCTCT ATTTTTGGAA ΑΑΑΑΑΑΑΑΑΑ 4082
ΑΑΑΑΑΑΑΑΑΑ ΑΑΑΑΑΑΑΑΑΆ AA 4104
-55CZ 288789 B6 (2) INFORMACE O SEQ ID NO:95:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 1026 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:95:
Met Glu Pro Leu Arg Ηΐβ Ser Pro Gly Pro Gly Gly Gin Arg Leu 15 Leu
1 5 10
Leu Pro Ser Met 20 Leu Leu Ala Leu Leu 25 Leu Leu Leu Ala Pro 30 Ser Pro
Gly His Ala 35 Thr Arg Val Val Tyr 40 Lys Val Pro Glu Glu 45 Gin Pro Pro
Asn Thr 50 Leu Ile Gly Ser Leu 55 Ala Ala Asp Tyr Gly Phe 60 Pro Asp Val
Gly 65 His Leu Tyr Lys Leu 70 Glu Val Gly Ala Pro 75 Tyr Leu Arg Val Asp 80
Gly Lys Thr Gly Asp 85 Ile Phe Thr Thr Glu 90 Thr Ser Ile Asp Arg 95 Glu
Gly Leu Arg Glu 100 Cys Gin Asn Gin Leu 105 Pro Gly Asp Pro Cye 110 Ile Leu
Glu Phe Glu 115 Val Ser Ile Thr Asp 120 Leu Val Gin Asn Ala 125 Ser Pro Arg
Leu Leu 130 Glu Gly Gin Ile Glu 135 Val Gin Asp Ile Asn Asp 140 Aen Thr Pro
Asn 145 Phe Ala Ser Pro Val 150 Ile Thr Leu Ala Ile 155 Pro Glu Asn Thr Asn 160
Ile Gly Ser Leu Phe 165 Pro Ile Pro Leu Ala 170 Ser Asp Arg Asp Ala 175 Gly
Pro Asn Gly Val 180 Ala Ser Tyr Glu Leu 185 Gin Val Ala Glu Asp 190 Gin Glu
Glu Lys Gin 195 Pro Gin Leu Ile Val 200 Met Gly Aen Leu Asp 205 Arg Glu Arg
Trp Asp 210 Ser Tyr Asp Leu Thr 215 Ile Lys Val Gin Asp Gly 220 Gly Ser Pro
Pro 225 Arg Ala Thr Ser Ala 230 Leu Leu Arg Val Thr 235 Val Leu Asp Thr Asn 240
Asp Asn Ala Pro Lys 245 Phe Glu Arg Pro Ser 250 Tyr Glu Ala Glu Leu 255 Ser
Glu Asn Ser Pro Ile Gly His Ser Val Ile Gin Val LyB Ala Asn Asp
260 265 270
-56CZ 288789 B6
Ser Aep Gin Gly Ala Asn Ala Glu 280 Ile Glu Tyr Thr Phe 285 Hle Gin Ala
275
Pro Glu Val Val Arg Arg Leu Leu Arg Leu Αβρ Arg Asn Thr cly Leu
290 295 300
Ile Thr Val Gin Gly Pro Val Asp Arg Glu Asp Leu Ser Thr Leu Arg
305 310 315 320
Phe Ser Val Leu Ala Lys Asp Arg Gly Thr Asn Pro Lys Ser Ala Arg
325 330 335
Ala Gin Val Val Val Thr Val Lys Asp Met Asn Asp Aen Ala Pro Thr
340 345 350
Ile Glu Ile Arg Gly Ile Gly Leu Val Thr Híb Gin Asp Gly Met Ala
355 360 365
Aen Ile Ser Glu Asp Val Ala Glu Glu Thr Ala Val Ala Leu Val Gin
370 375 380
Val Ser Asp Arg Asp Glu Gly Glu Asn Ala Ala Val Thr Cys Val Val
385 390 395 400
Ala Gly Asp Val Pro Phe Gin Leu Arg Gin Ala Ser Glu Thr Gly Ser
405 410 415
Aep Ser Lys Lys Lye Tyr Phe Leu Gin Thr Thr Thr Pro Leu Asp Tyr
420 425 430
Glu Lye Val Lys Asp Tyr Thr Ile Glu Ile Val Ala Val Aep Ser Gly
435 440 445
Aen Pro Pro Leu Ser Ser Thr Asn Ser Leu Lys Val Gin Val Val Asp
450 455 460
Val Asn Asp Asn Ala Pro Val Phe Thr Gin Ser Val Thr Glu Val Ala
465 470 475 480
Phe Pro Glu Asn Asn Lys Pro Gly Glu Val Ile Ala Glu Ile Thr Ala
485 490 495
Ser Asp Ala Asp Ser Gly Ser Asn Ala Glu Leu Val Tyr Ser Leu Glu
500 505 510
Pro Glu Pro Ala Ala Lys Gly Leu Phe Thr Ile Ser Pro Glu Thr Gly
515 520 525
Glu Ile Gin Val Lys Thr Ser Leu Asp Arg Glu Gin Arg Glu Ser Tyr
530 535 540
Glu Leu Lys Val Val Ala Ala Asp Arg Gly Ser Pro Ser Leu Gin Gly
545 550 555 560
Thr Ala Thr Val Leu Val Asn Val Leu Asp Cys Asn Asp Asn Asp Pro
565 570 575
Lye Phe Met Leu Ser Gly Tyr Asn Phe Ser Val Met Glu Asn Met Pro
580 585 590
-57CZ 288789 B6
Ala Leu Ser Pro Val Gly Met Val Thr Val 600 Ile Asp Gly 605 Asp LyB Gly
595
Clu Aen Ala Gin Val Gin Leu Ser Val Glu Gin Asp Asn Gly ABp Phe
610 615 620
Val Ile Gin Asn Gly Thr Gly Thr Ile Leu Ser Ser Leu Ser Phe Aep
625 630 635 640
Arg Glu Gin Gin Ser Thr Tyr Thr Phe Gin Leu Lys Ala Val Asp Gly
645 650 655
Gly Val Pro Pro Arg Ser Ala Tyr Val Gly Val Thr Ile Asn Val Leu
660 665 670
Asp Glu Asn Asp Asn Ala Pro Tyr Ile Thr Ala Pro Ser Asn Thr Ser
675 680 685
Hle Lya Leu Leu Thr Pro Gin Thr Arg Leu Gly Glu Thr Val Ser Gin
690 695 700
Val Ala Ala Glu Asp Phe Asp Ser Gly Val Asn Ala Glu Leu Ile Tyr
705 710 715 720
Ser Ile Ala Gly Gly Asn Pro Tyr Gly Leu Phe Gin Ile Gly Ser His
725 730 735
Ser Gly Ala Ile Thr Leu Glu Lys Glu Ile Glu Arg Arg His His Gly
740 745 750
Leu His Arg Leu Val Val Lys Val Ser Asp Arg Gly LyB Pro Pro Arg
755 760 765
Tyr Gly Thr Ala Leu Val His Leu Tyr Val Asn Glu Thr Leu Ala Asn
770 775 780
Arg Thr Leu Leu Glu Thr Leu Leu Gly His Ser Leu Asp Thr Pro Leu
785 790 795 800
ABp Ile Asp Ile Ala Gly Asp Pro Glu Tyr Glu Arg Ser Lys Gin Arg
805 810 815
Gly Asn Ile Leu Phe Gly Val Val Ala Gly Val Val Ala val Ala Leu
820 825 830
Leu Ile Ala Leu Ala Val Leu Val Arg Tyr Cye Arg Gin Arg Glu Ala
835 840 845
Lys Ser Gly Tyr Gin Ala Gly Lys Lys Glu Thr Lys Asp Leu Tyr Ala
850 855 860
Pro Lys Pro Ser Gly Lys Ala Ser Lys Gly Asn Lys Ser Lys Gly Lys
865 870 875 880
Lys Ser Lys Ser Pro Lys Pro Val Lys Pro Val Glu Asp Glu Asp Glu
885 890 895
Ala Gly Leu Gin Lys Ser Leu Lys Phe Asn Leu Met Ser Asp Ala Pro
900 905 910
-58CZ 288789 B6
Gly Aep ser Pro Arg Xle His Leu Pro Leu Asn Tyr Pro Pro Gly Ser
915 920 925
Pro Aep Leu Gly Arg Hie Tyr Arg Ser Asn Ser Pro Leu Pro Ser Ile
930 935 940
Gin Leu Gin Pro Gin Ser Pro Ser Ala Ser Lys Lys Hie Gin Val Val
945 950 955 960
Gin Aep Leu Pro Pro Ala Asn Thr Phe Val Gly Thr Gly Asp Thr Thr
965 970 975
Ser Thr Gly Ser Glu Gin Tyr Ser Asp Tyr Ser Tyr Arg Thr Asn Pro
980 985 990
Pro Lye Tyr Pro Ser Lys Gin Val Gly Gin Pro Phe Gin Leu Ser Thr
995 1000 1005
Pro Gin Pro Leu Pro His Pro Tyr His Gly Ala Ile Trp Thr Glu Val
1010 1015 1020
Trp Glu
1025 (2) INFORMACE O SEQ ID NO:96:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 4705 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 115..2827 (xi) POPIS SEKVENCE: SEQ ID NO:96:
CGAAAGCCAT GTCGGACTCG TCGCCCAGCG CCCAAGCGCT AACCCGCTGA AAGTTTCTCA
GCGAAATCTC AGGGACGATC TGGACCCCGC TGAGAGGAAC TGCTTTTGAG TGAG ATG Met 1
117
GTC Val CCA Pro GAG GCC Glu Ala 5 TGG AGG AGC GGA CTG GTA AGC ACC GGG AGG GTA GTG 165
Trp Arg Ser Gly Leu 10 Val Ser Thr Gly Arg 15 Val Val
GGA GTT TTG CTT CTG CTT GGT GCC TTG AAC AAG GCT TCC ACG GTC ATT 213
Gly Val Leu Leu Leu Leu Gly Ala Leu Asn Lye Ala Ser Thr Val Ile
20 25 30
CAC TAT GAG ATC CCG GAG GAA AGA GAG AAG GGT TTC GCT GTG GGC AAC 261
Hie Tyr Glu Ile Pro Glu Glu Arg Glu Lys Gly Phe Ala Val Gly Aen
35 40 45
-59CZ 288789 B6
CTC CTC GCG Val Val Ala 50 AAC CTT GGT TTG GAT CTC GGT AGC CTC TCA GCC CGC AGC 309
Asn Leu Cly 55 Leu Asp Leu Gly Ser 60 Leu Ser Ala Arg Arg 65
TTC CCG GTG GTG TCT GGA CCT AGC CGA AGA TTC TTT CAG GTG AAC CGC 357
Phe Pro Val Val Ser Gly Ala Ser Arg Arg Phe Phe Glu Val Asn Arg
70 75 80
CAG ACC CGA GAG ATC TTT CTG AAC CAC CGT CTG GAT CGA GAG CAG CTG 405
Glu Thr Gly Glu Met Phe Val Aen Asp Arg Leu Aep Arg Glu Glu Leu
85 90 95
TGT GCG ACA CTG CCC TCT TGC ACT GTA ACT CTG GAG TTG GTA GTG GAG 453
Cys Gly Thr Leu Pro Ser Cys Thr Val Thr Leu Glu Leu Val Val Glu
100 105 110
AAC CCG CTG CAG CTG TTC AGC CTG CAA GTG GTG ATC CAG CAC ATC AAC 501
Asn Pro Leu Clu Leu Phe Ser Val Clu Val Val Ile Cln Asp Ile Asn
115 120 125
GAC AAC AAT CCT CCT TTC CCT ACC CAG CAA ATG AAA TTG CAG ATT AGC 549
Asp Aan Aen Pro Ala Phe Pro Thr Cln Glu Het Lys Leu Clu Ile Ser
130 135 140 145
CAG GCC GTG CCT CCG GGG ACG CGC TTT CCG CTC CAG AGC CCC CAC GAT 597
Glu Ala val Ala Pro Cly Thr Arg Phe Pro Leu Clu Ser Ala His Asp
150 155 160
CCC GAT CTG CGA AGC AAC TCT TTA CAA ACC TAT GAG CTC ACC CGA AAT 645
Pro Asp Leu Gly Ser Asn Ser Leu Cln Thr Tyr Glu Leu Ser Arg Asn
165 170 175
GAA TAC TTT CCG CTT CGC GTG CAG ACG CGG CAG CAC ACC ACC AAG TAC 693
Glu Tyr Phe Ala Leu Arg Val Cln Thr Arg Glu Asp Ser Thr Lys Tyr
180 185 190
GCG GAG CTG CTG TTG GAG CGC GCC CTG GAC CGA CAA CGG GAG CCT AGT 741
Ala Clu Leu Val Leu Glu Arg Ala Leu Asp Arg Clu Arg Glu Pro Ser
195 200 205
CTC CAG TTA CTC CTG ACG GCG TTG GAC GGA CGG ACC CCA CCT CTC TCC 789
Leu Gin Leu Val Leu Thr Ala Leu Asp Cly Cly Thr Pro Ala Leu Ser
210 215 220 225
GCC AGC CTG CCT ATT CAC ATC AAG GTG CTG CAC CCG AAT CAC AAT GCG 837
Ala Ser Leu Pro Ile His Ile Lys Val Leu Asp Ala Asn Asp Asn Ala
230 235 240
CCT CTC TTC AAC CAG TCC TTG TAC CCG CCG CGC CTT CCT CGA GGA TGC 885
Pro val Phe Asn Gin Ser Leu Tyr Arg Ala Arg Val Pro Cly Gly Cys
245 250 255
ACC TCC GGC ACC CGC GTG GTA CAA GTC CTT CCA ACG GAT CTG GAT GAA 933
Thr Ser Gly Thr Arg Val Val Gin Val Leu Ala Thr Asp Leu Asp Glu
260 265 270
GCC CCC AAC GGT GAA ATT ATT TAC TCC TTC GGC AGC CAC AAC CCC GCC 981
Gly Pro Aen Gly Glu Ile Ile Tyr Seř Phe Gly Ser His Asn Arg Ala
275 280 285
-60CZ 288789 B6
GGC CTG CGG Gly Val Arg 290 CAA Gin CTA TTC GCC TTA GAC CTT GTA ACC GGG ATG CTG ACA 1029
Leu Phe 295 Ala Leu Asp Leu Val 300 Thr Gly Met Leu Thr 305
ATC AAG GGT CGG CTG GAC TTC GAG GAC ACC AAA CTC CAT GAG ATT TAC 1077
Xle Lye Gly Arg Leu Asp Phe Glu Asp Thr Lys Leu His Glu Ile Tyr
310 315 320
ATC CAG GCC AAA GAC AAG GGC GCC AAT CCC GAA GGA GCA CAT TGC AAA 1125
Ile Gin Ala Lys Asp Lye Gly Ala Asn Pro Glu Gly Ala His Cys Lys
325 330 33S
GTG TTG GTG GAG GTT GTG GAT GTG AAT GAC AAC GCC CCG GAG ATC ACA 1173
Val Leu Val Glu Val Val Aep Val Asn Asp Asn Ala Pro Glu Ile Thr
340 345 350
GTC ACC TCC GTG TAC AGC CCA GTA CCC GAG GAT GCC TCT GGG ACT GTC 1221
Val Thr Ser Val Tyr Ser Pro Val Pro Clu Asp Ala Ser Cly Thr Val
355 360 365
ATC GCT TTG CTC AGT GTG ACT GAC CTG GAT GCT GGC GAG AAC CGG CTG 1269
Ile Ala Leu Leu Ser Val Thr Asp Leu Asp Ala Gly Glu Asn Gly Leu
370 375 380 3B5
GTG ACC TGC GAA GTT CCA CCG GGT CTC CCT TTC AGC ctt ACT TCT TCC 1317
Val Thr Cys Glu Val Pro pro Gly Leu Pro Phe Ser Leu Thr Ser Ser
390 395 400
CTC AAG AAT TAC TTC ACT TTG AAA ACC AGT GCA GAC CTG GAT CGG GAG 1365
Leu Lys Asn Tyr Phe Thr Leu Lys Thr Ser Ala Aep Leu Asp Arg Glu
405 410 415
ACT GTG CCA GAA TAC AAC CTC AGC ATC ACC GCC CGA GAC GCC CGA ACC 1413
Thr Val Pro Glu Tyr Asn Leu Ser Ile Thr Ala Arg Asp Ala Cly Thr
420 425 430
CCT TCC CTC TCA GCC CTT ACA ATA GTG CCT GTT CAA GTG TCC GAC ATC 1461
Pro Ser Leu Ser Ala Leu Thr Ile Val Arg Val Gin Val Ser Asp Ile
435 440 445
AAT GAC AAC CCT CCA CAA TCT TCT CAA TCT TCC TAC GAC CTT TAC ATT 1509
Asn Aep Asn Pro Pro Gin Ser Ser Gin Ser Ser Tyr Asp Val Tyr Xle
450 455 460 465
GAA GAA AAC AAC CTC CCC GGG GCT CCA ATA CTA AAC CTA AGT GTC TGG 1557
Glu Glu Asn Asn Leu Pro Gly Ala Pro Ile Leu Asn Leu Ser Val Trp
470 475 480
GAC CCC GAC GCC CCG CAG AAT GCT CGG CTT TCT TTC TTT CTC TTC CAG 1605
Asp Pro Asp Ala Pro Gin Asn Ala Arg Leu Ser Phe Phe Leu Leu Glu
485 490 495
CAA GGA GCT GAA ACC GGG CTA GTG GGT CGC TAT TTC ACA ATA AAT CCT 1653
Gin Gly Ala Glu Thr Gly Leu Val Gly Arg Tyr Phe Thr Ile Asn Arg
500 505 510
GAC AAT GGC ATA GTG TCA TCC TTA GTG CCC CTA GAC TAT CAG CAT CGG 1701
Αβρ Asn cly Ile Val Ser Ser Leu Val Pro Leu Asp Tyr Glu Asp Arg
515 520 525
-61CZ 288789 B6
CGG Arg 530 CAA TTT CAA TTA ACA GCT Thr Ala 535 CAT His ATC AGC CAT CGG GGC ACC CCG CTC 1749
Glu Phe Clu Leu Ile Ser Asp 540 Gly Gly Thr Pro Val 545
CTA GCC ACC AAC ATC AGC CTG AAC ATA TTT GTC ACT GAT CGC AAT GAC 1797
Leu Ala Thr Asn Zle Ser Val Asn Zle Phe Val Thr Asp Arg Asn Αβρ
550 555 560
AAT CCC CCC CAG GTC CTA TAT CCT CGG CCA GCT CGG AGC TCG GTG GAG 1845
Asn Ala Pro Cln Val Leu Tyr Pro Arg Pro Cly Gly Ser Ser Val Glu
565 570 575
ATG CTG CCT CGA GCT ACC TCA CCT CGC CAC CTA GTG TCA CGG GTG GTA 1893
Met Leu Pro Arg Gly Thr Ser Ala Cly His Leu val Ser Arg Val Val
580 585 590
GGC TGG CAC GCG GAT GCA CGG CAC AAT GCC TGG CTC TCC TAC AGT CTC 1941
Gly Trp Asp Ala Asp Ala Gly His Asn Ala Trp Leu Ser Tyr Ser Leu
595 600 60S
TTT CGA TCC CCT AAC CAG AGC CTT TTT GCC ATA CCG CTG CAC ACT GGT 1989
Phe Gly Ser Pro Asn Gin Ser Leu Phe Ala Ile Cly Leu His Thr Gly
610 615 620 625
CAA ATC AGT ACT GCC CGT CCA GTC CAA GAC ACA CAT TCA CCC AGG CAG 2037
Gin Ile Ser Thr Ala Arg Pro Val Cln Asp Thr Asp ser Pro Arg Gin
630 635 640
ACT CTC ACT CTC TTC ATC AAA CAC AAT GCC CAC CCT TCG CTC TCC ACC 2085
Thr Leu Thr Val Leu Zle Lys Asp Asn Cly Clu Pro Ser Leu Ser Thr
645 650 655
ACT GCT ACC CTC ACT GTG TCA GTA ACC GAC GAC TCT CCT GAA GCC CGA 2133
Thr Ala Thr Leu Thr Val Ser Val Thr Glu Asp Ser Pro Glu Ala Arg
660 665 670
GCC GAG TTC CCC TCT GCC TCT GCC CCC CCC CAG CAG AAA AAA AAT CTC 2181
Ala Clu Phe Pro Ser Gly Ser Ala Pro Arg Glu Gin Lys Lys Asn Leu
675 680 685
ACC TTT TAT CTA CTT CTT TCT CTA ATC CTG GTT TCT GTG CGC TTC CTG 2229
Thr Phe Tyr Leu Leu Leu Ser Leu Ile Leu Val Ser Val Gly Phe Val
690 695 700 705
GTC ACA GTG TTC CGA GTA ATC ATA TTC AAA GTT TAC AAG TGG AAG CAG 2277
Val Thr Val Phe Cly Val Zle Zle Phe Lys Val Tyr Lys Trp Lys Gin
710 715 720
TCT AGA GAC CTA TAC CGA GCC CCG CTG AGC TCA CTG TAC CGA ACA CCA 2325
Ser Arg Asp Leu Tyr Arg Ala Pro Val Ser Ser Leu Tyr Arg Thr Pro
725 730 735
CGG CCC TCC TTC CAC GCG GAC CCC GTG CGC CGA CGC CTG ATG TCG CCC 2373
Gly Pro Ser Leu His Ala Asp Ala Val Arg Gly Gly Leu Met Ser Pro
740 745 750
CAC CTT TAC CAT CAG GTG TAT CTC ACC ACG GAC TCC CGC CGC AGC GAC 2421
His Leu Tyr His Gin Val Tyr Leu Thr Thr Asp Ser Arg Arg Ser Asp
755 760 765
-62CZ 288789 B6
CCG Pro 770 CTG CTG AAG AAA Lye LyB CCT Pro 775 GGT GCA GCC AGT CCA CTG GCC AGC CGC CAG 2469
Leu Leu Gly Ala Ala Ser Pro 780 Leu Ala Ser Arg Cln 785
AAC ACG CTG CGG AGC TGT GAT CCG GTG TTC TAT AGG CAG GTG TTG GGT 2517
Asn Thr Leu Arg Ser Cys Asp Pro Val Phe Tyr Arg Gin Val Leu Cly
790 795 800
GCA GAG AGC GCC CCT CCC GGA CAG CAA GCC CCG CCC AAC ACG GAC TGG 2565
Ala Glu Ser Ala Pro Pro Gly Gin Gin Ala Pro Pro Aen Thr Asp Trp
805 810 815
CGT TTC TCT CAG GCC CAG AGA CCC GGC ACC AGC GGC TCC CAA AAT CCC 2613
Arg Phe Ser Gin Ala Gin Arg Pro Gly Thr Ser Gly Ser Gin Aen Gly
820 825 830
GAT GAC ACC GGC ACC TGG CCC AAC AAC CAG TTT GAC ACA CAC ATG CTG 2661
Αβρ Αβρ Thr Gly Thr Trp Pro Aen Asn Cln Phe Asp Thr Clu Het Leu
835 840 845
CAA GCC ATG ATC TTG GCG TCC GCC AGT GAA GCT GCT GAT GGG AGC TCC 2709
Gin Ala Met Ile Leu Ala Ser Ala Ser Glu Ala Ala Asp Gly Ser Ser
850 855 860 865
ACC CTG GGA GGG GGT GCC CGC ACC ATG GGA TTG ACC GCC CGC TAC GGA 2757
Thr Leu Gly Gly Gly Ala Gly Thr Het Gly Leu Ser Ala Arg Tyr Cly
870 875 880
ccc CAG TTC ACC CTG CAG CAC GTG CCC CAC TAC CGC CAG AAT GTC TAC 2805
Pro Gin Phe Thr Leu Gin His Val Pro Asp Tyr Arg Gin Aen Val Tyr
885 890 895
ATC CCA GGC AGC AAT GCA CAC T GACCAACGCA GCTGGCAAGC GGATGGCAAG 2857
Ile Pro Gly Ser Aen Ala Hle
900
GCCCAGCAGG TGGCAATGGC AACAAGAAGA AGTCGGCAAG AAGGAGAAGA AGTAACATGG 2917
AGGCCAGGCC AAGAGCCACA CGGCAGCCTC TCCCCGAACC AGCCCAGCTT CTCCTTACCT 2977
GCACCCACGC CTCAGAGTTT CAGGGCTAAC CCCCAGAATA CTGGTAGGGG CCAAGGCATC 3037
TCCCTTGGAA ACAGAAACAA GTGCCATCAC ACCATCCCTT CCCCAGGTCT AATATCCAAA 3097
GCAGTTCCGC TGGGAACCCC ATCCAATCAG TGGCTGTACC CATTTGGGTA CTGGGGTTCA 3157
TGTAGACACC AAGAACCATT TGCCACACCC CGTTTAGTTA CAGCTGAACC CTCCATCTTC 3217
CAAATCAATC AGGCCCATCC ATCCCATGCC TCCCTCCTCC CCACCCCACT CCAACAGTTC 3277
CTCTTTCCCG AGTAAGGTGG TTGGGGTGTT GAAGTACCAA GTAACCTACA AGCCTCCTAG 3337
TTCTGAAAAG TTGGAAGGGC ATCATGACCT CTTGGCCTCT CCTTTGATTC TCAATCTTCC 3397
CCCAAAGCAT GGTTTGGTGC CAGCCCCTTC ACCTCCTTCC AGACCCCAAG ATCAATGCTC 3457
AAGTTTTGGA GGACATGATC ACCATCCCCA TGGTACTGAT GCTTGCTGGA TTTAGGGAGG 3517
GCATTTTGCT ACCAAGCCTC TTCCCAACGC CCTGGGACCA GTCTTCTGTT TTGTTTTTCA 3577
TTGTTTGAGC TTTCCACTGC ATGCCTTGAC TTCCCCCACC TCCTCCTCAA ACAAGAGACT 3637
-63CZ 288789 B6
CCACTGCATG TTCCAAGACA GTATGGGGTG GTAAGATAAG GAAGGGAAGT GTGTGGATGT 3697
GGATGGTGGG GGCATGGACA AAGCTTGACA CATCAAGTTA TCAAGGCCTT GGAGGAGGCT 3757
CTGTATGTCC TCAGGGGACT GACAACATCC TCCAGATTCC AGCCATAAAC CAATAACTAG 3817
GCTGGACCCT TCCCACTACA TAATACGGCT CAGCCAGGCA GCCAGCTTTG GGCTGAGCTA 3877
ACAGGACCAA TGGATTAACT GGCATTTCAG TCCAAGGAAG CTCGAAGCAG GTTTAGGACC 3937
AGGTCCCCTT GAGAGGTCAG AGGGGCCTCT GTGGGTGCTG GGTACTCCAG AGGTGCCACT 3997
GGTGGAAGGG TCAGCGGAGC CCCAGCAGGA AGGGTGGGCC AGCCAGGCCA TTCTTAGTCC 4057
CTGGGTTGGG GAGGCAGGGA CCTAGGGCAG GGACCAAATG AACAGAAAGT CTCAGCCCAG 4117
GATGGGGCTT CTTCAACAGG CCCCTGCCCT CCTGAAGCCT CAGTCCTTCA CCTTGCCAGG 4177
TGCCGTTTCT CTTCCGTGAA GGCCACTGCC CAGGTCCCCA GTGCGCCCCC TAGTGGCCAT 4237
AGCCTGGTTA AAGTTCCCCA GTGCCTCCTT GTGATAGACC TTCTTCTCCC ACCCCCTTCT 4297
GCCCCTGGGT CCCCGGCCAT CCAGCGGGGC TGCCAGAGAA CCCCAGACCT GCCCTTACAG 4357
TAGTGTAGCG CCCCCTCCCT CTTTCGGCTG GTGTAGAATA GCCAGTAGTG TAGTGCGGTG 4417
TGCTTTTACG TGATGGCGGG TGGGCAGCGG GCGGCGGCGT CCGCGCAGCC GTCTGTCCTT 4477
GATCTGCCCG CGGCGGCCCG TGTTGTGTTT TGTGCTGTGT CCAGCGCTAA CGCGACCCCC 4537
TCCCCCGTAC TGACTTCTCC TATAAGCGCT TCTCTTCGCA TAGTCACGTA GCTCCCACCC 4597
CACCCTCTTC CTGTGTCTCA CGCAAGTTTT ATACTCTAAT ATTTATATGG CTTTTTTTCT 4657
TCGACAAAAA AATAATAAAA CGTTTCTTCT GAAAAAAAAA AAAAAAAA 4705
(2) INFORMACE O SEQ ID NO:97:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 904 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO:97:
Met Val Pro Glu Ala Trp Arg Ser Gly Leu 10 Val Ser Thr Gly Arg 15 Val
1 5
Val Gly Val Leu Leu Leu Leu Gly Ala Leu Asn Lys Ala Ser Thr Val
20 25 30
Ile Hie Tyr Glu Ile Pro Glu Glu Arg Glu Lys Gly Phe Ala Val Gly
35 40 45
Aen Val Val Ala Asn Leu Gly Leu Asp Leu Gly Ser Leu Ser Ala Arg
50 55 60
-64CZ 288789 B6
Arg 65 Phe Pro Val Val Ser Gly Ala Ser Arg Arg Phe Phe Glu Val Asn 80
70 75
Arg Glu Thr Gly Glu Met Phe Val Asn Asp Arg Leu Asp Arg Glu Glu
85 90 95
Leu Cys Gly Thr Leu Pro Ser Cys Thr Val Thr Leu Glu Leu Val Val
100 105 110
Glu Asn Pro Leu Glu Leu Phe Ser Val Glu Val Val Zle Gin Asp Zle
115 120 125
Asn Asp Asn Asn Pro Ala Phe Pro Thr Gin Glu Met Lys Leu Glu Zle
130 135 140
Ser Glu Ala Val Ala Pro Gly Thr Arg Phe Pro Leu Glu Ser Ala His
145 150 155 160
Asp Pro Asp Leu Gly Ser Asn Ser Leu Gin Thr Tyr Glu Leu Ser Arg
165 170 175
Asn Glu Tyr Phe Ala Leu Arg Val Gin Thr Arg Glu Asp Ser Thr Lys
180 185 190
Tyr Ala Glu Leu Val Leu Clu Arg Ala Leu Asp Arg Glu Arg Glu Pro
195 200 205
Ser Leu Gin Leu Val Leu Thr Ala Leu Asp Gly Gly Thr Pro Ala Leu
210 215 220
Ser Ala Ser Leu Pro Zle His Zle Lys Val Leu Asp Ala Asn Asp Asn
225 230 235 240
Ala Pro Val Phe Asn Gin Ser Leu Tyr Arg Ala Arg Val Pro Gly Gly
245 250 255
Cye Thr Ser Gly Thr Arg Val Val Gin Val Leu Ala Thr Asp Leu Asp
260 265 270
Glu Gly Pro Asn Gly Glu Zle Zle Tyr Ser Phe Gly Ser His Asn Arg
275 280 285
Ala Gly Val Arg Gin Leu Phe Ala Leu Asp Leu Val Thr Gly Met Leu
290 295 300
Thr lle Lys Gly Arg Leu Asp Phe Glu Asp Thr Lys Leu His Glu lle
305 310 315 320
Tyr lle Gin Ala LyB Asp Lys Gly Ala Asn Pro Glu Gly Ala His Cys
325 330 335
Lye Val Leu Val Glu Val Val Asp Val Asn Asp Asn Ala Pro Glu Zle
340 345 350
Thr Val Thr Ser Val Tyr Ser Pro Val Pro Glu Asp Ala Ser Gly Thr
35S 360 365
Val lle Ala Leu Leu Ser Val Thr Asp Leu Asp Ala Cly Glu Asn Gly
370 375 380
-65CZ 288789 B6
Leu 385 Val Thr Cye Glu Val 390 Pro Pro Gly Leu Pro Phe 395 Ser Leu Thr Ser 400
Ser Leu Lys Asn Tyr Phe Thr Leu Ly6 Thr Ser Ala Asp Leu Asp Arg
405 410 415
Glu Thr Val Pro Glu Tyr Asn Leu Ser Ile Thr Ala Arg Asp Ala Gly
420 425 430
Thr Pro Ser Leu ser Ala Leu Thr Ile Val Arg Val Gin Val Ser Asp
435 440 445
Ile Asn Asp Asn Pro Pro Gin Ser Ser Gin Ser Ser Tyr Asp Val Tyr
450 455 460
Ile Glu Glu Asn Asn Leu Pro Glý Ala Pro Ile Leu Asn Leu Ser Val
465 470 475 480
Trp Asp Pro Asp Ala Pro Gin Asn Ala Arg Leu Ser Phe Phe Leu Leu
485 490 495
Glu Gin Gly Ala Glu Thr Gly Leu Val Gly Arg Tyr Phe Thr Ile Asn
500 505 510
Arg Asp Asn Gly Ile Val Ser Ser Leu Val Pro Leu Asp Tyr Glu Asp
515 520 525
Arg Arg Glu Phe Glu Leu Thr Ala His Ile Ser Asp Gly Gly Thr Pro
530 535 540
Val Leu Ala Thr Asn Ile Ser Val Asn Ile Phe Val Thr Asp Arg Asn
545 550 555 560
Asp Asn Ala Pro Gin Val Leu Tyr Pro Arg Pro Gly Gly Ser Ser Val
565 570 575
Glu Met Leu Pro Arg Gly Thr Ser Ala Gly His Leu Val Ser Arg Val
580 585 590
Val Gly Trp Asp Ala Asp Ala Gly His Asn Ala Trp Leu Ser Tyr Ser
595 600 605
Leu Phe Gly Ser Pro Asn Gin Ser Leu Phe Ala Ile Gly Leu His Thr
610 615 620
Gly Gin Ile Ser Thr Ala Arg Pro Val Gin Asp Thr Asp Ser Pro Arg
625 630 635 640
Gin Thr Leu Thr Val Leu Ile Lys Asp Asn Gly Glu Pro Ser Leu Ser
645 650 655
Thr Thr Ala Thr Leu Thr Val Ser Val Thr Glu Asp Ser Pro Glu Ala
660 665 670
Arg Ala Glu Phe Pro Ser Gly ser Ala Pro Arg Glu Gin Lys Lys Asn
675 680 685
Leu Thr Phe Tyr Leu Leu Leu ser Leu Ile Leu Val Ser Val Gly Phe
690 695 700
-66CZ 288789 B6
Val 705 Val Thr Val Phe Gly 710 Val Ile Ile Phe Lys 715 Val Tyr Lys Trp Lys 720
Gin Ser Arg Asp Leu Tyr Arg Ala Pro Val Ser Ser Leu Tyr Arg Thr
725 730 735
Pro Gly Pro Ser Leu Hie Ala Asp Ala Val Arg Gly Gly Leu Met Ser
740 745 750
Pro His Leu Tyr His Gin Val Tyr Leu Thr Thr Asp Ser Arg Arg Ser
755 760 765
Asp Pro Leu Leu Lys Lys Pro Gly Ala Ala Ser Pro Leu Ala Ser Arg
770 775 780
Gin Asn Thr Leu Arg Ser Cys Asp Pro Val Phe Tyr Arg Gin Val Leu
785 790 795 800
Gly Ala Glu Ser Ala Pro Pro Gly Gin Gin Ala Pro Pro Asn Thr Asp
805 810 815
Trp Arg Phe Ser Gin Ala Gin Arg Pro Gly Thr Ser Gly Ser Gin Aen
820 825 830
Gly Asp Aap Thr Gly Thr Trp Pro Asn Asn Gin Phe Asp Thr Glu Met
835 840 845
Leu Gin Ala Met Ile Leu Ala Ser Ala Ser Glu Ala Ala Asp Gly Ser
850 855 860
Ser Thr Leu Gly Gly Gly Ala Gly Thr Met Gly Leu Ser Ala Arg Tyr
865 870 875 880
Gly Pro Gin Phe Thr Leu Gin His Val Pro Asp Tyr Arg Gin Asn Val
885 890 895
Tyr Ile Pro Gly Ser Asn Ala Hie
900 (2) INFORMACE O SEQ ID NO:98:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 441 bázových párů (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO:98:
Asp Trp Val Ile Pro Pro Ile Asn Leu Pro Glu Asn Ser Arg Gly Pro 15 10 15
Phe Pro Gin Glu Leu Val Arg Ile Arg Ser Asp Arg Asp Lys Asn Leu 20 25 30
-67CZ 288789 B6
Ser Leu Arg Tyr Thr Val Thr Gly 40 Pro Cly Ala Asp Gin 45 Pro Pro Thr
35
Gly Ile Phe Ile Ile Asn Pro Ile Ser Gly Gin Leu Ser Val Thr Lys
50 55 60
Pro Leu Asp Arg Glu Gin Ile Ala Arg Phe His Leu Arg Ala Híb Ala
65 70 75 80
Val Aep Ile Asn Cly Asn Gin Val Glu Asn Pro Ile Asp Ile Val Ile
85 90 95
Aan Val Ile Asp Met Asn Asp Asn Arg Pro Glu Phe Thr Ala Met Thr
100 105 110
Phe Tyr Gly Glu Val Pro Glu Asn Arg Val Asp Ile Ile Val Ala Asn
115 120 125
Leu Thr Val Thr Asp Lys Asp Gin Pro His Thr Pro Ala Trp Asn Ala
130 135 140
Val Thr Arg Ile Ser Gly Gly Asp Pro Thr Gly Arg Phe Ala Ile Gin
Ů45 150 155 160
Thr Aap Pro Asn Ser Asn Asp Gly Leu Val Thr Val Val Lys Pro Ile
165 170 175
Asp Phe Glu Thr Asn Arg Met Phe Val Leu Thr Val Ala Ala Glu Asn
180 185 190
Cln Val Pro Leu Ala Lys Gly Ile Gin His Pro Pro Gin Ser Thr Ala
195 200 205
Thr Val Ser Val Thr Val Ile Asp Val Asn Glu Asn Pro Tyr Phe Ala
210 215 220
Pro Asn Pro Lys Ile Ile Arg Gin Glu Clu Gly Leu His Ala Cly Thr
225 230 235 240
Met Leu Thr Thr Phe Thr Ala Cly Asp Pro Asp Arg Tyr Met Gin Cln
245 250 255
Aan Ile Arg Tyr Thr Lys Leu Ser Asp Pro Ala Asn Trp Leu-Lys Ile
260 265 270
Asp Pro Val Asn Gly Gin Ile Thr Thr Ile Ala Val Leu Asp Arg Clu
275 280 285
Ser Pro Asn Val Lys Asn Asn Ile Tyr Asn Ala Thr Phe Leu Ala Ser
290 295 300
Asp Asn Gly Ile Pro Pro Met Ser Gly Thr Gly Thr Leu Gin Ile Tyr
305 310 315 320
Leu Leu Asp Ile Asn Asp Asn Ala Pro Gin Val Leu Pro Gin Glu Ala
325 330 335
Glu Thr Cys Glu Thr Pro Asp Pro Asn Ser Ile Aen Ile Thr Thr Ala
340 345 350
-68CZ 288789 B6
Leu Aep Tyr Asp 355 Ile Asp Pro Asn Ala Cly Pro Phe Ala Tyr Asp Leu
360 365
Pro Leu Ser Pro Val Thr Ile Lys Arg Asn Trp Thr Ile Thr Arg Leu
370 375 380
Asn Gly Asp Phe Ala Gin Leu Asn Leu Lys Ile Lys Phe Leu Glu Ala
385 390 395 400
Gly Ile Tyr Glu Val Pro Ile Ile Ile Thr Asp Ser Gly Asn Pro Pro
405 410 415
Lye Ser Asn Lye Ser Ile Leu Arg Val Arg Val Cye Gin Cys Asp Phe
420 425 430
Asn Gly Asp Cys Thr Asp Val Asp Arg
435 440 (2) INFORMACE O SEQ ID NO:99:
(i) (ii) (xi) CHARAKTERISTIKA SEKVENCE: (A) DÉLKA: 105 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární TYP MOLEKULY: protein POPIS SEKVENCE: SEQ ID NO:99:
Glu Aep Thr Val Tyr Ser Phe Asp Ile Pro Glu Asn Ala Gin Arg Gly
1 5 10 15
Tyr Gin Val Gly Gin Ile Val Ala Arg Asp Ala Asp Leu Gly Gin Asn
20 25 30
Ala Gin Leu Ser Tyr Gly Val Val Ser Asp Trp Ala Asn Asp Val Phe
35 40 45
Ser Leu Asn Pro Gin Thr Gly Met Leu Thr Leu Thr Ala Arg Leu Asp
50 55 60
Tyr Glu Glu Val Gin His Tyr Ile Leu Ile Val Gin Ala Gin Asp Asn
65 70 75 80
Gly Gin Pro Ser Leu Ser Thr Thr Ile Thr Val Tyr Cys Asn Val Leu
85 90 95
Asp Leu Asn Asp Asn Ala Pro Ile Phe
100 105 (2) INFORMACE O SEQ ID NO: 100:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 7 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 100:
Asp Xaa Asp Xaa Gly Xaa Asn
5
-69CZ 288789 B6 (2) INFORMACE O SEQ ID NO: 101:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 7 aminokyselin (B) TYP: aminokyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 101:
Ala Xaa Asp Xaa Gly Xaa Pro
5 (2) INFORMACE O SEQ ID NO: 102:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 4650 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 495..4103 (xi) POPIS SEKVENCE: SEQ ID NO: 102:
CCTCTATTCG ACATTCTCTT TGGATTGTTT TGCTATAACT TGAAATTTGG GATGTCACAA 60
ACGAAACTGT CATCTGTTTC CGCCAAACTG TGGTTCTGCT AATCTCCCAG GCTGGCAGCA 120
TTGGAGACTT GCTGACTTCT TTCATCCCCC ACTCTTTTCA CCTGAAATTC CTTTCCTTGG 180
TTTTGCTCTA AGTCCTATGC TTCAGTCACG GGCCAACCAA ATCTCACTGC CTCCTTTTTA 240
TCATGAAGCC TTTGATCACT GATAGTTCTT TTTATATCTT GAAAAATCAC CCTTCCCAGT 300
ACAGTTAATA TTTAGTATCT CTACTCATCT TGGCACTTAC TCACAGCTCC ATAATTCAGT 360
CGTTTTCGTA CCTCTTCATG GTGATGGGGA GCCCTTTCGA GGTGGTGACT GTGCTTTATA 420
CTCCTCATGA TGCTTCACAT GTGGCAGGCG TGGAGTGCCC GGAGGCGGCC CTCCTGATTC 480
-70CZ 288789 B6
TGGGGCCTCC CAGG ATG GAG CCC Pro CTG AGG CAC AGC CCA GGC CCT CGG Gly GGG Gly 530
Met Glu 1 Leu Arg 5 His Ser Pro Gly Pro 10
CAA CGG CTA CTG CTG CCC TCC ATG CTG CTA GCA CTG CTG CTC CTG CTG 578
Gin Arg Leu Leu Leu Pro Ser Met Leu Leu Ala Leu Leu Leu Leu Leu
15 20 25
GCT CCA TCC CCA GGC CAC GCC ACT CGG GTA GTG TAC AAG GTG CCG GAG 626
Ala Pro Ser Pro Gly His Ala Thr Arg Val Val Tyr Lys Val Pro Glu
30 35 40
GAA CAG CCA CCC AAC ACC CTC ATT GGG AGC CTC GCA GCC GAC TAT GGT 674
Glu Gin Pro Pro Asn Thr Leu Ile Gly Ser Leu Ala Ala Asp Tyr Gly
45 50 55 60
TTT CCA GAT GTG GGG CAC CTC TAC AAG CTA GAC GTG GGT CCC CCG TAC 722
Phe Pro Asp Val Gly His Leu Tyr Lys Leu Glu Val Gly Ala Pro Tyr
65 70 75
CTT CGC GTG GAT GGC AAG ACA GGT GAC ATT TTC ACC ACC GAG ACC TCC 770
Leu Arg Val Asp Cly Lys Thr Gly Asp Ile Phe Thr Thr Glu Thr Ser
80 85 90
ATC GAC CGT CAG GGG CTC CGT GAA TGC CAG AAC CAG CTC CCT GGT GAT 618
Ile ABp Arg Clu Gly Leu Arg Glu Cys Gin Αβπ Gin Leu Pro Gly Asp
95 100 105
CCC TGC ATC CTG CAG TTT GAG GTA TCT ATC ACA GAC CTC GTG CAG AAT 866
Pro Cys Ile Leu Clu Phe Glu Val Ser Ile Thr Asp Leu Val Gin Aen
110 115 120
GCG AGC CCC CGG CTG CTA GAG GGC CAG ATA GAA GTA CAA GAC ATC AAT 914
Ala Ser Pro Arg Leu Leu Glu Gly Gin Ile Glu Val Gin Aep Ile Asn
125 130 135 140
GAC AAC ACA CCC AAC TTC GCC TCA CCA GTC ATC ACT CTG GCC ATC CCT 962
Asp Asn Thr Pro Asn Phe Ala Ser Pro Val Ile Thr Leu Ala Ile Pro
145 150 155
GAG AAC ACC AAC ATC GGC TCA CTC TTC CCC ATC CCG CTG GCT TCA GAC 1010
Glu Asn Thr Asn Ile Gly Ser Leu Phe Pro Ile Pro Leu Ala Ser Asp
160 165 170
CGT GAT GCT CGT CCC AAC GGT CTG CCA TCC TAT GAG CTG CAG GTG GCA 1058
Arg Asp Ala Gly Pro Αβπ Gly Val Ala Ser Tyr Glu Leu Gin Val Ala
175 180 185
GAG GAC CAG GAG CAG AAG CAA CCA CAG CTC ATT GTG ATG GGC AAC CTG 1106
Glu Asp Gin Glu Glu Lys Gin Pro Gin Leu Ile Val Met Gly Asn Leu
190 195 200
GAC CGT GAG CGC TGG GAC TCC TAT GAC CTC ACC ATC AAG GTG CAG GAT 1154
Asp Arg Glu Arg Trp Asp Ser Tyr Asp Leu Thr Ile Lys Val Gin Asp
205 210 215 220
CGC GGC AGC CCC CCA CGC GCC ACG AGT GCC CTG CTG CGT GTC ACC GTG 1202
Gly Gly Ser Pro Pro Arg Ala Thr Ser Ala Leu Leu Arg Val Thr Val
225 230 235
-71CZ 288789 B6
CTT Leu CAC ACC AAT CAC AAC CCC CCC AAG TTT GAG CCG Arg CCC TCC TAT CAG Glu 1250
Asp Thr Asn Asp 240 Asn Ala Pro Lys 245 Phe Clu Pro Ser 250 Tyr
CCC GAA CTA TCT CAG AAT AGC CCC ATA CGC CAC TCG CTC ATC CAC CTG 1298
Ala Glu Leu Ser Clu Asn Ser Pro Ile Gly His Ser Val Ile Gin Val
255 260 265
AAG CCC AAT GAC TCA GAC CAA CCT GCC AAT CCA GAA ATC CAA TAC ACA 1346
Lys Ala Aen Asp Ser Asp Gin Gly Ala Asn Ala Glu Ile Clu Tyr Thr
270 275 280
TTC CAC CAC CCG CCC GAA GTT CTC ACC CGT CTT CTT CCA CTC CAC AGC 1394
Phe Hře Gin Ala Pro Clu Val Val Arg Arg Leu Leu Arg Leu Asp Arg
285 290 295 300
AAC ACT CGA CTT ATC ACT GTT CAG CGC CCG CTC GAC CGT CAG GAC CTA 1442
Asn Thr Gly Leu Ile Thr Val Cln Cly Pro Val Asp Arg Glu Asp Leu
305 310 315
ACC ACC CTG CGC TTC TCA GTG CTT GCT AAC GAC CGA CGC ACC AAC CCC 1490
Ser Thr Leu Arg Phe Ser Val Leu Ala Lys Asp Arg Cly Thr Asn Pro
320 325 330
AAC AGT GCC CGT CCC CAC CTG GTT GTC ACC CTG AAG GAC ATG AAT GAC 1538
Lye Ser Ala Arg Ala Cln Val Val Val Thr Val Lys Asp Met Asn Asp
335 340 345
AAT CCC CCC ACC ATT CAG. ATC CGC CCC ATA CCC CTA CTG ACT CAT CAA 1586
Aen Ala Pro Thr Ile Clu Ile Arg Gly Ile Cly Leu Val Thr Hie Gin
350 355 360
GAT GGG ATG GCT AAC ATC TCA CAG GAT GTG GCA GAG GAG ACA CCT CTG 1634
Aep Gly Met Ala Asn Ile Ser Clu Asp Val Ala Glu Glu Thr Ala Val
365 370 375 380
CCC CTG GTC CAC CTG TCT GAC CCA CAT CAG CCA GAG AAT GCA GCT GTC 1682
Ala Leu Val Cln Val Ser Asp Arg Asp Clu Gly Glu Asn Ala Ala Val
385 390 395
ACC TGT GTG GTG CCA CGT CAT CTG CCC TTC CAG CTC CGC CAG CCC AGT 1730
Thr Cya Val Val Ala Cly Asp Val Pro Phe Gin Leu Arg Gin Ala Ser
400 405 410
CAG ACA CGC AGT CAC AGC AAG AAG AAG TAT TTC CTG CAC ACT ACC ACC 1778
Glu Thr Cly Ser Asp Ser Lys Lys Lys Tyr Phe Leu Gin Thr Thr Thr
415 420 425
CCG CTA GAC TAC CAG AAG GTC AAA GAC TAC ACC ATT GAG ATT GTG CCT 1826
Pro Leu Asp Tyr Clu Lys Val Lys Asp Tyr Thr Ile Glu Zle Val Ala
430 435 440
GTG GAC TCT CGC AAC CCC CCA CTC TCC AGC ACT AAC TCC CTC AAG CTG 1874
Val Aep Ser Gly Asn Pro Pro Leu Ser Ser Thr Asn Ser Leu Lys Val
445 450 455 460
CAG GTG GTG GAC GTC AAT CAC AAC GCA CCT GTC TTC ACT CAG AGT CTC 1922
Gin Val Val Asp Val Asn Asp Asn Ala Pro Val Phe Thr Gin Ser Val
465 470 475
-72CZ 288789 B6
ACT GAG Thr Glu GTC Val GCC TTC CCG GAA AAC Asn AAC AAG CCT CGT CAA CTG ATT CCT Ala 1970
Ala Phe Pro 480 Clu Aen 485 Lye Pro Gly Clu Val 490 Ile
GAG ATC ACT GCC AGT CAT CCT GAC TCT CGC TCT AAT GCT GAG CTG CTT 2018
Glu Ile Thr Ala Ser Aep Ala Asp Ser Gly Ser Asn Ala Glu Leu Val
495 500 505
TAC TCT CTG CAG CCT CAC CCC GCT GCT AAC CCC CTC TTC ACC ATC TCA 2066
Tyr Ser Leu Glu Pro Glu Pro Ala Ala Lys Gly Leu Phe Thr Ile Ser
510 515 520
CCC GAG ACT GGA CAG ATC CAG GTG AAG ACA TCT CTC GAT CCC GAA CAG 2114
Pro Glu Thr Cly Glu Ile Gin Val Lys Thr Ser Leu Asp Arg Clu Cln
525 530 535 540
CGG GAG AGC TAT GAG TTG AAC CTG GTG GCA GCT GAC CGG CCC AGT CCT 2162
Arg Clu Ser Tyr Clu Leu Lye Val Val Ala Ala Asp Arg cly Ser Pro
545 550 555
AGC CTC CAG GGC ACA CCC ACT CTC CTT GTC AAT GTG CTG CAC TGC AAT 2210
Ser Leu Cln Gly Thr Ala Thr Val Leu Val Asn val Leu Asp Cye Asn
560 565 570
GAC AAT GAC CCC AAA TTT ATG CTG AGT CCC TAC AAC TTC TCA CTG ATC 2258
Asp Aen Asp Pro Lys Phe Met Leu Ser Gly Tyr Asn Phe Ser Val Met
575 seo 585
GAG AAC ATG CCA CCA CTC AGT CCA CTC CGC ATG GTG ACT CTC ATT GAT 2306
Glu Aen Met Pro Ala Leu Ser Pro val Gly Met Val Thr Val Ile Αβρ
590 595 600
CGA GAC AAG CCC CAC AAT GCC CAG CTG CAG CTC TCA CTG GAG CAG GAC 2354
Cly Αβρ Lye Gly Clu Asn Ala Gin Val Gin Leu Ser Val Glu Gin Asp
60S 610 615 620
AAC GGT GAC TTT CTT ATC CAG AAT CCC ACA GGC ACC ATC CTA TCC AGC 2402
Aen Gly Asp Phe Val Ile Gin Asn Gly Thr Gly Thr Ile Leu Ser Ser
625 630 635
CTC AGC TTT CAT CGA CAG CAA CAA AGC ACC TAC ACC TTC CAG CTG AAG 2450
Leu Ser Phe Asp Arg Clu Gin Gin Ser Thr Tyr Thr Phe Cln Leu Lys
640 645 650
GCA CTG GAT GGT GGC CTC CCA CCT CGC TCA CCT TAC CTT GGT CTC ACC 2498
Ala Val Asp Gly Gly Val Pro Pro Arg Ser Ala Tyr Val Gly Val Thr
655 660 665
ATC AAT CTG CTG GAC CAG AAT GAC AAC GCA CCC TAT ATC ACT CCC CCT 2546
Ile Aen Val Leu Asp Glu Asn Asp Asn Ala Pro Tyr Ile Thr Ala Pro
670 675 680
TCT AAC ACC TCT CAC AAG CTG CTG ACC CCC CAG ACA CGT CTT GGT CAG 2594
Ser Asn Thr Ser His Lys Leu Leu Thr Pro Gin Thr Arg Leu Cly Glu
685 690 695 700
ACG CTC AGC CAG CTG CCA GCC CAG GAC TTT GAC TCT GGT GTC AAT GCC 2642
Thr Val Ser Gin Val Ala Ala Clu Asp Phe Asp Ser Gly Val Asn Ala
705 710 715
-73CZ 288789 B6
GAC Clu CTG Leu ATC TAC AGC Ile Tyr Ser 720 ATT Ile CCA CGT CGC AAC CCT TAT CGA CTC TTC CAG cín 2690
Ala Gly Cly 725 Αβη Pro Tyr Gly Leu 730 Phe
ATT GGG TCA CAT TCA GGT CCC ATC ACC CTG GAG AAG GAG ATT CAG CGG 2738
Ile Gly Ser His Ser Gly Ala Ile Thr Leu Clu Lys Clu Ile Clu Arg
735 740 745
CGC CAC CAT CGG CTA CAC CGC CTC GTG GTG AAG GTC AGT CAC CGC CGC 2786
Arg Hle Hle Cly Leu His Arg Leu Val Val Lys Val Ser Asp Arg Gly
750 755 760
AAG CCC CCA CGC TAT GGC ACA GCC TTG GTC CAT CTT TAT CTC AAT GAG 2834
Lys Pro Pro Arg Tyr Gly Thr Ala Leu Val Híb Leu Tyr Val Asn Clu
765 770 775 780
ACT CTG GCC AAC CGC ACG CTG CTG CAG ACC CTC CTG GGC CAC AGC CTG 2882
Thr Leu Ala Asn Arg Thr Leu Leu Glu Thr Leu Leu Gly His ser Leu
785 790 795
GAC ACG CCG CTG GAT ATT GAC ATT GCT GGG GAT CCA CAA TAT CAC CCC 2930
Asp Thr Pro Leu Asp Ile Asp Ile Ala Gly Asp Pro Clu Tyr Clu Arg
800 805 810
TCC AAG CAG CCT CGC AAC ATT CTC TTT CGT CTG GTG CCT GGT CTC CTG 2978
Ser Lye Gin Arg Cly Asn Ile Leu Phe Gly Val Val Ala Gly Val Val
815 820 825
GCC GTG GCC TTG CTC ATC GCC CTG GCG GTT CTT GTG CGC TAC TGC AGA 3026
Ala Val Ala Leu Leu Ile Ala Leu Ala Val Leu Val Arg Tyr Cys Arg
830 835 840
CAG CGG CAG CCC AAA AGT CCT TAC CAG GCT GGT AAG AAG GAG ACC AAC 3074
Gin Arg Clu Ala Lys ser Cly Tyr Gin Ala Gly Lys Lye Glu Thr Lys
845 850 855 860
GAC CTG TAT CCC CCC AAG CCC AGT CGC AAG GCC TCC AAG CGA AAC AAA 3122
Asp Leu Tyr Ala Pro Lys Pro Ser Cly Lys Ala Ser Lys Gly Asn Lys
865 870 875
AGC AAA CGC AAG AAG AGC AAG TCC CCA AAG CCC GTG AAG CCA CTG GAG 3170
Ser Lys Gly Lye Lye Ser Lys Ser Pro Lys Pro Val Lye Pro Val Glu
880 885 S90
GAC GAG GAT GAG GCC GGG CTG CAG AAG TCC CTC AAG TTC AAC CTG ATG 3218
Asp Glu Aep Glu Ala Gly Leu Gin Lys Ser Leu Lys Phe Asn Leu Het
895 900 905
AGC GAT GCC CCT GGG GAC AGT CCC CGC ATC CAC CTG CCC CTC AAC TAC 3266
Ser Asp Ala Pro Gly Asp Ser Pro Arg Ile His Leu Pro Leu Asn Tyr
910 915 920
CCA CCA GGC AGC CCT GAC CTG GGC CGC CAC TAT CGC TCT AAC TCC CCA 3314
Pro Pro Gly Ser Pro Asp Leu Gly Arg His Tyr Arg Ser Asn Ser Pro
925 930 935 940
CTG CCT TCC ATC CAG CTG CAG CCC CAG TCA CCC TCA GCC TCC AAG AAG 3362
Leu Pro Ser Ile Gin Leu Gin Pro Gin Ser Pro Ser Ala Ser Lys Lys
945 950 955
-74CZ 288789 B6
CAC Hie CAG GTG GTA CAG GAC CTG CCA CCT GCA AAC ACA TTC GTG GGC Gly ACC Thr 3410
Cln Val Val Gin Asp 960 Leu Pro Pro 965 Ala Asn Thr Phe Val 970
CGG GAC ACC ACG TCC ACG GGC TCT GAG CAG TAC TCC GAC TAC AGC TAC 3458
Cly Asp Thr Thr Ser Thr Gly Ser Glu Gin Tyr Ser Asp Tyr Ser Tyr
975 980 985
CGC ACC AAC CCC CCC AAA TAC CCC AGC AAG CAG TTA CCT CAC CGC CGC 3506
Arg Thr Asn Pro Pro Lys Tyr Pro Ser LyB Gin Leu Pra Hie Arg Arg
990 995 1000
GTC ACC TTC TCG GCC ACC AGC CAG GCC CAG GAG CTG CAG GAC CCA TCC 3554
Val Thr Phe Ser Ala Thr Ser Gin Ala Gin Glu Leu Gin Asp Pro Ser
1005 1010 1015 1020
CAG CAC AGT TAC TAT GAC AGT GGC CTG GAG GAG TCT GAG ACG CCG TCC 3602
Gin His Ser Tyr Tyr Asp Ser Gly Leu Glu Glu Ser Glu Thr Pro Ser
1025 1030 1035
AGC AAG TCA TCC TCA GGG CCT CGA CTC GGT CCC CTG GCC CTG CCT GAG 3650
ser Lys Ser Ser Ser Gly Pro Arg Leu Gly Pro Leu Ala Leu Pro Glu
1040 1045 1050
GAT CAC TAT GAG CGC ACC ACC CCT GAT GGC AGC ATA GGA GAG ATG GAG 3698
Asp His Tyr Glu Arg Thr Thr Pro Asp Gly Ser Ile Gly Glu Met Glu
1055 1060 1065
CAC CCC GAG AAT GAC CTT CGC CCT TTG CCT GAT GTC GCC ATG ACA GGC 3746
His Pro Glu Asn Asp Leu Arg Pro Leu Pro Asp Val Ala Met Thr Gly
1070 1075 1080
ACA TGT ACC CGG GAG TGC AGT GAG TTT GGC CAC TCT GAC ACA TGC TGG 3794
Thr Cys Thr Arg Glu Cys Ser Glu Phe Gly Hie Ser Αβρ Thr Cys Trp
1085 1090 1095 1100
ATG CCT GGC CAG TCA TCT CCC AGC CGC CGG ACC AAG AGC AGC GCC CTC 3842
Met Pro Gly Gin Ser Ser Pro Ser Arg Arg Thr Lys Ser Ser Ala Leu
1105 1110 1115
AAA CTC TCC ACC TTC ATG CCT TAC CAG GAC CGA CGA GGG CAG GAG CCT 3890
Lys Leu Ser Thr Phe Met Pro Tyr Gin Asp Arg Gly Gly Gin Glu Pro
1120 1125 1130
CCG GGC GCC GGC AGC CCC AGC CCC CCG GAA GAC CGG AAC ACC AAA ACG 3938
Ala Gly Ala Gly Ser Pro Ser Pro Pro Glu Asp Arg Asn Thr Lye Thr
1135 1140 1145
GCC CCC GTG CGC CTC CTG CCC TCC TAC AGT GCC TTC TCC CAC AGT AGC 3986
Ala Pro Val Arg Leu Leu Pro Ser Tyr Ser Ala Phe Ser His Ser Ser
1150 1155 1160
CAT GAT TCC TGC AAG GAC TCG GCC ACC TTG GAG GAA ATC CCC CTG ACC 4034
His Asp Ser Cys Lys Asp Ser Ala Thr Leu Glu Glu Ile Pro Leu Thr
1165 1170 1175 1180
CAG ACC TCG GAC TTC CCA CCC GCA GCC ACA CCG GCA TCT GCC CAG ACG 4082
Gin Thr Ser Asp Phe Pro Pro Ala Ala Thr Pro Ala Ser Ala Gin Thr
1185 1190 1195
-75CZ 288789 B6
CAGCGCCGGC CAGCTCCCAA ATGCCCATTC CAGGGCCTCA CTCTCCACCC CTTCAGCGTG 4193
GACTTCCTGC CAGGGCCCAA GTGGGGGTAT CACTGACCTC ATGACCACGC TGGCCCTTCT 4253
CCCATGCAGG GTCCAGGTCC TCTCCCCTCA TTTCCATCTC CCAGCCCAGG GGCCCCTTCC 4313
CCTTTATGGG GCTTCCCCCA GCTGATGCCC AAGAGGGCTC CTCTGCAATG ACTGGGCTCC 4373
TTCCCTTGAC TTCCAGGGAG CACCCCCTCG ATTTGGGCAG ATGGTGGAGT CAAGGGTGGG 4433
CAGCGTACTT CTAACTCATT GTTTCCCTCA TGGCCGACCA GGGCGGGGAT AGCATGCCCA 4493
ATTTTAGCCC TGAAGCAGGG CTGAACTGGG GAGCCCCTTT CCCTCGGAGC TCCCAGAGGA 4553
AACTCTTGAC CACCAGTGGC TCCCTGAAGG GCTTTTGTTA CCAAAGGTGG CGTAGGGACG 4613
GGGGTGGGAG TGGAGCGGAG GCCTTGTTTT CCCGTCG 4650
(2) INFORMACE O SEQ ID NO: 103:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 1203 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 103:
Met Glu 1 Pro Leu Arg His Ser Pro Gly Pro Gly Gly Gin Arg Leu Leu
5 10 15
Leu Pro Ser Met Leu Leu Ala Leu Leu Leu Leu Leu Ala Pro Ser Pro
20 25 30
Gly His Ala Thr Arg Val Val Tyr Lys Val Pro Glu Glu Gin Pro Pro
35 40 45
Asn Thr Leu Ile Gly Ser Leu Ala Ala Asp Tyr Gly Phe Pro Asp Val
•50 55 60
Gly His Leu Tyr Lys Leu Glu Val Gly Ala Pro Tyr Leu Arg Val Asp
65 70 75 80
Gly Lye Thr Gly Asp Ile Phe Thr Thr Glu Thr Ser Ile Asp Arg Glu
85 90 95
Gly Leu Arg Glu Cys Gin Asn Gin Leu Pro Gly Asp Pro Cye Ile Leu
100 105 110
Glu Phe Glu Val Ser Zle Thr Asp Leu Val Gin Asn Ala Ser Pro Arg
115 120 125
-76CZ 288789 B6
Leu Leu 130 Clu Gly Gin lle Glu 135 Val Gin Asp lle Asn 140 Asp Asn Thr Pro
Asn Phe Ala Ser Pro Val lle Thr Leu Ala Tle Pro clu Aen Thr Asn
145 150 155 160
lle Gly Ser Leu Phe Pro Zle Pro Leu Ala Ser Asp Arg Asp Ala Cly
165 170 175
Pro Asn Gly Val Ala Ser Tyr Glu Leu Gin Val Ala Glu Asp Gin Glu
180 185 190
Glu Lys Gin Pro Cln Leu lle Val Met Gly Asn Leu Aep Arg Glu Arg
195 200 205
Trp Asp Ser Tyr Asp Leu Thr Zle Lys Val Gin Asp Gly Gly Ser Pro
210 215 220
Pro Arg Ala Thr Ser Ala Leu Leu Arg Val Thr Val Leu Asp Thr Asn
225 230 235 240
Aep Asn Ala Pro Lys Phe Glu Arg Pro Ser Tyr Clu Ala Clu Leu Ser
245 250 255
Glu Asn Ser Pro lle Gly His Ser Val Zle Gin Val Lys Ala Asn Asp
260 265 270
Ser Asp Gin Cly Ala Asn Ala Clu Zle Glu Tyr Thr Phe His Gin Ala
275 280 285
Pro Glu Val Val Arg Arg Leu Leu Arg Leu Asp Arg Asn Thr Gly Leu
290 295 300
I1A Thr Val Gin Gly Pro Val Asp Arg Clu Asp Leu Ser Thr Leu Arg
30 310 315 320
Phe Ser Val Leu Ala Lys Asp Arg Gly Thr Asn Pro Lys Ser Ala Arg
325 330 335
Ala Gin Val Val Val Thr Val Lys Asp Met Asn Asp Asn Ala Pro Thr
340 345 350
lle Glu lle Arg Gly Zle Gly Leu Val Thr His Cln Asp Gly Met Ala
355 360 365
Aen lle Ser Glu Asp Val Ala Glu Glu Thr Ala Val Ala Leu Val Gin
370 375 380
Val Ser Asp Arg Asp Glu Gly Glu Asn Ala Ala Val Thr Cys Val Val
385 390 395 400
Ala Gly Asp Val Pro Phe Gin Leu Arg Gin Ala Ser Glu Thr Gly Ser
405 410 415
Aep Ser Lys Lys Lys Tyr Phe Leu Gin Thr Thr Thr Pro Leu Asp Tyr
420 425 430
Glu LyB Val Lys Asp Tyr Thr lle Clu lle Val Ala Val Asp Ser Gly
435 440 445
-77CZ 288789 B6
Αβη Pro 450 Pro Leu Ser Ser Thr 455 Asn Ser Leu Lys Val Cln 460 Val Val Asp
Val Asn Asp Asn Ala Pro Val Phe Thr Gin Ser Val Thr Glu Val Ala
465 470 475 480
Phe Pro Glu Asn Asn Lys Pro Gly Glu Val Ile Ala Clu Ile Thr Ala
485 490 495
Ser Asp Ala Asp Ser Gly Ser Asn Ala Clu Leu Val Tyr Ser Leu Glu
500 505 510
Pro Glu Pro Ala Ala Lys Gly Leu Phe Thr Ile Ser Pro Glu Thr Gly
515 520 525
Clu Ile Cln Val Lys Thr Ser Leu Asp Arg Clu Gin Arg Glu Ser Tyr
530 535 540
Clu Leu Lys Val Val Ala Ala Asp Arg Gly Ser Pro Ser Leu Cln Gly
545 550 555 560
Thr Ala Thr Val Leu Val Asn Val Leu Asp Cys Asn Asp Asn Asp Pro
565 570 575
Lys Phe Het Leu Ser Cly Tyr Asn Phe Ser Val Met Glu Asn Met Pro
5B0 585 590
Ala Leu Ser Pro Val Gly Met Val Thr Val Ile Asp Gly Asp Lys Gly
595 600 605
Glu Asn Ala Gin Val Gin Leu Ser Val Glu Gin Asp Asn Gly Asp Phe
610 615 620
Val Ile Gin Asn Gly Thr Gly Thr Ile Leu Ser Ser Leu Ser Phe Asp
625 630 635 640
Arg Glu Gin Cln Ser Thr Tyr Thr Phe Cln Leu Lys Ala Val Asp Gly
645 650 655
Gly Val Pro Pro Arg Ser Ala Tyr Val Gly Val Thr Ile Asn Val Leu
660 665 670
Asp Glu Asn Asp Asn Ala Pro Tyr Ile Thr Ala Pro Ser Asn Thr Ser
675 680 685
His Lys Leu Leu Thr Pro Gin Thr Arg Leu Gly Clu Thr Val Ser Cln
690 695 700
Val Ala Ala Glu Asp Phe Asp Ser Gly Val Asn Ala Glu Leu Ile Tyr
705 710 715 720
Ser Ile Ala Gly Gly Asn Pro Tyr Gly Leu Phe Gin Ile Gly Ser His
725 730 735
Ser Gly Ala Ile Thr Leu Glu Lys Glu Ile Glu Arg Arg His HÍB Gly
740 745 750
Leu His Arg Leu Val Val Lys Val Ser Asp Arg Gly Lys Pro Pro Arg
755 760 765
-78CZ 288789 B6
Tyr Cly Thr Ala Leu Val His Leu Tyr 775 Val Asn Glu Thr 780 Leu Ala Asn
770
Arg Thr Leu Leu Glu Thr Leu Leu Gly His Ser Leu Asp Thr Pro Leu
705 790 795 800
Asp Ile Asp Ile Ala Gly Asp Pro Glu Tyr Clu Arg Ser Lys Gin Arg
805 810 815
Gly Aen Ile Leu Phe Gly Val Val Ala Gly Val Val Ala Val Ala Leu
820 825 830
Leu Ile Ala Leu Ala Val Leu Val Arg Tyr Cye Arg Gin Arg Glu Ala
835 840 845
Lys Ser Cly Tyr Gin Ala Gly Lys Lys Clu Thr Lys Asp Leu Tyr Ala
850 855 860
Pro Lye Pro Ser Gly Lys Ala Ser Lys Gly Asn Lye Ser Lys Cly Lys
065 870 875 880
Lys Ser Lys Ser Pro Lys Pro Val Lys Pro Val Glu Asp Glu Asp Glu
885 890 895
Ala Cly Leu Gin Lys Ser Leu Lys Phe Asn Leu Met Ser Asp Ala Pro
900 905 910
Gly Asp Ser Pro Arg Ile His Leu Pro Leu Asn Tyr Pro Pro Gly Ser
915 920 925
Pro Aep Leu Gly Arg His Tyr Arg Ser Αεη Ser Pro Leu Pro Ser Ile
930 935 940
Gin Leu Gin Pro Gin Ser Pro Ser Ala Ser Lya Lys His Gin Val Val
945 950 955 960
Gin Asp Leu Pro Pro Ala Asn Thr Phe Val Gly Thr Gly Asp Thr Thr
965 970 975
Ser Thr Gly Ser Glu Gin Tyr Ser Asp Tyr Ser Tyr Arg Thr Asn Pro
980 985 990
Pro Lys Tyr Pro ser Lys Gin Leu Pro His Arg Arg Val Thr Phe Ser
995 1000 1005
Ala Thr Ser Gin Ala Gin Clu Leu Gin Asp Pro Ser Gin His Ser Tyr
1010 1015 1020
Tyr Asp Ser Gly Leu Glu Glu Ser Clu Thr Pro Ser Ser Lys Ser Ser
1025 1030 1035 1040
Ser Gly Pro Arg Leu Gly Pro Leu Ala Leu Pro Glu Asp His Tyr Glu
1045 1050 1055
Arg Thr Thr Pro Asp Gly Ser Ile Gly Glu Het Glu His Pro Glu Asn
1060 1065 1070
Asp Leu Arg Pro Leu Pro Asp Val Ala Het Thr Gly Thr Cys Thr Arg
1075 1080 1085
-79CZ 288789 B6
Glu Cye Ser 1090 Glu Phe Gly His Ser 1095 Aep Thr Cys Trp Het 1100 Pro Gly Gin
Ser Ser Pro Ser Arg Arg Thr Lys Ser Ser Ala Leu Lys Leu Ser Thr
1105 1110 1115 1120
Phe Met Pro Tyr Gin Asp Arg Gly Gly Gin Glu Pro Ala Gly Ala Gly
1125 1130 1135
Ser Pro Ser Pro Pro Glu Asp Arg Asn Thr Lys Thr Ala Pro Val Arg
1140 1145 1150
Leu Leu Pro Ser Tyr Ser Ala Phe Ser His Ser Ser Hie Asp Ser Cye
1155 1160 1165
Lys Asp Ser Ala Thr Leu Glu Glu Ile Pro Leu Thr Gin Thr Ser Asp
1170 1175 1180
Phe Pro Pro Ala Ala Thr Pro Ala Ser Ala Gin Thr Ala Lys Arg Glu
1185 1190 1195 1200
Ile Tyr Leu (2) INFORMACE O SEQ ID NO: 104:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 2789 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 115..2622 (xi) POPIS SEKVENCE: SEQ ID NO: 104:
CGAAAGCCAT GTCGGACTCG TCGCCCAGCG CCCAAGCGCT AACCCGCTGA AAGTTTCTCA 60
CCGAAATCTC AGGGACGATC TGGACCCCGC TGAGAGGAAC TGCTTTTGAG TGAG ATG 117
Met
GTC Val CCA Pro GAG Glu GCC TGG Ala Trp 5 AGG AGC GGA CTG GTA AGC ACC GGG AGG GTA Val GTG Val 165
Arg Ser Gly Leu 10 Val Ser Thr Gly Arg 15
GGA GTT TTG CTT CTG CTT GGT GCC TTG AAC AAG GCT TCC ACG GTC ATT 213
Gly Val Leu Leu Leu Leu Gly Ala Leu Asn Lys Ala Ser Thr Val Ile
20 25 30
CAC TAT GAG ATC CCG GAG GAA AGA GAG AAG GGT TTC GCT GTG GGC AAC 261
His Tyr Glu Ile Pro Glu Glu Arg Glu Lys Gly Phe Ala Val Gly Asn
35 40 45
-80CZ 288789 B6
CTG Val 50 GTC Val GCG Ala AAC CTT GCT TTG GAT Asp CTC Leu CGT AGC CTC Leu TCA CCC CGC AGG Arg 65 309
Asn Leu Gly 55 Leu Cly Ser 60 Ser Ala Arg
TTC CCG GTG GTG TCT GGA GCT AGC CGA ACA TTC TTT GAG GTG AAC CCG 357
Phe Pro Val Val Ser Gly Ala Ser Arg Arg Phe Phe Glu Val Asn Arg
70 75 80
GAG ACC GGA GAG ATG TTT CTG AAC GAC CGT CTG GAT CGA CAG GAG CTG 405
Clu Thr Gly Glu Het Phe Val Asn Abd Arg Leu Asp Arg Clu Clu Leu
85 90 95
TCT CGG ACA CTG CCC TCT TGC ACT GTA ACT CTG GAG TTG GTA GTG GAG 453
Cys Gly Thr Leu Pro Ser Cys Thr Val Thr Leu Glu Leu Val Val Glu
100 105 110
AAC CCG CTG GAG CTG TTC AGC GTG CAA GTG GTG ATC CAG GAC ATC AAC 501
Asn Pro Leu Glu Leu Phe Ser Val Glu Val Val Ile Cln Aep Ile Aen
115 120 125
GAC AAC AAT CCT GCT TTC CCT ACC CAG GAA ATG AAA TTG GAG ATT AGC 549
Aep Aen Asn Pro Ala Phe Pro Thr Cln Glu Met Lys Leu Glu Ile Ser
130 135 140 145
GAG GCC GTG CCT CCG CGC ACG CGC TTT CCG CTC GAG AGC CCG CAC GAT 597
Glu Ala Val Ala Pro Gly Thr Arg Phe Pro Leu Glu Ser Ala His Aep
150 155 160
CCC GAT CTG GGA AGC AAC TCT TTA CAA ACC TAT GAG CTG ACC CGA AAT 645
Pro Αβρ Leu Gly Ser Asn Ser Leu Gin Thr Tyr Glu Leu Ser Arg Asn
165 170 175
GAA TAC TTT GCG CTT CGC CTG CAG ACG CGG GAG GAC AGC ACC AAG TAC 693
Glu Tyr Phe Ala Leu Arg Val Gin Thr Arg Glu Asp Ser Thr Lys Tyr
1B0 185 190
GCG GAG CTG GTG TTG GAG CGC GCC CTG GAC CGA GAA CGG GAG CCT AGT 741
Ala Glu Leu Val Leu Glu Arg Ala Leu Asp Arg Glu Arg Glu Pro Ser
195 200 205
CTC CAG TTA GTG CTG ACG GCG TTG GAC CGA GGG ACC CCA GCT CTC TCC 789
Leu Gin Leu Val Leu Thr Ala Leu Asp Gly Gly Thr Pro Ala Leu Ser
210 215 220 225
GCC AGC CTG CCT ATT CAC ATC AAG GTG CTG GAC GCG AAT GAC AAT GCG 837
Ala Ser Leu Pro Ile His Ile Lys Val Leu Asp Ala Asn Asp Αβη Ala
230 235 240
CCT GTC TTC AAC CAG TCC TTG TAC CGG GCG CGC GTT CCT GGA GGA TGC 885
Pro Val Phe Aan Gin Ser Leu Tyr Arg Ala Arg Val Pro Cly Gly Cys
245 250 255
ACC TCC GGC ACG CGC GTG GTA CAA GTC CTT GCA ACG GAT CTG GAT GAA 933
Thr Ser Gly Thr Arg Val Val Gin Val Leu Ala Thr Asp Leu Asp Glu
260 265 270
GGC CCC AAC CGT GAA ATT ATT TAC TCC TTC GGC AGC CAC AAC CGC GCC 981
Gly Pro Asn Gly Glu Ile Ile Tyr Ser Phe Gly Ser His Aen Arg Ala
275 280 285
-81CZ 288789 B6
CGC CTG CGG CAA CTA TTC GCC Phe Ala 295 TTA GAC Leu Asp CTT GTA ACC GCG Thr Gly ATC Met CTC ACA 1029
Gly 290 Val Arg Cln Leu Leu Val 300 Leu Thr 305
ATC AAG CGT CGG CTG GAC TTC GAG GAC ACC AAA CTC CAT GAG ATT TAC 1077
Ile Lys Gly Arg Leu Asp Phe Glu Asp Thr Lys Leu His Glu Zle Tyr
310 315 320
ATC CAG GCC AAA GAC AAG GGC GCC AAT CCC GAA GGA CCA CAT TGC AAA 1125
Ile Cln Ala Lys Asp Lys Gly Ala Asn Pro Glu Gly Ala His Cys Lys
325 330 335
CTG TTG GTG CAG GTT GTG GAT GTG AAT GAC AAC GCC CCG GAG ATC ACA 1173
Val Leu Val Glu Val Val Asp Val Asn Asp Asn Ala Pro Glu Ile Thr
340 345 350
CTC ACC TCC CTC TAC AGC CCA GTA CCC GAG GAT GCC TCT GGG ACT GTC 1221
Val Thr Ser Val Tyr Ser Pro Val Pro Glu Asp Ala Ser Gly Thr Val
355 360 365
ATC CCT TTG CTC AGT GTG ACT GAC CTG GAT GCT GGC GAG AAC GGG CTG 1269
Ile Ala Leu Leu Ser Val Thr Asp Leu Asp Ala Gly Glu Asn Gly Leu
370 375 380 385
CTC ACC TGC GAA GTT CCA CCG CGT CTC CCT TTC AGC CTT ACT TCT TCC 1317
Val Thr Cys Glu Val Pro Pro Gly Leu Pro Phe Ser Leu Thr Ser Ser
390 395 400
CTC AAG AAT TAC TTC ACT TTG AAA ACC AGT GCA GAC CTC GAT CCG CAC 1365
Leu Lys Asn Tyr Phe Thr Leu Lys Thr Ser Ala Asp Leu Asp Arg Clu
405 410 415
ACT GTG CCA CAA TAC AAC CTC AGC ATC ACC GCC CGA CAC GCC CGA ACC 1413
Thr Val Pro Glu Tyr Asn Leu Ser Ile Thr Ala Arg Asp Ala Gly Thr
420 425 430
CCT TCC CTC TCA GCC CTT ACA ATA GTG CGT GTT CAA GTG TCC GAC ATC 1461
Pro Ser Leu Ser Ala Leu Thr Ile Val Arg Val Gin Val Ser Asp Zle
435 440 445
AAT CAC AAC CCT CCA CAA TCT TCT CAA TCT TCC TAC GAC GTT TAC ATT 1509
Asn Asp Aen Pro Pro Gin Ser Ser Gin ser Ser Tyr Aep Val Tyr .Zle
450 455 460 465
GAA CAA AAC AAC CTC CCC GGG GCT CCA ATA CTA AAC CTA AGT GTC TGG 1557
Glu Clu Asn Αβη Leu Pro Gly Ala Pro Ile Leu Asn Leu Ser Val Trp
470 475 480
CAC CCC GAC GCC CCG CAG AAT GCT CGG CTT TCT TTC ttt CTC TTG CAG 1605
Aep Pro Asp Ala Pro Gin Asn Ala Arg Leu Ser Phe Phe Leu Leu Glu
485 490 495
CAA GGA GCT GAA ACC GGG CTA GTG GGT CGC TAT TTC ACA ATA AAT CGT 1653
Cln Gly Ala Glu Thr Gly Leu Val Gly Arg Tyr Phe Thr Ile Asn Arg
500 505 510
GAC AAT GGC ATA GTG TCA TCC TTA GTG CCC CTA GAC TAT GAG GAT CGG 1701
Asp Asn Cly Ile Val Ser Ser Leu Val Pro Leu Asp Tyr Glu Asp Arg
515 520 525
-82CZ 288789 B6
CGG Arg 530 GAA TTT GAA TTA ACA GCT Ala CAT His ATC Ile AGC GAT CGG CCC ACC CCC GTC Val 545 1749
Glu Phe Glu Leu Thr 535 Ser Asp 540 Gly Gly Thr Pro
CTA GCC ACC AAC ATC AGC GTG AAC ATA TTT GTC ACT CAT CGC AAT CAC 1797
Leu Ala Thr Aen Ile Ser Val Asn Ilé Phe Val Thr Asp Arg Asn Aep
550 555 560
AAT GCC CCC CAG GTC CTÁ TAT CCT CGG CCA GGT GGG AGC TCG GTG GAG 1845
Asn Ala Pro Gin val Leu Tyr Pro Arg Pro Gly Gly Ser Ser Val Glu
565 570 575
ATG CTG CCT CGA GGT ACC TCA GCT CCC CAC CTA GTG TCA CGG GTC GTA 1893
Met. Leu Pro Arg Gly Thr Ser Ala Cly His Leu Val Ser Arg Val Val
560 585 590
GGC TGG GAC GCG GAT GCA CGG CAC AAT GCC TGG CTC TCC TAC AGT CTC 1941
Gly Trp Asp Ala Asp Ala Gly His Asn Ala Trp Leu Ser Tyr ser Leu
595 600 605
TTT GGA TCC CCT AAC CAG AGC CTT TTT GCC ATA CGG CTG CAC ACT GCT 1989
Phe Gly Ser Pro Asn Gin Ser Leu Phe Ala Ile Gly Leu His Thr Gly
610 615 620 625
CAA ATC ACT ACT GCC CCT CCA GTC CAA GAC ACA CAT TCA CCC AGG CAG 2037
Gin Ile Ser Thr Ala Arg Pro Val Cln Asp Thr Asp Ser Pro Arg Gin
630 635 640
ACT CTC ACT GTC TTG ATC AAA CAC AAT CCC CAC CCT TCG CTC TCC ACC 2085
Thr Leu Thr Val Leu Ile Lys Asp Asn Gly Clu Pro Ser Leu Ser Thr
645 650 655
ACT GCT ACC CTC ACT GTG TCA GTA ACC GAG CAC TCT CCT GAA CCC CGA 2133
Thr Ala Thr Leu Thr Val Ser Val Thr Glu Asp Ser Pro Glu Ala Arg
660 665 670
GCC GAG TTC CCC TCT CCC TCT GCC CCC CGG GAG CAG AAA AAA AAT CTC 2181
Ala Glu Phe Pro Ser Gly Ser Ala Pro Arg Clu Cln Lys Lys Asn Leu
675 680 685
ACC TTT TAT CTA CTT CTT TCT CTA ATC CTG GTT TCT GTG GGC TTC GTG 2229
Thr Phe Tyr Leu Leu Leu ser Leu Ile Leu Val Ser Val Cly Phe Val
690 695 700 705
GTC ACA GTG TTC CGA GTA ATC ATA TTC AAA CTT TAC AAG TGG AAG CAC 2277
Val Thr Val Phe Gly Val Ile Ile Phe Lys Val Tyr Lys Trp Lys •Cln
710 715 720
TCT AGA GAC CTA TAC CGA GCC CCG GTG AGC TCA CTG TAC CGA ACA CCA 2325
Ser Arg Asp Leu Tyr Arg Ala Pro Val Ser Ser Leu Tyr Arg Thr Pro
725 730 735
GGG CCC TCC TTG CAC GCG GAC CCC GTG CGG CCA GGC CTG ATG TCG CCG 2373
Gly Pro Ser Leu His Ala Asp Ala Val Arg Gly Gly Leu Met Ser Pro
740 745 750
CAC CTT TAC CAT CAG GTG TAT CTC ACC ACG CAC TCC CGC CGC AGC GAC 2421
His Leu Tyr His Gin Val Tyr Leu Thr Thr Asp Ser Arg Arg Ser Asp
755 760 765
-83CZ 288789 B6
CCG CTG Pro Leu 770 CTG AAG AAA Lys CCT Pro 775 CCT CCA GCC AGT CCA Pro 780 CTG GCC Leu Ala AGC CCC CAG Gin 785 2469
Leu Lys Gly Ala Ala Ser Ser Arg
AAC ACG CTG CGG AGC TGT GAT CCG GTG TTC TAT AGG CAG GTG TTG GGT 2517
Asn Thr Leu Arg Ser Cys Asp Pro Val Phe Tyr Arg Gin Val Leu Gly
790 795 800
CCA GAG AGC GCC CCT CCC CGA CAG GTA AGG TTT AGC AAG TCA TGC TTG 2565
Ala Glu Ser Ala Pro Pro Gly Gin Val Arg Phe Ser Lye Ser Cys Leu
805 810 815
ACC CTG TTA GTG CCT TTT TAT TCC TAC ATC ATA TTG AGA AGG CTG GAG 2613
Thr Leu Leu Val Pro Phe Tyr Ser Tyr Ile Ile Leu Arg Arg Leu Glu
820 825 830
CTG TTT TTT TACTCATGAA GATGTTTTCC TGGTGATGCA TTCACACTTT 2662
Leu Phe Phe
835
CAACTGGCTC TTCCTAGATC AAAGTTAGTG CCTTTCTGAG ATGGTGGCCT CCCAGAGTGT
GGTTTGTGGT CCCATTTCAG GGGGAAGATA CTTGACTCAT CTGTGGACCT AATTCACATC
CTCAGCG
2722
2782
2789 (2) INFORMACE O SEQ ID NO: 105:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 836 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 105:
Met Val Pro Glu 1 Ala 5 Trp Arg Ser Gly Leu Val Ser Thr Gly Arg Val
10 15
Val Gly Val Leu Leu Leu Leu Gly Ala Leu Asn Lys Ala Ser Thr Val
20 25 30
Zle His Tyr Glu Zle Pro Glu Glu Arg Glu Lys Gly Phe Ala Val Gly
35 40 45
Aen Val Val Ala Asn Leu Gly Leu Asp Leu Gly Ser Leu Ser Ala Arg
50 55 60
Arg Phe Pro Val Val Ser Gly Ala Ser Arg Arg Phe Phe Glu Val Asn
65 70 75 80
Arg Glu Thr Gly Glu Met Phe Val Asn Asp Arg Leu Asp Arg Glu Glu
85 90 95
Leu Cys Gly Thr Leu Pro Ser Cye Thr Val Thr Leu Glu Leu Val Val
100 105 110
Glu Asn Pro Leu Glu Leu Phe Ser Val Glu Val Val Zle Gin Asp Zle
115 120 125
-84CZ 288789 B6
Asn Asp 130 Asn Asn Pro Ala Phe Pro Thr Gin Glu Met Lys Leu Glu Ile
135 140
Ser Clu Ala Val Ala Pro Gly Thr Arg Phe Pro Leu Glu Ser Ala His
145 150 155 160
Asp Pro Asp Leu Gly Ser Asn Ser Leu Gin Thr Tyr Glu Leu Ser Arg
165 170 175
Asn Glu Tyr Phe Ala Leu Arg Val Gin Thr Arg Glu Asp Ser Thr Lys
180 185 190
Tyr Ala Clu Leu Val Leu Glu Arg Ala Leu Asp Arg Glu Arg Glu Pro
195 200 205
Ser Leu Gin Leu Val Leu Thr Ala Leu Asp Cly Gly Thr Pro Ala Leu
210 215 220
Ser Ala Ser Leu Pro Ile His Ile Lys Val Leu Asp Ala Asn Asp Asn
225 230 235 240
Ala Pro Val Phe Asn Cln Ser Leu Tyr Arg Ala Arg Val Pro Gly Gly
245 250 255
Cys Thr Ser Gly Thr Arg Val Val Gin Val Leu Ala Thr Asp Leu Asp
260 265 270
Clu Gly Pro Αβπ Gly Glu Ile Ile Tyr Ser Phe Gly Ser His Asn Arg
275 280 28S
Ala Gly Val Arg Gin Leu Phe Ala Leu Asp Leu Val Thr Gly Met Leu
290 295 300
Thr Ile Lys Gly Arg Leu Asp Phe Glu Asp Thr Lys Leu His Glu Ile
305 310 315 320
Tyr Ile Gin Ala Lys Asp Lys cly Ala Asn Pro Glu Gly Ala His Cys
325 330 335
Lys Val Leu Val Clu Val Val Asp Val Asn Asp Asn Ala Pro Clu Ile
340 345 350
Thr Val Thr Ser Val Tyr Ser Pro Val Pro Glu Asp Ala Ser Gly Thr
355 360 365
Val Ile Ala Leu Leu Ser Val Thr Asp Leu Asp Ala Gly Glu Asn Gly
370 375 380
Leu Val Thr Cys Glu Val Pro Pro Gly Leu Pro Phe Ser Leu Thr Ser
385 390 395 400
Ser Leu Lys Asn Tyr Phe Thr Leu Lys Thr Ser Ala Asp Leu Asp Arg
405 410 415
Glu Thr Val Pro Glu Tyr Asn Leu Ser Ile Thr Ala Arg Asp Ala Gly
420 425 430
Thr Pro Ser Leu Ser Ala Leu Thr Ile Val Arg Val Gin Val Ser Asp
435 440 445
-85CZ 288789 B6
Ile Asn Asp Asn Pro Pro Gin Ser Ser Gin Ser Ser 460 Tyr Asp Val Tyr
450 455
Ile Glu Glu Asn Asn Leu Pro Gly Ala Pro Ile Leu Asn Leu Ser Val
465 470 475 480
Trp Asp Pro Asp Ala Pro Gin Asn Ala Arg Leu ser Phe Phe Leu Leu
485 490 495
Glu Gin Gly Ala Glu Thr Gly Leu Val Gly Arg Tyr Phe Thr Ile Asn
500 505 510
Arg Asp Asn Gly Ile Val Ser Ser Leu Val Pro Leu Asp Tyr Glu Asp
515 520 525
Arg Arg Glu Phe Glu Leu Thr Ala His Ile Ser Asp Gly Gly Thr Pro
530 535 540
Val Leu Ala Thr Asn Ile Ser Val Asn Ile Phe Val Thr Asp Arg Asn
545 550 555 560
Asp Asn Ala Pro Gin Val Leu Tyr Pro Arg Pro Gly Gly Ser Ser Val
565 570 575
Glu Met Leu Pro Arg Gly Thr Ser Ala Gly His Leu Val Ser Arg Val
580 585 590
Val Gly Trp Aep Ala Asp Ala Gly His Asn Ala Trp Leu Ser Tyr Ser
595 600 605
Leu Phe Gly Ser Pro Asn Gin Ser Leu Phe Ala Ile Gly Leu His Thr
610 615 620
Gly Gin Ile Ser Thr Ala Arg Pro Val Gin Asp Thr Asp Ser Pro Arg
625 630 635 640
Gin Thr Leu Thr Val Leu Ile Lys Asp Asn Gly Glu Pro Ser Leu Ser
645 650 655
Thr Thr Ala Thr Leu Thr Val Ser Val Thr Glu Asp Ser Pro G1U Ala
660 665 670
Arg Ala Glu Phe Pro Ser Gly Ser Ala Pro Arg Glu Gin Lys Lys Asn
675 680 685
Leu Thr Phe Tyr Leu Leu Leu Ser Leu Ile Leu Val Ser Val Gly Phe
690 695 700
Val Val Thr Val Phe Gly Val Ile Ile Phe Lys Val Tyr Lys Trp Lys
705 710 715 720
Gin Ser Arg Asp Leu Tyr Arg Ala Pro Val Ser Ser Leu Tyr Arg Thr
725 730 735
Pro Gly Pro Ser Leu His Ala Asp Ala Val Arg Gly Gly Leu Met Ser
740 745 750
Pro His Leu Tyr His Gin Val Tyr Leu Thr Thr Asp Ser Arg Arg Ser
755 760 765
-86CZ 288789 B6 i
Aep Pro 770 Leu Leu Lye Lys Pro Gly 775 Ala Ala Ser Pro Leu Ala 780 Ser Arg
Gin Asn Thr Leu Arg Ser Cya Asp Pro Val Phe Tyr Arg Gin Val Leu
785 790 795 800
Gly Ala Glu Ser Ala Pro Pro Gly Gin Val Arg Phe Ser Lye Ser Cye
805 810 815
Leu Thr Leu Leu Val Pro Phe Tyr Ser Tyr Ile Ile Leu Arg Arg Leu
820 825 830
Glu Leu Phe Phe
835 (2) INFORMACE O SEQ ID NO: 106:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 2751 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 115..2160 (xi) POPIS SEKVENCE: SEQ ID NO: 106:
CGAAAGCCAT GTCGGACTCG TCGCCCAGCG CCCAAGCGCT AACCCGCTGA AAGTTTCTCA
GCGAAATCTC AGGGACGATC TGGACCCCGC TGAGAGGAAC TGCTTTTGAG TGAG ATG Met 1
117
GTC Val CCA GAG GCC TGG AGG AGC GGA CTG GTA AGC ACC CGG AGG GTA GTG 165
Pro Glu Ala Trp 5 Arg Ser Gly Leu Val 10 Ser Thr Gly Arg 15 Val Val
GGA GTT TTG CTT CTG CTT GGT GCC TTG AAC AAG GCT TCC ACG GTC ATT 213
Gly Val Leu Leu Leu Leu Gly Ala Leu Asn Lys Ala Ser Thr Val Ile
20 25 30
CAC TAT GAG ATC CCG GAG GAA AGA GAG AAG GGT TTC GCT GTG GGC AAC 261
His Tyr Glu Ile Pro Glu Glu Arg Glu Lys Gly Phe Ala Val Gly Asn
35 40 45
GTG GTC GCG AAC CTT GGT TTG CAT CTC GGT AGC CTC TCA GCC CGC AGG 309
Val Val Ala Asn Leu Gly Leu Asp Leu Gly Ser Leu Ser Ala Arg Arg
50 55 60 65
TTC CCG GTG GTG TCT GGA GCT AGC CGA AGA TTC TTT GAG GTG AAC CGG 357
Phe Pro Val Val Ser Gly Ala ser Arg Arg Phe Phe Glu Val Asn Arg
70 75 80
-87CZ 288789 B6
GAG Clu ACC GGA CAG ATG Met TTT GTG Phe Val AAC Asn GAC CGT CTG GAT CGA GAG CAG Glu CTG Leu 405
Thr Cly Clu 8S Asp 90 Arg Leu Asp Arg Clu 95
TCT CCC ACA CTG CCC TCT TCC ACT CTA ACT CTG GAG TTG GTA CTC CAC 453
Cys Cly Thr Leu Pro Ser Cys Thr Val Thr Leu Clu Leu Val val Glu
100 105 110
AAC CCC CTG GAG CTG TTC AGC GTG GAA GTG GTG ATC CAG GAC ATC AAC 501
Aen Pro Leu Glu Leu Phe Ser Val Glu Val Val Xle Gin Asp lle Asn
115 120 125
GAC AAC AAT CCT CCT TTC CCT ACC CAG CAA ATG AAA TTG CAG ATT ACC 549
Aep Aen Aen Pro Ala Phe Pro Thr Gin Clu Het Lya Leu Clu lle Ser
130 135 140 145
GAG CCC CTG CCT CCG CCC ACG CGC TTT CCG CTC GAG ACC CCC CAC GAT 597
Clu Ala Val Ala Pro Gly Thr Arg Phe Pro Leu Clu Ser Ala His Asp
150 15S 160
ccc GAT CTG GGA AGC AAC TCT TTA CAA ACC TAT CAC CTG ACC CGA AAT 645
Pro Aep Leu Gly Ser Asn Ser Leu Cln Thr Tyr Clu Leu Ser Arg Asn
165 170 175
GAA TAC TTT CCG CTT CGC CTG CAG ACG CGC CAC GAC AGC ACC AAC TAC 693
Glu Tyr Phe Ala Leu Arg Val Gin Thr Arg Glu Asp Ser Thr Lys Tyr
180 185 190
CCC CAG CTG CTC TTG GAG CGC GCC CTG CAC CGA CAA CCG CAC CCT ACT 741
Ala Clu Leu Val Leu Clu Arg Ala Leu Asp Arg Clu Arg Clu Pro Ser
195 200 205
ctc CAG TTA GTG CTG ACG GCG TTG GAC GGA GGG ACC CCA CCT CTC TCC 789
Leu Gin Leu Val Leu Thr Ala Leu Asp Gly Gly Thr Pro Ala Leu Ser
210 215 220 225
CCC ACC CTC CCT ATT CAC ATC AAG CTG CTG GAC CCG AAT CAC AAT GCC 837
Ala Ser Leu Pro lle His lle Lys Val Leu Asp Ala Asn Asp Asn Ala
230 235 240
CCT CTC TTC AAC CAG TCC TTG TAC CGG GCG CGC GTT CCT GGA GGA TCC 885
Pro Val Phe Asn Gin Ser Leu Tyr Arg Ala Arg Val Pro Cly Gly.Cys
245 250 255
ACC TCC CCC ACG CGC GTG CTA CAA CTC CTT CCA ACG GAT CTG CAT CAA 933
Thr Ser Cly Thr Arg Val Val Gin Val Leu Ala Thr Asp Leu Asp Glu
260 265 270
CCC CCC AAC GGT GAA ATT ATT TAC TCC TTC GCC AGC CAC AAC CGC CCC 981
Gly Pro Aen Gly Glu lle lle Tyr Ser Phe Gly Ser His Asn Arg Ala
275 280 285
CCC CTG CCC CAA CTA TTC GCC TTA CAC CTT GTA ACC GGG ATG CTG ACA 1029
Gly Val Arg Gin Leu Phe Ala Leu Asp Leu Val Thr Gly Met Leu Thr
290 295 300 305
ATC AAG GGT CCG CTG GAC TTC GAG GAC ACC AAA CTC CAT GAG ATT TAC 1077
lle Lys Gly Arg Leu Asp Phe Glu Asp Thr Lys Leu His Glu lle Tyr
310 315 320
-88CZ 288789 B6
ATC CAG GCC AAA GAC AAG GGC GCC AAT CCC CAA CGA GCA CAT TGC AAA1125
Ile Cln Ala Lye Aep Lye Cly Ala Asn Pro Clu Gly Ala His CyaLye
325 330335
GTG TTG CTG GAG CTT GTG GAT GTG AAT CAC AAC GCC CCG CAG ATC ACA1173
Val Leu Val Clu Val Val Asp Val Asn Asp Asn Ala Pro Glu IleThr
340 345350
CTC ACC TCC GTG TAC AGC CCA CTA CCC GAG GAT GCC TCT GGG ACT GTC1221
Val Thr Ser Val Tyr Ser Pro Val Pro Glu Asp Ala Ser cly ThrVal
355 360365
ATC CCT TTG CTC AGT GTG ACT GAC CTG GAT GCT CGC GAG AAC GGG CTG1269
Ile Ala Leu Leu Ser Val Thr Asp Leu Asp Ala Gly Glu Asn GlyLeu
370 375 380385
CTG ACC TGC GAA CTT CCA CCG CGT CTC CCT TTC AGC CTT ACT TCT TCC1317
Val Thr Cys Clu Val Pro Pro Cly Leu Pro Phe Ser Leu Thr SerSer
390 395400
CTC AAG AAT TAC TTC ACT TTG AAA ACC ACT CCA GAC CTG GAT CCG GAG1365
Leu Lys Asn Tyr Phe Thr Leu Lys Thr Ser Ala Asp Leu Asp ArgGlu
405 410415
ACT GTG CCA CAA TAC AAC CTC AGC ATC ACC GCC CCA GAC GCC GGA ACC1413
Thr Val Pro Clu Tyr Asn Leu Ser Ile Thr Ala Arg Asp Ala GlyThr
420 425430
CCT TCC CTC TCA CCC CTT ACA ATA GTG CGT GTT CAA GTG TCC GAC ATC1461
Pro Ser Leu Ser Ala Leu Thr Ile Val Arg Val Gin Val Ser AspIle
435 440445
AAT GAC AAC CCT CCA CAA TCT TCT CAA TCT TCC TAC GAC GTT TAC ATT1509
Asn Asp Asn Pro Pro Gin Ser Ser Gin Ser Ser Tyr Aep Val TyrIle
450 455 460465
GAA GAA AAC AAC CTC CCC GGG GCT CCA ATA CTA AAC CTA AGT GTC TGC1557
Clu Glu Asn Asn Leu Pro Gly Ala Pro Ile Leu Asn Leu Ser ValTrp
470 475480
GAC CCC GAC GCC CCG CAG AAT GCT CGG CTT TCT TTC TTT CTC TTC CAG1605
Asp Pro Asp Ala Pro Gin Asn Ala Arg Leu Ser Phe Phe Leu LeuGlu
485 490495
CAA GGA GCT GAA ACC GGG CTA GTG GGT CGC TAT TTC ACA ATA AAT CGT1653
Gin Gly Ala Glu Thr Gly Leu Val Gly Arg Tyr Phe Thr Ile AsnArg
500 505510
GAC AAT GGC ATA GTG TCA TCC TTA GTG CCC CTA GAC TAT GAG GAT CGG1701
Asp Asn Gly Ile Val Ser Ser Leu Val Pro Leu Asp Tyr Glu AspArg
515 520525
CGG GAA TTT GAA TTA ACA GCT CAT ATC AGC GAT GCG GGC ACC CCG GTC1749
Arg Glu Phe Glu Leu Thr Ala His Ile Ser Asp Gly Gly Thr ProVal
530 535 540545
CTA GCC ACC AAC ATC AGC GTG AAC ATA TTT GTC ACT GAT CGC AAT GAC1797
Leu Ala Thr Asn Ile Ser Val Asn Ile Phe Val Thr Asp Arg ΑβηAsp
550 555560
-89CZ 288789 B6
* AAT Asn GCC CCC CAG GTC CTA TAT Tyr CCT CGG CCA GGT GGG AGC TCG Ser 575 GTG GAG 1845
Ala Pro Gin 565 Val Leu Pro Arg 570 Pro Gly Gly Ser Val Glu
ATG CTG CCT CGA GGT ACC TCA GCT GGC CAC CTA GTG TCA CGG GTG GTA 1893
Met Leu Pro Arg Gly Thr Ser Ala Gly His Leu Val Ser Arg Val Val
580 585 590
GGC TGG GAC GCG GAT GCA GGG CAC AAT GCC TGG CTC TCC TAC AGT CTC 1941
Gly Trp Asp Ala Asp Ala Gly His Asn Ala Trp Leu Ser Tyr Ser Leu
595 600 605
TTT GGA TCC CCT AAC CAG AGC CTT TTT GCC ATA GGG CTG CAC ACT GGT 1989
Phe Gly Ser Pro Asn Gin Ser Leu Phe Ala Ile Gly Leu His Thr Gly
610 615 620 625
CAA ATC AGT ACT GCC CGT CCA GTC CAA GAC ACA GAT TCA CCC AGG CAG 2037
Gin Xle Ser Thr Ala Arg Pro Val Gin Asp Thr Asp Ser Pro Arg Gin
630 63S 640
ACT CTC ACT GTC TTG ATC AAA GAC AAT GGG GAG CCT TCG CTC TCC ACC 2085
Thr Leu Thr Val Leu Ile Lys Asp Asn Gly Glu Pro Ser Leu Ser Thr
645 650 655
ACT GCT ACC CTC ACT GTG TCA GTA ACC GAG GAC TCT CCT GAA GCC CGA 2133
Thr Ala Thr Leu Thr Val Ser Val Thr Glu Asp Ser Pro Glu Ala Arg
660 665 670
GCC GAG TTC CCC TCT GGC TCT GCC AGT TAAACCTTCT TTAATTATGG 2180
Ala Glu Phe Pro Ser Gly ser Ala Ser
675 680
ATTAGCCATT AACATTTTTG AAACGTGGAC CATTTAACCT CGGCCTACCC CCTCCAACTG 2240
TCCTGGTGAT GAGTTCATTA GCTAAGTTAA ATTAATTGAA CTTTGATCTA AACCAAAACA 2300
AATCAGGAAA ATAAAGCTGT AAAGGAACTT ATCAAGCATT CCAAAACCAA CTAGAAATTA 2360
CTTGAAGTTT CGAGTGAGCA TTGCCTGTGC CAGTATTCTT CATTATAGGA TTATAAACTC 2420
GTTTTTTTCC CAAAGCGCAT GTCTACGCCA GGCAGAGGAG TAATTATTCA GCCAATTTCA 2480
TGGATGTAAC GATGGATATA AATAATTGAT AGCACCTAGA GGCTTCCAGT TTGGGTGGAA 2540
GGCTAAAAGT AGAGGGGAAC TCACTCACTT GAGAAATGAT ATTTAAGTGA ATAAATAGTT 2600
CTCTTCTATG AAACTATTAC TATTTAGTTC TCTGGAAAAC TTAAGTGTAT TAATCATTAG 2660
AACATCAAAT CCTAAGTAAA GAAATGACAT TTTAAATATA AAAAGCCAAA CTTTAAATAA 2720
ATCATAGAGA CCTCAGACAT AATATAGGAA A 2751
(2) INFORMACE O SEQ ID NO: 107:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 682 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 107:
-90CZ 288789 B6
Het Val Pro Glu 1 Ala Trp 5 Arg Ser Gly Leu Val Ser Thr Gly Arg Val
10 15
Val Gly Val Leu Leu Leu Leu Gly Ala Leu Asn Lys Ala Ser Thr Val
20 25 30
Ile His Tyr Glu Ile Pro Glu Glu Arg Glu Lys Gly Phe Ala Val Gly
35 40 45
Asn Val Val Ala Asn Leu Gly Leu Asp Leu Gly Ser Leu ser Ala Arg
50 55 60
Arg Phe Pro Val Val Ser Gly Ala Ser Arg Arg Phe Phe Glu Val Asn
65 70 75 80
Arg Glu Thr Gly Glu Het Phe Val Asn Asp Arg Leu Asp Arg Glu Glu
85 90 95
Leu Cys Gly Thr Leu Pro Ser Cys Thr Val Thr Leu Glu Leu Val Val
100 105 110
Glu Asn Pro Leu Glu Leu Phe Ser Val Glu Val Val Ile Gin Asp Ile
115 120 125
Asn Asp Asn Asn Pro Ala Phe Pro Thr Gin Glu Het LyB Leu Glu Ile
130 135 140
Ser Glu Ala Val Ala Pro Gly Thr Arg Phe Pro Leu Glu Ser Ala His
145 150 155 160
Aep Pro Asp Leu Gly ser Asn Ser Leu Gin Thr Tyr Glu Leu Ser Arg
165 170 175
Asn Glu Tyr Phe Ala Leu Arg Val Gin Thr Arg Glu Asp Ser Thr Lys
180 185 190
Tyr Ala Glu Leu Val Leu Glu Arg Ala Leu Asp Arg Glu Arg Glu Pro
195 200 205
Ser Leu Gin Leu Val Leu Thr Ala Leu Asp Gly Gly Thr Pro Ala Leu
210 215 220
Ser Ala Ser Leu Pro Ile His Ile Lys Val Leu Asp Ala Asn Asp Asn
225 230 235 240
Ala Pro Val Phe Asn Gin Ser Leu Tyr Arg Ala Arg Val Pro Gly Gly
245 250 255
Cys Thr Ser Gly Thr Arg Val Val Gin Val Leu Ala Thr Asp Leu Asp
260 265 270
Glu Gly Pro Asn Gly Glu Ile Ile Tyr Ser Phe Gly Ser His Asn Arg
275 280 285
Ala Gly Val Arg Gin Leu Phe Ala Leu Asp Leu Val Thr Gly Het Leu
290 295 300
Thr Ile Lys Gly Arg Leu Asp Phe Glu Asp Thr Lys Leu His Glu Xle
305 310 315 320
-91CZ 288789 B6
Tyr Ile Cln Ala Lys Asp 325 Lys Gly Ala Asn Pro Glu Gly Ala His Cys
330 335
Lye Val Leu Val Glu Val Val Asp Val Asn Asp Asn Ala Pro Glu Ile
340 345 350
Thr Val Thr Ser Val Tyr Ser Pro Val Pro Glu Asp Ala ser Gly Thr
355 360 365
Val Ile Ala Leu Leu Ser Val Thr Asp Leu Asp Ala Gly Glu Asn cly
370 375 380
Leu Val Thr Cye Glu Val Pro Pro Gly Leu Pro Phe Ser Leu Thr Ser
365 390 395 400
Ser Leu LyB Asn Tyr Phe Thr Leu Lys Thr Ser Ala Asp Leu Asp Arg
405 410 415
Glu Thr Val Pro Glu Tyr Asn Leu Ser Ile Thr Ala Arg Asp Ala Gly
420 425 430
Thr Pro Ser Leu Ser Ala Leu Thr Ile Val Arg Val Gin Val Ser Aep
435 440 445
Ile Asn Asp Αβη Pro Pro Cln Ser Ser Gin Ser Ser Tyr Asp Val Tyr
450 455 460
Ile Clu Glu Asn Asn Leu Pro Cly Ala Pro Ile Leu Asn Leu Ser Val
465 470 475 480
Trp Asp Pro Asp Ala Pro Cln Asn Ala Arg Leu Ser Phe Phe Leu Leu
485 490 495
Glu Gin Gly Ala Glu Thr Gly Leu Val Gly Arg Tyr Phe Thr Ile Asn
500 505 510
Arg Asp Α6Π Gly Ile Val Ser Ser Leu Val Pro Leu Asp Tyr Glu Asp
515 520 525
Arg Arg Glu Phe Glu Leu Thr Ala His Ile Ser Asp Gly Gly Thr Pro
530 535 540
Val Leu Ala Thr Asn Ile Ser Val Asn Ile Phe Val Thr Asp Arg Asn
545 550 555 560
Asp Asn Ala Pro Gin Val Leu Tyr Pro Arg Pro Gly Gly Ser Ser Val
565 570 575
Glu Met Leu Pro Arg Gly Thr Ser Ala Gly His Leu Val Ser Arg Val
580 585 590
Val Gly Trp Asp Ala Asp Ala Gly His Asn Ala Trp Leu Ser Tyr Ser
595 600 605
Leu Phe Gly Ser Pro Asn Gin Ser Leu Phe Ala Ile Gly Leu His Thr
610 615 620
Cly Gin Ile Ser Thr Ala Arg Pro Val Cln Asp Thr Asp Ser Pro Arg
625 630 635 640
-92CZ 288789 B6
Gin Thr Leu Thr Val 645 Leu Ile Lye Asp
Thr Thr Ala Thr 660 Leu Thr Val Ser Val 665
Arg Ala Glu 675 Phe Pro Ser Gly Ser 680 Ala
Asn Gly Glu
650
Thr
Ser
Pro Ser
Ser Pro
670
Leu
655
Glu
Ser
(2) INFORMACE O SEQ ID NO: 108:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 2831 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO: 108:
GAATTCGGCA CGAGGCTGAA CTGAGGGTGA CGGACATAAA CGACTATTCT CCAGTGTTCA 60
GTGAAAGAGA AATGATACTG AGGATACCAG AAAACAGTGC TCGGGGAAAT ACATTCCCTT 120
TAAACAATGC TCTGGACTCA GACGTAGATA TCAACAATAT CCAGACCTAT AGGCTCAGCT 180
CAAACTCTCA TTTCCTGGTT GTAACCCGCA ACCGCAGTGA TCGCAGGAAG TACCCAGAGC 240
TGGTGCTGGA GAAAGAACTG GATCGAGAGG AGGAACCTGA GCTGAGGTTA ACGCTGACAG 300
CTTTGGATGG TGGCTCTCCT CCCCGGTCTG GGACGACACA GGTCCTCATT GAAGTAGTGG 360
ACACCAACGA TAATGCACCC CAGTTTCAGC AGCCAACATA CCAAGTGCAA ACTCCCGAGA 420
ACAGTCCCAC CGGCTCTCTG GTACTCACAG TCTCACCCAA TGACTTAGAC AGTGGAGACT 480
ATGGGAAAGT CTTGTACGCA CTTTCGCAAC CCTCAGAAGA TATTAGCAAA ACATTCGAGG 540
TAAACCCTGT AACCGGGGAA ATTCGCCTAC GAAAAGAGGT GAATTTTGAA ACTATTCCTT 600
CGTATGAAGT GGTTATCAAG GGGACGGACG GGGGAGGTCT CTCAGGAAAA TGCACTCTGT 660
TACTGCAGGT GGTGGACGTG AATGACAATG CCCCAGAAGT GATGCTATCT GCGCTAACCA 720
ACCCAGTCCC AGAAAATTCC CCCGATGAGG TAGTGGCTGT TTTCAGTGTT AGAGATCCTG 780
ACTCTGGGAA CAACGGAAAA GTGATTGCAT CCATCGAGGA AGACCTGCCC TTTCTTCTAA 840
AATCTTCAGG AAAGAACTTT TACACTTTAG TAACCAAGGG AGCACTTGAC AGGGAAGAAA 900
GAGAGCAATT GAACATCACC ATCACAGTCA CTGACCTGGG CATACCCAGG CTCACCACCC 960
AACACACCAT AACAGTGCAG GTGGCAGACA TCAACGACAA TGCCCCCTCC TTCACCCAAA 1020
CCTCCTACAC CATGTTTGTC CGCGAGAACA ACAGCCCCGC CCTGCACATA GGCACCATCA 1080
GCGCCACAGA CTCAGACTCA GGATCCAATG CCCACATCAC CTACTCGCTG CTACCGCCCC 1140
-93CZ 288789 B6
AAGACCCACA GCTGGCCCTC GACTCGCTCA TCTCCATCAA TGTAGACAAC GGGCAGCTGT 1200
TCGCGCTCAG GGCGCTAGAC TATGAGGCTC TGCAGGGCTT CGAGTTCCAT GTGGGCGCCA 1260
cagaccaAgg CTCGCCCGCG CTCAGCAGCC AGGCTCTGGT GCACGTGGTG GTGTTGGACG 1320
ACAATGACAA TGCGCCCTTC GTGCTCTACC CGCTGCAAAA CGCCTCTGCA CCCTTCACTG 1380
AGCTGCTGCC CAGGGCGGCA GAGCCTGGAT ACCTGGTTAC CAAGGTGGTA GCTGTGGACC 1440
GCGACTCTGG CCAGAATGCC TGGCTGTCAT TCCAGCTGCT CAAGGCCACG GAGCCCGGGC 1500
TGTTCAACGT ATGGGCGCAC AATGGCGAGG TACGCACCTC CAGGCTGCTG AGCGAGCGČG 1560
ACGCACCCAA GCACAAGCTG CTGCTGTTGG TCAAGGACAA TGGAGATCCT CCACGCTCTG 1620
CCAGTGTTAC TCTGCACGTG CTAGTGGTGG ATGCCTTCTC TCAGCCCTAC CTGCCTCTGC 1680
CAGAGGTGGC GCACGACCCT CCACAAGAAG AAGATGCGCT AACACTCTAC CTGGTCATAG 1740
CTTTGGCATC TGTGTCTTCT CTCTTCCTCT TGTCTGTGCT GCTGTTCGTG GGGGTGAGGC 1800
TCTGCAGGAG GGCCAGGGCA GCCTCTCTGA CTGCCTATTC TGTGCCTGAA GGCCACTTTC 1860
CTGGCCAGCT GGTGGATGTC AGAGGTATGG GGACCCTGTC CCAGAGCTAC CAGTATGATG 1920
TATGTCTGAT GGGGGATTCT TCTGGGACCA GCGAATTTAA CTTCTTAAAG CCAGTTCTGC 1980
CTAGCTCTCT GCACCAGTGC TCTGGGAAAG AAATAGAGGA AAATTCCACA CTCCAGAATA 2040
GTTTTGGGTT TCATCATTAA TAGAAAACTA CTTTACAGAT ATTTAATTCC AAATATCATC 2100
TTGTTGATTA ACTAAAGTCT GTTCACATGT AGCTAGCTAG CAACGATTTT AATGTTCACT 2160
TTACCCATCT TTTTTCAGGG TCATGTCTAA ACCTACAAGT TTGNCTTTAC TTATACTTGT 2220
CGCACAGAAT NNNNNNNNNN TGGTGTATAA GTCACAGTCA TGGGATACTG GCACAAGATG 2280
GCAGCTTGAT TGCTCAGTTA TGGCTGCAAA GGGGNGCTTG AGTTTAGGGA ATGTGTTAGA 2340
GCTGGAATAA CTTTTCTGAG AAATGTGTAA GACAAATTTC TTTTGCACAT TCCCTGTGTT 2400
CCTGTACCCC TGTTTCCAGA ACTACGAAAT GTGTCATCAG AAGGCATGCT CACATTTTCC 2460
CCTTTGTTTG CGTGACCCGG GTGCCAGAAA TTAAATAAAA TTAGCATGGA GTTCAATGCA 2520
GCATTAAAAC AAAGTTACTT CTACAAACCT TTTATTCGAC GGTTAAAATT GTAACTTCCC 2580
CACCCATGAG GCTGGCTGTA AGAACCAGTA TGAATGGGTG TCTATCGCAA CCTTATTTTC 2640
AAAAATCAAA CAAAAGGAGA AATGAGAGAC CAAACAACAC GCTACAGGAA AGATTTCATA 2700
AGGATGTATG TATGGACACA AAAACTGGGA TACAGACATT TTAAATCTGT TGGTACCACA 2760
TGGTGGCGCT GCAGGCTAAA GAAATGCAAG GGAAATTAAA AAGAGGCTGA GCTAGAAGTC 2820
AAAAAAAAAA A 2831
-94CZ 288789 B6 (2) INFORMACE O SEQ ID NO: 109:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 3353 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (ix) CHARAKTERISTICKÝ ZNAK:
io (A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 763..3123 (xi) POPIS SEKVENCE: SEQ ID NO: 109:
GTATTTTTCC ACAGTTTAAA ATTTTCATAA AATCATAACT CTCTGACTTT ATGTAGAAAG60
GATACCACAC TGGAATTAAC GTGTAGCTTT TTCTTGATGT AATCCAACCA ATGGGAGCAC120
AATTCTGGTA CATAGGCTGT CTAGAATTTG AAAGAAATTA AAGAATTCAT TTTGTTTTGC180
TGATAAATTT TTAAGAAATC ACGTGGCTTT ATGTTATTAT TATTACAAGA TGACTGATCA240
CTATTATGTC ttctttcact tctcaatttc čctcagaaca CTACACCCAG ACTACAGGCT300
CTGGAGGGTG GGGACCATGT CTGGGTTGTT TACTGATGTA TTTCATAATT TGGCACATAG360
AGACCAATAA TACTCCTTTA AATGAAGAAA ΤΤΑΑΤΑΑΤΤΛ CCATTGCGTG ATATTGTGAT420
TACATCATTT CCTCCCAATT TCCAAACTCC TAATAGAATA GAGAATAGAT CAATTGTAGC480
AATTCGTTTC GAAGCAAAGA CAACGCATGG TGGCGCTGCA GGCTAAGGCT TCAAAAAAAG540
GAAAAGGAAA AAGCCCATGA AATGCTACTA GCTACTTCAG ACCTCTTTCA GCCTAAGAGG600
AAAGCCTGTT AGCAGAGCAC GGACCAGTGT CTCCGGAGAA TGCTATTCTC CTACATTTCC660
GAACAGGTTA TCAACGCACA GATCGATCAC TGCCTCTGTC CCATCGCTCC CTGAAGTAGC720
TCTGACTCCG GTTCCTTGAA AGGGGCGTGT ACAGAAGTAA AG ATG GAG CCT GCA774
Met Glu Pro Ala
GGG -GAG CGC TTT CCC GAA CAA AGG CAA GTC CTG ATT CTC CTT CTT TTA822
Gly Glu Arg Phe Pro Glu Gin Arg Gin Val Leu Ile Leu Leu LeuLeu
10 1520
CTG GAA GTG ACT CTG GCA GGC TGG GAA CCC CGT CGC TAT TCT GTG ATG870
Leu Glu Val Thr Leu Ala Gly Trp Glu Pro Arg Arg Tyr Ser ValMet
3035
GAG GAA ACA GAG AGA GGT TCT TTT GTA GCC AAC CTG GCC AAT GAC CTA918
Glu Glu Thr Glu Arg Gly Ser Phe Val Ala Asn Leu Ala Asn AapLeu
4550
GGG CTG GGA GTG GGG GAG CTA GCC GAG CGG GGA GCC CGG GTA GTT TCT966
Gly Leu Gly Val Gly Glu Leu Ala Glu Arg Gly Ala Arg Val ValSer
6065
-95CZ 288789 B6
GAG Glu GAT AAC Asp Asn 70 CAA Clu CAA CGC TTG CAG CTT GAT CTG CAG ACC GGG CAG Cln TTG Leu 1014
Cln Cly Leu Cln Leu 75 Asp Leu Gin 80 Thr Gly
ATA TTA AAT GAG AAG CTG CAC CCG CAG AAG CTC TGT CGC CCT ACT CAC 1062
Ile Leu Asn Clu Lys Leu Asp Arg Clu Lys Leu Cys Gly Pro Thr Clu
85 90 95 100
CCC TGT ATA ATC CAT TTC CAA GTG TTA CTG AAA AAA CCT TTG CAA CTA 1110
Pro Cys Ile Met His Phe Gin Val Leu Leu Lys Lys Pro Leu Glu Val
105 110 115
TTT CGA CCT CAA CTA CTA GTC ACA GAC ATA AAC GAT CAT TCT CCT CAC 1158
Phe Arg Ala Clu Leu Leu Val Thr Asp Ile Asn Asp Hie Ser Pro Clu
120 125 130
TTT CCT GAA AGA GAA ATG ACC CTG AAA ATC CCA GAA ACT ACC TCC CTT 1206
Phe Pro Glu Arg Clu Met Thr Leu Lys Ile Pro Clu Thr Ser Ser Leu
135 140 145
GGG ACT GTG TTT CCT CTG AAA AAA GCT CGG GAC TTG GAC CTG GCC AGC 1254
Gly Thr Val Phe Pro Leu Lys Lys Ala Arg Asp Leu Asp Val Cly Ser
150 155 160
AAT AAT CTT CAA AAC TAC AAT ATT TCT CCC AAT TCT CAT TTC CAT CTT 1302
Aen Aen Val Cln Asn Tyr Asn Ile Ser Pro Asn Ser His Phe His Val
165 170 175 180
TCC ACT CGC ACC CCA CGC CAT CCC AGG AAA TAC CCA CAG CTG GTG CTG 1350
ser Thr Arg Thr Arg Gly Asp Gly Arg Lys Tyr Pro Clu Leu Val Leu
185 190 195
GAC ACA GAA CTG GAT CGC GAG GAG CAG GCC GAG CTC AGA TTA ACC TTG 1398
Asp Thr Glu Leu Asp Arg Glu Clu Gin Ala Glu Leu Arg Leu Thr Leu
200 205 210
ACA CCG GTG CAC CCT CCC TCT CCA CCC CGA TCT CGC ACC GTC CAG ATC 1446
Thr Ala Val Asp Gly Cly Ser Pro Pro Arg Ser Gly Thr Val Cln Ile
215 220 225
CTC ATC TTG CTC TTG CAC CCC AAT GAC AAT CCC CCG GAC TTT GTG CAG 1494
Leu Ile Leu Val Leu Asp Ala Asn Asp Asn Ala Pro Clu Phe Val cln
230 235 240
CCG CTC TAC CAC CTC CAG CTC CCA CAG AAC AGC CCA GTA CGC TCC CTA 1542
Ala Leu Tyr Glu Val Cln Val Pro Clu Asn Ser Pro Val Gly Ser Leu
245 250 255 260
GTT CTC AAG GTC TCT GCT AGG CAT TTA GAC ACT CGG ACA AAT CGA GAG 1590
Val Val Lys Val Ser Ala Arg Asp Leu Asp Thr Gly Thr Asn Gly Glu
265 270 275
ATA TCA TAC TCC CTT TAT TAC AGC TCT CAG CAG ATA CAC AAA CCT TTT 1638
Ile Ser Tyr Ser Leu Tyr Tyr Ser Ser Cln Glu Ile Asp Lys Pro Phe
280 285 290
GAG CTA AGC AGC CTT TCA CGA CAA ATT CGA CTA ATT AAA AAA CTA GAT 1686
Glu Leu Ser Ser Leu Ser Gly Glu Ile Arg Leu Ile Lys Lys Leu Asp
295 300 305
-96CZ 288789 B6
TTT GAG ACA ATG TCT TCA TAT GAT CTA GAT ATA GAG CCA TCT GAT Asp GGC Gly 1734
Phe Glu 310 Thr Met Ser Ser Tyr 315 Asp Leu Asp Ile Glu 320 Ala Ser
GGG GGA CTT TCT GGA AAA TGC TCT GTC TCT GTT AAG GTG CTG GAT GTT 1782
Gly Gly Leu Ser Gly Lys Cys Ser Val Ser Val Lys Val Leu Asp Val
325 330 335 340
AAC GAT AAC TTC CCG GAA CTA AGT ATT TCA TCA CTT ACC AGC CCT ATT 1830
Ánn Asp Asn Phe Pro Glu Leu Ser Ile Ser Ser Leu Thr Ser Pro Ile
345 350 355
CCC GAG AAT TCT CCA GAG ACA GAA GTG GCC CTG TTT AGG ATT AGA GAC 1878
Pro Glu Asn ser Pro Glu Thr Glu Val Ala Leu Phe Arg Ile Arg Asp
360 365 370
CGA GAC TCT GGA GAA AAT GGA AAA ATG ATT TGC TCA ATT CAG GAT GAT 1926
Arg Asp Ser Gly Glu Asn Gly Lys Met Ile Cys Ser Ile Gin Asp Asp
375 380 385
GTT CCT TTT AAG CTA AAA CCT TCT GTT GAG AAT TTC TAC AGG CTG GTA 1974
Val Pro Phe Lys Leu Lys Pro Ser Val Glu Asn Phe Tyr Arg Leu Val
390 395 400
ACA GAA GGG CCG CTG GAC AGA GAG ACC AGA CCC GAG TAC AAC ATC ACC 2022
Thr Glu Gly Ala Leu Asp Arg Glu Thr Arg Ala Clu Tyr Asn Ile Thr
405 410 415 420
ATC ACC ATC ACA GAC TTG GGG ACT CCA ACG CTG AAA ACC GAG CAG AGC 2070
Ile Thr Ile Thr Asp Leu Gly Thr Pro Arg Leu Lys Thr Glu Gin Ser
425 430 435
ATA ACC GTG CTG GTG TCG GAC GTC AAT GAC AAC GCC CCC GCC TTC ACC 2118
Ile Thr Val Leu Val Ser Asp Val Asn Asp Asn Ala Pro Ala Phe Thr
440 445 450
CAA ACC TCC TAC ACC CTG TTC GTC CGC GAG AAC AAC AGC CCC GCC CTG 2166
Gin Thr Ser Tyr Thr Leu Phe Val Arg Glu Asn Asn Ser Pro Ala Leu
455 460 465
CAC ATC GGC AGT GTC AGC GCC ACA GAC AGA GAC TCG GGC ACC AAC GCC 2214
His Xle Gly Ser Val Ser Ala Thr Asp Arg Asp Ser Gly Thr Asn Ala
470 475 480
CAG GTC ACC TAC TCG CTG CTG CCG CCC CAG GAC CCG CAC CTG CCC CTA 2262
Gin Val Thr Tyr Ser Leu Leu Pro Pro Gin Asp Pro HÍB Leu Pro Leu
4B5 490 495 500
ACC TCC CTG GTC TCC ATT AAC ACG GAC AAC GGC CAC CTG TTC GCT CTC 2310
Thr Ser Leu Val Ser Ile Asn Thr Asp Asn Gly His Leu Phe Ala Leu
505 510 515
CAG TCG CTG GAC TAC GAG GCC CTG CAG GCT TTC GAG TTC CGC GTG GGC 2358
Gin Ser Leu Asp Tyr Glu Ala Leu Gin Ala Phe Glu Phe Arg Val Gly
520 525 530
GCC ACA GAC CCC GGC TTC CCG GCG CTG AGC AGC GAG GCG CTG GTG CGA 2406
Ala Thr Asp Arg Gly Phe Pro Ala Leu Ser Ser Glu Ala Leu Val Arg
535 540 545
-97CZ 288789 B6
GTC CTG GTG Val CTG GAC GCC AAC GAC AAC TCG CCC TTC GTG CTG TAC CCG Pro 2454
Val Leu 550 Leu Asp Ala Aen 555 Asp Asn Ser Pro Phe 560 Val Leu Tyr
CTG CAG AAC GGC TCC GCC CCC TGC ACC CAG CTG GTG CCC CGG GCG CCC 2502
Leu Gin Asn Gly Ser Ala Pro Cys Thr Glu Leu Val Pro Arg Ala Ala
565 570 575 580
GAG CCG GGC TAC CTG GTG ACC AAG GTG GTG GCG GTG GAC CCC GAC TCG 2550
Glu Pro Gly Tyr Leu Val Thr Lye Val Val Ala Val Aep Gly Αβρ Ser
585 590 595
GGC CAG AAC GCC TGC CTG TCG TAC CAG CTG CTC AAG GCC ACG GAG CCC 2598
Gly Gin Asn Ala Trp Leu Ser Tyr Cln Leu Leu Lys Ala Thr Clu Pro
600 605 610
GGC CTG TTC GCC GTG TGG GCG CAC AAT CGC GAG GTG CGC ACC GCC ACC 2646
Gly Leu Phe Gly Val Trp Ala His Asn Gly Glu Val Arg Thr Ala Arg
615 620 625
CTG CTG ACC GAG CGC GAC GTG CCC AAG CAC AGG CTA GTG GTG CTG GTC 2694
Leu Leu Ser Glu Arg Asp Val Ala Lys His Arg Leu Val Val Leu Val
630 635 640
AAG GAC AAT GGC GAG CCT CCG CGC TCG GCC ACA CCC ACG CTG CAA GTG 2742
Lye Asp Aen Gly Glu Pro Pro Arg Ser Ala Thr Ala Thr Leu Gin Val
645 650 655 660
CTC CTG GTG GAC GGC TTC TCT CAG CCC TAC CTG CCG CTC CCA GAG CCG 2790
Leu Leu Val Asp Gly Phe Ser Gin Pro Tyr Leu Pro Leu Pro Glu Ala
665 670 675
GCC CCG GCC CAA GCC CAG GCC GAC TCG CTT ACC CTC TAC CTG GTG GTG 2838
Ala Pro Ala Gin Ala Gin Ala Asp Ser Leu Thr Val Tyr Leu Val Val
680 685 690
GCA TTG GCC TCG GTG TCT TCG CTC TTC CTC TTC TCG GTG TTC CTG TTC 2886
Ala Leu Ala Ser Val Ser Ser Leu Phe Leu Phe Ser Val Phe Leu Phe
695 700 705
GTG GCA GTG CGG CTG TGC AGG AGG AGC AGG CCG CCC TCA GTG GGT CGC 2934
val Ala Val Arg Leu Cys Arg Arg ser Arg Ala Ala Ser Val Gly Arg
710 715 720
TGC TCG GTG CCC GAG GGC CCC TTT CCA GGG CAT CTG GTG GAC GTG AGC 2982
Cye Ser Val Pro Glu Gly Pro Phe Pro Cly His Leu Val Asp Val Ser
725 730 735 740
GGC ACC GGG ACC CTT TCC CAG AGC TAC CAG TAC CAG CTG TGT CTG ACG 3030
Gly Thr Gly Thr Leu Ser Gin Ser Tyr Gin Tyr Clu Val Cye Leu Thr
745 750 755
GGA GGC TCT GAA AGT AAT CAT TTC AAG TTC TTG AAG CCT ATA TTC CCA 3078
cly Gly Ser Glu Ser Asn Asp Phe Lys Phe Leu Lys Pro Ile Phe Pro
760 765 770
AAT ATT GTA ACC CAG GAC TCT AGG AGG AAA TCA GAA TTT CTA GAA 3123
Asn Ile Val Ser Gin Asp Ser Arg Arg Lys Ser Glu Phe Leu Clu
775 780 785
TAATGTAGGT ATCTGTAGCT TTCCGACCGT CTGTTAATTT TGTCTTCCTC ACTTTTCACC 3183
-98CZ 288789 B6
TTAGTTTTTT TTAACCCTTT AGTAATCTTG AATTCTACTT TTTTTTAAAT TTCTACTGTT3243
GTCTTTAGTA ATGTTACTCA TTTCCTTTGT CTGATTGTTA GTTTTCAAAT TATTGTATTA3303
TTATAAATAT TTTATATCAG GAAAGTTCAT ATTTCTGAAT AAATTAATAG3353 (2) INFORMACE O SEQ ID NO: 110:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 787 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 110:
Met 1 Glu Pro Ala Gly 5 Glu Arg Phe Pro Glu 10 Gin Arg Gin Val Leu 15 Ile
Leu Leu Leu Leu Leu Glu Val Thr Leu Ala Gly Trp Glu Pro Arg Arg
20 25 30
Tyr Ser Val Met Glu Glu Thr Glu Arg Gly Ser Phe Val Ala Asn Leu
35 40 45
Ala Asn Asp Leu Gly Leu Gly Val Gly Glu Leu Ala Glu Arg Gly Ala
50 55 60
Arg Val Val Ser Glu Asp Asn Glu Gin Gly Leu Gin Leu Asp Leu Gin
65 70 75 80
Thr Gly Gin Leu Ile Leu Asn Glu Lys Leu Asp Arg Clu Lye Leu Cye
85 90 95
Gly Pro Thr Glu Pro Cys Ile Met His Phe Gin Val Leu Leu Lys Lys
100 105 110
Pro Leu Glu Val Phe Arg Ala Glu Leu Leu Val Thr Asp Ile Asn Asp
115 120 125
Hie Ser Pro Glu Phe Pro Glu Arg Glu Met Thr Leu Lys Ile Pro Glu
130 135 140
Thr Ser Ser Leu Gly Thr Val Phe Pro Leu Lys Lys Ala Arg Asp Leu
145 150 155 160
Asp Val Gly Ser Asn Asn Val Gin Asn Tyr Asn Ile Ser Pro Asn Ser
165 170 175
Híb Phe His Val Ser Thr Arg Thr Arg Gly Asp Gly Arg Lys Tyr Pro
180 185 190
Glu Leu Val Leu Asp Thr Glu Leu Asp Arg Glu Glu Gin Ala Glu Leu
195 200 205
Arg Leu Thr Leu Thr Ala Val Asp Gly Gly Ser Pro Pro Arg Ser Gly
210 215 220
-99CL 288789 B6
Thr 225 Val Gin Ile Leu Ile 230 Leu Val Leu Asp Ala 235 Aen Asp Asn Ala Pro 240
Glu Phe Val Gin Ala Leu Tyr Glu Val Gin Val Pro Glu Asn Ser Pro
245 250 255
Val Gly Ser Leu Val Val Lys Val Ser Ala Arg Asp Leu Asp Thr Gly
260 265 270
Thr Αβπ Gly Glu Ile Ser Tyr Ser Leu Tyr Tyr Ser Ser Gin Glu Ile
275 280 285
Asp Lys Pro Phe Glu Leu Ser Ser Leu Ser Gly Glu Ile Arg Leu Ile
290 295 300
Lys Lys Leu Asp Phe Glu Thr Met Ser Ser Tyr Asp Leu Asp Ile Clu
305 310 315 320
Ala Ser Asp Gly Gly Gly Leu Ser Gly Lys Cys Ser Val Ser Val Lys
325 330 335
Val Leu Asp Val Asn Asp Asn Phe Pro Glu Leu Ser Ile Ser Ser Leu
340 345 350
Thr Ser Pro Ile Pro Glu Asn Ser Pro Clu Thr Clu Val Ala Leu Phe
355 360 365
Arg Ile Arg Asp Arg Asp Ser Gly Clu Asn Gly Lys Met Ile Cys Ser
370 375 380
Ile Gin Asp Asp Val Pro Phe Lys Leu Lys Pro Ser Val Clu Asn Phe
385 390 395 400
Tyr Arg Leu Val Thr Glu Cly Ala Leu Ásp Arg Glu Thr Arg Ala Clu
405 410 415
Tyr Asn Ile Thr Ile Thr Ile Thr Asp Leu Gly Thr Pro Arg Leu Lys
420 425 430
Thr Glu Gin Ser Ile Thr Val Leu Val Ser Asp Val Asn Asp Asn Ala
435 440 445
Pro Ala Phe Thr Gin Thr Ser Tyr Thr Leu Phe Val Arg Glu Asn Asn
450 455 460
Ser Pro Ala Leu His Ile Gly Ser Val Ser Ala Thr Asp Arg Asp Ser
465 470 475 480
Gly Thr Asn Ala Gin Val Thr Tyr Ser Leu Leu Pro Pro Gin Asp Pro
485 490 495
His Leu Pro Leu Thr Ser Leu Val Ser Ile Asn Thr Asp Asn Gly His
500 505 510
Leu Phe Ala Leu Gin Ser Leu Asp Tyr Glu Ala Leu Gin Ala Phe Glu
515 520 525
Phe Arg Val Gly Ala Thr Asp Arg Gly Phe Pro Ala Leu Ser Ser Clu
530 535 540
-100CZ 288789 B6
Ala Leu 545 Val Arg Val Leu Val Leu 550 Asp Ala Asn 555 Asp Asn Ser Pro Phe 560
Val Leu Tyr Pro Leu Gin Asn Gly Ser Ala Pro Cy6 Thr Glu Leu Val
565 570 575
Pro Arg Ala Ala Glu Pro Gly Tyr Leu Val Thr Lys Val Val Ala Val
5B0 585 590
Asp Gly Asp Ser Gly Gin Asn Ala Trp Leu Ser Tyr Gin Leu Leu Lys
595 600 605
Ala Thr Glu Pro Gly Leu Phe Gly Val Trp Ala His Asn Gly Glu Val
610 615 620
Arg Thr Ala Arg Leu Leu Ser Glu Arg Asp Val Ala Lys His Arg Leu
625 630 635 640
Val Val Leu Val Lys Asp Asn Gly Glu Pro Pro Arg Ser Ala Thr Ala
645 650 655
Thr Leu Gin Val Leu Leu Val Asp Gly Phe Ser cln Pro Tyr Leu Pro
660 665 670
Leu Pro Glu Ala Ala Pro Ala Gin Ala Gin Ala Asp Ser Leu Thr Val
675 680 685
Tyr Leu Val Val Ala Leu Ala Ser Val Ser Ser Leu Phe Leu Phe Ser
690 695 700
Val Phe Leu Phe Val Ala Val Arg Leu Cys Arg Arg Ser Arg Ala Ala
705 710 715 720
Ser Val Gly Arg Cys Ser Val Pro Glu Gly Pro Phe Pro Gly His Leu
725 730 735
Val Asp Val Ser Gly Thr Gly Thr Leu Ser Gin Ser Tyr Gin Tyr Glu
740 745 750
Val Cys Leu Thr Gly Gly Ser Glu Ser Asn Asp Phe Lys Phe Leu Lys
755 760 765
Pro Ile Phe Pro Asn Ile Val Ser Gin Asp Ser Arg Arg Lys Ser Glu
770 775 780
Phe Leu Glu
785 (2) INFORMACE O SEQ ID NO: 111:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 3033 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 138..2528 (xi) POPIS SEKVENCE: SEQ ID NO: 111:
-101CZ 288789 B6
GTGATTGGAC GTGTTTTTGT GACTATTTGG GAAGAAGACA CCTTCCTAAT CAGATTTACT 60
CCAATATCTT CCCGGACCCT CATGAGTGGA . TTGCAATTGA CTTGAAGAAG CAGCACCCTC 120
AGCACTGAAT CTGAACA ATG GAG ACA GCA CTA GCA AAA ATA CCA CAG CAA 170
Met Glu Thr Ala Leu Ala Lys Ile Pro Gin Gin
1 5 10
AGG CAA GTC TTT TTT CTT ACT ATA TTG TCG TTA TTG TGG AAG TCT AGC 218
Arg Gin Val Phe Phe Leu Thr Ile Leu Ser Leu Leu Trp Lys Ser Ser
15 20 25
TCT GAG GCC ATT AGA TAT tcc ATG CCA GAA CAA ACA GAG AGT GGC TAT 266
Ser Glu Ala Ile Arg Tyr Ser Met Pro Glu Clu Thr Glu Ser Gly Tyr
30 35 40
ATG GTG GCT AAC CTG GCG AAA GAT CTG GGG ATC AGG GTT GGA CAA CTC 314
Met Val Ala Asn Leu Ala Lys Asp Leu Gly Ile Arg Val Gly Clu Leu
45 50 55
TCC TCT AGA CGA CCT CAA ATC CAT TAC AAA CGA AAC AAA CAA CTT TTG 362
Ser Ser Arg Gly Ala Gin Ile His Tyr Lys Cly Asn Lye Glu Leu Leu
60 65 70 75
CAG CTG GAT GCA CAG ACT GGG AAT TTG TTC TTA AAG GAA AAA CTA GAC 410
Gin Leu Asp Ala Glu Thr Gly Asn Leu Phe Leu Lys Glu Lys Leu Asp
80 85 90
AGA GAA CTG CTG TGT GCA CAG ACA GAA CCC TGT GTC CTG AAC TTC CAC 458
Arg Glu Leu Leu Cys Gly Clu Thr Clu Pro Cys Val Leu Asn Phe Cln
95 100 105
ATC ATA CTG GAA AAC CCT ATG CAC TTC TTC CAA ACT GAA CTG CAG CTC 506
Ile Ile Leu Glu Asn Pro Met Gin Phe Phe Gin Thr Glu Leu Cln Leu
110 115 120
ACA GAT ATA AAC GAC CAT TCT CCA GAG TTC CCC AAC AAC AAA ATG CTT 554
Thr Aep Ile Asn Asp His Ser Pro GlU Phe Pro Asn LyB Lys Het Leu
125 130 135
CTA ACA ATT CCT GAG AGT GCC CAT CCA CGG ACT GTG TTT CCT CTC AAG 602
Leu Thr Ile Pro Glu Ser Ala His Pro Gly Thr Val Phe Pro Leu Lys
140 145 150 155
CCA GCT CCG GAC TCT GAC ATA GGG AGC AAC GCT GTT CAG AAC TAC ACA 650
Ala Ala Arg Asp Ser Asp Ile Gly Ser Asn Ala Val Gin Asn Tyr Thr
160 165 170
GTC AAT CCC AAC CTC CAT TTC CAC GTC GTT ACT CAC AGT CGC ACA CAT 698
Val Aen Pro Asn Leu His Phe His Val Val Thr His Ser Arg Thr Asp
175 180 185
-102CZ 288789 B6
CCC Cly AGG Arg AAA TAC CCA CAG CTG CTG CTG Leu CAC AGA CCC CTG Leu 200 CAT ACG GAC Glu 746
Lys Tyr 190 Pro Clu Leu Val 195 Aep Arg Ala Asp Arg
GAG CAG CCT GAG CTC ACT TTA ATC CTC ACT GCT CTG GAT CGT CCA GCT 794
Glu Gin Pro Glu Leu Thr Leu Ile Leu Thr Ala Leu Asp Gly Gly Ala
205 210 215
CCT TCC AGG TCA CGA ACC ACC ACA GTT CAC ATA CAA GTT GTG CAC ATC 842
Pro Ser Arg Ser Gly Thr Thr Thr Val His Ile Glu Val Val Asp Ile
220 225 230 235
AAT GAT AAC TCC CCC CAG TTT GTA CAG TCA CTC TAT AAC GTG CAA GTT 890
Asn Asp Asn Ser Pro Gin Phe Val Gin Ser Leu Tyr Lys Val Gin Val
240 245 250
CCT CAG AAT AAT CCC CTC AAT GCC TTT GTT CTC ACG GTC TCT GCC ACG 938
Pro Glu Asn Asn Pro Leu Asn Ala Phe Val Val Thr Val Ser Ala Thr
255 260 265
GAT TTA CAT GCT GGG GTA TAT GGC AAT CTG ACC TAT TCT CTG TTT CAA 986
Asp Leu Asp Ala Gly Val Tyr Cly Asn Val Thr Tyr Ser Leu Phe Gin
270 275 280
GGG TAT GGG GTA TTT CAA CCA TTT GTA ATA CAC CAA ATC ACT CGA GAA 1034
Gly Tyr Gly Val Phe Gin Pro Phe Val Ile Asp Glu Ile Thr Gly Clu
285 290 295
ATC CAT CTG AGC AAA GAG CTG GAT TTT CAG CAA ATT AGC AAT CAT AAC 1082
Ile His Leu Ser Lys Clu Leu Asp Phe Clu Clu Ile Ser Asn Híb Asn
300 305 310 315
ATA CAA ATC CCA GCC ACA GAT CGA CGA GGC CTT TCA CCA AAA TCC ACT 1130
Ile Glu Ile Ala Ala Thr Asp Gly Gly Gly Leu Ser Gly Lys Cyo Thr
320 325 330
GTG CCT GTA CAG GTG TTG GAT CTG AAT CAC AAC GCC CCA GAG TTG ACA 1178
Val Ala Val Gin Val Leu Asp Val Asn Asp Asn Ala Pro Glu Leu Thr
335 340 345
ATT AGG AAG CTC ACA CTC CTG CTC CCA CAA AAT TCC CCA GAG ACT GTA 1226
Ile Arg Lys Leu Thr Val Leu Val Pro Glu Asn Ser Ala Glu Thr Val
350 355 360
GTT GCT GTT TTT AGT GTT TCT GAT TCT GAT TCG GGG GAC AAT GGA AGG 1274
Val Ala Val Phe Ser Val Ser Asp Ser Asp Ser Gly Asp Asn Gly Arg
'365 370 375
ATG GTG TGT TCT ATT CCG AAC AAT ATC CCA TTT CTC CTG AAA CCC ACA 1322
Het Val Cys Ser Ile Pro Asn Asn Ile Pro Phe Leu Leu Lye Pro Thr
380 385 390 395
TTT GAG AAT TAT TAC ACG TTA GTG ACT GAG GGG CCA CTT GAT AGA GAG 1370
Phe Glu Asn Tyr Tyr Thr Leu Val Thr Glu Gly Pro Leu Asp Arg Glu
400 405 410
AAC AGA GCT GAG TAC AAC ATC ACC ATC ACG GTC TCA CAT CTG GGC ACA 1418
Asn Arg Ala Glu Tyr Asn Ile Thr Ile Thr Val Ser Asp Leu Gly Thr
415 420 425
-103CZ 288789 B6
CCC Pro AGG CTC Arg Leu 430 ACA Thr ACC Thr CAG CAC ACC ATA ACA GTG CAA GTG TCC GAC Asp ATC Ile 1466
Gin His Thr 435 Ile Thr Val Gin Val 440 Ser
AAC GAC AAC GCC CCT GCC TTC ACC CAA ACC TCC TAC ACC ATC TTT GTC 1514
Aan Asp Asn Ala Pro Ala Phe Thr Gin Thr Ser Tyr Thr Het Phe Val
445 450 455
CAC GAG AAC AAC AGC CCC GCC CTG CAC ATA GCC ACC ATC AGT CCC ACA 1562
His Glu Asn Asn Ser Pro Ala Leu His Ile Gly Thr Ile Ser Ala Thr
460 465 470 475
GAC TCA CAC TCA GGC TCC AAT GCC CAC ATC ACC TAC TCG CTG CTC CCC 1610
Asp Ser Asp Ser Gly Ser Asn Ala His Ile Thr Tyr Ser Leu Leu Pro
480 485 490
CCT GAT GAC CCG CAG CTG GCC CTC GAC TCA CTC ATC TCC ATC AAT GTT 1658
Pro Asp Asp Pro Gin Leu Ala Leu Asp Ser Leu Ile Ser Ile Asn Val
495 500 505
GAC AAT GCC CAG CTG TTC CCC CTC ACA CCT CTA CAC TAT CAC CCA CTC 1706
Asp Aen Gly Gin Leu Phe Ala Leu Arg Ala Leu Asp Tyr Clu Ala Leu
510 515 520
CAG TCC TTC GAG TTC TAC GTG GGC GCT ACA GAT CGA CCC TCA CCC CCG 1754
Gin Ser Phe Glu Phe Tyr Val Cly Ala Thr Asp Gly Cly Ser Pro Ala
525 530 535
CTC AGC AGC CAG ACT CTG GTG CGC ATG GTG GTG CTG CAT CAC AAT GAC 1802
Leu Ser Ser Gin Thr Leu Val Arg Het Val Val Leu Asp Aep Asn Asp
540 545 550 555
AAT GCC CCC TTC GTG CTC TAC CCA CTG CAC AAT CCC TCA GCA CCC TGT 1850
Asn Ala Pro Phe Val Leu Tyr Pro Leu Cln Asn Ala Ser Ala Pro Cys
560 565 570
ACT GAG CTA CTG CCT AGG CCA GCA CAG CCC GGC TAC CTG ATC ACC AAA 1898
Thr Glu Leu Leu Pro Arg Ala Ala Clu Pro Gly Tyr Leu Ile Thr Lys
575 580 585
GTG GTG GCT GTG GAT CGC GAC TCT GGA CAC AAT GCT TGG CTG TCG •TTC 1946
Val Val Ala Val Asp Arg Asp Ser Gly Cln Asn Ala Trp Leu Ser Phe
590 595 600
CAG CTA CTT AAA GCT ACA GAG CCA CGG CTG TTC AGT CTA TGG CCA CAC 1994
Gin Leu Leu Lys Ala Thr Clu Pro Gly Leu Phe Ser Val Trp Ala His
' 605 610 615
AAT GGT GAA GTG CGC ACC ACT AGG CTG CTG AGT CAC CGA GAT GCT CAG 2042
Asn Gly Glu Val Arg Thr Thr Arg Leu Leu Ser Glu Arg Asp Ala Gin
620 625 630 635
AAG CAC AAG CTA CTG CTG CTG CTC AAG CAC AAT GGC GAT CCT CTG CGC 2090
Lys His Lys Leu Leu Leu Leu Val Lys Asp Asn Gly Asp Pro Leu Arg
640 645 650
TCT GCC AAT GTC ACT CTT CAC GTG CTA CTG GTG GAT GGC TTC TCG CAG 2138
Ser Ala Asn Val Thr Leu His Val Leu Val Val Asp Gly Phe Ser Gin
655 660 665
-104CZ 288789 B6
CCT TAC CTA CCA TTG GCT GAG GTG CCA CAG GAT TCC ATG CAA GAT AAT21B6
Pro Tyr Leu Pro Leu Ala Clu Val Ala Gin Asp Ser Het Gin Asp Aen
670 675680
TAC GAC GTT CTC ACA CTG TAC CTA GTC ATT GCC TTG GCA TCT GTA TCT2234
Tyr Asp Val Leu Thr Leu Tyr Leu Val Ile Ala Leu Ala ser ValSer
685 690695
TCT CTC TTC CTC TTG TCT GTA GTG CTG TTT GTG CGG GTG AGG CTG TCC2282
Ser Leu Phe Leu Leu Ser Val Val Leu Phe Val Gly Val Arg LeuCye
700 705 710715
AGG AGG GCC AGG GAG GCC TCC TTG GGT GAC TAC TCT GTG CCT GAG GGA2330
Arg Arg Ala Arg Glu Ala Ser Leu Gly Asp Tyr Ser Val Pro GluGly
720 725730
CAC TTT CCT AGC CAC TTG GTG GAT GTC AGC GGT GCC GGG ACC CTG TCC2378
Hie Phe Pro Ser His Leu Val Asp Val Ser Gly Ala Gly Thr LeuSer
735 740745
CAG AGT TAT CAA TAT GAG GTG TGT CTT AAT GGA GGT ACT AGA ACA AAT2426
Gin Ser Tyr Gin Tyr Glu Val Cys Leu Asn Gly Gly Thr Arg ThrAsn
750 755760
GAG TTT AAC TTT CTT AAA CCA TTG TTT CCT ATC CTT CCG ACC CAG GCT2474
Glu Phe Aen Phe Leu Lys Pro Leu Phe Pro Ile Leu Pro Thr GinAla
765 770775
CCT GCT GCT GAA GAA AGA GAA AAC GCT GTT GTG CAC AAT AGC GTT GGA2522
Ala Ala Ala Glu Glu Arg Glu Asn Ala Val Val His Aen Ser ValGly
780 785 790795
TTC TAT TAGAGCACTG ATTTTGAAGT GGTGGTTACC TCATTTTTCC TTAACTATCC2578
Phe Tyr
CTGATGTAGA ATGGTGTAGT GCCGTGAATC AACTCCTGAG ATATATGTTC ATTTTATCCT2638
TTGTTTTGAA TCAAACTATT CAGATGTGAT CCTACTCTAG AGAATTTCGT TCTACTCCAT2698
TGTGTTTGTT TAGATTTCTA CGCCATACCA GTGCATGCTG GGTTGTTTTT TTTTTTACAA2758
TTATTATAAC TTTGCTTTGG AGGGGAACTC ATATTCGCTG TAACGAATTG GAACCACTTT2818
CATTGTTAGA GATGCCTTGC TTTGTTGTGT TATTTCAGAC AGGGTCTTAA ATTGTAGCCC2878
TGGGTGACCT GAAATGACTA TGTACAGACT CACTTTGAAT TTGTGGCAGT CCATCTGCCT2938
CTGTTGTCCT ATGTTGGGAT TGTGAGCATG CATGAGTAGG CTCAGCTGTG GTGAGCGACC2998
TTAATAAAAA TCAAATACTA AAAAAAAAAA AAAAA3033 (2) INFORMACE O SEQ ID NO: 112:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 797 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID N0:l 12:
-105CZ 288789 B6
Met Glu Thr Ala 1 Leu Ala Lys 5 Ile Pro Gin 10 Gin Arg Cln Val Phe 15 Phe
Leu Thr Ile Leu Ser Leu Leu Trp Lys Ser Ser Ser Glu Ala Ile Arg
20 25 30
Tyr ser Met Pro Glu Clu Thr Glu Ser Gly Tyr Met Val Ala Asn Leu
35 40 45
Ala Lys Asp Leu Gly Ile Arg Val Gly Glu Leu Ser Ser Arg Gly Ala
50 55 60
Gin Ile His Tyr Lys Gly Asn Lys Glu Leu Leu Gin Leu Asp Ala Glu
65 70 75 80
Thr Gly Asn Leu Phe Leu Lys Glu Lys Leu Asp Arg Clu Leu Leu Cys
85 90 95
Gly Clu Thr Clu Pro Cys Val Leu Asn Phe Gin Ile Ile Leu Clu Asn
100 105 110
Pro Met Cln Phe Phe Cln Thr Clu Leu Gin Leu Thr Aop Ile Asn Aep
115 120 125
His Ser Pro Glu Phe Pro Asn Lys Lys Met Leu Leu Thr Ile Pro Glu
130 135 140
Ser Ala His Pro Gly Thr Val Phe Pro Leu Lys Ala Ala Arg Aop Ser
145 150 155 160
Aop Ile Gly Ser Asn Ala val Gin Asn Tyr Thr Val Asn Pro Asn Leu
165 170 175
Híb Phe His Val Val Thr His Ser Arg Thr Asp Gly Arg Lye Tyr Pro
180 185 190
Glu Leu Val Leu Asp Arg Ala Leu Asp Arg Glu Glu Gin Pro Clu Leu
195 200 205
Thr Leu Ile Leu Thr Ala Leu Asp Gly Gly Ala Pro Ser Arg Ser Gly
210 215 220
Thr Thr Thr Val His Ile Glu Val Val Asp Ile Asn Asp Asn Ser Pro
225 230 235 240
Gin Phe Val Gin Ser Leu Tyr Lys Val Gin Val Pro Glu Asn Asn Pro
245 .250 255
Leu Asn Ala Phe Val Val Thr Val Ser Ala Thr Asp Leu Asp Ala Gly
260 265 270
Val Tyr Gly Asn Val Thr Tyr Ser Leu Phe Gin Gly Tyr Cly Val Phe
275 280 285
Gin Pro Phe Val Ile Asp Glu Ile Thr Gly Glu Ile His Leu Ser Lye
290 295 300
-106CZ 288789 B6
Glu 305 Leu Aap Phe Glu Glu 310 Ile Ser Asn His Asn Ile 315 Clu Ile Ala Ala 320
Thr Aep Gly Gly Gly Leu Ser Cly Lys Cys Thr Val Ala Val Cln Val
325 330 335
Leu Aep Val Αβη Aep Asn Ala Pro Glu Leu Thr Ile Arg Lys Leu Thr
340 345 350
Val Leu Val Pro Glu Asn Ser Ala Glu Thr Val Val Ala Val Phe ser
355 360 365
Val Ser Aep Ser Asp Ser Gly Asp Asn Cly Arg Met Val Cys Ser Ile
370 375 380
Pro Asn Aen Ile Pro Phe Leu Leu Lys Pro Thr Phe Glu Asn Tyr Tyr
385 390 395 400
Thr Leu Val Thr Glu Gly Pro Leu Asp Arg Clu Asn Arg Ala Glu Tyr
405 410 415
Asn Ile Thr Ile Thr Val Ser Asp Leu Gly Thr Pro Arg Leu Thr Thr
420 425 430
Gin Hle Thr Ile Thr Val Cln Val Ser Asp Ile Asn Asp Asn Ala Pro
435 440 445
Ala Phe Thr Gin Thr Ser Tyr Thr Het Phe Val His Glu Asn Asn Ser
450 455 460
Pro Ala Leu Hic Ile Gly Thr Ile Ser Ala Thr Asp Ser Aep Ser Gly
465 470 475 480
Ser Aen Ala Hle Ile Thr Tyr Ser Leu Leu Pro Pro Asp Asp Pro Gin
485 490 495
Leu Ala Leu Asp Ser Leu Ile Ser Ile Asn Val Asp Asn Gly Gin Leu
500 505 510
Phe Ala Leu Arg Ala Leu Asp Tyr Glu Ala Leu Gin Ser Phe Glu Phe
515 520 525
Tyr Val Gly Ala Thr Asp Gly Cly Ser Pro Ala Leu Ser Ser Cln Thr
530 535 540
Leu •Val Arg Het Val Val Leu Asp Asp Asn Asp Asn Ala Pro Phe Val
545 550 555 560
Leu Tyr Pro Leu Gin Asn Ala Ser Ala Pro Cys Thr Glu Leu Leu Pro
565 570 575
Arg Ala Ala Glu Pro Gly Tyr Leu Ile Thr Lys Val Val Ala Val Asp
580 585 590
Arg Aep Ser Gly Gin Asn Ala Trp Leu Ser Phe Gin Leu Leu Lys Ala
595 600 605
Thr Glu Pro Gly Leu Phe Ser Val Trp Ala His Asn Gly Glu Val Arg
610 615 620
-107CZ 288789 B6
Thr 625 Thr Arg Leu Leu Ser 630 Glu Arg Asp Ala Gin Lys 635 His Lys Leu Leu 640
Leu Leu Val Lys Aep Asn Gly Asp Pro Leu Arg Ser Ala Asn Val Thr
645 650 655
Leu His Val Leu Val Val Asp Gly Phe Ser Gin Pro Tyr Leu Pro Leu
660 665 670
Ala Glu Val Ala Gin Asp Ser Met Gin Asp Asn Tyr Asp Val Leu Thr
675 680 685
Leu Tyr Leu Val Ile Ala Leu Ala Ser Val Ser Ser Leu Phe Leu Leu
690 695 700
Ser Val Val Leu Phe Val Gly Val Arg Leu Cys Arg Arg Ala Arg Glu
705 710 715 720
Ala Ser Leu Gly Asp Tyr Ser Val Pro Glu Gly His Phe Pro Ser His
725 730 735
Leu Val Aep Val Ser Gly Ala Gly Thr Leu Ser Gin Ser Tyr Gin Tyr
740 745 750
Clu Val Cys Leu Asn Gly Gly Thr Arg Thr Asn Glu Phe Asn Phe Leu
755 760 765
Lys Pro Leu Phe Pro Ile Leu Pro Thr Gin Ala Ala Ala Ala Glu Glu
770 775 780
Arg Glu Asn Ala Val Val His Asn Ser Val Gly Phe Tyr
785 790 795 (2) INFORMACE O SEQ ID NO: 113:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 2347 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (xi) POPIS SEKVENCE: SEQ ID NO: 113:
AAAACACGGG GGAAATGACA GTAGCAAAGA ATCTGGACTA TGAAGAATGC TCATTGTATG 60
AAATGGAAAT ACAGGCTGAA GATGTGGGGG CGCTTCTGGG GAGGAGCAAA GTGGTAATTA 120
TGGTAGAAGA TGTAAATGAC AATCGGCCAG AAGTGACCAT TACATCCTTG TTTAACCCGG 180
TATTGGAAAA TTCTCTTCCC GGGACAGTAA TTGCCTTCTT GAATGTGCAT GACCGAGACT 240
CTGGAAAGAA CGGCCAAGTT GTCTGTTACA CGCATGATAA CTTACCTTTT AAATTAGAAA 300
AGTCAATAGA TAATTATTAT AGATTGGTGA CATGGAAATA TTTGGACCGA GAAAAAGTCT 360
CCATCTACAA TATCACAGTG ATAGCCTCAG ATCTAGGAGC CCACTCTGTC ACTGAAACTT 420
-108CZ 288789 B6
ACATTGCCCT GATTGTGGCA GACACTAATG ACAACCCTCC TCGTTTTCCT CACACCTCCT 460
ACACAGCCTA TATTCCAGAG AACAACCTGA GGGGCGCCTC CATCTTCTCA CTGACTGCAC 540
ATGATCCTGA CAGTCAGGAA AATGCACAGG TCACTTACTC TGTGTCTGAG GACACCATAC 600
AGGGAGTGCC TTTGTCCTCT TATATCTCCA TCAACTCAGA TACTGGTGTC CTGTATGCAC 660
TGCACTCTTT TGACTTCGAG AAGATACAAG ACTTGCAGCT ACTGGTTGTT GCCACTGACA 720
GTGGAAGCCC ACCTCTCAGC AGCAATGTGT CATTGAGCTT GTTTGTGTTG GACCAGAACG 780
ACAACGCACC TGAGATTCTA TATCCTAGCT TCCCCACAGA TGGCTCCACT GGTGTGGAAC 840
TAGCACCCCG CTCTGCAGAG CCTGGATACC TAGTGACCAA AGTGGTGGCA GTGGACAAAG 900
ACTCAGGACA GAATGCTTGG CTGTCCTACC GTCTGCTGAA GGCCAGCGAA CCTGGGCTCT 960
TCTCTGTAGG ACTTCACACG GGTGAGGTGC CTACAGCGAG GGCCCTGCTG GACAGAGATG 1020
CTCTCAAACA GAATCTGGTG ATGGCCGTGC AGGACCATGG CCAACCCCCT CTCTCGGCCA 1080
CTGTAACTCT CACTGTGGCA GTGGCTAACA GCATCCCTGA CGTGTTGGCT GACTTGAGCA 1140
GCATTAGGAC CCCTGGGGTA CCAGAGGATT CTGATATCAC GCTCCACCTG GTGGTGGCAG 1200
TGGCTGTGGT CTCCTGTGTC TTCCTTGTCT TTGTCATTGT CCTCCTAGCT CTCAGGCTTC 1260
AGCGCTGGCA GAAGTCTCGC CAGCTCCAGG GCTCCAAAGG TGGATTGGCT CCTGCACCTC 1320
CATCACATTT TGTGCGCATC CACGGGGTAC AGGCTTTTCT ACAAACCTAT TCTCATGAAG 1380
TCTCGCTCAC TTCAGGCTCC CAGACAAGCC ACATTATCTT TCCTCAGCCC AACTATGCAG 1440
ACATGCTCAT TAACCAAGAA GGCTGTGAGA AAAATGATTC CTTATTAACA TCCATAGATT 1500
TTCATGAGAG TAACCCTGAA GATGCTTGCG CCCCGCAAGC CCCGCCCAAC ACTGACTGGC 1560
GTTTCTCTCA AGCCCAGAGA CCCGGCACGA GCGGATCCCA AAATGGGGAT GAAACCGGCA 1620
CCTGGCCCAA CAACCAGTTC GATACAGAGA TGCTGCAAGC CATGATCTTG GCCTCTGCCA 1680
GTGAAGCCGC TGATGGGAGC TCCACTCTGG GAGGGGGCAC TGGCACTATG GGTTTGAGCG 1740
CTCGATATGG ACCCCAGTTT ACCCTGCAGC ACGTGCCTGA CTACCGCCAG AACGTGTACA 1800
TCCCTGGCAG CAATGCCACA CTGACCAACG CAGCTGGCAA ACGAGATGGC AAGGCTCCGG 1860
CAGGCGGCAA TGGCAACAAC AACAAGTCGG GCAAGAAAGA GAAGAAGTAA TATGGAGGCC 1920
AGGCCTTGAG CCACAGGGCA GCCTCCCTCC CCAGCCAGTC CAGCTTGTCC TTACTTGTAC 1980
CCAGGCCTCA GAATTTCAGG GCTCACCCCA GGATTCTGGT AGGAGCCACA GCCAGGCCAT 2040
GCTCCCCGTT GGGAAACAGA AACAAGTGCC CAAGCCAACA CCCCCTCTTT GTACCCTAGG 2100
GGGGTTGAAT ATGCAAAGAG AGTTCTGCTG GGACCCCCTA TCCAATCAGT GATTGTACCC 2160
ACATAGGTAG CAGGGTTAGT GTGGATACAC ACACACACAC ACACACACAC ACACACACAA 2220
CCCTTGTCCT CCGCAGTGCC TGCCACTTTC TGGGACTTTC TCATCCCCCT ACGCCCTTCC 2280
-109CZ 288789 B6
TTTATCCTCT CCCACCCAGA CACAGCTGCT GGAGAATAAA TTTGCGGATG CTGATGCTAA
AAAAAAA
2340
2347 (2) INFORMACE O SEQ ID NO: 114:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 2972 bázových párů (B) TYP: nukleová kyselina (C) ŘETĚZCOVOST: jeden řetězec (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: cDNA (ix) CHARAKTERISTICKÝ ZNAK:
(A) JMÉNO/KLÍČ: CDS (B) UMÍSTĚNÍ: 2..1849 (xi) POPIS SEKVENCE: SEQ ID NO: 114:
A GAG GCT GCT CAC CAC CTG GTC CTC ACG CCC TČG GAT GGC GGC AAG 46
Glu Ala Ala His His Leu Val Leu Thr Ala Ser Asp Gly Gly Lys 15 10 15
CCG Pro CCT CGC TCT AGC ACA Thr CTG Val CCC ATC CAC GTG ACA CTG TTG Leu CAT Asp 30 ACA Thr 94
Pro Arg Ser Ser 20 Arg Tle Hle 25 Val Thr Val
AAT GAC AAT GCC CCG GTT TTT CCT CAC CCG ATT TAC CGA GTG AAA GTC 142
Asn Aep Asn Ala Pro Val Phe Pro His Pro lle Tyr Arg Val Lys val
35 40 45
CTT GAG AAC ATC CCC CCA CGC ACG CCG CTG CTT ACT CTA ACA CCC AGC 190
Leu Glu Asn Het Pro Pro Cly Thr Arg Leu Leu Thr Val Thr Ala Ser
50 55 60
GAC CCG GAT GAG GGA ATC AAC CCA AAA GTG CCA TAC AAA TTC CCG AAA 238
Asp Pro Aep Glu Gly Tle Asn Gly Lys Val Ala Tyr Lys Phe Arg Lys
65 70 75
ATT AAT GAA AAA CAA ACT CCG TTA TTC CAG CTT AAT GAA AAT ACT GGC 286
lle Asn Glu Lys Cln Thr Pro Leu Phe Gin Leu Aen Clu Asn Thr Gly
80 85 90 95
CAAATA TCA ΆΤΑ CCA AAA AGT CTA GAT TAT GAA CAA TGT TCA TTT TAT 334
Glu Zle Ser lle Ala Lys ser Leu Asp Tyr Glu Clu Cys Ser Phe Tyr
100 105 110
GAA ATG GAA ATA CAA GCC CAA CAT CTC GGC CCA CTT CTG CCC ACC ACC 382
Glu Met Glu Zle Gin Ala Clu Asp Val Gly Ala Leu Leu Cly Arg Thr
115 120 125
AAA TTG CTC ATT TCT GTG GAA CAT GTA AAT GAC AAT AGA CCA GAA GTG 430
Lys Leu Leu Tle Ser Val Glu Asp Val Asn Asp Asn Arg Pro Glu Val
130 135 140
ATC ATT ACG TCT TTG TTT AGC CCA GTG TTA CAA AAT TCT CTT CCC GCG 478
Zle lle Thr Ser Leu Phe Ser Pro Val Leu Glu Asn Ser Leu Pro Gly
145 150 155
-110CZ 288789 B6
ACA Thr 160 GTA ATT GCC TTC TTG Leu 165 AGT Ser GTG CAT GAC CAA GAC TCT GGA AAG Lys AAT Asn 175 526
Val Xle Ala Phe Val His Asp Cln 170 Asp Ser Gly
CGT CAA GTT GTC TGT TAC ACA CGT GAT AAT TTA CCT TTT AAA TTA CAA 574
Gly Gin Val Val Cys Tyr Thr Arg Asp Asn Leu Pro Phe Lys Leu Glu
180 185 190
AAG TCA ATA CCT AAT TAT TAT AGA TTA GTG ACA ACG AAA TAT TTG CAC 622
Lye Ser Ile Gly Aen Tyr Tyr Arg Leu Val Thr Arg Lys Tyr Leu Asp
195 200 205
CGA GAA AAT GTC TCT ATC TAC AAT ATC ACA GTG ATG CCC TCA GAT CTA 670
Arg Glu Aen Val Ser Ile Tyr Asn Ile Thr Val Het Ala Ser Asp Leu
210 215 220
CGA ACA CCA CCT CTG TCC ACT GAA ACT CAA ATC GCT CTG CAC CTG GCA 718
Cly Thr Pro Pro Leu Ser Thr Clu Thr Gin Ile Ala Leu His Val Ala
225 230 235
CAC Asp 240 ATT AAC GAC AAC Asn CCT CCT ACT TTC CCT CAT GCC TCC Ser TAC Tyr TCA Ser GCG Ala 255 766
Ile Aen Asp Pro 245 Pro Thr Phe Pro His 250 Ala
TAT ATC CTA GAG AAC AAC CTG AGA GGA GCC TCC ATC TTT TCC TTG ACT 814
Tyr Ile Leu Glu Asn Asn Leu Arg Cly Ala Ser Ile Phe Ser Leu Thr
260 265 270
CCA CAC GAC CCC GAC AGC CAG GAG AAT GCC CAG GTC ACT TAC TCT GTG 862
Ala His Asp Pro Asp Ser Gin Glu Asn Ala Gin Val Thr Tyr Ser Val
275 280 285
ACC GAG GAC ACG CTG CAG GGG GCG CCC CTG TCC TCG TAT ATC TCC ATC 910
Thr Glu Asp Thr Leu Gin Gly Ala Pro Leu Ser Ser Tyr Ile Ser Ile
290 295 300
AAC TCT GAC ACC CGT GTC CTG TAT GCG CTG CAA TCT TTC GAC TAT GAG 958
Asn Ser Asp Thr Gly Val Leu Tyr Ala Leu Gin Ser Phe Asp Tyr Glu
305 310 315
CAG ATC CGA GAC CTG CAG CTA CTG GTA ACA GCC AGC GAC AGC GGG GAC 1006
Cln Ile Arg Asp Leu Gin Leu Leu Val Thr Ala Ser Asp Ser Gly Aep
320 325 330 335
CCG CCC CTC AGC AGC AAC ATG TCA CTG AGC CTG TTC GTG CTG GAC CAG 1054
Pro 'Pro Leu Ser Ser Asn Met Ser Leu Ser Leu Phe Val Leu Asp Gin
340 345 350
AAT GAC AAC GCG CCC GAG ATC CTG TAC CCC GCC CTC CCC ACA GAC GGT 1102
Asn Asp Asn Ala Pro Glu Ile Leu Tyr Pro Ala Leu Pro Thr ABp Gly
355 360 365
TCC ACT GGC GTG GAG CTG GCG CCC CGC TCC GCA GAG CGT GGC TAC CTG 1150
Ser Thr Gly Val Glu Leu Ala Pro Arg Ser Ala Glu Arg Gly Tyr Leu
370 375 380
GTG ACC AAG GTG GTG GCG GTG GAC AGA GAC TCG GGC CAG AAC GCC TGG 1198
Val Thr Lys Val Val Ala Val Asp Arg Asp Ser Cly Gin Asn Ala Trp
385 390 395
-111CZ 288789 B6
CTG TCC TAC CGC CTC Arg Leu CTC Leu 405 AAG Lys CCC Ala AGC CAC CCG GGA CTC TTC TCC CTG 1246
Leu 400 Ser Tyr Ser Glu Pro Gly Leu 410 Phe Ser Val 415
CGT CTG CAC ACG CGC CAG GTG CCC ACG CCG CCA CCC CTG CTC CAC ACA 1294
Gly Leu His Thr Gly Clu Val Arg Thr Ala Arg Ala Leu Leu Asp Arg
420 425 430
GAC GCG CTC AAG CAG AGC CTC GTG CTG CCC GTC CAC CAC CAT GGC CAG 1342
Aep Ala Leu Lys Gin Ser Leu Val Val Ala Val Gin Asp His Gly Gin
435 440 445
CCC CCT CTC TCC CCC ACT GTC ACC CTC ACC CTA GCC GTG GCT CAC AGC 1390
Pro Pro Leu Ser Ala Thr Val Thr Leu Thr Val Ala Val Ala Asp Ser
450 455 460
ATC CCC CAA GTC CTG ACC GAG TTG CGC ACT CTG AAG CCT TCG GTC GAC 1438
Ile Pro Glu Val Leu Thr Clu Leu Gly Ser Leu Lys Pro Ser Val Asp
465 470 475
CCG AAC CAT TCG AGC CTT ACA CTC TAT CTC GTC CTG CCA CTC CCT GCC 1486
Pro Aen Aep Ser Ser Leu Thr Leu Tyr Leu Val Val Ala Val Ala Ala
480 485 490 495
ATC TCC TCT GTC TTC CTC GCC TTT CTC CCT CTC CTT CTC CGG CTC AGC 1534
Ile Ser Cys Val Phe Leu Ala Phe Val Ala Val Leu Leu Gly Leu Arg
500 505 510
CTG AGG CCC TGG CAC AAC TCA CGC CTG CTC CAG CAT TCC GGT CGC AGA 1582
Leu Arg Arg Trp His Lys Ser Arg Leu Leu Gin Asp Ser Cly Cly Arg
515 520 525
TTG CTA GGC CTG CCT GCC TCA CAT TTT CTG CGT CTT GAG GAG CTA CAC 1630
Leu Val Gly Val Pro Ala ser His Phe Val Gly Val Glu Glu Val Gin
530 535 540
CCT TTC CTG CAG ACC TAT TCC CAG CAA GTC TCC CTC ACC GCC CAC TCC 1678
Ala Phe Leu cln Thr Tyr Ser Gin Clu Val Ser Leu Thr Ala Asp Ser
545 550 555
CGG AAG AGT CAC CTG ATC TTT CCC CAG CCC AAC TAC GCA CAC ATG CTC 1726
Arg Lys Ser His Leu Ile Phe Pro Gin Pro Asn Tyr Ala Asp Met Leu
560 565 570 575
ATC AGT CAG CAG CGC TCT GAG AAA AAT GAT TCT TTC TTA ACA TCC GTA 1774
Ile Ser Cln Glu Cly Cys Glu Lys Asn Asp Ser Leu Leu Thr Ser Val
580 585 590
GAT TTT CAT GAA TAT AAG AAT GAA GCT GAT CAT CGT CAG GTG AGT TTA 1822
Asp Phe His Glu Tyr Lys Asn Clu Ala Asp His Gly Gin Val Ser Leu
595 600 605
CTT CTT TGC TTG CTT TTA ATT TCC AGA TGAATTTTAT TTGGCATAAA 1869
Val Leu Cys Leu Leu Leu Ile Ser Arg
610 615
TTATGTTTTG AAAAACATTG
TGAAGATAGT TGAAAATAAT TTTTAAGGTG TATCACAGAG
1929
TTTTGGGTTT ATTTTGGTGG TGTTACCAAA AAATTGAACT
CTAATAGTCA TAGGTTATTG
1989
TTTCATTTCC TTTTAAACCA CTTGGAAAAG ATTGTTCCAC
CATTTTAAAC CTTCCAGTAT
2049
-112CZ 288789 B6
TTTATTCCTA TTATCACTCA TTCACTTAAG AAGTAGCTAC CCGTCCATAC TCGTAATTTT 2109
CCTATTCTTT GTTTGTGTGT GTGTGTGTGT GTGTGTGTGT CTGTGTGTAT CCCAAACTAG 2169
AACTTCAGAA AATTATCAAG AAGTCTAAAG CCTTGTTATT AGCTTAGCAA AAGTAAAATA 2229
TATCTCAGAA TTTTTAGGGT TATGTTTAGC ATTTGAACCT GTAACTAGGC TCTTGTATAT 2289
TTCTTCACTT TAAACCTCTT TTCTGAGCCC TGTTTCTGTA CCAGTGCCCT TCAAAACTTT 2349
AATACTTCTT ACCATCCTTC AAAACATGAA CAAACTTTAA AGATGGATCT TGGTGGGAGA 2409
TGAGACTGGT TACTAAATAT TAAGTATGTG AGTCAGTGGT CACCTGGGCT CCATCCCCAT 2469
GGAGACATGA AATCTAAAGC CTAGAATGTC CATTGCTCCC CCAAACAAAA AACAAAAGCA 2529
AAAACATTAG ATCTGAATTA AAATGTAATT TTAAACTGTT GAAAGTGACT TTTGTAAAAT 2589
ATGTAAGAAC ATATTTCAAT ACAATTCCAA TTAGCTGTTT CGGTTGTCCA TTGATGTGAA 2649
GTGGTGAGAA TGTTGATATT AAGAACCAAT GTTTCAGGTA CACAAGTTCT AAATAAGCTG 2709
ATCAATTCAA TTAAAGTTAT TCAGTCTTGG CTGGACACAG TGCCTCATGT CTGAAATCCC 2769
AGCACTTTGG GAGCCTGCGG CAGGAGGACC GCTTGAGCCC CGGGGGTTTG AAACTGCAGT 2829
GAGCTATCAT CATGCCACTG CACTCCAGCC TAGGTGGCAG AACTAGACCC TGTCTCTAAA 2889
AAAACTATTA TTAGGCCGCG TGCGGTGGCT CACGCCTGTA ATCCCAGCAC TTTGGGAGAC 2949
TGAGGTGGGT GGATCACCTG AGC 2972
(2) INFORMACE O SEQ ID NO: 115:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 616 aminokyselin (B) TYP: aminokyselina (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 115:
Glu 1 Ala Ala His His 5 Leu Val Leu Thr Ala Ser 10 Asp Gly Gly Lys 15 Pro
Pro Arg Ser Ser Thr Val Arg Ile HÍ5 Val Thr Val Leu Asp Thr Asn
20 25 30
Asp Αεπ Ala Pro Val Phe Pro His Pro Ile Tyr Arg Val Lys Val Leu
35 40 45
Glu Asn Met Pro Pro Gly Thr Arg Leu Leu Thr Val Thr Ala ser Asp
50 55 60
Pro ABp Glu Cly Ile Asn Gly Lys Val Ala Tyr Lys Phe Arg Ly6 Ile
70 75 80
-113CZ 288789 B6
Asn Glu Lys Gin Thr 85 Pro Leu Phe Gin Leu Asn Glu Asn Thr Gly Glu
90 95
Ile Ser Ile Ala Lys Ser Leu Asp Tyr Glu Glu Cys Ser Phe Tyr Glu
100 105 110
Met Glu Ile Gin Ala Glu Asp Val Gly Ala Leu Leu Gly Arg Thr Lys
115 120 125
Leu Leu Ile Ser Val Glu Asp Val Asn Asp Asn Arg Pro Glu Val Ile
130 135 140
Ile Thr Ser Leu Phe Ser Pro Val Leu Glu Asn Ser Leu Pro Gly Thr
145 150 155 160
Val Ile Ala Phe Leu Ser Val His Asp Gin Asp Ser Gly Lys Asn Gly
165 170 175
Gin Val Val Cys Tyr Thr Arg Asp Asn Leu Pro Phe Lys Leu Glu Lys
180 185 190
Ser Ile Gly Asn Tyr Tyr Arg Leu Val Thr Arg Lys Tyr Leu Asp Arg
195 200 205
Glu Aen Val Ser Ile Tyr Asn Ile Thr Val Met Ala Ser Asp Leu Gly
210 215 220
Thr Pro Pro Leu Ser Thr Glu Thr Gin Ile Ala Leu His Val Ala Asp
225 230 235 240
Ile Asn Asp Aen Pro Pro Thr Phe Pro His Ala Ser Tyr Ser Ala Tyr
245 250 255
Ile Leu Glu Aen Asn Leu Arg Gly Ala Ser Ile Phe ser Leu Thr Ala
260 265 270
His Asp Pro Asp Ser Gin Glu Asn Ala Gin Val Thr Tyr Ser Val Thr
275 280 285
Glu Asp Thr Leu Gin Gly Ala Pro Leu Ser Ser Tyr Ile Ser Ile Asn
290 295 300
Ser Asp Thr Gly Val Leu Tyr Ala Leu Gin Ser Phe Asp Tyr Clu Gin
305 310 315 320
Ile Arg Asp Leu Gin Leu Leu Val Thr Ala Ser Asp Ser Gly Asp Pro
325 330 335
Pro Leu Ser Ser Asn Met Ser Leu Ser Leu Phe Val Leu Asp Gin Asn
340 345 350
Asp Asn Ala Pro Glu Ile Leu Tyr Pro Ala Leu Pro Thr Asp Gly Ser
355 360 365
Thr Gly Val Glu Leu Ala Pro Arg Ser Ala Glu Arg Gly Tyr Leu Val
370 375 380
Thr Lys Val Val Ala Val Asp Arg Asp Ser Gly Gin Asn Ala Trp Leu
385 390 395 400
-114CZ 288789 B6
Ser Tyr Arg Leu Leu 405 Lys Ala Ser Glu Pro Gly Leu 410 Phe Ser Val 415 Gly
Leu His Thr Gly Glu Val Arg Thr Ala Arg Ala Leu Leu Asp Arg Asp
420 425 430
Ala Leu Lye Gin Ser Leu Val Val Ala Val Gin Asp His Gly Gin Pro
435 440 445
Pro Leu Ser Ala Thr Val Thr Leu Thr Val Ala Val Ala Asp Ser Ile
450 455 460
Pro Clu Val Leu Thr Glu Leu Gly Ser Leu Lys Pro Ser Val Aep Pro
465 470 475 480
Asn Aep Ser Ser Leu Thr Leu Tyr Leu Val Val Ala Val Ala Ala Ile
485 490 495
Ser Cye Val Phe Leu Ala Phe Val Ala Val Leu Leu Cly Leu Arg Leu
500 505 510
Arg Arg Trp Hle Lys Ser Arg Leu Leu Gin Asp Ser Gly Gly Arg Leu
515 520 525
Val Gly Val Pro Ala Ser His Phe Val Gly Val Clu Glu Val Gin Ala
530 535 540
Phe Leu Gin Thr Tyr Ser Gin Glu Val Ser Leu Thr Ala Asp Ser Arg
545 550 555 560
Lye Ser Hic Leu Ile Phe Pro Gin Pro Asn Tyr Ala Asp Met Leu Ile
565 570 575
Ser Gin Glu Gly Cye Glu Lys Asn Asp Ser Leu Leu Thr Ser Val Asp
580 585 590
Phe His Glu Tyr Lys Asn Glu Ala Asp His Gly Gin Val Ser Leu Val
595 600 605
Leu Cye Leu Leu Leu Ile Ser Arg
610 615

Claims (26)

  1. PATENTOVÉ NÁROKY
    1. Purifíkovaná a izolovaná polynukleotidová sekvence kódující protokadherin zvolený ze souboru sestávajícího z
    a) humánního protokadherinu pc3 o sekvenci SEQ ID NO: 110 nebo jeho polypeptidového analogu, v němž je jedna nebo více specifikovaných aminokyselin vypuštěna nebo nahrazena, nebo v němž je přidána jedna nebo více aminokyselin, které nejsou přírodně kódovány, a to 1) beze ztráty jedné nebo více biologických aktivit nebo imunologický ch vlastností specifických pro protokadherin pc3 nebo 2) se specifickým zneschopněním určité vazebné funkce ligand/antiligand protokadherinu pc3;
    b) humánního protokadherinu pc4 o sekvenci SEQ ID NO: 115 nebo jeho polypeptidového analogu, v němž je jedna nebo více specifikovaných aminokyselin vypuštěna nebo nahrazena, nebo v němž je přidána jedna nebo více aminokyselin, které nejsou přírodně kódovány, a to 1)
    -115CZ 288789 B6 beze ztráty jedné nebo více biologických aktivit nebo imunologických vlastností specifických pro * protokadherin pc4 nebo 2) se specifickým zneschopněním určité vazebné funkce ligand/antiligand protokadherinu pc4; a
    5 c) krysího protokadherinu pc5 o sekvenci SEQ ID NO: 112 nebo jeho polypeptidového analogu, v němž je jedna nebo více specifikovaných aminokyselin vypuštěna nebo nahrazena, nebo v němž je přidána jedna nebo více aminokyselin, které nejsou přírodně kódovány, a to 1) beze ztráty jedné nebo více biologických aktivit nebo imunologických vlastností specifických pro protokadherin pc5 nebo 2) se specifickým zneschopněním určité vazebné funkce 10 ligand/antiligand protokadherinu pc5.
  2. 2. Polynukleotidová sekvence podle nároku 1, kterou je sekvence DNA.
  3. 3. Sekvence DNA podle nároku 2, kterou je sekvence cDNA.
  4. 4. Sekvence DNA podle nároku 2, kterou je sekvence genomové DNA.
  5. 5. Sekvence DNA podle nároku 2, která je zcela nebo částečně chemicky syntetizována.
    20
  6. 6. Polynukleotidová sekvence podle nároku 1, obsahující sekvenci kódující humánní protokadherin pc3, která má složení odpovídající SEQ ID NO: 109.
  7. 7. Polynukleotidová sekvence podle nároku 1, obsahující sekvenci kódující humánní protokadherin pc4, která má složení odpovídající SEQ ID NO: 114.
  8. 8. Polynukleotidová sekvence podle nároku 1, obsahující sekvenci kódující krysí protokadherin pc5, která má složení odpovídající SEQ ID NO: 111.
  9. 9. Biologicky funkční DNA vektor obsahující sekvenci DNA podle nároku 2.
  10. 10. Vektor podle nároku 9, v němž je sekvence DNA operativně připojena k sekvenci DNA regulující expresi.
  11. 11. Hostitelská buňka transformovaná nebo transfekovaná sekvencí DNA podle nároku 2 35 způsobem umožňujícím této hostitelské buňce exprimovat protokadherinový polypeptid.
  12. 12. Způsob produkce protokadherinového peptidu, vyznačující se tím, že zahrnuje stupeň pěstování hostitelské buňky podle nároku 11 ve vhodném živném prostředí a stupeň izolace protokadherinového polypeptidu z této hostitelské buňky nebo z růstového média
    40 použitého pro jej í pěstování.
  13. 13. Purifikovaný a izolovaný humánní protokadherinový polypeptid pc3 o sekvenci SEQ ID NO: 110 nebo jeho polypeptidového analogu, v němž je jedna nebo více specifikovaných aminokyselin vypuštěna nebo nahrazena, nebo v němž je přidána jedna nebo více aminokyselin,
    45 které nejsou přírodně kódovány, a to 1) beze ztráty jedné nebo více biologických aktivit nebo imunologických vlastností specifických pro protokadherin pc3 nebo 2) se specifickým zneschopněním určité vazebné funkce ligand/antiligand protokadherinu pc3.
  14. 14. Purifikovaný a izolovaný humánní protokadherinový polypeptid pc4 o sekvenci SEQ ID 50 NO: 115 nebo jeho polypeptidového analogu, v němž je jedna nebo více specifikovaných aminokyselin vypuštěna nebo nahrazena, nebo v němž je přidána jedna nebo více aminokyselin, které nejsou přírodně kódovány, a to 1) beze ztráty jedné nebo více biologických aktivit nebo imunologických vlastností specifických pro protokadherin pc4 nebo 2) se specifickým zneschopněním určité vazebné funkce ligand/antiligand protokadherinu pc4.
    -116CZ 288789 B6
  15. 15. Purifikovaný a izolovaný krysí protokadherinový polypeptid pc5 o sekvenci SEQ ID NO: 112 nebo jeho polypeptidového analogu, v němž je jedna nebo více specifikovaných aminokyselin vypuštěna nebo nahrazena, nebo v němž je přidána jedna nebo více aminokyselin, které nejsou přírodně kódovány, a to 1) beze ztráty jedné nebo více biologických aktivit nebo imunologických vlastností specifických pro protokadherin pc5 nebo 2) se specifickým zneschopněním určité vazebné funkce ligand/antiligand protokadherinu pc5.
  16. 16. Protilátková substance specifická pro humánní protokadherin pc3.
  17. 17. Protilátková substance specifická pro humánní protokadherin pc4.
  18. 18. Protilátková substance specifická pro krysí protokadherin pc5.
  19. 19. Protilátková substance specifická podle nároku 16, 17 nebo 18, kterou je monoklonální protilátka.
  20. 20. Hybridomální buněčná linie produkující monoklonální protilátku podle nároku 19.
  21. 21. Způsob modulace vazebné aktivity humánního protokadherinu pc3, vyznačující se t í m , že se tento protokadherin uvede do styku s protilátkovou substancí podle nároku 16, která je specifická pro tento protokadherin.
  22. 22. Způsob modulace vazebné aktivity humánního protokadherinu pc3, vyznačující se t í m , že se tento protokadherin uvede do styku s peptidovým ligandem tohoto protokadherinu.
  23. 23. Způsob modulace vazebné aktivity humánního protokadherinu pc4, vyznačující se t í m , že se tento protokadherin uvede do styku s protilátkovou substancí podle nároku 17, která je specifická pro tento protokadherin.
  24. 24. Způsob modulace vazebné aktivity humánního protokadherinu pc4, vyznačující se t í m , že se tento protokadherin uvede do styku s peptidovým ligandem tohoto protokadherinu.
  25. 25. Způsob modulace vazebné aktivity krysího protokadherinu pc5, vyznačující se t í m , že se tento protokadherin uvede do styku s protilátkovou substancí podle nároku 18, která je specifická pro tento protokadherin.
  26. 26. Způsob modulace vazebné aktivity krysího protokadherinu pc5, vyznačující se t í m , že se tento protokadherin uvede do styku s peptidovým ligandem tohoto protokadherinu.
CZ1996482A 1994-06-27 1995-06-26 Polynukleotidová sekvence kódující protokadherin, DNA vektor, hostitelská buňka, protokadherin, způsob jeho produkce, protilátková substance, buněčná linie a způsob modulace vazebné aktivity protokadherinu CZ288789B6 (cs)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US08/268,161 US5798224A (en) 1992-12-29 1994-06-27 Nucleic acids encoding protocadherin

Publications (2)

Publication Number Publication Date
CZ48296A3 CZ48296A3 (en) 1996-11-13
CZ288789B6 true CZ288789B6 (cs) 2001-09-12

Family

ID=23021746

Family Applications (1)

Application Number Title Priority Date Filing Date
CZ1996482A CZ288789B6 (cs) 1994-06-27 1995-06-26 Polynukleotidová sekvence kódující protokadherin, DNA vektor, hostitelská buňka, protokadherin, způsob jeho produkce, protilátková substance, buněčná linie a způsob modulace vazebné aktivity protokadherinu

Country Status (18)

Country Link
US (5) US5798224A (cs)
EP (1) EP0719330B1 (cs)
JP (1) JP3560344B2 (cs)
CN (1) CN1105187C (cs)
AT (1) ATE309347T1 (cs)
AU (1) AU699135B2 (cs)
BR (1) BR9506058A (cs)
CA (1) CA2170156A1 (cs)
CZ (1) CZ288789B6 (cs)
DE (1) DE69534588D1 (cs)
FI (1) FI960888A0 (cs)
HU (1) HU221637B1 (cs)
MX (1) MX9600666A (cs)
NO (1) NO319686B1 (cs)
PL (1) PL182324B1 (cs)
RU (1) RU2197525C2 (cs)
SK (1) SK281413B6 (cs)
WO (1) WO1996000289A1 (cs)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6458939B1 (en) 1996-03-15 2002-10-01 Millennium Pharmaceuticals, Inc. Compositions and methods for the diagnosis, prevention, and treatment of neoplastic cell growth and proliferation
WO1998030584A2 (en) * 1997-01-09 1998-07-16 Genetics Institute, Inc. Secreted proteins and polynucleotides encoding them
US20020137890A1 (en) * 1997-03-31 2002-09-26 Genentech, Inc. Secreted and transmembrane polypeptides and nucleic acids encoding the same
AU3908299A (en) * 1997-12-08 1999-06-28 Ontogeny, Inc. Cadherin-like polypeptides, methods and compositions related thereto
EP2256204A1 (en) * 1997-12-10 2010-12-01 CSL Limited Porphorymonas gingivalis polypeptides and polynucleotides
DK1241185T3 (da) * 1998-03-26 2005-04-25 Genentech Inc Nucleinsyrer, der er opformeret i humane tumorer, samt beslægtede materialer og fremgangsmåder
US7481999B2 (en) * 1998-05-05 2009-01-27 Adherex Technologies, Inc. Compounds and methods for modulating OB-cadherin-mediated function
US6680175B2 (en) * 1998-05-05 2004-01-20 Adherex Technologies, Inc. Methods for diagnosing and evaluating cancer
US6472367B1 (en) 1998-05-05 2002-10-29 Adherex Technologies, Inc. Compounds and methods for modulating OB-cadherin mediated cell adhesion
US6638911B1 (en) 1998-05-05 2003-10-28 Adherex Technologies Inc. Compounds and methods for modulating desmosomal cadherin-mediated functions
US20050203025A1 (en) * 1998-05-05 2005-09-15 Adherex Technologies, Inc. Compounds and methods for modulating nonclassical cadherin-mediated functions
US6277824B1 (en) 1998-07-10 2001-08-21 Adherex Technologies Compounds and methods for modulating adhesion molecule function
US20030096951A1 (en) * 1998-08-14 2003-05-22 Kenneth Jacobs Secreted proteins and polynucleotides encoding them
US7041807B1 (en) 1999-06-23 2006-05-09 Caprion Pharmaceuticals, Inc. Antibodies to a YYX epitope of a mammalian prion protein
US6787136B1 (en) 1999-09-03 2004-09-07 The Brigham And Women's Hospital, Inc. Methods and compositions for treatment of inflammatory disease using cadherin-11 modulating agents
US7193050B2 (en) 2000-02-18 2007-03-20 Genentech, Inc. Secreted and transmembrane polypeptides and nucleic acids encoding the same
CN1313328A (zh) * 2000-03-15 2001-09-19 上海博德基因开发有限公司 一种新的多肽——人原钙粘素14和编码这种多肽的多核苷酸
AU2001275306A1 (en) * 2000-06-06 2001-12-17 Genaissance Pharmaceuticals, Inc. Haplotypes of the pcdh2 gene
US6790636B1 (en) * 2000-06-14 2004-09-14 The United States Of America As Represented By The Department Of Health And Human Services Rapid fluorescent labeling of tissue for microdissection using fluorescent specific binding agents
JP2004504018A (ja) * 2000-07-19 2004-02-12 ファルマシア・アンド・アップジョン・カンパニー β−セレクターゼ活性の基質およびアッセイ
US7122311B2 (en) * 2001-07-16 2006-10-17 Novartis Ag Methods for determining the risk of developing asthma characterized by bronchial hyperresponsiveness
US20040072236A1 (en) 2002-09-27 2004-04-15 Neil Cashman PrPSc -interacting molecules and uses thereof
WO2004048411A2 (en) * 2002-11-14 2004-06-10 Adherex Technologies, Inc. Compounds and methods for modulating desmosomal and atypical cadherin-mediated cell adhesion
CN101492673B (zh) * 2008-01-25 2012-01-11 中国科学院上海生命科学研究院 非洲爪蟾xpapc基因启动子及其组织特异性增强子
CN102274506A (zh) * 2008-09-07 2011-12-14 苏州爱生基因有限公司 治疗或预防癌症的药物
CN102274509A (zh) * 2008-09-07 2011-12-14 苏州爱生基因有限公司 治疗或预防癌症的药物
CN102274503A (zh) * 2008-09-07 2011-12-14 苏州爱生基因有限公司 治疗或预防癌症的药物
CN102274490A (zh) * 2008-09-07 2011-12-14 苏州爱生基因有限公司 一种用于治疗或预防癌症的药物
CN102274501A (zh) * 2008-09-07 2011-12-14 苏州爱生基因有限公司 一种治疗或预防癌症的药物
CN102274489A (zh) * 2008-09-07 2011-12-14 苏州爱生基因有限公司 治疗或预防癌症的药物
CN102274507A (zh) * 2008-09-07 2011-12-14 苏州爱生基因有限公司 一种用于治疗或预防癌症的药物
CN102274499A (zh) * 2008-09-07 2011-12-14 苏州爱生基因有限公司 用于治疗或预防癌症的药物
MA33276B1 (fr) * 2009-04-20 2012-05-02 Oxford Biotherapeutics Ltd Anticorps spécifiques à la cadhérine-17
WO2011115268A1 (ja) * 2010-03-18 2011-09-22 大日本住友製薬株式会社 腫瘍血管新生阻害剤
US8877188B2 (en) 2010-05-04 2014-11-04 The Brigham And Women's Hospital, Inc. Detection and treatment of non-dermal fibrosis
US9534058B2 (en) 2012-02-08 2017-01-03 Abbvie Stemcentrx Llc Anti-CD324 monoclonal antibodies and uses thereof
CN103194476A (zh) * 2013-04-07 2013-07-10 新乡医学院 鸡pcdh1基因部分片段的克隆、表达及多克隆抗体的制备
AU2015302959B2 (en) * 2014-08-12 2018-09-20 Novartis Ag Anti-CDH6 antibody drug conjugates
US11097005B2 (en) 2014-12-15 2021-08-24 The Brigham And Women's Hospital, Inc. Use of cadherin-11 antagonists to treat metabolic disorders and/or increase insulin sensitivity

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05500504A (ja) * 1989-09-27 1993-02-04 アテナ・ニュウロサイエンスィズ・インコーポレイテッド 細胞付着阻止のための組成物及び使用方法
DE69129760T2 (de) * 1990-10-30 1999-03-25 La Jolla Cancer Research Foundation, La Jolla, Calif. T-cadherin-bindungsmolekül

Also Published As

Publication number Publication date
FI960888L (fi) 1996-02-26
SK25296A3 (en) 1997-02-05
NO960767L (no) 1996-04-26
US6262237B1 (en) 2001-07-17
HUT75825A (en) 1997-05-28
HU9600449D0 (en) 1996-04-29
WO1996000289A1 (en) 1996-01-04
CN1105187C (zh) 2003-04-09
NO319686B1 (no) 2005-09-05
AU2872495A (en) 1996-01-19
MX9600666A (es) 1997-06-28
HU221637B1 (hu) 2002-12-28
US5798224A (en) 1998-08-25
EP0719330A1 (en) 1996-07-03
DE69534588D1 (de) 2005-12-15
PL182324B1 (pl) 2001-12-31
CA2170156A1 (en) 1996-01-04
SK281413B6 (sk) 2001-03-12
CN1134172A (zh) 1996-10-23
US5708143A (en) 1998-01-13
JPH09505740A (ja) 1997-06-10
EP0719330B1 (en) 2005-11-09
JP3560344B2 (ja) 2004-09-02
CZ48296A3 (en) 1996-11-13
PL313256A1 (en) 1996-06-24
BR9506058A (pt) 1997-08-05
RU2197525C2 (ru) 2003-01-27
US5891706A (en) 1999-04-06
AU699135B2 (en) 1998-11-26
US20030139581A1 (en) 2003-07-24
NO960767D0 (no) 1996-02-26
ATE309347T1 (de) 2005-11-15
FI960888A0 (fi) 1996-02-26

Similar Documents

Publication Publication Date Title
CZ288789B6 (cs) Polynukleotidová sekvence kódující protokadherin, DNA vektor, hostitelská buňka, protokadherin, způsob jeho produkce, protilátková substance, buněčná linie a způsob modulace vazebné aktivity protokadherinu
KR100381788B1 (ko) 신규단백질및그제조방법,골다공증,골량감소증및골대사이상증의예방또는치료제
US6455042B1 (en) Method of treating ulcerative colitis or crohn's disease by administering an antibody toαEβ7 integrin
US5643781A (en) DNA encoding protocadherin-42
CA2299619A1 (en) Human orphan receptor ntr-1
JP4326944B2 (ja) ナチュラルキラー細胞活性に関与する表面分子ntb−a
US5599676A (en) Method for isolating a novel receptor for α4 integrins
CA2316545A1 (en) Novel nucleic acid and polypeptide with homology to the tnf-receptors
US20060024291A1 (en) Protocadherin materials and methods
AU736328B2 (en) Morphogenic proteins
JP2001505420A (ja) 肝臓アクチビン/インヒビンのヌクレオチド配列およびタンパク質配列ならびにそれらに基づく方法
WO1998037195A9 (en) Morphogenic proteins
WO1997020573A1 (en) Growth factor receptor-binding protein 2 homolog
AU4500696A (en) Novel receptor tyrosine kinases
WO1998036064A9 (en) Phosphonate binding proteins
WO1998020114A1 (en) Novel receptor tyrosine kinases
WO1998036064A1 (en) Phosphonate binding proteins

Legal Events

Date Code Title Description
PD00 Pending as of 2000-06-30 in czech republic
MM4A Patent lapsed due to non-payment of fee

Effective date: 20060626