JP4852576B2 - ヒトテロメラーゼ触媒性サブユニット - Google Patents
ヒトテロメラーゼ触媒性サブユニット Download PDFInfo
- Publication number
- JP4852576B2 JP4852576B2 JP2008194208A JP2008194208A JP4852576B2 JP 4852576 B2 JP4852576 B2 JP 4852576B2 JP 2008194208 A JP2008194208 A JP 2008194208A JP 2008194208 A JP2008194208 A JP 2008194208A JP 4852576 B2 JP4852576 B2 JP 4852576B2
- Authority
- JP
- Japan
- Prior art keywords
- htrt
- telomerase
- polynucleotide
- sequence
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 0 CC(C)C(C)=CC1C(C2)CC(CCC3=*CC(CC4CC(C)CC4)C3)CC2C1 Chemical compound CC(C)C(C)=CC1C(C2)CC(CCC3=*CC(CC4CC(C)CC4)C3)CC2C1 0.000 description 1
- KPLTXTIAEQUDPO-UHFFFAOYSA-N CC(CC1CC1)(C1)C(C2)=C1CC2C(CC1)CCC1C1CCCC1 Chemical compound CC(CC1CC1)(C1)C(C2)=C1CC2C(CC1)CCC1C1CCCC1 KPLTXTIAEQUDPO-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/16—Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P11/00—Drugs for disorders of the respiratory system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P15/00—Drugs for genital or sexual disorders; Contraceptives
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P15/00—Drugs for genital or sexual disorders; Contraceptives
- A61P15/08—Drugs for genital or sexual disorders; Contraceptives for gonadal disorders or for enhancing fertility, e.g. inducers of ovulation or of spermatogenesis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
- A61P17/02—Drugs for dermatological disorders for treating wounds, ulcers, burns, scars, keloids, or the like
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
- A61P17/14—Drugs for dermatological disorders for baldness or alopecia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
- A61P19/02—Drugs for skeletal disorders for joint disorders, e.g. arthritis, arthrosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
- A61P19/08—Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease
- A61P19/10—Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease for osteoporosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
- A61P21/04—Drugs for disorders of the muscular or neuromuscular system for myasthenia gravis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/14—Drugs for disorders of the nervous system for treating abnormal movements, e.g. chorea, dyskinesia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/14—Drugs for disorders of the nervous system for treating abnormal movements, e.g. chorea, dyskinesia
- A61P25/16—Anti-Parkinson drugs
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/28—Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
- A61P3/08—Drugs for disorders of the metabolism for glucose homeostasis
- A61P3/10—Drugs for disorders of the metabolism for glucose homeostasis for hyperglycaemia, e.g. antidiabetics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
- A61P3/12—Drugs for disorders of the metabolism for electrolyte homeostasis
- A61P3/14—Drugs for disorders of the metabolism for electrolyte homeostasis for calcium homeostasis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
- A61P35/02—Antineoplastic agents specific for leukemia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P5/00—Drugs for disorders of the endocrine system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P5/00—Drugs for disorders of the endocrine system
- A61P5/06—Drugs for disorders of the endocrine system of the anterior pituitary hormones, e.g. TSH, ACTH, FSH, LH, PRL, GH
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P5/00—Drugs for disorders of the endocrine system
- A61P5/38—Drugs for disorders of the endocrine system of the suprarenal hormones
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/02—Antithrombotic agents; Anticoagulants; Platelet aggregation inhibitors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
- A61P9/10—Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
- A61P9/14—Vasoprotectives; Antihaemorrhoidals; Drugs for varicose therapy; Capillary stabilisers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1137—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1276—RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07049—RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/05—Animals comprising random inserted nucleic acids (transgenic)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/15—Nucleic acids forming more than 2 strands, e.g. TFOs
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/315—Phosphorothioates
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S530/00—Chemistry: natural resins or derivatives; peptides or proteins; lignins or reaction products thereof
- Y10S530/827—Proteins from mammals or birds
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S530/00—Chemistry: natural resins or derivatives; peptides or proteins; lignins or reaction products thereof
- Y10S530/827—Proteins from mammals or birds
- Y10S530/828—Cancer
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Genetics & Genomics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- General Chemical & Material Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Diabetes (AREA)
- Endocrinology (AREA)
- Immunology (AREA)
- Neurology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Neurosurgery (AREA)
- Hematology (AREA)
- Physical Education & Sports Medicine (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Rheumatology (AREA)
- Obesity (AREA)
- Dermatology (AREA)
- Reproductive Health (AREA)
- Cardiology (AREA)
Description
ードする新規な核酸に関する。特に、本発明は、ヒトのテロメラーゼ触媒サブユ
ニットに関する。本発明は、医学、分子生物学、化学、薬理学、ならびに医学的
診断および予後の技術に関する方法および組成物を提供する。
認識されてきた(非特許文献1〜2)。従来のDNAポリメラーゼによる線状DNA鎖の複製
は、RNAプライマーを必要とし、そして5'末端から3'末端へのみ進行し得る。
真核生物の染色体DNA鎖の5'最末端に結合したRNAがはずれるとき、ギャップが
挿入される。これは、複製が繰り返されるたびに、娘鎖の連続的短鎖化を導く。
テロメア(染色体の末端に物理的に位置しているタンパク質−DNA構造体)のこ
の短鎖化は、インビトロおよびインビボでの正常なヒトの体細胞の細胞老化また
は加齢現象を説明すると考えられている(例えば、Goldstein、1990、Science 2
49:1129;Martinら、1979、Lab. Invest. 23:86;Goldsteinら、1969、Proc. Na
tl. Acad. Sci. USA、64:155;およびSchneiderおよびMitsui, 1976, Proc. Nat
l. Acad. Sci. USA, 73:3584を参照のこと)。
、増殖能の欠如)への細胞の進入と関係する。さらに、細胞がテロメアの長さを
維持(または増大)する能力によって、細胞が老化するのを免れる、すなわち細
胞を不死化させる。
た(例えば、HarleyおよびVilleponteau、1995、Curr.Opin.Genet.Dev. 5:249を
参照のこと)。ほとんどの生物において、テロメリックDNAは、タンデム(tandem
)配置の非常に単純な配列からなる;ヒトおよび他の脊椎動物では、テロメリッ
クDNAは、配列TTAGGGが数百から数千のタンデム反復からなる。細胞中でのテロ
メアの長さを決定および調節する方法は、PCT公開WO 93/23572およびWO 96/4101
6に記載されている。
メラーゼの機能である。テロメラーゼは、そのRNA部分の一部をテロメア反復のD
NA合成のための鋳型として用いるリボ核タンパク質(RNP)である(Morin、1997
, Eur. J. Cancer 33:750;Yuら、1990, Nature 344:126;SingerおよびGottsch
ling、1994、Science 266:404;AutexierおよびGreider、1994, Genes Develop.
, 8:563;Gilleyら、1995, Genes Develop., 9:2214;McEachernおよびBlackbur
n、1995, Nature 367:403;Blackburn、1992, Ann. Rev. Biochem., 61:113;Gr
eider、1996, Ann. Rev. Biochem., 65:337)。ヒトおよび他のテロメラーゼのR
NA成分は、クローン化および特徴付けされている(PCT公開WO 96/01835およびFe
ngら、1995, Science 269:1236を参照のこと)。しかしながら、テロメラーゼの
タンパク質成分の特徴付けは困難であった。これは、テロメラーゼRNP(これは
、発現される細胞中で、極めて低レベルで存在する)の精製が困難であることが
証明されたことが一因である。例えば、高レベルのテロメラーゼ活性を発現する
と知られているヒト細胞は、1細胞当たりわずか約100分子の酵素しか有しない
と見積もられている。
る能力)との関係に一致して、テロメラーゼ活性は、不死の細胞株および非常に
多様なセットの腫瘍組織中に検出されるが、正常な体細胞培養物または腫瘍に隣
接する正常な組織中には検出されない(すなわち、存在しないか、またはアッセ
イの閾を下回った)(米国特許第5,629,154号;同第5,489,508号;同第5,648,21
5号;および同第5,639,613号参照のこと;また、Morin、1989, Cell 59:521;Sh
ayおよびBacchetti 1997, Eur. J. Cancer 33:787;Kimら、1994, Science 266:
2011;Counterら、1992, EMBO J. 11:1921;Counterら、1994, Proc. Natl. Aca
d. Sci. U.S.A. 91, 2900;Counterら、1994, J. Virol. 68:3410も参照のこと)
。さらに、腫瘍中のテロメラーゼ活性のレベルと、患者の適切な臨床結果との相
関関係が報告されている(例えば、米国特許第5,639,613号(前出);Langford
ら、1997, Hum. Pathol. 28:416)。テロメラーゼ活性はまた、ヒトの生殖細胞、
増殖中の幹細胞または始原細胞、および活性化されたリンパ球で検出されている
。体細胞の幹細胞または始原細胞、および活性化されたリンパ球では、テロメラ
ーゼ活性は、典型的には、非常に低いか、または一時的にのみ発現されるかのい
づれかである(Chiuら、1996, Stem Cells 14:239;Bodnarら、1996, Exp. Cell
Res. 228:58;Taylorら、1996, J. Invest. Dermatology 106:759を参照のこと
)。
ガン)の診断および処置のための理想的な標的である。ヒトにおけるガンおよび
他のテロメラーゼ関連の疾患を診断および処置する方法は、米国特許第5,489,50
8号、同第5,639,613号および同第5,645,986号に記載されている。テロメラーゼ
をモニターすることにより、腫瘍の進行を予想するための方法は、米国特許第5,
639,613号に記載されている。ヒトテロメラーゼの触媒タンパク質サブユニット
の発見および特徴付けは、テロメラーゼ、ならびに疾患の診断および治療のため
のさらなる有用なアッセイを提供する。さらに、触媒タンパク質サブユニットの
一次配列のクローニングおよび決定は、ヒトのガンおよび細胞増殖能および老化
に関連した他の疾患のためのより効果的な治療を可能にする。
この出願の発明に関連する先行技術文献情報としては、次のものがある。
Watson、1972、Nature New Biol.、239:197 Olovnikov、1973、J. Theor. Biol.、41:181
そのフラグメントの、単離された、実質的に純粋な、または組換えタンパク質調
製物を提供する。
タンパク質調製物であって、該タンパク質が、図17のhTRTタンパク質と少なく
とも75%の配列同一性を有するアミノ酸配列、その変異体またはそのフラグメン
トを有することにより特徴づけられる、タンパク質調製物を提供する。
グメントを有する。
テロメラーゼ触媒活性を有する。
ロメラーゼ触媒活性を有さない。
ノ酸残基を含む。
である。
ロメラーゼ活性を有するリボ核タンパク質複合体を形成する。
配列を有する。
る。
。
む、単離された、合成の、実質的に純粋な、または組換えのポリヌクレオチドを
提供する。
それ以上の保存的置換を含む配列を有するhTRTタンパク質をコードするヌクレオ
チド配列を含む、単離された、合成の、実質的に純粋な、または組換えのポリヌ
クレオチドを提供する。
7に記載のアミノ酸配列を有する。
リヌクレオチドであって、該ポリヌクレオチドのヌクレオチド配列が、デフォル
トパラメータを使用するBLASTアルゴリズムを使用して図16に記載のヌクレオ
チド配列と比較した場合、約0.5未満の最小合計確率(smallest sum probability
)を有する、組換えポリヌクレオチドを提供する。
下で、図16に記載の配列を有するポリヌクレオチドとハイブリダイズする。
する配列に、作動可能に連結したプロモーター配列を含む。
するhTRTプロモーター以外のプロモーターである。
在するhTRT遺伝子またはhTRT mRNA中の連続配列と同一かまたは正確に相補的で
ある少なくとも10ヌクレオチドの連続配列を含む、単離された、合成の、実質的
に純粋な、または組換えのポリヌクレオチドを提供する。
に存在しない合成ヌクレオチドを含む。
子またはhTRT mRNA中の前記連続配列と同一である。
子またはhTRT mRNA中の前記連続配列と正確に相補的である。
オチドである。
約20ヌクレオチドを含む。
ポリヌクレオチドを含まない細胞に対して増加した増殖能を有する。
前記組換えポリヌクレオチドを含まない細胞に対して増加したテロメラーゼ活性
レベルを有する。
を提供する。
る。
って、該抗体またはフラグメントがhTRTタンパク質と特異的に結合する、抗体ま
たはフラグメントを提供する。
で結合する。
。
かどうかを決定する方法であって、該化合物または処置の施行後に、hTRTタンパ
ク質またはポリヌクレオチドを含む細胞、動物、または組成物において、活性ま
たは発現の変化を検出する工程を包含する方法を提供する。
かどうかを決定する方法を提供する。この方法は、以下の工程を包含する:
a)hTRTタンパク質を含む組成物を提供する工程;
b)このhTRTタンパク質を上記試験化合物と接触させる工程;および
c)このhTRTの活性を測定する工程であって、上記試験化合物の非存在下での
hTRT活性と比較して上記試験化合物の存在下で測定されたhTRT活性の変化が、上
記試験化合物がテロメラーゼ逆転写酵素活性を調節することの決定を提供する、
工程。
む細胞である。
ト生物である。
産物である。
へのヌクレオチド標識の組込みをモニターすることによって測定される。
ゼ基質へのプローブのハイブリダイゼーションをモニターすることによって測定
される。
ゼ基質の増幅をモニターすることによって測定される。
れた細胞のテロメア長をモニターすることによって測定される。
に結合する能力の喪失をモニターすることによって測定される。
物と接触させる工程、および該hTRTの特性または活性の変化を測定する工程を包
含し、ここで、統計的に有意な変化が、該化合物をhTRT活性を調節するものとし
て同定する方法を提供する。
質とテロメラーゼRNA成分とを、該組換えタンパク質と該テロメラーゼRNA成分が
会合して、テロメラーゼ基質へのヌクレオチドの付加を触媒し得るテロメラーゼ
酵素を形成する条件下で接触させる工程を包含する方法を提供する。
列を有する。
において産生される。
おいて共発現する。
る。
天然に発現する。
は、テロメラーゼ活性を発現しない。
、テロメラーゼ活性を発現する。
a)上記サンプルを、上記遺伝子産物に特異的に結合するプローブと接触させ
る工程であって、ここで、このプローブおよび上記遺伝子産物が複合体を形成す
る、工程、およびこの複合体を検出する工程;または
b)上記生物学的サンプル中の上記遺伝子産物を特異的に増幅する工程であっ
て、ここで、上記遺伝子産物が核酸である、工程、およびこの増幅産物を検出す
る工程
を包含し、ここで、この複合体または増幅産物の存在を、上記生物学的サンプル
における上記hTRT遺伝子産物の存在と相関づける、方法を提供する。
含む。
程はインタクトな細胞中で生じる。
程は細胞抽出物中で生じる。
ゼ陽性ヒト細胞の存在を検出する方法であって、
a)上記サンプル中のhTRT遺伝子産物の量を測定する工程、
b)この測定した量をテロメラーゼ陽性細胞を欠くサンプルに相関するコント
ロールと比較する工程
を包含し、ここで、このコントロールと比較して、上記サンプルにおける上記hT
RT遺伝子産物のより高いレベルの存在を、上記生物学的サンプルにおけるテロメ
ラーゼ陽性細胞の存在と相関づける、方法を提供する。
ある。
ある。
ある。
、 a)上記患者から細胞または組織サンプルを得る工程;
b)この細胞または組織中のhTRT遺伝子産物の量を測定する工程;および
c)この細胞または組織中のhRTR遺伝子産物の量を、同じタイプの健常な細胞
または組織中の量と比較する工程
を包含する方法を提供し、ここで、上記患者由来のサンプル中のhTRT遺伝子産物
の量と、健常な細胞または組織中の量との差異が、テロメラーゼ関連状態の診断
である。
たは組織中の量より高く、そして前記テロメラーゼ関連状態はガンである。
:
a)上記患者から生物学的サンプルを得る工程;および
b)上記患者のサンプルにおいてhTRT遺伝子産物を検出する工程
を包含する方法を提供し、ここで、上記サンプルにおけるhTRT遺伝子産物の検出
を、ガンの診断に相関づける。
:
a)患者のサンプルを得る工程;
b)上記患者のサンプル中のhTRT遺伝子産物の量を測定する工程;および
c)hTRT遺伝子産物の量を正常値と比較する工程
を包含する方法を提供し、ここで、この正常値より高い、患者における上記hTRT
遺伝子産物の量が、ガンの診断である。
:
a)少なくとも1つの細胞を含む患者サンプルを得る工程;
b)上記サンプル中の細胞におけるhTRT遺伝子産物の量を測定する工程;およ
び
c)この細胞中のhTRT遺伝子産物の量を、この細胞の正常値と比較する工程
を包含する方法を提供し、ここで、この正常値より多い上記サンプル中のhTRT遺
伝子産物の量が、ガンの診断である。
胞を含む。
a)上記患者から得たガン細胞中のhTRT遺伝子産物の量を測定する工程;およ
び
b)このガン細胞中のhTRTの量を、このガンの予後と一致する、1つのガン細
胞あたりのhTRTの予後値と比較する工程
を包含する方法を提供し、これによって、この予後値である、上記サンプル中の
1細胞あたりのhTRの量が特定の予後を提供する。
モニターする方法であって、
a)上記患者由来の少なくとも1つのガン細胞中のhTRT遺伝子産物の量の第1
の測定を行う工程;
b)上記患者由来の少なくとも1つのガン細胞中のhTRT遺伝子産物のレベルの
第2の測定を行う工程であって、ここで、この抗ガン処置が該第2の測定の前に
上記患者に施行される、工程;および
c)この第1および第2の測定値を比較する工程であって、この第2の測定値
におけるhTRT遺伝子産物のより低いレベルを、抗ガン処置が上記患者におけるガ
ン細胞の増殖能を減少させる能力と相関づける、工程
を包含する方法を提供する。
核酸またはその部分配列(subsequence)、hTRTポリペプチドまたはその部分配列
、および抗hTRT抗体から選択される分子を含む容器を含む、キットを提供する。
を増幅するために使用され得る一対のプライマーを含む。
ズし得るオリゴヌクレオチドプローブを含む。
って、上記脊椎動物細胞の増殖能を増大させるための方法であって、ここで、こ
の配列がプロモーターに作動可能に連結される方法を提供する。
るhTRTは、テロメラーゼ触媒活性を有する。
の配列を有する。
をさらに包含する。
治療ベクターを使用して患者の少なくとも1つの細胞に導入される。
に連結された、hTRをコードする配列を含むポリヌクレオチドを導入する工程を
さらに包含する。
効量のhTRTポリペプチドを導入する工程を包含する、方法を提供する。
媒活性を有する。
体、hTRTポリペプチドをコードするポリヌクレオチド、およびhTRT核酸またはそ
の部分配列から選択される分子を含む、薬学組成物を提供する。
方法であって、上記細胞中に、治療有効量の上記テロメラーゼ活性のインヒビタ
ーを導入する工程を包含し、ここで、このインヒビターがhTRTポリペプチド、hT
RTに結合する抗体、またはhTRTポリヌクレオチドである、方法を提供する。
列、またはその部分配列または変異体を含むポリペプチドである。
誘導体化された残基を含む。
への結合を阻害する。
上記工程は、前記hTRTポリペプチドをコードするポリヌクレオチドまたはhTRTポ
リヌクレオチドで、前記細胞または祖先を形質転換する工程を包含する。
コードするポリヌクレオチドを提供する。
は、タンパク質コード配列に作動可能に連結される。
は、hTRT以外のタンパク質をコードする。
離するための方法であって、
(a)上記核酸を一対のオリゴヌクレオチドプライマーと、このプライマーが
上記核酸中の相補配列とハイブリダイズし、そしてこのプライマーの3'末端へ
のヌクレオチドの付加によって伸長して、上記核酸にハイブリダイズする伸長プ
ライマーを形成するする条件下で接触させて反応混合物を形成させる工程であっ
て、ここで、この一対のオリゴヌクレオチドプライマーは、異なる配列のプライ
マーの混合物である少なくとも1つのプライマーを含み、そして該プライマーの
うち少なくとも1つは結合部分で標識されている、工程;
(b)工程(a)において形成された反応混合物を加熱するかまたはそうでなけ
れば処置して、上記核酸とハイブリダイズする伸長プライマーを変性させ、次い
で上記接触させる工程(a)を繰り返す工程;
(c)工程(b)を少なくとも1回から10回繰り返す工程;
(d)この反応混合物を固体支持体上に固定された薬剤と、二本鎖核酸が上記
接触させる工程の間変性しない条件下で接触させる工程であって、この薬剤は上
記結合部分と特異的に結合し、したがって上記結合部分を含む上記伸長プライマ
ーに結合する、工程;
(e)非特異的に結合した物質を該固体支持体から除去して、支持体に結合し
た核酸混合物を調製する工程;
(f)上記薬剤は該結合部分に結合したままであり、そして二本鎖核酸は変性
されて一本鎖核酸を形成する条件下で、上記支持体に結合した核酸混合物を加熱
またはそうでなければ変性させる工程;および
(g)加熱する工程(e)の後、上記支持体に結合していない任意の一本鎖核酸
を単離する工程
を包含する、方法を提供する。
酸を使用する第2の増幅反応を行う工程をさらに包含する。
上記薬剤はアビジンまたはアビジン化分子である。
たはそれらのフラグメントの、単離された、実質的に純粋な、または組換えタン
パク質調製物を提供する。
するアミノ酸配列またはその変異体またはそのフラグメントを有することによっ
て特徴付けられる、単離された、実質的に純粋な、または組換えhTRTタンパク質
を提供する。
む、単離された、合成の、実質的に純粋な、または組換えポリヌクレオチドを提
供する。
有する。
することにおいて、長さが少なくとも10ヌクレオチドから10kbであり、そして天
然に存在するhTRT遺伝子またはhTRT mRNA中の連続配列と同一かまたは正確に相
補的である少なくとも10ヌクレオチドの連続配列を含むポリヌクレオチドの使用
を提供する。
レオチドから10kbであり、そして天然に存在するhTRT遺伝子またはhTRT mRNA中
の連続配列と同一かまたは正確に相補的である少なくとも10ヌクレオチドの連続
配列を含むポリヌクレオチドの使用を提供する。
。
ントを提供する。
かどうかを決定する方法であって、上記化合物または処置の施行後に、hTRT組換
えタンパク質またはポリヌクレオチドを含む細胞、動物、または組成物において
、活性または発現の変化を検出する工程を包含する、方法を提供する。
方法を提供し、この方法は以下の工程:
(a)本発明のhTRTタンパク質を上記試験化合物と接触させる工程;および
(b)上記hTRTタンパク質の活性を測定する工程であって、上記試験化合物の
非存在下でのhTRT活性と比較して上記試験化合物の存在下で測定されたhTRT活性
の変化が、該試験化合物がテロメラーゼ逆転写酵素活性を調節することの決定を
提供する、工程
を包含する。
程:
本発明の組換えhTRTタンパク質とテロメラーゼRNA成分とを、この組換えタンパ
ク質とこのテロメラーゼRNA成分が会合して、テロメラーゼ基質へのヌクレオチ
ドの付加を触媒し得るテロメラーゼ酵素を形成する条件下で接触させる工程を包
含する。
(a)上記サンプルを、上記遺伝子産物に特異的に結合するプローブと接触さ
せる工程であって、ここで、このプローブおよび上記遺伝子産物が複合体を形成
する、工程、およびこの複合体を検出する工程;または
(b)上記生物学的サンプル中の上記遺伝子産物を特異的に増幅する工程であ
って、ここで、上記遺伝子産物が核酸である、工程、およびこの増幅産物を検出
する工程
を包含する方法を提供し、ここで、この複合体または増幅産物の存在を、上記生
物学的サンプル中の上記hTRT遺伝子産物の存在と相関づける。
ゼ陽性ヒト細胞の存在を検出する方法を提供し、この方法は以下の工程:
(a)上記サンプル中のhTRT遺伝子産物の量を測定する工程、
(b)この測定した量をテロメラーゼ陽性細胞を欠くサンプルに相関するコン
トロールと比較する工程
を包含し、ここでこのコントロールと比較して、上記サンプル中の上記hTRT遺伝
子産物のより高いレベルの存在を、上記生物学的サンプルにおけるテロメラーゼ
陽性細胞の存在と相関づける。
、 (a)上記患者から細胞または組織サンプルを得る工程;
(b)上記細胞または組織中のhTRT遺伝子産物の量を測定する工程;および
(c)上記細胞または組織中のhTRT遺伝子産物の量を、同じタイプの健常な細
胞または組織中の量と比較する工程
を包含する方法を提供し、ここで、上記患者由来のサンプル中のhTRT遺伝子産物
の量と、健常な細胞または組織中の量との差異が、テロメラーゼ関連状態を診断
する。
トロでの該脊椎動物細胞の増殖能を増大させるための方法を提供する。
処置するための医薬の製造における、hTRTの発現を増大させる薬剤の使用を提供
する。
である。
たはフラグメント、本発明のhTRT抗体または結合フラグメント、本発明で規定さ
れるhTRTタンパク質、変異体またはフラグメントをコードするポリヌクレオチド
、あるいはhTRTタンパク質をコードする核酸またはその部分配列を含む、薬学組
成物を提供する。
するための医薬の製造における、テロメラーゼ活性のインヒビターの使用を提供
する。
して使用する。
製造において使用される。
たはガンの影響を阻害するための医薬の製造において使用される。
て使用される。
造において使用される。
はガンの影響を阻害するための医薬の製造において使用される。
(b)このDNAにハイブリダイズし、そしてhTRTタンパク質または変異体をコー
ドする少なくとも10ヌクレオチドのポリヌクレオチド;
(c)遺伝コードの結果として、(a)および(b)に規定されるDNA配列に縮重し
、そしてhTRTポリペプチドまたは変異体をコードするDNA配列
から選択されるポリヌクレオチドを提供する。
れらのフラグメントの単離されたタンパク質調製物、実質的に純粋なタンパク質
調製物、または組換えタンパク質調製物を提供する。1つの実施態様において、
このタンパク質は、以下のアミノ酸配列を有する定義されたモチーフを有するこ
とにより特徴付けられる:
Trp-R1-X7-R1-R1-R2-X-Phe-Phe-Tyr-X-Thr-Glu-X8〜9-R3-R3-Arg-R4-X2-Trp
ここで、Xは任意のアミノ酸でありかつ下付き文字は連続する残基の数をいい、
R1はロイシンまたはイソロイシンであり、R2はグルタミンまたはアルギニンであ
り、R3はフェニルアラニンまたはチロシンであり、そしてR4はリジンまたはヒス
チジンである。1つの実施態様において、このタンパク質は、ヒトTRTの配列を
有する。他の実施態様において、本発明は、このようなタンパク質の部分配列と
実質的な配列同一性を有するペプチドおよびポリペプチドに関する。
コードする、単離された核酸、実質的に純粋な核酸、または組換え核酸を提供す
る。1つの実施態様において、この核酸は、以下のアミノ酸配列を含むタンパク
質をコードする:
Trp-R1-X7-R1-R1-R2-X-Phe-Phe-Tyr-X-Thr-Glu-X8〜9-R3-R3-Arg-R4-X2-Trp
。
別の実施態様において、この核酸はヒトTRTタンパク質をコードする配列を有す
る。他の実施態様において、本発明は、このような核酸の部分配列と実質的な配
列同一性または相補性を共有するオリゴヌクレオチドおよびポリヌクレオチドに
関する。
ンパク質に関する。従って、1つの実施態様において、本発明は、hTRTタンパク
質またはその変異体、あるいはそれらのフラグメントの、単離されたタンパク質
調製物、実質的に純粋なタンパク質調製物、または組換えタンパク質調製物を提
供する。1つの実施態様において、このタンパク質は、図17のhTRTタンパク質(
配列番号2)またはその変異体、あるいはそれらのフラグメントと少なくとも約
75%または少なくとも約80%の配列同一性を有するアミノ酸配列を有することに
より特徴付けられる。関連する局面において、hTRTタンパク質は、配列番号2の
配列を有する。いくつかの実施態様において、タンパク質は、1つ以上のテロメ
ラーゼ活性(例えば、触媒活性)を有する。1つの実施態様において、hTRTタン
パク質のフラグメントは、少なくとも6つのアミノ酸残基を有する。
ロメラーゼRNA(例えば、ヒトテロメラーゼRNA)であり得る。1つの実施態様に
おいて、hTRTタンパク質およびヒトテロメラーゼRNA(hTR)は、テロメラーゼ活
性を有するリボ核タンパク質複合体に由来する。
ロメラーゼ(例えば、hTRTタンパク質を含み、そしてhTRを含む、実質的に純粋
なヒトテロメラーゼ)を提供する。1つの実施態様において、テロメラーゼは、
少なくとも約95%純粋である。テロメラーゼは、細胞(例えば、組換え宿主細胞
またはテロメラーゼ活性を発現する細胞)から単離され得る。
単離されたポリヌクレオチド、合成のポリヌクレオチド、実質的に純粋なポリヌ
クレオチド、または組換えポリヌクレオチドを提供する。1つの実施態様におい
て、このポリヌクレオチドは、図17(配列番号2)に示すアミノ酸配列を有する
hTRTタンパク質をコードするヌクレオチド配列、あるいはこのアミノ酸配列中に
1つ以上の保存的アミノ酸(またはコドン)置換、または1つ以上の活性を変化
させるアミノ酸(またはコドン)置換を含む配列を有する。関連する局面におい
て、このポリヌクレオチドは、図16(配列番号1)に示す配列を有するポリヌク
レオチドにストリンジェントな条件下でハイブリダイズする。別の関連する局面
において、このポリヌクレオチドのヌクレオチド配列は、デフォルトパラメータ
ーを有するBLASTアルゴリズムを用いて図16(配列番号1)に示すヌクレオチド
配列と比較した場合、約0.5未満の最小合計確率を有する。
連結されたプロモーター配列を有するポリヌクレオチドを提供する。このプロモ
ーターは、天然に存在するhTRTプロモーター以外のプロモーターであり得る。関
連する局面において、本発明は、hTRTのプロモーターを含む発現ベクターを提供
する。
るhTRT遺伝子またはhTRT mRNA中の連続する配列に同一であるかまたは正確に相
補的である少なくとも10ヌクレオチドの連続する配列を含む、単離されたポリヌ
クレオチド、合成のポリヌクレオチド、実質的に純粋なポリヌクレオチド、また
は組換えポリヌクレオチドを提供する。いくつかの実施態様において、このポリ
ヌクレオチドは、RNA、DNAであるか、または1つ以上の天然に存在しない合成ヌ
クレオチドを含む。1つの局面において、このポリヌクレオチドは、天然に存在
するhTRT遺伝子またはhTRT mRNA中の少なくとも10の連続するヌクレオチドの連
続する配列に同一であるかまたは正確に相補的である。例えば、このポリヌクレ
オチドは、アンチセンスポリヌクレオチドであり得る。1つの実施態様において
、アンチセンスポリヌクレオチドは、少なくとも約20ヌクレオチドを含む。
ーゼ基質へのヌクレオチドの添加を触媒し得るテロメラーゼ酵素を形成するよう
な条件下で、この組換えhTRTタンパク質とこのテロメラーゼRNA成分とを接触さ
せることにより、組換えテロメラーゼを調製する方法をさらに提供する。1つの
実施態様において、hTRTタンパク質は、図17(配列番号2)に示す配列を有する
。hTRTタンパク質は、インビトロ発現系で産生され得、そしてテロメラーゼRNA
と混合され得るか、または別の実施態様において、テロメラーゼRNAはインビト
ロ発現系で同時に発現され得る。1つの実施態様において、テロメラーゼRNAはh
TRである。別の実施態様において、接触は、ヒト細胞のような細胞中で生じる。
1つの実施態様において、細胞は、hTRTとRNAとの接触、またはトランスフェク
ションによるようなhTRTポリヌクレオチドの導入の前にはテロメラーゼ活性を有
さない。1つの実施態様において、テロメラーゼRNAはこの細胞によって天然に
発現される。
動可能に連結したhTRTタンパク質コード配列を有するポリヌクレオチド)を含む
細胞(例えば、ヒト、マウス、または酵母の細胞)を提供する。特定の局面にお
いて、細胞は、哺乳動物(例えば、ヒト)由来の細胞のような脊椎動物細胞であ
り、そして組換えポリヌクレオチドを含まないこと以外は同一である細胞と比較
して増加した増殖能力を有するか、または組換えポリヌクレオチドを含まないこ
と以外は同一である細胞と比較して増加したテロメラーゼ活性レベルを有する。
いくつかの実施態様において、細胞は不死である。
チドをコードするポリヌクレオチドを含む生物および細胞(例えば、酵母、植物
、細菌、または非ヒト動物(例えば、マウス)のようなトランスジェニック非ヒ
ト生物)を提供する。本発明はまた、hTRT遺伝子が欠失している(ノックアウト
の)、またはこの遺伝子が天然に存在するhTRT遺伝子産物を発現しないように変
異したトランスジェニック動物および細胞を提供する。従って、別の実施態様に
おいて、トランスジェニック非ヒト動物は、変異したテロメラーゼ遺伝子を有し
、テロメラーゼ活性を欠損した動物であり、TRT欠損が、野生型TRTと比較して減
少したレベルのテロメラーゼ活性を有するTRTをコードする変異した遺伝子の結
果である動物であり、そしてミスセンス変異、ナンセンス変異、挿入、または欠
失を含む1つ以上の変異を有する変異したTRT遺伝子を有する動物である。
換え抗体、あるいはそのフラグメントを提供する。1つの実施態様において、抗
体は、少なくとも約108M-1の親和性で結合する。抗体は、モノクローナルであ
り得るか、またはポリクローナル抗血清のようなポリクローナル組成物であり得
る。関連する局面において、本発明は、ハイブリドーマのような、抗体を分泌し
得る細胞を提供する。
発現のモジュレーターであるか否かを決定するための方法を提供する。この方法
は、化合物の投与または処置の後に、hTRTタンパク質またはポリヌクレオチドを
含む、細胞、動物、または組成物中の活性または発現における変化を検出または
モニタリングする工程を包含する。1つの実施態様において、この方法は、以下
の工程を含む:TRT組成物を提供する工程、TRTを試験化合物と接触させる工程、
およびTRTの活性を測定する工程。ここで、試験化合物の存在下でのTRT活性の変
化は、その試験化合物がTRT活性を調節することの指標である。特定の実施態様
において、組成物は、hTRTポリペプチドをコードする組換えポリヌクレオチドを
含む、細胞、生物、トランスジェニック生物、または発現系のようなインビトロ
の系である。従って、この方法のhTRTは、インビトロ発現の産物であり得る。種
々の実施態様において、テロメラーゼ活性または発現の検出は、hTRT遺伝子産物
の発生量の変化を検出すること、テロメラーゼに対する基質へのヌクレオチド標
識の取り込みをモニタリングすること、伸長したテロメラーゼ基質へのプローブ
のハイブリダイゼーションをモニタリングすること、伸長したテロメラーゼ基質
の増幅をモニタリングすること、試験化合物に曝された細胞のテロメア長をモニ
タリングすること、テロメラーゼの染色体への結合能力の喪失をモニタリングす
ること、またはテロメア構造の蓄積または喪失を測定することにより行われ得る
。
るプローブと接触させ(ここで、プローブと遺伝子産物は複合体を形成する)、
そして複合体を検出する(ここで、複合体の存在は、生物学的試料中のhTRT遺伝
子産物の存在に相関する)ことにより、生物学的試料中のhTRT遺伝子産物を検出
する方法を提供する。遺伝子産物は、RNA、DNA、またはポリペプチドであり得る
。検出のために使用され得るプローブの例としては、核酸および抗体が挙げられ
るが、これらに限定されない。
検出することにより検出される核酸である。ここで、複合体または増幅産物の存
在は、生物学的試料中のhTRT遺伝子産物の存在に相関する。
。別の実施態様において、生物学的試料は、ヒト細胞培養物のようなインビトロ
細胞培養物に由来する少なくとも1つの細胞を含む。
はテロメラーゼ陽性のヒト細胞の存在を検出する方法を提供する。この方法は、
ヒト細胞を含む生物学的試料を得る工程;および高レベルのhTRT遺伝子産物を有
する細胞の試料中の存在を検出する工程を含み、ここで高レベルのhTRT遺伝子産
物を有する細胞の存在は、生物学的試料中の不死またはテロメラーゼ陽性の細胞
の存在に相関する。
法を提供する。この方法は、患者から細胞または組織の試料を得る工程、細胞ま
たは組織中のhTRT遺伝子産物の量を決定する工程;および細胞または組織中のhT
RT遺伝子産物の量を、同じタイプの健康な細胞または組織中の量と比較する工程
を含み、ここで、患者および健康な細胞または組織由来の試料中のhTRT遺伝子産
物との間の量の差異は、テロメラーゼに関連する状態を診断する。1つの実施態
様において、テロメラーゼに関連する状態はガンであり、そしてより多量のhTRT
遺伝子産物が試料中に検出される。
患者から生物学的試料を得る工程、および患者の試料中のhTRT遺伝子産物を検出
する工程を含み、ここで、試料中でのhTRT遺伝子産物の検出は、ガンの診断に相
関する。
患者の試料を得る工程、患者の試料中のhTRT遺伝子産物の量を決定する工程;お
よびhTRT遺伝子産物の量を正常値またはコントロール値と比較する工程を含み、
ここで正常値またはコントロール値よりも多い量の患者におけるhTRT遺伝子産物
は、ガンを診断する。
なくとも1つの細胞を含む患者の試料を得る工程;試料中の細胞におけるhTRT遺
伝子産物の量を決定する工程;および細胞のhTRT遺伝子産物の量をこの細胞につ
いての正常値と比較する工程を含み、ここで、正常値よりも多量のhTRT遺伝子産
物は、ガンを診断する。1つの実施態様において、試料は、少なくとも1つの悪
性細胞を含むと考えられる。
方法は、患者から得たガン細胞におけるhTRT遺伝子産物の量を決定する工程;お
よびガン細胞中のhTRTの量をガンの予測と一致するhTRTの予測値と比較する工程
を含み;ここで、予測値である量の試料中のhTRTは、特定の予測を提供する。
の能力をモニタリングするための方法を提供する。この方法は、患者由来の少な
くとも1つのガン細胞におけるhTRT遺伝子産物の量を1回目に測定する工程、患
者由来の少なくとも1つのガン細胞のhTRT遺伝子産物のレベルを2回目に測定す
る工程(ここで、抗ガン処置は2回目の測定の前に患者に投与される);そして
1回目と2回目の測定値を比較する工程(ここで、2回目の測定におけるhTRT遺
伝子産物のより低いレベルは、患者においてガン細胞の増殖能を減少させるため
の抗ガン処置の能力に相関する)を含む。
。1つの実施態様において、キットは、hTRT核酸またはその部分配列、hTRTポリ
ペプチドまたはその部分配列、および抗hTRT抗体から選択される分子を含有する
容器を含む。
発明は、哺乳動物細胞のような脊椎動物細胞の増殖能を増大させるための方法を
提供する。この方法は、組換えポリヌクレオチドを細胞に導入する工程を含み、
ここで、このポリヌクレオチドはhTRTポリペプチドをコードする配列を含む。1
つの実施態様において、hTRTポリペプチドは、図17に示されるような配列を有す
る。1つの実施態様において、配列は、プロモーターに作動可能に連結される。
1つの実施態様において、hTRTは、テロメラーゼ触媒活性を有する。1つの実施
態様において、細胞は、ヒト患者中の細胞のようなヒトである。別の実施態様に
おいて、細胞はインビトロで培養される。関連する実施態様において、細胞はヒ
ト患者中に導入される。
者中の少なくとも1つの細胞に組換えhTRTポリヌクレオチドを導入する工程を含
む。1つの実施態様において、遺伝子治療ベクターが使用される。関連する実施
態様において、この方法はさらに、hTRをコードする配列を含むポリヌクレオチ
ド(例えば、プロモーターに作動可能に連結されたhTRポリヌクレオチド)を細
胞に導入する工程を含む。
の方法は、細胞に有効量のhTRTポリペプチドを導入する工程を包含する。1つの
実施態様において、hTRTポリペプチドは、テロメラーゼ触媒活性を有する。本発
明はさらに、増大した増殖能を有する細胞および細胞の子孫を提供する。
処置するための方法を提供する。この方法は、この細胞にこのテロメラーゼ活性
のインヒビターの治療的有効量を導入する工程を含み、ここで、このインヒビタ
ーは、hTRTポリペプチドまたはhTRTポリヌクレオチドである。1つの実施態様に
おいて、インヒビターは、例えば、図16、17、または20に示される配列の少なく
とも1つの部分配列を含むポリペプチドまたはポリヌクレオチドである。さらな
る実施態様において、ポリペプチドまたはポリヌクレオチドは、テロメラーゼRN
Aへの内在性TRTの結合のような、TRT活性を阻害する。
る。本発明はまた、薬学的に受容可能なキャリアおよび以下から選択される分子
を含む薬理学的組成物を提供する:hTRTポリペプチド、hTRTポリペプチドをコー
ドするポリヌクレオチド、およびhTRT核酸またはその部分配列。
(発明の詳細な説明)
テロメラーゼは、RNA成分および触媒タンパク質成分を含むリボ核タンパク質
複合体(RNP)である。本発明は、本明細書中で以下、「TRT」(テロメラーゼ逆
転写酵素)という、テロメラーゼの触媒タンパク質成分のクローン化および特徴
付けに関する。TRTは、このタンパク質が、テロメラーゼRNA成分(本明細書中以
下、「TR」)を用いて、テロメアDNA反復配列の合成を指示するRNA依存性DNAポ
リメラーゼ(逆転写酵素)として作用するので、このように命名される。さらに
、TRTは、進化的に他の逆転写酵素と関連する(実施例12を参照のこと)。
ラーゼの触媒タンパク質成分のクローン化および特徴付けに関する。前述のよう
に、ヒト(および他の哺乳動物細胞)におけるテロメラーゼ活性は、細胞増殖能
、細胞不死、および新生物表現型の発生に相関するので、ヒトTRTは、並外れて
興味深く、そして価値があるものである。例えば、テロメラーゼ活性、および以
下の実施例2に実証されるように、ヒトTRT遺伝子産物のレベルは、有寿命性細
胞(例えば、ほとんどのヒト体細胞)と比較して不死のヒト細胞(例えば、悪性
腫瘍細胞および不死細胞株)において上昇する。
患状態の診断、予測、および処置のために価値のある方法および組成物を提供す
る。細胞の不死化(インビボおよびエクスビボ)、所望の特徴を有するトランス
ジェニック動物の作製、および多くの他の使用(その多くは以下に記載される)
に有用な方法および試薬もまた提供される。本発明はまた、繊毛虫、真菌類、哺
乳動物のような脊椎動物、および他の生物からTRT遺伝子およびそのタンパク質
を調製、クローン化、または再クローン化するために有用な方法および試薬を提
供する。
s由来のテロメラーゼの精製後に特徴付けられた。RNAアフィニティークロマトグ
ラフィーおよび他の方法を用いて、E.aediculatusテロメラーゼの十分な精製に
より、タンパク質「p123」が得られた。驚くべきことに、p123は、テロメラーゼ
ホロ酵素のタンパク質サブユニットを構成すると以前に考えられていたタンパク
質(すなわち、Tetrahymena thermophilaのp80およびp95タンパク質)と関連し
ない。p123 DNAおよびタンパク質の配列(GenBank受託番号U95964;図13および1
4)の分析により、テロメラーゼの触媒サブユニットとしてのp123の役割と一致
する逆転写酵素(RT)モチーフが明らかになった(図1、4、および11を参照の
こと)。さらに、p123は、S.cerevisiae(酵母)タンパク質Est2pに関連する。E
st2pは、S.cerevisiae(GenBank受託番号S5396)においてテロメアの維持に役割
を果たすことが知られていたが、本発明の以前にはテロメラーゼ触媒サブユニッ
トタンパク質をコードするとは認識されていなかった(例えば、Lendvayら, 199
6, Genetics, 144:1399を参照のこと)。
れるかまたはこれに由来する核酸プローブおよびプライマー(例えば、TRT遺伝
子およびcDNAのクローン化のため)を用いて;モチーフまたはモチーフ配列ある
いは他のTRTエピトープを特異的に認識する抗体(例えば、クローン化TRT遺伝子
の発現またはTRTタンパク質の精製のため)を用いて;コンピューターデータベ
ースをスクリーニングすることにより;あるいは他の手段を用いて、新規のTRT
を同定およびクローン化するための試薬および方法を提供する。例えば、実施例
1に記載のように、S.pombe DNAのPCR(ポリメラーゼ連鎖反応)増幅を、Euplot
esのp123 RTモチーフのB'およびCから設計した縮重配列プライマーを用いて行
った。作製した4つの顕著な産物のうち、1つは、Euplotesのp123およびS.cere
visiaeのEst2pに相同なペプチド配列をコードした。このPCR産物をプローブとし
て用いて、S.pombe cDNAおよびゲノムライブラリーをスクリーニングし、そして
逆転写およびPCR(RT-PCR)によりS.pombe RNAを増幅することにより、S.pombe
TRTホモログの完全な配列を得た。S.pombe遺伝子の完全な配列(「trt1」;GenB
ank受託番号AF015783;図15)により、p123およびEst2pとの相同性が、逆転写酵
素モチーフにおいて特に高いことが明らかになった。S.pombe trt1はまた、tez1
とも呼ばれる。
例1に記載のように、Oxytricha trifallaxおよびTetrahymena thermophilaにお
けるTRT遺伝子配列を得るために用いた。
列を、プログラムBLAST(Altschulら, 1990, J.Mol. Biol. 215: 403)を用いる
ヒトの発現配列タグ(EST)のコンピューター処理化データベースの検索に使用
した。Est2p配列を用いたこのデータベースの検索は、マッチングを示さなかっ
たが、p123およびtrt1配列を用いた検索は、実施例1に記載のように、推定的に
相同タンパク質をコードするヒトEST(GenBank受託番号AA281296;配列番号8を
参照のこと)を同定した。このESTを含むcDNAクローン(本明細書中以下、「ク
ローン712562」、配列番号3を参照のこと)の完全な配列決定により、7つのRT
モチーフが存在することが示された。しかし、このクローンは7つ全てのモチー
フを有する連続するヒトTRTをコードしなかった。なぜなら、モチーフB'、C、
D,およびEは、よりNH2末端のモチーフとは異なるオープンリーディングフレ
ーム(ORF)に含まれたからである。さらに、モチーフAおよびB'の距離は、3
つの以前に特徴付けられたTRTの距離よりも実質的に短かかった。クローン71256
2を、I.M.A.G.E.Consortium; Lennonら, 1996, Genomics 33:151より得た。
pGRN121を、実施例1に記載されるようなヒト293細胞株に由来するcDNAライブラ
リーから単離した。クローン712562とpGRN121との比較により、クローン712562
が182塩基対(図24、配列番号9を参照のこと)の欠失をモチーフAとモチーフ
B'との間に有することが示された。pGRN121に存在する付加的な182塩基対は、
単一のオープンリーディングフレームのTRTモチーフの全てを配置し、そして他
の公知のTRTと一致する距離に、モチーフAとモチーフB'領域との間の間隔を増
加させる。以下の実施例(例えば、実施例7)に記載されるように、配列番号1
は、配列番号2の配列を有する触媒的に活性なテロメラーゼタンパク質をコード
する。配列番号2のポリペプチドは、1132残基を有し、そして約127キロダルト
ン(kD)の計算分子量を有する。
2塩基対の欠失の特徴を有するTRT cDNAは、テロメラーゼ陽性細胞(例えば、精
巣および293細胞)由来のRNAの逆転写後に検出される。この182塩基対の配列を
欠くhTRT RNAは、一般に「Δ182変異体」といわれ、そして1、2、または数種
を表わし得る。pGRN121 cDNAに見出される182塩基対の配列を欠くhTRT変異体は
完全に活性なテロメラーゼ触媒酵素をコードしないようであるが、これらは以下
に議論するように、テロメラーゼ調節に役割を有し得、および/または以下に議
論するように、テロメア結合活性またはhTR結合活性のような部分的テロメラー
ゼ活性を有し得る。
はmRNAの配列を有する単離されたポリヌクレオチド(図16に示すような配列(配
列番号1)を有するポリヌクレオチドを含むがこれに限定されない)を提供する
。関連する局面において、本発明は、hTRTタンパク質、フラグメント、変異体、
または誘導体をコードするポリヌクレオチドを提供する。別の関連する局面にお
いて、本発明は、hTRT遺伝子またはmRNAに結合するセンスおよびアンチセンス核
酸を提供する。本発明はさらに、hTRTタンパク質(合成されたかまたは天然の供
給源から単離されたかによらない)、ならびにhTRTタンパク質またはそのフラグ
メントに特異的に結合する抗体および他の薬剤を提供する。本発明はまた、例え
ば、ヒトの疾患に対する診断アッセイおよび予測アッセイを提供することにより
前述の組成物を用いる方法、テロメラーゼ会合タンパク質の治療薬の開発方法お
よび治療方法、テロメラーゼ会合タンパク質の同定方法、ならびにテロメラーゼ
活性を活性化または阻害し得る薬剤のスクリーニング方法を含む、多くの新規の
方法を提供する。本発明の多くの他の局面および実施態様を以下に提供する。
、そして天然に存在するhTRT遺伝子またはhTRT mRNA中の連続する配列に同一で
あるかまたは正確に相補的である少なくとも10ヌクレオチドの連続する配列を含
むポリヌクレオチドの、hTRT遺伝子配列またはhTRT mRNAのアッセイまたはスク
リーニング、あるいは組換え宿主細胞の調製における使用である。
状態の処置のための医薬品の製造におけるhTRTの発現を増大させる薬剤の使用で
ある。必要に応じて、この医薬品は加齢の効果を阻害するためのものである。
と関連する状態の処置のための医薬品の製造における、テロメラーゼ活性のイン
ヒビターの使用である。
ポリヌクレオチドまたはそのフラグメントはまた、それぞれ薬剤としての使用の
ための本発明のさらなる局面において提供される。
製造における(例えば、加齢またはガンの効果を阻害するための医薬品の製造に
おける)、タンパク質、変異体、またはそのフラグメント、あるいはポリヌクレ
オチドまたはそのフラグメントの使用を含む。
9ヌクレオチドのポリヌクレオチド以外、および/またはインサートを含むプラ
スミドであるクローン712562以外であり、このインサートの配列は図18(配列番
号3)に示される。
のアミノ酸モチーフの特徴、およびこのようなモチーフを有するタンパク質をコ
ードするTRT遺伝子を記載する。第III部〜第VI部は、とりわけ、特にヒトのTRT
関連組成物に焦点をおいて、本発明の核酸、タンパク質、抗体、および精製され
た組成物を記載する。第VII部は、とりわけ、ヒトの疾患の処置に有用な本発明
の方法および組成物を記載する。第VIII部は、不死化ヒト細胞株の作製および同
定を記載する。第IX部は、とりわけ、ヒトの疾患の診断のための、本発明の核酸
、ポリヌクレオチド、および他の組成物の使用を記載する。第X部は、とりわけ
、テロメラーゼ活性または発現を調節(例えば、阻害または促進)する薬剤およ
び処置をスクリーニングおよび同定するのに有用な本発明の方法および組成物を
記載する。第XI部は、とりわけ、トランスジェニック動物(例えば、テロメラー
ゼノックアウト動物および細胞)を記載する。第XII部は、第I部〜第XI部で使
用された用語の用語解説である。第XIII部は、本発明の特定の実施態様に関する
実施例を記載する。論題および副次的な論題による本発明の記載の系統立ては、
明確さを提供し、そしてどのような方法においても限定されない。
本発明は、単離形態または組換え形態の、天然に存在する形態のこのような遺
伝子およびタンパク質を含むがこれらに限定されない、テロメラーゼ触媒サブユ
ニットタンパク質(すなわち、テロメラーゼ逆転写酵素)の配列を有する、単離
されたおよび/または組換え遺伝子およびタンパク質を提供する。代表的には、
TRTは、本明細書中に開示されるように、逆転写酵素(RT)およびテロメラーゼ
特異的(T)アミノ酸モチーフを有する大きな塩基性のタンパク質である。これ
らのモチーフは多様な生物にわたって保存されているので、多くの生物のTRT遺
伝子を、本発明の方法を用いて得ることができるか、または本発明のプライマー
、核酸プローブ、および抗体(例えば、1つ以上のモチーフ配列に特異的なもの
)を用いて同定し得る。
モチーフは、特定の顕著な特徴を有する。例えば、図4に示すように、TRT RTモ
チーフ内に、他のRT間で高度に保存される残基中に多くのアミノ酸置換(矢印で
示す)がある。例えば、モチーフCにおいては、活性部位金属イオンと配位結合
する2つのアスパラギン酸残基(DD)(Kohlstaedtら, 1992, Science 256:178
3; Jacobo-Molinaら, 1993, Proc.Natl.Acad.Sci. U.S.A. 90:6320;Patelら,
1995, Biochemistry 34:5351を参照のこと)が、他のRTにおける(F/Y)xDDhと
比較して、テロメラーゼRTにおいてはhxDD(F/Y)の関係で存在する(ここで、「
h」は、疎水性アミノ酸であり、そして「x」は任意のアミノ酸である;Xiong
ら, 1990, EMBO J. 9:3353;Eickbush, The Evolutionary Biology of Viruses
,(S.Morse編, Raven Press, NY, 121頁, 1994)を参照のこと)。テロメラーゼサ
ブグループの別の規則正しい変化の特徴はモチーフEに存在し、ここで、WxGxSx
はコンセンサス配列であるかまたはテロメラーゼタンパク質間で保存されている
が、hLGxxhは他のRTの特徴である(Xiongら、前出;Eickbush、前出)。このモ
チーフEは、「プライマーグリップ」と呼ばれ、そしてこの領域における変異が
RNAプライミングに影響するがDNAプライミングに影響しないことが報告されてい
る(Powellら, 1997, J.Biol.Chem. 272:13262)。テロメラーゼはDNAプライマ
ー(例えば、染色体3'末端)を必要とするので、テロメラーゼがプライマーグリ
ップ領域で他のRTと異なっているはずであることは意外ではない。さらに、モチ
ーフAとモチーフB'との間の距離は、他のRTの典型的な距離よりもTRTで長い。
これは、右手に似た構造の「フィンガー」領域内の挿入を示し得る(図3:Kohl
staedtら、前出;Jacobo-Molinaら、前出;およびPatelら、前出を参照のこと)
。
である。このモチーフTは、例えば、図4に示すように(W-L-X-Y-X-X-h-h-X-h-
h-X-p-F-F-T-E-X-p-X-X-X-p-X-X-X-Y-X-R-K-X-X-W[Xは任意のアミノ酸であり、
hは疎水性であり、pは極性である])、以下の式を用いて記載され得る配列か
らなる:
Trp-R1-X7-R1-R1-R2-X-Phe-Phe-Tyr-X-Thr-Glu-X8〜9-R3-R3-Arg-R4-X2-Trp、
ここで、Xは任意のアミノ酸であり、そして下付きは連続する残基の数をいい、
R1はロイシンまたはイソロイシンであり、R2はグルタミンまたはアルギニンであ
り、R3はフェニルアラニンまたはチロシンであり、そしてR4はリジンまたはヒス
チジンである。
Trp-R1-X4-h-h-X-h-h-R2-p-Phe-Phe-Tyr-X-Thr-Glu-X-p-X3-p-X2〜3-R3-R3-Ar
g-R4-X2-Trp、
ここで、Xは任意のアミノ酸であり、そして下付きは連続する残基の数をいい、
R1はロイシンまたはイソロイシンであり、R2はグルタミンまたはアルギニンであ
り、R3はフェニルアラニンまたはチロシンであり、R4はリジンまたはヒスチジン
であり、hはAla、Leu、Ile、Val、Pro、Phe、Trp、およびMetから選択される疎
水性アミノ酸であり、そしてpはGly、Ser、Thr、Tyr、Cys、Asn、およびGlnか
ら選択される極性アミノ酸である。
)の1つ以上を含む単離された天然に存在するTRTタンパク質、および組換えTRT
タンパク質を提供する:
モチーフT W-X12-FFY-X-TE-X10〜11-R-X3-W-X7-I
モチーフT' E-X2-V-X
モチーフ1 X3-R-X2-PK-X3
モチーフ2 X-R-X-I-X
モチーフA X4-F-X3-D-X4-YD-X2
モチーフB' Y-X4-G-X2-QG-X3-S-X3
モチーフC X6-DD-X-L-X3 。
示したTRTタンパク質が1つより多くのTRTモチーフを含む場合、その順序(NH2
−> COOH)は図11に示される通りである。
た天然に存在するTRTタンパク質を提供する:
(NH2)-X300〜600-W-X12-FFY-X-TE-X10〜11-R-X3-W-X7-I-X5〜20-E-X2-V-X-X5〜2
0-X3-R-X2-PK-X4〜10-R-X-I-X-X60〜80-X4-F-X3-D-X4-YD-X2-X80〜130-Y-X4-G-X
2-QG-X3-S-X8-X5〜35-X6-DD-X-L-X3-X10〜20-X12-K 。
明細書中に提供される方法および指針(以下で記載される特定の方法論を含む)
が提供されれば、TRT遺伝子およびタンパク質が当業者により得られ得、単離さ
れ得、そして組換え形態で産生され得ることは当業者には明らかである。例えば
、TRTの特徴的なRTおよびTモチーフをコードする遺伝子配列にハイブリダイズ
するプライマー(例えば、縮重増幅プライマー)が提供される。例えば、Tモチ
ーフのFFYXTE領域、他のTRTモチーフ(以下に議論するように)、またはモチー
フまたはコンセンサス配列の組み合わせをコードする配列にハイブリダイズする
1つ以上のプライマーまたは縮重プライマーが、標的生物のコドンの使用法に基
づいて調製され得、そして標的生物から調製したゲノムDNAまたはcDNAからTRT遺
伝子配列を増幅するために使用され得る。縮重プライマーの使用は、当該分野に
おいて周知であり、そして標的生物のコドン優先度および使用法を考慮し、そし
てPCRのアニーリング工程における塩基のミスマッチを可能にするのに適切な増
幅(例えば、PCR)条件を用いることにより、標的モチーフのアミノ酸を潜在的
にコードし得る核酸配列のセットにハイブリダイズするプライマーのセットの使
用を伴う。代表的には、2つのプライマーセットを用いる;しかし、1つのプラ
イマー(またはこの場合、1つの縮重プライマーセット)増幅系が周知であり、
そしてTRT遺伝子を得るために使用され得る。
)のものから増幅するために使用され得る本発明の例示的なプライマーを提供す
る。「N」は、4つ全てのヌクレオチドの等モル混合物であり、そして括弧内の
ヌクレオチドは示したヌクレオチドの等モル混合物である。
ブラリー(例えば、cDNAライブラリー)に対するコロニーハイブリダイゼーショ
ンのためのハイブリダイゼーションプローブとして使用され、それによりTRTタ
ンパク質コード配列全体またはその実質的な部分を有する核酸が同定および単離
またはクローン化される。まさに記載したもののような試薬および方法を、本明
細書中に記載される方法に従って用いて、以下に詳細に記載されるように、Oxyt
richa trifallaxおよびTetrahymena thermophilaのTRT遺伝子配列を得た。以前
に特徴付けられなかったTRT遺伝子のクローン化の後に、配列が通常の方法によ
り決定され得、そしてコードされるポリペプチドが合成され、そしてTRT活性(
例えば、テロメラーゼ触媒活性)について(本明細書中に記載されるように、お
よび/または当該分野で公知のテロメラーゼアッセイにより)アッセイされ得る
ことが認識される。
れ得ることもまた、当業者には明らかである。なぜなら、TRTモチーフ配列およ
びこのような配列を含む本発明の核酸は、このような広範な種々の方法において
使用され得るからである。例えば、実施例1に記載のように、公知のTRTの配列
に基づくプローブを用いる、標的生物由来のDNAライブラリーまたは他の核酸ラ
イブラリーへのハイブリダイゼーションが使用され得る。縮重PCRプライマーま
たは前述のもののようなこれらの増幅産物がそれ自体標識され得、そしてハイブ
リダイゼーションプローブとして使用され得ることが評価される。別の実施態様
において、発現クローン化方法が用いられる。例えば、TRTモチーフまたは他のT
RTエピトープ(例えば、FFYXTEモチーフ)にまたがるペプチドに特異的に結合す
る1つ以上の抗体が、TRTタンパク質を含むリボゾーム複合体およびそれをコー
ドするmRNAを単離するために用いられ得る。本発明のこのような抗体を作製する
ために、ペプチド免疫原は、代表的には6アミノ酸と30アミノ酸との間の長さ、
より多くの場合約10〜20アミノ酸の長さである。抗体はまた、TRT配列をコード
するクローンを同定するために、目的の生物に由来するcDNA発現ライブラリーを
プローブするのに使用され得る。別の実施態様において、公知のTRTで保存され
る配列を含むDNAについてのDNAデータベースのコンピューター検索もまた、TRT
配列を含むクローンを同定するために用いられ得る。
列を有する単離されたまたは組換えのポリペプチドを含む組成物を提供する。通
常、天然に存在するTRTは、約80,000ダルトン(D)と約150,000Dとの間、最も
多くの場合約95,000Dと約130,000Dとの間の分子量を有する。代表的には、天
然に存在するTRTは、pH7で正味の正電荷(代表的には9より大きな計算されたp
I)を有する。1つの実施態様において、ポリペプチドは、本明細書中に定義さ
れるようなテロメラーゼ活性を示す。関連する実施態様において、ポリペプチド
はTRT特異的領域(Tモチーフ)配列を有し、そしてテロメラーゼ活性を示す。
本発明はさらに、このようなポリペプチドのフラグメントを提供する。本発明は
また、TRTタンパク質をコードする天然に存在する遺伝子の配列を有する単離さ
れたまたは組換えのポリヌクレオチドを提供する。本発明は、非脊椎動物(例え
ば、酵母)、および哺乳動物のような脊椎動物(例えば、マウスまたはヒト)か
らTRTの配列を単離するために有用な試薬を提供する。単離されたポリヌクレオ
チドは、他の天然に存在するあるいは組換えまたは合成のベクター核酸配列に関
連し得る。代表的には、単離された核酸は、約300kbより小さく、しばしば約50k
b未満であり、より多くの場合約20kb未満であり、頻繁には約10kb未満であり、
そして時々約5kbまたは2kb未満の長さである。いくつかの実施態様において、
単離されたTRTポリヌクレオチドは、約1kb未満または0.1kb未満の遺伝子フラグ
メント、プライマー、またはプローブのように、さらに小さい。
A)概要
本発明は、Euplotes、Tetrahymena、S.pombe、またはヒトに由来する組換えTR
T遺伝子のような、テロメラーゼ触媒サブユニットタンパク質(TRT)をコードす
るポリヌクレオチドの配列を有する単離されたそして組換えの核酸を提供する。
例示的なポリヌクレオチドは、図13(Euplotes);図15(S.pombe);および図1
6(ヒト、GenBank受託番号AF015950)において提供される。本発明は、プローブ
、プライマー、TRTタンパク質コードポリヌクレオチドなどを含む、TRT遺伝子配
列を有するセンスおよびアンチセンスのポリヌクレオチドを提供する。
本発明は、ヒト由来のテロメラーゼ触媒サブユニット(すなわち、hTRT)の配
列を有する核酸を提供する。
列を有するポリヌクレオチドを提供する。1つの実施態様において、本発明のポ
リヌクレオチドは、図16に示す配列番号1の配列またはその部分配列を有する。
別の実施態様において、ポリヌクレオチドは、配列番号3(図18)、配列番号4
(図20)の配列、またはそれらの部分配列を有する。本発明はまた、本明細書中
に開示されるhTRT核酸の配列に実質的な配列同一性を有するポリヌクレオチドを
提供する。本明細書中に開示されるhTRT核酸の配列は、例えば、配列番号1[図1
6]、配列番号4[図20]、配列番号6[図21]、および配列番号7を包含するがこれ
らに限定されない。従って、本発明は、ヒトTRT遺伝子の天然に存在する対立遺
伝子および本明細書中に開示されるhTRT核酸配列に関して1つ以上のヌクレオチ
ドの欠失、挿入、または置換を有する変異ポリヌクレオチド配列を提供する。以
下に記載されるように、変異核酸は、以下に記載される組換え法または合成法を
用いて、あるいは他の手段により作製され得る。
および組換えのポリヌクレオチドを提供する。このようなポリヌクレオチドは、
hTRT mRNAの非翻訳領域のゲノム配列に由来するポリヌクレオチドを含む。代表
的なゲノム配列を図21(配列番号6)に示す。実施例4に記載するように、配列
番号6を、ヒトゲノムライブラリーから単離されたクローンλGФ5を配列決定す
ることにより得た。λGФ5は、hTRTコード配列の5'側におよそ13,000塩基を含む
15キロ塩基対(kbp)のインサートを含む。このクローンは、hTRTプロモーター
配列および他のhTRT遺伝子調節配列(例えば、エンハンサー)を含む。
されたおよび組換えポリヌクレオチドを提供する。代表的なイントロン配列を、
図21(配列番号7;実施例3を参照のこと)に示す。いくつかの実施態様におい
て、hTRTイントロンは、真核生物細胞におけるhTRTタンパク質の改良された発現
のための「ミニ遺伝子」に含まれる。
RTポリペプチド、および変異hTRTポリペプチドを含む、hTRTタンパク質またはタ
ンパク質のフラグメントをコードするポリヌクレオチドを提供する。1つの実施
態様において、コードされるhTRTタンパク質またはフラグメントは、図17(配列
番号2)に示されるようなアミノ酸配列を有するか、または配列番号2の保存的
置換を伴うアミノ酸配列を有する。1つの実施態様において、コードされるhTRT
タンパク質またはフラグメントは、タンパク質の活性(例えば、テロメラーゼ触
媒活性)を変化させる置換を有する。
存在するhTRT遺伝子の配列を有する必要はないが、多数のポリヌクレオチドが配
列番号2のアミノ酸配列を有するhTRTポリペプチドをコードし得ることが理解さ
れる。本発明は、公知のトリプレット遺伝コードに従ってなされる可能なコドン
選択に基づいて組み合わせを選択することにより作製され得るヌクレオチド配列
のそれぞれのそして全ての可能な変異を提供し、そしてすべてのこのような変異
が本明細書により特に開示される。従って、いくつかの場合には天然に存在する
配列のヌクレオチド配列にハイブリダイズし得る(適切に選択されたストリンジ
ェンシーの条件下で)hTRTポリペプチドコードヌクレオチド配列が好ましいが、
他の場合には実質的に異なるコドンの使用法を用い、それゆえおそらく天然に存
在する配列を有する核酸にハイブリダイズしないhTRTをコードするヌクレオチド
配列を作製することが有利であり得る。
配列(例えば、配列番号1および6)を含む、hTRTオリゴヌクレオチドおよびポ
リヌクレオチドを提供する。本発明の核酸は、代表的に、例示的なhTRTポリヌク
レオチドの少なくとも約10、より多くの場合少なくとも約12、または約15の連続
する塩基を含有する。しばしば、本発明の核酸は、例えば、ポリペプチドまたは
完全長hTRTタンパク質の発現が意図される場合、より長い配列(例えば、少なく
とも約25、約50、約100、約200、または少なくとも約500〜3000塩基の長さ)を
含む。
天然に存在するかまたは天然に存在しないhTRTポリヌクレオチドに配列相同性ま
たは相補性を有する「Δ182hTRT」ポリヌクレオチドを提供する。これらは、pGR
N121に見出される182ヌクレオチドの配列(配列番号9[図24])を含まない(そ
してまたクローン712562にも存在しない)。これらのポリヌクレオチドは、部分
的に興味深い。なぜなら、これらは、pGRN121によりコードされるような「完全
長」hTRTポリペプチド(配列番号2)に見出されるのとは異なる組み合わせまた
は配置のTRTモチーフを含むポリペプチドをコードするからである。以下に議論
するように、これらのポリペプチドが天然で(例えば、細胞内のテロメラーゼ発
現の調節において)生物学的役割を果たし得、および/または治療剤として(例
えば、野生型タンパク質の機能を阻害するドミナントネガティブ(dominannt-ne
gative)産物として)の用途が見出され得ること、あるいは例えば、本明細書中
に記載されたような他の役割および用途を有し得ることが意図される。
562は、およそ30kDの計算された分子量を有する259残基のタンパク質(本明細書
では以後「712562 hTRT」)をコードする。712562 hTRTポリペプチド(配列番号
10[図19])は、モチーフT,1、2、およびAを含むが、モチーフB'、C、D
、およびEを含まない(図4を参照のこと)。同様に、治療活性および他の活性
を有する変異hTRTポリペプチドは、pGRN121 cDNAと類似の核酸から発現され得る
が、例えば、図20(配列番号4)に示される配列を有するクローン712562におい
て失われている182塩基対を欠く。この核酸(本明細書では以後「pro90 hTRT」
)は(これは、本明細書中に記載のような通常の合成または組換え法を用いて合
成され得る)、配列番号1によりコードされるhTRTタンパク質と同じアミノ末端
配列を共有するが、カルボキシ末端領域で異なる807残基(およそ90kDの計算分
子量)のタンパク質をコードする(最初の763残基は共通であり、pro90 hTRTの
最後の44残基が「完全長」hTRTとは異なる)。pro90 hTRTポリペプチドは、モチ
ーフT、1、2、およびAを含むが、モチーフB、C、D、Eを含まず、従って
、いくつかのテロメラーゼ活性は有し得るが、全てのテロメラーゼ活性は有さな
いようである。
本発明のポリヌクレオチドは、hTRTをコードするポリペプチドまたはそのフラ
グメントの発現、天然に存在するhTRT遺伝子またはRNAのハイブリダイゼーショ
ンおよび/または増幅のためのセンスまたはアンチセンスのプローブまたはプラ
イマーとしての使用(例えば、診断適用または予測適用)、および治療剤(例え
ば、アンチセンス、3重鎖、またはリボザイムの組成物)としての使用を含むが
これらに限定されない多くの用途を有する。本開示を精査すれば明らかであるよ
うに、これらの用途は、加齢、ガン、および受精能力、ならびに成長、生殖、お
よび細胞に基づく産物の製造に関連するヒトの疾患の診断および処置に巨大な影
響を有する。以下の節で記載するように、本発明のhTRT核酸は、当該分野で周知
の技術を用いて作製(例えば、クローン化、合成、または増幅)され得る。
1つの実施態様において、hTRT遺伝子またはcDNAは、hTRT mRNA、cDNA、また
はゲノムDNAに特異的にハイブリダイズする核酸プローブを用いてクローン化さ
れる。この目的に適切な1つのプローブは、図16(配列番号1)に提供される配
列の全てまたは一部を有するポリヌクレオチド(例えば、その部分配列を含むプ
ローブ)である。代表的には、標的hTRTゲノムDNAまたはcDNAは、ベクター(例
えば、プラスミド、ファージ、ウイルス、酵母人工染色体など)に連結され、そ
してゲノムまたはcDNAライブラリー(例えば、ヒトの胎盤cDNAライブラリー)か
ら単離され得る。一旦、hTRT核酸が同定されれば、これは、当業者に公知の標準
的な方法に従って単離され得る。hTRT遺伝子についてのヒトcDNAライブラリーの
スクリーニングの例示的な例を実施例1に提供する;同様に、ヒトゲノムライブ
ラリーのスクリーニングの例は、実施例3および4に見出される。クローン化方
法は周知であり、そして例えば、以下に記載される:Ausubelら, Current Proto
cols in Molecular Biology, Greene Publishing and Wiley-Interscience, New
York (1997);BergerおよびKimmel (1987) Methods in Enzymology, 第152巻:
Guide to Molecular Cloning Techniques, San Diego: Academic Press,Inc.;S
ambrookら (1989) Molecular Cloning:A Laboratory Manual, 第2版、第1〜
3巻, Cold Spring Harbor Laboratory(本明細書では以後「Sambrook」);Cas
hionら、米国特許第5,017,478号;およびCarr、欧州特許第0,246,864号。
れたhTRTのゲノムまたはcDNAの核酸を提供する。1つの実施態様において、hTRT
タンパク質コード配列は、プライマー5'-GTGAAGGCACTGTTCAGCG-3'(「TCP1.1」
)および5'-CGCGTGGGTGAGGTGAGGTG-3'(「TCP1.15」)を用いて、RNAまたはcDNA
試料(例えば、2本鎖胎盤cDNA(Clontech, Palo Alto CA))から増幅される。い
くつかの実施態様において、特異性を増加させるために、例えば、「ネスティッ
ドPCR」用に、第3のプライマーまたは第2のプライマー対が用いられ得る。第
2のプライマー対の1例は、5'-CTGTGCTGGGCCTGGACGATA-3'(「bill TCP6」)お
よび5'-AGCTTGTTCTCCATGTCGCCGTAG-3'(「TCP1.14」)である。hTRT核酸の増幅
のために有用な多くの他のプライマーおよびプライマーの組み合わせが本発明に
より提供されることは当業者には明らかである。
えば、コード領域、プロモーター領域、および/またはイントロン)または部分
配列を増幅するプライマーを提供する。例えば、配列番号1の274/275の位置のh
TRTイントロン(実施例3を参照のこと)は、プライマーTCP1.57およびTCP1.52
(プライマー対1)またはプライマーTCP1.49およびTCP1.50(プライマー対2)
を用いて(例えば、ゲノムクローンの検出のために)増幅され得る。(プライマ
ー名は、以下の表2に列挙するプライマーをいう。)プライマー対は、個別にま
たはネスティッドPCRにおいて(ここで、プライマーセット1が最初に使用され
る)使用され得る。別の例示的な例は、(例えば、cDNAクローンの大きさまたは
完全性を評価するために)特異的に増幅し、それゆえhTRT mRNAの5'末端またはh
TRT遺伝子の5'末端をコードするエキソンを検出するプライマーに関する。以下
のプライマー対は、hTRTの5'末端を増幅するために有用である:プライマーK320
およびK321(プライマー対3);プライマーK320およびTCP1.61(プライマー対
4);プライマーK320およびK322(プライマー対5)。このプライマーセットは
、セット5の次にセット4またはセット3、あるいはセット4またはセット5の
次にセット3の順番で、ネスティッドPCRにおいて使用され得る。さらに別の例
示的な例は、mRNAのほぼ真ん中の3分の1(the middle third)を含む保存され
たhTRT TRTモチーフ領域を増幅または特異的に検出するために選択されたプライ
マーを含む(例えば、(例えば、非ヒト生物由来の)TRTクローンを同定するた
めのハイブリダイゼーションプローブとして使用するために)。以下のプライマ
ー対は、hTRT核酸のTRTモチーフ領域を増幅するために有用である:プライマーK
304およびTCP1.8(プライマー対6)、またはプライマーLT1およびTCP1.15(プ
ライマー対7)。このプライマーセットは、ネスティッドPCR実験においてセッ
ト6の次にセット7の順番で使用され得る。
(Perkin Elmer, Norwalk CT)、100μMの各dNTP(dATP、dCTP、dGTP、dTTP)、
1×PCR緩衝液(50mM KCl、10mM Tris、室温にてpH8.3、1.5mM MgCl2、0.01%ゼ
ラチン)および0.5μMプライマーを含み、94°にて45秒間、55°にて45秒間、お
よび72°にて90秒間を約30サイクルの増幅操作を伴う(しかし、これらに限定さ
れない)。他の熱安定性DNAポリメラーゼ、反応条件、およびサイクリングパラ
メーターもまた、適切な増幅を提供することが当業者には理解される。hTRT核酸
を得るために使用され得る他の適切なインビトロ増幅方法は、本明細書中以下に
記載のものを含むがこれらに限定されない。一旦増幅されれば、hTRT核酸は、所
望であれば、通常の分子生物学的方法を用いて任意の種々のベクター中にクロー
ン化され得るか、または検出され得るか、さもなければ本発明の方法に従って利
用され得る。
学合成、またはE.coliのような細菌系(例えば、Ausubelら、前出を参照のこと
)、哺乳動物のような真核生物発現系に形質転換することによる複製のような他
の方法を用いて調製または増加され得ることを認識する。同様に、hTRT RNAが、
本発明のインビトロ方法に従って、または例えば、T7、T3、またはSP6のようなR
NAポリメラーゼにより認識されるプロモーターを含む市販のベクターを用いるE.
coliのような細菌系において、またはRNAポリメラーゼプロモーターを含むプラ
イマーを用いるPCR増幅により生成したDNAの転写により発現され得る。
ン化または増幅されたhTRT核酸が、当該分野で周知の方法(例えば、部位特異的
変異誘発、リンカースキャニング変異誘発)により改変(例えば、短縮化、誘導
体化、変化)され得るか、または下記のように新たに簡単に合成され得ることは
、当業者により認識される。変化または改変したhTRT核酸は、hTRT遺伝子または
遺伝子産物のクローン化または操作を容易にすること、あるいは変異hTRT遺伝子
産物を発現することを含むがこれらに限定されない種々の適用に有用である。例
えば、1つの実施態様において、hTRT遺伝子配列は、以下に詳細に議論するよう
に、例えば、hTRTの保存されたモチーフにおける変異により、変化した特性また
は活性を有するhTRTポリペプチドをコードするように変化される。別の例示的な
例において、hTRT核酸のタンパク質コード領域における変異は、グリコシル化の
パターンを変化させる、コドン優先度を変化させる、スプライス変異体を産生す
る、プロテアーゼ感受性部位を除去する、抗原性ドメインを生じる、比活性を変
化させるなどのために導入され得る。他の実施態様において、hTRTおよびその誘
導体をコードするヌクレオチド配列は、コードされるアミノ酸配列を変化させず
に変化される。例えば、より望ましい特性(例えば、天然に存在する配列から産
生される転写物と比較して増加した転写効率あるいはより大きなまたはより短い
半減期)を有するRNA転写物が産生される。さらに別の実施態様において、変化
したコドンは、特定の原核生物または真核生物の発現宿主において生じるペプチ
ドの発現速度を増加させるために、特定のコドンが宿主により利用される頻度に
従って選択される。本発明の変異hTRTポリヌクレオチドを調製するために使用さ
れ得る有用なインビトロおよびインビボ組換え技術は、SambrookらおよびAusube
lら(両方とも前出)に見出される。
ロン配列を有する核酸を提供する。この核酸は、とりわけ、興味深い。なぜなら
、これらはhTRT調節に関与し、ならびにhTRTおよび他の組換えタンパク質または
RNA遺伝子産物の発現に有用であるプロモーターおよび他の調節エレメントを含
むからである。配列番号6および7に提供される核酸配列に加えて、さらなるhT
RTイントロンおよび隣接配列が、通常の分子生物学的技術を用いて容易に得られ
得ることが明らかである。例えば、さらなるhTRTゲノム配列は、上記および実施
例4に記載のλクローンGΦ5(ATCC受託番号209024)から得られ得る。さらに他
のhTRTゲノムクローンおよび配列は、配列番号1由来の配列または部分配列を有
するhTRT核酸プローブを用いてヒトゲノムライブラリーをスクリーニングするこ
とにより得られ得る。さらなるクローンおよび配列(例えば、さらにより上流)
が、λGΦ5に由来する標識された配列またはサブクローンを用いて適切なライブ
ラリーをプローブすることにより得られ得る。hTRT隣接配列をさらに特徴付ける
ための他の有用な方法は、Gobindaら, 1993, PCR Meth.Applic. 2:318;Trigli
aら, 1988, Nucleic Acids Res. 16:8186;Lagerstromら, 1991, PCR Methods
Applic. 1:111;およびParkerら, 1991, Nucleic Acids Res. 19:3055により
記載される一般的な方法を含む。
、実施例3を参照のこと)、S1分析(Ausubelら、前出、第4章を参照のこと)
、または当該分野で公知の種々の他の手段のような通常の手段により同定され得
る。イントロン配列はまた、細胞RNAの逆転写後に増幅またはクローン化され得
る、プレmRNA(すなわち、スプライシングされていないかまたは不完全にスプラ
イシングされたmRNA前駆体)中に見出され得る。
T核酸の配列は、当該分野で周知のDNA配列決定方法(例えば、Ausubelら、前出
を参照のこと)を用いて決定または確認され得る。配列決定の有用な方法は、DN
AポリメラーゼIのKlenowフラグメント、Sequenase(US Biochemical Corp, Cle
veland OH)、Taq DNAポリメラーゼ(Perkin Elmer, Norwalk CT)、熱安定性T7
ポリメラーゼ(Amersham, Chicago IL)、またはGibco BRL(Gaithersburg MD)
により販売されるELONGASE増幅システムのような組換えポリメラーゼと校正エキ
ソヌクレアーゼとの組み合わせのような酵素を用いる。オリゴヌクレオチド(例
えば、化学合成により新たに作製されたオリゴヌクレオチド)の配列を配列決定
または確認する場合、MaxamおよびGilbertの方法が好ましいかもしれない(Maxa
mおよびGilbert, 1980, Meth.Enz. 65:499;Ausubelら、前出、第7章)。
れたcDNAのクローン化および配列決定のような標準的な方法を用いて、「完全長
」hTRTまたは他のcDNAをクローン化することにより、直接決定され得る。より大
きなcDNAを含むようにサイズにより選択された完全長cDNAをスクリーニングまた
は増幅するために好ましいオリゴ(dT)プライムライブラリーが、好ましいかも
しれない。ランダムプライムライブラリーもまた適切であり、そしてしばしば遺
伝子の5'領域を含むより大きな部分のクローンを含む。Frohmanら, 1988, Proc.
Nat.Acad.Sci USA 85:8998に記載されるRACEプロトコルのような、5'RNA配列を
得るための他の周知の方法もまた使用され得る。所望である場合、hTRTまたは他
のTRTのmRNAの転写開始部位が、本明細書中に提供される核酸(例えば、配列番
号1の配列を有する)を用いて、通常の方法により決定され得る。1つの方法は
、配列番号1の5'領域に由来する配列を有する標識されたDNAを用いるS1ヌクレ
アーゼ分析(Ausubelら、前出)である。
本発明はまた、直接化学合成により生成されるhTRTポリヌクレオチド(RNA、D
NA、または修飾された)を提供する。化学合成は、一般的に、オリゴヌクレオチ
ドの生成に、または非標準的ヌクレオチドを含むオリゴヌクレオチドおよびポリ
ヌクレオチド(例えば、プローブ、プライマー、およびアンチセンスオリゴヌク
レオチド)に好ましい。核酸の直接化学合成は、当該分野で公知の方法により達
成され得、例えば、Narangら、1979, Meth. Enzymol. 68:90のホスホトリエステ
ル法;Brownら、Meth. Enzymol. 68:109 (1979)のホスホジエステル法;Beaucag
eら、Tetra. Lett., 22:1859 (1981)のジエチルホスホルアミダイト法;および
米国特許第4,458,066号の固体支持体法がある。化学合成は、代表的には、一本
鎖オリゴヌクレオチドを生成し、これは相補配列とのハイブリダイゼーションに
よって、またはテンプレートとして一本鎖を用いるDNAポリメラーゼおよびオリ
ゴヌクレオチドプライマーでの重合化によって、二本鎖DNAに変換され得る。DNA
の化学合成は、しばしば、約100または150塩基の配列に限定されるが、より長い
配列は、より短い配列の連結によって、またはより精巧な合成方法によって得ら
れ得ることが、当業者には認識される。
レオチドが、所望の特性(例えば、増加したヌクレアーゼ耐性、より堅い結合、
安定性、または所望のTM)を与えるために、非標準塩基(例えば、アデニン、
シチジン、グアニン、チミン、およびウリジン以外)または非標準骨格構造を用
いて作製され得ることが認識される。オリゴヌクレオチドをヌクレアーゼ耐性に
するための技法には、PCT公開公報WO 94/12633に記載される技法が挙げられる。
広範な種々の有用な修飾されたオリゴヌクレオチドが生成され得、ペプチド-核
酸(PNA)骨格(Nielsenら、1991, Science 254:1497)を有するオリゴヌクレオ
チド、または2'-O-メチルリボヌクレオチド、ホスホロチオエートヌクレオチド
、メチルホスホネートヌクレオチド、ホスホトリエステルヌクレオチド、ホスホ
ロチオエートヌクレオチド、ホスホルアミデートを組み込んだオリゴヌクレオチ
ドが挙げられる。さらに他の有用なオリゴヌクレオチドは、2'位に以下の1つを
含むアルキルおよびハロゲンで置換された糖部分を含み得る:OH、SH、SCH3、F
、OCN、OCH3OCH3、OCH3O(CH2)nCH3、O(CH2)nNH2、またはO(CH2)nCH3、ここで、n
は1〜約10である;C1〜C10低級アルキル、置換低級アルキル、アルカリル、ま
たはアラルキル;Cl;Br;CN;CF3;OCF3;0-、S-、またはN-アルキル;O-、S-
、またはN-アルケニル;SOCH3;SO2CH3;ONO2;NO2;N3;NH2;ヘテロシクロア
ルキル;ヘテロシクロアルカリル;アミノアルキルアミノ;ポリアルキルアミノ
;置換シリル;RNA切断基;コレステリル基;葉酸基;レポーター基;インター
カレーター;オリゴヌクレオチドの薬物動態学特性を改良するための基;あるい
はオリゴヌクレオチドおよび同様の特性を有する他の置換基の薬力学特性を改良
するための基。葉酸、コレステロール、またはオリゴヌクレオチドの取り込みを
促進する他の基(例えば、脂質アナログ)は、任意のヌクレオシドの2'位で、あ
るいは3'末端または5'末端のヌクレオシドのそれぞれ3'または5'位で、直接また
はリンカーを介して結合され得る。1つ以上のこのような結合体が使用され得る
。オリゴヌクレオチドはまた、ペントフラノシル基の代わりにシクロブチルのよ
うな糖模倣物を有し得る。他の実施態様は、少なくとも1つの修飾された塩基形
態またはイノシンのような「普遍塩基」、あるいは、キューオシン(queosin)
およびワイブトシン(wybutosine)のような他の非標準塩基ならびに内因性エン
ドヌクレアーゼにより容易に認識されないアデニン、シチジン、グアニン、チミ
ジン、およびウリジンのアセチル、メチル、チオ、および同様に修飾された形態
の含有物を含み得る。本発明はさらに、例えば、ホスホジエステル、ホスホロチ
オエート、ホスホロジチオエート、メチルホスホネート、ホスホルアミデート、
アルキルホスホトリエステル、スルファメート、3'-チオアセタール、メチレン
(メチリミノ)、3'-N-カルバメート、モルホリノカルバメート、キラルメチル
ホスホネートのような骨格アナログを有するオリゴヌクレオチド、短鎖アルキル
またはシクロアルキル糖間結合、短鎖ヘテロ原子またはヘテロ環糖間(「骨格」
)結合、またはCH2-NH-O-CH2、CH2-N(CH3)-OCH2、CH2-O-N(CH3)-CH2、CH2-N(CH3
)-N(CH3)-CH2、およびO-N(CH3)-CH2-CH2骨格を有するヌクレオチド(ここで、ホ
スホジエステルはO-P-O-CH2である)、またはこれらの混合物を提供する。モル
ホリノ骨格構造を有するオリゴヌクレオチドもまた有用である(米国特許第5,03
4,506号)。
proach, F. Eckstein編, IRL Press at Oxford University Press (1991);Anti
sense Strategies, Annals of the New York Academy of Sciences, 600巻, Bas
ergaおよびDenhardt編 (NYAS 1992);Milliganら、1993年7月9日, J. Med. Chem
. 36(14):1923-1937;Antisense Research and Applications (1993, CRC Press
)その全体および特にSanghviによる「核酸のヘテロ環塩基修飾およびアンチセン
スオリゴヌクレオチドにおけるその適用」という表題の15章、Antisense Therap
eutics, Sudhir Agrawal編 (Humana Press, Totowa, New Jersey, 1996)が挙げ
られる。
例えば、hTRTまたは他のオリゴヌクレオチドまたはポリヌクレオチドが核酸プ
ローブとして用いられるべき場合、本発明の核酸を標識することはしばしば有用
である。標識(以下を参照のこと)は、当業者に周知の多くの手段により組み込
まれ得る。1つの実施態様では、増幅されていない核酸(例えば、mRNA、ポリA
mRNA、cDNA)が標識される。標識された核酸を生成する手段は、当業者に周知で
あり、そして、例えば、ニックトランスレーション、ランダムプライマー標識、
末端標識(例えば、キナーゼを用いて)、および化学結合(例えば、光ビオチン
化)または合成が挙げられる。他の実施態様では、標識は、試料核酸の調製にお
ける増幅工程中に同時に組み込まれる。したがって、例えば、標識されたプライ
マーまたは標識されたヌクレオチドを用いるポリメラーゼ連鎖反応(PCR)また
は他の核酸増幅方法は、標識された増幅産物を提供する。他の実施態様では、標
識されたヌクレオチド(例えば、フルオレセイン標識UTPおよび/またはCTP)を
用いる転写増幅が、転写された核酸中に標識を組み込む。増幅産物はまた、また
はあるいは、増幅が完了した後に標識され得る。
上記および以下に詳細に論じるように、オリゴヌクレオチドは、プライマー、
プローブ、治療剤、または他のアンチセンスオリゴヌクレオチド、三重鎖オリゴ
ヌクレオチドとしての用途を含む種々の用途、ならびに本開示から明らかな多く
の他の用途について、使用される。表2〜6は、本発明の実施に使用され得るあ
る例示の特定のオリゴヌクレオチドを提供する。本発明の多くの他の有用なオリ
ゴヌクレオチドは、当業者によって本明細書中に提供される指針に従って合成さ
れ得る。
たは有用であることを意味し;「PCR」は、そのプライマーがPCRに用いられたか
または有用であることを意味し;「AS」は、そのプライマーがテロメラーゼ活性
のアンチセンス阻害に用いられたかまたは有用であることを意味し;「CL」は、
そのプライマーがhTRT遺伝子またはRNAのクローニング領域に用いられたかまた
は有用であることを意味し;「mut」は、そのプライマーがhTRT遺伝子または遺
伝子産物の変異体を構築するために用いられたかまたは有用であることを意味す
る。「UC」は「大文字」を意味し、そして「lc」は「小文字」を意味する。ミス
マッチおよび挿入(配列番号1に対して)を下線により示し;欠失を「-」によ
り示す。表2〜6においては、任意の1つの用途またはセットの用途への任意の
特定のオリゴヌクレオチドの使用を制限することは意図されないことが理解され
る。
A)一般
本発明は、特に、テロメラーゼ活性の産生、細胞内でのテロメラーゼ活性の阻
害、抗TRT免疫応答の誘導に有用な種々の広範囲のhTRTタンパク質を、治療剤と
して、または臨床アッセイでの標準あるいはコントロールとして、hTRTまたはテ
ロメラーゼの活性を活性化または阻害し得る化合物のスクリーニングでの標的と
して提供し、そして、当業者に明白であるか、またはそうでなければ本明細書中
に記載されている多数のその他の使用を提供する。本発明のhTRTは、以下に例示
を目的として詳細に記載されているように、(例えば、テロメラーゼ陰性細胞で
のテロメラーゼ活性を確認するために有用な)機能的に活性なタンパク質および
(例えば、細胞でのテロメラーゼ活性を阻害するために有用な)変異体、不活性
変異体、hTRTポリペプチド、ならびに、天然に存在するhTRTおよびテロメラーゼ
の1種、数種、または全ての機能活性を示すテロメラーゼRNP(例えば、タンパ
ク質を含有するリボ核タンパク質複合体)を包含する。
れる配列、あるいはそのフラグメントを有するポリペプチドである。別の実施態
様では、hTRTポリペプチドは、アミノ酸残基の内部の欠損、挿入、または保存的
置換によって、配列番号2とは異なる。関連の実施態様では、本発明は、配列番
号2と実質的な類似性を有するhTRTポリペプチドを提供する。本発明はさらに、
配列番号2のアミノ酸配列に関して、例えば、切形、変異、誘導体化、または他
の配列との融合(例えば、融合タンパク質を形成する)の様式で、改変されたhT
RTポリペプチドを提供する。さらに、本発明は、テンプレートRNA(例えば、hTR
)と複合体化された本発明のhTRTタンパク質を含有するテロメラーゼRNPを提供
する。他の実施態様では、1種以上のテロメラーゼ会合タンパク質は、hTRTタン
パク質および/またはhTRと会合する。
らと実質的な類似性を有するタンパク質、およびそのフラグメント、変異体また
は誘導体のような他の天然に存在するhTRT種または天然に存在しない変異体を提
供する。
例は、クローン712562(配列番号3(図18))または配列番号4(図20)に示される
pro90変異体hTRTによりコードされるmRNAのリボソームフレームシフトより得ら
れ得、従って、全TRTモチーフを有するhTRTポリプチドを合成し得る(一般的な
例は、例えば、Tsuchihashiら、1990, Proc. Natl. Acad. Sci. USA 87:2516;C
raigengenら、1987, Cell 50:1 Weiss, 1990, Cell 62:117を参照のこと)。リ
ボソームフレームシフトは、特定のmRNA配列または二次構造が、リボソームを停
止させ、そして配列中で1ヌクレオチドを前方または後方に飛ばすときに、生じ
得る。従って、712562 mRNAでのリボソームフレームシフト事象は、約523アミノ
酸残基ポリペプチドの合成をなし得る。pro90配列でのリボソームフレームシフ
ト事象は、約1071残基を有するタンパク質をもたらし得る。リボソームフレーム
シフトから得られるタンパク質はまた、本発明によって提供される合成または組
換え法によって発現され得ることが理解される。
より詳細に議論されているような、精製、化学合成、または組換え産生によって
得られ得る。
本発明のTRTポリペプチド(フラグメント、変異体、オルタナティブ(alternat
ive)対立遺伝子産物、および融合タンパク質を含む)は、天然hTRTに関連する1
つ以上または全ての機能活性を有し得る。本明細書に使用されているように、記
載以外にhTRTまたは他のTRTポリペプチドは、活性が、会合RNA(例えば、hTR)
を有さないhTRTタンパク質またはhTRT会合RNA(例えば、hTR)複合体中のhTRTタ
ンパク質のいずれかによって示されるときには、特定の活性を有すると考えられ
る。hTRTのhTR結合活性は、hTRTタンパク質に関連する活性の1つの例である。
本発明の核酸(例えば、hTR)およびhTRTポリペプチドの複合体を産生する方法
は、以下に記載される。
hTRTポリペプチドをコードするポリヌクレオチドの変異または改変、または天然
ポリヌクレオチド配列と異なる配列を有するポリヌクレオチドの化学合成を含む
、化学的または組換え方法による)は、治療適用、あるいはhTRTまたはテロメラ
ーゼの活性の特異的モジュレーターのスクリーニングに有用であり得る。さらに
、種々のhTRT活性についてのアッセイは、hTRTまたはテロメラーゼと相互作用し
てテロメラーゼ活性を変化させる薬剤(例えば、活性調節剤)を同定するのに特
に有用であり得る。
ーゼ触媒活性(前進(processive)活性または非前進(non-processive)活性のいず
れかであり得る);テロメラーゼ前進性;従来の逆転写活性;ヌクレオチド分解
活性;プライマーまたは基質(テロメアまたは合成テロメラーゼ基質またはプラ
イマー)結合活性;dNTP結合活性;RNA(すなわち、hTR)結合活性;およびタン
パク質結合活性(例えば、テロメラーゼ会合タンパク質、テロメア結合タンパク
質、またはタンパク質−テロメリックDNA複合体への結合)。しかし、本発明は
また、任意の特定のhTRT活性を有さないが、hTRTまたは他のTRTタンパク質(例
えば、特定の典型的に短い免疫原ペプチド、阻害性ペプチド)に関連するなんら
かの有用活性を有するhTRT組成物を提供することが理解される。
本明細書で使用されているように、本発明のポリペプドは、ポリペプチドが、
テンプレート核酸(例えば、hTR)によってコードされる配列の1つの反復(例
えば、TTAGGG)の、部分的、1つ、または2つ以上の付加によってテロメラーゼ
基質として機能するDNAプライマーを伸長し得るとき、「テロメラーゼ触媒活性
」を有する。この活性は、前進的または非前進的であり得る。前進活性は、DNA
が酵素複合体によって放出される前に、テロメラーゼRNPがプライマーまたはテ
ロメラーゼに複数の反復を付加するときに生じる。非前進活性は、テロメラーゼ
が、プライマーに、部分的、または1つのみの反復を付加し、そして放出される
ときに、生じる。しかし、インビボにおいて、非前進反応は、引き続く一連の会
合、伸長、および解離により、複数の反復を付加し得る。これはインビトロにお
いて同様に生じ得るが、標準的なアッセイでのテロメラーゼを超える大過剰モル
のプライマーによる標準的なアッセイ条件下では典型的に観察されない。
メラーゼ反応が、典型的に最高の効果を有する温度およびdGTPを伴う、非前進反
応に好ましい条件、例えば、高温(すなわち、35〜45℃、典型的には37℃)、低
dGTP濃度(1μM以下)、高プライマー濃度(5μM以上)、および高dATP/TTP濃度
(2mM以上)を用いて実施される。前進活性を有するとしてhTRTポリペプチドを
特徴づけるために、従来のテロメラーゼ反応が、典型的に最も臨界的である温度
およびdGTP濃度を伴う、非前進反応に好ましい条件(例えば、27〜34℃、典型的
には30℃)、高dGTP濃度(10μM以上)、低プライマー濃度(1μM以下)、およ
び/または低dATPおよびTTP濃度(0.3-1mM)を用いて、実施される。あるいは
、TRAPアッセイ(前進活性または適度な前進活性について)、またはドットブロ
ットアッセイおよびゲルブロットアッセイ(前進活性について)が使用され得る
。本発明のhTRTポリペプチドは、非前進活性を有し得るが、前進活性(例えば、
hTRTポリペプチドの代替が、転位(translocation)する能力を減少または除去
するときに)は、単に前進的であり得るか、または両方の活性を有し得る。
非前進テロメラーゼ触媒活性は、3'末端がRNAテンプレートにアニールする位
置からテンプレート配列の5'末端にDNAプライマーを伸長し得、典型的には最初
のG残基の付加で終わる(例えば、テンプレートがhTRである場合)。表7に示
されているように、付加されるヌクレオチドの正確な数は、TTAGGG反復配列にお
けるプライマーの3'末端ヌクレオチドの位置に依存する。
クレオチドが--TTAGプライマーに付加される(ii)。前進反応においてテロメラー
ゼによって付加される最初の反復は、この工程と等価である;しかし、前進反応
では、テロメラーゼは、3'末端が放出され、別の反復のプライマー付加に十分な
位置でのテンプレートの3'領域で再結合する転位工程を実施する(Morin, 1997,
Eur. J. Cancer 33:750を参照のこと)。
いて1バンドのみを産生する。この得られたものはまた、末端トランスフェラー
ゼ活性のような他の酵素によって産生され得るので、産物がテロメラーゼ触媒活
性の結果であることを証明することは、いくつかの適用で望まれ得る。テロメラ
ーゼ(hTRTを有する)により生じたバンドは、いくつかのさらなる特徴によって
区別され得る。プライマー末端に付加されるヌクレオチド数は、プライマー3'末
端の位置に一致するはずである。従って、--TTAGGGプライマーは、4ヌクレオチ
ドが付加するはずであり、--TTAGプライマーは、6ヌクレオチドが付加するはず
である(上記を参照のこと)。実際に、2つ以上の配列が入れ換ったプライマー
が使用され得、これらは、同じ全長を有するが、異なる5'終端および3'終端を有
する。例として、プライマー5'-TTAGGGTTAGGGTTAGGGおよび5'-GTTAGGGTTAGGGTTA
GGの非前進伸長は、その絶対長が1ヌクレオチド差である産物を生成し得る(22
ntの全長のために5'-TTAGGGTTAGGGTTAGGGに4つが付加され、23ntのために全長
のために5'-GTTAGGGTTAGGGTTAGGに5つが付加される)。反応のヌクレオチド依
存性は、プライマー末端の位置に一致するはずである。従って、--TTAGGGプライ
マー産物は、dGTP、TTP、およびdATPを要求するが、dCTPは必要としないはずで
あり、そして---AGGGTTプライマー産物は、dGTPおよびdATPを要求し、TTPまたは
dCTPを必要としないはずである。活性は、hTRを分解して、その結果テンプレー
ト除去する条件下でのRNAaseまたはミクロコッカスヌクレアーゼの前処理に対し
て感受性であるはずである(Morin, 1989, Cell 59:521を参照のこと)。
実際には、前進活性は、従来のアッセイ、TRAPアッセイ、またはゲルブロット
アッセイでの6ヌクレオチドラダーの出現によって容易に観察される。ドットブ
ロットアッセイもまた使用され得るが、このような方法ではラダーは検出されな
い。従来のアッセイは、Morin, 1989, Cell 59:521に記載され、これは、その全
体において、そして全目的のために本明細書中で援用される。TRAPアッセイは、
米国特許第5,629,154号に記載されており、PCT公開 WO 97/15687、PCT公開 WO 9
5/13381;Kruppら、Nucleic Acids Res., 1997, 25:919;および、Wrightら、19
95, Nuc. Acids Res. 23:3794もまた参照のこと。これらの各々は、その全体に
おいて、そして全目的のために本明細書中で援用される。ドットブロットアッセ
イは、活性を検出するために使用される(CCCUAA)nプローブの安定なハイブリダ
イゼーションに要求される3つ以上の反復を付加しない非前進活性が、同じもの
が前進性を生じるかどうか、すなわち、プローブが、予測されるテロメラーゼ基
質を検出するかどうかを決定するために、化合物またはhTRT変異体を用いて試験
され、次いでその化合物または変異体が非前進活性を前進活性に変化し得る様式
で、使用され得る。前進テロメラーゼ触媒活性についての他のアッセイもまた、
例えば、Tatematsuら、1996, Oncogene 13:2265のストレッチPCRアッセイで使用
され得る。従来のアッセイとドットブロットアッセイとの組み合わせのゲルブロ
ットアッセイもまた、使用され得る。この変法で、従来アッセイが、放射標識ヌ
クレオチドなしに、そして高いdGTP濃度(例えば、0.1〜2mM)で実施される。
従来アッセイの実施後、合成されたDNAは、変性PAGEによって分離され、そして
メンブレン(例えば、ニトロセルロース)に移される。次に、テロメリックDNA
(テロメラーゼ産物−伸長したテロメラーゼプライマーまたは基質)が、標識さ
れたテロメリックDNAプローブ(例えば、前出のドットブロットアッセイで使用
されたようなCCCTAA配列を有するプローブ)を使用するハイブリダイゼーション
のような方法によって検出され得る。この技術の利点は、従来アッセイよりも感
度が高く、合成フラグメントのサイズ、および反応の前進性についての情報を提
供することである。
hTRTポリペプチドのテロメラーゼ活性は、未精製、部分精製、または実質的に
純粋なhTRTポリペプチド(例えば、hTRとの会合で)を使用して、インビトロで
、またはインビボ発現後に測定され得る。例えば、細胞(例えば、本発明の組換
えhTRTポリペプチドを発現する細胞)でのテロメラーゼ活性は、テロメアの長さ
の増加または減少を検出することによってアッセイされ得る。テロメラーゼ触媒
活性の典型的なアッセイは、hTRと複合体化されたhTRTを使用して実施され得る
;しかし、オルタナティブテロメラーゼテンプレートRNAが置換され得るか、ま
たはテロメラーゼ−プライマー結合のような別の活性を測定するためのアッセイ
が行われ得る。テロメアの長さを測定するアッセイは、当該分野で公知であり、
そしてテロメリックDNAへのプローブのハイブリダイゼーション(増幅工程が包
含され得る)、およびTRF分析、すなわち、制限エンドヌクレアーゼ切断後のテ
ロメリックDNA制限フラグメント[TRF]の分析、を包含する。PCT公開WO 93/23572
およびWO 96/41016;Counterら、1992, EMBO J. 11:1921;Allsoppら、1992, Pr
oc. Nat'l. Acad. Sci. USA 89:10114;Sanno, 1996, Am J Clin Pathol 106:16
,およびSanno, 1997, Neuroendocrinology 65:299を参照のこと。
テロメラーゼ触媒活性アッセイを使用する多数の方法で測定され得る。1つの方
法に従って、hTRTタンパク質が、hTRが発現される(すなわち、細胞で正常に、
または組換え発現によるいずれかで)テロメラーゼ陰性ヒト細胞で、発現され(
例えば、以下に記載されるように)、そして細胞または細胞溶解物中のテロメラ
ーゼ活性の存在または非存在が測定される。適切なテロメラーゼ陰性細胞の例は
、IMR 90(ATCC, #CCL-186)またはBJ細胞(ヒト包皮線維芽細胞株;例えば、Fe
ngら、1995, Science 269:1236を参照のこと)。その他の例は、網膜着色上皮細
胞(RPE)、ヒト臍帯静脈内皮細胞(HUVEC; ATCC #CRL-1730)、ヒト大動脈内皮
細胞(HAEC; Clonetics Corp, #CC-2535)、およびヒト乳房上皮細胞(HME; Ham
mondら、1984, Proc. Nat'l. Acad. Sci. USA 81:5435; Stampfer, 1985, J. Ti
ssue Culture Methods 9:107)を包含する。別の実施態様では、hTRTポリペプチ
ドは、テロメラーゼ陽性細胞で発現され(例えば、hTRT発現ベクターでのトラン
スフェクションによって)、そしてトランスフェクトされていないコントロール
細胞に比較して、細胞でのテロメラーゼ活性の増加が、ポリペプチドがテロメラ
ーゼ触媒活性を有する場合に検出される。通常、hTRTを発現する適切な発現ベク
ターでトランスフェクトされた細胞でのテロメラーゼ触媒活性は、トランスフェ
クトされていない(コントロール)細胞より、少なくとも約2倍、少なくとも約
5倍、または少なくとも約10倍〜100倍さえ、または1000倍でさえ、有意に大き
く増加する。
ピトープタグ」を有する融合タンパク質として(下記を参照のこと)、細胞(例
えば、hTRが発現されるテロメラーゼ陰性細胞で)発現される。1つの実施態様で
は、RNPは、タグを特異的に認識する抗体を使用して細胞から回収される。好ま
しいタグは、典型的に、短いかまたは小さく、そして切断部位、またはhTRTポリ
ペプチドからタグを除去し得る他の特性を有し得る。適切なタグの例は、Xpress
TMエピトープ(Invitrogen, Inc., San Diego CA)、および、抗体または核酸、
あるいは実施例6に記載されているような他の等価な方法によって、特異的に結
合され得る他の部分を包含する。別のタグは、例えば、配列番号2のタンパク質
の翻訳を開始するATGコドンの上流の配列番号1に挿入される配列によってコー
ドされるものを包含し、これは、上流配列への(新しい)メチオニン開始コドン
の挿入を包含し得る。
えば、リボ核タンパク質複合体として)単離されるとき、他の細胞タンパク質(
すなわち、テロメラーゼ会合タンパク質)が、単離された複合体と会合し得る(
それに直接的または間接的に結合し得る)ことが理解される。このような場合に
、hTRT、hTR、および関連タンパク質を含有する複合体についてテロメラーゼ活
性をアッセイすることが、ときに望まれる。
本発明のhTRTポリペプチドは、テロメラーゼ触媒活性を欠くが、1つ以上の他
のテロメラーゼ活性を保持する変異体を包含する。これらの他の活性、および、
このような活性を測定する本発明の方法は、(限定されないが)以下の節に議論
されているものを包含する。
テロメラーゼの従来の逆転写活性は、例えば、Morin, 1997,前出、およびSpen
ceら、1995, Science 267:988に記載されている。hTRTは、逆転写触媒活性に要
求される保存されたアミノ酸モチーフを有するので、hTRTは、ある種の外因性(
例えば、非hTR)RNAを転写する能力を有する。従来のRTアッセイは、アニールし
たDNAプライマーを伸長することによって、RNAテンプレートを転写する酵素の能
力を測定する。逆転写活性は、当該分野で公知の多数の方法、例えば、標識核酸
プライマー(例えば、RNAまたはDNA)のサイズの増加、または標識dNTPの取り込
みを測定することによって測定され得る(例えば、前出Ausubelらを参照こと)。
/RNAテンプレートが、hTRおよび/またはテロメリックDNAプライマーに関連す
る特徴を有するように改変され得ることは、理解される。例えば、RNAは、配列
(CCCTAA)nを有し得、ここで、nは、少なくとも1または少なくとも3、あるい
は少なくとも10以上である。1つの実施態様では、(CCCTAA)n領域は、RNAの5'
末端またはその付近に存在する(テロメラーゼRNAでのテンプレート領域の5'位
置に類似する)。同様に、DNAプライマーは、TTAGGGテロメア配列の部分を有す
る3'末端、例えば、XnTTAG、XnAGGG、Xn(TTAGGG)qTTAGなどを有し得、ここで
、Xは、非テロメリック配列であり、そしてnは、8〜20または6〜30であり、qは
、1〜4である。別の実施態様では、DNAプライマーはRNAテンプレートに相補的で
ない5'末端を有し、その結果、プライマーがRNAにアニールされるとき、プライ
マーの5'末端が結合されずに残る。本発明の方法に適用され得る標準的な逆転写
アッセイのさらなる改変が、当該分野で公知である。
テロメラーゼのヌクレオチド分解活性は、例えば、Morin, 1997,前出;Collin
sおよびGrieder, 1993, Genes and Development 7:1364に記載されている。テロ
メラーゼは、ヌクレオチド分解活性を有する(JoyceおよびSteitz, 1987, Trends
Biochem, Sci. 12:288);しかし、テロメラーゼ活性は定義されている特性を有
する。テロメラーゼは、ヒトおよびTetrahymenaでは、DNAの3'末端が、DNAテン
プレート配列の5'境界に位置するときに、オリゴヌクレオチドの3'末端から、優
先的にヌクレオチドを通常1つだけ除去する。このヌクレチドは、テロメリック
反復(ヒトではTTAGGである)の最初のGである。テロメラーゼは、優先的にG
残基を除去するが、その他のヌクレオチドに対するヌクレオチド分解活性を有す
る。この活性は、モニターされ得る。2つの異なる方法が、例示目的に本明細書
に記載されている。1つの方法は、全テンプレート配列に結合するプライマーと
の従来のテロメラーゼ反応(すなわち、テンプレート境界;ヒトでは5'-TAGGGAT
TAGでの終止)である。ヌクレオチド分解活性は、最終dG残基の、アッセイで提
供される放射標識dGTPとの置換をモニターすることによって観察される。この置
換は、ゲル電気泳動およびオートラジオグラフィーによって示される、開始プラ
イマーのサイズでのバンドの出現によってモニターされる。
末端を有するDNAプライマーを使用する。3'ブロックプライマーは、標準的なテ
ロメラーゼアッセイで使用され得るが、3'ヌクレオチドがテロメラーゼのヌクレ
オチド分解活性によって除去されない限り、伸長されない。この方法の利点は、
テロメラーゼ活性が、いくつかの標準的な方法のいずれによりモニターされ得、
そのシグナルが強く、そして定量が容易であることである。プライマーの3'末端
のブロックは、いくつかの方法によって完了され得る。1つの方法は、標準的な
オリゴヌクレトチド合成法を用いる、プライマーの3'末端での3'-デオキシ-dNTP
残基の付加である。この末端は、2'OHを有するが、テロメラーゼに必要な3'OHを
有さない。3'末端をブロックする他の方法は、例えば、3'ジデオキシ末端、3'ア
ミン末端などに存在する。hTRTヌクレオチド分解アッセイに対するプライマーの
例は、5'-TTAGGGTTAGGGTTA(G3'H)であり、ここで、最後の残基は、3'-デオキシ
グアノシン残基を示す(Glen Research, Sterling, VA)。本開示に基づく適切
なプライマーに対する多数の他の変化は、当業者に公知である。
テロメラーゼプライマー(テロメア)結合活性は、例えば、Morin, 1997,前出
;Collinsら、1995, Cell 81:677; Harringtonら、1995, J. Biol. Chem. 270:8
893に記載されている。テロメラーゼは、テロメリックDNAプライマーに結合する
2つの部位を有すると考えられる。プライマー結合に関連するRTモチーフは、hT
RTおよび/またはhTRT/hTRはDNAプライマー結合活性を有することを示す。プラ
イマー結合活性をアッセイするいくつかの方法が存在する;しかし、ほとんどの
方法に共通する工程は、適切な結合条件下における、標識DNAプライマーの、hTR
TあるいはhTRT/hTRまたは他のTRT/TR組み合わせとのインキュベーションである
。さらに、ほとんどの方法は、非結合DNAを、タンパク質結合DNAから分離する手
段を用いる;これらの方法は、以下を包含する。
は、非結合DNAプライマーが、タンパク質結合DNAプライマーから、非変性ゲル上
での電気泳動によって分離されるアッセイである(Ausubelら、前出)。
し、これは、標識プライマーとのインキュベーションの前または後のいずれかで
、hTRまたはhTRT/hTR複合体のマトリックス(例えば、ニトロセルロース)への
結合を包含する。hTRTのマトリクッスへの結合によって、非結合プライマーが、
結合プライマーから機械的に分離され得る。残りの非結合DNAは、定量前にメン
ブレンを洗浄することによって除去され得る。当業者は、化学的、光化学的、UV
架橋結合、抗体/エピトープ、および非共有的(疎水的、静電気的など)な相互
作用を含む、このようなマトリックス、固体支持体、およびメンブレンへの、タ
ンパク質の結合方法がいくつか存在することを認識する。
(TTAGGG)n(ここで、nは、1〜10であり得、典型的には3〜5である)のようなテ
ロメリックDNAプライマーであり得る。3'末端および5'末端は、反復配列の任意
の位置で終わり得る。プライマーはまた、標識または欠損を促進し得る非テロメ
リックDNAの5'または3'の伸長を有し得る。プライマーはまた、例えば、検出ま
たは単離を促進するように誘導体化され得る。
テロメラーゼのdNTP結合活性は、例えば、Morin, 1997、前出;Spenceら、前
出に記載されている。テロメラーゼは、DNAを合成するためにdNTPを必要とする
。hTRTタンパク質は、ヌクレオチド結合活性を有し、そして他のヌクレオチド結
合タンパク質と同様の様式(Kantrowitzら、1980,Trends Biochem. Sci. 5:124
)で、dNTP結合についてアッセイされ得る。典型的には、標識されたdNTPまたは
dNTPのアナログの結合は、当該分野で公知であるように、非テロメラーゼRTタン
パク質についてモニターされ得る。
テロメラーゼのRNA(すなわち、hTR)結合活性は、例えば、Morin, 1997、前
出; Harringtonら、1997, Science 275:973; Collinsら、1995, Cell 81:677に
記載されている。本発明のTRTタンパク質のRNA結合活性は、標識RNAプローブを
用いる、前記のDNAプライマー結合アッセイと同様の様式でアッセイされ得る。
結合および非結合のRNAの分離方法、およびRNAの検出方法は、当該分野で周知で
あり、DNAプライマー結合アッセイについて記載されているのと同様の様式で、
本発明の活性アッセイに適用され得る。RNAは、全長hTR、hTRのフラグメント、
またはテロメラーゼまたはhTRTに対して親和性を有することが実証された他のRN
Aであり得る。米国特許第5,583,016号およびPCT公開第96/40868号を参照のこと
。
本発明は、前記のように、活性の完全な相補性(前記のような)を有する組換
えhTRTに加えて、天然に存在するテロメラーゼまたはhTRTまたは他のTRTタンパ
ク質のテロメラーゼ活性の完全な相補性より少ないhTRTポリペプチドを提供する
。RTおよびTRTのテロメラーゼ特異的モチーフの本明細書の開示を考慮して、前
記のモチーフ配列中に認められるような、保存されたアミノ酸残基の変化または
変異は、治療、薬剤スクリーニング、および特徴づけ、および他の使用に有用で
ある、活性を失なった変異体をもたらすことが理解される。例えば、実施例1に
記載されているように、S. pombeの外因性TRT遺伝子のRTドメインでのモチーフ
B〜Dの欠失は、テロメアが、テロメアプローブのテロメリック反復へのハイブ
リダイゼーションがほとんど検出されない位置に順次短くされたハプロイド細胞
をもたらす。このことは、テロメラーゼ触媒活性の消失を示す。同様に、モチー
フEのWxGxS部位での変化は、テロメラーゼDNAプライマーの結合または機能に影
響し得る。さらに、モチーフA、B'、およびCでのアミノ酸変化は、テロメラーゼ
の触媒活性に影響し得る。hTRTのDDモチーフの変異は、テロメラーゼ活性を、有
意に減少または無くし得る(実施例16を参照のこと)。
本発明は、本明細書に開示されているhTRTおよび他のTRTポリペプチドを生産
する種々の方法を提供する。下記の節に、hTRTタンパク質の化学合成合および組
換え発現(融合タンパク質を含む)が、いくぶん詳細に記載されている。
本発明は、当該分野で周知の一般的な化学的な方法を使用して、全体または部
分的に合成されたhTRTポリペプチドを提供する(例えば、Caruthersら、1980, N
ucleic Acids Res.Symp. Ser., 215-223;および、Hornら、1980, Nucleic Acids
Res. Symp. Ser., 225-232)。例えば、ペプチド合成は、自動化された合成(
例えば、製造者によって提供された使用説明書に従う、Perkin Elmer ABI 431A
Peptide Synthesizerを使用する)を含む、種々の固相法(Robergeら、1995,Scie
nce 269;202)を使用して実施され得る。全長のタンパク質が必要なときは、より
短いポリペプチドが、ペプチド結合を形成するために、1つの分子のアミノ末端
と他の分子のカルボキシル末端との縮合によって融合され得る。
例えば、Creighton, Proteins, Structures and Molecular Principles, WH Fre
eman and Co, New York NY [1983])によって、実質的に精製され得る。合成ペ
プチド(または、本発明の任意の他のペプチドまたはポリペプチド)の組成物は
、アミノ酸分析または配列決定(例えば、Edman分解法;Creighton,前出)によ
って確認され得る。重要なことは、hTRTのアミノ酸配列またはその任意の部分が
、直接合成の間に変化され得るか、および/または化学的方法を用いて、他のタ
ンパク質からの配列またはそうでなければその任意の部分と任意の目的のために
組合わされ得て、本発明の変異体ポリペプチドを産生する。
本発明は、インビトロ(無細胞の)、エクソビボ、またはインビボ(細胞また
は生物に基づく)組換え発現系を使用する、hTRTポリペプチドおよび核酸の発現
に有用な方法、試薬、ベクター、および細胞を提供する。1つの実施態様では、
hTRTタンパク質またはそのフラグメントの発現は、適切な発現ベクター(すなわ
ち、使用される発現系に要求される、挿入されたコード配列の転写および翻訳に
必須エレメントを有するベクター)へコード配列を挿入する工程を包含する。従
って、1つの局面で、本発明は、hTRT遺伝子のコード配列に対する配列において
、少なくとも25ヌクレオチド、および多くの適用に好ましくは、本発明のhTRT c
DNAまたは遺伝子の50〜100ヌクレオチド以上が実質的に同一であるポリヌクレオ
チドを提供する。これは、hTRTポリペプチドを発現し得る転写ユニットを形成す
るために、プロモーターに作動可能に連結される。当業者に周知の方法を用いて
、hTRT配列、および、本発明によって提供される適切な転写または翻訳制御を有
する発現ベクターを構築し得る(例えば、Sambrookら、前出、およびAusubelら
、前出および本発明の開示を参照のこと)。
タンパク質のフラグメントを含有する融合タンパク質を包含する。融合タンパク
質は、化学合成によってもまた産生され得るが、典型的には組換え方法によって
産生される。融合タンパク質は、hTRTポリペプチド構築物の増強された発現の提
供、または、他の所望の特性(例えば、標識(例えば、酵素リポーター基)、結
合基、または抗体エピトープを含む)を有するhTRTポリペプチドの産生に有用で
あり得る。hTRTおよび増強グリーン蛍光タンパク質(EGFP)配列を有する融合タ
ンパク質の例が、以下の実施例15に記載される。実施例15および本明細書の
他のところに議論されている使用および適用が、特定の融合タンパク質に限定さ
れるのではなく、種々の融合構築物の使用の例示であることは、当業者には明白
である。
産生および単離を促進するために使用され得る。例えば、いくつかの実施態様で
は、融合タンパク質の非hTRT配列部分は、融合タンパク質が非結合成分(例えば
細胞溶解物中の非関連タンパク質)から分離され得るように、固定化分子に特異
的に結合され得る短いペプチドを有する。1つの例は、特異抗体に結合されるペ
プチド配列である。別の例は、ニッケルまたは銅イオンを含有する樹脂(すなわ
ち、金属ーキレートアフィニティークロマトグラフィー)により結合され得る、
ポリヒスチジン部、例えば、(His)6またはヒスチジン−トリプトファン配列を
有するペプチドである。他の例は、固定化免疫グロブリンでの精製を可能にする
プロテインAのドメインまたはフラグメント、および、FLAGS伸長/アフィニティ
ー精製システム(Immunex Corp, Seattle WA)で使用されるドメインを包含する
。いくつかの実施態様では、融合タンパク質は、hTRTまたは他のTRTポリペプチ
ド配列が、非hTRTペプチドまたはタンパク質の配列から容易に分離され得るよう
な、切断部位を有する。この場合、切断は、化学的(例えば、臭化シアン、2-(2
-ニトロフェニルスルフェニル)-3-メチル-3'-ブロモインドレン、ヒドロキシル
アミン、または低いpH)、または酵素的(例えば、Xa因子、エンテロキナーゼ)
であり得る。融合および切断システムの選択は、部分的には、発現されるhTRTポ
リペプチドの部分(すなわち、配列)に依存し得る。融合タンパク質は、Ausube
lら、前出、16節, Krollら、1993, DNA Cell. Biol. 12:441、およびInvitrogen
1997カタログ(Invitrogen Inc, San Diego CA)に一般的に記載されている。
エピトープタグまたはタグおよび切断部位を有する本発明の融合タンパク質の他
の例は、下記の実施例6に提供される。
同じまたは類似の細胞、ベクター、および方法が、hTRTポリヌクレオチドの必ず
しも所望する産生をともなうことなく、センスおよびアンチセンスのポリヌクレ
オチドを含む、本発明のhTRTポリヌクレオチドを発現するために使用され得るこ
とは、当業者に理解される。典型的には、ポリペプチドの発現は、適切な開始コ
ドン(例えば、メチオニン)、オープンリーディングフレーム、および、タンパ
ク質を産生するための核酸配列の翻訳が所望されないときには省略され得る翻訳
調節シグナル(例えば、リボソーム結合部位、終止コドン)を必要とする。
る、任意のいくつかの関連する利点を達成するように実施され得る。例示的な利
点の1つは、それらが発現される細胞からその後に単離されるhTRTポリペプチド
の発現である(例えば、ワクチンとして、またはテロメラーゼ活性を調節する化
合物を同定するためのスクリーニング適用での使用のための多量のhTRT産生のた
め)。第二の例示的な利点は、細胞の表現型を変化させるために、細胞でのhTRT
発現(遺伝子治療の適用のように)である。非哺乳動物細胞が、精製のためにhT
RTの発現に使用され得、一方、特定の真核哺乳動物細胞(例えば、ヒト細胞)は
、hTRTの単離および精製のみならず、細胞での表現型の変化が望まれるときに(
例えば、遺伝子治療適用でのように増殖能力の変化に影響するように)、hTRTの
発現にも使用され得る。例示および非限定の目的として、1つ以上のテロメラー
ゼ活性(例えば、テロメラーゼ触媒活性)を有するhTRTポリペプチドは、細胞の
増殖能力を増加する(例えば、細胞を不死化する)ために宿主細胞で発現され得
る。逆に、hTRTアンチセンスポリヌクレオチドまたは阻害ポリペプチドは、典型
的に、細胞(例えば、テロメラーゼ陽性の悪性腫瘍細胞)の増殖能力を減少させ
るために発現され得る。多数の特定の適用が、本明細書中、例えば、以下の治療
適用のための本発明の試薬および方法の使用の議論に記載されている。
現)は、当該分野で周知の一般的な方法(例えば、Ausubelら(前出)の10節を参
照のこと)に従って、hTRTポリヌクレオチドを使用する、網状赤血球溶解物およ
び小麦胚芽系のような多数の無細胞系を包含する。別の実施態様では、本発明は
、原核細胞または真核細胞でのhTRT発現のための試薬および方法を提供する。従
って、本発明は、hTRTポリヌクレオチド、タンパク質、タンパク質部分配列、ま
たは融合タンパク質をコードする核酸を提供する。これらは、単離細胞、細胞株
、細胞培養物、組織および全生物を含み、当該分野で公知のヒト細胞発現系を含
む細菌、真菌、植物、昆虫、および動物で発現され得る。当業者により理解され
るように、宿主細胞または無細胞系発現系に導入されるhTRTポリヌクレオチドは
、通常、各宿主または無細胞系に対して適切な発現制御配列に作動可能に連結さ
れる。
他の腸内細菌(例えば、Salmonella、Serratia、および種々のPseudomonas種)
、または他の細菌宿主(例えば、Streptococcus cremoris、Streptococcus lact
is、Streptococcus thermophilus、Leuconostoc citrovorum、Leuconostoc mese
nteroides、Lactobacillus acidophilus、Lactobacillus lactis、Bifidobacter
ium bifidum、Bifidobacterium breve、およびBifidobacterium longum)を、包
含する。原核生物で有用なhTRT発現構築物は、組換えバクテリオファージ、プラ
スミドまたはコスミドDNA発現ベクターなどを包含し、代表的には、プロモータ
ー配列を包含する。プロモーターの例は、lacプロモーター、Bluescript7 phage
mid(Stratagene, La Jolla CA)またはpSport1(Gibco BRL)のハイブリッドlacZプ
ロモーターのような誘導プロモーター;ファージーλプロモーター系;トリプト
ファン(trp)プロモーター系;および、ptrp-lacハイブリッドなどを包含する
。細菌発現構築物は、必要に応じて、リボソーム結合部位、および転写終止シグ
ナル調節配列を包含する。発現に有用な特定のベクターの例は、例えば、pTrcHi
s2(Invitrogen, San Diego CA)、pThioHis A、B、およびC、ならびに当該分野
で公知または開発され得る他の多数のベクター(例えば、Ausbelを参照のこと)
を包含する。細菌に有用なベクターは、hTRT融合タンパク質の産生を促進するも
のを包含する。細菌細胞での融合タンパク質の高レベル発現に有用なベクターは
、以下に限定されないが、上記のBluescript7(Stratagene)のような、多重機
能性E. coliクローニングおよび発現ベクターを包含し、そこで、hTRTタンパク
質、hTRT融合タンパク質、またはhTRTフラグメントをコードする配列が、ハイブ
リッドタンパク質が産生されるように、アミノ末端Metおよび後続のβ-ガラクト
シダーゼの7残基に対する配列に、インフレームでベクターに連結され得る(例
えば、pINベクター; Van HeekeおよびSchuster, 1989, J. Biol. Chem., 264:55
03)。pGEXベクター(例えば、pGEX-2TK; Pharmacia Biotech)のようなベクタ
ーもまた、グルタチオンS-トランスフェラーゼ(GST)を有する融合タンパク質
として、hTRTタンパク質のような外来ポリペプチドを発現するために使用され得
る。このような融合タンパク質は、グルタチオン−アガロースビーズへの吸着、
その後の遊離グルタチオンの存在下での溶出によって、溶解細胞から精製され得
る。このような系で産生されたタンパク質は、精製または他の適用に有用であり
得るような、エンテロキナーゼ、トロンビン、またはXa因子プロテアーゼ切断部
位をしばしば含み、その結果目的のクローニングされたポリペプチドがGST部分
から放出され得る。他の例は、hTRTおよびE. coliマルトース結合タンパク質(M
BP)またはE. coliチオレドキシンを含む融合タンパク質である。細菌細胞で有
用なhTRT発現構築物の例は、以下の実施例6に提供される。
omyces cerevisiae, Pichia pastoris, Torulopsis holmil, Saccharomyces fra
gilis, Saccharomyces lactis, Hansenula polymorpha、およびCandida pseudot
ropicalisのような酵母で発現されるhTRTポリペプチドを提供する。hTRTが酵母
で発現されるときは、プラスミドおよび酵母人工染色体(YAC)ベクターを含む
、多数の適切なベクターが入手可能である。ベクターは、代表的に、構成または
誘導プロモーター(例えば、α因子、アルコールオキシダーゼ、PGH、および3-
ホスホグリセレートキナーゼまたは他の解糖酵素)のような発現制御配列、およ
び、必要であれば、複製起点、終結配列などを包含する。Pichiaでの使用に適切
なベクターは、pPICZ、His6/pPICZB、pPICZα、pPIC3.5K、pPIC9K、pA0815、pGA
P2A、B、およびC、pGAP2αA、B、およびC(Invitrogen, San Diego, CA)、なら
びに当該分野で公知または開発されるべき多数のベクターを包含する。1つの実
施態様では、ベクターHis6/pPICZB(Invitrogen, San Diego, CA)が、酵母Pich
ia pastorisでHis6-hTRT融合タンパク質を発現するために使用される。Saccharo
mycesで有用なベクターの例は、pYES2(Invitrogen, San Diego, CA)である。
酵母で有用なhTRT発現構築物の例は、以下の実施例6に提供される。
えば、カリフラワーモザイクウイルス、CaMV;タバコモザイクウイルス、TMV)
でトランスフェクトされるか、または細菌発現ベクター(例えば、TiまたはpBR3
22プラスミド)で形質転換される植物細胞系で発現され得る。植物ウイルス発現
ベクターが使用される場合には、hTRTコード配列の発現は、任意の多数のプロモ
ーターによって駆動され得る。例えば、CaMVの35Sおよび19Sプロモーター(Bris
sonら, 1984, Nature 310:511-514)のようなウイルスプロモーターは、単独ま
たはTMVからのオメガリーダー配列(Takamatsuら、1987, EMBO J., 6:307-311)
との組み合わせで、使用され得る。あるいは、RUBISCOのスモールサブユニット
遺伝子由来のプロモーター(Coruzziら、1984, EMBO J., 3:1671-1680;Broglie
ら、1984, Science 224:838-843)のような植物プロモーター、または熱ショッ
クプロモーター(WinterおよびSinibaldi, 1991, Results Probl. Cell Differ.
, 17:85)、または貯蔵タンパク質遺伝子プロモーターが、使用され得る。これ
らの構築物は、直接DNA形質転換または病原体媒介トランスフェクションによっ
て、植物細胞へ導入され得る(このような技術の総説は、HobbsまたはMurry, 19
92,MCGRAW HILL YEARBOOK OF SCIENCE AND TECHONOLOGY McGraw Hill New York
NY, 191-196頁 (1992);または、WeissbachおよびWeissbach, 1988, METHODS FO
R PLANT MOLECULAR BIOLOGY, Academic Press, New York NY, 421-463頁を参照
のこと)。
虫系である。好ましい系は、バキュロウイルスポリヘドリンプロモーターを使用
する。このような系の1つは、Autographa californica核ポリヘドロシスウイル
ス(AcNPV)が、Spodoptera frugiperda細胞またはTrichoplusia larvaeにおい
て外来遺伝子を発現するためのベクターとして使用される。目的の遺伝子をコー
ドする配列が、ポリヘドリン遺伝子のようなウイルスの非必須領域にクローニン
グされ得、ポリヘドリンプロモーターの制御下に置かれ得る。hTRTタンパク質を
コードするような配列の首尾よい挿入は、ポリヘドリン遺伝子を不活性化し、コ
ートタンパク質を欠く組換えウイルスを産生する。次いで、組換えウイルスは、
S. frugiperda細胞またはTrichoplusia larvaeを感染させるために使用され、こ
こで、次いで、hTRT配列が発現される(一般的な方法については、Smithら、J.
Virol., 46:584(1983);Engelhardら、Proc. Natl. Acad. Sci. 91:3224-7(1994
)を参照のこと)。バキュロウイルス発現についての有用なベクターは、pBlueBa
cHis2A、BおよびC、pBlueBac4.5、pMelBacBならびに当該分野で公知ならびに開
発されるべき多数の他のベクターを包含する。昆虫細胞に有用なhTRT発現構築物
の例は、以下の実施例6に提供される。
うに、hTRTポリヌクレオチドは、hTRTポリペプチドの大量生産(例えば、精製の
ため)、または標的細胞の表現型を変化するために(例えば、遺伝子療法、細胞
不死化などの目的のために)、哺乳動物細胞(例えば、ヒト細胞)で発現され得
る。後者の場合には、発現されるhTRTポリヌクレオチドは、テロメラーゼ触媒活
性を有するポリペプチドをコードし得るか、またはコードしなくてもよい。すな
わち、発現が、センスまたはアンチセンスポリヌクレオチド、阻害または刺激ポ
リペプチド、ゼロまたは1以上のテロメラーゼ活性を有するポリペプチド、なら
びに、本明細書に開示またはこの開示の概説から当業者に明白なその他の組み合
わせおよび変異体であり得る。
質転換されたサル腎CV1株(COS-7, ATCC CRL 1651);ヒト胚腎株(293;Graham
ら、J. Gen. Virol. 36:59 (1977));仔ハムスター腎細胞(BHK, ATCC CCL 10
);CHO(ATCC CCL 61およびCRL 9618);マウスセルトリ細胞(TM4, Mather, B
iol. Reprod. 23:243-251 (1980));サル腎細胞(CV1 ATCC CCL 70);アフリ
カミドリザル腎細胞(VERO-76, ATCC CRL 1587);ヒトけい管ガン細胞(HeLa,
ATCC CCL 2);イヌ腎細胞(MDCK, ATCC CCL 34);バッファロラット肝細胞(B
RL 3A, ATCC CRL 1442);ヒト肺細胞(W138, ATCC CCL75);ヒト肝細胞(Hep
G2,HB 8065);マウス乳腫瘍(MMT 060562, ATCC CCL51);TRI細胞(Matherら
、Annals N.Y. Acad. Sci. 383:44-46 (1982);MDCK細胞(ATCC CCL 34およびCR
L 6253);HEK 293細胞(ATCC CRL 1573)、および、WI-38細胞(ATCC CCL 75;
ATCC:American Type Culture Collection、Rockville, MD)を含む、任意の正常
有限寿命動物もしくはヒト細胞あるいは正常または異常な不死化動物もしくはヒ
ト細胞を包含する。ポリペプチドを発現するための哺乳動物組織細胞培養物の使
用は、Winnacker, FROM GENE TO CLONES(VCH Publishers, N.Y., N.Y., 1987)
に全般的に考察されている。
れる。非ウイルスベクターおよび系は、代表的に、タンパク質またはRNAおよび
ヒト人工染色体を発現するための発現カセットを有する、プラスミドおよびエピ
ソームベクターを包含する(例えば、Harringtonら、1997, Nat Genet 15:345を
参照のこと)。例えば、哺乳動物(例えば、ヒト)細胞でのhTRTポリヌクレオチ
ドおよびポリペプチドの発現に有用な非ウイルスベクターは、pcDNA3.1/His、pE
BVHisA、B、およびC(Invitrogen, San Diego CA)、MPSVベクター、Invitrogen
1997カタログ(Invitrogen Inc, San Diego CA)(その全体が本明細書中で援
用される)に記載されている他のベクター、および他のタンパク質についての当
該分野で公知の多数の他のベクターを包含する。哺乳動物細胞で有用なhTRT発現
構築物の例は、以下の実施例6に提供される。
イルス、ヘルペスウイルスに基づくベクター、SV40、パピローマウイルス、HBP
エプスタインバーウイルスに基づくベクター、ワクシニアウイルスベクター、お
よびセムリキ森林ウイルス(SFV)を包含する。SFVおよびワクシニアベクターは
、一般的に前出のAusubelらの第16章で議論されている。ときにはウイルスベク
ターは、ネイクド形態で導入されるか、またはウイルスタンパク質以外のタンパ
ク質でコートされるが、これらのベクターは、しばしば、2つの成分である、改
変されたウイルスゲノムおよびそれを囲むコート構造からなる(一般的に、Smit
h、 1995, Annu. Rev. Microbiol. 49:807を参照のこと)。しかし、ベクター中
のウイルス核酸は、例えば、遺伝子療法用に設計されるときには、多くの様式で
変化され得る。これらの変化の目的は、入手可能なパッケージングまたはヘルパ
ー細胞中でベクター形態で増殖し得るその能力を維持しながら、標的細胞中でウ
イルスを増殖不能にすること、外因性DNA配列の挿入のためにウイルスゲノム内
に空間を提供すること、および目的遺伝子をコードし、そして適切な発現を可能
にする新たな配列を組み込むことである。従って、ベクター核酸は、一般的に2
つの成分を含む:ヘルパー株での複製およびパッケージングのための必須cis作
用ウイルス配列、および外因性遺伝子のための転写ユニット。他のウイルス機能
は、特定のパッケージングまたはヘルパー細胞株でトランスで発現される。アデ
ノウイルスベクター(例えば、ヒト遺伝子療法における使用のため)は、例えば
、Rosenfeldら、1992, Cell 68:143;PCT公開公報WO 94/12650;同94/12649;同
94/12629に記載されている。アデノウイルスが発現ベクターとして使用される場
合に、hTRTをコードする配列は、後期プロモーターおよび3部分からなるリーダ
ー配列からなる、アデノウイルス転写/翻訳複合体に連結され得る。ウイルスゲ
ノムのE1またはE3の非必須領域での挿入は、感染宿主細胞で発現し得る生ウイル
スをもたらす(LoganおよびShenk, 1984, Proc. Natl. Acad. Sci., 81:3655)
。レトロウイルスゲノム部分としての治療ポリヌクレオチド配列を有する、複製
欠損レトロウイルスベクターが、例えば、Millerら、1990, Mol. Cell. Biol. 1
0:4239;Kolberg, 1992, J. NIH Res. 4:43;および、Cornettaら、1991, Hum.
Gene Ther. 2:215に記載されている。
ターが、しばしば適切である。適切なプロモーターは、構成的、細胞型特異的、
ステージ特異的、および/または制御もしくは調節可能(例えば、グルココルチ
コイドのようなホルモンによる)であり得る。有用なプロモーターは、以下に限
定されないが、メタロチオネインプロモーター、構成的アデノウイル主要後期プ
ロモーター、デキサメタゾン誘導MMTVプロモーター、SV40プロモーター、MRPpol
IIIプロモーター、構成的MPSVプロモーター、テトラサイクリン誘導CMVプロモー
ター、(例えば、ヒト即時初期CMVプロモーター)、構成的CMVプロモーター、お
よび当該分野で公知のプロモーター-エンハンサー組み合わせを包含する。
たはhTRTタンパク質をコードする配列の翻訳に必要とされ得るかまたは望まれ得
る。翻訳のために、これらのエレメントは、代表的に、ATG開始コドンおよび隣
接のリボソーム結合部位または他の配列を含む。hTRTタンパク質をコードする配
列では、その開始コドンおよび上流のプロモーター配列が発現ベクターに挿入さ
れているならば、さらなる翻訳または他の制御シグナルが必要とされなくてもよ
い。しかし、コード配列、またはその部分のみが挿入されるている場合は、外因
性転写および/または翻訳制御シグナル(例えば、プロモーター、リボソーム結
合部位、およびATG開始コドン)は、しばしば提供されなければならない。さら
に、開始コドンは、代表的に、所望のタンパク質の翻訳を確実にするように正し
い読み取り枠でなければならない。外因性転写エレメントおよび開始コドンは、
天然および合成の両方の種々の起源のものであり得る。さらに、発現効率は、使
用する細胞系に適切なエンハンサーを含むことによって促進され得る(Scharfら
、1994, Results Probl. Cell Differ. 20:125;および、Bittnerら、1987, Met
h. Enzymol., 153:516)。例えば、SV40エンハンサーまたはCMVエンハンサーが
、哺乳動物宿主細胞での発現を増加するために使用され得る。
ような細胞で、hTRTプロモーターまたはエンハンサーの活性化によりなされ(増
加され)得る。活性化は、外因性プロモーター活性化因子の投与、またはhTRT遺
伝子の発現を抑制する細胞成分の阻害を含む、種々の方法によって実施され得る
。逆に、以下に記載されるように、プロモーター機能の阻害がhTRT遺伝子発現を
減少させることが理解される。
よびClontechからのTet-OnおよびTet-offテトラサイクリン制御系を使用して、h
TRTポリペプチドの誘導可能および抑制可能な発現を提供する。エクジソン誘導
発現系は、ステロイドホルモンエクジソンアナログ、ムリステロンAを使用して
、ヘテロ二量体核レセプターを通じて組換えタンパク質の発現を活性化する(No
ら、1996, Proc. Natl. Acad. Sci. USA 93:3346)。本発明の1つの実施態様で
は、hTRTは、pINDベクター(Clontech)にクローニングされ、これは、最小の熱
ショックプロモーター上流の5つの改変エクジソン応答エレメント(E/GRE)お
よび複数のクローニング部位を含む。次いで、その構築物は、エクジソンレセプ
ターを安定に発現する細胞株にトランスフェクトされる。トランスフェクション
後、細胞は、ムリステロンAによって処理され、pINDからの細胞内発現を誘導す
る。本発明の別の実施態様では、hTRTポリペプチドは、Tet-onおよびTet-off発
現系(Clontech)を使用して発現され、制御された高レベルの遺伝子発現を提供
する(Gossenら、1992, Proc. Natl. Acad. Sci. USA 89:5547;Gossenら、1995
, Science 268:1766)。
法で導入され得る。本発明の核酸発現ベクター(代表的にdsDNA)が、塩化カル
シウム形質転換(細菌系用)、エレクトロポレーション、リン酸カルシウム処理
、リポソーム媒介形質転換、インジェクションおよびマイクロインジェクション
、弾道法(ballistic method)、バイロソム(virosome)、イムノリポソーム、
ポリカチオン:核酸複合体、ネイクドDNA、人工ビリオン、ヘルペスウイルス構
造タンパク質VP22(ElliotおよびO'Hare, Cell 88:223)への融合、DNAの薬剤促
進取り込み、およびエクスビボ形質導入のような、周知の方法によって、選択さ
れた宿主細胞に導入され得る。有用なリポソーム媒介DNA輸送法は、米国特許第5
,049,386号、同第4,946,787号;および同第4,897,355号;PCT公開公報WO 91/174
24、同WO 91/16024;WangおよびHuang, 1987, Biochem. Biophys. Res. Commun.
147:980;WangおよびHuang, 1989, Biochemistry 28:9508;LitzingerおよびHu
ang,1992, Biochem. Biophys. Acta 1113:201; GaoおよびHuang, 1991, Biochem
. Biophys. Res. Commun. 179:280に記載されている。イムノリポソームは、外
因性ポリヌクレオチドのキャリアとして記載されており(WangおよびHuang, 198
7, Proc. Natl. Acad. Sci. U.S.A. 84:7851;Trubetskoyら、1992, Biochem. B
iophys. Acta 1131:311)、おそらく特定の細胞型で表面抗原に結合する特異的
な抗体の封入により、リポソームと比較すると、改良された細胞型特異性を有し
得る。Behrら、1989, Proc. Natl. Acad. Sci. U.S.A. 86:6982は、リポソーム
を形成するための任意のさらなるリン脂質の必要なしに、それ自身のトランスフ
ェクションを媒介する試薬としてリポポリアミンを使用することを報告している
。適切な送達方法は、受容可能な実施および制御要求(例えば、遺伝子療法につ
いてかまたは組換えタンパク質の発現のための細胞株の産生について)の観点に
より、実施者によって選択される。先に挙げた送達方法は、遺伝子療法目的のた
めの細胞に、組織培養細胞などに核酸を輸送するために使用され得ることが理解
される。
れる。例えば、hTRTを安定に発現する細胞株は、ウイルス複製起点または外因性
発現エレメント、および選択マーカー遺伝子を含む本発明の発現ベクターを使用
して調製され得る。ベクターの導入後、細胞は、選択培地に交換される前に、栄
養培地中で1〜2日間増殖され得る。選択マーカーの目的は、選択に対する耐性を
付与することであり、その存在は、選択培地中で導入された配列を首尾良く発現
する細胞の増殖を可能にする。耐性で安定にトランスフェクトされた細胞が、細
胞型に適切な組織培養技術を使用して、増殖され得る。例えば、当該分野で周知
の方法に従ってDHFR遺伝子でトランスフェクトされた細胞にメチルトレキセート
を投与することによる、増幅工程が包含され得る。
式で発現されたタンパク質をプロセシングするその能力について選択され得る。
ポリペプチドのこのような修飾は、これらに限定されないが、アセチル化、カル
ボキシル化、リン酸化、脂質化、およびアシル化を包含する。翻訳後のプロセシ
ングもまた、正しい挿入、折り畳み、および/または機能に重要であり得る。異
なる宿主細胞は、このような翻訳後の活性について各細胞について特異的な細胞
機関および特徴的機構を有するので、特定の細胞が、導入された外来タンパク質
の正しい修飾およびプロセシングを確実にするために選択され得る。
現する、トランスジェニック動物(すなわち、ヒトまたは他のTRT遺伝子配列に
ついてのトランスジェニック哺乳動物)を提供する。1つの実施態様では、hTRT
は、トランスジェニックウシ、ヤギ、またはウサギのような、トランスジェニッ
ク哺乳動物の乳汁中に分泌される。このような動物の作製方法は、例えば、Heyn
ekerらのPCT WO 91/08216に見出され得る。
ンパク質および複合体は、本発明(例えば、下記)によって提供された特定の方
法に従って、当該分野で公知の一般的な種々の方法を用いて精製され得る。当業
者は、化学合成、生物発現、または精製後に、hTRTタンパク質が、天然に存在す
るテロメラーゼの天然のコンフォメーションとは異なるコンフォメーションを有
することを理解する。それは、ある場合には、ポリペプチドを変性し(例えば、
ジスルフィドまたは他の結合の還元を含む)、次いで、ポリペプチドに好ましい
コンフォメーションに再度折り畳むことをもたらすために有用であるか、または
必要でさえあり得る。生産的な再折り畳みはまた、hTR(またはhTRフラグメント
)の存在を必要とする。タンパク質の還元および変性、および再折り畳みの誘導
方法は、当業者に周知である(例えば、Debinskiら、1993., J. Biol. Chem., 2
68:14065;KreitmanおよびPastan, 1993, Bioconjug. Chem., 4:581;および、B
uchnerら、1992, Anal. Biochem., 205:263;および、McCamanら、1985, J. Bio
tech. 2:177を参照のこと)。さらに、前出のPCT公開公報WO 96/40868を参照の
こと。
びに同時発現およびその他の方法によって産生された他の生体分子の複合体
本発明のhTRTポリペプチドは、インビボおよびインビトロにおいて、RNA(例
えば、hTR)、タンパク質(例えば、テロメラーゼ会合タンパク質)、DNA(例え
ば、テロメリックDNA、[T2AG3]N)、および(デオキシ)リボヌクレオチドトリ
ホスフェートのようなヌクレオチドを含む他の生体分子と会合し得る。これらの
会合は、本発明の方法に従って、hTRTの存在または機能のアッセイ、hTRTまたは
テロメラーゼ会合分子の同定または精製、およびhTRTまたはテロメラーゼの構造
または機能の分析に利用され得る。
めに、核酸、通常はRNAと複合体化(例えば、会合または結合された)hTRTを提
供する。1つの実施態様では、結合RNAは、テロメラーゼ媒介DNA合成のテンプレ
ートとして作用し得る。hTRTポリペプチドと複合体化され得るRNAの例は、天然
に存在する宿主細胞テロメラーゼRNA、ヒトテロメラーゼRNA(例えば、hTR;米国
特許第5,583,016号)、hTRサブ配列またはドメイン、合成RNA、または他のRNAを
包含する。RNA-hTRTタンパク質複合体(RNP)は、代表的に、テロメラーゼ触媒
活性のような、1つ以上のテロメラーゼ活性を示す。これらのhTRT-hTR RNP(ま
たは、他のhTRT-RNA複合体)は、hTRTおよびhTR(または、他のRNA)のインビト
ロ(すなわち、細胞を含まない系での)同時発現によるインビトロ再構築、イン
ビボ再構築、またはエクスビボ再構築を含む、例示目的で以下に記載されるよう
な、種々の方法によって産生され得る。
によって、インビトロで形成されたhTRT-hTR複合体(または、他のhTRT-RNA複合
体)を提供する(「インビトロ再構築」;例えば、再構築の記載については米国
特許第5,583,016号を参照のこと;さらに、Autexierら、EMBO J. 15:5928を参照
のこと)。
芽またはウサギ網状赤血球溶解物)で、インビトロにおいてhTRTポリペプチドお
よびRNA(例えば、hTR)を同時発現することによって産生された、テロメラーゼ
RNPを提供する。実施例7に示されるように、組換えhTRTポリペプチドおよびhTR
のインビトロにおける同時発現は、テロメラーゼ触媒活性(TRAPアッセイによっ
て測定されるような)の産生をもたらす。
タンパク質と複合体を形成し得る別のRNA)が組換え方法によって導入または発
現される細胞(例えば、哺乳動物細胞)で、hTRTポリペプチドを発現することに
よって産生されるテロメラーゼRNPが提供される。従って、1つの実施態様で、h
TRTは、hTRが存在するテロメラーゼ陰性ヒト細胞(例えば、BJまたはIMP90細胞
)で発現され、それは、2分子をRNPにアセンブリし得る。別の実施態様では、h
TRTは、hTRが組換え的に発現されるヒト細胞または非ヒト細胞で発現される。細
胞でのhTR発現方法は、米国特許第5,583,016号に見出される。さらに、テロメラ
ーゼのRNA成分をコードするcDNAを含有するクローンは、pGRN33(ATCC 75926)
として寄託されている。ヒトテロメラーゼのRNA成分をコードするゲノム配列も
また、λクローン28-1の約15 kbのSauIIIAからHindIIIの挿入物(ATCC 75925)
で寄託されている。真核生物細胞での発現には、hTRT配列は、代表的に、転写開
始配列(RNAポリメラーゼ結合部位)および転写終結配列に作動可能に連結され
る(例えば、PCT公開公報WO 96/01835;Fengら、1995, Science 269:1236を参照
のこと)。
/または会合される、組換え産生されたかまたは実質的に精製されたhTRTポリペ
プチドを提供する。従って、本発明は、他のタンパク質(例えば、テロメラーゼ
会合タンパク質)と同時発現または複合体化されたhTRTを提供する。テロメラー
ゼ会合タンパク質は、ヒトテロメラーゼと同時精製するタンパク質、および/ま
たはテロメラーゼ機能または活性を、例えば、テロメラーゼをテロメリックDNA
との会合に関与させることによって調節する役割をなし得るタンパク質である。
テロメラーゼ会合タンパク質の例は、以下に限定されないが、以下のタンパク質
および/またはそれらのヒトホモログを包含する:ヌクレオリン(Srivastavaら
、1989, FEBS Letts. 250:99を参照のこと);EF2H(伸長因子2ホモログ;Nomu
raら、1994, DNA Res. (Japan) 1:27, GENBANK受託番号D21163を参照のこと);
TP1/TLP1(Harringtonら、1997, Science 275:973;Nakayama, 1997, Cell 88:8
75);Tetrahymena p95のヒトホモログまたはp95それ自身(Collinsら、1995, C
ell 81:677);TPC2(テロメア長調節タンパク質;ATCC寄託番号97708;TPC3(
これもまた、テロメア長調節タンパク質;ATCC受託番号97707;DNA結合タンパク
質B(dbpB; Horwitzら、1994, J. Biol. Chem. 269:14130;および、テロメア反
復結合因子(TRF1および2;Changら、1995, Science 270:1663; Chongら、1997,
Hum Mol Genet 6:69);EST1、3、および4(Lendvayら、1996, Genetics 144:1
399, Nugentら、1996, Science 274:249, Lundbladら、1989, Cell 57:633);
および、エンドキャッピング因子(Cardenasら、1993, Genes Dev. 7:883)。
精製または結合に基づいて、同定され得る。あるいは、それらは、hTRT融合タン
パク質、例えば、GST-hTRT融合タンパク質などとの結合に基づいて、アフィニテ
ィー精製(Ausubelら、第20章を参照のこと)によって測定されるように、同定
され得る。hTRT会合タンパク質を同定するために適用し得る、タンパク質-タン
パク質相互作用を評価するために特に有用な技術は、Chienら(Proc. Natl. Aca
d. Sci. USA 88:9578 (1991);さらに、前出のAusubelらの第20章を参照のこと
)の2ハイブリッドスクリーニング法である。このスクリーニングは、転写アク
チベーターである酵母Gal4転写タンパク質(FieldおよびSong, 1989, Nature 34
0:245を参照のこと)の再構築を通じて、インビボでのタンパク質-タンパク質相
互作用を同定する。この方法は、DNA結合および転写活性化をもたらす別々のド
メインからなる酵母Gal4タンパク質の特性に基づく。2つのハイブリッドタンパ
ク質をコードするポリヌクレオチド、通常は発現ベクターが構築される。1つの
ポリヌクレオチドは、hTRT相互作用について試験されるべきタンパク質(例えば
、ヌクレオリンまたはEF2H)のポリペチド配列に融合された、酵母Gal4 DNA結合
ドメインを含む。あるいは、酵母Gal4 DNA結合ドメインはヒト細胞からのcDNAに
融合されており、従って、テロメラーゼ会合タンパク質についてのスクリーニン
グのためのGal4 DNA結合ドメインに融合されたヒトタンパク質のライブラリーを
作成する。他のポリヌクレオチドは、hTRTポリペプチド配列に融合されたGal4活
性化ドメインを含む。その構築物は、酵母宿主細胞に導入される。発現に際して
、hTHTと試験タンパク質との間の分子間結合は、Gal4活性化ドメインを有するGa
l4 DNA結合ドメインを再構築し得る。これは、Gal4結合部位に作動可能に結合さ
れたレポーター遺伝子(例えば、lacZ、HIS3)の転写活性化を導く。レポーター
の選択またはアッセイによって、hTRT相互作用タンパク質またはテロメラーゼ会
合タンパク質を含有する細胞の遺伝子コロニーが、同定され得る。当業者は、2-
ハイブリッドスクリーニングの多数の変法、例えば、LexA系(Bartelら、1993,
Cellular Interactions in Development: A Practical Approach Hartley, D.A.
編(Oxford Univ. Press) 153-79頁)が存在することを、理解する。
ッド系である(例えば、Zhangら、1996, Anal. Biochem. 242:68;Licitraら、19
96, Proc. Natl. Acad. Sci. USA 93:12817を参照のこと)。テロメラーゼRNA成
分は、TRTまたはhTRTタンパク質および試験タンパク質を含むこの系において、
利用され得る。相互作用タンパク質(すなわち、ヘテロ二量体化するかまたは高
次のヘテロ多量体を形成するタンパク質)を同定するために有用な他の方法は、
E. coli/BCCP相互作用スクリーニング系である(Germinoら、(1993) Proc. Natl
. Acad. Sci. U.S.A. 90:933;Guarente (1993) Proc. Natl. Acad. Sci. (U.S.
A.) 90:1639を参照のこと)。
得るか、またはそうでなくてもよい)と、hTRT(hTR、その他のRNA、または1つ
以上のテロメラーゼ会合タンパク質と複合体化され得るか、またはされなくても
よい)との複合体を提供する。テロメア結合タンパク質の例は、TRF1およびTRF2
(前出);mpA1、mpA2、RAP1(Buchmanら、1988, Mol. Cell. Biol. 8:210, Buc
hmanら、1988, Mol. Cell. Biol. 8:5086)、SIR3およびSIR4(Aparicioら、199
1, Cell 66:1279)、TEL1(Greenwellら、1995, Cell 82:823;Morrowら、1995,
Cell 82:831);ATM(Savitskyら、1995, Science 268:1749)、エンドキャッ
ピング因子(Cardenasら、1993, Genes Dev. 7:883)、および対応するヒトホモ
ログを包含する。前述の複合体は、一般的に、hTRTおよびhTRまたはテロメラー
ゼ会合タンパク質の複合体についての前出の記載のように、例えばインビトロま
たはインビボでの混合または同時発現によって産生され得る。
関連する局面において、本発明は、ポリクローナル抗体およびモノクローナル
抗体、抗体フラグメント、一本鎖抗体、ヒトおよびキメラ抗体を含み、ファージ
外皮もしくは細胞表面タンパク質に融合した抗体または抗体フラグメント、およ
び当該分野で公知であり、かつ本明細書中に記載の他のものを含む、hTRTと特異
的に免疫反応する抗体を提供する。本発明の抗体は、図17に記載したアミノ酸配
列(配列番号2)と実質的に同一のアミノ酸配列を有するポリペプチド、もしく
はその免疫原性フラグメントまたはそれにより定義されるタンパク質上のエピト
ープを特異的に認識し得、そして結合し得る。本発明の抗体は、少なくとも約10
7、108、109または1010M-1のhTRTに対する特異的結合親和性を示し得、そして
これはポリクローナル、モノクローナル、組換えまたは他の産物であり得る。本
発明はまた、hTRT構造エピトープ(例えば、hTRTタンパク質またはテロメラーゼ
RNPの表面上のエピトープ)を認識する抗hTRT抗体を提供する。同様に、所望な
らば、hTRTタンパク質配列のコンピューターアシスト分析、HIV-1のp66サブユニ
ットのような関連する逆転写酵素のコンフォメーションに対する比較(例えば、
図3参照)によって、あるいは経験的にコンフォメーショナルエピトープを同定
し得る。コンフォメーショナルエピトープを認識する抗hTRT抗体は、特に、ヒト
テロメラーゼの検出および精製において、ならびにヒト疾患の診断および処置に
おいて有用性を有する。
ットまたはマウスのような宿主を、hTRTタンパク質または免疫原性特性を保持す
るその任意の部位、フラグメントまたはオリゴペプチドでの注射によって免疫化
し得る。抗体誘導のためのhTRTポリペプチドの選択において、生物学的活性を保
持する必要はない;しかし、タンパク質フラグメントまたはオリゴペプチドは、
免疫原性、および好ましくは抗原性でなければならない。免疫原性は、ポリペプ
チドおよびアジュバントを動物(例えば、ウサギ)に注射し、そして注射したポ
リペプチドに対して指向する抗体の出現をアッセイすることにより測定し得る(
例えば、HarlowおよびLane, ANTIBODIES: A LABORATORY MANUAL, COLD SPRING H
ARBOR LABORATORY, New York (1988)参照。すべての目的のために(例えば第5
章において)本明細書中に全部が参考として援用される)。特異的抗体を誘導す
るために使用されるペプチドは、典型的には、少なくとも5個のアミノ酸、好ま
しくは少なくとも8個のアミノ酸、より好ましくは少なくとも10個のアミノ酸か
ら成るアミノ酸配列を有する。通常、それらは、配列番号2のタンパク質のアミ
ノ酸配列の全てまたは隣接部分を模倣するか、またはそれと実質的な配列同一性
を有する。hTRTタンパク質アミノ酸の短い領域は、キーホールリンペットヘモシ
アニン、およびキメラ分子に対して産生された抗hTRT抗体のような別のタンパク
質の領域に融合され得る。宿主の種に応じて、種々のアジュバントを用いて免疫
学的反応を増大し得る。
る。これらのおよび他のパラメーターは、一般に、免疫学者に周知である。典型
的には、注射は肉趾、筋肉内、皮内、リンパ節周辺または腹腔内に投与する。ア
フィニティー精製を含む日常的な方法によって、宿主によって産生された免疫グ
ロブリンを沈殿し、単離し、精製し得る。
は抗hTRTポリクローナル抗体の産生および使用を記載する。
hTRTタンパク質およびペプチドに対するモノクローナル抗体は、培養中の連続
する細胞株による、抗体分子の産生を提供する任意の技術を用いる本発明の方法
に従って調製し得る。これらは、KoehlerおよびMilstein (Nature 256:495 [197
5])によって最初に記載されたハイブリドーマ技術、ヒトB細胞ハイブリドーマ
技術(Kosborら,1983, Immunol. Today 4:72;Coteら, 1983, Proc. Natl. Acad
. Sci. USA, 80:2026)、およびEBVハイブリドーマ技術(Coleら, MONOCLONAL AN
TIBODIES AND CANCER THERAPY, Alan R Liss Inc., New York,NY, 77-96頁 [198
5])を含むがこれらに限定されない。
て行う。非ヒトモノクローナル抗体(例えば、ネズミ、ウサギ、ウマ)の産生は
周知であり、そして例えば、hTRTまたはそのフラグメントを含有する調製物で動
物を免疫化することによって達成し得る。ある方法において、適切な時間の後、
動物の脾臓を切り出し、個々の脾臓細胞を、典型的には、適切な選択条件下で不
死化骨髄腫細胞に融合する。その後、細胞をクローンに分離し、各クローン(例
えば、ハイブリドーマ)の上清を、抗原の所望の領域に対して特異的な適切な抗
体の産生につき試験する。抗体を産生する技術は当該分野で周知である。例えば
、Godingら, MONOCLONAL ANTIBODIES: PRINCIPLES AND PRACTICE (第2版) Acad.
Press, N.Y.およびHarlowおよびLane(前出)を参照のこと(そのそれぞれにつき
、その全部は全ての目的で本明細書に援用される)。他の適切な技術は、抗原性
ポリペプチドに対する、あるいは、ファージまたは同様のベクターにおける抗体
(後述を参照)のライブラリーの選択に対するリンパ球のインビトロ暴露を含む
。
本発明の別の局面において、hTRTポリペプチドに対するヒト抗体が提供される
。ヒト免疫系のエレメントを有するトランスジェニック動物を用いて(例えば、
米国特許第5,569,825号および第5,545,806号参照、これらの両方は全目的のため
それらの全部が本明細書中に参考として援用される)、あるいはヒト末梢血液細
胞を用いて(Casaliら, 1986, Science 234:476)、既知の抗原に対するヒトモノ
クローナル抗体をまた作成し得る。いくつかのヒト抗体は、競合結合実験によっ
て、あるいは特定のマウス抗体と同一のエピトープ特異性を有するように選択さ
れる。
, Science 246:1275(本明細書中に参考として援用される)によって概説されて
いる一般的なプロトコルに従って、ヒトB細胞由来のDNAライブラリーをスクリ
ーニングすることにより生産し得る。hTRTポリペプチドに結合する抗体を選択す
る。次いで、このような抗体(または結合フラグメント)をコードする配列をク
ローン化し、そして増幅する。Huseによって記載されているプロトコルは、しば
しばファージティスプレイ技術とともに使用される。
本発明はまた、キメラ、ヒト様またはヒト化されて、それらの標的に対するそ
れらの親和性を低下させることなく、それらの潜在的抗原性を低下させた抗hTRT
抗体を提供する。キメラ、ヒト様およびヒト化抗体の調製は当該分野で記載され
ている(例えば、米国特許第5,585,089号および第5,530,101号;Queenら, 1989,
Proc. Natl. Acad. Sci. USA, 86:10029;およびVerhoeyanら, 1988, Science 2
39:1534を参照;その全部は全目的のために本明細書中に参考として援用される。
ヒト化免疫グロブリンは、実質的にヒト免疫グロブリン由来の可変フレームワー
ク領域(アクセプター免疫グロブリンという)および実質的に非ヒト(例えば、
マウス)免疫グロブリン由来の相補性決定領域(ドナー免疫グロブリンという)
を有する。もし存在すれば、定常領域は実質的にヒト免疫グロブリン由来である
。
にヒト)抗hTRT抗体は、ネズミまたは他の種由来の抗体よりも優れたいくつかの
利点を提供する:(1)ヒト免疫系は、ヒト化抗体のフレームワークまたは定常
領域を外来性のものとして認識するはずがなく、従って、このような注射された
抗体に対する抗体応答は、全体的に外来性のマウス抗体または部分的に外来性の
キメラ抗体に対してより低いはずである;(2)ヒト化抗体のエフェクター部分
はヒトのものであるので、ヒト免疫系の他の部分とより良好に相互作用し得る;
および(3)注射されたヒト化抗体は、天然に生じるヒト抗体と実質的に等しい
半減期を有し、他の種の抗体よりも少なく、より低い頻度の用量を可能とする。
前述のことから暗に意味されるように、抗hTRT抗体は疾患の処置に、すなわち、
テロメラーゼ陽性細胞を標的化するための適用を有する。
本発明はまた、ファージディスプレイ法(例えば、Dowerら, WO91/17271およ
びMcCaffertyら, WO92/01047;およびVaughanら, 1996, Nature Biotechnology,
14:309;その全部は全目的のために本明細書中に参考として援用される)によ
って生産された抗hTRT抗体(または結合性組成物)を提供する。これらの方法に
おいて、ファージのライブラリーが生産される。ここで、メンバーはそれらの外
表面上に異なる抗体を提示する。抗体は、通常、FvまたはFabフラグメントとし
て提示される。所望の特異性を有する抗体を表示するファージは、hTRTポリペプ
チドに対する親和性の豊富さによって選択される。
を有するヒト化抗体が生産され得る。この方法において、選択されたネズミ抗体
の重鎖または軽鎖可変領域のいずれかを出発物質として用いる。もし、例えば、
軽鎖可変領域が出発物質として選択される場合、メンバーが同一の軽鎖可変領域
(すなわち、ネズミ出発物質)および異なる重鎖可変領域を示すファージライブ
ラリーが構築される。重鎖可変領域は、再編成されたヒト重鎖可変領域のライブ
ラリーから得られる。hTRTポリペプチドに対する強力な特異的結合を示すファー
ジ(例えば、少なくとも108M-1および好ましくは少なくとも109M-1)が選択さ
れる。次いで、このファージ由来のヒト重鎖可変領域は、さらなるファージライ
ブラリーを構築するための出発物質として働く。このライブラリーにおいて、各
ファージは同一の重鎖可変領域(すなわち、最初のディスプレイライブラリーか
ら同定された領域)、および異なる軽鎖可変領域を表示する。軽鎖可変領域は、
再編成されたヒト可変軽鎖領域のライブラリーから得られる。再度、強力な特異
的結合を示すファージが選択される。これらのファージは完全なヒト抗hTRT抗体
の可変領域を表示する。これらの抗体は、通常、ネズミ出発物質と同一または同
様のエピトープ特異性を有する。
本発明はまた、hTRTポリペプチドに対する抗体の特異性を共有するが、第2の
部位にも特異的に結合し得るハイブリッド抗体を提供する。このようなハイブリ
ッド抗体において、一方の重鎖および軽鎖対は、通常、抗hTRT抗体由来であり、
他の対は別のエピトープまたはタンパク質に対して惹起された抗体由来である。
この結果、多機能価の特性、すなわち、少なくとも2つの異なるエピトープに同
時に結合する能力が得られ、ここで、少なくとも1つのエピトープは、抗複合体
抗体が結合するエピトープである。このようなハイブリッドは、各成分抗体を生
産するハイブリドーマの融合によって、あるいは組換え技術によって形成され得
る。このようなハイブリッドは化合物(すなわち、薬物)をテロメラーゼ陽性細
胞に運搬するために使用され得る(すなわち、細胞傷害薬剤がガン細胞に送達さ
れる)。
)に融合させて、有用な特性を有する融合タンパク質(例えば、イムノトキシン
)を生産し得る。
また、上記の手法によって単離し得る抗イディオタイプ抗体もまた有用である
。抗イディオタイプ抗体は、例えば、動物の一次抗体(すなわち、抗hTRT抗体ま
たはそのhTRT-結合性フラグメント)での免疫化によって調製し得る。抗hTRT抗
体については、一次抗体へのその結合がhTRTポリペプチドまたはそのフラグメン
トによって阻害されるその抗イディオタイプ抗体が選択される。抗イディオタイ
プ抗体およびhTRTポリペプチドまたはそのフラグメントは共に一次免疫グロブリ
ンに結合するので、抗イディオタイプ免疫グロブリンはエピトープの「内部イメ
ージ」を表し得、そして従って、アッセイにおいてhTRTポリペプチドに置換し得
、あるいはそれを用いて、例えば患者において抗hTRT抗体を結合(すなわち、不
活化し得る。抗イディオタイプ抗体をまた、テロメラーゼ会合タンパク質と相互
作用し得る。このような抗体の投与は、hTRT会合タンパク質への結合においてhT
RTで滴定するか、あるいは競合させることによってテロメラーゼ機能に影響し得
る。
本発明の抗体は任意のイディオタイプ、例えば、IgM、IgD、IgG、IgAおよびIg
Eであり得、IgG、IgAおよびIgMがしばしば好ましい。ヒト化抗体は1より多いク
ラスまたはイソタイプ由来の配列を含み得る。
供される。典型的には、これらのフラグメントは、それらが由来するインタクト
な抗体とhTRTポリペプチドへの特異的結合について競合し得、少なくとも107、1
08、109M-1、または1010M-1の親和性で結合し得る。抗体フラグメントは別々
の重鎖、軽鎖、Fab、Fab'、(ab')2、Fabc、およびFvを含む。フラグメントは、
インタクトな免疫グロブリンの酵素的または化学的分離によって生じ得る。例え
ば、F(ab')2フラグメントは、HarlowおよびLane(前出)に記載されたような標
準的な方法を用い、pH3.0〜3.5においてペプシンでタンパク消化することによっ
てIgG分子から得ることができる。Fabフラグメントは、限定的還元によってF(ab
')2フラグメントから、あるいは還元剤の存在下でのパパインでの消化によって
全抗体から得ることができる(一般には、Paul, W.編, FUNDAMENTAL IMMUNOLOGY
第2版 Raven Press, N.Y., 1989, 第7章を参照,その全部はすべての目的のた
めに参考として援用される)。フラグメントはまた、組換えDNA技術によって産
生され得る。選択されたフラグメントをコードする核酸のセグメントは、制限酵
素での全長コード配列の消化によって、あるいはデノボ合成によって産生される
。フラグメントはしばしば、ファージ外皮融合タンパク質の形態で発現される。
、または結合親和性の過剰な低下(すなわち、約107M-1未満)の欠失なしに、
可変および定常領域双方において、重要でないアミノ酸置換、付加または欠失を
受けることができる。通常、このような改変を取り入んだ免疫グロブリンは、そ
れらが由来する参照免疫グロブリンに対して実質的な配列同一性を示す。それが
由来する参照免疫グロブリンと比較して同一の特異性および増加した親和性を有
する、変異免疫グロブリンを選択し得る。ファージディスプレイ技術はこのよう
な免疫グロブリンを選択するための有用な技術を供する。例えば、Dowerら, WO
91/17271 McCattertyら, WO 92/01047;およびHuse, WO 92/06204参照。
、検出可能な標識に共有結合的または非共有結合的のいずれかで結合することに
よって標識される。標識結合体として、本発明の抗体は診断適用において特に有
用である。
れらのダイマー、個々の軽鎖および重鎖、または他の免疫グロブリン形態は、硫
酸アンモニウム沈殿、アフィニティーカラム、カラムクロマトグラフィー、ゲル
電気泳動等を含む当該分野の標準的な手順に従って、本発明の方法および試薬を
用いて精製し得る(一般には、Scopes, PROTEIN PURIFICATION; PRINCIPLES AND
PRACTICE 第3版, (Springer-Verlag, N.Y., 1993)を参照)。少なくとも約90〜9
5%、または98〜99%さえの、またはそれを以上の均一性の実質的に純粋な免疫
グロブリンが好ましい。
本発明は、前例のない純度の単離されたヒトテロメラーゼを提供する。特に、
本発明は:組換えまたは非組換え起源の精製hTRT;必要に応じて1以上のテロメ
ラーゼ会合タンパク質を含む組換え、非組換え、または混合起源の精製hTRT-hTR
複合体(すなわち、RNP);精製された天然に生じるヒトテロメラーゼ等を提供
する。さらに、本発明は、変異体、融合タンパク質、天然に生じるタンパク質等
を含む前記分子および複合体(集合的に、「hTRTおよび/またはhTRT複合体とい
う)を部分的に、実質的にまたは高度に精製するための方法および試薬を提供す
る。
る試みは、限定的な成功に終わった。前記の適用で供される方法は、粗製細胞抽
出物と比較して、約60,000倍またはそれ以上のテロメラーゼの精製を提供する。
本発明は、部分的には、本発明の新規のイムノアフィニティー試薬(例えば、抗
hTRT抗体)、および/またはhTRTの組換え発現について本明細書中に提供される
試薬、細胞、および方法によって、より高い純度のhTRTおよびhTRT複合体をも提
供する。hTRTおよびhTRT複合体の組換え発現は精製を容易とする。なぜなら、天
然に生じるほとんどの細胞発現で見い出されるよりもかなり高いレベルで所望の
分子を産生し得る。そして/または組換えhTRT分子を、容易に精製し得るよう(
例えば、エピトープタグとの融合によって)修飾し得るからである。
と、およびとりわけ、インビトロ、インビボ、もしくはエクソビボ、または前出
の開示の植物もしくは動物発現系、あるいは当該分野で公知の他のもの/系のい
ずれかを用いて、組換えhTRTおよびhTRT複合体を発現させ、そして精製し得るこ
とが認識させる。
イムノアフィニティー工程を、単独でまたは他の精製工程と組み合わせて用いて
精製される。典型的には、本発明によって提供されるような固定化されたまたは
固定化され得る抗hTRT抗体を、抗hTRT抗体がhTRT抗原に結合する条件下で所望の
hTRTまたはhTRT−含有複合体を含有する、細胞溶解物のようなサンプルと接触さ
せる。当該分野で周知の方法によってサンプルの未結合成分を除去した後、hTRT
組成物を、所望ならば、実質的に純粋な形態で、抗体から溶出し得る。1つの実
施態様において、当該分野で周知のイムノアフィニティークロマトグラフィー法
(例えば、HarlowおよびLane、 前出; およびAusubel, 前出;Hermansanら, 199
2, IMMOBILIZED AFFINITY LIGAND TECHNIQUES (Academic Press, San Diego)を
参照)を、本発明の方法に従って用いる。別の例示的な実施態様において、抗hT
RT免疫グロブリン−hTRT複合体の免疫沈降を固定化プロテインAを用いて行う。
本発明の方法および試薬に従って使用するのに適した多数の改変および別のイム
ノアフィニティー精製プロトコルは当業者に周知である。
ィー方法に代えて、またはそれに加えて、硫酸アンモニウム沈殿、アフィニティ
ーカラム(例えば、イムノアフィニティー)、サイズ排除、アニオンおよびカチ
オン交換クロマトグラフィー、ゲル電気泳動等のような日常的なタンパク質精製
法を用いて、組換えhTRTタンパク質を精製し得る(一般に、R. Scopes, PROTEIN
PURIFICATION, Springer-Verlag, N.Y. (1982)およびDeutscher, METHODS IN E
NZYMOLOGY VOL.182: GUIDE TO PROTEIN PURIFICATION, Academic Press, Inc. N
.Y. (1990)を参照)。カチオン交換法は、hTRTタンパク質の塩基性pIのため特に
有用であり得る。例えば、固定化ホスフェートを、カチオン交換官能基として使
用し得る(例えば、P-11 Phosphocellulose, Whatman カタログ# 4071またはCel
lulose Phosphate, Sigmaカタログ#C 3145)。固定化ホスフェートは、hTRT精製
につき2つの有利な特徴を有する。それは、カチオン交換樹脂であり、それは核
酸のホスフェート骨格に対して物理的類似性を示す。これはアフィニティークロ
マトグラフィーを可能とする。なぜなら、hTRTはhTRおよびテロメリックDNAに結
合するからである。また、他の非特異的および特異的核酸アフィニティークロマ
トグラフィー法もまた精製に有用である(例えば、Albertsら, 1971, Methods E
nzymol. 21:198;Arnt-Jovinら, 1975, Eur. J. Biochem. 54:411;Pharmaciaカ
タログ#27-5575-02)。hTRTのこの結合機能のさらなる開発は、精製のための特
異的核酸(例えば、テロメラーゼプライマーまたはhTR)アフィニティークロマ
トグラフィーの使用を包含し得(Chodoshら, 1986, Mol. Cell. Biol. 6:4723;
Wuら, 1987, Science 238:1247; Kadonaga, 1991, Methods Enzymol. 208:10);
ヌクレオチドに対する物理的類似性を示す固定化シブリコンブルー色素は、ヌク
レオチドのhTRT結合に起因する(例えば、DNA合成のための基質として)、hTRT
精製のための別の有用な樹脂である(Pharmaciaカタログ#17-0948-01またはSigm
aカタログ#C 1285)。
現されないインビトロまたはインビボ発現系から直接単離される。単離されたhT
RTタンパク質はまた、例えば、(例えば、温和なまたは他の変性剤への暴露によ
って)テロメラーゼRNPを破壊し、そして(例えば、クロマトグラフィーまたは
イムノアフィニティークロマトグラフィーのようなルーチンの手段によって)RN
P成分を分離することによって、精製ヒトテロメラーゼまたはhTRT複合体から容
易に取得し得ることが認識される。
によって、hTRの富化を測定することによって、または当該分野で公知の他の方
法によってテロメラーゼ活性アッセイ(例えば、TRAPアッセイ、慣習的アッセイ
、またはプライマー結合アッセイ)を用いてモニターし得る。
よびhTRT複合体は、1つの実施態様において、高度に精製されている(すなわち
、少なくとも約90%均一、より頻繁には少なくとも約95%均一)。均一性は、SD
S−ポリアクリルアミドゲル電気泳動および当該分野で公知の他の手段(例えば
、Ausubelら、前出を参照)のような標準的手段によって測定し得る。高度に精
製されたヒトテロメラーゼ、hTRTタンパク質、またはhTRT複合体が時には望まし
いが、実質的に精製された(例えば、少なくとも約75%均一)または部分的に精
製された(例えば、少なくとも約20%均一)ヒトテロメラーゼ、hTRTタンパク質
、またはhTRT複合体が多くの適用で有用であり、本発明によってまた提供される
ことが理解される。例えば、部分的に精製されたテロメラーゼは、テロメラーゼ
調節活性、および他の使用のための試験化合物をスクリーニングするのに有用で
ある(例えば、後出および前出参照;米国特許第5,645,986号参照)。
A)序
本発明は、ヒト疾患および疾患状態の処置のために有用なhTRTポリヌクレオチ
ド、ポリペプチドおよび抗体を提供する。本発明の組換えおよび合成hTRT遺伝子
産物(タンパク質およびmRNA)を用いて、細胞中のテロメラーゼ活性を生じさせ
または上昇させ、ならびにそれが所望でない細胞中のテロメラーゼ活性を阻害し
得る。従って、細胞中のテロメラーゼ活性(例えば、テロメラーゼ触媒活性、忠
実度、前進性(processivity)、テロメア結合等)の阻害、活性化または改変を
用いて、細胞の増殖能力を変化させ得る。例えば、悪性腫瘍細胞のような不死化
細胞におけるテロメラーゼ活性の低下は、細胞を有寿命性ものとし得る。逆に、
有寿命性細胞(例えば、ほとんどのヒト体細胞)におけるテロメラーゼ活性の増
加は、細胞の増殖能力を増加させ得る。例えば、それによりテロメア長を増加さ
せる皮膚線維芽細胞におけるhTRTタンパク質の発現の結果、線維芽細胞増殖能力
の増加を生じ;このような発現は創傷閉塞の年齢-依存性遅延化を遅延し得るか
または転地し得る(例えば、West, 1994, Arch. Derm. 130:87を参照)。
の存在、不存在、または量によって特徴付けられ、本明細書で開示される組成物
および方法を用いる処置に感受性である疾患および病的状態を処置するのに有用
である試薬および方法を提供する。これらの疾患は、以下により詳細に記載され
るように、ガン、細胞増殖の他の疾患(特に、老化の疾患)、免疫学的障害、不
妊症(または受精能)などを含む。
本発明は、腫瘍細胞におけるテロメラーゼ活性を低下させるため、およびガン
を処置するための方法および組成物を提供する。組成物は、アンチセンスオリゴ
ヌクレオチド、ペプチド、アンチセンスオリゴヌクレオチドまたは活性改変タン
パク質をコードする遺伝子治療ベクター、および抗hTRT抗体を含む。テロメラー
ゼ活性(テロメラーゼ陽性細胞)を発現するガン細胞(例えば、悪性腫瘍細胞)
は、内因性テロメラーゼ活性を低下または阻害することによって死滅化し得る。
さらに、テロメラーゼレベルは転移可能性のような疾患特徴に相関するので(例
えば、米国特許第5,639,613号;第5,648,215号;第5,489,508号;Panditaら, 19
96, Proc. Am. Ass. Cancer Res. 37:559)、テロメラーゼ活性におけるいずれの
低下も疾患状態まで癌の攻撃的性質を低下させ得る。(従来の介在の有効性を増
加する)より処置できる
本発明は、固体腫瘍および白血病を含む、広範なタイプのいずれのガンの処置
にも有用な組成物および方法を提供する。処置し得るガンのタイプは、限定され
ないが、:乳房、前立腺および結腸の腺ガン;肺の全ての形態の気管支原性ガン
;骨髄腫;黒色腫;肝ガン;神経芽腫;乳頭腫;アプドーマ;分離腫;鰓腫;悪
性類ガン腫症候群;類ガン腫心臓病;ガン腫(例えば、ウォーカーガン、基底細
胞ガン、基底有棘細胞ガン、ブラウン−ペアスガン、腺管ガン、エーリッヒ腫瘍
、上皮内ガン、クレブス2ガン、メルケル細胞ガン、粘液性ガン腫、非小細胞肺
ガン、燕麦細胞ガン、乳頭状ガン、硬性ガン、細気管支ガン、気管支原生ガン、
偏平上皮ガン、および移行上皮ガン)、組織球障害;白血病(例えば、B細胞性
白血病、混合細胞性白血病、ヌル細胞性白血病、T細胞性白血病、T細胞性慢性
白血病、HTLV-II関連白血病、リンパ性急性白血病、リンパ性慢性白血病、肥満
細胞性白血病、および骨髄様白血病);悪性組織球症;ホジキン病;免疫増殖小
;非ホジキンリンパ腫;形質細胞腫;細網内皮症;黒色腫;軟骨芽細胞腫;軟骨
腫;軟骨肉腫;線維腫;線維肉腫;巨大細胞腫;組織球腫;脂肪腫;脂肪肉腫;
中皮腫;粘液腫;粘液肉腫;骨腫;骨肉腫;ユーイング肉腫;骨膜腫;腺線維症
;腺リンパ腫;ガン肉腫;脊索腫;頭蓋咽頭腫;未分化胚細胞腫;過誤腫;間葉
腫;中腎腫;筋肉腫;エナメル上皮腫;セメント質腫;歯牙腫;奇形腫;胸腺腫
;栄養膜腫;腺ガン;腺腫;胆管腫;コレステリン腫;円柱腫;嚢胞腺ガン;嚢
胞腺腫;顆粒層腫;半陰陽性卵巣腫瘍;肝ガン;汗腺腫;島細胞腫;レイディッ
ヒ細胞腫;乳頭腫;セルトリ細胞腫;膜細胞腫;平滑筋腫;平滑筋肉腫;筋芽細
胞腫;筋細胞腫;筋肉腫;横紋筋腫;横紋筋肉腫;脳室上衣細胞腫;神経節細胞
腫;神経膠腫;髄芽細胞腫;髄膜腫;神経鞘腫;神経芽細胞腫;神経上皮腫;神
経線維腫;神経腫;傍神経節腫;非クロム親和性傍神経節腫;被角血管腫;好酸
球増加随半性血管類リンパ組織増殖症;血管腫硬化症;血管腫症;グロムス血管
腫;血管内皮腫;血管腫;血管周囲細胞腫;血管肉腫;リンパ管腫;リンパ管筋
肉腫;リンパ管肉腫;松果体腫;ガン肉腫;軟骨肉腫;葉状嚢肉腫;線維肉腫;
血管肉腫;平滑筋肉腫;白血肉腫;脂肪肉腫;リンパ管肉腫;筋肉腫;粘液肉腫
;卵巣ガン;横紋筋肉腫;肉腫(例えば、ユーイング肉腫、実験的肉腫、カポシ
肉腫;および肥満細胞肉腫);新生物(例えば、骨、乳房、消化系、結直腸、肝
臓、膵臓、下垂体、精巣、眼窩、頭部および頸部、中枢神経系、聴覚、骨盤、呼
吸管、および尿生殖器);神経線維腫症、および子宮頸部形成異常)を含む。本
発明は、例えば、hTRT、テロメラーゼ酵素、またはテロメラーゼ活性の脱調節(
例えば、異常に高い発現)によって、不死化または過剰増殖状態となった他の病
的の状態の処置のための有用な組成物および方法を提供する。
ベクター、およびテロメラーゼ陽性細胞の特異的死滅を生じる遺伝子治療ベクタ
ーを含む、ガンの予防のための組成物および方法を提供する。関連する局面にお
いて、後述する遺伝子置換治療法は、ガンについての遺伝子偏好を「処置する」
ために使用され得る。
本発明はまた、テロメラーゼまたはhTRT遺伝子産物の過少発現または過剰発現
によって特徴付けられる疾患または疾患状態(ガンに加えて)の処置に有用な組
成物および方法を提供する。例としては、細胞増殖の疾患、細胞老化から生じる
疾患(特に、加齢の疾患)、免疫学的障害、不妊症、免疫不全の疾患などが挙げ
られる。
かなり低いレベル)から生じる、減少したテロメア長(より若い細胞と比較して
)による細胞老化に関連する変化によって特徴付けられる。減少したテロメア長
および低下した複製能は後述のような疾患に寄与する。テロメラーゼ活性および
テロメア長は、例えば、細胞におけるhTRT遺伝子産物(タンパク質およびmRNA)
のレベルを増加させることによって増加し得る。hTRT発現が処置となり得る細胞
老化に関連する病的状態の部分的なリストには、アルツハイマー病、パーキンソ
ン病、ハンチントン病、および卒中;年齢関連疾患(例えば皮膚萎縮症、エラス
トリシスおよび皮膚皺形成)、皮脂腺過形成、老人性黒子、毛髪の白髪化および
脱毛、慢性皮膚潰瘍、および創傷治癒の年齢関連不全;変性関節病;骨粗鬆症:
(例えば、BおよびTリンパ球、単球、好中球、好酸球、好塩基球、NK細胞およ
びそれらの各始原細胞のような細胞が関与する)年齢関連免疫系不全;アテロー
ム性動脈硬化症、カルシウム沈着、血栓症、および動脈瘤を含む血管系の年齢関
連疾患;糖尿病、筋肉萎縮症、呼吸器疾患、肝臓およびGI管の疾患、代謝疾患、
内分泌腺疾患(例えば、下垂体および副腎の障害)、生殖疾患、および年齢関連
斑点変性が含まれる。これらの疾患および状態は、細胞中のhTRT遺伝子産物のレ
ベルを増加させて、テロメア長を増加させ、それにより細胞により大きな複製能
力を回復させるかまたは付与することによって処置され得る。このような方法は
エクスビボで培養した細胞またはインビボの細胞に対して実行され得る。1つの
実施態様において、細胞を、テロメラーゼを活性化し、そしてテロメアを長くす
るようまず処置し、次いで、hTRT遺伝子およびテロメラーゼ活性を不活化するよ
う処理する。好ましい実施態様において、テロメラーゼ活性は、分化に先立って
または分化の間に胚性の生殖細胞または幹細胞において本発明のベクターによっ
て生じる。
生殖系細胞(例えば、精原細胞、それらの祖先または子孫)は不定期に増殖し得
、そして高テロメラーゼ活性によって特徴付けられる。異常なまたは低下したレ
ベルのhTRT遺伝子産物は、例えば、精子の不適切または異常な産生を生じ、不妊
または生殖の障害に至る。従って、「テロメラーゼをベースとする」不妊は、テ
ロメラーゼレベルを増加させるための本明細書に記載した方法および組成物を用
いて処置され得る。同様に、テロメラーゼの阻害は、精子形成、卵子形成、およ
び精子および卵子の生存能に負に影響(impact)し得るので、本発明のテロメラ
ーゼ阻害性組成物は、生殖系列細胞におけるhTRT遺伝子産物レベルを低下させる
ために使用される場合、避妊効果を有し得る。
ゼ陽性細胞(例えば、活性化リンパ球および造血幹細胞)の増殖能力を減少させ
るに有用な方法および組成物を提供する。従って、本発明は、免疫抑制を行う手
段を提供する。逆に、本発明の方法および試薬は、処置的介入に先立って、低レ
ベルのテロメラーゼを発現するかまたはテロメラーゼを発現しない細胞(例えば
、幹細胞)におけるテロメラーゼ活性および増殖能力を増加させるに有用である
。
前記の議論から明らかなように、細胞のテロメラーゼのレベルまたはテロメラ
ーゼ活性の調節は、細胞の増殖能力に対して絶大な効果を有し得、従って、疾患
の処置において顕著な有用性を有する。やはり明らかなように、この調節は、テ
ロメラーゼ活性の減少または活性の増大のいずれであってもよい。本発明のテロ
メラーゼ調節分子は、多数のメカニズムにより作用し得る;これらのうちのいく
つかを、このサブセクションおよび以下のサブセクションに、処置剤を選択する
際に実施者を助けるために記載する。しかしながら、本出願人らは、本明細書に
記載した新規な処置剤化合物、組成物および方法についていずれかの特定の作用
メカニズムに限定する意図はない。
ニズムの組合せにより減少させ得る。1つのメカニズムは、テロメラーゼ活性を
低下させるためのhTRT遺伝子発現の低下である。この低下は、hTRT遺伝子のmRNA
への転写、プロセシング(例えば、スプライシング)、mRNAの核輸送または安定
性、hTRTタンパク質を産出するためのmRNAの翻訳、またはhTRTタンパク質の安定
性および機能のレベルにおけるものであり得る。別のメカニズムは、本明細書中
に開示した方法を用いて同定され得るか、あるいは本明細書に開示した組成物に
よって供される阻害性の核酸、ポリペプチドまたは他の薬剤(例えば、模倣物、
小分子、薬物およびプロドラッグ)を用いる、テロメラーゼの1またはそれ以上
の活性(例えば、逆転写酵素触媒活性、またはhTR結合活性)の干渉である。他
のメカニズムは、hTRおよび/またはテロメラーゼ会合タンパク質の隔離、およ
びその成分サブユニットからのテロメラーゼRNPの組立ての干渉を含む。関連す
るメカニズムにおいて、hTRTプロモーター配列は、トキシンをコードする遺伝子
に作動可能に連結され細胞に導入される;hTRT転写アクチベーターが細胞におい
て発現されるか、または活性化される場合、トキシンが発現され、その結果、特
定の細胞の死滅を生じる。
ように、低い忠実度合を有するhTRT変異型(すなわち、高い、例えば1%を超え
るエラー率を有するhTRT変異型)を導入することを含む。これらの異常な反復は
、テロメアタンパク質結合に影響し、そして染色体の再配置および異常に至り、
そして/または細胞死に至る。
たはメカニズムの組合せにより増大させ得る。これらは、細胞におけるhTRTの量
を増大させることを含む。通常、これは、hTRTポリペプチドをコードするポリヌ
クレオチドを、細胞中に導入することによって行われる(例えば、プロモーター
に作動可能に連結されたhTRT DNA配列を含む組換えにより産生されたポリペプチ
ド、または安定なhTRT mRNA)。あるいは、触媒的に活性なhTRTポリペプチドは
、それ自体、例えば、マイクロインジェクションまたは当該分野で公知の他の手
段によって、細胞または組織中に導入され得る。他のメカニズムにおいて、細胞
における内因性hTRT遺伝子からの発現またはhTRT遺伝子産物の安定性は、増大さ
せ得る。また、細胞におけるテロメラーゼ活性は、内因性テロメラーゼインヒビ
ターとテロメラーゼRNPとの、または内因性hTRT転写リプレッサーとhTRT遺伝子
との相互作用を干渉すること;hTRT転写アクチベーターの発現または活性を増大
させること;および本開示を精査して当業者に明らかな他の手段によって増大さ
せ得る。
1)TRTタンパク質およびペプチド
1つの実施態様において、本発明は、(例えば、注入、リポソーム媒介融合、
ヒドロゲルの腫瘍[例えば、黒色腫]表面への適用、ヘルペスウイルス構造タン
パク質VP22への融合または付着、および本明細書に記載されたおよび当該分野で
公知の他の手段によって)標的細胞中に直接的に導入され得るテロメラーゼ活性
を増大または減少させるテロメラーゼ調節ポリペプチド(すなわち、タンパク質
、ポリペプチド、およびペプチド)を提供する。第2の実施態様において、本発
明のテロメラーゼ調節タンパク質およびペプチドは、所望のタンパク質またはペ
プチドをコードする核酸(例えば、DNA発現ベクターまたはmRNA)を細胞中に導
入することによって、細胞において発現される。発現は、ベクターおよびプロモ
ーターの選択に依存して、構成的または誘導性のいずれかであり得る(下記の議
論を参照)。hTRTをコードするメッセンジャーRNA調製物は、一過性発現(例え
ば、テロメラーゼの一過性活性化)のみが所望である場合、特に有用である。細
胞中への核酸導入および発現のための方法は、当該分野で周知である(また、本
明細書の他の箇所、例えば、オリゴヌクレオチド、遺伝子治療方法のセクション
を参照)。
ロメラーゼ調節ポリペプチドが提供される。1つの実施態様において、ポリペプ
チドは、ヒトテロメリックDNAの合成(hTRのようなRNAテンプレートと組み合わ
せた)を指示し得る触媒的に活性なhTRTポリペプチドである。この活性は、例え
ば、TRAPアッセイのようなテロメラーゼ活性アッセイを用い、前記のように、測
定され得る。1つの実施態様において、ポリペプチドは、配列番号2の1132残基
の配列を有するか、またはその配列と実質的に同一の配列を有する完全長hTRTタ
ンパク質である。別の実施態様において、ポリペプチドは、配列番号2のhTRTタ
ンパク質の変異型(例えば、融合ポリペプチド、誘導体化ポリペプチド、短縮型
ポリペプチド、保存的に置換されたポリペプチド、活性が修飾されたポリペプチ
ドなど)である。融合または誘導体化タンパク質は、細胞膜を横切るポリペプチ
ドの能力を増大させるか、あるいはポリペプチドを特定された細胞タイプ(例え
ば、肝臓細胞または腫瘍細胞)または細胞区画(例えば、核区画)に優先的に送
達されるようにする標的化部分(targeting moiety)を含み得る。標的化部分の
例は、脂質テイル、アミノ酸配列(例えば、アンテナペディアペプチド)または
核局在化シグナル(NLS;例えば、Xenopusヌクレオプラスミン Robbinsら, 199
1, Cell 64:615)を含む。天然に存在するhTRTタンパク質(例えば、配列番号2
の配列またはそれと実質的に同一な配列を有する)は、細胞核で作用する。従っ
て、配列番号2の1またはそれ以上のサブ配列(例えば、残基193〜196(PRRR)お
よび残基235〜240(PKRPRR))は、核局在化シグナルとして作用するようである。
この小領域は、多くのNLSが、塩基性アミノ酸(KまたはR)から構成されるか
、あるいは3塩基性アミノ酸(KまたはR)およびHまたはPから構成される4
残基パターン;Pから始まり、3残基内に、4残基のうちに3つのKまたはR残
基を含有する塩基性セグメントが続くパターンを含むという観察(例えば、Naka
iら, 1992, Genomics 14:897を参照)に基づくNLSであるようである。これらの配
列のうちの1つまたは両方および/またはさらなる局所化配列の欠失は、核への
hTRT輸送に干渉し、そして/またはhTRTの代謝回転を増加させると予測され、そ
の核基質へのテロメラーゼの接近を妨げ、そして増殖能力を減少させるために有
用である。さらに、NSLを欠く変異型hTRTポリペプチドは、テロメア長を維持し
得ないためRNPに組み立て得る。何故ならば、得られる酵素が核に侵入し得ない
からである。
ロメラーゼ活性を増大させるために使用される場合、標的細胞においてテロメラ
ーゼRNA(例えば、hTR)とで会合する。1つの実施態様において、導入されたhT
RTポリペプチドは内因性hTRと会合して、触媒的に活性なRNP(例えば、hTRおよ
び配列番号2の配列を有する完全長ポリペプチドを含むRNP)を形成する。また
、このように形成されたRNPは、他のタンパク質(例えば、テロメラーゼ会合タ
ンパク質)と会合し得る。他の実施態様において、テロメラーゼRNP(hTRTタン
パク質、hTRおよび必要に応じて他の成分を含有する)は、複合体として標的細
胞に導入される。
、hTR)発現ベクターを同時にまたは引き続いて導入されるか、または前もって
導入された細胞(またはこの細胞の子孫)に導入される。この実施態様において
、hTRTタンパク質およびテロメラーゼRNAは、細胞において共発現され、そして
集合(assemble)してテロメラーゼRNPを形成する。好ましいテロメラーゼRNAは
、hTRである。細胞におけるhTRの発現に有用な発現ベクターは、前述されている
(米国特許第5,583,016号を参照)。さらに別の実施態様において、hTRTポリペ
プチドおよびhTR RNA(または均等物)は、インビトロで会合して複合体を形成
し、次いで、この複合体は、例えば、リポソーム媒介移入によって標的細胞に導
入される。
有用なhTRTポリペプチドを提供する。上記のように、これらの「阻害性」ポリペ
プチドは、直接的に、または組換え核酸の発現によって細胞に導入され得る。ペ
プチド模倣物、または非標準的アミノ酸(すなわち、遺伝コードによりコードさ
れる20アミノ酸またはそれらの通常の誘導体以外のアミノ酸)を含むポリペプチ
ドは、代表的には、直接的に導入されることが理解される。
必要とされる成分の隔離に由来から生じる。このような成分の例は、hTRTおよび
hTRである。従って、hTRに結合するが、テロメラーゼ触媒活性を有しないポリペ
プチドの投与は、細胞において内因性テロメラーゼ活性を低下させ得る。関連す
る実施態様において、hTRTポリペプチドは、hTR以外の細胞成分(例えば、1ま
たはそれ以上のテロメラーゼ会合タンパク質)に結合され得、それにより細胞に
おいてテロメラーゼ活性に干渉する。
RTタンパク質と、テロメラーゼ機能に必要な別の細胞成分(例えばhTR、テロメ
リックDNA、テロメラーゼ会合タンパク質、テロメア会合タンパク質、テロメア
、細胞周期制御タンパク質、DNA修復酵素、ヒストンまたは非ヒストン染色体タ
ンパク質など)の相互作用に(例えば、競合によって)干渉する。
発明の分子(例えば、ポリペプチド)を選択することにおいて、本明細書に記載
されるように、hTRTタンパク質の1またはそれ以上の保存されたモチーフを含む
分子が好ましくあり得る。これらの領域の進化論的保存は、これらのモチーフが
寄与するヒトテロメラーゼの適切な機能化において重要な機能を示し、従ってこ
のモチーフは、一般的には、hTRTタンパク質機能を変化させて、本発明の変異型
hTRTタンパク質を作製するための有用な部位である。従って、保存されたモチー
フ変異を有する変異型hTRTポリペプチドは、本発明のいくつかの適用に特に有用
である。
(例えば、代表的には、内因レベルより少なくとも2倍多い、よりしばしば、少
なくとも約10倍〜約100倍)の細胞への導入によって抑制される。この大量のhTR
Tは、フィードバックループを介して作用して、hTRT遺伝子の転写、hTRTプレmRN
Aのプロセシング、hTRT mRNAの翻訳、またはテロメラーゼRNPの組立ておよび輸
送を阻害する。
a)アンチセンス構築物
本発明は、hTRT遺伝子産物の発現をインビトロまたはインビボで低下させるた
めに使用され得る、方法およびアンチセンスオリゴヌクレオチドまたはポリヌク
レオチド試薬を提供する。本発明のアンチセンス試薬の標的細胞への投与は、テ
ロメラーゼ活性の低下を生じ、そして高テロメラーゼ活性によって特徴付けられ
る疾患(例えば、ガン)の処置に特に有用である。いずれかの特定のメカニズム
に限定する意図はないが、アンチセンスオリゴヌクレオチドは、センスhTRT mRN
Aに結合し、センスhTRT mRNAの翻訳に干渉すると考えられている。あるいは、ア
ンチセンス分子は、hTRT mRNAをヌクレアーゼ消化に対して感受性とし、転写に
干渉し、プロセシング、局在化またはそうでなければRNA前駆体(「プレmRNA」
)に干渉し、hTRT遺伝子からのmRNAの転写を抑制し、あるいはいくつかの他のメ
カニズムを介して作用し得る。しかし、アンチセンス分子がhTRT発現を低下させ
る特定のメカニズムは、重要ではない。
遺伝子から転写されるmRNA由来の配列に特異的にハイブリダイズする、少なくと
も7〜10〜代表的には20またはそれ以上のヌクレオチドのアンチセンス配列を含
む。よりしばしば、本発明のアンチセンスポリヌクレオチドは、約10〜約50ヌク
レオチド長、または約14〜約35ヌクレオチド長である。他の実施態様において、
アンチセンスポリヌクレオチドは、約100ヌクレオチド未満または約200ヌクレオ
チド未満のポリヌクレオチドである。一般に、アンチセンスポリヌクレオチドは
、安定な二重鎖を形成するに十分な長さであるが、所望であれば、インビボに投
与するに、十分に短く(送達の様式に応じて)あるべきである。標的配列への特
異的ハイブリダイゼーションに必要なポリヌクレオチドの最小の長さは、とりわ
け、いくつかの因子(例えばG/C含有量、ミスマッチ塩基の位置(もしあれば)
、標的ポリヌクレオチドの集団と比較した場合の配列の独自性の程度、およびポ
リヌクレオチドの化学的性質(例えば、メチルホスホネート骨格、ペプチド核酸
、ホスホロチオエート))に依存する。
列は、標的hTRT mRNA配列と実質的に相補的である。特定の実施態様において、
アンチセンス配列は、標的配列に正確に相補的である。しかし、アンチセンスポ
リヌクレオチドはまた、hTRT RNAまたはその遺伝子に対応する関連標的配列への
特異的結合が、ポリヌクレオチドの機能的特性として保持される限り、ヌクレオ
チドの置換、付加、欠失、トランジション、転位、または修飾、あるいは他の核
酸配列または非核酸部分を含み得る。
な配列(例えば、二次構造を比較的欠く配列)に相補的である。これは、例えば
、MFOLDプログラム(Genetics Computer Group, Madison, WI)を用いて、予測さ
れるRNA二次構造を解析し、そして当該分野で公知のようにインビトロまたはイ
ンビボで試験することによって決定され得る。hTRT機能のアンチセンス抑制につ
いて、細胞において試験され得るオリゴヌクレオチドの例は、配列番号1の配列
の以下の位置:40-60;260-280;500-520;770-790;885-905;1000-1020;1300
-1320;1520-1540;2110-2130;2295-2315;2450-2470;2670-2690;3080-3110
;3140-3160;および3690-3710にハイブリダイズし得る(すなわち、実質的に相
補的であり得る。)オリゴヌクレオチドである。効果的なアンチセンス組成物を
同定するために有用な別の方法は、オリゴヌクレオチドの組合せ整列(combinat
orial array)を使用する(例えば、Milnerら, 1997, Nature Biotechnology 15
:537)。
列に加えて)、配列を有するアンチセンスポリヌクレオチドを提供する。この場
合、アンチセンス配列は、より長い配列のポリヌクレオチド内に含まれる。別の
実施態様において、ポリヌクレオチドの配列は、アンチセンス配列から実質的に
なるか、あるいはアンチセンス配列である。
成する任意の適切な方法(例えば、化学合成および本明細書に開示された組換え
法)を用いて作製され得る。1つの実施態様において、例えば、本発明のアンチ
センスRNA分子は、デノボ(de novo)化学合成によって、あるいはクローニング
によって調製され得る。例えば、hTRT mRNAにハイブリダイズするアンチセンスR
NAは、ベクター(例えば、プラスミド)中のプロモーター作動可能に逆方向に連
結したhTRT DNA配列(例えば、配列番号1、またはそのフラグメント)を、挿入
(連結)することによって作製され得る。プロモーターならびに、好ましくは終
止シグナルおよびポリアデニル化シグナルが適切に配置される場合、非コード鎖
に対応する挿入された配列の鎖が転写され、そして本発明のアンチセンスオリゴ
ヌクレオチドとして作用する。
(哺乳動物およびヒトを含む)においてテロメラーゼ活性を阻害するために使用
され得る。例えば、以下のホスホロチオエートアンチセンスオリゴヌクレオチド
はテロメラーゼ活性を阻害するために使用され得る:
よびB;A、B、CおよびD;ならびにA、CおよびDの混合物は、1日当たり
1回、7日間処理した場合、293個の細胞においてテロメラーゼ活性を阻害した
。また、アンチセンスhTR分子(5'-GCTCTAGAATGAAGGGTG-3'がオリゴヌクレオチ
ドA、BおよびC;A、BおよびD;ならびにAおよびCと併用された場合、阻
害が観察された。このような実験で有用なコントロールオリゴヌクレオチドは:
決定するために、本発明のアンチセンスオリゴヌクレオチドのセットを用いてス
キャンを行い得る。1つの例示的なセットは、hTRT mRNAにわたり(span)、そ
してあるものから次のものへ15ヌクレオチドだけずれる30量体オリゴヌクレオチ
ドである(すなわち、ON1は位置1-30に対応し、TCCCACGTGCGCAGCAGGACGCAGCGCTG
Cであり、ON2は位置16-45に対応し、GCCGGGGCCAGGGCTTCCCACGTGCGCAGCであり、O
N3は位置31-60に対応し、GGCATCGCGGGGGTGGCCGGGGCCAGGGCTであり、そしてmRNA
の最後まで同様に続く)。このセットの各メンバーは、本明細書に開示するよう
に阻害活性について試験され得る。次いで、目的の条件下で阻害活性を示すオリ
ゴヌクレオチドは、目的の領域を同定し、そして目的の領域に対応する本発明の
他のオリゴヌクレオチド(すなわち、8量体、10量体、15量体など)が、適用の
ための好ましい活性を有するオリゴヌクレオチドを同定ために試験され得る。
A AND DNA, (1988), D.A. Melton編, Cold Spring Harbor Laboratory, Cold Sp
ring Harbor, NY)を参照。また、Dagleら, 1991, Nucleic Acids Research, 19:
1805も参照。アンチセンス処置の概説については、例えば、Uhlmannら, Chem. R
eviews, 90:543-584 (1990)を参照。
本発明は、(例えば、hTRT RNAの折り畳まれた領域(folded region)におい
て、またはhTRT遺伝子において)二本鎖または二重鎖のhTRT核酸に結合し、三重
らせん含有または「三重鎖」の核酸を形成するオリゴヌクレオチドおよびポリヌ
クレオチド(例えば、DNA、RNA、PNAなど)を提供する。三重らせんの形成は、
例えば、hTRT遺伝子の転写を妨げることによってhTRT発現の阻害を生じ、従って
、細胞においてテロメラーゼ活性を低下させるかまたは消失させる。いずれかの
特定のメカニズムに限定する意図はないが、三重らせん対合は、ポリメラーゼ、
転写因子、または調整分子の結合が起こるに十分に、二重らせんが開く能力を弱
めると考えられる。
形成の塩基対合則(例えば、Chengら, 1988, J. Biol. Chem. 263: 15110;Ferr
inおよびCamerini-Otero, 1991, Science 354: 1494;Ramdasら, 1989, J. Biol
. CHem. 264:17395;Strobelら, 1991, Science 254:1639;およびRigasら, 198
6, Proc. Natl. Acad. Sci. U.S.A.83:9591;これらのそれぞれを本明細書中で
参考として援用する)ならびにhTRT mRNAおよび/または遺伝子配列を用いて構
築される。代表的には、本発明の三重鎖形成オリゴヌクレオチドは、hTRT RNAま
たは遺伝子中の特定配列に「相補的な」、約10から少なくとも約25ヌクレオチド
またはそれ以上の特定配列を含む(すなわち、安定な三重らせんを形成するに十
分長いが、所望であれば、送達の様式に応じて、インビボに投与するに十分短い
)。この意味で、「相補的な」とは、安定な三重らせんを形成し得ることを意味
する。1つの実施態様において、オリゴヌクレオチドは、hTRT遺伝子の調節領域
(例えば、hTRT5'フランキング配列、プロモーターおよびエンハンサー)、ある
いは転写開始部位(例えば、転写開始部位から-10と+10と間)に特異的に結合す
るように設計される。三重鎖DNAを用いる最近の処置の進歩の概説については、G
eeら,1994, MOLECULAR AND IMMUNOLOGIC APPROACHES(Huber およびCarr), Fut
ura Publishing Co. Mt Kisco NY、およびRinislandら, 1997, Proc. Natl. Aca
d. Sci. USA 94:5854(共に本明細書中で参考として援用する)。を参照。
本発明はまた、テロメラーゼ活性の阻害に有用なリボザイムを提供する。本発
明のリボザイムはhTRT mRNAに結合し、それを特異的に切断し、不活化する。有
用なリボザイムはhTRT mRNAに相補的な5'および3'末端配列を含み得、そして
本明細書に開示されるhTRT mRNA配列に基づいて当業者によって設計され得る(P
CT国際公開WO 93/23572参照、前掲)。本発明のリボザイムは、グループIイン
トロンリボザイム(Cech, 1995, Biotechnology 13:323)、およびハンマーヘッ
ドリボザイムの他のもの(Edgington, 1992, Biotechnology 10:256)の特徴を有
するものを含む。
む。本発明におけるテロメラーゼ活性のリボザイム媒介阻害のための他の最適切
断部位は、PCT国際公開WO 94/02595およびWO 93/23569(共に、本明細書中で参
考として援用する)に記載されたものを含む。切断部位を含有する標的hTRT遺伝
子の領域に対応する長さが15および20リボヌクレオチドの間の短いRNAオリゴヌ
クレオチドは、オリゴヌクレオチドをより望ましくし得る二次構造の特徴につい
て評価され得る。切断部位の適合性はまた、リボヌクレアーゼ保護アッセイを用
いて相補的オリゴヌクレオチドとのハイブリダイゼーションへの接近性を試験す
ることによって、あるいは当該分野で公知の標準的な手法に従ってインビトロリ
ボザイム活性について試験することによって、評価され得る。
記載されているように、アンチセンスおよびリボザイム機能を単一オリゴヌクレ
オチドにおいて組み合わせ得る。さらに、リボザイムは、本発明の例示的なアン
チセンスオリゴヌクレオチドの記載と組み合わせた、前記のように、1以上の修
飾されたヌクレオチドまたはヌクレオチド間の修飾された結合を含み得る。
または患者に導入される。別の実施態様において、遺伝子治療法が、エクスビボ
またはインビボでの標的細胞におけるリボザイムの発現のために使用される。
典型的には、本発明の治療方法は、インビボ生理学的条件下でテロメラーゼ活
性を阻害または刺激するように機能し、かつ治療的効果のために十分な時間の間
その条件下で比較的安定であるオリゴヌクレオチドの投与を含む。前記したよう
に、修飾された核酸は、このような安定性を付与することにおいて、ならびに所
望の組織、器官、または細胞へのオリゴヌクレオチドの送達を標的化するために
有用であり得る。
的に、あるいは本明細書に記載されるようなリポソーム、イムノリポソーム、バ
リスティックス、細胞への直接取り込みなどを含む、核酸の細胞への導入手段に
よって間接的に送達され得る。疾患の治療のために、本発明のオリゴヌクレオチ
ドは、治療的有効量で患者に投与される。治療的有効量は、疾患の徴候を寛解す
るのに、あるいは例えば、TRAPアッセイもしくはテロメラーゼの生物学的機
能の他の適切なアッセイを用いて測定できるように、標的細胞におけるテロメラ
ーゼ活性を調節させるのに十分な量である。治療目的のためのオリゴヌクレオチ
ドの送達に有用な方法は、本明細書中で参考として援用する米国特許第5,272,06
5号に記載されている。薬学的に活性な化合物の投与の他の詳細は下記にて提供
する。他の実施態様において、オリゴ−およびポリ−ヌクレオチドは、本発明の
遺伝子治療および組換えDNA発現プラスミドを用いて送達され得る。
遺伝子治療とは、それが導入される(典型的には)哺乳動物細胞において医学
的に有用な表現型効果を生じる外因性ポリヌクレオチドの導入をいう。1つの局
面において、本発明は、テロメラーゼ関連状態の処置のための遺伝子治療法およ
び組成物を提供する。例示的な実施態様において、遺伝子治療は、hTRT遺伝子産
物(例えば、テロメラーゼ活性を増加させるための配列番号2の配列を有するhT
RTポリペプチドに実質的に類似したhTRTタンパク質)または活性を低下させるた
めの阻害性hTRTポリペプチドを発現するか、hTRT遺伝子またはmRNA配列を有する
核酸(例えば、テロメラーゼ活性を低下させるためのアンチセンスRNA)を発現
するか、hTRT遺伝子産物の発現に影響するポリペプチドまたはポリヌクレオチド
(例えば、テロメラーゼ活性を低下させるためのhTRT mRNAに指向するリボザイ
ム)を発現するか、あるいは内因性hTRT配列を置換または破壊する(例えば、そ
れぞれ、遺伝子置換および「遺伝子ノックアウト」)ベクターを細胞に導入する
ことを含む。多数の他の実施態様が、本明細書の開示を考慮して当業者に明らか
である。1つの実施態様において、hTRをコードするベクターもまた導入される
。他の実施態様において、テロメラーゼ会合タンパク質をコードするベクターも
またhTRのためのベクターと共にまたはそれをともなうことなく導入される。
明のhTRT発現系に関連して上記したものを含む。遺伝子治療ベクターが本開示で
記載されているようなプロモーターおよび他の調節またはプロセシング配列を含
み得ることは当業者によって理解される。通常、ベクターは、オリゴリボヌクレ
オチドの転写を駆動するように働くプロモーターおよび、必要に応じて(プロモ
ーター配列内に含まれるいずれかのものとも別の)エンハンサー、ならびに所望
であれば、エビソーム維持または染色体組込みおよび高レベル転写を提供する他
の調節エレメントを含む。遺伝子治療に有用なプラスミドは、選択マーカー、同
定領域、および他の配列のような他の機能的エレメントを含み得る。さらなる配
列は、細胞外部または細胞内の両方における安定性の付与、特定の器官、組織、
または細胞集団へのhTRTヌクレオチド配列(センスまたはアンチセンス)の送達
の標的化、細胞への侵入の媒介、細胞の核への侵入の媒介、および/または核DN
A内への組込みの媒介において役割を有し得る。例えば、アプタマー様DNA構造、
または他のタンパク質結合部位を用いて、細胞表面レセプター、またはレセプタ
ーへ結合する血清タンパク質へのベクターの結合を媒介させ、それにより細胞へ
のDNA導入の効率を増大させ得る。他のDNA部位および構造は、核膜中のレセプタ
ー、あるいは核に進みそれによりベクターの核取り込みを促進する他のタンパク
質に直接的にまたは間接的に結合し得る。
えば、患者への投与前のベクターの増殖のためにベクター中に複製起点を含ませ
ることは有用である。しかし、宿主染色体DNAに組み込まれるか、あるいは宿主m
RNAまたはDNAに結合するようにベクターを設計すれば、投与前に複製起点をしば
しば除去できる。いくつかの状況(例えば、腫瘍細胞)において、外因性DNAを
導入細胞に安定に取り込ませる必要はないであろう。なぜなら、一過性発現は腫
瘍細胞を死滅させるのに十分であり得るからである。
の組換え遺伝子での相同組換えによる置換)のための方法および試薬を提供する
。相同組換えによる組込みのために特別に設計したベクターを使用することもで
きる。相同組換えを最適化するための重要な因子は、染色体配列に対する配列同
一性の程度および相同性の長さを含む。相同組換えを媒介する特異的配列もまた
重要である。何故ならば、組込みは転写的に活性なDNAでかなり容易に起こるか
らである。相同標的化構築物を構築するための方法および材料は例えばMansour
ら, 1988, Nature 336:348;Bradleyら, 1992, Bio/Technology 10:534によって
記載されている。また、米国特許第5,627,059号;第5,487,992号;第5,631,153
号;および第5,464,764号も参照のこと。1つの実施態様において、遺伝子置換
処置は、調節すべきhTRT遺伝子の発現を制御する調節配列の全てまたは一部を改
変または置換することを含む。例えば、hTRTプロモーター配列(例えば、配列番
号6に見い出されるような)は、(hTRT発現を低下させるか、あるいは転写調節
部位を廃止させるために破壊され得、あるいは外因性プロモーターは、(例えば
、hTRT発現を増加させるために)置換され得る。
れたベクターを用いる内因性hTRT遺伝子の相同組換えによる欠失または破壊)の
ための方法および試薬を提供する。遺伝子ノックアウトにおいて、標的化される
配列は調節配列(例えば、hTRTプロモーター)、またはRNAもしくはタンパク質
コード配列であり得る。内因性遺伝子の発現を変化させるための相同組換えの使
用は米国特許第5,272,071号(および上記で引用した米国特許)、WO 91/09955、
WO 93/09222、WO 96/29411、WO 95/31560、およびWo 91/12650に詳細に記載され
ている。また、Moynahanら, 1996, Hum. Mol. Genet. 5:875参照。
のhTRT遺伝子プロモーターを用いて、テロメラーゼ陽性細胞を特異的に死滅させ
るか、あるいはテロメラーゼ陰性細胞のテロメラーゼ陽性状態への形質転換を妨
げるための方法を提供する。実施例14に示すように、hTRTプロモーター配列は、
このプロモーターの活性化がレポーター遺伝子によってコードされるタンパク質
の発現が生じるように、レポーター遺伝子に作動可能に連結させられ得る。レポ
ータータンパク質の代わりに、コードされるタンパク質が細胞に対して毒性であ
る場合、プロモーターの活性化は細胞の病的状態または死滅に至る。本発明の1
つの実施態様において、毒性タンパク質をコードする遺伝子に作動可能に連結し
たhTRTプロモーターを含むベクターは、ヒト細胞(例えばヒト患者の細胞)のよ
うな細胞に導入され、hTRTプロモーター活性化因子が発現されるガン細胞のよう
な細胞の細胞死を生じる。関連する実施態様において、コードされるタンパク質
はそれ自体細胞に対して毒性ではないが、細胞を他の非毒性薬物に対して感受性
にする活性をコードする。例えば、hTRT−プロモーター−ヘルペスチミジンキナ
ーゼ(TK)遺伝子融合構築物を腫瘍細胞に導入し、そしてガンシクロビル(gancyc
lovir)またはその等価物を投与することによって腫瘍を処置し得る(例えば、Mo
oltonおよびWells, 1990, J. Nat'l Canc. Inst. 82:297参照)。当該分野では、
本開示を考慮して当業者により本発明に従って改変され、そして適用され得る(
hTRT以外のプロモーター配列を用いる)多数の他の適切な毒性のまたは潜在的に
毒性のタンパク質および系が知られている。
は組織に導入され得る。エクスビボ治療のために、ベクターは、細胞、例えば、
患者から採取され、同一患者に自己移植で戻すためにクローン的に増殖させられ
る幹細胞に導入され得る(例えば、その開示が本明細書中で参考として採用され
る米国特許第5,399,493号および第5,437,994号参照)。標的細胞のテロメラーゼ
活性を増加させることを狙ったhTRT遺伝子治療のために標的化され得る細胞とし
ては、胚幹細胞または胚細胞、前記した特に霊長類またはヒト細胞、造血幹細胞
(AIDSおよび化学療法後)、血管内皮細胞(心臓および大脳血管病)、皮膚線維
芽細胞および基底皮膚ケラチノサイト(創傷治癒および火傷)、軟骨細胞(関節
炎)、脳の膠星状細胞および小膠細胞(アルツハイマー病)、骨芽細胞(骨粗鬆
症)、網膜細胞(眼病)、および膵臓島細胞(I型糖尿病)および下記表8〜1
7に列挙した細胞のいずれか、ならびに分裂することが知られている任意の他の
細胞タイプが挙げられるが、これらに限定されない。
異体)に作動可能に連結した誘導性プロモーターは、インビボまたはインビトロ
で細胞の増殖能力を調節するために用いられる。特別の実施態様において、例え
ば、誘導性プロモーターの制御下にあるhTRT発現ベクターでトランスフェクトし
たインスリン−産生膵臓細胞が患者に導入される。次いで、細胞がそれまで可能
であったよりも増殖することを可能にするプロモーター活性化剤(例えば、テト
ラサイクリン)の患者への投与によって、細胞の増殖能力を制御することができ
る。次いで、治療する医師によって望まれるように、細胞増殖が停止され、継続
され、あるいは再開される。
hTRT配列を有する免疫原性ペプチドおよびポリペプチドは、患者において抗hT
RT免疫応答を誘発し得る(すなわち、ワクチンとして作用し得る)。例示的な免
疫原性hTRTペプチドおよびポリペプチドは後記実施例6および8に記載される。
免疫応答は、目的のポリペプチドをコードするプラスミドベクターの送達(すな
わち、「ネイクドDNA」の投与)によって惹起させ得る。目的の核酸は、注入、
リポソーム、または他の投与手段によって送達することができる。1つの実施態
様において、被検体においてテロメラーゼ発現細胞に対するクラスI MHC拘束細
胞傷害性リンパ球応答を誘発する免疫様式が選択される。一旦免疫化されれば、
個体または動物は、高レベルのテロメラーゼを発現する細胞(例えば、悪性細胞
)に対して高い免疫応答を誘発する。
者に投与されて(例えば、受動免疫化)、テロメラーゼ発現細胞に対する免疫応
答を達成し得る。
関連する局面において、本発明は、hTRTオリゴおよびポリヌクレオチド、ポリ
ペプチド、および抗体、アゴニスト、アンタゴニスト、またはインヒビターを単
独で、または安定化化合物、希釈剤、担体、または別の成分または薬剤のような
他の薬剤と組み合わせて含む薬学的組成物を提供する。
、緩衝化生理食塩水、デキストロース、および水を含むが、それらに限定されな
い)中で投与され得る。これらの分子のいずれも、適切な賦形剤、アジュバント
、および/または薬学的に受容可能なキャリアーと混合する薬学的組成物中にて
、単独で、あるいは他の薬剤、薬物、またはホルモンと組み合わせて患者に投与
され得る。本発明の1の実施態様において、薬学的に受容可能なキャリアーは薬
学的に不活性である。
としては、局所、動脈内(例えば、腫瘍に直接的に)、筋肉内、皮下、髄内、ク
モ膜下腔内、脳室内、静脈内、腹腔内、または鼻孔内の投与が挙げられる。活性
成分に加えて、これらの薬学的組成物は、賦形剤または薬学的に使用できる製剤
への活性化合物のプロセシングを促進する他の化合物を含む適切な薬学的に受容
可能なキャリアーを含有し得る。処方および投与のための技術のさらなる詳細は
「REMINGTON'S PHARMACEUTICAL SCIENCES」 (Maack Publishing Co., Easton, PA
)の最終版に見い出され得る。
で周知の薬学的に受容可能なキャリアを用いて処方され得る。このような担体は
、薬学的組成物が患者による摂取に適した錠剤、丸剤、糖衣剤、カプセル、液体
、ゲル、シロップ、スラリー、懸濁物などに処方されることを可能とする。PCT
国際公開WO 93/23572参照。
より得られた混合物を粉砕し、所望ならば、錠剤または糖衣剤のコアを得るため
に、適切なさらなる化合物を添加した後、顆粒の混合物をプロセシングすること
を介して得られ得る。適切な賦形剤は炭水化物またはタンパク質充填剤であり、
以下を含むが、それらに限定されない:ラクトース、スクロース、マンニトール
、またはソルビトールを含む糖;トウモロコシ、コムギ、イネ、ジャガイモ、ま
たは他の植物由来のデンプン;メチルセルロース、ヒドロキシプロピルメチルセ
ルロース、またはカルボキシメチルセルロースナトリウムのようなセルロース;
ならびにアラビアゴムおよびトラガカントゴムを含むゴム;ならびにゼラチンお
よびコラーゲンのようなタンパク質。所望ならば、架橋されたポリビニルピロリ
ドン、寒天、アルギン酸またはその塩(例えば、アルギン酸ナトリウム)のよう
な崩壊剤または可溶化剤が添加され得る。
これはまた、アラビアガム、タルク、ポリビニルピロリドン、カルボポルゲル、
ポリエチレングリコール、および/または二酸化チタン、ラツカー溶液、および
適切な有機溶媒または溶媒混合液をも含有し得る。製品同定のため、または活性
化合物の量(すなわち、用量)を特徴付けるために、染料または色素が錠剤また
は糖衣剤に添加され得る。
プセル、ならびにゼラチンおよびコーティング(例えば、グリセロールまたはソ
ルビトール)よりなるソフト封着カプセルを含む。押込ばめカプセルは、ラクト
ースまたは澱粉のような充填剤またはバインダー、タルクまたはステアリン酸マ
グネシウムのような潤滑剤、および所望により安定化剤と混合した活性な成分を
含有し得る。ソフトカプセルでは、活性化合物は、安定化剤とともにまたはとも
なわずに脂肪油、流動パラフィンまたは液状ポリエチレングリコールのような適
切な液体に溶解または懸濁され得る。
発明の薬学的組成物は水溶液、好ましくはハンクスの溶液、リンゲル溶液、また
は緩衝化生理食塩水のような生理学的に適合する緩衝液中に処方され得る。水性
注射懸濁物は、懸濁物の粘度を増加させる物質(例えば、ナトリウムカルボキシ
メチルセルロース、ソルビトール、またはデキストラン)を含有し得る。さらに
、活性化合物の懸濁物は、適切な油状注射懸濁物として調製され得る。適切な親
油性溶媒またはビヒクルは、ゴマ油のような脂肪酸、あるいはオレイン酸エチル
またはトリグリセリドのような合成脂肪酸エステル、またはリポソームを含む。
所望により、懸濁物は、高濃度溶液の製剤を可能にする安定化剤または化合物の
溶解度を増加させる適切な薬剤または試薬を含有し得る。
透剤が処方物中で使用される。このような浸透剤は一般に当該分野で公知である
。
的な混合、溶解、顆粒化、糖衣剤作製、水簸、乳化、カプセル化、包括、または
凍結乾燥の手段によって)で製造され得る。
イン酸、コハク酸等を含むが、それらに限定されない多くの酸を用いて形成され
得る。塩は、対応する遊離塩基形態である水性溶媒または他のプロトン性溶媒に
より可溶性である傾向にある。他の場合において、好ましい調製物は、使用に先
だって、緩衝液と組み合わせた、4.5〜5.5のpH範囲の1mM-50mMヒスチジン、0.1
%〜2%スクロース、2%〜7%マンニトール中の凍結乾燥粉体であり得る。
された後、それらは適切な容器に入れられ、そして示された状態の治療のために
標識され得る。ヒトテロメラーゼタンパク質および核酸の投与のために、このよ
うな標識は投与の量、頻度、および方法を含む。
成するのに有効な量で含有される組成物を含む。「治療的有効量」または「薬理
学的有効量」は十分に認識されているフレーズであり、意図される薬理学的結果
を生じるのに有効な薬剤の量をいう。従って、治療的有効量は、処置されるべき
疾患の徴候を軽減するのに十分な量である。所定の適用のための有効量(例えば
、治療的有効量)を確認する1つの有用なアッセイは、標的細胞におけるテロメ
ラーゼ活性に対する効果を測定することである。実際に投与される量は、処置が
適用されるべき個体に依存し、好ましくは、所望の効果が顕著な副作用をともな
うことなく達成されるように最適化された量である。治療的有効用量の決定は十
分に当業者の能力内にある。
の適切な動物モデルのいずれかにおいて、最初に見積もられ得る。動物モデルは
また、所望の濃度範囲および投与経路を達成するために用いられる。次いで、こ
のような情報を用いて、ヒトにおける投与に有用な用量および経路を決定するこ
とができる。
プチド、抗体、オリゴまたはポリヌクレオチド、アゴニスト、またはアンタゴニ
ストの量をいう。このような化合物の治療効果および毒性は、細胞培養または実
験動物における標準的な薬学的手順(例えば、ED50、集団の50%において治療的
に有効な用量;およびLD50、集団の50%に対して致死的である用量)によって決
定され得る。治療効果と毒性効果との間の用量比は治療係数であり、それは比率
ED50/LD50として表され得る。大きな治療係数を呈する薬学的組成物が好ましい
。細胞培養アッセイおよび動物実験から得られたデータが、ヒトでの使用のため
の量の範囲を公式化するのに使用される。このような化合物の用量は、好ましく
は、毒性をほとんどまたは全くともなわないED50を含む循環濃度の範囲内にある
。この用量は、使用される投与形態、患者の感受性、および投与経路に依存して
この範囲内で変化する。
れる。用量および投与は、十分なレベルの活性部分を提供するか、または所望の
効果を維持するように調整される。考慮され得るさらなる因子としては、疾患状
態の重症度(例えば、腫瘍のサイズおよび位置;患者の年齢、体重、および性別
;投与の食餌制限時間、および頻度、薬物組合せ、反応感受性、および治療に対
する耐性/応答)が挙げられる。特定の処方物の半減期およびクリアランス速度
に応じて、持続作用性薬学的組成物は、3〜4日毎に、毎週、または2週間に1
回、投与され得る。特定の用量および送達の方法に関するガイダンスは文献に提
供されている(本明細書中で参考として援用する米国特許第4,657,760号;第5,2
06,344号;および第5,225,212号参照)。当業者は、典型的には、タンパク質ま
たはそれらのインヒビターよりもヌクレオチドについての異なる処方物を使用す
る。同様に、ポリヌクレオチドまたはポリペプチドの送達は特定の細胞、状態、
位置などに対して特異的であり得る。
前記で議論したように、ほとんどの脊椎動物細胞は、培養において限定された
数の分裂(例えば、50〜100分裂)の後に老化する。しかしながら、ある変異細
胞は、培養中に無限に分裂し得(例えば、HeLa細胞、293細胞)、そしてこの理
由により、研究および産業的適用に有用である。通常、これらの不死化細胞株は
自然発生的に生じる腫瘍に由来するか、あるいは照射または腫瘍誘導ウイルスも
しくは化学物質にさらすことによる形質転換に由来する。あいにく、分化した細
胞機能を示す細胞株(特にヒト細胞株)の限定的選択しか利用できない。さらに
、現在利用可能な不死化細胞株は染色体異常(例えば、異数性、遺伝子再編成、
または変異)によって特徴付けられる。さらに、多くの長期間樹立細胞株は比較
的未分化である(例えば、それらは特定の組織または器官をユニークに特徴付け
る種類の高度に特殊化した産物を産生しない)。従って、不死化細胞(特にヒト
細胞)を生成する新しい方法に対する必要性がある。不死化細胞についての1つ
の用途は、天然タンパク質および組換えタンパク質(例えば、エリスロポエチン
、ヒト成長ホルモン、インスリン等のような治療的ポリペプチド)、または抗体
の生産においてであり、そのために安定で遺伝的に正常な細胞株が好適である。
いくつかの組換えタンパク質の生産について、特殊化された細胞型もまた好適で
あり得る(例えば、ヒトインスリンの産生のための膵臓細胞)。さらには不死化
細胞について、または(非改変細胞と比較して)増大した増殖能力を有する死ぬ
べき運命の細胞でさえ、別の用途は、遺伝子治療のため、または疾患もしくは損
傷細胞または損傷組織の置換のための患者への導入である。例えば、本発明の組
換えhTRT遺伝子またはポリペプチドを含有するまたは発現する自己免疫細胞を、
攻撃的ガン治療(例えば全身照射)の後に、患者における細胞置換のために使用
し得る。不死化細胞についての別の用途は、治療的用途のための「人工」組織ま
たは器官(例えば、皮膚)のエクスビボ産生のためである。このような細胞につ
いて別の用途は、テロメラーゼ阻害性薬物のような薬物のスクリーニングまたは
有効化のため、あるいはワクチンまたは生物学的試薬の生産における使用のため
である。本発明の細胞のさらなる用途は当業者に明らかである。
細胞においてテロメラーゼ活性を増加させることによって作成される。テロメラ
ーゼ活性を増加させるための本明細書に開示した任意の方法が使用され得る。従
って、1つの実施態様において、細胞は、細胞中のhTRTポリペプチドの量を増加
させることによって不死化される。1つの実施態様において、hTRTレベルは、(
時々は好ましい安定なトランスフェクションにより)hTRT発現ベクターを細胞に
導入することによって増大される。先に議論したように、hTRTコード配列は、通
常、細胞中で誘導性または構成的に活性であり得るプロモーターに作動可能に連
結される。
成的に発現されるプロモーター、例えば、配列番号6の配列)に作動可能に連結
している)のポリペプチドをコードする配列からなるポリヌクレオチドを細胞に
導入する。1つの実施態様において、ポリヌクレオチドは配列番号1の配列を含
む。好ましくは、ポリヌクレオチドはポリアデニル化および終結シグナルを含む
。別の実施態様において、エンハンサーまたは前出議論の他のもののようなさら
なるエレメントが含まれる。別の実施態様において、ポリヌクレオチドはプロモ
ーター配列を含まず、このような配列は導入されたポリヌクレオチドの組込み(
例えば、組換え、例えば、相同組換え)により標的細胞の内因性ゲノムによって
提供される。ポリヌクレオチドは、リポフェクション、エレクトロポレーション
、ビロソーム、リポソーム、イムノリポソーム、ポリカチオン:核酸コンジュゲ
ート、ネイクドDNAのような本明細書中に開示された任意の方法を含むあらゆる
方法によって標的細胞に導入され得る。
能力を有するように誘導され得るか、または不死化されそして培養において無限
に維持されるようにさえされ得る。1つの実施態様において、細胞は哺乳動物の
ものであり、ヒト細胞が多くの適用について好ましい。不死化され得るヒト細胞
の例は表8〜17に列挙されたものを含む。
び特徴付け得ることが理解される。
A)はじめに
1)TRTアッセイ
本発明は、TRT、好ましくはhTRTおよびテロメラーゼに対する非常に多様なア
ッセイを提供する。これらのアッセイは、とりわけ、ガンがその例示的な例であ
る多数のヒトの疾患の診断および予後について、感度良好、安価、簡便で広範囲
に適用できるアッセイの基礎を提供する。前記したように、hTRT遺伝子産物(タ
ンパク質およびmRNA)は、通常、ほとんどの正常な死すべき細胞に対する不滅化
ヒト細胞(すなわち、テロメラーゼ−陰性細胞およびほとんどのテロメラーゼ−
陽性正常成体体細胞)において上昇する。従って、1つの局面において、本発明
は、(悪性腫瘍細胞のような)不滅化または(成体におけるほとんどの正常体細
胞のような)死すべき、あるいはテロメラーゼ陽性または陰性として細胞を、特
徴付けるために、ヒトまたは他の哺乳動物あるいは真核生物細胞からの、または
それを含む試料におけるhTRT遺伝子産物の存在、不存在または量を検出または測
定するのに有用なアッセイを提供する。
って特徴付けられるいずれの障害も、本明細書に開示する方法および物質を用い
て診断され得る。後記にてより十分に記載するように、これらは、ガン、加速さ
れた細胞増殖の他の疾患、免疫学的障害、受精、不妊症その他を含む。さらに、
テロメラーゼ活性がガン細胞において上昇する程度は転移能力のような腫瘍の特
徴と相関するので、hTRT、mRNAまたはタンパク質レベルのモニタリングを用いて
、腫瘍の将来のありそうな進行を見積もりまたは予測することがされ得る。
例えば、患者由来の)生物学的試料中に存在するか否かを測定することを含む。
第2の局面において、(例えば、患者由来の)生物学的試料におけるhTRT遺伝子
産物の豊富さを測定し、コントロール試料(例えば、正常細胞または組織)にお
ける存在量と比較する。第3の局面において、hTRT遺伝子産物の細胞または細胞
内局在性を細胞または組織試料において決定する。第4の局面において、宿主(
例えば、患者)細胞をアッセイして、異常hTRT遺伝子発現(異常な量、調節、ま
たは産物)についての遺伝性の性質に特徴的な配列を持つ核酸を同定する。これ
は、例えば遺伝子スクリーニングまたは遺伝カウンセリングにおいて有用である
。第5の局面において、本発明のアッセイを用いて、(例えば、患者血清中の)
抗hTRT抗体の存在を検出する。以下にいくらか詳細に記載する方法は、本明細書
中に開示した配列および関係を用いて実施し得る有用なアッセイを示す。しかし
、これらのアッセイの多数の変形または他の適用は、本開示を考慮すれば、当業
者に明らかである。
子、遺伝子産物、または変異体が検出され、定量され、あるいは特徴付けられる
場合はいつでも使用され得ることは認識される。従って、例えば、後記する「診
断」方法は、hTRTまたはヒトテロメラーゼの生産および精製の間におけるhTRTま
たはテロメラーゼのアッセイに、(例えば、不死株を同定するための)ヒト細胞
に由来する細胞株の特徴付けに、ヒトTRT遺伝子または遺伝子産物(またはその
フラグメント)を含む細胞、非ヒト動物、植物、菌類、細菌または他の生物の特
徴付けに有用である。
不妊症、活性化)、または状態(例えば、受精)の存在または性質を同定するそ
の通常の意味を有し、そして用語「予後」は、疾患または障害のありそうな進展
および/または結果を予測するその通常の意味を有する。これらの2つの用語は
臨床的な場では幾分異なるように使用されるが、「診断の」との関係において以
下に開示されるアッセイまたはアッセイ様式のいずれも予後の判定に同等に適し
ていることが理解される。なぜならば、より高いテロメラーゼ活性レベルはガン
患者についてのより貧弱な予後に関係することが、十分確立されており、そして
本発明が、細胞中のテロメラーゼ活性と密接に相関するレベルで発現される、hT
RTに特異的な検出方法を提供するからである。
正常または標準範囲を超えるhTRT遺伝子、mRNAまたはタンパク質のレベルの測
定は、テロメラーゼ−陽性細胞または不死化細胞(ある種の腫瘍がその例である
)の存在の指標となる。ある種の胚性および胎児細胞、ならびにある種の成体幹
細胞はテロメラーゼを発現するので、本発明はまた、母血液からのテロメラーゼ
陽性胎児細胞の検出または単離によって、妊娠のような他の状態を測定する方法
も提供する。これらの値を用いて、細胞がガン性として分類されていない、ある
いは伝統的方法を用いて検出もしくは分類されていない場合でさえ、診断、ある
いは診断の補助をすることができる。従って、本発明の方法は、少なくともいく
つかの例においては初期の段階において、増大した信頼性をもって、テロメラー
ゼに関連するガン性または他の障害の検出または検証を可能とする。本発明のア
ッセイは、hTRT遺伝子または遺伝子産物についての定量的アッセイを供し、それ
により適切な治療レジメンの選択および正確な診断を容易とすることにより、ヒ
ト腫瘍または他の細胞増殖病の異なるクラスおよびグレードの間に区別を可能と
する。さらに、テロメラーゼ活性のレベルを用いて、良性および悪性腫瘍の間を
識別し得(例えば、米国特許第5,489,508号;Hiyamaら, 1997, Proc. Am Ass. C
ancer Res. 38:637)、侵潤の内在性を予測し(例えば、米国特許第5,639,613号
;Yashimaら, 1997, Proc. Am Ass. Cancer Res. 38:326)、そして転移可能性と
相関付け得る(例えば、米国特許第5,648,215号;Panditaら, 1996,Proc. Am As
s. Cancer Res. 37:559)ので、これらのアッセイは広範囲のヒトガンの予防、検
出および治療に有用である。
害)の予後については、特定の腫瘍タイプ、クラスまたはグレードについてのhT
RT遺伝子産物(mRNAまたはタンパク質)または活性の予後値を後記するように測
定する。患者におけるhTRTタンパク質またはmRNAレベルまたはテロメラーゼ活性
はまた(例えば、本明細書中で開示したアッセイを用いて)測定し、予後レベル
と比較し得る。
は、アッセイで検出され得る場合は常に上昇していると考えられる。テロメラー
ゼ−陽性細胞においてさえhTRT mRNAおよびタンパク質の存在量は低く、そして
これらの遺伝子産物は、正常またはテロメラーゼ−陰性細胞中では希薄であるか
または存在しないため、もし正常細胞中に少しでも存在するならば、hTRT遺伝子
産物を検出するためには、高感度のアッセイ必要がある。もし感度のより低いア
ッセイが選択されると、hTRT遺伝子産物は健康組織では検出不能であるが、テロ
メラーゼ陽性ガンまたは他のテロメラーゼ陽性細胞では検出可能である。代表的
には、上昇した試料におけるhTRT遺伝子産物の量は、テロメラーゼ陰性コントロ
ール細胞または成体における健康組織由来の細胞におけるレベルよりも少なくと
も約5倍、頻繁には少なくとも約10倍、より頻繁には少なくとも約50倍、非常に
頻繁には少なくとも約100〜1000倍高く、ここで、テロメラーゼ陽性正常細胞の
パーセントは非常に低い。
型でも使用され得、そしてそれを用いて、あらゆる起源の不死化または新生物細
胞または腫瘍組織、あるいはガンも検出することができる。検出され得るガンの
型は、hTRTの治療的適用の議論で前記でリストした全てのものを含むが、これら
に限定されない。
治療介入の効果をモニターするのにも有用である。モニターされ得る抗ガン剤レ
ジメンは(化学療法、放射線療法および外科手術を含めた)全ての現在認められ
ている治療を含み、また、本明細書に記載するようにテロメラーゼ阻害または活
性化療法のような将来承認される治療をも含む(例えば、PCT国際公開第96/0183
5号および第96/40868号および米国特許第5,583,016号を参照のこと。それらは全
て、その全体が、本明細書中に参考として援用される)。
したガンまたは他の障害(不妊症、早期老化)に関して偏向を示すhTRT遺伝子配
列におけるある種の変異(変異および遺伝性hTRT対立遺伝子)を検出するのに有
用である。
ガンの診断に加えて、本発明のアッセイは多数の他の適用を有する。本発明は
、細胞におけるテロメラーゼまたはhTRT遺伝子産物の過小または過剰発現により
特徴付けられる障害または疾患の試薬および方法/診断を提供する。成体におい
ては、低レベルのテロメラーゼ活性は、通常、正常ヒト体細胞、例えば幹細胞、
活性化リンパ球および生殖細胞の限定された補集合中に見い出され、そして他の
体細胞では存在しない。従って、通常は存在せずまたは不活化されている細胞に
おけるhTRTまたはテロメラーゼ活性の検出、またはhTRTが通常は低レベルで存在
する細胞(例えば、幹細胞、活性化リンパ球および生殖細胞)における異常(す
なわち、正常よりも高いまたは低い)レベルでの検出は、テロメラーゼ関連疾患
または障害の診断となり得るか、あるいはそれを用いて特定の細胞型を同定しま
たは単離(すなわち、幹細胞を単離)し得る。このような疾患および障害の例と
して、細胞増殖の疾患、免疫学的障害、不妊症、免疫細胞機能の疾患、妊娠、胎
児異常、早期老化などが挙げられる。さらに、本発明のアッセイは、患者または
細胞−もしくは動物−ベースのアッセイにおいて、(テロメラーゼ活性を調節す
る薬物を含むが、これらに限定されない)治療介入の有効性をモニターするのに
有用である。
する。ヒト生殖細胞(例えば、精原細胞、それらの祖先または子孫)は無限増殖
が可能であり、そして高テロメラーゼ活性によって特徴付けられる。hTRT遺伝子
産物の異常なレベルまたは産物あるいは低下したレベルは、不適当なまたは異常
な精子の産生をもたらし得、それは不妊症または生殖障害につながる。従って、
本発明は、「テロメラーゼベースの」生殖障害の診断および治療のためのアッセ
イ(方法および試薬)を提供する。同様に、該アッセイを用いて、精子生産を標
的とするかあるいはそれに間接的に影響する(そして、hTRTレベルまたはテロメ
ラーゼ活性を低下させる)避妊薬(例えば、男性避妊薬)の効率をモニターし得
る。
よび造血幹細胞におけるテロメラーゼおよびhTRTのレベルおよび機能を分析する
ためのアッセイを提供する。例えば、hTRT遺伝子産物検出についてのアッセイを
用いて、(例えば、活性化リンパ球の罹患率または始原幹細胞の存在量をモニタ
ーすることにより)一般的に免疫機能をモニターし、(上昇したhTRTレベルに基
づいて)活性化リンパ球または幹細胞を同定しまたは選択しまたは単離し、そし
て、これらの組織を標的とする治療介入(例えば、免疫抑制剤または幹細胞集団
を増やす治療的試み)の効率をモニターし得る。
TRT免疫グロブリンの同定のための有用なアッセイも提供する。本明細書中に記
載される物質およびアッセイを用いて、このような自己免疫抗体が見い出される
患者を同定し、その免疫グロブリンに関連する障害の診断および治療を可能にし
得る。
本明細書中に記載されるアッセイはまた、エクスビボまたはインビトロの細胞
中のhTRT遺伝子産物の発現およびhTRT遺伝子の特徴付けをモニターするのにも有
用である。上昇したhTRTレベルは不死化細胞に特徴的であるので、本発明のアッ
セイは、例えば、不死化細胞をスクリーニング、または同定するのに、あるいは
hTRT発現または機能を阻害することにより不死化細胞を死化し得る薬剤を同定す
るのに使用され得る。例えば、このアッセイは、細胞におけるhTRTの増大した発
現によって、例えば、組換えhTRTの発現により、あるいは内因的にコードされた
hTRTの(例えば、プロモーター活性化による)増大した発現により不死化した細
胞を同定するのに有用である。
えば、hTRT遺伝子を含む酵母またはヒト細胞)におけるhTRT発現をモニターし得
る。特に、本発明のhTRTを発現するヒトおよび非ヒト細胞におけるhTRTレベルに
対するある種の処置(例えば、公知のまたは推定テロメラーゼアンタゴニストの
適用)の効果は、有用な薬物および薬物候補(例えば、テロメラーゼ−活性調節
薬物)を同定するのに使用され得る。
hTRT遺伝子産物の存在または量についてのアッセイは、アッセイ形式、アッセ
イすべき試料の性質および求められる情報に依存して、種々の方法で行われ、そ
の結果は解釈され得る。例えば、hTRT遺伝子産物の定常状態の存在量はほとんど
のヒト体細胞で組織では非常に低いので、特定のアッセイにより検出不能である
。さらに、一般に、これらの組織の細胞ではテロメラーゼ活性はなく、活性の確
認をかなり容易とする。逆に、hTRTタンパク質および/またはhTRT mRNAまたは
テロメラーゼは、他のテロメラーゼ陽性組織、例えば悪性腫瘍においては十分に
豊富であり、従って、同じことが同一のアッセイを用いて検出され得る。低レベ
ルのテロメラーゼ活性が通常は検出され得る体細胞タイプにおいてさえ(例えば
、幹細胞およびある種の活性化された造血系細胞)、hTRT mRNAのレベルおよび
テロメラーゼ活性は不死化細胞においてレベルの小分率(例えば、約1%または
それ未満と見積もられる)であり;従って、不死化および死すべき細胞は本発明
の方法により容易に区別され得る。「感度がより低い」アッセイを用いる場合、
生物学的試料におけるhTRT遺伝子産物の単なる検出は、さらなる分析の必要性な
くして、それ自体で診断となり得ると理解される。さらに、後記するアッセイはか
なり高感度となし得るが、それらはまた、所望ならば、(例えば、緩衝液、洗浄条件、
増幅のラウンド数、試薬の賢明な選択、および/またはシグナル増幅剤の選択によ
り)低感度にもされ得る。従って、実質的にあらゆるアッセイか、それが、hTRT遺伝
子産物が特別の濃度にて、例えば健康なまたは他のコントロール組織よりも高濃
度で存在する生物学的試料においてのみhTRT遺伝子産物を検出するように設計さ
れ得る。この場合、hTRT mRNAまたはタンパク質のあらゆる検出可能なレベルが、
(造血細胞および他の幹細胞以外の)誕生後ヒト体細胞組織由来の細胞中で上昇
すると考えられる。
の非常に低レベルを検出し得る非常な高感度のアッセイが用いられる場合には、
hTRT遺伝子産物発現レベルについて正常またはベースライン値(または範囲)を
確立するのが望ましい。発現または正常発現産物の正常レベルは、当業者に周知
の方法に従い且つ本発明の方法および試薬を用いて、生物のあらゆる特定の集団
、サブ集団、またはグループについても決定され得る。一般に、hTRTタンパク質
またはhTRT mRNAのベースライン(正常)レベルは、正常な(健常な)披験体、
例えばヒト被験体から得られた生物学的試料(例えば、体液、細胞または組織)
におけるhTRTタンパク質および/またはhTRTmRNAの量を定量することにより測定
される。特定の試料および目的のために、細胞当たり、または腫瘍細胞当たりの
ベースでhTRT遺伝子産物の量を定量することを所望し得る。試料の細胞性(cellu
larity)を測定するために、構成的に発現される遺伝子産物または試料が採取さ
れたタイプの細胞における既知レベルで発現される他の遺伝子産物のレベルを測
定し得る。あるいは、hTRTタンパク質またはhTRT mRNAの正常値は、疾患(また
は恐らくは疾患の)細胞が収集されたのと同一患者から、または健常な個体から
得られる、健康であることが知られた細胞または組織におけるhTRTタンパク質/
RNAの量を定量することにより測定され得る。あるいは、ベースラインレベルは
、培養中の非不死化ヒト体細胞に存在するレベルとして、ある場合には定義され
得る。正常(ベースライン)値は、異なる細胞型の間で(例えば、hTRT mRNAレ
ベルは腎臓よりも睾丸において高い)、患者の年齢、性別または身体的状態に従
って、幾分異なり得る可能性がある。従って、例えば、アッセイを用いてガンに
関連するhTRTレベルの変化を測定する場合は、hTRT遺伝子産物発現の正常範囲を
測定するのに使用される細胞は、調査の性質に依存して、同一または異なる年齢
の個人からの細胞であり得る。分子遺伝学で使用される標準的な統計方法の適用
は、発現のベースラインレベルの決定を可能とし、ならびにこのようなベースラ
インレベルからの有意な偏差の同定を可能とする。
後値」に言及するのが時には有用である。本明細書中で用いる「診断値」とは、
hTRT遺伝子産物の正常(または「ベースライン」)範囲と比較して、疾患の存在
の指標となる試料中に検出されたhTRT遺伝子産物について決定された値をいう。
この疾患は高テロメラーゼ活性(例えば、ガン)、テロメラーゼ活性の不存在(
例えば、不妊症)、またはいくつかの中間体値により特徴付けられ得る。「予後
値」とは、その疾患(例えば、ガン)について特定の診断および予後に合致する
所与の細胞型(例えば、悪性腫瘍細胞)中に検出されたhTRT遺伝子産物の量をい
う。試料中に検出されたhTRT遺伝子産物の(ゼロ量を含める)量は、その値の相
対的比較が疾患の存在または疾患(例えば、ガン)の進行のありそうな結果を示
すように、細胞についての予後値と比較される。1つの実施態様において、例え
ば、腫瘍予後を評価するために、データが収集され、異なる腫瘍クラスまたはグ
レートに関するhTRTレベルの統計的に有意な相関を得る。既知の臨床的結果を有
する被験体から得られた同一の細胞または組織試料につき、所定の範囲のhTRTレ
ベルを確立する。十分な数の測定を行い、比較がなされる統計的に有意な値(ま
たは値の範囲)を得る。次いで、所与の細胞または組織試料についての所定の範
囲のhTRTレベルまたは活性を用いて、有利な(または不利ではない)予後(例え
ば、ガンの場合には「低レベル」)に相関するhTRT遺伝子産物のレベルについて
の値または範囲を測定する。ガンの場合の不利な(またはより不利な)予後に相
関する「高レベル」に対応する範囲が同様に測定され得る。次いで、生物学的試
料(例えば、患者試料)からのhTRT遺伝子産物のレベルを測定し、低いおよび高
い範囲と比較し、それを用いて臨床的結果を予測し得る。
後値はまた他の疾患(例えば、細胞増殖の疾患)および障害についても測定され
得、そして、ガン以外の疾患または障害については、「高」レベルは所望の結果
と相関され得、「低」レベルは不利な結果と相関され得ることが理解される。例
えば、いくつかの疾患は、幹細胞、活性化リンパ球、または生殖系細胞における
テロメラーゼ活性の欠陥(例えば、低レベル)により特徴付けられ得る。このよ
うな場合、(例えば、他の患者または特定の患者における他の組織由来の)同様
の年齢および/またはタイプの細胞に対するhTRT遺伝子産物の「高」レベルは有
利な結果と相関させられ得る。
ずしも要しないことが理解される。なぜならば、相対値は本発明の方法の多くの
適用で十分だからである。定量が望ましい場合、本発明は、遺伝子産物を定量す
るためのあらゆる既知の方法が実質的に使用され得るような試薬を提供する。
の患者の処置をモニターするにおける、特定の治療的処置レジメンの効率を評価
し得る。これらの場合、治療を開始する前に患者に対してベースラインを確立し
、通常は正規ベースに基づいて、治療経過を介して1回以上アッセイを反復し、
治療の結果として、所望の終点(例えば、アッセイがガンについてのものであれ
ばhTRTの発現の低下)に向かってhTRTレベルが動いているか否かを評価するのが
望ましい。
正常発現産物との比較により、変異体または異常な発現パターン(例えば、RNA
スプライシング変異体の異常量)あるいは変異体または異常発現産物(例えば、
変異した転写体、切り詰められたもしくはナンセンスポリペプチド)が同定され
得ることを認識する。これらの場合において、「正常」または「ベースライン」
の測定は、健康な生物および/または組織(すなわち、hTRT発現不調または新生
物増殖のない生物および/または組織)を同定する工程、および変異体hTRT遺伝
子産物(例えば、スプライシング変異体)の発現レベルを測定する工程、あるい
はhTRT遺伝子、mRNA、または逆転写されたcDNAを配列決定しまたは検出して、代
表的な(正常な)配列変化を得るまたは検出する工程を含む。分子遺伝学で使用
される標準的な統計方法の適用は、このようなベースラインレベルからの有意な
偏りの決定を可能とする。
本明細書中で強調してきたように、hTRT遺伝子産物は通常は極端に低いレベル
にてほとんどの正常体細胞で見い出される。例えば、hTRTタンパク質をコードす
るmRNAは、これまでに調べた全てのテロメラーゼ−陰性細胞型では極端に稀であ
るかまたは存在しない。293細胞のような不死化細胞においては、hTRT mRNAは細
胞当たり約100コピーのみで存在し得る一方、正常な体細胞は細胞当たり1また
は0コピーしか有し得ない。このように、hTRT遺伝子産物につき高感度のアッセ
イが望まれる場合、シグナルまたは標的増幅技術をアッセイ形式に組み入れるの
が時々有利であることが明らかである。例えば、Plenatら, 1997, Ann. Pathol.
17:17(フルオレセイニル-チラミドのシグナル増幅);Zehbeら, 1997, J. Pat
hol. 150:1553(触媒されたレポーター沈殿);本明細書中に挙げた他の文献(例
えば、bDNAシグナル増幅、PCRおよび他の標的増幅形式につき);および当該分野
で知られた他の技術を参照のこと。 前記したように、本明細書で開示するアッ
セイではhTRT mRNAまたはタンパク質を定量する必要のないことが多い。なぜな
らば、(その産物がコントロールの中で、例えばテロメラーゼ陰性細胞では検出
されないアッセイ条件下での)hTRT遺伝子産物の検出はそれ自体で診断に十分だ
からである。別の例として、試験(例えば、腫瘍)およびコントロール(例えば
、健常細胞)試料中に見い出された産物のレベルが直接比較される場合、定量は
不必要であり得る。
産物の量は、測定の方法および便宜に依存して、種々の方法で記載され得る。従
って、正常、診断、予後、高量または低量のhTRTタンパク質/mRNAは、生物学的
試料の量当たりの重量の標準単位として(例えば、グラム組織当たりのピコグラ
ム、1012細胞当たりのピコグラム)、生物学的試料の量当たりの分子の数として
(例えば、転写物/細胞、モル/細胞)、細胞当たりまたは他の単位量当たりの
活性の単位として、あるいは同様の方法により表現され得る。hTRT遺伝子産物の
量はまた、別の分子の量に対して表現され得;その例として:試料中のhTRT転写
物の数/試料中の28S rRNA転写物の数:hTRTタンパク質のナノグラム/全タンパ
ク質のナノグラム等が挙げられる。
、2つの試料に対する比較の共通のベースを有することが時々有用である。例え
ば、正常組織の試料とガン性組織の試料とを比較する場合、等量の組織(重量、
容量、細胞数等)が比較され得る。あるいは、マーカー分子の等価物(例えば、
28S rRNA、hTR、テロメラーゼ活性、テロメア長、アクチン)が使用され得る。
例えば、28S rRNAの10ピコグラムを含む健常組織試料中のhTRTタンパク質の量が
、28S rRNAの同一量を含む疾患組織の試料と比較され得る。
設計され得ることは当業者により認識される。代表的には、既知の量または供給
源のhTRT遺伝子産物(例えば、本発明の方法および組成物を用いて生産したもの
)を用いて該アッセイを較正する。
におけるhTRT対立遺伝子または遺伝子産物の存在、不存在、または存在量を検出
するアッセイ形式が選択される。このような形式の例として、組織学(例えば、
シグナル増強または標的増強増幅工程を伴う免疫組織化学)または蛍光活性化細
胞分析もしくは細胞ソーティング(FACS)によるシグナルを検出するものが挙げ
られる。これらの形式は、高度に異種の細胞集団(例えば、1または数個のタイ
プのみが上昇したhTRTレベルを有する多数の細胞型、または異なるレベルでテロ
メラーゼを発現する同様の細胞の集団を含む)を取り扱う場合は、特に有用であ
る。
hTRT遺伝子または遺伝子産物(すなわち、mRNAまたはポリペプチド)は、好ま
しくは、生物学的試料中で検出および/または定量される。このような試料は、
限定されるものではないが、細胞(全細胞、細胞画分、細胞抽出物、および培養
された細胞または細胞株を含む)、組織(血液、血液細胞(例えば、白血球細胞
)、および(例えば、前立腺、乳房、甲状腺等からの)微小針バイオプシー試料
のような組織試料、体液(例えば、尿、痰、羊膜液、血液、腹腔液、胸腔液、精
液)またはそれから収集した細胞(例えば、尿からの膀胱細胞、血液からのリン
パ球)、培地(培養細胞または細胞株からのもの)、および洗液(例えば、膀胱
および肺)を含む。また、生物学的試料は、組織学的目的で採取された凍結切片
のような組織の切片も含む。ガンの診断および予後では、試料はガン性または前
ガン性あるいは疑われるガン性組織または腫瘍から得られる。後者の分析では(
例えば、薬物処理の効果をモニターする場合)、生物学的試料を凍結するのが時
々望ましいであろう。
の組織パイオプシーにおいて、周知の方法に従い、セルソーター(例えば、蛍光
活性化セルソーター)を使用して、表面抗原(例えば、腫瘍表面抗原)の発現の
ような特徴に従って細胞を分けることができる。
いて、他の動物からの試料におけるhTRT相同遺伝子または遺伝子産物を検出し得
る。あるいは、hTRT遺伝子および遺伝子産物は、ヒトTRTタンパク質または核酸
配列を発現するトランスジェニック動物または生物でアッセイし得る。
、あるいは濃縮し得る。生理学的pHでのリン酸塩、トリス緩衝液等のような種々
の緩衝液を使用する任意の多数の標準的水性緩衝液が使用され得る。
のいずれかとして呼び得る。「患者試料」の分析が患者からの細胞または組織の
除去を必ずしも要しないことが認識される。例えば、適切に標識されたhTRT結合
剤(例えば、抗体または核酸)を患者に注射し、標準的な画像化技術(例えば、
CAT、NMR等)を用いて(標識に結合している場合には)可視化し得る。
1つの実施態様において、本発明は、(スプライシングまたは配列変異体およ
びオルナタナティブ対立遺伝子を含む)hTRT mRNAの発現を検出および/または
定量する方法を提供する。別の実施態様において、本発明は、正常または異常な
hTRT遺伝子(またはそのフラグメント)を検出し、そして分析する方法を提供す
る。このような定性または定量アッセイの形態は、限定されるものではないが、
シグナルを増幅するまたは増幅しない増幅に基づくアッセイ、ハイブリダイゼー
ションに基づくアッセイ、および組合せ増幅ハイブリダイゼーションアッセイを
含み得る。ハイブリダイゼーションと増幅との間の区別は便宜的にすぎないと当
業者によって認識される;以下の実施例で説明するように、多くのアッセイ様式
はハイブリダイゼーションおよび増幅の両方の要素を含み、そのため、類別はあ
る場合では幾分任意的である。
いくつかの実施態様において、試験すべき細胞、組織、生物、または細胞株か
ら単離した核酸の試料で核酸アッセイを行う。核酸(例えば、ゲノムDNA、RNAま
たはcDNA)は、当業者に周知の任意の多数の方法に従って試料から「単離」され
得る。この文脈で、「単離された」とは、混合物中の任意の他の物質から検出さ
れるべき種または標的のいずれかの分離をいうが、標的の精製の有意な程度を必
ずしも示さない。当業者は、hTRT遺伝子のコピー数の変化を検出すべき場合、ゲ
ノムDNAが検出すべき標的であることを認識する。逆に、遺伝子または複数の遺
伝子の発現レベルを検出すべき場合、RNAが核酸に基づくアッセイで検出すべき
標的である。1つの好ましい実施態様において、核酸試料は生物学的試料中の全
mRNA(すなわち、ポリ(A)+RNA)である。核酸を単離する方法は、当業者に周知
であり、そして例えば、Tijssen, P.編 LABORATORY TECHNIQUES IN BIOCHEMISTR
Y AND MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES, PART I.
THEORY AND NUCLEIC ACID PREPARATION, Elsevier, N.Y. (1993)第3章(本明
細書中で参考として援用される)に記載されている。1つの実施態様において、
全核酸は、酸グアニジニウム−フェノール−クロロホルム抽出法を用いて所定の
試料から単離され、そしてオリゴ−dTカラムクロマトグラフィーによって、ある
いは(dT)n磁性ビーズを用いることによって、ポリ(A)+mRNAは単離される(例え
ば、Sambrookら, およびAusubelら, 前出を参照)。
行う前に核酸(例えば、全RNAまたはポリA+RNA)を生物学的試料から単離する必
要はない。これらの実施態様は、hTRT RNAを測定すべき場合にある利点を有する
。なぜなら、それらは単離および取り扱いの間にhTRT mRNAの喪失の可能性を低
下させるからである。例えば、前記PCRおよびRT-PCRのような多くの増幅技術を
、浸透した細胞(組織学的検体およびFACS分析)、全溶解細胞、またはある細胞
抽出物のような粗細胞画分を用いて行い得る。好ましくは、工程は、要すれば、
標的核酸(例えば、mRNA)の完全性を保持するように行われる(例えばRNAaseイ
ンヒビターの添加)。増幅およびハイブリダイゼーションアッセイはまた、例え
ば、バイオプシー試料からの薄い組織切片または細胞単層(例えば、血液細胞ま
たは解離させた組織培養細胞)からの薄い組織切片においてインサイチュで行い
得る。増幅はまた、インタクトな全細胞または固定した細胞で行い得る。例えば
、標的hTRT RNAまたはDNAを増幅するために、固定し、予め浸透させた、または
ミイクロインジョンした細胞について、ポリメラーゼまたはリガーゼ、プライマ
ー、および(デオキシ)リボヌクレオシド三リン酸(ポリメラーゼを使用する場
合)、および逆転写酵素およびプライマー(RNAを転写し、cDNAを検出すべき場
合)を用いて、インサイチュで当該分野で周知のように、PCR、RT-PCR、またはL
CR増幅法を行い得る。次いで、hTRT RNAを含有する細胞(例えば、テロメラーゼ
陽性細胞)または目的のhTRT DNA配列を検出し得る。この方法は、蛍光標識dNTP
、プライマーまたは他の成分を顕微鏡、FACS分析または同等のものと組み合わせ
て使用する場合にしばしば有用である。
1つの実施態様において、本発明のアッセイは、hTRT遺伝子または遺伝子産物
の検出のための増幅に基づくアッセイである。増幅に基づくアッセイにおいて、
hTRT遺伝子または転写物(例えば、mRNAまたはcDNA:本明細書中以後、「標的」
ともいう)の全てまたは一部を増幅し、次いで、増幅産物を直接的または間接的
に検出する。テンプレートとして作用すべき基礎となる遺伝子または遺伝子産物
がない場合、(例えば、予測されるサイズの)増幅産物は生産されず、あるいは
増幅は非特異的であり、そして典型的には、単一の増幅産物はない。対照的に、
基礎となる遺伝子または遺伝子産物が存在する場合、標的配列が増幅され、基礎
となる遺伝子またはmRNAの存在および/または量の指標が提供される。標的の増
幅に基づくアッセイは当業者に周知である。
およびプローブを提供する。このようなプライマーおよびプローブは、標的核酸
にハイブリダイズするためにhTRT遺伝子または遺伝子産物に対して十分に相補的
である。プライマーは、典型的には、少なくとも6塩基、通常は約10と約100塩
基との間、典型的には、約12と約50塩基との間の長さであり、そしてしばしば約
14と約25塩基との間の長さである。本開示を再検討した当業者は、日常的方法を
用いて、プライマーを選択してhTRT遺伝子または遺伝子産物の全部または任意の
部分を増幅するか、あるいは変異体遺伝子産物とhTRT対立遺伝子等との間を区別
し得る。表2はhTRT、または特定のhTRT遺伝子産物または領域のPCR増幅に有用
な例示的プライマーを列挙する。当該分野で知られているように、単一オリゴマ
ー(例えば、米国特許第5,545,522号)、オリゴマーのネステッド組、またはオ
リゴマーの変性プールさえも、例えば、後出のTetrahymena TRT cDNAの増幅によ
って例示されるように、増幅について使用され得る。
rise Amplification System (Oncor, Inc., Gaithersburg, MD);および当該分野
で公知の多数の他のものを含む)を含む、hTRT遺伝子または遺伝子産物を増幅し
そして検出するための多数の方法を提供する。1つの例示的実施態様において、
PCR増幅は、核酸試料(例えば、hTRT RNAの逆転写を介して得られたcDNA)、100
μlの各dNTP(dATP、dCTP、dGTPおよびdTTP;Pharmacia LKB Biotechnology, NJ
)、hTRT−特異的PCRプライマー、1単位/Taqポリメラーゼ(Perkin Elmer, Nor
walk, CT)、1×PCR緩衝液(50mM KCl、10mM Tris、室温でpH8.3、1.5mM MgCl2、
0.01%ゼラチン)を含有する50μl溶液中で行い、94℃で45秒間、55℃で45秒間
および72℃で90秒間の約30サイクルの増幅を行う。しかし、評価されるように、
多数の改変を行って、任意の特定の反応のためにPCR増幅を最適化し得る。
1989, Genomics 4:560;Landegrenら, 1988, Science, 241:1077, Barany, 199
1, Proc. Natl. Acd. Sci. USA 88:189およびBarringerら, 1990, Gene, 89:117
);鎖置換増幅(SDA:例えば、 Walkerら, 1992, Proc. Natl. Acad. Sci. USA
89:392-396);転写増幅(例えば、Kwohら, 1989, Proc. Natl. Acd. Sci. USA 8
6: 1173);自己維持配列複製(3SR;例えば、Fahyら, 1992, PCR Methods Appl.
1:25, Guatelliら, 1990, Proc. Natl. Acad. Sci. USA,87:1874);核酸配列
に基づく増幅(NASBA, Cangene, Mississauga, Ontario;例えば, Compton, 199
1, Nature 350:91);転写に基づく増幅系(TAS);および自己維持配列複製系(S
SR)を含む。前記した文献のそれぞれを本明細書中で参考として援用する。1つ
の有用なPCRの改変はPCR ELISAである(例えば、Boehringer Mannheimカタログ
番号1636111)であり、ここで、ジゴキシゲニン−dUTPがPCR産物に組み込まれる
。PCR反応混合物を変性し、そしてPCR産物の内部配列にアニールするように設計
されたビオチン標識化オリゴヌクレオチドとハイブリダイズさせる。ハイブリダ
イゼーション産物をストレプトアビジン被覆プレートに固定化し、抗ジゴキシゲ
ニン抗体を用いて検出する。インビトロ増幅法を介して当業者を指示するのに十
分な技術の例は、PCR TECHNOLOGY: PRINCIPLES AND APPLICATION FOR DNA AMPLI
FICATION, H. Erlich編、Freeman Press, New York, NY (1992); PCR PROTOCOLS
: A GUIDE TO METHODS AND APPLICATIONS, Innis, Gelfland, SniskyおよびWhit
e編, Academic Press, San Diego,CA (1990);Mattilaら, 1991, Nucleic Acids
Res. 19:4967;EckertおよびKunkel, (1991) PCR METHODS AND APPLICATIONS 1
:17; PCR, McPherson, QuirkesおよびTaylor編, IRL Press, Oxford, 米国特許
第4,683,195号、第4,683,202号および第4,965,188号;Barringerら, 1990, Gene
, 89:117; Lomellら, 1989, J. Clin. Chem., 35:1826(すべての目的について
それぞれを本明細書中に参考として援用する)に見い出される。
、膜、スライドまたはチップのような固体支持体に固定化した標的核酸へのハイ
ブリダイゼーションによって;配列決定によって;免疫学的に、例えば、PCR-EL
ISAによって、蛍光、リン光、または放射性シグナルによって;または任意の種
々の他の周知の手段によって直接分析し得る。例えば、検出方法の例示的な例は
、プライマーが折り畳みが解けてそれらの標的に結合し、複製が起こる場合のみ
蛍光が放射されるように、フルオレセインに連結したヘアピンループおよびクエ
ンチャーとして働く安息香酸誘導体で増加したPCRプライマーを使用する。
ルの極度に稀な転写物として発現するので、増幅工程から生じたシグナルを最適
化または増大することがしばしば望ましい。これを行う1つの方法は、増幅のサ
イクル数を増加することである。例えば、20〜25サイクルが標準的な反応条件下
でポリメラーゼ鎖反応反応を用いるほとんどのmRNAの増幅に適するが、多くの試
料におけるhTRT mRNAの検出は、検出様式および増幅の効率に応じて、30〜35サ
イクルもの増殖を要し得る。増幅サイクル数を含む増幅条件の賢明な選択を用い
て、試験試料中の標的の閾値量が存在する場合のみ(すなわち、高レベルのhTRT
mRNAを有する試料のみが「陽性」結果を生じる)増幅産物が生じるアッセイを
設計し得ることが認識される。さらに、標的配列の増幅によって産生されたシグ
ナルを増加するための方法は既知である。増幅された標的を検出する能力を増加
させる方法は:分岐DNAシグナル増幅(例えば、米国特許第5,124,246号;Urdea,
1994, Bio/Tech. 12:926);チラミドシグナル増幅(TSA)系(Du Pont):触媒的
シグナル増幅(CSA; Dako);Qβレプリカーゼ系(Tyagiら, 1996, Proc. Natl.
Acad. Sci. USA; 93:5395)等のようなシグナル増幅系を含む。
の種々の定量方法を使用し得ることを認識する。例えば、所望の場合、2以上の
ポリヌクレオチドを単一試料において共増幅し得る。この方法は試料中のhTRT m
RNAの量を定量する簡便な方法として使用し得る。なぜなら、逆転写反応および
増幅反応を標的およびコントロールのポリヌクレオチドに対して同一反応で行う
からである。コントロールのポリヌクレオチド(通常は既知の濃度またはコピー
数で存在させる)の共増幅を、試料中のhTRTの量と比較して試料中の細胞数に対
する正規化に使用し得る。共増幅反応のための適切なコントロールのポリヌクレ
オチドは、ハウスキーピング遺伝子、構成的に発現される遺伝子から発現された
DNA、RNA、および反応混合物に添加されたインビトロ合成されたRNAまたはDNAを
含む。内因性コントロールのポリヌクレオチドは試料中に既に存在するものであ
り、一方、外因性コントロールのポリヌクレオチドは試料に添加されて、「スパ
イク」反応を生じる。例示的なコントロールのRNAは、βアクチンRNA、GAPDH RN
A、snRNA、hTRおよび内因的に発現された28S rRNAを含む(Khanら, 1992, Neuro
sci. Lett. 147:114参照)。外因性コントロールのポリヌクレオチドは合成AW10
6 cRNAを含み、これはT7ポリメラーゼによってpAW106からセンス鎖として合成さ
れ得る。共増幅法が定量に有用となるためには、コントロールおよび標的ポリヌ
クレオチドが典型的には共に直線的範囲で増幅されなければならないことが理解
される。定量PCRについての詳細なプロトコルは、PCR PROTOCOLS, A GUIDE TO M
ETHODS AND APPLICATIONS, Innisら, Acdemic Press, Inc. N.Y. (1990)およびA
usubelら, 前出(Unit 15)およびDiaco, R. (1995)定量PCRアッセイの設計のため
の実質的な考察 84-108頁, Innisら編, Academic Press, New Yorkに見い出し得
る。
共増幅反応について使用し得る。競合増幅と呼ばれる1つの方法おいて、定量PC
Rは、標的核酸の増幅に使用される同一プライマー(2つのプライマーのうち1
対)を用いて、既知の量のコントロールの配列を同時に共に増幅することを含む
。非競合的競合として公知の別の実施態様において、コントロールの配列および
標的配列(例えば、hTRT cDNA)を異なるプライマー(すなわち、2つのプライ
マーのうち2対)を用いて増幅する。半競合的増幅と呼ばれる別の実施態様にお
いて、3つのプライマーを用い、このうちの1つはhTRT特異的であり、このうち
の1つはコントロール特異的であり、このうちの1つは標的およびコントロール
の配列の両方にアニールすることができる。半競合的増幅は、本明細書中で参考
として援用される米国特許第5,629,154号に記載される。
a)一般
核酸ハイブリダイゼーション技術を用いる特異的DNAおよびRNA測定のための種
々の方法が当業者に公知である(Sambrookら,前出)。ハイブリダイゼーションに
基づくアッセイとは、プローブ核酸が標的核酸にハイブリダイズするアッセイを
いう。通常、本発明の核酸ハイブリダイゼーションプローブは、hTRT遺伝子また
はRNA配列の隣接配列に全くまたは実質的に同一である。好ましくは、核酸プロ
ーブは少なくとも約10塩基、しばしば少なくとも約20塩基、そして時々は少なく
とも約200塩基以上の長さである。核酸ハイブリダイゼーションで用いる核酸プ
ローブ配列を選択する方法は、Sambrookら(前出)に議論されている。いくつか
の様式において、標的およびプローブのうちの少なくとも一方を固定化する。固
定化核酸は、DNA、RNAまたは別のオリゴヌクレオチドもしくはポリヌクレオチド
であり得、そしてまた、天然または非天然に存在するヌクレオチド、ヌクレオチ
ドアナログ、または骨格を含み得る。このようなアッセイはサザンブロット、ノ
ーザンブロット、ドットブロットおよびスロットブロット、高密度ポリヌクレオ
チドまたはオリゴヌクレオチドアレイ(例えば、GeneChipTM Affymetrix)、ディ
ップスティック、ピン、チップ、またはビーズを含む任意のいくつかの様式のい
ずれかであり得る。これらの技術の全ては当該分野で周知であり、多くの市販の
診断キットの基礎である。ハイブリダイゼーション技術は、一般に、Hamesら編,
NUCLEIC ACID HYBRIDIZATION, A PRACTICAL APPROACH IRL Press, (1985);Gal
lおよびPardue, Proc. Natl. Acd. Sci. USA., 63:378-383 (1969);およびJohn
ら, Nature, 223: 582-587 (1969)に記載される。
の通常の様式は、直接ハイブリダイゼーションであり、ここで、標的核酸は標識
された相補的なプローブにハイブリダイズする。典型的には、標識された核酸を
ハイブリダイゼーションに使用し、この標識は検出可能なシグナルを供する。hT
RT mRNAの存在、不在または量を評価する1つの方法は、実施例2に例示される
ように、試料からのRNAのノーザン転移および標識hTRT特異的核酸プローブのハ
イブリダイゼーションを行うことである。前述したように、全てが存在する場合
、hTRT mRNAは、ほとんどの細胞で非常に少ない量で存在する。従って、ノーザ
ンハイブリダイゼーションを用いる場合、増幅工程(または、あるいは、大量の
出発RNA)を用いることがしばしば望ましい。試料中のhTRTタンパク質をコード
するDNAの存在、不在または量を評価するための有用な方法は、試料からのDNAの
サザン転移および標識hTRT特異的核酸プローブのハイブリダイゼーションを含む
。
アッセイまたは置換アッセイを含む。サンドイッチアッセイは、核酸配列を検出
するかまたは単離する商業的に有用なハイブリダイゼーションアッセイである。
このようなアッセイは、固体支持体に共有結合により固定化された「捕獲」核酸
および溶液中の「シグナル」核酸を利用する。生物学的または臨床的試料は標的
核酸を提供する。「捕獲」核酸および「シグナル」核酸プローブは標的核酸とハ
イブリダイズして、「サンドイッチ」ハイブリダイゼーション複合体を形成する
。効果的にするために、シグナル核酸は捕獲核酸とはハイブリダイズし得ない。
本発明はまた、hTRT核酸がそれにハイブリダイズし得る(すなわち、固定化オ
リゴ−またはポリ−ヌクレオチドのいくらかに対して、しかし通常は全てではな
くほとんどである)固定化オリゴヌクレオチドまたはポリヌクレオチドのアレイ
を使用するhTRT遺伝子産物のためのプローブに基づくハイブリダイゼーションア
ッセイを提供する。高密度オリゴヌクレオチドアレイまたはポリヌクレオチドア
レイは、標的核酸(例えば、hTRT遺伝子、mRNAまたはcDNA)の存在および特徴(
例えば、配列)を効率的に検出するための手段を提供する。インサイチュ合成の
ための写真平板技術を用いる表面上で規定された位置で、定義された配列に相補
的な数1000のオリゴヌクレオチドを含有するアレイを産生する技術(例えば、米
国特許第5,578,832号;第5,556,752号;および第5,510,270号;Foderら, 1991,
Science 251: 767; Peaseら, 1994, Proc. Natl. Acd. Sci. USA 91:5022;およ
びLockhartら, 1996, Nature Biotech 14:1675)または規定されたオリゴヌクレ
オチドの迅速な合成および沈積のための他の方法(Blanchardら, 1996, Biosens
ors & Bioelectronics, 11:687)が公知である。これらの方法を用いる場合、既
知配列のオリゴヌクレオチド(例えば、20マー)を誘導体化されたガラススライ
ドのような表面上に直接合成する。通常、産生されたアレイは冗長であり、検出
されるべきhTRTポリヌクレオチドに特異的なチップ上のいくつかのオリゴヌクレ
オチドプローブを有する。
たmRNAを検出するか、または種々のhTRT対立遺伝子のどれが特定の試料で発現す
るかを同定するように設計し得る。
製されたcDNAを増幅する(例えば、PCRを用いて)。典型的には、増幅産物を、
例えば、蛍光標識したdNTPの取り込みによって標識する。次いで、標識cDNAを、
hTRT遺伝子の種々のサブ配列に相補的なオリゴヌクレオチドプローブを含むチッ
プにハイブリダイズさせる。ハイブリダイゼーションの位置を、(例えば、Shal
onら, 1996, Genome Research 6:639またはShenaら, 1996, Genome Res. 6;639
の一般的な方法に従い)決定し、そして配列(または他の情報)を当該分野で周
知の手段によってハイブリダイゼーションパターンから推定する。
れる)を同一チップにハイブリダイズさせる。次いで、hTRT遺伝子に相補的な部
位への各標識試料のハイブリダイゼーションの比率をアッセイする。両試料が同
一量のhTRT mRNAを含有するならば、2つの蛍光の比率は1:1である(蛍光由
来のシグナルは蛍光のモル感度のいずれの差異のために調節する必要はないこと
が認識される)。対照的に、第1の試料が健康(またはコントロール)組織由来
であり、第2の試料がガン性組織由来のものであれば、第2の試料で使用する蛍
光は優勢である。
hTRTタンパク質をコードする遺伝子の発現を検出する別の手段は、インサイチ
ュハイブリダイゼーションである。インサイチュハイブリダイゼーションアッセ
イは周知であり、一般に、Angererら, METHODS ENZYMOL., 152:649-660 (1987)
およびAusubelら,前出に記載されている。インサイチュハイブリダイゼーション
アッセイでは、細胞または組織検体を、代表的には浸透状態で、代表的にはガラ
ススライド上の固体支持体に固定する。次いで、細胞を中程度の温度でハイブリ
ダイゼーション溶液と接触させて、hTRTに完全にまたは実質的に相補的な標識核
酸プローブ(例えば、35S−標識リボプローブ、蛍光標識プローブ)のアニーリ
ングを行う。当該分野で公知のように、洗浄および/またはヌクレアーゼ消化に
よって遊離プローブを除去し、そしてオートラジオグラフィーまたは適切な画像
化技術によって結合プローブをスライド上で直接可視化する。
前記および実施例(例えば、実施例9)で説明するように、増幅プライマーま
たはプローブを選択して、特定の欠失、切形、および挿入にまたがり、それによ
りhTRT mRNAにおける特定の変異体または異常性の検出を容易とする増幅産物を
供し得る。
された産物(配列番号4)のようなhTRT RNAである。Δ182変異体の、生物学的
機能は、あったとしても、知られていない;しかしながら、この変異体によって
推定的にコードされる切形hTRTタンパク質は、例えば、テロメラーゼ成分を決定
する非機能的テロメラーゼRNPを組み立てることによって、テロメラーゼ活性の
調節に関与し得る。あるいはテロメラーゼ活性の負の調節は、全長mRNAを除去し
、そしてhTRT mRNAレベルを低下させ、そしてΔ182 hTRT RNAレベルを増加させ
るに至るように、hTRTプレmRNA(未成熟のmRNA)のプロセシングを指示すること
によって達成され得る。これらおよび他の理由で、Δ182変異体を検出し得るこ
とは有用である。さらに、それらの相対的および/または絶対的な量を比較する
ことは、(Δ182 hTRT RNA、および全長hTRTタンパク質をコードするhTRT RNAの
ような)hTRT RNAの2つの種が存在する試料においては時には望ましい。
基対欠失をまたがるプライマー対を用いる増幅により、欠失および非欠失のhTRT
RNAに対応する異なるサイズの産物が得られる。もし両者が存在すれば、(例え
ば、ゲル電気泳動によって)サイズに基づいて区別できる。182bp欠失をまたが
る領域を増幅するのに有用なプライマー対の例は、TCP1.14およびTCP1.15(プラ
イマー組1)、またはTCP1.25およびbTCP6(プライマー組2)を含む(表2〜6
参照)。これらのプライマー対を、個々に、あるいはプライマー組1をまず用い
るネステッドPCR実験で使用することができる。また、本発明のhTRT核酸プロー
ブを用いるハイブリダイゼーション方法(例えば、ノーザンハイブリダイゼーシ
ョン)またはRNAse保護アッセイを用いてhTRT RNA変異体を検出し、そして区別
することができることは、当業者には明らかである。
を含む。前記にてより詳細に記載した半競合的な定量的PCR方法と類似して、1
つのプライマーは、(例えば、表18に例示するように)hTRT RNA種のそれぞれ
に対して特異的であり、そして1つのプライマーは、両方の種に相補的である(
例えば、TCP1.25(2270-2288))。配列番号1に特異的なプライマーの例は、182
ヌクレオチド配列(すなわち、配列番号1のヌクレオチド2345〜2526)内にアニ
ールするものである(例えば、TCP1.73(2465〜2445))。例えば、配列番号4
(Δ182変異体)に特異的なプライマーは、配列番号4のヌクレオチド2358〜233
9(すなわち、配列番号1における182ヌクレオチド挿入に対応する部位)にてア
ニールするものである。Δ182 hTRT mRNA種の絶対的な量、または全長hTRTタン
パク質をコードする種と比較したその相対的な量を、細胞状態(例えば、無限増
殖の能力)に対して相関させるために分析することができる。多数の他のプライ
マーまたは増幅方法もしくは検出方法を本開示に基づいて選択できることが認識
される。
、欠失、置換、または挿入によって特徴付けられるものを含む。欠失は、遺伝子
、mRNA転写物、またはcDNAの減少したサイズによって検出できる。同様に、挿入
は、遺伝子、mRNA転写物、またはcDNAの増加したサイズによって検出できる。挿
入および欠失はまた、成熟前の停止コドンまたはより長いオープンリーディング
フレームに至るリーディングフレームのシフトを引き起こし得る。置換、欠失、
および挿入は、またプローブハイブリダイゼーションによっても検出できる。変
化はまた、(例えば、ウェスタン分析によって)変異体hTRTポリペプチドのサイ
ズの変化を観察することによって、あるいは適切なようにハイブリダイゼーショ
ンまたは特異的増幅によって検出され得る。あるいは、変異は、標準的な方法に
従って遺伝子または遺伝子産物を配列決定することによって決定することができ
る。さらに、前記のように、増幅アッセイおよびハイブリダイゼーションプロー
ブを選択して、特定の異常性を特異的に標的化することができる。例えば、欠失
、置換、または挿入を含む領域に、それぞれ、特異的に、ハイブリダイズするか
、あるいはそれを増幅する核酸プローブまたは増幅プライマーが選択され得る。
hTRT遺伝子がそのような変異を有する場合、プローブは、(1)ハイブリダイズ
しないか、あるいは増幅反応は特異的な増幅を提供しないか、または増幅産物も
しくはハイブリダイゼーションシグナルのサイズの変化を引き起こすか;あるい
は(2)プローブまたは増幅反応は、全欠失または欠失のいずれかの端部(欠失
連結部)を含むか;あるいは(3)同様に、プローブおよび増幅プライマーは、
点変異または挿入を特異的に標的化するように選択できるかのいずれかである。
hTRT遺伝子中の変異は、疾患開始の原因となり得るか、あるいは疾患状態に寄
与し得る。hTRTのゲノムDNAの変化は、遺伝子転写のレベルに影響し、hTRTタン
パク質中のアミノ酸残基を変化させ、産生されるべき切形hTRTポリペプチドの産
生を引き起こし、プレmRNAのプロセシング経路を変化させ(これは、hTRT mRNA
レベルを変化させ得る)、同様に他の結果を引き起こし得る。
ーゼ会合タンパク質の発現およびプロセシングならびにRNPアセンブリーおよび
輸送の調節を担う酵素または細胞プロセスを変化させることによってhTRTまたは
テロメラーゼの発現に影響し得る。hTRTの発現、プロセシング、またはRNPアセ
ンブリーに影響する変化は、ガンの進行、加齢の疾患、DNA損傷疾患、およびそ
の他で重要であり得る。
は、複数の方法にて、本明細書中の方法に従って達成することができる。例示的
な例は以下のものを含む:プライマースクリーニングと呼ばれる技術を使用でき
る;その3'末端が、恐らくは変異した試料DNA(またはRNA)中のヌクレオチドに
アニールするPCRプライマーを設計する。このDNA(またはRNA)をプライマーに
よって増幅する場合、3'末端は遺伝子中のヌクレオチドにマッチする;このDNA
が増幅されない場合、一方または両方の末端は遺伝子中のヌクレオチドにマッチ
せず、これは、変異が存在したことを示す。同様のプライマー設計を用いて、リ
ガーゼ連鎖反応(LCR、前記)を用いて点変異についてアッセイすることができ
る。制限フラグメント長多型、RFLP(Pourzand, C., Cerutti, P. (1993) Mutat
. Res. 288:113-121)は、本方法で適用できる別の技術である。種々の制限酵素
で消化したヒトゲノムDNAのサザンブロットを、hTRT特異的プローブで探る。試
料とコントロールとの間のフラグメントの数またはサイズの差は、実験試料の変
化、通常は挿入または欠失を示す。一本鎖コンホメーション多型、SSCP(Orrita
, M.ら(1989) PNAS USA 86:2766-70)は、本方法で適用され得る別の技術である
。SSCPは、変性した野生型および変異体の一本鎖DNA(通常はPCRによって生じる
)の異なる移動に基づく。一本鎖DNAは、配列特異的な三次元コンホメーション
を採る。1塩基変化ほどの少ない配列の差異は、非変性ゲルでの移動度の変化を
もたらす。SSCPは、その簡便さのために最も広範囲に使用される変異スクリーニ
ング方法の1つである。変性グラジエントゲル電気泳動、DGGE(Myers, R. M.,
Maniatis, T.およびLerman, L., (1987) Methods in Enzymology, 155:501-527
)は、本方法で適用され得る別の技術である。DGGEは、二本鎖DNAの融解挙動に基
づいて変異を同定する。特殊化された変性電気泳動装置を利用して、実験および
コントロールDNAの融解プロフィールを観察する;変異を含むDNAは、これらのゲ
ル系においてコントロールと比較して異なる移動度を有する。議論した例は、通
常に使用される方法を示す;当業者により公知であり、そして本明細書における
教示に従って適用され得る多くの他の技術が存在する。
本発明は、さらに、hTRT配列プローブを用い、および/またはヒト患者、ヒト
細胞株、または非ヒト細胞由来の染色体におけるhTRT遺伝子配列を検出するかま
たは位置決定する核型分析または他の染色体分析用の方法および試薬を提供する
。1つの実施態様において、増幅(すなわち、コピー数の変化)、欠失(すなわ
ち、部分的欠失)、挿入、置換、またはhTRT遺伝子の染色体位置の変化(すなわ
ち、転座)を、病理学的状態の存在または病理学的状態(例えば、ガン)を発症
する素因と関連付けることができる。
くにマップされると決定された(後記実施例5参照)。最も近いSTSマーカーはD
5S678である(実施例8参照)。この位置を用いて、hTRT遺伝子に密接に連鎖し
ているマーカーを同定することができる。このマーカーを用いて、YAC、STS、コ
スミド、BAC、ラムダ、またはP1ファージ、あるいはhTRTゲノム配列またはコン
トロールエレメントを含む他のクローンを同定することができる。このマーカー
または遺伝子の位置を用いて、ガンまたは疾患のタイプの出現と関連する正常hT
RT遺伝子位置、編成化または配列の変化についてヒト組織試料を調べることがで
きる。この情報は、関連する疾患またはガンについての診断または予後の方法で
使用できる。さらに、hTRT遺伝子に対するいずれかの変化の性質は、細胞が不死
化する性質に関する情報を与えることができる。例えば、転座事象は、hTRT発現
の活性化が、hTRTプロモーターを不適切な様式でhTRT転写を指示する別のプロモ
ーターで置き換えることによってある場合には生じることを示し得る。このタイ
プの本発明の方法および試薬を用いて、hTRT活性化を阻害することができる。こ
の位置はまた、正常体細胞におけるhTRT遺伝子抑制の性質、例えば、この位置が
非発現性のヘテロクロマチンの一部であるか否かを決定するために有用であり得
る。ヘテロクロマチンおよびユークロマチンを区別するためのヌクレアーゼ過剰
感度アッセイは、例えば、Wuら, 1979, Cell 16:797; GroudineおよびWeintraub
, 1982, Cell 30:131 GrossおよびGarrard, 1988, Ann. Rev. Biochem. 57:159
に記載されている。
の方法のいずれかを用いる核型分析によって同定される。1つの有用な技術はイ
ンサイチュハイブリダイゼーション(ISH)である。典型的には、インサイチュ
ハイブリダイゼーション技術を核型分析で使用する場合、検出可能なまたは検出
可能に標識されたプローブをインサイチュで染色体試料にハイブリダイズさせて
、hTRT遺伝子配列の位置を決定する。一般に、ISHは、以下の1つ以上の工程よ
りなる:(1)分析すべき組織、細胞、または他の生物学的組織の固定;(2)
標的DNAの接近性を増大させ(例えば、加熱またはアルカリでの変性)、および
(例えばヒトゲノムDNAを用い、反復配列のハイブリダイゼーション能力を、例
えばブロックすることによって)非特異的結合を低下させるための、生物学的組
織のプレハイブリダイゼーション処理;(3)1種以上の核酸プローブ(例えば
、通常の核酸、PNA、または他の核酸アナログを含有するプローブ)の、生物学
的組織または組織中の核酸へのハイブリダイゼーション;(4)ハイブリダイゼ
ーションにおいて結合しなかった核酸フラグメントを除去するためのハイブリダ
イゼーション後の洗浄;および(5)ハイブリダイズした核酸フラグメントの検
出。これらの各工程で使用する試薬およびそれらの使用のための条件は、個々の
適用に応じて変化する。これらの工程が当業者に周知の種々の方法で改変できる
ことは理解される。
ンサイチュハイブリダイゼーション、「FISH」)。典型的には、二重色素蛍光イ
ンサイチュハイブリダイゼーションの使用が望ましく、これは、2つのプローブ
を利用し、それぞれは異なる蛍光色素によって標識される。目的のhTRT配列にハ
イブリダイズする試験プローブを1つの色素で標識し、そして異なる領域にハイ
ブリダイズするコントロールプローブを第2の色素で標識する。動原体領域のよ
うな、目的の染色体の安定な部分にハイブリダイズする核酸を、コントロールプ
ローブとして用いることができる。このようにして、試料間でハイブリダイゼー
ションの効率の差を設けることができる。
ノグラム量に対して行うことができる。新鮮なまたは凍結した材料、組織または
切片で可能なように、パラフィン包埋した正常組織または腫瘍の切片を用いるこ
とができる。FISHは限定された材料に適用され得るので、非培養の原発性腫瘍か
ら調製したタッチ(touch)調製物もまた使用できる(例えば、Kallioniemiら, 1
992, Cytogenet. Cell Genet. 60:190)。例えば、腫瘍由来の小さなバイオプシ
ー組織試料を、タッチ調製物に使用できる(例えば、Kallioniemiら,前掲参照
)。吸引バイオプシーから得られた少数の細胞、または体液(例えば、血液、尿
、痰等)中の細胞も分析できる。出生前診断において、適切な試料は、羊水、母
親血液等を含む。本明細書に開示する方法および試薬に適用可能な有用なハイブ
リダイゼーションプロトコルは、Pinkeloら, 1988, Proc. Natl. Acad. Sci. US
A, 85:9138;EPO公開第430,402号;Choo編, METHODS IN MOLECULAR BIOLOGY 第3
3巻; IN SITU HYBRIDIZATION PROTOCOLS, Humana Press, Totowa, New Jersey,
(1994);およびKallioniemiら、前掲に記載されている。
配列の増幅、欠失、挿入、置換、または他の再配置を同定するのに使用され得本
発明のhTRTプローブおよびプライマーを用いる、定量的サザンブロッティング、
定量的PCR、または比較ゲノムハイブリダイゼーション(Kallioniemiら,1992,
Science, 258:818)のような技術を含む。
1)一般
本発明は、hTRTポリペプチドを検出し、そして定量する方法および試薬を提供
する。これらの方法は、電気泳動、質量分析、ゲルシフト、キャピラリー電気泳
動のような分析生化学的方法、サイズ排除クロマトグラフィー、高速液体クロマ
トグラフィー(HPLC)、薄層クロマトグラフィー(TLC)、高拡散クロマトグラ
フィー等のようなクロマトグラフィー方法、あるいは流体またはゲル沈降素反応
、免疫拡散(一重または二重)、免疫電気泳動、ラジオイムノアッセイ(RIA)
、酵素結合イムノソルベントアッセイ(ELISA)、免疫蛍光アッセイ、ウェスタ
ンブロッティングのような質量分析などの免疫学的方法、および後記の、そして
本開示を考慮して当業者に明らかな他のものを含む。
1つの実施態様において、hTRTポリペプチドは電気泳動タンパク質分離で検出
される;1つの局面において、二次元電気泳動系が使用される。電気泳動技術を
用いるタンパク質の検出手段は当業者に周知である(一般に、R. Scopes (1982)
PROTEIN PURIFICATION, Springer-Verlag, N.Y.; Deutscher, (1990) METHODS
IN ENZYMOLOGY 第182巻: GUIDE TO PROTEIN PURIFICATION, Academic Press, In
c. N.Y.)。
掲参照)を使用する。例えば、標識hTRは、hTRTと会合し、非変性ポリアクリル
アミドゲル等での電気泳動に際して変化した移動度で移動する。従って、例えば
、もし(必要に応じて標識された)hTRプローブまたは(必要に応じて標識され
た)テロメラーゼプライマーを、hTRTを含有する試料と混合するか、あるいは(
例えば、無細胞発現系において)hTRTと共に共発現させれば、試料中のhTRTタン
パク質(またはhTRTをコードするポリヌクレオチド)の存在は、hTR移動度の検
出可能な変化をもたらす。
a)一般
本発明はまた、本発明の1種以上の抗体試薬を使用するhTRTポリペプチドの検
出のための方法を提供する(すなわち、イムノアッセイ)。本明細書中で使用さ
れるように、イムノアッセイは、hTRTポリペプチドまたはエピトープと特異的に
結合する抗体(本明細書では広く定義されるように、そして特に、フラグメント
、キメラおよび他の結合剤を含む)を利用するアッセイである。本発明の抗体は
、例えば、前記したように、当業者に周知の種々の手段によって作成できる。
知である(例えば、米国特許第4,366,241号;同第4,376,110号;同第4,517,288
号;および同第4,837,168号参照)。例えば、METHODS IN CELL BIOLOGY 第37巻:
ANTIBODIES IN CELL BIOLOGY, Asai編, Academic Press, Inc. New York (1993
); BASIC AND CLINICAL IMMUNOLOGY 第7版, Stites & Terr編, (1991); Harlow
およびLane, 前掲[例えば、第14章]、およびAusubelら,前掲[例えば、第11章]
(そのそれぞれは、参考として、その全体および全目的で援用される)参照。典
型的には、免疫学的結合アッセイ(またはイムノアッセイ)は、分析物に特異的
に結合し、そしてしばしばこれを固定化する「捕獲剤」を利用する。1つの実施
態様において、捕獲剤は、抗hTRT抗体のような、hTRTポリペプチドまたはサブ配
列に特異的に結合する部分である。別の実施態様において、捕獲剤は、hTRT会合
分子が(もしhTRT会合分子が固定化されれば、hTRTタンパク質が同様に固定化さ
れるように)hTRTに結合されたままとなる条件下でhTRT会合タンパク質またはRN
Aに結合することができる。hTRT会合分子が捕獲されるアッセイにおいては、例
えば、抗hTRT抗体等を用い、会合するhTRTタンパク質が通常存在し、従って、出
できることが理解される。タンパク質複合体を検出するイムノアッセイは当該分
野で公知である(例えば、HarlowおよびLane(583頁)前掲参照)。
は間接的に検出される。アッセイで使用する個々の標識または検出可能な基は、
アッセイで使用する抗体の特異的な結合を有意に妨害しない限り、通常、本発明
の重要な局面ではない。標識は、捕獲剤(例えば、抗TRT抗体)に共有結合によ
り結合させることができるか、あるいは別の抗体のような第3の部分に結合させ
ることができる。それは、例えば以下のものに特異的に結合する:(捕獲剤によ
って認識される異なるエピトープにおいて)hTRTポリペプチド、捕獲剤(例えば
、抗(第1の抗体)免疫グロブリン;抗TRT抗体;抗TRT抗体に結合する抗体;ま
たは(例えば、テロメラーゼ関連タンパク質のような関連分子への結合を介する
)抗体/テロメラーゼ複合体。プロテインAまたはプロテインGのような、アッ
セイで使用される抗体を結合し得る他のタンパク質をまた、標識してもよい。い
くつかの実施態様において、2つ以上の標識分子(すなわち、相互に区別できる
もの)を使用することは有用である。さらに、捕獲剤(例えば、抗hTRT抗体)に
よって結合した(例えば、固定化された)標的が、複合体(すなわち、hTRTとTR
T会合タンパク質、hTR、または他のTRT会合分子との複合体)である場合、タン
パク質またはhTRTタンパク質と会合したRNAを認識する標識抗体が使用できる。
複合体がタンパク質−核酸複合体(例えば、TRT-hTR)である場合、レポーター
分子は、この複合体のRNA成分を認識するポリヌクレオチドまたは他の分子(例
えば、酵素)であり得る。
セイを用いて、標的抗体の存在を検出することができる。この場合、標的抗体を
含む試料によって抗原でコートされた粒子は凝集する。この形式において、この
成分は標識されている必要はなく、標的抗体の存在は単純な視覚的観察によって
検出できる。
本発明は、hTRTポリペプチドを検出する競合的および非競合的イムノアッセイ
のための方法および試薬を提供する。非競合的イムノアッセイは、捕獲された分
析物(この場合、hTRT)の量が直接的に測定されるアッセイである。1つのこの
ようなアッセイは、hTRTタンパク質上の2つの非干渉性エピトープに対して反応
性のモノクローナル抗体を利用する2部位モノクローナルに基づくイムノアッセ
イである。背景情報については、例えば、Maddoxら, 1983, J. Exp. Med., 158:
1211参照。1つの好ましい「サンドイッチ」アッセイにおいて、捕獲剤(例えば
、抗TRT抗体)を固定化される固体基板に直接的に結合させる。次いで、これら
の固定化抗体は、試験試料中に存在する任意のhTRTタンパク質を捕獲する。次い
で、このように固定化されたhTRTは、すなわち標識を有する第2の抗hTRT抗体に
結合させることによって標識することができる。あるいは、第2の抗hTRT抗体は
、標識を欠くものであってもよいが、第2の抗体が由来する種の抗体に対して特
異的な標識された第3の抗体によって結合されてもよい。あるいは、酵素標識の
ストレプトアビジンのような、第3の標識分子が特異的に結合できるビオチンの
ような検出可能部分で、第2の抗体を修飾することができる。
競合アッセイにおいて、試料中に存在するhTRTタンパク質の量は、試料中に存
在するhTRTタンパク質によって捕獲剤(例えば、抗TRT抗体)から置き換えられ
た(または、競合してはずされた)添加された(外因性)hTRTの量を測定するこ
とによって間接的に測定される。1つの競合アッセイにおいて、既知量の標識hT
RTタンパク質を試料に添加し、次いで、試料を捕獲剤(例えば、hTRTタンパク質
を特異的に結合する抗体)と接触させる。抗体に結合した外因性(標識)hTRTタ
ンパク質の量は、試料に存在するhTRTタンパク質の濃度に反比例する。1つの実
施態様において、抗体を固体基質に固定化する。抗体に結合したhTRTタンパク質
の量は、TRT/抗体複合体中に存在するhTRTタンパク質の量を測定すること、あ
るいは残存する非複合体化TRTタンパク質の量を測定することのいずれかによっ
て決定され得る。hTRTタンパク質の量は、標識されたhTRT分子を提供することに
よって検出され得る。
、hTRTタンパク質を固体基質に固定化する。既知量の抗TRT抗体を試料に添加し
、次いで、試料を固定化したhTRTタンパク質と接触させる。この場合、固定化し
たhTRTタンパク質に結合した抗TRT抗体の量は、試料中に存在するhTRTタンパク
質の量に反比例する。固定化抗体の量は、抗体の固定化画分または溶液中に残存
する抗体の画分のいずれかを検出することによって検出され得る。この局面にお
いて、検出は、抗体が標識される場合は、直接的であり得、または上記のように
抗体に特異的に結合する分子に標識を結合させる場合は間接的であり得る。
本発明はまた、イムノブロット(ウェスタンブロット)形式を使用することに
よって、試料中のhTRTの存在を検出および定量するための試薬および方法を提供
する。この形式においては、試料中のhTRTポリペプチドを(例えば、分子量に基
づいて)ゲル電気泳動によって他の試料成分から分離し、分離されたタンパク質
を適切な固体支持体(例えば、ニトロセルロースフィルター、ナイロンフィルタ
ー、誘導体化ナイロンフィルターなど)に移し、そして支持体を本発明の抗TRT
抗体と共にインキュベートする。抗TRT抗体は、固体支持体上のhTRTまたは他のT
RTに特異的に結合する。これらの抗体は、直接標識され得るか、あるいはその後
標識された抗体(例えば、標識されたヒツジ抗マウス抗体)または抗TRT抗体に
特異的に結合する他の標識試薬を用いて検出され得る。
の分子(例えば、抗体)に結合し、そしてカプセルに包まれた試薬またはマーカ
ーを放出するように設計されたリポソームを使用する。次いで、放出された化学
物質を、標準的な技術に従って検出し得る(Monroeら, 1986, Amer. Clin. Prod
. Rev. 5:34参照)。
は、不均一な試料(例えば、正常細胞および悪性細胞の両方を含有するバイオプ
シー試料)中のhTRT遺伝子産物を測定する場合に利点を有する。
前記したように、アッセイに応じて、抗原、標的抗体、または抗hTRT抗体を含
む様々な成分を、固体表面または支持体(すなわち、基質、メンブレン、または
濾紙)に結合させ得る。種々の固体表面に生体分子を固定化する多くの方法は、
当該分野で公知である。例えば、固体表面は、メンブレン(例えば、ニトロセル
ロース)、マイクロタイターディッシュ(例えば、PVC、ポリプロピレン、また
はポリスチレン)、試験管(ガラスまたはプラスチック)、計量棒(例えば、ガ
ラス、PVC、ポリプロピレン、ポリスチレン、ラテックスなど)、微量遠心分離
管、またはガラスもしくはプラスチックのビーズであり得る。所望の成分を、非
特異的結合を介して共有結合または非共有結合させることができる。
、固体表面のための材料として使用し得る。例示的なポリマーは、ポリエチレン
、ポリプロピレン、ポリ(4-メチルブテン)、ポリスチレン、ポリメタクリレー
ト、ポリ(エチレンテレフタレート)、レーヨン、ナイロン、ポリ(ビニルブチレ
ート)、ポリビニリデンジフルオリド(PVDF)、シリコーン、ポリホルムアルデ
ヒド、セルロース、酢酸セルロース、ニトロセルロースなどを含む。使用され得
る他の材料は、紙、ガラス、セラミックス、金属、メタロイド、半導体材料、セ
メントなどを含む。さらに、タンパク質(例えば、ゼラチン)、リポ多糖、シリ
ケート、アガロース、およびポリアクリルアミドのようなゲルを形成する物質を
使用し得る。デキストラン、ポリアルキレングリコールのようないくかの水相を
形成するポリマー、またはリン脂質、長鎖(12〜24個の炭素原子)アルキルアン
モニウム塩などのような界面活性剤も適切である。固体表面が多孔質である場合
、システムの性質に応じて種々の孔サイズを使用し得る。
種々の特性を得ることが可能である。例えば、ゼラチンのようなタンパク質コー
ティングを用いて、非特異的結合の回避、共有結合の単純化、シグナル検出の増
強などを行い得る。
あるか、または多官能性化され得る。表面に存在し、そして、結合に使用され得
る官能基は、カルボン酸、アルデヒド、アミノ基、シアノ基、エチレン基、ヒド
ロキシル基、メルカプト基などを含み得る。広範囲の種々の化合物を種々の表面
に結合させる方法は周知であり、そして文献に十分に説明される。例えば、Immo
bilized Enzymes, Ichiro Chibata, Halsted Press, New York, 1978およびCuat
recasas (1970), J. Biol. Chem. 245 3039参照。
。非共有結合は、典型的には表面への化合物の非特異的吸着である。
ましいことを認識する。特に、アッセイが固体基質上に固定化された抗原または
抗体を含む場合、基質への非特異的結合の量を最小化するのが望ましい。このよ
うな非特異的結合を低下させる手段は、当業者に周知である。典型的には、これ
は、タンパク質組成物で基質をコーティングすることを含む。特に、ウシ血清ア
ルブミン(BSA)、脱脂粉乳、およびゼラチンのようなタンパク質組成物が広く
使用され、粉乳が時々好ましい。あるいは、表面を、それが1つの成分に非特異
的に結合するが、別の成分には有意に結合しないように設計する。例えば、コン
カナバリンAのようなレクチンを有する表面は、炭水化物含有化合物を結合する
が、グリコシル化を欠く標識タンパク質には結合しない。アッセイ成分の非共有
結合に用いられる種々の固体表面は、米国特許第4,447,576号および同第4,254,0
82号に概説される。
本発明はまた、hTRT特異的免疫グロブリンを検出するための試薬およびアッセ
イを提供する。1つの実施態様において、固定化hTRT(例えば、マイクロアッセ
イプレートウェルに結合した組換えhTRT)を、抗hTRT抗体が存在する場合、固定
化hTRTを結合する条件下で患者からの血清と共にインキュベートする。洗浄して
非特異的に結合した免疫グロブリンを除去した後、結合した血清抗体を、もしこ
れらが存在する場合、検出可能に標識された抗(ヒトIg)抗体を添加することに
よって検出し得る(別の実施態様および変形は当業者に周知である;例えば、Ha
rlow、前出、第14章参照)。これらのアッセイは、動物もしくはヒトの血清また
は生理食塩水のようなキャリアを含むいずれかの供給源中の抗hTRT抗体を検出す
るのに有用である。1つの実施態様において、アッセイを用いて、患者における
hTRTタンパク質に対する免疫応答、特に自己免疫(例えば、抗テロメラーゼ)応
答を検出またはモニターする。抗hTRT抗体は、自己免疫疾患または他の病的状態
を罹う患者からの血清または他の組織または液体中に存在し得る。
本明細書に記載される診断アッセイおよび予後アッセイは、種々の組み合わせ
で実施し得、そしてまた他の診断試験または予後試験と組み合わせて実施し得る
。例えば、本方法を使用して患者の試料中に存在するガン細胞の存在を検出する
場合、hTRTの存在を用いて、疾患の段階、特定の腫瘍が隣接する組織を侵襲しそ
うか、または遠くの位置に転移しそうか、およびガンの再発がありそうかを決定
し得る。さらなる情報を提供し得る試験は、バイオプシー試料の顕微鏡分析、腫
瘍形成性に関連する抗原(例えば、細胞表面マーカー)の検出(例えば、組織細
胞化学、FACSなどを用いて)、画像化方法(例えば、患者への標識した抗腫瘍抗
体の投与に際して)、テロメラーゼ活性アッセイ、テロメア長アッセイ、hTRア
ッセイなどを含む。このような組合せ試験は、疾患の進行に関する有用な情報を
提供し得る。
前記したように、hTRT mRNAについてのアッセイをhTR(ヒトテロメラーゼRNA)
についてのアッセイまたはテロメラーゼ活性(すなわち、TRAP)アッセイと組み
合わせて、テロメラーゼのアセンブリーおよび機能についての情報を提供し得る
。
本発明はまた、テロメラーゼに関連する病的状態を有する患者のスクリーニン
グ、モニタリング、診断、および予後に、または細胞または細胞株におけるhTRT
の発現レベルの決定に有用なキットを提供する。キットは、hTRT遺伝子産物(RN
Aまたはタンパク質)の存在または非存在を測定するため、またはhTRT遺伝子の
発現を定量するための1つ以上の試薬を含む。好ましい試薬は、hTRTの遺伝子、
RNA、cDNA、またはその部分に特異的に結合する核酸プライマーおよびプローブ
に加えて、タンパク質、ペプチド、抗体、ならびにコントロールのプライマー、
プローブ、オリゴヌクレオチド、タンパク質、ペプチドおよび抗体を含む。酵素
(例えば、逆転写酵素、DNAポリメラーゼ、リガーゼ)、緩衝液、試薬(標識、d
NTP)を含む他の材料を含み得る。
プチドまたはそのサブ配列に特異的に結合する抗体を含み得るか、またはそれら
と組み合わせ得る。抗体はモノクローナルまたはポリクローナルであり得る。抗
体を、標識のような別の部分に結合させ得るか、および/またはそれを固体支持
体(基質)上に固定化し得る。キット(単数または複数)はまた、hTRTポリペプ
チド/抗体複合体の検出のため、またはハイブリダイズした核酸プローブ、なら
びにコントロールまたは他の試薬として使用する1つ以上のhTRTペプチドまたは
hTRTタンパク質の検出のための第2の抗体を含み得る。
、マイクロタイタープレート、計量棒などのような固体支持体に固定化され得る
。キットはまた、TRTの検出のためのアッセイにおける、抗体またはハイブリダ
イゼーションプローブの使用を教示する説明教材を含み得る。キットは、標識の
検出のため、または陽性コントロールおよび陰性コントロールを標識するための
適切な試薬、洗浄溶液、希釈緩衝液などを含み得る。
対を含む。このようなキットはまた、hTRTの増幅されたDNAについてのプローブ
、および/またはポリメラーゼ、緩衝液、dNTPなどを含み得る。別の実施態様に
おいて、キットは、プローブ、任意に、標識されたプローブを含む。別の実施態
様において、キットは抗体を含む。
A.概説
本発明は、テロメラーゼまたはテロメラーゼ成分(例えば、hTRTタンパク質)
の活性または発現を調節する化合物および処理を提供する。本発明はまた、テロ
メラーゼの活性または発現を調節する化合物および処理を同定するためのアッセ
イおよびスクリーニング方法(高処理量スクリーニングを含む)を提供する。テ
ロメラーゼの活性および発現のこれらのモジュレーター(本明細書では以後、「
モジュレーター」という)は、テロメラーゼアゴニスト(これはテロメラーゼの
活性および/または発現を増加させる)およびテロメラーゼアンタゴニスト(こ
れはテロメラーゼの活性および/また発現を減少させる)を含む。
ーゼモジュレーターはヒトの疾患の処置のための有効な処置用薬剤であることが
意図される。アゴニスト活性および転写もしくは翻訳のアクチベーターについて
のスクリーニングは、細胞内のテロメラーゼ活性(テロメア依存性複製能、また
は「部分的」テロメラーゼ活性を含む)を増加させる組成物を提供する。このよ
うなアゴニスト組成物は、有用なタンパク質を発現し得る細胞を含む、他の点で
は正常な非形質転換細胞を不死化させる方法を提供する。このようなアゴニスト
はまた、細胞老化を制御する方法を提供し得る。逆に、アンタゴニスト活性につ
いてのスクリーニングは、テロメア依存性複製能を低下させ、それにより、ガン
細胞のように、そうでなければ不死の細胞を有寿命にする(mortalizing)組成物
を提供する。アンタゴニスト活性についてのスクリーニングは、テロメラーゼ活
性を低下させ、それにより、ガン細胞のような調節されない細胞増殖を示す細胞
の無制限な細胞分裂を防ぐ組成物を提供する。モジュレーターを用いて処置され
得る例示的な疾患および病的状態は、本明細書において、例えば、第VII節およ
び第IX節(前出)に列記される。一般に、本発明のモジュレーターは、細胞また
は生物においてテロメラーゼ活性を増加または減少させるのが所望される場合は
常に使用され得る。従って、疾患の処置での使用に加えて、hTRTの発現レベルを
増大させるモジュレーターを用いて、一般的には第VIII節(前出)に記載される
特性を有する培養ヒト細胞株を作製し得、そして当業者に明らかである種々の他
の用途に使用され得る。
る遺伝子(例えば、hTRT mRNAをコードする遺伝子)の転写の速度またはレベル
を変化させるか、テロメラーゼ成分をコードするRNAの安定性または転写後プロ
セシング(例えば、輸送、スプライシング、ポリアデニル化、または他の修飾)
に影響を与えるか、コードされるタンパク質(例えば、hTRT)の翻訳、安定性、
翻訳後プロセシング、または修飾に影響を与えるか、あるいはさもなければ機能
的(例えば、触媒的に活性な)テロメラーゼRNPのレベルを変化させる場合に、
テロメラーゼまたはテロメラーゼ成分の「発現」を調節する。化合物または処置
は化合物の投与または処置が、第IV(B)章(前出)に記載されたいずれかの活性
(例えば、進行的または非進行的なテロメラーゼ活性;テロメラーゼ進行性;従
来の逆転写酵素活性;核酸分解活性;プライマーまたは基質結合活性;dNTP結合
活性;RNA結合活性;テロメラーゼRNPアセンブリー;およびタンパク質結合活性
を含む)のようなテロメラーゼ活性を変化させる場合、テロメラーゼ「活性」に
影響を与える。「活性」における変化と「発現」における変化との間には必ずし
もはっきりした記述ないこと、およびこれらの用語は限定のためではなく議論を
容易にするために使用されることが認識される。本発明のモジュレーターが、例
えば、標的細胞の非特異的毒殺によってテロメラーゼ成分の発現を低下させるよ
りもむしろ、テロメラーゼの活性または発現に特異的に(例えば、一般に、アク
チンのようなハウスキーピングタンパク質の発現を変化させることなく)影響を
与えるべきであることもまた認識される。
本発明は、テロメラーゼまたはテロメラーゼ成分の発現に影響を与えることが
できるか、テロメラーゼのDNA複製能を改変し得るか、あるいはさもなければテ
ロメラーゼ酵素およびTRTタンパク質がテロメリックDNAを合成する能力(「全活
性」)を改変する組成物または化合物をスクリーニングするための方法および試
薬を提供する。本発明はまた、hTRTの「部分的活性」のいずれかまたは全てのモ
ジュレーターについてのスクリーニングを提供する。従って、本発明は、例えば
、通常はhTRTタンパク質またはテロメラーゼが発現されない細胞においてそれを
発現させることによって、またはテロメラーゼ陽性細胞においてテロメラーゼの
活性レベルを増加させることによって、テロメラーゼの活性を増加させる薬剤を
スクリーニングするのに使用され得るアッセイを提供する。
的または免疫原性のフラグメントまたはそのオリゴペプチドを、種々の薬物スク
リーニング技術のいずれかにおいて処置的化合物をスクリーニングするのに使用
し得る。このような試験で使用されるフラグメントは、溶液中で遊離であるか、
固体支持体に付着しているか、細胞表面に生じるか、または細胞内に位置し得る
。テロメラーゼまたはサブユニットタンパク質と試験される薬剤との間の結合複
合体の形成は測定され得る。
部位、テロメラーゼ会合タンパク質、ヌクレオチド、またはテロメリックDNAの
テロメラーゼまたはhTRTタンパク質への会合を阻害するか;酵素複合体の解離を
促進するか;テロメラーゼRNA部位(例えば、hTR)の転写を妨げるか;または本
明細書に記載される「部分活性」のいずれかを阻害するアンタゴニストをスクリ
ーニングする方法を含む。本発明は、hTRとhTRTとの会合またはhTRTとp80もしく
はp95のヒトホモログまたは別の関連タンパク質との会合、またはhTRTとテロメ
ラーゼもしくはヌクレオチドとの会合のような、核酸および/またはテロメラー
ゼ関連組成物とhTRTとの会合を阻害する組成物についてスクリーニングする方法
;hTRまたはhTRTに対する抗体のような、酵素複合体の解離を促進するか、また
はその会合(すなわち、アセンブリー)を促進する組成物についてスクリーニン
グする方法;酵素の進行的に影響を与える薬剤についてスクリーニングする方法
;およびhTRに相補的な核酸のような、テロメラーゼに結合する、核酸および他
の組成物についてスクリーニングする方法を提供する。本発明は、さらに、hTRT
遺伝子の転写および/またはhTRT遺伝子産物の翻訳を増加または減少させる組成
物についてのスクリーニングを意図する。本発明はまた、1つの実施態様におい
て、トランスジェニック動物のような動物において、テロメラーゼ活性または抗
テロメラーゼ活性を再構成することによって、動物におけるテロメラーゼモジュ
レーターをスクリーニングする方法を意図する。本発明は、「ノックアウト」モ
デルを含むインビボアッセイシステムを提供し、ここで、1または数単位の内因
性テロメラーゼ、テロメラーゼRNA部位、および/またはテロメラーゼ会合タン
パク質が欠失または阻害される。内因性テロメラーゼ活性(完全または部分的)
が残存または欠損し得る。1つの実施態様において、外因性テロメラーゼ活性(
完全活性または部分的)を再構成する。
モジュレーターを同定するための、種々の部分的活性テロメラーゼアッセイが提
供される。本発明の「部分的活性」アッセイは、「全活性」テロメラーゼアッセ
イで検出されないかも知れないクラスのテロメラーゼ活性モジュレーターの同定
を可能とする。1つの部分的活性アッセイは、TRTおよびテロメラーゼの非進行
的活性を含む。テロメラーゼの進行的性質は、Morin (1989) Cell 59:521-529に
記載される;Prowse (1993) 「Identification of a nonprocessive telomerase
activity from mouse cells」 Proc. Natl. Acad. Sci. USA 90:1493-1497も参照
。本発明の別の部分的活性アッセイは、テロメラーゼの「逆転写酵素様」活性を
利用する。これらのアッセイでは、hTRTタンパク質の逆転写酵素活性をアッセイ
する。Lingner (1997) 「Reverse transcriptase motifs in the catalytic subu
nit of telomerase」 Science 276:561-567参照。本発明の別の部分的活性アッセ
イは、プライマーの3'鎖からの少なくとも1つのヌクレオチド、典型的にはグア
ノシンの酵素の除去を含む、hTRTおよびテロメラーゼの「核酸分解活性」を利用
する。この核酸分解活性は、Collins (1993) 「Tetrahymena telomerase catalyz
es nucleolytic cleavage and nonprocessive elongation」 Genes Dev 7:1364-1
376による、テトラヒメナテロメラーゼにおいて観察されている。本発明の別の
部分的活性アッセイは、この酵素的進行的DNA重合活性の一部としてヌクレオチ
ドに結合する、hTRTおよびテロメラーゼの能力を分析することを含む。本発明の
別の部分的活性アッセイは、テロメア合成のためのテンプレートとして使用され
る、そのRNA部位、すなわちヒト細胞についてのhTRに結合する、hTRTまたはテロ
メラーゼの能力を分析することを含む。本発明のさらなる部分的活性アッセイは
、インビボで染色体に結合する、またはインビトロもしくは再構成システムにお
いてオリゴヌクレチオドプライマーに結合する、あるいは染色体構造に関連する
タンパク質(このようなタンパク質の例については、Harrington (1995) J Biol
Chem 270: 8893-8901を参照)に結合する、hTRTおよびテロメラーゼの能力を分
析することを含む。hTRTに結合する染色体構造は、例えば、テロメリック反復DN
A、テロメアタンパク質、ヒストン、核マトリックスタンパク質、細胞分裂/細
胞周期制御タンパク質などを含む。
上の細胞(すなわち、「試験細胞」)を試験化合物と接触させる工程、および試
験化合物が細胞においてテロメラーゼ(またはテロメラーゼ成分)の発現または
活性に影響を与えるか否かを決定する工程を含む。通常、この決定は、試験化合
物と接触させていない同様の細胞または複数の細胞(すなわち、コントロール細
胞)に対して、試験細胞における活性または発現を比較する工程を含む。あるい
は、細胞抽出物を、インタクトな細胞の代わりに使用し得る。関連する実施態様
において、試験化合物を多細胞生物(例えば、植物または動物)に投与する。テ
ロメラーゼまたはテロメラーゼ成分は、細胞または多細胞生物にとって全く内因
性であり得るか(すなわち、天然に生じる内因性遺伝子によってコードされる)
、または1種以上の組換えにより発現されるテロメラーゼ成分(例えば、hTRT、
hTR、テロメラーゼ会合タンパク質)を含む組換え細胞またはトランスジェニッ
ク生物であり得るか、または内因性成分および組換え成分の両方を有し得る。従
って、1つの実施態様において、テロメラーゼ活性モジュレーターを有寿命細胞
に投与する。別の実施形態様において、テロメラーゼ活性モジュレーターを不死
化細胞に投与する。例えば、推定の阻害性組成物を、ガン細胞のような顕著な量
のテロメラーゼ活性を示すことが知られる細胞に投与し、そしてテロメラーゼ活
性、テロメア長、または増殖能力の減少(これらの全てがアンタゴニスト活性を
有する化合物の指標である)が観察されるか否かを測定することによって、テロ
メラーゼ媒介DNA複製のアンタゴニストを同定し得る。
、hTR)を含むリボ核タンパク質複合体(RNP)のテロメラーゼ活性の変化をモニ
ターすることによってモジュレーターが同定され、(例えば、実施例7、後出に
記載されているように)そのRNPはインビトロで再構築される。
現系において、TRT遺伝子産物(例えば、RNAまたはタンパク質)の発現の変化を
モニターすることによってモジュレーターが同定される。
に存在するTRT調節要素によって全体的にまたは部分的にその発現が調節される
、実施例15に記載のような、レポーター遺伝子の発現を変化させることによって
モジュレーターが同定される。関連する実施態様において、テロメラーゼ成分(
例えば、hTRT)、RNA、または遺伝子調節配列(例えば、TRT遺伝子プロモーター
)に結合する試験化合物の能力をアッセイする。
スプライシングされた産物、オルタナティブポリ−アデニル化事象、RNA切断な
どの変化を観察することによってモジュレーターが同定される。関連する実施態
様において、変異型hTRTポリペプチド(そのうちのいくつかは、優性的に陰性の
テロメラーゼ調節活性を有し得る)の産生をモニターすることによってモジュレ
ーターの活性を観察することができる。
、バイオテクノロジーおよび医薬産業において周知であり、多数のさらなるアッ
セイおよび後記にて提供する例示的アッセイの変形が当業者に明らかである。
得る。テロメラーゼ成分(例えば、hTRTタンパク質)または前駆体(例えば、hT
RT mRNA)の発現のレベルの変化は、当業者に周知の方法を用いてアッセイされ
得る。そのうちのいくつかは例えば第IX節にて前記され、(例えば、本発明のTR
Tプローブおよびプライマーを用いる)ハイブリダイゼーション、(例えば、本
発明の抗TRT抗体を用いる)イムノアッセイ、RNase保護アッセイ、増幅アッセイ
、または本明細書中に記載のもしくは当該分野で公知の任意の他の適切な検出手
段によってTRT遺伝子産物(例えば、タンパク質およびRNA)のレベルをモニター
することを含む。試料中の核酸の量を定量すること(例えば、RNA、例えば、hTR
またはhTRT mRNAのレベルの評価)もまた、シス−またはトランス−転写レギュ
レーターを評価するにおいて有用である。
IV(B)節、前出)またはテロメラーゼ機能の他のアッセイのような方法を用いて
測定され得る。望まれる場合、テロメラーゼ活性の定量は、本明細書中に記載し
た方法を含む任意の方法によって行い得る。テロメリック構造の喪失を引き起し
または促進し得るテロメラーゼアンタゴニストは、インビボ、エクスビボまたは
インビトロでテロメラーゼ活性に対するそれらの効果をモニターおよび測定する
ことによって、または(染色、タグ化したハイブリダイゼーションプローブまた
は他の手段の使用によって測定されたまたは検出された)テロメア長に対するそ
れらの効果によって、あるいはテロメラーゼ陽性ガン細胞の細胞分裂の阻害によ
って(テロメアの臨界的短鎖化は「危機」またはM2老化と呼ばれる現象に至る
(Shay, 1991、Biochem. Biophys. Acta 1072:1-7) 同定され得、それは、ガン
細胞はテロメラーゼの活性化によって迂回するが、テロメラーゼの不存在下では
、染色体の欠失および再配置を介するそれらの老化または死滅に至る。ヒトテロ
メラーゼ活性のインビボでの再構築は、任意の供給源からの細胞または動物にお
いてテロメラーゼモジュレーターのためのスクリーニング方法を提供する。この
ようなアゴニストは、テロメア長の変化の測定を含む、本発明の活性アッセイで
同定され得る。細胞においてテロメラーゼ活性を測定するアッセイの他の例は、
テロメア構造の蓄積または喪失のためのアッセイ、TRAPアッセイまたは定量的ポ
リメラーゼ連鎖反応アッセイを含む。
応において組み込まれた標識の相対量と比較して、標識ヌクレオチドの基質への
組込みによって測定して、hTRTの活性の統計学的に有意な減少を試験化合物が生
じ、それにより、試験化合物がテロメラーゼインヒビターであると判断される方
法を含む。
知のプロトコルの改作に従う。例えば、本発明のテロメラーゼまたはTRTタンパ
ク質を用いて、テロメラーゼ活性のモジュレーターとして作用する組成物を同定
する場合、非常に多数の潜在的に有用な分子を単一の試験でスクリーニングする
ことができる。モジュレーターは、テロメラーゼ活性に対して阻害性(アンタゴ
ニスト)または増強性(アゴニスト)効果を有し得る。例えば、もし1000のイン
ヒビターのパネルをスクリーニングすべきであれば、全ての1000のインヒビター
を潜在的に1つのマイクロタイターウェルに入れ、同時に試験することができる
。もしこのようなインヒビターが見つかれば、1000のプールを100の10プールに
分け、個々のインヒビターが同定されるまでプロセスを反復することができる。
して作用するそれらの能力について調べる(高処理能力スクリーニングの技術に
よって多いに加速されるプロセス)。本明細書に記載のテロメラーゼ活性につい
てのアッセイ(全てまたは部分)を、高処理能力技術で使用するのに適合させる
ことができる。この目的を達成するために多数の方法が存在することは当業者に
は明らかである。
親和性を有する化合物の高処理能力スクリーニングに適用し得る薬物スクリーニ
ングについての別の技術は、Geysenによる「Determination of Amino Acid Sequ
ence Antigenicity」(本明細書中で参考として援用される、Geysen, 1984年9月
13日に公開されたWO国際公開84/03564)に詳細に記載されている。要約すると、
非常に多数の異なる小ペプチド試験化合物を、プラスチックピンまたはいくつか
の他の表面のような固体基板上で合成する。ペプチド試験化合物をテロメラーゼ
のフラグメントまたはテロメラーゼタンパク質サブユニットと反応させ、そして
洗浄する。次いで、結合したテロメラーゼまたはテロメラーゼタンパク質サブユ
ニットを、当該分野で周知の方法によって検出する。実質的に精製したテロメラ
ーゼまたはテロメラーゼタンパク質サブユニットはまた、前記薬物スクリーニン
グ技術で使用するプレート上に直接被覆され得る。あるいは、非中和抗体を用い
てペプチドを捕獲し、固体支持体に固定化し得る。
抗体を、テロメラーゼまたはサブユニットタンパク質への結合のために試験化合
物と特異的に競合させる競合的薬物スクリーニングアッセイの使用を意図する。
また、抗体を用いて、テロメラーゼまたはサブユニットタンパク質で1つ以上の
抗原決定基を共有する任意のペプチドの存在も検出し得る。
645,986号に記載されており、これは、本明細書中で参考として援用される。本
発明は、hTRTポリヌクレオチド、プローブおよびプライマー、高度に精製された
hTR、hTRTおよびテロメラーゼ、ならびに抗テロメラーゼおよび抗TRT抗体のよう
な試薬(その全てを、アッセイ、例えば、コントロール、標準、結合剤またはハ
イブリダイゼーション剤などとして使用し得る)を供することによって部分的に
、以前に知られた方法の改良を提供することが認識される。
モジュレーターの同定のためのアッセイで有用であると認識される。このスクリ
ーニングアッセイは、テロメラーゼ活性の全体的もしくは部分的再構成によって
、または存在する活性の増加によって得られたテロメラーゼまたはhTRTを利用し
得る。上記のように、一般に、本発明によって提供されるアッセイおよびスクリ
ーニングを用いて、テロメアーゼのテロメリックDNAを合成する能力を試験し得
るか、またはhTRTおよびTRTのいくつかまたはすべての「部分的活性」を試験し
得る。このアッセイは、そのRNA部分または関連タンパク質と共にまたは無しで
テロメラーゼを発現するように操作された細胞のエクスビボ改変を取り入れるこ
とができ、これらを動物に再移植し得、そしてインビボ試験で使用し得る。従っ
て、本発明は、インビボアッセイおよびそこで有用なトランスジェニック動物を
提供する。これらのインビボアッセイ系は、1または数単位の内因性テロメラー
ゼ酵素複合体が欠失または阻害されている「ノックアウト」細胞、ならびに外因
性または内因性テロメラーゼ活性が再構成されまたは活性化されている細胞を使
用し得る。
たはTRTタンパク質のいずれかまたは全ての機能を改変または欠失させたテロメ
ラーゼおよびTRTタンパク質もまた、治療用薬剤を発見するために本発明のスク
リーニングで使用し得る。例えば、基質DNAに結合する、そのRNA部位(例えばhT
R)に結合する、テロメリックDNAの付加を触媒する、デオキシヌクレオチド基質
に結合する、核酸分解活性を有する、テロメア会合タンパク質または染色体構造
に結合するなどのその能力を喪失するようにTRTを操作し得る。得られた「変異
タンパク質」または「ムテイン(muteen)」を用いて、TRTタンパク質またはテ
ロメラーゼの1つ、いくつかの、または全ての機能または活性を特異的に調節す
る化合物を同定し得る。
1)一般
前記にて言及した試験化合物は、ポリマー(例えば、オリゴペプチド、ポリペ
プチド、オリゴヌクレオチド、およびポリヌクレオチド)、小分子、抗体(本明
細書では広く定義される)、糖、脂肪酸、ヌクレオチドおよびヌクレオチドアナ
ログ、天然に存在する構造のアナログ(例えば、ペプチド模倣物、核酸アナログ
等)、および多数の他の化合物を含む、広範な種々の化合物(天然および合成の
両方、有機および無機の両方)であり得る。
レーターを提供する。例示目的で、モジュレーターの例は、以下の化合物または
処置を含む:
(i)hTRTポリペプチド(例えば、酵素の活性部位)または他のテロメラーゼ成
分に結合し、そしてテロメラーゼ活性に影響する;
(ii)テロメラーゼ成分(例えば、hTRTまたはhTRT-hTR RNP)の(例えば、前記
第IV(D)節に記載したものを含む)テロメラーゼ会合タンパク質との会合を阻害
もしくは促進し、またはそれからの解離を阻害もしくは促進する;
(iii)テロメラーゼポリペプチド(例えば、hTRT)の、テロメラーゼRNA(例え
ば、hTR)との会合を阻害しもしくは促進し、またはそれらの解離を阻害しもし
くは促進する;
(iv)テロメラーゼポリペプチド(例えば、hTRT)の、染色体(例えば、テロメ
ア)または染色体DNA(例えば、テロメリックDNA)との会合を阻害しもしくは促
進し、またはそれからの解離を阻害しもしくは促進する;
(v)(例えば、hTRT遺伝子または別のテロメラーゼ成分の転写に影響する因子
(例えば、転写調節タンパク質)と相互作用することによって)遺伝子または遺
伝子産物に結合することによって、TRT遺伝子の転写、または遺伝子産物の翻訳
、輸送または安定性の速度またはレベルを変化させることを包含する、テロメラ
ーゼ成分遺伝子産物(例えば、hTRT遺伝子の産物)の発現を増加させまたは減少
させる。
テロメラーゼ活性の潜在的なモジュレーターはまた、ペプチド(例えば、阻害
性ペプチドモジュレイター(アンタゴニスト)およびアクチベーターペプチドモ
ジュレーター(アゴニスト)も含む。例えば、ランダムに生じた配列を有するオ
リゴペプチドをスクリーニングして、テロメラーゼ活性のペプチドモジュレータ
ー(アゴニストまたはインヒビター)を発見し得る。このようなペプチドを直接
薬物として用いて、テロメラーゼ活性を阻害し得る官能基の配向または位置を見
い出し得、次いで、これは小分子インヒビターの設計または試験に導かれ、ある
いは薬理学的利用性を増大させる化学修飾の基礎となる。ペプチドは構造的模倣
物であり得、テロメラーゼ酵素およびhTRTタンパク質の特徴的二次構造および/
または三次構造に基づいて模倣物を設計するための分子モデリングプログラムを
用いることができる。このような構造的模倣物もまた、テロメラーゼ活性のモジ
ュレーター(アゴニストおよびアンタゴニスト)としてインビボで治療的に用い
得る。構造的模倣物はまた、抗テロメラーゼまたは抗TRTタンパク質抗体を若起
するための免疫原として使用され得る。
さらに、非常に多数の潜在的に有用な活性修飾化合物を、供給源物質として天
然物質からの抽出物でスリーニングし得る。このような抽出物の供給源は、菌類
、放線菌、藻類、昆虫、原生動物、植物および細菌の多数の種由来であり得る。
次いで、阻害性活性を示すこれらの抽出物を分析して、活性分子を単離し得る。
例えば、Turner (1996) J. Ethnopharmacol. 51 (1-3);39-43 ;Suh (1995) Anti
cancer Res. 15:233-239を参照のこと。
本発明によって提供される1つの特に有用な組のインヒビターは、機能的hTRT
タンパク質の産生を妨げるかまたは阻害するいずれの場合にも、hTRTタンパク質
をコードするmRNAまたはhTRT遺伝子のいずれかに結合し得るオリゴヌクレオチド
を含む。本発明の他のオリゴヌクレオチドは、hTRのようなテロメラーゼのRNA部
位と相互作用するか、あるいはテロメラーゼまたはhTRTのそのDNA標的への、ま
たは1つのテロメラーゼ成分の別の成分または基質への結合を妨げ得る。このよ
うなオリゴヌクレオチドはまた、テロメラーゼ酵素、hTRTタンパク質、または双
方のタンパク質およびRNAの両方に結合し得、そしてその進行的活性、その逆転
写酵素活性、その核酸分解活性等のような上記の部分的活性を阻害する。会合は
、別の核酸への配列特異的ハイブリダイゼーションによるか、またはアプタマー
におけるように一般的結合によるか、または両方により得る。
ドでhTRT mRNAを標的化することによって阻害し得る。
を引き起こすオリゴヌクレオチドを含む。すなわち、オリゴヌクレオチドは、化
学的に修飾されるか、あるいはリボザイム、EDTA結合オリゴヌクレオチド、また
はプソラレンもしくはオリゴヌクレオチドに結合した他の架橋試薬のような共有
結合オリゴヌクレオチドの場合のように、このような切断を生じる酵素活性を有
する。上記ように、所望の活性を有するものについての多くの異なるこのような
オリゴヌクレオチドのプールをスクリーニングし得る。
チドを含む。特異的なポリペプチド標的に結合する二本鎖または一本鎖のDNAあ
るいは二本鎖または一本鎖のRNA分子は、「アプタマー」と呼ばれる。特異的オ
リゴヌクレオチド−ポリペプチド会合は、静電的相互作用によって媒介され得る
。例えば、アプタマーは、ポリアニオン性のヘパリンに生理学的に結合する、ト
ロンビン上のアニオン結合性エクソサイトに特異的に結合する(Bock (1992) Na
ture 355:564-566)。hTRTタンパク質はhTRおよびそのDNA基質の両方に結合する
ので、そして本発明は大量の精製された形態のhTRTおよび他のTRTタンパク質を
提供するので、当業者は本発明の方法を用い、TRT結合性アプタマーについて容
易にスクリーニングし得る。
例えば、RNAオリゴヌクレオチド)は、SELEXの技術を用いて産生し得る(Tuerk,
1977, Methods Mol. Biol. 67, 2190)。この技術において、標的への結合に対
して高親和性を有する分子および低親和性を有する分子の間の高程度の区別を引
き起こす条件を用いて、ランダム配列核酸の非常に大きなプール(106-109)を
標的(例えば、hTRT)に結合させる。結合した分子を非結合分子から分離し、そ
して末端に含まれる特異的核酸配列および適切な増幅試薬によって結合分子を増
幅する。このプロセスを、標的に対して高親和性を有する比較的少数の分子が残
るまで数回反復する。次いで、本明細書中に記載のように、これらの分子を、テ
ロメラーゼ活性を調節するそれらの能力について試験する。
に、相補的配列の認識または切断を介して、hTRの阻害(Norton (1996) Nature
Biotechnology 14:615-619)に基づき得る。
細胞に移入することができる。例えば、特異的修飾なしでオリゴヌクレオチドを
細胞質に送達し得る。あるいは、それらは、細胞の表面膜タンパク質レセプター
に付着し、その結果飲食される、細胞膜と融合するかまたは飲食されるリポソー
ムの使用によって、すなわち、リポソームに付着した、またはオリゴヌクレオチ
ドに直接付着したリガンドの使用により送達し得る。あるいは、細胞を透過性と
して、宿主細胞を傷つけることなく、オリゴヌクレオチドの細胞への輸送を増強
し得る。オリゴヌクレオチドを細胞への輸送が公知の、DNA結合性タンパク質、
例えばHBGF-1を使用できる。
標的RNAを切断するリボザイムの酵素部分に近くに保持されたリボザイムの標
的RNA結合部分を介して標的RNAに結合することによって、リボザイムは作用する
。従って、リボザイムは通常は相補的塩基対形成を介して標的RNAを認識しそれ
に結合し、そして一旦正しい部位に結合すれば、酵素的に作用して、標的RNAを
切断し不活化させる。そのような様式における標的RNAの切断は、切断がコード
配列内で起った場合、コードされたタンパク質の合成を指向するその能力を破壊
する。リボザイムがそのRNA標的に結合しそれを切断した後、典型的には、それ
はRNAから遊離され、従って、新規の標的に反復して結合しそれを切断できる。
本発明の1つの実施態様において、テロメラーゼを用いて、テロメラーゼ活性
を調節するか、またはさもなければそれを補うテロメラーゼ会合タンパク質、す
なわち、テロメラーゼアクセサリータンパク質を同定する。上記のように、これ
らのタンパク質またはそのフラグメントは、テロメラーゼ酵素複合体の解離を引
き起こし、またはその会合を妨げることによって、テロメラーゼ複合体の構築を
妨げることによって、hTRTがその核酸相補体にまたはそのDNAテンプレートに結
合するのを妨げることによって、hTRTがヌクレオチドを結合することを妨げるこ
とによりまたは上記のテロメラーゼ酵素もしくはhTRTタンパク質の部分的活性の
いずれか、またはいくつか、または全てを妨げ、増大させ、または阻害すること
によって機能を調節し得る。
部分(例えば、ドメイン)がテロメラーゼに接触するのかを同定し得る。本発明
の1つの実施態様において、これらのテロメラーゼ会合タンパク質またはそのフ
ラグメントは、テロメラーゼ活性のモジュレーターとして使用される。
ゼ関連タンパク質
本発明の1つの実施態様において、テロメラーゼ会合タンパク質は、テロメラ
ーゼ活性のモジュレーターとして使用される。テロメラーゼ活性タンパク質は、
ヒストン、核マトリックスタンパク質、細胞分裂および細胞周期制御タンパク質
等のような染色体構造を含む。本発明の目的のためにモジュレーターとして使用
し得る他のテロメラーゼ会合タンパク質は、p80およびp95タンパク質ならびにTP
1およびTRF-1のようなそれらのヒトホモログを含む(Chong, 1995, Science 270
:1663-1667)。さらに、これらのテロメラーゼ会合タンパク質のフラグメントは
、本発明の方法により当業者によって同定され得、そしてテロメラーゼ活性のモ
ジュレーターとして使用し得る。
上記のように、8つの高度に保存されたモチーフが、異なる非ヒト種のTRTの
間で同定されている(Lingner (1997) Science 276:561-567もまた、参照のこと
)。図4は、S. pombe Trtlp, Euplotes p123およびS. cerevisiae Est2pと比較
して、(pGRN121からの)ヒトTRTアミノ酸配列およびRTモチーフの概略を示す。
本発明は、これらのモチーフの8個全ての、それぞれにおける保存されたアミノ
酸残基に対するコドンが、単独で、あるいは1以上のさらなるコドンと組み合わ
されて、他のコドンのそれぞれに変更された組換えおよび合成核酸を提供する。
種々の得られたコード配列は非機能的hTRTを発現する。例えば、実施例16を参照
のこと。従って、本発明は、例えば、テロメラーゼの部分的活性を有するが、全
活性を有しない非常に広範囲の「変異した」テロメラーゼ酵素およびTRTタンパ
ク質を提供する。例えば、1つのこのようなテロメラーゼはテロメリック構造に
結合し得るが、テロメラーゼ会合RNA(すなわち、hTR)に結合し得ない。もし十
分に高いレベルで発現されれば、このようなテロメラーゼ変異体は、必要なテロ
メラーゼ成分(例えば、hTR)を枯渇させ得、それにより、野生型テロメラーゼ
活性のインヒビターとして機能する。このように作用する変異したテロメラーゼ
は、アンタゴニストまたはいわゆる「ドミナントネガティブ」変異体である。
一般に、本発明の抗体を用いて、テロメラーゼ酵素およびhTRTタンパク質のい
ずれかのまたは全ての活性を同定し、精製し、または阻害することができる。抗
体は、種々の方法、例えば、テロメラーゼ複合体またはヌクレオチドがそのDNA
基質に結合するのを妨げることによって、テロメラーゼの成分が活性複合体を形
成するのを妨げることによって、機能的(テロメラーゼ複合体)4次構造を維持
することによって、または活性に対してアロステリック効果を有する酵素の活性
部位または他の部位の1つに結合することによって、テロメラーゼ活性のアンタ
ゴニストとして作用できる(テロメラーゼの異なる部分的活性は本明細書の他の
箇所に詳細に記載されている)。
本発明のテロメラーゼモジュレーターは、コンビナトリアル法および合理的な
薬物デザイン技術を含む、薬学的分野で周知の方法を用いて作製されることが意
図される。
合成分子の大ライブラリーの作製および同時スクリーニングは、コンビナトリ
アル化学における周知の技術を用いて行い得る。例えば、van Breemen (1997) A
nal. Chem. 69:2159-2164;Lam (1997) Anticancer Drug Des. 12:145-167 (199
7)参照。
質のような、任意の標的に対する適切な結合親和性および特異性を有する特異的
オリゴヌクレオチド(または化合物)について迅速にスクリーニングし得る膨大
な数のオリゴヌクレオチド(または他の化合物)を作製し、利用し得る(一般的
背景情報については、Gold (1995) J. of Biol. Chem. 270: 13581-13584を参照
のこと)。
合理的薬物デザインは、標的分子の構造解析、合成化学、および進歩したコン
ピューター手段を含む方法論の一体化された組を含む。テロメラーゼ酵素および
hTRTタンパク質のような、タンパク質標的のアンタゴニスト/インヒビターのよ
うなモジュレーターを設計するのに使用する場合、合理的薬物デザインの目的は
、分子の三次元の形状および化学を理解することにある。合理的薬物デザインは
X線結晶解析データまたはNMRデータによって支援され、今や、本発明によって
提供される方法に従い、本発明によって提供される試薬を用い、hTRTタンパク質
およびテロメラーゼ酵素について測定し得る。静電気学、疎水性および溶媒接近
性についての計算も助けになる。例えば、Goldren (1997) Proc. Natl. Acad. S
ci. USA 94:6635-6640を参照のこと。
本発明はまた、試験化合物がTRT活性のモジュレーターであるか否かの決定を
助けるのに使用され得るキットを提供する。このキットは、典型的には、1つ以
上の以下の成分:実質的に精製されたTRTポリペプチドまたはポリヌクレオチド
(プローブおよびプライマー含む):細胞または無細胞発現系に導入された場合
にTRT(例えば、hTRT)を発現できるプラスミド;細胞または無細胞発現系に導
入された場合にTR(例えば、hTR)を発現できるプラスミド;細胞または細胞株
;TRT活性の変化を検出するための組成物;および試験化合物の存在下における
テロメラーゼ活性の変化は、試験化合物がテロメラーゼ活性を調節する指標であ
ることを示す、TRT活性の変化を検出し測定するための手段を教示する教示物質
、ならびに1つ以上の容器を含む。このキットはまた、TRT活性の変化を測定す
るための、TRAPアッセイ試薬または定量的ポリメラーゼ連鎖反応アッセイ用の試
薬のような手段を含むことができる。このキットはまた、試験化合物の存在下に
おけるテロメラーゼ活性の変化が試験化合物がテロメラーゼ活性を調節する指標
であることを示す、TRT活性の変化を検出し測定するための手段を教示する教示
物質を含み得る。
ル)
本発明はまた、コード配列または調節(例えば、プロモーター)配列であり得
る、外因性TRT遺伝子配列を含むトランスジェニック非ヒト多細胞生物(例えば
、植物または非ヒト動物)または単細胞生物(例えば、酵母)を提供する。1つ
の実施態様において、この生物は、ヒトTRTタンパク質の配列を有する外因性TRT
ポリペプチドを発現する。この関連する実施態様において、この生物はまた、テ
ロメラーゼRNA成分(例えば、hTR)を発現する。
ゼ会合タンパク質をコードする少なくとも1つの遺伝子が、天然のテロメラーゼ
が発現されないか、または野生型細胞または野生型生物と比較した場合低下した
レベルまたは異なる活性で発現されるように、変異または欠失している(すなわ
ち、コード領域または調節領域において)単細胞および多細胞生物(またはそれ
由来の細胞)を提供する。このような細胞および生物は、しばしば、「遺伝子ノ
ックアウト」細胞または生物といわれる。
しているか、または所望により変異または欠失され、そして外因性テロメラーゼ
遺伝子または変異体(例えば、ヒトTRT)が導入され発現される細胞および生物
を提供する。このタイプの細胞および生物は、例えば、hTRT活性または発現のモ
ジュレーターの同定;テロメラーゼ成分遺伝子における変異の効果の決定、およ
びテロメラーゼ活性の発生タイミングおよび組織位置の効果の決定のような他の
使用(例えば、テロメラーゼモジュレーターをいつ投与すべきかの評価、および
任意の可能な副作用の評価)のためのモデル系として有用である。
ル、類人猿、ブタおよび他の非ヒト哺乳動物のような非ヒト動物が挙げられる。
単細胞生物の例は酵母である。
に周知である。例えば、Baudinら, 1993, Nucl. Acids Res. 21:3329;Wachら,
1994, Yeast 10:1793; Rothstein, 1991, Methods Enzymol. 194:281;Anderson
, 1995, Methods Cell Biol. 48:31;Pettittら, 1996, Development 122:4149-
4157; Ramirez-Solisら, 1993, Methods Enzymol. 225:855;およびThomasら, 1
987, Cell 51:503を参照のこと、そのそれぞれは、その全体が全ての目的のため
に本明細書中で参考として援用される。
ラーゼ酵素複合体が欠失または阻害されている細胞および動物を含む。テロメラ
ーゼ活性の再構成は、細胞または動物を老化から、またはガン細胞については、
テロメアを維持するその無能力によって引き起こされる細胞死から救済する。内
因性遺伝子の発現を改変する方法は、当業者に周知である。典型的には、このよ
うな方法は、調節すべき特定の遺伝子の発現を制御する全てのまたは一部の調節
配列を改変するかまたは置き換えることを含む。調節配列(例えば、天然プロモ
ーター)は改変され得る。遺伝子の標的変異のための従来の技術は、目的の遺伝
子を含有するゲノムDNAフラグメントをベクターに入れ、続いてチミジンキナー
ゼを含有するベクター中の選択可能なネオマイシン−耐性カセットの回りに標的
化遺伝子の関連する2つのゲノムアームをクローニングすることを含む。次いで
、この「ノックアウト」構築物を適切な宿主細胞、すなわち、マウス胚性幹(ES
)細胞にトランスフェクトし、これを引き続いてノックアウトベクターで相同組
換えを受けた細胞の選択を可能にする陽性選択(例えば、ネオマイシン耐性につ
いて選択するためにG418を使用)および陰性選択(例えば、チミジンキナーゼを
欠く細胞を排除するためにFIAUを使用)に供する。このアプローチは、目的の遺
伝子の不活化に導く。例えば、米国特許第5,464,764号;同第5,631,153号;同第
5,487,992号;および同第5,627,059号を参照のこと。
酸を目的の遺伝子の調節配列(例えば、プロモーター)に導入することによって
達成され得る。機能的酵素または産物の発現を妨ぐためには、リーディングフレ
ームを改変するか、あるいはプロモーターを破壊する単純な変異が適切であり得
る。発現をアップレギュレートするために、天然プロモーターは、より高レベル
の転写を誘導する異種プロモーターで置換され得る。また、例えば、Holzschu (
1997) Transgenic Res. 6:97-106に記載されているように、「遺伝子トラップ挿
入」を用いて宿主遺伝子を破壊することができ、マウスES細胞を用いてノックア
ウトトランスジェニック動物を生産することができる。
核酸配列を用いることによって達成され得る。異種組換え構築物を標的化するた
めに上流配列を利用する。配列番号1のようなTRT構造遺伝子配列情報を利用し
、当業者は、日常的な実験のみにより相同組換え構築物を作製することができる
。内因性遺伝子の発現を改変するための相同組換えは、米国特許第5,272,071号
、およびWO 91/09955、WO 93/09222、WO96/29411、WO95/31560、およびWO91/126
50に記載されている。マイコバクテリウムにおける相同組換えは、Azad (1996)
Proc. Natl. Acad. Sci. USA 93:4787; Baulard (1996) J. Bacteriol. 178:309
1;およびPelicic (1996) Mol. Microbiol. 20:919によって記載されている。動
物における相同組換えは、Moynahan (1996) Hum. Mol. Genet. 5:875によって、
植物における相同組換えはOffinga (1990) EMBO J. 9:3077によって記載されて
いる。
以下の用語を以下に定義し、本発明の実施において当業者にさらなるガイダン
スを提供する:アジュバント、対立遺伝子(および対立遺伝子配列)、アミノ酸
(疎水性、極性、荷電を含む)、保存的置換、制御エレメント(および調節配列
)、誘導体化、検出可能な標識、上昇したレベル、エピトープ、好ましい予後ま
たは好ましくない予後、融合タンパク質、遺伝子産物、hTR、不死の、免疫原お
よび免疫原性、単離された、モジュレーター、モチーフ、核酸(およびポリヌク
レオチド)、オリゴヌクレオチド(およびオリゴマー)、作動可能に連結された
、ポリペプチド、プローブ(核酸プローブおよび抗体プローブ含む)、組換え体
、選択系、配列、特異的結合、ストリンジェントなハイブリダイゼーション条件
(およびストリンジェンシィー)、実質的な同一性(および実質的な類似性)、
実質的に純粋な(および実質的に精製された)、テロメラーゼ陰性およびテロメ
ラーゼ陽性細胞、テロメラーゼ触媒活性、テロメラーゼに関連した、および試験
化合物。
る免疫応答を増強する任意の物質のその通常の意味をいう。本発明において有用
なアジュバントは、フロイントのアジュバント、水酸化アルミニウムのような無
機物ゲル、ならびにリゾレシチン、プルロニックポリオール、ポリアニオン、ペ
プチド、油エマルジョン、キーホールリンペットヘモシアニン、およびジニトロ
フェノールのような表面活性物質を含むが、これらに限定されない。BCG(Bacil
lus Calmette-Guerin)およびCorynebacterium parvumは、潜在的に有用なアジュ
バントである。
配列(すなわち、hTRTタンパク質をコードする核酸)の別の形態をいう。対立遺
伝子は変異(すなわち、核酸配列における変化)から生じ、一般に、改変された
および/または異なって調節されるmRNAまたはポリペプチドを生成し、その構造
および/または機能は改変されてもよく、または改変されていなくてもよい。対
立遺伝子を生じさせる通常の変異変化は、一般に、コードされるアミノ酸に影響
し得るか、または影響し得ないヌクレオチドの天然の欠失、付加、または置換に
帰せられる。これらの型の変化のそれぞれは、単独で、他と組み合わせて、また
は所定の遺伝子、染色体もしくは他の細胞核酸内で1回以上起こり得る。いずれ
の所定の遺伝子も対立遺伝子形態を全く有さないか、1つまたは多くの対立遺伝
子形態を有し得る。本明細書中で使用する用語「対立遺伝子」は、遺伝子または
この遺伝子から転写されたmRNAのいずれか、または両方をいう。
いて明記される:アラニン(A)、セリン(S)、スレオニン(T)、アスパラ
ギン酸(D)、グルタミン酸(E)、アスパラギン(N)、グルタミン(Q)、
アルギニン(R)、リジン(K)、イソロイシン(I)、ロイシン(L)、メチ
オニン(M)、バリン(V)、フェニルアラニン(F)、チロシン(Y)、トリ
プトファン(W)、プロリン(P)、グリシン(G)、ヒスチジン(H)、シス
テイン(C)。合成および非天然アミノ酸アナログ(および/またはペプチド結
合)が含まれる。
およびMをいう。本明細書中で使用する「極性アミノ酸」とは、G、S、T、Y
、C、NおよびQをいう。本明細書中で使用する「荷電アミノ酸」とは、D、E
、H、KおよびRをいう。
にタンパク質の活性を改変しないタンパク質のアミノ酸組成の変化をいう。従っ
て、特定のアミノ酸配列の「保存的に修飾された変形」とは、タンパク質活性に
重要でないアミノ酸のアミノ酸置換、または重要なアミノ酸の置換でも実質的に
活性を改変しないような、類似の特性(例えば、酸性、塩基性、正にまたは負に
荷電した、極性または非極性等)を有する他のアミノ酸でのアミノ酸の置換をい
う。機能的に類似のアミノ酸を提供する保存的置換の表は、当該分野で周知であ
る。以下の6つの群はそれぞれ、互いについて保存的置換であるアミノ酸を含む
:1)アラニン(A)、セリン(S)、スレオニン(T);2)アスパラギン酸
(D)、グルタミン酸(E);3)アスパラギン(N)、グルタミン(Q);4
)アルギニン(R)、リシン(K);5)イソロイシン(I)、ロイシン(L)
、メチオニン(M)、バリン(V);および6)フェニルアラニン(F)、チロ
シン(Y)、トリプトファン(W)(Creighton (1984) Proteins, W. H. Freem
an and Companyも参照のこと)。当業者は、前記の置換が唯一可能な保存的置換
ではないことを認識する。例えば、全ての荷電アミノ酸は、それらが正または負
であるかにかかわらず、互いについて保存的置換であると考えられ得る。さらに
、コードされた配列において単一のアミノ酸または低い割合のアミノ酸を変化さ
せ、付加しまたは欠失させる個々の置換、欠失または付加もまた、「保存的に修
飾された変形」であり得る。天然または野生型遺伝子によって使用されるコドン
とは異なる1つ以上のコドンを利用することによって、組換えタンパク質中に「
保存的置換」がなされ得る。この場合、保存的置換はまた、アミノ酸のコドンを
同一のアミノ酸の異なるコドンで置き換えることを含む。
ー、プロモーター、転写ターミネーター、複製起点、染色体組込み配列、5'およ
び3'非翻訳領域を含み、これらとタンパク質または他の生物分子が相互作用して
転写および翻訳を行う。真核生物細胞について、制御配列は、プロモーターおよ
び好ましくはエンハンサー(例えば、免疫グロブリン遺伝子、SV40、サイトメガ
ロウイルス、およびポリアデニル化配列由来する)を含み、そしてスプライスド
ナーおよびアクセプター配列を含み得る。利用されるベクター系および宿主に依
存して任意の数の適切な転写および翻訳エレメント(構成的および誘導性プロモ
ーターを含む)が使用され得る。
たは核酸は、誘導体化置換基を含むオリゴヌクレオチドおよびポリヌクレオチド
をいう。いくつかの実施態様において、置換基は、相補的なポリヌクレオチドへ
のハイブリダイゼーションに関して実質的に干渉しない。(例えば、既に合成さ
れたオリゴヌクレオチドまたはポリヌクレオチドの修飾によるか、または合成の
間に修飾塩基または骨格アナログを取り込むことによって)付加された化学置換
基で修飾された誘導体化オリゴヌクレオチドまたはポリヌクレオチドを、代謝的
に活性な真核生物細胞に導入して、hTRT DNA、RNAまたはタンパク質にハイブリ
ダイズさせ得る。ここで、それらは局所的なDNA、RNA、またはタンパク質に対す
る改変または化学的修飾を生じる。あるいは、誘導体化オリゴヌクレオチドまた
は、ポリヌクレオチドは、hTRTポリペプチド、テロメラーゼ−関連タンパク質、
あるいはhTRT DNAもしくはhTRT遺伝子産物と相互作用するか、またはhTRT DNA、
RNAもしくはタンパク質の発現もしくは機能を改変するか、もしくは調節する他
の因子と相互作用させ、そしてそれを改変し得る。例示的な付着化学置換基は:
ユーロピウム(III)テキサフィリン(texaphyrin)、架橋剤、プソラレン、金
属キレート(例えば、鉄により触媒される切断についての鉄/EDTAキレート)、
トポイソメラーゼ、エンドヌクレアーゼ、エキソヌクレアーゼ、リガーゼ、ホス
ホジエステラーゼ、光力学ポリフィリン、化学療法剤(例えば、アドリアマイシ
ン、ドキシルビシン(doxirubicin)、インターカレート剤、塩基修飾剤、免疫
グロブリン鎖、およびオリゴヌクレオチドを含む。鉄/EDTAキレートは、ポリヌ
クレオチド配列の局所的切断が所望される場合にしばしば使用される化学置換基
である(Hertzbergら, 1982, J. Am. Chem. Soc. 104:313;HertzbergおよびDer
van, 1984, Biochemistry 23:3934;Taylorら, 1984, Tetrahedron 40:457;Der
van, 1986, Science 232: 464)。例示的な付着化学は、例えば、付加された反
応性アミノ基を介する直接的結合(CoreyおよびSchultz (1988) Science 238:14
01, これは本明細書中で参考として援用される)および他の直接的結合化学を含
むがストレプトアビジン/ビオチンおよびジゴキシゲニン/抗ジゴキシゲニン抗
体結合法もまた使用され得る。化学置換基を結合する方法は、本明細書中で参考
として援用される米国特許第5,135,720号、同第5,093,245号および同第5,055,55
6号に提供されている。他の結合化学は、従業者の裁量にて使用され得る。
し、そして分子の存在を(例えば、物理的または化学的特性により)検出するか
、分子の存在を示すか、または共有結合もしくは別の方法で会合する別の分子の
結合を可能するために使用されるか、または使用され得る原子(例えば、放射性
核種)、分子(例えば、フルオレセイン)、または複合体をいう。用語「標識」
はまた、基質に作用して検出可能な原子、分子または複合体を生じる共有結合し
た分子、または別の方法で会合した分子(例えば、酵素のような生物分子)をい
う。本発明で使用するのに適した検出可能な標識は、分光学的、光化学的、生化
学的、免疫化学的、電子的、光学的または化学的手段によって検出可能な任意の
組成を含む。本発明において有用な標識は、標識したストレプトアビジン結合体
で染色するためのビオチン、磁性ビーズ(例えば、DynabeadsTM)、蛍光色素(
例えば、フルオレセイン、テキサスレッド、ローダミン、緑色蛍光タンパク質、
増強された緑色蛍光タンパク質、リサミン、フィコエリトリン、Cy2、Cy3、Cy3.
5、Cy5、Cy5.5、Cy7、FluorX[Amersham]、SyBRグリーンI&II[Molecular Pr
obes]等)、放射性標識(例えば、3H、125I、35S、14Cまたは32P)、酵素(
例えば、ヒドロラーゼ、特にアルカリ性ホスファターゼのようなホスファターゼ
、エステラーゼおよびグリコシダーゼ、またはオキシドレダクターゼ、特に西洋
ワサビペルオキシダーゼのようなペルオキシダーゼ、およびELISAにおいて常用
される他のもの)、基質、補因子、インヒビター、化学ルミネセンス基、発色剤
、およびコロイド金またはまたは有色ガラスもしくはプラスチック(例えば、ポ
リスチレン、ポリプロピレン、ラテックス等)ビーズのような比色標識を含む。
このような標識の使用を教示する特許は、米国特許第3,817,837号;同第3,850,7
52号;同第3,939,350号;同第3,996,345号;同第4,277,437号;同第4,275,149号
;および同第4,366,241号を含む。このような標識を検出する手段は、当業者に
周知である。従って、例えば、放射性標識および化学ルミネセンス標識は、写真
フィルムまたはシンチレーションカウンターを用いて検出され得、蛍光マーカー
は、(例えば、蛍光活性化セルソーティングにおけるような)放射された光を検
出するための光検出器を用いて検出され得る。酵素標識は、典型的には、基質と
共に酵素を提供し、基質に対する酵素の作用によって生じた反応産物を検出する
ことによって検出され、比色標識は、有色標識を単に可視化することにより検出
される。従って、標識は、分光学的、光化学的、生化学的、免疫化学的、電子的
、光学的または化学的手段によって検出可能な任意の組成物である。標識は、当
該分野で周知の方法に従って、アッセイの所望の成分に直接的または間接的にカ
ップリングされ得る。非放射性標識は、しばしば間接的手段によって付着される
。一般に、リガンド分子(例えば、ビオチン)は、分子に共有結合している。次
いで、このリガンドは、本質的に検出可能であるか、またはシグナル発生系(例
えば、検出可能な酵素、蛍光化合物、もしくは化学ルミネセンス化合物)に共有
結合した抗リガンド(例えば、ストレプトアビジン)分子に結合させる。多数の
リガンドおよび抗リガンドが使用され得る。リガンドが天然の抗リガンド(例え
ば、ビオチン、チロキシンおよびコルチゾル)を有する場合、それを標識された
天然の抗リガンドと共に使用することができる。あるいは、いずれのハプテン化
合物または抗原化合物も抗体と組み合わせて用いることができる。また、この分
子は、例えば、酵素または発蛍光団と抱合することによってシグナル発生化合物
に直接結合させることもできる。標識を検出する手段は、当業者に周知である。
従って、例えば、標識が放射性標識である場合、検出のための手段は、シンチレ
ーションカウンター、オートラジオグラフィーにおけるような写真フィルム、ま
たは貯蔵(storage)蛍光体画像化を含む。標識が蛍光標識である場合、それは
蛍光色素を適切な波長の光で励起し、そして得られた蛍光を検出することによっ
て検出することができる。蛍光は目で、写真フィルムによって、電荷結合デバイ
ス(charge coupled device)(CCD)または光電子増倍管等のような電子検出器の
使用によって検出することができる。同様に、酵素標識は、酵素に対する適切な
基質を提供し、得られた反応産物を検出することによって検出できる。また、単
純な比色標識は、標識に結合する色を観察することによって検出できる。発蛍光
団の対をアッセイで使用する場合、それらは容易に識別され得るように異なる放
射パターン(波長)を有することがしばしば好ましいことが認識される。
については、個体または疾患に罹っていない個体における正常なテロメラーゼ陰
性細胞におけるレベル、および予後については、例えば、種々のグレードまたは
クラスの腫瘍由来の腫瘍細胞におけるレベル)よりも上昇したか、またはそれよ
りも高い細胞におけるhTRT遺伝子産物(または他の特定の物質または活性)の量
をいう。
の部位の通常の意味を有する。エピトープは、典型的には、全タンパク質の小さ
な部分であるアミノ酸のセグメントである。エピトープは、立体配座的(すなわ
ち、不連続的)であり得る。すなわち、それらは、タンパク質のフォールディン
グによって並べられた一次配列の非隣接部分によってコードされるアミノ酸から
形成されるものであり得る。
。ガンに関して、「好ましい予後」は、好ましくない予後を有するものと比較し
て好ましい予後を有する患者について、腫瘍の後退またはより長い生存期間の見
込みがあることを意味し、他方、「好ましくない予後」は、腫瘍がより攻撃的と
なるらしいことを、すなわち、より速く増殖しおよび/または転移し、その結果
、患者について貧弱な成果または疾患進行のより迅速な経過をもたらすらしいこ
とを意味する。
、単一のアミノ酸配列においては通常、共に融合されない2つの(またはそれよ
り多くの)異なる異種ポリペプチドよりなる、単一の隣接するアミノ酸配列をい
う。従って、融合タンパク質は、2つの全く異なるアミノ酸配列または2つの類
似したもしくは同一のポリペプチド配列を含有する単一のアミノ酸配列を含み得
る。但し、これらの配列は、天然で見い出される単一のアミノ酸配列における同
一の立体配座では通常、共に見い出されない。融合タンパク質は、一般に、組換
え核酸法(すなわち、その融合が本発明のポリペプチドをコードするセグメント
および異種タンパク質をコードするセグメントを含む、組換え遺伝子融合産物の
転写および翻訳の結果として)、または当該分野で周知の化学合成法のいずれか
を用いることによって調製することができる。融合タンパク質の非hTRT領域(単
数または複数)は、hTRTポリペプチドのアミノ末端もしくはカルボキシル末端、
または両方に融合されることができ、あるいは(部位挿入によって、またはアミ
ノ酸を置き換えることによって)非hTRT領域は、タンパク質配列の内部に挿入さ
れることができ、あるいは前記のものを組合せて行うことができる。
、または遺伝子によってコードされるか、もしくはRNAから翻訳されたタンパク
質をいう。
)とは、ヒトテロメラーゼおよび任意の天然に存在する対立遺伝子および変異体
または組換え変異体のRNA成分をいう。hTRは、その全体が全目的のために、本明
細書において参考として援用される米国特許第5,583,016号に詳細に記載されて
いる。
メラーゼ技術においてはその通常の意味を有し、明らかに制限されない複製能力
を有する細胞をいう。不死はまたそれらの非修飾対照物に対して増大した増殖能
を有する細胞を得る。不死化ヒト細胞の例は、悪性腫瘍細胞、生殖系列細胞、お
よびインビトロで培養された特定の形質転換ヒト細胞株(例えば、ウイルス性オ
ンコジーンまたはその他による形質転換により不死化した細胞)である。対照的
に、最も正常なヒト体細胞は有寿命性ものであり、すなわち、制限された複製能
を有し、有限数の細胞分裂の後に老化する。
るそれらの通常の意味を有する。すなわち、免疫原は、ヒトまたは動物への注入
に際して適応した免疫応答を誘導できる分子(例えば、タンパク質または他の抗
原)である。
1つのタンパク質および少なくとも1つのRNA)のような分子または組成物を言
及する場合、分子または組成物が、それがインビボまたは天然で生じる状態にお
いて会合する少なくとも1つの他の化合物(例えば、タンパク質、他のRNAまた
は他の汚染物)から分離されていることを意味する。従って、RNPが天然で会合
する任意の他の成分(例えば、細胞抽出物における細胞膜)から単離された場合
、このRNPは単離されたと考えられる。しかしながら、単離された組成物はまた
実質的に純粋であり得る。
)の「完全な」またはいずれかの「部分的活性」のいずれかまたは両方を、何ら
かの方法で変化させ得る任意の合成または天然の化合物または組成物をいう。モ
ジュレーターは、アゴニストまたはアンタゴニストであり得る。モジュレーター
は、任意の有機および無機化合物であり得る(例えば、小分子、ペプチド、タン
パク質、糖、核酸、脂肪酸等を含むが、これらに限定されない)。
タンパク質に共通の、または保存されるタンパク質における特徴または構造を規
定する隣接アミノ酸の配列(または隣接アミノ酸の配列をコードする核酸配列)
をいう。モチーフまたはコンセンサス配列は、保存された残基および保存されて
いない残基の両方を含み得る。モチーフ配列における保存された残基は、保存さ
れた残基または残基のクラス(すなわち、疎水性、極性、非極性、または他のク
ラス)が、典型的には、モチーフによって規定されるタンパク質のクラスの各タ
ンパク質(または遺伝子またはmRNA)において示された位置に存在することを示
す。モチーフはタンパク質のクラスに従って異なり得る。従って、例えば、逆転
写酵素は、1つ以上のモチーフによって規定され得るタンパク質のクラスを形成
し、そしてこのクラスはテロメラーゼ酵素を含む。しかしながら、テロメラーゼ
酵素はまた、そのクラスに特徴的なモチーフを有する酵素のクラスとしても規定
できる。当業者は、モチーフにおける保存された残基としての残基の同定は、モ
チーフによって規定されるクラスの各メンバーが示された位置において示された
残基(または残基のクラス)を有し、そしてクラスの1以上のメンバーが保存さ
れた位置において異なる残基を有し得ることを認識する。
的に使用される。用語「ポリヌクレオチド」の使用は、オリゴヌクレオチド(す
なわち、短いポリヌクレオチド)を排除することを意図せず、そして合成および
/または非天然核酸(すなわち、核酸アナログまたは修飾された骨格残基または
結合を含む)をいう。
7ヌクレオチドまたはそれ以上の核酸配列、および約100程度のヌクレオチドを
いい、これは、プライマー、プローブまたはアンプリマー(amplimer)として使用
できる。オリゴヌクレオチドは、しばしば、約10と約50ヌクレオチドとの間の長
さ、よりしばしば約14と約35ヌクレオチドとの間、非常にしばしば約15と約25ヌ
クレオチドとの間であり、そしてオリゴヌクレオチドまたはオリゴマーはまた、
合成および/または非天然核酸(すなわち、核酸アナログまたは修飾された骨格
残基または結合を含む)もいう。
ば、DNA)セグメントの間の機能的関係をいい;例えば、プロモーターまたはエ
ンハンサーは、それが適切な宿主細胞または他の発現系においてコード配列の転
写を刺激する場合、コード配列に作動可能に連結している。一般に、作動可能に
連結している配列は隣接しており、シグナル配列の場合には、隣接相およびリー
ディング相の両方である。しかしながら、エンハンサーは、その転写をエンハン
サーが増強するコード配列に密接して配置される必要はない。
書中で相互変換可能に使用され、アミド結合によって結合されたアミノ酸残基か
らなるポリマー(アミノ酸および結合)をいい、合成の、天然に存在するおよび
天然に存在しないそのアナログを含む。ペプチドはポリペプチドの例である。
う。プローブの1つの例は、実質的に相補的な核酸に特異的に結合する(すなわ
ち、アニールまたはハイブリダイズする)「核酸プローブ」である。プローブの
別の例は、対応する抗原またはエピトープに特異的に結合する「抗体プローブ」
である。
ンビトロで操作されたポリヌクレオチド(例えば、「組換えポリヌクレオチド」
)、細胞もしくは他の生物学的系において遺伝子産物を産生するための組換えポ
リヌクレオチドを用いる方法、または組換えポリヌクレオチドによってコードさ
れるポリペプチド(「組換えタンパク質」)をいう。
おいて、目的の組換え核酸を含有する細胞を同定しおよび/または選択する方法
をいう。非常に多様な選択系が形質転換細胞の同定のために知られており、そし
て本発明での使用に適切である。例えば、プラスミドまたは他のベクターにより
形質転換された細胞は、周知のamp、gpt、neoおよびhyg遺伝子、またはそれぞれ
tk-細胞またはaprt-細胞において使用できる単純ヘルペスウイルスチミジンキナ
ーゼ(Wiglerら, Cell 11:223-32 [1977])遺伝子およびアデニンホスホリボシル
トランスフェラーゼ(Lowyら, Cell 22:817 [1980])遺伝子のような他の遺伝子
のような、プラスミド上に含まれる遺伝子によって付与される抗生物質に対する
耐性によって選択できる。また、抗代謝産物耐性、抗生物質耐性または除草剤耐
性を選択のための基準として使用することもできる;例えば、耐性をメトトレキ
セートに付与し、遺伝子増幅にも有用であるdhfr(Wiglerら, Proc. Natl. Acad
. Sci., 77:3567 [1980]);アミノグリコシドネオマイシンおよびG418に対して
耐性を付与するnpt(Colbere-Garapinら, J. Mol. Biol. 150:1 [1981])および
、それぞれ、クロロスルフロン(chlorsulfuron)およびホスフィノトリシン(phos
phinotricin)アセチルトランスフェラーゼに対する耐性を付与するalsまたはpat
(Murry, McGraw Hill Yearbook of Science and Technology, McGraw Hill, Ne
w York NY, 191-196頁 [1992])。さらなる選択可能な遺伝子が記載されている。
例えば、トリプトファンの代わりにインドールを細胞が利用すること可能にする
ハイグロマイシン耐性付与遺伝子trpB、ヒスチジンの代わりにヒスチノールを細
胞が利用することを可能にするhisD(HartmanおよびMulligan, Proc, Natl. Aca
d. Sci, 85:8047 [1988])。最近、可視化マーカーが好まれ、アントシアニン、
β-グルクロニダーゼおよびその基質のGUS、ならびにルシフェラーゼおよびその
基質のルシフェリンのようなマーカーが、形質転換体を同定するためだけでなく
、特異的ベクター系に帰せられる一過性または安定なタンパク質発現の量を定量
するために広く利用されている。(Rhodesら, Meth, Mol. Biol., 55:121 [1995
])。
、またはペプチドの「配列」は、二本鎖DNA分子の片鎖または両鎖におけるヌク
レオチドの順序、例えば、コード鎖およびその相補体の両方の配列、または一本
鎖核酸分子の配列をいい、また、ペプチドまたはタンパク質におけるアミノ酸の
順序をいう。
てでさえ他方の特異的分子と接触および会合する一方の分子、典型的には抗体ま
たはポリヌクレオチドの能力をいう。例えば、一本鎖ポリヌクレオチドは配列が
相補的である一本鎖ポリヌクレオチドに特異的に結合でき、そして抗体はその対
応する抗原に特異的に結合できる(または「それと特異的に免疫反応する」)。
たは「ストリンジェンシー」は、標的に対する正確なほとんど正確な相補性を有
する標的配列およびプローブの融解温度(Tm)未満の約5℃〜約20℃または25
℃の範囲の条件をいう。本明細書中で使用するように融解温度は、二本鎖核酸分
子の集団が半解離して一本鎖になる温度である。核酸のTmを計算する方法は当
該分野において周知である(例えば、BergerおよびKimmel (1987) METHODS IN E
NZYMOLOGY, VOL. 152:GUIDE TO MOLECULAR CLONING TECHNIQUES, San Diego:Ac
ademic Press,Inc.およびSambrooksら、(1989) MOLECULAR CLONING : A LABOR
ATORY MANUAL, 第2版, 第1-3巻 Cold Spring Harbor Laboratory、以後「Sambr
ook」) (共に本明細書中で参考として援用される)。標準的な文献によって示さ
れるように、Tm値の簡単な見積もりは、核酸が1M NaClの水溶液中に存在する場
合等式:Tm=81.5+0.41(%G+C)によって計算することができる。(例えば、
AndersonおよびYoung, Quantitative Filter Hybridization in NUCLEIC ACID H
YBRIDIZATION (1985) を参照のこと)。他の文献は、Tmの計算に構造ならびに配
列特徴を考慮するより精巧な計算を含む。ハイブリッドの融解温度(従ってスト
リンジェントなハイブリダイゼーションについての条件)は、プローブの長さお
よび性質(DNA、RNA、塩基組成物)および標的の性質(溶液中に存在するまたは
固定化されるDNA、RNA、塩基組成物)、ならびに塩および他の成分の濃度(例え
ば、ホルムアミド、デキストラン硫酸、ポリエチレングリコールの存在および非
存在)のような種々の因子によって影響される。これらの因子の影響は周知であ
り、当該分野における標準的な文献で考察されている。例えば、Sambrook(前掲
)およびAusubelら(前掲)を参照のこと。典型的には、ストリンジェントなハ
イブリダイゼーション条件は、pH7.0〜8.3の約1.0M未満のナトリウムイオン塩濃
度、典型的には、約0.01〜1.0Mのナトリウムイオンの塩濃度、ならびに短いプロ
ーブ(例えば、10〜50ヌクレオチド)については少なくとも約30℃の温度、長い
プローブ(例えば、50を超えるヌクレオチド)については少なくとも約60℃の温
度である。前記したように、ストリンジェントな条件は、ホルムアミドのような
不安定化剤の添加で達成することもでき、この場合、より低い温度が使用され得
る。
は「実質的な類似性」は、核酸の情況においては、2つのポリヌクレオチドの間
の配列類似性の尺度をいう。実質的な配列同一性はストリンジェントな条件下で
のハイブリダイゼーション、直接的比較、または他の手段によって決定される。
例えば、2つのポリヌクレオチドは、それらがストリンジェントなハイブリダイ
ゼーション条件下で相互に特異的にハイブリダイズし得る場合、実質的配列同一
性を有するとして同定される。配列同一性の他の程度(例えば、「実質的」未満
)は、異なるストリンジェンシーの条件下でのハイブリダイゼーションによって
特徴付けることができる。あるいは、実質的な配列同一性は、2つのヌクレオチ
ド(またはポリペプチド)配列の間のパーセント同一性として記載できる。2つ
の配列は、それらが少なくとも約60%同一である場合、好ましくは少なくとも約
70%同一である場合、または少なくとも約80%同一である場合、または少なくと
も約90%同一である場合、または少なくとも約95%もしくは98%〜100%同一で
ある場合、実質的に同一であると考えられる。配列(ヌクレオチドまたはアミノ
酸)のパーセント同一性は、典型的には、2つの配列の間の最適アライメントを
決定し、そして2つの配列を比較することによって算定される。例えば、タンパ
ク質発現で用いる外因性転写物は、参照配列(例えば、対応する内因性配列)と
比較した同一性または類似性の特定のパーセントを有するとして記載され得る。
配列の最適アライメントがNeedlemanおよびWunsch (1970) J. Mol. Biol. 48:44
3の相同性アライメントアルゴリズムによって、PearsonおよびLipman (1988) Pr
oc. Natl. Acad. Sci. USA 85:2444の類似性方法のためのサーチによって、これ
らのアルゴリズムのコンピューター実行によって(Wisconsin Genetics Softwar
e Package, Genetics Computer Group, 575 Science Dr.、Madison、WIにおける
GAP、BESTFIT、FASTA、およびTFASTA)、または検分によって、SmithおよびWater
man (1981) Adv. Appl. Math. 2:482の局所相同性アルゴリズムを用いて行われ
得る。種々の方法によって得られた最良のアライメント(すなわち、最高パーセ
ントの同一が得られること)を選択する。典型的には、これらのアルゴリズムは「
比較ウィンドウ」(通常は少なくとも18ヌクレオチドの長さ)にわたって2つの配列
を比較して、配列類似性の局所的領域を同定および比較し、従って、小さい付加
または欠失(すなわち、ギャップ)を可能にする。付加および欠失は、典型的には
、付加または欠失を含まない参照配列に対して配列の20パーセント以下の長さで
ある。特定の長さまたは領域を参照して、2つの配列の間の配列同一性を記載す
ることが時々望ましい(例えば、2つの配列は、少なくとも500塩基対の長さにわ
たって少なくとも95%の同一性を有するとして記載され得る)。通常、長さは少
なくとも約50、100、200、300、400、または500塩基対、アミノ酸、または他の
残基である。配列同一性のパーセントは、比較の領域にわたって最適にアライメ
ントされた2つの配列を比較する工程、同一の核酸塩基(例えば、A、T、C、Gま
たはU)が両配列に生じる位置の数を決定して適合された位置の数が得られ、そし
て参照配列または比較領域における塩基の総数と比較して適合した位置の数(ま
たはパーセント)を決定する工程によって計算される。配列類似性を測定するの
に適したさらなるアルゴリズムはBLASTアルゴリズムであり、これはAltschul (1
990) J. Mol. Biol. 215:403-410;およびShpaer (1996) Genomics 38:179-191
に記載されている。BLAST解析を実行するためのソフトウェアは、National Cent
er for Biotechnology Information (http://www.ncbi.nlm.nih.gov/)で公的に
入手可能である。このアルゴリズムは、データベース配列における同一長さのワ
ードとアラインされる場合に、いくつかの陽性評価された閾値スコアTに適合す
るかまたはそれを満足するかのいずれかである問題の配列中に長さWの短いワー
ドを同定することによって、最初に高スコアの配列対(HSP)を同定することを
含む。Tは隣接するワードスコア閾値といわれる(Altschulら、前掲)。これら
の最初の隣接ワードのヒットは、それらを含むより長いHSPを見い出すためのサ
ーチを開始するための核として作用する。ワードのヒットは、累積アライメント
スコアが増加し得る限り、各配列に沿って両方向に拡張される。各方向における
ワードヒットの拡張は:累積アライメントスコアがその最大達成値から未知数X
だけ遠ざかる場合;累積スコアが、1以上の負のスコアリング残基アライメント
の累積のために0以下になる場合;またはいずれかの配列の端に到達する場合に
停止される。BLASTアルゴリズムのパラメーターであるW、T、およびXはアラ
イメントの感度およびスピードを決定する。BLASTプログラムは、デフォールト
として、11のワード長(W)、BLOSUM62スコアリングマトリックス(Henikoff (
1992) Proc. Natl. Acad. Sci. USA 89:10915-10919を参照のこと)の50のアライ
メント(B)、10の予測(E)、M=5、N=4、および両鎖の比較を使用する。用語
BLASTは、2つの配列の間の類似性の統計的解析を行うBLASTアルゴリズムをいう
。Karlin (1993) Proc. Natl. Acd. Sci. USA 90:5873-5787を参照のこと。BLAS
Tアルゴリズムによって提供される類似性の1つの尺度は、最小合計確率(P(N)
)であり、これは2つの核酸配列またはアミノ酸配列の間の適合性が偶然に起こ
る確率の指標を提供する。例えば、TRT核酸に対する試験核酸の比較において最
小合計確率が約0.5、0.2、0.1、0.01、または0.001未満である場合、核酸はTRT
核酸に類似すると考えられ得る。あるいは、2つの核酸配列が類似するという別
の指標は、第1の核酸がコードするポリペプチドが、第2の核酸によってコード
されるポリペプチドと免疫学的に交差反応性であるということである。
は「実質的な類似性」は、ポリペプチドの情況においては、2つのポリペプチド
の間の類似性の程度をいい、ここで、ポリペプチドは、参照配列に対して少なく
とも70%の配列同一性、または参照配列に対して80%、または85%、または100
%の配列同一性、または最も好ましくは10〜20アミノ酸残基の比較ウィンドウに
わたって、90%の同一性を有する配列を含む。アミノ酸配列類似性または配列同
一性は、必要であれば、必要とされるギャップを導入することによって、残基の
適合を最適化することによって決定される。Needlehamら, (1970) J. Mol. Biol
. 48:443-453; およびSankoffら, 1983, Time Warps, String Edits, およびMac
romolecules, The Theory and Practice of Sequence Comparison, 第1章,Add
ison-Wesley, Reading, MA; ならびにIntelliGenetics, Mountain View, CA、お
よびthe University of Wisconsin Genetics Computer Group, Madison, WIから
のソフトウェアパッケージを参照のこと。当業者に明らかなように、用語「実質
的な同一性」、「実質的な類似性」および「実質的な配列同一性」は、ポリペプ
チドまたはポリヌクレオチドに関して相互変換的に使用できる。
は、抗体(例えば、抗hTRT抗体)のような特定の試薬を含む組成物をいう場合、
この特定の試薬がこの組成物(例えば、溶媒または緩衝液は含まない)の少なく
とも約75%、または少なくとも約90%、または少なくとも約95%、または少なく
とも約99%以上であることを意味する。従って、例えば、hTRTポリペプチドに特
異的に結合する本発明の好ましい免疫グロブリン調製物が実質的に精製されてい
る。
ない、すなわちテロメラーゼ触媒活性のための通常のアッセイまたはTRAPアッセ
イを用いてテロメラーゼ触媒活性が検出できない細胞である。本明細書中で使用
する「テロメラーゼ陽性」細胞は、テロメラーゼが発現される(すなわち、テロ
メラーゼ活性が検出できる)細胞である。
胞におけるテロメラーゼ活性の異常に高いレベルと相関するか、ほとんどの正常
体細胞についてのいずれのテロメラーゼ活性をも含み得るか、または正常細胞機
能の減損を生じる低レベルのテロメラーゼ活性と相関する、被験体における疾患
または症状である。テロメラーゼ関連性疾患の例としては、例えば、ガン(悪性
細胞における高いテロメラーゼ活性)および不妊症(生殖系細胞における低いテ
ロメラーゼ活性)が挙げられる。
然の化合物または組成物をいう。この用語は、全ての有機化合物および無機化合
物を含み;例えば、小分子、ペプチド、タンパク質、糖、核酸、脂肪酸などが挙
げられる。
以下の実施例は本発明を説明するために提供され、本発明を限定するものでは
ない。
μM(マイクロモル濃度);N(規定);mol(モル);mmol(ミリモル);μmol
(マイクロモル);nmol(ナノモル);g(グラム);mg(ミリグラム);μg
(マイクログラム);ng(ナノグラム);lまたはL(リットル);ml(ミリリ
ットル);μl(マイクロリットル);cm(センチメートル);mm(ミリメート
ル);μm(マイクロメートル);nm(ナノメートル);℃(度摂氏);RPN(リ
ボ核タンパク質);mreN(2'-O-メチルリボヌクレオチド);dNTP(デオキシリ
ボヌクレオチド);dH2O(蒸留水);DDT(ジチオスレイトール);PMSF(フッ
化フェニルメチルスルホニル);TE(10mM Tris HCl、1mM EDTA、約pH7.2);KG
lu(グルタミン酸カリウム);SSC(塩およびクエン酸ナトリウム緩衝液);SDS
(ドデシル硫酸ナトリウム);PAGE(ポリアクリルアミドゲル電気泳動);Nove
x(Novex, San Diego, CA); BioRad(Bio-Rad Laboratories, Hercules, CA);
Pharmacia (Pharmacia Biotech, Piscataway, NJ);Boehringer-Mannheim (Boeh
ringer-Mannheim Corp., Concord, CA);Amersham (Amersham, Inc.,Chicago, I
L);Strategene (Strategene Cloning System, La Jolla, CA);NEB(New Englan
d Biolabs, Beverly, MA); Pierce (Pierce Chemical Co., Rockford, IL);Bec
kman (Beckman Instruments, Fullerton, CA);Lab Industries (Lab Industrie
s, Inc., Berkeley,CA);Eppendorf (Eppendorf Scientific, Madison, WI);お
よびMolecular Dynamics (Molecular Dynamics, Sunnyvale, CA)。
テロメラーゼタンパク質およびクローンの単離
以下の実施例は、種々の生物からのテロメラーゼタンパク質およびクローンの
単離(euplotes p.123のhTRT、TRT、およびS. pombe TRTテロメラーゼcDNAクロ
ーンを含む)を詳細に記載する。
i)序説
この節は、TRT遺伝子の精製およびクローニングの概説を提供し、本実施例の
以下の節においてより詳細に記載する。テロメラーゼRNAサブユニットは、繊毛
虫、酵母および哺乳動物において同定されてきたが、この酵素のタンパク質サブ
ユニットは、本発明の前には、それ自体が同定されていなかった。繊毛虫原生動
物のEuplotes aediculatus由来のテロメラーゼの精製により、p123およびp43と
呼ばれる2つのタンパク質が得られた(以下を参照; Lingner (1996) Proc. Nat
l. Acad. Sci. U.S.A. 93:10712)。Euplotes aediculatusは、約8×107個のテロ
メアおよび約3×105個のテロメラーゼ分子を含有する大核を有する貧毛の(hypo
trichous)繊毛虫である。精製の後、活性なテロメラーゼ複合体は、66kD RNAサ
ブユニットおよび約123kDおよび43kDの2つのタンパク質に対応する約230kDの分
子量を有した(Linger (1996), 前掲)。光架橋実験により、より大きいp123タン
パク質がテロメアDNA基質の特異的結合に関与することが示された(Lingner, (1
996), 前掲)。
ードするcDNAクローンが単離された。これらのEuplotes配列は、Tetrahymenaの
テロメラーゼ会合性タンパク質であるp80およびp95に関連しないことが見出され
た。Euplotes p123の配列解析により逆転写酵素(RT)モチーフが示された。さ
らに、他の配列との比較によるEuplotes p123の配列解析により、Est2タンパク
質と呼ばれる酵母ホモログが示された(Lingner (1997) Science 276:561)。酵
母Est2はインビボにおけるテロメラーゼ維持に必須であることは以前に示されて
いるが(Lendvay (1996) Genetics 144:1399)、テロメラーゼ触媒タンパク質と
しては同定されていなかった。部位特異的変異誘発により、酵母Est2のRTモチー
フがインビボおよびインビトロでのテロメアDNA合成のために必須であることが
示された(Lingner(1997)、前掲)。
S. pombeのDNAのPCR増幅を、以下に記載するEuplotes p123RTモチーフから設
計された縮重配列プライマーを用いて行った。生成された4つの顕著なPCR産物
のうち、120塩基対バンドが、p123およびEst2に相同なペプチド配列をコードし
ていた。このPCR産物をコロニーハイブリダイゼーションにおいてプローブとし
て用い、S. pombeのゲノムライブラリーから重複する2つのクローンを、および
S. pombe cDNAライブラリーから3つのクローンを同定した。配列分析により、
3つのS. pombe cDNAクローンのうちのいずれもが全長ではないことが示され、
従って、RT-PCRを用いてタンパク質のN末端をコードする配列を得た。
伝子、trt1が示された。trt1の完全なヌクレオチド配列は、GenBankに、アクセ
ス番号AF015783で寄託された(図15を参照のこと)。
構築物を作製した。配列の解析により、trt1が116kDの予測される分子量を有す
る塩基性タンパク質をコードすることが示された。p123およびEst2との相同性は
、7つの逆転写酵素モチーフ(下線を施し、およびモチーフ1、2、A、B、C
、DおよびEと命名する(図63参照))において特に高いことが見出された。別
のテロメラーゼ−特異的モチーフ(T−モチーフと命名)がまた見出された。36
〜71塩基対の大きさの範囲の15個のイントロンが、コード配列を中断していた。
物を作製した。1つはRTドメインにおいてモチーフB〜Dのみを除去した。2つ
目は、オープンリーディングフレームの99%を除去した。
復に対するハイブリダイゼーションがほとんど検出できなくなる点までの進行的
テロメア短鎖化を示した。trt1+/trt1-ディプロイドは胞子を形成し、得られた
テトラドを切り開き、アミノ酸を補足した酵母エキス培地で発芽させた(YESプ
レート、Alfa(1993) Experiments with Fission Yeast, Cold Spring Harbor L
aboratory Press, Cold Spring Harbor, NY)。各胞子に由来するコロニーを3日
間32℃で増殖させ、3日毎に新鮮なYESプレートに順次、ストリークした。各ラ
ウンドからのコロニーを、32℃で、6mlのYES液体培養に入れ、そして静止期ま
で増殖させた。ゲノムDNAを調製した。ApaIでの消化した後、DNAを2.3%アガロ
ースゲル上での電気泳動に供し、エチジウムブロミドで染色して、各レーンにお
けるほぼ等しいローディングを確認し、次いで、ナイロンメンブレンに移し、テ
ロメアDNAプローブにハイブリダイズさせた。
するかまたは増殖できないことによって、およびぎざぎざの縁が増大するコロニ
ーによって(図22Cに示したコロニー形態)によって、および細長い細胞の高画
分率が増大することによって(図22Dに示す)、老化が示された。細胞を、写真
をとる前に、塩化アンモニウムをグルタミン酸で置き換えた最小培地(Alfa (19
93),前掲)上で、32℃で2日間、平板培養した。
を受けないことが見出された。同じテロメラーゼ陰性(trt1-)細胞集団は、分
裂を続けるが、頻繁に非分裂子孫を産生する正常な大きさの細胞を常に含んだ。
テロメラーゼ陰性生存種は、種々のテロメア−複製遺伝子が欠失された発芽酵母
株について記載されているテロメア維持の組換え態様を使用し得る(Lendvay (1
996), 前掲, Lundblad (1993) Cell 73:347)。
Euplotesの123kDaペプチドおよび核酸配列、ならびにSchizosaccharomycesタ
ンパク質および対応するcDNA(tez1)配列を用いる、dbEST(発現された配列タ
グ)GenbankデータベースのBLASTサーチによって、ヒトテロメラーゼ逆転写酵素
(hTRT)cDNAに由来するEST(発現された配列タグ)を同定した。Genbank AA281
96と命名されたESTは、389ヌクレオチド長であり、これはクローン712562の1679
〜2076位(図18)に対応し、I.M.A.G.E. Consortium (Human Gemone Center, DOE,
Lawrence Livermore National Laboratory, Livermore, CA)から得られた。こ
のクローンは、扁桃腺細胞のフローソーティングによって得られた胚芽B細胞の
cDNAライブラリーから得られた。このhTRTcDNAクローンの完全な配列決定は、8
つのテロメラーゼRT(TRT)モチーフの全てを示した。しかし、このhTRTクロー
ンは、RTモチーフB’、C、D、およびEが、よりN末端側のRTモチーフではな
く異なるオープンリーディングフレームに含まれていたので、TRTの隣接部分を
コードしなかった。さらに、RTモチーフAとBとの間の距離は、3つの以前に知
られている(非ヒト)TRTのものよりも実質的に短かった。
ヒト293細胞株(前記)に由来するcDNAライブラリーをスクリーニングした。293
細胞株由来のλcDNAライブラリーを、各約200,000プラークを含有する25プール
に分配した。プライマー対、5'-CGGAAGAGTGTCTGGAGCAA-3'および5'-GGATGAAG
CGGAGTCTGGA-3'でのPCRによって各プールをスクリーニングした。1つの陽性一
次プールの6つのサブプールを、この同じプライマー対を使用するPCRによって
さらにスクリーニングした。一次および二次サブプールスクリーニングの両方に
ついて、hTRTを94℃、45秒;60℃、45秒;および72℃、90秒での合計31サイクル
で増幅した。コントロールとして、ハウスキーピング酵素GAPDHのRNAを、プライ
マー対5'-CTCAGACACCATGGGGAAGGTGA-3'および5'-ATGATCTTGAGGCTGTTGTCATA-
3'を用い、94℃、45秒;55℃、45秒;および72℃、90秒での合計16サイクルで
増幅した。
12562の5'領域由来のプローブを用いたプラークハイブリダイゼーションによっ
てスクリーニングした。1つのファージは陽性として同定された(λファージ25
-1.1と命名、ATCC209024、1997年5月12日に寄託)。これは、約4kbのインサー
トを含有した。このインサートを切り出し、そしてEcoRIフラグメントとしてpBl
uescript II SK+ベクター(Stratagene, San Diego、CA)のEcoRI部位にサブク
ローニングした。このcDNAクローンを含有するプラスミドを、pGRN121と命名し
た。cDNAインサートは、合計で約4kb対である。ヒトhTRT cDNA(pGRN121)の完
全なヌクレオチド配列を、Genbankに寄託し(アクセス番号AF015950)、そして
プラスミドをATCCに寄託した(1997年5月6日寄託;ATCC209016)。
この実施例では、E. aediculatusの培養物は、David Prescott博士(MCDB、Un
iversity of Colorado)から入手した。Prescott博士は最初にこの培養を池の水
から単離したが、この培養物はATCC(ATCC#30859)からも入手できる。栄養源と
してChlorogoniumを含有する15リットルのガラス製容器中、非滅菌条件下で、Sw
antonら (Swantonら, Chromosoma 77:203 [1980])によって記載されているよう
に培養物を増殖させた。密度が約104細胞/mlに到達した時に、生物を培養物か
ら収集した。
本実施例では、後記するように、E. aediculatusの核抽出物をLingnerら (Lin
gnerら, Genes Develop., 8:1984 [1994])の方法をわずかに改変して用いて調製
した。簡潔には、パートBに記載したように増殖した細胞を15μm Nytexフィル
ターで濃縮し、そして氷上で冷却した。細胞ペレットを110mlの最終容量のTMS/P
MSF/スペルミジンリン酸緩衝液に再懸濁した。ストックのTMS/PMSF/スペルミジ
ンリン酸緩衝液は、0.075gのスペルミジンリン酸(USB)および0.75mlのPMSF(
エタノール中で調製した100mMストック由来の)を150mlのTMSに添加することに
よって調製した。TMSは10mM Tris酢酸、10mM MgCl2、85.5752gのスクロース/リ
ットル、および0.33297gのCaCl2/リットル、pH7.5を含む。
び94.1gのスクロースを添加し、そして混合物を、オーバーヘッドモーターに連
結させたステンレス鋼撹拌ロッド付きのシリコンガラスビーカーに入れた。混合
物を、細胞が完全に溶解するまで撹拌した(約20分)。次いで、Beckman JS-13
スイングアウトローターを用いて、4℃で、7500rpm(8950×g)で10分間、混合物
を遠心分離した。上清を除去し、そして核ペレットをTMS/PMSF/スペルミジンリ
ン酸緩衝液で再懸濁し、そしてBeckman JS-13 スイングアウトローターを用いて
、4℃で、7500rpm(8950×g)で5分間、再度遠心分離した。
量で、50mM Tris酢酸、10mM MgCl2、10%グリセロール、0.1%NP-40、0.4M KGlu
、0.5mM PMSF、pH7.5を含む緩衝液で再懸濁した。次いで、再懸濁した核を約50
ストロークでガラスホモジナイザーに入れ、次いで、Eppendorf遠心分離機で、
4℃で、14,000rpmにて25分間遠心分離した。核抽出物を含有する上清を収集し
、液体窒素中で凍結し、そして使用するまで-80℃で保存した。
本実施例では、パートCに記載したように調製した核抽出物を用いて、E. aed
iculatusテロメラーゼを精製した。この精製プロトコルにおいて、Affi-Gel-ヘ
パリンカラムのクロマトグラフィーによってまずテロメラーゼを富化し、そして
次いで、アンチセンスオリゴヌクレオチドを用いるアフィニティー精製によつて
大量に精製した。テロメラーゼRNAのテンプレート領域は、テロメラーゼRNP粒子
におけるハイブリダイゼーションに利用できるので、テロメラーゼについての親
和性罠(bait)としてのこのテンプレート領域に相補的なアンチセンスオリゴヌク
レオチド(すなわち、「アフィニティーオリゴヌクレオチド」)を合成した。ビ
オチン残基を、それをアビジンカラムに固定化するために、オリゴヌクレオチド
の5'末端に含めた。
換オリゴヌクレオチドの使用によってテロメラーゼを溶出させた。アフィニティ
ーオリゴヌクレオチドは、テロメラーゼ−特異的配列の5'側のテロメラーゼRNA
に相補的ではないDNA塩基を含んだ。置換オリゴヌクレオチドは、その全長につ
きアフィニティーオリゴヌクレオチドに相補的であったので、アフィニティーオ
リゴヌクレオチドに結合したテロメラーゼよりもよりさらに熱力学的に安定な二
本鎖を形成し得た。従って、置換オリゴヌクレオチドの添加により、カラムから
テロメラーゼが溶出された。
で凍結した。これは630リットルの培養物(すなわち、約4×109細胞)に対応し
た。核抽出物を緩衝液で410mlに希釈して、最終濃度20mMのTris酢酸、1mM MgCl2
、0.1mM EDTA、33mM KGlu、10%(容量/容量)グリセロール、1mMジチオスレイ
トール(DTT)、および0.5mMフッ化フェニルメチルスルホニル(PMSF)(pH7.5
)を得た。
直径の、Affi-Gel-ヘパリンゲルカラム(Bio-Rad)に適用し、そして33〜450mM K
Gluグラジエント2リットルで溶出し、カラムを、1カラム容量/時間の流速で、
4℃で流した。各50mlの画分を収集し、そしてパートEに記載したようにテロメ
ラーゼ活性につき検定した。テロメラーゼを約170mM KGluでカラムから溶出した
。テロメラーゼを含有する画分(約440ml)をプールし、そして20mMTris酢酸、1
0mM MgCl2、1mM EDTA、300mM KGlu、10%グリセロール、1mM DTTおよび1%Non
idet P-40に調整した。この緩衝液を「WB」と命名した。
ヌクレオチド(5'-TAGACCTGTTAGTGTACATTTGAATTGAAGC-3'および5'-TAGACCTGTTAGG
TTGGATTTGTGGCATCA-3')、50μg酵母RNA(Sigma)、および0.3nmolのビオチン標識
化テロメラーゼ特異的オリゴヌクレオチド(5'-ビオチン-TAGACCTGTTA-(mreG)2-(
rmeU)4-(rmeG)4-(rmeU)4-remG-3')を添加した。テロメラーゼ特異的オリゴヌク
レオチドの2-ο-メチルリボヌクレオチドは、テロメラーゼRNA;テンプレート
領域に相補的であり;このデオキシリボヌクレオチドは相補的ではなかった。競
合体の非特異的DNAオリゴヌクレオチドの含有は、アフィニティーオリゴヌクレ
オチドに結合するかまたは混合物からテロメラーゼを除去するであろう混合物中
の核酸結合性タンパク質および他の成分の効果が最小化されるので、精製の効率
は増加した。
定化ニュートラアビジン(neutravidin)添加(Pierce)カラム物質に添加した。
0.01% Nonidet P-40、0.5mg BSA、0.5mg/mlリゾチーム、0.05mg/mlグリコーゲ
ン、および0.1mg/ml酵母RNAを含有するWBの調製物で、カラム物質を各ブロッ
キングについて15分間、2回プレブロックした。ブロッキングは、4℃で回転ホ
イール(rotating Wheel)を用いて行い、カラム物質を徹底的にブロックした。最
初のブロッキング工程の後、そして第2のブロッキング工程前に、カラム物質を
200×gで2分間遠心分離してマトリックスをペレット化した。
8分間、次いでさらに4℃で2時間インキュベートして結合させた。次いで、プ
ール-カラム混合物を200×gで2分間遠心分離し、未結合物質を含む上清を除去
した。次いで、プール-カラム混合物を洗浄した。この洗浄プロセスは、プール-
カラム混合物を4℃でWBでリンスする工程、混合物を15分間4℃でWBで洗浄する
工程、WBでリンスする工程、0.6M KGluを含有しNonidet P-40を含有しないWBで3
0℃で5分間洗浄する工程、WBで25℃で5分間洗浄する工程、そして最後にWBで
再度リンスする工程を包含した。最終洗浄後に残る容量を少量に保って、約1:
1の緩衝液に対するカラム物質の比率を生じた。
チド(5'-CA4C4A4C2TA2CAG2TCTA-3')を添加し、そして25℃で30分間インキュベー
トすることによって、カラム物質から溶出させた。この物質を、微量遠心分離機
(Eppendorf)で、14,000rpmで2分間遠心分離し、そして溶出物を回集した。毎
回新しい置換オリゴヌクレオチドを用い、溶出手順をさらに2回反復した。前記
したように、置換オリゴヌクレオチドはアフィニティーオリゴヌクレオチドに相
補的であったので、P-40よりアフィニティーオリゴヌクレオチドとより熱力学的
に安定な複合体を形成した。従って、置換オリゴヌクレオチドのアフィニティー
-結合テロメラーゼへの添加により、天然条件下でテロメラーゼの十分な溶出が
得られた。テロメラーゼは、タンパク質ゲルでの分析によって判断した場合、こ
の段階で約50%の純度であるようであった。テロメラーゼのアフィニティー精製
および置換オリゴヌクレオチドでの溶出を、図26(それぞれ、パネルAおよびB
)に示す。この図において、アフィニティーオリゴヌクレオチドの2'-ο-メチ
ル糖は太線によって示される。この図中の黒色および陰影を施した楕円は、本発
明のタンパク質サブユニットを写実的に表示することが意図される。
タンパク質濃度は、標準としてBSAを用い、Bradford (Bradford, Anal. Biochem
., 72:248 [1976])の方法を用いて測定した。テロメラーゼ調製物の画分のみを
グリセロールグラジエントでさらに精製した。
ト遠心分離によって決定した。
る。このテロメラーゼは、回収率80%で全細胞抽出物と比較して核抽出物が12倍
富化されている;テロメラーゼの85%は抽出に際して核から可溶化された。
**この値は(タンパク質ゲルに基づき)50%の純度を仮定することにより、テ
ロメラーゼの測定量(680pmol)から計算した。
テロメラーゼの精製の各工程において、本実施例に記載されるように、3つの
別のアッセイ(このうちの1つは活性であった)によって分析した。一般に、テ
ロメラーゼアッセイは、0.003〜0.3μlの核抽出物、50mM Tris-Cl(pH7.5)、50
mM KGlu、10mM MgCl2、1mM DTT、125μM dTTP、125μM dGTP、および約0.2pmol
の5'-32P-標識オリゴヌクレオチド基質(すなわち、約400,000cpm)を含有する
40μlで行った。オリゴヌクレオチドプライマーを、反応混合物へのそれらの添
加に先立って熱変性した。反応物を氷上に集め、25℃で30分間インキュベートし
た。200μlの10mM Tris-Cl(pH7.5)、15mM EDTA、0.6%SDS、および0.05mg/ml
プロテイナーゼKの添加によって反応を停止させ、そして45℃で少なくとも30分
間インキュベートした。エタノール沈殿の後、当該分野で公知のように(例えば
、 Sambrookら、1989参照)、生成物を変性8%PAGEゲルで分析した。
本実施例では、精製手順を通じてのテロメラーゼ活性の定量を記載する。dGTP
および[α-32P]dTTPの存在下でオリゴヌクレオチドプライマーの伸長をアッ
セイすることによって定量を達成した。簡潔には、記載されるように、(Lingne
rら, Genes Develop., 8:1984 [1994])、2μlの[α-32P]dTTP(10mCi/ml、40
0Ci/mmol:1Ci=37GBq)の存在下で、1μMの5'-(G4T4)2-3'オリゴヌクレオチド
を20μlの反応混合物中で伸長させ、記載されるように8%PAGE配列決定ゲルに
ロードした。
わち、陰性コントロール);レーン2、5、8および11は0.14fmolのテロメラー
ゼを含有し;レーン3、6、9および12は、0.42fmolのテロメラーゼを含有し;
そしてレーン4、7、10および13は、1.3fmolのテロメラーゼを含有した。製造
業者の指示を用いて、PhosphorImager (Molecular Dynamics)を用いて活性を定
量した。これらの条件下では、30分以内に、1fmolのアフィニティー-精製テロ
メラーゼが21fmolのdTTPを取り込んだとことが決定された。
変化しなかった。アフィニティー-精製テロメラーゼは十分に活性であった。し
かしながら、高濃度では、阻害活性が検出され、そして粗抽出物の活性は直線的
でないと決定された。従って、図28に示したアッセイにおいて、粗抽出物を700-
7000倍希釈した。精製に際し、この阻害活性は除去され、そして阻害効果は、高
酵素濃度においてさえ精製テロメラーゼ調製物では検出されなかった。
パートEに述べたように、テロメラーゼの精製における各工程では、調製物を
3つの別々のアッセイによって分析した。本実施例は、画分に存在するテロメラ
ーゼRNAを定量し、そしてテロメラーゼリボ核タンパク質粒子の全部を分析する
ために使用したゲル電気泳動およびブロッティング手順を記載する。
本実施例では、既知の濃度の合成T7-転写テロメラーゼRNAを標準として供した
。この調査を通じて、RNA成分をテロメラーゼの尺度として用いた。
構築物を(PCR)を用いて生成した。テロメラーゼRNA遺伝子を、遺伝子のいずれ
かの末端にアニールするプライマーを用いて増幅した。5'末端にアニールする
プライマーはまた、転写されたRNAの切断に際しての天然の5'末端、T7-プロモ
ーター配列、およびサブクローニングのためのEcoRI部位を生成するためのハン
マーヘッド(hammerhead)リボザイム配列もコードした。この5'プライマーの配
列は、5'-GCGGGAATTCTAATACGACTCACTATAGGGAAGAAACTCTGATGAGGCCGAAAGGCCGAAACT
CCACGAAAGTGGAGTAAGTTTCTCGATAATTGATCTGTAG-3'であった。3'プライマーは、天
然の3'末端に転写終結のためのEarI部位、およびクローニングのためのBamHI部
位を含んだ。この3'プライマーの配列は5'-CGGGGATCCTCTTCAAAAGATGAGAGGACAGC
AAAC-3'であった。PCR増幅産物をEcoRIおよびBamHIで切断し、そしてpUC19(NEB
)の各部位にサブクローンして「pEaT7」を得た。このインサートの正確さをDNA
配列決定によって確認した。T7転写は、Zaugら, Biochemistry 33:14935[1994]
によって記載されているように、EarI線状化プラスミドで行った。RNAをゲル精
製し、そして濃度を測定した(1=40μg/mlのA260)。このRNAを標準として使
用して、テロメラーゼの種々の調製物に存在するテロメラーゼRNAを決定した。
由来するRNA濃度は天然のゲル電気泳動によって得られたものと合致したが、そ
れよりもわずかに高かった。既知のT7のRNA転写物濃度の連続希釈物に対する全
細胞RNAにおける全テロメラーゼRNAの量の比較は、各E. aediculatus細胞が約30
0,000テロメラーゼ分子を含有することを示した。
elop., 8:1984 [1994])、そのRNA成分に対するノーザンブロットハイブリダイゼ
ーションによって達成した。簡潔には、当該分野で公知のように(例えば、 Sam
brookら, 1989参照)、RNA(0.5μg/レーン未満または等価)を、8%PAGEで分
解し、そしてHybond-N膜(Amersham)に電気ブロットした。このブロットを、10m
lの4×SSC、10×デンハルト溶液、0.1%SDS、および50μg/ml変性ニシン精子DNA
中で一晩ハイブリダイズし、3時間のプレハイブリダイズの後、2×106cpmプロ
ーブ/mlハイブリダイゼーション溶液を添加した。ランダムに標識したプローブ
、全テロメラーゼRNA遺伝子をカバーするPCR産物であった。ブロットを2×SCC、
0.1%SDS中で30分間、そして次いで、45℃で0.1×SSCおよび0.1%SDS中で1時間
、緩衝液を数回交換しながら洗浄した。
本実験では、当該分野で公知であり、そして記載されているように(Lamondお
よびSproat [1994], 前出)、精製したテロメラーゼ調製物を、3.5%ポリアクリ
ルアミドおよび0.33%アガロースの天然(すなわち、非変性)ゲルで泳動した。
テロメラーゼはキシレンシアノール色素とほとんど一緒に移動した。
ることを示した。図27は、非変性ゲル上の異なる画分におけるテロメラーゼなら
びにインビトロ転写されたテロメラーゼの移動度を示すノーザンブロットの写真
である。この図において、レーン1は1.5fmolのテロメラーゼRNAを含有し、レー
ン2は4.6fmolのテロメラーゼRNAを含有し、レーン3は14fmolのテロメラーゼRN
Aを含有し、レーン4は41fmolのテロメラーゼRNAを含有し、レーン5は核抽出物
(42fmolテロメラーゼ)を含有し、レーン6はAffi-Gel-ヘパリン-精製テロメラ
ーゼ(47fmolテロメラーゼ)を含有し、レーン7はアティニティー-精製テロメ
ラーゼ(68fmol)を含有し、そしてレーン8はグリセロールグラジエント-精製
テロメラーゼ(35fmol)を含有した。
ルし、これはアセンブルしていないテロメラーゼRNAよりもゆっくりと移動した
。1%未満の遊離RNAがこの方法によって検出された。しかし、よりゆっくりと
移動するテロメラーゼRNP複合体もまた抽出物中で時々検出された。Affi-Gel-ヘ
パリンカラムでの精製に際して、テロメラーゼRNP粒子は移動度が変化しなかっ
た(図27、レーン6)。しかし、アティニティー精製に際して、RNA粒子の移動
度はわずかに増加し(図27、レーン7)、これはおそらく、タンパク質サブユニ
ットまたはフラグメントが喪失したことを示す。グリセロールグラジエントでは
、アティニティー精製テロメラーゼはサイズが変化しなかったが、約2%の遊離
テロメラーゼRNAが検出され(図27、レーン8)、これは少量のRNP粒子のジアセ
ンブルが起こったことを示す。
本実施例では、精製されたテロメラーゼタンパク質組成の分析を記載する。
%のポリアクリルアミドゲル(Novex)で分離した。電気泳動に続き、ゲルをクー
マシーブリリアントブルーで染色した。図29はゲルの写真を示す。図29に示すゲ
ルの左側に示すように、レーン1および2は分子量マーカー(Pharmacia)を含ん
だ。レーン3〜5はゲルの頂部に示すようにグリセロールグラジエント画分プー
ルを含んだ(すなわち、レーン3は画分9〜14を含み、レーン4は画分15〜22を
含み、レーン5は画分23〜32を含んだ)。レーン4は、1pmolのテロメラーゼRN
Aを含むプールを含有した。レーン6〜9では、図29のゲルの頂部に示される濃
度でBSA標準を泳動させた(すなわち、レーン6は0.5pmolのBSAを含み、レーン
7は1.5pmolのBSAを含み、レーン8は4.5BSAを含み、そしてレーン9は15pmolの
BSAを含んだ)。
ーゼと共に精製した。43kDaポリペプチドはダブレットとして観察された。レー
ン3における約43kDaのポリペプチドが、レーン4のダブレットとは異なって移
動したことに注意した;それは無関係なタンパク質であろう。120kDaおよび43kD
aダブレットはそれぞれ、BSA標準と比較した場合、約1pmolのレベルで、クーマ
シーブリリアントブルーで染色された。この画分は1pmolのテロメラーゼRNA(
その全てはRNP粒子にアセンブルした(図27、レーン8参照))を含有したので
、テロメラーゼRNAに対して化学量論的な2種のポリペプチドサブユニットがあ
るようであった。しかし、43kDa近辺の2つのタンパク質が別々の酵素サブユニ
ットである可能性もある。
メラーゼは、それぞれ、35kDaおよび37kDaの見かけの分子量を有するさらなるポ
リペプチドを含有した。この後者の画分は、少なくとも50%の純度であると見積
もられた。しかし、アフィニティー-精製物質中に存在する35kDaおよび37kDaポ
リペプチドは、グリセロールグラジエント遠心分離によって再現性よくは分離さ
れなかった。これらのポリペプチドは混成物であり得る。というのは、それらは
全ての活性含有調製物中で見られなかったからである。
テロメラーゼについての沈降係数は、グリセロールグラジエント遠心分離によ
って決定した。本実施例では、核抽出物およびアフィニティー-精製テロメラー
ゼを、1mM MgCl2、0.1mM EDTA、300mM KGlu、および1mM DTT、pH7.5を有する2
0mM Tris酢酸を含有する15〜40%グリセロールグラジエントで分画した。グリセ
ロールグラジエントを、5ml(13×51mm)チューブに注ぎ、そしてSW55Tiロータ
ー(Beckman)を用いて、55,000rpmで4℃で14時間遠心分離した。
ゼ(ADH)については7.6Sの沈降係数、カタラーゼについては113S、アポフェ
リチンについては17.3S、およびチログロブリンについては19.3Sの沈降係数を
有した。テロメラーゼピークを、グラジエント画分の天然ゲル電気泳動、その後
のRNA成分へのブロットハイブリダイゼーションによって同定した。
ように、アフィニティー-精製テロメラーゼは11.5Sでカタラーゼと共に移動し
、一方、核抽出物中のテロメラーゼはわずかに速く沈降し、12.5S辺りにピーク
があった。従って、天然ゲルにおける酵素の移動度と一致して、精製されたテロ
メラーゼは、タンパク質分解フラグメントまたはゆるく会合したサブユニットを
喪失したように見える。
ブユニット、1つの43kDaサブユニット、および66kDaの1つのRNAサブユニット
より成ると仮定すると、229kDaの合計値となる。これは、カタラーゼの232kDaの
分子量とかなり一致する。しかし、沈降係数は分子量、ならびに分子の部分特異
的な容量および摩擦係数(共に、EuplotesテロメラーゼRNPについては知られて
いない)の関数である。
本実施例では、Euplotesテロメラーゼの基質要件を調べた。DNA末端複製に対
する1つの簡単なモデルは、半保存的DNA複製の後、テロメラーゼは二本鎖を延
長し、DNA分子を平滑末端とすることを予測する。このモデルの変形において、
一本鎖3'末端がヘリカーゼまたはヌクレアーゼによって複製後に作製される。次
いで、結合および伸長のために、この3'末端をテロメラーゼによって使用する
。
アピンを、それらの3'末端に位置するテロメリック反復で合成した。これらのプ
ライマー基質をゲル精製し、ポリヌクレオチドキナーゼで5'末端を標識し、0.4
μMで80℃で5分間加熱し、次いで、加熱ブロック中でゆっくりと室温まで冷却
して、ヘアピンの再生およびヘリックス形成を行った。非変性ゲル上での基質移
動度は、二量体と比較して非常に有効なヘアピン形成が存在することを示した。
有する10μlの反応混合物中、未標識125μM dGTP、125μM dTTP、および0.02μM
5'末端標識プライマー(5' 32P標識オリゴヌクレオチド基質)を用いてアッセ
イを行った。これらの混合物を25℃で30分間インキュベートした。ホルムアミド
負荷緩衝液(すなわち、TBS、ホルムアミド、ブロモチモールブルー、およびシ
アノール、Sambrook, 1989, 前出)を添加することによって反応を停止させた。
テロメラーゼ有りで(「+」)、または17.6fmolのアフィニティー精製テロメラ
ーゼ有りで(「+++」)インキュベートした。このアッセイで使用したアフィ
ニティー精製テロメラーゼを、100kDaの分子量カットオフを有する膜で透析して
置換オリゴヌクレオチドを除去した。反応作製物を、36%ホルムアミドを含有す
る8%のPAGE/尿素ゲルで分離してヘアピンを変性した。この研究で使用したプ
ライマーの配列、ならびにそれらのレーン帰属を表20に示す。
復を有する基質を含有した。レーン16〜30は、4つのT残基で終わるテロメリッ
ク反復を有する基質を含有した。テロメラーゼRNAテンプレート上の推定の配置
を図32に示す。プライマー対は図32(すなわち、それぞれ、パネルAおよびパネ
ルB)に示されるテンプレート中の2つの非常に異なる位置でアニールすると推
定された。これは、それらの結合および/または伸長速度に影響を与えるかも知
れない。
光を行って、付加されたヌクレオチドおよび伸長産物における中断位置を可視化
した。各対における第3のレーンの伸長させた基質のパーセントは、図31の底部
で示したようにPhosphorImagerで定量した。
ロメア様基質と比較した。4つのG残基で終わったモデル基質(図31のレーン1
〜15参照)は、それを平滑末端とした場合には伸長しなかった(レーン1〜3参
照)。しかし、わずかな伸長が2塩基の突出長で観察され;伸長は、突出が少な
くとも4塩基長である場合には十分となった。テロメラーゼは、4つのT残基で
終わる二本鎖基質と同様に作用し、6塩基突出はかなり十分な伸長を要した。図
31においては、テロメラーゼとは無関係のレーン10〜15におけるプライマー下方
のかすかなバンドは、プライマー調製におけるより短いオリゴヌクレオチドを表
す。
nerら, Genes Develop., 8:1984 [1994]によって記載されているように)最も暗
いバンドはテンプレートの推定5'境界に対応する。テンプレートにおける他の位
置に対応する産物の豊富さは、中断および/または解離が、精製テロメラーゼで
の転位の部位以外の部位で起こることを示唆した。
対する基質ではなかった。これらの分子がテロメラーゼに結合するか否かを診断
するために、競合実験を行った。本実験では、2nMの配列(G4T4)2を有する5'末端
標識基質、または6塩基突出を有するヘアピン基質を0.125nMテロメラーゼで伸
長させた(図31、レーン25〜27)。同一の未標識オリゴヌクレオチド基質は、伸
長につき標識基質と十分に競合したが、二本鎖平滑末端ヘアピンオリゴヌクレオ
チドを競合体として使用した場合は、100倍過剰のヘアピンの存在下においてさ
え、活性の低下は観察されなかった。
た濃度および条件においてテロメラーゼに結合できないことを示した。むしろ、
一本鎖3'末端が結合には必要である。この3'末端はテロメラーゼRNAテンプレー
トとの塩基対に対して必要なようである。
本実施例では、Euplotesテロメラーゼの123kDaポリペプチド(すなわち、123k
Daタンパク質サブユニット)のクローニングを記載する。本実験では、前記パー
トDで得られた精製ポリペプチドから得られたペプチド配列にマッチするように
設計されたオリゴヌクレオチドプライマーを用いて、テロメラーゼ遺伝子の内部
フラグメントをPCRにより増幅した。当該分野で公知の、そしてCalvioら,RNA 1:
724-733 [1995]によって記載のnanoESタンデム質量分析方法を用いてポリペプチ
ド配列を決定した。本実施例で使用したオリゴヌクレオチドプライマーは以下の
配列を有し、縮重位置は括弧に入れて示す。
'および5'-GCGGATCCATGAA(T/C)CC(A/T)GA(G/A)AA(T/C)CC(A/T)AA(T/C)GT-3'。
(Boehringer-Mannheim)、0.8μgの各プライマー、および1×反応緩衝液(Boehr
inger-Mannheim)を含有した。反応物でサーモサイクラー(Perkin-Elmer)中で
以下を使用してインキュベートした:95℃における5分間、続いての94℃での1分
間、52℃での1分間、およぴ72℃での2分間の30サイクル。反応は72℃で10分間の
インキュベーションによって完了した。
maI部位にクローニングすることによって染色体E. aediculatusDNAから調製した
(図14)(Stratagene)。このライブラリーは、放射性標識したゲル精製PCR産物
でのコロニーハイブリダイゼーションによってスクリーニングした。陽性クロー
ンのプラスミドDNAを調製し、そして自動シーケンサー(ABI)の使用により、ジ
デオキシ方法(Sangerら, Proc. Natl. Acad. Sci., 74:5463 [1977])または手
動によって配列決定した。このポリヌクレオチドをコードする遺伝子のDNA配列
を図13に示す。DNA配列から帰結されるこの配列における停止コドンはヌクレオ
チド位置101に位置付けられ、そしてオープンリーディングフレーム末端は3193
位に位置付けられる。Euplotesの遺伝コードは、「UGA」コドンがシステイン残
基をコードする点で、他の生物とは異なる。DNA配列から帰結されるポリヌクレ
オチドのアミノ酸配列を図14に示し、異常アミノ酸は翻訳の間に挿入され、翻訳
後修飾は起こらないと推定される。
本実施例では、テロメラーゼの43kDaポリペプチド(すなわち、43kDaタンパク
質サブユニット)のクローニングを記載する。本実験では、対応するテロメラー
ゼ遺伝子の内部フラグメントを、前記パートDで得られた精製ポリペプチドから
得られたペプチド配列に適合するように設計されたオリゴヌクレオチドプライマ
ーを用いて、PCRによって増幅した。ポリペプチド配列は、当該分野で公知で、C
alvioら,前出によって記載されたnanoESタンデム質量分析方法を用いて決定した
。本実施例で使用したオリゴヌクレオチドプライマーは、以下の配列を有した。
A)GT(C/T)TC(T/C)TG(G/A)TC(G/A)TT(G/A)TA-3'。この配列において「N」は4種
のヌクレオチド(すなわち、A、T、GまたはC)のいずれかの存在を示す。
グした。このポリペプチドをコードする遺伝子のDNA配列を図34に示す。図35に
示すように、3つの可能なリーディングフレームをこの配列につき示す。明瞭性
のため、アミノ酸配列を、すべての3つのリーディングフレームにおけるヌクレ
オチド配列の下方に示す。これらのリーディングフレームを「a」、「b」およ
び「c」と命名する。可能な開始コドンは、リーディングフレーム「c」中のヌ
クレオチド84位でコードされる。コード領域は、リーディングフレーム「b」中
の1501位で終わり得る。この図中のアステリスクによって示される初期停止コド
ンは、ヌクレオチド位置337〜350の間の全ての3つのリーディングフレームにお
いて起こる。
ンによっていずれも中断されないので、タンパク質配列は、異なるリーディング
フレームによってコードされるようである。さらに、精製タンパク質からのペプ
チド配列は全ての3つのフレームにおいてコードされる。従って、この遺伝子は
介入配列を含有するようであり、あるいは、RNAが編集される。他の可能性は、
リボソームフレームシフティングまたは配列エラーを含む。しかし、La−タンパ
ク質配列に対する相同性は非常に興味深いままである。また、Euplotesにおいて
は、「UGA」コドンはシステイン残基をコードする。
本実施例では、種々の報告された配列および123kDaおよび43kDaテロメラーゼ
サブユニットポリペプチドの配列の間の比較を行った。
123kDaのEuplotes. aediculatusポリペプチドのアミノ酸配列を、Tetrahymena
thermophila(GenBank受託番号#U25641)の80kDaテロメラーゼタンパク質サブユ
ニットの配列と比較して、それらの類似性を調べた。このタンパク質をコードす
るGenBankから得られたヌクレオチド配列を図42に示す。GenBankから得られたこ
のタンパク質のアミノ酸配列を図43に示す。123kDaのE. aediculatusおよび89kD
aのT. thermophilaの間の配列比較を図36に示す。この図では、E. aediculatus
配列は上の配列であり、他方、T. thermophila配列は下の配列である。観察され
た同一性は約19%であると決定され、他方、パーセント類似性は約45%であった
(この値はいずれのランダムタンパク質配列でも観察されるであろうものと同様
である)。図36-39において、同一性は垂直棒線によって示され、他方、配列間
の単一のドットは幾分類似のアミノ酸を示し、配列間の二重ドットはより類似の
アミノ酸を示す。
ena thermophila(GenBank受託番号#U25642)の95kDaテロメラーゼタンパク質サ
ブユニットの配列と比較して、それらの類似性を調べた。このタンパク質をコー
ドするGenBankから得られたヌクレオチド配列を図44に示す。GenBankから得られ
たこのタンパク質のアミノ酸配列を図45に示す。この配列比較を図37に示す。こ
の図では、E. aediculatus配列は上の配列であり、他方、T. thermophila配列
は下の配列である。観察された同一性は約20%であると決定され、他方、パーセ
ント類似性は約43%(いずれのランダムタンパク質配列でも観察されるであろう
ものと同様の値)であった。
酵素の5モチーフ特徴を含む。この123kDaポリペプチドをまた、種々の逆転写酵
素のポリメラーゼドメインと比較した。図40は推定酵母ホモログ(L8543.12また
はESTp)と123kDaポリペプチドとのアライメントを示す。GenBankから得られたL
8543.12のアミノ酸配列を図46に示す。
の図40において、高度に保存された残基は、黒色バックグラウンド上の白色文字
によって示される。他の配列において保存されているE. aediculatus配列の残基
を太文字で示し;「h」は疎水性アミノ酸の存在を示す。モチーフのアミノ酸残
基の間に位置する数字は配列におけるギャップの長さを示す。例えば、モチーフ
AおよびBの間に示す「100」はモチーフ間の配列における100アミノ酸ギャップ
を反映する。
サブユニットに対していくらかの相同性を示すアミノ酸配列を含有するかまたは
コードする酵母タンパク質(GenBank受託番号#u20618)、および遺伝子L8543.12
(Est2)を同定した。両タンパク質は、それらのC-末端領域に逆転写酵素モチー
フを含有する;両タンパク質は、逆転写酵素モチーフの外部の領域における類似
性を有する;このタンパク質は、同様に塩基性である(E. aediculatusではpI=10
.1、および酵母についてはpI=10.0);および両タンパク質は大きい(E. aedicu
latusでは123kDaおよび酵母では103kDa)という観察に基づくと、これらの配列
はそれらの各テロメラーゼの触媒コアを含む。E. aediculatusおよび酵母として
の2つの系統発生的に区別される生物における相同性のこの観察に基づいて、ヒ
トテロメラーゼは同一の特徴(すなわち、逆転写酵素モチーフ、塩基性である、
および大きい[>100kDa])タンパク質を含有するであろうと考えられた。
43kDのEuplotes aediculatusポリペプチドの「La−ドメイン」のアミノ酸配列
をTetrahymena thermophila(前記)の95kDaのテロメラーゼタンパク質サブユニ
ットの配列と比較してそれらの類似性を調べた。この配列比較を図38に示し、他
方、T. thermophila配列は下の配列である。観察された同一性は約23%であると
判断され、他方、パーセント類似性は約46%(任意のランダムタンパク質配列で
も観察されるであろうものに類似の値)であった。
列をTetrahymena thermophila(前記)の80kDaテロメラーゼタンパク質サブユニ
ットの配列と比較してそれらの類似性を調べた。この配列比較を図39に示す。こ
の図においては、E. aediculatus配列は上の配列であり、他方、T. thermophila
)配列は下の配列である。観察された同一性は約26%であると判断され、他方、
パーセント類似性は約49%(いずれのランダムタンパク質配列で観察されるであ
ろうものと類似の値)であった。
々の他の生物からのLaタンパク質と比較した。これらの比較を図41に示す。この
図においては、高度に保存された残基は黒色バックグラウンド上の白色文字によ
って示される。他の配列において保存されているE. aediculatus配列の残基は太
字で示す。
本実施例では、前記これまでの実施例で同定された配列を用いて、Oxytricha
tallax(E. aediculatusとは非常に区別される関係の繊毛虫)のテロメラーゼタ
ンパク質サブユニットを同定した。プライマーは、逆転写酵素ドメインモチーフ
を含むE. aediculatusの123kDaのポリペプチドの保存された領域に基づいて選択
した。適切なプライマーを合成し、そしてOxytrichaからの全DNAを用いるPCR反
応で使用した。OxytrichaのDNAは、当該分野で公知の方法に従って調製した。次
いで、PCR産物をクローン化し、そして当該分野で公知の方法を用いて配列決定
した。
5'-(T/C)A(A/G)AC(T/A/C)AA(G/A)GG(T/A/C)AT(T/C)CC(C/T/A)(C/T)A(G/A)GG-3'
および5'-(G/A/T)GT(G/A/T)ATNA(G/A)NA(G/A)(G/A))TA(G/A)TC(G/A)TC-3')。
縮重している位置は括弧に入れて示し、オルタナティブ塩基は括弧内に示す。「
N」は4つのヌクレオチドのいずれかを表す。
色体DNA、1μl Taqポリメラーゼ(Boehringer-Mannheim)、2マイクロモルの各
プライマー、1×反応緩衝液(Boehringer-Mannheim)を含有した。以下の条件:
95℃における5分、次の94℃における1分、53℃における1分、および72℃におけ
る1分からなる30サイクル、続いての72℃における10分間のインキュベーション
で、反応物をサーモサイクラー(Perkin-Elmer)中でインキュベートした。PCR産
物をゲル精製し、ジデオキシ法(例えば、Sangerら, Proc, Natl. Acad. Sci. 7
4, 5463-5467(1977))によって配列決定した。
比較した。図47は、これらの配列のアライメントアラインメントを示し、O. tri
fallax配列は頂部上列に、E. aediculatus配列は下部列に示す。この図から分か
るように、本実施例で同定されたO. trifallaxポリペプチド配列とE. aediculat
usポリペプチド配列との間には非常に大きな同性がある。従って、本発明で同定
された配列は、他の真核生物における相同性テロメラーゼタンパク質サブユニッ
トの同定で有用である。事実、本発明の開発は、本明細書中に記載のように多数
の多様な種において相同性テロメラーゼ配列を同定した。
本実施例では、Euplotes配列、およびEST2pとの相同性を共有するThtrahymena
クローンを生成させた。
マーを用いるPCRを利用して、Thtrahymena、Euplotes、およびEST2p配列の間の
相同性の領域を同定した。本実施例で用いたPCR方法は、複合体混合物からの稀
なDNA配列を特異的に増幅するように設計された新規の方法である。この方法は
、PCRクローニング方法で通常に遭遇する両端部における同一のPCRプライマーを
用いるDNA産物(すなわち、単一プライマー産物)の増幅の問題を回避する。こ
れらの単一プライマー産物は望まないバックグラウンドを生じ、そしてしばしば
、所望の2つのプライマー産物の増幅および検出を曖昧にし得る。本実施例で使
用した方法は2つのプライマー産物につき優先的に選択する。特に、1つのプラ
イマーをビオチン化し、他方はそうしない。数ラウンドのPCR増幅の後、ストレ
プトアビジン磁性ビーズを用いて産物を精製し、そして熱変性を用いて2つのプ
ライマー産物を特異的に溶出する。この方法は、本実施例に記載の実験以外のセ
ッティングにも使用される。事実、この方法は、5'および3';RACEのようなクロ
ーニング方法、およびPCRにおいて縮重プライマーを使用する任意の方法におけ
る予備的工程を含有する、稀なDNA配列を特異的に増幅することが望まれる適用
において使用される。
1」と命名された配列5'ビオチン-GCCTATTT(TC)TT(TC)TA(TC)(GATC)(GATC)(GATC)
AC(GATC)GA-3'を有する24量体正方向プライマー、およびDDFL(FIL)I領域に対応
する「K220」と命名した配列5'-CCAGATAT(GATC)A(TGA)(GATC)A(AG)(AG)AA(AG)TC
(AG)TC-3'を有する23量体逆方向プライマーを用いて単離したTetrahymenaテンプ
レート巨大分子DNAを用いて行った。このPCR反応は、2.5μl DNA(50ng)、4μlの
各プライマー(20μM)、3μl 10xPCR緩衝液、3μl 10xdTNP、2μl Mg、0.3μl
Taqおよび11.2μl dH2Oを含有した。混合物を45秒間の94℃、45秒間の37℃、お
よび1分間の72℃の8サイクルで行った。
で洗浄し、20μl dH2Oに再懸濁し、次いで、100℃で2分間沸騰させることによっ
て熱変性させた。ビーズを引き寄せ、溶出物を取り出した。次いで、α-32P dAT
Pの0.3μlを含め、PCRを33サイクル行った以外は、前記条件を用いて2.5μlのこ
の溶出物を引き続いて再増幅した。この反応を5%変性ポリアクリルアミドゲル
で泳動させ、適切な領域をゲルから切り出した。次いで、これらの産物を、42℃
アニーリング温度を用いた以外は前記した条件下でさらに34サイクル再増幅した
。
する「K228」と命名した配列5'-ACAATG(CA)G(GATC)(TCA)T(GATC)(TCA)T(GATC)CC
(GATC)AA(AG)AA-3'を有する23量体正方向プライマー、およびCYDSIPR領
域に対応する「K224」と命名した配列5'-ACGAAT'C(GT)(GATC)GG(TAG)AT(GATC)(G
C)(TA)(AG)TC(AG)TA(AG)CA-3'を有する逆方向プライマーを用いて単離したTetra
hymena巨大分子DNAテンプレートを用いて行った。このPCR反応は2.5μl DNA(50n
g)、4μlの各プライマー(20μM)、3μl 10xPCR緩衝液、3μl 10xdNTP、2
μl Mg、0.3μl α-32P dATP、0.3μl Taq、および10.9μl dH2Oを含有した。こ
の反応を5%変性ポリアクリルアミドゲルで泳動させ、適当な領域をゲルから切
り出した。これらの産物を、42℃アニーリング温度を用いた以外は前記した条件
下でさらに34サイクル再増幅した。
ビーズに結合させた。ビーズを200μl TEで洗浄し、次いで、20μl dH2Oに再懸
濁し、熱変性し、溶出物を取り出した。次いで、泳動2からの反応作製物をビー
ズに添加し、30μl 0.5×SSCで希釈した。混合物を94℃〜50℃で加熱した。溶出
物を取り出し、ビーズを55℃で0.5xSSC中で3回洗浄した。次いで、ビーズを20μ
l dH2Oに再懸濁し、加熱変性し、溶出物を取り出し、「ラウンド1溶出物」と命
名し、保存した。
マーK228およびDIKSCYD領域に対応する配列5'-CAATTCTC(AG)TA(AG)CA(GATC)(CG)
(TA)(CT)TT(AGT)AT(GA)TC-3'を有する逆方向プライマーK227で再増幅した。PCR
反応を前記したように行った。反応作製物を5%ポリアクリルアミドゲルで泳動
させ;約295ヌクレオチドに対応するバンドをゲルから取り出し、配列決定した
。
列は以下のように見い出された:
「K297」)からの配列;およびK231(FFYXTE)プライマーに適合するように設計した
1つの独特なプライマーを用いるPCRによって得られた。168-3と共に、この反応
で得られたフラグメントの配列は以下の通りである(プライマー配列無し):
とアラインメントさせた。このアラインメントを図53に示す。コンセンサス配列
もこの図に示す。
本実施例において、S. pombeのtez1配列は、E.aediculatus p123、およびS. c
erevisiae Est2pのホモログとして同定された。
ルA)は2つの重複するゲノムクローンの関係および配列決定した5825bpの部分
を示す。「tez1+」と命名した領域は、同様に示すフランキング配列をともなう
、タンパク質コード領域であり、5825bp領域の下の四角は、下記のようにtez1破
壊構築物を作製するのに使用した約2kbのHindIIIフラグメントである。
図である。「オリジナルPCR」と命名した配列は、記載するように、Euplotes配
列モチーフ4(B’)およびモチーフ5(C)に基づいて設計した縮重オリゴヌク
レオチドプライマー対で生じさせたオリジナルの縮重PCRフラグメントである。
縮重プライマーを用いるPCRを用いて、S. pombeにおけるE. aediculatus p123
のホモログを見出した。図56は、この反応で使用した縮重プライマー(「ポリ4
」および「ポリ1」と命名した)の配列を示す。PCR反応(run)は、94℃における5
分間のランプ時間、続いての30秒間の94℃、45秒間の50℃、および30秒間の72℃
の30サイクル、ならびに72℃の7分間で、先の実施例(例えば、前記パートKを
参照のこと)に記載したのと同一の緩衝液を用いて行い、続いて4℃で貯蔵した
。PCR反応を、変化する条件(すなわち、種々のS. pombe DNAの濃度およびMgCl2
濃度)を用いて行った。PCR産物をアガロースゲルで泳動し、そして前記したよ
うにエチジウムブロミドで染色した。いくつかのPCR反応の結果、3つのバンドの
生成を生じた(「T」、「M」および「B」と命名した)。前記したのと同一の
条件を用い、これらのバンドを再増幅し、そしてゲルで泳動した。図57に示すよ
うに、4つのバンドがこの再増幅の後に観察された(「T」、「M1」、「M2」
および「B」)。次いで、これらの4つのバンドを、前記したのと同一条件を用
いて再増幅した。図57におけるレーンの頂部から第3のバンドは、テロメラーゼ
タンパク質についての正しい配列を含有するものとして同定された。M2と命名し
たPCR産物は、図58に示すように、他のテロメラーゼタンパク質との合理的なマ
ッチを示すことが見い出された。示したアラインメントに加えて、この図もtez1
の実際の配列を示す。この図において、アステリスクはすべての4つの配列で共
有された残基を示す(Oxytricha 「Ot」; E. aediculatus「Ea p123」;S. cerevi
siae「Sc p103;およびM2)、他方、丸(すなわち、ドット)は類似のアミノ
酸残基を示す。
さらなる配列情報を得るために、3'および5'RT PCRを、図58に同定されるテロ
メラーゼ候補に対して行った。図59は使用した3'RT PCR戦略の模式図を提供する
。まず、オリゴヌクレオチドプライマー「QT」(5'-CCA GTG AGC AGA GTG ACG AG
G ACT CGA GCT CAA GCT TTT TTT TTT TTT TT-3')を用いてmRNAからcDNAを調製し
、次いでこのcDNAを「QO」(5'-CCA GTG AGC AGA GTG ACG-3')、およびオリジナ
ルの縮重PCR反応に基づいて設計されたプライマー(すなわち、配列5'-G TGT CA
T TTC TAT ATG GAA GAT TTG ATT GAT G-3'を有する「M2-T」)にてのPCR用のテ
ンプレートとして用いた。「Ql」(5'-GAGGACTCGAGCTCAAGC-3')、およびオリ
ジナル縮重PCR反応に由来する配列を用いて設計した別のPCRプライマーまたは「M
2-T2」(5'-AC CTA TCG TTT ACG AAA AAG AAA GGA TCA GTG-3')にての第2のPCR反
応(すなわち、ネステッド(nested)PCR)。このPCRで使用した緩衝液は前記した
のと同一であり、5分間の94℃のランプアップで開始し、続いての30秒間の94℃
、30秒間の55℃、および3分間の72℃の30サイクル、続いての72℃の7分間にて増
幅を行った。反応産物は使用するまで4℃で保存した。
このさらなる配列情報を得た後、いくつかのゲノムライブラリーおよびcDNAラ
イブラリーをスクリーニングして、このテロメラーゼ候補遺伝子を含有するすべ
てのライブラリーを同定した。使用したアプローチ、ならびにライブラリーおよ
び結果を、図60に示す。この図において、パネルAはこの実験で試験したライブ
ラリーを列挙し;パネルBは使用した領域を示し;パネルCおよびDはこれらの
ライブラリーで得られたドットブロットハイブリダイゼーションの結果を示す。
次いで、コロニーハイブリダイゼーションによって陽性ライブラリーをスクリー
ニングして、tez1遺伝子のゲノムおよびcDNAバージョンを得た。本実験において
、HindIIIゲノムライブラリーからの約3×104コロニーをスクリーニングし、そ
して6つの陽性クローンを同定した(約0.01%)。次いで、DNAを2つの独立した
クローン(A5およびB2)から調製した。図61は、HindIII消化したA5およびB
2陽性ゲノムクローンで得られた結果を示す。
グし、そして5つの陽性クローンを同定した(0.002%)。3つの独立したクロー
ン(2-3、4-1、および5-20)からDNAを調製した。後の実験において、クローン2
-3および5-20は同一のインサートを含有すると判断された。
この時点までに生成された遺伝子のcDNAバージョンは完全ではなかったので、
5'RT-PCRを行って全長クローンを得た。戦略を模式的に図62で示す。この実験に
おいて、以前に同定したtez1の既知領域から設計したDNAオリゴヌクレオチドプ
ライマー「M2-B」(5'-CAC TGA TCC TTT CTT TTT CGT AAA CGA TAG GT-3')および
「M2-B2」(5'-C ATC AAT CAA ATC TTC CAT ATA GAA ATG ACA-3')を用いてcDNAを
調製した。次いで、リン酸化5'末端(「P」)を有するオリゴヌクレオチドリン
カーPCR Adapt SfiI(P-GGG CCG TGT TGG CCT AGT TCT CTG CTC-3')を、このcDNA
の3'末端にて連結し、そしてこの構築物をネステッドPCR用のテンプレートとし
て使用した。PCRの最初のラウンドにおいて、PCR Adapt SFIおよびM2-Bをプライ
マーとして使用し;他方、PCR Adapt SfiII(5'-GAG GAG GAG AAG AGC AGA GAA C
TA GGC CAA CAC GCC CC-3')、およびM2-B2を第2ラウンドにおけるプライマーと
して使用した。ネステッドPCRを使用して反応の特異性を増大させた。
一旦tez1の配列を同定したら、それを以前に記載された配列と比較した。図63
はS. pombe(「S.p. Tezlp」)、S. cerevisiae(「S.c. Est2p」)およびE. aedicu
latus p123(「E.a. p123」)のテロメラーゼ触媒サブユニットからのRTドメインの
アラインメントを示す。この図において、「h」は疎水性残基を示し、他方、「
p」は小極性残基を示し、そして「c」は荷電残基を示す。アラインメントの上
に示したアミノ酸残基は、Y. XiongおよびT.H. Eickbush の既知コンセンサスRT
モチーフを示す(Y. XiongおよびT. H. Eickbush, EMBO J., 9: 3353-3362 [1990
])。アステリスクは全ての3つのタンパク質で保存された残基を示す。「モチー
フO」が、本明細書および図63において、このテロメラーゼサブユニットに対し
て特異的であり、そして一般に逆転写酵素では見出されないモチーフとして同定
される。従って、それは、テロメラーゼ触媒サブユニットとしての他のアミノ酸
配列を同定するにおいて価値がある。
pombe(「Sp Tezlp」)からの全体の配列のアラインメントを示す。パネルAにお
いて、陰影を施した領域は2つの配列の間で共有される残基を示す。パネルBに
おいて、陰影を施した領域は全ての3つの配列の間で共有された残基を示す。
本実施例では、tezlの破壊の効果を調べた。テロメラーゼはテロメア維持に関
与するので、もしtezlが実際にテロメラーゼ成分であれば、tezlの破壊は徐々に
テロメアの短縮化を引き起こすであろうと仮定した。
特異的に破壊した。このアプローチを図65に模式的に示す。図65に示すように、
野生型tezlを、ura4またはLEU2マーカーを含有するフラグメントで置き換えた。
って、テロメア長につきチェックした。図67はこの実験についてのサザンブロッ
トの結果を示す。ApaI制限酵素部位がS. pombeにおけるテロメア配列に直ぐに隣
接して存在するので、S. pombeゲノムDNA調製物のApaI消化はテロメア長の分析
を可能とする。従って、S. pombeからのDNAをApaIで消化し、そして消化産物を
アガロースゲルで泳動し、そしてテロメア配列特異的プローブでプローブして、
破壊したS. pombe細胞のテロメアが短縮化されたか否かを判断した。結果を図67
に示す。これらの結果から、tezl遺伝子の破壊がテロメアの短縮化を引き起こし
たことが明らかである。
本実施例では、ヒトテロメラーゼについての核酸およびアミノ酸配列情報を決
定した。Euplotes 123kDaペプチドおよび核酸配列、ならびにSchizosaccharomyc
esタンパク質および対応するcDNA(tezl)配列を用いて行ったBLASTサーチにおい
て、部分相同配列をまず同定した。ヒト配列(「hTCP1.1」ともいう)を部分cDN
Aクローン(クローン712562)から同定した。このクローンからの配列を先の実
施例に記載したように決定した配列とアラインメントした。
ち、Est2核酸配列によってコードされ、本明細書において「L8543.12」ともいうS.
cerevisiaeタンパク質)、およびこの比較サーチで同定されたヒトホモログの
配列アラインメントを示す。図51はtezlのアミノ酸配列を示し、他方、図52はte
zlのDNA配列を示す。図52において、イントロンおよび他の非コード領域を小文
字で示し、他方、エキソン(すなわち、コード領域)を大文字で示す。
えば、図1に示すように、「モチーフ0」、「モチーフ1」、「モチーフ2」および
「モチーフ3」における同一性の領域がある。同一のアミノ酸はアステリスク(*)
で示し、他方、類似のアミノ酸残基は丸(●)で示す。このことは、酵母から繊
毛虫からヒトまでの範囲にわたり、広範な真核生物の間で保存された領域がテロ
メラーゼモチーフ内にあることを示す。さらなる生物は同様に配列のこのような
保存された領域を含むと考えられる。図49はヒトテロメラーゼモチーフの部分的
アミノ酸配列を示し、他方、図50は対応するDNA配列を示す。
、クローン712562の完全な配列情報を得た。配列決定で使用したプライマーのい
くつかを表7に示す。これらのプライマーを、プラスミド骨格配列またはクロー
ン中のヒトcDNAインサートの配列のいずれかに相補的な配列に基づいて、クロー
ンにハイブリダイズするように設計した。
ーゼタンパク質についての部分的オープンリーディングフレームのみを含有する
が、そのタンパク質の活性フラグメントをコードし得ると判断された。このクロ
ーンにおけるオープンリーディングフレームは約63kDのタンパク質をコードする
。同定された最長オープンリーディングフレームの配列を図68に示す。ORFは図
に示した「met」にてのATGコドンで始まる。配列の3'末端におけるポリAテール
も示す。図69はヒト配列(ヒトテロメラーゼコアタンパク質1、「Hs TCP1」)、E.
aediculatus p123(「Ep p123」)、S. pombe tezl(「Sp Tezl」)、S. cerevisiae ES
T2(Sc Est2)、およびコンセンサス配列からのテロメラーゼ逆転写酵素タンパク
質の仮の予備的アラインメントを示す。この図では、種々のモチーフが示される
。
を用いて、以前にクローン化されなかった領域の部分をコードするクローンを得
た。これらの実験において、RACE(cDNA末端の迅速増幅;例えば、M. A. Frohma
n, 「RACE: cDNA末端の迅速増幅」,Innisら(編), PCR Protocols: A Guide to M
ethods and Applications [1990], 28-38頁;およびFrohmanら, Proc. Natl. Aca
d. Sci., 85:8998-9002 [1988])を用いて、配列分析用の材料を生成させた。4つ
のこのようなクローンを生成させ、そしてこれを用いてさらなる5'配列情報を提
供した(pFWRP5、6、19および20)。
ラグメントでプローブした。「λ25-1.1」と命名した1つのλクローン(ATCC受
託番号#209024)は相補的配列を有するものとして同定された。図75は、このλ
クローンの制限地図を示す。このクローンからのヒトcDNAインサートを、市販の
ファージミドpBluescriptIISK+(Stratagene)のEcoRI部位へEcoRI制限フラグメ
ントとしてサブクローン化して、プラスミド「pGRN121」を作製し、これをATCC
に寄託した(ATCC受託番号#209016)。予備的結果は、プラスミドpGRN121はヒト
テロメラーゼタンパク質をコードする全体のオープンリーディングフレーム(OR
F)を含有することを示した。
定した。図70は、この予備的作業に基づいて同定されたプラスミドpGRN121の制
限部位および機能地図を提供する。この予備的配列分析の結果を図71に示す。こ
の分析から、および図70に示すように、コード領域についての推定開始部位は、
EcoRI部位(707位に位置する)から約50ヌクレオチドにて同定され、そしてヌク
レオチド#3571における推定終止部位に加えて、テロメラーゼ−特異的モチーフ
「FFYVTE」、「PKP」、「AYD」、「QG」および「DD」の位置が同定された(図72
を参照のこと、これは、DNAおよび配列中のオープンリーディングフレーム(「
a」、「b」および「c」)に対応するアミノ酸配列を示す)。しかし、初期の
配列決定作業の予備的性質のため、種々のモチーフについてのリーディングフレ
ームはアラインメントにおいては見出されなかった。
に存在しないコード配列の5'末端からの有意な部分を含有したことを示した。さ
らに、pGRN121は、約182ヌクレオチドのインサートを含む変異体コード配列を含
有することが判明した。このインサートはこのクローンには存在しないことが判
明した。E. aediculatus配列に関しては、このような変異体は、テロメラーゼア
ッセイのような機能的アッセイにおいて試験して、試料中の機能的テロメラーゼ
の存在を検出し得る。
,000ダルトンの分子量、および1132アミノ酸の部分をコードする連続したオープ
ンリーディングフレームを提供した。この分析に基づくpGRN121の洗練された地
図を図73に提供する。hTRT cDNAのさらなる配列分析の結果を図16に示す(配列
番号1)。
hTRTの豊富さと細胞不死性との相関
hTRT mRNAの相対的豊富さを、6つのテロメラーゼ陰性の有寿命細胞株および6
つのテロメラーゼ陽性不死細胞株において評価した(図5)。hTRT mRNAの定常状
態レベルは、以前に活性テロメラーゼを有することが示されている不死細胞株に
おいて有意に増加した。より低レベルのhTRT mRNAが、いくつかのテロメラーゼ
陰性細胞株において検出された。
arringtonら, 1997, Science 275:973:Nakayamaら, 1997, Cell 88:875])および
(RNAテンプレートの同等量について標準化するための)GAPDHについてのRT-PCR
を以下の細胞に由来するRNAに対して行った:(1)ヒト胎児肺線維芽細胞GFL、
(2)ヒト胎児皮膚線維芽細胞GFS、(3)成人前立腺線維芽細胞31YO、(4)ヒト
胎児膝滑膜線維芽細胞HFS、(5)新生児包皮線維芽細胞BJ、(6)ヒト胎児肺線
維芽細胞IMR90、および不死化細胞株;(7)メラノーマLOX IMVI、(8)白血病U
251、(9)NCI H23肺ガン、(10)結腸腺ガンSW620、(11)乳腫瘍MCF7、(12)
293アデノウイルスE1形質転換ヒト胚腎臓細胞株。
オチドプライマーLT5およびLT6(表2〜6)を用い、hTRT核酸をcDNAから増幅し
た。合計16サイクル(94℃45秒間、55℃45秒間、72℃90秒間)の間、プライマー
KI36(5'-CTCAGACACCATGGGGAAGGTGA)およびK137(5'-ATGATCTTGAGGCTGTTGTCATA)を
用い、GAPDHを増幅した。合計22サイクルの間(94℃45秒間、55℃45秒間、72℃9
0秒間)、プライマーF3b(5'-TCTAACCCTAACTGAGAAGGGCGTAG)およびR3c(5'-GTTTGC
TCTAGAATGAACGGTGGAAG)を用い、hTRを増幅した。28サイクル(hTRTと同じサイク
ル)の間、プライマーTP1.1およびTP1.2を用い、TP1 mRNAを増幅した。反応産物
を8%ポリアクリルアミドゲルで分離し、SYBR Green(Molecular Probes)で染色
し、そしてStrom860 (Molecular Dynamics)でスキャニングすることによって可
視化した。図5に示す結果は、hTRT mRNAレベルは試験した細胞におけるテロメ
ラーゼ活性と直接的に相関することを示す。
hTRTイントロン配列の特徴付け
まず、本実施例に記載したように、ヒトゲノムDNAのPCR増幅によって推定イン
トロンを同定し、引き続いて、ゲノムクローンλGφ5を配列決定することによ
って確認した(実施例4を参照のこと)。逆方向プライマーTCP1.46、TCP1.48、
TCP1.50、TCP1.52、TCP1.54、TCP1.56、およびTCP1.58(表2〜6を参照のこと
)と個々に対とした正方向プライマーTCP1.57を用い、PCR増幅を行った。TCP1.5
7/TCP1.46、TCP1.48、TCP1.50、TCP1.52、TCP1.54またはTCP1.56増幅のゲノムDN
Aからの産物は、pGRN121増幅の産物よりも約100塩基対大きかった。TCP1.57/TCP
1.58増幅は、ゲノムDNAまたはpGRN121 DNAのいずれについても同一であった。こ
のことは、ゲノムDNAがTCP1.58およびTCP1.50についての部位の間に挿入を含有
したことを示した。TCP1.57/TCP1.50およびTCP1.57/TCP1.52のPCR産物を、プラ
イマーTCP1.39、TCP1.57、およびTCP1.49を用い、サブクローニングすることな
く、直接配列決定した。
74および275に対応する部位において、hTRT mRNAに挿入される(太字で示す)。
ス5'および3'スプライス部位配列に対して良好なマッチを示す。
的なモチーフを含有する(図21を参照のこと)。部分的には、トポイソメラーゼ
IIの発現はほとんどの腫瘍においてアップレギュレートされるので、これらのモ
チーフは興味深い。それは、DNAを切断し、巻き戻し、従って、特定の遺伝子の
発現を増大させることによって、DNAを弛緩させるように機能する。トポイソメ
ラーゼIIのインヒビターは抗腫瘍剤として作用することが示されている。NFκB
の場合には、この転写因子は、発生の間のテロメラーゼの初期抑制におけるよう
な、末端分化の間にテロメラーゼの調節において役割を果たし得、従って、細胞
においてテロメラーゼ活性を調節する処置的介入のための別の標的である。
λファージGφ5のクローニングおよびhTRTゲノム配列の特徴付け
A.λGφ5
PCRおよびハイブリダイゼーションによってヒトゲノムDNAライブラリーをスク
リーニングして、hTRT RNAコード配列を含有するゲノムクローンを同定した。ラ
イブラリーはWI38肺線維芽細胞からのDNAを用いて作製したヒト線維芽細胞ゲノ
ムライブラリーであった(Stratagene, カタログ番号946204)。このライブラリ
ーにおいて、部分的Sau3AIフラグメントをLambda FIX(登録商標)RIIベクター(S
tratagene)のXhoI部位に、9〜22kbのインサートサイズを有して連結した。
をネステッドPCR(外側プライマー対TCP1.52およびTCP1.57;内側対TCP1.49およ
びTCP1.50、表1を参照のこと)によってスクリーニングした。これらのプライマ
ー対は、hTRTのゲノムDNAにおける推定イントロン(実施例3、上記を参照のこと
)にわたり、そしてPCR産物がhTRT cDNAクローンによる混入からではなくゲノム
供給源由来であることを確認した。陽性プールをさらに、2000ファージのプール
が得られるまで細分化した。このプールを低密度でプレーティングし、そして図
16の塩基対1552〜2108(それぞれ、制限部位SphIおよびEcoRV)を含むDNAフラグ
メントとのハイブリダイゼーションを介してスクリーニングした。
クリーニングし;両クローンはPCRにより陽性であった。クローンの1つ(λGΦ5)
をNotIで消化し、約20kbのインサートサイズが明らかとなった。引き続いてのマ
ッピング(下記を参照のこと)は、インサートサイズが15kbであること、および
ファージGΦ5がcDNA配列の開始部位の上流約13kbのDNAを含有することを示した
。
れたマップを図7に示す。ファージDNAをNcoIで消化し、そしてフラグメントをpB
BS167にクローン化した。得られたサブクローンをPCRによってスクリーニングし
て、hTRT cDNAの5'領域に対応する配列を含有するものを同定した。(hTRT遺伝
子配列および4〜5kbのλベクター配列を有する)9kb NcoIフラグメントを含むサ
ブクローン(pGRN140)を部分的に配列決定して、インサートの方向を決定した。S
alIを用いてpGRN140を消化して、λベクター配列を除去して、pGRN144を得た。
次いで、pGRN144を配列決定した。配列決定の結果を図21に提供する。hTRTmRNA
の5'末端は図21の塩基2441に対応する。図7に示すように、2つのAlu配列エレメ
ントがhTRT cDNAの5'末端の1700塩基対上流に位置し、そしてhTRTのプロモータ
ー領域に対してそれらしい上流限界を提供する。この配列はまた、実施例3(上
記)に記載したイントロンの3'側に、図21における塩基4173に位置するイントロ
ンを明らかとした。
前記したゲノムクローンに加えて、2つのP1バクテリオファージクローンおよ
び1つのヒトBACクローンが本発明の例示的実施態様として提供される。P1インサ
ートは、通常、75〜100kbであって、BACインサートは、通常、100 Kbを超える。
372)を、hTRTの3'末端を増幅するプライマーTCP1.12およびUTR2を用い、ヒト包
皮線維芽細胞(Shepherdら, 1994, PNAS USA 91:2629)に由来するヒトP1ライブ
ラリーのPCRスクリーニングによって得た。これらのクローンの両方は、hTRTの5
'末端を増幅するプライマーで、陰性(増幅されない)であった。
52〜2695)の1143 bp Sph1/Xmn1フラグメントを用い、BACヒトゲノムライブラリ
ーのハイブリダイゼーションスクリーニングで得た。このクローンは遺伝子の5'
末端を含むと考えられている。本実施例におけるhTRTゲノムクローンは全体のhT
RT遺伝子を含むと考えられる。
hTRT遺伝子の染色体位置
hTRT遺伝子は、全ヒトゲノム(Stanford Human Genome Centerで作製された)
の83RHクローンの中解像度(medium resolution)Stanford G3パネルを用い、照
射(radiation)ハイブリッドマッピング(Boehnkeら, 1991, Am J Hum Genet 49:
1174; Walterら, 1994, Nature Genet 7:22)によって、染色体5pに位置付けら
れた。ヒトリンパ芽球様細胞株(ドナー:rM)を10,000ラドのX線に暴露し、次
いで、非照射ハムスターレシピエント細胞(A3)と融合させた。83の独立した体
細胞ハイブリッドクローンを単離し、そしてそれぞれは照射ドナー細胞とレシピ
エントハムスター細胞との間の融合事象を表す。G3 DNAのパネルを、目的の領域
においてマーカーを順序付けるため、ならびにこれらのマーカー間の距離を確立
するために使用した。
びPerkin-Elmer Taqを用いる94℃45秒間、55℃45秒間、72℃45秒間の45サイクル
の増幅条件でのTCP1.12およびUTR2であった。83プールを独立して増幅し、そし
て14(17%)が(346bpバンドの出現によって)hTRTについて陽性であると評価し
た。増幅結果をStanford RHサーバーに提出し、次いで、これはマップ位置5pお
よび最も密接なマーカーSTS D5S678を提供した。
STSマーカーD5S678:CEPH YAC 780 C 3サイズ:390,660kbを含有するYACを同定し
た。このYACはまた、染色体17マーカー含有した。この結果は、hTRT遺伝子は染
色体5上のテロメア末端近くにあることを示した。多数の腫瘍において5pのコピ
ー数が増大した。猫鳴き症候群もまた、この領域における欠失に対してマップさ
れている。
hTRTタンパク質およびポリヌクレオチドの発現用ベクターの設計および構築
細菌におけるhTRTの発現
本実施例の以下の部分は、大量の全長の生物学的活性hTRTを生成させるための
hTRT発現細菌および真核生物細胞の発現ベクターの設計を詳細に記載する。この
方法での生物学的に活性なhTRTタンパク質の生成は、いくつかの例として、テロ
メラーゼ再構築アッセイ、テロメラーゼ活性モジュレーターのアッセイ、hTRTの
新しく単離された種の活性の分析、hTRTと特異的に会合する化合物の同定および
単離、部位特異的に変異したhTRT変異型タンパク質の活性の分析に、および免疫
原として有用である。
大量の全長hTRTを生成させるために、細菌発現ベクターpThioHis A(Invitrog
en, San Diego、CA)を発現系として選択した。hTRT−コーディングインサートは
、プラスミドpGRN121におけるhTRTインサートのヌクレオチド707〜4776を含む。
このヌクレオチド配列は、hTRTタンパク質の完全なコード配列を含む。
このベクターを誘導して、E. coliにおいて、切断可能なHISタグしたチオレドキ
シン部分および全長hTRTタンパク質よりなる高レベルの融合タンパク質を発現さ
せ得る。この発現系の使用は、製造業者の説明書に実質的に従った。本発明の得
られたベクターによってコードされる融合タンパク質のアミノ酸配列を以下に示
す;(-*-)はエンテロキナーゼ切断部位を示す。
本発明のこの構築物を用いて、例えば、hTRTタンパク質に対するポリクローナ
ル抗体およびモノクローナル抗体を産生させる目的で、融合タンパク質を生成さ
せる。hTRTのフラグメントはまた、例えば、ドミナントネガティブ変異体として
テロメラーゼ活性を調節するか、あるいはテロメラーゼ成分と他のタンパク質ま
たは核酸との会合を防げるような、他の目的のために使用され得る。
ーpGEX-2TK(Pharmacia Biotech, Piscataway N.J)を選択し、そして製造業者の
説明書に本質的に従って用いて、本発明の発現ベクターを作製した。得られた構
築物はプラスミドpGRN121におけるhTRTインサートのヌクレオチド3272から4177
に由来するインサートを含有する。このベクターは、下記に示すように、グルタ
チオン-S-トランスフェラーゼ配列(下方に下線)、トロンビン切断配列(二重
下線)、心筋タンパク質キナーゼの認識配列(イタリック体)、括弧中のクロー
ニングによって導入された残基([GSVTK])およびhTRTタンパク質フラグメント
(太字)よりなる高レベルの融合タンパク質のE. coliにおける発現を指向する
。
、封入体からのタンパク質の精製と題した節において前記したように一般的に処
理した。具体的には、誘導された細胞をPBS(20mMリン酸ナトリウム、pH7.4、15
0mM NaCl)に懸濁し、そして超音波処理によって破壊した。NP−40を0.1%まで
添加し、そして混合物を穏やかに混合しつつ4℃で30分間インキュベートした。4
℃で30分間25,000gで遠心分離することによって、不溶性物質を収集した。不溶
性物質をPBS中の4M尿素中で1回洗浄し、遠心分離によって収集し、次いでPBS中
で再度洗浄した。収集したペレットは、75%を超える融合タンパク質を含有する
と評価された。この物質をスピードバキューム(speed vacuum)中で乾燥し、次い
で、抗体の生成のためのマウスおよびウサギへの注射用のアジュバントに懸濁し
た。グルタチオン-S-トランスフェラーゼ部分からの組換えタンパク質の分離は
、製造業者のに従ってトロンビンを用いる部位特異的タンパク分解によって達成
される。
大量のhTRTのフラグメントを生成させるために、別のE. coli発現ベクターpGE
X−2TK構築物を調製した。この構築物はプラスミドpGRN121におけるhTRTインサ
ートのヌクレオチド2426〜3274に由来するインサートおよび8つの連続的ヒスチ
ジン残基(HIS-8タグ)をコードする配列を含有する。HIS-8 TAGを挿入するため
に、pGRN121のhTRTヌクレオチド2426〜3274を有するpGEX-2TKベクターをBamHIで
線状化した。これはGST−トロンビン−心筋タンパク質キナーゼとhTRTコード配
列との間の接合においてプラスミドを開環させた。BamHI適合末端を有する二本
鎖オリゴヌクレオチドを線状化プラスミドに連結させて、hTRT配列の上流の8個
のヒスチジン残基のインフレーム導入がなされた。
下線);トロンビン切断配列(二重下線);心筋タンパク質キナーゼの認識配列
(イタリック体);括弧内にあるクローニングによって導入された3残基の組お
よび5残基の組([GSV]および[GSVTK]);8つの連続ヒスチジン(また二重
下線);およびhTRTタンパク質フラグメント(太字):よりなる融合タンパク質
の高レベルの発現を指向する。
クローナル抗体およびモノクローナル抗体を生成させる目的のために融合タンパ
ク質を生成させ得る。加えて、この融合タンパク質を用いて、融合タンパク質内
に含まれるhTRTペプチドに対して生成される抗体をアフィニティー精製し得る。
グルタチオンS-トランスフェラーゼ部分に由来する組換えタンパク質の分離は
、製造業者の指示に従ってトロンビンを用いる部位特異的タンパク分解によって
達成することができる。
大量のhTRTのフラグメントを生成させるために、別のE. coli発現ベクターpGE
X-2TK構築物を調製した。
6〜3274に由来するインサートを含むが、前記構築物のHIS-8タグを含まない。こ
のベクターは、グルタチオン-S-トランスフェラーゼ(下線)、トロンビン切断
配列(二重下線)、心筋タンパク質キナーゼの認識配列(イタリック体)、括弧
内のクローニングによって導入された残基([GSVTK])、およびhTRTタンパク質
フラグメント(太字)よりなる融合タンパク質の高レベルのE. coliにおける発
現を指向する。
大量のhTRTタンパク質のフラグメントを生成させるために、別のE. coli発現
ベクターpGEX-2TK構築物を調製した。
〜2458に由来するインサートを含有する。このベクターは、グルタチオン-S-ト
ランスフェラーゼ(下線)、トロンビン切断配列(二重下線)、心筋タンパク質
キナーゼの認識配列(イタリック体)、括弧内のクローニングによって導入され
た残基([GSVTK])、およびhTRTタンパク質フラグメント(太字)よりなる融合
タンパク質の高レベルのE. coliにおける発現を指示する。
大量のhTRTタンパク質のフラグメントを生成させるために、別のE. coli発現
ベクターpGEX-2TK構築物を調製した。
1636に由来するインサートを含有する。このベクターは、グルタチオン-S-トラ
ンスフェラーゼ(下線)、トロンビン切断配列(二重下線)、心筋タンパク質キ
ナーゼについての認識配列(イタリック体)、括弧内のクローニングによって導
入された残基([GSVTK])、およびhTRTタンパク質フラグメント(太字)よりな
る融合タンパク質の高レベルのE. coliにおける発現を指向する。
前記のように、1つの実施態様において、本発明は、いずれの5'非翻訳hTRT配
列も有さない細菌、哺乳動物、酵母および昆虫の発現ベクターへのクローニング
を容易にするための部位特異的な様式で改変されたhTRTを提供する。いくつかの
状況において、非タンパク質をコードする配列の量を最小にすることは、改善さ
れたタンパク質産生(収率)および増大したmRNA安定性を可能とする。本発明の
この実施態様において、hTRT遺伝子の5'非コード領域を、細菌発現ベクターへの
クローニングに先立って除去した。
らなる制限エンドヌクレアーゼ部位を操作することによって行った(図16)。タ
ンパク質のコード領域に対してすぐ5'側の制限部位の生成は、免疫検出および精
製のための、標識およびペプチドタグを含む融合タンパク質のような融合タンパ
ク質をコードする広範囲のベクターの効率的な産生を可能とする。
述したように用いて、hTRTcDNAのhTRTcDNAヌクレオチドの779〜781をGCGからCAT
へと改変した(図16)。これらの3つのヌクレオチドは、タンパク質配列を改変
しないような、ATG開始コドン前の最後のヌクレオチドである。配列の変化によ
り、hTRT cDNAにおいて唯一のNdeI制限部位が作製された。一本鎖hTRT DNAを部
位特異的変異誘発のためのDNA供給源として使用した。得られたプラスミドを配
列決定して、変異誘発の成功を確認した。
する。部位特異的に改変したhTRT配列(NdeI制限部位の付加)をNdeIおよびNcoI
で消化して、hTRTをコードする核酸フラグメントを生成した。次いで、このフラ
グメントを、NdeIおよびSmaI(また、平滑末端カッター)で予め制限消化したpS
L3418プラスミドにクローン化した。pSL3418は、FLAG配列(Immunex Corp., Sea
ttle,WA)およびエンテロキナーゼ配列が上記のNdeI部位からすぐ上流に挿入され
た、改変されたpAED4プラスミドである。pT7FLhTRTと命名されたこのプラスミド
は、T7 RNAポリメラーゼを発現するE. coli株における(その5'末端にFlag−タ
グを有する)全長hTRTの発現を可能とする。
前述したように、本発明は、いくつかのまたは全ての非コード配列が欠失され
たTRTをコードする核酸を含有する発現ベクターを提供する。いくつかの状況に
おいて、非タンパク質をコードする配列の量を最小化することは、改善されたタ
ンパク質産生(収率)を可能にし、そしてmRNA安定性を増大させる。本発明のこ
の実態様において、hTRTの3'非翻訳領域を、細菌発現プラスミドへのクローニン
グ前に欠失させる。
のApaI部位を欠失させる。これに続いて、3’UTRを含有するMscI-HincII hTRT制
限消化酵素フラグメントを欠失する。次いで、hTRTの停止コドンを含有するNcoI
-XbaI制限消化フラグメントを、pGRN121のNcoI-XbaI部位に挿入して、3’UTRを
欠く以外はpGRN121と同等のpGRN124と命名したプラスミドを作製した。
本発明はまた、形質転換細胞に選択可能表現型を付与する選択マーカー、なら
びに宿主ゲノムへの組み込みが必要とされないようなエピソームの維持および複
製のためのコード配列を含有し得る細菌発現ベクターを提供する。例えば、この
マーカーは抗生物質耐性、特にクロラムフェニコール(Harrod (1977) Nucleic
Acids res. 25:1720-1726を参照のこと)、カナマイシン、G418、ブレオマイシ
ン、およびハイグロマイシンに対する耐性をコードし得、所望のDNA配列で形質
転換したこれらの細胞の選択を可能にする。例えば、Blondelet-Rouault (1977)
Gene 190:315-317;およびMahan (1995) Proc Natl Acad Sci USA 92:669-673を
参照のこと。
抗生物質耐性遺伝子が挿入された改変されたBlueScriptプラスミドベクター(Str
atagene, San Diego、CA)に全長hTRTをクローン化した。TRT ORFがベクターのLa
cプロモーターの反対方向となるように、hTRT ORFを含有するpGRN124(前記)か
らのNotIフラグメントを、pBBS235のNotI部位に挿入した。これは、本発明のTRT
核酸のようなプラスミドインサートの変異誘発に適したプラスミドを作製する。
pGRN125と命名したこのプラスミド構築物は、テロメラーゼ酵素およびTRTタンパ
ク質コード配列のの変異誘発を含み、T7プロモーターを用いるhTRTのインビトロ
転写(およびT3プロモーターを用いるアンチセンスhTRTのインビトロ転写)のた
めの本発明の方法で使用し得る。
消化フラグメントを、TRT ORFがベクターのLacプロモーターと同一方向であるよ
うにpBBS235(前記)のNcoI部位にサブクローン化した。これは、E. coliにおけ
る全長hTRTの発現で使用し得るpGRN126と命名したプラスミドを作製する。発現
された産物は、ベクターpBBS235によってコードされる29個のアミノ酸、続くhTR
Tの5’UTRによってコードされる18個のアミノ酸、続く全長hTRTタンパク質を含
有する。
TRT開始ATGコドンをkozakコンセンサスに変換し、発現ベクターへのクローン化
を容易にするためのEcoRIおよびBglII制限消化部位を作製させる。オリゴヌクレ
オチド5'−TGCGCACGTGGGAAGCCCTGGCagatctgAattCcaCcATGCCGCGCGCTCCCCGCTG−3'
(以下の場合における改変されたヌクレオチド)を変異誘発手順で使用した。得
られた発現ベクターをpGRN127と命名した。
変換して、非機能的テロメラーゼ酵素に作製し、従って、優性/陰性変異体とし
て使用するための変異体TRTタンパク質を作製する。hTRTコード配列をオリゴヌ
クレオチド5'−CGGGACGGGCTGCTCCTGCGTTTGGTGGAcGcgTTCTTGTTGGTGACACCTCACCTCA
CC−3'を用いてインビトロ変異誘発して、残基869のアスパラギンコドン(Asp86
9)をアラニン(Ala)コドンに変換した。これはまた、MluI制限酵素部位を作製
した。得られた発現プラスミドをpGRN130と命名し、これはまた、pGRN127につい
て記載したkozakコンセンサス配列含有する。
ベクターを提供する。pGRN126プラスミドを、MscIおよびSmaI制限酵素で完全に
切断し、そして再度連結してhTRT ORFの95%以上を欠失させた。このプロセスの
間に、1つのSmaI-MscIフラグメントを再度挿入してCAT活性を再生した。この未
精製プラスミドを、次いで、SalIおよびEcoRIで再度消化し、そしてhTRT ORFの
開始コドンを含有するフラグメントをpBBS212のSalI-EcoRI部位に挿入して、5’
UTRおよび(哺乳動物細胞における)hTRT ORFの73塩基対残基にわたるアンチセ
ンス配列を発現するアンチセンス発現プラスミドを作製した。このプラスミドを
pGRN135と命名した。
本発明はまた、大量の全長の生物学的に活性なhTRTを産生するための、hTRT発
現酵母発現ベクターを提供する。
大量の全長の生物学的活性hTRTを産生させるために、Picha pastoris発現ベク
ターpPICZ B(Invitrogen, San Diego、CA)を選択した。hTRTコード配列インサ
ートはプラスミドpGRN121におけるhTRTインサートのヌクレオチド659〜4801に由
来するものであった。このヌクレオチド配列はhTRTをコードする全長配列を含む
。この発現ベクターは、高レベルの全長の未修飾hTRTタンパク質のP.pastorisに
おける誘導性発現のために設計される。発現は酵母プロモーターによって駆動さ
れるが、発現された配列はhTRT開始および終結コドンを利用する。外因性コドン
をクローニングによって導入した。得られたpPICZ B/hTRTベクターを用いて酵母
を形質転換した。
pPICZ Bに由来する本発明の第2のPicha pastoris発現ベクターはまた、プラス
ミドpGRN121におけるhTRTインサートのヌクレオチド659〜4801に由来するhTRTを
コードする全長配列を含む。このhTRT-His6/pPICZ B発現ベクターは、そのC-末
端でMycエピトープおよびHis6レポータータグ配列を融合した全長hTRTタンパク
質をコードする。hTRT停止コドンは除去され、そしてMycエピトープおよびHis6
レポータータグならびに停止コドンをコードするベクター配列によって置換され
ている。このベクターは、hTRT配列(下線)、括弧中のベクター配列([L]お
よび[NSAVD])、Mycエピトープ(二重下線)、およびHis6 タグ(イタリック
体)よりなる、以下の融合タンパク質の酵母における高レベルの誘導性発現を指
示するように設計される:
本発明はまた、大量の全長の生物学的に活性なhTRTを産生するhTRTテロメラー
ゼ発現昆虫細胞発現ベクターを提供する。
目的のテロメラーゼコード配列をバキュロウィルス発現ベクターpVL1393(Inv
itrogen, San Diego,CA)にクローン化した。この構築物を、Autograph californ
ia核多角体ウイルス(Baculogold-AcMNPV)からの線状化したDNAとともに、Spodo
ptera fungupeida(sf−9)細胞に引き続いて同時トランスフェクトした。得ら
れた組換えバキュロウイルスを引き続いてプラーク精製し、そして標準的なプロ
トコルに従って増殖させた。
を提供する。発現はバキュロウィルスポリヘドリン遺伝子プロモーターによって
駆動される。外因性コドンはクローニングによって導入されなかった。
大量の全長の生物学的活性なhTRTを産生するために、バキュロウィルス発現ベ
クターpBlueBacHis2 B(Invitrogen, San Diego,CA)を制御エレメントの供給源
として選択した。hTRT-コードインサートはプラスミドpGRN121におけるhTRTイン
サートのヌクレオチド707〜4776からなるものであった。
のベクターはまた、プラスミドpGRN121由来のhTRTインサートのヌクレオチド707
〜4776からなるインサートを含む。このベクターは、高レベルの、切断可能6−
ヒスチジンおよび抗Xpressタグに融合した全長hTRTタンパク質の昆虫細胞におけ
る高レベルの発現を指示し、そして融合タンパク質のアミノ酸配列を以下に示す
;(−*−)はエンテロキナーゼ切断部位を示す:
大量の全長の生物学的に活性なhTRTを産生するために、第2のバキュロウイル
ス発現ベクター、pBlueBac4.5 (Invitrogen, San Diego,CA)を構築した。hTRTを
コードするインサートはまた、プラスミドpGRN121由来のhTRTのヌクレオチド707
〜4776よりなるものであった。
大量の全長の生物学的に活性なhTRTを産生するために、第3のバキュロウィル
ス発現ベクター、pMelBacB (Invitrogen,San Diego, CA)を構築した。hTRTをコ
ードするインサートはまた、プラスミドpGRN121由来のhTRTインサートのヌクレ
オチド707〜4776よりなる。
の昆虫細胞における全長hTRTの発現を指示する。高レベルの全長hTRTがこのよう
にして分泌される。メリチンシグナル配列は排出される場合は切断されるが、細
胞内に維持されるタンパク質プールの一部である。この理由から、以下の配列に
おいて括弧内に示される。このベクターによってコードされる融合タンパク質の
配列を下記に示す:
本発明はまた、上で議論したように、本発明の多くの実施態様において有用で
ある種々の哺乳動物細胞株において全長の生物学的に活性なタンパク質として大
量にhTRTを産生するためのベクターを提供する。
本発明はまた、コード配列を現実には修飾する(例えば、コドン使用法を最適
化する)ことなく、テロメラーゼのような組換えタンパク質の最大の可能な発現
を与える哺乳動物細胞での使用のための発現系を提供する。1つの実施態様にお
いて、本発明は、本発明のTRTを発現し得るMPSV哺乳動物発現プラスミド(Lin J
-H (1994) Gene 47:287-292においてpMPSV-TMとして記載されたプラスミドpBBS2
12由来)を提供する。MPSVプラスミドは、安定なクローンまたは一過性のクロー
ンのいずれかとして発現され得る。
レメントがベクターに組み込まれる。サイトメガロウイルス(CMV)エンハンサ
ーによって増強される骨髄増殖性肉腫ウイルス(MPSV)LTR(MPSV-LTR)プロモータ
ーを転写開始のために組み込む。このプロモーターは一貫して細胞株におけるよ
り高い発現レベルを示す(Lin J-H (1994), 前出を参照のこと)。Kozakコンセン
サス配列を翻訳開始のために組み込み得る(Kozak (1996) Mamm. Genome 7:563-
574を参照のこと)。全ての外因性5'および3'非翻訳hTRT配列を除去して、これら
の配列が上記のように発現を妨げないことを確認し得る。全ての外因性配列を有
する、完全なhTRTコード配列を含有するMPSVプラスミドをpGRN133と命名する。
コントロールであるhTRT「アンチセンス」プラスミドをまた構築した。このベク
ターは、TRTインサートがhTRTのアンチセンス配列である以外はpGRN133と同一で
ある(このコントロールがベクターとして使用され得るアンチセンスをpGRN134
と命名する)。全ての他の外因性配列が除去され、そしてKozakコンセンサス配
列を有する完全なhTRTコード配列を含有するMPSVプラスミドをpGRN145と命名す
る。
プロマイシン耐性)およびHygB(ハイグロマイシンB=ハイグロマイシン耐性)
はトランスフェクション後のプラスミドの選択のために存在する(上記の選択マ
ーカーに言及する議論を参照のこと)。ベクターポリリンカーの両側のマーカー
を使用する二重選択はhTRTコード配列の安定性を増大させるはずである。DHFR(
ジヒドロ葉酸レダクターゼ)コード配列を含ませて、安定なクローンが作製され
た後に発現カセットの増幅を可能とする。また、遺伝子増幅の他の手段を使用し
て、組換えタンパク質収率を増大させ得る。
提供する。1つの実施態様において、hTRT配列を、その5'非翻訳領域を保持した
まま、IBI FLAG(International Biotechnologies Inc. (IBI), Kodak, New Hav
en, CT)のようなエピトープフラッグに連結させ、そしてMPSV発現プラスミドに
挿入する(pGRN147と命名する)。この特定の構築物は、Kozak翻訳開始部位を含
む。発現された融合タンパク質は、M-1抗FLAGオクタペプチドモノクローナル抗
体(IBI, Kodak,前出)を用いて精製され得る。
コドンを変異誘発し、869位のアスパラギン酸をアラニンに変化させる。その5'
非翻訳領域を保持し、そしてKozak配列を組み込むこのAsp869→Ala hTRT変異体
をMPSV発現プラスミドに挿入し、そしてpGRN146と命名した。Asp869→Ala hTRT
変異体を、さらに、上記のようにFLAG配列を含有するように操作し、そしてこの
インサートをMPSV発現プラスミドにクローン化した。この発現プラスミドをpGRN
154と命名する。特に、pGRN154については、hTRTの「先端」(5'セグメント)を
含有するKozak配列を含むpGRN146由来のEam1105I制限消化フラグメントをpGRN14
7(上記を参照のこと)のEam1105I部位にクローン化して、Kozak配列、上記のD
869−>A変異、およびIBIフラッグを有するhTRTを発現し得るMPSV発現プラスミ
ドを作製する。
された哺乳動物発現プラスミドを、(hTRT ORFを含有する)プラスミドpGRN146
からEcoRIフラグメントを切り出すことによって生成し、そしてpBBS212のEcoRI
部位にクローン化して、hTRTの5’UTRを除去した。このhTRTは、その発現がMPSV
プロモーターによって制御されるような方向である。これにより、Kozakコンセ
ンサス配列およびD869−>A変異を有するhTRTを発現する哺乳動物発現プラスミ
ドを作成し、そしてMPSVプロモーターを使用する。
うな方向とした哺乳動物発現ベクターを提供する。例えば、hTRTオープンリーデ
ィングフレーム(ORF)を含有するpGRN137由来のEcoRI制限消化フラグメントをp
BBS212(下記参照のこと)のEcoRI部位にクローン化し、このようにして、hTRT
の5'非翻訳領域(5'-UTR)を除去した。pGRN137を、pGRN136のSal 1-SSE 8387I
部位へのhTRTのKozak変異を有する後記のpGRN130からSalI-Sse8387Iフラグメン
トを切り出し、MPSVプロモーターから離れてKozakコンセンサス配列を含有するh
TRTを発現する哺乳動物発現プラスミドを作製することによって構築した。プラ
スミドpGRN136を、hTRT ORFを含有するpGRN126からHindIII SalIフラグメントを
切り出し、そしてそれをプラスミドpBBS242のHindIII SalI部位にクローニング
し、MPSVプロモーターから離れてhTRTを発現する哺乳動物発現プラスミドを作製
することによって構築した。これにより、MPSVプロモーターを用いて、Kozakコ
ンセンサス配列を有するhTRTを発現するpGRN145と命名された哺乳動物発現プラ
スミドが作製される。下記のpGRN152 MPSVプロモーター駆動性哺乳動物発現ベク
ターも参照のこと。
エピソームベクターpEBVHis(Invitrogen, San Diego, CA)を、N末端発現エ
ピトープタグ、Xpressエピトープ(Invitrogen, San Diego, CA)に融合したhTRT
を含むhTRT融合タンパク質を発現するように操作した(pGRN122と命名した)。h
TRT ORFを含有するpGRN121由来のNotI hTRTフラグメントを、hTRT ORFがベクタ
ーのラウス肉腫ウイルス(RSV)プロモーターと同一方向になるように、pEBVHis
AのNotI部位にクローン化した。この方向において、His6フラッグはhTRTのN末
端に比較的近かった。
として含むように構築した(コントロールとして使用できるプラスミドpGRN123
と命名した)。このベクターを293細胞にトランスフェクトし、そしてXpressエ
ピトープに対して特異的な抗体を用いて、翻訳されたhTRTを同定し、そして単離
した。pEBVHisは、N末端ペプチドに融合した目的のタンパク質を発現するハイ
グロマイシン耐性EBVエピソームベクターである。このベクターを有する細胞を
選択し、そして増殖させ、次いで、核および細胞質抽出物を調製した。これらお
よびコントロール抽出物を抗Xpress抗体で免疫沈降させ、免疫沈降したビーズを
通常のアッセイによってテロメラーゼ活性について試験する。
本発明の1つの実施態様において、組換えhTRTおよび必要なテロメラーゼ酵素
複合体成分を、正常なディプロイド有寿命性細胞で発現させて、それらの増殖能
力を増大、あるいはそれらを不死化させ、またはそれらの不死化を促進し得る。
これにより、さもなければ正常な表現型および核型(karotype)を有するディプ
ロイドの不死化細胞を得ることができる。上記の、テロメラーゼのこの用途は膨
大な商業的利用性を有する。
。これらのベクターを精製し、そして2つの正常な有寿命性のディプロイドヒト
細胞クローンに一過性にトランスフェクトした。ヒトクローンは若い継代のディ
プロイドヒトBJおよびIMR90細胞株であった。
用いるテロメラーゼ活性の分析は、アンチセンスhTRTではなくセンスhTRTのトラ
ンスフェクションがBJおよびIMR90の両方の細胞株でテロメラーゼ活性を生じた
ことを示した。
上記のディプロイドヒトBJおよびIMR90細胞株研究で使用したCMVベクターにク
ローン化した同一hTRTセンス構築物を用いて、不死化SW13ALT経路細胞株(SV40
抗原で不死化したIMR90細胞)を一過性にトランスフェクトした。TRAPアッセイ
(TRAPeze, Oncor, Inc., Gaithersburg, MD)は、テロメラーゼ活性がセンス構
築物でトランスフェクトした細胞で生じたことを示した。
および抑制性発現
本発明は、hTRTのような本発明のTRTの発現を誘導または抑制するように操作
され得るベクターを提供する。例えば、hTRTコード配列を、Invitrogen (San Di
ego,CA)によるエクジソン(Ecdysone)誘導性発現系およびClontech Laboratories
, Inc. (Palo Alto, CA)によるTet-OnおよびTet-offテトラサイクリン調節系に
クローン化し得る。このような誘導性発現系は、トランスフェクトしたTRTの転
写のレベルまたは速度を制御することが重要である本発明の方法で使用するため
に提供される。例えば、本発明は、hTRTの発現を介して不死化された細胞株を提
供し;このような細胞は、Tet-Off系によって提供されるもののような、転写制
御を介する、ベクターによるhTRT発現の阻害によって「有寿命性」にし得る。本
発明はまた、hTRTの構成的発現を回避するためにTRTを一時的にのみ発現する方
法を提供し、これは上記のように、トランスフェクトした細胞の所望されない「
不死化」を導き得る。
節された発現を可能にするように設計される。この系は、哺乳動物細胞において
ほとんど検出されない基底発現および200倍よりも大きい誘導性を可能とするそ
の厳密に調節されたメカニズムによって区別される。この発現系はDrosophilaの
ヘテロダイマーエクジソンレセプターに基づく。エクジソン誘導性発現系は、ヘ
テロダイマー核レセプターを介してhTRTの発現を活性化するためにステロイドホ
ルモンエクジソンアナログ、ムリステロンAを使用する。発現レベルは、基底レ
ベルよりも200倍を超え、哺乳動物細胞生理学に対する効果を有さないと報告さ
れている(「Ecdysone-Inducible Gene Expression in Mammalian Cells and Tr
ansgenic Mice」 (1996) Proc. Natl. Acad. Sci. USA 93, 3346-3351)。一旦、
レセプターがエクジソンまたはムリステロン(エクジソンのアナログ)に結合す
ると、レセプターはエクジソン応答性プロモーターを活性化して、目的の遺伝子
の制御された発現をももたらす。エクジソン誘導性哺乳動物発現系において、ヘ
テロダイマーレセプターの両方のモノマーは同じベクターであるpVgRXRから構成
的に発現される。最終的に、目的の遺伝子の発現を駆動するエクジソン応答性プ
ロモーターは、目的の遺伝子の転写を駆動する第2のベクターpIND上に位置する
。
位の上流の5つの修飾されたエクジソン応答エレメント(E/GRE)を含有するpIND
ベクター(Clontech Laboratories, Inc., Palo Alto,CA)にクローン化する。次
いで、この構築物を、エクジソンレセプターを安定に発現するように予め操作さ
れた細胞株にトランスフェクトする。トランスフェクション後、細胞をムリステ
ロンAで処理して、pIND由来の細胞内発現を誘導する。
系についてはGossen (1992)「Tight control of gene expression in mammalian
cells by tetracycline responsive promoters」 Proc. Natl. Acad. Sci. USA 8
9:5547-5551;およびTet-On誘導性転写系についてはGossen (1995) 「Transcript
ional activation by tetracycline in mammalian cells」 Science 268:1766-17
69によって記載された、調節された高レベル遺伝子発現系を利用する。「Tet-Of
f」形質転換細胞株においては、テトラサイクリン(Tc)またはドキシサイクリ
ン(「Dox」はTc誘導体)が培養培地から除去された場合に遺伝子発現はスイッチ
が入る。対照的に、TcまたはDoxの培地への添加によってTet-On細胞株では発現
にスイッチが入る。両方の系は、種々の濃度のTcまたはDoxに応答して厳密に調
節されるべきクローン化遺伝子の発現を可能にする。
RE」を使用する。プラスミドpTREはTet応答性PhCMV*-1プロモーターのすぐ下流
にマルチクローニング部位(MCS)を含有する。MCSの部位の1つに挿入された目
的の遺伝子またはcDNAは、それぞれ、Tet-OffおよびTet-On系においてtTAおよび
rtTA調節タンパク質に応答性である。PhCMV*-1は、7コピーの42bpのtetオペレ
ーター配列(tetO)よりなるTet応答性エレメント(TRE)を含有する。TREエレ
メントは、pTetプラスミドにおける完全なCMVプロモーターの一部であるエンハ
ンサーを欠く最小CMVプロモーター(PminCMV)のすぐ上流にある。結果として、
PhCMV*-1は、調節タンパク質のtetO配列への結合の非存在下でサイレントである
。このクローン化インサートは開始コドンを有さなければならない。いくつかの
場合には、Kozakコンセンサスリボソーム結合部位の付加は発現レベルを改善し
得る;しかし、多くのcDNAがKozak配列の付加なくしてTet系において効果的に発
現されてきた。pTRE-Gene XプラスミドをpTK-Hygで同時にトランスフェクトして
、安定なトランスフェクタントの選択を可能にする。
パク質およびTRTをコードする遺伝子の全コピーを含有する「二重-安定」細胞株
を生成させるための2つの連続的な安定なトランスフェクションを必要とする。
最初のトランスフェクションにおいて、適切な調節タンパク質を、適切な調節タ
ンパク質を発現する、pTet-OffまたはpTet-Onベクターのような「調節プラスミ
ド」のトランスフェクションによって、選択した細胞株に導入する。次いで、pT
RE「応答プラスミド」にクローン化されたhTRTを第2のトランスフェクションに
おいて導入して、二重-安定Tet-OffまたはTet-On細胞株を作製する。両方の系は
遺伝子発現の非常に厳密なon/off制御、調節された用量-依存性誘導、および高
い絶対レベルの遺伝子発現を与える。
pGRN155プラスミド構築物を、哺乳動物細胞におけるhTRT cDNAの一過性発現の
ために設計した。KozakコンセンサスをhTRT配列の5'末端に挿入する。hTRTイン
サートは3'または5’UTRを有さない。hTRT cDNAをp91023(B)(Wong (1985) Sci
ence 228:810-815)のEcoRI部位に挿入する。hTRTインサートはDHFR ORFと同一方
向である。これにより、一過性発現のため特に有用な発現ベクターを作製する。
よびエンハンサー、テトラサイクリン耐性遺伝子、E. coli起点、ならびにアデ
ノウイルスVAIおよびVAII遺伝子領域を有する。この発現カセットは、以下の順
序で以下のものを含む:アデノウイルス主要後期プロモーター;アデノウイルス
三部分リーダー;この三部分リーダーの第1のエクソン由来の5'スプライス部位
およびマウス免疫グロブリン遺伝子由来の3'スプライス部位からなるハイブリッ
ドイントロン:hTRT cDNA;マウスDHFRコード配列;およびSV40ポリアデニル化
シグナル。
される効率を増大させることが報告されている。DHFR配列は、ハイブリッドmRNA
の安定性を増大することが報告されている。また、DHFR配列は、ベクター配列の
選択および増幅のためのマーカーを提供し得る。Logan (1984) Proc. Natl. Aca
d. Sci. USA 81:3655); Kaufman (1985) Proc. Natl. Acad. Sci. USA 82:689;
およびKaufman (1988) Focus (Life Technologies, Inc.), 第10巻, 3号)を参照
のこと。
hTRTタンパク質をコードする全cDNAを含有するラムダクローン25-1.1.6由来の
EcoRIフラグメントを、cDNAの5'末端がベクター中のT7プロモーター近くになる
ように、pBluescriptIISK+のEcoRI部位に挿入した。このベクターで使用される
選択マーカーはアンピシリンである。
hTRT ORFを含有するpGRN121由来のNotIフラグメントを、コード配列がRSVプロ
モーターに作動可能に連結されるようにpEBVHisAのNotI部位に挿入した。このプ
ラスミドは、hTRTタンパク質のN末端に融合したHis6フラッグからなる融合タン
パク質を発現する。このベクターで使用される選択マーカーはアンピシリンまた
はハイグロマイシンである。
hTRT ORFを含有するpGRN121由来のNotIフラグメントを、コード配列がRSVプロ
モーターと反対方向になるようにpEBVHisAのNotI部位に挿入した。従ってアンチ
センスhTRTを発現する。
プラスミドpGRN121を、全てのApaI部位を欠失させ、続いて3’UTRを含有するM
scI-HincIIフラグメントを欠失させた。次いで、hTRTコード配列の停止コドンを
含有するNco-XbaIフラグメントをpGRN121のNco-XbaI部位に挿入して、3’UTRを
欠く以外はpGRN121と同等のプラスミドを作製した。これはいくつかの細胞にお
いて増大した発現レベルのために好適であり得る。
hTRTコード配列を含有するpGRN124からのNotIフラグメントを、オープンリー
ディングフレームがLacプロモーターの反対方向となるようにpBBS235のNotI部位
に挿入した。このベクターで使用する選択マーカーはクロラムフェニコールであ
る。
hTRTコード配列を含有するpGRN124からのNotIフラグメントを、挿入されたhTR
Tコード配列がLacプロモーターと同一方向となるようにpBBS235のNotI部位に挿
入した。
オリゴヌクレオチド5'−TGCGCACGTGGGAAGCCCTGGCag
atctgAattCCaCcATGCCGCGCGCTCCCCGCTG−3'
をpGRN125のインビトロ変異誘発で使用して、hTRTコード配列の開始ATGコドンを
kozakコンセンサス配列に変換し、クローニングのためのEcoRIおよびBglII部位
を作製した。また、オリゴヌクレオチドCOD2866を用いて、AmpSをAmpR(アンピ
シリン耐性)に変換し、オリゴヌクレオチドCOD1941を用いてCatR(クロラムフ
ェニコール耐性)をCatS(クロラムフェニコール感受性)に変換した。
オリゴヌクレオチド5'−TGCGCACGTGGGAAGCCCTGGCag
atctgAattCCaCcATGCCGCGCGCTCCCCGCTG−3'
をインビトロ変異誘発で用いて、hTRTの開始ATGコドンをkozakコンセンサスに変
換し、クローニングのためのEcoRIおよびBglII部位を作製した。また、オリゴ5'
−CTGCCCTCAGACTTCAAGACCATCCTGGACTACAA
GGACGACGATGACAAATGAATTCAGATCTGCGGCCG
CCACCGCGGTGGAGCTCCAGC−3'を用いて、C末端にIBI Flag
(International Biotechnologies Inc. (IBI), Kodak, New Haven, CT)を挿入
し、クローニングのためのEcoRIおよびBglII部位を作製した。また、COD2866を
用いて、AmpSをAmpRに変換し、COD1941を用いてCatRをCatSに変換した。
オリゴヌクレオチド5'−CGGGACGGGCTGCTCCTGCGTTTG
GTGGAcGcgTTCTTGTTGGTGACACCTCACCTCACC
−3'をインビトロ変異誘発によって用いて、Asp869をAlaコドンに変換した(す
なわち、DDモチーフの第2Aspをアラニンに変換して、優性/陰性hTRT変異体を作
製した)。これはまた、MluI部位も生じた。また、オリゴヌクレオチド5'−CT
GCCCTCAGACTTCAAGACCATCCTGGACTACAAGGA
CGACGATGACAAATGAATTCAGATCTGCGGCCGCCA
CCGCGGTGGAGCTCCAGC−3')を用いて、C末端にIBI Flagを挿
入し、クローニングのためのEcoRIおよびBglII部位を作製した。また、COD2866
を用いて、AmpSをAmpRに変換し、COD1941を用いてCatRをCatSに変換した。
オリゴヌクレオチド5'−CGGGACGGGCTGCTCCTGCGTTTG
GTGGAcGcgTTCTTGTTGGTGACACCTCACCTCACC
−3'をインビトロ変異誘発で用いてAsp869コドンをAlaコドンに変換した(すな
わち、DDモチーフの第2Aspをアラニンに変換して優性/陰性変異型タンパク質を
作製した)。これはまた、MluI部位を生じた。また、オリゴヌクレオチド5'−T
GCGCACGTGGGAAGCCCTGGGagatctgAattCCaC
cATGCCGCGCGCTCCCCGCTG−3'をインビトロ変異誘発で用い
て、hTRTコード配列の開始ATGコドンをkozakコンセンサス配列に変換し、クロー
ニングのためのEcoRIおよびBglII部位を作製した。また、COD2866を用いてAmpS
をAmpRに変換し、COD1941を用いてCatRを変換した。
kozak配列およびIBI Flag変異と共にhTRT ORFを含有するpGRN128からのEcoRI
フラグメントを、hTRT ORFがMPSVプロモーターから離れて発現されるように、pB
BS212のEcoRI部位に挿入する。プラスミドpBBS212はMPSVプロモーター、CMVエン
ハンサー、およびSV40ポリアデニル化部位を含有する。
kozak配列およびIBI Flag変異と共にhTRT ORFを含有するpGRN128からのEcoRI
フラグメントを、hTRT ORFのアンチセンスがMPSVプロモーターから離れて発現さ
れるようにpBBS212のEcoRI部位に挿入する。
hTRTコード配列を含有するpGRN121からのEcoRIフラグメントを、hTRTタンパク
質がMPSVプロモーターの制御下で発現されるように、pBBS212のEcoRI部位に挿入
した。
hTRTコード配列を含有するpGRN121からのEcoRIフラグメントを、hTRTコード配
列のアンチセンスがMPSVプロモーターの制御下で発現されるように、pBBS212のE
coRI部位に挿入した。このベクターで使用した選択マーカーはChlor/HygB/PACで
ある。
プラスミドpGRN126をMscIおよびSmaIで完全に消化し、再度連結して、挿入さ
れたhTRTコード配列の95%以上を欠失させた。1つのSmaI-MscIフラグメントをこ
のプロセスの間に再度挿入して、選択用のCat活性を再度生じさせた。次いで、
この未精製プラスミドをSalIおよびEcoRIで再度消化し、hTRTコード配列の開始
コドンを含有するフラグメントをpBBS212のSalI-EcoRI部位に挿入した。これに
より、5’UTRのアンチセンスおよびコード配列の73塩基を発現するアンチセンス
発現プラスミドが作成される。このベクターで使用した選択マーカーはChlor/Hy
gB/PACである。
hTRTコード配列を含有するpGRN126からのHindIII-SalIフラグメントをpBBS242
のHindIII-SalI部位に挿入した。
kozak配列を含有するpGRN130からのSalI-Sse8387IフラグメントをpGRN136のS
alI-Sse8387I部位に挿入した。
hTRTマイナス3’UTRを含有するpGRN124からのEcoRIフラグメントを、hTRTの方
向がEGFPドメインと同一になるように、pEGFP-C2のEcoRI部位に挿入した。
オリゴヌクレオチド5'−CTGCCCTCAGACTTCAAGACCATC
CTGGACTACAAGGACGACGATGACAAATGAATTCAG
ATCTGCGGCCGCCACCGCGGTGGAGCTCCAGC−3'をイ
ンビトロ変異誘発で使用して、pGRN125におけるhTRTのC末端にIBI Flagを挿入
し、クローニングのためのEcoRIおよびBglIIを作製した。また、COD2866を用い
てAmpSをAmpRに変換し、COD1941を用いてCatRをCatSに変換した。
ゲノムhTRTの上流配列およびラムダG55からのhTRTの第1イントロンを含有す
るNcoIフラグメントをpBBS167のNcoI部位に挿入した。このフラグメントはhTRT
がLacプロモーターと同一方向になるような方向とする。
ゲノムhTRTの上流配列およびラムダG55からのhTRTの第1イントロンを含有す
るNcoIフラグメントをpBBS167のNcoI部位に挿入した。このフラグメントを、hTR
TがLacプロモーターと反対方向となるような方向とする。
hTRT遺伝子プロモーター領域を含む完全〜15kbpゲノムインサートを含有する
ラムダGphi5からのNotIフラグメントを、プラスミドpBBS185のNotI部位に挿入し
た。このフラグメントは、hTRT ORFがLacプロモーターと反対方向となるような
方向とする。
hTRT遺伝子プロモーター領域を含む完全〜15kbpゲノムインサートを含有する
ラムダGphi5からのNotIフラグメントを、プラスミドpBBS185のNotI部位に挿入し
た。このフラグメントは、hTRT ORFがLacプロモーターと同一方向となるような
方向とする。
ラムダ配列を除去するためのpGRN140のSAL1を欠失。
このベクターを、哺乳動物細胞におけるhTRT配列の発現用に構築した。hTRTコ
ード配列を含有するpGRN137からのEcoRIフラグメントを、pBBS212のEcoRI部位に
挿入して、hTRT mRNAの5’UTRに対応する配列の一部を除去した。hTRTコード配
列は、それがMPSVプロモーターの制御下で発現されるような方向とする。このベ
クターで使用した選択マーカーはChlor/HygB/PACである。
このベクターを、哺乳動物細胞におけるhTRT配列の発現のために構築した。hT
RTのD869A変異を含有するpGRN130からのSse8387I−NcoIフラグメントをpGRN13
7のSse8387I−NcoI部位に挿入した。このベクターで使用した選択マーカーはア
ンピシリン/HygB/PACである。
IBI Flagを含有するpGRN139からのSse8387I−NotIフラグメントをpGRN137のSs
e8387I−NotgI部位に挿入した。
hTRTのプロモーター領域を含有するpGRN144からのBglII-Eco47IIIフラグメン
トをpSEAP2のBglII-NruI部位に挿入してhTRTプロモーター/レポーター構築物を
作製した。
このベクターは、hTRT融合タンパク質発現ベクターを構築するための中間ベ
クターである。
acgcggccgccaccgcggtggagctcc−3'を用いて、pGRN
125のインビトロ変異誘発によってhTRTのC末端にCSP45I部位を付加した。hTRT
の「停止」コドンを欠失させ、Csp45I部位で置き換えた。このベクターで使用す
る選択マーカーはアンピシリンである。
hTRTのプロモーター領域を含有するpGRN144からのBglII-FspIフラグメントをp
SEAP2のBglII-NruI部位に挿入して、hTRTプロモーター/レポーター構築物を作
製した。
このベクターを、哺乳動物細胞におけるhTRT配列の発現のために構築した。hT
RTコード配列を含有するpGRN147からのEcoRIフラグメントをpBBS212のEcoRI部位
に挿入して、hTRT mRNAの5’UTRに対応する配列の一部を除去した。hTRTコード
配列は、それがMPSVプロモーターの制御下で発現されるような方向とする。この
ベクターで使用する選択マーカーはChlor/HygB/PACである。
hTRTコード配列を含有するpGRN146からのEcoRIフラグメントをpBBS212のEcoRI
部位に挿入して、hTRTの5’UTRに対応する配列の一部を除去した。hTRTコード配
列は、それがMPSVプロモーターの制御下で発現されるような方向とする。
hTRTのD869−>A変異を含有するpGRN130からのStyIフラグメント(hTRT変異
型コード配列)をpGRN158のStyI部位に挿入して、その5'末端にkozakコンセンサ
ス配列、その3'末端にIBI FLAG配列(C−末端コード領域)、およびD869→A
変異を有するhTRTコード配列を含有するプラスミドを得た。
hTRT遺伝子を含有するpGRN153のEcoRIフラグメントを、hTRT ORFがMPSVプロモ
ーターと同一方向に配向されるような方向で、プラスミドpBS212のEcoRI部位に
挿入した。これにより、そのアミノ末端でkozakコンセンサス配列、そのカルボ
キシ末端でIBI FLAG、およびD869→A変異を有するhTRTタンパク質を発現するM
PSV−指向性発現プラスミドが作製される。
このベクターを、哺乳動物細胞におけるhTRT配列の発現のために構築した。こ
のインサートは、5'および3’UTRを有さないhTRTの全長cDNA、およびkozak配列
を含んだ。kozakコンセンサスを有しかつ3’UTRも5’UTRも有さないhTRT cDNAを
含有するpGRN145からのEcoRIフラグメントを、hTRTがDHFR ORFと同一方向になる
ように、p91023(B)のEcoRI部位に挿入した。これにより、hTRTのための一過
性発現ベクターが作製される。このベクターで使用した選択マーカーはテトラサ
イクリンである。
このベクターを、哺乳動物細胞におけるhTRT配列の発現のために構築した。ko
zakコンセンサス配列を有しかつ3’UTRも5’UTRも有さないhTRT cDNAのD869A
変異を含有するpGRN146からのEcoRIフラグメントを、hTRTがDHFR ORFと同一方向
となるようにp91023(B)のEcoRI部位に挿入した。これにより、hTRTについて
の一過性発現ベクターが作製される。このインサートは、5’および3’UTRを有
さないhTRTの全長cDNA、D869A、およびkozak配列を含んだ。このベクターで使
用した選択マーカーはテトラサイクリンである。
このベクターを、哺乳動物細胞におけるhTRT配列の発現用に構築した。C−
末端のIBI FLAG;kozakコンセンサスを有しかつ3’UTRも5’UTRも有さないhTRT
cDNAを含有するpGRN147からのEcoRIフラグメントを、hTRTがDHFR ORFと同一方向
となるように、p91023(B)のEcoRI部位に挿入した。これにより、hTRT用の一
過性発現ベクターが作製される。このインサートは、5’および3’UTRを有さな
いhTRTの全長cDNA、FLAG配列、およびkozak配列を含んだ。このベクターで使用
した選択マーカーはテトラサイクリンである。
このベクターを、E. coliにおけるTRT配列の発現および変異誘発のために構築
した。hTRT ORFを含有するpGRN151からのEcoRIフラグメントを、hTRT ORFがLac
プロモーターと反対方向の方向となるように、pBBS183のEcoRI部位に挿入した。
このインサートは5'および3’UTRを有さないhTRTの全長cDNA、FLAG配列、および
kozak配列を含んだ。hTRTコード配列はT7プロモーターによって駆動される。こ
のベクターで使用した選択マーカーはアンピシリンである。
このベクターを、E. coliにおけるTRT配列の発現および変異誘発のために構築
した。EGFPからhTRT融合を含有するpGRN138由来のHeI-KpnIフラグメントをpBlue
scriptIIKS+のXbaI-KpnI部位に挿入した。これにより、融合タンパク質のための
T7発現ベクターが作製される(コード配列はT7プロモーターによって駆動され
る)。インサートは、EGFPを含む融合タンパク質として3’UTRを有さないhTRTの
全長cDNAを含んだ。このベクターで使用した選択マーカーはアンピシリンである
。
このベクターを、哺乳動物細胞におけるアンチセンスhTR配列の発現のために
構築した。コード配列は、MPSVプロモーターに作動可能に連結されている。全長
hTR ORFを含有するpGRN90からのXhoI-NsiIフラグメントをpBBS295のSalI-Sse838
7I部位に挿入した。これにより、hTRアンチセンスRNAを発現する一過性/安定ベ
クターが作製される。GPTマーカーをベクターに組み込んだ。このベクターで使
用する選択マーカーはChlor/gpt/PACである。
このベクターを、哺乳動物細胞においてセンスhTR配列の発現のために構築し
た。全長hTR ORFを含有するpGRN89からのXhoI-NniIフラグメントをpBBS295のSal
I-Sse8387I部位に挿入した。これにより、センス方向でhTRを発現する一過性/
安定ベクターが作製される。コード配列はMPSVプロモーターによって駆動される
。GPTマーカーをベクターに組み込んだ。このベクターで使用する選択マーカー
はChlor/gpt/PACである。
全長hTR ORFを含有するpGRN87からのXhoI-NsiIフラグメントを、pBBS295のSal
I-Sse8387I部位に挿入した。これにより、センス方向に短縮されたhTR(+108位
〜+435位)を発現する一過性/安定ベクターが作製される。
このベクターを、E. coliにおけるTRT配列の発現および変異誘発のために構築
した。コード配列はT7プロモーターによって駆動される。オリゴヌクレオチド
RA45(5'−GCCACCCCCGCGCTGCCTCGAGCTCCCCGC
TGC−3')をインビトロ変異誘発で使用して、hTRTにおける開始metをLeuに変
化させ、そしてLeu後の次の2つのコドンにおいてXhoI部位を導入する。また、CO
D1941を用いて、CatRをCatSに変化させ、BSPH1部位を導入し、そしてCOD2866を
用いて、AmpSをAmpRに変化させて、FSP1部位を導入する。このベクターで使用す
る選択マーカーはアンピシリンである。
このベクターを、E. coliにおけるhTR配列の発現のために構築した。プライマ
ーhTR+1 5'−GGGGAAGCTTTAATACGACTCACTATAGG
GTTGCGGAGGGTGGGCCTG−3'およびhTR+445 5'−CCCCG
GATCCTGCGCATGTGTGAGCCGAGTCCTGGG−3'を用い
て、(hTR+1におけるように)PCRにより5'末端にT7プロモーターを有する全長
hTRを含有するpGRN33からのフラグメントを増幅した。PCR産物のBamHI-HindIII
消化物をpUC119のBamHI-HindIII部位に挿入した。コード配列はT7プロモーター
に作動可能に連結した。このベクターで使用する選択マーカーはアンピシリンで
ある。
このベクターを、E. coliにおけるhTRT配列の発現および変異誘発のために構
築した。コード配列はT7プロモーターに作動可能に連結する。kozak前方末端と
共にhTRT ORFを含有するpGRN145からのEcoRIフラグメントを、hTRTがT7プロモ
ーターと同一方向の方向となるように、pBluescriptIISK+のEcoRI部位に挿入し
た。このベクターで使用する選択マーカーはアンピシリンである。
このベクターを、哺乳動物細胞におけるTRT配列の発現および変異誘発のため
に構築した。コード配列はT7プロモーターに作動可能に連結する。kozak前方末
端および後方末端のIBI flagと共にhTRT ORFを含有するpGRN151からのEcoRIフラ
グメントを、hTRT ORFがT7プロモーターと同一方向の方向となるようにpBluesc
riptIISK+のEcoRI部位に挿入した。このインサートは5'および3’UTRを有さない
hTRTの全長cDNA、FLAG配列(Immunex Corp.,Seattle、WA)、およびkozak配列を
含んだ。このベクターで使用する選択マーカーはアンピシリンである。
hTRT ORFの5'末端を含有するpGRN144からのAvRII-StuIフラグメントを、pBBS1
61のXbaI-StuI部位に挿入した。
最適化hTRT発現カセットを含有するpGRN145からのEcoRIフラグメントを、hTRT
コード配列がミニCMVプロモーターと同一方向となるように、pINDのEcoRI部位に
挿入した。
最適化hTRT発現カセットを含有するpGRN145からのEcoRIフラグメントを、hTRT
がミニCMVプロモーターと逆方向になるように、pINDのEcoRI部位に挿入した。
最適化hTRT発現カセットを含有するpGRN145からのEcoRIフラグメントを、hTRT
がミニCMVプロモーターと逆方向になるように、pIND(sp1)のEcoRI部位に挿入し
た。
pGRN163からのEco47III-NarIフラグメントを、pGRN167のEco47III-NarI部位に
挿入し、MlL変異をhTRTゲノムDNAのフラグメントに入れた。
hTRT ORFにおけるMetからLeuの変異を含有するpGRN171からのBamHI-StuIフラ
グメントを、pSEAP2-BasicのBglII-NruI部位に挿入した。
hTRTプロモーター領域の5'末端を含有するpGRN144からのEcoRV-ECO47IIIフラ
グメントを、pGRN172のSrfI-Eco47III部位に挿入した。これにより、Met1−>Leu
変異と共に、hTRT ORFの開始からほぼ2.3kb上流からコード領域における第1イン
トロンの直後までのhTRTのプロモーター領域を含有するプロモーターレポーター
プラスミドが作製される。
「最適化」hTRT発現カセットを含有するpGRN145からのEcoRIフラグメントを、
hTRTがミニCMVプロモーターと同一方向になるように、pIND(sp1)のEcoRI部位に
挿入した。
テロメラーゼ活性の再構成
A.インビトロにおけるhTRTおよびhTRの共発現
本実施例では、インビトロ無細胞発現系を用いるhTRTおよびhTRの共発現を記
載する。これらの結果は、pGRN121によってコードされるhTRTポリペプチドが触
媒的に活性なテロメラーゼタンパク質をコードし、テロメラーゼRNPのインビト
ロ再構成(IVR)が組換えにより発現されたhTRTおよびhTRを用いて達成できるこ
とを示す。
pGRN121;XbaIで消化した1μg DNA)およびhTR(phTR+1;FspIで消化した1μg)
の線状化プラスミドを添加することによって、テロメラーゼ活性を復元した。ph
TR+1は、FspIで線状化し、次いで、T7 RNAポリメラーゼによって転写した場合に
、ヌクレオチド+1で始まり、hTRのヌクレオチド446まで伸びる445ヌクレオチド
転写体を生じるプラスミドである(Autexierら, 1996, EMBO J. 15:5928)。50μ
l反応につき、以下の成分を添加した:2μl TNTTM緩衝液、1μl TNTTM T7 RNAポ
リメラーゼ、1μl 1mMアミノ酸混合物、40ユニットRnasinTM RNaseインヒビター
、1μgの各線状化テンプレートDNA、および25μl TNTTM網状赤血球溶解物。成分
は製造業者によって推奨される比率で添加し、30℃で90分間インキュベートした
。転写は、T7プロモーターの指示下にあり、また、網状赤血球溶解物の添加に
先立って行うことができ、同様の結果であった。インキュベーションの後、プロ
グラムされた転写−翻訳反応の5および10μlを、シグナルを増幅するために20サ
イクルのPCRを用い、前記したようにTRAPによってテロメラーゼ活性についてア
ッセイした(Autexierら,前掲)。
がある。最初の2レーンは二連アッセイであって、第3レーンは、PCR生成人工物
をなくするためのTRAP相に先立って熱変性した(95℃、5分)二連試料である。
を有さない(レーン6)。同様に、hTR単独(レーン1)または全長hTRT遺伝子(
レーン4)のいずれかを溶解物に添加した場合、検出可能な活性は観察されない
。両成分を添加した場合(レーン2)、特徴的な反復ラダーパターンによって示
されるようにテロメラーゼ活性が生じている。hTRT遺伝子のカルボキシル末端領
域を、NcoIでのベクターの消化によって除去した場合(「切形hTRT」)、テロメ
ラーゼ活性はなくなる(レーン3)。レーン5は、切形hTRT単独の翻訳はテロメラ
ーゼ活性を生じないことを示す。レーン「R8」は、TSR8のTRAPによって生じた
テロメラーゼ産物ラダーについての陽性コントロールを示す(5'−ATTCCG
TCGAGCAGAGTTAG[GGTTAG]7−3'のヌクレオチド配列を有
する合成テロメラーゼ産物)。
テロメラーゼ活性のインビトロ再構成もまた、混合によって達成された。hTR
プラスミドを添加しないこと以外は前記のように、hTRTを転写し、翻訳させた。
テロメラーゼRNPの復元は、次いで、hTRT翻訳混合物と(phTR+1-FspからT7 RNA
ポリメラーゼ転写により予め生じた)hTRとを、hTRの2μl(1μg)に対してhTRT
翻訳混合物2μlの比で混合し、次いで、30℃で90分間インキュベートされるこ
とによって達成された。hTRT/hTR復元のこの方法を「連結復元」または「連結IV
R」と呼ぶ。この混合物においてテロメラーゼ活性は存在する(すなわち、検出
することができる)。DEAEクロマトグラフィーによる活性の部分的精製の後に、
改良されたシグナルが観察された。この場合、Millipore Ultrafree-MC DEAE Ce
ntrifugal Filter Devicesを製造業者に指示に従って使用した。使用した緩衝液
は、hypo0.1、hypo0.2、およびhypo1.0であり、ここでhypoは、20mM Hepes-KOH
、pH7.9、2mM MgCl2、1mM EGTA、10%グリセロール、0.1% NP-40、1mM DTT、1m
Mメタ重亜硫酸ナトリウム、1mMベンズアミジン、および0.2mMフッ化フェニルメ
チルスルホニル(PMSF)であり、そしてここで0.1、0.2および1.0は、0.1、0.2
または1.0M HClをいう。フィルターをhypo1.0で予備コンディショニングし、hyp
o0.1で洗浄し、復元されたテロメラーゼを添加し、カラムをhypo0.1次いでhypo0
.2で洗浄し、そして再構成されたテロメラーゼを添加した容量の半分にてhypo1.
0で溶出した。この処方物は、−70℃にて凍結保存することができ、活性を保持
する。
を使用しなかったことを除き、Morin, 1989, Cell 59:521に記載されているよう
に、通常のテロメラーゼアッセイを行った。工程2において、前記したように、T
RAP手法によって、20〜30サイクルで、アリコートをアッセイした。25mMトリス
−HCl、pH8.3、50mM酢酸カリウム、1mM EGTA、1mM MgCl2、2mM dATP、2mM TTP、
10μM dGTP、および1μMプライマー(通常、M2,5'−AATCCGTCGAG
CAGAGTT)の40〜50μlの最終容量中にて、30℃で60〜180分間、1-10μl
の再構成テロメラーゼをアッセイすることによって、通常のアッセイを行った。
95℃で5分間加熱することによって反応を停止し、1〜10μlの第1工程混合物を
工程2のTRAP反応(50μl)で続けた。
れ、35S−メチオニン取り込みおよびノーザンブロッティングによってモニター
した。ほぼ予測されたサイズのタンパク質が、相互に対してほぼ等モル量にて、
hTRT(127kD)、hTRT-Nco(85kD)、およびpro90hTRT(90kD)について合成され
た。ノーザン分析は、hTR合成が正しいサイズ(445ヌクレオチド)であって、イ
ンタクトが優勢であることを示した。
時間および温度、および一価塩(例えば、NaCl、KCl、酢酸カリウム、グルタミ
ン酸カリウムなど)、二価塩(MgCl2、MnCl2、MgSO4など)。変性剤(尿素、ホ
ルムアミドなど)、界面活性剤(NP-40、Tween、CHAPSなど)のような成分の存
在または濃度、(免疫沈降、アフィニティーまたは標準的クロマトグラフイーの
ような)別の改良された精製手法を使用することができる。これらのおよび他の
パラメーターは、特定のアッセイまたは他の再構成プロトコルに対する条件を最
適化するために体系的に変化させることができる。
ほぼ野生型レベルで、EGFP-hTRT、増強された緑色蛍光タンパク質とhTRTとの
融合物(実施例6および15参照)、またはエピトープタグ化hTRT(IBI FLAG、実
施例6参照)両再構成テロメラーゼ活性をhTRを用いて共発現させた場合、テロメ
ラーゼ触媒活性の再構成が起こった。
)を使用した場合、テロメラーゼ活性は復元されなかった。これは、pro90hTRT
が他の部分的活性(例えば、RNA[すなわち、hTR]結合能力)を有し、前記した
ようにインビボでテロメラーゼのドミナントネガティブなレギュレーターとして
機能し得るが、十分なテロメラーゼ触媒活性を保有しないことを示す。
成テロメラーゼ活性のアッセイ
以下の実施例は、インビトロ復元した(IVR)テロメラーゼが増幅に基づくア
ッセイ(すなわち、TRAP)に加えて通常のテロメラーゼアッセイを用いてアッセ
イできることを示す。以下の反応条件:30℃における180分間の、40μl最終容
量の25mMトリス−HCl、pH8.3、50mM酢酸カリウム、1mM EGTA、1mM MgCl2、0.8mM
dATP、0.8mM TTP、1.0mM dGTP、および1μMプライマー(M2、前掲;またはH
3.03、5'−TTAGGGTTAGGGTTAGGG)中の1-10μlの連結したIVR
テロメラーゼを用いるゲルブロットアッセイを使用して、パート(B)に記載し
たようなIVRテロメラーゼ(前掲)(「連結復元方法」)、続いて前記したよう
にDEAE精製を行ったIVRテロメラーゼをアッセイした。合成されたテロメリックD
NAを標準的な手法によって単離し、8%ポリアクリルアミド/8M尿素ゲルで分離
し、ナイロン膜に移し、ドットブロットアッセイで用いた32P-(CCCTAA)nリボプ
ローブを用いてプローブした。このプローブは、モノQおよびヘパリンクロマト
グラフイーによって精製された5μlの天然核テロメラーゼにつき観察されたラダ
ーと同等の10μlのIVRテロメラーゼを表すレーンにおいて、6ヌクレオチドラダ
ーを同定した。結果は、IVRテロメラーゼが天然テロメラーゼと同等の進行的テ
ロメラーゼ触媒活性を保有することを示す。
メラーゼをアッセイした。前記したように、連結再構成方法により調製し、続い
てDEAE精製を行ったIVRテロメラーゼを、進行的および非進行的の両反応条件下
でアッセイした。アッセイ条件は、30℃[進行的反応]または37℃[非進行的反
応用]における180分間の、10μM 32P-dGTP(72Ci/ミリモル)[進行的条件の
アッセイ用]または1μM 32P-dGTP(720Ci/ミリモル)[非進行的用]、および
1μMプライマー(すなわち、H3.03、前掲)を含む、25mMトリス−HCl、pH8.3
、50mM酢酸カリウム、1mM EGTA、1mM MgCl2、2mM dATP、2mM TTPの40μlの最終
容量の中の5〜10μl連結IVRテロメラーゼであった。合成されたテロメリックDN
Aを標準的な手法によって単離し、そして8%ポリアクリルアミド/8M尿素ゲル
配列決定ゲルで分離した。進行的反応は、進行的テロメラーゼ反応と合致する弱
い6ヌクレオチドラダーを示し、そして非進行的反応は、1の反復を付加した。こ
れは、天然テロメラーゼ調製物を用いるコントロール反応と同等のパターンであ
る。IVRテロメラーゼを用いる通常のアッセイは、本明細書に記載するテロメラ
ーゼモジュレーターについてのスクリーニング、ならびにテロメラーゼの構造お
よび機能特性の解明のような他の用途で有用である。
本実験は、IVRテロメラーゼが、天然(精製)テロメラーゼと同等にプライマ
ー3'末端を認識することを示す。テロメラーゼはプライマー3'末端およびhTRの
テンプレート領域との間に塩基対合二重鎖を形成し、そして次の特定されるヌク
レオチドを付加する(Morin, 1989,前掲)。IVR(組換え)テロメラーゼが同一
特性を有することを確認するために、前記にて詳細に記載した2工程の通常/TRA
PアッセイによってアッセイしたIVRおよび天然のテロメラーゼを用い、−−−G
GGまたは−−−TAG3'末端を有するプラマー(AATCCGTCGAGCA
GAGGGおよびAATCCGTCGAGCAGATAG)の反応を、−−−G
TT3'末端(M2前掲)を有するプライマーと比較した。標準プライマー(−−
−GTT3'末端)と比較すると、−−−GGGおよび−−−TAGプライマーの
産物ラダーは、それぞれ、+4および+2シフトし、天然テロメラーゼで観察され
たものと同一効果であった。この実験は、IVRおよび天然のテロメラーゼが同様
にプライマー末端を認識することを示す。
保有することを示す前掲の結果と共に)IVRテロメラーゼが天然もしくは精製の
テロメラーゼと比較して同様の構造および特性を有することを示す。
抗hTRT抗体の生産
A.hTRTペプチドに対する抗hTRT抗体の生産
抗hTRT抗体を生産するために、アミノ末端残基としてC(システイン)を付加
させて、hTRT由来の以下のペプチドを合成した(図54参照)。
シアニン]キャリアータンパク質に固定化(すなわち、共有結合)させた。KLH
−ペプチドを抗原として使用した。BSA−ペプチドコンジュゲートを、免疫抗血
清の特異性を試験するためにELISA用材料として供した。
の注射は腋窩および鼠径リンパ節近位に注射物を置くことによってなされる。追
加注射は筋肉内で行った。初回の注射のために、抗原をフロイントの完全アジュ
バントで乳化し;追加注射のために、フロイントの不完全アジュバントを用いた
。ウサギには続いて3週間のブーストサイクルを行い、ここで、20〜25mlの血清
を生じる50mlの血液を各ブーストの10日後に採取する。ウェスタンブロットに際
して、4つのペプチドのそれぞれに対する抗血清は、組換えhTRT融合タンパク質
のhTRT部分(GST-HIS8-hTRT−フラグメント2426〜3274;実施例6参照)を認識し
た。
部分的精製テロメラーゼ画分(粗製核抽出物と比較してほぼ1000倍精製)および
アフィニティー精製抗S−2抗体を用い、130kdタンパク質のダブレットがウェス
タンブロットで検出できた。感受性化学ルミネセンス検出方法を用いた(SuperS
ignal化学ルミネセンス基質、Pierce)が、ブロットでのシグナルは弱く、これ
は、hTRTがこれらの不死化細胞では低いまたは非常に低い量で存在することを示
す。ダブレットの観察は、hTRTの翻訳後修飾、すなわち、リン酸化またはグリコ
シル化と合致する。
てそのN末端システイン残基を介してSulfoLink (Pierce, Rockford、IL)に固
定化した。KLH-S-2ペプチド抗原で免疫化したウサギからの第1の採血血清をS-2-
SulfoLinkに添加し、そしてS−2ペプチドに特異的に結合した抗体を溶出させた
。
GST-hTRT融合タンパク質を、実施例6に記載したGST-hTRTフラグメント#4(ヌ
クレオチド3272〜4177)およびGST-HIS8−hTRTフラグメント#3(ヌクレオチド2
426〜3274)タンパク質としてE. coliで発現させた。融合タンパク質を不溶性タ
ンパク質として精製し、そして抗原の純度をSDSポリアクリルアミドゲルによっ
てアッセイし、GST-hTRTフラグメント#4組換えタンパク質につき約75%の純度
、およびGST-HIS8-hTRTフラグメント#3組換えタンパク質につき75%を超える純
度が見積もられた。日常的な方法が、90%を超える純度でこれらのおよび他の融
合タンパク質を得るために用いることができる。これらの組換えタンパク質を用
いて、ウサギおよびマウスの双方を前記したように免疫化した。
トリックスを用いて、抗GST抗体の除去後における抗hTRT抗体の存在について、
試験した。抗血清を、固定化組換えGST-hTRT融合タンパク質を用いるウェスタン
ブロッティングによって、および部分的に精製した天然テロメラーゼ酵素を用い
る免疫沈降によって、抗hTRT抗体について試験した。これらの初期採血ではシグ
ナルは観察されなかったが、予測されるような抗hTRT抗体の力価は引き続いての
採血で増加した。
Δ182 RNA変異体に対応するhTRT mRNAの検出
ヒト睾丸および293細胞株からのポリA+RNAを、RT-PCRおよびネスト化プラスマ
ーを用い、hTRT mRNAについて分析した。第1プライマーセットはTCP1.1およびTC
P1.15であり;第2プライマーセットはTCP1.14およびBTCP6であった。それぞれか
らの増幅は182bpだけ異なる2つの産物を与えた;睾丸RNAからの大および小産物
を配列決定し、それぞれ、確かにpGRN121(図16)および712562クローン(図18
)に相当することが判明した。変異型hTRT RNA産物はSW39i、OVCAR4、293、およ
び睾丸からのmRNAで観察された。
。略言すれば、全長hTRT RNA(すなわち、欠失なし)を、RT-PCR用のテンプレー
トとして使用するpGRN121のインビトロ転写によって生産した。42℃または50℃
で、ランダム−プライマーまたは特異的プライマーにて、Superscriptョ逆転写酵
素(Bethesda Research Laboratories, Bethesda, MD)を用いて別々のcDNA合成反
応を行った。15PCRサイクル後、長い産物が検出できた;しかしながら、小さな
産物(すなわち、欠失に対応する)は30以上のサイクルの後でも検出できなかっ
た。これは、RT-PCR産物が人工物ではないことを示す。
睾丸hTRT mRNAの配列決定
hTRT RNAの睾丸形態の配列は、ThermoSequenase放射性標識ターミネーターサ
イクル配列決定キット(Amersham Life Science)を用い、睾丸cDNA(Marathon T
estes cDNA, Clontech, San Diego, CA)からのPCRによって生成したDNAフラグメ
ントの直接的手動配列決定によって決定した。PCR工程は表22に示すようにネ
スト化PCRによって行った。全ての場合において、cDNAなしのプライマーとの陰
性コントロール反応を行った。コントロール反応において産物が存在しないこと
は、存在するcDNAとの反応に由来する産物が、pGRN121または他の細胞供給源(
例えば、293細胞)からのhTRTの汚染によるものではないことを示した。DNAフラ
グメントをアガロースゲルから切り出して、配列決定に先立って、DNAを精製し
た。
有する睾丸mRNA配列が得られた。この領域において、睾丸およびpGRN121配列の
間で差異はなかった。
RNase保護によるhTRT mRNAの検出
RNase保護アッセイを、hTRT mRNAまたは変異型mRNAの存在を検出し、モニター
し、または診断するために用いることができる。1の例示的RNase保護プローブは
、hTRT mRNA配列に相補的な配列ならびに追加の非相補的配列よりなるインビト
ロ合成したRNAである。後者の配列は、アッセイにおける陽性結果から生じるプ
ローブのフラグメントと全長プローブとを区別するために含まれる。陽性アッセ
イでは、プローブの相補的配列はRNase消化から保護される。何故ならば、それ
らはhTRT mRNAにハイブリダイズするからである。非相補的配列を、RNaseおよび
標的相補的核酸の存在下で、プローブから消化して取り去る。
きる。プローブはhTRTに相補的なそれらの配列において異なるが、本実施態様で
は、SV40後期mRNAリーダー配列に由来する同一の非相補的配列を含有する。5'か
ら3'へ、1のプローブは、非相補的配列の33ヌクレオチドおよび227ヌクレオチド
の全長プローブサイズのhTRTヌクレオチド2513−2707に相補的な配列の194ヌク
レオチドよりなる。5'から3'へ、第2のプローブは、非相補的配列の33ヌクレオ
チドおよび231ヌクレオチドの全長プローブサイズのhTRTヌクレオチド2837−303
5に相補的な配列の198ヌクレオチドよりなる。アッセイを行うためには、いずれ
かのプローブを、試験試料からのRNA、すなわちポリA+RNAにハイブリダイズさせ
ることができ、次いで、T1リボヌクレアーゼまたはRNaseAを添加する。消化の
後、プローブRNAを精製し、ゲル電気泳動によって分析する。227ヌクレオチドプ
ローブの194ヌクレオチドフラグメントおよび231ヌクレオチドプローブの198ヌ
クレオチドフラグメントは試料におけるhTRT mRNAの指標である。
、インビトロ転写によって生じさせることができる。放射性または他の方法で標
識したリボヌクレオチドを標識プローブの合成用に含ませることができる。RNA
プローブを生産するインビトロ転写反応のためのテンプレートはPCR産物である
。これらの例示的プロープは、hTRT遺伝子またはmRNAの対応する相補的領域にま
たがるプライマーを用いるpGRN121 DNAのPCR増幅後にT7ポリメラーゼを用いて
、合成することができる。加えて、下流プライマーはT7 RNAポリメラーゼプロモ
ーター配列および非相補的配列を含有する。
リバース01)からのPCR産物を用いる:
リバース02)からのPCR産物を用いる;
hTRTおよび他の逆転写酵素を比較する系統樹の構築
系統樹(図6)を、XiongおよびEickbush (1990, EMBO J. 9:3353)によって定
義された7つのRTドメインの比較によって構築した。4つのTRT、67のRT、および3
つのRNAポリメラーゼからのモチーフ1、2、およびA−Eの配列アラインメント
の後、NJ(隣接結合)方法(SaitouおよびNei, 1987, Mol. Biol. Evol. 4:406)を
用いて系統樹を構築した。系統樹の同一枝に位置する同一クラスからの要素をボ
ックスとして単純化する。各ボックスの長さは、そのボックス内の最も発散した
要素に対応する。
プIIイントロン、および非LTR(長末端反復)レトロトランスポゾンに関連するR
Tに、より密接に関係するようである。これらの後者の要素がショウジョウバエ
においてテロメア維持のためにテロメラーゼを置き換えたとすれば、レトロ要素
の非LTR枝に対するテロメラーゼRTの関係は興味深い。しかしながら、最も驚く
べき発見は、TRTが、以前に知られているRTのいずれかに関してポリオウイルス
のようなプラス鎖RNAウイルスのRNA依存性RNAポリメラーゼにほとんど密接に関
連している離れた亜群を形成するということである。4つのテロメラーゼ遺伝子
が進化的に距離のある生物−−原生動物、菌類、および哺乳動物−−に由来する
ことを考慮すると、この別々のグループ分けは、データセットにおける系統発散
の欠如によって説明することができない。事実、この深い分岐は、テロメラーゼ
RTが、恐らくは第1真核生物とともに始まる古代群であることを示唆する。
あった:msDNA(94535、134069、134074、134075、134078)、グループIIイン
トロン(483039、101880、1332208、1334433、1334435、133345、1353081)、ミ
トコンドリアプラスミド/RTL(903835、134084)、非LTRレトロトランスポ
ゾン(140023、84806、103221、103353、134083、435415、103015、1335673、85
020、141475、106903、130402、U0551、903695、940390、2055276、L08889)
、LTRレトロトランスポゾン(74599、85105、130582、99712、83589、84126
、479443、224319、130398、130583、1335652、173088、226407、101042、10788
24)、ヘパドナウイルス(I18876、1706510、118894)、カウリモウイルス(33
1554、130600、130593、93553)、レトロウイルス(130601、325465、74601、13
0587、130671、130607、130629、130589、130631、1346746、130651、130635、1
780973、130646)。アラインメントはClustalW 1.5[J. D. Thompson, D. G. Hig
gins, T. J. Gibson, Nucleic Acids Res. 22, 4673 (1994)]およびPHYLIP 3.5[
J. Felsenstein, Cladisfics 5, 164 (1989)]を用いて分析した。
コントロールプラスミドおよびhTRTをコードするプラスミドでの培養ヒト線維
芽細胞(BJ)のトランスフェクション
本実施例は、哺乳動物細胞における組換えhTRTタンパク質の発現の結果、活性
テロメラーゼが生成されることを示す。
mlの濃度にて、新鮮な培地(10%ウシ胎児血清を含有するDMEM/199)に再懸濁
した。BioRad Gene PulserTMエレクトロポレーターでのエレクトロポレーション
を用い、細胞をトランスフェクトした。必要に応じて、製造業者の指示に従い、
SuperfectTM試薬(Qiagen)を用い、細胞をトランスフェクトしてもよい。エレク
トロポレーションでは、500μlの細胞懸濁液をエレクトロポレーションキュベ
ット(BioRad, 0.4cm電極ギャップ)に入れた。プラスミドDNA(2μg)をキュベ
ットに添加し、懸濁液を静かに混合し、そして氷上で5分間インキュベートした
。コントロールプラスミド(pBBS212)は、MPSVプロモーターの後にはインサー
トを含まず、実験プラスミド(pGRN133)はMPSVプロモーターからhTRTを発現し
た。300ボルトおよび960μFDで細胞をエレクトロポレートした。パルスを送った
後、キュベットを氷上に約5分間置き、その後、100mm組織培養皿で培地中に播種
した。6時間後、培地を新鮮な培地で置き換えた。トランスフェクションの72時
間後、細胞をトリプシン処理し、PBSで1回洗浄し、ペレット化し、そして−80℃
で凍結保存した。細胞抽出物を、改変された界面活性剤溶解法(Bodnarら, 1996
, Exp. Cell. Res. 228:58; Kimら, 1994, Science 266:2011参照,および前掲の
TRAPアッセイに関連する特許および出版物に記載される)によって25,000細胞/
μlの濃度で調製し、そして細胞抽出物におけるテロメラーゼ活性を、改変され
たPCRに基づくTRAPアッセイ(Kimら, 1994, Bodnarら, 1996)を用いて測定した
。略言すれば、5×104細胞当量を反応のテロメラーゼプライマー伸長部分で用い
た。抽出物は、典型的には、PCR増幅に対するテロメラーゼ伸長反応から直接採
取されたが、また、PCR増幅に先立って、フェノール/クロロホルムで1回、およ
びクロロホルムで1回洗浄抽出され得る。1/5の物質をTRAP反応のPCR増幅部分で
使用した(ほぼ10,000細胞当量)。TRAP反応の1/2を、図25における各レーンが
5,000細胞当量からの反応産物を表すように、分析のためにゲルに負荷した。pGR
N133でトランスフェクトした細胞由来の抽出物はテロメラーゼ活性につき陽性で
あり、他方、トランスフェクトされない(示さず)またはコントロールプラスミ
ドでトランスフェクトされた細胞由来の抽出物はテロメラーゼ活性を示さなかっ
た。RPE細胞を用いる同様の実験は、同一の結果を与えた。
GRN155およびpGRN138)を用いて行った。これらの構築物を用いる再構成は、pGR
N133トランスフェクト細胞におけるよりも多くのテロメラーゼ活性が生じるよう
であった。
論したように、pGRN155は、hTRTの発現のための制御エレメントとしてアデノウ
イルス主要後期プロモーターを含有するベクターであり、BJ細胞にトランスフェ
クトした場合、テロメラーゼ活性を再構成することが示された。
施例15参照)を用いて再構成が行われた場合、pGRN138は、インビトロ(実施例7
参照)またはインビボ(BJ細胞へのトランスフェクション)のいずれかのテロメ
ラーゼ活性が得られた。例えば、前記のようにBJ細胞へのトランスフェクション
によって、テロメラーゼ活性は、pGRN133またはpGRN145を用いるインビトロ再構
成から得らる活性に匹敵した。
皮(RPE)のトランスフェクションに際して得られた。RPE細胞の老化は、老化関
連の斑状変性の疾患に寄与するか、あるいはそれを引き起こすと考えられる。本
発明のhTRT発現ベクターを用いる本発明の方法により処理したRPE細胞は、未処
理細胞と比較して、遅延した老化を示すはずであり、従って、老化関連の斑状変
性を処置または防止する移植療法で有用である。
プロモーターレポーター構築物
本実施例は、レポーター遺伝子がプロモーターエレメントを含有するhTRT上流
配列に作動可能に連結したプラスミドの構築を記載する。ベクターは、インビボ
でのシスおよびトランスの転写調節因子の同定およびhTRT発現を調節(例えば、
活性化または阻害)し得る薬剤のスクリーニング(例えば、薬物スクリーニング
)を含む多数の用途を有する。多数のレポーターを使用できるが(例えば、ホタ
ルルシフェラーゼ、β−グルクロニダーゼ、β−ガラクトシダーゼ、クロラムフ
ェニコールアセチルトランスフェラーゼ、およびGFP等)、ヒト分泌アルカリホ
スファターゼ(SEAP、Clone Tech)を最初の実験で使用した。SEAPレポーター遺
伝子は、膜固定ドメインを欠く胎盤酵素の切形形態をコードし、それによりタン
パク質がトランスフェクト細胞から効果的に分泌されることを可能とする。培養
培地中で検出されるSEAP活性のレベルは、SEAP mRNAおよびタンパク質の細胞内
濃度の変化に直接比例することが示されている(Bergerら, 1988, Gene 66:1; C
ullenら, 1992, Meth. Enzymol. 216:362)。
無し=陰性コントロール)および「pSEAP2コントロール」(SV40初期プロモータ
ーおよびエンハンサーを含有)を、有寿命性細胞および不死細胞に三連にてトラ
ンスフェクトした。
からのBgl2-Eco47IIIフラグメントを消化し、そしてpSeapBasic(Clonetech, Sa
n Diego、CA)のBglII-NruI部位にクローン化した。第2のレポーター−プロモー
ター、プラスミドpGRN150は、実施例3に記載したhTRTイントロンからの配列を含
み、このイントロンに存在し得る調節配列を使用する。プロモーター領域後の第
2のATGがSEAP ORFの開始ATGとなるように、開始MetをLeuに変異する。
細胞)および不死細胞(293)にトランスフェクトした。全てのトランスフェク
ションを2つのコントロールプラスミド:1つの陰性コントロールプラスミド(pS
EAPベーシック)および1つの陽性コントロールプラスミド(SV40初期プロモータ
ーおよびSV40エンハンサーを含有するpSEAPコントロール)と平行して行った。
びエンハンサーを含有する)pSEAP2陽性コントロールと同程度に効果的にSEAP発
現を行うようである。対照的に、不死細胞においては、pSEAP2コントロールのみ
が検出可能な活性を与えた。これらの結果は、予測されるように、hTRTプロモー
ター配列が有寿命性細胞ではなく、腫瘍細胞で活性であることを示す。
て得られた。(2.2KBの上流ゲノム配列を含有する)pGRN150でトランスフェクト
したRPE細胞において、hTRTプロモーター領域は不活性であり、他方、pSEAP2コ
ントロールプラスミドは活性であった。
RT上流配列に作動可能に連結しているプラスミドは、一過性および安定なトラン
スフェクション技術の両方を用いる、テロメラーゼ活性調節剤の同定およびスク
リーニングで極めて有用である。1つのアプローチにおいて、例えば、Ausubelら
(1997)(前掲)に従って、(neoのような)真核生物の選択マーカーとの共トラン
スフェクションによって、pGRN148の安定な形質転換が、テロメラーゼ陰性およ
びテロメラーゼ陽性の細胞でなされる。得られた細胞株は、例えば、試験化合物
の存在下または非存在下で、hTRT−プロモーター−駆動の発現を比較することに
よって、推定テロメラーゼ調節剤のスクリーニングに使用される。
−およびシス−作用性の転写および翻訳調節エレメントを同定するために使用さ
れる。シス−作用性転写調節エレメントの例は、テロメラーゼ遺伝子のプロモー
ターおよびエンハンサーを含む。シス−およびトランス−作用性の調節剤の同定
および単離は、テロメラーゼの転写および翻訳を調節する薬剤を同定するための
さらなる方法および試薬を提供する。
hTRTの細胞下(subcellular)局在化
hTRTおよび増強された緑色蛍光タンパク質(EGFP;Cormackら, 1996, Gene 17
3:33)の領域を有する融合タンパク質を後記するように構築した。EGFP部分は、
融合タンパク質の存在または位置が容易に決定できるような検出可能なタグまた
はシグナルを提供する。EGFP−融合タンパク質は正しい細胞区画に局在化するの
で、この構築物を用いて、hTRTタンパク質の細胞下局在化を決定することができ
る。
哺乳動物細胞におけるhTRT-EGFP融合タンパク質の発現用ベクターは、pGRN124
(実施例6参照)由来のEcoRIインサートをpEGFP-C2(Clonetech,San Diego, CA)
のEcoRI部位に入れることによって構築した。融合タンパク質のアミノ酸配列を
以下に提供する。EGFP残基は太字で示し、hTRT mRNAの5'非翻訳領域によってコ
ードされる残基には下線を施し、そしてhTRTタンパク質配列は通常の字体で示す
。
ることができ、後記するようににこれを用いて、hTRTポリペプチドの特定の領域
の活性を同定することができる。
pGRN138でのMIH293細胞およびBJ細胞のトランスフェクションにより、組換え
により発現されたhTRTの核局所化が確認された。pGRN138(EGEP-hTRT)および(
EGFPのみを発現する)コントロール構築物で細胞をトランスフェクトした。EGFP
-hTRTの核局所化は、蛍光顕微鏡により両細胞タイプで明らかである。前記した
ように、pGRN138 hTRT-GFP融合タンパク質は、BJ細胞にトランスフェクトした場
合にはインビトロ転写翻訳系およびインビボ系の双方で、テロメラーゼ活性の再
構成を支持する。
の適用で使用することができる。例えば、本実施例で記載する融合構築物、また
はEGFPの構築物およびhTRTの切形形態を用いて、hTRT、ならびに細胞核に侵入し
、および/または染色体末端に局所化する変異型を能力を評価することができる
。さらに、pGRN138を用いて安定または一過的にトランスフェクトされた細胞は
、テロメラーゼ調節薬物または化合物を同定するための化合物をスクリーニング
するのに使用される。核局所化またはテロメラーゼ局所化を妨害する薬剤は、テ
ロメラーゼインヒビターとして同定できる。EGFP-hTRTを安定に発現する腫瘍細
胞株はこの目的に有用であり得る。テロメラーゼの潜在的なモジュレーターを、
これらのトランスフェクトされた細胞に投与し、そしてEGFP-hTRTの局所化が評
価される。さらに、FACSまたは他の蛍光に基づく方法は、hTRTを発現する細胞を
選択して、特に細胞の一過性トランスフェクションを使用する場合に、薬物スク
リーニングのための同種集団を提供するために使用され得る。
メラーゼ活性モジュレーター)についての標的である、核局所化に必要な領域(
例えば、残基193−196(PRRR)および235−240(PKRPRR)を同定することができ
る。他の適切な適用は、以下を含む;
一過性トランスフェクション実験のため、およびEGFP-hTRTを発現する安定な
細胞株を確立する場合のための両方の効率的な細胞トランスフェクションの蛍光
マーカーとしての融合タンパク質の使用;
hTRT変異体−EGFPが、hTRを細胞質に保持し、テロメラーゼ維持を防止する不
死細胞の全てのhTRを一掃するように、不死細胞における(核局所化に不十分な
)変異した核局所化シグナルを伴うhTRT-EGFP融合の発現;および
免疫沈降のためのタグ化タンパク質としての使用。
テロメラーゼ触媒活性に対する変異の効果
本実施例は、変化したアミノ酸および変化した触媒活性を有するhTRT変異型タ
ンパク質を記載する。アミノ酸置換、続いての機能的分析は、ポリペプチド配列
の重要性および機能を評価する標準的手段である。本実施例は、逆転写酵素(RT
)およびテロメラーゼ(T)のモチーフの変化がテロメラーゼ触媒活性に影響す
ることを示す。
基は、一文字コードおよび位置によって同定され、変異タンパク質における対応
する残基は、一文字コードによって示される。従って、例えば、「K626A」は、h
TRTの626位における(すなわち、モチーフ1における)リジンがアラニンに変化
した変異体を特定する。
最初の実験において、標準的な技術を用いるpGRN121の部位特異的変異誘発に
よってhTRTのアミノ酸560がフェニルアラニン(F)からアラニン(A)に変化
した、hTRT変異タンパク質「F560A」をコードするベクターを産生した。この変
異は、TRTのFFYxTEモチーフを破壊する。得られたF560A変異ポリヌクレオチドは
、35S−メチオニンの存在下での無細胞の網状赤血球溶解物転写/翻訳系を用い
て評価されるように、全長hTRTタンパク質の合成を行うことが示された。
クルのPCRを用いるTRAPにより観測されるように、テロメラーゼ活性は検出され
なかったが、コントロールhTRT/hTR共翻訳は活性を再構成した。TRAPアッセイに
おける30サイクルのPCRで、テロメラーゼ活性は変異hTRTで観察できたが、コン
トロール(野生型)hTRTよりもかなり低かった。
標準的な部位特異的変異誘発技術(例えば、Ausubel,前掲参照)を用い、6つの
RTモチーフにおける保存されたアミノ酸をアラニンに変化させて、触媒活性に対
するそれらの貢献を評価した。実施例7に詳細に記載した2工程の通常の/TRAPア
ッセイを用いるIVRテロメラーゼを用い、変異体をアッセイした。
チーフA)、D868A(モチーフC)の変異体は、大きく減少したかまたは検出で
きないテロメラーゼ活性を有したが、Q833A(モチーフB)およびG932A(モチー
フE)の変異体は中レベルの活性を呈した。RTモチーフの外側の2つの変異体、R
688AおよびD897Aは、野生型hTRTと同等の活性を有した。これらの結果は、逆転
写酵素における類似の変異と合致し(Joyceら, 1994, Ann. Rev. Biochem. 63:7
77)、そしてEst2pで得られた結果と同様である(Lingner, 1997, Science 276:5
61参照)。実験は、酵素活性に重要および重要でないRTモチーフにおける残基
を同定し、そしてhTRTがヒトテロメラーゼの触媒タンパク質であることを示す。
変異は、例えば、テロメラーゼ活性の優性/陰性のレギュレーターとしての利用
性を有する変異hTRTポリペプチドを提供する。
ーフT(前掲参照)を同定した。hTRTにおけるこのモチーフの触媒的な役割を決
定するために、標準的な部位特異的変異誘発技術(Ausubel,前掲)を用いてこの
モチーフにおける6つのアミノ酸欠失(Δ560−565;FFYxTE)を構築した。実施
例7に詳細を記載した2段階の通常/TRAPアッセイを用い、欠失をIVRテロメラー
ゼを用いてアッセイした。Δ560−565変異体は観察可能なテロメラーゼ活性を25
サイクルのPCRの後に有さず、他方、野生型hTRT IVRテロメラーゼは強力なシグ
ナルを生じた。モチーフT内の各残基における各アミノ酸を同様な方法で独立し
て調べた;変異体F560A、Y562A、T564、およびE565Aは中レベルのテロメラーゼ
活性を保持し、他方、コントロール変異体F487Aは活性に対して最小の影響を有
した。注目すべきは、変異体F561Aは、大きく減少したかまたは検出できないテ
ロメラーゼ活性を有し、他方、活性はその「復帰変異体」F561A561Fで完全に復
帰した。F561A561Fは、変異位置をその元のフェニルアラニンに変化させる。こ
れは、観察された低下した活性を説明し得るプラスミドに対して他のアミノ酸変
化が起こらなかったことを示すコントロールである。従って、Tモチーフは、テ
ロメラーゼ活性で絶対的に必要とされることが示された最初の非RTモチーフであ
る。
ーフの変異型を含むhTRTタンパク質を、テロメラーゼ活性の優性/陰性レギュレ
ーターとして使用することができる。多くの他のRTとは異なり、テロメラーゼは
単一RNAの小部分(すなわち、hTR)と安定に会合し、そして前進的にそれをコピ
ーし、従って、モチーフTはhTR結合の媒介、反応の進行性、またはテロメラー
ゼRTに対してユニークな他の機能に関与し得る。
組換えにより発現されたテロメラーゼ成分を用いるテロメラーゼ活性モジュレ
ーターについてのスクリーニング
本実施例は、テロメラーゼ活性モジュレーターをスクリーニングし、同定する
ためのインビトロ再構成されたテロメラーゼの使用を記載する。記載したアッセ
イは、容易に(例えば、マルチウェルプレートおよび/またはロボット系を用い
る)高処理能力の方法に適合される。アッセイの工程に対する多数の変形は、こ
の開示のレビューの後に当業者に明らかである。
製造者の指示に従い、米国特許第5,324,637号に記載されているTNT(登録商標)Co
upled Reticulocyte溶解物系(Promega)を使用、以下のインビトロ反応で、そし
て前記実施例7に記載されているように、転写および翻訳する(hTRTのみ)。
TNTウサギ網状赤血球溶解物 25
TNT反応緩衝液 2
TNT T7 RNA Pol. 1
AA混合物(完全) 1
プライムRNaseインヒビター 1
無ヌクレアーゼ水 16
XbaI切断のpGRN121[hTRT](0.5μg) 2
FspI切断のpGRN164[hTR](0.5μg) 2
反応物を30℃で2時間インキュベートする。次いで、生成物をultrafree−MC DEA
Eフィルター(Millipore)で精製する。
下および非存在下で組換えテロメラーゼ産物(IVRP)をアッセイする。2.5μL I
VRP、2.5%DMSO、および1X TRAP緩衝液(20mM Tris−HCl、pH8.3、1.5mM MgCl2
、63mM KCl、0.05%Tween20、1.0mM EGTA、0.1mg/mlウシ血清アルブミン)の存
在下、室温にて、試験化合物を25μLの合計容量中で30分間プレインキュベート
する。プレインキュベーションの後、25μLのTRAPアッセイ反応混合物を各試料
に添加する。TRAPアッセイ反応混合物は、1X TRAP緩衝液、50μl dNTP、2.0μg/
mlプライマーACX、4μg/mlプライマーU2、0.8attomol/ml TSU2、2ユニット/5
0μl Taqポリメラーゼ(Perkin Elmer)、および2μg/ml[32P]5'末端標識プラ
イマーTS(3000Ci/mmol)からなる。次いで、反応チューブをPCRサーモサイク
ラー(MJ Research)に入れ、そしてPCRは以下のように行う:30℃における60分
間、20サイクルの{94℃における30秒、60℃における30秒、72℃における30秒}
、72℃における1分、10℃への冷却。TRAPアッセイは、米国特許第5,629,154号に
おいて、前記したように記載されている。使用されたプライマーおよび基質は以
下の配列を有する:
を各反応チューブに添加し、生成物(20μl)を400Vにおいて0.5X TBE中の12.5
%非変性PAGEで泳動する。完了したゲルを続いて乾燥し、TRAP生成物をPhosphor
imagerまたはオートラジオグラフィーによって可視化する。試験化合物の存在下
におけるテロメラーゼ活性を、薬剤を欠く平行反応に対して反応生成物中の標識
の取り込みを比較することによって測定する。
ckville, MD 20852, USAに寄託した:
ラムダファージλ25−1.1 ATCC受託番号209024
pGRN121 ATCC受託番号209016
ラムダファージλGФ5 ATCC受託番号98505
本発明は、hTRTに関する新規な方法および物質、ならびにテロメラーゼ関連疾
患の診断および処置を提供する。特定の実施例を提供したが、前記の記載は例示
的なものであって限定的なものではない。本発明の多くの変形が本明細書のレビ
ューにより当業者に明らかになる。従って、本発明の範囲は、前記の記載を参照
することなく決定されるべきであり、代わりに、等価物のその全範囲と共に添付
の請求の範囲を参照して決定されるべきである。
たは特許書類が個々に示されるのと同程度に全ての目的でその全体において参考
として援用される。
SEQUENCE LISTING
(1) GENERAL INFORMATION:
(i) APPLICANT:
(A) NAME: Geron Corporation
(B) STREET: 230 Constitution Drive
(C) CITY: Menlo Park
(D) STATE: California
(E) POSTAL CODE (ZIP): 94025
(F) COUNTRY: USA
(G) TELEPHONE: (415) 473-7700
(H) TELEFAX: (415) 473-7750
(I) TELEX:
(i) APPLICANT:
(A) NAME: University Technology Corporation
(B) STREET: 3101 Iris Avenue, Suite 250
(C) CITY: Boulder
(D) STATE: Colorado
(E) POSTAL CODE (ZIP): 80301
(F) COUNTRY: USA
(G) TELEPHONE: (303) 440-5495
(H) TELEFAX: (303) 440-5875
(I) TELEX:
(ii) TITLE OF INVENTION: Human Telomerase Catalytic Subunit Promoter
(iii) NUMBER OF SEQUENCES: 641
(iv) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/724,643
(B) FILING DATE: 01-OCT-1996
(v) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/844,419
(B) FILING DATE: 18-APR-1997
(v) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/846,017
(B) FILING DATE: 25-APR-1997
(v) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/854,050
(B) FILING DATE: 09-MAY-1997
(v) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/911,312
(B) FILING DATE: 14-AUG-1997
(v) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/912,951
(B) FILING DATE: 14-AUG-1997
(v) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/915,503
(B) FILING DATE: 14-AUG-1997
(2) INFORMATION FOR SEQ ID NO:1:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4015 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: 56..3454
(D) OTHER INFORMATION: /product= "hTRT"
/note= "human telomerase reverse
transcriptase (hTRT) catalytic protein
component"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:1:
GCAGCGCTGC GTCCTGCTGC GCACGTGGGA AGCCCTGGCC CCGGCCACCC CCGCG ATG 5
8
Met
1
CCG CGC GCT CCC CGC TGC CGA GCC GTG CGC TCC CTG CTG CGC AGC CAC 10
6
Pro Arg Ala Pro Arg Cys Arg Ala Val Arg Ser Leu Leu Arg Ser His
5 10 15
TAC CGC GAG GTG CTG CCG CTG GCC ACG TTC GTG CGG CGC CTG GGG CCC 15
4
Tyr Arg Glu Val Leu Pro Leu Ala Thr Phe Val Arg Arg Leu Gly Pro
20 25 30
CAG GGC TGG CGG CTG GTG CAG CGC GGG GAC CCG GCG GCT TTC CGC GCG 20
2
Gln Gly Trp Arg Leu Val Gln Arg Gly Asp Pro Ala Ala Phe Arg Ala
35 40 45
CTG GTG GCC CAG TGC CTG GTG TGC GTG CCC TGG GAC GCA CGG CCG CCC 25
0
Leu Val Ala Gln Cys Leu Val Cys Val Pro Trp Asp Ala Arg Pro Pro
50 55 60 65
CCC GCC GCC CCC TCC TTC CGC CAG GTG TCC TGC CTG AAG GAG CTG GTG 29
8
Pro Ala Ala Pro Ser Phe Arg Gln Val Ser Cys Leu Lys Glu Leu Val
70 75 80
GCC CGA GTG CTG CAG AGG CTG TGC GAG CGC GGC GCG AAG AAC GTG CTG 34
6
Ala Arg Val Leu Gln Arg Leu Cys Glu Arg Gly Ala Lys Asn Val Leu
85 90 95
GCC TTC GGC TTC GCG CTG CTG GAC GGG GCC CGC GGG GGC CCC CCC GAG 39
4
Ala Phe Gly Phe Ala Leu Leu Asp Gly Ala Arg Gly Gly Pro Pro Glu
100 105 110
GCC TTC ACC ACC AGC GTG CGC AGC TAC CTG CCC AAC ACG GTG ACC GAC 44
2
Ala Phe Thr Thr Ser Val Arg Ser Tyr Leu Pro Asn Thr Val Thr Asp
115 120 125
GCA CTG CGG GGG AGC GGG GCG TGG GGG CTG CTG CTG CGC CGC GTG GGC 49
0
Ala Leu Arg Gly Ser Gly Ala Trp Gly Leu Leu Leu Arg Arg Val Gly
130 135 140 145
GAC GAC GTG CTG GTT CAC CTG CTG GCA CGC TGC GCG CTC TTT GTG CTG 53
8
Asp Asp Val Leu Val His Leu Leu Ala Arg Cys Ala Leu Phe Val Leu
150 155 160
GTG GCT CCC AGC TGC GCC TAC CAG GTG TGC GGG CCG CCG CTG TAC CAG 58
6
Val Ala Pro Ser Cys Ala Tyr Gln Val Cys Gly Pro Pro Leu Tyr Gln
165 170 175
CTC GGC GCT GCC ACT CAG GCC CGG CCC CCG CCA CAC GCT AGT GGA CCC 63
4
Leu Gly Ala Ala Thr Gln Ala Arg Pro Pro Pro His Ala Ser Gly Pro
180 185 190
CGA AGG CGT CTG GGA TGC GAA CGG GCC TGG AAC CAT AGC GTC AGG GAG 68
2
Arg Arg Arg Leu Gly Cys Glu Arg Ala Trp Asn His Ser Val Arg Glu
195 200 205
GCC GGG GTC CCC CTG GGC CTG CCA GCC CCG GGT GCG AGG AGG CGC GGG 73
0
Ala Gly Val Pro Leu Gly Leu Pro Ala Pro Gly Ala Arg Arg Arg Gly
210 215 220 225
GGC AGT GCC AGC CGA AGT CTG CCG TTG CCC AAG AGG CCC AGG CGT GGC 77
8
Gly Ser Ala Ser Arg Ser Leu Pro Leu Pro Lys Arg Pro Arg Arg Gly
230 235 240
GCT GCC CCT GAG CCG GAG CGG ACG CCC GTT GGG CAG GGG TCC TGG GCC 82
6
Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln Gly Ser Trp Ala
245 250 255
CAC CCG GGC AGG ACG CGT GGA CCG AGT GAC CGT GGT TTC TGT GTG GTG 87
4
His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly Phe Cys Val Val
260 265 270
TCA CCT GCC AGA CCC GCC GAA GAA GCC ACC TCT TTG GAG GGT GCG CTC 92
2
Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu Glu Gly Ala Leu
275 280 285
TCT GGC ACG CGC CAC TCC CAC CCA TCC GTG GGC CGC CAG CAC CAC GCG 97
0
Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg Gln His His Ala
290 295 300 305
GGC CCC CCA TCC ACA TCG CGG CCA CCA CGT CCC TGG GAC ACG CCT TGT 101
8
Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp Asp Thr Pro Cys
310 315 320
CCC CCG GTG TAC GCC GAG ACC AAG CAC TTC CTC TAC TCC TCA GGC GAC 106
6
Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr Ser Ser Gly Asp
325 330 335
AAG GAG CAG CTG CGG CCC TCC TTC CTA CTC AGC TCT CTG AGG CCC AGC 111
4
Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser Leu Arg Pro Ser
340 345 350
CTG ACT GGC GCT CGG AGG CTC GTG GAG ACC ATC TTT CTG GGT TCC AGG 116
2
Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe Leu Gly Ser Arg
355 360 365
CCC TGG ATG CCA GGG ACT CCC CGC AGG TTG CCC CGC CTG CCC CAG CGC 121
0
Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg Leu Pro Gln Arg
370 375 380 385
TAC TGG CAA ATG CGG CCC CTG TTT CTG GAG CTG CTT GGG AAC CAC GCG 125
8
Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn His Ala
390 395 400
CAG TGC CCC TAC GGG GTG CTC CTC AAG ACG CAC TGC CCG CTG CGA GCT 130
6
Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys Pro Leu Arg Ala
405 410 415
GCG GTC ACC CCA GCA GCC GGT GTC TGT GCC CGG GAG AAG CCC CAG GGC 135
4
Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu Lys Pro Gln Gly
420 425 430
TCT GTG GCG GCC CCC GAG GAG GAG GAC ACA GAC CCC CGT CGC CTG GTG 140
2
Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro Arg Arg Leu Val
435 440 445
CAG CTG CTC CGC CAG CAC AGC AGC CCC TGG CAG GTG TAC GGC TTC GTG 145
0
Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val Tyr Gly Phe Val
450 455 460 465
CGG GCC TGC CTG CGC CGG CTG GTG CCC CCA GGC CTC TGG GGC TCC AGG 149
8
Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu Trp Gly Ser Arg
470 475 480
CAC AAC GAA CGC CGC TTC CTC AGG AAC ACC AAG AAG TTC ATC TCC CTG 154
6
His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe Ile Ser Leu
485 490 495
GGG AAG CAT GCC AAG CTC TCG CTG CAG GAG CTG ACG TGG AAG ATG AGC 159
4
Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr Trp Lys Met Ser
500 505 510
GTG CGG GAC TGC GCT TGG CTG CGC AGG AGC CCA GGG GTT GGC TGT GTT 164
2
Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val Gly Cys Val
515 520 525
CCG GCC GCA GAG CAC CGT CTG CGT GAG GAG ATC CTG GCC AAG TTC CTG 169
0
Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu Ala Lys Phe Leu
530 535 540 545
CAC TGG CTG ATG AGT GTG TAC GTC GTC GAG CTG CTC AGG TCT TTC TTT 173
8
His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe Phe
550 555 560
TAT GTC ACG GAG ACC ACG TTT CAA AAG AAC AGG CTC TTT TTC TAC CGG 178
6
Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg
565 570 575
AAG AGT GTC TGG AGC AAG TTG CAA AGC ATT GGA ATC AGA CAG CAC TTG 183
4
Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His Leu
580 585 590
AAG AGG GTG CAG CTG CGG GAG CTG TCG GAA GCA GAG GTC AGG CAG CAT 188
2
Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln His
595 600 605
CGG GAA GCC AGG CCC GCC CTG CTG ACG TCC AGA CTC CGC TTC ATC CCC 193
0
Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro
610 615 620 625
AAG CCT GAC GGG CTG CGG CCG ATT GTG AAC ATG GAC TAC GTC GTG GGA 197
8
Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val Gly
630 635 640
GCC AGA ACG TTC CGC AGA GAA AAG AGG GCC GAG CGT CTC ACC TCG AGG 202
6
Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg
645 650 655
GTG AAG GCA CTG TTC AGC GTG CTC AAC TAC GAG CGG GCG CGG CGC CCC 207
4
Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro
660 665 670
GGC CTC CTG GGC GCC TCT GTG CTG GGC CTG GAC GAT ATC CAC AGG GCC 212
2
Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His Arg Ala
675 680 685
TGG CGC ACC TTC GTG CTG CGT GTG CGG GCC CAG GAC CCG CCG CCT GAG 217
0
Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro Glu
690 695 700 705
CTG TAC TTT GTC AAG GTG GAT GTG ACG GGC GCG TAC GAC ACC ATC CCC 221
8
Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr Asp Thr Ile Pro
710 715 720
CAG GAC AGG CTC ACG GAG GTC ATC GCC AGC ATC ATC AAA CCC CAG AAC 226
6
Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln Asn
725 730 735
ACG TAC TGC GTG CGT CGG TAT GCC GTG GTC CAG AAG GCC GCC CAT GGG 231
4
Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His Gly
740 745 750
CAC GTC CGC AAG GCC TTC AAG AGC CAC GTC TCT ACC TTG ACA GAC CTC 236
2
His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr Asp Leu
755 760 765
CAG CCG TAC ATG CGA CAG TTC GTG GCT CAC CTG CAG GAG ACC AGC CCG 241
0
Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln Glu Thr Ser Pro
770 775 780 785
CTG AGG GAT GCC GTC GTC ATC GAG CAG AGC TCC TCC CTG AAT GAG GCC 245
8
Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser Leu Asn Glu Ala
790 795 800
AGC AGT GGC CTC TTC GAC GTC TTC CTA CGC TTC ATG TGC CAC CAC GCC 250
6
Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met Cys His His Ala
805 810 815
GTG CGC ATC AGG GGC AAG TCC TAC GTC CAG TGC CAG GGG ATC CCG CAG 255
4
Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln
820 825 830
GGC TCC ATC CTC TCC ACG CTG CTC TGC AGC CTG TGC TAC GGC GAC ATG 260
2
Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp Met
835 840 845
GAG AAC AAG CTG TTT GCG GGG ATT CGG CGG GAC GGG CTG CTC CTG CGT 265
0
Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu Arg
850 855 860 865
TTG GTG GAT GAT TTC TTG TTG GTG ACA CCT CAC CTC ACC CAC GCG AAA 269
8
Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr His Ala Lys
870 875 880
ACC TTC CTC AGG ACC CTG GTC CGA GGT GTC CCT GAG TAT GGC TGC GTG 274
6
Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys Val
885 890 895
GTG AAC TTG CGG AAG ACA GTG GTG AAC TTC CCT GTA GAA GAC GAG GCC 279
4
Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu Ala
900 905 910
CTG GGT GGC ACG GCT TTT GTT CAG ATG CCG GCC CAC GGC CTA TTC CCC 284
2
Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His Gly Leu Phe Pro
915 920 925
TGG TGC GGC CTG CTG CTG GAT ACC CGG ACC CTG GAG GTG CAG AGC GAC 289
0
Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser Asp
930 935 940 945
TAC TCC AGC TAT GCC CGG ACC TCC ATC AGA GCC AGT CTC ACC TTC AAC 293
8
Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn
950 955 960
CGC GGC TTC AAG GCT GGG AGG AAC ATG CGT CGC AAA CTC TTT GGG GTC 298
6
Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly Val
965 970 975
TTG CGG CTG AAG TGT CAC AGC CTG TTT CTG GAT TTG CAG GTG AAC AGC 303
4
Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn Ser
980 985 990
CTC CAG ACG GTG TGC ACC AAC ATC TAC AAG ATC CTC CTG CTG CAG GCG 308
2
Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala
995 1000 1005
TAC AGG TTT CAC GCA TGT GTG CTG CAG CTC CCA TTT CAT CAG CAA GTT 313
0
Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln Gln Val
1010 1015 1020 1025
TGG AAG AAC CCC ACA TTT TTC CTG CGC GTC ATC TCT GAC ACG GCC TCC 317
8
Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser Asp Thr Ala Ser
1030 1035 1040
CTC TGC TAC TCC ATC CTG AAA GCC AAG AAC GCA GGG ATG TCG CTG GGG 322
6
Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly Met Ser Leu Gly
1045 1050 1055
GCC AAG GGC GCC GCC GGC CCT CTG CCC TCC GAG GCC GTG CAG TGG CTG 327
4
Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala Val Gln Trp Leu
1060 1065 1070
TGC CAC CAA GCA TTC CTG CTC AAG CTG ACT CGA CAC CGT GTC ACC TAC 332
2
Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His Arg Val Thr Tyr
1075 1080 1085
GTG CCA CTC CTG GGG TCA CTC AGG ACA GCC CAG ACG CAG CTG AGT CGG 337
0
Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr Gln Leu Ser Arg
1090 1095 1100 1105
AAG CTC CCG GGG ACG ACG CTG ACT GCC CTG GAG GCC GCA GCC AAC CCG 341
8
Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala Ala Ala Asn Pro
1110 1115 1120
GCA CTG CCC TCA GAC TTC AAG ACC ATC CTG GAC TGATGGCCAC CCGCCCACAG 347
1
Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp
1125 1130
CCAGGCCGAG AGCAGACACC AGCAGCCCTG TCACGCCGGG CTCTACGTCC CAGGGAGGGA 353
1
GGGGCGGCCC ACACCCAGGC CCGCACCGCT GGGAGTCTGA GGCCTGAGTG AGTGTTTGGC 359
1
CGAGGCCTGC ATGTCCGGCT GAAGGCTGAG TGTCCGGCTG AGGCCTGAGC GAGTGTCCAG 365
1
CCAAGGGCTG AGTGTCCAGC ACACCTGCCG TCTTCACTTC CCCACAGGCT GGCGCTCGGC 371
1
TCCACCCCAG GGCCAGCTTT TCCTCACCAG GAGCCCGGCT TCCACTCCCC ACATAGGAAT 377
1
AGTCCATCCC CAGATTCGCC ATTGTTCACC CCTCGCCCTG CCCTCCTTTG CCTTCCACCC 383
1
CCACCATCCA GGTGGAGACC CTGAGAAGGA CCCTGGGAGC TCTGGGAATT TGGAGTGACC 389
1
AAAGGTGTGC CCTGTACACA GGCGAGGACC CTGCACCTGG ATGGGGGTCC CTGTGGGTCA 395
1
AATTGGGGGG AGGTGCTGTG GGAGTAAAAT ACTGAATATA TGAGTTTTTC AGTTTTGAAA 401
1
AAAA 401
5
(2) INFORMATION FOR SEQ ID NO:2:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1132 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:2:
Met Pro Arg Ala Pro Arg Cys Arg Ala Val Arg Ser Leu Leu Arg Ser
1 5 10 15
His Tyr Arg Glu Val Leu Pro Leu Ala Thr Phe Val Arg Arg Leu Gly
20 25 30
Pro Gln Gly Trp Arg Leu Val Gln Arg Gly Asp Pro Ala Ala Phe Arg
35 40 45
Ala Leu Val Ala Gln Cys Leu Val Cys Val Pro Trp Asp Ala Arg Pro
50 55 60
Pro Pro Ala Ala Pro Ser Phe Arg Gln Val Ser Cys Leu Lys Glu Leu
65 70 75 80
Val Ala Arg Val Leu Gln Arg Leu Cys Glu Arg Gly Ala Lys Asn Val
85 90 95
Leu Ala Phe Gly Phe Ala Leu Leu Asp Gly Ala Arg Gly Gly Pro Pro
100 105 110
Glu Ala Phe Thr Thr Ser Val Arg Ser Tyr Leu Pro Asn Thr Val Thr
115 120 125
Asp Ala Leu Arg Gly Ser Gly Ala Trp Gly Leu Leu Leu Arg Arg Val
130 135 140
Gly Asp Asp Val Leu Val His Leu Leu Ala Arg Cys Ala Leu Phe Val
145 150 155 160
Leu Val Ala Pro Ser Cys Ala Tyr Gln Val Cys Gly Pro Pro Leu Tyr
165 170 175
Gln Leu Gly Ala Ala Thr Gln Ala Arg Pro Pro Pro His Ala Ser Gly
180 185 190
Pro Arg Arg Arg Leu Gly Cys Glu Arg Ala Trp Asn His Ser Val Arg
195 200 205
Glu Ala Gly Val Pro Leu Gly Leu Pro Ala Pro Gly Ala Arg Arg Arg
210 215 220
Gly Gly Ser Ala Ser Arg Ser Leu Pro Leu Pro Lys Arg Pro Arg Arg
225 230 235 240
Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln Gly Ser Trp
245 250 255
Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly Phe Cys Val
260 265 270
Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu Glu Gly Ala
275 280 285
Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg Gln His His
290 295 300
Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp Asp Thr Pro
305 310 315 320
Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr Ser Ser Gly
325 330 335
Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser Leu Arg Pro
340 345 350
Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe Leu Gly Ser
355 360 365
Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg Leu Pro Gln
370 375 380
Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn His
385 390 395 400
Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys Pro Leu Arg
405 410 415
Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu Lys Pro Gln
420 425 430
Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro Arg Arg Leu
435 440 445
Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val Tyr Gly Phe
450 455 460
Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu Trp Gly Ser
465 470 475 480
Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe Ile Ser
485 490 495
Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr Trp Lys Met
500 505 510
Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val Gly Cys
515 520 525
Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu Ala Lys Phe
530 535 540
Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe
545 550 555 560
Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr
565 570 575
Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His
580 585 590
Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln
595 600 605
His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile
610 615 620
Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val
625 630 635 640
Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser
645 650 655
Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg
660 665 670
Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His Arg
675 680 685
Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro
690 695 700
Glu Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr Asp Thr Ile
705 710 715 720
Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln
725 730 735
Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His
740 745 750
Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr Asp
755 760 765
Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln Glu Thr Ser
770 775 780
Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser Leu Asn Glu
785 790 795 800
Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met Cys His His
805 810 815
Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro
820 825 830
Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp
835 840 845
Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu
850 855 860
Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr His Ala
865 870 875 880
Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys
885 890 895
Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu
900 905 910
Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His Gly Leu Phe
915 920 925
Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser
930 935 940
Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe
945 950 955 960
Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly
965 970 975
Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn
980 985 990
Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln
995 1000 1005
Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln Gln
1010 1015 1020
Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser Asp Thr Ala
1025 1030 1035 1040
Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly Met Ser Leu
1045 1050 1055
Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala Val Gln Trp
1060 1065 1070
Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His Arg Val Thr
1075 1080 1085
Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr Gln Leu Ser
1090 1095 1100
Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala Ala Ala Asn
1105 1110 1115 1120
Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp
1125 1130
(2) INFORMATION FOR SEQ ID NO:3:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 2176 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(ix) FEATURE:
(A) NAME/KEY: nucleic acid
(B) LOCATION: 1..2176
(D) OTHER INFORMATION: /note= "clone 712562"
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: 23..802
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:3:
GGCCAAGTTC CTGCACTGGC TGATGAGTGT GTACGTCGTC GAGCTGCTCA GGTCTTTCTT 6
0
TTATGTCACG GAGACCACGT TTCAAAAGAA CAGGCTCTTT TTCTACCGGA AGAGTGTCTG 12
0
GAGCAAGTTG CAAAGCATTG GAATCAGACA GCACTTGAAG AGGGTGCAGC TGCGGGAGCT 18
0
GTCGGAAGCA GAGGTCAGGC AGCATCGGGA AGCCAGGCCC GCCCTGCTGA CGTCCAGACT 24
0
CCGCTTCATC CCCAAGCCTG ACGGGCTGCG GCCGATTGTG AACATGGACT ACGTCGTGGG 30
0
AGCCAGAACG TTCCGCAGAG AAAAGAGGGC CGAGCGTCTC ACCTCGAGGG TGAAGGCACT 36
0
GTTCAGCGTG CTCAACTACG AGCGGGCGCG GCGCCCCGGC CTCCTGGGCG CCTCTGTGCT 42
0
GGGCCTGGAC GATATCCACA GGGCCTGGCG CACCTTCGTG CTGCGTGTGC GGGCCCAGGA 48
0
CCCGCCGCCT GAGCTGTACT TTGTCAAGGT GGATGTGACG GGCGCGTACG ACACCATCCC 54
0
CCAGGACAGG CTCACGGAGG TCATCGCCAG CATCATCAAA CCCCAGAACA CGTACTGCGT 60
0
GCGTCGGTAT GCCGTGGTCC AGAAGGCCGC CCATGGGCAC GTCCGCAAGG CCTTCAAGAG 66
0
CCACGTCCTA CGTCCAGTGC CAGGGGATCC CGCAGGGCTC CATCCTCTCC ACGCTGCTCT 72
0
GCAGCCTGTG CTACGGCGAC ATGGAGAACA AGCTGTTTGC GGGGATTCGG CGGGACGGGC 78
0
TGCTCCTGCG TTTGGTGGAT GATTTCTTGT TGGTGACACC TCACCTCACC CACGCGAAAA 84
0
CCTTCCTCAG GACCCTGGTC CGAGGTGTCC CTGAGTATGG CTGCGTGGTG AACTTGCGGA 90
0
AGACAGTGGT GAACTTCCCT GTAGAAGACG AGGCCCTGGG TGGCACGGCT TTTGTTCAGA 96
0
TGCCGGCCCA CGGCCTATTC CCCTGGTGCG GCCTGCTGCT GGATACCCGG ACCCTGGAGG 102
0
TGCAGAGCGA CTACTCCAGC TATGCCCGGA CCTCCATCAG AGCCAGTCTC ACCTTCAACC 108
0
GCGGCTTCAA GGCTGGGAGG AACATGCGTC GCAAACTCTT TGGGGTCTTG CGGCTGAAGT 114
0
GTCACAGCCT GTTTCTGGAT TTGCAGGTGA ACAGCCTCCA GACGGTGTGC ACCAACATCT 120
0
ACAAGATCCT CCTGCTGCAG GCGTACAGGT TTCACGCATG TGTGCTGCAG CTCCCATTTC 126
0
ATCAGCAAGT TTGGAAGAAC CCCACATTTT TCCTGCGCGT CATCTCTGAC ACGGCCTCCC 132
0
TCTGCTACTC CATCCTGAAA GCCAAGAACG CAGGGATGTC GCTGGGGGCC AAGGGCGCCG 138
0
CCGGCCNTCT GCCCTCCGAG GCCGTGCAGT GGCTGTGCCA CCAAGCATTC CTGCTCAAGC 144
0
TGACTCGACA CCGTGTCACC TACGTGCCAC TCCTGGGGTC ACTCAGGACA GCCCAGACGC 150
0
AGCTGAGTCG GAAGCTCCCG GGGACGACGC TGACTGCCCT GGAGGCCGCA GCCAACCCGG 156
0
CACTGCCCTC AGACTTCAAG ACCATCCTGG ACTGATGGCC ACCCGCCCAC AGCCAGGCCG 162
0
AGAGCAGACA CCAGCAGCCC TGTCACGCCG GGCTCTACGT CCCAGGGAGG GAGGGGCGGC 168
0
CCACACCCAG GCCTGCACCG CTGGGAGTCT GAGGCCTGAG TGAGTGTTTG GCCGAGGCCT 174
0
GCATGTCCGG CTGAAGGCTG AGTGTCCGGC TGAGGCCTGA GCGAGTGTCC AGCCAAGGGC 180
0
TGAGTGTCCA GCACACCTGC CGTCTTCACT TCCCCACAGG CTGGCGCTCG GCTCCACCCC 186
0
AGGGCCAGCT TTTCCTCACC AGGAGCCCGG CTTCCACTCC CCACATAGGA ATAGTCCATC 192
0
CCCAGATTCG CCATTGTTCA CCCCTCGCCC TGCCCTCCTT TGCCTTCCAC CCCCACCATC 198
0
CAGGTGGAGA CCCTGAGAAG GACCCTGGGA GCTCTGGGAA TTTGGAGTGA CCAAAGGTGT 204
0
GCCCTGTACA CAGGCGAGGA CCCTGCACCT GGATGGGGGT CCCTGTGGGT CAAATTGGGG 210
0
GGAGGTGCTG TGGGAGTAAA ATACTGAATA TATGAGTTTT TCAGTTTTGN AAAAAAAAAA 216
0
AAAAAAAAAA AAAAAA 217
6
(2) INFORMATION FOR SEQ ID NO:4:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 3855 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(ix) FEATURE:
(A) NAME/KEY: nucleic acid
(B) LOCATION: 1..3855
(D) OTHER INFORMATION: /note= "nucleic acid sequence with an
open reading frame encoding a delta-182
variant polypeptide"
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: 56..2479
(D) OTHER INFORMATION: /product= "delta-182 variant
polypeptide"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:4:
GCAGCGCTGC GTCCTGCTGC GCACGTGGGA AGCCCTGGCC CCGGCCACCC CCGCG ATG 5
8
Met
1
CCG CGC GCT CCC CGC TGC CGA GCC GTG CGC TCC CTG CTG CGC AGC CAC 10
6
Pro Arg Ala Pro Arg Cys Arg Ala Val Arg Ser Leu Leu Arg Ser His
5 10 15
TAC CGC GAG GTG CTG CCG CTG GCC ACG TTC GTG CGG CGC CTG GGG CCC 15
4
Tyr Arg Glu Val Leu Pro Leu Ala Thr Phe Val Arg Arg Leu Gly Pro
20 25 30
CAG GGC TGG CGG CTG GTG CAG CGC GGG GAC CCG GCG GCT TTC CGC GCG 20
2
Gln Gly Trp Arg Leu Val Gln Arg Gly Asp Pro Ala Ala Phe Arg Ala
35 40 45
CTG GTG GCC CAG TGC CTG GTG TGC GTG CCC TGG GAC GCA CGG CCG CCC 25
0
Leu Val Ala Gln Cys Leu Val Cys Val Pro Trp Asp Ala Arg Pro Pro
50 55 60 65
CCC GCC GCC CCC TCC TTC CGC CAG GTG TCC TGC CTG AAG GAG CTG GTG 29
8
Pro Ala Ala Pro Ser Phe Arg Gln Val Ser Cys Leu Lys Glu Leu Val
70 75 80
GCC CGA GTG CTG CAG AGG CTG TGC GAG CGC GGC GCG AAG AAC GTG CTG 34
6
Ala Arg Val Leu Gln Arg Leu Cys Glu Arg Gly Ala Lys Asn Val Leu
85 90 95
GCC TTC GGC TTC GCG CTG CTG GAC GGG GCC CGC GGG GGC CCC CCC GAG 39
4
Ala Phe Gly Phe Ala Leu Leu Asp Gly Ala Arg Gly Gly Pro Pro Glu
100 105 110
GCC TTC ACC ACC AGC GTG CGC AGC TAC CTG CCC AAC ACG GTG ACC GAC 44
2
Ala Phe Thr Thr Ser Val Arg Ser Tyr Leu Pro Asn Thr Val Thr Asp
115 120 125
GCA CTG CGG GGG AGC GGG GCG TGG GGG CTG CTG CTG CGC CGC GTG GGC 49
0
Ala Leu Arg Gly Ser Gly Ala Trp Gly Leu Leu Leu Arg Arg Val Gly
130 135 140 145
GAC GAC GTG CTG GTT CAC CTG CTG GCA CGC TGC GCG CTC TTT GTG CTG 53
8
Asp Asp Val Leu Val His Leu Leu Ala Arg Cys Ala Leu Phe Val Leu
150 155 160
GTG GCT CCC AGC TGC GCC TAC CAG GTG TGC GGG CCG CCG CTG TAC CAG 58
6
Val Ala Pro Ser Cys Ala Tyr Gln Val Cys Gly Pro Pro Leu Tyr Gln
165 170 175
CTC GGC GCT GCC ACT CAG GCC CGG CCC CCG CCA CAC GCT AGT GGA CCC 63
4
Leu Gly Ala Ala Thr Gln Ala Arg Pro Pro Pro His Ala Ser Gly Pro
180 185 190
CGA AGG CGT CTG GGA TGC GAA CGG GCC TGG AAC CAT AGC GTC AGG GAG 68
2
Arg Arg Arg Leu Gly Cys Glu Arg Ala Trp Asn His Ser Val Arg Glu
195 200 205
GCC GGG GTC CCC CTG GGC CTG CCA GCC CCG GGT GCG AGG AGG CGC GGG 73
0
Ala Gly Val Pro Leu Gly Leu Pro Ala Pro Gly Ala Arg Arg Arg Gly
210 215 220 225
GGC AGT GCC AGC CGA AGT CTG CCG TTG CCC AAG AGG CCC AGG CGT GGC 77
8
Gly Ser Ala Ser Arg Ser Leu Pro Leu Pro Lys Arg Pro Arg Arg Gly
230 235 240
GCT GCC CCT GAG CCG GAG CGG ACG CCC GTT GGG CAG GGG TCC TGG GCC 82
6
Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln Gly Ser Trp Ala
245 250 255
CAC CCG GGC AGG ACG CGT GGA CCG AGT GAC CGT GGT TTC TGT GTG GTG 87
4
His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly Phe Cys Val Val
260 265 270
TCA CCT GCC AGA CCC GCC GAA GAA GCC ACC TCT TTG GAG GGT GCG CTC 92
2
Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu Glu Gly Ala Leu
275 280 285
TCT GGC ACG CGC CAC TCC CAC CCA TCC GTG GGC CGC CAG CAC CAC GCG 97
0
Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg Gln His His Ala
290 295 300 305
GGC CCC CCA TCC ACA TCG CGG CCA CCA CGT CCC TGG GAC ACG CCT TGT 101
8
Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp Asp Thr Pro Cys
310 315 320
CCC CCG GTG TAC GCC GAG ACC AAG CAC TTC CTC TAC TCC TCA GGC GAC 106
6
Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr Ser Ser Gly Asp
325 330 335
AAG GAG CAG CTG CGG CCC TCC TTC CTA CTC AGC TCT CTG AGG CCC AGC 111
4
Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser Leu Arg Pro Ser
340 345 350
CTG ACT GGC GCT CGG AGG CTC GTG GAG ACC ATC TTT CTG GGT TCC AGG 116
2
Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe Leu Gly Ser Arg
355 360 365
CCC TGG ATG CCA GGG ACT CCC CGC AGG TTG CCC CGC CTG CCC CAG CGC 121
0
Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg Leu Pro Gln Arg
370 375 380 385
TAC TGG CAA ATG CGG CCC CTG TTT CTG GAG CTG CTT GGG AAC CAC GCG 125
8
Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn His Ala
390 395 400
CAG TGC CCC TAC GGG GTG CTC CTC AAG ACG CAC TGC CCG CTG CGA GCT 130
6
Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys Pro Leu Arg Ala
405 410 415
GCG GTC ACC CCA GCA GCC GGT GTC TGT GCC CGG GAG AAG CCC CAG GGC 135
4
Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu Lys Pro Gln Gly
420 425 430
TCT GTG GCG GCC CCC GAG GAG GAG GAC ACA GAC CCC CGT CGC CTG GTG 140
2
Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro Arg Arg Leu Val
435 440 445
CAG CTG CTC CGC CAG CAC AGC AGC CCC TGG CAG GTG TAC GGC TTC GTG 145
0
Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val Tyr Gly Phe Val
450 455 460 465
CGG GCC TGC CTG CGC CGG CTG GTG CCC CCA GGC CTC TGG GGC TCC AGG 149
8
Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu Trp Gly Ser Arg
470 475 480
CAC AAC GAA CGC CGC TTC CTC AGG AAC ACC AAG AAG TTC ATC TCC CTG 154
6
His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe Ile Ser Leu
485 490 495
GGG AAG CAT GCC AAG CTC TCG CTG CAG GAG CTG ACG TGG AAG ATG AGC 159
4
Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr Trp Lys Met Ser
500 505 510
GTG CGG GAC TGC GCT TGG CTG CGC AGG AGC CCA GGG GTT GGC TGT GTT 164
2
Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val Gly Cys Val
515 520 525
CCG GCC GCA GAG CAC CGT CTG CGT GAG GAG ATC CTG GCC AAG TTC CTG 169
0
Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu Ala Lys Phe Leu
530 535 540 545
CAC TGG CTG ATG AGT GTG TAC GTC GTC GAG CTG CTC AGG TCT TTC TTT 173
8
His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe Phe
550 555 560
TAT GTC ACG GAG ACC ACG TTT CAA AAG AAC AGG CTC TTT TTC TAC CGG 178
6
Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg
565 570 575
AAG AGT GTC TGG AGC AAG TTG CAA AGC ATT GGA ATC AGA CAG CAC TTG 183
4
Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His Leu
580 585 590
AAG AGG GTG CAG CTG CGG GAG CTG TCG GAA GCA GAG GTC AGG CAG CAT 188
2
Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln His
595 600 605
CGG GAA GCC AGG CCC GCC CTG CTG ACG TCC AGA CTC CGC TTC ATC CCC 193
0
Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro
610 615 620 625
AAG CCT GAC GGG CTG CGG CCG ATT GTG AAC ATG GAC TAC GTC GTG GGA 197
8
Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val Gly
630 635 640
GCC AGA ACG TTC CGC AGA GAA AAG AGG GCC GAG CGT CTC ACC TCG AGG 202
6
Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg
645 650 655
GTG AAG GCA CTG TTC AGC GTG CTC AAC TAC GAG CGG GCG CGG CGC CCC 207
4
Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro
660 665 670
GGC CTC CTG GGC GCC TCT GTG CTG GGC CTG GAC GAT ATC CAC AGG GCC 212
2
Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His Arg Ala
675 680 685
TGG CGC ACC TTC GTG CTG CGT GTG CGG GCC CAG GAC CCG CCG CCT GAG 217
0
Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro Glu
690 695 700 705
CTG TAC TTT GTC AAG GTG GAT GTG ACG GGC GCG TAC GAC ACC ATC CCC 221
8
Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr Asp Thr Ile Pro
710 715 720
CAG GAC AGG CTC ACG GAG GTC ATC GCC AGC ATC ATC AAA CCC CAG AAC 226
6
Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln Asn
725 730 735
ACG TAC TGC GTG CGT CGG TAT GCC GTG GTC CAG AAG GCC GCC CAT GGG 231
4
Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His Gly
740 745 750
CAC GTC CGC AAG GCC TTC AAG AGC CAC GTC CTA CGT CCA GTG CCA GGG 236
2
His Val Arg Lys Ala Phe Lys Ser His Val Leu Arg Pro Val Pro Gly
755 760 765
GAT CCC GCA GGG CTC CAT CCT CTC CAC GCT GCT CTG CAG CCT GTG CTA 241
0
Asp Pro Ala Gly Leu His Pro Leu His Ala Ala Leu Gln Pro Val Leu
770 775 780 785
CGG CGA CAT GGA GAA CAA GCT GTT TGC GGG GAT TCG GCG GGA CGG GCT 245
8
Arg Arg His Gly Glu Gln Ala Val Cys Gly Asp Ser Ala Gly Arg Ala
790 795 800
GCT CCT GCG TTT GGT GGA TGATTTCTTG TTGGTGACAC CTCACCTCAC 250
6
Ala Pro Ala Phe Gly Gly
805
CCACGCGAAA ACCTTCCTCA GGACCCTGGT CCGAGGTGTC CCTGAGTATG GCTGCGTGGT 256
6
GAACTTGCGG AAGACAGTGG TGAACTTCCC TGTAGAAGAC GAGGCCCTGG GTGGCACGGC 262
6
TTTTGTTCAG ATGCCGGCCC ACGGCCTATT CCCCTGGTGC GGCCTGCTGC TGGATACCCG 268
6
GACCCTGGAG GTGCAGAGCG ACTACTCCAG CTATGCCCGG ACCTCCATCA GAGCCAGTCT 274
6
CACCTTCAAC CGCGGCTTCA AGGCTGGGAG GAACATGCGT CGCAAACTCT TTGGGGTCTT 280
6
GCGGCTGAAG TGTCACAGCC TGTTTCTGGA TTTGCAGGTG AACAGCCTCC AGACGGTGTG 286
6
CACCAACATC TACAAGATCC TCCTGCTGCA GGCGTACAGG TTTCACGCAT GTGTGCTGCA 292
6
GCTCCCATTT CATCAGCAAG TTTGGAAGAA CCCCACATTT TTCCTGCGCG TCATCTCTGA 298
6
CACGGCCTCC CTCTGCTACT CCATCCTGAA AGCCAAGAAC GCAGGGATGT CGCTGGGGGC 304
6
CAAGGGCGCC GCCGGCCCTC TGCCCTCCGA GGCCGTGCAG TGGCTGTGCC ACCAAGCATT 310
6
CCTGCTCAAG CTGACTCGAC ACCGTGTCAC CTACGTGCCA CTCCTGGGGT CACTCAGGAC 316
6
AGCCCAGACG CAGCTGAGTC GGAAGCTCCC GGGGACGACG CTGACTGCCC TGGAGGCCGC 322
6
AGCCAACCCG GCACTGCCCT CAGACTTCAA GACCATCCTG GACTGATGGC CACCCGCCCA 328
6
CAGCCAGGCC GAGAGCAGAC ACCAGCAGCC CTGTCACGCC GGGCTCTACG TCCCAGGGAG 334
6
GGAGGGGCGG CCCACACCCA GGCCCGCACC GCTGGGAGTC TGAGGCCTGA GTGAGTGTTT 340
6
GGCCGAGGCC TGCATGTCCG GCTGAAGGCT GAGTGTCCGG CTGAGGCCTG AGCGAGTGTC 346
6
CAGCCAAGGG CTGAGTGTCC AGCACACCTG CCGTCTTCAC TTCCCCACAG GCTGGCGCTC 352
6
GGCTCCACCC CAGGGCCAGC TTTTCCTCAC CAGGAGCCCG GCTTCCACTC CCCACATAGG 358
6
AATAGTCCAT CCCCAGATTC GCCATTGTTC ACCCCTCGCC CTGCCCTCCT TTGCCTTCCA 364
6
CCCCCACCAT CCAGGTGGAG ACCCTGAGAA GGACCCTGGG AGCTCTGGGA ATTTGGAGTG 370
6
ACCAAAGGTG TGCCCTGTAC ACAGGCGAGG ACCCTGCACC TGGATGGGGG TCCCTGTGGG 376
6
TCAAATTGGG GGGAGGTGCT GTGGGAGTAA AATACTGAAT ATATGAGTTT TTCAGTTTTG 382
6
AAAAAAAAAA AAAAAAAAAA AAAAAAAAA 385
5
(2) INFORMATION FOR SEQ ID NO:5:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 807 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:5:
Met Pro Arg Ala Pro Arg Cys Arg Ala Val Arg Ser Leu Leu Arg Ser
1 5 10 15
His Tyr Arg Glu Val Leu Pro Leu Ala Thr Phe Val Arg Arg Leu Gly
20 25 30
Pro Gln Gly Trp Arg Leu Val Gln Arg Gly Asp Pro Ala Ala Phe Arg
35 40 45
Ala Leu Val Ala Gln Cys Leu Val Cys Val Pro Trp Asp Ala Arg Pro
50 55 60
Pro Pro Ala Ala Pro Ser Phe Arg Gln Val Ser Cys Leu Lys Glu Leu
65 70 75 80
Val Ala Arg Val Leu Gln Arg Leu Cys Glu Arg Gly Ala Lys Asn Val
85 90 95
Leu Ala Phe Gly Phe Ala Leu Leu Asp Gly Ala Arg Gly Gly Pro Pro
100 105 110
Glu Ala Phe Thr Thr Ser Val Arg Ser Tyr Leu Pro Asn Thr Val Thr
115 120 125
Asp Ala Leu Arg Gly Ser Gly Ala Trp Gly Leu Leu Leu Arg Arg Val
130 135 140
Gly Asp Asp Val Leu Val His Leu Leu Ala Arg Cys Ala Leu Phe Val
145 150 155 160
Leu Val Ala Pro Ser Cys Ala Tyr Gln Val Cys Gly Pro Pro Leu Tyr
165 170 175
Gln Leu Gly Ala Ala Thr Gln Ala Arg Pro Pro Pro His Ala Ser Gly
180 185 190
Pro Arg Arg Arg Leu Gly Cys Glu Arg Ala Trp Asn His Ser Val Arg
195 200 205
Glu Ala Gly Val Pro Leu Gly Leu Pro Ala Pro Gly Ala Arg Arg Arg
210 215 220
Gly Gly Ser Ala Ser Arg Ser Leu Pro Leu Pro Lys Arg Pro Arg Arg
225 230 235 240
Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln Gly Ser Trp
245 250 255
Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly Phe Cys Val
260 265 270
Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu Glu Gly Ala
275 280 285
Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg Gln His His
290 295 300
Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp Asp Thr Pro
305 310 315 320
Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr Ser Ser Gly
325 330 335
Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser Leu Arg Pro
340 345 350
Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe Leu Gly Ser
355 360 365
Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg Leu Pro Gln
370 375 380
Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn His
385 390 395 400
Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys Pro Leu Arg
405 410 415
Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu Lys Pro Gln
420 425 430
Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro Arg Arg Leu
435 440 445
Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val Tyr Gly Phe
450 455 460
Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu Trp Gly Ser
465 470 475 480
Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe Ile Ser
485 490 495
Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr Trp Lys Met
500 505 510
Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val Gly Cys
515 520 525
Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu Ala Lys Phe
530 535 540
Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe
545 550 555 560
Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr
565 570 575
Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His
580 585 590
Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln
595 600 605
His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile
610 615 620
Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val
625 630 635 640
Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser
645 650 655
Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg
660 665 670
Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His Arg
675 680 685
Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro
690 695 700
Glu Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr Asp Thr Ile
705 710 715 720
Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln
725 730 735
Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His
740 745 750
Gly His Val Arg Lys Ala Phe Lys Ser His Val Leu Arg Pro Val Pro
755 760 765
Gly Asp Pro Ala Gly Leu His Pro Leu His Ala Ala Leu Gln Pro Val
770 775 780
Leu Arg Arg His Gly Glu Gln Ala Val Cys Gly Asp Ser Ala Gly Arg
785 790 795 800
Ala Ala Pro Ala Phe Gly Gly
805
(2) INFORMATION FOR SEQ ID NO:6:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4335 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: nucleic acid
(B) LOCATION: 1..4335
(D) OTHER INFORMATION: /note= "genomic DNA insert of pGRN144"
(ix) FEATURE:
(A) NAME/KEY: intron
(B) LOCATION: 2715..2818
(D) OTHER INFORMATION: /note= "intron 1"
(ix) FEATURE:
(A) NAME/KEY: intron
(B) LOCATION: 4173..4326
(D) OTHER INFORMATION: /note= "intron 2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:6:
CCATGGGACC CACTGCAGGG GCAGCTGGGA GGCTGCAGGC TTCAGGTCCC AGTGGGGTTG 6
0
CCATCTGCCA GTAGAAACCT GATGTAGAAT CAGGGCGCGA GTGTGGACAC TGTCCTGAAT 12
0
CTCAATGTCT CAGTGTGTGC TGAAACATGT AGAAATTAAA GTCCATCCCT CCTACTCTAC 18
0
TGGGATTGAG CCCCTTCCCT ATCCCCCCCC AGGGGCAGAG GAGTTCCTCT CACTCCTGTG 24
0
GAGGAAGGAA TGATACTTTG TTATTTTTCA CTGCTGGTAC TGAATCCACT GTTTCATTTG 30
0
TTGGTTTGTT TGTTTTGTTT TGAGAGGCGG TTTCACTCTT GTTGCTCAGG CTGGAGGGAG 36
0
TGCAATGGCG CGATCTTGGC TTACTGCAGC CTCTGCCTCC CAGGTTCAAG TGATTCTCCT 42
0
GCTTCCGCCT CCCATTTGGC TGGGATTACA GGCACCCGCC ACCATGCCCA GCTAATTTTT 48
0
TGTATTTTTA GTAGAGACGG GGGTGGGGGT GGGGTTCACC ATGTTGGCCA GGCTGGTCTC 54
0
GAACTTCTGA CCTCAGATGA TCCACCTGCC TCTGCCTCCT AAAGTGCTGG GATTACAGGT 60
0
GTGAGCCACC ATGCCCAGCT CAGAATTTAC TCTGTTTAGA AACATCTGGG TCTGAGGTAG 66
0
GAAGCTCACC CCACTCAAGT GTTGTGGTGT TTTAAGCCAA TGATAGAATT TTTTTATTGT 72
0
TGTTAGAACA CTCTTGATGT TTTACACTGT GATGACTAAG ACATCATCAG CTTTTCAAAG 78
0
ACACACTAAC TGCACCCATA ATACTGGGGT GTCTTCTGGG TATCAGCGAT CTTCATTGAA 84
0
TGCCGGGAGG CGTTTCCTCG CCATGCACAT GGTGTTAATT ACTCCAGCAT AATCTTCTGC 90
0
TTCCATTTCT TCTCTTCCCT CTTTTAAAAT TGTGTTTTCT ATGTTGGCTT CTCTGCAGAG 96
0
AACCAGTGTA AGCTACAACT TAACTTTTGT TGGAACAAAT TTTCCAAACC GCCCCTTTGC 102
0
CCTAGTGGCA GAGACAATTC ACAAACACAG CCCTTTAAAA AGGCTTAGGG ATCACTAAGG 108
0
GGATTTCTAG AAGAGCGACC CGTAATCCTT AAGTATTTAC AAGACGAGGC TAACCTCCAG 114
0
CGAGCGTGAC AGCCCAGGGA GGGTGCGAGG CCTGTTCAAA TGCTAAGCTT CCATAAATAA 120
0
AGCAAATTTC CTCCGGCAGT TTCTGGAAAG TAGGAAAGGT TAACATTTAA GGTTGCGTTT 126
0
GTTAGCATTT CAGTGTTTGC CGACCTCAGC TAACAGCATC CCTGCAAGGC CTCGGGAGAC 132
0
CCAGAAGTTT CTCGCCCCTT AGATCCAAAC TTGAGCAACC CGGAGTCTGG ATTCCTGGGA 138
0
AGTCCTCAGC TGTCCTGCGG TTGTGCCGGG GCCCCAGGTC TGGAGGGGAC CAGTGGCCGT 144
0
GTGGCTTCTA CTGCTGGGCT GGAAGTCGGG CCTCCTAGCT CTGCAGTCCG AGGCTTGGAG 150
0
CCAGGTGCCT GGACCCCGAG GCTGCCCTCC ACCCTGTGCG GGCGGGATGT GACCAGATGT 156
0
TGGCCTCATC TGCCAGACAG AGTGCCGGGG CCCAGGGTCA AGGCCGTTGT GGCTGGTGTG 162
0
AGGCGCCCGG TGCGCGGCCA GCAGGAGCGC CTGGCTCCAT TTCCCACCCT TTCTCGACGG 168
0
GACCGCCCCG GTGGGTGATT AACAGATATT GGGGTGGTTT GCTCATGGTG GGGACCCCTT 174
0
CGCCGCCTGA GAACCTGCAA AGAGAAATGA CGGGCCTGTG TCAAGGAGCC CAAGTCGCGG 180
0
GGAAGTGTTG CAGGGAGGCA CTCCGGGAGG TCCCGCGTGC CCGTCCAGGG AGCAATGCGT 186
0
CCTCGGGTTC GTCCCCAGCC GCGTCTACGC GCCTCCGTCC TCCCCTTCAC GTCCGGCATT 192
0
CGTGGTGCCC GGAGCCCGAC GCCCCGCGTC CGGACCTGGA GGCAGCCCTG GGTCTCCGGA 198
0
TCAGGCCAGC GGCCAAAGGG TCGCCGCACG CACCTGTTCC CAGGGCCTCC ACATCATGGC 204
0
CCCTCCCTCG GGTTACCCCA CAGCCTAGGC CGATTCGACC TCTCTCCGCT GGGGCCCTCG 210
0
CTGGCGTCCC TGCACCCTGG GAGCGCGAGC GGCGCGCGGG CGGGGAAGCG CGGCCCAGAC 216
0
CCCCGGGTCC GCCCGGAGCA GCTGCGCTGT CGGGGCCAGG CCGGGCTCCC AGTGGATTCG 222
0
CGGGCAACAG ACGCCCAGGA CCGCGCTTCC CACGTGGCGG AGGGACTGGG GACCCGGGCA 228
0
CCGGTCCTGC CCCTTCACCT TCCAGCTCCG CCTCGTCCGC GCGGAACCCC GCCCCGTCCC 234
0
GAACCCTTCC CGGGTCCCCG GCCCAGCCCC TTCCGGGCCA TCCCAGCCCG TCCCGTTCCT 240
0
TTTCCGCGGC CCCGCCCTCT CCTCGCGGCG CGAGTTTCAG GCAGCGCTGC GTCCTGCTGC 246
0
GCACGTGGGA AGCCCTGGCC CCGGCCACCC CCGCGATGCC GCGCGCTCCC CGCTGCCGAG 252
0
CCGTGCGCTC CCTGCTGCGC AGCCACTACC GCGAGGTGCT GCCGCTGGCC ACGTTCGTGC 258
0
GGCGCCTGGG GCCCCAGGGC TGGCGGCTGG TGCAGCGCGG GGACCCGGCG GCTTTCCGCG 264
0
CGCTGGTGGC CCAGTGCCTG GTGTGCGTGC CCTGGGACGC ACGGCCGCCC CCCGCCGCCC 270
0
CCTCCTTCCG CCAGGTGGGC CTCCCCGGGG TCGGCGTCCG GCTGGGGTTG AGGGCGGCCG 276
0
GGGGGAACCA GCGACATGCG GAGAGCAGCG CAGGCGACTC AGGGCGCTTC CCCCGCAGGT 282
0
GTCCTGCCTG AAGGAGCTGG TGGCCCGAGT GCTGCAGAGG CTGTGCGAGC GCGGCGCGAA 288
0
GAACGTGCTG GCCTTCGGCT TCGCGCTGCT GGACGGGGCC CGCGGGGGCC CCCCCGAGGC 294
0
CTTCACCACC AGCGTGCGCA GCTACCTGCC CAACACGGTG ACCGACGCAC TGCGGGGGAG 300
0
CGGGGCGTGG GGGCTGCTGC TGCGCCGCGT GGGCGACGAC GTGCTGGTTC ACCTGCTGGC 306
0
ACGCTGCGCG CTCTTTGTGC TGGTGGCTCC CAGCTGCGCC TACCAGGTGT GCGGGCCGCC 312
0
GCTGTACCAG CTCGGCGCTG CCACTCAGGC CCGGCCCCCG CCACACGCTA GTGGACCCCG 318
0
AAGGCGTCTG GGATGCGAAC GGGCCTGGAA CCATAGCGTC AGGGAGGCCG GGGTCCCCCT 324
0
GGGCCTGCCA GCCCCGGGTG CGAGGAGGCG CGGGGGCAGT GCCAGCCGAA GTCTGCCGTT 330
0
GCCCAAGAGG CCCAGGCGTG GCGCTGCCCC TGAGCCGGAG CGGACGCCCG TTGGGCAGGG 336
0
GTCCTGGGCC CACCCGGGCA GGACGCGTGG ACCGAGTGAC CGTGGTTTCT GTGTGGTGTC 342
0
ACCTGCCAGA CCCGCCGAAG AAGCCACCTC TTTGGAGGGT GCGCTCTCTG GCACGCGCCA 348
0
CTCCCACCCA TCCGTGGGCC GCCAGCACCA CGCGGGCCCC CCATCCACAT CGCGGCCACC 354
0
ACGTCCCTGG GACACGCCTT GTCCCCCGGT GTACGCCGAG ACCAAGCACT TCCTCTACTC 360
0
CTCAGGCGAC AAGGAGCAGC TGCGGCCCTC CTTCCTACTC AGCTCTCTGA GGCCCAGCCT 366
0
GACTGGCGCT CGGAGGCTCG TGGAGACCAT CTTTCTGGGT TCCAGGCCCT GGATGCCAGG 372
0
GACTCCCCGC AGGTTGCCCC GCCTGCCCCA GCGCTACTGG CAAATGCGGC CCCTGTTTCT 378
0
GGAGCTGCTT GGGAACCACG CGCAGTGCCC CTACGGGGTG CTCCTCAAGA CGCACTGCCC 384
0
GCTGCGAGCT GCGGTCACCC CAGCAGCCGG TGTCTGTGCC CGGGAGAAGC CCCAGGGCTC 390
0
TGTGGCGGCC CCCGAGGAGG AGGACACAGA CCCCCGTCGC CTGGTGCAGC TGCTCCGCCA 396
0
GCACAGCAGC CCCTGGCAGG TGTACGGCTT CGTGCGGGCC TGCCTGCGCC GGCTGGTGCC 402
0
CCCAGGCCTC TGGGGCTCCA GGCACAACGA ACGCCGCTTC CTCAGGAACA CCAAGAAGTT 408
0
CATCTCCCTG GGGAAGCATG CCAAGCTCTC GCTGCAGGAG CTGACGTGGA AGATGAGCGT 414
0
GCGGGACTGC GCTTGGCTGC GCAGGAGCCC AGGTGAGGAG GTGGTGGCCG TCGAGGGCCC 420
0
AGGCCCCAGA GCTGAATGCA GTAGGGGCTC AGAAAAGGGG GCAGGCAGAG CCCTGGTCCT 426
0
CCTGTCTCCA TCGTCACGTG GGCACACGTG GCTTTTCGCT CAGGACGTCG AGTGGACACG 432
0
GTGATCGAGG TCGAC 433
5
(2) INFORMATION FOR SEQ ID NO:7:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 240 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: intron
(B) LOCATION: 95..198
(D) OTHER INFORMATION: /note= "intron 1"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:7:
GGACCCGGCG GCTTTCCGCG CGCTGGTGGC CCAGTGCCTG GTGTGCGTGC CCTGGGACGC 6
0
ACGGCCGCCC CCCGCCGCCC CCTCCTTCCG CCAGGTGGGC CTCCCCGGGG TCGGCGTCCG 12
0
GCTGGGGTTG AGGGCGGCCG GGGGGAACCA GCGACATGCG GAGAGCAGCG CAGGCGACTC 18
0
AGGGCGCTTC CCCCGCAGGT GTCCTGCCTG AAGGAGCTGG TGGCCCGAGT GCTGCAGAGG 24
0
(2) INFORMATION FOR SEQ ID NO:8:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 389 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: nucleic acid
(B) LOCATION: 1..389
(D) OTHER INFORMATION: /note= "expressed sequence tag (EST)
AA281296"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:8:
GCCAAGTTCC TGCACTGGCT GATGAGTGTG TACGTCGTCG AGCTGCTCAG GTCTTTCTTT 6
0
TATGTCACGG AGACCACGTT TCAAAAGAAC AGGCTCTTTT TCTACCGGAA GAGTGTCTGG 12
0
AGCAAGTTGC AAAGCATTGG AATCAGACAG CACTTGAAGA GGGTGCAGCT GCGGGACGTG 18
0
TCGGAAGCAG AGGTCAGGCA GCATCGGGAA GCCAGGCCCG CCCTGCTGAC GTCCAGACTC 24
0
CGCTTCATCC CCAAGCCTGA CGGGCTGCGG CCGATTGTGA ACATGGACTA CGTCGTGGGA 30
0
GCCAGAACGT TCCGCAGAGA AAAGAGGGCC GAGCGTCTCA CCTCGAGGGT GAAGGCACTG 36
0
TTCAGCGTGC TCAACTACGA GCGGGCGCG 38
9
(2) INFORMATION FOR SEQ ID NO:9:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 182 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: nucleic acid
(B) LOCATION: 1..182
(D) OTHER INFORMATION: /note= "182 basepair sequence deleted i
n
clone 712562"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:9:
TCTACCTTGA CAGACCTCCA GCCGTACATG CGACAGTTCG TGGCTCACCT GCAGGAGACC 6
0
AGCCCGCTGA GGGATGCCGT CGTCATCGAG CAGAGCTCCT CCCTGAATGA GGCCAGCAGT 12
0
GGCCTCTTCG ACGTCTTCCT ACGCTTCATG TGCCACCACG CCGTGCGCAT CAGGGGCAAG 18
0
TC 18
2
(2) INFORMATION FOR SEQ ID NO:10:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 259 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(ix) FEATURE:
(A) NAME/KEY: Protein
(B) LOCATION: 1..259
(D) OTHER INFORMATION: /note= "protein encoded by clone 712562
"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:10:
Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr
1 5 10 15
Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg Lys Ser Val
20 25 30
Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His Leu Lys Arg Val
35 40 45
Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln His Arg Glu Ala
50 55 60
Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro Lys Pro Asp
65 70 75 80
Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val Gly Ala Arg Thr
85 90 95
Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg Val Lys Ala
100 105 110
Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro Gly Leu Leu
115 120 125
Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His Arg Ala Trp Arg Thr
130 135 140
Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro Glu Leu Tyr Phe
145 150 155 160
Val Lys Val Asp Val Thr Gly Ala Tyr Asp Thr Ile Pro Gln Asp Arg
165 170 175
Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln Asn Thr Tyr Cys
180 185 190
Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His Gly His Val Arg
195 200 205
Lys Ala Phe Lys Ser His Val Leu Arg Pro Val Pro Gly Asp Pro Ala
210 215 220
Gly Leu His Pro Leu His Ala Ala Leu Gln Pro Val Leu Arg Arg His
225 230 235 240
Gly Glu Gln Ala Val Cys Gly Asp Ser Ala Gly Arg Ala Ala Pro Ala
245 250 255
Phe Gly Gly
(2) INFORMATION FOR SEQ ID NO:11:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 2
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Leu or Ile"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 10
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Leu or Ile"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 11
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Leu or Ile"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 12
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Gln or Arg"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 28
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Phe or Tyr"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 29
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Phe or Tyr"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 31
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Lys or His"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:11:
Trp Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe Phe Trp
1 5 10 15
Xaa Thr Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Xaa Xaa
20 25 30
Xaa Trp
(2) INFORMATION FOR SEQ ID NO:12:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 2
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Leu or Ile"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 10
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Leu or Ile"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 11
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Leu or Ile"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 12
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Gln or Arg"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 29
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Phe or Tyr"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 30
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Phe or Tyr"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 32
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Lys or His"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:12:
Trp Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe Phe Trp
1 5 10 15
Xaa Thr Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Xaa
20 25 30
Xaa Xaa Trp
35
(2) INFORMATION FOR SEQ ID NO:13:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 129 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..129
(D) OTHER INFORMATION: /note= "TRT motifs from human"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:13:
Ala Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu
1 5 10 15
Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu
20 25 30
Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile
35 40 45
Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu
50 55 60
Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu
65 70 75 80
Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp
85 90 95
Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg
100 105 110
Leu Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg
115 120 125
Ala
(2) INFORMATION FOR SEQ ID NO:14:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 233 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..233
(D) OTHER INFORMATION: /note= "TRT motifs from
Schizosaccharomyces pombe tez1"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:14:
Ile Ser Glu Ile Glu Trp Leu Val Leu Gly Lys Arg Ser Asn Ala Lys
1 5 10 15
Met Cys Leu Ser Asp Phe Glu Lys Arg Lys Gln Ile Phe Ala Glu Phe
20 25 30
Ile Tyr Trp Leu Tyr Asn Ser Phe Ile Ile Pro Ile Leu Gln Ser Phe
35 40 45
Phe Tyr Ile Thr Glu Ser Ser Asp Leu Arg Asn Arg Thr Val Tyr Phe
50 55 60
Arg Lys Asp Ile Trp Lys Leu Leu Cys Arg Pro Phe Ile Thr Ser Met
65 70 75 80
Lys Met Glu Ala Phe Glu Lys Ile Asn Glu Asn Asn Val Arg Met Asp
85 90 95
Thr Gln Lys Thr Thr Leu Pro Pro Ala Val Ile Arg Leu Leu Pro Lys
100 105 110
Lys Asn Thr Phe Arg Leu Ile Thr Asn Leu Arg Lys Arg Phe Leu Ile
115 120 125
Lys Met Gly Ser Asn Lys Lys Met Leu Val Ser Thr Asn Gln Thr Leu
130 135 140
Arg Pro Val Ala Ser Ile Leu Lys His Leu Ile Asn Glu Glu Ser Ser
145 150 155 160
Gly Ile Pro Phe Asn Leu Glu Val Tyr Met Lys Leu Leu Thr Phe Lys
165 170 175
Lys Asp Leu Leu Lys His Arg Met Phe Gly Arg Lys Lys Tyr Phe Val
180 185 190
Arg Ile Asp Ile Lys Ser Cys Tyr Asp Arg Ile Lys Gln Asp Leu Met
195 200 205
Phe Arg Ile Val Lys Lys Lys Leu Lys Asp Pro Glu Phe Val Ile Arg
210 215 220
Lys Tyr Ala Thr Ile His Ala Thr Ser
225 230
(2) INFORMATION FOR SEQ ID NO:15:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 233 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..233
(D) OTHER INFORMATION: /note= "TRT motifs from Saccharomyces
cerevisiae EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:15:
Leu Lys Asp Phe Arg Trp Leu Phe Ile Ser Asp Ile Trp Phe Thr Lys
1 5 10 15
His Asn Phe Glu Asn Leu Asn Gln Leu Ala Ile Cys Phe Ile Ser Trp
20 25 30
Leu Phe Arg Gln Leu Ile Pro Lys Ile Ile Gln Thr Phe Phe Tyr Cys
35 40 45
Thr Glu Ile Ser Ser Thr Val Thr Ile Val Tyr Phe Arg His Asp Thr
50 55 60
Trp Asn Lys Leu Ile Thr Pro Phe Ile Val Glu Tyr Phe Lys Thr Tyr
65 70 75 80
Leu Val Glu Asn Asn Val Cys Arg Asn His Asn Ser Tyr Thr Leu Ser
85 90 95
Asn Phe Asn His Ser Lys Met Arg Ile Ile Pro Lys Lys Ser Asn Asn
100 105 110
Glu Phe Arg Ile Ile Ala Ile Pro Cys Arg Gly Ala Asp Glu Glu Glu
115 120 125
Phe Thr Ile Tyr Lys Glu Asn His Lys Asn Ala Ile Gln Pro Thr Gln
130 135 140
Lys Ile Leu Glu Tyr Leu Arg Asn Lys Arg Pro Thr Ser Phe Thr Lys
145 150 155 160
Ile Tyr Ser Pro Thr Gln Ile Ala Asp Arg Ile Lys Glu Phe Lys Gln
165 170 175
Arg Leu Leu Lys Lys Phe Asn Asn Val Leu Pro Glu Leu Tyr Phe Met
180 185 190
Lys Phe Asp Val Lys Ser Cys Tyr Asp Ser Ile Pro Arg Met Glu Cys
195 200 205
Met Arg Ile Leu Lys Asp Ala Leu Lys Asn Glu Asn Gly Phe Phe Val
210 215 220
Arg Ser Gln Tyr Phe Phe Asn Thr Asn
225 230
(2) INFORMATION FOR SEQ ID NO:16:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 233 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..233
(D) OTHER INFORMATION: /note= "TRT motifs from Euplotes
aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:16:
Thr Arg Glu Ile Ser Trp Met Gln Val Glu Thr Ser Ala Lys His Phe
1 5 10 15
Tyr Tyr Phe Asp His Glu Asn Ile Tyr Val Leu Trp Lys Leu Leu Arg
20 25 30
Trp Ile Phe Glu Asp Leu Val Val Ser Leu Ile Arg Cys Phe Phe Tyr
35 40 45
Val Thr Glu Gln Gln Lys Ser Tyr Ser Lys Thr Tyr Tyr Tyr Arg Lys
50 55 60
Asn Ile Trp Asp Val Ile Met Lys Met Ser Ile Ala Asp Leu Lys Lys
65 70 75 80
Glu Thr Leu Ala Glu Val Gln Glu Lys Glu Val Glu Glu Trp Lys Lys
85 90 95
Ser Leu Gly Phe Ala Pro Gly Lys Leu Arg Leu Ile Pro Lys Lys Thr
100 105 110
Thr Phe Arg Pro Ile Met Thr Phe Asn Lys Lys Ile Val Asn Ser Asp
115 120 125
Arg Lys Thr Thr Lys Leu Thr Thr Asn Thr Lys Leu Leu Asn Ser His
130 135 140
Leu Met Leu Lys Thr Leu Lys Asn Arg Met Phe Lys Asp Pro Phe Gly
145 150 155 160
Phe Ala Val Phe Asn Tyr Asp Asp Val Met Lys Lys Tyr Glu Glu Phe
165 170 175
Val Cys Lys Trp Lys Gln Val Gly Gln Pro Lys Leu Phe Phe Ala Thr
180 185 190
Met Asp Ile Glu Lys Cys Tyr Asp Ser Val Asn Arg Glu Lys Leu Ser
195 200 205
Thr Phe Leu Lys Thr Thr Lys Leu Leu Ser Ser Asp Phe Trp Ile Met
210 215 220
Thr Ala Gln Ile Leu Lys Arg Lys Asn
225 230
(2) INFORMATION FOR SEQ ID NO:17:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..4
(D) OTHER INFORMATION: /note= "consensus telomerase RT sequenc
e
from motif T"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 1
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = polar amino acid, Gly,
Ser, Thr, Tyr, Cys, Asn or Gln"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:17:
Xaa Phe Phe Tyr
1
(2) INFORMATION FOR SEQ ID NO:18:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 7 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..7
(D) OTHER INFORMATION: /note= "consensus telomerase RT sequenc
e
from motif 1"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 1
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 3
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:18:
Xaa Arg Xaa Ile Pro Lys Lys
1 5
(2) INFORMATION FOR SEQ ID NO:19:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..4
(D) OTHER INFORMATION: /note= "consensus telomerase RT sequenc
e
from motif 2"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 3
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:19:
Phe Arg Xaa Ile
1
(2) INFORMATION FOR SEQ ID NO:20:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..6
(D) OTHER INFORMATION: /note= "consensus telomerase RT sequenc
e
from motif A"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 2
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = charged amino acid, Asp,
Glu, His, Lys or Arg"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 6
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:20:
Pro Xaa Leu Tyr Phe Xaa
1 5
(2) INFORMATION FOR SEQ ID NO:21:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..6
(D) OTHER INFORMATION: /note= "consensus telomerase RT sequenc
e
from motif B’"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:21:
Gly Ile Pro Gln Gly Ser
1 5
(2) INFORMATION FOR SEQ ID NO:22:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..4
(D) OTHER INFORMATION: /note= "consensus telomerase RT sequenc
e
from motif C"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:22:
Leu Leu Arg Leu
1
(2) INFORMATION FOR SEQ ID NO:23:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 7 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..7
(D) OTHER INFORMATION: /note= "consensus telomerase RT sequenc
e
from motif C"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 5
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:23:
Asp Asp Phe Leu Xaa Ile Thr
1 5
(2) INFORMATION FOR SEQ ID NO:24:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 48 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..48
(D) OTHER INFORMATION: /note= "motif T peptide from
Schizosaccharomyces pombe TRT tez1p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:24:
Trp Leu Tyr Asn Ser Phe Ile Ile Pro Ile Leu Gln Ser Phe Phe Tyr
1 5 10 15
Ile Thr Glu Ser Ser Asp Leu Arg Asn Arg Thr Val Tyr Phe Arg Lys
20 25 30
Asp Ile Trp Lys Leu Leu Cys Arg Pro Phe Ile Thr Ser Met Lys Met
35 40 45
(2) INFORMATION FOR SEQ ID NO:25:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 54 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..54
(D) OTHER INFORMATION: /note= "motif 1 and 2 peptide from
Schizosaccharomyces pombe TRT tez1p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:25:
Asn Asn Val Arg Met Asp Thr Gln Lys Thr Thr Leu Pro Pro Ala Val
1 5 10 15
Ile Arg Leu Leu Pro Lys Lys Asn Thr Phe Arg Leu Ile Thr Asn Leu
20 25 30
Arg Lys Arg Phe Leu Ile Lys Met Gly Ser Asn Lys Lys Met Leu Val
35 40 45
Ser Thr Asn Gln Thr Leu
50
(2) INFORMATION FOR SEQ ID NO:26:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..34
(D) OTHER INFORMATION: /note= "motif A peptide from
Schizosaccharomyces pombe TRT tez1p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:26:
Phe Gly Arg Lys Lys Tyr Phe Val Arg Ile Asp Ile Lys Ser Cys Tyr
1 5 10 15
Asp Arg Ile Lys Gln Asp Leu Met Phe Arg Ile Val Lys Lys Lys Leu
20 25 30
Lys Asp
(2) INFORMATION FOR SEQ ID NO:27:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..35
(D) OTHER INFORMATION: /note= "motif B’ peptide from
Schizosaccharomyces pombe TRT tez1p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:27:
Ser Gln Tyr Leu Gln Lys Val Gly Ile Pro Gln Gly Ser Ile Leu Ser
1 5 10 15
Ser Phe Leu Cys His Phe Tyr Met Glu Asp Leu Ile Asp Glu Tyr Leu
20 25 30
Ser Phe Thr
35
(2) INFORMATION FOR SEQ ID NO:28:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 43 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..43
(D) OTHER INFORMATION: /note= "motif C and D peptide from
Schizosaccharomyces pombe TRT tez1p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:28:
Leu Leu Arg Val Val Asp Asp Phe Leu Phe Ile Thr Val Asn Lys Lys
1 5 10 15
Asp Ala Lys Lys Phe Leu Asn Leu Ser Leu Arg Gly Phe Glu Lys His
20 25 30
Asn Phe Ser Thr Ser Leu Glu Lys Thr Val Ile
35 40
(2) INFORMATION FOR SEQ ID NO:29:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..11
(D) OTHER INFORMATION: /note= "motif E peptide from
Schizosaccharomyces pombe TRT tez1p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:29:
Lys Lys Arg Met Pro Phe Phe Gly Phe Ser Val
1 5 10
(2) INFORMATION FOR SEQ ID NO:30:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 48 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..48
(D) OTHER INFORMATION: /note= "motif T peptide from human TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:30:
Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe Phe Tyr
1 5 10 15
Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg Lys
20 25 30
Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His Leu Lys
35 40 45
(2) INFORMATION FOR SEQ ID NO:31:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 54 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..54
(D) OTHER INFORMATION: /note= "motif 1 and 2 peptide from
human TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:31:
Glu Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg
1 5 10 15
Leu Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met
20 25 30
Asp Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu
35 40 45
Arg Leu Thr Ser Arg Val
50
(2) INFORMATION FOR SEQ ID NO:32:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..34
(D) OTHER INFORMATION: /note= "motif A peptide from human TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:32:
Pro Pro Pro Glu Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr
1 5 10 15
Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile
20 25 30
Lys Pro
(2) INFORMATION FOR SEQ ID NO:33:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..35
(D) OTHER INFORMATION: /note= "motif B’ peptide from human TR
T
"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:33:
Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln Gly Ser Ile Leu Ser
1 5 10 15
Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp Met Glu Asn Lys Leu Phe
20 25 30
Ala Gly Ile
35
(2) INFORMATION FOR SEQ ID NO:34:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 43 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..43
(D) OTHER INFORMATION: /note= "motif C and D peptide from
human TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:34:
Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr
1 5 10 15
His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr
20 25 30
Gly Cys Val Val Asn Leu Arg Lys Thr Val Val
35 40
(2) INFORMATION FOR SEQ ID NO:35:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..11
(D) OTHER INFORMATION: /note= "motif E peptide from human TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:35:
His Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu
1 5 10
(2) INFORMATION FOR SEQ ID NO:36:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 48 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..48
(D) OTHER INFORMATION: /note= "motif T peptide from Euplotes
aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:36:
Trp Ile Phe Glu Asp Leu Val Val Ser Leu Ile Arg Cys Phe Phe Tyr
1 5 10 15
Val Thr Glu Gln Gln Lys Ser Tyr Ser Lys Thr Tyr Tyr Tyr Arg Lys
20 25 30
Asn Ile Trp Asp Val Ile Met Lys Met Ser Ile Ala Asp Leu Lys Lys
35 40 45
(2) INFORMATION FOR SEQ ID NO:37:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 54 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..54
(D) OTHER INFORMATION: /note= "motif 1 and 2 peptide from
Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:37:
Lys Glu Val Glu Glu Trp Lys Lys Ser Leu Gly Phe Ala Pro Gly Lys
1 5 10 15
Leu Arg Leu Ile Pro Lys Lys Thr Thr Phe Arg Pro Ile Met Thr Phe
20 25 30
Asn Lys Lys Ile Val Asn Ser Asp Arg Lys Thr Thr Lys Leu Thr Thr
35 40 45
Asn Thr Lys Leu Leu Asn
50
(2) INFORMATION FOR SEQ ID NO:38:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..34
(D) OTHER INFORMATION: /note= "motif A peptide from Euplotes
aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:38:
Gly Gln Pro Lys Leu Phe Phe Ala Thr Met Asp Ile Glu Lys Cys Tyr
1 5 10 15
Asp Ser Val Asn Arg Glu Lys Leu Ser Thr Phe Leu Lys Thr Thr Lys
20 25 30
Leu Leu
(2) INFORMATION FOR SEQ ID NO:39:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..35
(D) OTHER INFORMATION: /note= "motif B’ peptide from Euplotes
aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:39:
Lys Phe Tyr Lys Gln Thr Lys Gly Ile Pro Gln Gly Leu Cys Val Ser
1 5 10 15
Ser Ile Leu Ser Ser Phe Tyr Tyr Ala Thr Leu Glu Glu Ser Ser Leu
20 25 30
Gly Phe Leu
35
(2) INFORMATION FOR SEQ ID NO:40:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 43 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..43
(D) OTHER INFORMATION: /note= "motif C and D peptide from
Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:40:
Leu Met Arg Leu Thr Asp Asp Tyr Leu Leu Ile Thr Thr Gln Glu Asn
1 5 10 15
Asn Ala Val Leu Phe Ile Glu Lys Leu Ile Asn Val Ser Arg Glu Asn
20 25 30
Gly Phe Lys Phe Asn Met Lys Lys Leu Gln Thr
35 40
(2) INFORMATION FOR SEQ ID NO:41:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..11
(D) OTHER INFORMATION: /note= "motif E peptide from Euplotes
aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:41:
Gln Asp Tyr Cys Asp Trp Ile Gly Ile Ser Ile
1 5 10
(2) INFORMATION FOR SEQ ID NO:42:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 47 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..47
(D) OTHER INFORMATION: /note= "motif T peptide from
Saccharomyces cerevisiae EST2p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:42:
Trp Leu Phe Arg Gln Leu Ile Pro Lys Ile Ile Gln Thr Phe Phe Tyr
1 5 10 15
Cys Thr Glu Ile Ser Ser Thr Val Thr Ile Val Tyr Phe Arg His Asp
20 25 30
Thr Trp Asn Lys Leu Ile Thr Pro Phe Ile Val Glu Tyr Phe Lys
35 40 45
(2) INFORMATION FOR SEQ ID NO:43:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..26
(D) OTHER INFORMATION: /note= "motif 1 peptide from
Saccharomyces cerevisiae EST2p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:43:
Cys Arg Asn His Asn Ser Tyr Thr Leu Ser Asn Phe Asn His Ser Lys
1 5 10 15
Met Arg Ile Ile Pro Lys Lys Ser Asn Asn
20 25
(2) INFORMATION FOR SEQ ID NO:44:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 29 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..29
(D) OTHER INFORMATION: /note= "motif 2 peptide from
Saccharomyces cerevisiae EST2p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:44:
Phe Arg Ile Ile Ala Ile Pro Cys Arg Gly Ala Asp Glu Glu Glu Phe
1 5 10 15
Thr Ile Tyr Lys Glu Asn His Lys Asn Ala Ile Gln Pro
20 25
(2) INFORMATION FOR SEQ ID NO:45:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..34
(D) OTHER INFORMATION: /note= "motif A peptide from
Saccharomyces cerevisiae EST2p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:45:
Val Leu Pro Glu Leu Tyr Phe Met Lys Phe Asp Val Lys Ser Cys Tyr
1 5 10 15
Asp Ser Ile Pro Arg Met Glu Cys Met Arg Ile Leu Lys Asp Ala Leu
20 25 30
Lys Asn
(2) INFORMATION FOR SEQ ID NO:46:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..35
(D) OTHER INFORMATION: /note= "motif B’ peptide from
Saccharomyces cerevisiae EST2p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:46:
Lys Cys Tyr Ile Arg Glu Asp Gly Leu Phe Gln Gly Ser Ser Leu Ser
1 5 10 15
Ala Pro Ile Val Asp Leu Val Tyr Asp Asp Leu Leu Glu Phe Tyr Ser
20 25 30
Glu Phe Lys
35
(2) INFORMATION FOR SEQ ID NO:47:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 43 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..43
(D) OTHER INFORMATION: /note= "motif C and D peptide from
Saccharomyces cerevisiae EST2p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:47:
Ile Leu Lys Leu Ala Asp Asp Phe Leu Ile Ile Ser Thr Asp Gln Gln
1 5 10 15
Gln Val Ile Asn Ile Lys Lys Leu Ala Met Gly Gly Phe Gln Lys Tyr
20 25 30
Asn Ala Lys Ala Asn Arg Asp Lys Ile Leu Ala
35 40
(2) INFORMATION FOR SEQ ID NO:48:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..11
(D) OTHER INFORMATION: /note= "motif E peptide from
Saccharomyces cerevisiae EST2p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:48:
Lys Glu Leu Glu Val Trp Lys His Ser Ser Thr
1 5 10
(2) INFORMATION FOR SEQ ID NO:49:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..4
(D) OTHER INFORMATION: /note= "consensus non-telomerase RT
sequence from motif B’"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 1
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:49:
Xaa Pro Gln Gly
1
(2) INFORMATION FOR SEQ ID NO:50:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..5
(D) OTHER INFORMATION: /note= "consensus non-telomerase RT
sequence from motif C"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 3
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 4
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 5
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:50:
Asp Asp Xaa Xaa Xaa
1 5
(2) INFORMATION FOR SEQ ID NO:51:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 55 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..55
(D) OTHER INFORMATION: /note= "motif 1 and 2 peptide from
Saccharomyces cerevisiae cytochrome
oxidase group II intron 1-encoded
mitochondrial protein"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:51:
Leu Ser Asn Glu Leu Gly Thr Gly Lys Phe Lys Phe Lys Pro Met Arg
1 5 10 15
Ile Val Asn Ile Pro Lys Pro Lys Gly Gly Ile Arg Pro Leu Ser Val
20 25 30
Gly Asn Pro Arg Asp Lys Ile Val Gln Glu Val Met Arg Met Ile Leu
35 40 45
Asp Thr Ile Phe Asp Lys Lys
50 55
(2) INFORMATION FOR SEQ ID NO:52:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..34
(D) OTHER INFORMATION: /note= "motif A peptide from
Saccharomyces cerevisiae cytochrome
oxidase group II intron 1-encoded
mitochondrial protein"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:52:
Phe Gly Gly Ser Asn Trp Phe Ile Glu Val Asp Leu Lys Lys Cys Phe
1 5 10 15
Asp Thr Ile Ser His Asp Leu Ile Ile Lys Glu Leu Lys Arg Tyr Ile
20 25 30
Ser Asp
(2) INFORMATION FOR SEQ ID NO:53:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..35
(D) OTHER INFORMATION: /note= "motif B’ peptide from
Saccharomyces cerevisiae cytochrome
oxidase group II intron 1-encoded
mitochondrial protein"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:53:
Thr Tyr His Lys Pro Met Leu Gly Leu Pro Gln Gly Ser Leu Ile Ser
1 5 10 15
Pro Ile Leu Cys Asn Ile Val Met Thr Leu Val Asp Asn Trp Leu Glu
20 25 30
Asp Tyr Ile
35
(2) INFORMATION FOR SEQ ID NO:54:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..17
(D) OTHER INFORMATION: /note= "motif C peptide from
Saccharomyces cerevisiae cytochrome
oxidase group II intron 1-encoded
mitochondrial protein"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:54:
Tyr Val Arg Tyr Ala Asp Asp Ile Leu Ile Gly Val Leu Gly Ser Lys
1 5 10 15
Asn
(2) INFORMATION FOR SEQ ID NO:55:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..25
(D) OTHER INFORMATION: /note= "motif D peptide from
Saccharomyces cerevisiae cytochrome
oxidase group II intron 1-encoded
mitochondrial protein"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:55:
Lys Met Ile Lys Arg Asp Leu Asn Asn Phe Leu Asn Ser Leu Gly Leu
1 5 10 15
Thr Ile Asn Glu Glu Lys Thr Leu Ile
20 25
(2) INFORMATION FOR SEQ ID NO:56:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..11
(D) OTHER INFORMATION: /note= "motif E peptide from
Saccharomyces cerevisiae cytochrome
oxidase group II intron 1-encoded
mitochondrial protein"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:56:
Glu Thr Pro Ala Arg Phe Leu Gly Tyr Asn Ile
1 5 10
(2) INFORMATION FOR SEQ ID NO:57:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..26
(D) OTHER INFORMATION: /note= "motif 1 peptide from
Drosophila melanogaster TART non-LTR
retrotransposable element reverse
transcriptase"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:57:
Ser Ile Leu Arg Ile Gly Tyr Tyr Pro Asp Ala Trp Lys His Ala Gln
1 5 10 15
Val Lys Met Ile Leu Lys Pro Gly Lys Ser
20 25
(2) INFORMATION FOR SEQ ID NO:58:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 29 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..29
(D) OTHER INFORMATION: /note= "motif 2 peptide from
Drosophila melanogaster TART non-LTR
retrotransposable element reverse
transcriptase"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:58:
Tyr Arg Pro Ile Ser Leu Leu Ser Gly Leu Ser Lys Met Phe Glu Arg
1 5 10 15
Leu Leu Leu Lys Arg Leu Phe Arg Val Asp Leu Phe Lys
20 25
(2) INFORMATION FOR SEQ ID NO:59:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..34
(D) OTHER INFORMATION: /note= "motif A peptide from
Drosophila melanogaster TART non-LTR
retrotransposable element reverse
transcriptase"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:59:
Arg Lys Glu Tyr Cys Ser Ala Val Phe Leu Asp Ile Ser Glu Ala Phe
1 5 10 15
Asp Arg Val Trp His Glu Gly Leu Leu Leu Lys Leu Ala Lys Ile Leu
20 25 30
Pro Tyr
(2) INFORMATION FOR SEQ ID NO:60:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..35
(D) OTHER INFORMATION: /note= "motif B’ peptide from
Drosophila melanogaster TART non-LTR
retrotransposable element reverse
transcriptase"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:60:
Arg Ala Gly Gln Ile Gly Ala Gly Val Pro Gln Gly Ser Asn Leu Gly
1 5 10 15
Pro Ile Leu Tyr Ser Ile Phe Ser Ser Asp Met Pro Leu Pro His Ile
20 25 30
Tyr His Pro
35
(2) INFORMATION FOR SEQ ID NO:61:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..17
(D) OTHER INFORMATION: /note= "motif C peptide from
Drosophila melanogaster TART non-LTR
retrotransposable element reverse
transcriptase"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:61:
Leu Ser Thr Tyr Ala Asp Asp Thr Ile Val Leu Ser Ser Asp Ile Leu
1 5 10 15
Ala
(2) INFORMATION FOR SEQ ID NO:62:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..26
(D) OTHER INFORMATION: /note= "motif D peptide from
Drosophila melanogaster TART non-LTR
retrotransposable element reverse
transcriptase"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:62:
Asn Glu Asn Tyr Leu Lys Thr Phe Ser Asp Trp Ala Asp Lys Trp Gly
1 5 10 15
Ile Ser Val Asn Ala Ala Lys Thr Gly His
20 25
(2) INFORMATION FOR SEQ ID NO:63:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..11
(D) OTHER INFORMATION: /note= "motif E peptide from
Drosophila melanogaster TART non-LTR
retrotransposable element reverse
transcriptase"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:63:
Glu Ser Lys Gln Ser Tyr Leu Gly Val Ile Leu
1 5 10
(2) INFORMATION FOR SEQ ID NO:64:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..26
(D) OTHER INFORMATION: /note= "motif 1 peptide from HIV-1
reverse transcriptase"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:64:
Glu Gly Lys Ile Ser Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro
1 5 10 15
Val Phe Ala Ile Lys Lys Lys Asp Ser Thr
20 25
(2) INFORMATION FOR SEQ ID NO:65:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 63 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..63
(D) OTHER INFORMATION: /note= "motif 2 and A peptide from HIV-
1
reverse transcriptase"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:65:
Trp Arg Lys Leu Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln Asp
1 5 10 15
Phe Trp Glu Val Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys Lys
20 25 30
Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Val
35 40 45
Pro Leu Asp Glu Asp Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro
50 55 60
(2) INFORMATION FOR SEQ ID NO:66:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 35
(D) OTHER INFORMATION: /note= "motif B’ peptide from HIV-1
reverse transcriptase"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:66:
Gly Ile Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser
1 5 10 15
Pro Ala Ile Phe Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Lys
20 25 30
Lys Gln Asn
35
(2) INFORMATION FOR SEQ ID NO:67:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..17
(D) OTHER INFORMATION: /note= "motif C peptide from HIV-1
reverse transcriptase"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:67:
Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile
1 5 10 15
Gly
(2) INFORMATION FOR SEQ ID NO:68:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 37 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..37
(D) OTHER INFORMATION: /note= "motif D and E peptide from HIV-
1
reverse transcriptase"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:68:
His Arg Thr Lys Ile Glu Glu Leu Arg Gln His Leu Leu Arg Trp Gly
1 5 10 15
Leu Thr Thr Pro Asp Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp
20 25 30
Met Gly Ile Thr Leu
35
(2) INFORMATION FOR SEQ ID NO:69:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..4
(D) OTHER INFORMATION: /note= "consensus telomerase RT finger
sequence from motif 1"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:69:
Ile Pro Lys Lys
1
(2) INFORMATION FOR SEQ ID NO:70:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..5
(D) OTHER INFORMATION: /note= "consensus telomerase RT palm,
primer grip sequence from motif C"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:70:
Leu Leu Leu Arg Leu
1 5
(2) INFORMATION FOR SEQ ID NO:71:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..4
(D) OTHER INFORMATION: /note= "consensus telomerase RT palm,
primer grip sequence from motif C"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:71:
Asp Asp Phe Leu
1
(2) INFORMATION FOR SEQ ID NO:72:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 43 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..43
(D) OTHER INFORMATION: /note= "telomerase specific motif T
peptide from human TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:72:
Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe Phe Tyr
1 5 10 15
Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg Lys
20 25 30
Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile
35 40
(2) INFORMATION FOR SEQ ID NO:73:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..5
(D) OTHER INFORMATION: /note= "telomerase specific motif T’
peptide from human TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:73:
Glu Ala Glu Val Arg
1 5
(2) INFORMATION FOR SEQ ID NO:74:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 16 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..16
(D) OTHER INFORMATION: /note= "telomerase RT finger motif
1 and 2 peptide from human TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:74:
Ser Arg Leu Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:75:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..17
(D) OTHER INFORMATION: /note= "telomerase RT finger motif A
peptide from human TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:75:
Pro Glu Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr Asp Thr
1 5 10 15
Ile
(2) INFORMATION FOR SEQ ID NO:76:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..22
(D) OTHER INFORMATION: /note= "telomerase RT finger motif B’
peptide from human TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:76:
Tyr Val Gln Cys Gln Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu
1 5 10 15
Leu Cys Ser Leu Cys Tyr
20
(2) INFORMATION FOR SEQ ID NO:77:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 13 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..13
(D) OTHER INFORMATION: /note= "telomerase RT palm, primer grip
motif C peptide from human TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:77:
Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr
1 5 10
(2) INFORMATION FOR SEQ ID NO:78:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 16 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..16
(D) OTHER INFORMATION: /note= "telomerase RT palm, primer grip
motif D peptide from human TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:78:
Gly Val Pro Glu Tyr Gly Cys Val Val Asn Leu Arg Lys Thr Val Val
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:79:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..11
(D) OTHER INFORMATION: /note= "telomerase RT palm, primer grip
motif E peptide from human TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:79:
Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu
1 5 10
(2) INFORMATION FOR SEQ ID NO:80:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 43 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..43
(D) OTHER INFORMATION: /note= "telomerase specific motif T
peptide from Schizosaccharomyces
pombe TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:80:
Trp Leu Tyr Asn Ser Phe Ile Ile Pro Ile Leu Gln Ser Phe Phe Tyr
1 5 10 15
Ile Thr Glu Ser Ser Asp Leu Arg Asn Arg Thr Val Tyr Phe Arg Lys
20 25 30
Asp Ile Trp Lys Leu Leu Cys Arg Pro Phe Ile
35 40
(2) INFORMATION FOR SEQ ID NO:81:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..5
(D) OTHER INFORMATION: /note= "telomerase specific motif T’
peptide from Schizosaccharomyces
pombe TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:81:
Glu Asn Asn Val Arg
1 5
(2) INFORMATION FOR SEQ ID NO:82:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 16 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..16
(D) OTHER INFORMATION: /note= "telomerase RT finger motif
1 and 2 peptide from Schizosaccharomyce
s
pombe TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:82:
Ala Val Ile Arg Leu Leu Pro Lys Lys Asn Thr Phe Arg Leu Ile Thr
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:83:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..17
(D) OTHER INFORMATION: /note= "telomerase RT finger motif A
peptide from Schizosaccharomyces
pombe TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:83:
Arg Lys Lys Tyr Phe Val Arg Ile Asp Ile Lys Ser Cys Tyr Asp Arg
1 5 10 15
Ile
(2) INFORMATION FOR SEQ ID NO:84:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..22
(D) OTHER INFORMATION: /note= "telomerase RT finger motif B’
peptide from Schizosaccharomyces
pombe TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:84:
Tyr Leu Gln Lys Val Gly Ile Pro Gln Gly Ser Ile Leu Ser Ser Phe
1 5 10 15
Leu Cys His Phe Tyr Met
20
(2) INFORMATION FOR SEQ ID NO:85:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 13 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..13
(D) OTHER INFORMATION: /note= "telomerase RT palm, primer grip
motif C peptide from Schizosaccharomyce
s
pombe TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:85:
Val Leu Leu Arg Val Val Asp Asp Phe Leu Phe Ile Thr
1 5 10
(2) INFORMATION FOR SEQ ID NO:86:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 16 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..16
(D) OTHER INFORMATION: /note= "telomerase RT palm, primer grip
motif D peptide from Schizosaccharomyce
s
pombe TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:86:
Gly Phe Glu Lys His Asn Phe Ser Thr Ser Leu Glu Lys Thr Val Ile
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:87:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..11
(D) OTHER INFORMATION: /note= "telomerase RT palm, primer grip
motif E peptide from Schizosaccharomyce
s
pombe TRT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:87:
Phe Phe Gly Phe Ser Val Asn Met Arg Ser Leu
1 5 10
(2) INFORMATION FOR SEQ ID NO:88:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 43 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..43
(D) OTHER INFORMATION: /note= "telomerase specific motif T
peptide from Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:88:
Trp Ile Phe Glu Asp Leu Val Val Ser Leu Ile Arg Cys Phe Phe Tyr
1 5 10 15
Val Thr Glu Gln Gln Lys Ser Tyr Ser Lys Thr Tyr Tyr Tyr Arg Lys
20 25 30
Asn Ile Trp Asp Val Ile Met Lys Met Ser Ile
35 40
(2) INFORMATION FOR SEQ ID NO:89:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..5
(D) OTHER INFORMATION: /note= "telomerase specific motif T’
peptide from Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:89:
Glu Lys Glu Val Glu
1 5
(2) INFORMATION FOR SEQ ID NO:90:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 16 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..16
(D) OTHER INFORMATION: /note= "telomerase RT finger motif
1 and 2 peptide from Euplotes
aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:90:
Gly Lys Leu Arg Leu Ile Pro Lys Lys Thr Thr Phe Arg Pro Ile Met
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:91:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..17
(D) OTHER INFORMATION: /note= "telomerase RT finger motif A
peptide from Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:91:
Pro Lys Leu Phe Phe Ala Thr Met Asp Ile Glu Lys Cys Tyr Asp Ser
1 5 10 15
Val
(2) INFORMATION FOR SEQ ID NO:92:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..22
(D) OTHER INFORMATION: /note= "telomerase RT finger motif B’
peptide from Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:92:
Tyr Lys Gln Thr Lys Gly Ile Pro Gln Gly Leu Cys Val Ser Ser Ile
1 5 10 15
Leu Ser Ser Phe Tyr Tyr
20
(2) INFORMATION FOR SEQ ID NO:93:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 13 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..13
(D) OTHER INFORMATION: /note= "telomerase RT palm, primer grip
motif C peptide from Euplotes
aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:93:
Leu Leu Met Arg Leu Thr Asp Asp Tyr Leu Leu Ile Thr
1 5 10
(2) INFORMATION FOR SEQ ID NO:94:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 16 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..16
(D) OTHER INFORMATION: /note= "telomerase RT palm, primer grip
motif D peptide from Euplotes
aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:94:
Val Ser Arg Glu Asn Gly Phe Lys Phe Asn Met Lys Lys Leu Gln Thr
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:95:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..11
(D) OTHER INFORMATION: /note= "telomerase RT palm, primer grip
motif E peptide from Euplotes
aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:95:
Trp Ile Gly Ile Ser Ile Asp Met Lys Thr Leu
1 5 10
(2) INFORMATION FOR SEQ ID NO:96:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..42
(D) OTHER INFORMATION: /note= "telomerase specific motif T
peptide from Saccharomyces
cerevisiae EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:96:
Trp Leu Phe Arg Gln Leu Ile Pro Lys Ile Ile Gln Thr Phe Phe Tyr
1 5 10 15
Cys Thr Glu Ile Ser Ser Thr Val Thr Ile Val Tyr Phe Arg His Asp
20 25 30
Thr Trp Asn Lys Leu Ile Thr Pro Phe Ile
35 40
(2) INFORMATION FOR SEQ ID NO:97:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..5
(D) OTHER INFORMATION: /note= "telomerase specific motif T’
peptide from Saccharomyces
cerevisiae EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:97:
Glu Asn Asn Val Cys
1 5
(2) INFORMATION FOR SEQ ID NO:98:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..11
(D) OTHER INFORMATION: /note= "telomerase RT finger motif 1
peptide from Saccharomyces
cerevisiae EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:98:
Ser Lys Met Arg Ile Ile Pro Lys Lys Ser Asn
1 5 10
(2) INFORMATION FOR SEQ ID NO:99:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..5
(D) OTHER INFORMATION: /note= "telomerase RT finger motif 2
peptide from Saccharomyces
cerevisiae EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:99:
Phe Arg Ile Ile Ala
1 5
(2) INFORMATION FOR SEQ ID NO:100:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..17
(D) OTHER INFORMATION: /note= "telomerase RT finger motif A
peptide from Saccharomyces
cerevisiae EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:100:
Pro Glu Leu Tyr Phe Met Lys Phe Asp Val Lys Ser Cys Tyr Asp Ser
1 5 10 15
Ile
(2) INFORMATION FOR SEQ ID NO:101:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..22
(D) OTHER INFORMATION: /note= "telomerase RT finger motif B’
peptide from Saccharomyces
cerevisiae EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:101:
Tyr Ile Arg Glu Asp Gly Leu Phe Gln Gly Ser Ser Leu Ser Ala Pro
1 5 10 15
Ile Val Asp Leu Val Tyr
20
(2) INFORMATION FOR SEQ ID NO:102:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 13 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..13
(D) OTHER INFORMATION: /note= "telomerase RT palm, primer grip
motif C peptide from Saccharomyces
cerevisiae EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:102:
Leu Ile Leu Lys Leu Ala Asp Asp Phe Leu Ile Ile Ser
1 5 10
(2) INFORMATION FOR SEQ ID NO:103:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 16 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..16
(D) OTHER INFORMATION: /note= "telomerase RT palm, primer grip
motif D peptide from Saccharomyces
cerevisiae EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:103:
Gly Phe Gln Lys Tyr Asn Ala Lys Ala Asn Arg Asp Lys Ile Leu Ala
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:104:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..11
(D) OTHER INFORMATION: /note= "telomerase RT palm, primer grip
motif E peptide from Saccharomyces
cerevisiae EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:104:
Trp Lys His Ser Ser Thr Met Asn Asn Phe His
1 5 10
(2) INFORMATION FOR SEQ ID NO:105:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 10 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: protein_bind
(B) LOCATION: 1..10
(D) OTHER INFORMATION: /note= "NFkappaB CS1 binding site motif
"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:105:
GGGRHTYYHC 1
0
(2) INFORMATION FOR SEQ ID NO:106:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: protein_bind
(B) LOCATION: 1..11
(D) OTHER INFORMATION: /note= "NFkappaB MHC I.2 binding
site motif"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:106:
TGGGCTTCCC C 1
1
(2) INFORMATION FOR SEQ ID NO:107:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: protein_bind
(B) LOCATION: 1..11
(D) OTHER INFORMATION: /note= "NFkappaB CS2 binding site motif
"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:107:
RGGGRMTYYC C 1
1
(2) INFORMATION FOR SEQ ID NO:108:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: protein_bind
(B) LOCATION: 1..18
(D) OTHER INFORMATION: /note= "topoisomerase II cleavage
site motif"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:108:
RNYNNCNNGY NGKTNYNY 1
8
(2) INFORMATION FOR SEQ ID NO:109:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 3279 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: 101..3196
(D) OTHER INFORMATION: /note= "Euplotes aediculatus 123 kDa
telomerase protein subunit (TRT)"
/codon= (seq: "tga", aa: Cys)
/product= "Euplotes aediculatus 123 kDa
telomerase protein subunit (TRT)"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:109:
AAAACCCCAA AACCCCAAAA CCCCTTTTAG AGCCCTGCAG TTGGAAATAT AACCTCAGTA 6
0
TTAATAAGCT CAGATTTTAA ATATTAATTA CAAAACCTAA ATG GAG GTT GAT GTT 11
5
Met Glu Val Asp Val
1 5
GAT AAT CAA GCT GAT AAT CAT GGC ATT CAC TCA GCT CTT AAG ACT TGT 16
3
Asp Asn Gln Ala Asp Asn His Gly Ile His Ser Ala Leu Lys Thr Cys
10 15 20
GAA GAA ATT AAA GAA GCT AAA ACG TTG TAC TCT TGG ATC CAG AAA GTT 21
1
Glu Glu Ile Lys Glu Ala Lys Thr Leu Tyr Ser Trp Ile Gln Lys Val
25 30 35
ATT AGA TGA AGA AAT CAA TCT CAA AGT CAT TAT AAA GAT TTA GAA GAT 25
9
Ile Arg Cys Arg Asn Gln Ser Gln Ser His Tyr Lys Asp Leu Glu Asp
40 45 50
ATT AAA ATA TTT GCG CAG ACA AAT ATT GTT GCT ACT CCA CGA GAC TAT 30
7
Ile Lys Ile Phe Ala Gln Thr Asn Ile Val Ala Thr Pro Arg Asp Tyr
55 60 65
AAT GAA GAA GAT TTT AAA GTT ATT GCA AGA AAA GAA GTA TTT TCA ACT 35
5
Asn Glu Glu Asp Phe Lys Val Ile Ala Arg Lys Glu Val Phe Ser Thr
70 75 80 85
GGA CTA ATG ATC GAA CTT ATT GAC AAA TGC TTA GTT GAA CTT CTT TCA 40
3
Gly Leu Met Ile Glu Leu Ile Asp Lys Cys Leu Val Glu Leu Leu Ser
90 95 100
TCA AGC GAT GTT TCA GAT AGA CAA AAA CTT CAA TGA TTT GGA TTT CAA 45
1
Ser Ser Asp Val Ser Asp Arg Gln Lys Leu Gln Cys Phe Gly Phe Gln
105 110 115
CTT AAG GGA AAT CAA TTA GCA AAG ACC CAT TTA TTA ACA GCT CTT TCA 49
9
Leu Lys Gly Asn Gln Leu Ala Lys Thr His Leu Leu Thr Ala Leu Ser
120 125 130
ACT CAA AAG CAG TAT TTC TTT CAA GAC GAA TGG AAC CAA GTT AGA GCA 54
7
Thr Gln Lys Gln Tyr Phe Phe Gln Asp Glu Trp Asn Gln Val Arg Ala
135 140 145
ATG ATT GGA AAT GAG CTC TTC CGA CAT CTC TAC ACT AAA TAT TTA ATA 59
5
Met Ile Gly Asn Glu Leu Phe Arg His Leu Tyr Thr Lys Tyr Leu Ile
150 155 160 165
TTC CAG CGA ACT TCT GAA GGA ACT CTT GTT CAA TTT TGC GGG AAT AAC 64
3
Phe Gln Arg Thr Ser Glu Gly Thr Leu Val Gln Phe Cys Gly Asn Asn
170 175 180
GTT TTT GAT CAT TTG AAA GTC AAC GAT AAG TTT GAC AAA AAG CAA AAA 69
1
Val Phe Asp His Leu Lys Val Asn Asp Lys Phe Asp Lys Lys Gln Lys
185 190 195
GGT GGA GCA GCA GAC ATG AAT GAA CCT CGA TGT TGA TCA ACC TGC AAA 73
9
Gly Gly Ala Ala Asp Met Asn Glu Pro Arg Cys Cys Ser Thr Cys Lys
200 205 210
TAC AAT GTC AAG AAT GAG AAA GAT CAC TTT CTC AAC AAC ATC AAC GTG 78
7
Tyr Asn Val Lys Asn Glu Lys Asp His Phe Leu Asn Asn Ile Asn Val
215 220 225
CCG AAT TGG AAT AAT ATG AAA TCA AGA ACC AGA ATA TTT TAT TGC ACT 83
5
Pro Asn Trp Asn Asn Met Lys Ser Arg Thr Arg Ile Phe Tyr Cys Thr
230 235 240 245
CAT TTT AAT AGA AAT AAC CAA TTC TTC AAA AAG CAT GAG TTT GTG AGT 88
3
His Phe Asn Arg Asn Asn Gln Phe Phe Lys Lys His Glu Phe Val Ser
250 255 260
AAC AAA AAC AAT ATT TCA GCG ATG GAC AGA GCT CAG ACG ATA TTC ACG 93
1
Asn Lys Asn Asn Ile Ser Ala Met Asp Arg Ala Gln Thr Ile Phe Thr
265 270 275
AAT ATA TTC AGA TTT AAT AGA ATT AGA AAG AAG CTA AAA GAT AAG GTT 97
9
Asn Ile Phe Arg Phe Asn Arg Ile Arg Lys Lys Leu Lys Asp Lys Val
280 285 290
ATC GAA AAA ATT GCC TAC ATG CTT GAG AAA GTC AAA GAT TTT AAC TTC 102
7
Ile Glu Lys Ile Ala Tyr Met Leu Glu Lys Val Lys Asp Phe Asn Phe
295 300 305
AAC TAC TAT TTA ACA AAA TCT TGT CCT CTT CCA GAA AAT TGG CGG GAA 107
5
Asn Tyr Tyr Leu Thr Lys Ser Cys Pro Leu Pro Glu Asn Trp Arg Glu
310 315 320 325
CGG AAA CAA AAA ATC GAA AAC TTG ATA AAT AAA ACT AGA GAA GAA AAG 112
3
Arg Lys Gln Lys Ile Glu Asn Leu Ile Asn Lys Thr Arg Glu Glu Lys
330 335 340
TCG AAG TAC TAT GAA GAG CTG TTT AGC TAC ACA ACT GAT AAT AAA TGC 117
1
Ser Lys Tyr Tyr Glu Glu Leu Phe Ser Tyr Thr Thr Asp Asn Lys Cys
345 350 355
GTC ACA CAA TTT ATT AAT GAA TTT TTC TAC AAT ATA CTC CCC AAA GAC 121
9
Val Thr Gln Phe Ile Asn Glu Phe Phe Tyr Asn Ile Leu Pro Lys Asp
360 365 370
TTT TTG ACT GGA AGA AAC CGT AAG AAT TTT CAA AAG AAA GTT AAG AAA 126
7
Phe Leu Thr Gly Arg Asn Arg Lys Asn Phe Gln Lys Lys Val Lys Lys
375 380 385
TAT GTG GAA CTA AAC AAG CAT GAA CTC ATT CAC AAA AAC TTA TTG CTT 131
5
Tyr Val Glu Leu Asn Lys His Glu Leu Ile His Lys Asn Leu Leu Leu
390 395 400 405
GAG AAG ATC AAT ACA AGA GAA ATA TCA TGG ATG CAG GTT GAG ACC TCT 136
3
Glu Lys Ile Asn Thr Arg Glu Ile Ser Trp Met Gln Val Glu Thr Ser
410 415 420
GCA AAG CAT TTT TAT TAT TTT GAT CAC GAA AAC ATC TAC GTC TTA TGG 141
1
Ala Lys His Phe Tyr Tyr Phe Asp His Glu Asn Ile Tyr Val Leu Trp
425 430 435
AAA TTG CTC CGA TGG ATA TTC GAG GAT CTC GTC GTC TCG CTG ATT AGA 145
9
Lys Leu Leu Arg Trp Ile Phe Glu Asp Leu Val Val Ser Leu Ile Arg
440 445 450
TGA TTT TTC TAT GTC ACC GAG CAA CAG AAA AGT TAC TCC AAA ACC TAT 150
7
Cys Phe Phe Tyr Val Thr Glu Gln Gln Lys Ser Tyr Ser Lys Thr Tyr
455 460 465
TAC TAC AGA AAG AAT ATT TGG GAC GTC ATT ATG AAA ATG TCA ATC GCA 155
5
Tyr Tyr Arg Lys Asn Ile Trp Asp Val Ile Met Lys Met Ser Ile Ala
470 475 480 485
GAC TTA AAG AAG GAA ACG CTT GCT GAG GTC CAA GAA AAA GAG GTT GAA 160
3
Asp Leu Lys Lys Glu Thr Leu Ala Glu Val Gln Glu Lys Glu Val Glu
490 495 500
GAA TGG AAA AAG TCG CTT GGA TTT GCA CCT GGA AAA CTC AGA CTA ATA 165
1
Glu Trp Lys Lys Ser Leu Gly Phe Ala Pro Gly Lys Leu Arg Leu Ile
505 510 515
CCG AAG AAA ACT ACT TTC CGT CCA ATT ATG ACT TTC AAT AAG AAG ATT 169
9
Pro Lys Lys Thr Thr Phe Arg Pro Ile Met Thr Phe Asn Lys Lys Ile
520 525 530
GTA AAT TCA GAC CGG AAG ACT ACA AAA TTA ACT ACA AAT ACG AAG TTA 174
7
Val Asn Ser Asp Arg Lys Thr Thr Lys Leu Thr Thr Asn Thr Lys Leu
535 540 545
TTG AAC TCT CAC TTA ATG CTT AAG ACA TTG AAG AAT AGA ATG TTT AAA 179
5
Leu Asn Ser His Leu Met Leu Lys Thr Leu Lys Asn Arg Met Phe Lys
550 555 560 565
GAT CCT TTT GGA TTC GCT GTT TTT AAC TAT GAT GAT GTA ATG AAA AAG 184
3
Asp Pro Phe Gly Phe Ala Val Phe Asn Tyr Asp Asp Val Met Lys Lys
570 575 580
TAT GAG GAG TTT GTT TGC AAA TGG AAG CAA GTT GGA CAA CCA AAA CTC 189
1
Tyr Glu Glu Phe Val Cys Lys Trp Lys Gln Val Gly Gln Pro Lys Leu
585 590 595
TTC TTT GCA ACT ATG GAT ATC GAA AAG TGA TAT GAT AGT GTA AAC AGA 193
9
Phe Phe Ala Thr Met Asp Ile Glu Lys Cys Tyr Asp Ser Val Asn Arg
600 605 610
GAA AAA CTA TCA ACA TTC CTA AAA ACT ACT AAA TTA CTT TCT TCA GAT 198
7
Glu Lys Leu Ser Thr Phe Leu Lys Thr Thr Lys Leu Leu Ser Ser Asp
615 620 625
TTC TGG ATT ATG ACT GCA CAA ATT CTA AAG AGA AAG AAT AAC ATA GTT 203
5
Phe Trp Ile Met Thr Ala Gln Ile Leu Lys Arg Lys Asn Asn Ile Val
630 635 640 645
ATC GAT TCG AAA AAC TTT AGA AAG AAA GAA ATG AAA GAT TAT TTT AGA 208
3
Ile Asp Ser Lys Asn Phe Arg Lys Lys Glu Met Lys Asp Tyr Phe Arg
650 655 660
CAG AAA TTC CAG AAG ATT GCA CTT GAA GGA GGA CAA TAT CCA ACC TTA 213
1
Gln Lys Phe Gln Lys Ile Ala Leu Glu Gly Gly Gln Tyr Pro Thr Leu
665 670 675
TTC AGT GTT CTT GAA AAT GAA CAA AAT GAC TTA AAT GCA AAG AAA ACA 217
9
Phe Ser Val Leu Glu Asn Glu Gln Asn Asp Leu Asn Ala Lys Lys Thr
680 685 690
TTA ATT GTT GAA GCA AAG CAA AGA AAT TAT TTT AAG AAA GAT AAC TTA 222
7
Leu Ile Val Glu Ala Lys Gln Arg Asn Tyr Phe Lys Lys Asp Asn Leu
695 700 705
CTT CAA CCA GTC ATT AAT ATT TGC CAA TAT AAT TAC ATT AAC TTT AAT 227
5
Leu Gln Pro Val Ile Asn Ile Cys Gln Tyr Asn Tyr Ile Asn Phe Asn
710 715 720 725
GGG AAG TTT TAT AAA CAA ACA AAA GGA ATT CCT CAA GGT CTT TGA GTT 232
3
Gly Lys Phe Tyr Lys Gln Thr Lys Gly Ile Pro Gln Gly Leu Cys Val
730 735 740
TCA TCA ATT TTG TCA TCA TTT TAT TAT GCA ACA TTA GAG GAA AGC TCC 237
1
Ser Ser Ile Leu Ser Ser Phe Tyr Tyr Ala Thr Leu Glu Glu Ser Ser
745 750 755
TTA GGA TTC CTT AGA GAT GAA TCA ATG AAC CCT GAA AAT CCA AAT GTT 241
9
Leu Gly Phe Leu Arg Asp Glu Ser Met Asn Pro Glu Asn Pro Asn Val
760 765 770
AAT CTT CTA ATG AGA CTT ACA GAT GAC TAT CTT TTG ATT ACA ACT CAA 246
7
Asn Leu Leu Met Arg Leu Thr Asp Asp Tyr Leu Leu Ile Thr Thr Gln
775 780 785
GAG AAT AAT GCA GTA TTG TTT ATT GAG AAA CTT ATA AAC GTA AGT CGT 251
5
Glu Asn Asn Ala Val Leu Phe Ile Glu Lys Leu Ile Asn Val Ser Arg
790 795 800 805
GAA AAT GGA TTT AAA TTC AAT ATG AAG AAA CTA CAG ACT AGT TTT CCA 256
3
Glu Asn Gly Phe Lys Phe Asn Met Lys Lys Leu Gln Thr Ser Phe Pro
810 815 820
TTA AGT CCA AGC AAA TTT GCA AAA TAC GGA ATG GAT AGT GTT GAG GAG 261
1
Leu Ser Pro Ser Lys Phe Ala Lys Tyr Gly Met Asp Ser Val Glu Glu
825 830 835
CAA AAT ATT GTT CAA GAT TAC TGC GAT TGG ATT GGC ATC TCA ATT GAT 265
9
Gln Asn Ile Val Gln Asp Tyr Cys Asp Trp Ile Gly Ile Ser Ile Asp
840 845 850
ATG AAA ACT CTT GCT TTA ATG CCA AAT ATT AAC TTG AGA ATA GAA GGA 270
7
Met Lys Thr Leu Ala Leu Met Pro Asn Ile Asn Leu Arg Ile Glu Gly
855 860 865
ATT CTG TGT ACA CTC AAT CTA AAC ATG CAA ACA AAG AAA GCA TCA ATG 275
5
Ile Leu Cys Thr Leu Asn Leu Asn Met Gln Thr Lys Lys Ala Ser Met
870 875 880 885
TGG CTC AAG AAG AAA CTA AAG TCG TTT TTA ATG AAT AAC ATT ACC CAT 280
3
Trp Leu Lys Lys Lys Leu Lys Ser Phe Leu Met Asn Asn Ile Thr His
890 895 900
TAT TTT AGA AAG ACG ATT ACA ACC GAA GAC TTT GCG AAT AAA ACT CTC 285
1
Tyr Phe Arg Lys Thr Ile Thr Thr Glu Asp Phe Ala Asn Lys Thr Leu
905 910 915
AAC AAG TTA TTT ATA TCA GGC GGT TAC AAA TAC ATG CAA TGA GCC AAA 289
9
Asn Lys Leu Phe Ile Ser Gly Gly Tyr Lys Tyr Met Gln Cys Ala Lys
920 925 930
GAA TAC AAG GAC CAC TTT AAG AAG AAC TTA GCT ATG AGC AGT ATG ATC 294
7
Glu Tyr Lys Asp His Phe Lys Lys Asn Leu Ala Met Ser Ser Met Ile
935 940 945
GAC TTA GAG GTA TCT AAA ATT ATA TAC TCT GTA ACC AGA GCA TTC TTT 299
5
Asp Leu Glu Val Ser Lys Ile Ile Tyr Ser Val Thr Arg Ala Phe Phe
950 955 960 965
AAA TAC CTT GTG TGC AAT ATT AAG GAT ACA ATT TTT GGA GAG GAG CAT 304
3
Lys Tyr Leu Val Cys Asn Ile Lys Asp Thr Ile Phe Gly Glu Glu His
970 975 980
TAT CCA GAC TTT TTC CTT AGC ACA CTG AAG CAC TTT ATT GAA ATA TTC 309
1
Tyr Pro Asp Phe Phe Leu Ser Thr Leu Lys His Phe Ile Glu Ile Phe
985 990 995
AGC ACA AAA AAG TAC ATT TTC AAC AGA GTT TGC ATG ATC CTC AAG GCA 313
9
Ser Thr Lys Lys Tyr Ile Phe Asn Arg Val Cys Met Ile Leu Lys Ala
1000 1005 1010
AAA GAA GCA AAG CTA AAA AGT GAC CAA TGT CAA TCT CTA ATT CAA TAT 318
7
Lys Glu Ala Lys Leu Lys Ser Asp Gln Cys Gln Ser Leu Ile Gln Tyr
1015 1020 1025
GAT GCA TAGTCGACTA TTCTAACTTA TTTTGGAAAG TTAATTTTCA ATTTTTGTCT 324
3
Asp Ala
1030
TATATACTGG GGTTTTGGGG TTTTGGGGTT TTGGGG 327
9
(2) INFORMATION FOR SEQ ID NO:110:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1031 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:110:
Met Glu Val Asp Val Asp Asn Gln Ala Asp Asn His Gly Ile His Ser
1 5 10 15
Ala Leu Lys Thr Cys Glu Glu Ile Lys Glu Ala Lys Thr Leu Tyr Ser
20 25 30
Trp Ile Gln Lys Val Ile Arg Cys Arg Asn Gln Ser Gln Ser His Tyr
35 40 45
Lys Asp Leu Glu Asp Ile Lys Ile Phe Ala Gln Thr Asn Ile Val Ala
50 55 60
Thr Pro Arg Asp Tyr Asn Glu Glu Asp Phe Lys Val Ile Ala Arg Lys
65 70 75 80
Glu Val Phe Ser Thr Gly Leu Met Ile Glu Leu Ile Asp Lys Cys Leu
85 90 95
Val Glu Leu Leu Ser Ser Ser Asp Val Ser Asp Arg Gln Lys Leu Gln
100 105 110
Cys Phe Gly Phe Gln Leu Lys Gly Asn Gln Leu Ala Lys Thr His Leu
115 120 125
Leu Thr Ala Leu Ser Thr Gln Lys Gln Tyr Phe Phe Gln Asp Glu Trp
130 135 140
Asn Gln Val Arg Ala Met Ile Gly Asn Glu Leu Phe Arg His Leu Tyr
145 150 155 160
Thr Lys Tyr Leu Ile Phe Gln Arg Thr Ser Glu Gly Thr Leu Val Gln
165 170 175
Phe Cys Gly Asn Asn Val Phe Asp His Leu Lys Val Asn Asp Lys Phe
180 185 190
Asp Lys Lys Gln Lys Gly Gly Ala Ala Asp Met Asn Glu Pro Arg Cys
195 200 205
Cys Ser Thr Cys Lys Tyr Asn Val Lys Asn Glu Lys Asp His Phe Leu
210 215 220
Asn Asn Ile Asn Val Pro Asn Trp Asn Asn Met Lys Ser Arg Thr Arg
225 230 235 240
Ile Phe Tyr Cys Thr His Phe Asn Arg Asn Asn Gln Phe Phe Lys Lys
245 250 255
His Glu Phe Val Ser Asn Lys Asn Asn Ile Ser Ala Met Asp Arg Ala
260 265 270
Gln Thr Ile Phe Thr Asn Ile Phe Arg Phe Asn Arg Ile Arg Lys Lys
275 280 285
Leu Lys Asp Lys Val Ile Glu Lys Ile Ala Tyr Met Leu Glu Lys Val
290 295 300
Lys Asp Phe Asn Phe Asn Tyr Tyr Leu Thr Lys Ser Cys Pro Leu Pro
305 310 315 320
Glu Asn Trp Arg Glu Arg Lys Gln Lys Ile Glu Asn Leu Ile Asn Lys
325 330 335
Thr Arg Glu Glu Lys Ser Lys Tyr Tyr Glu Glu Leu Phe Ser Tyr Thr
340 345 350
Thr Asp Asn Lys Cys Val Thr Gln Phe Ile Asn Glu Phe Phe Tyr Asn
355 360 365
Ile Leu Pro Lys Asp Phe Leu Thr Gly Arg Asn Arg Lys Asn Phe Gln
370 375 380
Lys Lys Val Lys Lys Tyr Val Glu Leu Asn Lys His Glu Leu Ile His
385 390 395 400
Lys Asn Leu Leu Leu Glu Lys Ile Asn Thr Arg Glu Ile Ser Trp Met
405 410 415
Gln Val Glu Thr Ser Ala Lys His Phe Tyr Tyr Phe Asp His Glu Asn
420 425 430
Ile Tyr Val Leu Trp Lys Leu Leu Arg Trp Ile Phe Glu Asp Leu Val
435 440 445
Val Ser Leu Ile Arg Cys Phe Phe Tyr Val Thr Glu Gln Gln Lys Ser
450 455 460
Tyr Ser Lys Thr Tyr Tyr Tyr Arg Lys Asn Ile Trp Asp Val Ile Met
465 470 475 480
Lys Met Ser Ile Ala Asp Leu Lys Lys Glu Thr Leu Ala Glu Val Gln
485 490 495
Glu Lys Glu Val Glu Glu Trp Lys Lys Ser Leu Gly Phe Ala Pro Gly
500 505 510
Lys Leu Arg Leu Ile Pro Lys Lys Thr Thr Phe Arg Pro Ile Met Thr
515 520 525
Phe Asn Lys Lys Ile Val Asn Ser Asp Arg Lys Thr Thr Lys Leu Thr
530 535 540
Thr Asn Thr Lys Leu Leu Asn Ser His Leu Met Leu Lys Thr Leu Lys
545 550 555 560
Asn Arg Met Phe Lys Asp Pro Phe Gly Phe Ala Val Phe Asn Tyr Asp
565 570 575
Asp Val Met Lys Lys Tyr Glu Glu Phe Val Cys Lys Trp Lys Gln Val
580 585 590
Gly Gln Pro Lys Leu Phe Phe Ala Thr Met Asp Ile Glu Lys Cys Tyr
595 600 605
Asp Ser Val Asn Arg Glu Lys Leu Ser Thr Phe Leu Lys Thr Thr Lys
610 615 620
Leu Leu Ser Ser Asp Phe Trp Ile Met Thr Ala Gln Ile Leu Lys Arg
625 630 635 640
Lys Asn Asn Ile Val Ile Asp Ser Lys Asn Phe Arg Lys Lys Glu Met
645 650 655
Lys Asp Tyr Phe Arg Gln Lys Phe Gln Lys Ile Ala Leu Glu Gly Gly
660 665 670
Gln Tyr Pro Thr Leu Phe Ser Val Leu Glu Asn Glu Gln Asn Asp Leu
675 680 685
Asn Ala Lys Lys Thr Leu Ile Val Glu Ala Lys Gln Arg Asn Tyr Phe
690 695 700
Lys Lys Asp Asn Leu Leu Gln Pro Val Ile Asn Ile Cys Gln Tyr Asn
705 710 715 720
Tyr Ile Asn Phe Asn Gly Lys Phe Tyr Lys Gln Thr Lys Gly Ile Pro
725 730 735
Gln Gly Leu Cys Val Ser Ser Ile Leu Ser Ser Phe Tyr Tyr Ala Thr
740 745 750
Leu Glu Glu Ser Ser Leu Gly Phe Leu Arg Asp Glu Ser Met Asn Pro
755 760 765
Glu Asn Pro Asn Val Asn Leu Leu Met Arg Leu Thr Asp Asp Tyr Leu
770 775 780
Leu Ile Thr Thr Gln Glu Asn Asn Ala Val Leu Phe Ile Glu Lys Leu
785 790 795 800
Ile Asn Val Ser Arg Glu Asn Gly Phe Lys Phe Asn Met Lys Lys Leu
805 810 815
Gln Thr Ser Phe Pro Leu Ser Pro Ser Lys Phe Ala Lys Tyr Gly Met
820 825 830
Asp Ser Val Glu Glu Gln Asn Ile Val Gln Asp Tyr Cys Asp Trp Ile
835 840 845
Gly Ile Ser Ile Asp Met Lys Thr Leu Ala Leu Met Pro Asn Ile Asn
850 855 860
Leu Arg Ile Glu Gly Ile Leu Cys Thr Leu Asn Leu Asn Met Gln Thr
865 870 875 880
Lys Lys Ala Ser Met Trp Leu Lys Lys Lys Leu Lys Ser Phe Leu Met
885 890 895
Asn Asn Ile Thr His Tyr Phe Arg Lys Thr Ile Thr Thr Glu Asp Phe
900 905 910
Ala Asn Lys Thr Leu Asn Lys Leu Phe Ile Ser Gly Gly Tyr Lys Tyr
915 920 925
Met Gln Cys Ala Lys Glu Tyr Lys Asp His Phe Lys Lys Asn Leu Ala
930 935 940
Met Ser Ser Met Ile Asp Leu Glu Val Ser Lys Ile Ile Tyr Ser Val
945 950 955 960
Thr Arg Ala Phe Phe Lys Tyr Leu Val Cys Asn Ile Lys Asp Thr Ile
965 970 975
Phe Gly Glu Glu His Tyr Pro Asp Phe Phe Leu Ser Thr Leu Lys His
980 985 990
Phe Ile Glu Ile Phe Ser Thr Lys Lys Tyr Ile Phe Asn Arg Val Cys
995 1000 1005
Met Ile Leu Lys Ala Lys Glu Ala Lys Leu Lys Ser Asp Gln Cys Gln
1010 1015 1020
Ser Leu Ile Gln Tyr Asp Ala
1025 1030
(2) INFORMATION FOR SEQ ID NO:111:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5544 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: join(959..1216, 1273..1353, 1425..1543,
1595..1857, 1894..2286, 2326..2396, 2436..2705,
2746..2862, 2914..3083, 3125..3309, 3356..3504,
3546..3759, 3797..4046, 4086..4252, 4296..4392,
4435..4597)
(D) OTHER INFORMATION: /note= "Schizosaccharomyces pombe
telomerase catalytic subunit (TRT)"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:111:
GGTACCGATT TACTTTCCTT TCTTCATAAG CTAATTGCTT CCTCGAACGC TCCTAAATCT 6
0
CTGGAAATAT TTTTACAAGA ACTCAATAAC AATACCAAGT CAAATTCCAA TATGAAGGTG 12
0
TTATTAGTGA TCGATAATAT TTCTATTTTA TCGGTCGTTA CCAAGTATAA GGACAAAAAG 18
0
AACAACTTCC TTCCCCCTAA AGACTTTTAC TTTATTAATT TACTTTTCAA ATATATTTCG 24
0
GGTTCGCTTA CTTTTAATCG TGGTACTGTT TTAGCTGCTA CTTCTAGCCA ACCGCGTGTT 30
0
TCTACCCCGT CATTGGATAT AGCTCTTGGA GTAGCTCACA GAAATCCTTA CAAATCTTCT 36
0
GATGAGACTA TATTAGATTC ATTACAGTCC GTGCATATTC TTAACATGGA GCCTTACACT 42
0
TTAGATGAGT CACGTCGCAT GATGGAGTAT TTGGTATCAT CCAACGTTTG CCTTGAAAAG 48
0
GTTGATAATT ATTTGCAAAA TCATGTCCTT AGTGGTGGTA ATCCGCGAAA GTTTTTTGAT 54
0
GCTTGCACAC GTCTAGCATG ATTGAGATAT TCAAAAATTT CTATCCACTA CAACTCCTTT 60
0
AACGCGGTTT TATTTTTCTA TTTTCTATTC TCATGTTGTT CCAAATATGT ATCATCTCGT 66
0
ATTAGGCTTT TTTCCGTTTT ACTCCTGGAA TCGTACCTTT TTCACTATTC CCCCTAATGA 72
0
ATAATCTAAA TTAGTTTCGC TTATAATTGA TAGTAGTAGA AAGATTGGTG ATTCTACTCG 78
0
TGTAATGTTA TTAGTTTAAA GATACTTTGC AAAACATTTA TTAGCTATCA TTATATAAAA 84
0
AAAATCCTAT AATTATAAAT ATTAATCAAT ATTTGCGGTC ACTATTTATT TAAAACGTTA 90
0
TGATCAGTAG GACACTTTGC ATATATATAG TTATGCTTAA TGGTTACTTG TAACTTGC 95
8
ATG ACC GAA CAC CAT ACC CCC AAA AGC AGG ATT CTT CGC TTT CTA GAG 100
6
Met Thr Glu His His Thr Pro Lys Ser Arg Ile Leu Arg Phe Leu Glu
1 5 10 15
AAT CAA TAT GTA TAC CTA TGT ACC TTA AAT GAT TAT GTA CAA CTT GTT 105
4
Asn Gln Tyr Val Tyr Leu Cys Thr Leu Asn Asp Tyr Val Gln Leu Val
20 25 30
TTG AGA GGG TCG CCG GCA AGC TCG TAT AGC AAT ATA TGC GAA CGC TTG 110
2
Leu Arg Gly Ser Pro Ala Ser Ser Tyr Ser Asn Ile Cys Glu Arg Leu
35 40 45
AGA AGC GAT GTA CAA ACG TCC TTT TCT ATT TTT CTT CAT TCG ACT GTA 115
0
Arg Ser Asp Val Gln Thr Ser Phe Ser Ile Phe Leu His Ser Thr Val
50 55 60
GTC GGC TTC GAC AGT AAG CCA GAT GAA GGT GTT CAA TTT TCT TCT CCA 119
8
Val Gly Phe Asp Ser Lys Pro Asp Glu Gly Val Gln Phe Ser Ser Pro
65 70 75 80
AAA TGC TCA CAG TCA GAG GTATATATAT TTTTGTTTTG ATTTTTTTCT 124
6
Lys Cys Ser Gln Ser Glu
85
ATTCGGGATA GCTAATATAT GGGCAG CTA ATA GCG AAT GTT GTA AAA CAG ATG 129
9
Leu Ile Ala Asn Val Val Lys Gln Met
90 95
TTC GAT GAA AGT TTT GAG CGT CGA AGG AAT CTA CTG ATG AAA GGG TTT 134
7
Phe Asp Glu Ser Phe Glu Arg Arg Arg Asn Leu Leu Met Lys Gly Phe
100 105 110
TCC ATG GTAAGGTATT CTAATTGTGA AATATTTACC TGCAATTACT GTTTCAAAGA 140
3
Ser Met
GATTGTATTT AACCGATAAA G AAT CAT GAA GAT TTT CGA GCC ATG CAT GTA 145
4
Asn His Glu Asp Phe Arg Ala Met His Val
115 120
AAC GGA GTA CAA AAT GAT CTC GTT TCT ACT TTT CCT AAT TAC CTT ATA 150
2
Asn Gly Val Gln Asn Asp Leu Val Ser Thr Phe Pro Asn Tyr Leu Ile
125 130 135
TCT ATA CTT GAG TCA AAA AAT TGG CAA CTT TTG TTA GAA AT 154
3
Ser Ile Leu Glu Ser Lys Asn Trp Gln Leu Leu Leu Glu Ile
140 145 150
GTAAATACCG GTTAAGATGT TGCGCACTTT GAACAAGACT GACAAGTATA G T ATC 159
8
Ile
GGC AGT GAT GCC ATG CAT TAC TTA TTA TCC AAA GGA AGT ATT TTT GAG 164
6
Gly Ser Asp Ala Met His Tyr Leu Leu Ser Lys Gly Ser Ile Phe Glu
155 160 165 170
GCT CTT CCA AAT GAC AAT TAC CTT CAG ATT TCT GGC ATA CCA CTT TTT 169
4
Ala Leu Pro Asn Asp Asn Tyr Leu Gln Ile Ser Gly Ile Pro Leu Phe
175 180 185
AAA AAT AAT GTG TTT GAG GAA ACT GTG TCA AAA AAA AGA AAG CGA ACC 174
2
Lys Asn Asn Val Phe Glu Glu Thr Val Ser Lys Lys Arg Lys Arg Thr
190 195 200
ATT GAA ACA TCC ATT ACT CAA AAT AAA AGC GCC CGC AAA GAA GTT TCC 179
0
Ile Glu Thr Ser Ile Thr Gln Asn Lys Ser Ala Arg Lys Glu Val Ser
205 210 215
TGG AAT AGC ATT TCA ATT AGT AGG TTT AGC ATT TTT TAC AGG TCA TCC 183
8
Trp Asn Ser Ile Ser Ile Ser Arg Phe Ser Ile Phe Tyr Arg Ser Ser
220 225 230
TAT AAG AAG TTT AAG CAA G GTAACTAATA CTGTTATCCT TCATAACTAA 188
7
Tyr Lys Lys Phe Lys Gln
235 240
TTTTAG AT CTA TAT TTT AAC TTA CAC TCT ATT TGT GAT CGG AAC ACA 193
4
Asp Leu Tyr Phe Asn Leu His Ser Ile Cys Asp Arg Asn Thr
245 250
GTA CAC ATG TGG CTT CAA TGG ATT TTT CCA AGG CAA TTT GGA CTT ATA 198
2
Val His Met Trp Leu Gln Trp Ile Phe Pro Arg Gln Phe Gly Leu Ile
255 260 265 270
AAC GCA TTT CAA GTG AAG CAA TTG CAC AAA GTG ATT CCA CTG GTA TCA 203
0
Asn Ala Phe Gln Val Lys Gln Leu His Lys Val Ile Pro Leu Val Ser
275 280 285
CAG AGT ACA GTT GTG CCC AAA CGT CTC CTA AAG GTA TAC CCT TTA ATT 207
8
Gln Ser Thr Val Val Pro Lys Arg Leu Leu Lys Val Tyr Pro Leu Ile
290 295 300
GAA CAA ACA GCA AAG CGA CTC CAT CGT ATT TCT CTA TCA AAA GTT TAC 212
6
Glu Gln Thr Ala Lys Arg Leu His Arg Ile Ser Leu Ser Lys Val Tyr
305 310 315
AAC CAT TAT TGC CCA TAT ATT GAC ACC CAC GAT GAT GAA AAA ATC CTT 217
4
Asn His Tyr Cys Pro Tyr Ile Asp Thr His Asp Asp Glu Lys Ile Leu
320 325 330
AGT TAT TCC TTA AAG CCG AAC CAG GTG TTT GCG TTT CTT CGA TCC ATT 222
2
Ser Tyr Ser Leu Lys Pro Asn Gln Val Phe Ala Phe Leu Arg Ser Ile
335 340 345 350
CTT GTT CGA GTG TTT CCT AAA TTA ATC TGG GGT AAC CAA AGG ATA TTT 227
0
Leu Val Arg Val Phe Pro Lys Leu Ile Trp Gly Asn Gln Arg Ile Phe
355 360 365
GAG ATA ATA TTA AAA G GTATTGTATA AAATTTATTA CCACTAACGA TTTTACCAG AC
2327
Glu Ile Ile Leu Lys Asp
370
CTC GAA ACT TTC TTG AAA TTA TCG AGA TAC GAG TCT TTT AGT TTA CAT 237
5
Leu Glu Thr Phe Leu Lys Leu Ser Arg Tyr Glu Ser Phe Ser Leu His
375 380 385
TAT TTA ATG AGT AAC ATA AAG GTAATATGCC AAATTTTTTT ACCATTAATT 242
6
Tyr Leu Met Ser Asn Ile Lys
390 395
AACAATCAG ATT TCA GAA ATT GAA TGG CTA GTC CTT GGA AAA AGG TCA 247
4
Ile Ser Glu Ile Glu Trp Leu Val Leu Gly Lys Arg Ser
400 405
AAT GCG AAA ATG TGC TTA AGT GAT TTT GAG AAA CGC AAG CAA ATA TTT 252
2
Asn Ala Lys Met Cys Leu Ser Asp Phe Glu Lys Arg Lys Gln Ile Phe
410 415 420
GCG GAA TTC ATC TAC TGG CTA TAC AAT TCG TTT ATA ATA CCT ATT TTA 257
0
Ala Glu Phe Ile Tyr Trp Leu Tyr Asn Ser Phe Ile Ile Pro Ile Leu
425 430 435 440
CAA TCT TTT TTT TAT ATC ACT GAA TCA AGT GAT TTA CGA AAT CGA ACT 261
8
Gln Ser Phe Phe Tyr Ile Thr Glu Ser Ser Asp Leu Arg Asn Arg Thr
445 450 455
GTT TAT TTT AGA AAA GAT ATT TGG AAA CTC TTG TGC CGA CCC TTT ATT 266
6
Val Tyr Phe Arg Lys Asp Ile Trp Lys Leu Leu Cys Arg Pro Phe Ile
460 465 470
ACA TCA ATG AAA ATG GAA GCG TTT GAA AAA ATA AAC GAG GTATTTTAAA 271
5
Thr Ser Met Lys Met Glu Ala Phe Glu Lys Ile Asn Glu
475 480 485
GTATTTTTTG CAAAAAGCTA ATATTTTCAG AAC AAT GTT AGG ATG GAT ACT CAG 276
9
Asn Asn Val Arg Met Asp Thr Gln
490
AAA ACT ACT TTG CCT CCA GCA GTT ATT CGT CTA TTA CCT AAG AAG AAT 281
7
Lys Thr Thr Leu Pro Pro Ala Val Ile Arg Leu Leu Pro Lys Lys Asn
495 500 505
ACC TTT CGT CTC ATT ACG AAT TTA AGA AAA AGA TTC TTA ATA AAG 286
2
Thr Phe Arg Leu Ile Thr Asn Leu Arg Lys Arg Phe Leu Ile Lys
510 515 520
GTATTAATTT TTGGTCATCA ATGTACTTTA CTTCTAATCT ATTATTAGCA G ATG GGT 291
9
Met Gly
525
TCA AAC AAA AAA ATG TTA GTC AGT ACG AAC CAA ACT TTA CGA CCT GTG 296
7
Ser Asn Lys Lys Met Leu Val Ser Thr Asn Gln Thr Leu Arg Pro Val
530 535 540
GCA TCG ATA CTG AAA CAT TTA ATC AAT GAA GAA AGT AGT GGT ATT CCA 301
5
Ala Ser Ile Leu Lys His Leu Ile Asn Glu Glu Ser Ser Gly Ile Pro
545 550 555
TTT AAC TTG GAG GTT TAC ATG AAG CTT CTT ACT TTT AAG AAG GAT CTT 306
3
Phe Asn Leu Glu Val Tyr Met Lys Leu Leu Thr Phe Lys Lys Asp Leu
560 565 570
CTT AAG CAC CGA ATG TTT GG GTAATTATAT AATGCGCGAT TCCTCATTAT 311
3
Leu Lys His Arg Met Phe Gly
575 580
TAATTTTGCA G G CGT AAG AAG TAT TTT GTA CGG ATA GAT ATA AAA TCC 316
1
Arg Lys Lys Tyr Phe Val Arg Ile Asp Ile Lys Ser
585 590
TGT TAT GAT CGA ATA AAG CAA GAT TTG ATG TTT CGG ATT GTT AAA AAG 320
9
Cys Tyr Asp Arg Ile Lys Gln Asp Leu Met Phe Arg Ile Val Lys Lys
595 600 605
AAA CTC AAG GAT CCC GAA TTT GTA ATT CGA AAG TAT GCA ACC ATA CAT 325
7
Lys Leu Lys Asp Pro Glu Phe Val Ile Arg Lys Tyr Ala Thr Ile His
610 615 620 625
GCA ACA AGT GAC CGA GCT ACA AAA AAC TTT GTT AGT GAG GCG TTT TCC 330
5
Ala Thr Ser Asp Arg Ala Thr Lys Asn Phe Val Ser Glu Ala Phe Ser
630 635 640
TAT T GTAAGTTTAT TTTTTCATTG GAATTTTTTA ACAAATTCTT TTTTAG TT 335
7
Tyr Phe
GAT ATG GTG CCT TTT GAA AAA GTC GTG CAG TTA CTT TCT ATG AAA ACA 340
5
Asp Met Val Pro Phe Glu Lys Val Val Gln Leu Leu Ser Met Lys Thr
645 650 655
TCA GAT ACT TTG TTT GTT GAT TTT GTG GAT TAT TGG ACC AAA AGT TCT 345
3
Ser Asp Thr Leu Phe Val Asp Phe Val Asp Tyr Trp Thr Lys Ser Ser
660 665 670 675
TCT GAA ATT TTT AAA ATG CTC AAG GAA CAT CTC TCT GGA CAC ATT GTT 350
1
Ser Glu Ile Phe Lys Met Leu Lys Glu His Leu Ser Gly His Ile Val
680 685 690
AAG GTATACCAAT TGTTGAATTG TAATAACACT AATGAAACTA G ATA GGA AAT 355
4
Lys Ile Gly Asn
695
TCT CAA TAC CTT CAA AAA GTT GGT ATC CCT CAG GGC TCA ATT CTG TCA 360
2
Ser Gln Tyr Leu Gln Lys Val Gly Ile Pro Gln Gly Ser Ile Leu Ser
700 705 710
TCT TTT TTG TGT CAT TTC TAT ATG GAA GAT TTG ATT GAT GAA TAC CTA 365
0
Ser Phe Leu Cys His Phe Tyr Met Glu Asp Leu Ile Asp Glu Tyr Leu
715 720 725
TCG TTT ACG AAA AAG AAA GGA TCA GTG TTG TTA CGA GTA GTC GAC GAT 369
8
Ser Phe Thr Lys Lys Lys Gly Ser Val Leu Leu Arg Val Val Asp Asp
730 735 740
TTC CTC TTT ATA ACA GTT AAT AAA AAG GAT GCA AAA AAA TTT TTG AAT 374
6
Phe Leu Phe Ile Thr Val Asn Lys Lys Asp Ala Lys Lys Phe Leu Asn
745 750 755
TTA TCT TTA AGA G GTGAGTTGCT GTCATTCCTA AGTTCTAACC GTTGAAG GA 379
8
Leu Ser Leu Arg Gly
760
TTT GAG AAA CAC AAT TTT TCT ACG AGC CTG GAG AAA ACA GTA ATA AAC 384
6
Phe Glu Lys His Asn Phe Ser Thr Ser Leu Glu Lys Thr Val Ile Asn
765 770 775 780
TTT GAA AAT AGT AAT GGG ATA ATA AAC AAT ACT TTT TTT AAT GAA AGC 389
4
Phe Glu Asn Ser Asn Gly Ile Ile Asn Asn Thr Phe Phe Asn Glu Ser
785 790 795
AAG AAA AGA ATG CCA TTC TTC GGT TTC TCT GTG AAC ATG AGG TCT CTT 394
2
Lys Lys Arg Met Pro Phe Phe Gly Phe Ser Val Asn Met Arg Ser Leu
800 805 810
GAT ACA TTG TTA GCA TGT CCT AAA ATT GAT GAA GCC TTA TTT AAC TCT 399
0
Asp Thr Leu Leu Ala Cys Pro Lys Ile Asp Glu Ala Leu Phe Asn Ser
815 820 825
ACA TCT GTA GAG CTG ACG AAA CAT ATG GGG AAA TCT TTT TTT TAC AAA 403
8
Thr Ser Val Glu Leu Thr Lys His Met Gly Lys Ser Phe Phe Tyr Lys
830 835 840
ATT CTA AG GTATACTGTG TAACTGAATA ATAGCTGACA AATAATCAG A TCG 408
9
Ile Leu Arg Ser
845
AGC CTT GCA TCC TTT GCA CAA GTA TTT ATT GAC ATT ACC CAC AAT TCA 413
7
Ser Leu Ala Ser Phe Ala Gln Val Phe Ile Asp Ile Thr His Asn Ser
850 855 860
AAA TTC AAT TCT TGC TGC AAT ATA TAT AGG CTA GGA TAC TCT ATG TGT 418
5
Lys Phe Asn Ser Cys Cys Asn Ile Tyr Arg Leu Gly Tyr Ser Met Cys
865 870 875 880
ATG AGA GCA CAA GCA TAC TTA AAA AGG ATG AAG GAT ATA TTT ATT CCC 423
3
Met Arg Ala Gln Ala Tyr Leu Lys Arg Met Lys Asp Ile Phe Ile Pro
885 890 895
CAA AGA ATG TTC ATA ACG G GTGAGTACTT ATTTTAACTA GAAAAGTCAT 428
2
Gln Arg Met Phe Ile Thr
900
TAATTAACCT TAG AT CTT TTG AAT GTT ATT GGA AGA AAA ATT TGG AAA 433
0
Asp Leu Leu Asn Val Ile Gly Arg Lys Ile Trp Lys
905 910
AAG TTG GCC GAA ATA TTA GGA TAT ACG AGT AGG CGT TTC TTG TCC TCT 437
8
Lys Leu Ala Glu Ile Leu Gly Tyr Thr Ser Arg Arg Phe Leu Ser Ser
915 920 925 930
GCA GAA GTC AAA TG GTACGTGTCG GTCTCGAGAC TTCAGCAATA TTGACACATC 443
2
Ala Glu Val Lys Trp
935
AG G CTT TTT TGT CTT GGA ATG AGA GAT GGT TTG AAA CCC TCT TTC AAA 448
0
Leu Phe Cys Leu Gly Met Arg Asp Gly Leu Lys Pro Ser Phe Lys
940 945 950
TAT CAT CCA TGC TTC GAA CAG CTA ATA TAC CAA TTT CAG TCA TTG ACT 452
8
Tyr His Pro Cys Phe Glu Gln Leu Ile Tyr Gln Phe Gln Ser Leu Thr
955 960 965
GAT CTT ATC AAG CCG CTA AGA CCA GTT TTG CGA CAG GTG TTA TTT TTA 457
6
Asp Leu Ile Lys Pro Leu Arg Pro Val Leu Arg Gln Val Leu Phe Leu
970 975 980
CAT AGA AGA ATA GCT GAT TAATGTCATT TTCAATTTAT TATATACATC 462
4
His Arg Arg Ile Ala Asp
985
CTTTATTACT GGTGTCTTAA ACAATATTAT TACTAAGTAT AGCTGACCCC CAAAGCAAGC 468
4
ATACTATAGG ATTTCTAGTA AAGTAAAATT AATCTCGTTA TTAGTTTTGA TTGACTTGTC 474
4
TTTATCCTTA TACTTTTAAG AAAGATTGAC AGTGGTTGCT GACTACTGCC CACATGCCCA 480
4
TTAAACGGGA GTGGTTAAAC ATTAAAAGTA ATACATGAGG CTAATCTCCT TTCATTTAGA 486
4
ATAAGGAAAG TGGTTTTCTA TAATGAATAA TGCCCGCACT AATGCAAAAA GACGAAGATT 492
4
ATCTTCTAAA CAAGGGGGAT TAAGCATATC CGAAGGAAAA GAGAGTAATA TACCCAGTGT 498
4
TGTTGAAGAA AGCAAGGATA ATTTGGAACA AGCTTCTGCA GATGACAGGC TAAATTTTGG 504
4
TGACCGAATT TTGGTAAAAG CCCCAGGTTA TCCATGGTGG CCGGCCTTGC TACTGAGACG 510
4
AAAAGAAACT AAGGATAGTT TGAATACTAA TAGCTCATTT AATGTCTTAT ATAAGGTTTT 516
4
GTTTTTTCCT GACTTCAATT TTGCATGGGT GAAAAGAAAT AGTGTTAAGC CATTATTGGA 522
4
TTCCGAAATA GCCAAATTTC TTGGTTCCTC AAAGCGGAAG TCTAAAGAAC TTATTGAAGC 528
4
TTATGAGGCT TCAAAAACTC CTCCTGATTT AAAGGAGGAA TCTTCCACCG ATGAGGAAAT 534
4
GGATAGCTTA TCAGCTGCTG AGGAGAAGCC TAATTTTTTG CAAAAAAGAA AATATCATTG 540
4
GGAGACATCT CTTGATGAAT CAGATGCGGA GAGTATCTCC AGCGGATCCT TGATGTCAAT 546
4
AACTTCTATT TCTGAAATGT ATGGTCCTAC TGTCGCTTCG ACTTCTCGTA GCTCTACGCA 552
4
GTTAAGTGAC CAAAGGTACC 554
4
(2) INFORMATION FOR SEQ ID NO:112:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 988 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:112:
Met Thr Glu His His Thr Pro Lys Ser Arg Ile Leu Arg Phe Leu Glu
1 5 10 15
Asn Gln Tyr Val Tyr Leu Cys Thr Leu Asn Asp Tyr Val Gln Leu Val
20 25 30
Leu Arg Gly Ser Pro Ala Ser Ser Tyr Ser Asn Ile Cys Glu Arg Leu
35 40 45
Arg Ser Asp Val Gln Thr Ser Phe Ser Ile Phe Leu His Ser Thr Val
50 55 60
Val Gly Phe Asp Ser Lys Pro Asp Glu Gly Val Gln Phe Ser Ser Pro
65 70 75 80
Lys Cys Ser Gln Ser Glu Leu Ile Ala Asn Val Val Lys Gln Met Phe
85 90 95
Asp Glu Ser Phe Glu Arg Arg Arg Asn Leu Leu Met Lys Gly Phe Ser
100 105 110
Met Asn His Glu Asp Phe Arg Ala Met His Val Asn Gly Val Gln Asn
115 120 125
Asp Leu Val Ser Thr Phe Pro Asn Tyr Leu Ile Ser Ile Leu Glu Ser
130 135 140
Lys Asn Trp Gln Leu Leu Leu Glu Ile Ile Gly Ser Asp Ala Met His
145 150 155 160
Tyr Leu Leu Ser Lys Gly Ser Ile Phe Glu Ala Leu Pro Asn Asp Asn
165 170 175
Tyr Leu Gln Ile Ser Gly Ile Pro Leu Phe Lys Asn Asn Val Phe Glu
180 185 190
Glu Thr Val Ser Lys Lys Arg Lys Arg Thr Ile Glu Thr Ser Ile Thr
195 200 205
Gln Asn Lys Ser Ala Arg Lys Glu Val Ser Trp Asn Ser Ile Ser Ile
210 215 220
Ser Arg Phe Ser Ile Phe Tyr Arg Ser Ser Tyr Lys Lys Phe Lys Gln
225 230 235 240
Asp Leu Tyr Phe Asn Leu His Ser Ile Cys Asp Arg Asn Thr Val His
245 250 255
Met Trp Leu Gln Trp Ile Phe Pro Arg Gln Phe Gly Leu Ile Asn Ala
260 265 270
Phe Gln Val Lys Gln Leu His Lys Val Ile Pro Leu Val Ser Gln Ser
275 280 285
Thr Val Val Pro Lys Arg Leu Leu Lys Val Tyr Pro Leu Ile Glu Gln
290 295 300
Thr Ala Lys Arg Leu His Arg Ile Ser Leu Ser Lys Val Tyr Asn His
305 310 315 320
Tyr Cys Pro Tyr Ile Asp Thr His Asp Asp Glu Lys Ile Leu Ser Tyr
325 330 335
Ser Leu Lys Pro Asn Gln Val Phe Ala Phe Leu Arg Ser Ile Leu Val
340 345 350
Arg Val Phe Pro Lys Leu Ile Trp Gly Asn Gln Arg Ile Phe Glu Ile
355 360 365
Ile Leu Lys Asp Leu Glu Thr Phe Leu Lys Leu Ser Arg Tyr Glu Ser
370 375 380
Phe Ser Leu His Tyr Leu Met Ser Asn Ile Lys Ile Ser Glu Ile Glu
385 390 395 400
Trp Leu Val Leu Gly Lys Arg Ser Asn Ala Lys Met Cys Leu Ser Asp
405 410 415
Phe Glu Lys Arg Lys Gln Ile Phe Ala Glu Phe Ile Tyr Trp Leu Tyr
420 425 430
Asn Ser Phe Ile Ile Pro Ile Leu Gln Ser Phe Phe Tyr Ile Thr Glu
435 440 445
Ser Ser Asp Leu Arg Asn Arg Thr Val Tyr Phe Arg Lys Asp Ile Trp
450 455 460
Lys Leu Leu Cys Arg Pro Phe Ile Thr Ser Met Lys Met Glu Ala Phe
465 470 475 480
Glu Lys Ile Asn Glu Asn Asn Val Arg Met Asp Thr Gln Lys Thr Thr
485 490 495
Leu Pro Pro Ala Val Ile Arg Leu Leu Pro Lys Lys Asn Thr Phe Arg
500 505 510
Leu Ile Thr Asn Leu Arg Lys Arg Phe Leu Ile Lys Met Gly Ser Asn
515 520 525
Lys Lys Met Leu Val Ser Thr Asn Gln Thr Leu Arg Pro Val Ala Ser
530 535 540
Ile Leu Lys His Leu Ile Asn Glu Glu Ser Ser Gly Ile Pro Phe Asn
545 550 555 560
Leu Glu Val Tyr Met Lys Leu Leu Thr Phe Lys Lys Asp Leu Leu Lys
565 570 575
His Arg Met Phe Gly Arg Lys Lys Tyr Phe Val Arg Ile Asp Ile Lys
580 585 590
Ser Cys Tyr Asp Arg Ile Lys Gln Asp Leu Met Phe Arg Ile Val Lys
595 600 605
Lys Lys Leu Lys Asp Pro Glu Phe Val Ile Arg Lys Tyr Ala Thr Ile
610 615 620
His Ala Thr Ser Asp Arg Ala Thr Lys Asn Phe Val Ser Glu Ala Phe
625 630 635 640
Ser Tyr Phe Asp Met Val Pro Phe Glu Lys Val Val Gln Leu Leu Ser
645 650 655
Met Lys Thr Ser Asp Thr Leu Phe Val Asp Phe Val Asp Tyr Trp Thr
660 665 670
Lys Ser Ser Ser Glu Ile Phe Lys Met Leu Lys Glu His Leu Ser Gly
675 680 685
His Ile Val Lys Ile Gly Asn Ser Gln Tyr Leu Gln Lys Val Gly Ile
690 695 700
Pro Gln Gly Ser Ile Leu Ser Ser Phe Leu Cys His Phe Tyr Met Glu
705 710 715 720
Asp Leu Ile Asp Glu Tyr Leu Ser Phe Thr Lys Lys Lys Gly Ser Val
725 730 735
Leu Leu Arg Val Val Asp Asp Phe Leu Phe Ile Thr Val Asn Lys Lys
740 745 750
Asp Ala Lys Lys Phe Leu Asn Leu Ser Leu Arg Gly Phe Glu Lys His
755 760 765
Asn Phe Ser Thr Ser Leu Glu Lys Thr Val Ile Asn Phe Glu Asn Ser
770 775 780
Asn Gly Ile Ile Asn Asn Thr Phe Phe Asn Glu Ser Lys Lys Arg Met
785 790 795 800
Pro Phe Phe Gly Phe Ser Val Asn Met Arg Ser Leu Asp Thr Leu Leu
805 810 815
Ala Cys Pro Lys Ile Asp Glu Ala Leu Phe Asn Ser Thr Ser Val Glu
820 825 830
Leu Thr Lys His Met Gly Lys Ser Phe Phe Tyr Lys Ile Leu Arg Ser
835 840 845
Ser Leu Ala Ser Phe Ala Gln Val Phe Ile Asp Ile Thr His Asn Ser
850 855 860
Lys Phe Asn Ser Cys Cys Asn Ile Tyr Arg Leu Gly Tyr Ser Met Cys
865 870 875 880
Met Arg Ala Gln Ala Tyr Leu Lys Arg Met Lys Asp Ile Phe Ile Pro
885 890 895
Gln Arg Met Phe Ile Thr Asp Leu Leu Asn Val Ile Gly Arg Lys Ile
900 905 910
Trp Lys Lys Leu Ala Glu Ile Leu Gly Tyr Thr Ser Arg Arg Phe Leu
915 920 925
Ser Ser Ala Glu Val Lys Trp Leu Phe Cys Leu Gly Met Arg Asp Gly
930 935 940
Leu Lys Pro Ser Phe Lys Tyr His Pro Cys Phe Glu Gln Leu Ile Tyr
945 950 955 960
Gln Phe Gln Ser Leu Thr Asp Leu Ile Lys Pro Leu Arg Pro Val Leu
965 970 975
Arg Gln Val Leu Phe Leu His Arg Arg Ile Ala Asp
980 985
(2) INFORMATION FOR SEQ ID NO:113:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 15 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:113:
CAAAACCCCA AAACC 1
5
(2) INFORMATION FOR SEQ ID NO:114:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 16 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:114:
GGGGTTTTGG GGTTTT 1
6
(2) INFORMATION FOR SEQ ID NO:115:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1762 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: nucleic acid
(B) LOCATION: 1..1762
(D) OTHER INFORMATION: /note= "gene encoding the 43 kDa
telomerase protein subunit from
Euplotes aediculatus"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:115:
CCCCAAAACC CCAAAACCCC AAAACCCCTA TAAAAAAAGA AAAAATTGAG GTAGTTTAGA 6
0
AATAAAATAT TATTCCCGCA CAAATGGAGA TGGATATTGA TTTGGATGAT ATAGAAAATT 12
0
TACTTCCTAA TACATTCAAC AAGTATAGCA GCTCTTGTAG TGACAAGAAA GGATGCAAAA 18
0
CATTGAAATC TGGCTCGAAA TCGCCTTCAT TGACTATTCC AAAGTTGCAA AAACAATTAG 24
0
AGTTCTACTT CTCGGATGCA AATCTTTATA ACGATTCTTT CTTGAGAAAA TTAGTTTTAA 30
0
AAAGCGGAGA GCAAAGAGTA GAAATTGAAA CATTACTAAT GTTTAAATAA AATCAGGTAA 36
0
TGAGGATTAT TCTATTTTTT AGATCACTTC TTAAGGAGCA TTATGGAGAA AATTACTTAA 42
0
TACTAAAAGG TAAACAGTTT GGATTATTTC CCTAGCCAAC AATGATGAGT ATATTAAATT 48
0
CATATGAGAA TGAGTCAAAG GATCTCGATA CATCAGACTT ACCAAAGACA AACTCGCTAT 54
0
AAAACGCAAG AAAAAGTTTG ATAATCGAAC AGCAGAAGAA CTTATTGCAT TTACTATTCG 60
0
TATGGGTTTT ATTACAATTG TTTTAGGTAT CGACGGTGAA CTCCCGAGTC TTGAGACAAT 66
0
TGAAAAAGCT GTTTACAACT GAAGGAATCG CAGTTCTGAA AGTTCTGATG TGTATGCCAT 72
0
TATTTTGTGA ATTAATCTCA AATATCTTAT CTCAATTTAA TGGATAGCTA TAGAAACAAA 78
0
CCAAATAAAC CATGCAAGTT TAATGGAATA TACGTTAAAT CCTTTGGGAC AAATGCACAC 84
0
TGAATTTATA TTGGATTCTT AAAGCATAGA TACACAGAAT GCTTTAGAGA CTGATTTAGC 90
0
TTACAACAGA TTACCTGTTT TGATTACTCT TGCTCATCTC TTATATCTTT AAAAGAAGCA 96
0
GGCGAAATGA AAAGAAGACT AAAGAAAGAG ATTTCAAAAT TTGTTGATTC TTCTGTAACC 102
0
GGAATTAACA ACAAGAATAT TAGCAACGAA AAAGAAGAAG AGCTATCACA ATCCTGATTC 108
0
TTAAAGATTT CAAAAATTCC AGGTAAGAGA GATACATTCA TTAAAATTCA TATATTATAG 114
0
TTTTTCATTT CACAGCTGTT ATTTTCTTTT ATCTTAACAA TATTTTTTGA TTAGCTGGAA 120
0
GTAAAAAGTA TCAAATAAGA GAAGCGCTAG ACTGAGGTAA CTTAGCTTAT TCACATTCAT 126
0
AGATCGACCT TCATATATCC AATACGATGA TAAGGAAACA GCAGTCATCC GTTTTAAAAA 132
0
TAGTGCTATG AGGACTAAAT TTTTAGAGTC AAGAAATGGA GCCGAAATCT TAATCAAAAA 138
0
GAATTGCGTC GATATTGCAA AAGAATCGAA CTCTAAATCT TTCGTTAATA AGTATTACCA 144
0
ATCTTGATTG ATTGAAGAGA TTGACGAGGC AACTGCACAG AAGATCATTA AAGAAATAAA 150
0
GTAACTTTTA TTAATTAGAG AATAAACTAA ATTACTAATA TAGAGATCAG CGATCTTCAA 156
0
TTGACGAAAT AAAAGCTGAA CTAAAGTTAG ACAATAAAAA ATACAAACCT TGGTCAAAAT 162
0
ATTGAGGAAG GAAAAGAAGA CCAGTTAGCA AAAGAAAAAA TAAGGCAATA AATAAAATGA 168
0
GTACAGAAGT GAAGAAATAA AAGATTTATT TTTTTCAATA ATTTATTGAA AAGAGGGGTT 174
0
TTGGGGTTTT GGGGTTTTGG GG 176
2
(2) INFORMATION FOR SEQ ID NO:116:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 10 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:116:
Pro Gln Asn Pro Lys Thr Pro Lys Pro Leu
1 5 10
(2) INFORMATION FOR SEQ ID NO:117:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:117:
Lys Lys Lys Lys Leu Arg
1 5
(2) INFORMATION FOR SEQ ID NO:118:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:118:
Phe Arg Asn Lys Ile Leu Phe Pro His Lys Trp Arg Trp Ile Leu Ile
1 5 10 15
Trp Met Ile
(2) INFORMATION FOR SEQ ID NO:119:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 41 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:119:
Lys Ile Tyr Phe Leu Ile His Ser Thr Ser Ile Ala Ala Leu Val Val
1 5 10 15
Thr Arg Lys Asp Ala Lys His Cys Asn Leu Ala Arg Asn Arg Leu His
20 25 30
Cys Leu Phe Gln Ser Cys Lys Asn Asn
35 40
(2) INFORMATION FOR SEQ ID NO:120:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:120:
Ser Ser Thr Ser Arg Met Gln Ile Phe Ile Thr Ile Leu Ser Cys Glu
1 5 10 15
Asn
(2) INFORMATION FOR SEQ ID NO:121:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:121:
Lys Ala Glu Ser Lys Glu
1 5
(2) INFORMATION FOR SEQ ID NO:122:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:122:
Lys Leu Lys His Tyr
1 5
(2) INFORMATION FOR SEQ ID NO:123:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:123:
Cys Leu Asn Lys Ile Arg
1 5
(2) INFORMATION FOR SEQ ID NO:124:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:124:
Cys Gly Leu Phe Tyr Phe Leu Asp His Phe Leu Arg Ser Ile Met Glu
1 5 10 15
Lys Ile Thr
(2) INFORMATION FOR SEQ ID NO:125:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 16 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:125:
Lys Val Asn Ser Leu Asp Tyr Phe Pro Ser Gln Gln Cys Cys Val Tyr
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:126:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 28 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:126:
Ile His Met Arg Met Ser Gln Arg Ile Ser Ile His Gln Thr Tyr Gln
1 5 10 15
Arg Gln Thr Arg Tyr Lys Thr Gln Glu Lys Val Cys
20 25
(2) INFORMATION FOR SEQ ID NO:127:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 56 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:127:
Ser Asn Ser Arg Arg Thr Tyr Cys Ile Tyr Tyr Ser Tyr Gly Phe Tyr
1 5 10 15
Tyr Asn Cys Phe Arg Tyr Arg Arg Cys Thr Pro Glu Ser Cys Asp Asn
20 25 30
Cys Lys Ser Cys Leu Gln Leu Lys Glu Ser Gln Phe Cys Lys Phe Cys
35 40 45
Cys Val Cys His Tyr Phe Val Asn
50 55
(2) INFORMATION FOR SEQ ID NO:128:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 134 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:128:
Ser Gln Ile Ser Tyr Leu Asn Leu Met Asp Ser Tyr Arg Asn Lys Pro
1 5 10 15
Asn Lys Pro Cys Lys Phe Asn Gly Ile Tyr Val Lys Ser Phe Gly Thr
20 25 30
Asn Ala His Cys Ile Tyr Ile Gly Phe Leu Lys His Arg Tyr Thr Glu
35 40 45
Cys Phe Arg Asp Cys Phe Ser Leu Gln Gln Ile Thr Cys Phe Asp Tyr
50 55 60
Ser Cys Ser Ser Leu Ile Ser Leu Lys Glu Ala Gly Glu Met Lys Arg
65 70 75 80
Arg Leu Lys Lys Glu Ile Ser Lys Phe Val Asp Ser Ser Val Thr Gly
85 90 95
Ile Asn Asn Lys Asn Ile Ser Asn Glu Lys Glu Glu Glu Leu Ser Gln
100 105 110
Ser Cys Phe Leu Lys Ile Ser Lys Ile Pro Gly Lys Arg Asp Thr Phe
115 120 125
Ile Lys Ile His Ile Leu
130
(2) INFORMATION FOR SEQ ID NO:129:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:129:
Phe Phe Ile Ser Gln Leu Leu Phe Ser Phe Ile Leu Thr Ile Phe Phe
1 5 10 15
Asp
(2) INFORMATION FOR SEQ ID NO:130:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 7 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:130:
Leu Glu Val Lys Ser Ile Lys
1 5
(2) INFORMATION FOR SEQ ID NO:131:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:131:
Thr Glu Val Thr
1
(2) INFORMATION FOR SEQ ID NO:132:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 15 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:132:
Leu Ile His Ile His Arg Ser Thr Phe Ile Tyr Pro Ile Arg Cys
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:133:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 7 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:133:
Gly Asn Ser Ser His Pro Phe
1 5
(2) INFORMATION FOR SEQ ID NO:134:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:134:
Cys Tyr Glu Asp
1
(2) INFORMATION FOR SEQ ID NO:135:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:135:
Ile Phe Arg Val Lys Lys Trp Ser Arg Asn Leu Asn Gln Lys Glu Leu
1 5 10 15
Arg Arg Tyr Cys Lys Arg Ile Glu Leu
20 25
(2) INFORMATION FOR SEQ ID NO:136:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:136:
Val Leu Pro Ile Leu Ile Asp Cys Arg Asp Cys Arg Gly Asn Cys Thr
1 5 10 15
Glu Asp His
(2) INFORMATION FOR SEQ ID NO:137:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 8 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:137:
Arg Asn Lys Val Thr Phe Ile Asn
1 5
(2) INFORMATION FOR SEQ ID NO:138:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 13 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:138:
Ile Thr Asn Ile Glu Ile Ser Asp Leu Gln Leu Thr Lys
1 5 10
(2) INFORMATION FOR SEQ ID NO:139:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:139:
Thr Ile Lys Asn Thr Asn Leu Gly Gln Asn Ile Glu Glu Gly Lys Glu
1 5 10 15
Asp Gln Leu Ala Lys Glu Lys Ile Arg Gln
20 25
(2) INFORMATION FOR SEQ ID NO:140:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:140:
Ile Lys Cys Val Gln Lys Cys Arg Asn Lys Arg Phe Ile Phe Phe Asn
1 5 10 15
Asn Leu Leu Lys Arg Gly Val Leu Gly Phe Trp Gly Phe Gly
20 25 30
(2) INFORMATION FOR SEQ ID NO:141:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:141:
Pro Lys Thr Pro Lys Pro Gln Asn Pro Tyr Lys Lys Arg Lys Asn Cys
1 5 10 15
Gly Ser Leu Glu Ile Lys Tyr Tyr Ser Arg Thr Asn Gly Asp Gly Tyr
20 25 30
Cys Phe Gly Cys Tyr Arg Lys Phe Thr Ser
35 40
(2) INFORMATION FOR SEQ ID NO:142:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:142:
Tyr Ile Gln Gln Val
1 5
(2) INFORMATION FOR SEQ ID NO:143:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 36 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:143:
Cys Gln Glu Arg Met Gln Asn Ile Glu Ile Trp Leu Glu Ile Ala Phe
1 5 10 15
Ile Asp Tyr Ser Lys Val Ala Lys Thr Ile Arg Val Leu Leu Leu Gly
20 25 30
Cys Lys Ser Leu
35
(2) INFORMATION FOR SEQ ID NO:144:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:144:
Arg Phe Phe Leu Glu Lys Ile Ser Phe Lys Lys Arg Arg Ala Lys Ser
1 5 10 15
Arg Asn Cys Asn Ile Thr Asn Val
20
(2) INFORMATION FOR SEQ ID NO:145:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:145:
Ile Lys Ser Gly Asn Glu Asp Tyr Ser Ile Phe
1 5 10
(2) INFORMATION FOR SEQ ID NO:146:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 12 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:146:
Gly Ala Leu Trp Arg Lys Leu Leu Asn Thr Lys Arg
1 5 10
(2) INFORMATION FOR SEQ ID NO:147:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 108 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:147:
Thr Val Trp Ile Ile Ser Leu Ala Asn Asn Asp Glu Tyr Ile Lys Phe
1 5 10 15
Ile Cys Glu Cys Val Lys Gly Ser Arg Tyr Ile Arg Leu Thr Lys Asp
20 25 30
Lys Leu Ala Ile Lys Arg Lys Lys Lys Phe Asp Asn Arg Thr Ala Glu
35 40 45
Glu Leu Ile Ala Phe Thr Ile Arg Met Gly Phe Ile Thr Ile Val Leu
50 55 60
Gly Ile Asp Gly Glu Leu Pro Ser Leu Glu Thr Ile Glu Lys Ala Val
65 70 75 80
Tyr Asn Cys Arg Asn Arg Ser Ser Glu Ser Ser Asp Val Tyr Ala Ile
85 90 95
Ile Leu Cys Ile Asn Leu Lys Tyr Leu Ile Ser Ile
100 105
(2) INFORMATION FOR SEQ ID NO:148:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 33 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:148:
Trp Ile Ala Ile Glu Thr Asn Gln Ile Asn His Ala Ser Leu Met Glu
1 5 10 15
Tyr Thr Leu Asn Pro Leu Gly Gln Met His Thr Glu Phe Ile Leu Asp
20 25 30
Ser
(2) INFORMATION FOR SEQ ID NO:149:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 29 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:149:
Ser Ile Asp Thr Gln Asn Ala Leu Glu Thr Asp Leu Ala Tyr Asn Arg
1 5 10 15
Leu Pro Val Leu Ile Thr Leu Ala His Leu Leu Tyr Leu
20 25
(2) INFORMATION FOR SEQ ID NO:150:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 9 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:150:
Lys Lys Gln Ala Lys Cys Lys Glu Asp
1 5
(2) INFORMATION FOR SEQ ID NO:151:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:151:
Arg Lys Arg Phe Gln Asn Leu Leu Ile Leu Leu
1 5 10
(2) INFORMATION FOR SEQ ID NO:152:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:152:
Pro Glu Leu Thr Thr Arg Ile Leu Ala Thr Lys Lys Lys Lys Ser Tyr
1 5 10 15
His Asn Pro Asp Ser
20
(2) INFORMATION FOR SEQ ID NO:153:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:153:
Arg Phe Gln Lys Phe Gln Val Arg Glu Ile His Ser Leu Lys Phe Ile
1 5 10 15
Tyr Tyr Ser Phe Ser Phe His Ser Cys Tyr Phe Leu Leu Ser
20 25 30
(2) INFORMATION FOR SEQ ID NO:154:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 8 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:154:
Gln Tyr Phe Leu Ile Ser Trp Lys
1 5
(2) INFORMATION FOR SEQ ID NO:155:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:155:
Lys Val Ser Asn Lys Arg Ser Ala Arg Leu Arg
1 5 10
(2) INFORMATION FOR SEQ ID NO:156:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 87 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:156:
Leu Ser Leu Phe Thr Phe Ile Asp Arg Pro Ser Tyr Ile Gln Tyr Asp
1 5 10 15
Asp Lys Glu Thr Ala Val Ile Arg Phe Lys Asn Ser Ala Met Arg Thr
20 25 30
Lys Phe Leu Glu Ser Arg Asn Gly Ala Glu Ile Leu Ile Lys Lys Asn
35 40 45
Cys Val Asp Ile Ala Lys Glu Ser Asn Ser Lys Ser Phe Val Asn Lys
50 55 60
Tyr Tyr Gln Ser Cys Leu Ile Glu Glu Ile Asp Glu Ala Thr Ala Gln
65 70 75 80
Lys Ile Ile Lys Glu Ile Lys
85
(2) INFORMATION FOR SEQ ID NO:157:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:157:
Leu Leu Leu Ile Arg Glu
1 5
(2) INFORMATION FOR SEQ ID NO:158:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:158:
Thr Lys Leu Leu Ile
1 5
(2) INFORMATION FOR SEQ ID NO:159:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:159:
Arg Ser Ala Ile Phe Asn Cys Arg Asn Lys Ser Cys Thr Lys Val Arg
1 5 10 15
Gln
(2) INFORMATION FOR SEQ ID NO:160:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 16 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:160:
Lys Ile Gln Thr Leu Val Lys Ile Leu Arg Lys Glu Lys Lys Thr Ser
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:161:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:161:
Gln Lys Lys Lys
1
(2) INFORMATION FOR SEQ ID NO:162:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 29 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:162:
Asn Glu Tyr Arg Ser Glu Glu Ile Lys Asp Leu Phe Phe Ser Ile Ile
1 5 10 15
Tyr Cys Lys Glu Gly Phe Trp Gly Phe Gly Val Leu Gly
20 25
(2) INFORMATION FOR SEQ ID NO:163:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:163:
Pro Lys Pro Gln Asn Pro Lys Thr Pro Ile Lys Lys Glu Lys Ile Glu
1 5 10 15
Val Val
(2) INFORMATION FOR SEQ ID NO:164:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 94 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:164:
Asn Ile Ile Pro Ala Gln Met Glu Met Asp Ile Asp Leu Asp Asp Ile
1 5 10 15
Glu Asn Leu Leu Pro Asn Thr Phe Asn Lys Tyr Ser Ser Ser Cys Ser
20 25 30
Asp Lys Lys Gly Cys Lys Thr Leu Lys Ser Gly Ser Lys Ser Pro Ser
35 40 45
Leu Thr Ile Pro Lys Leu Gln Lys Gln Leu Glu Phe Tyr Phe Ser Asp
50 55 60
Ala Asn Leu Tyr Asn Asp Ser Phe Leu Arg Lys Leu Val Leu Lys Ser
65 70 75 80
Gly Glu Gln Arg Val Glu Ile Glu Thr Leu Leu Met Phe Lys
85 90
(2) INFORMATION FOR SEQ ID NO:165:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:165:
Asn Gln Val Met Arg Ile Ile Leu Phe Phe Arg Ser Leu Leu Lys Glu
1 5 10 15
His Tyr Gly Glu Asn Tyr Leu Ile Leu Lys Gly Lys Gln Phe Gly Leu
20 25 30
Phe Pro
(2) INFORMATION FOR SEQ ID NO:166:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 28 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:166:
Pro Thr Met Met Ser Ile Leu Asn Ser Tyr Glu Asn Glu Ser Lys Asp
1 5 10 15
Leu Asp Thr Ser Asp Leu Pro Lys Thr Asn Ser Leu
20 25
(2) INFORMATION FOR SEQ ID NO:167:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:167:
Asn Ala Arg Lys Ser Leu Ile Ile Glu Gln Gln Lys Asn Leu Leu His
1 5 10 15
Leu Leu Phe Val Trp Val Leu Leu Gln Leu Phe
20 25
(2) INFORMATION FOR SEQ ID NO:168:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 46 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:168:
Val Ser Thr Val Asn Ser Arg Val Leu Arg Gln Leu Lys Lys Leu Phe
1 5 10 15
Thr Thr Glu Gly Ile Ala Val Leu Lys Val Leu Met Cys Met Pro Leu
20 25 30
Phe Cys Glu Leu Ile Ser Asn Ile Leu Ser Gln Phe Asn Gly
35 40 45
(2) INFORMATION FOR SEQ ID NO:169:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:169:
Lys Gln Thr Lys
1
(2) INFORMATION FOR SEQ ID NO:170:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:170:
Thr Met Gln Val
1
(2) INFORMATION FOR SEQ ID NO:171:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:171:
Trp Asn Ile Arg
1
(2) INFORMATION FOR SEQ ID NO:172:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 16 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:172:
Ile Leu Trp Asp Lys Cys Thr Leu Asn Leu Tyr Trp Ile Leu Lys Ala
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:173:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:173:
Ile His Arg Met Leu
1 5
(2) INFORMATION FOR SEQ ID NO:174:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:174:
Leu Thr Thr Asp Tyr Leu Phe Cys Leu Leu Leu Leu Ile Ser Tyr Ile
1 5 10 15
Phe Lys Arg Ser Arg Arg Asn Glu Lys Lys Thr Lys Glu Arg Asp Phe
20 25 30
Lys Ile Cys Cys Phe Phe Cys Asn Arg Asn
35 40
(2) INFORMATION FOR SEQ ID NO:175:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:175:
Gln Gln Glu Tyr
1
(2) INFORMATION FOR SEQ ID NO:176:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:176:
Gln Arg Lys Arg Arg Arg Ala Ile Thr Ile Leu Ile Leu Lys Asp Phe
1 5 10 15
Lys Asn Ser Arg
20
(2) INFORMATION FOR SEQ ID NO:177:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:177:
Glu Arg Tyr Ile His
1 5
(2) INFORMATION FOR SEQ ID NO:178:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 45 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:178:
Asn Ser Tyr Ile Ile Val Phe His Phe Thr Ala Val Ile Phe Phe Tyr
1 5 10 15
Leu Asn Asn Ile Phe Cys Leu Ala Gly Ser Lys Lys Tyr Gln Ile Arg
20 25 30
Glu Ala Leu Asp Cys Gly Asn Leu Ala Tyr Ser His Ser
35 40 45
(2) INFORMATION FOR SEQ ID NO:179:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:179:
Ile Asp Leu His Ile Ser Asn Thr Met Ile Arg Lys Gln Gln Ser Ser
1 5 10 15
Val Leu Lys Ile Val Leu Cys Gly Leu Asn Phe
20 25
(2) INFORMATION FOR SEQ ID NO:180:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 8 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:180:
Ser Gln Glu Met Glu Pro Lys Ser
1 5
(2) INFORMATION FOR SEQ ID NO:181:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 41 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:181:
Ser Lys Arg Ile Ala Ser Ile Leu Gln Lys Asn Arg Thr Leu Asn Leu
1 5 10 15
Ser Leu Ile Ser Ile Thr Asn Leu Asp Cys Leu Lys Arg Leu Thr Arg
20 25 30
Gln Leu His Arg Arg Ser Leu Lys Lys
35 40
(2) INFORMATION FOR SEQ ID NO:182:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:182:
Ser Asn Phe Tyr
1
(2) INFORMATION FOR SEQ ID NO:183:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 7 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:183:
Leu Glu Asn Lys Leu Asn Tyr
1 5
(2) INFORMATION FOR SEQ ID NO:184:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 53 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:184:
Tyr Arg Asp Gln Arg Ser Ser Ile Asp Glu Ile Lys Ala Glu Leu Lys
1 5 10 15
Leu Asp Asn Lys Lys Tyr Lys Pro Trp Ser Lys Tyr Cys Gly Arg Lys
20 25 30
Arg Arg Pro Val Ser Lys Arg Lys Asn Lys Ala Ile Asn Lys Met Ser
35 40 45
Thr Glu Val Lys Lys
50
(2) INFORMATION FOR SEQ ID NO:185:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:185:
Lys Ile Tyr Phe Phe Gln
1 5
(2) INFORMATION FOR SEQ ID NO:186:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 13 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:186:
Phe Ile Glu Lys Arg Gly Phe Gly Val Leu Gly Phe Trp
1 5 10
(2) INFORMATION FOR SEQ ID NO:187:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1007 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:187:
Glu Val Asp Val Asp Asn Gln Ala Asp Asn His Gly Ile His Ser Ala
1 5 10 15
Leu Lys Thr Cys Glu Glu Ile Lys Glu Ala Lys Thr Leu Tyr Ser Trp
20 25 30
Ile Gln Lys Val Ile Arg Cys Arg Asn Gln Ser Gln Ser His Tyr Lys
35 40 45
Asp Leu Glu Asp Ile Lys Ile Phe Ala Gln Thr Asn Ile Val Ala Thr
50 55 60
Pro Arg Asp Tyr Asn Glu Glu Asp Phe Lys Val Ile Ala Arg Lys Glu
65 70 75 80
Val Phe Ser Thr Gly Leu Met Ile Glu Leu Ile Asp Lys Cys Leu Val
85 90 95
Glu Leu Leu Ser Ser Ser Asp Val Ser Asp Arg Gln Lys Leu Gln Cys
100 105 110
Phe Gly Phe Gln Leu Lys Gly Asn Gln Leu Ala Lys Thr His Leu Leu
115 120 125
Thr Ala Leu Ser Thr Gln Lys Gln Tyr Phe Phe Gln Asp Glu Trp Asn
130 135 140
Gln Val Arg Ala Met Ile Gly Asn Glu Leu Phe Arg His Leu Tyr Thr
145 150 155 160
Lys Tyr Leu Ile Phe Gln Arg Thr Ser Glu Gly Thr Leu Val Gln Phe
165 170 175
Cys Gly Asn Asn Val Phe Asp His Leu Lys Val Asn Asp Lys Phe Asp
180 185 190
Lys Lys Gln Lys Gly Gly Ala Ala Asp Met Asn Glu Pro Arg Cys Cys
195 200 205
Ser Thr Cys Lys Tyr Asn Val Lys Asn Glu Lys Asp His Phe Leu Asn
210 215 220
Asn Ile Asn Val Pro Asn Trp Asn Asn Met Lys Ser Arg Thr Arg Ile
225 230 235 240
Phe Tyr Cys Thr His Phe Asn Arg Asn Asn Gln Phe Phe Lys Lys His
245 250 255
Glu Phe Val Ser Asn Lys Asn Asn Ile Ser Ala Met Asp Arg Ala Gln
260 265 270
Thr Ile Phe Thr Asn Ile Phe Arg Phe Asn Arg Ile Arg Lys Lys Leu
275 280 285
Lys Asp Lys Val Ile Glu Lys Ile Ala Tyr Met Leu Glu Lys Val Lys
290 295 300
Asp Phe Asn Phe Asn Tyr Tyr Leu Thr Lys Ser Cys Pro Leu Pro Glu
305 310 315 320
Asn Trp Arg Glu Arg Lys Gln Lys Ile Glu Asn Leu Ile Asn Lys Thr
325 330 335
Arg Glu Glu Lys Ser Lys Tyr Tyr Glu Glu Leu Phe Ser Tyr Thr Thr
340 345 350
Asp Asn Lys Cys Val Thr Gln Phe Ile Asn Glu Phe Phe Tyr Asn Ile
355 360 365
Leu Pro Lys Asp Phe Leu Thr Gly Arg Asn Arg Lys Asn Phe Gln Lys
370 375 380
Lys Val Lys Lys Tyr Val Glu Leu Asn Lys His Glu Leu Ile His Lys
385 390 395 400
Asn Leu Leu Leu Glu Lys Ile Asn Thr Arg Glu Ile Ser Trp Met Gln
405 410 415
Val Glu Thr Ser Ala Lys His Phe Tyr Tyr Phe Asp His Glu Asn Ile
420 425 430
Tyr Val Leu Trp Lys Leu Leu Arg Trp Ile Phe Glu Asp Leu Val Val
435 440 445
Ser Leu Ile Arg Cys Phe Phe Tyr Val Thr Glu Gln Gln Lys Ser Tyr
450 455 460
Ser Lys Thr Tyr Tyr Tyr Arg Lys Asn Ile Trp Asp Val Ile Met Lys
465 470 475 480
Met Ser Ile Ala Asp Leu Lys Lys Glu Thr Leu Ala Glu Val Gln Glu
485 490 495
Lys Glu Val Glu Glu Trp Lys Lys Ser Leu Gly Phe Ala Pro Gly Lys
500 505 510
Leu Arg Leu Ile Pro Lys Lys Thr Thr Phe Arg Pro Ile Met Thr Phe
515 520 525
Asn Lys Lys Ile Val Asn Ser Asp Arg Lys Thr Thr Lys Leu Thr Thr
530 535 540
Asn Thr Lys Leu Leu Asn Ser His Leu Met Leu Lys Thr Leu Lys Asn
545 550 555 560
Arg Met Phe Lys Asp Pro Phe Gly Phe Ala Val Phe Asn Tyr Asp Asp
565 570 575
Val Met Lys Lys Tyr Glu Glu Phe Val Cys Lys Trp Lys Gln Val Gly
580 585 590
Gln Pro Lys Leu Phe Phe Ala Thr Met Asp Ile Glu Lys Cys Tyr Asp
595 600 605
Ser Val Asn Arg Glu Lys Leu Ser Thr Phe Leu Lys Thr Thr Lys Leu
610 615 620
Leu Ser Ser Asp Phe Trp Ile Met Thr Ala Gln Ile Leu Lys Arg Lys
625 630 635 640
Asn Asn Ile Val Ile Asp Ser Lys Asn Phe Arg Lys Lys Glu Met Lys
645 650 655
Asp Tyr Phe Arg Gln Lys Phe Gln Lys Ile Ala Leu Glu Gly Gly Gln
660 665 670
Tyr Pro Thr Leu Phe Ser Val Leu Glu Asn Glu Gln Asn Asp Leu Asn
675 680 685
Ala Lys Lys Thr Leu Ile Val Glu Ala Lys Gln Arg Asn Tyr Phe Lys
690 695 700
Lys Asp Asn Leu Leu Gln Pro Val Ile Asn Ile Cys Gln Tyr Asn Tyr
705 710 715 720
Ile Asn Phe Asn Gly Lys Phe Tyr Lys Gln Thr Lys Gly Ile Pro Gln
725 730 735
Gly Leu Cys Val Ser Ser Ile Leu Ser Ser Phe Tyr Tyr Ala Thr Leu
740 745 750
Glu Glu Ser Ser Leu Gly Phe Leu Arg Asp Glu Ser Met Asn Pro Glu
755 760 765
Asn Pro Asn Val Asn Leu Leu Met Arg Leu Thr Asp Asp Tyr Leu Leu
770 775 780
Ile Thr Thr Gln Glu Asn Asn Ala Val Leu Phe Ile Glu Lys Leu Ile
785 790 795 800
Asn Val Ser Arg Glu Asn Gly Phe Lys Phe Asn Met Lys Lys Leu Gln
805 810 815
Thr Ser Phe Pro Leu Ser Pro Ser Lys Phe Ala Lys Tyr Gly Met Asp
820 825 830
Ser Val Glu Glu Gln Asn Ile Val Gln Asp Tyr Cys Asp Trp Ile Gly
835 840 845
Ile Ser Ile Asp Met Lys Thr Leu Ala Leu Met Pro Asn Ile Asn Leu
850 855 860
Arg Ile Glu Gly Ile Leu Cys Thr Leu Asn Leu Asn Met Gln Thr Lys
865 870 875 880
Lys Ala Ser Met Trp Leu Lys Lys Lys Leu Lys Ser Phe Leu Met Asn
885 890 895
Asn Ile Thr His Tyr Phe Arg Lys Thr Ile Thr Thr Glu Asp Phe Ala
900 905 910
Asn Lys Thr Leu Asn Lys Leu Phe Ile Ser Gly Gly Tyr Lys Tyr Met
915 920 925
Gln Cys Ala Lys Glu Tyr Lys Asp His Phe Lys Lys Asn Leu Ala Met
930 935 940
Ser Ser Met Ile Asp Leu Glu Val Ser Lys Ile Ile Tyr Ser Val Thr
945 950 955 960
Arg Ala Phe Phe Lys Tyr Leu Val Cys Asn Ile Lys Asp Thr Ile Phe
965 970 975
Gly Glu Glu His Tyr Pro Asp Phe Phe Leu Ser Thr Leu Lys His Phe
980 985 990
Ile Glu Ile Phe Ser Thr Lys Lys Tyr Ile Phe Asn Arg Val Cys
995 1000 1005
(2) INFORMATION FOR SEQ ID NO:188:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 699 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:188:
Glu Leu Glu Leu Glu Met Gln Glu Asn Gln Asn Asp Ile Gln Val Arg
1 5 10 15
Val Lys Ile Asp Asp Pro Lys Gln Tyr Leu Val Asn Val Thr Ala Ala
20 25 30
Cys Leu Leu Gln Glu Gly Ser Tyr Tyr Gln Asp Lys Asp Glu Arg Arg
35 40 45
Tyr Ile Ile Thr Lys Ala Leu Leu Glu Val Ala Glu Ser Asp Pro Glu
50 55 60
Phe Ile Cys Gln Leu Ala Val Tyr Ile Arg Asn Glu Leu Tyr Ile Arg
65 70 75 80
Thr Thr Thr Asn Tyr Ile Val Ala Phe Cys Val Val His Lys Asn Thr
85 90 95
Gln Pro Phe Ile Glu Lys Tyr Phe Asn Lys Ala Val Leu Leu Pro Asn
100 105 110
Asp Leu Leu Glu Val Cys Glu Phe Ala Gln Val Leu Tyr Ile Phe Asp
115 120 125
Ala Thr Glu Phe Lys Asn Leu Tyr Leu Asp Arg Ile Leu Ser Gln Asp
130 135 140
Ile Arg Lys Glu Leu Thr Phe Arg Lys Cys Leu Gln Arg Cys Val Arg
145 150 155 160
Ser Lys Phe Ser Glu Phe Asn Glu Tyr Gln Leu Gly Lys Tyr Cys Thr
165 170 175
Glu Ser Gln Arg Lys Lys Thr Met Phe Arg Tyr Leu Ser Val Thr Asn
180 185 190
Lys Gln Lys Trp Asp Gln Thr Lys Lys Lys Arg Lys Glu Asn Leu Leu
195 200 205
Thr Lys Leu Gln Ala Ile Lys Glu Ser Glu Asp Lys Ser Lys Arg Glu
210 215 220
Thr Gly Asp Ile Met Asn Val Glu Asp Ala Ile Lys Ala Leu Lys Pro
225 230 235 240
Ala Val Met Lys Lys Ile Ala Lys Arg Gln Asn Ala Met Lys Lys His
245 250 255
Met Lys Ala Pro Lys Ile Pro Asn Ser Thr Leu Glu Ser Lys Tyr Leu
260 265 270
Thr Phe Lys Asp Leu Ile Lys Phe Cys His Ile Ser Glu Pro Lys Glu
275 280 285
Arg Val Tyr Lys Ile Leu Gly Lys Lys Tyr Pro Lys Thr Glu Glu Glu
290 295 300
Tyr Lys Ala Ala Phe Gly Asp Ser Ala Ser Ala Pro Phe Asn Pro Glu
305 310 315 320
Leu Ala Gly Lys Arg Met Lys Ile Glu Ile Ser Lys Thr Trp Glu Asn
325 330 335
Glu Leu Ser Ala Lys Gly Asn Thr Ala Glu Val Trp Asp Asn Leu Ile
340 345 350
Ser Ser Asn Gln Leu Pro Tyr Met Ala Met Leu Arg Asn Leu Ser Asn
355 360 365
Ile Leu Lys Ala Gly Val Ser Asp Thr Thr His Ser Ile Val Ile Asn
370 375 380
Lys Ile Cys Glu Pro Lys Ala Val Glu Asn Ser Lys Met Phe Pro Leu
385 390 395 400
Gln Phe Phe Ser Ala Ile Glu Ala Val Asn Glu Ala Val Thr Lys Gly
405 410 415
Phe Lys Ala Lys Lys Arg Glu Asn Met Asn Leu Lys Gly Gln Ile Glu
420 425 430
Ala Val Lys Glu Val Val Glu Lys Thr Asp Glu Glu Lys Lys Asp Met
435 440 445
Glu Leu Glu Gln Thr Glu Glu Gly Glu Phe Val Lys Val Asn Glu Gly
450 455 460
Ile Gly Lys Gln Tyr Ile Asn Ser Ile Glu Leu Ala Ile Lys Ile Ala
465 470 475 480
Val Asn Lys Asn Leu Asp Glu Ile Lys Gly His Thr Ala Ile Phe Ser
485 490 495
Asp Val Ser Gly Ser Met Ser Thr Ser Met Ser Gly Gly Ala Lys Lys
500 505 510
Tyr Gly Ser Val Arg Thr Cys Leu Glu Cys Ala Leu Val Leu Gly Leu
515 520 525
Met Val Lys Gln Arg Cys Glu Lys Ser Ser Phe Tyr Ile Phe Ser Ser
530 535 540
Pro Ser Ser Gln Cys Asn Lys Cys Tyr Leu Glu Val Asp Leu Pro Gly
545 550 555 560
Asp Glu Leu Arg Pro Ser Met Gln Lys Leu Leu Gln Glu Lys Gly Lys
565 570 575
Leu Gly Gly Gly Thr Asp Phe Pro Tyr Glu Cys Ile Asp Glu Trp Thr
580 585 590
Lys Asn Lys Thr His Val Asp Asn Ile Val Ile Leu Ser Asp Met Met
595 600 605
Ile Ala Glu Gly Tyr Ser Asp Ile Asn Val Arg Gly Ser Ser Ile Val
610 615 620
Asn Ser Ile Lys Lys Tyr Lys Asp Glu Val Asn Pro Asn Ile Lys Ile
625 630 635 640
Phe Ala Val Asp Leu Glu Gly Tyr Gly Lys Cys Leu Asn Leu Gly Asp
645 650 655
Glu Phe Asn Glu Asn Asn Tyr Ile Lys Ile Phe Gly Met Ser Asp Ser
660 665 670
Ile Leu Lys Phe Ile Ser Ala Lys Gln Gly Gly Ala Asn Met Val Glu
675 680 685
Val Ile Lys Asn Phe Ala Leu Gln Lys Ile Gly
690 695
(2) INFORMATION FOR SEQ ID NO:189:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 897 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:189:
Leu Ser Thr Gln Lys Gln Tyr Phe Phe Gln Asp Glu Trp Asn Gln Val
1 5 10 15
Arg Ala Met Ile Gly Asn Glu Leu Phe Arg His Leu Tyr Thr Lys Tyr
20 25 30
Leu Ile Phe Gln Arg Thr Ser Glu Gly Thr Leu Val Gln Phe Cys Gly
35 40 45
Asn Asn Val Phe Asp His Leu Lys Val Asn Asp Lys Phe Asp Lys Lys
50 55 60
Gln Lys Gly Gly Ala Ala Asp Met Asn Glu Pro Arg Cys Cys Ser Thr
65 70 75 80
Cys Lys Tyr Asn Val Lys Asn Glu Lys Asp His Phe Leu Asn Asn Ile
85 90 95
Asn Val Pro Asn Trp Asn Asn Met Lys Ser Arg Thr Arg Ile Phe Tyr
100 105 110
Cys Thr His Phe Asn Arg Asn Asn Gln Phe Phe Lys Lys His Glu Phe
115 120 125
Val Ser Asn Lys Asn Asn Ile Ser Ala Met Asp Arg Ala Gln Thr Ile
130 135 140
Phe Thr Asn Ile Phe Arg Phe Asn Arg Ile Arg Lys Lys Leu Lys Asp
145 150 155 160
Lys Val Ile Glu Lys Ile Ala Tyr Met Leu Glu Lys Val Lys Asp Phe
165 170 175
Asn Phe Asn Tyr Tyr Leu Thr Lys Ser Cys Pro Leu Pro Glu Asn Trp
180 185 190
Arg Glu Arg Lys Gln Lys Ile Glu Asn Leu Ile Asn Lys Thr Arg Glu
195 200 205
Glu Lys Ser Lys Tyr Tyr Glu Glu Leu Phe Ser Tyr Thr Thr Asp Asn
210 215 220
Lys Cys Val Thr Gln Phe Ile Asn Glu Phe Phe Tyr Asn Ile Leu Pro
225 230 235 240
Lys Asp Phe Leu Thr Gly Arg Asn Arg Lys Asn Phe Gln Lys Lys Val
245 250 255
Lys Lys Tyr Val Glu Leu Asn Lys His Glu Leu Ile His Lys Asn Leu
260 265 270
Leu Leu Glu Lys Ile Asn Thr Arg Glu Ile Ser Trp Met Gln Val Glu
275 280 285
Thr Ser Ala Lys His Phe Tyr Tyr Phe Asp His Glu Asn Ile Tyr Val
290 295 300
Leu Trp Lys Leu Leu Arg Trp Ile Phe Glu Asp Leu Val Val Ser Leu
305 310 315 320
Ile Arg Cys Phe Phe Tyr Val Thr Glu Gln Gln Lys Ser Tyr Ser Lys
325 330 335
Thr Tyr Tyr Tyr Arg Lys Asn Ile Trp Asp Val Ile Met Lys Met Ser
340 345 350
Ile Ala Asp Leu Lys Lys Glu Thr Leu Ala Glu Val Gln Glu Lys Glu
355 360 365
Val Glu Glu Trp Lys Lys Ser Leu Gly Phe Ala Pro Gly Lys Leu Arg
370 375 380
Leu Ile Pro Lys Lys Thr Thr Phe Arg Pro Ile Met Thr Phe Asn Lys
385 390 395 400
Lys Ile Val Asn Ser Asp Arg Lys Thr Thr Lys Leu Thr Thr Asn Thr
405 410 415
Lys Leu Leu Asn Ser His Leu Met Leu Lys Thr Leu Lys Asn Arg Met
420 425 430
Phe Lys Asp Pro Phe Gly Phe Ala Val Phe Asn Tyr Asp Asp Val Met
435 440 445
Lys Lys Tyr Glu Glu Phe Val Cys Lys Trp Lys Gln Val Gly Gln Pro
450 455 460
Lys Leu Phe Phe Ala Thr Met Asp Ile Glu Lys Cys Tyr Asp Ser Val
465 470 475 480
Asn Arg Glu Lys Leu Ser Thr Phe Leu Lys Thr Thr Lys Leu Leu Ser
485 490 495
Ser Asp Phe Trp Ile Met Thr Ala Gln Ile Leu Lys Arg Lys Asn Asn
500 505 510
Ile Val Ile Asp Ser Lys Asn Phe Arg Lys Lys Glu Met Lys Asp Tyr
515 520 525
Phe Arg Gln Lys Phe Gln Lys Ile Ala Leu Glu Gly Gly Gln Tyr Pro
530 535 540
Thr Leu Phe Ser Val Leu Glu Asn Glu Gln Asn Asp Leu Asn Ala Lys
545 550 555 560
Lys Thr Leu Ile Val Glu Ala Lys Gln Arg Asn Tyr Phe Lys Lys Asp
565 570 575
Asn Leu Leu Gln Pro Val Ile Asn Ile Cys Gln Tyr Asn Tyr Ile Asn
580 585 590
Phe Asn Gly Lys Phe Tyr Lys Gln Thr Lys Gly Ile Pro Gln Gly Leu
595 600 605
Cys Val Ser Ser Ile Leu Ser Ser Phe Tyr Tyr Ala Thr Leu Glu Glu
610 615 620
Ser Ser Leu Gly Phe Leu Arg Asp Glu Ser Met Asn Pro Glu Asn Pro
625 630 635 640
Asn Val Asn Leu Leu Met Arg Leu Thr Asp Asp Tyr Leu Leu Ile Thr
645 650 655
Thr Gln Glu Asn Asn Ala Val Leu Phe Ile Glu Lys Leu Ile Asn Val
660 665 670
Ser Arg Glu Asn Gly Phe Lys Phe Asn Met Lys Lys Leu Gln Thr Ser
675 680 685
Phe Pro Leu Ser Pro Ser Lys Phe Ala Lys Tyr Gly Met Asp Ser Val
690 695 700
Glu Glu Gln Asn Ile Val Gln Asp Tyr Cys Asp Trp Ile Gly Ile Ser
705 710 715 720
Ile Asp Met Lys Thr Leu Ala Leu Met Pro Asn Ile Asn Leu Arg Ile
725 730 735
Glu Gly Ile Leu Cys Thr Leu Asn Leu Asn Met Gln Thr Lys Lys Ala
740 745 750
Ser Met Trp Leu Lys Lys Lys Leu Lys Ser Phe Leu Met Asn Asn Ile
755 760 765
Thr His Tyr Phe Arg Lys Thr Ile Thr Thr Glu Asp Phe Ala Asn Lys
770 775 780
Thr Leu Asn Lys Leu Phe Ile Ser Gly Gly Tyr Lys Tyr Met Gln Cys
785 790 795 800
Ala Lys Glu Tyr Lys Asp His Phe Lys Lys Asn Leu Ala Met Ser Ser
805 810 815
Met Ile Asp Leu Glu Val Ser Lys Ile Ile Tyr Ser Val Thr Arg Ala
820 825 830
Phe Phe Lys Tyr Leu Val Cys Asn Ile Lys Asp Thr Ile Phe Gly Glu
835 840 845
Glu His Tyr Pro Asp Phe Phe Leu Ser Thr Leu Lys His Phe Ile Glu
850 855 860
Ile Phe Ser Thr Lys Lys Tyr Ile Phe Asn Arg Val Cys Met Ile Leu
865 870 875 880
Lys Ala Lys Glu Ala Lys Leu Lys Ser Asp Gln Cys Gln Ser Leu Ile
885 890 895
Gln
(2) INFORMATION FOR SEQ ID NO:190:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 840 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:190:
Met Ser Arg Arg Asn Gln Lys Lys Pro Gln Ala Pro Ile Gly Asn Glu
1 5 10 15
Thr Asn Leu Asp Phe Val Leu Gln Asn Leu Glu Val Tyr Lys Ser Gln
20 25 30
Ile Glu His Tyr Lys Thr Gln Gln Gln Gln Ile Lys Glu Glu Asp Leu
35 40 45
Lys Leu Leu Lys Phe Lys Asn Gln Asp Gln Asp Gly Asn Ser Gly Asn
50 55 60
Asp Asp Asp Asp Glu Glu Asn Asn Ser Asn Lys Gln Gln Glu Leu Leu
65 70 75 80
Arg Arg Val Asn Gln Ile Lys Gln Gln Val Gln Leu Ile Lys Lys Val
85 90 95
Gly Ser Lys Val Glu Lys Asp Leu Asn Leu Asn Glu Asp Glu Asn Lys
100 105 110
Lys Asn Gly Leu Ser Glu Gln Gln Val Lys Glu Glu Gln Leu Arg Thr
115 120 125
Ile Thr Glu Glu Gln Val Lys Tyr Gln Asn Leu Val Phe Asn Met Asp
130 135 140
Tyr Gln Leu Asp Leu Asn Glu Ser Gly Gly His Arg Arg His Arg Arg
145 150 155 160
Glu Thr Asp Tyr Asp Thr Glu Lys Trp Phe Glu Ile Ser His Asp Gln
165 170 175
Lys Asn Tyr Val Ser Ile Tyr Ala Asn Gln Lys Thr Ser Tyr Cys Trp
180 185 190
Trp Leu Lys Asp Tyr Phe Asn Lys Asn Asn Tyr Asp His Leu Asn Val
195 200 205
Ser Ile Asn Arg Leu Glu Thr Glu Ala Glu Phe Tyr Ala Phe Asp Asp
210 215 220
Phe Ser Gln Thr Ile Lys Leu Thr Asn Asn Ser Tyr Gln Thr Val Asn
225 230 235 240
Ile Asp Val Asn Phe Asp Asn Asn Leu Cys Ile Leu Ala Leu Leu Arg
245 250 255
Phe Leu Leu Ser Leu Glu Arg Phe Asn Ile Leu Asn Ile Arg Ser Ser
260 265 270
Tyr Thr Arg Asn Gln Tyr Asn Phe Glu Lys Ile Gly Glu Leu Leu Glu
275 280 285
Thr Ile Phe Ala Val Val Phe Ser His Arg His Leu Gln Gly Ile His
290 295 300
Leu Gln Val Pro Cys Glu Ala Phe Gln Tyr Leu Val Asn Ser Ser Ser
305 310 315 320
Gln Ile Ser Val Lys Asp Ser Gln Leu Gln Val Tyr Ser Phe Ser Thr
325 330 335
Asp Leu Lys Leu Val Asp Thr Asn Lys Val Gln Asp Tyr Phe Lys Phe
340 345 350
Leu Gln Glu Phe Pro Arg Leu Thr His Val Ser Gln Gln Ala Ile Pro
355 360 365
Val Ser Ala Thr Asn Ala Val Glu Asn Leu Asn Val Leu Leu Lys Lys
370 375 380
Val Lys His Ala Asn Leu Asn Leu Val Ser Ile Pro Thr Gln Phe Asn
385 390 395 400
Phe Asp Phe Tyr Phe Val Asn Leu Gln His Leu Lys Leu Glu Phe Gly
405 410 415
Leu Glu Pro Asn Ile Leu Thr Lys Gln Lys Leu Glu Asn Leu Leu Leu
420 425 430
Ser Ile Lys Gln Ser Lys Asn Leu Lys Phe Leu Arg Leu Asn Phe Tyr
435 440 445
Thr Tyr Val Ala Gln Glu Thr Ser Arg Lys Gln Ile Leu Lys Gln Ala
450 455 460
Thr Thr Ile Lys Asn Leu Lys Asn Asn Lys Asn Gln Glu Glu Thr Pro
465 470 475 480
Glu Thr Lys Asp Glu Thr Pro Ser Glu Ser Thr Ser Gly Met Lys Phe
485 490 495
Phe Asp His Leu Ser Glu Leu Thr Glu Leu Glu Asp Phe Ser Val Asn
500 505 510
Leu Gln Ala Thr Gln Glu Ile Tyr Asp Ser Leu His Lys Leu Leu Ile
515 520 525
Arg Ser Thr Asn Leu Lys Lys Phe Lys Leu Ser Tyr Lys Tyr Glu Met
530 535 540
Glu Lys Ser Lys Met Asp Thr Phe Ile Asp Leu Lys Asn Ile Tyr Glu
545 550 555 560
Thr Leu Asn Asn Leu Lys Arg Cys Ser Val Asn Ile Ser Asn Pro His
565 570 575
Gly Asn Ile Ser Tyr Glu Leu Thr Asn Lys Asp Ser Thr Phe Tyr Lys
580 585 590
Phe Lys Leu Thr Leu Asn Gln Glu Leu Gln His Ala Lys Tyr Thr Phe
595 600 605
Lys Gln Asn Glu Phe Gln Phe Asn Asn Val Lys Ser Ala Lys Ile Glu
610 615 620
Ser Ser Ser Leu Glu Ser Leu Glu Asp Ile Asp Ser Leu Cys Lys Ser
625 630 635 640
Ile Ala Ser Cys Lys Asn Leu Gln Asn Val Asn Ile Ile Ala Ser Leu
645 650 655
Leu Tyr Pro Asn Asn Ile Gln Lys Asn Pro Phe Asn Lys Pro Asn Leu
660 665 670
Leu Phe Phe Lys Gln Phe Glu Gln Leu Lys Asn Leu Glu Asn Val Ser
675 680 685
Ile Asn Cys Ile Leu Asp Gln His Ile Leu Asn Ser Ile Ser Glu Phe
690 695 700
Leu Glu Lys Asn Lys Lys Ile Lys Ala Phe Ile Leu Lys Arg Tyr Tyr
705 710 715 720
Leu Leu Gln Tyr Tyr Leu Asp Tyr Thr Lys Leu Phe Lys Thr Leu Gln
725 730 735
Gln Leu Pro Glu Leu Asn Gln Val Tyr Ile Asn Gln Gln Leu Glu Glu
740 745 750
Leu Thr Val Ser Glu Val His Lys Gln Val Trp Glu Asn His Lys Gln
755 760 765
Lys Ala Phe Tyr Glu Pro Leu Cys Glu Phe Ile Lys Glu Ser Ser Gln
770 775 780
Thr Leu Gln Leu Ile Asp Phe Asp Gln Asn Thr Val Ser Asp Asp Ser
785 790 795 800
Ile Lys Lys Ile Leu Glu Ser Ile Ser Glu Ser Lys Tyr His His Tyr
805 810 815
Leu Arg Leu Asn Pro Ser Gln Ser Ser Ser Leu Ile Lys Ser Glu Asn
820 825 830
Glu Glu Ile Gln Glu Leu Leu Lys
835 840
(2) INFORMATION FOR SEQ ID NO:191:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 83 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:191:
Asp Ile Asp Leu Asp Asp Ile Glu Asn Leu Leu Pro Asn Thr Phe Asn
1 5 10 15
Lys Tyr Ser Ser Ser Cys Ser Asp Lys Lys Gly Cys Lys Thr Leu Lys
20 25 30
Ser Gly Ser Lys Ser Pro Ser Leu Thr Ile Pro Lys Leu Gln Lys Gln
35 40 45
Leu Glu Phe Tyr Phe Ser Asp Ala Asn Leu Tyr Asn Asp Ser Phe Leu
50 55 60
Arg Lys Leu Val Leu Lys Ser Gly Glu Gln Arg Val Glu Ile Glu Thr
65 70 75 80
Leu Leu Met
(2) INFORMATION FOR SEQ ID NO:192:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 100 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:192:
Asn Val Lys Ser Ala Lys Ile Glu Ser Ser Ser Leu Glu Ser Leu Glu
1 5 10 15
Asp Ile Asp Ser Leu Cys Lys Ser Ile Ala Ser Cys Lys Asn Leu Gln
20 25 30
Asn Val Asn Ile Ile Ala Ser Leu Leu Tyr Pro Asn Asn Ile Gln Lys
35 40 45
Asn Pro Phe Asn Lys Pro Asn Leu Leu Phe Phe Lys Gln Phe Glu Gln
50 55 60
Leu Lys Asn Leu Glu Asn Val Ser Ile Asn Cys Ile Leu Asp Gln His
65 70 75 80
Ile Leu Asn Ser Ile Ser Glu Phe Leu Glu Lys Asn Lys Lys Ile Lys
85 90 95
Ala Phe Ile Leu
100
(2) INFORMATION FOR SEQ ID NO:193:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 85 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:193:
Met Glu Met Asp Ile Asp Leu Asp Asp Ile Glu Asn Leu Leu Pro Asn
1 5 10 15
Thr Phe Asn Lys Tyr Ser Ser Ser Cys Ser Asp Lys Lys Gly Cys Lys
20 25 30
Thr Leu Lys Ser Gly Ser Lys Ser Pro Ser Leu Thr Ile Pro Lys Leu
35 40 45
Gln Lys Gln Leu Glu Phe Tyr Phe Ser Asp Ala Asn Leu Tyr Asn Asp
50 55 60
Ser Phe Leu Arg Lys Leu Val Leu Lys Ser Gly Glu Gln Arg Val Glu
65 70 75 80
Ile Glu Thr Leu Leu
85
(2) INFORMATION FOR SEQ ID NO:194:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 99 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:194:
Ile Glu Leu Ala Ile Lys Ile Ala Val Asn Lys Asn Leu Asp Glu Ile
1 5 10 15
Lys Gly His Thr Ala Ile Phe Ser Asp Val Ser Gly Ser Met Ser Thr
20 25 30
Ser Met Ser Gly Gly Ala Lys Lys Tyr Gly Ser Val Arg Thr Cys Leu
35 40 45
Glu Cys Ala Leu Val Leu Gly Leu Met Val Lys Gln Arg Cys Glu Lys
50 55 60
Ser Ser Phe Tyr Ile Phe Ser Ser Pro Ser Ser Gln Cys Asn Lys Cys
65 70 75 80
Tyr Leu Glu Val Asp Leu Pro Gly Asp Glu Leu Arg Pro Ser Met Gln
85 90 95
Lys Leu Leu
(2) INFORMATION FOR SEQ ID NO:195:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 13 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..13
(D) OTHER INFORMATION: /note= "consensus telomerase RT sequenc
e
from motif A"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 1
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 4
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 6
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 10
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 13
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:195:
Xaa Xaa Xaa Xaa Asp Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10
(2) INFORMATION FOR SEQ ID NO:196:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 13 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..13
(D) OTHER INFORMATION: /note= "consensus telomerase RT sequenc
e
from motif B"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 1
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:196:
Xaa Xaa Xaa Xaa Xaa Xaa Gln Gly Xaa Xaa Xaa Ser Pro
1 5 10
(2) INFORMATION FOR SEQ ID NO:197:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 10 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..10
(D) OTHER INFORMATION: /note= "consensus telomerase RT sequenc
e
from motif C"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 1
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 5
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 8..10
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:197:
Xaa Xaa Xaa Tyr Xaa Asp Asp Xaa Xaa Xaa
1 5 10
(2) INFORMATION FOR SEQ ID NO:198:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 8 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..8
(D) OTHER INFORMATION: /note= "consensus telomerase RT sequenc
e
from motif D"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 2
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 4
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:198:
Gly Xaa Xaa Xaa Xaa Xaa Xaa Lys
1 5
(2) INFORMATION FOR SEQ ID NO:199:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 8 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..8
(D) OTHER INFORMATION: /note= "consensus telomerase RT sequenc
e
from motif E"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 1
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 3
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 6
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 8
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:199:
Xaa Xaa Xaa Leu Gly Xaa Xaa Xaa
1 5
(2) INFORMATION FOR SEQ ID NO:200:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..34
(D) OTHER INFORMATION: /note= "motif A peptide from
Dong (LINE)"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:200:
Lys Asn Arg Asn Leu His Cys Thr Tyr Ile Asp Tyr Lys Lys Ala Phe
1 5 10 15
Asp Ser Ile Pro His Ser Trp Leu Ile Gln Val Leu Glu Ile Tyr Lys
20 25 30
Ile Asn
(2) INFORMATION FOR SEQ ID NO:201:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..35
(D) OTHER INFORMATION: /note= "motif B peptide from
Dong (LINE)"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:201:
Arg Gln Ile Ala Ile Lys Lys Gly Ile Tyr Gln Gly Asp Ser Leu Ser
1 5 10 15
Pro Leu Trp Phe Cys Leu Ala Leu Asn Pro Leu Ser His Gln Leu His
20 25 30
Asn Asp Arg
35
(2) INFORMATION FOR SEQ ID NO:202:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 43 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..43
(D) OTHER INFORMATION: /note= "motif C and D peptide from
Dong (LINE)"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:202:
His Leu Ile Tyr Met Asp Asp Ile Lys Leu Tyr Ala Lys Asn Asp Lys
1 5 10 15
Glu Met Lys Lys Leu Ile Asp Thr Thr Thr Ile Phe Ser Asn Asp Ile
20 25 30
Ser Met Gln Phe Gly Leu Asp Lys Cys Lys Thr
35 40
(2) INFORMATION FOR SEQ ID NO:203:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..11
(D) OTHER INFORMATION: /note= "motif E peptide from
Dong (LINE)"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:203:
Lys Cys Leu Tyr Lys Tyr Leu Gly Phe Gln Gln
1 5 10
(2) INFORMATION FOR SEQ ID NO:204:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..34
(D) OTHER INFORMATION: /note= "motif A peptide from
Saccharomyces cerevisiae cytochrome
oxidase group II intron 1-encoded
mitochondrial protein"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:204:
Phe Gly Gly Ser Asn Trp Phe Arg Glu Val Asp Leu Lys Lys Cys Phe
1 5 10 15
Asp Thr Ile Ser His Asp Leu Ile Ile Lys Glu Leu Lys Arg Tyr Ile
20 25 30
Ser Asp
(2) INFORMATION FOR SEQ ID NO:205:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..35
(D) OTHER INFORMATION: /note= "motif B peptide from
Saccharomyces cerevisiae cytochrome
oxidase group II intron 1-encoded
mitochondrial protein"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:205:
His Val Pro Val Gly Pro Arg Val Cys Val Gln Gly Ala Pro Thr Ser
1 5 10 15
Pro Ala Leu Cys Asn Ala Val Leu Leu Arg Leu Asp Arg Arg Leu Ala
20 25 30
Gly Leu Ala
35
(2) INFORMATION FOR SEQ ID NO:206:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..25
(D) OTHER INFORMATION: /note= "motif D peptide from
Saccharomyces cerevisiae cytochrome
oxidase group II intron 1-encoded
mitochondrial protein"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:206:
Lys Ile Ile Lys Arg Asp Leu Asn Asn Phe Leu Asn Ser Leu Gly Leu
1 5 10 15
Thr Ile Asn Glu Glu Lys Thr Leu Ile
20 25
(2) INFORMATION FOR SEQ ID NO:207:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..34
(D) OTHER INFORMATION: /note= "motif A peptide from HIV RT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:207:
Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr
1 5 10 15
Phe Ser Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr Thr Ala Phe Thr
20 25 30
Ile Pro
(2) INFORMATION FOR SEQ ID NO:208:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..35
(D) OTHER INFORMATION: /note= "motif B peptide from HIV RT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:208:
Gly Ile Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser
1 5 10 15
Pro Ala Ile Phe Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg
20 25 30
Lys Gln Asn
35
(2) INFORMATION FOR SEQ ID NO:209:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..17
(D) OTHER INFORMATION: /note= "motif C peptide from HIV RT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:209:
Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser His Leu Glu Ile
1 5 10 15
Gly
(2) INFORMATION FOR SEQ ID NO:210:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 37 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..37
(D) OTHER INFORMATION: /note= "motif D and E peptide from
HIV RT"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:210:
His Arg Thr Lys Ile Glu Glu Leu Arg Gln His Leu Leu Arg Trp Gly
1 5 10 15
Leu Thr Thr Pro Asp Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp
20 25 30
Met Gly Tyr Glu Leu
35
(2) INFORMATION FOR SEQ ID NO:211:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 38 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..38
(D) OTHER INFORMATION: /note= "motif C and D peptide from
Saccharomyces cerevisiae
ESTp (L8543.12)"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:211:
Ile Leu Lys Leu Ala Asp Asp Phe Leu Ile Ile Ser Thr Asp Gln Gln
1 5 10 15
Gln Val Ile Asn Ile Lys Lys Leu Ala Met Gly Gly Phe Gln Lys Tyr
20 25 30
Asn Ala Lys Ala Asn Arg
35
(2) INFORMATION FOR SEQ ID NO:212:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..11
(D) OTHER INFORMATION: /note= "motif E peptide from
Saccharomyces cerevisiae
ESTp (L8543.12)"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:212:
Ile Arg Ser Lys Ser Ser Lys Gly Ile Phe Arg
1 5 10
(2) INFORMATION FOR SEQ ID NO:213:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 39 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:213:
Leu Gln Lys Gln Leu Glu Phe Tyr Phe Ser Asp Ala Asn Leu Tyr Asn
1 5 10 15
Asp Ser Phe Leu Arg Lys Leu Val Leu Lys Ser Gly Glu Gln Arg Val
20 25 30
Glu Ile Glu Thr Leu Leu Met
35
(2) INFORMATION FOR SEQ ID NO:214:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 38 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:214:
Ile Cys His Gln Xaa Glu Tyr Tyr Phe Gly Asp Phe Asn Leu Pro Arg
1 5 10 15
Asp Lys Phe Leu Lys Glu Gln Ile Lys Leu Asp Glu Gly Trp Val Pro
20 25 30
Leu Glu Ile Met Ile Lys
35
(2) INFORMATION FOR SEQ ID NO:215:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 38 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:215:
Ile Cys Glu Gln Ile Glu Tyr Tyr Phe Gly Asp His Asn Leu Pro Arg
1 5 10 15
Asp Lys Phe Leu Lys Gln Gln Ile Leu Leu Asp Asp Gly Trp Val Pro
20 25 30
Leu Glu Thr Met Ile Lys
35
(2) INFORMATION FOR SEQ ID NO:216:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 39 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:216:
Ile Leu Arg Gln Val Glu Tyr Tyr Phe Gly Asp Ala Asn Leu Asn Arg
1 5 10 15
Asp Lys Phe Leu Arg Glu Gln Ile Gly Lys Asn Glu Asp Gly Trp Val
20 25 30
Pro Leu Ser Val Leu Val Thr
35
(2) INFORMATION FOR SEQ ID NO:217:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 38 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:217:
Cys Leu Lys Gln Val Glu Phe Tyr Phe Ser Glu Phe Asn Phe Pro Tyr
1 5 10 15
Asp Arg Phe Leu Arg Thr Thr Ala Glu Lys Asn Asp Gly Trp Val Pro
20 25 30
Ile Ser Thr Ile Ala Thr
35
(2) INFORMATION FOR SEQ ID NO:218:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 2421 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: 92..2251
(D) OTHER INFORMATION: /codon= (seq: "taa", aa: Gln)
/codon= (seq: "tag", aa: Gln)
/codon= (seq: "tga", aa: TRM)
/product= "Tetrahymena thermophila
80 kDa protein subunit"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:218:
AACTCATTTA ATTACTAATT TAATCAACAA GATTGATAAA AAGCAGTAAA TAAAACCCAA 6
0
TAGATTTAAT TTAGAAAGTA TCAATTGAAA A ATG GAA ATT GAA AAC AAC TAA 11
2
Met Glu Ile Glu Asn Asn Gln
1 5
GCA CAA TAG CCA AAA GCC GAA AAA TTG TGG TGG GAA CTT GAA TTA GAG 16
0
Ala Gln Gln Pro Lys Ala Glu Lys Leu Trp Trp Glu Leu Glu Leu Glu
10 15 20
ATG CAA GAA AAC CAA AAT GAT ATA TAA GTT AGG GTT AAG ATT GAC GAT 20
8
Met Gln Glu Asn Gln Asn Asp Ile Gln Val Arg Val Lys Ile Asp Asp
25 30 35
CCT AAG CAA TAT CTC GTG AAC GTC ACT GCA GCA TGT TTG TTG TAG GAA 25
6
Pro Lys Gln Tyr Leu Val Asn Val Thr Ala Ala Cys Leu Leu Gln Glu
40 45 50 55
GGT AGT TAC TAC TAA GAT AAA GAT GAA AGA AGA TAT ATC ATC ACT AAA 30
4
Gly Ser Tyr Tyr Gln Asp Lys Asp Glu Arg Arg Tyr Ile Ile Thr Lys
60 65 70
GCA CTT CTT GAG GTG GCT GAG TCT GAT CCT GAG TTC ATC TGC TAG TTG 35
2
Ala Leu Leu Glu Val Ala Glu Ser Asp Pro Glu Phe Ile Cys Gln Leu
75 80 85
GCA GTC TAC ATC CGT AAT GAA CTT TAC ATC AGA ACT ACC ACT AAC TAC 40
0
Ala Val Tyr Ile Arg Asn Glu Leu Tyr Ile Arg Thr Thr Thr Asn Tyr
90 95 100
ATT GTA GCA TTT TGT GTT GTC CAC AAG AAT ACT CAA CCA TTC ATC GAA 44
8
Ile Val Ala Phe Cys Val Val His Lys Asn Thr Gln Pro Phe Ile Glu
105 110 115
AAG TAC TTC AAC AAA GCA GTA CTT TTG CCT AAT GAC TTA CTG GAA GTC 49
6
Lys Tyr Phe Asn Lys Ala Val Leu Leu Pro Asn Asp Leu Leu Glu Val
120 125 130 135
TGT GAA TTT GCA TAG GTT CTC TAT ATT TTT GAT GCA ACT GAA TTC AAA 54
4
Cys Glu Phe Ala Gln Val Leu Tyr Ile Phe Asp Ala Thr Glu Phe Lys
140 145 150
AAT TTG TAT CTT GAT AGG ATA CTT TCA TAA GAT ATT CGT AAG GAA CTC 59
2
Asn Leu Tyr Leu Asp Arg Ile Leu Ser Gln Asp Ile Arg Lys Glu Leu
155 160 165
ACT TTC CGT AAG TGT TTA CAA AGA TGC GTC AGA AGC AAG TTT TCT GAA 64
0
Thr Phe Arg Lys Cys Leu Gln Arg Cys Val Arg Ser Lys Phe Ser Glu
170 175 180
TTC AAC GAA TAC TAA CTT GGT AAG TAT TGC ACT GAA TCC TAA CGT AAG 68
8
Phe Asn Glu Tyr Gln Leu Gly Lys Tyr Cys Thr Glu Ser Gln Arg Lys
185 190 195
AAA ACA ATG TTC CGT TAC CTC TCA GTT ACC AAC AAG TAA AAG TGG GAT 73
6
Lys Thr Met Phe Arg Tyr Leu Ser Val Thr Asn Lys Gln Lys Trp Asp
200 205 210 215
TAA ACT AAG AAG AAG AGA AAA GAG AAT CTC TTA ACC AAA CTT TAG GCA 78
4
Gln Thr Lys Lys Lys Arg Lys Glu Asn Leu Leu Thr Lys Leu Gln Ala
220 225 230
ATA AAG GAA TCT GAA GAT AAG TCC AAG AGA GAA ACT GGA GAC ATA ATG 83
2
Ile Lys Glu Ser Glu Asp Lys Ser Lys Arg Glu Thr Gly Asp Ile Met
235 240 245
AAC GTT GAA GAT GCA ATC AAG GCT TTA AAA CCA GCA GTT ATG AAG AAA 88
0
Asn Val Glu Asp Ala Ile Lys Ala Leu Lys Pro Ala Val Met Lys Lys
250 255 260
ATA GCC AAG AGA TAG AAT GCC ATG AAG AAA CAC ATG AAG GCA CCT AAA 92
8
Ile Ala Lys Arg Gln Asn Ala Met Lys Lys His Met Lys Ala Pro Lys
265 270 275
ATT CCT AAC TCT ACC TTG GAA TCA AAG TAC TTG ACC TTC AAG GAT CTC 97
6
Ile Pro Asn Ser Thr Leu Glu Ser Lys Tyr Leu Thr Phe Lys Asp Leu
280 285 290 295
ATT AAG TTC TGC CAT ATT TCT GAG CCT AAA GAA AGA GTC TAT AAG ATC 102
4
Ile Lys Phe Cys His Ile Ser Glu Pro Lys Glu Arg Val Tyr Lys Ile
300 305 310
CTT GGT AAA AAA TAC CCT AAG ACC GAA GAG GAA TAC AAA GCA GCC TTT 107
2
Leu Gly Lys Lys Tyr Pro Lys Thr Glu Glu Glu Tyr Lys Ala Ala Phe
315 320 325
GGT GAT TCT GCA TCT GCA CCC TTC AAT CCT GAA TTG GCT GGA AAG CGT 112
0
Gly Asp Ser Ala Ser Ala Pro Phe Asn Pro Glu Leu Ala Gly Lys Arg
330 335 340
ATG AAG ATT GAA ATC TCT AAA ACA TGG GAA AAT GAA CTC AGT GCA AAA 116
8
Met Lys Ile Glu Ile Ser Lys Thr Trp Glu Asn Glu Leu Ser Ala Lys
345 350 355
GGC AAC ACT GCT GAG GTT TGG GAT AAT TTA ATT TCA AGC AAT TAA CTC 121
6
Gly Asn Thr Ala Glu Val Trp Asp Asn Leu Ile Ser Ser Asn Gln Leu
360 365 370 375
CCA TAT ATG GCC ATG TTA CGT AAC TTG TCT AAC ATC TTA AAA GCC GGT 126
4
Pro Tyr Met Ala Met Leu Arg Asn Leu Ser Asn Ile Leu Lys Ala Gly
380 385 390
GTT TCA GAT ACT ACA CAC TCT ATT GTG ATC AAC AAG ATT TGT GAG CCC 131
2
Val Ser Asp Thr Thr His Ser Ile Val Ile Asn Lys Ile Cys Glu Pro
395 400 405
AAG GCC GTT GAG AAC TCC AAG ATG TTC CCT CTT CAA TTC TTT AGT GCC 136
0
Lys Ala Val Glu Asn Ser Lys Met Phe Pro Leu Gln Phe Phe Ser Ala
410 415 420
ATT GAA GCT GTT AAT GAA GCA GTT ACT AAG GGA TTC AAG GCC AAG AAG 140
8
Ile Glu Ala Val Asn Glu Ala Val Thr Lys Gly Phe Lys Ala Lys Lys
425 430 435
AGA GAA AAT ATG AAT CTT AAA GGT CAA ATC GAA GCA GTA AAG GAA GTT 145
6
Arg Glu Asn Met Asn Leu Lys Gly Gln Ile Glu Ala Val Lys Glu Val
440 445 450 455
GTT GAA AAA ACC GAT GAA GAG AAG AAA GAT ATG GAG TTG GAG TAA ACC 150
4
Val Glu Lys Thr Asp Glu Glu Lys Lys Asp Met Glu Leu Glu Gln Thr
460 465 470
GAA GAA GGA GAA TTT GTT AAA GTC AAC GAA GGA ATT GGC AAG CAA TAC 155
2
Glu Glu Gly Glu Phe Val Lys Val Asn Glu Gly Ile Gly Lys Gln Tyr
475 480 485
ATT AAC TCC ATT GAA CTT GCA ATC AAG ATA GCA GTT AAC AAG AAT TTA 160
0
Ile Asn Ser Ile Glu Leu Ala Ile Lys Ile Ala Val Asn Lys Asn Leu
490 495 500
GAT GAA ATC AAA GGA CAC ACT GCA ATC TTC TCT GAT GTT TCT GGT TCT 164
8
Asp Glu Ile Lys Gly His Thr Ala Ile Phe Ser Asp Val Ser Gly Ser
505 510 515
ATG AGT ACC TCA ATG TCA GGT GGA GCC AAG AAG TAT GGT TCC GTT CGT 169
6
Met Ser Thr Ser Met Ser Gly Gly Ala Lys Lys Tyr Gly Ser Val Arg
520 525 530 535
ACT TGT CTC GAG TGT GCA TTA GTC CTT GGT TTG ATG GTA AAA TAA CGT 174
4
Thr Cys Leu Glu Cys Ala Leu Val Leu Gly Leu Met Val Lys Gln Arg
540 545 550
TGT GAA AAG TCC TCA TTC TAC ATC TTC AGT TCA CCT AGT TCT CAA TGC 179
2
Cys Glu Lys Ser Ser Phe Tyr Ile Phe Ser Ser Pro Ser Ser Gln Cys
555 560 565
AAT AAG TGT TAC TTA GAA GTT GAT CTC CCT GGA GAC GAA CTC CGT CCT 184
0
Asn Lys Cys Tyr Leu Glu Val Asp Leu Pro Gly Asp Glu Leu Arg Pro
570 575 580
TCT ATG TAA AAA CTT TTG CAA GAG AAA GGA AAA CTT GGT GGT GGT ACT 188
8
Ser Met Gln Lys Leu Leu Gln Glu Lys Gly Lys Leu Gly Gly Gly Thr
585 590 595
GAT TTC CCC TAT GAG TGC ATT GAT GAA TGG ACA AAG AAT AAA ACT CAC 193
6
Asp Phe Pro Tyr Glu Cys Ile Asp Glu Trp Thr Lys Asn Lys Thr His
600 605 610 615
GTA GAC AAT ATC GTT ATT TTG TCT GAT ATG ATG ATT GCA GAA GGA TAT 198
4
Val Asp Asn Ile Val Ile Leu Ser Asp Met Met Ile Ala Glu Gly Tyr
620 625 630
TCA GAT ATC AAT GTT AGA GGC AGT TCC ATT GTT AAC AGC ATC AAA AAG 203
2
Ser Asp Ile Asn Val Arg Gly Ser Ser Ile Val Asn Ser Ile Lys Lys
635 640 645
TAC AAG GAT GAA GTA AAT CCT AAC ATT AAA ATC TTT GCA GTT GAC TTA 208
0
Tyr Lys Asp Glu Val Asn Pro Asn Ile Lys Ile Phe Ala Val Asp Leu
650 655 660
GAA GGT TAC GGA AAG TGC CTT AAT CTA GGT GAT GAG TTC AAT GAA AAC 212
8
Glu Gly Tyr Gly Lys Cys Leu Asn Leu Gly Asp Glu Phe Asn Glu Asn
665 670 675
AAC TAC ATC AAG ATA TTC GGT ATG AGC GAT TCA ATC TTA AAG TTC ATT 217
6
Asn Tyr Ile Lys Ile Phe Gly Met Ser Asp Ser Ile Leu Lys Phe Ile
680 685 690 695
TCA GCC AAG CAA GGA GGA GCA AAT ATG GTC GAA GTT ATC AAA AAC TTT 222
4
Ser Ala Lys Gln Gly Gly Ala Asn Met Val Glu Val Ile Lys Asn Phe
700 705 710
GCC CTT CAA AAA ATA GGA CAA AAG TGAGTTTCTT GAGATTCTTC TATAACAAAA 227
8
Ala Leu Gln Lys Ile Gly Gln Lys
715
ATCTCACCCC ACTTTTTTGT TTTATTGCAT AGCCATTATG AAATTTAAAT TATTATCTAT 233
8
TTATTTAAGT TACTTACATA GTTTATGTAT CGCAGTCTAT TAGCCTATTC AAATGATTCT 239
8
GCAAAGAACA AAAAAGATTA AAA 242
1
(2) INFORMATION FOR SEQ ID NO:219:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 719 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:219:
Met Glu Ile Glu Asn Asn Gln Ala Gln Gln Pro Lys Ala Glu Lys Leu
1 5 10 15
Trp Trp Glu Leu Glu Leu Glu Met Gln Glu Asn Gln Asn Asp Ile Gln
20 25 30
Val Arg Val Lys Ile Asp Asp Pro Lys Gln Tyr Leu Val Asn Val Thr
35 40 45
Ala Ala Cys Leu Leu Gln Glu Gly Ser Tyr Tyr Gln Asp Lys Asp Glu
50 55 60
Arg Arg Tyr Ile Ile Thr Lys Ala Leu Leu Glu Val Ala Glu Ser Asp
65 70 75 80
Pro Glu Phe Ile Cys Gln Leu Ala Val Tyr Ile Arg Asn Glu Leu Tyr
85 90 95
Ile Arg Thr Thr Thr Asn Tyr Ile Val Ala Phe Cys Val Val His Lys
100 105 110
Asn Thr Gln Pro Phe Ile Glu Lys Tyr Phe Asn Lys Ala Val Leu Leu
115 120 125
Pro Asn Asp Leu Leu Glu Val Cys Glu Phe Ala Gln Val Leu Tyr Ile
130 135 140
Phe Asp Ala Thr Glu Phe Lys Asn Leu Tyr Leu Asp Arg Ile Leu Ser
145 150 155 160
Gln Asp Ile Arg Lys Glu Leu Thr Phe Arg Lys Cys Leu Gln Arg Cys
165 170 175
Val Arg Ser Lys Phe Ser Glu Phe Asn Glu Tyr Gln Leu Gly Lys Tyr
180 185 190
Cys Thr Glu Ser Gln Arg Lys Lys Thr Met Phe Arg Tyr Leu Ser Val
195 200 205
Thr Asn Lys Gln Lys Trp Asp Gln Thr Lys Lys Lys Arg Lys Glu Asn
210 215 220
Leu Leu Thr Lys Leu Gln Ala Ile Lys Glu Ser Glu Asp Lys Ser Lys
225 230 235 240
Arg Glu Thr Gly Asp Ile Met Asn Val Glu Asp Ala Ile Lys Ala Leu
245 250 255
Lys Pro Ala Val Met Lys Lys Ile Ala Lys Arg Gln Asn Ala Met Lys
260 265 270
Lys His Met Lys Ala Pro Lys Ile Pro Asn Ser Thr Leu Glu Ser Lys
275 280 285
Tyr Leu Thr Phe Lys Asp Leu Ile Lys Phe Cys His Ile Ser Glu Pro
290 295 300
Lys Glu Arg Val Tyr Lys Ile Leu Gly Lys Lys Tyr Pro Lys Thr Glu
305 310 315 320
Glu Glu Tyr Lys Ala Ala Phe Gly Asp Ser Ala Ser Ala Pro Phe Asn
325 330 335
Pro Glu Leu Ala Gly Lys Arg Met Lys Ile Glu Ile Ser Lys Thr Trp
340 345 350
Glu Asn Glu Leu Ser Ala Lys Gly Asn Thr Ala Glu Val Trp Asp Asn
355 360 365
Leu Ile Ser Ser Asn Gln Leu Pro Tyr Met Ala Met Leu Arg Asn Leu
370 375 380
Ser Asn Ile Leu Lys Ala Gly Val Ser Asp Thr Thr His Ser Ile Val
385 390 395 400
Ile Asn Lys Ile Cys Glu Pro Lys Ala Val Glu Asn Ser Lys Met Phe
405 410 415
Pro Leu Gln Phe Phe Ser Ala Ile Glu Ala Val Asn Glu Ala Val Thr
420 425 430
Lys Gly Phe Lys Ala Lys Lys Arg Glu Asn Met Asn Leu Lys Gly Gln
435 440 445
Ile Glu Ala Val Lys Glu Val Val Glu Lys Thr Asp Glu Glu Lys Lys
450 455 460
Asp Met Glu Leu Glu Gln Thr Glu Glu Gly Glu Phe Val Lys Val Asn
465 470 475 480
Glu Gly Ile Gly Lys Gln Tyr Ile Asn Ser Ile Glu Leu Ala Ile Lys
485 490 495
Ile Ala Val Asn Lys Asn Leu Asp Glu Ile Lys Gly His Thr Ala Ile
500 505 510
Phe Ser Asp Val Ser Gly Ser Met Ser Thr Ser Met Ser Gly Gly Ala
515 520 525
Lys Lys Tyr Gly Ser Val Arg Thr Cys Leu Glu Cys Ala Leu Val Leu
530 535 540
Gly Leu Met Val Lys Gln Arg Cys Glu Lys Ser Ser Phe Tyr Ile Phe
545 550 555 560
Ser Ser Pro Ser Ser Gln Cys Asn Lys Cys Tyr Leu Glu Val Asp Leu
565 570 575
Pro Gly Asp Glu Leu Arg Pro Ser Met Gln Lys Leu Leu Gln Glu Lys
580 585 590
Gly Lys Leu Gly Gly Gly Thr Asp Phe Pro Tyr Glu Cys Ile Asp Glu
595 600 605
Trp Thr Lys Asn Lys Thr His Val Asp Asn Ile Val Ile Leu Ser Asp
610 615 620
Met Met Ile Ala Glu Gly Tyr Ser Asp Ile Asn Val Arg Gly Ser Ser
625 630 635 640
Ile Val Asn Ser Ile Lys Lys Tyr Lys Asp Glu Val Asn Pro Asn Ile
645 650 655
Lys Ile Phe Ala Val Asp Leu Glu Gly Tyr Gly Lys Cys Leu Asn Leu
660 665 670
Gly Asp Glu Phe Asn Glu Asn Asn Tyr Ile Lys Ile Phe Gly Met Ser
675 680 685
Asp Ser Ile Leu Lys Phe Ile Ser Ala Lys Gln Gly Gly Ala Asn Met
690 695 700
Val Glu Val Ile Lys Asn Phe Ala Leu Gln Lys Ile Gly Gln Lys
705 710 715
(2) INFORMATION FOR SEQ ID NO:220:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 2829 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: 47..2665
(D) OTHER INFORMATION: /codon= (seq: "taa", aa: Gln)
/codon= (seq: "tag", aa: Gln)
/codon= (seq: "tga", aa: TRM)
/product= "Tetrahymena thermophila
95 kDa protein subunit"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:220:
TCAATACTAT TAATTAATAA ATAAAAAAAA GCAAACTACA AAGAAA ATG TCA AGG 5
5
Met Ser Arg
1
CGT AAC TAA AAA AAG CCA TAG GCT CCT ATA GGC AAT GAA ACA AAT CTT 10
3
Arg Asn Gln Lys Lys Pro Gln Ala Pro Ile Gly Asn Glu Thr Asn Leu
5 10 15
GAT TTT GTA TTA CAA AAT CTA GAA GTT TAC AAA AGC CAG ATT GAG CAT 15
1
Asp Phe Val Leu Gln Asn Leu Glu Val Tyr Lys Ser Gln Ile Glu His
20 25 30 35
TAT AAG ACC TAG TAG TAA TAG ATC AAA GAG GAG GAT CTC AAG CTT TTA 19
9
Tyr Lys Thr Gln Gln Gln Gln Ile Lys Glu Glu Asp Leu Lys Leu Leu
40 45 50
AAG TTC AAA AAT TAA GAT TAG GAT GGA AAC TCT GGC AAC GAT GAT GAT 24
7
Lys Phe Lys Asn Gln Asp Gln Asp Gly Asn Ser Gly Asn Asp Asp Asp
55 60 65
GAT GAA GAA AAC AAC TCA AAT AAA TAA TAA GAA TTA TTA AGG AGA GTC 29
5
Asp Glu Glu Asn Asn Ser Asn Lys Gln Gln Glu Leu Leu Arg Arg Val
70 75 80
AAT TAG ATT AAG TAG CAA GTT TAA TTG ATA AAA AAA GTT GGT TCT AAG 34
3
Asn Gln Ile Lys Gln Gln Val Gln Leu Ile Lys Lys Val Gly Ser Lys
85 90 95
GTA GAG AAA GAT TTG AAT TTG AAC GAA GAT GAA AAC AAA AAG AAT GGA 39
1
Val Glu Lys Asp Leu Asn Leu Asn Glu Asp Glu Asn Lys Lys Asn Gly
100 105 110 115
CTT TCT GAA TAG CAA GTG AAA GAA GAG TAA TTA AGA ACG ATT ACT GAA 43
9
Leu Ser Glu Gln Gln Val Lys Glu Glu Gln Leu Arg Thr Ile Thr Glu
120 125 130
GAA TAG GTT AAG TAT TAA AAT TTA GTA TTT AAC ATG GAC TAC CAG TTA 48
7
Glu Gln Val Lys Tyr Gln Asn Leu Val Phe Asn Met Asp Tyr Gln Leu
135 140 145
GAT TTA AAT GAG AGT GGT GGC CAT AGA AGA CAC AGA AGA GAA ACA GAT 53
5
Asp Leu Asn Glu Ser Gly Gly His Arg Arg His Arg Arg Glu Thr Asp
150 155 160
TAT GAT ACT GAA AAA TGG TTT GAA ATA TCT CAT GAC CAA AAA AAT TAT 58
3
Tyr Asp Thr Glu Lys Trp Phe Glu Ile Ser His Asp Gln Lys Asn Tyr
165 170 175
GTA TCA ATT TAC GCC AAC TAA AAG ACA TCA TAT TGT TGG TGG CTT AAA 63
1
Val Ser Ile Tyr Ala Asn Gln Lys Thr Ser Tyr Cys Trp Trp Leu Lys
180 185 190 195
GAT TAT TTT AAT AAA AAC AAT TAT GAT CAT CTT AAT GTA AGC ATT AAC 67
9
Asp Tyr Phe Asn Lys Asn Asn Tyr Asp His Leu Asn Val Ser Ile Asn
200 205 210
AGA CTA GAA ACT GAA GCC GAA TTC TAT GCC TTT GAT GAT TTT TCA CAA 72
7
Arg Leu Glu Thr Glu Ala Glu Phe Tyr Ala Phe Asp Asp Phe Ser Gln
215 220 225
ACA ATC AAA CTT ACT AAT AAT TCT TAC TAG ACT GTT AAC ATA GAC GTT 77
5
Thr Ile Lys Leu Thr Asn Asn Ser Tyr Gln Thr Val Asn Ile Asp Val
230 235 240
AAT TTT GAT AAT AAT CTC TGT ATA CTC GCA TTG CTT AGA TTT TTA TTA 82
3
Asn Phe Asp Asn Asn Leu Cys Ile Leu Ala Leu Leu Arg Phe Leu Leu
245 250 255
TCA CTA GAA AGA TTC AAT ATT TTG AAT ATA AGA TCT TCT TAT ACA AGA 87
1
Ser Leu Glu Arg Phe Asn Ile Leu Asn Ile Arg Ser Ser Tyr Thr Arg
260 265 270 275
AAT TAA TAT AAT TTT GAG AAA ATT GGT GAG CTA CTT GAA ACT ATC TTC 91
9
Asn Gln Tyr Asn Phe Glu Lys Ile Gly Glu Leu Leu Glu Thr Ile Phe
280 285 290
GCA GTT GTC TTT TCT CAT CGC CAC TTA CAA GGC ATT CAT TTA CAA GTT 96
7
Ala Val Val Phe Ser His Arg His Leu Gln Gly Ile His Leu Gln Val
295 300 305
CCT TGC GAA GCG TTC TAA TAT TTA GTT AAC TCC TCA TCA TAA ATT AGC 101
5
Pro Cys Glu Ala Phe Gln Tyr Leu Val Asn Ser Ser Ser Gln Ile Ser
310 315 320
GTT AAA GAT AGC TAA TTA TAG GTA TAC TCT TTC TCT ACA GAC TTA AAA 106
3
Val Lys Asp Ser Gln Leu Gln Val Tyr Ser Phe Ser Thr Asp Leu Lys
325 330 335
TTA GTT GAC ACT AAC AAA GTC CAA GAT TAT TTT AAG TTC TTA TAA GAA 111
1
Leu Val Asp Thr Asn Lys Val Gln Asp Tyr Phe Lys Phe Leu Gln Glu
340 345 350 355
TTC CCT CGT TTG ACT CAT GTA AGC TAG TAG GCT ATC CCA GTT AGT GCT 115
9
Phe Pro Arg Leu Thr His Val Ser Gln Gln Ala Ile Pro Val Ser Ala
360 365 370
ACT AAC GCT GTA GAG AAC CTC AAT GTT TTA CTT AAA AAG GTC AAG CAT 120
7
Thr Asn Ala Val Glu Asn Leu Asn Val Leu Leu Lys Lys Val Lys His
375 380 385
GCT AAT CTT AAT TTA GTT TCT ATC CCT ACC TAA TTC AAT TTT GAT TTC 125
5
Ala Asn Leu Asn Leu Val Ser Ile Pro Thr Gln Phe Asn Phe Asp Phe
390 395 400
TAC TTT GTT AAT TTA TAA CAT TTG AAA TTA GAG TTT GGA TTA GAA CCA 130
3
Tyr Phe Val Asn Leu Gln His Leu Lys Leu Glu Phe Gly Leu Glu Pro
405 410 415
AAT ATT TTG ACA AAA CAA AAG CTT GAA AAT CTA CTT TTG AGT ATA AAA 135
1
Asn Ile Leu Thr Lys Gln Lys Leu Glu Asn Leu Leu Leu Ser Ile Lys
420 425 430 435
TAA TCA AAA AAT CTT AAA TTT TTA AGA TTA AAC TTT TAC ACC TAC GTT 139
9
Gln Ser Lys Asn Leu Lys Phe Leu Arg Leu Asn Phe Tyr Thr Tyr Val
440 445 450
GCT TAA GAA ACC TCC AGA AAA CAG ATA TTA AAA CAA GCT ACA ACA ATC 144
7
Ala Gln Glu Thr Ser Arg Lys Gln Ile Leu Lys Gln Ala Thr Thr Ile
455 460 465
AAA AAT CTC AAA AAC AAT AAA AAT CAA GAA GAA ACT CCT GAA ACT AAA 149
5
Lys Asn Leu Lys Asn Asn Lys Asn Gln Glu Glu Thr Pro Glu Thr Lys
470 475 480
GAT GAA ACT CCA AGC GAA AGC ACA AGT GGT ATG AAA TTT TTT GAT CAT 154
3
Asp Glu Thr Pro Ser Glu Ser Thr Ser Gly Met Lys Phe Phe Asp His
485 490 495
CTT TCT GAA TTA ACC GAG CTT GAA GAT TTC AGC GTT AAC TTG TAA GCT 159
1
Leu Ser Glu Leu Thr Glu Leu Glu Asp Phe Ser Val Asn Leu Gln Ala
500 505 510 515
ACC CAA GAA ATT TAT GAT AGC TTG CAC AAA CTT TTG ATT AGA TCA ACA 163
9
Thr Gln Glu Ile Tyr Asp Ser Leu His Lys Leu Leu Ile Arg Ser Thr
520 525 530
AAT TTA AAG AAG TTC AAA TTA AGT TAC AAA TAT GAA ATG GAA AAG AGT 168
7
Asn Leu Lys Lys Phe Lys Leu Ser Tyr Lys Tyr Glu Met Glu Lys Ser
535 540 545
AAA ATG GAT ACA TTC ATA GAT CTT AAG AAT ATT TAT GAA ACC TTA AAC 173
5
Lys Met Asp Thr Phe Ile Asp Leu Lys Asn Ile Tyr Glu Thr Leu Asn
550 555 560
AAT CTT AAA AGA TGC TCT GTT AAT ATA TCA AAT CCT CAT GGA AAC ATT 178
3
Asn Leu Lys Arg Cys Ser Val Asn Ile Ser Asn Pro His Gly Asn Ile
565 570 575
TCT TAT GAA CTG ACA AAT AAA GAT TCT ACT TTT TAT AAA TTT AAG CTG 183
1
Ser Tyr Glu Leu Thr Asn Lys Asp Ser Thr Phe Tyr Lys Phe Lys Leu
580 585 590 595
ACC TTA AAC TAA GAA TTA TAA CAC GCT AAG TAT ACT TTT AAG TAG AAC 187
9
Thr Leu Asn Gln Glu Leu Gln His Ala Lys Tyr Thr Phe Lys Gln Asn
600 605 610
GAA TTT TAA TTT AAT AAC GTT AAA AGT GCA AAA ATT GAA TCT TCC TCA 192
7
Glu Phe Gln Phe Asn Asn Val Lys Ser Ala Lys Ile Glu Ser Ser Ser
615 620 625
TTA GAA AGC TTA GAA GAT ATT GAT AGT CTT TGC AAA TCT ATT GCT TCT 197
5
Leu Glu Ser Leu Glu Asp Ile Asp Ser Leu Cys Lys Ser Ile Ala Ser
630 635 640
TGT AAA AAT TTA CAA AAT GTT AAT ATT ATC GCC AGT TTG CTC TAT CCC 202
3
Cys Lys Asn Leu Gln Asn Val Asn Ile Ile Ala Ser Leu Leu Tyr Pro
645 650 655
AAC AAT ATT TAG AAA AAT CCT TTC AAT AAG CCC AAT CTT CTA TTT TTC 207
1
Asn Asn Ile Gln Lys Asn Pro Phe Asn Lys Pro Asn Leu Leu Phe Phe
660 665 670 675
AAG CAA TTT GAA TAA TTG AAA AAT TTG GAA AAT GTA TCT ATC AAC TGT 211
9
Lys Gln Phe Glu Gln Leu Lys Asn Leu Glu Asn Val Ser Ile Asn Cys
680 685 690
ATT CTT GAT CAG CAT ATA CTT AAT TCT ATT TCA GAA TTC TTA GAA AAG 216
7
Ile Leu Asp Gln His Ile Leu Asn Ser Ile Ser Glu Phe Leu Glu Lys
695 700 705
AAT AAA AAA ATA AAA GCA TTC ATT TTG AAA AGA TAT TAT TTA TTA CAA 221
5
Asn Lys Lys Ile Lys Ala Phe Ile Leu Lys Arg Tyr Tyr Leu Leu Gln
710 715 720
TAT TAT CTT GAT TAT ACT AAA TTA TTT AAA ACA CTT CAA TAG TTA CCT 226
3
Tyr Tyr Leu Asp Tyr Thr Lys Leu Phe Lys Thr Leu Gln Gln Leu Pro
725 730 735
GAA TTA AAT TAA GTT TAC ATT AAT TAG CAA TTA GAA GAA TTG ACT GTG 231
1
Glu Leu Asn Gln Val Tyr Ile Asn Gln Gln Leu Glu Glu Leu Thr Val
740 745 750 755
AGT GAA GTA CAT AAG TAA GTA TGG GAA AAC CAC AAG CAA AAA GCT TTC 235
9
Ser Glu Val His Lys Gln Val Trp Glu Asn His Lys Gln Lys Ala Phe
760 765 770
TAT GAA CCA TTA TGT GAG TTT ATC AAA GAA TCA TCC TAA ACC CTT TAG 240
7
Tyr Glu Pro Leu Cys Glu Phe Ile Lys Glu Ser Ser Gln Thr Leu Gln
775 780 785
CTA ATA GAT TTT GAC CAA AAC ACT GTA AGT GAT GAC TCT ATT AAA AAG 245
5
Leu Ile Asp Phe Asp Gln Asn Thr Val Ser Asp Asp Ser Ile Lys Lys
790 795 800
ATT TTA GAA TCT ATA TCT GAG TCT AAG TAT CAT CAT TAT TTG AGA TTG 250
3
Ile Leu Glu Ser Ile Ser Glu Ser Lys Tyr His His Tyr Leu Arg Leu
805 810 815
AAC CCT AGT TAA TCT AGC AGT TTA ATT AAA TCT GAA AAC GAA GAA ATT 255
1
Asn Pro Ser Gln Ser Ser Ser Leu Ile Lys Ser Glu Asn Glu Glu Ile
820 825 830 835
TAA GAA CTT CTC AAA GCT TGC GAC GAA AAA GGT GTT TTA GTA AAA GCA 259
9
Gln Glu Leu Leu Lys Ala Cys Asp Glu Lys Gly Val Leu Val Lys Ala
840 845 850
TAC TAT AAA TTC CCT CTA TGT TTA CCA ACT GGT ACT TAT TAC GAT TAC 264
7
Tyr Tyr Lys Phe Pro Leu Cys Leu Pro Thr Gly Thr Tyr Tyr Asp Tyr
855 860 865
AAT TCA GAT AGA TGG TGATTAATTA AATATTAGTT TAAATAAATA TTAAATATTG 270
2
Asn Ser Asp Arg Trp
870
AATATTTCTT TGCTTATTAT TTGAATAATA CATACAATAG TCATTTTTAG TGTTTTGAAT 276
2
ATATTTTAGT TATTTAATTC ATTATTTTAA GTAAATAATT ATTTTTCAAT CATTTTTTAA 282
2
AAAATCG 282
9
(2) INFORMATION FOR SEQ ID NO:221:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 872 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:221:
Met Ser Arg Arg Asn Gln Lys Lys Pro Gln Ala Pro Ile Gly Asn Glu
1 5 10 15
Thr Asn Leu Asp Phe Val Leu Gln Asn Leu Glu Val Tyr Lys Ser Gln
20 25 30
Ile Glu His Tyr Lys Thr Gln Gln Gln Gln Ile Lys Glu Glu Asp Leu
35 40 45
Lys Leu Leu Lys Phe Lys Asn Gln Asp Gln Asp Gly Asn Ser Gly Asn
50 55 60
Asp Asp Asp Asp Glu Glu Asn Asn Ser Asn Lys Gln Gln Glu Leu Leu
65 70 75 80
Arg Arg Val Asn Gln Ile Lys Gln Gln Val Gln Leu Ile Lys Lys Val
85 90 95
Gly Ser Lys Val Glu Lys Asp Leu Asn Leu Asn Glu Asp Glu Asn Lys
100 105 110
Lys Asn Gly Leu Ser Glu Gln Gln Val Lys Glu Glu Gln Leu Arg Thr
115 120 125
Ile Thr Glu Glu Gln Val Lys Tyr Gln Asn Leu Val Phe Asn Met Asp
130 135 140
Tyr Gln Leu Asp Leu Asn Glu Ser Gly Gly His Arg Arg His Arg Arg
145 150 155 160
Glu Thr Asp Tyr Asp Thr Glu Lys Trp Phe Glu Ile Ser His Asp Gln
165 170 175
Lys Asn Tyr Val Ser Ile Tyr Ala Asn Gln Lys Thr Ser Tyr Cys Trp
180 185 190
Trp Leu Lys Asp Tyr Phe Asn Lys Asn Asn Tyr Asp His Leu Asn Val
195 200 205
Ser Ile Asn Arg Leu Glu Thr Glu Ala Glu Phe Tyr Ala Phe Asp Asp
210 215 220
Phe Ser Gln Thr Ile Lys Leu Thr Asn Asn Ser Tyr Gln Thr Val Asn
225 230 235 240
Ile Asp Val Asn Phe Asp Asn Asn Leu Cys Ile Leu Ala Leu Leu Arg
245 250 255
Phe Leu Leu Ser Leu Glu Arg Phe Asn Ile Leu Asn Ile Arg Ser Ser
260 265 270
Tyr Thr Arg Asn Gln Tyr Asn Phe Glu Lys Ile Gly Glu Leu Leu Glu
275 280 285
Thr Ile Phe Ala Val Val Phe Ser His Arg His Leu Gln Gly Ile His
290 295 300
Leu Gln Val Pro Cys Glu Ala Phe Gln Tyr Leu Val Asn Ser Ser Ser
305 310 315 320
Gln Ile Ser Val Lys Asp Ser Gln Leu Gln Val Tyr Ser Phe Ser Thr
325 330 335
Asp Leu Lys Leu Val Asp Thr Asn Lys Val Gln Asp Tyr Phe Lys Phe
340 345 350
Leu Gln Glu Phe Pro Arg Leu Thr His Val Ser Gln Gln Ala Ile Pro
355 360 365
Val Ser Ala Thr Asn Ala Val Glu Asn Leu Asn Val Leu Leu Lys Lys
370 375 380
Val Lys His Ala Asn Leu Asn Leu Val Ser Ile Pro Thr Gln Phe Asn
385 390 395 400
Phe Asp Phe Tyr Phe Val Asn Leu Gln His Leu Lys Leu Glu Phe Gly
405 410 415
Leu Glu Pro Asn Ile Leu Thr Lys Gln Lys Leu Glu Asn Leu Leu Leu
420 425 430
Ser Ile Lys Gln Ser Lys Asn Leu Lys Phe Leu Arg Leu Asn Phe Tyr
435 440 445
Thr Tyr Val Ala Gln Glu Thr Ser Arg Lys Gln Ile Leu Lys Gln Ala
450 455 460
Thr Thr Ile Lys Asn Leu Lys Asn Asn Lys Asn Gln Glu Glu Thr Pro
465 470 475 480
Glu Thr Lys Asp Glu Thr Pro Ser Glu Ser Thr Ser Gly Met Lys Phe
485 490 495
Phe Asp His Leu Ser Glu Leu Thr Glu Leu Glu Asp Phe Ser Val Asn
500 505 510
Leu Gln Ala Thr Gln Glu Ile Tyr Asp Ser Leu His Lys Leu Leu Ile
515 520 525
Arg Ser Thr Asn Leu Lys Lys Phe Lys Leu Ser Tyr Lys Tyr Glu Met
530 535 540
Glu Lys Ser Lys Met Asp Thr Phe Ile Asp Leu Lys Asn Ile Tyr Glu
545 550 555 560
Thr Leu Asn Asn Leu Lys Arg Cys Ser Val Asn Ile Ser Asn Pro His
565 570 575
Gly Asn Ile Ser Tyr Glu Leu Thr Asn Lys Asp Ser Thr Phe Tyr Lys
580 585 590
Phe Lys Leu Thr Leu Asn Gln Glu Leu Gln His Ala Lys Tyr Thr Phe
595 600 605
Lys Gln Asn Glu Phe Gln Phe Asn Asn Val Lys Ser Ala Lys Ile Glu
610 615 620
Ser Ser Ser Leu Glu Ser Leu Glu Asp Ile Asp Ser Leu Cys Lys Ser
625 630 635 640
Ile Ala Ser Cys Lys Asn Leu Gln Asn Val Asn Ile Ile Ala Ser Leu
645 650 655
Leu Tyr Pro Asn Asn Ile Gln Lys Asn Pro Phe Asn Lys Pro Asn Leu
660 665 670
Leu Phe Phe Lys Gln Phe Glu Gln Leu Lys Asn Leu Glu Asn Val Ser
675 680 685
Ile Asn Cys Ile Leu Asp Gln His Ile Leu Asn Ser Ile Ser Glu Phe
690 695 700
Leu Glu Lys Asn Lys Lys Ile Lys Ala Phe Ile Leu Lys Arg Tyr Tyr
705 710 715 720
Leu Leu Gln Tyr Tyr Leu Asp Tyr Thr Lys Leu Phe Lys Thr Leu Gln
725 730 735
Gln Leu Pro Glu Leu Asn Gln Val Tyr Ile Asn Gln Gln Leu Glu Glu
740 745 750
Leu Thr Val Ser Glu Val His Lys Gln Val Trp Glu Asn His Lys Gln
755 760 765
Lys Ala Phe Tyr Glu Pro Leu Cys Glu Phe Ile Lys Glu Ser Ser Gln
770 775 780
Thr Leu Gln Leu Ile Asp Phe Asp Gln Asn Thr Val Ser Asp Asp Ser
785 790 795 800
Ile Lys Lys Ile Leu Glu Ser Ile Ser Glu Ser Lys Tyr His His Tyr
805 810 815
Leu Arg Leu Asn Pro Ser Gln Ser Ser Ser Leu Ile Lys Ser Glu Asn
820 825 830
Glu Glu Ile Gln Glu Leu Leu Lys Ala Cys Asp Glu Lys Gly Val Leu
835 840 845
Val Lys Ala Tyr Tyr Lys Phe Pro Leu Cys Leu Pro Thr Gly Thr Tyr
850 855 860
Tyr Asp Tyr Asn Ser Asp Arg Trp
865 870
(2) INFORMATION FOR SEQ ID NO:222:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 884 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(ix) FEATURE:
(A) NAME/KEY: Protein
(B) LOCATION: 1..884
(D) OTHER INFORMATION: /note= "Saccharomyces cerevisiae
ESTp (L8543.12)"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:222:
Met Lys Ile Leu Phe Glu Phe Ile Gln Asp Lys Leu Asp Ile Asp Leu
1 5 10 15
Gln Thr Asn Ser Thr Tyr Lys Glu Asn Leu Lys Cys Gly His Phe Asn
20 25 30
Gly Leu Asp Glu Ile Leu Thr Thr Cys Phe Ala Leu Pro Asn Ser Arg
35 40 45
Lys Ile Ala Leu Pro Cys Leu Pro Gly Asp Leu Ser His Lys Ala Val
50 55 60
Ile Asp His Cys Ile Ile Tyr Leu Leu Thr Gly Glu Leu Tyr Asn Asn
65 70 75 80
Val Leu Thr Phe Gly Tyr Lys Ile Ala Arg Asn Glu Asp Val Asn Asn
85 90 95
Ser Leu Phe Cys His Ser Ala Asn Val Asn Val Thr Leu Leu Lys Gly
100 105 110
Ala Ala Trp Lys Met Phe His Ser Leu Val Gly Thr Tyr Ala Phe Val
115 120 125
Asp Leu Leu Ile Asn Tyr Thr Val Ile Gln Phe Asn Gly Gln Phe Phe
130 135 140
Thr Gln Ile Val Gly Asn Arg Cys Asn Glu Pro His Leu Pro Pro Lys
145 150 155 160
Trp Val Gln Arg Ser Ser Ser Ser Ser Ala Thr Ala Ala Gln Ile Lys
165 170 175
Gln Leu Thr Glu Pro Val Thr Asn Lys Gln Phe Leu His Lys Leu Asn
180 185 190
Ile Asn Ser Ser Ser Phe Phe Pro Tyr Ser Lys Ile Leu Pro Ser Ser
195 200 205
Ser Ser Ile Lys Lys Leu Thr Asp Leu Arg Glu Ala Ile Phe Pro Thr
210 215 220
Asn Leu Val Lys Ile Pro Gln Arg Leu Lys Val Arg Ile Asn Leu Thr
225 230 235 240
Leu Gln Lys Leu Leu Lys Arg His Lys Arg Leu Asn Tyr Val Ser Ile
245 250 255
Leu Asn Ser Ile Cys Pro Pro Leu Glu Gly Thr Val Leu Asp Leu Ser
260 265 270
His Leu Ser Arg Gln Ser Pro Lys Glu Arg Val Leu Lys Phe Ile Ile
275 280 285
Val Ile Leu Gln Lys Leu Leu Pro Gln Glu Met Phe Gly Ser Lys Lys
290 295 300
Asn Lys Gly Lys Ile Ile Lys Asn Leu Asn Leu Leu Leu Ser Leu Pro
305 310 315 320
Leu Asn Gly Tyr Leu Pro Phe Asp Ser Leu Leu Lys Lys Leu Arg Leu
325 330 335
Lys Asp Phe Arg Trp Leu Phe Ile Ser Asp Ile Trp Phe Thr Lys His
340 345 350
Asn Phe Glu Asn Leu Asn Gln Leu Ala Ile Cys Phe Ile Ser Trp Leu
355 360 365
Phe Arg Gln Leu Ile Pro Lys Ile Ile Gln Thr Phe Phe Tyr Cys Thr
370 375 380
Glu Ile Ser Ser Thr Val Thr Ile Val Tyr Phe Arg His Asp Thr Trp
385 390 395 400
Asn Lys Leu Ile Thr Pro Phe Ile Val Glu Tyr Phe Lys Thr Tyr Leu
405 410 415
Val Glu Asn Asn Val Cys Arg Asn His Asn Ser Tyr Thr Leu Ser Asn
420 425 430
Phe Asn His Ser Lys Met Arg Ile Ile Pro Lys Lys Ser Asn Asn Glu
435 440 445
Phe Arg Ile Ile Ala Ile Pro Cys Arg Gly Ala Asp Glu Glu Glu Phe
450 455 460
Thr Ile Tyr Lys Glu Asn His Lys Asn Ala Ile Gln Pro Thr Gln Lys
465 470 475 480
Ile Leu Glu Tyr Leu Arg Asn Lys Arg Pro Thr Ser Phe Thr Lys Ile
485 490 495
Tyr Ser Pro Thr Gln Ile Ala Asp Arg Ile Lys Glu Phe Lys Gln Arg
500 505 510
Leu Leu Lys Lys Phe Asn Asn Val Leu Pro Glu Leu Tyr Phe Met Lys
515 520 525
Phe Asp Val Lys Ser Cys Tyr Asp Ser Ile Pro Arg Met Glu Cys Met
530 535 540
Arg Ile Leu Lys Asp Ala Leu Lys Asn Glu Asn Gly Phe Phe Val Arg
545 550 555 560
Ser Gln Tyr Phe Phe Asn Thr Asn Thr Gly Val Leu Lys Leu Phe Asn
565 570 575
Val Val Asn Ala Ser Arg Val Pro Lys Pro Tyr Glu Leu Tyr Ile Asp
580 585 590
Asn Val Arg Thr Val His Leu Ser Asn Gln Asp Val Ile Asn Val Val
595 600 605
Glu Met Glu Ile Phe Lys Thr Ala Leu Trp Val Glu Asp Lys Cys Tyr
610 615 620
Ile Arg Glu Asp Gly Leu Phe Gln Gly Ser Ser Leu Ser Ala Pro Ile
625 630 635 640
Val Asp Leu Val Tyr Asp Asp Leu Leu Glu Phe Tyr Ser Glu Phe Lys
645 650 655
Ala Ser Pro Ser Gln Asp Thr Leu Ile Leu Lys Leu Ala Asp Asp Phe
660 665 670
Leu Ile Ile Ser Thr Asp Gln Gln Gln Val Ile Asn Ile Lys Lys Leu
675 680 685
Ala Met Gly Gly Phe Gln Lys Tyr Asn Ala Lys Ala Asn Arg Asp Lys
690 695 700
Ile Leu Ala Val Ser Ser Gln Ser Asp Asp Asp Thr Val Ile Gln Phe
705 710 715 720
Cys Ala Met His Ile Phe Val Lys Glu Leu Glu Val Trp Lys His Ser
725 730 735
Ser Thr Met Asn Asn Phe His Ile Arg Ser Lys Ser Ser Lys Gly Ile
740 745 750
Phe Arg Ser Leu Ile Ala Leu Phe Asn Thr Arg Ile Ser Tyr Lys Thr
755 760 765
Ile Asp Thr Asn Leu Asn Ser Thr Asn Thr Val Leu Met Gln Ile Asp
770 775 780
His Val Val Lys Asn Ile Ser Glu Cys Tyr Lys Ser Ala Phe Lys Asp
785 790 795 800
Leu Ser Ile Asn Val Thr Gln Asn Met Gln Phe His Ser Phe Leu Gln
805 810 815
Arg Ile Ile Glu Met Thr Val Ser Gly Cys Pro Ile Thr Lys Cys Asp
820 825 830
Pro Leu Ile Glu Tyr Glu Val Arg Phe Thr Ile Leu Asn Gly Phe Leu
835 840 845
Glu Ser Leu Ser Ser Asn Thr Ser Lys Phe Lys Asp Asn Ile Ile Leu
850 855 860
Leu Arg Lys Glu Ile Gln His Leu Gln Ala Tyr Ile Tyr Ile Tyr Ile
865 870 875 880
His Ile Val Asn
(2) INFORMATION FOR SEQ ID NO:223:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:223:
Leu Cys Val Ser Tyr Ile Leu Ser Ser Phe Tyr Tyr Ala Asn Leu Glu
1 5 10 15
Glu Asn Ala Leu Gln Phe Leu Arg Lys Glu Ser Met Asp Pro Glu Lys
20 25 30
Pro Glu Thr Asn Leu Leu Met Arg Leu Thr
35 40
(2) INFORMATION FOR SEQ ID NO:224:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:224:
Leu Cys Val Ser Ser Ile Leu Ser Ser Phe Tyr Tyr Ala Thr Leu Glu
1 5 10 15
Glu Ser Ser Leu Gly Phe Leu Arg Asp Glu Ser Met Asn Pro Glu Asn
20 25 30
Pro Asn Val Asn Leu Leu Met Arg Leu Thr
35 40
(2) INFORMATION FOR SEQ ID NO:225:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 2631 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: nucleic acid
(B) LOCATION: 1..2631
(D) OTHER INFORMATION: /note= "Saccharomyces cerevisiae
EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:225:
ATTTATACTC ATGAAAATCT TATTCGAGTT CATTCAAGAC AAGCTTGACA TTGATCTACA 6
0
GACCAACAGT ACTTACAAAG AAAATTTAAA ATGTGGTCAC TTCAATGGCC TCGATGAAAT 12
0
TCTAACTACG TGTTTCGCAC TACCAAATTC AAGAAAAATA GCATTACCAT GCCTTCCTGG 18
0
TGACTTAAGC CACAAAGCAG TCATTGATCA CTGCATCATT TACCTGTTGA CGGGCGAATT 24
0
ATACAACAAC GTACTAACAT TTGGCTATAA AATAGCTAGA AATGAAGATG TCAACAATAG 30
0
TCTTTTTTGC CATTCTGCAA ATGTTAACGT TACGTTACTG AAAGGCGCTG CTTGGAAAAT 36
0
GTTCCACAGT TTGGTCGGTA CATACGCATT CGTTGATTTA TTGATCAATT ATACAGTAAT 42
0
TCAATTTAAT GGGCAGTTTT TCACTCAAAT CGTGGGTAAC AGATGTAACG AACCTCATCT 48
0
GCCGCCCAAA TGGGTCCAAC GATCATCCTC ATCATCCGCA ACTGCTGCGC AAATCAAACA 54
0
ACTTACAGAA CCAGTGACAA ATAAACAATT CTTACACAAG CTCAATATAA ATTCCTCTTC 60
0
TTTTTTTCCT TATAGCAAGA TCCTTCCTTC ATCATCATCT ATCAAAAAGC TAACTGACTT 66
0
GAGAGAAGCT ATTTTTCCCA CAAATTTGGT TAAAATTCCT CAGAGACTAA AGGTACGAAT 72
0
TAATTTGACG CTGCAAAAGC TATTAAAGAG ACATAAGCGT TTGAATTACG TTTCTATTTT 78
0
GAATAGTATT TGCCCACCAT TGGAAGGGAC CGTATTGGAC TTGTCGCATT TGAGTAGGCA 84
0
ATCACCAAAG GAACGAGTCT TGAAATTTAT CATTGTTATT TTACAGAAGT TATTACCCCA 90
0
AGAAATGTTT GGCTCAAAGA AAAATAAAGG AAAAATTATC AAGAATCTAA ATCTTTTATT 96
0
AAGTTTACCC TTAAATGGCT ATTTACCATT TGATAGTTTG TTGAAAAAGT TAAGATTAAA 102
0
GGATTTTCGG TGGTTGTTCA TTTCTGATAT TTGGTTCACC AAGCACAATT TTGAAAACTT 108
0
GAATCAATTG GCGATTTGTT TCATTTCCTG GCTATTTAGA CAACTAATTC CCAAAATTAT 114
0
ACAGACTTTT TTTTACTGCA CCGAAATATC TTCTACAGTG ACAATTGTTT ACTTTAGACA 120
0
TGATACTTGG AATAAACTTA TCACCCCTTT TATCGTAGAA TATTTTAAGA CGTACTTAGT 126
0
CGAAAACAAC GTATGTAGAA ACCATAATAG TTACACGTTG TCCAATTTCA ATCATAGCAA 132
0
AATGAGGATT ATACCAAAAA AAAGTAATAA TGAGTTCAGG ATTATTGCCA TCCCATGCAG 138
0
AGGGGCAGAC GAAGAAGAAT TCACAATTTA TAAGGAGAAT CACAAAAATG CTATCCAGCC 144
0
CACTCAAAAA ATTTTAGAAT ACCTAAGAAA CAAAAGGCCG ACTAGTTTTA CTAAAATATA 150
0
TTCTCCAACG CAAATAGCTG ACCGTATCAA AGAATTTAAG CAGAGACTTT TAAAGAAATT 156
0
TAATAATGTC TTACCAGAGC TTTATTTCAT GAAATTTGAT GTCAAATCTT GCTATGATTC 162
0
CATACCAAGG ATGGAATGTA TGAGGATACT CAAGGATGCG CTAAAAAATG AAAATGGGTT 168
0
TTTCGTTAGA TCTCAATATT TCTTCAATAC CAATACAGGT GTATTGAAGT TATTTAATGT 174
0
TGTTAACGCT AGCAGAGTAC CAAAACCTTA TGAGCTATAC ATAGATAATG TGAGGACGGT 180
0
TCATTTATCA AATCAGGATG TTATAAACGT TGTAGAGATG GAAATATTTA AAACAGCTTT 186
0
GTGGGTTGAA GATAAGTGCT ACATTAGAGA AGATGGTCTT TTTCAGGGCT CTAGTTTATC 192
0
TGCTCCGATC GTTGATTTGG TGTATGACGA TCTTCTGGAG TTTTATAGCG AGTTTAAAGC 198
0
CAGTCCTAGC CAGGACACAT TAATTTTAAA ACTGGCTGAC GATTTCCTTA TAATATCAAC 204
0
AGACCAACAG CAAGTGATCA ATATCAAAAA GCTTGCCATG GGCGGATTTC AAAAATATAA 210
0
TGCGAAAGCC AATAGAGACA AAATTTTAGC CGTAAGCTCC CAATCAGATG ATGATACGGT 216
0
TATTCAATTT TGTGCAATGC ACATATTTGT TAAAGAATTG GAAGTTTGGA AACATTCAAG 222
0
CACAATGAAT AATTTCCATA TCCGTTCGAA ATCTAGTAAA GGGATATTTC GAAGTTTAAT 228
0
AGCGCTGTTT AACACTAGAA TCTCTTATAA AACAATTGAC ACAAATTTAA ATTCAACAAA 234
0
CACCGTTCTC ATGCAAATTG ATCATGTTGT AAAGAACATT TCGGAATGTT ATAAATCTGC 240
0
TTTTAAGGAT CTATCAATTA ATGTTACGCA AAATATGCAA TTTCATTCGT TCTTACAACG 246
0
CATCATTGAA ATGACAGTCA GCGGTTGTCC AATTACGAAA TGTGATCCTT TAATCGAGTA 252
0
TGAGGTACGA TTCACCATAT TGAATGGATT TTTGGAAAGC CTATCTTCAA ACACATCAAA 258
0
ATTTAAAGAT AATATCATTC TTTTGAGAAA GGAAATTCAA CACTTGCAAG C 263
1
(2) INFORMATION FOR SEQ ID NO:226:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 157 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:226:
Phe Phe Tyr Cys Thr Glu Ile Ser Ser Thr Val Thr Ile Val Tyr Phe
1 5 10 15
Arg His Asp Thr Trp Asn Lys Leu Ile Thr Pro Phe Ile Val Glu Tyr
20 25 30
Phe Lys Thr Tyr Leu Val Glu Asn Asn Val Cys Arg Asn His Asn Ser
35 40 45
Tyr Thr Leu Ser Asn Phe Asn His Ser Lys Met Arg Ile Ile Pro Lys
50 55 60
Lys Ser Asn Asn Glu Phe Arg Ile Ile Ala Ile Pro Cys Arg Gly Ala
65 70 75 80
Asp Glu Glu Glu Phe Thr Ile Tyr Lys Glu Asn His Lys Asn Ala Ile
85 90 95
Gln Pro Thr Gln Lys Ile Leu Glu Tyr Leu Arg Asn Lys Arg Pro Thr
100 105 110
Ser Phe Thr Lys Ile Tyr Ser Pro Thr Gln Ile Ala Asp Arg Ile Lys
115 120 125
Glu Phe Lys Gln Arg Leu Leu Lys Lys Phe Asn Asn Val Leu Pro Glu
130 135 140
Leu Tyr Phe Met Lys Phe Asp Val Lys Ser Cys Tyr Asp
145 150 155
(2) INFORMATION FOR SEQ ID NO:227:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 155 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:227:
Phe Phe Tyr Val Thr Glu Gln Gln Lys Ser Tyr Ser Lys Thr Tyr Tyr
1 5 10 15
Tyr Arg Lys Asn Ile Trp Asp Val Ile Met Lys Met Ser Ile Ala Asp
20 25 30
Leu Lys Lys Glu Thr Leu Ala Glu Val Gln Glu Lys Glu Val Glu Glu
35 40 45
Trp Lys Lys Ser Leu Gly Phe Ala Pro Gly Lys Leu Arg Leu Ile Pro
50 55 60
Lys Lys Thr Thr Phe Arg Pro Ile Met Thr Phe Asn Lys Lys Ile Val
65 70 75 80
Asn Ser Asp Arg Lys Thr Thr Lys Leu Thr Thr Asn Thr Lys Leu Leu
85 90 95
Asn Ser His Leu Met Leu Lys Thr Leu Lys Asn Arg Met Phe Lys Asp
100 105 110
Pro Phe Gly Phe Ala Val Phe Asn Tyr Asp Asp Val Met Lys Lys Tyr
115 120 125
Glu Glu Phe Val Cys Lys Trp Lys Gln Val Gly Gln Pro Lys Leu Phe
130 135 140
Phe Ala Thr Met Asp Ile Glu Lys Cys Tyr Asp
145 150 155
(2) INFORMATION FOR SEQ ID NO:228:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 158 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:228:
Lys His Lys Glu Gly Ser Gln Ile Phe Tyr Tyr Arg Lys Pro Ile Trp
1 5 10 15
Lys Leu Val Ser Lys Leu Thr Ile Val Lys Val Arg Ile Gln Phe Ser
20 25 30
Glu Lys Asn Lys Gln Met Lys Asn Asn Phe Tyr Gln Lys Ile Gln Leu
35 40 45
Glu Glu Glu Asn Leu Glu Lys Val Glu Glu Lys Leu Ile Pro Glu Asp
50 55 60
Ser Phe Gln Lys Tyr Pro Gln Gly Lys Leu Arg Ile Ile Pro Lys Lys
65 70 75 80
Gly Ser Phe Arg Pro Ile Met Thr Phe Leu Arg Lys Asp Lys Gln Lys
85 90 95
Asn Ile Lys Leu Asn Leu Asn Gln Ile Leu Met Asp Ser Gln Leu Val
100 105 110
Phe Arg Asn Leu Lys Asp Met Leu Gly Gln Lys Ile Gly Tyr Ser Val
115 120 125
Phe Asp Asn Lys Gln Ile Ser Glu Lys Phe Ala Gln Phe Ile Glu Lys
130 135 140
Trp Lys Asn Lys Gly Arg Pro Gln Leu Tyr Tyr Val Thr Leu
145 150 155
(2) INFORMATION FOR SEQ ID NO:229:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:229:
Tyr Tyr Tyr Arg Lys
1 5
(2) INFORMATION FOR SEQ ID NO:230:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 9 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:230:
Gly Lys Leu Arg Ile Ile Pro Lys Lys
1 5
(2) INFORMATION FOR SEQ ID NO:231:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 7 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:231:
Phe Arg Pro Ile Met Thr Phe
1 5
(2) INFORMATION FOR SEQ ID NO:232:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:232:
Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe
1 5 10 15
Tyr Arg Lys Ser Val Trp Ser Lys
20
(2) INFORMATION FOR SEQ ID NO:233:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:233:
Arg Gln His Leu Lys Arg Val Gln Leu Arg Asp Val Ser Glu Ala Glu
1 5 10 15
Val Arg Gln His Arg Glu Ala
20
(2) INFORMATION FOR SEQ ID NO:234:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:234:
Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg
1 5 10 15
Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu
20 25
(2) INFORMATION FOR SEQ ID NO:235:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 28 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:235:
Ala Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu
1 5 10 15
Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln
20 25
(2) INFORMATION FOR SEQ ID NO:236:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:236:
Leu Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly
1 5 10 15
Ile Arg Gln His Leu Lys Arg Val Gln Leu Arg Asp Val Ser
20 25 30
(2) INFORMATION FOR SEQ ID NO:237:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:237:
Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro Lys Pro Asp Gly
1 5 10 15
Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val
20 25
(2) INFORMATION FOR SEQ ID NO:238:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:238:
YARACHAARG GHATYCCHYA RGG 2
3
(2) INFORMATION FOR SEQ ID NO:239:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 8 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:239:
Gln Thr Lys Gly Ile Pro Gln Gly
1 5
(2) INFORMATION FOR SEQ ID NO:240:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 7 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:240:
Asp Asp Tyr Leu Leu Ile Thr
1 5
(2) INFORMATION FOR SEQ ID NO:241:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:241:
NGTNATDARD ARRTARTCRT C 2
1
(2) INFORMATION FOR SEQ ID NO:242:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 55 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:242:
Lys Gly Ile Pro Gln Gly Leu Cys Val Ser Ser Ile Leu Ser Ser Phe
1 5 10 15
Tyr Tyr Ala Thr Leu Glu Glu Ser Ser Leu Gly Phe Leu Arg Asp Glu
20 25 30
Ser Met Asn Pro Glu Asn Pro Asn Val Asn Leu Leu Met Arg Leu Thr
35 40 45
Asp Asp Tyr Leu Leu Ile Thr
50 55
(2) INFORMATION FOR SEQ ID NO:243:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:243:
Ser Ile Leu Ser Ser Phe Leu Cys His Phe Tyr Met Glu Asp Leu Ile
1 5 10 15
Asp Glu Tyr Leu Ser Phe Thr Lys Lys Lys Gly Ser Val Leu Leu Arg
20 25 30
Val Val
(2) INFORMATION FOR SEQ ID NO:244:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 49 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:244:
Asp Gly Leu Phe Gln Gly Ser Ser Leu Ser Ala Pro Ile Val Asp Leu
1 5 10 15
Val Tyr Asp Asp Leu Leu Glu Phe Tyr Ser Glu Phe Lys Ala Ser Pro
20 25 30
Ser Gln Asp Thr Leu Ile Leu Lys Leu Ala Asp Asp Phe Leu Ile Ile
35 40 45
Ser
(2) INFORMATION FOR SEQ ID NO:245:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 8 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:245:
Gln Lys Val Gly Ile Pro Gln Gly
1 5
(2) INFORMATION FOR SEQ ID NO:246:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:246:
CAAAAAGTTG GTATCCCTCA GGG 2
3
(2) INFORMATION FOR SEQ ID NO:247:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 146 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:247:
AGACCAAAGG AATTCCATCA GGCTCAATTC TGTCATCTTT TTTGTGTCAT TTCTATATGG 6
0
AAGATTTGAT TGATGAATAC CTATCGTTTA CGAAAAAGAA AGGATCAGTG TTGTTACGAG 12
0
TAGTCGACGA CTACCTCCTC ATCACC 14
6
(2) INFORMATION FOR SEQ ID NO:248:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 47 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:248:
Lys Gly Ile Pro Ser Gly Ser Ile Leu Ser Ser Phe Leu Cys His Phe
1 5 10 15
Tyr Met Glu Asp Leu Ile Asp Glu Tyr Leu Ser Phe Thr Lys Lys Lys
20 25 30
Gly Ser Val Leu Leu Arg Val Val Asp Asp Tyr Leu Leu Ile Thr
35 40 45
(2) INFORMATION FOR SEQ ID NO:249:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:249:
GACGATTTCC TCTTTATAAC A 2
1
(2) INFORMATION FOR SEQ ID NO:250:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 7 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:250:
Asp Asp Phe Leu Phe Ile Thr
1 5
(2) INFORMATION FOR SEQ ID NO:251:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..35
(D) OTHER INFORMATION: /note= "motif 0 peptide from
Schizosaccharomyces pombe tez1p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:251:
Trp Leu Tyr Asn Ser Phe Ile Ile Pro Ile Leu Gln Ser Phe Phe Tyr
1 5 10 15
Ile Thr Glu Ser Ser Asp Leu Arg Asn Arg Thr Val Tyr Phe Arg Lys
20 25 30
Asp Ile Trp
35
(2) INFORMATION FOR SEQ ID NO:252:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..22
(D) OTHER INFORMATION: /note= "motif 1 and 2 peptide from
Schizosaccharomyces pombe tez1p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:252:
Ala Val Ile Arg Leu Leu Pro Lys Lys Asn Thr Phe Arg Leu Ile Thr
1 5 10 15
Asn Leu Arg Lys Arg Phe
20
(2) INFORMATION FOR SEQ ID NO:253:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..26
(D) OTHER INFORMATION: /note= "motif 3(A) peptide from
Schizosaccharomyces pombe tez1p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:253:
Lys Lys Tyr Phe Val Arg Ile Asp Ile Lys Ser Cys Tyr Asp Arg Ile
1 5 10 15
Lys Gln Asp Leu Met Phe Arg Ile Val Lys
20 25
(2) INFORMATION FOR SEQ ID NO:254:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 32 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..32
(D) OTHER INFORMATION: /note= "motif 4(B’) peptide from
Schizosaccharomyces pombe tez1p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:254:
Tyr Leu Gln Lys Val Gly Ile Pro Gln Gly Ser Ile Leu Ser Ser Phe
1 5 10 15
Leu Cys His Phe Tyr Met Glu Asp Leu Ile Asp Glu Tyr Leu Ser Phe
20 25 30
(2) INFORMATION FOR SEQ ID NO:255:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 49 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..49
(D) OTHER INFORMATION: /note= "motif 5(C) and 6(D) peptide fro
m
Schizosaccharomyces pombe tez1p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:255:
Val Leu Leu Arg Val Val Asp Asp Phe Leu Phe Ile Thr Val Asn Lys
1 5 10 15
Lys Asp Ala Lys Lys Phe Leu Asn Leu Ser Leu Arg Gly Phe Glu Lys
20 25 30
His Asn Phe Ser Thr Ser Leu Glu Lys Thr Val Ile Asn Phe Glu Asn
35 40 45
Ser
(2) INFORMATION FOR SEQ ID NO:256:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..34
(D) OTHER INFORMATION: /note= "motif 0 peptide from
Saccharomyces cerevisiae EST2p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:256:
Trp Leu Phe Arg Gln Leu Ile Pro Lys Ile Ile Gln Thr Phe Phe Tyr
1 5 10 15
Cys Thr Glu Ile Ser Ser Thr Val Thr Ile Val Tyr Phe Arg His Asp
20 25 30
Thr Trp
(2) INFORMATION FOR SEQ ID NO:257:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..25
(D) OTHER INFORMATION: /note= "motif 1 and 2 peptide from
Saccharomyces cerevisiae EST2p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:257:
Ser Lys Met Arg Ile Ile Pro Lys Lys Ser Asn Asn Glu Phe Arg Ile
1 5 10 15
Ile Ala Ile Pro Cys Arg Gly Ala Asp
20 25
(2) INFORMATION FOR SEQ ID NO:258:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..26
(D) OTHER INFORMATION: /note= "motif 3(A) peptide from
Saccharomyces cerevisiae EST2p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:258:
Glu Leu Tyr Phe Met Lys Phe Asp Val Lys Ser Cys Tyr Asp Ser Ile
1 5 10 15
Pro Arg Met Glu Cys Met Arg Ile Leu Lys
20 25
(2) INFORMATION FOR SEQ ID NO:259:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 32 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..32
(D) OTHER INFORMATION: /note= "motif 4(B’) peptide from
Saccharomyces cerevisiae EST2p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:259:
Tyr Ile Arg Glu Asp Gly Leu Phe Gln Gly Ser Ser Leu Ser Ala Pro
1 5 10 15
Ile Val Asp Leu Val Tyr Asp Asp Leu Leu Glu Phe Tyr Ser Glu Phe
20 25 30
(2) INFORMATION FOR SEQ ID NO:260:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 49 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..49
(D) OTHER INFORMATION: /note= "motif 5(C) peptide from
Saccharomyces cerevisiae EST2p"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:260:
Leu Ile Leu Lys Leu Ala Asp Asp Phe Leu Ile Ile Ser Thr Asp Gln
1 5 10 15
Gln Gln Val Ile Asn Ile Lys Lys Leu Ala Met Gly Gly Phe Gln Lys
20 25 30
Tyr Asn Ala Lys Ala Asn Arg Asp Lys Ile Leu Ala Val Ser Ser Gln
35 40 45
Ser
(2) INFORMATION FOR SEQ ID NO:261:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..35
(D) OTHER INFORMATION: /note= "motif 0 peptide from
Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:261:
Trp Ile Phe Glu Asp Leu Val Val Ser Leu Ile Arg Cys Phe Phe Tyr
1 5 10 15
Val Thr Glu Gln Gln Lys Ser Tyr Ser Lys Thr Tyr Tyr Tyr Arg Lys
20 25 30
Asn Ile Trp
35
(2) INFORMATION FOR SEQ ID NO:262:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..23
(D) OTHER INFORMATION: /note= "motif 1 and 2 peptide from
Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:262:
Gly Lys Leu Arg Leu Ile Pro Lys Lys Thr Thr Phe Arg Pro Ile Met
1 5 10 15
Thr Phe Asn Lys Lys Ile Val
20
(2) INFORMATION FOR SEQ ID NO:263:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..26
(D) OTHER INFORMATION: /note= "motif 3(A) peptide from
Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:263:
Lys Leu Phe Phe Ala Thr Met Asp Ile Glu Lys Cys Tyr Asp Ser Val
1 5 10 15
Asn Arg Glu Lys Leu Ser Thr Phe Leu Lys
20 25
(2) INFORMATION FOR SEQ ID NO:264:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 32 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..32
(D) OTHER INFORMATION: /note= "motif 4(B’) peptide from
Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:264:
Tyr Lys Gln Thr Lys Gly Ile Pro Gln Gly Leu Cys Val Ser Ser Ile
1 5 10 15
Leu Ser Ser Phe Tyr Tyr Ala Thr Leu Glu Glu Ser Ser Leu Gly Phe
20 25 30
(2) INFORMATION FOR SEQ ID NO:265:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 49 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..49
(D) OTHER INFORMATION: /note= "motif 5(C) and 6(D) peptide fro
m
Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:265:
Leu Leu Met Arg Leu Thr Asp Asp Tyr Leu Leu Ile Thr Thr Gln Glu
1 5 10 15
Asn Asn Ala Val Leu Phe Ile Glu Lys Leu Ile Asn Val Ser Arg Glu
20 25 30
Asn Gly Phe Lys Phe Asn Met Lys Lys Leu Gln Thr Ser Phe Pro Leu
35 40 45
Ser
(2) INFORMATION FOR SEQ ID NO:266:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 2171 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: 22..1716
(D) OTHER INFORMATION: /note= "EcoRI-NotI insert of
clone 712562 encoding 63 kDa
telomerase protein"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:266:
GCCAAGTTCC TGCACTGGCT GATGAGTGTG TACGTCGTCG AGCTGCTCAG GTCTTTCTTT 6
0
TATGTCACGG AGACCACGTT TCAAAAGAAC AGGCTCTTTT TCTACCGGAA GAGTGTCTGG 12
0
AGCAAGTTGC AAAGCATTGG AATCAGACAG CACTTGAAGA GGGTGCAGCT GCGGGAGCTG 18
0
TCGGAAGCAG AGGTCAGGCA GCATCGGGAA GCCAGGCCCG CCCTGCTGAC GTCCAGACTC 24
0
CGCTTCATCC CCAAGCCTGA CGGGCTGCGG CCGATTGTGA ACATGGACTA CGTCGTGGGA 30
0
GCCAGAACGT TCCGCAGAGA AAAGARGGCC GAGCGTCTCA CCTCGAGGGT GAAGGCACTG 36
0
TTCAGCGTGC TCAACTACGA GCGGGCGCGG CGCCCCGGCC TCCTGGGCGC CTCTGTGCTG 42
0
GGCCTGGACG ATATCCACAG GGCCTGGCGC ACCTTCGTGC TGCGTGTGCG GGCCCAGGAC 48
0
CCGCCGCCTG AGCTGTACTT TGTCAAGGTG GATGTGACGG GCGCGTACGA CACCATCCCC 54
0
CAGGACAGGC TCACGGAGGT CATCGCCAGC ATCATCAAAC CCCAGAACAC GTACTGCGTG 60
0
CGTCGGTATG CCGTGGTCCA GAAGGCCGCC ATGGGCACGT CCGCAAGGCC TTCAAGAGCC 66
0
ACGTCCTACG TCCAGTGCCA GGGGATCCCG CAGGGCTCCA TCCTCTCCAC GCTGCTCTGC 72
0
AGCCTGTGCT ACGGCGACAT GGAGAACAAG CTGTTTGCGG GGATTCGGCG GGACGGGCTG 78
0
CTCCTGCGTT TGGTGGATGA TTTCTTGTTG GTGACACCTC ACCTCACCCA CGCGAAAACC 84
0
TTCCTCAGGA CCCTGGTCCG AGGTGTCCCT GAGTATGGCT GCGTGGTGAA CTTGCGGAAG 90
0
ACAGTGGTGA ACTTCCCTGT AGAAGACGAG GCCCTGGGTG GCACGGCTTT TGTTCAGATG 96
0
CCGGCCCACG GCCTATTCCC CTGGTGCGGC CTGCTGCTGG ATACCCGGAC CCTGGAGGTG 102
0
CAGAGCGACT ACTCCAGCTA TGCCCGGACC TCCATCAGAG CCAGTCTCAC CTTCAACCGC 108
0
GGCTTCAAGG CTGGGAGGAA CATGCGTCGC AAACTCTTTG GGGTCTTGCG GCTGAAGTGT 114
0
CACAGCCTGT TTCTGGATTT GCAGGTGAAC AGCCTCCAGA CGGTGTGCAC CAACATCTAC 120
0
AAGATCCTCC TGCTGCAGGC GTACAGGTTT CACGCATGTG TGCTGCAGCT CCCATTTCAT 126
0
CAGCAAGTTT GGAAGAACCC ACATTTTTCC TGCGCGTCAT CTCTGACACG GCTCCCTCTG 132
0
CTACTCCATC CTGAAAGCCA AGAACGCAGG GATGTCGCTG GGGGCCAAGG GCGCCGCCGG 138
0
CCCTCTGCCC TCCGAGGCCG TGCAGTGGCT GTGCCACCAA GCATTCCTGC TCAAGCTGAC 144
0
TCGACACCGT GTCACCTACG TGCCACTCCT GGGGTCACTC AGGACAGCCC AGACGCAGCT 150
0
GAGTCGGAAG CTCCCGGGGA CGACGCTGAC TGCCCTGGAG GCCGCAGCCA ACCCGGCACT 156
0
GCCCTCAGAC TTCAAGACCA TCCTGGACTG ATGGCCACCC GCCCACAGCC AGGCCGAGAG 162
0
CAGACACCAG CAGCCCTGTC ACGCCGGGCT TATACGTCCC AGGGAGGGAG GGGCGGCCCA 168
0
CACCCAGGCC TGCACCGCTG GGAGTCTGAG GCCTGAGTGA GTGTTTGGCC GAGGCCTGCA 174
0
TGTCCGGCTG AAGGCTGAGT GTCCGGCTGA GGCCTGAGCG AGTGTCCAGC CAAGGGCTGA 180
0
GTGTCCAGCA CACCTGCGTT TTCACTTCCC CACAGGCTGG CGTTCGGTCC ACCCCAGGGC 186
0
CAGCTTTTCC TCACCAGGAG CCCGGCTTCC ACTCCCCACA TAGGAATAGT CCATCCCCAG 192
0
ATTCGCCATT GTTCACCCTT CGCCCTGCCT TCCTTTGCCT TCCACCCCCA CCATTCAGGT 198
0
GGAGACCCTG AGAAGGACCC TGGGAGCTTT GGGAATTTGG AGTGACCAAA GGTGTGCCCT 204
0
GTACACAGGC GAGGACCCTG CACCTGGATG GGGGTCCCTG TGGGTCAAAT TGGGGGGAGG 210
0
TGCTGTGGGA GTAAAATACT GAATATATGA GTTTTTCAGT TTTGGAAAAA AAAAAAAAAA 216
0
AAAAAAAAAA A 217
1
(2) INFORMATION FOR SEQ ID NO:267:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 564 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(ix) FEATURE:
(A) NAME/KEY: Protein
(B) LOCATION: 1..564
(D) OTHER INFORMATION: /note= "63 kDa telomerase protein
encoded by ORF of EcoRI-NotI insert of
clone 712562"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:267:
Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr
1 5 10 15
Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg Lys Ser Val
20 25 30
Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His Leu Lys Arg Val
35 40 45
Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln His Arg Glu Ala
50 55 60
Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro Lys Pro Asp
65 70 75 80
Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val Gly Ala Arg Thr
85 90 95
Phe Arg Arg Glu Lys Xaa Ala Glu Arg Leu Thr Ser Arg Val Lys Ala
100 105 110
Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro Gly Leu Leu
115 120 125
Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His Arg Ala Trp Arg Thr
130 135 140
Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro Glu Leu Tyr Phe
145 150 155 160
Val Lys Val Asp Val Thr Gly Ala Tyr Asp Thr Ile Pro Gln Asp Arg
165 170 175
Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln Asn Thr Tyr Cys
180 185 190
Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala Met Gly Thr Ser Ala
195 200 205
Arg Pro Ser Arg Ala Thr Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln
210 215 220
Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp Met
225 230 235 240
Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu Arg
245 250 255
Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr His Ala Lys
260 265 270
Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys Val
275 280 285
Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu Ala
290 295 300
Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His Gly Leu Phe Pro
305 310 315 320
Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser Asp
325 330 335
Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn
340 345 350
Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly Val
355 360 365
Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn Ser
370 375 380
Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala
385 390 395 400
Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln Gln Val
405 410 415
Trp Lys Asn Pro His Phe Ser Cys Ala Ser Ser Leu Thr Arg Leu Pro
420 425 430
Leu Leu Leu His Pro Glu Ser Gln Glu Arg Arg Asp Val Ala Gly Gly
435 440 445
Gln Gly Arg Arg Arg Pro Ser Ala Leu Arg Gly Arg Ala Val Ala Val
450 455 460
Pro Pro Ser Ile Pro Ala Gln Ala Asp Ser Thr Pro Cys His Leu Arg
465 470 475 480
Ala Thr Pro Gly Val Thr Gln Asp Ser Pro Asp Ala Ala Glu Ser Glu
485 490 495
Ala Pro Gly Asp Asp Ala Asp Cys Pro Gly Gly Arg Ser Gln Pro Gly
500 505 510
Thr Ala Leu Arg Leu Gln Asp His Pro Gly Leu Met Ala Thr Arg Pro
515 520 525
Gln Pro Gly Arg Glu Gln Thr Pro Ala Ala Leu Ser Arg Arg Ala Tyr
530 535 540
Thr Ser Gln Gly Gly Arg Gly Gly Pro His Pro Gly Leu His Arg Trp
545 550 555 560
Glu Ser Glu Ala
(2) INFORMATION FOR SEQ ID NO:268:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..22
(D) OTHER INFORMATION: /note= "motif 1 peptide from
Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:268:
Leu Val Val Ser Leu Ile Arg Cys Phe Phe Tyr Val Thr Glu Gln Gln
1 5 10 15
Lys Ser Tyr Ser Lys Thr
20
(2) INFORMATION FOR SEQ ID NO:269:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..30
(D) OTHER INFORMATION: /note= "motif 0 peptide from
Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:269:
Lys Ser Leu Gly Phe Ala Pro Gly Lys Leu Arg Leu Ile Pro Lys Lys
1 5 10 15
Thr Thr Phe Arg Pro Ile Met Thr Phe Asn Lys Lys Ile Val
20 25 30
(2) INFORMATION FOR SEQ ID NO:270:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..27
(D) OTHER INFORMATION: /note= "motif A peptide from
Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:270:
Pro Lys Leu Phe Phe Ala Thr Met Asp Ile Glu Lys Cys Tyr Asp Ser
1 5 10 15
Val Asn Arg Glu Lys Leu Ser Thr Phe Leu Lys
20 25
(2) INFORMATION FOR SEQ ID NO:271:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..27
(D) OTHER INFORMATION: /note= "motif B peptide from
Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:271:
Asn Gly Lys Phe Tyr Lys Gln Thr Lys Gly Ile Pro Gln Gly Leu Cys
1 5 10 15
Val Ser Ser Ile Leu Ser Ser Phe Tyr Tyr Ala
20 25
(2) INFORMATION FOR SEQ ID NO:272:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 22
(D) OTHER INFORMATION: /note= "motif C peptide from
Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:272:
Pro Asn Val Asn Leu Leu Met Arg Leu Thr Asp Asp Tyr Leu Leu Ile
1 5 10 15
Thr Thr Gln Glu Asn Asn
20
(2) INFORMATION FOR SEQ ID NO:273:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 15 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..15
(D) OTHER INFORMATION: /note= "motif D peptide from
Euplotes aediculatus p123"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:273:
Asn Val Ser Arg Glu Asn Gly Phe Lys Phe Asn Met Lys Lys Leu
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:274:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..22
(D) OTHER INFORMATION: /note= "motif 1 peptide from
Schizosaccharomyces pombe tez1"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:274:
Phe Ile Ile Pro Ile Leu Gln Ser Phe Phe Tyr Ile Thr Glu Ser Ser
1 5 10 15
Asp Leu Arg Asn Arg Thr
20
(2) INFORMATION FOR SEQ ID NO:275:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..30
(D) OTHER INFORMATION: /note= "motif 0 peptide from
Schizosaccharomyces pombe tez1"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:275:
Gln Lys Thr Thr Leu Pro Pro Ala Val Ile Arg Leu Leu Pro Lys Lys
1 5 10 15
Asn Thr Phe Arg Leu Ile Thr Asn Leu Arg Lys Arg Phe Leu
20 25 30
(2) INFORMATION FOR SEQ ID NO:276:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..27
(D) OTHER INFORMATION: /note= "motif A peptide from
Schizosaccharomyces pombe tez1"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:276:
Arg Lys Lys Tyr Phe Val Arg Ile Asp Ile Lys Ser Cys Tyr Asp Arg
1 5 10 15
Ile Lys Gln Asp Leu Met Phe Arg Ile Val Lys
20 25
(2) INFORMATION FOR SEQ ID NO:277:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..27
(D) OTHER INFORMATION: /note= "motif B peptide from
Schizosaccharomyces pombe tez1"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:277:
Gly Asn Ser Gln Tyr Leu Gln Lys Val Gly Ile Pro Gln Gly Ser Ile
1 5 10 15
Leu Ser Ser Phe Leu Cys His Phe Tyr Met Glu
20 25
(2) INFORMATION FOR SEQ ID NO:278:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..22
(D) OTHER INFORMATION: /note= "motif C peptide from
Schizosaccharomyces pombe tez1"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:278:
Lys Lys Gly Ser Val Leu Leu Arg Val Val Asp Asp Phe Leu Phe Ile
1 5 10 15
Thr Val Asn Lys Lys Asp
20
(2) INFORMATION FOR SEQ ID NO:279:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 15 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..15
(D) OTHER INFORMATION: /note= "motif D peptide from
Schizosaccharomyces pombe tez1"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:279:
Leu Asn Leu Ser Leu Arg Gly Phe Glu Lys His Asn Phe Ser Thr
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:280:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..22
(D) OTHER INFORMATION: /note= "motif 1 peptide from
Saccharomyces cerevisiae EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:280:
Leu Ile Pro Lys Ile Ile Gln Thr Phe Phe Tyr Cys Thr Glu Ile Ser
1 5 10 15
Ser Thr Val Thr Ile Val
20
(2) INFORMATION FOR SEQ ID NO:281:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 32 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..32
(D) OTHER INFORMATION: /note= "motif 0 peptide from
Saccharomyces cerevisiae EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:281:
Thr Leu Ser Asn Phe Asn His Ser Lys Met Arg Ile Ile Pro Lys Lys
1 5 10 15
Ser Asn Asn Glu Phe Arg Ile Ile Ala Ile Pro Cys Arg Gly Ala Asp
20 25 30
(2) INFORMATION FOR SEQ ID NO:282:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..27
(D) OTHER INFORMATION: /note= "motif A peptide from
Saccharomyces cerevisiae EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:282:
Pro Glu Leu Tyr Phe Met Lys Phe Asp Val Lys Ser Cys Tyr Asp Ser
1 5 10 15
Ile Pro Arg Met Glu Cys Met Arg Ile Leu Lys
20 25
(2) INFORMATION FOR SEQ ID NO:283:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..27
(D) OTHER INFORMATION: /note= "motif B peptide from
Saccharomyces cerevisiae EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:283:
Glu Asp Lys Cys Tyr Ile Arg Glu Asp Gly Leu Phe Gln Gly Ser Ser
1 5 10 15
Leu Ser Ala Pro Ile Val Asp Leu Val Tyr Asp
20 25
(2) INFORMATION FOR SEQ ID NO:284:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..22
(D) OTHER INFORMATION: /note= "motif C peptide from
Saccharomyces cerevisiae EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:284:
Ser Gln Asp Thr Leu Ile Leu Lys Leu Ala Asp Asp Phe Leu Ile Ile
1 5 10 15
Ser Thr Asp Gln Gln Gln
20
(2) INFORMATION FOR SEQ ID NO:285:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 15 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..15
(D) OTHER INFORMATION: /note= "motif D peptide from
Saccharomyces cerevisiae EST2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:285:
Lys Lys Leu Ala Met Gly Gly Phe Gln Lys Tyr Asn Ala Lys Ala
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:286:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..22
(D) OTHER INFORMATION: /note= "motif 1 peptide from human
telomerase core protein 1 (TCP1)"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:286:
Tyr Val Val Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr
1 5 10 15
Phe Gln Lys Asn Arg Leu
20
(2) INFORMATION FOR SEQ ID NO:287:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..30
(D) OTHER INFORMATION: /note= "motif 0 peptide from human
telomerase core protein 1 (TCP1)"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:287:
Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro Lys Pro
1 5 10 15
Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val Gly
20 25 30
(2) INFORMATION FOR SEQ ID NO:288:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..27
(D) OTHER INFORMATION: /note= "motif A peptide from human
telomerase core protein 1 (TCP1)"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:288:
Pro Glu Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr Asp Thr
1 5 10 15
Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala
20 25
(2) INFORMATION FOR SEQ ID NO:289:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Protein
(B) LOCATION: 1..27
(D) OTHER INFORMATION: /note= "motif B peptide from human
telomerase core protein 1 (TCP1)"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:289:
Arg Ala Thr Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln Gly Ser Ile
1 5 10 15
Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly
20 25
(2) INFORMATION FOR SEQ ID NO:290:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..22
(D) OTHER INFORMATION: /note= "motif C peptide from human
telomerase core protein 1 (TCP1)"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:290:
Arg Arg Asp Gly Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val
1 5 10 15
Thr Pro His Leu Thr His
20
(2) INFORMATION FOR SEQ ID NO:291:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 15 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Peptide
(B) LOCATION: 1..15
(D) OTHER INFORMATION: /note= "motif D peptide from human
telomerase core protein 1 (TCP1)"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:291:
Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys Val Val
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:292:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4029 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(ix) FEATURE:
(A) NAME/KEY: nucleic acid
(B) LOCATION: 1..4029
(D) OTHER INFORMATION: /note= "preliminary sequence for
human TRT cDNA insert of
plasmid pGRN121"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:292:
GCAGCGCTGC GTCCTGCTGC GCACGTGGGA AGCCCTGGCC CCGGCCACCC CCGCGATGCC 6
0
GCGCGCTCCC CGCTGCCGAG CCGTGCGCTC CCTGCTGCGC AGCCACTACC GCGAGGTGCT 12
0
GCCGCTGGCC ACGTTCGTGC GGCGCCTGGG GCCCCAGGGC TGGCGGCTGG TGCAGCGCGG 18
0
GGACCCGGCG GCTTTCCGCG CGNTGGTGGC CCANTGCNTG GTGTGCGTGC CCTGGGANGN 24
0
ANGGCNGCCC CCCGCCGCCC CCTCCTTCCG CCAGGTGTCC TGCCTGAANG ANCTGGTGGC 30
0
CCGAGTGCTG CANANGCTGT GCGANCGCGG CGCGAANAAC GTGCTGGCCT TCGGCTTCGC 36
0
GCTGCTGGAC GGGGCCCGCG GGGGCCCCCC CGAGGCCTTC ACCACCAGCG TGCGCAGCTA 42
0
CCTGCCCAAC ACGGTGACCG ACGCACTGCG GGGGAGCGGG GCGTGGGGGC TGCTGCTGCG 48
0
CCGCGTGGGC GACGACGTGC TGGTTCACCT GCTGGCACGC TGCGCGNTNT TTGTGCTGGT 54
0
GGNTCCCAGC TGCGCCTACC ANGTGTGCGG GCCGCCGCTG TACCAGCTCG GCGCTGCNAC 60
0
TCAGGCCCGG CCCCCGCCAC ACGCTANTGG ACCCGAANGC GTCTGGGATC CAACGGGCCT 66
0
GGAACCATAG CGTCAGGGAG GCCGGGGTCC CCCTGGGCTG CCAGCCCCGG GTGCGAGGAG 72
0
GCGCGGGGGC AGTGCCAGCC GAAGTCTGCC GTTGCCCAAG AGGCCCAGGC GTGGCGCTGC 78
0
CCCTGAGCCG GAGCGGACGC CCGTTGGGCA GGGGTCCTGG GCCCACCCGG GCAGGACGCC 84
0
TGGACCGAGT GACCGTGGTT TCTGTGTGGT GTCACCTGCC AGACCCGCCG AAGAAGCCAC 90
0
CTCTTTGGAG GGTGCGCTCT CTGGCACGCG CCACTCCCAC CCATCCGTGG GCCGCCAGCA 96
0
CCACGCGGGC CCCCCATCCA CATCGCGGCC ACCACGTCCT GGGACACGCC TTGTCCCCCG 102
0
GTGTACGCCG AGACCAAGCA CTTCCTCTAC TCCTCAGGCG ACAAGNACAC TGCGNCCCTC 108
0
CTTCCTACTC AATATATCTG AGGCCCAGCC TGACTGGCGT TCGGGAGGTT CGTGGAGACA 114
0
NTCTTTCTGG TTCCAGGCCT TGGATGCCAG GATTCCCCGC AGGTTGCCCC GCCTGCCCCA 120
0
GCGNTACTGG CAAATGCGGC CCCTGTTTCT GGAGCTGCTT GGGAACCACG CGCAGTGCCC 126
0
CTACGGGGTG TTCCTCAAGA CGCACTGCCC GCTGCGAGCT GCGGTCACCC CAGCAGCCGG 132
0
TGTCTGTGCC CGGGAGAAGC CCCAGGGCTC TGTGGCGGCC CCCGAGGAGG AGGAACACAG 138
0
ACCCCCGTCG CCTGGTGCAG CTGCTCCGCC AGCACAGCAG CCCCTGGCAG GTGTACGGCT 144
0
TCGTGCGGGC CTGCCTGCGC CGGCTGGTGC CCCCAGGCCT CTGGGGCTCC AGGCACAACG 150
0
AACGCCGCTT CCTCAGGAAC ACCAAGAAGT TCATCTCCCT GGGGAAGCAT GCCAAGCTCT 156
0
CGCTGCAGGA GCTGACGTGG AAGATGAGCG TGCGGGACTG CGCTTGGCTG CGCAGGAGCC 162
0
CAGGGGTTGG CTGTGTTCCG GCCGCAGAGC ACCGTCTGCG TGAGGAGATC CTGGCCAAGT 168
0
TCCTGCACTG GCTGATGAGT GTGTACGTCG TCGAGCTGCT CAGGTCTTTC TTTTATGTCA 174
0
CGGAGACCAC GTTTCAAAAG AACAGGCTCT TTTTCTACCG GAAGAGTGTC TGGAGCAAGT 180
0
TGCAAAGCAT TGGAATCAGA CAGCACTTGA AGAGGGTGCA GCTGCGGGAG CTGTCGGAAG 186
0
CAGAGGTCAG GCAGCATCGG GAAGCCAGGC CCGCCCTGCT GACGTCCAGA CTCCGCTTCA 192
0
TCCCCAAGCC TGACGGGCTG CGGCCGATTG TGAACATGGA CTACGTCGTG GGAGCCAGAA 198
0
CGTTCCGCAG AGAAAAGAGG GCCGAGCGTC TCACCTCGAG GGTGAAGGCA CTGTTCAGCG 204
0
TGCTCAACTA CGAGCGGGCG CGGCGCCCCG GCCTCCTGGG CGCCTCTGTG CTGGGCCTGG 210
0
ACGATATCCA CAGGGCCTGG CGCACCTTCG TGCTGCGTGT GCGGGCCCAG GACCCGCCGC 216
0
CTGAGCTGTA CTTTGTCAAG GTGGATGTGA CGGGCGCGTA CGACACCATC CCCCAGGACA 222
0
GGCTCACGGA GGTCATCGCC AGCATCATCA AACCCCAGAA CACGTACTGC GTGCGTCGGT 228
0
ATGCCGTGGT CCAGAAGGCC GCCCATGGGC ACGTCCGCAA GGCCTTCAAG AGCCACGTCT 234
0
CTACCTTGAC AGACCTCCAG CCGTACATGC GACAGTTCGT GGCTCACCTG CAGGANAACA 240
0
GCCCGCTGAG GGATGCCGTC GTCATCGAGC AGAGCTCCTC CCTGAATGAG GCCAGCAGTG 246
0
GCCTCTTCGA CGTCTTCCTA CGCTTCATGT GCCACCACGC CGTGCGCATC AGGGGCAAGT 252
0
CCTACGTCCA GTGCCAGGGG ATCCCGCAGG GCTCCATCCT CTCCACGCTG CTCTGCAGCC 258
0
TGTGCTACGG CGACATGGAG AACAAGCTGT TTGCGGGGAT TCGGCGGGAC GGGCTGCTCC 264
0
TGCGTTTGGT GGATGATTTC TTGTTGGTGA CACCTCACCT CACCCACGCG AAAACCTTCC 270
0
TCAGGACCCT GGTCCGAGGT GTCCCTGAGT ATGGCTGCGT GGTGAACTTG CGGAAGACAG 276
0
TGGTGAACTT CCCTGTAGAA GACGAGGCCC TGGGTGGCAC GGCTTTTGTT CAGATGCCGG 282
0
CCCACGGCCT ATTCCCCTGG TGCGGCCTGC TGCTGGATAC CCGGACCCTG GAGGTGCAGA 288
0
GCGACTACTC CAGCTATGCC CGGACCTCCA TCAGAGCCAG TCTCACCTTC AACCGCGGCT 294
0
TCAAGGCTGG GAGGAACATG CGTCGCAAAC TCTTTGGGGT CTTGCGGCTG AAGTGTCACA 300
0
GCCTGTTTCT GGATTTGCAG GTGAACAGCC TCCAGACGGT GTGCACCAAC ATCTACAAGA 306
0
TCCTCCTGCT GCAGGCGTAC AGGTTTCACG CATGTGTGCT GCAGCTCCCA TTTCATCAGC 312
0
AAGTTTGGAA GAACCCCACA TTTTTCCTGC GCGTCATCTC TGACACGGCC TCCCTCTGCT 318
0
ACTCCATCCT GAAAGCCAAG AACGCAGGGA TGTCGCTGGG GGCCAAGGGC GCCGCCGGCC 324
0
CTCTGCCCTC CGAGGCCGTG CAGTGGCTGT GCCACCAAGC ATTCCTGCTC AAGCTGACTC 330
0
GACACCGTGT CACCTACGTG CCACTCCTGG GGTCACTCAG GACAGCCCAG ACGCAGCTGA 336
0
GTCGGAAGCT CCCGGGGACG ACGCTGACTG CCCTGGAGGC CGCAGCCAAC CCGGCACTGC 342
0
CCTCAGACTT CAAGACCATC CTGGACTGAT GGCCACCCGC CCACAGCCAG GCCGAGAGCA 348
0
GACACCAGCA GCCCTGTCAC GCCGGGCTCT ACGTCCCAGG GAGGGAGGGG CGGCCCACAC 354
0
CCAGGCCCGC ACCGCTGGGA GTCTGAGGCC TGAGTGAGTG TTTGGCCGAG GCCTGCATGT 360
0
CCGGCTGAAG GCTGAGTGTC CGGCTGAGGC CTGAGCGAGT GTCCAGCCAA GGGCTGAGTG 366
0
TCCAGCACAC CTGCCGTCTT CACTTCCCCA CAGGCTGGCG CTCGGCTCCA CCCCAGGGCC 372
0
AGCTTTTCCT CACCAGGAGC CCGGCTTCCA CTCCCCACAT AGGAATAGTC CATCCCCAGA 378
0
TTCGCCATTG TTCACCCCTC GCCCTGCCCT CCTTTGCCTT CCACCCCCAC CATCCAGGTG 384
0
GAGACCCTGA GAAGGACCCT GGGAGCTCTG GGAATTTGGA GTGACCAAAG GTGTGCCCTG 390
0
TACACAGGCG AGGACCCTGC ACCTGGATGG GGGTCCCTGT GGGTCAAATT GGGGGGAGGT 396
0
GCTGTGGGAG TAAAATACTG AATATATGAG TTTTTCAGTT TTGAAAAAAA AAAAAAAAAA 402
0
AAAAAAAAA 402
9
(2) INFORMATION FOR SEQ ID NO:293:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 261 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:293:
Ala Ala Leu Arg Pro Ala Ala His Val Gly Ser Pro Gly Pro Gly His
1 5 10 15
Pro Arg Asp Ala Ala Arg Ser Pro Leu Pro Ser Arg Ala Leu Pro Ala
20 25 30
Ala Gln Pro Leu Pro Arg Gly Ala Ala Ala Gly His Val Arg Ala Ala
35 40 45
Pro Gly Ala Pro Gly Leu Ala Ala Gly Ala Ala Arg Gly Pro Gly Gly
50 55 60
Phe Pro Arg Xaa Gly Gly Pro Xaa Xaa Gly Val Arg Ala Leu Gly Xaa
65 70 75 80
Xaa Ala Ala Pro Arg Arg Pro Leu Leu Pro Pro Gly Val Leu Pro Glu
85 90 95
Xaa Xaa Gly Gly Pro Ser Ala Ala Xaa Ala Val Arg Xaa Arg Arg Glu
100 105 110
Xaa Arg Ala Gly Leu Arg Leu Arg Ala Ala Gly Arg Gly Pro Arg Gly
115 120 125
Pro Pro Arg Gly Leu His His Gln Arg Ala Gln Leu Pro Ala Gln His
130 135 140
Gly Asp Arg Arg Thr Ala Gly Glu Arg Gly Val Gly Ala Ala Ala Ala
145 150 155 160
Pro Arg Gly Arg Arg Arg Ala Gly Ser Pro Ala Gly Thr Leu Arg Xaa
165 170 175
Xaa Cys Ala Gly Gly Ser Gln Leu Arg Leu Pro Xaa Val Arg Ala Ala
180 185 190
Ala Val Pro Ala Arg Arg Cys Xaa Ser Gly Pro Ala Pro Ala Thr Arg
195 200 205
Xaa Trp Thr Arg Xaa Arg Leu Gly Ser Asn Gly Pro Gly Thr Ile Ala
210 215 220
Ser Gly Arg Pro Gly Ser Pro Trp Ala Ala Ser Pro Gly Cys Glu Glu
225 230 235 240
Ala Arg Gly Gln Cys Gln Pro Lys Ser Ala Val Ala Gln Glu Ala Gln
245 250 255
Ala Trp Arg Cys Pro
260
(2) INFORMATION FOR SEQ ID NO:294:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:294:
Ala Gly Ala Asp Ala Arg Trp Ala Gly Val Leu Gly Pro Pro Gly Gln
1 5 10 15
Asp Ala Trp Thr Glu
20
(2) INFORMATION FOR SEQ ID NO:295:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 82 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:295:
Pro Trp Phe Leu Cys Gly Val Thr Cys Gln Thr Arg Arg Arg Ser His
1 5 10 15
Leu Phe Gly Gly Cys Ala Leu Trp His Ala Pro Leu Pro Pro Ile Arg
20 25 30
Gly Pro Pro Ala Pro Arg Gly Pro Pro Ile His Ile Ala Ala Thr Thr
35 40 45
Ser Trp Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe
50 55 60
Leu Tyr Ser Ser Gly Asp Lys Xaa Thr Ala Xaa Leu Leu Pro Thr Gln
65 70 75 80
Tyr Ile
(2) INFORMATION FOR SEQ ID NO:296:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 153 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:296:
Leu Ala Phe Gly Arg Phe Val Glu Thr Xaa Phe Leu Val Pro Gly Leu
1 5 10 15
Gly Cys Gln Asp Ser Pro Gln Val Ala Pro Pro Ala Pro Ala Xaa Leu
20 25 30
Ala Asn Ala Ala Pro Val Ser Gly Ala Ala Trp Glu Pro Arg Ala Val
35 40 45
Pro Leu Arg Gly Val Pro Gln Asp Ala Leu Pro Ala Ala Ser Cys Gly
50 55 60
His Pro Ser Ser Arg Cys Leu Cys Pro Gly Glu Ala Pro Gly Leu Cys
65 70 75 80
Gly Gly Pro Arg Gly Gly Gly Thr Gln Thr Pro Val Ala Trp Cys Ser
85 90 95
Cys Ser Ala Ser Thr Ala Ala Pro Gly Arg Cys Thr Ala Ser Cys Gly
100 105 110
Pro Ala Cys Ala Gly Trp Cys Pro Gln Ala Ser Gly Ala Pro Gly Thr
115 120 125
Thr Asn Ala Ala Ser Ser Gly Thr Pro Arg Ser Ser Ser Pro Trp Gly
130 135 140
Ser Met Pro Ser Ser Arg Cys Arg Ser
145 150
(2) INFORMATION FOR SEQ ID NO:297:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:297:
Ala Cys Gly Thr Ala Leu Gly Cys Ala Gly Ala Gln Gly Leu Ala Val
1 5 10 15
Phe Arg Pro Gln Ser Thr Val Cys Val Arg Arg Ser Trp Pro Ser Ser
20 25 30
Cys Thr Gly
35
(2) INFORMATION FOR SEQ ID NO:298:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 43 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:298:
Val Cys Thr Ser Ser Ser Cys Ser Gly Leu Ser Phe Met Ser Arg Arg
1 5 10 15
Pro Arg Phe Lys Arg Thr Gly Ser Phe Ser Thr Gly Arg Val Ser Gly
20 25 30
Ala Ser Cys Lys Ala Leu Glu Ser Asp Ser Thr
35 40
(2) INFORMATION FOR SEQ ID NO:299:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:299:
Arg Gly Cys Ser Cys Gly Ser Cys Arg Lys Gln Arg Ser Gly Ser Ile
1 5 10 15
Gly Lys Pro Gly Pro Pro Cys
20
(2) INFORMATION FOR SEQ ID NO:300:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 16 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:300:
Arg Pro Asp Ser Ala Ser Ser Pro Ser Leu Thr Gly Cys Gly Arg Leu
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:301:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:301:
Thr Trp Thr Thr Ser Trp Glu Pro Glu Arg Ser Ala Glu Lys Arg Gly
1 5 10 15
Pro Ser Val Ser Pro Arg Gly
20
(2) INFORMATION FOR SEQ ID NO:302:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 54 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:302:
Arg His Cys Ser Ala Cys Ser Thr Thr Ser Gly Arg Gly Ala Pro Ala
1 5 10 15
Ser Trp Ala Pro Leu Cys Trp Ala Trp Thr Ile Ser Thr Gly Pro Gly
20 25 30
Ala Pro Ser Cys Cys Val Cys Gly Pro Arg Thr Arg Arg Leu Ser Cys
35 40 45
Thr Leu Ser Arg Trp Met
50
(2) INFORMATION FOR SEQ ID NO:303:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 52 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:303:
Arg Ala Arg Thr Thr Pro Ser Pro Arg Thr Gly Ser Arg Arg Ser Ser
1 5 10 15
Pro Ala Ser Ser Asn Pro Arg Thr Arg Thr Ala Cys Val Gly Met Pro
20 25 30
Trp Ser Arg Arg Pro Pro Met Gly Thr Ser Ala Arg Pro Ser Arg Ala
35 40 45
Thr Ser Leu Pro
50
(2) INFORMATION FOR SEQ ID NO:304:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:304:
Gln Thr Ser Ser Arg Thr Cys Asp Ser Ser Trp Leu Thr Cys Arg Xaa
1 5 10 15
Thr Ala Arg
(2) INFORMATION FOR SEQ ID NO:305:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:305:
Gly Met Pro Ser Ser Ser Ser Arg Ala Pro Pro
1 5 10
(2) INFORMATION FOR SEQ ID NO:306:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 74 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:306:
Met Arg Pro Ala Val Ala Ser Ser Thr Ser Ser Tyr Ala Ser Cys Ala
1 5 10 15
Thr Thr Pro Cys Ala Ser Gly Ala Ser Pro Thr Ser Ser Ala Arg Gly
20 25 30
Ser Arg Arg Ala Pro Ser Ser Pro Arg Cys Ser Ala Ala Cys Ala Thr
35 40 45
Ala Thr Trp Arg Thr Ser Cys Leu Arg Gly Phe Gly Gly Thr Gly Cys
50 55 60
Ser Cys Val Trp Trp Met Ile Ser Cys Trp
65 70
(2) INFORMATION FOR SEQ ID NO:307:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:307:
His Leu Thr Ser Pro Thr Arg Lys Pro Ser Ser Gly Pro Trp Ser Glu
1 5 10 15
Val Ser Leu Ser Met Ala Ala Trp
20
(2) INFORMATION FOR SEQ ID NO:308:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:308:
Thr Cys Gly Arg Gln Trp
1 5
(2) INFORMATION FOR SEQ ID NO:309:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 70 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:309:
Lys Thr Arg Pro Trp Val Ala Arg Leu Leu Phe Arg Cys Arg Pro Thr
1 5 10 15
Ala Tyr Ser Pro Gly Ala Ala Cys Cys Trp Ile Pro Gly Pro Trp Arg
20 25 30
Cys Arg Ala Thr Thr Pro Ala Met Pro Gly Pro Pro Ser Glu Pro Val
35 40 45
Ser Pro Ser Thr Ala Ala Ser Arg Leu Gly Gly Thr Cys Val Ala Asn
50 55 60
Ser Leu Gly Ser Cys Gly
65 70
(2) INFORMATION FOR SEQ ID NO:310:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 10 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:310:
Ser Val Thr Ala Cys Phe Trp Ile Cys Arg
1 5 10
(2) INFORMATION FOR SEQ ID NO:311:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 55 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:311:
Thr Ala Ser Arg Arg Cys Ala Pro Thr Ser Thr Arg Ser Ser Cys Cys
1 5 10 15
Arg Arg Thr Gly Phe Thr His Val Cys Cys Ser Ser His Phe Ile Ser
20 25 30
Lys Phe Gly Arg Thr Pro His Phe Ser Cys Ala Ser Ser Leu Thr Arg
35 40 45
Pro Pro Ser Ala Thr Pro Ser
50 55
(2) INFORMATION FOR SEQ ID NO:312:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:312:
Lys Pro Arg Thr Gln Gly Cys Arg Trp Gly Pro Arg Ala Pro Pro Ala
1 5 10 15
Leu Cys Pro Pro Arg Pro Cys Ser Gly Cys Ala Thr Lys His Ser Cys
20 25 30
Ser Ser
(2) INFORMATION FOR SEQ ID NO:313:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:313:
Leu Asp Thr Val Ser Pro Thr Cys His Ser Trp Gly His Ser Gly Gln
1 5 10 15
Pro Arg Arg Ser
20
(2) INFORMATION FOR SEQ ID NO:314:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 8 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:314:
Val Gly Ser Ser Arg Gly Arg Arg
1 5
(2) INFORMATION FOR SEQ ID NO:315:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 61 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:315:
Leu Pro Trp Arg Pro Gln Pro Thr Arg His Cys Pro Gln Thr Ser Arg
1 5 10 15
Pro Ser Trp Thr Asp Gly His Pro Pro Thr Ala Arg Pro Arg Ala Asp
20 25 30
Thr Ser Ser Pro Val Thr Pro Gly Ser Thr Ser Gln Gly Gly Arg Gly
35 40 45
Gly Pro His Pro Gly Pro His Arg Trp Glu Ser Glu Ala
50 55 60
(2) INFORMATION FOR SEQ ID NO:316:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 13 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:316:
Val Ser Val Trp Pro Arg Pro Ala Cys Pro Ala Glu Gly
1 5 10
(2) INFORMATION FOR SEQ ID NO:317:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 9 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:317:
Gly Leu Ser Glu Cys Pro Ala Lys Gly
1 5
(2) INFORMATION FOR SEQ ID NO:318:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:318:
Val Ser Ser Thr Pro Ala Val Phe Thr Ser Pro Gln Ala Gly Ala Arg
1 5 10 15
Leu His Pro Arg Ala Ser Phe Ser Ser Pro Gly Ala Arg Leu Pro Leu
20 25 30
Pro Thr
(2) INFORMATION FOR SEQ ID NO:319:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 70 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:319:
Ser Ile Pro Arg Phe Ala Ile Val His Pro Ser Pro Cys Pro Pro Leu
1 5 10 15
Pro Ser Thr Pro Thr Ile Gln Val Glu Thr Leu Arg Arg Thr Leu Gly
20 25 30
Ala Leu Gly Ile Trp Ser Asp Gln Arg Cys Ala Leu Tyr Thr Gly Glu
35 40 45
Asp Pro Ala Pro Gly Trp Gly Ser Leu Trp Val Lys Leu Gly Gly Gly
50 55 60
Ala Val Gly Val Lys Tyr
65 70
(2) INFORMATION FOR SEQ ID NO:320:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 16 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:320:
Ile Tyr Glu Phe Phe Ser Phe Glu Lys Lys Lys Lys Lys Lys Lys Lys
1 5 10 15
(2) INFORMATION FOR SEQ ID NO:321:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 222 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:321:
Gln Arg Cys Val Leu Leu Arg Thr Trp Glu Ala Leu Ala Pro Ala Thr
1 5 10 15
Pro Ala Met Pro Arg Ala Pro Arg Cys Arg Ala Val Arg Ser Leu Leu
20 25 30
Arg Ser His Tyr Arg Glu Val Leu Pro Leu Ala Thr Phe Val Arg Arg
35 40 45
Leu Gly Pro Gln Gly Trp Arg Leu Val Gln Arg Gly Asp Pro Ala Ala
50 55 60
Phe Arg Ala Xaa Val Ala Xaa Cys Xaa Val Cys Val Pro Trp Xaa Xaa
65 70 75 80
Xaa Xaa Pro Pro Ala Ala Pro Ser Phe Arg Gln Val Ser Cys Leu Xaa
85 90 95
Xaa Leu Val Ala Arg Val Leu Xaa Xaa Leu Cys Xaa Arg Gly Ala Xaa
100 105 110
Asn Val Leu Ala Phe Gly Phe Ala Leu Leu Asp Gly Ala Arg Gly Gly
115 120 125
Pro Pro Glu Ala Phe Thr Thr Ser Val Arg Ser Tyr Leu Pro Asn Thr
130 135 140
Val Thr Asp Ala Leu Arg Gly Ser Gly Ala Trp Gly Leu Leu Leu Arg
145 150 155 160
Arg Val Gly Asp Asp Val Leu Val His Leu Leu Ala Arg Cys Ala Xaa
165 170 175
Phe Val Leu Val Xaa Pro Ser Cys Ala Tyr Xaa Val Cys Gly Pro Pro
180 185 190
Leu Tyr Gln Leu Gly Ala Ala Thr Gln Ala Arg Pro Pro Pro His Ala
195 200 205
Xaa Gly Pro Glu Xaa Val Trp Asp Pro Thr Gly Leu Glu Pro
210 215 220
(2) INFORMATION FOR SEQ ID NO:322:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 330 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:322:
Arg Gln Gly Gly Arg Gly Pro Pro Gly Leu Pro Ala Pro Gly Ala Arg
1 5 10 15
Arg Arg Gly Gly Ser Ala Ser Arg Ser Leu Pro Leu Pro Lys Arg Pro
20 25 30
Arg Arg Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln Gly
35 40 45
Ser Trp Ala His Pro Gly Arg Thr Pro Gly Pro Ser Asp Arg Gly Phe
50 55 60
Cys Val Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu Glu
65 70 75 80
Gly Ala Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg Gln
85 90 95
His His Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Gly Thr
100 105 110
Arg Leu Val Pro Arg Cys Thr Pro Arg Pro Ser Thr Ser Ser Thr Pro
115 120 125
Gln Ala Thr Xaa Thr Leu Arg Pro Ser Phe Leu Leu Asn Ile Ser Glu
130 135 140
Ala Gln Pro Asp Trp Arg Ser Gly Gly Ser Trp Arg Xaa Ser Phe Trp
145 150 155 160
Phe Gln Ala Leu Asp Ala Arg Ile Pro Arg Arg Leu Pro Arg Leu Pro
165 170 175
Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn
180 185 190
His Ala Gln Cys Pro Tyr Gly Val Phe Leu Lys Thr His Cys Pro Leu
195 200 205
Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu Lys Pro
210 215 220
Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Glu His Arg Pro Pro Ser
225 230 235 240
Pro Gly Ala Ala Ala Pro Pro Ala Gln Gln Pro Leu Ala Gly Val Arg
245 250 255
Leu Arg Ala Gly Leu Pro Ala Pro Ala Gly Ala Pro Arg Pro Leu Gly
260 265 270
Leu Gln Ala Gln Arg Thr Pro Leu Pro Gln Glu His Gln Glu Val His
275 280 285
Leu Pro Gly Glu Ala Cys Gln Ala Leu Ala Ala Gly Ala Asp Val Glu
290 295 300
Asp Glu Arg Ala Gly Leu Arg Leu Ala Ala Gln Glu Pro Arg Gly Trp
305 310 315 320
Leu Cys Ser Gly Arg Arg Ala Pro Ser Ala
325 330
(2) INFORMATION FOR SEQ ID NO:323:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 89 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:323:
Gly Asp Pro Gly Gln Val Pro Ala Leu Ala Asp Glu Cys Val Arg Arg
1 5 10 15
Arg Ala Ala Gln Val Phe Leu Leu Cys His Gly Asp His Val Ser Lys
20 25 30
Glu Gln Ala Leu Phe Leu Pro Glu Glu Cys Leu Glu Gln Val Ala Lys
35 40 45
His Trp Asn Gln Thr Ala Leu Glu Glu Gly Ala Ala Ala Gly Ala Val
50 55 60
Gly Ser Arg Gly Gln Ala Ala Ser Gly Ser Gln Ala Arg Pro Ala Asp
65 70 75 80
Val Gln Thr Pro Leu His Pro Gln Ala
85
(2) INFORMATION FOR SEQ ID NO:324:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 76 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:324:
Arg Ala Ala Ala Asp Cys Glu His Gly Leu Arg Arg Gly Ser Gln Asn
1 5 10 15
Val Pro Gln Arg Lys Glu Gly Arg Ala Ser His Leu Glu Gly Glu Gly
20 25 30
Thr Val Gln Arg Ala Gln Leu Arg Ala Gly Ala Ala Pro Arg Pro Pro
35 40 45
Gly Arg Leu Cys Ala Gly Pro Gly Arg Tyr Pro Gln Gly Leu Ala His
50 55 60
Leu Arg Ala Ala Cys Ala Gly Pro Gly Pro Ala Ala
65 70 75
(2) INFORMATION FOR SEQ ID NO:325:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 94 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:325:
Ala Val Leu Cys Gln Gly Gly Cys Asp Gly Arg Val Arg His His Pro
1 5 10 15
Pro Gly Gln Ala His Gly Gly His Arg Gln His His Gln Thr Pro Glu
20 25 30
His Val Leu Arg Ala Ser Val Cys Arg Gly Pro Glu Gly Arg Pro Trp
35 40 45
Ala Arg Pro Gln Gly Leu Gln Glu Pro Arg Leu Tyr Leu Asp Arg Pro
50 55 60
Pro Ala Val His Ala Thr Val Arg Gly Ser Pro Ala Gly Xaa Gln Pro
65 70 75 80
Ala Glu Gly Cys Arg Arg His Arg Ala Glu Leu Leu Pro Glu
85 90
(2) INFORMATION FOR SEQ ID NO:326:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 68 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:326:
Gly Gln Gln Trp Pro Leu Arg Arg Leu Pro Thr Leu His Val Pro Pro
1 5 10 15
Arg Arg Ala His Gln Gly Gln Val Leu Arg Pro Val Pro Gly Asp Pro
20 25 30
Ala Gly Leu His Pro Leu His Ala Ala Leu Gln Pro Val Leu Arg Arg
35 40 45
His Gly Glu Gln Ala Val Cys Gly Asp Ser Ala Gly Arg Ala Ala Pro
50 55 60
Ala Phe Gly Gly
65
(2) INFORMATION FOR SEQ ID NO:327:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:327:
Phe Leu Val Gly Asp Thr Ser Pro His Pro Arg Glu Asn Leu Pro Gln
1 5 10 15
Asp Pro Gly Pro Arg Cys Pro
20
(2) INFORMATION FOR SEQ ID NO:328:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 144 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:328:
Val Trp Leu Arg Gly Glu Leu Ala Glu Asp Ser Gly Glu Leu Pro Cys
1 5 10 15
Arg Arg Arg Gly Pro Gly Trp His Gly Phe Cys Ser Asp Ala Gly Pro
20 25 30
Arg Pro Ile Pro Leu Val Arg Pro Ala Ala Gly Tyr Pro Asp Pro Gly
35 40 45
Gly Ala Glu Arg Leu Leu Gln Leu Cys Pro Asp Leu His Gln Ser Gln
50 55 60
Ser His Leu Gln Pro Arg Leu Gln Gly Trp Glu Glu His Ala Ser Gln
65 70 75 80
Thr Leu Trp Gly Leu Ala Ala Glu Val Ser Gln Pro Val Ser Gly Phe
85 90 95
Ala Gly Glu Gln Pro Pro Asp Gly Val His Gln His Leu Gln Asp Pro
100 105 110
Pro Ala Ala Gly Val Gln Val Ser Arg Met Cys Ala Ala Ala Pro Ile
115 120 125
Ser Ser Ala Ser Leu Glu Glu Pro His Ile Phe Pro Ala Arg His Leu
130 135 140
(2) INFORMATION FOR SEQ ID NO:329:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 137 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:329:
His Gly Leu Pro Leu Leu Leu His Pro Glu Ser Gln Glu Arg Arg Asp
1 5 10 15
Val Ala Gly Gly Gln Gly Arg Arg Arg Pro Ser Ala Leu Arg Gly Arg
20 25 30
Ala Val Ala Val Pro Pro Ser Ile Pro Ala Gln Ala Asp Ser Thr Pro
35 40 45
Cys His Leu Arg Ala Thr Pro Gly Val Thr Gln Asp Ser Pro Asp Ala
50 55 60
Ala Glu Ser Glu Ala Pro Gly Asp Asp Ala Asp Cys Pro Gly Gly Arg
65 70 75 80
Ser Gln Pro Gly Thr Ala Leu Arg Leu Gln Asp His Pro Gly Leu Met
85 90 95
Ala Thr Arg Pro Gln Pro Gly Arg Glu Gln Thr Pro Ala Ala Leu Ser
100 105 110
Arg Arg Ala Leu Arg Pro Arg Glu Gly Gly Ala Ala His Thr Gln Ala
115 120 125
Arg Thr Ala Gly Ser Leu Arg Pro Glu
130 135
(2) INFORMATION FOR SEQ ID NO:330:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:330:
Val Phe Gly Arg Gly Leu His Val Arg Leu Lys Ala Glu Cys Pro Ala
1 5 10 15
Glu Ala
(2) INFORMATION FOR SEQ ID NO:331:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 71 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:331:
Ala Ser Val Gln Pro Arg Ala Glu Cys Pro Ala His Leu Pro Ser Ser
1 5 10 15
Leu Pro His Arg Leu Ala Leu Gly Ser Thr Pro Gly Pro Ala Phe Pro
20 25 30
His Gln Glu Pro Gly Phe His Ser Pro His Arg Asn Ser Pro Ser Pro
35 40 45
Asp Ser Pro Leu Phe Thr Pro Arg Pro Ala Leu Leu Cys Leu Pro Pro
50 55 60
Pro Pro Ser Arg Trp Arg Pro
65 70
(2) INFORMATION FOR SEQ ID NO:332:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 40 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:332:
Glu Gly Pro Trp Glu Leu Trp Glu Phe Gly Val Thr Lys Gly Val Pro
1 5 10 15
Cys Thr Gln Ala Arg Thr Leu His Leu Asp Gly Gly Pro Cys Gly Ser
20 25 30
Asn Trp Gly Glu Val Leu Trp Glu
35 40
(2) INFORMATION FOR SEQ ID NO:333:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:333:
Asn Thr Glu Tyr Met Ser Phe Ser Val Leu Lys Lys Lys Lys Lys Lys
1 5 10 15
Lys Lys
(2) INFORMATION FOR SEQ ID NO:334:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 94 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:334:
Ser Ala Ala Ser Cys Cys Ala Arg Gly Lys Pro Trp Pro Arg Pro Pro
1 5 10 15
Pro Arg Cys Arg Ala Leu Pro Ala Ala Glu Pro Cys Ala Pro Cys Cys
20 25 30
Ala Ala Thr Thr Ala Arg Cys Cys Arg Trp Pro Arg Ser Cys Gly Ala
35 40 45
Trp Gly Pro Arg Ala Gly Gly Trp Cys Ser Ala Gly Thr Arg Arg Leu
50 55 60
Ser Ala Arg Trp Trp Pro Xaa Ala Trp Cys Ala Cys Pro Gly Xaa Xaa
65 70 75 80
Gly Xaa Pro Pro Pro Pro Pro Pro Ser Ala Arg Cys Pro Ala
85 90
(2) INFORMATION FOR SEQ ID NO:335:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 49 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:335:
Xaa Xaa Trp Trp Pro Glu Cys Cys Xaa Xaa Cys Ala Xaa Ala Ala Arg
1 5 10 15
Xaa Thr Cys Trp Pro Ser Ala Ser Arg Cys Trp Thr Gly Pro Ala Gly
20 25 30
Ala Pro Pro Arg Pro Ser Pro Pro Ala Cys Ala Ala Thr Cys Pro Thr
35 40 45
Arg
(2) INFORMATION FOR SEQ ID NO:336:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1003 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:336:
Pro Thr His Cys Gly Gly Ala Gly Arg Gly Gly Cys Cys Cys Ala Ala
1 5 10 15
Trp Ala Thr Thr Cys Trp Phe Thr Cys Trp His Ala Ala Arg Xaa Leu
20 25 30
Cys Trp Trp Xaa Pro Ala Ala Pro Thr Xaa Cys Ala Gly Arg Arg Cys
35 40 45
Thr Ser Ser Ala Leu Xaa Leu Arg Pro Gly Pro Arg His Thr Leu Xaa
50 55 60
Asp Pro Xaa Ala Ser Gly Ile Gln Arg Ala Trp Asn His Ser Val Arg
65 70 75 80
Glu Ala Gly Val Pro Leu Gly Cys Gln Pro Arg Val Arg Gly Gly Ala
85 90 95
Gly Ala Val Pro Ala Glu Val Cys Arg Cys Pro Arg Gly Pro Gly Val
100 105 110
Ala Leu Pro Leu Ser Arg Ser Gly Arg Pro Leu Gly Arg Gly Pro Gly
115 120 125
Pro Thr Arg Ala Gly Arg Leu Asp Arg Val Thr Val Val Ser Val Trp
130 135 140
Cys His Leu Pro Asp Pro Pro Lys Lys Pro Pro Leu Trp Arg Val Arg
145 150 155 160
Ser Leu Ala Arg Ala Thr Pro Thr His Pro Trp Ala Ala Ser Thr Thr
165 170 175
Arg Ala Pro His Pro His Arg Gly His His Val Leu Gly His Ala Leu
180 185 190
Ser Pro Gly Val Arg Arg Asp Gln Ala Leu Pro Leu Leu Leu Arg Arg
195 200 205
Gln Xaa His Cys Xaa Pro Pro Ser Tyr Ser Ile Tyr Leu Arg Pro Ser
210 215 220
Leu Thr Gly Val Arg Glu Val Arg Gly Asp Xaa Leu Ser Gly Ser Arg
225 230 235 240
Pro Trp Met Pro Gly Phe Pro Ala Gly Cys Pro Ala Cys Pro Ser Xaa
245 250 255
Thr Gly Lys Cys Gly Pro Cys Phe Trp Ser Cys Leu Gly Thr Thr Arg
260 265 270
Ser Ala Pro Thr Gly Cys Ser Ser Arg Arg Thr Ala Arg Cys Glu Leu
275 280 285
Arg Ser Pro Gln Gln Pro Val Ser Val Pro Gly Arg Ser Pro Arg Ala
290 295 300
Leu Trp Arg Pro Pro Arg Arg Arg Asn Thr Asp Pro Arg Arg Leu Val
305 310 315 320
Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val Tyr Gly Phe Val
325 330 335
Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu Trp Gly Ser Arg
340 345 350
His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe Ile Ser Leu
355 360 365
Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr Trp Lys Met Ser
370 375 380
Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val Gly Cys Val
385 390 395 400
Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu Ala Lys Phe Leu
405 410 415
His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe Phe
420 425 430
Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg
435 440 445
Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His Leu
450 455 460
Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln His
465 470 475 480
Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro
485 490 495
Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val Gly
500 505 510
Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg
515 520 525
Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro
530 535 540
Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His Arg Ala
545 550 555 560
Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro Glu
565 570 575
Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr Asp Thr Ile Pro
580 585 590
Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln Asn
595 600 605
Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His Gly
610 615 620
His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr Asp Leu
625 630 635 640
Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln Xaa Asn Ser Pro
645 650 655
Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser Leu Asn Glu Ala
660 665 670
Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met Cys His His Ala
675 680 685
Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln
690 695 700
Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp Met
705 710 715 720
Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu Arg
725 730 735
Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr His Ala Lys
740 745 750
Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys Val
755 760 765
Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu Ala
770 775 780
Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His Gly Leu Phe Pro
785 790 795 800
Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser Asp
805 810 815
Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn
820 825 830
Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly Val
835 840 845
Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn Ser
850 855 860
Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala
865 870 875 880
Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln Gln Val
885 890 895
Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser Asp Thr Ala Ser
900 905 910
Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly Met Ser Leu Gly
915 920 925
Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala Val Gln Trp Leu
930 935 940
Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His Arg Val Thr Tyr
945 950 955 960
Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr Gln Leu Ser Arg
965 970 975
Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala Ala Ala Asn Pro
980 985 990
Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp
995 1000
(2) INFORMATION FOR SEQ ID NO:337:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 38 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:337:
Trp Pro Pro Ala His Ser Gln Ala Glu Ser Arg His Gln Gln Pro Cys
1 5 10 15
His Ala Gly Leu Tyr Val Pro Gly Arg Glu Gly Arg Pro Thr Pro Arg
20 25 30
Pro Ala Pro Leu Gly Val
35
(2) INFORMATION FOR SEQ ID NO:338:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 13 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:338:
Gly Leu Ser Glu Cys Leu Ala Glu Ala Cys Met Ser Gly
1 5 10
(2) INFORMATION FOR SEQ ID NO:339:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 91 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:339:
Arg Leu Ser Val Arg Leu Arg Pro Glu Arg Val Ser Ser Gln Gly Leu
1 5 10 15
Ser Val Gln His Thr Cys Arg Leu His Phe Pro Thr Gly Trp Arg Ser
20 25 30
Ala Pro Pro Gln Gly Gln Leu Phe Leu Thr Arg Ser Pro Ala Ser Thr
35 40 45
Pro His Ile Gly Ile Val His Pro Gln Ile Arg His Cys Ser Pro Leu
50 55 60
Ala Leu Pro Ser Phe Ala Phe His Pro His His Pro Gly Gly Asp Pro
65 70 75 80
Glu Lys Asp Pro Gly Ser Ser Gly Asn Leu Glu
85 90
(2) INFORMATION FOR SEQ ID NO:340:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:340:
Pro Lys Val Cys Pro Val His Arg Arg Gly Pro Cys Thr Trp Met Gly
1 5 10 15
Val Pro Val Gly Gln Ile Gly Gly Arg Cys Cys Gly Ser Lys Ile Leu
20 25 30
Asn Ile
(2) INFORMATION FOR SEQ ID NO:341:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:341:
Val Phe Gln Phe
1
(2) INFORMATION FOR SEQ ID NO:342:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 8 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:342:
Lys Lys Lys Lys Lys Lys Lys Lys
1 5
(2) INFORMATION FOR SEQ ID NO:343:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4037 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: 56..3454
(D) OTHER INFORMATION: /note= "refined sequence of hTRT cDNA"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:343:
GCAGCGCTGC GTCCTGCTGC GCACGTGGGA AGCCCTGGCC CCGGCCACCC CCGCG ATG 5
8
Met
1
CCG CGC GCT CCC CGC TGC CGA GCC GTG CGC TCC CTG CTG CGC AGC CAC 10
6
Pro Arg Ala Pro Arg Cys Arg Ala Val Arg Ser Leu Leu Arg Ser His
5 10 15
TAC CGC GAG GTG CTG CCG CTG GCC ACG TTC GTG CGG CGC CTG GGG CCC 15
4
Tyr Arg Glu Val Leu Pro Leu Ala Thr Phe Val Arg Arg Leu Gly Pro
20 25 30
CAG GGC TGG CGG CTG GTG CAG CGC GGG GAC CCG GCG GCT TTC CGC GCG 20
2
Gln Gly Trp Arg Leu Val Gln Arg Gly Asp Pro Ala Ala Phe Arg Ala
35 40 45
CTG GTG GCC CAG TGC CTG GTG TGC GTG CCC TGG GAC GCA CGG CCG CCC 25
0
Leu Val Ala Gln Cys Leu Val Cys Val Pro Trp Asp Ala Arg Pro Pro
50 55 60 65
CCC GCC GCC CCC TCC TTC CGC CAG GTG TCC TGC CTG AAG GAG CTG GTG 29
8
Pro Ala Ala Pro Ser Phe Arg Gln Val Ser Cys Leu Lys Glu Leu Val
70 75 80
GCC CGA GTG CTG CAG AGG CTG TGC GAG CGC GGC GCG AAG AAC GTG CTG 34
6
Ala Arg Val Leu Gln Arg Leu Cys Glu Arg Gly Ala Lys Asn Val Leu
85 90 95
GCC TTC GGC TTC GCG CTG CTG GAC GGG GCC CGC GGG GGC CCC CCC GAG 39
4
Ala Phe Gly Phe Ala Leu Leu Asp Gly Ala Arg Gly Gly Pro Pro Glu
100 105 110
GCC TTC ACC ACC AGC GTG CGC AGC TAC CTG CCC AAC ACG GTG ACC GAC 44
2
Ala Phe Thr Thr Ser Val Arg Ser Tyr Leu Pro Asn Thr Val Thr Asp
115 120 125
GCA CTG CGG GGG AGC GGG GCG TGG GGG CTG CTG CTG CGC CGC GTG GGC 49
0
Ala Leu Arg Gly Ser Gly Ala Trp Gly Leu Leu Leu Arg Arg Val Gly
130 135 140 145
GAC GAC GTG CTG GTT CAC CTG CTG GCA CGC TGC GCG CTC TTT GTG CTG 53
8
Asp Asp Val Leu Val His Leu Leu Ala Arg Cys Ala Leu Phe Val Leu
150 155 160
GTG GCT CCC AGC TGC GCC TAC CAG GTG TGC GGG CCG CCG CTG TAC CAG 58
6
Val Ala Pro Ser Cys Ala Tyr Gln Val Cys Gly Pro Pro Leu Tyr Gln
165 170 175
CTC GGC GCT GCC ACT CAG GCC CGG CCC CCG CCA CAC GCT AGT GGA CCC 63
4
Leu Gly Ala Ala Thr Gln Ala Arg Pro Pro Pro His Ala Ser Gly Pro
180 185 190
CGA AGG CGT CTG GGA TGC GAA CGG GCC TGG AAC CAT AGC GTC AGG GAG 68
2
Arg Arg Arg Leu Gly Cys Glu Arg Ala Trp Asn His Ser Val Arg Glu
195 200 205
GCC GGG GTC CCC CTG GGC CTG CCA GCC CCG GGT GCG AGG AGG CGC GGG 73
0
Ala Gly Val Pro Leu Gly Leu Pro Ala Pro Gly Ala Arg Arg Arg Gly
210 215 220 225
GGC AGT GCC AGC CGA AGT CTG CCG TTG CCC AAG AGG CCC AGG CGT GGC 77
8
Gly Ser Ala Ser Arg Ser Leu Pro Leu Pro Lys Arg Pro Arg Arg Gly
230 235 240
GCT GCC CCT GAG CCG GAG CGG ACG CCC GTT GGG CAG GGG TCC TGG GCC 82
6
Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln Gly Ser Trp Ala
245 250 255
CAC CCG GGC AGG ACG CGT GGA CCG AGT GAC CGT GGT TTC TGT GTG GTG 87
4
His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly Phe Cys Val Val
260 265 270
TCA CCT GCC AGA CCC GCC GAA GAA GCC ACC TCT TTG GAG GGT GCG CTC 92
2
Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu Glu Gly Ala Leu
275 280 285
TCT GGC ACG CGC CAC TCC CAC CCA TCC GTG GGC CGC CAG CAC CAC GCG 97
0
Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg Gln His His Ala
290 295 300 305
GGC CCC CCA TCC ACA TCG CGG CCA CCA CGT CCC TGG GAC ACG CCT TGT 101
8
Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp Asp Thr Pro Cys
310 315 320
CCC CCG GTG TAC GCC GAG ACC AAG CAC TTC CTC TAC TCC TCA GGC GAC 106
6
Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr Ser Ser Gly Asp
325 330 335
AAG GAG CAG CTG CGG CCC TCC TTC CTA CTC AGC TCT CTG AGG CCC AGC 111
4
Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser Leu Arg Pro Ser
340 345 350
CTG ACT GGC GCT CGG AGG CTC GTG GAG ACC ATC TTT CTG GGT TCC AGG 116
2
Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe Leu Gly Ser Arg
355 360 365
CCC TGG ATG CCA GGG ACT CCC CGC AGG TTG CCC CGC CTG CCC CAG CGC 121
0
Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg Leu Pro Gln Arg
370 375 380 385
TAC TGG CAA ATG CGG CCC CTG TTT CTG GAG CTG CTT GGG AAC CAC GCG 125
8
Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn His Ala
390 395 400
CAG TGC CCC TAC GGG GTG CTC CTC AAG ACG CAC TGC CCG CTG CGA GCT 130
6
Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys Pro Leu Arg Ala
405 410 415
GCG GTC ACC CCA GCA GCC GGT GTC TGT GCC CGG GAG AAG CCC CAG GGC 135
4
Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu Lys Pro Gln Gly
420 425 430
TCT GTG GCG GCC CCC GAG GAG GAG GAC ACA GAC CCC CGT CGC CTG GTG 140
2
Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro Arg Arg Leu Val
435 440 445
CAG CTG CTC CGC CAG CAC AGC AGC CCC TGG CAG GTG TAC GGC TTC GTG 145
0
Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val Tyr Gly Phe Val
450 455 460 465
CGG GCC TGC CTG CGC CGG CTG GTG CCC CCA GGC CTC TGG GGC TCC AGG 149
8
Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu Trp Gly Ser Arg
470 475 480
CAC AAC GAA CGC CGC TTC CTC AGG AAC ACC AAG AAG TTC ATC TCC CTG 154
6
His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe Ile Ser Leu
485 490 495
GGG AAG CAT GCC AAG CTC TCG CTG CAG GAG CTG ACG TGG AAG ATG AGC 159
4
Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr Trp Lys Met Ser
500 505 510
GTG CGG GAC TGC GCT TGG CTG CGC AGG AGC CCA GGG GTT GGC TGT GTT 164
2
Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val Gly Cys Val
515 520 525
CCG GCC GCA GAG CAC CGT CTG CGT GAG GAG ATC CTG GCC AAG TTC CTG 169
0
Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu Ala Lys Phe Leu
530 535 540 545
CAC TGG CTG ATG AGT GTG TAC GTC GTC GAG CTG CTC AGG TCT TTC TTT 173
8
His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe Phe
550 555 560
TAT GTC ACG GAG ACC ACG TTT CAA AAG AAC AGG CTC TTT TTC TAC CGG 178
6
Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg
565 570 575
CCG AGT GTC TGG AGC AAG TTG CAA AGC ATT GGA ATC AGA CAG CAC TTG 183
4
Pro Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His Leu
580 585 590
AAG AGG GTG CAG CTG CGG GAG CTG TCG GAA GCA GAG GTC AGG CAG CAT 188
2
Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln His
595 600 605
CGG GAA GCC AGG CCC GCC CTG CTG ACG TCC AGA CTC CGC TTC ATC CCC 193
0
Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro
610 615 620 625
AAG CCT GAC GGG CTG CGG CCG ATT GTG AAC ATG GAC TAC GTC GTG GGA 197
8
Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val Gly
630 635 640
GCC AGA ACG TTC CGC AGA GAA AAG AGG GCC GAG CGT CTC ACC TCG AGG 202
6
Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg
645 650 655
GTG AAG GCA CTG TTC AGC GTG CTC AAC TAC GAG CGG GCG CGG CGC CCC 207
4
Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro
660 665 670
GGC CTC CTG GGC GCC TCT GTG CTG GGC CTG GAC GAT ATC CAC AGG GCC 212
2
Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His Arg Ala
675 680 685
TGG CGC ACC TTC GTG CTG CGT GTG CGG GCC CAG GAC CCG CCG CCT GAG 217
0
Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro Glu
690 695 700 705
CTG TAC TTT GTC AAG GTG GAT GTG ACG GGC GCG TAC GAC ACC ATC CCC 221
8
Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr Asp Thr Ile Pro
710 715 720
CAG GAC AGG CTC ACG GAG GTC ATC GCC AGC ATC ATC AAA CCC CAG AAC 226
6
Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln Asn
725 730 735
ACG TAC TGC GTG CGT CGG TAT GCC GTG GTC CAG AAG GCC GCC CAT GGG 231
4
Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His Gly
740 745 750
CAC GTC CGC AAG GCC TTC AAG AGC CAC GTC TCT ACC TTG ACA GAC CTC 236
2
His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr Asp Leu
755 760 765
CAG CCG TAC ATG CGA CAG TTC GTG GCT CAC CTG CAG GAG ACC AGC CCG 241
0
Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln Glu Thr Ser Pro
770 775 780 785
CTG AGG GAT GCC GTC GTC ATC GAG CAG AGC TCC TCC CTG AAT GAG GCC 245
8
Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser Leu Asn Glu Ala
790 795 800
AGC AGT GGC CTC TTC GAC GTC TTC CTA CGC TTC ATG TGC CAC CAC GCC 250
6
Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met Cys His His Ala
805 810 815
GTG CGC ATC AGG GGC AAG TCC TAC GTC CAG TGC CAG GGG ATC CCG CAG 255
4
Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln
820 825 830
GGC TCC ATC CTC TCC ACG CTG CTC TGC AGC CTG TGC TAC GGC GAC ATG 260
2
Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp Met
835 840 845
GAG AAC AAG CTG TTT GCG GGG ATT CGG CGG GAC GGG CTG CTC CTG CGT 265
0
Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu Arg
850 855 860 865
TTG GTG GAT GAT TTC TTG TTG GTG ACA CCT CAC CTC ACC CAC GCG AAA 269
8
Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr His Ala Lys
870 875 880
ACC TTC CTC AGG ACC CTG GTC CGA GGT GTC CCT GAG TAT GGC TGC GTG 274
6
Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys Val
885 890 895
GTG AAC TTG CGG AAG ACA GTG GTG AAC TTC CCT GTA GAA GAC GAG GCC 279
4
Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu Ala
900 905 910
CTG GGT GGC ACG GCT TTT GTT CAG ATG CCG GCC CAC GGC CTA TTC CCC 284
2
Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His Gly Leu Phe Pro
915 920 925
TGG TGC GGC CTG CTG CTG GAT ACC CGG ACC CTG GAG GTG CAG AGC GAC 289
0
Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser Asp
930 935 940 945
TAC TCC AGC TAT GCC CGG ACC TCC ATC AGA GCC AGT GTC ACC TTC AAC 293
8
Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser Val Thr Phe Asn
950 955 960
CGC GGC TTC AAG GCT GGG AGG AAC ATG CGT CGC AAA CTC TTT GGG GTC 298
6
Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly Val
965 970 975
TTG CGG CTG AAG TGT CAC AGC CTG TTT CTG GAT TTG CAG GTG AAC AGC 303
4
Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn Ser
980 985 990
CTC CAG ACG GTG TGC ACC AAC ATC TAC AAG ATC CTC CTG CTG CAG GCG 308
2
Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala
995 1000 1005
TAC AGG TTT CAC GCA TGT GTG CTG CAG CTC CCA TTT CAT CAG CAA GTT 313
0
Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln Gln Val
1010 1015 1020 1025
TGG AAG AAC CCC ACA TTT TTC CTG CGC GTC ATC TCT GAC ACG GCC TCC 317
8
Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser Asp Thr Ala Ser
1030 1035 1040
CTC TGC TAC TCC ATC CTG AAA GCC AAG AAC GCA GGG ATG TCG CTG GGG 322
6
Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly Met Ser Leu Gly
1045 1050 1055
GCC AAG GGC GCC GCC GGC CCT CTG CCC TCC GAG GCC GTG CAG TGG CTG 327
4
Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala Val Gln Trp Leu
1060 1065 1070
TGC CAC CAA GCA TTC CTG CTC AAG CTG ACT CGA CAC CGT GTC ACC TAC 332
2
Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His Arg Val Thr Tyr
1075 1080 1085
GTG CCA CTC CTG GGG TCA CTC AGG ACA GCC CAG ACG CAG CTG AGT CGG 337
0
Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr Gln Leu Ser Arg
1090 1095 1100 1105
AAG CTC CCG GGG ACG ACG CTG ACT GCC CTG GAG GCC GCA GCC AAC CCG 341
8
Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala Ala Ala Asn Pro
1110 1115 1120
GCA CTG CCC TCA GAC TTC AAG ACC ATC CTG GAC TGATGGCCAC CCGCCCACAG 347
1
Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp
1125 1130
CCAGGCCGAG AGCAGACACC AGCAGCCCTG TCACGCCGGG CTCTACGTCC CAGGGAGGGA 353
1
GGGGCGGCCC ACACCCAGGC CCGCACCGCT GGGAGTCTGA GGCCTGAGTG AGTGTTTGGC 359
1
CGAGGCCTGC ATGTCCGGCT GAAGGCTGAG TGTCCGGCTG AGGCCTGAGC GAGTGTCCAG 365
1
CCAAGGGCTG AGTGTCCAGC ACACCTGCCG TCTTCACTTC CCCACAGGCT GGCGCTCGGC 371
1
TCCACCCCAG GGCCAGCTTT TCYTCACCAG GAGCCCGGCT TCCACTCCCC ACATAGGAAT 377
1
AGTCCATCCC CAGATTCGCC ATTGTTCACC CYTCGCCCTG CCYTCCTTTG CCTTCCACCC 383
1
CCACCATCCA GGTGGAGACC CTGAGAAGGA CCCTGGGAGC TCTGGGAATT TGGAGTGACC 389
1
AAAGGTGTGC CCTGTACACA GGCGAGGACC CTGCACCTGG ATGGGGGTCC CTGTGGGTCA 395
1
AATTGGGGGG AGGTGCTGTG GGAGTAAAAT ACTGAATATA TGAGTTTTTC AGTTTTGRAA 401
1
AAAAAAAAAA AAAAAAAAAA AAAAAA 403
7
(2) INFORMATION FOR SEQ ID NO:344:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1132 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:344:
Met Pro Arg Ala Pro Arg Cys Arg Ala Val Arg Ser Leu Leu Arg Ser
1 5 10 15
His Tyr Arg Glu Val Leu Pro Leu Ala Thr Phe Val Arg Arg Leu Gly
20 25 30
Pro Gln Gly Trp Arg Leu Val Gln Arg Gly Asp Pro Ala Ala Phe Arg
35 40 45
Ala Leu Val Ala Gln Cys Leu Val Cys Val Pro Trp Asp Ala Arg Pro
50 55 60
Pro Pro Ala Ala Pro Ser Phe Arg Gln Val Ser Cys Leu Lys Glu Leu
65 70 75 80
Val Ala Arg Val Leu Gln Arg Leu Cys Glu Arg Gly Ala Lys Asn Val
85 90 95
Leu Ala Phe Gly Phe Ala Leu Leu Asp Gly Ala Arg Gly Gly Pro Pro
100 105 110
Glu Ala Phe Thr Thr Ser Val Arg Ser Tyr Leu Pro Asn Thr Val Thr
115 120 125
Asp Ala Leu Arg Gly Ser Gly Ala Trp Gly Leu Leu Leu Arg Arg Val
130 135 140
Gly Asp Asp Val Leu Val His Leu Leu Ala Arg Cys Ala Leu Phe Val
145 150 155 160
Leu Val Ala Pro Ser Cys Ala Tyr Gln Val Cys Gly Pro Pro Leu Tyr
165 170 175
Gln Leu Gly Ala Ala Thr Gln Ala Arg Pro Pro Pro His Ala Ser Gly
180 185 190
Pro Arg Arg Arg Leu Gly Cys Glu Arg Ala Trp Asn His Ser Val Arg
195 200 205
Glu Ala Gly Val Pro Leu Gly Leu Pro Ala Pro Gly Ala Arg Arg Arg
210 215 220
Gly Gly Ser Ala Ser Arg Ser Leu Pro Leu Pro Lys Arg Pro Arg Arg
225 230 235 240
Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln Gly Ser Trp
245 250 255
Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly Phe Cys Val
260 265 270
Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu Glu Gly Ala
275 280 285
Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg Gln His His
290 295 300
Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp Asp Thr Pro
305 310 315 320
Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr Ser Ser Gly
325 330 335
Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser Leu Arg Pro
340 345 350
Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe Leu Gly Ser
355 360 365
Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg Leu Pro Gln
370 375 380
Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn His
385 390 395 400
Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys Pro Leu Arg
405 410 415
Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu Lys Pro Gln
420 425 430
Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro Arg Arg Leu
435 440 445
Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val Tyr Gly Phe
450 455 460
Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu Trp Gly Ser
465 470 475 480
Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe Ile Ser
485 490 495
Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr Trp Lys Met
500 505 510
Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val Gly Cys
515 520 525
Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu Ala Lys Phe
530 535 540
Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe
545 550 555 560
Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr
565 570 575
Arg Pro Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His
580 585 590
Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln
595 600 605
His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile
610 615 620
Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val
625 630 635 640
Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser
645 650 655
Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg
660 665 670
Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His Arg
675 680 685
Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro
690 695 700
Glu Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr Asp Thr Ile
705 710 715 720
Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln
725 730 735
Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His
740 745 750
Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr Asp
755 760 765
Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln Glu Thr Ser
770 775 780
Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser Leu Asn Glu
785 790 795 800
Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met Cys His His
805 810 815
Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro
820 825 830
Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp
835 840 845
Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu
850 855 860
Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr His Ala
865 870 875 880
Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys
885 890 895
Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu
900 905 910
Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His Gly Leu Phe
915 920 925
Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser
930 935 940
Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser Val Thr Phe
945 950 955 960
Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly
965 970 975
Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn
980 985 990
Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln
995 1000 1005
Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln Gln
1010 1015 1020
Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser Asp Thr Ala
1025 1030 1035 1040
Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly Met Ser Leu
1045 1050 1055
Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala Val Gln Trp
1060 1065 1070
Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His Arg Val Thr
1075 1080 1085
Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr Gln Leu Ser
1090 1095 1100
Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala Ala Ala Asn
1105 1110 1115 1120
Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp
1125 1130
(2) INFORMATION FOR SEQ ID NO:345:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 1
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 5
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Phe or Tyr"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:345:
Xaa Xaa Asp Asp Xaa
1 5
(2) INFORMATION FOR SEQ ID NO:346:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 1
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Phe or Tyr"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 5
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:346:
Xaa Xaa Asp Asp Xaa
1 5
(2) INFORMATION FOR SEQ ID NO:347:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:347:
Trp Xaa Gly Xaa Ser Xaa
1 5
(2) INFORMATION FOR SEQ ID NO:348:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 1
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 6
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:348:
Xaa Leu Gly Xaa Xaa Xaa
1 5
(2) INFORMATION FOR SEQ ID NO:349:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 33 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 7..8
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 10..11
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 13
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = polar amino acid, Gly,
Ser, Thr, Tyr, Cys, Asn or Gln"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 19
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = polar amino acid, Gly,
Ser, Thr, Tyr, Cys, Asn or Gln"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 23
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = polar amino acid, Gly,
Ser, Thr, Tyr, Cys, Asn or Gln"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:349:
Trp Leu Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe Phe Thr
1 5 10 15
Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Tyr Xaa Arg Lys Xaa Xaa
20 25 30
Trp
(2) INFORMATION FOR SEQ ID NO:350:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 2
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Leu or Ile"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 7..8
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 10..11
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 12
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Gln or Arg"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 13
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = polar amino acid, Gly,
Ser, Thr, Tyr, Cys, Asn or Gln"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 21
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = polar amino acid, Gly,
Ser, Thr, Tyr, Cys, Asn or Gln"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 25
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = polar amino acid, Gly,
Ser, Thr, Tyr, Cys, Asn or Gln"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 28..29
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Phe or Tyr"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 31
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Lys or His"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:350:
Trp Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe Phe Tyr
1 5 10 15
Xaa Thr Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Xaa Xaa
20 25 30
Xaa Trp
(2) INFORMATION FOR SEQ ID NO:351:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 2
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Leu or Ile"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 7..8
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 10..11
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = hydrophobic amino acid,
Ala, Leu, Ile, Val, Pro, Phe, Trp
or Met"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 12
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Gln or Arg"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 13
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = polar amino acid, Gly,
Ser, Thr, Tyr, Cys, Asn or Gln"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 21
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = polar amino acid, Gly,
Ser, Thr, Tyr, Cys, Asn or Gln"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 25
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = polar amino acid, Gly,
Ser, Thr, Tyr, Cys, Asn or Gln"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 29..30
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Phe or Tyr"
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 32
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Lys or His"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:351:
Trp Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe Phe Tyr
1 5 10 15
Xaa Thr Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Xaa
20 25 30
Xaa Xaa Trp
35
(2) INFORMATION FOR SEQ ID NO:352:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:352:
Trp Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe Phe Tyr
1 5 10 15
Xaa Thr Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Xaa Xaa
20 25 30
Xaa Trp Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ile
35 40
(2) INFORMATION FOR SEQ ID NO:353:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 43 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:353:
Trp Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe Phe Tyr
1 5 10 15
Xaa Thr Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Xaa
20 25 30
Xaa Xaa Trp Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ile
35 40
(2) INFORMATION FOR SEQ ID NO:354:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:354:
Glu Xaa Xaa Val Xaa
1 5
(2) INFORMATION FOR SEQ ID NO:355:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 11 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:355:
Xaa Xaa Xaa Arg Xaa Xaa Pro Lys Xaa Xaa Xaa
1 5 10
(2) INFORMATION FOR SEQ ID NO:356:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:356:
Xaa Arg Xaa Ile Xaa
1 5
(2) INFORMATION FOR SEQ ID NO:357:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:357:
Xaa Xaa Xaa Xaa Phe Xaa Xaa Xaa Asp Xaa Xaa Xaa Xaa Tyr Asp Xaa
1 5 10 15
Xaa
(2) INFORMATION FOR SEQ ID NO:358:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:358:
Tyr Xaa Xaa Xaa Xaa Gly Xaa Xaa Gln Gly Xaa Xaa Xaa Ser Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa
20
(2) INFORMATION FOR SEQ ID NO:359:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 13 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:359:
Xaa Xaa Xaa Xaa Xaa Xaa Asp Asp Xaa Leu Xaa Xaa Xaa
1 5 10
(2) INFORMATION FOR SEQ ID NO:360:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:360:
Phe Phe Tyr Xaa Thr Glu
1 5
(2) INFORMATION FOR SEQ ID NO:361:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:361:
Phe Phe Tyr Val Thr Glu
1 5
(2) INFORMATION FOR SEQ ID NO:362:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:362:
TTYTTYTAYG TNACNGA 1
7
(2) INFORMATION FOR SEQ ID NO:363:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:363:
TCNGTNACRT ARAARAA 1
7
(2) INFORMATION FOR SEQ ID NO:364:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:364:
Arg Phe Ile Pro Lys Pro
1 5
(2) INFORMATION FOR SEQ ID NO:365:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:365:
MGNTTYATHC CNAARCC 1
7
(2) INFORMATION FOR SEQ ID NO:366:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 16 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:366:
GGYTTNGGDA TRAANC 1
6
(2) INFORMATION FOR SEQ ID NO:367:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:367:
Ala Tyr Asp Thr Ile
1 5
(2) INFORMATION FOR SEQ ID NO:368:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 14 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:368:
GCNTAYGAYA CNAT 1
4
(2) INFORMATION FOR SEQ ID NO:369:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 14 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:369:
TANGTRTCRT ANGC 1
4
(2) INFORMATION FOR SEQ ID NO:370:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:370:
Gly Ile Pro Gln Gly
1 5
(2) INFORMATION FOR SEQ ID NO:371:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 14 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:371:
GGNATHCCNC ARGG 1
4
(2) INFORMATION FOR SEQ ID NO:372:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:372:
SWNCCYTGNG GDATNCC 1
7
(2) INFORMATION FOR SEQ ID NO:373:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:373:
Leu Val Asp Asp Phe Leu
1 5
(2) INFORMATION FOR SEQ ID NO:374:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:374:
YTNGTNGAYG AYTTYYT 1
7
(2) INFORMATION FOR SEQ ID NO:375:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 7 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:375:
Asp Asp Phe Leu Leu Val Thr
1 5
(2) INFORMATION FOR SEQ ID NO:376:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:376:
GTNACNARNA RRAARTCRTC 2
0
(2) INFORMATION FOR SEQ ID NO:377:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:377:
GTGAAGGCAC TGTTCAGCG 1
9
(2) INFORMATION FOR SEQ ID NO:378:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:378:
CGCGTGGGTG AGGTGAGGTG 2
0
(2) INFORMATION FOR SEQ ID NO:379:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:379:
CTGTGCTGGG CCTGGACGAT A 2
1
(2) INFORMATION FOR SEQ ID NO:380:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:380:
AGCTTGTTCT CCATGTCGCC GTAG 2
4
(2) INFORMATION FOR SEQ ID NO:381:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:381:
GTGGATGATT TCTTGTTGG 1
9
(2) INFORMATION FOR SEQ ID NO:382:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:382:
CTGGACACTC AGCCCTTGG 1
9
(2) INFORMATION FOR SEQ ID NO:383:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:383:
GGCAGGTGTG CTGGACACT 1
9
(2) INFORMATION FOR SEQ ID NO:384:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:384:
TTTGATGATG CTGGCGATG 1
9
(2) INFORMATION FOR SEQ ID NO:385:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:385:
GGGGCTCGTC TTCTACAGG 1
9
(2) INFORMATION FOR SEQ ID NO:386:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:386:
CAGCAGGAGG ATCTTGTAG 1
9
(2) INFORMATION FOR SEQ ID NO:387:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:387:
TGACCCCAGG AGTGGCACG 1
9
(2) INFORMATION FOR SEQ ID NO:388:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:388:
TCAAGCTGAC TCGACACCG 1
9
(2) INFORMATION FOR SEQ ID NO:389:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:389:
CGGCGTGACA GGGCTGC 1
7
(2) INFORMATION FOR SEQ ID NO:390:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:390:
GCTGAAGGCT GAGTGTCC 1
8
(2) INFORMATION FOR SEQ ID NO:391:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:391:
TAGTCCATGT TCACAATCG 1
9
(2) INFORMATION FOR SEQ ID NO:392:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:392:
TTTCCGTGTT GAGTGTTTC 1
9
(2) INFORMATION FOR SEQ ID NO:393:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:393:
GTCACCGTGT TGGGCAGG 1
8
(2) INFORMATION FOR SEQ ID NO:394:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:394:
GCTACCTGCC CAACACGG 1
8
(2) INFORMATION FOR SEQ ID NO:395:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:395:
GCGCGAAGAA CGTGCTGG 1
8
(2) INFORMATION FOR SEQ ID NO:396:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:396:
CACTGCTCCT TGTCGCCTG 1
9
(2) INFORMATION FOR SEQ ID NO:397:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:397:
TTCCCAAGGA CTTTGTTGC 1
9
(2) INFORMATION FOR SEQ ID NO:398:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:398:
TGTTCCTCAA GACGCACTG 1
9
(2) INFORMATION FOR SEQ ID NO:399:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:399:
TACTGCGTGC GTCGGTATG 1
9
(2) INFORMATION FOR SEQ ID NO:400:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:400:
GGTCTTGCGG CTGAAGTGT 1
9
(2) INFORMATION FOR SEQ ID NO:401:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:401:
TGGTTCACCT GCTGGCACG 1
9
(2) INFORMATION FOR SEQ ID NO:402:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:402:
GTGGTTTCTG TGTGGTGTC 1
9
(2) INFORMATION FOR SEQ ID NO:403:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:403:
GACACCACAC AGAAACCAC 1
9
(2) INFORMATION FOR SEQ ID NO:404:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:404:
GTGCCAGCAG GTGAACCAG 1
9
(2) INFORMATION FOR SEQ ID NO:405:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:405:
GCAGTGCGTC TTGAGGAGC 1
9
(2) INFORMATION FOR SEQ ID NO:406:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:406:
TGGAACCATA GCGTCAGGGA G 2
1
(2) INFORMATION FOR SEQ ID NO:407:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:407:
GGCCTCCCTG ACGCTATGGT T 2
1
(2) INFORMATION FOR SEQ ID NO:408:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:408:
GCKCGGCGCT GCCACTCAGG 2
0
(2) INFORMATION FOR SEQ ID NO:409:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:409:
GCTCGGCGCT GCCACTCAGG 2
0
(2) INFORMATION FOR SEQ ID NO:410:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:410:
ACGCCGAGAC CAAGCACTTC 2
0
(2) INFORMATION FOR SEQ ID NO:411:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:411:
CCAAAGAGGT GGCTTCTTCG 2
0
(2) INFORMATION FOR SEQ ID NO:412:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:412:
AAGGCCAGCA CGTTCTTCGC 2
0
(2) INFORMATION FOR SEQ ID NO:413:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:413:
CACGTTCGTG CGGCGCCTG 1
9
(2) INFORMATION FOR SEQ ID NO:414:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:414:
CCTTCACCAC CAGCGTGCG 1
9
(2) INFORMATION FOR SEQ ID NO:415:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:415:
GGCGACGACG TGCTGGTTC 1
9
(2) INFORMATION FOR SEQ ID NO:416:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:416:
GGCTCAGGGG CAGCGCCAC 1
9
(2) INFORMATION FOR SEQ ID NO:417:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:417:
CTGGCAGGTG TACGGCTTC 1
9
(2) INFORMATION FOR SEQ ID NO:418:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:418:
GCGTGGACCG AGTGACCGTG GTTTC 2
5
(2) INFORMATION FOR SEQ ID NO:419:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:419:
GACGTGGTGG CCGCGATGTG G 2
1
(2) INFORMATION FOR SEQ ID NO:420:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:420:
GAAGTCTGCC GTTGCCCAAG AG 2
2
(2) INFORMATION FOR SEQ ID NO:421:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:421:
GACACCACAC AGAAACCACG GTCAC 2
5
(2) INFORMATION FOR SEQ ID NO:422:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:422:
CGCCCCCTCC TTCCGCCAGG T 2
1
(2) INFORMATION FOR SEQ ID NO:423:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:423:
CGAAGCCGAA GGCCAGCACG TTCTT 2
5
(2) INFORMATION FOR SEQ ID NO:424:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:424:
GGTGGCCCGA GTGCTGCAGA GG 2
2
(2) INFORMATION FOR SEQ ID NO:425:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:425:
GTAGCTGCGC ACGCTGGTGG TGAAG 2
5
(2) INFORMATION FOR SEQ ID NO:426:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:426:
TGGGCGACGA CGTGCTGGTT CA 2
2
(2) INFORMATION FOR SEQ ID NO:427:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:427:
TATGGTTCCA GGCCCGTTCG CATCC 2
5
(2) INFORMATION FOR SEQ ID NO:428:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:428:
CCAGCTGCGC CTACCAGGTG TGC 2
3
(2) INFORMATION FOR SEQ ID NO:429:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:429:
GGCCTCCCTG ACGCTATGGT TCCAG 2
5
(2) INFORMATION FOR SEQ ID NO:430:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:430:
GGTGCTGCCG CTGGCCACGT TCG 2
3
(2) INFORMATION FOR SEQ ID NO:431:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:431:
TCCCAGGGCA CGCACACCAG GCACT 2
5
(2) INFORMATION FOR SEQ ID NO:432:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:432:
GTACAGGGCA CACCTTTGGT CACTC 2
5
(2) INFORMATION FOR SEQ ID NO:433:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:433:
TCGACGACGT ACACACTCAT CAGCC 2
5
(2) INFORMATION FOR SEQ ID NO:434:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:434:
AGCGGCAGCA CCTCGCGGTA GTGGC 2
5
(2) INFORMATION FOR SEQ ID NO:435:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:435:
CCACCAGCTC CTTCAGGCAG GACAC 2
5
(2) INFORMATION FOR SEQ ID NO:436:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:436:
CCAGGGCTTC CCACGTGCGC AGCAG 2
5
(2) INFORMATION FOR SEQ ID NO:437:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:437:
CGCACGAACG TGGCCAGCGG CAGCA 2
5
(2) INFORMATION FOR SEQ ID NO:438:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:438:
TGACCGTGGT TTCTGTGTGG TGT 2
3
(2) INFORMATION FOR SEQ ID NO:439:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:439:
CCCTCTTCAA GTGCTGTCTG ATTCC 2
5
(2) INFORMATION FOR SEQ ID NO:440:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:440:
ATCGCGGCCA CCACGTCCCT 2
0
(2) INFORMATION FOR SEQ ID NO:441:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:441:
TGCTCCAGAC ACTCGGCCGG TAGAA 2
5
(2) INFORMATION FOR SEQ ID NO:442:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:442:
ACGAAGCCGT ACACCTGCC 1
9
(2) INFORMATION FOR SEQ ID NO:443:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:443:
CGACATCCCT GCGTTCTTGG CTTTC 2
5
(2) INFORMATION FOR SEQ ID NO:444:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:444:
CACTGCTGGC CTCATTCAGG G 2
1
(2) INFORMATION FOR SEQ ID NO:445:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:445:
CACTGCTGGC CTCATTCAGG G 2
1
(2) INFORMATION FOR SEQ ID NO:446:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:446:
GCAGCCATAC TCAGGGACAC 2
0
(2) INFORMATION FOR SEQ ID NO:447:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:447:
CCATCCTCTC CACGCTGCTC 2
0
(2) INFORMATION FOR SEQ ID NO:448:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:448:
GCGATGACCT CCGTGAGCCT G 2
1
(2) INFORMATION FOR SEQ ID NO:449:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:449:
CCCAGGACAG GCTCACGGA 1
9
(2) INFORMATION FOR SEQ ID NO:450:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:450:
CCTCTTCAAG TGCTGTCTGA TTCC 2
4
(2) INFORMATION FOR SEQ ID NO:451:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:451:
CAGCTCGACG ACGTACACAC TCATC 2
5
(2) INFORMATION FOR SEQ ID NO:452:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:452:
CTGACGTCCA GACTCCGCTT CAT 2
3
(2) INFORMATION FOR SEQ ID NO:453:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 33 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:453:
GACCTGAGCA GCTCGACGAC GTACACACTC ATC 3
3
(2) INFORMATION FOR SEQ ID NO:454:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:454:
GTCGTCGAGC TGCTCAGGTC 2
0
(2) INFORMATION FOR SEQ ID NO:455:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:455:
AGCACGCTGA ACAGTGCCTT 2
0
(2) INFORMATION FOR SEQ ID NO:456:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:456:
GACCTGAGCA GCTCGACGAC 2
0
(2) INFORMATION FOR SEQ ID NO:457:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:457:
AAGGCACTGT TCAGCGTGCT 2
0
(2) INFORMATION FOR SEQ ID NO:458:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:458:
CGGCCGAGTG TCTGGAGCAA 2
0
(2) INFORMATION FOR SEQ ID NO:459:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:459:
GGATGAAGCG GAGTCTGGA 1
9
(2) INFORMATION FOR SEQ ID NO:460:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 29 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:460:
ATGGATCCGT CGTCGAGCTG CTCAGGTCT 2
9
(2) INFORMATION FOR SEQ ID NO:461:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 29 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:461:
ATCAGCTGAG CACGCTGAAC AGTGCCTTC 2
9
(2) INFORMATION FOR SEQ ID NO:462:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:462:
GTCTCCGTGA CATAAAAGAA AGAC 2
4
(2) INFORMATION FOR SEQ ID NO:463:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:463:
GCCAAGTTCC TGCACTGGCT 2
0
(2) INFORMATION FOR SEQ ID NO:464:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:464:
GCCTGTTCTT TTGAAACGTG GTCT 2
4
(2) INFORMATION FOR SEQ ID NO:465:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: modified_base
(B) LOCATION: 1
(D) OTHER INFORMATION: /mod_base= OTHER
/note= "N = guanosine substituted by tw
o
biotin groups"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:465:
NCCTGTTCTT TTGAAACGTG GTCT 2
4
(2) INFORMATION FOR SEQ ID NO:466:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:466:
GTCAAGATGC CTGAGATAGA AC 2
2
(2) INFORMATION FOR SEQ ID NO:467:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:467:
TGCTTAGCTT GTGGGGGTGT CA 2
2
(2) INFORMATION FOR SEQ ID NO:468:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:468:
GCTGCGTCCT GCTGCGCACG T 2
1
(2) INFORMATION FOR SEQ ID NO:469:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:469:
CAGCGGGGAG CGCGCGGCAT C 2
1
(2) INFORMATION FOR SEQ ID NO:470:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:470:
TGGGCCACCA GCGCGCGGAA A 2
1
(2) INFORMATION FOR SEQ ID NO:471:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:471:
CGGCCGCAGC CCGTCAGGCT TGGGG 2
5
(2) INFORMATION FOR SEQ ID NO:472:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:472:
CCGACAGCTC CCGCAGCTGC ACCC 2
4
(2) INFORMATION FOR SEQ ID NO:473:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:473:
CGTACACACT CATCAGCCAG TGCAGGAACT TGGC 3
4
(2) INFORMATION FOR SEQ ID NO:474:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 39 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:474:
CGCGCCCGCT CGTAGTTGAG CACGCTGAAC AGTGCCTTC 3
9
(2) INFORMATION FOR SEQ ID NO:475:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 39 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:475:
GCGGAGTCTG GACGTCAGCA GGGCGGGCCT GGCTTCCCG 3
9
(2) INFORMATION FOR SEQ ID NO:476:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:476:
ATTTGACCCA CAGGGACCCC CATCCAG 2
7
(2) INFORMATION FOR SEQ ID NO:477:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:477:
ATGACCGCCC TCCTCGTGAG 2
0
(2) INFORMATION FOR SEQ ID NO:478:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:478:
GCCACCCCCG CGATGCC 1
7
(2) INFORMATION FOR SEQ ID NO:479:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:479:
AGCCCTGGCC CCGGCCA 1
7
(2) INFORMATION FOR SEQ ID NO:480:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:480:
TCCCACGTGC GCAGCAG 1
7
(2) INFORMATION FOR SEQ ID NO:481:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:481:
AGCAGGACGC AGCGCTG 1
7
(2) INFORMATION FOR SEQ ID NO:482:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:482:
CGCGGTAGTG GCTGCGCAGC AGGGAGCGCA CGGC 3
4
(2) INFORMATION FOR SEQ ID NO:483:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:483:
CCAGGGCTTC CCACGTGCGC AGCAGGACGC AGCGC 3
5
(2) INFORMATION FOR SEQ ID NO:484:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 62 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:484:
CTAGTCTAGA TCRCTAGCGT AATCTGGAAC ATCGTATGGG TRTCCAGGAT GGTCTTGAAG 6
0
TC 6
2
(2) INFORMATION FOR SEQ ID NO:485:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 39 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:485:
TACCATGGGC TACCCATACG ACGTTCCAGA TTACGCTCA 3
9
(2) INFORMATION FOR SEQ ID NO:486:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 39 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:486:
TATGAGCGTA ATCTGGAACG TCGTATGGGT AGCCCATGG 3
9
(2) INFORMATION FOR SEQ ID NO:487:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 45 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:487:
GTGTACGTCG TCGAGCTCCT CAGGTCTGCC TTTTATGTCA CGGAG 4
5
(2) INFORMATION FOR SEQ ID NO:488:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 48 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:488:
GTGTACGTCG TCGAGCTCCT CAGGTCTTTC GCTTATGTCA CGGAGACC 4
8
(2) INFORMATION FOR SEQ ID NO:489:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 48 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:489:
CCTCAGGTCT TTCTTTGCTG TCACGGAGAC AACGTTTCAA AAGAACAG 4
8
(2) INFORMATION FOR SEQ ID NO:490:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 43 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:490:
GGTCTTTCTT TTATGTCGCG GAGACAACGT TTCAAAAGAA CAG 4
3
(2) INFORMATION FOR SEQ ID NO:491:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 39 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:491:
CTTTCTTTTA TGTCACGGCG ACAACGTTTC AAAAGAACA 3
9
(2) INFORMATION FOR SEQ ID NO:492:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 60 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:492:
ATGAGTGTGT ACGTCGTCGA GCTCCTCAGG TCTACCACGC AAAAGAACAG GCTCTTTTTC 6
0
(2) INFORMATION FOR SEQ ID NO:493:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:493:
GGCTGATGAG TGTGTACGTC GTCGA 2
5
(2) INFORMATION FOR SEQ ID NO:494:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:494:
ACGTGGTCTC CGTGACATAA AAGAA 2
5
(2) INFORMATION FOR SEQ ID NO:495:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:495:
AGGTCTTTCT TTTATGTCAC GGA 2
3
(2) INFORMATION FOR SEQ ID NO:496:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:496:
CACAGACCCC CGTCGCCTGG TC 2
2
(2) INFORMATION FOR SEQ ID NO:497:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:497:
CGGAGTCTGG ACGTCAGCAG GGC 2
3
(2) INFORMATION FOR SEQ ID NO:498:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 39 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:498:
CGCGGATCCG TAACTAAAAT GCCGCGCGCT CCCCGCTGC 3
9
(2) INFORMATION FOR SEQ ID NO:499:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:499:
CCGGAATTCG TTAGTTACTT ACAAAGAGGT GGCTTCTTCG GC 4
2
(2) INFORMATION FOR SEQ ID NO:500:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 39 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:500:
CGCGGATCCG TAACTAAAGC CACCTCTTTG GAGGGTGCG 3
9
(2) INFORMATION FOR SEQ ID NO:501:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:501:
CCGGAATTCG TTAGTTACTT AAGACCTGAG CAGCTCGACG AC 4
2
(2) INFORMATION FOR SEQ ID NO:502:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 39 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:502:
CGCGGATCCG TAACTAAAAT GAGTGTGTAC GTCGTCGAG 3
9
(2) INFORMATION FOR SEQ ID NO:503:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 40 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:503:
CCGGAATTCG TTAGTTACTT AGATCCCCTG GCACTGGACG 4
0
(2) INFORMATION FOR SEQ ID NO:504:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 39 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:504:
CGCGGATCCG TAACTAAAAT CCCGCAGGGC TCCATCCTC 3
9
(2) INFORMATION FOR SEQ ID NO:505:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:505:
CCGGAATTCG TTAGTTACTT AGTCCAGGAT GGTCTTGAAG TC 4
2
(2) INFORMATION FOR SEQ ID NO:506:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:506:
GGCATCGCGG GGGTGGCCGG G 2
1
(2) INFORMATION FOR SEQ ID NO:507:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:507:
GGACACCTGG CGGAAGGAGG G 2
1
(2) INFORMATION FOR SEQ ID NO:508:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:508:
GCGTGCCAGC AGGTGAACCA G 2
1
(2) INFORMATION FOR SEQ ID NO:509:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:509:
CTCAGGGGCA GCGCCACGCC T 2
1
(2) INFORMATION FOR SEQ ID NO:510:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:510:
AGGTGGCTTC TTCGGCGGGT C 2
1
(2) INFORMATION FOR SEQ ID NO:511:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:511:
GGACAAGGCG TGTCCCAGGG A 2
1
(2) INFORMATION FOR SEQ ID NO:512:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:512:
GCTGGGGTGA CCGCAGCTCG C 2
1
(2) INFORMATION FOR SEQ ID NO:513:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:513:
GATGAACTTC TTGGTGTTCC T 2
1
(2) INFORMATION FOR SEQ ID NO:514:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:514:
GTGCGCCAGG CCCTGTGGAT A 2
1
(2) INFORMATION FOR SEQ ID NO:515:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:515:
GCCCATGGGC GGCCTTCTGG A 2
1
(2) INFORMATION FOR SEQ ID NO:516:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:516:
GAGGCCACTG CTGGCCTCAT T 2
1
(2) INFORMATION FOR SEQ ID NO:517:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:517:
GGGTGAGGTG AGGTGTCACC A 2
1
(2) INFORMATION FOR SEQ ID NO:518:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 31 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:518:
GCTGCAGCAC ACATGCGTGA AACCTGTACG C 3
1
(2) INFORMATION FOR SEQ ID NO:519:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:519:
GACGCGCAGG AAAAATGTGG G 2
1
(2) INFORMATION FOR SEQ ID NO:520:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:520:
CCGAGCGCCA GCCTGTGGGG A 2
1
(2) INFORMATION FOR SEQ ID NO:521:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:521:
CAGCGGGGAG CGCGCGGCAT C 2
1
(2) INFORMATION FOR SEQ ID NO:522:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(A) DESCRIPTION: /desc = "phosphorothioate"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:522:
CAGCACCTCG CGGTAGTGGC T 2
1
(2) INFORMATION FOR SEQ ID NO:523:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:523:
TCAAGCCAAA CCTGAATCTG AG 2
2
(2) INFORMATION FOR SEQ ID NO:524:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:524:
CCCGAGTGAA TCTTTCTACG C 2
1
(2) INFORMATION FOR SEQ ID NO:525:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:525:
GTCTCTGGCA GTTTCCTCAT CCC 2
3
(2) INFORMATION FOR SEQ ID NO:526:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:526:
TTTAGGCATC CTCCCAAGCA CA 2
2
(2) INFORMATION FOR SEQ ID NO:527:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 10 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:527:
TTAGGGTTAG 1
0
(2) INFORMATION FOR SEQ ID NO:528:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:528:
TTAGGGTTAG GGTTAGGG 1
8
(2) INFORMATION FOR SEQ ID NO:529:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:529:
GTTAGGGTTA GGGTTAGG 1
8
(2) INFORMATION FOR SEQ ID NO:530:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 60 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: repeat_unit
(B) LOCATION: 1..6
(D) OTHER INFORMATION: /note= "sequence (CCCTAA)-n, where n is
at least 1, or at least 3, or at least
10 or more"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:530:
CCCTAACCCT AACCCTAACC CTAACCCTAA CCCTAACCCT AACCCTAACC CTAACCCTAA 6
0
(2) INFORMATION FOR SEQ ID NO:531:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: misc_feature
(B) LOCATION: 1..30
(D) OTHER INFORMATION: /note= "non-telomeric nucleotide
sequence, (N)-n, where n is 8-20,
or 6-30"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:531:
NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN TTAG 3
4
(2) INFORMATION FOR SEQ ID NO:532:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: misc_feature
(B) LOCATION: 1..30
(D) OTHER INFORMATION: /note= "non-telomeric nucleotide
sequence, (N)-n, where n is 8-20,
or 6-30"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:532:
NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN AGGG 3
4
(2) INFORMATION FOR SEQ ID NO:533:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 40 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: misc_feature
(B) LOCATION: 1..30
(D) OTHER INFORMATION: /note= "non-telomeric nucleotide
sequence, (N)-n, where n is 8-20,
or 6-30"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:533:
NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN TTAGGGTTAG 4
0
(2) INFORMATION FOR SEQ ID NO:534:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 46 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: misc_feature
(B) LOCATION: 1..30
(D) OTHER INFORMATION: /note= "non-telomeric nucleotide
sequence, (N)-n, where n is 8-20,
or 6-30"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:534:
NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN TTAGGGTTAG GGTTAG 4
6
(2) INFORMATION FOR SEQ ID NO:535:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 52 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: misc_feature
(B) LOCATION: 1..30
(D) OTHER INFORMATION: /note= "non-telomeric nucleotide
sequence, (N)-n, where n is 8-20,
or 6-30"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:535:
NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN TTAGGGTTAG GGTTAGGGTT AG 5
2
(2) INFORMATION FOR SEQ ID NO:536:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 58 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: misc_feature
(B) LOCATION: 1..30
(D) OTHER INFORMATION: /note= "non-telomeric nucleotide
sequence, (N)-n, where n is 8-20,
or 6-30"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:536:
NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN TTAGGGTTAG GGTTAGGGTT AGGGTTAG 5
8
(2) INFORMATION FOR SEQ ID NO:537:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 10 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:537:
TAGGGATTAG 1
0
(2) INFORMATION FOR SEQ ID NO:538:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 16 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: modified_base
(B) LOCATION: 16
(D) OTHER INFORMATION: /mod_base= OTHER
/note= "N = 3’-deoxyguanosine"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:538:
TTAGGGTTAG GGTTAN 1
6
(2) INFORMATION FOR SEQ ID NO:539:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 60 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: repeat_unit
(B) LOCATION: 1..6
(D) OTHER INFORMATION: /note= "sequence (TTAGGG)-n, where n
is 1-10, or typically 3-5"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:539:
TTAGGGTTAG GGTTAGGGTT AGGGTTAGGG TTAGGGTTAG GGTTAGGGTT AGGGTTAGGG 6
0
(2) INFORMATION FOR SEQ ID NO:540:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:540:
Trp Xaa Gly Xaa Ser
1 5
(2) INFORMATION FOR SEQ ID NO:541:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:541:
Pro Arg Arg Arg
1
(2) INFORMATION FOR SEQ ID NO:542:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:542:
Pro Lys Arg Pro Arg Arg
1 5
(2) INFORMATION FOR SEQ ID NO:543:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:543:
GCTCTAGAAT GAAGGGTG 1
8
(2) INFORMATION FOR SEQ ID NO:544:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:544:
GCGACGACTG ACATTGGCCG G 2
1
(2) INFORMATION FOR SEQ ID NO:545:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:545:
GGCTCGAAGT AGCACCGGTG C 2
1
(2) INFORMATION FOR SEQ ID NO:546:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:546:
GTGGGAACAG GCCGATGTCC C 2
1
(2) INFORMATION FOR SEQ ID NO:547:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:547:
TCCCACGTGC GCAGCAGGAC GCAGCGCTGC 3
0
(2) INFORMATION FOR SEQ ID NO:548:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:548:
GCCGGGGCCA GGGCTTCCCA CGTGCGCAGC 3
0
(2) INFORMATION FOR SEQ ID NO:549:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:549:
GGCATCGCGG GGGTGGCCGG GGCCAGGGCT 3
0
(2) INFORMATION FOR SEQ ID NO:550:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:550:
GGCACTGGAC GTAGGACGTG 2
0
(2) INFORMATION FOR SEQ ID NO:551:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:551:
CGGAAGAGTG TCTGGAGCAA 2
0
(2) INFORMATION FOR SEQ ID NO:552:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:552:
CTCAGACACC ATGGGGAAGG TGA 2
3
(2) INFORMATION FOR SEQ ID NO:553:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:553:
ATGATCTTGA GGCTGTTGTC ATA 2
3
(2) INFORMATION FOR SEQ ID NO:554:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 31 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:554:
TAGACCTGTT AGTGTACATT TGAATTGAAG C 3
1
(2) INFORMATION FOR SEQ ID NO:555:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:555:
TAGACCTGTT AGGTTGGATT TGTGGCATCA 3
0
(2) INFORMATION FOR SEQ ID NO:556:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: modified_base
(B) LOCATION: 1
(D) OTHER INFORMATION: /mod_base= OTHER
/note= "N = thymidine modified by a
biotin group"
(ix) FEATURE:
(A) NAME/KEY: modified_base
(B) LOCATION: 12..13
(D) OTHER INFORMATION: /mod_base= gm
(ix) FEATURE:
(A) NAME/KEY: modified_base
(B) LOCATION: 14..17
(D) OTHER INFORMATION: /mod_base= um
(ix) FEATURE:
(A) NAME/KEY: modified_base
(B) LOCATION: 18..21
(D) OTHER INFORMATION: /mod_base= gm
(ix) FEATURE:
(A) NAME/KEY: modified_base
(B) LOCATION: 22..25
(D) OTHER INFORMATION: /mod_base= um
(ix) FEATURE:
(A) NAME/KEY: modified_base
(B) LOCATION: 26
(D) OTHER INFORMATION: /mod_base= gm
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:556:
NAGACCTGTT ANNNNNNNNN NNNNNN 2
6
(2) INFORMATION FOR SEQ ID NO:557:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:557:
CAAAACCCCA AAACCTAACA GGTCTA 2
6
(2) INFORMATION FOR SEQ ID NO:558:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 103 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:558:
GCGGGAATTC TAATACGACT CACTATAGGG AAGAAACTCT GATGAGGCCG AAAGGCCGAA 6
0
ACTCCACGAA AGTGGAGTAA GTTTCTCGAT AATTGATCTG TAG 10
3
(2) INFORMATION FOR SEQ ID NO:559:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 36 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:559:
CGGGGATCCT CTTCAAAAGA TGAGAGGACA GCAAAC 3
6
(2) INFORMATION FOR SEQ ID NO:560:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 60 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:560:
CCCCAAAACC CCAAAACCCC AAAACCCCCA CAGGGGTTTT GGGGTTTTGG GGTTTTGGGG 6
0
(2) INFORMATION FOR SEQ ID NO:561:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 58 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:561:
CCAAAACCCC AAAACCCCAA AACCCCCACA GGGGTTTTGG GGTTTTGGGG TTTTGGGG 5
8
(2) INFORMATION FOR SEQ ID NO:562:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 56 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:562:
AAAACCCCAA AACCCCAAAA CCCCCACAGG GGTTTTGGGG TTTTGGGGTT TTGGGG 5
6
(2) INFORMATION FOR SEQ ID NO:563:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 54 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:563:
AACCCCAAAA CCCCAAAACC CCCACAGGGG TTTTGGGGTT TTGGGGTTTT GGGG 5
4
(2) INFORMATION FOR SEQ ID NO:564:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 48 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:564:
CCCCAAAACC CCAAAACCCC CACAGGGGTT TTGGGGTTTT GGGGTTTT 4
8
(2) INFORMATION FOR SEQ ID NO:565:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 52 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:565:
AAAACCCCAA AACCCCAAAA CCCCCACAGG GGTTTTGGGG TTTTGGGGTT TT 5
2
(2) INFORMATION FOR SEQ ID NO:566:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 50 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:566:
AACCCCAAAA CCCCAAAACC CCCACAGGGG TTTTGGGGTT TTGGGGTTTT 5
0
(2) INFORMATION FOR SEQ ID NO:567:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 46 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:567:
CCAAAACCCC AAAACCCCCA CAGGGGTTTT GGGGTTTTGG GGTTTT 4
6
(2) INFORMATION FOR SEQ ID NO:568:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 44 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:568:
AAAACCCCAA AACCCCCACA GGGGTTTTGG GGTTTTGGGG TTTT 4
4
(2) INFORMATION FOR SEQ ID NO:569:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:569:
TCTRAARTAR TGDGTNADRT TRTTCAT 2
7
(2) INFORMATION FOR SEQ ID NO:570:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 31 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:570:
GCGGATCCAT GAAYCCWGAR AAYCCWAAYG T 3
1
(2) INFORMATION FOR SEQ ID NO:571:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:571:
NNNGTNACHG GHATHAAYAA 2
0
(2) INFORMATION FOR SEQ ID NO:572:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:572:
DGCDGTYTCY TGRTCRTTRT A 2
1
(2) INFORMATION FOR SEQ ID NO:573:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:573:
YARACHAARG GHATYCCHYA RGG 2
3
(2) INFORMATION FOR SEQ ID NO:574:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:574:
DGTDATNARN ARRTARTCRT C 2
1
(2) INFORMATION FOR SEQ ID NO:575:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: modified_base
(B) LOCATION: 1
(D) OTHER INFORMATION: /mod_base= OTHER
/note= "N = guanosine modified by a
biotin group"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:575:
NCCTATTTYT TYTAYNNNAC NGA 2
3
(2) INFORMATION FOR SEQ ID NO:576:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:576:
CCAGATATNA DNARRAARTC RTC 2
3
(2) INFORMATION FOR SEQ ID NO:577:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 5
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Phe, Ile or Leu"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:577:
Asp Asp Phe Leu Xaa Ile
1 5
(2) INFORMATION FOR SEQ ID NO:578:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:578:
ACAATGMGNH TNHTNCCNAA RAA 2
3
(2) INFORMATION FOR SEQ ID NO:579:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(ix) FEATURE:
(A) NAME/KEY: Modified-site
(B) LOCATION: 2..3
(D) OTHER INFORMATION: /product= "OTHER"
/note= "Xaa = Leu or Ile"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:579:
Arg Xaa Xaa Pro Lys Lys
1 5
(2) INFORMATION FOR SEQ ID NO:580:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:580:
ACGAATCKNG GDATNSWRTC RTARCA 2
6
(2) INFORMATION FOR SEQ ID NO:581:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 7 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:581:
Cys Tyr Asp Ser Ile Pro Arg
1 5
(2) INFORMATION FOR SEQ ID NO:582:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:582:
CAATTCTCRT ARCANSWYTT DATRTC 2
6
(2) INFORMATION FOR SEQ ID NO:583:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 7 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:583:
Asp Ile Lys Ser Cys Tyr Asp
1 5
(2) INFORMATION FOR SEQ ID NO:584:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 269 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:584:
GATTACTCCC GAAGAAAGGA TCTTTCCGTC CAATCATGAC TTTCTTAAGA AAGGACAAGC 6
0
AAAAAAATAT TAAGTTAAAT CTAAATTAAA TTCTAATGGA TAGCCAACTT GTGTTTAGGA 12
0
ATTTAAAAGA CATGCTGGGA TAAAAGATAG GATACTCAGT CTTTGATAAT AAACAAATTT 18
0
CAGAAAAATT TGCCTAATTC ATAGAGAAAT GGAAAAATAA AGGAAGACCT CAGCTATATT 24
0
ATGTCACTCT AGACATAAAG ACTTGCTAC 26
9
(2) INFORMATION FOR SEQ ID NO:585:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:585:
GAGTGACATA ATATACGTGA 2
0
(2) INFORMATION FOR SEQ ID NO:586:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 474 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:586:
AAACACAAGG AAGGAAGTCA AATATTCTAT TACCGTAAAC CAATATGGAA ATTAGTGAGT 6
0
AAATTAACTA TTGTCAAAGT AAGAATTTAG TTTTCTGAAA AGAATAAATA AATGAAAAAT 12
0
AATTTTTATC AAAAAATTTA GCTTGAAGAG GAGAATTTGG AAAAAGTTGA AGAAAAATTG 18
0
ATACCAGAAG ATTCATTTTA GAAATACCCT CAAGGAAAGC TAAGGATTAT ACCTAAAAAA 24
0
GGATCTTTCC GTCCAATCAT GACTTTCTTA AGAAAGGACA AGCAAAAAAA TATTAAGTTA 30
0
AATCTAAATT AAATTCTAAT GGATAGCCAA CTTGTGTTTA GGAATTTAAA AGACATGCTG 36
0
GGATAAAAGA TAGGATACTC AGTCTTTGAT AATAAACAAA TTTCAGAAAA ATTTGCCTAA 42
0
TTCATAGAGA AATGGAAAAA TAAAGGAAGA CCTCAGCTAT ATTATGTCAC TCTA 47
4
(2) INFORMATION FOR SEQ ID NO:587:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 50 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:587:
CCAGTGAGCA GAGTGACGAG GACTCGAGCT CAAGCTTTTT TTTTTTTTTT 5
0
(2) INFORMATION FOR SEQ ID NO:588:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:588:
CCAGTGAGCA GAGTGACG 1
8
(2) INFORMATION FOR SEQ ID NO:589:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 32 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:589:
GTGTCATTTC TATATGGAAG ATTTGATTGA TG 3
2
(2) INFORMATION FOR SEQ ID NO:590:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:590:
GAGGACTCGA GCTCAAGC 1
8
(2) INFORMATION FOR SEQ ID NO:591:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 32 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:591:
ACCTATCGTT TACGAAAAAG AAAGGATCAG TG 3
2
(2) INFORMATION FOR SEQ ID NO:592:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 32 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:592:
CACTGATCCT TTCTTTTTCG TAAACGATAG GT 3
2
(2) INFORMATION FOR SEQ ID NO:593:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 31 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:593:
CATCAATCAA ATCTTCCATA TAGAAATGAC A 3
1
(2) INFORMATION FOR SEQ ID NO:594:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(ix) FEATURE:
(A) NAME/KEY: modified_base
(B) LOCATION: 1
(D) OTHER INFORMATION: /mod_base= OTHER
/note= "N = 5’-phosphorylated guanosin
e
"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:594:
NGGCCGTGTT GGCCTAGTTC TCTGCTC 2
7
(2) INFORMATION FOR SEQ ID NO:595:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 38 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:595:
GAGGAGGAGA AGAGCAGAGA ACTAGGCCAA CACGCCCC 3
8
(2) INFORMATION FOR SEQ ID NO:596:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:596:
ATGCTCCTGC GTTTGGTGG 1
9
(2) INFORMATION FOR SEQ ID NO:597:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:597:
CTCAGACACC ATGGGGAAGG TGA 2
3
(2) INFORMATION FOR SEQ ID NO:598:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:598:
ATGATCTTGA GGCTGTTGTC ATA 2
3
(2) INFORMATION FOR SEQ ID NO:599:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:599:
TCTAACCCTA ACTGAGAAGG GCGTAG 2
6
(2) INFORMATION FOR SEQ ID NO:600:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:600:
GTTTGCTCTA GAATGAACGG TGGAAG 2
6
(2) INFORMATION FOR SEQ ID NO:601:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 170 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:601:
CCCCCCGCCG CCCCCTCCTT CCGCCAGGTG GGCCTCCCCG GGGTCGGCGT CCGGCTGGGG 6
0
TTGAGGGCGG CCGGGGGGAA CCAGCGACAT GCGGAGAGCA GCGCAGGCGA CTCAGGGCGC 12
0
TTCCCCCGCA GGTGTCCTGC CTGAAGGAGC TGGTGGCCCG AGTGCTGCAG 17
0
(2) INFORMATION FOR SEQ ID NO:602:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1285 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:602:
Met Ser Asp Lys Ile Ile His Leu Thr Asp Asp Ser Phe Asp Thr Asp
1 5 10 15
Val Leu Lys Ala Asp Gly Ala Ile Leu Val Asp Phe Trp Ala His Trp
20 25 30
Cys Gly Pro Cys Lys Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp
35 40 45
Glu Tyr Gln Gly Lys Leu Thr Val Ala Lys Leu Arg Ile Asp His Asn
50 55 60
Pro Gly Thr Ala Pro Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu
65 70 75 80
Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser
85 90 95
Lys Gly Gln Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly
100 105 110
Ser Gly Asp Asp Asp Asp Lys Val Pro Met His Glu Leu Glu Ile Phe
115 120 125
Glu Phe Ala Ala Ala Ser Thr Gln Arg Cys Val Leu Leu Arg Thr Trp
130 135 140
Glu Ala Leu Ala Pro Ala Thr Pro Ala Met Pro Arg Ala Pro Arg Cys
145 150 155 160
Arg Ala Val Arg Ser Leu Leu Arg Ser His Tyr Arg Glu Val Leu Pro
165 170 175
Leu Ala Thr Phe Val Arg Arg Leu Gly Pro Gln Gly Trp Arg Leu Val
180 185 190
Gln Arg Gly Asp Pro Ala Ala Phe Arg Ala Leu Val Ala Gln Cys Leu
195 200 205
Val Cys Val Pro Trp Asp Ala Arg Pro Pro Pro Ala Ala Pro Ser Phe
210 215 220
Arg Gln Val Ser Cys Leu Lys Glu Leu Val Ala Arg Val Leu Gln Arg
225 230 235 240
Leu Cys Glu Arg Gly Ala Lys Asn Val Leu Ala Phe Gly Phe Ala Leu
245 250 255
Leu Asp Gly Ala Arg Gly Gly Pro Pro Glu Ala Phe Thr Thr Ser Val
260 265 270
Arg Ser Tyr Leu Pro Asn Thr Val Thr Asp Ala Leu Arg Gly Ser Gly
275 280 285
Ala Trp Gly Leu Leu Leu Arg Arg Val Gly Asp Asp Val Leu Val His
290 295 300
Leu Leu Ala Arg Cys Ala Leu Phe Val Leu Val Ala Pro Ser Cys Ala
305 310 315 320
Tyr Gln Val Cys Gly Pro Pro Leu Tyr Gln Leu Gly Ala Ala Thr Gln
325 330 335
Ala Arg Pro Pro Pro His Ala Ser Gly Pro Arg Arg Arg Leu Gly Cys
340 345 350
Glu Arg Ala Trp Asn His Ser Val Arg Glu Ala Gly Val Pro Leu Gly
355 360 365
Leu Pro Ala Pro Gly Ala Arg Arg Arg Gly Gly Ser Ala Ser Arg Ser
370 375 380
Leu Pro Leu Pro Lys Arg Pro Arg Arg Gly Ala Ala Pro Glu Pro Glu
385 390 395 400
Arg Thr Pro Val Gly Gln Gly Ser Trp Ala His Pro Gly Arg Thr Arg
405 410 415
Gly Pro Ser Asp Arg Gly Phe Cys Val Val Ser Pro Ala Arg Pro Ala
420 425 430
Glu Glu Ala Thr Ser Leu Glu Gly Ala Leu Ser Gly Thr Arg His Ser
435 440 445
His Pro Ser Val Gly Arg Gln His His Ala Gly Pro Pro Ser Thr Ser
450 455 460
Arg Pro Pro Arg Pro Trp Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu
465 470 475 480
Thr Lys His Phe Leu Tyr Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro
485 490 495
Ser Phe Leu Leu Ser Ser Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg
500 505 510
Leu Val Glu Thr Ile Phe Leu Gly Ser Arg Pro Trp Met Pro Gly Thr
515 520 525
Pro Arg Arg Leu Pro Arg Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro
530 535 540
Leu Phe Leu Glu Leu Leu Gly Asn His Ala Gln Cys Pro Tyr Gly Val
545 550 555 560
Leu Leu Lys Thr His Cys Pro Leu Arg Ala Ala Val Thr Pro Ala Ala
565 570 575
Gly Val Cys Ala Arg Glu Lys Pro Gln Gly Ser Val Ala Ala Pro Glu
580 585 590
Glu Glu Asp Thr Asp Pro Arg Arg Leu Val Gln Leu Leu Arg Gln His
595 600 605
Ser Ser Pro Trp Gln Val Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg
610 615 620
Leu Val Pro Pro Gly Leu Trp Gly Ser Arg His Asn Glu Arg Arg Phe
625 630 635 640
Leu Arg Asn Thr Lys Lys Phe Ile Ser Leu Gly Lys His Ala Lys Leu
645 650 655
Ser Leu Gln Glu Leu Thr Trp Lys Met Ser Val Arg Asp Cys Ala Trp
660 665 670
Leu Arg Arg Ser Pro Gly Val Gly Cys Val Pro Ala Ala Glu His Arg
675 680 685
Leu Arg Glu Glu Ile Leu Ala Lys Phe Leu His Trp Leu Met Ser Val
690 695 700
Tyr Val Val Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr
705 710 715 720
Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys
725 730 735
Leu Gln Ser Ile Gly Ile Arg Gln His Leu Lys Arg Val Gln Leu Arg
740 745 750
Glu Leu Ser Glu Ala Glu Val Arg Gln His Arg Glu Ala Arg Pro Ala
755 760 765
Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg
770 775 780
Pro Ile Val Asn Met Asp Tyr Val Val Gly Ala Arg Thr Phe Arg Arg
785 790 795 800
Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg Val Lys Ala Leu Phe Ser
805 810 815
Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser
820 825 830
Val Leu Gly Leu Asp Asp Ile His Arg Ala Trp Arg Thr Phe Val Leu
835 840 845
Arg Val Arg Ala Gln Asp Pro Pro Pro Glu Leu Tyr Phe Val Lys Val
850 855 860
Asp Val Thr Gly Ala Tyr Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu
865 870 875 880
Val Ile Ala Ser Ile Ile Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg
885 890 895
Tyr Ala Val Val Gln Lys Ala Ala His Gly His Val Arg Lys Ala Phe
900 905 910
Lys Ser His Val Ser Thr Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln
915 920 925
Phe Val Ala His Leu Gln Glu Thr Ser Pro Leu Arg Asp Ala Val Val
930 935 940
Ile Glu Gln Ser Ser Ser Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp
945 950 955 960
Val Phe Leu Arg Phe Met Cys His His Ala Val Arg Ile Arg Gly Lys
965 970 975
Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr
980 985 990
Leu Leu Cys Ser Leu Cys Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala
995 1000 1005
Gly Ile Arg Arg Asp Gly Leu Leu Leu Arg Leu Val Asp Asp Phe Leu
1010 1015 1020
Leu Val Thr Pro His Leu Thr His Ala Lys Thr Phe Leu Arg Thr Leu
1025 1030 1035 1040
Val Arg Gly Val Pro Glu Tyr Gly Cys Val Val Asn Leu Arg Lys Thr
1045 1050 1055
Val Val Asn Phe Pro Val Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe
1060 1065 1070
Val Gln Met Pro Ala His Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu
1075 1080 1085
Asp Thr Arg Thr Leu Glu Val Gln Ser Asp Tyr Ser Ser Tyr Ala Arg
1090 1095 1100
Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn Arg Gly Phe Lys Ala Gly
1105 1110 1115 1120
Arg Asn Met Arg Arg Lys Leu Phe Gly Val Leu Arg Leu Lys Cys His
1125 1130 1135
Ser Leu Phe Leu Asp Leu Gln Val Asn Ser Leu Gln Thr Val Cys Thr
1140 1145 1150
Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala Tyr Arg Phe His Ala Cys
1155 1160 1165
Val Leu Gln Leu Pro Phe His Gln Gln Val Trp Lys Asn Pro Thr Phe
1170 1175 1180
Phe Leu Arg Val Ile Ser Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu
1185 1190 1195 1200
Lys Ala Lys Asn Ala Gly Met Ser Leu Gly Ala Lys Gly Ala Ala Gly
1205 1210 1215
Pro Leu Pro Ser Glu Ala Val Gln Trp Leu Cys His Gln Ala Phe Leu
1220 1225 1230
Leu Lys Leu Thr Arg His Arg Val Thr Tyr Val Pro Leu Leu Gly Ser
1235 1240 1245
Leu Arg Thr Ala Gln Thr Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr
1250 1255 1260
Leu Thr Ala Leu Glu Ala Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe
1265 1270 1275 1280
Lys Thr Ile Leu Asp
1285
(2) INFORMATION FOR SEQ ID NO:603:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:603:
Gly Ser Val Thr Lys
1 5
(2) INFORMATION FOR SEQ ID NO:604:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 538 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:604:
Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro
1 5 10 15
Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu
20 25 30
Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu
35 40 45
Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys
50 55 60
Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn
65 70 75 80
Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu
85 90 95
Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser
100 105 110
Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu
115 120 125
Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn
130 135 140
Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp
145 150 155 160
Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu
165 170 175
Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr
180 185 190
Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala
195 200 205
Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Val Pro Arg
210 215 220
Gly Ser Arg Arg Ala Ser Val Gly Ser Val Thr Lys Ile Pro Gln Gly
225 230 235 240
Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp Met Glu
245 250 255
Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu Arg Leu
260 265 270
Val Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr His Ala Lys Thr
275 280 285
Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys Val Val
290 295 300
Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu Ala Leu
305 310 315 320
Gly Gly Thr Ala Phe Val Gln Met Pro Ala His Gly Leu Phe Pro Trp
325 330 335
Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser Asp Tyr
340 345 350
Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser Val Thr Phe Asn Arg
355 360 365
Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly Val Leu
370 375 380
Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn Ser Leu
385 390 395 400
Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala Tyr
405 410 415
Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln Gln Val Trp
420 425 430
Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser Asp Thr Ala Ser Leu
435 440 445
Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly Met Ser Leu Gly Ala
450 455 460
Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala Val Gln Trp Leu Cys
465 470 475 480
His Gln Ala Phe Leu Leu Lys Leu Thr Arg His Arg Val Thr Tyr Val
485 490 495
Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr Gln Leu Ser Arg Lys
500 505 510
Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala Ala Ala Asn Pro Ala
515 520 525
Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp
530 535
(2) INFORMATION FOR SEQ ID NO:605:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 530 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:605:
Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro
1 5 10 15
Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu
20 25 30
Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu
35 40 45
Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys
50 55 60
Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn
65 70 75 80
Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu
85 90 95
Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser
100 105 110
Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu
115 120 125
Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn
130 135 140
Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp
145 150 155 160
Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu
165 170 175
Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr
180 185 190
Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala
195 200 205
Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Val Pro Arg
210 215 220
Gly Ser Arg Arg Ala Ser Val Gly Ser Val His His His His His His
225 230 235 240
His His Gly Ser Val Thr Lys Met Ser Val Tyr Val Val Glu Leu Leu
245 250 255
Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu
260 265 270
Phe Phe Tyr Arg Pro Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile
275 280 285
Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu
290 295 300
Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu
305 310 315 320
Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp
325 330 335
Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg
340 345 350
Leu Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg
355 360 365
Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp
370 375 380
Ile His Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp
385 390 395 400
Pro Pro Pro Glu Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr
405 410 415
Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile
420 425 430
Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys
435 440 445
Ala Ala His Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr
450 455 460
Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln
465 470 475 480
Glu Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser
485 490 495
Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met
500 505 510
Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln
515 520 525
Gly Ile
530
(2) INFORMATION FOR SEQ ID NO:606:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 515 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:606:
Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro
1 5 10 15
Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu
20 25 30
Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu
35 40 45
Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys
50 55 60
Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn
65 70 75 80
Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu
85 90 95
Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser
100 105 110
Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu
115 120 125
Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn
130 135 140
Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp
145 150 155 160
Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu
165 170 175
Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr
180 185 190
Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala
195 200 205
Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Val Pro Arg
210 215 220
Gly Ser Arg Arg Ala Ser Val Gly Ser Val Thr Lys Met Ser Val Tyr
225 230 235 240
Val Val Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe
245 250 255
Gln Lys Asn Arg Leu Phe Phe Tyr Arg Pro Ser Val Trp Ser Lys Leu
260 265 270
Gln Ser Ile Gly Ile Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu
275 280 285
Leu Ser Glu Ala Glu Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu
290 295 300
Leu Thr Ser Arg Leu Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro
305 310 315 320
Ile Val Asn Met Asp Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu
325 330 335
Lys Arg Ala Glu Arg Leu Thr Ser Arg Lys Ala Leu Phe Ser Val Leu
340 345 350
Asn Tyr Glu Arg Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu
355 360 365
Gly Leu Asp Asp Ile His Arg Ala Trp Arg Thr Phe Val Leu Arg Val
370 375 380
Arg Ala Gln Asp Pro Pro Pro Glu Tyr Phe Val Lys Val Asp Val Thr
385 390 395 400
Gly Ala Tyr Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala
405 410 415
Ser Ile Ile Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val
420 425 430
Val Gln Lys Ala Ala His Gly Val Arg Lys Ala Phe Lys Ser His Val
435 440 445
Ser Thr Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His
450 455 460
Leu Gln Glu Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser
465 470 475 480
Ser Ser Leu Asn Glu Ala Ser Gly Leu Phe Asp Val Phe Leu Arg Phe
485 490 495
Met Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys
500 505 510
Gln Gly Ile
515
(2) INFORMATION FOR SEQ ID NO:607:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 514 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:607:
Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro
1 5 10 15
Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu
20 25 30
Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu
35 40 45
Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys
50 55 60
Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn
65 70 75 80
Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu
85 90 95
Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser
100 105 110
Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu
115 120 125
Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn
130 135 140
Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp
145 150 155 160
Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu
165 170 175
Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr
180 185 190
Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala
195 200 205
Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Val Pro Arg
210 215 220
Gly Ser Arg Arg Ala Ser Val Gly Ser Val Thr Lys Ala Thr Ser Leu
225 230 235 240
Glu Gly Ala Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg
245 250 255
Gln His His Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp
260 265 270
Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr
275 280 285
Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser
290 295 300
Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe
305 310 315 320
Leu Gly Ser Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg
325 330 335
Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu
340 345 350
Gly Asn His Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys
355 360 365
Pro Leu Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu
370 375 380
Lys Pro Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro
385 390 395 400
Arg Arg Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val
405 410 415
Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu
420 425 430
Trp Gly Ser Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys
435 440 445
Phe Ile Ser Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr
450 455 460
Trp Lys Met Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly
465 470 475 480
Val Gly Cys Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu
485 490 495
Ala Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu
500 505 510
Arg Ser
(2) INFORMATION FOR SEQ ID NO:608:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 517 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:608:
Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro
1 5 10 15
Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu
20 25 30
Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu
35 40 45
Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys
50 55 60
Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn
65 70 75 80
Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu
85 90 95
Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser
100 105 110
Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu
115 120 125
Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn
130 135 140
Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp
145 150 155 160
Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu
165 170 175
Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr
180 185 190
Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala
195 200 205
Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Val Pro Arg
210 215 220
Gly Ser Arg Arg Ala Ser Val Gly Ser Val Thr Lys Met Pro Arg Ala
225 230 235 240
Pro Arg Cys Arg Ala Val Arg Ser Leu Leu Ser His Tyr Arg Glu Val
245 250 255
Leu Pro Leu Ala Thr Phe Val Arg Arg Leu Gly Pro Gln Gly Trp Arg
260 265 270
Leu Val Gln Arg Gly Asp Pro Ala Ala Phe Arg Ala Leu Val Ala Gln
275 280 285
Cys Leu Val Cys Val Pro Trp Asp Ala Arg Pro Pro Ala Ala Pro Ser
290 295 300
Phe Arg Gln Val Ser Cys Leu Lys Glu Leu Val Ala Arg Val Leu Gln
305 310 315 320
Arg Leu Cys Glu Arg Gly Ala Lys Asn Val Leu Ala Phe Gly Phe Ala
325 330 335
Leu Leu Asp Gly Ala Arg Gly Gly Pro Pro Glu Ala Thr Thr Ser Val
340 345 350
Arg Ser Tyr Leu Pro Asn Thr Val Thr Asp Ala Leu Arg Gly Ser Gly
355 360 365
Ala Trp Gly Leu Leu Leu Arg Arg Val Gly Asp Asp Val Leu Val His
370 375 380
Leu Leu Ala Arg Cys Ala Leu Phe Val Leu Val Ala Pro Cys Ala Tyr
385 390 395 400
Gln Val Cys Gly Pro Pro Leu Tyr Gln Leu Gly Ala Ala Thr Gln Ala
405 410 415
Arg Pro Pro Pro His Ala Ser Gly Pro Arg Arg Arg Leu Gly Cys Glu
420 425 430
Arg Ala Trp Asn His Ser Val Arg Glu Ala Gly Val Pro Leu Gly Leu
435 440 445
Pro Ala Pro Gly Ala Arg Arg Arg Gly Gly Ser Ala Ser Arg Ser Leu
450 455 460
Pro Leu Pro Lys Arg Pro Arg Arg Gly Ala Ala Pro Glu Pro Glu Arg
465 470 475 480
Thr Pro Val Gly Gln Gly Ser Trp Ala His Pro Gly Arg Thr Arg Gly
485 490 495
Pro Ser Asp Arg Gly Phe Cys Val Val Ser Pro Ala Arg Pro Ala Glu
500 505 510
Glu Ala Thr Ser Leu
515
(2) INFORMATION FOR SEQ ID NO:609:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:609:
CCGGCCACCC CCCATATGCC GCGCGCTCCC 3
0
(2) INFORMATION FOR SEQ ID NO:610:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 58 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:610:
TGCGCACGTG GGAAGCCCTG GCAGATCTGA ATTCCACCAT GCCGCGCGCT CCCCGCTG 5
8
(2) INFORMATION FOR SEQ ID NO:611:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 60 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:611:
CGGGACGGGC TGCTCCTGCG TTTGGTGGAC GCGTTCTTGT TGGTGACACC TCACCTCACC 6
0
(2) INFORMATION FOR SEQ ID NO:612:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:612:
Asn Ser Ala Val Asp
1 5
(2) INFORMATION FOR SEQ ID NO:613:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1154 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:613:
Met Pro Arg Ala Pro Arg Cys Arg Ala Val Arg Ser Leu Leu Arg Ser
1 5 10 15
His Tyr Arg Glu Val Leu Pro Leu Ala Thr Phe Val Arg Arg Leu Gly
20 25 30
Pro Gln Gly Trp Arg Leu Val Gln Arg Gly Asp Pro Ala Ala Phe Arg
35 40 45
Ala Leu Val Ala Gln Cys Leu Val Cys Val Pro Trp Asp Ala Arg Pro
50 55 60
Pro Pro Ala Ala Pro Ser Phe Arg Gln Val Ser Cys Leu Lys Glu Leu
65 70 75 80
Val Ala Arg Val Leu Gln Arg Leu Cys Glu Arg Gly Ala Lys Asn Val
85 90 95
Leu Ala Phe Gly Phe Ala Leu Leu Asp Gly Ala Arg Gly Gly Pro Pro
100 105 110
Glu Ala Phe Thr Thr Ser Val Arg Ser Tyr Leu Pro Asn Thr Val Thr
115 120 125
Asp Ala Leu Arg Gly Ser Gly Ala Trp Gly Leu Leu Leu Arg Arg Val
130 135 140
Gly Asp Asp Val Leu Val His Leu Leu Ala Arg Cys Ala Leu Phe Val
145 150 155 160
Leu Val Ala Pro Ser Cys Ala Tyr Gln Val Cys Gly Pro Pro Leu Tyr
165 170 175
Gln Leu Gly Ala Ala Thr Gln Ala Arg Pro Pro Pro His Ala Ser Gly
180 185 190
Pro Arg Arg Arg Leu Gly Cys Glu Arg Ala Trp Asn His Ser Val Arg
195 200 205
Glu Ala Gly Val Pro Leu Gly Leu Pro Ala Pro Gly Ala Arg Arg Arg
210 215 220
Gly Gly Ser Ala Ser Arg Ser Leu Pro Leu Pro Lys Arg Pro Arg Arg
225 230 235 240
Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln Gly Ser Trp
245 250 255
Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly Phe Cys Val
260 265 270
Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu Glu Gly Ala
275 280 285
Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg Gln His His
290 295 300
Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp Asp Thr Pro
305 310 315 320
Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr Ser Ser Gly
325 330 335
Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser Leu Arg Pro
340 345 350
Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe Leu Gly Ser
355 360 365
Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg Leu Pro Gln
370 375 380
Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn His
385 390 395 400
Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys Pro Leu Arg
405 410 415
Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu Lys Pro Gln
420 425 430
Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro Arg Arg Leu
435 440 445
Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val Tyr Gly Phe
450 455 460
Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu Trp Gly Ser
465 470 475 480
Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe Ile Ser
485 490 495
Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr Trp Lys Met
500 505 510
Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val Gly Cys
515 520 525
Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu Ala Lys Phe
530 535 540
Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe
545 550 555 560
Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr
565 570 575
Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His
580 585 590
Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln
595 600 605
His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile
610 615 620
Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val
625 630 635 640
Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser
645 650 655
Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg
660 665 670
Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His Arg
675 680 685
Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro
690 695 700
Glu Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr Asp Thr Ile
705 710 715 720
Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln
725 730 735
Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His
740 745 750
Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr Asp
755 760 765
Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln Glu Thr Ser
770 775 780
Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser Leu Asn Glu
785 790 795 800
Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met Cys His His
805 810 815
Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro
820 825 830
Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp
835 840 845
Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu
850 855 860
Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr His Ala
865 870 875 880
Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys
885 890 895
Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu
900 905 910
Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His Gly Leu Phe
915 920 925
Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser
930 935 940
Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe
945 950 955 960
Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly
965 970 975
Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn
980 985 990
Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln
995 1000 1005
Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln Gln
1010 1015 1020
Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser Asp Thr Ala
1025 1030 1035 1040
Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly Met Ser Leu
1045 1050 1055
Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala Val Gln Trp
1060 1065 1070
Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His Arg Val Thr
1075 1080 1085
Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr Gln Leu Ser
1090 1095 1100
Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala Ala Ala Asn
1105 1110 1115 1120
Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp Leu Glu Gln Lys
1125 1130 1135
Leu Ile Ser Glu Glu Asp Leu Asn Ser Ala Val Asp His His His His
1140 1145 1150
His His
(2) INFORMATION FOR SEQ ID NO:614:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1200 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:614:
Met Pro Arg Gly Ser His His His His His His Gly Met Ala Ser Met
1 5 10 15
Thr Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Leu
20 25 30
Asp Pro Ser Ser Arg Ser Ala Ala Gly Thr Met Glu Phe Ala Ala Ala
35 40 45
Ser Thr Gln Arg Cys Val Leu Leu Arg Thr Trp Glu Ala Leu Ala Pro
50 55 60
Ala Thr Pro Ala Met Pro Arg Ala Pro Arg Cys Arg Ala Val Arg Ser
65 70 75 80
Leu Leu Arg Ser His Tyr Arg Glu Val Leu Pro Leu Ala Thr Phe Val
85 90 95
Arg Arg Leu Gly Pro Gln Gly Trp Arg Leu Val Gln Arg Gly Asp Pro
100 105 110
Ala Ala Phe Arg Ala Leu Val Ala Gln Cys Leu Val Cys Val Pro Trp
115 120 125
Asp Ala Arg Pro Pro Pro Ala Ala Pro Ser Phe Arg Gln Val Ser Cys
130 135 140
Leu Lys Glu Leu Val Ala Arg Val Leu Gln Arg Leu Cys Glu Arg Gly
145 150 155 160
Ala Lys Asn Val Leu Ala Phe Gly Phe Ala Leu Leu Asp Gly Ala Arg
165 170 175
Gly Gly Pro Pro Glu Ala Phe Thr Thr Ser Val Arg Ser Tyr Leu Pro
180 185 190
Asn Thr Val Thr Asp Ala Leu Arg Gly Ser Gly Ala Trp Gly Leu Leu
195 200 205
Leu Arg Arg Val Gly Asp Asp Val Leu Val His Leu Leu Ala Arg Cys
210 215 220
Ala Leu Phe Val Leu Val Ala Pro Ser Cys Ala Tyr Gln Val Cys Gly
225 230 235 240
Pro Pro Leu Tyr Gln Leu Gly Ala Ala Thr Gln Ala Arg Pro Pro Pro
245 250 255
His Ala Ser Gly Pro Arg Arg Arg Leu Gly Cys Glu Arg Ala Trp Asn
260 265 270
His Ser Val Arg Glu Ala Gly Val Pro Leu Gly Leu Pro Ala Pro Gly
275 280 285
Ala Arg Arg Arg Gly Gly Ser Ala Ser Arg Ser Leu Pro Leu Pro Lys
290 295 300
Arg Pro Arg Arg Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly
305 310 315 320
Gln Gly Ser Trp Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg
325 330 335
Gly Phe Cys Val Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser
340 345 350
Leu Glu Gly Ala Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly
355 360 365
Arg Gln His His Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro
370 375 380
Trp Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu
385 390 395 400
Tyr Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser
405 410 415
Ser Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile
420 425 430
Phe Leu Gly Ser Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro
435 440 445
Arg Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu
450 455 460
Leu Gly Asn His Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His
465 470 475 480
Cys Pro Leu Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg
485 490 495
Glu Lys Pro Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp
500 505 510
Pro Arg Arg Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln
515 520 525
Val Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly
530 535 540
Leu Trp Gly Ser Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys
545 550 555 560
Lys Phe Ile Ser Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu
565 570 575
Thr Trp Lys Met Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro
580 585 590
Gly Val Gly Cys Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile
595 600 605
Leu Ala Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu
610 615 620
Leu Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg
625 630 635 640
Leu Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly
645 650 655
Ile Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala
660 665 670
Glu Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg
675 680 685
Leu Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met
690 695 700
Asp Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu
705 710 715 720
Arg Leu Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu
725 730 735
Arg Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp
740 745 750
Asp Ile His Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln
755 760 765
Asp Pro Pro Pro Glu Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala
770 775 780
Tyr Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile
785 790 795 800
Ile Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln
805 810 815
Lys Ala Ala His Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser
820 825 830
Thr Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu
835 840 845
Gln Glu Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser
850 855 860
Ser Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe
865 870 875 880
Met Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys
885 890 895
Gln Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu
900 905 910
Cys Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp
915 920 925
Gly Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His
930 935 940
Leu Thr His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro
945 950 955 960
Glu Tyr Gly Cys Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro
965 970 975
Val Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala
980 985 990
His Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu
995 1000 1005
Glu Val Gln Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala
1010 1015 1020
Ser Leu Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg
1025 1030 1035 1040
Lys Leu Phe Gly Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp
1045 1050 1055
Leu Gln Val Asn Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile
1060 1065 1070
Leu Leu Leu Gln Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro
1075 1080 1085
Phe His Gln Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile
1090 1095 1100
Ser Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala
1105 1110 1115 1120
Gly Met Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu
1125 1130 1135
Ala Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg
1140 1145 1150
His Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln
1155 1160 1165
Thr Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu
1170 1175 1180
Ala Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp
1185 1190 1195 1200
(2) INFORMATION FOR SEQ ID NO:615:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1189 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:615:
Met Lys Phe Leu Val Asn Val Ala Leu Val Phe Met Val Val Tyr Ile
1 5 10 15
Ser Tyr Ile Tyr Ala Asp Pro Ser Ser Arg Ser Ala Ala Gly Thr Met
20 25 30
Glu Phe Ala Ala Ala Ser Thr Gln Arg Cys Val Leu Leu Arg Thr Trp
35 40 45
Glu Ala Leu Ala Pro Ala Thr Pro Ala Met Pro Arg Ala Pro Arg Cys
50 55 60
Arg Ala Val Arg Ser Leu Leu Arg Ser His Tyr Arg Glu Val Leu Pro
65 70 75 80
Leu Ala Thr Phe Val Arg Arg Leu Gly Pro Gln Gly Trp Arg Leu Val
85 90 95
Gln Arg Gly Asp Pro Ala Ala Phe Arg Ala Leu Val Ala Gln Cys Leu
100 105 110
Val Cys Val Pro Trp Asp Ala Arg Pro Pro Pro Ala Ala Pro Ser Phe
115 120 125
Arg Gln Val Ser Cys Leu Lys Glu Leu Val Ala Arg Val Leu Gln Arg
130 135 140
Leu Cys Glu Arg Gly Ala Lys Asn Val Leu Ala Phe Gly Phe Ala Leu
145 150 155 160
Leu Asp Gly Ala Arg Gly Gly Pro Pro Glu Ala Phe Thr Thr Ser Val
165 170 175
Arg Ser Tyr Leu Pro Asn Thr Val Thr Asp Ala Leu Arg Gly Ser Gly
180 185 190
Ala Trp Gly Leu Leu Leu Arg Arg Val Gly Asp Asp Val Leu Val His
195 200 205
Leu Leu Ala Arg Cys Ala Leu Phe Val Leu Val Ala Pro Ser Cys Ala
210 215 220
Tyr Gln Val Cys Gly Pro Pro Leu Tyr Gln Leu Gly Ala Ala Thr Gln
225 230 235 240
Ala Arg Pro Pro Pro His Ala Ser Gly Pro Arg Arg Arg Leu Gly Cys
245 250 255
Glu Arg Ala Trp Asn His Ser Val Arg Glu Ala Gly Val Pro Leu Gly
260 265 270
Leu Pro Ala Pro Gly Ala Arg Arg Arg Gly Gly Ser Ala Ser Arg Ser
275 280 285
Leu Pro Leu Pro Lys Arg Pro Arg Arg Gly Ala Ala Pro Glu Pro Glu
290 295 300
Arg Thr Pro Val Gly Gln Gly Ser Trp Ala His Pro Gly Arg Thr Arg
305 310 315 320
Gly Pro Ser Asp Arg Gly Phe Cys Val Val Ser Pro Ala Arg Pro Ala
325 330 335
Glu Glu Ala Thr Ser Leu Glu Gly Ala Leu Ser Gly Thr Arg His Ser
340 345 350
His Pro Ser Val Gly Arg Gln His His Ala Gly Pro Pro Ser Thr Ser
355 360 365
Arg Pro Pro Arg Pro Trp Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu
370 375 380
Thr Lys His Phe Leu Tyr Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro
385 390 395 400
Ser Phe Leu Leu Ser Ser Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg
405 410 415
Leu Val Glu Thr Ile Phe Leu Gly Ser Arg Pro Trp Met Pro Gly Thr
420 425 430
Pro Arg Arg Leu Pro Arg Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro
435 440 445
Leu Phe Leu Glu Leu Leu Gly Asn His Ala Gln Cys Pro Tyr Gly Val
450 455 460
Leu Leu Lys Thr His Cys Pro Leu Arg Ala Ala Val Thr Pro Ala Ala
465 470 475 480
Gly Val Cys Ala Arg Glu Lys Pro Gln Gly Ser Val Ala Ala Pro Glu
485 490 495
Glu Glu Asp Thr Asp Pro Arg Arg Leu Val Gln Leu Leu Arg Gln His
500 505 510
Ser Ser Pro Trp Gln Val Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg
515 520 525
Leu Val Pro Pro Gly Leu Trp Gly Ser Arg His Asn Glu Arg Arg Phe
530 535 540
Leu Arg Asn Thr Lys Lys Phe Ile Ser Leu Gly Lys His Ala Lys Leu
545 550 555 560
Ser Leu Gln Glu Leu Thr Trp Lys Met Ser Val Arg Asp Cys Ala Trp
565 570 575
Leu Arg Arg Ser Pro Gly Val Gly Cys Val Pro Ala Ala Glu His Arg
580 585 590
Leu Arg Glu Glu Ile Leu Ala Lys Phe Leu His Trp Leu Met Ser Val
595 600 605
Tyr Val Val Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr
610 615 620
Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys
625 630 635 640
Leu Gln Ser Ile Gly Ile Arg Gln His Leu Lys Arg Val Gln Leu Arg
645 650 655
Glu Leu Ser Glu Ala Glu Val Arg Gln His Arg Glu Ala Arg Pro Ala
660 665 670
Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg
675 680 685
Pro Ile Val Asn Met Asp Tyr Val Val Gly Ala Arg Thr Phe Arg Arg
690 695 700
Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg Val Lys Ala Leu Phe Ser
705 710 715 720
Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser
725 730 735
Val Leu Gly Leu Asp Asp Ile His Arg Ala Trp Arg Thr Phe Val Leu
740 745 750
Arg Val Arg Ala Gln Asp Pro Pro Pro Glu Leu Tyr Phe Val Lys Val
755 760 765
Asp Val Thr Gly Ala Tyr Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu
770 775 780
Val Ile Ala Ser Ile Ile Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg
785 790 795 800
Tyr Ala Val Val Gln Lys Ala Ala His Gly His Val Arg Lys Ala Phe
805 810 815
Lys Ser His Val Ser Thr Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln
820 825 830
Phe Val Ala His Leu Gln Glu Thr Ser Pro Leu Arg Asp Ala Val Val
835 840 845
Ile Glu Gln Ser Ser Ser Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp
850 855 860
Val Phe Leu Arg Phe Met Cys His His Ala Val Arg Ile Arg Gly Lys
865 870 875 880
Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr
885 890 895
Leu Leu Cys Ser Leu Cys Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala
900 905 910
Gly Ile Arg Arg Asp Gly Leu Leu Leu Arg Leu Val Asp Asp Phe Leu
915 920 925
Leu Val Thr Pro His Leu Thr His Ala Lys Thr Phe Leu Arg Thr Leu
930 935 940
Val Arg Gly Val Pro Glu Tyr Gly Cys Val Val Asn Leu Arg Lys Thr
945 950 955 960
Val Val Asn Phe Pro Val Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe
965 970 975
Val Gln Met Pro Ala His Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu
980 985 990
Asp Thr Arg Thr Leu Glu Val Gln Ser Asp Tyr Ser Ser Tyr Ala Arg
995 1000 1005
Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn Arg Gly Phe Lys Ala Gly
1010 1015 1020
Arg Asn Met Arg Arg Lys Leu Phe Gly Val Leu Arg Leu Lys Cys His
1025 1030 1035 1040
Ser Leu Phe Leu Asp Leu Gln Val Asn Ser Leu Gln Thr Val Cys Thr
1045 1050 1055
Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala Tyr Arg Phe His Ala Cys
1060 1065 1070
Val Leu Gln Leu Pro Phe His Gln Gln Val Trp Lys Asn Pro Thr Phe
1075 1080 1085
Phe Leu Arg Val Ile Ser Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu
1090 1095 1100
Lys Ala Lys Asn Ala Gly Met Ser Leu Gly Ala Lys Gly Ala Ala Gly
1105 1110 1115 1120
Pro Leu Pro Ser Glu Ala Val Gln Trp Leu Cys His Gln Ala Phe Leu
1125 1130 1135
Leu Lys Leu Thr Arg His Arg Val Thr Tyr Val Pro Leu Leu Gly Ser
1140 1145 1150
Leu Arg Thr Ala Gln Thr Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr
1155 1160 1165
Leu Thr Ala Leu Glu Ala Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe
1170 1175 1180
Lys Thr Ile Leu Asp
1185
(2) INFORMATION FOR SEQ ID NO:616:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 58 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:616:
TGCGCACGTG GGAAGCCCTG GCAGATCTGA ATTCCACCAT GCCGCGCGCT CCCCGCTG 5
8
(2) INFORMATION FOR SEQ ID NO:617:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 58 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:617:
TGCGCACGTG GGAAGCCCTG GCAGATCTGA ATTCCACCAT GCCGCGCGCT CCCCGCTG 5
8
(2) INFORMATION FOR SEQ ID NO:618:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 92 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:618:
CTGCCCTCAG ACTTCAAGAC CATCCTGGAC TACAAGGACG ACGATGACAA ATGAATTCAG 6
0
ATCTGCGGCC GCCACCGCGG TGGAGCTCCA GC 9
2
(2) INFORMATION FOR SEQ ID NO:619:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 60 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:619:
CGGGACGGGC TGCTCCTGCG TTTGGTGGAC GCGTTCTTGT TGGTGACACC TCACCTCACC 6
0
(2) INFORMATION FOR SEQ ID NO:620:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 92 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:620:
CTGCCCTCAG ACTTCAAGAC CATCCTGGAC TACAAGGACG ACGATGACAA ATGAATTCAG 6
0
ATCTGCGGCC GCCACCGCGG TGGAGCTCCA GC 9
2
(2) INFORMATION FOR SEQ ID NO:621:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 60 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:621:
CGGGACGGGC TGCTCCTGCG TTTGGTGGAC GCGTTCTTGT TGGTGACACC TCACCTCACC 6
0
(2) INFORMATION FOR SEQ ID NO:622:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 58 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:622:
TGCGCACGTG GGAAGCCCTG GCAGATCTGA ATTCCACCAT GCCGCGCGCT CCCCGCTG 5
8
(2) INFORMATION FOR SEQ ID NO:623:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 92 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:623:
CTGCCCTCAG ACTTCAAGAC CATCCTGGAC TACAAGGACG ACGATGACAA ATGAATTCAG 6
0
ATCTGCGGCC GCCACCGCGG TGGAGCTCCA GC 9
2
(2) INFORMATION FOR SEQ ID NO:624:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 53 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:624:
CTTCAAGACC ATCCTGGACT TTCGAAACGC GGCCGCCACC GCGGTGGAGC TCC 5
3
(2) INFORMATION FOR SEQ ID NO:625:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 33 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:625:
GCCACCCCCG CGCTGCCTCG AGCTCCCCGC TGC 3
3
(2) INFORMATION FOR SEQ ID NO:626:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 48 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:626:
GGGGAAGCTT TAATACGACT CACTATAGGG TTGCGGAGGG TGGGCCTG 4
8
(2) INFORMATION FOR SEQ ID NO:627:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 36 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:627:
CCCCGGATCC TGCGCATGTG TGAGCCGAGT CCTGGG 3
6
(2) INFORMATION FOR SEQ ID NO:628:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 62 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:628:
ATTCCGTCGA GCAGAGTTAG GGTTAGGGTT AGGGTTAGGG TTAGGGTTAG GGTTAGGGTT 6
0
AG 6
2
(2) INFORMATION FOR SEQ ID NO:629:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:629:
AATCCGTCGA GCAGAGTT 1
8
(2) INFORMATION FOR SEQ ID NO:630:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:630:
TTAGGGTTAG GGTTAGGG 1
8
(2) INFORMATION FOR SEQ ID NO:631:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:631:
AATCCGTCGA GCAGAGGG 1
8
(2) INFORMATION FOR SEQ ID NO:632:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:632:
AATCCGTCGA GCAGATAG 1
8
(2) INFORMATION FOR SEQ ID NO:633:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 84 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:633:
GGGAGATCTT AATACGACTC ACTATAGATT CAGGCCATGG TGCTGCGCCG GCTGTCAGGC 6
0
TCCCACGACG TAGTCCATGT TCAC 8
4
(2) INFORMATION FOR SEQ ID NO:634:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 32 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:634:
GGGTCTAGAT CCGGAAGAGT GTCTGGAGCA AG 3
2
(2) INFORMATION FOR SEQ ID NO:635:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 84 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:635:
GGGAGATCTT AATACGACTC ACTATAGATT CAGGCCATGG TGCTGCGCCG GCTGTCAGGG 6
0
CGGCCTTCTG GACCACGGCA TACC 8
4
(2) INFORMATION FOR SEQ ID NO:636:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:636:
GGTCTAGACG ATATCCACAG GGCCTGGCGC 3
0
(2) INFORMATION FOR SEQ ID NO:637:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1407 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:637:
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Ser
225 230 235 240
Gly Arg Thr Gln Ile Ser Ser Ser Ser Phe Glu Phe Ala Ala Ala Ser
245 250 255
Thr Gln Arg Cys Val Leu Leu Arg Thr Trp Glu Ala Leu Ala Pro Ala
260 265 270
Thr Pro Ala Met Pro Arg Ala Pro Arg Cys Arg Ala Val Arg Ser Leu
275 280 285
Leu Arg Ser His Tyr Arg Glu Val Leu Pro Leu Ala Thr Phe Val Arg
290 295 300
Arg Leu Gly Pro Gln Gly Trp Arg Leu Val Gln Arg Gly Asp Pro Ala
305 310 315 320
Ala Phe Arg Ala Leu Val Ala Gln Cys Leu Val Cys Val Pro Trp Asp
325 330 335
Ala Arg Pro Pro Pro Ala Ala Pro Ser Phe Arg Gln Val Ser Cys Leu
340 345 350
Lys Glu Leu Val Ala Arg Val Leu Gln Arg Leu Cys Glu Arg Gly Ala
355 360 365
Lys Asn Val Leu Ala Phe Gly Phe Ala Leu Leu Asp Gly Ala Arg Gly
370 375 380
Gly Pro Pro Glu Ala Phe Thr Thr Ser Val Arg Ser Tyr Leu Pro Asn
385 390 395 400
Thr Val Thr Asp Ala Leu Arg Gly Ser Gly Ala Trp Gly Leu Leu Leu
405 410 415
Arg Arg Val Gly Asp Asp Val Leu Val His Leu Leu Ala Arg Cys Ala
420 425 430
Leu Phe Val Leu Val Ala Pro Ser Cys Ala Tyr Gln Val Cys Gly Pro
435 440 445
Pro Leu Tyr Gln Leu Gly Ala Ala Thr Gln Ala Arg Pro Pro Pro His
450 455 460
Ala Ser Gly Pro Arg Arg Arg Leu Gly Cys Glu Arg Ala Trp Asn His
465 470 475 480
Ser Val Arg Glu Ala Gly Val Pro Leu Gly Leu Pro Ala Pro Gly Ala
485 490 495
Arg Arg Arg Gly Gly Ser Ala Ser Arg Ser Leu Pro Leu Pro Lys Arg
500 505 510
Pro Arg Arg Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln
515 520 525
Gly Ser Trp Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly
530 535 540
Phe Cys Val Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu
545 550 555 560
Glu Gly Ala Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg
565 570 575
Gln His His Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp
580 585 590
Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr
595 600 605
Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser
610 615 620
Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe
625 630 635 640
Leu Gly Ser Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg
645 650 655
Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu
660 665 670
Gly Asn His Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys
675 680 685
Pro Leu Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu
690 695 700
Lys Pro Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro
705 710 715 720
Arg Arg Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val
725 730 735
Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu
740 745 750
Trp Gly Ser Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys
755 760 765
Phe Ile Ser Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr
770 775 780
Trp Lys Met Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly
785 790 795 800
Val Gly Cys Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu
805 810 815
Ala Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu
820 825 830
Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu
835 840 845
Phe Phe Tyr Arg Pro Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile
850 855 860
Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu
865 870 875 880
Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu
885 890 895
Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp
900 905 910
Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg
915 920 925
Leu Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg
930 935 940
Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp
945 950 955 960
Ile His Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp
965 970 975
Pro Pro Pro Glu Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr
980 985 990
Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile
995 1000 1005
Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys
1010 1015 1020
Ala Ala His Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr
1025 1030 1035 1040
Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln
1045 1050 1055
Glu Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser
1060 1065 1070
Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met
1075 1080 1085
Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln
1090 1095 1100
Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys
1105 1110 1115 1120
Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly
1125 1130 1135
Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu
1140 1145 1150
Thr His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu
1155 1160 1165
Tyr Gly Cys Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val
1170 1175 1180
Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His
1185 1190 1195 1200
Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu
1205 1210 1215
Val Gln Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser
1220 1225 1230
Val Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys
1235 1240 1245
Leu Phe Gly Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu
1250 1255 1260
Gln Val Asn Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu
1265 1270 1275 1280
Leu Leu Gln Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe
1285 1290 1295
His Gln Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser
1300 1305 1310
Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly
1315 1320 1325
Met Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala
1330 1335 1340
Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His
1345 1350 1355 1360
Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr
1365 1370 1375
Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala
1380 1385 1390
Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp
1395 1400 1405
(2) INFORMATION FOR SEQ ID NO:638:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:638:
AATCCGTCGA GCAGAGTT 1
8
(2) INFORMATION FOR SEQ ID NO:639:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:639:
GCGCGGCTTA CCCTTACCCT TACCCTAACC 3
0
(2) INFORMATION FOR SEQ ID NO:640:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 18 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:640:
ATCGCTTCTC GGCCTTTT 1
8
(2) INFORMATION FOR SEQ ID NO:641:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 36 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:641:
AATCCGTCGA GCAGAGTTAA AAGGCCGAGA AGCGAT 3
6
Claims (11)
- 単離されたポリヌクレオチドまたは組み換えポリヌクレオチドであって、ヒトテロメラーゼ逆転写酵素(hTRT)核酸配列の部分配列を含み、該部分配列は、配列番号1で示される核酸配列に同一かまたは相補的である少なくとも15〜3000の連続した塩基からなり、該部分配列は、配列番号1の核酸配列または配列番号1の核酸配列の相補体に対してストリンジェントな条件下でハイブリダイズするが、ただし、該部分配列は配列番号8または配列番号3である核酸を除く、ポリヌクレオチドであって、
ただし、該ポリヌクレオチドは、テロメラーゼRNAと会合するときテロメラーゼ触媒活性を有するポリペプチドをコードする、単離された、合成の、実質的に純粋な、または組換えのポリヌクレオチドであって:
(a)配列番号1に示される配列を有するポリヌクレオチド;または
(b)該(a)に正確に相補的なポリヌクレオチドにストリンジェントな条件下でハイブリダイズするポリヌクレオチド;または
(c)配列番号2に記載のアミノ酸配列、または該アミノ酸配列中に単一のアミノ酸または低い割合のアミノ酸の置換、付加、または、欠失を含むアミノ酸配列を有するポリペプチドをコードするポリヌクレオチド;
であるポリヌクレオチドを除く、ポリヌクレオチド。 - 請求項1に記載のポリヌクレオチドであって、前記部分配列が、配列番号1の少なくとも50、100、200または500の連続したヌクレオチドからなるポリヌクレオチド。
- hTRT核酸配列の部分配列を含む、単離されたポリヌクレオチドまたは組み換えポリヌクレオチドであって、該部分配列が、以下:
a)プラスミドpGRN121(ATCC 209016)のヌクレオチド1625〜2458のヒトテロメラーゼ逆転写酵素(hTRT)挿入物の配列に同一か又は相補的である少なくとも100〜3000塩基;または
b)プラスミドpGRN121(ATCC 209016)のヌクレオチド782〜1636のヒトテロメラーゼ逆転写酵素(hTRT)挿入物の配列に同一か又は相補的である少なくとも15〜3000塩基、
からなり、該部分配列が、配列番号1の核酸配列または配列番号1の核酸配列の相補体に対してストリンジェントな条件下でハイブリダイズする、ポリヌクレオチドであって、
ただし、該ポリヌクレオチドは、テロメラーゼRNAと会合するときテロメラーゼ触媒活性を有するポリペプチドをコードする、単離された、合成の、実質的に純粋な、または組換えのポリヌクレオチドであって:
(a)配列番号1に示される配列を有するポリヌクレオチド;または
(b)該(a)に正確に相補的なポリヌクレオチドにストリンジェントな条件下でハイブリダイズするポリヌクレオチド;または
(c)配列番号2に記載のアミノ酸配列、または該アミノ酸配列中に単一のアミノ酸または低い割合のアミノ酸の置換、付加、または、欠失を含むアミノ酸配列を有するポリペプチドをコードするポリヌクレオチド;
であるポリヌクレオチドを除く、ポリヌクレオチド。 - 請求項3で規定される単離されたポリヌクレオチドまたは組み換えポリヌクレオチドであって、該ポリヌクレオチドが、前記のいずれかの配列に同一であるか又は相補的である少なくとも200塩基の核酸配列を含む、ポリヌクレオチド。
- 請求項3で規定されるポリヌクレオチドであって、前記部分配列が、プラスミドpGRN121(ATCC 209016)のヌクレオチド1625〜2458のヒトテロメラーゼ逆転写酵素(hTRT)挿入物の配列に同一か又は相補的である核酸配列を含む、ポリヌクレオチド。
- 請求項3で規定されるポリヌクレオチドであって、前記部分配列が、プラスミドpGRN121(ATCC 209016)のヌクレオチド782〜1636のヒトテロメラーゼ逆転写酵素(hTRT)挿入物の配列に同一か又は相補的である核酸配列を含む、ポリヌクレオチド。
- 請求項1〜6のいずれかに記載のポリヌクレオチドであって、該ポリヌクレオチドが、該ポリヌクレオチドの発現を調節するプロモーターをさらに含む、ポリヌクレオチド。
- 請求項1〜7のいずれかに記載のポリヌクレオチドであって、該ポリヌクレオチドが、プラスミドベクターまたはウイルスベクター中に含まれる、ポリヌクレオチド。
- 請求項8に記載のポリヌクレオチドであって、前記ウイルスベクターが、アデノウイルスベクター、ヘルペスウイルスベクター、またはエプスタインバーウイルスベクターである、ポリヌクレオチド。
- 請求項1〜9のいずれかに記載のポリヌクレオチドであって、アジュバントおよび/または薬学的に受容可能な担体をさらに含む、ポリヌクレオチド。
- 請求項1〜9のいずれかに記載のポリヌクレオチドを含む薬学的組成物であって、薬学的に受容可能な担体を任意にともなう、薬学的組成物。
Applications Claiming Priority (16)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US72464396A | 1996-10-01 | 1996-10-01 | |
US08/724,643 | 1996-10-01 | ||
US84441997A | 1997-04-18 | 1997-04-18 | |
US08/844,419 | 1997-04-18 | ||
US84601797A | 1997-04-25 | 1997-04-25 | |
US08/846,017 | 1997-04-25 | ||
US08/851,843 US6093809A (en) | 1996-10-01 | 1997-05-06 | Telomerase |
US08/851,843 | 1997-05-06 | ||
US08/854,050 US6261836B1 (en) | 1996-10-01 | 1997-05-09 | Telomerase |
US08/854,050 | 1997-05-09 | ||
US91550397A | 1997-08-14 | 1997-08-14 | |
US91131297A | 1997-08-14 | 1997-08-14 | |
US08/912,951 | 1997-08-14 | ||
US08/915,503 | 1997-08-14 | ||
US08/912,951 US6475789B1 (en) | 1996-10-01 | 1997-08-14 | Human telomerase catalytic subunit: diagnostic and therapeutic methods |
US08/911,312 | 1997-08-14 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000227474A Division JP2001081042A (ja) | 1996-10-01 | 2000-07-27 | ヒトテロメラーゼ触媒性サブユニット |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009040779A JP2009040779A (ja) | 2009-02-26 |
JP4852576B2 true JP4852576B2 (ja) | 2012-01-11 |
Family
ID=27575511
Family Applications (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP28618297A Expired - Lifetime JP3869092B2 (ja) | 1996-10-01 | 1997-10-01 | ヒトテロメラーゼ触媒性サブユニット |
JP51690998A Pending JP2001510985A (ja) | 1996-10-01 | 1997-10-01 | ヒトテロメラーゼ触媒性サブユニット |
JP51680298A Pending JP2001523947A (ja) | 1996-10-01 | 1997-10-01 | テロメラーゼ逆転写酵素 |
JP32016998A Expired - Lifetime JP4070331B2 (ja) | 1996-10-01 | 1998-10-15 | ヒトテロメラーゼ触媒性サブユニットプロモーター |
JP11042410A Pending JPH11313689A (ja) | 1996-10-01 | 1999-02-19 | ヒトテロメラ―ゼ触媒性サブユニット |
JP2000227474A Withdrawn JP2001081042A (ja) | 1996-10-01 | 2000-07-27 | ヒトテロメラーゼ触媒性サブユニット |
JP2008194208A Expired - Lifetime JP4852576B2 (ja) | 1996-10-01 | 2008-07-28 | ヒトテロメラーゼ触媒性サブユニット |
Family Applications Before (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP28618297A Expired - Lifetime JP3869092B2 (ja) | 1996-10-01 | 1997-10-01 | ヒトテロメラーゼ触媒性サブユニット |
JP51690998A Pending JP2001510985A (ja) | 1996-10-01 | 1997-10-01 | ヒトテロメラーゼ触媒性サブユニット |
JP51680298A Pending JP2001523947A (ja) | 1996-10-01 | 1997-10-01 | テロメラーゼ逆転写酵素 |
JP32016998A Expired - Lifetime JP4070331B2 (ja) | 1996-10-01 | 1998-10-15 | ヒトテロメラーゼ触媒性サブユニットプロモーター |
JP11042410A Pending JPH11313689A (ja) | 1996-10-01 | 1999-02-19 | ヒトテロメラ―ゼ触媒性サブユニット |
JP2000227474A Withdrawn JP2001081042A (ja) | 1996-10-01 | 2000-07-27 | ヒトテロメラーゼ触媒性サブユニット |
Country Status (20)
Country | Link |
---|---|
US (4) | US6166178A (ja) |
EP (6) | EP0954585B1 (ja) |
JP (7) | JP3869092B2 (ja) |
KR (2) | KR100530483B1 (ja) |
CN (3) | CN1291231B (ja) |
AT (3) | ATE245194T1 (ja) |
AU (2) | AU4803697A (ja) |
BR (3) | BR9711844A (ja) |
CA (3) | CA2267664C (ja) |
DE (5) | DE69723531T3 (ja) |
EA (2) | EA199900349A1 (ja) |
ES (1) | ES2205132T5 (ja) |
FI (1) | FI990655A7 (ja) |
FR (1) | FR2757177A1 (ja) |
GB (2) | GB2321642B8 (ja) |
IL (2) | IL129103A0 (ja) |
NO (2) | NO319982B1 (ja) |
NZ (1) | NZ334709A (ja) |
SG (1) | SG94355A1 (ja) |
WO (2) | WO1998014592A2 (ja) |
Families Citing this family (178)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5958680A (en) | 1994-07-07 | 1999-09-28 | Geron Corporation | Mammalian telomerase |
US6517834B1 (en) | 1995-08-04 | 2003-02-11 | Geron Corporation | Purified telomerase |
US6545133B1 (en) | 1995-08-04 | 2003-04-08 | Geron Corporation | Methods for purifying telomerase |
DE59609347D1 (de) | 1995-11-16 | 2002-07-18 | Michael W Dahm | Verfahren zur quantifizierung von tumorzellen in einer körperflüssigkeit und dazu geeignete testkits |
US6881571B1 (en) * | 1998-03-11 | 2005-04-19 | Exonhit Therapeutics S.A. | Qualitative differential screening |
US6607898B1 (en) | 1996-03-26 | 2003-08-19 | Oncomedx, Inc. | Method for detection of hTR and hTERT telomerase-associated RNA in plasma or serum |
US6475789B1 (en) | 1996-10-01 | 2002-11-05 | University Technology Corporation | Human telomerase catalytic subunit: diagnostic and therapeutic methods |
US6777203B1 (en) | 1997-11-19 | 2004-08-17 | Geron Corporation | Telomerase promoter driving expression of therapeutic gene sequences |
US6808880B2 (en) | 1996-10-01 | 2004-10-26 | Geron Corporation | Method for detecting polynucleotides encoding telomerase |
US6093809A (en) | 1996-10-01 | 2000-07-25 | University Technology Corporation | Telomerase |
US6261836B1 (en) | 1996-10-01 | 2001-07-17 | Geron Corporation | Telomerase |
CN1291231B (zh) * | 1996-10-01 | 2010-06-02 | 杰龙公司 | 人类的端粒酶催化亚单位 |
US6444650B1 (en) * | 1996-10-01 | 2002-09-03 | Geron Corporation | Antisense compositions for detecting and inhibiting telomerase reverse transcriptase |
US6610839B1 (en) | 1997-08-14 | 2003-08-26 | Geron Corporation | Promoter for telomerase reverse transcriptase |
US7585622B1 (en) | 1996-10-01 | 2009-09-08 | Geron Corporation | Increasing the proliferative capacity of cells using telomerase reverse transcriptase |
US7390891B1 (en) | 1996-11-15 | 2008-06-24 | Amgen Inc. | Polynucleotides encoding a telomerase component TP2 |
WO1998023759A2 (en) * | 1996-11-26 | 1998-06-04 | Baylor College Of Medicine | Identification of inhibitors that prevent access of telomerase to chromosomal terminus |
WO1998037181A2 (en) * | 1997-02-20 | 1998-08-27 | Whitehead Institute For Biomedical Research | Telomerase catalytic subunit gene and encoded protein |
US7622549B2 (en) | 1997-04-18 | 2009-11-24 | Geron Corporation | Human telomerase reverse transcriptase polypeptides |
US7413864B2 (en) | 1997-04-18 | 2008-08-19 | Geron Corporation | Treating cancer using a telomerase vaccine |
US20050013825A1 (en) * | 1997-04-18 | 2005-01-20 | Geron Corporation | Vaccine containing the catalytic subunit of telomerase for treating cancer |
JP2002508662A (ja) * | 1997-06-20 | 2002-03-19 | バイエル・アクチエンゲゼルシヤフト | ヒトテロメラーゼの触媒サブユニット並びにその診断的及び治療的使用 |
JP2002514928A (ja) | 1997-07-01 | 2002-05-21 | キャンビア バイオシステムス リミティド ライアビリティー カンパニー | 脊椎動物テロメラーゼ遺伝子およびタンパク質ならびにその使用 |
EP1571215A3 (en) * | 1997-07-01 | 2007-10-31 | Cambia Biosystems LLC | Vertebrate telomerase genes and proteins and uses thereof |
US7378244B2 (en) * | 1997-10-01 | 2008-05-27 | Geron Corporation | Telomerase promoters sequences for screening telomerase modulators |
AU1606999A (en) * | 1997-11-26 | 1999-06-15 | Albert Einstein College Of Medicine Of Yeshiva University | Mouse telomerase reverse transcriptase |
DE19757984A1 (de) * | 1997-12-24 | 1999-07-01 | Bayer Ag | Regulatorische DNA-Sequenzen aus der 5'-Region vom Gen der humanen katalytischen Telomerase-Untereinheit udn deren diagnostische und therapeutische Verwendung |
DE19804372A1 (de) * | 1998-02-04 | 1999-08-05 | Michael W Dr Dr Dahm | Verfahren zur quantitativen Bestimmung von Tumorzellen in einer Körperflüssigkeit und dazu geeignete Testkits |
CA2291798A1 (en) | 1998-03-26 | 1999-10-07 | Kyowa Hakko Kogyo Co., Ltd. | Monoclonal antibody against human telomerase catalytic subunit |
US6337200B1 (en) * | 1998-03-31 | 2002-01-08 | Geron Corporation | Human telomerase catalytic subunit variants |
US7402307B2 (en) | 1998-03-31 | 2008-07-22 | Geron Corporation | Method for identifying and killing cancer cells |
EP1068296B1 (en) | 1998-03-31 | 2011-08-10 | Geron Corporation | Compositions for eliciting an immune response to a telomerase antigen |
US20030105315A1 (en) * | 1998-04-09 | 2003-06-05 | Metagen Pharmaceuticals Gmbh | Human nucleic acid sequences from ovarian tumor tissue |
US7030211B1 (en) | 1998-07-08 | 2006-04-18 | Gemvax As | Antigenic peptides derived from telomerase |
US6900049B2 (en) | 1998-09-10 | 2005-05-31 | Cell Genesys, Inc. | Adenovirus vectors containing cell status-specific response elements and methods of use thereof |
US6667176B1 (en) | 2000-01-11 | 2003-12-23 | Geron Corporation | cDNA libraries reflecting gene expression during growth and differentiation of human pluripotent stem cells |
DE69934426T2 (de) | 1998-10-29 | 2007-10-04 | Whitehead Institute For Biomedical Research, Cambridge | KREBSIMMUNTHERAPIE UND KREBSDIAGNOSE UNTER VERWENDUNG UNIVERSELLER TUMORASSOZIIERTER ANTIGENE EINSCHLIESSLICH hTERT |
GB9900298D0 (en) * | 1999-01-07 | 1999-02-24 | Medical Res Council | Optical sorting method |
JP2002536967A (ja) * | 1999-01-22 | 2002-11-05 | フンボルト−ウニベルジテート ツー ベルリン ウニベルジテートスクリーニクム シャリテー | ヒトテロメラーゼ(hTERT)の触媒サブユニットを標的とするリボザイム |
EP1147181B1 (en) * | 1999-02-04 | 2004-05-12 | Geron Corporation | Replicative virus driven by the promoter for telomerase reverse transcriptase for use in treating cancer |
CA2370000A1 (en) | 1999-04-08 | 2000-10-19 | Uab Research Foundation | Antiproliferative activity of g-righ oligonucleotides and method of using same to bind to nucleolin |
US8114850B2 (en) | 1999-04-08 | 2012-02-14 | Advanced Cancer Therapeutics, Llc | Antiproliferative activity of G-rich oligonucleotides and method of using same to bind to nucleolin |
US7960540B2 (en) | 1999-04-08 | 2011-06-14 | Advanced Cancer Therapeutics, Llc | Antiproliferative activity of G-rich oligonucleotides and method of using same to bind to nucleolin |
WO2000061766A2 (en) * | 1999-04-09 | 2000-10-19 | Biomira, Inc. | Telomerase-specific cancer vaccine |
US6358739B1 (en) * | 1999-04-12 | 2002-03-19 | Modex Therapeutiques, S.A. | Transiently immortalized cells |
DE19916929A1 (de) * | 1999-04-15 | 2000-10-19 | Bayer Ag | Ein automatisierbarer Schnelltest zum Nachweis von Krebserkrankungen auf der Basis von Telomerase(hTC) mRNA mit spezifischen Primern und Sonden |
US6995145B1 (en) | 1999-06-04 | 2006-02-07 | Au Jessie L-S | Methods and compositions for modulating drug activity through telomere damage |
US20050255596A1 (en) * | 1999-09-07 | 2005-11-17 | West Michael D | Methods of repairing tandemly repeated DNA sequences and extending cell life-span nuclear transfer |
JP4267233B2 (ja) | 1999-09-10 | 2009-05-27 | ジェロン・コーポレーション | オリゴヌクレオチドn3’→p5’チオホスホルアミデート:それらの合成および使用 |
FR2798673B1 (fr) * | 1999-09-16 | 2004-05-28 | Exonhit Therapeutics Sa | Methodes et compositions pour la detection d'evenements pathologiques |
US6399384B1 (en) | 1999-09-17 | 2002-06-04 | Reneuron Limited | Conditional immortalization of cells |
WO2001036971A1 (fr) * | 1999-11-16 | 2001-05-25 | Kyowa Hakko Kogyo Co., Ltd. | Methode de recherche de substance d'inhibition de liaison entre des sous-unites de telomerase |
US7074983B2 (en) | 1999-11-19 | 2006-07-11 | Kirin Beer Kabushiki Kaisha | Transgenic bovine comprising human immunoglobulin loci and producing human immunoglobulin |
GB9927353D0 (en) * | 1999-11-19 | 2000-01-19 | Cantab Pharma Res | Virus preparation and use |
US7414170B2 (en) | 1999-11-19 | 2008-08-19 | Kirin Beer Kabushiki Kaisha | Transgenic bovines capable of human antibody production |
US6664046B1 (en) * | 1999-12-16 | 2003-12-16 | Roche Molecular Systems, Inc. | Quantitation of hTERT mRNA expression |
KR20010096991A (ko) * | 2000-04-19 | 2001-11-08 | 임정빈 | 텔로머레이즈의 프로모터에 특정하게 결합하는더블유티이1 절편, 그 유전자, 발현벡터 및 그것을 이용한세포성장 억제 방법 |
US6458589B1 (en) | 2000-04-27 | 2002-10-01 | Geron Corporation | Hepatocyte lineage cells derived from pluripotent stem cells |
IT1318504B1 (it) * | 2000-05-08 | 2003-08-27 | Talent Srl | Metodo e apparecchiatura per la diagnosi precoce di tumori vescicalisu campioni di urina. |
US6492171B2 (en) | 2000-05-16 | 2002-12-10 | Isis Pharmaceuticals, Inc. | Antisense modulation of TERT expression |
US6331399B1 (en) | 2000-05-16 | 2001-12-18 | Isis Pharmaceuticals, Inc. | Antisense inhibition of tert expression |
US7250294B2 (en) | 2000-05-17 | 2007-07-31 | Geron Corporation | Screening small molecule drugs using neural cells differentiated from human embryonic stem cells |
EP1158055A1 (fr) | 2000-05-26 | 2001-11-28 | Xu Qi University of Teaxs Laboratoire de Leucémie Chen | Méthode pour le diagnostic de cancers |
US7078491B1 (en) | 2000-09-21 | 2006-07-18 | Amgen Inc. | Selective binding agents of telomerase |
US6576464B2 (en) | 2000-11-27 | 2003-06-10 | Geron Corporation | Methods for providing differentiated stem cells |
AU2002235141A1 (en) | 2000-11-27 | 2002-06-03 | Geron Corporation | Glycosyltransferase vectors for treating cancer |
AU2002226076A1 (en) * | 2000-12-14 | 2002-06-24 | The Government Of The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services | Telomerase immortalized human liver cell lines |
US7491534B2 (en) | 2000-12-22 | 2009-02-17 | Kirin Holdings Kabushiki Kaisha | Methods for altering cell fate to generate T-cells specific for an antigen of interest |
AU2002232858B2 (en) | 2000-12-22 | 2007-01-11 | Sab, Llc | Methods for cloning mammals using reprogrammed donor chromatin or donor cells |
US6906237B2 (en) * | 2001-02-27 | 2005-06-14 | G. Scott Herron | Vivo assay for anti angiogenic compounds |
US20040063922A1 (en) * | 2001-04-17 | 2004-04-01 | Conrad Charles A. | Methods and compositions for catalytic DNA exchange in a sequence specific manner |
WO2002091999A2 (en) * | 2001-05-09 | 2002-11-21 | Geron Corporation | Treatment for wounds |
GB0112342D0 (en) * | 2001-05-21 | 2001-07-11 | Norsk Hydro As | Polypeptides |
EP1408109B1 (en) * | 2001-07-16 | 2008-07-09 | Fuyuki Ishikawa | Novel method for the induction of cellular senescence and method for screening anti-aging agent |
US7150989B2 (en) * | 2001-08-10 | 2006-12-19 | Cornell Research Foundation, Inc. | Telomerase immortalized neural progenitor cells |
AUPR769701A0 (en) * | 2001-09-14 | 2001-10-11 | Li, He | Telomerase inhibitory peptides and uses thereof |
CA2463960A1 (en) * | 2001-10-18 | 2003-05-01 | Heart Biosystems Gmbh | Transient immortalization |
AU2002343527A1 (en) * | 2001-10-22 | 2003-05-06 | University Of Rochester | Telomerase interference |
EP1447443A4 (en) * | 2001-10-31 | 2006-06-07 | Renomedix Inst Inc | IMMORTALIZED MESENCHYMAL CELLS AND USE THEREOF |
JP4666567B2 (ja) | 2001-12-07 | 2011-04-06 | ジェロン・コーポレーション | ヒト胚幹細胞由来の膵島細胞 |
US20030153082A1 (en) | 2001-12-07 | 2003-08-14 | The John P. Robarts Research Institute | Hematopoietic cells from human embryonic stem cells |
DE10163130B4 (de) * | 2001-12-20 | 2009-05-14 | Cyto Tools Gmbh | Apoptotisch wirksame Peptide und diese umfassende pharmazeutische Zusammensetzungen |
WO2003054545A1 (fr) * | 2001-12-21 | 2003-07-03 | Mitsubishi Kagaku Iatron, Inc. | Procede permettant de detecter un anticorps anti-telomerase |
GB0200929D0 (en) * | 2002-01-16 | 2002-03-06 | Univ Glasgow | Tissue rejection |
US7638334B2 (en) * | 2002-01-18 | 2009-12-29 | Morphotek, Inc. | Method for generating engineered cells by homologously recombining segments having increased degeneracy |
US20030175961A1 (en) * | 2002-02-26 | 2003-09-18 | Herron G. Scott | Immortal micorvascular endothelial cells and uses thereof |
US20050106729A1 (en) * | 2002-05-03 | 2005-05-19 | Mark Irvin Rosenblatt | Gene transfer methods and compositions |
US7405202B2 (en) * | 2002-05-28 | 2008-07-29 | Regents Of The University Of Minnesota | CRISP polypeptides as contraceptives and inhibitors of sperm capacitation |
US7294708B2 (en) * | 2002-05-31 | 2007-11-13 | Beijing Institute Of Biotechnology | Telomerase reverse transcriptase fragments and uses thereof |
CA2488924A1 (en) * | 2002-06-18 | 2003-12-24 | Zymogenetics, Inc. | Hybrid vector having a cytomegalovirus enhancer and myeloproliferative sarcoma virus promoter |
US7285415B2 (en) | 2002-07-11 | 2007-10-23 | The Regents Of The University Of California | Oligodendrocytes derived from human embryonic stem cells for remyelination and treatment of spinal cord injury |
MXPA05004870A (es) | 2002-11-08 | 2005-11-04 | Hematech Llc | Ungulados transgenicos que tienen actividad reducida de la proteina prion y sus usos. |
US7166692B2 (en) * | 2003-03-04 | 2007-01-23 | Canbrex Bio Science Walkersville, Inc. | Intracellular delivery of small molecules, proteins, and nucleic acids |
US8771982B2 (en) * | 2003-04-30 | 2014-07-08 | Duke University | Chimeric molecule and nucleic acid encoding same |
HRP20180330T1 (hr) | 2003-06-23 | 2018-04-20 | Telomerase Activation Sciences, Inc. | Pripravci za povećavanje aktivnosti telomeraze i liječenje infekcije hiv-om |
WO2005026201A1 (en) * | 2003-09-12 | 2005-03-24 | Reneuron Limited | Immortalisation of mammalian cells and therapeutic applications of said cells |
EP1522858A1 (en) * | 2003-10-10 | 2005-04-13 | Jean-Christophe Roegel | Methods for selecting compounds using antibodies with activity as agonist, antagonist or allosteric modulators |
US7473418B2 (en) | 2004-03-25 | 2009-01-06 | Cell Genesys, Inc. | Pan cancer oncolytic vectors and methods of use thereof |
AU2005237494B2 (en) | 2004-04-22 | 2010-06-10 | Kyowa Hakko Kirin Co., Ltd | Transgenic animals and uses thereof |
EP3070174B1 (en) | 2004-05-11 | 2019-11-06 | Ncardia AG | Drug discovery based on in vitro differentiated cells |
CA2576055A1 (en) * | 2004-08-05 | 2006-03-23 | Steven E. Artandi | Methods and compositions for cell activation |
US8697139B2 (en) | 2004-09-21 | 2014-04-15 | Frank M. Phillips | Method of intervertebral disc treatment using articular chondrocyte cells |
JP2006242618A (ja) * | 2005-03-01 | 2006-09-14 | Univ Of Tokyo | 組織fish法によるテロメア量を指標とした癌の診断 |
JP4635196B2 (ja) * | 2005-03-04 | 2011-02-16 | 国立大学法人広島大学 | 遺伝子導入細胞、及びそれを用いたテロメラーゼ誘導物質の検出方法 |
RU2007137122A (ru) * | 2005-03-09 | 2009-04-20 | Борд Оф Риджентс, Дзе Юниверсити Оф Техас Систем (Us) | НОВЫЙ ПРОМОТОР hTMC И ВЕКТОРЫ ДЛЯ ОПУХОЛЕСЕЛЕКТИВНОЙ И ВЫСОКОЭФФЕКТИВНОЙ ЭКСПРЕССИИ ТЕРАПЕВТИЧЕСКИХ ПРОТИВОРАКОВЫХ ГЕНОВ |
EP1886138A4 (en) * | 2005-05-11 | 2009-04-15 | Genetic Technologies Ltd | METHODS FOR ENRICHING FETAL CELLS |
EP1748067A1 (en) * | 2005-07-29 | 2007-01-31 | Institut Pasteur | Polynucleotides encoding MHC class I-restricted hTERT epitopes, analogues thereof or polyepitopes |
ES2672205T3 (es) | 2005-12-21 | 2018-06-13 | Université Catholique de Louvain | Células madre hepáticas aisladas |
WO2007149182A2 (en) | 2006-06-19 | 2007-12-27 | Geron Corporation | Differentiation and enrichment of islet-like cells from human pluripotent stem cells |
US20080131442A1 (en) * | 2006-06-26 | 2008-06-05 | Science Applications International Corporation | IgY antibodies to human telomerase reverse transcriptase |
WO2008002285A1 (en) * | 2006-06-26 | 2008-01-03 | Science Applications International Corporation | Igy antibodies to human telomerase reverse transcriptase |
KR102511874B1 (ko) * | 2006-07-28 | 2023-03-20 | 더 트러스티스 오브 더 유니버시티 오브 펜실바니아 | 개선된 백신 및 이의 사용 방법 |
AU2013203229C1 (en) * | 2006-07-28 | 2015-10-29 | The Trustees Of The University Of Pennsylvania | Improved vaccines and methods for using the same |
EP2076531B1 (en) | 2006-10-12 | 2011-11-23 | Istituto di Ricerche di Biologia Molecolare P. Angeletti S.R.L. | Telomerase reverse transcriptase fusion protein, nucleotides encoding it, and uses thereof |
US20100226927A1 (en) | 2006-11-03 | 2010-09-09 | Weissman Irving L | Selective immunodepletion of endogenous stem cell niche for engraftment |
EP1994942A1 (en) * | 2007-05-25 | 2008-11-26 | INSERM (Institut National de la Santé et de la Recherche Médicale) | Pharmaceutical compositions comprising telomerase, and uses thereof |
WO2009091811A1 (en) | 2008-01-14 | 2009-07-23 | Brenzel Michael P | Apparatus and methods for fracture repair |
US9186128B2 (en) | 2008-10-01 | 2015-11-17 | Covidien Lp | Needle biopsy device |
US9332973B2 (en) | 2008-10-01 | 2016-05-10 | Covidien Lp | Needle biopsy device with exchangeable needle and integrated needle protection |
US8968210B2 (en) | 2008-10-01 | 2015-03-03 | Covidien LLP | Device for needle biopsy with integrated needle protection |
US9782565B2 (en) | 2008-10-01 | 2017-10-10 | Covidien Lp | Endoscopic ultrasound-guided biliary access system |
US11298113B2 (en) | 2008-10-01 | 2022-04-12 | Covidien Lp | Device for needle biopsy with integrated needle protection |
US9447467B2 (en) | 2009-04-21 | 2016-09-20 | Genetic Technologies Limited | Methods for obtaining fetal genetic material |
WO2011005930A1 (en) * | 2009-07-09 | 2011-01-13 | Centocor Ortho Biotech Inc. | Cardiac tissue-derived cells |
WO2011088172A1 (en) | 2010-01-15 | 2011-07-21 | Brenzel Michael P | Rotary-rigid orthopaedic rod |
EP2523616B1 (en) | 2010-01-20 | 2019-04-17 | Conventus Orthopaedics, Inc. | Apparatus for bone access and cavity preparation |
LT2536830T (lt) | 2010-02-16 | 2019-11-11 | Ultimovacs Asa | Polipeptidai |
US9249452B2 (en) * | 2010-02-26 | 2016-02-02 | Zhu Zhen Pirot | Method of detecting and assaying telomerase activity of telomerase bound by anti-telomerase antibodies |
US8906022B2 (en) | 2010-03-08 | 2014-12-09 | Conventus Orthopaedics, Inc. | Apparatus and methods for securing a bone implant |
CN102933704A (zh) | 2010-04-08 | 2013-02-13 | 爱丁堡大学管理处 | 软骨祖细胞、用于细胞衍生的方案和其用途 |
WO2012026309A1 (ja) * | 2010-08-23 | 2012-03-01 | 公立大学法人横浜市立大学 | 抗pad4抗体医薬の創成 |
CN102093980B (zh) * | 2010-12-10 | 2013-04-17 | 梁伟国 | 永生化人椎间盘髓核细胞体系的制备方法 |
US8420617B2 (en) * | 2011-03-11 | 2013-04-16 | Biocell Laboratories | Multiantivirus compound, composition and method for treatment of virus diseases |
CN102676518B (zh) * | 2012-02-27 | 2013-09-18 | 华侨大学 | 一种新型抗肿瘤amiRNA序列及其应用 |
EP2639299A1 (en) | 2012-03-16 | 2013-09-18 | Invectys | Universal cancer peptides derived from telomerase |
EP2875826B1 (en) * | 2012-05-11 | 2017-08-23 | KAEL-GemVax Co.,Ltd | Composition for preventing or treating sepsis |
US9527888B2 (en) * | 2012-05-11 | 2016-12-27 | Gemvax & Kael Co., Ltd. | Anti-inflammatory peptides and composition comprising the same |
BR112014032677A2 (pt) * | 2012-06-27 | 2019-01-15 | Univ Rutgers | ensaios rápido para ativação de célula t por medições de rna usando citometria de fluxo |
US20150125438A1 (en) * | 2012-07-20 | 2015-05-07 | Sang Jae Kim | Anti-Inflammatory Peptides and Composition Comprising the Same |
CN104768967B (zh) * | 2012-09-19 | 2019-02-15 | 珍白斯凯尔有限公司 | 细胞穿透性肽、包含该肽的缀合物、及包含该缀合物的组合物 |
KR102038487B1 (ko) | 2012-09-19 | 2019-10-30 | 주식회사 젬백스앤카엘 | 텔로머라제 펩티드를 포함하는 항균 또는 항진균용 조성물 |
US9902945B2 (en) * | 2012-09-19 | 2018-02-27 | Gemvax & Kael Co., Ltd. | Cell penetrating peptide, conjugate comprising same, and composition comprising conjugate |
KR102166542B1 (ko) | 2012-09-28 | 2020-10-16 | 주식회사 젬백스앤카엘 | 줄기세포 검출을 위한 텔로머라제 유래 펩티드 및 조영물질의 컨쥬게이트 및 이를 포함하는 조영제 |
KR102093093B1 (ko) | 2012-12-13 | 2020-03-25 | 주식회사 젬백스앤카엘 | 피부 노화 개선용 조성물 |
KR102106756B1 (ko) | 2012-12-13 | 2020-05-06 | 주식회사 젬백스앤카엘 | 자외선에 의한 피부 손상 예방 또는 치료용 조성물 |
PL2959005T3 (pl) | 2013-02-22 | 2022-01-31 | The Board Of Trustees Of The Leland Stanford Junior University | Zastosowanie medyczne dotyczące wydłużania telomerów |
EP2978445B1 (en) | 2013-03-28 | 2018-07-04 | Invectys | A cancer vaccine for cats |
DK2978444T3 (en) | 2013-03-28 | 2019-03-18 | Invectys | CANCERVACCINE FOR DOGS |
EP4461806A3 (en) | 2013-06-11 | 2025-02-12 | President and Fellows of Harvard College | Sc-b cells and compositions and methods for generating the same |
EP3063280B1 (en) | 2013-10-28 | 2019-08-14 | Invectys | Gene electrotransfer into skin cells |
NZ719098A (en) | 2013-10-28 | 2022-08-26 | Invectys | A telomerase encoding dna vaccine |
EP2871235A1 (en) * | 2013-11-07 | 2015-05-13 | Centre National de la Recherche Scientifique (CNRS) | New methods to produce active hTERT |
JP6539652B2 (ja) | 2013-12-12 | 2019-07-03 | コンベンタス オーソピディックス, インコーポレイテッド | 組織変位ツールおよび方法 |
KR102166549B1 (ko) | 2014-01-10 | 2020-10-16 | 주식회사 젬백스앤카엘 | 혈뇌장벽 투과성 펩티드 및 이를 포함하는 컨쥬게이트 |
DK3656869T4 (da) | 2014-08-26 | 2025-05-19 | Univ Leland Stanford Junior | Transplantation af stamceller med en kombination af et stof, som er rettet mod stamceller, og modulation af immunregulatorisk signalering |
WO2017079419A1 (en) | 2015-11-05 | 2017-05-11 | The Regents Of The University Of California | Cells labelled with lipid conjugates and methods of use thereof |
WO2017125844A1 (en) | 2016-01-19 | 2017-07-27 | Pfizer Inc. | Cancer vaccines |
BR112019015342A2 (pt) | 2017-01-30 | 2020-03-10 | The Board Of Trustees Of The Leland Stanford Junior University | Regime de condicionamento não genotóxico para o transplante de células-tronco |
US10631881B2 (en) | 2017-03-09 | 2020-04-28 | Flower Orthopedics Corporation | Plating depth gauge and countersink instrument |
WO2018206512A1 (en) | 2017-05-09 | 2018-11-15 | Invectys | Recombinant measles vaccine expressing htert |
WO2019010252A2 (en) | 2017-07-04 | 2019-01-10 | Conventus Orthopaedics, Inc. | APPARATUS AND METHODS FOR TREATING BONES |
WO2019070740A2 (en) | 2017-10-02 | 2019-04-11 | Fred Hutchinson Cancer Research Center | LUTENING HORMONE RECEPTOR BINDING AGENTS AND LUTINISING HORMONE AGONISTS FOR IDENTIFICATION, MULTIPLICATION, REMOVAL AND MODIFICATION OF PRIMITIVE STEM CELL POPULATIONS |
CN108715863B (zh) * | 2018-05-30 | 2020-09-11 | 吉林大学 | 一种肿瘤靶向性载体pcTERT及其构建方法及其应用 |
CN110827920B (zh) * | 2018-08-14 | 2022-11-22 | 武汉华大医学检验所有限公司 | 测序数据分析方法和设备及高通量测序方法 |
WO2020096687A1 (en) * | 2018-09-05 | 2020-05-14 | Readcoor, Inc. | Methods and systems for therapeutic agent analysis |
CN117568273A (zh) * | 2018-09-06 | 2024-02-20 | 德克萨斯大学系统董事会 | 端粒酶全酶复合体及其使用方法 |
WO2020076976A1 (en) | 2018-10-10 | 2020-04-16 | Readcoor, Inc. | Three-dimensional spatial molecular indexing |
CN109545039A (zh) * | 2019-01-15 | 2019-03-29 | 苏州大学 | 一种核孔复合体结构模型教具及其使用方法 |
EP3994245A1 (en) | 2019-07-05 | 2022-05-11 | Case Western Reserve University | Priming media and methods for stem cell culture and therapy |
JP2021151979A (ja) * | 2020-03-24 | 2021-09-30 | 均 石井 | 再生医療薬 |
US20220049303A1 (en) | 2020-08-17 | 2022-02-17 | Readcoor, Llc | Methods and systems for spatial mapping of genetic variants |
CN116870195A (zh) * | 2020-09-22 | 2023-10-13 | 浙江愈方生物科技有限公司 | 一种灭活性端粒酶、具有其的腺病毒和人造mRNA及应用 |
JP2022119144A (ja) * | 2021-02-03 | 2022-08-16 | 均 石井 | パーキンソン病治療薬 |
JP2022151412A (ja) * | 2021-03-23 | 2022-10-07 | 均 石井 | 脳卒中治療薬 |
CN113355303B (zh) * | 2021-06-07 | 2023-06-16 | 中元汇吉生物技术股份有限公司 | 一种m-mlv逆转录酶突变体及其应用 |
EP4463151A1 (en) * | 2022-01-19 | 2024-11-20 | Northwestern University | Agents that target telomerase reverse transcriptase (tert) for treating cancer and sensitizing cancer cells to genotoxic therapy |
CN114920802B (zh) * | 2022-05-16 | 2023-05-23 | 中国地质大学(武汉) | 调节端粒酶限速蛋白运动的多肽探针及其复合物和方法 |
CN116364195B (zh) * | 2023-05-10 | 2023-10-13 | 浙大城市学院 | 一种基于预训练模型的微生物遗传序列表型预测方法 |
Family Cites Families (151)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US912629A (en) | 1908-08-29 | 1909-02-16 | Conrad L Stueber | Foundation-top for pipe-carriers. |
NL154598B (nl) | 1970-11-10 | 1977-09-15 | Organon Nv | Werkwijze voor het aantonen en bepalen van laagmoleculire verbindingen en van eiwitten die deze verbindingen specifiek kunnen binden, alsmede testverpakking. |
US3817837A (en) | 1971-05-14 | 1974-06-18 | Syva Corp | Enzyme amplification assay |
US3939350A (en) | 1974-04-29 | 1976-02-17 | Board Of Trustees Of The Leland Stanford Junior University | Fluorescent immunoassay employing total reflection for activation |
US3996345A (en) | 1974-08-12 | 1976-12-07 | Syva Company | Fluorescence quenching with immunological pairs in immunoassays |
US4277437A (en) | 1978-04-05 | 1981-07-07 | Syva Company | Kit for carrying out chemically induced fluorescence immunoassay |
US4275149A (en) | 1978-11-24 | 1981-06-23 | Syva Company | Macromolecular environment control in specific receptor assays |
US4254082A (en) | 1978-06-12 | 1981-03-03 | Miles Laboratories, Inc. | Specific binding-adsorbent assay test means |
US4657760A (en) | 1979-03-20 | 1987-04-14 | Ortho Pharmaceutical Corporation | Methods and compositions using monoclonal antibody to human T cells |
US4458066A (en) | 1980-02-29 | 1984-07-03 | University Patents, Inc. | Process for preparing polynucleotides |
WO1982001461A1 (en) | 1980-07-18 | 1982-05-13 | Leland Stanford Junior Univ | Human hybridomas,precursors and products |
US4376110A (en) | 1980-08-04 | 1983-03-08 | Hybritech, Incorporated | Immunometric assays using monoclonal antibodies |
US4366241A (en) | 1980-08-07 | 1982-12-28 | Syva Company | Concentrating zone method in heterogeneous immunoassays |
US4554101A (en) * | 1981-01-09 | 1985-11-19 | New York Blood Center, Inc. | Identification and preparation of epitopes on antigens and allergens on the basis of hydrophilicity |
US4517288A (en) | 1981-01-23 | 1985-05-14 | American Hospital Supply Corp. | Solid phase system for ligand assay |
US5055556A (en) | 1981-10-06 | 1991-10-08 | The Board Of Trustees Of The Leland Stanford Jr. Univ. | Fluorescent conjugates for analysis of molecules and cells |
JPS58215453A (ja) | 1982-06-09 | 1983-12-14 | Toray Silicone Co Ltd | 室温硬化後塗装可能なオルガノポリシロキサン組成物 |
FR2542494B1 (fr) | 1983-03-08 | 1985-08-16 | Sevylor International | Combinaison protectrice, utilisable notamment en atmosphere irradiee |
NZ207394A (en) | 1983-03-08 | 1987-03-06 | Commw Serum Lab Commission | Detecting or determining sequence of amino acids |
US4816567A (en) | 1983-04-08 | 1989-03-28 | Genentech, Inc. | Recombinant immunoglobin preparations |
US5272065A (en) | 1983-10-20 | 1993-12-21 | Research Foundation Of State University Of New York | Regulation of gene expression by employing translational inhibition of MRNA utilizing interfering complementary MRNA |
US4897355A (en) | 1985-01-07 | 1990-01-30 | Syntex (U.S.A.) Inc. | N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US5049386A (en) | 1985-01-07 | 1991-09-17 | Syntex (U.S.A.) Inc. | N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4946787A (en) | 1985-01-07 | 1990-08-07 | Syntex (U.S.A.) Inc. | N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US5034506A (en) | 1985-03-15 | 1991-07-23 | Anti-Gene Development Group | Uncharged morpholino-based polymers having achiral intersubunit linkages |
US4965188A (en) | 1986-08-22 | 1990-10-23 | Cetus Corporation | Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
US5206344A (en) | 1985-06-26 | 1993-04-27 | Cetus Oncology Corporation | Interleukin-2 muteins and polymer conjugation thereof |
CA1291031C (en) | 1985-12-23 | 1991-10-22 | Nikolaas C.J. De Jaeger | Method for the detection of specific binding agents and their correspondingbindable substances |
GB8612087D0 (en) | 1986-05-19 | 1986-06-25 | Ici Plc | Hybridisation probes |
US5001225A (en) | 1986-12-08 | 1991-03-19 | Georgetown University | Monoclonal antibodies to a pan-malarial antigen |
US4889806A (en) | 1987-04-15 | 1989-12-26 | Washington University | Large DNA cloning system based on yeast artificial chromosomes |
US5017478A (en) | 1987-07-16 | 1991-05-21 | Berlex Laboratories, Inc. | Transfected cells containing plasmids having genes oriented in opposing directions and methods of using |
US5124246A (en) | 1987-10-15 | 1992-06-23 | Chiron Corporation | Nucleic acid multimers and amplified nucleic acid hybridization assays using same |
US5093245A (en) | 1988-01-26 | 1992-03-03 | Applied Biosystems | Labeling by simultaneous ligation and restriction |
US5530101A (en) | 1988-12-28 | 1996-06-25 | Protein Design Labs, Inc. | Humanized immunoglobulins |
US5075227A (en) * | 1989-03-07 | 1991-12-24 | Zymogenetics, Inc. | Directional cloning |
JPH02307059A (ja) | 1989-05-23 | 1990-12-20 | Seiko Instr Inc | 反応容器 |
US5143854A (en) | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
US5399493A (en) | 1989-06-15 | 1995-03-21 | The Regents Of The University Of Michigan | Methods and compositions for the optimization of human hematopoietic progenitor cell cultures |
US5437994A (en) | 1989-06-15 | 1995-08-01 | Regents Of The University Of Michigan | Method for the ex vivo replication of stem cells, for the optimization of hematopoietic progenitor cell cultures, and for increasing the metabolism, GM-CSF secretion and/or IL-6 secretion of human stromal cells |
US5464764A (en) | 1989-08-22 | 1995-11-07 | University Of Utah Research Foundation | Positive-negative selection methods and vectors |
US5545522A (en) | 1989-09-22 | 1996-08-13 | Van Gelder; Russell N. | Process for amplifying a target polynucleotide sequence using a single primer-promoter complex |
US5225212A (en) | 1989-10-20 | 1993-07-06 | Liposome Technology, Inc. | Microreservoir liposome composition and method |
ES2090299T3 (es) | 1989-12-01 | 1996-10-16 | Pharming Bv | Produccion de polipeptidos recombinantes mediante especies bovinas y metodos transgenicos. |
AU647741B2 (en) | 1989-12-01 | 1994-03-31 | Regents Of The University Of California, The | Methods and compositions for chromosome-specific staining |
DE69031172T2 (de) | 1989-12-22 | 1998-03-12 | Applied Research Systems Ars Holding N.V., Curacao | Modifikation der endogenen genexpression mit hilfe eines regulatorischen elements mittels homologe rekombination |
US5272071A (en) | 1989-12-22 | 1993-12-21 | Applied Research Systems Ars Holding N.V. | Method for the modification of the expression characteristics of an endogenous gene of a given cell line |
EP0466874A1 (fr) | 1990-02-09 | 1992-01-22 | Asulab S.A. | Micromoteur electrostatique a champ radial realise par microfabrication photolithographique et procede de realisation d'un tel micromoteur |
US5264618A (en) | 1990-04-19 | 1993-11-23 | Vical, Inc. | Cationic lipids for intracellular delivery of biologically active molecules |
US5427908A (en) | 1990-05-01 | 1995-06-27 | Affymax Technologies N.V. | Recombinant library screening methods |
AU7979491A (en) | 1990-05-03 | 1991-11-27 | Vical, Inc. | Intracellular delivery of biologically active substances by means of self-assembling lipid complexes |
SE468913B (sv) | 1990-05-16 | 1993-04-05 | Igesto Ab | Saekerhetskrok |
GB9015198D0 (en) | 1990-07-10 | 1990-08-29 | Brien Caroline J O | Binding substance |
ATE158021T1 (de) | 1990-08-29 | 1997-09-15 | Genpharm Int | Produktion und nützung nicht-menschliche transgentiere zur produktion heterologe antikörper |
US5545806A (en) | 1990-08-29 | 1996-08-13 | Genpharm International, Inc. | Ransgenic non-human animals for producing heterologous antibodies |
IL99552A0 (en) | 1990-09-28 | 1992-08-18 | Ixsys Inc | Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof |
KR100198659B1 (ko) | 1996-05-16 | 1999-06-15 | 구본준 | 메모리 셀, 메모리 장치 및 그의 제조 방법 |
AU660329B2 (en) | 1991-10-11 | 1995-06-22 | Promega Corporation | Coupled transcription and translation in eukaryotic cell-free extract |
US6270989B1 (en) | 1991-11-05 | 2001-08-07 | Transkaryotic Therapies, Inc. | Protein production and delivery |
PT101031B (pt) | 1991-11-05 | 2002-07-31 | Transkaryotic Therapies Inc | Processo para o fornecimento de proteinas por terapia genetica |
US5641670A (en) | 1991-11-05 | 1997-06-24 | Transkaryotic Therapies, Inc. | Protein production and protein delivery |
CA2135646A1 (en) | 1992-05-11 | 1993-11-25 | Kenneth G. Draper | Method and reagent for inhibiting viral replication |
US5629154A (en) | 1993-11-12 | 1997-05-13 | Geron Corporation | Telomerase activity assays |
US5639613A (en) | 1992-05-13 | 1997-06-17 | Board Of Regents, University Of Texas System | Methods for cancer diagnosis and prognosis |
US5648215A (en) | 1992-05-13 | 1997-07-15 | Board Of Regents, The University Of Texas System | Telomerase diagnostic methods |
US5645986A (en) | 1992-05-13 | 1997-07-08 | Board Of Reagents, The University Of Texas System | Therapy and diagnosis of conditions related to telomere length and/or telomerase activity |
US5489508A (en) | 1992-05-13 | 1996-02-06 | University Of Texas System Board Of Regents | Therapy and diagnosis of conditions related to telomere length and/or telomerase activity |
CA2140343A1 (en) | 1992-07-17 | 1994-02-03 | Sean M. Sullivan | Method and reagent for treatment of animal diseases |
US6107062A (en) | 1992-07-30 | 2000-08-22 | Inpax, Inc. | Antisense viruses and antisense-ribozyme viruses |
GB2273932A (en) | 1992-11-24 | 1994-07-06 | Stiefel Laboratories | Stable oligonucleotides |
WO1994012629A1 (en) | 1992-12-02 | 1994-06-09 | Baylor College Of Medicine | Episomal vectors for gene therapy |
JPH08503855A (ja) | 1992-12-03 | 1996-04-30 | ジェンザイム・コーポレイション | 嚢胞性線維症に対する遺伝子治療 |
TW402639B (en) | 1992-12-03 | 2000-08-21 | Transkaryotic Therapies Inc | Protein production and protein delivery |
JPH08508636A (ja) | 1993-01-27 | 1996-09-17 | オンコール インコーポレーテッド | 核酸配列の増幅 |
US6140087A (en) | 1993-06-24 | 2000-10-31 | Advec, Inc. | Adenovirus vectors for gene therapy |
US5919676A (en) | 1993-06-24 | 1999-07-06 | Advec, Inc. | Adenoviral vector system comprising Cre-loxP recombination |
US6120764A (en) | 1993-06-24 | 2000-09-19 | Advec, Inc. | Adenoviruses for control of gene expression |
WO1995013382A1 (en) * | 1993-11-12 | 1995-05-18 | Geron Corporation | Therapy and diagnosis of conditions related to telomere length and/or telomerase activity |
US5578832A (en) | 1994-09-02 | 1996-11-26 | Affymetrix, Inc. | Method and apparatus for imaging a sample on a device |
CZ3497A3 (en) * | 1994-07-07 | 1997-10-15 | Geron Corp | Rna component of mammal telomerase, oligonucleotide, recombinant expression plasmid containing the oligonucleotide, process for preparing eukaryotic host cell, process for preparing a recombinant telomerase enzyme |
US5583016A (en) | 1994-07-07 | 1996-12-10 | Geron Corporation | Mammalian telomerase |
US5597697A (en) | 1994-09-30 | 1997-01-28 | Diamond; Paul | Screening assay for inhibitors and activators of RNA and DNA-dependent nucleic acid polymerases |
US5698686A (en) * | 1994-10-20 | 1997-12-16 | Arch Development Corporation | Yeast telomerase compositions |
US5556752A (en) | 1994-10-24 | 1996-09-17 | Affymetrix, Inc. | Surface-bound, unimolecular, double-stranded DNA |
EP0799315A2 (en) | 1994-12-19 | 1997-10-08 | Cold Spring Harbor Laboratory | Telomerase protein component |
US5741677A (en) | 1995-06-07 | 1998-04-21 | Geron Corporation | Methods for measuring telomere length |
JPH11507839A (ja) | 1995-06-07 | 1999-07-13 | ジェロン コーポレイション | テロメラーゼ活性検定 |
US5722998A (en) | 1995-06-07 | 1998-03-03 | Intermedics, Inc. | Apparatus and method for the control of an implantable medical device |
AU701903B2 (en) | 1995-06-07 | 1999-02-11 | Cold Spring Harbor Laboratory | Essential oligonucleotides of vertebrate telomerase |
US5968506A (en) | 1995-08-04 | 1999-10-19 | Geron Corporation | Purified telomerase |
US6545133B1 (en) | 1995-08-04 | 2003-04-08 | Geron Corporation | Methods for purifying telomerase |
EP0784542B1 (en) | 1995-08-04 | 2001-11-28 | International Business Machines Corporation | Stamp for a lithographic process |
US6517834B1 (en) | 1995-08-04 | 2003-02-11 | Geron Corporation | Purified telomerase |
JPH09154575A (ja) | 1995-10-04 | 1997-06-17 | Soosei:Kk | テロメラーゼ |
JPH09164575A (ja) | 1995-12-13 | 1997-06-24 | Japan Steel Works Ltd:The | 流れ模様を有する樹脂板の製造方法およびその装置 |
US6015710A (en) | 1996-04-09 | 2000-01-18 | The University Of Texas System | Modulation of mammalian telomerase by peptide nucleic acids |
US5853719A (en) | 1996-04-30 | 1998-12-29 | Duke University | Methods for treating cancers and pathogen infections using antigen-presenting cells loaded with RNA |
US5747317A (en) | 1996-07-08 | 1998-05-05 | Tularik Inc. | Human telomerase RNA interacting protein gene |
US5770422A (en) * | 1996-07-08 | 1998-06-23 | The Regents Of The University Of California | Human telomerase |
US5724021A (en) | 1996-07-09 | 1998-03-03 | Stephen C. Perrone | Self-contained, programmable, time interval alarm reminder device for eyedrop medication administration and a means for affixing such to eyedrop/medication container |
AUPO181296A0 (en) | 1996-08-21 | 1996-09-12 | Commonwealth Scientific And Industrial Research Organisation | Manipulation of proanthocyanidin biosynthesis |
WO1998007838A1 (fr) | 1996-08-21 | 1998-02-26 | Mitsubishi Chemical Corporation | Proteine de telomerase d'animaux superieurs et gene codant pour elle |
AU4030697A (en) | 1996-08-28 | 1998-03-19 | Shonen Yoshida | Proteins having telomerase activity |
DE19638482A1 (de) | 1996-09-20 | 1998-04-02 | Bosch Gmbh Robert | Verfahren zur Auswahl einer Sendefrequenz |
US6808880B2 (en) | 1996-10-01 | 2004-10-26 | Geron Corporation | Method for detecting polynucleotides encoding telomerase |
US7585622B1 (en) | 1996-10-01 | 2009-09-08 | Geron Corporation | Increasing the proliferative capacity of cells using telomerase reverse transcriptase |
US6610839B1 (en) | 1997-08-14 | 2003-08-26 | Geron Corporation | Promoter for telomerase reverse transcriptase |
US6444650B1 (en) | 1996-10-01 | 2002-09-03 | Geron Corporation | Antisense compositions for detecting and inhibiting telomerase reverse transcriptase |
US6767719B1 (en) | 1997-11-26 | 2004-07-27 | Geron Corporation | Mouse telomerase reverse transcriptase |
US6261836B1 (en) * | 1996-10-01 | 2001-07-17 | Geron Corporation | Telomerase |
US6475789B1 (en) | 1996-10-01 | 2002-11-05 | University Technology Corporation | Human telomerase catalytic subunit: diagnostic and therapeutic methods |
CN1291231B (zh) | 1996-10-01 | 2010-06-02 | 杰龙公司 | 人类的端粒酶催化亚单位 |
US6777203B1 (en) | 1997-11-19 | 2004-08-17 | Geron Corporation | Telomerase promoter driving expression of therapeutic gene sequences |
US6093809A (en) | 1996-10-01 | 2000-07-25 | University Technology Corporation | Telomerase |
US5890326A (en) | 1996-11-06 | 1999-04-06 | Hill-Rom, Inc. | Head wall for a hospital room |
US7390891B1 (en) | 1996-11-15 | 2008-06-24 | Amgen Inc. | Polynucleotides encoding a telomerase component TP2 |
US5919656A (en) | 1996-11-15 | 1999-07-06 | Amgen Canada Inc. | Genes encoding telomerase protein 1 |
WO1998023759A2 (en) | 1996-11-26 | 1998-06-04 | Baylor College Of Medicine | Identification of inhibitors that prevent access of telomerase to chromosomal terminus |
WO1998037181A2 (en) * | 1997-02-20 | 1998-08-27 | Whitehead Institute For Biomedical Research | Telomerase catalytic subunit gene and encoded protein |
US6617119B2 (en) | 1997-02-21 | 2003-09-09 | The Regents Of The University Of California | Assay for specific strains of multiple disease related conformations of a protein |
CA2285672C (en) * | 1997-04-04 | 2012-01-31 | Geron Corporation | Purified telomerase |
US6485789B1 (en) | 1997-04-14 | 2002-11-26 | 3M Innovative Properties Company | Fluorochemical composition containing a condensation product of a fluorochemical polyether and a poly-isocyanate to impart stain release properties to a substrate |
US7413864B2 (en) | 1997-04-18 | 2008-08-19 | Geron Corporation | Treating cancer using a telomerase vaccine |
US20050013825A1 (en) | 1997-04-18 | 2005-01-20 | Geron Corporation | Vaccine containing the catalytic subunit of telomerase for treating cancer |
US7622549B2 (en) * | 1997-04-18 | 2009-11-24 | Geron Corporation | Human telomerase reverse transcriptase polypeptides |
US6201830B1 (en) | 1997-06-11 | 2001-03-13 | Texas Instruments Incorporated | Low computation idle transmission method for DSL modems |
JP2002508662A (ja) * | 1997-06-20 | 2002-03-19 | バイエル・アクチエンゲゼルシヤフト | ヒトテロメラーゼの触媒サブユニット並びにその診断的及び治療的使用 |
JP2002514928A (ja) | 1997-07-01 | 2002-05-21 | キャンビア バイオシステムス リミティド ライアビリティー カンパニー | 脊椎動物テロメラーゼ遺伝子およびタンパク質ならびにその使用 |
US7378244B2 (en) | 1997-10-01 | 2008-05-27 | Geron Corporation | Telomerase promoters sequences for screening telomerase modulators |
AU1606999A (en) | 1997-11-26 | 1999-06-15 | Albert Einstein College Of Medicine Of Yeshiva University | Mouse telomerase reverse transcriptase |
DE19757984A1 (de) | 1997-12-24 | 1999-07-01 | Bayer Ag | Regulatorische DNA-Sequenzen aus der 5'-Region vom Gen der humanen katalytischen Telomerase-Untereinheit udn deren diagnostische und therapeutische Verwendung |
US6608188B1 (en) | 1998-01-08 | 2003-08-19 | Chugai Seiyaku Kabushiki Kaisha | CRT-1 gene having reverse transcriptase motif |
GB9801902D0 (en) | 1998-01-29 | 1998-03-25 | Cancer Res Campaign Tech | A gene promoter |
EP1068296B1 (en) | 1998-03-31 | 2011-08-10 | Geron Corporation | Compositions for eliciting an immune response to a telomerase antigen |
US7402307B2 (en) | 1998-03-31 | 2008-07-22 | Geron Corporation | Method for identifying and killing cancer cells |
US6337200B1 (en) | 1998-03-31 | 2002-01-08 | Geron Corporation | Human telomerase catalytic subunit variants |
US6069471A (en) | 1998-05-14 | 2000-05-30 | Intel Corporation | Dynamic set point switching regulator |
EP1085892A4 (en) | 1998-06-12 | 2002-07-17 | Sloan Kettering Inst Cancer | VACCINATION STRATEGY FOR PREVENTING AND TREATING CANCERS |
US7030211B1 (en) * | 1998-07-08 | 2006-04-18 | Gemvax As | Antigenic peptides derived from telomerase |
EP1147181B1 (en) | 1999-02-04 | 2004-05-12 | Geron Corporation | Replicative virus driven by the promoter for telomerase reverse transcriptase for use in treating cancer |
WO2000061766A2 (en) | 1999-04-09 | 2000-10-19 | Biomira, Inc. | Telomerase-specific cancer vaccine |
WO2000073420A2 (en) | 1999-06-02 | 2000-12-07 | Whitehead Institute For Biomedical Research | Creation of human tumorigenic cells and uses therefor |
US6354941B2 (en) | 1999-11-03 | 2002-03-12 | 516 Holdings | Electronic system for a game of chance |
JP2004527449A (ja) | 2000-02-15 | 2004-09-09 | リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | テロメラーゼ逆転写酵素を用いる癌を治療するための万能ワクチンと方法 |
WO2002091999A2 (en) | 2001-05-09 | 2002-11-21 | Geron Corporation | Treatment for wounds |
JP2002348474A (ja) | 2001-05-23 | 2002-12-04 | Dow Corning Toray Silicone Co Ltd | ポリオルガノシロキサンマイクロエマルジョン組成物および化粧料原料 |
WO2003038047A2 (en) | 2001-10-29 | 2003-05-08 | Baylor College Of Medicine | Human telomerase reverse transcriptase as a class-ii restricted tumor-associated antigen |
US7294708B2 (en) * | 2002-05-31 | 2007-11-13 | Beijing Institute Of Biotechnology | Telomerase reverse transcriptase fragments and uses thereof |
KR100705868B1 (ko) | 2003-05-06 | 2007-04-10 | 후지 덴키 디바이스 테크놀로지 가부시키가이샤 | 반도체 장치 및 그 제조 방법 |
-
1997
- 1997-10-01 CN CN971802564A patent/CN1291231B/zh not_active Expired - Lifetime
- 1997-10-01 IL IL12910397A patent/IL129103A0/xx not_active IP Right Cessation
- 1997-10-01 EP EP97910785A patent/EP0954585B1/en not_active Expired - Lifetime
- 1997-10-01 FI FI990655A patent/FI990655A7/fi unknown
- 1997-10-01 KR KR1019997002838A patent/KR100530483B1/ko not_active Expired - Lifetime
- 1997-10-01 FR FR9712217A patent/FR2757177A1/fr active Pending
- 1997-10-01 EP EP97910737A patent/EP0932686A2/en not_active Withdrawn
- 1997-10-01 AU AU48036/97A patent/AU4803697A/en not_active Abandoned
- 1997-10-01 IL IL12922297A patent/IL129222A0/xx unknown
- 1997-10-01 GB GB9804859A patent/GB2321642B8/en not_active Expired - Lifetime
- 1997-10-01 CA CA2267664A patent/CA2267664C/en not_active Expired - Lifetime
- 1997-10-01 DE DE69723531T patent/DE69723531T3/de not_active Expired - Lifetime
- 1997-10-01 DE DE19743497A patent/DE19743497A1/de not_active Withdrawn
- 1997-10-01 EP EP06117664A patent/EP1783139B8/en not_active Expired - Lifetime
- 1997-10-01 GB GB9720890.4A patent/GB2317891C/en not_active Expired - Lifetime
- 1997-10-01 WO PCT/US1997/017618 patent/WO1998014592A2/en not_active Application Discontinuation
- 1997-10-01 EP EP20090176870 patent/EP2213740A1/en not_active Withdrawn
- 1997-10-01 SG SG200101834A patent/SG94355A1/en unknown
- 1997-10-01 WO PCT/US1997/017885 patent/WO1998014593A2/en not_active Application Discontinuation
- 1997-10-01 EA EA199900349A patent/EA199900349A1/ru unknown
- 1997-10-01 EA EA199900355A patent/EA199900355A1/ru unknown
- 1997-10-01 AU AU48073/97A patent/AU734089B2/en not_active Expired
- 1997-10-01 EP EP97307757A patent/EP0841396B2/en not_active Expired - Lifetime
- 1997-10-01 DE DE69739497T patent/DE69739497D1/de not_active Expired - Lifetime
- 1997-10-01 AT AT97307757T patent/ATE245194T1/de active
- 1997-10-01 CA CA002266752A patent/CA2266752A1/en not_active Abandoned
- 1997-10-01 AT AT97910785T patent/ATE449851T1/de not_active IP Right Cessation
- 1997-10-01 DE DE0841396T patent/DE841396T1/de active Pending
- 1997-10-01 DE DE69739675T patent/DE69739675D1/de not_active Expired - Lifetime
- 1997-10-01 BR BR9711844-3A patent/BR9711844A/pt unknown
- 1997-10-01 EP EP03075454A patent/EP1333094B1/en not_active Expired - Lifetime
- 1997-10-01 JP JP28618297A patent/JP3869092B2/ja not_active Expired - Lifetime
- 1997-10-01 JP JP51690998A patent/JP2001510985A/ja active Pending
- 1997-10-01 ES ES97307757T patent/ES2205132T5/es not_active Expired - Lifetime
- 1997-10-01 BR BR9712254-8A patent/BR9712254A/pt not_active IP Right Cessation
- 1997-10-01 CN CN97199534A patent/CN1254376A/zh active Pending
- 1997-10-01 JP JP51680298A patent/JP2001523947A/ja active Pending
- 1997-10-01 CN CN201010150493.9A patent/CN102021153B/zh not_active Expired - Lifetime
- 1997-10-01 BR BRPI9712254A patent/BRPI9712254B1/pt unknown
- 1997-10-01 NZ NZ334709A patent/NZ334709A/en not_active IP Right Cessation
- 1997-10-01 KR KR1019990702815A patent/KR20000048820A/ko not_active Withdrawn
- 1997-10-01 AT AT03075454T patent/ATE552341T1/de active
- 1997-10-01 CA CA2645721A patent/CA2645721C/en not_active Expired - Lifetime
- 1997-11-19 US US08/974,549 patent/US6166178A/en not_active Expired - Lifetime
-
1998
- 1998-10-15 JP JP32016998A patent/JP4070331B2/ja not_active Expired - Lifetime
-
1999
- 1999-02-19 JP JP11042410A patent/JPH11313689A/ja active Pending
- 1999-03-31 NO NO19991588A patent/NO319982B1/no not_active IP Right Cessation
-
2000
- 2000-07-27 JP JP2000227474A patent/JP2001081042A/ja not_active Withdrawn
- 2000-11-22 US US09/721,456 patent/US6617110B1/en not_active Expired - Lifetime
- 2000-11-22 US US09/721,477 patent/US7517971B1/en not_active Expired - Fee Related
-
2005
- 2005-06-24 NO NO20053120A patent/NO332085B1/no unknown
-
2007
- 2007-08-20 US US11/894,600 patent/US8222392B2/en not_active Expired - Fee Related
-
2008
- 2008-07-28 JP JP2008194208A patent/JP4852576B2/ja not_active Expired - Lifetime
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4852576B2 (ja) | ヒトテロメラーゼ触媒性サブユニット | |
US7879609B2 (en) | Regulatory segments of the human gene for telomerase reverse transcriptase | |
US8236774B2 (en) | Human telomerase catalytic subunit | |
US6475789B1 (en) | Human telomerase catalytic subunit: diagnostic and therapeutic methods | |
US8709995B2 (en) | Method for eliciting an immune response to human telomerase reverse transcriptase | |
US7413864B2 (en) | Treating cancer using a telomerase vaccine | |
US20050013825A1 (en) | Vaccine containing the catalytic subunit of telomerase for treating cancer | |
HK1024505A1 (en) | Human telomerase reverse transcriptase promoter | |
HK1024505B (en) | Human telomerase reverse transcriptase promoter | |
AU4799201A (en) | Promoter for human telomerase reverse transcriptase |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090402 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090619 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090624 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20100224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100521 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110325 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110725 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20110817 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110926 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111024 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141028 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141028 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141028 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |