[go: up one dir, main page]

PT1607402E - Método para o diagnóstico de tumores - Google Patents

Método para o diagnóstico de tumores Download PDF

Info

Publication number
PT1607402E
PT1607402E PT05018356T PT05018356T PT1607402E PT 1607402 E PT1607402 E PT 1607402E PT 05018356 T PT05018356 T PT 05018356T PT 05018356 T PT05018356 T PT 05018356T PT 1607402 E PT1607402 E PT 1607402E
Authority
PT
Portugal
Prior art keywords
quot
amino acid
antibody
acid sequence
seq
Prior art date
Application number
PT05018356T
Other languages
English (en)
Inventor
Avi J Ashkenazi
Robert M Pitti
Audrey Goddard
Kenneth J Hillan
James Pan
Colin K Watanabe
William I Wood
Victoria Smith
Paul J Godowski
Austin L Gurney
Scot A Masters
Margaret Ann Roy
Donna M Stone
Original Assignee
Genentech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/US1999/005028 external-priority patent/WO1999046281A2/en
Priority claimed from PCT/US1999/012252 external-priority patent/WO1999063088A2/en
Priority claimed from PCT/US1999/020111 external-priority patent/WO2000012708A2/en
Priority claimed from PCT/US1999/021090 external-priority patent/WO2000015796A2/en
Priority claimed from PCT/US1999/028313 external-priority patent/WO2000032221A2/en
Priority claimed from PCT/US1999/028301 external-priority patent/WO2000032776A2/en
Priority claimed from PCT/US1999/028634 external-priority patent/WO2000036102A2/en
Priority claimed from PCT/US2000/000219 external-priority patent/WO2000053753A2/en
Application filed by Genentech Inc filed Critical Genentech Inc
Publication of PT1607402E publication Critical patent/PT1607402E/pt

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/395Antibodies; Immunoglobulins; Immune serum, e.g. antilymphocytic serum
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K45/00Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K45/00Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
    • A61K45/06Mixtures of active ingredients without chemical characterisation, e.g. antiphlogistics and cardiaca
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • A61P35/02Antineoplastic agents specific for leukemia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/72Receptors; Cell surface antigens; Cell surface determinants for hormones
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/82Translation products from oncogenes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/30Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants from tumour cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/32Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against translation products of oncogenes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/02Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • G01N33/57496Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites involving intracellular compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Cell Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Analytical Chemistry (AREA)
  • Oncology (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Hospice & Palliative Care (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)

Description

ΕΡ 1 607 402 /PT
DESCRIÇÃO "Método para o diagnóstico de tumores"
Campo do invento O presente invento refere-se a composições e métodos para o diagnóstico e tratamento de tumor.
Antecedentes do invento
Os tumores malignos (cancros) são a segunda principal causa de morte nos Estados Unidos logo após as doenças cardíacas (Boring et al., CA Cancel J. Clin., 43:7 [1993]). O cancro caracteriza-se por um aumento do número de células anómalas ou neoplásicas derivadas de um tecido normal que proliferam para formar uma massa de tumor, pela invasão de tecidos adjacentes por essas células neoplásicas de tumor e pela geração de células malignas que eventualmente se espalharão através do sistema sanguíneo ou linfático para nódulos linfáticos locais e para localizações distantes (metástase). Num estado canceroso uma célula prolifera em condições sob as quais células normais não cresceriam. O cancro manifesta-se numa grande variedade de formas caracterizadas por diferentes graus de invasão e agressividade. A alteração da expressão génica está intimamente relacionada com o crescimento celular descontrolado e des-diferenciação que são características comuns a todos os cancros. Verificou-se que os genomas de determinados tumores bem estudados apresentam expressão diminuída de genes recessivos, habitualmente referidos como genes de supressão de tumor, que funcionariam normalmente para evitar crescimento celular maligno e/ou sobre-expressão de determinados genes dominantes tal como oncogenes, que actuam na promoção de crescimento maligno. Cada uma destas alterações genéticas parece ser responsável pela importação de algumas das características que, conjuntamente, representam o fenótipo neoplásico completo (Hunter, Cell, 6_4:1129 [1991] e Bishop, Cell, 64:235-248 [1991]); 2
ΕΡ 1 607 402 /PT A amplificação génica constitui um mecanismo bem conhecido de sobre-expressão de genes (por exemplo, oncogene) em células de cancro. Esta consiste num processo em que se produzem cópias múltiplas de um gene especifico no cromossoma da célula ancestral. O processo envolve replicação não prevista da região do cromossoma incluindo o gene, seguida de recombinação dos segmentos replicados de volta para o cromossoma (Alitalo et al., Adv. Câncer Res., _47:235-281 [1986]). Pensa-se que a sobre-expressão do gene equivale a amplificação génica, ou seja, é proporcional ao número de cópias efectuadas.
Os proto-oncogenes que codificam factores de crescimento e receptores de factores de crescimento foram identificados como desempenhando papéis importantes na patogénese de várias malignidades humanas, incluindo cancro de mama. Por exemplo, revelou-se que o gene humano ErbB2 (erbB2, também conhecido como her2 ou c-erbB-2), que codifica um receptor de glicoproteina transmembranar de 185 kd (pl85HER2; HER2) relacionado com o receptor do factor de crescimento epidérmico EGFR), se encontra sobre-expresso em cerca de 25% a 30% em cancro de mama humano (Slamon et al., Science, 235:177-182 [1987]; Slamon et al., Science, 244:707-712 [1989]).
Relatou-se que a amplificação génica de um proto-oncogene é um evento tipicamente envolvido nas formas mais malignas de cancro e poderia funcionar como um elemento de previsão do desfecho clínico (Schwab et al., Genes Chromosomes Câncer, _1:181-193 [1990]; Alitalo et al., supra). Assim, a sobre-expressão de erbB2 é habitualmente encarada como um elemento de previsão de um prognóstico fraco, especialmente em doentes com doença primária que envolve nódulos linfáticos auxiliares (Slamon et al., [1987] e [1989], supra; Ravdin e Chamness, Gene, 159:19-27 [1995]; e Hynes e Stern, Biochim. Biophys. Acta, 1198:165-184 [1994]) e tem sido relacionado com a sensibilidade e/ou resistência a terapia hormonal e regimes quimioterapêuticos incluindo CMF (ciclofosfamida, metotrexato, e fluorouracilo) e antraciclinas (Baselga et al., Oncology, 11 (3 Supl):43-48 (1997]). Contudo, apesar da associação entre sobre-expressão de erbB2 e prognóstico fraco, a probabilidade de doentes positivos para HER2 responderem clinicamente a tratamento com taxanos foi mais de três vezes superior à de doentes negativos para HER2 (Ibid). Um anticorpo monoclonal 3
ΕΡ 1 607 402 /PT recombinante humanizado anti-ErbB2 (anti-HER2) (uma versão humanizada do anticorpo 4D5 anti-ErbB2 murino, denominado rhuMAb HER2 ou Herceptin™) foi clinicamente activo em doentes com cancros de mama metastáticos que sobre-expressam ErbB2 e que tinham recebido terapia anticancerosa extensiva anterior. (Baselga et ai., J. Clin. Oncol., R4:737-744 [1996]).
Tendo tal em consideração, existe interesse óbvio em identificar novos métodos e composições que sejam úteis para diagnóstico e tratamento de tumores que estão associados com amplificação génica.
Sumário do invento A. Concretizações O presente invento refere-se a composições e métodos para o diagnóstico de crescimento e proliferação de células neoplásicas em mamíferos, incluindo humanos. O presente invento baseia-se na identificação de genes que são amplificados no genoma de células tumorais. Espera-se que tal amplificação génica esteja associada com a sobre-expressão do produto génico e contribua para a tumorigénese. Assim, pensa-se que as proteínas codificadas pelos genes amplificados sejam alvos úteis para o diagnóstico e/ou tratamento (incluindo prevenção) de determinados cancros e possam actuar como elementos de previsão do prognóstico de tratamento de tumor.
Numa concretização, o presente invento refere-se a um anticorpo isolado que se liga a um polipéptido aqui designado como um polipéptido PR05775. Num aspecto, o anticorpo isolado liga-se especificamente a um PR05775. Muitas vezes a célula que expressa o polipéptido PR05775 é uma célula tumoral que sobre-expressa o polipéptido relativamente a uma célula normal do mesmo tipo de tecido. Ainda noutro aspecto, o anticorpo é um anticorpo monoclonal, que apresenta de preferência resíduos de região determinante de complementaridade (CDR) não humana e resíduos de região de esqueleto (FR) humana. O anticorpo pode ser marcado e pode ser imobilizado num suporte sólido. Ainda noutro aspecto, o anticorpo é um fragmento de anticorpo, um anticorpo de cadeia simples ou um anticorpo humanizado que se 4 ΕΡ 1 607 402 /PT liga, de preferência especificamente, a um polipéptido PR05775.
Noutra concretização, o invento refere-se a uma composição de matéria que inclui um anticorpo que se liga, de preferência especificamente, a um polipéptido PR05775 misturado com um transportador farmaceuticamente aceitável. Num aspecto, a composição de matéria inclui uma quantidade terapeuticamente eficaz do anticorpo. Noutro aspecto, a composição inclui um ingrediente activo adicional que pode, por exemplo, ser um anticorpo ou um agente citotóxico ou quimioterapêutico adicional. De preferência, a composição é estéril. O invento pode utilizar moléculas de ácido nucleico isoladas que codificam anticorpos anti-PR05775 e vectores e células hospedeiras recombinantes incluindo tais moléculas de ácido nucleico.
Descrevem-se aqui métodos para produzir um anticorpo anti-PR05775, em que o método inclui cultivar uma célula hospedeira transformada com uma molécula de ácido nucleico que codifica o anticorpo em condições suficientes para permitir expressão do anticorpo e recuperação do anticorpo da cultura de células.
Noutra concretização, o invento refere-se a um método para determinar a presença de um polipéptido PR05775 numa amostra que se suspeita conter um polipéptido PR05775, em que o método inclui expor a amostra a um anticorpo anti-PR05775 e determinar a ligação do anticorpo a um polipéptido PR05775 na amostra. Noutra concretização, o invento refere-se a um método para determinar a presença de um polipéptido numa célula, em que o método inclui expor a célula a um anticorpo anti-PR05775 e determinar ligação do anticorpo à célula.
Ainda noutra concretização, o presente invento refere-se a um método de diagnóstico de tumor num mamífero, incluindo detectar o nível de expressão de um gene que codifica um polipéptido (a) numa amostra de teste de células de tecido obtida de um mamífero e (b) numa amostra de controlo de células de tecido normal conhecido do mesmo tipo de células, em que um nível de expressão mais elevado na amostra de teste comparativamente com a amostra de controlo é indicativo da 5
ΕΡ 1 607 402 /PT presença de tumor no mamífero do qual se obtiveram as células do tecido de teste.
Noutra concretização, o presente invento refere-se a um método de diagnóstico de tumor num mamífero, incluindo (a) por em contacto um anticorpo anti-PR05775 com uma amostra de teste de células de tecido obtidas do mamífero e (b) detectar a formação de um complexo entre o anticorpo anti-PR05775 e um polipéptido PR05775 na amostra de teste, em que a formação de um complexo é indicativa da presença de um tumor no referido mamífero. A detecção pode ser qualitativa ou quantitativa e pode ser efectuada em comparação com a monitorização de formação de complexo numa amostra de controlo de células de tecido normal conhecido do mesmo tipo de células. Uma maior quantidade de complexos formados na amostra de teste indica a presença de tumor no mamífero do qual se obtiveram as células de tecido de teste. O anticorpo transporta de preferência um marcador detectável. A formação de complexo pode ser monitorizada, por exemplo, por microscopia óptica, citometria de fluxo, fluorimetria ou outras técnicas conhecidas na especialidade. A amostra de teste é habitualmente obtida de um indivíduo que se suspeita ter crescimento ou proliferação de células neoplásicas (por exemplo, células cancerosas).
Noutra concretização, o presente invento refere-se a um kit de diagnóstico de cancro incluindo um anticorpo anti-PR05775 e um transportador (por exemplo, um tampão) numa embalagem adequada. O kit contém de preferência instruções para utilizar o anticorpo para detectar a presença de um polipéptido PR05775 numa amostra que se suspeita conter o mesmo. B. Concretizações adicionais
Noutras concretizações do presente invento, o invento pode utilizar uma molécula de ácido nucleico isolada incluindo uma sequência de nucleótidos que codifica um polipéptido PR05775.
Num aspecto, a molécula de ácido nucleico isolada compreende uma sequência nucleotídica possuindo pelo menos 6
ΕΡ 1 607 402 /PT cerca de 80% de identidade de sequência, preferivelmente pelo menos cerca de 81% de identidade de sequência, mais preferivelmente pelo menos cerca de 82% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 83% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 84% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 85% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 86% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 87% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 88% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 89% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 90% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 91 % de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 92% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 93% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 94% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 95% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 96% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 97% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 98% de identidade de sequência e ainda mais preferivelmente pelo menos cerca de 99% de identidade de sequência com (a) uma molécula de adn que codifica um polipéptido PR05775 possuindo uma sequência de aminoácidos de comprimento completo como aqui se descreve, uma sequência de aminoácidos a que falta o péptido de sinal como aqui se descreve, um domínio extracelular de uma proteína transmembranar, com ou sem o péptido de sinal, como aqui se descreve ou qualquer outro fragmento especificamente definido da sequência de aminoácidos de comprimento completo como aqui se descreve, ou (b) o complemento da molécula de ADN de (a).
Noutros aspectos, a molécula de ácido nucleico isolada compreende uma sequência nucleotídica possuindo pelo menos cerca de 80% de identidade de sequência, preferivelmente pelo menos cerca de 81% de identidade de sequência, mais preferivelmente pelo menos cerca de 82% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 83% 7
ΕΡ 1 607 402 /PT de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 84% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 85% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 86% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 87% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 88% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 89% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 90% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 91 % de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 92% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 93% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 94% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 95% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 96% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 97% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 98% de identidade de sequência e ainda mais preferivelmente pelo menos cerca de 99% de identidade de sequência to (a) uma molécula de ADN compreendendo a sequência de codificação de um ADNc do polipéptido PR05775 de comprimento completo como aqui se descreve, a sequência de codificação de um polipéptido PR05775 a que falta o péptido de sinal como aqui se descreve, a sequência de codificação de um domínio extracelular de um polipéptido PR05775 transmembranar, com ou sem o péptido de sinal, como aqui se descreve ou a sequência de codificação de qualquer outro fragmento especificamente definido da sequência de aminoácidos de comprimento completo como aqui se descreve, ou (b) o complemento da molécula de ADN de (a).
Num outro aspecto, a invenção pode utilizar uma molécula de ácido nucleico isolada compreendendo a sequência nucleotídica possuindo pelo menos cerca de 80% de identidade de sequência, preferivelmente pelo menos cerca de 81% de identidade de sequência, mais preferivelmente pelo menos cerca de 82% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 83% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 84% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 85% 8
ΕΡ 1 607 402 /PT de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 86% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 87% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 88% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 89% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 90% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 91% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 92% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 93% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 94% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 95% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 96% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 97% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 98% de identidade de sequência e ainda mais preferivelmente pelo menos cerca de 99% de identidade de sequência to (a) uma molécula de ADN que codifica o mesmo polipéptido maduro que é codificado pelo ADNc da proteína humana depositado na ATCC como aqui se descreve, ou (b) o complemento da molécula de ADN de (a). O invento pode utilizar uma molécula de ácido nucleico isolada incluindo uma sequência de nucleótidos que codifica um polipéptido PR05775 que apresenta quer o domínio transmembranar eliminado quer o domínio transmembranar inactivado, ou é complementar a tal sequência de nucleótidos de codificação, em que o(s) domínio(s) transmembranar(es) de tal polipéptido são aqui revelados. Assim, encontram-se abrangidos domínios solúveis extracelulares dos polipéptidos PR05775 aqui descritos.
Fragmentos da sequência de codificação de um polipéptido PR05775, ou do seu complemento, podem ser úteis como, por exemplo, sondas de hibridação, para fragmentos de codificação de um polipéptido PR05775 que podem codificar opcionalmente um polipéptido compreendendo um local de ligação para um anticorpo anti-PR05775 ou como sondas oligonucleotídicas anti-sentido. Estes fragmentos de ácido nucleico têm usualmente pelo menos cerca de 20 nucleótidos de comprimento, 9 ΕΡ 1 607 402 /PT preferivelmente pelo menos cerca de 30 nucleótidos de comprimento, mais preferivelmente pelo menos cerca de 40 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 50 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 60 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 70 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 80 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 90 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 100 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 110 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 120 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 130 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 140 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 150 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 160 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 170 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 180 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 190 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 200 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 250 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 300 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 350 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 400 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 450 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 500 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 600 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 700 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 800 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 900 nucleótidos de comprimento e ainda mais preferivelmente pelo menos cerca de 1000 nucleótidos de comprimento, em que, neste contexto, o termo "cerca de" significa o comprimento da sequência nucleotidica referenciada mais ou menos 10% desse comprimento referenciado. Note-se que podem ser determinados novos 10 ΕΡ 1 607 402 /PT fragmentos de uma sequência nucleotídica que codifica o polipéptido PR05775 de forma rotineira efectuando o alinhamento da sequência nucleotidica que codifica o polipéptido PR05775 com outras sequências nucleotidicas conhecidas utilizando qualquer um dos vários de programas de alinhamento de sequências bem conhecidos e determinando quais o(s) fragmento(s) da sequência nucleotidica que codifica o Polipéptido PR05775 são novos.
Noutra concretização, a invenção pode referir-se ao polipéptido PR05775 isolado codificado por qualquer das sequências de ácido nucleico isoladas atrás identificadas.
Num determinado aspecto, a invenção refere-se a um polipéptido PR05775 isolado, compreendendo uma sequência de aminoácidos possuindo pelo menos cerca de 80% de identidade de sequência, preferivelmente pelo menos cerca de 81% de identidade de sequência, mais preferivelmente pelo menos cerca de 82% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 83% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 84% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 85% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 86% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 87% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 88% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 89% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 90% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 91% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 92% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 93% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 94% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 95% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 96% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 97% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 98% de identidade de sequência e ainda mais preferivelmente pelo menos cerca de 99% de identidade de sequência com um polipéptido PR05775 possuindo uma sequência 11
ΕΡ 1 607 402 /PT de aminoácidos de comprimento completo como aqui se descreve, uma sequência de aminoácidos a que falta o péptido de sinal como aqui se descreve, um dominio extracelular de uma proteina transmembranar, com ou sem o péptido de sinal, como aqui se descreve ou qualquer outro fragmento especificamente definido da sequência de aminoácidos de comprimento completo como aqui se descreve.
Num outro aspecto, a invenção refere-se a um polipéptido PR05775 isolado compreendendo uma sequência de aminoácidos possuindo pelo menos cerca de 80% de identidade de sequência, preferivelmente pelo menos cerca de 81% de identidade de sequência, mais preferivelmente pelo menos cerca de 82% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 83% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 84% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 85% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 86% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 87% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 88% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 89% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 90% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 91% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 92% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 93% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 94% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 95% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 96% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 97% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 98% de identidade de sequência e ainda mais preferivelmente pelo menos cerca de 99% de identidade de sequência com uma sequência de aminoácidos codificada por qualquer dos ADNc de proteina humana depositados na ATCC como aqui se descreve.
Num outro aspecto, a invenção refere-se a um polipéptido PR05775 isolado compreendendo uma sequência de aminoácidos com 12
ΕΡ 1 607 402 /PT uma pontuação de pelo menos cerca de 80% positivos, preferivelmente pele i menos cerca de 81% positivos, mais preferivelmente pelo menos cerca de 82% positivos, ainda mais preferivelmente pelo menos cerca de 83% positivos, ainda mais preferivelmente pelo menos cerca de 84% positivos, ainda mais preferivelmente pelo menos cerca de 85% positivos, ainda mais preferivelmente pelo menos cerca de 86% positivos, ainda mais preferivelmente pelo menos cerca de 87% positivos, ainda mais preferivelmente pelo menos cerca de 88% positivos, ainda mais preferivelmente pelo menos cerca de 89% positivos, ainda mais preferivelmente pelo menos cerca de 90% positivos, ainda mais preferivelmente pelo menos cerca de 91% positivos, ainda mais preferivelmente pelo menos cerca de 92% positivos, ainda mais preferivelmente pelo menos cerca de 93% positivos, ainda mais preferivelmente pelo menos cerca de 94% positivos, ainda mais preferivelmente pelo menos cerca de 95% positivos, ainda mais preferivelmente pelo menos cerca de 96% positivos, ainda mais preferivelmente pelo menos cerca de 97% positivos, ainda mais preferivelmente pelo menos cerca de 98% positivos e ainda mais preferivelmente pelo menos cerca de 99% positivos em comparação com a sequência de aminoácidos de um polipéptido PR05775 possuindo uma sequência de aminoácidos de comprimento completo como aqui se descreve, uma sequência de aminoácidos a que falta o péptido de sinal como aqui se descreve, um domínio extracelular de uma proteína transmembranar, com ou sem o péptido de sinal, como aqui se descreve ou qualquer outro fragmento especificamente definido da sequência de aminoácidos de comprimento completo como aqui se descreve.
Num aspecto especifico, o invento refere-se a um polipéptido PR05775 isolado sem a sequência de sinal N-terminal e/ou a metionina de iniciação e é codificado por uma sequência de nucleótidos que codifica tal sequência de aminoácidos tal como aqui previamente descrito. Os processos para produzir aquele são também aqui descritos, em que esses processos incluem cultivar uma célula hospedeira incluindo um vector que inclui a molécula de ácido nucleico codificante apropriada em condições adequadas para expressão do polipéptido PR05775 e recuperação do polipéptido PR05775 da cultura de células. 13
ΕΡ 1 607 402 /PT
Outro aspecto do invento refere-se a um polipéptido PR05775 isolado que apresenta quer o domínio transmembranar eliminado quer o domínio transmembranar inactivado. São também aqui descritos processos para produzir aquele, em que esses processos incluem cultivar uma célula hospedeira incluindo um vector que inclui a molécula de ácido nucleico codificante apropriada, em condições adequadas para expressão do polipéptido PR05775 e recuperação do polipéptido PR05775 de uma cultura de células.
Ainda numa concretização adicional, o invento refere-se a uma composição de matéria incluindo um anticorpo anti-PR05775 em combinação com uma transportador. Opcionalmente, o transportador é um transportador farmaceuticamente aceitável.
Descrevem-se aqui vectores incluindo ADN que codificam qualquer dos polipéptidos aqui descritos. Proporcionam-se igualmente células hospedeiras incluindo qualquer de tais vectores. Como exemplo, as células hospedeiras podem ser células CHO, células de E. coli, de levedura ou de insecto infectadas por baculovírus. Descreve-se adicionalmente um processo para produzir qualquer dos polipéptidos aqui descritos e inclui cultivar células hospedeiras em condições adequadas para expressão do polipéptido pretendido e recuperar o polipéptido pretendido da cultura de células.
Também se descrevem aqui moléculas quiméricas incluindo qualquer dos polipéptidos aqui descritos fundido com um polipéptido ou sequência de aminoácidos heteróloga. Constituem exemplos de tais moléculas quiméricas, entre outros, quaisquer dos polipéptidos aqui descritos fundidos com uma sequência de marcação de epítopo ou uma região Fc de uma imunoglobulina.
Noutra concretização, o invento proporciona um anticorpo que se liga especificamente a qualquer dos polipéptidos descritos supra ou infra. Opcionalmente, o anticorpo é um anticorpo monoclonal, anticorpo humanizado, fragmento de anticorpo ou anticorpo de cadeia simples.
Ainda noutras concretizações, o invento pode utilizar sondas de oligonucleótidos úteis para isolar sequências de nucleótidos genómicas e de ADNc ou como sondas anti-sentido, 14 ΕΡ 1 607 402 /PT em que essas sondas podem ser derivadas de qualquer das sequências de nucleótidos descritas supra ou infra.
Descrição sucinta das figuras A figura 1 apresenta a sequência de nucleótidos (SEQ ID NO:l) de um ADNc contendo uma sequência de nucleótidos que codifica PR05775 de sequência nativa, em que a sequência de nucleótidos (SEQ ID NO.l) é um clone aqui denominado como DNA96869-2673. Também se apresentam em tipo negrito e sublinhado as posições dos respectivos codões de iniciação e terminação. A figura 2 apresenta a sequência de aminoácidos (SEQ ID NO:2) de um polipéptido PR05775 de sequência nativa tal como derivado da sequência de codificação de SEQ ID NO:l apresentada na figura 1.
Descrição detalhada do invento I. Definições
As expressões "amplificação génica" e "duplicação génica" são utilizadas indiferentemente e referem-se a um processo pelo qual se formam cópias múltiplas de um gene ou fragmento de gene numa célula ou linha celular especificas. A região duplicada (uma parte de ADN amplificado) é muitas vezes denominada um "amplicão". Habitualmente, a quantidade do ARN mensageiro (ARNm) produzido, ou seja, o nível de expressão génica também aumenta proporcionalmente com o número de cópias efectuadas do gene especificamente expresso. "Tumor", tal como aqui utilizado, refere-se a todo o crescimento e proliferação de células neoplásicas, quer sejam malignas quer sejam benignas e a todas as células e tecidos pré-cancerosos e cancerosos.
As expressões "cancro" e "canceroso" referem-se ou descrevem a condição fisiológica em mamíferos que é caracterizada tipicamente por crescimento celular desregulado. Constituem exemplos de cancro, entre outros, carcinoma, linfoma, blastoma, sarcoma e leucemia. Constituem exemplos 15
ΕΡ 1 607 402 /PT mais específicos de tais cancros, entre outros, cancro de mama, cancro de próstata, cancro de cólon, cancro de células escamosas, cancro de células pequenas do pulmão, cancro de células não pequenas do pulmão, cancro gastrointestinal, cancro pancreático, glioblastoma, cancro cervical, cancro dos ovários, cancro de fígado, cancro de bexiga, hepatoma, cancro colorrectal, carcinoma do endométrio, carcinoma das glândulas salivares, cancro de rim, cancro de fígado, cancro vulvar, cancro da tiróide, carcinoma hepático e vários tipos de cancro da cabeça e do pescoço. "Tratamento" é uma intervenção efectuada com o intuito de evitar o desenvolvimento ou alterar a patologia de uma doença. Assim, "tratamento" refere-se tanto a tratamento terapêutico e profiláctico como a medidas preventivas. Aqueles que têm necessidade de tratamento incluem os que já apresentam a doença assim como aqueles nos quais a doença deve ser evitada. No tratamento de tumor (por exemplo, cancro), um agente terapêutico pode diminuir directamente a patologia de células tumorais ou tornar as células tumorais mais susceptiveis a tratamento por outros agentes terapêuticos, por exemplo, radiação e/ou quimioterapia. A "patologia" do cancro inclui todos os fenómenos que comprometem o bem-estar do doente. Tal inclui, entre outros, crescimento celular anómalo ou descontrolado, metástase, interferência com o funcionamento normal de células adjacentes, libertação de citoquinas ou outros produtos de excreção a níveis anómalos, supressão ou agravamento de resposta inflamatória ou imunológica, etc. "Mamífero" com objectivos de tratamento refere-se a qualquer animal classificado como um mamífero, incluindo humanos, animais domésticos e de quinta e animais de jardim zoológico, de desporto ou de companhia, tal como cães, cavalos, gatos, gado bovino, porcos, ovelhas, etc. De preferência o mamífero é humano. "Transportadores" tal como aqui utilizado inclui transportadores farmaceuticamente aceitáveis, excipientes ou estabilizantes que não são tóxicos para a célula ou mamífero que a eles é exposta às dosagens e concentrações utilizadas. 16
ΕΡ 1 607 402 /PT
Muitas vezes o transportador fisiologicamente aceitável é uma solução aquosa de pH tamponado. Constituem exemplos de transportadores fisiologicamente aceitáveis, entre outros, tampões tais como fosfato, citrato e outros ácidos orgânicos; antioxidantes incluindo ácido ascórbico; polipéptidos de baixo peso molecular (menos de cerca de 10 resíduos); proteínas, tal como albumina de soro, gelatina ou imunoglobulinas; polímeros hidrófilos tal como polivinilpirrolidona; aminoácidos tais como glicina, glutamina, asparagina, arginina ou lisina; monossacáridos, dissacáridos e outros hidratos de carbono incluindo glucose, manose ou dextrinas; agentes quelantes tais como EDTA; álcoois de açúcar tal como manitol ou sorbitol; contra-iões formadores de sais tal como sódio; e/ou tensioactivos não iónicos tais como TWEEN™, polietilenoglicol (PEG) e PLURONICS™. A administração "em combinação com" um ou mais agentes terapêuticos adicionais inclui administração simultânea (concomitante) e consecutiva em qualquer ordem. A expressão "agente citotóxico" tal como aqui utilizada refere-se a uma substância que inibe ou evita a função de células e/ou causa destruição de células. Pretende-se que a expressão inclua isótopos radioactivos (por exemplo, I131, I125, Y90 e Re186), agentes quimioterapêuticos e toxinas tais como toxinas activas enzimaticamente de origem bacteriana, fúngica, vegetal ou animal ou seus fragmentos.
Um "agente quimioterapêutico" é um composto químico útil para o tratamento de cancro. Constituem exemplos de agentes quimioterapêuticos, entre outros, adriamicina, doxorrubicina, epirrubicina, 5-fluorouracilo, arabinósido de citosina ("Ara-C"), ciclofosfamida, tiotepa, bussulfano, citoxina, taxóides, por exemplo, paclitaxel (Taxol, Bristol-Myers Squibb Oncology, Princeton, NJ) e doxetaxel (Taxotere, Rhone-PoulencRorer, Antony, França), toxotere, metotrexato, cisplatina, melfalano, vinblastina, bleomicina, etoposido, ifosfamida, mitomicina C, mitoxantrona, vincristina, vinorrelbina, carboplatina, teniposido, daunomicina, carminomicina, aminopterina, dactinomicina, mitomicinas, esperamicinas (consultar patente U.S. n.° 4 675 187), 5-FU, 6-tioguanina, 6-mercaptopurina, actinomicina D, VP-16, 17
ΕΡ 1 607 402 /PT clorambucilo, melfalano e outras mostardas de azoto relacionadas. Também se incluem nesta definição agentes hormonais que actuam para regular ou inibir a acção hormonal sobre os tumores tal como tamoxifeno e onapristona.
Um "agente inibidor do crescimento" quando aqui utilizado refere-se a um composto ou composição que inibe crescimento de uma célula, especialmente uma célula de cancro que sobre-expressa qualquer dos genes aqui identificados quer in vitro quer in vivo. Assim, o agente inibidor do crescimento é aquele que reduz significativamente a percentagem de células que sobre-expressam tais genes na fase S. Constituem exemplos de agentes inibidores do crescimento, entre outros, agentes que bloqueiam a progressão do ciclo celular (num ponto diferente da fase S), tal como agentes que induzem paragem em G1 e paragem na fase M. Os bloqueadores de fase M tipicos incluem as vincas (vincristina e vinblastina), taxol e inibidores de topo II tais como doxorrubicina, epirrubicina, daunorrubicina, etoposido e bleomicina. Os agentes que param Gl também provocam paragem de fase S, por exemplo, agentes alquilantes de ADN tais como tamoxifeno, prednisona, dacarbazina, mecloretamina, cisplatina, metotrexato, 5-fluorouracilo e ara-C. Pode consultar-se informação adicional em The Molecular Basis of Câncer, Mendelsohn e Israel, ed., capitulo 1, intitulado "Cell cycle regulation, oncogens, and antineoplastic drugs" por Murakami et al., (WB Saunders: Philadelphia, 1995), especialmente a p. 13. A "doxorrubicina" é um antibiótico de antraciclina. A denominação química completa da doxorrubicina é (8S-cis)-10-[(3-amino-2,3,6-tridesoxi-a-L-lixo-hexapiranosil)oxi]-7,8,9,10-tetra-hidro-6,8,ll-tri-hidroxi-8-(hidroxiacetil)-1-metoxi-5,12-naftacenodiona. A expressão "citoquina" é uma expressão genérica para proteínas libertadas por uma população de células que actuam noutra célula como mediadores intercelulares. Constituem exemplos de tais citoquinas, as linfoquinas, as monoquinas e as hormonas polipeptídicas tradicionais. Incluem-se nas citoquinas a hormona do crescimento tal como a hormona do crescimento humana, N-metionil-hormona do crescimento humana e hormona do crescimento bovina; hormona paratiróide; tiroxina; 18
ΕΡ 1 607 402 /PT insulina; pró-insulina; relaxina; pró-relaxina; hormonas de glicoproteina tal como hormona foliculo estimulante (FSH), hormona estimuladora da tiróide (TSH) e hormona luteinizante (LH); factor de crescimento hepático, factor de crescimento de fibroblastos; prolactina; lactogénio da placenta; factor de necrose tumoral α e β; substância inibidora mulleriana; péptido associado a gonadotrofina de ratinho; inibina; activina; factor de crescimento endotelial vascular; integrina; trombopoietina (TPO); factores de crescimento de nervos tais como NGF-β; factor de crescimento de plaquetas; factores de crescimento de transformação (TGF) tais como TGF-a e TGF-β; factor de crescimento do tipo insulina I e II; eritropoietina (EPO); factores osteoindutores; interferões tais como interferão α, β e γ; factores estimulantes de colónias (CSF) tais como CSF de macrófagos (M-CSF); CSF de granulócitos-macrófagos (GM-CSF); e CSF de granulócitos (G-CSF); interleucinas (IL) tais como IL-1, IL-la, EL-2, EL-3, IL-4, IL-5, IL6, IL-7, IL-8, IL-9, IL-11, IL-12; um factor de necrose tumoral tal como TNF-α ou TNF-β; e outros factores polipeptidicos incluindo LIF e ligando kit (KL). Tal como aqui utilizada, o termo citoquina inclui proteínas de fontes naturais ou de cultura de células recombinantes e equivalentes biologicamente activos de citoquinas de sequência nativa. A expressão "pró-fármaco" tal como utilizada neste pedido refere-se a um precursor ou uma forma derivada de uma substância farmaceuticamente activa que é menos citotóxica para células tumorais comparativamente com o fármaco progenitor e é capaz de ser activada enzimaticamente ou convertida na forma progenitora, mais activa. Consultar, por exemplo, Wilman, "Prodrugs in Câncer Chemotherapy", Biochemical Society Transactions, K4:375-382,615th Meeting, Belfast (1986) e Stella et al., "Prodrugs: A Chemical Approach to Targeted Drug Delivery", Directed Drug Delivery, Borchardt et al, (ed.), p. 147-267, Humana Press (1985). Os "pró-fármacos" deste invento incluem, entre outros, pró-fármacos contendo fosfato, pró-fármacos contendo tiofosfato, pró-fármacos contendo sulfato, pró-fármacos contendo péptidos, pró-fármacos com modificação em D-aminoácidos, pró-fármacos glicosilados, pró-fármacos contendo β-lactama, pró-fármacos contendo fenoxiacetamina opcionalmente substituídos ou pró-fármacos contendo fenilacetamida opcionalmente substituídos, 19
ΕΡ 1 607 402 /PT pró-fármacos de 5-fluorocitosina e outros pró-fármacos de 5-fluorouridina que podem ser convertidos no fármaco livre citotóxico mais activo. Constituem exemplos de fármacos citotóxicos que podem ser derivatizados para uma forma de pró-fármaco para utilização neste invento, entre outros, os agentes quimioterapêuticos descritos supra.
Uma "quantidade eficaz" de um polipéptido aqui revelado ou de um seu antagonista, em referência a inibição de crescimento celular neoplásico, crescimento tumoral ou crescimento de células de cancro, é uma quantidade capaz de inibir em alguma extensão o crescimento de células alvo. A expressão inclui uma quantidade capaz de evocar um efeito inibidor do crescimento, citostático e/ou citotóxico e/ou de apoptose das células alvo. Uma "quantidade eficaz" de um antagonista de polipéptido PRO com o objectivo de inibir crescimento celular neoplásico, crescimento tumoral ou crescimento de célula de cancro, pode ser determinada empiricamente e de um modo rotineiro.
Uma "quantidade terapeuticamente eficaz", em referência ao tratamento de tumor, refere-se a uma quantidade capaz de evocar um ou mais dos seguintes efeitos: (1) inibição, em alguma extensão, de crescimento tumoral incluindo abrandar o crescimento e parar completamente o crescimento; (2) redução do número de células tumorais; (3) redução das dimensões do tumor; (4) inibição (ou seja, redução, abrandamento ou paragem completa) de infiltração de células tumorais em órgãos periféricos; (5) inibição (ou seja, redução, abrandamento ou paragem completa) de metástase; (6) aumento da resposta imunitária antitumoral, que pode, embora não obrigatoriamente, resultar na regressão ou rejeição do tumor; e/ou (7) alívio, em alguma extensão, de um ou mais sintomas associados com a doença. Uma "quantidade terapeuticamente eficaz" de antagonista de um polipéptido PRO com objectivos de tratamento de tumor pode ser determinada empiricamente e de um modo rotineiro.
Uma "quantidade inibidora do crescimento" de um antagonista PRO é uma quantidade capaz de inibir o crescimento de uma célula, especialmente tumor, por exemplo, célula de cancro quer in vitro quer in vivo. Uma "quantidade inibidora do crescimento" de um antagonista PRO com o objectivo de 20
ΕΡ 1 607 402 /PT inibir crescimento celular neoplásico pode ser determinada empiricamente e de um modo rotineiro.
Uma "quantidade citotóxica" de um antagonista PRO é uma quantidade capaz de causar destruição de uma célula, especialmente uma célula tumoral, por exemplo, de cancro, quer in vitro quer in vivo. Uma "quantidade citotóxica" de um antagonista PRO com o objectivo de inibir crescimento celular neoplásico pode ser determinada empiricamente e de um modo rotineiro.
As expressões "polipéptido PRO" e "PRO" tal como aqui utilizadas e quando imediatamente seguidas por uma designação numérica referem-se a vários polipéptidos em que a designação completa (ou seja, PRO/número) se refere a sequências polipeptidicas especificas tal como aqui descritas. As expressões "polipéptido PRO/número" e "PRO/número" em que a expressão "número" é proporcionada, como uma designação numérica real, tal como aqui utilizadas, abrangem polipéptidos de sequência nativa e variantes de polipéptidos (que são aqui adicionalmente definidos). Os polipéptidos PRO aqui descritos podem ser isolados de várias fontes, tal como de tipos de tecido humano ou de outra fonte ou preparados por métodos recombinantes ou sintéticos.
Um "polipéptido PRO de sequência nativa" inclui um polipéptido apresentando a mesma sequência de aminoácidos que o polipéptido PRO correspondente derivado da natureza. Tais polipéptidos PRO de sequência nativa podem ser isolados da natureza ou podem ser produzidos por meios recombinantes ou sintéticos. A expressão "polipéptido PRO de sequência nativa" abrange especificamente formas de ocorrência natural truncadas ou excretadas do polipéptido PRO especifico (por exemplo, uma sequência de domínio extracelular), formas variantes de ocorrência natural (por exemplo, formas de splicing alternativo) e variantes alélicas de ocorrência natural do polipéptido. Em várias concretizações do invento, os polipéptidos PRO de sequência nativa aqui revelados são polipéptidos de sequência nativa madura ou de comprimento completo incluindo as sequências de aminoácidos de comprimento completo apresentadas nas figuras anexas. Os codões de iniciação e de terminação são apresentados a negrito e 21
ΕΡ 1 607 402 /PT sublinhados nas figuras. Contudo, apesar de se apresentarem os polipéptidos PRO revelados nas figuras anexas como começando com resíduos de metionina aqui designados como posição de aminoácido 1 nas figuras, é provável e possível que outros resíduos de metionina localizados quer a montante quer a jusante da posição de aminoácido 1 nas figuras possam ser utilizados como o resíduo de aminoácido iniciador para os polipéptidos PRO. O "domínio extracelular" ou "ECD" do polipéptido PRO refere-se a uma forma do polipéptido PRO que se encontra essencialmente isenta dos domínios transmembranar e citoplasmático. Habitualmente, o ECD de um polipéptido PRO terá menos de 1% de tais domínios transmembranares e/ou citoplasmáticos e de preferência terá menos que 0,5% de tais domínios. Entender-se-á que quaisquer domínios transmembranares identificados para os polipéptidos PRO do presente invento são identificados de acordo com os critérios rotineiramente utilizados na especialidade para identificar esse tipo de domínios hidrófobos. As fronteiras exactas de um domínio transmembranar podem variar mas muito provavelmente não variarão mais de cerca de 5 aminoácidos em qualquer das extremidades do domínio tal como aqui inicialmente identificado. Opcionalmente, e consequentemente, um domínio extracelular de um polipéptido PRO pode conter desde cerca de 5 ou menos aminoácidos em qualquer dos lados do limite do domínio transmembranar/domínio extracelular tal como identificado nos exemplos ou descrição e tais polipéptidos com ou sem o péptido de sinal associado e os ácidos nucleicos que os codificam, encontram-se abrangidos pelo presente invento.
As localizações aproximadas dos "péptidos de sinal" dos diferentes polipéptidos PRO aqui revelados apresentam-se no presente fascículo e/ou nas figuras anexas. Note-se, contudo, que o limite C-terminal de um péptido de sinal pode variar mas muito provavelmente não variará mais de cerca de 5 aminoácidos em qualquer dos lados do limite C-terminal do péptido de sinal tal como inicialmente aqui identificado, em que o limite C-terminal do péptido de sinal pode ser identificado de acordo com os critério rotineiramente utilizados na especialidade para identificar esse tipo de elemento de sequência de aminoácidos (por exemplo, Nielsen et al., Prot. Eng., 10:1-6 22 ΕΡ 1 607 402 /PT (1997) e von Heinje et al., Nucl. Acids Res., 14:4683-4690 (1986)). Além disso, reconhece-se igualmente que nalguns casos a clivagem de uma sequência de sinal de um polipéptido excretado não é inteiramente uniforme, resultando em mais de uma espécie excretada. Esses polipéptidos maduros, em que o péptido de sinal é clivado num intervalo não superior a cerca de 5 aminoácidos de qualquer dos lados do limite C-terminal do péptido de sinal tal como aqui identificado e os polinucleótidos que os codificam, encontram-se abrangidos pelo presente invento. "Variante de polipéptido PRO" significa um polipéptido PRO activo tal como definido atrás ou adiante possuindo pelo menos cerca de 80% de identidade de sequência de aminoácidos com uma sequência de um polipéptido PRO de sequência nativa de comprimento completo como aqui se descreve, uma sequência de um polipéptido PRO a que falta o péptido de sinal como aqui se descreve, um domínio extracelular de um polipéptido PRO, com ou sem o péptido de sinal, como aqui se descreve ou qualquer outro fragmento de uma sequência de um polipéptido PRO de comprimento completo como aqui se descreve. Estas variantes de polipéptido PRO incluem, por exemplo, polipéptidos PRO em que um ou mais resíduos de aminoácido são adicionados, ou eliminados, no terminal N ou C da sequência de aminoácidos nativa de comprimento completo. Vulgarmente, uma variante de polipéptido PRO terá pelo menos cerca de 80% de identidade de sequência de aminoácidos, preferivelmente pelo menos cerca de 81% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 82% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 83% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 84% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 85% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 86% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 87% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 88% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 89% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 90% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos 23
ΕΡ 1 607 402 /PT cerca de 91% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 92% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 93% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 94% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 95% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 96% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 97% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 98% de identidade de sequência de aminoácidos e o mais preferivelmente pelo menos cerca de 99% de identidade de sequência de aminoácidos com uma sequência de um polipéptido PRO de sequência nativa de comprimento completo como aqui se descreve, uma sequência de um polipéptido PRO a que falta o péptido de sinal como aqui se descreve, um dominio extracelular de um polipéptido PRO, com ou sem o péptido de sinal, como aqui se descreve ou qualquer outro fragmento especificamente definido de uma sequência de um polipéptido PRO de comprimento completo como aqui se descreve. Vulgarmente, os polipéptidos PRO variantes têm pelo menos cerca de 10 aminoácidos de comprimento, frequentemente pelo menos cerca de 20 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 30 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 40 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 50 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 60 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 70 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 80 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 90 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 100 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 150 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 200 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 300 aminoácidos de comprimento, ou mais.
Tal como apresentado infra, a tabela 1 proporciona o código de fonte completo para o programa de computador de comparação de sequências ALIGN-2. Este código de fonte pode ser rotineiramente compilado para utilização num sistema 24
ΕΡ 1 607 402 /PT operativo UNIX para proporcionar o programa de computador de comparação de sequências ALIGN-2.
Adicionalmente, as tabelas 2A-2D apresentam exemplos hipotéticos para utilização do método descrito infra para determinar a % de identidade de sequência de aminoácidos (tabelas 2A-2B) e a % de identidade de sequências de ácidos nucleicos (tabelas 2C-2D) utilizando o programa de computador de comparação de sequências ALIGN-2, em que "PRO" representa a sequência de aminoácidos de um polipéptido PRO hipotético de interesse. "Proteina de comparação" representa a sequência de aminoácidos de um polipéptido contra a qual se compara o polipéptido "PRO" de interesse, "PRO-ADN" representa uma sequência de ácido nucleico de interesse que codifica PRO hipotético. "ADN de comparação" representa a sequência de nucleótidos de uma molécula de ácido nucleico contra a qual se compara a molécula de ácido nucleico "PRO-ADN" de interesse, "X", "Y" e "Z" representam, cada um, resíduos de aminoácido hipotéticos diferentes e "N", "L" e "V" representam, cada um, nucleótidos hipotéticos diferentes. 25
ΕΡ 1 607 402 /PT
Tabela 1 /* * * C-C increased from 12 to 15
* Zis avcrage of EQ
* B is average of ND * match with stop is M; stop-stop = 0; J (joker) match = 0 */ tfdeTme _M -8 /* valuc of a match with a stop */ int day[26][26] = { /* A~B CDEFGHIJKLMNOPQRSTUVWXYZ*/ /* A */ { 2, 0,-2. 0, 0,-4, 1,-1,-1, 0,-),-2,-1, 0, Μ, 1, 0,-2, 1.1, 0,0,-6, 0,-3, 0}, /* B */ { 0, 3,-4, 3, 2,-5,0, 1.-2, 0, 0,-3,-2, 2,'tó,-l, 1, 0, 0, 0, 0,-2,-5, 0.-3, )>, /* C *1 {-2,-4,15,.5,-5,-4,-3,-3,-2, 0,-5,-6.-5,-47 M.-3,-5,-4, 0,-2,0,-2,-8, 0, 0,-5), /* D */ { 0, 3,-5, 4, 3,-6, 1, 1,-2, 0, 0,-4,-3, 2, M,-l, 2,-1, 0, 0, 0,-2,-7, 0,4, 2}, /* E */ { 0, 2,-5, 3, 4,-5,0, 1,-2, 0,0,-3,-2, 1,'M,-1,2,-1, 0, 0, 0,-2,-7, 0,-4, 3}, I* F *1 {-4,-5,4,-6,-5, 9,-5,-2, 1, 0,-5, 2, 0,4,'m,-5,-5,4,-3,-3, 0,-1, 0, 0, 7,-5}, /* G */ { 1.0,-3, 1, 0,-5, 5,-2,-3, 0,-2,-4,-3, 0."m.-1,-I.-3. 1.0, 0,-1,-7, 0,-5, 0>, /* H */ {-1, 1,-3, 1, 1,-2,-2, 6,-2, 0.0,-2,-2, 2,'m, 0. 3, 2,-1,-1, 0,-2,-3, 0, 0, 2}, /* I */ {-1,-2,-2,-2,-2, 1,-3,-Z. 5, 0,-2, 2, 2,-2, M,-2,-2,-2,-1,0, 0, 4,-5, 0,-1,-2}. 1*1*1 {o, o, o, o, o, o, o, o, o, o, o; o, o, o, m, o, o, o, o, o. o, o, o, o, o, o}, l* K *1 (-1,0,-5.0, 0,-5,-2, 0,-2, 0, 5,-3,0, i7m,-1, 1, 3,0, 0, 0,-2,-3,0,-4,0}, /* L */ {-2,-3,-6,4,-3, 2,4,-2,2, 0,-3, 6,4,-3, M,-3,-2,-3,-3,-1, 0, 2,-2,0,-1,-2}. I* M ·/ {-1,-2,-5,-3,-2,0.-3,-2,2, 0,0, 4,6,-2, Μ,-2,-1, 0,-2,-1,0. 2,4.0.-2.-1}, /* N */ { 0.2,4, 2, 1,4, O, 2,-2, 0, 1,-3,-2.2.*Μ.·1.1, 0, 1, 0, 0,-2,4, 0,-2, 1}, 1*0*1 {_M, Μ. Μ, Μ, Μ, M,_M, Μ, M, M,_M, 0,_M,_M,_M._M,_M,_M,_M,_M,_M,_M,_M}, /♦ P +/ { 1,-Γ,-3,:ΐ,.Γ,-5,-1. 0.-2, 0,-f,·-3,-2,-1, Μ, 6,’θ, 0, 1,0,0.-C-6, 0,-5, 0}7 /* Q */ { 0,1,-5, 2. 2,-5,-1, 3,-2, O, 1,-2,-1, 1, M, 0,4, 1,-1,-1, 0,-2,-5, 0,4, 3}, I* R */ {-2, 0,4,-1,-1,4,-3, 2,-2, 0, 3,-3, 0, 0,'m, 0, 1, 6, 0,-1, 0,-2, 2, 0,4, 0}, /* S *1 { 1, 0, 0. 0, 0,-3, 1,-1,-1, 0, 0,-3,-2,1,_M, 1,-1, 0, 2, 1, 0,-1,-2, 0.-3, 0}, 1*1*1 { 1, 0,-2, 0, 0,-3, 0,-1, 0, 0, 0,-1,-1, 0. M, 0,-1,-1, 1, 3, 0, 0,-5, 0,-3, 0}, /* U */ { 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, o.jd, 0,0. 0. 0. 0. 0,0. 0, 0, 0, 0}, /* V */ { 0,-2/2,-2,-2,-1,-1,-2, 4, 0,-2, 2, 2,-2, M,-!,-2,-2,-1, 0.0, 4,-6, 0.-2.-2}, I* W */ {-6,-5.-8,-7,-7, 0,-7,-3,-5, 0,-3,-2,-4,4,_M,-6,-5, 2,-2,-5,0,-6,17, 0,0,-6}, /* X */ { 0.0, 0, 0, 0, 0, O, 0, 0, 0, 0, 0,0. 0, M, 0,0,0,0. 0,0, 0. 0, 0, 0. 0}, I* Y *1 {-3,-3, 0,4,4, 7,-5, 0,-1, 0,4,-1,-2,-27 M,-5,-4,4,-3,-3,0,-2, 0,0.10,4}, /* Z */ { 0,1,-5, 2. 3,-5, 0, 2,-2, 0. 0,-2,-1, 1,~M, 0, 3, 0, 0,0, 0,-2,-6, 0.4, 4} }; 26
26ΕΡ 1 607 402 /PT I* ·/ linclude <stdio.h> linclude <ctype.h> #dcfine MAXJMF 16 /* maxjumpsinadiag *1 tfdefinc MAXGAP 24 /* don't continue to penalize gaps larger than this */ //'define JMPS 1024 /* max jmps in an path *1 ffdefine MX 4 1· save if there's at least MX-1 bases since last jmp *1 ídefine DMAT 3 /* value of matching bases */ Idefine D MIS 0 /* penalty for mismatched bases */ #define DINSO 8 1* penatty for a gap *1 ádefine D1NS1 I 1* penalty per base */ Idcfine PINSO 8 /* penalty for a gap *1 #define PINSl 4 1* penalty per residue *1 struct jmp { short njMAXJMP); /* sizeofjrop (neg for dely) */ unsigned short x[MAXJMP]; /* base no. of jmp in seq x */ !* limits seq to 2“16 -1 */ struct diag { int score; /* score at last jmp */ lODg offset: /♦ offset of prev block */ short ijmp; /* currenl jmp índex *1 }; struct jmp jp; /* list of jmps */ struct path { int spc; /* number of leading spaces */ short n[JMPS];/* size of jmp (gap) */ }; int x[JMPS];/· loc of jmp (last elcm before gap) */ char •ofilc; /* output file name ♦/ char 'narnex(2j; /* seq naraes: getseqsO */ char ‘prog; /* prog name for err msgs *1 char *seqx[2j; /* seqs: getseqsO */ int dmax; /* best diag: nwO */ int dmaxO; t‘ final diag */ int dna; /* set if dna; maíaO */ int endgaps; r sei if penaiiaing ênd gaps *' int gapx, gapy; /* total gaps in seqs *1 int lenO. leni; /* seq lens */ int ngapx, ngapy; /* total siae of gaps */ int smax; /* max score: nwO */ int •xbm; /* bitmap for matching */ iong offset; /* currenl offset in jmp file */ struct diag ♦dx; /* holds diagonais */ struct path ppPl; /* holds path far seqs */ char •cailocO. *malloc(), ‘indexO. *strcpy0; char ♦getseqQ, *g_calloc0; 27
ΕΡ 1 607 402 /PT /* Needleroan-Wunsch alignment program * * usage: progs filei file2 * where filei and file2 are two dna or two proiein sequences. * The sequences cao be in upper- or lower-case an may contain ambiguity * Any lines beginning with ' or ' <' are ignored * Max file length is 65535 (limited by unsigned sbort x in lhe jmp struct)
* A sequence with 1/3 or more of its elements ACGTU is assumed to be DNA * Output is in the file "align.out" * * The program may create a tmp file in /tmp lo hold info about traceback. * Original version developed under BSD 4.3 on a vax 8650 */ #include "nw.h" ffindude "day.h" static _dbval[26] = {
static _pbval[26] = { 1, 2|(1< < <('N'-'A')), 4, 8, 16, 32, 64, 128, 256, OxFFFFFFF, 1<<10, 1<<U, 1 < < 12, 1<<13, 1<<14, 1 < < 15, 1 < < 16, 1 < <17, lcc 18, I < < 19, 1<<20, 1< <21, 1 c <22, 1 < <23,1 < <24, 1<<25|(1<<(Έ'-Ά'))ΚΙ<«Ό'-Ά')) main(ac, av) main int char { ac; *avQ; prog - av[0]; if (ac ! = 3) { fprintffslderr,"usage: %s filei fileltn”, prog); fprintf(stderr,"where ftlel and file2 are two dna or two protein sequencesAn'); fprintf(stderr, "The sequences can be in upper- or lower-casein"); fprintffslderr,"Any lines beginning with or' <' are ígnoredin"); fprintffstderr,"Output is in Ibe Tile \"align.out\"\n"); exit(l);} naiscx[0j ~ av[lj; namex(lj = av[2]; seqx(0] = getseq(namex[0), &lenO); seqx[l] = getseq(namex[l], &lenl); xbm = (dna)? _dbval: jtbval; endgaps = 0; /· 1 to penalize endgaps */ ofile = "align.out"; I* output file */ nv/O; /* fill in the matrix, get the possible jraps *1 readjmpsO; I* get the actual jmps ♦/ printO; /* print stats, alignment */ } cleanup(O); /* unlink any tmp files */ 28
ΕΡ 1 607 402 /PT
/* do lhe aligaraent, return best score: raainO * dna·. values in Fitch and Smith, PNAS. 80. 1382-1386,1983 * pro: PAM 2S0 values * Wben scores are equal, we prefer mismatches to any gap, prefer
* a new gap to extending an ongoing gap, and prefer a gap in seqx * to a gap in seq y. V mvO { char *p*. 'py; 1* seqs and ptrs */ int ndely, *dely; 1* keep track of dely *1 int ndelx, delx; /* keep track of delx *1 int *tmp; 1* for swapping rowO, rowl */ int mis; /* score for each type *1 ínt insO, insl; t* insertion pcnalties */ register id; 1· diagonal index */ register ϋ: /* jmp índex *1 register *co!0, *coII; /* score for curr. last row */ register xx, yy; /* index into seqs V dx = (struct diag *)g_caIloc("to get diags", lenO+lenl + 1, s!zeof(struct diag)); ndcly = fmt *)g_callocCto get ndety", lenl + 1, sizeof(int)); dely = (int *)g_calIoc(”to get dely”, leni +1, sizeof(int)); colO = (int *)g_calloc("to get colO", lenl + 1, sizeofflat)); coll = (int *)g calloc("togetcoH", lenl + 1, sizeoffint»; insO = (dna)? DÍNS0 : PINSO; insl = (dna)? DINS1 : PINS1; smax = -10000; if (endgaps) { for (col0(0) = dely[0] = -insO, yy = 1; yy < = leni; yy + +) { eoI0(yy] = delylyy] = colO[yy-l] - insl; ndelyiyy] = yy; } col0[0] = 0; /* Waterman Buli Math Biol 84 */ } elsc for (yy = 1; yy < = leni; yy++) delylyy] = -insO;
I* fill in match matrix V for (px = seqx[0], xx = I; xx < = lenO; px+ + , xx++) {
/* initialize fust entry in col V if (endgaps) { ií (xx = = i) coll[0] = delx = -(insO+insl); else col 1 [0] = delx = col0[0] - insl; ndelx = xx; } else { col 1(0] = 0; delx = -insO; ndelx = 0; } 29
ΕΡ 1 607 402 /PT .nw for (py = seqx[l], yy = 1; yy < = leni; py+ + , yy++) { mis = coI0[yy-l]; if (dna) mis += (xbm[*px-'A,)&xbm[*py-'A'])7 DMAT : DMIS; else mis += _day[*px-'A')[*py-'A']; /* update penalty for del in x seq; * favor new del over ongong del * ignore MAXGAP if weighting endgaps *1
If (endgaps j j náeiyíyyj < MAXGAP) { if (col0[yy) - insO > = dely[yy]) { delyfyy] = colO[yy] - (insO+insl); ndelyfyy] = 1; } else { dely[yy] -= insl; ndely[yy] ++; } } else { if (col0(yy] · (insO+insl) > = delylyy)) { dely[yyj - colO(yy] - (insO+insl); ndely[yy] = 1; } else ndely[yy] + + ; } /* updaíe penalty for del in y seq; * favor new del over ongong del */ 1Γ (endgaps 11 ndelx < MAXGAP) { if (coll[yy-t] - insO > = delx) { delx = coll(yy-l] - (insO+insl); ndelx = 1; } else { delx -= insl; ndelx++; } } else { if (coll[yy-l] - (insO+insl) > = delx) { delx = co! 1 [yy-1 ] - (insO+insl); ndelx = 1; ) else ndelx++; } /* pick the maximum score; we're favoring * mis over any del and delx over dely */ 30
ΕΡ 1 607 402 /PT ..nw id = xx - yy + leni -1; lf (mis > = delx && mis > = delyfyy]) coll[yy) = mis; else if (delx > = delylyy]) { cd I [yy] - delx; ij = dx[id].ijmp; if (dx[id].jp.n[0] && (Idna 11 (ndelx > = MAXJMP &&xx > dx[id].jp.x[ij]+MX) 11 mis > dxfidj.score+DtNSO)) { dx[id).ijmp++; if(++ij > = MAXJMP) { writejmps(id); ij = dx(td].ijmp - 0; dx[id).ofíse[ = offset; offset + = sizeof(stnjct jmp) + sizeoffofFset);} > dx[id].jp.n[ij] - ndelx; <Upd].jp.x[ij] = xx; dx[id].scare = delx;} else { coll[yy] = delylyy]; ij - dxlidj.ijmp; if (dx[id].jp.n[0] && (idna i | (ndelyfyy] > - MAXJMP && xx > dx[id]jp.x(íj]+MX) 11 mis > dx[id).score+DINSO)) { dx[Íd].ijmp+ + ; if (+ + ij > = MAXJMP) { writejmps(id); ij = dxpdj.ijmp = 0; dx[id),offset = offsel; offset + - sizeof(struc* jmp) + sizeof(offset); } dx[id].jp.n[ij] = -ndelylyyj; dx[id].jp.xlij] = xx; dx[id].score = delylyyj; if (xx = = lenO && yy c leni) { /* last col V if (endgaps) col I [yy] -= ins0+insl*(lenl-yy); if (coll[yy] > smax) { smax = colllyy]; dmax = id:}}} if (endgaps && xx < lenQ) colllyy-Ι] — ins0+insl*(ler.0‘Xx); If (coll[yy-l] > smax) { smax = coll[yy-l]; dmax - id; } tmp = coIO; colO = coll; coil = tmp;} (void) £tee((char *)ndely); (vold) freeftchar *)dely); (void) free((char ·)α>10); (void) ffee((char *)coll); } 31
31 ΕΡ 1 607 402 /PT /* * * printO - only rontine visible outside ihis module * * static:
* getmatO - trace back besl path, counl matches: printO
* pr alignO - priut alignment of described in array pQ: printO
* dumpbloekO -dump a blockof liões with numbers. stars: pr_alignO
* num$0 — put out a mimber line: dumpbloekO
* putlineO - put out a line (name, [num], seq, [num]): dumpbloekO
* SfarsO - -nu! Ά linft Of StifS! dUTTí^blOçkO * stripnameO - strip any path and prefix from a scqname */ tândude "nw.h* ifdefue SPC 3 #define P UNE 256 I* maximum output line */ tfdefine P SPC 3 /* space between name or num and seq */ extern day[2d][26]; int olen; /* set output line length *! FILE »fx; 1* output file */ printO Pr>nt { int Ix, ly, firstgap, lastgap; /* ovcrlap */ if <(fx = fopetitofile, "w”)) = = 0) { fprintfijsrderr, ” %s: cant write %s\n", prog, ofile); cleanup(l); } fprintf(fx, " < first sequence: %s (lenglh - %d)\n". namex[0], lenO); lprintf(fx, ”<second sequence: %s (lengtli = %d)\n', narnex[l], leni); olen = 60;
Ix = lenO; ly e leni; firstgap = lastgap = 0; if (dmax < leni - 1) { /* leading gap in x */ pp[0].spc = firstgap = leni - dmax -1; ly -- pp[0].spc; } else if (dmax > leni -1) { /* leading gap in y */ pp[I].spc = firstgap - dmax - (leni -1); lx-= pp[lj.spc; }
If (dniaxO < lenO 1) 1 /* íidiling gãp iu x *' lastgap = lenO - dmaxO -1, lx-= lastgap; } else if (dmaxO > lenO -!){/* trailing gap in y V lastgap = dmaxO - (lenO -1); ly -= lastgap; } getmat(lx, ly, firstgap, lastgap); pr_alignO; ) 32
ΕΡ 1 607 402 /PT I* * trace back the best path, count matches »/ stalic gewiat(lx, ly, firstgap, lastgap) int Ix, ly; /* int firstgap, lastgap; /* { ‘ core" (minus endgaps) */ leading tratling oyerlap */ getmat int char double register register char nm, iO, il, sizO, sizl; Outx[32J; pcU nO, nl; *p0, *pl; I* get total matches, score */ iO = il = sizO = sizl = 0; pO = seqx[0] + ppflj.spc; pl = seqxjl] + pp[0].spc; oO = pp[l].spc + 1; nl = ppfOJ.spc + 1; nm = 0; while ( *p0 && *pl) { if(sizO){ pl + +; nl ++; sizO—; > else if (sizl) { p0+ + ; n0+ + ; sizl-; ) else { if (xbm[*pO-'A']&xbm[,pl-'A']) nm++; if(nO++ == pp[0].x[i0]}
SizO = pp[0].n[i0++]; if (nl + + = = ppflj.x(ilj) sizl = pp[l]n[il + +]; p0++; pl + +; } > /* pet homology: * if penalizing endgaps, base is the shorter seq
* else, knock o ff overhangs and take shorter core V if (endgaps) lx = (lenO < leni)? lenO; leni; else lx = (lx < ly)7 lx ; ly; pet = 100.*(double)nm/(double)Ix; fprinrf(fx, "\n"); fyrintf(fx,'< %d match%s in an overlapof %d: %.2fpercentsimilarity\n", nm, (nm == 1)? "" : "es", lx, pet);
33 ΕΡ 1 607 402 /PT fprintRfx, "<gaps in first sequente: %d", gapx); if (gapx) { (void) sprintf(outx, " (%d %s%s)", ngapx, (dna)? "base":"residue", (ngapx == 1)? fprintf(fx,"?6s", outx); ...getmat fprinlf(fx,", gaps in second sequente: %d", gapy); if(gapy) { (void) sprintf(outx, ” (%d %s%s)", ngapy, (dna)? "base":"residue", (ngapy = = 1)? ”":"s"); fprintf(fx,"%s", outx);} if (dna) iprintf(fx, ”\n<score: %d (match = %d, mismatch = %d, gap penalty = %d + Síd per base)\n”, smax, DMAT, DMIS, DINSO, DINS1); else fprintf(fx, ”\n<score: %d (DayhoffPAM 250 matrix, gap penalty = %& + %dper residue)\n", smax, PINSO, PINS1); if (endgaps) i)>rintf(fx, '<endgaps penalized. left endgap: 9td %s*s, right endgap: %d %s%s\n”, firstgap, (dna)? "base": “residue”, (firstgap == 1)? lastgap, (dna)? "base": “residue", (lastgap == 1)? ” : "s”): else fprmtf(íx, ”<endgaps not penalizedtn"); static static static static Static static static char static char static char static char nm; lmax;m\ nc(2]; ni[2); siz(2]; •psPl;VPl; out(2][P_LINE]; star[P_LINE): /* matches in core - for checking */ )* lengths of slripped file names */ /* jmp index for a path */ /* numbcr at start of current Une */ I* current elem mimber - for gapping */ /* ptr to current element */ /* ptr to next output char slot */ /* output line */ /* set by starsQ */ /* * print alignment of described in Street path ppQ */ static pr alignO Γ int nn; /* char count */ int more; register i; for (i = 0, lmax = 0; i < 2; i++) { nn = 5tripname(namex[i]); if (nn > lmax) lmax = nn; ne[i) = 1; ni[i] = 1; sizfij = ij[i] = 0; psp] *=> seqx[i]; po[i) = out(i];} pr_align 34
ΕΡ 1 607 402 /PT ...pralign for (nn = nm = 0, more = 1; more;) { for (i = more = 0; i < 2; i++) { /* * do we havc more of this sequence?
V if(!*ps[i]) continue; more++; if (pp[i] .spc) { /* lecding space *1 *po[i]4 4 = ’ ppfl.spc-; } élse if (siz[i]) { /* in a gap */ *po[i]++- = sizfl]-; > else { /*we'reputtmga scqelcmeni */ *po['] = *ps[>);
IfOslOwerf^psti])) *ps[ij = toupper(*ps[i]); po(H + +; ps(i]4+; /* * are we at next gap for this seq? */ if (nifi) = = pp[i].x[ij[il]> { /* * we need to merge all gaps * at this iocation */ sii[i] = pp[i].n[ij[i] + +J; while (nifij == pp[i].x[ijí'H) sii[i) 4 = pp[i].n[ij[i]++); } ni[i| + +; } 5 ir(++nn == olsn 11 Imore && nn) { dumpblockO; for(i = 0; i < 2; i++) po|i] — out[i}; nn = 0; í } /* * dump a block of tines, induding numbers, stars: pr alignO */ static dumpblock
dumpblockO { register i; for (i = 0; i < 2; i++) *po[i]~ = '\o'; 35
ΕΡ 1 607 402 /PT ...durapblock (vold) pu!c('\n', fx); for (i = 0; i < 2; i+ +) { lf (*out[i) && (*out[i) !» " 11 *(po[i]) !='’)){ if (i = = 0) nums(i); if (i = = 0&&*out[lj) starsOi putline(i); if (i = = 0 && *oui[l)) fprintfffx, sLar); if(i==i) mims(Í); } } } /·
* put out a numbcr line: dumpblockO */ static nums(ix) □ums 1 int ΐχ; /* index in outQ holding seq line */ l char nltne[P_LINE]; rcgisíer j; regfster char *pn, *px, *py; for (pn = nline, i ; = 0; i < lmax+P__SPC; i+-r, pn+-r) *pn ® ' ' ; for (i * nc[ix], py = out[ix); *py; py++, pn++) { lf(‘py = = ' 'll*py == rpn = 1 else { if(i%10==0 || (i == 1 && nc[ix] != 1)){ j = (i < 0)? -i: i; for (px - pn; j; j /= 10, px--) *px = j%10 + '0'; if fi < 0) *px = } elsc *pn = ’ > } *pn = '\0'; ncfixj = i; for (pn = nline; *pn; pn++) (void) putc(*pn, fx); (void)putc('\n', fx); } /*
* put out a line (name, [num), seq, [num]): dumpblocltO V startc pmline(ix) putline int ix; { 36
ΕΡ 1 607 402 /PT ...putline int i; register char *px; for (px = namex[ix], i = 0; *px && *px px+ +, i+ +) (void) putc(*px, fx); for (; i < lraax+P_SPC; i++) (void) putc(' fx); /* these count from 1: * niO is current element (from 1) * ncQ is number at siart of curtem line *1 for (px = oul[ix); *px; px++) (void) putc(*px&0x7F, fx); (void) putc('\n', fx); } /* * pui a line of stars (seqs always in out[0), oul[l]): dumpblockO *1 static starsO stars { int i; register char *p0, *pl, cx, *px; if (!*out(0] 11 (*out[0] =="&& *(po[0]) == ") 11 !*ouitl] 11 (*out[l] ==’*&& *(po[l}) = ='*)) returti; px = star; for (i = imax+P SPC; i;»~) *px+ + = ' for (p0 = out[0], pl = oul[l]; *pO && *pl; p0+ + , pl + +) { iF (isaIpha(*pO) &&. isalpha(+pl)) { ΙΓ (xbm[*pO-,A'I&xbm[*pl-'A']) { cx = **'; nm+ +; } else iF (!dna && _day[*pO-,A‘l[*pl-'A'] > 0) cx * else CX e ’ } else cx = ' *px++ = cx; } *px+ + = V; *px = '\0'; } I·
* strip path or prefix from pn, return len; pralignO V static stripname strip name(pn) char *pn; I* file name (may be path) */ { register char *px, *py; py =0; for (px = pn; *px; px+ +) if (*px == T) py = px + 1; if(py) (void) strcpy(pn, py); return(strlen(pn)); }
37 ΕΡ 1 607 402 /PT ι· * cleanupO - cleanup any unp file * getseqO - read in seq, set dna, len. maxlen * g callocO - callocO with error chcckin * readjmpsO - get the good jmps, from tmp file if necessary * writejmpsO - wri(6 a fiiled array of jmps lo a tmp file: tiwO */ íinclude "nw.h" #mcludc <sys/file.h> .l._ _ w ww··. LUlU 'Jlldilic — / ιιιψι IIUmgA-tV/W\/WV , FILE *lj; int cleanupO; long IseekO, /* * remove any tmp file if we blow */ cleanup(i) int i;{ (void) unlinkOname); exit(i).} /* cleanup tmp file */ cleanup /* * read, return plr (o seq, set dna, len, maxlen φ skip lines staning with or '>’ * seq in upper or lower case *1 char *
getseq(file, len) char ♦file; int *len;{ char registcr char Int FILE /* file name */ /* seq len */ line(l024], *pseq;*ρχ, *py; natgc, tlen; ♦fp; getseq if ((fp = fopen(file, "r")) == 0) { fprintf(slderr,"»s: can't read %s\n”, prog, file); exil(l);} tlen = natgc - 0; whiie (ígeis(iinc, 1024, fp)) { if (*line == V j | *line == ' <' | j *line == '>') continue; for (px = line; ®px != '\n'; px++) if (isupper(*px) || islower(*px)) if ((pseq = malloc((unsÍgned)(tlen+6))) = = 0) { fprintf(stdetT,"®s: mallocO failed to get %d bytes for %s\n", prog, tlen+6, file); exit(l); } pseq [0] = pseq[l] = pseq [2) = pseq [3) = '10'; 38
ΕΡ 1 607 402 /PT ...getseq py = pseq + 4; *len = tlen; rewind(fp); while (fgels(line, 1024, (p)) { if(*lifle == || *line =»'<' 11 *line == '>') continue; for (px = line; *px != ’\n'; px++) { if (isupper(*px)) *py+ + — *px; elsc if (islower(*px)) *py++ = loupper(*px); if (index("ATGCU",*(py-I))) natgc++; > } *py++ = ’\0'; *py = '\0‘; (void) ftlose(ip); doa = natgc > (tlen/3); return(pseq+4); } g_caUoc char * gjalloc(msg, nx, sz) char *msg; /* program, calling routine *i int nxT sz; í* numbcr and size of elemenls */ { char *px. *eallocO; nx, sz); if ((px = calloc((unsigned)nx, (unsigned)sz)) = = 0) { if (*msg) { fprintf(stderr, "%s: gcallocO failed Ss (o=%d, si=%d)\n\ prog, msg, exii(l); } } reíurn(px); } /* * gei fina! jmps írorn dxQ onp file, sei ppQ, reset õinax: mainQ */ readjmps
readjmpsO { int fd — -1; int sír, iO, il; register i, j, xx:
If (6) { (void) fclose(fj); if ((fd = open(jnaine, 0_RD0NLY, 0)) < 0) { fprintf(stderr, ”Ss: can'topen0 %s\n“, prog, jname); cleanup(l); } } for (i = iO = il = 0. dmaxO = dmax, xx = ienO;; i+ +) { while (1) { for (| = dx[dmax].ijmp; j > = 0 && dx[dmax).jp.xD] > = xx; j~) 39
39 ΕΡ 1 607 402 /PT ...readjmps if (j < O && dx[dmax].offsci && (j) { (void) lseek(fd, dx[dmax].offset, 0); (vold) read(fd. (char *)&dx[dmax].jp, sizeof(struci jrap)); (void) read(fd, (char *)&dx[dinax].offset, sizeof(dx[dmax).offset)); dx[dmax].ijmp = MAXIMP-1; } cise break; } lf(i > = JMPS){ (prinrf(stderr, "%s: too many gaps in alignmentln", prog); cleanup(l); } if(j > = 0) { siz = dx(draax).jp.n[j]; xx = dx(dmax].jp.x[jj; droax + = siz; if (siz < 0) { /* gap in second seq */ pp[l).n[il] = -siz; xx + = siz;
/* id = xx - yy + leni -1 V pp[l].x(íl] = xx - dmax + leni -1; gapy++; ngapy -= siz; I* ignore MAXGAP when doing endgaps */ siz = ( siz < MAXGAP 11 endgaps)? -siz : MAXGAP; il + + ; } else if (siz > 0) { /* gap in first seq */ pp[0].n[i0] = siz; ρρ[0].χ(ί0] = xx; gapx+ + ; ngapx += siz; I* ignore MAXGAP when doing endgaps */ siz = (siz < MAXGAP 11 endgaps)? siz : MAXGAP; Í0-M-; } } /* reverse the order of jmps */ for (j = 0, i0~; j < iO; j++, i0~) { i - pp[0).n[j]; pp(0].n[i] = pp[0J.n[i0]; pp[0].n(i0] = i; i = PP[0].xD); ppioj.xQ] = pp[0].x[i0]; pp[0].x[i0) = i; } for (j = 0, il—; j < il; j++, íl-) { i = pp[l].nD); pp[l].n[j] = pp[l)-n[il]; ρρ[1).η[ί1) = i; i = pp[l).x[j]; pp[l] x[j] = pp[l) x[il]: = ‘1 } if (fd > = 0) (void) close(fd); 'f (5) { (void) unlink(jname); fi = 0; offset = 0; } 40
ΕΡ 1 607 402 /PT /·
* »rire a filled jmp stroct offset of lhe prev one (if any): nwO •I
wriiejmps(ix) WritejmpS int ix; thar ‘mkiempO; *f 05) { if (raktempOname) < 0) { fprinlf(stdetr. *%s: can't mklempO %s\o". prog. jname); cleanup(l); } if ((fj = fopen(pianie, "w")) == 0) { fprimf(stderr, "%s: can‘t write SsW, prog, jname); cxit(l); } } (void) fwrite((char *)&dx(ix].jp, sUeof(stnicl jmp), 1, fj); (void) fwriie((char *)&dxIix].offset, sizeof(dx[ix].offeet). 1, fj);
Tabela 2A PRO XXXXXXXXXXXXXXX (Comprimento = 15 aminoácidos)
Proteína de comparação XXXXXYYYYYYY (Comprimento = 12 aminoácidos) % de identidade de sequência de aminoácidos = (o número de resíduos de aminoácidos idênticos e na mesma posição entre as duas sequências de polipéptidos tal como determinado por ALIGN-2) a dividir por (o número total de resíduos de aminoácidos do polipéptido PRO) = 5 a dividir por 15 = 33,3%
Tabela 2B PRO XXXXXXXXXX (Comprimento = 10 aminoácidos)
Proteína de comparação XXXXXYYYYYYZZYZ (Comprimento = 15 aminoácidos) % de identidade de sequência de aminoácidos = (o número de resíduos de aminoácidos idênticos e na mesma posição entre as duas sequências de polipéptidos tal como determinado por ALIGN-2) a dividir por (o número total de resíduos de aminoácidos do polipéptido PRO) = 5 a dividir por 10 = 50%
Tabela 2C PRO-ADN NNNNNNNNNNNNNN (Comprimento = 14 nucleótidos) ADN de comparação NNNNNNLLLLLLLLLL - (Comprimento = 16 nucleótidos) % de identidade da sequência de ácido nucleico = (o número de nucleótidos idênticos e na mesma posição entre as duas sequências de ácido nucleico tal como determinado por ALIGN-2) a dividir por (o número total de nucleótidos da sequência de ácido nucleico PRO-ADN) = 6 a dividir por 14 = 42,9% 41
ΕΡ 1 607 402 /PT
Tabela 2D PRO-ADN NNNNNNNNNNNN (Comprimento = 12 nucleótidos) ADN de comparação NNNNLLLW (Comprimento = 9 nucleótidos) % de identidade de sequência de ácido nucleico = (o número de nucleótidos idênticos e na mesma posição entre as duas sequências de ácido nucleico tal como determinado por ALIGN-2) a dividir por (o número total de nucleótidos da sequência de ácido nucleico PRO-ADN) = 4 a dividir por 12 = 33,3%
Define-se "percentagem (%) de identidade de sequência de aminoácidos" relativamente às sequências de polipéptido PRO aqui identificadas, como a percentagem de resíduos de aminoácidos numa sequência candidata que são idênticos aos resíduos de aminoácidos numa sequência PRO após alinhamento de sequências e introdução de hiatos, caso necessário, para atingir a máxima percentagem de identidade de sequências e não considerando quaisquer substituições conservativas como parte da identidade de sequência. O alinhamento com objectivos de determinar a percentagem de identidade de sequência de aminoácidos pode ser obtido de vários modos que se encontram abrangidos pela perícia na especialidade, por exemplo, utilizando programas de computador disponíveis ao público tais como os programas BLAST, BLAST-2, ALIGN, ALIGN-2 ou Megalign (DNASTAR). Os peritos na especialidade podem determinar os parâmetros apropriados para medir o alinhamento, incluindo quaisquer algoritmos necessários para atingir o alinhamento máximo ao longo do comprimento total das sequências em comparação. Para os presentes objectivos, contudo, os valores de % de identidade de sequência de aminoácidos obtêm-se tal como descrito infra utilizando o programa de computador de comparação de sequências ALIGN-2, em que o código de fonte completo para o programa ALIGN-2 é proporcionado na tabela 1. 0 programa de computador de comparação de sequências align-2 tem como autor Genentech, Inc. e o código de fonte apresentado na tabela 1 foi apresentado com documentação para o utilizador no gabinete de direitos de autor dos E.U.A. ("U.S. Copyright Office"), Washington D.C., 20559, onde se encontra registado com o número de registo US Copyright Registration, TXU510087. O programa ALIGN-2 está disponível ao público através de Genentech, Inc., South San Francisco, Califórnia ou pode ser compilado a partir do código de fonte proporcionado na tabela 1. O programa ALIGN-2 deve ser compilado para 42
ΕΡ 1 607 402 /PT utilização num sistema operativo UNIX, de preferência UNIX V4.0D digital. Todos os parâmetros de comparação de sequências são estabelecidos pelo programa ALIGN-2 e não variam.
Para os presentes objectivos, a % de identidade de sequência de aminoácidos de uma determinada sequência de aminoácidos A relativamente, com ou contra uma determinada sequência de aminoácidos B (que pode ser alternativamente denominada como uma determinada sequência de aminoácidos A que apresenta ou inclui uma determinada % de identidade de sequência de aminoácidos relativamente, com ou contra uma determinada sequência de aminoácidos B), calcula-se como se segue:
100 vezes a fracção X/Y em que X é o número de resíduos de aminoácidos pontuados como correspondências idênticas pelo programa de alinhamento de sequências align-2 no alinhamento efectuado por esse programa de A e B e em que Y é o número total de resíduos de aminoácidos em B. Considerar-se-á que nos casos em que o comprimento da sequência de aminoácidos A não é igual ao comprimento da sequência de aminoácidos B, a % de identidade de sequência de aminoácidos de A relativamente a B não será igual à % de identidade de sequência de aminoácidos de B relativamente a A. Como exemplos de cálculos de % de identidade de sequência de aminoácidos, as tabelas 2A-2B demonstram como calcular a % de identidade de sequência de aminoácidos da sequência de aminoácidos designada "proteína de comparação" relativamente à sequência de aminoácidos designada "PRO".
Salvo especificado em contrário, todos os valores de % de identidade de sequência de aminoácidos aqui utilizados são obtidos e descritos como descrito supra utilizando o programa de computador de comparação de sequências ALIGN-2. Contudo, a % de identidade de sequência de aminoácidos pode também ser determinada utilizando o programa de comparação de sequências NCBI-BLAST2 (Altschul et ai., Nucleic Acids Res., 25:3389-3402 (1997)). O programa de comparação de sequências NCBI-BLAST2 pode ser obtido em http://www.ncbi.nlm.nih.gov. NCBI-BLAST2 utiliza vários parâmetros de busca, em que todos esses 43
ΕΡ 1 607 402 /PT parâmetros de busca estão estabelecidos em valores por defeito incluindo, por exemplo, "unmask = yes", "strand = all", "expected occurrences = 10", "minimum low complexity length = 15/5", "multi-_pass e-_value = 0.01", "constant for multi-_pass = 25", "dropoff for final gapped alignment = 25" e "scoring matrix = BLOSUM62".
Nas situações em que se utiliza NCBI-BLAST2 para comparações de sequências de aminoácidos, a % de identidade de sequência de aminoácidos de uma determinada sequência de aminoácidos A relativamente, com ou contra uma determinada sequência de aminoácidos B (que pode ser alternativamente denominada como uma determinada sequência de aminoácidos A que apresenta ou inclui uma determinada % de identidade de sequência de aminoácidos relativamente, com ou contra uma determinada sequência de aminoácidos B), calcula-se como se segue:
100 vezes a fracção X/Y em que X é o número de resíduos de aminoácidos pontudos como correspondências idênticas pelo programa de alinhamento de sequências NCBI-BLAST2 no alinhamento efectuado por esse programa de A e B e em que Y é o número total de resíduos de aminoácidos em B. Considerar-se-á que nos casos em que o comprimento da sequência de aminoácidos A não é igual ao comprimento da sequência de aminoácidos B, a % de identidade de sequência de aminoácidos de A relativamente a B não será igual à % de identidade de sequência de aminoácidos de B relativamente a A.
Adicionalmente, a % de identidade de sequência de aminoácidos pode também ser determinada utilizando o programa de computador WU-BLAST-2 (Altschul et al., Methods in Enzymology, 266:460-480 (1996)). A maioria dos parâmetros de busca WU-BLAST-2 são estabelecidos em valores por defeito. Os parâmetros não estabelecidos em valores por defeito, ou seja, os parâmetros ajustáveis, são colocados nos seguintes valores: "overlap span = 1", "overlap fraction = 0.125", "word threshold (T) =11", e "scoring matrix = BLOSUM62". Para os presentes objectivos, o valor da % de identidade de sequência de aminoácidos é determinado pela divisão de (a) o número de 44
ΕΡ 1 607 402 /PT resíduos de aminoácidos com correspondência idêntica entre a sequência de aminoácidos do polipéptido PRO de interesse apresentando a sequência derivada do polipéptido PRO nativo e a sequência de aminoácidos de interesse de comparação (ou seja, a sequência contra a qual se está a comparar o polipéptido PRO de interesse que pode ser um polipéptido PRO variante) tal como determinado por WU-BLAST-2, por (b) o número total de resíduos de aminoácidos do polipéptido PRO de interesse. Por exemplo, na expressão "um polipéptido incluindo uma sequência de aminoácidos A que apresenta ou apresentando pelo menos 80% de identidade de sequência de aminoácidos relativamente à sequência de aminoácidos B", a sequência de aminoácidos A é a sequência de aminoácidos de comparação de interesse e a sequência de aminoácidos B é a sequência de aminoácidos do polipéptido PRO de interesse. "Variante de polipéptido PRO" ou "sequência de ácido nucleico de variante de PRO" significam uma molécula de ácido nucleico que codifica um polipéptido PRO activo tal como definido adiante e que possui pelo menos cerca de 80% de identidade de sequência de ácido nucleico com uma sequência de ácido nucleico que codifica uma sequência de um polipéptido PRO de sequência nativa de comprimento completo como aqui se descreve, uma sequência de um polipéptido PRO de sequência nativa de comprimento completo a que falta o péptido de sinal como aqui se descreve, um domínio extracelular de um polipéptido PRO, com ou sem o péptido de sinal, como aqui se descreve ou qualquer outro fragmento de uma sequência de um polipéptido PRO de comprimento completo como aqui se descreve. Vulgarmente, um polinucleótido variante PRO terá pelo menos cerca de 80% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 81% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 82% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 83% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 84% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 85% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 86% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 87% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos 45
ΕΡ 1 607 402 /PT cerca de 88% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 89% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 90% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 91% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 92% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 93% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 94% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 95% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 96% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 97% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 98% de identidade de sequência de ácido nucleico e ainda mais preferivelmente pelo menos cerca de 99% de identidade de sequência de ácido nucleico com a sequência de ácido nucleico que codifica uma sequência de um polipéptido PRO de sequência nativa de comprimento completo como aqui se descreve, uma sequência de um polipéptido PRO de sequência nativa de comprimento completo a que falta o péptido de sinal como aqui se descreve, um domínio extracelular de um polipéptido PRO, com ou sem a sequência de sinal, como aqui se descreve ou qualquer outro fragmento de uma sequência de um polipéptido PRO de comprimento completo como aqui se descreve. As variantes não abrangem a sequência nucleotídica nativa.
Vulgarmente, os polinucleótidos variantes PRO têm pelo menos cerca de 30 nucleótidos de comprimento, frequentemente pelo menos cerca de 60 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 90 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 120 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 150 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 180 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 210 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 240 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 270 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 300 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 450 nucleótidos de 46
ΕΡ 1 607 402 /PT comprimento, mais frequentemente pelo menos cerca de 600 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 900 nucleótidos de comprimento, ou mais. A "percentagem (%) de identidade de sequência de ácido nucleico" relativamente às sequências de ácidos nucleicos que codificam o polipéptido PRO aqui identificadas, define-se como a percentagem de nucleótidos numa sequência candidata que é idêntica aos nucleótidos numa sequência de ácido nucleico que codifica um polipéptido PRO após alinhamento de sequências e introdução de hiatos, caso necessário, para obter a percentagem máxima de identidade de sequência. O alinhamento com objectivos de determinar a percentagem de identidade de sequência de ácido nucleico pode ser conseguido de vários modos que se encontram abrangidos pela perícia na especialidade, por exemplo, utilizando os programas de computador disponíveis ao público tais como os programas BLAST, BLAST-2, ALIGN, ALIGN-2 ou Megalign (DNASTAR). Os peritos na especialidade podem determinar os parâmetros apropriados para medir o alinhamento incluindo quaisquer algoritmos necessários para obter o alinhamento máximo ao longo do comprimento total das sequências a comparar. Para os presentes objectivos, contudo, os valores de % de identidade de sequência de ácido nucleico obtêm-se como descrito infra utilizando o programa de computador de comparação de sequências ALIGN-2, em que o código de fonte completo para o programa ALIGN-2 é proporcionado na tabela 1. O programa de computador de comparação de sequências ALIGN-2 tem como autor Genentech, inc. e o código de fonte apresentado na tabela 1 foi apresentado com a documentação para o utilizador no gabinete de direitos de autor dos E.U.A. ("U.S. Copyright Office"), Washington D.C., 20559, onde se encontra registado com o número de registo de US Copyright Registration, TXU510087. O programa ALIGN-2 está disponível ao público através de Genentech, inc., South San Francisco, Califórnia ou pode ser compilado a partir do código de fonte proporcionado na tabela 1. O programa ALIGN-2 deve ser compilado para utilização num sistema operativo UNIX, de preferência UNIX V4.0D digital. Todos os parâmetros de comparação de sequências estão estabelecidos pelo programa ALIGN-2 e não variam. 47
ΕΡ 1 607 402 /PT
Para os presentes objectivos, a % de identidade de sequência de ácido nucleico de uma determinada sequência de ácido nucleico C relativamente, com ou contra uma determinada sequência de ácido nucleico D (que pode ser alternativamente denominada como uma determinada sequência de ácido nucleico C que apresenta ou inclui uma determinada % de identidade de sequência de ácido nucleico relativamente, com ou contra uma determinada sequência de ácido nucleico D), calcula-se como se segue:
100 vezes a fracção W/Z em que W é o número de nucleótidos pontuados como correspondências idênticas pelo programa de alinhamento de sequências ALIGN-2 no alinhamento efectuado por esse programa de C e D e em que Z é o número total de nucleótidos em D. Considerar-se-á que nos casos em que o comprimento da sequência de ácido nucleico C não é igual ao comprimento da sequência de ácido nucleico D, a % de identidade de sequência de ácido nucleico de C relativamente a D não será igual à % de identidade de sequência de ácido nucleico de D relativamente a C. Como exemplos de cálculo da % de identidade de sequência de ácido nucleico, as tabelas 2C-2D demonstram como calcular a % de identidade de sequência de ácido nucleico da sequência de ácido nucleico designada como "ADN de comparação" relativamente à sequência de ácido nucleico designada como "PRO-ADN".
Salvo especificado em contrário, todos os valores de % de identidade de sequência de ácido nucleico aqui utilizados são obtidos como descrito supra utilizando o programa de computador de comparação de sequências ALIGN-2. Contudo, a % identidade de sequência de ácido nucleico pode também ser determinada utilizando o programa de comparação de sequências NCBI-BLAST2 (Altschul et al., Nucleic Acids Res., 25:3389-3402 (1997)). O programa de comparação de sequências NCBI-BLAST2 pode ser obtido de http://www.ncbi.nlm.nih.gov. NCBI-BLAST2 utiliza vários parâmetros de busca, em que todos esses parâmetros de busca estão estabelecidos em valores por defeito incluindo, por exemplo, "unmask = yes", "strand = all", "expected occurrences =10", "minimum low complexity length =15/5", "multi-_pass e-_value = 0.01", "constant for multi- 48
ΕΡ 1 607 402 /PT _pass = 25", "dropoff for final gapped alignment = 25" e "scoring matrix = BLOSUM62".
Nas situações em que se utiliza NCBI-BLAST2 para comparações de sequências, a % de identidade de sequência de ácido nucleico de uma dada sequência de ácido nucleico C relativamente, com ou contra uma determinada sequência de ácido nucleico D (que pode ser alternativamente denominada como uma determinada sequência de ácido nucleico C que apresenta ou inclui uma determinada % de identidade de ácidos nucleicos relativamente, com ou contra uma determinada sequência de ácido nucleico D) calcula-se como se segue:
100 vezes a fracção W/Z em que W é o número de nucleótidos pontuados como correspondências idênticas pelo programa de alinhamento de sequências NCBI-BLAST2 no alinhamento efectuado por esse programa de C e D e em que Z é o número total de nucleótidos em D. Considerar-se-á que nos casos em que o comprimento da sequência de ácido nucleico C não é igual ao comprimento da sequência de ácido nucleico D, a % de identidade de ácidos nucleicos de C relativamente a D não será igual à % de identidade de sequência de ácido nucleico de D relativamente a C.
Adicionalmente, os valores de % de identidade de sequência de ácido nucleico podem também ser determinados utilizando o programa de computador WU-BLAST-2 (Altschul et al., Methods in Enzymology, 266:460-480 (1996)). A maioria dos parâmetros de busca WU-BLAST-2 são estabelecidos em valores por defeito. Os parâmetros não colocados em valores por defeito, ou seja, os parâmetros ajustáveis, são estabelecidos nos seguintes valores: "overlap span = 1", "overlap fraction = 0.125", "word threshold (T) = 11" e "scoring matrix = BLOSUM62". Para os presentes objectivos, o valor da % de identidade de sequência de ácido nucleico é determinado por divisão de (a) o número de nucleótidos com correspondência idêntica entre a sequência de ácido nucleico da molécula de ácidos nucleicos que codifica o polipéptido PRO de interesse apresentando uma sequência derivada dos ácidos nucleicos que codificam a sequência do polipéptido PRO nativo e a comparação da molécula de ácido 49
ΕΡ 1 607 402 /PT nucleico de interesse (ou seja, a sequência contra a qual se está a comparar a molécula de ácido nucleico que codifica o polipéptido PRO de interesse que pode ser um polinucleótido PRO variante) tal como determinado por WU-BLAST-2, por (b) o número total de nucleótidos da molécula de ácido nucleico que codifica o polipéptido PRO de interesse. Por exemplo, na expressão "uma molécula de ácido nucleico isolada incluindo uma sequência de ácido nucleico A que apresenta ou apresentando pelo menos 80% de identidade de sequência de ácido nucleico com a sequência de ácido nucleico B", a sequência de ácido nucleico A é a molécula de ácido nucleico de interesse de comparação e a sequência de ácido nucleico B é a sequência de ácido nucleico da molécula de ácido nucleico que codifica o polipéptido PRO de interesse.
Noutras concretizações, os polinucleótidos PRO variantes são moléculas de ácido nucleico que codificam um polipéptido PRO activo e que são capazes de hibridar, de preferência sob condições de hibridação e lavagem rigorosas, com sequências de nucleótidos que codificam o polipéptido PRO de comprimento completo apresentado na figura 2 (SEQ ID NO:2). Os polipéptidos PRO variantes podem ser aqueles que são codificados por um polinucleótido PRO variante. A expressão "positivos", no contexto de comparações de identidade de sequência de aminoácidos efectuadas como descrito supra, inclui resíduos de aminoácidos nas sequências comparadas que são, não apenas idênticos, mas também aqueles que apresentam propriedades semelhantes. Os resíduos de aminoácido que pontuam um valor positivo com um resíduo de aminoácido de interesse são aqueles que são quer idênticos ao resíduo de aminoácido de interesse quer uma substituição preferida (tal como definido na tabela 3 infra) do resíduo de aminoácido de interesse.
Para os presentes objectivos, o valor de % de positivos de uma determinada sequência de aminoácidos A relativamente, com ou contra uma determinada sequência de aminoácidos B (que pode ser alternativamente denominada como uma determinada sequência de aminoácidos A que apresenta ou inclui uma determinada % de positivos relativamente, com ou contra uma determinada sequência de aminoácidos B), calcula-se como se segue: 50
ΕΡ 1 607 402 /PT
100 vezes a fracção X/Y em que X é o número de resíduos de aminoácidos pontuados como um valor positivo tal como definido supra pelo programa de alinhamento de sequências ALIGN-2 no alinhamento efectuado por esse programa de A e B e em que Y é o número total de resíduos de aminoácidos em B. Considerar-se-á que nos casos em que o comprimento da sequência de aminoácidos A não é igual ao comprimento da sequência de aminoácidos B, a % de positivos de A relativamente a B não será igual à % de positivos de B relativamente a A. "Isolados", quando utilizado para descrever os diferentes polipéptidos aqui revelados, significa um polipéptido que foi identificado e separado e/ou recuperado de uma componente do seu ambiente natural. De preferência, o polipéptido isolado está isento de qualquer associação com todas as componentes com as quais se encontra naturalmente associado. As componentes contaminantes do seu ambiente natural são materiais que interfeririam tipicamente com utilizações em diagnóstico ou terapêuticas para o polipéptido e podem incluir enzimas, hormonas e outros solutos proteináceos ou não proteináceos. Em concretizações preferidas, o polipéptido será purificado (1) até um grau suficiente para obter pelo menos 15 resíduos da sequência de aminoácidos N-terminais ou internos por utilização de um sequenciador de copo rotativo, ou (2) até à homogeneidade por SDS-PAGE sob condições não redutoras ou redutoras utilizando coloração com azul de Coomassie ou, de preferência, com prata. O polipéptido isolado inclui polipéptido in situ no interior de células recombinantes, dado que não estará presente pelo menos uma componente do ambiente natural de PRO. Habitualmente, contudo, o polipéptido isolado será preparado através de pelo menos uma etapa de purificação.
Uma molécula de ácido nucleico "isolada" que codifica um polipéptido PRO ou uma molécula de ácido nucleico "isolada" que codifica um anticorpo anti-PRO, é uma molécula de ácido nucleico que é identificada e separada de pelo menos uma molécula de ácido nucleico contaminante com a qual se encontra habitualmente associada na origem natural dos ácidos nucleicos 51
ΕΡ 1 607 402 /PT que codificam PRO ou dos ácidos nucleicos que codificam o anti-PRO. De preferência, os ácidos nucleicos isolados
encontram-se isentos de associação com todas as componentes com as quais se encontram naturalmente associados. Uma molécula de ácido nucleico que codifica PRO isolado ou uma molécula de ácido nucleico que codifica um anti-PRO encontra-se numa forma ou ambiente distinto dos encontrados na natureza. As moléculas de ácido nucleico isoladas distinguem-se portanto da molécula de ácido nucleico que codifica PRO ou da molécula de ácido nucleico que codifica anti-PRO tal como ocorre em células naturais. Contudo, uma molécula de ácido nucleico isolada que codifica um polipéptido PRO ou um anticorpo anti-PRO inclui moléculas de ácido nucleico PRO e moléculas de ácido nucleico anti-PRO contidas em células que habitualmente expressam polipéptidos PRO ou expressam anticorpos anti-PRO em que, por exemplo, a molécula de ácido nucleico ocorre numa localização cromossómica diferente da das células naturais. A expressão "sequências de controlo" refere-se a sequências de ADN necessárias para a expressão de uma sequência de codificação ligada operativamente num organismo hospedeiro especifico. As sequências de controlo que são adequadas para procariotas, por exemplo, incluem um promotor, opcionalmente uma sequência de operador e um local de ligação ao ribossoma. Sabe-se que as células eucarióticas utilizam promotores, sinais de poliadenilação e potenciadores. O ácido nucleico encontra-se "ligado operativamente" quando está colocado numa relação funcional com outra sequência de ácido nucleico. Por exemplo, o ADN para uma pré-sequência ou um comando de excreção encontra-se ligado operativamente ao ADN para um polipéptido se é expresso como uma pré-proteina que participa na excreção do polipéptido; um promotor ou potenciador encontra-se ligado operativamente a uma sequência de codificação se afecta a transcrição da sequência; ou um local de ligação ao ribossoma encontra-se ligado operativamente a uma sequência de codificação se está posicionado de modo a facilitar a tradução. De um modo geral, "ligado operativamente" significa que as sequências de ADN a ser ligadas são contíguas e no caso de um comando de excreção, contíguas e em quadro de leitura. Contudo, os potenciadores 52
ΕΡ 1 607 402 /PT não têm que ser contíguos. A ligação consegue-se por ligação em locais de restrição convenientes. Se tais locais não existirem, os adaptadores ou ligantes de oligonucleótidos sintéticos são utilizados de acordo com a prática convencional. A expressão "anticorpo" utiliza-se no seu sentido mais abrangente e abrange especificamente, por exemplo, anticorpos monoclonais anti-PR05775 simples (incluindo anticorpos antagonistas e neutralizantes), composições de anticorpo anti-PR05775 com especificidade poliepitópica, anticorpos anti-PR05775 de cadeia simples e fragmentos de anticorpos anti-PR05775 (consultar infra). A expressão "anticorpo monoclonal" tal como aqui utilizada refere-se a um anticorpo obtido de uma população de anticorpos substancialmente homogénea, ou seja, os anticorpos individuais que constituem a população são idênticos excepto relativamente a possíveis mutações de ocorrência natural que podem estar presentes em quantidades insignificantes. O "rigor" das reacções de hibridação é facilmente determinado pelo perito na especialidade e geralmente é um cálculo empírico dependente do comprimento da sonda, temperatura de lavagem e concentração de sal. De um modo geral, sondas mais longas requerem temperaturas mais elevadas para hibridação adequada, enquanto que sondas mais curtas necessitam de temperaturas mais baixas. A hibridação geralmente depende da capacidade do ADN desnaturado tornar a hibridar com cadeias complementares que estão presentes num ambiente abaixo da sua temperatura de fusão. Quanto maior o grau de homologia pretendida entre a sonda e a sequência a hibridar, maior a temperatura relativa que pode ser utilizada. Em resultado, temperaturas relativas mais altas tenderão a tornar as condições reaccionais mais rigorosas, enquanto que temperaturas mais baixas fazem-no em menor escala. Para detalhes adicionais e explicação do rigor das reacções de hibridação, consultar Ausubel et al., Current Protocols in Molecular Biology, Wiley Interscience Publishers, (1995). "Condições rigorosas" ou "condições altamente rigorosas", tal como aqui definidas, podem ser identificadas como aquelas que (1) utilizam força iónica baixa e temperatura elevada para 53
ΕΡ 1 607 402 /PT lavagem, por exemplo cloreto de sódio 0,015 M/citrato de sódio 0,0015 M/dodecilssulfato de sódio a 0,1% a 50°C; (2) utilizam durante a hibridação um agente desnaturante, tal como formamida, por exemplo, formamida a 50% (v/v) com albumina sérica bovina a 0,1%/Ficoll a 0,1%/polivinilpirrolidona a 0,1%/tampão de fosfato de sódio 50 mM a pH 6,5 com cloreto de sódio 750 mM, citrato de sódio 75 mM a 42°C; ou (3) utilizam formamida a 50%, SSC 5x (NaCl 0,75 M, citrato de sódio 0, 075 M), fosfato de sódio 50 mM (pH 6,8), pirofosfato de sódio a 0,1%, solução de Denhardt 5x, ADN de esperma de salmão tratado com ultra-sons (50 pg/ml), SDS a 0,1% e sulfato de dextrano a 10% a 42°C, com lavagens a 42°C com SSC 0,2x (cloreto de sódio/citrato de sódio) e formamida a 50% a 55°C, seguido por uma lavagem de rigor elevado consistindo em SSC 0,lx contendo EDTA a 55°C. "Condições moderadamente rigorosas" podem ser identificadas como descrito por Sambrook et al., Molecular Cloning: A Laboratory Manual, New York: Cold Spring Harbor Press, 1989 e incluem a utilização de solução de lavagem e condições de hibridação (por exemplo, temperatura, força iónica e % de SDS) menos rigorosas que as descritas supra. Constitui um exemplo de condições moderadamente rigorosas a incubação durante a noite a 37°C numa solução contendo: formamida a 20%, SSC 5x (NaCl 150 mM, citrato trissódico 15 mM), fosfato de sódio 50 mM (pH 7,6), solução de Denhardt 5x, sulfato de dextrano a 10% e ADN de esperma de salmão cortado e desnaturado a 20 mg/ml, seguido de lavagem dos filtros com SSC lx a cerca de 35°C-50°C. O perito na especialidade reconhecerá como ajustar a temperatura, a força iónica, etc. conforme necessário para acomodar factores tais como comprimento da sonda e semelhantes. A expressão "marcado com epítopo" quando aqui utilizada refere-se a um polipéptido quimérico incluindo um polipéptido PR05775 fundido a um "polipéptido marcador". O polipéptido marcador tem resíduos suficientes para proporcionar um epítopo contra o qual pode ser desenvolvido um anticorpo, mas é suficientemente curto de modo a não interferir com a actividade do polipéptido com o qual se encontra fundido. O polipéptido marcador é de preferência também geralmente único de modo a que o anticorpo não apresente reactividade cruzada 54
ΕΡ 1 607 402 /PT substancial com outros epítopos. Geralmente os polipéptidos marcadores têm pelo menos seis resíduos de aminoácidos e têm geralmente entre cerca de 8 a 50 resíduos de aminoácidos (de preferência, entre cerca de 10 a 20 resíduos de aminoácidos). "Activo" ou "actividade" para os presentes objectivos refere-se a forma(s) do polipéptido PR05775 que retêm uma actividade/propriedade biológica e/ou imunológica de um polipéptido PR05775 nativo ou de ocorrência natural, em que actividade "biológica" se refere a uma função (quer de inibição quer de estimulação) causada por um polipéptido PR05775 nativo ou de ocorrência natural diferente da capacidade para induzir a produção de um anticorpo contra um epítopo antigénico apresentado por um polipéptido PR05775 nativo ou de ocorrência natural e uma actividade "imunológica" refere-se à capacidade de induzir a produção de um anticorpo contra um epítopo antigénico apresentado por um polipéptido PR05775 nativo ou de ocorrência natural. "Actividade biológica" no contexto de um anticorpo ou outra molécula antagonista que pode ser identificada pelos ensaios de rastreio aqui revelados (por exemplo, uma molécula pequena orgânica ou inorgânica, péptido, etc.) utiliza-se para referir a capacidade de tais moléculas ligarem ou se complexarem com os polipéptidos codificadas pelos genes amplificados aqui identificados, ou que interfere de outro modo com a interacção dos polipéptidos codificados com outras proteínas celulares ou interfere de outro modo com a transcrição ou tradução de um polipéptido PR05775. Constitui uma actividade biológica preferida a inibição do crescimento de uma célula tumoral alvo. Constitui outra actividade biológica preferida a actividade citotóxica que resulta na morte de uma célula tumoral alvo. A expressão "actividade biológica" no contexto de um polipéptido PR05775 significa a capacidade de um polipéptido PR05775 induzir crescimento celular neoplásico ou crescimento celular descontrolado. A expressão "actividade imunológica" significa reactividade cruzada imunológica com pelo menos um epítopo de um polipéptido PR05775. 55
ΕΡ 1 607 402 /PT "Reactividade imunológica cruzada" tal como aqui utilizada significa que o polipéptido candidato é capaz de inibir competitivamente a actividade biológica qualitativa de um polipéptido PR05775 apresentando esta actividade, com anti-soros policlonais desenvolvidos contra o polipéptido PR05775 activo conhecido. Tais anti-soros preparam-se de modo convencional por injecção de cabras ou coelhos, por exemplo, por via subcutânea com o análogo activo conhecido em adjuvante completo de Freund seguido de injecção intraperitoneal ou subcutânea de reforço em meio incompleto de Freund. A reactividade cruzada imunológica é de preferência "especifica", o que significa que a afinidade de ligação da molécula que apresenta reactividade cruzada imunológica (por exemplo, anticorpo) identificada, relativamente ao polipéptido PR05775 correspondente, é significativamente superior (de preferência pelo menos cerca de 2 vezes, com maior preferência pelo menos cerca de 4 vezes, ainda com maior preferência pelo menos cerca de 8 vezes, com a maior preferência pelo menos cerca de 10 vezes mais elevada) do que a afinidade de ligação dessa molécula relativamente a qualquer outro polipéptido nativo conhecido. A expressão "antagonista" utiliza-se no sentido mais abrangente e inclui qualquer molécula que bloqueia, inibe ou neutraliza parcial ou completamente uma actividade biológica de um polipéptido PR05775 nativo aqui revelado ou a sua transcrição ou tradução. Constituem especificamente moléculas antagonistas, entre outras, anticorpos antagonistas ou fragmentos de anticorpos antagonistas, fragmentos antagonistas, péptidos antagonistas, moléculas orgânicas pequenas, ácidos nucleicos anti-sentido antagonistas, etc.
Define-se aqui uma "molécula pequena" como apresentando um peso molecular inferior a cerca de 500 Dalton. "Anticorpos" (Ab) e "imunoglobulinas" (Ig) são glicoproteinas apresentando as mesmas características estruturais. Enquanto que os anticorpos apresentam especificidade de ligação a um antigénio especifico, as imunoglobulinas incluem tanto anticorpos como outras moléculas do tipo dos anticorpos que são isentas de especificidade antigénica. Os polipéptidos deste último tipo são, por 56
ΕΡ 1 607 402 /PT exemplo, produzidos a níveis reduzidos pelo sistema linfático e a níveis aumentados pelos mielomas. A expressão "anticorpo" é utilizada no seu sentido mais lato e abrange especificamente, entre outros, anticorpos monoclonais intactos, anticorpos policlonais, anticorpos multiespecíficos (por exemplo, anticorpos biespecíficos) formados a partir de pelo menos dois anticorpos intactos e fragmentos de anticorpo desde que apresentem a actividade biológica pretendida. "Anticorpos nativos" e "imunoglobulinas nativas" são habitualmente glicoproteínas heterotetraméricas com cerca de 150 000 dalton, compostas por duas cadeias leves (L) idênticas e duas cadeias pesadas (H) idênticas. Cada cadeia leve encontra-se ligada a uma cadeia pesada por uma ligação dissulfureto covalente, sendo que o número de ligações dissulfureto varia entre as cadeias pesadas de diferentes isotipos de imunoglobulinas. Cada cadeia pesada e leve apresenta igualmente pontes de dissulfureto regularmente espaçadas. Cada cadeia pesada apresenta numa das extremidades um domínio variável (VH) seguido por vários domínios constantes. Cada cadeia leve apresenta um domínio variável (Vi) numa das extremidades e um domínio constante na sua outra extremidade; o domínio constante da cadeia leve está alinhado com o primeiro domínio constante da cadeia pesada e o domínio variável da cadeia leve está alinhado com o domínio variável da cadeia pesada. Pensa-se que determinados resíduos de aminoácidos formam uma interface entre os domínios variáveis de cadeia leve e de cadeia pesada. A expressão "variável" refere-se ao facto de determinadas partes dos domínios variáveis apresentarem grandes diferenças de sequência entre anticorpos e serem utilizadas na ligação e especificidade de cada anticorpo em particular relativamente ao seu antigénio específico. Contudo, a variabilidade não se encontra uniformemente distribuída ao longo dos domínios variáveis dos anticorpos. Encontra-se concentrada em três segmentos denominados regiões determinantes da complementaridade (CDR) ou regiões hipervariáveis tanto nos domínios variáveis de cadeia leve como de cadeia pesada. As partes mais altamente conservadas dos domínios variáveis denominam-se regiões de esqueleto (FR). Cada um dos domínios variáveis das cadeias pesada e leve nativas inclui quatro 57
ΕΡ 1 607 402 /PT regiões FR, que adoptam de um modo geral uma configuração em folha β ligadas por três CDR que formam ansas que ligam a estrutura em folha β e nalguns casos fazem parte dessa estrutura. As CDR em cada cadeia mantêm-se juntas e muito próximas pelas regiões FR e juntamente com as CDR da outra cadeia contribuem para a formação do local de ligação de antigénios de anticorpos (consultar Kabat et ai., NIH Publ. N° 91-3242, Vol. I, páginas 647-669 (1991)). Os domínios constantes não estão directamente envolvidos na ligação de um anticorpo a um antigénio mas apresentam diferentes funções efectoras tais como participação do anticorpo em toxicidade celular dependente de anticorpo. A expressão "região hipervariável" quando aqui utilizada refere-se aos resíduos de aminoácidos de um anticorpo que são responsáveis por ligação de antigénio. A região hipervariável inclui resíduos de aminoácidos de uma "região determinante da complementaridade" ou "CDR" (ou seja, resíduos 24-34 (Ll), 50-56 (L2) e 89-97 (L3) no domínio variável da cadeia leve e 31-35 (Hl), 50-65 (H2) e 95-102 (H3) no domínio variável da cadeia pesada; Kabat et al., Sequences of Proteins of Immunological Interest, 5a Ed. Public Health Service, National Institute of Health, Bethesda, Maryland [1991]) e/ou os resíduos de uma "ansa hipervariável" (ou seja, resíduos 26-32 (Ll), 50-52 (L2) e 91-96 (L3) no domínio variável de cadeia leve e 26-32 (Hl), 53-55 (H2) e 96-101 (H3) no domínio variável de cadeia pesada; Clothia e Lesk, J. Mol. Biol,, 196:901-917 [1987]). Resíduos de "esqueleto" ou "FR" são os resíduos de domínio variável diferentes dos resíduos de região hipervariável tal como aqui definidos. "Fragmentos de anticorpos" incluem uma parte de um anticorpo intacto, de preferência a região de ligação ao antigénio ou região variável do anticorpo intacto. Constituem exemplos de fragmentos de anticorpos, entre outros, fragmentos Fab, Fab', F(ab')2 e Fv; diacorpos; anticorpos lineares (Zapata et al., Protein Eng., 8(10) : 1057-1062 [1995]); moléculas de anticorpo de cadeia simples; e anticorpos multiespecíficos formados a partir de fragmentos de anticorpos. 58
ΕΡ 1 607 402 /PT A digestão de anticorpos com papaína produz dois fragmentos de ligação de antigénio idênticos, denominados fragmentos "Fab", cada um com um único local de ligação de antigénio e um fragmento "Fc" residual cujo nome reflecte a sua capacidade para cristalizar facilmente. O tratamento com pepsina origina um fragmento F(ab')2 que apresenta dois locais de combinação de antigénio e ainda é capaz de reticular com antigénio. "Fv" é o fragmento de anticorpo mínimo que contém um local de reconhecimento e ligação ao antigénio. Esta região consiste de um dímero de um domínio variável de cadeia pesada e outro de cadeia leve em forte associação não covalente. É nesta configuração que as três CDR de cada domínio variável interagem para definir um local de ligação de antigénio à superfície do dímero VH-VL. Conjuntamente, as seis CDR conferem especificidade de ligação de antigénio ao anticorpo. Contudo, mesmo apenas um domínio variável (ou metade de um Fv incluindo apenas três CDR específicas para um antigénio) tem a capacidade de reconhecer e ligar antigénio apesar de o fazer com afinidade reduzida relativamente ao local de ligação de comprimento completo. 0 fragmento Fab contém também o domínio constante da cadeia leve e o primeiro domínio constante (CHI) da cadeia pesada. Os fragmentos Fab diferem de fragmentos Fab' por adição de alguns resíduos no terminal carboxilo do domínio de cadeia pesada CHI incluindo uma ou mais cisteínas da região de charneira do anticorpo. Fab'-SH é a designação aqui utilizada para Fab' em que o(s) resíduo (s) de cisteína dos domínios constantes apresentam um grupo tiol livre. Produziram-se originalmente fragmentos de anticorpo F(ab')2 como pares de fragmentos Fab' que apresentam cisteínas de charneira entre si. São igualmente conhecidos outros acoplamentos químicos de fragmentos de anticorpo.
As "cadeias leves" de anticorpos (imunoglobulinas) de quaisquer espécies de vertebrados podem ser atribuídas a um ou dois tipos nitidamente diferentes denominados capa (k) e lambda (λ), com base nas sequências de aminoácido dos seus domínios constantes. 59
ΕΡ 1 607 402 /PT
Dependendo da sequência de aminoácidos do domínio constante das suas cadeias pesadas, as imunoglobulinas podem ser atribuídas a diferentes classes. Existem cinco classes principais de imunoglobulinas: igA, igD, igE, igG e igM e várias de entre estas podem ser adicionalmente divididas em subclasses (isotipos), por exemplo, igGl, lgG2, lgG3, IgG4, IgA e lgA2. Os domínio constantes de cadeia pesada que correspondem a diferentes classes de imunoglobulinas denominam-se α, δ, ε, γ e μ, respectivamente. As estruturas de subunidade e as configurações tridimensionais das diferentes classes de imunoglobulinas são bem conhecidas. A expressão "anticorpo monoclonal" tal como aqui utilizada refere-se a um anticorpo obtido de uma população substancialmente homogénea de anticorpos, ou seja, os anticorpos individuais que fazem parte da população são idênticos excepto relativamente a possíveis mutações de ocorrência natural que possam estar presentes em pequenas quantidades. Os anticorpos monoclonais são altamente específicos, sendo dirigidos contra um único local antigénico. Além disso, contrariamente às preparações de anticorpos convencionais (policlonais) que incluem tipicamente anticorpos diferentes dirigidos contra determinantes (epítopos) diferentes, cada anticorpo monoclonal é dirigido contra um único determinante no antigénio. Além da sua especificidade, os anticorpos monoclonais são vantajosos por serem sintetizados pela cultura de hibridomas, não contaminados por outras imunoglobulinas. O adjectivo "monoclonal" indica o carácter do anticorpo como sendo obtido de uma população substancialmente homogénea de anticorpos e não deve ser encarado como requerendo a produção do anticorpo por qualquer método em particular. Por exemplo, os anticorpos monoclonais a utilizar de acordo com o presente invento podem ser produzidos pelo método do hibridoma, pela primeira vez descrito por Kohler et al., Nature, 256:495 [1975], ou podem ser produzidos por métodos de ADN recombinante (consultar, por exemplo, patente U.S. n.° 4 816 567). Os "anticorpos monoclonais" podem ser também isolados de bibliotecas de anticorpos sobre fagos utilizando as técnicas descritas em Clackson et al., Nature, 352:624-628 [1991] e Marks et al., J. Mol, Biol., 222:581-597 (1991), por exemplo. 60
ΕΡ 1 607 402 /PT
Os presentes anticorpos monoclonais incluem especificamente anticorpos "quiméricos" (imunoglobulinas) nos quais uma parte da cadeia pesada e/ou leve é idêntica ou homóloga às sequências correspondentes em anticorpos derivados de uma espécie em particular ou pertencentes a uma classe ou subclasse particular de anticorpo, enquanto que a(s) cadeia(s) restante(s) são idênticas ou homólogas às sequências correspondentes em anticorpos derivados de outra espécie ou pertencentes a outra classe ou subclasse de anticorpos, assim como fragmentos de tais anticorpos desde que apresentem a actividade biológica pretendida (patente U.S. n.° 4 816 567; Morrison et ai., Proc. Natl. Acad. Sei. USA, 81:6851-6855 [1984]) .
Formas "humanizadas" de anticorpos não humanos (por exemplo, murinos) são imunoglobulinas quiméricas, cadeias de imunoglobulina ou seus fragmentos (tais como Fv, Fab, Fab', F(ab')2 ou outras subsequências de ligação de antigénio de anticorpos) que contêm uma sequência mínima derivada de imunoglobulina não humana. Na sua maioria, os anticorpos humanizados são imunoglobulinas humanas (anticorpo recebedor) nas quais se substituíram resíduos de uma CDR do recebedor por resíduos de uma CDR de uma espécie não humana (anticorpo dador) tal como ratinho, rato ou coelho apresentando a especificidade, afinidade e capacidade pretendidas. Nalguns casos, substituem-se resíduos Fv FR de imunoglobulina humana pelos correspondentes resíduos não humanos. Além disso, os anticorpos humanizados podem incluir resíduos que não existem nem no anticorpo recebedor nem nas sequências de CDR ou de esqueleto FR importadas. Estas modificações são efectuada para refinar e maximizar adicionalmente o desempenho do anticorpo. De um modo geral, o anticorpo humanizado incluirá substancialmente todos e pelo menos um e tipicamente dois, domínio variáveis nos quais todas ou substancialmente todas as regiões CDR correspondem às de uma imunoglobulina não humana e todas ou substancialmente todas as regiões FR são as de uma sequência de imunoglobulina humana. O anticorpo humanizado incluirá optimamente também pelo menos uma parte de uma região constante de imunoglobulina (Fc), tipicamente a de uma imunoglobulina humana. Para pormenores adicionais consultar Jones et al., Nature, 321:522-525 (1986); Reichmann et al.,
Nature, 332:323-329 [1988]; e Presta, Curr. Op. Struct. Biol,, 61
ΕΡ 1 607 402 /PT _2:593—596 (1992). Ο anticorpo humanizado inclui um anticorpo PRIMATIZED™ em que a região de ligação ao antigénio do anticorpo é derivada de um anticorpo produzido por imunização de macacos Macaque com o antigénio de interesse.
Fragmentos de anticorpo "Fv em cadeia simples" ou "sFv" incluem os domínios VH e VL de anticorpo em que esses domínios estão presentes numa única cadeia polipeptídica. De preferência, o polipéptido Fv inclui adicionalmente um ligante polipeptídico entre os domínios VH e VL que permite que sFv forme a estrutura pretendida para ligação do antigénio. Para uma revisão de sFv consultar Pluckthun em The Pharmacology of Monoclonal Antibodies, vol. 113, Rosenburg e Moore ed., Springer-Verlag, New York, p. 269-315 (1994). A expressão "diacorpos" refere-se a fragmentos de anticorpo pequenos com dois locais de ligação de antigénio em que os fragmentos incluem um domínio variável de cadeia pesada (VH) ligado a um domínio variável de cadeia leve (VL) na mesma cadeia polipeptídica (VH-VL) . Utilizando um ligante que é demasiado curto para permitir emparelhamento entre os dois domínios da mesma cadeia, forçam-se os domínios a emparelhar com os domínios complementares de outra cadeia e a criar dois locais de ligação de antigénio. Descrevem-se diacorpos em maior detalhe em, por exemplo, EP 404 097; WO 93/11161; e Hollinger et al., Proc. Natl. Acad. Sei. USA, 90:6444-6448 (1993) .
Um anticorpo "isolado" é aquele que foi identificado e separado e/ou recuperado de uma componente do seu ambiente natural. As componentes contaminantes do seu ambiente natural são materiais que interferiram com utilizações do anticorpo em diagnóstico ou terapêutica e podem incluir enzimas, hormonas e outro solutos proteináceos ou não proteináceos. Em concretizações preferidas, o anticorpo será purificado (1) até mais de 95% em peso de anticorpo tal como determinado pelo método de Lowry e com maior preferência até mais de 99% em peso, (2) até um grau suficiente para obter pelo menos 15 resíduos da sequência de aminoácidos N-terminais ou internos por utilização de um sequenciador de copo rotativo, ou (3) até à homogeneidade por SDS-PAGE em condições redutoras ou não redutoras utilizando coloração com azul de Coomassie 62
ΕΡ 1 607 402 /PT ou, de preferência, com prata. O anticorpo isolado inclui o anticorpo in situ no interior de células recombinantes dado que não estará presente pelo menos uma componente do ambiente natural do anticorpo. Habitualmente, contudo, o anticorpo isolado será preparado através de pelo menos uma etapa de purificação. A expressão "marcador" quando aqui utilizada refere-se a um composto ou composição detectável que está directa ou indirectamente conjugado com o anticorpo de modo a gerar um anticorpo "marcado". O marcador pode ser detectável por si próprio (por exemplo, marcadores radioisotópicos ou marcadores fluorescentes) ou, no caso de um marcador enzimático, pode catalisar alteração química de um composto ou composição substrato que é detectável. Os radionuclidos que podem servir como marcadores detectáveis incluem, por exemplo, 1-131, 1-123, 1-125, Y-90, Re-188, Re-186, At-211, Cu-67, Bi-212 e Pd-109. O marcador pode também ser uma entidade não detectável tal como uma toxina. "Fase sólida" significa uma matriz não aquosa à qual o anticorpo do presente invento pode aderir. Constituem exemplos de fases sólidas aqui abrangidas, entre outras, as formadas parcial ou inteiramente por vidro (por exemplo, vidro de porosidade controlada), polissacáridos (por exemplo, agarose), poliacrilamidas, poliestireno, poli(álcool vinílico) e silicones. Em determinadas concretizações, dependendo do contexto, a fase sólida pode incluir o poço de uma placa de ensaio; noutras é uma coluna de purificação (por exemplo, uma coluna de cromatografia de afinidade). Esta expressão também inclui uma fase sólida descontínua de partículas discretas, tal como as descritas na patente U.S. n.° 4 275 149.
Um "lipossoma" é uma vesícula pequena composta por diferentes tipos de lípidos, fosfolípidos e/ou tensioactivos que é útil para entregar um fármaco (tal como um polipéptido PR05775 ou um anticorpo deste e opcionalmente um agente quimioterapêutico) a um mamífero. As componentes do lipossoma são habitualmente dispostas numa formação em bicamadas semelhante ao arranjo de lípidos das membranas biológicas. 63
ΕΡ 1 607 402 /PT
Tal como aqui utilizada, a expressão "imunoadesina" designa moléculas do tipo anticorpo que combinam a especificidade de ligação de uma proteína heteróloga (uma "adesina") com as funções de efector dos domínios constantes de imunoglobulina. Estruturalmente, as imunoadesinas incluem uma fusão de uma sequência de aminoácidos com a especificidade de ligação pretendida que é diferente do local de reconhecimento e ligação de antigénio de um anticorpo (ou seja, é "heteróloga") e de uma sequência de domínio constante de uma imunoglobulina. A parte de adesina de uma molécula de imunoadesina é tipicamente uma sequência de aminoácidos contígua incluindo pelo menos o local de ligação de um receptor ou de um ligando. A sequência de domínio constante de imunoglobulina da imunoadesina pode ser obtida de qualquer imunoglobulina tal como os subtipos IgG-1, IgG-2, IgG-3 ou IgG-4, IgA (incluindo IgA-1 e IgA-2), IgE, IgD ou IgM. II. Composições e métodos do invento A. Polipéptidos PR05775 de comprimento completo O presente invento pode referir-se a sequências de nucleótidos que codificam polipéptidos que se referem no presente pedido como PR05775. Nomeadamente, revela-se mais detalhadamente ADNc que codifica polipéptidos PR05775 nos exemplos infra. Note-se que se podem atribuir números PRO diferentes a proteínas produzidas em ciclos de expressão independentes mas o número UNQ é único para qualquer ADN determinado e proteína codificada e não será alterado. Contudo, com vista a simplificar, no presente fascículo as proteínas codificadas pelas sequências de ácidos nucleicos aqui reveladas assim como todos os homólogos e variantes nativos adicionais incluídos na definição de PR05775 supra, serão referidos como "PR05775" independentemente da sua origem ou modo de preparação.
Tal como revelado nos exemplos infra, os clones de ADNc foram depositados em ATCC. A sequência de nucleótidos real dos clones pode ser facilmente determinada pelo perito na especialidade por sequenciação do clone depositado utilizando métodos rotineiros na especialidade. As sequências de aminoácidos previstas podem ser determinada a partir das 64 ΕΡ 1 607 402 /PT sequências de nucleótidos utilizando práticas correntes. Para os ácidos nucleicos codificantes e polipéptidos PR05775 aqui descritos, os requerentes identificaram o que se pensam serem os quadros de leitura mais facilmente identificáveis a partir da informação de sequência então disponível. B. Variantes de PR05775
Além dos polipéptidos PR05775 de sequência nativa de comprimento completo aqui descritos, considera-se que se podem preparar variantes de PR05775. As variantes de PR05775 podem ser preparadas por introdução das alterações apropriadas de nucleótidos no ADN de PR05775 e/ou por síntese do polipéptido PR05775 pretendido. Os peritos na especialidade avaliarão quais as alterações de aminoácidos que podem alterar processos pós-tradução de PR05775 tal como a mudança do número ou posição de locais de glicosilação ou alteração das características de ancoragem à membrana.
Podem efectuar-se variações no PR05775 de sequência nativa de comprimento completo ou em vários domínios dos aqui descritos, por exemplo, utilizando qualquer das técnicas e orientações para mutações conservativas e não conservativas apresentadas, por exemplo, na patente U.S. n.° 5 364 934. As variações podem ser uma substituição, deleção ou inserção de um ou mais codões que codificam o PR05775 que resultam numa alteração da sequência de aminoácidos de PR05775 comparativamente com a sequência de PR05775 nativa. Opcionalmente a variação é por substituição de pelo menos um aminoácido por qualquer outro aminoácido em um ou mais domínios do PR05775. Podem encontrar-se orientações relativas à determinação de qual o resíduo de aminoácido que pode ser inserido, substituído ou eliminado sem afectar de modo adverso a actividade pretendida por comparação da sequência do PR05775 com a de moléculas de proteínas homólogas conhecidas e minimização do número de alterações de sequências de aminoácidos efectuadas em regiões de homologia elevada. As substituições de aminoácidos podem ser o resultado de substituir um aminoácido por outro aminoácido apresentando propriedades estruturais e/ou químicas semelhantes, tais como a substituição de uma leucina por uma serina, ou seja, substituições de aminoácidos conservativas. As inserções ou 65
ΕΡ 1 607 402 /PT deleções podem opcionalmente ser efectuadas na gama entre cerca de 1 a 5 aminoácidos. As variações permitidas podem ser determinadas fazendo sistematicamente inserções, deleções ou substituições de aminoácidos na sequência e ensaiando as variantes resultantes quanto à actividade apresentada pela sequência nativa madura ou de comprimento completo.
Proporcionam-se aqui fragmentos de polipéptido PR05775. Tais fragmentos podem ser truncados no terminal N ou no terminal C ou podem apresentar falta de resíduos internos, por exemplo, quando comparados com uma proteina nativa de comprimento completo. Determinados fragmentos apresentam falta de resíduos de aminoácidos que não são essenciais para a actividade biológica pretendida do polipéptido PR05775.
Os fragmentos PR05775 podem ser preparado por qualquer de várias técnicas convencionais. Os fragmentos peptidicos pretendidos podem ser sintetizados quimicamente. Uma abordagem alternativa envolve a geração de fragmentos PR05775 por digestão enzimática, por exemplo, por tratamento da proteina com uma enzima que se sabe que cliva proteínas em locais definidos por determinados resíduos de aminoácidos ou por digestão do ADN com enzimas de restrição adequadas e isolamento do fragmento pretendido. Ainda outra técnica adequada envolve isolamento e amplificação de um fragmento de ADN que codifica um fragmento polipeptídico pretendido através de reacção de polimerização em cadeia (PCR). Nos iniciadores 5' e 3' da PCR utilizam-se oligonucleótidos que definem as extremidades pretendidas do fragmento de ADN. De preferência, os fragmentos de polipéptido PR05775 partilham pelo menos uma actividade biológica e/ou imunológica com o polipéptido PR05775 nativo.
Em concretizações particulares, apresentam-se substituições conservativas de interesse na tabela 3 sob o título de substituições preferidas. Se tais substituições resultarem numa alteração da actividade biológica, então introduzem-se alterações mais substanciais, denominadas exemplos de substituições na tabela 3 ou tal como adicionalmente descrito infra em referência a classes de aminoácidos e rastreiam-se os produtos. 66
ΕΡ 1 607 402 /PT
Tabela 3
Resíduo Original Exemplos de substituições Substituições preferidas Ala (A) vai; leu; ile vai Arg (R) lys; gin; asn lys Asn (N) gin; his; lys; arg gin Asp (D) glu glu Cys (C) ser ser Gin (Q) asn asn Glu (E) asp asp Gly (G) pro; ala ala His (H) asn; gin; lys; arg arg He (I) leu; vai; met; ala; phe; norleucina leu Leu (L) norleucina; ile; vai; met; ala; phe ile Lys (K) arg; gin; asn arg Met (M) leu; phe; ile leu Phe (F) leu; vai; ile; ala; tyr leu Pro (P) ala ala Ser (S) thr thr Thr (T) ser ser Trp (W) tyr; phe tyr Tyr (Y) trp; phe; thr; ser phe Vai (V) ile; leu; met; phe; ala; norleucina leu
Obtêm-se modificações substanciais de função ou de identidade imunológica do polipéptido por selecção de substituições que diferem significativamente relativamente ao seu efeito de manter (a) a estrutura do esqueleto do polipéptido na área da substituição, por exemplo, como uma conformação em folha ou em hélice, (b) a carga ou hidrofobicidade da molécula no local alvo, ou (c) a generalidade da cadeia lateral. Os resíduos de ocorrência natural dividem-se em grupos com base em propriedades comuns das cadeias laterais: 67
ΕΡ 1 607 402 /PT (1) hidrófobos: norleucina, met, ala, vai, leu, ile; (2) hidrófilos neutros: cys, ser, thr; (3) ácidos: asp, glu; (4) básicos: asn, gin, his, lys, arg; (5) resíduos que influenciam a orientação da cadeia: gly, pro; e (6) aromáticos: trp, tyr, phe.
As substituições não conservativas implicarão trocar um membro de uma destas classes por outro de outra classe. Tais resíduos substituídos podem ser introduzidos nos locais de substituição conservativa ou, com maior preferência, nos locais restantes (não conservados).
As variações podem ser efectuadas utilizando métodos conhecidos na especialidade tais como mutagénese mediada por oligonucleótidos (dirigida ao local), varrimento de alanina e mutagénese por PCR. Pode efectuar-se mutagénese dirigida ao local [Cárter et al., Nucl. Acids Res., 13:4331 (1986); Zoller et al., Nucl. Acids Res., 1£:6487 (1987)], mutagénese com cassete [Wells et al., Gene, 3_4:315 (1985)], mutagénese com selecção por restrição [Wells et al., Philos. Trans. R. Soc. London SerA, 317:415 (1986)] ou outras técnicas conhecidas sobre o ADN clonado para produzir o ADN variante PR05775.
Pode também utilizar-se varrimento de análise de aminoácidos para identificar um ou mais aminoácidos ao longo de uma sequência não contígua. Entre os aminoácidos preferidos para varrimento incluem-se os aminoácidos neutros e
relativamente pequenos. Tais aminoácidos incluem alanina, glicina, serina e cisteína. A alanina é tipicamente um aminoácido preferido para rastreio neste grupo porque elimina a cadeia lateral para além do carbono beta e é menos provável que altere a conformação da cadeia principal da variante [Cunningham e Wells, Science, 244: 1081-1085 (1989)]. A alanina é também tipicamente preferida porque não é o aminoácido mais comum. Além disso, encontra-se frequentemente tanto em posições enterradas como expostas [Creighton, The Proteins, (W.H. Freeman & Co., New York); Chothia, J. Mol. Biol., 150:1 (1976)]. Se a substituição com alanina não proporcionar quantidades adequadas de variante, pode utilizar-se um aminoácido isotérico. 68
ΕΡ 1 607 402 /PT C. Modificações de PR05775
As modificações covalentes de PR05775 estão incluídas no âmbito deste invento. Um tipo de modificação covalente inclui fazer reagir resíduos de aminoácidos alvo de um polipéptido PR05775 com um agente de derivatização orgânico que é capaz de reagir com cadeias laterais seleccionadas ou com os resíduos do terminal N ou do terminal C do PR05775. A derivatização com agentes bifuncionais é útil, por exemplo, para reticulação de PR05775 com uma matriz de suporte ou superfície insolúveis em água para utilização no método para purificar anticorpos anti-PR05775 e vice-versa. Constituem agentes de reticulação habitualmente utilizados, por exemplo, 1,1-bis(diazoacetil)-2-fenitetano, glutaraldeído, ésteres de N-hidroxissuccinimida, por exemplo, ésteres com ácido 4-azidossalicílico, imidoésteres homobifuncionais, incluindo ésteres dissuccinimidilo tais como 3,3'-ditiobis(succinimidil-propionato), maleimidas bifuncionais tais como bis-N-maleimido-1,8-octano e agentes tais como metil-3-[(p-azidofenil)ditio]propioimidato.
Outras modificações incluem desaminação de resíduos glutaminilo e asparaginilo aos resíduos glutamilo e aspartilo correspondentes, respectivamente, hidroxilação de prolina e lisina, fosforilação de grupos hidroxilo de resíduos serilo ortreonilo, metilação de grupos α-amino de cadeias laterais de lisina, arginina e histidina [T.E. Creighton, Proteins: Structure and Molecular Properties, W.H. Freeman & Co., San Francisco, p. 79-86 (1983)], acetilação da amina do terminal N e amidação de qualquer grupo carboxilo do terminal C.
Constitui outro tipo de modificação covalente do polipéptido PR05775 abrangida pelo âmbito do presente invento, entre outras, alterar o padrão de glicosilação nativo do polipéptido. Pretende-se que "alterar o padrão de glicosilação nativo" para os presentes objectivos, signifique eliminar uma ou mais partes de hidrato de carbono presentes na sequência PR05775 nativa (quer por remoção do local de glicosilação subjacente quer por deleção da glicosilação por meios químicos e/ou enzimáticos) e/ou adicionar um ou mais locais de glicosilação que não se encontram presentes na sequência 69
ΕΡ 1 607 402 /PT PR05775 nativa. Adicionalmente, a expressão inclui mudanças qualitativas na glicosilação das proteínas nativas, envolvendo uma alteração da natureza e proporções das diferentes partes de hidratos de carbono presentes. A adição de locais de glicosilação ao polipéptido PR05775 pode obter-se por alteração da sequência de aminoácidos. A alteração pode ser efectuada, por exemplo, pela adição de um mais resíduos de serina ou treonina ou por substituição dos resíduos existentes por um mais resíduos de serina ou treonina na sequência PR05775 nativa (para locais de glicosilação ligados a 0) . A sequência de aminoácidos PR05775 pode ser opcionalmente alterada através de mudanças ao nível do ADN, nomeadamente por mutação do ADN que codifica o polipéptido PR05775 em bases pré-seleccionadas de modo a que sejam gerados codões que se traduzirão nos aminoácidos pretendidos.
Outro meio de aumentar o número de partes de hidrato de carbono no polipéptido PR05775 é por acoplamento químico ou enzimático de glicósidos ao polipéptido. Tais métodos são descritos na especialidade, por exemplo, em WO 87/05330 publicada a 11 de Setembro de 1987 e em Aplin e Wriston, CRC Crit Rev. Biochem., p. 259-306 (1981). A remoção de partes de hidrato de carbono presentes no polipéptido PR05775 pode ser obtida química ou enzimaticamente ou por substituição por mutação de codões que codificam resíduos de aminoácidos que servem como alvos para glicosilação. São conhecidas na especialidade técnicas de desglicosilação química e descrevem-se, por exemplo, em
Hakimuddin, et ai., Arch. Biochem. Biophys., 259:52 (1987) e em Edge et al., Anal. Biochem., 118:131 (1981). A clivagem enzimática de partes de hidrato de carbono em polipéptidos pode ser obtida por utilização de várias endoglicosidases e exoglicosidases tal como descritas por Thotakura et ai., Meth, Enzymol., 138:350 (1987).
Outro tipo de modificação covalente de PR05775 inclui ligar o polipéptido PR05775 a um de entre vários polímeros não proteináceos, por exemplo, polietilenoglicol (PEG), polipropilenoglicol, orpolioxialquilenos do modo estabelecido 70 ΕΡ 1 607 402 /PT nas patentes U.S. n.° 4 640 835; 4 496 689; 4 301 144; 4 670 417; 4 791 192 ou 4 179 337. O PR05775 do presente invento pode também ser modificado de modo a formar uma molécula quimérica incluindo PR05775 fundido a outro polipéptido ou sequência de aminoácidos heteróloqos.
Tal molécula quimérica pode incluir uma fusão do PR05775 com um polipéptido marcador que proporciona um epitopo ao qual se pode ligar selectivamente um anticorpo anti-marcador. O marcador epitópico é geralmente colocado no terminal amino ou carboxilo do PR05775 e a presença de tais formas de PR05775 com marcador epitópico pode ser detectada utilizando um anticorpo contra o polipéptido marcador. Igualmente, a dotação com o marcador epitópico permite que PR05775 seja facilmente purificado por purificação de afinidade utilizando um anticorpo anti-marcador ou outro tipo de matriz de afinidade que se liga ao marcador epitópico. São bem conhecidos na especialidade vários polipéptidos marcadores e seus respectivos anticorpos. Constituem exemplos, entre outros, marcadores poli-histidina (poli-His) ou poli-histidina-glicina (poli-His-gly); o polipéptido marcador flu HA e o seu anticorpo 12CA5 [Field et al., Mol. Cell. Biol., _8:2159-2165 (1988)]; o marcador c-myc e os seus anticorpos 8F9, 3C7, 6E10, G4, B7 e 9E10 [Evan et al., Molecular and Cellular Biology, 5:3610-3616 (1985)]; e o marcador da glicoproteina D (gD) do virus Herpes Simplex e o seu anticorpo [Paborsky et al., Protein Engineering, 3(6):547-553 (1990)]. Outros marcadores polipeptidicos incluem o péptido Flag [Hopp et al., BioTechnoloqy,6:1204-1210 (1988)]; o péptido epitópico KT3 [Martin et al., Science, 255:192-194 (1992)]; um péptido epitópico de α-tubulina [Skinner et al., J. Biol. Chem., 266:15163-15166 (1991)]; e o marcador epitópico da proteína 10 do gene T7 [Lutz-Freyermuth et al., Proc. Natl. Acad. Sei. USA, 87:6393-6397 (1990)]. A molécula quimérica pode incluir alternativamente uma fusão do PR05775 com uma imunoglobulina ou com uma região particular de uma imunoglobulina. Para uma forma bivalente de uma molécula quimérica (também referida como uma "imunoadesina"), tal fusão poderia ser com a região Fc de uma 71 ΕΡ 1 607 402 /PT molécula igG. As fusões Ig preferidas incluem a substituição de uma forma solúvel (domínio transmembranar eliminado ou inactivado) de um polipéptido PR05775 no lugar de pelo menos uma região variável no interior de uma molécula Ig. Numa concretização especialmente preferida, a fusão de imunoglobulina inclui as regiões de charneira, CH2 e CH3 ou as regiões de charneira, CHl, CH2 e CH3 de uma molécula IgGl. Para a produção de fusões de imunoglobulina consultar igualmente patente US n.° 5 428 130 emitida a 27 de Junho de 1995. D. Preparação de polipéptidos PRQ5775 A descrição infra refere-se principalmente à produção de PR05775 por células em cultura transformadas ou transfectadas com um vector contendo ácidos nucleicos PR05775. Considera-se obviamente que se podem utilizar métodos alternativos, que são conhecidos na especialidade, para preparar PR05775. Por exemplo, a sequência PR05775 ou suas partes podem ser produzidas por síntese peptídica directa utilizando técnicas de fase sólida [consultar, por exemplo, Stewart et al., Solid-Phase Peptide Synthesis, W.H. Freeman Co., San Francisco, Califórnia (1969); Merrifield, J. Am. Chem. Soc., 85:2149-2154 (1963)]. Pode efectuar-se síntese de proteínas in vitro utilizando técnicas manuais ou por meios automáticos. A síntese automatizada pode ser obtida, por exemplo, utilizando um sintetizador de péptidos Applied Biosystems (Foster City, Califórnia) utilizando as instruções do fabricante. Diferentes partes do PR05775 podem ser sintetizadas quimicamente separadamente e combinadas utilizando métodos químicos ou enzimáticos para produzir o PR05775 de comprimento completo. a. Isolamento de um ADN que codifica um polipéptido PR05775
Pode obter-se ADN que codifica PR05775 a partir de uma biblioteca de ADNc preparada a partir de tecido que se pensa apresentar ARNm de PR05775 e expressá-lo a um nível detectável. Consequentemente, pode obter-se convenientemente ADN de PR05775 humano a partir de uma biblioteca de ADNc preparada a partir de tecido humano, tal como descrito nos exemplos. Pode também obter-se o gene que codifica PR05775 a 72
ΕΡ 1 607 402 /PT partir de uma biblioteca genómica ou por síntese de oligonucleótidos.
As bibliotecas podem ser rastreadas com sondas (tais como anticorpos contra o polipéptido PR05775 ou oligonucleótidos com pelo menos cerca de 20-80 bases) concebidas para identificar o gene de interesse ou a proteína por ele codificada. O rastreio da biblioteca de ADNc ou genómica com a sonda seleccionada pode ser efectuada utilizando procedimentos padrão, tal como os descritos em Sambrook et al., Molecular Cloning: A Laboratory Manual (New York: Cold Spring Harbor Laboratory Press, 1989). A utilização da metodologia de PCR é um modo alternativo de isolar o gene que codifica PR05775 [Sambrook et al., supra; Dieffenbach et al., PCR Primer: A Laboratory Manual (Cold Spring Harbor Laboratory Press, 1995)] .
Os exemplos infra descrevem técnicas para rastreio de uma biblioteca de ADNc. As sequências de oligonucleótidos seleccionadas como sondas devem apresentar comprimento suficiente e devem ser suficientemente não ambíguas de modo a minimizar falsos positivos. O oligonucleótido é de preferência marcado de modo a poder ser detectado por hibridação com ADN da biblioteca que está a ser rastreada. São bem conhecidos na especialidade métodos de marcação e incluem a utilização de marcadores radioactivos tais como ATP marcado com 32P, biotinilação ou marcação com enzima. Proporcionam-se as condições de hibridação, incluindo rigor moderado e rigor elevado, em Sambrook et al., supra.
As sequências identificadas em tais métodos de rastreio de biblioteca podem ser comparadas e alinhadas com outras sequências conhecidas depositadas e disponíveis em bases de dados públicas tais como GenBank ou outras bases de dados de sequências privadas. Pode determinar-se identidade de sequência (ao nível de aminoácido ou de nucleótido) no interior de regiões definidas da molécula ou ao longo da sequência de comprimento completo, utilizando métodos conhecidos na especialidade e tal como aqui descritos.
Podem obter-se ácidos nucleico apresentando sequências de codificação de proteína por rastreio de bibliotecas de ADNc ou 73
ΕΡ 1 607 402 /PT genómicas seleccionadas utilizando a sequência de aminoácidos deduzida aqui revelada pela primeira vez e se necessário, utilizando procedimentos convencionais de extensão de iniciadores tal como descrito em Sambrook et al., supra, para detectar precursores e intermediários de processamento de ARNm que podem não ter sido submetidos a transcrição inversa para ADNc . b. Selecção e transformação de células hospedeiras
Transfectam-se ou transformam-se células hospedeiras com vectores de expressão ou clonagem aqui descritos para produção de PR05775 e cultiva-se em meio de nutrientes convencional modificado tal como apropriado para induzir promotores, seleccionar produtos de transformação ou amplificar os genes que codificam as sequências pretendidas. As condições de cultura tais como meio, temperatura, pH e semelhantes podem ser seleccionadas pelo perito na especialidade sem experiências desnecessárias. De um modo geral, podem encontrar-se princípios, protocolos e técnicas práticas para maximizar a produtividade de culturas de células em Mammalian Cell Biotechnology: a Practical Approach, M. Butler, ed. (IRL Press, 1991) e Sambrook et al., supra.
Os métodos de transfecção de células eucarióticas e transformação de células procarióticas são conhecidos do perito na especialidade, por exemplo, CaCl2, CaPCh, mediada por lipossomas e electroporação. Dependendo da célula hospedeira utilizada, efectua-se transformação utilizando técnicas padrão apropriadas para tais células. Utiliza-se geralmente tratamento com cálcio que utiliza cloreto de cálcio, tal como descrito em Sambrook et al., supra, ou electroporação para procariotas. Utiliza-se infecção com Agrobacterium tumefaciens para transformação de determinadas células de planta, tal como descrita por Shaw et al., Gene, 23:315 (1983) e WO 89/05859 publicada a 29 de Junho de 1989. Para células de mamífero sem tais paredes celulares, pode utilizar-se o método de precipitação com fosfato de cálcio de Graham e van der Eb, Virology, 52:456-457 (1978). Descreveram-se aspectos gerais de transfecções para sistema hospedeiro de células de mamífero na patente U.S. n.° 4 399 216. As transformações para levedura são tipicamente 74
ΕΡ 1 607 402 /PT efectuadas de acordo com o método de Van Solingen et al., J. Bact., 130:946 (1977) e Hsiao et al., Proc. Natl. Acad. Sei. (USA), 7_6;3829 (1979). Contudo, podem utilizar-se outros métodos para introduzir ADN em células, tais como por micro-injecção nuclear, electroporação, fusão de protoplasto bacteriano com células intactas ou policatiões, por exemplo, polibreno, poliornitina. Para diferentes técnicas para transformar células de mamifero, consultar, Keown et al., Methods in Enzymology, 185:527-537 (1990) e Mansour et al.,
Nature, 336:348-352 (1988).
Constituem células hospedeiras adequadas para clonagem ou expressão do ADN nos vectores aqui referidos, entre outras, células de procariotas, levedura ou eucariotas superiores. Constituem procariotas adequados, entre outros, eubactérias, tais como organismos Gram-negativos ou Gram-positivos, por exemplo, Enterobacterlaceae tal como E. coll. Diferentes estirpes de E. coli encontram-se disponíveis ao público, tal como E. coli Kl2 estirpe MM294 (ATCC 31 446); E. coli X1776 (ATCC 31 537); E. coli estirpe W3110 (ATCC 27 325) e E. coli estirpe K5 772 (ATCC 53 635). Constituem outras células hospedeiras procarióticas adequadas, entre outras, Enterobacteriaceae tais como Escherichia, por exemplo, E. coli, Enterobacter, Erwinia, Klebsiella, Proteus, Salmonella, por exemplo, Salmonella typhimurium, Serratia, por exemplo, Serratia marcescans, e Shígella, assim como bacilos tais como B. subtilis e B. licheniformis (por exemplo, B. licheniformis 41P revelado em DD 266 710 publicado a 12 de Abril de 1989), Pseudomonas tal como P. aeruginosa e Streptomyces. Estes exemplos são ilustrativos e não limitativos. A estirpe W3110 constitui um hospedeiro ou hospedeiro parental particularmente preferido porque é uma estirpe hospedeira comum para fermentações de produtos de ADN recombinante. De preferência, a célula hospedeira excreta quantidades mínimas de enzimas proteolíticas. Por exemplo, a estirpe W3110 pode ser modificada para efectuar uma mutação genética nos genes que codificam proteínas endógenas ao hospedeiro, incluindo os exemplos de tais hospedeiros, entre outros, E. coli W3110 estirpe 1A2, que apresenta o genótipo completo tonA; E. coli W3110 estirpe 9E4, que apresenta o genótipo completo tonA ptr3; E. coli W3110 estirpe 27C7 (ATCC 55 244), que apresenta o genótipo completo tonA ptr3 75
ΕΡ 1 607 402 /PT phoA E15 (argF-lac)169 degP onepT karf; E. coli W3110 estirpe 37D6, que apresenta o genótipo completo tonA ptr3 phoA E15 (argF-lac) 169 degP ompT rbs7 ilvG kanr·, E. coli W3110 estirpe 40B4, que é uma estirpe 37D6 com uma mutação de deleção degP com resistência não canamicina; e uma estirpe E. coli apresentando protease periplasmática mutante revelada na patente U.S. n.° 4 946 783 emitida a 7 de Aqosto de 1990. Alternativamente, são adequados métodos in vitro de clonagem, por exemplo, PCR ou outras reacções de polimerização de ácidos nucleicos .
Além de procariotas, constituem hospedeiros de clonagem ou expressão adequados para vectores que codificam PR05775, micróbios eucarióticos tais como fungos filamentosos ou leveduras. Saccharomyces cerevlslae é um microrganismo hospedeiro eucariota inferior habitualmente utilizado. Outros incluem Schizosaccharomyces pombe (Beach e Nurse, Nature, 290: 140 [1981]; EP 139 383 publicada a 2 de Maio de 1985); hospedeiros de Kluyveromyces (patente U.S. n.° 4 943 529; Fleer et al., Bio/Technology, 9_: 968—975 (1991)) tal como, por exemplo, K. lactis (MW98-8C, CBS683, CBS4574; Louvencourt et al., J. Bacteriol., 737 [1983]). K. fragilis (ATCC 12 424), K. bulgaricus (ATCC 16 045), K. wickeramii (ATCC 24 178), K. waltii (ATCC 56 500), K. drosophílarum (ATCC 36 906; Vanden Berg et al., Bio/Technology, 8_:135 (1990)), K. thermotolerans e K. marxianus; yarrowia (EP 402 226); Pichia pastoris (EP 183 070; Sreekrishna et al., J. Basic Microbiol., 28:265-278 [1988]); Candida·, Trichoderma reesia (EP 244 234);
Neurospora crassa (Case et al., Proc. Natl. Acad. Sei. USA, 7/5:5259-5263 [1979]); Schwanniomyces tal como Schwanniomyces occidentalis (EP 394 538 publicada a 31 de Outubro de 1990); e fungos filamentosos tais como, por exemplo, Neurospora, Penicillium, Tolypocladium (WO 91/00357 publicada a 10 de Janeiro de 1991), e hospedeiros de Aspergillus tais como A. nidulans (Ballance et al., Biochem. Biophys. Res. Commun, 112:284-289 [1983]; Tilburn et al., Gene, 26:205-221 [1983]; Yelton et al., Proc. Natl. Acad. Sei. USA, 81:1470-1474 (1984)) e A. niger (Kelly e Hynes, EMBO J., /1:475-479 [1985]). São aqui adequadas leveduras metilotróficas e incluem, entre outras, leveduras capazes de crescer em metanol seleccionadas dos géneros que consistem de Hansenula, Candida, Kloeckera, Pichia, Saccharomyces, Torulopsis e Rhodotorula. Pode 76
ΕΡ 1 607 402 /PT encontrar-se uma listagem de espécies específicas que constituem exemplos desta classe de leveduras em C. Anthony, The Biochemistry of Methylotrophs, 269 (1982).
Derivam-se células hospedeiras adequadas para a expressão de PR05775 glicosilado a partir de organismos pluricelulares. Constituem exemplos de células de invertebrados, entre outras, células de insectos tais como Drosophila S2 e Spodoptera Sf9, assim como células de planta. Constituem exemplos de linhas celulares de mamífero hospedeiras, entre outras, células de ovário de hamster chinês (CHO) e células COS. Constituem exemplos mais específicos, entre outros, linha CVl de rim de macaco transformada com SV40 (COS-7, ATCC CRL 1651); linha de rim embrionário humano (células 293 ou 293 subclonadas para crescimento em cultura em suspensão, Graham et al., J. Gen. Virol., 3_6:59 (1977)); células de ovário de hamster chinês/- DHFR (CHO), Urlaub e Chasin, Proc. Natl. Acad. Sei. USA, 7_7p4216 (1980)); células de Sertoli de ratinho (TM4, Mather,
Biol. Reprod., 23_ :243-251 (1980)); células de pulmão humano (W138, ATCC CCL 75); células de fígado humano (Hep G2, HB 8065); e tumor de mama de ratinho (MMT 060562, ATCC CCL51). Considera-se que a selecção da célula hospedeira apropriada se encontra abrangida pela perícia na especialidade. c. Selecção e utilização de um vector replicável
Os ácidos nucleicos (por exemplo, ADNc ou ADN genómico) que codificam PR05775 podem ser inseridos num vector replicável para clonagem (amplificação do ADN) ou para expressão. Encontram-se disponíveis ao público vários vectores. O vector pode, por exemplo, estar sob a forma de um plasmídeo, cosmídeo, partícula virai ou fago. A sequência de ácido nucleico apropriada pode ser inserida no vector através de vários procedimentos. De um modo geral, insere-se o ADN em local(ais) apropriado(s) de uma endonuclease de restrição utilizando técnicas conhecidas na especialidade. As componentes do vector incluem geralmente, entre outras, uma ou mais sequências de sinal, uma origem de replicação, um ou mais genes marcadores, um elemento potenciador, um promotor e uma sequência de terminação de transcrição. A construção de vectores adequados contendo uma ou mais dessas componentes 77
ΕΡ 1 607 402 /PT utiliza técnicas de ligação padrão que são conhecidas do perito na especialidade. O PR05775 pode ser produzido de modo recombinante não apenas directamente mas também com um polipéptido de fusão com um polipéptido heterólogo, que pode ser uma sequência de sinal ou outro polipéptido apresentando um local de clivagem especifico no terminal N da proteína madura ou do polipéptido. De um modo geral, a sequência de sinal pode ser uma componente do vector ou pode ser uma parte do ADN que codifica PR05775 que é inserida no vector. A sequência de sinal pode ser uma sequência de sinal procariótica seleccionada, por exemplo, do grupo de comandos de fosfatase alcalina, penicilinase, Ipp ou enterotoxina II estável ao calor. Para excreção de levedura a sequência de sinal pode ser, por exemplo, o comando de invertase de levedura, o comando de factor alfa (incluindo os comandos de factor α de Saccharomyces e Kluyveromyces, o último descrito em patente U.S. n.° 5 010 182) ou comando de fosfatase ácida, comando de glucoamilase de C. albicans (EP 362 179 publicada a 4 de Abril de 1990) ou a sequência de sinal descrita em WO 90/13646 publicada a 15 de Novembro de 1990. Para a expressão de células de mamífero, podem utilizar-se sequências de sinal de mamífero para dirigir a excreção da proteína, tais como sequências de sinal de polipéptidos excretados da mesma espécie ou de espécies relacionadas assim como comandos de excreção virais.
Ambos os vectores de expressão e clonagem contêm uma sequência de ácido nucleico que permite que o vector se replique em uma ou mais células hospedeiras seleccionadas. Tais sequências são bem conhecidas para várias bactérias, leveduras e vírus. A origem de replicação do plasmídeo pBR322 é adequada para a maioria das bactérias Gram-negativas, a origem de plasmídeo 2μ é adequada para levedura e diferentes origens de replicação virai (SV40, polioma, adenovírus, VSV ou BPV) são úteis para vectores de clonagem em células de mamífero.
Os vectores de expressão e clonagem conterão tipicamente um gene de selecção também denominado um marcador seleccionável. Os genes de selecção típicos codificam proteínas que (a) conferem resistência a antibióticos ou 78
ΕΡ 1 607 402 /PT outras toxinas, por exemplo, ampicilina, neomicina, metotrexato ou tetraciclina, (b) complementam deficiências auxotróficas, ou (c) fornecem nutrientes críticos não disponíveis a partir de meios complexos, por exemplo, o gene que codifica D-alanina racemase para bacilos.
Constituem exemplos de marcadores de selecção adequados para células de mamífero, os que permitem a identificação de células competentes para absorver os ácidos nucleicos que codificam PR05775 tal como DHFR ou timidina quinase. Constitui uma célula hospedeira apropriada quando se utiliza DHFR de tipo selvagem a linha celular CHO deficiente em actividade DHFR, preparada e propagada tal como descrito por Urlaub et al., Proc. Natl. Acad. Sei. USA, ΊΊ_·Λ216 (1980). Constitui um gene de selecção adequado para utilização em levedura, o gene trpl presente no plasmídeo de levedura YRp7 [Stinchcomb et al., Nature, 282:39 (1979); Kingsman et al., Gene, (1979); Tschemper et al., Gene, Kkl57 (1980)]. O gene trpl proporciona um marcador de selecção para uma estirpe mutante de levedura que não apresenta a capacidade de crescer em triptofano, por exemplo, ATCC n.° 44076 ou PEP4-1 [Jones,
Genetics, _85_:12 (1977)].
Os vectores de expressão e clonagem contêm habitualmente um promotor ligado operativamente à sequência de ácido nucleico que codifica PR05775 para dirigir síntese de ARNm. São bem conhecidos promotores reconhecidos por várias células hospedeiras potenciais. Constituem promotores adequados para utilização com hospedeiros procarióticos, entre outros, os sistemas de promotores β-lactamase e lactose [Chang et al., Nature, 275:615(1978); Goeddel et al., Nature, 281:544 (1979)], fosfatase alcalina, um sistema de promotor de triptofano (trp) [Goeddel, Nucleic Acids Res., 8_:4057 (1980); EP 36 776] e promotores híbridos tais como o promotor tac [deBoer et al., Proc. Natl. Acad. Sei. USA, 8^:21-25 (1983)]. Os promotores para utilização em sistemas bacterianos conterão também uma sequência de Shine-Dalgarno (S.D.) ligada operativamente ao ADN que codifica PR05775.
Constituem exemplos de sequências de promotor adequadas para utilização com hospedeiros de levedura, entre outras, os promotores para 3-fosfoglicerato-quinase [Hitzeman et al., J. 79
ΕΡ 1 607 402 /PT
Biol. Chem., 255:2073 (1980)] ou outras enzimas glicolíticas [Hess et al., J. Adv. Enzyme Req., ]_:149 (1968); Holland, Biochemistry, Γ7:4900 (1978)], tal como enolase, gliceraldeído-3-fosfato-desidrogenase, hexoquinase, piruvato-descarboxilase, fosfofrutoquinase, glucose-6-fosfato-isomerase, 3-fosfoglicerato-mutase, piruvato-quinase, triosefosfato-isomerase, fosfoglucose-isomerase e glucoquinase.
Outros promotores de levedura, que são promotores indutíveis apresentando a vantagem adicional da transcrição ser controlada pelas condições de crescimento, são as regiões de promotor para álcool desidrogenase 2, isocitocromo C, fosfatase ácida, enzimas de degradação associadas com o metabolismo do azoto, metalotioneina, gliceraldeido-3-fosfato-desidrogenase e enzimas responsáveis pela utilização de maltose e galactose. Descrevem-se adicionalmente vectores e promotores adequados para utilização em expressão em levedura em EP 73 657. A transcrição de PR05775 a partir de vectores em células hospedeiras de mamífero é controlada, por exemplo, por promotores obtidos a partir de genomas de vírus tais como vírus do polioma, vírus da varíola aviária (UK 2 211 504 publicado a 5 de Julho de 1989), adenovírus (tal como Adenovírus 2), vírus do papiloma bovino, vírus do sarcoma aviário, citomegalovírus, um retrovírus, vírus de hepatite B e vírus símio 40 (SV40), de promotores de mamífero heterólogos, por exemplo, o promotor de actina ou um promotor de imunoglobulina e de promotores de choque térmico, desde que tais promotores sejam compatíveis com os sistemas da célula hospedeira. A transcrição de um ADN que codifica o PR05775 por eucariotas superiores pode ser aumentada pela inserção no vector de uma sequência potenciadora. Os potenciadores são elementos de ADN actuantes em cis habitualmente com cerca de 10 a 300 pb, que actuam num promotor para aumentar a sua transcrição. São actualmente conhecidas muitas sequências de potenciador de genes de mamífero (globina, elastase, albumina, α-fetoproteína e insulina). Tipicamente, contudo, utilizar-se-á um potenciador de um vírus de célula eucariótica. Constituem 80
ΕΡ 1 607 402 /PT exemplos, entre outros, o potenciador SV40 do lado tardio da origem de replicação (pb 100-270), o potenciador do promotor precoce de citomegalovírus, o potenciador de polioma do lado tardio da origem de replicação e potenciadores de adenovirus. O potenciador pode ser submetido a splicing para o vector numa posição 5' ou 3' relativamente à sequência de codificação PR05775, mas localiza-se de preferência num local a 5' do promotor.
Os vectores de expressão utilizados em células hospedeiras eucarióticas (células de levedura, fungo, insecto, planta, animal, humano ou células nucleadas de outros organismos pluricelulares) conterão igualmente sequências necessárias para terminação de transcrição e para estabilização de ARNm. Tais sequências estão habitualmente disponíveis a partir das regiões não traduzidas a 5' e ocasionalmente a 3' de ADN ou ADNc eucariótico ou virai. Estas regiões contêm segmentos de nucleótidos transcritos como fragmentos poliadenilados na parte não traduzida do ARNm que codifica PR05775.
Descrevem-se ainda outros métodos, vectores e células hospedeiras adequados para adaptação à síntese de PR05775 em cultura de células de vertebrado recombinantes em Gething et al., Nature, 293:620-625 (1981); Mantei et al., Nature, 281:40-46 (1979); EP 117 060; e EP 117 058. d. Detecção de amplificação/expressão qénica A amplificação e/ou expressão génica pode ser medida numa amostra directamente, por exemplo, por hibridação de Southern convencional, hibridação de Northern para quantificar a transcrição de ARNm [Thomas, Proc. Natl. Acad. Sei. USA, 7_7;5201-5205 (1980)], hibridação "dot blot" (análise de ADN), ou hibridação in sítu utilizando uma sonda adequadamente marcada com base nas sequências aqui proporcionadas. Alternativamente, podem utilizar-se anticorpos que podem reconhecer cadeias duplas específicas, incluindo cadeias duplas de ADN, cadeias duplas de ARN e cadeias duplas híbridas ADN-ARN ou cadeias duplas ADN-proteína. Os anticorpos podem por sua vez ser marcados e o ensaio pode ser efectuado no local em que a cadeia dupla se encontra ligada a uma superfície, de modo a que após formação de uma cadeia dupla na 81
ΕΡ 1 607 402 /PT superfície se possa detectar a presença de um anticorpo ligado à cadeia dupla.
Alternativamente, a expressão génica pode ser medida por métodos imunológicos, tal como coloração imuno-histoquímica de células ou secções de tecido e ensaio de cultura de células ou fluidos corporais para quantificar directamente a expressão de produto génico. Os anticorpos úteis para coloração imuno-histoquímica e/ou ensaio de fluidos de amostra podem ser quer monoclonais quer policlonais e podem ser preparado em qualquer mamífero. Convenientemente, os anticorpos podem ser preparados contra um polipéptido PR05775 de sequência nativa ou contra um péptido sintético baseado nas sequências de ADN aqui proporcionadas ou contra uma sequência exógena fundida com o ADN de PR05775 e codificando para um epítopo de anticorpo específico. e. Purificação do polipéptido
Podem recuperar-se formas de PR05775 do meio de cultura ou de lisados da célula hospedeira. Se estiverem ligadas à membrana podem ser libertadas da membrana utilizando uma solução de detergente adequada (por exemplo, Triton-X 100) ou por clivagem enzimática. As células utilizadas para expressão de PR05775 podem ser quebradas por diferentes meios físicos ou químicos tais como ciclos de congelamento-descongelamento, tratamento com ultra-sons, ruptura mecânica ou agentes de lise de células.
Pode pretender-se purificar PR05775 de proteínas ou polipéptidos de células recombinantes. Os seguintes procedimentos constituem exemplos de procedimentos de purificação adequados: fraccionamento numa coluna de permuta iónica; precipitação com etanol; HPLC em fase reversa; cromatografia em sílica ou numa resina de permuta catiónica tal como DEAE; electrofocagem; SDS-PAGE; precipitação com sulfato de amónio; filtração em gel utilizando, por exemplo, Sephadex G-75; colunas de proteína A-Sepharose para remover contaminantes tais como IgG; e colunas quelantes de metais para ligar formas marcadas com epítopo de PR05775. Podem utilizar-se diferentes métodos de purificação de proteína e tais métodos são conhecidos na especialidade e descritos por 82
ΕΡ 1 607 402 /PT exemplo em Deutscher, Methods in Enzymology, 182 (1990) ;
Scopes, Protein Purification: Principies and Practice,
Springer-Verlag, New York (1982). A(s) etapa(s) de purificação seleccionada(s) dependerão, por exemplo, da natureza do processo de produção utilizado e do PR05775 especifico produzido. E. Amplificação de genes que codificam polipéptidos PR05775 em células tumorais e linhas celulares O presente invento baseia-se na identificação e caracterização de genes que são amplificados em determinadas células de cancro. O genoma de organismos procarióticos e eucarióticos está sujeito a dois requisitos aparentemente contraditórios. Um é a preservação e propagação do ADN como informação genética na sua forma original para garantir herança estável através de várias gerações. Por outro lado, as células ou organismos devem ser capazes de se adaptarem de modo a resistirem a alterações ambientais. Os mecanismos de adaptação podem incluir modificações qualitativas ou quantitativas do material genético. As modificações qualitativas incluem mutações de ADN nas quais sequências de codificação são alteradas o que resulta numa proteína estrutural e/ou funcionalmente diferente. A amplificação génica é uma modificação quantitativa pela qual o número real de sequências de codificação de comprimento completo, ou seja, de genes, aumenta, o que leva a um número aumentado de moldes disponíveis para transcrição, um número aumentado de produtos de transcrição para traduzir e por último a uma abundância aumentada da proteína que é codificada pelo gene amplificado. O fenómeno de amplificação génica e os seus mecanismos subjacentes têm sido investigados in vitro em vários sistemas de cultura procarióticos e eucarióticos. O exemplo melhor caracterizado de amplificação génica envolve a cultura de células eucarióticas num meio contendo concentrações variáveis do fármaco citotóxico metotrexato (MTX). MTX é um análogo do ácido fólico e interfere com a síntese de ADN por bloqueio da enzima di-hidrofolato-redutase (DHFR). Durante a exposição inicial a concentrações baixas de MTX a maioria das células 83
ΕΡ 1 607 402 /PT (>99,9%) morrerá. Um pequeno número de células sobrevive e são capazes de crescer em concentrações crescentes de MTX através da produção de grandes quantidades de ARN e proteína DHFR. A base desta sobre-produção é a amplificação do gene DHFR único. As cópias adicionais do gene encontram-se sob a forma de cópias extracromossómicas sob a forma de cromossomas pequenos e supranumerários (diminutos duplos) ou como cópias cromossómicas integradas. A amplificação génica encontra-se mais habitualmente no desenvolvimento de resistência a fármacos citotóxicos (antibióticos para bactérias e agentes quimioterapêuticos para células eucarióticas) e transformação neoplásica. A transformação de uma célula eucariótica como um evento espontâneo ou devido a um insulto virai ou químico/ambiental está tipicamente associada a alterações do material genético dessa célula. Uma das alterações genéticas mais comummente observadas em malignidades humanas consiste em mutações da proteína p53. p53 controla a transição de células de uma fase estacionária (Gl) para replicativa (S) e evita esta transição na presença de danos do ADN. Noutras palavras, uma das principais consequências da desactivação de mutações p53 é a acumulação e propagação de danos de ADN, ou seja, alterações genéticas. Constituem tipos vulgares de alterações genéticas em células neoplásicas, além de mutações pontuais, amplificações e alterações estruturais grosseiras tais como translocações. A amplificação de sequências de ADN pode indicar um requisito funcional específico tal como ilustrado no sistema experimental DHFR. Assim, a amplificação de determinados oncogenes em malignidades indica um efeito causador desses genes no processo de transformação maligna e manutenção do fenótipo transformado. Estudos recentes têm apoiado esta hipótese. Por exemplo, revelou-se que a proteína bcl-2 era amplificada em determinados tipos de linfoma não Hodgkin. Esta proteína inibe a apoptose e leva à acumulação progressiva de células neoplásicas. Tem-se verificado que membros da família génica de receptores de factores de crescimento são amplificados em vários tipos de cancros o que sugere que a sobre-expressão desses receptores pode fazer com que as células neoplásicas sejam menos susceptíveis a quantidades 84
ΕΡ 1 607 402 /PT limitantes de factor de crescimento disponível. Constituem exemplos, entre outros, a amplificação de um receptor de androgénio no cancro da próstata recorrente durante terapia de privação de androgénio e a amplificação do homólogo do receptor de factor de crescimento ERB2 em cancro da mama. Por último, os genes envolvidos em sinalização intracelular e controlo da progressão do ciclo celular podem sofrer amplificação durante transformação maligna. Tal é ilustrado pela amplificação dos genes bcl-i e ras em diferentes neoplasmas epiteliais e linfóides.
Estes estudos anteriores ilustram a possibilidade de efectuar identificação de sequências de ADN amplificadas em neoplasmas, dado que esta abordagem pode identificar genes importantes para transformação maligna. O caso de ERB2 também demonstra a possibilidade de o fazer de um ponto de vista terapêutico, dado que as proteínas de transformação podem representar alvos novos e específicos para terapia de tumor.
Podem utilizar-se várias técnicas diferentes para demonstrar sequências genómicas amplificadas. A análise citogenética clássica das preparações de cromossoma preparadas a partir de células de cancro é adequada para identificar alterações estruturais grosseiras, tal como translocações, deleções e inversões. As regiões genómicas amplificadas podem apenas ser visualizadas caso envolvam regiões extensas com número de cópias elevado ou estejam presentes como material extra-cromossómico. Apesar da citogenética ter sido a primeira técnica que demonstrou uma associação consistente de alterações cromossómicas específicas com neoplasmas específicos, não é adequada para a identificação e isolamento de sequências de ADN manipuláveis. A técnica mais recentemente desenvolvida de hibridação genómica comparativa (CGH) ilustrou o fenómeno amplamente difundido de amplificação genómica em neoplasmas. Os ADN de tumor e normal são hibridados simultaneamente com metafases de células normais e o genoma completo pode ser rastreado por análise de imagem para sequências de ADN que se encontram presentes no tumor com uma frequência aumentada. (W093/18 186; Gray et al., Radiation
Res., 137:275-289 [1994]). Como um método de rastreio, este tipo de análise revelou um número elevado de amplicões (uma extensão de ADN amplificado) recorrentes em vários neoplasmas 85
ΕΡ 1 607 402 /PT humanos. Apesar de CGH ser mais sensível do que a análise citogenética clássica para a identificação de extensões amplificadas de ADN, aquela técnica não permite uma identificação e isolamento rápidos de sequências de codificação no interior do amplicão por técnicas de genética molecular padrão.
Os métodos mais sensíveis para detectar amplificação génica são os ensaios baseados na reacção de polimerização em cadeia (PCR). Estes ensaios utilizam uma quantidade muito pequena de ADN de tumor como material de partida, são extremamente sensíveis, proporcionam ADN que é passível de análise posterior tal como sequenciação e são adequados para análise de elevada quantidade e rendimento.
Os ensaio supra mencionados não são mutuamente exclusivos, mas são frequentemente utilizados em combinação para identificar amplificações em neoplasmas. Enquanto que a análise citogenética e CGH representam métodos de rastreio para analisar o genoma completo para regiões amplificadas, os ensaios baseados em PCR são mais adequados para identificação final de sequências de codificação, ou seja, genes em regiões amplificadas.
De acordo com o presente invento tais genes têm sido identificados por PCR quantitativo (S. Gelmini et al., Clin. Chem., £3:752 [1997]) por comparação de ADN proveniente de vários tumores primários, incluindo tumor de mama, pulmão, cólon, próstata, cérebro, fígado, rim, pâncreas, baço, timo, testículos, ovário, útero, etc. ou linhas celulares de tumor com ADN recolhido de dadores saudáveis. Efectuou-se PCR quantitativo utilizando um instrumento TaqMan™ (ABI). Conceberam-se iniciadores e sondas fluorigénicas específicas de gene com base nas sequências de codificação dos ADN.
As linhas de células de carcinoma do pulmão humano incluem A549 (SRCC768), Calu-1 (SRCC769), Calu-β (SRCC770), H157 (SRCC771), H441 (SRCC772), H460 (SRCC773), SKMES-1 (SRCC774), SW900 (SRCC775) , H522 (SRCC832),e H810 (SRCC833) , todas disponíveis na ATCC. As células de tumor do pulmão humano primário usualmente derivam de adenocarcinomas, carcinomas de células escamosas, carcinomas de células grandes, carcinomas 86
ΕΡ 1 607 402 /PT de células não pequenas, carcinomas de células pequenas, e carcinomas bronco-alveolares, e incluem, por exemplo, SRCC724 (adenocarcinoma, abreviado para "AdenoCa")(LT1), SRCC725 (carcinoma de células escamosas, abreviado para "SqCCa)(LTla), SRCC726 (adenocarcinoma)(LT2), SRCC727 (adenocarcinoma)(LT3), SRCC728 (adenocarcinoma)(LT4), SRCC729 (carcinoma de células escamosas)(LT6), SRCC730 (adeno/carcinoma de células escamosas) (LT7), SRCC731 (adenocarcinoma)(LT9), SRCC732 (carcinoma de células escamosas)(LT10), SRCC733 (carcinoma de células escamosas)(LTll), SRCC734 (adenocarcinoma)(LT12), SRCC735 (adeno/carcinoma de células escamosas)(LT13), SRCC736 (carcinoma de células escamosas)(LT15), SRCC737 (carcinoma de células escamosas)(LT16), SRCC738 (carcinoma de células escamosas)(LT17), SRCC739 (carcinoma de células escamosas)(LT18), SRCC740 (carcinoma de células escamosas)(LT19), SRCC741 (carcinoma de células do pulmão, abreviado para "LCCa")(LT21), SRCC811 (adenocarcinoma)(LT22), SRCC825 (adenocarcinoma)(LT8), SRCC886 (adenocarcinoma)(LT25), SRCC887 (carcinoma de células escamosas) (LT26), SRCC888 (adeno-BAC carcinoma) (LT27), SRCC889 (carcinoma de células escamosas) (LT28), SRCC890 (carcinoma de células escamosas) (LT29), SRCC891 (adenocarcinoma) (LT30), SRCC892 (carcinoma de células escamosas) (LT31), SRCC894 (adenocarcinoma) (LT33). Estão também incluídos os tumores do pulmão humanos designados por SRCC1125 [HF-000631], SRCC1127 [HF-000641] , SRCC1129 [HF-000842], SRCC1230 [HF-001296], e SRCC1236 [HF-000643], SRCC1133 SRCC1227 [HF-001291], [HF-001294], SRCC1231 SRCC1233 [HF-001297], [HF-001300] .
[HF-000840], SRCC1135 SRCC1229 [HF-001293], [HF-001295], SRCC1232 SRCC1235 [HF-001299],
As linhas de células de cancro do cólon incluem, por exemplo, as linhas de células da ATCC SW480 (adenocarcinoma, SRCC776). SW620 (metástases nos nódulos linfáticos do adenocarcinoma do cólon, SRCC777), Colo320 (carcinoma, SRCC778), HT29 (adenocarcinoma, SRCC779), HM7 (uma variante produtor de mucina com alto rendimento da linha de células de adenocarcinoma do cólon da ATCC, SRCC780, obtida do Dr. Robert Warren, UCSF), CaWiDr (adenocarcinoma, SRCC781 HCT116 (carcinoma, SRCC782), SKCOl (adenocarcinoma, SRCC783), SW403 (adenocarcinoma, SRCC784), LS174T (carcinoma, SRCC785), Colo205 (carcinoma, SRCC828), HCT15 (carcinoma, SRCC829), 87
ΕΡ 1 607 402 /PT HCC2998 (carcinoma, SRCC830), e KM12 (carcinoma, SRCC831) . Os tumores do cólon primários incluem os adenocarcinomas do cólon designados por CT2 (SRCC742), CT3 (SRCC743), CT8 (SRCC744), CT10 (SRCC745), CT12 (SRCC746) , CT14 (SRCC747), CT15 (SRCC748) , CT16 (SRCC749) , CT17 (SRCC750 ) , CT1 (SRCC751) , CT4 (SRCC752) , CT5 (SRCC753), CT6 (SRCC754), CT7 (SRCC755), CT9 (SRCC756) , CTl (SRCC757) . CT18 (SRCC758), CT19 (adenocarcinoma, SRCC906), CT20 (adenocarcinoma, SRCC907), CT21 (adenocarcinoma, SRCC908) . CT22 (adenocarcinoma, SRCC909), CT23 (adenocarcinoma, SRCC910), CT24 (adenocarcinoma, SRCC911), CT25 (adenocarcinoma, SRCC912). CT26 (adenocarcinoma, SRCC913), CT27 (adenocarcinoma, SRCC914), CT28 (adenocarcinoma, SRCC915), CT29 (adenocarcinoma, SRCC916), CT30 (adenocarcinoma, SRCC917), CT31 (adenocarcinoma, SRCC918), CT32 (adenocarcinoma, SRCC919), CT33 (adenocarcinoma, SRCC920), CT35 (adenocarcinoma, SRCC921), e CT36 (adenocarcinoma, SRCC922). Estão também incluídos centros de tumor do cólon humanos designados SRCC1051 [HF-000499], SRCC1052 [hf-000539], SRCC1053 [HF-000575], SRCC1054 [HF-000698], SRCC1059 [HF-000755], SRCC106 0 [HF-000756], SRCC1142 [HF-000762], SRCC1144 [HF-000789], SRCC1146 [HF-000795] e SRCC1148 [HF-000811] .
As linhas de células de carcinoma da mama humano incluem, por exemplo, HBL100 (SRCC759) , MB435s (SRCC760), T47D (SRCC761) , MB468 (SRCC762 ) , MB 175 (SRCC763), MB361 (SRCC764), BT20 (SRCC765) , MCF7 (SRCC766 ) e SKBR3 (SRCC767) , e o centro de tumor da mama humano designado SRCC1057 [HF-000545]. Estão também incluídos os tumores da mama humanos designados por SRCC1094, SRCC1095, SRCC1096, SRCC1097, SRCC1098, SRCC1099, SRCC1100, SRCC1101 e o tumor mama-met-pulmão-NS humano designado por SRCC893 [LT32].
Os tumores do recto humanos incluem SRCC981 [HF-000550] e SRCC982 [HF-000551].
Os centros de tumor do rim humano incluem SRCC989 [HF-000611] e SRCC1014 [HF-000613]. 88
ΕΡ 1 607 402 /PT Ο centro de tumor dos testículos humano incluem SRCC1001 [HF-000733] e a margem de tumor dos testículos SRCC999 [HF-000716].
Os tumores da paratiróide humanos incluem SRCC1002 [HF-000831] e SRCC1003 [HF-000832].
Os tumores dos nódulos linfáticos humanos incluem SRCC1004 [HF-000854], SRCC1005 [HF-000855] eSRCCl006 [HF-000856]. F. Distribuição tissular
Os resultados dos presentes ensaios de amplificação génica podem ser verificados por estudos adicionais, tal como, por determinação de expressão de ARNm em diferentes tecidos humanos.
Tal como referido supra, pode medir-se amplificação génica e/ou expressão génica em diferentes tecidos por hibridação de Southern convencional, hibridação de Northern para quantificar a transcrição de ARNm (Thomas, Proc. Natl. Acad. Sei. USA, 7_7; 5201-5205 [1980]), hibridação dot blot (análise de ADN) ou hibridação ín situ utilizando uma sonda adequadamente marcada com base nas sequências aqui proporcionadas. Alternativamente, podem utilizar-se anticorpos que podem reconhecer cadeias duplas especificas, incluindo cadeias duplas de ADN, cadeias duplas de arn e cadeias duplas híbridas adn-arn ou cadeias duplas ADN-proteína. A expressão génica em diferentes tecidos pode ser alternativamente medida por métodos imunológicos tais como coloração imuno-histoquímica de secções de tecido e ensaio de cultura de células ou fluidos corporais, para quantificar directamente a expressão de produto génico. Os anticorpos úteis para coloração imuno-histoquímica e/ou ensaio de fluidos de amostra podem ser quer monoclonais quer policlonais e podem ser preparados em qualquer mamífero. Convenientemente, os anticorpos podem ser preparados contra uma sequência de polipéptido PR05775 nativa ou contra um péptido sintético baseado nas sequências de ADN aqui proporcionadas ou contra uma sequência exógena fundida com a sequência de ADN de PR05775 e que codifica para um epítopo de anticorpo 89 ΕΡ 1 607 402 /PT específico. Proporcionam-se aqui infra técnicas gerais para gerar anticorpos e protocolos especiais para hibridação de Northern e hibridação in situ. G. Mapeamento de cromossomas
Se a amplificação de um determinado gene é funcionalmente relevante, então esse gene deve ser mais amplificado do que as regiões genómicas vizinhas que não são importantes para a sobrevivência do tumor. Para ensaiar esta hipótese o gene pode ser mapeado num cromossoma específico, por exemplo, por análise de híbrido de radiação. O nível de amplificação é então determinado na localização identificada e na região genómica vizinha. A amplificação selectiva ou preferencial numa região genómica para a qual o gene foi mapeado é consistente com a possibilidade da amplificação génica observada promover crescimento ou sobrevivência de tumor. O mapeamento de cromossoma inclui tanto mapeamento de esqueleto como de epicentro. Para detalhes adicionais consultar, por exemplo, Stewart et al., Genome Research, 1_:A22-A33 (1997). H. Estudos de ligação de anticorpos
Os resultados do estudo de amplificação génica podem ser adicionalmente verificados por estudos de ligação de anticorpo nos quais se ensaia a capacidade de anticorpos anti-PR0577 inibirem a expressão de polipéptidos PR05775 em células tumorais (cancro). Constituem exemplos de anticorpos, entre outros, anticorpos policlonais, monoclonais, humanizados, biespecíficos e heteroconjugados cuja preparação será aqui descrita infra.
Os estudos de ligação de anticorpos podem ser efectuados segundo qualquer método de ensaio conhecido, tal como ensaios de ligação competitiva, ensaios em sanduíche directos ou indirectos e ensaios de imunoprecipitação. Zola, Monoclonal Antibodies: A Manual of Techniques, p. 147-158 (CRC Press, Inc., 1987).
Os ensaios de ligação competitiva baseiam-se na capacidade de um padrão marcado competir com o analito da amostra de teste relativamente a ligação com uma quantidade limitada de 90
ΕΡ 1 607 402 /PT anticorpo. A quantidade de proteína alvo (codificada por um gene amplificado numa célula tumoral) na amostra de teste é inversamente proporcional à quantidade de padrão que se liga aos anticorpos. Para facilitar a determinação da quantidade de padrão que se liga, os anticorpos são de preferência insolubilizados antes ou após a competição de modo a que o padrão e o analito que estão ligados aos anticorpos possam ser convenientemente separados do padrão e analito que permanecem não ligados.
Os ensaios em sanduíche envolvem a utilização de dois anticorpos sendo cada um capaz de se ligar a uma parte imunogénica ou epítopo diferentes da proteína a detectar. Num ensaio em sanduíche o analito da amostra de teste liga-se a um primeiro anticorpo que está imobilizado num suporte sólido e seguidamente liga-se um segundo anticorpo ao analito, formando assim um complexo tripartido insolúvel. Consultar, por exemplo, patente U.S. n.° 4 376 110. O segundo anticorpo pode estar ele próprio marcado com uma parte detectável (ensaio em sanduíche directo) ou pode ser medido utilizando um anticorpo anti-imunoglobulina que está marcado com uma parte detectável (ensaio em sanduíche indirecto). Por exemplo, um ensaio ELISA consiste num tipo de ensaio em sanduíche em que a parte detectável é uma enzima.
Para imuno-histoquímica, a amostra de tumor pode ser fresca ou congelada ou pode estar embebida em parafina e fixada com um conservante tal como formalina, por exemplo. I. Ensaios de tumores baseados em células
Os ensaios baseados em células e modelos animais para tumores (por exemplo, cancros) podem ser utilizados para verificar as revelações do ensaio de amplificação génica e compreender adicionalmente a relação entre os genes aqui identificados e o desenvolvimento e patogénese do crescimento celular neoplásico. O papel de produtos génicos aqui identificados no desenvolvimento e patologia de tumor ou cancro pode ser ensaiado utilizando células de tumor primário ou linhas celulares que se identificaram como capazes de amplificar os presentes genes. Tais células incluem, por 91
ΕΡ 1 607 402 /PT exemplo, células de cancro de mama, cólon e pulmão e as linhas celulares referidas supra.
Numa abordagem diferente, células de um tipo celular que se sabe estar envolvido num tumor especifico são transfectadas com os presentes ADNc e analisa-se a capacidade destes ADNc induzirem crescimento excessivo. Constituem células adequadas, entre outras, por exemplo, células de linhas tumorais estáveis tais como a linha celular B104-1-1 (linha celular estável NIH-3T3 transfectada com o proto-oncogene neu) e células NIH-3T3 transfectadas com ras que podem ser transfectadas com o gene pretendido e monitorizadas relativamente a crescimento tumorigénico. Tais linhas celulares transfectadas podem então ser utilizadas para ensaiar a capacidade de anticorpos policlonais ou monoclonais ou composições de anticorpos inibirem crescimento celular tumorigénico exercendo actividades citostática ou citotóxica sobre o crescimento das células transformadas ou mediando citotoxicidade celular dependente de anticorpo (ADCC). As células transfectadas com as sequências de codificação dos genes aqui identificados podem ser adicionalmente utilizadas para identificar candidatos a fármacos para o tratamento de cancro.
Adicionalmente, podem utilizar-se culturas primárias derivadas de tumores em animais transgénicos (tal como descrito infra) nos presentes ensaios baseados em células, apesar de se preferirem linhas celulares estáveis. São bem conhecidas na especialidade técnicas para derivar linhas celulares continuas a partir de animais transgénicos (consultar, por exemplo, Small et al.r Mol. Cell. Biol., 5:642-648 [1985]). J. Modelos animais
Podem utilizar-se vários modelos animais bem conhecidos para entender adicionalmente o papel dos genes aqui identificados no desenvolvimento e patogénese de tumores e para ensaiar a eficácia de agentes terapêuticos candidatos, incluindo anticorpos e outros antagonistas dos polipéptidos nativos, incluindo antagonistas de moléculas pequenas. A natureza in vivo de tais modelos torna-os adequados para previsão de respostas em doentes humanos. Os modelos animais 92
ΕΡ 1 607 402 /PT de tumores e cancros (por exemplo, cancro de mama, cancro de cólon, cancro de próstata, cancro de pulmão, etc.) incluem animais (transgénicos) tanto não recombinantes como recombinantes. Os modelos animais não recombinantes incluem, por exemplo, roedores, por exemplo, modelos murinos. Tais modelos podem ser gerados introduzindo células tumorais em ratinhos singenésicos utilizando técnicas padrão, por exemplo, injecção subcutânea, injecção na veia da cauda, implante no baço, implante intraperitoneal, implante sob a cápsula renal ou implante "Orthopin", por exemplo, células de cancro de cólon implantadas em tecido de cólon. (Consultar, por exemplo, publicação PCT n.° WO 97/33551, publicada a 18 de Setembro de 1997) .
Provavelmente, a espécie animal mais habitualmente utilizada em estudos oncológicos é a de ratinhos imunodeficientes, em particular, ratinhos nus. A observação que ratinhos nus com hipoplasia/aplasia podem funcionar com sucesso como hospedeiros de xenoenxertos de tumores humanos, levou à vulgarização da sua utilização com este objectivo. O gene nu autossómico recessivo foi introduzido num grande número de estirpes recombinantes diferentes de ratinhos nus, incluindo, por exemplo, ASW, A/He, AKR, BALB/c, B10.LP, C17, C3H, C57BL, C57, CBA, DBA, DDD, Ι/st, NC, NFR, NFS, NFS/N, NZB, NZC, NZW, P, RIII e S JL. Além disso, têm-se criado e utilizado uma grande variedade de outros animais com deficiências imunológicas herdadas, diferentes de ratinhos nus, como recebedores de xenoenxertos de tumor. Para detalhes adicionais consultar, por exemplo, The Nude Mouse in Oncology Research, E. Boven e B. Winograd, ed., CRC Press, Inc., 1991.
As células introduzidas em tais animais podem ser derivadas de linhas celulares conhecidas de tumor/cancro, tal como qualquer das linhas celulares de tumor descritas supra e por exemplo, a linha celular B104-1-1 (linha celular NIH-3T3 estável transfectada com o proto-oncogene neu); células NIH-3T3 transfectadas com ras; Caco-2 (ATCC htb-37); uma linha celular de adenocarcinoma de cólon humano moderadamente bem diferenciada de grau II, HT-29 (ATCC HTB-38) ou de tumores e cancros. Podem obter-se amostras de tumores ou células de cancro a partir de doentes submetidos a intervenção cirúrgica, utilizando condições padrão envolvendo congelamento e 93 ΕΡ 1 607 402 /PT armazenagem em azoto líquido (Karmali et al., Br. J. Câncer, £8: 689-696 [1983]) .
Podem introduzir-se células tumorais em animais, tal com ratinhos nus, através de vários procedimentos. O espaço subcutâneo (s.c.) do ratinho é muito adequado para implante de tumor. Os tumores podem ser transplantados s.c. como blocos sólidos, como biópsias efectuadas com agulha por utilização de uma troca ou como suspensões celulares. Para implante de bloco sólido ou de troca, introduzem-se fragmentos de tecido de tumor de tamanho adequado no espaço s.c.. As suspensões celulares são preparadas de fresco a partir de tumores primários ou linhas celulares de tumor estáveis e injectadas por via subcutânea. As células tumorais podem também ser injectadas como implantes subdérmicos. Nesta localização, deposita-se o inoculo entre a parte inferior do tecido conjuntivo dérmico e o tecido s.c.. Boven e Winograd (1991), supra.
Podem gerar-se modelos animais de cancro de mama, por exemplo, por implante de células de neuroblastoma de rato (das quais se isolou inicialmente o oncogene neu) ou de células NIH-3T3 transformadas com neu em ratinhos nus, essencialmente como descrito por Drebin et al., PNAS USA, 83:9129-9133 (1986) .
De igual modo, podem gerar-se modelos animais de cancro de cólon por passagem de células de cancro de cólon para animais, por exemplo, ratinhos nus, levando ao aparecimento de tumores nesses animais. Descreveu-se um modelo de transplante ortotópico de cancro de cólon humano em ratinhos nus, por exemplo, em Wang et al., Câncer Research, 54:4726-4728 (1994) e Too et al., Câncer Research, 5_5:681 — 684 (1995). Este modelo baseia-se no denominado "METAMOUSE" vendido por AntiCancer, Inc., (San Diego, Califórnia).
Os tumores que ocorrem em animais podem ser removidos e cultivados in vitro. As células das culturas in vitro podem então ser passadas para animais. Tais tumores podem servir como alvos para ensaio posterior ou rastreio de fármacos. Alternativamente, os tumores que resultam da passagem podem ser isolados e o ARN de células pré-passagem e de células 94
ΕΡ 1 607 402 /PT isoladas após um ou mais ciclos de passagem pode ser analisado relativamente a expressão diferencial de genes de interesse. Tais técnicas de passagem podem ser efectuadas com quaisquer linhas celulares conhecidas de tumor ou cancro.
Por exemplo, Meth A, CMS4, CMS5, CMS21 e WEHI-164 são fibrossarcomas induzidos quimicamente em ratinhos fêmea BALB/c (DeLeo et al., J. Exp. Med., 146:720 [1977]), que proporcionam um sistema modelo altamente controlado para estudo de actividades antitumorais de diferentes agentes (Palladino et al., J. Immunol., 138:4023-4032 [1987]). Sucintamente, propagam-se células tumorais In vitro em cultura de células. Antes da injecção nos animais, lavam-se as linhas celulares e suspendem-se em tampão a um densidade celular de cerca de 10xl06 a 10xl07 células/ml. Os animais são então infectados por via subcutânea com 10 a 100 μΐ da suspensão celular, decorrendo uma a três semanas até aparecimento de um tumor.
Adicionalmente, o carcinoma de Lewis de pulmão (3LL) de ratinho, que é um dos tumores experimentais mais amplamente estudado, pode ser utilizado como modelo de tumor para investigação. A eficácia neste modelo de tumor foi correlacionada com efeitos benéficos no tratamento de doentes humanos diagnosticados com carcinoma de células pequenas do pulmão (SCCL). Este tumor pode ser introduzido em ratinhos normais por injecção de fragmentos de tumor de um ratinho afectado ou de células mantidas em cultura (Zupi et al., Br. J. Câncer, 4_l:supl. 4:309 [1980]) e a evidência experimental indica que podem ser iniciados tumores a partir de injecção de apenas uma célula e que uma grande proporção de células infectadas de tumor sobrevive. Para informação adicional sobre este modelo de tumor consultar Zacharski, Haemostasis, 16:300-320 [1986]).
Um modo de avaliar a eficácia de um composto de teste num modelo animal ou num tumor implantado consiste em medir a dimensão do tumor antes e após tratamento. Tradicionalmente, a dimensão de tumores implantados tem sido medida com uma craveira em duas ou três dimensões. A medição limitada a duas dimensões não reflecte rigorosamente a dimensão do tumor sendo que esta é habitualmente convertida no volume correspondente utilizando uma fórmula matemática. Contudo, a medição das 95
ΕΡ 1 607 402 /PT dimensões do tumor é muito pouco rigorosa. Os efeitos terapêuticos de um fármaco candidato podem ser melhor descritos como atraso de crescimento e atraso de crescimento específico induzidos pelo tratamento. Outra variável importante na descrição do crescimento do tumor é o tempo de duplicação do volume do tumor. Encontram-se igualmente disponíveis programas de computador para o cálculo e descrição de crescimento de tumor, tal como o programa relatado por Rygaard e Spang-Thomsen, Proc. 6th Int Workshop on Immune-Deficient Animais. Wu e Sheng ed., Basileia, 1989, 301.
Note-se contudo que necrose e respostas inflamatórias a seguir ao tratamento podem resultar de facto num aumento das dimensões do tumor, pelo menos inicialmente. Consequentemente, estas alterações devem ser cuidadosamente monitorizadas através de uma combinação de um método morfométrico e de análise de citometria de fluxo.
Podem conceber-se racionalmente modelos animais recombinantes (transgénicos) por introdução da parte de codificação dos genes aqui identificados no genoma de animais de interesse utilizando técnicas padrão para produção de animais transgénicos. Os animais que podem servir como um alvo para manipulação transgénica incluem, entre outros, ratinhos, ratos, coelhos, porquinhos-da-índia, ovelhas, cabras, porcos e primatas não humanos, por exemplo, babuínos, chimpanzés e macacos. Constituem técnicas conhecidas na especialidade para introduzir um transgene em tais animais, entre outras, micro-injecção pró-nucleica (Hoppe e Wanger, patente U.S. n.° 4 873 191); transferência génica para linhas germinais mediada por retrovírus (por exemplo, Van der Putten et al., Proc. Natl. Acad. Sei. USA, 8_2:6148-615 [1985]); ter como alvo genes em células estaminais embrionárias (Thompson et al., Cell, 5^:313-321 [1989]); electroporação de embriões (Lo, Mol. Cell Biol, 3^1803-1814 [1983]); transferência génica mediada por esperma (Lavitrano et al., Cell, 5_7:717-73 [1989]). Para uma revisão, consultar, por exemplo, patente U.S. n.° 4 736 866.
Para os objectivos do presente invento constituem animais transgénicos, entre outros, os que transportam o transgene apenas em parte das suas células ("animais mosaico"). O transgene pode ser integrado quer como um transgene único quer como concatâmeros, por exemplo, estruturas em tandem cabeça- 96
ΕΡ 1 607 402 /PT com-cabeça ou cabeça-com-cauda. A introdução selectiva de um transgene num tipo de célula especifico é também possível seguindo, por exemplo, a técnica de Lasko et al., Proc. Natl. Acad. Sei. USA, 89:6232-636(1992). A expressão do transgene em animais transgénicos pode ser monitorizada por técnicas padrão. Por exemplo, pode utilizar-se análise de hibridação de Southern ou amplificação por PCR para verificar a integração do transgene. O nivel de expressão de ARNm pode então ser analisado utilizando técnicas tais como hibridação in situ, análise de hibridação de Northern, PCR ou imunocitoquimica. Os animais são posteriormente analisados relativamente a sinais de desenvolvimento de tumor ou cancro.
Alternativamente, podem construir-se animais J‘knock out" que apresentam um gene deficiente ou alterado que codifica um polipéptido PR05775 aqui identificado, em resultado de recombinação homóloga entre o gene endógeno que codifica o polipéptido e o adn genómico que codifica o mesmo polipéptido introduzido numa célula embrionária do animal. Por exemplo, pode utilizar-se ADNc que codifica um polipéptido PR05775 para clonar ADN genómico que codifica esse polipéptido de acordo com técnicas estabelecidas. Uma parte do ADN genómico que codifica um polipéptido PR05775 especifico pode ser eliminada ou substituída por outro gene, tal como um gene que codifica um marcador seleccionável que pode ser utilizado para monitorizar integração. Tipicamente, incluem-se no vector várias quilobases de ADN flanqueador não alterado (tanto na extremidade 5' com na extremidade 3') [consultar, por exemplo, Thomas e Capecchi, Cell, 51.:503 (1987) para uma descrição de vectores de recombinação homóloga]. Introduz-se o vector numa linha celular estaminal embrionária (por exemplo, por electroporação) e seleccionam-se células nas quais o ADN introduzido se recombinou de modo homólogo com o ADN endógeno [consultar, por exemplo, Li et al., Cell, 6_9:915 (1992)]. As células seleccionadas são então injectadas num blastocisto de um animal (por exemplo, um ratinho ou rato) para formar quimeras de agregação [consultar, por exemplo, Bradley em Teratocarcinomas and Embryonic Stem Cells: A Practical Approach, E. J. Robertson, ed. (IRL, Oxford, 1987), p. 113-152] . Pode então implantar-se um embrião quimérico num animal hospedeiro fêmea pseudo-grávida adequada e o embrião pode ser 97
ΕΡ 1 607 402 /PT
levado a termo para criar um animal "knock out". Pode identificar-se uma descendência que apresenta o ADN recombinado de modo homólogo nas suas células germinais através de técnicas padrão e utilizadas para criar animais nos quais todas as células do animal contêm o ADN recombinado de modo homólogo. Podem então caracterizar-se os animais "knock out" por exemplo, através da sua capacidade de se defenderem contra determinadas condições patológicas e pelo seu desenvolvimento de condições patológicas devidas à ausência do polipéptido PR05775. A eficácia de anticorpos que se ligam especificamente aos polipéptidos aqui identificados e a outros fármacos candidatos pode ser também ensaiada no tratamento de tumores animais espontâneos. Constitui um alvo adequado para tais estudos o carcinoma de células escamosas (SCC) oral felino. O SCC oral felino é um tumor maligno altamente invasivo que constitui a malignidade oral mais comum em gatos, sendo responsável por mais de 60% dos tumores orais relatados nesta espécie. Raramente forma metástases para locais distantes, apesar desta reduzida incidência de metástases poder ser meramente um reflexo dos tempos de sobrevivência curtos dos gatos com este tumor. Estes tumores não são habitualmente passíveis de cirurgia, principalmente devido à anatomia da cavidade oral felina. Presentemente não existe tratamento eficaz para este tumor. Antes da entrada para o presente estudo, cada gato sujeita-se a um exame clínico completo, biopsia e é submetido a tomografia axial computorizada (TAC). Os gatos nos quais se diagnosticam tumores de células escamosas orais sublinguais são excluídos do presente estudo. A língua pode então paralisar em resultado de tal tumor e mesmo se o tratamento matar o tumor os animais podem não ser capazes de se alimentar sozinhos. Cada gato é tratado repetidamente ao longo de um período de tempo. Tirar-se-ão diariamente fotografias dos tumores durante o período de tratamento e a cada reverificação subsequente. Após o tratamento submete-se cada gato a uma nova TAC. Cada TAC e radiografia torácica é avaliada de 8 em 8 semanas daí em diante. Os dados são avaliados relativamente a diferenças em sobrevivência, resposta e toxicidade comparativamente com grupos de controlo. Uma resposta positiva pode requerer evidência de regressão de tumor, de preferência 98
ΕΡ 1 607 402 /PT com melhoria da qualidade de vida e/ou aumento da esperança de vida.
Adicionalmente, podem também ensaiar-se outros tumores animais espontâneos tais como fibrossarcoma, adenocarcinoma, linfoma, condroma, leiomiossarcoma de cães, gatos e babuínos. De entre estes, o adenocarcinoma da mama de cães e gatos é um modelo preferido dado que o seu aparecimento e comportamento são muito semelhantes aos dos humanos. Contudo, a utilização deste modelo limita-se à rara ocorrência deste tipo de tumor em animais. K. Ensaios de rastreio para candidatos a fármacos
Os ensaios de rastreio para candidatos a fármacos concebem-se para identificar compostos que se ligam ou complexam com os polipéptidos codificados pelos genes aqui identificados ou que interferem de outro modo com a interacção dos polipéptidos codificados com outras proteínas celulares. Tais ensaios de rastreio incluirão ensaios passíveis de rastreio de elevada quantidade e rendimento de bibliotecas de compostos químicos, tornando-os particularmente adequados para identificar candidatos a fármacos de moléculas pequenas. Encontram-se abrangidas moléculas pequenas tais como compostos orgânicos ou inorgânicos sintéticos incluindo péptidos, de preferência péptidos solúveis, fusões (poli)péptido-imunoglobulina e em particular anticorpos incluindo, entre outros, anticorpos policlonais e monoclonais e fragmentos de anticorpo, anticorpos de cadeia simples, anticorpos anti-idiotípicos e versões quiméricas ou humanizadas de tais anticorpos ou fragmentos assim como anticorpos e fragmentos de anticorpos humanos. Os ensaios podem ser efectuados em diferentes formatos incluindo ensaios de ligação proteína-proteína, ensaios de rastreio bioquímico, imunoensaios e ensaios baseados em células, que se encontram bem caracterizados na especialidade.
Todos os ensaios têm em comum o facto de necessitarem de contacto entre o fármaco candidato e um polipéptido codificado por ácido nucleico aqui identificado em condições e durante um intervalo de tempo suficiente para permitir que essas duas componentes interajam. 99
ΕΡ 1 607 402 /PT
Em ensaios de ligação, a interacção é ligação e o complexo formado pode ser isolado ou detectado na mistura reaccional. Numa concretização especifica, o polipéptido codificado pelo gene aqui identificado ou o fármaco candidato é imobilizado numa fase sólida, por exemplo, numa placa de microtitulação, por ligações covalentes ou não covalentes. A ligação não covalente é geralmente obtida por revestimento da superfície sólida com uma solução do polipéptido e secagem. Alternativamente, pode utilizar-se um anticorpo imobilizado, por exemplo, um anticorpo monoclonal específico para o polipéptido a imobilizar para o ancorar a uma superfície sólida. O ensaio é efectuado por adição da componente não imobilizada, que pode ser marcada por um marcador detectável, à componente imobilizada, por exemplo, a superfície revestida contendo a componente ancorada. Quando a reacção se completa, removem-se as componentes que não reagiram, por exemplo, por lavagem e detectam-se os complexos ancorados à superfície sólida. Quando a componente originalmente não imobilizada transporta um marcador detectável a detecção de marcador imobilizado à superfície indica que ocorreu complexação. Nos casos em que a componente originalmente não imobilizada não transporta um marcador pode detectar-se complexação, por exemplo, utilizando um anticorpo marcado que liga especificamente o complexo imobilizado.
Se o composto candidato interage sem se ligar a um polipéptido PR05775 específico codificado por um gene aqui identificado, a sua interacção com esse polipéptido pode ser ensaiada com métodos bem conhecidos de detecção de interacções proteína-proteína. Tais ensaios incluem abordagens tradicionais tais como reticulação, co-imunoprecipitação e co-purificação através de gradientes ou colunas cromatográficas. Adicionalmente, podem monitorizar-se interacções proteína-proteína utilizando um sistema genético baseado em levedura descrito por Fields e colaboradores [Fields e Song, Nature, 340:245-246 (1989); Chien et al., Proc. Natl. Acad. Sei. USA, 88: 9578-9582 (1991)] tal como revelado por Chevray e Nathans, Proc. Natl. Acad. Sei. USA, 8_9:5789-5793 (1991)]. Muitos activadores de transcrição, tal como GAL4 de levedura, consistem de dois domínios modulares fisicamente discretos actuando um deles como domínio de ligação de ADN enquanto que 100
ΕΡ 1 607 402 /PT ο outro funciona como domínio de activação de transcrição. O sistema de expressão de levedura descrito nas publicações supra (referido de um modo geral como "sistema de dois híbridos") aproveita esta propriedade e utiliza duas proteínas híbridas, uma em que a proteína alvo se encontra fundida com o domínio de ligação de ADN de GAL4 e outra na qual se fundem proteínas de activação candidatas com o domínio de activação. A expressão de um gene repórter GALl-lacZ sob o controlo de um promotor activado por GAL4 depende da reconstituição de actividade GAL4 através de interacção proteína-proteína. Detectam-se colónias contendo polipéptidos em interacção com um substrato cromogénico para β-galactosidase. Encontra-se comercialmente disponível de Clontech um kit completo (MATCHMAKER™) para identificar interacções proteína-proteína entre duas proteínas específicas utilizando a técnica de dois híbridos. Este sistema pode também ser estendido ao mapeamento de domínios de proteína envolvidos em interacções específicas de proteína assim como para identificar resíduos de aminoácidos que são cruciais para essas interacções.
Os compostos que interferem com a interacção de um gene que codifica PR05775, PR0313 aqui identificados e outras componentes intracelulares ou extracelulares podem ser ensaiados da seguinte forma: usualmente prepara-se uma mistura reaccional contendo o produto do gene amplificado e a componente intracelular ou extracelular sob condições e durante um período de tempo que permita a interacção e ligação dos dois produtos. Para ensaiar a capacidade do composto de teste para inibir ligação, corre-se a reacção na ausência e na presença do composto de teste. Adicionalmente, pode adicionar-se um placebo a uma terceira mistura reaccional, para servir como um controlo positivo. A ligação (formação de complexo) entre o composto de teste e a componente intracelular ou extracelular presente na mistura é monitorizada tal como aqui descrito supra. A formação de um complexo na(s) reacção(ões) de controlo mas não na mistura reaccional contendo o composto de teste indica que o composto de teste interfere com a interacção do composto de teste com o seu parceiro reaccional.
Para ensaiar para antagonistas, pode adicionar-se o polipéptido PR05775 a uma célula juntamente com o composto a 101 ΕΡ 1 607 402 /PT ser rastreado para uma actividade específica e a capacidade do composto inibir a actividade de interesse na presença do polipéptido PR05775 indica que o composto é um antagonista para o polipéptido PR05775. Alternativamente, podem detectar-se antagonistas por combinação do polipéptido PR05775 e um antagonista potencial com receptores de polipéptido PR05775 ou receptores recombinantes, ligados a membrana, em condições adequadas para um ensaio de inibição competitiva. O polipéptido PR05775 pode ser marcado, tal como por radioactividade, de modo que o número de moléculas de polipéptido PR05775 ligadas ao receptor pode ser utilizado para determinar a eficácia do antagonista potencial. O gene que codifica o receptor pode ser identificado por numerosos métodos conhecidos dos peritos na especialidade, por exemplo, ciclos de selecção ("panning") com ligandos e triagem por FACS. Coligan et al., Current Protocols in Immun., 1(2): Capítulo 5 (1991). De preferência, utiliza-se clonagem de expressão em que se prepara ARN poliadenilado a partir de uma célula que responde ao polipéptido PR05775 e divide-se uma biblioteca de ADNc, criada a partir deste ARN, em conjuntos e utiliza-se para transfectar células COS ou outras células que não respondem ao polipéptido PR05775. Expõe-se células transfectadas, que são cultivadas em lâminas de vidro, a polipéptido PR05775 marcado. O polipéptido PR05775 pode ser marcado por vários meios incluindo iodação ou inclusão de um local de reconhecimento para uma proteína quinase específica de local. Após fixação e incubação, sujeitam-se as lâminas a análise por autorradiografia. Identificam-se os conjuntos positivos e preparam-se subconjuntos e novamente transfectam-se utilizando um processo interactivo de formação de subconjuntos e novo rastreio, originando eventualmente um clone único que codifica o suposto receptor.
Como uma abordagem alternativa para identificação de receptor, pode ligar-se por foto-afinidade polipéptido PR05775 marcado com preparações de membrana ou extracto celulares que expressam a molécula de receptor. Resolve-se o material reticulado por PAGE e expõe-se a película de raios X. Pode excisar-se o complexo marcado contendo o receptor, resolver-se em fragmentos de péptido e sujeitar-se a micro-sequenciação de proteína. A sequência de aminoácidos obtida por micro-sequenciação seria utilizada para conceber um conjunto de 102
ΕΡ 1 607 402 /PT sondas de oligonucleótido degeneradas para rastrear uma biblioteca de ADNc, para identificar o gene que codifica o suposto receptor.
Noutro ensaio para antagonistas, incubar-se-iam células de mamífero ou uma preparação de membrana que expressa o receptor com polipéptido PR05775 marcado, na presença do composto candidato. A capacidade do composto aumentar ou bloquear esta interacção poderia então ser medida.
Constituem exemplos mais específicos de antagonistas potenciais, entre outros, um oligonucleótido que se liga às fusões de imunoglobulina com o polipéptido PR05775 e, em particular, anticorpos incluindo, entre outros, anticorpos policlonais e monoclonais e fragmentos de anticorpo, anticorpos de cadeia simples, anticorpos anti-idiotipicos e versões quiméricas ou humanizadas de tais anticorpos ou fragmentos, bem como anticorpos e fragmentos de anticorpo humanos. Alternativamente, um antagonista potencial pode ser uma proteína estreitamente relacionada, por exemplo, uma forma mutada do polipéptido PR05775 que reconhece o receptor mas não provoca qualquer efeito, inibindo assim competitivamente a acção do polipéptido PR05775.
Outro antagonista potencial de polipéptido PR05775 é uma construção de ARN ou ADN anti-sentido preparada utilizando tecnologia anti-sentido em que, por exemplo, uma molécula de ARN ou de ADN anti-sentido actua para bloquear directamente a tradução de ARNm por hibridação a ARNm alvo e evitando a tradução de proteína. A tecnologia anti-sentido pode ser utilizada para controlar a expressão génica através de formação de hélice tripla ou ADN ou ARN anti-sentido, em que ambos os métodos se baseiam na ligação de um polinucleótido a ADN ou ARN. Por exemplo, a parte de codificação 5' da sequência de polinucleótido, que aqui codifica o polipéptido PR05775 maduro, é utilizada para conceber um oligonucleótido de arn anti-sentido desde cerca de 10 a 40 pares de bases de comprimento. Concebe-se um oligonucleótido de ADN de modo a ser complementar a uma região do gene envolvida em transcrição (hélice tripla - consultar Lee et al., Nucl. Acids Res., _6_:3073 (1979); Cooney et al., Science, 241: 456 (1988): Dervan et al., Science, 251:1360 (1991)), evitando assim transcrição 103 ΕΡ 1 607 402 /PT e a produção do polipéptido PR05775. O oligonucleótido de ARN anti-sentido híbrida com o ARNm in vivo e bloqueia a tradução da molécula de ARNm para o polipéptido PR05775 (anti-sentido -Okano, Neurochem., 5_6:560 (1991); Oligodeoxynucleotides as Anti-sense Inhibitors of Gene Expression (CRC Press: Boca Raton, Florida, 1988). Os oligonucleótidos descritos supra podem também ser entregues a células de modo que o ARN ou ADN anti-sentido possa ser expresso in vivo para inibir a produção do polipéptido PR05775. Quando se utiliza adn anti-sentido, preferem-se oligodesoxirribonucleótidos derivados do local de iniciação de tradução, por exemplo, entre cerca de -10 e +10 posições da sequência de nucleótidos do gene alvo.
As moléculas de ARN ou ADN anti-sentido têm, em geral, pelo menos cerca de 5 bases de comprimento, cerca de 10 bases de comprimento, cerca de 15 bases de comprimento, cerca de 20 bases de comprimento, cerca de 25 bases de comprimento, cerca de 30 bases de comprimento, cerca de 35 bases de comprimento, cerca de 40 bases de comprimento, cerca de 45 bases de comprimento , cerca de 50 bases de comprimento, cerca de 55 bases de comprimento, cerca de 60 bases de comprimento, cerca de 65 bases de comprimento, cerca de 70 bases de comprimento , cerca de 75 bases de comprimento, cerca de 80 bases de comprimento, cerca de 85 bases de comprimento, cerca de 90 bases de comprimento, cerca de 95 bases de comprimento, cerca de 100 bases de comprimento, ou mais .
Os antagonistas potenciais incluem moléculas pequenas que se ligam ao local activo, o local de ligação do receptor ou factor de crescimento ou outro local de ligação relevante do polipéptido PR05775, bloqueando assim a actividade biológica normal do polipéptido PR05775. Constituem exemplos de moléculas pequenas, entre outros, péptidos ou moléculas do tipo péptido pequenas, de preferência péptidos solúveis, e compostos orgânicos ou inorgânicos não peptidilo sintéticos.
As ribozimas são moléculas de ARN enzimáticas capazes de catalisar a clivagem específica de ARN. As ribozimas actuam por hibridação específica de sequência a ARN alvo complementar, seguida por clivagem endonucleolítica. Podem identificar-se locais de clivagem por ribozima específicos 104
ΕΡ 1 607 402 /PT dentro de um ARN alvo potencial por técnicas conhecidas. Para mais detalhes consultar, por exemplo, Rossi, Current Bioloqy, _4:469-471 (1994) e publicação PCT N.° WO 97/33551 (publicada a 18 de Setembro de 1997) .
As moléculas de ácido nucleico em formação em hélice tripla utilizadas para inibir transcrição devem ser em cadeia simples e compostas por desoxinucleótidos. A composição em bases destes oligonucleótidos é concebida de modo a promover a formação de hélice tripla através das regras de emparelhamento de bases de Hoogsteen, que em geral requerem extensões de tamanho considerável de purinas ou pirimidinas numa das cadeias de uma cadeia dupla. Para detalhes adicionais consultar, por exemplo, publicação PCT N.° WO 97/33551, supra.
Estas moléculas pequenas podem ser identificadas por qualquer um ou mais dos ensaios de rastreio aqui discutidos supra e/ou por quaisquer outras técnicas de rastreio bem conhecidas dos peritos na especialidade. L. Composições e métodos para o tratamento de tumores
As composições úteis no tratamento de tumores associados com a amplificação dos genes aqui identificados incluem, entre outras, anticorpos, moléculas orgânicas e inorgânicas pequenas, péptidos, fosfopéptidos, moléculas anti-sentido e ribozima, moléculas em hélice tripla, etc., que inibem a expressão e/ou actividade do produto génico alvo.
Por exemplo, as moléculas de ARN anti-sentido e de ARN actuam para bloquear directamente a tradução de ARNm por hibridação ao ARNm alvo e evitando a tradução proteína. Quando se utiliza ADN anti-sentido, são preferidos oligodesoxirribonucleótidos derivados do local de iniciação de tradução, por exemplo, entre cerca de -10 e +10 posições da sequência de nucleótidos de gene alvo.
As ribozimas são moléculas de ARN enzimáticas capazes de catalisar a clivagem específica de ARN. As ribozimas actuam por hibridação específica de sequência ao ARN alvo complementar, seguida por clivagem endonucleolítica. Podem identificar-se locais de clivagem de ribozima específicos 105
ΕΡ 1 607 402 /PT dentro de um ARN alvo potencial utilizando técnicas conhecidas. Para mais detalhes consultar, por exemplo, Rossi, Current Bioloqy, _4:469-471 (1994) e publicação PCT N.° WO 97/33551 (publicada a 18 de Setembro de 1997) .
As moléculas de ácido nucleico em formação de hélice tripla utilizadas para inibir transcrição devem ser em cadeia simples e compostas de desoxinucleótidos. A composição de bases destes oligonucleótidos é concebida de forma a promover a formação de hélice tripla através das regras de emparelhamento de bases de Hoogsteen, que requerem em geral extensões de tamanho considerável de purinas ou pirimidinas numa cadeia de uma hélice dupla. Para detalhes adicionais consultar, por exemplo, publicação PCT N.° WO 97/33551, supra.
Estas moléculas podem ser identificadas por qualquer dos ensaios de rastreio aqui discutidos supra ou qualquer combinação destes e/ou por qualquer outra técnica de rastreio bem conhecida dos peritos na especialidade. M. Anticorpos
Alguns dos candidatos a fármacos mais promissores de acordo com o presente invento são anticorpos e fragmentos de anticorpo que podem inibir a produção do produto génico dos genes amplificados aqui identificados e/ou reduzir a actividade dos produtos génicos. 1. Anticorpos policlonais São conhecidos dos peritos na especialidade métodos de preparação de anticorpos policlonais. Os anticorpos policlonais podem ser desenvolvidos num mamífero, por exemplo, por uma ou mais injecções de um agente de imunização e, caso pretendido, um adjuvante. Tipicamente, o agente de imunização e/ou adjuvante será injectado no mamífero por injecções subcutâneas ou intraperitoneais múltiplas. O agente de imunização pode incluir o polipéptido PR05775 ou uma sua proteína de fusão. Pode ser útil conjugar o agente de imunização a uma proteína que se sabe que é imunogénica no mamífero a ser imunizado. Constituem exemplos de tais proteínas imunogénicas, entre outras, hemocianina de lapa 106 ΕΡ 1 607 402 /PT gigante, albumina de soro, tiroglobulina bovina e inibidor de tripsina de soja. Constituem exemplos de adjuvantes que podem ser utilizados, entre outros, adjuvante completo de Freund e adjuvante MPL-TDM (monofosforil-Lipido A, dicorinomicolato de trealose sintético). O protocolo de imunização pode ser seleccionado por um perito na especialidade sem experiências desnecessárias. 2. Anticorpos monoclonais
Os anticorpos anti-PR05775 podem, alternativamente, ser anticorpos monoclonais. Os anticorpos monoclonais podem ser preparados utilizando métodos de hibridoma, tais como os descritos por Kohler e Milstein, Nature, 256:495 (1975). Num método de hibridoma imuniza-se tipicamente um ratinho, hamster ou outro animal hospedeiro adequado com um agente de imunização para desencadear linfócitos que produzem ou são capazes de produzir anticorpos que se ligarão especificamente ao agente de imunização. Alternativamente, os linfócitos podem ser imunizados in vitro. O agente de imunização incluirá tipicamente o polipéptido PR05775, incluindo fragmentos, ou uma proteína de fusão de tal proteína ou um seu fragmento. Em geral, utilizam-se linfócitos de sangue periférico ("PBL") caso se pretendam células de origem humana, ou utilizam-se células de baço ou células de nódulos linfáticos caso se pretendam fontes de mamífero não humano. Os linfócitos são então fundidos com uma linha celular imortalizada utilizando um agente de fusão adequado, tal como polietilenoglicol, para formar uma célula de hibridoma [Goding, Monoclonal Antibodies: Principies and Practice, Academic Press, (1986) p. 59-103]. As linhas celulares imortalizadas são usualmente células de mamífero transformadas, nomeadamente células de mieloma de origem de roedor, bovina e humana. Usualmente, utilizam-se linhas celulares de rato ou ratinho. As células de hibridoma podem ser cultivadas num meio de cultura adequado que de preferência contém uma ou mais substâncias que inibem o crescimento ou sobrevivência das células imortalizadas não fundidas. Por exemplo, se as células parentais não contiverem a enzima hipoxantina-guanina-fosforribosil-transferase (HGPRT ou HPRT), o meio de cultura para hibridomas incluirá tipicamente 107
ΕΡ 1 607 402 /PT hipoxantina, aminopterina e timidina ("meio HAT"), substâncias que evitam o crescimento de células deficientes em HGPRT.
As linhas imortalizadas preferidas são as que se fundem eficazmente, suportam expressão estável em niveis elevados de anticorpo pelas células produtoras de anticorpo seleccionadas e são sensíveis a um meio, tal como meio HAT. Constituem linhas celulares imortalizadas mais preferidas as linhas de mieloma murino, que podem ser obtida, por exemplo, de Salk Institute Cell Distribution Center, San Diego, Califórnia e de American Type Culture Collection (ATCC), Manassas, Virgínia. Foram também descritas linhas celulares de mieloma humano e de heteromieloma ratinho-humano para a produção de anticorpos monoclonais humanos [Kozbor, J. Immunol., 133:3001 (1984);
Brodeur et al., Monoclonal Antibodies Production Techniques and Applications, Mareei Dekker, Inc., New York, (1987) p. 51-63] . O meio de cultura no qual se cultivam as células de hibridoma pode então ser ensaiado para a presença de anticorpos monoclonais dirigidos contra PR05775. De preferência, determina-se a especificidade de ligação de anticorpos monoclonais produzidos pelas células de hibridoma por imunoprecipitação ou por um ensaio de ligação in vitro, tal como radioimunoensaio (RIA) ou um ensaio de imunoabsorção ligado a enzima (ELISA). Tais técnicas e ensaios são conhecidos na especialidade. A afinidade de ligação do anticorpo monoclonal pode, por exemplo, ser determinada pela análise de Scatchard de Munson e Pollard, Anal. Biochem., 107:220 (1980) .
Após terem sido identificadas as células de hibridoma pretendidas, os clones podem ser subclonados por procedimentos de diluição limitante e cultivados por métodos padrão [Goding, supra]. Constituem meios de cultura adequados para este objectivo, entre outros, por exemplo, meio Eagle modificado de Dulbecco e meio RPMi-1640. Alternativamente, as células de hibridoma podem ser cultivadas in vivo como ascites num mamífero.
Os anticorpos monoclonais excretados pelos subclones podem ser isolados ou purificados do meio de cultura ou fluido de 108
ΕΡ 1 607 402 /PT ascites por procedimentos de purificação de imunoglobulina convencionais tais como, por exemplo, proteína A-Sepharose, cromatografia em hidroxilapatite, electroforese em gel, diálise ou cromatografia de afinidade.
Os anticorpos monoclonais podem também ser preparados por métodos de ADN recombinante, tais como os descritos em Patente U.S. N.° 4 816 567. O ADN que codifica os anticorpos monoclonais do invento pode ser facilmente isolado e sequenciado utilizando procedimentos convencionais (por exemplo, por utilização de sondas de oligonucleótido que são capazes de se ligar especificamente a genes que codificam as cadeias pesada e leve de anticorpos murinos). As células de hibridoma do invento servem como fonte preferida de tal ADN. Uma vez isolado, o ADN pode ser colocado em vectores de expressão, que são então transfectados para células hospedeiras tais como células COS de símio, células de ovário de hamster chinês (CHO) ou células de mieloma que de outra forma não produzem proteína imunoglobulina, para obter a síntese de anticorpos monoclonais nas células hospedeiras recombinantes. Os ADN podem também ser modificados, por exemplo, por substituição da sequência de codificação para domínios constantes de cadeia pesada e leve humana em vez das sequências homólogas murinas [Patente U.S. N.° 4 816 567;
Morrison et al., supra] ou por ligação covalente à sequência de codificação de imunoglobulina de toda ou parte da sequência de codificação para um péptido não imunoglobulina. Tal péptido não imunoglobulina pode ser substituído pelos domínios constantes de um anticorpo do invento ou pode ser substituído pelos domínios variáveis de um local de combinação de antigénio de um anticorpo do invento para criar um anticorpo bivalente quimérico.
Os anticorpos podem ser anticorpos monovalentes. São bem conhecidos na especialidade métodos para preparar anticorpos monovalentes. Por exemplo, um método envolve a expressão recombinante de cadeia leve e cadeia pesada modificada de imunoglobulina. A cadeia pesada é, em geral, truncada em qualquer ponto na região Fc de modo a evitar reticulação da cadeia pesada. Alternativamente, substituem-se os resíduos de cisteína relevantes por outro resíduo de aminoácido ou são eliminados para evitar reticulação. 109
ΕΡ 1 607 402 /PT São também adequados métodos in vitro para preparar anticorpos monovalentes. Pode efectuar-se digestão de anticorpos para produzir os seus fragmentos, nomeadamente fragmentos Fab, utilizando técnicas de rotina conhecidas na especialidade. 3. Anticorpos humanos e humanizados
Os anticorpos anti-PR05775 podem adicionalmente incluir anticorpos humanizados ou anticorpos humanos. As formas humanizadas de anticorpos não humanos (por exemplo, murinos) são imunoglobulinas quiméricas, cadeias de imunoglobulina ou seus fragmentos (tais como Fv, Fab, Fab', F(ab')2 ou outras subsequências de ligação de antigénio de anticorpos) que contêm uma sequência minima derivada de imunoglobulina não humana. Os anticorpos humanizados incluem imunoglobulinas humanas (anticorpo recebedor) em que os residuos de uma região determinante de complementaridade (CDR) do recebedor são substituídos pelos residuos de uma CDR de uma espécie não humana (anticorpo dador) tal como ratinho, rato ou coelho apresentando a especificidade, afinidade e capacidade pretendidas. Em alguns casos, substituem-se residuos do esqueleto Fv da imunoglobulina humana pelos resíduos não humanos correspondentes. Os anticorpos humanizados podem também incluir resíduos que não se encontram no anticorpo recebedor, nem nas sequências CDR ou de esqueleto importadas. Em geral, o anticorpo humanizado incluirá substancialmente todos de pelo menos um e tipicamente dois domínios variáveis de comprimento completo, nos quais todas ou substancialmente todas as regiões CDR correspondem às da imunoglobulina não humana e todas ou substancialmente todas as regiões FR são as de uma sequência de consenso de uma imunoglobulina humana. O anticorpo humanizado incluirá optimamente também pelo menos uma parte de uma região constante de imunoglobulina (Fc), tipicamente a de uma imunoglobulina humana [Jones et al., Nature, 321:522-525 (1986); Riechmann et al., Nature, 332:323-329 (1988); e Presta, Curr. Op. Struct. Biol., _2:593-596 (1992)] . São bem conhecidos na especialidade métodos para humanizar anticorpos não humanos. Em geral, um anticorpo humanizado tem 110
ΕΡ 1 607 402 /PT um ou mais resíduos de aminoácidos introduzidos nele de uma fonte que não é humana. Estes resíduos de aminoácidos não humanos são usualmente denominados resíduos de "importação", que são tipicamente obtidos de um domínio variável de "importação". A humanização pode ser essencialmente efectuada seguindo o método de Winter e colaboradores [Jones et al., Nature, 321:522-525 (1986); Riechmann et al., Nature, 332:323-327 (1988); Verhoeyen et al., Science, 239:1534-1536 (1988)), por substituição de CDR ou sequências de CDR de roedor pelas sequências correspondentes de um anticorpo humano. Assim, tais anticorpos "humanizados" são anticorpos quiméricos (Patente U.S. N.° 4 816 567), em que substancialmente menos de um domínio variável intacto foi substituído pela sequência correspondente de uma espécie não humana. Na prática, os anticorpos humanizados são tipicamente anticorpos humanos em que alguns resíduos CDR e possivelmente alguns resíduos FR são substituídos por locais análogos em anticorpos de roedor.
Os anticorpos humanos podem também ser produzidos utilizando várias técnicas conhecidas na especialidade, incluindo bibliotecas de disposição de fagos [Hoogenboom e Winter, J. Mol. Biol., 227:381 (1991); Marks et al., J. Mol. Biol. 222:581 (1991)]. As técnicas de Cole et al. e Boerner et al. estão também disponíveis para a preparação de anticorpos monoclonais humanos (Cole et al., Monoclonal Antibodies and Câncer Therapy, Alan R. Liss, p. 77 (1985) e Boerner et al., J. Immunol., 147(1):86-95 (1991)]. De igual modo, podem ser preparados anticorpos humanos por introdução de locais de imunoglobulina humana em animais transgénicos, por exemplo, ratinhos nos quais os gene de imunoglobulina endógenos foram parcial ou completamente inactivados. Após provocação, observa-se produção de anticorpo humano, que é muito semelhante ao observado em humanos em todos os sentidos, incluindo rearranjo de gene, montagem e reportório de anticorpo. Esta abordagem é descrita, por exemplo, em Patentes U.S. N. 0 5 545 807; 5 545 806; 5 569 825; 5 625 126; 5 633 425; 5 661 016 e nas seguintes publicações científicas: Marks et al., Bio/Technology, 1^:779-783 (1992); Lonberg et al.,
Nature, 368:856-859 (1994); Morrison, Nature, 368:812-13 (1994); Fishwild et al., Nature Biotechnology, 14:845-51 (1996); Neuberger, Nature Biotechnology, L4:826 (1996);
Lonberg e Huszar, Intern. Rev. Immunol., L3:65-93 (1995). 111 ΕΡ 1 607 402 /PT 4. Terapia com pró-farmaco mediada por enzima dependente de anticorpo (ADEPT)
Os anticorpos do presente invento podem também ser utilizados em ADEPT por conjugação do anticorpo a uma enzima activadora de pró-fármaco que converte um pró-fármaco (por exemplo, um agente quimioterapêutico peptidilo, consultar WO 81/01145) num fármaco anticanceroso activo. Consultar, por exemplo, WO 88/07378 e Patente U. S. N.° 4 975 278. A componente de enzima do imunoconjugado útil para ADEPT inclui uma enzima capaz de actuar num pró-fármaco de tal forma a convertê-lo na sua forma citotóxica mais activa. 328:457-458 (1987)). Podem preparar-se
Constituem enzimas que são úteis no método deste invento, entre outras, glicosidase, glucose-oxidase, lisozima humana, glucuronidase humana, fosfatase alcalina útil para converter pró-fármacos contendo fosfatos em fármacos livres; arilsulfatase útil para converter pró-fármacos contendo sulfatos em fármacos livres; citosina-desaminase útil para converter 5-fluorocitosina não tóxica no fármaco anticanceroso 5-fluorouracilo; proteases, tal como protease de Serratia, termolisina, subtilisina, carboxipeptidases (por exemplo, carboxipeptidase G2 e carboxipeptidase A) e catepsinas (tais como catepsinas B e L), que são úteis para converter pró-fármacos contendo péptidos em fármacos livres; D-alanilcarboxipeptidases, úteis para converter pró-fármacos que contêm substituintes D-aminoácido; enzimas que clivam hidratos de carbono, tais como β-galactosidase e neuraminidase úteis para converter pró-fármacos glicosilados em fármacos livres; β-lactamase útil para converter fármacos derivatizados com β-lactamas em fármacos livres; e penicilina amidases, tais como penicilina Varnidase ou penicilina G-amidase, úteis para converter fármacos derivatizados nos seus azotos amina com grupos fenoxiacetilo ou fenilacetilo, respectivamente, em fármacos livres. Alternativamente, podem ser utilizados anticorpos com actividade enzimática, também conhecidos na especialidade como "abzimas" para converter os pró-fármacos do invento em fármacos activos livres (consultar, por exemplo, Massey, Nature, 112
ΕΡ 1 607 402 /PT conjugados anticorpo-abzima tal como aqui descrito para entrega da abzima a uma população de células tumorais.
As enzimas deste invento podem ser ligadas covalentemente aos anticorpos anti-PR05775 por técnicas bem conhecidas na especialidade, tal como a utilização dos agentes de reticulação heterobifuncionais discutidos supra.
Alternativamente, podem ser construídas proteínas de fusão incluindo pelo menos a região de ligação ao antigénio do anticorpo do invento ligada a pelo menos uma parte activa funcionalmente de uma enzima do invento, utilizando técnicas de ADN recombinante bem conhecidas na especialidade (consultar, por exemplo, Neuberger et al., Nature, 312:604-608 (1984)) . 5. Anticorpos biespecíficos
Os anticorpos biespecíficos são anticorpos monoclonais, de preferência humanos ou humanizados, que apresentam especificidades de ligação para pelo menos dois antigénios diferentes. No presente caso, uma das especificidades de ligação é para o PR05775 e a outra é para qualquer outro antigénio e de preferência para uma proteína ou receptor ou subunidade de receptor de superfície celular. São conhecidos na especialidade métodos para preparar anticorpos biespecíficos. Tradicionalmente, a produção recombinante de anticorpos biespecíficos baseia-se na co-expressão de dois pares de cadeia pesada/cadeia leve de imunoglobulina, em que as duas cadeias pesadas têm especificidades diferentes (Milstein e Cuello, Nature, 305:537-539 [1983]). Dada a distribuição aleatória de cadeias pesada e leve de imunoglobulina, estes hibridomas (quadromas) produzem uma mistura potencial de dez moléculas de anticorpo diferentes, das quais só uma tem a estrutura biespecifica correcta. A purificação da molécula correcta é usualmente conseguida por etapas de cromatografia de afinidade. Revelam-se procedimentos semelhantes em WO 93/08829, publicada a 13 de Maio de 1993 e em Traunecker et al., EMBO J., 10:3655-3659 (1991) . 113
ΕΡ 1 607 402 /PT
Os domínios variáveis de anticorpo com as especificidades de ligação pretendidas (locais de combinação anticorpo-antigénio) podem ser fundidos a sequências de domínio constante de imunoglobulina. A fusão é, de preferência, com um domínio constante de cadeia pesada de imunoglobulina, incluindo pelo menos parte das regiões de charneira, CH2 e CH3. É preferível ter a primeira região constante de cadeia pesada (CHI) contendo o local necessário para a ligação a cadeia leve presente em pelo menos uma das fusões. Os ADN que codificam as fusões de cadeia pesada de imunoglobulina e, caso se pretenda, a cadeia leve de imunoglobulina, são inseridos em vectores de expressão separados e são co-transfectados para um organismo hospedeiro adequado. Para mais detalhes sobre geração de anticorpos biespecíficos consultar, por exemplo, Suresh et al., Methods in Enzymoloqy, 121:210 (1986).
De acordo com outra abordagem descrita em WO 96/27011, a interface entre um par de moléculas de anticorpo pode ser modificada racionalmente para maximizar a percentagem de heterodímeros que se recuperam da cultura de células recombinantes. A interface preferida inclui pelo menos uma parte da região CH3 de um domínio constante de anticorpo. Neste método, substituem-se uma ou mais cadeias laterais pequenas de aminoácidos da interface da primeira molécula de anticorpo por cadeias laterais maiores (por exemplo, tirosina ou triptofano). Criam-se "cavidades" de compensação de tamanho idêntico ou semelhante à(s) cadeia(s) lateral(is) grande(s) na interface da segunda molécula de anticorpo por substituição de cadeias laterais grandes de aminoácidos por cadeias mais pequenas (por exemplo, alanina ou treonina). Tal proporciona um mecanismo para aumentar o rendimento do heterodímero relativamente a produtos secundários indesejáveis, tal como homodímeros.
Podem preparar-se anticorpos biespecíficos como anticorpos de comprimento completo ou fragmentos de anticorpo (por exemplo, anticorpos biespecíficos F(ab')2). Foram descritas na literatura técnicas para gerar anticorpos biespecíficos a partir de fragmentos de anticorpo. Por exemplo, podem preparar-se anticorpos biespecíficos utilizando ligação química. Brennan et al., Science, 229:81 (1985) descrevem um procedimento em que se clivam proteoliticamente anticorpos 114
ΕΡ 1 607 402 /PT intactos para gerar fragmentos F(ab')2. Estes fragmentos são reduzidos na presença do agente de complexação de ditiol, arsenieto de sódio, para estabilizar ditióis vizinhos e evitar a formação de dissulfureto intermolecular. Os fragmentos Fab' gerados são então convertidos aos derivados tionitrobenzoato (TNB). Um dos derivados Fab'-TNB é então reconvertido ao Fab'-tiol por redução com mercaptoetilamina e misturado com uma quantidade equimolar do outro derivado Fab'-TNB para formar o anticorpo biespecífico. Os anticorpos biespecíficos produzidos podem ser utilizados como agentes para a imobilização selectiva de enzimas.
Os fragmentos Fab' podem ser recuperados directamente de E. coli e acoplados quimicamente para formar anticorpos biespecíficos. Shalaby et al., J. Exp. Med., 175:217-225 (1992) descrevem a produção de uma molécula de anticorpo biespecífico F(ab')2 completamente humanizada. Cada fragmento Fab' foi excretado separadamente de E. coli e sujeito a acoplamento químico directo in vitro para formar o anticorpo biespecífico. O anticorpo biespecífico assim formado foi capaz de se ligar a células que sobre-expressam o receptor ErbB2 e a células T humanas normais, bem como desencadear a actividade lítica de linfócitos citotóxicos humanos contra alvos de tumor de mama humanos.
Foram também descritas várias técnicas para preparar e isolar fragmentos de anticorpo biespecíficos directamente de cultura de células recombinantes. Por exemplo, produziram-se anticorpos biespecíficos utilizando cremalheiras de leucina. Kostelny et al., J. Immunol., 148(5):1547-1553 (1992). Ligaram-se os péptidos de cremalheira de leucina das proteínas Fos e Jun a partes Fab' de dois anticorpos diferentes através de fusão génica. Reduziram-se os homodímeros de anticorpo na região de charneira para formar monómeros e seguidamente re-oxidaram-se para formar os heterodímeros de anticorpo. Este método pode também ser utilizado para a produção de homodímeros de anticorpo. A tecnologia de "diacorpo" descrita por Hollinger et al., Proc. Natl. Acad. Sei. USA, 90:6444-6448 (1993) proporcionou um mecanismo alternativo para preparar fragmentos de anticorpo biespecíficos. Os fragmentos incluem um domínio variável de cadeia pesada (VH) ligado a um domínio variável de cadeia leve (VL) através de um ligante que é 115
ΕΡ 1 607 402 /PT demasiado curto para permitir emparelhamento entre os dois domínios na mesma cadeia. Assim, os domínios VH e VL de um fragmento são forçados a emparelhar com os domínios VL e VH complementares de outro fragmento, formando assim dois locais de ligação de antigénio. Foi também relatada outra estratégia para preparar fragmentos de anticorpo biespecíficos por utilização de dímeros Fv de cadeia simples (sFv). Consultar, Gruber et al., J. Immunol., 152 :5368 (1994).
Abrangem-se anticorpos com mais de duas valências. Por exemplo, podem preparar-se anticorpos triespecíficos. Tutt et al., J. Immunol., 147:60 (1991).
Podem ligar-se exemplos de anticorpos biespecíficos a dois epítopos diferentes num determinado polipéptido aqui. Alternativamente, pode combinar-se um braço anti-polipéptido com um braço que liga uma molécula desencadeadora num leucócito, tal como uma molécula de receptor de célula T (por exemplo, CD2, CD3, CD28 ou B7) ou receptores Fc para igG (FcyR), tal como FcyRI (CD64), FcyRII (CD32) e FcyRIII (CD16) de modo a focar os mecanismos de defesa para a célula que expressa o polipéptido determinado. Os anticorpos biespecíficos podem ser também utilizados para localizar agentes citotóxicos em células que expressam um polipéptido determinado. Estes anticorpos possuem um braço de ligação ao polipéptido e um braço que liga um agente citotóxico ou um quelante de radionuclidos, tal como EOTUBE, DPTA, DOTA ou TETA. Outro anticorpo biespecífico de interesse liga o polipéptido e liga adicionalmente o factor tissular (TF). 6. Anticorpos heteroconjugados
Os anticorpos heteroconjugados são compostos de dois anticorpos ligados covalentemente. Tais anticorpos foram, por exemplo, propostos para dirigir ao alvo células do sistema imunitário para células indesejáveis [Patente U.S. N.° 4 676 980] e para tratamento de infecção por vih [wo 91/00360; WO 92/200373; EP 03089]. Considera-se que os anticorpos podem ser preparados in vitro utilizando métodos conhecidos em química de síntese de proteínas, incluindo os que envolvem agentes de reticulação. Por exemplo, podem construir-se imunotoxinas utilizando uma reacção de permuta de dissulfureto 116 ΕΡ 1 607 402 /PT ou por formação de uma ligação tioéter. Constituem exemplos de reagentes adequados para este objectivo, entre outros, iminotiolato e metil-4-mercaptobutirimidato e os revelados, por exemplo, em Patente U.S. N.° 4 676 980. 7. Concepção racional de função de efector
Pode ser desejável modificar o anticorpo do invento relativamente à função de efector, de modo a aumentar a eficácia do anticorpo no tratamento de cancro, por exemplo. Por exemplo, pode(m) introduzir-se resíduo(s) de cisteína na região Fc, permitindo assim formação de ligação dissulfureto intercadeia nesta região. O anticorpo homodimérico assim gerado pode ter capacidade de internalização melhorada e/ou morte celular mediada por complemento e citotoxicidade celular dependente de anticorpo (ADCC) melhoradas. Consultar, Caron et al., J, Exp. Med., 176:1191-1195 (1992) e Shopes, J, Immunol., 148:2918-2922 (1992). Podem também preparar-se anticorpos homodiméricos com actividade antitumoral aumentada utilizando agentes de reticulação heterobifuncionais, tal como descrito em Wolff et al., Câncer Research 53:2560-2565 (1993).
Alternativamente, pode conceber-se racionalmente um anticorpo que tem regiões Fc duplas e pode portanto apresentar capacidades de lise de complemento e ADCC melhoradas. Consultar, Stevenson et al., Anti-Cancer Drug Design, 3_:219-230 (1989). 8. Imunoconjugados O invento refere-se também a imunoconjugados incluindo um anticorpo conjugado a um agente citotóxico, tal como um agente quimioterapêutico, toxina (por exemplo, uma toxina activa enzimaticamente de origem bacteriana, fúngica, de planta ou de animal ou seus fragmentos ou uma toxina de molécula pequena) ou um isótopo radioactivo (ou seja, um radioconjugado).
Foram descritos supra agentes quimioterapêuticos úteis na geração de tais imunoconjugados. Constituem toxinas de proteína enzimaticamente activas e seus fragmentos que podem ser utilizadas, entre outras, cadeia A de difteria, fragmentos activos não ligantes de toxina de difteria, toxina da cólera, toxina botulínica, cadeia A de exotoxina (de Pseudomonas 117 ΕΡ 1 607 402 /PT aeruginosa), cadeia A de ricina, cadeia A de abrina, cadeia A de modecina, alfa-sarcina, proteínas de Aleurites fordii, proteínas de diantina, proteínas de Phytolaca americana (PAPI, PAPII e PAP-S), inibidor de Momordica charantia, curcina, crotina, inibidor de Sapaonaria officinalis, gelonina, saporina, mitogelina, restrictocina, fenomicina, enomicina e os tricotecenos. As toxinas de molécula pequena incluem, por exemplo, caliqueamicinas, maitansinóides, palitoxina e CC1065. Encontram-se disponíveis vários radionuclidos para a produção de anticorpos radioconjugados. Constituem exemplos, entre outros, 212Bi, 131I, 131In, 90Y e 186Re.
Os conjugados do anticorpo e agente citotóxico são preparados utilizando vários agentes de acoplamento de proteína bifuncionais, tais como N-succinimidil-3-(2-piridilditiol)propionato (SPDP), iminotiolano (IT), derivados bifuncionais de imidoésteres (tal como adipimidato de dimetilo HCL), ésteres activos (tal como suberato de dissuccinimidilo), aldeídos (tal como glutaraldeído), compostos bis-azido (tal como bis(p-azidobenzoíl)hexanodiamina), derivados bis-diazónio (tal como bis-(p-diazónio-benzoíl)etilenodiantina), diisocianatos (tal como 2,β-diisocianato de tolueno) compostos de flúor bis-activos (tal como 1,5-difluoro-2,4-dinitrobenzeno). Por exemplo, pode ser preparada uma imunotoxina de ricina tal como descrito em Vitetta et al., Science, 238:1098 (1987). Constitui um exemplo de agente quelante para a conjugação de radionucleótidos ao anticorpo, o ácido l-isotiocianatobenzil-3-metildietilenotriaminopenta-acético (MX-DTPA) marcado com carbono-14. Consultar WO94/11026.
Noutra concretização, o anticorpo pode ser conjugado a um "receptor" (tal como estreptavidina) para utilização em pré-localização ao alvo de tumor em que o conjugado anticorpo-receptor é administrado ao doente, seguido de remoção do conjugado não ligado de circulação utilizando um agente de depuração e seguidamente administração de um "ligando" (por exemplo, avidina) que está conjugado a um agente citotóxico (por exemplo, um radionucleótido). 118 ΕΡ 1 607 402 /PT 9. Imunolipossornas
Os anticorpos aqui revelados podem também ser formulados como imunolipossomas. Os lipossomas contendo o anticorpo são preparados por métodos conhecidos na especialidade, tal como descrito em Epstein et al., Proc. Natl. Acad. Sei. USA, _8_2:3688 (1985); Hwang et al., Proc. Natl. Acad. Sei. USA, 7^:4030 (1980); e Patentes U.S. N.° 4 485 045 e 4 544 545. Revelam-se lipossomas com tempo de circulação aumentado em Patente U.S. N.° 5 013 556.
Podem gerar-se lipossomas particularmente úteis pelo método de evaporação de fase reversa com uma composição de lipido incluindo fosfatidileolina, colesterol e fosfatidiletanolamina derivatizada com PEG (PEG-PE). Extrudem-se os lipossomas através de filtros de tamanho de poro definido para obter lipossomas com o diâmetro pretendido. Podem conjugar-se aos lipossomas fragmentos Fab' do anticorpo do presente invento tal como descrito em Martin et al., J. Biol, Chem,, 257:286-288 (1982) através de uma reacção de permuta de dissulfureto. O lipossoma contém no seu interior opcionalmente um agente quimioterapêutico (tal como doxorrubicina). Consultar, Gabizon et al., J. National Câncer Inst., 81(19):1484 (1989). N. Composições farmacêuticas
Podem administrar-se anticorpos que ligam especificamente o produto de um gene amplificado aqui identificado, bem como outras moléculas identificadas pelos ensaios de rastreio aqui revelados supra, para o tratamento de tumores, incluindo cancros, sob a forma de composições farmacêuticas.
Se a proteína codificada pelo gene amplificado é intracelular e se são utilizados anticorpos de comprimento completo como inibidores, são preferidos anticorpos de internalização. Contudo, podem também utilizar-se lipofecções ou lipossomas para entregar o anticorpo ou um fragmento de anticorpo às células. Quando se utilizam fragmentos de anticorpo, é preferido o fragmento de inibição mais pequeno que liga especificamente o domínio de ligação da proteína alvo. Por exemplo, com base nas sequências de região variável 119
ΕΡ 1 607 402 /PT de um anticorpo, podem conceber-se moléculas de péptido que mantêm a capacidade de ligar a sequência de proteína alvo. Tais péptidos podem sintetizar-se quimicamente e/ou produzir-se por tecnologia de adn recombinante (consultar, por exemplo, Marasco et al., Proc. Natl. Acad. Sei. USA, 90:7889-7893 [1993]).
Preparam-se formulações terapêuticas do anticorpo para armazenamento por mistura do anticorpo com o grau de pureza pretendido com transportadores, excipientes ou estabilizantes farmaceuticamente aceitáveis opcionais (Remington's Pharmaceutical Sciences, 16a edição, Osol, A. ed. [1980]), sob a forma de formulações liofilizadas ou soluções aquosas. Os transportadores, excipientes ou estabilizantes aceitáveis não são tóxicos para os recebedores nas dosagens e concentrações utilizadas e incluem tampões tal como fosfato, citrato e outros ácidos orgânicos; antioxidantes incluindo ácido ascórbico e metionina; conservantes (tal como cloreto de octadecildimetilbenzilamónio; cloreto de hexametónio; cloreto de benzalcónio, cloreto de benzetónio; fenol, álcool butílico ou benzilico; alquilparabenos tal como metilparabeno ou propilparabeno; catecol; resorcinol; ciclo-hexanol; 3-pentanol; e m-cresol); polipéptidos de baixa peso molecular (menos de cerca de 10 resíduos); proteínas, tal como albumina de soro, gelatina ou imunoglobulinas; polímeros hidrófilos tais como polivinilpirrolidona; aminoácidos tais como glicina, glutamina, asparagina, histidina, arginina ou lisina; monossacáridos, dissacáridos e outros hidratos de carbono incluindo glucose, manose ou dextrinas; agentes quelantes tais como EDTA; açúcares tais como sacarose, manitol, trealose ou sorbitol; contra-iões formadores de sais tais como sódio; complexos metálicos (por exemplo, complexos Zn-proteína); e/ou tensioactivos não iónicos tal como TWEEN™, PLURONICS™ ou polietilenoglicol (PEG).
Os compostos não anticorpo identificados pelos ensaios de rastreio do presente invento podem ser formulados de forma análoga, utilizando técnicas padrão bem conhecidas na especialidade. A formulação aqui pode também conter mais do que um composto activo, como necessário para a indicação particular a 120
ΕΡ 1 607 402 /PT ser tratada, de preferência os que apresentam actividades complementares que não apresentam efeitos adversos entre si. Alternativa ou adicionalmente, a composição pode incluir um agente citotóxico, citoquina ou agente inibidor do crescimento. Tais moléculas encontram-se presentes adequadamente em combinação em quantidades que são eficazes para o objectivo pretendido.
Os ingredientes activos podem também ser encapsulados em microcápsulas preparadas, por exemplo, por técnicas de coacervação ou por polimerização interfacial, por exemplo, microcápsulas de hidroximetilcelulose ou gelatina e microcápsulas de poli(metilmetacilato), respectivamente, em sistemas de entrega de fármacos coloidais (por exemplo, lipossomas, microesferas de albumina, microemulsões, nanoparticulas e nanocápsulas) ou em macroemulsões. Tais técnicas revelam-se em Remington's Pharmaceutical Sciences, 16a edição, Osol, A. ed. (1980) .
As formulações a serem utilizadas em administração in vivo devem ser estéreis. Tal pode ser facilmente conseguido por filtração através de membranas de filtração estéreis.
Podem preparar-se preparações de libertação controlada. Constituem exemplos adequados de preparações de libertação controlada, entre outros, matrizes semi-permeáveis de polímeros hidrófobos sólidos contendo o anticorpo, em que as matrizes se encontram sob a forma de artigos com forma, por exemplo, filmes ou microcápsulas. Constituem exemplos de matrizes de libertação controlada, entre outros, poliésteres, hidrogéis (por exemplo, poli(2-hidroxietilmetacrilato) ou poli(álcool vinílico)), polilactidos (Patente U.S. N.° 3 773 919), copolímeros de ácido L-glutâmico e L-glutamato de etilo, etileno-acetato de vinilo não degradável, copolímeros de ácido láctico-ácido glicólico degradáveis, tal como o LUPRON DEPOT™ (microesferas injectáveis compostas de copolímero de ácido láctico-ácido glicólico e acetato de leuprolida) e ácido poli-D-(-)-3-hidroxibutírico. Enquanto que os polímeros tal como etileno-acetato de vinilo e ácido láctico-ácido glicólico permitem a libertação de moléculas durante mais de 100 dias, determinados hidrogéis libertam proteínas durante períodos de tempo mais curtos. Quando os 121
ΕΡ 1 607 402 /PT anticorpos encapsulados permanecem no corpo durante um longo período de tempo podem desnaturar ou agregar como resultado de exposição a humidade a 37°C, resultando em perda de actividade biológica e possíveis alterações de imunogenicidade. Podem ser concebidas estratégias racionais para estabilização dependendo do mecanismo envolvido. Por exemplo, quando se verifica que o mecanismo de agregação é formação de ligação S-S intermolecular através de permuta tio-dissulfureto, pode conseguir-se estabilização por modificação de resíduos sulfidrilo, liofilização a partir de soluções ácidas, controlo do teor de humidade, utilização de aditivos adequados e desenvolvimento de composições de matrizes poliméricas específicas. 0. Métodos de tratamento
Considera-se que os anticorpos e outros compostos antitumorais do presente invento podem ser utilizados para tratar várias doenças, incluindo as caracterizadas por sobre-expressão e/ou activação dos genes amplificados aqui identificados. Constituem exemplos de condições e doenças a ser tratadas com tais anticorpos e outros compostos, incluindo, entre outros, moléculas orgânicas e inorgânicas pequenas, péptidos, moléculas anti-sentido, etc., entre outros, tumores benignos ou malignos (por exemplo, tumores renais, do fígado, do rim, da bexiga, da mama, gástricos, dos ovários, colorrectais, da próstata, pancreáticos, do pulmão, da vulva, da tiróide, carcinomas hepáticos; sarcomas; glioblastomas; e vários tumores da cabeça e pescoço); leucemias e malignidades linfóides; outras doenças, tais como doenças neuronais, gliais, astrocitais, hipotalâmicas e outras doenças glandulares, macrofágicas, epiteliais, do estroma e blastocélicas; e doenças inflamatórias, angiogénicas e imunológicas.
Os agentes antitumorais do presente invento, por exemplo, anticorpos, são administrados a um mamífero, de preferência um humano, de acordo com métodos conhecidos, tais como administração intravenosa como um bolus ou por infusão contínua ao longo de um período de tempo, por via intramuscular, intraperitoneal, intracerobroespinal, subcutânea, intra-articular, intrassinovial, intratecal, oral, 122
ΕΡ 1 607 402 /PT tópica ou por inalação. É preferível a administração intravenosa do anticorpo.
Podem combinar-se outros regimes terapêuticos com a administração dos agentes anticancerosos, por exemplo, anticorpos do presente invento. Por exemplo, o doente a ser tratado com tais agentes anticancerosos pode também receber terapia de radiação. Alternativa ou adicionalmente, podem administrar-se um agente quimioterapêutico ao doente. A preparação e calendário de dosagem para tais agentes quimioterapêuticos pode ser utilizada de acordo com as instruções do fabricante ou como determinado empiricamente pelo profissional de saúde. A preparação e calendário de dosagem para tal quimioterapia são também descritos em Chemotherapy Service Ed., M.C. Perry, Williams e Wilkins, Baltimore, Maryland (1992) . O agente quimioterapêutico pode preceder ou seguir a administração do agente antitumoral, por exemplo, anticorpo, ou pode ser administrado simultaneamente com ele. 0 anticorpo pode ser combinado com um composto anti-estrogénio, tal como tamoxifeno ou um composto anti-progesterona, tal como onapristona (consultar, EP 616812) em dosagens conhecidas para tais moléculas.
Pode ser desejável administrar também anticorpos contra outros antigénios associados a tumores, tais como anticorpos que ligam a ErbB2, EGFR, ErbB3, ErbB4 ou factor endotelial vascular (VEGF). Alternativa ou adicionalmente, podem ser co-administrados ao doente dois ou mais anticorpos que ligam o mesmo ou dois ou mais antigénios diferentes aqui revelados. Por vezes, pode ser benéfico administrar também uma ou mais citoquinas ao doente. Numa concretização preferida, os anticorpos aqui são co-administrados com um agente inibidor do crescimento. Por exemplo, o agente inibidor do crescimento pode ser administrado primeiro, seguido por um anticorpo do presente invento. Contudo, considera-se também administração simultânea ou administração do anticorpo do presente invento primeiramente. As dosagens adequadas para o agente inibidor do crescimento são as utilizadas actualmente e podem ser diminuídas devido à acção combinada (sinergia) do agente inibidor do crescimento e do presente anticorpo. 123
ΕΡ 1 607 402 /PT
Para a prevenção ou tratamento de doença, a dosagem adequada de um agente antitumoral, por exemplo, um presente anticorpo dependerá do tipo de doença a ser tratada, tal como definido supra, da gravidade e evolução da doença, se o agente é administrado com objectivos preventivos ou terapêuticos, terapia prévia, história clinica do doente e resposta ao agente e critério do médico assistente. O agente é administrado adequadamente ao doente de uma vez ou ao longo de uma série de tratamentos.
Por exemplo, dependendo do tipo e gravidade da doença, cerca de 1 pg/kg a 15 mg/kg (por exemplo, 0,1-20 mg/kg) de anticorpo é uma dosagem candidata inicial para administração ao doente quer, por exemplo, numa administração, quer em mais administrações separadas ou por infusão continua. Uma dosagem diária típica pode estar na gama de cerca de 1 pg/Kg a 100 mg/kg ou mais, dependendo dos factores supramencionados. Para administrações repetidas ao longo de vários dias ou mais longas, dependendo da condição, o tratamento é mantido até que ocorra a supressão pretendida dos sintomas da doença. Contudo, podem ser úteis outros regimes de dosagem. O progresso desta terapia é facilmente monitorizado por técnicas e ensaios convencionais. P. Artigos de fabrico
Noutra concretização do invento, proporciona-se um artigo de fabrico contendo materiais úteis para o diagnóstico das doenças descritas supra. O artigo de fabrico inclui um recipiente e uma etiqueta. Constituem recipientes adequados, entre outros, por exemplo, frascos, garrafas, seringas e tubos de ensaio. Os recipientes podem ser feitas de vários materiais, tais como vidro ou plástico. O recipiente contém uma composição que é eficaz para o diagnóstico ou tratamento da condição e pode ter uma entrada de acesso estéril (por exemplo, o recipiente pode ser um saco de solução intravenosa ou um frasco com uma tampa perfurável com uma agulha de injecção hipodérmica) . O agente activo na composição é usualmente um agente antitumoral capaz de interferir com a actividade do produto génico aqui identificado, por exemplo, um anticorpo. A etiqueta no recipiente ou associada a este indica que a composição é utilizada para diagnóstico ou 124 ΕΡ 1 607 402 /PT tratamento da doença seleccionada. O artigo de fabrico pode incluir adicionalmente um segundo recipiente contendo um tampão farmaceuticamente aceitável, tal como solução salina tamponada de fosfato, solução de Ringer e solução de dextrose. Pode incluir adicionalmente outros materiais desejáveis do ponto de vista comercial e do utilizador, incluindo outros tampões, diluentes, filtros, agulhas, seringas e folhetos inclusos com instruções para utilização. Q. Diagnóstico e prognóstico de tumores
As proteínas de superfície celular, tal como receptores de crescimento sobre-expressos em determinados tumores são alvos excelentes para candidatos a fármacos ou tratamento de tumor (por exemplo, cancro), as mesmas proteínas juntamente com proteínas excretadas codificadas pelos genes amplificados em células tumorais podem ser utilizadas adicionalmente no diagnóstico e prognóstico de tumores. Por exemplo, os anticorpos dirigidos contra os produtos de proteína de genes amplificados em células tumorais podem ser utilizados como diagnóstico ou prognóstico de tumor.
Por exemplo, os anticorpos, incluindo fragmentos de anticorpo, podem ser utilizados para detectar qualitativa ou quantitativamente a expressão de proteínas codificadas pelos genes amplificados ("produtos génicos marcadores"). O anticorpo é de preferência equipado com um marcador detectável, por exemplo, um marcador fluorescente e pode monitorar-se a ligação por microscopia óptica, citometria de fluxo, fluorimetria ou outras técnicas bem conhecidas na especialidade. Estas técnicas são particularmente adequadas, se o gene amplificado codifica uma proteína de superfície celular, por exemplo, um factor de crescimento. Tais ensaios de ligação são efectuados essencialmente tal como descrito na secção 5 supra. A detecção in situ da ligação de anticorpo aos produtos do gene marcador pode ser efectuada, por exemplo, por imunofluorescência ou microscopia imunoelectrónica. Com este objectivo, remove-se um espécime histológico do doente e aplica-se a este um anticorpo marcado, de preferência por sobreposição do anticorpo numa amostra biológica. Este 125
ΕΡ 1 607 402 /PT procedimento também permite determinar a distribuição do produto de gene marcador no tecido examinado. Será aparente aos peritos na especialidade que se encontra facilmente disponível uma larga gama de métodos histológicos para detecção in situ.
Os seguintes exemplos apresentam-se com fins meramente ilustrativos e não pretendem de modo algum limitar o âmbito do presente invento.
EXEMPLOS
Os reagentes disponíveis comercialmente referidos nos exemplos foram utilizados de acordo com as instruções do fabricante, salvo indicação em contrário. A fonte das células identificadas nos seguintes exemplos e ao longo do fascículo pelos números de acesso ATCC é a American Type Culture Collection, 10801 University Blvd., Manassas, VA 20110-2209. Todos os depósitos originais referidos no presente pedido foram feitos segundo estipulado no Tratado de Budapeste sobre o Reconhecimento Internacional do Depósito de Microrganismos para Efeitos do Procedimento em Matéria de Patentes e seus Regulamentos (Tratado de Budapeste). Tal assegura a manutenção de uma cultura viável do depósito durante 30 anos a partir da data do depósito. O depósito será disponibilizado pela ATCC segundo os termos do Tratado de Budapeste e sujeito a acordo entre a Genentech, inc. e a ATCC, que assegura a disponibilidade permanente e não restrita da progénie da cultura em depósito ao público após concessão da patente norte-americana pertinente e após disponíveis ao público quaisquer pedidos de patente norte-americana ou estrangeira, o que ocorrer primeiro, e assegura a disponibilidade da progénie a quem for determinado pelo U.S. Commissioner of Patents and Trademarks ter esse direito de acordo com 35 USC § 122 e as regras do Commissioner daí decorrentes (incluindo 37 CFR §1.14, com especial referência a 886 OG 638).
Salvo indicação em contrário, o presente invento utiliza procedimentos padrão de tecnologia de ADN recombinante, tal como descrito aqui supra e nos seguintes livros: Sambrook et al., Molecular Cloninq: A Laboratory Manual, Cold Spring Harbor Press, New York, 1989; Ausubel et al., Current 126
ΕΡ 1 607 402 /PT
Protocols in Molecular Biology, Green Publishing Associates and Wiley Interscience, New York, 1989; Innis et al., PCR Protocols: A Guide to Methods and Applications, Academic Press, inc., New York, 1990; Harlow et al., Antibodies: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, 1988; Gait, Oligonucleotide Synthesis, IRL Press, Oxford, 1984; R.I. Freshney, Animal Cell Culture, 1987; Coligan et al., Current Protocols in Immunology, 1991. EXEMPLO 1
Rastreio de homologia de domínio extracelular para identificar novos polipéptidos e ADNc gue os codificam
As sequências do domínio extracelular (ECD) (incluindo a sequência de sinal de excreção, caso exista) de cerca de 950 proteínas excretadas conhecidas da base de dados pública Swiss-Prot foram utilizadas para busca em base de dados EST. As bases de dados EST incluíram bases de dados públicas (por exemplo, Dayhoff, GenBank) e bases de dados registadas (por exemplo LIFESEQ®, Incyte Pharmaceuticals, Paio Alto, Califórnia). A busca foi efectuada utilizando o programa de computador BLAST ou BLAST-2 (Altschul et al., Methods in Enzymology, 266:460-480 (1996)) como uma comparação das sequências de proteínas ECD com uma tradução de 6 quadros das sequências EST. As comparações com uma pontuação BLAST de 70 (ou em alguns casos 90) ou superior que não codificam proteínas conhecidas foram agrupadas e montadas em sequências de ADN de consenso com o programa "phrap" (Phil Green, University of Washington, Seattle, Washington).
Utilizando este rastreio de homologia de domínio extracelular, as sequências de ADN de consenso foram montadas relativamente a outras sequências EST identificadas utilizando phrap. Além disso, as sequências de ADN de consenso obtidas foram frequentemente (mas nem sempre) estendidas utilizando ciclos repetidos de BLAST ou BLAST-2 e phrap para estender a sequência de consenso o mais possível utilizando as fontes de sequências EST discutidas supra.
Com base nas sequências de consenso obtidas como descrito supra, sintetizaram-se então oligonucleótidos e utilizaram-se 127
ΕΡ 1 607 402 /PT para identificar por PCR uma biblioteca de ADNc que continha a sequência de interesse e para utilização como sondas para isolar um clone da sequência de codificação de comprimento completo de um polipéptido PRO. Os iniciadores de PCR directos e inversos têm, em geral, de 20 a 30 nucleótidos e são frequentemente concebidos para darem um produto de PCR de cerca de 100-1000 pb de comprimento. As sequências sonda têm tipicamente 40-55 pb de comprimento. Em alguns casos, sintetizam-se oligonucleótidos adicionais quando a sequência de consenso é maior do que cerca de 1-1,5 kpb. De modo a rastrear várias bibliotecas para um clone completo, rastreou-se o ADN das bibliotecas por amplificação por PCR, tal como em Ausubel et al.r Current Protocols in Molecular Biology, com o par de iniciadores de PCR. Utilizou-se então uma biblioteca positiva para isolar clones que codificam o gene de interesse, utilizando o oligonucleótido sonda e um dos pares de iniciadores.
As bibliotecas de ADNc utilizadas para isolar os clones de ADNc foram construídas por métodos padrão utilizando reagentes disponíveis comercialmente, tal como os de Invitrogen, San Diego, CA. O ADNc foi iniciado com oligo dT contendo um local Notl, ligado com extremidades lisas a adaptadores hemiquinase Sall, clivados com Notl, ajustou-se o tamanho para ficar adequado para electroforese e clonou-se numa orientação definida para um vector de clonagem adequado (tal como pRKB ou pRKD; pRK5B é um precursor de pRK5D que não contém o local Sfil; consultar, Holmes et al., Science, 253:1278-1280 (1991)) nos locais Xhol e Notl únicos. EXEMPLO 2
Isolamento de clones de ADNc utilizando análise de algoritmo de sinal
Identificaram-se várias sequências de ácido nucleico que codificam polipéptidos, por aplicação de um algoritmo de busca de sequência de sinal registado desenvolvido por Genentech, Inc., (South San Francisco, CA) nas EST, bem como fragmentos EST agrupados e montados de bases de dados públicas (por exemplo, GenBank) e/ou privadas (LIFESEQ®, Incyte Pharmaceuticals, inc., Paio Alto, CA). O algoritmo de 128
ΕΡ 1 607 402 /PT sequências de sinal calcula uma pontuação de sinal de excreção com base no carácter dos nucleótidos do ADN que circundam o primeiro e opcionalmente o segundo codão de metionina (ATG) na extremidade 5' da sequência ou do fragmento de sequência em consideração. Os nucleótidos a seguir ao primeiro ATG devem codificar pelo menos 35 aminoácidos não ambíguos sem quaisquer codões de paragem. Se o primeiro ATG tem os aminoácidos necessários, o segundo não é examinado. Se nenhum deles cumprir os requisitos, a sequência candidata não é pontuada. De modo a determinar se a sequência EST contém uma sequência de sinal autêntica, os ADN e as sequências de aminoácidos correspondentes que circundam o codão ATG são pontuados utilizando um conjunto de sete sensores (parâmetros de avaliação) que se sabe estarem associados a sinais de excreção. A utilização deste algoritmo resultou na identificação de numerosas sequências de ácido nucleico que codificam polipéptido. EXEMPLO 3
Isolamento de clones de ADNc que codificam PR05775 humano
Identificou-se DNA96869-2673 por aplicação do algoritmo de busca de sequências de sinal registado descrito no exemplo 2 supra. A utilização do algoritmo para sequências de sinal descrito supra permitiu a identificação de uma sequência de grupo EST da base de dados lifeseq®, incyte Pharmaceuticals, Paio Alto, CA, aqui designada como CLU86443. Esta sequência de grupo EST foi então comparada com várias bases de dados de marcadores de sequências expressos (EST) que inclui bases de dados EST públicas (por exemplo, GenBank) e uma base de dados de ADN de EST registada (LIFESEQ®, Incyte Pharmaceuticals, Paio Alto, CA) para identificar homologias existentes. A busca de homologia foi efectuada utilizando o programa de computador BLAST ou BLAST2 (Altshul et al., Methods in Enzymology, 266:460-480 (1996)). As comparações que resultaram numa pontuação BLAST de 70 (ou em alguns casos 90) ou superior que não codificam proteínas conhecidas foram agrupadas e montadas numa sequência de ADN de consenso com o programa "phrap" (Phil Green, University of Washington, Seattle, Washington). A sequência de consenso assim obtida é aqui referida como DNA79860. 129
ΕΡ 1 607 402 /PT
Dada a homologia de sequências verificada entre a sequência DNA79860 e a sequência EST de Incyte abrangida pelo clone n.° 1614726H1 da base de dados LIFESEQ®, Incyte Pharmaceuticals, Paio Alto, Califórnia, comprou-se o clone n.° 1614726H1 e obteve-se e sequenciou-se a inserção de ADNc. A sequência desta inserção de ADNc apresenta-se na figura 31 (SEQ ID NO:31) e é aqui denominada como DNA96869-2673. A sequência de codificação completa de DNA96869-2673 está incluída na figura 1 (SEQ ID NO:l). O clone DNA96869-2673 contém um único quadro de leitura aberta com um local de iniciação de tradução aparente nas posições de nucleótidos 193-195 e acabando no codão de paragem nas posições de nucleótidos 1660-1662 (figura 1). O precursor polipeptídico previsto tem um comprimento de 489 aminoácidos (figura 2; SEQ ID NO:2). A proteína PR05775 de comprimento completo apresentada na figura 32 tem um peso molecular estimado de cerca de 53 745 dalton e um pi de cerca de 8,36. A análise da sequência PR05775 de comprimento completo apresentada na figura 2 (SEQ ID NO:2) evidencia a presença de uma variedade de domínios polipeptídicos importantes, em que as localizações apresentadas para esses domínios polipeptídicos importantes são aproximadamente as descritas supra. A análise da sequência PR05775 de comprimento completo apresentada na figura 2 evidencia a presença do seguinte: um péptido de sinal de cerca dc > aminoácido 1 a cerca do aminoácido 29; um domínio transmembranar de cerca do aminoácido 381 a cerca do aminoácido 399; locais de glicosilação em N de ! cerca do aminoácido 133 a cerca do aminoácido 137, de cerca do aminoácido 154 a cerca do aminoácido 158, de cerca do aminoácido 232 a cerca do aminoácido 236, de cerca do aminoácido 264 a cerca do aminoácido 268, de cerca do aminoácido 386 a cerca do aminoácido 390, de cerca do aminoácido 400 a cerca do aminoácido 404, de cerca do aminoácido 410 â cerca do aminoácido 414 e de cerca do aminoácido 427 a cerca do aminoácido 431; e locais de miristoilação em N de cerca do aminoácido 58 a cerca do aminoácido 64, de cerca do aminoácido 94 a cerca do aminoácido 100, de cerca do aminoácido 131 a cerca do aminoácido 137, de cerca do aminoácido 194 a cerca do aminoácido 200, de cerca do aminoácido 251 a cerca do 130
ΕΡ 1 607 402 /PT aminoácido 257, de cerca do aminoácido 277 a cerca do aminoácido 283, de cerca do aminoácido 281 a cerca do aminoácido 287, de cerca do aminoácido 361 a cerca do aminoácido 367, de cerca do aminoácido 399 a cerca do aminoácido 405, de cerca do aminoácido 440 a cerca do aminoácido 446, de cerca do aminoácido 448 a cerca do aminoácido 454 e de cerca do aminoácido 478 a cerca do aminoácido 484. O clone DNA96869-2673 foi depositado em ATCC em 22 de Junho de 1999 e foi-lhe atribuído o n.° de depósito ATCC PTA-255.
Uma análise da base de dados Dayhoff (versão 35.45 SwissProt 35), utilizando uma análise de alinhamento de sequência WU-BLAST2 da sequência de comprimento completo apresentada na figura 2 (SEQ ID NO:2) evidenciou identidade de sequência entre a sequência de aminoácidos PR05775 e as seguintes sequências Dayhoff: U94848_12, P_W57899, CV41KBPL_33, HSU60644_1, CV0RF1L5L_3, VK04_VACCV, CVGRI90_41, VK04_VACCC e AF026124_1. EXEMPLO 4
Amplificação génica
Este exemplo demonstra que os genes que codificam PR05775 são amplificados no genoma de determinados cancros e/ou linhas celulares de pulmão, cólon e/ou mama humanos. A amplificação está associada com sobre-expressão do produto génico, indicando que os polipéptidos são alvos úteis para intervenção terapêutica em determinados cancros, tais como cancro do cólon, pulmão, mama e outros. Os agentes terapêuticos podem tomar a forma de antagonistas dos polipéptidos PR05775, por exemplo, anticorpos quiméricos murino-humano, humanizados ou humanos contra um polipéptido PR05775. O material de partida para o rastreio foi ADN genómico isolado de vários cancros. O ADN é quantificado precisamente, por exemplo, fluorimetricamente. Como um controlo negativo, isolou-se ADN de células de dez indivíduos saudáveis normais que foram agrupadas e utilizadas como controlos de ensaio para a cópia do gene em indivíduos saudáveis (não apresentado). Utilizou-se o ensaio de 5' nuclease (por exemplo, TaqMan™) e 131
ΕΡ 1 607 402 /PT PCR quantitativo em tempo real (por exemplo, ABI Prizm 7700 Sequence Detection System™ (Perkin Elmer, Applied Biosystems Division, Foster City, CA) ) para encontrar genes potencialmente amplificados em determinados cancros. Os resultados foram utilizados para determinar se o ADN que codifica PR05775 é sobre-expresso em qualquer dos cancros primários ou linhas celulares de cancro de pulmão ou cólon ou linhas celulares de cancro de mama que foram rastreadas. Os cancros de pulmão primários foram obtidos de indivíduos com tumores do tipo e no estádio indicados na tabela 6. Foi apresentada aqui supra uma explicação das abreviaturas utilizadas para a designação dos tumores primários apresentados na tabela 6 e os tumores primários e linhas celulares referidos ao longo deste exemplo.
Os resultados de TaqMan™ são apresentados em unidades delta (A) Ct. Uma unidade corresponde a 1 ciclo de PCR ou aproximadamente uma amplificação de 2 vezes relativamente ao normal, duas unidades correspondem a amplificação de 4 vezes, 3 unidades a amplificação de 8 vezes e assim sucessivamente. A quantificação foi obtida utilizando iniciadores e uma sonda fluorescente TaqMan™ derivada do gene que codifica PR05775. As regiões de PR05775 que mais provavelmente contêm sequências de ácido nucleico únicas e que têm menor probabilidade de ter removido os intrões por splicing são preferidas para derivação do iniciador e sonda, por exemplo, regiões não traduzidas a 3'. As sequências para os iniciadores e sondas (directo, inverso e sonda) utilizadas para a análise de amplificação de gene PR05775 foram as seguintes: PR05775 (DNA96869-2673): 96869.tm.fi: 5'-GGGGAACCATfCCAACATC-3' (SEQ ID NO:3) 96869.tm.pl: 5'-CCATTCAGCAGGGTGAACCACAG-3' (SEQ ID NO:4) 96869.tm.rl: 5'-TCTCCGTGACCATGAACTTG-3' (SEQ ID NO:5) A reacção de ensaio de 5' nuclease é uma técnica baseada em PCR fluorescente que utiliza a actividade da 5' exonuclease da enzima ADN polimerase Taq para monitorizar a amplificação em tempo real. Utilizaram-se dois oligonucleótidos iniciadores 132
ΕΡ 1 607 402 /PT para gerar um amplicão típico de uma reacção de PCR. Concebe-se um terceiro oligonucleótido, ou sonda, para detectar a sequência de nucleótidos localizada entre os dois iniciadores de PCR. A sonda não é extensível pela enzima ADN polimerase Taq e é marcada com um corante fluorescente repórter e um corante de extinção de fluorescência. Qualquer emissão do corante repórter induzida por laser é extinta pelo corante de extinção quando os dois corantes se localizam perto um do outro, tal como estão na sonda. Durante a reacção de amplificação, a enzima ADN polimerase Taq cliva a sonda de uma forma dependente do molde. Os fragmentos de sonda resultantes dissociam em solução e o sinal do repórter libertado está livre do efeito de extinção do segundo fluoróforo. Liberta-se uma molécula de corante repórter por cada nova molécula sintetizada e a detecção do corante repórter não extinto proporciona a base para interpretação quantitativa dos dados. O procedimento de 5' nuclease é efectuado num dispositivo de PCR quantitativo em tempo real, tal como o ABI Prism 7700TM Sequence Detection. O sistema consiste de um termociclador, um laser, uma câmara de dispositivo de carga acoplada (CCD) e um computador. O sistema amplifica amostras num formato de 96 poços num termociclador. Durante a amplificação, recolhe-se o sinal fluorescente induzido por laser em tempo real através de cabos de fibra óptica para todos os 96 poços e detecta-se na CCD. O sistema inclui utilitário de computador para operar o instrumento e para analisar os dados.
Os dados do ensaio de 5' nuclease são inicialmente expressos como Ct ou o ciclo limiar. Este é definido como o ciclo no qual o sinal do repórter se acumula acima do nível de base de fluorescência. Utilizam-se os valores de ACt como medida quantitativa do número relativo de cópias iniciais de uma determinada sequência alvo numa amostra de ácido nucleico, quando comparando resultados de ADN de cancro com resultados de ADN humano normal. A tabela 6 descreve o estádio, estádio T e estádio N de vários tumores primários que foram utilizados para rastrear o composto PR05775 do invento. 133
ΕΡ 1 607 402 /PT
Tabela 6
Perfis de Tumores Primários do Pulmão e do Cólon Tumor Primário Estádio Outro Estádio Estádio Dukes Estádio T Estádio N Tumor do pulmão humano AdenoCa (SRCC724) [LT1] I IA TI NI Tumor do pulmão humano SqCCa (SRCC725) [LTla] IIB T3 NO Tumor do pulmão humano AdenoCa (SRCC726) [LT2] IB T2 NO Tumor do pulmão humano AdenoCa (SRCC727) [LT3] II IA TI N2 Tumor do pulmão humano AdenoCa (SRCC728) [LT4] IB T2 NO Tumor do pulmão humano SqCCa (SRCC729) [LT6] IB T2 NO Tumor do pulmão humano Aden/SqCCa (SRCC730) [LT7] IA TI NO Tumor do pulmão humano AdenoCa (SRCC731) [LT9] IB T2 NO Tumor do pulmão humano SqCCa (SRCC732) [LT10] IIB T2 NI Tumor do pulmão humano SqCCa (SRCC733) [LT11] I IA TI NI Tumor do pulmão humano AdenoCa (SRCC734) [LT12] IV T2 NO Tumor do pulmão humano AdenoSqCCa (SRCC735)[LT13] IB T2 NO Tumor do pulmão humano SqCCa (SRCC736) [LT15] IB T2 NO Tumor do pulmão humano SqCCa (SRCC737) [LT16] IB T2 NO Tumor do pulmão humano SqCCa (SRCC738) [LT17] IIB T2 NI Tumor do pulmão humano SqCCa (SRCC739) [LT18] IB T2 NO Tumor do pulmão humano SqCCa (SRCC740) [LT19] IB T2 NO Tumor do pulmão humano LCCa (SRCC741) [LT21] IIB T3 NI Pulmão humano AdenoCa (SRCC811) [LT22] IA TI NO Cólon humano AdenoCa (SRCC742) [CT2] Ml D pT4 NO 134
ΕΡ 1 607 402 /PT
Perfis de Tumores Primários do Pulmão e do Cólon Tumor Primário Estádio Outro Estádio Estádio Dukes Estádio T Estádio N Cólon humano AdenoCa (SRCC743) [CT3] B pT3 NO Cólon humano AdenoCa (SRCC 744) [CT8] B T3 NO Cólon humano AdenoCa (SRCC745) [CT10] A pT2 NO Cólon humano AdenoCa (SRCC7 4 6) [CT12] MO, RI B T3 NO Cólon humano AdenoCa (SRCC747) [CT14] pMO, RO B pT3 pNO Cólon humano AdenoCa (SRCC748) [CT15] Ml, R2 D T4 N2 Cólon humano AdenoCa (SRCC749) [CT16] pMO B pT3 pNO Cólon humano AdenoCa (SRCC750) [CT17] Cl pT3 pNl Cólon humano AdenoCa (SRCC751) [CT1] MO, RI B pT3 NO Cólon humano AdenoCa (SRCC752) [CT4] B pT3 MO Cólon humano AdenoCa (SRCC753) [CT5] G2 Cl pT3 pNO Cólon humano AdenoCa (SRCC754) [CT6] pMO, RO B pT3 pNO Cólon humano AdenoCa (SRCC755) [CT7] G1 A pT2 pNO Cólon humano AdenoCa (SRCC756) [CT9 ] G3 D pT4 pN2 Cólon humano AdenoCa (SRCC757) [CT11] B T3 NO Cólon humano AdenoCa (SRCC758) [CT18] MO, RO B pT3 pNO
Preparação de ADN:
Preparou-se ADN a partir de linhas celulares em cultura, tumores primários e sangue humano normal. O isolamento foi efectuado utilizando kit de purificação, conjunto de tampão e protease e todos de Qiagen, de acordo com as instruções do fabricante e a descrição infra. 135
ΕΡ 1 607 402 /PT
Lise da cultura celular.
Lavaram-se as células e trataram-se com tripsina a uma concentração de 7,5 x 108 por ponta e sedimentaram-se por centrifugação a 1000 rpm durante 5 minutos a 4°C, seguido por lavagem mais uma vez mais com 1/2 volume de PBS e nova centrifugação. Lavaram-se os sedimentos uma terceira vez, recolheram-se as células em suspensão e lavaram-se 2x com PBS. As células foram então suspensas em 10 ml de PBS.
Eguilibrou-se tampão Cl a 4°C. Diluiu-se protease n.° 19155 de Qiagen em 6,25 ml de água duplamente destilada (ddH20) fria para uma concentração final de 20 mg/ml e equilibrou-se a 4°C. Preparou-se 10 ml de tampão G2 por diluição de solução-mãe de ARNase A de Qiagen (100 mg/ml) para uma concentração final de 200 pg/ml.
Adicionaram-se então tampão Cl (10 ml, 4°C) e ddH20 (40 ml, 4°C) a 10 ml de suspensão celular, misturou-se por inversão e incubou-se em gelo durante 10 minutos.
Sedimentaram-se os núcleos celulares por centrifugação num rotor de cesto basculante Beckman a 2500 rpm a 4°C durante 15 minutos. Rejeitou-se o sobrenadante e suspenderam-se os núcleos num vórtex para 2 ml de tampão Cl (a 4°C) e 6 ml de ddH20, seguido por uma segunda centrifugação a 4°C a 2500 rpm durante 15 minutos. Os núcleos foram então ressuspensos no tampão residual utilizando 200 μΐ por ponta. Adicionou-se tampão G2 (10 ml) aos núcleos em suspensão enquanto se aplicava um vórtex suave. Após finalizar a adição de tampão, aplicou-se vórtex vigoroso durante 30 segundos. Adicionou-se protease de Qiagen (200 μΐ, preparada como indicado supra) e incubou-se a 50°C durante 60 minutos. A incubação e centrifugação foram repetidas até os lisados estarem límpidos (por exemplo, incubando 30-60 minutos adicionais, sedimentar a 3000 x g durante 10 min., 4°C).
Preparação e lise da amostra de tumor humano sólido:
Pesaram-se as amostras de tumor e colocaram-se em tubos cónicos de 50 ml e colocaram-se em gelo. O processamento foi limitado a não mais de 250 mg de tecido por preparação (1 ponta/preparação). Preparou-se de novo a solução de protease por diluição em 6,25 ml de ddH20 fria para uma concentração final de 20 mg/ml e armazenou-se a 4°C. Preparou-se tampão G2 (20 ml) por diluição de ADNase A para 136
ΕΡ 1 607 402 /PT uma concentração final de 200 mg/ml (a partir de solução-mãe 100 mg/ml) . Homogeneizou-se o tecido de tumor em 19 ml de tampão G2 durante 60 segundos com a ponta grande do homogeneizador numa hotte de fluxo laminar TC de modo a evitar inalação dos aerossóis e manteve-se à temperatura ambiente. Entre amostras, limpou-se o homogeneizador por rotação a 2x 30 segundos cada, em 2 L de ddH20, seguido por tampão G2 (50 ml). Caso ainda houvesse tecido na ponta do gerador, o aparelho era desmontado e lavado.
Adicionou-se protease de Qiagen (preparada como indicado supra, 1,0 ml), seguido por vórtex e incubação a 50°C durante 3 horas. Repetiram-se a incubação e centrifugação até os lisados estarem límpidos (por exemplo, incubação adicional de 30-60 minutos, sedimentação a 3000 x g durante 10 min., 4°C).
Preparação e lise de sangue humano:
Obteve-se sangue de voluntários saudáveis utilizando protocolos de agente infeccioso padrões e citrado para amostras de 10 ml por ponta. Preparou-se de novo protease de Qiagen por diluição para 6,25 ml de ddH20 fria para uma concentração final de 20 mg/ml e armazenou-se a 4°C. Preparou-se tampão G2 por diluição de ARNase A para uma concentração final de 200 pg/ml a partir de solução-mãe a 100 mg/ml. Colocou-se o sangue (10 ml) num tubo cónico de 50 ml e adicionaram-se 10 ml de tampão Cl e 30 ml de ddH20 (ambos previamente equilibrados a 4°C) e misturaram-se as componentes por inversão e mantiveram-se em gelo durante 10 minutos. Sedimentaram-se os núcleos com um rotor de cesto basculante Beckman a 2500 rpm, 4°C durante 15 minutos e rejeitou-se o sobrenadante. Suspenderam-se os núcleos com um vórtex em 2 ml de tampão Cl (4°C) e 6 ml de ddH20 (4°C) .
Repetiu-se o vórtex até o sedimento estar branco. Os núcleos foram então suspensos no tampão residual utilizando uma ponta de 200 μΐ. Adicionou-se tampão G2 (10 ml) aos núcleos em suspensão enquanto se aplicava um vórtex suave seguido por vórtex vigoroso durante 30 segundos. Adicionou-se protease de Qiagen (200 μΐ) e incubou-se a 50°C durante 60 minutos. Repetiram-se a incubação e centrifugação até os lisados estarem limpidos (por exemplo, incubação adicional durante 30-60 minutos, sedimentação a 3000x g durante 10 min., 4°C) . 137
ΕΡ 1 607 402 /PT
Purificação dos Usados límpidos: (1) Isolamento de ADN qenómico:
Equilibrou-se ADN genómico (1 amostra por preparação em ponta maxi) com 10 ml de tampão QBT. Equilibrou-se tampão de eluição QF a 50°C. As amostras foram sujeitas a vórtex durante 30 segundos, seguidamente carregadas para pontas equilibradas e despejadas por gravidade. Lavaram-se as pontas com 2 x 15 ml de tampão QC. Eluiu-se o ADN para tubos Corex de 30 ml silanizados, autoclavados com 15 ml de tampão QF (50°C). Adicionou-se isopropanol (10,5 ml) a cada amostra, cobriram-se os tubos com parafina e misturaram-se por inversão repetida até o ADN precipitar. Sedimentaram-se as amostras por centrifugação no rotor SS-34 a 15 000 rpm durante 10 minutos a 4°C. Marcou-se a localização do sedimento, rejeitou-se o sobrenadante e adicionou-se 10 ml de etanol a 70% (4°C). Sedimentaram-se novamente as amostras por centrifugação no rotor SS-34 10 000 rpm durante 10 minutos a 4°C. Marcou-se a localização do sedimento e rejeitou-se o sobrenadante. Colocaram-se os tubos de lado num tabuleiro de secagem e secaram-se durante 10 minutos a 37°C, tendo o cuidado de não secar as amostras em demasia.
Após secagem, dissolveram-se os sedimentos em 1,0 ml de TE (pH 8,5) e colocaram-se a 50°C durante 1-2 horas. Mantiveram-se as amostras durante a noite a 4°C à medida que continuava a dissolução. Transferiu-se então a solução de ADN para tubos de 1,5 ml com uma agulha de calibre 26 numa seringa de tuberculina. Repetiu-se a transferência 5x de modo a cortar o ADN. Colocaram-se então as amostras a 50 °C durante 1-2 horas. (2) Quantificação de ADN genómico e preparação para ensaio de amplificação génica:
Quantificaram-se os níveis de ADN em cada tubo por espectrofotometria A260/A280 padrão numa diluição 1:20 (5 pl de ADN + 95 μΐ de ddH20) utilizando cuvetes de quartzo de 0,1 ml no espectrof otómetro Beckman DU640. As razões A26o/A28o estiveram na gama de 1,8-1,9. Diluiu-se então cada amostra de ADN adicionalmente até aproximadamente 200 ng/ml em TE 138
ΕΡ 1 607 402 /PT (pH 8,5). Quando o material original estava altamente concentrado (cerca de 700 ng/μΐ), colocou-se o material a 50°C durante várias horas até ressuspender. A quantificação fluorimétrica de ADN foi então efectuada no material diluido (20-600 ng/ml) utilizando as orientações do fabricante, modificadas como descrita infra. Tal foi efectuado deixando aquecer um fluorimetro Hoeffer DyNA Quant 200 durante cerca de 15 minutos. Diluiu-se a solução de trabalho de corante Hoechst (n.° H33258, 10 μΐ, preparado a menos de 12 horas da utilização) para 100 ml de tampão lx TNE. Encheu-se uma cuvete de 2 ml com a solução de fluorimetro, colocou-se na máquina e ajustou-se a máquina a zero. Adicionou-se pGEM 3Zf(+) (2 μΐ, lote n.° 360851026) a 2 ml de solução de fluorimetro e calibrou-se a 200 unidades. Ensaiou-se então 2 μΐ de ADN pGEM 3Zf(+) adicionais e a leitura confirmou 400 +/- 10 unidades. Leu-se então cada amostra pelo menos em triplicado. Quando se verificou que 3 amostras estavam dentro do intervalo de 10% umas das outras, efectuou-se a sua média e utilizou-se este valor como o valor de quantificação. A concentração determinada fluorimetricamente foi então utilizada para diluir cada amostra a 10 ng/μΐ em ddH20. Tal foi efectuado simultaneamente em todas as amostras molde para um ensaio de placa TaqMan™ único e com material suficiente para efectuar 500-1000 ensaios. Ensaiaram-se as amostras em triplicado com iniciadores Taqman™ e sondou-se tanto B-actina como GAPDH numa placa única com ADN humano normal e controlos sem molde. Utilizaram-se as amostras diluídas desde que o valor de CT de ADN humano normal subtraído do ADN de teste fosse +/- 1 Ct. O ADN genómico de lote qualificado diluído foi armazenado em alíquotas de 1,0 ml a -80°C. As alíquotas que foram utilizadas subsequentemente no ensaio de amplificação génica foram armazenadas a 4°C. Cada alíquota de 1 ml é suficiente para 8-9 placas ou 64 ensaios.
Ensaio de amplificação génica: O composto PR05775 do invento foi rastreado nos seguintes tumores primários e os valores de ACt resultantes apresentam-se na tabela 7B. 139
139 ΕΡ 1 607 402 /PT
Tabela 7B
Valores de ACt no tumor primário do pulmão e do cólon e em modelos de linhas celulares Tumor Primário PR05 775 HF-000631 1, 97 1, 70 HF-000641 1, 90 1, 87 HF-000643 1, 13 1,21 HF-000840 3,64 3,55 HF-000842 2,56 2, 42 2, 12 2, 88 HBL100 - MB435s - T47D - MB468 - MB175 - MB361 - BT20 - MCF7 - SKBR3 - SW4 80 - SW620 - Colo320 - HT29 - HM 7 - WiDr - HCT116 - SKCOl - SW403 - LS174T - Colo205 - HCT15 - HCC2998 - KM12 - A549 - Calu-1 -
140 ΕΡ 1 607 402 /PT
Valores de ACt no tumor primário do pulmão e do cólon e em modelos de linhas celulares Tumor Primário PR05 775 Calu-6 - H157 - H441 - H46 0 - SKMES1 - SW900 - H522 - H810 - SRCC1094 - SRCC1095 - SRCC1096 - SRCC1097 - SRCC1098 - SRCC1099 - SRCC1100 - SRCC1101 - HF-000545 - HF-000499 - HF-000539 - HF-000575 - HF-000698 - HF-000756 - HF-000762 2, 01 1, 04 HF-000789 1,30 1, 12 HF-000795 - HF-000811 1, 82 1, 80 HF-000755 - CT2 - CT3 - CT8 - CT10 - CT12 - CT14 - CT15 -
141 ΕΡ 1 607 402 /PT
Valores de ACt no tumor primário do pulmão e do cólon e em modelos de linhas celulares Tumor Primário PR05 775 CT16 - CT17 - CT1 - CT4 - CT5 - CT6 - CT7 - CT9 - CT11 - CT18 - CT25 - CT28 - CT35 - HF-000611 - HF-000613 - HF-001291 - HF-001293 2, 12 2, 09 HF-001294 2, 15 1, 99 HF-001295 1, 99 2, 15 HF-001296 4,62 4, 78 HF-001297 - HF-001299 1, 92 1, 95 HF-001300 - LT7 - LT27 - LT13 - LT1 - LT2 - LT3 - LT4 - LT9 - 142
ΕΡ 1 607 402 /PT
Valores de ACt no tumor primário do pulmão e do cólon e em modelos de linhas celulares Tumor Primário PR05775 LT12 - LT22 - LT30 - LT33 - LT8 - LT21 - LTla - LT6 - LT10 - LT11 - LT15 - LT16 - LTl 7 - LTl 8 - LTl 9 - LT26 - LT28 - LT29 - L731 - HF-000854 - HF-000855 - HF-000856 - HF-000831 - HF-000832 - HF-000550 - HF-000551 - HF-000733 - HF-000716 - PR05775 (DNA96869-2673):
Os valores de ACt para DNA96869-2673 em vários tumores apresentam-se na tabela 7B. Utilizou-se tipicamente um ACt >1 como valor limiar para pontuação de amplificação, já que isso representa uma duplicação de cópias do gene. A tabela 7B indica que ocorreu amplificação significativa de ácido 143
ΕΡ 1 607 402 /PT nucleico DNA96869-2673 que codifica PR05775: (1) em tumores de pulmão primários: HF-000631, HF-000641, HF-000643, HF-000840, HF-000842, HF-001293, HF-001294, HF-001295, HF-001296 e HF-001299; e (2) em centros de tumor de cólon primários: HF-000762, HF-000789 e HF-000811.
Dado que a amplificação de DNA96869-2673 ocorre em vários tumores, é altamente provável que desempenhe um papel significativo em formação ou crescimento de tumor. Como resultado, seria de esperar que os antagonistas (por exemplo, anticorpos) dirigidos contra a proteina codificada por DNA96869-2673 (PR05775) sejam úteis em terapia de cancro. EXEMPLO 5
Hibridação in situ A hibridação in situ é uma técnica potente e versátil para a detecção e localização de sequências de ácido nucleico dentro de células ou preparações de tecidos. Pode ser útil, por exemplo, para identificar locais de expressão génica, analisar a distribuição de transcrição nos tecidos, identificar e localizar infecção virai, seguir alterações em síntese de ARNm específico e auxiliar em mapeamento de cromossomas. A hibridação in situ é efectuada seguindo uma versão optimizada do protocolo de Lu e Gillett, Cell Vision, _1:169-176(1994), utilizando ribossondas marcadas com 33P geradas por PCR. Sucintamente, seccionaram-se tecidos humanos fixados com formalina e embebidos em parafina, desparafinizaram-se, desproteinaram-se em proteinase K (20 g/ml) durante 15 minutos a 37°C e processaram-se adicionalmente para hibridação in situ tal como descrito por Lu e Gillett, supra. Gera-se uma ribossonda anti-sentido marcada com (33-P)UTP a partir de um produto de PCR e hibrida-se a 55°C durante a noite. Mergulham-se as lâminas em emulsão de traçador nuclear Kodak NTB2™ e expõe-se durante 4 semanas. 144
ΕΡ 1 607 402 /PT Síntese de 33P-Ribossonda
Liofiliza-se num Speed-Vac 6,0 μΐ (125 mCi) de 33P-UTP (AmershamBF 1002, SA<2000 Ci/mmol). Para cada tubo contendo o 33P-UTP seco adicionam-se os seguintes ingredientes: 20 μΐ de 5x tampão de transcrição 1.0 μΐ de DTT (100 mM) 2.0 μΐ de mistura NTP (2,5 mM: 10 μΐ cada de GTP, CTP e ATP, todos 10 mM + 10 μΐ H20) 1.0 μΐ de UTP (50 μΜ) 1.0 μΐ de RNAsin 1.0 μΐ de molde de ADN (1 pg) 1.0 μΐ de H20 1.0 μΐ de ARN polimerase (para produtos de PCR T3= AS, T7= S, usualmente)
Incubaram-se os tubos a 37°C durante uma hora.
Adicionou-se um total de 1,0 μΐ de RQl ADNase, seguido por incubação a 37°C durante 15 minutos. Adicionou-se um total de 90 μΐ de TE (Tris 10 mM, pH 7,6/EDTA 1 mM, pH 8,0) e pipetou-se a mistura para papel DE81. A solução restante é carregada para uma unidade de filtração MICROCON-50™ e centrifugada utilizando o programa 10 (6 minutos). Inverte-se a unidade de filtração para um segundo tubo e centrifuga-se utilizando o programa 2 (3 minutos). Após a centrifugação de recuperação final, adiciona-se um total de 100 μΐ de TE, seguidamente pipeta-se 1 μΐ do produto final em papel DE81 e conta-se em 6 ml de BIOFLUOR II™.
Corre-se a sonda num gel de TBE/ureia. Adiciona-se um total de 1-3 μΐ da sonda ou 5 μΐ de ARN Mrk III a 3 μΐ de tampão de carga. Após aquecimento a 95°C num bloco de aquecimento durante três minutos, coloca-se o gel imediatamente em gelo. Lavam-se os poços do gel e carrega-se a amostra e corre-se a 180-250 volts durante 45 minutos. Embrulha-se o gel em película plástica (marca SARAN™) e expõe-se a película XAR com um monitor intensificador num congelador a -70°C durante uma hora até durante a noite. 145
ΕΡ 1 607 402 /PT
Hibridação com 33P A. Pré-tratamento de secções congeladas
Removem-se as lâminas do congelador, colocam-se em tabuleiros de alumínio e descongelam-se à temperatura ambiente durante 5 minutos. Colocam-se os tabuleiros num incubador a 55°C durante cinco minutos para reduzir a condensação. Fixam-se as lâminas durante 10 minutos em paraformaldeído a 4% em gelo numa hotte e lava-se com SSC 0,5x durante 5 minutos, à temperatura ambiente (25 ml SSC 20x + 975 ml SQ H20) . Após desproteinação em proteinase K a 0,5 pg/ml durante 10 minutos a 37°C (12,5 μΐ de solução-mãe a 10 mg/ml em 250 ml de tampão ARNase isento de ARNase pré-aquecido), lavaram-se as secções com SSC 0,5x durante 10 minutos à temperatura ambiente. Desidratam-se as secções em etanol a 70%, 95% e 100%, 2 minutos cada. B. Pré-tratamento de secções embebidas em parafina
Desparafinizaram-se as lâminas, colocaram-se em SQ H20 e enxaguaram-se duas vezes com SSC 2x à temperatura ambiente, durante 5 minutos de cada vez. Desproteinaram-se as secções em proteinase K 20 pg/ml (500 μΐ de 10 mg/ml em 250 ml de tampão ARNase isento de ARNase, 37°C, 15 minutos) para tecido de embrião humano ou 8 x proteinase K (100 μΐ em 250 ml de tampão ARNase, 37°C, 30 minutos) para tecidos em formalina.
Efectua-se lavagem subsequente com SSC 0,5x e desidratação tal como descrito supra. C. Pré-hibridação
Colocam-se as lâminas numa caixa de plástico forrada com papel de filtro de saturado com tampão de caixa (SSC 4x, formamida a 50%) . Cobre-se o tecido com 50 μΐ de tampão de hibridação (3,75 g de sulfato de dextrano + 6 ml SQ H20), sujeitou-se a vórtex e aqueceu-se no microondas durante 2 minutos com a tampa solta. Após arrefecer em gelo, adicionou-se 18,75 ml de formamida, 3,75 ml de SSC 20x e 9 ml de SQ H20 e sujeita-se bem o tecido a vórtex e incuba-se a 42°C durante 1-4 horas. 146
ΕΡ 1 607 402 /PT D. Hibridação
Aquece-se a 95°C durante 3 minutos, 1,0 x 106 cpm de sonda e 1,0 μΐ de ARNt (50 mg/ml solução-mãe) por lâmina. Arrefecem-se as lâminas em gelo e adiciona-se 48 μΐ de tampão de hibridação por lâmina. Após vórtex, adiciona-se 50 μΐ de mistura 33P a 50 μΐ de pré-hibridação na lâmina. Incubam-se as lâminas durante a noite a 55°C. E. Lavagens A lavagem é efectuada durante 2x 10 minutos com SSC 2x, EDTA à temperatura ambiente (400 ml de SSC 20x + 16 ml de EDTA 0,25 M, Vf=4L), seguido por tratamento com ARNase a 37°C durante 30 minutos (500 μΐ de 10 mg/ml em 250 ml de tampão ARNase = 20 pg/ml), Lavam-se as lâminas 2 x 10 minutos com SSC 2x, EDTA à temperatura ambiente. As condições de rigor da lavagem são as seguintes: 2 horas a 55°C, SSC 0,lx, EDTA (20 ml SSC 20x + 16 ml EDTA, Vf=4L). EXEMPLO 6
Utilização de PRQ5775 como uma sonda de hibridação O seguinte método descreve a utilização de uma sequência de nucleótidos que codifica um polipéptido PR05775 como uma sonda de hibridação.
Pode utilizar-se ADN incluindo a sequência de codificação de um polipéptido "PR05775" de comprimento completo ou maduro, tal como aqui revelado e/ou seus fragmentos como uma sonda para rastrear ADN homólogo (tal como os que codificam variantes de ocorrência natural de PR05775 em bibliotecas de ADNc de tecido humano ou bibliotecas genómicas de tecido humano. A hibridação e lavagem de filtros contendo qualquer das bibliotecas de ADN é efectuada sob as seguintes condições de elevado rigor. A hibridação da sonda derivada de PR05775 marcada radioactivamente é efectuada numa solução de formamida a 50%, SSC 5x, SDS a 0,1%, pirofosfato de sódio a 0,1%, fosfato de sódio 50 mM, pH 6,8, solução de Denhardt 2x e sulfato de dextrano a 10% a 42°C durante 20 horas. A lavagem 147
ΕΡ 1 607 402 /PT dos filtros é efectuada numa solução aquosa de SSC 0,lx e SDS a 0,1% a 42°C.
Pode então ser identificado adn com a identidade de sequência pretendida com o ADN que codifica a sequência nativa de comprimento completo de PR05775, utilizando técnicas padrão conhecidas na especialidade. EXEMPLO 7
Expressão de polipéptidos PRQ5775 em E. coli
Este exemplo ilustra a preparação de uma forma não glicosilada de PR05775 por expressão recombinante em E. coli. A sequência de ADN que codifica o polipéptido PRO de interesse é inicialmente amplificada utilizando iniciadores de PCR seleccionados. Os iniciadores devem conter locais de enzima de restrição que correspondem aos locais de enzima de restrição do vector de expressão seleccionado. Podem ser utilizados vários vectores de expressão. Constitui um exemplo de um vector adequado pBR322 (derivado de E. coli} consultar Bolívar et al., Gene, 2:95 (1977)) que contém genes para resistência a ampicilina e tetraciclina. O vector é digerido com enzima de restrição e desfosforilado. Ligam-se então as sequências amplificadas por PCR ao vector. O vector incluirá, de preferência, sequências que codificam um gene de resistência a antibiótico, um promotor trp, um comando poli-His (incluindo os primeiros seis codões STII, sequência poli-His e local de clivagem de enteroquinase), a região de codificação de PR05775, terminador de transcrição lambda e um gene argU. A mistura de ligação é então utilizada para transformar uma estirpe de E. coli seleccionada utilizando os métodos descritos em Sambrook et al., supra. Identificam-se os transformantes pela sua capacidade de crescer em placas LB e seleccionam-se colónias resistentes a antibióticos. O ADN de plasmídeo pode ser isolado e confirmado por análise de restrição e sequenciação de ADN.
Podem cultivar-se clones seleccionados durante a noite em meio de cultura líquido, tal como meio LB suplementado com 148
ΕΡ 1 607 402 /PT antibióticos. A cultura durante a noite pode ser subsequentemente utilizada para inocular uma cultura em maior escala. Cultivam-se então as células até uma densidade óptica pretendida, durante a qual a expressão de promotor é iniciada.
Após cultura das células durante mais algumas horas, as células podem ser recolhidas por centrifugação. O sedimento celular obtido na centrifugação pode ser solubilizado utilizando vários agentes conhecidos na especialidade e a proteína PR05775 solubilizada pode ser então purificada utilizando uma coluna de quelação de metais, em condições que permitem ligação forte da proteína.
As proteínas podem ser expressas em E. coli numa forma marcada com poli-His, utilizando o seguinte procedimento. O ADN que codifica a proteína é inicialmente amplificado utilizando iniciadores de PCR seleccionados. Os iniciadores contêm locais de enzima de restrição adequados que correspondem aos locais de enzima de restrição no vector de expressão seleccionado e outras sequências úteis para início de tradução fiável, purificação rápida numa coluna de quelação de metal e remoção proteolítica com enteroquinase. Ligam-se então as sequências amplificadas por PCR marcadas com poli-His para um vector de expressão, que é utilizado para transformar um hospedeiro de E. coli com base em estirpe 52 (W3110 fuhA(tonA) Ion galE rpoHts(htpRts) clpP(lacIq). Crescem-se primeiramente os transformantes em LB contendo carbenicilina a 50 mg/ml a 30°C, com agitação, até se atingir uma D.O. de 3-5 a 600 nm. Diluem-se então as culturas 50-100 vezes em meio CRAP (preparado por mistura de 3,57 g de (NH4)2S04, 0,71 g de citrato de sódio·2Η20, 1,07 g de KC1, 5,36 g de extracto de levedura Difco, 5,36 g de hycase SF de Sheffield em 500 ml de água, bem como MPOS 110 mM, pH 7,3, glucose a 0,55% (p/v) e MgSCú 7 mM) e crescem-se durante aproximadamente 20-30 horas a 30 °C com agitação. Removem-se as amostras para verificar expressão por SDS-PAGE e centrifuga-se a cultura em bruto para sedimentar as células. Congelam-se os sedimentos de células até purificação e re-dobragem.
Ressuspende-se a pasta de E. coli de fermentações de 0,5 a 1 L (sedimentos de 6-10 g) em 10 volumes (p/v) em tampão de guanidina 7 M, Tris 20 mM, pH 8. Adiciona-se sulfito de sódio 149 ΕΡ 1 607 402 /PT sólido e tetrationato de sódio para obter concentrações finais de 0,1 M e 0,02 M, respectivamente, e agita-se a solução durante a noite a 4°C. Esta etapa resulta numa proteína desnaturada com todos os resíduos de cisteína bloqueados por sulfitação. Centrifuga-se a solução a 40 000 rpm numa ultracentrífuga Beckman durante 30 min. Dilui-se o sobrenadante com 3-5 volumes de tampão de coluna de quelação de metal (guanidina 6 M, Tris 20 mM, pH 7,4) e filtra-se através de filtros de 0,22 micra para clarificar. O extracto clarificado é carregado para uma coluna de quelação de metais Qiagen Ni2+-NTA de 5 ml equilibrada no tampão de coluna de quelação de metal. Lava-se a coluna com tampão adicional contendo imidazole 50 mM (Calbiochem, grau Utrol), pH 7,4. Eluem-se as proteínas com tampão contendo imidazole 250 mM. Recolhem-se conjuntamente as fracções que contêm a proteína pretendida e armazenam-se a 4°C. Estima-se a concentração de proteína através da sua absorvância a 280 nm, utilizando o coeficiente de extinção calculado com base na sua sequência de aminoácidos. A proteína é re-dobrada por diluição lenta da amostra para tampão de re-dobragem preparado recentemente que consiste de: Tris 20 mM, pH 8,6, NaCl 0,3 M, ureia 2,5 M, cisteína 5 mM, glicina 20 mM e EDTA 1 mM. Os volumes de re-dobragem são seleccionados de modo a que a concentração final de proteína esteja entre 50 a 100 microgramas/ml. Agita-se suavemente a solução de re-dobragem a 4°C durante 12-36 horas. Pára-se a reacção de re-dobragem por adição de TFA para uma concentração final de 0,4% (pH aproximadamente igual a 3). Antes de purificação adicional da proteína, filtra-se a solução através de um filtro de 0,22 micra e adiciona-se acetonitrilo para uma concentração final de 2-10%. Sujeita-se a proteína re-dobrada a cromatografia numa coluna de fase reversa Poros Rl/H utilizando um tampão móvel de TFA a 0,1% com eluição com um gradiente de acetonitrilo de 10 a 80%. Analisam-se as alíquotas de fracções com absorvância A2so em géis de SDS poliacrilamida e recolhem-se conjuntamente as fracções contendo proteína re-dobrada homogénea. Em geral, as espécies com re-dobragem adequado da maioria das proteínas são eluídas às concentrações mais baixas de acetonitrilo, dado que essas espécies são as mais compactas com os seus interiores hidrófobos protegidos de interacção com a resina de fase 150
ΕΡ 1 607 402 /PT reversa. As espécies agregadas são usualmente eluídas a concentrações de acetonitrilo mais elevadas. Além de resolver as formas com dobragem incorrecto das proteínas relativamente à forma pretendida, a etapa de fase reversa também remove endotoxina das amostras.
As fracções contendo a proteína dobrada pretendida são agrupadas e remove-se o acetonitrilo utilizando uma corrente suave de azoto dirigida para a solução. As proteínas são formuladas em Hepes 20 mM, pH 6,8 com cloreto de sódio 0,14 M e manitol a 4% por diálise ou por filtração em gel utilizando resinas G25 Superfina (Pharmacia) equilibradas em tampão de formulação e esterilizadas por filtração. EXEMPLO 8
Expressão de PR05775 em células de mamífero
Este exemplo ilustra a preparação de uma forma potencialmente glicosilada de PR05775 por expressão recombinante em células de mamífero. O vector, pRK5 (consultar EP 307 247, publicada a 15 de Março de 1989), é utilizado como o vector de expressão. Opcionalmente, liga-se o ADN PR05775 para pRK5 com enzimas de restrição seleccionadas para permitir inserção do ADN PR05775 utilizando métodos de ligação, tal como descrito em Sambrook et al., supra. O vector resultante é denominado pRK5-PR05775.
Numa concretização, as células hospedeiras seleccionadas podem ser células 293. Cultivam-se células 293 humanas (ATCC CCL 1573) até confluência em placas de cultura de tecidos em meio tal como DMEM suplementado com soro fetal de vitelo e opcionalmente, componentes nutrientes e/ou antibióticos. Mistura-se cerca de 10 pg de ADN pRK5-PR05775 com cerca de 1 pg de ADN que codifica o gene VA RNA [Thimmappaya et al. , Cell, 3^:543 (1982)] e dissolve-se em 500 pl de Tris-HCl 1 mM, EDTA 0,1 mM, CaCl2 0,227 Μ. A esta mistura adiciona-se, gota a gota, 500 pl de HEPES 50 mM (pH 7,35), NaCl 280 mM. NaP04 1,5 mM e deixa-se formar um precipitado durante 10 minutos a 25°C. Suspende-se o precipitado e adiciona-se a células 293 e permite-se sedimentar durante cerca de quatro horas a 37°C. 151
ΕΡ 1 607 402 /PT
Aspira-se o meio de cultura e adiciona-se 2 ml de glicerol a 20% em PBS durante 30 segundos. Lavam-se então as células 293 com meio isento de soro, adiciona-se meio fresco e incubam-se as células durante cerca de 5 dias.
Aproximadamente 24 horas após as transfecções, remove-se o meio de cultura e substitui-se por meio de cultura (sozinho) ou meio de cultura contendo 35S-cisteína 200 pCi/ml e 35S-metionina 200 pCi/ml. Após uma incubação de 12 horas, recolhe-se o meio condicionado, concentrado num filtro de rotação e carrega-se para um gel de SDS a 15%. O gel processado pode ser seco e exposto a película durante um período seleccionado para revelar a presença do polipéptido PR05775. As culturas contendo células transfectadas podem ser sujeitas a incubação adicional (em meio isento de soro) e o meio é ensaiado em bioensaios seleccionados.
Numa técnica alternativa, pode introduzir-se ADN R05775 em células 293 transitoriamente utilizando o método de sulfato de dextrano descrito por Somparyrac et al., Proc. Natl. Acad. Sei., 1_2:7575 (1981). Cultivam-se células 293 até densidade máxima num balão de rotação e adiciona-se 700 pg de ADN PRK5-PR05775. As células são primeiramente concentradas do balão de rotação por centrifugação e lavam-se com PBS. Incuba-se o precipitado de ADN-dextrano no sedimento celular durante quatro horas. Tratam-se as células com glicerol a 20% durante 90 segundos, lavam-se com meio de cultura de tecidos e re-introduzem-se num balão de rotação contendo meio de cultura de tecidos, insulina bovina a 5 pg/ml e transferrina bovina a 0,1 pg/ml. Após cerca de quatro dias, o meio condicionado é centrifugado e filtrado para remover células e resíduos. A amostra contendo PR05775 expresso pode então ser concentrada e purificada por qualquer método seleccionado, tal como diálise e/ou cromatografia em coluna.
Noutra concretização, PR05775 pode ser expresso em células CHO. O vector pRK5-PR05775 pode ser transfectado para células CHO utilizando reagentes conhecidos, tal como CaP04 ou DEAE-dextrano. Tal como descrito supra, as culturas celulares podem ser incubadas e o meio substituído com meio de cultura (sozinho) ou meio contendo um marcador radioactivo, tal como 35S-metionina. Após determinar a presença do polipéptido 152
ΕΡ 1 607 402 /PT PR05775, ο meio de cultura pode ser substituído com meio isento de soro. De preferência, as culturas são incubadas durante cerca de 6 dias e seguidamente recolhe-se o meio condicionado. O meio contendo o PR05775 expresso pode então ser concentrado e purificado por qualquer método seleccionado.
Pode também expressar-se PR05775 marcado com epítopo em células hospedeiras CHO. O PR05775 pode ser subclonado do vector pRK5. A inserção de subclone pode ser sujeita a PCR para fundir em quadro com um marcador epitópico seleccionado, tal como um marcador poli-His, para um vector de expressão de baculovírus. A inserção PR05775 marcada com poli-His pode então ser subclonada para um vector dirigido por SV40 contendo um marcador de selecção, tal como DHFR para selecção de clones estáveis. Finalmente, as células CHO podem ser transfectadas (tal como descrito supra) com o vector dirigido por SV40. A marcação pode ser efectuada, tal como descrito supra, para verificar expressão. O meio de cultura contendo o PR05775 marcado com poli-His expresso pode então ser concentrado e purificado por qualquer método seleccionado, tal como por cromatograf ia de afinidade de Ni2+-quelato. A expressão em células CHO e/ou COS pode também ser conseguida por um procedimento de expressão transitória.
As proteínas podem ser expressas em células CHO através de um procedimento de expressão estável ou por um procedimento transitório. A expressão estável em células CHO é efectuada utilizando o seguinte procedimento. As proteínas são expressas numa construção igG (imunoadesina), nas quais as sequências de codificação para as formas solúveis (por exemplo, domínios extracelulares) das proteínas respectivas são fundidas a uma região constante de igGl contendo os domínios de charneira, CH2 e CH2 e/ou numa forma marcada com poli-His.
Após amplificação por PCR, os ADN respectivos são subclonados para um vector de expressão CHO utilizando técnicas padrão, tal como descrito em Ausubel et al., Current Protocols of Molecular Biology, Unidade 3.16, John Wiley and Sons (1997) . Os vectores de expressão CHO são construídos de modo a terem locais de restrição 5' e 3' compatíveis com o ADN de interesse, para permitir a manipulação adequada de ADNc. O vector utilizado para expressão em células CHO é tal como 153 ΕΡ 1 607 402 /PT descrito em Lucas et al., Nucl. Acids Res., 24:9 (1774-1779 (1996) e utiliza o promotor/potenciador precoce de SV40 para dirigir a expressão do ADNc de interesse e di-hidrofolato redutase (dhfr). A expressão de DHFR permite a selecção para manutenção estável do plasmideo após transfecção.
Introduz-se doze miligramas do ADN de plasmideo pretendido em aproximadamente 10 milhões de células CHO utilizando reagentes de transfecção Superfect® (Qiagen), Dosper® ou Fugene® (Boehringer Mannheim) comercialmente disponíveis. Cultivam-se as células tal como descrito em Lucas et al., supra. Congelam-se aproximadamente 3 x 107 numa ampola para cultura adicional e produção, tal como descrito infra.
Descongelam-se as ampolas contendo o ADN de plasmideo colocando-as num banho de água e mistura-se por vórtex. Pipeta-se o conteúdo para um tubo de centrífuga contendo 10 ml de meio e centrifuga-se a 1000 rpm durante 5 minutos. Aspira-se o sobrenadante e ressuspendem-se as células em 10 ml de meio selectivo (filtrado por PS20 de 0,2 pm com soro bovino fetal diafiltrado por 0,2 pm a 5%). As células são então divididas em alíquotas para um balão de rotação de 100 ml contendo 90 ml de meio selectivo. Após 1-2 dias, transferem-se as células para um balão de rotação de 250 ml contendo 150 ml de meio de cultura selectivo e incuba-se a 37°C. Após mais 2-3 dias, inoculam-se balões de rotação de 250 ml, 500 ml e 2000 ml com 3 x 105 células/ml. O meio celular é permutado com meio fresco por centrifugação e ressuspensão em meio de produção. Embora possa ser utilizado qualquer meio CHO adequado, utiliza-se de facto um meio de produção descrito em Patente US N.° 5 122 469, emitida a 16 de Junho de 1992. Inocula-se um balão de rotação de produção de 3 L a 1,2 x 106 células/ml. No dia 0, determina-se o número de células e pH. No dia 1, amostra-se o balão de rotação e inicia-se a aspersão com ar filtrado. No dia 2, amostra-se o balão de rotação, muda-se a temperatura para 33°C e adiciona-se 30 ml de glucose a 500 g/L e 0,6 ml de anti-espuma a 10% (por exemplo, emulsão de polidimetilsiloxano a 35%, Dow Corning 365 emulsão de grau médico). Ao longo da produção, ajusta-se o pH como necessário para mantê-lo a cerca de 7,2. Após 10 dias, ou até a viabilidade atingir um valor inferior a 70%, recolhe-se o meio de cultura por centrifugação e 154
ΕΡ 1 607 402 /PT filtra-se através de um filtro de 0,22 μπι. 0 filtrado é armazenado a 4°C ou carregado imediatamente em colunas para purificação.
Para as construções marcadas com poli-His, as proteínas são purificadas utilizando uma coluna Ni2+-NTA (Qiagen). Antes de purificação, adiciona-se imidazole ao meio condicionado a uma concentração de 5 mM. Bombeia-se o meio condicionado para uma coluna de Ni2+-NTA de 6 ml equilibrada em tampão Hepes 20 mM, pH 7,4, contendo NaCl 0,3 M e imidazole 5 mM, a um caudal de 4-5 ml/min. a 4°C. Após carga, lava-se a coluna com tampão de equilíbrio adicional e elui-se a proteína com tampão de equilíbrio contendo imidazole 0,25 Μ. A proteína altamente purificada é subsequentemente dessalinizada para um tampão de armazenagem contendo Hepes 10 mM, NaCl 0,14 Me manitol a 4%, pH 6,8, com uma coluna de 25 ml de G25 Superfina (Pharmacia) e armazenada a -80°C.
As construções de imunoadesina (contendo Fc) são purificadas do meio condicionado da seguinte forma. Bombeia-se 0 meio condicionado para 5 ml de coluna de Proteína A (Pharmacia) que foi equilibrada em tampão Na fosfato 20 mM, pH 6,8. Após carga, lava-se a coluna extensivamente com tampão de equilíbrio antes de eluir com ácido cítrico 100 mM, pH 3,5. Neutraliza-se a proteína eluída imediatamente por recolha de fracções de 1 ml para tubos contendo 275 μΐ de tampão Tris 1 M, pH 9. A proteína altamente purificada é subsequentemente dessalinizada para tampão de armazenamento tal como descrito supra para as proteínas marcadas com poli-His. Avalia-se a homogeneidade em géis de SDS-poliacrilamida e por sequenciação dos aminoácidos N-terminais por degradação de Edman. EXEMPLO 9
Expressão de PR05775 em levedura 0 seguinte método descreve expressão recombinante de PR05775 em levedura.
Primeiramente, constroem-se vectores de expressão de levedura para produção intracelular ou excreção de PR05775 a partir do promotor ADH2/GAPDH. O ADN que codifica PR05775 e o 155
ΕΡ 1 607 402 /PT promotor são inseridos em locais de enzima de restrição adequados para dirigir a expressão intracelular de PR05775. Para excreção, pode clonar-se ADN que codifica PR05775 para o plasmideo seleccionado, conjuntamente com ADN que codifica o promotor ADH2/GAPDH, um Péptido de sinal PR05775 nativo ou outro Péptido de sinal de mamífero ou, por exemplo, uma sequência de sinal/comando de factor alfa de levedura ou de excreção de invertase e sequências ligantes (caso necessário) para expressão de PR05775.
As células de levedura, tal como levedura estirpe AB110, podem ser então transformadas com os plasmideos de expressão descritos supra e cultivadas em meio de fermentação seleccionado. Os sobrenadantes de levedura transformados podem ser analisados por precipitação com ácido tricloroacético a 10% e separação por SDS-PAGE, seguido de coloração dos géis com corante azul de Coomassie.
0 PR05775 recombinante pode subsequentemente ser isolado e purificado por remoção de células de levedura a partir do meio de fermentação por centrifugação e seguidamente concentrando o meio utilizando filtros de cartucho seleccionados. O concentrado contendo PR05775 pode ser purificado adicionalmente utilizando resinas de cromatografia em coluna seleccionadas. EXEMPLO 10
Expressão de PRQ5775 em células de insecto infectadas com baculovírus O seguinte método descreve expressão recombinante em células de insecto infectadas com baculovírus. A sequência de codificação para PR05775 é fundida a montante de um marcador epitópico contido dentro de um vector de expressão de baculovírus. Tais marcadores de epítopo incluem marcadores poli-His e marcadores de imunoglobulina (tal como regiões Fc de IgG). Podem ser utilizados vários plasmideos, incluindo plasmideos derivados de plasmideos disponíveis comercialmente, tal como pVL1393 (Novagen). Sucintamente, a sequência de codificação PR05775 ou a parte pretendida da sequência de codificação de PR05775 [tal como a sequência que codifica o domínio extracelular de uma proteína 156
ΕΡ 1 607 402 /PT transmembranar ou a sequência que codifica a proteína madura caso o proteína seja extracelular] é amplificada por PCR com iniciadores complementares a regiões 5' e 3'. O iniciador 5' pode incorporar locais de enzima de restrição flanqueadores (seleccionados). O produto é então digerido com essas enzimas de restrição seleccionadas e subclonado para o vector de expressão.
Gera-se o baculovírus recombinante por co-transfecção do plasmídeo supra e ADN de vírus BaculoGold™ (Pharmingen) para células Spodoptera frugiperda ("Sf9") (ATCC CRL 1711) utilizando Lipofectine (disponível comercialmente de GIBCO-BRL). Após 4-5 dias de incubação a 28°C, recolhem-se os vírus libertados e utilizam-se para amplificações adicionais. A infecção virai e expressão de proteína são efectuadas tal como descrito por 0'Reilley et al., Baculovírus expression vectors: A Laboratory Manual, Oxford: Oxford University Press (1994) . O PR05775 marcado com poli-His expresso pode então ser purificado, por exemplo, por cromatografia de afinidade de Ni2+-quelato, tal como se segue. Preparam-se os extractos a partir de células Sf9 infectadas com vírus recombinantes, tal como descrito por Rupert et al., Nature, 362:175-179 (1993). Sucintamente, lavam-se as células Sf9, ressuspendem-se em tampão de ultra-sons (25 ml de Hepes, pH 7,9; MgCl2 12,5 mM; EDTA 0,1 mM; glicerol a 10%; NP-40 a 0,1%; KC1 0,4 M) e trataram-se duas vezes com ultra-sons durante 20 segundos em gelo. Clarificam-se os resultantes por centrifugação e dilui-se o sobrenadante 50 vezes em tampão de carga (fosfato 50 mM, NaCl 300 mM, glicerol a 10%, pH 7,8) e filtra-se através de um filtro de 0,45 pm. Prepara-se uma coluna de Ni2+-NTA agarose (disponível comercialmente de Qiagen) com um volume de leito de 5 ml, lava-se com 25 ml de água e equilibra-se com 25 ml de tampão de carga. Carrega-se o extracto celular filtrado para a coluna a 0,5 ml por minuto. Lava-se a coluna até A2so igual ao da linha de base com tampão de carga, ponto no qual se inicia a recolha de fracções. Seguidamente, lava-se a coluna com um tampão de lavagem secundário (fosfato 50 mM; NaCl 300 mM, glicerol a 10%, pH 6,0), que elui proteína ligada não especificamente. Após atingir novamente um A2so idêntico ao da linha de base, desenvolve-se a coluna com um gradiente de imidazole de 0 a 500 mM no tampão de lavagem secundário. Recolhem-se fracções 157
ΕΡ 1 607 402 /PT de um ml e analisam-se por SDS-PAGE e coloração com prata ou hibridação de Western com Ni2+-NTA conjugado a fosfatase alcalina (Qiagen). Agrupam-se as fracções contendo PR05775 marcado com HislO eluídas, respectivamente, e dialisadas contra tampão de carga.
Alternativamente, a purificação do PR05775 marcado com IgG (ou marcado com Fc) pode ser efectuada utilizando técnicas de cromatografia conhecidas, incluindo por exemplo, cromatografia em coluna de Proteína A ou proteína G.
Embora a expressão seja de facto efectuada numa escala de 0,5-2 L, pode ser facilmente efectuada em preparações em maior escala (por exemplo, 8 L). As proteínas são expressas como uma construção IgG (imunoadesina), na qual a região extracelular da proteína está fundida a uma sequência de região constante de IgGl contendo os domínios de charneira, CH2 e CH3 e/ou em formas marcadas com poli-His.
Após amplificação por PCR, as sequências de codificação respectivas são subclonadas para um vector de expressão de baculovírus (pb.PH.IgG para fusões IgG e pb.PH.His.c para proteínas marcadas com poli-His) e co-transfectam-se o vector e ADN de baculovírus Baculogold® (Pharmingen) para células 105 de Spodoptera frugiperda ("Sf9") (ATCC CRL 1711), utilizando Lipofectine (Gibco BRL). pb.PH.IgG e pb.PH.His são modificações do vector de expressão de baculovírus pVL1393 disponível comercialmente (Pharmingen), com regiões de poliligante modificadas de modo a incluir sequências de marcador His ou Fc. Cultivam-se as células em meio TNM-FH de Hink suplementado com FBS a 10% (Hyclone). Incubam-se as células durante 5 dias a 28°C. Recolhe-se o sobrenadante e utiliza-se subsequentemente para a primeira amplificação virai, infectando células Sf9 em meio TNM-FH de Hink suplementado com FBS a 10% a uma multiplicidade de infecção (MOI) de aproximadamente 10. Incubam-se as células durante 3 dias a 28°C. Recolhe-se o sobrenadante e determina-se a expressão de construções no vector de expressão de baculovírus por ligação em lote de 1 ml de sobrenadante a 25 ml de pérolas de Ni2+-NTA (QIAGEN) para proteínas marcadas com histidina ou pérolas Proteína A-Sepharose CL-4B (Pharmacia) para proteínas marcadas com IgG, seguido por análise por SDS-PAGE, por 158
ΕΡ 1 607 402 /PT comparação com um padrão de proteína de concentração conhecida por coloração com azul de Coomassie. O sobrenadante da primeira amplificação virai é utilizado para infectar uma cultura em frasco de rotação (500 ml) de células Sf9 cultivadas em meio ESF-921 (Expression Systems LLC) a uma MOI de aproximadamente 0,1. Incubam-se as células durante 3 dias a 28°C. Recolhe-se o sobrenadante e filtra-se. Repete-se a ligação em lote e a análise por SDS-PAGE, como necessário, até se confirmar expressão da cultura em frasco de rotação.
Recolhe-se o meio condicionado das células transfectadas (0,5 a 3 L) por centrifugação para remover as células e filtra-se através de filtros de 0,22 micra. Para as construções marcadas com poli-His, purifica-se a construção de proteína utilizando uma coluna de Ni2+-NTA (Qiagen). Antes de purificação, adiciona-se imidazole ao meio condicionado até uma concentração de 5 mM. Bombeia-se o meio condicionado para uma coluna de Ni2+-NTA de 6 ml equilibrada em tampão Hepes 20 mM, pH 7,4, contendo NaCl 0,3 M e imidazole 5 mM a um caudal de 4-5 ml/min. a 4°C. Após carga, lava-se a coluna com tampão de equilíbrio adicional e elui-se a proteína com tampão de equilíbrio contendo imidazole 0,25 Μ. A proteína altamente purificada é subsequentemente dessalinizada para um tampão de armazenagem contendo Hepes 10 mM, NaCl 0,14 Me manitol a 4%, pH 6,8, com uma coluna G25 Superfina (Pharmacia) de 25 ml e armazenada a -80°C.
As construções de proteínas de imunoadesina (contendo Fc) são purificadas do meio condicionado da seguinte forma. Bombeia-se o meio condicionado para uma coluna de Proteína A (Pharmacia) de 5 ml que foi equilibrada em tampão Na fosfato 20 mM, pH 6,8. Após carga, lava-se a coluna extensamente com tampão de equilíbrio antes de eluição com ácido cítrico 100 mM, pH 3,5. A proteína eluída é neutralizada imediatamente por recolha de fracções de 1 ml para tubos contendo 275 ml de tampão Tris 1 M, pH 9. A proteína altamente purificada é subsequentemente dessalinizada para tampão de armazenagem, tal como descrito supra para as proteínas marcadas com poli-His. Verifica-se a homogeneidade das proteínas por electroforese em gel de SDS poliacrilamida (PEG) e sequenciação de aminoácidos do terminal N por degradação de Edman. 159
ΕΡ 1 607 402 /PT
Alternativamente, pode ser utilizado um procedimento de baculovírus modificado, incorporando células high 5. Neste procedimento, amplifica-se o ADN que codifica a sequência pretendida com sistemas adequados, tal como Pfu (Stratagene), ou fundida a montante (a 5' de) de um marcador epitópico contido num vector de expressão de baculovírus. Tais marcadores de epítopo incluem marcadores poli-His e marcadores de imunoglobulina (tal como regiões Fc de IgG). Podem ser utilizados vários plasmídeos, incluindo plasmídeos derivados de plasmídeos disponíveis comercialmente, tal como plEl-1 (Novagen). Os vectores pIEl-1 e pIEl-2 são concebidos para expressão constitutiva de proteínas recombinantes do promotor iel de baculovírus em células de insecto transformadas estavelmente. Os plasmídeos diferem apenas na orientação dos locais de clonagem múltipla e contêm todas as sequências de promotor que se sabe serem importantes para expressão de gene mediada por iel em células de insecto não infectadas, bem como o elemento potenciador hr5. pIEl-1 e pIEl-2 incluem o local de iniciação de tradução e podem ser utilizados para produzir proteínas de fusão. Sucintamente, a sequência pretendida ou a parte da sequência pretendida (tal como a sequência que codifica o domínio extracelular de uma proteína transmembranar) é amplificada por PCR com iniciadores complementares às regiões 5' e 3'. O iniciador 5' pode incorporar locais de enzima de restrição flanqueadores (seleccionados) . O produto é então digerido com estas enzimas de restrição seleccionadas e subclonado para o vector de expressão. Por exemplo, os derivados de pIEl-1 podem incluir a região Fc de IgG humana (pb.PH.lgG) ou um marcador a jusante (a 3' de) de 8 histidinas (pb.PH.His) da sequência pretendida. De preferência, a construção de vector é sequenciada para confirmação.
Cultivam-se células high 5 até uma confluência de 50% nas condições 27°C, sem CO2, sem penicilina/estreptamicina. Para cada placa de 150 mm, mistura-se 30 pg de vector baseado em plE contendo a sequência com 1 ml de meio Ex-Cell (Meio: Ex-Cell 401 + 1/100 L-Glu JRH Biosciences N.° 14401-78P (nota: este meio é sensível à luz)) e num tubo separado, mistura-se 100 μΐ de CellFectin (CellFECTIN (GibcoBRL N.° 10362-010) (sujeito a vórtex para misturar)) com 1 ml de meio Ex-Cell. Combinam-se as duas soluções e deixa-se incubar à temperatura ambiente durante 15 minutos. Adiciona-se 8 ml de meio Ex-Cell 160
ΕΡ 1 607 402 /PT a 2 ml de mistura de ADN/CellFECTlN e despeja-se em células high 5 que foram lavadas uma vez com meio Ex-Cell. A placa é então incubada às escuras durante 1 hora à temperatura ambiente. Seguidamente, aspira-se a mistura ADN/CellFECTlN e lavam-se as células uma vez com Ex-Cell para remover o excesso de CellFECTlN, adiciona-se 30 ml de meio Ex-Cell fresco e incubam-se as células durante 3 dias a 28°C. Recolhe-se o sobrenadante e determina-se a expressão da sequência no vector de expressão de baculovirus por ligação em lote de 1 ml de sobrenadante a 25 ml de pérolas de Ni2+-NTA (QIAGEN) para proteínas marcadas com histidina ou pérolas de Proteina A-Sepharose CL-4B (Pharmacia) para proteínas marcadas com igG, seguido por análise por SDS-PAGE comparando com padrão de proteína de concentração conhecida por coloração com azul de Coomassie.
Recolhe-se o meio condicionado das células transfectadas (0,5 a 3 L) por centrifugação para remover células e filtra-se através de filtros de 0,22 micra. Para as construções marcadas com poli-His, a proteína incluindo a sequência é purificada utilizando uma coluna de Ni2+-NTA (Qiagen) . Antes de purificação, adiciona-se imidazole ao meio condicionado até uma concentração de 5 mM. Bombeia-se o meio condicionado para uma coluna de Ni2+-NTA de 6 ml equilibrada em tampão Hepes 20 mM, pH 7,4, contendo NaCl 0,3 M e imidazole 5 mM, a um caudal de 4-5 ml/min. a 48°C. Após carga, lava-se a coluna com tampão de equilíbrio adicional e elui-se a proteína com tampão de equilíbrio contendo imidazole 0,25 Μ. A proteína altamente purificada é subsequentemente dessalinizada para tampão de armazenagem contendo Hepes 10 mM, NaCl 0,14 Me manitol a 4%, pH 6,8, com uma coluna G25 Superfina (Pharmacia) de 25 ml e armazena-se a -80°C.
As construções de proteínas de imunoadesinas (contendo Fc) são purificadas a partir de meio condicionado, da seguinte forma. Bombeia-se o meio condicionado para uma coluna de Proteína A (Pharmacia) de 5 ml que tinha sido equilibrada em Na fosfato 20 mM, pH 6,8. Após carga, lava-se a coluna extensamente com tampão de equilíbrio antes de eluir com ácido cítrico 100 mM, pH 3,5. A proteína eluída é neutralizada imediatamente por recolha de fracções de 1 ml para tubos contendo 275 ml de tampão Tris 1 M, pH 9. A proteína altamente purificada é subsequentemente dessalinizada para tampão de 161
ΕΡ 1 607 402 /PT armazenagem, tal como descrito supra para as proteínas marcadas com poli-His. A homogeneidade da sequência é avaliada por géis de SDS poliacrilamida e sequenciação dos aminoácidos N-terminais por degradação de Edman e outros procedimentos analíticos, tal como pretendido ou necessário. EXEMPLOS 11
Preparação de anticorpos que ligam PR05775
Este exemplo ilustra a preparação de anticorpos monoclonais que podem ligar PR05775 especificamente. São conhecidas na especialidade técnicas para a produção de anticorpos monoclonais e são descritas, por exemplo, em Goding, supra. Constituem imunogénios que podem ser utilizados, entre outros, proteínas de fusão PR05775 purificadas contendo PR05775 e células que expressam PR05775 recombinante na superfície celular. A selecção do imunogénio pode ser feita pelo perito na especialidade sem experiências desnecessárias.
Imunizam-se ratinhos, tal como Balb/c, com o imunogénio PR05775 emulsionado em adjuvante completo de Freund e injecta-se subcutânea ou intraperitonealmente numa quantidade de 1-100 microgramas. Alternativamente, emulsiona-se o imunogénio em adjuvante MPL-TDM (Ribi Immunochemical Research, Hamilton, Montana) e injecta-se nas almofadas da pata posterior do animal. Os ratinhos imunizados são então reforçados 10 a 12 dias mais tarde com imunogénio adicional emulsionado no adjuvante seleccionado. Seguidamente, durante várias semanas, os ratinhos podem também ser reforçados com injecções de imunização adicionais. Podem obter-se amostras de soro dos ratinhos periodicamente por sangramento retro-orbital para ensaiar em ensaios ELISA para detectar anti-PR05775.
Após se detectar um título de anticorpo adequado, os animais "positivos" para anticorpos podem ser injectados com uma injecção intravenosa final de PR05775. Três a quatro dias mais tarde, sacrificam-se os ratinhos e recolhem-se as células de baço. As células de baço são então fundidas (utilizando polietilenoglicol a 35%) com uma linha celular de mieloma murino seleccionada tal como P3X63AgU.l, disponível de ATCC, 162
ΕΡ 1 607 402 /PT Ν.° CRL 1597. As fusões geram células de hibridoma que podem ser então plaqueadas em placas de cultura de tecidos de 96 poços contendo meio HAT (hipoxantina, aminopterina e timidina) para inibir a proliferação de células não fundidas, híbridos de mieloma e híbridos de células de baço.
As células de hibridoma serão rastreadas num ELISA para reactividade contra PR05775. A determinação de células de hibridoma "positivas" que excretam os anticorpos monoclonais contra PR05775 pretendidos está dentro da perícia na especialidade.
As células de hibridoma positivas podem ser injectadas intraperitonealmente para ratinhos Balb/c singenésicos que produzem ascites contendo os anticorpos monoclonais anti-PR05775. Alternativamente, as células de hibridoma podem ser cultivadas em balões de cultura de tecidos ou frascos de rotação. A purificação dos anticorpos monoclonais produzidos nas ascites pode ser efectuada utilizando precipitação com sulfato de amónio, seguido por cromatografia de exclusão em gel. Alternativamente, pode utilizar-se cromatografia de afinidade com base na ligação de anticorpo a proteína A ou proteína G.
Depósito de material:
Os seguintes materiais foram depositados em American Type Culture Collection, 10801 University Blvd., Manassas, Virgínia 20110-2209, EUA (ATCC):
Material N.° de depósito Data de depósito
ATCC DNA96869-2673 PTA-255 22 de Junho de 1999
Estes depósitos foram efectuados segundo os termos do "Tratado de Budapeste sobre o Reconhecimento Internacional do Depósito de Microorganismos para Efeitos do Procedimento em Matéria de Patentes" e seus Regulamentos (Tratado de
Budapeste). Tal assegura a manutenção de uma cultura viável do depósito durante 30 anos a partir da data de depósito. O depósito será disponibilizado pela ATCC segundo os termos do Tratado de Budapeste e sujeito a um acordo entre a Genentech, 163
ΕΡ 1 607 402 /PT
Inc. e a ATCC, que assegura a disponibilidade permanente e não restrita da progénie da cultura do depósito ao público após concessão da patente norte-americana pertinente ou após disponíveis ao público quaisquer pedidos de patente norte-americana ou estrangeira, o que ocorrer primeiro, e assegura a disponibilidade da progénie a quem determinado pelo U.S. Commissioner of Patents and Trademarks com esse direito de acordo com 35 U.S.C. §122 e as regras do Commissioner daí decorrentes (incluindo 37 C.f.r. §1.14 com particular referência a 886 OG 638). O cessionário do presente pedido de patente concordou que, caso uma cultura dos materiais depositados morra ou se perca ou seja destruída quando cultivada em condições adequadas, os materiais serão prontamente substituídos após notificação, por outros equivalentes. A disponibilidade do material depositado não deve ser entendida como uma permissão para a prática do invento em contravenção dos direitos concedidos pela autoridade de qualquer governo de acordo com as suas leis relativas a patentes. O fascículo aqui escrito é considerada suficiente para permitir que um perito na especialidade ponha em prática o invento. O presente invento não está limitado no seu âmbito pela construção depositada, dado que a concretização depositada se destina unicamente a ilustração de determinados aspectos do invento e quaisquer construções que sejam equivalentes funcionalmente encontram-se no âmbito deste invento. O depósito de material aqui não constitui uma admissão de que a descrição escrita aqui contida é inadequada para permitir a prática de qualquer aspecto do invento, incluindo o seu melhor modo, nem deve ser interpretada como limitante do âmbito das reivindicações às ilustrações específicas que representa.
Listagem de Sequências <110> Genentech, Inc. <120> COMPOSIÇÕES E MÉTODOS PARA O TRATAMENTO DE TUMORES <130> CMD/FP6297329
ΕΡ 1 607 402 /PT 164 < 14 0 > < 141 > ΕΡ 05018356.5 2000-02-11 < 15 0 > < 151 > PCT/US00/03565 2000-02-11 < 15 0 > < 151 > PCT/US99/05028 1999-03-08 < 15 0 > < 151 > US 60/123,972 1999-03-11 < 15 0 > < 151 > US 60/133,459 1999-05-11 < 15 0 > < 151 > PCT/US99/12252 1999-06-02 < 15 0 > < 151 > US 60/140,650 1999-06-22 < 15 0 > < 151 > US 60/140,653 1999-06-22 < 15 0 > < 151 > US 60/144,758 1999-07-20 < 15 0 > < 151 > US 60/145,698 1999-07-26 < 15 0 > < 151 > US 60/146,222 1999-07-28 < 15 0 > < 151 > US 60/149,395 1999-08-17 < 15 0 > < 151 > US 60/151,689 1999-08-31 < 15 0 > < 151 > PCT/US99/20111 1999-09-01 < 15 0 > < 151 > PCT/US99/21090 1999-09-15 < 15 0 > < 151 > PCT/US99/28313 1999/11/30 < 15 0 > < 151 > PCT/US99/28301 1999-12-01 <150> PCT/US99/28634 <151> 1999-12-01 165
ΕΡ 1 607 402 /PT <150> PCT/USOO/00219 <151> 2000-01-05 <160> 5
<210> 1 <211> 1964 <212> ADN <213> Homo sapiens <400> 1 ccagctgcag agaggaggag gtgaçctgca gagaagagga ggttggtgtg 50 gagcacaggc agcaccgagc ctgccccgtg agctgagggc ctgcagtctg 100 cggctggaat caggatagac accaaggcag gacccccaga gatgctgaag 150 cctctttgga aagcagcagt ggcccccaca tggccatgct ccatgccgcc 200 ccgccgcccg tgggacagag aggctggcac gttgcaggtc ctgggagcgc 250 tggctgtgct gtggctgggc tccgtggctc ttatctgcct cctgtggcaa 300 gtgccccgtc ctcccacctg gggccaggtg naor.nnaflnn — -j----- ΆΓ.ηΫ ΠΓΓΓΆΠ --3-3----3 350 gtcctgggag catggctcca gcccagcttg ggagcccctg gaagcagagg 400 ccaggcagca gagggactcc tgccagcttg tccttgtgga aagcatcccc 450 caggacctgc catctgcagc cggcagcccc tctgcccagc ctctgggcca 500 ggcctggctg cagctgctgg acactgccca ggagagcgtc cacgtggctt 550 catactactg gtccctcaca gggcctgaca tcggggtcaa cgactcgtct 600 tcccagctgg gagaggctct tctgcagaag ctgcagcagc tgctgggcag 650 gaacatttcc ctggctgtgg ccaccagcag cccgacactg gccaggacat 700 ccaccgacct gcaggttctç gctgcccgag gtgcccatgt acgacaggtg 7 50 cccatggggc ggctcaccag gggtgttttg cactccaaat tctgggttgt 800 ggatggacgg cacatataca tgggcagtgc caacatggac tggcggtctc 850 tgacgcaggt gaaggagctt ggcgctgtca tctataactg cagccacctg 900 gcccaagacc tggagaagac cttccagacc tactgggtac tgggggtgcc 950 caaggctgtc ctccccaaaa cctggcctca gaacttctca tctcacttca 1000 accgtttcca gcccttccac ggcctctttg atggggtgcc caccactgcc 1050 tacttctcag cgtcgccacc agcactctgt ccccagggcc gcacccggga 1100 cctggaggcg ctgctggcgg tgatggggag cgcccaggag ttcatctatg 1150 cctccgtgat ggagtatttc cccaccacgc gcttcagcca ccccccgagg 1200 tactggccgg tgctggacaa cgcgctgcgg gcggcagcct tcggcaaggg 1250 166
ΕΡ 1 607 402 /PT cgtgcgcgtg cgcctgctgg tcggctgcgg actcaacacg gaccccacca 1300 tgttccccta cctgcggtcc ctgcaggcgc tcagcaaccc cgcggccaac 1350 gtctctgtgg acgtgaaagt cttcatcgtg ccggtgggga accattccaa 1400 catcccattc agcagggtga accacagcaa gttcatggtc acggagaagg 1450 cagcctacat aggcacctcc aactggtcgg aggattactt cagcagcacg 1500 gcgggggtgg gcttggtggt cacccagagc cctggcgcgc agcccgcggg 1550 ggccacggtg caggagcagc tgcggcagct ctttgagcgg gactggagtt 1600 cgcgctacgc cgtcggcctg gacggacagg ctccgggcca ggactgcgtt 1650 tggcagggct gaggggggcc tctttttctc tcggcgaccc cgccccgcac 1700 gcgccctccc ctctgacccc ggcctgggct tcagccgctt cctcccgcaa 1750 gcagcccggg tccgcactgc gccaggagcc gcctgcgacc gcccgggcgt 1800 cgcaaaccgc ccgcctgctc tctgatttcc gagtccagcc ccccctgagc 1850 cccacctcct ccagggagcc ctccaggaag ccccttccct gactcctggc 1900 ccacaggcca ggcctaaaaa aaactcgtgg cttcaaaaaa aaaaaaaaaa 1950 aaaaaaaaaa aaaa 1964
<210> 2 <211> 489 <212> PRT <213> Homo sapiens < 4 0 0 > 2
Met Pro Pro Arg Arg Pro Trp Asp Arg Glu Ala Gly Thr Leu Gin 1 5 10 15 w-. 1 vai Leu Gly Ala Leu Ala Vai Leu Trp T . j_)t: u Gly Ser Vai Ala Leu 20 25 30 Ile Cys Leu Leu Trp Gin Vai Pro Arg Pro Pro Thr Trp Gly Gin 35 40 45 Vai Gin Pro Lys Asp Vai Pro Arg Ser Trp Glu His Gly Ser Ser 50 55 60 Pro Ala Trp Glu Pro Leu Glu Ala Glu Ala Arg Gin Gin Arg Asp 65 70 75 Ser Cys Gin Leu Vai Leu Vai Glu Ser Ile Pro Gin Asp Leu Pro 80 85 90 Ser Ala Ala Gly Ser Pro Ser Ala Gin Pro Leu Gly Gin Ala Trp 95 100 105 Leu Gin Leu Leu Asp Thr Ala Gin Glu Ser Vai His Vai Ala Ser 110 115 120 167
ΕΡ 1 607 402 /PT
Tyr Tyr Trp Ser Leu Thr Gly Pro Asp Ile Gly Vai Asn Asp Ser 125 130 135 Ser Ser Gin Leu Gly Glu Ala Leu Leu Gin Lys Leu Gin Gin Leu 140 145 150 Leu Gly Arg Asn Ile Ser Leu Ala Vai Ala Thr Ser Ser Pro Thr 155 160 165 Leu Ala Arg Thr Ser Thr Asp Leu Gin Vai Leu Ala Ala Arg Gly 170 175 180 Ala His Vai Arg Gin Vai Pro Met Gly Arg Leu Thr Arg Gly Vai 185 190 195 Lêu His Ser Lys Phe Trp lí-, 1 YQ1 Vai Asp Gly Arg His lie Tyr Met 200 205 210 Gly Ser Ala Asn Met Asp Trp Arg Ser Leu Thr Gin Vai Lys Glu 215 220 225 Leu Gly Ala Vai Ile Tyr Asn Cys Ser His Leu Ala Gin Asp Leu 230 235 240 Glu. Lys Thr Phe Gin Thr Tyr Trp Vai Leu Gly Vai Pro Lys Ala 245 250 255 Vai Leu Pro Lys Thr Trp Pro Gin Asn Phe Ser Ser His Phe Asn 250 265 270 Arg Phe Gin Pro Phe His Gly Leu Phe Asp Gly Vai Pro Thr Thr 275 280 285 Ala Tyr Phe Ser Ala Ser Pro Pro Ala Leu Cys Pro Gin Gly Arg 290 295 300 Thr Arg Asp Leu Glu Ala Leu Leu Ala Vai Met Gly Ser Ala Gin 305 310 315 Glu Phe Ile Tyr Ala Ser Vai Met Glu Tyr Phe Pro Thr Thr Arg 320 325 330 Phe Ser His Pro Pro Arg Tyr Trp Pro Vai Leu Asp Asn Ala Leu 335 340 345 Arg Ala Ala Ala Phe Gly Lys Gly Vai Arg Vai Arg Leu Leu Val 350 355 360 Gly Cys Gly Leu Asn Thr Asp Pro Thr Met Phe Pro Tyr Leu Arg 365 370 375 Ser Leu Gin Ala Leu Ser Asn Pro Ala Ala Asn Vai Ser Val Asp 380 385 390 Vai Lys Vai Phe Ile Vai Pro Vai Gly Asn His Ser Asn Ile Pro 395 400 405 Phe Ser Arg Vai Asn His Ser Lys Phe Met Vai Thr Glu Lys Ala 410 415 420
Ala Tyr Ile Gly Thr Ser Asn Trp Ser Glu Asp Tyr Phe Ser Ser 168
ΕΡ 1 607 402 /PT 425 430 435
Thr Ala Gly Vai Gly Leu Vai Vai Thr Gin Ser Pro Gly Ala Gin 440 445 450
Pro Ala Gly Ala Thr Vai Gin Glu Gin Leu Arg Gin Leu Phe Glu 455 460 465
Arg Asp Trp Ser Ser Arg Tyr Ala Vai Gly Leu Asp Gly Gin Ala 470 475 480
Pro Gly Gin Asp Cys Vai Trp Gin Gly 485
< 210 > 3 <211> 19 <212> ADN <213> Sequência Artificial < 2 2 0 > <223> Sonda Oligonucleotídica Sintética. < 4 0 0 > 3 ggggaaccat tccaacatc 19
<210> 4 <211> 23 <212> ADN <213> Sequência Artificial <220> <223> Sonda Oligonucleotídica Sintética. < 4 0 0 > 4 ccattcagca gggtgaacca cag 23
< 210 > 5 <211> 20 <212> ADN <213> Sequência Artificial < 2 2 0 > <223> Sonda Oligonucleotídica Sintética. < 4 0 0 > 5 tctccgtgac catgaacttg 20
Lisboa

Claims (25)

  1. ΕΡ 1 607 402 /PT 1/5 REIVINDICAÇÕES 1. Método de diagnóstico de tumores num mamífero, incluindo o referido método a detecção do nível de expressão de um gene que codifica um polipéptido PR05775 (a) numa amostra de teste de células de tecido obtidas do mamífero e (b) numa amostra de controlo de células de tecido normal conhecidas do mesmo tipo celular, em que um nível mais elevado de expressão na amostra de teste, em comparação com a amostra de controlo, é indicativo da presença de tumor no mamífero do qual se obtiveram as células de tecido de teste e em que o referido polipéptido PR05775 é um polipéptido com pelo menos 80% de identidade de sequência de aminoácidos com: (i) a sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), (ii) a sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), sem o péptido de sinal, (iii) o domínio extracelular da sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), com o péptido de sinal, (iv) o domínio extracelular da sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), com o péptido de sinal, ou (v) a sequência de aminoácidos codificada pela sequência de codificação de PR05775 de comprimento completo de DNA96869-2673, depositada na ATCC com o número de acesso PTA-255, em que a referida identidade de sequência de aminoácidos é determinada utilizando o programa de computador ALIGN-2.
  2. 2. Método de acordo com a reivindicação 1, em que o nível de identidade é de pelo menos 90%.
  3. 3. Método de acordo com a reivindicação 2, em que o nível de identidade é de pelo menos 95%.
  4. 4. Método de acordo com a reivindicação 3, em que o referido polipéptido PR05775 é um polipéptido com: (i) a sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), ΕΡ 1 607 402 /PT 2/5 (ii) a sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), sem o péptido de sinal, (iii) o dominio extracelular da sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), com o péptido de sinal, (iv) o dominio extracelular da sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), sem o péptido de sinal, ou (v) a sequência de aminoácidos codificada pela sequência de codificação de PR05775 de comprimento completo de DNA96869-2673, depositada na ATCC com o número de acesso PTA-255.
  5. 5. Método de acordo com qualquer das reivindicações anteriores, em que o péptido de sinal consiste nos aminoácidos 1 a 29±5 da figura 2 (SEQ ID NO:2).
  6. 6. Método de acordo com qualquer das reivindicações anteriores, em que o dominio extracelular com o péptido de sinal consiste nos aminoácidos 1 a 380±5 da figura 2 (SEQ ID NO:2) ou o domínio extracelular sem o péptido de sinal consiste nos aminoácidos 30±5 a 380±5 da figura 2 (SEQ ID NO:2).
  7. 7. Método de diagnóstico de tumores num mamífero, em que o referido método inclui (a) pôr em contacto um anticorpo com uma amostra de teste de células de tecido obtidas do mamífero e (b) detectar a formação de um complexo entre o referido anticorpo e um polipéptido PR05775, tal como definido em qualquer uma das reivindicações 1 a 6, na amostra de teste, em que a formação de um complexo é indicativa da presença de um tumor no referido mamífero, e em que o anticorpo é capaz de se ligar especificamente a um polipéptido com: (i) a sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), (ii) a sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), sem o péptido de sinal, (iii) o domínio extracelular da sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), com o péptido de sinal, ΕΡ 1 607 402 /PT 3/5 (iv) o domínio extracelular da sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), sem o péptido de sinal, ou (v) a sequência de aminoácidos codificada pela sequência de codificação de PR05775 de comprimento completo de DNA96869-2673, depositada na ATCC com o número de acesso PTA-255.
  8. 8. Método de acordo com a reivindicação 7, em que o péptido de sinal consiste nos aminoácidos 1 a 29±5 da figura 2 (SEQ ID NO:2).
  9. 9. Método de acordo com a reivindicação 7 ou a reivindicação 8, em que o domínio extracelular com o péptido de sinal consiste nos aminoácidos 1 a 380±5 da figura 2 (SEQ ID NO:2) ou o domínio extracelular sem o péptido de sinal consiste nos aminoácidos 30±5 a 380±5 da figura 2 (SEQ ID NO:2).
  10. 10. Método de acordo com a reivindicação 7, em que o referido anticorpo é marcado de modo detectável.
  11. 11. Método de acordo com a reivindicação 7, em que a referida amostra de teste de células de tecido é obtida de um indivíduo que se suspeita apresentar crescimento ou proliferação de células neoplásicas.
  12. 12. Kit de diagnóstico do cancro incluindo um anticorpo e um transportador numa embalagem adequada, em que o anticorpo é capaz de se ligar especificamente a um polipéptido com: (i) a sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2) f (ii) a sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2) , sem o péptido de sinal, (iii) o domínio extracelular da sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), com o péptido de sinal, ΕΡ 1 607 402 /PT 4/5 (iv) o domínio extracelular da sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), sem o péptido de sinal, ou (v) a sequência de aminoácidos codificada pela sequência de codificação de PR05775 de comprimento completo de DNA96869-2673, depositada na ATCC com o número de acesso PTA-255.
  13. 13. Kit de acordo com a reivindicação 12, em que o péptido de sinal consiste nos aminoácidos 1 a 29±5 da figura 2 (SEQ ID NO:2).
  14. 14. Kit de acordo com a reivindicação 12 ou a reivindicação 13, em que o domínio extracelular com o péptido de sinal consiste nos aminoácidos 1 a 380±5 da figura 2 (SEQ ID NO:2) ou o domínio extracelular sem o péptido de sinal consiste nos aminoácidos 30±5 a 380±5 da figura 2 (SEQ ID NO:2).
  15. 15. Kit de acordo com qualquer uma das reivindicações 12 a 14, que inclui adicionalmente instruções para a utilização do referido anticorpo para detectar a presença de um polipéptido tal como definido em qualquer uma das reivindicações 1 a 6, numa amostra que se suspeita conter o mesmo.
  16. 16. Anticorpo para utilização em diagnóstico in vivo, em que o anticorpo é capaz de se ligar especificamente a um polipéptido com: (i) a sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), (ii) a sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), sem o péptido de sinal, (iii) o domínio extracelular da sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), com o péptido de sinal, (iv) o domínio extracelular da sequência de aminoácidos apresentada na figura 2 (SEQ ID NO:2), sem o péptido de sinal, ou ΕΡ 1 607 402 /PT 5/5 (v) a sequência de aminoácidos codificada pela sequência de codificação de PR05775 de comprimento completo de DNA96869-2673, depositada na ATCC com o número de acesso PTA-255.
  17. 17. Anticorpo de acordo com a reivindicação 16, em que o péptido de sinal consiste nos aminoácidos 1 a 29±5 da figura 2 (SEQ ID NO:2).
  18. 18. Anticorpo de acordo com a reivindicação 16 ou a reivindicação 17, em que o dominio extracelular com o péptido de sinal consiste nos aminoácidos 1 a 380±5 da figura 2 (SEQ ID NO:2) ou o dominio extracelular sem o péptido de sinal consiste nos aminoácidos 30±5 a 380±5 da figura 2 (SEQ ID NO:2).
  19. 19. Anticorpo de acordo com qualquer uma das reivindicações 16 a 18, em que o diagnóstico é de tumor.
  20. 20. Anticorpo de acordo com a reivindicação 19, em que o diagnóstico é de tumor do pulmão ou do cólon.
  21. 21. Anticorpo de acordo com qualquer uma das reivindicações 16 a 18 que é um anticorpo monoclonal.
  22. 22. Anticorpo de acordo com a reivindicação 21 que inclui uma região determinante de complementaridade (CDR) não humana ou uma região de esqueleto (FR) humana.
  23. 23. Anticorpo de acordo com a reivindicação 21, em que o referido anticorpo é um anticorpo humanizado.
  24. 24. Anticorpo de acordo com qualquer uma das reivindicações 16 a 18 que é um fragmento de anticorpo ou um anticorpo de cadeia simples.
  25. 25. Composição de matéria que inclui um anticorpo tal como definido em qualquer uma das reivindicações 16 a 24 em mistura com um transportador farmaceuticamente aceitável. Lisboa,
PT05018356T 1999-03-08 2000-02-11 Método para o diagnóstico de tumores PT1607402E (pt)

Applications Claiming Priority (17)

Application Number Priority Date Filing Date Title
PCT/US1999/005028 WO1999046281A2 (en) 1998-03-10 1999-03-08 Novel polypeptides and nucleic acids encoding the same
US12397299P 1999-03-11 1999-03-11
US13345999P 1999-05-11 1999-05-11
PCT/US1999/012252 WO1999063088A2 (en) 1998-06-02 1999-06-02 Membrane-bound proteins and nucleic acids encoding the same
US14065399P 1999-06-22 1999-06-22
US14065099P 1999-06-22 1999-06-22
US14475899P 1999-07-20 1999-07-20
US14569899P 1999-07-26 1999-07-26
US14622299P 1999-07-28 1999-07-28
US14939599P 1999-08-17 1999-08-17
US15168999P 1999-08-31 1999-08-31
PCT/US1999/020111 WO2000012708A2 (en) 1998-09-01 1999-09-01 Further pro polypeptides and sequences thereof
PCT/US1999/021090 WO2000015796A2 (en) 1998-09-16 1999-09-15 Secreted and transmembrane polypeptides and nucleic acids encoding the same
PCT/US1999/028313 WO2000032221A2 (en) 1998-12-01 1999-11-30 Promotion or inhibition of angiogenesis and cardiovascularization
PCT/US1999/028301 WO2000032776A2 (en) 1998-12-01 1999-12-01 Secreted amd transmembrane polypeptides and nucleic acids encoding the same
PCT/US1999/028634 WO2000036102A2 (en) 1998-12-16 1999-12-01 Secreted and transmembrane polypeptides and nucleic acids encoding the same
PCT/US2000/000219 WO2000053753A2 (en) 1999-03-08 2000-01-05 Promotion or inhibition of angiogenesis and cardiovascularization

Publications (1)

Publication Number Publication Date
PT1607402E true PT1607402E (pt) 2007-03-30

Family

ID=27578504

Family Applications (5)

Application Number Title Priority Date Filing Date
PT05018356T PT1607402E (pt) 1999-03-08 2000-02-11 Método para o diagnóstico de tumores
PT05018355T PT1623989E (pt) 1999-03-08 2000-02-11 ''composições e métodos para o diagnóstico de tumores''
PT05018357T PT1626058E (pt) 1999-03-08 2000-02-11 Composições e métodos para o diagnóstico de tumores
PT05018358T PT1623990E (pt) 1999-03-08 2000-02-11 Composições e métodos para o tratamento de tumores
PT05018354T PT1632499E (pt) 1999-03-08 2000-02-11 Dispositivo de detecção de impacto para automóveis.

Family Applications After (4)

Application Number Title Priority Date Filing Date
PT05018355T PT1623989E (pt) 1999-03-08 2000-02-11 ''composições e métodos para o diagnóstico de tumores''
PT05018357T PT1626058E (pt) 1999-03-08 2000-02-11 Composições e métodos para o diagnóstico de tumores
PT05018358T PT1623990E (pt) 1999-03-08 2000-02-11 Composições e métodos para o tratamento de tumores
PT05018354T PT1632499E (pt) 1999-03-08 2000-02-11 Dispositivo de detecção de impacto para automóveis.

Country Status (10)

Country Link
EP (7) EP1626084B1 (pt)
JP (6) JP2004520003A (pt)
KR (1) KR100512819B1 (pt)
AT (6) ATE377025T1 (pt)
AU (3) AU2003200731C1 (pt)
CA (5) CA2479498A1 (pt)
DK (5) DK1626058T3 (pt)
ES (6) ES2289630T3 (pt)
PT (5) PT1607402E (pt)
WO (1) WO2001053486A1 (pt)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2577799A (en) 1998-02-09 1999-08-23 Human Genome Sciences, Inc. 45 human secreted proteins
US7160679B1 (en) 1998-05-21 2007-01-09 Diadexus, Inc. Method of diagnosing, monitoring, and staging lung cancer
US6593133B1 (en) * 1998-07-06 2003-07-15 Nsgene A/S Neurotrophic factors
KR100468978B1 (ko) * 1998-12-16 2005-02-02 제넨테크, 인크. 분비 및 막횡단 폴리펩티드, 및 이를 코딩하는 핵산
EP1141027A1 (en) 1999-01-15 2001-10-10 Biogen, Inc. Antagonists of tweak and of tweak receptor and their use to treat immunological disorders
US8410248B2 (en) 1999-03-12 2013-04-02 Human Genome Sciences Inc. HWBAO62 polypeptides
EP1873244A3 (en) * 1999-06-02 2008-04-02 Genentech, Inc. Methods and compositions for inhibiting neoplastic cell growth
US20030119113A1 (en) 1999-07-20 2003-06-26 Genentech, Inc. Secreted and transmembrane polypeptides and nucleic acids encoding the same
AU2001259519C1 (en) 2000-05-08 2005-09-22 Biogen Ma Inc. Method for promoting neovascularization
US7208151B2 (en) 2001-09-12 2007-04-24 Biogen Idec Ma Inc. Tweak receptor agonists as anti-angiogenic agents
AU2002239505A1 (en) * 2000-12-07 2002-06-18 Millennium Pharmaceuticals, Inc. Methods and compositions for the diagnosis and treatment of viral disease using 55092
FR2843395A1 (fr) * 2002-08-12 2004-02-13 Genfit S A Composition et methodes pour le dosage de l'aa4rp
ATE347108T1 (de) * 2001-09-07 2006-12-15 Genfit Zusammensetzungen und verfahren zum bestimmen von aa4rp
US20050123925A1 (en) * 2002-11-15 2005-06-09 Genentech, Inc. Compositions and methods for the diagnosis and treatment of tumor
AU2003227179A1 (en) * 2002-02-08 2003-09-09 Amersham Biosciences K.K. Fused protein having glucuronyl transferase activity
WO2003070936A1 (en) * 2002-02-20 2003-08-28 Yamanouchi Pharmaceutical Co., Ltd. Novel polypeptide
EP1361433A3 (en) * 2002-04-09 2005-02-23 Kabushiki Kaisha Hayashibara Seibutsu Kagaku Kenkyujo Method for estimating therapeutic efficacy of tumor necrosis factor (TNF)
PT1997512E (pt) 2002-04-09 2014-02-20 Biogen Idec Inc Métodos para o tratamento de estados relacionados com tweak
DE60334400D1 (de) * 2002-06-28 2010-11-11 Imclone Llc Neue polynukleotid- und polypeptidsequenzen und deren verwendungen
US7455834B2 (en) 2002-06-29 2008-11-25 Genentech, Inc. Methods and compositions for modulating and detecting WISP activity
JP4636497B2 (ja) * 2002-06-29 2011-02-23 ジェネンテック, インコーポレイテッド Wisp活性を調節し検出するための方法及び組成物
AU2003259704A1 (en) * 2002-08-07 2004-02-25 Curagen Corporation Therapeutic polypeptides, nucleic acids encoding same, and methods of use
US7700574B2 (en) 2003-09-17 2010-04-20 Isis Pharmaceuticals, Inc. Modulation of RANKL expression
RU2380411C2 (ru) 2004-07-20 2010-01-27 Дженентек, Инк. Способ ингибирования пролиферации гепатоцитов, способ ингибирования клеточной адгезии гепатоцитов и способ ингибирования биологической активности angptl4 в гепатоцитах или предшественниках гепатоцитов
US8604185B2 (en) 2004-07-20 2013-12-10 Genentech, Inc. Inhibitors of angiopoietin-like 4 protein, combinations, and their use
CA2577690C (en) 2004-08-19 2013-08-06 Biogen Idec Ma Inc. Refolding transforming growth factor beta family proteins
DK2332408T3 (da) 2005-02-17 2013-12-02 Biogen Idec Inc Behandling af neurologiske sygdomme
WO2006096487A2 (en) * 2005-03-07 2006-09-14 Genentech, Inc. Methods and compositions for modulating tweak and fn14 activity
CA2607697C (en) 2005-05-10 2015-01-06 Biogen Idec Ma Inc. Treating and evaluating inflammatory disorders
WO2006138219A2 (en) 2005-06-13 2006-12-28 Biogen Idec Ma Inc. Methods of diagnosis / prognosis of inflammatory conditions
TWI501774B (zh) 2006-02-27 2015-10-01 Biogen Idec Inc 神經性病症之治療
TWI445544B (zh) 2007-05-01 2014-07-21 Biogen Idec Inc 增進血管形成之組合物及方法
CA2691166A1 (en) * 2007-06-27 2008-12-31 Liu Dongxu Polypeptides and polynucleotides for artemin and related ligands, and methods of use thereof
AU2010290989B2 (en) 2009-09-03 2016-05-19 Cancer Research Technology Limited CLEC14A inhibitors

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994000603A1 (en) * 1992-06-26 1994-01-06 The Trustees Of Princeton University Method for detecting pre-cancerous or cancerous cells using p90 antibodies or probes
US5411860A (en) * 1992-04-07 1995-05-02 The Johns Hopkins University Amplification of human MDM2 gene in human tumors
AU8116494A (en) * 1993-11-12 1995-06-13 Kenichi Matsubara Gene signature
WO1999066041A1 (en) * 1998-06-16 1999-12-23 Human Genome Sciences, Inc. 94 human secreted proteins
EP1000148A2 (en) * 1997-08-01 2000-05-17 Genset 5' ESTs FOR SECRETED PROTEINS EXPRESSED IN PROSTATE
US6030831A (en) * 1997-09-19 2000-02-29 Genetech, Inc. Tie ligand homologues
AU2471899A (en) * 1998-01-30 1999-08-16 Human Genome Sciences, Inc. 67 human secreted proteins
WO1999045135A1 (en) * 1998-03-02 1999-09-10 Millennium Pharmaceuticals, Inc. Novel fdrg protein and nucleic acid molecules and uses therefor
DE19818620A1 (de) * 1998-04-21 1999-10-28 Metagen Gesellschaft Fuer Genomforschung Mbh Menschliche Nukleinsäuresequenzen aus Blase-Normal
JP2002534055A (ja) * 1998-05-14 2002-10-15 カイロン コーポレイション ヒト遺伝子および遺伝子発現産物v
WO1999067382A2 (en) * 1998-06-24 1999-12-29 Compugen Ltd. Angiopoietin-like growth factor sequences
WO2000004135A2 (en) * 1998-07-16 2000-01-27 Incyte Pharmaceuticals, Inc. Human scad-related molecules, scrm-1 and scrm-2
WO2000006728A2 (en) * 1998-07-28 2000-02-10 Incyte Pharmaceuticals, Inc. Phosphorylation effectors
EP1107978A1 (en) * 1998-08-24 2001-06-20 Alphagene, Inc. Secreted proteins and polynucleotides encoding them
WO2001053455A2 (en) * 1999-12-23 2001-07-26 Hyseq, Inc. Novel nucleic acids and polypeptides
AU2373800A (en) * 1998-12-11 2000-06-26 Incyte Pharmaceuticals, Inc. Neuron-associated proteins
JP2004507202A (ja) * 1999-03-31 2004-03-11 キュラジェン コーポレイション ポリペプチドをコードするオープンリーディングフレームを含む核酸;「orfx」
CA2373915A1 (en) * 1999-06-02 2000-12-07 Genentech, Inc. Methods and compositions for inhibiting neoplastic cell growth
EP1230367A4 (en) * 1999-11-12 2003-10-22 Human Genome Sciences Inc 19 HUMANE SECRETIED PROTEINS
WO2001053312A1 (en) * 1999-12-23 2001-07-26 Hyseq, Inc. Novel nucleic acids and polypeptides

Also Published As

Publication number Publication date
CA2479494C (en) 2010-02-02
EP1623990A2 (en) 2006-02-08
CA2479498A1 (en) 2001-07-26
KR20010103045A (ko) 2001-11-17
JP2004201652A (ja) 2004-07-22
JP2004229504A (ja) 2004-08-19
EP1607402B1 (en) 2006-12-13
EP1632499B1 (en) 2007-05-30
ES2321954T3 (es) 2009-06-15
AU2003200731B2 (en) 2006-04-13
DK1623990T3 (da) 2008-04-07
CA2365610A1 (en) 2001-07-26
PT1623989E (pt) 2007-09-25
AU2003200722B2 (en) 2006-02-02
ATE422536T1 (de) 2009-02-15
ATE380195T1 (de) 2007-12-15
EP1623989A1 (en) 2006-02-08
PT1626058E (pt) 2008-02-15
ATE348108T1 (de) 2007-01-15
DK1623989T3 (da) 2007-10-15
CA2479511A1 (en) 2001-07-26
EP1632499A2 (en) 2006-03-08
AU2003200722C1 (en) 2003-05-01
AU2003200731C1 (en) 2008-07-17
AU2003200740B2 (en) 2005-12-15
CA2479476C (en) 2009-11-10
CA2479476A1 (en) 2001-07-26
EP1623990A3 (en) 2006-03-01
KR100512819B1 (ko) 2005-09-07
EP1607402A1 (en) 2005-12-21
EP1632499A3 (en) 2006-03-15
EP1173563A1 (en) 2002-01-23
DK1607402T3 (da) 2007-04-16
EP1626084B1 (en) 2009-02-11
ES2279473T3 (es) 2007-08-16
ES2296029T3 (es) 2008-04-16
AU2003200740C1 (en) 2008-07-17
PT1632499E (pt) 2007-09-11
EP1623989B1 (en) 2007-06-13
EP1623990B1 (en) 2007-12-05
ES2298896T3 (es) 2008-05-16
JP2004520003A (ja) 2004-07-08
ES2289630T3 (es) 2008-02-01
ATE377025T1 (de) 2007-11-15
DK1626058T3 (da) 2008-02-25
ATE364628T1 (de) 2007-07-15
PT1623990E (pt) 2008-03-18
WO2001053486A1 (en) 2001-07-26
EP1626084A1 (en) 2006-02-15
ES2290834T3 (es) 2008-02-16
ATE363489T1 (de) 2007-06-15
EP1632499B9 (en) 2008-02-20
DK1632499T3 (da) 2007-10-01
JP2004201654A (ja) 2004-07-22
CA2479494A1 (en) 2001-07-26
EP1626058A1 (en) 2006-02-15
JP2004201653A (ja) 2004-07-22
JP2004229503A (ja) 2004-08-19
EP1626058B1 (en) 2007-10-31

Similar Documents

Publication Publication Date Title
AU2003200731C1 (en) Compositions and methods for the treatment of tumor
US20070026450A1 (en) Methods for the treatment of carcinoma
US20070141068A1 (en) Methods for the treatment of carcinoma
WO2000053755A2 (en) Compositions and methods for the treatment of tumor
US20050176104A1 (en) Compositions and methods for the treatment of tumor
JP2009039097A (ja) 腫瘍治療のための組成物及び方法
CA2371434A1 (en) Compositions and methods for the treatment of tumor
AU2192800A (en) Compositions and methods for the treatment of tumor
WO2001005836A1 (en) Polypeptidic compositions and methods for the treatment of tumors
AU756400B2 (en) Compositions and methods for the treatment of tumor
CA2478730A1 (en) Compositions and methods for the treatment of tumors
NZ513423A (en) Compositions and methods for the treatment of tumors
ZA200106059B (en) Compositions and methods for the treatment of tumors.