CN101163790A - 在宿主细胞中表达克隆的改进方法 - Google Patents
在宿主细胞中表达克隆的改进方法 Download PDFInfo
- Publication number
- CN101163790A CN101163790A CNA2006800086839A CN200680008683A CN101163790A CN 101163790 A CN101163790 A CN 101163790A CN A2006800086839 A CNA2006800086839 A CN A2006800086839A CN 200680008683 A CN200680008683 A CN 200680008683A CN 101163790 A CN101163790 A CN 101163790A
- Authority
- CN
- China
- Prior art keywords
- dna
- leu
- ser
- seq
- ala
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 92
- 238000001400 expression cloning Methods 0.000 title abstract 4
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 195
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 150
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 93
- 108020004414 DNA Proteins 0.000 claims description 215
- 241000228245 Aspergillus niger Species 0.000 claims description 91
- 230000014509 gene expression Effects 0.000 claims description 60
- 108700008625 Reporter Genes Proteins 0.000 claims description 56
- 241000228212 Aspergillus Species 0.000 claims description 38
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 32
- 238000009396 hybridization Methods 0.000 claims description 31
- 238000012216 screening Methods 0.000 claims description 31
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 29
- 239000003550 marker Substances 0.000 claims description 26
- 239000013604 expression vector Substances 0.000 claims description 22
- 241000233866 Fungi Species 0.000 claims description 20
- 238000002360 preparation method Methods 0.000 claims description 17
- 240000006439 Aspergillus oryzae Species 0.000 claims description 15
- 102000004190 Enzymes Human genes 0.000 claims description 7
- 108090000790 Enzymes Proteins 0.000 claims description 7
- 241000206602 Eukaryota Species 0.000 claims description 7
- 241000223259 Trichoderma Species 0.000 claims description 6
- 235000002247 Aspergillus oryzae Nutrition 0.000 claims description 5
- 241000131386 Aspergillus sojae Species 0.000 claims description 5
- 241000228143 Penicillium Species 0.000 claims description 5
- 238000013467 fragmentation Methods 0.000 claims description 4
- 238000006062 fragmentation reaction Methods 0.000 claims description 4
- 238000006386 neutralization reaction Methods 0.000 claims description 3
- 101150078331 ama-1 gene Proteins 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 7
- 230000001976 improved effect Effects 0.000 abstract description 6
- 238000002955 isolation Methods 0.000 abstract description 3
- 210000004027 cell Anatomy 0.000 description 246
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 224
- 239000002773 nucleotide Substances 0.000 description 68
- 125000003729 nucleotide group Chemical group 0.000 description 68
- 230000028327 secretion Effects 0.000 description 53
- 235000018102 proteins Nutrition 0.000 description 43
- 230000001580 bacterial effect Effects 0.000 description 39
- 235000014469 Bacillus subtilis Nutrition 0.000 description 34
- 239000005090 green fluorescent protein Substances 0.000 description 33
- 238000004458 analytical method Methods 0.000 description 32
- 102220023257 rs387907546 Human genes 0.000 description 32
- 241000282326 Felis catus Species 0.000 description 30
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 30
- 239000013612 plasmid Substances 0.000 description 30
- 230000002538 fungal effect Effects 0.000 description 28
- 230000001105 regulatory effect Effects 0.000 description 28
- 239000000523 sample Substances 0.000 description 27
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 26
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 26
- 230000000694 effects Effects 0.000 description 26
- 108090000765 processed proteins & peptides Proteins 0.000 description 22
- 238000011144 upstream manufacturing Methods 0.000 description 22
- QRBLKGHRWFGINE-UGWAGOLRSA-N 2-[2-[2-[[2-[[4-[[2-[[6-amino-2-[3-amino-1-[(2,3-diamino-3-oxopropyl)amino]-3-oxopropyl]-5-methylpyrimidine-4-carbonyl]amino]-3-[(2r,3s,4s,5s,6s)-3-[(2s,3r,4r,5s)-4-carbamoyl-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-4,5-dihydroxy-6-(hydroxymethyl)- Chemical compound N=1C(C=2SC=C(N=2)C(N)=O)CSC=1CCNC(=O)C(C(C)=O)NC(=O)C(C)C(O)C(C)NC(=O)C(C(O[C@H]1[C@@]([C@@H](O)[C@H](O)[C@H](CO)O1)(C)O[C@H]1[C@@H]([C@](O)([C@@H](O)C(CO)O1)C(N)=O)O)C=1NC=NC=1)NC(=O)C1=NC(C(CC(N)=O)NCC(N)C(N)=O)=NC(N)=C1C QRBLKGHRWFGINE-UGWAGOLRSA-N 0.000 description 21
- 244000063299 Bacillus subtilis Species 0.000 description 21
- LTQCLFMNABRKSH-UHFFFAOYSA-N Phleomycin Natural products N=1C(C=2SC=C(N=2)C(N)=O)CSC=1CCNC(=O)C(C(O)C)NC(=O)C(C)C(O)C(C)NC(=O)C(C(OC1C(C(O)C(O)C(CO)O1)OC1C(C(OC(N)=O)C(O)C(CO)O1)O)C=1NC=NC=1)NC(=O)C1=NC(C(CC(N)=O)NCC(N)C(N)=O)=NC(N)=C1C LTQCLFMNABRKSH-UHFFFAOYSA-N 0.000 description 21
- 108010035235 Phleomycins Proteins 0.000 description 21
- 230000001276 controlling effect Effects 0.000 description 20
- 229920001184 polypeptide Polymers 0.000 description 20
- 102000004196 processed proteins & peptides Human genes 0.000 description 20
- 102220023256 rs387907547 Human genes 0.000 description 20
- 108091005804 Peptidases Proteins 0.000 description 19
- 238000004519 manufacturing process Methods 0.000 description 19
- 102000035195 Peptidases Human genes 0.000 description 18
- 238000010367 cloning Methods 0.000 description 18
- 230000001939 inductive effect Effects 0.000 description 18
- 102220023258 rs387907548 Human genes 0.000 description 18
- 230000008859 change Effects 0.000 description 16
- 108020004999 messenger RNA Proteins 0.000 description 16
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 15
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 15
- 150000007523 nucleic acids Chemical class 0.000 description 15
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 14
- 102100022624 Glucoamylase Human genes 0.000 description 14
- 102220369445 c.668T>C Human genes 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 14
- 239000004382 Amylase Substances 0.000 description 13
- 108010065511 Amylases Proteins 0.000 description 13
- 108091081024 Start codon Proteins 0.000 description 13
- 230000033228 biological regulation Effects 0.000 description 13
- 108020004707 nucleic acids Proteins 0.000 description 13
- 102000039446 nucleic acids Human genes 0.000 description 13
- 241000351920 Aspergillus nidulans Species 0.000 description 12
- 241000894006 Bacteria Species 0.000 description 12
- 102220369447 c.1352G>A Human genes 0.000 description 12
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 12
- 239000002253 acid Substances 0.000 description 11
- 239000002299 complementary DNA Substances 0.000 description 11
- 230000002950 deficient Effects 0.000 description 11
- 239000000047 product Substances 0.000 description 11
- 229940081969 saccharomyces cerevisiae Drugs 0.000 description 11
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 10
- 239000012634 fragment Substances 0.000 description 10
- 230000004927 fusion Effects 0.000 description 10
- 230000010354 integration Effects 0.000 description 10
- 102000013142 Amylases Human genes 0.000 description 9
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 9
- 235000019418 amylase Nutrition 0.000 description 9
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000010276 construction Methods 0.000 description 9
- 239000012530 fluid Substances 0.000 description 9
- 239000008103 glucose Substances 0.000 description 9
- 101150007310 htrA gene Proteins 0.000 description 9
- 239000002609 medium Substances 0.000 description 9
- 108010011619 6-Phytase Proteins 0.000 description 8
- 230000006698 induction Effects 0.000 description 8
- 230000008521 reorganization Effects 0.000 description 8
- 239000006228 supernatant Substances 0.000 description 8
- 238000013519 translation Methods 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 7
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 7
- 239000013611 chromosomal DNA Substances 0.000 description 7
- 239000013599 cloning vector Substances 0.000 description 7
- 238000013016 damping Methods 0.000 description 7
- 230000029087 digestion Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 239000000499 gel Substances 0.000 description 7
- -1 methane amide Chemical class 0.000 description 7
- 244000005700 microbiome Species 0.000 description 7
- 239000002853 nucleic acid probe Substances 0.000 description 7
- 230000010076 replication Effects 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 7
- 229920001817 Agar Polymers 0.000 description 6
- 108050001049 Extracellular proteins Proteins 0.000 description 6
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 6
- 108010048241 acetamidase Proteins 0.000 description 6
- 108090000637 alpha-Amylases Proteins 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 101150018266 degP gene Proteins 0.000 description 6
- 230000008034 disappearance Effects 0.000 description 6
- 229940088598 enzyme Drugs 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 102220004457 rs11567847 Human genes 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 230000001131 transforming effect Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 108091005507 Neutral proteases Proteins 0.000 description 5
- 239000008272 agar Substances 0.000 description 5
- 150000001413 amino acids Chemical group 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- 238000002703 mutagenesis Methods 0.000 description 5
- 231100000350 mutagenesis Toxicity 0.000 description 5
- 230000007935 neutral effect Effects 0.000 description 5
- 229910052757 nitrogen Inorganic materials 0.000 description 5
- 239000001965 potato dextrose agar Substances 0.000 description 5
- 238000003259 recombinant expression Methods 0.000 description 5
- 230000003248 secreting effect Effects 0.000 description 5
- 239000006152 selective media Substances 0.000 description 5
- 239000000725 suspension Substances 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 230000014621 translational initiation Effects 0.000 description 5
- DLFVBJFMPXGRIB-UHFFFAOYSA-N Acetamide Chemical compound CC(N)=O DLFVBJFMPXGRIB-UHFFFAOYSA-N 0.000 description 4
- 108090000145 Bacillolysin Proteins 0.000 description 4
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 4
- 238000000018 DNA microarray Methods 0.000 description 4
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 241000223221 Fusarium oxysporum Species 0.000 description 4
- 101150108358 GLAA gene Proteins 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 241000235648 Pichia Species 0.000 description 4
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 102220369446 c.1274G>A Human genes 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- MURGITYSBWUQTI-UHFFFAOYSA-N fluorescin Chemical compound OC(=O)C1=CC=CC=C1C1C2=CC=C(O)C=C2OC2=CC(O)=CC=C21 MURGITYSBWUQTI-UHFFFAOYSA-N 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 238000001819 mass spectrum Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000002493 microarray Methods 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 230000008488 polyadenylation Effects 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 3
- MEIRRNXMZYDVDW-MQQKCMAXSA-N (2E,4E)-2,4-hexadien-1-ol Chemical compound C\C=C\C=C\CO MEIRRNXMZYDVDW-MQQKCMAXSA-N 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 3
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 3
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 3
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 3
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 3
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 3
- 101100451792 Bacillus subtilis (strain 168) htrB gene Proteins 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 241000223218 Fusarium Species 0.000 description 3
- 241000221779 Fusarium sambucinum Species 0.000 description 3
- 102000035092 Neutral proteases Human genes 0.000 description 3
- 108091058545 Secretory proteins Proteins 0.000 description 3
- 102000040739 Secretory proteins Human genes 0.000 description 3
- 229920002472 Starch Polymers 0.000 description 3
- 229930006000 Sucrose Natural products 0.000 description 3
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 3
- 241000499912 Trichoderma reesei Species 0.000 description 3
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 3
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 3
- 229930003756 Vitamin B7 Natural products 0.000 description 3
- 239000003139 biocide Substances 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000001502 gel electrophoresis Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 101150073906 gpdA gene Proteins 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 238000001906 matrix-assisted laser desorption--ionisation mass spectrometry Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 235000016709 nutrition Nutrition 0.000 description 3
- 230000035764 nutrition Effects 0.000 description 3
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 3
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 101150115781 prtT gene Proteins 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 229960000268 spectinomycin Drugs 0.000 description 3
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 3
- 239000008107 starch Substances 0.000 description 3
- 235000019698 starch Nutrition 0.000 description 3
- QTENRWWVYAAPBI-YCRXJPFRSA-N streptomycin sulfate Chemical compound OS(O)(=O)=O.OS(O)(=O)=O.OS(O)(=O)=O.CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](N=C(N)N)[C@H](O)[C@@H](N=C(N)N)[C@H](O)[C@H]1O.CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](N=C(N)N)[C@H](O)[C@@H](N=C(N)N)[C@H](O)[C@H]1O QTENRWWVYAAPBI-YCRXJPFRSA-N 0.000 description 3
- 239000005720 sucrose Substances 0.000 description 3
- 230000001810 trypsinlike Effects 0.000 description 3
- 238000000108 ultra-filtration Methods 0.000 description 3
- 239000011735 vitamin B7 Substances 0.000 description 3
- 235000011912 vitamin B7 Nutrition 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 101150100890 ydiS gene Proteins 0.000 description 3
- LXJXRIRHZLFYRP-VKHMYHEASA-L (R)-2-Hydroxy-3-(phosphonooxy)-propanal Natural products O=C[C@H](O)COP([O-])([O-])=O LXJXRIRHZLFYRP-VKHMYHEASA-L 0.000 description 2
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- 101100163849 Arabidopsis thaliana ARS1 gene Proteins 0.000 description 2
- 241001370055 Aspergillus niger CBS 513.88 Species 0.000 description 2
- 241000228232 Aspergillus tubingensis Species 0.000 description 2
- 241000194108 Bacillus licheniformis Species 0.000 description 2
- 101710130006 Beta-glucanase Proteins 0.000 description 2
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 2
- AUNGANRZJHBGPY-UHFFFAOYSA-N D-Lyxoflavin Natural products OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-UHFFFAOYSA-N 0.000 description 2
- LXJXRIRHZLFYRP-VKHMYHEASA-N D-glyceraldehyde 3-phosphate Chemical compound O=C[C@H](O)COP(O)(O)=O LXJXRIRHZLFYRP-VKHMYHEASA-N 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical group O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 101150015836 ENO1 gene Proteins 0.000 description 2
- 108700005088 Fungal Genes Proteins 0.000 description 2
- 241000567163 Fusarium cerealis Species 0.000 description 2
- 241000146406 Fusarium heterosporum Species 0.000 description 2
- 101150066002 GFP gene Proteins 0.000 description 2
- 102000048120 Galactokinases Human genes 0.000 description 2
- 108700023157 Galactokinases Proteins 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- 101001041393 Homo sapiens Serine protease HTRA1 Proteins 0.000 description 2
- 108090000604 Hydrolases Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 241000235649 Kluyveromyces Species 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 102100024295 Maltase-glucoamylase Human genes 0.000 description 2
- 229910004616 Na2MoO4.2H2 O Inorganic materials 0.000 description 2
- DFPAKSUCGFBDDF-UHFFFAOYSA-N Nicotinamide Chemical compound NC(=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-UHFFFAOYSA-N 0.000 description 2
- 108090000913 Nitrate Reductases Proteins 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 229930182555 Penicillin Natural products 0.000 description 2
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 2
- 229920001030 Polyethylene Glycol 4000 Polymers 0.000 description 2
- 102000001253 Protein Kinase Human genes 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 241000235403 Rhizomucor miehei Species 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- 241000235072 Saccharomyces bayanus Species 0.000 description 2
- 241001123227 Saccharomyces pastorianus Species 0.000 description 2
- 101100097319 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ala1 gene Proteins 0.000 description 2
- 102100021119 Serine protease HTRA1 Human genes 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 241000235013 Yarrowia Species 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 102000004139 alpha-Amylases Human genes 0.000 description 2
- 108010028144 alpha-Glucosidases Proteins 0.000 description 2
- 229940024171 alpha-amylase Drugs 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 125000004093 cyano group Chemical group *C#N 0.000 description 2
- 230000009849 deactivation Effects 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 229960003276 erythromycin Drugs 0.000 description 2
- 238000010195 expression analysis Methods 0.000 description 2
- 238000000855 fermentation Methods 0.000 description 2
- 230000004151 fermentation Effects 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 101150095733 gpsA gene Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 230000012447 hatching Effects 0.000 description 2
- 229910001385 heavy metal Inorganic materials 0.000 description 2
- IXCSERBJSXMMFS-UHFFFAOYSA-N hydrogen chloride Substances Cl.Cl IXCSERBJSXMMFS-UHFFFAOYSA-N 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 101150011311 lpxL gene Proteins 0.000 description 2
- 238000007898 magnetic cell sorting Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Natural products C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 101150095344 niaD gene Proteins 0.000 description 2
- 229960003966 nicotinamide Drugs 0.000 description 2
- 235000005152 nicotinamide Nutrition 0.000 description 2
- 239000011570 nicotinamide Substances 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 229940049954 penicillin Drugs 0.000 description 2
- 229940085127 phytase Drugs 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 108060006633 protein kinase Proteins 0.000 description 2
- 230000012743 protein tagging Effects 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 101150054232 pyrG gene Proteins 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 229960002477 riboflavin Drugs 0.000 description 2
- 235000019192 riboflavin Nutrition 0.000 description 2
- 239000002151 riboflavin Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 101150016309 trpC gene Proteins 0.000 description 2
- 108700026220 vif Genes Proteins 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 101150044125 ydiR gene Proteins 0.000 description 2
- NWXMGUDVXFXRIG-WESIUVDSSA-N (4s,4as,5as,6s,12ar)-4-(dimethylamino)-1,6,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4,4a,5,5a-tetrahydrotetracene-2-carboxamide Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(=O)C(C(N)=O)=C(O)[C@@]4(O)C(=O)C3=C(O)C2=C1O NWXMGUDVXFXRIG-WESIUVDSSA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- MKPCNMXYTMQZBE-UHFFFAOYSA-N 7h-purin-6-amine;sulfuric acid;dihydrate Chemical compound O.O.OS(O)(=O)=O.NC1=NC=NC2=C1NC=N2.NC1=NC=NC2=C1NC=N2 MKPCNMXYTMQZBE-UHFFFAOYSA-N 0.000 description 1
- 210000002925 A-like Anatomy 0.000 description 1
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 1
- 108010000239 Aequorin Proteins 0.000 description 1
- 241001136782 Alca Species 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 102000004400 Aminopeptidases Human genes 0.000 description 1
- 108090000915 Aminopeptidases Proteins 0.000 description 1
- 241000228215 Aspergillus aculeatus Species 0.000 description 1
- 241001513093 Aspergillus awamori Species 0.000 description 1
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 1
- 241000892910 Aspergillus foetidus Species 0.000 description 1
- 241001480052 Aspergillus japonicus Species 0.000 description 1
- 101100317631 Aspergillus tubingensis xynA gene Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 241000223651 Aureobasidium Species 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 241000304886 Bacilli Species 0.000 description 1
- 241000193375 Bacillus alcalophilus Species 0.000 description 1
- 241000193752 Bacillus circulans Species 0.000 description 1
- 241001328122 Bacillus clausii Species 0.000 description 1
- 241000193747 Bacillus firmus Species 0.000 description 1
- 241000193422 Bacillus lentus Species 0.000 description 1
- 241000194107 Bacillus megaterium Species 0.000 description 1
- 241000194103 Bacillus pumilus Species 0.000 description 1
- 101001078820 Bacillus subtilis (strain 168) Serine protease Do-like HtrA Proteins 0.000 description 1
- 101001078808 Bacillus subtilis (strain 168) Serine protease Do-like HtrB Proteins 0.000 description 1
- 101100113607 Bacillus subtilis (strain 168) citM gene Proteins 0.000 description 1
- 101100081606 Bacillus subtilis (strain 168) odhB gene Proteins 0.000 description 1
- 101100313657 Bacillus subtilis (strain 168) thiL gene Proteins 0.000 description 1
- 241000276408 Bacillus subtilis subsp. subtilis str. 168 Species 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 108091005658 Basic proteases Proteins 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 241000193764 Brevibacillus brevis Species 0.000 description 1
- 101150092493 CREA gene Proteins 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 101000898643 Candida albicans Vacuolar aspartic protease Proteins 0.000 description 1
- 101000898783 Candida tropicalis Candidapepsin Proteins 0.000 description 1
- 108010059892 Cellulase Proteins 0.000 description 1
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- 208000036086 Chromosome Duplication Diseases 0.000 description 1
- 241000726425 Circe Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 101000898784 Cryphonectria parasitica Endothiapepsin Proteins 0.000 description 1
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 1
- NZNMSOFKMUBTKW-UHFFFAOYSA-N Cyclohexanecarboxylic acid Natural products OC(=O)C1CCCCC1 NZNMSOFKMUBTKW-UHFFFAOYSA-N 0.000 description 1
- CNZIQHGDUXRUJS-UHFFFAOYSA-N Cyclopiazonic acid Natural products CC(=C/1C(=O)C2C3C(Cc4cccc5[nH]cc3c45)C(C)(C)N2C1=O)O CNZIQHGDUXRUJS-UHFFFAOYSA-N 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- DYDCUQKUCUHJBH-UWTATZPHSA-N D-Cycloserine Chemical compound N[C@@H]1CONC1=O DYDCUQKUCUHJBH-UWTATZPHSA-N 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108010001817 Endo-1,4-beta Xylanases Proteins 0.000 description 1
- 102100030013 Endoribonuclease Human genes 0.000 description 1
- 101100522027 Enterobacter agglomerans ydiA gene Proteins 0.000 description 1
- 101000925662 Enterobacteria phage PRD1 Endolysin Proteins 0.000 description 1
- 101100522021 Escherichia coli (strain K12) ppsR gene Proteins 0.000 description 1
- 101100545052 Escherichia coli (strain K12) yuaV gene Proteins 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 241000145614 Fusarium bactridioides Species 0.000 description 1
- 241000223194 Fusarium culmorum Species 0.000 description 1
- 241000223195 Fusarium graminearum Species 0.000 description 1
- 241001112697 Fusarium reticulatum Species 0.000 description 1
- 241001014439 Fusarium sarcochroum Species 0.000 description 1
- 241000223192 Fusarium sporotrichioides Species 0.000 description 1
- 241001465753 Fusarium torulosum Species 0.000 description 1
- 241000567178 Fusarium venenatum Species 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 101150074355 GS gene Proteins 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101710130691 HTH-type transcriptional regulator TnrA Proteins 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- 101001010783 Homo sapiens Endoribonuclease Proteins 0.000 description 1
- 101000664600 Homo sapiens Tripartite motif-containing protein 3 Proteins 0.000 description 1
- 241000223198 Humicola Species 0.000 description 1
- 241001480714 Humicola insolens Species 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- LKDRXBCSQODPBY-AMVSKUEXSA-N L-(-)-Sorbose Chemical compound OCC1(O)OC[C@H](O)[C@@H](O)[C@@H]1O LKDRXBCSQODPBY-AMVSKUEXSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- IGRMTQMIDNDFAA-UWVGGRQHSA-N Lys-His Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IGRMTQMIDNDFAA-UWVGGRQHSA-N 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 241001344133 Magnaporthe Species 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 241000235395 Mucor Species 0.000 description 1
- 241000226677 Myceliophthora Species 0.000 description 1
- 101001116439 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) Serine protease PepD Proteins 0.000 description 1
- 241000233892 Neocallimastix Species 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 102100035593 POU domain, class 2, transcription factor 1 Human genes 0.000 description 1
- 101710084414 POU domain, class 2, transcription factor 1 Proteins 0.000 description 1
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102100036894 Protein patched homolog 2 Human genes 0.000 description 1
- 101710161395 Protein patched homolog 2 Proteins 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 101000968489 Rhizomucor miehei Lipase Proteins 0.000 description 1
- 101000933133 Rhizopus niveus Rhizopuspepsin-1 Proteins 0.000 description 1
- 101000910082 Rhizopus niveus Rhizopuspepsin-2 Proteins 0.000 description 1
- 101000910079 Rhizopus niveus Rhizopuspepsin-3 Proteins 0.000 description 1
- 101000910086 Rhizopus niveus Rhizopuspepsin-4 Proteins 0.000 description 1
- 101000910088 Rhizopus niveus Rhizopuspepsin-5 Proteins 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 102000018673 SEC Translocation Channels Human genes 0.000 description 1
- 108010091732 SEC Translocation Channels Proteins 0.000 description 1
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 1
- 101000898773 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Saccharopepsin Proteins 0.000 description 1
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 1
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 1
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 1
- 241000204893 Saccharomyces douglasii Species 0.000 description 1
- 241001407717 Saccharomyces norbensis Species 0.000 description 1
- 241000222480 Schizophyllum Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 241000203615 Streptoalloteichus Species 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 241000228341 Talaromyces Species 0.000 description 1
- 241001540751 Talaromyces ruber Species 0.000 description 1
- 241000228178 Thermoascus Species 0.000 description 1
- 241000223258 Thermomyces lanuginosus Species 0.000 description 1
- 241001313536 Thermothelomyces thermophila Species 0.000 description 1
- 241001494489 Thielavia Species 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 241001149964 Tolypocladium Species 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 241000223260 Trichoderma harzianum Species 0.000 description 1
- 241000378866 Trichoderma koningii Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- 102100038798 Tripartite motif-containing protein 3 Human genes 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- SRBFZHDQGSBBOR-LECHCGJUSA-N alpha-D-xylose Chemical compound O[C@@H]1CO[C@H](O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-LECHCGJUSA-N 0.000 description 1
- AFVLVVWMAFSXCK-VMPITWQZSA-N alpha-cyano-4-hydroxycinnamic acid Chemical compound OC(=O)C(\C#N)=C\C1=CC=C(O)C=C1 AFVLVVWMAFSXCK-VMPITWQZSA-N 0.000 description 1
- CNZIQHGDUXRUJS-DQYPLSBCSA-N alpha-cyclopiazonic acid Natural products CC(O)=C1C(=O)[C@@H]2[C@@H]3[C@@H](Cc4cccc5[nH]cc3c45)C(C)(C)N2C1=O CNZIQHGDUXRUJS-DQYPLSBCSA-N 0.000 description 1
- 101150069003 amdS gene Proteins 0.000 description 1
- 229940024606 amino acid Drugs 0.000 description 1
- 235000001014 amino acid Nutrition 0.000 description 1
- 235000012538 ammonium bicarbonate Nutrition 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960003311 ampicillin trihydrate Drugs 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 230000010455 autoregulation Effects 0.000 description 1
- 229940005348 bacillus firmus Drugs 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- ZKSIPEYIAHUPNM-ZEQRLZLVSA-N butobendine Chemical compound C([C@H](CC)N(C)CCN(C)[C@@H](CC)COC(=O)C=1C=C(OC)C(OC)=C(OC)C=1)OC(=O)C1=CC(OC)=C(OC)C(OC)=C1 ZKSIPEYIAHUPNM-ZEQRLZLVSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 150000001721 carbon Chemical class 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000009015 carbon catabolite repression of transcription Effects 0.000 description 1
- 239000005018 casein Substances 0.000 description 1
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 1
- 235000021240 caseins Nutrition 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 229940106157 cellulase Drugs 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- 238000004737 colorimetric analysis Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002361 compost Substances 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 229960003077 cycloserine Drugs 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000010856 establishment of protein localization Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000000763 evoking effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Natural products O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- ZJYYHGLJYGJLLN-UHFFFAOYSA-N guanidinium thiocyanate Chemical compound SC#N.NC(N)=N ZJYYHGLJYGJLLN-UHFFFAOYSA-N 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 150000002367 halogens Chemical class 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- BEJNERDRQOWKJM-UHFFFAOYSA-N kojic acid Chemical compound OCC1=CC(=O)C(O)=CO1 BEJNERDRQOWKJM-UHFFFAOYSA-N 0.000 description 1
- 229960004705 kojic acid Drugs 0.000 description 1
- WZNJWVWKTVETCG-UHFFFAOYSA-N kojic acid Natural products OC(=O)C(N)CN1C=CC(=O)C(O)=C1 WZNJWVWKTVETCG-UHFFFAOYSA-N 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000000816 matrix-assisted laser desorption--ionisation Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 229940045641 monobasic sodium phosphate Drugs 0.000 description 1
- 239000004570 mortar (masonry) Substances 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 108010090409 novozym 234 Proteins 0.000 description 1
- 229940046166 oligodeoxynucleotide Drugs 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 235000006408 oxalic acid Nutrition 0.000 description 1
- 101150100654 pacC gene Proteins 0.000 description 1
- 229940049547 paraxin Drugs 0.000 description 1
- 125000001151 peptidyl group Chemical group 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 1
- 150000003016 phosphoric acids Chemical class 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000002980 postoperative effect Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- LXNHXLLTXMVWPM-UHFFFAOYSA-N pyridoxine Chemical compound CC1=NC=C(CO)C(CO)=C1O LXNHXLLTXMVWPM-UHFFFAOYSA-N 0.000 description 1
- 235000008160 pyridoxine Nutrition 0.000 description 1
- 239000011677 pyridoxine Substances 0.000 description 1
- ZUFQODAHGAHPFQ-UHFFFAOYSA-N pyridoxine hydrochloride Chemical compound Cl.CC1=NC=C(CO)C(CO)=C1O ZUFQODAHGAHPFQ-UHFFFAOYSA-N 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229940061969 rheumatrex Drugs 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012882 sequential analysis Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 230000004763 spore germination Effects 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000004885 tandem mass spectrometry Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 229910000406 trisodium phosphate Inorganic materials 0.000 description 1
- 235000019801 trisodium phosphate Nutrition 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
- 101150077833 xlnA gene Proteins 0.000 description 1
- 229960003487 xylose Drugs 0.000 description 1
- 101150065440 ydjA gene Proteins 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 101150075080 yuaU gene Proteins 0.000 description 1
Images
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
帝斯曼知识产权资产管理有限公司B.V.24403WO,在宿主细胞中表达克隆的改进方法,本发明涉及高度适用于经改进的表达克隆方法中的启动子DNA序列和利用该启动子的经改进的表达克隆方法,所述经改进的表达克隆方法用于分离下述DNA序列,所述DNA序列包含在宿主细胞中编码目的蛋白质的DNA序列。所述经分离的DNA序列适用于制造目的蛋白质的方法。
Description
技术领域
本发明涉及高度适合用于下述方法的启动子,所述方法通过表达克隆鉴定编码目的蛋白质的DNA序列。
背景技术
已知数量递增的基于表达克隆的筛选方法。这类方法先前被成功地用于在例如Bacillus(比较US 4,469,791、WO2005/38024)和E.coli(例如WO 95/18219和WO 95/34662)中鉴定原核基因产物。WO2005/38024描述筛选分泌蛋白质的重组Bacillus细胞的方法。然而,该方法缺乏高通量自动化检测技术。酵母也被用作用于表达克隆真核基因的宿主细胞。Strasser等(Eur.J.Biochem.(1989)184:699-706)报导了通过在酵母Saccharomyces cerevisiae中表达克隆真菌基因组DNA来鉴定真菌α-淀粉酶。类似地,WO 93/11249报导了通过在S.cerevisiae中表达克隆真菌cDNA来鉴定真菌纤维素酶。最近,描述了在丝状真菌中的表达克隆(WO99/32617)。
在所有这些方法中,在可分离分泌具有目的特性蛋白质的转化体之前,不得不筛选大量转化体。因此存在对下述表达克隆方法的需要,所述方法可最优化检测编码被分泌蛋白质的DNA序列的机会。
附图简述
图1.描述了pPhtrA-gfp-amyE。该分泌报告子载体包含与GFP可操作连接的B.subtilis htrA启动子。该载体对pPhtrB-gfp-amyE是有代表性的。
图2.用于分泌-胁迫的B.subtilis报告子菌株的结构。htr启动子与GFP基因融合,最终产生质粒pPhtrA-gfp-amyE和pPhtrB-gfp-amyE。产生的质粒通过相应htr基因座中的单交换重组整合进Bacillus宿主细胞染色体中,得到VT210A和VT210B细胞。Cmr代表氯霉素抗性基因。
图3.描述了pUBnpr-2,其包含来自Bacillus amyloliquefaciens的中性蛋白酶基因npr(Genbank登录号K 02497)
图4.描述了pUBBAG,其包含来自Bacillus amyloliquefaciens的β-葡聚糖酶基因bag(Genbank登录号M 15674)。
图5.描述了使用荧光激活细胞分选术(Fluorescence Activated CellSorting)对用质粒pUB110(空对照载体)或质粒pKTH10(编码Bacillusamyloliquefaciens的α-淀粉酶基因amyQ)转化的Bacillus subtilis VT210A细胞的分析。y轴描述所观察到的事件数量,x轴描述相对荧光。在图A中,描述了对用空载体pUB110转化的Bacillus subtilis VT210A细胞的分析。在图B中,描述了对用amyQ载体pKTH10转化的Bacillus subtilisVT210A细胞的分析。在图C中,描述了对用1∶20比例的pUB110和pKTH10转化的Bacillus subtilis VT210A细胞混合种群的分析。在图D中,描述了对用pUB110和pKTH10二者转化的Bacillus subtilis VT210A细胞混合种群的细胞分选;细胞分选限制由垂直虚线指示。显示高于所述限制的细胞被分选出来。
图6.描述了对用质粒pUB110(空对照载体)或质粒pKTH10(编码Bacillus amyloliquefaciens的α-淀粉酶基因amyQ)转化的Bacillus subtilisVT210A细胞混合种群的分析。分析通过荧光激活细胞扫描(FluorescenceActivated Cell Scanning)进行。y轴描述所观察到的事件数量,x轴描述相对荧光。
图7.描述了用于在A.niger中表达绿色荧光蛋白(GFP,Chalfie,M et al.,Science(1994)263(5148):802-805)的pGBFINGFP-2载体。所述FIN载体的主链特征先前描述于WO 99/32617中。
图8.描述了用于在A.niger中表达植酸酶(PHY)(与WO99/32617中所述FytA相同的植酸酶基因PHY)的pGBFIN-32载体。
图9.描述了其中大部分植酸酶基因和整个葡萄糖淀粉酶启动子被去除的pGBFIN-40载体,该载体用作构建A.niger WT载体菌株的孔对照载体。
图10.描述了为确认分泌诱导的启动子身份而进行的Northern印迹分析。
图11.描述了用于在A.niger中基因表达的载体。该载体在构建分泌诱导的A.niger报告子构建体中用作主链。
图12.描述了pGBFINGFPBLE-1克隆载体。该分泌诱导型报告子构建体包含与本发明分泌诱导型启动子1可操作连接的GFP-BLE报告子融合基因。该构建体对于pGBFINGFPBLE-2、pGBFINGFPBLE-3、pGBFINGFPBLE-4和pGBFINGFPBLE-5是代表性的。
图13.描述了pGBTOPSEL-1,该载体用作构建最终分泌诱导型报告子质粒的主链。所述载体的主链特征先前描述于WO 99/32617。
图14.描述了最终分泌报告子构建体pGBTOPGFPBLE-1。该分泌诱导的报告子载体包含与本发明分泌诱导型启动子1可操作连接的GFP-BLE报告子构建体。该载体对pGBTOPGFPBLE-2、pGBTOPGFPBLE-3、pGBTOPGFPBLE-4和pGBTOPGFPBLE-5是代表性的。
图15.描述了含有下述报告子构建体的A.niger共转化体腐草霉素抗性的差异,所述报告子构建体带有与编码细胞内蛋白质(由黑点表示)或细胞外蛋白质(由黑方块表示)的文库构建体结合的分泌诱导型启动子P4。
图16.描述了含有下述报告子构建体的A.niger共转化体腐草霉素抗性的差异,所述报告子构建体带有与编码细胞内蛋白质(由黑点表示)或细胞外蛋白质(由黑方块表示)的文库构建体结合的分泌诱导型启动子P5。
图17.描述了E-PAGETM凝胶,其中各图代表包含下述报告子构建体的经共转化的A.niger克隆,所述报告子构建体带有与编码细胞外蛋白质的文库构建体结合的分泌诱导型启动子P1。M代表E-PAGE预染标准(Invitrogen,U.K.)。
发明内容
启动子DNA序列
根据本发明的第一方面,提供了启动子DNA序列,例如:
(a)以下列表所示的DNA序列:SEQ ID NO:1、SEQ ID NO:2、SEQID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ IDNO:24,
(b)能够与(a)的DNA序列杂交的DNA序列,
(c)与(a)的DNA序列至少50%同源的DNA序列,
(d)(a)到(c)的DNA序列中任何一种的变体,或
(e)(a)到(d)的DNA序列中任何一种的亚序列。
根据一种优选的实施方案,本发明的启动子序列为这样的一种启动子DNA序列,例如:
(a)以下列表所示的一种DNA序列:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ IDNO:24,
(b)能够与(a)的DNA序列杂交的DNA序列,
(c)与(a)的DNA序列至少50%同源的一个DNA序列,
(d)(a)到(c)的DNA序列中任何一种的一个变体,或
(e)(a)到(d)的DNA序列中任何一种的一个亚序列。
在本申请上下文中,启动子DNA序列为下述DNA序列,当该启动子DNA序列与该编码序列可操作连接时,所述DNA序列能够控制编码序列的表达。术语“可操作连接”在本文定义为一种构型,其中启动子DNA序列适当地置于与编码序列相关的位置,使得所述启动子DNA序列指导由所述编码序列编码的多肽的产生。
术语“编码序列”在本文定义为被转录为下述mRNA的核酸序列,所述mRNA置于适当调控序列调控之下时被翻译为多肽。编码序列的边界通常由ATG起始密码子(其通常为mRNA5’末端开放读码框的起点)和转录终止序列(在mRNA 3’末端开放读码框的紧下游)确定。编码序列可包括但不仅限于基因组DNA、cDNA、半合成的、合成的和重组的核酸序列。优选地,启动子DNA序列被定义为位于其连接的编码序列上游的DNA序列,并定义为能够调控该编码序列的表达。
更具体地,术语“启动子”在本文定义为下述DNA序列,所述DNA序列结合RNA聚合酶,并指导聚合酶到达编码多肽的编码序列正确的下游转录起始位点以起始转录。RNA聚合酶能有效催化与编码区适当DNA链互补的信使RNA的装配。术语“启动子”还应被理解为包括用于转录为mRNA后翻译的5’非编码区(启动子和翻译起点之间)、顺式作用转录调控元件如增强子,和其它能够与转录因子相互作用的核苷酸序列。
在一种优选的实施方案中,本发明的启动子DNA序列为来自以下的DNA序列:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ ID NO:24。
根据另一优选的实施方案,本发明的启动子DNA序列为能够与以下列表所示的DNA序列杂交并仍保持启动子活性的DNA序列:SEQ ID NO1、SEQ ID NO:2、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQID NO:23或SEQ ID NO:24。
启动子活性优选通过测量作为编码序列表达结果产生的蛋白质浓度来确定,所述编码序列与启动子可操作连接。或者启动子活性通过测量由编码序列编码的蛋白质的酶活性确定,所述编码序列与启动子可操作连接。根据优选的实施方案,启动子活性(及其强度)通过测量lacZ报告子基因表达来确定(In Luo,Gene 163(1995)127-131或Perkins and Youngman(1986)Proc Natl Acad Sci USA 83:140;或Vagner et al.(1998)Microbiology144:3097中)。根据另一优选的实施方案,通过使用绿色荧光蛋白作为编码序列确定启动子活性(In Microbiology.1999 Mar;145(Pt 3):729-34.Santerre Henriksen AL,Even S,Muller C,Punt PJ,van den Hondel CA,NielsenJ.Study)。在细菌细胞中,GFP和其它荧光蛋白已广泛用于表达和(动态)蛋白质定位研究(在Southward and Surette(2002)MoI.Microbiol.45:1191中综述)。另外,可通过测量在启动子调控下产生的转录物mRNA水平确定启动子活性。可例如通过Northern印迹、GeneChipsTM(Affymetrix)或斑点阵列技术或定量(实时)PCR测量mRNA水平(J.Sambrook,E.F.Fritsch,and T.Maniatis,2001,Molecular Cloning,A Laboratory Manual,3dedition,Cold Spring Harbor,N.Y.)。最优选地,通过使用Northern印迹的mRNA分析确定启动子活性。
优选地,本发明的(经分离的)启动子DNA序列在非常低严格度条件下,更优选低严格度条件下,更优选中严格度条件下,更优选中-高严格度条件下,甚至更优选高严格度条件下和最优选非常高严格度条件下与下述核酸探针杂交,所述核酸探针在相同条件下与
(i)SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23或SEQ ID NO:24,或
(ii)(i)的亚序列,或
(iii)(i)、(ii)的互补链杂交。
术语互补链为本领域技术人员已知,并描述于(J.Sambrook,E.F.Fritsch,and T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,2dedition,Cold Spring Harbor,N.Y.)。SEQ ID NO:1、SEQ ID NO:2、SEQ IDNO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ ID NO:24的亚序列可在20个核苷酸和编码区上游SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ IDNO:24的相应全序列(SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ ID NO:24的相应编码区分别在SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28和SEQ ID NO:29中给出)之间的范围。
SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23或SEQ ID NO:24的核酸序列及其亚序列(如前一段中所定义)可用于设计核酸探针,以从不同属或种的菌株中根据本领域公知方法鉴定和克隆DNA启动子。具体地,这类探针可用于与目的属或种的基因组或cDNA根据标准Southern印迹方法杂交,从而从其中鉴定和分离相应的基因。这类探针可显著短于整个序列,但是应有至少15个,优选至少25个和更优选至少35个核苷酸长。另外,这类探针可用于通过PCR扩增DNA启动子。也可使用更长的探针。可使用DNA、RNA和肽核酸(PNA)探针。典型地,标记探针用于检测相应基因(例如用@32P、@33P、@3H、@35S、生物素或抗生物素蛋白或荧光标记物)。本发明包括这类探针。
因此从这类其它生物中制备的基因组DNA或cDNA可用于筛选下述DNA,所述DNA与上文所述探针杂交并编码多肽。来自这类其它生物的基因组DNA或其它DNA可通过琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术分离。来自文库或经分离的DNA的DNA可转移至并固定在硝酸纤维素或其它合适的载体材料上。为了鉴定与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ IDNO:24或其亚序列同源的克隆或DNA序列,载体材料可用于Southern印迹。就本发明的目的而言,杂交是指DNA序列在非常低到非常高严格度条件下与下述经标记的核酸探针杂交,所述探针对应于SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23或SEQ ID NO:24中所示DNA序列,对应于所述DNA序列的互补链,或对应于所述DNA序列的亚序列。在这些条件下与核酸探针杂交的分子使用例如X射线胶片检测。也可使用其它杂交技术,例如使用用于检测的荧光和玻片和/或DNA微阵列作为支持。DNA微阵列杂交检测的一个实例在FEMS Yeast Res.2003 Dec;4(3):259-69(Daran-Lapujade P,Daran JM,Kotter P,Petit T,Piper MD,Pronk JT.″Comparative genotyping of theSaccharomyces cerevisiae laboratory strains S288C and CEN.PK1 13-7D usingoligonucleotide microarrays″)中给出。另外,PNA微阵列用于杂交的用途描述于Nucleic Acids Res.2003 Oct 1;31(19):e119(Brandt O,Feldner J,Stephan A,Schroder M,Schnolzer M,Arlinghaus HF,Hoheisel JD,Jacob A.PNA microarrays for hybridisation of unlabelled DNA samples.)。
在一种优选的实施方案中,核酸或DNA探针为SEQ ID NO:1、SEQID NO:2、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ ID NO:24的DNA序列。在另一实施方案中,核酸探针为具有SEQID NO:1的核苷酸100到150的DNA序列或具有SEQ ID NO:2的核苷酸170到220的DNA序列。
在另一优选的实施方案中,核酸探针为具有以下的DNA序列:
-SEQ ID NO:20的核苷酸996到2797、SEQ ID NO:21的核苷酸996到3561、SEQ ID NO:22的核苷酸997到3536、SEQ ID NO:23的核苷酸1034到3175或SEQ ID NO:24的核苷酸1080到4054,更优选:
-SEQ ID NO:20的核苷酸1496到2497、SEQ ID NO:21的核苷酸1496到3261、SEQ ID NO:22的核苷酸1497到3236、SEQ ID NO:23的核苷酸1534到2875或SEQ ID NO:24的核苷酸1580到3754,甚至更优选:
-SEQ ID NO:20的核苷酸1896到2197、SEQ ID NO:21的核苷酸1896到2861、SEQ ID NO:22的核苷酸1897到2936、SEQ ID NO:23的核苷酸1934到2575或SEQ ID NO:24的核苷酸1980到3454,和最优选:
-SEQ ID NO:20的核苷酸1996到2100、SEQ ID NO:21的核苷酸1996到2300、SEQ ID NO:22的核苷酸1997到2400、SEQ ID NO:23的核苷酸2034到2100或SEQ ID NO:24的核苷酸2080到2800。
根据另一优选的实施方案,探针为位于编码序列上游的SEQ IDNO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ ID NO:24的DNA序列的一部分。SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ ID NO:24的相应的编码区分别在SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28和SEQ ID NO:29中给出。
对于至少100个核苷酸长度的长探针而言,非常低到非常高严格度条件被定义为:依照标准Southern印迹程序,在42℃下5倍SSPE、0.3%SDS、200毫克/ml经剪切且变性的鲑精DNA和甲酰胺中预杂交和杂交,所述甲酰胺对于非常低和低严格度而言为25%,对于中和中-高严格度而言为35%或对于高和非常高严格度而言为50%。对于至少100个核苷酸长度的长探针而言,最后用2倍SSC、0.2%SDS,在至少45℃(非常低严格度),更优选至少50℃(低严格度),更优选至少55℃(中严格度),更优选至少60℃(中-高严格度),进一步更优选至少65℃(高严格度)和最优选至少70℃(非常高严格度)下对载体材料洗涤三次,每次15分钟。
对于约15个核苷酸到约70个核苷酸长度的短探针而言,严格度条件定义为:在比使用Bolton and McCarthy(1962,Proceedings of the NationalAcademy of Sciences USA 48:1390)算法计算的Tm低5℃到10℃下,在0.9M NaCl、0.09 M Tris-HCl pH 7.6、6 mM EDTA、0.5%NP-40、1倍Denhardfs溶液、1mM焦磷酸钠、1mM磷酸二氢钠、0.1mM ATP和0.2mg/ml酵母RNA中依照标准Southern印迹程序预杂交、杂交和杂交后洗涤。对于约15个核苷酸到约70个核苷酸长度的短探针而言,在6倍SCC加上0.1%SDS中15分钟对载体材料洗涤一次,并使用6倍SSC在低于所计算的Tm 5℃到10℃下洗涤两次,每次15分钟。
根据另一优选的实施方案,首先用来自SEQ ID NO 1、SEQ IDNO:2、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ ID NO:24的本发明的启动子DNA序列克隆与其可操作连接的天然基因、编码序列或其部分。这可从SEQ ID NO 1、SEQ ID NO:2、SEQ IDNO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ ID NO:24或先前定义的其亚序列开始来完成,其中使用该序列作为探针。将所述探针与给定宿主的cDNA或基因组文库杂交,所述宿主为Bacillus、Aspergillus niger或本申请文本中定义的任何其它宿主。一旦天然基因或其部分被克隆,可随后使用其自身作为探针,通过本文所述杂交实验克隆来自其它真菌的它的同源基因。在本发明上下文中,同源基因是指与天然基因至少50%同源的基因。优选地,同源基因与天然基因至少55%同源,更优选至少60%,更优选至少65%,更优选至少70%,进一步更优选至少75%,优选至少约80%,更优选约90%,进一步更优选约95%和最优选约97%。
同源基因编码序列上游的序列为本发明包含的启动子。或者,可通过使用SEQ ID NO 25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28或SEQ ID NO:29或如前定义的其亚序列,用例如如本文所述的比对或BLAST算法搜索基因组数据库来鉴定与本发明启动子可操作连接的天然基因、编码序列或其部分的序列。随后可使用该经鉴定的序列来鉴定本申请中定义的任何其它真菌宿主中的直向同源基因或同源基因。经鉴定的直向同源基因或同源基因编码序列上游的序列为本发明所包括的启动子。
根据另一优选的实施方案,本发明的启动子DNA序列为来自SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ ID NO:24并仍然具有较前定义的启动子活性的(经分离的)DNA序列。
根据另一优选的实施方案,本发明的启动子DNA序列为分别来自SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23或SEQ ID NO:24的(经分离的)DNA序列,其与位于各自编码区(SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28或SEQ ID NO:29)上游的各自相应的DNA序列SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18或SEQ ID NO:19的至少部分至少50%同源。优选地,所述DNA序列与位于各自相应编码区上游的SEQ ID NO 15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18或SEQ ID NO:19的至少部分至少55%同源,更优选至少60%,更优选至少65%,更优选至少70%,进一步更优选至少75%,优选约80%,更优选约90%,进一步更优选约95%,最优选约97%同源。
就本发明目的而言,优选通过Wilbur-Lipman方法(Wilbur andLipman,1983,Proceedings of the National Academy of Science USA 80:726-730)使用LASERGENE.TM.MEGALIGN.TM.软件(DNASTAR,Inc.,Madison,Wis.)用同一性表格和以下多重比对参数确定两个核酸序列之间的同源性程度:缺口惩罚为10和缺口长度惩罚为10。配对比对参数为Ktuple=3、缺口惩罚=3和窗口=20。
根据另一优选的实施方案,本发明的启动子DNA序列来自下述(经分离的)DNA序列,所述分离的DNA序列为位于各自相应编码区上游的SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:18或SEQ ID NO:19或SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18或SEQ IDNO:19的部分的变体。术语“变体启动子”在本文被定义为具有下述核苷酸序列的启动子,所述核苷酸序列包含母体启动子的一个或多个核苷酸的取代、缺失和/或插入,其中所述变体启动子具有大于或小于相应母体启动子的启动子活性。术语“变体启动子”还应包括天然变体和使用本领域公知方法(例如经典诱变、定向诱变和DNA改组(shuffling))体外产生的变体。变体启动子可具有一个或多个突变。各突变为核苷酸的独立取代、缺失和/或插入。向启动子中引入核苷酸取代、缺失和/或核苷酸可使用任何本领域已知方法(例如经典诱变、定向诱变或DNA改组)完成。特别有用的为下述方法,所述方法利用带有目的插入的超螺旋的双链DNA载体和含有所需突变的两个合成引物。各自与载体相反链互补的寡核苷酸引物通过Pfu DNA聚合酶的手段在温度循环中延伸。掺入引物后,产生含有交错切口的经突变的质粒。温度循环之后,用Dpn1处理产物以消化亲代DNA模板并选择含有突变的经合成的DNA,所述Dpn1对经甲基化的和经半甲基化的DNA特异。也可使用本领域已知的其它方法。其它方法的实例为QuickChangeTM定点诱变试剂盒(Stratagene Cloning Systems,La JoIIa,CA)、改变的位点II体外诱变体系(The Alteredin vitroMutagenesis Systems)(Promega Corporation)或通过使用如Gene.1989 Apr15;77(1):51-9.(Ho SN,Hunt HD,Horton RM,Pullen JK,Pease LR″Site-directed mutagenesis by overlap extension using the polymerase chain reaction″)所述PCR或使用如Molecular Biology:Current Innovations and Future Trends.(Eds.A.M.Griffin and H.G.Griffin.ISBN 1-898486-01-8 1995 HorizonScientific Press,PO Box 1,Wymondham,Norfolk,U.K.)所述PCR的重叠延伸。根据优选的实施方案,变体启动子为与最初来自SEQ ID NO:1、SEQID NO:2、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18或SEQ ID NO:19的启动子序列相比,具有至少一个经修饰的调节位点的启动子。这类调节位点可以整体被去除或如上文所解释被特异突变。从而调节这类启动子变体使得例如其不再被葡萄糖诱导。这类启动子变体和如何获得它们的技术的实例描述于EP 673 429B或WO 94/04673。
启动子变体可以是等位变体。等位变体是指占据相同染色体位点的基因的两种或更多可选择的形式中的任何。等位变体通过突变天然发生,并可由种群中的多态性引起。可通过包含步骤(a)和(b)的以下方法获得变体启动子:(a)在非常低、低、中、中-高、高或非常高严格度条件下将DNA与
(i)SEQ ID NO 1、SEQ ID NO:2、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18或SEQ ID NO:19,或
(ii)(i)的亚序列,或
(iii)(i)、(ii)的互补链杂交,和
(b)从所述DNA序列中分离变体启动子。严格度和洗涤条件如本文定义。
本发明的启动子可以是下述启动子,所述启动子的序列可用接头提供,所述接头用于引入特异限制性位点的目的,所述限制性位点便于连接启动子序列和编码多肽的核酸序列编码区。
在另一优选的实施方案中,启动子DNA序列来自SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ IDNO:18或SEQ ID NO:19的亚序列。在本文上下文中亚序列优选被定义为位于先前定义的各相应编码序列上游的SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18或SEQ IDNO:19的部分。
亚序列优选含有至少约50个核苷酸,或优选至少约100个核苷酸,更优选至少约200个核苷酸,甚至更优选至少约230个核苷酸,甚至更优选至少约250个核苷酸和最优选至少约290个核苷酸。
根据另一优选的实施方案,亚序列与前述句子定义的亚序列区别在于一个或多个来自5’和/或3’端的核苷酸被缺失,所述DNA序列仍具有早先定义的启动子活性。
在另一优选的实施方案中,启动子亚序列为来自翻译起点和/或来自转录起点的“经修剪的(trimmed)”亚序列。修剪启动子并对其功能性分析的实例描述于Gene.1994 Aug 5;145(2):179-87:the effect of multiple copiesof the upstream region on expression of the Aspergillus niger glucoamylase-encoding gene.Verdoes JC,Punt PJ,Stouthamer AH,van den Hondel CA).
本文所提供的序列信息不应狭义地解释为要求包括错误鉴定的碱基。本文所公开的特异序列可被容易地使用,并最终进行进一步的序列分析从而鉴定测序错误,以从丝状真菌(特别是Aspergillus niger)中分离最初的DNA序列。
除非另有说明,所有通过测序本文DNA分子确定的核苷酸序列都是使用自动DNA测序仪确定的。因此,如本领域已知,对于通过该自动途径确定的任何DNA序列而言,本文确定的任何核苷酸序列可能含有一些错误。通过自动化确定的核苷酸序列通常与经测序DNA分子的实际核苷酸序列至少约90%相同,更典型地至少约95%相同到至少约99.9%相同。可通过其它手段更为精确地确定实际序列,包括本领域公知的手工DNA测序方法。
本领域技术人员能够鉴定这类被错误鉴定的碱基,并知道如何改正这类错误。
功能性核酸等同物可典型地含有不改变其涉及的生物学功能的突变。术语“功能性等同物”还包括A.niger DNA序列的直向同源物。A.nigerDNA序列的直向同源物为能够从其它菌株或物种中分离,并具有类似或相同生物学活性的DNA序列。
还可通过使用“序列比较算法”确定同源(类似或同一)序列。可例如通过Smith & Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法、通过Needleman & Wunsch,J.MoI.Biol.48:443(1970)的同源性比对算法、通过Pearson & Lipman,Proc.Nat′l Acad.Sci.USA 85:2444(1988)的搜索相似性算法、通过这些算法的计算机实现(GAP,BESTFIT,FASTA,andTFASTA in the Wisconsin Genetics Software Package,Genetics ComputerGroup,575 Science Dr.,Madison,Wl)或通过目测进行用于查询序列的最佳比对。适用于确定序列相似性的算法的实例为BLAST算法,其描述于Altschul,et al.,J.MoI.Biol.215:403-410(1990)。或者,其它程序可用于本文较早描述的序列比对。用于进行BLAST分析的软件通过National Centerfor Biotechnology Information(http://www.ncbi.nlm.nih.gov/)可公开获得。该算法涉及首先通过鉴定查询序列中W长度的短字词鉴定高分序列对(HSP),所述短字在与数据库序列中相同长度的字相比时,匹配或满足一些正值阈分值T。这些最初的相邻字击中(word hits)被用作为寻找含有它们的更长HSP的起点。字击中在两个方向上沿两条被比较序列中的各条延伸,直至积累的比对评分可以提高。当累积的比对评分从达到的最大值减少数量X时;累积的比对评分降为零或低于零时;或到达任一序列末端时,字击中的延伸停止。BLAST算法参数W、T和X确定比对的敏感性和速度。BLAST程序使用11的字长(W)、50的BLOSUM62评分矩阵(参阅Henikoff & Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989))比对(B)、10的期望值(E)、M=5、N=-4和双链比较作为默认值。然后BLAST算法进行两条序列间相似性的统计分析(参阅例如Karlin &Altschul,Proc.Nat′l.Acad.Sci.USA 90:5873-5787(1993))。由BLAST算法提供的一种相似性测量为最小和概率(P(N)),其提供了对两个核苷酸或氨基酸序列间偶然发生匹配的可能性的指示。例如,如果在测试氨基酸序列与蛋白质(如蛋白酶)氨基酸序列的比较中最小和可能性为小于约0.1,更优选小于约0.01和最优选小于约0.001时,认为氨基酸序列与蛋白质(如蛋白酶)相似。
优选地,变体启动子的相似性为与具有SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18或SEQ ID NO:19的DNA序列之一至少40%同源。更优选地,相似性为与具有SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:18或SEQ ID NO:19的DNA序列至少50%,更优选至少60%,更优选至少70%,更优选至少80%,更优选至少90%和更优选至少95%或至少98%同源。
除天然存在的启动子序列等位变体外,技术人员知道:可通过突变将改变引入来自SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18或SEQ ID NO:19的启动子序列中,而本质上不改变其启动子功能。
本发明的启动子序列可得自任何属的微生物。就本发明的目的而言,在本文中与给定来源结合使用术语“得自”应指多肽由所述来源制造或由来插入了自所述来源的基因的细胞制造。优选微生物为原核生物。优选的原核生物为Bacillus和E.coli。优选的Bacilli为Bacillus subtilis、Bacillusamyloliquefaciens、Bacillus licheniformis、Bacillus alcalophilus、Bacillusclausii、Bacillus brevis、Bacillus circulans、Bacillus firmus、Bacilluspumilis、Bacillus stearothermophilus、Bacillus megaterium、Bacilluslentus或Bacillus thuringiensis。
或者,启动子序列得自真核生物,优选真菌来源,并更优选来自酵母菌株,如Candida、Hansenula、Kluyveromyces、Pichia、Saccharomyces、Schizosaccharomyces或Yarrowia菌株;或更优选地,来自丝状真菌菌株,如Acremonium、Aspergillus、Aureobasidium、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mucor、Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Schizophyllum、Talaromyces、Thermoascus、Thielavia、Tolypocladium或Trichoderma菌株。
在优选的实施方案中,启动子序列得自Saccharomycescarlsbergensis、Saccharomyces cerevisiae、Saccharomyces diastaticus、Saccharomyces douglasii、Saccharomyces kluyveri、Saccharomycesnorbensis、Saccharomyces oviformis、Saccharomyces bayanus、Saccharomyces bayanus,var.uvarum或Saccharomyces pastorianus菌株。
在另一优选的实施方案中,启动子序列得自Aspergillus aculeatus、Aspergillus awamori、Aspergillus foetidus、Aspergillus japonicus、A.nidulans、A.niger优选A.niger CBS 513.88、A.sojae、Aspergillus oryzae(A.oryzae)、Humicola insolens、Humicola lanuginosa、Mucor miehei、Myceliophthora thermophila、Neurospora crassa、Penicilliumpurpurogenum、Trichoderma harzianum、Trichoderma koningii、Trichoderma longibrachiatum、Trichoderma reesei或Trichoderma viride菌株。
在另一优选的实施方案中,启动子序列得自Fusarium bactridioides、Fusarium cerealis、Fusarium crookwellense、Fusarium culmorum、Fusariumgraminearum、Fusarium graminum、Fusarium heterosporum Fusariumnegundi、Fusarium oxysporum、Fusarium reticulatum、Fusarium roseum、Fusarium sambucinum、Fusarium sarcochroum、Fusarium sporotrichioides、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides、Fusarium venenatum菌株。
应当理解:对于上述物种而言,本发明包括完美和不完美的状态,和其它分类学等价物(例如无性型),而无论其被已知的物种名如何。本领域技术人员会容易地识别合适等价物的性质。公众可以在大量培养物收集中容易地得到这些物种的菌株,所述培养物收集如美国模式培养物保藏单位(ATCC)、Deutsche Sammlung von Mikroorganismen und ZellkulturenGmbH(DSM)、Centraalbureau Voor Schimmelcultures(CBS)和AgriculturalResearch Service Patent Culture Collection,Northern Regional Research Center(NRRL)。
此外,可使用上述探针从其它来源中鉴定或获得根据本发明的启动子序列,所述其它来源包括从自然(例如土壤、堆肥、水等)中分离的微生物。用于从天然生境中分离微生物的技术为本领域公知。然后可类似地筛选另一微生物的基因组DNA文库得到核酸序列。一旦用探针检测到了编码启动子的核酸序列,则可通过使用本领域常规技术人员已知地技术分离或克隆该序列(参阅例如Sambrook et al.,1989,上文)。
在本发明中,启动子DNA序列还可以是杂交启动子,其包含一个或多个本发明启动子的部分;本发明启动子的部分和另一已知启动子的部分(如一个启动子的前导序列和来自另一启动子的转录起始位点);或本发明一个或多个启动子的部分和一个或多个其它启动子的部分。其它启动子可以是在所选的宿主细胞中显示转录活性的任何启动子序列,包括变体的、截短的和杂交启动子,并可得自编码与所述宿主细胞同源或异源的细胞外或细胞内多肽的基因。其它启动子序列对于编码多肽的核酸序列来说可以是同源或异源的,并可对细胞来说是同源或异源的。
作为一种优选的实施方案,经鉴定的启动子的重要调节亚序列可与其它“基本”启动子融合以增强它们的启动子活性(例如描述于MolMicrobiol.1994May;12(3):479-90.Regulation of the xylanase-encoding xlnAgene of Aspergillus tubigensis.de Graaff LH,van den Broeck HC,van OoijenAJ,Visser J.)
适用于用本发明启动子构建杂交启动子的其它启动子的其它实例包括得自下述基因的启动子:A.oryzae TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、A.niger中性α-淀粉酶、A.niger酸稳定α-淀粉酶、A.niger或Aspergillus awamori葡萄糖淀粉酶(glaA)、A.niger gpdA、A.niger葡萄糖氧化酶goxC、Rhizomucor miehei脂酶、A.oryzae碱性蛋白酶、A.oryzae磷酸丙糖异构酶、A.nidulans乙酰胺酶和Fusarium oxysporum胰蛋白酶样蛋白酶(WO 96/00787)以及NA2-tpi启动子(来自A.niger中性α-淀粉酶基因的启动子和A.oryzae磷酸丙糖异构酶的杂种)、Saccharomycescerevisiae烯醇化酶(ENO-1)、Saccharomyces cerevisiae半乳糖激酶(GAL1)、Saccharomyces cerevisiae醇脱氢酶/甘油醛-3-磷酸盐脱氢酶(ADH2/GAP)和Saccharomyces cerevisiae 3-磷酸甘油酸酯激酶,及其突变体、截短的启动子和杂交启动子。适用于酵母宿主细胞的其它启动子由Romanos et al.,1992,Yeast 8:423-488描述。其它用于细菌细胞的有用启动子为以下基因的启动子:B.subtilis碱性蛋白酶(apr)、B.subtilis中性蛋白酶(npr)、B.amyloliquefaciens α-淀粉酶(amyQ)、B.amyloliquefaciens碱性蛋白酶(apr)和B.amyloliquefaciens中性蛋白酶(npr)。
在本发明中,启动子DNA序列还可以是“串联启动子”。“串联启动子”在本文中被定义为两个或更多启动子序列,其各与编码序列可操作连接并介导编码序列到mRNA的转录。
串联启动子包含两个或更多本发明的启动子,或者一个或多个本发明的启动子和一个或多个其它已知启动子,如上举例适用于构建杂交启动子的那些。串联启动子的两个或更多启动子序列可同时启动核酸序列的转录。或者串联启动子的一个或多个启动子序列可在细胞生长的不同阶段、或在真菌宿主的情况下时在菌丝体形态学上不同的部分、或在成孢子的细菌(如bacilli)中孢子发育中不同的细胞区室内启动核酸序列的转录。
在本发明中,启动子可编码序列和/或对宿主细胞可以是外源的。本发明的变体、杂交或串联启动子应被理解为对编码多肽的DNA序列外源,即使野生型的启动子对编码序列或对宿主细胞是内源的。
本发明的变体、杂交或串联启动子具有为来自SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ ID NO:24和早先定义的任何启动子的至少约20%,优选至少约40%,更优选至少约60%,更优选至少约80%,更优选至少约90%,更优选至少约100%,进一步更优选至少约200%,最优选至少约300%,和进一步最优选至少约400%的启动子活性。启动子活性优选如先前所述来确定。最优选启动子活性使用Norhtern印迹通过mRNA分析确定。
DNA构建体
根据第二个方面,本发明提供下述DNA构建体,所述构建体包含与赋予可选择性状的报告基因可操作连接的如上部分所述的本发明启动子DNA序列。报告基因可以是对合适宿主赋予可选择性状的任何基因。优选报告基因为选择性标记基因。
“DNA构建体”在本文中被定义为单链或双链的核酸分子,其分离自天然存在的基因,或其经修饰而含有以天然不存在的方式组合和并置的核酸片段。
当DNA构建体含有编码序列和编码序列表达所需的全部调控序列时,术语“DNA构建体”与术语“表达盒”同义。在本申请上下文中,术语“DNA构建体”与术语“经分离的DNA构建体”可互换使用,其中两个术语理解为同义。
DNA构建体可包含选择性标记基因,其允许容易选择经转化的宿主细胞。DNA构建体包含两个选择性标记基因时,技术人员会理解这两个选择性标记基因不相同:与本发明启动子连接的第一个选择性标记基因用于本发明的筛选方法中,DNA构建体中存在的第二个选择性标记基因允许经转化的宿主细胞的标准选择。
报告基因与本发明的启动子DNA序列可操作连接,从而在给定的宿主细胞中所述报告基因能够在启动子DNA序列调控下表达。由报告子基因编码的多肽对宿主细胞和/或对启动子DNA序列可以是同源或异源的。
在本文上下文中“一个”是指“至少一个”。因此DNA构建体包含至少一个报告基因。宿主可与至少两个DNA构建体共转化,其中一个包含选择性标记而另一个包含与报告基因连接的本发明启动子。或者根据更优选的实施方案,DNA构建体中包含的报告基因为包含至少一部分一个报告基因和至少一部分第二个报告基因的杂交报告基因,其中第一个和第二个报告基因的编码序列按读码框彼此配对,且其中所述杂交报告基因与本发明启动子可操作连接。第一个和/或第二个报告基因可以是赋予合适宿主可选择性状的任何基因。用于真菌的优选杂交报告基因包括Streptoalloteichus hindustanis(Drocourt et al.,NAR,1990)的GFP基因和腐草霉素抗性基因(BLE)。
选择性标记或可选择标记为下述基因,所述基因的产生提供抗微生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养型等。用于原核宿主细胞的合适可选择标记包括但不仅限于卡那霉素、新霉素、红霉素和其它MLS型标记物(大环内酯-林肯酰胺-蜜柑霉素B)、氯霉素、氨苄西林、四环素、链霉素和壮观霉素。用于酵母的合适标记物为ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的可选择标记物包括但不仅限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲基转移酶)、bar(膦丝菌素乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清苷-5′-磷酸脱羧酶)、sC(硫酸腺嘌呤基转移酶)、trpC(邻氨基苯甲酸合酶)及其等效物。也可使用提供针对例如腐草霉素、潮霉素B或G418抗性的标记。优选用于Aspergillus细胞的为A.nidulans或A.oryzae的amdS和pyrG基因和Streptomyces hygroscopicus的bar基因。amdS标记基因优选应用EP 635574B或WO 97/06261中所述技术使用。优选的选择性标记基因为与A.nidulans gpdA启动子融合的A.nidulans amdS编码序列(EP635 574B)。也可使用来自其它丝状真菌的amdS基因(WO 97/06261)。
根据另一优选的实施方案,报告基因编码用于如上所述的原核、酵母和/或丝状真菌细胞的可选择标记物。或者报告基因编码如下的报告子蛋白:β-半乳糖苷酶、β-葡萄糖苷酸酶、水母发光蛋白、绿色荧光蛋白(GFP)及其变体(红色、氰基、黄色荧光蛋白)、萤光素酶、lux、血红素、β-内酰胺酶或碱性磷酸酶。更优选地,报告基因为或包含编码荧光报告子蛋白的基因,所述荧光报告子蛋白例如但不仅限于GFP、YFP和CFP(分别为绿色、黄色和氰基荧光蛋白质)。转化体将显示荧光并可使用光电管分选技术(FACS,荧光活化的细胞分选)从非表达克隆中分离。该方法的一个重要优点为:不需要将转化混合物涂布平板(其显著的提高了筛选方法的通量),并且阳性克隆可直接排列为MTP形式用于进一步的自动化处理。或者报告基因编码(跨)膜蛋白或细胞壁蛋白,抗体可出现在其上。可使用磁细胞分选技术(,Magnetic cell sorting,www.miltenyibiotec.com)从非表达转化体中分离显示所述膜蛋白的转化体。
调控元件
DNA构建体除启动子DNA序列外可进一步包含一种或多种调控序列,其在宿主细胞中在与调控序列相容的条件下指导报告基因的表达。表达应被理解为包括多肽产生中涉及的任何步骤,其包括但不仅限于转录、转录后修饰、翻译、翻译后修饰和分泌。一个或多个调控序列对编码序列或宿主来说可以是内源的。或者可以用一个或多个对核酸序列外源的调控序列代替一个或多个调控序列,用于改善编码序列在宿主细胞中的表达。
术语“调控序列”在本文中被定义为包括编码序列(如报告基因)表达必需或有利的所有组件,包括本发明的启动子。各调控序列对编码多肽的编码序列来说可以是内源的或外源的。这类调控序列包括但不仅限于前导序列、最佳翻译起始序列(如Kozak,1991,J.Biol.Chem.266:19867-19870中所述)、多腺苷酸化序列、前肽序列、信号肽序列、上游激活序列、本发明的启动子(包括其的变体、片段和杂交和串联启动子)和转录终止子。调控序列最少包括转录和翻译终止信号和本发明启动子(部分)。调控序列可以与用于引入特异限制性位点目的的接头一起提供,所述限制性位点便于连接调控序列与编码多肽的编码序列(如报告基因)的编码区。
调控序列可以是合适的转录终止子序列,即被宿主细胞识别终止转录的序列。终止子序列与编码多肽的编码序列3’末端可操作连接。任何在所选宿主细胞中有功能的终止子可用于本发明。
技术人员会理解序列的5’端和3’端根据各编码序列定义。对于给定的终止子序列和给定的编码序列而言,技术人员会知道如何将它们可操作连接在一起。
用于丝状真菌宿主细胞的优选终止子得自A.oryzae TAKA淀粉酶、A.niger葡萄糖淀粉酶、A.nidulans邻氨基苯甲酸合酶、A.niger α-葡萄糖苷酶、trpC基因和Fusarium oxysporum胰蛋白酶样蛋白酶基因。
用于酵母宿主细胞的优选终止子得自以下基因:Saccharomycescerevisiae烯醇化酶、Saccharomyces cerevisiae细胞色素C(CYC1)和Saccharomyces cerevisiae甘油醛-3-磷酸盐脱氢酶。用于酵母宿主细胞的其它有用终止子由Romanos et al,1992,上文描述。调控序列还可为合适的前导序列,即mRNA的非翻译区,其对宿主细胞翻译是重要的。前导序列与编码多肽的核酸序列5’末端可操作地连接。在所选宿主细胞中有功能的任何前导序列可用于本发明。
用于丝状真菌宿主细胞的优选前导序列得自A.oryzae TAKA淀粉酶、A.nidulans磷酸丙糖异构酶和A.niger葡萄糖淀粉酶基因。
用于酵母宿主细胞的合适前导序列来自Saccharomyces cerevisiae烯醇化酶(ENO-1)、Saccharomyces cerevisiae 3-磷酸甘油酸酯激酶、Saccharomyces cerevisiaeα-因子和Saccharomyces cerevisiae醇脱氢酶和甘油醛-3-磷酸酯脱氢酶(ADH2/GAP)基因。
调控序列还可以是聚腺苷酸化序列,所述序列与核酸序列3’末端可操作连接。用于丝状真菌宿主细胞的优选的聚腺苷酸化序列得自A.oryzaeTAKA淀粉酶、A.niger葡萄糖淀粉酶、A.nidulans邻氨基苯甲酸合酶、Fusarium oxysporum胰蛋白酶样蛋白酶和A.nidulans α-葡萄糖苷酶。
用于酵母宿主细胞的有用聚腺苷酸化序列由Guo and Sherman,1995,Molecular Cellular Biology 15:5983-5990描述。
还可期望添加调节序列,其允许多肽表达的调节与宿主细胞的生长相关。调节体系的实例为响应化学或物理刺激(包括调节化合物的存在)引起基因的表达被打开或关闭的那些。原核体系中的调节体系包括E.coli的lac和trp操纵子体系,和B.subtilis的spac、xyl、sacB和citM体系(在Meima et al.(2004)Expression Systems in Bacillus.In″Protein ExpressionTechnologies.Current status and future trends″(F.Baneyx,ed.),HorizonBioscience,Wymondham,Norfolk,UK,pp.199-252中综述)。在杆菌中中适用于调控表达的其它启动子为在营养饥饿条件下被诱导的启动子,如分别位于磷酸盐和氮调控下的Pho调节子和TnrA/GlnR体系。在酵母中可使用ADH2体系或GAL1体系。在丝状真菌中,可使用如US 5,503,991中所述的TAKA α-淀粉酶启动子、A.niger葡萄糖淀粉酶启动子、A.oryzae葡萄糖淀粉酶启动子、A.tubingensis木聚糖内切酶(xlnA)启动子、A.niger硝酸盐还原酶(niaD)启动子、Trichoderma reesei纤维二糖水解酶启动子和A.nidulans醇和醛脱氢酶(分别为alcA和aldA)作为调节序列。调节序列的其它实例为允许基因扩增的调节序列。在真核体系中,这些调节序列包括二氢叶酸还原酶基因(其在存在甲氨喋呤时被扩增)和金属硫蛋白基因(其在有重金属时被扩增)。在这些情况下,编码多肽的核酸序列应与调节序列可操作地连接。
本发明启动子DNA序列中的内源调节序列可以被去除,例如去除creA结合位点(如早先在EP 673 429B中所述的碳分解代谢物阻遏)、改变pacC和areA(用于pH和氮调节)。在B.subtilis中,碳代谢物阻遏(CCR)涉及CcpA蛋白质与cre元件的结合。cre元件与木糖诱导型的xyl启动子组合用于开发表达体系,所述表达体系允许双重调控目的基因(Bhavsar et al.(2001)Appl Environ Microbiol67:403)。
优选地,DNA构建体包含本发明的启动子DNA序列、与所述启动子DNA序列可操作连接的编码序列和翻译调控序列,如:
-选自以下序列列表的依照5’到3’方向的一种翻译终止序列:TAAG、TAGA和TAAA,优选TAAA,和/或
-选自以下序列列表的依照5’到3’方向的一种翻译起始编码序列:GCTACCCCC;GCTACCTCC;GCTACCCTC;GCTACCTTC;GCTCCCCCC;GCTCCCTCC;GCTCCCCTC;GCTCCCTTC;GCTGCCCCC;GCTGCCTCC;GCTGCCCTC;GCTGCCTTC;GCTTCCCCC;GCTTCCTCC;GCTTCCCTC;和GCTTCCTTC,优选GCT TCC TTC和/或
-选自以下序列列表的一种转录起始序列:5′-mwChkyCAAA-3′、5′-mwChkyCACA-3′或5′-mwChkyCAAG-3′,其中采用针对核苷酸的不确定编码:m(A/C);w(A/T);y(C/T);k(G/T);h(A/C/T),优选5′-CACCGTCAAA-3′或5′-CGCAGTCAAG-3′。
在本发明上下文中,术语“翻译起始编码序列”被定义为DNA编码序列开放读码框的起始子或起始密码子紧邻上游的九个核苷酸。起始子或起始密码子编码AA甲硫氨酸。起始密码子典型地为ATG,但是也可以是任何功能性起始密码子如GTG。
在本发明上下文中,术语“翻译终止序列”被定义为从开放读码框或核苷酸编码序列3’端翻译终止密码子开始的,并依照5’到3’方向的三个或四个核苷酸。
在本发明上下文中,术语“翻译起始序列”被定义为编码多肽的DNA序列开放读码框起始子或起始密码子紧邻下游的十个核苷酸。起始子或起始密码子编码甲硫氨酸这种氨基酸。起始密码子典型为ATG,但是也可以是任何功能性起始密码子,如GTG。本领域公知在RNA中尿嘧啶U代替脱氧核苷酸胸腺嘧啶T。
用于原核生物的优选调控序列已在EP 284 126A中描述。
本发明还涉及重组表达载体,其包含与报告基因可操作连接的本发明启动子和转录和翻译起始和终止信号。上述多种报告基因和调控序列可以结合在一起,产生下述重组表达载体,所述重组表达载体可包括一个或多个便利的限制性位点,所述限制性位点允许在这类位点处插入或取代启动子和/或报告基因。或者可通过例如Gene.1989 Apr 15;77(1):51-9.Ho SN,Hunt HD,Horton RM,Pullen JK,Pease LR″Site-directed mutagenesis byoverlap extension using the polymerase chain reaction″中所述的使用PCR的序列重叠延伸(SOE-PCR),或通过使用GatewayTM克隆体系(Invitrogen)克隆完成编码序列和启动子的融合。
重组表达载体可以是能够转化宿主细胞的任何载体。对载体的选择典型地会取决于载体与其被引入的宿主细胞间的相容性。载体可以是线性或闭环质粒。载体可以是整合的或自主复制的载体。
载体可以是自主复制载体(即作为染色体外实体存在时其复制不依赖于染色体复制)例如质粒、染色体外因子、微型染色体或人工染色体。自主复制载体可包含确保自主复制的任何手段。载体可以是引入宿主细胞时被整合进基因组,并与其被整合进的染色体一起复制的载体。另外,可以使用包含要引入宿主细胞基因组中全部DNA或转座子的单个载体或质粒或两个或更多的载体或质粒,或转座子。自主维持克隆载体的一个实例为包含AMA1-序列的克隆载体。AMA1为从A.nidulans分离的6.0kb基因组DNA片段,其能够在Aspergillus中自主维持(参阅例如Aleksenko andClutterbuck(1997),Fungal Genet.Biol.21:373-397)。适用于在革兰氏阳性细菌如B.subtilis和B.amyloliquefaciens中表达的自主复制载体的实例为葡萄球菌载体pUB110(McKenzie et al.(1986)Plasmid 15:93)和内源B.subtilis质粒pTA1015、pTA1040和pTA1060和来自它们的载体(例如pHB201;Bron et al.(1998)J Biotechnol 64:3)。
本发明的载体优选含有下述元件,所述元件允许载体稳定整合进宿主细胞基因组或允许载体在细胞中独立于基因组自主复制。
就整合进宿主细胞基因组而言,载体可依赖于启动子序列和/或报告基因序列或载体的任何其它元件,用于通过同源重组或非同源重组将载体稳定整合进基因组。或者载体可含有用于指导通过同源重组整合进宿主细胞基因组的额外的核酸序列。所述额外的核酸序列使得载体能够在染色体中精确的靶位点整合进宿主细胞基因组。为了提高精确位点整合的可能性,整合元件应优选含有足够数量的核酸,例如20到50个,优选55到95个,优选100到1,500个碱基对,优选400到1,500个碱基对,更优选800到1,500个碱基对并最优选至少2kb,所述核酸与宿主细胞基因组中预先确定的靶基因座的DNA序列同源。整合元件可以是与宿主细胞基因组中靶序列同源的任何序列。另外,整合元件可以是非编码或编码核酸序列。为了促进靶向的整合,克隆载体优选在转化宿主细胞之前线性化。线性化优选以下述方式进行:克隆载体的至少一端(但是优选两端)侧翼为与靶位点同源的序列。
优选地,表达载体中与靶位点同源的整合元件来自高度表达的基因座,即它们来自能够在真菌宿主细胞中高水平表达的基因。能够有高表达水平的基因(即高表达的基因)在本文中定义为下述基因,所述基因的mRNA可占据总细胞mRNA的至少0.5%(w/w)(例如在经诱导的条件下),或者,所述基因的基因产物可占据总细胞蛋白质的至少1%(w/w),或在经分泌的基因产物情况下,所述基因的基因产物可分泌至至少0.1g/l的水平(如EP 357127B1中所述)。大量优选的高表达真菌基因以实例的方式给出:淀粉酶、葡萄糖淀粉酶、醇脱氢酶、木聚糖酶、磷酸甘油醛脱氢酶或来自Aspergilli或Trichoderma的纤维二糖水解酶基因。用于这些目的的最优选的高表达基因为葡萄糖淀粉酶基因,优选A.niger葡萄糖淀粉酶基因、A.oryzae TAKA-淀粉酶基因、A.nidulans gpdA基因、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28和SEQ ID NO:29基因座,优选SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28和SEQ ID NO:29的A.niger基因座或Trichoderma reesei纤维二糖水解酶基因。
或者,载体可以通过非同源重组整合进宿主细胞基因组。
或者,和/或与上述实施方案组合,可在本发明步骤(e)中针对制造(优选分泌)目的蛋白质对细胞进行生产(筛选)后,从宿主细胞中缺失下述DNA构建体,所述DNA构建体包含与本发明启动子可操作连接的报告基因。步骤(e)稍后描述。这使得宿主细胞能够直接用于制造目的蛋白质,而所述宿主细胞不包含报告基因和/或可选择标记基因。为了能够缺失本发明的DNA构建体,DNA构建体优选包含报告基因和DNA重复之间的双向可选择标记。DNA重复允许通过内染色体同源重组缺失DNA构建体。该方法与EP 0635574所述的″MARKER-GENE FREE″方法类似。
对自主复制而言,载体可以还包含允许载体在所述宿主细胞中自主复制的复制起点。用于酵母宿主细胞的复制起点实例为2微米复制起点、ARS1、ARS4、ARS1和CEN3的组合,和ARS4和CEN6的组合。复制起点可以是具有下述突变的复制起点,所述突变使宿主细胞中复制起点的功能对于温度敏感(参阅例如Ehrlich,1978,Proceedings of the NationalAcademy of Sciences USA 75:1433)。
可将多于一个拷贝的本发明DNA构建体插入宿主细胞中。这可通过优选将数拷贝DNA序列整合进其基因组中,更优选通过将DNA序列的整合靶向高表达基因座(优选葡萄糖淀粉酶基因座或SEQ ID NO:25、SEQID NO:26、SEQ ID NO:27、SEQ ID NO:28和SEQ ID NO:29的基因座)中完成。或者这可通过在核酸序列中包含可扩增的可选择标记基因,使细胞含有经扩增的拷贝的可选择标记基因,并从而可通过例如在存在适当可选择剂时培养细胞用于选择额外拷贝的核酸序列。为了进一步提高要过表达的DNA序列的拷贝数,可使用如WO98/46772中所述的基因转换技术。
用于连接上述元件以构建本发明重组表达载体的方法为本领域技术人员公知(参阅例如Sambrook et al.,1989,上文)。
宿主细胞
本发明还涉及用上一部分定义的DNA构建体转化的重组宿主细胞,所述DNA构建体包含与报告基因可操作连接的本发明的启动子DNA序列。优选地,经转化的宿主细胞还包含包含下述DNA序列的额外的DNA构建体,所述DNA序列包含来自下述生物DNA文库的编码序列,所述生物可能能够制造一种或多种具有目的特性的蛋白质。
这类细胞可有利地用于下一部分中描述的表达克隆方法中。包含与报告基因可操作连接的本发明启动子DNA序列的表达载体被引入宿主细胞。再用包含下述DNA序列的DNA构建体或表达载体转化宿主细胞,所述DNA序列包含来自DNA文库的编码序列。如先前所述,DNA构建体或表达载体均作为染色体整合体或作为自我复制染色体外载体。宿主细胞的选择在很大程度上取决于其中制造了DNA文库的生物和/或取决于所使用的启动子DNA序列的来源。
宿主细胞可以是任何微生物。优选地,宿主细胞与制备DNA文库的宿主细胞相同,和/或与如说明书中早先定义的本发明启动子来源的宿主细胞为相同生物。根据一种优选的实施方案,宿主细胞为原核生物或真核生物。根据一种更优选的实施方案,适用于本发明方法的宿主细胞为原核生物,更优选地,在启动子部分定义为启动子来源的原核生物。更优选地,原核宿主细胞为Bacillus宿主细胞,优选地,Bacillus Subtilis、Bacilluslicheniformis和/或Bacillus amyloliquefaciens种。
根据另一更优选的实施方案,适用于本发明方法的宿主细胞为真菌。
宿主细胞可以是野生型丝状真菌宿主细胞或变体、突变体或经遗传修饰的丝状真菌宿主细胞。在本发明优选的实施方案中,宿主细胞为蛋白酶缺陷或蛋白酶负型菌株。这可以是称为“alp”的碱性蛋白酶基因被缺失的蛋白酶缺陷菌株Aspergillus oryzae JaL 125(描述于WO 97/35956或EP429490)或公开于WO 96/14404中的A.niger三肽基氨基肽酶(TRAP)缺陷菌株。另外,根据本发明也考虑WO 01/68864中描述的转录激活子(prtT)产生减少的宿主细胞。另一特别考虑的宿主菌株为Aspergillus oryzaeBECh2,其中出现在亲本菌株IF04177中的三个TAKA淀粉酶基因被灭活。另外,两个蛋白酶(碱性蛋白酶和中性金属蛋白酶11)通过基因破坏被破坏。通过突变破坏了形成代谢产物环并偶氮酸和曲酸的能力。BECh2描述于WO 00/39322并来自JaL228(描述于WO 98/12300),所述JaL228也是US 5,766,912中公开为A1560的IF04177的突变体。
任选地,丝状真菌宿主细胞与野生型细胞相比包含提高的解折叠蛋白应答(UPR)以增强目的多肽的生产能力。UPR可通过US2004/0186070A1和/或US2001/0034045A1和/或WO01/72783A2和/或WO2005/123763中描述的技术提高。更具体地,HAC1和/或IRE1和/或PTC2的蛋白质水平被调节,和/或SEC61蛋白质被设计从而获得具有提高的UPR的宿主细胞。
或者,或与提高的UPR一起,宿主细胞可通常被遗传修饰以获得下述表型,所述表型与野生型细胞相比显示更低的蛋白酶表达和/或蛋白酶分泌,从而增强目的多肽的制造能力。这类表型可通过缺失和/或修饰和/或灭活蛋白酶表达的转录调节子获得。这类转录调节子为例如prtT。通过调节prtT降低蛋白酶的表达可通过US2004/0191864A1和EP2005/055145中所述技术进行。
或者,或与提高的UPR和/或显示更低蛋白酶表达和/或蛋白酶分泌的表型一起,宿主细胞显示草酸盐缺陷表型,从而增强目的多肽的制造量。草酸盐缺陷表型可通过WO2004/070022A2和WO2000/50576中描述的技术获得。
或者,或与提高的UPR和/或显示更低蛋白酶表达和/或蛋白酶分泌和/或草酸盐缺陷的表型一起,宿主细胞显示与野生型细胞相比表型差异的组合,从而提高目的多肽的制造量。这些差异可包括,但不仅限于降低的葡萄糖淀粉酶和/或中性α-淀粉酶A和/或中性α-淀粉酶B、α-1、6转葡萄糖基酶、蛋白酶和草酸水解酶的表达。所述由宿主细胞显示的表型差异可根据US2004/0191864A1中所述技术通过遗传修饰获得。
或者,或与上述表型组合,核酸构建体通过同源重组靶向整合进入宿主细胞基因组(即整合进预先确定的靶位点)的效率优选通过宿主细胞的增强的同源重组能力提高。细胞的这类表型优选涉及WO2005/095624中描述的缺陷hdfA或hdfB基因。WO2005/095624公开了获得具有提高的靶向整合能力的丝状真菌细胞的优选方法。
更优选地,本发明的宿主细胞选自以下列表:Bacillus、酵母和丝状真菌,优选Aspergillus、Penicillium或Trichoderma种。进一步更优选Aspergillus宿主细胞为Aspergillus niger或Aspergillus sojae或Aspergillusoryzae种。
本发明还涉及重组的宿主细胞,所述宿主细胞包含多于一个本发明的启动子DNA序列,各启动子与一个报告基因可操作连接。这类宿主细胞可有利地用于下一部分种所述的表达克隆方法中。可通过多种方法转化细菌细胞,包括化学诱导的感受态(例如CaCl2)或电穿孔(Sambrook et al.(1989)″Molecular Cloning:a laboratory manual″,Cold Spring HarborLaboratories,Cold Spring Harbor,New York)、原生质体转化(Chang andCohen(1979)Mol Gen Genet 168:111)以及,在一些Bacillus种的情况下为天然感受态(Spizizen(1958)Proc Natl Acad Sci USA 44:1072)。可通过下述方法转化真菌细胞,所述方法涉及原生质体形成、原生质体转化和以本身已知的方式再生细胞壁。用于转化Aspergillus宿主细胞的合适方法描述于EP 238 023和Yelton et al.,1984,Proceedings of the National Academyof Sciences USA 81:1470-1474。使用Agrobacterium tumefaciens转化Aspergillus和其它丝状真菌宿主细胞的合适方法描述于例如Nat Biotechnol.1998 Sep;16(9):839-42.Erratum in:Nat Biotechnol 1998 Nov;16(11):1074.Agrobacterium tumefaciens-mediated transformation of filamentous fungi,deGroot MJ,Bundock P,Hooykaas PJ,Beijersbergen AG.Unilever ResearchLaboratory Vlaardingen,The Netherlands。用于转化Fusarium种的合适方法描述于Malardier et al.,1989,Gene 78:147-156和WO 96/00787。可使用Becker and Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide toYeast Genetics and Molecular Biology,Methods in Enzymology,Volume 194,pp 182-187,Academic Press,Inc.,New York;lto et al.,1983,Journal ofBacteriology 153:163;和Hinnen et al.,1978,Proceedings of the NationalAcademy of Sciences USA 75:1920中描述的方法转化酵母。原核生物的转化可如EP 284 126A中所述进行。
表达克隆方法
根据另一方面,本发明提供用于在宿主细胞中分离包含下述DNA序列的DNA序列的方法,所述DNA序列编码目的蛋白质,所述方法包含步骤:
(a)制备第一DNA构建体,其包含与赋予可选择性状的报告基因可操作连接的启动子DNA序列;当所述DNA构建体存在于宿主细胞中和当宿主细胞产生目的蛋白质(优选地,被分泌的目的蛋白质)时,所述启动子DNA序列被诱导;
(b)制备第二DNA构建体,其包含包含下述DNA序列的DNA序列,所述DNA序列编码来自下述生物DNA文库的目的蛋白质,所述生物被怀疑能够制造一种或多种目的蛋白质;
(c)用(a)和(b)中制备的两种DNA构建体转化宿主细胞;
(d)在有助于制造DNA文库中存在的目的蛋白质的条件下,培养(c)中获得的所有经转化的宿主细胞;和
(e)通过分析在(d)中制造的蛋白质,筛选制造目的蛋白质的经转化的宿主细胞。
步骤(a)
制备第一DNA构建体,其包含与赋予可选择性状的报告基因可操作连接的启动子DNA序列;当所述DNA构建体存在于宿主细胞中和当宿主细胞产生目的蛋白质(优选地,被分泌的目的蛋白质)时,所述启动子DNA序列被诱导。
第一DNA构建体中存在的启动子为当宿主细胞产生目的蛋白质(优选被分泌当目的蛋白质)时被诱导的启动子。
在本发明中,术语“被诱导的”定义为:在相同培养条件下,与相应对照宿主细胞不(过量)产生目的蛋白质时的启动子活性相比,当宿主细胞(过量)产生(优选分泌)目的蛋白质时,本发明启动子的启动子活性提高。优选地,当宿主细胞中(过量)产生(优选分泌)目的蛋白质时,与相同培养条件下其中不(过量)产生目的蛋白质的相应对照宿主细胞相比,启动子活性提高至少约1.5倍,更优选至少约两倍,更优选至少约三倍,更优选至少约四倍,更优选至少约五倍,进一步更优选至少约六倍,进一步更优选至少约八倍,进一步更优选至少约十倍,进一步更优选至少约二十倍,进一步更优选至少约50倍,以及最优选至少约100倍。更优选地,启动子活性提高是无限的,即当不(过量)产生目的蛋白质时,未检测到启动子活性或启动子是无活性的,而当(过量)产生目的蛋白质时,启动子被诱导。优选如前所述确定启动子活性。最优选使用Northern印迹通过mRNA分析确定启动子活性。
可通过将制造目的蛋白质的细胞的基因表达谱与不制造所述蛋白质的对照菌株的基因表达谱比较,鉴定这类启动子。优选地,这类表达谱使用确立的DNA微阵列分析比较。或者可使用技术人员已知的其它方法(如Northern印迹或定量PCR分析)比较表达谱。比较表达谱的最优选的方法如下进行:首先通过DNA微阵列分析比较表达谱,然后通过Northern印迹随后确证微阵列结果。根据优选的实施方案,启动子为启动子部分描述的本发明的启动子DNA序列。
根据另一优选的实施方案,当宿主细胞为Bacillus细胞时,启动子来自下列基因组DNA序列:htrA(SEQ ID NO:1)或htrB(SEQ ID NO:2)。优选启动子DNA序列来自位于起始密码子上游的这些基因组DNA序列之一的非编码部分,或为位于上游的所述基因组序列的部分。更优选所使用的启动子为SEQ ID NO:1或SEQ ID NO:2的DNA序列。
根据另一优选的实施方案,当宿主细胞为丝状真菌细胞时,启动子来自下列基因组DNA序列:SEQ ID NO:20、SEQ NO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ ID NO:24。优选地,启动子DNA序列来自位于起始密码子上游的这些基因组DNA序列之一的非编码部分,或为位于上游的所述基因组序列的部分。更优选地,所使用的启动子为SEQ IDNO:15、SEQ NO:16、SEQ ID NO:17、SEQ ID NO:18或SEQ ID NO:19的DNA序列或其衍生物。
步骤(a)中制备的第一DNA构建体已经在相应的“DNA构建体”部分中描述,优选地,其包含如“DNA构建体”部分所述赋予可选择性状的报告基因。
步骤(b)
步骤(b)中制备的DNA构建体包含包含下述DNA序列的DNA序列,所述DNA序列编码来自下述生物DNA文库的目的蛋白质,所述生物被怀疑能够制造一种或多种目的蛋白质;可能制造一种或多种目的蛋白质的生物为原核生物或真核生物。优选的原核生物和真核生物的实例早先已在说明书中与本发明启动子的来源一起定义。根据另一优选的实施方案,该生物为Bacillus,更优选地,在启动子部分定义的Bacillus物种。根据另一优选的实施方案,该生物为真核生物,更优选为真菌,其中最优选丝状真菌。
在步骤(b)中制备的DNA构建体,优选包含如“DNA构建体”和“调控元件”部分中定义的调节序列。
在根据本发明的方法中,来自可能制造一种或多种目的蛋白质的DNA片段文库可以是基因组文库或cDNA文库。然而,在真核供体的情况下,优选使用cDNA文库以避免真菌宿主生物中启动子或剪接信号识别的问题。优选从分离自来源生物的mRNA中制备cDNA文库,所述来源生物在有助于目的蛋白质表达的条件下生长。
如果存在在宿主细胞表达蛋白质后可用于检测所述蛋白质的测定法,那么根据本发明的方法可应用于分离编码任何目的蛋白质或多肽的DNA序列。
步骤(c)
要用两种DNA构建体转化的宿主细胞的身份已描述于“宿主细胞”部分中。转化方法已在相同部分中描述。根据一个实施方案,用(a)和(b)中制备的构建体同时转化宿主细胞。或者,并根据另一实施方案,先用步骤(a)制备的DNA构建体转化宿主细胞,然后用用步骤(b)制备的DNA构建体转化宿主细胞。
根据优选的实施方案,宿主细胞为原核生物,优选Bacillus细胞,更优选为Bacillus subtilis,进一步更优选为htrA基因缺陷的Bacillus subtilis(其中htrA基因的至少部分编码区被缺失和/或取代和/或其中htrA基因的编码区仍然存在于所述Bacillus细胞的基因组中),最优选使用Bacillussubtilis BV2003(Hyyrylainen et al.(2001)MoI Microbiol 41:1159)。
或者,或与先前优选的实施方案结合,宿主细胞为Bacillus细胞,且报告基因编码如DNA构建体部分定义的荧光报告蛋白,最优选GFP。
或者,或与先前优选的实施方案结合,当宿主细胞为Bacillus细胞时,启动子来自以下列表所述基因组DNA序列:htrA(SEQ ID NO:1)或htrB(SEQ ID NO:2)。优选地,启动子DNA序列来自位于起始密码子上游的这两个基因组DNA序列之一的非编码部分,或为位于上游的所述序列的部分。更优选地,所使用的启动子为来自SEQ ID NO:1或SEQ ID NO:2的启动子。根据最优选的实施方案,所使用的启动子和所使用的报告基因为与SEQ ID NO:1可操作连接的GFP,或与SEQ ID NO:2可操作连接的GFP。
根据另一优选的实施方案,所述生物为真核生物,更优选真菌,其中最优选丝状真菌。优选丝状真菌为Aspergillus、Penicillium或Trichoderma种。进一步更优选Aspergillus宿主细胞为Aspergillus niger或Aspergillussojae或Aspergillus oryzae种。最优选的宿主细胞为A.niger,优选CBS513.88或其衍生物。
或者,或与先前优选的实施方案结合,宿主细胞为丝状真菌细胞,报告基因编码如DNA构建体部分所定义的荧光报告蛋白,最优选GFP。或者报告基因编码可选择标记。更优选地,报告基因为荧光蛋白和可选择标记物的杂交报告基因。最优选杂交报告基因包含GFP和Streptoalloteichushindustanis的腐草霉素抗性基因(BLE)(Drocourt etal.,NAR,1990)。
或者,或与先前优选的实施方案结合,当宿主细胞为丝状真菌细胞时,启动子来自以下列表中存在的基因组DNA序列:SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ ID NO:24。优选启动子序列来自位于起始密码子上游的所列基因组DNA序列之一的非编码部分,或为位于上游的部分所述序列。更优选地,所使用的启动子为实施例3到7中所使用的启动子之一,并来自SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ ID NO:24。根据最优选的实施方案,所使用的启动子和所用的杂交报告基因为与启动子SEQ ID NO:15可操作连接的GFP-BLE(SEQ ID NO:61)、与启动子SEQ ID NO:16可操作连接的GFP-BLE、与SEQ ID NO:17可操作连接的GFP-BLE、与启动子SEQ ID NO:18可操作连接的GFP-BLE或与启动子SEQ ID NO:19可操作连接的GFP-BLE。
步骤(d)
用两种DNA构建体转化宿主细胞后,在有助于制造DNA文库中存在的目的蛋白质的条件下,培养所有获得的经转化的宿主细胞。根据检测目的蛋白质所需的测试法,将经转化的克隆传代并储存为固体培养基(例如琼脂平板)上或液体培养基中的菌落,由此在微孔滴定板的孔中培养、储存和/或测试个体文库克隆。
技术人员会理解通常对本领域已知克隆方法的适应可同样应用于本发明的方法中。所述适应包括但不仅限于例如筛选文库克隆池、筛选相同文库得到大量不同的目的蛋白质,以及再筛选、再分离和再克隆阳性克隆以确保更精确的结果。
技术人员可获得多种方法用于从筛选方法中鉴定为经转化的宿主细胞中分离编码目的蛋白质的DNA序列,和用于随后分析所分离的DNA序列。
步骤(e)
在步骤(d)之后,通过分析制造的蛋白质筛选经转化的宿主细胞用于制造目的蛋白质,优选地,分泌目的蛋白质。在步骤(e)中,通过监测由第一DNA构建体中存在的启动子DNA序列诱导的依赖于制造(优选依赖于分泌)的报告子表达,筛选制造(优选分泌)目的蛋白质的经转化的宿主细胞。
根据优选的实施方案,当宿主细胞为Bacillus细胞时,优选使用基于荧光的细胞分析测定法(例如荧光激活的细胞扫描、荧光激活的细胞分选(FACS)或荧光分析)进行筛选,以鉴定制造(优选分泌)目的蛋白质的经转化的宿主细胞,所述筛选通过监测由第一DNA构建体中存在的启动子DNA序列诱导的依赖于制造(优选地,依赖于分泌)的报告子表达。更优选宿主细胞为包含第一DNA构建体的Bacillus细胞,所述DNA构建体包含如SEQ ID NO:1或其衍生物或SEQ ID NO:2或其衍生物的启动子,所述DNA构建体还包含编码荧光报告子的报告基因,并且筛选使用基于荧光的细胞分析测定法进行。进一步更优选地,宿主细胞为Bacillus且第一DNA构建体包含:
-与GFP可操作连接的启动子DNA序列SEQ ID NO:1或其衍生物,或
-与GFP可操作连接的启动子DNA序列SEQ ID NO:2或其衍生物
且筛选使用FACS进行。或者,或与先前的实施方案结合,筛选可使用例如比色测定法或使用选择性培养条件进行。技术人员会理解,根据所使用的报告基因,选择性培养条件是但不仅限于:杀生物剂的使用、抗生素的使用、至少一种营养、原养型。
根据另一优选的实施方案,当宿主细胞为丝状真菌细胞时,优选通过在选择性培养条件下进行筛选,以鉴定制造(优选分泌)目的蛋白质的经转化的宿主细胞,所述筛选通过监测由本发明第一DNA构建体中存在的启动子DNA序列诱导的依赖于制造(优选依赖于分泌)的报告子表达。技术人员会理解基于所使用的报告基因,可相应选择选择性培养条件。选择性培养条件的实例是但不仅限于:使用杀生物剂、使用抗生素、至少一种营养、原养型。或者,或与先前实施方案结合,筛选可使用比色、荧光的(如FACS)或基于酶活性的测定法进行。根据更优选的实施方案,宿主细胞为包含本发明第一DNA构建体的丝状真菌细胞,且筛选使用选择性培养条件进行。更优选地,宿主细胞为包含本发明第一DNA构建体的丝状真菌细胞时,所述DNA构建体包含选自下列的启动子:SEQ IDNO:15或其衍生物、SEQ ID NO:16或其衍生物、SEQ ID NO:17或其衍生物、SEQ ID NO:18或其衍生物、SEQ ID NO:19或其衍生物,所述DNA构建体还包含编码可选择标记的报告基因,且筛选使用选择性培养条件进行。进一步更优选地,宿主细胞为包含本发明第一DNA构建体的丝状真菌细胞,所述DNA构建体包含选自下列的启动子:SEQ ID NO:15或其衍生物、SEQ ID NO:16或其衍生物、SEQ ID NO:17或其衍生物、SEQ IDNO:18或其衍生物、SEQ ID NO:19或其衍生物,所述DNA构建体还包含杂交报告基因如SEQ ID NO:61,且筛选使用选择性培养条件进行。
根据另一更优选的实施方案,宿主细胞为包含本发明第一DNA构建体的A.niger细胞,且筛选使用选择性培养条件进行。更优选地,宿主细胞为包含本发明第一DNA构建体的A.niger细胞,所述DNA构建体包含选自下列的启动子:SEQ ID NO:15或其衍生物、SEQ ID NO:16或其衍生物、SEQ ID NO:17或其衍生物、SEQ ID NO:18或其衍生物、SEQ IDNO:19或其衍生物,所述DNA构建体还包含编码可选择标记的报告子基因,且筛选使用选择性培养条件进行。进一步更优选地,宿主细胞为包含本发明第一DNA构建体的A.niger细胞,所述DNA构建体包含选自下列的启动子:SEQ ID NO:15或其衍生物、SEQ ID NO:16或其衍生物、SEQID NO:17或其衍生物、SEQ ID NO:18或其衍生物、SEQ ID NO:19或其衍生物,所述DNA构建体还包含杂交报告基因如SEQ ID NO:61,且筛选使用选择性培养条件进行。进一步更优选地,宿主细胞为A.niger细胞且第一DNA构建体包含:
-与启动子SEQ ID NO:15可操作连接的杂交报告基因GFP-BLE(SEQID NO:61),或
-与启动子SEQ ID NO:16或其衍生物可操作连接的GFP-BLE,或
-与启动子SEQ ID NO:17或其衍生物可操作连接的GFP-BLE,或
-与启动子SEQ ID NO:18或其衍生物可操作连接的GFP-BLE,或
-与启动子SEQ ID NO:19或其衍生物可操作连接的GFP-BLE,且筛选使用包含抗生素(优选腐草霉素)作为选择剂的选择性培养条件进行。
通过如上所述本发明的筛选方法分离的DNA序列用于制造目的蛋白质或改善目的蛋白质的制造,所述目的蛋白质由DNA序列编码。有利地,在上述筛选方法中分离的经转化的宿主细胞直接用于制造目的蛋白质的方法中,所述方法通过在有助于制造(优选分泌)目的蛋白质的条件下培养经转化的宿主细胞并可选地回收蛋白质。
根据一种优选的实施方案,宿主细胞能够直接用于制造目的蛋白质,所述宿主细胞不包含报告基因和/或可选择标记基因。因此,在细胞已被筛选用于制造(优选分泌)目的蛋白质后,从宿主细胞中缺失包含与本发明启动子可操作连接的报告基因的DNA构建体。为了能够缺失本发明的DNA构建体,所述DNA构建体优选在DNA重复之间包含报告基因和双向可选择标记基因。DNA重复允许通过内染色体同源重组缺失DNA构建体。该方法与EP 0 635 574B1所述的″MARKER-GENE FREE″方法类似。
在本发明筛选方法中分离的最初经转化的宿主细胞通常会具有足够用于筛选目的,但是可为经济制造目的显著改善的表达水平。为此,将DNA序列插入表达载体中,其随后用于转化合适的宿主细胞。在该表达载体中,DNA序列与适当的表达信号(如启动子、可选的信号序列和终止子)可操作连接,如“DNA构建体”和“调控元件”部分中所定义,所述表达信号能够指导蛋白质在宿主生物中的表达。用于制造蛋白质的合适宿主细胞可以是原核或真核细胞,优选真细菌、酵母或丝状真菌。优选的细菌宿主细胞选自如启动子部分定义的Bacillus属。根据另一优选的实施方案,宿主细胞为已在“宿主细胞”部分中定义的酵母或丝状真菌。优选的酵母宿主细胞选自Saccharomyces、Kluyveromyces、Yarrowia、Pichia和Hansenula属。优选的丝状真菌宿主细胞选自在上文列为用于筛选方法的优选宿主细胞的相同属。更优选地,丝状真菌为Aspergillus、Penicillium或Trichoderma种。进一步更优选地,Aspergillus宿主细胞为Aspergillusniger或Aspergillus sojae或Aspergillus oryzae种。最优选的宿主细胞为A.niger,优选CBS513.88或其衍生物。
通过技术人员可获得的多种流程中的任何流程,用表达载体转化合适的宿主细胞。然后将经转化的宿主细胞用于下述方法,所述方法通过在有助于表达编码蛋白质的DNA序列的条件下培养经转化的宿主细胞来制造目的蛋白质,并可选地回收蛋白质。
优选目的蛋白质为酶。
因此,本发明涉及本发明启动子在表达克隆方法中的用途。
本发明还涉及本发明启动子的其它用途。优选地,本发明启动子可DNA构建体或表达载体(均在前一部分中定义)中与任何编码序列可操作连接。这类DNA构建体或表达载体可被引入在“宿主细胞”部分中定义的任何宿主细胞中,并用于表达给定的有价值化合物。这类有价值化合物的实例为,但不仅限于代谢物或多肽。优选地,与本发明启动子可操作连接的编码序列编码有价值的化合物。或者,并根据本发明另一优选的实施方案,与本发明启动子可操作连接的编码序列涉及有价值化合物的制造。
或者,并根据本发明启动子另一优选的用途,本发明的启动子被整合进灭活或取代构建体中,转化进给定宿主细胞中,并用于灭活或取代靶基因。
本发明由以下实施例进一步说明。
实施例
材料和方法
一般程序
标准分子克隆技术,如DNA分离、凝胶电泳、核酸的限制性酶修饰、Northern分析、E.coli转化等,如Sambrook et al.(2001)″MolecularCloning:a laboratory manual,3d edition″,Cold Spring Harbor Laboratories,Cold Spring Harbor,New York and lnnis et al.(1990)″PCR protocols,a guideto methods and applications″Academic Press,San Diego所述进行。合成的寡脱氧核苷酸得自Invitrogen(Breda,The Netherlands)。室温为20℃±2℃。
Aspergillus niger转化
A.niger转化根据Tilburn,J.et al.(1983)Gene 26,205-221和Kelly,J.&Hynes,M.(1985)EMBO J.,4,475-479所述方法进行,其中采用以下改变:
使孢子发芽并在置于300rpm摇床中的摇瓶中Aspergillus最小培养基(100ml)中在30℃下培养16小时。每升Aspergillus最小培养基含有:6gNaNO3、0.52g KCl、1.52g KH2PO4、1.12ml 4M KOH、0.52gMgSO4.7H2O、10g葡萄糖、1g酪蛋白氨基酸、22mg ZnSO4.7H2O、11mg H3BO3、5mg FeSO4.7H2O、1.7mg CoCl2.6H2O、1.6mg CuSO4.5H2O、5mg MnCl2.2H2O、1.5mg Na2MoO4.2H2O、50mg EDTA、2mg核黄素、2mg硫胺-HCl、2mg烟酰胺、1mg吡哆醇-HCL、0.2mg panthotenic acid、4g生物素、10ml青霉素(5000IU/ml)链霉素(5000UG/ml)溶液(Gibco)。
-用Novozym 234TM(Novo Industries)代替解螺旋酶用于制备原生质体;
-形成原生质体后(60-90分钟),加入KC缓冲液(0.8M KCl、9.5mM柠檬酸,pH 6.2)至45ml的终体积,在浮桶式转头离心机中在4℃下3000rpm将原生质体悬浮液离心10分钟。原生质体重悬于20ml KC缓冲液中并随后加入25ml STC缓冲液(1.2M山梨糖、10mM Tris-HCI pH7.5,50mM CaCl2)。在浮桶式转头离心机中在4℃下3000rpm将原生质体悬浮液离心10分钟,在STC缓冲液中洗涤并在STC缓冲液中重悬为10E8原生质体/ml的浓度;
-向200微升原生质体悬浮液中加入溶解在10微升TE缓冲液(10mMTris-HCI pH 7.5,0.1mM EDTA)和100微升PEG溶液(20%PEG 4000(Merck),0.8M山梨醇,10mM Tris-HCl pH 7.5,50mM CaCl2)中的DNA片段;
-在室温下将DNA-原生质体悬浮液孵育10分钟后,缓慢加入1.5mlPEG溶液(60%PEG 4000(Merck),10mM Tris-HCl pH 7.5,50mM CaCl2)并重复混匀管。在室温下孵育20分钟后,用5ml 1.2M山梨醇稀释悬浮液,颠倒混匀并在室温下4000rpm离心10分钟。将原生质体柔和地重悬于1ml 1.2M山梨醇中并涂布在固体选择性培养基上,所述培养基由不含核黄素、硫胺-HCl、烟酰胺、吡哆醇、panthotenic acid、生物素、酪蛋白氨基酸和葡萄糖的Aspergillus最小培养基组成。对乙酰胺选择而言,培养基含有10mM乙酰胺作为唯一氮源和1M蔗糖作为渗压剂和C源。或者将原生质体涂布于添加有1-50微克/ml腐草霉素和1M蔗糖作为渗压剂的PDA(马铃薯葡萄糖琼脂,Oxoid)上。使用20%琼脂(琼脂No.1,OxoidL1 1)固化再生平板。在30℃下孵育6-10天后,将转化体的分生孢子转移至由含2%葡萄糖和1.5%琼脂糖(Invitrogen)的Aspergillus选择性培养基(在乙酰胺选择的情况下含有乙酰胺作为唯一氮源,或在腐草霉素选择情况下为添加了1-50微克/ml腐草霉素的PDA)上,并在30℃下孵育5-10天。分离单个转化体,并重复一次该选择性纯化步骤,藉此储存经纯化的转化体。
Aspergillus niger微量滴定板发酵和取样
为了获得A.niger的孢子,将菌丝体转移至根据供应商说明制备的填充有150微升固体PDA培养基(马铃薯葡萄糖琼脂,Oxoid)的微量滴定板上。在30℃(静止)生长3-7天后形成孢子。然后向各孔中添加100微升液体发酵培养基(70g/l葡萄糖.H2O、25g/l蛋白胨(来自酪蛋白)、12.5g/l酵母提取物(Difco)、2g/l K2SO4、1g/l KH2PO4、0.5g/lMgSO4.7H2O、0.03g/l ZnCL2、0.02g/l CaCL2、9mg/l MnSO4-H2O、3mg/lFeSO4.7H2O,用4N H2SO4调至pH 5.6)。上下吸打液体培养基20次以分离培养基中的孢子。将接种过的发酵培养基转移至另一微量滴定板并在34℃、550rpm和80%湿度下在轨道微量滴定板摇床(Infors HT)上孵育6天。在第6天收集上清液并用于检测所分泌的蛋白质。
质谱法分析
将上清液通过离心力在Ultracel滤板(Millipore,Billerica,MA,USA)上超滤。超滤根据制造商提供的流程进行。向经超滤的上清液中添加10微升200mM的碳酸氢铵,pH7.8(Riedel-de Haen AG,Seelze,Germany)和1微升250微克每ml的胰蛋白酶(Worthington,Lakewood,NJ,USA)。将上清液在37℃消化3小时。经消化的上清液以1∶1的比例与10毫克每ml的经再结晶的α-氰-4-羟基苯丙烯酸(?CHCA)(Laser Bio Labs,Sophia-AntipolisCedex,France)溶液混合;从这些混合物中将1微升点在MALDI靶标上。在vMALDI LTQ质谱仪(Thermo electron,Orlando,FL,USA)上用MALDIMS和MALDI MS/MS分析被点的样品。
所获得的MS/MS谱被转化为肽序列,与在预先推定的FASTA蛋白质数据库中可获得的蛋白质序列比较,以鉴定个体酶。
RNA分离
收集在培养皿中20ml液体选择性再生培养基(6g/l NaNO3,0.52g/lKCl,1.52g/l KH2PO4,0.25g/l KOH,0.52g/l MgSO4.7H2O,22mg/lZnSO4.7H2O,11mg/l H3BO3,5mg/l FeSO4.7H2O,1.7mg/l CoCl2.6H2O,1.6mg/l CuSO4.5H2O,5mg/l MnCl2.2H2O,1.5mg/l Na2MoO4.2H2O,50mg/lEDTA,341g/l蔗糖,10ml青霉素(5000lU/ml)链霉素(5000UG/ml)溶液(Gibco))上形成的Aspergillus niger菌丝体,用软化水洗涤并在纸巾之间挤压去除多余的水。立刻将菌丝体在液氮中冷冻,并用研钵和研杵研磨成精细的粉末。将产生的粉末转移至无菌的50ml管中并称量,藉此对酶1-1.2g被研磨的菌丝体加入10ml TRIzol试剂(Invitrogen)(每管最多25ml)。立刻通过充分混合(涡旋1分钟)增溶菌丝体粉末,然后室温孵育5分钟并随机搅拌。添加0.2(最初TRIzol)体积的氯仿(从而对每10ml最初使用的TRIzol添加2ml氯仿),涡旋并在室温下放置10分钟。然后将混合物在4℃,6000g离心30分钟。将上部水相转移至新管中并通过添加0.5(最初TRIzol)体积的100%异丙醇(从而每10ml最初使用的TRIzol添加5ml异丙醇)沉淀总RNA。在室温下沉淀10分钟后,通过在6000g离心30分钟回收RNA。去除上清液后,将RNA沉淀块用一倍(原始TRIzol)体积的70%乙醇洗涤。去除乙醇后,将RNA沉淀块晾干。干燥的RNA沉淀块溶于3ml GTS(100mM Tris-Cl,pH 7.5,4M硫氰酸胍,0.5%十二烷基肌氨酸钠)缓冲液。根据供应商手册使用Rneasy Maxi试剂盒(Qiagen)额外纯化RNA。使用10微升RNA溶液确定核酸的量和浓度。
Aspergillus niger菌株
A.niger WT-1:该A.niger菌株为包含编码葡萄糖淀粉酶(glaA)、真菌淀粉酶和酸性淀粉酶的基因缺失的CBS513.88。A.niger WT-1使用如EP 0635574B1所述的″MARKER-GENE FREE″途径构建。该专利中广泛描述了如何缺失CBS 513.88基因组中的glaA特异DNA序列。第一个步骤得到了MARKER-GENE FREE?glaA重组A.niger CBS 513.88菌株,其最终完全不具有任何外源DNA序列。然后通过EP 0 635 574B1中所述方法从A.niger WT-1基因组中缺失编码真菌淀粉酶和酸性淀粉酶的基因。
如图7到9和11到14所描绘的用于克隆目的构建体的载体含有先前在WO 99/32617中描述的主链特征。
A.niger WT-GFP:该A.niger菌株通过用图7所描述的表达载体pGBFINGFP-2转化A.niger WT-1获得,所述载体含有由葡萄糖淀粉酶启动子驱动的编码公知绿色荧光蛋白(GFP)的基因(Chalfie,M et al.,Science(1994)263(5148):802-805)。在选择性培养基上纯化后,基于PCR分析选择单拷贝整合体。
A.niger WT-PHY:该A.niger菌株通过用图8所描述的表达载体pGBFIN-32转化A.niger WT-1获得,所述载体包含由葡萄糖淀粉酶启动子驱动的植酸酶基因PHY(与先前在WO 99/32617中描述的FytA相同)。在选择性培养基上纯化后,基于PCR分析选择单拷贝整合体。
A.niger WT-PHY-2:该A.niger菌株通过用图8所描述的表达载体pGBFIN-32转化A.niger WT-1获得,所述载体包含由葡萄糖淀粉酶启动子驱动的植酸酶基因PHY(与先前在WO 99/32617中描述的FytA相同)。在选择性培养基上纯化后,基于PCR分析选择单拷贝整合体。
A.niger WT-载体:该A.niger菌株通过用图9所描述的空对照载体pGBFIN-40转化A.niger WT-1菌株获得。空对照载体pGBFIN-40通过Xhol消化图8中所描述的pGBFIN-32并将最大片段重新连接,从而去除葡萄糖淀粉酶启动子和植酸酶基因PHY的5’部分构建。通过PCR分析选择单拷贝整合体。
实施例1构建Bacillus报告质粒和报告菌株
1.1构建报告质粒pPhtrA-gfp-amyE和pPhtrB-gfp-amyE
首先,如下构建报告质粒pPhtrA-gfp-amyE。使用pSG1151(P.J.Lewisand A.L.Marston,1999;GFP vectors for controlled expression and duallabelling of protein fusions in Bacillus subtilis,Gene 227,101.)作为模板DNA,用以下引物:RN-lacZ-rv(SEQ ID NO:3),GTGAGCGGATAACAATTTCACACAGG;和 gfp-terminator-rv,(SEQ IDNO: 4)GTGGCTCAGCTTTTTTAAGGAAGGGAGGCTCTCACCTCCCTTCCCTTTATTTGTAGAGC TCATCCATGCC,通过PCR扩增编码最佳化版本GFP——gfpmut-1的基因(P.Cormack,R.H.Valdivia,and S.Falkow,1996;FACS-optimized mutants of the green fluorescent protein(GFP),Gene 173,33.),其中所述引物分别得到gfpmut-1上游和下游的KpnI和Bpu1101I位点(黑体)。使用KpnI和Bpu1101I位点将913bp PCR产物连接在下述pDL中,得到pGFP-amyE,所述pDL包含用于位点特异重组的amyE基因座的同源侧翼区(G.Yuan and S.L.Wong,1995;Regulation of groEexpression in Bacillus subtilis:the involvement of the sigma A-like promoterand the roles of the inverted repeat sequence(CIRCE),J.Bacteriol.177,5427)。使用B.subtilis 168(Bacillus Genetic Stock Center ID:1 A1)的染色体DNA作为模板DNA,通过PCR扩增htrA的启动子(PhtrA)(SEQ ID NO:1)。所使用的引物为分别引入KpnI和HindIII位点(黑体)的PhtrA-fw,(SEQ ID NO:5)CGTGAGGTACCGGCTTCTGTTTCTGCC;和Phtr-rv,(SEQ ID NO:6)CATCACGAAGCTTATCCATCATGTTCACTCCG。用Kpn1和Hind3消化后,将531bp PCR产物连接进pGFP-amyE中gfp基因上游,得到报告质粒pPhtrA-gfp-amyE。该质粒的图谱描绘于图1中。质粒pPhtrB-gfp-AmyE以如上所述类似的方法构建。用于扩增htrB启动子(PhtrB)(SEQ ID NO 2)的引物为PhtrB-fw(SEQ ID NO 7)GACCGGTACCTCAGGATCTTTCGCC和PhtrA-rv(SEQ ID NO 8)GGCCATCAAGCTTATAATCCATGTTCTTACACTCC。
1.2构建Bacillus报告菌株VT210A和VT210B
将得到的质粒pPhtrA-gfp-amyE和pPhtrB-gfp-amyE引入DaprE、DnprE双突变体B.subtilis DB104中(F.Kawamura and R.H.Doi,1984;Construction of a Bacillus subtilis double mutant deficient in extra cellularalkaline and neutral proteases,J.Bacteriol.160,442)。通过对染色体DNA的PCR检查氯霉素抗性转化体通过amyE基因座上双交换的位点特异性整合。为了降低HtrA对PhtrA的负反馈调节(D.Noone,A.Howell,R.Collery,and K.M.Devine,2001;YkdA and YvtA,HtrA-like serine proteases in Bacillussubtilis,engage in negative auto regulation and reciprocal cross-regulation ofykdA and yvtA gene expression,J.Bacteriol.183,654),用B.subtilisBV2003的染色体DNA转化新菌株,所述B.subtilis BV2003具有通过pMutin2整合被破坏的htrA基因(H.L.Hyyrylainen,A.Bolhuis,E.Darmon,L.Muukkonen,P.Koski,M.Vitikainen,M.Sarvas,Z.Pragai,S.Bron,J.M.van Dij1,and V.P.Kontinen,2001;A novel two-component regulatory system in Bacillussubtilis for the survival of severe secretion stress,Mol.Microbiol.41,1159)。选择红霉素抗性的转化体并通过对染色体DNA的PCR检查htrA破坏。获得的菌株命名为VT200A和VT200B。
为了提高VT200A菌株的转化效率,设计了BsuMR破坏构建体。BsuMR体系通过由三个基因:ydiR、ydiS和ydiA组成的操纵子形成,其中各基因对BsuMR功能是必须的(P.J.Lewis and A.L.Marston,1999;GFPvectors for controlled expression and dual labeling of protein fusions in Bacillussubtilis,Gene 227,101)。使用以下引物和B.subtilis染色体DNA作为模板扩增756bp的ydiR区——侧翼区1(flr1):flrBsul F,(SEQ ID NO 9)GAAAGATTGTTTCAGAAGCC;和flrBsuR,(SEQ ID NO10)ACAGCGTTGGGATCCAAGCCCTTCCATTTTGGACATTTGG。使用pDG1726(A.M.Guerout-Fleury,K.Shazand,N.Frandsen,and P.Stragier,1995;Antibiotic-resistance cassettes for Bacillus subtilis,Gene 167,335)作为模板DNA和以下引物扩增壮观霉素抗性标记:specBsu-F,(SEQ ID NO11)GGGCTTGGATCCCAACGCTGTCGACGTTGTAAAACGACGG;和specBsu-R, (SEQ ID NO12)CGCATAGCTTTCCGGTCGCCGCAGCTATGACCATGATTACGC。1319bp PCR产物和flrBsu1片段用于第二轮PCR,其中由引物flrBsu1-R和specBsu-F(黑体)引入的其同源末端重组后,两个片段作为一个模板作用。使用引物flrBsu1-F和specBsu-R获得2075bp PCR片段flr1-specr,其被亚克隆进pCR-XL-TOPO(Invitrogen)中得到pCT-XL-TOPO-flr1-spec。覆盖ydiS(编码DNA内切核酸酶)的3’末端和相邻ydjA(未知功能)大部分的739bp区域——侧翼区2,使用引物flrBsu2-F,(SEQ ID NO 13)GATGATTCGTCTTTTTGTAGTG;和引物flrBsu2-R,(SEQ ID NO 14)CGATCAACATATGTGTTCACG和B.subtilis的染色体DNA作为模板扩增。将PCR产物克隆进pCR-XL-TOPO中得到pCR-XL-TOPO-flr2。利用pCR-XL-TOPO载体的多克隆位点,使用XhoI和NsiI将flr1-specr从pCR-XL-TOPO-flr1上限制性酶切下并连接进用XhoI和Pstl(与NsiI匹配)消化的pCR-XL-TOPO-flr2中。这引起构建体pTOPO-flr1-specr-flr2的删除,其被引入菌株VT200A。通过对染色体DNA的PCR检查壮观霉素抗性转化体的ydiS缺失。获得的最终报告菌株称为VT210A和VT210B并用于进一步的实验,构建这些菌株的一般性概括描绘于图2中。
1.3构建表达载体pUBnpr2和pUBBAG:
质粒pUB110的构建及其序列之前已被描述过(McKenzie T.,HoshinoT.,and Sueoka,N.1986.The nucleotide sequence of pUB110;some salientfeatures in relation to replication and its regulation.Plasmid 15:93-103)。将Bacillus amyloliquefaciens a-淀粉酶基因amyQ(Genbank登录号J 01542)克隆进pUB110,得到如先前所述的质粒pKTH10(Palva,I.1982.Molecularcloning of the alpha-amylase gene of Bacillus amyloliquefaciens and itsexpression in B.subtilis.Gene 19:81-87)。
将均来自Bacillus amyloliquefaciens的中性蛋白酶基因npr(Genbank登录号K 02497)和β-葡聚糖酶基因bag(Genbank登录号M15674)克隆进载体pUB110的过程实质上根据用于克隆amyQ的方法进行,得到如图3和图4所描绘的质粒pUBnpr2和pUBBAG。
1.4将表达构建体pKTHIO、pUBnpr2和pUBBAG转化进Bacillus报告菌株VT210A中:
Bacillus subtilis菌株VT210A的转化实际上如先前所述利用该生物的天然感受态进行(Anagnostopoulos,C.and Spizizen,J.1961.Requirements fortransformation in Bacillus subtilis.J.Bacteriology 81:741-746)。DNA孵育后,将细胞涂布于2 x TY琼脂上,其含有0.1%淀粉和作为转化选择剂的抗生素卡那霉素(20μg/ml)。将板在37℃孵育过夜。当转化涉及质粒pKTH10时,用鲁戈溶液(lugol solution)覆盖菌落以检测分泌淀粉酶的细胞。
实施例2通过荧光激活的细胞测定法分析分泌胁迫的细胞
2.1通过荧光激活的细胞分选选择分泌胁迫的细胞:
以1∶20的比例使用质粒pUB110(空对照载体)和pKTH10(编码Bacillus amyloliquefaciens a-淀粉酶基因amyQ)共转化Bacillus subtilis菌株VT210A。将一部分细胞涂布于选择性TY琼脂平板上,向另一部分中添加含卡那霉素的2 x TY培养基,并将细胞孵育过夜。同样用与共转化相同的操作转化分离的质粒。第二天,在FACS型流式细胞仪(Mo-FIo ofDakocytomation)上由熟练操作者GFP荧光分析培养物。使用80mWatt和488nm的蓝色激光。典型的FACS实验包含对20.000个事件(细胞)的分析。首先单独分析(图5A和5B)和作为混合(图5C)分析VT210A,pUB110(无分泌胁迫)和VT210A,pKTH10(由于过量生产α-淀粉酶AmyQ的分泌胁迫)细胞的荧光信号。在这些结果的基础上手动设置细胞分界限(图5D中的虚线),使得显示高于细胞分选界限的GFP荧光的细胞被分选。将共转化培养物应用于流式细胞仪并在管中收集被分选的细胞。为了验证经分选的荧光群体已经富集了分泌α-淀粉酶的细胞,将被收集的细胞的不同稀释液涂布在含淀粉的选择性琼脂上。对未经FACS分选的最初的过夜输入培养物进行相同处理。培养后用鲁戈溶液覆盖菌落,使α-淀粉酶活性引起的卤素形成显影。图表1所示,约90%的经分选的细胞的确分泌α-淀粉酶,而输入培养物中仅0.5%-0.7%的细胞分泌α-淀粉酶。该结果清除地说明了有力的本发明选择工具,其通过使用正常细胞和分泌胁迫细胞之间的荧光信号辨别来分离分泌蛋白质的细胞。
表1:流式细胞术后富集形成amy+菌落的单位。
2.2通过荧光细胞扫描选择分泌胁迫的细胞:
将质粒pUB110(空对照载体)和pKTH10(编码Bacillusamyloliquefaciens a-淀粉酶基因amyQ)单独地转化进Bacillus subtilis菌株VT210B中。将一部分细胞涂布于选择性TY琼脂平板上,向另一部分中添加含卡那霉素的2 x TY培养基,并将细胞孵育过夜。在流式细胞仪(Coulter Epics XL-MCL,Beckman Coulter)上由熟练操作者分析培养物。典型的实验包含20.000事件(细胞)的分析。使用FITC滤器并将光电倍增管电压设为700和800伏特之间检测荧光信号。正常细胞和受到分泌胁迫的细胞间的荧光信号差异描绘于图6中。
2.3使用荧光计选择分泌胁迫的VT21OA细胞
经转化的报告菌株细胞在存在卡那霉素的2 x TY培养基中孵育并在37℃过夜培养。用于转化质粒pUB110、pKTH10、pUBnpr2和pUBBAG的DNA数量相等。生长至稳定期后,将四种转化的培养细胞以96孔微量滴定板的形式等体积分为8份。孔在荧光计中分析荧光(MolecularDevices,type Spectra MAX Gemini)。刺激在490nm,发射在510nm和截断在495nm。表2说明通过清晰显著(P two-tail<0.05)的荧光信号差异而将非胁迫的细胞(pUB110)从胁迫的细胞(pKTH10、pUBnpr2和pUBBAG)中区别出来。
pUB 110细胞 | 比值 | |
pKTH10细胞 | P=1,05899E-13 | 7,84 |
pUBnpr2细胞 | P=4,63415E-11 | 1,58 |
pUBBAG细胞 | P=7,17216E-14 | 1,77 |
表2.假定不等方差的t检验。给定空宿主细胞(pUB110)对分泌胁迫(pKTH10、pUBnpr2、pUBBAG)细胞的P值。
比值表达了胁迫细胞的平均荧光值(n=8)对空宿主细胞的平均荧光值(n=8)。
实施例3基因组广泛表达分析A.niger以鉴定分泌诱导的启动子
进行基因组广泛表达分析以鉴定在A.niger WT-PHY中高度表达,并在A.niger WT-GFP,A.niger WT-载体和A.niger WT-1中不显示或显示较低表达的启动子序列。为了模拟将来的应用实验,获得A.niger WT-1,A.niger WT-GFP,A.niger WT-PHY和A.niger WT-vector菌株的原生质体。在A.niger WT-GFP,A.niger WT-PHY and A.niger WT-载体情况下将20ml数量补充有50mg/l phleomycin(Invitrogen)的液体选择性再生培养基在培养皿中与100微升10E7/ml原生质体孵育。在30℃(静止)生长3天的周期后,在液体培养基表面形成菌丝体小片,将其用于总RNA分离。在Affymetrix A.niger GeneChipsTM上的cDNA合成、cDNA标记和杂交根据供应商流程进行。随后的表达分析得到5个下述基因,所述基因在A.niger WT-PHY菌株中的表达水平为在A.niger WT-1,A.niger WT-GFP和A.niger WT-载体中基底表达水平的至少8.5倍。为了确认所述发现,进行Northern印迹分析。
实施例4Northern分析
为了确认Affymetrix A.niger GeneChipsTM实验的结果,进行Northern印迹分析。为此从A.niger菌株WT-1、WT-GFP、WT-FYT和WT-载体中分离总RNA。将RNA变性,在1%琼脂糖凝胶上通过凝胶电泳分离,并根据制造商说明通过毛细管印迹转移至尼龙膜(Hybond-N+,AmershamBiosciences)上。在GS Gene LinkerTM(BioRad,C3 setting,150mJoule)上将RNA紫外交联在尼龙膜上。用于产生32P-标记的DNA探针的DNA使用A.niger WT-1的基因组DNA作为模板并使用表3所列引物(SEQ ID NO′s 50到59)通过PCR分离。根据供应商说明(RadPrime DNA Labeling System,Invitrogen)将Northern印迹与随机引物32P-标记的DNA探针杂交,所述探针代表了分泌诱导的基因(SEQ ID NO′s 20到24)。Northern分析到结果显示在图10中。Northern印迹的杂交模式证实了通过表达分析AffymetrixA.niger GeneChipsTM数据获得的数据;分泌诱导的基因在A.niger菌株WT-1、WT-GFP、WT-载体中低表达并在A.niger WT-PHY中高表达。
引物 | 引物序列 | 基因序列 |
SEQ ID NO:50 | CAACACCTACGGCGTCAAGG | SEQ ID NO:20 |
SEQ ID NO:51 | TAACCCGGGGAGATGCTGTT | SEQ ID NO:20 |
SEQ ID NO:52 | CGATCCGGAAATTCCTCCTG | SEQ ID NO:21 |
SEQ ID NO:53 | GCCGCCGACTCAGCAGTAT | SEQ ID NO:21 |
SEQ ID NO:54 | GTGCATGAACAACACGGAGA | SEQ ID NO:22 |
SEQ ID NO:55 | ACTCAGTTGTGCGCCTCTCG | SEQ ID NO:22 |
SEQ ID NO:56 | GTCGAACTCGGCGTTTCTCC | SEQ ID NO:23 |
SEQ ID NO:57 | CCGGTGAGGAGGTGCTTTTC | SEQ ID NO:23 |
SEQ ID NO:58 | AGCATCTCGCCATCCATCAG | SEQ ID NO:24 |
SEQ ID NO:59 | GCCTTCGGACCATGGTATCC | SEQ ID NO:24 |
表3:用于分离用于经32P-标记探针的DNA的引物。
实施例5克隆GFP-BLE分泌诱导的报告构建体
通过PCR构建GFP(绿色荧光蛋白(Chalfie,M et al.,Science(1994)263(5148):802-805)和腐草霉素结合蛋白(BLE,存在于先前在WO99/32617中描述的pGBFIN-14中)的融合。使用SEQ ID NO:62和SEQ ID NO:63的引物组通过PCR扩增GFP片段。使用引物组SEQ ID NO:64和SEQ IDNO:65和pGBFIN-14作为模板通过PCR扩增BLE片段。获得的重叠PCR片段用于使用引物SEQ ID NO:62和SEQ ID NO:65的融合PCR中,得到PCR融合产物GFP-BLE(SEQ ID NO:61)。用限制性酶PacI和AscI消化GFP-BLE融合物并与经PacI、AscI线性化的克隆载体pGBFIN-2(描述于WO99/32617和EP98/08577)连接,从而将GFP-BLE融合物置于葡萄糖淀粉酶启动子的调控下,得到的载体pGBFINBLE-2描绘于图11中。
使用来自A.niger WT-1的基因组DNA作为模板和表4所示引物通过PCR分离分泌诱导的基因的启动子序列。
引物 | 引物序列 | 启动子 | PCR产物 |
SEQ ID | ACTTCATTAATTAAGTTGATTGAGGTAGAGATGAGTTTG | P1、SEQ ID | SEQ ID |
NO:40 | NO:20 | NO:35 | |
SEQ IDNO:41 | ACTTCACTCGAGATAATGTAGGCGACAAAGTAGCC | P1、SEQ IDNO:20 | SEQ IDNO:35 |
SEQ IDNO:42 | ACTTCATTAATTAATTTGACACTTAACGTGGTAAGG | P2、SEQ IDNO:21 | SEQ IDNO:36 |
SEQ IDNO:43 | ACTTCACTCGAGTTCTCACAAGCAAATCCGAGA | P2、SEQ IDNO:21 | SEQ IDNO:36 |
SEQ IDNO:44 | ATCCTACTCGAGTGGTGCCTGTGAACGAGGTCA | P3、SEQ IDNO:22 | SEQ IDNO:37 |
SEQ IDNO:45 | ACTTCATTAATTAATGTGGATTTTGGATAGTAATTAAAG | P3、SEQ IDNO:22 | SEQ IDNO:37 |
SEQ IDNO:46 | ATCCTATTAATTAAGATGGTTTGGTGTATAACAGAACA | P4、SEQ IDNO:23 | SEQ IDNO:38 |
SEQ IDNO:47 | ACTTCACTCGAGGTCCACACTCTAATTGGGATGA | P4、SEQ IDNO:23 | SEQ IDNO:38 |
SEQ IDNO:48 | ATCCTATTAATTAAGTTGCATCTGCGACAGACAGT | P5、SEQ IDNO:24 | SEQ IDNO:39 |
SEQ IDNO:49 | ACTTCACTCGAGGCCTTTGGAGAATGTAATATCCC | P5、SEQ IDNO:24 | SEQ IDNO:39 |
表4:用于扩增相应启动子的引物概述
用限制性酶XhoI和PacI消化得到的PCR片段(SEQ ID NO′s:35到39),并连接进用XhoI、PacI线性化的图11所描述的克隆载体pGBFINBLE-2中,从而去除PgpdA-amdS并用各自的分泌诱导启动子Pind代替葡萄糖淀粉酶启动子,得到pGBFINGFPBLE-1到5。pGBFINGFPBLE-1描绘于图12中,并代表pGBFINGFPBLE-2到5。通过XhoI和FseI消化pGBFINGFPBLE-1并随后与XhoI、FseI线性化的图13所描绘的A.niger表达载体pGBTOPSEL-1连接来分离各诱导型启动子与GFP-BLE的融合构建体。得到的分泌报告构建体pGBTOPGFPBLE-1到5含有位于各分泌诱导型启动子P1、P2、P3、P4、P5调控下的GFP-BLE融合物。在图14中,pGBTOPGFPBLE-1作为pGBTOPGFPBLE-1到5的代表被描绘。在实施例6和7中使用这些载体转化A.niger WT-1。
实施例6过表达细胞外蛋白质赋予表达GFP-BLE报告构建体的A.niger腐
草霉素抗性
根据材料和方法中描述的步骤进行分泌报告构建体pGBTOPGFPBLE-1到5到A.niger WT-PHY-2中的转化,所述A.niger WT-PHY-2过表达经分泌的蛋白质植酸酶。在补充有多种数量腐草霉素(0、5、10、15、20、25、30、35、40、45、50微克每毫升)作为选择剂的选择性再生平板上选择转化体。所有5个报告构建体能够在含腐草霉素的平板上正选择,而负对照WT-PHY-2野生型不能在含腐草霉素的任何平板上生长。分泌报告构建体pGBTOPGFPBLE-1到5能够在分别有50、35、50、35、25微克每毫升腐草霉素上成长。从而说明这些构建体的分泌诱导型启动子是有功能的,并且转化后在腐草霉素上的正选择是可能的。
实施例7cDNA文库和GFP-BLE报告构建体共转化后选择表达细胞外蛋白
质的A.niger克隆
使用分泌报告构建体pGBTOPGFPBLE-1到5与经定义的A.nigercDNA文库组合共转化Aspergillus niger WT-1,所述cDNA文库编码50个细胞外蛋白质和50个细胞内蛋白质。通过菌落PCR确认共转化事件。含分泌报告构建体与表达文库构建体组合的共转化体的孢子在补充有不同数量腐草霉素(0、5、25、50、100、175微克每毫升)的选择性平板上生长。证明了含有分泌报告构建体与编码细胞外蛋白质的文库构建体组合的共转化体与含有分泌报告构建体与编码细胞内蛋白质的文库构建体组合的转化体相比,腐草霉素抗性的平均提高。代表分泌敏感性启动子P4和P5的这些结果的图片在图15和图16中显示。这些结果说明达到了至少多至20倍的腐草霉素抗性提高。
证明了下述共转化体制造的细胞外蛋白质的多样性,所述共转化体含有包含启动子P1或P3的分泌报告构建体与编码细胞外蛋白质的文库构建体的组合。共转化体在微量滴定板上个体生长,并在第6天将这些培养物的上清液通过E-PAGETM High-Throughput Pre-Cast Gel System(Invitrogen)和质谱法(MALDI MS/MS)进行蛋白质分析。
E-PAGETM 96,6%Gels(Invitrogen)含有用于蛋白质分离的微量滴定板格式的96个样品区和8个标记物区。根据供应商手册将上清液和标记物(E-PAGETM 预染标准(Invitrogen))上样在凝胶上。将凝胶电泳后,根据供应商手册将SimplyBlueTM Safestain(Invitrogen)用于染色。E-PAGETM凝胶的扫描图通过Invitrogen提供的E-editor程序编辑,所述程序将蛋白质样品排列为微量滴定板格式。由具有分泌敏感启动子P1和P3的共转化体制造的细胞外蛋白质展示在图17和18中,并在表5中概述。这些结果说明,至多70%的经分析的腐草霉素抗性菌落分泌通过E-PAGE可检测数量的蛋白质。根据凝胶上观察到的蛋白质片段的大小,评估用给定文库转化的菌落的多样性。这些结果说明根据E-PAGE分析可观察到至多35%的多样性。
质谱结果描绘于表5中。至多58%的被分析为腐草霉素抗性的菌落分泌通过质谱可检测数量的蛋白质。根据所检测的肽序列的同一性评估多样性。这些结果说明使用质谱可观察到至多100%的多样性。
表5:E-PAGE和质谱结果概述。用于分析的测定法在第一列中描述;第二列鉴定了分泌敏感的启动子-报告子构建体;第三列描述了由测量法分析的转化体的数量;第四列和第五列说明了对蛋白质分泌评分为正的菌落数量和各自的阳性百分比;第六列和第七列说明了分泌不同蛋白质的菌落数量和各自的多样性百分比。
申请人或代理人文件参考编号24403WO | 国际申请号: |
与被保藏的微生物相关的说明
(PCT Rule 13bis)
序列表
<110>帝斯曼知识产权资产管理有限公司
<120>在宿主细胞中表达克隆的改进方法
<130>24403WO
<160>65
<170>XML to WIPO ST.25Converter-http://www.biomax.de/
<210>1
<211>168
<212>DNA
<213>Bacillus subtilis
<400>1
CGACTCAGTC CTTTCATATA CAATATGAAG TGTACCGTTT TCCGCACTTT TTCACAATTT 60
CCCATAATCT TTTCATTTTT ATCCCACAGT TTTTGTTTAT GATAAACTCA AGTCATAAAC 120
CTATCAATAT AAATAGACAT GTGAAAATAG AGAAACGGAG TGAACATG 168
<210>2
<211>277
<212>DNA
<213>Bacillus subtilis
<400>2
GGCTCTTCAC ATCCTTTCAA CGTCATTATA AACTAGTTTT AACATACGGC AGGCAATTTT 60
CATAATTTCA CATATTCTTT TCATTTTTAT CCCACAATGT TTGTTTATGA TATGGTTAAG 120
GGAAGAAAGG AAGAGAAAAA GAGCGAGGAA GATGTAGGAT GATCAAACAT ATTCTATTTT 180
GGTGCTTTGC TTTTCTCCTC ATTATTGGGA CAATTGAACT TGTACATGCG ATGAATATGT 240
AACGATAAAT GAATAACCGT TAAAGGAGTG TAAGAAC 277
<210>3
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>3
GTGAGCGGAT AACAATTTCA CACAGG 26
<210>4
<211>70
<212>DNA
<213>人工序列
<220>
<223>引物
<400>4
GTGGCTCAGC TTTTTTAAGG AAGGGAGGCT CTCACCTCCC TTCCCTTTAT TTGTAGAGCT 60
CATCCATGCC 70
<210>5
<211>27
<212>DNA
<213>人工序列
<220>
<223>引物
<400>5
CGTGAGGTAC CGGCTTCTGT TTCTGCC 27
<210>6
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物
<400>6
CATCACGAAG CTTATCCATC ATGTTCACTC CG 32
<210>7
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>7
GACCGGTACC TCAGGATCTT TCGCC 25
<210>8
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>8
GGCCATCAAG CTTATAATCC ATGTTCTTAC ACTCC 35
<210>9
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>9
GAAAGATTGT TTCAGAAGC 20
<210>10
<211>40
<212>DNA
<213>人工序列
<220>
<223>引物
<400>10
ACAGCGTTGG GATCCAAGCC CTTCCATTTT GGACATTTGG 40
<210>11
<211>40
<212>DNA
<213>人工序列
<220>
<223>引物
<400>11
GGGCTTGGAT CCCAACGCTG TCGACGTTGT AAAACGACGG 40
<210>12
<211>42
<212>DNA
<213>人工序列
<220>
<223>引物
<400>12
CGCATAGCTT TCCGGTCGCC GCAGCTATGA CCATGATTAC GC 42
<210>13
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>13
GATGATTCGT CTTTTTGTAG TG 22
<210>14
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>14
CGATCAACAT ATGTGTTCAC G 21
<210>15
<211>1050
<212>DNA
<213>Aspergillus niger
<400>15
ATAATGTAGG CGACAAAGTA GCCGGGCATG CGACCGGAGG ACTCGGTCAG AGGCACGAAT 60
ATGAGAGGCC AGAACGCCGC ACCCATGTTC CAAGATGTTG TGGCCCAGTA AAGGTTAGGA 120
AATGGGGTGT TTTGAACGTG GAATCGTTCT TCCATCCAGT TGTTGCCGGA GCCGTAGGAA 180
CCGGCCGGGA TACCAGTGAG GATGGAACTA TACCTATTAG CACTGCCATC TTCGAGAACA 240
AGGCTAAGAC ATACATGAAA CAAACGGTGA CCGTGAGAAG CCATTTATAA GAGGTGCTCC 300
AATTGAACCT GAATATGTTA AAACTAGTAT ACTAGCAACT GCATGCTTGA CGTACGGATT 360
GTCCGGGTCA TCCTTGCCGT TCCAGGTATG GATCTCAAGG TCCTCCCTGT CACGCAGATC 420
ATTGTGGCTG ACTACCCCGA CATGGGGGTC CCGGCGAAAG AACGACCGCA CCCTGCAACG 480
TCACTTAGTG GCTGTCTGAC AGGGATTGAT TGGCAATGAT TGGCAGACTA ACCGTCCCAG 540
AAACGAATCA TCGAACTCAT TGGTGTGCAC TGTGCTAGCG CGGCGCAGCG ACGGGCGTGG 600
CTCCTCGGCA GGGGTGGACA TGACTTTCTC TGTGTAGATT CCTTGCAAGG TATCTGCTTG 660
ACAGATGCAG AGATGATGTT GAGTAAAATA GGGTGCAGAG ACCCTGCAGA ACCTGCATCG 720
GCCGGCGGCG ACATGTCGTC ATGACCGACC CGGGCCGAGC GGAATTAATG AAACTCGGAA 780
CAGCCAGGGG AATCCGACGC TTTGAGTGGC CAATCCATGT CTATCCACAT CTGCATTGAA 840
GTGGATGAAA GGTGGAGGAG GGCTGGTTGC CAAATTCTGT TAGGGCTTGG AATGTAAGCA 900
ACCGGTTTCG GTCATGACAT CATCACAGCG ATGACTTCAT CACTCTCGGA CGAGCATATA 960
TAGTTGTGCC TGTCGTCGTA TCTCAACAAA CATCAACAAC AACAACAATC ATCTACTGCA 1020
TTTACCAAAC TCATCTCTAC CTCAATCAAC 1050
<210>16
<211>1032
<212>DNA
<213>Aspergillus niger
<400>16
TTCTCACAAG CAAATCCGAG AAACGCAATT GACCATATGT CCTTAGTATG AGGGCTAGCA 60
GGAATACTTG TTTGTCGATG CATACCGACT AATAAAAATG GTTCTTCTTT TTCGCGCAGG 120
GATTTGGTTT TTCATTTTTC ATTTTTCATA TTTTATGTTA TTTTATTTTA TTTTTTTGTT 180
TTATTTTATT TTATTTTTTT TTTTTAAATA AGACTGGGTG TTTTCGTCTC CCACCCCTGC 240
TGAGGAACTG TTTGATATAC AGAAGCCTGA GATACTTGAG ATTATGTGAC AAAGAAATTG 300
TAAACCTGAA TGTGACTAAG GCAGAAGAGA GCAGGTGAGG CCACACAATA CTGTACACCC 360
ACTTCCGATC GTCATCGAAA TGAGCGTTGT GGGTACTGGA ACGACAAACC ATAGATCGGA 420
TCTGCATCCG AATAGGCTTT ACTTTGTACA TTGGTAGGAG TTTGAATGTT TGAAGATCCG 480
GCAGATGATC ACCTGCTGCA GGGAATAATT TGAAACCTGT CCGTCTGCTT TGACCCAATT 540
GACGAGGTAC GTGATTTGAT GCTACCCAAG CAGTATGAAT GCGACGGAGG TGGCTATCCT 600
TACCTTGTCA TATGCAACTC ATAACGGGTA GTCCCCATGG AGCCACGGCT ATTTATTTCT 660
AAGGGCCAAC AGTGAAAGAT TGTGAGATCG TATACCTCCT GGGTATGACG CAACCAGGGT 720
GAGCACTGGC ATTGCTCCAA TCCATATGGT GGAGGTATGT CTCCGAGACC ATGACGCATG 780
TAGACCCTGA CCTGTCCCTG ATCCAGGGAT CTGGTTTGTC ACTTGGCGTA TTTTAATTAA 840
CTGCGGGTCA GGGTCTTGCC GTCCAGACCC AATGGATGAA TTGCCTGCGT GGCCCTGCAG 900
TTCCAGCGAT CGGCACGGCA CGGCTATGAC GTCGGTGGGT GTTCCGTTTG ATATTTAACC 960
ATAGAAGACA GCCTTGTTAT GCTGGTTCCT GCCGCAAAAT AAAGGTCTAT CCTTACCACG 1020
TTAAGTGTCA AA 1032
<210>17
<211>1035
<212>DNA
<213>Aspergillus niger
<400>17
TGGTGCCTGT GAACGAGGTC ACCACTGATA AATTGTCTGG ATCCGTAACG TCTGTATCAG 60
TGGATGGTAC TGAAAAGTTC CAAAGATTGA GGGCAGCATA TGTAGCACAT GGTGGTAGCT 120
CTAAGTGGTT CGAAACTTCG ATGAATGGGC GTGATATACA GGGGGGTAGC ACCTGTATAG 180
TTGATGTCAG CGAAGGCACG GGCCATGCAG TGATAGACAA GAAAAGAGGG ATTGAATAAA 240
AGACTCGATT CTGAAGGGGA GTAATACATC TTTCGGCTTC TCACCACCCC AGATGTAGGC 300
GTGTGTAAGG TAAGCAAGCA CAACATATGC TCTCCGCCAC TCAGGTTCCC CCTTCAACTT 360
CTTCGTAGAG AGTATACCCA GGTCATCGAC AGACCTCCTG ATAGTACCAG ACTGAATCAG 420
GCCAGGCAAG TCCTGAGCGA TTTCCTCCCA CGGGGAATAG TAAGGGTCTT CCAATCTCCG 480
TACGGGAGGA ACTTCCGGGA GGAACCCGTT CTGGAGGGAG ACACCGTACG CAACAAGTGA 540
AATGTCTTGT GTATAAAGCA TGATAATATA TGCACTTCAG TAGACAACTT GATATTCAAG 600
CCTCCTTGAA ATGATCCTCA TGCAGGTAAG AGTAGATCCA AGTGTTTATA TTGTATTCCC 660
AAGGAGGGAC GGAAGAAAAC CGGATCCAGA GGGCTCGAGA TAGGGCCACC TGCATGAGCA 720
AAGACGGGTC ATTTCCCGTT TCACAACGAC CATTCTCAGG CAGAAAGGCA GTGGATTAGC 780
GGAAAACTTA GCAACCATCC GGATTTCTGG AGTGGATGCT TTGTTATCTC ACTTCCGGCA 840
ACACGGATGG TGAGGCGGAA GCGGAACGGT ATCCGGATCC GGAGGGAGGG ACAAACCGAA 900
GTGCCTTGTG TCACACGCCG GTCCATATAT AAATGTTAAT TGGTGACGGT CAGCGGATTG 960
TTTCTGGTGT TCATCCATTT TTTCTTGATA TCCTGGACCC AGTTATTGCA CTTTAATTAC 1020
TATCCAAAAT CCACA 1035
<210>18
<211>1071
<212>DNA
<213>Aspergillus niger
<400>18
GTCCACACTC TAATTGGGAT GAGCATTGCC TTTCAGGAAC TTGACTTTTT GTGGTTGCAT 60
CTTTTGTTGC CTTACCCACG CAGGCTTCGT TTATGAGATA GCGATTTCAG GCCTCAAATT 120
GCTGTCATCA CTTCCGGCCC CAAACTCGTG GGCGGTGCCC GCCCATCGCT GGCAAGAAGC 180
ACAGACTAAC GCCTTACTTC GCCTAGTTGC ACACGATGCA TCAAGACTTC CTCCTATTTC 240
ACAACGACCA GCTCCTTGCC ATTTGTTGTT TCGAATGCCC CCTTCCCCGT GCCTTGCATT 300
TCTAATTCCC ATCTATACCC TTTTGCGCTC TCACGCCCGC CTGACTATCA ATTTTTCTGC 360
CAGCATAACC CTGCGTGCAG AGCGGTTGAC AGCAGGCTTG CTAAGAGTCT TCGTCTAGAA 420
GAACTGTCTG GGTGGATTCC TTTTCGGATT AACTTTTGCT ATTTTAAAAG CTGATTGCAC 480
TACGGAGTAC ACCCGCAATC TGATTCTCAC TGATACTCCA ATTAAAGGCC ACTAATTGCT 540
GACATTTGTA ACATATTTGC GTTTGCTTTC CGGTTGAAAT TGGCGGCTTT GTGCTTTCGA 600
TCGCTAGCAG TCTCTGTGCA TGTACAACTG ATCGGCTATT CAGTCCTATT CGGAAGCGGC 660
ACTGAGAGGC GGAGACAAGC CACAGATACG ACGAGTCTGA TTTTGAGACG GGCGCATCCA 720
ACGAAAGCCT GCGATTGCAA TTGAAGATCT CAATTGGGGG ACTGACAACC TAATACCTAA 780
ACATATCGAG GATTAGGCGC CAACACGAGC ATGGGAAGCT TTGGTGCATG CGACGGCTGA 840
TCCATTTCTA ACAACCGTTT TGCGCGCGCG TCCGAGGTAA GGCTCCCGAT CCCTTGGCGC 900
TTTGCATGTT TCACTCCGAT GCATCTACTG TTTATATGAG TGCGGTGGGC AAGCTGTGCC 960
CACCGACTGA GCATTCTCAA CCGGCCCAAT GCTGTGGGAT CGATCCTCCC CTCCAAAGTT 1020
GTCGCTCGGT TACACTTGAT CGGAGCTTGT TCTGTTATAC ACCAAACCAT C 1071
<210>19
<211>1116
<212>DNA
<213>Aspergillus niger
<400>19
GCCTTTGGAG AATGTAATAT CCCTTGATCA CCCCAGACTC ACATCCAGAT TCTGACTGAC 60
CTCGTGCATA GCCATATTTA ACTTGGTCCC TGATGATCAA AACAGTACAT GGAACTGGGG 120
CCGAACATTT CCCTAGCCAA AGGAGCATCA GGGATTCAAC GTGATCAGTA CAGCCTTGTA 180
GCTCGCTGAA ACTGCCCTGG AGCCAAGCCA AAGCCTAGAC AGCAAGGTGC ATGGGCGAGC 240
TTTGCGAGGA TTTAGTTGTT ATTTAGTATG CCAAGATTAA GCCACGCAGA ATGGCTTATG 300
GCCATAGTAG CAACAACGGC CACGGAACGT TCTTCCATGT GGTATGGGGA AAGCCGCCGG 360
ATATTTGGGG AGGGCGTGAT TGTTCCGGTG GCTATCTTTC CGGTGGAGAT AACGGCGGTG 420
GACCATCAAA ACTCCTCAGC CCGGATTGCT CGGACTCCGC ATCGTCAAGT ATCGGTTTCA 480
TGACAGCCAT TCGACTACTT AGAAGACACA AATAGCTATC CAACTTACCC GGACCTTTGA 540
TAATAATTTT CAGCAGATCT GTCGATCTCA GAGACAATAA TGCCACCGTT CTGTGTGGAA 600
GGCACTGCGC CGTGGTTTAA CAATAATAAA ACTCCAAATT GCCCAAAAGC TAGAGCGAAG 660
GAAAGTCGAG AAGCCCAGTC TAGACTGGCG GGCTGATCGT CCGGTTCACA ACCTGATTGA 720
CAAATCATCT GTGACCCTCG ATGTTCCGCG GCGTTGAGCG GGTGAGAATG TGGATCCTAG 780
TGGGGAAGAC CCAATTGCCG CCGGAAAAGG TGAGCTTGTG CTGCACATGT CCGGTGGCTC 840
AATTCAGGGC CATGCCAGGA CATTGCTCTT CAAAGGGATG CGATTGCTAT TCCCTATTTA 900
CTTCTTTAAC CCGCTGACGG GCCTGTCTGG ACCGAGAATT CTTGGTCAAG TTTCAGTGGA 960
GCGATCCAGG AAAGAACATC CGATATGGAC AGTTGCCCTC GATCTCAGGT CTGTAGTCGT 1020
GTGACACAGA GGCCTCTACT CGCTTGCCTT GCATGTCGGA GCTCAAAGGT GCGATGTGAA 1080
TTAACACGAG GAGCGACTGT CTGTCGCAGA TGCAAC 1116
<210>20
<211>3191
<212>DNA
<213>Aspergillus niger
<400>20
GGAGTTACGT CCCAGAGATG CTGCGGACAA TGCCGATGCG GCATACTTCT CATACGCATC 60
CGTCAAGTAA TTCACAACAG CCATGTAGAT ACTGTAGATG CCAATACCGG TAGCCCCGAT 120
GCCGAGGGTC GGGACAATCC AAGGCACAGA AGGAAAACTG GCCCAACCAT ACCAGAACAG 180
CCCGCCTGCG AACAGCAAGC TGCCAATGAT ACTAGTATAC AGACGGGCCT CCGGGATGGG 240
TTTCCCGGGC TTCTCTTTGT TGCGTTTCGC CGACCGCAAA TACAGCATAT CCTGAAGAGG 300
ATTGACGAGA GTACCGATTA GAGCACCCAC GGAGATGGCC AATTGAATGC ACCCAGTTTG 360
CAAAGTATTC ATGCCGTAGT TGGTGGAGAA GGTCTGAACG ACACTGCTGA AGAAGAGATA 420
CAGGATACCC CAGGCGAAAG AGATCCAGAG GGTGAAGAAG GCAACGACGG GCTCGGTGAG 480
GAGCATTCGT GTGGGCCGTT CGAAGGAGAT CTGCATCAGA CGCCAGACGC TGGTGTTGTC 540
TAGCTCGGCT TCGGCGTAGA TGGGGCGCTG CTTTTCTTTG CGGAGCTTCT TGGCCCGACG 600
GGTGAGGATC ACGTCCGCGC GGGTTTCGTA CAGGATGAAC CAGAAGATGG GTAGGAGCCC 660
TGTTAGATAG ATAATTTGGA TGTAGAAGAT CCAGCGCCAC GGGGCGGTTT TGTGGATGGC 720
TACGATGGCG GATCCGATGA ATGGGCCCAG GGCAATTCCA ACCACACTGG TAAAACCGAA 780
GAGCGACATA GGGAGACTCC TCGCTTTGTC ACCATACCAG ACATCACTGA TGCTACCGCC 840
GACGATGTTG ATCGATACGG AGGACGCACC ACCACCGAAG AAACGCGTCA CTACGAGAGT 900
AGCGTAGTTT TGGGCGAAGG CGGAGGGGAA TAGCGAGATG ATGAGAATAA TGTAGGCGAC 960
AAAGTAGCCG GGCATGCGAC CGGAGGACTC GGTCAGAGGC ACGAATATGA GAGGCCAGAA 1020
CGCCGCACCC ATGTTCCAAG ATGTTGTGGC CCAGTAAAGG TTAGGAAATG GGGTGTTTTG 1080
AACGTGGAAT CGTTCTTCCA TCCAGTTGTT GCCGGAGCCG TAGGAACCGG CCGGGATACC 1140
AGTGAGGATG GAACTATACC TATTAGCACT GCCATCTTCG AGAACAAGGC TAAGACATAC 1200
ATGAAACAAA CGGTGACCGT GAGAAGCCAT TTATAAGAGG TGCTCCAATT GAACCTGAAT 1260
ATGTTAAAAC TAGTATACTA GCAACTGCAT GCTTGACGTA CGGATTGTCC GGGTCATCCT 1320
TGCCGTTCCA GGTATGGATC TCAAGGTCCT CCCTGTCACG CAGATCATTG TGGCTGACTA 1380
CCCCGACATG GGGGTCCCGG CGAAAGAACG ACCGCACCCT GCAACGTCAC TTAGTGGCTG 1440
TCTGACAGGG ATTGATTGGC AATGATTGGC AGACTAACCG TCCCAGAAAC GAATCATCGA 1500
ACTCATTGGT GTGCACTGTG CTAGCGCGGC GCAGCGACGG GCGTGGCTCC TCGGCAGGGG 1560
TGGACATGAC TTTCTCTGTG TAGATTCCTT GCAAGGTATC TGCTTGACAG ATGCAGAGAT 1620
GATGTTGAGT AAAATAGGGT GCAGAGACCC TGCAGAACCT GCATCGGCCG GCGGCGACAT 1680
GTCGTCATGA CCGACCCGGG CCGAGCGGAA TTAATGAAAC TCGGAACAGC CAGGGGAATC 1740
CGACGCTTTG AGTGGCCAAT CCATGTCTAT CCACATCTGC ATTGAAGTGG ATGAAAGGTG 1800
GAGGAGGGCT GGTTGCCAAA TTCTGTTAGG GCTTGGAATG TAAGCAACCG GTTTCGGTCA 1860
TGACATCATC ACAGCGATGA CTTCATCACT CTCGGACGAG CATATATAGT TGTGCCTGTC 1920
GTCGTATCTC AACAAACATC AACAACAACA ACAATCATCT ACTGCATTTA CCAAACTCAT 1980
CTCTACCTCA ATCAACATGC CTATCTCCAT TCCCTCCGCC TCCAGCGTCC ACGACCTCTT 2040
CAGCCTGAAG GGCAAGGTCG TCGTTATCAC CGGCGCTTCC GGCCCTCGCG GCATGGGCAT 2100
TGAAGCCGCG CGTGGCTGCG CCGAAATGGG CGCCAACATC GCCCTCACCT ACTCCTCTCG 2160
TCCTCAGGGT GGTGAGAAGA ACGCCGAAGA ACTTCGCAAC ACCTACGGCG TCAAGGCCAA 2220
GGCCTACCAG TGCAACGTGG GCGACTGGAA CAGCGTCAAG AAGCTCGTGG ACGACGTGCT 2280
GGCCGAGTTT GGCCAGATTG ACGCCTTCAT TGCCAACGCT GGCAAGACAG CCAGCAGTGG 2340
TATCCTGGAT GGTTCCGTTG AGGACTGGGA AGAGGTCATC CAGACAGACC TGACGGGTAC 2400
CTTCCACTGC GCCAAGGCGG TGGGCCCGCA CTTCAAGCAG CGCGGAACGG GCAGCTTCAT 2460
CATCACCTCC AGCATGTCGG GTCACATTGC CAACTTCCCG CAGGAGCAGA CGTCGTACAA 2520
CGTTGCCAAG GCAGGCTGCA TCCATATGGC CCGGTCATTG GCCAACGAGT GGAGGGACTT 2580
TGCCCGCGTG AACAGCATCT CCCCGGGTTA CATCGACACG GGGCTGTCGG ACTTTGTGGA 2640
TAAGAAGACT CAGGATCTGT GGATGTCGAT GATCCCCATG GGACGCAACG GTGATGCCAA 2700
GGAGCTGAAG GGTGCATATG TCTATCTCGC CAGTGATGCC AGCACATACA CGACGGGTGC 2760
CGATTTGGTC ATTGACGGAG GATACACCGT GCGGTAAATT ATCATCCGCG GTCGGATAGA 2820
AAATAATGTT TATGACATGT ATGTAATGAA TATGAATGTT CAACAATAGT CTTCAATTCT 2880
TCACTTGCTA GTATCCTGAG TATCTTGTCG TATAGCTCAA CAACCTGGCA TGGCCGGGCG 2940
CGCAGTGTAG CTCTCCCAAG TCTATGGATA CAACTTGCGT CAGTGTGGAT CTTTGGCTCA 3000
GATTCGGAGG GGCAGTGGGG TAAACAAGAA CACGCAGCCA CTCTCGGCTT TGCGGATCCC 3060
CACGGAACGC CAGTCAACCC TGAAGATTCA GTCCGGGCCT GGGCTCGGAC TGATTTGGTG 3120
AGGGGATTCT GCATCCGTCC AAACCTTATC ATCGTTGGTG AGACGGACTC CGGACAGCCA 3180
GGAGCCTTAT T 3191
<210>21
<211>4031
<212>DNA
<213>Aspergillus niger
<400>21
GGGGTCAAAG GACACAATGT CGAAATAGCG AGATTGCTGT GCATCATCGG GGCTGTCTAC 60
AGTCCGCTGG ATTTCTTTCC CTCGGTTAAG TATTTCCTGC ACGCCGGACC CGCCAGGGCC 120
ACCTGTATTC CTAGTAAGCG ACCGTGGTGG GGTGACAGAA TGGTGGCGGT GGTGGCATTG 180
CTGCCTATAC CTGGGTTCAC GATTATGGAG CCACCGTAAC GCTCGTCGGC AGGATCTACC 240
TGTGCAGGCA GTTTTATGAC GGCCAGGGCA GCCGTTTTAT TTTCAATGGC ACTAGCTGAC 300
CAGTCTAGGG GAACTTCGAG ACGTGCACAT AGATAGTCCT GGTAGCAGGG GATGAAATTT 360
AGTGCTGAGC CTGGCGCAGT CTGGTAGGAG CGGGTTAGAC TGTGAGAAAT TATAATAGGG 420
CGGATGAGAT CAGTACGCTA CTCCAGGAGA AGTCCCCGGC TTGCACCGCA GACGGCATCA 480
TGGGTTGGTG TCGCAGGGAG GAGGGTGAGT TGAGTAAGAG AGAATTAATG AAAAGGATGG 540
AGTAGCCGAC CATATAAGTA CTGGATGAAG TGAGCGAGTT AGCGTCAGCC ACGACGGGCT 600
GACATGCATG ATCGGGGCAC CGCCGGCAAC CGATACAGCC TCAGCTCGAC GGGAAAACGT 660
GGTTACCTGG ACTTAGAAGA TGATAATACA ATGAAAAGAT AGCGTAGATT GCCATAAATA 720
CGCCACAATC TATTTATTAG GCAACAATCA AGTAAGAGCA GATTTGGCGA CTCATAGTAG 780
TCCCCATGGA GGGGCGCGAT GGTTTTCTTC GCCGAAATAA TCGCTTAATG CCTCTAACGA 840
AGATCTCAGA ACCTCCAAAC TGTAGTATTC TTCTCACAAG CAAATCCGAG AAACGCAATT 900
GACCATATGT CCTTAGTATG AGGGCTAGCA GGAATACTTG TTTGTCGATG CATACCGACT 960
AATAAAAATG GTTCTTCTTT TTCGCGCAGG GATTTGGTTT TTCATTTTTC ATTTTTCATA 1020
TTTTATGTTA TTTTATTTTA TTTTTTTGTT TTATTTTATT TTATTTTTTT TTTTTAAATA 1080
AGACTGGGTG TTTTCGTCTC CCACCCCTGC TGAGGAACTG TTTGATATAC AGAAGCCTGA 1140
GATACTTGAG ATTATGTGAC AAAGAAATTG TAAACCTGAA TGTGACTAAG GCAGAAGAGA 1200
GCAGGTGAGG CCACACAATA CTGTACACCC ACTTCCGATC GTCATCGAAA TGAGCGTTGT 1260
GGGTACTGGA ACGACAAACC ATAGATCGGA TCTGCATCCG AATAGGCTTT ACTTTGTACA 1320
TTGGTAGGAG TTTGAATGTT TGAAGATCCG GCAGATGATC ACCTGCTGCA GGGAATAATT 1380
TGAAACCTGT CCGTCTGCTT TGACCCAATT GACGAGGTAC GTGATTTGAT GCTACCCAAG 1440
CAGTATGAAT GCGACGGAGG TGGCTATCCT TACCTTGTCA TATGCAACTC ATAACGGGTA 1500
GTCCCCATGG AGCCACGGCT ATTTATTTCT AAGGGCCAAC AGTGAAAGAT TGTGAGATCG 1560
TATACCTCCT GGGTATGACG CAACCAGGGT GAGCACTGGC ATTGCTCCAA TCCATATGGT 1620
GGAGGTATGT CTCCGAGACC ATGACGCATG TAGACCCTGA CCTGTCCCTG ATCCAGGGAT 1680
CTGGTTTGTC ACTTGGCGTA TTTTAATTAA CTGCGGGTCA GGGTCTTGCC GTCCAGACCC 1740
AATGGATGAA TTGCCTGCGT GGCCCTGCAG TTCCAGCGAT CGGCACGGCA CGGCTATGAC 1800
GTCGGTGGGT GTTCCGTTTG ATATTTAACC ATAGAAGACA GCCTTGTTAT GCTGGTTCCT 1860
GCCGCAAAAT AAAGGTCTAT CCTTACCACG TTAAGTGTCA AAATGAGTGG GGTAAGCTTT 1920
GCCCGTCAGG CCTTACTCCA GGCTGCTCTT CTTTCGATTG TCTCCGCAAT CCCGGCGCCC 1980
ACGGCCTTCG TCAACAATGT CGCTCCGCCC GAGCCCATCA TCACCCCTTC GCCGGTTCAA 2040
CATCGACCTT CTCGAGTCGC TGGTCGAAAC ATTCTGAGTG ACGTCGATTC TGATATTAAC 2100
AGCATCCTTT CTGGCCTTGG ATCCGACCTA CCCTCCTGGG TCGCATCGGG TGTGCCCAAC 2160
TACTTCCAGG GTTTCCCTAC TGGGGATGCA GTGGTGAGCT CCTTGGGCTT GAACAGCGCT 2220
GAGTTGGCAG CCTTGCCCAC CAATGTCTTG AATATCGACC CATATGCCAA CTGGACTAGC 2280
TCTGGCTGGA ACGTTCGCTT CCACGGAAAC GTCTACAAGC AGCCCAACAC CTCCATCTCC 2340
GACCTCAATG ATTTGGCTGA TGTTTTCCTC GGCAATACAA GCATCTCCGA CCTTTCCGAA 2400
TCCGAGCAGA AACAGGCTCG GAATTTAACA GCGGAAATAT TAGTGGTCCA GCAAGCTCAC 2460
GTCGCCGTAA ACACAATCCA CCTGGAGCCT GCACCGAGTC AGGGATCCAG CGGACAGTCA 2520
GGCGGCGGTG GATCCTCTAA TACCACTGGC GGCACCCAAG ACCTCACTCT GCCCTACAAC 2580
ACTACAGTTG AAGGCGATTT TGACACTTTC GTACCGATTA GCAGCAATGG CTTGACGGCA 2640
GGTAATGAAA CTTCGGCGAT ACAACGGCTT AACGTCCATG TGGAGGGCGC GACAATAGGA 2700
AACAGTACTG CCTATCTCGT ACCTCCGACC GGGCTCACTG TCGTTTCGGA CATCGATGAT 2760
ATCCTACGCG TCACCAAAAT CTATGAACCA GAGCAAGGTT TACTCAACTC ATTTGCGCGC 2820
CCCTTCAGGC CGTGGGAGAA TATGCCGGAC ATCTATCGCA ACTGGTCGAT CAGTCTCCCC 2880
AACCTGCACT TTCACTACCT AGTAAGTCTG CTAGATGTCC CTGATTGCAT TGTTGCTGCA 2940
TACTCACCAC TACACTACAG ACGACGACCC CCGAACAAGT CACCAGGAAC TACATGCAAT 3000
TCATCTACGA CAACTACCCC GGTGGATCTT TCGACACCCG TCCCCTCAAC TTTAGCGACG 3060
TTTCCGCCAC CTTGTCGATC CGGAAATTCC TCCTGCAAAA GGTCTTCGAG ACCTTTCCGC 3120
AGCGCAAGTT CATCCTCATC GCCGACACCA GCAACAGCGA CGTCATGCGT GACTATCCTG 3180
AAATGGCGAC CGACTTCCCT GGTCAAGTGC AATGTATTTT TCTCCGGAAC ACCAGCGCCA 3240
CCGACTCAGG GGACAAATTC CCATACGATA CCTCTGGGTT TAAGAAGCTC AATCAGTCAA 3300
ACTACATGTT CTTCTTGCAT CCCGATGACT TGACGAATCT AGACATCGCG AATGGCCAGT 3360
GTTACAACAC ATCCATTCCG CAGAATTTAA CGTTTAGTTA TCAGGGTTTG CCATTGGGGC 3420
TGGGTGATGA ACCCACAGCT GTCAATGGGT CTGCCAATCA TACTGCTGAG TCGGCGGCCG 3480
GTTTGTCGGT AAAGGGTGGG ACTGATATGC AGGGTTTGAT CTTTCTGTTC ACCCTGGTTA 3540
CGGCCTATTC CATTTTCTTG TAAATATCAG TTACGATGTA TGAGAGATAA CGACTTTGAT 3600
ATACTCACGG CTCAATTTAC GTTCCAAAAC CGAATACAGC GGATATCTAT GCTCGATGCA 3660
AGGACTACCA CTATGTTACA CTACTAAGGG TTTATCTACT ATGGGAAATA TTAGTGCTTG 3720
GTTTGTTACA GCTCACTCGA GCTTGCGTTA CTAACCACTT TTATCGGTCC ATGGATCCAC 3780
CGCCCAACGC AGTTATCCCA GGAGGTGGCC GCAATGGCCA GTCAAGTCAA TTAAATCTCC 3840
TCTGCTAGGA ATTGCATGGG TTTTGACAGA CAGAACTCGG GGAAAGTATC GATATTCAAT 3900
GATCTGACGG TGGCTCCGAA ATTCGCTAGG CTAGCCCTTC ATCACTAGTA ATATTAGTTG 3960
TCCAACTTTC GCGCTTTACA CTTTCCATAG CAAACCCCCA ATTCCCAGCC AAATCCTCAT 4020
ATCCTCTAGG A 4031
<210>22
<211>3771
<212>DNA
<213>Aspergillus niger
<400>22
GCTTCTATGG TATCAAGGGT CGCGTAGCCA AAAGTTTAAC TGCATCGCTG CGGTATTAGT 60
CGGTGTAGCT GGCTGCAGCT TTCGTTGTGT CCCTGGTCTG TTTAAGAAAC GGTATCAGAT 120
CTGTCCCGCC CGTCCCCCTG ACACCGGCAT TGAGTTTCTC ATGAGAATTG TCCACTATTG 180
TCGACGTTGT TGTGGCTAGG TTTGTTCTCG AAGATACTTG GTTTGGCGGC GGAGTCCTTG 240
CAGCCATGAT GATGTATCGA GTCACCATCC GCACATGCTT ATCGCGAAAT CCCCCAAGTG 300
ACATAACCGC CATGTTATAT GCATCCCTCA AAGCAGATCC GGGCTTGTGA CTTAATACAT 360
AGGATCTCAC ATTAGACGTG CGGAGCATCA TTTCCAAGAA GCGTCGGTGA GGGCCTGGCA 420
TGTAGTTTCG CATGTTCTTG AATATACAGT CAGTATCGAC ATTGCTTTGT CTGGATAACT 480
CCTCGAAGAT CAGTCCTTAC CTGCATAAAA CCAGTCATGA CTTGAGGATT CGACTTGCCG 540
TGAGGCTTGG TCTCCCCAGT GGCCGAATGT TCCACACCCA AGAAAATGTC GAAGGCTTGG 600
ATCAGAGAAC TTTGAGCATT GCTACCACCA CTGTATTGAT GCCATTCGCC TCGTCCTTCC 660
CCAACATCAT AGAATACGCC GTTTGGCAGC CCGGCCGATG CCATGTTCTT GCTGCCGGCT 720
AGGTATGGAC GTAATTGATG GTAAAAGACG GGCGGCGCAC ACTTTTCATA CATGCGTTCC 780
AAGAGGTCAC CGAGTTCCTT GAGACCATAA TTGAGCTGCT CCAGACGAGA AATAACACGC 840
TGGCTATCAT CAACATTAGC TGCATGCATA GCATCCAGCA TTAGCTCGAT GAGCTGTGCT 900
CCCTTGGCCT CGATAGCGAC GGAGAGGACG AAAAACCATT CTTCGTCTTT GGTGCCTGTG 960
AACGAGGTCA CCACTGATAA ATTGTCTGGA TCCGTAACGT CTGTATCAGT GGATGGTACT 1020
GAAAAGTTCC AAAGATTGAG GGCAGCATAT GTAGCACATG GTGGTAGCTC TAAGTGGTTC 1080
GAAACTTCGA TGAATGGGCG TGATATACAG GGGGGTAGCA CCTGTATAGT TGATGTCAGC 1140
GAAGGCACGG GCCATGCAGT GATAGACAAG AAAAGAGGGA TTGAATAAAA GACTCGATTC 1200
TGAAGGGGAG TAATACATCT TTCGGCTTCT CACCACCCCA GATGTAGGCG TGTGTAAGGT 1260
AAGCAAGCAC AACATATGCT CTCCGCCACT CAGGTTCCCC CTTCAACTTC TTCGTAGAGA 1320
GTATACCCAG GTCATCGACA GACCTCCTGA TAGTACCAGA CTGAATCAGG CCAGGCAAGT 1380
CCTGAGCGAT TTCCTCCCAC GGGGAATAGT AAGGGTCTTC CAATCTCCGT ACGGGAGGAA 1440
CTTCCGGGAG GAACCCGTTC TGGAGGGAGA CACCGTACGC AACAAGTGAA ATGTCTTGTG 1500
TATAAAGCAT GATAATATAT GCACTTCAGT AGACAACTTG ATATTCAAGC CTCCTTGAAA 1560
TGATCCTCAT GCAGGTAAGA GTAGATCCAA GTGTTTATAT TGTATTCCCA AGGAGGGACG 1620
GAAGAAAACC GGATCCAGAG GGCTCGAGAT AGGGCCACCT GCATGAGCAA AGACGGGTCA 1680
TTTCCCGTTT CACAACGACC ATTCTCAGGC AGAAAGGCAG TGGATTAGCG GAAAACTTAG 1740
CAACCATCCG GATTTCTGGA GTGGATGCTT TGTTATCTCA CTTCCGGCAA CACGGATGGT 1800
GAGGCGGAAG CGGAACGGTA TCCGGATCCG GAGGGAGGGA CAAACCGAAG TGCCTTGTGT 1860
CACACGCCGG TCCATATATA AATGTTAATT GGTGACGGTC AGCGGATTGT TTCTGGTGTT 1920
CATCCATTTT TTCTTGATAT CCTGGACCCA GTTATTGCAC TTTAATTACT ATCCAAAATC 1980
CACAATGTCG AAGTCGAATG GCGTCAGCCT GGCATTCCCC GCCGAAGCAG CGACAAAGGA 2040
ATATGCAGCA TCTCTAGACT CTTCTGATAG ACTTGCTGCA TTTCGGGAGA AGTTCATCGT 2100
CCCATCGAAA GCAAATATTG CTTCCAAAAA GCTAGCAAAG CCTGGTGGGT TCCATCCTGG 2160
CAACTGTAGA CCTCGTCACT AATGTCACAG GCCTTTCGCC CGAGTCATGC ATTTACTTCT 2220
GCGGTAACTC ACTTGGCATT CAACCCAAGG CCACAGCAAA GTACTTAGAA GCACAGTTGG 2280
ACACTTGGTC ATCTATTGGA GTTGGCGGCC ACTTCACTGA TCTTGAGGGC TCACCCTTGA 2340
AGCAATGGCA GCTGCTCTCA GAGCAAGCAG CTGATTCAAT GAGCAAGATT GTGGGAGCAA 2400
AGCCAGAAGA AGTCGCAGCG ATGGGAACAC TTACAACGAA CCTTCATCTT CTGCTGGCTA 2460
GTTTCTATAA ACCGACTCAA ACAAAGCACA AGATCTTGAT GGATTGGAAG GCTTTCCCAA 2520
GTGATCACGT AAGTTCGAAA GAAGCTGCCT TCTGCTATCA CGGCACTGAC GATTATATAG 2580
TACGCTATCG AATCTCATAT TGCCTGGCAT GACCTGGATC CTAAGGAGTC TATGGTGCTC 2640
ATCGGTCCAG ATGAAGGCGA ATACGAGATA TCCACCCAGA AGATTTTCTC TTATATCGAC 2700
AAGCATGCTG ATGAGGCTGC TATGATTCTT CTTCCTGGTA TTCAATATTA TACTGGGCAA 2760
CTGTTCGATA TCCAGAAAAT TACAAAATAT GCCCATTCGC GCAACATGGT TGTTGGCTGG 2820
GATCTGGCCC ATGCGTTCGC TAATGTTGAG CTAAAGCTGC ATGATTGGAA CGTTGATTTT 2880
GCAGCATGGT GCACATATAA GTACGGAAAC GCCGGTCCTG GAGCAATGGG GGGGCTTTTC 2940
GTGCATGAAC AACACGGAGA GGTCGATTAC AGCGCGGGAG AAGATGCACC CAAATTCCGC 3000
CATCGTCTGA CCGGGTGGTA TGGTGGCGAT CGATCGGTAA GATTCAAGAT GGACAACAGT 3060
ATGTGTGCAC TTGGCTATAG AACAATTTTG TGGGCTAGTA AGCTGATACG ATTGATAACC 3120
AGAGTTCAAA CCTATTCCTG GGGCAGGAGG ATTTCAGATA TCAAATCCTT CGGCCATCGA 3180
CCTTGCGTGT CTTTGTGCCG CTTTATCGGT GTTTGATGAG ACGTCAATGG CAGATCTTCG 3240
CAGAAAATCA TTGAAGCTAA CAGCATACCT TGAGTTCCTT TTGCTCAGGG ATTATGAAGA 3300
AGAATCTAGG CCATTCAGCA TTATCACGCC CAAGGACCCC GAGGCGAGAG GCGCACAACT 3360
GAGTCTATTG CTCAAGCCTG GTCTATTACA GAATGTTGCA CAGAAGTTGC AAGAAGCAGG 3420
AATAGTCTGC GATAAACGGG AGCCGGGTGT TGTGCGTGTC GCTCCGGTTC CTTTGTACAA 3480
CAGCTTCAGC GAGGTTTGGA CATTTGTGAA GATCTTCAAG GATGCACTGC AGCAGTGATG 3540
GGTCTCACTA GATCATTTGG TCAGGACTGA GACCAGATTT GTCAAGTTCG CTCCGATGAA 3600
TGATTTTTTA GATAGATACC AAATTATTTG ATTCTTAGAT TTGTTGAAGC TCTCACTGCG 3660
ACATGGTCCA CAGCCACTGT GCAAAAGCAA ATAACTGAAG TAGGAACTCT ATGATAGACC 3720
CGTACTGTTG AGGTTATAGA TTTCCAAAGC CGTTCCTTGG ATCACCACTT C 3771
<210>23
<211>3562
<212>DNA
<213>Aspergillus niger
<400>23
CCTGTGCTTG TGGTATGACA GAGCCACTGA TATCATCTCC TCTCATCTCC AGTTGTAATC 60
GGAATTGATC GAGGGGGCCA ATCTTCCACA CAGCCCCATG GAAGACGCAC AGATGCTTTC 120
GATGCCACGC TGGCAGACGG CCGCCAACTG TCATCGTCCA GTGCTGCCGC CATTCCCATG 180
CAAAAGCCAA CGCTAAGAAG CGCGCGGGCG CCGAGTTTCC ACGCTTGCAG CTTAGTTCAG 240
CGACCCAGCT CAGTGGCGGC TCGCTCATGC ATAGAAAGAT GGGTTTGGAC CCGCGCTGGG 300
CCTTTCATCT GCAACACTGC TCGCAGACCA TGTGTGACTT TTGGCTGCAA AAAAAAAGAG 360
GCTGGCGACA GCTGATCCAC TGTGCTATTC CTATCTCATC CTCCCCGGCT GGATCGAAAG 420
CTGCACGGCA GGGGAAATCA ACAGTTGGGC TCTGACACGT ATCGAGCTAA CTGATGCGCT 480
GTCCTTCCGC CTAATGCCTA CTAAGTCTTA GGGACGGGAC CATCATCCAA CATGCCACCT 540
TGTCCTTCGT AATTCCTTTT TGATCTCGGT GATGGTGGCC ACCCAGGAAA TGACGTTCCT 600
CACCTTGGCT GCAATTGGTG CCCGATGTCT CATCTCCGCT CAGAACGGCG GCGAGGGCAG 660
AATAAAAATT GACGGGCACA GCAGGAACTA ATCAAACATA CCGGCGGTCT TCTAAATGAT 720
CGTATCTCCC GGAATACTCC CTCTTTCTAC AGAAGCGGGG ATCCATTCGC CCTATATGTA 780
TAGTGGAGCT TTGCCGCACT GATTCGCACG GCATTATACC TCCGCACTGC CGTGCCTTCA 840
TCCACTTGAT TGTGGCCAGG GAAATATCAA CGGGGCAGAT AACTTGCCCT TGCATCATTA 900
TTGCTCCGCA CATTCATTCA TTATCGCTCT GATCCCACAT CCTCACGCAG CTGCGACCGG 960
AGTGTCCACA CTCTAATTGG GATGAGCATT GCCTTTCAGG AACTTGACTT TTTGTGGTTG 1020
CATCTTTTGT TGCCTTACCC ACGCAGGCTT CGTTTATGAG ATAGCGATTT CAGGCCTCAA 1080
ATTGCTGTCA TCACTTCCGG CCCCAAACTC GTGGGCGGTG CCCGCCCATC GCTGGCAAGA 1140
AGCACAGACT AACGCCTTAC TTCGCCTAGT TGCACACGAT GCATCAAGAC TTCCTCCTAT 1200
TTCACAACGA CCAGCTCCTT GCCATTTGTT GTTTCGAATG CCCCCTTCCC CGTGCCTTGC 1260
ATTTCTAATT CCCATCTATA CCCTTTTGCG CTCTCACGCC CGCCTGACTA TCAATTTTTC 1320
TGCCAGCATA ACCCTGCGTG CAGAGCGGTT GACAGCAGGC TTGCTAAGAG TCTTCGTCTA 1380
GAAGAACTGT CTGGGTGGAT TCCTTTTCGG ATTAACTTTT GCTATTTTAA AAGCTGATTG 1440
CACTACGGAG TACACCCGCA ATCTGATTCT CACTGATACT CCAATTAAAG GCCACTAATT 1500
GCTGACATTT GTAACATATT TGCGTTTGCT TTCCGGTTGA AATTGGCGGC TTTGTGCTTT 1560
CGATCGCTAG CAGTCTCTGT GCATGTACAA CTGATCGGCT ATTCAGTCCT ATTCGGAAGC 1620
GGCACTGAGA GGCGGAGACA AGCCACAGAT ACGACGAGTC TGATTTTGAG ACGGGCGCAT 1680
CCAACGAAAG CCTGCGATTG CAATTGAAGA TCTCAATTGG GGGACTGACA ACCTAATACC 1740
TAAACATATC GAGGATTAGG CGCCAACACG AGCATGGGAA GCTTTGGTGC ATGCGACGGC 1800
TGATCCATTT CTAACAACCG TTTTGCGCGC GCGTCCGAGG TAAGGCTCCC GATCCCTTGG 1860
CGCTTTGCAT GTTTCACTCC GATGCATCTA CTGTTTATAT GAGTGCGGTG GGCAAGCTGT 1920
GCCCACCGAC TGAGCATTCT CAACCGGCCC AATGCTGTGG GATCGATCCT CCCCTCCAAA 1980
GTTGTCGCTC GGTTACACTT GATCGGAGCT TGTTCTGTTA TACACCAAAC CATCATGGAT 2040
GTGACTAATT TGGCTGTCGA TTGTCCCGTT ATAGAGACCG GTTCCCTTGC TTTGTGGATG 2100
GCTTCCTCCG AAGTGGACCA GAAGGCCTTG GGCAACTTTG CGGCCATAAC GGGCCTCGAG 2160
AACCCGTTCC TGTCCGCGAT GCTGTACAAG ATTCTGGGGT TGTCTGTTAT GTTATCGAAG 2220
AAACTCCTCC GTGCACGACG ATTGCGGCGC CTAGACCCCA CCCGAGAGAC TAAATCGCTT 2280
CATCTTTATT ACCATATCAT CTGGCTTTCG CGTGAGGGTC TTCTGATATT AGAGGAGTTC 2340
GTCCTGCCAC TGGTTGAGGG ATTTATGGAA CTCAAAATTT TAGCTTACAA GCTGCGCGCC 2400
TCCTTTTACC ATATATTCGT CCTATTTCAG AACCAGCCTG CTGTCCACTC GCCGGGTATC 2460
GTTAGTCTGC CGAGTAGTAC ACCTTTATCC AACGGCGTGA CAGAAGCGGA GTCACCATCC 2520
AAGGATTCCA ATTTGAGATT TTCATTTCAG CTGAAGCCCG ACACGATAAC GGTTTCCGGG 2580
AAGCCCAGTT CCGCCTCGGA TAGTGCGCCA CGAGGCAAGG TTACGCAGGC ACCCCCGGGC 2640
TTTGCGCCGG TTCAACCGCC CAAGTCGAAC TCGGCGTTTC TCCTCCCTGC TCTCGATTAT 2700
ACCCCTACAG CTACCGCATG CTTCAATCAT GCCGCCCTCT TGGCAGATCA ATTCCTCCCG 2760
GGGTCGCACC CGCTCCGTCT GTCCATCAAG CTTGAATTTG CCGCCTACCT CTACGATTGC 2820
CTACATGACG CTCATGCCTG TCGACGGTTG GCCAAGCAAG CCATTGCCGA TGTGTACAAT 2880
GCGCAAGAGG GCATGGACGA CGAGAGCTTC GAGGATGCAG CTGAGATTGT GGGTATTTTG 2940
GGCAAGATGG TGAAGCGGGG AAGGAACACA AGCAGTGCTG GAAATAGCAC CACGGCTGTG 3000
AAAACGCCCC AGGAGGAGCG AAGTGAGGGC AGTCGAACAC CATCCTCTCA GACAACGTTG 3060
AAAAGGCCGG CGCGAGTGCC GAAAAGCACC TCCTCACCGG CGCGCGCGAC CAAGCCGACG 3120
ACTAGCGAGG GGATGTCCCC CGCTGTGCCC GACCCCACCA TGATGAATCC CATATGATGC 3180
CTTTCCCTAC GACCTGTATA TGCTTCTTCT TGGAACTATG GAGTCGCGCA TGAGCGCTTG 3240
GCCTGTGACT TCTACTTGAC TTGCACCTGT CTGTATCATC TCGGTAACGG AGTTGCGGCG 3300
ATAGACTGGA ATTGGGCATC AGCTTGCGGG GAGCTGTGGA ATGAGCGATT AAGCGCGACA 3360
AAAACTTGAG GTGGAAGGGA CAGACCAGCC AATTTGTGAT GGTGACTGTA GATAGATAGA 3420
TGTGTGCAAT ACAAAGTATG TTGTTGATGT CATGCACCCC ACTTGTGTAT GCTTGTCTGG 3480
ACAATGGACC TACACTTAGT CGCAACAACT GTATGTCTCA AGCCAATGGC CATGGGGCAG 3540
GATGGATCGA TGGATCTCTT GT 3562
<210>24
<211>4361
<212>DNA
<213>Aspergillus niger
<400>24
CGACGGACTA ACGTCGCGCG CCCCATTTCA CGTCTTGAAG ACAGATGTGT ATGCGATTGC 60
TCGCGAAATT CTCATCCGAT TCCGTCGGCT TGACCTGACA TCTGGAATAG ACGAACAGGA 120
CTTGGAAGCT ATCATTCGTA TTACCGAAGA GTCCAACGTA CTTCTCACTG ACTGGTGGAA 180
GTCCGTCCCG AAACTGTATG ACTTCGATTA CTGGAAAGCA GACGGTCGAT GGGAAATGAT 240
TGAAGGCCAG CTGCAAAGGC TTCCCTCCGA AGCAAGGCAA CAGGTGGAGA CAATATATCT 300
ACAGGCTGCT GTTCTCCAGT TGACGTACGA CGGCATGGTC ATCCAAGCAA ATAGACCACT 360
GTTGGAGCGA AGAATCAACA GGCTAACATC TTCGCGGGCG ATCGTGGATG CGATGCATAG 420
GGCGCTTGAC CGAGCCACTG CTGCTGCTCT CCGCATATCC CGTGTTCCAG TTCACAAGCT 480
GAAAAATCAT TTTGCTATAG CAGTCGTATC GATGCAAGAG TTCACTGCTG GTGTGATTCT 540
CTGTATACCT CCCACGGTGA AGCCTTTAAC GGCCACCGCT CATGAGGCGA AGGACGGGGT 600
GGTAAGAATA ATACGCGCCA GTCGAAGTCT CAAGAGCCAC GATCGAATAG CAAGGCAAAC 660
TGAACAACTT CTGACGGAAC TACTCAAAGT TACCACCCAA CGCGAGATAA CGCACGCCTT 720
GGCCGATAAT CTCGACACCA ATTTCCCCTC CGATACGCGG CTAACAGGCT CCGTTGTTGC 780
CGGCGCCTCA AGTGACTCCT TGGGTGCAGG ACGCTCCAGG CCAGTTCCCG GATCCGCAGC 840
GCAGGCAGTT GTAGATCCTA TCCAAGGAGC CTGGGACTCA GAATTCAATG CCCTCCCTGC 900
CGTAACGGGA CCTTATGATT TCCTCCCTGC TCAAGCCTTT CAACAGCTGG ACGATACATT 960
TGGTGCCTTT GGAGAATGTA ATATCCCTTG ATCACCCCAG ACTCACATCC AGATTCTGAC 1020
TGACCTCGTG CATAGCCATA TTTAACTTGG TCCCTGATGA TCAAAACAGT ACATGGAACT 1080
GGGGCCGAAC ATTTCCCTAG CCAAAGGAGC ATCAGGGATT CAACGTGATC AGTACAGCCT 1140
TGTAGCTCGC TGAAACTGCC CTGGAGCCAA GCCAAAGCCT AGACAGCAAG GTGCATGGGC 1200
GAGCTTTGCG AGGATTTAGT TGTTATTTAG TATGCCAAGA TTAAGCCACG CAGAATGGCT 1260
TATGGCCATA GTAGCAACAA CGGCCACGGA ACGTTCTTCC ATGTGGTATG GGGAAAGCCG 1320
CCGGATATTT GGGGAGGGCG TGATTGTTCC GGTGGCTATC TTTCCGGTGG AGATAACGGC 1380
GGTGGACCAT CAAAACTCCT CAGCCCGGAT TGCTCGGACT CCGCATCGTC AAGTATCGGT 1440
TTCATGACAG CCATTCGACT ACTTAGAAGA CACAAATAGC TATCCAACTT ACCCGGACCT 1500
TTGATAATAA TTTTCAGCAG ATCTGTCGAT CTCAGAGACA ATAATGCCAC CGTTCTGTGT 1560
GGAAGGCACT GCGCCGTGGT TTAACAATAA TAAAACTCCA AATTGCCCAA AAGCTAGAGC 1620
GAAGGAAAGT CGAGAAGCCC AGTCTAGACT GGCGGGCTGA TCGTCCGGTT CACAACCTGA 1680
TTGACAAATC ATCTGTGACC CTCGATGTTC CGCGGCGTTG AGCGGGTGAG AATGTGGATC 1740
CTAGTGGGGA AGACCCAATT GCCGCCGGAA AAGGTGAGCT TGTGCTGCAC ATGTCCGGTG 1800
GCTCAATTCA GGGCCATGCC AGGACATTGC TCTTCAAAGG GATGCGATTG CTATTCCCTA 1860
TTTACTTCTT TAACCCGCTG ACGGGCCTGT CTGGACCGAG AATTCTTGGT CAAGTTTCAG 1920
TGGAGCGATC CAGGAAAGAA CATCCGATAT GGACAGTTGC CCTCGATCTC AGGTCTGTAG 1980
TCGTGTGACA CAGAGGCCTC TACTCGCTTG CCTTGCATGT CGGAGCTCAA AGGTGCGATG 2040
TGAATTAACA CGAGGAGCGA CTGTCTGTCG CAGATGCAAC ATGAGAAATT TGGAGTGTGT 2100
CTACACAAAA TCACGAAGGT ATCCCTCGTC TATCTTTCCG TGTGTATTAT TAGCCGAGAG 2160
TCACGCAATG CTCTTTGTAT ACAATGAAAT AATGTTGGAG CTAGAGAATG ATTTCTGATA 2220
GTTATATGTT ACAGGACACT CAGGAGGTCG TCAACTAGTC CGAACACGGC GTCCTCTCCT 2280
GACACTAATG CCTCATCTTC GCCATGCTCG GACTCTAGTG GGACCCATGC TGGCATTTCC 2340
ATTCCCCACT CAGATAGTCC CGCCAGTGTG GACGAATGTG GGAACAACGG CCTTTTCGAC 2400
GGGGGTAGGT AATATGTCAT GCTTACCTGC GACACTCACT CACCATTCTT CTAGAATCTC 2460
TAACTCAATT ATTGGTCTCT GGGAGCAAAG CCATATCAGG CCAACCACAT ATCGCCATTA 2520
AGCCACATGT TCTGTCTACC TATCCCCTTG ACAACCTCCT CTCAGACATT GAGGGACTCC 2580
TCGAGCAGCC AGTCTCTCAT TTGGCTCAAA GCAAGGAAGA TCTAACAAAA CCGGACCGGA 2640
TGTTTCGAAC TCGCCTTCCA GCGGTCTCAG GTGAGGACAA TGAGTATCTG CTAAGGAAAG 2700
GAGCTCTGCT GCTCTTGCCA CCAGCCTTGC GCAACGAACT ATTGGCGGCA TATGTCAACT 2760
ACGTCCATCC GCTATTACCG ATTCTTGATC TTGGAGACTT TCTCTCACAA ATCATTGTTG 2820
GAGATGATGC TCAATTCAAG TCACCACTAT TATACCAAGC TGTCATGTTC GCGGGCAGTA 2880
TTTTTGCTCA GCGAGACGGC ACAGACGAAC CTGAACAGCT AACGAGGGCT TTATTTGAAC 2940
GTACAAAGGT TAGTAATGGT TACAATTAGA CATATCTTAG ATATACTGAG CGATTTCCAG 3000
GTTCTATACG AGTTTGAATC CGAATCATGT GCCTACACTC AAATTCAAGC TCTCTTATTG 3060
ATGACTCTCT GGCATGGAGA TATGTCACGC CACAAAGGCC CGTCTTACTG GCTTGACGTC 3120
GCCTTCTCCA CTGCGGAAAG AATTGGCCTA CTCCATGATG AAGACTGGCC ATGCGATAGC 3180
CGTTCCTTCC GATCCGCTAT GTGGTGTTGC CTTTACGTAC GTGATCGAAC AATCTCGCTT 3240
GGGTCTCGTC GGCCTCCACG GATGCCAGTC AACAAATATC CGGACTCAAT TCTCCATCTT 3300
ATGAGCGACG CACCTCGGGA ATATGACGAA ATAATTCTTG AGAGTCTAGG TAGCGCTTCT 3360
CTGATGCTTA CAAGCACTTA CCAAGAACAA TCGACCATGC TCTTCAAGGA ACTTGTCAAA 3420
CTCTCCTACT GCGTCGGGGC AATCTTAGAT TATCTATACG AAGGGGCCTG GGTCCGAATA 3480
CCAACACGTC GCAGCAGCTT TTATTCACTC GCCCCTAAAT GCAGCATCTC GCCATCCATC 3540
AGACCAAGCT GTGAGAAACT ACTTTACTCT TGGATTCAAT TCCTCCCTCT CAACGCAGTC 3600
TACCATCCGC CACAGTTGCC CGCCGATGCG GAAGGGGAGT CAGCCGAAAC AGTCTTCCTT 3660
GTCCACAAAG CCTTCCTTTA CTTGCTGTAC CTAGCCTCCA TGGCAGTCAT ATACCGCACA 3720
GGCACTCATA GCCAACAAAC CAGCACGGCA ACTCCGAACA TGGAAGGTCT ACGGGCATCG 3780
ACGTCACAAA TAAAAAAGGT CCTTGCGGAG CTGCAGGGCA TGGGACTGCT TCAGTTCCTT 3840
CCAGGGGCAT CAGTCACTAT CCTGATGTTC GCTGTGGAGG CTAGTCTGTT GGATCTCCAG 3900
GGCTCGGATA CCATGGTCCG AAGGCAGGCT ATGTCAAATC TATATGCCTG TGAGGAGGCT 3960
GCGTTACACT TGATGCAGGC TTATCCTACG GCTGAGATGG CGGTATTGAA GACTAGGACA 4020
GCCCGTGCAA ACCTTCTTGG GTTGGTTGAG ACATGAAGAC CAATCATGGA AGCTCTGCTT 4080
CCATCAAAGC ATTGTGTCTT TGCTTAATGA ATGAATGGAT TATGAGCGTT TCGCAACCTT 4140
CTTTAATGCA GCTACATAAT AGAGCATAAA CAGAGGCCCG GAAATATATA ATTTGGCTAA 4200
GAACCCGGTT GCAAGCAGGC AAGTCACGAG GTGCAGAACA TACCATCAAG TTTATAGATT 4260
ATTGTAGGGG ATATCCTCAA CAATATCTTA CTTCCACCAT TACGTACTGA AGATCGAGGT 4320
TATCGGGGAC CATGCTGTCG TGTCAATAGG TACGACTCGT T 4361
<210>25
<211>801
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(801)
<400>5
atg cct atc tcc att ccc tcc gcc tcc agc gtc cac gac ctc ttc agc 48
Met Pro Ile Ser Ile Pro Ser Ala Ser Ser Val His Asp Leu Phe Ser
1 5 10 15
ctg aag ggc aag gtc gtc gtt atc acc ggc gct tcc ggc cct cgc ggc 96
Leu Lys Gly Lys Val Val Val Ile Thr Gly Ala Ser Gly Pro Arg Gly
20 25 30
atg ggc att gaa gcc gcg cgt ggc tgc gcc gaa atg ggc gcc aac atc 144
Met Gly Ile Glu Ala Ala Arg Gly Cys Ala Glu Met Gly Ala Asn Ile
35 40 45
gcc ctc acc tac tcc tct cgt cct cag ggt ggt gag aag aac gcc gaa 192
Ala Leu Thr Tyr Ser Ser Arg Pro Gln Gly Gly Glu Lys Asn Ala Glu
50 55 60
gaa ctt cgc aac acc tac ggc gtc aag gcc aag gcc tac cag tgc aac 240
Glu Leu Arg Asn Thr Tyr Gly Val Lys Ala Lys Ala Tyr Gln Cys Asn
65 70 75 80
gtg ggc gac tgg aac agc gtc aag aag ctc gtg gac gac gtg ctg gcc 288
Val Gly Asp Trp Asn Ser Val Lys Lys Leu Val Asp Asp Val Leu Ala
85 90 95
gag ttt ggc cag att gac gcc ttc att gcc aac gct ggc aag aca gcc 336
Glu Phe Gly Gln Ile Asp Ala Phe Ile Ala Asn Ala Gly Lys Thr Ala
100 105 110
agc agt ggt atc ctg gat ggt tcc gtt gag gac tgg gaa gag gtc atc 384
Ser Ser Gly Ile Leu Asp Gly Ser Val Glu Asp Trp Glu Glu Val Ile
115 120 125
cag aca gac ctg acg ggt acc ttc cac tgc gcc aag gcg gtg ggc ccg 432
Gln Thr Asp Leu Thr Gly Thr Phe His Cys Ala Lys Ala Val Gly Pro
130 135 140
cac ttc aag cag cgc gga acg ggc agc ttc atc atc acc tcc agc atg 480
His Phe Lys Gln Arg Gly Thr Gly Ser Phe Ile Ile Thr Ser Ser Met
145 150 155 160
tcg ggt cac att gcc aac ttc ccg cag gag cag acg tcg tac aac gtt 528
Ser Gly His Ile Ala Asn Phe Pro Gln Glu Gln Thr Ser Tyr Asn Val
165 170 175
gcc aag gca ggc tgc atc cat atg gcc cgg tca ttg gcc aac gag tgg 576
Ala Lys Ala Gly Cys Ile His Met Ala Arg Ser Leu Ala Asn Glu Trp
180 185 190
agg gac ttt gcc cgc gtg aac agc atc tcc ccg ggt tac atc gac acg 624
Arg Asp Phe Ala Arg Val Asn Ser Ile Ser Pro Gly Tyr Ile Asp Thr
195 200 205
ggg ctg tcg gac ttt gtg gat aag aag act cag gat ctg tgg atg tcg 672
Gly Leu Ser Asp Phe Val Asp Lys Lys Thr Gln Asp Leu Trp Met Ser
210 215 220
atg atc ccc atg gga cgc aac ggt gat gcc aag gag ctg aag ggt gca 720
Met Ile Pro Met Gly Arg Asn Gly Asp Ala Lys Glu Leu Lys Gly Ala
225 230 235 240
tat gtc tat ctc gcc agt gat gcc agc aca tac acg acg ggt gcc gat 768
Tyr Val Tyr Leu Ala Ser Asp Ala Ser Thr Tyr Thr Thr Gly Ala Asp
245 250 255
ttg gtc att gac gga gga tac acc gtg cgg taa 801
Leu Val Ile Asp Gly Gly Tyr Thr Val Arg
260 265
<210>26
<211>1602
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(1602)
<400>26
atg agt ggg gta agc ttt gcc cgt cag gcc tta ctc cag gct gct ctt 48
Met Ser Gly Val Ser Phe Ala Arg Gln Ala Leu Leu Gln Ala Ala Leu
1 5 10 15
ctt tcg att gtc tcc gca atc ccg gcg ccc acg gcc ttc gtc aac aat 96
Leu Ser Ile Val Ser Ala Ile Pro Ala Pro Thr Ala Phe Val Asn Asn
20 25 30
gtc gct ccg ccc gag ccc atc atc acc cct tcg ccg gtt caa cat cga 144
Val Ala Pro Pro Glu Pro Ile Ile Thr Pro Ser Pro Val Gln His Arg
35 40 45
cct tct cga gtc gct ggt cga aac att ctg agt gac gtc gat tct gat 192
Pro Ser Arg Val Ala Gly Arg Asn Ile Leu Ser Asp Val Asp Ser Asp
50 55 60
att aac agc atc ctt tct ggc ctt gga tcc gac cta ccc tcc tgg gtc 240
Ile Asn Ser Ile Leu Ser Gly Leu Gly Ser Asp Leu Pro Ser Trp Val
65 70 75 80
gca tcg ggt gtg ccc aac tac ttc cag ggt ttc cct act ggg gat gca 288
Ala Ser Gly Val Pro Asn Tyr Phe Gln Gly Phe Pro Thr Gly Asp Ala
85 90 95
gtg gtg agc tcc ttg ggc ttg aac agc gct gag ttg gca gcc ttg ccc 336
Val Val Ser Ser Leu Gly Leu Asn Ser Ala Glu Leu Ala Ala Leu Pro
100 105 110
acc aat gtc ttg aat atc gac cca tat gcc aac tgg act agc tct ggc 384
Thr Asn Val Leu Asn Ile Asp Pro Tyr Ala Asn Trp Thr Ser Ser Gly
115 120 125
tgg aac gtt cgc ttc cac gga aac gtc tac aag cag ccc aac acc tcc 432
Trp Asn Val Arg Phe His Gly Asn Val Tyr Lys Gln Pro Asn Thr Ser
130 135 140
atc tcc gac ctc aat gat ttg gct gat gtt ttc ctc ggc aat aca agc 480
Ile Ser Asp Leu Asn Asp Leu Ala Asp Val Phe Leu Gly Asn Thr Ser
145 150 155 160
atc tcc gac ctt tcc gaa tcc gag cag aaa cag gct cgg aat tta aca 528
Ile Ser Asp Leu Ser Glu Ser Glu Gln Lys Gln Ala Arg Asn Leu Thr
165 170 175
gcg gaa ata tta gtg gtc cag caa gct cac gtc gcc gta aac aca atc 576
Ala Glu Ile Leu Val Val Gln Gln Ala His Val Ala Val Asn Thr Ile
180 185 190
cac ctg gag cct gca ccg agt cag gga tcc agc gga cag tca ggc ggc 624
His Leu Glu Pro Ala Pro Ser Gln Gly Ser Ser Gly Gln Ser Gly Gly
195 200 205
ggt gga tcc tct aat acc act ggc ggc acc caa gac ctc act ctg ccc 672
Gly Gly Ser Ser Asn Thr Thr Gly Gly Thr Gln Asp Leu Thr Leu Pro
210 215 220
tac aac act aca gtt gaa ggc gat ttt gac act ttc gta ccg att agc 720
Tyr Asn Thr Thr Val Glu Gly Asp Phe Asp Thr Phe Val Pro Ile Ser
225 230 235 240
agc aat ggc ttg acg gca ggt aat gaa act tcg gcg ata caa cgg ctt 768
Ser Asn Gly Leu Thr Ala Gly Asn Glu Thr Ser Ala Ile Gln Arg Leu
245 250 255
aac gtc cat gtg gag ggc gcg aca ata gga aac agt act gcc tat ctc 816
Asn Val His Val Glu Gly Ala Thr Ile Gly Asn Ser Thr Ala Tyr Leu
260 265 270
gta cct ccg acc ggg ctc act gtc gtt tcg gac atc gat gat atc cta 864
Val Pro Pro Thr Gly Leu Thr Val Val Ser Asp Ile Asp Asp Ile Leu
275 280 285
cgc gtc acc aaa atc tat gaa cca gag caa ggt tta ctc aac tca ttt 912
Arg Val Thr Lys Ile Tyr Glu Pro Glu Gln Gly Leu Leu Asn Ser Phe
290 295 300
gcg cgc ccc ttc agg ccg tgg gag aat atg ccg gac atc tat cgc aac 960
Ala Arg Pro Phe Arg Pro Trp Glu Asn Met Pro Asp Ile Tyr Arg Asn
305 310 315 320
tgg tcg atc agt ctc ccc aac ctg cac ttt cac tac cta acg acg acc 1008
Trp Ser Ile Ser Leu Pro Asn Leu His Phe His Tyr Leu Thr Thr Thr
325 330 335
ccc gaa caa gtc acc agg aac tac atg caa ttc atc tac gac aac tac 1056
Pro Glu Gln Val Thr Arg Asn Tyr Met Gln Phe Ile Tyr Asp Asn Tyr
340 345 350
ccc ggt gga tct ttc gac acc cgt ccc ctc aac ttt agc gac gtt tcc 1104
Pro Gly Gly Ser Phe Asp Thr Arg Pro Leu Asn Phe Ser Asp Val Ser
355 360 365
gcc acc ttg tcg atc cgg aaa ttc ctc ctg caa aag gtc ttc gag acc 1152
Ala Thr Leu Ser Ile Arg Lys Phe Leu Leu Gln Lys Val Phe Glu Thr
370 375 380
ttt ccg cag cgc aag ttc atc ctc atc gcc gac acc agc aac agc gac 1200
Phe Pro Gln Arg Lys Phe Ile Leu Ile Ala Asp Thr Ser Asn Ser Asp
385 390 395 400
gtc atg cgt gac tat cct gaa atg gcg acc gac ttc cct ggt caa gtg 1248
Val Met Arg Asp Tyr Pro Glu Met Ala Thr Asp Phe Pro Gly Gln Val
405 410 415
caa tgt att ttt ctc cgg aac acc agc gcc acc gac tca ggg gac aaa 1296
Gln Cys Ile Phe Leu Arg Asn Thr Ser Ala Thr Asp Ser Gly Asp Lys
420 425 430
ttc cca tac gat acc tct ggg ttt aag aag ctc aat cag tca aac tac 1344
Phe Pro Tyr Asp Thr Ser Gly Phe Lys Lys Leu Asn Gln Ser Asn Tyr
435 440 445
atg ttc ttc ttg cat ccc gat gac ttg acg aat cta gac atc gcg aat 1392
Met Phe Phe Leu His Pro Asp Asp Leu Thr Asn Leu Asp Ile Ala Asn
450 455 460
ggc cag tgt tac aac aca tcc att ccg cag aat tta acg ttt agt tat 1440
GLy Gln Cys Tyr Asn Thr Ser Ile Pro Gln Asn Leu Thr Phe Ser Tyr
465 470 475 480
cag ggt ttg cca ttg ggg ctg ggt gat gaa ccc aca gct gtc aat ggg 1488
Gln Gly Leu Pro Leu Gly Leu Gly Asp Glu Pro Thr Ala Val Asn Gly
485 490 495
tct gcc aat cat act gct gag tcg gcg gcc ggt ttg tcg gta aag ggt 1536
Ser Ala Asn His Thr Ala Glu Ser Ala Ala Gly Leu Ser Val Lys Gly
500 505 510
ggg act gat atg cag ggt ttg atc ttt ctg ttc acc ctg gtt acg gcc 1584
Gly Thr Asp Met Gln Gly Leu Ile Phe Leu Phe Thr Leu Val Thr Ala
515 520 525
tat tcc att ttc ttg taa 1602
Tyr Ser Ile Phe Leu
530
<210>27
<211>1392
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(1392)
<400>27
atg tcg aag tcg aat ggc gtc agc ctg gca ttc ccc gcc gaa gca gcg 48
Met Ser Lys Ser Asn Gly Val Ser Leu Ala Phe Pro Ala Glu Ala Ala
1 5 10 15
aca aag gaa tat gca gca tct cta gac tct tct gat aga ctt gct gca 96
Thr Lys Glu Tyr Ala Ala Ser Leu Asp Ser Ser Asp Arg Leu Ala Ala
20 25 30
ttt cgg gag aag ttc atc gtc cca tcg aaa gca aat att gct tcc aaa 144
Phe Arg Glu Lys Phe Ile Val Pro Ser Lys Ala Asn Ile Ala Ser Lys
35 40 45
aag cta gca aag cct ggc ctt tcg ccc gag tca tgc att tac ttc tgc 192
Lys Leu Ala Lys Pro Gly Leu Ser Pro Glu Ser Cys Ile Tyr Phe Cys
50 55 60
ggt aac tca ctt ggc att caa ccc aag gcc aca gca aag tac tta gaa 240
Gly Asn Ser Leu Gly Ile Gln Pro Lys Ala Thr Ala Lys Tyr Leu Glu
65 70 75 80
gca cag ttg gac act tgg tca tct att gga gtt ggc ggc cac ttc act 288
Ala Gln Leu Asp Thr Trp Ser Ser Ile Gly Val Gly Gly His Phe Thr
85 90 95
gat ctt gag ggc tca ccc ttg aag caa tgg cag ctg ctc tca gag caa 336
Asp Leu Glu Gly Ser Pro Leu Lys Gln Trp Gln Leu Leu Ser Glu Gln
100 105 110
gca gct gat tca atg agc aag att gtg gga gca aag cca gaa gaa gtc 384
Ala Ala Asp Ser Met Ser Lys Ile Val Gly Ala Lys Pro Glu Glu Val
115 120 125
gca gcg atg gga aca ctt aca acg aac ctt cat ctt ctg ctg gct agt 432
Ala Ala Met Gly Thr Leu Thr Thr Asn Leu His Leu Leu Leu Ala Ser
130 135 140
ttc tat aaa ccg act caa aca aag cac aag atc ttg atg gat tgg aag 480
Phe Tyr Lys Pro Thr Gln Thr Lys His Lys Ile Leu Met Asp Trp Lys
145 150 155 160
gct ttc cca agt gat cac tac gct atc gaa tct cat att gcc tgg cat 528
Ala Phe Pro Ser Asp His Tyr Ala Ile Glu Ser His Ile Ala Trp His
165 170 175
gac ctg gat cct aag gag tct atg gtg ctc atc ggt cca gat gaa ggc 576
Asp Leu Asp Pro Lys Glu Ser Met Val Leu Ile Gly Pro Asp Glu Gly
180 185 190
gaa tac gag ata tcc acc cag aag att ttc tct tat atc gac aag cat 624
Glu Tyr Glu Ile Ser Thr Gln Lys Ile Phe Ser Tyr Ile Asp Lys His
195 200 205
gct gat gag gct gct atg att ctt ctt cct ggt att caa tat tat act 672
Ala Asp Glu Ala Ala Met Ile Leu Leu Pro Gly Ile Gln Tyr Tyr Thr
210 215 220
ggg caa ctg ttc gat atc cag aaa att aca aaa tat gcc cat tcg cgc 720
Gly Gln Leu Phe Asp Ile Gln Lys Ile Thr Lys Tyr Ala His Ser Arg
225 230 235 240
aac atg gtt gtt ggc tgg gat ctg gcc cat gcg ttc gct aat gtt gag 768
Asn Met Val Val Gly Trp Asp Leu Ala His Ala Phe Ala Asn Val Glu
245 250 255
cta aag ctg cat gat tgg aac gtt gat ttt gca gca tgg tgc aca tat 816
Leu Lys Leu His Asp Trp Asn Val Asp Phe Ala Ala Trp Cys Thr Tyr
260 265 270
aag tac gga aac gcc ggt cct gga gca atg ggg ggg ctt ttc gtg cat 864
Lys Tyr Gly Asn Ala Gly Pro Gly Ala Met Gly Gly Leu Phe Val His
275 280 285
gaa caa cac gga gag gtc gat tac agc gcg gga gaa gat gca ccc aaa 912
Glu Gln His Gly Glu Val Asp Tyr Ser Ala Gly Glu Asp Ala Pro Lys
290 295 300
ttc cgc cat cgt ctg acc ggg tgg tat ggt ggc gat cga tcg gta aga 960
Phe Arg His Arg Leu Thr Gly Trp Tyr Gly Gly Asp Arg Ser Val Arg
305 310 315 320
ttc aag atg gac aac aag ttc aaa cct att cct ggg gca gga gga ttt 1008
Phe Lys Met Asp Asn Lys Phe Lys Pro Ile Pro Gly Ala Gly Gly Phe
325 330 335
cag ata tca aat cct tcg gcc atc gac ctt gcg tgt ctt tgt gcc gct 1056
Gln Ile Ser Asn Pro Ser Ala Ile Asp Leu Ala Cys Leu Cys Ala Ala
340 345 350
tta tcg gtg ttt gat gag acg tca atg gca gat ctt cgc aga aaa tca 1104
Leu Ser Val Phe Asp Glu Thr Ser Met Ala Asp Leu Arg Arg Lys Ser
355 360 365
ttg aag cta aca gca tac ctt gag ttc ctt ttg ctc agg gat tat gaa 1152
Leu Lys Leu Thr Ala Tyr Leu Glu Phe Leu Leu Leu Arg Asp Tyr Glu
370 375 380
gaa gaa tct agg cca ttc agc att atc acg ccc aag gac ccc gag gcg 1200
Glu Glu Ser Arg Pro Phe Ser Ile Ile Thr Pro Lys Asp Pro Glu Ala
385 390 395 400
aga ggc gca caa ctg agt cta ttg ctc aag cct ggt cta tta cag aat 1248
Arg Gly Ala Gln Leu Ser Leu Leu Leu Lys Pro Gly Leu Leu Gln Asn
405 410 415
gtt gca cag aag ttg caa gaa gca gga ata gtc tgc gat aaa cgg gag 1296
Val Ala Gln Lys Leu Gln Glu Ala Gly Ile Val Cys Asp Lys Arg Glu
420 425 430
ccg ggt gtt gtg cgt gtc gct ccg gtt cct ttg tac aac agc ttc agc 1344
Pro Gly Val Val Arg Val Ala Pro Val Pro Leu Tyr Asn Ser Phe Ser
435 440 445
gag gtt tgg aca ttt gtg aag atc ttc aag gat gca ctg cag cag tga 1392
Glu Val Trp Thr Phe Val Lys Ile Phe Lys Asp Ala Leu Gln Gln
450 455 460
<210>28
<211>1143
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(1143)
<400>28
atg gat gtg act aat ttg gct gtc gat tgt ccc gtt ata gag acc ggt 48
Met Asp Val Thr Asn Leu Ala Val Asp Cys Pro Val Ile Glu Thr Gly
1 5 10 15
tcc ctt gct ttg tgg atg gct tcc tcc gaa gtg gac cag aag gcc ttg 96
Ser Leu Ala Leu Trp Met Ala Ser Ser Glu Val Asp Gln Lys Ala Leu
20 25 30
ggc aac ttt gcg gcc ata acg ggc ctc gag aac ccg ttc ctg tcc gcg 144
Gly Asn Phe Ala Ala Ile Thr Gly Leu Glu Asn Pro Phe Leu Ser Ala
35 40 45
atg ctg tac aag att ctg ggg ttg tct gtt atg tta tcg aag aaa ctc 192
Met Leu Tyr Lys Ile Leu Gly Leu Ser Val Met Leu Ser Lys Lys Leu
50 55 60
ctc cgt gca cga cga ttg cgg cgc cta gac ccc acc cga gag act aaa 240
Leu Arg Ala Arg Arg Leu Arg Arg Leu Asp Pro Thr Arg Glu Thr Lys
65 70 75 80
tcg ctt cat ctt tat tac cat atc atc tgg ctt tcg cgt gag ggt ctt 288
Ser Leu His Leu Tyr Tyr His Ile Ile Trp Leu Ser Arg Glu Gly Leu
85 90 95
ctg ata tta gag gag ttc gtc ctg cca ctg gtt gag gga ttt atg gaa 336
Leu Ile Leu Glu Glu Phe Val Leu Pro Leu Val Glu Gly Phe Met Glu
100 105 110
ctc aaa att tta gct tac aag ctg cgc gcc tcc ttt tac cat ata ttc 384
Leu Lys Ile Leu Ala Tyr Lys Leu Arg Ala Ser Phe Tyr His Ile Phe
115 120 125
gtc cta ttt cag aac cag cct gct gtc cac tcg ccg ggt atc gtt agt 432
Val Leu Phe Gln Asn Gln Pro Ala Val His Ser Pro Gly Ile Val Ser
130 135 140
ctg ccg agt agt aca cct tta tcc aac ggc gtg aca gaa gcg gag tca 480
Leu Pro Ser Ser Thr Pro Leu Ser Asn Gly Val Thr Glu Ala Glu Ser
145 150 155 160
cca tcc aag gat tcc aat ttg aga ttt tca ttt cag ctg aag ccc gac 528
Pro Ser Lys Asp Ser Asn Leu Arg Phe Ser Phe Gln Leu Lys Pro Asp
165 170 175
acg ata acg gtt tcc ggg aag ccc agt tcc gcc tcg gat agt gcg cca 576
Thr Ile Thr Val Ser Gly Lys Pro Ser Ser Ala Ser Asp Ser Ala Pro
180 185 190
cga ggc aag gtt acg cag gca ccc ccg ggc ttt gcg ccg gtt caa ccg 624
Arg Gly Lys Val Thr Gln Ala Pro Pro Gly Phe Ala Pro Val Gln Pro
195 200 205
ccc aag tcg aac tcg gcg ttt ctc ctc cct gct ctc gat tat acc cct 672
Pro Lys Ser Asn Ser Ala Phe Leu Leu Pro Ala Leu Asp Tyr Thr Pro
210 215 220
aca gct acc gca tgc ttc aat cat gcc gcc ctc ttg gca gat caa ttc 720
Thr Ala Thr Ala Cys Phe Asn His Ala Ala Leu Leu Ala Asp Gln Phe
225 230 235 240
ctc ccg ggg tcg cac ccg ctc cgt ctg tcc atc aag ctt gaa ttt gcc 768
Leu Pro Gly Ser His Pro Leu Arg Leu Ser Ile Lys Leu Glu Phe Ala
245 250 255
gcc tac ctc tac gat tgc cta cat gac gct cat gcc tgt cga cgg ttg 816
Ala Tyr Leu Tyr Asp Cys Leu His Asp Ala His Ala Cys Arg Arg Leu
260 265 270
gcc aag caa gcc att gcc gat gtg tac aat gcg caa gag ggc atg gac 864
Ala Lys Gln Ala Ile Ala Asp Val Tyr Asn Ala Gln Glu Gly Met Asp
275 280 285
gac gag agc ttc gag gat gca gct gag att gtg ggt att ttg ggc aag 912
Asp Glu Ser Phe Glu Asp Ala Ala Glu Ile Val Gly Ile Leu Gly Lys
290 295 300
atg gtg aag cgg gga agg aac aca agc agt gct gga aat agc acc acg 960
Met Val Lys Arg Gly Arg Asn Thr Ser Ser Ala Gly Asn Ser Thr Thr
305 310 315 320
gct gtg aaa acg ccc cag gag gag cga agt gag ggc agt cga aca cca 1008
Ala Val Lys Thr Pro Gln Glu Glu Arg Ser Glu Gly Ser Arg Thr Pro
325 330 335
tcc tct cag aca acg ttg aaa agg ccg gcg cga gtg ccg aaa agc acc 1056
Ser Ser Gln Thr Thr Leu Lys Arg Pro Ala Arg Val Pro Lys Ser Thr
340 345 350
tcc tca ccg gcg cgc gcg acc aag ccg acg act agc gag ggg atg tcc 1104
Ser Ser Pro Ala Arg Ala Thr Lys Pro Thr Thr Ser Glu Gly Met Ser
355 360 365
ccc gct gtg ccc gac ccc acc atg atg aat ccc ata tga 1143
Pro Ala Val Pro Asp Pro Thr Met Met Asn Pro Ile
370 375 380
<210>29
<211>1779
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(1779)
<400>29
atg aga aat ttg gag tgt gtc tac aca aaa tca cga agg tat ccc tcg 48
Met Arg Asn Leu Glu Cys Val Tyr Thr Lys Ser Arg Arg Tyr Pro Ser
1 5 10 15
tct atc ttt ccg aca ctc agg agg tcg tca act agt ccg aac acg gcg 96
Ser Ile Phe Pro Thr Leu Arg Arg Ser Ser Thr Ser Pro Asn Thr Ala
20 25 30
tcc tct cct gac act aat gcc tca tct tcg cca tgc tcg gac tct agt 144
Ser Ser Pro Asp Thr Asn Ala Ser Ser Ser Pro Cys Ser Asp Ser Ser
35 40 45
ggg acc cat gct ggc att tcc att ccc cac tca gat agt ccc gcc agt 192
Gly Thr His Ala Gly Ile Ser Ile Pro His Ser Asp Ser Pro Ala Ser
50 55 60
gtg gac gaa tgt ggg aac aac ggc ctt ttc gac ggg gaa tct cta act 240
Val Asp Glu Cys Gly Asn Asn Gly Leu Phe Asp Gly Glu Ser Leu Thr
65 70 75 80
caa tta ttg gtc tct ggg agc aaa gcc ata tca ggc caa cca cat atc 288
Gln Leu Leu Val Ser Gly Ser Lys Ala Ile Ser Gly Gln Pro His Ile
85 90 95
gcc att aag cca cat gtt ctg tct acc tat ccc ctt gac aac ctc ctc 336
Ala Ile Lys Pro His Val Leu Ser Thr Tyr Pro Leu Asp Asn Leu Leu
100 105 110
tca gac att gag gga ctc ctc gag cag cca gtc tct cat ttg gct caa 384
Ser Asp Ile Glu Gly Leu Leu Glu Gln Pro Val Ser His Leu Ala Gln
115 120 125
agc aag gaa gat cta aca aaa ccg gac cgg atg ttt cga act cgc ctt 432
Ser Lys Glu Asp Leu Thr Lys Pro Asp Arg Met Phe Arg Thr Arg Leu
130 135 140
cca gcg gtc tca ggt gag gac aat gag tat ctg cta agg aaa gga gct 480
Pro Ala Val Ser Gly Glu Asp Asn Glu Tyr Leu Leu Arg Lys Gly Ala
145 150 155 160
ctg ctg ctc ttg cca cca gcc ttg cgc aac gaa cta ttg gcg gca tat 528
Leu Leu Leu Leu Pro Pro Ala Leu Arg Asn Glu Leu Leu Ala Ala Tyr
165 170 175
gtc aac tac gtc cat ccg cta tta ccg att ctt gat ctt gga gac ttt 576
Val Asn Tyr Val His Pro Leu Leu Pro Ile Leu Asp Leu Gly Asp Phe
180 185 190
ctc tca caa atc att gtt gga gat gat gct caa ttc aag tca cca cta 624
Leu Ser Gln Ile Ile Val Gly Asp Asp Ala Gln Phe Lys Ser Pro Leu
195 200 205
tta tac caa gct gtc atg ttc gcg ggc agt att ttt gct cag cga gac 672
Leu Tyr Gln Ala Val Met Phe Ala Gly Ser Ile Phe Ala Gln Arg Asp
210 215 220
ggc aca gac gaa cct gaa cag cta acg agg gct tta ttt gaa cgt aca 720
Gly Thr Asp Glu Pro Glu Gln Leu Thr Arg Ala Leu Phe Glu Arg Thr
225 230 235 240
aag gtt cta tac gag ttt gaa tcc gaa tca tgt gcc tac act caa att 768
Lys Val Leu Tyr Glu Phe Glu Ser Glu Ser Cys Ala Tyr Thr Gln Ile
245 250 255
caa gct ctc tta ttg atg act ctc tgg cat gga gat atg tca cgc cac 816
Gln Ala Leu Leu Leu Met Thr Leu Trp His Gly Asp Met Ser Arg His
260 265 270
aaa ggc ccg tct tac tgg ctt gac gtc gcc ttc tcc act gcg gaa aga 864
Lys Gly Pro Ser Tyr Trp Leu Asp Val Ala Phe Ser Thr Ala Glu Arg
275 280 285
att ggc cta ctc cat gat gaa gac tgg cca tgc gat agc cgt tcc ttc 912
Ile Gly Leu Leu His Asp Glu Asp Trp Pro Cys Asp Ser Arg Ser Phe
290 295 300
cga tcc gct atg tgg tgt tgc ctt tac gta cgt gat cga aca atc tcg 960
Arg Ser Ala Met Trp Cys Cys Leu Tyr Val Arg Asp Arg Thr Ile Ser
305 310 315 320
ctt ggg tct cgt cgg cct cca cgg atg cca gtc aac aaa tat ccg gac 1008
Leu Gly Ser Arg Arg Pro Pro Arg Met Pro Val Asn Lys Tyr Pro Asp
325 330 335
tca att ctc cat ctt atg agc gac gca cct cgg gaa tat gac gaa ata 1056
Ser Ile Leu His Leu Met Ser Asp Ala Pro Arg Glu Tyr Asp Glu Ile
340 345 350
att ctt gag agt cta ggt agc gct tct ctg atg ctt aca agc act tac 1104
Ile Leu Glu Ser Leu Gly Ser Ala Ser Leu Met Leu Thr Ser Thr Tyr
355 360 365
caa gaa caa tcg acc atg ctc ttc aag gaa ctt gtc aaa ctc tcc tac 1152
Gln Glu Gln Ser Thr Met Leu Phe Lys Glu Leu Val Lys Leu Ser Tyr
370 375 380
tgc gtc ggg gca atc tta gat tat cta tac gaa ggg gcc tgg gtc cga 1200
Cys Val Gly Ala Ile Leu Asp Tyr Leu Tyr Glu Gly Ala Trp Val Arg
385 390 395 400
ata cca aca cgt cgc agc agc ttt tat tca ctc gcc cct aaa tgc agc 1248
Ile Pro Thr Arg Arg Ser Ser Phe Tyr Ser Leu Ala Pro Lys Cys Ser
405 410 415
atc tcg cca tcc atc aga cca agc tgt gag aaa cta ctt tac tct tgg 1296
Ile Ser Pro Ser Ile Arg Pro Ser Cys Glu Lys Leu Leu Tyr Ser Trp
420 425 430
att caa ttc ctc cct ctc aac gca gtc tac cat ccg cca cag ttg ccc 1344
Ile Gln Phe Leu Pro Leu Asn Ala Val Tyr His Pro Pro Gln Leu Pro
435 440 445
gcc gat gcg gaa ggg gag tca gcc gaa aca gtc ttc ctt gtc cac aaa 1392
Ala Asp Ala Glu Gly Glu Ser Ala Glu Thr Val Phe Leu Val His Lys
450 455 460
gcc ttc ctt tac ttg ctg tac cta gcc tcc atg gca gtc ata tac cgc 1440
Ala Phe Leu Tyr Leu Leu Tyr Leu Ala Ser Met Ala Val Ile Tyr Arg
465 470 475 480
aca ggc act cat agc caa caa acc agc acg gca act ccg aac atg gaa 1488
Thr Gly Thr His Ser Gln Gln Thr Ser Thr Ala Thr Pro Asn Met Glu
485 490 495
ggt cta cgg gca tcg acg tca caa ata aaa aag gtc ctt gcg gag ctg 1536
Gly Leu Arg Ala Ser Thr Ser Gln Ile Lys Lys Val Leu Ala Glu Leu
500 505 510
cag ggc atg gga ctg ctt cag ttc ctt cca ggg gca tca gtc act atc 1584
Gln Gly Met Gly Leu Leu Gln Phe Leu Pro Gly Ala Ser Val Thr Ile
515 520 525
ctg atg ttc gct gtg gag gct agt ctg ttg gat ctc cag ggc tcg gat 1632
Leu Met Phe Ala Val Glu Ala Ser Leu Leu Asp Leu Gln Gly Ser Asp
530 535 540
acc atg gtc cga agg cag gct atg tca aat cta tat gcc tgt gag gag 1680
Thr Met Val Arg Arg Gln Ala Met Ser Asn Leu Tyr Ala Cys Glu Glu
545 550 555 560
gct gcg tta cac ttg atg cag gct tat cct acg gct gag atg gcg gta 1728
Ala Ala Leu His Leu Met Gln Ala Tyr Pro Thr Ala Glu Met Ala Val
565 570 575
ttg aag act agg aca gcc cgt gca aac ctt ctt ggg ttg gtt gag aca 1776
Leu Lys Thr Arg Thr Ala Arg Ala Asn Leu Leu Gly Leu Val Glu Thr
580 585 590
tga 1779
<210>30
<211>266
<212>PRT
<213>Aspergillus niger
<400>30
Met Pro Ile Ser Ile Pro Ser Ala Ser Ser Val His Asp Leu Phe Ser
1 5 10 15
Leu Lys Gly Lys Val Val Val Ile Thr Gly Ala Ser Gly Pro Arg Gly
20 25 30
Met Gly Ile Glu Ala Ala Arg Gly Cys Ala Glu Met Gly Ala Asn Ile
35 40 45
Ala Leu Thr Tyr Ser Ser Arg Pro Gln Gly Gly Glu Lys Asn Ala Glu
50 55 60
Glu Leu Arg Asn Thr Tyr Gly Val Lys Ala Lys Ala Tyr Gln Cys Asn
65 70 75 80
Val Gly Asp Trp Asn Ser Val Lys Lys Leu Val Asp Asp Val Leu Ala
85 90 95
Glu Phe Gly Gln Ile Asp Ala Phe Ile Ala Asn Ala Gly Lys Thr Ala
100 105 110
Ser Ser Gly Ile Leu Asp Gly Ser Val Glu Asp Trp Glu Glu Val Ile
115 120 125
Gln Thr Asp Leu Thr Gly Thr Phe His Cys Ala Lys Ala Val Gly Pro
130 135 140
His Phe Lys Gln Arg Gly Thr Gly Ser Phe Ile Ile Thr Ser Ser Met
145 150 155 160
Ser Gly His Ile Ala Asn Phe Pro Gln Glu Gln Thr Ser Tyr Asn Val
165 170 175
Ala Lys Ala Gly Cys Ile His Met Ala Arg Ser Leu Ala Asn Glu Trp
180 185 190
Arg Asp Phe Ala Arg Val Asn Ser Ile Ser Pro Gly Tyr Ile Asp Thr
195 200 205
Gly Leu Ser Asp Phe Val Asp Lys Lys Thr Gln Asp Leu Trp Met Ser
210 215 220
Met Ile Pro Met Gly Arg Asn Gly Asp Ala Lys Glu Leu Lys Gly Ala
225 230 235 240
Tyr Val Tyr Leu Ala Ser Asp Ala Ser Thr Tyr Thr Thr Gly Ala Asp
245 250 255
Leu Val Ile Asp Gly Gly Tyr Thr Val Arg
260 265
<210>31
<211>533
<212>PRT
<213>Aspergillus niger
<400>31
Met Ser Gly Val Ser Phe Ala Arg Gln Ala Leu Leu Gln Ala Ala Leu
1 5 10 15
Leu Ser Ile Val Ser Ala Ile Pro Ala Pro Thr Ala Phe Val Asn Asn
20 25 30
Val Ala Pro Pro Glu Pro Ile Ile Thr Pro Ser Pro Val Gln His Arg
35 40 45
Pro Ser Arg Val Ala Gly Arg Asn Ile Leu Ser Asp Val Asp Ser Asp
50 55 60
Ile Asn Ser Ile Leu Ser Gly Leu Gly Ser Asp Leu Pro Ser Trp Val
65 70 75 80
Ala Ser Gly Val Pro Asn Tyr Phe Gln Gly Phe Pro Thr Gly Asp Ala
85 90 95
Val Val Ser Ser Leu Gly Leu Asn Ser Ala Glu Leu Ala Ala Leu Pro
100 105 110
Thr Asn Val Leu Asn Ile Asp Pro Tyr Ala Asn Trp Thr Ser Ser Gly
115 120 125
Trp Asn Val Arg Phe His Gly Asn Val Tyr Lys Gln Pro Asn Thr Ser
130 135 140
Ile Ser Asp Leu Asn Asp Leu Ala Asp Val Phe Leu Gly Asn Thr Ser
145 150 155 160
Ile Ser Asp Leu Ser Glu Ser Glu Gln Lys Gln Ala Arg Asn Leu Thr
165 170 175
Ala Glu Ile Leu Val Val Gln Gln Ala His Val Ala Val Asn Thr Ile
180 185 190
His Leu Glu Pro Ala Pro Ser Gln Gly Ser Ser Gly Gln Ser Gly Gly
195 200 205
Gly Gly Ser Ser Asn Thr Thr Gly Gly Thr Gln Asp Leu Thr Leu Pro
210 215 220
Tyr Asn Thr Thr Val Glu Gly Asp Phe Asp Thr Phe Val Pro Ile Ser
225 230 235 240
Ser Asn Gly Leu Thr Ala Gly Asn Glu Thr Ser Ala Ile Gln Arg Leu
245 250 255
Asn Val His Val Glu Gly Ala Thr Ile Gly Asn Ser Thr Ala Tyr Leu
260 265 270
Val Pro Pro Thr Gly Leu Thr Val Val Ser Asp Ile Asp Asp Ile Leu
275 280 285
Arg Val Thr Lys Ile Tyr Glu Pro Glu Gln Gly Leu Leu Asn Ser Phe
290 295 300
Ala Arg Pro Phe Arg Pro Trp Glu Asn Met Pro Asp Ile Tyr Arg Asn
305 310 315 320
Trp Ser Ile Ser Leu Pro Asn Leu His Phe His Tyr Leu Thr Thr Thr
325 330 335
Pro Glu Gln Val Thr Arg Asn Tyr Met Gln Phe Ile Tyr Asp Asn Tyr
340 345 350
Pro Gly Gly Ser Phe Asp Thr Arg Pro Leu Asn Phe Ser Asp Val Ser
355 360 365
Ala Thr Leu Ser Ile Arg Lys Phe Leu Leu Gln Lys Val Phe Glu Thr
370 375 380
Phe Pro Gln Arg Lys Phe Ile Leu Ile Ala Asp Thr Ser Asn Ser Asp
385 390 395 400
Val Met Arg Asp Tyr Pro Glu Met Ala Thr Asp Phe Pro Gly Gln Val
405 410 415
Gln Cys Ile Phe Leu Arg Asn Thr Ser Ala Thr Asp Ser Gly Asp Lys
420 425 430
Phe Pro Tyr Asp Thr Ser Gly Phe Lys Lys Leu Asn Gln Ser Asn Tyr
435 440 445
Met Phe Phe Leu His Pro Asp Asp Leu Thr Asn Leu Asp Ile Ala Asn
450 455 460
Gly Gln Cys Tyr Asn Thr Ser Ile Pro Gln Asn Leu Thr Phe Ser Tyr
465 470 475 480
Gln Gly Leu Pro Leu Gly Leu Gly Asp Glu Pro Thr Ala Val Asn Gly
485 490 495
Ser Ala Asn His Thr Ala Glu Ser Ala Ala Gly Leu Ser Val Lys Gly
500 505 510
Gly Thr Asp Met Gln Gly Leu Ile Phe Leu Phe Thr Leu Val Thr Ala
515 520 525
Tyr Ser Ile Phe Leu
530
<210>32
<211>463
<212>PRT
<213>Aspergillus niger
<400>32
Met Ser Lys Ser Asn Gly Val Ser Leu Ala Phe Pro Ala Glu Ala Ala
1 5 10 15
Thr Lys Glu Tyr Ala Ala Ser Leu Asp Ser Ser Asp Arg Leu Ala Ala
20 25 30
Phe Arg Glu Lys Phe Ile Val Pro Ser Lys Ala Asn Ile Ala Ser Lys
35 40 45
Lys Leu Ala Lys Pro Gly Leu Ser Pro Glu Ser Cys Ile Tyr Phe Cys
50 55 60
Gly Asn Ser Leu Gly Ile Gln Pro Lys Ala Thr Ala Lys Tyr Leu Glu
65 70 75 80
Ala Gln Leu Asp Thr Trp Ser Ser Ile Gly Val Gly Gly His Phe Thr
85 90 95
Asp Leu Glu Gly Ser Pro Leu Lys Gln Trp Gln Leu Leu Ser Glu Gln
100 105 110
Ala Ala Asp Ser Met Ser Lys Ile Val Gly Ala Lys Pro Glu Glu Val
115 120 125
Ala Ala Met Gly Thr Leu Thr Thr Asn Leu His Leu Leu Leu Ala Ser
130 135 140
Phe Tyr Lys Pro Thr Gln Thr Lys His Lys Ile Leu Met Asp Trp Lys
145 150 155 160
Ala Phe Pro Ser Asp His Tyr Ala Ile Glu Ser His Ile Ala Trp His
165 170 175
Asp Leu Asp Pro Lys Glu Ser Met Val Leu Ile Gly Pro Asp Glu Gly
180 185 190
Glu Tyr Glu Ile Ser Thr Gln Lys Ile Phe Ser Tyr Ile Asp Lys His
195 200 205
Ala Asp Glu Ala Ala Met Ile Leu Leu Pro Gly Ile Gln Tyr Tyr Thr
210 215 220
Gly Gln Leu Phe Asp Ile Gln Lys Ile Thr Lys Tyr Ala His Ser Arg
225 230 235 240
Asn Met Val Val Gly Trp Asp Leu Ala His Ala Phe Ala Asn Val Glu
245 250 255
Leu Lys Leu His Asp Trp Asn Val Asp Phe Ala Ala Trp Cys Thr Tyr
260 265 270
Lys Tyr Gly Asn Ala Gly Pro Gly Ala Met Gly Gly Leu Phe Val His
275 280 285
Glu Gln His Gly Glu Val Asp Tyr Ser Ala Gly Glu Asp Ala Pro Lys
290 295 300
Phe Arg His Arg Leu Thr Gly Trp Tyr Gly Gly Asp Arg Ser Val Arg
305 310 315 320
Phe Lys Met Asp Asn Lys Phe Lys Pro Ile Pro Gly Ala Gly Gly Phe
325 330 335
Gln Ile Ser Asn Pro Ser Ala Ile Asp Leu Ala Cys Leu Cys Ala Ala
340 345 350
Leu Ser Val Phe Asp Glu Thr Ser Met Ala Asp Leu Arg Arg Lys Ser
355 360 365
Leu Lys Leu Thr Ala Tyr Leu Glu Phe Leu Leu Leu Arg Asp Tyr Glu
370 375 380
Glu Glu Ser Arg Pro Phe Ser Ile Ile Thr Pro Lys Asp Pro Glu Ala
385 390 395 400
Arg Gly Ala Gln Leu Ser Leu Leu Leu Lys Pro Gly Leu Leu Gln Asn
405 410 415
Val Ala Gln Lys Leu Gln Glu Ala Gly Ile Val Cys Asp Lys Arg Glu
420 425 430
Pro Gly Val Val Arg Val Ala Pro Val Pro Leu Tyr Asn Ser Phe Ser
435 440 445
Glu Val Trp Thr Phe Val Lys Ile Phe Lys Asp Ala Leu Gln Gln
450 455 460
<210>33
<211>380
<212>PRT
<213>Aspergillus niger
<400>33
Met Asp Val Thr Asn Leu Ala Val Asp Cys Pro Val Ile Glu Thr Gly
1 5 10 15
Ser Leu Ala Leu Trp Met Ala Ser Ser Glu Val Asp Gln Lys Ala Leu
20 25 30
Gly Asn Phe Ala Ala Ile Thr Gly Leu Glu Asn Pro Phe Leu Ser Ala
35 40 45
Met Leu Tyr Lys Ile Leu Gly Leu Ser Val Met Leu Ser Lys Lys Leu
50 55 60
Leu Arg Ala Arg Arg Leu Arg Arg Leu Asp Pro Thr Arg Glu Thr Lys
65 70 75 80
Ser Leu His Leu Tyr Tyr His Ile Ile Trp Leu Ser Arg Glu Gly Leu
85 90 95
Leu Ile Leu Glu Glu Phe Val Leu Pro Leu Val Glu Gly Phe Met Glu
100 105 110
Leu Lys Ile Leu Ala Tyr Lys Leu Arg Ala Ser Phe Tyr His Ile Phe
115 120 125
Val Leu Phe Gln Asn Gln Pro Ala Val His Ser Pro Gly Ile Val Ser
130 135 140
Leu Pro Ser Ser Thr Pro Leu Ser Asn Gly Val Thr Glu Ala Glu Ser
145 150 155 160
Pro Ser Lys Asp Ser Asn Leu Arg Phe Ser Phe Gln Leu Lys Pro Asp
165 170 175
Thr Ile Thr Val Ser Gly Lys Pro Ser Ser Ala Ser Asp Ser Ala Pro
180 185 190
Arg Gly Lys Val Thr Gln Ala Pro Pro Gly Phe Ala Pro Val Gln Pro
195 200 205
Pro Lys Ser Asn Ser Ala Phe Leu Leu Pro Ala Leu Asp Tyr Thr Pro
210 215 220
Thr Ala Thr Ala Cys Phe Asn His Ala Ala Leu Leu Ala Asp Gln Phe
225 230 235 240
Leu Pro Gly Ser His Pro Leu Arg Leu Ser Ile Lys Leu Glu Phe Ala
245 250 255
Ala Tyr Leu Tyr Asp Cys Leu His Asp Ala His Ala Cys Arg Arg Leu
260 265 270
Ala Lys Gln Ala Ile Ala Asp Val Tyr Asn Ala Gln Glu Gly Met Asp
275 280 285
Asp Glu Ser Phe Glu Asp Ala Ala Glu Ile Val Gly Ile Leu Gly Lys
290 295 300
Met Val Lys Arg Gly Arg Asn Thr Ser Ser Ala Gly Asn Ser Thr Thr
305 310 315 320
Ala Val Lys Thr Pro Gln Glu Glu Arg Ser Glu Gly Ser Arg Thr Pro
325 330 335
Ser Ser Gln Thr Thr Leu Lys Arg Pro Ala Arg Val Pro Lys Ser Thr
340 345 350
Ser Ser Pro Ala Arg Ala Thr Lys Pro Thr Thr Ser Glu Gly Met Ser
355 360 365
Pro Ala Val Pro Asp Pro Thr Met Met Asn Pro Ile
370 375 380
<210>34
<211>592
<212>PRT
<213>Aspergillus niger
<400>34
Met Arg Asn Leu Glu Cys Val Tyr Thr Lys Ser Arg Arg Tyr Pro Ser
1 5 10 15
Ser Ile Phe Pro Thr Leu Arg Arg Ser Ser Thr Ser Pro Asn Thr Ala
20 25 30
Ser Ser Pro Asp Thr Asn Ala Ser Ser Ser Pro Cys Ser Asp Ser Ser
35 40 45
Gly Thr His Ala Gly Ile Ser Ile Pro His Ser Asp Ser Pro Ala Ser
50 55 60
Val Asp Glu Cys Gly Asn Asn Gly Leu Phe Asp Gly Glu Ser Leu Thr
65 70 75 80
Gln Leu Leu Val Ser Gly Ser Lys Ala Ile Ser Gly Gln Pro His Ile
85 90 95
Ala Ile Lys Pro His Val Leu Ser Thr Tyr Pro Leu Asp Asn Leu Leu
100 105 110
Ser Asp Ile Glu Gly Leu Leu Glu Gln Pro Val Ser His Leu Ala Gln
115 120 125
Ser Lys Glu Asp Leu Thr Lys Pro Asp Arg Met Phe Arg Thr Arg Leu
130 135 140
Pro Ala Val Ser Gly Glu Asp Asn Glu Tyr Leu Leu Arg Lys Gly Ala
145 150 155 160
Leu Leu Leu Leu Pro Pro Ala Leu Arg Asn Glu Leu Leu Ala Ala Tyr
165 170 175
Val Asn Tyr Val His Pro Leu Leu Pro Ile Leu Asp Leu Gly Asp Phe
180 185 190
Leu Ser Gln Ile Ile Val Gly Asp Asp Ala Gln Phe Lys Ser Pro Leu
195 200 205
Leu Tyr Gln Ala Val Met Phe Ala Gly Ser Ile Phe Ala Gln Arg Asp
210 215 220
Gly Thr Asp Glu Pro Glu Gln Leu Thr Arg Ala Leu Phe Glu Arg Thr
225 230 235 240
Lys Val Leu Tyr Glu Phe Glu Ser Glu Ser Cys Ala Tyr Thr Gln Ile
245 250 255
Gln Ala Leu Leu Leu Met Thr Leu Trp His Gly Asp Met Ser Arg His
260 265 270
Lys Gly Pro Ser Tyr Trp Leu Asp Val Ala Phe Ser Thr Ala Glu Arg
275 280 285
Ile Gly Leu Leu His Asp Glu Asp Trp Pro Cys Asp Ser Arg Ser Phe
290 295 300
Arg Ser Ala Met Trp Cys Cys Leu Tyr Val Arg Asp Arg Thr Ile Ser
305 310 315 320
Leu Gly Ser Arg Arg Pro Pro Arg Met Pro Val Asn Lys Tyr Pro Asp
325 330 335
Ser Ile Leu His Leu Met Ser Asp Ala Pro Arg Glu Tyr Asp Glu Ile
340 345 350
Ile Leu Glu Ser Leu Gly Ser Ala Ser Leu Met Leu Thr Ser Thr Tyr
355 360 365
Gln Glu Gln Ser Thr Met Leu Phe Lys Glu Leu Val Lys Leu Ser Tyr
370 375 380
Cys Val Gly Ala Ile Leu Asp Tyr Leu Tyr Glu Gly Ala Trp Val Arg
385 390 395 400
Ile Pro Thr Arg Arg Ser Ser Phe Tyr Ser Leu Ala Pro Lys Cys Ser
405 410 415
Ile Ser Pro Ser Ile Arg Pro Ser Cys Glu Lys Leu Leu Tyr Ser Trp
420 425 430
Ile Gln Phe Leu Pro Leu Asn Ala Val Tyr His Pro Pro Gln Leu Pro
435 440 445
Ala Asp Ala Glu Gly Glu Ser Ala Glu Thr Val Phe Leu Val His Lys
450 455 460
Ala Phe Leu Tyr Leu Leu Tyr Leu Ala Ser Met Ala Val Ile Tyr Arg
465 470 475 480
Thr Gly Thr His Ser Gln Gln Thr Ser Thr Ala Thr Pro Asn Met Glu
485 490 495
Gly Leu Arg Ala Ser Thr Ser Gln Ile Lys Lys Val Leu Ala Glu Leu
500 505 510
Gln Gly Met Gly Leu Leu Gln Phe Leu Pro Gly Ala Ser Val Thr Ile
515 520 525
Leu Met Phe Ala Val Glu Ala Ser Leu Leu Asp Leu Gln Gly Ser Asp
530 535 540
Thr Met Val Arg Arg Gln Ala Met Ser Asn Leu Tyr Ala Cys Glu Glu
545 550 555 560
Ala Ala Leu His Leu Met Gln Ala Tyr Pro Thr Ala Glu Met Ala Val
565 570 575
Leu Lys Thr Arg Thr Ala Arg Ala Asn Leu Leu Gly Leu Val Glu Thr
580 585 590
<210>35
<211>1076
<212>DNA
<213>人工序列
<220>
<221>引物结合
<222>(1)..(35)
<220>
<221>启动子
<222>(13)..(1062)
<220>
<221>引物结合
<222>(1037)..(1076)
<400>35
ACTTCACTCG AGATAATGTA GGCGACAAAG TAGCCGGGCA TGCGACCGGA GGACTCGGTC 60
AGAGGCACGA ATATGAGAGG CCAGAACGCC GCACCCATGT TCCAAGATGT TGTGGCCCAG 120
TAAAGGTTAG GAAATGGGGT GTTTTGAACG TGGAATCGTT CTTCCATCCA GTTGTTGCCG 180
GAGCCGTAGG AACCGGCCGG GATACCAGTG AGGATGGAAC TATACCTATT AGCACTGCCA 240
TCTTCGAGAA CAAGGCTAAG ACATACATGA AACAAACGGT GACCGTGAGA AGCCATTTAT 300
AAGAGGTGCT CCAATTGAAC CTGAATATGT TAAAACTAGT ATACTAGCAA CTGCATGCTT 360
GACGTACGGA TTGTCCGGGT CATCCTTGCC GTTCCAGGTA TGGATCTCAA GGTCCTCCCT 420
GTCACGCAGA TCATTGTGGC TGACTACCCC GACATGGGGG TCCCGGCGAA AGAACGACCG 480
CACCCTGCAA CGTCACTTAG TGGCTGTCTG ACAGGGATTG ATTGGCAATG ATTGGCAGAC 540
TAACCGTCCC AGAAACGAAT CATCGAACTC ATTGGTGTGC ACTGTGCTAG CGCGGCGCAG 600
CGACGGGCGT GGCTCCTCGG CAGGGGTGGA CATGACTTTC TCTGTGTAGA TTCCTTGCAA 660
GGTATCTGCT TGACAGATGC AGAGATGATG TTGAGTAAAA TAGGGTGCAG AGACCCTGCA 720
GAACCTGCAT CGGCCGGCGG CGACATGTCG TCATGACCGA CCCGGGCCGA GCGGAATTAA 780
TGAAACTCGG AACAGCCAGG GGAATCCGAC GCTTTGAGTG GCCAATCCAT GTCTATCCAC 840
ATCTGCATTG AAGTGGATGA AAGGTGGAGG AGGGCTGGTT GCCAAATTCT GTTAGGGCTT 900
GGAATGTAAG CAACCGGTTT CGGTCATGAC ATCATCACAG CGATGACTTC ATCACTCTCG 960
GACGAGCATA TATAGTTGTG CCTGTCGTCG TATCTCAACA AACATCAACA ACAACAACAA 1020
TCATCTACTG CATTTACCAA ACTCATCTCT ACCTCAATCA ACTTAATTAA TGAAGT 1076
<210>36
<211>1057
<212>DNA
<213>人工序列
<220>
<221>引物结合
<222>(1)..(33)
<220>
<221>启动子
<222>(13)..(1043)
<220>
<221>引物结合
<222>(1022)..(1057)
<400>36
ACTTCACTCG AGTTCTCACA AGCAAATCCG AGAAACGCAA TTGACCATAT GTCCTTAGTA 60
TGAGGGCTAG CAGGAATACT TGTTTGTCGA TGCATACCGA CTAATAAAAA TGGTTCTTCT 120
TTTTCGCGCA GGGATTTGGT TTTTCATTTT TCATTTTTCA TATTTTATGT TATTTTATTT 180
TATTTTTTTG TTTTATTTTA TTTTATTTTT TTTTTTTAAA TAAGACTGGG TGTTTTCGTC 240
TCCCACCCCT GCTGAGGAAC TGTTTGATAT ACAGAAGCCT GAGATACTTG AGATTATGTG 300
ACAAAGAAAT TGTAAACCTG AATGTGACTA AGGCAGAAGA GAGCAGGTGA GGCCACACAA 360
TACTGTACAC CCACTTCCGA TCGTCATCGA AATGAGCGTT GTGGGTACTG GAACGACAAA 420
CCATAGATCG GATCTGCATC CGAATAGGCT TTACTTTGTA CATTGGTAGG AGTTTGAATG 480
TTTGAAGATC CGGCAGATGA TCACCTGCTG CAGGGAATAA TTTGAAACCT GTCCGTCTGC 540
TTTGACCCAA TTGACGAGGT ACGTGATTTG ATGCTACCCA AGCAGTATGA ATGCGACGGA 600
GGTGGCTATC CTTACCTTGT CATATGCAAC TCATAACGGG TAGTCCCCAT GGAGCCACGG 660
CTATTTATTT CTAAGGGCCA ACAGTGAAAG ATTGTGAGAT CGTATACCTC CTGGGTATGA 720
CGCAACCAGG GTGAGCACTG GCATTGCTCC AATCCATATG GTGGAGGTAT GTCTCCGAGA 780
CCATGACGCA TGTAGACCCT GACCTGTCCC TGATCCAGGG ATCTGGTTTG TCACTTGGCG 840
TATTTTAATT AACTGCGGGT CAGGGTCTTG CCGTCCAGAC CCAATGGATG AATTGCCTGC 900
GTGGCCCTGC AGTTCCAGCG ATCGGCACGG CACGGCTATG ACGTCGGTGG GTGTTCCGTT 960
TGATATTTAA CCATAGAAGA CAGCCTTGTT ATGCTGGTTC CTGCCGCAAA ATAAAGGTCT 1020
ATCCTTACCA CGTTAAGTGT CAAATTAATT AAGAAGT 1057
<210>37
<211>1061
<212>DNA
<213>人工序列
<220>
<221>引物结合
<222>(1)..(33)
<220>
<221>启动子
<222>(13)..(1047)
<220>
<221>引物结合
<222>(1023)..(1061)
<400>37
ATCCTACTCG AGTGGTGCCT GTGAACGAGG TCACCACTGA TAAATTGTCT GGATCCGTAA 60
CGTCTGTATC AGTGGATGGT ACTGAAAAGT TCCAAAGATT GAGGGCAGCA TATGTAGCAC 120
ATGGTGGTAG CTCTAAGTGG TTCGAAACTT CGATGAATGG GCGTGATATA CAGGGGGGTA 180
GCACCTGTAT AGTTGATGTC AGCGAAGGCA CGGGCCATGC AGTGATAGAC AAGAAAAGAG 240
GGATTGAATA AAAGACTCGA TTCTGAAGGG GAGTAATACA TCTTTCGGCT TCTCACCACC 300
CCAGATGTAG GCGTGTGTAA GGTAAGCAAG CACAACATAT GCTCTCCGCC ACTCAGGTTC 360
CCCCTTCAAC TTCTTCGTAG AGAGTATACC CAGGTCATCG ACAGACCTCC TGATAGTACC 420
AGACTGAATC AGGCCAGGCA AGTCCTGAGC GATTTCCTCC CACGGGGAAT AGTAAGGGTC 480
TTCCAATCTC CGTACGGGAG GAACTTCCGG GAGGAACCCG TTCTGGAGGG AGACACCGTA 540
CGCAACAAGT GAAATGTCTT GTGTATAAAG CATGATAATA TATGCACTTC AGTAGACAAC 600
TTGATATTCA AGCCTCCTTG AAATGATCCT CATGCAGGTA AGAGTAGATC CAAGTGTTTA 660
TATTGTATTC CCAAGGAGGG ACGGAAGAAA ACCGGATCCA GAGGGCTCGA GATAGGGCCA 720
CCTGCATGAG CAAAGACGGG TCATTTCCCG TTTCACAACG ACCATTCTCA GGCAGAAAGG 780
CAGTGGATTA GCGGAAAACT TAGCAACCAT CCGGATTTCT GGAGTGGATG CTTTGTTATC 840
TCACTTCCGG CAACACGGAT GGTGAGGCGG AAGCGGAACG GTATCCGGAT CCGGAGGGAG 900
GGACAAACCG AAGTGCCTTG TGTCACACGC CGGTCCATAT ATAAATGTTA ATTGGTGACG 960
GTCAGCGGAT TGTTTCTGGT GTTCATCCAT TTTTTCTTGA TATCCTGGAC CCAGTTATTG 1020
CACTTTAATT ACTATCCAAA ATCCACATTA ATTAATGAAG T 1061
<210>38
<211>1097
<212>DNA
<213>人工序列
<220>
<221>引物结合
<222>(1)..(34)
<220>
<221>启动子
<222>(13)..(1083)
<220>
<221>引物结合
<222>(1060)..(1097)
<400>38
ACTTCACTCG AGGTCCACAC TCTAATTGGG ATGAGCATTG CCTTTCAGGA ACTTGACTTT 60
TTGTGGTTGC ATCTTTTGTT GCCTTACCCA CGCAGGCTTC GTTTATGAGA TAGCGATTTC 120
AGGCCTCAAA TTGCTGTCAT CACTTCCGGC CCCAAACTCG TGGGCGGTGC CCGCCCATCG 180
CTGGCAAGAA GCACAGACTA ACGCCTTACT TCGCCTAGTT GCACACGATG CATCAAGACT 240
TCCTCCTATT TCACAACGAC CAGCTCCTTG CCATTTGTTG TTTCGAATGC CCCCTTCCCC 300
GTGCCTTGCA TTTCTAATTC CCATCTATAC CCTTTTGCGC TCTCACGCCC GCCTGACTAT 360
CAATTTTTCT GCCAGCATAA CCCTGCGTGC AGAGCGGTTG ACAGCAGGCT TGCTAAGAGT 420
CTTCGTCTAG AAGAACTGTC TGGGTGGATT CCTTTTCGGA TTAACTTTTG CTATTTTAAA 480
AGCTGATTGC ACTACGGAGT ACACCCGCAA TCTGATTCTC ACTGATACTC CAATTAAAGG 540
CCACTAATTG CTGACATTTG TAACATATTT GCGTTTGCTT TCCGGTTGAA ATTGGCGGCT 600
TTGTGCTTTC GATCGCTAGC AGTCTCTGTG CATGTACAAC TGATCGGCTA TTCAGTCCTA 660
TTCGGAAGCG GCACTGAGAG GCGGAGACAA GCCACAGATA CGACGAGTCT GATTTTGAGA 720
CGGGCGCATC CAACGAAAGC CTGCGATTGC AATTGAAGAT CTCAATTGGG GGACTGACAA 780
CCTAATACCT AAACATATCG AGGATTAGGC GCCAACACGA GCATGGGAAG CTTTGGTGCA 840
TGCGACGGCT GATCCATTTC TAACAACCGT TTTGCGCGCG CGTCCGAGGT AAGGCTCCCG 900
ATCCCTTGGC GCTTTGCATG TTTCACTCCG ATGCATCTAC TGTTTATATG AGTGCGGTGG 960
GCAAGCTGTG CCCACCGACT GAGCATTCTC AACCGGCCCA ATGCTGTGGG ATCGATCCTC 1020
CCCTCCAAAG TTGTCGCTCG GTTACACTTG ATCGGAGCTT GTTCTGTTAT ACACCAAACC 1080
ATCTTAATTA ATAGGAT 1097
<210>39
<211>1142
<212>DNA
<213>人工序列
<220>
<221>引物结合
<222>(1)..(35)
<220>
<221>启动子
<222>(13)..(1128)
<220>
<221>引物结合
<222>(1118)..(1142)
<400>39
ATCCTACTCG AGGCCTTTGG AGAATGTAAT ATCCCTTGAT CACCCCAGAC TCACATCCAG 60
ATTCTGACTG ACCTCGTGCA TAGCCATATT TAACTTGGTC CCTGATGATC AAAACAGTAC 120
ATGGAACTGG GGCCGAACAT TTCCCTAGCC AAAGGAGCAT CAGGGATTCA ACGTGATCAG 180
TACAGCCTTG TAGCTCGCTG AAACTGCCCT GGAGCCAAGC CAAAGCCTAG ACAGCAAGGT 240
GCATGGGCGA GCTTTGCGAG GATTTAGTTG TTATTTAGTA TGCCAAGATT AAGCCACGCA 300
GAATGGCTTA TGGCCATAGT AGCAACAACG GCCACGGAAC GTTCTTCCAT GTGGTATGGG 360
GAAAGCCGCC GGATATTTGG GGAGGGCGTG ATTGTTCCGG TGGCTATCTT TCCGGTGGAG 420
ATAACGGCGG TGGACCATCA AAACTCCTCA GCCCGGATTG CTCGGACTCC GCATCGTCAA 480
GTATCGGTTTC ATGACAGCC ATTCGACTAC TTAGAAGACA CAAATAGCTA TCCAACTTAC 540
CCGGACCTTTG ATAATAATT TTCAGCAGAT CTGTCGATCT CAGAGACAAT AATGCCACCG 600
TTCTGTGTGGA AGGCACTGC GCCGTGGTTT AACAATAATA AAACTCCAAA TTGCCCAAAA 660
GCTAGAGCGAA GGAAAGTCG AGAAGCCCAG TCTAGACTGG CGGGCTGATC GTCCGGTTCA 720
CAACCTGATTG ACAAATCAT CTGTGACCCT CGATGTTCCG CGGCGTTGAG CGGGTGAGAA 780
TGTGGATCCTA GTGGGGAAG ACCCAATTGC CGCCGGAAAA GGTGAGCTTG TGCTGCACAT 840
GTCCGGTGGCT CAATTCAGG GCCATGCCAG GACATTGCTC TTCAAAGGGA TGCGATTGCT 900
ATTCCCTATTT ACTTCTTTA ACCCGCTGAC GGGCCTGTCT GGACCGAGAA TTCTTGGTCA 960
AGTTTCAGTGG AGCGATCCA GGAAAGAACA TCCGATATGG ACAGTTGCCC TCGATCTCAG 1020
GTCTGTAGTCG TGTGACACA GAGGCCTCTA CTCGCTTGCC TTGCATGTCG GAGCTCAAAG 1080
GTGCGATGTGA ATTAACACG AGGAGCGACT GTCTGTCGCA GATGCAACTT AATTAATAGG 1140
AT 1142
<210>40
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>40
ACTTCATTAA TTAAGTTGAT TGAGGTAGAG ATGAGTTTG 39
<210>41
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>4I
ACTTCACTCG AGATAATGTA GGCGACAAAG TAGCC 35
<210>42
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物
<400>42
ACTTCATTAA TTAATTTGAC ACTTAACGTG GTAAGG 36
<210>43
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>43
ACTTCACTCG AGTTCTCACA AGCAAATCCG AGA 33
<210>44
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>44
ATCCTACTCG AGTGGTGCCT GTGAACGAGG TCA 33
<210>45
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>45
ACTTCATTAA TTAATGTGGA TTTTGGATAG TAATTAAAG 39
<210>46
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物
<400>46
ATCCTATTAA TTAAGATGGT TTGGTGTATA ACAGAACA 38
<210>47
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物
<400>47
ACTTCACTCG AGGTCCACAC TCTAATTGGG ATGA 34
<210>48
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>48
ATCCTATTAA TTAAGTTGCA TCTGCGACAG ACAGT 35
<210>49
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>49
ACTTCACTCG AGGCCTTTGG AGAATGTAAT ATCCC 35
<210>50
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>50
CAACACCTAC GGCGTCAAGG 20
<210>51
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>51
TAACCCGGGG AGATGCTGTT 20
<210>52
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>52
CGATCCGGAA ATTCCTCCTG 20
<210>53
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物
<400>53
GCCGCCGACT CAGCAGTAT 19
<210>54
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>54
GTGCATGAAC AACACGGAGA 20
<210>55
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>55
ACTCAGTTGT GCGCCTCTCG 20
<210>56
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>56
GTCGAACTCG GCGTTTCTCC 20
<210>57
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>57
CCGGTGAGGA GGTGCTTTTC 20
<210>58
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>58
AGCATCTCGC CATCCATCAG 20
<210>59
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>59
GCCTTCGGAC CATGGTATCC 20
<210>60
<400>60
000
<210>61
<211>1226
<212>DNA
<213>人工序列
<220>
<221>基因
<222>(23)..(739)
<223>GFP
<220>
<221>基因
<222>(740)..(1212)
<223>BLE
<400>61
GTCCTGTTAA TTAACCTTCA CCATGGTGAG CAAGGGCGAG GAGCTGTTCA CCGGGGTGGT 60
GCCCATCCTG GTCGAGCTGG ACGGCGACGT AAACGGCCAC AAGTTCAGCG TGTCCGGCGA 120
GGGCGAGGGC GATGCCACCT ACGGCAAGCT GACCCTGAAG TTCATCTGCA CCACCGGCAA 180
GCTGCCCGTG CCCTGGCCCA CCCTCGTGAC CACCCTGACC TACGGCGTGC AGTGCTTCAG 240
CCGCTACCCC GACCACATGA AGCAGCACGA CTTCTTCAAG TCCGCCATGC CCGAAGGCTA 300
CGTCCAGGAG CGCACCATCT TCTTCAAGGA CGACGGCAAC TACAAGACCC GCGCCGAGGT 360
GAAGTTCGAG GGCGACACCC TGGTGAACCG CATCGAGCTG AAGGGCATCG ACTTCAAGGA 420
GGACGGCAAC ATCCTGGGGC ACAAGCTGGA GTACAACTAC AACAGCCACA ACGTCTATAT 480
CATGGCCGAC AAGCAGAAGA ACGGCATCAA GGTGAACTTC AAGATCCGCC ACAACATCGA 540
GGACGGCAGC GTGCAGCTCG CCGACCACTA CCAGCAGAAC ACCCCCATCG GCGACGGCCC 600
CGTGCTGCTG CCCGACAACC ACTACCTGAG CACCCAGTCC GCCCTGAGCA AAGACCCCAA 660
CGAGAAGCGC GATCACATGG TCCTGCTGGA GTTCGTGACC GCCGCCGGGA TCACTCTCGG 720
CATGGACGAG CTGTACAAGG CCAAGTTGAC CAGTGCCGTT CCGGTGCTCA CCGCGCGCGA 780
CGTCGCCGGA GCGGTCGAGT TCTGGACCGA CCGGCTCGGG TTCTCCCGGG ACTTCGTGGA 840
GGACGACTTC GCCGGTGTGG TCCGGGACGA CGTGACCCTG TTCATCAGCG CGGTCCAGGA 900
CCAGGTGGTG CCGGACAACA CCCTGGCCTG GGTGTGGGTG CGCGGCCTGG ACGAGCTGTA 960
CGCCGAGTGG TCGGAGGTCG TGTCCACGAA CTTCCGGGAC GCCTCCGGGC CGGCCATGAC 1020
CGAGATCGGC GAGCAGCCGT GGGGGCGGGA GTTCGCCCTG CGCGACCCGG CCGGCAACTG 1080
CGTGCACTTC GTGGCCGAGG AGCAGGACTA AAGGCGCGCC TGAAGT 1226
<210>62
<211>37
<212>DNA
<213>人工序列
<220>
<223>引物
<400>62
GTCCTGTTAA TTAACCTTCA CCATGGTGAG CAAGGGC 37
<210>63
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物
<400>63
GCACTGGTCA ACTTGGCCTT GTACAGCTCG TCCATG 36
<210>64
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物
<400>64
CATGGACGAG CTGTACAAGG CCAAGTTGAC CAGTGC 36
<210>65
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>65
ACTTCAGGCG CGCCTTTAGT CCTGCTCCTC GGCCA 35
Claims (14)
1.启动子DNA序列,例如:
(a)以下列表所示的DNA序列:SEQ ID NO:1、SEQ ID NO:2、SEQID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23或SEQ IDNO:24,
(b)能够与(a)的DNA序列杂交的DNA序列,
(c)与(a)的DNA序列至少50%同源的DNA序列,
(d)(a)到(c)中任何DNA序列的变体,或
(e)(a)到(d)中任何DNA序列的亚序列。
2.DNA构建体,其包含与报告基因可操作连接的如权利要求1所述的启动子DNA,所述报告基因赋予可选择性状,优选地,选择性标记基因。
3.包含如权利要求2所述的DNA构建体的表达载体,其中所述DNA构建体包含下述DNA片段,所述DNA片段与宿主细胞基因组中预先确定的靶基因座DNA序列同源,优选所述预先确定的靶基因座包含高表达的基因。
4.包含如权利要求2所述的DNA构建体的表达载体,其中所述DNA构建体能够在宿主细胞中自主维持,优选地,所述DNA构建体包含AMA1序列。
5.宿主细胞,其包含如权利要求2所述DNA构建体,或包含如权利要求3或4所述的表达载体。
6.如权利要求5所述的宿主细胞,其还包含包含下述DNA序列的DNA构建体,所述DNA序列包含来自下述DNA文库的编码序列,所述DNA文库来自被怀疑能够产生一种或多种目的蛋白质的生物。
7.如权利要求5或6所述的宿主细胞,其中所述宿主细胞为原核生物或真核生物。
8.如权利要求7所述的宿主细胞,其中所述宿主细胞选自以下列表:Bacillus、酵母或丝状真菌,优选地,Aspergillus、Penicillium或Trichoderma种。
9.如权利要求8所述的宿主细胞,其中Aspergillus为Aspergillus niger或Aspergillus sojae或Aspergillus oryzae种。
10.用于分离下述DNA序列的方法,所述DNA序列包含在宿主细胞中编码目的蛋白质的DNA序列,所述方法包含如下步骤:
(a)制备第一DNA构建体,其包含与赋予可选择性状的报告基因可操作连接的启动子DNA序列;当所述DNA构建体存在于宿主细胞中和当所述宿主细胞产生目的蛋白质,优选被分泌的目的蛋白质时,所述启动子DNA序列被诱导;
(b)制备第二DNA构建体,其包含包含下述DNA序列的DNA序列,所述DNA序列编码来自下述生物DNA文库的目的蛋白质,所述生物被怀疑能够制造一种或多种目的蛋白质;
(c)用(a)和(b)中制备的两种DNA构建体转化宿主细胞;
(d)在有助于产生所述DNA文库中存在的目的蛋白质的条件下,培养(c)中获得的所有经转化的宿主细胞;和
(e)通过分析在(d)中产生的蛋白质,筛选产生目的蛋白质的经转化的宿主细胞。
11.如权利要求10所述的方法,其中首先用步骤(a)中制备的DNA构建体转化所述宿主细胞,然后用步骤(b)中制备的DNA构建体转化所述宿主细胞。
12.如权利要求10或11所述的方法,其中步骤(a)中使用的所述启动子为权利要求1的启动子。
13.如权利要求10到12任一项所述的方法,其中所述被怀疑能够产生目的蛋白质的生物为真核生物或原核生物。
14.如权利要求10到13任一项所述的方法,其中所述目的蛋白质为酶。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05102180.6 | 2005-03-18 | ||
EP05102177.2 | 2005-03-18 | ||
EP05102159.0 | 2005-03-18 | ||
EP05102160.8 | 2005-03-18 | ||
EP05102180 | 2005-03-18 | ||
EP05102184.8 | 2005-03-18 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101163790A true CN101163790A (zh) | 2008-04-16 |
Family
ID=39298243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800086839A Pending CN101163790A (zh) | 2005-03-18 | 2006-03-20 | 在宿主细胞中表达克隆的改进方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101163790A (zh) |
-
2006
- 2006-03-20 CN CNA2006800086839A patent/CN101163790A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2008214663B2 (en) | A recombinant host cell for the production of a compound of interest | |
US7794974B2 (en) | Fungal transcriptional activators useful in methods for producing a polypeptide | |
US8945898B2 (en) | Recombinant host cell with deficiency in non-ribosomal peptide synthase production | |
EP2147107B1 (en) | Expression cloning method suitable for selecting library clones producing a polypeptide of interest | |
EP1266011B1 (en) | Fungal transcriptional activator useful in methods for producing polypeptides | |
EP2683732B1 (en) | Vector-host system | |
CN102597241A (zh) | 用于生产感兴趣的化合物的经改进的宿主细胞 | |
US8481320B2 (en) | Methods for increasing homologous recombination of a nucleic acid sequence | |
US20170313997A1 (en) | Filamentous Fungal Double-Mutant Host Cells | |
JPH08500733A (ja) | グルコースの存在下で活性的な真菌プロモーター | |
JP2002515252A (ja) | 糸状菌変異体細胞においてポリペプチドを生産するための方法 | |
US20090209007A1 (en) | Method of Expression Cloning in a Host Cell | |
JP6899815B2 (ja) | 微生物学的タンパク質分泌の検出および定量化のためのセンサ | |
CN101163790A (zh) | 在宿主细胞中表达克隆的改进方法 | |
CN105102471A (zh) | 具有选择性自噬途径的灭活组分的丝状真菌细胞及其使用方法 | |
US20160251666A1 (en) | Promoters for Expressing Genes in a Fungal Cell | |
EP4023757A1 (en) | Methods for generating selection marker-free transformants of heterokaryotic organisms | |
US20030022280A1 (en) | Compositions and methods for producing high yields of heterologous polypeptides in a pichia cell | |
KR20220098155A (ko) | 비바이러스성 전사 활성화 도메인들 및 그와 관련된 방법들 및 이용들 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20080416 |