MX2013010510A - Enzimas glocosil hidrolasa y usos de estas para la hidrolisis de biomasa. - Google Patents
Enzimas glocosil hidrolasa y usos de estas para la hidrolisis de biomasa.Info
- Publication number
- MX2013010510A MX2013010510A MX2013010510A MX2013010510A MX2013010510A MX 2013010510 A MX2013010510 A MX 2013010510A MX 2013010510 A MX2013010510 A MX 2013010510A MX 2013010510 A MX2013010510 A MX 2013010510A MX 2013010510 A MX2013010510 A MX 2013010510A
- Authority
- MX
- Mexico
- Prior art keywords
- polypeptide
- sec
- ident
- sequence
- numbers
- Prior art date
Links
- 239000002028 Biomass Substances 0.000 title claims abstract description 33
- 108090000604 Hydrolases Proteins 0.000 title abstract description 14
- 125000003147 glycosyl group Chemical group 0.000 title abstract description 11
- 102000004157 Hydrolases Human genes 0.000 title description 13
- 238000006460 hydrolysis reaction Methods 0.000 title description 13
- 230000007062 hydrolysis Effects 0.000 title description 12
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 923
- 229920001184 polypeptide Polymers 0.000 claims abstract description 921
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 920
- 239000000203 mixture Substances 0.000 claims abstract description 320
- 230000000694 effects Effects 0.000 claims abstract description 312
- 108010059892 Cellulase Proteins 0.000 claims abstract description 218
- 238000000034 method Methods 0.000 claims abstract description 49
- 239000000463 material Substances 0.000 claims abstract description 43
- 230000003301 hydrolyzing effect Effects 0.000 claims abstract description 18
- 108010047754 beta-Glucosidase Proteins 0.000 claims description 305
- 102000006995 beta-Glucosidase Human genes 0.000 claims description 305
- 125000000539 amino acid group Chemical group 0.000 claims description 228
- 102000004190 Enzymes Human genes 0.000 claims description 226
- 108090000790 Enzymes Proteins 0.000 claims description 226
- 229940088598 enzyme Drugs 0.000 claims description 226
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 220
- 108010038658 exo-1,4-beta-D-xylosidase Proteins 0.000 claims description 157
- 230000002255 enzymatic effect Effects 0.000 claims description 138
- 229940106157 cellulase Drugs 0.000 claims description 105
- 108090000623 proteins and genes Proteins 0.000 claims description 96
- 239000002773 nucleotide Substances 0.000 claims description 80
- 125000003729 nucleotide group Chemical group 0.000 claims description 80
- 102000004169 proteins and genes Human genes 0.000 claims description 72
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 claims description 55
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 claims description 52
- 238000004519 manufacturing process Methods 0.000 claims description 41
- 240000008042 Zea mays Species 0.000 claims description 39
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 39
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 claims description 36
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 34
- 235000005822 corn Nutrition 0.000 claims description 34
- 241000233866 Fungi Species 0.000 claims description 33
- 229920002678 cellulose Polymers 0.000 claims description 32
- 239000001913 cellulose Substances 0.000 claims description 32
- 238000000855 fermentation Methods 0.000 claims description 28
- 230000004151 fermentation Effects 0.000 claims description 28
- 229910021529 ammonia Inorganic materials 0.000 claims description 26
- 229920002488 Hemicellulose Polymers 0.000 claims description 25
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 claims description 25
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 claims description 25
- 239000002699 waste material Substances 0.000 claims description 25
- 235000000346 sugar Nutrition 0.000 claims description 20
- 239000002029 lignocellulosic biomass Substances 0.000 claims description 18
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 17
- 150000008163 sugars Chemical class 0.000 claims description 16
- 241000894006 Bacteria Species 0.000 claims description 14
- 230000002378 acidificating effect Effects 0.000 claims description 14
- 239000002253 acid Substances 0.000 claims description 13
- 244000005700 microbiome Species 0.000 claims description 13
- 239000000047 product Substances 0.000 claims description 13
- 241000223259 Trichoderma Species 0.000 claims description 12
- 241000123346 Chrysosporium Species 0.000 claims description 11
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 claims description 10
- 241000228212 Aspergillus Species 0.000 claims description 8
- 235000013305 food Nutrition 0.000 claims description 8
- 240000005430 Bromus catharticus Species 0.000 claims description 7
- 244000273256 Phragmites communis Species 0.000 claims description 7
- 235000014676 Phragmites communis Nutrition 0.000 claims description 7
- 235000016536 Sporobolus cryptandrus Nutrition 0.000 claims description 7
- 230000000295 complement effect Effects 0.000 claims description 7
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 6
- 239000010893 paper waste Substances 0.000 claims description 6
- 235000013311 vegetables Nutrition 0.000 claims description 6
- 239000002023 wood Substances 0.000 claims description 6
- 229920001221 xylan Polymers 0.000 claims description 6
- 150000004823 xylans Chemical class 0.000 claims description 6
- 241001327268 Sorghastrum Species 0.000 claims description 5
- 239000006227 byproduct Substances 0.000 claims description 5
- 235000013339 cereals Nutrition 0.000 claims description 5
- 238000009472 formulation Methods 0.000 claims description 5
- 244000025254 Cannabis sativa Species 0.000 claims description 4
- 230000029087 digestion Effects 0.000 claims description 4
- 229920001131 Pulp (paper) Polymers 0.000 claims description 3
- 239000010902 straw Substances 0.000 claims description 3
- 241000588724 Escherichia coli Species 0.000 claims 2
- 241000609240 Ambelania acida Species 0.000 claims 1
- 235000007319 Avena orientalis Nutrition 0.000 claims 1
- 244000075850 Avena orientalis Species 0.000 claims 1
- 235000016068 Berberis vulgaris Nutrition 0.000 claims 1
- 241000335053 Beta vulgaris Species 0.000 claims 1
- 244000068988 Glycine max Species 0.000 claims 1
- 235000010469 Glycine max Nutrition 0.000 claims 1
- 240000005979 Hordeum vulgare Species 0.000 claims 1
- 235000007340 Hordeum vulgare Nutrition 0.000 claims 1
- 240000000111 Saccharum officinarum Species 0.000 claims 1
- 235000007201 Saccharum officinarum Nutrition 0.000 claims 1
- 241000209056 Secale Species 0.000 claims 1
- 235000007238 Secale cereale Nutrition 0.000 claims 1
- 244000061456 Solanum tuberosum Species 0.000 claims 1
- 235000002595 Solanum tuberosum Nutrition 0.000 claims 1
- 240000006394 Sorghum bicolor Species 0.000 claims 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims 1
- 235000021307 Triticum Nutrition 0.000 claims 1
- 244000098338 Triticum aestivum Species 0.000 claims 1
- 241000588902 Zymomonas mobilis Species 0.000 claims 1
- 239000010905 bagasse Substances 0.000 claims 1
- 235000012015 potatoes Nutrition 0.000 claims 1
- 241000499912 Trichoderma reesei Species 0.000 description 212
- 108010076504 Protein Sorting Signals Proteins 0.000 description 111
- 230000004927 fusion Effects 0.000 description 69
- 230000000875 corresponding effect Effects 0.000 description 59
- 235000018102 proteins Nutrition 0.000 description 57
- 230000003197 catalytic effect Effects 0.000 description 49
- 210000004027 cell Anatomy 0.000 description 46
- 230000014509 gene expression Effects 0.000 description 46
- 239000000758 substrate Substances 0.000 description 36
- 102000005575 Cellulases Human genes 0.000 description 32
- 108010084185 Cellulases Proteins 0.000 description 32
- 150000007523 nucleic acids Chemical class 0.000 description 31
- 102000039446 nucleic acids Human genes 0.000 description 30
- 108020004707 nucleic acids Proteins 0.000 description 30
- 235000001014 amino acid Nutrition 0.000 description 29
- 235000010633 broth Nutrition 0.000 description 29
- 238000006243 chemical reaction Methods 0.000 description 28
- 238000003776 cleavage reaction Methods 0.000 description 28
- 230000007017 scission Effects 0.000 description 28
- 150000001413 amino acids Chemical class 0.000 description 24
- 229940024606 amino acid Drugs 0.000 description 22
- 239000012634 fragment Substances 0.000 description 21
- 239000013612 plasmid Substances 0.000 description 21
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 19
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 19
- 239000008103 glucose Substances 0.000 description 19
- 230000001965 increasing effect Effects 0.000 description 19
- 229920001503 Glucan Polymers 0.000 description 17
- 238000007824 enzymatic assay Methods 0.000 description 17
- 239000000123 paper Substances 0.000 description 17
- 108010038196 saccharide-binding proteins Proteins 0.000 description 17
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 16
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 16
- 238000001195 ultra high performance liquid chromatography Methods 0.000 description 15
- 108010052085 cellobiose-quinone oxidoreductase Proteins 0.000 description 14
- 238000004128 high performance liquid chromatography Methods 0.000 description 14
- 230000000670 limiting effect Effects 0.000 description 14
- 241000228245 Aspergillus niger Species 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 239000012038 nucleophile Substances 0.000 description 13
- 238000002474 experimental method Methods 0.000 description 12
- 108091033319 polynucleotide Proteins 0.000 description 12
- 102000040430 polynucleotide Human genes 0.000 description 12
- 239000002157 polynucleotide Substances 0.000 description 12
- 239000000523 sample Substances 0.000 description 12
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 12
- 238000003860 storage Methods 0.000 description 12
- LGQKSQQRKHFMLI-SJYYZXOBSA-N (2s,3r,4s,5r)-2-[(3r,4r,5r,6r)-4,5,6-trihydroxyoxan-3-yl]oxyoxane-3,4,5-triol Chemical compound O[C@@H]1[C@@H](O)[C@H](O)CO[C@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O)OC1 LGQKSQQRKHFMLI-SJYYZXOBSA-N 0.000 description 11
- LGQKSQQRKHFMLI-UHFFFAOYSA-N 4-O-beta-D-xylopyranosyl-beta-D-xylopyranose Natural products OC1C(O)C(O)COC1OC1C(O)C(O)C(O)OC1 LGQKSQQRKHFMLI-UHFFFAOYSA-N 0.000 description 11
- SQNRKWHRVIAKLP-UHFFFAOYSA-N D-xylobiose Natural products O=CC(O)C(O)C(CO)OC1OCC(O)C(O)C1O SQNRKWHRVIAKLP-UHFFFAOYSA-N 0.000 description 11
- 239000002585 base Substances 0.000 description 11
- MLJYKRYCCUGBBV-YTWAJWBKSA-N 4-nitrophenyl beta-D-xyloside Chemical compound O[C@@H]1[C@@H](O)[C@H](O)CO[C@H]1OC1=CC=C([N+]([O-])=O)C=C1 MLJYKRYCCUGBBV-YTWAJWBKSA-N 0.000 description 10
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 10
- 108010001817 Endo-1,4-beta Xylanases Proteins 0.000 description 10
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 241000196324 Embryophyta Species 0.000 description 9
- 102000040594 GH3 family Human genes 0.000 description 9
- 108091071558 GH3 family Proteins 0.000 description 9
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 9
- 150000001720 carbohydrates Chemical class 0.000 description 9
- 239000013078 crystal Substances 0.000 description 9
- 230000003993 interaction Effects 0.000 description 9
- 239000000178 monomer Substances 0.000 description 9
- 239000007787 solid Substances 0.000 description 9
- 241000204664 Thermotoga neapolitana Species 0.000 description 8
- 235000014633 carbohydrates Nutrition 0.000 description 8
- 101150052795 cbh-1 gene Proteins 0.000 description 8
- 108010002430 hemicellulase Proteins 0.000 description 8
- 230000006337 proteolytic cleavage Effects 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 7
- 108020004414 DNA Proteins 0.000 description 7
- 241000223218 Fusarium Species 0.000 description 7
- 241000223195 Fusarium graminearum Species 0.000 description 7
- 241000223221 Fusarium oxysporum Species 0.000 description 7
- 241000233732 Fusarium verticillioides Species 0.000 description 7
- 244000308495 Potentilla anserina Species 0.000 description 7
- 241001123668 Verticillium dahliae Species 0.000 description 7
- 101710136524 X polypeptide Proteins 0.000 description 7
- 241001231403 [Nectria] haematococca Species 0.000 description 7
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 7
- 210000004899 c-terminal region Anatomy 0.000 description 7
- 239000000446 fuel Substances 0.000 description 7
- 230000002538 fungal effect Effects 0.000 description 7
- 229940059442 hemicellulase Drugs 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 238000002864 sequence alignment Methods 0.000 description 7
- 108091026890 Coding region Proteins 0.000 description 6
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 6
- 230000013595 glycosylation Effects 0.000 description 6
- 238000006206 glycosylation reaction Methods 0.000 description 6
- 230000002573 hemicellulolytic effect Effects 0.000 description 6
- 239000002243 precursor Substances 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 241000209134 Arundinaria Species 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- 239000004284 Heptyl p-hydroxybenzoate Substances 0.000 description 5
- 241000228143 Penicillium Species 0.000 description 5
- 241000959173 Rasamsonia emersonii Species 0.000 description 5
- 108010027199 Xylosidases Proteins 0.000 description 5
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 229920000617 arabinoxylan Polymers 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 239000012620 biological material Substances 0.000 description 5
- 238000006555 catalytic reaction Methods 0.000 description 5
- 235000009973 maize Nutrition 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 230000002797 proteolythic effect Effects 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- DUYYBTBDYZXISX-UKKRHICBSA-N 4-nitrophenyl-ara Chemical compound O[C@@H]1[C@@H](O)[C@H](CO)O[C@H]1OC1=CC=C([N+]([O-])=O)C=C1 DUYYBTBDYZXISX-UKKRHICBSA-N 0.000 description 4
- 101710178122 Endoglucanase 4 Proteins 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 4
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 4
- UGXQOOQUZRUVSS-ZZXKWVIFSA-N [5-[3,5-dihydroxy-2-(1,3,4-trihydroxy-5-oxopentan-2-yl)oxyoxan-4-yl]oxy-3,4-dihydroxyoxolan-2-yl]methyl (e)-3-(4-hydroxyphenyl)prop-2-enoate Chemical compound OC1C(OC(CO)C(O)C(O)C=O)OCC(O)C1OC1C(O)C(O)C(COC(=O)\C=C\C=2C=CC(O)=CC=2)O1 UGXQOOQUZRUVSS-ZZXKWVIFSA-N 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 229940009098 aspartate Drugs 0.000 description 4
- 230000001461 cytolytic effect Effects 0.000 description 4
- -1 for example Polymers 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000004317 sodium nitrate Substances 0.000 description 4
- 235000010344 sodium nitrate Nutrition 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 239000010907 stover Substances 0.000 description 4
- 241001578974 Achlya <moth> Species 0.000 description 3
- 240000006439 Aspergillus oryzae Species 0.000 description 3
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 3
- 241001619326 Cephalosporium Species 0.000 description 3
- 241000228437 Cochliobolus Species 0.000 description 3
- 241001246273 Endothia Species 0.000 description 3
- 108010017544 Glucosylceramidase Proteins 0.000 description 3
- 241000223198 Humicola Species 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- 241000235395 Mucor Species 0.000 description 3
- 241000221960 Neurospora Species 0.000 description 3
- 241000221945 Podospora Species 0.000 description 3
- 241000231139 Pyricularia Species 0.000 description 3
- 241000638881 Talaromyces aurantiacus Species 0.000 description 3
- 241001137871 Thermoanaerobacterium saccharolyticum Species 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical group N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 3
- 108010005774 beta-Galactosidase Proteins 0.000 description 3
- 239000002551 biofuel Substances 0.000 description 3
- 239000004330 calcium propionate Substances 0.000 description 3
- 108010089934 carbohydrase Proteins 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 210000002421 cell wall Anatomy 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 229930195712 glutamate Natural products 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 230000014759 maintenance of location Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 210000001724 microfibril Anatomy 0.000 description 3
- 230000000269 nucleophilic effect Effects 0.000 description 3
- 229920001282 polysaccharide Polymers 0.000 description 3
- 239000005017 polysaccharide Substances 0.000 description 3
- 150000004804 polysaccharides Chemical class 0.000 description 3
- 239000004175 ponceau 4R Substances 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 239000002994 raw material Substances 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000001509 sodium citrate Substances 0.000 description 3
- 235000011121 sodium hydroxide Nutrition 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 239000001733 1,4-Heptonolactone Substances 0.000 description 2
- KIAPWMKFHIKQOZ-UHFFFAOYSA-N 2-[[(4-fluorophenyl)-oxomethyl]amino]benzoic acid methyl ester Chemical compound COC(=O)C1=CC=CC=C1NC(=O)C1=CC=C(F)C=C1 KIAPWMKFHIKQOZ-UHFFFAOYSA-N 0.000 description 2
- 239000001741 Ammonium adipate Substances 0.000 description 2
- 239000005711 Benzoic acid Substances 0.000 description 2
- 101710180684 Beta-hexosaminidase Proteins 0.000 description 2
- 101710124976 Beta-hexosaminidase A Proteins 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 229920002134 Carboxymethyl cellulose Polymers 0.000 description 2
- 239000001836 Dioctyl sodium sulphosuccinate Substances 0.000 description 2
- 239000004398 Ethyl lauroyl arginate Substances 0.000 description 2
- 239000004277 Ferrous carbonate Substances 0.000 description 2
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 2
- 102000004366 Glucosidases Human genes 0.000 description 2
- 108010056771 Glucosidases Proteins 0.000 description 2
- 102000004547 Glucosylceramidase Human genes 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 108700023372 Glycosyltransferases Proteins 0.000 description 2
- 241000142758 Gynerium sagittatum Species 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 241000209117 Panicum Species 0.000 description 2
- 241001520808 Panicum virgatum Species 0.000 description 2
- 241000228129 Penicillium janthinellum Species 0.000 description 2
- 102100030122 Protein O-GlcNAcase Human genes 0.000 description 2
- 101710081801 Protein O-GlcNAcase Proteins 0.000 description 2
- 101710199095 Putative beta-hexosaminidase Proteins 0.000 description 2
- 235000014704 Saccharum spontaneum Nutrition 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 239000004141 Sodium laurylsulphate Substances 0.000 description 2
- 239000004139 Sodium stearoyl fumarate Substances 0.000 description 2
- 241001327284 Sorghastrum nutans Species 0.000 description 2
- 235000015505 Sorghum bicolor subsp. bicolor Nutrition 0.000 description 2
- 241001136494 Talaromyces funiculosus Species 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 239000004191 allura red AC Substances 0.000 description 2
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 2
- 239000004178 amaranth Substances 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 102000005936 beta-Galactosidase Human genes 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 239000004301 calcium benzoate Substances 0.000 description 2
- 239000001110 calcium chloride Substances 0.000 description 2
- 235000011148 calcium chloride Nutrition 0.000 description 2
- 239000004294 calcium hydrogen sulphite Substances 0.000 description 2
- 235000010260 calcium hydrogen sulphite Nutrition 0.000 description 2
- 239000001175 calcium sulphate Substances 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 239000001768 carboxy methyl cellulose Substances 0.000 description 2
- 235000010948 carboxy methyl cellulose Nutrition 0.000 description 2
- 239000008112 carboxymethyl-cellulose Substances 0.000 description 2
- 101150114858 cbh2 gene Proteins 0.000 description 2
- FYGDTMLNYKFZSV-ZWSAEMDYSA-N cellotriose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-ZWSAEMDYSA-N 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Substances OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 2
- 235000015165 citric acid Nutrition 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 108010091371 endoglucanase 1 Proteins 0.000 description 2
- 108010091384 endoglucanase 2 Proteins 0.000 description 2
- 108010092450 endoglucanase Z Proteins 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N formic acid Substances OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 229930182830 galactose Natural products 0.000 description 2
- 150000002307 glutamic acids Chemical class 0.000 description 2
- 102000045442 glycosyltransferase activity proteins Human genes 0.000 description 2
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 2
- 239000004333 gold (food color) Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 239000010903 husk Substances 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 239000001863 hydroxypropyl cellulose Substances 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229920005610 lignin Polymers 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000004335 litholrubine BK Substances 0.000 description 2
- 239000001630 malic acid Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 239000004309 nisin Substances 0.000 description 2
- 239000003921 oil Substances 0.000 description 2
- 235000019198 oils Nutrition 0.000 description 2
- 230000001590 oxidative effect Effects 0.000 description 2
- 125000000636 p-nitrophenyl group Chemical group [H]C1=C([H])C(=C([H])C([H])=C1*)[N+]([O-])=O 0.000 description 2
- 239000005022 packaging material Substances 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 102000020244 polysaccharide lyase Human genes 0.000 description 2
- 108091022901 polysaccharide lyase Proteins 0.000 description 2
- 239000004300 potassium benzoate Substances 0.000 description 2
- 239000000276 potassium ferrocyanide Substances 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K potassium phosphate Substances [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 235000011009 potassium phosphates Nutrition 0.000 description 2
- 230000017854 proteolysis Effects 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 239000004402 sodium ethyl p-hydroxybenzoate Substances 0.000 description 2
- 239000001590 sorbitan monolaureate Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 238000000108 ultra-filtration Methods 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 125000000969 xylosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)CO1)* 0.000 description 2
- 150000008495 β-glucosides Chemical class 0.000 description 2
- 229920000189 Arabinogalactan Polymers 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 101001065065 Aspergillus awamori Feruloyl esterase A Proteins 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 229920002498 Beta-glucan Polymers 0.000 description 1
- 102100032487 Beta-mannosidase Human genes 0.000 description 1
- 102220588724 C2 domain-containing protein 5_P51A_mutation Human genes 0.000 description 1
- 241000010977 Cellvibrio japonicus Species 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241001275954 Cortinarius caperatus Species 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 241001592215 Ebenus reesei Species 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 101710112457 Exoglucanase Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 229920000926 Galactomannan Polymers 0.000 description 1
- 208000015872 Gaucher disease Diseases 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101001035456 Hypocrea jecorina Endoglucanase-4 Proteins 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102100033342 Lysosomal acid glucosylceramidase Human genes 0.000 description 1
- 229920000057 Mannan Polymers 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 102000002568 Multienzyme Complexes Human genes 0.000 description 1
- 108010093369 Multienzyme Complexes Proteins 0.000 description 1
- 101000907953 Myceliophthora thermophila (strain ATCC 42464 / BCRC 31852 / DSM 1799) Polysaccharide monooxygenase Cel61a Proteins 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 101100382629 Schizosaccharomyces pombe (strain 972 / ATCC 24843) cbh1 gene Proteins 0.000 description 1
- 229920002000 Xyloglucan Polymers 0.000 description 1
- 108010093941 acetylxylan esterase Proteins 0.000 description 1
- 108091006088 activator proteins Proteins 0.000 description 1
- 239000002154 agricultural waste Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 235000019312 arabinogalactan Nutrition 0.000 description 1
- 150000004783 arabinoxylans Chemical class 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108010055059 beta-Mannosidase Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000004106 carminic acid Substances 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 101150048033 cbh gene Proteins 0.000 description 1
- 230000022534 cell killing Effects 0.000 description 1
- 125000001547 cellobiose group Chemical group 0.000 description 1
- 108010080434 cephalosporin-C deacetylase Proteins 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000012707 chemical precursor Substances 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000012459 cleaning agent Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 235000012055 fruits and vegetables Nutrition 0.000 description 1
- 239000003502 gasoline Substances 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 102000034238 globular proteins Human genes 0.000 description 1
- 108091005896 globular proteins Proteins 0.000 description 1
- 230000009229 glucose formation Effects 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-L glutamate group Chemical group N[C@@H](CCC(=O)[O-])C(=O)[O-] WHUUTDBJXJRKMK-VKHMYHEASA-L 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- RIGBPMDIGYBTBJ-UHFFFAOYSA-N glycyclamide Chemical compound C1=CC(C)=CC=C1S(=O)(=O)NC(=O)NC1CCCCC1 RIGBPMDIGYBTBJ-UHFFFAOYSA-N 0.000 description 1
- 239000008241 heterogeneous mixture Substances 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 230000002706 hydrostatic effect Effects 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000012994 industrial processing Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 239000012978 lignocellulosic material Substances 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- LUEWUZLMQUOBSB-GFVSVBBRSA-N mannan Chemical class O[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@@H](O[C@@H]2[C@H](O[C@@H](O[C@H]3[C@H](O[C@@H](O)[C@@H](O)[C@H]3O)CO)[C@@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O LUEWUZLMQUOBSB-GFVSVBBRSA-N 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 238000006400 oxidative hydrolysis reaction Methods 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 210000004896 polypeptide structure Anatomy 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 230000009452 underexpressoin Effects 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2437—Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2445—Beta-glucosidase (3.2.1.21)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
- C12P7/08—Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2477—Hemicellulases not provided in a preceding group
- C12N9/248—Xylanases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2477—Hemicellulases not provided in a preceding group
- C12N9/248—Xylanases
- C12N9/2485—Xylan endo-1,3-beta-xylosidase (3.2.1.32), i.e. endo-1,3-beta-xylanase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/02—Monosaccharides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/14—Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
- C12P7/08—Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
- C12P7/10—Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
- C12P7/14—Multiple stages of fermentation; Multiple types of microorganisms or re-use of microorganisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01004—Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01021—Beta-glucosidase (3.2.1.21)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01032—Xylan endo-1,3-beta-xylosidase (3.2.1.32), i.e. endo-1-3-beta-xylanase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01037—Xylan 1,4-beta-xylosidase (3.2.1.37)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01055—Alpha-N-arabinofuranosidase (3.2.1.55)
-
- D—TEXTILES; PAPER
- D21—PAPER-MAKING; PRODUCTION OF CELLULOSE
- D21C—PRODUCTION OF CELLULOSE BY REMOVING NON-CELLULOSE SUBSTANCES FROM CELLULOSE-CONTAINING MATERIALS; REGENERATION OF PULPING LIQUORS; APPARATUS THEREFOR
- D21C11/00—Regeneration of pulp liquors or effluent waste waters
- D21C11/0007—Recovery of by-products, i.e. compounds other than those necessary for pulping, for multiple uses or not otherwise provided for
-
- D—TEXTILES; PAPER
- D21—PAPER-MAKING; PRODUCTION OF CELLULOSE
- D21C—PRODUCTION OF CELLULOSE BY REMOVING NON-CELLULOSE SUBSTANCES FROM CELLULOSE-CONTAINING MATERIALS; REGENERATION OF PULPING LIQUORS; APPARATUS THEREFOR
- D21C5/00—Other processes for obtaining cellulose, e.g. cooking cotton linters ; Processes characterised by the choice of cellulose-containing starting materials
-
- D—TEXTILES; PAPER
- D21—PAPER-MAKING; PRODUCTION OF CELLULOSE
- D21C—PRODUCTION OF CELLULOSE BY REMOVING NON-CELLULOSE SUBSTANCES FROM CELLULOSE-CONTAINING MATERIALS; REGENERATION OF PULPING LIQUORS; APPARATUS THEREFOR
- D21C5/00—Other processes for obtaining cellulose, e.g. cooking cotton linters ; Processes characterised by the choice of cellulose-containing starting materials
- D21C5/005—Treatment of cellulose-containing material with microorganisms or enzymes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
La presente invención se refiere a composiciones que se pueden usar para hidrolizar biomasa, tal como composiciones que comprenden un polipéptido que tiene actividad de la familia 61 de glicosil hidrolasas (GH)/endoglucanasa y/o un polipéptido de ß-g1ucosidasa, a métodos para hidrolizar material de biomasa y a métodos para usar esas composiciones.
Description
ENZIMAS GLICOSIL HIDROLASA Y USOS DE ESTAS PARA LA HIDROLISIS
DE BIOMASA
Campo de la Invención
La presente descripción se refiere, generalmente, a enzimas glicosil hidrolasas y a composiciones enzimáticas diseñadas por ingeniería genética, composiciones de caldo de fermentación diseñadas por ingeniería genética y otras composiciones que comprenden tales enzimas, y a métodos para preparar o usar las enzimas y composiciones en un entorno de investigación, industrial o comercial, por ejemplo, para sacarificación o conversión de materiales de biomasa que comprenden hemicelulosa y, opcionalmente , celulosa en azúcares fermentables .
Antecedentes de la Invención
La bioconversión de biomasa lignocelulósica renovable en un azúcar fermentable que, posteriormente, se fermenta para producir alcohol (por ejemplo, etanol) como una alternativa a los combustibles líquidos generó mucho interés entre los investigadores desde la crisis del petróleo ocurrida en la década del 70 (Bungay, H. R. , "Energy: the biomass options" . NY: iley; 1981; Olsson L, Hahn-Hagerdal B. Enzyme Microb Technol 1996, 18:312-31; Zaldivar, J et al., Appl Microbiol Biotechnol 2001, 56: 17-34; Galbe, M et al., Appl Microbiol Biotechnol 2002, 59:618-28) . El etanol se ha usado como una
Ref. 242667 mezcla al 10 % para gasolina en los Estados Unidos o como combustible puro para vehículos en Brasil en las últimas décadas. La importancia del bioetanol como combustible aumentará con el incremento de los precios del petróleo y la reducción gradual de sus fuentes. Además, los azúcares fermentables se usan cada vez más para producir plásticos, polímeros y otros materiales de origen biológico. La demanda de azúcares fermentables abundantes de bajo costo que se pueden usar en lugar de materia prima combustible a base de petróleo crece rápidamente.
Entre los materiales de biomasa renovables útiles se encuentran, principalmente, la celulosa y la hemicelulosa (xilanos) , que se pueden convertir en azúcares fermentables. La conversión enzimática de estos polisacáridos en azúcares solubles, por ejemplo, glucosa, xilosa, arabinosa, galactosa, mañosa y/u otras hexosas y pentosas, se produce debido a las acciones combinadas de varias enzimas. Por ejemplo, las endo-1, ?-ß-glucanasas (EG, por sus siglas en inglés) y exo-celobiohidrolasas (CBH, por sus siglas en inglés) catalizan la hidrólisis de celulosa insoluble en celooligosacáridos (por ejemplo, con celobiosa como un producto principal) , mientras que las ß -glucosidasas (BGL, por sus siglas en inglés) convierten los oligosacáridos en glucosa. Las xilanasas, junto con otras proteínas accesorias (los ejemplos no limitantes de las cuales incluyen L-a-arabinofuranosidasas , feruloil y acetilxilan esterasas, glucuronidasas y ß-xilosidasas) catalizan la hidrólisis de las hemicelulosas .
Las paredes celulares de las plantas están compuestas de una mezcla heterogénea de polisacáridos complejos que interactúan a través de medios covalentes y no covalentes . Los polisacáridos complejos de las paredes celulares de las plantas superiores incluyen, por ejemplo, celulosa (ß-1,4 glucano) que, generalmente, conforma el 35-50 % del carbono encontrado en los componentes de la pared celular. Los polímeros de celulosa se autoasocian a través de enlaces de hidrógeno, interacciones de van der Waals e interacciones hidrófobas para formar microfibrillas de celulosa semicristalina . Estas microfibrillas incluyen, además, regiones no cristalinas conocidas, generalmente, como celulosa amorfa. Las microfibrillas de celulosa se incrustan en una matriz formada por hemicelulosas (que incluyen, por ejemplo, xilanos, arábanos y mananos) , pectinas (por ejemplo, galacturonanos y galactanos) y otros ß-1,3 y ß-1,4 glucanos . Frecuentemente, estos polímeros se sustituyen, por ejemplo, con residuos de arabinosa, galactosa y/o xilosa para producir arabinoxilanos , arabinogalactanos , galactomananos y xiloglucanos altamente complejos. A su vez, la matriz de hemicelulosa está rodeada por lignina polifenólica .
Típicamente, para obtener azúcares fermentables útiles a partir de materiales de biomasa, la lignina se permeabiliza y la hemicelulosa se altera para permitir el acceso por parte de las enzimas que hidrolizan celulosa. Posiblemente se requiere un conjunto de actividades enzimáticas para descomponer la matriz compleja de un material de biomasa antes de poder obtener los azúcares fermentables.
Independientemente del tipo de materia prima celulósica, el costo y la eficacia hidrolítica de las enzimas son factores principales que restringen la comercialización de procesos de bioconversión de biomasa. Los costos de la producción microbiana de enzimas están asociados a la productividad de la cepa que produce enzimas y a la producción de actividad final a partir de la fermentación. La eficacia hidrolítica de un complejo multienzimático puede depender de múltiples factores, por ejemplo, propiedades de enzimas individuales, sinergias entre ellas y la relación en la mezcla muítienzimática .
En la técnica, existe la necesidad de identificar enzimas y/o composiciones enzimáticas capaces de convertir materiales vegetales y/u otros materiales celulósicos o hemicelulósicos en azúcares fermentables con una eficacia suficiente o mejorada, producciones mejoradas de azúcares fermentables y/o capacidad mejorada para actuar en una mayor variedad de materiales celulósicos o hemicelulósicos .
Sumario de la Invención
La descripción proporciona ciertos polipéptidos que tienen actividad de celulasa o celulolítica que incluyen, por ejemplo, ciertos polipéptidos de ß-glucosidasa y endoglucanasa y ciertos polipéptidos que tienen actividad hemicelulolítica que incluyen, por ejemplo, xilanasa (por ejemplo, endoxilanasa) , xilosidasa (por ejemplo, ß-xilosidasa) , arabinofuranosidasa (por ejemplo, L-OÍ-arabinofuranosidasa) , que proporcionan beneficios adicionales en la sacarificación de materiales de biomasa celulósicos y/o hemicelulósicos . La descripción proporciona, además, ácidos nucleicos que codifican estos polipéptidos, células recombinantes que expresan estos ácidos nucleicos, vectores y casetes de expresión que comprenden estos ácidos nucleicos. Además, la descripción proporciona métodos para elaborar y usar los polipéptidos y ácidos nucleicos. La descripción proporciona, además, composiciones que comprenden una combinación o mezcla de 2 o más (por ejemplo, 2 o más, 3 o más, 4 o más, 5 o más, etc.) enzimas seleccionadas de los polipéptidos de la descripción, y relaciones o pesos relativos adecuados de los polipéptidos presentes en la composición para obtener la sacarificación o proporcionar una eficacia y/o eficiencia de sacarificación mejorada. Una o más o todas las enzimas de la descripción pueden ser heterólogas a la célula huésped. Por otra parte, una o más o todas las enzimas de la descripción se pueden diseñar o modificar mediante ingeniería genética de modo que se expresen en un nivel diferente al que están en una célula huésped silvestre correspondiente. Además, la descripción proporciona métodos de uso en un entorno de investigación, un entorno industrial (por ejemplo, en la producción de biocombustibles) o un entorno comercial.
Para los fines de la presente descripción, se puede hacer referencia a la enzima por medio de las clases de enzimas con respecto a las cuales están categorizadas por aquellos con experiencia en la técnica. Además, se hace referencia a ella por sus actividades enzimáticas respectivas. Por ejemplo, una xilanasa se menciona como un polipéptido que tiene actividad de xilanasa o, indistintamente, como un polipéptido de xilanasa. Por consiguiente, la descripción se basa, en parte, en el descubrimiento de ciertas enzimas novedosas y variantes que tienen actividad de xilanasa, actividad de ß-xilosidasa, actividad de L-a-arabinofuranosidasa, actividad de ß-glucosidasa y/o actividades de endoglucanasa . La descripción se basa, además, en la identificación de composiciones enzimáticas novedosas que comprenden ciertas combinaciones o relaciones en peso particulares de polipéptidos que tienen estas actividades hemicelulolíticas y/o celulolíticas , que permiten la sacarificación eficaz de materiales celulósicos y hemicelulósicos .
Las enzimas y/o composiciones enzimáticas de la descripción se usan para producir azúcares fermentables a partir de biomasa. Después, los microorganismos pueden usar los azúcares para producir etanol, por ejemplo, por fermentación u otro medio de cultivo o los azúcares se pueden usar para producir otros bioproductos o biomateriales útiles. La descripción proporciona aplicaciones industriales (por ejemplo, procesos de sacarificación, procesos de producción de etanol) con el uso de las enzimas y/o composiciones enzimáticas descritas en la presente descripción. Entre sus diversos usos, las enzimas y/o composiciones enzimáticas de la descripción pueden reducir, ventajosamente, el costo de las enzimas en varios procesos industriales que incluyen, por ejemplo, la producción de biocombustibles .
En relación con esto, la descripción proporciona el uso de las enzimas y/o las composiciones enzimáticas de la invención en un entorno comercial. Por ejemplo, las enzimas y/o composiciones enzimáticas de la descripción se pueden vender en el mercado adecuado combinadas con instrucciones sobre los métodos de uso típicos o preferidos para las enzimas y/o composiciones. Por consiguiente, las enzimas y/o composiciones enzimáticas de la descripción se pueden usar o comercializar dentro de un modelo de suministro comercial de enzimas, en donde las enzimas y/o composiciones enzimáticas de la descripción se venden a un fabricante de bioetanol, una refinería de combustible o un fabricante de bioquímicos o biomateriales que está en el negocio de la producción de combustibles o productos biológicos. En algunos aspectos, la enzima y/o composición enzimática de la descripción se puede vender o comercializar con el uso de un modelo de biorefinería en el sitio, en donde la enzima y/o composición enzimática se produce o prepara en una instalación en o cerca de una refinería de combustibles o instalación del fabricante de bioquímicos/materiales biológicos, y la enzima y/o composición de la invención se adapta a las necesidades específicas de la refinería de combustibles o fabricante de bioquímicos/materiales biológicos en tiempo real. Además, la descripción se refiere al suministro a estos fabricantes del apoyo técnico y/o las instrucciones de uso de las enzimas y/o composiciones enzimáticas para fabricar y comercializar el producto biológico deseado (por ejemplo, biocombustible , bioquímicos, materiales biológicos, etc.)
Por consiguiente, en un primer aspecto, la invención se refiere a varios polipéptidos que incluyen variantes de estos y que tienen actividades de glicosil hidrolasas. La invención se refiere a polipéptidos aislados, a las variantes y al ácido nucleico que codifica los polipéptidos y variantes.
En algunos aspectos, la descripción proporciona polipéptidos aislados, sintéticos o recombinantes que comprenden una secuencia de aminoácidos que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident . : 44, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o en el dominio catalítico de longitud completa (CD, por sus siglas en inglés) o el dominio de unión a carbohidratos (CBM, por sus siglas en inglés) de longitud completa. En ciertas modalidades, los polipéptidos aislados, sintéticos o recombinantes tienen actividad de ß-glucosidasa . En ciertas modalidades, los polipéptidos aislados, sintéticos o recombinantes son polipéptidos de ß-glucosidasa que incluyen, por ejemplo, variantes, mutantes y polipéptidos de ß-glucosidasa de fusión/híbridos/quiméricos. Para la presente descripción, los términos "fusión", "híbrido" y "quimérico" se usan indistintamente y como equivalentes entre sí. En ciertas modalidades, la descripción proporciona un polipéptido que tiene actividad de ß-glucosidasa; el polipéptido es un híbrido o quimera de dos o más secuencias de ß -glucosidasa . Por ejemplo, la primera de las dos o más secuencias de ß -glucosidasa tiene una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 250, 300, 350, 400 o 500) residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms . de ident . : 96-108. En algunas modalidades, la segunda de las dos o más secuencias de ß -glucosidasa tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 125, 150, 175 o 200) residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 109-116. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) de los motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 197-202 y la segunda de las dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident. :203. En algunas modalidades, la primera secuencia está en el N-terminal, mientras que la segunda secuencia está en el C-terminal del polipéptido de ß-glucosidasa quimérico o híbrido. En algunas modalidades,, la primera secuencia se conecta a través de su residuo C-terminal con el residuo N-terminal de la segunda secuencia.
Por ejemplo, la primera secuencia está inmediatamente adyacente o conectada directamente a la segunda secuencia. En otras modalidades, la primera secuencia no está inmediatamente adyacente a la segunda secuencia, más bien la primera secuencia está conectada a la segunda secuencia a través de un dominio conector. En algunas modalidades, la primera secuencia, la segunda secuencia o ambas secuencias comprenden 1 o más sitios de glicosilación. En algunas modalidades, la primera o la segunda secuencia comprende una secuencia de bucle o una secuencia que codifica una estructura similar a un bucle. La secuencia de bucle puede tener una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos y comprende una secuencia de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205) . En otras modalidades, el dominio conector que conecta la primera y la segunda secuencia comprende la secuencia de bucle. En algunas modalidades, el polipéptido de ß-glucosidasa híbrido o quimérico tiene una estabilidad mejorada en comparación con los polipéptidos de ß-glucosidasa equivalentes a partir de los cuales se deriva la primera secuencia, la segunda secuencia o la secuencia del dominio conector. La estabilidad mejorada es, por ejemplo, una estabilidad proteolítica mejorada que se refleja en una estabilidad mejorada o en una mayor resistencia al clivaje proteolítico durante el almacenamiento en condiciones de almacenamiento estándar o durante la expresión y/o producción en condiciones de expresión/producción estándar. Por ejemplo, el polipéptido híbrido/quimérico es menos susceptible al clivaje proteolítico en un residuo dentro de la secuencia de bucle o en un residuo o posición que no está dentro de la secuencia de bucle.
En ciertas modalidades, la descripción proporciona un polipéptido aislado, sintético o recombinante que tiene actividad de ß-glucosidasa que es un híbrido de por lo menos 2 (por ejemplo, 2, 3 o aun 4) secuencias de ß-glucosidasa, en donde la primera de por lo menos 2 secuencias de ß-glucosidasa tiene una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 250, 300, 350 o 400) residuos de aminoácidos y comprende una secuencia que tiene por , lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 ¾, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % O 100 %) de identidad con respecto a una secuencia de la misma longitud que cualquiera de las sec . con núms . de ident . : 44, 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, mientras que la segunda de por lo menos 2 secuencias de ß-glucosidasa tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 125, 150 o 200) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 ¾ o 100 %) de identidad con respecto a una secuencia de la misma longitud que la sec. con núm. de ident . :60. En una modalidad alternativa, la descripción proporciona un polipéptido aislado, sintético o recombinante que codifica un polipéptido que tiene actividad de ß-glucosidasa que es un híbrido de por lo menos 2 (por ejemplo, 2, 3 o incluso 4) secuencias de ß-glucosidasa, en donde la primera de por lo menos 2 secuencias de ß -glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 250, 300, 350 o 400) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que la sec. con núm. de ident. :60, mientras que la segunda de por lo menos 2 secuencias de ß -glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 125, 150 o 200) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que cualquiera de las sec. con núms . de ident . : 44, 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) de los motivos de secuencias de aminoácidos de las sec. con núms. de ident. : 197-202 y la segunda de las dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident. :203. En algunas modalidades, la primera secuencia está en el N-terminal, mientras que la segunda secuencia está en el C-terminal del polipéptido de ß-glucosidasa quimérico o híbrido. En algunas modalidades, la primera secuencia se conecta a través de su residuo C-terminal con el residuo N-terminal de la segunda secuencia. Por ejemplo, la primera secuencia está inmediatamente adyacente o conectada directamente a la segunda secuencia. En otras modalidades, la primera secuencia no está inmediatamente adyacente a la segunda secuencia, más bien la primera secuencia está conectada a la segunda secuencia a través de un dominio conector. La primera secuencia, la segunda secuencia o ambas secuencias pueden comprender 1 o más sitios de glicosilación .
En algunas modalidades, la primera o la segunda secuencia comprende una secuencia de bucle o una secuencia que codifica una estructura similar a un bucle. En ciertas modalidades, la secuencia de bucle se deriva de un tercer polipéptido de ß-glucosidasa, tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos y comprende una secuencia de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205). En ciertas modalidades, el dominio conector que conecta la primera y la segunda secuencia comprende la secuencia de bucle.
En una modalidad ilustrativa, la descripción proporciona un polipéptido de ß-glucosidasa híbrido o quimérico derivado de dos o más secuencias de ß-glucosidasa, en donde la primera secuencia de ß-glucosidasa se deriva de Fv3C y tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y la segunda secuencia de ß-glucosidasa se deriva de un polipéptido de Bgl3 de T. reesei (o "Tr3B" ) y tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos. En algunas modalidades, el C-terminal de la primera secuencia está conectado al N-terminal de la segunda secuencia. Por consiguiente, la primera secuencia está inmediatamente adyacente o conectada directamente a la segunda secuencia. En otras modalidades, la primera secuencia está conectada a la segunda secuencia a través de una secuencia de un dominio conector. En algunas modalidades, la primera o la segunda secuencia comprende una secuencia de bucle. En algunas modalidades, la secuencia de bucle se deriva de un tercer polipéptido de ß-glucosidas . En ciertas modalidades, la secuencia de bucle tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos y comprende una secuencia de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) Y IT (sec. con núm. de ident.:205) . En ciertas modalidades, la secuencia de un dominio conector que conecta la primera y la segunda secuencia comprende la secuencia de bucle. En ciertas modalidades, la secuencia de bucle se deriva de un polipéptido de Te3A. En algunas modalidades, el polipéptido de ß-glucosidasa híbrido o quimérico tiene una estabilidad mejorada con respecto a los polipéptidos de ß-glucosidasa equivalentes a partir de los cuales se deriva cada parte quimérica, por ejemplo, con respecto a la del polipéptido de Fv3C, el polipéptido de Te3A y/o el polipéptido de Tr3B. En algunas modalidades, la estabilidad mejorada es una estabilidad proteolítica mejorada que se refleja en una menor sensibilidad al clivaje proteolítico en un residuo en la secuencia de bucle o en un residuo o posición que está fuera de la secuencia de bucle, durante el almacenamiento en condiciones de almacenamiento estándar o durante la expresión y/o producción, en condiciones de expresión/producción estándar.
En ciertos aspectos, la descripción proporciona nucleótidos aislados, sintéticos o recombinantes que codifican un polipéptido de ß-glucosidasa que tiene por lo menos 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident.: 44, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o en el dominio catalítico (CD, por sus siglas en inglés) de longitud completa o el módulo de unión a carbohidratos (CBM, por sus siglas en inglés) de longitud completa. En algunas modalidades, el nucleótido aislado, sintético o recombinante codifica un polipéptido de ß-glucosidasa que es un híbrido o quimera de dos o más secuencias de ß-glucosidasa . En algunas modalidades, el polipéptido de ß -glucosidasa híbrido/quimérico comprende una primera secuencia de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 250, 300, 350, 400 o 500) residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 96-108. En algunas modalidades, el polipéptido de ß-glucosidasa híbrido/quimérico comprende una segunda secuencia de ß-glucosidasa que tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 125, 150, 175 o 200) residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms . de ident . : 109-116. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) de los motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 197-202 y la segunda de las dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident.: 203. En ciertas modalidades, el C-terminal de la primera secuencia de ß-glucosidasa está conectado al N-terminal de la segunda secuencia de ß-glucosidasa . Alternativamente, la primera y la segunda secuencia de -glucosidasa se conectan a través de una tercera secuencia de nucleótidos que codifica un dominio conector. La primera secuencia, la segunda secuencia o el dominio conector pueden comprender una secuencia de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident. :205) . En algunas modalidades, la secuencia de bucle se deriva de un tercer polipéptido de ß-glucosidasa .
En ciertos aspectos, la descripción proporciona un nucleótido aislado, sintético o recombinante que codifica un polipéptido que tiene actividad de ß-glucosidasa que es un híbrido de por lo menos 2 (por ejemplo, 2, 3 o incluso 4) secuencias de ß-glucosidasa, en donde la primera de por lo menos 2 secuencias de ß-glucosidasa tiene una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 250, 300, 350 o 400) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que cualquiera de las sec. con núms . de ident . : 44, 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, mientras que la segunda de por lo menos 2 secuencias de ß-glucosidasa tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 125, 150 o 200) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que la sec. con núm. de ident. :60. Alterna ivamente, la descripción proporciona un nucleótido aislado, sintético o recombinante que codifica un polipéptido que tiene actividad de ß-glucosidasa que es un híbrido de por lo menos 2 (por ejemplo, 2, 3 o incluso 4) secuencias de ß-glucosidasa, en donde la primera de por lo menos 2 secuencias de ß-glucosidasa tiene una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 250, 300, 350 o 400) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que la sec. con núm. de ident.:60, mientras que la segunda de por lo menos 2 secuencias de ß-glucosidasa tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 125, 150 o 200) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que cualquiera de las sec. con núms . de ident . : 44, 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es ident . : 205) . En ciertas modalidades, la secuencia de bucle se deriva de un tercer polipéptido de ß-glucosidasa .
En algunos aspectos, la descripción proporciona nucleótidos aislados, sintéticos o recombinantes que tienen por lo menos 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident.: 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 92 o 94 o con respecto a un fragmento de estas que tiene una longitud de por lo menos aproximadamente 300 (por ejemplo, por lo menos aproximadamente 300, 400, 500 o 600) residuos. En ciertas modalidades, se proporcionan nucleótidos aislados, sintéticos o recombinantes capaces de hibridarse a cualquiera de las sec. con núms. de ident.: 53, 55, 57,' 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 92 o 94, a un fragmento con una longitud de por lo menos aproximadamente 300 residuos o a un complemento de estas, en condiciones de rigurosidad baja, rigurosidad media, rigurosidad alta o rigurosidad muy alta.
En ciertas modalidades, la descripción proporciona polipéptidos aislados, sintéticos o recombinantes que tienen por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a cualquiera de las sec. con núms. de ident.:44, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95, en el dominio catalítico (CD) de longitud completa o el módulo de unión a carbohidratos (CBM) . Los polipéptidos aislados, sintéticos o recombinantes pueden tener actividad de ß-glucosidasa .
En algunos aspectos, la descripción proporciona polipéptidos aislados, sintéticos o recombinantes que tienen por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident . : 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o en el dominio catalítico (CD) de longitud completa o el dominio de unión a carbohidratos (CBM). En ciertas modalidades, los polipéptidos aislados, sintéticos o recombinantes tienen actividad de GH6l/endoglucanasa . "Actividad de GH6l/endoglucanasa" significa que el polipéptido tiene actividad enzimática de la familia 61 de glicosil hidrolasas y/o actividad de endoglucanasa . En algunas modalidades, la descripción proporciona polipéptidos aislados, sintéticos o recombinantes con una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 100, 150, 200, 250 o 300) residuos de aminoácidos que comprenden uno o más motivos de secuencias seleccionados del grupo que consiste en (1) las sec. con núms . de ident.:84 y 88; (2) las sec . con núms. de ident.:85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec. con núm. de ident.:87; (5) las sec. con núms. de ident.:84, 88 y 89; (6) las sec. con núms. de ident.:85, 88 y 89; (7) las sec. con núms. de ident . : 84, 88 y 90; (8) las sec. con núms. de ident. : 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. En ciertas modalidades, el polipéptido es un polipéptido de endoglucanasa DE GH61 (por ejemplo, un polipéptido de EG IV de un microorganismo u otra fuente adecuada que incluye, sin limitarse a, la enzima Eg4 de G. reesei) . En algunas modalidades, el polipéptido de endoglucanasa de GH61 es un polipéptido variante, mutante o de fusión derivado de Eg4 de T. reesei (por ejemplo, un polipéptido que comprende por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la sec. con núm. de ident. :52) .
En algunos aspectos, la descripción proporciona un nucleótido aislado, sintético o recombinante que codifica un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident.: 52, 80-81 y 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o en el dominio catalítico (CD) de longitud completa o el dominio de unión a carbohidratos (CBM) . Por ejemplo, el nucleótido aislado, sintético o recombinante codifica un polipéptido que tiene actividad de GH61/endoglucanasa . En algunas modalidades, la descripción proporciona un nucleótido aislado, sintético o recombinante que codifica un polipéptido con una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 100, 150, 200, 250 o 300) residuos de aminoácidos que comprenden uno o más motivos de secuencias seleccionados del grupo que consiste en (1) las sec. con núms. de ident .: 84 y 88; (2) las sec. con núms. de ident..-85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec. con núm. de ident. :87; (5) las sec. con núms. de ident. :84, 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident. : 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms . de ident.:84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. Por ejemplo, el nucleótido es un nucleótido que codifica un polipéptido que tiene por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la sec. con núm. de ident.: 52. En algunas modalidades, el nucleótido codifica un polipéptido de endoglucanasa de GH61 (por ejemplo, un polipéptido de EG IV de un organismo adecuado, tal como, sin limitarse a, Eg4 de T. reesei) .
En algunos aspectos, la descripción proporciona un polipéptido aislado, sintético o recombinante que tiene por lo menos aproximadamente 70 %, por ejemplo, por lo menos aproximadamente 71 %, 72 % , 73 %, 74 % 75 %, 76 %, 77
78 %, 79 ¾, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 o. 97
98 % o 99 % o total (100 %) de identidad de secuencia con respecto a un polipéptido de cualquiera de las sec. con núms. de ident. :2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 43 y 45 en una región de por lo menos aproximadamente 10, por ejemplo, por lo menos aproximadamente 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325 o 350 residuos o en el polipéptido inmaduro de longitud completa, polipéptido maduro, dominio catalítico (CD) o dominio de unión a carbohidratos (CBM) .
En algunos aspectos, la descripción proporciona un nucleótido aislado, sintético o recombinante que codifica un polipéptido que tiene por lo menos aproximadamente 70 % (por ejemplo, por lo menos aproximadamente 71 9o- f 11 ¿* 9¾- / 73 %, 74 %,
75 %, 76 ¾ f 77 %, 78 %, 79 %, 80 %, 81 "6 / 82 "6 , 83 %, 84 %,
85 %, 86 g. 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %,
95 %, 96 %, 97 %, 98 % o 99 % o total i (100 %)) de identidad de secuencia con respecto a un polipéptido de cualquiera de las sec. con núms . de ident.:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 43 y 45 en una región de por lo menos aproximadamente 10, por ejemplo, por lo menos aproximadamente 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325 o 350 residuos o en el polipéptido inmaduro de longitud completa, el polipéptido maduro, el dominio catalítico (CD) o el dominio de unión a carbohidratos (CBM) . En algunos aspectos, la descripción proporciona un nucleótido aislado, sintético o recombinante que tiene por lo menos aproximadamente 70 % (por ejemplo, por lo menos aproximadamente 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %,
78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 8,8 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % o total (100 %) ) de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident . : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 y 41 o con respecto a un fragmento de estas. El fragmento puede tener una longitud de por lo menos aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 residuos. En algunas modalidades, la descripción proporciona un nucleótido aislado, sintético o recombinante que se híbrida en condiciones de rigurosidad baja, condiciones de rigurosidad media, condiciones de rigurosidad alta o condiciones de rigurosidad muy alta con respecto a cualquiera de las sec. con núms. de ident.: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 y 41 o con respecto a un fragmento o subsecuencia de estas.
Las secuencias de polipéptidos de la descripción incluyen, además, secuencias codificadas por los ácidos nucleicos de la descripción, por ejemplo, aquellas descritas en la Sección 5.1. más abajo.
La descripción proporciona, además, una proteína de fusión o quimérica que comprende por lo menos un dominio de un polipéptido (por ejemplo, el CD, el CBM o ambos) . Por lo menos un dominio puede estar unido operativamente a una segunda secuencia de aminoácidos, por ejBmplo, una secuencia del péptido señal. Por lo tanto, la descripción proporciona un primer tipo de enzima de fusión o quimérica producida por medio de la expresión de una secuencia de nucleótidos que comprende una secuencia señal de un polipéptido de la descripción unida operativamente a una segunda secuencia de nucleótidos que codifica un segundo polipéptido diferente, por ejemplo, un polipéptido heterólogo no asociado naturalmente con la secuencia señal . La descripción proporciona, por ejemplo, un polipéptido recombinante que comprende los residuos 1 a 13, 1 a 14 , 1 a 15, 1 a 16, l a 17, 1 a 18, 1 a 19, l a 20, 1 a 21, 1 a 22, l a 23, 1 a 24, 1 a 25, l a 26, 1 a 27, 1 a 28, l a 28, 1 a 30, 1 a 31, l a 32, 1 a 33, 1 a 34, 1 a 35, 1 a 36, 1 a 37, 1 a 38 o 1 a 40, por ejemplo, de las sec . con núms . de ident.:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 43, 45, 52, 54, 56, 58, 60, 62, .64, 66, 68, 70, 72, 74, 76, 78-83, 93 o 95, con un polipéptido no asociado naturalmente a él. Otros polipéptidos quiméricos o de fusión se describen en la Sección 5.1.1. más abajo.
La descripción proporciona un segundo tipo de enzima quimérica o de fusión que comprende un primer tramo contiguo de residuos de aminoácidos de una primera secuencia de polipéptidos que está unida operativamente a un segundo tramo contiguo de residuos de aminoácidos de una segunda secuencia de polipéptidos. El primer y/o el segundo tramo contiguo puede comprender, opcionalmente, péptidos señal. Por consiguiente, este tipo de enzima quimérica o de fusión se obtiene por medio de la expresión de un polinucleótido que comprende un primer gen que codifica el primer tramo contiguo de residuos de aminoácidos de la primera secuencia de polipéptidos y un segundo gen que codifica el segundo tramo contiguo de residuos de aminoácidos de la segunda secuencia de polipéptidos, en donde el primer gen y el segundo gen están unidos directa y operativamente. En otras modalidades, la estrategia quimérica o de fusión se puede usar para unir operativamente 2 o más tramos contiguos de residuos de aminoácidos obtenidos de distintas enzimas, en donde los tramos contiguos no se unen o asocian en forma natural o nativa. En ciertas modalidades, los tramos contiguos de residuos de aminoácidos que están unidos operativamente se pueden obtener de enzimas que tienen una actividad enzimática similar, pero que son heterólogos entre sí y/o con respecto a la célula huésped.- En otra modalidad, 2 o más tramos contiguos de residuos de aminoácidos unidos operativamente se pueden unir, además, a un péptido señal adecuado, tal como se describe en la presente descripción. En otra modalidad, el primer tramo contiguo de residuos de aminoácidos y el segundo tramo contiguo de residuos de aminoácidos se unen a través de un dominio conector. En algunas modalidades, el primer tramo contiguo de residuos de aminoácidos, el segundo tramo contiguo de residuos de aminoácidos o la secuencia conectora pueden comprender la secuencia de bucle que tiene una longitud, por ejemplo, de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos y una secuencia de aminoácidos de FD SPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205). En ciertas modalidades, la secuencia de bucle se deriva de una enzima diferente a las enzimas a partir de las cuales se deriva el primer y el segundo tramo contiguo de residuos de aminoácidos. En algunas modalidades, las enzimas quiméricas o de fusión resultantes tienen una estabilidad mejorada, por ejemplo, que se refleja en la estabilidad frente a la proteólisis o degradación proteolítica durante el almacenamiento en condiciones de almacenamiento estándar o durante la expresión/producción en condiciones de expresión o producción estándar, cuando se compara con cada equivalente enzimático a partir del cual se obtienen las partes quiméricas .
Para la presente descripción, las enzimas quiméricas o de fusión se definen por la actividad ensimática de una de las enzimas originales a partir de la cual se deriva la secuencia quimérica. Por ejemplo, si una de las secuencias quiméricas se deriva de o es una variante de una ß-glucosidasa, entonces, independientemente de la enzima o enzimas a partir de las cuales se derivan las otras secuencias quiméricas del mismo polipéptido, la enzima híbrida/quimera se menciona como un polipéptido de ß-glucosidasa. Para los fines de la presente descripción, un "polipéptido X" abarca una variante, un mutante o un polipéptido X quimérico/de fusión que tiene actividad enzimática X.
Por lo tanto, la presente descripción proporciona polipéptidos y/o nucleótidos o ácidos nucleicos que codifican polipéptidos que tienen actividades hemicelulolíticas o actividades celulolíticas . Las actividades hemicelulolíticas incluyen, sin limitarse a, actividades de xilanasa, ß-xilosidasa y/o L-a- arabinofuranosidasa . Los polipéptidos que tienen actividad hemicelulolítica incluyen, sin limitarse a, una xilanasa, una ß-xilosidasa y/o una L-a-arabinofuranosidasa . Los polipéptidos que tienen actividades de celulasa incluyen, sin limitarse a, actividad de ß-glucosidasa o actividad de celulasa completa enriquecida con ß-glucosidasa y actividad de GH6l/endoglucanasa o actividad de celulasa enriquecida con endoglucanasa.
La descripción proporciona, además, un cásete de expresión que comprende un ácido nucleico de la descripción o una subsecuencia de este. Por ejemplo, el ácido nucleico comprende por lo menos aproximadamente 60 %, por ejemplo, por lo menos aproximadamente 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con respecto a una secuencia de ácido nucleico de las sec. con núms . de ident.:53, 55, 57, 59, 61, 63, 65, 69, 71, 73, 75, 77, 92, 94 en una región de por lo menos aproximadamente 10 residuos, por ejemplo, por lo menos aproximadamente 10, 20, 30, 40, 50, 75, 90, 100, 150, 200, 250, 300, 350, 400 o 500 residuos. En algunos aspectos, el ácido nucleico codifica un polipéptido de ß-glucosidasa que puede ser, por ejemplo, un polipéptido quimérico/de fusión derivado de dos o más polipéptidos de ß-glucosidasa y que comprende dos o más secuencias de ß-glucosidasa, en donde la primera secuencia tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende una o más o todas las sec. con núms. de ident . :96-108, mientras que la segunda secuencia tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y comprende una o más o todas las sec. con núms. de ident. :109-116 y, opcionalmente , una tercera secuencia con una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD(R/K)YNIT (sec. con núm. de ident.: 205) y que se deriva de un tercer polipéptido de ß-glucosidasa diferente al primer o al segundo polipéptido de ß -glucosidasa . Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) motivos de secuencias de aminoácidos de las sec . con núms . de ident . : 197-202 y la segunda de dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident. :203 y, opcionalmente , además, una tercera secuencia con una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident. :205) y que se deriva de un tercer polipéptido de ß-glucosidasa diferente del primer o segundo polipéptido de ß-glucosidasa .
En algunos aspectos, la descripción proporciona un cásete de expresión que comprende un ácido nucleico que codifica un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con respecto a cualquiera de las sec . con núms. de ident.: 52, 80-81, 206-207 o cualquiera de los motivos de secuencias seleccionadas del grupo que consiste en: (1) las sec. con núms. de ident. :84 y 88; (2) las sec. con núms. de ident. :85 y 88; (3) la sec. con núm. de ident.:86; (4) la sec . con núm. de ident.:87; (5) las sec . con núms . de ident.:84, 88 y 89; (6) las sec. con núms . de ident.:85, 88 y 89; (7) las sec. con núms. de ident.: 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91.
En algunos aspectos, la descripción proporciona un cásete de expresión que comprende un ácido nucleico que codifica un polipéptido que tiene por lo menos aproximadamente 70 % (por ejemplo, por lo menos aproximadamente 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. :2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 43 y 45 en una región de por lo menos aproximadamente 10 residuos, por ejemplo, por lo menos aproximadamente 10, 20, 30, 40, 50, 75, 90, 100, 150, 200, 250, 300, 350, 400 o 500 residuos. En algunos aspectos, la descripción proporciona un cásete de expresión que comprende un ácido nucleico que se híbrida en condiciones de rigurosidad baja, condiciones de rigurosidad media o condiciones de rigurosidad alta con respecto a cualquiera de las sec. con núms . de ident.: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 y 41 o con respecto a un fragmento o subsecuencia de estas, en donde el fragmento o subsecuencia tiene una longitud de por lo menos aproximadamente, por ejemplo, 10, 20, 30, 40, 50, 75, 100, 125, 150, 200, 250 residuos.
En algunos aspectos, el ácido nucleico del cásete de expresión está unido operativamente a un promotor. El promotor puede ser, por ejemplo, un promotor fúngico, viral, bacteriano, mamífero o vegetal. El promotor puede ser un promotor constitutivo o un promotor inducible, por ejemplo, en un hongo filamentoso. Un promotor adecuado se puede derivar de un hongo filamentoso. Por ejemplo, el promotor puede ser un promotor del gen de celobiohidrolasa 1 ("cjbhl") de T. reesei.
En algunos aspectos, la descripción proporciona una célula recombinante modificada genéticamente para expresar un ácido nucleico o un cásete de expresión de la descripción. La célula recombinante es, preferentemente, una célula bacteriana, una célula de un mamífero, una célula fúngica, una célula de levadura, una célula de insecto o una célula vegetal. Por ejemplo, la célula recombinante es una célula fúngica filamentosa recombinante, tal como una célula de Trichoderma, Humicola, Fusarium, Aspergillus, Neurospora, Penicillium, Cephalosporium, Achlya, Podospora , Endothia , Mucor, Cochliobolus, Pyricularia o Chrysosporium.
La descripción proporciona, además, métodos para producir un polipéptido recombinante que comprende: (a) cultivar una célula huésped modificada genéticamente para expresar un polipéptido de la descripción; y (b) recuperar el polipéptido. La recuperación del polipéptido incluye, por ejemplo, la recuperación del caldo de fermentación que comprende el polipéptido. El caldo de fermentación se puede usar con un procesamiento mínimo posterior a la producción, por ejemplo, purificación, ultrafiltración, una etapa de exterminación celular, etc. y, en ese caso, se dice que el caldo de fermentación se usa en una formulación de caldo entero. Alternativamente, el polipéptido se puede recuperar con el uso de una o varias etapas de purificación.
En otro aspecto, la invención se refiere a ciertas composiciones enzimáticas diseñadas por ingeniería genética que comprenden 2 o más, 3 o más, 4 o más o 5 o más polipéptidos (que incluyen variantes, mutantes o polipéptidos de fusión/quiméricos adecuados) de la invención, en donde las composiciones enzimáticas pueden hidrolizar uno o más componentes de un material de biomasa lignocelulósica . Tales componentes incluyen, por ejemplo, hemicelulosa y, opcionalmente , celulosa. Los materiales de biomasa lignocelulósica adecuados incluyen, sin limitarse a, semillas, granos, tubérculos, desechos vegetales o subproductos del procesamiento de alimentos o procesamiento industrial (por ejemplo, tallos) , maíz (que incluye, por ejemplo, mazorcas, rastrojo y similares), césped (por ejemplo, pasto indio, tal como Sorghastrum nutans; o césped de pradera, por ejemplo, especies Panicum, tales como Panicum virgatum) , cañas perennes, por ejemplo, cañas bravas, madera (que incluye, por ejemplo, astillas, desechos de procesamiento), papel, pulpa, papel reciclado (por ejemplo, papel de periódico) . Las combinaciones/composiciones enzimáticas pueden usarse para hidrolizar celulosa que comprende una cadena lineal de porciones de glucosa con enlaces ß-1,4 o hemicelulosa de una estructura compleja que varía entre una planta y otra.
Las composiciones enzimáticas diseñadas por ingeniería genética de la invención pueden comprender una cantidad de polipéptidos diferentes que tienen, por ejemplo, actividad de hemicelulasa o actividad de celulasa. La actividad de hemicelulasa puede ser actividad de xilanasa, actividad de arabinofuranosidasa o actividad de xilosidasa. La actividad de celulasa puede ser actividad de glucosidasa, actividad de celobiohidrolasa o actividad de endoglucanasa . Un polipéptido de la composición enzimática de la invención puede ser un polipéptido que tiene una o más de las actividades de hemicelulasa y/o de celulasa. Por ejemplo, un polipéptido de la composición enzimática puede tener actividad de ß-xilosidasa y actividad de L-a-arabinofuranosidasa . Además, dos o más polipéptidos de una composición enzimática determinada pueden tener la misma actividad enzimática o una similar. Por ejemplo, más de un polipéptido en la composición puede tener, independientemente, actividad de endoglucanasa, actividad de ß-xilosidasa o actividad de ß-glucosidasa .
Los polipéptidos adecuados de la invención pueden aislarse de fuentes naturales. Por ejemplo, uno o más polipéptidos se pueden purificar o purificar sustancialmente a partir de fuentes naturales. En otro ejemplo, uno o más polipéptidos se pueden producir en forma recombinante por medio de un organismo diseñado por ingeniería genética, tal como por medio de una bacteria u hongo recombinante . Un organismo recombinante puede sobreexpresar uno o más polipéptidos. Uno o más polipéptidos se pueden expresar o coexpresar con uno o más polipéptidos heterólogos (es decir, que no son de origen natural en los mismos organismos) . Los genes que codifican uno o más polipéptidos de la invención se pueden integrar en los materiales genéticos de un organismo huésped recombinante, por ejemplo, una célula fúngica huésped o una célula bacteriana huésped que, después, se puede usar para producir los productos génicos.
Las composiciones enzimáticas de la invención pueden ser composiciones de origen natural o diseñadas por ingeniería genética. El término "composición enzimática de origen natural" se refiere a una composición que existe en la naturaleza, por ejemplo, una composición derivada directamente de un organismo no modificado cultivado en condiciones de su entorno nativo. El término "composición modificada genéticamente" se refiere a una composición en donde por lo menos una enzima (1) se produce en forma recombinante ; (2) se produce por medio de un organismo a través de la expresión de un gen heterólogo; y/o (3) está presente en una cantidad o porcentaje en peso relativo que es mayor o menor al presente en una composición enzimática de origen natural que comprende tipos de enzimas idénticas o similares. Una enzima "producida en forma recombinante" es una enzima producida a través de medios recombinantes . Una enzima producida en forma recombinante puede estar presente en una mezcla, en donde la enzima producida en forma recombinante está entre mezclas de otras enzimas que no coexisten en forma natural. Además, una composición modificada genéticamente puede ser una composición producida por un organismo encontrado en la naturaleza (es decir, un organismo no modificado) cultivado en condiciones diferentes a aquellas encontradas en su entorno nativo.
Los polipéptidos , mezcla de estos y/o las composiciones enzimáticas diseñadas por ingeniería genética de la invención se pueden usar para hidrolizar materiales de biomasa u otras materias primas adecuadas. Las composiciones enzimáticas comprenden, preferentemente, mezclas de 2 o más, 3 o más, 4 o más o aun 5 o más polipéptidos de la invención seleccionados de xilanasas, xilosidasas, celobiohidrolasas , endoglucanasas , glucosidasas y, opcionalmente, arabinofuranosidasas y/u otras enzimas que pueden catalizar o ayudar a la digestión o conversión de materiales de hemicelulosa en azúcares fermentables . Las glucosidasas adecuadas incluyen, por ejemplo, varias ß-glucosidasas que incluyen, sin limitarse a, aquellas que tienen una identidad de por lo menos aproximadamente 60 % {por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 , 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) con respecto a cualquiera de las sec. con núms . de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos. Las glucosidasas adecuadas incluyen, además, por ejemplo, un polipéptido de ß-glucosidasa quimérico/de fusión que comprende dos o más secuencias de ß-glucosidasa, en donde la primera secuencia derivada de una primera ß-glucosidasa tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms. de ident. : 96-108, mientras que la segunda secuencia derivada de una segunda ß-glucosidasa tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms . de ident . : 109- 116 y, opcionalmente , además, una tercera secuencia con una longitud de 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que codifican una secuencia de bucle derivada de una tercera ß-glucosidasa que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. : 204) o de FD (R/K) YNIT (sec. con núm. de ident. :205) . Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) motivos de secuencias de aminoácidos de las sec. con núms. de ident. : 197-202 y la segunda de dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident. :203 y, opcionalmente, además, una tercera secuencia con una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident. :205) y que se deriva de un tercer polipéptido de ß-glucosidasa diferente del primer o segundo polipéptido de ß-glucosidasa .
Las endoglucanasas adecuadas incluyen, por ejemplo, una o más endoglucanasas de GH61 que incluyen, sin limitarse a, aquellas que tienen por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident . : 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 {por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos. Las endoglucanasas adecuadas pueden incluir, además, polipéptidos que comprenden uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec. con núms. de ident. : 84 y 88; (2) las sec. con núms. de ident. :85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec. con núm. de ident. :87; (5) las sec. con núms. de ident. :84, 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident.: 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91.
Las otras enzimas útiles para la digestión de hemicelulosa en azúcares fermentables incluyen, sin limitarse a, una celulasa, una hemicelulasa o una composición que comprende una celulasa o una hemicelulasa. Además, otros polipéptidos adecuados que pueden estar presentes incluyen, por ejemplo, celobiosa deshidrogenasas . Una composición enzimática modificada genéticamente de la invención puede comprender mezclas de 2 o más, 3 o más, 4 o más o aun 5 o más polipéptidos de la invención seleccionados de xilanasas, xilosidasas, arabinofuranosidasas y un panel de celulasas. La composición enzimática modificada genéticamente puede comprender, además, opcionalmente , una o más celobiosa deshidrogenasas. La composición de celulasa completa puede ser una composición enriquecida con un polipéptido de ß-glucosidasa o enriquecida con un polipéptido de endoglucanasa o enriquecida con un polipéptido de ß-glucosidasa y un polipéptido de endoglucanasa. En algunas modalidades, el polipéptido de endoglucanasa puede ser un polipéptido que pertenece a la familia GH61, por ejemplo, un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident . : 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos. El polipéptido de endoglucanasa puede ser un polipéptido que comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec. con núms . de ident.:84 y 88; (2) las sec . con núms. de ident.:85 y 88; (3) la sec. con núm. de ident.:86; (4) la sec. con núm. de ident.:87; (5) las sec. con núms. de ident.:84, 88 y 89; (6) las sec. con núms. de ident.:85, 88 y 89; (7) las sec. con núms. de ident . : 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. Por ejemplo, el polipéptido de endoglucanasa puede ser un EGIV de un organismo adecuado, tal como Eg4 de T. reesei . En algunas modalidades, el polipéptido de ß-glucosidasa puede ser un polipéptido que tiene por lo menos aproximadamente 60 % {por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad con respecto a cualquiera de las sec. con núms. de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275 o 300) residuos .
Un primer ejemplo no limitante de una composición enzimática modificada genéticamente de la invención comprende 4 polipéptidos : (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa, (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa y (4) un cuarto polipéptido que tiene actividad de ß-glucosidasa . En ciertas modalidades, el cuarto polipéptido que tiene actividad de ß-glucosidasa tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident . : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos. En ciertas modalidades, el cuarto polipéptido que tiene ß-glucosidasa es un polipéptido quimérico/de fusión que comprende dos o más secuencias de ß-glucosidasa, en donde la primera secuencia derivada de una primera ß -glucosidasa tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencia de las sec . con núms . de ident . : 96-108, mientras que la segunda secuencia derivada de una segunda ß-glucosidasa tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencia de las sec. con núms. de ident .: 109-116 y, opcionalmente, además, una tercera secuencia que tiene una longitud de 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que codifican una secuencia de bucle derivada de una tercera ß-glucosidasa que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident. :205). Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 197-202 y la segunda de dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident. :203 y, opcionalmente, además, una tercera secuencia con una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident.:205) y que se deriva de un tercer polipéptido de ß-glucosidasa diferente del primer o segundo polipéptido de ß-glucosidasa. Por ejemplo, el cuarto polipéptido que tiene actividad de ß-glucosidasa comprende una primera secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 200 residuos de Fv3C (sec. con núm. de ident.:60), por ejemplo, un tramo de por lo menos 200 residuos del N-terminal o una posición de aminoácidos cerca del N-terminal de la sec. con núm. de ident.:60 y una segunda secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo que tiene por lo menos 50 residuos de Bgl3 de T. reesei (Tr3B, sec. con núm. de ident.:64), por ejemplo, un tramo de por lo menos 50 residuos del C-terminal o una posición de aminoácidos cerca del C-terminal de la sec . con núm. de ident.:64. El cuarto polipéptido puede comprender, además, una tercera secuencia de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que se deriva de una secuencia de longitud igual de Te3A (sec. con núm. de ident.:66) o comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205). En algunas modalidades, el cuarto polipéptido comprende una secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident . : 93 o 95 o con respecto a una subsecuencia o fragmento de por lo menos aproximadamente 20, 30, 40, 50, 60, 70 o más residuos de las sec . con núms . de ident . : 93 o 95.
En algunas modalidades, la composición enzimática modificada genéticamente comprende, además, un quinto polipéptido que tiene actividad de GH61/endoglucanasa o, alternativamente, una celulasa completa enriquecida con endoglucanasa de GH61. Por ejemplo, el polipéptido que tiene actividad de GH61/endoglucanasa es un polipéptido de EGIV, por ejemplo, un Eg4 de T. reesei. La celulasa completa enriquecida con GH61 es una celulasa completa enriquecida con un polipéptido de EGIV, por ejemplo, Eg4 de T. reesei. En algunas modalidades, el quinto polipéptido tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.: 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec. con núms. de ident .: 84 y 88; (2) las sec. con núms. de ident. :85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec . con núm. de ident.:87; (5) las sec. con núms . de ident.:84, 88 y 89; (6) las sec. con núms. de ident.:85, 88 y 89; (7) las sec. con núms. de ident . : 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident. : 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91; y (14) las sec. con núms. de ident. : 85, 88, 90 y 91. En algunas modalidades, la composición enzimática comprende, además, una celobiosa deshidrogenasa .
En algunas modalidades, el primer polipeptido que tiene actividad de xilanasa tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.: 24, 26, 42 y 43 o con respecto a una secuencia madura de estas. Por ejemplo, el primer polipéptido es AfuXyn2 , AfuXyn5 , Xyn3 de T. reesei o Xyn2 de T. reesei .
En algunas modalidades, el segundo polipéptido que tiene actividad de xilosidasa se selecciona de polipéptidos de ß-xilosidasa de un Grupo 1 o Grupo 2. Los polipéptidos de ß-xilosidasa del Grupo 1 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. : 2 y 10 o con respecto a una secuencia madura de estas. Por ejemplo, la ß-xilosidasa del Grupo 1 puede ser Fv3A o Fv43A. Los polipéptidos de ß-xilosidasa del Grupo 2 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.:4, 6, 8, 10, 12, 14, 16, 18, 28, 30 y 45 o con respecto a una secuencia madura de estas. Por ejemplo, las ß-xilosidasas del Grupo 2 pueden ser Pf43A, Fv43E, Fv39A, Fv43B, Pa51A, Gz43A, Fo43A, Fv43D, Pf43B o Bxll de G. reesei .
En algunas modalidades, el tercer polipéptido que tiene actividad de arabinofuranosidasa tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.:12, 14, 20, 22 y 32 o con respecto a una secuencia madura de estas. Por ejemplo, el tercer polipéptido puede ser Fv43B, Pa51A, Af43A, Pf51A o Fv51A.
El primero, segundo, tercero, cuarto o quinto polipéptido se puede aislar o purificar a partir de una fuente de origen natural. Alternativamente, se puede expresar o sobreexpresar por medio de una célula huésped recombinante. Se puede añadir a una composición enzimática en forma aislada o purificada. Se puede expresar o sobreexpresar por medio de un organismo huésped o célula huésped como parte de una mezcla de cultivo, por ejemplo, un caldo de fermentación. En algunas modalidades, un gen que codifica el polipéptido se puede integrar en el material genético del organismo huésped lo que permite la expresión de los polipéptidos codificados por ese organismo.
Un segundo ejemplo no limitante de una composición enzimática modificada genéticamente de la invención comprende: (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa, (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa y (4) una composición de celulasa completa enriquecida con ß -glucosidasa . En ciertas modalidades, la composición de celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido de ß-glucosidasa que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident . : 54, 56, 58, 60, 62, 64, 66,.68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos. En ciertas modalidades, la composición de celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido de ß-glucosidasa quimérico/de fusión que comprende 2 o más secuencias de ß-glucosidasa, en donde la primera secuencia derivada de una primera ß-glucosidasa tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencia de las sec. con núms . de ident . : 96-108, mientras que la segunda secuencia derivada de una segunda ß-glucosidasa tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencia de las sec. con núms. de ident .: 109- 116 y, opcionalmente , además una tercera secuencia con una longitud de 3 , 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que codifican una secuencia de bucle derivada de una tercera ß-glucosidasa que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.: 204) o de FD (R/K) Y IT (sec. con núm. de ident. :205). Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 197-202 y la segunda de dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident. :203 y, opcionalmente, además, una tercera secuencia con una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident.:205) que se deriva de un tercer polipéptido de ß-glucosidasa diferente del primer o segundo polipéptido de ß-glucosidasa. Por ejemplo, la composición de celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido de ß-glucosidasa que comprende una primera secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 200 residuos de Fv3C (sec. con núm. de ident.:60), por ejemplo, un tramo de por lo menos 200 residuos del N-terminal o de un residuo que está cerca del N-terminal de la sec. con núm. de ident.:60 y una segunda secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 50 residuos de Bgl3 de T. reesei (Tr3B, sec. con núm. de ident.:64), por ejemplo, un tramo de por lo menos 50 residuos del C-terminal o de un residuo cerca del C-terminal de la sec. con núm. de ident.:64. La composición de celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido de ß-glucosidasa que comprende, además, una tercera secuencia de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que se deriva de una secuencia de igual longitud de Te3A (sec. con núm. de ident.:66) o tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205). En algunas modalidades, el cuarto polipéptido comprende una secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident.:93 o 95 o con respecto a una subsecuencia o fragmento de por lo menos aproximadamente 20, 30, 40, 50, 60, 70 o más residuos de las sec. con núms . de ident . : 93 o 95.
En algunas modalidades, la composición enzimática modificada genéticamente comprende, además, un cuarto polipéptido que tiene actividad de GH6l/endoglucanasa o, alternativamente, una celulasa completa enriquecida con endoglucanasa de GH61. Por ejemplo, el polipéptido que tiene actividad de GH61/endoglucanasa es un polipéptido de EGIV, por ejemplo, un polipéptido de Eg4 de T. reesei . En algunas modalidades, la celulasa completa enriquecida con endoglucanasa de GH61 es una celulasa completa enriquecida con un polipéptido de EGIV, por ejemplo, un polipéptido de Eg4 de T. reesei .
En algunas modalidades, el cuarto polipéptido es un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 ¾, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad con respecto a cualquiera de las sec. con núms. de ident.: 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec . con núms . de ident.:84 y 88; (2) las sec . con núms . de ident.:85 y 88; (3) la sec. con núm. de ident.:86; (4) la sec. con núm. de ident.:87; (5) las sec. con núms. de ident.:84, 88 y 89; (6) las sec. con núms. de ident.:85, 88 y 89; (7) las sec. con núms. de ident . : 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. En algunas modalidades, la composición enzimática comprende, además, una celobiosa deshidrogenasa .
En algunas modalidades, el primer polipéptido que tiene actividad de xilanasa tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.: 24, 26, 42 y 43 o con respecto a una secuencia madura de estas. Por ejemplo, el primer polipéptido es AfuXyn2 , AfuXyn5, Xyn3 de T. reesei o Xyn2 de T. reesei.
En algunas modalidades, el segundo polipéptido que tiene actividad de xilosidasa se selecciona de polipéptidos de ß-xilosidasa de un Grupo 1 o Grupo 2. Los polipéptidos de ß-xilosidasa del Grupo 1 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident . : 2 y 10 o con respecto a una secuencia madura de estas. Por ejemplo, la ß-xilosidasa del Grupo 1 es Fv3A o Fv43A. Los polipéptidos de ß-xilosidasa del Grupo 2 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. :4, 6, 8, 10, 12, 14, 16, 18, 28, 30 y 45 o con respecto a una secuencia madura de estas. Por ejemplo, las ß-xilosidasas del Grupo 2 pueden ser Pf43A, Fv43E, Fv39A, Fv43B, Pa51A, Gz43A, Fo43A, Fv43D, Pf43B o Bxll de G. reesei .
En algunas modalidades, el tercer polipéptido que tiene actividad de arabinofuranosidasa tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. :12, 14, 20, 22 y 32 o con respecto a una secuencia madura de estas. Por ejemplo, el tercer polipéptido puede ser Fv43B, Pa51A, Af43A, PÍ51A o Fv51A.
El primero, segundo, tercero o cuarto polipéptido se puede aislar o purificar a partir de una fuente de origen natural. Alternativamente, se puede expresar o sobreexpresar por medio de una célula huésped recom inante . Se puede añadir a una composición enzimática en forma aislada o purificada. Se puede expresar o sobreexpresar por medio de un organismo huésped o célula huésped como parte de una mezcla de cultivo, por ejemplo, un caldo de fermentación. En algunas modalidades, un gen que codifica el polipéptido se puede integrar en el material genético del organismo huésped lo que permite la expresión de los polipéptidos codificados por ese organismo.
Un tercer ejemplo no limitante de una composición enzimática modificada genéticamente de la invención comprende
(1) un primer polipéptido que tiene actividad de xilanasa;
(2) un segundo polipéptido que tiene actividad de xilosidasa; (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa ; y (4) un cuarto polipéptido que tiene actividad de GH61/endoglucanasa o una celulasa completa enriquecida con endoglucanasa de GH61. En algunas modalidades, el cuarto polipéptido que tiene actividad de GH6l/endoglucanasa es un polipéptido de EGIV. En algunas modalidades, el polipéptido que tiene actividad de GH61/endoglucanasa es un polipéptido de EGIV de un microorganismo adecuado, por ejemplo, un polipéptido de Eg4 de T. reesei. En algunas modalidades, la celulasa completa enriquecida con endoglucanasa de GH61 es una celulasa completa enriquecida con un polipéptido de EGIV, por ejemplo, un polipéptido de Eg4 de T. reesei. En algunas modalidades, el cuarto polipéptido es un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident . : 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o uno que comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec. con núms. de ident. : 84 y 88; (2) las sec. con núms. de ident. :85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec. con núm. de ident. :87; (5) las sec. con núms. de ident. :84, 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec . con núms. de ident.: 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident. : 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. La composición puede comprender, además, una celobiosa deshidrogenase.
En algunas modalidades, el primer polipéptido que tiene actividad de xilanasa tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.: 24, 26, 42 y 43 o con respecto a una secuencia madura de estas. Por ejemplo, el primer polipéptido puede ser AfuXyn2 , AfuXyr.5, Xyn3 de G. reesei o Xyn2 de G. reesei .
En algunas modalidades, el segundo polipéptido que tiene actividad de xilosidasa puede ser un polipéptido seleccionado de polipéptidos de ß del Grupo 1 o Grupo 2. Los polipéptidos de ß-xilosidasa del Grupo 1 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident . : 2 y 10 o con respecto a una secuencia madura de estas. Por ejemplo, la ß-xilosidasa del Grupo 1 puede ser Fv3A o Fv43A. Los polipéptidos de ß-xilosidasa del Grupo 2 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. :4, 6, 8, 10, 12, 14, 16, 18, 28, 30 y 45 o con respecto a una secuencia madura de estas. Por ejemplo, las ß-xilosidasas del Grupo 2 pueden ser Pf43A, Fv43E, Fv39A, Fv43B, Pa51A, Gz43A, Fo43A, Fv43D, Pf43B o Bxll de T. reesei.
En algunas modalidades, el tercer polipéptido que tiene actividad de arabinofuranosidasa tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. :12, 14, 20, 22 y 32 o con respecto a una secuencia madura de estas. Por ejemplo, el tercer polipéptido puede ser Fv43B, Pa51A, Af43A, Pf51A o Fv51A.
El primero, segundo, tercero o cuarto u otro polipéptido se puede aislar o purificar a partir de una fuente de origen natural. Alternativamente, se puede expresar o sobreexpresar por medio de una célula huésped recombinante . Se puede añadir a una composición enzimática en forma aislada o purificada. Se puede expresar o sobreexpresar por medio de un organismo huésped o célula huésped como parte de una mezcla de cultivo, por ejemplo, un caldo de fermentación. En algunas modalidades, un gen que codifica el polipéptido se puede integrar en el material genético del organismo huésped, lo que permite la expresión de los polipéptidos codificados por ese organismo.
Un cuarto ejemplo no limitante de una composición enzimática modificada genéticamente de la invención comprende (1) un primer polipéptido que tiene actividad de xilosidasa, (2) un segundo polipéptido (diferente al primer polipéptido) que tiene actividad de xilosidasa, (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa y (4) un cuarto polipéptido que tiene actividad de ß-glucosidasa . En ciertas modalidades, el cuarto polipéptido tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad con respecto a cualquiera de las sec . con núms . de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos. En ciertas modalidades, el cuarto polipéptido es un polipéptido de ß-glucosidasa quimérico/de fusión que comprende dos o más secuencias de ß-glucosidasa, en donde la primera secuencia derivada de una primera ß-glucosidasa tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencia de las sec. con núms . de ident.: 96-108, mientras que la segunda secuencia derivada de una segunda ß-glucosidasa tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencia de las sec. con núms. de ident .: 109-116 y, opcionalmente , además una tercera secuencia con una longitud de 3 , 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que codifican una secuencia de bucle derivada de una tercera ß-glucosidasa que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD(R/K)YNIT (sec. con núm. de ident. :205) . Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) de los motivos de secuencias de aminoácidos de las sec. con núms. de ident. : 197-202 y la segunda de dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec . con núm. de ident.:203 y, opcionalmente , además, una tercera secuencia con una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD(R/K)Y IT (sec. con núm. de ident.:205) y que se deriva de un tercer polipéptido de ß-glucosidasa diferente del primer o segundo polipéptido de ß-glucosidasa . Por ejemplo, el cuarto polipéptido comprende una primera secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 200 residuos de Fv3C (sec. con núm. de ident.:60), por ejemplo, un tramo de por lo menos 200 residuos del N-terminal o de un residuo cerca del N-terminal de la sec. con núm. de ident. :60 y una segunda secuencia que tiene por lo menos aproximadamente 60 % de identidad, de secuencia con respecto a un tramo de por lo menos 50 residuos de Bgl3 de T. reesei (Tr3B, sec. con núm. de ident . :64) , por ejemplo, un tramo de por lo menos 50 residuos del C-terminal o de un residuo cerca del C-terminal de la sec. con núm. de ident. :64. El cuarto polipéptido comprende, además, una tercera secuencia de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que se deriva de una secuencia de longitud igual de Te3A (sec. con núm. de ident. :66) o tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205). En algunas modalidades, el cuarto polipéptido tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident . : 93 o 95 o con respecto a una subsecuencia o fragmento de por lo menos aproximadamente 20, 30, 40, 50, 60, 70 o más residuos de la sec. con núm. de ident. : 93 o 95.
En algunas modalidades, la composición enzimática puede comprender, además, un quinto polipéptido que tiene actividad de GH6l/endoglucanasa o, alternativamente, una celulasa completa enriquecida con endoglucanasa de GH61. Por ejemplo, el polipéptido que tiene actividad de GH61/endoglucanasa es un polipéptido de EGIV de un organismo adecuado, tal como una bacteria o un hongo, por ejemplo, Eg4 de T. reesei. En algunas modalidades, el quinto polipéptido, que es un polipéptido de endoglucanasa de GH61, comprende por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad con respecto a cualquiera de las sec. con núms . de ident.: 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o uno que comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec . con núms . de ident.:84 y 88; (2) las sec. con núms . de ident.:85 y 88; (3) la sec. con núm. de ident.:86; (4) la sec. con núm. de ident.:87; (5) las sec. con núms. de ident.:84, 88 y 89; (6) las sec. con núms. de ident.:85, 88 y 89; (7) las sec. con núms. de ident . : 84, 88 y 90; (8) las sec. con núms. de ident . : 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. La composición enzimática puede comprender, además, una celobiosa deshidrogenasa .
En ciertas modalidades, el primer polipéptido que tiene actividad de xilosidasa es un polipéptido seleccionado de polipéptidos de ß-xilosidasa del Grupo 1. Los polipéptidos de ß-xilosidasa del Grupo 1 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.: 2 y 10 o con respecto a una secuencia madura de estas. Por ejemplo, la ß-xilosidasa del Grupo puede ser Fv3A o Fv43A.
En ciertas modalidades, el segundo polipéptido que tiene actividad de xilosidasa es un polipéptido seleccionado de polipéptidos de ß-xilosidasa del Grupo 2. Los polipéptidos de ß-xilosidasa del Grupo 2 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident.:4, 6, 8, 10, 12, 14, 16, 18, 28, 30 y 45 o con respecto a una secuencia madura de estas. Por ejemplo, las ß-xilosidasas del Grupo 2 pueden ser Pf43A, Fv43E, Fv39A, Fv43B, Pa51A, Gz43A, Fo43A, Fv43D, Pf43B o Bxll de T. reesei.
En algunas modalidades, el tercer polipéptido que tiene actividad de arabinof ranosidasa tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. :12, 14, 20, 22 y 32 o con respecto a una secuencia madura de estas. Por ejemplo, el tercer polipéptido puede ser Fv43B, Pa51A, Af43A, Pf51A o Fv51A.
El primero, segundo, tercero, cuarto, quinto u otro polipéptido se puede aislar o purificar a partir de una fuente de origen natural. Alternativamente, se puede expresar o sobreexpresar por medio de una célula huésped recombinante. Se puede añadir a una composición enzimática en forma aislada o purificada. Se puede expresar o sobreexpresar por medio de un organismo huésped o célula huésped como parte de una mezcla de cultivo, por ejemplo, un caldo de fermentación. En algunas modalidades, un gen que codifica el polipéptido se puede integrar en el material genético del organismo huésped lo que permite la expresión de los polipéptidos codificados por ese organismo.
Un quinto ejemplo no limitante de una composición enzimática comprende (1) un primer polipéptido que tiene actividad de xilosidasa, (2) un segundo polipéptido (diferente del primero) que tiene actividad de xilosidasa y (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa y (4) una celulasa completa enriquecida con ß-glucosidasa . En ciertas modalidades, la celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido que tiene por lo menos aproximadamente 60 % {por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident . : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos. En ciertas modalidades, la celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido de ß -glucosidasa quimérico/de fusión que comprende dos o más secuencias de -glucosidasa, en donde la primera secuencia derivada de una primera ß-glucosidasa tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms. de ident. : 96-108, mientras que la segunda secuencia derivada de una segunda ß-glucosidasa tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms . de ident . : 109- 116 y, opcionalmente , además, una tercera secuencia que tiene una longitud de 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que codifican una secuencia de bucle derivada de una tercera ß-glucosidasa que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) Y IT (sec. con núm. de ident.: 205). Por ejemplo, la celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido que comprende una primera secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 200 residuos de Fv3C (sec. con núm. de ident.: 60), por ejemplo, un tramo de por lo menos 200 residuos del N-terminal o de un residuo cerca del N-terminal de la sec. con núm. de ident. :60 y una segunda secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 50 residuos de Bgl3 de T. reesei (Tr3B, sec. con núm. de ident. :64) , por ejemplo, un tramo de por lo menos 50 residuos del C-terminal o de un residuo que está cerca del C-terminal de la sec. con núm. de ident. :64. En ciertas modalidades, la celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido que comprende, además, una tercera secuencia de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que se deriva de una secuencia de longitud igual de Te3A (sec. con núm. de ident.:66) o de una secuencia que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) Y IT (sec. con núm. de ident.:205). Por ejemplo, la celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident. :93 o 95 o con respecto a una subsecuencia o fragmento de por lo menos aproximadamente 20, 30, 40, 50, 60, 70 o más residuos de la sec. con núm. de ident. : 93 o 95.
En ciertas modalidades, la composición enzimática puede comprender un cuarto polipéptido que tiene actividad de GH61/endoglucanasa o, alternativamente, una celulasa completa enriquecida con endoglucanasa de GH61. Por ejemplo, el polipéptido que tiene actividad de GH6l/endoglucanasa es un polipéptido de EGIV de un organismo adecuado tal como una bacteria o un hongo, por ejemplo, Eg4 de G. reesei . En algunas modalidades, el quinto polipéptido, que es un polipéptido de endoglucanasa de GH61 comprende por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad con respecto a cualquiera de las sec. con núms . de ident.: 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec. con núms. de ident. : 84 y 88; (2) las sec. con núms. de ident. :85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec. con núm. de ident. :87; (5) las sec. con núms. de ident .: 84 , 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident.: 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. La composición enzimática puede comprender, además, una celobiosa deshidrogenasa .
En ciertas modalidades, el primer polipéptido que tiene actividad de xilosidasa es un polipéptido seleccionado de polipéptidos de ß-xilosidasa del Grupo 1. Los polipéptidos de ß-xilosidasa del Grupo 1 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. : 2 y 10 o con respecto a una secuencia madura de estas. Por ejemplo, la ß-xilosidasa del Grupo puede ser Fv3A o Fv43A.
En ciertas modalidades, el segundo polipéptido que tiene actividad de xilosidasa es un polipéptido seleccionado de polipéptidos de ß-xilosidasa del Grupo 2 . Los polipéptidos de ß-xilosidasa del Grupo 2 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident.:4, 6, 8, 10, 12, 14, 16, 18, 28, 30 y 45 o con respecto a una secuencia madura de estas. Por ejemplo, las ß -xilosidasas del Grupo 2 pueden ser Pf43A, Fv43E, Fv39A, Fv43B, Pa51A, Gz43A, Fo43A, Fv43D, Pf43B O Bxll de T. reesei .
En algunas modalidades, el tercer polipéptido que tiene actividad de arabinofuranosidasa tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. :12, 14, 20, 22 y 32 o con respecto a una secuencia madura de estas. Por ejemplo, el tercer polipéptido puede ser Fv43B, Pa51A, Af43A, Pf51A o Fv51A.
El primero, segundo, tercero, cuarto u otro polipéptido se puede aislar o purificar a partir de una fuente de origen natural. Alternativamente, se puede expresar o sobreexpresar por medio de una célula huésped recombinante . Se puede añadir a una composición enzimática en forma aislada o purificada. Se puede expresar o sobreexpresar por medio de un organismo huésped o célula huésped como parte de una mezcla de cultivo, por ejemplo, un caldo de fermentación. En algunas modalidades, un gen que codifica el polipéptido se puede integrar en el material genético del organismo huésped lo que permite la expresión de los polipéptidos codificados por ese organismo .
Un sexto ejemplo no limitante de una composición enzimática modificada genéticamente de la invención comprende (1) un primer polipéptido que tiene actividad de xilosidasa, (2) un segundo polipéptido (diferente al primer polipéptido) que tiene actividad de xilosidasa, (3) y un tercer polipéptido que tiene actividad de arabinofuranosidasa; y (4) un cuarto polipéptido que tiene actividad de GH61/ endoglucanasa o, alternativamente, una celulasa completa enriquecida con EGIV. Por ejemplo, el polipéptido que tiene actividad de GH61/endoglucanasa es un polipéptido de EGIV de un organismo adecuado tal como una bacteria o un hongo, por ejemplo, Eg4 de T. reesei . En algunas modalidades, el quinto polipéptido, que es un polipéptido de endoglucanasa de GH61, comprende por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad con respecto a cualquiera de las sec . con núms . de ident . : 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o uno que comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec . con núms . de ident.:84 y 88; (2) las sec. con núms . de ident.:85 y 88; (3) la sec. con núm. de ident.:86; (4) la sec. con núm. de ident.:87; (5) las sec. con núms. de ident . : 84 , 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident.: 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. La composición enzimática puede comprender, además, una celobiosa deshidrogenasa .
En ciertas modalidades, el primer polipéptido que tiene actividad de xilosidasa es un polipéptido seleccionado de polipéptidos de ß-xilosidasa del Grupo 1. Los polipéptidos de ß-xilosidasa del Grupo 1 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.: 2 y 10 o con respecto a una secuencia madura de estas. Por ejemplo, la ß-xilosidasa del Grupo puede ser Fv3A o Fv43A.
En ciertas modalidades, el segundo polipéptido que tiene actividad de xilosidasa es un polipéptido seleccionado de polipéptidos de ß-xilosidasa del Grupo 2. Los polipéptidos de ß-xilosidasa del Grupo 2 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident.:4, 6, 8, 10, 12, 14, 16, 18, 28, 30 y 45 o con respecto a una secuencia madura de estas. Por ejemplo, las ß-xilosidasas del Grupo 2 pueden ser Pf43A, Fv43E, Fv39A, Fv43B, Pa51A, Gz43A, Fo43A, Fv43D, Pf43B o Bxll de T. reesei.
En algunas modalidades, el tercer polipéptido que tiene actividad de arabinof ranosidasa tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.:12, 14, 20, 22 y 32 o con respecto a una secuencia madura de estas. Por ejemplo, el tercer polipéptido puede ser Fv43B, Pa51A, Af43A, Pf51A o Fv51A.
El primero, segundo, tercero, cuarto u otro polipéptido se puede aislar o purificar a partir de una fuente de origen natural. Alternativamente, se puede expresar o sobreexpresar por medio de una célula huésped recombinante . Se puede añadir a una composición enzimática en forma aislada o purificada. Se puede expresar o sobreexpresar por medio de un organismo huésped o célula huésped como parte de una mezcla de cultivo, por ejemplo, un caldo de fermentación. En algunas modalidades, un gen que codifica el polipéptido se puede integrar en el material genético del organismo huésped, lo que permite la expresión de los polipéptidos codificados por ese organismo.
Un séptimo ejemplo no limitante de una composición enzimática modificada genéticamente de la invención comprende
(1) un primer polipéptido que tiene actividad de xilanasa,
(2) un segundo polipéptido que tiene actividad de xilosidasa,
(3) un tercer polipéptido (diferente al segundo polipéptido) que tiene actividad de xilosidasa y (4) un cuarto polipéptido que tiene actividad de ß-glucosidasa . En ciertas modalidades, el cuarto polipéptido tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad con respecto a cualquiera de las sec. con núms . de ident . : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos. En ciertas modalidades, el cuarto polipéptido es un polipéptido de ß-glucosidasa quimérico/de fusión que comprende dos o más secuencias de ß-glucosidasa, en donde la primera secuencia derivada de una primera ß-glucosidasa tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec . con núms . de ident . : 96-108, mientras que la segunda secuencia derivada de una segunda ß-glucosidasa tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms. de ident .: 109- 116 y, opcionalmente, además, una tercera secuencia que tiene una longitud de 3 , 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que codifican una secuencia de bucle derivada de una tercera ß-glucosidasa que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. : 204) o de FD (R/K) YNIT (sec. con núm. de ident. :205) . Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 197-202 y la segunda de dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident. :203 y, opcionalmente, además, una tercera secuencia con una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident. :205) y que se deriva de un tercer polipéptido de ß -glucosidasa diferente del primer o segundo polipéptido de ß-glucosidasa . Por ejemplo, el cuarto polipéptido comprende una primera secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 200 residuos de Fv3C (sec. con núm. de ident.:60) , por ejemplo, un tramo de por lo menos 200 residuos del N-terminal o de un residuo que está cerca del N-terminal de la sec. con núm. de ident . :60 y una segunda secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 50 residuos de Bgl3 de T. reesei (Tr3B, sec. con núm. de ident. :64), por ejemplo, un tramo de por lo menos 50 residuos del C-terminal o de un residuo que está cerca del C-terminal de la sec. con núm. de ident.: 64. En ciertas modalidades, el cuarto polipéptido comprende, además, una tercera secuencia de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que se deriva de una secuencia de longitud igual de Te3A (sec. con núm. de ident. :66) o tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident. :205) . Por ejemplo, el cuarto polipéptido comprende una secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident. : 93 o 95 o con respecto a una subsecuencia o fragmento de por lo menos aproximadamente 20, 30, 40, 50, 60, 70 o más residuos de las sec. con núms . de ident. : 93 o 95.
La composición enzimática puede comprender, además, un quinto polipéptido que tiene actividad de GH61/ endoglucanasa o, alternativamente, una celulasa completa enriquecida con endoglucanasa de GH61. Por ejemplo, el polipéptido que tiene actividad de GH6l/endoglucanasa es un polipéptido de EGIV de un organismo adecuado tal como una bacteria o un hongo, por ejemplo, Eg4 de T. reesei . En algunas modalidades, el quinto polipéptido, que es un polipéptido de endoglucanasa de GH61 comprende por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad con respecto a cualquiera de las sec. con núms . de ident . : 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o uno que comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec. con núms. de ident. : 84 y 88; (2) las sec. con núms. de ident. :85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec. con núm. de ident.: 87; (5) las sec. con núms. de ident .: 84 , 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident. : 84, 88 y 90; (8) las sec. con núms. de ident. : 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms . de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident. : 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. La composición enzimática puede comprender, además, una celobiosa deshidrogenasa .
En algunas modalidades, el primer polipéptido que tiene actividad de xilanasa tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.: 24, 26, 42 y 43 o con respecto a una secuencia madura de estas. Por ejemplo, el primer polipéptido puede ser AfuXyn2, AfuXyn5 , Xyn3 de T. reesei o Xyn2 de T. reesei .
En ciertas modalidades, el segundo polipéptido que tiene actividad de xilosidasa es un polipéptido seleccionado de polipéptidos de ß-xilosidasa del Grupo 1. Los polipéptidos de ß-xilosidasa del Grupo 1 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.: 2 y 10 o con respecto a una secuencia madura de estas. Por ejemplo, la ß-xilosidasa del Grupo puede ser Fv3A o Fv43A.
En ciertas modalidades, el tercer polipéptido que tiene actividad de xilosidasa es un polipéptido seleccionado de polipéptidos de ß-xilosidasa del Grupo 2. Los polipéptidos de ß-xilosidasa del Grupo 2 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident.:4, 6, 8, 10, 12, 14, 16, 18, 28, 30 y 45 o con respecto a una secuencia madura de estas. Por ejemplo, las ß-xilosidasas del Grupo 2 pueden ser Pf43A, Fv43E, Fv39A, Fv43B, Pa51A, Gz43A, Fo43A, Fv43D, Pf43B o Bxll de T. reesei .
El primero, segundo, tercero, cuarto, quinto u otro polipéptido se puede aislar o purificar a partir de una fuente de origen natural. Alternativamente, se puede expresar o sobreexpresar por medio de una célula huésped recombinante. Se puede añadir a una composición enzimática en forma aislada o purificada. Se puede expresar o sobreexpresar por medio de un organismo huésped o célula huésped como parte de una mezcla de cultivo, por ejemplo, un caldo de fermentación. En algunas modalidades, un gen que codifica el polipéptido se puede integrar en el material genético del organismo huésped, lo que permite la expresión de los polipéptidos codificados por ese organismo.
Un octavo ejemplo no limitante de una composición enzimática modificada genéticamente comprende (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa, (3) un tercer polipéptido (diferente al segundo polipéptido) que tiene actividad de xilosidasa y una celulasa completa enriquecida con ß-glucosidasa . En ciertas modalidades, la celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad con respecto a cualquiera de las sec . con núms . de ident . : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos. En ciertas modalidades, la celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido de ß-glucosidasa quimérico/de fusión que comprende dos o más secuencias de ß-glucosidasa , en donde la primera secuencia derivada de una primera ß-glucosidasa tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 96-108, mientras que la segunda secuencia derivada de una segunda ß-glucosidasa tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms. de ident .: 109-116 y, opcionalmente , además, una tercera secuencia con una longitud de 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que codifican una secuencia de bucle derivada de una tercera ß-glucosidasa que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205) . Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) de los motivos de secuencias de aminoácidos de las sec. con núms . de ident . : 197-202 y la segunda de dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident. :203 y, opcionalmente , además, una tercera secuencia con una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident. :205) y que se deriva de un tercer polipéptido de ß-glucosidasa diferente del primer o segundo polipéptido de ß-glucosidasa. Por ejemplo, la celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido que comprende una primera secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 200 residuos de Fv3C (sec. con núm. de ident. :60), por ejemplo, un tramo de por lo menos 200 residuos del N-terminal o de un residuo cerca del N-terminal de la sec. con núm. de ident. :60 y una segunda secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 50 residuos de Bgl3 de T. reesei (Tr3B, sec . con núm. de ident.:64), por ejemplo, un tramo de por lo menos 50 residuos del C-terminal o de un residuo que está cerca del C-terminal de la sec. con núm. de ident . : 6 . En algunas modalidades, la celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido que comprende, además, una tercera secuencia de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que se deriva de una secuencia de longitud igual de Te3A (sec. con núm. de ident. :66) o tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident. :205). Por ejemplo, la celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido que comprende una secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident. : 93 o 95 o con respecto a una subsecuencia o fragmento de por lo menos aproximadamente 20, 30, 40, 50, 60, 70 o más residuos de la sec. con núm. de ident . : 93 o 95.
La composición enzimática puede comprender, además, un cuarto polipéptido que tiene actividad de GH61/ endoglucanasa o, alternativamente, una celulasa completa enriquecida con endoglucanasa de GH61. Por ejemplo, el polipéptido que tiene actividad de GH6l/endoglucanasa es un polipéptido de EGIV de un organismo adecuado tal como una bacteria o un hongo, por ejemplo, Eg4 de T. reesei. En algunas modalidades, el cuarto polipéptido, que es un polipéptido de endoglucanasa de GH61, comprende por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident . : 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o uno que comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec. con núms. de ident. : 84 y 88; (2) las sec. con núms. de ident.: 85 y 88; (3) la sec. con núm. de ident.: 86; (4) la sec. con núm. de ident. :87; (5) las sec. con núms. de ident. :84, 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident.: 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec . con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident. : 85, 88, 89 y 91: y (14) las sec. con núms. de ident. : 85, 88, 90 y 91. La composición enzimática puede comprender, además, una celobiosa deshidrogenasa .
En algunas modalidades, el primer polipéptido que tiene actividad de xilanasa tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident . : 24, 26, 42 y 43 o con respecto a una secuencia madura de estas. Por ejemplo, el primer polipéptido puede ser AfuXyn2, AfuXyn5 , Xyn3 de G. reesei o Xyn2 de T. reesei .
En ciertas modalidades, el segundo polipéptido que tiene actividad de xilosidasa es un polipéptido seleccionado de polipéptidos de ß-xilosidasa del Grupo 1. Los polipéptidos de ß-xilosidasa del Grupo 1 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. : 2 y 10 o con respecto a una secuencia madura de estas. Por ejemplo, la ß-xilosidasa del Grupo puede ser Fv3A o Fv43A.
En ciertas modalidades, el tercer polipéptido que tiene actividad de xilosidasa es un polipéptido seleccionado de polipéptidos de ß-xilosidasa del Grupo 2. Los polipéptidos de ß-xilosidasa del Grupo 2 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. :4, 6, 8, 10, 12, 14, 16, 18, 28, 30 y 45 o con respecto a una secuencia madura de estas. Por ejemplo, las ß-xilosidasas del Grupo 2 pueden ser Pf43A, Fv43E, Fv39A, Fv43B, Pa51A, Gz43A, Fo43A, Fv43D, Pf43B o Bxll de T. reesei .
El primero, segundo, tercero, cuarto u otro polipéptido se puede aislar o purificar a partir de una fuente de origen natural. Alternativamente, se puede expresar o sobreexpresar por medio de una célula huésped recombinante . Se puede añadir a una composición enzimática en forma aislada o purificada. Se puede expresar o sobreexpresar po medio de un organismo huésped o célula huésped como parte de una mezcla de cultivo, por ejemplo, un caldo de fermentación. En algunas modalidades, un gen que codifica el polipéptido se puede integrar en el material genético del organismo huésped lo que permite la expresión de los polipéptidos codificados por ese organismo .
Un noveno ejemplo no limitante de una composición enzimática modificada genéticamente comprende (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa, (3) un tercer polipéptido (diferente al segundo polipéptido) que tiene actividad de xilosidasa, (4) y un cuarto polipéptido que tiene actividad de GH6l/endoglucanasa o, alternativamente, una celulasa completa enriquecida con endoglucanasa de GH61. En algunas modalidades, el cuarto polipéptido que tiene actividad de GH61/endoglucanasa es un polipéptido de EGIV de un organismo adecuado, tal como una bacteria o un hongo, por ejemplo, Eg4 de T. reesei. En algunas modalidades, el quinto polipéptido, que es un polipéptido de endoglucanasa de GH61, tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad con respecto a cualquiera de las sec. con núms . de ident.: 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o es uno que comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec. con núms. de ident.: 84 y 88; (2) las sec. con núms. de ident. :85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec. con núm. de ident. :87; (5) las sec. con núms. de ident. : 84 , 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident.: 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident. : 85, 88, 90 y 91. La composición enzimática puede comprender, además, una celobiosa deshidrogenasa .
En algunas modalidades, el primer polipéptido que tiene actividad de xilanasa tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident . : 24, 26, 42 y 43 o con respecto a una secuencia madura de estas. Por ejemplo, el primer polipéptido puede ser AfuXyn2, AfuXyn5 , Xyn3 de T. reesei o Xyn2 de T. reesei.
En ciertas modalidades, el segundo polipéptido que tiene actividad de xilosidasa es un polipéptido seleccionado de polipéptidos de ß-xilosidasa del Grupo 1. Los polipéptidos de ß-xilosidasa del Grupo 1 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. : 2 y 10 o con respecto a una secuencia madura de estas. Por ejemplo, la ß-xilosidasa del Grupo puede ser Fv3A o Fv43A.
En ciertas modalidades, el tercer polipéptido que tiene actividad de xilosidasa es un polipéptido seleccionado de polipéptidos de ß-xilosidasa del Grupo 2. Los polipéptidos de ß-xilosidasa del Grupo 2 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. :4, 6, 8, 10, 12, 14, 16, 18, 28, 30 y 45 o con respecto a una secuencia madura de estas. Por ejemplo, las ß-xilosidasas del Grupo 2 pueden ser Pf43A, Fv43E, Fv39A, Fv43B, Pa51A, Gz43A, Fo43A, Fv43D, Pf43B o Bxll de T. reesei.
El primero, segundo, tercero, cuarto u otro polipéptido se puede aislar o purificar a partir de una fuente de origen natural. Alternativamente, se puede expresar o sobreexpresar por medio de una célula huésped recombinante . Se puede añadir a una composición enzimática en forma aislada o purificada. Se puede expresar o sobreexpresar por medio de un organismo huésped o célula huésped como parte de una mezcla de cultivo, por ejemplo, un caldo de fermentación. En algunas modalidades, un gen que codifica el polipéptido se puede integrar en el material genético del organismo huésped lo que permite la expresión de los polipéptidos codificados por ese organismo .
Un décimo ejemplo no limitante de una composición enzimática modificada genéticamente comprende (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa y (3) un tercer polipéptido que tiene actividad de ß-glucosidasa . En ciertas modalidades, el tercer polipéptido tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad con respecto a cualquiera de las sec . con núms . de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos. En ciertas modalidades, el tercer polipéptido es un polipéptido de ß-glucosidasa quimérico/de fusión que comprende dos o más secuencias de ß-glucosidasa, en donde la primera secuencia derivada de una primera ß-glucosidasa tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms . de ident.: 96-108, mientras que la segunda secuencia derivada de una segunda ß-glucosidasa tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms. de ident .: 109- 116 y, opcionalmente , además, una tercera secuencia con una longitud de 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que codifican una secuencia de bucle derivada de una tercera ß-glucosidasa que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident. :205). Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 197-202 y la segunda de dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident.:203 y, opcionalmente , además, una tercera secuencia con una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD(R/K)YNIT (sec. con núm. de ident.:205) y que se deriva de un tercer polipéptido de ß-glucosidasa diferente del primer o segundo polipéptido de ß-glucosidasa . Por ejemplo, el tercer polipéptido comprende una primera secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 200 residuos de Fv3C (sec. con núm. de ident.:60), por ejemplo, un tramo de por lo menos 200 residuos del N-terminal o de un residuo que está cerca del N-terminal de la sec. con núm. de ident.:60 y una segunda secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 50 residuos de Bgl3 de T. reesei (Tr3B, sec. con núm. de ident.:64), por ejemplo, un tramo de por lo menos 50 residuos del C-terminal o de un residuo que está cerca del C-terminal de la sec. con núm. de ident . :64. En ciertas modalidades, el tercer polipéptido comprende, además, una tercera secuencia de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que se deriva de una secuencia de longitud igual de Te3A (sec. con núm. de ident. :66) o comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident . : 204 ) o de FD (R/K) YNIT (sec. con núm. de ident . : 205) . Por ejemplo, el tercer polipéptido comprende una secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident.. :93 o 95 o con respecto a una subsecuencia o fragmento de por lo menos aproximadamente 20, 30, 40, 50, 60, 70 o más residuos de la sec. con núm. de ident. : 93 o 95.
La composición enzimática puede comprender, además, un cuarto polipéptido que tiene actividad de GH61/endoglucanasa o, alternativamente, una celulasa completa enriquecida con endoglucanasa de GH61. Por ejemplo, el polipéptido que tiene actividad de GH61/endoglucanasa es un polipéptido de EGIV de un organismo adecuado tal como una bacteria o un hongo, por ejemplo, Eg4 de T. reesei . En algunas modalidades, el cuarto polipéptido, que es un polipéptido de endoglucanasa de GH61, tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad con respecto a cualquiera de las sec. con núms . de ident. : 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec. con núms . de ident . : 84 y 88; (2) las sec . con núms . de ident.:85 y 88; (3) la sec . con núm. de ident. :86; (4) la sec. con núm. de ident. :87; (5) las sec. con núms. de ident .: 84 , 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident.: 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident. : 85, 88, 90 y 91. La composición enzimática puede comprender, además, una celobiosa deshidrogenasa .
En algunas modalidades, el primer polipéptido que tiene actividad de xilanasa tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.: 24, 26, 42 y 43 o con respecto a una secuencia madura de estas. Por ejemplo, el primer polipéptido puede ser AfuXyn2 , AfuXyn5 , Xyn3 de T. reesei o Xyn2 de T. reesei.
En algunas modalidades, el segundo polipéptido que tiene actividad de xilosidasa puede ser un polipéptido seleccionado de polipéptidos de ß del Grupo 1 o Grupo 2. Los polipéptidos de ß-xilosidasa del Grupo 1 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.: 2 y 10 o con respecto a una secuencia madura de estas. Por ejemplo, la ß-xilosidasa del Grupo 1 puede ser Fv3A o Fv43A. Los polipéptidos de ß-xilosidasa del Grupo 2 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident.:4, 6, 8, 10, 12, 14, 16, 18, 28, 30 y 45 o con respecto a una secuencia madura de estas. Por ejemplo, las ß-xilosidasas del Grupo 2 pueden ser Pf43A, Fv43E, Fv39A, Fv43B, Pa51A, Gz43A, Fo43A, Fv43D, Pf43B o Bxll de T. reesei .
El primero, segundo, tercero, cuarto u otro polipéptido se puede aislar o purificar a partir de una fuente de origen natural. Alternativamente, se puede expresar o sobreexpresar por medio de una célula huésped recombinante . Se puede añadir a una composición enzimática en forma aislada o purificada. Se puede expresar o sobreexpresar por medio de un organismo huésped o célula huésped como parte de una mezcla de cultivo, por ejemplo, un caldo de fermentación. En algunas modalidades, un gen que codifica el polipéptido se puede integrar en el material genético del organismo huésped lo que permite la expresión de los polipéptidos codificados por ese organismo .
Un décimo primer ejemplo no limitante de una composición enzimática modificada genéticamente comprende (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa y una celulasa completa enriquecida con ß -glucosidasa . En algunas modalidades, la celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad con respecto a cualquiera de las sec . con núms . de ident. : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos. En ciertas modalidades, la celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido de ß-glucosidasa quimérico/de fusión que comprende dos o más secuencias de ß-glucosidasa, en donde la primera secuencia derivada de una primera ß -glucosidasa tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms. de ident. : 96-108, mientras que la segunda secuencia derivada de una segunda ß -glucosidasa tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms. de iden .: 109- 116 y, opcionalmente , además, una tercera secuencia con una longitud de 3 , 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que codifican una secuencia de bucle derivada de una tercera ß-glucosidasa que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205). Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) motivos de secuencias de aminoácidos de las sec. con núms . de ident.: 197-202 y la segunda de dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident. :203 y, opcionalmente , además, una tercera secuencia con una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident. :205) y que se deriva de un tercer polipéptido de ß-glucosidasa diferente del primer o segundo polipéptido de ß-glucosidasa. Por ejemplo, la celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido que comprende una primera secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 200 residuos de Fv3C (sec. con núm. de ident. :60) , por ejemplo, un tramo de por lo menos 200 residuos del N-terminal o de un residuo cerca del N-terminal de la sec . con núm. de ident.:60 y una segunda secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 50 residuos de Bgl3 de T. reesei (Tr3B, sec. con núm. de ident.:64), por ejemplo, un tramo de por lo menos 50 residuos del C-terminal o de un residuo que está cerca del C-terminal de la sec. con núm. de ident.:64. En algunas modalidades, la celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido que comprende, además, una tercera secuencia de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que se deriva de una secuencia de longitud igual de Te3A (sec. con núm. de ident . :66) o comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident. :205). Por ejemplo, la celulasa completa enriquecida con ß-glucosidasa se enriquece con un polipéptido que comprende una secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident.: 93 o 95 o con respecto a una subsecuencia o fragmento de por lo menos aproximadamente 20, 30, 40, 50, 60, 70 o más residuos de la sec. con núm. de ident.: 93 o 95.
La composición enzimática puede comprender, además, un tercer polipéptido que tiene actividad de GH61/ endoglucanasa o, alternativamente, una celulasa completa enriquecida con endoglucanasa de GH61. Por ejemplo, el polipéptido que tiene actividad de GH61/endoglucanasa es un polipéptido de EGIV de un organismo adecuado tal como una bacteria o un hongo, por ejemplo, Eg4 de T. reesei . En algunas modalidades, el tercer polipéptido, que es un polipéptido de endoglucanasa de GH61, tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 ¾, 97 %, 98 % o 99 %) de identidad con respecto a cualquiera de las sec. con núms . de ident . : 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec. con núms. de ident .: 84 y 88; (2) las sec. con núms. de ident. :85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec. con núm. de ident. :87; (5) las sec. con núms. de ident. :84, 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident.: 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. La composición enzimática puede comprender, además, una celobiosa deshidrogenasa .
En algunas modalidades, el primer polipéptido que tiene actividad de xilanasa tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident.: 24, 26, 42 y 43 o con respecto a una secuencia madura de estas. Por ejemplo, el primer polipéptido puede ser AfuXyn2 , AfuXyn5 , Xyn3 de G. reesei o Xyn2 de G. reesei .
En algunas modalidades, el segundo polipéptido que tiene actividad de xilosidasa puede ser un polipéptido seleccionado de polipéptidos de ß del Grupo 1 o Grupo 2. Los polipéptidos de ß-xilosidasa del Grupo 1 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.: 2 y 10 o con respecto a una secuencia madura de estas. Por ejemplo, la ß-xilosidasa del Grupo 1 puede ser Fv3A o Fv43A. Los polipéptidos de ß-xilosidasa del Grupo 2 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. :4, 6, 8, 10, 12, 14, 16, 18, 28, 30 y 45 o con respecto a una secuencia madura de estas. Por ejemplo, las ß-xilosidasas del Grupo 2 pueden ser Pf43A, FV43E, Fv39A, Fv43B, Pa51A, Gz43A, Fo43A, Fv43D, Pf43B o Bxll de T. reesei.
El primero, segundo u otro polipéptido se puede aislar o purificar a partir de una fuente de origen natural. Alternativamente, se puede expresar o sobreexpresar por medio de una célula huésped recombinante . Se puede añadir a una composición enzimática en forma aislada o purificada. Se puede expresar o sobreexpresar por medio de un organismo huésped o célula huésped como parte de una mezcla de cultivo, por ejemplo, un caldo de fermentación. En algunas modalidades, un gen que codifica el polipéptido se puede integrar en el material genético del organismo huésped lo que permite la expresión de los polipéptidos codificados por ese organismo .
Un décimo segundo ejemplo no limitante de una composición enzimática modificada genéticamente comprende (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa y (3) un tercer polipéptido que tiene actividad de GH61/endoglucanasa o, alternativamente, una celulasa completa enriquecida con endoglucanasa de GH61. En algunas modalidades, el polipéptido que tiene actividad de GH6l/endoglucanasa es un polipéptido de EGIV de un organismo adecuado, tal como una bacteria o un hongo, por ejemplo, Eg4 de T. reesei. En algunas modalidades, el tercer polipéptido, que es un polipéptido de endoglucanasa de GH61, tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % O 99 %) de identidad con respecto a cualquiera de las sec. con núms . de ident . : 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec. con núms. de ident. :84 y 88; (2) las sec. con núms. de ident. :85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec. con núm. de ident. :87; (5) las sec. con núms. de ident. :84, 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident. : 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. La composición enzimática puede comprender, además, una celobiosa deshidrogenasa .
En algunas modalidades, el primer polipéptido que tiene actividad de xilanasa tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.: 24, 26, 42 y 43 o con respecto a una secuencia madura de estas. Por ejemplo, el primer polipéptido puede ser AfuXyn2, AfuXyn5 , Xyn3 de T. reesei o Xyn2 de T. reesei .
En algunas modalidades, el segundo polipéptido que tiene actividad de xilosidasa puede ser un polipéptido seleccionado de polipéptidos de ß del Grupo 1 o Grupo 2. Los polipéptidos de ß-xilosidasa del Grupo 1 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident . : 2 y 10 o con respecto a una secuencia madura de estas. Por ejemplo, la ß-xilosidasa del Grupo 1 puede ser Fv3A o Fv43A. Los polipéptidos de ß-xilosidasa del Grupo 2 tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. :4, 6, 8, 10, 12, 14, 16, 18, 28, 30 y 45 o con respecto a una secuencia madura de estas. Por ejemplo, las ß-xilosidasas del Grupo 2 pueden ser Pf43A, Fv43E, Fv39A, Fv43B, Pa51A, Gz43A, Fo43A, Fv43D, Pf43B o Bxll de T. reesei.
El primero, segundo, tercero u otro polipéptido se puede aislar o purificar a partir de una fuente de origen natural. Alternativamente, se puede expresar o sobreexpresar por medio de una célula huésped recombinante . Se puede añadir a una composición enzimática en forma aislada o purificada. Se puede expresar o sobreexpresar por medio de un organismo huésped o célula huésped como parte de una mezcla de cultivo, por ejemplo, un caldo de fermentación. En algunas modalidades, un gen que codifica el polipéptido se puede integrar en el material genético del organismo huésped lo que permite la expresión de los polipéptidos codificados por ese organismo .
La composición enzimática modificada genéticamente descrita en la presente descripción es, por ejemplo, un caldo de fermentación. El caldo de fermentación es, por ejemplo, un caldo obtenido a partir de un microorganismo. El microorganismo puede ser una bacteria o un hongo, tal como un hongo filamentoso o levadura. Los hongos filamentosos incluyen, sin limitarse a, a Trichoderma, Humicola, Fusarium, Aspergillus, Neurospora, Penicillium, Cephalosporium, Achlya, Podospora, Endothia, Mucor, Cochliobolus, Pyricularia o Chrysosporium. Un ejemplo de un hongo de Trichoderma spp . adecuado es Trichoderma reesei. Un ejemplo de un hongo de Penicillium spp. adecuado es Penicillium funiculosum. El caldo de fermentación puede ser, por ejemplo, un caldo de fermentación sin células o una formulación de caldo entero.
La composición enzimática descrita en la presente descripción, cuando comprende una enzima que tiene actividad de celulasa, por ejemplo, actividad de celobiohidrolasa, actividad de endoglucanasa, actividad de GH61/ endoglucanasa o actividad de ß -glucosidasa o cuando comprende una celulasa completa, es una composición de celulasa. La composición de celulasa puede ser, por ejemplo, una composición de celulasa bacteriana o fúngica. Por ejemplo, una composición de celulasa fúngica filamentosa puede ser una composición de celulasa de Trichoderma, Aspergillus o Chrysosporiu tal como una composición de celulasa de Trichoderma reeseí, Aspergillus niger, Aspergillus oryzae o Chrysosporium lucknowence. La composición de celulasa se puede producir adecuadamente por medio de un hongo filamentoso, por ejemplo, Trichoderma, tal como Trichoderma reesei , por medio de Aspergillus, tal como Aspergillus niger o Aspergillus oryzae o por medio de Chrysosporium, tal como Chrysosporium lucknowence. La composición enzimática puede producirse, alternativamente, en un organismo recombinante tal como una levadura .
Los componentes de las composiciones enzimáticas de la presente descripción se pueden medir con el uso de métodos conocidos en la técnica. Por ejemplo, se puede usar SDS-PAGE para medir las cantidades relativas de componentes si bien las mediciones no son precisas y son, preferentemente, semicuantitativas . Típicamente, se considera que la HPLC es una medición más precisa de componentes enzimáticos, si bien su precisión depende, frecuentemente, de la disponibilidad de estándares enzimáticos adecuados con los cuales pueden combinarse las cantidades medidas y la pureza de la mezcla, así como la capacidad de las columnas usadas para resolver ciertos componentes que se eluyen simultáneamente. Los componentes pueden medirse, además, con el uso de cromatografía líquida de ultraalta eficacia (UPLC, por sus siglas en inglés) que, al igual que la HPLC, es limitada en cuanto a la resolución de ciertas proteínas entre sí, pero tiende a ser limitada con respecto a un conjunto diferente de proteínas. Por lo tanto, las proteínas que no se resuelven con el uso de HPLC pueden resolverse algunas veces con el uso de UPLC y viceversa. Las condiciones usadas para las mediciones con estos métodos se describen en los ejemplos de la presente descripción. El peso combinado del polipéptido o los polipéptidos que tienen actividad de xilanasa en la composición diseñada por ingeniería ggenérica según se mide por cualquiera de los métodos SDS-PAGE, HPLC o UPLC, puede representar de aproximadamente 0.05 % en peso a aproximadamente 80 % en peso (por ejemplo, de aproximadamente 0.05 % en peso a aproximadamente 75 % en peso, de aproximadamente 0.1 % en peso a aproximadamente 70 % en peso, de aproximadamente 1 % en peso a aproximadamente 60 % en peso, de aproximadamente 5 % en peso a aproximadamente 50 % en peso, de aproximadamente 10 % en peso a aproximadamente 40 % en peso, de aproximadamente 0.5 % en peso a aproximadamente 40 % en peso, de aproximadamente 1 % en peso a aproximadamente 35 % en peso, de aproximadamente 5 % en peso a aproximadamente 25 % en peso, de aproximadamente 9 % en peso a aproximadamente 17 % en peso, de aproximadamente 5 % en peso a aproximadamente 15 % en peso, de aproximadamente 10 % en peso a aproximadamente 15 % en peso, de aproximadamente 10 % en peso a aproximadamente 25 % en peso, de aproximadamente 10 % en peso a aproximadamente 35 % en peso, etc.) del peso combinado o total de proteínas en la composición enzimática. En un ejemplo específico, el peso combinado del polipéptido o los polipéptidos que tienen actividad de xilanasa se mide por la cantidad de Xyn2 de T. reesei y Xyn3 de T. reesei en una composición que comprende estas xilanasas, por ejemplo, cualquiera de las composiciones enzimáticas diseñadas por ingeniería genética descritas en la presente descripción. El peso total de xilanasas en esa mezcla es de aproximadamente 10 % en peso a aproximadamente 20 % en peso o de aproximadamente 14 % en peso a aproximadamente 18 % en peso del peso total de proteínas en la composición, según se mide con el uso de SDS-PAGE, HPLC o UPLC por medio de los métodos descritos en la presente descripción .
El peso combinado del polipéptido o los polipéptidos que tienen actividad de ß-xilosidasa según se mide por SDS-PAGE, HPLC o UPLC, puede ser de aproximadamente 0.05 % en peso a aproximadamente 75 % en peso (por ejemplo, de aproximadamente 0.05 % en peso a aproximadamente 70 % en peso, de aproximadamente 0.1 % en peso a aproximadamente 60 % en peso, de aproximadamente 1 % en peso a aproximadamente 50 % en peso, de aproximadamente 10 % en peso a aproximadamente 40 % en peso, de aproximadamente 20 % en peso a aproximadamente 30 % en peso, de aproximadamente 2 % en peso a aproximadamente 45 % en peso, de aproximadamente 5 % en peso a aproximadamente 40 % en peso, de aproximadamente 10 % en peso a aproximadamente 35 % en peso, de aproximadamente 2 % en peso a aproximadamente 30 % en peso, de aproximadamente 5 % en peso a aproximadamente 25 % en peso, de aproximadamente 5 % en peso a aproximadamente 10 % en peso, de aproximadamente 9 % en peso a aproximadamente 15 % en peso, de aproximadamente 10 % en peso a aproximadamente 20 % en peso, etc.) del total de proteínas en la composición enzimática modificada genéticamente. En un ejemplo particular, el peso combinado del polipéptido o los polipéptidos que tienen actividad de ß-xilosidasa se mide por la cantidad de una ß-xilosidasa del Grupo 1 y una ß-xilosidasa del Grupo 2, por ejemplo, Fv3A y Fv43D, en una composición que comprende esas ß-xilosidasas , por ejemplo-, cualquiera de las composiciones enzimáticas diseñadas por ingeniería genética de la presente descripción. El peso total de ß-xilosidasas en esa mezcla es de aproximadamente 3 % en peso a aproximadamente 20 % en peso, por ejemplo, de aproximadamente 4 % en peso a aproximadamente 6 % en peso según se mide con el uso de HPLC, de aproximadamente 10 % en peso a aproximadamente 14 % en peso según se mide con el uso de UPLC y de aproximadamente 15 % en peso a aproximadamente 18 % en peso según se mide con el uso de SDS-PAGE, de conformidad con los métodos descritos en la presente descripción .
Cuando una composición enzimática modificada genéticamente de la invención comprende un polipéptido del Grupo 1 que tiene actividad de ß-xilosidasa y un polipéptido del Grupo 2 que tiene actividad de ß-xilosidasa , el peso combinado del polipéptido o los polipéptidos del Grupo 1 puede constituir de aproximadamente 0.1 % en peso a aproximadamente 30 % en peso (por ejemplo, de aproximadamente 0.2 % en peso a aproximadamente 25 % en peso, de aproximadamente 0.5 % en peso a aproximadamente 20 % en peso, de aproximadamente 4 % en peso a aproximadamente 10 % en peso, de aproximadamente 4 % en peso a aproximadamente 8 % en peso, etc.) del peso total de proteínas en la composición, mientras que el peso combinado del polipéptido o los polipéptidos del Grupo 2 puede constituir de aproximadamente 0.1 % en peso a 20 % en peso (por ejemplo, de aproximadamente 0.2 % en peso a aproximadamente 18 % en peso, de aproximadamente 0.5 % en peso a aproximadamente 15 % en peso, de aproximadamente 5 % en peso a aproximadamente 10 % en peso, etc.) del peso total de proteínas en la composición. La relación entre el peso del polipéptido o los polipéptidos de ß-xilosidasa del Grupo 1 y el polipéptido o los polipéptidos de ß-xilosidasa del Grupo 2 puede ser de aproximadamente 1:10 a aproximadamente 10:1, por ejemplo, de aproximadamente 1:8 a aproximadamente 8:1, de aproximadamente 1:6 a aproximadamente 6:1, de aproximadamente 1:4 a aproximadamente 4:1, de aproximadamente 1:2 a aproximadamente 2:1 o aproximadamente 1:1.
El peso combinado del polipéptido o los polipéptidos que tienen actividad de L-a-arabinofuranosidasa, si está presente, puede constituir de aproximadamente 0.05 % en peso a aproximadamente 20 % en peso (por ejemplo, de 0.1 % en peso a aproximadamente 15 % en peso, de 1 % en peso a aproximadamente 10 % en peso, de 2 % en peso a aproximadamente 12 % en peso, de 4 % en peso a aproximadamente de 10 % en peso, de 3 % en peso a aproximadamente 9 % en peso, de 5 % en peso a aproximadamente 9 % en peso, etc.) del peso combinado o total de proteínas en la composición enzimática modificada genéticamente, según se mide con el uso de SDS-PAGE, HPLC o UPLC. El peso combinado del polipéptido o los polipéptidos que tienen actividad de L-a-arabinofuranosidasa se mide, por ejemplo, por la cantidad de Fv51A en una composición que comprende esta L-a-arabinofuranosidasa, por ejemplo, cualquiera de las composiciones enzimáticas diseñadas por ingeniería genética de la presente descripción. El peso total de L- -arabinofuranosidasa en esa mezcla es de aproximadamente 0.2 % en peso a aproximadamente 2 % en peso, por ejemplo, de aproximadamente 0.3 % en peso a aproximadamente 0.5 % en peso según se mide con el uso de HPLC, de aproximadamente 0.8 % en peso a aproximadamente 1.2 % en peso según se mide con el uso de UPLC y SDS-PAGE de conformidad con los métodos descritos en la presente descripción.
El peso combinado del polipéptido o los polipéptidos que tienen actividad de ß-glucosidasa (que incluyen variantes, mutantes o polipéptidos de ß-glucosidasa quiméricos/de fusión) puede constituir de aproximadamente 0.05 % en peso a aproximadamente 50 % en peso (por ejemplo, de aproximadamente 0.1 % en peso a aproximadamente 45 % en peso, de aproximadamente 1 % en peso a aproximadamente 42 % en peso, de aproximadamente 2 ¾ en peso a aproximadamente 45 % en peso, de aproximadamente 2 % en peso a aproximadamente 40 % en peso, de aproximadamente 2 % en peso a aproximadamente 30 % en peso, de aproximadamente 2 % en peso a aproximadamente 25 % en peso, de aproximadamente 5 % en peso a aproximadamente 50 % en peso, de aproximadamente 9 % en peso a aproximadamente 17 % en peso, de aproximadamente 10 % en peso a aproximadamente 50 % en peso, de aproximadamente 20 % en peso a aproximadamente 50 % en peso, de aproximadamente 25 % en peso a aproximadamente 50 % en peso, de aproximadamente 30 % en peso a aproximadamente 50 % en peso, etc.) del peso combinado o total de proteínas en la composición enzimática modificada genéticamente, según se mide con el uso de SDS-PAGE, UPLC o HPLC. En un ejemplo particular, el peso combinado del polipéptido o los polipéptidos que tienen actividad de ß-glucosidasa se mide por la cantidad de un híbrido/quimera de ß-glucosidasa, por ejemplo, de la sec . con núm. de ident.:92 y Bgll de T. reesei en una composición que comprende las enzimas, por ejemplo, cualquiera de las composiciones enzimáticas diseñadas por ingeniería genética de la presente descripción. El peso total de ß-glucosidasa en esa mezcla es de aproximadamente 18 % en peso a aproximadamente 28 % en peso, por ejemplo, de aproximadamente 22 % en peso a aproximadamente 25 % en peso medido por medio de SDS-PAGE y UPLC y de aproximadamente 18 % en peso a aproximadamente 22 % en peso medido con el uso de HPLC de conformidad con los métodos descritos en la presente descripción .
El peso total de los polipéptidos de endoglucanasa de GH61 puede representar o constituir de aproximadamente 2 % en peso a aproximadamente 50 % en peso (por ejemplo, de aproximadamente 2 % en peso a aproximadamente 45 % en peso, de aproximadamente 2 % en peso a aproximadamente 40 % en peso, de apro imadamente 2 % en peso a aproximadamente 30 % en peso, de aproximadamente 2 % en peso a aproximadamente 25 % en peso, de aproximadamente 4 % en peso a aproximadamente 16 % en peso, de aproximadamente 5 % eri peso a aproximadamente 50 % en peso, de aproximadamente 10 % en peso a aproximadamente 50 % en peso, de aproximadamente 20 % en peso a aproximadamente 50 % en peso, de aproximadamente 25 % en peso a aproximadamente 50 % en peso, de aproximadamente 30 % en peso a aproximadamente 50 % en peso, etc.) del peso combinado o total de proteínas en la composición enzimática modificada genéticamente según se mide por SDS-PAGE, HPLC o UPLC . En un ejemplo particular, el peso combinado del polipéptido o los polipéptidos que tienen actividad de GH61/endoglucanasa se mide por la cantidad de polipéptido de Eg4 de T. reesei en una composición que comprende las enzimas, por ejemplo, cualquiera de las composiciones enzimáticas diseñadas por ingeniería genética de la presente descripción. El peso total de Eg4 de T. reesei en esa mezcla es de aproximadamente 6 % en peso a aproximadamente 20 % en peso, por ejemplo, de aproximadamente 6 % en peso a aproximadamente 10 % en peso medido por medio de HPLC y de aproximadamente 6 % en peso a aproximadamente 18 % en peso medido con el uso de UPLC o SDS-PAGE de conformidad con los métodos descritos en la presente descripción .
Un ejemplo de una composición enzimática modificada genéticamente de la invención comprende, de conformidad con una medición por HPLC con el uso de las condiciones descritas en los ejemplos de la presente descripción, de aproximadamente 4 % en peso a aproximadamente 6 % en peso de un polipéptido de ß-xilosidasa del Grupo 1, de aproximadamente 5 % en peso a aproximadamente 9 % en peso de un peso combinado de un polipéptido de ß-xilosidasa del Grupo 2 y un polipéptido de L-a-arabinofuranosidasa, de aproximadamente 9 % en peso a aproximadamente 17 % en peso de un polipéptido de ß-glucosidasa, de aproximadamente 9 % en peso a aproximadamente 17 % en peso de una xilanasa, de aproximadamente 4 % en peso a aproximadamente 16 % en peso de una endoglucanasa de GH61. La composición enzimática puede comprender, además, de aproximadamente 25 % en peso a aproximadamente 45 % en peso de una o más celobiohidrolasas . La composición enzimática puede comprender, además, de aproximadamente 7 % en peso a aproximadamente 20 % en peso de otras celulasas.
Un ejemplo de una composición enzimática modificada genéticamente de la invención comprende, de conformidad con una medición por UPLC con el uso de las condiciones descritas en los ejemplos de la presente descripción, de aproximadamente 4 % en peso a aproximadamente 6 % en peso de un polipéptido de ß-xilosidasa del Grupo 1, de aproximadamente 5 % en peso a aproximadamente 9 % en peso de un polipéptido de ß-xilosidasa del Grupo 2, de aproximadamente 0.5 % en peso a aproximadamente 2 % en peso de un polipéptido de L-a-arabinofuranosidasa , de aproximadamente 18 % en peso a aproximadamente 22 % en peso de polipéptidos de ß-glucosidasa, de aproximadamente 13 % en peso a aproximadamente 15 % en peso de polipéptidos de xilanasa y de aproximadamente 8 % en peso a aproximadamente 20 % en peso de una endoglucanasa de GH61. La composición enzimática puede comprender, además, de aproximadamente 15 % en peso a aproximadamente 25 % en peso de celobiohidrolasas , por ejemplo, CBH1 y CBH2 de T. reesei . La composición enzimática puede comprender, además, de aproximadamente 2 % en peso a aproximadamente 8 % en peso de otras celulasas.
Por lo menos una (por ejemplo, una o más, dos o más, tres o más, cuatro o más, cinco o más o aun seis o más) enzima en una composición enzimática modificada genéticamente de la invención se deriva de una fuente biológica heteróloga, tal como, por ejemplo, un microorganismo, que es diferente a la célula huésped. En un ejemplo no limitante, una de las enzimas en una composición enzimática modificada genéticamente es una enzima de un hongo filamentoso de Fusariu spp . , mientras que la composición enzimática modificada genéticamente se produce por medio de un microorganismo distinto a un hongo de Fusarium spp. En otro ejemplo, una de las enzimas en una composición enzimática modificada genéticamente es una enzima de un hongo filamentoso de Trichoderma spp., mientras que la composición enzimática modificada genéticamente se produce por medio de un microorganismo distinto a un hongo de Trichoderma spp., por ejemplo, Aspergillus o Chrysosporium.
Por lo menos dos enzimas en la composición enzimática modificada genéticamente descrita en la presente descripción se derivan de fuentes biológicas diferentes. En un ejemplo de una composición enzimática modificada genéticamente, una o más enzimas se derivan de Fusarium spp., mientras que otra u otras enzimas se derivan de un hongo distinto a Fusarium spp.
La composición enzimática modificada genéticamente es, por ejemplo, adecuadamente, una composición de caldo de cultivo. El caldo de cultivo es, por ejemplo, un caldo de cultivo de un hongo filamentoso que incluye, sin limitarse a, Trichoderma, Humicola, Fusarium, Aspergillus, Neurospora, Penicillium, Cephalosporium, Achlya, Podospora, Endothia, Mucor, Cochliobolus, Pyricularia o Chrysosporium. Un ejemplo de un hongo de Trichoderma spp. es Trichoderma reesei . Un ejemplo de un hongo de Penicillium spp. es Penicillium funiculosum. Un ejemplo de un hongo de Aspergilllus spp. es Aspergillus niger o Aspergillus oryzae. Un ejemplo de un hongo de Chrysosporium spp. es Chrysosporium luckhowence. El caldo de fermentación puede ser, por ejemplo, un caldo de fermentación libre de células que, opcionalmente , se expone a un procesamiento mínimo después de la producción que incluye, por ejemplo, ultrafiltración, purificación, exterminación de células, etc., y como tal se puede usar en una formulación de caldo entero.
La composición enzimática modificada genéticamente puede ser, además, una composición de celulasa, por ej mplo, una composición de celulasa fúngica o una composición de celulasa bacteriana. La composición de celulasa puede producirse, por ejemplo, por medio de un hongo filamentoso, tal como por Trichoderma , Aspergillus, Chrysosporium, por medio de una levadura, tal como Saccharomyces cerevisiae .
Las enzimas o composiciones enzimáticas diseñadas por ingeniería genética de la descripción se pueden usar en la industria alimenticia, por ejemplo, para horneado, para el procesamiento de frutas y vegetales, para la descomposición de desechos agrícolas, en la fabricación de alimentos para animales, en la producción de pulpa y papel, en la fabricación de telas o en agentes de limpieza industriales y para el hogar. Cada enzima de la presente descripción puede producirse individualmente, por ejemplo, por medio de un microorganismo, tal como un hongo o una bacteria.
Las enzimas o composiciones enzimáticas diseñadas por ingeniería genética de la presente descripción pueden usarse, además, para la digestión de lignocelulosa a partir de cualquier fuente adecuada, que incluye todas las fuentes biológicas, tales como biomasas vegetales, por ejemplo, maíz, granos, césped {por ejemplo, pasto indio, tal como Sorghastrum nutans; o césped de pradera, por ejemplo, especies de Panicum, tales como Panicum virgatum) , cañas perennes (por ejemplo, cañas bravas) o maderas o subproductos del procesamiento de madera, por ej mplo, en la industria del procesamiento de madera, industria de la pulpa y/o papel, la fabricación de telas, agentes para limpieza industrial y/o procesamiento de desechos de biomasa. La descripción proporciona métodos para hidrolizar, descomponer o alterar un celooligosacárido, un oligómero de arabinoxilano o una composición que comprende glucano o celulosa; los métodos comprenden poner en contacto la composición con una enzima o composición enzimática de la descripción en condiciones adecuadas, en donde la enzima o la composición enzimática hidroliza, descompone o altera el celooligosacárido, el oligómero de arabinoxilano o la composición que comprende glucano o celulosa.
La descripción proporciona composiciones enzimáticas diseñadas por ingeniería genética que comprenden un polipéptido de la presente descripción o un polipéptido codificado por un ácido nucleico de la presente descripción. En algunas modalidades, el polipéptido tiene una o más actividades seleccionadas de actividades de xilanasa, xilosidasa, L-a-arabinofuranosidasa, ß-glucosidasa y/o GH6l/endoglucanasa . Las composiciones enzimáticas diseñadas por ingeniería genética se usan o son útiles para la despolimerización de polímeros celulósicos y hemicelulósicos en porciones de carbono metabolizable . La composición enzimática modificada genéticamente está, adecuadamente, por ejemplo, en forma de un producto de fabricación. La composición puede ser, por ejemplo, una formulación y puede estar físicamente, por ejemplo, en forma líquida o sólida.
Una composición enzimática modificada genéticamente de la presente descripción puede incluir, además, opcionalmente , una celulasa, por ejemplo, una celulasa completa, que comprende por lo menos tres tipos de enzimas diferentes seleccionados de (1) una endoglucanasa, (2) una celobiohidrolasa y (3) una ß-glucosidasa ; o por lo menos tres actividades enzimáticas diferentes seleccionadas de (1) una actividad de endoglucanasa que cataliza el clivaje de enlaces ß-1,4 internos de materiales celulósicos o hemicelulósicos que producen glucooligosacáridos más cortos, (2) una actividad de celobiohidrolasa que cataliza el clivaje y la liberación, en una forma "exo", de unidades de celobiosa (por ejemplo, disacárido de ß-1,4 glucosa-glucosa) y (3) una actividad de ß-glucosidasa que cataliza la liberación de monómeros de glucosa a partir de celooligosáridos cortos (por ejemplo, celobiosa) . La celulasa completa se puede enriquecer con uno o más polipéptidos de ß-glucosidasa . En ciertas modalidades, la celulasa completa se puede enriquecer con un polipéptido de endoglucanasa de GH61, por ejemplo, un polipéptido de EGIV, tal como Eg4 de T. reesei. En ciertas modalidades, la celulasa completa se puede enriquecer con un polipéptido de ß-glucosidasa y un polipéptido de endoglucanasa de GH61. Las composiciones enzimáticas diseñadas por ingeniería genética de la descripción se describen, además, en la Sección 5.3. más abajo.
En otro aspecto, la descripción proporciona métodos para procesar un material de biomasa que comprende poner en contacto una composición que comprende lignocelulosa y/o un azúcar fermentable con una enzima de la presente descripción o con un polipéptido codificado por un ácido nucleico de la presente descripción o con una composición enzimática modificada genéticamente (por ejemplo, un producto de fabricación o una fórmula) de la presente descripción. El material de biomasa adecuado que comprende lignocelulosa se puede derivar, por ejemplo, de un cultivo agrícola, un subproducto de un alimento o producto alimenticio, un producto de desecho lignocelulósico, un residuo vegetal o un papel de desecho o producto de papel de desecho. Los polipéptidos pueden tener, adecuadamente, una o más actividades enzimáticas seleccionadas de actividades de celulasa, endoglucanasa, celobiohidrolasa, ß-glucosidasa, xilanasa, mananasa, ß-xilosidasa, arabinofuranosidasa y otras actividades de hemicelulasa . El residuo vegetal adecuado puede comprender grano, semillas, tallos, hojas, vainas, cáscaras, mazorcas de maíz, rastrojo de maíz, paja, césped, caña, juncos, madera, astillas, pulpa de madera y aserrín. El césped puede ser, por ejemplo, pasto indio o césped de pradera. Los juncos pueden ser, por ejemplo, cañas perennes tales como cañas bravas. El papel de desecho puede ser, por ejemplo, papel de fotocopias, papel de impresora de computadora, papel de cuaderno, papel de anotador, papel de máquina de escribir, periódicos, revistas, cartón y materiales de embalaje a base de papel desechados o usados.
La descripción proporciona composiciones (que incluyen enzimas o composiciones enzimáticas diseñadas por ingeniería genética, por ejemplo, productos de fabricación o una fórmula) que comprenden una mezcla de enzimas hidrolizantes de hemicelulosa y celulosa y por lo menos un material de biomasa. Opcionalmente , el material de biomasa comprende un material lignocelulósico derivado de un cultivo agrícola o que es un subproducto de un alimento o de la producción alimenticia. El material de biomasa adecuado puede ser, además, un producto de desecho lignocelulósico, un residuo vegetal, un papel de desecho o producto de papel de desecho o comprende un residuo vegetal. El residuo vegetal puede ser, por ejemplo, un residuo que comprende granos, semillas, tallos, hojas, vainas, cáscaras, mazorcas de maíz, rastrojo de maíz, césped, paja, juncos, madera, astillas, pulpa de madera o aserrín. El césped ilustrativo incluye, sin limitarse a, pasto indio o césped de pradera. Los juncos ilustrativos incluyen, sin limitarse a, ciertas cañas perennes tales como cañas bravas. El papel de desecho ilustrativo incluye, sin limitarse a, papel de fotocopias, papel de impresora de computadora, papel de cuaderno, papel de anotador, papel de máquina de escribir, periódicos, revistas, cartón y materiales de embalaje a base de papel desechados o usados.
Por lo tanto, la presente descripción proporciona composiciones (que incluyen enzimas o composiciones enzimáticas diseñadas por ingeniería genética, por ejemplo, productos de fabricación o una fórmula) útiles para hidrolizar materiales hemicelulósicos y catalizar la conversión enzimática de sustratos de biomasa adecuados en azúcares fermentables . La presente descripción proporciona, además, métodos para preparar las composiciones así como métodos para usar o aplicar las composiciones en un entorno de investigación, un entorno industrial o un entorno comercial ·
Toda la información disponible al público a partir de la fecha de presentación que incluye, por ejemplo, publicaciones, patentes, solicitudes de patente, secuencias del GenBank y depósitos en la ATCC citada en la presente descripción se incorpora en la presente descripción expresamente como referencia.
Breve Descripción de las Figuras
Las siguientes figuras y tablas son ilustrativas y no limitan el alcance y contenido de la presente descripción o de las reivindicaciones de la presente descripción.
Las Figs . 1A-1D proporcionan un resumen de las secuencias identificadas usadas en la presente descripción correspondientes a varias enzimas y motivos de secuencias.
Figs. 2A-2B: la Fig. 2A proporciona residuos conservados de Eg4 de T. reesei, inferidos del alineamiento de secuencias y las estructuras conocidas de TrEGb (o Eg7 de T. reesei, conocido, además, como "TrEG7") (estructura cristalina en el Registro del banco de datos de proteínas (Protein Data Bank Accession) : pdb:2vtc) y TtEG (estructura cristalina en el Registro del banco de datos de proteínas (Protein Data Bank Accession): pdb:3EII). La Fig. 2B proporciona residuos del dominio CBM conservados inferidos del alineamiento de secuencias con secuencias de Tr6A, Tr7A conocidas.
Fig. 3: proporciona residuos de sitios activos conservados entre homólogos de Fv3C, previstos en base a la estructura cristalina de Bgl3B de T. neapolitana complejada con glucosa en -1 subsitio (estructura cristalina en el Registro del banco de datos de proteínas (Protein Data Bank Accession) : pdb:2X41) .
Fig. 4: proporciona la composición enzimática de un caldo de fermentación producido por la cepa integrada de T. reesei H3A. La determinación de esta composición se describe en el Ejemplo 2.
Fig. 5: enumera las enzimas (purificadas o no purificadas) añadidas individualmente a cada muestra en el Ejemplo 2 y las concentraciones de iniciales de proteína de estas enzimas.
Fig. 6: proporciona un cuadro de dosificación de Eg4 de T. reesei para el Ejemplo 4 (experimento 1) . La muestra "núm. 27" es una cepa integrada H3A/Eg4 tal como se describe en el Ejemplo 4. Las cantidades de Eg4 de T. reesei purificado que se añadieron se enumeran bajo "Descripción de la muestra" por % en peso o por masa (en mg de proteína/g de G+X) .
Figs . 7A-7B: la Fig. 7A proporciona otro cuadro de dosificación de Eg4 de T. reesei para el Ejemplo 4 (experimento 2) . Las muestras se describen de manera similar a las de la Fig. 6. Las cantidades de Eg4 de T. reesei purificado se añadieron en forma variada por incrementos menores que los del Ejemplo 4, experimento 1 (anterior); la Fig. 7B proporciona otro cuadro de dosificación de Eg4 de T. reesei para el Ejemplo 4 (experimento 3) . Las muestras se describen de manera similar a las de las Figs. 6 y 7A. Las cantidades de Eg4 de T. reesei purificado se añadieron en formada variada por incrementos aun más pequeños que los del Ejemplo 4, experimentos 1 y 2 (anteriores) .
Figs. 8A-8B-2: la Fig. 8A representa las diversas relaciones de mezclas de CBH1, CBH2 y Eg2 de T. reesei, tal como se describe en el Ejemplo 15. Las Figs. 8B1-8B2 enumeran la conversión de glucano (%) con el uso de diversas composiciones enzimáticas. Las condiciones de los experimentos se describen en el Ejemplo 15.
Fig. 9: enumera el % de producción de la xilosa liberada de la mazorca de maíz pretratada con amoníaco diluido con el uso de una composición enzimática que comprende Eg4 de T. reesei, de conformidad con el Ejemplo 6.
Fig. 10: proporciona el % de producción de glucosa liberada de la mazorca de maíz pretratada con amoníaco diluido con el uso de una composición enzimática que comprende Eg4 de T. reesei, de conformidad con el Ejemplo 6.
Fig. 11: proporciona el % de producción de monómeros fermentables totales liberados de la mazorca de maíz pretratada con amoníaco diluido con el uso de una composición enzimática que comprende Eg4 de T. reesei, de conformidad con el Ejemplo 6.
Fig. 12: compara las cantidades de glucosa liberada a través de hidrólisis por una composición enzimática sin Eg4 de G. reesei comparada con una composición que tiene Eg4 de T. reesei a 0.53 mg/g. El experimento se describe en el Ejemplo 7.
Fig. 13: enumera la actividad de ß-glucosidasa de varios homólogos de ß-glucosidasa que incluyen Bgll de T. reesei (Tr3A) , Bglu de A. niger (An3A) , Fv3C, Fv3D y Pa3C. Se midió la actividad en sustratos de celobiosa y CNPG, de conformidad con el Ejemplo 18.
Fig. 14: enumera los pesos relativos de las enzimas en una mezcla/composición enzimática probada en el Ejemplo 19.
Fig. 15: proporciona una comparación de los efectos de composiciones enzimáticas en la mazorca de maíz pretratada con amoníaco diluido. Los detalles experimentales se describen en el Ejemplo 21.
Figs . 16A-16B: la Fig. 16A representa una secuencia de nucleótidos de Fv3A (sec. con núm. de ident.:l). La Fig. 16B representa una secuencia de aminoácidos de Fv3A (sec. con núm. de ident.:2). La secuencia señal prevista está subrayada. El dominio conservado previsto aparece en negrita.
Figs. 17A-17B: la Fig. 17A representa una secuencia de nucleótidos de Pf43A (sec. con núm. de ident . : 3 ) . La Fig. 17B representa una secuencia de aminoácidos de Pf43A (sec. con núm. de ident. :4). La secuencia señal prevista está subrayada. El dominio conservado previsto aparece en negrita, el módulo de unión a carbohidratos previsto ("CBM") está en mayúscula y el conector previsto que separa el dominio conservado (CD) y el CBM aparece en cursiva.
Figs. 18A-18B: la Fig. 18A representa una secuencia de nucleótidos de Fv43E (sec. con núm. de ident.: 5) . La Fig. 18B representa una secuencia de aminoácidos de Fv43E (sec. con núm. de ident. :6) . La secuencia señal prevista está subrayada. El dominio conservado previsto aparece en negrita.
Figs . 19A-19B: la Fig. 19A representa una secuencia de nucleótidos de Fv39A (sec. con núm. de ident.:7) . La Fig. 19B representa una secuencia de aminoácidos de Fv39A (sec. con núm. de ident . : 8) . La secuencia señal prevista está subrayada. El dominio conservado previsto aparece en negrita.
Figs. 20A-20B: la Fig. 20A representa una secuencia de nucleótidos de Fv43A (sec. con núm. de ident. :9) . La Fig. 20B representa una secuencia de aminoácidos de Fv43A (sec. con núm. de ident. :10) . La secuencia señal prevista está subrayada. El dominio conservado previsto aparece en negrita, el CBM previsto está en mayúscula y el conector previsto que separa el dominio conservado y el CBM aparece en cursiva.
Figs. 21A-21B: la Fig. 21A representa una secuencia de nucleótidos de Fv43B (sec. con núm. de ident.: 11) . La Fig. 21B representa una secuencia de aminoácidos de Fv43B (sec. con núm. de ident. :12) . La secuencia señal prevista está subrayada. El dominio conservado previsto aparece en negrita.
Figs. 22A-22B: la Fig. 22A representa una secuencia de nucleótidos de Pa51A (sec. con núm. de ident. :13) . La Fig. 22B representa una secuencia de aminoácidos de Pa51A (sec. con núm. de ident. : 14) . La secuencia señal prevista está subrayada. El dominio conservado de L- -arabinofuranosidasa previsto aparece en negrita. Para la expresión en T. reesei se usó ADN genómico con codones optimizados para la expresión en T. reesei (ver la Fig. 39B) .
Figs . 23A-23B: la Fig. 23A representa una secuencia de nucleótidos de Gz43A (sec. con núm. de ident.:15). La Fig. 23B representa una secuencia de aminoácidos de Gz43A (sec. con núm. de ident.:16) . La secuencia señal prevista está subrayada. El dominio conservado previsto aparece en negrita.
Para la expresión en G. reesei, la secuencia señal prevista se reemplazó por la secuencia señal de CBH1 de G. reesei (myrklavisaflatara (sec. con núm. de ident . : 117)).
Figs. 24A-24B: la Fig. 24A representa una secuencia de nucleótidos de Fo43A (sec. con núm. de ident. :17) . La Fig.
24B representa una secuencia de aminoácidos de Fo43A (sec. con núm. de ident. :18) . La secuencia señal prevista está subrayada. El dominio conservado previsto aparece en negrita.
Para la expresión en T. reesei, la secuencia señal prevista se reemplazó por la secuencia señal de CBH1 de T. reesei
(myrklavisaflatara (sec. con núm. de ident .: 117) ) .
Figs. 25A-25B: la Fig. 25A representa una secuencia de nucleótidos de Af43A (sec. con núm. de ident. :19) . La Fig.
25B representa una secuencia de aminoácidos de Af43A (sec. con núm. de ident. :20) . El dominio conservado previsto aparece en negrita.
Figs. 26A-26B: la Fig. 26A representa una secuencia de nucleótidos de Pf51A (sec. con núm. de ident. :21) . La Fig. 26B representa una secuencia de aminoácidos de Pf51A (sec. con núra. de ident.:22) . La secuencia señal prevista está subrayada. El dominio conservado de L-a-arabinofuranosidasa previsto aparece en negrita. Para la expresión en T. reesei, la secuencia señal prevista se reemplazó por la secuencia señal de CBH1 de T. reesei (myrklavisaflatara (sec. con núm. de ident.:117)) y la secuencia de nucleótidos de Pf51A tenía codones optimizados para la expresión en T. reesei.
Figs . 27A-27B: la Fig. 27A representa una secuencia de nucleótidos de AfuXyn2 (sec. con núm. de ident.:23) . La Fig. 27B representa una secuencia de aminoácidos de AfuXyn2 (sec. con núra. de ident.:24) . La secuencia señal prevista está subrayada. El dominio conservado de GH11 previsto aparece en negrita .
Figs. 28?-28?: la Fig. 28A representa una secuencia de nucleótidos de AfuXyn5 (sec. con núm. de ident . :25) . La Fig. 28B representa una secuencia de aminoácidos de AfuXyn5 (sec. con núm. de ident. :26) . La secuencia señal prevista está subrayada. El dominio conservado de GH11 previsto aparece en negrita.
Figs. 29A-29B: la Fig. 29A representa una secuencia de nucleótidos de Fv43D (sec. con núm. de ident. :27). La Fig. 29B representa una secuencia de aminoácidos de Fv43D (sec. con núm. de ident. :28) . La secuencia señal prevista está subrayada. El dominio conservado previsto aparece en negrita.
Figs . 30A-30B: la Fig. 30A representa una secuencia de nucleótidos de Pf43B (sec. con núm. de ident.:29) . La Fig. 30B representa una secuencia de aminoácidos de Pf43B (sec. con núm. de ident.:30) . La secuencia señal prevista está subrayada. El dominio conservado previsto aparece en negrita.
Figs. 31A-31B: la Fig. 31A representa una secuencia de nucleótidos de Fv51A (sec. con núm. de ident. :31) . La Fig. 31B representa una secuencia de aminoácidos de Fv51A (sec. con núm. de ident.:32) . La secuencia señal prevista está subrayada. El dominio conservado de L-a-arabinofuranosidasa previsto aparece en negrita.
Figs. 32A-32B: la Fig. 32A representa una secuencia de nucleótidos de Cg51B (sec. con núm. de ident.:33) . La Fig. 32B representa una secuencia de aminoácidos de Cg51B (sec. con núm. de ident.:34) . La secuencia señal prevista está subrayada. El dominio conservado previsto aparece en negrita.
Figs. 33A-33B: la Fig. 33A representa una secuencia de nucleótidos de Fv43C (sec. con núm. de ident. :35) . La Fig. 33B representa una secuencia de aminoácidos de Fv43C (sec. con núm. de ident.:36) . La secuencia señal prevista está subrayada. El dominio conservado previsto aparece en negrita.
Figs. 34A-34B: la Fig. 34A representa una secuencia de nucleótidos de Fv30A (sec. con núm. de ident. :37) . La Fig. 34B representa una secuencia de aminoácidos de Fv30A (sec. con núm. de ident.:38) . La secuencia señal prevista está subrayada .
Figs. 35A-35B: la Fig. 35A representa una secuencia de nucleótidos de Fv43F (sec. con núm. de ident.:39) . La Fig. 35B representa una secuencia de aminoácidos de Fv43F (sec. con núm. de ident.:40) . La secuencia señal prevista está subrayada .
Figs. 36A-36B: la Fig. 36A representa una secuencia de nucleótidos de Xyn3 de T. reesei (sec. con núm. de ident.:41). La Fig. 36B representa una secuencia de aminoácidos de Xyn3 de T. reesei (sec. con núm. de ident.:42). La secuencia señal prevista está subrayada. El dominio conservado previsto aparece en negrita.
Figs. 37A-37B: la Fig. 37A representa una secuencia de aminoácidos de Xyn2 de T. reesei (sec. con núm. de ident.:43). La secuencia señal aparece subrayada. El dominio conservado previsto aparece en negrita. La secuencia codificante se puede encontrar en Tórrónen et al. Biotechnology, 1992, 10:1461-65; La Fig. 37B representa una secuencia de aminoácidos de Pa3C (sec. con núm. de ident.:44), una enzima de GH3 de P. anserina.
La Fig. 38 representa una secuencia de aminoácidos de Bxll de T. reesei (sec. con núm. de ident.:45) . La secuencia señal aparece subrayada. El dominio conservado previsto aparece en negrita. La secuencia codificante puede encontrarse en Margolles-Clark et al. Appl . Environ.
Microbiol. 1996, 62 (10) : 3840-46.
Figs. 39A-39E: la Fig. 39A representa el ADNc deducido para Pa51A (sec. con núm. de ident.:46). La Fig. 39B representa ADNc con codones optimizados para Pa51A (sec. con núm. de ident.:47) . Fig. 39C: secuencia codificante para un constructo que comprende una secuencia señal de CBH1 (subrayada) corriente arriba del ADN genómico que codifica Gz43A maduro (sec. con núm. de ident . :48) . Fig. 39D: secuencia codificante para un constructo que comprende una secuencia señal de CBH1 (subrayada) corriente arriba del ADN genómico que codifica Fo43A maduro (sec. con núm. de ident. :49). Fig. 39E: secuencia codificante para un constructo que comprende una secuencia señal de CBH1 (subrayada) corriente arriba del ADN con codones optimizados que codifica Pf51A (sec. con núm. de ident. :50) .
Figs. 40A-40B: la Fig. 40A representa una secuencia de nucleótidos de Eg4 de T. reesei (sec. con núm. de ident.: 51). La Fig. 40B representa una secuencia de aminoácidos de Eg4 de T. reesei (sec. con núm. de ident.: 52) . La secuencia señal prevista está subrayada. Los dominios conservados previstos aparecen en negrita. El conector previsto aparece en cursiva.
Figs. 41A-41B: la Fig. 41A representa una secuencia de nucleótidos de Pa3D (sec. con núm. de ident. :53). La Fig. 41B representa una secuencia de aminoácidos de Pa3D (sec. con núm. de ident. :54) . La secuencia señal prevista está subrayada. Los dominios conservados previstos aparecen en negrita .
Figs . 42A-42B: la Fig. 42A representa una secuencia de nucleótidos de Fv3G (sec. con núm. de ident . :55) . La Fig. 42B representa una secuencia de aminoácidos de Fv3G (sec. con núm. de ident. :56). La secuencia señal prevista está subrayada. Los dominios conservados previstos aparecen en negrita .
Figs. 43A-43B: la Fig. 43A representa una secuencia de nucleótidos de Fv3D (sec. con núm. de ident. :57) . La Fig. 43B representa una secuencia de aminoácidos de Fv3D (sec. con núm. de ident. :58). La secuencia señal prevista está subrayada. Los dominios conservados previstos aparecen en negrita .
Figs. 44A-44B: la Fig. 44A representa una secuencia de nucleótidos de Fv3C (sec. con núm. de ident. :59) . La Fig. 44B representa una secuencia de aminoácidos de Fv3C (sec. con núm. de ident. :60). La secuencia señal prevista está subrayada. Los dominios conservados previstos aparecen en negrita.
Figs. 45A-45B: la Fig. 45A representa una secuencia de nucleótidos de Tr3A (sec. con núm. de ident. :61) . La Fig. 45B representa una secuencia de aminoácidos de Tr3A (sec. con núm. de ident. :62) . La secuencia señal prevista está subrayada. Los dominios conservados previstos aparecen en negrita.
Figs . 46A-46B: la Fig. 46A representa una secuencia de nucleótidos de Tr3B (sec. con núm. de ident.:63) . La Fig. 46B representa una secuencia de aminoácidos de Tr3B (sec. con núm. de ident. :64) . La secuencia señal prevista está subrayada. Los dominios conservados previstos aparecen en negrita .
Figs. 47A-47B: la Fig. 47A representa la secuencia de nucleótidos con codones optimizados (para la expresión en T. reesei) de Te3A (sec. con núm. de ident . :65) . La Fig. 47B representa una secuencia de aminoácidos de Te3A (sec. con núm. de ident.: 66). La secuencia señal prevista está subrayada. Los dominios conservados previstos aparecen en negrita .
Figs. 48A-48B: la Fig. 48A representa una secuencia de nucleótidos de An3A (sec. con núm. de ident. :67) . La Fig. 48B representa una secuencia de aminoácidos de An3A (sec. con núm. de ident. :68) . La secuencia señal prevista está subrayada. Los dominios conservados previstos aparecen en negrita.
Figs. 49A-49B: la Fig. 49A representa una secuencia de nucleótidos de Fo3A (sec. con núm. de ident. -.69) . La Fig. 49B representa una secuencia de aminoácidos de Fo3A (sec. con núm. de ident. :70) . La secuencia señal prevista está subrayada. Los dominios conservados previstos aparecen en negrita .
Figs. 50A-50B: la Fig. 50A representa una secuencia de nucleótidos de Gz3A (sec. con núm. de ident.:71) . La Fig. 50B representa una secuencia de aminoácidos de Gz3A(sec. con núm. de ident.:72) . La secuencia señal prevista está subrayada. Los dominios conservados previstos aparecen en negrita.
Figs. 51A-51B: la Fig. 51A representa una secuencia de nucleótidos de Nh3A (sec. con núm. de ident.:73) . La Fig. 51B representa una secuencia de aminoácidos de Nh3A (sec. con núm. de ident . :74) . La secuencia señal prevista está subrayada. Los dominios conservados previstos aparecen en negrita .
Figs. 52A-52B: la Fig. 52A representa una secuencia de nucleótidos de Vd3A (sec. con núm. de ident. :75) . La Fig. 52B representa una secuencia de aminoácidos de Vd3A (sec. con núm. de ident. :76) . La secuencia señal prevista está subrayada. Los dominios conservados previstos aparecen en negrita .
Figs. 53A-53B: la Fig. 53A representa una secuencia de nucleótidos de Pa3G (sec. con núm. de ident. :77) . La Fig. 53B representa una secuencia de aminoácidos de Pa3G (sec. con núm. de ident. :78) . La secuencia señal prevista está subrayada. Los dominios conservados previstos aparecen en negrita .
Fig. 54: representa una secuencia de aminoácidos de Tn3B (sec. con núm. de ident. :79) . El programa de predicción de señal estándar, Señal P no proporcionó una secuencia señal previst .
Figs . 55A-1 a 55A-7: representan un alineamieno de secuencias de aminoácidos de ciertos homólogos de ß-glucosidasa .
Figs. 56A-56B: representan un alineamiento de secuencias de aminoácidos de Eg4 de T. reesei con TrEGb (o TrEG7 (sec. con núm. de ident . :80) y TtEG (sec. con núm. de ident . :81) .
Fig. 57: representa un alineamiento parcial de secuencias de aminoácidos de los dominios CBM de Eg4 de T. reesei con Tr6A (sec. con núm. de ident. :82) y con Tr7A (sec. con núm. de ident. :83), así como dos GH6l/endoglucanasas de T. aurantiacus (sec. con núms . de ident. :206 y 207) .
Fig. 58A-58D: la Fig. 58A representa la liberación de glucosa después de la sacarificación de la mazorca de maíz pretratada con amoníaco diluido mediante la adición de las composiciones enzimáticas que comprenden varias enzimas purificadas o no purificadas de la Fig. 5 que se añadieron a la cepa integrada de T. reesei H3A, de conformidad con el Ejemplo 2. La Fig. 58B representa la liberación de celobiosa después de la sacarificación de la mazorca de maíz pretratada con amoníaco diluido por medio de la adición de las composiciones enzimáticas que comprenden varias enzimas purificadas o no purificadas de la Fig. 5 que se añadieron a la cepa integrada de T. reesei H3A, de conformidad con el Ejemplo 2; la Fig. 58C representa la liberación de xilobiosa después de la sacarificación de la mazorca de maíz pretratada con amoníaco diluido por medio de la adición de las composiciones enzimáticas que comprenden varias enzimas purificadas o no purificadas de la Fig. 5 que se añadieron a la cepa integrada de T. reesei H3A, de conformidad con el Ejemplo 2; la Fig. 58D representa la liberación de xilosa después de la sacarificación de la mazorca de maíz pretratada con amoníaco diluido por medio de la adición de las composiciones enzimáticas que comprenden varias enzimas purificadas o no purificadas de la Fig. 5 que se añadieron a la cepa integrada de T. reesei H3A, de conformidad con el Ejemplo 2.
Figs . 59A-59B: la Fig. 59A representa el cásete de expresión pEGl-EG4-sucA, tal como se describe en el Ejemplo 3; la Fig. 59B representa el mapa de plásmidos de pCR Blunt II TOPO que contiene el cásete de expresión pEGl-EG4-sucA, tal como se describe en el Ejemplo 3.
Fig. 60: representa la cantidad/porcentaje de conversión de glucano/xilano en celobiosa/ glucosa por medio de una composición enzimática que comprende enzimas producidas por los transformantes de la cepa integrada de G. reesei H3A que expresa Eg4 de T. reesei, de conformidad con el Ejemplo 3.
Fig. 61: representa el porcentaje incrementado de conversión de glucano observado con el uso de una cantidad creciente de una composición enzimática producida por transformantes de H3A que expresa Eg4 de T. reesei . Los detalles experimentales se describen en el Ejemplo 3.
Figs. 62A-62G: la Fig. 62A representa el mapa de plásmidos del plásmido pCR-Blunt II TOPO que incluye el cásete de expresión pEGl-Fv51A, tal como se describe en el Ejemplo 23; la Fig. 62B representa el mapa de plásmidos del plásmido pCR-Blunt II TOPO que incluye pEGl-Fv3A con la secuencia terminadora de cbhl, tal como se describe en el Ejemplo 23; la Fig. 62C representa el mapa de plásmidos del plásmido pCR-Blunt II TOPO que incluye Pcbh2-Fv43D, tal como se describe en el Ejemplo 23; la Fig. 62D representa el mapa de plásmidos del plásmido pCR-Blunt II-TOPO que incluye el marcador de Pcbh2-Fv43D-als (pSK49) , tal como se describe en el Ejemplo 23; la Fig. 62E representa el mapa de plásmidos de pCR-Blunt II-TOPO con Pcbh2-Fv43D (pSK42) , tal como se describe en el Ejemplo 23; la Fig. 62F representa el mapa de plásmidos de pTrex6g que incluye la secuencia de Fv3 , tal como se describe en el Ejemplo 23; la Fig. 62G representa el mapa de plásmidos de pTrex6G con la secuencia de Fv43D, tal como se describe en el Ejemplo 23.
Figs. 63A-63B: la Fig. 63A representa la producción de glucosa a partir de la hidrólisis de la mazorca de maíz con el uso de varias composiciones enzimáticas, de conformidad con los experimentos descritos en el Ejemplo 16; la Fig. 63B representa la producción de xilosa a partir de la hidrólisis de la mazorca de maíz con el uso de varias composiciones enzimáticas de conformidad con la descripción del Ejemplo 16.
La Fig. 64 representa el efecto de Eg4 de T. reesei en la liberación de glucosa a partir de la sacarificación de la mazorca de maíz pretratada con amoníaco diluido. El eje Y se refiere a las concentraciones de glucosa o xilosa liberada en las mezclas de reacción. El eje X enumera los nombres/descripciones breves de las muestras de la composición enzimática. Los detalles experimentales se incluyen en el Ejemplo 4.
La Fig. 65 representa el efecto de Eg4 de T. reesei en la liberación de xilosa a partir de la sacarificación de la mazorca de maíz pretratada con amoníaco diluido. El eje Y se refiere a las concentraciones de glucosa o xilosa liberada en las mezclas de reacción. El eje X enumera los nombres/descripciones breves de las muestras de la composición enzimática. Los detalles experimentales se describen en el Ejemplo 4.
Figs . 66A-66B: la Fig. 66A representa el efecto de Eg4 de T. reesei en varias cantidades (0.05 mg/g a 1.0 mg/g) en la liberación de glucosa a partir de la sacarificación de la mazorca de maíz pretratada con amoníaco diluido, tal como se describe en el Ejemplo 4. La Fig. 66B representa el efecto de Eg4 de G. reesei en varias cantidades (0.1 mg/g a 0.5 mg/g) en la liberación de glucosa a partir de la sacarificación de la mazorca de maíz pretratada con amoníaco diluido, tal como se describe en el Ejemplo 4.
Fig. 67: representa el efecto de Eg4 de T. reesei en una composición enzimática en la liberación de glucosa y xilosa a partir de la sacarificación del rastrojo de maíz pretratado con amoníaco diluido, con distintas cargas de sólidos, tal como se describe en el Ejemplo 5.
Fig. 68: representa la liberación del monómero de glucosa como resultado del tratamiento de la mazorca de maíz pretratada con amoníaco con el uso de Eg4 de T. reesei purificado solo, de conformidad con el Ejemplo 7.
Fig. 69: representa y compara el desempeño de la sacarificación en diversos sustratos en las composiciones enzimáticas producidas por la cepa integrada de T. reesei H3A y la cepa integrada H3A/Eg4 (cepa núm. 27) , en una dosificación de enzimas de 14 mg/g, de conformidad con el Ejemplo 8.
Fig. 70: representa el desempeño de la sacarificación de las composiciones enzimáticas producidas por la cepa integrada de T. reesei H3A y la cepa integrada H3A/Eg4 (cepa núm. 27) , en varias dosificaciones de enzimas, en el rastrojo de maíz pretratado con ácido de conformidad con el Ejemplo 9.
Fig. 71: representa el desempeño de la sacarificación de las composiciones enzimáticas producidas por la cepa integrada de T. reesei H3A y la cepa integrada H3A/Eg4 (cepa núm. 27) en hojas, tallos o mazorcas de maíz pretratados con amoníaco diluido, de conformidad con el Ejemplo 10.
Figs. 72A-1 a 72B-3. las Figs . 72A-1 a 72A-3 representan cantidades para diversas composiciones enzimáticas para sacarificación; las Figs. 72B-1 a 72B-3 representan la cantidad de glucosa, glucosa + celobiosa o xilosa producida con cada composición enzimática que corresponde a las Figs. 72A-1 a 72A-3. Los detalles experimentales se encuentran en el Ejemplo 14.
Fig. 73: compara el desempeño de la sacarificación, en términos de las cantidades de glucosa o xilosa liberada, de composiciones enzimáticas producidas por la cepa integrada de T. reesei H3A y la cepa integrada H3A/Eg4 (cepa núm. 27), de conformidad con el Ejemplo 11.
Fig. 74: representa el cambio en porcentaje de la conversión de glucano y xilano en cantidades crecientes de una composición enzimática producida por la cepa integrada de T. reesei H3A/Eg4 (cepa núm. 27) , de conformidad con el Ejemplo 12.
Fig. 75: representa el efecto de la adición de Eg4 de T. reesei en la sacarificación de la mazorca de maíz pretratada con amoníaco diluido, de conformidad con el Ejemplo 13 parte A.
Fig. 76: representa la hidrólisis de CMC por medio de Eg4 de T. reesei, de conformidad con el Ejemplo 13 parte B.
Fig. 77: representa la hidrólisis de celobiosa por medio de Eg4 de T. reesei, de conformidad con el Ejemplo 13 parte C.
Fig. 78: representa un vector pENTR/D-TOPO con el marco de lectura abierto de Fv3C, tal como se describe en el Ejemplo 17.
Figs. 79A-79B: la Fig. 79A representa un vector de expresión pTrex6g, como en el Ejemplo 17; la Fig. 79B representa un constructo de pExpression pTrex6g/Fv3C, como en el Ejemplo 17.
La Fig. 80 representa la región codificante prevista de una secuencia de ADN genómico de Fv3C, tal como se describe en el Ejemplo 17.
Figs. 81A-81B: la Fig. 81A representa una secuencia de aminoácidos N-terminal de Fv3C. Las flechas muestran los sitios de clivaje de péptidos de señal supuestos. El inicio de la proteína madura aparece subrayado. La Fig. 81B representa un gel de SDS-PAGE de transformantes de T. reesei que expresan Fv3C a partir de los codones de iniciación anotados (1) y alternativos (2) , de conformidad con el Ejemplo 17.
Fig. 82: compara el desempeño de la celulasa completa y de mezclas de ß -glucosidasa en la sacarificación de la celulosa dilatada con ácido fosfórico a 50 °C. La celulasa completa a 10 mg de proteína/g de celulosa se mezcló con 5 mg/g de ß-glucosidasa y las mezclas enzimáticas se usaron para hidrolizar celulosa dilatada con ácido fosfórico a 0.7 % de celulosa, pH 5.0. La muestra marcada como fondo en la figura representa la conversión obtenida a partir de 10 mg/g de celulasa completa sola sin ß-glucosidasa añadida. Las reacciones se realizaron en placas de microtitulación a 50 °C por 2 h. Las muestras se probaron por triplicado, de conformidad con el Ejemplo 19, parte A.
Fig. 83: compara» el desempeño de la celulasa completa y de mezclas de ß-glucosidasa en la sacarificación del rastrojo de maíz pretratado con ácido (PCS, por sus siglas en inglés) a 50 °C. La celulasa completa a 10 mg de proteína/g de celulosa se mezcló con 5 mg/g de ß-glucosidasa y las mezclas enzimáticas se usaron para hidrolizar el PCS a 13 % de sólidos, pH 5.0. La muestra marcada como fondo representa la conversión obtenida a partir de 10 mg/g de celulasa completa sola sin ß-glucosidasa añadida. Las reacciones se realizaron en placas de microtitulación a 50 °C por 48 h. Las muestras se probaron por triplicado, de conformidad con el Ejemplo 19, parte B.
Fig. 84: compara el desempeño de la celulasa completa y de las mezclas de ß-glucosidasa en la sacarificación de la mazorca de maíz pretratada con amoníaco a 50 °C. La celulasa completa a 10 mg de proteína/g de celulosa se mezcló con 8 mg/g de hemicelulasas y 5 mg/g de ß-glucosidasa y las mezclas enzimáticas se usaron para hidrolizar la mazorca de maíz pretratada con amoníaco a 20 % de sólidos, pH 5.0. La muestra marcada como fondo representa la conversión obtenida a partir de 10 mg/g de celulasa completa + 8 mg/g de mezcla de hemicelulosa sola sin ß-glucosidasa añadida. Las reacciones se realizaron en placas de microtitulación a 50 °C por 48 h. Las muestras se ensayaron por triplicado, de conformidad con el Ejemplo 19, C parte.
Fig. 85: compara el desempeño de la celulasa completa y de las mezclas de ß-glucosidasa en la sacarificación de la mazorca de maíz pretratada con hidróxido de sodio (NaOH) a 50 °C. La celulasa completa a 10 mg de proteína/g de celulosa se mezcló con 5 mg/g de ß -glucosidasa y las mezclas enzimáticas se usaron para hidrolizar la mazorca de maíz pretratada con NaOH a 17 % de sólidos, pH 5.0. La muestra marcada como fondo representa la conversión obtenida a partir de 10 mg/g de mezcla de celulasa completa sola sin ß-glucosidasa añadida. Las reacciones se realizaron en placas de microtitulación a 50 °C por 48 h. Cada muestra se ensayó en 4 réplicas, de conformidad con el Ejemplo 19, parte D.
Fig. 86: compara el desempeño de la celulasa completa y de las mezclas de ß-glucosidasa en la sacarificación del césped de pradera pretratado con amoníaco diluido a 50 °C. La celulasa completa a 10 mg de proteína/g de celulosa se mezcló con 5 mg/g de ß-glucosidasa y las mezclas enzimáticas se usaron para hidrolizar el césped de pradera a 17 % de sólidos, pH 5.0. La muestra marcada como fondo representa la conversión obtenida a partir de 10 mg/g de mezcla de celulasa completa sola sin ß-glucosidasa añadida. Las reacciones se realizaron en placas de microtitulación a 50 °C por 48 h. Cada muestra se ensayó en 4 réplicas, de conformidad con el Ejemplo 19, parte E.
Fig. 87: compara el desempeño de la celulasa completa y de mezclas de ß-glucosidasa en la sacarificación del rastrojo de maíz AFEX a 50 °C. La celulasa completa a 10 mg de proteína/g de celulosa se mezcló con 5 mg/g de ß -glucosidasa y las mezclas enzimáticas se usaron para hidrolizar el rastrojo de maíz AFEX a 14 % de sólidos, pH 5.0. La muestra marcada como fondo representa la conversión obtenida a partir de 10 mg/g de mezcla de celulasa completa sola sin ß-glucosidasa añadida. Las reacciones se realizaron en placas de microtitulación a 50 °C por 48 h. Cada muestra se ensayó en 4 réplicas, de conformidad con el Ejemplo 19, parte F.
Figs . 88A-88C: representan el porcentaje de conversión de glucano a partir de la mazorca de maíz pretratada con amoníaco diluido a 20 % de sólidos en relaciones variables entre la ß-glucosidasa y la celulasa completa, en una cantidad entre 0 y 50 %. La dosificación de enzimas se mantuvo constante para cada experimento. La Fig. 88A representa el experimento realizado con Bgll de T. reesei. La Fig. 88B representa el experimento realizado con Fv3C. La Fig. 88C representa el experimento realizado con Bglu de A. niger (An3A) . Los detalles experimentales se encuentran en el Ejemplo 20 de la presente descripción.
La Fig. 89: representa el porcentaje de conversión de glucano a partir de la mazorca de maíz pretratada con amoníaco diluido a 20 % de sólidos por tres composiciones enzimáticas diferentes dosificadas en niveles de 2.5-40 mg/g de glucano, de conformidad con el Ejemplo 21. ? indica la conversión de glucano observada con Accellerase 1500 + xilanasa Multifect, 0 indica la conversión de glucano observada con una celulasa completa de la cepa integrada de T. reesei H3A, ? indica la conversión de glucano observada con una composición enzimática que comprende 75 % en peso de celulasa completa de la cepa integrada de T. reesei H3A más 25 % en peso de Fv3C.
Figs . 90A-90I: la Fig. 90A representa un mapa del plásmido de expresión de pRAX2-Fv3C usado para la expresión en A. niger, tal como se describe en el Ejemplo 22. La Fig. 90B representa el plásmido pENTR-TOPO-Bgll-943/942 , tal como se describe en el Ejemplo 2. La Fig. 90C representa el vector pTrex3g 943/942, tal como se describe en el Ejemplo 2. La Fig. 90D representa el plásmido pENTR/ T. reesei Xyn3 , tal como se describe en el Ejemplo 2. La Fig. 90E representa el vector de expresión pTrex3g/T. reesei Xyn3 , tal como se describe en el Ejemplo 2. La Fig. 90F representa el plásmido pENTR- Fv3A, tal como se describe en el Ejemplo 2. La Fig. 90G representa el vector de expresión pTrex6g/Fv3A, tal como se describe en el Ejemplo 2. La Fig. 90H representa el plásmido TOPO Blunt/Pegll-Fv43D, tal como se describe en el Ejemplo 2. La Fig. 901 representa el plásmido TOPO Blunt/Pegll-Fv51A, tal como se describe en el Ejemplo 2.
Fig. 91: representa un alineamiento de aminoácidos entre ß-xilosidasa de T. reesei y Fv3A.
Fig. 92: representa un alineamiento de secuencias de aminoácidos de ciertas ß-xilosidasas de GH39. Los residuos que aparecen en negrita y subrayado son el residuo basado en ácido general catalítico (marcado con "A" arriba del alineamiento) y el residuo de nucleófilos catalíticos (marcado con "N" arriba del alineamiento) previstos. Los residuos que aparecen subrayados en letra normal en la parte inferior de dos secuencias están dentro de 4Á del sustrato en los sitios activos de las estructuras 3D respectivas (pdb: luhv y 2bs9, respectivamente) . Los residuos que aparecen subrayados en la secuencia de Fv39A están previstos para estar dentro de 4Á de un sustrato unido en el sitio activo.
Figs. 93A-93B: representan un alineamiento de secuencias de aminoácidos de ciertas hidrolasa de la familia GH 3. Los residuos de aminoácidos conservados entre miembros de la familia aparecen subrayados y en negrita.
Fig. 94: representa un alineamiento de secuencias de aminoácidos de ciertas enzimas de la familia GH51. Los residuos de aminoácidos conservados entre miembros de la familia se muestran subrayados y en negrita.
Figs . 95A-95B: representan alineamientos de secuencias de aminoácidos de ciertas endoxilanasas de las familias GH10 y GH11. Fig. 95A: alineamiento de xilanasas de la familia GH10. Los residuos que aparecen subrayados y en negrita son los residuos de nucleófilos catalíticos (marcados con "N" arriba del alineamiento) . Fig. 95B: alineamiento de xilanasas de la familia GH11. Los residuos que aparecen subrayados y en negrita son los residuos de nucleófilos catalíticos y residuos de base ácida generales (marcados con UN" y "A" , respectivamente, arriba del alineamiento) .
Figs. 96A-96B: representan un alineamiento de secuencias de aminoácidos de una cantidad de hidrolasas de la familia GH3. Los residuos de aminoácidos altamente conservados entre miembros de la familia se muestran subrayados y en negrita.
Fig. 97: representa un alineamiento de secuencias de aminoácidos de dos hidrolasas de la familia GH30 de Fusarium representativas. Los residuos de aminoácidos que están conservados entre miembros de la familia se muestran subrayados y en negrita.
La Fig. 98 enumera una cantidad de motivos de secuencias de aminoácidos de endoglucanasas de GH61.
Figs . 99A-99C: la Fig. 99A ilustra una representación esquemática del gen que codifica el polipéptido quimérico/de fusión Fv3C/Bgl3 de T. reesei. Las Figs. 99B-1 a 99B-2 representan la secuencia de nucleótidos que codifica el polipéptido de fusión/quimérico Fv3C/Bgl3 de T. reesei (sec. con núm. de ident . :92) . La Fig. 99C representa la secuencia de aminoácidos que codifica el polipéptido de fusión/quimérico Fv3C/Bgl3 de T. reesei (sec. con núm. de ident. : 93) . La secuencia que aparece en negrita es una secuencia de Bgl3 de G. reesei. Los detalles experimentales se describen en el Ejemplo 23.
Fig. 100: es un mapa del plásmido de fusión pTTT-pyrG13 -Fv3C/Bgl3 como en el Ejemplo 23.
Figs. 101A-101B: la Fig. 101A representa la secuencia de nucleótidos que codifica la quimera Fv3C/Te3A/Bgl3 de T. reesei (sec. con núm. de ident. :92) ; la Fig. 101B representa la secuencia de aminoácidos que codifica la quimera Fv3C/Te3A/Bgl3 de T. reesei (sec. con núm. de ident. :95)
Figs. 102A-102B: Fig. 102A: es una tabla que enumera los motivos de secuencias de aminoácidos adecuados de un polipéptido de ß-glucosidasa que incluye, por ejemplo, variantes, mutantes o polipéptidos de fusión/quiméricos de estos. Fig. 102B: es una tabla que enumera los motivos de secuencias de aminoácidos usados para diseñar un híbrido/quimera del polipéptido de ß-glucosidasa .
Figs. 103A-103C: la Fig. 103A representa un plásraido de fusión pTTT-pyrG13 -FAB (es decir, quimera Fv3C/Te3A/Bgl3 ) ; la Fig. 103B representa un plásmido pCR-Blunt II-Pcbh2-xyn3 -terminador de cbhl; la Fig. 103C representa un plásmido pCR-Blunt Il-TOPO/Pegll-Egl4 -suc . Los detalles experimentales se encuentran en el Ejemplo 23.
La Fig. 104 representa y compara el desempeño de la sacarificación de transformantes en la mazorca de maíz pretratada con amoníaco diluido. Las cepas con conversiones de xilano y glucano adecuadas se seleccionaron para caracterización adicional, de conformidad con el Ejemplo 23.
Figs. 105A-105J: la Fig. 105A representa estructuras 3-D superpuestas de Fv3C y Te3A y Bgll de T. reesei, vistas desde un primer ángulo de modo que la estructura de "inserción 1" queda visible. La Fig. 105B representa las mismas estructuras superpuestas vistas desde un segundo ángulo de modo que la estructura de "inserción 2" queda visible. La Fig. 105C representa las mismas estructuras superpuestas vistas desde un tercer ángulo, de modo que la estructura de "inserción 3" queda visible. La Fig. 105D representa las mismas estructuras superpuestas vistas desde un cuarto ángulo de modo que la estructura de "inserción 4" queda visible. Las Figs. 105E-1 a 105E-2 son un alineamiento de secuencias de Bgll de T. reesei (Q12715_TRI) , Te3A (ABG2_T_eme) y Fv3C (FV3C) , marcadas con las inserciones 1-4, que son estructuras similares a un lazo. La Fig. 105F representa partes superpuestas de estructuras de Fv3C (gris claro), Te3A (gris oscuro) y Bgll de T. reesei (negro) lo que indica interacciones conservadas entre residuos W59/W33 y W355/W325 (Fv3C/Te3A) . La Fig. 105G representa partes superpuestas de estructuras de Fv3C (gris claro) , Te3A (gris oscuro) y Bgll de T. reesei (negro) lo que indica interacciones conservadas entre el primer par de residuos: S57/31 y N291/261 (Fv3C/Te3A) ; y entre el segundo grupo de residuos: Y55/29, P775/729 y A778/732 (Fv3C/Te3A) . La Fig. 105H representa partes superpuestas de estructuras Fv3C (gris oscuro) y Bgll de T. reesei (negro) que indican interacciones de enlace de hidrógeno de Fv3C a K162 con el átomo de oxígeno de la cadena principal de V409 en la "inserción 2", una interacción que está conservada en Te3A, pero que no se encuentra en Bgll de T. reesei. Las Figs . 1051 (a) -1051(b) representan sitios de glicosilación conservados dentro de la sec . con núm. de ident.: 201, compartidos entre Fv3C, Te3A y una ß-glucosidasa quimérica/híbrida de la sec. con núm. de ident. : 95, (a) representa la misma región superpuesta con Te3A (gris oscuro) y Bgll de T. reesei (negro) ; (b) representa la misma región superpuesta con la ß-glucosidasa quimérica/híbrida de la sec. con núm. de ident.: 95 (gris claro) , Te3A (gris oscuro) y Bgll de T. reesei (negro) . La flecha negra indica la estructura de lazo de la "inserción 3" en Te3A (presente, además, en la ß-glucosidasa híbrida de la sec . con núm. de ident . : 95), que parece enterrar los glicanos de glicosilación . La Fig. 105J representa partes superpuestas de estructuras de Fv3C (gris claro) , Te3A (gris oscuro) y Bgll de T. reesei (negro) , lo que indica que las interacciones conservadas entre residuos W386/355 interactúan con W95/68 (Fv3C/Te3A) de "inserción 2" de Fv3C y Te3A. Falta la interacción en Bgll de T. reesei.
Figuras 106A-106B: Figura 106A: representa una traza de
UPLC representativa de una composición enzimática tal como se describe en el Ejemplo 24. Fig. 106B: es una tabla que enumera las cantidades medidas de componentes enzimáticos de la composición enzimática en el mismo ejemplo.
Descripción Detallada de la Invención
Tradicionalmente, las enzimas se han clasificado por la especificidad del sustrato y los productos de reacción. En la era pregenómica, la función era considerada como la base más flexible (y, quizás, la más útil) para comparar enzimas y ensayos para varias actividades enzimáticas que se han desarrollado adecuadamente por muchos años y se obtuvo el conocido esquema de clasificación EC. En este esquema de clasificación, las celulasas y otras glicosil hidrolasas que actúan sobre los enlaces glicosídicos entre porciones de carbohidratos (o un carbohidrato y una porción distinta a un carbohidrato tal como ocurre en los derivados de nitrofenol-glicósido) se designan como EC 3.2.1.-, con el número final que indica el tipo exacto de enlace clivado. Por ejemplo, una celulasa de acción endo (1 , 4 - ß-endoglucanasa) se designa como EC 3.2.1.4. Con el advenimiento de proyectos de secuenciación de genoma muy difundidos, los datos de secuenciación han facilitado los análisis y la comparación de genes y proteínas relacionadas. Además, se ha cristalizado un número creciente de enzimas capaces de actuar sobre las porciones de carbohidratos (es decir, carbohidrasas) y se ha resuelto sus estructuras tridimensionales. Tales análisis han identificado familias distintas de enzimas con secuencia relacionada que contienen pliegues tridimensionales conservados que pueden preverse en base a su secuencia de aminoácidos. Además, se ha demostrado que las enzimas con los mismos pliegues tridimensionales o similares exhiben la misma estereoespecificidad de hidrólisis o similar, aun cuando catalizan reacciones diferentes (Henrissat et al., FEBS Lett 1998, 425(2): 352-4; Coutinho y Henrissat, Genetics, biochemistry and ecology of cellulose degradation, 1999, T. Kimura. Tokyo, Uni Publishers Co : 15-23.). Estos descubrimientos forman la base de una clasificación basada en la secuencia de módulos de carbohidrasas disponibles en la forma de una base de datos de internet, el servidor de enzimas carbohidrato activas (CAZy, por sus siglas en inglés), disponible en afmb.cnrs-mrs.fr/CAZY/index.html (Carbohydrate-active enzymes : an integrated datábase approach. Ver, Cantarel et al., 2009, Nucleic Acids Res. 37 (publicación de base de datos) :D233-38) .
CAZy define cuatro clases principales de carbohidrasas que pueden distinguirse por el tipo de reacción catalizada: glicosil hidrolasas (GH) , glicosiltransferasas (GT) , polisacárido liasas (PL) y carbohidrato esterasas (CE) . Las enzimas de la descripción son glicosil hidrolasas. Las GH son un grupo de enzimas que hidrolizan el enlace glicosídico entre dos carbohidratos o entre un carbohidrato y una porción distinta a un carbohidrato. Un sistema de clasificación para las glicosil hidrolasas agrupadas por similitud de secuencias ha permitido definir más de 85 familias diferentes. Esta clasificación está disponible en el sitio web de CAZy.
Las enzimas de la descripción pertenecen, entre otras, a las familias de glicosil hidrolasas 3, 10, 11, 30, 39, 43, 51 y/o 61.
La familia de enzimas glicósido hidrolasa 3 ("GH3") incluyen, por ejemplo, ß-glucosidasa (EC : 3.2.1.21) ; ß-xilosidasa (EC : 3.2.1.37) ; N-acetil ß-glucosaminidasa (EC : 3.2.1.52) ; glucano ß- 1 , 3 -glucosidasa (EC : 3.2.1.58 ) ; celodextrinasa (EC : 3.2.1.74) ; exo-1, 3-1, 4-glucanasa
(EC:3.2.1); y ß-galactosidasa (EC 3.2.1.23). Por ejemplo, las enzimas GH3 pueden ser las enzimas que tienen actividad de ß-glucosidasa, ß-xilosidasa, N-acetil ß-glucosaminidasa, glucano ß-l, 3-glucosidasa, celodextrinasa, exo-1, 3-1,4-glucanasa y/o ß-galactosidasa . Generalmente, las enzimas GH3 son proteínas globulares y pueden consistir de dos o más subdominios . Un residuo catalítico se ha identificado como un residuo de aspartato que en las ß-glucosidasas se encuentra en el tercer N-terminal del péptido y se asienta dentro del fragmento del aminoácido SDW (Li et al. 2001, Biochem. J. 355:835-840). La secuencia correspondiente en Bgll de T. reesei es T266D267W268 (contada a partir de la metionina en la posición inicial) y el residuo catalítico aspartato es el D267. La secuencia de hidroxilo/aspartato está conservada, además, en las ß -xilosidasas de GH3 probadas. Por ejemplo, la secuencia correspondiente en Bxll de T. reesei es S310D311 y la secuencia correspondiente en Fv3A es S290D291.
La familia de enzimas glicósido hidrolasa 39 ( "GH39" ) tienen actividad de a-L- iduronidasa (EC : 3.2.1.76) o ß-xilosidasa (EC : 3.2.1.37) . La estructura tridimensional de dos ß-xilosidasas de GH39, de T. saccharolyticum (núm. de registro en Uniprot P36906) y G.s stearothermophilus (núm. de registro en Uniprot Q9ZFM2) se ha resuelto (ver Yang et al. J. Mol. Biol. 2004, 335 (1) : 155-65 y Czjzek et al., J. Mol. Biol. 2005, 353 (4) : 838-46) . Las regiones más altamente conservadas en estas enzimas están en sus secciones N-terminal que tienen un pliegue en el barril TIM (a/ß) 8 TIM clásico con los dos ácidos glutámicos del sitio activo principal ubicados en los extremos C-terminal de las cadenas ß 4 (ácido/base) y 7 (nucleófilo) . Los residuos de Fv39A E168 y E272 están previstos para funcionar como un ácido catalítico-base y nucleófilo, respectivamente, en base a un alineamiento de secuencias de las ß-xilosidasas de GH39 de T. saccharolyticum y G. stearothermop ilus mencionadas anteriormente con Fv39A.
La familia de enzimas glicósido hidrolasa 43 ("GH43") incluye, por ejemplo, L-a-arabinofuranosidasa (EC 3.2.1.55); ß-xilosidasa (EC 3.2.1.37); endo-arabinanasa (EC 3.2.1.99); y/o galactana 1, 3^-galactosidasa (EC 3.2.1.145). Por ejemplo, las enzimas GH43 pueden tener actividad de L-a-arabinofuranosidasa , actividad de ß-xilosidasa, actividad de endo-arabinanasa y/o actividad de galactana 1,3-ß-galactosidasa . Las enzimas de la familia GH43 muestran una estructura similar a una hélice ß de cinco aspas. La estructura similar a una hélice se basa en repeticiones de cinco veces de aspas compuestas de ß-láminas de cuatro cadenas. La base general catalítica, tal como un aspartato, el ácido general catalítico, un glutamato y un aspartato que modula el pKa de la base general se identificaron a través de la estructura cristalina de CjAbn43A de C. japonicus y se confirmaron por medio de mutagénesis sitio dirigida (ver, Nurizzo et al. Nat . Struc . Biol . 2002, 9(9) 665-8). Los residuos catalíticos están dispuestos en tres bloques conservados expandidos ampliamente a través de la secuencia de aminoácidos (Pons et al. Proteínas: Structure, Function and Bioinformatics , 2004, 54:424-432). Entre las enzimas de la familia GH43 probadas para determinar las actividades útiles en la hidrólisis de biomasa, los residuos catalíticos previstos se muestran como los residuos subrayados y en negrita en las secuencias de las Figs. 93A-93B. La estructura cristalina de la xilosidasa de G. stearothermophylus (Brux et al. J. Mol. Bio.( 2006, 359:97-109) sugiere varios residuos adicionales que pueden ser importantes para la unión del sustrato en esta enzima. Dado que las preferencias de sustratos de las enzimas de la familia GH43 probadas para determinar la hidrólisis de biomasa eran diferentes, estos residuos no están completamente conservados en las secuencias alineadas en la Fig. 93. Sin embargo, entre las xilosidasas probadas, varios residuos conservados que contribuyen a la unión de sustratos, ya sea a través de interacción hidrófoba o a través de unión a hidrógeno, están conservados y se indican por medio de subrayado simple en las Figs. 93A-93B.
La familia de enzimas glicósido hidrolasa 51 ("GH51") tienen actividad de L-a-arabinofuranosidasa (EC 3.2.1.55) y/o endoglucanasa (EC 3.2.1.4). La estructura cristalina de alta resolución de una L-a-arabinofuranosidasa de GH51 de T-6 de G.s stearothermophilus muestra que la enzima es un hexámero, con cada monómero organizado en dos dominios: un (ß/ ) de 8 barriles y un sándwich ß de 12 cadenas con topología de remolino (ver, Hóvel efc al. EMBO J. 2003, 22 (19) :4922-4932) . Se puede esperar que los residuos catalíticos sean acídicos y que estén conservados entre secuencias de enzimas de la familia. Cuando las secuencias de aminoácidos de Fv51A, Pf51A y Pa51A se alinean con enzimas de GH51 de la secuencia más diversa, 8 residuos acídicos se mantienen conservados. Estos aparecen subrayados y en negrita en la Fig. 94.
La familia de enzimas glicósido hidrolasa 10 ("GH10") tiene, además, una estructura (ß/ ) de 8 barriles. Se hidrolizan en forma endo con un mecanismo de retención que usa por lo menos un residuo catalítico acídico en un proceso de catálisis, generalmente, de ácido/base (Pell et al., J. Biol. Chem., 2004, 279(10): 9597-9605). Se han resuelto las estructuras cristalinas de las xilanasas de GH10 de P. simplicissimum (Uniprot P56588) y T. aurantiacus (Uniprot P23360) complejadas con sustratos en los sitios activos (ver, Schmidt et al. Biochem. , 1999, 38:2403-2412; y Lo Leggio et al. FEBS Lett . 2001, 509: 303-308). Los residuos de Xyn3 de T. reesei importantes para la unión y catálisis de sustratos pueden derivarse de un alineamiento con las secuencias de las xilanasas de GH10 de P. simplicissimum y T. aurantiacus mencionadas anteriormente (Fig. 95A) . El residuo de Xyn3 de T. reesei E282 está previsto para ser el residuo nucleofílico catalítico, mientras que los residuos E91, N92, K95, Q97, S98, H128, W132, Q135, N175, E176, Y219, Q252, H254, 312 y/o W320 están previstos para estar involucrados en la unión y/o catálisis del sustrato.
Las enzimas de la familia glicósido hidrolasa 11
( "GH11" ) tienen una estructura ß de brazo de gitano. Se hidrolizan en forma endo con un mecanismo de retención que usa por lo menos un residuo catalítico acídico en un proceso de catálisis, generalmente, de ácido/base. Otros diversos residuos expandidos en toda su estructura pueden contribuir a estabilizar las unidades de xilosa en el sustrato adyacente al par de monómeros de xilosa que se clivan por hidrólisis. Se probó tres endoxilanasas de la familia GH11 y sus secuencias están alineadas en la Fig. 95B. E118 (o E86 en el Xyn2 de T. reesei maduro) y E209 (o E177 en el Xyn2 de T. reesei) se han identificado como residuos generales de ácido/base y nucleófilos catalíticos en Xyn2 de G. reesei, respectivamente (ver, Havukainen et al. Biochem. , 1996, 35 : 9617-24) .
Las enzimas de la familia glicósido hidrolasa 30
( "GH30" ) son enzimas de retención que tienen actividad de glucosilceramidasa (EC 3.2.1.45); ß - 1 , 6 -glucanasa (EC 3.2.1.75); ß-xilosidasa (EC 3.2.1.37); ß-glucosidasa (3.2.1.21). La primera estructura cristalina de GH30 era la ß-glucocerebrosidasa humana relacionada con la enfermedad de Gaucher resuelta por Grabowski , et al. (Crit Rev Biochem Mol Biol 1990; 25(6) 385-414). GH30 tiene un pliegue ( /ß)8 del barril de TIM con los dos ácidos glutámicos del sitio activo principal ubicados en los extremos C-terminal de las cadenas ß 4 (ácido/base) y 7 (nucleófilo) (Henrissat B, et al. Proc Nati Acad Sci U S A, 92 (15) : 7090-4 , 1995; Jordán et al., Applied Microbiol Biotechnol, 86:1647, 2010). El glutamato 162 de Fv30A está conservado en 14 de 14 proteínas de GH30 alineadas (13 proteínas bacterianas y una endo-b-xilanasa de los hongos Biospora con el núm. de registro ADG62369) y el glutamato 250 de Fv30A está conservado en 10 de estas y es un aspartato en otras tres y no acídico en una de ellas. Otros residuos acídicos están moderadamente conservados, pero otros no están tan ampliamente conservados.
Las enzimas glicósido hidrolasa 61 ("GH61") se han identificado en Eukaryota. Un actividad endo-glucanasa débil se ha observado para Cel61A de H. jecorina (Karlsson et al, Eur J Biochem, 2001, 268 (24 ): 6498 -6507 ) . Los polipéptidos de GH61 potencian la hidrólisis enzimática de sustratos lignocelulósicos por parte de celulasas (Harris et al, 2010, Biochemistry, 49 (15) , 3305-16) . Los- estudios sobre polipéptidos homólogos implicados en la degradación de quitina prevén que los polipéptidos de GH61 usan un mecanismo de hidrólisis oxidativa que requiere un sustrato dador de electrones y en el cual están implicados los iones de metales divalentes (Vaaj e-Kolstad, 2010, Science, 330(6001), 219-22). Esto concuerda con la observación de que el efecto sinérgico de los polipéptidos de GH61 en la degradación del sustrato lignocelulósico depende de los iones divalentes (Harris et al, 2010, Biochemistry, 49(15), 3305-16). Además, las estructuras de polipéptidos de GH61 disponibles tienen átomos divalentes unidos por un número de residuos de aminoácidos totalmente conservados (Karkehabadi , 2008, J. Mol. Biol . , 383(1), 144-54; Harris et al, 2010, Biochemistry, 49 (15) , 3305-16) . Los polipéptidos de GH61 tienen una estructura plana en el sitio de unión a metales que se forma por los residuos conservados y que podría estar involucrada en la unión de sustratos (Karkehabadi, 2008, J. Mol. Biol., 383 (1) , 144-54) .
El término "aislado", como se usa en la presente descripción con respecto a ácidos nucleicos, tal como ADN o ARN, se refiere a moléculas separadas de otros ADN o ARN, respectivamente, que están presentes en la fuente natural del ácido nucleico. Además, un "ácido nucleico aislado" se usa de modo que incluye fragmentos de ácido nucleico que no son fragmentos de origen natural y que podrían no encontrarse en estado natural. El término "aislado", cuando se usa con respecto a polipéptidos, se refiere a los polipéptidos aislados de otras proteínas celulares o a polipéptidos purificados y recombinantes . El término "aislado" se refiere, además, a un ácido nucleico o péptido que está prácticamente libre de material celular, material viral o medio de cultivo cuando se produce por técnicas de ADN recombinante . El término "aislado", como se usa en la presente descripción, se refiere, además, a un ácido nucleico o péptido que está prácticamente libre de precursores químicos u otros químicos cuando se sintetiza químicamente.
A menos que se defina de otra manera, todos los términos técnicos y científicos usados en la presente descripción tienen el mismo significado que comprende comúnmente una persona con experiencia en la técnica a la que pertenece la presente invención. Singleton, et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY, 2nd ED . , John iley and Sons, New York (1994) y Hale & Marham, THE HARPER COLLINS DICTIONARY OF BIOLOGY, Harper Perennial, N.Y. (1991) proporcionan al experto en la técnica un diccionario general de muchos de los términos usados en esta invención. Aunque cualquier método y material similar o equivalente a los descritos en la presente descripción puede usarse en la práctica o pruebas de la presente invención, se describen los métodos y materiales preferidos. Los intervalos numéricos son inclusivos de los números que definen el intervalo. Se entenderá que esta invención no se limita a la metodología, protocolos y reactivos particulares descritos ya que estos pueden variar.
Los encabezados proporcionados en la presente descripción no son limitaciones de los diversos aspectos o modalidades de la invención que se pueden tomar como referencia para la descripción general. Por lo tanto, los términos definidos inmediatamente más abajo, se definen completamente como referencia para la descripción en general.
La descripción proporciona composiciones que comprenden un polipéptido que tiene actividad de la familia de glicosil hidrolasa 61 ( "GH61" ) /endoglucanasa, nucleótidos que codifican un polipéptido proporcionado, vectores que contienen un nucleótido proporcionado y células que contienen un nucleótido y/o vector proporcionado. La descripción proporciona, además, métodos para hidrolizar un material de biomasa y/o reducir la viscosidad de una mezcla de biomasa con el uso de una composición proporcionada.
Como se usa en la presente descripción, una "variante" del polipéptido X se refiere a un polipéptido que tiene la secuencia de aminoácidos del polipéptido X en la cual uno o más residuos de aminoácidos están alterados. La variante puede tener cambios conservativos o no conservativos. La guía para determinar qué residuos de aminoácidos pueden sustituirse, insertarse o eliminarse sin afectar la actividad biológica puede encontrarse con el uso de programas de computadora muy conocidos en la técnica, por ejemplo, el programa LASERGENE (DNASTAR) . Una variante de la invención incluye polipéptidos que comprenden secuencias de aminoácidos alteradas en comparación con una secuencia de aminoácidos de enzimas precursoras, en donde la enzima variante retiene la naturaleza celulósica característica de la enzima precursora, pero puede tener propiedades alteradas en algunos aspectos específicos, por ejemplo, un pH óptimo incrementado o reducido, una estabilidad oxidativa incrementada o reducida; una estabilidad térmica incrementada o reducida y un nivel incrementado o reducido de actividad específica hacia uno o más sustratos, en comparación con la enzima precursora.
El término "variante" , cuando se usa en el contexto de una secuencia de polinucleótidos, puede abarcar una secuencia de polinucleótidos relacionada con la de un gen o la secuencia codificante de este. Esta definición puede incluir, además, por ejemplo, variantes "alélicas", "de empalme", "de especies" o "polimórficas" . Una variante de empalme puede tener una identidad significativa con respecto a un polinucleótido de referencia, pero, generalmente, tendrá una cantidad mayor o menor de residuos debido al empalme alternativo de exones durante el procesamiento de AR m. El polipéptido correspondiente puede poseer dominios funcionales adicionales o puede carecer de dominios. Las variantes de especies son secuencias de polinucleótidos que varían entre una especie y otra. Los polipéptidos resultantes tendrán, generalmente, una identidad de aminoácidos significativa con respecto al otro. Una variante polimórfica es una variación en la secuencia de polinucleótidos de un gen particular entre individuos de una especie determinada.
Como se usa en la presente descripción, un "mutante" del polipéptido X se refiere a un polipéptido, en donde uno o más residuos de aminoácidos han pasado por una sustitución de aminoácidos mientras retenían la actividad enzimática nativa (es decir, la capacidad para catalizar ciertas reacciones de hidrólisis). Como tal, un polipéptido X mutante constituye un tipo particular del polipéptido X, tal como se define el término en la presente descripción. Los polipéptidos X imitantes se pueden producir por la sustitución de uno o más aminoácidos en la secuencia de aminoácidos nativa o silvestre del polipéptido. En algunos aspectos, la invención incluye polipéptidos que comprenden secuencias de aminoácidos alteradas en comparación con una secuencia de aminoácidos de enzimas precursoras, en donde la enzima mutante retiene la naturaleza celulolítica o hemicelulolítica característica de la enzima precursora, pero puede tener propiedades alteradas en algunos aspectos específicos, por ejemplo, un pH óptimo incrementado o reducido, una estabilidad oxidativa incrementada o reducida; una estabilidad térmica incrementada o reducida y un nivel incrementado o reducido de actividad específica hacia uno o más sustratos, en comparación con la enzima precursora. La guía para determinar qué residuos de aminoácidos pueden sustituirse, insertarse o eliminarse sin afectar la actividad biológica puede encontrarse con el uso de programas de computadora muy conocidos en la técnica, por ejemplo, el programa LASERGENE (DNASTAR) . Las sustituciones de aminoácidos pueden ser conservativas o no conservativas y tales residuos de aminoácidos sustituidos pueden ser o no un residuo de aminoácidos codificado por el código genético. Las sustituciones de aminoácidos pueden estar ubicadas en los dominios de unión a carbohidratos (CBM) del polipéptido, en los dominios catalíticos (CD) del polipéptido y/o en los CBM y los CD. El "alfabeto" de veinte aminoácidos estándar se ha dividido en familias químicas basadas en la similitud de sus cadenas laterales. Estas familias incluyen aminoácidos con cadenas laterales básicas (por ejemplo, lisina, a ginina, histidina) , cadenas laterales acídicas (por ejemplo, ácido aspártico, ácido glutámico) , cadenas laterales polares sin carga (por ejemplo, glicina, asparagina, glutamina, serina, treonina, tirosina, cisteína) , cadenas laterales no polares (por ejemplo, alanina, valina, leucina, isoleucina, prolina, fenilalanina, metionina, triptófano) , cadenas laterales beta-ramificadas (por ejemplo, treonina, valina, isoleucina) y cadenas laterales aromáticas (por ejemplo, tirosina, fenilalanina, triptófano, histidina) . Una "sustitución de aminoácidos conservativa" es aquella en la cual el residuo de aminoácidos se reemplaza con un residuo de aminoácidos que tiene una cadena lateral químicamente similar (es decir, reemplaza un aminoácido que tiene una cadena lateral básica con otro aminoácido que tiene una cadena lateral básica) . Una "sustitución de aminoácido no conservativa" es aquella en la cual el residuo de aminoácidos se reemplaza con un residuo de aminoácidos que tiene una cadena lateral químicamente diferente (es decir, reemplaza un aminoácido que tiene una cadena lateral básica con otro aminoácido que tiene una cadena lateral aromática) .
Como se usa en la presente descripción, un polipéptido o ácido nucleico que es "heterólogo" a una célula huésped se refiere a un polipéptido o ácido nucleico que no se produce de manera natural en una célula huésped.
La referencia a "aproximadamente" un valor o parámetro en la presente descripción incluye (y describe) variaciones dirigidas a ese valor o parámetro propiamente el. Por ejemplo, la descripción que indica "aproximadamente X" incluye la descripción de "X" .
Como se usa en la presente descripción y en las reivindicaciones anexas, las formas singulares "un/una" y "el/la" incluyen los referentes en plural a menos que el contexto indique claramente lo contrario.
Se entiende que los aspectos y variaciones de los métodos y composiciones descritas en la presente descripción incluyen los aspectos y variaciones "que consiste en" y/o "que consiste prácticamente en" . El término "que comprende" es más amplio que los términos "que consiste en" o "que consiste prácticamente en" .
Como se usa en la presente descripción, el término "unida operativamente" significa que la secuencia de nucleótidos seleccionada (por e emplo, que codifica un polipéptido descrito en la presente descripción) está próxima a una secuencia reguladora, por ejemplo, un promotor, para permitir que la secuencia regule la expresión del ADN seleccionado. Por ejemplo, el promotor se ubica corriente arriba de la secuencia de nucleótidos seleccionada en términos de la dirección de transcripción y traducción. "Unida operativamente" significa que una secuencia de nucleótidos y una o más secuencias reguladoras están conectadas de tal manera que permiten la expresión génica cuando las moléculas apropiadas {por ejemplo, proteínas activadoras de transcripción) están unidas a la secuencia o secuencias reguladoras.
Como se usa en la presente descripción, el término "se híbrida en condiciones de rigurosidad baja, de rigurosidad media, de rigurosidad alta o de rigurosidad muy alta" describe condiciones para hibridación y lavado. La guía para realizar reacciones de hibridación puede encontrarse en Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989) , 6.3.1 - 6.3.6. Los métodos acuosos y no acuosos se describen en esa referencia y se puede usar cualquier método. Las condiciones de hibridación específicas mencionadas en la presente descripción son las siguientes: 1) condiciones de hibridación de rigurosidad baja en cloruro de sodio 6X/citrato de sodio (SSC) a aproximadamente 45 °C, seguido de dos lavados en SSC 0.2X, SDS al 0.1 % por lo menos a 50 °C (la temperatura de los lavados se puede incrementar a 55 °C para condiciones de rigurosidad baja) ; 2) condiciones de hibridación de rigurosidad media en SSC 6X a aproximadamente 45 °C, seguido de uno o más lavados en SSC 0.2X, SDS al 0.1 % a 60 °C; 3) condiciones de hibridación de rigurosidad alta en SSC 6X a aproximadamente 45 °C, seguido de uno o más lavados en SSC 0.2.X, SDS al 0.1 % a 65 °C; y, preferentemente, 4) condiciones de hibridación de rigurosidad muy alta son fosfato de sodio 0.5M, SDS al 7 % a 65 °C, seguido de uno o más lavados a SSC 0.2X, SDS al 1 % a 65 °C. Las condiciones de rigurosidad muy alta (4) son las condiciones preferidas a menos que se especifique lo contrario. 5.1 Polipéptidos de la descripción
La descripción proporciona polipéptidos aislados, sintéticos o recombinantes que comprenden una secuencia de aminoácidos que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a cualquiera de las sec . con núms . de ident . : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o en el dominio catalítico (CD) de longitud completa o el dominio de unión a carbohidratos (CBM) de longitud completa. Los polipéptidos aislados, sintéticos o recombinantes pueden tener actividad de ß-glucosidas . En ciertas modalidades, los polipéptidos aislados, sintéticos o recombinantes son polipéptidos de ß -glucosidasa que incluyen, por ejemplo, variantes, mutantes y polipéptidos de ß-glucosidasa híbridos/quiméricos. En ciertas modalidades, la descripción proporciona un polipéptido que tiene actividad de ß -glucosidasa que es un híbrido/quimera de dos o más secuencias de ß-glucosidasa, en donde la primera de las dos o más secuencias de ß-glucosidasa tiene una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 250, 300, 350, 400 o 500) residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec . con núms . de ident . : 96-108, la segunda de las dos o más secuencias de ß-glucosidasa tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 125, 150, 175 o 200) residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms . de ident . : 109-116. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 197-202 y la segunda de las dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende sec. con núm. de ident. :203. En algunas modalidades, la primera secuencia está en el N-terminal del polipéptido de ß-glucosidasa quimérico/híbrido, mientras que la segunda secuencia está en el C-terminal del polipéptido de ß-glucosidasa quimérico/híbrido. En algunas modalidades, la primera secuencia está conectada por su C-terminal a la segunda secuencia por su N-terminal. Por ejemplo, la primera secuencia está inmediatamente adyacente o conectada directamente a la segunda secuencia. Alternativamente, la primera secuencia no está inmediatamente adyacente a la segunda secuencia, más bien la primera y la segunda secuencia están conectadas a través de un dominio conector. En ciertas modalidades, la primera secuencia, la segunda secuencia o ambas secuencias comprenden 1 o más sitios de glicosilación . En algunas modalidades, la primera o la segunda secuencia comprende una secuencia de bucle o una secuencia que codifica una estructura similar a un bucle. En ciertas modalidades, la secuencia de bucle tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident.:205). En ciertas modalidades, ni la primera ni la segunda secuencia comprende una secuencia de bucle, más bien el dominio conector que conecta la primera y la segunda secuencia comprende esa secuencia de bucle. El polipéptido de ß-glucosidasa híbrido/quimérico tiene una estabilidad mejorada en comparación con la ß-glucosidasa equivalente a partir de la cual se deriva la primera secuencia, la segunda secuencia o la secuencia del dominio conector. En algunas modalidades, la estabilidad mejorada es una estabilidad proteolítica o resistencia al clivaje proteolítico mejorada durante el almacenamiento en condiciones de almacenamiento estándar o durante la expresión y/o producción, en condiciones de expresión/producción estándar, por ejemplo, a partir del clivaje proteolítico en un residuo en la secuencia de bucle o en un residuo que está fuera de la secuencia de bucle.
En ciertos aspectos, la descripción proporciona un polipéptido de ß-glucosidasa aislado, sintético o recombinante que es un híbrido de por lo menos 2 (por ejemplo, 2, 3 o incluso 4) secuencias de ß -glucosidasa , en donde la primera de por lo menos 2 secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 250, 300, 350 o 400) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que cualquiera de las sec. con núms . de ident . : 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, mientras que la segunda de por lo menos 2 secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 125, 150 o 200) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que la sec. con núm. de ident. :60. La descripción proporciona, además, un polipéptido aislado, sintético o recombinante que tiene actividad de ß-glucosidasa que es un híbrido de por lo menos 2 (por ejemplo, 2, 3 o incluso 4) secuencias de ß-glucosidasa , en donde la primera de por lo menos 2 secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % de identidad con respecto a una secuencia de la misma longitud que la sec. con núm. de ident. :60, mientras que la segunda de por lo menos 2 secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % de identidad con respecto a una secuencia de la misma longitud que cualquiera de las sec. con núms. de ident.: 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 197-202 y la segunda de las dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende sec. con núm. de ident. :203. En algunas modalidades, la primera secuencia está en el N-terminal del polipéptido de ß-glucosidasa quimérico o híbrido, mientras que la segunda secuencia está en el C-terminal del polipéptido de ß-glucosidasa quimérico o híbrido. En algunas modalidades, la primera secuencia está conectada por su C-terminal a la segunda secuencia por su N-terminal, por ejemplo, la primera secuencia está adyacente o conectada directamente a la segunda secuencia. Alternativamente, la primera secuencia no está adyacente a la segunda secuencia, más bien la primera secuencia está conectada a la segunda secuencia a través de un dominio conector. La primera secuencia, la segunda secuencia o la primera y la segunda secuencia pueden comprender 1 o más sitios de glicosilación . La primera o la segunda secuencia pueden comprender una secuencia de bucle o una secuencia que codifica una estructura similar a un bucle, derivada de un tercer polipéptido de -glucosidasa que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos y que comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205). En ciertas modalidades, ni la primera ni la segunda secuencia comprende una secuencia de bucle, más bien el dominio conector que conecta la primera y la segunda secuencia comprende esa secuencia de bucle. En algunas modalidades, el polipéptido de ß-glucosidasa híbrido/quimérico tiene una estabilidad mejorada en comparación con el polipéptido de ß-glucosidasa equivalente a partir del cual se deriva la primera secuencia, la segunda secuencia o la secuencia del dominio conector. En algunas modalidades, la estabilidad mejorada es una estabilidad proteolítica mejorada por la cual el polipéptido de fusión/quimérico es menos sensible al clivaje proteolítico en un residuo de la secuencia de bucle o en un residuo o posición que está fuera de la secuencia de bucle, durante el almacenamiento en condiciones de almacenamiento estándar o durante la expresión y/o producción, en condiciones de expresión/producción estándar.
En ciertos aspectos, la descripción proporciona un polipéptido de ß-glucosidasa de fusión/quimérico derivado de 2 o más secuencias de ß-glucosidasa, en donde la primera secuencia se deriva de Fv3C y tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y la segunda secuencia se deriva de Bgl3 de T. reesei (o "Tr3B") y tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos. En algunas modalidades, el C-terminal de la primera secuencia está conectado al N-terminal de la segunda secuencia de modo que la primera secuencia está inmediatamente adyacente o conectada directamente a la segunda secuencia. Alternativamente, la primera secuencia está conectada a la segunda secuencia a través de un dominio conector. En algunas modalidades, la primera o la segunda secuencia comprende una secuencia de bucle derivada de un tercer polipéptido de ß-glucosidasa que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos y que comprende una secuencia de aminoácidos de FD RSPG (sec. con núm. de ident.:204) o de FD (R/K) Y IT (sec. con núm. de ident . :205) . En ciertas modalidades, el dominio conector que conecta la primera y la segunda secuencia comprende la secuencia de bucle. En ciertas modalidades, la secuencia de bucle se deriva de Te3A. En algunas modalidades, el polipéptido de ß-glucosidasa de fusión/quimérico tiene una estabilidad mejorada en comparación con el polipéptido de ß-glucosidasa equivalente a partir del cual se deriva cada parte quimérica, por ejemplo, con respecto al de Fv3C, Te3A y/o Tr3B. En algunas modalidades, la estabilidad mejorada es una estabilidad proteolítica mejorada por la cual el polipéptido de fusión/quimérico es menos sensible al clivaje proteolítico en un residuo de la secuencia de bucle o en un residuo o posición que está fuera de la secuencia de bucle, durante el almacenamiento en condiciones de almacenamiento estándar o durante la expresión y/o producción, en condiciones de expresión/producción estándar. Por ejemplo, el polipéptido de fusión/quimérico es menos sensible al clivaje proteolítico en un residuo corriente arriba del C-terminal de la secuencia de bucle en comparación con un polipéptido de Fv3C en la misma posición, por ejemplo, cuando se alinean las secuencias de la quimera y los polipéptidos de Fv3C.
La descripción proporciona, además, polipéptidos aislados, sintéticos o recombinantes que tienen actividad de ß -glucosidasa que comprenden una secuencia de aminoácidos que tiene por lo menos aproximadamente 60 % {por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 , 97 %, 98 %, 99 % o 100 %) de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 o en el dominio catalítico (CD) de longitud completa o el dominio de unión a carbohidratos (CBM) de longitud completa.
En algunos aspectos, la descripción proporciona polipéptidos aislados, sintéticos o recombinantes que comprenden una secuencia de aminoácidos que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %,
91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % O 100 %) de identidad con respecto a cualquiera de las sec. con núms. de ident.: 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o en el dominio catalítico (CD) de longitud completa o el dominio de unión a carbohidratos (CBM) . En ciertas modalidades, los polipéptidos aislados, sintéticos o recombinantes tienen actividad de GH6l/endoglucanasa . La descripción proporciona, además, polipéptidos aislados, sintéticos o recombinantes que comprenden una secuencia de aminoácidos con una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 100, 150, 200, 250 o 300) residuos de aminoácidos que comprenden uno o más motivos de secuencias seleccionados del grupo que consiste en (1) las sec. con núms . de ident . : 84 y 88; (2) las sec. con núms. de ident. :85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec. con núm. de ident. :87; (5) las sec. con núms. de ident. :84, 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident.: 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec . con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. En ciertas modalidades, el polipéptido es un polipéptido de endoglucanasa de GH61, por ejemplo, un polipéptido de EG IV de un microorganismo adecuado, tal como Eg4 de T. reesei) . En algunas modalidades, el polipéptido de endoglucanasa de GH61 es un polipéptido variante, mutante o de fusión derivado de Eg4 de T. reesei {por ejemplo, un polipéptido que comprende por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la sec. con núm. de ident. :52) .
La descripción proporciona, además, un polipéptido aislado, sintético o recombinante que tiene por lo menos aproximadamente 70 %, por ejemplo, por lo menos aproximadamente 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % o total (100 %) de identidad con respecto a un polipéptido de cualquiera de las sec. con núms . de ident.:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 43 y 45 en una región de por lo menos aproximadamente 10, por ejemplo, por lo menos aproximadamente 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325 o 350 residuos o en el polipéptido inmaduro de longitud completa, el polipéptido maduro de longitud completa, el dominio catalítico (CD) de longitud completa o el dominio de unión a carbohidratos (CBM) .
La descripción proporciona, en algunos aspectos, nucleótidos aislados, sintéticos o recombinantes que codifican un polipéptido de ß-glucosidasa que tiene por lo menos 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o en el dominio catalítico (CD) de longitud completa o el dominio de unión a carbohidratos (CBM) . En algunas modalidades, el nucleótido aislado, sintético o recombinante codifica un polipéptido de fusión/quimérico que tiene actividad de ß-glucosidasa que comprende una primera secuencia con una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 250, 300, 350, 400 o 500) residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec . con núms . de ident.: 96-108, una segunda secuencia que tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 125, 150, 175 o 200) residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 109-116. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 197-202 y la segunda de las dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident. :203. En ciertas modalidades, el C-terminal de la primera secuencia está conectado al N-terminal de la segunda secuencia. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasa se conectan a través de un dominio conector que puede comprender una secuencia de bucle, que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos y se deriva de un tercer polipéptido de ß-glucosidasa que comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205).
En ciertos aspectos, la descripción proporciona un nucleótido aislado, sintético o recombinante que codifica un polipéptido de ß-glucosidasa que es un híbrido de por lo menos 2 (por ejemplo, 2, 3 o incluso 4) secuencias de ß-glucosidasa, en donde la primera secuencia de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 250, 300, 350 o 400) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que cualquiera de las sec. con núms . de ident . : 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, mientras que la segunda secuencia de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 125, 150 o 200) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que la sec. con núm. de ident.:60. La descripción proporciona, además, un nucleótido aislado, sintético o recombinante que codifica un polipéptido que tiene actividad de ß-glucosidasa que es un híbrido o fusión de por lo menos 2 (por ejemplo, 2, 3 o incluso 4) secuencias de ß-glucosidasa , en donde la primera secuencia es una secuencia que tiene una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 250, 300, 350 o 400) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 , 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que la sec. con núm. de ident.:60, mientras que la segunda secuencia es una secuencia que tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 125, 150 o 200) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que cualquiera de las sec . con núms . de ident . : 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 197-202 y la segunda de las dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident.: 203. En algunas modalidades, el nucleótido codifica una primera secuencia de aminoácidos que está en el N-terminal del polipéptido de ß-glucosidasa quimérico/de fusión y una segunda secuencia de aminoácidos que está en el C-terminal del polipéptido de ß-glucosidasa quimérico/de fusión, en donde el C-terminal de la primera secuencia está conectado al N-terminal de la segunda secuencia. Alternativamente, la primera secuencia está conectada a la segunda secuencia a través de un dominio conector. En algunas modalidades, la primera secuencia de aminoácidos, la segunda secuencia de aminoácidos o el dominio conector comprende una secuencia de aminoácidos que comprende una secuencia que representa una estructura similar a un bucle derivada de un tercer polipéptido de ß-glucosidasa que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos y que comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205).
En algunos aspectos, la descripción proporciona nucleótidos aislados, sintéticos o recombinantes que tienen por lo menos 60 % (por ejemplo, por lo menos aproximadamente
60 65 70 %, 75 %, 80 %, 85 %, 90 % , 91 %, 92 %, 93 %,
94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a cualquiera de las sec. con núms . de ident . : 52, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 92 o 94 o con respecto a un fragmento de estos que tiene una longitud de por lo menos aproximadamente 300 (por ejemplo, por lo menos aproximadamente 300, 400, 500 o 600) residuos. En ciertas modalidades, la descripción proporciona nucleótidos aislados, sintéticos o recombinantes capaces de hibridarse a cualquiera de las sec. con núms. de ident.: 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 92 o 94, a un fragmento con una longitud de por lo menos aproximadamente 300 residuos o a un complemento de estas, en condiciones de rigurosidad baja, rigurosidad media, rigurosidad alta o rigurosidad muy alta.
La descripción proporciona, además, en ciertos aspectos, un nucleótido aislado, sintético o recombinante que codifica un polipéptido que tiene actividad de GH61/endoglucanasa que comprende una secuencia de aminoácidos que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a cualquiera de las sec. con núms . de ident . : 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 {por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o en el dominio catalítico (CD) de longitud completa o el dominio de unión a carbohidratos (CBM) . En algunas modalidades, la descripción proporciona un aislado, sintético o recombinante que codifica un polipéptido que comprende una secuencia de aminoácidos con una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 100, 150, 200, 250 o 300) residuos de aminoácidos que comprenden uno o más motivos de secuencias seleccionados del grupo que consiste en (1) las sec. con núms. de ident. : 84 y 88; (2) las sec. con núms. de ident. :85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec. con núm. de ident. :87; (5) las sec. con núms. de ident..-84, 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident. : 84, 88 y 90; (8) las sec. con núms. de ident. : 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec . con núms . de ident. : 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88,
89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. En ciertas modalidades, el polinucleótido es un polinucleótido que codifica un polipéptido que tiene por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %,
90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la sec. con núm. de ident. :52. En algunas modalidades, el polinucleótido codifica un polipéptido de endoglucanasa de GH61 (por ejemplo, un polipéptido de de EG IV de un organismo adecuado, tal como, sin limitarse a, Eg4 de T. reesei) .
En algunos aspectos, la descripción proporciona un polinucleótido aislado, sintético o recombinante que codifica un polipéptido que tiene por lo menos aproximadamente 70 %, (por ejemplo, por lo menos aproximadamente 71 %, 72 %, 73 %,
74 %, 75 %, 76 %, 77 %, 78 %, 79 o / 80 %, 81 %, 82 % , 83 %,
84 %, 85 %, 86 87 %, 88 % , 89 o. 90 %, 91 %, 92 % , 93 o
° /
94 o
¦o / 95 0
o / 96 %, 97 %, 98 % o 99 *o o total (100 %) ) de identidad con respecto a un polipéptido de cualquiera de las sec. con núms. de ident . : 2 , 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 43 y 45 en una región de por lo menos aproximadamente 10, por ejemplo, por lo menos aproximadamente 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325 o 350 residuos o en el polipéptido inmaduro de longitud completa, polipéptido maduro, dominio catalítico (CD) o dominio de unión a carbohidratos (CBM) . En algunos aspectos, la descripción proporciona un polinucleótido aislado, sintético o recombinante que tiene por lo menos aproximadamente 70 % (por ejemplo, por lo menos aproximadamente 71 ¾, 72 % , 73 %, 74 %, 75 %, 76 77 %,
78 %, 79 %, 80 %, 81 % , 82 % , 83 % / 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %,
98 % o 99 % o total (100 %) ) de identidad con respecto a cualquiera de las sec . con núms . de ident . : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 y 41 o con respecto a un fragmento de estas que tiene una longitud de por lo menos aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 residuos. En algunas modalidades, la descripción proporciona un polinucleótido aislado, sintético o recombinante que se híbrida en condiciones de rigurosidad baja, condiciones de rigurosidad media, condiciones de rigurosidad alta o condiciones de rigurosidad muy alta con respecto a cualquiera de las sec. con núms. de ident.: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 y 41 o con respecto a un fragmento o subsecuencia de estas .
Cualquiera de las secuencias de aminoácidos descritas en la presente descripción se puede producir junto o en conjunto con por lo menos 1, por ejemplo, por lo menos 2, 3, 5, 10 o 20 aminoácidos heterólogos que flanquean cada extremo C- y/o N-terminal de la secuencia de aminoácidos específica y/o deleciones de por lo menos 1, por ejemplo, por lo menos 2, 3, 5, 10 o 20 aminoácidos de los extremos C- y/o N-terminal de una enzima de la descripción.
Otras variaciones están, además, dentro del alcance de esta descripción. Por ejemplo, uno o más residuos de aminoácidos pueden modificarse para aumentar o reducir el pl de una enzima. El cambio en el valor del pl se puede alcanzar si se elimina un residuo de glutamato o se sustituye por otro residuo de aminoácido.
La descripción proporciona, específicamente, polipéptidos de ß-glucosidasa que incluyen, por ejemplo, polipéptidos de Fv3C, Pa3D, Fv3G, Fv3D, Tr3A (o Bgll de T. reesei) , Tr3B (o Bgl3 de T. reesei) , Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G y Tn3B. En algunas modalidades, los polipéptidos de ß-glucosidasa son una ß-glucosidasa de fusión/quimera que comprende 2 o más secuencias de ß-glucosidasa derivadas de cualquiera de los polipéptidos de ß-glucosidasa mencionados anteriormente (que incluyen variantes o mutantes de estos) . Por ejemplo, el polipéptido de ß-glucosidasa es un polipéptido quimérico/de fusión que comprende una parte de Fv3C unida opera ivamente a una parte de Tr3B. Por ejemplo, el polipéptido de ß-glucosidasa es un polipéptido quimérico/de fusión que comprende una primera parte que comprende un tramo contiguo de por lo menos aproximadamente 200 residuos de una secuencia N-terminal de Fv3C, una segunda parte que comprende un dominio conector que comprende una secuencia de bucle que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos que comprende una secuencia derivada de Te3A (por ejemplo, que comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205)) y una tercera parte que comprende un tramo contiguo con una longitud de por lo menos aproximadamente 50 residuos derivados de una secuencia C-terminal de Tr3B.
La descripción proporciona, además, un número de polipéptidos de endoglucanasa de GH61 que incluyen, por ejemplo, Eg4 de T. reesei (conocido, además, como "TrEG4"), Eg7 de G. reesei (conocido, además, como vTrEG7" o "TrEGb" ) , TtEG. En ciertas modalidades, los polipéptidos de endoglucanasa de GH61 de la invención tienen una longitud de por lo menos 100 residuos y comprenden uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec. con núms . de ident . : 84 y 88; (2) las sec. con núms . de ident.:85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec. con núm. de ident. :87; (5) las sec. con núms. de ident. :84, 88 y 89; (6) las sec. con núms. de ident. -.85, 88 y 89; (7) las sec. con núms . de ident . : 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91.
La descripción proporciona, además, varios polipéptidos de celulasa y polipéptidos de hemicelulasa que incluyen, por ejemplo, Fv3A, Pf43A, Fv43E, Fv39A, Fv43A, Fv43B, Pa51A, Gz43A, Fo43A, Af43A, Pf51A, AfuXyn2 , AfuXyn5 , Fv43D, Pf43B, Fv43B, Fv51A, Xyn3 de T. reesei, Xyn2 de T. reesei y Bxll de T. reesei .
Una combinación de una o más (por ejemplo, 2 o más, 3 o más, 4 o más, 5 o más o aun 6 o más) de estas enzimas está adecuadamente presente en la composición enzimática modificada genéticamente de la invención, en donde por lo menos 2 de las enzimas se derivan de fuentes biológicas diferentes. Por lo menos una o más de las enzimas en una composición enzimática modificada genéticamente de la invención está adecuadamente presente en un porcentaje en peso que es diferente a su porcentaje en peso en una composición de origen natural, con respecto al peso combinado de proteínas en la composición, por ejemplo, por lo menos una de las enzimas puede estar sobreexpresada o subexpresada .
Fv3A; la secuencia de aminoácidos de Fv3A (sec. con núm. de ident.:2) se muestra en las Figs . 16B y 91. La sec. con núm. de ident . 2 es la secuencia de Fv3A inmaduro. Fv3A tiene una secuencia señal prevista que corresponde a los residuos 1 a 23 de la sec. con núm. de ident. : 2 ; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 24 a 766 de la sec. con núm. de ident. 2. Los dominios conservados previstos aparecen en negrita en la Fig. 16B. Se demostró que Fv3A tiene actividad de ß-xilosidasa, por ejemplo, en un ensayo enzimático con el uso de p-nitrofenil- ß-xilopiranosida, xilobiosa, xilo-oligómeros lineales mezclados, oligómeros de arabinoxilano ramificados de hemicelulosa o mazorca de maíz pretratada con amoníaco diluido como sustratos. El residuo catalítico previsto es D291, mientras que se prevé que los residuos flanqueantes, S290 y C292, están implicados en la unión de sustratos. E175 y E213 están conservados entre otras enzimas de GH3 y GH39 y se prevé que tengan funciones catalíticas. Como se usa en la presente descripción, "un polipéptido de Fv3A" se refiere a un polipéptido y/o a una variante de este que comprende una secuencia que tiene por lo menos 85 %, por ejemplo, por lo menos 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 , 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, por ejemplo, por lo menos 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650 O 700 residuos de aminoácidos contiguos entre los residuos 24 a 766 de la sec. con núm. de ident. :2. Preferentemente, un polipéptido de Fv3A está inalterado en comparación con el Fv3A nativo en los residuos D291, S290, C292, E175 y E213. Preferentemente, un polipéptido de Fv3A está inalterado en por lo menos 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos que están conservados entre Fv3A, Bxll de T. reesei y/o Bgll de T. reesei, tal como se muestra en el alineamiento de la Fig. 91. Un polipéptido de Fv3A comprende adecuadamente el dominio conservado previsto completo del Fv3A nativo tal como se muestra en la Fig. 16B. El polipéptido de Fv3A de la invención tiene actividad de ß-xilosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. :2 o a los residuos (i) 24-766, (ii) 73-321, (iii) 73-394, (iv) 395-622, (v) 24-622 o (vi) 73-622 de la sec. con núm. de ident. :2.
Pf43A; la secuencia de aminoácidos de Pf43A (sec. con núm. de ident. :4) se muestra en las Figs . 17B y 93A-93B. La sec. con núm. de ident. :4 es la secuencia del Pf43A inmaduro. Pf43A tiene una secuencia señal prevista que corresponde a los residuos 1 a 20 de la sec. con núm. de ident. :4; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 21 a 445 de la sec . con núm. de ident . 4. El dominio conservado previsto aparece en negritas, el CBM previsto aparece en mayúsculas y el conector previsto que separa el CD y el CBM aparece en cursiva en la Fig. 17B. Se ha demostrado que Pf43A tiene actividad de ß-xilosidasa, por ejemplo, en un ensayo enzimático con el uso de p-nitrofenil-ß-xilopiranosida, xilobiosa, xilooligómeros lineales mezclados o mazorca de maíz pretratada con amoníaco como sustratos. Los residuos catalíticos previstos incluyen D32 o D60, D145 y E206. La región C-terminal que aparece subrayada en la Fig. 93 es el CBM previsto. Como se usa en la presente descripción, "un polipéptido de Pf43A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350 o 400 residuos de aminoácidos contiguos entre los residuos 21 a 445 de la sec. con núm. de ident . : 4. Preferentemente, un polipéptido de Pf43A está inalterado en comparación con el Pf43A nativo en los residuos D32 o D60, D145 y E206. Preferentemente, un Pf43A está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos que se encuentran conservados entre una familia de proteínas que incluyen Pf43A y 1, 2, 3, 4, 5, 6, 7 o las 8 secuencias de otros aminoácidos en el alineamiento de las Figs . 93A-93B. Un polipéptido de Pf43A de la invención comprende adecuadamente dos o más o todos los dominios siguientes: (1) el CBM previsto, (2) el dominio conservado previsto y (3) el conector de Pf43A tal como se muestra en la Fig. 17B. El polipéptido de Pf43A de la invención tiene actividad de ß-xilosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. :4 o con respecto a los residuos (i) 21-445, (ii) 21-301, (iii) 21-323, (iv) 21-444, (v) 302-444, (vi) 302-445, (vii) 324-444 o (viii) 324-445 de la sec. con núm. de ident. :4. El polipéptido tiene, adecuadamente, actividad de ß-xilosidas .
Fv43E ; la secuencia de aminoácidos de Fv43E (sec. con núm. de ident . :6) se muestra en las Figs. 18B y 93A-93B. La sec. con núm. de ident. 6 es la secuencia de Fv43E inmaduro. Fv43E tiene una secuencia señal prevista que corresponde a los residuos 1 a 18 de la sec. con núm. de ident. :G; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 19 a 530 de la sec. con núm. de ident. 6. El dominio conservado previsto aparece en negrita en la Fig. 18B. Se mostró que Fv43E tiene actividad de ß-xilosidasa, por ejemplo,' en un ensayo enzimático con el uso de 4-nitrofenil-ß-D-xilopiranosida, xilobiosa y xilooligómeros lineales mixtos o la mazorca de maíz pretratada con amoníaco como sustratos. Los residuos catalíticos previstos incluyen D40 o D71, D155 y E241. Como se usa en la presente descripción, "un polipéptido de Fv43E" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450 o 500 residuos de aminoácidos contiguos entre los residuos 19 a 530 de la sec . con núm. de ident . : 6. Preferentemente, un polipéptido de Fv43E está inalterado en comparación con el Fv43E nativo en los residuos D40 o D71, D155 y E241. Preferentemente, un polipéptido de Fv43E está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos que están conservados entre una familia de enzimas que incluyen Fv43E, y l, 2, 3, 4, 5, 6, 7 o las 8 secuencias de otros aminoácidos en el alineamiento de la Fig. 93. El polipéptido de Fv43E de la invención tiene, preferentemente, actividad de ß-xilosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident .: 6 o con respecto a los residuos (i) 19-530, (ii) 29-530, (iii) 19-300 o (iv) 29-300 de la sec . con núm. de ident . : 6.
Fv39A ; la secuencia de aminoácidos de Fv39A (sec. con núm. de ident. :8) se muestra en las Figs. 19B y 92. La sec. con núm. de ident. 8 es la secuencia de Fv39A inmaduro. Fv39A tiene una secuencia señal prevista que corresponde a los residuos 1 a 19 de la sec. con núm. de ident. :8; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 20 a 439 de la sec. con núm. de ident. 8. El dominio conservado previsto se muestra en negrita en la Fig. 19B. Se mostró que Fv39A tiene actividad de ß-xilosidasa, por ejemplo, en un ensayo enzimático con el uso de p-nitrofenil-ß-xilopiranosida, xilobiosa o xilooligómeros lineales mixtos como sustratos. Se prevé que los residuos de Fv39A E168 y E272 funcionen como un ácido base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las xilosidasas de GH39 de G. saccharolyticum (núm. de registro en Uniprot P36906) y G. stearothermophilus (núm. de registro en Uniprot Q9ZFM2) mencionadas anteriormente con Fv39A. Como se usa en la presente descripción, "un polipéptido de Fv39A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350 o 400 residuos de aminoácidos contiguos entre los residuos 20 a 439 de la sec . con núm. de ident .: 8. Preferentemente, un polipéptido de Fv39A está inalterado en comparación con el Fv39A nativo en los residuos E168 y E272. Preferentemente, un polipéptido de Fv39A está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre una familia de enzimas que incluyen Fv39A y xilosidasas de T. saccharolyticum y G. stearothermophilus (ver más arriba) . Un polipéptido de Fv39A comprende, adecuadamente, el dominio conservado previsto entero del Fv39A nativo tal como se muestra en la Fig. 19B. El polipéptido de Fv39A de la invención tiene, preferentemente, actividad de ß-xilosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident .: 8 o con respecto a los residuos (i) 20-439, (ii) 20-291, (iii) 145-291 o (iv) 145-439 de la sec. con núm. de ident . : 8.
Fv 3A: la secuencia de aminoácidos de Fv43A (sec. con núm. de ident. :10) se proporciona en las Figs . 20B y 93. La sec. con núm. de ident. 10 es la secuencia de Fv43A inmaduro. Fv43A tiene una secuencia señal prevista que corresponde a los residuos 1 a 22 de la sec. con núm. de ident. :10; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 23 a 449 de la sec . con núm. de ident. 10. En la Fig. 20B, el dominio conservado previsto aparece en negrita, el CBM previsto está en mayúscula y el conector previsto que separa el CD y el CBM aparece en cursiva. Se muestra que el Fv43A tiene actividad de ß-xilosidasa, por ejemplo, en un ensayo enzimático con el uso de 4-nitrofenil^-D-xilopiranosida, xilobiosa, xilooligómeros lineales mixtos, oligómeros de arabinoxilano ramificado de hemicelulosa y/o xilooligómeros lineales como sustratos. Los residuos catalíticos previstos incluyen D34 o D62, D148 y E209. Como se usa en la presente descripción, "un polipéptido de Fv43A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350 o 400 residuos de aminoácidos contiguos entre los residuos 23 a 449 de la sec. con núm. de ident.: 10. Preferentemente, un polipéptido de Fv43A está inalterado, en comparación con el Fv43A nativo, en los residuos D34 o D62, D148 y E209. Preferentemente, un polipéptido de Fv43A está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre una familia de enzimas que incluye Fv43A y 1, 2, 3, 4, 5, 6, 7, 8 o las 9 secuencias de otros aminoácidos en el alineamiento de la Fig. 93. Un polipéptido de Fv43A comprende, adecuadamente, el CBM previsto entero del Fv43A nativo y/o el dominio conservado previsto entero del Fv43A nativo y/o el conector de Fv43A tal como se muestra en la Fig. 20B. El polipéptido de Fv45A de la invención tiene, preferentemente, actividad de ß-xilosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec . con núm. de ident.:10 o con respecto a los residuos (i) 23-449, (ii) 23-302, (iii) 23-320, (iv) 23-448, (v) 303-448, (vi) 303-449, (vii) 321-448 o (viii) 321-449 de la sec. con núm. de ident.:10.
Fv43B ; la secuencia de aminoácidos de Fv43B (sec. con núm. de ident.:12) se muestra en las Figs . 21B y 93A-93B. La sec. con núm. de ident . 12 es la secuencia de Fv43B inmaduro. Fv43B tiene una secuencia señal prevista que corresponde a los residuos 1 a 16 de la sec. con núm. de ident. : 12 ; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 17 a 574 de la sec. con núm. de ident. 12. El dominio conservado previsto aparece en negrita en la Fig. 21B. Se mostró que Fv43B tiene actividad de ß-xilosidasa y de L-a-arabinofuranosidasa , por ejemplo, en un primer ensayo enzimático con el uso de 4 -nitrofenil - ß -D-xilopiranosida y p-nitrofenil-a-L-arabinofuranosida como sustratos. En un segundo ensayo enzimático se mostró que cataliza la liberación de arabinosa a partir de arabino-xilooligómeros ramificados y que cataliza la liberación de xilosa incrementada a partir de mezclas de oligómeros en presencia de otras enzimas de xilosidasa. Los residuos catalíticos previstos incluyen D38 o D68, D151 y E236. Como se usa en la presente descripción, "un polipéptido de Fv43B" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500 o 550 residuos de aminoácidos contiguos entre los residuos 17 a 574 de la sec . con núm. de ident . : 12. Preferentemente, un polipéptido de Fv43B está inalterado, en comparación con el Fv43B nativo, en los residuos D38 o D68, D151 y E236. Preferentemente, un polipéptido de Fv43B está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre una familia de enzimas que incluyen Fv43B y l, 2, 3, 4, 5, 6, 7, 8 o las 9 secuencias de otros aminoácidos en el alineamiento de la Fig. 93. Un polipéptido de Fv43B comprende, adecuadamente, el dominio conservado previsto entero del Fv43B nativo tal como se muestra en las Figs . 21B y 93A-93B.
El polipéptido de Fv43B de la presente invención tiene, preferentemente, actividad de ß-xilosidasa, actividad de L-a-arabinofuranosidasa o actividad de ß-xilosidasa y actividad de L-a-arabinofuranosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec . con núm. de ident.:12 o con respecto a los residuos (i) 17-574, (ii) 27-574, (iii) 17-303 o (iv) 27-303 de la sec. con núm. de ident.:12.
Pa51A: la secuencia de aminoácidos de Pa51A (sec. con núm. de ident.:14) se muestra en las Figs . 22B y 94. La sec. con núm. de ident . 14 es la secuencia de Pa51A inmaduro. Pa51A tiene una secuencia señal prevista que corresponde a los residuos 1 a 20 de la sec. con núm. de ident .: 14 ; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 21 a 676 de la sec. con núm. de ident. 14. El dominio conservado de L-a-arabinofuranosidasa previsto aparece en negrita en la Fig. 22B. Se mostró que Pa51A tiene actividad de ß-xilosidasa y actividad de L-a-arabinofuranosidasa, por ejemplo, en ensayos enzimáticos con el uso de sustratos artificiales de p-nitrofenil-ß-xilopiranosida y p-nitrofenil- a-L-arabinofuranosida . Se mostró que cataliza la liberación de arabinosa a partir de arabino-xilooligómeros ramificados y que cataliza la liberación de xilosa incrementada a partir de mezclas de oligómeros en presencia de otras enzimas xilosidasa. Los residuos acídicos conservados incluyen E43, D50, E257, E296, E340, E370, E485 y E493. Como se usa en la presente descripción, "un polipéptido de Pa51A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600 o 650 residuos de aminoácidos contiguos entre los residuos 21 a 676 de la sec. con núm. de ident.:14. Preferentemente, un polipéptido de Pa51A está inalterado, en comparación con el Pa51A nativo, en los residuos E43, D50, E257, E296, E340, E370, E485 y E493. Preferentemente, un polipéptido de Pa51A está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre un grupo de enzimas que incluyen Pa51A, Fv51A y Pf51A, tal como se muestra en el alineamiento de la Fig. 94. Un polipéptido de Pa51A comprende, adecuadamente, el dominio conservado previsto del Pa51A nativo tal como se muestra en la Fig. 22B. El polipéptido de Pa51A de la invención tiene, preferentemente, actividad de ß -xilosidasa , actividad de L-oí-arabinofuranosidasa o actividad de ß-xilosidasa y de L-a-arabinofuranosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % O 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec . con núm. de ident . : 14 o con respecto a los residuos (i) 21-676, (ii) 21-652, (iii) 469-652 o (iv) 469-676 de la sec. con núm. de ident .: 14.
Gz43A: la secuencia de aminoácidos de Gz43A (sec. con núm. de ident. :16) se muestra en las Figs . 23B y 93. La sec. con núm. de ident. 16 es la secuencia de Gz43A inmaduro. Gz43A tiene una secuencia señal prevista que corresponde a los residuos 1 a 18 de la sec. con núm. de ident. :16; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 19 a 340 de la sec. con núm. de ident. 16. El dominio conservado previsto aparece en negrita en la Fig. 23B. Se mostró que Gz43A tiene actividad de ß-xilosidasa, por ejemplo, en un ensayo enzimático con el uso de p-nitrofenil -ß-xilopiranosida, xilobiosa o xilooligómeros mixtos y/o lineales como sustratos. Los residuos catalíticos previstos incluyen D33 o D68, D154 y E243. Como se usa en la presente descripción, "un polipéptido de Gz43A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250 o 300 residuos de aminoácidos contiguos entre los residuos 19 a 340 de la sec. con núm. de ident.:16. Preferentemente, un polipéptido de Gz43A está inalterado en comparación con el Gz43A nativo en los residuos D33 o D68, D154 y E243. Preferentemente, un polipéptido de Gz43A está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre un grupo de enzimas que incluyen Gz43A y 1, 2, 3, 4, 5, 6, 7, 8 o las 9 secuencias de otros aminoácidos en el alineamiento de las Figs. 93A-93B. Un polipéptido de Gz43A comprende, adecuadamente, el dominio conservado previsto del Gz43A nativo que se muestra en la Fig. 23B. El polipéptido de Gz43A de la invención tiene, preferentemente, actividad de ß-xilosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.:16 o con respecto a los residuos (i) 19-340, (ii) 53-340, (iii) 19-383 o (iv) 53-383 de la sec. con núm. de ident . : 16.
Fo43A; la secuencia de aminoácidos de Fo43A (sec. con núm. de ident. :18) se muestra en las Figs. 24B y 93A-93B. La sec. con núm. de ident. 18 es la secuencia de Fo43A inmaduro. Fo43A tiene una secuencia señal prevista que corresponde a los residuos 1 a 20 de la sec. con núm. de ident. :18; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 21 a 348 de la sec. con núm. de ident. 18. El dominio conservado previsto aparece en negrita en la Fig. 24B. Se mostró que Fo43A tiene actividad de ß-xilosidasa, por ejemplo, en un ensayo enzimático con el uso de p-nitrofenil-ß-xilopiranosida, xilobiosa y/o xilooligómeros mixtos, lineales como sustratos. Los residuos catalíticos previstos incluyen D37 o D72, D159 y E251. Como se usa en la presente descripción, "un polipéptido de Fo43A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250 o 300 residuos de aminoácidos contiguos entre los residuos 18 a 344 de la sec. con núm. de ident.: 18. Preferentemente, un polipéptido de Fo43A está inalterado, en comparación con el Fo43A nativo, en los residuos D37 o D72, D159 y E251. Preferentemente, un polipéptido de Fo43A está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre un grupo de enzimas que incluyen Fo43A y 1, 2, 3, 4, 5, 6, 7, 8 o las 9 secuencias de otros aminoácidos en el alineamiento de la Fig. 93. El polipéptido de Fo43A de la invención tiene, preferentemente, actividad de ß-xilosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.:18 o con respecto a los residuos (i) 21-341, (ii) 107-341, (iii) 21-348 o (iv) 107-348 de la sec. con núm. de ident . : 18.
Af43A: la secuencia de aminoácidos de Af43A (sec. con núm. de ident. :20) se muestra en las Figs. 25B y 93A-93B. La sec. con núm. de ident. 20 es la secuencia de Af43A inmaduro. El dominio conservado previsto aparece en negrita en la Fig. 25B. Se mostró que Af43A tiene actividad de L-a-arabinofuranosidasa, por ejemplo, en un ensayo enzimático con el uso de p-nitrofenil- a-L-arabinofuranosida como un sustrato. Se mostró que Af43A cataliza la liberación de arabinosa a partir del conjunto de oligómeros liberados a partir de hemicelulosa a través de la acción de endoxilanasa. Los residuos catalíticos previstos incluyen D26 o D58, D139 y E227. Como se usa en la presente descripción, "un polipéptido de Af43A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250 o 300 residuos de aminoácidos contiguos de la sec. con núm. de ident. :20. Preferentemente, un polipéptido de Af43A está inalterado, en comparación con el Af43A nativo, en los residuos D26 o D58, D139 y E227. Preferentemente, un polipéptido de Af43A está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre un grupo de enzimas que incluyen Af43A y 1, 2, 3, 4, 5, 6, 7, 8 o las 9 secuencias de otros aminoácidos en el alineamiento de las Figs . 93A-93B. Un polipéptido de Af43A comprende, adecuadamente, el dominio conservado previsto del Af43A nativo tal como se muestra en la Fig. 25B. El polipéptido de Af43A de la invención tiene, preferentemente, actividad de L-a-arabinofuranosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. : 20 o con respecto a los residuos (i) 15-558 o (ii) 15-295 de la sec. con núm. de ident. :20.
Pf51A: la secuencia de aminoácidos de Pf51A (sec. con núm. de ident.:22) se muestra en las Figs. 26B y 94. La sec. con núm. de ident . 22 es la secuencia de Pf51A inmaduro. Pf51A tiene una secuencia señal prevista que corresponde a los residuos 1 a 20 de la sec. con núm. de ident. :22; se prevé que el cliva e de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 21 a 642 de la sec. con núm. de ident. 22. El dominio conservado de L-a-arabinofuranosidasa previsto aparece en negrita en la Fig. 26B. Se mostró que Pf51A tiene actividad de L-a-arabinofuranosidasa, por ejemplo, en un ensayo enzimático con el uso de -nitrofenil- a-L-arabinofuranosida como sustrato. Se mostró que Pf51A cataliza la liberación de arabinosa a partir del conjunto de oligómeros liberados a partir de hemicelulosa a través de la acción de endoxilanasa . Los residuos acídicos conservados previstos incluyen E43, D50, E248, E287, E331, E360, E472 y E480. Como se usa en la presente descripción, "un polipéptido de Pf51A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %,
96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550 o 600 residuos de aminoácidos contiguos entre los residuos 21 a 642 de la sec. con núm. de ident.:22. Preferentemente, un polipéptido de Pf51A está inalterado, en comparación con el Pf51A nativo, en los residuos E43, D50, E248, E287, E331, E360, E472 y E480. Preferentemente, un polipéptido de Pf5lA está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre Pf51A, Pa51A y Fv51A, tal como se muestra en el alineamiento de la Fig. 94. El polipéptido de Pf51A de la invención tiene, preferentemente, actividad de L-a-arabinofuranosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.:22 o con respecto a los residuos (i) 21-632, (ii) 461-632, (iii) 21-642 o (iv) 461-642 de la sec. con núm. de ident.:22.
AfuXyn2 ; la secuencia de aminoácidos de AfuXyn2 (sec. con núm. de ident . :24) se muestra en las Figs . 27B y 95B. La sec. con núm. de ident. 24 es la secuencia de AfuXyn2 inmaduro. Tiene una secuencia señal prevista que corresponde a los residuos 1 a 18 de la sec. con núm. de ident. :24; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 19 a 228 de la sec. con núm. de ident. 24. El dominio conservado de GH11 previsto aparece en negrita en la Fig. 27B. Se mostró que AfuXyn2 tiene actividad de endoxilanasa indirectamente por la observación de su capacidad para catalizar la producción de monomeros de xilosa incrementada en presencia de xilobiosidasa cuando las enzimas actúan en biomasa pretratada o en hemicelulosa aislada. Los residuos catalíticos conservados incluyen E124, E129 y E215. Como se usa en la presente descripción, "un polipéptido de AfuXyn2" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175 o 200 residuos de aminoácidos contiguos entre los residuos 19 a 228 de la sec . con núm. de ident.:24. Preferentemente, un polipéptido de AfuXyn2 está inalterado, en comparación con el AfuXyn2 nativo, en los residuos E124, E129 y E215. Preferentemente, un polipéptido de AfuXyn2 está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre AfuXyn2 , AfuXyn5 y Xyn2 de T. reesei, tal como se muestra en el alineamiento de la Fig. 95B. Un polipéptido de AfuXyn2 comprende, adecuadamente, el dominio conservado previsto entero del AfuXyn2 nativo ilustrado en la Fig. 27B. El polipéptido de AfuXyn2 de la invención tiene, preferentemente, actividad de xilanasa .
AfuXyn5 : la secuencia de aminoácidos de AfuXyn5 (sec. con núm. de ident.:26) se muestra en las Figs . 28B y 95B. La sec. con núm. de ident . 26 es la secuencia de AfuXyn5 inmaduro. AfuXyn5 tiene una secuencia señal prevista que corresponde a los residuos 1 a 19 de la sec. con núm. de ident. :26 ( se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 20 a 313 de la sec. con núm. de ident. 26. Los dominios conservados de GH11 previstos aparecen en negrita en la Fig. 28B. Se mostró que AfuXynS tiene actividad de endoxilanasa indirectamente por la observación de su capacidad para catalizar la producción de monómeros de xilosa incrementada en presencia de xilobiosidasa cuando las enzimas actúan en biomasa pretratada o en hemicelulosa aislada. Los residuos catalíticos conservados incluyen E119, E124 y E210. El CBM previsto está cerca del extremo C-terminal, caracterizado por numerosos residuos hidrófobos y porque se ajusta a la serie larga de aminoácidos ricos en serina y treonina. La región se muestra subrayada en la Fig. 95B. Como se usa en la presente descripción, "un polipéptido de AfuXyn5" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250 o 275 residuos de aminoácidos contiguos entre los residuos 20 a 313 de la sec . con núm. de ident.:26. Preferentemente, un polipéptido de AfuXyn5 está inalterado, en comparación con el AfuXyn5 nativo, en los residuos E119, E120 y E210. Preferentemente, un polipéptido de AfuXynS está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre AfuXyn5 , AfuXyn2 y Xyn2 de T. reesei , tal como se muestra en el alineamiento de la Fig. 95B. Un polipéptido de AfuXyn5 comprende, adecuadamente, el CBM previsto entero del AfuXynS nativo y/o el dominio conservado previsto entero del AfuXyn5 nativo (subrayado) que se muestra en la Fig. 28B. El polipéptido de AfuXyn5 de la invención tiene, preferentemente, actividad de xilanasa.
Fv43D; la secuencia de aminoácidos de Fv43D (sec. con núm. de ident.:28) se muestra en las Figs . 29B y 93A-93B. La sec. con núm. de ident. 28 es la secuencia de Fv43D inmaduro. Fv43D tiene una secuencia señal prevista que corresponde a los residuos 1 a 20 de la sec. con núm. de ident. :28; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 21 a 350 de la sec. con núm. de ident. 28. El dominio conservado previsto aparece en negrita en la Fig. 29B. Se mostró que Fv43D tiene actividad de ß-xilosidasa, por ejemplo, en un ensayo enzimático con el uso de p-nitrofenil , -ß-xilopiranosida, xilobiosa y/o xilooligómeros mixtos, lineales como sustratos. Los residuos catalíticos previstos incluyen D37 o D72, D159 y E251. Como se usa en la presente descripción, "un polipéptido de Fv43D" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 ¾, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300 o 320 residuos de aminoácidos contiguos entre los residuos 21 a 350 de la sec. con núm. de ident.: 28. Preferentemente, un polipéptido de Fv43D está inalterado, en comparación con el Fv43D nativo, en los residuos D37 o D72, D159 y E251.
Preferentemente, un polipéptido de Fv43D está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre un grupo de enzimas que incluyen Fv43D y 1, 2, 3, 4, 5, 6, 7, 8 o las 9 secuencias de otros aminoácidos en el alineamiento de las Figs . 93A-93B. Un polipéptido de Fv43D comprende, adecuadamente, el CD previsto entero del Fv43D nativo que se muestra en la Fig. 29B. El polipéptido de Fv43D de la invención tiene, preferentemente, actividad de ß-xilosidasa que tiene por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 ¾ o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. :28 o con respecto a los residuos (i) 20-341, (ii) 21-350, (iii) 107-341 o (iv) 107-350 de la sec. con núm. de ident . : 28.
Pf43B: la secuencia de aminoácidos de Pf43B (sec. con núm. de ident. :30) se muestra en las Figs. 30B y 93. La sec. con núm. de ident. 30 es la secuencia de Pf43B inmaduro. Pf43B tiene una secuencia señal prevista que corresponde a los residuos 1 a 20 de la sec. con núm. de ident. :30; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 21 a 321 de la sec. con núm. de ident. 30. El dominio conservado previsto aparece en negrita en la Fig. 30B. Los residuos acídicos conservados dentro del dominio conservado incluyen D32, D61, D148 y E212. Se mostró que Pf43B tiene actividad de ß-xilosidasa, por ejemplo, en un ensayo enzimático con el uso de p-nitrofenil-ß-xilopiranosida, xilobiosa y/o xilooligómeros mixtos lineales como sustratos. Como se usa en la presente descripción, "un polipéptido de Pf43B" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250 o 280 residuos de aminoácidos contiguos entre los residuos 21 a 321 de la sec . con núm. de ident.:30. Preferentemente, un polipéptido de Pf43B está inalterado, en comparación con el Pf43B nativo, en los residuos D32, D61, D148 y E212. Preferentemente, un polipéptido de Pf43B está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre un grupo de enzimas que incluyen Pf43B y 1, 2, 3, 4, 5, 6, 7, 8 o las 9 secuencias de otros aminoácidos en el alineamiento de la Fig. 93. Un polipéptido de Pf43B comprende, adecuadamente, el dominio conservado previsto del Pf43B nativo que se muestra en la Fig. 30B. El polipéptido de Pf43B de la invención tiene, preferentemente, actividad de ß-xilosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec . con núm. de ident.:30.
Fv51A; la secuencia de aminoácidos de Fv51A (sec. con núm. de ident.:32) se muestra en las Figs . 31B y 94. La sec. con núm. de ident. 32 es Fv51Ala secuencia de inmaduro. Fv51A tiene una secuencia señal prevista que corresponde a los residuos 1 a 19 de la sec. con núm. de ident. :32; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 20 a 660 de la sec. con núm. de ident. 32. El dominio conservado de L- -arabinofuranosidasa previsto aparece en negrita en la Fig. 31B. Se mostró que Fv51A tiene actividad de L-a-arabinofuranosidasa, por ejemplo, en un ensayo enzimático con el uso de 4 -nitrofenil - a-L-arabinofuranosida como sustrato. Se mostró que Fv51A cataliza la liberación de arabinosa a partir del conjunto de oligómeros liberados a partir de hemicelulosa a través de la acción de endoxilanasa. Los residuos conservados incluyen E42, D49, E247, E286, E330, E359, E479 y E487. Como se usa en la presente descripción, "un polipéptido de Fv51A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 ¾, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600 o 625 residuos de aminoácidos contiguos entre los residuos 20 a 660 de la sec. con núm. de ident.:32. Preferentemente, un polipéptido de Fv51A está inalterado, en comparación con el Fv51A nativo, en los residuos E42, D49, E247, E286, E330, E359, E479 y E487. Preferentemente, un polipéptido de Fv51A está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre Fv51A, Pa51A y Pf51A, tal como se muestra en el alineamiento de la Fig. 94. Un polipéptido de Fv51A comprende, adecuadamente, el dominio conservado previsto del Fv51A nativo que se muestra en la Fig. 31B. El polipéptido de Fv51A de la invención tiene, preferentemente, actividad de L- -arabinofuranosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 I, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec . con núm. de ident . :32 o con respecto a los residuos (i) 21-660, (ii) 21-645, (iii) 450-645 o (iv) 450-660 de la sec. con núm. de ident. :32.
Xyn3 : la secuencia de aminoácidos de Xyn3 de T. reesei (sec. con núm. de ident. :42) se muestra en la Fig. 36B y 95A. La sec. con núm. de ident. 42 es la secuencia de Xyn3 de T. reesei inmaduro. Xyn3 de T. reesei tiene una secuencia señal prevista que corresponde a los residuos 1 a 16 de la sec. con núm. de ident. -.42; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 17 a 347 de la sec. con núm. de ident. 42. El dominio conservado previsto aparece en negrita en la Fig. 36B. Se mostró que Xyn3 de T. reesei tiene actividad de endoxilanasa indirectamente por la observación de su capacidad para catalizar la producción de monómeros de xilosa incrementada en presencia de xilobiosidasa cuando las enzimas actúan en biomasa pretratada o en hemicelulosa aislada. Los residuos catalíticos conservados incluyen E91, E176, E180, E195 y E282, según se determinó por el alineamiento con otra enzima de la familia GH10, Xysl delta de Strepto yces halstedii (Canals et al., 2003, Act Crystalogr. D Biol . 59:1447-53)" que tiene 33 % de identidad de secuencia con respecto a Xyn3 de T. reesei. Como se usa en la presente descripción, "un polipéptido Xyn3 de T. reesei" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250 o 300 residuos de aminoácidos contiguos entre los residuos 17 a 347 de la sec . con núm. de ident . :42. Preferentemente, un polipéptido Xyn3 de T. reesei está inalterado, en comparación con Xyn3 de T. reesei nativo en los residuos E91, E176, E180, E195 y E282. Preferentemente, el polipéptido Xyn3 de T. reesei está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre Xyn3 de T. reesei y Xysl delta. Un polipéptido Xyn3 de T. reesei comprende, adecuadamente, el dominio conservado previsto entero del Xyn3 de T. reesei nativo que se muestra en la Fig. 36B. El polipéptido Xyn3 de T. reesei de la invención tiene, preferentemente, actividad de xilanasa.
Xyn2 : la secuencia de aminoácidos de Xyn2 de T. reesei
(sec. con núm. de ident.:43) se muestra en las Figs . 37A-37B y 95B. La sec. con núm. de ident . 43 es la secuencia de Xyn2 de T. reesei inmaduro. Xyn2 de T. reesei tiene una secuencia señal prevista que corresponde a los residuos 1 a 33 de la sec. con núm. de ident. :43; Se prevé que el clivaje de la secuencia señal prevista entre las posiciones 16 y 17 produzca un propéptido que se procesa por medio de una proteasa similar a una kexina entre las posiciones 32 y 33 y genera la proteína madura que tiene una secuencia que corresponde a los residuos 33 a 222 de la sec. con núm. de ident.: 43. El dominio conservado previsto aparece en negrita en las Figs. 37A-37B. Se mostró que Xyn2 de T. reesei tiene actividad de endoxilanasa indirectamente por la observación de su capacidad para catalizar una producción de monómeros de xilosa incrementada en presencia de xilobiosidasa cuando las enzimas actúan en biomasa pretratada o en hemicelulosa aislada. Los residuos acídicos conservados incluyen E118, E123 y E209. Como se usa en la presente descripción, "un polipéptido de Xyn2 de T. reesei" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150 o 175 residuos de aminoácidos contiguos entre los residuos 33 a 222 de la sec. con núm. de ident.:43. Preferentemente, un polipéptido de Xyn2 de T. reesei está inalterado, en comparación con Xyn2 de T. reesei nativo, en los residuos E118, E123 y E209. Preferentemente, un polipéptido de Xyn2 de T. reesei está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre Xyn2 de T. reesei, AfuXyn2 y AfuXynS, tal como se muestra en el alineamiento de la Fig. 95B. Un polipéptido de Xyn2 de T. reesei comprende, adecuadamente, el dominio conservado previsto entero de Xyn2 de T. reesei nativo que se muestra en las Figs . 37A-37B. El polipéptido de Xyn2 de G. reesei de la invención tiene, preferentemente, actividad de xilanasa.
Bxll : la secuencia de aminoácidos de Bxll de G. reesei (sec. con núm. de ident.:45) se muestra en las Figs. 38 y 91. La sec. con núm. de ident . 45 es la secuencia de Bxll de T. reesei inmaduro. Bxll de T. reesei tiene una secuencia señal prevista que corresponde a los residuos 1 a 18 de la sec. con núm. de ident. :45; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 19 a 797 de la sec. con núm. de ident. 45. Los dominios conservados previstos aparecen en negrita en la Fig. 38. Se mostró que Bxll de T. reesei tiene actividad de ß-xilosidasa, por ejemplo, en un ensayo enzimático con el uso de p-nitrofenil- ß-xilopiranosida, xilobiosa y/o xilooligómeros mixtos, lineales como sustratos. Los residuos acídicos conservados incluyen E193, E234 y D310. Como se usa en la presente descripción, "un polipéptido de Bxll de T. reesei" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 86 %, 87 88 % , 89 %, 90 %, 91 %, 92 %, 93
94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 o 750 residuos de aminoácidos contiguos entre los residuos 17 a 797 de la sec . con núm. de ident. :45. Preferentemente, un polipéptido de Bxll de T. reesei está inalterado, en comparación con un Bxll de T. reesei nativo, en los residuos E193, E234 y D310. Preferentemente, un polipéptido de Bxll de G. reesei está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre Fv3A y Bxll de T. reesei, tal como se muestra en el alineamiento de la Fig. 91. Un polipéptido de Bxll de T. reesei comprende, adecuadamente, los dominios conservados previstos enteros de Bxll de T. reesei nativo que se muestra en la Fig. 38. El polipéptido de Bxll de G. reesei de la invención tiene, preferentemente, actividad de ß-xilosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec . con núm. de ident.:45.
Eg4 de T. reesei ; la secuencia de aminoácidos de Eg4 de
T. reesei (sec. con núm. de ident.:52) se muestra en las Figs. 40B y 56. La sec. con núm. de ident . 52 es la secuencia de Eg4 de G. reesei inmaduro. Eg4 de T. reesei tiene una secuencia señal prevista que corresponde a los residuos 1 a 21 de la sec. con núm. de ident. :52; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 22 a 344 de la sec. con núm. de ident. 52. Los dominios conservados previstos corresponden a los residuos 22-256 y 307-343 de la sec. con núm. de ident. :52, el último es el dominio de unión a carbohidratos (CBM) previsto. Se mostró que Eg4 de T. reesei tiene actividad de endoglucanasa, por ejemplo, en un ensayo enzimático con el uso de carboximetilcelulosa como sustrato. Los residuos de Eg4 de T. reesei H22, H107, H184, Q193, Y195 estaban previstos para funcionar como coordinadores de metales, los residuos D61 y G63 estaban previstos como residuos de superficie conservados y el residuo Y232 estaba previsto como un residuo implicado en la actividad, en base a un alineamiento de secuencias de aminoácidos de endoglucanasas conocidas, por ejemplo, una endoglucanasa de G. terrestris (núm. de registro ACE10234, mencionada, además, como "TtEG" en la presente descripción) y otra endoglucanasa Eg7 (núm. de registro ADA26043.1) de T. reesei (mencionada, además, como "TtEG7" o "TrEGb" en la presente descripción), con Eg4 de T. reesei (ver, las Figs . 56A-56B) . Como se usa en la presente descripción, "un polipéptido de Eg4 de T. reesei" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250 o 300 residuos de aminoácidos contiguos entre los residuos 22 a 344 de la sec. con núm. de ident.:52. Preferentemente, un polipéptido de Eg4 de T. reesei está inalterado, en comparación con un Eg4 de T. reesei nativo, en los residuos H22, H107, H184, Q193, Y195, D61, G63 y Y232. Preferentemente, un polipéptido de Eg4 de T. reesei está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 ¾ o 99 % de los residuos de aminoácidos conservados entre TrEG7, TtEG y TrEG , tal como se muestra en el alineamiento de la Fig. 56. Un polipéptido de Eg4 de T. reesei comprende, adecuadamente, los dominios conservados previstos enteros de Eg4 de T. reesei nativo que se muestran en las Figs. 56A-56B. El polipéptido de Eg4 de T. reesei de la invención tiene, preferentemente, actividad de endoglucanasa IV (EGIV) y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec . con núm. de ident. : 52 o con respecto a los residuos (i) 22-255, (ii) 22-343, (iii) 307-343, (iv) 307-344 o (v) 22-344 de la sec. con núm. de ident . : 52.
Pa3D : la secuencia de aminoácidos de Pa3D (sec. con núm. de ident. :54) se muestra en las Figs . 41B y 55A-1 a 55A-7. La sec. con núm. de ident. 54 es la secuencia de Pa3D inmaduro. Pa3D tiene una secuencia señal prevista que corresponde a los residuos 1 a 17 de la sec. con núm. de ident . : 2 ; se prevé que el clivaje de la secuencia señal producirá una proteína madura que tiene una secuencia correspondiente a los residuos 18 a 733 de la sec. con núm. de ident. 54. Las predicciones de secuencias señal para este polipéptido y para otros polipéptidos de la descripción se prepararon con el algoritmo SignalP-NN en la presente descripción
(http://www.cbs.dtu.dk). El dominio conservado previsto aparece en negrita en la Fig. 4 IB. Las predicciones de dominios para este polipéptido y para otros polipéptidos de la descripción se basaron en las bases de datos de Pfam, SMART o NCBI. Se prevé que los residuos de Pa3D E463 y D262 funcionen como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de una cantidad de ß-glucosidasas de la familia GH3 , por ejemplo, de P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. e ersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473) , F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. (ver las Figs . 55A-1 a 55A-7) . Como se usa en la presente descripción, "un polipéptido de Pa3D" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %,
97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650 o 700 residuos de aminoácidos contiguos entre los residuos 18 a 733 de la sec . con núm. de ident.:54. Preferentemente, un polipéptido de Pa3D está inalterado, en comparación con un Pa3D nativo, en los residuos E463 y D262. Preferentemente, un polipéptido de Pa3D está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %,
98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descrita en la presente descripción, tal como se muestra en el alineamiento de las Figs. 55A-1 a 55A-7. Un polipéptido de Pa3D comprende, adecuadamente, los dominios conservados previstos enteros de Pa3D nativo que se muestra en la Fig. 41B. El polipéptido de Pa3D de la invención tiene, preferentemente, actividad de ß-glucosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.:54 o con respecto a los residuos (i) 18-282, (ii) 18-601, (iii) 18-733, (iv) 356-601 o (v) 356-733 de la sec. con núm. de ident.:54.
En ciertas modalidades, un polipéptido de Pa3D puede ser un polipéptido de fusión o quimérico que comprende dos o más secuencias de ß-glucosidasa, en donde por lo menos una de las secuencias de ß-glucosidasa se deriva de un polipéptido de Pa3D. Por ejemplo, un polipéptido de Pa3D puede ser un polipéptido quimérico/de fusión que comprende un polipéptido que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos derivada de una secuencia de la misma longitud del N-terminal de un polipéptido de Pa3D o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident.:54. Alternativamente, un polipéptido de Pa3D quimérico/de fusión puede comprender un polipéptido con una longitud de por lo menos aproximadamente 50 residuos de aminoácidos derivado de una secuencia de la misma longitud del C-terminal de un polipéptido de Pa3D o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec . con núm. de ident . :54. En ciertas modalidades, un polipéptido de Pa3D quimérico/de fusión puede comprender una secuencia de bucle que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos y que comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident. :205).
Fv3G : la secuencia de aminoácidos de Fv3G (sec. con núm. de ident. :56) se muestra en las Figs . 42B y 55A-1 a 55A-7. La sec. con núm. de ident. 56 es la secuencia de Fv3G inmaduro. Fv3G tiene una secuencia señal prevista que corresponde a las posiciones 1 a 21 de la sec. con núm. de ident. :56; Se prevé que el clivaje de la secuencia señal produzca una proteína madura que tiene una secuencia que corresponde a las posiciones 22 a 780 de la sec. con núm. de ident. :56. Las predicciones de las secuencias señal se prepararon, tal como se describió anteriormente, con el algoritmo SignalP- N (http://www.cbs.dtu.dk), tal como se prepararon para los otros polipéptidos de la descripción en la presente descripción.- El dominio conservado previsto aparece en negrita en la Fig. 42B. Las predicciones de dominios se prepararon, tal como se prepararon con los otros polipéptidos de la invención en la presente descripción, en base a las bases de datos de Pfam, SMART o NCBI . Se prevé que los residuos de Fv3G E509 y D272 funcionen como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 mencionadas anteriormente, por ejemplo, de P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386731), F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , G. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473), F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. (ver las Figs . 55A-1 a 55A-7) . Como se usa en la presente descripción, "un polipéptido de Fv3G" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 o 750 residuos de aminoácidos contiguos entre los residuos 20 a 780 de la sec . con núm. de ident.:56. Preferentemente, un polipéptido de Fv3G está inalterado, en comparación con un Fv3G nativo, en los residuos E509 y D272. Preferentemente, un polipéptido de Fv3G está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descrita en la presente descripción tal como se muestra en el alineamiento de las Figs. 55A-1 a 55A-7. Un polipéptido de Fv3G comprende, adecuadamente, los dominios conservados previstos enteros del Fv3G nativo que se muestra en la Fig. 42B. El polipéptido de Fv3G de la invención tiene, preferentemente, actividad de ß-glucosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.:56 o con respecto a los residuos (i) 22-292, (ii) 22-629, (iii) 22-780, (iv) 373-629 o (v) 373-780 de la sec. con núm. de ident . : 56.
En ciertas modalidades, un polipéptido de Fv3G es un polipéptido de fusión/quimérico que comprende dos o más secuencias de ß-glucosidasa , en donde por lo menos una de las secuencias de ß-glucosidasa se deriva de un polipéptido de Fv3G. Por ejemplo, un polipéptido de Fv3G quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del N-terminal de un polipéptido de Fv3G o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident. :56. Por ejemplo, un polipéptido de Fv3G quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del C-terminal de un polipéptido de Fv3G o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec . con núm. de ident.:56. En ciertas modalidades, el polipéptido de Fv3G comprende, además, una secuencia de bucle que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivada de una secuencia de la misma longitud de un polipéptido de Fv3G o una variante de este y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205).
Fv3D : la secuencia de aminoácidos de Fv3D (sec. con núm. de ident.:58) se muestra en las Figs . 43B y 55A-1 a 55A-7. La sec. con núm. de ident. 58 es la secuencia de Fv3D inmaduro. El Fv3D tiene una secuencia señal prevista que corresponde a las posiciones 1 a 19 de la sec. con núm. de ident. :58; Se prevé que el clivaje de la secuencia señal produzca una proteína madura que tiene una secuencia que corresponde a las posiciones 20 a 811 de la sec. con núm. de ident. :58. Las predicciones de la secuencia señal se realizaron con el algoritmo SignalP-NN. El dominio conservado previsto aparece en negrita en la Fig. 43B. Las predicciones de dominios se prepararon en base a las bases de datos de Pfam, SMART o NCBI . Se prevé que los residuos de Fv3D E534 y D301 funcionen como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 mencionadas anteriormente, por ejemplo, de P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. e ersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473), F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. (ver las Figs . 55A-1 a 55A-7) . Como se usa en la presente descripción, "un polipéptido de Fv3D" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 o 750 residuos de aminoácidos contiguos entre los residuos 20 a 811 de la sec . con núm. de ident . :58. Preferentemente, un polipéptido de Fv3D está inalterado, en comparación con un Fv3D nativo, en los residuos E534 y D301. Preferentemente, un polipéptido de Fv3D está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descrita en la presente descripción tal como se muestra en el alineamiento de las Figs. 55A-1 a 55A-7. Un polipéptido de Fv3D comprende, adecuadamente, los dominios conservados previstos enteros del Fv3D nativo que se muestra en la Fig. 43B. El polipéptido de Fv3D de la invención tiene, preferentemente, actividad de ß-glucosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.:58 o con respecto a los residuos (i) 20-321, (ii) 20-651, (iii) 20-811, (iv) 423-651 o (v) 423-811 de la sec. con núm. de ident.:58. El polipéptido tiene, adecuadamente, actividad de ß-glucosidasa .
En ciertas modalidades, un polipéptido de Fv3D puede ser un polipéptido de fusión/quimérico que comprende dos o más secuencias de ß-glucosidasa, en donde por lo menos una de las secuencias de ß-glucosidasa se deriva de un polipéptido de Fv3D. Por ejemplo, un polipéptido de Fv3D quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del N-terminal de un polipéptido de Fv3D o una variante de este que tiene por lo menos aproximadamente 60 ¾ de identidad de secuencia con respecto a la sec. con núm. de ident.:58. Por ejemplo, un polipéptido de Fv3D quimérico/de fusión puede comprender un polipéptido con una longitud de por lo menos aproximadamente 50 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del C-terminal de un polipéptido de Fv3D o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident.:58. En ciertas modalidades, un polipéptido de Fv3D quimérico/de fusión puede comprender una secuencia de bucle que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivado de una secuencia de la misma longitud de un polipéptido de Fv3D o una variante de este y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205).
Fv3C : la secuencia de aminoácidos de Fv3C (sec. con núm. de ident.:60) se muestra en las Figs . 44B y 55A-1 a 55A-7. La sec. con núm. de ident . 60 es la secuencia de Fv3C inmaduro. El Fv3C tiene una secuencia señal prevista que corresponde a las posiciones 1 a 19 de la sec. con núm. de ident. :60; Se prevé que el clivaje de la secuencia señal produzca una proteína madura que tiene una secuencia que corresponde a las posiciones 20 a 899 de la sec. con núm. de ident. :60. Las predicciones de la secuencia señal se realizaron con el algoritmo SignalP-NN. El dominio conservado previsto aparece en negrita en la Fig. 44B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI . Se prevé que los residuos de Fv3C E536 y D307 funcionen como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 mencionadas anteriormente, por ejemplo, de P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781), F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , G. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473), F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc (ver las Figs . 55A-1 a 55A-7) . Como se usa en la presente descripción, "un polipéptido de Fv3C" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 , 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750 o 800 residuos de aminoácidos contiguos entre los residuos 20 a 899 de la sec . con núm. de ident.:60. Preferentemente, un polipéptido de Fv3C está inalterado, en comparación con un Fv3C nativo, en los residuos E536 y D307. Preferentemente, un polipéptido de Fv3C está inalterado en por lo menos 60 %, 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descrita en la presente descripción tal como se muestra en el alineamiento de las Figs . 55A-1 a 55A-7. Un polipéptido de Fv3C comprende, adecuadamente, los dominios conservados previstos enteros del Fv3C nativo que se muestra en la Fig. 44B. El polipéptido de Fv3C de la invención tiene, preferentemente, actividad de ß-glucosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec . con núm. de ident.:60 o con respecto a los residuos (i) 20-327, (ii) 22-600, (iii) 20-899, (iv) 428-899 o (v) 428-660 de la sec. con núm. de ident . :60.
En ciertas modalidades, un polipéptido de Fv3C puede ser un polipéptido de fusión/quimérico que comprende dos o más secuencias de ß-glucosidasa, en donde por lo menos una de las secuencias de ß-glucosidasa se deriva de un polipéptido de Fv3C. Por ejemplo, un polipéptido de Fv3C quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del N-terminal de un polipéptido de Fv3C o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident. :60. Por ejemplo, un polipéptido de Fv3C quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del C-terminal de un polipéptido de Fv3C o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec . con núm. de ident. :60. En ciertas modalidades, un polipéptido de Fv3C quimérico/de fusión puede comprender una secuencia de bucle que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivado de una secuencia de la misma longitud de un polipéptido de Fv3C o una variante de este y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident. :205) .
Tr3A: la secuencia de aminoácidos de Tr3A (sec. con núm. de ident. :62) se muestra en las Figs. 45B y 55A-1 a 55A-7. La sec. con núm. de ident. 62 es la secuencia de Tr3A inmaduro. Tr3A tiene una secuencia señal prevista que corresponde a las posiciones 1 a 19 de la sec. con núm. de ident. : 62 ; Se prevé que el clivaje de la secuencia señal produzca una proteína madura que tiene una secuencia que corresponde a las posiciones 20 a 744 de la sec. con núm. de ident. :62. Las predicciones de la secuencia señal se realizaron con el algoritmo SignalP-NN. El dominio conservado previsto aparece en negrita en la Fig. 45B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI . Se prevé que los residuos de Tr3A E472 y D267 funcionen como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 mencionadas anteriormente, por ejemplo, de P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473) , F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc (ver las Figs . 55A-1 a 55A-7) . Como se usa en la presente descripción, "un polipéptido de Tr3A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650 o 700 residuos de aminoácidos contiguos entre los residuos 20 a 744 de la sec . con núm. de ident.:62. Preferentemente, un polipéptido de Tr3A está inalterado, en comparación con un Tr3A nativo, en los residuos E472 y D267. Preferentemente, un polipéptido de Tr3A está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descrita en la presente descripción, tal como se muestra en el alineamiento de las Figs. 55A-1 a 55A-7. Un polipéptido de Tr3A comprende, adecuadamente, los dominios conservados previstos enteros del Tr3A nativo que se muestra en la Fig. 45B. El polipéptido de Tr3A de la invención tiene, preferentemente, actividad de ß-glucosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec . con núm. de ident.:62 o con respecto a los residuos (i) 20-287, (ii) 22-611, (iii) 20-744, (iv) 362-611 o (v) 362-744 de la sec. con núm. de ident.:62.
En ciertas modalidades, un polipéptido de Tr3A puede ser un polipéptido de fusión/quimérico que comprende dos o más secuencias de ß-glucosidasa, en donde por lo menos una de las secuencias de ß-glucosidasa se deriva de un polipéptido de Tr3A. Por ejemplo, un polipéptido de Tr3A quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del N-terminal de un polipéptido de Tr3A o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident.:62. Por ejemplo, un polipéptido de Tr3A quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del C-terminal de un polipéptido de Tr3A o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident.:62. En ciertas modalidades, un polipéptido de Tr3A quimérico/de fusión puede comprender una secuencia de bucle que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivado de una secuencia de la misma longitud de un polipéptido de Tr3A o una variante de este y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) Y IT (sec. con núm. de ident.:205).
Tr3B : la secuencia de aminoácidos de Tr3B (sec. con núm. de ident.:64) se muestra en las Figs . 46B y 55A-1 a 55A-7. La sec. con núm. de ident . 64 es la secuencia de Tr3B inmaduro. El Tr3B tiene una secuencia señal prevista que corresponde a las posiciones 1 a 18 de la sec. con núm. de ident. :64; Se prevé que el clivaje de la secuencia señal produzca una proteína madura que tiene una secuencia que corresponde a las posiciones 19 a 874 de la sec. con núm. de ident.: 64. Las predicciones de la secuencia señal se realizaron con el algoritmo SignalP- N. El dominio conservado previsto aparece en negrita en la Fig. 46B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI . Se prevé que los residuos de Tr3B E516 y D287 funcionen como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 mencionadas anteriormente, por ejemplo, de P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , G. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473), F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. (ver las Figs . 55A-1 a 55A-7) . Como se usa en la presente descripción, "un polipéptido de Tr3B" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800 o 850 residuos de aminoácidos contiguos entre los residuos 19 a 874 de la sec . con núm. de ident . : 64. Preferentemente, un polipéptido de Tr3B está inalterado, en comparación con un Tr3B nativo, en los residuos E516 y D287. Preferentemente, un polipéptido de Tr3B está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descrita en la presente descripción, tal como se muestra en las Figs. 55A-1 a 55A-7. Un polipéptido de Tr3B comprende, adecuadamente, los dominios conservados previstos enteros del Tr3B nativo que se muestra en la Fig. 46B. El polipéptido de Tr3B de la invención tiene, preferentemente, actividad de ß-glucosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec . con núm. de ident.:64 o con respecto a los residuos (i) 19-307, (ii) 19-640, (iii) 19-874, ( iv) 407-640 o (v) 407-874 de la sec. con núm. de ident.:64.
En ciertas modalidades, un polipéptido de Tr3B puede ser un polipéptido de fusión/quimérico que comprende dos o más secuencias de ß-glucosidasa, en donde por lo menos una de las secuencias de ß-glucosidasa se deriva de un polipéptido de Tr3B. Por ejemplo, un polipéptido de Tr3B quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del N-terminal de un polipéptido de Tr3B o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident.:64. Por ejemplo, un polipéptido de Tr3B quimérico/de fusión puede comprender un polipéptido con una longitud de por lo menos aproximadamente 50 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del C-terminal de un polipéptido Tr3B o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident.:64. En ciertas modalidades, un polipéptido de Tr3B quimérico/de fusión puede comprender una secuencia de bucle que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivado de una secuencia de la misma longitud de un polipéptido de Tr3B o una variante de este y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205).
Te3A: la secuencia de aminoácidos de Te3A (sec. con núm. de ident . :66) se muestra en las Figs . 47B y 55A-1 a 55A-7. La sec. con núm. de ident. 66 es la secuencia de Te3A inmaduro. El Te3A tiene una secuencia señal prevista que corresponde a las posiciones 1 a 19 de la sec. con núm. de ident.: 66; Se prevé que el clivaje de la secuencia señal produzca una proteína madura que tiene una secuencia que corresponde a las posiciones 20 a 857 de la sec. con núm. de ident. :66. Las predicciones de la secuencia señal se realizaron con el algoritmo SignalP-NN. El dominio conservado previsto aparece en negrita en la Fig. 47B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI . Se prevé que los residuos de Te3A E505 y D277 funcionen como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 mencionadas anteriormente, por ejemplo, de P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , G. emersonii (núm. de registro AAL69548) , G. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473) , F. verticillioides y T. neapolitana (núm. de registro Q0GC07) etc. (ver las Figs . 55A-1 a 55A-7) . Como se usa en la presente descripción, "un polipéptido de Te3A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600', 650, 700, 750 o 800 residuos de aminoácidos contiguos entre los residuos 20 a 857 de la sec . con núm. de ident.:66. Preferentemente, un polipéptido de Te3A está inalterado, en comparación con un Te3A nativo, en los residuos E505 y D277. Preferentemente, un polipéptido de Te3A está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descrita en la presente descripción, tal como se muestra en las Figs. 55A-1 a 55A-7. Un polipéptido de Te3A comprende, adecuadamente, los dominios conservados previstos enteros del Te3A nativo que se muestra en la Fig. 47B. El polipéptido de Te3A de la invención tiene, preferentemente, actividad de ß-glucosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.:66 o con respecto a los residuos (i) 20-297, (ii) 20-629, (iii) 20-857, (iv) 396-629 o (v) 396-857 de la sec. con núm. de ident.:66.
En ciertas modalidades, un polipéptido de Te3A puede ser un polipéptido de fusión/quimérico que comprende dos o más secuencias de ß-glucosidasa, en donde por lo menos una de las secuencias de ß-glucosidasa se deriva de un polipéptido de Te3A. Por ejemplo, un polipéptido de Te3A quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del N-terminal de un polipéptido de Te3A o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident. :62. Por ejemplo, un polipéptido de Te3A quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del C-terminal de un polipéptido de Te3A o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident. :62. En ciertas modalidades, un polipéptido de Te3A quimérico/de fusión puede comprender una secuencia de bucle que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivado de una secuencia de la misma longitud de un polipéptido de Te3A o una variante de este y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205).
An3A : la secuencia de aminoácidos de An3A (sec. con núm. de ident.:68) se muestra en las Figs. 48B y 55A-1 a 55A-7. La sec. con núm. de ident . 6 es la secuencia de An3A inmaduro. Un An3A tiene una secuencia señal prevista que corresponde a las posiciones 1 a 19 de la sec. con núm. de ident. :68; se prevé que el clivaje de la secuencia señal produzca una proteína madura que tiene una secuencia que corresponde a las posiciones 20 a 860 de la sec. con núm. de ident. :68. Las predicciones de la secuencia señal se realizaron con el algoritmo SignalP-NN. El dominio conservado previsto aparece en negrita en la Fig. 48B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI. Se prevé que los residuos de An3A E509 y D277 funcionen como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 mencionadas anteriormente, por ejemplo, de P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. níger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473), F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. (ver las Figs . 55A-1 a 55A-7) . Como se usa en la presente descripción, "un polipéptido de An3A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %,
94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750 o 800 residuos de aminoácidos contiguos entre los residuos 20 a 860 de la sec . con núm. de ident.:68. Preferentemente, un polipéptido de An3A está inalterado, en comparación con un An3A nativo, en los residuos E509 y D277. Preferentemente, un polipéptido de An3A está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descrita en la presente descripción, tal como se muestra en las Figs. 55A-1 a 55A-7. Un polipéptido de An3A comprende, adecuadamente, los dominios conservados previstos enteros del An3A nativo que se muestra en la Fig. 48B. El polipéptido de An3A de la invención tiene, preferentemente, actividad de ß-glucosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %,
95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.:68 o con respecto a los residuos (i) 20-300, (ii) 20-634, (iii) 20-860, (iv) 400-634 o (v) 400-860 de la sec. con núm. de ident.:68.
En ciertas modalidades, un polipéptido de An3A puede ser un polipéptido de fusión/quimérico que comprende dos o más secuencias de ß-glucosidasa, en donde por lo menos una de las secuencias de ß-glucosidasa se deriva de un polipéptido de An3A. Por ejemplo, un polipéptido de An3A quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del N-terminal de un polipéptido de An3A o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident.:68. Por ejemplo, un polipéptido de An3A quimérico/de fusión puede comprender un polipéptido con una longitud de por lo menos aproximadamente 50 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del C-terminal de un polipéptido de An3A o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident.:68. En ciertas modalidades, un polipéptido de An3A quimérico/de fusión puede comprender una secuencia de bucle que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivado de una secuencia de la misma longitud de un polipéptido de An3A o una variante de este y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident . : 204 ) o de FD (R/K) YNIT (sec. con núm. de ident. :205) .
Fo3A : la secuencia de aminoácidos de Fo3A (sec. con núm. de ident. :70) se muestra en las Figs . 49B y 55A-1 a 55A-7. La sec. con núm. de ident. 70 es la secuencia de Fo3A inmaduro. Fo3A tiene una secuencia señal prevista que corresponde a las posiciones 1 a 19 de la sec. con núm. de ident. :70; se prevé que el clivaje de la secuencia señal produzca una proteína madura que tiene una secuencia que corresponde a las posiciones 20 a 899 de la sec. con núm. de ident. :70. Las predicciones de la secuencia señal se realizaron con el algoritmo SignalP- . El dominio conservado previsto aparece en negrita en la Fig. 49B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI . Se prevé que los residuos de Fo3A E536 y D307 funcionen como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 mencionadas anteriormente, por ejemplo, de P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , G. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473) , F. verticillioides y T. neapolitana (núm. de registro Q0GC07) etc. (ver las Figs. 55A-1 a 55A-7) . Como se usa en la presente descripción, "un polipéptido de Fo3A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800 o 850 residuos de aminoácidos contiguos entre los residuos 20 a 899 de la sec . con núm. de ident.:70. Preferentemente, un polipéptido de Fo3A está inalterado, en comparación con un Fo3A nativo, en los residuos E536 y D307. Preferentemente, un polipéptido de Fo3A está inalterado en por lo menos 70 %, 80 ¾, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de GH3 descritas en la presente descripción tal como se muestra en las Figs. 55A-1 a 55A-7. Un polipéptido de Fo3A comprende, adecuadamente, los dominios conservados previstos enteros del Fo3A nativo que se muestra en la Fig. 49B. El polipéptido de Fo3A de la invención tiene, preferentemente, actividad de ß-glucosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.:70 o con respecto a los residuos (i) 20-327, (ii) 20-660, (iii) 20-899, (iv) 428-660 o (v) 428-899 de la sec. con núm. de ident . : 70.
En ciertas modalidades, un polipéptido de Fo3A puede ser un polipéptido de fusión/quimérico que comprende dos o más secuencias de ß-glucosidasa, en donde por lo menos una de las secuencias de ß-glucosidasa se deriva de un polipéptido de Fo3A. Por ejemplo, un polipéptido de Fo3A quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del N-terminal de un polipéptido de Fo3A o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec . con núm. de ident.:70. Por ejemplo, un polipéptido de Fo3A quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del C-terminal de un polipéptido de Fo3A o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident.:70. En ciertas modalidades, un polipéptido de Fo3A quimérico/de fusión puede comprender una secuencia de bucle que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivado de una secuencia de la misma longitud de un polipéptido de Fo3A o una variante de este y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205).
Gz3A : la secuencia de aminoácidos de Gz3A (sec. con núm. de ident.:72) se muestra en las Figs . 50B y 55A-1 a 55A-7. La sec. con núm. de ident. 72 es la secuencia de Gz3A inmaduro. Gz3A tiene una secuencia señal prevista que corresponde a las posiciones 1 a 18 de la sec. con núm. de ident. :72; se prevé que el clivaje de la secuencia señal produzca una proteína madura que tiene una secuencia que corresponde a las posiciones 19 a 886 de la sec. con núm. de ident. :72. Las predicciones de la secuencia señal se realizaron con el algoritmo SignalP-NN. El dominio conservado previsto aparece en negrita en la Fig. 50B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI . Se prevé que los residuos de Gz3A E523 y D294 funcionen como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 mencionadas anteriormente, por ejemplo, de P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473), F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. (ver las Figs. 55A-1 a 55A-7) . Como se usa en la presente descripción, "un polipéptido de Gz3A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %,
94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800 o 850 residuos de aminoácidos contiguos entre los residuos 19 a 886 de la sec . con núm. de ident.:72. Preferentemente, un polipéptido de Gz3A está inalterado, en comparación con un Gz3A nativo, en los residuos E536 y D307. Preferentemente, un polipéptido de Gz3A está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descrita en la presente descripción, tal como se muestra en las Figs . 55A-1 a 55A-7. Un polipéptido de Gz3A comprende, adecuadamente, los dominios conservados previstos enteros del Gz3A nativo que se muestra en la Fig. 50B. El polipéptido de Gz3A de la invención tiene, preferentemente, actividad de ß-glucosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %,
95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.:72 o con respecto a los residuos (i) 19-314, (ii) 19-647, (iii) 19-886, (iv) 415-647 o (v) 415-886 de la sec. con núm. de ident.:72.
En ciertas modalidades, un polipéptido de Gz3A puede ser un polipéptido de fusión/quimérico que comprende dos o más secuencias de ß-glucosidasa, en donde por lo menos una de las secuencias de ß-glucosidasa se deriva de un polipéptido de Gz3A. Por ejemplo, un polipéptido de Gz3A quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del N-terminal de un polipéptido de Gz3A o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident. :72. Por ejemplo, un polipéptido de Gz3A quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del C-terminal de un polipéptido de Gz3A o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident. :72. En ciertas modalidades, a polipéptido de Gz3A quimérico/de fusión puede comprender una secuencia de bucle que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivado de una secuencia de la misma longitud que un polipéptido de Gz3A o una variante de este y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) Y IT (sec. con núm. de ident. :205) .
Nh3A : la secuencia de aminoácidos de Nh3A (sec. con núm. de ident. :74) se muestra en las Figs . 51B y 55A-1 a 55A-7. La sec. con núm. de ident. 74 es la secuencia de Nh3A inmaduro. Nh3A tiene una secuencia señal prevista que corresponde a las posiciones 1 a 19 de la sec. con núm. de ident. : 74 ; se prevé que el clivaje de la secuencia señal produzca una proteína madura que tiene una secuencia que corresponde a las posiciones 20 a 880 de la sec. con núm. de ident .: 74. Las predicciones de la secuencia señal se realizaron con el algoritmo SignalP- N. El dominio conservado previsto aparece en negrita en la Fig. 51B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI . Se prevé que los residuos de Nh3A E523 y D294 funcionen como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 mencionadas anteriormente, por ejemplo, de P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473), F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. (ver las Figs . 55A-1 a 55A-7) . Como se usa en la presente descripción, "un polipéptido de Nh3A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800 o 850 residuos de aminoácidos contiguos entre los residuos 20 a 880 de la sec . con núm. de ident.:74. Preferentemente, un polipéptido de Nh3A está inalterado, en comparación con un Nh3A nativo, en los residuos E523 y D294. Preferentemente, un polipéptido de Nh3A está inalterado, en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos conservados entre las ß-glucosidasas de la familia GH3 descrita en la presente descripción tal como se muestra en las Figs. 55A-1 a 55A-7. Un polipéptido de Nh3A comprende, adecuadamente, los dominios conservados previstos enteros del Nh3A nativo que se muestra en la Fig. 51B. El polipéptido de Nh3A de la invención tiene, preferentemente, actividad de ß -glucosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident . :76 o con respecto a los residuos (i) 20-295, (ii) 20-647, (iii) 20-880, (iv) 414-647 o (v) 414-880 de la sec. con núm. de ident . : 76.
En ciertas modalidades, un polipéptido de Nh3A puede ser un polipéptido de fusión/quimérico que comprende dos o más secuencias de ß-glucosidasa, en donde por lo menos una de las secuencias de ß-glucosidasa se deriva de un polipéptido de Nh3A. Por ejemplo, un polipéptido de Nh3A quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del N-terminal de un polipéptido de Nh3A o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident. :74. Por ejemplo, un polipéptido de Nh3A quimérico/de fusión puede comprender un polipéptido con una longitud de por lo menos aproximadamente 50 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del C-terminal de un polipéptido de Nh3A o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident. :74. En ciertas modalidades, un polipéptido de Nh3A quimérico/de fusión puede comprender una secuencia de bucle que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivado de una secuencia de la misma longitud de un polipéptido de Nh3A o una variante de este y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident. :205) .
Vd3A : la secuencia de aminoácidos de Vd3A (sec. con núm. de ident. :76) se muestra en las Figs . 52B y 55A-1 a 55A-7. La sec. con núm. de ident. 76 es la secuencia de Vd3A inmaduro. Vd3A tiene una secuencia señal prevista que corresponde a las posiciones 1 a 18 de la sec . con núm. de ident.:76; se prevé que el clivaje de la secuencia señal produzca una proteína madura que tiene una secuencia que corresponde a las posiciones 19 a 890 de la sec. con núm. de ident.:76. Las predicciones de la secuencia señal se realizaron con el algoritmo SignalP-N . El dominio conservado previsto aparece en negrita en la Fig. 52B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI. Se mostró que Vd3A tiene actividad de ß-glucosidasa, por ejemplo, en un ensayo enzimático con el uso de cNPG y celobiosa y en la hidrólisis de la mazorca de maíz pretratada con amoníaco diluido como sustrato. Se prevé que los residuos de Vd3A E524 y D295 funcionen como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 mencionadas anteriormente, por ejemplo, de P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , G. reesei (núm. de registro AAA18473) , F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. (ver las Figs . 55A-1 a 55A-7) . Como se usa en la presente descripción, "un polipéptido de Vd3A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %,
94 %, 95 %, 96 %, 97 %, 98 %, 99 ¾ o 100 % de identidad con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800 o 850 residuos de aminoácidos contiguos entre los residuos 19 a 890 de la sec. con núm. de ident.:76. Preferentemente, un polipéptido de Vd3A está inalterado, en comparación con un Vd3A nativo, en los residuos E524 y D295. Preferentemente, un polipéptido de Vd3A está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descrita en la presente descripción, tal como se muestra en las Figs . 55A-1 a 55A-7. Un polipéptido de Vd3A comprende, adecuadamente, los dominios conservados previstos enteros del Vd3A nativo que se muestra en la Fig. 52B. El polipéptido de Vd3A de la invención tiene, preferentemente, actividad de ß-glucüsidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %,
95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.:76 o con respecto a los residuos (i) 19-296, (ii) 19-649, (iii) 19-890, (iv) 415-649 o (v) 415-890 de la sec. con núm. de ident.:76.
En ciertas modalidades, un polipéptido de Vd3A puede ser un polipéptido de fusión/quimérico que comprende dos o más secuencias de ß-glucosidasa, en donde por lo menos una de las secuencias de ß-glucosidasa se deriva de un polipéptido de Vd3A. Por ejemplo, un polipéptido de Vd3A quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del N-terminal de un polipéptido de Vd3A o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec . con núm. de ident.:76. Por ejemplo, un polipéptido de Vd3A quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del C-terminal de un polipéptido de Vd3A o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident . :76. En ciertas modalidades, un polipéptido de Vd3A quimérico/de fusión puede comprender una secuencia de bucle que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivado de una secuencia de la misma longitud de un polipéptido de Vd3A o una variante de este y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD(R/ )YNIT (sec. con núm. de ident. :205).
Pa3G : la secuencia de aminoácidos de Pa3G (sec. con núm. de ident. :78) se muestra en las Figs . 53B y 55A-1 a 55A-7. La sec. con núm. de ident.:78 es la secuencia del Pa3G inmaduro. Pa3G tiene una secuencia señal prevista que corresponde a las posiciones 1 a 19 de la sec. con núm. de ident . :78; se prevé que el clivaje de la secuencia señal produzca una proteína madura que tiene una secuencia que corresponde a las posiciones 20 a 805 de la sec. con núm. de ident. :78. Las predicciones de la secuencia señal se realizaron con el algoritmo SignalP-NN. El dominio conservado previsto aparece en negrita en la Fig. 53B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI. Se prevé que los residuos de Pa3G E517 y D289 funcionen como ácido-base y nucleofilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 mencionadas anteriormente, por ejemplo, de P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473), F. verticillioides y G. neapolitana (núm. de registro Q0GC07) , etc. (ver las Figs . 55A-1 a 55A-7) . Como se usa en la presente descripción, "un polipéptido de Pa3G" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 o 750 residuos de aminoácidos contiguos entre los residuos 20 a 805 de la sec . con núm. de ident.:78. Preferentemente, un polipéptido de Pa3G está inalterado, en comparación con un Pa3G nativo, en los residuos E517 y D289. Preferentemente, un polipéptido de Pa3G está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descrita en la presente descripción, tal como se muestra en las Figs. 55A-1 a 55A-7. Un polipéptido de Pa3G comprende, adecuadamente, los dominios conservados previstos enteros del Pa3G nativo que se muestra en la Fig. 53B. El polipéptido de Pa3G de la invención tiene, preferentemente, actividad de ß-glucosidasa y por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % O 100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.:78 o con respecto a los residuos (i) 20-354, (ii) 20-660, (iii) 20-805, (iv) 449-660 o (v) 449-805 de la sec. con núm. de ident.:78.
En ciertas modalidades, un polipéptido de Pa3G puede ser un polipéptido de fusión/quimérico que comprende dos o más secuencias de ß-glucosidasa, en donde por lo menos una de las secuencias de ß-glucosidasa se deriva de un polipéptido de Pa3G. Por ejemplo, un polipéptido de Pa3G quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del N-terminal de un polipéptido de Pa3G o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec . con núm. de ident . :78. Por ejemplo, un polipéptido de Pa3G quimérico/de fusión puede comprender un polipéptido con una longitud de por lo menos aproximadamente 50 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del C-terminal de un polipéptido de Pa3G o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident. :78. En ciertas modalidades, un polipéptido de Pa3G quimérico/de fusión puede comprender una secuencia de bucle que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivado de una secuencia de la misma longitud de un polipéptido de Pa3G o una variante de este y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD (R/K) YNIT (sec. con núm. de ident. :205).
Tn3B : la secuencia de aminoácidos de Tn3B (sec. con núm. de ident. :79) se muestra en las Figs . 54 y 55A-1 a 55A-7. La sec. con núm. de ident. 79 es la secuencia de Tn3B inmaduro. El algoritmo SignalP-NN (http://www.cbs.dtu.dk) no proporcionó una secuencia señal prevista. Se prevé que los residuos de Tn3B E458 y D242 funcionen como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 mencionadas anteriormente, por ejemplo, P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. hae atococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781) , F. oxysporura (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473) , F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. (ver las Figs . 55A-1 a 55A-7) . Como se usa en la presente descripción, "un polipéptido de Tn3B" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 O 750 residuos de aminoácidos contiguos de la sec . con núm. de ident.:79. Preferentemente, un polipéptido de Tn3B está inalterado, en comparación con un Tn3B nativo, en los residuos E458 y D242. Preferentemente, un polipéptido de Tn3B está inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descrita en la presente descripción, tal como se muestra en el alineamiento de las Figs . 55A-1 a 55A-7. Un polipéptido de Tn3B comprende, adecuadamente, los dominios conservados previstos enteros del Tn3B nativo que se muestra en la Fig. 54. El polipéptido de Tn3B de la invención tiene, preferentemente, actividad de ß-glucosidasa .
En ciertas modalidades, un polipéptido de Tn3B puede ser un polipéptido de fusión/quimérico que comprende dos o más secuencias de ß-glucosidasa , en donde por lo menos una de las secuencias de ß-glucosidasa se deriva de un polipéptido de Tn3B. Por ejemplo, un polipéptido de Tn3B quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del N-terminal de un polipéptido de Tn3B o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec . con núm. de ident.:79. Por ejemplo, un polipéptido de Tn3B quimérico/de fusión puede comprender un polipéptido que tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos derivado de una secuencia de la misma longitud a partir del C-terminal de un polipéptido de Tn3B o una variante de este que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident.:79. En ciertas modalidades, un polipéptido de Tn3B quimérico/de fusión puede comprender una secuencia de bucle que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivado de una secuencia de la misma longitud de un polipéptido de Tn3B o una variante de este y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205).
Por consiguiente, la presente descripción proporciona una cantidad de polipéptidos aislados, sintéticos o recombinantes o variantes de estos tal como se describe más abajo :
(1) un polipéptido que tiene por lo menos 80 %, 85 %,
90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 24 a 766 de la sec. con núm. de ident.:2; (ii) 73 a 321 de la sec. con núm. de ident.:2; (iii) 73 a 394 de la sec. con núm. de ident. :2; (iv) 395 a 622 de la sec. con núm. de ident . : 2 ; (v) 24 a 622 de la sec. con núm. de ident . : 2 ; o (iv) 73 a 622 de la sec. con núm. de ident. :2; el polipéptido tiene actividad de ß-xilosidasa,- o
(2) un polipéptido que tiene por lo menos 80 %, 85 %,
90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 21 a 445 de la sec. con núm. de ident. -.4; (ii) 21 a 301 de la sec. con núm. de ident. :4; (iii) 21 a 323 de la sec. con núm. de ident. :4; (iv) 21 a 444 de la sec. con núm. de ident.:4; (v) 302 a 444 de la sec. con núm. de ident.:4; (vi) 302 a 445 de la sec. con núm. de ident.:4; (vii) 324 a 444 de la sec. con núm. de ident.:4; o (viii) 324 a 445 de la sec. con núm. de ident. :4; el polipéptido tiene actividad de ß-xilosidasa ; o
(3) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 19 a 530 de la sec. con núm. de ident . : 6 ; (ii) 29 a 530 de la sec. con núm. de ident.:6; (iii) 19 a 300 de la sec. con núm. de ident. :6; o (iv) 29 a 300 de la sec. con núm. de ident. :6; el polipéptido tiene actividad de ß-xilosidasa; o
(4) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o
100 % de identidad con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 20 a 439 de la sec. con núm. de ident. :8; (ii) 20 a 291 de la sec. con núm. de ident. : 8 ; (iii) 145 a 291 de la sec. con núm. de ident. : 8 ; o (iv) 145 a 439 de la sec. con núm. de ident . : 8 ; el polipéptido tiene actividad de ß-xilosidasa; o
(5) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 23 a 449 de la sec. con núm. de ident.rlO; (ii) 23 a 302 de la sec . con núm. de ident.:10; (iii) 23 a 320 de la sec. con núm. de ident.rlO; (iv) 23 a 448 de la sec. con núm. de ident.:10; (v) 303 a 448 de la sec. con núm. de ident.:10; (vi) 303 a 449 de la sec. con núm. de ident . :10; (vii) 321 a 448 de la sec. con núm. de ident.:10; o (viii) 321 a 449 de la sec. con núm. de ident. :10; el polipéptido tiene actividad de ß-xilosidasa; o
(6) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 17 a 574 de la sec. con núm. de ident. :12; (ii) 27 a 574 de la sec. con núm. de ident. :12; (iii) 17 a 303 de la sec. con núm. de ident. :12; o (iv) 27 a 303 de la sec. con núm. de ident. :12; el polipéptido tiene actividad de ß-xilosidasa y actividad de L-a-arabinofuranosidasa; o
(7) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % O 100 % de identidad con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 21 a 676 de la sec. con núm. de ident. : 14 ; (ii) 21 a 652 de la sec. con núm. de ident.: 14; (iii) 469 a 652 de la sec. con núm. de ident . 14 ; o (iv) 469 a 676 de la sec. con núm. de ident. : 14 ; el polipéptido tiene actividad de ß-xilosidasa y actividad de L-a-arabinofuranosidasa ; o
(8) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 19 a 340 de la sec . con núm. de ident.:16; (ii) 53 a 340 de la sec. con núm. de ident.:16; (iii) 19 a 383 de la sec. con núm. de ident.:16; o (iv) 53 a 383 de la sec. con núm. de ident. :16; el polipéptido tiene actividad de ß-xilosidasa; o
(9) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o
100 % de identidad con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 21 a 341 de la sec. con núm. de ident.: 18; (ii) 107 a 341 de la sec. con núm. de ident.: 18; (iii) 21 a 348 de la sec. con núm. de ident. :18; o (iv) 107 a 348 de la sec. con núm. de ident. :18; el polipéptido tiene actividad de ß-xilosidasa ; o
(10) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % O 100 % de identidad con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 15 a 558 de la sec. con núm. de ident. :20; o (ii) 15 a 295 de la sec. con núm. de ident. :20; el polipéptido tiene actividad de L-a-arabinofuranosidasa ; o
(11) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 ¾, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 21 a 632 de la sec . con núm. de ident. :22; (ii) 461 a 632 de la sec. con núm. de ident. :22; (iii) 21 a 642 de la sec. con núm. de ident. :22; o (iv) 461 a 642 de la sec. con núm. de ident. :22; el polipéptido tiene actividad de L- -arabinofuranosidasa ; o
(12) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 20 a 341 de la sec. con núm. de ident. :28; (ii) 21 a 350 de la sec. con núm. de ident. :28; (iii) 107 a 341 de la sec. con núm. de ident. :28; o (iv) 107 a 350 de la sec. con núm. de ident. :28; el polipéptido tiene actividad de ß-xilosidasa; o
(13) un polipéptido que tiene por lo menos 80 %, 85 %,
90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 21 a 660 de la sec. con núm. de ident. :32; (ii) 21 a 645 de la sec. con núm. de ident. :32; (iii) 450 a 645 de la sec. con núm. de ident. :32; o (iv) 450 a 660 de la sec. con núm. de ident. :32; el polipéptido tiene actividad de L-a-arabinofuranosidasa ; o
(14) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec . con núm. de ident. :52 o con respecto a los residuos (i) 22-255, (ii) 22-343, (iii) 307-343, (iv) 307-344 o (v) 22-344 de la sec. con núm. de ident. :52; el polipéptido tiene actividad de GH61/endoglucanasa ; o
(15) un polipéptido que tiene por lo menos 80 %, 85 %,
90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.: 54 o con respecto a los residuos (i) 18-282, (ii) 18-601, (iii) 18-733, (iv) 356-601 o (v) 356-733 de la sec. con núm. de ident. : 54 ,- el polipéptido tiene actividad de ß-glucosidasa; o
(16) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. :56 o con respecto a los residuos (i) 22-292, (ii) 22-629, (iii) 22-780, (iv) 373-629 o (v) 373-780 de la sec. con núm. de ident. :56; el polipéptido tiene actividad de ß-glucosidasa; o
(17) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o
100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. :58 o con respecto a los residuos (i) 20-321, (ii) 20-651, (iii) 20-811, (iv) 423-651 o (v) 423-811 de la sec. con núm. de ident. :58; el polipéptido tiene actividad de ß-glucosidasa ; o
(18) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % O 100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.:60 o con respecto a los residuos (i) 20-327, (ii) 22-600, (iii) 20-899, (iv) 428-899 o (v) 428-660 de la sec. con núm. de ident.:60; el polipéptido tiene actividad de ß-glucosidasa; o
(19) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. :62 o con respecto a los residuos (i) 20-287, (ii) 22-611, (iii) 20-744, (iv) 362-611 o (v) 362-744 de la sec. con núm. de ident. :62; el polipéptido tiene actividad de ß-glucosidasa; o
(20) un polipéptido que tiene por lo menos 80 %, 85 %,
90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.: 64 o con respecto a los residuos (i) 19-307, (ii) 19-640, (iii) 19-874, (iv) 407-640 o (v) 407-874 de la sec. con núm. de ident. :64; el polipéptido tiene actividad de ß-glucosidasa; o
(21) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. :66 o con respecto a los residuos (i) 20-297, (ii) 20-629, (iii) 20-857, (iv) 396-629 o (v) 396-857 de la sec . con núm. de ident.:66; el polipéptido tiene actividad de ß-glucosidasa; o
(22) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o
100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. :68 o con respecto a los residuos (i) 20-300, (ii) 20-634, (iii) 20-860, (iv) 400-634 o (v) 400-860 de la sec. con núm. de ident. :68; el polipéptido tiene actividad de ß-glucosidasa; o
(23) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. :70 o con respecto a los residuos (i) 20-327, (ii) 20-660, (iii) 20-899, (iv) 428-660 o (v) 428-899 de la sec. con núm. de ident. :70; el polipéptido tiene actividad de ß-glucosidasa ; o
(24) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.: 72 o con respecto a los residuos (i) 19-314, (ii) 19-647, (iii) 19-886, (iv) 415-647 o (v) 415-886 de la sec. con núm. de ident. : 72 ; el polipéptido tiene actividad de ß-glucosidasa; o
(25) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % O 100 % de identidad con respecto a la secuencia de aminoácidos de la sec . con núm. de ident. :74 o con respecto a los residuos (i) 20-295, (ii) 20-647, (iii) 20-880, (iv) 414-647 o (v) 414-880 de la sec. con núm. de ident. : 74 ; el polipéptido tiene actividad de ß-glucosidasa ; o
(26) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respectó a la secuencia de aminoácidos de la sec. con núm. de ident. :76 o con respecto a los residuos (i) 19-296, (ii) 19-649, (iii) 19-890, (iv) 415-649 o (v) 415-890 de la sec. con núm. de ident. :76; el polipéptido tiene actividad de ß-glucosidasa; o
(27) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o
100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. :78 o con respecto a los residuos (i) 20-354, (ii) 20-660, (iii) 20-805, (iv) 449-660 o (v) 449-805 de la sec. con núm. de ident. :78; el polipéptido tiene actividad de ß-glucosidasa; o
(28) un polipéptido que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. :79; el polipéptido tiene actividad de ß-glucosidasa; o
(29) un polipéptido que tiene una longitud de por lo menos aproximadamente 100 (por ejemplo, por lo menos aproximadamente 150, 175, 200, 225 o 250) residuos de aminoácidos y comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec . con núms . de ident . : 84 y 88; (2) las sec. con núms . de ident.:85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec. con núm. de ident.: 87; (5) las sec. con núms. de ident.: 84, 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident.: 84, 88 y 90; (8) las sec. con núms. de ident. : 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms . de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident. : 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91, en donde el polipéptido tiene actividad de GH6l/endoglucanasa ; o
(30) un polipéptido que comprende por lo menos 2 o más secuencias de ß-glucosidasa, en donde la primera secuencia de ß-glucosidasa tiene una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 220, 240, 260, 280, 300, 320, 340, 360, 380 o 400) residuos que comprende una o más o todas las sec. con núms. de ident.: 197-202, mientras que la segunda secuencia de ß-glucosidasa tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 120, 140, 160, 180, 200) residuos de aminoácidos y comprende la sec. con núm. de ident.:203, en donde el polipéptido comprende, opcionalmente , además, una tercera secuencia de ß-glucosidasa que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivada de una secuencia de bucle de las sec. con núms . de ident.:66 o que comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) Y IT (sec. con núm. de ident.:205), en donde el polipéptido tiene actividad de ß-glucosidasa .
La presente descripción proporciona, además, composiciones enzimáticas diseñadas por ingeniería genética (por ejemplo, composiciones de celulasa) o caldos de fermentación enriquecidos con uno o más de los polipéptidos descritos anteriormente. La composición de celulasa puede ser, por ejemplo, una composición de células fúngicas filamentosas, tal como una composición de celulasa de Trichoder a, Chrysosporium o Aspergillus,- una composición de celulasa de levadura, tal como una composición de celulasa de Saccharomyces cerevisiae o una composición de celulasa bacteriana, por ejemplo, una composición de celulasa de Bacillus . El caldo de fermentación puede ser un caldo de fermentación de un hongo filamentoso, por ejemplo, un caldo de fermentación de Trichoderma, Humicola , Fusariu , Aspergillus, Neurospora, Penicilliu , Cephalosporium, Achlya, Podospora, Endothia, Mucor, Cochliobolus, Pyricularia, o Chrysosporium. Particularmente, el caldo de fermentación puede ser, por ejemplo, un caldo de fermentación de Trichoderma spp. tal como T. reesei, o Penicillium spp., tal como P. funiculosum. El caldo de fermentación puede estar sujeto, además, adecuadamente, a un conjunto pequeño de etapas de procesamiento posteriores a la producción, por ejemplo, purificación, filtración, ultrafiltración o una etapa de exterminación de células y, después, puede usarse en una formulación de caldo entera.
La descripción proporciona, además, células huésped diseñadas en forma recombinante por ingeniería genética para expresar un polipéptido descrito anteriormente. Las células huésped pueden ser, por ejemplo, células huésped fúngicas o células huésped bacterianas. Las células huésped fúngicas pueden ser, por ejemplo, células huésped fúngicas filamentosas, tales como células de Trichoderma, Humicola, Fusarium, Aspergillus, Neurospora, Penicillium, Cephalosporium, Achlya, Podospora, Endothia, Mucor, cochliobolus, Pyricularia o Chrysosporium. Particularmente, las células huésped pueden ser, por ejemplo, una célula de Trichoderma spp. (tal como una célula de T. reesei) o una célula de Penicillium (tal como una célula de P. funiculosum), una célula de Aspergillus (tal como una célula de A. oryzae o A. nidulans) o una célula de Fusarium (tal como una célula de F. vertidlloides o F. oxysporum) .
5.1.1 Proteínas de fusión o quiméricas
La presente descripción proporciona una proteína de fusión/quimérica que incluye un dominio de una proteína de la presente descripción unida a uno o más segmentos de fusión que son, típicamente, heterólogos a la proteína (es decir, derivados de una fuente diferente a la proteína de la descripción) . Los segmentos de fusión/quiméricos adecuados incluyen, sin limitarse a, segmentos que pueden mejorar la estabilidad de una proteína, proporcionar otra actividad biológica deseable o niveles mejorados de actividad biológica deseable y/o facilitar la purificación de la proteína (por ejemplo, por medio de cromatografía por afinidad) . Un segmento de fusión adecuado puede ser un dominio de cualquier tamaño que tiene la función deseada (por ejemplo, imparte una mayor estabilidad, solubilidad, acción o actividad biológica; y/o simplifica la purificación de una proteína) . Una proteína de fusión/híbrida puede construirse a partir de 2 o más segmentos de fusión/quiméricos , cada uno de los cuales o por lo menos dos de los cuales se derivan a partir de una fuente o microorganismo diferente. Los segmentos de fusión/híbridos pueden unirse a terminales amino y/o carboxilo del dominio o los dominios de una proteína de la presente descripción. Los segmentos de fusión pueden ser sensibles al clivaje. Esta sensibilidad puede proporcionar cierta ventaja, por ejemplo, puede permitir la recuperación directa de la proteína de interés. Las proteínas de fusión se producen, preferentemente, por medio del cultivo de una célula recombinante transfectada con un ácido nucleico de fusión que codifica una proteína, que incluye un segmento de fusión unido al extremo terminal carboxilo o amino o segmentos de fusión unidos a los extremos terminales carboxilo y amino, de una proteína o dominio de esta.
En algunos aspectos, la descripción proporciona ciertas proteínas quiméricas/de fusión diseñadas por ingeniería genética de modo que comprendan 2 o más secuencias derivadas de 2 o más enzimas de clases de enzimas diferentes o 2 o más enzimas de la misma clase o de una clase similar, pero derivadas de organismos diferentes. En ciertos aspectos, la descripción proporciona ciertos polipéptidos o proteínas quiméricas/de fusión diseñadas por ingeniería genética para mejorar ciertas propiedades de modo que los polipéptidos quiméricos/de fusión sean más adecuados para aplicaciones industriales deseables, por ejemplo, cuando se usan para hidrolizar materiales de biomasa. En algunos aspectos, las propiedades mejoradas pueden incluir, por ejemplo, estabilidad mejorada. La estabilidad mejorada puede reflejarse en una estabilidad proteolítica mejorada, por ejemplo, por medio de un nivel menor de clivaje proteolítico observado después de un cierto periodo de almacenamiento en condiciones de almacenamiento estándar, por un nivel menor de clivaje proteolítico observado después de que la proteína es expresada por una célula huésped durante el proceso de expresión en condiciones de expresión adecuadas o por un nivel menor de clivaje proteolítico observado después de que la célula huésped modificada genéticamente produce la proteína en forma recombinante , por ejemplo, en condiciones de producción estándar.
En ciertas modalidades, la descripción proporciona un polipéptido de ß-glucosidasa quimérico/de fusión. En algunos aspectos, la ß-glucosidasa quimérica/de fusión comprende 2 o más secuencias de ß-glucosidasa, en donde la primera secuencia tiene una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 250, 300, 350 o 400) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %) 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que cualquiera de las sec . con núms . de ident . : 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, mientras que la segunda secuencia es una secuencia que tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 125, 150 o 200) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que la sec . con núm. de ident.:60. En algunos aspectos, la ß-glucosidasa quimérica/de fusión comprende 2 o más secuencias de ß -glucosidasa, en donde la primera secuencia tiene una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 250, 300, 350 o 400) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que la sec. con núm. de ident.:60, mientras que la segunda secuencia es una secuencia que tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 125, 150 o 200) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ej mplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 ¾) de identidad con respecto a una secuencia de la misma longitud que cualquiera de las sec. con núms . de ident . : 54, 56, 58, 62, 64,· 66, 68, 70, 72, 74, 76, 78 y 79. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) motivos de secuencias de aminoácidos de las sec. con núms . de ident . : 197-202 y la segunda de las dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident. :203. En ciertas modalidades, el polipéptido de ß-glucosidasa de fusión/quimérico tiene actividad de ß-glucosidasa . En algunas modalidades, la primera secuencia está en el N-terminal del polipéptido de ß-glucosidasa quimérico/de fusión, mientras que la segunda secuencia está en el C-terminal del polipéptido de ß-glucosidasa quimérico/de fusión. En algunas modalidades, la primera secuencia está conectada por su C-terminal a la segunda secuencia por su N-terminal, por ejemplo, la primera secuencia está inmediatamente adyacente o conectada directamente a la segunda secuencia. En otras modalidades, la primera secuencia está conectada a la segunda secuencia a través de un dominio conector. En ciertas modalidades, la primera secuencia, la segunda secuencia o ambas secuencias comprenden 1 o más sitios de glicosilación. En algunas modalidades, la primera o la segunda secuencia comprende una secuencia de bucle o una secuencia que codifica una estructura similar a un bucle derivada de un tercer polipéptido de ß-glucosidasa que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos y comprende una secuencia de aminoácidos de FDR SPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205). En ciertas modalidades, ni la primera ni la segunda secuencia comprende una secuencia de bucle, más bien el dominio conector que conecta la primera y la segunda secuencia comprende esa secuencia de bucle. En algunas modalidades, el polipéptido de ß-glucosidasa de fusión/quimérico tiene una estabilidad mejorada en comparación con los polipéptidos de ß-glucosidasa equivalentes a partir de los cuales se deriva la primera secuencia, la segunda secuencia o la secuencia del dominio conector. En algunas modalidades, la estabilidad mejorada es una estabilidad proteolítica mejorada que se refleja en una sensibilidad menor al clivaje proteolítico en un residuo en la secuencia de bucle o en un residuo o posición que está fuera de la secuencia de bucle, al clivaje proteolítico durante el almacenamiento en condiciones de almacenamiento estándar o durante la expresión y/o producción, en condiciones de expresión/producción estándar.
En ciertos aspectos, la descripción proporciona un polipéptido de ß-glucosidasa de fusión/quimérico derivado de 2 o más secuencias de ß-glucosidasa, en donde la primera secuencia se deriva de Fv3C y tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y la segunda secuencia se deriva de Tr3B y tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos. En algunas modalidades, el C-terminal de la primera secuencia está conectado al N-terminal de la segunda secuencia, por ejemplo, la primera secuencia está inmediatamente adyacente o conectada directamente a la segunda secuencia. En otras modalidades, la primera secuencia está conectada a la segunda secuencia a través de una secuencia conectora. En algunas modalidades, la primera o la segunda secuencia comprende una secuencia de bucle derivada de un tercer polipéptido de ß-glucosidasa que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205). En ciertas modalidades, ni la primera ni la segunda secuencia comprende la secuencia de bucle, más bien, la secuencia conectora que conecta la primera y la segunda secuencia comprende esa secuencia de bucle. En ciertas modalidades, la secuencia de bucle se deriva de un polipéptido Te3A. En algunas modalidades, el polipéptido de ß-glucosidasa de fusión/quimérico tiene estabilidad mejorada en comparación con cada polipéptido de ß-glucosidasa equivalente a partir del cual se deriva cada parte quimérica. Por ejemplo, la estabilidad mejorada es mayor que la del polipéptido de Fv3C, el polipéptido de Te3A y/o el polipéptido de Tr3B. En algunas modalidades, la estabilidad mejorada es una estabilidad proteolítica mejorada que se refleja, por ejemplo, por una sensibilidad menor al clivaje proteolítico en un residuo en la secuencia de bucle o en un residuo o posición que está fuera de la secuencia de bucle, durante el almacenamiento en condiciones de almacenamiento estándar o durante la expresión/ producción, en condiciones de expresión/producción estándar. Por ejemplo, el polipéptido de fusión/quimérico es menos sensible al clivaje proteolítico en un residuo o posición que está en el C-terminal de la secuencia de bucle en comparación con un polipéptido de Fv3C en la misma posición, por ejemplo, cuando se alinean las secuencias de la quimera y los polipéptidos de Fv3C.
Por consiguiente, las proteínas de la presente descripción incluyen, además, productos de expresión de fusiones génicas (por ejemplo, una forma sobreexpresada , soluble y activa de una proteína recombinante) o genes mutagenizados [por ejemplo, genes que tienen modificaciones de codones para mejorar la transcripción y traducción génica) y de genes truncados (por ejemplo, genes en los cuales se eliminaron secuencias señal o se sustituyeron por una secuencia señal heteróloga) .
Las glicosil hidrolasas que usan sustratos insolubles son, frecuentemente, enzimas modulares. Usualmente, comprenden módulos catalíticos unidos a l o más dominios de unión a carbohidratos (CBM) no catalíticos. Se piensa que los CBM promueven naturalmente la interacción de la glicosil hidrolasa con su polisacárido del sustrato objetivo. Por lo tanto, la descripción proporciona enzimas quiméricas con especificidad del sustrato alterada que incluyen, por ejemplo, enzimas quiméricas que tienen sustratos múltiples como resultado de los CBM heterólogos "empalmados" . Los CBM heterólogos de las enzimas quiméricas de la descripción pueden diseñarse, además, de modo que sean modulares y se unan a un módulo catalítico o dominio catalítico (un "CD" , por ejemplo, en un sitio activo) que puede ser heterólogo u homólogo a la glicosil hidrolasa. Por consiguiente, la descripción proporciona péptidos y polipéptidos que consisten en o comprenden módulos CBM/CD, que pueden aparearse o unirse homólogamente para formar pares CBM/CD quiméricos/heterólogos . Los polipéptidos/péptidos quiméricos pueden usarse para mejorar o alterar el desempeño de una enzima de interés.
Por consiguiente, la descripción proporciona enzimas quiméricas que comprenden, por ejemplo, por lo menos un CBM de una enzima o polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a cualquiera de las sec. con núms . de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 {por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos. En algunos aspectos, la descripción proporciona enzimas quiméricas que comprenden, por ejemplo, por lo menos un CBM de una enzima o polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a cualquiera de las sec. con núms. de ident.: 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos. En algunos aspectos, la descripción proporciona enzimas quiméricas que comprenden, por ejemplo, por lo menos un CBM de una enzima o polipéptido que tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 100, 150, 200, 250 o 300) residuos de aminoácidos, que comprenden uno o más motivos de secuencias seleccionados del grupo que consiste en (1) las sec. con núms. de ident. : 84 y 88; (2) las sec. con núms. de ident.:85 y 88; (3) la sec . con núm. de ident.: 86; (4) la sec. con núm. de ident.:87; (5) las sec. con núms. de ident.:84, 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident.: 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. En algunos aspectos, la descripción proporciona enzimas quiméricas que comprenden, por ejemplo, por lo menos un CBM de una enzima o polipéptido que tiene por lo menos aproximadamente 70 %, por ejemplo, por lo menos aproximadamente 71 %, 72 %, 73 %, 74 75 "o / 76 "o / 77 %, 78 % , 79 "o , 80 ~o , 81 %, 82 %, 83 %, 84 o
¦a / 85 86 Q, o /
87 %, 88 o.
¦o , 89 "5 , 90 "6 , 91 "o , 92 o
¾ , 93 94 o
"o / 95 %, 96 %,
97 %, 98 % o 99 % o total (100 %) de identidad con respecto a un polipéptido de cualquiera de las sec. con núms. de ident. :2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 43 y 45 en una región de por lo menos aproximadamente 10, por ejemplo, por lo menos aproximadamente 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325 o 350 residuos.
Por lo tanto, el polipéptido de la descripción puede ser, adecuadamente, una proteína de fusión que comprende dominios funcionales de dos o más proteínas diferentes (por ejemplo, un CBM de una proteína unida a un CD de otra proteína) .
Los polipéptidos de la descripción pueden obtenerse y/o usarse, adecuadamente, en una forma "prácticamente pura". Por ejemplo, un polipéptido de la descripción constituye por lo menos aproximadamente 80 % en peso (por ejemplo, por lo menos aproximadamente 85 % en peso, 90 % en peso, 91 % en peso, 92 % en peso, 93 % en peso, 94 % en peso, 95 % en peso, 96 % en peso, 97 % en peso, 98 % en peso o 99 % en peso) de la proteína total en una composición determinada que incluye, además, otros ingredientes, tales como un regulador o solución .
Además, los polipéptidos de la descripción pueden obtenerse y/o usarse, adecuadamente, en caldos de cultivo (por ejemplo, un caldo de cultivo fúngico filamentoso) . Los caldos de cultivo pueden ser una composición enzimática modificada genéticamente, por ejemplo, el caldo de cultivo puede producirse por medio de una célula huésped recombinante modificada genéticamente para expresar un polipéptido heterólogo de la descripción o por medio de una célula huésped recombinante modificada genéticamente para expresar un polipéptido endógeno de la descripción en cantidades mayores o menores que los niveles de expresión endógena (por ejemplo, en una cantidad que es 1, 2, 3, 4, 5 o más veces mayor o menos que los niveles de expresión endógena) . Además, los caldos de cultivo de la invención pueden producirse por medio de ciertas cepas de células huésped "integradas" diseñadas por ingeniería genética para expresar una pluralidad de los polipéptidos de la descripción en relaciones deseadas. Las relaciones deseadas ilustrativas se describen en la presente descripción, por ejemplo, en la Sección 5.3 más abajo.
5.2 Ácidos nucleicos y células huésped
La presente descripción proporciona ácidos nucleicos que codifican polipéptidos de la descripción, por ejemplo, los descritos en la Sección 5.1 más abajo.
En algunos aspectos, la descripción proporciona nucleótidos aislados, sintéticos o recombinantes que codifican un polipéptido de ß-glucosidasa que tiene por lo menos 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 ¾, 99 % o 100 %) de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident. : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o en el dominio catalítico (CD) de longitud completa o el dominio de unión a carbohidratos (CBM) de longitud completa. En algunas modalidades, el nucleótido aislado, sintético o recombinante codifica un polipéptido de ß-glucosidasa que es una fusión/quimera de dos o más secuencias de ß-glucosidasa . El polipéptido de ß-glucosidasa de fusión/quimérico puede comprender una primera secuencia que tiene una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 250, 300, 350, 400 o 500) residuos de aminoácidos y puede comprender uno o más o todos los motivos de secuencias de aminoácidos de las sec . con núms . de ident.: 96-108. El polipéptido de ß-glucosidasa híbrido/quimérico puede comprender una segunda secuencia de ß-glucosidasa que tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 125, 150, 175 o 200) residuos de aminoácidos y puede comprender uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 109-116. Particularmente, la primera de las dos o más secuencias de ß -glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 197-202 y la segunda de las dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende sec . con núm. de ident.:203. El C-terminal de la primera secuencia de ß-glucosidasa se puede conectar al N-terminal de la segunda secuencia de ß-glucosidasa . En otras modalidades, la primera y la segunda secuencia de ß-glucosidasa se conectan por medio de una secuencia conectora. La secuencia conectora puede comprender una secuencia de bucle que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivada de un tercer polipéptido de ß-glucosidasa y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) Y IT (sec. con núm. de ident.:205).
En ciertos aspectos, la descripción proporciona un nucleótido aislado, sintético o recombinante que codifica un polipéptido de ß-glucosidasa que es un híbrido de por lo menos 2 (por ejemplo, 2, 3 o incluso 4) secuencias de ß-glucosidasa, en donde la primera de por lo menos 2 secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 250, 300, 350 o 400) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que cualquiera de las sec. con núms . de ident . : 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, mientras que la segunda de por lo menos 2 secuencias de ß -glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 125, 150 o 200) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que la sec. con núm. de ident.:60. En una modalidad alternativa, la descripción proporciona un nucleótido aislado, sintético o recombinante que codifica un polipéptido de ß -glucosidasa que es un híbrido de por lo menos 2 (por ejemplo, 2, 3 o incluso 4) secuencias de ß-glucosidasa, en donde la primera de por lo menos 2 secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 250, 300, 350 o 400) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 ¾, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que la sec. con núm. de ident.:60, mientras que la segunda de por lo menos 2 secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 125, 150 o 200) residuos de aminoácidos y comprende una secuencia que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con respecto a una secuencia de la misma longitud que cualquiera de las sec. con núms. de ident.: 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79. En ciertas modalidades, el nucleótido codifica un polipéptido de ß-glucosidasa de fusión/quimérico que tiene actividad de ß-glucosidasa. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 197-202 y la segunda de las dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident. :203. En algunas modalidades, el nucleótido codifica una primera secuencia de aminoácidos que está en el N-terminal del polipéptido de ß-glucosidasa quimérico/de fusión. En algunas modalidades, el nucleótido codifica una segunda secuencia de aminoácidos que está en el C-terminal del polipéptido de ß-glucosidasa quimérico/de fusión. El C-terminal de la primera secuencia de aminoácidos se puede conectar al N-terminal de la segunda secuencia de aminoácidos. En otras modalidades, la primera secuencia de aminoácidos no está inmediatamente adyacente a la segunda secuencia de aminoácidos, más bien la primera secuencia está conectada a la segunda secuencia a través de un dominio conector. En algunas modalidades, la primera secuencia de aminoácidos, la segunda secuencia de aminoácidos o el dominio conector comprende una secuencia de aminoácidos que comprende una secuencia de bucle o una secuencia que representa una estructura similar a un bucle. En ciertas modalidades, la secuencia de bucle se deriva de un tercer polipéptido de ß-glucosidasa, tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos y comprende una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD (R/K) YNIT (sec. con núm. de ident.:205).
En algunos aspectos, la descripción proporciona nucleótidos aislados, sintéticos o recombinantes que tienen por lo menos 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident.: 52, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 92 o 94 o con respecto a un fragmento que tiene una longitud de por lo menos aproximadamente 300 {por ejemplo, por lo menos aproximadamente 300, 400, 500 o 600) residuos de cualquiera de las sec . con núms . de ident. : 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 92 o 94. En ciertas modalidades, la descripción proporciona nucleótidos aislados, sintéticos o recombinantes capaces de hibridarse a cualquiera de las sec. con núms. de ident.: 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 92 o 94, a un fragmento con una longitud de por lo menos aproximadamente 300 residuos o a un complemento de estas, en condiciones de rigurosidad baja, rigurosidad media, rigurosidad alta o rigurosidad muy alta.
En algunos aspectos, la descripción proporciona un nucleótido aislado, sintético o recombinante que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident.: 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o en el dominio catalítico (CD) de longitud completa o el dominio de unión a carbohidratos (CBM) de longitud completa. En ciertas modalidades, el nucleótido aislado, sintético o recombinante codifica un polipéptido que tiene actividad de GH61/endoglucanasa . En algunas modalidades, la descripción proporciona un aislado, sintético o recombinante que codifica un polipéptido que comprende una secuencia de aminoácidos con una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 100, 150, 200, 250 o 300) residuos de aminoácidos que comprenden uno o más motivos de secuencias seleccionados del grupo que consiste en (1) las sec . con núms . de ident.:84 y 88; (2) las sec. con núms . de ident.:85 y 88; (3) la sec. con núm. de ident.:86; (4) la sec. con núm. de ident.:87; (5) las sec. con núms. de ident.:84, 88 y 89; (6) las sec. con núms. de ident.:85, 88 y 89; (7) las sec. con núms. de ident . : 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 9G; (12) las sec. con núms. de ident. : 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. En ciertas modalidades, el polinucleótido es un polinucleótido que codifica un polipéptido que tiene por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la sec. con núm. de ident.: 52. En algunas modalidades, el polinucleótido codifica un polipéptido de endoglucanasa de GH61 (por ejemplo, un polipéptido de EG IV de un organismo adecuado, tal como, sin limitarse a, Eg4 de T. reesei) .
En algunos aspectos, la descripción proporciona un polinucleótido aislado, sintético o recombinante que codifica un polipéptido que tiene por lo menos aproximadamente 70 %, (por ejemplo, por lo menos aproximadamente 71 %, 72 %, 73 %,
74 %, 75 %, 76 77 %, 78 %, 79 %, 80 %, 81 %, 82 % , 83 %,
84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %,
94 %, 95 %, 96 %, 97 %, 98 % o 99 % o total (100 %)) de identidad de secuencia con respecto a un polipéptido de cualquiera de las sec . con núms . de ident . : 2 , 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 43 y 45 en una región de por lo menos aproximadamente 10, por ejemplo, por lo menos aproximadamente 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325 o 350 residuos o en el polipéptido inmaduro de longitud completa, el polipéptido maduro de longitud completa, el dominio catalítico (CD) de longitud completa o el dominio de unión a carbohidratos (CBM) de longitud completa. En algunos aspectos, la descripción proporciona un polinucleótido aislado, sintético o recombinante que tiene por lo menos aproximadamente 70 % (por ejemplo, por lo menos aproximadamente 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % o total (100 %) ) de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident.: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 y 41 o con respecto a un fragmento de estas. Por ejemplo, el fragmento puede tener una longitud de por lo menos aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 residuos. En algunas modalidades, la descripción proporciona un polinucleótido aislado, sintético o recombinante que se híbrida en condiciones de rigurosidad baja, condiciones de rigurosidad media, condiciones de rigurosidad alta o condiciones de rigurosidad muy alta con respecto a cualquiera de las sec. con núms. de ident.: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 y 41 o con respecto a un fragmento o subsecuencia de estas .
Por lo tanto, la descripción proporciona, específicamente, un ácido nucleico que codifica un polipéptido de Fv3A, Pf43A, Fv43E, Fv39A, Fv43A, Fv43B, Pa51A, Gz43A, Fo43A, Af43A, Pf51A, AfuXyn2 , AfuXyn5, Fv43D, Pf43B , Fv43B, Fv51A, Xyn3 de T. reesei, Xyn2 de G. reesei, Bxll de T. reesei, Eg4 de T. reesei, Pa3D, Fv3G, Fv3D, Fv3C, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G o Tn3B (que incluye una variante, mutante o fusión/quimera de estos) . La descripción proporciona, además, un ácido nucleico que codifica una enzima quimérica o de fusión que comprende una parte de Fv3C y una parte de Tr3B. En algunas modalidades, el polipéptido quimérico o de fusión puede comprender, además, un dominio conector que comprende una secuencia de bucle de por lo menos aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivada de Te3A. Por ejemplo, la descripción proporciona un nucleótido aislado que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a 92 o 94.
Por ejemplo, la descripción proporciona una molécula de ácido nucleico aislada, la molécula de ácido nucleico codifica :
(1) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 24 a 766 de la sec . con núm. de ident . : 2 ; (ii) 73 a 321 de la sec . con núm. de ident . : 2 ; (iii) 73 a 394 de la sec. con núm. de ident . : 2 ; (iv) 395 a 622 de la sec. con núm. de ident. :2; (v) 24 a 622 de la sec. con núm. de ident. : 2 ; o (iv) 73 a 622 de la sec. con núm. de ident . : 2 ; el polipéptido tiene, preferentemente, actividad de ß-xilosidasa; o
(2) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 21 a 445 de la sec . con núm. de ident . : 4 ; (ii) 21 a 301 de la sec. con núm. de ident.: 4; (iii) 21 a 323 de la sec. con núm. de ident . : 4 ; (iv) 21 a 444 de la sec. con núm. de ident. :4; (v) 302 a 444 de la sec. con núm. de ident. : 4 ; (vi) 302 a 445 de la sec. con núm. de ident. :4; (vii) 324 a 444 de la sec. con núm. de ident. :4; o (viii) 324 a 445 de la sec. con núm. de ident. :4; el polipéptido tiene, preferentemente, actividad de ß-xilosidasa; o
(3) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 19 a 530 de la sec. con núm. de ident . : 6 ; (ii) 29 a 530 de la sec. con núm. de ident . : 6 ; (iii) 19 a 300 de la sec. con núm. de ident. :6; o (iv) 29 a 300 de la sec. con núm. de ident. :6; el polipéptido tiene, preferentemente, actividad de ß-xilosidasa o
(4) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 ¾, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 20 a 439 de la sec. con núm. de ident . : 8 ; (ii) 20 a 291 de la sec . con núm. de ident . : 8 ; (iii) 145 a 291 de la sec. con núm. de ident. : 8 ; o (iv) 145 a 439 de la sec. con núm. de ident. : 8 ; el polipéptido tiene, preferentemente, actividad de ß-xilosidasa; o
(5) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 23 a 449 de la sec. con núm. de ident.: 10; (ii) 23 a 302 de la sec. con núm. de ident. :10; (iii) 23 a 320 de la sec. con núm. de ident. :10; (iv) 23 a 448 de la sec. con núm. de ident. :10; (v) 303 a 448 de la sec. con núm. de ident. :10; (vi) 303 a 449 de la sec. con núm. de ident.: 10; (vii) 321 a 448 de la sec. con núm. de ident. :10; o (viii) 321 a 449 de la sec. con núm. de ident. :10; el polipéptido tiene, preferentemente, actividad de ß-xilosidasa; o
(6) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 17 a 574 de la sec. con núm. de ident.:l2; (ii) 27 a 574 de la sec . con núm. de ident.:12; (iii) 17 a 303 de la sec. con núm. de ident.:12; o (iv) 27 a 303 de la sec. con núm. de ident .: 12 ; el polipéptido tiene, preferentemente, actividad de ß-xilosidasa y actividad de L-oí-arabinofuranosidasa; o
(7) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 21 a 676 de la sec. con núm. de ident. :14; (ii) 21 a 652 de la sec. con núm. de ident .: 14 ; (iii) 469 a 652 de la sec. con núm. de ident .: 14 ; o (iv) 469 a 676 de la sec. con núm. de ident .: 1 ; el polipéptido tiene, preferentemente, actividad de ß-xilosidasa y actividad de L-OÍ-arabinofuranosidasa ; o
(8) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % O 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 19 a 340 de la sec. con núm. de ident.: 16; (ii) 53 a 340 de la sec. con núm. de ident. :16; (iii) 19 a 383 de la sec. con núm. de ident. -.16; o (iv) 53 a 383 de la sec. con núm. de ident. :16; el polipéptido tiene, preferentemente, actividad de ß-xilosidasa; o
(9) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 21 a 341 de la sec. con núm. de ident.:18; (ii) 107 a 341 de la sec. con núm. de ident.:18; (iii) 21 a 348 de la sec. con núm. de ident.:18; o (iv) 107 a 348 de la sec. con núm. de ident. :18; el polipéptido tiene, preferentemente, actividad de ß-xilosidasa; o
(10) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 15 a 558 de la sec. con núm. de ident. :20; o (ii) 15 a 295 de la sec. con núm. de ident. :20; el polipéptido tiene, preferentemente, actividad de L- -arabinofuranosidasa; o
(11) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %,
92 ¾, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 21 a 632 de la sec. con núm. de ident. :22; (ii) 461 a 632 de la sec. con núm. de ident. :22; (iii) 21 a 642 de la sec. con núm. de ident.:22; o (iv) 461 a 642 de la sec. con núm. de ident. :22; el polípéptido tiene, preferentemente, actividad de L-a-arabinofuranosidasa ; o
(12) un polípéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %,
92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos que corresponde a las posiciones (i) 20 a 341 de la sec. con núm. de ident.:28; (ii) 21 a 350 de la sec. con núm. de ident.:28; (iii) 107 a 341 de la sec. con núm. de ident.:28; o (iv) 107 a 350 de la sec. con núm. de ident. :28; el polípéptido tiene actividad de ß-xilosidasa; o
(13) un polípéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia . de aminoácidos que corresponde a las posiciones (i) 21 a 660 de la sec. con núm. de ident . :32; (ii) 21 a 645 de la sec. con núm. de ident. :32; (iii) 450 a 645 de la sec. con núm. de ident. :32; o (iv) 450 a 660 de la sec. con núm. de ident. :32; el polípéptido tiene, preferentemente, actividad de L-a-arabinofuranosidasa; o
(14) un polípéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec . con núm. de ident.:52 o con respecto a los residuos (i) 22-255, (ii) 22-343, (iii) 307-343, (iv) 307-344 o (v) 22-344 de la sec. con núm. de ident.:52; el polipéptido tiene, preferentemente, actividad de GH61/ endoglucanasa; o
(15) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.:54 o con respecto a los residuos (i) 18-282, (ii) 18-601, (iii) 18-733, (iv) 356-601 o (v) 356-733 de la sec. con núm. de ident.:54; el polipéptido tiene, preferentemente, actividad de ß-glucosidasa ; o
(16) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. :56 o con respecto a los residuos (i) 22-292, (ii) 22-629, (iii) 22-780, (iv) 373-629 o (v) 373-780 de la sec. con núm. de ident. :56; el polipéptido tiene, preferentemente, actividad de ß-glucosidasa; o
(17) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec . con núm. de ident.:58 o con respecto a los residuos (i) 20-321, (ii) 20-651, (iii) 20-811, (iv) 423-651 o (v) 423-811 de la sec. con núm. de ident.:58; el polipéptido tiene, preferentemente, actividad de ß-glucosidasa; o
(18) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %,
92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident . :60 o con respecto a los residuos (i) 20-327, (ii) 22-600, (iii) 20-899, (iv) 428-899 o (v) 428-660 de la sec. con núm. de ident. :60; el polipéptido tiene, preferentemente, actividad de ß-glucosidasa ; o
(19) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. :62 o con respecto a los residuos (i) 20-287, (ii) 22-611, (iii) 20-744, (iv) 362-611 o (v) 362-744 de la sec. con núm. de ident. :62; el polipéptido tiene, preferentemente, actividad de ß-glucosidasa; o
(20) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec . con núm. de ident.:64 o con respecto a los residuos (i) 19-307, (ii) 19-640, (iii) 19-874, (iv) 407-640 o (v) 407-874 de la sec. con núm. de ident . :64; el polipéptido tiene, preferentemente, actividad de ß-glucosidasa; o
(21) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. :66 o con respecto a los residuos (i) 20-297, (ii) 20-629, (iii) 20-857, (iv) 396-629 o (v) 396-857 de la sec. con núm. de ident. :66; el polipéptido tiene, preferentemente, actividad de ß-glucosidasa ; o
(22) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. :68 o con respecto a los residuos (i) 20-300, (ii) 20-634, (iii) 20-860, (iv) 400-634 o (v) 400-860 de la sec . con núm. de ident. :68; el polipéptido tiene, preferentemente, actividad de ß-glucosidasa ; o
(23) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %,
92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident.:70 o con respecto a los residuos (i) 20-327, (ii) 20-660, (iii) 20-899, (iv) 428-660 o (v) 428-899 de la sec. con núm. de ident.:70; el polipéptido tiene, preferentemente, actividad de ß-glucosidasa; o
(24) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident . :72 o con respecto a los residuos (i) 19-314, (ii) 19-647, (iii) 19-886, (iv) 415-647 o (v) 415-886 de la sec. con núm. de ident. :72; el polipéptido tiene, preferentemente, actividad de ß-glucosidasa ; o
(25) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 ¾, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec . con núm. de ident.:74 o con respecto a los residuos (i) 20-295, (ii) 20-647, (iii) 20-880, (iv) 414-647 o (v) 414-880 de la sec. con núm. de ident.:74; el polipéptido tiene, preferentemente, actividad de ß-glucosidasa ; o
(26) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident . :76 o con respecto a los residuos (i) 19-296, (ii) 19-649, (iii) 19-890, (iv) 415-649 o (v) 415-890 de la sec . con núm. de ident. :76; el polipéptido tiene, preferentemente, actividad de ß-glucosidasa; o
(27) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec. con núm. de ident. :78 o con respecto a los residuos (i) 20-354, (ii) 20-660, (iii) 20-805, (iv) 449-660 o (v) 449-805 de la sec. con núm. de ident. :78; el polipéptido tiene, preferentemente, actividad de ß-glucosidasa ; o
(28) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia con respecto a la secuencia de aminoácidos de la sec . con núm. de ident.:79; el polipéptido tiene, preferentemente, actividad de ß-glucosidasa; o
(29) un polipéptido que tiene una longitud de por lo menos aproximadamente 100 (por ejemplo, por lo menos aproximadamente 150, 175, 200, 225 o 250) residuos y que comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec. con núms . de ident.:84 y 88; (2) las sec. con núms. de ident.:85 y 88; (3) la sec. con núm. de ident.:86; (4) la sec. con núm. de ident.:87; (5) las sec. con núms. de ident.:84, 88 y 89; (6) las sec. con núms. de ident.:85, 88 y 89; (7) las sec. con núms. de ident . : 84,
88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88,
89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91, en donde el polipéptido tiene, preferentemente, actividad de GH61/ endoglucanasa ; o
(30) un polipéptido que comprende por lo menos dos o más secuencias de ß-glucosidasa, en donde la primera secuencia de ß-glucosidasa tiene una longitud de por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 200, 220, 240, 260, 280, 300, 320, 340, 360, 380 o 400) residuos que comprende una o más o todas las sec . con núms . de ident . : 96-108, mientras que la segunda secuencia de ß-glucosidasa secuencia tiene una longitud de por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 120, 140, 160, 180, 200) residuos de aminoácidos y comprende una o más o todas las sec. con núms. de ident .: 109-116 , en donde el polipéptido comprende, además, opcionalmente , una tercera secuencia de ß-glucosidasa que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivada de una secuencia de bucle de las sec. con núms. de ident. :66, en donde el polipéptido tiene, preferentemente, actividad de ß-glucosidasa .
La descripción de la presente proporciona, además, :
(1) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident .: 1 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident .: 1 o a un fragmento de esta; o
(2) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 ¾, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident.:3 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident . :3 o a un fragmento de esta; o
(3) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident .: 5 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident. :5 o a un fragmento de esta; o
(4) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident .: 7 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident.: 7 o a un fragmento de esta; o
(5) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %,
94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident. :9 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident. :9 o a un fragmento de esta; o
(6) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec . con núm. de ident.:ll o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident.:ll o a un fragmento de esta; o
(7) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident.:13 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident. : 13 o a un fragmento de esta; o
(8) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por "lo menos 80 %, 85 %, 90 %, 91 %, 92 %; 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident.: 15 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident. :15 o a un fragmento de esta; o
(9) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident. : 17 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident . :17 o a un fragmento de esta; o
(10) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %,
94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident. :19 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident. :19 o a un fragmento de esta; o
(11) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident. :21 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident. :21 o a un fragmento de esta; o
(12) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 ¾, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident. :27 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident. -.27 o a un fragmento de esta; o
(13) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident.:31 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident.:31 o a un fragmento de esta; o
(14) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 ¾, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident.:51 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident.:51 o a un fragmento de esta; o
(15) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %,
94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident.:53 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident . :53 o a un fragmento de esta; o
(16) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident. :55 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident . : 55 o a un fragmento de esta; o
(17) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident.: 57 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident.: 57 o a un fragmento de esta; o
(18) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident.: 59 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident. :59 o a un fragmento de esta; o
(19) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident.: 61 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident. :61 o a un fragmento de esta; o
(20) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec . con núm. de ident.:63 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident . : 63 o a un fragmento de esta; o
(21) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident.: 65 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident. :65 o a un fragmento de esta; o
(22) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 ¾, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident.: 67 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident. :67 o a un fragmento de esta; o
(23) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 ¾, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident. :69 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident.:69 o a un fragmento de esta; o
(24) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec . con núm. de ident . :71 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident. : 71 o a un fragmento de esta; o
(25) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %,
94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident.: 73 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident. :73 o a un fragmento de esta; o
(26) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident. :75 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident.: 75 o a un fragmento de esta; o
(27) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident.:77 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident . :77 o a un fragmento de esta; o
(28) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident.: 92 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident.: 92 o a un fragmento de esta; o
(29) un ácido nucleico que tiene por lo menos 80 % (por ejemplo, por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencia con respecto a la sec. con núm. de ident .: 94 o un ácido nucleico capaz de hibridarse en condiciones de rigurosidad alta a un complemento de la sec. con núm. de ident .: 94 o a un fragmento de esta.
La descripción proporciona, además, casetes de expresión y/o vectores que comprenden los ácidos nucleicos descritos anteriormente. Adecuadamente, el ácido nucleico que codifica una enzima de la descripción se une operativamente a un promotor. Específicamente, cuando se desea obtener la expresión recombinante en un huésped fúngico filamentoso, el promotor puede ser un promotor fúngico filamentoso. Los ácidos nucleicos pueden estar controlados por promotores heterólogos. Los ácidos nucleicos pueden expresarse, además, bajo el control de promotores constitutivos o inducibles . Los ejemplos de promotores que pueden usarse incluyen, sin limitarse a, un promotor de celulasa, un promotor de xilanasa, el promotor 1818 (identificado anteriormente como una proteína altamente expresada por mapeo de EST de Trichoderma) . Por ejemplo, el promotor puede ser un promotor de celobiohidrolasa, endoglucanasa o ß-glucosidasa . Un promotor particularmente adecuado puede ser, por ejemplo, un promotor de celobiohidrolasa, endoglucanasa o ß-glucosidasa de T. reesei. Por ejemplo, el promotor es un promotor de celobiohidrolasa I (cjbhl) . Los ejemplos no limitantes de promotores incluyen un promotor de cbhl , cbh.2, egll, egl2, egl3, egl4, egl5, pkil, gpdl , xynl , o xyn2. Otros ejemplos no limitantes de promotores incluyen un promotor de G. reesei cbhl, cbh2, egll, egl2, egl3, egl4, egl5, pkil, gpdl, xynl o xyn2.
Como se usa en la presente descripción, el término "unida operativamente" significa que la secuencia de nucleótidos seleccionada (por ejemplo, que codifica un polipéptido descrito en la presente descripción) está próxima a un promotor para permitir que el promotor regule la expresión del ADN seleccionado. Además, el promotor está corriente arriba de la secuencia de nucleótidos seleccionada en términos de la dirección de transcripción y traducción. La secuencia de nucleótidos y una o varias secuencias reguladoras se conectan de modo que permiten la expresión génica cuando las moléculas apropiadas (por ejemplo, proteínas activadoras transcripcionales) se unen a la secuencia o secuencias reguladoras.
La presente descripción proporciona células huésped diseñadas para expresar una o más enzimas de la descripción. Las células huésped adecuadas incluyen células de cualquier microorganismo (por ejemplo, células de una bacteria, un protista, un alga, un hongo (por ejemplo, una levadura u hongo filamentoso) u otro microbio) y son, preferentemente, células de una bacteria, una levadura o un hongo filamentoso.
Las células huésped adecuadas de los géneros de bacterias incluyen, sin limitarse a, células de Escherichia, Bacillus, Lactobacillus, Pseudomonas y Streptomyces . Las células de especies bacterianas adecuadas incluyen, sin limitarse a, células de E. coli, B. subtllls, B. licheniformis, L. brevis, P. aeruginosa y S. lividans .
Las células huésped adecuadas de los géneros de levadura incluyen, sin limitarse a, células de Saccharo yces, Schizosaccharomyces, Candida, Hansenula, Pichia,
Kluyveromyces y Phaffia. Las células de especies de levadura adecuadas incluyen, sin limitarse a, células de Saccharomyces cerevisiae, Schizosaccharomyces pombe, Candida albicans, Hansenula polymorpha, Pichia pastoris, P. canadensis, Kluyveromyces marxianus y Phaffia rhodozyma.
Las células huésped adecuadas de hongos filamentosos incluyen todas las formas filamentosas de la subdivisión Eumycotina . Las células adecuadas de los géneros de hongos filamentosos incluyen, por ejemplo, células de Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Chrysoporium, Coprinus, Coriolus, Corynascus, Chaertomium, Cryptococcus, Filobasidium, Fusarium, Gibberella , Humicola, Magnaporthe, Mucor, Myceliophthora, Mucor, Neocallimastix, Neurospora, Paecilomyces, Penicillium, Phanerochaete, Phlebia, Piromyces, Pleurotus, Scytaldium, Schizop yllum, Sporotrichum, Talaromyces, Thermoascus, Th elavia,
Tolypocladium, Trametes y Trichoderma.
Las células adecuadas de especies fúngicas filamentosas incluyen, sin limitarse a, células de Aspergillus awamori , Aspergillus fu igatus, Aspergillus foetidus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Chrysosporium lucknowense, Fusarium bactridioides, Fusarium cerealis, Fusarium crookwelíense, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusarium sarcochroum, Fusarium sporotrichioides, Fusarium sulphureum, Fusarium torulosum, Fusarium trichothecioides, Fusarium venenatum, Bjerkandera adusta, Ceriporiopsis aneirina, Ceriporiopsis aneirina, Ceriporiopsis caregiea, Ceriporiopsis gilvescens, Ceriporiopsis pannocinta,
Ceriporiopsis rivulosa, Ceriporiopsis subrufa, Ceriporiopsis subvermispora, Coprinus cinereus, Coriolus hirsutus, Humicola insolens, Humicola lanuginosa, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Neurospora intermedia, Penicillium purpurogenum, Penicillium canescens, Penicillium solitum, Penicillium f niculosum Phanerochaete chrysosporium, Phlebia radíate, Pleurotus eryngii, Talaromyces flavus, Thielavia terrestris, Trametes villosa, Trametes versicolor, Trichoderma harzianum, Trichoderma koningii , Trichoderma longibrachiatum, Trichoderma reesei o Trichoderma viride .
La descripción proporciona, además, una célula huésped recombinante modificada genéticamente para expresar, en un primer aspecto, (1) un primer polipeptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa, (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa y (4) un cuarto polipéptido que tiene actividad de ß -glucosidasa . La descripción proporciona, además, en un segundo aspecto, una célula huésped recombinante modificada genéticamente para expresar (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa, (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa y (4) una composición de celulasa completa enriquecida con ß-glucosidasa. La descripción proporciona, además, en un tercer aspecto, una célula huésped recombinante modificada genéticamente para expresar (1) un primer polipéptido que tiene actividad de xilanasa; (2) un segundo polipéptido que tiene actividad de xilosidasa; (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa ; y (4) un cuarto polipéptido que tiene actividad de GH61/endoglucanasa o una celulasa completa enriquecida con endoglucanasa de GH61.
La descripción proporciona, en un cuarto aspecto, una célula huésped recombinante modificada genéticamente para expresar (1) un primer polipéptido que tiene actividad de xilosidasa, (2) un segundo polipéptido (diferente al primer polipéptido) que tiene actividad de xilosidasa, (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa y (4) un cuarto polipéptido que tiene actividad de ß-glucosidasa . La descripción proporciona, en un quinto aspecto, una célula huésped recombinante modificada genéticamente para expresar (1) un primer polipéptido que tiene actividad de xilosidasa, (2) un segundo polipéptido (diferente al primer polipéptido) que tiene actividad de xilosidasa, (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa y (4) una celulasa completa enriquecida con ß-glucosidasa. La descripción proporciona, además, en un sexto aspecto, una célula huésped modificada genéticamente para expresar (1) un primer polipéptido que tiene actividad de xilosidasa, (2) un segundo polipéptido (diferente al primer polipéptido) que tiene actividad de xilosidasa, (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa; (4) un cuarto polipéptido que tiene actividad de GH61/endoglucanasa o, alternativamente, una celulasa completa enriquecida con EGIV.
La descripción proporciona, en un séptimo aspecto, una célula huésped recombinante modificada genéticamente para expresar (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa, (3) un tercer polipéptido (diferente al segundo polipéptido) que tiene actividad de xilosidasa y (4) un cuarto polipéptido que tiene actividad de ß-glucosidasa . La descripción proporciona, en un octavo aspecto, una célula huésped recombinante modificada genéticamente para expresar
(1) un primer polipéptido que tiene actividad de xilanasa,
(2) un segundo polipéptido que tiene actividad de xilosidasa,
(3) un tercer polipéptido (diferente al segundo polipéptido) que tiene actividad de xilosidasa y una celulasa completa enriquecida con ß-glucosidasa . La descripción proporciona, en un noveno aspecto, una célula huésped recombinante modificada genéticamente para expresar (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa, (3) un tercer polipéptido (diferente al segundo polipéptido) que tiene actividad de xilosidasa y (4) un cuarto polipéptido que tiene actividad de GH61/endoglucanasa o, alternativamente, una celulasa completa enriquecida con endoglucanasa de GH61.
La descripción proporciona, en un décimo aspecto, una célula huésped recombinante modificada genéticamente para expresar (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa y (3) un tercer polipéptido que tiene actividad de ß-glucosidasa . La descripción proporciona, en un décimo primer aspecto, una célula huésped recombinante que se diseña por ingeniería genética para expresar (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa y una celulasa completa enriquecida con ß-glucosidasa . La descripción proporciona, además, en un décimo segundo aspecto, una célula huésped recombinante que se diseña por ingeniería genética para expresar (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa y (3) un tercer polipéptido que tiene actividad de GH6l/endoglucanasa o, alterna ivamente, una celulasa completa enriquecida con endoglucanasa de GH61.
En una célula huésped recombinante de cualquiera de los aspectos primero a décimo segundo anteriores, el polipéptido que tiene actividad de ß-glucosidasa es un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos. En ciertas modalidades, el polipéptido que tiene ß-glucosidasa es un polipéptido de ß-glucosidasa quimérico/de fusión que comprende dos o más secuencias de ß-glucosidasa, en donde la primera secuencia derivada de una primera ß-glucosidasa tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms. de ident.: 96-108, mientras que la segunda secuencia derivada de una segunda -glucosidasa tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms. de ident . : 109- 116 y, opcionalmente , además, una tercera secuencia con una longitud de 3 , 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que codifica una secuencia de bucle que tiene una secuencia de aminoácidos de FDR SPG (sec. con núm. de ident. :204) o de FD(R/K)YNIT (sec. con núm. de ident . : 205) , derivada de una tercera ß-glucosidasa es un polipéptido de ß-glucosidasa de fusión o quimérico. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) motivos de secuencias de aminoácidos de las sec. con núms . de ident.: 197-202 y la segunda de dos o más ß-glucosidasas tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident. :203 y, opcionalmente , además, una tercera secuencia con una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que tiene una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident. :204) o de FD(R/K)YNIT (sec. con núm. de ident. :205) y que se deriva de un tercer polipéptido de ß-glucosidasa diferente del primer o segundo polipéptido de ß-glucosidasa. En ciertas modalidades, el polipéptido que tiene actividad de ß-glucosidasa es un polipéptido que comprende una primera secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 200 residuos de Fv3C (sec. con núm. de ident. :60), por ejemplo, un tramo de por lo menos 200 residuos a partir del N-terminal de la sec. con núm. de ident. :60 y una segunda secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 50 residuos de Bgl3 de T. reesei (Tr3B, sec . con núm. de ident.:64), por ejemplo, un tramo de por lo menos 50 residuos a partir del C-terminal de la sec. con núm. de ident.:64. En ciertas modalidades, el polipéptido que tiene actividad de ß-glucosidasa que comprende la primera y la segunda secuencia anteriores comprende, además, una tercera secuencia de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que se deriva de una secuencia de longitud igual de Te3A (sec. con núm. de ident.:66), que tiene, por ejemplo, una secuencia de aminoácidos de FDRRSPG (sec. con núm. de ident.:204) o de FD(R/K)YNIT (sec. con núm. de ident.:205). En algunas modalidades, el polipéptido comprende una secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident . : 93 o 95 o con respecto a una subsecuencia o fragmento de por lo menos aproximadamente 20, 30, 40, 50, 60, 70 o más residuos de la sec. con núm. de ident . : 93 o 95.
En una célula huésped recombinante de cualquiera de los aspectos primero a décimo segundo anteriores, la célula huésped recombinante se diseña por ingeniería genética para expresar un polipéptido que tiene actividad de GH61/endoglucanasa . En algunas modalidades, el polipéptido que tiene actividad de GH61/endoglucanasa es un polipéptido de EGIV, por ejemplo, un polipéptido de Eg4 de T. reesei. En algunas modalidades, el polipéptido es un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident . : 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o uno que comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec. con núms. de ident. : 84 y 88; (2) las sec. con núms. de ident. :85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec. con núm. de ident. :87; (5) las sec. con núms. de ident. :84, 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident.: 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec . con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. En ciertas modalidades, la célula huésped recombinante puede diseñarse por ingeniería genética, además, para expresar una celobiosa deshidrogenasa .
En una célula huésped recombinante de cualquiera de los aspectos primero a décimo segundo anteriores, la célula huésped recombinante se diseña por ingeniería genética para expresar un polipéptido que tiene actividad de xilosidasa y que se selecciona de polipéptidos de ß-xilosidasa del Grupo 1. Los polipéptidos de ß-xilosidasa del Grupo 1 incluyen los polipéptidos que tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident.: 2 y 10 o con respecto a una secuencia madura de estas. Por ejemplo, la ß -xilosidasa del Grupo puede ser Fv3A o Fv43A. La célula huésped recombinante se puede diseñar por ingeniería genética, además, para expresar un polipéptido que tiene actividad de xilosidasa y que es un polipéptido seleccionado de polipéptidos de ß-xilosidasa del Grupo 2. Los polipéptidos de ß-xilosidasa del Grupo 2 incluyen aquellos que tienen por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. :4, 6, 8, 10, 12, 14, 16, 18, 28, 30 y 45 o con respecto a una secuencia madura de estas. Por ejemplo, las ß-xilosidasas del Grupo 2 pueden ser Pf43A, Fv43E, Fv39A, Fv43B, Pa51A, Gz43A, Fo43A, Fv43D, Pf43B O Bxll de T. reesei .
En una célula huésped recombinante de cualquiera de los aspectos primero, segundo y tercero anteriores, el polipéptido que tiene actividad de xilanasa es un polipéptido que tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident.: 24, 26, 42 y 43 o con respecto a una secuencia madura de estas. Por ejemplo, el polipéptido de xilanasa puede ser AfuXyn2, AfuXyn5 , Xyn3 de T. reesei o Xyn2 de T. reesei.
En una célula huésped recombinante de cualquiera de los aspectos cuarto, quinto y sexto, la célula huésped puede diseñarse por ingeniería genética para expresar un polipéptido que tiene actividad de arabinofuranosidasa y que tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. :12, 14, 20, 22 y 32 o con respecto a una secuencia madura de estas. Por ejemplo, el tercer polipéptido puede ser Fv43B, Pa51A, Af43A, Pf51A o Fv51A.
La célula huésped recombinante de la descripción puede ser, adecuadamente, por ejemplo, una célula huésped fúngica recombinante o un organismo recombinante, por ejemplo, un hongo filamentoso, tal como T. reesei recombinante. Por ejemplo, la célula huésped recombinante es, adecuadamente, una célula huésped de Trichoderma reesei. El hongo recombinante es, adecuadamente, Trichoderma reesei recombinante. La descripción proporciona, por ejemplo, una célula huésped de T. reesei.
Además, la descripción proporciona una célula huésped recombinante o un hongo recombinante diseñado por ingeniería genética para expresar una mezcla enzimática que comprende enzimas adecuadas en relaciones adecuadas para la sacarificación. La célula huésped recombinante es, por ejemplo, una célula huésped fúngica. El hongo recombinante es, por ejemplo, Trichoderma reesei, Aspergillus niger o Aspergillus oryzae, o Chrisosporium lucknowence recombinante. La célula huésped bacteriana recombinante puede ser una célula de Bacillus . Los ejemplos de relaciones/cantidades de enzimas adecuadas presentes en las mezclas enzimáticas se describen en la Sección 5.3.4.
5.3 Composiciones enzimáticas para sacarificación
La presente descripción proporciona una composición enzimática capaz de descomponer material de lignocelulosa . La composición enzimática de la invención es, típicamente, una mezcla de múltiples enzimas que comprende más de una enzima o polipéptido de la descripción. La composición enzimática de la invención puede incluir, adecuadamente, una o más enzimas adicionales derivadas de otros microorganismos, plantas u organismos. Se contemplan combinaciones de enzimas sinérgicas y métodos relacionados. La descripción incluye métodos para identificar las relaciones óptimas de las enzimas incluidas en las composiciones enzimáticas para degradar diversos tipos de materiales lignocelulósicos . Estos métodos incluyen, por ejemplo, pruebas para identificar la proporción óptima o los pesos relativos de enzimas que se incluirán en la composición enzimática de la invención para realizar la conversión eficaz de varios sustratos lignocelulósicos en sus azúcares fermentables constituyentes. Los siguientes ejemplos incluyen ensayos que se pueden usar para identificar proporciones/pesos relativos óptimos de enzimas en las composiciones enzimáticas con los cuales varios materiales lignocelulósicos se hidrolizan o descomponen eficazmente en procesos de sacarificación.
5.3.1. Antecedentes
Las paredes celulares de las plantas altas comprenden una variedad de componentes de polímeros de carbohidratos (CP) . Estos CP interactúan a través de medios covalentes y no covalentes y proporcionan la integridad estructural que las plantas necesitan para formar paredes celulares rígidas y resistir la presión de la rigidez. El CP principal que se encuentra en las plantas es la celulosa, que forma el esqueleto estructural de las paredes celulares. Durante la biosíntesis de la celulosa, las cadenas de poli-ß-?, 4-D-glucosa se autoasocian mediante enlaces de hidrógeno e interacciones hidrofóbicas para formar microfibrillas de celulosa. Las microfibrillas de celulosa son, f ecuentemente, de estructura irregular y contienen regiones de diversa cristalinidad . El grado de cristalinidad de las fibrillas de celulosa depende de cuán estrechamente ordenados estén los enlaces de de hidrógeno entre las cadenas de celulosa de sus componentes. Las áreas con enlaces menos ordenados y, por lo tanto, cadenas de glucosa más accesibles, se denominan regiones amorfas .
El modelo general para la despolimerización de celulosa a glucosa implica un mínimo de tres actividades enzimáticas distintas. Las endoglucanasas clivan cadenas de celulosa internamente a cadenas más cortas en un proceso que incrementa la cantidad de extremos accesibles que son más sensibles a la actividad de exoglucanasa que las cadenas de celulosa intacta. Estas exoglucanasas (por ejemplo, celobiohidrolasas) son específicas para reducir los extremos o para no reducir los extremos y liberan, en la mayoría de los casos, celobiosa, el dimero de glucosa. La celobiosa que se acumula se expone, después, al clivaje por parte de las celobiasas (por ejemplo, ß- 1 , 4-glucosidasas) a glucosa.
La celulosa contiene solamente anhidroglucosa . En contraposición, la hemicelulosa contiene varios monómeros de azúcar diferentes. Por ejemplo, aparte de la glucosa, los monómeros de azúcar en la hemicelulosa pueden incluir, además, xilosa, mañosa, galactosa, ramnosa y arabinosa. Las hemicelulosas contienen principalmente azúcares de D-pentosa y, ocasionalmente, pequeñas cantidades de azúcares L. Típicamente, la xilosa está presente en la mayor cantidad, pero también el ácido manurónico y el ácido galacturónico suelen estar presentes. Las hemicelulosas incluyen xilano, glucuronoxilano, arabinoxilano, glucomanano y xiloglucano.
Las composiciones enzimáticas y multienzimáticas de la presente descripción son útiles para la sacarificación de materiales de hemicelulosa que incluyen, por ejemplo, xilano, arabinoxilano y sustratos que contienen xilano o arabinoxilano. El arabinoxilano es un polisacárido compuesto de xilosa y arabinosa, en donde los residuos de L-a-arabinofuranosa están unidos como puntos de ramificación a una estructura polimérica de xilosa ligada a ß-(1,4) .
La mayoría de las fuentes de biomasa son algo complejas y contienen celulosa, hemicelulosa, pectina, lignina, proteína y ceniza, entre otros componentes. Por consiguiente, en ciertos aspectos, la presente descripción proporciona mezclas/composiciones enzimáticas que contienen enzimas que imparten un intervalo o variedad de especificaciones de sustratos cuando actúan juntas para degradar biomasa en azúcares fermentables en la forma más eficaz. Un ejemplo de una mezcla/composición multienzimática de la presente invención es una mezcla de celobiohidrolasa (s) , xilanasa(s), endoglucanasa (s) , ß-glucosidasa (s) , ß-xilosidasa (s) y, opcionalmente , proteínas accesorias. La mezcla/composición enzimática es, adecuadamente, una composición cuyo origen no es natural. Por consiguiente, la descripción proporciona mezclas/composiciones enzimáticas (que incluyen productos de fabricación) que comprenden una mezcla de enzimas que hidrolizan xilano, hemicelulosa y/o celulosa que incluyen por lo menos una, varias o todas las siguientes: una glucanasa; una celobiohidrolasa; una L- -arabinofuranosidasa; una xilanasa; una ß-glucosidasa; y una ß -xilosidasa . Preferentemente, cada una de las mezclas/composiciones enzimáticas de la descripción comprende por lo menos una enzima de la descripción. La presente descripción proporciona, además, mezclas/composiciones enzimáticas que no son de origen natural . Como se usa en la presente descripción, el término "mezclas/composiciones enzimáticas" se refiere a: (1) una composición elaborada mediante la combinación de enzimas componentes, ya sea en forma de un caldo de fermentación o parcialmente o completamente aisladas o purificadas; (2) una composición producida por un organismo modificado para expresar una o más enzimas componentes; En ciertas modalidades, el organismo usado para expresar una o más enzimas componentes puede modificarse para eliminar uno o más genes; en otras modalidades, el organismo usado para expresar una o más enzimas componentes puede comprender, además, proteínas que afectan la hidrólisis de xilano, la hidrólisis de hemicelulosa y/o la hidrólisis de celulosa; (3) una composición elaborada por la combinación de enzimas componentes simultáneamente, en forma separada o en secuencia durante una reacción de sacarificación o fermentación; (4) una mezcla enzimática producida in situ, por ejemplo, durante una reacción de sacarificación o fermentación; y (5) una composición producida de conformidad con alguno o todos los puntos (l)-(4) anteriores.
El término "caldo de fermentación" , como se usa en la presente descripción, se refiere a una preparación de enzimas producida por fermentación que no se recupera y/o purifica o que se recupera y/o purifica en un nivel mínimo después de la fermentación. Por ejemplo, los cultivos microbianos se cultivan hasta la saturación y se incuban en condiciones de carbono limitado para permitir la síntesis de proteínas (por ejemplo, expresión de enzimas). Después, una vez que la enzima o enzimas se secretan en el medio de cultivo celular se puede usar los caldos de fermentación. Los caldos de fermentación de la descripción pueden incluir un contenido fraccionado o no fraccionado de los materiales de fermentación obtenidos al final de la fermentación. Por ejemplo, los caldos de fermentación de la invención no son fraccionados y comprenden el medio de cultivo usado y los residuos celulares presentes después de que las células microbianas (por ejemplo, células fúngicas filamentosas) experimentan un proceso de fermentación. El caldo de fermentación puede contener, adecuadamente, el medio de cultivo celular usado, enzimas extracelulares y células microbianas vivas o muertas. Alternativamente, los caldos de fermentación se pueden fraccionar para eliminar las células microbianas. En esos casos, los caldos de fermentación pueden comprender, por ejemplo, el medio de cultivo celular usado y las enzimas extracelulares .
Cualquiera de las enzimas descritas específicamente en la presente descripción se puede combinar con una o más de las enzimas descritas en la presente descripción o con cualquier otra enzima disponible y adecuada, para producir una mezcla/composición multienzimática apropiada. La descripción no está restringida ni limitada a las combinaciones ilustrativas específicas que se enumeran más abajo.
5.3.2. Biomasa
La descripción proporciona métodos y procesos para la sacarificación de biomasa con el uso de enzimas y mezclas/composiciones enzimáticas de la descripción. El término "biomasa" , como se usa en la presente descripción, se refiere a cualquier composición que comprende celulosa y/o hemicelulosa (opcionalmente , además, lignina en materiales de biomasa lignocelulósica) . Como se usa en la presente descripción, biomasa incluye, sin limitarse a, semillas, granos, tubérculos, desechos vegetales o subproductos del procesamiento de alimentos o procesamiento industrial (por ejemplo, tallos), maíz (que incluye, por ejemplo, mazorcas, rastrojo y similares), césped (que incluye, por ejemplo, pasto indio, tal como Sorghastrum nutans,- o césped de pradera, por ejemplo, especies Panicum, tal como Panicum virgatum) , cañas perennes (por ejemplo, cañas bravas) , madera (que incluye, por ejemplo, astillas, desechos de procesamiento) , papel, pulpa y papel reciclado (que incluye, por ejemplo, papel de periódico, papel para impresora y similares) . Otros materiales de biomasa incluyen, sin limitarse a, papas, soja (por ejemplo, semilla de colza) , cebada, centeno, avena, trigo, betabel y bagazo de caña de azúcar .
La descripción proporciona métodos de sacarificación; los métodos comprenden poner en contacto una composición que comprende un material de biomasa, por ejemplo, un material que comprende xilano, hemicelulosa, celulosa y/o un azúcar fermentable, con un polipéptido de la descripción o un polipéptido codificado por un ácido nucleico de la descripción o cualquiera de las mezclas/composiciones enzimáticas o productos de fabricación descritos en la descripción.
La biomasa sacarificada (por ejemplo, material lignocelulósico procesado por enzimas de la descripción) se puede elaborar en varios productos de base biológica, a través de procesos tales como, por ejemplo, fermentación microbiana y/o síntesis química. Como se usa en la presente descripción, "fermentación microbiana" se refiere a un proceso de cultivo y recolección de microorganismos de fermentación en condiciones adecuadas. ?1 microorganismo de fermentación puede ser cualquier microorganismo adecuado para usar en un proceso de fermentación deseado para la producción de productos de base biológica. Los microorganismos de fermentación adecuados incluyen, sin limitarse a, hongos (por ejemplo, hongos filamentosos), levadura y bacterias. La biomasa sacarificada puede producir, por ejemplo, combustible (por ejemplo, un biocombustible tal como bioetanol, biobutanol, biometanol, biopropanol, biodiesel, combustible de reactor o similares) por medio de fermentación y/o síntesis química. La biomasa sacarificada puede producir, además, por ejemplo, un producto químico (por ejemplo, ácido ascórbico, isopreno, 1 , 3-propanodiol) , lípidos, aminoácidos, proteínas y enzimas por medio de fermentación y/o síntesis química .
5.3.3. Tratamiento previo
Antes de la sacarificación, la biomasa (por ejemplo, material lignocelulósico) se expone, preferentemente, a una o más etapas de tratamiento previo para hacer que el material de xilano, hemicelulosa, celulosa y/o lignina sea más accesible o sensible a las enzimas y, por lo tanto, más fácil de hidrolizar por medio de la enzima o enzimas y/o mezclas/composiciones enzimáticas de la descripción.
En ciertas modalidades, el tratamiento previo implica exponer el material de biomasa a un catalizador que comprende una solución diluida de un ácido fuerte y una sal de metal en un reactor. El material de biomasa puede ser, por ejemplo, una materia prima o un material secado. Este tratamiento previo puede reducir la energía de activación o la temperatura de hidrólisis de la celulosa y, en última instancia, puede permitir mayores producciones de azúcares fermentables . Ver, por ejemplo, las patentes de los Estados Unidos núms. 6,660,506; 6,423,145.
Otro ejemplo de un tratamiento previo implica hidrolizar la biomasa mediante la exposición del material de biomasa a una primera etapa de hidrólisis en un medio acuoso a una temperatura y con un nivel de presión seleccionados para efectuar, principalmente, la despolimerización de la hemicelulosa sin una despolimerización significativa de celulosa a glucosa. Esta etapa produce una suspensión en la cual la fase líquida acuosa contiene monosacáridos disueltos que resultan de la despolimerización de hemicelulosa y una fase sólida que contiene celulosa y lignina. Después, la suspensión se expone a una segunda etapa de hidrólisis en condiciones que permiten la despolimerización de una porción importante de la celulosa lo que produce una fase acuosa líquida que contiene productos de despolimerización de celulosa disueltos/solubles. Ver, por ejemplo, la patente de los Estados Unidos núm. 5,536,325.
Otro ejemplo de un método implica procesar un material de biomasa en una o más etapas de hidrólisis con ácido diluido mediante el uso de aproximadamente 0.4 % a aproximadamente 2 % de un ácido fuerte; seguido del tratamiento del componente lignocelulósico sólido sin reaccionar del material hidrolizado con ácido con deslignificación alcalina. Ver, por ejemplo, la patente de los Estados Unidos núm. 6,409,841.
Otro ejemplo de un método comprende la hidrólisis previa de la biomasa (por ejemplo, materiales lignocelulósicos) en un reactor de hidrólisis previa; la adición de un líquido acídico en el material lignocelulósico sólido para formar una mezcla; el calentamiento de la mezcla hasta la temperatura de la reacción; el mantenimiento de la temperatura de reacción durante un período de tiempo suficiente para fraccionar el material lignocelulósico en una parte solubilizada que contiene al menos 20 % de la lignina del material lignocelulósico y una fracción sólida que contiene celulosa; la separación de la parte solubilizada de la fracción sólida y la eliminación de la parte solubilizada mientras está a la temperatura de reacción o a una temperatura cercana a ella; y la recuperación de la parte solubilizada. De este modo, la celulosa en la fracción sólida facilita la digestión enzimática. Ver, por ejemplo, la patente de los Estados Unidos núm. 5,705,369.
Otros métodos de tratamiento previo pueden implicar el uso de peróxido de hidrógeno H202. Ver Gould, 1984, Biotech, and Bioengr. 26:46-52.
El tratamiento previo puede comprender, además, poner en contacto un material de biomasa con cantidades estequiométricas de hidróxido de sodio e hidróxido de amonio a una concentración muy baja. Ver Teixeira et al., 1999, Ap l . Biochem.and Biotech. 77-79:19-34. El tratamiento previo puede comprender, además, poner en contacto una lignocelulosa con una sustancia química (por ejemplo, una base, tal como carbonato de sodio o hidróxido de potasio) a un pH de aproximadamente 9 a aproximadamente 14 a temperatura, presión y pH moderados. Ver la publicación del PCT núm. WO2004/081185.
En el método de tratamiento previo preferido se usa, por ejemplo, amoniaco. Ese método de tratamiento previo comprende exponer material de biomasa a una concentración baja de amoniaco en condiciones de sólidos elevados. Ver, por ejemplo, la publicación de patente de los Estados Unidos núm. 20070031918 y la publicación del PCT núm. WO 06110901.
5.3.4. Composiciones enzimáticas
La presente descripción proporciona una cantidad de composiciones enzimáticas que comprenden múltiples (es decir, más de una) enzimas de la descripción. Por lo menos una enzima de cada composición enzimática de la invención se puede producir por medio de una célula huésped recombinante o un organismo recombinante. Por lo menos una enzima de la composición enzimática puede ser una enzima exógena producida, por ejemplo, por la expresión de un gen exógeno en una célula huésped o un organismo huésped. Por lo menos una enzima de la composición enzimática puede producirse como resultado de la sobreexpresión o subexpresión de un gen endógeno en una célula huésped u organismo huésped. Las composiciones enzimáticas son, adecuadamente, composiciones que no son de origen natural. La descripción proporciona un primer ejemplo no limitante de una composición enzimática modificada genéticamente de la invención que comprende 4 polipéptidos : (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa, (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa y (4) un cuarto polipéptido que tiene actividad de ß-glucosidasa . La descripción proporciona un segundo ejemplo no limitante de una composición enzimática modificada genéticamente de la invención que comprende : (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa, (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa y (4) una composición de celulasa completa enriquecida con ß-glucosidasa. La descripción proporciona un tercer ejemplo no limitante de una composición enzimática modificada genéticamente de la invención que comprende (1) un primer polipéptido que tiene actividad de xilanasa; (2) un segundo polipéptido que tiene actividad de xilosidasa; (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa; y (4) un cuarto polipéptido que tiene actividad de GH61/endoglucanasa o una celulasa completa enriquecida con endoglucanasa de GH61. La descripción proporciona un cuarto ejemplo no limitante de una composición enzimática modificada genéticamente de la invención que comprende (1) un primer polipéptido que tiene actividad de xilosidasa, (2) un segundo polipéptido (diferente al primer polipéptido) que tiene actividad de xilosidasa, (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa y (4) un cuarto polipéptido que tiene actividad de ß-glucosidasa . La descripción proporciona un quinto ejemplo no limitante de una composición enzimática de la invención que comprende (1) un primer polipéptido que tiene actividad de xilosidasa, (2) un segundo polipéptido (diferente al primer polipéptido) que tiene actividad de xilosidasa, (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa y (4) una celulasa completa enriquecida con ß-glucosidasa . La descripción proporciona un sexto ejemplo no limitante de una composición enzimática modificada genéticamente de la invención que comprende (1) un primer polipéptido que tiene actividad de xilosidasa, (2) un segundo polipéptido (diferente al primer polipéptido) que tiene actividad de xilosidasa, (3) un tercer polipéptido que tiene actividad de arabinofuranosidasa; y (4) un cuarto polipéptido que tiene actividad de GH61/ endoglucanasa o, alternativamente, una celulasa completa enriquecida con EGIV. La descripción proporciona un séptimo ejemplo no limitante de una composición enzimática modificada genéticamente de la invención que comprende (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa, (3) un tercer polipéptido (diferente al segundo polipéptido) que tiene actividad de xilosidasa y (4) un cuarto polipéptido que tiene actividad de ß-glucosidasa. La descripción proporciona un octavo ejemplo no limitante que comprende (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa, (3) un tercer polipéptido (diferente al segundo polipéptido) que tiene actividad de xilosidasa y una celulasa completa enriquecida con ß-glucosidasa . La descripción proporciona un noveno ejemplo no limitante de una composición enzimática modificada genéticamente de la invención que comprende (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa, (3) un tercer polipéptido (diferente al segundo polipéptido) que tiene actividad de xilosidasa y (4) un cuarto polipéptido que tiene actividad de GH61/endoglucanasa o, alternativamente, una celulasa completa enriquecida con endoglucanasa de GH61. La descripción proporciona un décimo ejemplo no limitante de una composición enzimática modificada genéticamente de la invención que comprende (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa, and (3) un tercer polipéptido que tiene actividad de ß-glucosidasa . La descripción proporciona un décimo primer ejemplo no limitante de una composición enzimática de la invención que comprende (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa y una celulasa completa enriquecida con ß-glucosidasa . La descripción proporciona un décimo segundo ejemplo no limitante de una composición enzimática modificada genéticamente de la invención que comprende (1) un primer polipéptido que tiene actividad de xilanasa, (2) un segundo polipéptido que tiene actividad de xilosidasa y (3) un tercer polipéptido que tiene actividad de GH61/endoglucanasa o, alternativamente, una celulasa completa enriquecida con endoglucanasa de GH61.
En cualquiera de las composiciones enzimáticas ilustrativas anteriores, el polipéptido que tiene actividad de ß -glucosidasa es un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 ¾, 95 %, 96 %, 97 %, 98 % O 99 %) de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident . : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos. En ciertas modalidades, el polipéptido que tiene ß-glucosidasa es un polipéptido de ß-glucosidasa quimérico/de fusión que comprende dos o más secuencias de ß-glucosidasa, en donde la primera secuencia derivada de una primera ß-glucosidasa tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms . de ident.: 96-108, mientras que la segunda secuencia derivada de una segunda ß-glucosidasa tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencias de aminoácidos de las sec. con núms. de ident .: 109-116 y, opcionalmente , además una tercera secuencia con una longitud de 3 , 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que codifican una secuencia de bucle derivada de una tercera ß-glucosidasa es un polipéptido de ß -glucosidasa de fusión o quimérico. En ciertas modalidades, el polipéptido que tiene actividad de ß-glucosidasa es un polipéptido que comprende una primera secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 200 residuos de Fv3C (sec. con núm. de ident.:60), por ejemplo, un tramo de por lo menos 200 residuos a partir del N-terminal de la sec . con núm. de ident . :60 y una segunda secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a un tramo de por lo menos 50 residuos de Bgl3 de G. reesei (Tr3B, sec. con núm. de ident. :64), por ejemplo, un tramo de por lo menos 50 residuos a partir del C-terminal de la sec. con núm. de ident. : 64. En ciertas modalidades, el polipéptido que tiene actividad de ß-glucosidasa y comprende la primera y la segunda secuencia anteriores comprende, además, una tercera secuencia de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que se deriva de una secuencia de longitud igual de Te3A (sec. con núm. de ident. :66) . En algunas modalidades, el polipéptido comprende una secuencia que tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a la sec. con núm. de ident. : 93 o 95 o con respecto a una subsecuencia o fragmento de por lo menos aproximadamente 20, 30, 40, 50, 60, 70 o más residuos de la sec. con núm. de ident. : 93 o 95.
En cualquiera de las composiciones enzimáticas en la presente descripción, el polipéptido que tiene actividad de GH6l/endoglucanasa es un polipéptido de EGIV, por ejemplo, un polipéptido de Eg4 de T. reesei. En algunas modalidades, el polipéptido es un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident . : 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o uno que comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec. con núms. de ident. : 84 y 88; (2) las sec. con núms. de ident. :85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec. con núm. de ident. :87; (5) las sec. con núms. de ident. :84, 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident.: 84, 88 y 90; (8) las sec. con núms. de ident. : 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91. En ciertas modalidades, la composición comprende, además, una celobiosa deshidrogenasa .
En cualquiera de las composiciones enzimáticas en la presente descripción, el polipéptido que tiene actividad de xilanasa puede ser un polipéptido que tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident.: 24, 26, 42 y 43 o con respecto a una secuencia madura de estas. Por ejemplo, el polipéptido de xilanasa puede ser AfuXyn2, AfuXyn5 , Xyn3 de T. reesei o Xyn2 de T. reesei .
En cualquiera de las composiciones enzimáticas de la presente descripción, el polipéptido que tiene actividad de xilosidasa puede ser un polipéptido seleccionado de polipéptidos de ß-xilosidasa del Grupo 1 o Grupo 2. Cuando la composición comprende una primera y una segunda ß-xilosidasa, se contempla que la primera ß-xilosidasa es un polipéptido de -xilosidasa del Grupo 1 que puede ser un polipéptido que tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. : 2 y 10 o con respecto a una secuencia madura de estas. Por ejemplo, la ß-xilosidasa del Grupo 1 puede ser Fv3A o Fv43A. Además, se contempla que la segunda ß-xilosidasa es un polipéptido de ß-xilosidasa del Grupo 2 que puede ser un polipéptido que tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms. de ident. :4, 6, 8, 10, 12, 14, 16, 18, 28, 30 y 45 o con respecto a una secuencia madura de estas. Por ejemplo, las ß-xilosidasas del Grupo 2 pueden ser Pf43A, Fv43E, Fv39A, Fv43B, Pa51A, Gz43A, Fo43A, Fv43D, Pf43B o Bxll de T. reesei.
En cualquiera de los ejemplos de las composiciones enzimáticas anteriores, el polipéptido que tiene actividad de arabinofuranosidasa puede ser un polipéptido que tiene por lo menos aproximadamente 70 % de identidad de secuencia con respecto a cualquiera de las sec. con núms . de ident.:12, 14, 20, 22, and 32 o con respecto a una secuencia madura de estas. Por ejemplo, el tercer polipéptido puede ser Fv43B, Pa51A, Af43A, Pf51A o Fv51A.
Xilanasas : la xilanasa o xilanasas constituyen, adecuadamente, aproximadamente 3 % en peso a aproximadamente 35 % en peso de las enzimas en una composición enzimática de la descripción, en donde el % en peso representa el peso combinado de la xilanasa o xilanasas con respecto al peso combinado de todas las enzimas en una composición determinada. La xilanasa o xilanasas pueden estar presentes en un intervalo, en donde el límite inferior es 3 % en peso, 4 % en peso, 5 % en peso, 6 % en peso, 7 % en peso, 8 % en peso, 9 % en peso, 10 % en peso, 12 % en peso, 15 % en peso y el límite superior es 5 % en peso, 10 % en peso, 15 % en peso, 20 % en peso, 25 % en peso, 30 % en peso, 35 % en peso. Adecuadamente, el peso combinado de una o más xilanasas en una composición enzimática de la invención puede constituir, por ejemplo, aproximadamente 3 % en peso a aproximadamente 30 % en peso (por ejemplo, 3 % en peso a 20 % en peso, 5 % en peso a 18 % en peso, 8 % en peso a 18 % en peso, 10 % en peso a 20 % en peso, etc.) del peso total de todas las enzimas en la composición enzimática. Los ejemplos de xilanasas adecuadas para incluir en las composiciones enzimáticas de la descripción se describen en la Sección 5.3.7.
L- -arabinofuranosidasas : la(s) L-a-arabinofuranosidasa (s) constituyen, adecuadamente, aproximadamente 0.1 % en peso a aproximadamente 5 % en peso de las enzimas en una composición enzimática de la descripción, en donde el % en peso representa el peso combinado de la L-a-arabinofuranosidasa o L-a-arabinofuranosidasas con respecto al peso combinado de todas las enzimas en una composición determinada. La L-a-arabinofuranosidasa o L-a-arabinofuranosidasas pueden estar presentes en un intervalo, en donde el límite inferior es 0.1 % en peso, 0.2 % en peso, 0.5 % en peso, 0.7 % en peso, 0.8 % en peso, 1 % en peso, 2 % en peso, 3 % en peso, 4 % en peso y el límite superior es 2 % en peso, 3 % en peso, 4 % en peso o 5 % en peso. Por ejemplo, una o más L-a-arabinofuranosidasas pueden constituir, adecuadamente, de aproximadamente 0.2 % en peso a aproximadamente 5 % en peso (por ejemplo, de 0.2 % en peso a 3 % en peso, 0.4 % en peso a 2 % en peso, 0.4 % en peso a 1 % en peso, etc.) del peso total de enzimas en una composición enzimática de la invención. Los ejemplos de L-a-arabinofuranosidasa (s) adecuadas para incluir en las composiciones de mezclas enzimáticas de la descripción se describen en la Sección 5.3.8.
ß-xiloeidasas ; la(s) ß-xilosidasa (s) constituyen, adecuadamente, de aproximadamente 0 % en peso a aproximadamente 40 % en peso del peso total de las enzimas en una mezcla/composiciones enzimáticas. La cantidad se puede calcular con el uso de métodos conocidos, tales como, por ejemplo, SDS-PAGE, HPLC y UPLC, como en los ejemplos. La relación de cualquier par de proteínas con respecto a la otra se puede calcular fácilmente. Se contemplan mezclas /composiciones que comprenden enzimas en cualquier relación en peso derivable de los porcentajes en peso descritos en la presente descripción. El contenido de ß-xilosidasa puede estar en un intervalo, en donde el límite inferior es de aproximadamente 0 % en peso, 1 % en peso, 2 % en peso, 3 % en peso, 4 % en peso, 5 % en peso, 6 % en peso 7 ¾ en peso, 8 % en peso, 9 % en peso, 10 % en peso, 12 % en peso, 15 % en peso, 20 % en peso, 25 % en peso, 30 % en peso, 35 % en peso del peso total de enzimas en la mezcla/composición y el límite superior es aproximadamente 10 % en peso, 15 % en peso, 20 % en peso, 25 % en peso, 30 % en peso, 35 % en peso o 40 % en peso del peso total de enzimas en la mezcla/composición. Por ejemplo, la ß-xilosidasa o ß-xilosidasas representan, adecuadamente, 2 % en peso a 30 % en peso; 10 % en peso a 20 % en peso; o 5 % en peso a 10 % en peso del peso total de enzimas en la mezcla/composición . La ß-xilosidasa o ß-xilosidasas se describen en la presente descripción, por ejemplo, en la Sección 5.3.7.
5.3.5. Celulasas
Las mezclas/composiciones enzimáticas de la descripción pueden comprender una o más celulasas. Las celulasas son enzimas que hidrolizan la celulosa (enlaces ß-l, 4-glucano o ß D-glucosídicos) lo que da lugar a la formación de glucosa, celobiosa, celooligosacáridos y similares. Tradicionalmente , las celulasas se han dividido en tres clases principales: endoglucanasas (EC 3.2.1.4) ("EG"), exoglucanasas o celobiohidrolasas (EC 3.2.1.91) ( "CBH" ) y ß-glucosidasas (ß -D-glucosida glucohidrolasa; EC 3.2.1.21) ( "BG" ) (Knowles et al., 1987, Trends in Biotechnology 5 (9) : 255-261 ; Shulein, 1988, Methods in Enzymology, 160:234-242). Las endoglucanasas actúan principalmente en las partes amorfas de la fibra de celulosa-, mientras que las celobiohidrolasas son capaces, además, de degradar la celulosa cristalina.
Las celulasas adecuadas para los métodos y composiciones de la descripción pueden obtenerse o producirse en forma recombinante , entre otros, a partir de uno o más de uno de los siguientes organismos: Crinipellis scapella, Macrophomina phaseolina, Myceliophthora thermophila, Sordaria fimicola, Volutella colletotrichoides, Thielavia terrestris, Acremonium sp . , Exidia glandulosa, Fomes fomentarius, Spongipellis sp . , Rhizophlyctis rosea, Rhizo ucor pusillus, Phycomyces niteus, Chaetostylum fresenii , Diplodia gossypina, Ulospora bilgramii , Saccobolus dilutellus, Penicillium verruculosum, Penicillium chrysogenum, Thermomyces verrucosus, Diaporthe syngenesia, Colletotrichum lagenarium, Nigrospora sp. , Xylaria hypoxilon, Nectria pinea, Sordaria macrospora, Thielavia thermophila , Chaeto ium mororum, Chaetomium virscens, Chaetomium brasiliensis, Chaetomium cunicolorum, Syspastospora boninensis, Cladorrhinum foecundissimum, Scytalidium thermophila, Gliocladium catenulatum, Fusarium oxysporum ssp. lycopersici , Fusarium oxysporum ssp. passiflora, Fusarium solani, Fusarium anguioides, Fusarium poae, Humicola nigrescens, Humicola grísea, Panaeolus retirugis, Trametes sanguínea, Schizophyllu commune, Trichothecium roseum, Microsphaeropsis sp. , Acsobolus stictoideus spej . , Poronia punctata, Nodulisporum sp., Trichoder a sp. (por ejemplo, T. reesei) y Cylindrocarpon sp.
Por ejemplo, una celulasa útil en el método y/o composición de la descripción es una celulasa completa y/o capaz de alcanzar un valor de por lo menos 0.1 (por ejemplo, 0.1 a 0.4) de producto fraccionado según se determina por medio del ensayo de calcoflúor descrito en la Sección 6.1.11. más abajo.
5.3.5.1. ß-glucosidasas
Las mezclas/composiciones enzimáticas de la descripción pueden comprender, opcionalmente , una o más ß-glucosidasas . El término "ß-glucosidasa" , como se usa en la presente descripción, se refiere a una ß-D-glucósido glucohidrolasa clasificada como EC 3.2.1.21 y/o miembros de ciertas familias GH que incluyen, sin limitarse a, miembros de las familias GH 1, 3, 9 o 48 que catalizan la hidrólisis de celobiosa para liberar ß-D-glucosa.
La ß-glucosidasa adecuada puede obtenerse a partir de varios microorganismos, por medios recombinantes o puede adquirirse de fuentes comerciales. Los ejemplos de ß-glucosidasas de microorganismos incluyen, sin limitarse a, las obtenidas de bacterias y hongos. Por ejemplo, una ß-glucosidasa de la presente descripción puede ser de un hongo filamentoso .
Las ß-glucosidasas pueden obtenerse o producirse en forma recombinante , entre otros, a partir de A. aculeatus (Kawaguchi et al. Gene 1996, 173: 287-288), A kawachi (Iwashita et al. Appl . Environ. Microbiol. 1999, 65: 5546-5553), A. oryzae (patente núm. WO 2002/095014), C. biazotea (Wong et al. Gene, 1998, 207:79-86), P. funiculosum (patente núm. WO 2004/078919), S. fibuligera (Machida et al. Ap l. Environ. Microbiol. 1988, 54: 3147-3155), S. pombe (Wood et al. Nature 2002, 415: 871-880) o T. reesei (por ejemplo, ß-glucosidasa 1 (patente de los Estados Unidos núm. 6,022,725), ß-glucosidasa 3 (patente de los Estados Unidos núm. 6,982,159), ß- glucosidasa 4 (patente de los Estados Unidos núm. 7,045,332), ß-glucosidasa 5 (patente de los Estados Unidos núm. 7,005,289), ß-glucosidasa 6 (publicación de patente de los Estados Unidos núm. 20060258554) , ß-glucosidasa 7 (publicación de patente de los Estados Unidos núm. 20060258554) .
La -glucosidasa se puede producir por la expresión de un gen endógeno o exogeno que codifica una ß-glucosidasa . Por ejemplo, la ß-glucosidasa puede ser secretada en el espacio extracelular, por ejemplo, por organismos Gram-positivos (por ejemplo, Bacillus o Actinomycetes) o huéspedes eucariotas (por ejemplo, Trichoderma, Aspergillus, Saccharomyces o Pichia) . En algunos casos, la ß-glucosidasa se puede sobreexpresar o subexpresar.
La ß-glucosidasa puede obtenerse, además, de fuentes comerciales. Los ejemplos de preparaciones comerciales de ß-glucosidasa adecuadas para usar en la presente descripción incluyen, por ejemplo, ß-glucosidasa de T. reesei en Accellerase® BG (Danisco US Inc., Genencor) ; NOVOZYM™ 188 (una ß-glucosidasa de A. niger) ; ß-glucosidasa de Agrobacterium sp. y ß-glucosidasa de T. marítima de Megazyme (Megazyme International Ireland Ltd. , Irlanda) .
Además, la ß-glucosidasa puede ser un componente de una celulasa completa, tal como se describe en la Sección 5.3.6. más abajo.
La descripción proporciona ciertos polipéptidos de ß-glucosidasa que son polipéptidos de fusión/quiméricos que comprenden dos o más secuencias de ß-glucosidasa . Por ejemplo, la primera secuencia de ß-glucosidasa puede comprender una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencia de las sec . con núms . de ident . : 96-108. La segunda secuencia de ß-glucosidasa puede comprender una secuencia que tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y comprende uno o más o todos los motivos de secuencia de las sec. con núms. de ident.: 109-116. En ciertas modalidades, la primera secuencia de ß-glucosidasa está en el N-terminal del polipéptido de fusión/quimérico mientras que la segunda secuencia de ß-glucosidasa está en el C-terminal del polipéptido de fusión/quimérico. En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasa están inmediatamente adyacentes. Por ejemplo, el C-terminal de la primera secuencia de ß-glucosidasa está conectado al N-terminal de la segunda secuencia de ß-glucosidasa. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasa no están inmediatamente adyacentes, sino que la primera y la segunda secuencia de ß-glucosidasa se conectan a través de un dominio conector. En algunas modalidades, la primera secuencia de ß-glucosidasa, la segunda secuencia de ß-glucosidasa o el dominio conector pueden comprender una secuencia que tiene una longitud de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos. En ciertas modalidades, la primera secuencia de ß-glucosidasa tiene una longitud de aproximadamente 200 residuos de aminoácidos y por lo menos aproximadamente 60 % de identidad de secuencia con respecto a una secuencia de Fv3C de la misma longitud en el N-terminal. En ciertas modalidades, la segunda secuencia de ß-glucosidasa tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y por lo menos aproximadamente 60 % de identidad de secuencia con respecto a una secuencia de igual longitud en el C-terminal de cualquiera de las sec . con núms . de ident.:54, 56, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79. En ciertas modalidades, el polipéptido de ß-glucosidasa de fusión/quimérico tiene estabilidad mejorada, por ejemplo, estabilidad proteolítica mejorada en comparación con cualquiera de las enzimas a partir de las cuales se derivaron las partes quiméricas del polipéptido quimérico/de fusión. En ciertas modalidades, la segunda secuencia de ß -glucosidasa es una secuencia que . tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y por lo menos aproximadamente 60 % de identidad de secuencia con una secuencia de igual longitud en el C-terminal de Tr3B. En ciertas modalidades, la secuencia de bucle que está en la primera secuencia de ß-glucosidasa, en la segunda secuencia de ß -glucosidasa o en el motivo conector, es una secuencia que tiene una longitud de 3 , 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos derivada de Te3A.
La actividad de ß-glucosidasa se puede determinar por varios medios adecuados conocidos en la técnica, tal como el ensayo descrito por Chen et al., en Biochimica et Biophysica Acta 1992, 121:54-60, en donde 1 pNPG representa 1 ymoL de nitrofenol liberado a partir de 4-nitrofenil-ß-?-glucopiranosida en 10 min a 50 °C (122 °F) y pH 4.8.
La ß-glucosidasa o ß-glucosidasas constituyen, adecuadamente, aproximadamente 0 % en peso a aproximadamente 55 % en peso del peso total de enzimas en una mezcla/composición enzimática de la invención. La cantidad se puede determinar con el uso de métodos conocidos que incluyen, por ejemplo, los métodos SDS-PAGE, HPLC o UPLC de los ejemplos. La relación de cualquier par de proteínas con respecto a la otra se puede calcular. Se contemplan mezclas /composiciones que comprenden enzimas en cualquier relación en peso derivable de los porcentajes en peso descritos en la presente descripción. El contenido de ß-glucosidasas puede estar en un intervalo, en donde el límite inferior es aproximadamente 0 % en peso, 1 % en peso, 2 % en peso, 3 % en peso, 4 % en peso, 5 % en peso, 6 % en peso 7 % en peso, 8 % en peso, 9 % en peso, 10 % en peso, 12 % en peso, 15 % en peso, 20 % en peso, 25 % en peso, 30 % en peso, 40 % en peso, 45 % en peso o 50 % en peso del peso total de enzimas en la mezcla/composición y el límite superior es aproximadamente 10 % en peso, 15 % en peso, 20 % en peso, 25 % en peso, 30 % en peso, 35 % en peso, 40 % en peso, 50 % en peso, 55 % en peso, del peso total de enzimas en la mezcla/ composición. Por ejemplo, la ß-glucosidasa o ß-glucosidasas representan, adecuadamente, 2 % en peso a 30 % en peso; 10 % en peso a 20 % en peso; o 5 % en peso a 10 % en peso del peso total de enzimas en la mezcla/composición .
5.3.5.2. Endoglucanasas
Las mezclas/composiciones enzimáticas de la descripción comprenden, opcionalmente, una o más endoglucanasas además de los polipéptidos de endoglucanasa de GH61 IV (EGIV) descritos en la presente descripción. Se puede usar cualquier endoglucanasa (EC 3.2.1.4), además de los polipéptidos de EGIV en los métodos y composiciones de la presente descripción. Tal endoglucanasa se puede producir por la expresión de un gen de endoglucanasa endógeno o exógeno. En algunos casos, la endoglucanasa se puede sobreexpresar o subexpresar .
Por ejemplo, EG1 de T. reesei (Penttila et al., Gene 1986, 63:103-112) y/o EG2 de T. reesei (Saloheimo et al., Gene 1988, 63:11-21) se usan, adecuadamente, en los métodos y composiciones de la presente descripción. Una endoglucanasa de T. terrestris termoestable (Kvesitadaze et al., Applied Biochem. Biotech. 1995, 50:137-143) se usa, por ejemplo, en los métodos y composiciones de la presente descripción. Además, se puede usar una EG3 de T. reesei (Okada et al. Ap l . Environ. Microbiol. 1988, 64:555-563), EG5 (Saloheimo et al. Molecular Microbiology 1994, 13:219-228), EG6 (publicación de patente de los Estados Unidos núm. 20070213249) o EG7 (publicación de patente de los Estados Unidos núm. 20090170181) , una endoglucanasa El de A. cellulolyticus (patente de los Estados Unidos núm. 5,536,655), una endoglucanasa V de H. insolens (EGV) (registro en el Banco de datos de proteínas: 4ENG) , una endoglucanasa de S. coccosporum (publicación de patente de los Estados Unidos núm. 20070111278), una endoglucanasa de Fl-CMC de A. aculeatus (Ooi et al. Nucleic Acid Res. 1990, 18:5884), una endoglucanasa CMCase-1 de A. kawachii IFO 4308 (Sakamoto et al. Curr. Genet . 1995, 27:435-439), una E. carotovara (Saarilahti et al. Gene 1990, 90:9-14); o una endoglucanasa de A. thermophilum ALK04245 (publicación de patente de los Estados Unidos núm. 20070148732) . Otras endoglucanasas adicionales adecuadas se describen, por ejemplo, en la patente núm. O 91/17243, patente núm. WO 91/17244, patente núm. WO 91/10732, patente de los Estados Unidos núm. 6,001,639.
La descripción proporciona polipéptidos que tienen actividad de GH61/endoglucanasa . En algunas modalidades, el polipéptido que tiene actividad de GH61/endoglucanasa es un polipéptido de EGIV, por ejemplo, un polipéptido de Eg4 de G. reesei . En algunas modalidades, el polipéptido es un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencia con respecto a cualquiera de las sec . con núms. de ident.: 52, 80-81, 206-207 en una región de por lo menos aproximadamente 10 (por ejemplo, por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300) residuos o uno que comprende uno o más motivos de secuencias seleccionados del grupo que consiste en: (1) las sec. con núms. de ident. : 84 y 88; (2) las sec. con núms. de ident. :85 y 88; (3) la sec. con núm. de ident. :86; (4) la sec. con núm. de ident. :87; (5) las sec. con núms. de ident. :84, 88 y 89; (6) las sec. con núms. de ident. :85, 88 y 89; (7) las sec. con núms. de ident. : 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident.: 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident. : 85, 88, 90 y 91. En ciertas modalidades, la composición comprende, además, una celobiosa deshidrogenasa .
Las endoglucanasas de GH61 constituyen aproximadamente 0.1 % en peso a aproximadamente 50 % en peso del peso total de enzimas en una mezcla/composición enzimática. La cantidad se puede determinar con el uso de métodos conocidos que incluyen, por ejemplo, SDS-PAGE, HPLC o UPLC, tal como se describe en los ejemplos. La relación de un par de proteínas con respecto a la otra puede calcularse en base a estas mediciones. Se contemplan mezclas/composiciones que comprenden enzimas en cualquier relación en peso derivable de los porcentajes en peso de la presente descripción. El contenido de endoglucanasa de GH61 puede estar en un intervalo, en donde el límite inferior es aproximadamente 0 % en peso, 1 % en peso, 2 % en peso, 3 % en peso, 4 % en peso, 5 % en peso, 6 % en peso 7 % en peso, 8 % en peso, 9 % en peso, 10 % en peso, 12 % en peso, 15 % en peso, 20 % en peso, 25 % en peso, 30 % en peso, 40 % en peso, 45 % en peso del peso total de enzimas en la mezcla/composición y el límite superior es aproximadamente 10 % en peso, 15 % en peso, 16 % en peso, 20 % en peso, 25 % en peso, 30 % en peso, 35 % en peso, 40 % en peso, 50 % en peso del peso total de enzimas en la mezcla/composición. Por ejemplo, las endoglucanasas de GH61 representan, adecuadamente, aproximadamente 2 % en peso a aproximadamente 30 % en peso; aproximadamente 8 % en peso a aproximadamente 20 % en peso; aproximadamente 3 % en peso a aproximadamente 18 % en peso, aproximadamente 4 % en peso a aproximadamente 19 % en peso o aproximadamente 5 % en peso a aproximadamente 20 % en peso del peso total de enzimas en la mezcla/composición .
5.3.5.3. Celobiohidrolasas
Opcionalmente , en los métodos y mezclas/composiciones de la presente descripción puede usarse cualquier celobiohidrolasa (EC 3.2.1.91) ("CBH"). La celobiohidrolasa se puede producir por la expresión de un gen de celobiohidrolasa endógeno o exógeno. En algunos casos, la celobiohidrolasa se puede sobreexpresar o subexpresar.
Por ejemplo, CBHI de T. reesei (Shoemaker et al. Bio/Technology 1983, 1:691-696) y/o CBHII de T. reesei (Teeri et al. Bio/Technology 1983, 1:696-699) pueden usarse adecuadamente en los métodos y mezclas/composiciones de la presente descripción.
Las CBH adecuadas pueden seleccionarse de una CBHl de A. bisporus (núm. de registro en Swiss Prot Q92400) , una CBHl de A. aculeatus (núm. de registro en Swiss Prot 059843), una CBHA de A. nidulans (núm. de registro en GenBank AF420019) o CBHB (núm. de registro en GenBank AF420020) , una CBHA de A. niger (núm. de registro en GenBank AF156268) o CBHB (núm. de registro en GenBank AF156269) , una CBHl de C. purpurea (núm. de registro en Swiss Prot 000082), una CBHl de C. carbonarum (núm. de registro en Swiss Prot Q00328) , una CBH1 de C. parasítica (núm. de registro en Swiss Prot Q00548) , una CBH1 de F. oxysporum (Cel7A) (núm. de registro en Swiss Prot P46238) , una CBH1.2 de H. grísea (núm. de registro en GenBank U50594), una CBH1 de H. grísea var. thermoidea (núm. de registro en GenBank D63515) , una CBHI .2 (núm. de registro en GenBank AF123441) o exol (núm. de registro en GenBank AB003105) , una Cel7B de M. albomyces (núm. de registro en GenBank AJ515705) , una CBHI de N. crassa (núm. de registro en GenBank X77778) , una CBHI de P. funiculosum (Cel7A) (publicación de patente de los Estados Unidos núm. 20070148730) , una CBHI de P. janthinellum (núm. de registro en GenBank S56178) , una CBH de P. chrysosporium (núm. de registro en GenBank M22220) o una CBHI-2 (Cel7D) (núm. de registro en GenBank L22656) , una CBH1A de T. emersoníí (núm. de registro en GenBank AF439935) , una CBHI de T. víríde (núm. de registro en GenBank X53931) o una V14 CBHI de V. volvacea (núm. de registro en GenBank AF156693) .
5.3.6. Celulasas completas
Una mezcla/composición enzimática de la descripción puede comprender, además, una celulasa completa. Como se usa en la presente descripción, una "celulasa completa" se refiere a una composición que contiene celulasa de origen natural o de origen no natural que comprende por lo menos 3 tipos de enzimas diferentes: (1) una endoglucanasa, (2) una celobiohidrolasa y (3) una ß-glucosidasa o que comprende por lo menos 3 actividades enzimáticas diferentes: (1) una actividad de endoglucanasa, que cataliza el clivaje de enlaces ß-1,4 internas y produce glucooligosacáridos más cortos, (2) una actividad de celobiohidrolasa que cataliza una liberación de tipo "exo" de unidades de celobiosa (glucosas de ß-1, -disacárido de glucosa) y (3) una actividad de ß-glucosidasa que cataliza la liberación del monómero de glucosa a partir de celooligosacáridos cortos (por ejemplo, celobiosa) .
Una composición "que contiene celulasa de origen natural" es una composición producida por una fuente natural, que comprende uno o más componentes o actividades de tipo celobiohidrolasa, uno o más componentes o actividades de tipo endoglucanasa y uno o más componentes o actividades de tipo ß-glucosidasa, en donde cada uno de estos componentes o actividades está presente en las proporciones y niveles producidos en la naturaleza, no modificados por el ser humano. En consecuencia, una composición que contiene celulasa de origen natural es, por ejemplo, una composición producida por un organismo no modificado con respecto a las enzimas celulolíticas , de manera que las proporciones o los niveles de las enzimas componentes sean iguales a los producidos por el organismo nativo en la naturaleza. Una "composición que contiene celulasa no presente en la naturaleza" se refiere a una composición producida por: (1) la combinación de enzimas celulolíticas componentes ya sea en una relación que existe en la naturaleza o no, es decir, en una relación alterada; o (2) la modificación de un organismo para que sobreexprese o subexprese una o más enzimas celulolíticas; o (3) la modificación de un organismo de manera que se elimine al menos una enzima celulolítica . Una composición "que contiene celulosa no presente en la naturaleza" puede referirse, además, a una composición que resulte de ajustar las condiciones del cultivo para un organismo natural, de manera que este crezca en condiciones no nativas y produzca un nivel o una relación modificados de enzimas. En consecuencia, en algunas modalidades, la preparación de celulasa completa de la presente descripción puede tener una o más EG y/o CBH y/o ß -glucosidasas eliminadas y/o sobreexpresadas.
Una preparación de celulasa completa se puede elaborar a partir de cualquier microorganismo capaz de hidrolizar un material celulósico. Por ejemplo, la preparación de celulasa completa es una celulasa completa de hongo filamentoso. Por ejemplo, la preparación de celulasa completa se puede realizar a partir de las especies Acremonium, Aspergillus, Emericella, Fusarium, Humicola , Mucor, Myceliophthora , Neurospora, Penicillium, Scytalidium, Thielavia , Tolypocladium o Trichoderma . La preparación de celulasa completa es, por ejemplo, una celulasa completa de Aspergillus aculeatus, Aspergillus awamori, Aspergillus foetidus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger o Aspergillus oryzae . La preparación de celulasa completa puede ser una preparación de celulasa completa de Fusarium bactridioides, Fusarium cerealis, Fusarium crookwellense, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi , Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusarium sarcochroum, Fusarium sporotrichioides, Fusarium sulphureum, Fusarium torulosum, Fusarium trichothecioides o Fusarium venenatum. La preparación de celulasa completa puede ser, además, una preparación de celulasa completa de Hu icola insolens, Humicola lanuginosa, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Penicillium purpurogenum, Penicillium funiculosum, Scytalidium thermophilum,
Chrysosporium lucknowence o Thielavia terrestris . Además., la preparación de celulasa completa puede ser una preparación de celulasa completa de Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatum, Trichoderma reesei (por ejemplo, RL-P37 (Sheir-Neiss G et al. Ap l . Microbiol . Biotechnology, 1984, 20, págs . 46-53), QM9414 (ATCC núm. 26921), NRRL 15709, ATCC 13631, 56764, 56466, 56767) o de Trichoderma viride {por ejemplo, ATCC 32098 y 32086).
Particularmente, la preparación de celulasa completa puede ser, adecuadamente, una preparación de celulasa completa de utC30 de T. reesei, que está disponible de la Colección Estadounidense de Cultivos Tipo (American Type Culture Collection) como Trichoderma reesei ATCC núm. 56765. Por ejemplo, la preparación de celulasa completa puede ser, además, adecuadamente, una celulasa completa de P. funiculosum, que está disponible de la Colección Americana de Cultivos Tipo como P. funiculosum ATCC núm.: 10446. Además, la preparación de celulasa completa puede ser una preparación de celulasa completa bacteriana, por ejemplo, una preparación de un Bacillus o E. coli.
La preparación de celulasa completa también se puede obtener de fuentes comerciales. Los ejemplos de preparaciones de celulasa comerciales adecuadas para usar en los métodos y composiciones de la presente descripción incluyen, por ejemplo, CELLUCLAST™ y Cellic™ (Novozymes A/S) y LAMINEX™ BG, IndiAge™ 44L, Primafast™ 100, Primafast™ 200, Spezyme™ CP, Accellerase® 1000 y Accellerase® 1500 (Danisco US. Inc., Genencor) .
Las preparaciones de celulasa completa se pueden obtener por cualquier método de cultivo de microorganismos que resulta en la expresión de enzimas capaces de hidrolizar un material celulósico. Como se usa en la presente descripción, "fermentación" se refiere a la fermentación a pequeña o gran escala del cultivo en un matraz de agitación, tales como fermentaciones por lote, por lote alimentado o en estado sólido en termentadores de laboratorio o industriales, realizadas en un medio adecuado y bajo condiciones que permitan la expresión o el aislamiento de la celulasa y/o las enzimas de interés.
Generalmente, se cultiva el microorganismo en un medio de cultivo celular adecuado para la producción de enzimas capaces de hidrolizar un material celulósico. El cultivo se lleva a cabo en un medio de nutrientes adecuado, que comprende fuentes de carbono y nitrógeno y sales inorgánicas, mediante el uso de los procedimientos y las variaciones conocidos en la técnica. Se conocen el medio de cultivo adecuado, los intervalos de temperatura y demás condiciones para el crecimiento y la producción de celulasa. Por ejemplo, un intervalo de temperatura típico para la producción de celulasas por medio de T. reesei es de 24 °C a 28 °C
La preparación de celulasa completa se puede usar tal como se la produce mediante fermentación con una recuperación y/o purificación mínimas o sin estas. Por ejemplo, una vez que se secretan las celulasas en el medio de cultivo celular, el medio de cultivo celular que contiene las celulasas se puede usar directamente. La preparación de celulasa completa puede comprender el contenido no fraccionado del material de fermentación, que incluyen el medio de cultivo celular usado, las enzimas extracelulares y las células. Por otro lado, la preparación de celulasa completa se puede someter, además, a un procesamiento adicional en una serie de etapas de rutina, por ejemplo, precipitación, centrifugación, cromatografía de afinidad, filtración, o similares. Por ejemplo, la preparación de celulasa completa se puede concentrar y, después, usar sin una purificación posterior. Por ejemplo, la preparación de celulasa completa se puede formular de modo que comprenda ciertos agentes químicos que reducen la viabilidad celular o eliminan las células después de la fermentación. Se pueden lisar o permeabilizar las células, por ejemplo, mediante el uso de los métodos conocidos en la técnica.
La actividad endoglucanasa de la preparación de celulasa completa se puede determinar mediante el uso de celulosa de carboximetilo (CMC) como un sustrato. Un ensayo adecuado mide la producción de los extremos reductores creados por la mezcla de enzimas que actúa en la CMC, en donde 1 unidad es la cantidad de enzimas que liberan 1 ymoL de producto/min (Ghose, T.K., Puré & Appl . Chem. 1987, 59, págs . 257-268) .
La celulasa completa puede ser una celulasa enriquecida con ß-glucosidasa . La celulasa completa enriquecida con ß-glucosidasa comprende, generalmente, una ß-glucosidasa y una preparación de celulasa completa. Las composiciones de celulasa completa enriquecidas con ß-glucosidasa se pueden producir con el uso de métodos recombinantes . Por ejemplo, la preparación de celulasa completa puede obtenerse por la expresión de una ß-glucosidasa en un microorganismo capaz de producir una celulasa completa. La composición de celulasa completa enriquecida con ß-glucosidasa puede comprender, además, por ejemplo, una preparación de celulasa completa y una ß-glucosidasa . Cualquiera de los polipéptidos de ß-glucosidasa descritos en la presente descripción puede ser adecuado e incluye, por ejemplo, un polipéptido de ß-glucosidasa quimérico/de fusión. Por ejemplo, la composición de celulasa completa enriquecida con ß-glucosidasa puede comprender, adecuadamente, por lo menos aproximadamente 5 % en peso, 7 % en peso, 9 % en peso 10 % en peso o 14 % en peso y hasta aproximadamente 17 % en peso, aproximadamente 20 % en peso, 25 % en peso, 30 % en peso, 35 % en peso, 40 % en peso o 50 % en peso de ß-glucosidasa en base al peso total de proteínas en esa mezcla/composición.
5.3.7. Xilanasas & ß-xilosidasa
Las mezclas/composiciones enzimáticas de la descripción pueden comprender, por ejemplo, una o más xilanasas, que pueden ser Xyn2 de T. reesei, Xyn3 de T. reesei, AfuXyn2 o AfuXyn5. Los polipéptidos de Xyn2 de T. reesei, Xyn3 de T. reesei, AfuXyn2 o AfuXyn5 se describen en la presente descripción .
Las mezclas/composiciones enzimáticas de la descripción comprenden, opcionalmente, una o más xilanasas además de o en lugar de una o más xilanasas. Cualquier xilanasa (EC 3.2.1.8) se puede usar con la o las xilanasas adicionales. Las xilanasas adecuadas incluyen, por ejemplo, una xilanasa de C. saccharolyticum (Luthi et al. 1990, Appl . Environ. Microbiol . 56 (9) : 2677-2683) , una xilanasa de T. marítima (Winterhalter & Liebel, 1995, Appl. Environ. Microbiol. 61 (5) : 1810-1815) , una xilanasa de la cepa de Thermatoga Sp. FJSS-B.l (Simpson et al. 1991, Biochem. J. 277, 413-417), una xilanasa de B . circulans (BcX) (patente de los Estados Unidos núm. 5,405,769), una xilanasa de A. niger (Kinoshita et al. 1995, Journal of Fermentation and Bioengineering 79 (5) : 422-428) , una xilanasa de S. lividans (Shareck et al. 1991, Gene 107:75-82; Morosoli et al. 1986 Biochem. J. 239:587-592; Kluepfel et al. 1990, Biochem. J. 287:45-50), una xilanasa de B. subtilis (Bernier et al. 1983, Gene 26 (1) : 59-65 ) , una xilanasa de C. fimi (Clarke et al., 1996, FEMS Microbiology Letters 139:27-35), una xilanasa de P. fluorescens (Gilbert et al. 1988, Journal of General Microbiology 134:3239-3247), una xilanasa de C. thermocellum (Domínguez et al., 1995, Nature Structural Biology 2:569-576), una xilanasa de B. pumilus (Nuyens et al. Applied Microbiology and Biotechnology 2001, 56:431-434; Yang et al. 1998, Nucleic Acids Res. 16 (14B) : 7187) , una xilanasa de C. acetobutylicum P262 (Zappe et al. 1990, Nucleic Acids Res. 18(8):2179) o una xilanasa de T. harzianum (Rose et al. 1987, J. Mol. Biol .194 (4) : 755-756) .
La xilanasa se puede producir por la expresión de un gen endógeno o exógeno que codifica una xilanasa. La xilanasa, por ejemplo, se puede sobreexpresar o subexpresar.
Las mezclas/composiciones enzimáticas de la descripción pueden comprender, adecuadamente, por ejemplo, una o más ß-xilosidasas. Por ejemplo, la ß-xilosidasa es una enzima de ß-xilosidasa del Grupo 1 (por ejemplo, Fv3A o Fv43A) o una enzima de ß-xilosidasa del Grupo 2 (por ejemplo, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A o Bxll de T. reesei) . Por ejemplo, una mezcla/composición enzimática de la descripción puede comprender, adecuadamente, una o más ß-xilosidasas del Grupo 1 y una o más ß-xilosidasas del Grupo 2.
Las mezclas/composiciones enzimáticas de la descripción pueden comprender, opcionalmente , una o más ß-xilosidasas, además de o en lugar de las ß-xilosidasas del Grupo 1 y/o Grupo 2 anteriores. Cualquier ß-xilosidasa (EC 3.2.1.37) se puede usar como las ß-xilosidasas adicionales. Las ß-xilosidasas adecuadas incluyen Bxll de T. emersonii (Reen et al. 2003, Biochem Biophys Res Commun. 305 (3) : 579-85) , una ß-xilosidasa de G. stearothermophilus (Shallom et al. 2005, Biochemistry 44:387-397), una ß-xilosidasa de S. thermophilum (Zanoelo et al. 2004, J. Ind. Microbiol. Biotechnol . 31:170-176), una ß-xilosidasa de T. lignorum (Schmidt, 1998, métodos Enzymol . 160:662-671), una ß-xilosidasa de A. awamori (Kurakake et al. 2005, Biochim. Biophys . Acta 1726:272-279), una ß-xilosidasa de A. versicolor (Andrade et al. 2004, Process Biochem. 39:1931-1938), una ß-xilosidasa de Streptomyces sp. (Pinphanichakarn et al. 2004, World J. Microbiol. Biotechnol . 20:727-733), una ß-xilosidasa de T. marítima (Xue and Shao, 2004, Biotechnol. Lett . 26:1511-1515), una ß-xilosidasa de Trichoderma sp. SY (Kim et al. 2004, J. Microbiol. Biotechnol. 14:643-645), una ß-xilosidasa de A. niger (Oguntimein and Reilly, 1980, Biotechnol. Bioeng. 22:1143-1154) o una ß-xilosidasa de P. wortmanni (Matsuo et al. 1987, Agrie. Biol . Chem. 51:2367-2379).
La ß-xilosidasa se puede producir por la expresión de un gen endógeno o exógeno que codifica una ß-xilosidasa . En algunos casos, la ß-xilosidasa se puede sobreexpresar o subexpresar .
5.3.8. L-a-arabinofuranosidasas
Las mezclas/composiciones enzimáticas de la descripción pueden comprender adecuadamente, por ejemplo, una o más L-a-arabinofuranosidasas . La L-a-arabinofuranosidasa es, por ejemplo, un polipéptido de Af43A, Fv43B, Pf51A, Pa51A, Fv51A, Af43A, Fv43B, Pf51A, Pa51A o Fv51A.
Las mezclas/composiciones enzimáticas de la descripción comprenden, opcionalmente , una o más L-a-arabinofuranosidasas además de o en lugar de las L-a-arabinofuranosidasas anteriores. Las L-a-arabinofuranosidasas (EC 3.2.1.55) de cualquier organismo adecuado pueden usarse como las L-a-arabinofuranosidasas adicionales. Las L-a-arabinofuranosidasas adecuadas incluyen, por ejemplo, una L-a-arabinofuranosidasa de A. oryzae (Numan & Bhosle, J. Ind. Microbiol . Biotechnol . 2006, 33:247-260), A. sojae (Oshima et al. J. Appl. Glycosci. 2005, 52:261-265), B. brevis (Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), B . stearothermophilus (Kim et al., J. Microbiol. Biotechnol. 2004, 14:474-482), B . breve (Shin et al., Appl. Environ. Microbiol. 2003, 69:7116-7123), B. longum (Margolles et al., Appl. Environ. Microbiol. 2003, 69:5096-5103), C. thermocellum (Taylor et al., Biochem. J. 2006, 395:31-37), F. oxysporum (Panagiotou et al., Can. J. Microbiol. 2003, 49:639-644), F. oxysporum f. sp. dianthi (Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), G. stearothermophilus T-6 (Shallom et al., J. Biol . Chem. 2002, 277:43667-43673), H. vulgare (Lee et al., J. Biol. Chem. 2003, 278:5377-5387), P. chrysogenum (Sakamoto et al., Biophys. Acta 2003, 1621:204-210), Penicillium sp. (Rahman et al., Can. J. Microbiol. 2003, 49:58-64), P. cellulosa (Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), R. pusillus (Rahman et al., Carbohydr. Res. 2003, 338:1469-1476) , S chartreusis, S. thermoviolacus, T. ethanolicus, T. xylanilyticus (Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), G. fusca (Tuncer and Ball, Folia Microbiol. 2003, (Praha) 48:168-172), T. marítima (Miyazaki, Extremophiles 2005, 9:399-406), Trichoderma sp. SY (Jung et al. Agrie. Chem. Biotechnol . 2005, 48:7-10), A. kawachii (Koseki et al., Biochim. Biophys. Acta 2006, 1760:1458-1464), F. oxysporum f. sp. dianthi (Chacón-Martínez et al., Physiol. Mol. Plant Pathol . 2004, 64:201-208), T. xylanilyticus (Debeche et al., Protein Eng. 2002, 15:21-28), H. insolens, M. giganteus (Sorensen et al., Biotechnol. Prog. 2007, 23:100-107) o R . sativus (Kotake et al. J. Ex . Bot . 2006, 57:2353-2362) .
La L-a-arabinofuranosidasa se puede producir por la expresión de un gen endógeno o exógeno que codifica una L-a-arabinofuranosidasa . En algunos casos, la L-a-arabinofuranosidasa se puede sobreexpresar o subexpresar.
5.3.9. Celobiosa deshidrogenasas
El término "celobiosa deshidrogenasa" se refiere a una oxidorreductasa de E.C. 1.1.99.18 que cataliza la conversión de celobiosa en presencia de un aceptor para celobiono- 1 , 5-lactona y un aceptor reducido. El 2 , 6 -dicloroindofeol , como el hierro, el oxígeno molecular, la ubiquinona o el citocromo C u otro polifenol pueden actuar como un aceptor. Los sustratos de celobiosa deshidrogenasa incluyen, sin limitarse a, celobiosa, celo-oligosacáridos , lactosa y D-glucosil-1 , 4-ß-D-manosa, glucosa, maltosa, manobiosa, tiocelobiosa , galactosil-mañosa, xilobiosa y xilosa. Los donadores de electrones incluyen, ß-1-4 dihexosas con glucosa o mañosa en el extremo reductor, -?-4-hexosidas, hexosas, pentosas y ß-1-4-pentómeros . Ver, Henriksson et al., 1998, Biochimica et Biophysica Acta - Protein Structure and Molecular Enzymology, 1383:48-54; Schou et al., 1998, Biochem. J. 330:565-571.
Dos familias de celobiosa deshidrogenasas pueden incluirse, adecuadamente, en una composición enzimática de la presente descripción o pueden expresarse por medio de una célula huésped modificada genéticamente de la presente descripción, familia 1 y familia 2. Las dos familias se diferencian por la presencia de un motivo de unión a celulosa (CBM) en la familia 1, pero no en la familia 2. La estructura tridimensional de la celobiosa deshidrogenasa indica dos dominios globulares, cada uno contiene uno de los dos cofactores : un derivado hémico o una flavina. El sitio activo está en una hendidura entre los dos dominios. El ciclo catalítico de la celobiosa deshidrogenasa sigue un mecanismo ordenado en secuencia. La oxidación de la celobiosa se produce por una transferencia de 2 electrones de la celobiosa a la flavina y genera celobiono-1, 5-lactona y flavina reducida. Después, el FAD activo se regenera por transferencia de electrones al grupo del derivado hémico y genera un derivado hémico reducido. El derivado hémico en estado nativo se regenera por la reacción con el sustrato oxidante en el segundo sitio activo.
El sustrato oxidante puede ser ferrocianuro de hierro, citocromo C o un compuesto fenólico oxidado, por ejemplo, dicloroindofenol (DCIP) , un sustrato común usado en ensayos colorimétricos . Los iones metálicos y el 02 son, además, sustratos adecuados para estas enzimas, si bien las relaciones de reacción de las celobiosa deshidrogenasas son prácticamente más bajas con respecto a estos sustratos cuando se comparan con el uso de oxidantes orgánicos o hierro como sustratos. Después de la liberación de la celobionolactona , el producto puede experimentar abertura de anillos espontánea para generar ácido celobiónico. Ver, Hallberg et al., 2003, J. Biol. Chem. 278:7160-66.
5.3.10. Otros componentes
Las composiciones enzimáticas diseñadas por ingeniería genética de la descripción pueden comprender adecuadamente, además, por ejemplo, una o más proteínas accesorias. Los ejemplos de proteínas accesorias incluyen, sin limitarse a, mananasas (por ejemplo, endomananasas , exomananasas y ß-manosidasas) , galactanasas (por ejemplo, endo y exo-galactanasas) , arabinasas (por ejemplo, endo-arabinasas y exo-arabinasas) , ligninasas, amilasas, glucuronidasas , proteasas, esterasas (por ejemplo, esterasas de ácido ferúlico, acetil xilan esterasas, esterasas de ácido cumárico o pectin metil esterasas), lipasas, otras glicósido hidrolasas, xiloglucanasas , CIP1, CIP2, swolleninas, expansinas y proteínas que alteran la celulosa. En modalidades específicas, las proteínas que alteran la celulosa son módulos de enlace de celulosa.
5.4. Métodos y procesos
Por lo tanto, la descripción proporciona, además, un proceso de sacarificación de un material de biomasa que comprende hemicelulosas y, opcionalmente , celulosa. Los materiales de biomasa ilustrativos incluyen, sin limitarse a, mazorca de maíz, césped de pradera, sorgo y/o bagazo. Por consiguiente, la descripción proporciona un proceso de sacarificación que comprende tratar un material de biomasa de la presente descripción que comprende hemicelulosa y, opcionalmente, celulosa con una mezcla/composición enzimática tal como se describe en la presente descripción. La mezcla/composición enzimática usada en el proceso de la invención incluye 1 g a 40 g (por ejemplo, 2 g a 20 g, 3 g a 7 g, l g a 5 g o 2 g a 5 g) de polipéptidos que tienen actividad de xilanasa por kg de hemicelulosa en el material de biomasa. La mezcla/composición enzimática usada en el proceso puede incluir, además, 1 g a 50 g (por ejemplo, 2 g a 40 g, 4 g a 20 g, 4 g a 10 g, 2 g a 10 g, 3 g a 7 g) de polipéptido que tiene actividad de ß-xilosidasa por kg de hemicelulosa en el material de biomasa. La mezcla/composición enzimática usada en el proceso de la invención puede incluir 0.5 g a 20 g (por ejemplo, l g a lO g, l g a 5 g, 2 g a 6 g, 0.5 g a 4 g o l g a 3 g) de polipéptidos que tienen actividad de L-oí-arabinofuranosidasa por kg de hemicelulosa en el material de biomasa. La mezcla/composición enzimática puede incluir, además, 1 g a 100 g (por ejemplo, 3 g a 50 g, 5 g a 40 g, 10 g a 30 g o 12 g a 18 g) de polipéptidos que tienen actividad de celulasa por kg de celulosa en el material de biomasa. Opcionalmente , la cantidad de polipéptidos que tienen actividad de ß-glucosidasa constituye hasta 50 % del peso total de polipéptidos que tienen actividad de celulasa.
Un proceso adecuado de la invención produce, preferentemente, 60 % a 90 % de xilosa a partir del xilano de hemicelulosa del material de biomasa tratado. Los materiales de biomasa adecuados incluyen uno o más de, por ejemplo, mazorca de maíz, césped de pradera, sorgo y/o bagazo. Como tal, un proceso de la invención produce, preferentemente, por lo menos 70 % (por ejemplo, por lo menos 75 %, por lo menos 80 %) de xilosa a partir de xilano de hemicelulosa de uno o más de estos materiales de biomasa. Por ejemplo, el proceso produce 60 % a 90 % de xilosa del xilano de hemicelulosa de un material de biomasa que comprende hemicelulosa, que incluyen, sin limitarse a, mazorca de maíz, césped de pradera, sorgo y/o bagazo.
El proceso de la invención comprende, opcionalmente, además, la etapa de recuperar monosacáridos . Además de la sacarificación de biomasa, las enzimas y/o mezclas enzimáticas de la descripción se pueden usar en procesos de procesamiento industrial, agrícola, de alimentos y productos alimenticios así como de suplementos de alimentos y productos alimenticios. Los ejemplos de las aplicaciones se describen más abajo.
5.4.1. Tratamientos de madera, papel y pulpa
Las enzimas, mezclas/composiciones enzimáticas y métodos de la descripción se pueden usar en el proceso industrial o tratamiento de madera, productos de madera, desechos de madera o subproductos, papel, productos de papel, pulpa de papel o madera, pulpa kraft o reciclado de madera o papel. Estos procesos incluyen, por ejemplo, tratamientos de madera, pulpa de madera, desechos de papel, papel o pulpa o el destintado de madera o papel. Las enzimas, mezclas/composiciones enzimáticas de la descripción pueden usarse, por ejemplo, para tratar/realizar el tratamiento previo de pulpa de papel o papel o pulpa de papel reciclado y similares. Las enzimas, mezclas/composiciones enzimáticas de la descripción se pueden usar para incrementar el "brillo" del papel cuando se incluyen en el tratamiento o tratamiento previo de papel, pulpa, papel reciclado o pulpa de papel. Puede apreciarse que cuanto mayor es la calidad del papel, mayor es el brillo; el brillo puede impactar en la capacidad de exploración de equipos de exploración óptica. Como tal, las enzimas, mezclas/composiciones enzimáticas y métodos/procesos pueden usarse para fabricar papeles "brillosos" de alta calidad, que incluyen papel de calidad de impresión para impresoras de chorro de tinta, láser y fotos.
Las enzimas, mezclas/composiciones enzimáticas de la descripción pueden usarse para procesar o tratar una cantidad de otro material celulósico que incluye, por ejemplo, fibras de madera, algodón, cáñamo, fibra de lino o lino.
Por consiguiente, la descripción proporciona procesos de tratamiento de madera, pulpa de madera, papel, pulpa de papel, desechos de papel o madera o reciclado de papel con el uso de una enzima, mezcla/composición enzimática de la descripción .
Las enzimas, mezclas/composiciones enzimáticas de la descripción pueden usarse para el destintado de papel de desecho impreso, tal como papel de periódico o para el destintado de papel de periódico impreso sin contacto, por ejemplo, papel xerográfico o impreso en láser y mezclas de papel de desecho impreso con contacto y sin contacto, tal como se describe en las patentes de los Estados Unidos núms . 6,767,728 o 6,426,200; Neo, J. Wood Chem. Tech. 1986, 6(2) :147. Además, se pueden usar para producir xilosa a partir de una pulpa de madera dura de calidad de papel en un proceso que implica la extracción del xilano contenido en la pulpa en una fase líquida, exponer el xilano contenido en la fase líquida obtenida a condiciones suficientes para hidrolizar xilano a xilosa y recuperar la xilosa. La etapa de extracción puede incluir, por ejemplo, por lo menos un tratamiento de una suspensión acuosa de pulpa o un material soluble en álcali por una enzima o una mezcla/composición enzimática (ver la patente de los Estados Unidos núm. 6,512,110) . Las enzimas, mezclas/composiciones enzimáticas de la descripción se pueden usar para disolver pulpa a partir de fibras celulósicas tal como productos de papel reciclado elaborados de fibra de madera dura, una mezcla de fibra de madera dura y fibra de madera blanda, papel de desecho, por ejemplo, de sobres sin imprimir, sobres destintados, papel ledger sin imprimir, papel de cuentas destintado y similares, tal como se describe, por ejemplo, en la patente de los Estados Unidos núm. 6,254,722.
5.4.2. Tratamiento de fibras y telas
La descripción proporciona métodos para tratar fibras y telas con el uso de una o más enzimas, mezclas/composiciones enzimáticas de la descripción. Las enzimas, mezclas/composiciones enzimáticas se pueden usar en cualquier método de tratamiento de fibras o telas conocidos en la técnica. Ver, por ejemplo, las patentes de los Estados Unidos núms. 6,261,828; 6,077,316; 6,024,766; 6,021,536; 6,017,751; 5,980,581; publicación de patente de los Estados Unidos núm. 20020142438 Al. Por ejemplo, las enzimas, mezclas/composiciones enzimáticas de la descripción pueden usarse en el desaprestado de fibras y/o telas. La sensación impartida por una tela y la apariencia de esta puede mejorarse, por ejemplo, por medio de un método que comprende poner en contacto al tela con una enzima o mezcla/composición enzimática de la descripción en una solución. Opcionalmente , la tela se trata con la solución bajo presión. Las enzimas, mezclas/composición de enzimas de la descripción pueden usarse, además, para eliminar manchas.
Las enzimas, mezclas/composiciones enzimáticas de la descripción pueden usarse para tratar una cantidad de otros materiales celulósicos que incluyen fibras (por ejemplo, fibras de algodón, cáñamo, fibra de lino o lino) , telas cosidas y no cosidas, por ejemplo, tejidos, tejidos de punto, drill de algodón, hilado y felpas, fabricadas de algodón, mezclas de algodón o celulósicos naturales o artificiales o mezclas de estos . Los procesos de tratamiento de telas se pueden usar junto con otros tratamientos de telas, por ejemplo, descrudado y/o blanqueamiento. El descrudado es, por ejemplo, la eliminación de material no celulósico de la fibra de algodón, por ejemplo, la cutícula (que consiste principalmente de ceras) y la pared celular primaria (que consiste principalmente de pectina, proteína y xiloglucano) . 5.4.3. Tratamiento de alimentos y procesamiento de alimentos Las enzimas, mezclas/composiciones enzimáticas de la descripción tienen varias aplicaciones en la industria del procesamiento de alimentos. Por ejemplo, se pueden usar para mejorar la extracción de aceite de material vegetal rico en aceite, por ejemplo, semillas con alto contenido de aceite. Las enzimas, mezclas/composiciones enzimáticas de la descripción se pueden usar para extraer aceite de soja de frijoles de soja, aceite de oliva de olivos, aceite de semilla de colza de semillas.de colza o aceite de girasol de semillas de girasol.
Las enzimas, mezclas/composiciones enzimáticas de la descripción pueden usarse, además, para separar componentes de materiales de células vegetales. Por ejemplo, se pueden usar para separar células vegetales en componentes. Las enzimas, mezclas/ composiciones enzimáticas de la descripción pueden usarse, además, para separar cultivos en fracciones de proteínas, aceites y cáscara. El proceso de separación se puede realizar con el uso de métodos conocidos.
Las enzimas, mezclas/composiciones enzimáticas de la descripción se pueden usar, además de los usos anteriores, para incrementar la producción en la preparación de jugos de frutas o vegetales, jarabes, extractos y similares. Además, se pueden usar en el tratamiento enzimático de varios materiales derivados de paredes celulares de plantas o materiales de desecho, por ejemplo, de la producción de cereales, granos, vino o jugo o residuos agrícolas, tales como, por ejemplo, cáscaras de vegetales, cáscaras de frijoles, pulpa de betabel azucarero, pulpa de olivo, pulpa de papa y similares. Además, se pueden usar para modificar la consistencia y/o apariencia de frutas o vegetales procesados. Además, se pueden usar para tratar material vegetal para facilitar el procesamiento del material vegetal (que incluye alimentos) , la purificación o extracción de componentes vegetales. Las enzimas y mezclas/composiciones de la descripción se pueden usar para mejorar el valor alimenticio, reducir la capacidad de unión del agua, mejorar el nivel de degradación en plantas de aguas residuales y/o mejorar la conversión de material vegetal en ensilaje y similares.
Las enzimas, mezclas/composiciones enzimáticas en la presente descripción se pueden usar en aplicaciones de horneado. Por ejemplo, se usan para crear masas no pegajosas que no son difíciles de procesar en máquinas y para reducir el tamaño de las galletas. Además, se usan para hidrolizar arabinoxilanos para evitar la rehidratación rápida del producto horneado de modo que este no deje de ser crujiente y que no se reduzca su vida útil. Por ejemplo, se usan como aditivos en el procesamiento de masa.
5.4.4. Alimentos y productos alimenticios para animales o aditivos para alimentos o productos alimenticios
Se proporcionan métodos para tratar alimentos/productos alimenticios para animales y aditivos para alimentos o productos alimenticios (suplementos) con el uso de enzimas y mezclas/composiciones de la descripción. Los animales incluyen mamíferos [por ejemplo, seres humanos) , aves, peces y similares. La descripción proporciona productos alimenticios y alimentos para animales y aditivos (suplementos) que comprenden enzimas y mezclas/ composiciones enzimáticas de la descripción. El tratamiento de productos alimenticios y alimentos para animales y aditivos con el uso de las enzimas puede aumentar la disponibilidad de nutrientes, por ejemplo, almidón, proteína y similares, en el producto alimenticio para animales o aditivo (suplementos) . La descomposición de las proteínas de difícil digestión o el desenmascaramiento directo o indirecto del almidón (u otros nutrientes) , las enzimas y mezclas/ composiciones pueden hacer que los nutrientes sean más accesibles a otras enzimas endógenas o exógenas . Además, pueden causar, simplemente, la liberación de azúcares y nutrientes que se digieren rápidamente y se absorben fácilmente.
Cuando se añaden a productos alimenticios para animales, las enzimas, mezclas/composiciones enzimáticas de la descripción mejoran la descomposición in vivo del material de la pared celular de la planta, en parte, mediante la reducción de la viscosidad intestinal (ver, por ejemplo, Bedford et al., Proceedings of the lst Symposium on Enzymes in Animal Nutrition, 1993, págs . 73-77), por medio de lo cual el animal puede aprovechar más los nutrientes vegetales. Por lo tanto, el uso de las enzimas, mezclas/composiciones enzimáticas de la descripción en productos alimenticios permite mejorar el índice de crecimiento y/o la relación de conversión de productos alimenticios (es decir, el peso del producto alimenticio ingerido con respecto al aumento de peso) del animal.
El aditivo del producto alimenticio para animales descrito en la descripción puede ser un producto enzimático granulado que se puede mezclar fácilmente con componentes de productos alimenticios. Alternativamente, los aditivos para productos alimenticios de la descripción pueden formar un componente de una premezcla. El producto enzimático granulado de la descripción puede estar recubierto o no recubierto. El tamaño de partícula de los granulados enzimáticos puede ser compatible con el tamaño de los componentes del producto alimenticio y/o premezcla. Esto proporciona un medio seguro y conveniente para incorporar enzimas en productos alimenticios. Alternativamente, el aditivo para productos alimenticios para animales de la descripción puede ser una composición líquida estabilizada. Esta puede ser una suspensión de base acuosa o de aceite. Ver, por ejemplo, la patente de los Estados Unidos núm. 6,245,546.
Una enzima, mezcla/composición enzimática de la descripción se puede suministrar por la expresión de las enzimas directamente en cultivos de alimentos transgénicos (por ejemplo, como plantas transgenicas, semillas y similares) , tales como granos, cereales, maíz, soja, semilla de colza, altramuz y similares. Como se mencionó anteriormente, la descripción proporciona plantas transgenicas, partes de plantas y células vegetales que comprenden una secuencia de ácido nucleico que codifica un polipéptido de la descripción. El ácido nucleico se expresa de tal manera que la enzima de la descripción se produce en cantidades recuperables. La xilanasa se puede recuperar a partir de cualquier planta o parte de planta. Alternativamente, la planta o parte de la planta que contiene el polipéptido recombinante se puede usar como tal para mejorar la calidad de un alimento o producto alimenticio, por ejemplo, mejorar el valor nutritivo, la palatabilidad y las propiedades reológicas o para destruir un factor antinutritivo.
La descripción proporciona métodos para eliminar oligosacáridos del producto alimenticio antes de que lo consuma un animal, con el uso de una enzima, mezcla/composición enzimática de la descripción. En este proceso se forma un producto alimenticio que tiene un valor de energía metabolizable aumentado. Además de las enzimas, mezclas/composiciones enzimáticas de la descripción se puede usar galactosidasas , celulasas y combinaciones de estas.
La descripción proporciona métodos para usar una enzima, una mezcla/composición enzimática de la descripción como suplemento nutricional en las dietas de animales por la preparación de un suplemento nutricional que contiene una enzima recombinante de la descripción y administrar el suplemento nutricional a un animal para aumentar el uso de hemicelulasa contenida en el alimento ingerido por el animal. 5.4.5 Tratamiento de desechos
Las enzimas, mezclas/composiciones enzimáticas de la descripción se pueden usar en otras diversas aplicaciones industriales, por ejemplo, en el tratamiento de desechos. Por ejemplo, en un aspecto, la descripción proporciona un proceso de digestión de desechos sólidos con el uso de las enzimas, mezclas/composiciones enzimáticas de la descripción. Los métodos pueden comprender reducir la masa y el volumen de desechos sólidos sustancialmente no tratados. Los desechos sólidos pueden tratarse con un proceso de digestión enzimática en presencia de una solución enzimática (que incluye las enzimas, mezclas/composiciones enzimáticas de la descripción) a una temperatura controlada. Esto produce una reacción sin fermentación bacteriana apreciable a partir de microorganismos añadidos. Los desechos sólidos se convierten en un desecho licuado y desecho sólido residual. El desecho licuado resultante se puede separar de cualquier desecho solidificado residual de ese tipo. Ver, por ejemplo, la patente de los Estados Unidos núm. 5,709,796.
5.4.6 Composiciones detergentes, desinfectantes y de limpieza La descripción proporciona composiciones detergentes, desinfectantes o composiciones limpiadoras (de limpieza general o personal) que comprenden una o más enzimas', mezclas/composiciones enzimáticas de la descripción y métodos para elaborar y usar estas composiciones. La descripción incorpora todos los métodos conocidos para elaborar y usar composiciones detergentes, desinfectantes o limpiadoras. Ver, por ejemplo, las patentes de los Estados Unidos núms. 6,413,928; 6,399,561; 6,365,561; 6,380,147.
En modalidades específicas, las composiciones detergentes, desinfectantes o limpiadoras pueden ser una composición acuosa de una y dos partes, una composición líquida no acuosa, un sólido fundido, una forma granular, una forma particulada, una tableta comprimida, un gel y/o una pasta y una forma de suspensión. Las enzimas, mezclas/composiciones enzimáticas de la descripción pueden usarse, además, como un producto aditivo para detergente, desinfectante o limpiador en forma sólida o líquida. Los productos aditivos están destinados a complementar o mejorar el rendimiento de las composiciones de detergentes convencionales y pueden añadirse en cualquier etapa del proceso de limpieza.
La presente descripción proporciona composiciones de limpieza que incluyen composiciones detergentes para limpiar superficies duras, para limpiar telas, composiciones para lavavaj illas , composiciones para la limpieza bucal, composiciones para limpieza de dentadura postiza y soluciones de limpieza de lentes de contacto.
Cuando las enzimas de la descripción son componentes de composiciones adecuados para usar en un método de lavado en máquina lavadora, las composiciones pueden comprender, además de una enzima, mezcla/composición enzimática de la descripción, un tensioactivo y un compuesto aditivo. Además, pueden comprender uno o más componentes detergentes, por ejemplo, compuestos poliméricos orgánicos, agentes blanqueadores, enzimas adicionales, supresores de espuma, dispersantes, dispersantes de jabón de cal, agentes de suspensión y antiredepósito de suciedad e inhibidores de corrosión.
Las composiciones para lavado de ropa de la descripción pueden contener, además, agentes suavizantes, tales como componentes detergentes adicionales. Tales composiciones que contienen carbohidrasa pueden proporcionar limpieza de telas, eliminación de manchas, mantenimiento de blancura, suavizado, apariencia de color, inhibición de transferencia de colorantes y esterilización cuando se formulan como composiciones detergentes para lavado de ropa.
5.4.7. Métodos industriales, comerciales y de
comercialización
Las composiciones de celulasa y/o hemicelulasa de la descripción pueden usarse, además, en entornos industriales y/o comerciales. Por consiguiente, se contempla, además, un método de fabricación, comercial o de comercialización de las composiciones de hemicelulasa y/o celulasa de origen no natural de la presente invención.
En una modalidad específica, los polipéptidos de celulasa que incluyen, por ejemplo, los polipéptidos de endoglucanasa (por ejemplo, las endoglucanasas de GH61, tales como el polipéptido Eg4 de G. reesei) , los polipéptidos de ß-glucosidasa (por ejemplo, los polipéptidos de Pa3D, Fv3G, Fv3D, Fv3C, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G y Tn3B de la presente descripción, el polipéptido tiene por lo menos aproximadamente 60 % de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident . : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79 y/o el polipéptido de fusión/quimérico comprende por lo menos dos secuencias de ß-glucosidasa, en donde la primera secuencia de ß -glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 200 residuos de aminoácidos y comprende una o más o todas las sec. con núms. de ident. : 6-108, mientras que la segunda secuencia de ß-glucosidasa es una secuencia que tiene una longitud de por lo menos aproximadamente 50 residuos de aminoácidos y comprende una o más o todas las sec. con núms. de ident .: 109-116 ) , los polipéptidos de celobiohidrolasa y los polipéptidos de hemicelulasa que incluyen los polipéptidos de ß-xilosidasa, los polipéptidos de xilanasa y los polipéptidos de L-a-arabinofuranosidasa, así como las composiciones de celulasa y/o composiciones de hemicelulasa que comprenden los polipéptidos mencionados anteriormente pueden suministrarse o venderse a ciertas refinerías de etanol (bioetanol) u otros fabricantes de bioquímicos o biomateriales . En un primer ejemplo, las composiciones de celulasa y/o hemicelulasa que no . son de origen natural se pueden fabricar en una instalación de fabricación de enzimas especializada en la fabricación de enzimas a escala industrial. Después, las composiciones de celulasa y/o hemicelulasa que no son de origen natural pueden envasarse o venderse a clientes del fabricante de enzimas. Esta estrategia operativa se menciona como el "modelo de suministro comercial de enzimas" en la presente descripción.
En otra estrategia operativa, las composiciones de celulasa y hemicelulasa que no son de origen natural de la invención pueden producirse en un sistema de producción de enzimas de avanzada construido por el fabricante de enzimas en el sitio que está en o cerca de las refinerías de bioetanol o de los fabricantes de bioquímicos/biomateriales ("en el sitio"). En algunas modalidades, el fabricante de enzimas y la refinería de bioetanol o el fabricante de bioquímicos/biomateriales formalizan un acuerdo de suministro de enzimas. El fabricante de enzimas diseña, controla y opera el sistema de producción de enzimas en el sitio, con el uso de la célula huésped, la expresión y métodos de producción tal como se describen en la presente descripción para producir las composiciones de celulasa y/o hemicelulasa que no son de origen natural. En ciertas modalidades, la biomasa adecuada, preferentemente, expuesta a tratamientos previos apropiados tal como se describen en la presente descripción puede hidrolizarse con el uso de los métodos de sacarificación y las enzimas y/o composiciones enzimáticas de la presente descripción en o cerca de las refinerías de bioetanol o las instalaciones de fabricación de bioquímicos/biomateriales. Los azúcares fermentables resultantes pueden exponerse después a fermentación en las mismas instalaciones o en instalaciones del área adyacente. Esta estrategia operativa se menciona como el "modelo de biorefinería en el sitio" en la presente descripción.
El modelo de biorefinería en el sitio proporciona ciertas ventajas en comparación con el modelo de suministro comercial de enzimas que incluyen, por ejemplo, la provisión de una operación autosuficiente que permite depender mínimamente de los proveedores de enzimas. A su vez, esto permite que las refinerías de bioetanol o los fabricantes de bioquímicos/biomateriales controlen mejor la cadena de enzimas en base a la demanda en tiempo real o casi en tiempo real. En ciertas modalidades, se contempla que dos o más refinerías de bioetanol y/o los fabricantes de bioquímicos/biomateriales que están cerca uno del otro compartan una instalación de producción de enzimas en el sitio, lo que reduce el costo de transporte y almacenamiento de enzimas. Además, esto permite obtener mejoras inmediatas en la tecnología "alternativa" en la instalación de producción de enzimas en el sitio, reducir el intervalo entre las mejoras de composiciones enzimáticas para obtener una mayor producción de azúcares fermentables y, en última instancia, de bioetanol y bioquímicos.
El modelo de biorefinería en el sitio tiene una aplicabilidad más general en la producción industrial y comercialización de bioetanoles y bioquímicos, ya que puede usarse para fabricar, suministrar y producir no solamente las composiciones de celulasa y hemicelulasa que no son de origen natural descritas en la presente descripción, sino, además, las enzimas y composiciones enzimáticas que procesan almidón (por ejemplo, maíz) para permitir una conversión directa más eficaz y eficiente del almidón en bioetanol/bioquímicos . En ciertas modalidades, las enzimas de procesamiento de almidón pueden producirse en la biorefinería en el sitio y, después, integrarse fácilmente en la refinería de bioetanol o la instalación de fabricación de bioquímicos/biomaterial para producir bioetanol.
Por lo tanto, en ciertos aspectos, la invención se relaciona, además, con ciertos métodos comerciales para aplicar las enzimas (por ejemplo, ciertos polipéptidos de ß-glucosidasa (que incluyen polipéptidos variantes, mutantes o quiméricos) y ciertas endoglucanasa de GH61 (que incluyen variantes, mutantes y similares) , células, composiciones y procesos de la presente descripción en la fabricación y comercialización de ciertos bioetanoles, biocombustibles , bioquímicos u otros biomateriales. En algunas modalidades, la invención se relaciona con la aplicación de tales enzimas, células, composiciones y procesos en un modelo de biorefinería en el sitio. En otras modalidades, la invención se relaciona con la aplicación de tales enzimas, células, composiciones y procesos en un modelo de suministro comercial de enzimas.
EJEMPLOS
6.1 Ejemplo 1: Ensayos/Métodos
En los ejemplos descritos más abajo se usaron, generalmente, los siguientes ensayos/métodos. Cualquier desviación de los protocolos proporcionados más abajo se indican en los ejemplos específicos.
6.1.1. A. Tratamiento previo de sustratos de biomasa
La mazorca de maíz, el rastrojo de maíz y el césped de pradera se trataron antes de la hidrólisis enzimática de conformidad con los métodos e intervalos de procesamiento descritos en la patente núm. WO 06110901A (a menos que se indique de cualquier otra forma) . Estas referencias para el tratamiento previo se incluyen, además, en las descripciones de las patentes de los Estados Unidos núms . US-2007-0031918-Al, US-2007-0031919-A1, US-2007-0031953 -Al y/o US-2007-0037259-A1.
Se obtuvo rastrojo de maíz tratado por explosión de fibras por amoniaco (AFEX, por sus siglas en inglés) de Michigan Biotechnology Institute International (MBI) . La composición del rastrojo de maíz se determinó con el uso del procedimiento del Laboratorio Nacional de Energía Renovable (National Renewable Energy Laboratory (NREL) ) , NREL LAP-002 (Teymouri, F et al. Applied Biochemistry and Biotechnology, 2004, 113:951-963). Los procedimientos de NREL están disponibles en: http://www.nrel.gov/ biomass/analytical_procedures . html .
Los sustratos de pulpa y papel de FPP se obtuvieron de SMURFIT KAPPA CELLULOSE DU PIN, Francia.
Se obtuvo bagazo de caña de azúcar expandida por vapor (SEB, por sus siglas en inglés) de SunOpta (Glasser, WG et al. Biomass and Bioenergy 1998, 14(3): 219-235; Jollez, P et al. Advances in thermochemical biomass conversión, 1994, 2 : 1659-1669) .
6.1.2. B. Análisis composicional de la biomasa
El método de hidrólisis ácida de 2 etapas descrito en "Determination of structural carbohydrates and lignin in the biomass" (National Renewable Energy Laboratory, Golden, CO 2008 http://www.nrel.gov/biomass/pdfs/42618.pdf) se usó para medir la composición de los sustratos de biomasa. Con el uso de este método se reportaron resultados de hidrólisis enzimática en la presente descripción en términos de porcentaje de conversión con respecto a la producción teórica a partir del contenido inicial de glucano y xilano del sustrato.
6.1.3. C. Ensayo de proteínas totales
El ensayo de proteínas de BCA es un ensayo colorimétrico que mide la concentración de proteínas con un espectrofotómetro . El equipo del ensayo de proteínas de BCA (Pierce Chemical, núm. de producto 23227) se usó según las instrucciones del fabricante. Las diluciones de enzimas se prepararon en tubos de prueba con el uso de un regulador acetato de sodio 50 mM, pH 5. La solución enzimática diluida (0.1 mi) se añadió en tubos de centrífuga Eppendorf de 2 mi que contenían 1 mi de ácido tricloroacético (TCA) al 15 %. Los tubos se procesaron en vórtice y se colocaron en un baño de hielo por 10 min. Después, las muestras se centrifugaron a 14000 rpm por 6 min. El sobrenadante se vertió, el gránulo se resuspendió en 1 mi de NaOH 0.1 N y los tubos se procesaron en vórtice hasta que el gránulo se disolvió. Se preparó soluciones estándar de BSA a partir de una solución inicial de 2 mg/ml. Se preparó la solución de trabajo de BCA por el mezclado de 0.5 mi del reactivo B con 25 mi del reactivo A. Se añadió 0.1 mi de la muestra de enzima resuspendida en 3 tubos de centrífuga Eppendorf . Se añadió dos mi de solución de trabajo de BCA Pierce en cada muestra y tubos Eppendorf estándar de BSA. Todos los tubos se incubaron en un baño maría a 37 °C por 30 min. Después, las muestras se enfriaron hasta temperatura ambiente (15 min) y se midió la absorbancia a 562 nm en un espectrofotómetro .
Se calcularon los valores promedio para la absorbancia de proteínas para cada estándar. Se gráfico el estándar de proteínas promedio, la absorbancia en el eje x y la concentración (mg/ml) en el eje y. Los puntos se ajustaron en una ecuación lineal :
y=mx +b
La concentración en bruto de las muestras de enzimas se calculó mediante la sustitución de la absorbancia para el valor x. La concentración total de proteínas se calculó por la multiplicación con el factor de dilución.
La proteína total de muestras purificadas se determinó por medio de A280 (Pace, CN, et al. Protein Science, 1995, 4 :2411-2423) .
Algunas muestras de proteínas se midieron con el uso del método de Biuret con las modificaciones realizadas por Weichselbaum y Gornall con el uso de albúmina sérica bovina como un calibrador (Weichselbaum, T. Amer. J. Clin. Path. 1960, 16:40; Gornall, A. et al. J. Biol . Chem. 1949, 177 :752) .
El contenido de proteínas totales de los productos de fermentación se midió algunas veces como el nitrógeno total por combustión, captura y medición de nitrógeno liberado ya sea por Kjeldahl (rtech laboratories , www.rtechlabs.com) o internamente por el método de Dumas (TruSpec CN, www.leco.com) (Sader, A. P.O. et al., Archives of Veterinary Science, 2004, 9(2):73-79). Para las muestras que contienen proteínas complejas, por ejemplo caldos de fermentación, se usó un contenido de N promedio de 16 % y el factor de conversión de 6.25 para nitrógeno a proteína. En algunos casos, la proteína precipitable total se midió para eliminar el nitrógeno no proteico interférente . Se usó una concentración de TCA final de 12.5 % y el gránulo de TCA que contiene proteínas se resuspendió en NaOH 0.1 M.
En algunos casos se usó el ensayo Coomassie combinado con el ensayo Better Bradford (Thermo Scientific, Rockford, IL, núm. de producto 23238) según las instrucciones del fabricante.
6.1.4 D. Determinación de glucosa con el uso de ABTS
El ensayo de ABTS (ácido 2, 2 ' -azino-bis (3-etilentiazolinoí-6) -sulfónico) para determinar la glucosa se basó en el principio que indica que en presencia de 02, la glucosa oxidasa cataliza la oxidación de glucosa y al mismo tiempo produce cantidades estequiométricos de peróxido de hidrógeno (H202) . Esta reacción es seguida por una oxidación de ABTS catalizada por peroxidasa de rábano picante (HRP, por sus siglas en inglés) que se correlaciona linealmente con la concentración de H202 - La emergencia de ABTS oxidado se indica por la evolución de un color verde que se cuantifica a una OD de 405 nm. Se preparó una mezcla de 2.74 mg/ml de ABTS en polvo (Sigma) , 0.1 U/ml de HRP (Sigma) y 1 U/ml de glucosa oxidasa (OxyGO® HP L5000, Genencor, Danisco USA) en un regulador de acetato de sodio 50 mM, pH 5.0, y se mantuvo en la oscuridad. Se preparó estándares de glucosa (a 0, 2, 4, 6, 8, 10 nmol) en regulador de acetato de sodio 50 mM, pH 5.0. Se añadió diez (10) mi de los estándares individualmente en una placa de microtitulación de fondo plano de 96 pocilios por triplicado. Además, en la placa se añadió diez (10) mi de muestras diluidas en serie. Se añadió cien (100) mi de solución de sustrato de ABTS en cada pocilio y la placa se colocó en un lector de placas espectrofotométrico . La oxidación del ABTS se leyó por 5 min a 405 nm.
Alternativamente, se midió las OD a 405 nm de las muestras después de 15-30 min de incubación seguido del enfriamiento de la reacción con el uso de una mezcla de enfriamiento que contenía regulador de acetato de sodio 50 mM, pH 5.0 y SDS al 2 % .
6.1.5. E. Análisis del azúcar por HPLC
Se preparó muestras a partir de la hidrólisis y sacarificación de mazorcas mediante la eliminación de material insoluble con el uso de centrifugación, filtración a través de un filtro de tubo de centrífuga Spin-X de nailon de 0.22 mm (Corning, Corning, NY) y la dilución hasta las concentraciones deseadas de azúcares solubles con el uso de agua destilada. Se determinó los azúcares de los monómeros en un equipo Shodex Sugar SH-G SH1011, 8 x 300 mm con una columna de protección de 6 x 50 mm SH-1011P (www.shodex.net). Se usó H2S0 0.01 N como solvente y se realizó la cromatografía a un régimen de flujo de 0.6 mi /min. La temperatura de la columna se mantuvo a 50 °C y se realizó la detección por índice de refracción. Alternativamente, se analizaron las cantidades de azúcar con el uso de una columna Biorad Aminex HPX-87H con un detector del índice de refracción Waters 2410. El tiempo de análisis fue de aproximadamente 20 min, el volumen de inyección 20 mi, como fase móvil se usó ácido sulfúrico 0.01 N que se filtró a través de un filtro de 0.2 mm y se desgasificó, el régimen de flujo fue de 0.6 mi /min y la temperatura de la columna se mantuvo en 60 °C. Se probaron estándares externos de glucosa, xilosa y arabinosa con cada conjunto de muestras.
Se usó cromatografía de exclusión por tamaño para separar e identificar azúcares oligoméricos . Se usó una columna Tosoh Biosep G2000PW de 7.5 mm x 60 cm. Se usó agua destilada para eluir los azúcares. Se usó un régimen de flujo de 0.6 mi /min y la columna se usó a temperatura ambiente. Los seis estándares de azúcar de carbono incluyeron estaquiosa, rafinosa, celobiosa y glucosa; los cinco estándares de azúcar de carbono incluyeron xilohexosa, xilopentosa, xilotetrosa, xilotriosa, xilobiosa y xilosa. Se adquirieron estándares de xilo-oligómeros (Megazyme) . La detección se realizó por índice de refracción. Para reportar los resultados se usó unidades de área pico o porcentaje de área de pico relativa.
Se determinó la cantidad de azúcares solubles totales por hidrólisis de las muestras centrif gadas y clarificadas en filtro (anteriores). La muestra clarificada se diluyó 1:1 con el uso de H2S04 0.8 N. La solución resultante se procesó en autoclave en un frasco con tapa por 1 h a 121 °C. Los resultados se reportan sin corrección para la pérdida de azúcar monomérica durante la hidrólisis.
6.1.6. F. Preparación de oligómeros a partir de mazorca y ensayos de enzimas
Se preparó oligómeros a partir de la hidrólisis de Xyn3 de T. reesei de mazorcas de maíz por la incubación de 8 mg de Xyn3 de T. reesei por g de glucano + xilano con 250 g de peso seco de mazorca de maíz pretratada con amoníaco diluido en un regulador de acetato de sodio 50 mM, H 5.0. La reacción continuó por 72 h a 48 °C con agitación rotativa a 180 rpm. El sobrenadante se centrifugó 9000 x G, después se filtró a través de filtros de 0.22 ram Nalgene para recuperar los azúcares solubles.
6.1.7. G. Ensayo de sacarificación de la mazorca de maíz
En los ejemplos típicos de la presente descripción se realizaron ensayos de sacarificación de la mazorca de maíz en un formata de placa de microtitulación de conformidad con los siguientes procedimientos, a menos que un ejemplo particular indique variaciones específicas. El sustrato de biomasa, por ejemplo, la mazorca de maíz pretratada con amoníaco diluido se diluyó en agua y el pH se ajustó con ácido sulfúrico para crear una suspensión de celulosa al 7 % pH 5, que se usó sin procesamiento adicional en el ensayo. Las muestras de enzimas se cargaron en base a mg de proteínas totales por g de celulosa (según se determinó con el uso de métodos de análisis de composiciones convencionales, supra) en el sustrato de la mazorca de maíz. Las enzimas se diluyeron en acetato de sodio 50 mM, pH 5.0, para obtener las concentraciones de carga deseadas. Se añadió cuarenta (40) mi de solución enzimática en 70 mg de mazorca de maíz pretratada con amoníaco diluido con celulosa al 7 % por pocilio (equivalente a celulosa al 4.5 % final por pocilio). Después, las placas del ensayo se cubrieron con selladores de placa de aluminio, se mezclaron a temperatura ambiente y se incubaron a 50 °C, 200 rpm, por 3 d. Al final del periodo de incubación, la reacción de sacarificación se enfrió por medio de la adición en cada pocilio de 100 µ? de un regulador de glicina 100 mM, pH 10.0 y la placa se centrifugó por 5 min a 3000 rpm. Se añadió diez (10) µ? del sobrenadante en 200 µ? de agua MilliQ en una placa de HPLC de 96 pocilios y los azúcares solubles se midieron por HPLC.
6.1.8. H. Ensayo de hidrólisis de celobiosa
La actividad de la celobiosa se determinó con el uso del método de Ghose, T.K. Puré and Applied Chemistry, 1987, 59(2), 257-268. Las unidades de celobiosa (derivadas tal como se describe en Ghose) se definen como 0.815 dividido por la cantidad de enzima necesaria para liberar 0.1 mg de glucosa en las condiciones del ensayo.
6.1.9. I. Ensayo de hidrólisis de cloro-nitro-fenil-glucósido (CNPG)
Se añadió doscientos (200) mi de un regulador de acetato de sodio 50 mM, pH 5 en pocilios individuales de una placa de microtitulación . La placa se cubrió y se dejó equilibrar a 37 °C por 15 min en un termomezclador Eppendorf . Además, se añadió cinco (5) mi de enzima diluida en regulador acetato de sodio 50 mM, pH 5, en los pocilios individuales. La placa se cubrió otra vez y se dejó equilibrar a 37 °C por 5 min. Se añadió veinte (20) mi de 2-cloro-4-nitrofenil-p-D-glucopiranosida 2 mM (CNPG, Rose Scientific Ltd., Edmonton, CA) preparada en agua Millipore en pocilios individuales y la placa se transfirió rápidamente a un espectrofotómetro (SpectraMax 250, Molecular Devices) . Se realizó una lectura cinética a OD 405 nm por 15 min y los datos se registraron como Vmáx. El coeficiente de extinción para CNP se usó para convertir Vmáx. de unidades de OD/s en mM de CNP/s. Se determinó la actividad específica (mM de CNP/s/mg de proteína) por la división de mM de CNP/s por el mg de proteína enzimática usada en el ensayo.
6.1.10. J. Ensayo de sacarificación en placa de
microtitulación
Se introdujo celulasas purificadas y productos libres de células de cepas de celulasa completa en el ensayo de sacarificación en una cantidad basada en la proteína total (en mg) por g de celulosa en el sustrato. Se cargó hemicelulasas purificadas en base al contenido de xilosa del sustrato. Los sustratos de biomasa que incluyen, por ejemplo, rastrojo de maíz pretratado con ácido diluido (PCS, por sus siglas en inglés) , rastrojo de maíz de fibra de amoniaco expandida (AFEX, por sus siglas en inglés) , mazorca de maíz pretratada con amoníaco, mazorca de maíz pretratada con hidróxido de sodio (NaOH) y césped de pradera pretratado con amoníaco se mezclaron en los niveles de % de sólidos indicados y el pH de las mezclas se ajustó hasta 5.0. Las placas se cubrieron con selladores de placa de aluminio y se colocaron en incubadores con una temperatura predeterminada en 50 °C. La incubación se realizó con agitación por 2 d. Las reacciones se terminaron por la adición de 100 mi de glicina 100 mM, pH 10 en pocilios individuales. Después de mezclar bien, las placas se centrifugaron y los sobrenadantes se diluyeron 10 veces en una placa de HPLC que contenía 100 mi de regulador de glicina 10 mM, pH 10. Las concentraciones de azúcares solubles producidos se midieron con el uso de HPLC tal como se describió para el ensayo de hidrólisis de celobiosa (más abajo) . El porcentaje de conversión de glucano se define como [mg de glucosa + (mg de celobiosa x 1.056 + mg de celotriosa x 1.056)] / [mg de celulosa en sustrato x l.lll] ; El % de conversión de xilano se define como [mg de xilosa + (mg de xilobiosa x 1.06)] / [mg de xilano en sustrato x 1.136] .
6.1.11. K. Ensayo de calcoflúor
Todas las sustancias químicas usadas fueron de grado analítico. Se adquirió Avicel PH-101 de FMC BioPolymer (Philadelphia, PA) . La celobiosa y el blanco de calcoflúor se adquirieron de Sigma (St. Louise, MO) ., La celulosa dilatada tratada con ácido fosfórico (PASC, por sus siglas en inglés) se preparó a partir de Avicel PH-101 con el uso de un protocolo adaptado de alseth, TAPPI 1971, 35:228 y Wood, Biochem. J. 1971, 121:353-362. En síntesis, se solubilizó Avicel en ácido fosfórico concentrado y, después, se precipitó con el uso de agua desionizada fría. Después de recolectar la celulosa y lavarla con más agua para neutralizar el pH, se diluyó hasta 1 % de sólidos en acetato de sodio 50 mM pH5.
Todas las diluciones de enzimas se prepararon en un regulador de acetato de sodio 50 mM, pH5.0. La celulasa GC220 (Danisco US Inc., Genencor) se diluyó en 2.5 , 5, 10 y 15 mg de proteína/G de PASC para producir una curva de calibración lineal. Las muestras para la evaluación se diluyeron hasta ajustarse al intervalo de la curva de calibración, es decir para obtener como respuesta de 0.1 a 0.4 de producto de fracción. Se añadió 150 µ? de PASC al 1 % frío en 20 µ? de solución enzimática en placas de microtitulación de 96 pocilios. La placa se cubrió y se incubó por 2 h a 50 °C, 200 rpm en un incubador/agitador Innova. La reacción se enfrió con 100 µ? de 50 µg/ml de calcoflúor en glicina 100 mM, pHlO. La fluorescencia se leyó en un lector de microplacas de fluorescencia (SpectraMax M5 de Molecular Devices) a una longitud de onda de excitación Ex = 365 nm y longitud de onda de emisión E = 435 nm. El resultado se expresa como el producto de fracción de acuerdo con la ecuación :
FP = 1 - (muestra Fl - regulador Fl con celobiosa) / (enzima cero Fl - regulador Fl con celobiosa) , en donde FP es el producto de fracción y Fl son las unidades de fluorescencia
6.1.12. L. Ensayo de hidrólisis de soforosa
El ensayo para probar la actividad de la soforosa de las ß-glucosidasas se realizó en una placa de microtitulación con el uso de soforosa adquirida de Sigma Aldrich (S1404) . La soforosa se suspendió en acetato de sodio 50 mM, pH 5.0, para crear una solución inicial de 5 mg/ml y se colocó en un mezclador rotativo por 30 min a temperatura ambiente. La soforosa (50 µ? por pocilio) se suministró en una placa de microtitulación de 96 pocilios de fondo plano y no aglutinante (corning, 04809009) . El sustrato suministrado se almacenó a temperatura ambiente por 5 min. En una segunda placa de microtitulación de 96 pocilios de fondo plano (corning, 04809009) se diluyó en serie las moléculas de ß-glucosidasa 10 veces en acetato de sodio 50 mM, pH 5.0. La placa de reacción se selló con sellos de placa de aluminio (E&K scientific) y se incubó a 37 °C y a 600 rpm por 30 min (ThermoCycler) . Al final del periodo de incubación las reacciones se diluyeron en serie, 2 veces, a través de la placa en acetato de sodio 50 mM, pH 5.0. En una tercera placa de microtitulación de 96 pocilios de fondo plano (Corning, 04809009) se añadió 10 µ? de muestra de enzima diluida o estándar de glucosa en 90 µ? de reactivo de ABTS. La cinética de la reacción se observó a 420 nm, por 5 min, cada 15 s. La concentración de glucosa se determinó con el uso del estándar de glucosa (5 mg/ml) .
6.2 Ejemplo 2: Construcción de la cepa de expresión integrada de T. reesei
Se construyó una cepa de expresión integrada de T. reesei que coexpresaba cinco genes: el gen de ß-glucosidasa de T. reesei bgll ) el gen de endoxilanasa de T. reesei xyn3 , el gen de ß-xilosidasa de F. verticillioidesfv3A, el gen de ß-xilosidasa de F. verticillioides fv43D y el gen de o¡-arabinofuranosidasa de F. verticillioides fv51A.
La construcción de los casetes de expresión para estos genes diferentes y la transformación de T. reesei se describen más abajo.
6.2.1. A. Construcción del vector de expresión de ß-glucosidasa
ADN 2.0 (Menlo Park, Estados Unidos) realizó la optimización con codones de la parte N- terminal del gen nativo de ß-glucosidasa de T. reesei bgll. La parte sintetizada comprendía las primeras 447 bases de la región codificante. Este fragmento se amplificó por PCR con el uso de los cebadores SK943 y SK941. La región restante del gen bgll nativo se amplificó por PCR a partir de una muestra de ADN genómico extraído de la cepa de T. reesei RL-P37 (Sheir-Neiss, G et al. Appl . Microbiol . Biotechnol . 1984, 20:46-53) con el uso de los cebadores SK940 y SK942. Estos dos fragmentos de PCR del gen bgll se fusionaron entre sí en una reacción de PCR de fusión con el uso de los cebadores SK943 y SK942 :
Cebador directo SK943: ( 5 ' -CACCATGAGATATAGAACAGCTGCCGCT- 3 ' ) (sec. con núm. de ident. :118)
Cebador inverso SK941: (5'- CGACCGCCCTGCGGAGTCTTGCCCAGTGGTCCCGCGACAG- 3 ' ) (sec. con núm. de ident . : 119)
Cebador directo (SK940) : (5'- CTGTCGCGGGACCACTGGGCAAGACTCCGCAGGG CGGTCG-3') (sec. con núm. de ident . : 120)
Cebador inverso (SK942) : (5 ' -CCTACGCTACCGACAGAGTG-3 ' ) (sec. con núm. de ident. : 121)
Los fragmentos de la PCR de fusión resultantes se clonaron en el vector de entrada Gateway® pENTR™/D-T0P0® y se transformaron en células químicamente compatibles de E. coli One Shot® TOP10 (Invitrogen) de modo que se obtuvo el vector intermedio, pENTR-TOPO-Bgll (943/942) (Fig. 90B) . Se determinó la secuencia de nucleótidos del ADN insertado. El vector pENTR-943/942 con la secuencia de bgll correcta se recombinó con pTrex3g con el uso de un protocolo de reacción LR clonase® producido por Invitrogen. La mezcla de reacción LR clonase se transformó en células químicamente compatibles de E. coli One Shot® TOP10 (Invitrogen) de modo que se obtuvo el vector de expresión final, pTrex3g 943/942 (Fig. 90C) . El vector contiene, además, el gen de Aspergillus nidulans amdS que codifica acetamidasa como un marcador seleccionable para la transformación de T. reesei . El cásete de expresión se amplificó por PCR con los cebadores SK745 y SK771 para generar un producto para la transformación de T. reesei.
Cebador directo SK771: ( 5 ' -GTCTAGACTGGAAACGCAAC -3') (sec. con núm. de ident.:122)
Cebador inverso SK745: ( 5 ' -GAGTTGTGAAGTCGGTAATCC -3') (sec. con núm. de ident.:123)
6.2.2 B. Construcción del cásete de expresión de endoxilanasa El gen de endoxilanasa nativo de T. reesei xyn3 se amplificó por PCR a partir de una muestra de ADN genómico extraído de T. reesei con el uso de los cebadores xyn3F-2 y xyn3 -2.
Cebador directo xyn3F-2: (5'-CACCATGAAAGCAAACGTCATCTTGTGCCTCCTGG-3 ' ) (sec. con núm. de ident . : 124)
Cebador inverso xyn3R-2: (5'- CTATTGTAAGATGCCAACAATGCTGTTATATGC CGGCTTGGGG-3 ' ) (sec. con núm. de ident. :125)
Los fragmentos de la PCR resultantes se clonaron en el vector de entrada Gateway® pENTR™/D-TOPO® y se transformaron en células químicamente competentes de E. coli One Shot® TOP10, (ver la Fig. 90D) . Se determinó la secuencia de nucleótidos del ADN insertado. El vector pENTR/Xyn3 con la secuencia de xyn3 correcta se recombinó con pTrex3g con el uso de un protocolo de reacción LR clonase® producido por Invitrogen. La mezcla de reacción LR clonase se transformó en células químicamente compatibles de E. coli One Shot® TOP10 (Invitrogen) de modo que se obtuvo el vector de expresión final, pTrex3g/Xyn3 (Fig. 90E) . El vector contiene, además, el gen Aspergillus nidulans amdS que codifica acetamidasa, como un marcador seleccionable para la transformación de T. reesei. El cásete de expresión se amplificó por PCR con los cebadores SK745 y SK822 para generar un producto para la transformación de T. reesei.
Cebador directo SK745: ( 5 ' -GAGTTGTGAAGTCGGTAATCC-3 ' ) (sec. con núm. de ident. :126)
Cebador inverso SK822: ( 5 ' - CACGAAGAGCGGCGATTC-3 ' ) (sec. con núm. de ident. :127)
6.2.3. C. Construcción del vector de expresión de Fv3A de ß-xilosidasa
El gen de ß-xilosidasa de F. verticillioides fv3A se amplificó a partir de una muestra de ADN genómico de F. verticillioides con el uso de los cebadores MH124 y MH125. Cebador directo MH124 : (5'-CAC CCA TGC TGC TCA ATC TTC AG -3') (sec. con núm. de ident. :128)
Cebador inverso MH125: (5'-TTA CGC AGA CTT GGG GTC TTG AG -3') (sec. con núm. de ident. :129)
Los fragmentos de la PCR se clonaron en el vector de entrada Gateway ® pENTR™/D-TOPO® y se transformaron en
células químicamente compatibles de E. coli One Shot® TOP10 (Invitrogen) de modo que se obtuvo el vector intermedio, pENTR- Fv3A (Fig. 90F) . Se determinó la secuencia de nucleótidos del ADN insertado. El vector pENTR^Fv3A con la secuencia de fv3A correcta se recombinó con pTrex6g (Fig. 79A) con el uso de un protocolo de reacción LR clonase® producido por Invitrogen. La mezcla de reacción LR clonase se transformó en células químicamente competentes de E. coli One Shot® TOP10 (Invitrogen) de modo que se obtuvo el vector de expresión final, pTrex6g/Fv3A (Fig. 90G) . El vector contiene, además, un mutante resistente al clorimuron etilo del gen nativo de G. reesei acetolactato sintasa {ais) , designado como alsR que se usa junto con su promotor nativo y terminador como un marcador seleccionable para la transformación de T. reesei (patente núm. WO 2008/039370 Al) . El cásete de expresión se amplificó por PCR con los cebadores SK1334, SK1335 y SK1299 para generar un producto para la transformación de T. reesei.
Cebador directo SK1334 : ( 5 ' -GCTTGAGTGTATCGTGTAAG -3') (sec. con núm. de ident. :130)
Cebador directo SK1335: (5 ' -GCAACGGCAAAGCCCCACTTC -3') (sec. con núm. de ident. :131)
Cebador inverso SK1299: ( 5 ' -GTAGCGGCCGCCTCATCTCATCTCATCCATCC -3') (sec. con núm. de ident. :132)
6.2.4. D. Construcción del cásete de expresión de Fv43D de ß-xilosidasa
Para la construcción del cásete de expresión de Fv43D de ß-xilosidasa de F. verticillioides , el producto génico de fv43D se amplificó a partir de una muestra de ADN genómico de F. verticillioides con el uso de los cebadores SK1322 y SK1297. Una región del promotor del gen de endoglucanasa egll se amplificó por PCR a partir de una muestra de ADN genómico de T. reesei extraído de la cepa RL-P37 con el uso de los cebadores SK1236 y SK1321. Estos dos fragmentos de ADN amplificados por PCR se fusionaron posteriormente en una reacción de PCR de fusión con el uso de los cebadores SK1236 y SK1297. El fragmento de PCR de fusión resultante se clonó en el vector pCR-Blunt II -TOPO (Invitrogen) para producir el plásmido TOPO Blunt/Pegll-Fv43D (Fig. 90H) y células químicamente competentes de E. coli One Shot® TOP10 (Invitrogen) se transformaron con el uso de este plásmido. Se extrajo el ADN del plásmido de los diversos clones de E. coli y se confirmó por medio de digestión restrictiva.
Cebador directo SK1322 : (5 ' -CACCATGCAGCTCAAGTTTCTGTC-3 ' ) (sec. con núm. de ident. :133)
Cebador inverso SK1297: (5 ' -GGTTACTAGTCAACTGCCCGTTCTGTAGCGAG-3') (sec. con núm. de ident. :134)
Cebador directo S 1236: (5 ' -CATGCGATCGCGACGTTTTGGTCAGGTCG-3 ' ) (sec. con núm. de ident. :135)
Cebador inverso SK1321: (5 ' -GACAGAAACTTGAGCTGCATGGTGTGGGACA ACAAGAAGG-3 ' ) (sec. con núm. de ident. :136)
El cásete de expresión se amplificó por PCR a partir de TOPO Blunt/Pegll-Fv43D con los cebadores SK1236 y SK1297 para generar un producto para la transformación de T. reesei.
6.2.5. E. Construcción del cásete de expresión de -arabinofuranosidasa
Para la construcción del cásete de expresión del gen de a-arabinofuranosidasa de F. verticillioides fv51A, el producto génico de fv51A se amplificó a partir de una muestra de ADN genómico de F. verticillioides con el uso de los cebadores SK1159 y SK1289. Una región del promotor del gen de endoglucanasa egll se amplificó por PCR a partir de una muestra de ADN genómico de T. reesei extraído de la cepa RL-P37 con el uso de los cebadores SK1236 y SK1262. Estos dos fragmentos de ADN amplificados por PCR se fusionaron posteriormente en una reacción de PCR de fusión con el uso de los cebadores SK1236 y SK1289. El fragmento de PCR de fusión resultante se clonó en el vector pCR-Blunt II-TOPO (Invitrogen) para producir el plásmido TOPO Blunt/Pegll-Fv51A (Fig. 901) y células químicamente competentes de E. coli One Shot® TOP10 (Invitrogen) se transformaron con el uso de este plásmido .
Cebador directo SK1159: (5 ' -CACCATGGTTCGCTTCAGTTCAATCCTAG-3 ' ) (sec. con núm. de ident . :137)
Cebador inverso SK1289: (5 ' -GTGGCTAGAAGATATCCAACAC-3 ' ) (sec. con núm. de ident.:138)
Cebador directo SK1236: (5 ' -CATGCGATCGCGACGTTTTGGTCAGGTCG-3 ' ) (sec. con núm. de ident.:139)
Cebador inverso SK1262 : (5'- GAACTGAAGCGAACCATGGTGTGGGACAACAAGAA GGAC-3') (sec. con núm. de ident . : 140)
El cásete de expresión se amplificó por PCR con los cebadores SK1298 y SK1289 para generar un producto para la transformación de T. reesei .
Cebador directo SK1298: (5 ' -GTAGTTATGCGCATGCTAGAC-3 ' ) (sec. con núm. de ident.: 141)
Cebador inverso SK1289: ( 5 '-GTGGCTAGAAGATATCCAACAC-3 ' ) (sec. con núm. de ident.: 1 2)
6.2.6. F. Cotransformación de casetes de expresión de T. reesei para ß-glucosidasa y endoxilanasa
Se cotransformó una cepa mutante de T. reesei, derivada de RL-P37 (Sheir-Neiss , G et al. Appl . Microbiol . Biotechnol .
1984, 20:46-53.) y seleccionada para una producción alta de celulasa con el cásete de expresión de ß-glucosidasa
(promotor de cbhl, gen de ß-glucosidasal de T. reesei, terminador de c¿ l y marcador de amdS) y el cásete de expresión de endoxilanasa (promotor de cbhl, xyn3 de T. reesei y terminador de cbhl) con el uso de transformación mediada por PEG (Penttila, M et al. Gene 1987, 61 (2 ) : 155 -64 ) .
Se aislaron numerosos transformantes y se los examinó para determinar la producción de ß-glucosidasa y endoxilanasa. Un transformante denominado cepa de T. reesei núm. 229 se usó para la transformación con los otros casetes de expresión. 6.2.7. G. Cotransformación de la cepa de T. reesei núm. 229 con casetes de expresión para dos ß-xilosidasas y una g-arabinofuranosidasa
La cepa de T. reesei núm. 229 se cotransformó con el cásete de expresión de fv3A de ß-xilosidasa (promotor de cbhl, gen fv3A, terminador de cbhl y marcador de alsR) , el cásete de expresión de fv43D de ß-xilosidasa (promotor de egll, gen de fv43D, terminador de fv43D nativo) y el cásete de expresión de fv51A de a-arabinofuranosidasa (promotor de egll, gen de fv51A, terminador nativo de fv51A) con el uso de electroporación (ver, por ejemplo, la patente núm. O 08153712). Los transformantes se seleccionaron en placas de agar de Vogel que contenían clorimurón etil (80 ppm) . El agar de Vogel se preparó de la siguiente manera, por litro.
Solución inicial de Vogel 50 x (receta 20 mi
más abajo)
Agar de BBL 20 g
Con H20 desionizada hasta 980 mi
Adición posterior a la esterilización:
Glucosa al 50 % 20 mi
Solución inicial de Vogel 50 x, por
litro :
En 750 mi de H20 desionizada, disolver
sucesivamente :
Citrato de Na3*2H20 125 g
KH2P04 (anhidro) 250 g
NH4N03 (anhidro) 100 g
MgS04*7H20 10 g
CaCl2*2H20 5 g
Solución de oligoelementos de Vogel 5 mi
(receta más abajo)
D-biotina 0.1 g
Con H20 desionizada, hasta 1 1
Solución de oligoelementos de Vogel:
ÁCIDO CÍTRICO 50 g
ZwS04.*7H20 50 g
Fe (NH4) 2S04. *6H20 10 g
CuS04.5H20 2.5 g
MnS04.4H20 0.5 g
H3BO3 0.5 g
Na2Mo04.2H20 0.5 g
Se aislaron numerosos transformantes y se los examinó para determinar la producción de ß-xilosidasa y L-a-arabinofuranosidasa . Los transformantes se analizaron, además, para determinar el desempeño de conversión de la biomasa de conformidad con el ensayo de sacarificación de la mazorca descrito en el Ejemplo 1 (supra) . Los ejemplos de cepas de expresión integradas de T. reesei descritos en la presente descripción son H3A, 39A, A10A, 11A y G9A que expresan todos los genes para Bgll de T. reesei, Xyn3 de T. reesei, Fv3A, Fv51A y Fv43D, en diferentes relaciones. Otras cepas de T. reesei integradas incluyen aquellas, en donde la mayor parte de los genes para Bgll de G. reesei, Xyn3 de T. reesei, Fv3A, Fv51A y Fv43D se expresaron en relaciones diferentes. Por ejemplo, una cepa carecía de Xyn3 de T. reesei sobreexpresado; otra carecía de Fv51A según se determinó por medio de análisis Western Blot; otras dos carecían de Fv3A, una carecía de Bgll sobreexpresado (por ejemplo, la cepa H3 -5) .
6.2.8. H. Composición de la cepa integrada de T. reesei H3A
La fermentación de la cepa integrada de T. reesei H3A produce las siguientes proteínas Xyn3 de T. reesei, Bgll de T. reesei, Fv3A, Fv5lA y Fv43D en relaciones determinadas tal como se describe en el Ejemplo 2, I, más abajo y se muestra en la Fig. 4 de la presente descripción.
6.2.9. I. Análisis de proteínas por HPLC
Se realizó cromatografía en liquido (LC) y espectroscopia de masa (MS) para separar, identificar y cuantificar las enzimas contenidas en caldos de fermentación. Las muestras de enzimas se trataron primero con una endoH glicosidasa expresada en forma recombinante de S. plicatus {por ejemplo, NEB P0702L) . La endoH se usó en una relación de 0.01-0.03 µg de proteína endoH por µ9 de proteína total de la muestra y se incubó por 3 h a 37 °C, pH 4.5-6.0 para eliminar enzimáticamente la glicosilación enlazada por N antes del análisis por HPLC. Después, se inyectó aproximadamente 50 \ig de proteína para la cromatografía por interacción hidrófoba con el uso de un sistema de HPLC Agilent 1100 con una columna de HIC-fenilo y un gradiente de sal alto a bajo durante 35 min. El gradiente se obtuvo con el uso de regulador con alto contenido de sal A: sulfato de amonio 4 M que contenía fosfato de potasio 20 mM pH 6.75 y regulador con bajo contenido de sal B: fosfato de potasio 20 mM pH 6.75. Los picos se detectaron con luz UV a 222 nm y las fracciones se recolectaron e identificaron por espectroscopia de masa. Las concentraciones de proteínas se reportan como porcentaje del área del cromatograma integrada total .
6.2.10. J. Efecto de la adición de proteínas purificadas en el caldo de fermentación de la cepa integrada de T. reesei H3A en la sacarificación de la mazorca de maíz pretratada con amoníaco diluido
Las proteínas purificadas (y una proteína sin purificar) se diluyeron en serie a partir de soluciones iniciales y se añadieron a un caldo de fermentación de la cepa integrada de G. reesei H3A para determinar su beneficio para la sacarificación de la biomasa pretratada. La mazorca de maíz pretratada con amoníaco diluido se cargó en pocilios de una placa de microtitulación (MTP, por sus siglas en inglés) en una concentración de 20 % de sólidos (p/p) (~5 mg de celulosa por pocilio), pH 5. La proteína de H3A (en la forma de un caldo de fermentación) se añadió en cada pocilio a 20 mg de proteína/g de celulosa. Se añadió volúmenes de 10, 5, 2 y 1 µ? de cada proteína diluida (Fig. 5) en pocilios individuales y se añadió agua de modo que la adición de líquido en cada pocilio alcanzó un total de 10 µ? . Los pocilios de referencia incluyeron adiciones de 10 µ? de agua o diluciones de caldo de fermentación de H3A adicional. Las MTP se sellaron con lámina de metal y se incubaron a 50 °C con agitación a 200 RPM en el agitador de un incubador Innova por tres días. Las muestras se enfriaron con 100 µ? de glicina 100 mM, pH 10. Las muestras enfriadas se cubrieron con un sello plástico y se centrifugaron a 3000 RPM por 5 min a 4 °C. Se diluyó una alícuota (5 µ?) de las reacciones enfriadas con 100 µ? de agua y la concentración de glucosa producida en las reacciones se determinó con el uso de HPLC. Los datos de la glucosa se graficaron como una función de la concentración de proteínas añadidas en los 20 mg/g de H3A (las concentraciones de las adiciones de proteínas fueron variables debido a concentraciones iniciales diferentes y a las adiciones por volumen) . Los resultados se muestran en las Figs. 58A-58D.
6.3. Ejemplo 3: Construcción de cepas de T. reesei
6.3.1 A. Construcción y análisis para determinar la cepa de T. reesei H3A/EG4 núm. 27
Se clonó un cásete de expresión que contenía el promotor de egll de T. reesei (conocido, además, como "Cel 7B" ) , el marco de lectura abierto de eg4 de T. reesei (conocido, además, como "TrEG4" o "Cel 61A") y la secuencia terminadora de cbhl (Cel 7A) (Fig. 59A) de T. reesei y el marcador seleccionable sucA (ver, Boddy et al., Curr. Genet . 1993, 24:60-66) de A. niger en pCR Blunt II TOPO (Invitrogen) (Fig. 59B) .
El cásete de expresión Pegll-eg4-sucA se amplificó por PCR con el uso de los siguientes cebadores:
SK1298: 5 ' -GTAGTTATGCGCATGCTAGAC- 3 ' (sec. con núm. de ident. :143)
214: 5 ' -CCGGCTCAGTATCAACCACTAAGCACAT-3 ' (sec. con núm. de ident. : 144)
Pfu Ultra II (Stratagene) se usó como la polimerasa para la reacción de PCR. Los productos de la reacción de PCR se purificaron con el equipo de purificación de PCR QIAquick (Qiagen) según el protocolo del fabricante. Después, los productos de la reacción de PCR se concentraron con el uso de un concentrador al vacío hasta 1-3 pg/^l. La cepa huésped de T. reesei objetivó de la transformación (H3A) se cultivó hasta obtener la esporulación completa en placas de agar dextrosa y papa por 5 d a 28 °C. Las esporas de 2 placas se recolectaron con agua MilliQ y se filtraron a través de un filtro celular de 40 µ? (BD Falcon) . Las esporas se transfirieron a un tubo cónico de 50 mi y se lavaron 3 veces por centrifugación repetida con 50 mi de agua. Se realizó un lavado final con solución de sorbitol 1.1 M. Las esporas se resuspendieron en un pequeño volumen (menos de 2 veces el volumen del gránulo) con el uso de solución de sorbitol 1.1 M. Después, la suspensión de esporas se mantuvo en hielo. La suspensión de esporas (60 µ?) se mezcló con 10-20 µg de ADN y se transfirió a la cubeta de electroporacion (E-shot, cubeta de electroporacion estándar de 0.1 cm de Invitrogen) . Las esporas se electroporaron con el uso del Biorad Gene Pulser Xcell configurado a 16 kV/cm, 25 iF , 400 O. Después de la electroporacion se añadió 1 mi de solución de sorbitol 1.1. M en la suspensión de esporas. La suspensión de esporas se colocó en placas sobre agar de Vogel (ver el Ejemplo 2G) que contenía sacarosa al 2 % como la fuente de carbono.
Las placas de transformación se incubaron a 30 °C por 5- 7 d. Los transformantes iniciales se inocularon otra vez por estrías sobre placas de Vogel secundarias con sacarosa y se cultivaron a 30 °C por otros 5-7 d. Después, las colonias sencillas cultivadas en placas de selección secundarias se cultivaron en pocilios de placas de microtitulación con el uso del método descrito en la patente núm. WO/2009/114380. Los sobrenadantes se analizaron en SDS-PAGE para controlar los niveles de expresión antes del análisis del desempeño de la sacarificación.
Un total de 94 transformantes sobreexpresaron EG4 en la cepa H3A. Dos cepas de control H3A se cultivaron en placas de microtitulación junto con las cepas H3A/EG4. El análisis del desempeño para las cepas de T. reesei que expresan la proteína EG4 se realizó con uso de la mazorca de maíz pretratada con amoníaco. La mazorca de maíz pretratada con amoníaco diluido se suspendió en agua y se ajustó hasta pH 5.0 con ácido sulfúrico para obtener celulosa al 7 %. La suspensión de despachó en una placa de microtitulación de 96 pocilios de fondo plano (Nunc, 269787) y se centrifugó a 3000 rpm por 5 min.
Las reacciones de sacarificación de la mazorca de maíz se iniciaron por la adición de 20 µ? de H3A o caldo de cultivo de la cepa H3A/EG4 por pocilio de sustrato. Las reacciones de sacarificación de la mazorca de maíz se sellaron con aluminio (E&K scientific) y se mezclaron por 5 min a 650 rpm, 24 °C. Después, la placa se colocó en un incubador Innova a 50 °C y 200 rpm por 72 h. Al final de la sacarificación de 72 h, las reacciones se enfriaron por medio de la adición de 100 µ? de glicina 100 mM, pH 10.0. Después, la placa se mezcló bien y se centrifugó a 3000 rpm por 5 min.
Se añadió sobrenadante (10 µ?) en 200 µ? de agua en una placa de microtitulación de 96 pocilios para HPLC (Agilent, 5042-1385) . Las concentraciones de glucosa, xilosa, celobiosa y xilobiosa se midieron por HPLC con el uso de una columna Aminex HPX-87P (300 mm x 7.8 mm, 125-0098) preequipada con una columna de protección.
El análisis en la mazorca de maíz identificó las siguientes cepas de H3A/EG4 como cepas que tienen una conversión de glucano y xilano mejorada en comparación con las cepas de control de H3A : 1, 2, 3, 4, 5, 6, 14, 22, 27, 43 y 49 (Fig. 60) .
Las cepas de H3A/EG4 seleccionadas se volvieron a cultivar en frascos de agitación. Se recolectó un total de 30 mi de cultivo de proteínas por matraz de agitación por cepa. Los filtrados de cultivo se concentraron 10 veces con el uso de concentradores centrífugos de membrana de 10 kDa (Sartorious, VS2001) y la concentración total de proteínas se determinó por BCA tal como se describe en el Ejemplo 1C. Se realizó una reacción de sacarificación de la mazorca de maíz con el uso de 2.5 , 5, 10 o 20 mg de proteína de muestras de cepa de H3A/EG4 por g de celulosa por pocilio de sustrato de mazorca de maíz. Una cepa de H3A producida a una escala de fermentación de 14 1 y una muestra de bajo rendimiento identificada previamente (cepa de H3A/EG4 núm. 20) producida en matraz de agitación se incluyeron como controles. Las reacciones de sacarificación se realizaron tal como se describe en el Ejemplo 4 (más abajo) . Se observó una mayor conversión de glucano con el incremento de la dosis de proteína con el sobrenadante de cultivo de todas las cepas de expresión de EG4 (Fig. 61) . La cepa integrada de T. reesei H3A/EG4 núm. 27 se usó en reacciones de sacarificación adicionales y la cepa se purificó por medio de inoculación por estrías de una sola colonia sobre una placa de dextrosa y papa a partir de la cual se aisló una sola colonia.
6.4. Ejemplo 4. Intervalo de concentraciones de EG4 de G. reesei para la sacarificación mejorada de la mazorca de maíz pretratada con amoníaco diluido
Para determinar la dosificación preferida, se realizó la hidrólisis de la mazorca de maíz pretratada con amoníaco diluido (25 % de sólidos, 8.7 % de celulosa, 7.3 % de xilano) a pH 5.3 con el uso de caldo de fermentación de la cepa integrada de T. reesei H3A/EG4 núm. 27 o H3A con EG4 purificada añadida en la mezcla de reacción. La carga total de la cepa integrada de T. reesei H3A/EG4 núm. 27 o H3A fue de 14 mg de proteína por gramo de glucano (G) y xilano (X) . La mezcla de reacción (masa total 5 g) se cargó en frascos de escintilación de 20 mi en un volumen de reacción total de 5 mi de conformidad con los cuadros de dosificación en las Figs. 6, 7A y 7B.
La configuración para el Experimento 1 se muestra en la Fig. 6. Se mezcló agua MilliQ y ácido sulfúrico 6 N en un tubo cónico y se añadió en los frascos respectivos y los frascos se agitaron para mezclar el contenido. Se añadió muestras de enzimas en los frascos y los frascos se incubaron por 6 d a 50 °C. En distintos momentos, se diluyó 100 µ? de muestra de los frascos con 900 µ? de ácido sulfúrico 5 mM, se agitó en vórtice, se centrifugó y el sobrenadante se usó para medir las concentraciones de azúcares solubles producidos con el uso de HPLC. Los resultados de la conversión de glucano se muestran en la Fig. 64 y la conversión de xilano en la Fig. 65.
La configuración para el Experimento 2 se muestra en la Fig. 7A. Para determinar aun más la concentración de EG4 preferida, se realizó la sacarificación de la mazorca de maíz diluida con amoniaco (25 % de sólidos, 8.7 % de celulosa, 7.3 % de xilano) a pH 5.3 con el uso de caldo de fermentación de la cepa integrada de T. reesei H3A/EG4 núm. 27 o H3A con EG4 purificada añadida (de 0.05 a 1.0 mg de proteína/g de G+X) en la mezcla de reacción. La carga total de la cepa integrada de T. reesei H3A/EG4 núm. 27 o H3A fue de 14 mg de proteína/g de glucano + xilano.
Los resultados experimentales se muestran en la Fig. 66A. La configuración para el Experimento 3 se muestra en la Fig. 7B . Para determinar el intervalo de concentración preferido de Eg4 de T. reesei aun más, se hidrolizó la mazorca de maíz diluida con amoníaco (25 % de sólidos, 8.7 % de celulosa y 7.3 % de xilano) a pH 5.3 con el uso de la cepa integrada de T. reesei H3A/EG4 núm. 27 o H3A con EG4 purificada añadida en concentraciones de 0.1-0.5 mg de proteína/g de G+X. La carga total de la cepa integrada de T. reesei H3A/EG4 núm. 27 o H3A fue de 14 mg de proteína por g de glucano y xilano.
Los resultados se muestran en la Fig. 66B.
6.5. Ejemplo 5. Efecto de Eg4 de G. reesei en la sacarificación del rastrojo de maíz pretratado con amoníaco diluido a cargas diferentes
El rastrojo de maíz pretratado con amoníaco diluido se incubó con caldo de fermentación de la cepa integrada de T. reesei H3A o H3A/EG4 núm. 27 (14 mg de proteína/g de glucano y xilano) a 7, 10, 15, 20 y 25 % de sólidos (%S) por tres días a 50 °C, pH 5.3 (5 g de biomasa húmeda total en frascos de 20 mi) . Las reacciones se realizaron tal como se describe en el Ejemplo 4 anterior. La glucosa y xilosa se analizaron por medio de HPLC. Los resultados se muestran en la Fig. 67. Todas las muestras que contenían hasta 20 % de sólidos estaban visiblemente licuadas en el día 1.
6.6. Ejemplo 6. Efecto de la sobreexpresion de EG4 de T. reesei en la hidrólisis de la mazorca de maíz pretratada con amoníaco diluido
El efecto de la sobreexpresion de Eg4 de T. reesei en la cepa H3A en la sacarificación de la mazorca de maíz pretratada con amoníaco diluido se probó con el uso de caldos de fermentación de cepas H3A/EG4 # 27 y H3A. La sacarificación de la mazorca de maíz en una escala de 3 g se realizó en frascos de vidrio de 20 mi de la siguiente manera. Se añadió la preparación enzimática, el ácido sulfúrico 1 N y el regulador de acetato de sodio 50 mM pH 5.0 (con azida sódica al 0.01 % y MnCl25 mM) para producir una suspensión final de 3 g de reacción total, 22 % de sólidos secos, pH 5.0 con cargas de enzimas entre 1.7 y 21.0 mg de proteínas totales por gramo de glucano + xilano. Todos los frascos de sacarificación se incubaron a 48 °C con rotación a 180 rpm. Después de 72 h, se añadió 12 mi de agua MilliQ filtrada en cada frasco para diluir 5 veces toda la reacción de sacarificación. Las muestras se centrifugaron a 14000 x g por 5 min, después, se filtraron a través de un filtro de nailon de 0.22 µt? (filtro de tubo de centrífuga Spin-X, Corning Incorporated, Corning, NY) y se diluyó 4 veces más con agua MilliQ filtrada para crear una dilución final de 20X. Se analizaron inyecciones de 20 µ? por HPLC para medir los azúcares liberados.
La sobreexpresión o adición de Eg4 de T. reesei permitió obtener una liberación de monómeros de glucosa y xilosa mejorada en comparación con el uso de H3A sola (Figs. 9 y 10) . La adición de H3A/EG4 núm. 27 en dosis diferentes resultó en una producción mayor de xilosa en comparación con la cepa H3A o en comparación con Eg4 + una constante de 1.12 mg de Xyn3 por g de glucano + xilano (Fig. 9) .
La adición de H3A/EG4 núm. 27 en dosis diferentes resultó en una producción mayor de glucosa en comparación con la cepa H3A o en comparación con Eg4 + una constante de 1.12 mg de Xyn3 por g de glucano + xilano (Fig. 10) .
El efecto de Eg4 de T. reesei en la liberación del monómero fermentable total (xilosa, glucosa y arabinosa) por las cepas integradas H3A/EG4# 27 o H3A se ilustra en la Fig. 11. La cepa integrada H3A/EG4 núm. 27 resultó en una liberación de monómeros fermentables totales mejorada en comparación con la cepa integrada H3A o con Eg4 + 1.12 mg de Xyn3/g de glucano + xilano.
6.7. Ejemplo 7: EG4 de T. reesei purificado produce liberación de glucosa en la mazorca de maíz pretratada con amoníaco diluido
Se probó el efecto de Eg4 de T. reesei purificado en la concentración de azúcares liberados, con el uso de la mazorca de maíz pretratada con amoníaco diluido en presencia o ausencia de 0.53 mg de Xyn3 por g de glucano + xilano. Los experimentos se realizaron tal como se describe en el Ejemplo
6. Los resultados se muestran en la Fig. 12.
Los datos indican que Eg4 de T. reesei purificado produce la liberación del monómero de glucosa sin la acción de otras celulasas tales como endoglucanasas , celobiohidrolasas y ß-glucosidasas . Además, se realizaron los experimentos de sacarificación con el uso de la mazorca de maíz pretratada con amoníaco diluido con Eg4 purificada añadida sola (sin Xyn3 agregado). Se añadió 3.3 µ? de Eg4 purificada (15.3 mg/ml) en 872 µ? de regulador de acetato de sodio 50 m , pH 5.0 (que incluía azida sódica al 0.01 % y MnCl2 5 mM) , 165 mg de mazorca de maíz pretratada con amoníaco diluido (67.3 % de sólidos secos, 111 mg de sólidos secos añadidos) y 16.5 µ? de ácido sulfúrico 1 N en frascos de 5 mi . Los frascos se incubaron a 48 °C y se rotaron a 180 rpm. Periódicamente, se extrajeron alícuotas de 20 µ?, se diluyeron 10 veces con agua destilada doble esterilizada con filtro y se filtraron a través de un filtro de nailon antes del análisis para determinar la glucosa liberada en un sistema de cromatografía de iones Dionex. Las soluciones de glucosa auténticas se usaron como estándares externos. Los resultados se muestran en la Fig. 68 y estos indican que la adición de Eg4 purificada produce la liberación de monómero de glucosa a partir de mazorcas de maíz pretratadas con amoníaco diluido durante una incubación de 72 h a 48 °C en ausencia de otras celulasas o endoxilanasa .
6.8. Ejemplo 8: Desempeño de la sacarificación de las cepas integradas de T. reesei H3A y H3A/EG4 núm. 27 en varios
sustratos
En este experimento, se probó el caldo de fermentación de la cepa integrada de T. reesei H3A o H3A/EG4 núm. 27 dosificada a 14 mg de proteína por g de glucano + xilano, para determinar el desempeño de la sacarificación en sustratos diferentes que incluyen: mazorca de maíz pretratada con amoníaco diluido, mazorca de maíz pretratada con amoníaco diluido lavado, rastrojo de maíz (CS) pretratado con fibra de amoniaco expandida (AFEX) , bagazo de caña de azúcar expandido con vapor (SEB) y pulpas de papel pretratadas con kraft FPP27 (pulpa de madera blanda industrial no blanqueada y deslignificada Kappa 13.5, 81.9 % de glucano, 8.0 % de xilano, 1.9 % de lignina Klason) , FPP-31 (pulpa de madera dura no blanqueada y deslignificada-Kappa 10.1, 75.1 % de glucano, 19.1 % de xilano, 2.2 % de lignina Klason) y FPP-37 (pulpa de madera blanda no blanqueada secada al aire-Kappa 82, 71.4 % de glucano, 8.7 % de xilano, 11.3 % de lignina Klason) .
Las reacciones de sacarificación se determinaron en frascos de vidrio de 25 mi con una masa final de 10 g en regulador de citrato de sodio 0.1 M, pH 5.0 y se incubaron a 50 °C, 200 rpm por 6 d. Al final de, los 6 d, se diluyó alícuotas de 100 µ? 1:10 en ácido sulfúrico 5 mM y las muestras se analizaron por HPLC para determinar la formación de glucosa y xilosa. Los resultados se muestran en la Fig. 69.
6.9. Ejemplo 9: Efecto de EG4 de G. reesei en la
sacarificación del rastrojo de maíz pretratado con ácido
Se probó el efecto de Eg4 en la sacarificación del rastrojo de maíz pretratado con ácido. Se obtuvo rastrojo de maíz pretratado con ácido sulfúrico diluido (Schell, DJ, et al., Appl. Bioche . Biotechnol . 2003, 105 (1-3) : 69-85) de NREL, se ajustó en 20 % de sólidos y se acondicionó hasta un pH 5.0 con la adición de solución de ceniza de sosa. La sacarificación del sustrato pretratado se realizó en una placa de microtitulación con el uso de 20 % de sólidos totales. La proteína total en los caldos de fermentación se midió por medio del ensayo de Biuret (ver el Ejemplo 1 anterior) . Se añadió cantidades cada vez mayores de caldo de fermentación de las cepas integradas de T. reesei H3A/EG4 núm. 27 y H3A en el sustrato y se midió el desempeño de la sacarificación después de la incubación a 50 °C, 5 d, agitación de 200 RPM. La formación de glucosa (mg/g) se midió con el uso de HPLC. Los resultados se muestran en la Fig. 70 6.10. Ejemplo 10: Desempeño de la sacarificación de cepas integradas de T. reesei H3A y H3A/EG4 núm. 27 en hojas, tallos y mazorcas de maíz pretratados con amoníaco diluido
En este experimento se comparó el desempeño de la sacarificación de cepas integradas de T. reesei H3A y H3A/EG4 núm. 27 en rastrojo, hojas, tallos o mazorcas de maíz pretratados con amoníaco diluido. El tratamiento previo se realizó tal como se describe en la patente núm. WO 06110901A. Se hidrolizó cinco (5) g de masa total (7 % de sólidos) en frascos de 20 mi a pH 5.3 (pH ajustado por la adición de H2S04 6 N) con el uso de 14 mg de proteína por g de glucano +xilano. Las reacciones de sacarificación se realizaron a 50 °C y las muestras se analizaron por HPLC para determinar la glucosa y xilosa liberada en el día 4. Los resultados se muestran en la Fig. 71.
6.11. Ejemplo 11: Desempeño de la sacarificación en mazorca de maíz pretratada con amoníaco diluido en respuesta al EG4 de G. reesei sobreexpresado
Se realizaron las reacciones de sacarificación a una escala de 3 g con el uso de la mazorca de maíz pretratada con amoníaco diluido. Se midió una cantidad suficiente de preparación de mazorca pretratada en frascos de vidrio de 20 mi para producir 0.75 g de sólido seco. Se añadió la preparación enzimática, ácido sulfúrico 1 N y regulador de acetato de sodio 50 mM pH 5.0 (con azida sódica al 0.01 %) para producir una suspensión final de 3 g, reacción total, 25 % de sólidos secos, pH 5.0. Se añadió proteína extracelular (caldo de fermentación) de la cepa integrada de T. reesei H3A en 14 mg de proteína/ g (glucano+xilano) con o sin un 5 % adicional de la carga de 14 mg de proteína como el sobrenadante del cultivo no purificado de una cepa de T. reesei { cbhl ¡\cbh2 egl eg2) {Ver la publicación internacional núm. WO 05/001036) que sobreexpresa Eg4. Las reacciones de sacarificación se incubaron por 72 h a 50 °C. Después de la incubación, el contenido de la reacción se diluyó 3 veces, se filtró y se analizó por HPLC para determinar la concentración de glucosa y xilosa. Los resultados se muestran en la Fig. 73. La adición de proteína de Eg4 en la forma de proteína extracelular de una cepa de T. reesei que sobreexpresa la proteína a H3A incrementó sustancialmente la liberación de monómero de glucosa e incrementó ligeramente la liberación de xilosa monomérica. 6.12. Ejemplo 12: Desempeño de la sacarificación de la cepa H3A/EG4 núm. 27 en césped de pradera pretratado con amoníaco El desempeño de la sacarificación de la cepa H3A/EG4 núm. 27 en césped de pradera pretratado con amoníaco diluido (patente núm. WO 06110901A) a dosis de proteínas crecientes se comparó con el de la cepa H3A (18.5 % de sólidos) . Las preparaciones de césped de pradera pretratado se midieron en frascos de vidrio de 20 mi para producir 0.925 g de sólido seco. Se añadió ácido sulfúrico 1 N y regulador de acetato de sodio 50 mM pH 5.3 (con azida sódica al 0.01 %) para producir una suspensión final de 5 gramos de la reacción total. Se probó dosificaciones de enzimas de H3A de 14, 20 y 30 mg/g (glucano + xilano) ; y dosificaciones de H3A-EG4 núm. 27 de 5, 8, 11, 14, 20 y 30 mg/g (glucano + xilano) . Las reacciones se incubaron a 50 °C por 3 d. Después de la incubación, el contenido de la reacción se diluyó 3 veces, se filtró y se analizó por HPLC para determinar la concentración de glucosa y xilosa. La conversión de glucano y xilano se calculó en base a la composición del sustrato de césped de pradera. Los resultados que se muestran en la Fig. 74 indican que el desempeño de conversión de glucano de H3A-EG4 núm. 27 es más eficaz que H3A en las mismas dosis de enzimas.
6.13. Ejemplo 13. Efecto de las adiciones de EG4 de T. reesei en la sacarificación de la mazorca de maíz, y en la hidrólisis de CMC y celobiosa
6.13.1 A. Sacarificación de la mazorca de maíz
La mazorca de maíz pretratada con amoníaco diluido se ajustó hasta 20 % de sólidos, 7 % de celulosa y se suministró 65 mg por pocilio en una placa de microtitulación . Las reacciones de sacarificación se iniciaron por la adición de 35 µ? de regulador de acetato de sodio 50 mM (pH 5.0) que contenía CBH1 de T. reesei a 5 mg de proteína/g de glucano (final) y las enzimas relevantes (CBH1 o Eg4), en concentraciones finales de O, 1, 2, 3, 4 y 5 mg/g de glucano. Un control de Eg4 recibió solamente EG4 en las mismas dosis y, como tal, la proteína añadida total en estos pocilios fue menor. Las placas de microtitulación se sellaron con un sello de placa de aluminio (E&K scientific) y se mezclaron por 2 min a 600 rpm, 24 °C. Después, la placa se colocó en un incubador Innova a 50 °C y 200 rpm por 72 h.
Al final de la sacarificación de 72 h, la placa se enfrió por medio de la adición de 100 µ? de glicina 100 mM, pH 10.0. Después, la placa se centrifugó a 3000 rpm por 5 min. Se añadió sobrenadante (20 µ?) en 100 µ? de agua en una placa de microtitulación de 96 pocilios para HPLC (Agilent, 5042-1385) . Las concentraciones de glucosa y celobiosa se midieron por HPLC con el uso de una columna Aminex HPX-87P (300 mm x 7.8 rara, 125-0098) preequipada con una columna de protección. El porcentaje de conversión de glucano se calculó como 100 x (mg de celobiosa + mg de glucosa) / total glucano en el sustrato (Fig. 75) .
6.13.2 B. Hidrólisis de CMC
Se diluyó carboximetilcelulosa (CMC, Sigma C4888) hasta
1 % con acetato de sodio 50 mM, H 5.0. Las reacciones de hidrólisis se iniciaron por la adición separada de cada una de las tres enzimas purificadas de T. reesei - Eg , EG1 y CBH1 en concentraciones finales de 20, 10, 5, 2.5, 1.25 y 0 mg/g en 100 µ? de CMC al 1 % en una placa de microtitulación de 96 pocilios (NUNC núm. 269787) . Se añadió acetato sódico, pH 5.0 50 mM en cada pocilio hasta una volumen final de 150 µ? . Las reacciones de hidrólisis de CMC se sellaron con un sello de placa de aluminio (E&K scientific) y se mezclaron por 2 min a 600 rpm, 24 °C. Después, la placa se colocó en un incubador Innova a 50 °C y
200 rpm por 30 min.
Al final de los 30 min de incubación, la placa se colocó en agua helada por 10 min para detener la reacción y las muestras se transfirieron a tubos Eppendorf . En cada tubo se añadió 375 µ? de solución de ácido dinitrosalicílico (DNS) (ver más abajo) . Después, las muestras se llevaron a la ebullición por 10 min y se midió la O.D a 540 nm por SpectraMAX 250 (Molecular Devices) . Los resultados se muestran en la Fig. 76.
SOLUCIÓN DE DNS:
40 g de ácido dinitrosalicílico 3.5 (Sigma, D0550)
8 g de fenol
2 g de sulfito de sodio (Na2S03)
800 g de tartrato de Na-K (sal de Rochelle) . Se añade todo lo anterior en 2 1 de NaOH al 2 % . Se agita de la noche a la mañana, cubierto con papel de aluminio. Se añade agua desionizada destilada hasta un volumen final de 4 L. Mezclar bien. Se almacena en una botella oscura, refrigerada.
6.13.3. C. Hidrólisis de celobiosa
Se diluyó celobiosa hasta 5 g/1 con acetato de sodio 50 mM, pH 5.0. Las reacciones de hidrólisis se iniciaron por la adición separada de cada una de las dos enzimas - EG4 y BGL1 en concentraciones finales de 20, 10, 5, 2.5 y 0 mg/g en 100 µ? de solución de celobiosa a 5 g/1. Se añadió acetato de sodio, pH 5.0 en cada pocilio hasta un volumen final de 120 µ? . Las placas de reacción se sellaron con un sello de placa de aluminio (E&K scientific) y se mezclaron por 2 min a 600 rpm, 24 °C. Después, la placa se colocó en un incubador Innova a 50 °C y 200 rpm por 2 h.
Al final de la etapa de hidrólisis de 2 h, la placa se enfrió por medio de la adición de 100 µ? de glicina 100 mM, pH 10.0. Después, la placa se centrifugó a 3000 rpm por 5 min. La concentración de glucosa se midió por medio del ensayo de ABTS (ácido 2 , 2 ' -azino-bis 3-etilbenzotiazolina-6-sulfónico) (Ejemplo 1) . Se añadió diez (10) µ? de sobrenadante en 90 µ? de solución de ABTS en una placa de microtitulación de 96 pocilios (Corning costar 9017 placa EIA/RIA, 96 pocilios de fondo plano, unión media) . La O.D. 420 nm se midió con SpectraMAX 250, Molecular Devices. Los resultados se muestran en la Fig. 77.
6.14. Ejemplo 14: La Eg4 purificada mejora la producción de glucosa a partir de la mazorca de maíz pretratada con amoníaco diluido cuando se mezcla con varias mezclas de celulasa
El efecto de la Eg4 purificada combinada con celulasas purificadas (T. reesei EG1, EG2 , CBH1, CBH2 y Bgll) en la concentración de azúcares liberados se probó con el uso de mazorca de maíz pretratada con amoníaco diluido en presencia de 0.53 mg de Xyn3 de T. reesei por g de glucano + xilano. Las reacciones de 1.06 g se determinaron en frascos de 5 mi que contenían 0.111 g de sólidos de mazorca seca (10.5 % de sólidos) . Se añadió la preparación enzimática (Fig. 72A) , ácido sulfúrico 1 N y regulador de acetato de sodio 50 mM pH 5.0 (con azida sódica al 0.01 % y MnCl2) 5 mM para producir el peso de la reacción final. Los frascos de la reacción se incubaron a 48 °C con rotación a 180 rpm. Después de 72 h, se añadió agua MilliQ filtrada para diluir 5 veces cada reacción de sacarificación. Las muestras se centrifugaron a 14000 x g por 5 min, después, se filtraron a través de un filtro de nailon de 0.22 µp? (filtro de tubo de centrífuga Spin-X, Corning Incorporated, Corning, NY Milli-Q) y se diluyó 4 veces más con agua filtrada para crear una dilución final de 20X. Se analizaron inyecciones de (20) µ? por HPLC para medir los azúcares liberados (glucosa, celobiosa y xilosa) .
La Fig. 72B muestra la glucosa (gráfico superior) , glucosa + celobiosa (gráfico central) o xilosa (gráfico inferior) producidas con cada combinación. La Eg4 purificada mejoró el desempeño de celulasas individuales y mezclas. Cuando estaban presentes todas las celulasas purificadas, la adición de 0.53 mg de Eg4 por g de glucano + xilano mejoró la conversión, prácticamente, un 40 %. La mejora se observó, además, cuando se añadió Eg4 en una combinación de CBH1 , Egll y Bgll. Cuando había celulasas individuales con la mazorca, las cantidades absolutas de liberación de glucosa total eran sustancialmente menores que las observadas en el experimento en el cual había combinaciones de celulasas con la mazorca, pero en los dos casos el porcentaje de mejora fue significativo en presencia de Eg4. La adición de Eg4 en celulasas purificadas produjo las siguientes mejoras porcentuales en la liberación total de glucosa-Bgll (121 %) , Egl2 (112 %) , CBH2 (239 %) y CBH1 (71 %) . Esto muestra que Eg4 generó un efecto significativo y amplio en la mejora del desempeño de celulasa en la biomasa.
6.15. Ejemplo 15. Efectos sinérgicos observados cuando se mezcló EG4 con CBH1, CBH2 y EG2 - Sustrato: mazorca de maíz pretratada con amoníaco diluido
Las reacciones de la mazorca de maíz pretratada con amoníaco diluido se prepararon por la adición de mezclas enzimáticas de la siguiente manera en la mazorca de maíz (65 mg por pocilio de 20 % de sólidos, 7 % de celulosa) en placas de microtitulacíón de 96 pocilios (VWR) . Se añadió, además, ochenta (80) µ? de acetato de sodio 50 mM (pH 5.0), 1 mg de Bgll/g de glucano y 0.5 mg de Xyn3/g de fondo de glucano en todos los pocilios.
Para probar el efecto del mezclado de Eg4 individualmente con CBH1, CBH2 y EG2 , cada CBH1, CBH2 y EG2 se añadió en 0, 1.25, 2.5, 5, 10 y 20 mg/g de glucano y se añadió EG4 en concentraciones de 20, 18.75, 17.5, 15, 10 y 0 mg/g de glucano en los pocilios respectivos lo que conformó las proteínas totales en 20 mg/g de glucano en pocilios individuales. En los pocilios de control se añadió solamente CBH1 o CBH2 o EG2 o EG4 en las mismas dosis, de modo que en estos pocilios se añadió una cantidad total de proteínas menor que 20 mg/g.
Para probar el efecto de Eg4 en combinaciones de celulasas, se añadió mezclas de CBH1, CBH2 y EG2 en relaciones diferentes (ver, la Fig. 8A) a 0, 1.25, 2.5, 5, 10 y 20 mg de proteína/g de glucano y se añadió EG4 en las mezclas en concentraciones de 20, 18.75, 17.5, 15, 10 y 0 mg de proteína/g de glucano, de modo que la cantidad de proteínas totales en pocilios individuales alcanzó 20 mg de proteína/g de glucano. Como antes, en los pocilios de control se añadió solamente una proteína de modo que se añadió una cantidad total de proteínas menor que 20 mg de proteína/g.
Las reacciones de sacarificación de la mazorca de maíz se sellaron con un sello de placa de aluminio (E&K scientific) y se mezclaron por 2 min a 600 rpm, 24 °C. Después, la placa se colocó en un agitador del incubador Innova 44 (New Brunswick Scientific) a 50 °C y 200 rpm por 72 h. Al final de la etapa de sacarificación de 72 h, la placa se enfrió por medio de la adición de 100 µ? de glicina 100 mM, pH 10.0. Después, la placa se centrifugó a 3000 rpm por 5 min (Rotanta 460R Centrifuge, Hettich Zentrifugen) . Se añadió veinte (20) µ? de sobrenadante en 100 µ? de agua en una placa de microt itulación de 96 pocilios para HPLC (Agilent, 5042-1385) . Las concentraciones de glucosa y celobiosa se midieron por medio de HPLC con el uso de una columna Aminex HPX-87P (300 mm x 7.8 mm, 125-0098) y columna de protección (BioRad) .
Los resultados se indicaron en la tabla de las Figs . 8B-1 y 8B-2, en donde el % de conversión de glucano se define como % (glucosa + celobiosa) / total glucano.
Este experimento indica que, cuando se añade Eg4 a una CBHl, CBH2 y/o EG2 , se obtiene como beneficio la mejora en la sacarificación de la mazorca de maíz pretratada con amoníaco diluido. Ciertamente, se observó un efecto sinérgico, especialmente, cuando se añadió Eg4 en una mezcla que comprende CBH2. Además, la mejora más importante se observó cuando se añadió Eg4 y la otra enzima (CBHl, CBH2 o EG2) en la mezcla de sacarificación en una cantidad igual. Además, se observó que el efecto de Eg4 es considerable en la mezcla de CBHl y CBH2. La mejora óptima producida por Eg4 se observó con una relación entre Eg4 y CBHl y CBH2 de 1:1. Los resultados se indican en la Fig. 8B-1 y 8B-2.
6.16. Ejemplo 16: EG4 mejora el desempeño de la sacarificación de varias composiciones de hemicelulasa
La concentración total de proteínas de preparaciones enzimáticas de celulasas comerciales Spezyme® CP, Accellerase®1500 y Accellerase®DUET (Genencor División, Danisco US) se determinaron por medio del ensayo de Biuret modificado (descrito en la presente descripción) .
Se añadió EG4 de T. reesei en cada preparación enzimática y las muestras se ensayaron, después, para determinar el desempeño de la sacarificación con el uso de una carga de 25 % de sólidos de mazorca de maíz pretratada con amoníaco diluido, en una dosis de 14 mg de proteínas totales por g de sustrato de glucano y xilano (5 mg de EG4 por g de glucano y xilano, más 9 mg de celulasa completa por g de glucano y xilano) . La reacción de sacarificación se realizó con el uso de 5 g de mezcla de reacción total en un frasco de 20 mi a pH 5, con incubación a 50 °C en un agitador rotativo a 200 rpm por 7 d. Las muestras de sacarificación se diluyeron lOx con ácido sulfúrico 5 mM, se filtraron a través de un filtro de 0.2 µp? antes de la inyección en la HPLC. El análisis por HPLC se realizó con el uso de una columna de exclusión de iones BioRad Aminex HPX-87H (300 mm x 7.8 mm) .
La sustitución de Eg4 purificada en celulasa completa mejoró la conversión de glucano en todos los productos de celulasa probados tal como se ilustra en la Fig. 63A. Como se ilustra en la Fig. 63B la sustitución de Eg4 no afectó, aparentemente, la conversión de xilano.
6.17 Ejemplo 17: Clonación, expresión y purificación de Fv3C 6.17.1. A. Clonación y expresión de Fv3C
La secuencia de Fv3C (sec. con núm. de ident. :60) se obtuvo mediante la búsqueda de homólogos de ß-glucosidasa de GH3 en el genoma de Fusarium verticillioides en la base de datos de Broad Institute (http://www.broadinstitute.org/) . El marco de lectura abierto de Fv3C se amplificó por PCR con el uso de ADN genómico de Fusarium verticillioides como la plantilla. Como termociclador de PCR se usó el DNA Engine Tetrad 2 Peltier Therraal Cycler (Bio-Rad Laboratories) . Como ADN polimerasa se usó PfuUltra II Fusión HS DNA Polymerase (Stratagene) . Para amplificar el marco de lectura abierta se usaron los siguientes cebadores:
Cebador directo MH234 (5 ' -CACCATGAAGCTGAATTGGGTCGC-3 ' ) (sec. con núm. de ident. : 145)
Cebador inverso MH235 (5 ' -TTACTCCAACTTGGCGCTG-3 ' ) (sec. con núm. de ident.: 146)
Los cebadores directos incluyeron cuatro nucleótidos adicionales (secuencias - CACC) en el extremo 5' para facilitar la clonación direccional en pENTR/D-TOPO (Invitrogen, Carlsbad, CA) . Para amplificar los marcos de lectura abiertos se usaron las siguientes condiciones de PCR: Etapa 1: 94 °C por 2 min. Etapa 2: 94 °C por 30 s. Etapa 3: 57 °C por 30 s. Etapa 4: 72 °C por 60 s. Las etapas 2, 3 y 4 se repitieron por 29 ciclos adicionales. Etapa 5: 72 °C por 2 min. El producto de PCR del marco de lectura abierto de Fv3C se purificó con el uso de un equipo de purificación por PCR Qiaquick (Qiagen) . El producto de PCR purificado se clonó inicialmente en el vector pENTR/D-TOPO, se transformó en células químicamente competentes TOP10 de E. coli (Invitrogen) y se sembró en placas de LA que contenían 50 ppm de canamicina. El ADN plasmídico se obtuvo a partir de los transformantes de E. coli con el uso de un equipo de preparación de plásmidos QlAspin (Qiagen) . La confirmación de secuencias para el ADN insertado en el vector pENTR/D-TOPO se obtuvo con el uso de cebadores directos e inversos M13 y los siguientes cebadores de secuenciación adicionales:
MH255 ( 5 ' -AAGCCAAGAGCTTTGTGTCC- 3 ' ) (sec. con núm. de ident . : 147)
MH256 ( 5 ' -TATGCACGAGCTCTACGCCT- 3 ' ) (sec. con núm. de ident . : 148)
MH257 ( 5 ' -ATGGTACCCTGGCTATGGCT- 3 ' ) (sec. con núm. de ident . : 149)
MH258 ( 5 ' - CGGTCACGGTCTATCTTGGT- 3 ' ) (sec. con núm. de ident . : 150)
Se recombinó un vector pENTR/D-TOPO con la secuencia de ADN correcta del marco de lectura abierto de Fv3C (Fig. 78) con el vector destino de pTrex6g (Fig. 79A) con el uso de la mezcla de reacción LR clonase® (Invitrogen) .
El producto de la reacción LR clonase® se transformó posteriormente en células químicamente competentes TOP10 de E. coli (Invitrogen) que, después, se sembraron en placas de LA que contenían 50 ppm de carbenicilina . El constructo pExpression resultante, pTrex6g/Fv3C, (Fig. 79B) contenía el marco de lectura abierto de Fv3C y el marcador de selección de acetolactato sintasa de T. reesei mutado (ais) . El ADN del constructo pExpression que contenía el marco de lectura abierto de Fv3C se aisló con el uso de un equipo miniprep Qiagen y se usó para la transformación biolística de esporas de T. reesei .
Se realizó la transformación biolística de T. reesei con el vector de expresión pTrex6g que contenía el marco de lectura abierto de Fv3C apropiado. Específicamente, una cepa de T. reesei, en donde se había eliminado cbhl , cbh2, egl , eg2, eg3 y bgll (es decir, la cepa con seis eliminaciones, ver, la publicación internacional WO núm. 05/001036) se transformó por bombardeo con helio con el uso de un sistema de suministro de partículas Biolistic® PDS-1000/he Particle Delivery System (Bio-Rad) según las instrucciones del fabricante (ver la patente de los Estados Unidos núm. 2006/0003408). Los transformantes se transfirieron a placas de selección de clorimurón etil nuevas. Los transformantes estables se inocularon en placas de microtitulación de filtro (Corning) que contenían 200 µ?/pocillo de un medio de glicina mínimo (que contenía 6.0 g/1 de glicina; 4.7 g/1 de (NH4)2S04; 5.0 g/1 de KH2P04 1.0 g/1 de MgS04»7H20; 33.0 g/1 de PIPPS, pH 5.5) con adición estéril posterior de una mezcla al ~2 % de glucosa/soforosa como la fuente de carbono, 10 mi /l de 100 g/1 de CaCl2, 2.5 mi /l de una solución de oligoelementos de T. reesei 400X que contenía: 175 g/1 de ácido cítrico anhidro; 200 g/1 de FeS04»7H20; 16 g/1 de ZnS04»7H20; 3.2 g/1 de CuS04«5H20; 1.4 g/1 de MnS04*H20; 0.8 g/1 de H3B03. Los transformantes se cultivaron en el cultivo líquido por cinco días. En un incubador a 28 °C. Las muestras de sobrenadante de la placa de microtitulación de filtro se recolectaron en un colector al vacío. Las muestras de sobrenadante se procesaron en geles NuPAGE al 4-12 % y se mancharon con el uso de la mancha Simply Blue (Invitrogen) .
6.17.2. B. Purificación de Fv3C
Fv3C, del concentrado del matraz de agitación, se dializó de la noche a la mañana contra un regulador TES 25 mM, pH 6.8. La solución enzimática dializada se cargó en una columna de dextrano y agarosa reticulada SEC HiLoad Superdex 200 Prep Grade (GE Healthcare) a un régimen de flujo de 1 mi /min, que se había equilibrado previamente con TES 25 mM, cloruro de sodio 0.1 M a pH 6.8. Se usó SDS-PAGE para identificar y confirmar la presencia de Fv3C en las fracciones de la separación en la columna SEC. Las fracciones que contenían Fv3C se agruparon y concentraron. Además, la purificación en SEC se usó para separar el Fv3C de contaminantes de masa con alto y bajo contenido molecular. La pureza de la preparación enzimática se determinó con el uso de tinción de azul Coomassie para SDS/PAGE. La SDS/PAGE mostró una sola banda importante a 97 kDa .
6.17.3. C. Traducción alternativa de Fv3C
Para la expresión del gen de Fv3C se usó la secuencia genómica que contenía el ORF tal como estaba anotado en la base de datos de Fusarium. (www . broadinstitute . org/annotation/
genome/fusarium_group/MultiHome .html) . La región codificante prevista contiene 3 intrones con el primer intrón que interrumpe la secuencia señal del péptido Fig. 80.
En su extremo 3 ' , el primer intrón contenía un ORF alternativo, estructurado con la secuencia madura que, además, se prevé codifica un péptido señal (Fig. 80) . En ambas traducciones, el sitio de inicio para la proteína madura (subrayada en la Fig. 81A) , según se determinó por análisis de secuencias N-terminal, comenzó corriente abajo de ambos sitios de el ivaje de péptidos señal supuestos (se indica por medio de flechas) . Se mostró que el Fv3C podría expresarse eficazmente por medio del uso de cualquiera de los ATG como los inicios supuestos de la traducción (Fig. 81B) .
6.18. Ejemplo 18: Actividad de ß-glucosidasa en celobiosa y CNPG En este experimento se probó las actividades de ß-glucosidasa de Bgll de T. reesei (Tr3A) , Bglu de A. niger (An3A) (Megazyme International Ireland Ltd. , Wicklow, Ireland) , Fv3C (sec. con núm. de ident.:60), Fv3D (sec. con núm. de ident.:58) y Pa3C (sec. con núm. de ident.:44) en celobiosa y CNPG. Bgll de T. reesei y Bglu de A. niger ( "An3A" ) eran proteínas purificadas. Fv3C, Fv3D y Pa3C no eran proteínas purificadas. Estaban expresadas en una cepa con seis eliminaciones de T. reesei (ver anterior) , pero aún estaban presentes las actividades de algunas proteínas de fondo. Como se muestra en la Fig. 13, se encontró que la Fv3C tenía aproximadamente el doble de la actividad de Bgll de G. reesei en celobiosa, mientras que Bglu de A. niger era aproximadamente 12 veces más activa que Bgll de G. reesei.
La actividad de Fv3C en el sustrato de CNPG era aproximadamente igual a la de Bgll de T. reesei, pero la actividad de Bglu de A. niger era aproximadamente 14 % de la actividad de Bglul de T. reesei (Fig. 13) . Fv3D, otra ß-glucosidasa de Fusarium verticillioides se expresó de manera similar a Fv3C, no tenía actividad de celobiasa medible, y aun así su actividad en CNPG fue aproximadamente 5 veces la de Bgll de G. reesei. Además, un homólogo de ß-glucosidasa de Podospora anserina producido de manera similar, Pa3C, no tenía actividad medible en un sustrato de CNPG o celobiosa. Estos estudios demuestran que las actividades de Fv3C en celobiosa y CNPG se debieron a la molécula propiamente la y no a las actividades de las proteínas de fondo.
6.19. Ejemplo 19: Sacarificación de Fv3C en varios sustratos de biomasa
6.19.1. A. Desempeño de la sacarificación de Fv3C en PASC
En este experimento se probó la capacidad de Bgll de T. reesei, Fv3C y varios homólogos de Fv3C para mejorar la sacarificación de PASC. Se añadió veinte (20) mi de cada ß-glucosidasa en una cantidad de 5 mg de proteína/g de celulosa en una carga de 10 mg de proteína/g de celulosa de celulasa completa de una cepa de bgll reducido de T. reesei, en una placa de 96 pocilios de HPLC. Se añadió ~ ciento cincuenta (150) mi de una solución de 0.7 % de sólidos de PASC en cada pocilio y las placas se cubrieron con sellos de placa de aluminio y se colocaron en un incubador a 50 °C por 2 h con agitación. La reacción se terminó por medio de la adición de 100 mi de un regulador de glicina 100 mM, pHIO en pocilios individuales. Después de mezclar bien, las placas se centrifugaron y los sobrenadantes se diluyeron 10 veces en otra placa de HPLC que contenía 100 mi de glicina 10 mM, pH 10 en pocilios individuales. Las concentraciones de azúcares solubles producidas se midieron con el uso de HPLC (Fig. 82) .
Se observó que la mezcla que contenia Fv3C produjo una proporción más alta de glucosa que la mezcla que contenía Bgll de T. reesei en las mismas condiciones. Esto indicó que Fv3C tiene una actividad de celobiasa mayor que Bgll de T. reesei (ver, además, la Fig. 13) . Fv3G, Pa3D y Pa3G no tuvieron un efecto observable en la hidrólisis de PASC que indicaba la falta de contribución del fondo de seis eliminaciones (en el cual se clonaron y expresaron los diversos homólogos de Fv3C) en la hidrólisis de PASC.
6.19.2. B. Desempeño de la sacarificación de Fv3C en el rastrojo de maíz pretratado con ácido diluido (PCS)
En este experimento, las capacidades de Bgll de T. reesei, Fv3C y varios homólogos de Fv3C para mejorar la sacarificación de PCS a 13 % de sólidos se probó con el uso del método descrito en el ensayo de sacarificación en placa de microtitulación (supra) . Para cada enzima probada, se añadió 5 mg de proteína/g de celulosa de ß-glucosidasa en 10 mg de proteína/g de celulosa de una celulasa completa derivada de una cepa con Bgll reducido de T. reesei .
Específicamente, se añadió 5 mg de proteína/g de celulosa de cada ß-glucosidasa (Bgll, Fv3C y homólogos) en 10 mg de proteína/g de celulosa de una celulasa completa derivada de una cepa reducida en Bgll de T. reesei o en 8 mg de proteína/g de celulosa de una mezcla de hemicelulasa purificada (los componentes de la cual se indican en la Fig. 14) . El % de conversión de glucano se midió después de que las mezclas enzimáticas se incubaron con el sustrato por 2 d a 50 °C.
Los resultados se muestran en la Fig- 83. El Fv3C impartió un beneficio evidente en términos de % de conversión de glucano en comparación con Bgll de T. reesei. Además, el Fv3C promovió una producción de glucosa y azúcar total mayor que Bgll de T. reesei.
Los resultados indicaron una contribución limitada o nula de las proteínas de fondo de la célula huésped.
6.19.3. C. Desempeño de la sacarificación de Fv3C en la mazorca de maíz pretratada con amoníaco
En este experimento se probó la capacidad de Bgll de T. reesei, Fv3C y Bglu de A. niger (An3A) para mejorar la sacarificación de la mazorca de maíz pretratada con amoniaco a 20 % de sólidos de conformidad con el método descrito en el ensayo de sacarificación en placas de microtitulación (supra) . Específicamente, se añadió 5 mg de proteína/g de celulosa de ß-glucosidasas (por ejemplo, Bgll de T. reesei, Fv3C y homólogos) en el sustrato de la mazorca de maíz pretratada con amoníaco diluido y se añadió, además, 10 mg de proteína/g de celulosa de celulasa completa derivada de una cepa de Bgll reducido de T. reesei. Además, se añadió en la mezcla 8 mg de proteína/g de celulosa de una mezcla de hemicelulasa purificada (Fig. 14) que contenía Xyn3 , Fv3A, Fv43D y Fv51A. El % de conversión de glucano se midió después de que las mezclas enzimáticas se incubaron con el sustrato por 2 d a 50 °C.
Los resultados se muestran en la Fig. 84. Se observó que el desempeño de Fv3C fue mejor que las otras ß-glucosidasas , que incluyen Bgll de G. reesei (Tr3A) . Además, se observó que las adiciones de Bglu deA. niger (An3A) en la mezcla enzimática hasta un nivel mayor que 2.5 mg/g de celulosa impidieron la sacarificación.
6.19.4. D. Desempeño de la sacarificación de Fv3C en la mazorca de maíz pretratada con hidróxido de sodio (NaOH)
Para probar el efecto de varios métodos de tratamiento previo de sustratos en el desempeño de Fv3C se midió la capacidad de Bgll de T. reesei (mencionada, además, como Tr3A) , Fv3C y Bglu de A. niger (An3A) para mejorar la sacarificación de la mazorca de maíz pretratada con NaOH a 12 % de sólidos de conformidad con el método descrito en el ensayo de sacarificación en placa de microtitulación (supra) . El tratamiento previo de la mazorca de maíz con hidróxido de sodio se realizó de la siguiente manera: Se trituró 1000 g de mazorca de maíz hasta un tamaño de aproximadamente 2 mm y, después, se suspendió en 4 1 de solución de hidróxido de sodio acuosa al 5 % y se calentó hasta 110 °C por 16 h. El líquido marrón oscuro se filtró en caliente bajo vacío en laboratorio. El residuo sólido en el filtro se lavó con agua hasta que no se eluyó más color. El sólido se secó bajo vacío en laboratorio por 24 h. Cien (100) g de la muestra se suspendió en 700 mi de agua y se agitó. El pH de la solución se midió en 11.2. Se añadió solución de ácido cítrico acuosa (10 %) para reducir el pH hasta 5.0 y la suspensión se agitó por 30 min. Después, el sólido se filtró, se lavó con agua y se secó bajo vacío a temperatura ambiente por 24 h. Después del secado se obtuvo 86.2 g de biomasa enriquecida con polisacáridos . El contenido de humedad de este material fue de aproximadamente 7.3 % en peso. Se midió el contenido total de glucano, xilano, lignina y carbohidratos antes y después del tratamiento con hidróxido de sodio, según se determinó por los métodos NREL para el análisis de carbohidratos. El tratamiento previo produjo la deslignificación de la biomasa y al mismo tiempo mantuvo una relación de peso glucano/xilano dentro del 15 % de la relación para la biomasa no tratada.
Se añadió cinco (5) mg de proteína/g de celulosa de ß-glucosidasas (Fv3C y homólogos) en el sustrato tratado previamente con NaOH con 8.7 mg de proteína/g de celulosa de una celulasa completa derivada de una cepa integrada de T. reesei H3A seleccionada específicamente para su expresión de bajo nivel de Bgll ("la cepa H3A-5") . No se añadió hemicelulasas purificadas adicionales (por ejemplo, la mezcla de la Fig. 14) en el fondo de celulasa completa en este experimento. El % de conversión de glucano se midió después de que las mezclas enzimáticas se incubaron con el sustrato por 2 d a 50 ° C
Los resultados se muestran en la Fig. 85. Se observó que el desempeño de Fv3C fue un poco mejor que las otras ß-glucosidasas , que incluyen Bgll de G. reesei (Tr3A) , An3A y Te3A. Además, se observó que las adiciones de Bglu de A. niger (An3A) hasta un nivel mayor que 4 mg/g de celulosa produjo una menor conversión.
6.19.5. E. Desempeño de la sacarificación de Fv3C en césped de pradera pretratado con amoníaco diluido
En este experimento se probó la capacidad de Bgll de T. reesei, Fv3C y Bglu de A. niger (An3A) para mejorar la sacarificación de césped de pradera pretratado con amoniaco diluido a 17 % de sólidos de conformidad con el método descrito en el ensayo de sacarificación en placas de microtitulación {supra) . El césped de pradera pretratado con amoníaco diluido se obtuvo de DuPont . La composición se determinó con el uso del procedimiento de National Renewable Energy Laboratory (NREL) , (NREL LAP-002) disponible en: www.nrel . gov/biomass/analytical_procedures .html .
La composición basada en peso seco era glucano (36.82 %) , xilano (26.09 %) , arabinano (3.51 %) , ácido de lignina insoluble (24.7 %) y acetilo (2.98 %) . Esta materia prima se trituró con cuchillo de modo que pasara por un tamiz de 1 rara. El material triturado se pretrató a -160 °C por 90 min en presencia de 6 % en peso (de sólidos secos) de amoniaco. La carga inicial de sólidos fue de aproximadamente 50 % de materia seca. La biomasa tratada se almacenó a 4 °C antes del uso.
En este experimento se añadió 5 mg de proteína/g de celulosa de ß-glucosidasas (por ejemplo, Bgll de T. reesei, Fv3C y homólogos) en el césped de pradera pretratado con amoníaco diluido en presencia de 10 mg de proteína/g de celulosa de una celulasa completa derivada de una cepa integrada de T. reesei (H3A) seleccionada para la expresión baja de ß-glucosidasa . El % de conversión de glucano se midió después de incubar las mezclas enzimáticas con el sustrato por 2 d a 50 °C y los resultados se indican en la Fig. 86.
El desempeño de Fv3C fue mejor que el de Bgll de G. reesei y el Bglu de A. niger con el sustrato de césped de pradera .
6.19.6. F. Desempeño de la sacarificación de Fv3C en rastrojo de maíz AFEX
En este experimento se probó la capacidad de Bgll de T. reesei, Fv3C y Bglu de A. niger para mejorar la sacarificación de rastrojo de maíz AFEX a 14 % de sólidos de conformidad con el método descrito en el ensayo de sacarificación en placas de microtitulación (supra) . El rastrojo de maíz tratado previamente con AFEX se obtuvo de Michigan Biotechnology Institute International (MBI) . La composición del rastrojo de maíz se determinó con el procedimiento de National Renewable Energy Laboratory (NREL) LAP-002 , www.nrel . gov/biomass/analytical_procedures . html .
La composición basada en peso seco era glucano (31.7 %) , xilano (19.1 %) , galactana (1.83 %) y arabinano (3.4 %) . Como materia prima se usó AFEX tratado en un reactor a presión de 5 galones (Parr) a 90 °C, 60·% de contenido de humedad, relación entre la carga de biomasa y amoniaco 1:1 y un periodo de 30 min. La biomasa tratada se extrajo del reactor y se dejó en una campana de humo para evaporar el amoníaco residual. La biomasa tratada se almacenó a 4 °C antes del uso.
En este experimento se añadió 5 mg de proteína/g de celulosa de ß-glucosidasas (Fv3C y homólogos) en el sustrato pretratado en presencia de 10 mg de proteína/g de celulosa de celulasa completa derivada de una cepa de T. reesei integrada con baja expresión de ß-glucosidasa . El % de conversión de glucano se midió después de incubar las mezclas enzimáticas con el sustrato por 2 d a 50 °C y los resultados se indicaron en la Fig. 87.
El desempeño de Fv3C fue mejor que el de Bgll de T. reesei en la conversión de glucano. Además, se observó que 10 mg/g de celulosa de Fv3C y 10 mg/g de celulosa de celulasa completa de H3A en las condiciones anteriores produjo una conversión de glucano completa o aparentemente completa. En niveles menores que 1 mg/g de celulosa, la Bglu de A. niger (An3A) aparentemente produjo conversiones de glucosa y glucano total mayores que las de Fv3C y Bgll de G. reesei, pero en niveles mayores que 2.5 mg/g de celulosa, se observó una mayor conversión de glucosa y glucano por medio de Fv3C y Bgll de T. reesei en comparación con Bglu de A. niger (An3A) . 6.20. Ejemplo 20: Optimización de la relación entre Fv3C y celulasa completa para la sacarificación de la mazorca de maíz pretratada con amoníaco
En este experimento, se modificó la relación entre Fv3C y celulasa completa para determinar la relación óptima entre Fv3C y celulasa completa en una composición de hemicelulasa . La mazorca de maíz pretratada con amoníaco se usó como sustrato. La relación entre ß-glucosidasas (por ejemplo, Bgll de T. reesei (Tr3A) , Fv3C, Bglu de A. niger) y la celulasa completa derivada de la cepa integrada de T. reesei (H3A) se modificó de 0 a 50 % en la composición de hemicelulasa . Las mezclas se añadieron para hidrolizar la mazorca de maíz pretratada con amoníaco a 20 % de sólidos y una cantidad de 20 mg de proteína/g de celulosa. Los resultados se muestran en las Figs . 88A-88C.
Se observó una relación óptima amplia entre Bgll de T. reesei (Tr3A) y la celulasa completa; la relación se centró en aproximadamente 10 % y la mezcla al 50 % produjo un desempeño similar al obtenido con la misma carga de celulasa completa sola. En contraposición, Bglu de A. niger (o An3A) alcanzó el nivel óptimo a aproximadamente 5 % y el pico fue más pronunciado. En el nivel de pico/óptimo, Bglu de A. niger (o An3A) produjo una conversión mayor que la mezcla óptima que comprende Bgll de T. reesei (Tr3A) .
La relación óptima entre el Fv3C y la celulasa completa se determinó en aproximadamente 25 % y la mezcla produjo más de 96 % de conversión de glucano a 20 mg de proteína total/g de celulosa. Por lo tanto, 25 % de las enzimas en la celulasa completa se pueden reemplazar con una sola enzima, Fv3C, lo que produce un desempeño mejorado de la sacarificación.
6.21. Ejemplo 21: Sacarificación de la mazorca de maíz pretratada con amoníaco por medio de distintas mezclas enzimáticas
Se comparó una mezcla de 25 % de Fv3C/75 % de celulasa completa de la cepa integrada de T. reesei (H3A) con otras mezclas de celulasa de alto desempeño en un experimento de respuesta a dosis. La celulasa completa de la cepa integrada de T. reesei (H3A) sola, una mezcla de 25 % de Fv3C/75 % de celulasa completa de la cepa integrada de T. reesei (H3A) y Accellerase® 1500 + xilanasa Multifect® se compararon en función del desempeño de sacarificación en la mazorca de maíz pretratada con amoníaco diluido a 20 % de sólidos. Las mezclas enzimáticas se dosificaron de 2.5 a 40 mg de proteína/g de celulosa en la reacción. Los resultados se muestran en la Fig. 89.
La mezcla de 25 % de Fv3C/75 % de celulasa completa de la cepa integrada de T. reesei (H3A) exhibió un desempeño drásticamente mejor que la mezcla de Accellerase® 1500 + xilanasa Multifect® y una mejora considerable con respecto a la celulasa completa de la cepa integrada de T. reesei (H3A) . La dosis necesaria para 70, 80 o 90 % de conversión de glucano de cada mezcla de enzimas se enumera en la Fig. 15. A una conversión de glucano del 70 %, la mezcla de 25 % de Fv3C/75 % de celulasa completa de la cepa integrada de T. reesei (H3A) produjo una reducción de 3.2 veces cuando se comparó con la mezcla de Accellerase® 1500 + xilanasa Multifect®. A una conversión de glucano del 70, 80 o 90 %, la mezcla de 25 % de Fv3C/75 % de celulasa completa de la cepa integrada de T. reesei (H3A) requirió aproximadamente 1.8 veces menos enzima que la celulasa completa de la cepa integrada de T. reesei (H3A) sola.
6.22. Ejemplo 22: Expresión de Fv3C en la cepa de Aspergillus niger Para expresar Fv3C en A. niger, el plásmido pEntry-Fv3C se recombinó con el vector de destino pRAXdest2, tal como se describe en la patente de los Estados Unidos núm. 7459299 con el uso de la reacción de recombinación Gateway LR (Invitrogen) . El plásmido de expresión contenía la secuencia genómica de Fv3C bajo el control del promotor y terminador de glucoamilasa de A. niger, el gen de A. nidulans pyrG como un marcador selectivo y la secuencia de A. nidulans amal para la replicación autónoma en células fúngicas. Los productos de recombinación generados se transformaron en E. coli Max Efficiency DH5 (Invitrogen) y los clones que contenían el constructo de expresión pRAX2-Fv3C (Fig. 90A) se seleccionaron en placas de agar 2xYT preparadas con 16 g/1 de Bacto triptona (Difco) , 10 g/1 de extracto de levadura Bacto (Difco) , 5 g/1 de NaCl, 16 g/1 de Bacto agar (Difco) y 100 yg/ml de ampicilina.
Aproximadamente 50-100 mg del plásmido de expresión se transformó en una cepa de A. niger var awamori [ver la patente de los Estados Unidos núm. 7459299) . El gen de glucoamilasa endógeno glaA se eliminó de esta cepa y se realizó una mutación en el gen pyrG que permitió la selección de transformantes para la prototrofia de uridina. Se cultivó transformantes de A. niger en medio MM (el mismo medio mínimo que se usó para la transformación de T. reesei, pero se usó NH4C1 10 mM en lugar de acetamida como una fuente de nitrógeno) por 4-5 d a 37 °C y una población total de esporas (aproximadamente 106 esporas/ml) de placas de transformación diferentes para inocular matraces de agitación que contenían medio de producción (por 1 1) : 12 g de triptona; 8 g de soyton; 15 g de (NH4)2S04; 12.1 g de NaH2P04xH20; 2.19 g de Na2HP04x2H20; 1 g de MgS04x7H20; 1 mi de Tween 80; 150 g de maltosa; pH 5.8. Después de 3 d de fermentación a 30 °C y agitación a 200 rpm, la expresión de Fv3C en transformantes se confirmó por SDS-PAGE.
6.23. Ejemplo 23: Construcción y análisis para determinar cepas integradas de T. reesei
6.23.1. A. Generación de la cepa CB#201
Una cepa mutante de T. reesei derivada de RL-P37 (Sheir- Neiss, G. and B. S. Montenecourt , Appl. Microbiol .
Biotechnol . 1984, 20:46-53) y seleccionada para una producción alta de celulasa se cotransformó con tres genes de hemicelulasa (Fv3A, Fv43D y Fv51A) de F. verticillioides . Se cotransformaron por electroporación en tres combinaciones diferentes que incluyeron el promotor de egll de T. reesei (Pegll) , el promotor de cbh.2 de T. reesei {Vcbh.2) o el promotor de cbhl de T. reesei (Pcbhl) y el marcador de acetolactato sintasa (ais) (patente de los Estados Unidos núm. US2007/020484, patente núm. O 2009/114380). Las tres combinaciones fueron las siguientes: 1) Pegll-fv52a, Vcbh2-fv43d-als y Pegll-fv3a, 2) Pcb l-marcadorfV3a-als, Pegll -fv51a y Pcbh2-fv43d, y 3) Pegll- fv51a, Pdbhl- fv43d-als y Pegll- fv3a . Después de la electroporación, las mezclas de transformación se sembraron en placas sobre agar selectivo que contenía clorimurón etilo. Después, los transformantes se cultivaron en placas de microtitulación tal como se describe en la patente WO núm. /2009/114380. Los transformantes resultantes se analizaron en ensayos de desempeño de sacarificación de mazorca de maíz en MTP como se describió anteriormente. El análisis permitió la identificación de una cepa (CB #201) que mostró niveles altos de conversión de glucosa y xilosa.
Para amplificar los casetes de expresión se usaron los siguientes pares de cebadores:
par de cebadores de Pegll-fv51a:
SK1298 51 -GTAGTTATGCGCATGCTAGAC-3 ' (sec. con núm. de ident . : 151)
SK1289 5 ' -GTGGCTAGAAGATATCCAACAC -3' (sec. con núm. de ident . : 152)
par de cebadores de Pcbh2-fv43d-als :
SK14385 ' -CGTCTAACTCGAACATCTGC-3 ' (sec. con núm. de ident. : 153)
SK1299 5 ' -GTAgcggccgcCTCATCTCATCTCATCCATCC-3 ' (sec. con núm. de ident . : 154)
par de cebadores de Pegll-fv3a
SK1298 51 -GTAGTTATGCGCATGCTAGAC- 3 ' (sec. con núm. de ident. :155)
SK822 - 5 ' - CACGAAGAGCGGCGATTC- 3 ' (sec. con núm. de ident . : 156)
par de cebadores de Pcbhl- fv3a-als :
SK1335 5'- GCAACGGCAAAGCCCCACTTC- 3 ' (sec. con núm. de ident. :157)
SK1299 5'- GTAgcggccgcCTCATCTCATCTCATCCATCC-3 ' (sec. con núm. de ident . : 158)
par de cebadores de ~Pcbh2-fv43d:
SK1438 5'- CGTCTAACTCGAACATCTGC-3 ' (sec. con núm. de ident . : 159)
SK1449 5'- CATggcgcgccCAACTGCCCGTTCTGTAGC- 3 ' (sec. con núm. de ident . : 160)
par de cebadores de Pcbhl-fv43d-als :
SK 1335 5'- GCAACGGCAAAGCCCCACTTC- 3 ' (sec. con núm. de ident. : 157)
SK1299 5'- GTAgcggccgcCTCATCTCATCTCATCCATCC -3' (sec. con núm. de ident. :161)
Los casetes de expresión se amplificaron a partir de los plásmidos que se muestran en las Figs . 62A-62G.
6.23.2 B. Transformación de la cepa CB#201
La cepa CB#201 de T. reesei se transformó aun más por electroporación (patente núm. WO 2009114380) con fragmentos de PCR que contenían egé de T. reesei amplificado con los cebadores SK1597 y SK1603, xyn3 de T. reesei amplificado con los cebadores SK1438 y SK1603 y una quimera de Fv3C ß-glucosidasa de F. verticillioides {fab) amplificada con los cebadores RPG159 y RPG163 (ver, más abajo en el Ejemplo 23) . Para las transformaciones se usó como marcador el gen amdS de A. nidulans que estaba contenido en el cásete de expresión amplificado por los cebadores RPG159 y RPG163. Los transformantes se cultivaron en medio selectivo que contenía acetamida (patente núm. WO 2009114380) . Los transformantes que mostraban una morfología estable se cultivaron en placas de microtitulación para la expresión tal como se describe en la patente núm. WO 2009114380. Los sobrenadantes del cultivo se analizaron mediante por SDS-PAGE y ensayo de cNPG (descritos anteriormente) . Los transformantes seleccionados se analizaron para determinar el desempeño en los ensayos de sacarificación de la mazorca de maíz (Sección F, más abajo) .
Para amplificar los casetes de expresión para la transformación de T. reesei se usaron los siguientes pares de cebadores :
par de cebadores de Pegll-Tr egl4-terminador de chhl:
SK1597 5' - GTAGTTATGCGCATGCTAGACTGCTCC-3 ' (sec. con núm. de ident . : 162)
SK1603 5' - GCAGGCCGCATCTCCAGTGAAAG-3 ' (sec. con núm. de ident . : 163)
par de cebadores de Pcbh2-Tr xyn3 -terminador de cbhl:
SK1438 5' - CGTCTAACTCGAACATCTGC -3' (sec. con núm. de ident. : 164)
SK1603 5' - GCAGGCCGCATCTCCAGTGAAAG -3' (sec. con núm. de ident. :165)
par de cebadores de Pc.b. l-fa/3-terminador de cbhl-amdS:
RPG159 5' - AGTTGTGAAGTCGGTAATCCCGCTGTAT -3' (sec. con núm. de ident . : 166)
RPG163 5' - TCGTAGCATGGCATGGTCACTTCA -3' (sec. con núm. de ident. : 167)
6.23.3. C. Construcción del cásete de expresión de
endoxilanasa (Xyn3)
El gen de endoxilanasa xyn3 de T. reesei nativo (núm. de registro en GenBank: BAA89465.2) se amplificó por PCR a partir de una muestra de ADN genómico extraída de una cepa de
T. reesei con el uso de los cebadores xyn3F-2 y xyn3R-2.
Cebador directo (xyn3F-2): 5'- CACCATGAAAGCAAACGTCATCTTGTGCCTCCTGG-3 ' (sec . con núm. de ident.: 168) (en donde los residuos de CACC que aparecen subrayados se usaron para facilitar la clonación en pENTR™/D- TOPO®)
Cebador inverso (xyn3R-2): 5'- CTATTGTAAGATGCCAACAATGCTGTTATATG CCGGCTTGGGG-3 ' (sec. con núm. de ident . : 169)
Los fragmentos de la PCR resultantes se clonaron en el vecctor Gateway® pENTR™/D-TOPO® y se transformaron en células químicamente compatibles de E. coli One Shot® TOP10 (Invitrogen) de modo que se obtuvo el vector intermedio, pENTR/Xyn3. Se determinó la secuencia de nucleótidos del ADN insertado .
El vector pENTR/Xyn3 con la secuencia de xyn3 correcta se recombinó con pTrex3g con el uso del protocolo de reacción LR clonase® producido por Invitrogen. La mezcla de reacción LR clonase se transformó en células químicamente competentes de E. coli One Shot® TOP10 (Invitrogen) de modo que se obtuvo el vector de expresión, pTrex3g/Xyn3. El vector contiene, además, el gen amdS de Aspergillus nidulans que codifica acetamidasa, como un marcador seleccionable para la transformación de T. reesei. El QRF de xyn3 , el terminador de cbhl y la secuencia de amdS se amplificaron con el uso de los cebadores xyn3-F-S0E y SK822. El promotor de cbh2 se amplificó con los cebadores SK1019 y cbh2P-R-SOE a partir de ADN genómico de una cepa silvestre de T. reesei QM6A. La PCR de fusión posterior se realizó en los dos fragmentos con los cebadores SK1019 y SK822 para obtener el cásete que consistía de Pcbh2-xyn3 y el terminador de cbhl. Después, este producto de la PCR de fusión se clonó en pCR-Blunt- II -TOPO (Invitrogen) y se transformó en células químicamente competentes de E. coli One Shot® TOP10 (Invitrogen), de modo que se obtuvo el vector de expresión pCR-Blunt II-T0P0/Pcjbh2-xyn3-terminador de cbhl (ver la Fig. 103B) . Se confirmó la secuencia de nucleótidos del ADN insertado.
Cebador directo (xyn3-F-S0E) 5' -AGATCACCCTCTGTGTATTGCACCATGAAA GCAAACGTCA - 3' (sec. con núm. de ident . : 170)
Cebador inverso (cbh2P-R-SOE) 5'
TGACGTTTGCTTTCATGGTGCAATACACAGAG GGTGATCT -3' (sec. con núm. de ident . : 171)
Cebador directo (SK1019) : 5 ' -GAGTTGTGAAGTCGGTAATCC-3 ' (sec. con núm. de ident. :172)
Cebador inverso (SK822) : 5 ' -CACGAAGAGCGGCGATTC-3 ' (sec . con núm. de ident.: 173)
6.23.4. D. Construcción del cásete de expresión de
endoglucanasa de T. reesei Eg4
El gen de endoglucanasa de T. reesei eg4 (núm. de registro en GenBank ADJ57703.1) se amplificó por PCR a partir de una muestra de ADN genómico extraída de una cepa de T. reesei con el uso de los cebadores SK1430 y SK1431.
Cebador directo (SK1430) : 5' - CACCATGATCCAGAAGCTTTCCAAC -3'
(sec. con núm. de ident.: 174), en donde los "CACC" que aparecen subrayados se usaron para facilitar la clonación en pENTR™/D-TOPO® .
Cebador inverso (SK1431) : 5' - CTAGTTAAGGCACTGGGCGTA -3' (sec. con núm. de ident. :175)
Los fragmentos de la PCR resultantes se clonaron en el vector de entrada Gateway ® pENTR™/D-TOPO® y se transformaron en células químicamente compatibles de E. coli One Shot® TOP10 (Invitrogen) de modo que se obtuvo el vector intermedio, pENTR/Egl4. Se confirmó la secuencia de nucleótidos del ADN insertado.
El vector pENTR/EG4 con la secuencia de egl4 correcta se recombinó con pTrex9gM con el uso del protocolo de reacción LR clonase® producido por Invitrogen. La mezcla de reacción LR clonase se transformó en células químicamente compatibles de E. coli One Shot® TOP10 (Invitrogen) , de modo que se obtuvo el vector de expresión, pTrex9gM/Egl4. El vector contenía, además, el gen sucA de A. niger que codifica sucrasa, como un marcador seleccionable para la t ansformación de T. reesei . El ORF de egl4, el terminador de cbhl y la secuencia de sucA se amplificaron con el uso de los cebadores SK1430 y SK1432. El promotor de egll se amplificó por PCR a partir de ADN genómico de la cepa silvestre de T. reesei QM6A con el uso de los cebadores SK1236 y SK1433. Estos dos fragmentos de ADN se fusionaron posteriormente juntos en una reacción de PCR de fusión con el uso de los cebadores SK1298 y SK1432. El fragmento de PCR de fusión resultante se clonó en el vector pCR-Blunt II-TOPO (Invitrogen) de modo que se formó TOPO Blunt II-TOPO w/Pegll-egl4-sucA (ver la Fig. 103C) y se transformó en células químicamente competentes de E. coli One Shot® TOP10 (Invitrogen) . Se confirmó la secuencia de nucleótidos del ADN insertado.
Cebador directo (SK1236) :5' - CATGCGATCGCGACGTTTTGGTCAGGTCG -3' (sec. con núm. de ident.:176)
Cebador inverso (SK1433): 5'
GTTGGAAAGCTTCTGGATCATGGTGTGGGACAACAA GAAGG -3' (sec. con núm. de ident . :177)
Cebador directo (SK1430) : 5' - CACCATGATCCAGAAGCTTTCCAAC - 3' (sec. con núm. de ident. :178), en donde los residuos que aparecen subrayados se usaron para facilitar la clonación en pENTR™/D-TOPO®)
Cebador inverso (SK1432) : 5' - GCTCAGTATCAACCACTAAGC-3 ' (sec. con núm. de ident.: 179)
Cebador directo (SKI298): 5' - GTAGTTATGCGCATGCTAGAC-3 ' (sec. con núm. de ident. :180)
El cásete de expresión se amplificó por PCR con los cebadores SK1597 y SK1603 para generar un producto para la transformación de T. reesei.
Cebador directo (SK1597) : 5' - GTAGTTATGCGCATGCTAGACTGCTCC -3' (sec. con núm. de ident. :181)
Cebador inverso (SK1603) : 5' - GCAGGCCGCATCTCCAGTGAAAG - 3' (sec. con núm. de ident. :182)
6.23.5. E. Construcción del vector de expresión Fv3C/Te3A/T. reesei Bgl3 del polipéptido quimérico de ß-glucosidasa
En base a los datos estructurales para Fv3C y un modelo previsto para Bgl3, la fusión entre las dos moléculas se diseñó en la posición de aminoácidos (aa) 692 del Fv3C de longitud completa. Es decir, los primeros 1 a 691 residuos de aa de Fv3C se fusionaron con los aa 668-874 de la región de Bgl3. La molécula quimérica se construyó con un método de PCR de fusión. Los clones de entrada de las secuencias codificantes de Fv3C y Bgl3 genómicos se usaron como plantillas para PCR. Los dos clones de entrada se construyeron en el vector pDonor221 (Invitrogen, Carlsbad, CA, Estados Unidos) de conformidad con las recomendaciones del proveedor. El producto de fusión se ensambló en dos etapas. Primero, la secuencia específica de Fv3C se amplificó en una reacción de PCR con el uso de un clon de pEntry Fv3C como la plantilla y oligonucleótidos específicos:
pDonor directo 5' GCTAGCATGGATGTTTTCCCAGTCACGACGTTGTA AAACGACGGC-3 ' (sec. con núm. de ident . : 183 ) ; y
Fv3C/Bgl3 inverso 5' GGAGGTTGGAGAACTTGAACGTCGACCAAGATAGACC GTGACCGAACTCGTAG-3 ' (sec. con núm. de ident.: 184)
En una reacción similar, la parte terminal 3' de Bgl3 se amplificó a partir de un vector pENTR Bgl3 con los oligonucleótidos :
pDonor inverso : 5 ' - TGCCAGGAAACAGCTATGACCATGTAATACGACTCAC TATAGG-3 ' (sec. con núm. de ident.: 185); y
Fv3C/Bgl3 directo: 5' -CTACGAGTTCGGTCACGGTCTATCTTGGTCGACGTTC AAGTTCTCCAACCTCC-3 ' (sec. con núm. de ident. :186).
En la segunda etapa se añadió cantidades equimolares de cada producto de PCR individual (aproximadamente 1 mi y 0.2 mi de las reacciones de PCR iniciales, respectivamente) como plantillas para una reacción de PCR de fusión posterior con el uso de un conjunto de cebadores anidados:
Att Ll dir 5' TAAGCTCGGGCCCCAAATAATGATTTTATTTTGACTGATAGT-3 ' (sec. con núm. de ident.:187); y
AttL2 inv 5 ' GGGATATCAGCTGGATGGCAAATAATGATTTTATTTTGACTGATA-3 ' (sec. con núm. de ident.:188)
Todas las reacciones de PCR se realizaron con el uso de una ADN-polimerasa Phusion de alta fidelidad (Finnzymes OY, Espoo, Finlandia) en condiciones estándar recomendadas por el proveedor. El producto de PCR final fusionado contenía los sitios de recombinación attLl, attL2 específicos de Gateway intactos en ambos extremos lo que permitió la clonación directa en un vector destino final a través de una reacción de recombinación LR Gateway (Invitrogen, Carlsbad, CA, Estados Unidos) .
Después de la separación del fragmento de ADN específico en un gel de agarosa al 0.8 %, este se purificó con un equipo de limpieza de extracto de PCR Nucleospin® (Macherey-Nagel GmbH & co. KG, Duren, Alemania) y se recombinó 100 ng con el vector destino pTTT-pyrG13 (ver la publicación de solicitud de patente internacional núm. O 2009/048488) con el uso de la mezcla enzimática LR clonase™ II de conformidad con el protocolo de Invitrogen. Los productos de recombinación generados se transformaron a E. coli Max Efficiency DH5OÍ, tal como describe el proveedor (Invitrogen) y los clones que contenían la fusión del constructo de expresión pTTT-pyrG13 -Fv3C/Bgl3 (Fig. 100) con la ß-glucosidasa quimérica se seleccionaron en placas de agar 2xYT (16 g/1 de Bacto triptona (Difco, Estados Unidos) , 10 g/1 de extracto de levadura Bacto (Difco, Estados Unidos), 5 g/1 de NaCl, 16 g/1 de Bacto agar (Difco, Estados Unidos) ) con 100 µg/ml de ampicilina. Después del cultivo de cultivos bacterianos en medio 2xYT con 100 µg/ml de ampicilina, los plásmidos aislados se expusieron a análisis de restricción con enzimas de restricción Bgll o EcoRV y la región específica de Fv3C/Bgl3 ("FB") se secuenció con el uso de un analizador de secuencias ABI3100 (Applied Biosystems) .
Dos sitios de N-glicosilación, S725N y S751N, se introdujeron en la parte derivada de Bgl3 de la quimera. Las posiciones equivalentes se glicosilan en Fv3C, pero no en Bgl3. Las mutaciones de glicosilación se introdujeron en la cadena principal de Fv3C/Bgl3 (FB) prácticamente a través del mismo método de fusión por PCR con la excepción de que el plásmido de fusión pTTT-pyrG13 -Fv3C/Bgl3 (Fig. 100) se usó como una plantilla para las primeras reacciones de PCR, tal como se describió anteriormente. Un producto de PCR se generó con el uso de los cebadores:
Pr Cbhl directo: 5' CGGAATGAGCTAGTAGGCAAAGTCAGC-3 ' (sec. con núm. de ident . : 189) ; y
725/751 inverso: 5'- CTCCTTGATGCGGCGAACGTTCTTGGGGAAGCCATAGTCCTTAAG GTTCTTGCTGAAGTTGCCCAGAGAG-3 ' (sec. con núm. de ident.: 190)
El segundo fragmento de PCR se amplificó con el uso de un conjunto de oligonucleótidos :
725/751 directo: 5'
GGCTTCCCCAAGAACGTTCGCCGCATCAAGGAGTTTATCTACCCCTA CCTGAACACCACTACCTC-3' (sec. con núm. de ident .: 191) ; y
Ter Cbhl inverso: 5' GATACACGAAGAGCGGCGATTCTACGG-3 ' (sec. con núm. de ident.: 192)
Por último, ambos fragmentos de PCR obtenidos se fusionaron con el uso de los cebadores Pr Cbhl directo y Ter Cbhl inverso, tal como se describió anteriormente. El producto de fusión con dos mutaciones de glicosilación introducidas contenía los sitios attBl y attB2 lo que permitió la recombinación con el vector pDonor221 con el uso de la reacción de recombinación Gateway BP (Invitrogen, Carlsbad, CA, Estados Unidos) de conformidad con la recomendación del proveedor. Las colonias de E. coli DH5a con clones pENTR que contenían la ß-glucosidasa quimérica de Fv3C/Bgl3 con dos mutaciones extra glicosilación S725N S751N se seleccionaron en placas de agar 2xYT con 50 µg/ml de canamicina. Los plásmidos aislados de células bacterianas se analizaron por su patrón de digestión de restricción para determinar la presencia del inserto y las mutaciones se controlaron por medio de análisis de secuencias con el uso de un analizador de secuencias ABI3100 (Applied Biosystems) . Esto resultó en el clon pEntry-Fv3C/Bgl3/S725N S751N que se usó para modificaciones adicionales.
Los residuos de aminoácidos 665 a 683 del híbrido Fv3C/Bgl3 anterior se reemplazaron con una secuencia correspondiente de Talaromyces emersonii lo que produjo un Fv3C/Te3A/Bgl3/S713N S739N de fusión/quimera (para el plásmido usado, ver la Fig. 103A) . Para introducir la secuencia de ß-glucosidasa de T. emersonii , mencionada como Te3A (sec. con núm. de ident.: 66) se realizaron las primeras reacciones de PCR con el uso de los siguientes conjuntos de cebadores :
Conjunto 1:
pDonor directo: 5' - GCTAGCATGGATGTTTTCCCAGTCACGACGTTGTAAA ACGACGGC-3' (sec. con núm. de ident. :193); y
ABG2 inverso: 5'- GATAGACCGTGACCGAACTCGTAGATAGGCGTGATGTTGTAC TTGTCGAAGTGACGGTAGTCGATGAAGAC-3 ' (sec. con núm. de ident. : 194) ;
Conjunto 2 :
ABG2 directo: 5'- GTCTTCATCGACTACCGTCACTTCGACAAGTACAACATCACGC CTATCTACGAGTTCGGTCACGGTCTATC- 3 ' (sec. con núm. de ident . : 195) ; y
pDonor inverso: 5' TGCCAGGAAACAGCTATGACCATGTAATACGACTCACTA TAGG-3' (sec. con núm. de ident.:196)
6.23.6. F. Procedimiento de análisis para la biomasa
El análisis de transformantes para determinar el desempeño de la biomasa se realizó en placas de microtitulacion con el uso de la mazorca de maíz pretratada con amoníaco diluido. La mazorca de maíz pretratada se suspendió con agua y se ajustó hasta pH 5.0 con ácido sulfúrico hasta obtener 8.7 % de celulosa (25.2 % de sólidos) . La suspensión de despachó (70 mg/pocillo) en una placa de microtitulacion de 96 pocilios de fondo plano (Nunc) y se centrifugó a 3000 rpm por 5 min. Las cepas del transformante se cultivaron en formato de matraz de agitación. Las cepas nuevas se ensayaron por medio de SDS-PAGE para controlar los niveles de expresión antes de la incubación con el sustrato de mazorca de maíz. Se determinó el total de proteínas de cada muestra y las muestras se diluyeron hasta 2 mg/ml.
Las reacciones de sacarificación de la mazorca de maíz se iniciaron mediante la adición de 5, 10, 20 o 30 µ? de producto de cepa por pocilio de mazorca de maíz. Según este formato, en el sustrato de mazorca de maíz se generó una respuesta amplia a la dosis de los productos de cepas transformadas .
Las reacciones de sacarificación de la mazorca de maíz se sellaron con sellos de placa de aluminio (E&K scientific) y se mezclaron por 1 minuto a 450 rpm, temperatura ambiente. Después, la placa se colocó en un incubador Innova a 50 °C y 200 rpm por 72 h.
Al final de la etapa de sacarificación de 72 h, la placa se enfrió por medio de la adición de 100 µ? de glicina 100 mM, pH 10.0. Después, la placa se mezcló bien y se centrifugó a 3000 rpm por 5 min (Rotanta 460R Centrifuge de Hettich Zentrifugen) .
Se añadió sobrenadante (10 µ?) en 100 µ? de agua en una placa de microtitulación de 96 pocilios para HPLC (Agilent, 5042-1385) . Las concentraciones de glucosa, xilosa, celobiosa y xilobiosa se midieron por HPLC con el uso de una columna Aminex HPX-87P (300 mm x 7.8 mm, 125-0098) preequipada con una columna de protección.
El desempeño de once cepas: A4 , C3 , C8, D9, D12, E12, F5, F7, G2, Hl, H7 se ilustra en la Fig. 104. Se observa las conversiones de glucano (celobiosa y glucosa) y xilano (xilobiosa + xilosa) de estas cepas.
Ejemplo 24: Cuantificación de proteínas de composiciones enzimáticas con el uso de UPLC.
Para la cuantificación de proteínas se usó un sistema Agilent HPLC 1290 Infinity. Se usó una columna Waters ACQUITY UPLC BEH C4 (1.7 µp?, 1 x 50 mm) , un programa de 6 min con un gradiente inicial de 5 % a 33 % de acetonitrilo (Sigma-Aldrich) en 0.5 min seguido de un gradiente de 33 % a 48 % en 4.5 min y, después, un gradiente de etapa para 90 % de acetronitrilo . Las proteínas de interés se eluyeron entre 33 % y 48 % de acetonitrilo . Los tiempos de retención de proteínas purificadas tales como CBH1, CBH2 , endoglucanasas , xilanasas, beta-glucosidasas , etc., se usaron como estándares. En base al área pico de cada proteína en cualquier mezcla enzimática se calculó el porcentaje de cada proteína comparado con el total de proteínas en esa mezcla. Un ejemplo de una enzima usada en la presente descripción se muestra en las Figs . 106A-106B. ,
Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.
Claims (49)
1. Una composición enzimática modificada genéticamente, caracterizada porque comprende: a) un polipéptido que tiene actividad de xilanasa; y b) un polipéptido que tiene actividad de ß-xilosidasa seleccionado de una ß-xilosidasa de un Grupo 1 o 2 y c) un polipéptido que tiene actividad de L-a-arabinofuranosidasa; y d) un polipéptido que tiene actividad de ß-glucosidasa o una celulasa completa enriquecida con el polipéptido que tiene actividad de ß-glucosidasa, donde la composición enzimática es capaz de hidrolizar un material de biomasa lignocelulósica .
2. Una composición enzimática modificada genéticamente, caracterizada porque comprende: a) un polipéptido que tiene actividad de ß-xilosidasa seleccionado de una ß-xilosidasa de un Grupo 1; y b) un polipéptido que tiene actividad de ß-xilosidasa seleccionado de una ß-xilosidasa de un Grupo 2; y c) un polipéptido que tiene actividad de L-a-arabinofuranosidasa ; y d) un polipéptido que tiene actividad de ß-glucosidasa o una celulasa completa enriquecida con el polipéptido que tiene actividad de ß-glucosidasa, en donde la composición enzimática es capaz de hidrolizar un material de biomasa lignocelulósica .
3. Una composición enzimática modificada genéticamente, caracterizada porque comprende: a) un polipéptido que tiene actividad de xilanasa; y b) un polipéptido que tiene actividad de ß-xilosidasa seleccionado de una ß-xilosidasa de un Grupo 1; y c) un polipéptido que tiene actividad de ß-xilosidasa seleccionado de una ß-xilosidasa de un Grupo 2; y d) un polipéptido que tiene actividad de ß-glucosidasa o una celulasa completa enriquecida con el polipéptido que tiene actividad de ß-glucosidasa, en donde la composición enzimática es capaz de hidrolizar un material de biomasa lignocelulósica.
4. Una composición enzimática modificada genéticamente; caracterizada porque comprende: a) un polipéptido que tiene actividad de xilanasa; y b) un polipéptido que tiene actividad de ß-xilosidasa seleccionado de una ß-xilosidasa de un Grupo 1 o 2; y c) un polipéptido que tiene actividad de ß-glucosidasa o una celulasa completa enriquecida con el polipéptido que tiene actividad de ß-glucosidasa, en donde la composición enzimática es capaz de hidrolizar un material de biomasa lignocelulósica .
5. La composición enzimática de conformidad con cualquiera de las reivindicaciones 1-4, caracterizada porque comprende además, un polipéptido que tiene actividad de GH61/endoglucanasa o una celulasa completa enriquecida con el polipéptido que tiene actividad de GH61/endoglucanasa .
6. Una composición enzimática modificada genéticamente, caracterizada porque comprende: a) un polipéptido que tiene actividad de xilanasa; y b) un polipéptido que tiene actividad de ß-xilosidasa seleccionado de una ß-xilosidasa de un Grupo 1 o 2 ; y c) un polipéptido que tiene actividad de L-o¡-arabinofuranosidasa ; y d) un polipéptido que tiene actividad de GH61/endoglucanasa o una celulasa completa enriquecida con el polipéptido que tiene actividad de GH61/endoglucanasa, en donde la composición enzimática es capaz de hidrolizar un material de biomasa lignocelulósica.
7. Una composición enzimática modificada genéticamente, caracterizada porque comprende: a) un polipéptido que tiene actividad de ß-xilosidasa seleccionado de una ß-xilosidasa de un Grupo 1; y b) un polipéptido que tiene actividad de ß-xilosidasa seleccionado de una ß-xilosidasa de un Grupo 2; y c) un polipéptido que tiene actividad de L-a-arabinofuranosidasa; y d) un polipéptido que tiene actividad de GH61/endoglucanasa o una celulasa completa enriquecida con el polipéptido que tiene actividad de GH6l/endoglucanasa, en donde la composición enzimática es capaz de hidrolizar un material de biomasa lignocelulósica .
8. Una composición enzimática modificada genéticamente, caracterizada porque comprende: a) un polipéptido que tiene actividad de xilanasa; y b) un polipéptido que tiene actividad de ß-xilosidasa seleccionado de una ß-xilosidasa de un Grupo 1; y c) un polipéptido que tiene actividad de ß-xilosidasa seleccionado de una ß-xilosidasa de un Grupo 2; y d) un polipéptido que tiene actividad de GH61/endoglucanasa o una celulasa completa enriquecida con el polipéptido que tiene actividad de GH61/endoglucanasa, en donde la composición enzimática es capaz de hidrolizar un material de biomasa lignocelulósica.
9. Una composición enzimática modificada genéticamente, caracterizada porque comprende: a) un polipéptido que tiene actividad de xilanasa; y b) un polipéptido que tiene actividad de ß-xilosidasa seleccionado de una ß-xilosidasa de un Grupo 1 o 2; y c) un polipéptido que tiene actividad de GH61/endoglucanasa o una celulasa completa enriquecida con el polipéptido que tiene actividad de GH61/endoglucanasa, en donde la composición enzimática es capaz de hidrolizar un material de biomasa lignocelulósica .
10. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-9, caracterizada porque el polipéptido que tiene actividad de xilanasa se selecciona de un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 70 % de identidad con respecto a las sec . con núms . de ident . : 24, 26, 42 o 43 o con respecto a una secuencia madura de estas; o está codificado por un nucleótido que tiene por lo menos 70 % de identidad con respecto a las sec. con núms. de ident.: 23, 25 o 41 o por un nucleótido capaz de hibridarse en condiciones de rigurosidad alta a las sec. con núms. de ident. : 23, 25 o 41 o a un complemento de estas.
11. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-10, caracterizada porque: a) el polipéptido que tiene actividad de ß-xilosidasa del Grupo 1 comprende una secuencia de aminoácidos qué tiene por lo menos 70 % de identidad con respecto a las sec. con núms. de ident.: 2 o 10 o con respecto a una secuencia madura de estas y el polipéptido que tiene actividad de ß-xilosidasa del Grupo 2 comprende una secuencia de aminoácidos que tiene por lo menos 70 % con respecto a las sec. con núms . de ident. : 4, 6, 8, 10, 12, 14, 16, 18, 28, 30 o 45 o con respecto a una secuencia madura de estas; o b) el polipéptido que tiene actividad de ß-xilosidasa del Grupo 1 está codificado por un nucleótido que comprende una secuencia de aminoácidos que tiene por lo menos 70 % de identidad con respecto a las sec. con núms. de ident. : 2 ó 10 o con respecto a una secuencia madura de estas y el polipéptido que tiene actividad de ß-xilosidasa del Grupo 2 comprende una secuencia de aminoácidos que tiene por lo menos 70 % con respecto a las sec. con núms. de ident.: 4, 6, 8, 10, 12, 14, 16, 18, 28, 30 ó 45 o con respecto a una secuencia madura de estas; o c) el polipéptido que tiene actividad de ß-xilosidasa del Grupo 1 está codificado por un nucleótido que tiene por lo menos 70 % de identidad con respecto a las sec. con núms. de ident. :1 o 9; y el polipéptido que tiene actividad de ß-xilosidasa del Grupo 2 está codificado por un nucleótido que tiene por lo menos 70 % de identidad con respecto a las sec. con núms. de ident. :3, 5, 7, 9, 11, 13, 15, 17, 27 ó 29; o d) el polipéptido que tiene actividad de ß-xilosidasa del Grupo 1 es capaz de hibridarse en condiciones de rigurosidad alta a las sec. con núms. de ident. :1 ó 9 o a un complemento de estas; y el polipéptido que tiene actividad de ß-xilosidasa del Grupo 2 es capaz de hibridarse en condiciones de rigurosidad alta a las sec. con núms . de ident . : 3 , 5, 7, 9, 11, 13, 15, 17, 27 o 29 o a un complemento de estas.
12. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-11, caracterizada porque el polipéptido que tiene actividad de L-a-arabinofuranosidasa es: a) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 70 % de identidad con respecto a las sec. con núms. de ident. :12, 14, 20, 22 o 32 o con respecto a una secuencia madura de estas; o b) un polipéptido codificado por un nucleótido que tiene por lo menos 70 % de identidad con respecto a las sec. con núms. de ident.: 11, 13, 19, 21 o 31 o un nucleótido capaz de hibridarse en condiciones de rigurosidad alta a las sec. con núms. de ident.: 11, 13, 19, 21 o 31.
13. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-12, caracterizada porque polipéptido que tiene actividad de ß-glucosidasa es: a) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos aproximadamente 60 % de identidad con respecto a las sec. con núms. de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 79, 93 y 95; o b) un polipéptido híbrido que comprende 2 o más secuencias de ß-glucosidasa, caracterizada además porque la primera secuencia derivada de una primera ß-glucosidasa tiene una longitud de por lo menos 200 residuos de aminoácidos y comprende una o más o todas las sec . con núms . de ident. : 96-108 y la segunda secuencia derivada de una segunda ß-glucosidasa tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende una o más o todas las sec. con núms. de ident.: 109-116 y, opcionalmente , una tercera secuencia derivada de una tercera ß-glucosidasa que tiene una longitud de 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que codifican a secuencia de bucle que comprende las sec. con núms. de ident.: 204 o 205; o c) un polipéptido codificado por un nucleótido que tiene por lo menos aproximadamente 60 % de identidad con respecto a las sec. con núms. de ident.: 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 92 o 94 o uno que es capaz de hibridarse en condiciones de rigurosidad alta a las sec. con núms. de ident.: 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 92 o 94 o a un complemento de estas.
14. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-13, caracterizada porque el. polipéptido que tiene actividad de GH61/endoglucanasa es: a) un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 70 % de identidad de secuencia con respecto a cualquiera de las sec . con núms . de ident.:52, 80-81, 206-207 en una región de por lo menos 100 residuos; o b) un polipéptido que tiene una longitud de por lo menos 200 residuos, que tiene actividad de GH61/endoglucanasa y que comprende una o más secuencias seleccionadas del grupo que consiste en: (1) las sec. con núms. de ident.:84 y 88; (2) las sec. con núms. de ident.:85 y 88; (3) la sec. con núm. de ident.:86; (4) la sec. con núm. de ident.:87; (5) las sec. con núms. de ident.:84, 88 y 89; (6) las sec. con núms. de ident.:85, 88 y 89; (7) las sec. con núms. de ident . : 84, 88 y 90; (8) las sec. con núms. de ident.: 85, 88 y 90; (9) las sec. con núms. de ident. :84, 88 y 91; (10) las sec. con núms. de ident. : 85, 88 y 91; (11) las sec. con núms. de ident.: 84, 88, 89 y 91; (12) las sec. con núms. de ident.: 84, 88, 90 y 91; (13) las sec. con núms. de ident.: 85, 88, 89 y 91: y (14) las sec. con núms. de ident.: 85, 88, 90 y 91; o c) un polipéptido codificado por un nucleótido que tiene por lo menos 70 % de identidad de secuencia con respecto a la sec. con núm. de ident. :51 o que es capaz de hibridarse en condiciones de rigurosidad alta a la sec. con núm. de ident. :51 o a un complemento de esta.
15. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-14, caracterizada porque el polipéptido que tiene actividad de ß-glucosidasa es un polipéptido híbrido que comprende 2 o más secuencias de ß-glucosidasa, caracterizada además porque la primera secuencia derivada de una primera ß -glucosidasa tiene una longitud de por lo menos 200 residuos de aminoácidos y comprende una o más o todas las sec . con núms . de ident . : 197-202 y la segunda secuencia derivada de una segunda ß-glucosidasa tiene una longitud de por lo menos 50 residuos de aminoácidos y comprende la sec. con núm. de ident. :203 y, opcionalmente , una tercera secuencia de polipéptidos que tiene una longitud de 3-11 residuos de aminoácidos que comprenden la sec. con núm. de ident. :204 o la sec. con núm. de ident . :205.
16. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-15, caracterizada porque es una mezcla de cultivo, un caldo de fermentación de una célula huésped que expresa uno o más de los polipéptidos o una formulación de caldo entero del caldo de fermentación.
17. La composición enzimática modificada genéticamente de conformidad con la reivindicación 16, caracterizada porque la célula huésped es de una bacteria o un hongo.
18. La composición enzimática modificada genéticamente de conformidad con la reivindicación 17, caracterizada porque la bacteria es Bacillus o E. coli.
19. La composición enzimática modificada genéticamente de conformidad con la reivindicación 17, caracterizada porque el hongo es una levadura, Aspergillus, Chrysosporium o Trichoderma .
20. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-19, caracterizada porque comprende un polipéptido que tiene actividad de celolubiohidrolasa y/o un polipéptido que tiene actividad de endoglucanasa .
21. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-19, caracterizada porque comprende, una celulasa completa.
22. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-21, caracterizada porque la cantidad de xilanasa relativa a la cantidad total de proteínas en la composición enzimática es de aproximadamente 10 % en peso a aproximadamente 20 % en peso .
23. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-21, caracterizada porque la cantidad de ß-xilosidasa relativa a la cantidad total de proteínas en la composición enzimática es de aproximadamente 5 % en peso a aproximadamente 20 % en peso .
24. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-23, caracterizada porque la cantidad de ß-glucosidasa relativa a la cantidad total de proteínas en la composición enzimática es de aproximadamente 18 % en peso a aproximadamente 30 % en peso .
25. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-24, caracterizada porque la cantidad de L-a-arabinofuranosidasa relativa a la cantidad total de proteínas en la composición enzimática es de aproximadamente 0.2 % en peso a aproximadamente 2 % en peso.
26. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-25, caracterizada porque la cantidad de polipéptidos que tienen actividad de GH61/endoglucanasa relativa a la cantidad total de proteínas en la composición enzimática es de aproximadamente 6 % en peso a aproximadamente 20 % en peso.
27. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-26, caracterizada porque la cantidad de polipéptidos que tienen actividad de celobiohidrolasa relativa a la cantidad total de proteínas en la composición enzimática es de aproximadamente 15 % en peso a aproximadamente 25 % en peso.
28. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 2-5, 7-8 y 10-27, caracterizada porque la relación del peso entre la ß-xilosidasa del Grupo 1 y el peso de la ß-xilosidasa del Grupo 2 es 1:10 a 10:1, 1:9 a 9:1, 1:8 a 8:1, 1:7 a 7:1, 1:6 a 6:1, 1:5 a 5:1, 1:4 a 4:1, 1:3 a 3:1, 1:2 a 2:1 O 1:1.
29. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-28, caracterizada porque por lo menos 1, 2 o 3 polipéptidos son heterólogos a la célula huésped modificada genéticamente para expresar los polipéptidos.
30. La composición enzimática modificada genéticamente de conformidad con cualquiera de las reivindicaciones 1-28, caracterizada porque por lo menos 2 polipéptidos se derivan de microorganismos diferentes.
31. La composición enzimática modificada genéticamente de conformidad con la reivindicación 30, caracterizada porque por lo menos uno de los polipéptidos es un polipéptido de Fusasrium o Trichoderma.
32. Un método para hidrolizar o realizar la digestión de un material de biomasa lignocelulósica que comprende hemicelulosas , celulosa o celulosa y hemicelulosas; caracterizado porque comprende poner en contacto la composición enzimática de conformidad con cualquiera de las reivindicaciones 1-31, con la mezcla de biomasa lignocelulósica .
33. El método de conformidad con la reivindicación 32, caracterizado porque la mezcla de biomasa lignocelulósica comprende un cultivo agrícola, un subproducto de un alimento/producción alimenticia, un producto de desecho lignocelulósico, un residuo vegetal o papel de desecho.
34. El método de conformidad con la reivindicación 33, caracterizado porque el residuo vegetal se selecciona de grano, semillas, tallos, hojas, vainas, cáscaras, mazorcas de maíz, rastrojo de maíz, patatas, soja, cebada, centeno, avena, trigo, betabel, bagazo de caña de azúcar, sorgo, paja, césped, cañas, juncos, madera, astillas, pulpa de madera o aserrín.
35. El método de conformidad con la reivindicación 33, caracterizado porque el césped se selecciona de pasto indio o césped de pradera.
36. El método de conformidad con la reivindicación 32, caracterizado porque el material de biomasa en la mezcla de biomasa lignocelulósica se expone a un tratamiento previo.
37. El método de conformidad con cualquiera de las reivindicaciones 32-36, caracterizado porque la mezcla de biomasa lignocelulósica comprende, además, un azúcar fermentable.
38. El método de conformidad con la reivindicación 36, caracterizado porque el tratamiento previo es un tratamiento previo acídico o básico.
39. El método de conformidad con la reivindicación 38, caracterizado porque el tratamiento previo básico se realiza con amoníaco diluido.
40. El método de conformidad con la reivindicación 38, caracterizado porque el tratamiento previo acídico se realiza con un ácido diluido.
41. Un método para producir etanol, caracterizado porque comprende poner en contacto un material de biomasa lignocelulósica con una composición enzimática de conformidad con cualquiera de las reivindicaciones 1-31, para producir uno o más azúcares fermentables seguido de la fermentación del azúcar fermentable en etanol con el uso de un microorganismo etanologénico .
42. El método de conformidad con la reivindicación 41, caracterizado porque el material de biomasa lignocelulósica se expone a un tratamiento previo antes del contacto con la composición enzimática.
43. El método de conformidad con la reivindicación 41 ó 42, caracterizado porque el microorganismo etanologénico es una levadura o un Zymomonas mobilis.
44. El método de conformidad con cualquiera de las reivindicaciones 32-43, caracterizado porque la composición enzimática comprende de aproximadamente 2 g a aproximadamente 20 g de polipéptido que tiene actividad de xilanasa por kilogramo de hemicelulosas en el material de biomasa.
45. El método de conformidad con cualquiera de las reivindicaciones 32-44, caracterizado porque la composición enzimática comprende de aproximadamente 2 g a aproximadamente 40 g de polipéptido que tiene actividad de ß-xilosidasa · por kilogramo de hemicelulosas en el material de biomasa.
46. El método de conformidad con cualquiera de las reivindicaciones 32-45, caracterizado porque la composición enzimática comprende de aproximadamente 3 g a aproximadamente 50 g de polipéptido que tiene actividad de celulasa por kilogramo de celulosa en el material de biomasa.
47. El método de conformidad con la reivindicación 46, caracterizado porque la cantidad de polipéptido que tiene actividad de ß-glucosidasa constituye hasta aproximadamente 50 % del peso total de un polipéptido que tiene actividad de celulasa .
48. El método de conformidad con cualquiera de las reivindicaciones 32-47, caracterizado porque la composición enzimática se usa en una cantidad y en ciertas condiciones y por un tiempo suficiente para convertir 60 % a 90 % del xilano en el material de biomasa en xilosa.
49. Un método para usar la composición enzimática de conformidad con cualquiera de las reivindicaciones 1-31, caracterizado porque es en un entorno industrial o comercial según una estrategia de un modelo de suministro comercial de enzimas o una estrategia de un modelo de biorefinería en el sitio .
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161453931P | 2011-03-17 | 2011-03-17 | |
PCT/US2012/029470 WO2012125937A2 (en) | 2011-03-17 | 2012-03-16 | Glycosyl hydrolase enzymes and uses thereof for biomass hydrolysis |
Publications (1)
Publication Number | Publication Date |
---|---|
MX2013010510A true MX2013010510A (es) | 2013-10-07 |
Family
ID=45888504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MX2013010510A MX2013010510A (es) | 2011-03-17 | 2012-03-16 | Enzimas glocosil hidrolasa y usos de estas para la hidrolisis de biomasa. |
Country Status (13)
Country | Link |
---|---|
US (2) | US20140106408A1 (es) |
EP (1) | EP2686425A2 (es) |
JP (2) | JP2014508535A (es) |
KR (1) | KR20140027154A (es) |
CN (1) | CN103502444A (es) |
AU (2) | AU2012229042B2 (es) |
BR (1) | BR112013023737A2 (es) |
CA (1) | CA2830239A1 (es) |
MX (1) | MX2013010510A (es) |
RU (1) | RU2013146240A (es) |
SG (1) | SG192025A1 (es) |
WO (1) | WO2012125937A2 (es) |
ZA (1) | ZA201305479B (es) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IN2012DN01492A (es) | 2009-09-23 | 2015-06-05 | Danisco Us Inc | |
EP2599861B1 (en) | 2009-11-20 | 2017-08-02 | Danisco US Inc. | Beta-glucosidase variants with improved properties |
PH12012500999A1 (en) | 2009-12-23 | 2013-02-11 | Danisco Us Inc | Methods for improving the efficiency of simultaneous saccharification and fermentation reactions |
BR112013023757A2 (pt) | 2011-03-17 | 2017-06-06 | Danisco Us Inc | método para redução de viscosidade no processo de sacarificação |
EP2855670A2 (en) | 2012-05-31 | 2015-04-08 | Novozymes A/S | Polypeptides having organophosphorous hydrolase activity |
CA2892054A1 (en) | 2012-12-07 | 2014-06-12 | Ling Hua | Compositions and methods of use |
EP2740840A1 (en) * | 2012-12-07 | 2014-06-11 | Novozymes A/S | Improving drainage of paper pulp |
BR112015029081A2 (pt) * | 2013-05-20 | 2017-09-19 | Abengoa Bioenergia Nuevas Tecnologias Sa | Célula hospedeira myceliophthora thermophila expressando uma enzima beta-xilosidase recombinante, enzima beta-xilosidase recombinante expressada por meio da mesma, composição, uso de célula hospedeira, enzima beta-xilosidase ou composição e métodos de produção de açúcares fermentescíveis e de produção de bioproduto a partir de biomassa |
WO2015017255A1 (en) | 2013-07-29 | 2015-02-05 | Danisco Us Inc. | Variant enzymes |
US20160298157A1 (en) * | 2013-12-04 | 2016-10-13 | Danisco Us Inc. | Compositions comprising a beta-glucosidase polypeptide and methods of use |
FR3014903B1 (fr) * | 2013-12-17 | 2017-12-01 | Ifp Energies Now | Procede d'hydrolyse enzymatique avec production in situ de glycosides hydrolases par des microorganismes genetiquement modifies (mgm) et non mgm |
GB201401699D0 (en) * | 2014-01-31 | 2014-03-19 | Dupont Nutrition Biosci Aps | Protein |
US11390898B2 (en) | 2014-09-05 | 2022-07-19 | Novozymes A/S | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
EP3242952A4 (en) * | 2015-01-09 | 2018-12-05 | University of Cincinnati | Neurospora crassa strains with amplified expression of cellulases and production of biofuel therefrom |
US20180148683A1 (en) | 2015-07-07 | 2018-05-31 | Danisco Us Inc. | Induction of gene expression using a high concentration sugar mixture |
EP3417057B1 (en) * | 2016-02-18 | 2022-04-20 | Biopract GmbH | Arabinanase and uses thereof |
WO2017147163A1 (en) | 2016-02-22 | 2017-08-31 | Danisco Us Inc. | Fungal high-level protein production system |
WO2018053058A1 (en) | 2016-09-14 | 2018-03-22 | Danisco Us Inc. | Lignocellulosic biomass fermentation-based processes |
JP7285780B2 (ja) | 2016-10-04 | 2023-06-02 | ダニスコ・ユーエス・インク | 誘導基質の非存在下における糸状菌細胞内でのタンパク質の産生 |
WO2018106656A1 (en) | 2016-12-06 | 2018-06-14 | Danisco Us Inc | Truncated lpmo enzymes and use thereof |
MX2019007335A (es) | 2016-12-21 | 2019-09-09 | Dupont Nutrition Biosci Aps | Métodos para usar serina proteasas termoestables. |
WO2018185267A1 (en) | 2017-04-06 | 2018-10-11 | Novozymes A/S | Cleaning compositions and uses thereof |
WO2019074828A1 (en) | 2017-10-09 | 2019-04-18 | Danisco Us Inc | CELLOBIOSE DEHYDROGENASE VARIANTS AND METHODS OF USE |
EP3760714A1 (en) * | 2019-07-02 | 2021-01-06 | AB Enzymes Oy | Improved mannanase variants |
CN110540981A (zh) * | 2019-07-26 | 2019-12-06 | 天津科技大学 | 一种具有高浓度木糖、醇和盐耐受性的木糖苷酶Xyl21及其编码基因和应用 |
FR3113291A1 (fr) * | 2020-08-06 | 2022-02-11 | IFP Energies Nouvelles | Procédé de production d’alcool par hydrolyse enzymatique et fermentation de biomasse lignocellulosique |
CN116685740A (zh) * | 2020-12-14 | 2023-09-01 | 巴克曼实验室国际公司 | 用于纸浆和纸生产的动态校正酶选择和配制物的系统和方法 |
CN112522117B (zh) * | 2020-12-29 | 2022-06-28 | 中国科学院成都生物研究所 | 一株粪壳菌及其应用 |
CN116064477B (zh) * | 2022-07-12 | 2024-06-21 | 华中科技大学 | 一种糖苷酶家族43的β-糖苷酶及其编码基因与应用 |
WO2024107625A1 (en) * | 2022-11-14 | 2024-05-23 | C1Pro Inc. | Systems and methods for microbial biomass production |
Family Cites Families (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1190108A (en) * | 1915-10-14 | 1916-07-04 | Ambrose B Chabot | Hoe. |
US5366558A (en) | 1979-03-23 | 1994-11-22 | Brink David L | Method of treating biomass material |
US5536655A (en) | 1989-09-26 | 1996-07-16 | Midwest Research Institute | Gene coding for the E1 endoglucanase |
DK16490D0 (da) | 1990-01-19 | 1990-01-19 | Novo Nordisk As | Enzym |
US5326477A (en) | 1990-05-07 | 1994-07-05 | Bio-Sep, Inc. | Process for digesting solid waste |
KR100237148B1 (ko) | 1990-05-09 | 2000-01-15 | 한센 핀 베네드 | 엔도글루칸아제 효소를 함유하는 셀룰라제 제조물 |
DK115890D0 (da) | 1990-05-09 | 1990-05-09 | Novo Nordisk As | Enzym |
DE69133612D1 (de) | 1990-12-10 | 2009-04-02 | Genencor Int | Verbesserte Saccharifizierung von Zellulose durch Klonierung und Vervielfältigung des beta-Glukosidase Genes aus Trichoderma |
US6021536A (en) | 1993-03-04 | 2000-02-08 | Wasinger; Eric | Mechanical desizing and abrading device |
US5405769A (en) | 1993-04-08 | 1995-04-11 | National Research Council Of Canada | Construction of thermostable mutants of a low molecular mass xylanase |
US6426200B1 (en) | 1994-09-15 | 2002-07-30 | University Of Georgia Research Foundation, Inc. | Methods for enzymatic deinking of waste paper |
US5705369A (en) | 1994-12-27 | 1998-01-06 | Midwest Research Institute | Prehydrolysis of lignocellulose |
CN1165614C (zh) | 1995-01-26 | 2004-09-08 | 诺沃奇梅兹有限公司 | 含有木聚糖酶的动物饲料添加剂 |
CN102080070B (zh) | 1995-03-17 | 2016-01-20 | 诺沃奇梅兹有限公司 | 新的内切葡聚糖酶 |
WO1997004160A1 (en) | 1995-07-19 | 1997-02-06 | Novo Nordisk A/S | Treatment of fabrics |
WO1997018286A1 (en) | 1995-11-15 | 1997-05-22 | Novo Nordisk A/S | A process for combined desizing and 'stone-washing' of dyed denim |
CN1209838A (zh) | 1996-01-29 | 1999-03-03 | 诺沃挪第克公司 | 纤维素织物的脱浆方法 |
US6254722B1 (en) | 1996-03-27 | 2001-07-03 | North Carolina State University | Method for making dissolving pulp from paper products containing hardwood fibers |
US6069122A (en) | 1997-06-16 | 2000-05-30 | The Procter & Gamble Company | Dishwashing detergent compositions containing organic diamines for improved grease cleaning, sudsing, low temperature stability and dissolution |
AU7768798A (en) | 1997-06-10 | 1998-12-30 | Xyrofin Oy | Process for the production of sylose from a paper-grade, hardwood pulp |
JP3905310B2 (ja) | 1997-11-10 | 2007-04-18 | ザ プロクター アンド ギャンブル カンパニー | 洗剤タブレツトの製法 |
US6187580B1 (en) | 1997-11-24 | 2001-02-13 | Novo Nordisk A/S | Pectate lyases |
JP2003527450A (ja) | 1998-05-01 | 2003-09-16 | ノボ ノルディスク アクティーゼルスカブ | N−ヒドロキシアセトアニリドの様な増強剤 |
DE19824705A1 (de) | 1998-06-03 | 1999-12-09 | Henkel Kgaa | Amylase und Protease enthaltende Wasch- und Reinigungsmittel |
US5980581A (en) | 1998-09-08 | 1999-11-09 | The Virkler Company | Process for desizing and cleaning woven fabrics and garments |
US6024766A (en) | 1999-01-27 | 2000-02-15 | Wasinger; Eric M. | Process for enzymatic desizing of garments and enzyme deactivation |
US6409841B1 (en) | 1999-11-02 | 2002-06-25 | Waste Energy Integrated Systems, Llc. | Process for the production of organic products from diverse biomass sources |
US6423145B1 (en) | 2000-08-09 | 2002-07-23 | Midwest Research Institute | Dilute acid/metal salt hydrolysis of lignocellulosics |
EP1395653A2 (en) | 2001-05-18 | 2004-03-10 | Novozymes A/S | Polypeptides having cellobiase activity and polynucleotides encoding same |
US6982159B2 (en) | 2001-09-21 | 2006-01-03 | Genencor International, Inc. | Trichoderma β-glucosidase |
US7045332B2 (en) | 2001-12-18 | 2006-05-16 | Genencor International, Inc. | BGL4 β-glucosidase and nucleic acids encoding the same |
US7056721B2 (en) | 2001-12-18 | 2006-06-06 | Genencor International, Inc. | EGVI endoglucanase and nucleic acids encoding the same |
US7045331B2 (en) | 2001-12-18 | 2006-05-16 | Genencor International, Inc. | EGVII endoglucanase and nucleic acids encoding the same |
US7005289B2 (en) | 2001-12-18 | 2006-02-28 | Genencor International, Inc. | BGL5 β-glucosidase and nucleic acids encoding the same |
EP1556512B1 (en) | 2002-11-07 | 2016-06-15 | Danisco US Inc. | Bgl6 beta-glucosidase and nucleic acids encoding the same |
WO2004078919A2 (en) | 2003-02-27 | 2004-09-16 | Midwest Research Institute | Superactive cellulase formulation using cellobiohydrolase-1 from penicillium funiculosum |
US20040231060A1 (en) | 2003-03-07 | 2004-11-25 | Athenix Corporation | Methods to enhance the activity of lignocellulose-degrading enzymes |
EP2385103A3 (en) | 2003-04-01 | 2012-02-22 | Danisco US Inc. | Variant Hypocrea jecorina CBH1 |
EP1862626B1 (en) | 2003-05-29 | 2011-09-14 | Genencor International, Inc. | Novel trichoderma genes |
DK1700917T3 (en) | 2003-12-03 | 2016-07-25 | Meiji Seika Pharma Co Ltd | ENDOGLUCANASE STCE AND CELLULASE PREPARATION CONTAINING THE SAME |
BRPI0507431B1 (pt) * | 2004-02-06 | 2021-07-27 | Novozymes, Inc | Célula hospedeira microbiana recombinante, construto de ácido nucleico, vetor de expressão recombinante, composição detergente, e, métodos para produzir o polipeptídeo gh61, para degradar um material celulósico e para produzir um produto de fermentação |
CA2567570C (en) | 2004-05-27 | 2014-07-08 | Genencor International, Inc. | Aspergillus kawachi acid-stable alpha amylase and applications in granular starch hydrolysis |
US7781191B2 (en) | 2005-04-12 | 2010-08-24 | E. I. Du Pont De Nemours And Company | Treatment of biomass to obtain a target chemical |
CN101160388B (zh) * | 2005-04-12 | 2013-05-01 | 纳幕尔杜邦公司 | 生物质处理的系统和工艺 |
KR100672535B1 (ko) | 2005-07-25 | 2007-01-24 | 엘지전자 주식회사 | 유기 el 소자 및 그 제조방법 |
US7256032B2 (en) | 2005-12-22 | 2007-08-14 | Ab Enzymes Oy | Enzymes |
IES20060090A2 (en) * | 2006-02-10 | 2007-06-13 | Nat Univ Ireland | Talaromyces emersonii enzyme systems |
NZ595501A (en) * | 2006-02-10 | 2013-05-31 | Verenium Corp | Cellulolytic enzymes, nucleic acids encoding them and methods for making and using them |
CA2663711C (en) | 2006-09-22 | 2017-02-28 | Danisco Us Inc. | Acetolactate synthase (als) selectable marker from trichoderma reesei |
NZ598285A (en) * | 2007-01-30 | 2013-10-25 | Syngenta Participations Ag | Enzymes for the treatment of lignocellulosics, nucleic acids encoding them and methods for making and using them |
CN101855345A (zh) * | 2007-05-10 | 2010-10-06 | 诺维信股份有限公司 | 用于增强含纤维素材料的降解或转化的组合物和方法 |
EP2152892B1 (en) | 2007-05-21 | 2013-05-01 | Danisco US, Inc., Genencor Division | Method for introducing nucleic acids into fungal cells |
BRPI0812267A2 (pt) * | 2007-05-31 | 2014-10-14 | Novozymes Inc | Célula hospedeira fúngica filamentosa, método para produzir uma composição de proteína celulolítica, composição de proteína celulolítica, e, métodos para degradar ou converter um material, contendo celulose e para produzir um produto de fermentação |
JP5731194B2 (ja) * | 2007-06-27 | 2015-06-10 | ノボザイムス アクティーゼルスカブ | 発酵製品を生産するための方法 |
EP2380988A3 (en) * | 2007-07-10 | 2012-04-11 | Mosanto Technology LLC | Transgenic plants with enhanced agronomic traits |
CA2702019C (en) | 2007-10-09 | 2017-01-03 | Danisco Us Inc. | Glucoamylase variants |
WO2009108941A2 (en) * | 2008-02-29 | 2009-09-03 | University Of Central Florida Research Foundation, Inc. | Production and use of plant degrading materials |
BRPI0910252A2 (pt) | 2008-03-07 | 2015-09-01 | Danisco Us Inc | Expressão de catalise em trichoderma |
CN106222150A (zh) * | 2008-03-21 | 2016-12-14 | 丹尼斯科美国公司 | 用于增加生物量水解的富含半纤维素酶的组合物 |
US20110165635A1 (en) * | 2008-04-21 | 2011-07-07 | Chromatin, Inc. | Methods and materials for processing a feedstock |
WO2010059424A2 (en) * | 2008-11-18 | 2010-05-27 | Novozymes, Inc. | Methods and compositions for degrading cellulosic material |
CA2765715A1 (en) * | 2009-06-16 | 2010-12-23 | Codexis, Inc. | .beta.-glucosidase variants |
IN2012DN01492A (es) * | 2009-09-23 | 2015-06-05 | Danisco Us Inc | |
EP2397491A1 (en) * | 2010-06-21 | 2011-12-21 | Technische Universität Wien | LeaA from Trichoderma reesei |
WO2012030845A2 (en) * | 2010-08-30 | 2012-03-08 | Novozymes A/S | Polypeptides having beta-glucosidase activity, beta-xylosidase activity, or beta-glucosidase and beta-xylosidase activity and polynucleotides encoding same |
-
2012
- 2012-03-16 JP JP2013558212A patent/JP2014508535A/ja active Pending
- 2012-03-16 RU RU2013146240/10A patent/RU2013146240A/ru not_active Application Discontinuation
- 2012-03-16 AU AU2012229042A patent/AU2012229042B2/en not_active Ceased
- 2012-03-16 BR BR112013023737A patent/BR112013023737A2/pt not_active Application Discontinuation
- 2012-03-16 SG SG2013054879A patent/SG192025A1/en unknown
- 2012-03-16 CA CA2830239A patent/CA2830239A1/en not_active Abandoned
- 2012-03-16 CN CN201280013821.8A patent/CN103502444A/zh active Pending
- 2012-03-16 KR KR1020137027129A patent/KR20140027154A/ko not_active Withdrawn
- 2012-03-16 WO PCT/US2012/029470 patent/WO2012125937A2/en active Application Filing
- 2012-03-16 US US14/004,881 patent/US20140106408A1/en not_active Abandoned
- 2012-03-16 EP EP12710853.8A patent/EP2686425A2/en not_active Withdrawn
- 2012-03-16 MX MX2013010510A patent/MX2013010510A/es unknown
-
2013
- 2013-07-19 ZA ZA2013/05479A patent/ZA201305479B/en unknown
-
2017
- 2017-03-22 JP JP2017055469A patent/JP2017140035A/ja not_active Withdrawn
- 2017-06-01 AU AU2017203715A patent/AU2017203715A1/en not_active Abandoned
- 2017-07-12 US US15/647,775 patent/US20180163242A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
CA2830239A1 (en) | 2012-09-20 |
KR20140027154A (ko) | 2014-03-06 |
RU2013146240A (ru) | 2015-04-27 |
US20180163242A1 (en) | 2018-06-14 |
SG192025A1 (en) | 2013-08-30 |
JP2014508535A (ja) | 2014-04-10 |
EP2686425A2 (en) | 2014-01-22 |
BR112013023737A2 (pt) | 2016-12-13 |
US20140106408A1 (en) | 2014-04-17 |
JP2017140035A (ja) | 2017-08-17 |
AU2017203715A1 (en) | 2017-06-22 |
WO2012125937A3 (en) | 2012-11-15 |
ZA201305479B (en) | 2014-10-29 |
AU2012229042B2 (en) | 2017-03-02 |
WO2012125937A2 (en) | 2012-09-20 |
CN103502444A (zh) | 2014-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2012229042B2 (en) | Glycosyl hydrolase enzymes and uses thereof for biomass hydrolysis | |
US20190169585A1 (en) | Novel glycosyl hydrolase enzymes and uses thereof | |
US10190108B2 (en) | Method for reducing viscosity in saccharification process | |
AU2012229042A1 (en) | Glycosyl hydrolase enzymes and uses thereof for biomass hydrolysis | |
CN103492561A (zh) | 纤维素酶组合物和使用相同组合物用于改善木质纤维素生物质转化成可发酵糖的方法 | |
AU2016203478A1 (en) | Method for reducing viscosity in saccharification process | |
AU2012229030A1 (en) | Method for reducing viscosity in saccharification process |