[go: up one dir, main page]

RU2845387C1 - Modified filamentous fungi for production of exogenous proteins - Google Patents

Modified filamentous fungi for production of exogenous proteins

Info

Publication number
RU2845387C1
RU2845387C1 RU2022131841A RU2022131841A RU2845387C1 RU 2845387 C1 RU2845387 C1 RU 2845387C1 RU 2022131841 A RU2022131841 A RU 2022131841A RU 2022131841 A RU2022131841 A RU 2022131841A RU 2845387 C1 RU2845387 C1 RU 2845387C1
Authority
RU
Russia
Prior art keywords
ala
gly
leu
ser
val
Prior art date
Application number
RU2022131841A
Other languages
Russian (ru)
Inventor
Марика ВИТИКАЙНЕН
Анне ХУУСКОНЕН
Андрий КОВАЛЬЧУК
Кристофер ЛАНДОВСКИ
Ронен ТЧЕЛЕТ
Марк Аарон Эмалфарб
Маркку САЛОХЕЙМО
Original Assignee
Диадик Интернэшнл (Сша), Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Диадик Интернэшнл (Сша), Инк. filed Critical Диадик Интернэшнл (Сша), Инк.
Application granted granted Critical
Publication of RU2845387C1 publication Critical patent/RU2845387C1/en

Links

Abstract

FIELD: biotechnology.
SUBSTANCE: invention relates to biotechnology, in particular to a genetically modified ascomycete filamentous fungus. Said fungus is intended to produce an exogenous protein of interest and contains at least one cell having a reduced expression and/or activity of KEX2 protease, and reduced expression and/or activity of at least 12 additional proteases, wherein at least one cell contains an exogenous polynucleotide encoding the protein of interest. Present invention also relates to a method of producing said fungus, as well as a method of producing at least one protein of interest.
EFFECT: present invention provides an increase in the stability and amount of expressed exogenous proteins, achieved due to low expression and/or activity of KEX2 protease and at least 12 additional proteases.
42 cl, 17 dwg, 5 tbl, 11 ex

Description

ОБЛАСТЬ ТЕХНИКИAREA OF TECHNOLOGY

Данное изобретение относится к производству экзогенных белков в генетически модифицированных аскомицетных мицелиальных грибах, в частности, вида Thermothelomyces heterothallica (ранее Myceliophthora thermophila), имеющих пониженную экспрессию или активность протеаз KЕХ2 и/или ALP7. Генетически модифицированные аскомицетные мицелиальные грибы используются для надежного производства высокостабильных белков.The present invention relates to the production of exogenous proteins in genetically modified ascomycetous filamentous fungi, in particular of the species Thermothelomyces heterothallica (formerly Myceliophthora thermophila), having reduced expression or activity of the proteases KEX2 and/or ALP7. The genetically modified ascomycetous filamentous fungi are used for the reliable production of highly stable proteins.

УРОВЕНЬ ТЕХНИКИLEVEL OF TECHNOLOGY

Производство рекомбинантного белкаRecombinant protein production

Экспрессия и очистка рекомбинантных белков, имеющих функциональные посттрансляционные модификации белков, такие как гликозилирование или фосфорилирование, могут быть осуществлены только с использованием эукариотических систем экспрессии. Системы экспрессии эукариотических белков, включая клетки млекопитающих, растения и грибы, стали незаменимыми для производства функциональных эукариотических белков.Expression and purification of recombinant proteins that have functional post-translational protein modifications such as glycosylation or phosphorylation can only be accomplished using eukaryotic expression systems. Eukaryotic protein expression systems, including mammalian, plant, and fungal cells, have become indispensable for the production of functional eukaryotic proteins.

Thermothelomyces heterothallica (Th. heterothallica) C1 дикого типа (до недавнего времени называвшийся Myceliophthora thermophila, который в свою очередь был переименован из Chrysosporium lucknowense) представляет собой термотолерантный аскомицетный мицелиальный гриб, продуцирующий высокие уровни целлюлаз, что делает его привлекательным для выработки этих и других белков в коммерческих масштабах.Thermothelomyces heterothallica (Th. heterothallica) wild-type C1 (until recently named Myceliophthora thermophila, which in turn was renamed from Chrysosporium lucknowense) is a thermotolerant ascomycete filamentous fungus that produces high levels of cellulases, making it attractive for the production of these and other proteins on a commercial scale.

Например, патенты США №№8268585 и 8871493, выданные заявителю данного изобретения, раскрывают систему трансформации в области мицелиальных грибов-хозяев для экспрессии и секреции гетерологичных белков или полипептидов. Также раскрыт способ получения больших количеств полипептидов или белков экономичным способом. Система включает трансформированный или трансфицированный штамм гриба рода Chrysosporium, более конкретно Chrysosporium lucknowense, и его мутантов или производных. Также раскрыты трансформанты, содержащие кодирующие последовательности Chrysosporium, а также последовательности, регулирующие экспрессию генов Chrysosporium.For example, U.S. Patent Nos. 8,268,585 and 8,871,493 issued to the applicant of the present invention disclose a transformation system in the field of filamentous fungal hosts for the expression and secretion of heterologous proteins or polypeptides. Also disclosed is a method for producing large quantities of polypeptides or proteins in an economical manner. The system includes a transformed or transfected strain of a fungus of the genus Chrysosporium, more particularly Chrysosporium lucknowense, and mutants or derivatives thereof. Also disclosed are transformants containing Chrysosporium coding sequences, as well as sequences regulating the expression of Chrysosporium genes.

Сl дикого типа депонирован в соответствии с Будапештским договором под номером VKM F-3500 D, дата депонирования 29 августа 1996 г. Также были депонированы штаммы с высоким (НС) и низким (LC) уровнями целлюлазы, как описано, например, в патенте США№8268585.Wild-type Cl has been deposited under the Budapest Treaty under accession number VKM F-3500 D, deposit date August 29, 1996. Strains with high (HC) and low (LC) cellulase levels have also been deposited, as described, for example, in U.S. Patent No. 8,268,585.

Недавно заявитель данной заявки показал, что мицелиальные грибы, особенно Th. heterothallica, очень хорошо подходят для продуцирования вторичных метаболитов. В международной (РСТ) заявке №PCT/IB2020/051015 раскрыто, что Th. heterothallica способен продуцировать каннабиноиды и их предшественников, в частности, продуцировать каннабигероловую кислоту (CBGA) и/или каннабигеровариновую кислоту (CBGVA) и их продукты, включая тетрагидроканнабиноловую кислоту (ТНСА), каннабидиоловую кислоту (CBDA) и каннабидивариновую кислоту (CBDVA), и его использование для продуцирования указанных прекурсоров и каннабиноидов.Recently, the applicant of this application has shown that filamentous fungi, especially Th. heterothallica, are very well suited for the production of secondary metabolites. In the international (PCT) application No. PCT/IB2020/051015, it is disclosed that Th. heterothallica is capable of producing cannabinoids and their precursors, in particular, producing cannabigerolic acid (CBGA) and/or cannabigerovaric acid (CBGVA) and their products, including tetrahydrocannabinolic acid (THCA), cannabidiolic acid (CBDA) and cannabidivaric acid (CBDVA), and its use for the production of said precursors and cannabinoids.

Публикация международной заявки №WO/2015/004241 на имя Landowski et al. раскрывает клетки мицелиальных грибов с дефицитом множества протеаз и способы, пригодные для продуцирования гетерологичных белков.International Publication No. WO/2015/004241 to Landowski et al. discloses filamentous fungal cells deficient in multiple proteases and methods useful for producing heterologous proteins.

КоронавирусCoronavirus

Коронавирусы (CoV) - самая большая группа вирусов, относящаяся к порядку Nidovirales, который включает семейства Coronaviridae, Arteriviridae и Roniviridae. Coronavirinae представляет собой одно из двух подсемейств семейства Coronaviridae, вторым является Torovirinae. Коронавирусы связаны с заболеваниями от обычной простуды до более тяжелых состояний, таких как тяжелый острый респираторный синдром (SARS-CoV) и ближневосточный респираторный синдром (MERS-CoV). Коронавирус тяжелого острого респираторного синдрома 2 (SARS-CoV-2) представляет собой положительно-смысловой одноцепочечный РНК-коронавирус, вызывающий коронавирусную болезнь 2019 (COVID-19). Коронавирусы являются зоонозными, то есть они передаются между животными и людьми. Общие признаки коронавирусной инфекции включают респираторные симптомы, лихорадку, кашель, одышку и затрудненное дыхание. В плазме тяжелобольных пациентов, инфицированных COVID-19, были зарегистрированы высокие концентрации цитокинов. В более тяжелых случаях инфекция может вызывать пневмонию, воспаление дыхательных путей, тяжелый острый респираторный синдром, почечную недостаточность и смерть. Рекомбинантное продуцирование вирусных белков может быть использовано в качестве потенциальной вакцины. Спайковые белки коронавируса считаются основной мишенью для разработки вакцин.Coronaviruses (CoV) are the largest group of viruses belonging to the order Nidovirales, which includes the families Coronaviridae, Arteriviridae, and Roniviridae. Coronavirinae is one of two subfamilies of the family Coronaviridae, the other being Torovirinae. Coronaviruses are associated with diseases ranging from the common cold to more severe conditions such as severe acute respiratory syndrome (SARS-CoV) and Middle East respiratory syndrome (MERS-CoV). Severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) is a positive-sense, single-stranded RNA coronavirus that causes coronavirus disease 2019 (COVID-19). Coronaviruses are zoonotic, meaning they are transmitted between animals and humans. Common signs of coronavirus infection include respiratory symptoms, fever, cough, shortness of breath, and difficulty breathing. High concentrations of cytokines have been detected in the plasma of severely ill patients infected with COVID-19. In more severe cases, the infection can cause pneumonia, airway inflammation, severe acute respiratory syndrome, renal failure, and death. Recombinant production of viral proteins can be used as a potential vaccine. The coronavirus spike proteins are considered the main target for vaccine development.

Сохраняется потребность в системах экспрессии для массовой выработки белков, которые можно было бы эффективно и экономично использовать в фармацевтической промышленности. В частности, существует потребность в улучшенных и надежных системах экспрессии, которые могут продуцировать стабильные антитела, а также вирусные антигены для вакцинации.There remains a need for expression systems for mass production of proteins that can be used efficiently and economically in the pharmaceutical industry. In particular, there is a need for improved and robust expression systems that can produce stable antibodies as well as viral antigens for vaccination.

СУЩНОСТЬ ИЗОБРЕТЕНИЯESSENCE OF THE INVENTION

Данное изобретение предусматривает генетически модифицированные аскомицетные мицелиальные грибы с пониженной экспрессией протеаз KЕХ2 и/или ALP7, способные продуцировать большое количество высокостабильных белков.The present invention provides genetically modified ascomycete filamentous fungi with reduced expression of KEX2 and/or ALP7 proteases, capable of producing a large number of highly stable proteins.

В частности, данное изобретение предусматривает штамм Cl Thermothelomyces heterothallica в качестве примера аскомицетного мицелиального гриба, генетически модифицированного для увеличения выработки экзогенных белков. В некоторых вариантах осуществления, описанные в данном документе грибы были модифицированы таким образом, чтобы они были лишены четырнадцати протеаз, включая KЕХ2 и ALP7.In particular, the present invention provides a strain of CI Thermothelomyces heterothallica as an example of an ascomycete filamentous fungus genetically modified to increase the production of exogenous proteins. In some embodiments, the fungi described herein have been modified to lack fourteen proteases, including KEX2 and ALP7.

Неожиданно, данное изобретение показывает, что Th.heterothallica, являющийся примером аскомицетных мицелиальных грибов, может быть генетически модифицирован для значительного увеличения экспрессии и стабильности экзогенных белков, экспрессируемых клетками Т. heterothallica, по сравнению с ранее раскрытыми грибковыми штаммами. Данное изобретение показывает, что делеция определенных протеаз, включая KЕХ2 или ALP7, значительно увеличивает стабильность экспрессируемых белков.Surprisingly, the present invention shows that Th. heterothallica, an example of an ascomycetous filamentous fungus, can be genetically modified to significantly increase the expression and stability of exogenous proteins expressed by T. heterothallica cells compared to previously disclosed fungal strains. The present invention shows that deletion of certain proteases, including KEX2 or ALP7, significantly increases the stability of the expressed proteins.

Кроме того, раскрывается, что комбинированная делеция KЕХ2 и ALP7 значительно увеличивает стабильность и количество экспрессируемых экзогенных белков.Furthermore, it is revealed that combined deletion of KEX2 and ALP7 significantly increases the stability and amount of expressed exogenous proteins.

Предпочтительно, в некоторых вариантах осуществления, был разработан генетически модифицированный аскомицетный мицелиальный гриб с пониженной экспрессией секретируемых протеаз по данному изобретению для продуцирования секретируемых белков. Секреция экспрессированных белков и недопущение появления фрагментированных белков в среде упрощают процедуру очистки и увеличивают выход белка.Preferably, in some embodiments, a genetically modified ascomycete filamentous fungus with reduced expression of secreted proteases according to the invention has been developed to produce secreted proteins. Secretion of the expressed proteins and avoidance of fragmented proteins in the medium simplifies the purification procedure and increases protein yield.

Образец системы Th. heterothallica С1 по данному изобретению был разработан для продуцирования представляющего интерес белка путем повреждения генов, кодирующих протеазы, экспрессируемые грибком в естественных условиях. Неожиданно было обнаружено, что делеция даже тринадцати или четырнадцати протеаз не только не нарушает скорость роста и пролиферации грибов, но, по меньшей мере, поддерживает и даже увеличивает скорость роста, что делает возможной массовую выработку экзогенного белка.The Th. heterothallica C1 system prototype of the present invention was designed to produce a protein of interest by disrupting genes encoding proteases naturally expressed by the fungus. Surprisingly, it was found that deletion of even thirteen or fourteen proteases not only does not disrupt the growth and proliferation rate of the fungi, but at least maintains and even increases the growth rate, making it possible to mass-produce exogenous protein.

Несколько штаммов Th. heterothallica С1, разработанных заявителем данного изобретения, менее чувствительны к репрессии по типу обратной связи глюкозой и другими ферментируемыми сахарами, присутствующими в питательной среде в качестве источника углерода, чем обычные штаммы дрожжей, а также большинство других аскомицетных мицелиальных грибов-хозяев и, следовательно, могут переносить более высокую скорость подачи источника углерода, что приводит к высокому выходу выработки этого гриба.Several strains of Th. heterothallica C1 developed by the applicant of the present invention are less sensitive to feedback repression by glucose and other fermentable sugars present in the growth medium as a carbon source than conventional yeast strains as well as most other ascomycete filamentous fungi hosts and, therefore, can tolerate a higher rate of carbon source supply, resulting in high yield production of the fungus.

Кроме того, некоторые из штаммов Th. heterothallica С1, разработанные заявителем данного изобретения, могут выращиваться в ферментерах в жидких культурах со значительно сниженной вязкостью среды по сравнению с большинством других видов аскомицетных мицелиальных грибов. Культуры низкой вязкости Th. heterothallica С1 сопоставимы с культурами S. cerevisiae и других видов дрожжей. Низкая вязкость может быть связана с морфологическими изменениями штамма от наличия длинных и сильно переплетенных гиф в исходном штамме (штаммах) к коротким и менее переплетенным гифам в разработанном штамме (штаммах). Низкая вязкость среды очень выгодна в крупномасштабном промышленном производстве.In addition, some of the Th. heterothallica C1 strains developed by the applicant of the present invention can be grown in fermenters in liquid cultures with a significantly reduced viscosity of the medium compared to most other species of ascomycetous filamentous fungi. Low viscosity cultures of Th. heterothallica C1 are comparable to cultures of S. cerevisiae and other yeast species. The low viscosity may be due to morphological changes in the strain from having long and strongly intertwined hyphae in the original strain(s) to short and less intertwined hyphae in the developed strain(s). Low viscosity of the medium is very advantageous in large-scale industrial production.

В соответствии с одним аспектом данное изобретение относится к мицелиальным грибам, генетически модифицированным для продуцирования представляющего интерес белка, причем генетически модифицированные мицелиальные грибы содержат по меньшей мере одну клетку, имеющую пониженную экспрессию и/или протеазную активность KЕХ2 и/или ALP7, причем по меньшей мере одна клетка содержит по меньшей мере один экзогенный полинуклеотид, кодирующий представляющий интерес белок.According to one aspect, the present invention relates to filamentous fungi genetically modified to produce a protein of interest, wherein the genetically modified filamentous fungi comprise at least one cell having reduced expression and/or protease activity of KEX2 and/or ALP7, wherein the at least one cell comprises at least one exogenous polynucleotide encoding the protein of interest.

В соответствии с некоторыми вариантами осуществления, ALP7 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, или по меньшей мере 80%, или по меньшей мере 85%, или по меньшей мере 90%, или по меньшей мере 95%, или по меньшей мере 99%, или 100% идентичности аминокислотной последовательности ALP7 Thermothelomyces heterothallica. В соответствии с некоторыми вариантами осуществления, ALP7 Thermothelomyces heterothallica содержит аминокислоты SEQ ID NO: 13.According to some embodiments, ALP7 comprises an amino acid sequence that has at least 75%, or at least 80%, or at least 85%, or at least 90%, or at least 95%, or at least 99%, or 100% amino acid sequence identity to Thermothelomyces heterothallica ALP7. According to some embodiments, Thermothelomyces heterothallica ALP7 comprises the amino acids of SEQ ID NO: 13.

В соответствии с некоторыми вариантами осуществления, KЕХ2 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, или по меньшей мере 80%, или по меньшей мере 85%, или по меньшей мере 90%, или по меньшей мере 95%, или по меньшей мере 99%, или 100% идентичности аминокислотной последовательности KЕХ2 Thermothelomyces heterothallica. В соответствии с некоторыми вариантами осуществления, KЕХ2 Thermothelomyces heterothallica содержит аминокислоты SEQ ID NO: 14.According to some embodiments, KEX2 comprises an amino acid sequence that has at least 75%, or at least 80%, or at least 85%, or at least 90%, or at least 95%, or at least 99%, or 100% amino acid sequence identity to KEX2 of Thermothelomyces heterothallica. According to some embodiments, KEX2 of Thermothelomyces heterothallica comprises the amino acids of SEQ ID NO: 14.

В соответствии с некоторыми вариантами осуществления, модифицированный мицелиальный гриб содержит по меньшей мере одну клетку, имеющую пониженную экспрессию и/или активность KЕХ2 и ALP7.According to some embodiments, the modified filamentous fungus comprises at least one cell having reduced expression and/or activity of KEX2 and ALP7.

В соответствии с некоторыми вариантами осуществления, модифицированный мицелиальный гриб содержит по меньшей мере одну клетку, имеющую пониженную экспрессию и/или активность по меньшей мере одной дополнительной протеазы.According to some embodiments, the modified filamentous fungus comprises at least one cell having reduced expression and/or activity of at least one additional protease.

В соответствии с некоторыми вариантами осуществления, модифицированный мицелиальный гриб содержит по меньшей мере одну клетку, имеющую пониженную экспрессию и/или активность по меньшей мере 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 или 14 протеаз. Каждый возможный вариант представляет собой отдельный вариант осуществления данного изобретения. В соответствии с некоторыми вариантами осуществления, модифицированный мицелиальный гриб содержит по меньшей мере одну клетку, имеющую пониженную экспрессию и/или активность по меньшей мере 5, 6, 7, 8, 9, 10, 11, 12, 13 или 14 протеаз. Каждый возможный вариант представляет собой отдельный вариант осуществления изобретения.According to some embodiments, the modified filamentous fungus comprises at least one cell having reduced expression and/or activity of at least 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, or 14 proteases. Each possible embodiment is a separate embodiment of the invention. According to some embodiments, the modified filamentous fungus comprises at least one cell having reduced expression and/or activity of at least 5, 6, 7, 8, 9, 10, 11, 12, 13, or 14 proteases. Each possible embodiment is a separate embodiment of the invention.

В соответствии с некоторыми вариантами осуществления, по меньшей мере одна дополнительная протеаза выбрана из группы, состоящей из ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6 и ALP4. Каждый возможный вариант представляет собой отдельный вариант осуществления данного изобретения.According to some embodiments, the at least one additional protease is selected from the group consisting of ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6 and ALP4. Each possible variant represents a separate embodiment of the present invention.

В соответствии с некоторыми вариантами осуществления, по меньшей мере одна дополнительная протеаза выбрана из группы, состоящей из ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6, ALP4, ALP5, ALP6, SRP3, SRP5 и SRP8.According to some embodiments, the at least one additional protease is selected from the group consisting of ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6, ALP4, ALP5, ALP6, SRP3, SRP5 and SRP8.

В соответствии с некоторыми вариантами осуществления, по меньшей мере одна клетка имеет пониженную экспрессию и/или активность по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9 или 10 протеаз, выбранных из группы, состоящей из ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6, ALP4, ALPS, ALP6, SRP3, SRP5, SRP8 и SRP10.According to some embodiments, at least one cell has reduced expression and/or activity of at least 2, 3, 4, 5, 6, 7, 8, 9, or 10 proteases selected from the group consisting of ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6, ALP4, ALPS, ALP6, SRP3, SRP5, SRP8, and SRP10.

В соответствии с некоторыми вариантами осуществления, модифицированный мицелиальный гриб содержит по меньшей мере одну клетку, имеющую пониженную экспрессию и/или активность ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6, ALP4 и ALP7. В соответствии с некоторыми вариантами осуществления, модифицированный мицелиальный гриб содержит по меньшей мере одну клетку, имеющую пониженную экспрессию и/или активность ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6, ALP4 и KЕХ2. В соответствии с некоторыми вариантами осуществления, модифицированный мицелиальный гриб дополнительно содержит по меньшей мере одну клетку, имеющую пониженную экспрессию и/или активность ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6, ALP4, ALP7 и KЕХ2.According to some embodiments, the modified filamentous fungus comprises at least one cell having reduced expression and/or activity of ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6, ALP4, and ALP7. According to some embodiments, the modified filamentous fungus comprises at least one cell having reduced expression and/or activity of ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6, ALP4, and KEX2. According to some embodiments, the modified filamentous fungus further comprises at least one cell having reduced expression and/or activity of ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6, ALP4, ALP7, and KEX2.

В соответствии с некоторыми вариантами осуществления, мицелиальный гриб дополнительно модифицируют для продуцирования белков с N-гликанами, аналогичных белкам человека, домашних животных и других млекопитающих. В соответствии с некоторыми вариантами осуществления, мицелиальный гриб включает делецию или повреждение гена alg3, так что гриб не может продуцировать функциональную альфа-1,3-маннозилтрансферазу. В соответствии с некоторыми дополнительными или альтернативными вариантами осуществления, мицелиальный гриб включает делецию или повреждение гена alg11, так что гриб не может продуцировать функциональную альфа-1,2-маннозилтрансферазу. В соответствии с еще одним дополнительным или альтернативным вариантом осуществления, мицелиальный гриб модифицирован для сверхэкспрессии флиппазы. Сверхэкспрессия флиппазы может быть достигнута путем сверхэкспрессии эндогенной флиппазы гриба или путем экспрессии гетерологичной флиппазы.According to some embodiments, the filamentous fungus is further modified to produce proteins with N-glycans similar to proteins of humans, domestic animals, and other mammals. According to some embodiments, the filamentous fungus comprises a deletion or disruption of the alg3 gene such that the fungus cannot produce a functional alpha-1,3-mannosyltransferase. According to some additional or alternative embodiments, the filamentous fungus comprises a deletion or disruption of the alg11 gene such that the fungus cannot produce a functional alpha-1,2-mannosyltransferase. According to yet another additional or alternative embodiment, the filamentous fungus is modified to overexpress flippase. Overexpression of flippase can be achieved by overexpressing an endogenous fungal flippase or by expressing a heterologous flippase.

В соответствии с определенными дополнительными или альтернативными вариантами осуществления, мицелиальный гриб дополнительно включает экспрессию гетерологичной GlcNAc трансферазы 1 (GNT1) и GlcNAc трансферазы 2 (GNT2). В некоторых вариантах осуществления, GNT1 содержит гетерологичный сигнал локализации в аппарате Гольджи.According to certain additional or alternative embodiments, the filamentous fungus further comprises expression of heterologous GlcNAc transferase 1 (GNT1) and GlcNAc transferase 2 (GNT2). In some embodiments, GNT1 comprises a heterologous Golgi localization signal.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок выбирают из группы, состоящей из антигена, антитела, фермента, вакцины и структурного белка.According to some embodiments, the protein of interest is selected from the group consisting of an antigen, an antibody, an enzyme, a vaccine, and a structural protein.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является секретируемым белком. В соответствии с определенными вариантами осуществления, представляющий интерес белок имеет лидерный или сигнальный пептид. В соответствии с другими вариантами осуществления, представляющий интерес белок является внутриклеточным белком.According to some embodiments, the protein of interest is a secreted protein. According to certain embodiments, the protein of interest has a leader or signal peptide. According to other embodiments, the protein of interest is an intracellular protein.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок включает две или более повторяющихся последовательностей белка или фрагмента белка.According to some embodiments, the protein of interest comprises two or more repeating protein or protein fragment sequences.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок слит с меткой. В соответствии с некоторыми вариантами осуществления, метка представляет собой С-концевую или N-концевую метку. В соответствии с некоторыми вариантами осуществления, метка выбрана из группы, состоящей из хитин-связывающего белка (СВР), мальтоза-связывающего белка (МВР), стреп-тега (Strep-tag), глутатион-S-трансферазы (ГСТ), метки FLAG, метки Spytag, С-метки, метки ALFA, метки V5, метки Мус, метки НА, метки Spot, метки Т7, метки NE и полигистидиновой (поли(His)) метки. В соответствии с некоторыми вариантами осуществления, метка представляет собой Spytag. В соответствии с некоторыми вариантами осуществления, метка представляет собой С-метку.According to some embodiments, the protein of interest is fused to a tag. According to some embodiments, the tag is a C-terminal or N-terminal tag. According to some embodiments, the tag is selected from the group consisting of chitin binding protein (CBP), maltose binding protein (MBP), Strep-tag, glutathione-S-transferase (GST), FLAG tag, Spytag tag, C-tag, ALFA tag, V5 tag, Myc tag, HA tag, Spot tag, T7 tag, NE tag, and polyhistidine (poly(His)) tag. According to some embodiments, the tag is Spytag. According to some embodiments, the tag is a C-tag.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является антителом или его фрагментом. В соответствии с некоторыми вариантами осуществления, антитело представляет собой IgG4 или IgG1. В соответствии с дополнительными вариантами осуществления, антитело представляет собой би- или множественно специфичное антитело. В соответствии с конкретными вариантами осуществления, антитело или его фрагмент представляет собой нейтрализующее антитело против коронавируса.In some embodiments, the protein of interest is an antibody or a fragment thereof. In some embodiments, the antibody is IgG4 or IgG1. In further embodiments, the antibody is a bi- or multi-specific antibody. In certain embodiments, the antibody or fragment thereof is a neutralizing antibody against coronavirus.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является антикалином.According to some embodiments, the protein of interest is anticalin.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является слитым с FC белком.According to some embodiments, the protein of interest is fused to an FC protein.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является антигеном.According to some embodiments, the protein of interest is an antigen.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является компонентом инфекционного агента. В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является компонентом грибов, бактерий или вирусов. В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является вирусным компонентом.According to some embodiments, the protein of interest is a component of an infectious agent. According to some embodiments, the protein of interest is a component of fungi, bacteria, or viruses. According to some embodiments, the protein of interest is a viral component.

В соответствии с некоторыми вариантами осуществления, вирусный компонент представляет собой эпидемический вирус. В соответствии с определенными иллюстративными вариантами осуществления, вирусные компоненты относятся к коронавирусу, вирусу гриппа, гепатиту В, гепатиту С, папилломавирусу, ВИЧ, вирусу Т-клеточного лейкоза человека 1 (HTLV-1) или вирусу Эпштейна-Барр (ВЭБ).According to some embodiments, the viral component is an epidemic virus. According to certain exemplary embodiments, the viral components are coronavirus, influenza virus, hepatitis B, hepatitis C, papillomavirus, HIV, human T-cell leukemia virus 1 (HTLV-1), or Epstein-Barr virus (EBV).

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является белком вируса гриппа. В соответствии с определенными вариантами осуществления, представляющий интерес белок является гемагглютинином (НА) или его фрагментом. В соответствии с определенными вариантами осуществления, представляющий интерес белок содержит трансмембранный домен (TMD) гемагглютинина. В соответствии с конкретными вариантами осуществления, представляющий интерес белок относится к подтипу гриппа H1N1.According to some embodiments, the protein of interest is an influenza virus protein. According to certain embodiments, the protein of interest is hemagglutinin (HA) or a fragment thereof. According to certain embodiments, the protein of interest comprises a transmembrane domain (TMD) of hemagglutinin. According to particular embodiments, the protein of interest is of the H1N1 influenza subtype.

В соответствии с некоторыми вариантами осуществления, продуцируемый белок гемагглютинин секретируется.According to some embodiments, the hemagglutinin protein produced is secreted.

В соответствии с некоторыми вариантами осуществления, вирусный компонент относится к коронавирусу. В соответствии с некоторыми примерными в данное время вариантами осуществления, коронавирус представляет собой SARS-CoV-2 (COVID-19).In some embodiments, the viral component is a coronavirus. In some currently exemplary embodiments, the coronavirus is SARS-CoV-2 (COVID-19).

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является спайковым белком. В соответствии с некоторыми вариантами осуществления, представляющий интерес белок содержит последовательность рецептор-связывающего домена (RBD) спайкового белка SARS-CoV-2 или ее фрагмент. В соответствии с некоторыми вариантами осуществления, представляющий интерес белок содержит RBD спайкового белка SARS-CoV-2. В соответствии с некоторыми вариантами осуществления, представляющий интерес белок состоит из RBD спайкового белка SARS-CoV-2. В соответствии с определенными вариантами осуществления, представляющий интерес белок содержит рецептор-связывающий мотив (RBM) спайкового белка SARS-CoV-2. В соответствии с конкретными вариантами осуществления, RBD или его фрагмент слиты с меткой Spytag. В соответствии с определенными вариантами осуществления, представляющий интерес белок содержит два, три или четыре повтора RBD или его фрагмента. В соответствии с дополнительными вариантами осуществления, представляющий интерес белок является нуклеокапсидом. В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является фрагментом S2 спайкового белка SARS-CoV-2.According to some embodiments, the protein of interest is the spike protein. According to some embodiments, the protein of interest comprises a receptor binding domain (RBD) sequence of the SARS-CoV-2 spike protein or a fragment thereof. According to some embodiments, the protein of interest comprises the RBD of the SARS-CoV-2 spike protein. According to some embodiments, the protein of interest consists of the RBD of the SARS-CoV-2 spike protein. According to certain embodiments, the protein of interest comprises the receptor binding motif (RBM) of the SARS-CoV-2 spike protein. According to particular embodiments, the RBD or a fragment thereof is fused to a Spytag. According to certain embodiments, the protein of interest comprises two, three, or four repeats of the RBD or a fragment thereof. According to further embodiments, the protein of interest is a nucleocapsid. According to some embodiments, the protein of interest is the S2 fragment of the SARS-CoV-2 spike protein.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является вирусным антигеном, слитым с Fc-фрагментом. В соответствии с определенными вариантами осуществления, Fc слит с N-концом антигена. В соответствии с другими вариантами осуществления, Fc слит с С-концом антигена.According to some embodiments, the protein of interest is a viral antigen fused to an Fc region. According to certain embodiments, the Fc is fused to the N-terminus of the antigen. According to other embodiments, the Fc is fused to the C-terminus of the antigen.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок представляет собой Fc-RBD. В соответствии с другими вариантами осуществления, представляющий интерес белок представляет собой RBD-Fc.In some embodiments, the protein of interest is Fc-RBD. In other embodiments, the protein of interest is RBD-Fc.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок содержит аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55 и SEQ ID NO: 57.According to some embodiments, the protein of interest comprises an amino acid sequence selected from the group consisting of SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, and SEQ ID NO: 57.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является инсулином. В соответствии с дополнительными вариантами осуществления, представляющий интерес белок является фибриногеном.According to some embodiments, the protein of interest is insulin. According to further embodiments, the protein of interest is fibrinogen.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является терапевтическим белком.According to some embodiments, the protein of interest is a therapeutic protein.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является белковым антигеном вакцины из вируса лихорадки долины Рифт (RVFV).According to some embodiments, the protein of interest is a Rift Valley fever virus (RVFV) vaccine protein antigen.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является слитым белком, состоящим из двух разных антигенов. В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является слитым белком, состоящим из двух компонентов разных вирусных антигенов. В соответствии с некоторыми вариантами осуществления, вирусные антигены относятся к коронавирусу и вирусу гриппа.According to some embodiments, the protein of interest is a fusion protein consisting of two different antigens. According to some embodiments, the protein of interest is a fusion protein consisting of two components of different viral antigens. According to some embodiments, the viral antigens are coronavirus and influenza virus.

В соответствии с некоторыми вариантами осуществления, вирусный антиген слит с последовательностью, нацеленной на МНСII. В соответствии с некоторыми вариантами осуществления, вирусный антиген и нацеливающая последовательность МНСII соединены через линкер.According to some embodiments, the viral antigen is fused to an MHCII targeting sequence. According to some embodiments, the viral antigen and the MHCII targeting sequence are connected via a linker.

В некоторых вариантах осуществления, метка является сайт-специфической флуоресцентной меткой для пептидов/белков.In some embodiments, the label is a site-specific fluorescent label for peptides/proteins.

В соответствии с некоторыми вариантами осуществления, генетически модифицированный аскомицетный мицелиальный гриб продуцирует экзогенный белок в повышенном количестве по сравнению с количеством, продуцируемым в соответствующем не модифицированном генетически исходном аскомицетном мицелиальном грибе, культивируемом в аналогичных условиях. В соответствии с некоторыми вариантами осуществления, генетически модифицированный аскомицетный мицелиальный гриб способен продуцировать по меньшей мере в 2 раза больше экзогенного белка по сравнению с исходным штаммом.According to some embodiments, the genetically modified ascomycetous filamentous fungus produces an exogenous protein in an increased amount compared to the amount produced in a corresponding non-genetically modified parental ascomycetous filamentous fungus cultivated under similar conditions. According to some embodiments, the genetically modified ascomycetous filamentous fungus is capable of producing at least 2 times more exogenous protein compared to the parental strain.

В соответствии с некоторыми вариантами осуществления, генетически модифицированный аскомицетный мицелиальный гриб способен увеличивать количество секретируемого экзогенного белка в питательной среде по меньшей мере в 1,5, 2, 5 или 10 раз по сравнению с исходным аскомицетный мицелиальный грибом. В соответствии с определенными вариантами осуществления, секретируемый белок представляет собой интактный белок.According to some embodiments, the genetically modified ascomycetous filamentous fungus is capable of increasing the amount of secreted exogenous protein in a nutrient medium by at least 1.5, 2, 5, or 10 times compared to the original ascomycetous filamentous fungus. According to certain embodiments, the secreted protein is an intact protein.

В соответствии с некоторыми вариантами осуществления, генетически модифицированный аскомицетный мицелиальный гриб способен увеличивать количество внутриклеточного экзогенного белка в клетках гриба по меньшей мере в 1,5, 2, 5 или 10 раз по сравнению с исходным аскомицетный мицелиальным грибом.According to some embodiments, the genetically modified ascomycetous filamentous fungus is capable of increasing the amount of intracellular exogenous protein in fungal cells by at least 1.5, 2, 5, or 10 times compared to the original ascomycetous filamentous fungus.

В соответствии с некоторыми вариантами осуществления, экзогенный белок, продуцируемый генетически модифицированным аскомицетный мицелиальным грибом, обладает повышенной стабильностью по сравнению с соответствующим белком, продуцируемым исходным штаммом аскомицетного мицелиального гриба, культивируемым в аналогичных условиях.According to some embodiments, the exogenous protein produced by the genetically modified ascomycetous filamentous fungus has increased stability compared to the corresponding protein produced by the original strain of ascomycetous filamentous fungus cultivated under similar conditions.

В соответствии с некоторыми вариантами осуществления, генетически модифицированный аскомицетный мицелиальный гриб растет с более высокой скоростью по сравнению с соответствующим исходным штаммом аскомицетного мицелиального гриба, культивируемым в аналогичных условиях.According to some embodiments, the genetically modified ascomycetous filamentous fungus grows at a higher rate compared to a corresponding original strain of ascomycetous filamentous fungus cultivated under similar conditions.

Полинуклеотид, кодирующий представляющий интерес белок, может составлять часть ДНК-конструкта или вектора экспрессии.A polynucleotide encoding a protein of interest may form part of a DNA construct or expression vector.

В соответствии с некоторыми вариантами осуществления, по меньшей мере один экзогенный полинуклеотид представляет собой ДНК-конструкт или вектор экспрессии, дополнительно содержащий по меньшей мере один регуляторный элемент, функциональный в указанном аскомицетном мицелиальном грибе. В соответствии с некоторыми вариантами осуществления, регуляторный элемент выбран из группы, состоящей из регуляторного элемента, эндогенного по отношению к указанному грибу, и регуляторного элемента, гетерологичного по отношению к указанному грибу.According to some embodiments, at least one exogenous polynucleotide is a DNA construct or expression vector, further comprising at least one regulatory element functional in said ascomycete filamentous fungus. According to some embodiments, the regulatory element is selected from the group consisting of a regulatory element endogenous to said fungus and a regulatory element heterologous to said fungus.

В соответствии с некоторыми вариантами осуществления, аскомицетный мицелиальный гриб относится к роду группы Pezizomycotina.According to some embodiments, the ascomycete filamentous fungus is a member of the Pezizomycotina group.

В соответствии с некоторыми вариантами осуществления, аскомицетный мицелиальный гриб относится к роду, выбранному из группы, состоящей из Thermothelomyces, Myceliophthora, Trichoderma, Aspergillus, Penicillium, Rasamsonia, Chrysosporium, Corynascus, Fusarium, Neurospora и Talaromyces.According to some embodiments, the ascomycete filamentous fungus is of a genus selected from the group consisting of Thermothelomyces, Myceliophthora, Trichoderma, Aspergillus, Penicillium, Rasamsonia, Chrysosporium, Corynascus, Fusarium, Neurospora, and Talaromyces.

В соответствии с некоторыми вариантами осуществления, аскомицетный мицелиальный гриб относится к виду, выбранному из группы, состоящей из Thermothelomyces heterothallica (также называемого Myceliophthora thermophila), Myceliophthora lutea, Aspergillus nidulans, Aspergillus funiculosus, Aspergillus niger, Aspergillus oryzae, Trichoderma reesei, Trichoderma harzianum, Trichoderma longibrachiatum, Trichoderma viride, Rasamsonia emersonii, Penicillium chrysogenum, Penicillium verrucosum, Sporotrichum thermophile, Corynascus fumimontanus, Corynascus thermophilus, Chrysosporium lucknowense, Fusarium graminearum, Fusarium venenatum, Neurospora crassa и Talaromyces piniphilus.According to some embodiments, the ascomycete filamentous fungus is a species selected from the group consisting of Thermothelomyces heterothallica (also called Myceliophthora thermophila), Myceliophthora lutea, Aspergillus nidulans, Aspergillus funiculosus, Aspergillus niger, Aspergillus oryzae, Trichoderma reesei, Trichoderma harzianum, Trichoderma longibrachiatum, Trichoderma viride, Rasamsonia emersonii, Penicillium chrysogenum, Penicillium verrucosum, Sporotrichum thermophile, Corynascus fumimontanus, Corynascus thermophilus, Chrysosporium lucknowense, Fusarium graminearum, Fusarium venenatum, Neurospora crassa, and Talaromyces piniphilus.

В соответствии с некоторыми вариантами осуществления, аскомицетный мицелиальный гриб представляет собой штамм Thermothelomyces heterothallica, содержащий последовательность рДНК, имеющую по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или 100% идентичности с последовательностью нуклеиновой кислоты, приведенной в SEQ ID NO: 2O.According to some embodiments, the ascomycetous filamentous fungus is a strain of Thermothelomyces heterothallica comprising an rDNA sequence that has at least 95%, or at least 96%, or at least 97%, or at least 98%, or at least 99%, or 100% identity to the nucleic acid sequence set forth in SEQ ID NO: 2O .

В соответствии с некоторыми вариантами осуществления, аскомицетный мицелиальный гриб представляет собой Thermothelomyces heterothallica C1.According to some embodiments, the ascomycetous filamentous fungus is Thermothelomyces heterothallica C1.

В одном аспекте, данное изобретение предусматривает способ получения гриба, способного продуцировать представляющий интерес белок, включающий конструирование гриба с ингибированной или пониженной экспрессией и/или активностью KЕХ2 и/или ALP7.In one aspect, the present invention provides a method for producing a fungus capable of producing a protein of interest, comprising engineering the fungus to have inhibited or reduced expression and/or activity of KEX2 and/or ALP7.

В соответствии с некоторыми вариантами осуществления, способ включает трансформацию по меньшей мере одной клетки гриба по меньшей мере одним экзогенным полинуклеотидом.According to some embodiments, the method comprises transforming at least one fungal cell with at least one exogenous polynucleotide.

В соответствии с дополнительным аспектом, данное изобретение предусматривает способ получения гриба, способного продуцировать представляющий интерес белок, включающий трансформацию по меньшей мере одной клетки гриба по меньшей мере одним экзогенным полинуклеотидом, при этом указанная по меньшей мере одна клетка имеет пониженную экспрессию и/или протеазную активность KЕХ2 и/или ALP7.According to a further aspect, the present invention provides a method for producing a fungus capable of producing a protein of interest, comprising transforming at least one fungal cell with at least one exogenous polynucleotide, wherein said at least one cell has reduced expression and/or protease activity of KEX2 and/or ALP7.

В соответствии с некоторыми вариантами осуществления, способ включает трансформацию по меньшей мере одной клетки гриба по меньшей мере двумя экзогенными полинуклеотидами, кодирующими разные белки.According to some embodiments, the method comprises transforming at least one fungal cell with at least two exogenous polynucleotides encoding different proteins.

В соответствии с некоторыми вариантами осуществления, способ дополнительно включает конструирование гриба с ингибированной или пониженной экспрессией и/или активностью по меньшей мере одной протеазы, выбранной из группы, состоящей из ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6 и ALP4 в по меньшей мере одной клетке.According to some embodiments, the method further comprises engineering the fungus with inhibited or reduced expression and/or activity of at least one protease selected from the group consisting of ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6 and ALP4 in at least one cell.

В соответствии с некоторыми вариантами осуществления, способ дополнительно включает конструирование гриба с ингибированной или пониженной экспрессией и/или активностью по меньшей мере двух различных протеаз, выбранных из группы, состоящей из ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6 и ALP4.According to some embodiments, the method further comprises engineering the fungus with inhibited or reduced expression and/or activity of at least two different proteases selected from the group consisting of ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6 and ALP4.

В соответствии с некоторыми вариантами осуществления, ингибирование экспрессии протеазы включает делецию или повреждение эндогенного гена, кодирующего протеазу.According to some embodiments, inhibiting the expression of a protease comprises deleting or damaging an endogenous gene encoding the protease.

В соответствии с некоторыми вариантами осуществления, аскомицетный мицелиальный гриб относится к роду, входящему в группу Pezizomycotina.According to some embodiments, the ascomycete filamentous fungus is of a genus within the group Pezizomycotina.

В соответствии с некоторыми вариантами осуществления, аскомицетный мицелиальный гриб относится к роду, выбранному из группы, состоящей из Thermothelomyces, Myceliophthora, Trichoderma, Aspergillus, Penicillium, Rasamsonia, Chrysosporium, Corynascus, Fusarium, Neurospora и Talaromyces.According to some embodiments, the ascomycete filamentous fungus is of a genus selected from the group consisting of Thermothelomyces, Myceliophthora, Trichoderma, Aspergillus, Penicillium, Rasamsonia, Chrysosporium, Corynascus, Fusarium, Neurospora, and Talaromyces.

В соответствии с некоторыми вариантами осуществления, аскомицетный мицелиальный гриб относится к видам, выбранным из группы, состоящей из Thermothelomyces heterothallica (или Myceliophthora thermophila), Myceliophthora lutea, Aspergillus nidulans, Aspergillus funiculosus, Aspergillus niger, Aspergillus oryzae, Trichoderma reesei, Trichoderma harzianum, Trichoderma longibrachiatum, Trichoderma viride, Rasamsonia emersonii, Penicillium chrysogenum, Penicillium verrucosum, Sporotrichum thermophile, Corynascus fumimontanus, Corynascus thermophilus, Chrysosporium lucknowense, Fusarium graminearum, Fusarium venenatum, Neurospora crassa и Talaromyces piniphilus.According to some embodiments, the ascomycete filamentous fungus is a species selected from the group consisting of Thermothelomyces heterothallica (or Myceliophthora thermophila), Myceliophthora lutea, Aspergillus nidulans, Aspergillus funiculosus, Aspergillus niger, Aspergillus oryzae, Trichoderma reesei, Trichoderma harzianum, Trichoderma longibrachiatum, Trichoderma viride, Rasamsonia emersonii, Penicillium chrysogenum, Penicillium verrucosum, Sporotrichum thermophile, Corynascus fumimontanus, Corynascus thermophilus, Chrysosporium lucknowense, Fusarium graminearum, Fusarium venenatum, Neurospora crassa, and Talaromyces piniphilus.

В соответствии с некоторыми вариантами осуществления, аскомицетный мицелиальный гриб представляет собой штамм Thermothelomyces heterothallica, содержащий последовательность рДНК, имеющую по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или 100% идентичности с последовательностью нуклеиновой кислоты, представленной в SEQ ID NO: 20.According to some embodiments, the ascomycete filamentous fungus is a strain of Thermothelomyces heterothallica comprising an rDNA sequence having at least 95%, or at least 96%, or at least 97%, or at least 98%, or at least 99%, or 100% identity to the nucleic acid sequence set forth in SEQ ID NO: 20.

В соответствии с некоторыми вариантами осуществления, аскомицетный мицелиальный гриб представляет собой Thermothelomyces heterothallica C1.According to some embodiments, the ascomycetous filamentous fungus is Thermothelomyces heterothallica C1.

В соответствии с еще одним аспектом, данное изобретение предусматривает способ получения по меньшей мере одного представляющего интерес белка, включающий культивацию генетически модифицированного гриба, как описано в данном документе, в подходящей среде; и выделение по меньшей мере одного белкового продукта.According to another aspect, the present invention provides a method for producing at least one protein of interest, comprising culturing a genetically modified fungus as described herein in a suitable medium; and isolating at least one protein product.

В соответствии с некоторыми вариантами осуществления, стадия выделения включает выделение белка из питательной среды, из грибковой массы или из того и другого.According to some embodiments, the isolating step comprises isolating the protein from the culture medium, from the fungal mass, or from both.

В соответствии с некоторыми вариантами осуществления, белок выделяют из питательной среды. В соответствии с определенным вариантом осуществления, секретируется по меньшей мере 50%, 60%, 70%, 80%, 90% или 95% белка.According to some embodiments, the protein is isolated from the nutrient medium. According to a particular embodiment, at least 50%, 60%, 70%, 80%, 90%, or 95% of the protein is secreted.

В соответствии с некоторыми вариантами осуществления, среда содержит источник углерода, выбранный из группы, состоящей из глюкозы, сахарозы, ксилозы, арабинозы, галактозы, фруктозы, лактозы, целлобиозы, глицерина и любой их комбинации.According to some embodiments, the medium comprises a carbon source selected from the group consisting of glucose, sucrose, xylose, arabinose, galactose, fructose, lactose, cellobiose, glycerol, and any combination thereof.

В соответствии с некоторыми вариантами осуществления, культивация генетически модифицированного гриба в подходящей среде обеспечивает продуцирование представляющего интерес белка в повышенном количестве по сравнению с количеством, продуцируемым в соответствующем не модифицированном негенетически исходном штамме гриба, культивируемом в аналогичных условиях.According to some embodiments, culturing a genetically modified fungus in a suitable medium provides for the production of a protein of interest in an increased amount compared to the amount produced in a corresponding non-genetically modified, non-genetically modified original fungal strain cultivated under similar conditions.

В соответствии с некоторыми вариантами осуществления, соответствующий исходный гриб относится к тому же виду, что и генетически модифицированный гриб. В соответствии с некоторыми вариантами осуществления, соответствующий исходный гриб является изогенным по отношению к генетически модифицированному грибу.According to some embodiments, the corresponding original fungus is of the same species as the genetically modified fungus. According to some embodiments, the corresponding original fungus is isogenic with respect to the genetically modified fungus.

В соответствии с другим аспектом, данное изобретение относится к представляющему интерес белку, полученному любым из описанных в данном документе способов.According to another aspect, the present invention relates to a protein of interest obtained by any of the methods described herein.

В соответствии с одним аспектом, данное изобретение относится к представляющему интерес белку, полученному способом, включающим культивацию генетически модифицированного гриба, как описано в данном документе, в подходящей среде; и выделение представляющего интерес белка.According to one aspect, the present invention relates to a protein of interest obtained by a method comprising culturing a genetically modified fungus as described herein in a suitable medium; and isolating the protein of interest.

Представляющий интерес белок является таким, как описано выше.The protein of interest is as described above.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является антигеном коронавируса. В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является спайковым белком коронавируса. В соответствии с некоторыми вариантами осуществления, представляющий интерес белок содержит последовательность RBD коронавируса или ее фрагмент. В соответствии с некоторыми вариантами осуществления, представляющий интерес белок содержит последовательность рецептор-связывающего мотива (RBM) спайкового белка коронавируса.In some embodiments, the protein of interest is a coronavirus antigen. In some embodiments, the protein of interest is a coronavirus spike protein. In some embodiments, the protein of interest comprises a coronavirus RBD sequence or a fragment thereof. In some embodiments, the protein of interest comprises a receptor binding motif (RBM) sequence of a coronavirus spike protein.

Данное изобретение дополнительно обеспечивает композицию, содержащую два или более различных представляющих интерес белков, полученных любым из описанных в данном документе способов.The present invention further provides a composition comprising two or more different proteins of interest obtained by any of the methods described herein.

В соответствии с определенными вариантами осуществления, композиция содержит по меньшей мере два разных антигена коронавируса, причем указанные антигены содержат последовательности разных вариантов коронавируса.According to certain embodiments, the composition comprises at least two different coronavirus antigens, wherein said antigens comprise sequences of different coronavirus variants.

Следует четко понимать, что объем данного изобретения охватывает гомологи, аналоги, варианты и производные, включая более короткие и более длинные полипептиды, белки и полинуклеотиды, а также аналоги полипептидов, белков и полинуклеотидов с одной или несколькими заменами аминокислот или нуклеиновых кислот, как известно в данной области техники, при условии, что такие варианты и модификации должны сохранять активность белка или ферментов, описанных в данном документе.It should be clearly understood that the scope of the present invention covers homologues, analogs, variants and derivatives, including shorter and longer polypeptides, proteins and polynucleotides, as well as analogs of polypeptides, proteins and polynucleotides with one or more amino acid or nucleic acid substitutions, as known in the art, provided that such variants and modifications must retain the activity of the protein or enzymes described herein.

Следует понимать, что любая комбинация каждого из аспектов и вариантов осуществления, раскрытых в данном документе, явным образом входит в раскрытие данного изобретения.It should be understood that any combination of each of the aspects and embodiments disclosed herein is expressly included within the disclosure of the present invention.

Другие цели, признаки и преимущества данного изобретения будут понятны из следующего описания и чертежей.Other objects, features and advantages of the present invention will be apparent from the following description and drawings.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВBRIEF DESCRIPTION OF GRAPHIC MATERIALS

Фиг. 1. Демонстрирует вестерн-блоттинг с обнаружением С-метки в 24-луночных планшетных культурах трансформантов С1, продуцирующих либо RBD-C-метку (левая панель), либо RBD-Spytag-C-метку (правая панель).Fig. 1. Shows Western blot analysis of C-tag detection in 24-well plate cultures of C1 transformants producing either RBD-C-tag (left panel) or RBD-Spytag-C-tag (right panel).

Фиг. 2. Продуцирование RBD-C-метки и RBD-Spytag-C-метки в штаммах с дефицитом протеазы С1 с делецией 12-14 генов протеазы. Самая высокая выработка белков RBD наблюдается у штаммов DNL155 и DNL159 с делецией kех2. Один из трех параллельных клонов как с RBD-C-меткой, так и с RBD-Spytag-C-меткой, рос плохо и, таким образом, продуцировал более низкие уровни белка.Fig. 2. Production of RBD-C-tag and RBD-Spytag-C-tag in C1 protease-deficient strains with deletion of 12-14 protease genes. The highest production of RBD proteins was observed in strains DNL155 and DNL159 with deletion of kex2. One of three parallel clones with both RBD-C-tag and RBD-Spytag-C-tag grew poorly and thus produced lower levels of protein.

Фиг. 3А-3В. Аффинная очистка по С-метке RBD-C-метки из культуры штамма C1 М4169 в биореакторе. Показаны окрашенный ДСН-гель (Фиг. 3А) и вестерн-анализ (Фиг. 3В) образцов с разных стадий очистки. Начало = Начальный образец после осветления, разбавленный 1:5 в геле; Начало потока = поток в начале загрузки образца, разбавленный 1:5 в геле; Конец потока = поток в конце загрузки образца, разбавленный 1:5 в геле; Fr4-Fr9 = фракции элюирования. Следует обратить внимание, что миграция образцов элюата перед диализом не является нормальной из-за высокой концентрации MgCl2.Fig. 3A-3B. C-tag affinity purification of RBD-C-tag from a bioreactor culture of C1 strain M4169. Stained SDS gel (Fig. 3A) and Western analysis (Fig. 3B) of samples from different stages of purification are shown. Start = Initial sample after clarification, diluted 1:5 in gel; Start Flow = Flow at the beginning of sample loading, diluted 1:5 in gel; End Flow = Flow at the end of sample loading, diluted 1:5 in gel; Fr4-Fr9 = elution fractions. Note that the migration of eluate samples before dialysis is not normal due to the high concentration of MgCl 2 .

Фиг. 4. Схематическое описание линии С1.Fig. 4. Schematic description of line C1.

На Фиг. 5 показаны эксперименты с добавлением антител к различным штаммам с дефицитом протеазы. Штаммы с делецией протеазы С1 культивировали в 24-луночных культуральных планшетах в течение 4 дней. Для экспериментов методом добавок, антитела инкубировали в культуральных супернатантах, брали пробы из образцов в разное время (0 ч, 3 ч, с/д (на следующий день) и ч/д (через день)) и анализировали методом вестерн-блоттинга. Для обнаружения тяжелых и легких цепей использовали отдельные антитела. На каждую дорожку загружали 270 нг мАт. Контроль - 200 нг.Figure 5 shows antibody addition experiments with different protease-deficient strains. C1 protease deletion strains were cultured in 24-well culture plates for 4 days. For addition experiments, antibodies were incubated in culture supernatants, samples were taken at different times (0 h, 3 h, d/d, and d/d) and analyzed by Western blotting. Separate antibodies were used to detect heavy and light chains. 270 ng of mAb were loaded into each lane. The control was 200 ng.

На Фиг. 6 показаны эксперименты с добавлением антител к штаммам с дефицитом различных из 13 протеаз. Штаммы с делецией протеазы С1 культивировали в 24-луночных культуральных планшетах в течение 4 дней. Для экспериментов методом добавок, антитела инкубировали в культуральных супернатантах, брали пробы из образцов в разное время (0 ч, 3 ч, с/д (на следующий день) и ч/д (через день)) и анализировали методом вестерн-блоттинга. На каждую дорожку загружали 270 нг мАт.Контроль - 200 нг.Figure 6 shows antibody addition experiments with strains deficient in various of the 13 proteases. Strains deficient in C1 protease were grown in 24-well culture plates for 4 days. For addition experiments, antibodies were incubated in culture supernatants, samples were taken at different times (0 h, 3 h, d/d (next day), and d/d (every other day)) and analyzed by Western blotting. Each lane was loaded with 270 ng of mAb. Control was 200 ng.

На Фиг. 7 показаны эксперименты с добавлением фибриногена к штаммам с дефицитом различных из 13 протеаз. Штаммы с делецией протеазы С1 культивировали в 24-луночных культуральных планшетах в течение 4 дней. Для экспериментов с введением добавок, белок фибриногена инкубировали в культуральных супернатантах. Пробы брали из образцов в разное время (0 ч, 3 ч, с/д и ч/д) и анализировали методом вестерн-блоттинга. Для обнаружения использовали поликлональные антитела к фибриногену (ко всем цепям фибриногена). На каждую дорожку загружали 240 нг фибриногена. Контроль - 200 нг.Fig. 7 shows experiments with the addition of fibrinogen to strains deficient in various of the 13 proteases. Strains with a deletion of protease C1 were grown in 24-well culture plates for 4 days. For the addition experiments, fibrinogen protein was incubated in the culture supernatants. Samples were taken from the samples at different times (0 h, 3 h, pm, and pm) and analyzed by Western blotting. Polyclonal antibodies to fibrinogen (to all fibrinogen chains) were used for detection. 240 ng of fibrinogen were loaded into each lane. The control was 200 ng.

На Фиг. 8 показаны эксперименты с добавлением Fc-FGF21 к штаммам с дефицитом различных из 13 протеаз. Штаммы с делецией протеазы С1 культивировали в 24-луночных культуральных планшетах в течение 4 дней. Для экспериментов с введением добавок, Fc-FGF21 инкубировали в культуральных супернатантах. Пробы брали из образцов в разное время (0 ч, 4 ч, с/д и ч/д) и анализировали методом вестерн-блоттинга. Для обнаружения использовали два антитела (анти-Fc и анти-FGF21). На каждую дорожку загружали 240 нг Fc-FGF21. Контроль - 200 нг.Fig. 8 shows experiments with addition of Fc-FGF21 to strains deficient in various of the 13 proteases. Strains deficient in C1 protease were grown in 24-well culture plates for 4 days. For addition experiments, Fc-FGF21 was incubated in culture supernatants. Samples were taken from samples at different times (0 h, 4 h, pm, and pm) and analyzed by Western blotting. Two antibodies (anti-Fc and anti-FGF21) were used for detection. Each lane was loaded with 240 ng of Fc-FGF21. The control was 200 ng.

На Фиг. 9. показано введение добавок (левая панель) и экспрессия (правая панель) мАт в штаммах с дефицитом 12 протеаз по сравнению со штаммами с дефицитом 13 протеаз, как указано.Fig. 9 shows the addition (left panel) and expression (right panel) of mAbs in 12 protease-deficient strains compared to 13 protease-deficient strains, as indicated.

На Фиг. 10 показана экспрессия мАт в штаммах с дефицитом 12 и 13 протеаз. Экспрессионный конструкт мАт трансформировали в штамм с делецией 13 протеаз и с делецией kех2. Трансформанты выращивали в 24-луночных планшетах, а полученные мАт анализировали методом вестерн-блоттинга. Те же мАт, экспрессированные в исходном штамме с делецией 12 протеаз и в штамме с делецией 13хΔаlр7, показаны в качестве контролей.Figure 10 shows mAb expression in 12- and 13-protease deficient strains. The mAb expression construct was transformed into a 13-protease deletion strain and a kex2 deletion strain. Transformants were grown in 24-well plates and the resulting mAbs were analyzed by Western blotting. The same mAbs expressed in the original 12-protease deletion strain and in the 13xΔalp7 deletion strain are shown as controls.

Фиг. 11. показывает продуцирование антигенного белка rvfv под промотором bgl штаммом dnl 155 с дефицитом 14 протеаз и штаммом с дефицитом 13 протеаз, как указано.Fig. 11 shows the production of rvfv antigenic protein under the bgl promoter by the 14-protease deficient strain dnl 155 and the 13-protease deficient strain, as indicated.

Фиг. 12А-12В показано, что RBD-Spytag и конъюгаты RBD-SpyTag с ВПЧ SpyCatcher HBsAg генерируют тримеры и/или димеры. Фиг. 12А - вестерн-блоттинг.Фиг.12В - ДСН-ПААГ.Fig. 12A-12B show that RBD-Spytag and RBD-SpyTag conjugates with SpyCatcher HBsAg HPV generate trimers and/or dimers. Fig. 12A - Western blot. Fig. 12B - SDS-PAGE.

Фиг. 13A-13F показывают связывание растворимого и конъюгированного RBD с hACE-2, определяемое с помощью непрямого ИФА. Фиг. 13А - схематическое изображение связывания антитела против RBD CR3022 с частицей ВПЧ RBD-ST:SC-HBsAg и детекции с помощью меченого конъюгата козьего а-антитела к IgG человека с щелочной фосфатазой (ЩФ). Фиг. 13В - Детекция различных серий RBD с частицей ВПЧ или без нее. Фигуры 13C-13D - схематическое изображение связывания ВПЧ RBD-ST:SC-HBsAg с hACE (13С) и контролем (13D). Фиг. 13E-13F. Результаты ИФА связывания hACE с ВПЧ-RBD в конъюгированном белке (13Е) или только с ВПЧ (13F).Fig. 13A-13F show the binding of soluble and conjugated RBD to hACE-2 as determined by indirect ELISA. Fig. 13A is a schematic representation of the binding of anti-RBD antibody CR3022 to the RBD-ST:SC-HBsAg HPV particle and detection by labeled goat anti-human IgG alpha-alkaline phosphatase (ALP) conjugate. Fig. 13B is a Detection of different RBD lots with or without the HPV particle. Fig. 13C-13D is a schematic representation of the binding of RBD-ST:SC-HBsAg HPV to hACE (13C) and control (13D). Fig. 13E-13F. ELISA results of hACE binding to HPV-RBD in the conjugated protein (13E) or to HPV alone (13F).

Фиг. 14А-14В. Вестерн-анализ трансформантов С1, продуцирующих слитый белок RBD-Fc (Фиг. 14А) или Fc-RBD (Фиг. 14В). Показаны исходные штаммы, используемые для продуцирования. Штамм DNL155 показан как отрицательный контроль. Дорожки с номерами 1-12 соответствуют отдельным трансформантам.Fig. 14A-14B. Western analysis of C1 transformants producing RBD-Fc (Fig. 14A) or Fc-RBD (Fig. 14B) fusion protein. The parental strains used for production are shown. Strain DNL155 is shown as a negative control. Lanes numbered 1-12 correspond to individual transformants.

Фиг. 15. - Вестерн-блоттинг с обнаружением С-метки в культурах трансформантов С1 на 24-луночных планшетах, продуцирующих рекомбинантный антиген αМНСII-Саl07 под контролем либо эндогенного промотора C1 bgl8, либо синтетического промотора AnSES в трансформантах, полученных из штаммов DNL155 и М3599. Подвижность целевого белка в геле согласуется с его предсказанным размером 87 кДа. Кроме того, во всех образцах, полученных из исходного штамма DNL155, присутствует эндогенный фоновый белок С1 размером 70 кДа, реагирующий с антителом.Fig. 15. - Western blot analysis with C-label detection in 24-well plate cultures of C1 transformants producing recombinant αMHCII-Cal07 antigen under the control of either the endogenous C1 bgl8 promoter or the synthetic AnSES promoter in transformants derived from strains DNL155 and M3599. The mobility of the target protein in the gel is consistent with its predicted size of 87 kDa. In addition, an endogenous background C1 protein of 70 kDa reactive with the antibody is present in all samples derived from the parent strain DNL155.

Фиг. 16А-16С - Аффинная очистка по С-метке αМНСII-Саl07 из биореакторной культуры штамма CI М4540. Показаны окрашенный ДСН-гель (Фиг. 16А) и вестерн-анализ (Фиг. 16 В) образцов с разных стадий очистки. Вход=Начальный образец после осветления, разбавленный 1:10 в геле; Поток=поток в начале загрузки образца, разбавленного 1:10 в геле; Промывка=поток во время промывки колонки. Следует отметить, что миграция образцов элюата перед диализом не является нормальной из-за высокой концентрации MgCl2. Фиг. 16С - анализ образца αМНСII-Саl07 методами окрашивания ДСН-ПААГ-геля и вестерн-блоттинга после диализа по сравнению с эталонным белком. Фиг. 17 - результаты вестерн-блоттинга культуры трансформантов С1, продуцирующих варианты RBD, на 24-луночном планшете. Желтый цвет - это наложение сигналов детектирующих агентов для обнаружения как RBD_(красный сигнал), так и С-метки (зеленый сигнал). UK (Великобритания) обозначает RBD_B.1.1.7-UK, SA (ЮАР) - RBD_B.1.351-SA, и BR (Бразилия) RBD_1.1.28.1(P.1)-BR. Образец, обозначенный как Wuhan (Ухань), получен из штамма М4169 С1, продуцирующего RBD Wuhan (Пример 4).Fig. 16A-16C. Affinity purification of C-labeled αMHCII-Cal07 from a bioreactor culture of the CI strain M4540. SDS-stained gel (Fig. 16A) and Western blot (Fig. 16B) of samples from different stages of purification are shown. Input = Initial sample after clarification, diluted 1:10 in the gel; Flow = Flow at the beginning of loading the sample, diluted 1:10 in the gel; Wash = Flow during column wash. Note that the migration of the eluate samples before dialysis is not normal due to the high concentration of MgCl2. Fig. 16C. SDS-PAGE and Western blot analysis of the αMHCII-Cal07 sample after dialysis, compared to the reference protein. Fig. 17 - Western blot results of a 24-well plate culture of C1 transformants producing RBD variants. Yellow is the superposition of the signals of the detection agents for both RBD_ (red signal) and the C-tag (green signal). UK denotes RBD_B.1.1.7-UK, SA - RBD_B.1.351-SA, and BR (Brazil) RBD_1.1.28.1(P.1)-BR. The sample designated as Wuhan is obtained from the M4169 C1 strain producing the Wuhan RBD (Example 4).

ПОДРОБНОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE ESSENCE OF THE INVENTION

Данное изобретение предусматривает альтернативную высокоэффективную систему для производства больших количеств белков. Система по данному изобретению частично основана на мицелиальном грибе Thermothelomyces heterothallica С1 и его конкретных штаммах, которые ранее были разработаны в качестве естественной биологической фабрики по производству белка, а также вторичного метаболита. Эти штаммы демонстрируют высокую скорость роста при сохранении низкой вязкости культуры и, таким образом, очень хорошо подходят для непрерывного роста в ферментационных культурах при объемах до 100000-150000 литров или больше. Данное изобретение в некоторых вариантах осуществления предлагает генетически модифицированные грибы, имеющие пониженную экспрессию и/или активность KЕХ2 и/или ALP7.The present invention provides an alternative, highly efficient system for producing large quantities of proteins. The system of the present invention is based in part on the filamentous fungus Thermothelomyces heterothallica C1 and specific strains thereof, which have previously been developed as a natural biological factory for the production of protein, as well as a secondary metabolite. These strains exhibit a high growth rate while maintaining a low culture viscosity and are thus very well suited for continuous growth in fermentation cultures at volumes of up to 100,000-150,000 liters or more. The present invention, in some embodiments, provides genetically modified fungi having reduced expression and/or activity of KEX2 and/or ALP7.

ОпределенияDefinitions

Аскомицетные мицелиальные грибы, как определено в данном документе, относятся к любому штамму грибов, принадлежащему к группе Pezizomycotina. Pezizomycotina включает, без ограничений, следующие группы:Ascomycete filamentous fungi, as defined herein, refer to any strain of fungi belonging to the group Pezizomycotina. Pezizomycotina includes, but is not limited to, the following groups:

Sordariales, включая роды:Sordariales, including genera:

Thermothelomyces (включая виды: heterothallica и thermophila),Thermothelomyces (including species: heterothallica and thermophila),

Myceliophthora (включая вид lutea и неназванные виды),Myceliophthora (including the species lutea and unnamed species),

Corynascus (включая вид fumimontanus),Corynascus (including the species fumimontanus),

Neurospora (включая вид crassa); Hypocreales, включая роды:Neurospora (including the species crassa); Hypocreales, including the genera:

Fusarium (включая виды graminearum и venenatum),Fusarium (including graminearum and venenatum species),

Trichoderma (включая виды reesei, harzianum, longibrachiatum и viride);Trichoderma (including species reesei, harzianum, longibrachiatum and viride);

Onygenales, включая роды:Onygenales, including genera:

Chrysosporium (включая вид lucknowense); Eurotiales, включая роды:Chrysosporium (including the species lucknowense); Eurotiales, including the genera:

Rasamsonia (включая вид emersonii),Rasamsonia (including the species emersonii),

Penicillium (включая вид verrucosum),Penicillium (including verrucosum species),

Aspergillus (включая виды funiculosus, nidulans, nigem oryzae), Talaromyces (включая вид piniphilus (ранее Penicillium funiculosum)); Следует понимать, что приведенный выше список не является окончательным и призван обеспечить неполный список промышленно значимых видов аскомицетных мицелиальных грибов.Aspergillus (including species funiculosus, nidulans, nigem oryzae), Talaromyces (including species piniphilus (formerly Penicillium funiculosum)); It should be understood that the above list is not definitive and is intended to provide a non-exhaustive list of industrially significant species of ascomycetous filamentous fungi.

Некоторые виды аскомицетных мицелиальных грибов могут существовать вне Pezizomycotina, и эта группа не включает Saccharomycotina, которые содержат наиболее широко известные немицелиальные промышленно значимые роды, такие как Saccharomyces, Komagataella (включая вид, ранее называвшийся Pichia pastoris), Kluyveromyces или Taphrinomycotina, которые содержат некоторые другие общеизвестные немицелиальные промышленно значимые роды, такие как Schizosaccharomyces.Some species of ascomycete filamentous fungi may exist outside the Pezizomycotina, and this group does not include the Saccharomycotina, which contains the most widely known non-mycelial industrially important genera such as Saccharomyces, Komagataella (including the species formerly called Pichia pastoris), Kluyveromyces, or Taphrinomycotina, which contains some other commonly known non-mycelial industrially important genera such as Schizosaccharomyces.

Все вышеперечисленные таксономические категории определены согласно браузеру таксономии NCBI (ncbi.nlm.nih.gov/taxonomy) на дату подачи заявки на патент.All of the above taxonomic categories are defined according to the NCBI Taxonomy Browser (ncbi.nlm.nih.gov/taxonomy) on the filing date of the patent application.

Следует понимать, что таксономия грибов находится в постоянном движении, и названия и иерархическое положение таксонов могут измениться в будущем. Однако специалист в данной области сможет однозначно определить, принадлежит ли конкретный грибковый штамм к группе, определенной выше.It should be understood that fungal taxonomy is in constant flux, and the names and hierarchical position of taxa may change in the future. However, a specialist in the field will be able to determine with certainty whether a particular fungal strain belongs to the group defined above.

В соответствии с некоторыми вариантами осуществления, род мицелиальных грибов выбирают из группы, состоящей из Myceliophthora, Thermothelomyces, Aspergillus, Penicillium, Trichoderma, Rasamsonia, Chrysosporium, Corynascus, Fusarium, Neurospora, Talaromyces и т.п. В соответствии с некоторыми вариантами осуществления, гриб выбирают из группы, состоящей из Myceliophthora thermophila, Thermothelomyces thermophila (ранее M. thermophila), Thermothelomyces heterothallica (ранее M. thermophila и heterothallica), Myceliophthora lutea, Aspergillus nidulans, Aspergillus funiculosus, Aspergillus niger, Aspergillus oryzae, Penicillium chrysogenum, Penicillium verrucosum, Trichoderma reesei, Trichoderma harzianum, Trichoderma longibrachiatum, Trichoderma viride, Chrysosporium lucknowense, Rasamsonia emersonii, Sporotrichum thermophile, Corynascus fumimontanus, Corynascus thermophilus, Fusarium graminearum, Fusarium venenatum, Neurospora crassa и Talaromy piniphilus.According to some embodiments, the genus of filamentous fungi is selected from the group consisting of Myceliophthora, Thermothelomyces, Aspergillus, Penicillium, Trichoderma, Rasamsonia, Chrysosporium, Corynascus, Fusarium, Neurospora, Talaromyces, etc. According to some embodiments, the fungus is selected from the group consisting of Myceliophthora thermophila, Thermothelomyces thermophila (formerly M. thermophila), Thermothelomyces heterothallica (formerly M. thermophila and heterothallica), Myceliophthora lutea, Aspergillus nidulans, Aspergillus funiculosus, Aspergillus niger, Aspergillus oryzae, Penicillium chrysogenum, Penicillium verrucosum, Trichoderma reesei, Trichoderma harzianum, Trichoderma longibrachiatum, Trichoderma viride, Chrysosporium lucknowense, Rasamsonia emersonii, Sporotrichum thermophile, Corynascus fumimontanus, Corynascus thermophilus, Fusarium graminearum, Fusarium venenatum, Neurospora crassa and Talaromy piniphilus.

В частности, данное изобретение предусматривает штамм C1 Thermothelomyces heterothallica в качестве модели аскомицетного мицелиального гриба, способного продуцировать большое количество стабильных белков.In particular, the present invention provides the C1 strain of Thermothelomyces heterothallica as a model ascomycete filamentous fungus capable of producing a large number of stable proteins.

Термины «Thermothelomyces» и его виды «Thermothelomyces heterothallica и thermophila» используются в данном документе в самом широком смысле, как известно в данной области техники. Описание рода и его видов приведено, например, в Marin-Felix Y (2015. Mycologica 107(3): 619-632 doi.org/10.3852/14-228) и van den Brink J et al. (2012, Fungal Diversity 52(1): 197-207). Используемые в данном документе термины «СТ» или «Thermothelomyces heterothallica С1» или Th.heterothallica С1 или С1 все относятся к штамму С1 Thermothelomyces heterothallica.The terms "Thermothelomyces" and its species "Thermothelomyces heterothallica and thermophila" are used herein in the broadest sense known in the art. Descriptions of the genus and its species are given, for example, in Marin-Felix Y (2015. Mycologica 107(3): 619-632 doi.org/10.3852/14-228) and van den Brink J et al. (2012, Fungal Diversity 52(1): 197-207). As used herein, the terms "CT" or "Thermothelomyces heterothallica C1" or Th.heterothallica C1 or C1 all refer to the strain C1 of Thermothelomyces heterothallica.

Отмечается, что вышеуказанные авторы (Marin-Felix et al., 2015) предложили разделение рода Myceliophthora на основании различий в оптимальной температуре роста, морфологии конидиоспор и деталей цикла полового размножения. В соответствии с предложенными критериями С1 явно принадлежит к вновь установленному роду Thermothelomyces, который содержит термотолерантные виды, ранее принадлежавшие к Myceliophthora, а не к роду Myceliophthora, который по-прежнему включает не-термотолерантные виды. Поскольку С1 может образовывать аскоспоры с некоторыми другими штаммами Thermothelomyces (ранее Myceliophthora) с противоположным типом спаривания, С1 лучше всего классифицировать как Th. heterothallica штамм С1, а не Th. thermophila C1.It is noted that the above-mentioned authors (Marin-Felix et al., 2015) proposed a subdivision of the genus Myceliophthora based on differences in optimal growth temperature, conidiospore morphology, and details of the sexual reproduction cycle. According to the proposed criteria, C1 clearly belongs to the newly established genus Thermothelomyces, which contains thermotolerant species previously belonging to Myceliophthora, rather than to the genus Myceliophthora, which still contains non-thermotolerant species. Since C1 can form ascospores with some other Thermothelomyces (formerly Myceliophthora) strains with opposite mating type, C1 is best classified as Th. heterothallica strain C1 rather than Th.

Следует также учитывать, что таксономия грибов в прошлом также постоянно менялась, поэтому нынешним названиям, перечисленным выше, могут предшествовать различные более старые названия, помимо Myceliophthora thermophila (van Oorschot, 1977. Persoonia 9(3):403), которые теперь считаются синонимами. Например, синонимами Thermothelomyces heterothallica (Marin-Felix et al., 2015. Mycologica, 3:619-63), являются Corynascus heterotchallicus, Thielavia heterothallica, Chrysosporium lucknowense и thermophile, а также Sporotrichium thermophile (Alpinis 1963. Nova Hedwigia 5:74).It should also be taken into account that fungal taxonomy has also been in a state of flux in the past, so the current names listed above may be preceded by various older names other than Myceliophthora thermophila (van Oorschot, 1977. Persoonia 9(3):403), which are now considered synonyms. For example, synonyms of Thermothelomyces heterothallica (Marin-Felix et al., 2015. Mycologica, 3:619–63) include Corynascus heterotchallicus, Thielavia heterothallica, Chrysosporium lucknowense and thermophile, and Sporotrichium thermophile (Alpinis 1963. Nova Hedwigia 5:74).

Кроме того, следует четко понимать, что данное изобретение охватывает любой штамм, содержащий последовательность рибосомальной ДНК (рДНК), которая демонстрирует гомологию 99% или более с SEQ ID NO: 20, и все такие штаммы считаются конспецифичными с Thermothelomyces heterothallica.It is furthermore expressly understood that the present invention encompasses any strain comprising a ribosomal DNA (rDNA) sequence that exhibits 99% or greater homology with SEQ ID NO: 20, and all such strains are considered conspecific with Thermothelomyces heterothallica.

В частности, термин штамм Th. heterothallica С1 включает генетически модифицированные субштаммы, полученные из штамма дикого типа, которые были мутированы с использованием случайных или направленных подходов, например, с использованием УФ-мутагенез а, или путем делеции одного или нескольких эндогенных генов. Например, штамм С1 может относиться к штамму дикого типа, модифицированному для удаления одного или нескольких генов, кодирующих эндогенную протеазу. Например, штаммы С1, охватываемые данным изобретением, включают штамм UV18-25, №депонирования VKM F-3631 D; штамм NG7C-19, №депонирования VKM F-3633 D; и штамм UV13-6, №депонирования VKM F-3632 D. Другие штаммы С1, которые можно использовать в соответствии с описанием данного изобретения, включают штамм НС UV18-100f, №депонирования CBS141147; штамм НС UV18-100f, №депонирования CBS141143; штамм LC W1L#100I, № депонирования CBS141153; и штамм LC WIUI00I, №депонирования CBS141149, и их производные.In particular, the term Th. heterothallica C1 strain includes genetically modified substrains derived from a wild-type strain that have been mutated using random or targeted approaches, such as using UV mutagenesis, or by deletion of one or more endogenous genes. For example, a C1 strain may refer to a wild-type strain modified to delete one or more genes encoding an endogenous protease. For example, C1 strains encompassed by the present invention include strain UV18-25, Deposit No. VKM F-3631 D; strain NG7C-19, Deposit No. VKM F-3633 D; and strain UV13-6, Deposit No. VKM F-3632 D. Other C1 strains that can be used in accordance with the description of the present invention include strain HC UV18-100f, Deposit No. CBS141147; strain HC UV18-100f, deposition number CBS141143; strain LC W1L#100I, deposition number CBS141153; and strain LC WIUI00I, deposition number CBS141149, and derivatives thereof.

Следует четко понимать, что принципы данного изобретения охватывают мутанты, производные, потомство и клоны штаммов Т. heterothallica С1, при условии, что эти производные, потомство и клоны, будучи генетически модифицированными в соответствии с описанием данного изобретения, способны продуцировать по меньшей мере один белковый продукт согласно данному изобретению.It should be clearly understood that the principles of the present invention encompass mutants, derivatives, progeny and clones of T. heterothallica C1 strains, provided that these derivatives, progeny and clones, when genetically modified in accordance with the description of the present invention, are capable of producing at least one protein product according to the present invention.

Следует четко понимать, что термин «производное» применительно к грибковой линии охватывает любую исходную грибковую линию с модификациями, положительно влияющими на выход продукта, эффективность или действенность, или влияющими на какой-либо признак, улучшающий грибковое производное в качестве инструмента для получения желаемого белка. Используемый в данном документе термин «потомство» относится к немодифицированному или частично модифицированному потомку исходной линии грибов, такому как клетка от клетки. Термин «исходный штамм» относится к соответствующему штамму гриба, не имеющему пониженной экспрессии или активности специфической протеазы по данному изобретению.It should be clearly understood that the term "derivative" when applied to a fungal line includes any parental fungal line with modifications that positively affect product yield, efficiency or effectiveness, or affect any trait that improves the fungal derivative as a tool for producing a desired protein. As used herein, the term "progeny" refers to an unmodified or partially modified descendant of the parental fungal line, such as a cell by cell. The term "parental strain" refers to a corresponding fungal strain that does not have reduced expression or activity of a specific protease of the invention.

В соответствии с одним из аспектов данного изобретения предлагается генетически модифицированный мицелиальный гриб для продуцирования представляющего интерес белка, причем генетически модифицированный мицелиальный гриб содержит по меньшей мере одну клетку со сниженной или отмененной экспрессией и/или активностью протеазы KЕХ2 и/или ALP7 и по меньшей мере одной дополнительной протеазы, и указанный мицелиальный гриб содержит по меньшей мере одну клетку, содержащую по меньшей мере один экзогенный полинуклеотид, кодирующий представляющий интерес белок.According to one aspect of the present invention, a genetically modified filamentous fungus is provided for producing a protein of interest, wherein the genetically modified filamentous fungus comprises at least one cell with reduced or abolished expression and/or activity of the KEX2 and/or ALP7 protease and at least one additional protease, and said filamentous fungus comprises at least one cell containing at least one exogenous polynucleotide encoding the protein of interest.

В соответствии с аспектом данного изобретения предлагается генетически модифицированный мицелиальный гриб для продуцирования гетерологичного белка, причем генетически модифицированный мицелиальный гриб содержит по меньшей мере одну клетку со сниженной или отмененной экспрессией и/или активностью KЕХ2 и по меньшей мере одной дополнительной протеазы, и указанный мицелиальный гриб содержит по меньшей мере одну клетку, содержащую по меньшей мере один экзогенный полинуклеотид, кодирующий гетерологичный белок.According to an aspect of the present invention, a genetically modified filamentous fungus is provided for producing a heterologous protein, wherein the genetically modified filamentous fungus comprises at least one cell with reduced or abolished expression and/or activity of KEX2 and at least one additional protease, and said filamentous fungus comprises at least one cell containing at least one exogenous polynucleotide encoding a heterologous protein.

В соответствии с аспектом данного изобретения предлагается генетически модифицированный мицелиальный гриб для продуцирования гетерологичного белка, причем генетически модифицированный мицелиальный гриб содержит по меньшей мере одну клетку со сниженной или отмененной экспрессией и/или активностью ALP7 и по меньшей мере одной дополнительной протеазы, и указанный мицелиальный гриб содержит по меньшей мере одну клетку, содержащую по меньшей мере один экзогенный полинуклеотид, кодирующий гетерологичный белок.According to an aspect of the present invention, a genetically modified filamentous fungus is provided for producing a heterologous protein, wherein the genetically modified filamentous fungus comprises at least one cell with reduced or abolished expression and/or activity of ALP7 and at least one additional protease, and said filamentous fungus comprises at least one cell containing at least one exogenous polynucleotide encoding a heterologous protein.

В соответствии с аспектом данного изобретения предлагается генетически модифицированный мицелиальный гриб для продуцирования гетерологичного белка, причем генетически модифицированный мицелиальный гриб содержит по меньшей мере одну клетку со сниженной или отмененной экспрессией и/или активностью протеаз ALP7, KЕХ2 и по меньшей мере одной дополнительной протеазы, и указанный мицелиальный гриб содержит по меньшей мере одну клетку, содержащую по меньшей мере один экзогенный полинуклеотид, кодирующий гетерологичный белок.According to an aspect of the present invention, a genetically modified filamentous fungus is provided for producing a heterologous protein, wherein the genetically modified filamentous fungus comprises at least one cell with reduced or abolished expression and/or activity of the proteases ALP7, KEX2 and at least one additional protease, and said filamentous fungus comprises at least one cell containing at least one exogenous polynucleotide encoding a heterologous protein.

В соответствии с некоторыми вариантами осуществления, по меньшей мере одна клетка имеет пониженную или отмененную экспрессию и/или активность 13 протеаз, одной из которых является KЕХ2. В соответствии с некоторыми вариантами осуществления, по меньшей мере одна клетка имеет пониженную или отмененную экспрессию и/или активность 13 протеаз, одной из которых является ALP7. В соответствии с некоторыми вариантами осуществления, по меньшей мере одна клетка имеет пониженную или отмененную экспрессию и/или активность 14 протеаз, включая KЕХ2 и ALP7.According to some embodiments, at least one cell has reduced or abolished expression and/or activity of 13 proteases, one of which is KEX2. According to some embodiments, at least one cell has reduced or abolished expression and/or activity of 13 proteases, one of which is ALP7. According to some embodiments, at least one cell has reduced or abolished expression and/or activity of 14 proteases, including KEX2 and ALP7.

Термины «белок» и «полипептид» используются в данном документе взаимозаменяемо и относятся к полимеру аминокислот, без указания на конкретную длину продукта; таким образом, в это определение включены пептиды, олигопептиды и полипептиды.The terms "protein" and "polypeptide" are used interchangeably herein and refer to a polymer of amino acids, without reference to the specific length of the product; thus, peptides, oligopeptides, and polypeptides are included within this definition.

Используемый в данном документе термин «представляющий интерес белок» относится к белку, который желательно экспрессируется в мицелиальных грибах на высоких уровнях. Такие белки включают, без ограничений, антитела, ферменты, белки, связывающие субстрат, структурные белки, антигены и т.п.As used herein, the term "protein of interest" refers to a protein that is desirably expressed at high levels in filamentous fungi. Such proteins include, but are not limited to, antibodies, enzymes, substrate binding proteins, structural proteins, antigens, and the like.

В соответствии с некоторыми вариантами осуществления, аскомицетный мицелиальный гриб содержит по меньшей мере одну клетку со сниженной или отмененной экспрессией и/или активностью KЕХ2 и по меньшей мере еще одной протеазы.According to some embodiments, the ascomycete filamentous fungus comprises at least one cell with reduced or abolished expression and/or activity of KEX2 and at least one other protease.

В соответствии с некоторыми вариантами осуществления, аскомицетный мицелиальный гриб содержит по меньшей мере одну клетку со сниженной или отмененной экспрессией и/или активностью по меньшей мере трех, по меньшей мере четырех, по меньшей мере пяти, по меньшей мере шести, по меньшей мере семи, по меньшей мере восьми, по меньшей мере девяти, по меньшей мере десяти, по меньшей мере одиннадцати, по меньшей мере двенадцати, по меньшей мере тринадцати, по меньшей мере четырнадцати или по меньшей мере пятнадцати протеаз.According to some embodiments, the ascomycetous filamentous fungus comprises at least one cell with reduced or abolished expression and/or activity of at least three, at least four, at least five, at least six, at least seven, at least eight, at least nine, at least ten, at least eleven, at least twelve, at least thirteen, at least fourteen, or at least fifteen proteases.

В соответствии с некоторыми вариантами осуществления, генетически модифицированный мицелиальный гриб не экспрессирует KЕХ2. В соответствии с некоторыми вариантами осуществления, генетически модифицированный мицелиальный гриб не экспрессирует ALP7.According to some embodiments, the genetically modified filamentous fungus does not express KEX2. According to some embodiments, the genetically modified filamentous fungus does not express ALP7.

В соответствии с некоторыми вариантами осуществления, генетически модифицированный мицелиальный гриб не экспрессирует ALP1. В соответствии с некоторыми вариантами осуществления, генетически модифицированный мицелиальный гриб не экспрессирует РЕР4. В соответствии с некоторыми вариантами осуществления, генетически модифицированный мицелиальный гриб не экспрессирует ALP2. В соответствии с некоторыми вариантами осуществления, генетически модифицированный мицелиальный гриб не экспрессирует PRT1. В соответствии с некоторыми вариантами осуществления, генетически модифицированный мицелиальный гриб не экспрессирует SRP1. В соответствии с некоторыми вариантами осуществления, генетически модифицированный мицелиальный гриб не экспрессирует ALP3. В соответствии с некоторыми вариантами осуществления, генетически модифицированный мицелиальный гриб не экспрессирует РЕР1. В соответствии с некоторыми вариантами осуществления, генетически модифицированный мицелиальный гриб не экспрессирует МТР2. В соответствии с некоторыми вариантами осуществления, генетически модифицированный мицелиальный гриб не экспрессирует РЕР5. В соответствии с некоторыми вариантами осуществления, генетически модифицированный мицелиальный гриб не экспрессирует МТР4. В соответствии с некоторыми вариантами осуществления, генетически модифицированный мицелиальный гриб не экспрессирует РЕР6. В соответствии с некоторыми вариантами осуществления, генетически модифицированный мицелиальный гриб не экспрессирует ALP4.According to some embodiments, the genetically modified filamentous fungus does not express ALP1. According to some embodiments, the genetically modified filamentous fungus does not express PEP4. According to some embodiments, the genetically modified filamentous fungus does not express ALP2. According to some embodiments, the genetically modified filamentous fungus does not express PRT1. According to some embodiments, the genetically modified filamentous fungus does not express SRP1. According to some embodiments, the genetically modified filamentous fungus does not express ALP3. According to some embodiments, the genetically modified filamentous fungus does not express PEP1. According to some embodiments, the genetically modified filamentous fungus does not express MTP2. According to some embodiments, the genetically modified filamentous fungus does not express PEP5. According to some embodiments, the genetically modified filamentous fungus does not express MTP4. According to some embodiments, the genetically modified filamentous fungus does not express PEP6. According to some embodiments, the genetically modified filamentous fungus does not express ALP4.

В соответствии с конкретными вариантами осуществления, аскомицетный мицелиальный гриб содержит по меньшей мере одну клетку со сниженной или отмененной экспрессией и/или активностью по меньшей мере одной дополнительной протеазы, выбранной из группы, состоящей из ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6 и ALP4. Каждый возможный вариант представляет собой отдельный вариант осуществления данного изобретения.According to specific embodiments, the ascomycetous filamentous fungus comprises at least one cell with reduced or abolished expression and/or activity of at least one additional protease selected from the group consisting of ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6 and ALP4. Each possible variant represents a separate embodiment of the present invention.

В соответствии с аспектом данного изобретения предложен генетически модифицированный аскомицетный мицелиальный гриб для продуцирования представляющего интерес белка, причем генетически модифицированный мицелиальный гриб содержит по меньшей мере одну клетку, содержащую экзогенные полинуклеотиды, кодирующие представляющий интерес белок, при этом указанный генетически модифицированный аскомицетный мицелиальный гриб не экспрессирует или экспрессирует уменьшенное количество KЕХ2 и/или ALP7, и по меньшей мере одной дополнительной протеазы, выбранной из группы, состоящей из ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6 и ALP4.According to an aspect of the present invention, a genetically modified ascomycetous filamentous fungus is provided for producing a protein of interest, wherein the genetically modified filamentous fungus comprises at least one cell comprising exogenous polynucleotides encoding the protein of interest, wherein said genetically modified ascomycetous filamentous fungus does not express or expresses a reduced amount of KEX2 and/or ALP7, and at least one additional protease selected from the group consisting of ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6 and ALP4.

В соответствии с некоторыми вариантами осуществления, мицелиальный гриб не экспрессирует или экспрессирует пониженное количество KЕХ2, ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6 и ALP4.According to some embodiments, the filamentous fungus does not express or expresses a reduced amount of KEX2, ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6, and ALP4.

В соответствии с некоторыми вариантами осуществления, мицелиальный гриб не экспрессирует или экспрессирует пониженное количество ALP7, ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6 и ALP4.According to some embodiments, the filamentous fungus does not express or expresses a reduced amount of ALP7, ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6, and ALP4.

В соответствии с некоторыми вариантами осуществления, мицелиальный гриб не экспрессирует или экспрессирует пониженное количество KЕХ2, ALP7, ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6 и ALP4.According to some embodiments, the filamentous fungus does not express or expresses a reduced amount of KEX2, ALP7, ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6, and ALP4.

В соответствии с аспектом данного изобретения, предусматривается генетически модифицированный аскомицетный мицелиальный гриб для продуцирования вирусного антигена, при этом генетически модифицированный мицелиальный гриб содержит по меньшей мере одну клетку, содержащую экзогенные полинуклеотиды, кодирующие вирусный антиген, и указанный генетически модифицированный аскомицетный мицелиальный гриб не экспрессирует или экспрессирует пониженное количество KЕХ2, ALP7, ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6 и ALP4.According to an aspect of the present invention, a genetically modified ascomycetous filamentous fungus is provided for producing a viral antigen, wherein the genetically modified filamentous fungus comprises at least one cell comprising exogenous polynucleotides encoding a viral antigen, and said genetically modified ascomycetous filamentous fungus does not express or expresses a reduced amount of KEX2, ALP7, ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6 and ALP4.

В соответствии с некоторыми вариантами осуществления, вирусный антиген представляет собой белок вакцинного антигена вируса лихорадки долины Рифт (RVFV).According to some embodiments, the viral antigen is a Rift Valley fever virus (RVFV) vaccine antigen protein.

В соответствии с аспектом, данное изобретение относится к генетически модифицированному аскомицетному мицелиальному грибу для продуцирования рецептор-связывающего домена (RBD) спайкового домена SARS-CoV2, при этом генетически модифицированный мицелиальный гриб содержит по меньшей мере одну клетку, содержащую экзогенные полинуклеотиды, кодирующие RBD, причем указанный генетически модифицированный аскомицетный мицелиальный гриб не экспрессирует или экспрессирует пониженное количество KЕХ2, ALP7, ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТВ2, РЕР5, МТР4, РЕР6 и ALP4.According to an aspect, the present invention relates to a genetically modified ascomycetous filamentous fungus for producing a receptor-binding domain (RBD) of the SARS-CoV2 spike domain, wherein the genetically modified filamentous fungus comprises at least one cell comprising exogenous polynucleotides encoding the RBD, wherein said genetically modified ascomycetous filamentous fungus does not express or expresses a reduced amount of KEX2, ALP7, ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTB2, PEP5, MTP4, PEP6 and ALP4.

Ген kех2, также известный как qds1, srb1 и vmn45, кодирует протеазу KЕХ2 или KEXIN. Протеаза KЕХ2 представляет собой серинпептидазу. Аминокислотная последовательность KЕХ2 Thermothelomyces heterothallica представлена в SEQ ID NO: 14.The kex2 gene, also known as qds1, srb1, and vmn45, encodes the KEX2 protease or KEXIN. The KEX2 protease is a serine peptidase. The amino acid sequence of Thermothelomyces heterothallica KEX2 is shown in SEQ ID NO: 14.

В соответствии с некоторыми вариантами осуществления, KЕХ2 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 14.According to some embodiments, KEX2 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 14.

Аминокислотная последовательность ALP7 Thermothelomyces heterothallica представлена в SEQ ID NO: 13.The amino acid sequence of Thermothelomyces heterothallica ALP7 is shown in SEQ ID NO: 13.

В соответствии с некоторыми вариантами осуществления, ALP7 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 13.According to some embodiments, ALP7 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 13.

Ген alp1 кодирует щелочную протеазу 1. ALP1 представляет собой секретируемую щелочную протеазу, которая позволяет ассимилировать белковые субстраты. Аминокислотная последовательность ALP1 Thermothelomyces heterothallica представлена в SEQ ID NO: 1.The alp1 gene encodes alkaline protease 1. ALP1 is a secreted alkaline protease that allows the assimilation of protein substrates. The amino acid sequence of Thermothelomyces heterothallica ALP1 is shown in SEQ ID NO: 1.

В соответствии с некоторыми вариантами осуществления, ALP1 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 1.According to some embodiments, ALP1 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 1.

Ген рер4 (синонимы: pho9, pral, yscA) представляет собой аспарагиновую пептидазу. Аминокислотная последовательность РЕР4 Thermothelomyces heterothallica представлена в SEQ ID NO: 2.The pep4 gene (synonyms: pho9, pral, yscA) is an aspartic peptidase. The amino acid sequence of Thermothelomyces heterothallica PEP4 is presented in SEQ ID NO: 2.

В соответствии с некоторыми вариантами осуществления, РЕР4 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 2.According to some embodiments, PEP4 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 2.

Аминокислотная последовательность ALP2 Thermothelomyces heterothallica представлена в SEQ ID NO: 3.The amino acid sequence of Thermothelomyces heterothallica ALP2 is shown in SEQ ID NO: 3.

В соответствии с некоторыми вариантами осуществления, ALP2 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 3.According to some embodiments, ALP2 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 3.

Аминокислотная последовательность PRT1 Thermothelomyces heterothallica представлена в SEQ ID NO: 4.The amino acid sequence of Thermothelomyces heterothallica PRT1 is shown in SEQ ID NO: 4.

В соответствии с некоторыми вариантами осуществления, PRT1 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 4.According to some embodiments, PRT1 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 4.

Аминокислотная последовательность SRP1 Thermothelomyces heterothallica представлена в SEQ ID NO: 5.The amino acid sequence of SRP1 of Thermothelomyces heterothallica is shown in SEQ ID NO: 5.

В соответствии с некоторыми вариантами осуществления, SRP1 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 5.According to some embodiments, SRP1 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 5.

Аминокислотная последовательность ALP3 Thermothelomyces heterothallica представлена в SEQ ID NO: 6.The amino acid sequence of Thermothelomyces heterothallica ALP3 is shown in SEQ ID NO: 6.

В соответствии с некоторыми вариантами осуществления, ALP3 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 6.According to some embodiments, ALP3 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 6.

Аминокислотная последовательность РЕР1 Thermothelomyces heterothallica представлена в SEQ ID NO: 7.The amino acid sequence of Thermothelomyces heterothallica PEP1 is shown in SEQ ID NO: 7.

В соответствии с некоторыми вариантами осуществления, РЕР1 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 7.According to some embodiments, PEP1 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 7.

Аминокислотная последовательность МТР2 Thermothelomyces heterothallica представлена в SEQ ID NO: 8.The amino acid sequence of Thermothelomyces heterothallica MTP2 is shown in SEQ ID NO: 8.

В соответствии с некоторыми вариантами осуществления, МТР2 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 8.According to some embodiments, MTP2 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 8.

Аминокислотная последовательность РЕР5 Thermothelomyces heterothallica представлена в SEQ ID NO: 9.The amino acid sequence of Thermothelomyces heterothallica PEP5 is shown in SEQ ID NO: 9.

В соответствии с некоторыми вариантами осуществления, РЕР5 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 9.According to some embodiments, PEP5 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 9.

Аминокислотная последовательность МТР4 Thermothelomyces heterothallica представлена в SEQ ID NO: 10.The amino acid sequence of Thermothelomyces heterothallica MTP4 is shown in SEQ ID NO: 10.

В соответствии с некоторыми вариантами осуществления, МТР4 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 10.According to some embodiments, MTP4 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 10.

Аминокислотная последовательность РЕР6 Thermothelomyces heterothallica представлена в SEQ ID NO: 11.The amino acid sequence of Thermothelomyces heterothallica PEP6 is shown in SEQ ID NO: 11.

В соответствии с некоторыми вариантами осуществления, РЕР6 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 11.According to some embodiments, PEP6 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 11.

Аминокислотная последовательность ALP4 Thermothelomyces heterothallica представлена в SEQ ID NO: 12.The amino acid sequence of Thermothelomyces heterothallica ALP4 is shown in SEQ ID NO: 12.

В соответствии с некоторыми вариантами осуществления, ALP4 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 12.According to some embodiments, ALP4 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 12.

Аминокислотная последовательность ALP5 Thermothelomyces heterothallica представлена в SEQ ID NO: 15.The amino acid sequence of Thermothelomyces heterothallica ALP5 is shown in SEQ ID NO: 15.

В соответствии с некоторыми вариантами осуществления, ALP5 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 15.According to some embodiments, ALP5 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 15.

Аминокислотная последовательность ALP6 Thermothelomyces heterothallica представлена в SEQ ID NO: 16.The amino acid sequence of Thermothelomyces heterothallica ALP6 is shown in SEQ ID NO: 16.

В соответствии с некоторыми вариантами осуществления, ALP6 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 16.According to some embodiments, ALP6 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 16.

Аминокислотная последовательность SRP3 Thermothelomyces heterothallica представлена в SEQ ID NO: 17.The amino acid sequence of SRP3 of Thermothelomyces heterothallica is shown in SEQ ID NO: 17.

В соответствии с некоторыми вариантами осуществления, SRP3 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 17.According to some embodiments, SRP3 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 17.

Аминокислотная последовательность SRP5 Thermothelomyces heterothallica представлена в SEQ ID NO: 18.The amino acid sequence of SRP5 of Thermothelomyces heterothallica is shown in SEQ ID NO: 18.

В соответствии с некоторыми вариантами осуществления, SRP5 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 18.According to some embodiments, SRP5 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 18.

Аминокислотная последовательность SRP8 Thermothelomyces heterothallica представлена в SEQ ID NO: 19.The amino acid sequence of SRP8 of Thermothelomyces heterothallica is shown in SEQ ID NO: 19.

В соответствии с некоторыми вариантами осуществления, SRP8 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности с SEQ ID NO: 19.According to some embodiments, SRP8 comprises an amino acid sequence having at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identity to SEQ ID NO: 19.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок слит с меткой. В соответствии с некоторыми вариантами осуществления, метка представляет собой С-концевую или N-концевую метку. В соответствии с некоторыми вариантами осуществления, метка выбрана из группы, состоящей из хитин-связывающего белка (СВР), мальтоза-связывающего белка (МВР), стреп-тега (Strep-tag), глутатион-S-трансферазы (ГСТ), метки FLAG, метки Spytag, С-метки, метки ALFA, метки V5, метки Мус, метки НА, метки Spot, метки Т7, метки NE и полигистидиновой (поли(His) метки. В соответствии с некоторыми вариантами осуществления, метка представляет собой Spytag. В соответствии с некоторыми вариантами осуществления, метка представляет собой С-метку.According to some embodiments, the protein of interest is fused to a tag. According to some embodiments, the tag is a C-terminal or N-terminal tag. According to some embodiments, the tag is selected from the group consisting of chitin binding protein (CBP), maltose binding protein (MBP), Strep-tag, glutathione-S-transferase (GST), FLAG tag, Spytag tag, C-tag, ALFA tag, V5 tag, Myc tag, HA tag, Spot tag, T7 tag, NE tag, and polyhistidine (poly(His) tag. According to some embodiments, the tag is Spytag. According to some embodiments, the tag is a C-tag.

Используемый в данном документе термин «метка» относится к аминокислотной последовательности, которая обычно в данной области техники слита с другой аминокислотной последовательностью или включена в нее для а) облегчения очистки всей аминокислотной последовательности или полипептида, б) улучшения экспрессии всей аминокислотной последовательности или полипептида, и/или с) облегчения обнаружения всей аминокислотной последовательности или полипептида.As used herein, the term "tag" refers to an amino acid sequence that is commonly fused to or included in another amino acid sequence in the art to a) facilitate purification of the entire amino acid sequence or polypeptide, b) improve expression of the entire amino acid sequence or polypeptide, and/or c) facilitate detection of the entire amino acid sequence or polypeptide.

Термин «С-метка» хорошо известен в данной области техники и относится к аффинной метке из 4 аминокислот: ЕРЕА (глутаминовая кислота-пролин-глутаминовая кислота-аланин), которая может быть слита с С-концом любого рекомбинантного белка. Метка обеспечивает высокую аффинность и селективность при использовании в целях очистки.The term "C-tag" is well known in the art and refers to a 4 amino acid affinity tag: EPEA (glutamic acid-proline-glutamic acid-alanine), which can be fused to the C-terminus of any recombinant protein. The tag provides high affinity and selectivity when used for purification purposes.

Термин «Spytag» хорошо известен в данной области и относится к короткому пептиду, который ковалентно связывается с белком SpyCatcher. Последовательность Spytag: Ala-His-Ile-Val-Met-Val-Asp-Ala-Tyr-Lys-Pro-Thr-Lys.The term "Spytag" is well known in the art and refers to a short peptide that covalently binds to the SpyCatcher protein. The sequence of Spytag is Ala-His-Ile-Val-Met-Val-Asp-Ala-Tyr-Lys-Pro-Thr-Lys.

Термин «стреп-тег» используется в данном документе как известный в данной области техники и относится к методу, позволяющему очищать и обнаруживать белки с помощью аффинной хроматографии. Метод основан на связывании с Strep-Tactin.The term "Strep-Tag" is used herein as is known in the art and refers to a method for purifying and detecting proteins using affinity chromatography. The method is based on binding to Strep-Tactin.

Термин «глутатион-S-трансферазы (ГСТ)» используется в данном документе как известный в данной области техники и основан на сильной аффинности связывания белка ГСТ с глутатионом (GSH). Метка ГСТ часто используется для разделения и очистки белков, содержащих слитый с ГСТ белок. Длина метки составляет 22O аминокислот.The term "glutathione S-transferase (GST)" is used herein as it is known in the art and is based on the strong binding affinity of the GST protein for glutathione (GSH). The GST tag is often used to separate and purify proteins containing a GST fusion protein. The tag is 2 2 O amino acids long.

Термин «FLAG-метка» используется в данном документе, как известно в данной области техники, и относится к полипептидной белковой метке, которая может быть добавлена к белку с использованием технологии рекомбинантной ДНК. Это одна из наиболее специфических меток, представляющая собой искусственный антиген, к которому были разработаны специфические высокоаффинные моноклональные антитела и, таким образом, может использоваться для очистки белков с помощью аффинной хроматографии.The term "FLAG tag" is used herein as is known in the art and refers to a polypeptide protein tag that can be added to a protein using recombinant DNA technology. It is one of the most specific tags, representing an artificial antigen to which specific high-affinity monoclonal antibodies have been developed and can thus be used to purify proteins using affinity chromatography.

Термин «ALFA-метка» используется в данном документе, как известно в данной области техники, и относится к эпитопной метке, специфически распознаваемой нанотелом, которое можно использовать для обнаружения и очистки.The term "ALFA tag" is used herein as is known in the art and refers to an epitope tag specifically recognized by a nanobody that can be used for detection and purification.

Метка V5 представляет собой короткую пептидную метку для обнаружения и очистки белков. Метка V5 может быть слита/клонирована с рекомбинантным белком и обнаружена с помощью ИФА, проточной цитометрии, иммунопреципитации, иммунофлуоресценции и вестерн-блоттинга с использованием антител и нанотел.The V5 tag is a short peptide tag for protein detection and purification. The V5 tag can be fused/cloned to recombinant protein and detected by ELISA, flow cytometry, immunoprecipitation, immunofluorescence, and Western blotting using antibodies and nanobodies.

Термин «Мус-метка» используется в данном документе, как известно в данной области техники, и относится к короткой пептидной метке, полученной из гена с-тус, которая может распознаваться специфическими антителами.The term "Myc tag" is used herein as is known in the art and refers to a short peptide tag derived from the c-myc gene that can be recognized by specific antibodies.

«НА-метка» используется в данном документе, как известно в данной области техники, и относится к пептиду, полученному из молекулы гемагглютинина (НА) человеческого гриппа, соответствующему аминокислотам 98-106. Эта метка используется для облегчения обнаружения, выделения и очистки представляющего интерес белка."HA tag" is used herein as is known in the art and refers to a peptide derived from the human influenza hemagglutinin (HA) molecule corresponding to amino acids 98-106. This tag is used to facilitate detection, isolation and purification of the protein of interest.

«Spot-метка» представляет собой пептидную метку из 12 аминокислот, распознаваемую однодоменным наноантителом (sdAb). Метку можно использовать для различных приложений, включая иммунопреципитацию, аффинную очистку, иммунофлуоресценцию и микроскопию сверхвысокого разрешения.The "Spot Tag" is a 12 amino acid peptide tag recognized by a single-domain nanoantibody (sdAb). The tag can be used for a variety of applications including immunoprecipitation, affinity purification, immunofluorescence, and super-resolution microscopy.

Термин «метка Т7» используется в данном документе, как известно в данной области техники, и относится к эпитопной метке, состоящей из пептида с 11 остатками, кодируемого лидерной последовательностью гена 10 бактериофага Т7.The term "T7 tag" is used herein as is known in the art and refers to an epitope tag consisting of an 11-residue peptide encoded by the leader sequence of gene 10 of bacteriophage T7.

Термин «NE-метка» используется в данном документе, как известно в данной области техники, и относится к синтетической пептидной метке (NE-метке), разработанной в качестве эпитопной метки для обнаружения, количественного определения и очистки рекомбинантных белков. Эта пептидная метка состоит из восемнадцати гидрофильных аминокислот.The term "NE tag" is used herein as is known in the art and refers to a synthetic peptide tag (NE tag) developed as an epitope tag for detection, quantification and purification of recombinant proteins. This peptide tag consists of eighteen hydrophilic amino acids.

Термин «поли(His)-метка» или «полигистидиновая метка» известен в данной области техники и относится к аминокислотному мотиву в белках, который обычно состоит из по меньшей мере шести остатков гистидина (His), часто на N- или С-конце белка. Она также известна как гексагистидиновая метка, 6xHis-метка и метка His6. Короткий пептид может связываться ионами металлов, такими как двухвалентный никель или кобальт.The term "poly(His) tag" or "polyhistidine tag" is known in the art and refers to an amino acid motif in proteins that typically consists of at least six histidine (His) residues, often at the N- or C-terminus of the protein. It is also known as a hexahistidine tag, 6xHis tag, and His6 tag. The short peptide can be bound by metal ions such as divalent nickel or cobalt.

В соответствии с некоторыми вариантами осуществления, мицелиальный гриб дополнительно модифицируют для продуцирования белков с N-гликанами, аналогичных белкам человека, домашних животных и других млекопитающих. В соответствии с некоторыми вариантами осуществления, мицелиальный гриб включает делецию или повреждение гена alg3, так что гриб не может продуцировать функциональную альфа-1,3-маннозилтрансферазу. В соответствии с некоторыми вариантами осуществления, мицелиальный гриб включает делецию или повреждение гена alg11, так что гриб не может продуцировать функциональную альфа-1,2-маннозилтрансферазу. В соответствии с некоторыми вариантами осуществления, мицелиальный гриб характеризуется сверхэкспрессией эндогенной флиппазы или экспрессией гетерологичной флиппазы.According to some embodiments, the filamentous fungus is further modified to produce proteins with N-glycans similar to proteins of humans, domestic animals, and other mammals. According to some embodiments, the filamentous fungus comprises a deletion or damage to the alg3 gene, such that the fungus cannot produce a functional alpha-1,3-mannosyltransferase. According to some embodiments, the filamentous fungus comprises a deletion or damage to the alg11 gene, such that the fungus cannot produce a functional alpha-1,2-mannosyltransferase. According to some embodiments, the filamentous fungus is characterized by overexpression of an endogenous flippase or expression of a heterologous flippase.

В соответствии с некоторыми вариантами осуществления, мицелиальный гриб дополнительно включает экспрессию гетерологичной GlcNAc-трансферазы 1 (GNT1) и GlcNAc-трансферазы 2 (GNT2). В некоторых вариантах осуществления, GNT1 содержит гетерологичный сигнал локализации в аппарате Гольджи. В некоторых вариантах осуществления, гетер о логичные GNT1 и GNT2 имеют животное происхождение.According to some embodiments, the filamentous fungus further comprises expression of heterologous GlcNAc transferase 1 (GNT1) and GlcNAc transferase 2 (GNT2). In some embodiments, GNT1 comprises a heterologous Golgi localization signal. In some embodiments, heterologous GNT1 and GNT2 are of animal origin.

В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является антигеном. В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является спайковым белком. В соответствии с некоторыми вариантами осуществления, представляющий интерес белок содержит последовательность рецептор-связывающего домена (RBD) спайкового белка SARS-CoV-2 или ее фрагмент. В соответствии с некоторыми вариантами осуществления, представляющий интерес белок является RBD спайкового белка SARS-CoV-2. В соответствии с определенными вариантами осуществления, представляющий интерес белок содержит рецептор-связывающий мотив (RBM) спайкового белка SARS-CoV-2. В соответствии с некоторыми вариантами осуществления, представляющий интерес белок содержит последовательность гликопротеин-связывающего домена (GBD) S-белка SARS-CoV-2. В соответствии с конкретными вариантами осуществления, RBD или его фрагмент слиты с меткой Spytag. В соответствии с некоторыми вариантами осуществления, RBD или его фрагмент слиты с С-меткой. В соответствии с дополнительными вариантами осуществления, RBD слит с Fc антитела. В соответствии с определенными вариантами осуществления, представляющий интерес белок содержит два, три или четыре повтора RBD или его фрагмента.According to some embodiments, the protein of interest is an antigen. According to some embodiments, the protein of interest is the spike protein. According to some embodiments, the protein of interest comprises a receptor binding domain (RBD) sequence of the SARS-CoV-2 spike protein, or a fragment thereof. According to some embodiments, the protein of interest is the RBD of the SARS-CoV-2 spike protein. According to certain embodiments, the protein of interest comprises the receptor binding motif (RBM) of the SARS-CoV-2 spike protein. According to some embodiments, the protein of interest comprises a glycoprotein binding domain (GBD) sequence of the SARS-CoV-2 S protein. According to certain embodiments, the RBD or a fragment thereof is fused to a Spytag. According to some embodiments, the RBD or a fragment thereof is fused to a C-tag. According to additional embodiments, the RBD is fused to the Fc of the antibody. According to certain embodiments, the protein of interest comprises two, three, or four repeats of the RBD or a fragment thereof.

С последовательностью антигена коронавируса могут проводиться манипуляции в соответствии с любым известным или обнаруженным вариантом коронавируса. Например, с последовательностью можно манипулировать в соответствии с последовательностью, описанной в Rambaut et al. nCoV-2019 Genomic Epidemiology, December 2020 (https://virological.org/t/preliminary-genomic-characterisation-of-an-emergent-sars-cov-2-lineage-in-the-uk-defined-by-a-novel-set-of-spike-mutations/563), Tegally, H. et al. 2020 (https://www.medrxiv.org/content /10.1101/2O2O. 21.12.2O24 8640vl), или Faria NR, et al. 2020 (https://virological.org/t/genomic-characterisation-of-an-emergentsars-cov-2-lineage-in-manaus-preliminary-findings/586). Данное изобретение охватывает аминокислотные последовательности, которые по существу гомологичны аминокислотным последовательностям на основе любой из последовательностей, определенных в данной заявке. Термины «идентичность последовательности» и «гомология последовательности» считаются синонимами в данном описании.The coronavirus antigen sequence can be manipulated according to any known or discovered coronavirus variant. For example, the sequence can be manipulated according to the sequence described in Rambaut et al. nCoV-2019 Genomic Epidemiology, December 2020 (https://virological.org/t/preliminary-genomic-characterisation-of-an-emergent-sars-cov-2-lineage-in-the-uk-defined-by-a-novel-set-of-spike-mutations/563), Tegally, H. et al. 2020 (https://www.medrxiv.org/content /10.1101/ 2 O 2 O. 21.12. 2 O24 8640vl), or Faria NR, et al. 2020 (https://virological.org/t/genomic-characterisation-of-an-emergentsars-cov-2-lineage-in-manaus-preliminary-findings/586). The present invention encompasses amino acid sequences that are substantially homologous to amino acid sequences based on any of the sequences defined in this application. The terms "sequence identity" and "sequence homology" are considered synonymous in this specification.

Существует множество доступных установленных алгоритмов для выравнивания двух аминокислотных последовательностей. Как правило, одна последовательность служит эталонной последовательностью, с которой можно сравнивать тестовые последовательности. Алгоритм сравнения последовательностей вычисляет процент идентичности последовательности для тестовой последовательности (последовательностей) по сравнению с эталонной последовательностью на основе указанных параметров программы. Выравнивание аминокислотных последовательностей для сравнения можно проводить, например, с помощью алгоритмов, реализуемых компьютером (например, GAP, BESTFIT, FASTA или TFASTA), или алгоритмов BLAST и BLAST 2.0.There are many established algorithms available for aligning two amino acid sequences. Typically, one sequence serves as a reference sequence to which test sequences can be compared. The sequence comparison algorithm calculates the percent sequence identity for the test sequence(s) compared to the reference sequence based on specified program parameters. Amino acid sequence alignment for comparison can be performed, for example, using computer-implemented algorithms (e.g., GAP, BESTFIT, FASTA, or TFASTA) or the BLAST and BLAST 2.0 algorithms.

При сравнении, идентичность может существовать в области последовательностей длиной не менее 10 аминокислотных остатков (например, длиной не менее 15, 20, 30, 40, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650 или 685 аминокислотных остатков, например, вплоть до полной длины эталонной последовательности). Каждый возможный вариант представляет собой отдельный вариант осуществления данного изобретения.When compared, the identity may exist over a region of sequences of at least 10 amino acid residues in length (e.g., at least 15, 20 , 30, 40, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650 or 685 amino acid residues in length, e.g., up to the full length of the reference sequence). Each possible variant represents a separate embodiment of the present invention.

Термин «экзогенный», используемый в данном документе, относится к полинуклеотиду или белку, который в природе не экспрессируется в грибе (например, к гетерологичному полинуклеотиду другого вида). Экзогенный полинуклеотид может быть введен в грибок стабильно или транзиентно, чтобы продуцировать молекулу рибонуклеиновой кислоты (РНК) и/или молекулу полипептида.The term "exogenous" as used herein refers to a polynucleotide or protein that is not naturally expressed in a fungus (e.g., a heterologous polynucleotide from another species). An exogenous polynucleotide may be stably or transiently introduced into a fungus to produce a ribonucleic acid (RNA) molecule and/or a polypeptide molecule.

Используемый в данном документе термин «гетерологичный» включает последовательность, которая была встроена в грибы и не встречается в указанных грибах в природе.As used herein, the term "heterologous" includes a sequence that has been inserted into a fungus and is not naturally occurring in said fungi.

Термины «ДНК-конструкт», «вектор экспрессии», «экспрессионный конструкт» и «кассета экспрессии» используются для обозначения искусственно собранной или выделенной молекулы нуклеиновой кислоты, которая включает последовательность нуклеиновой кислоты, кодирующую представляющий интерес белок, и которая собрана таким образом, чтобы представляющий интерес белок функционально экспрессировался в целевой клетке-хозяине. Вектор экспрессии обычно содержит соответствующие регуляторные последовательности, функционально связанные с последовательностью нуклеиновой кислоты, кодирующей представляющий интерес белок. Вектор экспрессии может дополнительно включать последовательность нуклеиновой кислоты, кодирующую селектируемый маркер.The terms "DNA construct", "expression vector", "expression construct" and "expression cassette" are used to refer to an artificially assembled or isolated nucleic acid molecule that includes a nucleic acid sequence encoding a protein of interest and that is assembled such that the protein of interest is functionally expressed in a target host cell. An expression vector typically contains appropriate regulatory sequences operably linked to the nucleic acid sequence encoding the protein of interest. An expression vector may further include a nucleic acid sequence encoding a selectable marker.

Термины «полинуклеотид», «последовательность нуклеиновой кислоты» и «нуклеотидная последовательность» используются в данном документе для обозначения полимеров дезоксирибонуклеотидов (ДНК), рибонуклеотидов (РНК) и их модифицированных форм в виде отдельного фрагмента или в виде компонента более крупного конструкта. Последовательность нуклеиновой кислоты может быть кодирующей последовательностью, т.е. последовательностью, которая кодирует конечный продукт в клетке, такой как белок.The terms "polynucleotide", "nucleic acid sequence" and "nucleotide sequence" are used herein to refer to polymers of deoxyribonucleotides (DNA), ribonucleotides (RNA) and modified forms thereof as a single unit or as a component of a larger construct. A nucleic acid sequence may be a coding sequence, i.e., a sequence that codes for an end product in a cell, such as a protein.

Последовательность (такая как последовательность нуклеиновой кислоты и аминокислотная последовательность), являющаяся «гомологичной» эталонной последовательности, относится в данном документе к процентной идентичности между последовательностями, причем процент идентичности составляет по меньшей мере 70%, по меньшей мере 75%, предпочтительно, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98%, по меньшей мере 99% или по меньшей мере 99,5%. Каждый возможный вариант представляет собой отдельный вариант осуществления данного изобретения. Гомологичные последовательности нуклеиновых кислот включают варианты, связанные с использованием кодонов и вырождением генетического кода.A sequence (such as a nucleic acid sequence and an amino acid sequence) that is "homologous" to a reference sequence refers herein to a percent identity between the sequences, wherein the percent identity is at least 70%, at least 75%, preferably at least 80%, at least 85%, at least 90%, at least 95%, at least 98%, at least 99%, or at least 99.5%. Each possible variant represents a separate embodiment of the invention. Homologous nucleic acid sequences include variants related to codon usage and degeneracy of the genetic code.

Последовательности нуклеиновых кислот, кодирующие белки по данному изобретению, могут быть оптимизированы для экспрессии. Примеры таких модификаций последовательности включают, без ограничений, измененное отношение содержания G/C для более близкого приближения к обычно наблюдаемому у мицелиальных грибов.The nucleic acid sequences encoding the proteins of the present invention may be optimized for expression. Examples of such sequence modifications include, but are not limited to, altering the G/C content ratio to more closely approximate that typically observed in filamentous fungi.

Фраза «оптимизация кодонов» относится к выбору подходящих нуклеотидов ДНК для использования в структурном гене или его фрагменте, который приближается к использованию кодонов в представляющем интерес организме, и/или к процессу модификации последовательности нуклеиновой кислоты для усиления экспрессии в представляющих интерес клетках-хозяевах путем замены по меньшей мере одного кодона (например, одного или более чем примерно 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более кодонов) нативной последовательности кодонами, которые чаще или наиболее часто используются в генах этой клетки-хозяина, при сохранении нативной аминокислотной последовательности. Различные виды демонстрируют особое предпочтение определенных кодонов конкретной аминокислоты. Предпочтение кодонов (различия в использовании кодонов между организмами) часто коррелирует с эффективностью трансляции матричной РНК (мРНК), которая, в свою очередь, считается зависящей, среди прочего, от свойств транслируемых кодонов и доступности молекул определенных транспортных РНК (тРНК). Преобладание выбранных тРНК в клетке обычно отображает кодоны, наиболее часто используемые в синтезе пептидов. Соответственно, гены могут быть адаптированы для оптимальной генной экспрессии в данном организме на основе оптимизации кодонов. Таким образом, оптимизированная последовательность гена или нуклеиновой кислоты относится к гену, в котором нуклеотидная последовательность нативного или встречающегося в природе гена была модифицирована для использования статистически предпочтительных или статистически благоприятных кодонов в организме.The phrase "codon optimization" refers to the selection of appropriate DNA nucleotides for use in a structural gene or fragment thereof that approximates the codon usage of the organism of interest and/or the process of modifying a nucleic acid sequence to enhance expression in host cells of interest by replacing at least one codon (e.g., one or more than about 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 or more codons) of the native sequence with codons that are more frequently or most frequently used in the genes of that host cell, while maintaining the native amino acid sequence. Different species exhibit particular preferences for certain codons for a particular amino acid. Codon preference (differences in codon usage between organisms) often correlates with the efficiency of messenger RNA (mRNA) translation, which in turn is thought to depend on, among other things, the properties of the codons being translated and the availability of certain transfer RNA (tRNA) molecules. The prevalence of selected tRNAs in a cell typically reflects the codons most frequently used in peptide synthesis. Accordingly, genes can be tailored for optimal gene expression in a given organism based on codon optimization. Thus, an optimized gene or nucleic acid sequence refers to a gene in which the nucleotide sequence of a native or naturally occurring gene has been modified to use statistically preferred or statistically favorable codons in the organism.

Идентичность последовательности может быть определена с использованием алгоритма сравнения нуклеотидных/аминокислотных последовательностей, известного в данной области техники.Sequence identity can be determined using a nucleotide/amino acid sequence comparison algorithm known in the art.

Термин «кодирующая последовательность» используется в данном документе для обозначения последовательности нуклеотидов, начинающейся со стартового кодона (ATG), и содержащей любое количество кодонов, за исключением стоп-кодонов, и стоп-кодона (ТАА, TGA, ТАА), которая кодирует функциональный полипептид.The term "coding sequence" is used herein to refer to a sequence of nucleotides beginning with a start codon (ATG) and containing any number of codons, except stop codons, and a stop codon (TAA, TGA, TAA), that encodes a functional polypeptide.

Любая кодирующая последовательность или аминокислотная последовательность, указанная в данном документе, также охватывает укороченные последовательности, в которых отсутствует 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более кодонов или аминокислот из любой части последовательности. Укороченные варианты кодирующих последовательностей или аминокислотных последовательностей могут быть идентифицированы с использованием алгоритма сравнения нуклеотидных/аминокислотных последовательностей, как известно в данной области техники.Any coding sequence or amino acid sequence referred to herein also encompasses truncated sequences that lack 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 or more codons or amino acids from any portion of the sequence. Shortened variants of coding sequences or amino acid sequences can be identified using a nucleotide/amino acid sequence comparison algorithm as known in the art.

Любая кодирующая последовательность или аминокислотная последовательность, указанная в данном документе, также охватывает слитые последовательности, которые содержат, кроме кодирующей последовательности, представленной в данном документе, или укороченного варианта этой последовательности, как определено выше, другие последовательности. Слитые последовательности могут быть последовательностями, раскрытыми в данном документе, и другими последовательностями. Слитые кодирующие последовательности или аминокислотные последовательности могут быть идентифицированы с использованием алгоритма сравнения нуклеотидных/аминокислотных последовательностей, известного в данной области техники.Any coding sequence or amino acid sequence disclosed herein also encompasses fusion sequences that comprise, in addition to the coding sequence disclosed herein or a truncated version of this sequence as defined above, other sequences. Fused sequences may be sequences disclosed herein and other sequences. Fused coding sequences or amino acid sequences may be identified using a nucleotide/amino acid sequence comparison algorithm known in the art.

Последовательности ДНК собираются в кассеты экспрессии, кассеты селекции и далее в ДНК-конструкты и/или векторы экспрессии с помощью обычных молекулярно-биологических подходов, с использованием рестрикционных эндонуклеаз и лигаз, сборки по Гибсону или дрожжевой рекомбинации. Кроме того, вышеуказанный синтез может быть осуществлен поставщиками услуг синтеза ДНК. Как известно в данной области техники, один и тот же результат может быть достигнут несколькими различными способами.The DNA sequences are assembled into expression cassettes, selection cassettes and further into DNA constructs and/or expression vectors using conventional molecular biological approaches, using restriction endonucleases and ligases, Gibson assembly or yeast recombination. In addition, the above synthesis can be carried out by DNA synthesis service providers. As is known in the art, the same result can be achieved in several different ways.

Последовательности ДНК собирают в кассеты экспрессии, соединяющие 5'-регуляторные области (промоторы), кодирующую последовательность и 3'-регуляторные области (терминаторы), как описано ниже и как известно в данной области техники. Любая комбинация этих трех последовательностей может приводить к образованию функциональной кассеты экспрессии.The DNA sequences are assembled into expression cassettes connecting 5' regulatory regions (promoters), a coding sequence, and 3' regulatory regions (terminators), as described below and as known in the art. Any combination of these three sequences can result in the formation of a functional expression cassette.

Список терминаторов включает, без ограничений, терминаторы генов Th. heterothallica, кодирующие неохарактеризованный белок G2QF75 (ХР_003664349); гомолог полиубиквитина (G2QHM8, ХР_003664133); неохарактеризованный белок (G2QIA5, ХР_003664731); бета-глюкозидазу (G2QD93, ХР_003662704); фактор элонгации 1-альфа (G2Q129, ХР_003660173); хитиназу (G2QDD4, ХР_003663544), фосфоглицераткиназу (PGK) (Uniprot G2QLD8), глицеральдегид-3-фосфатдегидрогеназу (GPD) (G2QPQ8), фосфофруктокиназу (PFK) (G2Q605); или триозофосфатизомеразу (TPI) (G2QBR0); актин (ACT) (G2Q7Q5); cbhl (GenBank АХ284115) или β-глюкозидазу 1 bgl1 (ХМ_003662656). Экзогенные терминаторы включают терминатор gpdA Aspergillus nidulans.The list of terminators includes, but is not limited to, the terminators of the Th. heterothallica genes encoding the uncharacterized protein G2QF75 (XP_003664349); polyubiquitin homolog (G2QHM8, XP_003664133); uncharacterized protein (G2QIA5, XP_003664731); beta-glucosidase (G2QD93, XP_003662704); elongation factor 1-alpha (G2Q129, XP_003660173); chitinase (G2QDD4, XP_003663544), phosphoglycerate kinase (PGK) (Uniprot G2QLD8), glyceraldehyde-3-phosphate dehydrogenase (GPD) (G2QPQ8), phosphofructokinase (PFK) (G2Q605); or triosephosphate isomerase (TPI) (G2QBR0); actin (ACT) (G2Q7Q5); cbhl (GenBank AX284115) or β-glucosidase 1 bgl1 ( XM_003662656 ). Exogenous terminators include the Aspergillus nidulans gpdA terminator.

5'-Регуляторные области (промоторы) практически определяются как участок длиной до 2O00 пар оснований, предшествующий стартовому кодону кодирующей последовательности гена, который они регулируют, при условии, что предшествующая область не является кодирующей.5'-Regulatory regions (promoters) are generally defined as a region up to 2,000 base pairs in length preceding the start codon of the coding sequence of the gene they regulate, provided that the preceding region is non-coding.

3'-Регуляторные области (терминаторы) практически определяются как участок длиной до 300 пар оснований, расположенный после концевого кодона кодирующей последовательности гена при условии, что последующая область не является кодирующей.3'-Regulatory regions (terminators) are practically defined as a region up to 300 base pairs long located after the end codon of the coding sequence of a gene, provided that the subsequent region is not coding.

Последовательности ДНК также собираются в кассеты селектируемых маркеров, представляющие собой экспрессионные кассеты, в которых кодирующая последовательность кодирует ген, обеспечивающий селективное преимущество при наличии в трансформированном штамме. Таким преимуществом может быть использование нового источника углерода или азота, устойчивость к токсичному веществу и т.д.DNA sequences are also assembled into selectable marker cassettes, which are expression cassettes in which the coding sequence codes for a gene that provides a selective advantage when present in the transformed strain. Such an advantage could be the use of a new carbon or nitrogen source, resistance to a toxic substance, etc.

Делеция протеаз, раскрытых в данном документе, может осуществляться, как известно в данной области техники. В некоторых вариантах делецию выполняют путем трансформации подходящих ДНК-конструктов. ДНК-конструкты, используемые для направленной трансформации, состоят из (а) подходящего вектора, который позволяет поддерживать ДНК-конструкт в конкретном хозяине, (б) нуля, одной или нескольких кассет экспрессии в любом направлении, (в) кассеты селектируемого маркера в любом направлении и (d) последовательностей, идентичных выбранным участкам геномной ДНК-мишени (также называемые нацеливающими участками). Эти компоненты размещены таким образом, что два нацеливающих участка охватывают любые экспрессионные кассеты и кассету селектируемого маркера, так что при гомологичной рекомбинации между нацеливающими участками и двумя идентичными областями геномной ДНК, последовательность между нацеливающими участками ДНК-конструкта встраивается в хромосому и заменяет последовательность, изначально присутствующую в хромосоме. Используя этот принцип, гены могут быть удалены из генома или вставлены в него. Размещая следом за кассетой селектируемого маркера последовательность, идентичную последовательности непосредственно перед кассетой селектируемого маркера, можно рециркулировать маркер, как известно в данной области техники.Deletion of the proteases disclosed herein can be accomplished as is known in the art. In some embodiments, the deletion is accomplished by transformation of suitable DNA constructs. DNA constructs used for targeted transformation consist of (a) a suitable vector that allows the DNA construct to be maintained in a particular host, (b) zero, one or more expression cassettes in either direction, (c) a selectable marker cassette in either direction, and (d) sequences identical to selected regions of the target genomic DNA (also called targeting regions). These components are arranged such that two targeting regions span any expression cassettes and the selectable marker cassette, such that upon homologous recombination between the targeting regions and the two identical regions of the genomic DNA, the sequence between the targeting regions of the DNA construct is inserted into the chromosome and replaces the sequence originally present in the chromosome. Using this principle, genes can be removed from or inserted into the genome. By placing a sequence following the selectable marker cassette that is identical to the sequence immediately preceding the selectable marker cassette, the marker can be recycled, as is known in the art.

Термин «регуляторные последовательности» относится к последовательностям ДНК, которые контролируют экспрессию (транскрипцию) кодирующих последовательностей, таким как промоторы, энхансеры и терминаторы.The term "regulatory sequences" refers to DNA sequences that control the expression (transcription) of coding sequences, such as promoters, enhancers, and terminators.

Термин «промотор» относится к регуляторной последовательности ДНК, которая контролирует или направляет транскрипцию другой последовательности ДНК in vivo или in vitro. Обычно промотор располагается в 5'-области транскрибируемой последовательности (то есть предшествует, расположен перед ней). Промоторы могут быть получены полностью из нативного источника или состоять из различных элементов, полученных из различных промоторов, встречающихся в природе, или даже содержать синтетические нуклеотидные сегменты. Промоторы могут быть конститутивными (т.е. активация промотора не регулируется индуцирующим агентом и, следовательно, скорость транскрипции постоянна) или индуцибельными (т.е. активация промотора регулируется индуцирующим агентом или условиями окружающей среды). Промоторы могут также ограничивать транскрипцию определенной стадией развития или определенной морфологически отличной частью организма. В большинстве случаев точные границы регуляторных последовательностей полностью не определены, а в некоторых случаях и не могут быть полностью определены, поэтому некоторые варианты последовательностей ДНК могут иметь одинаковую промоторную активность.The term "promoter" refers to a regulatory DNA sequence that controls or directs the transcription of another DNA sequence in vivo or in vitro. Typically, a promoter is located 5' of the sequence to be transcribed (i.e., preceding, or upstream of it). Promoters may be derived entirely from a native source or may consist of different elements derived from different promoters found in nature or even contain synthetic nucleotide segments. Promoters may be constitutive (i.e., promoter activation is not regulated by an inducing agent and, therefore, the rate of transcription is constant) or inducible (i.e., promoter activation is regulated by an inducing agent or environmental conditions). Promoters may also restrict transcription to a particular developmental stage or to a particular morphologically distinct part of an organism. In most cases, the precise boundaries of regulatory sequences are not fully defined, and in some cases cannot be fully defined, so that several variants of DNA sequences may have the same promoter activity.

Термин «терминатор» относится к другой регуляторной последовательности ДНК, которая регулирует терминацию транскрипции. Терминирующая последовательность функционально связана с 3'-концом транскрибируемой последовательности нуклеиновой кислоты.The term "terminator" refers to another regulatory DNA sequence that regulates transcription termination. The termination sequence is operably linked to the 3' end of the nucleic acid sequence being transcribed.

Термины «промотор С1» и «терминатор С1» обозначают последовательности промотора и терминатора, подходящие для использования в С1, т.е. способные управлять экспрессией гена в С1.The terms "C1 promoter" and "C1 terminator" refer to promoter and terminator sequences suitable for use in C1, i.e. capable of driving gene expression in C1.

Однако, как известно специалистам в данной области, выбор промоторов и терминаторов может не иметь решающего значения, и сходные результаты могут быть получены с различными промоторами и терминаторами, обеспечивающими аналогичную или идентичную экспрессию генов.However, as is known to those skilled in the art, the choice of promoters and terminators may not be critical, and similar results can be obtained with different promoters and terminators that provide similar or identical gene expression.

Термин «функционально связанный» означает, что выбранная последовательность нуклеиновой кислоты расположена поблизости от регуляторного элемента (промотора, энхансера и/или терминатора), что позволяет регуляторному элементу регулировать экспрессию выбранной последовательности нуклеиновой кислоты.The term "operably linked" means that the selected nucleic acid sequence is located in proximity to a regulatory element (promoter, enhancer and/or terminator) that allows the regulatory element to regulate the expression of the selected nucleic acid sequence.

Данное изобретение раскрывает продуцирование представляющего интерес белка с использованием генетически модифицированных штаммов Th. heterothallica С1. Как описано выше, могут быть также использованы мицелиальные грибы других видов, обладающие сходными эндогенными путями продуцирования предшественников.The present invention discloses the production of a protein of interest using genetically modified strains of Th. heterothallica C1. As described above, filamentous fungi of other species having similar endogenous pathways for producing precursors can also be used.

В соответствии с некоторыми вариантами осуществления, полинуклеотиды по данному изобретению сконструированы на основе аминокислотной последовательности белка, который должен продуцироваться с использованием кодонов мицелиального гриба. В соответствии с некоторыми вариантами осуществления, мицелиальный гриб принадлежит к группе Pezizomycotina. В соответствии с некоторыми вариантами осуществления, мицелиальный гриб принадлежит к группе, выбранной из группы, состоящей из Sordariales, Hypocreales, Onygenales и Eurotiales, включая роды и виды, описанные выше в разделе «Определения». В соответствии с некоторыми иллюстративными вариантами осуществления указанный грибок представляет собой Th. heterothallica. В соответствии с этими вариантами осуществления, полинуклеотиды по данному изобретению представляют собой полинуклеотиды, идентифицированные в Th.heterothallica, или их гомологи. В соответствии с некоторыми типичными в данное время вариантами осуществления, указанный грибок представляет собой Th. heterothallica C1.According to some embodiments, the polynucleotides of the invention are designed based on the amino acid sequence of a protein to be produced using codons of a filamentous fungus. According to some embodiments, the filamentous fungus belongs to the group Pezizomycotina. According to some embodiments, the filamentous fungus belongs to a group selected from the group consisting of Sordariales, Hypocreales, Onygenales and Eurotiales, including the genera and species described above in the Definitions section. According to some exemplary embodiments, the fungus is Th. heterothallica. According to these embodiments, the polynucleotides of the invention are polynucleotides identified in Th. heterothallica or homologues thereof. According to some currently exemplary embodiments, the fungus is Th. heterothallica C1.

В соответствии с некоторыми иллюстративными вариантами осуществления, Th. heterothallica С1 является производным от штамма UV18-#100.According to some exemplary embodiments, Th. heterothallica C1 is derived from strain UV18-#100.

Каждый ДНК-конструкт или вектор экспрессии или их множество содержит регуляторные элементы, контролирующие транскрипцию полинуклеотидов в по меньшей мере одной клетке гриба. Регуляторный элемент может быть регуляторный элементом, эндогенным для гриба, в частности, для Th.heterothallica С1, или экзогенным для гриба.Each DNA construct or expression vector or a plurality thereof comprises regulatory elements that control transcription of polynucleotides in at least one cell of the fungus. The regulatory element may be a regulatory element endogenous to the fungus, in particular, to Th. heterothallica C1, or exogenous to the fungus.

В соответствии с некоторыми вариантами осуществления, регуляторный элемент выбран из группы, состоящей из 5'-регуляторного элемента (обобщенно называемого промотором) и 3'-регуляторного элемента (обобщенно называемого терминатором), даже если эти нуклеотидные последовательности могут содержать дополнительные регуляторные элементы, не классифицируемые как промоторные или терминирующие последовательности в строгом смысле.According to some embodiments, the regulatory element is selected from the group consisting of a 5' regulatory element (collectively referred to as a promoter) and a 3' regulatory element (collectively referred to as a terminator), even though these nucleotide sequences may contain additional regulatory elements not classified as promoter or terminator sequences in the strict sense.

В соответствии с некоторыми вариантами осуществления, ДНК-конструкт или вектор экспрессии содержит по меньшей мере один промотор, функционально связанный с по меньшей мере одним полинуклеотидом, содержащим кодирующую последовательность, функционально связанную с по меньшей мере одним терминатором. В соответствии с некоторыми вариантами осуществления, промотор является эндогенным промотором гриба, в частности, промотором Th.heterothallica. В соответствии с дополнительными или альтернативными вариантами осуществления, промотор гетерологичен грибу, в частности, Th.heterothallica. В соответствии с некоторыми вариантами осуществления, терминатор представляет собой эндогенный терминатор грибка, в частности, Th. heterothallica. В соответствии с дополнительными или альтернативными вариантами осуществления, терминатор гетерологичен грибу, в частности Th. heterothallica.According to some embodiments, the DNA construct or expression vector comprises at least one promoter operably linked to at least one polynucleotide comprising a coding sequence operably linked to at least one terminator. According to some embodiments, the promoter is an endogenous fungal promoter, in particular a Th. heterothallica promoter. According to further or alternative embodiments, the promoter is heterologous to a fungus, in particular Th. heterothallica. According to some embodiments, the terminator is an endogenous fungal terminator, in particular Th. heterothallica. According to further or alternative embodiments, the terminator is heterologous to a fungus, in particular Th. heterothallica.

В соответствии с некоторыми иллюстративными вариантами осуществления, ДНК-конструкты содержат синтетические регуляторные элементы, называемые «синтетической системой экспрессии» (SES), по существу, как описано в публикации международной заявки (РСТ) №WO 2017/144777.According to some exemplary embodiments, the DNA constructs comprise synthetic regulatory elements, referred to as a "synthetic expression system" (SES), substantially as described in International Patent Application (PCT) Publication No. WO 2017/144777.

В соответствии с некоторыми вариантами осуществления, полинуклеотид стабильно интегрирован в по меньшей мере один хромосомный локус по меньшей мере одной клетки генетически модифицированного гриба. В соответствии с некоторыми вариантами осуществления, полинуклеотид стабильно интегрирован в определенный сайт на хромосомах грибов. В соответствии с некоторыми вариантами осуществления, полинуклеотид стабильно интегрирован в случайный сайт хромосомы. В соответствии с некоторыми вариантами осуществления, полинуклеотид может быть включен целенаправленно или случайным образом в виде 1, 2 или более копий в 1, 2 или более хромосомных локусов.According to some embodiments, the polynucleotide is stably integrated into at least one chromosomal locus of at least one cell of the genetically modified fungus. According to some embodiments, the polynucleotide is stably integrated into a specific site on the fungal chromosomes. According to some embodiments, the polynucleotide is stably integrated into a random site on the chromosome. According to some embodiments, the polynucleotide can be included in a targeted or random manner as 1, 2 or more copies in 1, 2 or more chromosomal loci.

В соответствии с некоторыми альтернативными вариантами осуществления, полинуклеотид транзиентно экспрессируется с использованием векторов внехромосомной экспрессии, как известно специалисту в данной области техники.According to some alternative embodiments, the polynucleotide is transiently expressed using extrachromosomal expression vectors, as known to those skilled in the art.

В соответствии с некоторыми вариантами осуществления, культивация генетически модифицированного гриба в подходящей среде обеспечивает продуцирование представляющего интерес белка в повышенном количестве по сравнению с количеством, продуцируемым в соответствующем исходном грибе, культивируемом в аналогичных условиях.According to some embodiments, culturing a genetically modified fungus in a suitable medium results in the production of a protein of interest in an increased amount compared to the amount produced in a corresponding original fungus cultivated under similar conditions.

В соответствии с некоторыми иллюстративными вариантами осуществления, данное изобретение относится к генетически модифицированному грибу Th. heterothallica C1, который позволяет продуцировать представляющий интерес белок. В соответствии с этими вариантами осуществления, такой генетически модифицированный гриб Th. heterothallica С1 содержит по меньшей мере одну клетку, имеющую пониженную экспрессию и/или активность KЕХ2 и/или ALP7 и по меньшей мере одной дополнительной протеазы.According to some exemplary embodiments, the present invention relates to a genetically modified fungus Th. heterothallica C1, which allows the production of a protein of interest. According to these embodiments, such a genetically modified fungus Th. heterothallica C1 comprises at least one cell having reduced expression and/or activity of KEX2 and/or ALP7 and at least one additional protease.

В соответствии с определенными вариантами осуществления, подходящая среда для культивации генетически модифицированных грибов содержит источник углерода, выбранный из группы, состоящей из глюкозы, сахарозы, ксилозы, арабинозы, галактозы, фруктозы, лактозы, целлобиозы и глицерина. В соответствии с некоторыми вариантами осуществления, источник углерода получают из отходов производства этанола или другой биопродукции из крахмала, сахарной свеклы и сахарного тростника, таких как меласса, содержащая ферментируемые сахара, крахмал, лигноцеллюлозная биомасса, содержащая полимерные углеводы, такие как целлюлоза и гемицеллюлоза.According to certain embodiments, a suitable medium for culturing genetically modified fungi comprises a carbon source selected from the group consisting of glucose, sucrose, xylose, arabinose, galactose, fructose, lactose, cellobiose and glycerol. According to some embodiments, the carbon source is obtained from waste from the production of ethanol or other bioproducts from starch, sugar beet and sugar cane, such as molasses containing fermentable sugars, starch, lignocellulosic biomass containing polymeric carbohydrates such as cellulose and hemicellulose.

В соответствии с некоторыми типичными в данное время вариантами осуществления, указанный гриб представляет собой Th.heterothallica С1. В соответствии с некоторыми вариантами осуществления, штамм Th. heterothallica С1 выбран из группы, состоящей из штамма UV18-25, № депонирования VKM F-3631 D; штамм NG7C-19, № депонирования VKM F-3633 D; и штамм УВ13-6, №депонирования VKM F-3632 D. Дополнительными штаммами, которые могут быть использованы, являются штамм НС UV18-100f, №депонирования CBS141147; штамм НС UV18-100f, №депонирования CBS141143; LC штамм W1L#100I, №депонирования CBS141153; и LC штамм W1L#100I, №депонирования CBS141149, и их производные. Каждый возможный вариант представляет собой отдельный вариант осуществления данного изобретения.According to some currently exemplary embodiments, the fungus is Th. heterothallica C1. According to some embodiments, the Th. heterothallica C1 strain is selected from the group consisting of strain UV18-25, Deposit No. VKM F-3631 D; strain NG7C-19, Deposit No. VKM F-3633 D; and strain UV13-6, Deposit No. VKM F-3632 D. Additional strains that can be used are strain HC UV18-100f, Deposit No. CBS141147; strain HC UV18-100f, Deposit No. CBS141143; LC strain W1L#100I, Deposit No. CBS141153; and LC strain W1L#100I, deposition number CBS141149, and derivatives thereof. Each possible variant represents a separate embodiment of the present invention.

В соответствии с другим аспектом, данное изобретение предусматривает способ получения гриба, способного продуцировать представляющий интерес экзогенный белок, включающий трансформацию по меньшей мере одной клетки гриба по меньшей мере одним полинуклеотидом, кодирующим представляющий интерес белок, причем указанная по меньшей мере одна клетка гриба имеет пониженную экспрессию и/или активность KЕХ2 и/или ALP7 и по меньшей мере одной дополнительной протеазы.According to another aspect, the present invention provides a method for producing a fungus capable of producing an exogenous protein of interest, comprising transforming at least one fungal cell with at least one polynucleotide encoding the protein of interest, wherein said at least one fungal cell has reduced expression and/or activity of KEX2 and/or ALP7 and at least one additional protease.

В соответствии с некоторыми вариантами осуществления, способ дополнительно включает делецию, ингибирование или снижение экспрессии KЕХ2 или ALP7. В соответствии с некоторыми вариантами осуществления, способ дополнительно включает делецию, ингибирование или снижение экспрессии по меньшей мере одной протеазы, выбранной из группы, состоящей из ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6, ALP4.According to some embodiments, the method further comprises deleting, inhibiting or reducing the expression of KEX2 or ALP7. According to some embodiments, the method further comprises deleting, inhibiting or reducing the expression of at least one protease selected from the group consisting of ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6, ALP4.

Термины «пониженная экспрессия» или «ингибированная экспрессия» белка, в частности протеазы, как описано в данном документе, используются взаимозаменяемо и включают, без ограничений, делецию или повреждение гена, который кодирует указанный белок.The terms "reduced expression" or "inhibited expression" of a protein, particularly a protease, as described herein, are used interchangeably and include, without limitation, deletion or damage to the gene that encodes said protein.

Термины «пониженная активность» или «ингибированная активность» белка, в частности протеазы, как описано в данном документе, используются взаимозаменяемо, и дополнительно включают посттрансляционные модификации, приводящие к снижению или устранению активности белка.The terms "reduced activity" or "inhibited activity" of a protein, particularly a protease, as described herein, are used interchangeably and further include post-translational modifications that result in a decrease or elimination of protein activity.

Любой известный в данной области техники способ трансформации мицелиальных грибов полинуклеотидом, кодирующим представляющий интерес белок, может быть использован в соответствии с описанием данного изобретения.Any method known in the art for transforming filamentous fungi with a polynucleotide encoding a protein of interest may be used in accordance with the description of the present invention.

Грибок и полинуклеотиды являются такими, как описано выше.The fungus and polynucleotides are as described above.

В соответствии с еще одним аспектом, данное изобретение относится к способу продуцирования экзогенного белка, включающему культивацию генетически модифицированного гриба, в частности грибов Th. heterothallica С1 по данному изобретению, в подходящей среде; и выделение белковых продуктов.According to another aspect, the present invention relates to a method for producing an exogenous protein, comprising culturing a genetically modified fungus, in particular the Th. heterothallica C1 fungi of the present invention, in a suitable medium; and isolating the protein products.

В соответствии с некоторыми вариантами осуществления, способ включает культивацию генетически модифицированных грибов, как описано в данном документе, каждый из которых экспрессирует отличный от других представляющий интерес белок. В соответствии с некоторыми вариантами осуществления, грибы экспрессируют антигены различных вариантов коронавируса.According to some embodiments, the method includes culturing genetically modified fungi as described herein, each expressing a different protein of interest. According to some embodiments, the fungi express antigens of different coronavirus variants.

В соответствии с некоторыми вариантами осуществления, среда содержит источник углерода, выбранный из группы, состоящей из глюкозы, сахарозы, ксилозы, арабинозы, галактозы, фруктозы, лактозы, целлобиозы и глицерина. В соответствии с некоторыми вариантами осуществления, источником углерода являются отходы, полученные при производстве этанола или другой биопродукции из крахмала, сахарной свеклы и сахарного тростника, такие как меласса, содержащая ферментируемые сахара, крахмал, лигноцеллюлозная биомасса, содержащая полимерные углеводы, такие как целлюлоза и гемицеллюлоза.According to some embodiments, the medium contains a carbon source selected from the group consisting of glucose, sucrose, xylose, arabinose, galactose, fructose, lactose, cellobiose and glycerol. According to some embodiments, the carbon source is waste obtained during the production of ethanol or other bioproducts from starch, sugar beet and sugar cane, such as molasses containing fermentable sugars, starch, lignocellulosic biomass containing polymeric carbohydrates such as cellulose and hemicellulose.

В соответствии с некоторыми вариантами осуществления, экзогенный белок очищают от питательной среды для грибов.According to some embodiments, the exogenous protein is purified from the fungal growth medium.

В соответствии с другими вариантами осуществления, экзогенный белок экстрагируют из грибковой массы. Можно использовать любой известный в данной области техники способ экстракции и очистки белков из растительных тканей.According to other embodiments, the exogenous protein is extracted from the fungal mass. Any method known in the art for extracting and purifying proteins from plant tissues can be used.

В соответствии с еще одним аспектом, данное изобретение относится к экзогенному белку, продуцируемому генетически модифицированным грибком, в частности, генетически модифицированным Th. heterothallica С1 по данному изобретению.According to another aspect, the present invention relates to an exogenous protein produced by a genetically modified fungus, in particular the genetically modified Th. heterothallica C1 of the present invention.

В соответствии с некоторыми вариантами осуществления, экзогенный белковый продукт представляет собой антиген коронавируса. В соответствии с некоторыми вариантами осуществления, антиген представляет собой полноразмерный спайковый белок коронавируса. В соответствии с некоторыми вариантами осуществления, антиген содержит последовательность RBD спайкового белка коронавируса или ее фрагмент. В соответствии с некоторыми вариантами осуществления, RBD или его фрагмент прямо или косвенно слиты со Spytag. В соответствии с некоторыми вариантами осуществления, антиген присоединен к белку SpyCatcher. Следующие примеры приведены для более полной иллюстрации некоторых вариантов осуществления данного изобретения. Однако они никоим образом не должны рассматриваться как ограничивающие объем изобретения. Специалист в данной области техники сможет легко предложить множество изменений и модификаций на основе принципов, раскрытых в данном документе, не выходя за рамки объема изобретения.According to some embodiments, the exogenous protein product is a coronavirus antigen. According to some embodiments, the antigen is a full-length coronavirus spike protein. According to some embodiments, the antigen comprises the RBD sequence of the coronavirus spike protein or a fragment thereof. According to some embodiments, the RBD or fragment thereof is directly or indirectly fused to a Spytag. According to some embodiments, the antigen is attached to a SpyCatcher protein. The following examples are provided to more fully illustrate some embodiments of the present invention. However, they should in no way be construed as limiting the scope of the invention. One skilled in the art will readily be able to propose many changes and modifications based on the principles disclosed herein without departing from the scope of the invention.

ПРИМЕРЫEXAMPLES

Пример 1: Делеция гена C1 alp7Example 1: Deletion of the C1 alp7 gene

Ген протеазы C1 аlр7 был делетирован из штамма линии делеции протеазы С1, в которой ранее были делетированы 12 протеаз. Делеционная кассета для alp7 была сконструирована из двух частей в виде двух отдельных плазмид. Маркерные фрагменты в этих двух плазмидах перекрываются друг с другом, и планируется, что эта область будет подвергаться гомологичной рекомбинации в С1 между плазмидами одновременно с рекомбинацией фрагментов 5'- и 3'-фланкирующих областей с геномной ДНК по обе стороны от гена alp7. Рекомбинация между фрагментами селектируемого маркера делает маркерный ген функциональным и позволяет трансформантам расти в условиях селекции. Делеционная кассета также содержит прямую повторяющуюся последовательность 5'-фланкирующей области для удаления маркера pyr4. Последовательности плазмид делеционного конструкта представлены в SEQ ID NO: 21 и 22. Плазмида pMYT0936 с 5'-областью содержала фрагмент 5'-фланкирующей области аlр7 для интеграции (положения 9-1025 SEQ ID NO: 21) и половину маркера pyr4 (положения 1033-2812 SEQ ID NO: 21). Плазмида pMYT0937 3'-области содержала вторую половину маркера pyr4 (положения 17-1273 SEQ ID NO: 22), последовательность прямого повтора (положения 1282-1781 SEQ ID NO: 22) и фрагмент 3'-фланкирующей области alp7 для интеграции (положения 1790-2759 SEQ ID NO: 22).The alp7 C1 protease gene was deleted from a C1 protease deletion strain in which 12 proteases had previously been deleted. The alp7 deletion cassette was constructed in two parts as two separate plasmids. The marker fragments in the two plasmids overlap each other and it is planned that this region will undergo homologous recombination in C1 between the plasmids simultaneously with recombination of fragments of the 5' and 3' flanking regions with genomic DNA on either side of the alp7 gene. Recombination between the selectable marker fragments makes the marker gene functional and allows transformants to grow under selection conditions. The deletion cassette also contains a direct repeat sequence of the 5' flanking region to remove the pyr4 marker. The sequences of the deletion construct plasmids are shown in SEQ ID NOs: 21 and 22. The pMYT0936 5' plasmid contained a fragment of the 5' flanking region of alp7 for integration (positions 9-1025 of SEQ ID NO: 21) and half of the pyr4 marker (positions 1033-2812 of SEQ ID NO: 21). The pMYT0937 3' plasmid contained the second half of the pyr4 marker (positions 17-1273 of SEQ ID NO: 22), the direct repeat sequence (positions 1282-1781 of SEQ ID NO: 22) and a fragment of the 3' flanking region of alp7 for integration (positions 1790-2759 of SEQ ID NO: 22).

Фрагменты фланкирующей области аlр7 и прямой повтор амплифицировали из геномной ДНК С1 и клонировали в содержащие маркер руr4 векторы основной цепи, полученные из плазмиды pSR426 путем клонирования по Гибсону с помощью набора NEBbuilder™ HiFi DNA Assembly (New England Biolabs) в соответствии с инструкциями производителя. Обе части делеционного конструкта вырезали из плазмид и котрансформировали в штамм CI DNL146, имеющий 12 делеций протеазных генов, методом протопласт/ПЭГ, как описано в Visser, V.J., et al. (Industrial Biotechnology 2011, 7, 214-223).Fragments of the alp7 flanking region and the direct repeat were amplified from C1 genomic DNA and cloned into backbone vectors containing the pyr4 marker derived from plasmid pSR426 by Gibson cloning using the NEBbuilder™ HiFi DNA Assembly Kit (New England Biolabs) according to the manufacturer's instructions. Both parts of the deletion construct were excised from the plasmids and co-transformed into the CI strain DNL146, which has 12 deletions of the protease genes, by the protoplast/PEG method as described by Visser, V.J., et al. (Industrial Biotechnology 2011, 7, 214-223).

Трансформированные колонии, растущие на чашках с селективной средой pyr4, снова высевали штрихом на той же селективной среде. Идентификацию правильных трансформантов проводили методом ПЦР. Мицелий из штриховых культур трансформантов растворяли в 2O мМ NaOH и инкубировали при 100°С для лизиса клеток. 1-2 мкл этого раствора использовали в качестве матрицы для ПЦР с использованием набора Phire Plant PCR™ (Thermo Fisher). Олигонуклеотидные праймеры, используемые в этой ПЦР, указаны в Таблице 1. Интеграция делеционного конструкта в локус alp7 была подтверждена двумя ПЦР-реакциями. Интеграция на 5'-конце гена была подтверждена реакцией с праймерами, представленными в SEQ ID NO: 25 и 26. Фрагмент размером 1233 п. н. был амплифицирован, что указывает на успешную интеграцию в локус alp7. Интеграция на 3'-конце alp7 была подтверждена с праймерами, представленными в SEQ ID NO: 27 и 28. Фрагмент длиной 1748 п.н. был амплифицирован, что указывает на успешную интеграцию в локус alp7. Потеря гена alp7 была показана реакцией с праймерами, представленными в SEQ ID NO: 29 и 30. Фрагмент размером 569 п.н. не амплифицировался, что свидетельствует о делеции гена alp7.Transformed colonies growing on pyr4 selective medium plates were streaked again on the same selective medium. Identification of correct transformants was performed by PCR. Mycelium from streak cultures of transformants was dissolved in 20 mM NaOH and incubated at 100°C to lyse the cells. 1-2 μl of this solution was used as a template for PCR using the Phire Plant PCR™ kit (Thermo Fisher). The oligonucleotide primers used in this PCR are listed in Table 1. Integration of the deletion construct into the alp7 locus was confirmed by two PCR reactions. Integration at the 5' end of the gene was confirmed by a reaction with the primers shown in SEQ ID NOs: 25 and 26. A 1233 bp fragment was detected in the alp7 locus using the primers shown in SEQ ID NOs: 26 and 27. was amplified, indicating successful integration into the alp7 locus. Integration at the 3' end of alp7 was confirmed with the primers shown in SEQ ID NOs: 27 and 28. A 1748 bp fragment was amplified, indicating successful integration into the alp7 locus. Loss of the alp7 gene was demonstrated by reaction with the primers shown in SEQ ID NOs: 29 and 30. A 569 bp fragment was not amplified, indicating deletion of the alp7 gene.

Трансформанты, положительные как по обоим ПЦР-реакциям интеграции, так и по потере орс (открытой рамки считывания) alp7, дополнительно анализировали методом количественной ПЦР с праймерами, представленными в SEQ ID NO: 31 и 32, чтобы продемонстрировать полное удаление гена alp7 из тестируемых трансформантов. Один клон трансформанта С1, положительный по интеграции делеционной кассеты в локус alp7 и отрицательный по тесту методом количественной ПЦР на наличие гена alp7, хранили при -80°С, и ему был присвоен номер штамма DNL150.Transformants positive for both the integration PCR reactions and for the loss of the alp7 open reading frame were further analyzed by quantitative PCR with the primers shown in SEQ ID NOs: 31 and 32 to demonstrate complete deletion of the alp7 gene from the transformants tested. One clone of transformant C1, positive for the integration of the deletion cassette into the alp7 locus and negative for the alp7 gene by quantitative PCR, was stored at -80°C and assigned the strain number DNL150.

Пример 2: Делеция гена С1 kех2Example 2: Deletion of the C1 kex2 gene

Ген протеазы С1 kех2 был удален из штамма линии делеции протеазы С1, в которой 12 протеаз были делетированы ранее. Делеционная кассета для kех2 была сконструирована из двух частей в виде двух отдельных плазмид, и функционирует при трансформации в С1 сходным образом с делеционной кассетой alp7 (описана выше). Делеционная кассета также содержит прямую повторяющуюся последовательность 5'-фланкирующей области для удаления маркера pyr4. Последовательности плазмид делеционного конструкта представлены в SEQ ID NO: 23 и 24. Плазмида pMYT0997 с 5'-областью содержала фрагмент 5'-фланкирующей области kех2 для интеграции (положения 9-1058 SEQ ID NO: 23) и половину маркера pyr4 (положения 1033-2812 SEQ ID NO: 23). Плазмида 3'-области pMYT0998 содержала вторую половину маркера pyr4 (положения 17-1273 SEQ ID NO: 24), последовательность прямого повтора (положения 1281-1782 SEQ ID NO: 24) и фрагмент 3'-фланкирующей области kех2 для интеграции (положения 1791-2690 SEQ ID NO: 24).The C1 protease gene kex2 was deleted from a C1 protease deletion line strain in which 12 proteases had been deleted previously. The deletion cassette for kex2 was constructed in two parts as two separate plasmids and functions in C1 transformation in a similar manner to the alp7 deletion cassette (described above). The deletion cassette also contains a direct repeat sequence of the 5' flanking region for removal of the pyr4 marker. The sequences of the deletion construct plasmids are shown in SEQ ID NOs: 23 and 24. The 5' region plasmid pMYT0997 contained a fragment of the kex2 5' flanking region for integration (positions 9-1058 of SEQ ID NO: 23) and half of the pyr4 marker (positions 1033-2812 of SEQ ID NO: 23). The 3' region of pMYT0998 plasmid contained the second half of the pyr4 marker (positions 17-1273 of SEQ ID NO: 24), the direct repeat sequence (positions 1281-1782 of SEQ ID NO: 24) and a fragment of the 3' flanking region of kex2 for integration (positions 1791-2690 of SEQ ID NO: 24).

Фрагменты фланкирующих областей kех2 и прямого повтора амплифицировали из геномной ДНК С1 и клонировали в содержащие маркер pyr4 векторы основной цепи, полученные из плазмиды pSR426, путем клонирования по Гибсону с помощью набора NEBbuilder™ HiFi DNA Assembly (New England Biolabs) в соответствии с инструкциями производителя. Обе части делеционного конструкта вырезали из плазмид и котрансформировали в штамм CI DNL146, имеющий 12 делеций протеазных генов, как описано ранее в Visser, V.J., et al. {ibid.).Fragments of the flanking regions of kex2 and the direct repeat were amplified from C1 genomic DNA and cloned into pyr4 marker-containing backbone vectors derived from pSR426 by Gibson cloning using the NEBbuilder™ HiFi DNA Assembly Kit (New England Biolabs) according to the manufacturer's instructions. Both parts of the deletion construct were excised from the plasmids and co-transformed into the CI strain DNL146, which has 12 deletions of the protease genes, as described previously by Visser, V.J., et al. {ibid.).

Трансформированные колонии, растущие на чашках с селективной средой pyr4, снова высевали штрихом на той же селективной среде. Идентификацию правильных трансформантов проводили методом ПЦР. Мицелий из штриховых культур трансформантов растворяли в 2O мМ NaOH и инкубировали при 100°С для лизиса клеток. 1-2 мкл этого раствора использовали в качестве матрицы для ПЦР с использованием набора Phire Plant PCR™ (Thermo Fisher). Олигонуклеотидные праймеры, используемые в этой ПЦР, показаны в Таблице 2. Интеграция делеционного конструкта в локус kех2 была подтверждена двумя ПЦР-реакциями. Интеграция на 5'-конце гена была подтверждена реакцией с праймерами, представленными в SEQ ID NO: 33 и 34. Фрагмент длиной 1187 п. н. был амплифицирован, что показало успешную интеграцию в локус kех2. Интеграция на 3'-конце kех2 была подтверждена с праймерами, представленными в SEQ ID NO: 35 и 36. Фрагмент длиной 1849 п.н. был амплифицирован, что показало успешную интеграцию в локус kех2. Потеря гена kех2 была подтверждена реакцией с праймерами, представленными в SEQ ID NO: 37 и 38. Фрагмент размером 510 п.н. не амплифицировался, что свидетельствует о делеции гена kех2.Transformed colonies growing on pyr4 selective medium plates were streaked again on the same selective medium. Identification of correct transformants was performed by PCR. Mycelium from streak cultures of transformants was dissolved in 20 mM NaOH and incubated at 100°C to lyse the cells. 1-2 μl of this solution was used as a template for PCR using the Phire Plant PCR™ kit (Thermo Fisher). The oligonucleotide primers used in this PCR are shown in Table 2. Integration of the deletion construct into the kex2 locus was confirmed by two PCR reactions. Integration at the 5' end of the gene was confirmed by a reaction with the primers shown in SEQ ID NOs: 33 and 34. The 1187 bp fragment was amplified, indicating successful integration into the kex2 locus. Integration at the 3' end of kex2 was confirmed with the primers shown in SEQ ID NOs: 35 and 36. A 1849 bp fragment was amplified, indicating successful integration into the kex2 locus. Loss of the kex2 gene was confirmed by reaction with the primers shown in SEQ ID NOs: 37 and 38. A 510 bp fragment was not amplified, indicating deletion of the kex2 gene.

Трансформанты, положительные как по ПЦР-реакциям интеграции, так и положительные по потере ОРС kех2, дополнительно анализировали методом количественной ПЦР с праймерами, представленными в SEQ ID NO: 39 и 40, и с праймерами, представленными в SEQ ID NO: 41 и 42, чтобы продемонстрировать полное удаление гена kех2 из тестируемых трансформантов. Один клон-трансформант С1, положительный по интеграции делеционной кассеты в локус kех2 и отрицательный по тесту количественной ПЦР на наличие гена kех2, хранили при -80°С и ему присвоили номер штамма DNL152.Transformants positive for both integration PCR reactions and for loss of the kex2 ORF were further analyzed by quantitative PCR with the primers shown in SEQ ID NOs: 39 and 40 and with the primers shown in SEQ ID NOs: 41 and 42 to demonstrate complete deletion of the kex2 gene from the transformants tested. One transformant clone C1, positive for integration of the deletion cassette into the kex2 locus and negative for the kex2 gene by quantitative PCR, was stored at -80°C and assigned the strain number DNL152.

Пример 3: Сочетание делений гена C1 alp7 и гена С1 kех2Example 3: Combination of deletions of the C1 alp7 gene and the C1 kex2 gene

Создание штамма С1, в котором удалены как ген alp7, так и ген kех2, было осуществлено путем делеции гена kех2 из штамма DNL150, в котором ранее были делетированы ген alp7 и 12 других генов протеаз. Перед делецией гена kех2, в штамме DNL150 был удален маркер pyr4, чтобы использовать для делеции гена kех2 те же делеционные кассеты, которые были описаны выше для получения штамма DNL152.The creation of strain C1, in which both the alp7 and kex2 genes were deleted, was accomplished by deleting the kex2 gene from strain DNL150, in which the alp7 gene and 12 other protease genes had previously been deleted. Before deleting the kex2 gene, the pyr4 marker was deleted in strain DNL150 in order to use the same deletion cassettes for the kex2 gene deletion that were described above for the generation of strain DNL152.

Удаление селектируемого маркера pyr4 с использованием делеционной кассеты, описанной выше для получения DNL150, основано на двух особенностях: а) функциональный ген pyr4 превращает 5-фтороротовую кислоту (5-FOA) в 5-фторурацил, токсичный метаболит, таким образом, клоны, которые потеряли функциональный ген pyr4, способны расти в присутствии 5-FOA; и b) под давлением отбора 5-FOA, последовательность прямого повтора в делеционном конструкте позволяет клонам удалить селектируемый маркер pyr4 посредством события гомологичной рекомбинации между 5'-фланкирующей областью и прямым повтором. Успешная рекомбинация удаляет полный маркер pyr4, позволяя правильным клонам расти в присутствии 5-FOA.Removal of the pyr4 selectable marker using the deletion cassette described above for the production of DNL150 relies on two features: a) a functional pyr4 gene converts 5-fluoroorotic acid (5-FOA) to 5-fluorouracil, a toxic metabolite, so clones that have lost the functional pyr4 gene are able to grow in the presence of 5-FOA; and b) under selection pressure from 5-FOA, a direct repeat sequence in the deletion construct allows clones to remove the pyr4 selectable marker through a homologous recombination event between the 5' flanking region and the direct repeat. Successful recombination removes the entire pyr4 marker, allowing the correct clones to grow in the presence of 5-FOA.

Удаление маркера pyr4 из DNL150 проводили в соответствии со следующим протоколом: небольшую часть свежего мицелия с чашки суспендировали в растворе 0,9% NaCl, 0,025% твин-20 (Tween20). Готовили разведения суспензии. Различные количества мицелиальной суспензии наносили на чашки, содержащие 5-фтороротовую кислоту (5-FOA) (компоненты среды чашек с 5-FOA: 7 мМ KCl, 11 мМ KН2РО4, 0,1% глюкозы, 10 мМ урацила, 10 мМ уридина, 2 мМ MgSO4, 10 мМ пролина, раствор микроэлементов (100х: 174 мМ ЭДТА, 76 мМ ZnSO4⋅7H2O, 178 мМ Н3ВО3, 25 мМ MnSO4 H2O, 18 мМ FeSO4⋅7H2O, 7,1 мМ СоСl2⋅6Н2O, 6,4 мМ CuSO4⋅5H2O, 6,2 мМ Na2MoO4⋅2H2O), 4 мМ 5-фтороротовой кислоты, 2O г/л гранулированного агара, рН 6,0). Чашки инкубировали при +35°С до появления колоний. Колонии, растущие на чашках со средой 5-FOA, снова высевали штрихом на той же селективной среде. Поскольку рост на селективной среде 5-FOA слабый и штрихи не розрастаются в четкие полосы, мицелий из слабых полос был пересеян штрихами на неселективную среду (компоненты среды: 7 мМ KCl, 55 мМ KН2РO4, 1,0% глюкозы, 670 мМ сахарозы, 0,6% дрожжевого экстракта, 35 мМ (NH4)2SO4, 2 мМ MgSO4, 10 мМ урацила, 10 мМ уридина, раствор микроэлементов (100х: 174 мМ ЭДТА, 76 мМ ZnSO4⋅7H2O, 178 мМ Н3ВО3, 25 мМ MnSO4⋅H2O, 18 мМ FeSO4⋅7H2O, 7,1 мМ СоСl2⋅6Н2O, 6,4 мМ CuSO4⋅5H2O, 6,2 мМ Na2MoO4-2H2O), 16 г/л агара гранулированного, рН 6,5) для обеспечения хорошего роста. Штрихи, эффективно растущие на чашках с неселективной средой, высевали штрихами на чашки с селективной средой pyr4 без урацила и уридина для тестирования фенотипа. При тестировании фенотипа клоны, в которых удаление pyr4 было успешным, не могут расти на среде без добавления урацила и уридина (компоненты среды: 7 мМ KCl, 11 мМ КН2РO4, 1,0% глюкозы, 670 мМ сахарозы, 35 мМ (NH4)2SO4, 2 мМ MgSO4, раствор микроэлементов (1000х: 174 мМ ЭДТА, 76 мМ ZnSO4⋅7H2O, 178 мМ Н3ВO3, 25 мМ MnSO4 H2O, 18 мМ FeSO4⋅7H2O, 7,1 мМ СоСl2⋅6Н2O, 6,4 мМ CuSO4⋅5H2O, 6,2 мМ Na2MoO4⋅2H2O), 15 г/л гранулированного агара, рН 6,5). Клоны, не растущие на чашках для тестирования фенотипа, анализировали на удаление pyr4 с помощью количественной ПЦР с праймерами, приведенными как последовательности SEQ ID NO: 43 и 44. Олигонуклеотидные праймеры, использованные в реакциях количественной ПЦР, указаны в Таблице 3.Removal of the pyr4 marker from DNL150 was performed according to the following protocol: a small portion of fresh mycelium from a plate was suspended in a solution of 0.9% NaCl, 0.025% Tween-20. Dilutions of the suspension were prepared. Different amounts of mycelial suspension were applied to plates containing 5-fluoroorotic acid (5-FOA) (components of the medium of 5-FOA plates: 7 mM KCl, 11 mM KH 2 PO 4 , 0.1% glucose, 10 mM uracil, 10 mM uridine, 2 mM MgSO 4 , 10 mM proline, trace element solution (100x: 174 mM EDTA, 76 mM ZnSO 4 ⋅7H 2 O, 178 mM H 3 BO 3 , 25 mM MnSO 4 H 2 O, 18 mM FeSO 4 ⋅7H 2 O, 7.1 mM CoCl 2 ⋅6H 2 O, 6.4 mM CuSO4⋅5H2O , 6.2 mM Na2MoO4⋅2H2O), 4 mM 5-fluoroorotic acid, 2 O g/l granular agar, pH 6.0). The plates were incubated at +35°C until colonies appeared. Colonies growing on the plates with 5-FOA medium were streaked again on the same selective medium. Since growth on the selective 5-FOA medium is weak and streaks do not expand into distinct bands, mycelium from weak bands was streaked onto a non-selective medium (medium components: 7 mM KCl, 55 mM KH 2 PO 4 , 1.0% glucose, 670 mM sucrose, 0.6% yeast extract, 35 mM (NH 4 ) 2 SO 4 , 2 mM MgSO 4 , 10 mM uracil, 10 mM uridine, trace element solution (100x: 174 mM EDTA, 76 mM ZnSO 4 ⋅7H 2 O, 178 mM H 3 BO 3 , 25 mM MnSO 4 ⋅H 2 O, 18 mM FeSO 4 ⋅7H2O , 7.1 mM CoCl2 ⋅6H2O , 6.4 mM CuSO4 ⋅5H2O , 6.2 mM Na2MoO4 -2H2O ), 16 g/L granular agar, pH 6.5 ) to ensure good growth. Streaks growing efficiently on non-selective medium plates were streaked onto pyr4 selective medium plates without uracil and uridine for phenotype testing. When testing the phenotype, clones in which pyr4 deletion was successful could not grow on the medium without the addition of uracil and uridine ( medium components: 7 mM KCl, 11 mM KH2PO4 , 1.0% glucose, 670 mM sucrose, 35 mM ( NH4 ) 2SO4 , 2 mM MgSO4 , trace element solution (1000x: 174 mM EDTA, 76 mM ZnSO4 ⋅7H2O, 178 mM H3BO3 , 25 mM MnSO4 ⋅H2O , 18 mM FeSO4 ⋅7H2O , 7.1 mM CoCl2 ⋅6H2O , 6.4 mM CuSO 4 ⋅5H 2 O, 6.2 mM Na 2 MoO 4 ⋅2H 2 O), 15 g/L granular agar, pH 6.5). Clones not growing on phenotype testing plates were analyzed for pyr4 deletion by quantitative PCR with the primers given as SEQ ID NOs: 43 and 44. The oligonucleotide primers used in the qPCR reactions are listed in Table 3.

Один клон DNL150 с удаленным pyr4, неспособный расти при тестировании фенотипа и показывающий отрицательный результат для гена pyr4 методом количественной ПЦР, хранился при -80°С и получил номер штамма DNL151.One pyr4-deleted clone of DNL150, which failed to grow in phenotype testing and was negative for the pyr4 gene by qPCR, was stored at -80°C and given the strain number DNL151.

Протеазу kех2 делетировали из штамма CI DNL151 с использованием той же кассеты делеции и метода трансформации, которые описаны выше для получения DNL152. Идентификацию правильной интеграции и делеции kех2 с помощью реакции ПЦР проводили, как описано выше для получения DNL152. Один клон-трансформант С1, положительный по интеграции делеционной кассеты в локус kех2 и отрицательный в тесте количественной ПЦР на присутствие гена kех2, хранили при -80°С, и он получил номер штамма DNL155 (ΔalplΔalp2Δpep4ΔprtlΔsrplΔalp3ΔpeplΔmtp2Δpep5Δmtp4Δpep6Δalp4Δalp7Δkex2)The kex2 protease was deleted from the CI strain DNL151 using the same deletion cassette and transformation method described above for DNL152. Identification of the correct integration and deletion of kex2 by PCR reaction was performed as described above for DNL152. One transformant clone C1, positive for integration of the deletion cassette into the kex2 locus and negative in the quantitative PCR test for the presence of the kex2 gene, was stored at -80°C and assigned the strain number DNL155 (ΔalplΔalp2Δpep4ΔprtlΔsrplΔalp3ΔpeplΔmtp2Δpep5Δmtp4Δpep6Δalp4Δalp7Δkex2)

Пример 4: Экспрессия RBD SARS-CoV-2 в штаммах С1 с дефицитом протеазыExample 4: Expression of SARS-CoV-2 RBD in protease-deficient C1 strains

Рецептор-связывающий домен (RBD) спайкового белка SARS-CoV-2 экспрессировали в штаммах С1 с дефицитом протеазы. Первый конструкт содержал последовательность, кодирующую эндогенную сигнальную последовательность СВН1 С1, остатки 333-527 спайкового белка SARS-CoV-2, линкер Gly-Ser и С-метку, фланкированные рекомбинированными последовательностями к экспрессионному вектору С1 и сайтам рестрикционного фермента Mssl. Фрагмент был синтезирован фирмой GenScript (США) и представлен как SEQ ID NO: 45 (аминокислотная последовательность RBD-C-метки, включая сигнальную последовательность и линкер Gly/Ser между RBD и С-меткой). Использование кодонов гена было оптимизировано для экспрессии в Thermothelomyces heterothallica. Синтезированный фрагмент амплифицировали с помощью ПЦР из плазмиды GenScript и клонировали методом сборки по Гибсону (набор NEBuilder® HiFi DNA Assembly Cloning, New England Biolabs) в сайт Pad вектора экспрессии C1 pMYT1055 под эндогенным промотором C1 bgl8 и терминатором C1 chil. Правильность последовательности конструкта подтверждали секвенированием фрагмента, встроенного в плазмиду. Плазмиде с правильной последовательностью был присвоен номер плазмиды pMYT1142 (SEQ ID NO: 46). Второй конструкт содержал в дополнение к тем же последовательностям, что и в pMYT1142, линкер Gly-Ser и Spytag между доменом RBD и С-концевым линкером Gly-Ser и С-меткой. Эта последовательность представлена как SEQ ID NO: 47 (аминокислотная последовательность RBD-Spytag-C-метка, включая сигнальную последовательность и линкер Gly/Ser между Spytag и С-меткой). Второй конструкт вставляли в вектор экспрессии pMYT1055 таким же образом, как и pMYT1142, и плазмиде с правильной последовательностью был присвоен номер плазмиды pMYT1143 (SEQ ID NO: 48).The receptor binding domain (RBD) of the SARS-CoV-2 spike protein was expressed in protease-deficient C1 strains. The first construct contained the sequence encoding the endogenous CBH1 signal sequence of C1, residues 333-527 of the SARS-CoV-2 spike protein, a Gly-Ser linker, and a C-tag, flanked by recombinant sequences to the C1 expression vector and Mssl restriction enzyme sites. The fragment was synthesized by GenScript (USA) and presented as SEQ ID NO: 45 (amino acid sequence of the RBD-C-tag, including the signal sequence and the Gly/Ser linker between the RBD and the C-tag). The codon usage of the gene was optimized for expression in Thermothelomyces heterothallica. The synthesized fragment was amplified by PCR from the GenScript plasmid and cloned using the Gibson assembly method (NEBuilder® HiFi DNA Assembly Cloning kit, New England Biolabs) into the Pad site of the C1 expression vector pMYT1055 under the endogenous C1 bgl8 promoter and C1 chil terminator. The correctness of the construct sequence was confirmed by sequencing the fragment inserted into the plasmid. The plasmid with the correct sequence was assigned the plasmid number pMYT1142 (SEQ ID NO: 46). The second construct contained, in addition to the same sequences as in pMYT1142, a Gly-Ser linker and a Spytag between the RBD domain and the C-terminal Gly-Ser linker and a C-tag. This sequence is given as SEQ ID NO: 47 (amino acid sequence of RBD-Spytag-C-tag, including signal sequence and Gly/Ser linker between Spytag and C-tag). The second construct was inserted into the expression vector pMYT1055 in the same manner as pMYT1142, and the plasmid with the correct sequence was assigned the plasmid number pMYT1143 (SEQ ID NO: 48).

Вектор экспрессии pMYT1142 и фиктивный вектор-партнер pMYT1140, который необходим для завершения маркерного гена устойчивости к гигромицину и интеграции в локус bgl8, отщепляли с помощью MssI и котрансформировали в штамм DNL155, из которого были делетированы четырнадцать генов протеаз. Трансформацию проводили методом протопласт/ПЭГ (Visser, V.J., et al., ibid.), и трансформанты отбирали по фенотипу nia1+ и устойчивости к гигромицину. Трансформанты высевали штрихами на чашки с селективной средой и инокулировали из штрихов в жидкие культуры в 24-луночных планшетах. Компоненты среды: (в г/л) глюкоза 5, дрожжевой экстракт 1, (NH4)2SO4 4,6, MgSO4⋅7H2O 0,49, KН2РO4 7,48, и (в мг/л) ЭДТА 45, ZnSO4⋅7H2O 19,8, MnSO4⋅4H2O 3,87, СоСl2⋅6Н2O 1,44, CuSO4⋅5H2O 1,44, Na2MoO4⋅2H2O 1,35, FeSO4⋅7H2O 4,5, Н3ВO4 9,9, D-биотин 0,004, 50 Ед/мл пенициллина и 0,05 мг стрептомицина. 24-луночные планшеты инкубировали при 35°С при встряхивании со скоростью 800 об/мин в течение четырех дней. Супернатанты культур собирали и анализировали методом вестерн-блоттинга, выполняемого стандартными способами с первичным агентом детекции конъюгатом Capture Select Biotin Anti-C-tag (ThermoFisher) и вторичным агентом IRDye 800CW Stretavidin (Li-Cor). Вестерн-анализ (Фиг. 1) показал, что был обнаружен сильный сигнал ожидаемой величины для ряда трансформантов RBD-C-метка и RBD-Spytag-C-метка, что свидетельствует о продуцировании обоих этих белков в С1.The expression vector pMYT1142 and the dummy partner vector pMYT1140, which is required for completion of the hygromycin resistance marker gene and integration into the bgl8 locus, were cleaved with MssI and cotransformed into the DNL155 strain, from which fourteen protease genes had been deleted. Transformation was performed by the protoplast/PEG method (Visser, VJ, et al., ibid.), and transformants were selected for the nia1+ phenotype and hygromycin resistance. Transformants were streaked onto selective medium plates and inoculated from streaks into liquid cultures in 24-well plates. The medium components were: (in g/l) glucose 5, yeast extract 1, (NH 4 ) 2 SO 4 4.6, MgSO 4 ⋅7H 2 O 0.49, KH 2 PO 4 7.48, and (in mg/l) EDTA 45, ZnSO 4 ⋅7H 2 O 19.8, MnSO 4 ⋅4H 2 O 3.87, СоСl 2 ⋅6Н 2 O 1.44, CuSO 4 ⋅5H 2 O 1.44, Na 2 MoO 4 ⋅2H 2 O 1.35, FeSO 4 ⋅7H 2 O 4.5, Н 3 BO 4 9.9, D-biotin 0.004, 50 U/ml penicillin and 0.05 mg streptomycin. The 24-well plates were incubated at 35°C with shaking at 800 rpm for four days. Culture supernatants were collected and analyzed by Western blotting using standard methods with Capture Select Biotin Anti-C-tag conjugate primary detection agent (ThermoFisher) and IRDye 800CW Stretavidin secondary detection agent (Li-Cor). Western analysis (Fig. 1) showed that a strong signal of the expected magnitude was detected for a number of RBD-C-tag and RBD-Spytag-C-tag transformants, indicating that both of these proteins are produced in C1.

Трансформанты, продуцирующие белок RBD-C-метка, очищали путем посева одной колонии, а очищенный клон проверяли с помощью ПЦР на правильность интеграции экспрессионной кассеты и с помощью количественной ПЦР на чистоту клона. Один проверенный трансформант, продуцирующий RBD-C-метку, хранился при -80°С и получил номер штамма М4169.Transformants producing the RBD-C tag protein were purified by single colony plating, and the purified clone was checked by PCR for correct integration of the expression cassette and by quantitative PCR for clone purity. One verified transformant producing the RBD-C tag was stored at -80°C and assigned the strain number M4169.

Экспрессионный вектор pMYT1143, несущий вариант RBD-Spytag-С-метка, был котрансформирован с фиктивным вектором-партнером pMYT1140, и трансформанты анализировали из культур 24-луночных планшетов (Фиг. 1) и очищали путем посева одной колонии таким же образом, как описано выше для pMYT1142. После проверки с помощью ПЦР один клон-транс форм ант С1, продуцирующий RBD-Spytag-C-метку, сохраняли при -80°С, и ему был присвоен номер штамма М4173.The expression vector pMYT1143 carrying the RBD-Spytag-C-tag variant was co-transformed with the mock partner vector pMYT1140, and transformants were analyzed from 24-well plate cultures (Fig. 1) and purified by single colony plating in the same manner as described above for pMYT1142. After PCR verification, one clone of the C1 trans form producing the RBD-Spytag-C-tag was stored at -80°C and assigned the strain number M4173.

Плазмиды pMYT1142 и pMYT1143 трансформировали также в другие штаммы С1 с дефицитом протеаз, кроме DNL155, для сравнения уровней продукции в различных штаммах с делецией протеаз. Делеции генов протеаз в этих штаммах перечислены в Таблице 4. Плазмиды pMYT1142 и pMYT1143, продуцирующие RBD, трансформировали в четыре других штамма с дефицитом протеаз: 1) штамм DNL145, в котором было делетировано 12 протеаз, 2) DNL150, в котором было делетировано 13 протеаз, 3) DNL159, который является параллельным клоном DNL155, и 4) DNL157, в котором делетированы 14 протеаз, но ген kех2 остается интактным. Трансформацию, анализ трансформантов, очистку из отдельных колоний и ПЦР-анализ проводили таким же образом, как описано выше для получения штаммов М4169 и М4173. Было получено несколько подтвержденных производственных штаммов для продуцирования как RBD-C-метки, так и RBD-Spytag-C-метки во всех четырех штаммах с дефицитом протеаз. Три параллельных трансформанта из этих новых производственных штаммов в DNL145, DNL150, DNL157 и DNL159, вместе с М4169 и М4173 и двумя другими параллельными клонами обоих этих штаммов культивировали в жидкой среде в 24-луночных планшетах при 35°С при встряхивании со скоростью 800 об/мин в течение четырех дней. Супернатанты культур собирали и анализировали в окрашенных кумасси ДСН-гелях методами, известными в данной области техники. Самая высокая продукция белков RBD наблюдалась у штаммов DNL155 и DNL159, в которых делетирован kех2 (Фиг. 2).Plasmids pMYT1142 and pMYT1143 were also transformed into other protease-deficient C1 strains besides DNL155 to compare production levels in the different protease-deleted strains. The protease gene deletions in these strains are listed in Table 4. RBD-producing plasmids pMYT1142 and pMYT1143 were transformed into four other protease-deficient strains: 1) strain DNL145, in which 12 proteases were deleted, 2) DNL150, in which 13 proteases were deleted, 3) DNL159, which is a parallel clone of DNL155, and 4) DNL157, in which 14 proteases were deleted but the kex2 gene remained intact. Transformation, analysis of transformants, purification from single colonies and PCR analysis were carried out in the same manner as described above for the production of strains M4169 and M4173. Several production strains were confirmed to produce both the RBD-C-tag and the RBD-Spytag-C-tag in all four protease-deficient strains. Three parallel transformants from these new production strains in DNL145, DNL150, DNL157 and DNL159, together with M4169 and M4173 and two other parallel clones of both these strains were cultured in liquid medium in 24-well plates at 35°C with shaking at 800 rpm for four days. Culture supernatants were collected and analyzed on Coomassie-stained SDS gels by methods known in the art. The highest production of RBD proteins was observed in strains DNL155 and DNL159, in which kex2 was deleted (Fig. 2).

Штамм CI М4169, продуцирующий белок RBD-C-метка, культивировали в 2-литровом биореакторе в периодическом процессе с подпиткой в среде с дрожжевым экстрактом в качестве источника органического азота и глюкозой в качестве источника углерода. Культивирование проводили при 38°С в течение пяти дней. По окончании культивирования мицелий удаляли центрифугированием при 4000 g в течение 2O минут, добавляли фенилметилсульфонилфторид в концентрации 1-2 мМ для ингибирования протеазной активности в полученном жидком культуральном супернатанте и супернатант хранили при -80°С.Для очистки RBD методом аффинной хроматографии с С-меткой, 100 мл жидкой культуры оттаивали на льду, и после оттаивания образец осветляли центрифугированием 3x2O мин при 20000 g при +4°С с последующей фильтрацией через фильтр 0,45 мкМ. 90 мл прозрачного супернатанта разбавляли 1×ФСБ (фосфатно-солевой буфер) (12 мМ Na2HPO4⋅2H2O, 3 мМ NaH2PO4⋅H2O, 150 мМ NaCl, рН 7,3) до конечного объема 200 мл. Аффинную очистку с С-меткой проводили с помощью колонки объемом 10 мл, набитой смолой CaptureSelect C-tag XL (Thermo Fisher), присоединенной к системе очистки белка АКТА Start (Cytiva) и работающей при скорости потока 2,5 мл/мин. Колонку сначала уравновешивали 5 объемами колонки (CV) 1×ФСБ перед загрузкой образца. После загрузки образца колонку промывали 15 объемами колонки 1×ФСБ и затем элюировали одноступенчатым градиентом 5 объемами колонки 20 мМ Трис-HCl, 2М MgCl2, 1 мМ ЭДТА, рН 7,5, с объемом фракции 3 мл. Количество элюированного RBD определяли количественно, интегрируя УФ-кривую пика элюирования с помощью прикладной программы Unicorn 1.0, включенной в систему АКТА Start. Коэффициент экстинкции, равный 1,498, использовался при расчете количества RBD-C-меток и 1,450 -при расчете количества RBD-Spytag-C-меток. После элюции колонку регенерировали 5 объемами колонки 0,1 М глицина, рН 2,3, и промывали 1×ФСБ до достижения рН 7,3. Фракции элюции, содержащие белок, объединяли для стадии диализа, чтобы заменить буфер для элюции на буфер 1×ФСБ. Объединенные фракции помещали в диализную кассету на 12 мл и диализовали диализную кассету в 1,5 л 1×ФСБ в течение 1 ч при +4°С с перемешиванием на магнитной мешалке. 1×ФСБ заменяли свежим буфером через 1 ч и продолжали диализ в течение 2 ч в тех же условиях. Наконец, заменяли 1×ФСБ на свежий и продолжали диализ в течение ночи. Концентрацию диализированного RBD определяли с помощью спектрофотометра Nanodrop, измеряя оптическую плотность при 280 нм и используя коэффициенты экстинкции 1,498 для RBD-C-метки и 1,450 для RBD-Spytag-C-метки. Аликвоты препаратов RBD хранили при -80°С. Аффинная очистка RBD-C-метки от ферментации М4169 показана в качестве примера на Фиг. 3А-3В. Поликлональную антисыворотку кролика к антителу спайкового RBD SARS-CoV-2 (SinoBiologicals) и козий антикроличий IRDye 680RD (Li-Cor) использовали для детекции методом вестерн-блоттинга.The RBD-C-tag protein-producing strain CI M4169 was grown in a 2-liter bioreactor in a fed-batch process in a medium with yeast extract as an organic nitrogen source and glucose as a carbon source. Cultivation was carried out at 38°C for five days. At the end of the cultivation, the mycelium was removed by centrifugation at 4000 g for 2 O minutes, phenylmethylsulfonyl fluoride was added at a concentration of 1-2 mM to inhibit protease activity in the resulting liquid culture supernatant, and the supernatant was stored at -80 °C. For purification of RBD by C-labeled affinity chromatography, 100 ml of the liquid culture was thawed on ice, and after thawing, the sample was clarified by centrifugation 3x 2 O min at 20,000 g at +4 °C, followed by filtration through a 0.45 μM filter. 90 mL of the clear supernatant was diluted with 1×PBS (phosphate-buffered saline) (12 mM Na2HPO4⋅2H2O , 3 mM NaH2PO4⋅H2O , 150 mM NaCl, pH 7.3) to a final volume of 200 mL. C-tag affinity purification was performed using a 10 mL column packed with CaptureSelect C-tag XL resin (Thermo Fisher) attached to an AKTA Start Protein Purification System (Cytiva) and operated at a flow rate of 2.5 mL/min. The column was first equilibrated with 5 column volumes (CV) of 1×PBS before sample loading. After loading the sample, the column was washed with 15 column volumes of 1×PBS and then eluted with a one-step gradient of 5 column volumes of 20 mM Tris-HCl, 2 M MgCl2, 1 mM EDTA, pH 7.5, in 3 ml fractions. The amount of eluted RBD was quantified by integrating the UV curve of the elution peak using the Unicorn 1.0 application program included in the AKTA Start system. An extinction coefficient of 1.498 was used to calculate the amount of RBD-C-tags and 1.450 to calculate the amount of RBD-Spytag-C-tags. After elution, the column was regenerated with 5 column volumes of 0.1 M glycine, pH 2.3, and washed with 1×PBS until the pH reached 7.3. The elution fractions containing protein were pooled for a dialysis step to exchange the elution buffer with 1×PBS. The pooled fractions were placed in a 12 mL dialysis cassette and the dialysis cassette was dialyzed in 1.5 L of 1×PBS for 1 h at +4°C with magnetic stirring. 1×PBS was replaced with fresh buffer after 1 h and dialysis was continued for 2 h under the same conditions. Finally, 1×PBS was replaced with fresh buffer and dialysis was continued overnight. The concentration of dialyzed RBD was determined using a Nanodrop spectrophotometer by measuring the optical density at 280 nm and using extinction coefficients of 1.498 for the RBD-C-tag and 1.450 for the RBD-Spytag-C-tag. Aliquots of the RBD preparations were stored at -80°C. Affinity purification of the RBD-C tag from M4169 fermentation is shown as an example in Fig. 3A-3B. Polyclonal rabbit antiserum to SARS-CoV-2 spike RBD antibody (SinoBiologicals) and goat anti-rabbit IRDye 680RD (Li-Cor) were used for Western blot detection.

Пример 5: Экспрессия и стабильность белков в разных штаммах Thermothelomyces heterothallica C1Example 5: Protein expression and stability in different strains of Thermothelomyces heterothallica C1

Различные штаммы Thermothelomyces heterothallica С1 показаны на Фиг. 4.Different strains of Thermothelomyces heterothallica C1 are shown in Fig. 4.

Для проверки стабильности белков и антител использовали эксперименты с использованием добавок. Добавляли белки-мишени и инкубировали в культуральном супернатанте грибковых штаммов. Отбирали образцы в разные моменты времени и анализировали методом вестерн-блоттинга. Как показано на Фиг. 5 и 6, делеция ALP7 положительно влияла на стабильность антител.To test the stability of proteins and antibodies, addition experiments were used. Target proteins were added and incubated in the culture supernatant of fungal strains. Samples were taken at different time points and analyzed by Western blotting. As shown in Fig. 5 and 6, deletion of ALP7 had a positive effect on antibody stability.

На Фиг. 7 показаны эксперименты с добавлением фибриногена. Повышенная стабильность была обнаружена у штамма с дефицитом KЕХ2.Fig. 7 shows experiments with the addition of fibrinogen. Increased stability was found in the KEX2-deficient strain.

На Фиг. 8 показаны эксперименты по добавлению Fc-FGF21. Повышенная стабильность была обнаружена у штаммов с дефицитом KЕХ2 и SRP10.Fig. 8 shows experiments with addition of Fc-FGF21. Increased stability was found in strains deficient in KEX2 and SRP10.

На фиг. 9 показан эксперимент с введением добавок и экспрессия мАт в штаммах с дефицитом протеаз. Повышенные стабильность и количества белка были обнаружены у штамма 13х с дефицитом ALP7 по сравнению со штаммами с дефицитом протеаз 12х и 13х SRP10. Когда это же мАт экспрессировали в штамме 13х с делецией протеазы ALP7, продуцировалось значительно большее количество интактного мАт.Figure 9 shows the spiking experiment and expression of mAb in protease-deficient strains. Increased stability and protein amounts were found in the ALP7-deficient strain 13x compared to the protease-deficient strains 12x and 13x SRP10. When the same mAb was expressed in the ALP7-deleted strain 13x, significantly more intact mAb was produced.

На Фиг. 10 показана экспрессия мАт в штаммах с делецией протеаз 13х с делецией kех2 или alp7. Фрагмент деградации 27 кДа (отмечен стрелкой) не образовывался в штамме с делецией KЕХ2 по сравнению с исходным штаммом 12х. Кроме того, фрагменты деградации 37 кДа не продуцировались в штамме 13х с дефицитом ALP7 по сравнению с исходними 12х штаммами с дефицитом протеаз.Figure 10 shows mAb expression in 13x protease deletion strains with deletion of kex2 or alp7. The 27 kDa degradation fragment (marked with arrow) was not produced in the KEX2 deletion strain compared to the parental 12x strain. In addition, the 37 kDa degradation fragments were not produced in the ALP7-deficient 13x strain compared to the parental 12x protease-deficient strains.

Пример 6: Экспрессия RVFV в штаммах с дефицитом протеаз 14хExample 6: Expression of RVFV in 14x protease-deficient strains

Белок вакцинного антигена из вируса лихорадки долины Рифт (RVFV) экспрессировали в виде слитого белка с доменом Spycatcher из того же вектора экспрессии в штамме DNL150 с делецией протеаз 13х и в штамме DNL155 с делецией протеаз 14х, имеющем делецию kех2.The vaccine antigen protein from Rift Valley fever virus (RVFV) was expressed as a fusion protein with the Spycatcher domain from the same expression vector in the 13x protease deletion strain DNL150 and the 14x protease deletion strain DNL155, which has a kex2 deletion.

Штаммы, трансформированные вектором экспрессии антигена RVFV, выращивали в 24-луночных планшетах, и продукцию антигена анализировали методом вестерн-блоттинга с антителом против антигена RVFV.Strains transformed with the RVFV antigen expression vector were grown in 24-well plates, and antigen production was analyzed by Western blotting with an antibody against RVFV antigen.

Как показано на Фиг. 11, трансформанты 14х дефицитного по протеазам штамма DNL155 показали высокую экспрессию RVFV. Уровень экспрессии был намного выше, чем у штамма с дефицитом 13 протеаз (DNL150).As shown in Fig. 11, transformants of the 14x protease-deficient strain DNL155 showed high expression of RVFV. The expression level was much higher than that of the 13x protease-deficient strain (DNL150).

Пример 7: Экспрессия и функциональность RBD-Spytag в штаммах с дефицитом протеаз 14хExample 7: Expression and functionality of RBD-Spytag in 14x protease-deficient strains

Структурное формирование рецепторсвязывающего домена спайкового белка SARS-CoV-2, слитого со Spytag, в штамме Thermothelomyces heterothallica С1 с дефицитом протеаз 14х представлено на Фиг. 12А-12В. Белок был конъюгирован с вакциной вирусоподобных частиц (ВПЧ) SpyCatcher с рекомбинантным поверхностным антигеном вируса гепатита В (HBsAg) для изучения возможности использования полученного белка в качестве вакцины. Были исследованы две серии CI RBD-Spytag (№2 и №4). Стабильность белков и конъюгатов исследовали в геле ДСН-ПААГ, а затем анализировали методом вестерн-блоттинга с использованием мышиного антитела к HBsAg (1-е антитело) и козьего анти-мышиного IgG-ЩФ (2-е антитело). Как показано на Фиг. 12А-12 В, RBD-Spytag эффективно конъюгировали с ВПЧ SpyCatcher HBsAg. Важно отметить, что белки RBD с конъюгированным SpyCatcher или без него были способны генерировать димеры/тримеры. Димеризация и тримеризация рекомбинантного RBD имитирует естественную структуру RBS коронавируса и, как ожидается, позволит создать эффективную вакцину.The structural arrangement of the receptor-binding domain of the SARS-CoV-2 spike protein fused to Spytag in the 14x protease-deficient Thermothelomyces heterothallica C1 strain is shown in Figs. 12A–12B. The protein was conjugated to the SpyCatcher virus-like particle (VLP) vaccine with recombinant hepatitis B surface antigen (HBsAg) to study the potential of using the resulting protein as a vaccine. Two lots of CI RBD-Spytag (#2 and #4) were tested. The stability of the proteins and conjugates was examined by SDS-PAGE gel and then analyzed by Western blotting using mouse anti-HBsAg antibody (1st antibody) and goat anti-mouse IgG-ALP (2nd antibody). As shown in Fig. 12A-12B, RBD-Spytag were efficiently conjugated to SpyCatcher HBsAg VLP. Importantly, RBD proteins with or without conjugated SpyCatcher were able to generate dimers/trimers. Dimerization and trimerization of the recombinant RBD mimics the natural structure of coronavirus RBS and is expected to enable the design of an effective vaccine.

Затем исследовали связывание RBD-Spytag с белком АСЕ-2 человека с использованием антитела CR3022. Как показано на Фиг. 13A-13F, антитело CR3022 способно связываться с RBD, презентированным на частице ВПЧ. Кроме того, использовали непрямой ИФА, чтобы показать, что конъюгированный RBD связывает hACE-2, а не частицу ВПЧ. В совокупности результаты показывают, что полученный RBD, слитый со Spytag, правильно собран, презентирован на частице ВПЧ и, таким образом, может использоваться в качестве вакцины.The binding of RBD-Spytag to human ACE-2 protein was then examined using the CR3022 antibody. As shown in Fig. 13A-13F, the CR3022 antibody was able to bind to the RBD presented on the HPV particle. In addition, an indirect ELISA was used to show that the conjugated RBD binds hACE-2 and not the HPV particle. Taken together, the results indicate that the resulting Spytag-fused RBD is correctly assembled, presented on the HPV particle, and thus has potential for use as a vaccine.

Пример 8: Получение слитых с Fc белков рецептор-связывающего домена SARS-СоV-2 в С1Example 8: Production of SARS-CoV-2 receptor-binding domain fusion proteins with Fc in C1

Было проведено продуцирование в С1 двух белков потенциальной вакцины против коронавируса SARS-CoV-2, в которых рецептор-связывающий домен (RBD) спайкового белка SARS-CoV-2 S2 слит на N-конце либо на С-конце с доменом Fc антитела IgGl. Фрагменты ДНК, кодирующие 40 п. н, перекрываются с промотором C1 bgl8, сигнальной последовательностью CI СВН1, кодирующей областью аминокислотной последовательности RBD-Fc или Fc-RBD (показаны как SEQ ID NO: 49 и 51; указанные последовательности включают сигнальную последовательность и линкер между RBD и Fc), стоп-кодон и перекрывание с терминатором C1 bgl8 или chil. Кодирующие белок области фрагментов ДНК показаны как SEQ ID NO: 50 и 52. Фрагменты ДНК, перекрывающиеся с терминатором chil, клонировали в 5'-область экспрессионного конструкта (плазмида pMYT1055), а фрагменты, перекрывающиеся с терминатором bgl8, клонировали в З'-область экспрессионного конструкта (плазмида pMYT1056). Клонирование проводили методом сборки по Гибсону с использованием набора NEBuilder™ HiFi DNA Assembly (New England Biolabs) в соответствии с инструкциями производителя. Полученные экспрессионные плазмиды были обозначены как pMYT1302 (5'-область RBD-Fc), pMYT1303 (3'-область RBD-Fc), pMYT1304 (5'-область Fc-RBD) и pMYT1305 (3'-область Fc-RBD).Two potential SARS-CoV-2 coronavirus vaccine proteins were produced in C1, in which the receptor binding domain (RBD) of the SARS-CoV-2 S2 spike protein was fused at either the N-terminus or the C-terminus to the Fc domain of an IgG1 antibody. The 40 bp DNA encoding fragments overlap with the C1 bgl8 promoter, the CI CBH1 signal sequence, the coding region of the RBD-Fc or Fc-RBD amino acid sequence (shown as SEQ ID NOs: 49 and 51; these sequences include the signal sequence and the linker between the RBD and Fc), a stop codon, and an overlap with the C1 bgl8 or chil terminator. The protein-coding regions of the DNA fragments are shown as SEQ ID NOs: 50 and 52. The DNA fragments overlapping the chil terminator were cloned into the 5' region of the expression construct (plasmid pMYT1055), and the fragments overlapping the bgl8 terminator were cloned into the 3' region of the expression construct (plasmid pMYT1056). Cloning was performed by the Gibson assembly method using the NEBuilder™ HiFi DNA Assembly Kit (New England Biolabs) according to the manufacturer's instructions. The resulting expression plasmids were designated pMYT1302 (RBD-Fc 5' region), pMYT1303 (RBD-Fc 3' region), pMYT1304 (Fc-RBD 5' region), and pMYT1305 (Fc-RBD 3' region).

Для конструирования С1 штаммов, продуцирующих конструкт RBD-Fc, экспрессионные плазмиды pMYT1302 и pMYT1303 трансформировали вместе в три разных штамма CI: DNL155 (ΔalplΔalp2Δpep4ΔprtlΔsrplΔalp3ΔpeplΔmtp2-Δpep5Δmtp4Δpep6Δalp4Δalp7Δkex2), DNL157 (ΔalplΔalp2Δpep4ΔprtlΔsrplΔalp3-ΔpeplAmtp2Δpep5Δmtp4Δpep6Δalp4Δalp7Δsrpl0) и гликоинженерный штамм, имеющий 10 делеций протеаз, М3599 (Δа1р1Δа1р2Δрер4ΔрrtΔsrtΔаrр3Δрер1Δmtр2Δаlр6Δsrр7). После трансформации 5'- и 3'-области экспрессионного конструкта интегрируются в локус bgl8, и перекрывающиеся фрагменты гена устойчивости к гигромицину в двух областях рекомбинируют друг с другом с образованием конечного экспрессионного конструкта с двумя экспрессионными кассетами в локусе bgl8. Трансформации проводили, как описано Visser, V.J., et al. {ibid.). Трансформанты отбирали на устойчивость к гигромицину и подвергали скринингу с использованием культур 24-луночных планшетов и вестерн-блоттинга на продукцию белка RBD-Fc. Вестерн-анализ выполняли по стандартной методике с разведением 1:10000 конъюгата F(c) козьего поликлонального антитела против IgG человека-IRDye700DX (Licor). Детекцию сигнала проводили с помощью флуориметра Licor Odyssey. Результаты показывают, что лишь небольшая часть RBD-Fc, продуцируемого в штамме М3599 с делециями 10 протеаз, имеет полную длину (расчетная молекулярная масса 49,4 кДа). В штаммах М155 и Ml57 большая часть RBD-Fc не расщепляется протеазами и продуцируется в виде интактного продукта (Фиг. 14А). Эти штаммы имеют делеции протеазы alp7 (DNL157) или как alp7, так и kех2 (DNL155). Уровень продуцирования в DNL155 значительно выше, чем в DNL157. В заключение следует отметить, что делеции alp7 и kех2 оказывают благотворное влияние на продуцирование RBD-Fc.To construct C1 strains producing the RBD-Fc construct, the expression plasmids pMYT1302 and pMYT1303 were transformed together into three different CI strains: DNL155 (ΔalplΔalp2Δpep4ΔprtlΔsrplΔalp3ΔpeplΔmtp2-Δpep5Δmtp4Δpep6Δalp4Δalp7Δkex2), DNL157 (ΔalplΔalp2Δpep4ΔprtlΔsrplΔalp3-ΔpeplAmtp2Δpep5Δmtp4Δpep6Δalp4Δalp7Δsrpl0) and a glycoengineered strain containing 10 protease deletions, M3599 (Δа1р1Δа1р2Δрер4ΔрrtΔsrtΔаrр3Δрер1Δmtр2Δаlр6Δsrр7). Following transformation, the 5' and 3' regions of the expression construct are integrated into the bgl8 locus, and the overlapping fragments of the hygromycin resistance gene in the two regions are recombined with each other to form a final expression construct with two expression cassettes at the bgl8 locus. Transformations were performed as described by Visser, V.J., et al. {ibid.). Transformants were selected for hygromycin resistance and screened using 24-well plate cultures and Western blotting for RBD-Fc protein production. Western analysis was performed using a standard method with a 1:10,000 dilution of goat anti-human IgG polyclonal F(c) conjugate-IRDye700DX (Licor). Signal detection was performed using a Licor Odyssey fluorometer. The results show that only a small fraction of the RBD-Fc produced in the M3599 strain with deletions of 10 proteases is full-length (calculated molecular weight 49.4 kDa). In strains M155 and Ml57, most of the RBD-Fc is not cleaved by proteases and is produced as intact product (Fig. 14A). These strains have deletions of the alp7 protease (DNL157) or both alp7 and kex2 (DNL155). The level of production in DNL155 is significantly higher than in DNL157. In conclusion, it should be noted that deletions of alp7 and kex2 have a beneficial effect on RBD-Fc production.

Для получения штамма, экспрессирующего слитый белок Fc-RBD, плазмиды pMYT1304 и pMYT1305 вместе трансформировали в штамм DNL155, как описано выше для конструирования штамма-продуцента RBD-Fc. Трансформанты анализировали на присутствие Fc-RBD с помощью вестерн-блоттинга из культур 24-луночных планшетов, как описано выше (Фиг. 14 В). Было обнаружено несколько трансформантов, продуцирующих хорошие уровни белка Fc-RBD. Продукт в подавляющем большинстве был интактным.To generate a strain expressing the Fc-RBD fusion protein, plasmids pMYT1304 and pMYT1305 were transformed together into the DNL155 strain as described above for constructing the RBD-Fc producer strain. Transformants were analyzed for the presence of Fc-RBD by Western blotting from 24-well plate cultures as described above (Fig. 14B). Several transformants were found producing good levels of Fc-RBD protein. The product was largely intact.

Пример 9: Вакцинация мышей антигеном RBD SARS-CoV-2Example 9: Vaccination of mice with SARS-CoV-2 RBD antigen

Полученный спайковый белок SARS-CoV-2 из Примера 4 тестировали на предмет использования в качестве вакцины. Антиген RBD SARS-CoV-2 вводили трансгенным мышам К18 hACE2. Две группы трансгенных мышей вакцинировали 20 мкг RBD, приготовленного с альгидрогелем. Первичную вакцинацию проводили в день 1 ("основная") и в день 21 ("ревакцинация"). На 42-й день мышей заражали 2000 БОЕ SARS-CoV-2. Исследования сыворотки показали, что антиген продуцирует высокие титры нейтрализующих антител. Через два дня после заражения атипичной пневмонией все контрольные мыши погибли, а 13 из 14 вакцинированных мышей выжили практически без потери веса.The resulting SARS-CoV-2 spike protein from Example 4 was tested for use as a vaccine. The SARS-CoV-2 RBD antigen was administered to K18 hACE2 transgenic mice. Two groups of transgenic mice were vaccinated with 20 μg of RBD formulated with alhydrogel. Primary vaccination was performed on day 1 (“prime”) and on day 21 (“booster”). On day 42, mice were challenged with 2,000 PFU of SARS-CoV-2. Serum studies showed that the antigen produced high titers of neutralizing antibodies. Two days after SARS challenge, all control mice died, while 13 of 14 vaccinated mice survived with little or no weight loss.

Пример 10: Экспрессия рекомбинантного антигена αМНСII-Саl07 в штаммах О с дефицитом протеазExample 10: Expression of recombinant antigen αMHCII-Cal07 in protease-deficient O strains

Рекомбинантный антиген αМНСII-Саl07, состоящий из нацеливающего домена МНСП и антигена НА штамма гриппа A/California/07/2009 (подтип H1N1), был экспрессирован в штаммах С1 с дефицитом протеаз. Экспрессионный конструкт содержал последовательность, кодирующую эндогенную сигнальную последовательность C1 СВН1, МНСII-специфичный нацеливающий элемент, линкер из 20 аминокислот, остатки 18-541 белка НА, полученного из штамма гриппа A/California/07/2009, и С-метку, фланкированную последовательностями рекомбинации с вектором экспрессии С1 и сайтами узнавания рестрикционными ферментами Mssl. Фрагмент был синтезирован фирмой GenScript (США). Использование кодонов гена было оптимизировано для экспрессии в Thermothelomyces heterothallicus. Синтезированный фрагмент высвобождали из плазмиды GenScript путем расщепления рестрикционным ферментом Mssl и клонировали методом сборки по Гибсону (набор NEBuilder® HiFi DNA Assembly Cloning, New England Biolabs) в сайт Pad экспрессионного вектора C1 pMYT1055 под эндогенным промотором C1 bgl8 и терминатором C1 chil. Правильность последовательности конструкта подтверждали секвенированием фрагмента, встроенного в плазмиду. Плазмиде с правильной последовательностью был присвоен номер плазмиды pMYT1242.Recombinant antigen αMHCII-Саl07, consisting of the targeting domain of MHCII and the HA antigen of the influenza A/California/07/2009 strain (subtype H1N1), was expressed in protease-deficient C1 strains. The expression construct contained a sequence encoding the endogenous C1 signal sequence CBH1, an MHCII-specific targeting element, a 20-amino acid linker, residues 18-541 of the HA protein obtained from the influenza A/California/07/2009 strain, and a C-tag flanked by recombination sequences with the C1 expression vector and recognition sites for Mssl restriction enzymes. The fragment was synthesized by GenScript (USA). Gene codon usage was optimized for expression in Thermothelomyces heterothallicus. The synthesized fragment was released from the GenScript plasmid by digestion with the restriction enzyme Mssl and cloned using the Gibson assembly method (NEBuilder® HiFi DNA Assembly Cloning kit, New England Biolabs) into the Pad site of the C1 expression vector pMYT1055 under the endogenous C1 bgl8 promoter and the C1 chil terminator. The correctness of the construct sequence was confirmed by sequencing the fragment inserted into the plasmid. The plasmid with the correct sequence was assigned the plasmid number pMYT1242.

Во втором случае синтезированный фрагмент амплифицировали с помощью ПЦР из плазмиды GenScript и клонировали методом сборки по Гибсону в сайт Pad векторов экспрессии C1 pMYT0987 под синтетическим промотором AnSES и эндогенным терминатором C1 chil. Правильность последовательности конструкта подтверждали секвенированием фрагмента, встроенного в плазмиду. Плазмиде правильной последовательности был присвоен номер плазмиды pMYT1243.In the second case, the synthesized fragment was amplified by PCR from the GenScript plasmid and cloned by the Gibson assembly method into the Pad site of the C1 expression vectors pMYT0987 under the synthetic AnSES promoter and the endogenous C1 chil terminator. The correctness of the construct sequence was confirmed by sequencing the fragment inserted into the plasmid. The plasmid with the correct sequence was assigned the plasmid number pMYT1243.

Экспрессионный вектор pMYT1242 и фиктивный вектор-партнер pMYT1140, который необходим для завершения маркерного гена устойчивости к гигромицину и интеграции в локус bgl8, расщепляли с помощью Mssl и котрансформировали в штамм DNL155, из которого были делетированы четырнадцать генов протеаз, и в штамм М3599, из которого были делетированы десять генов протеаз. Протеазы, делетированные в вышеуказанных штаммах, перечислены в Таблице 5. Трансформацию проводили методом протопласт/ПЭГ в соответствии с Visser, V.J., et al. (ibid.), и трансформанты были отобраны по фенотипу nial+ и устойчивости к гигромицину. Трансформанты высевали штрихами на чашки с селективной средой и инокулировали из штрихов в жидкие культуры в 24-луночных планшетах. Компоненты среды: (в г/л) глюкоза 5, дрожжевой экстракт 1, (NH4)2SO4 4,6, MgSO4⋅7H2O 0,49, KН2РO4 7,48, и (в мг/л) ЭДТА 45, ZnSO4⋅7H2O 19,8, MnSO4⋅4H2O 3,87, СоСl2⋅6Н2O 1,44, CuSO4⋅5H2O 1,44, Na2MoO4⋅2H2O 1,35, FeSO4⋅7H2O 4,5, Н3ВO4 9,9, D-биотин 0,004, 50 Ед/мл пенициллина и 0,05 мг стрептомицина. 24-луночные планшеты инкубировали при 35°С при встряхивании со скоростью 800 об/мин в течение четырех дней. Супернатанты культур собирали и анализировали методом вестерн-блоттинга, проводимого стандартными методами с первичным агентом детекции конъюгатом Capture Select Biotin Anti-C-tag (ThermoFisher) и вторичным агентом IRDye 680RD Streptavidin (Li-Cor). Вестерн-анализ (Фиг. 15) показал сильный сигнал ожидаемого размера (87 кДа) для ряда трансформантов αМНСII-Саl07, полученных из штамма DNL155, что подтверждает продуцию белка в С1. Однако ни в одном из трансформантов, полученных из М3599, не было обнаружено продуктов ожидаемого размера. Дополнительные протеазы, присутствующие в трансформантах, полученных из М3599, по сравнению с трансформантами, полученными из DNL155, вызывали протеолитическую деградацию продукта.The expression vector pMYT1242 and the mock partner vector pMYT1140, which is required for completion of the hygromycin resistance marker gene and integration into the bgl8 locus, were digested with Mssl and cotransformed into strain DNL155, from which fourteen protease genes were deleted, and into strain M3599, from which ten protease genes were deleted. The proteases deleted in the above strains are listed in Table 5. Transformation was performed by the protoplast/PEG method according to Visser, VJ, et al. (ibid.), and transformants were selected for the nial+ phenotype and hygromycin resistance. Transformants were streaked onto plates containing selective medium and inoculated from the streaks into liquid cultures in 24-well plates. The medium components were: (in g/l) glucose 5, yeast extract 1, (NH 4 ) 2 SO 4 4.6, MgSO 4 ⋅7H 2 O 0.49, KH 2 PO 4 7.48, and (in mg/l) EDTA 45, ZnSO 4 ⋅7H 2 O 19.8, MnSO 4 ⋅4H 2 O 3.87, СоСl 2 ⋅6Н 2 O 1.44, CuSO 4 ⋅5H 2 O 1.44, Na 2 MoO 4 ⋅2H 2 O 1.35, FeSO 4 ⋅7H 2 O 4.5, Н 3 BO 4 9.9, D-biotin 0.004, 50 U/ml penicillin and 0.05 mg streptomycin. The 24-well plates were incubated at 35°C with shaking at 800 rpm for four days. The culture supernatants were collected and analyzed by Western blotting using standard methods with Capture Select Biotin Anti-C-tag conjugate (ThermoFisher) as the primary detection agent and IRDye 680RD Streptavidin (Li-Cor) as the secondary detection agent. Western analysis (Fig. 15) showed a strong signal of the expected size (87 kDa) for a number of αMHCII-Cal07 transformants derived from strain DNL155, confirming protein production in C1. However, none of the transformants derived from M3599 showed products of the expected size. Additional proteases present in M3599-derived transformants compared to DNL155-derived transformants caused proteolytic degradation of the product.

Трансформанты, продуцирующие белок αМНСII-Саl07, очищали путем посева единичной колонии, а очищенный клон проверяли методом ПЦР на правильность интеграции кассеты экспрессии и методом количественной ПЦР на чистоту клона. Один подтвержденный трансформант, продуцирующий αМНСII-Саl07, хранили в виде маточного раствора в глицерине при -80°С, и ему был присвоен номер штамма М4540.Transformants producing αMHCII-Cal07 protein were purified by single colony plating, and the purified clone was checked by PCR for correct integration of the expression cassette and by quantitative PCR for clone purity. One confirmed αMHCII-Cal07-producing transformant was stored as a stock solution in glycerol at -80°C and assigned the strain number M4540.

Штаммы C1 DNL155 дополнительно котрансформировали экспрессионным вектором pMYT1243, расщепленным Mssl, несущим конструкт αМНСII-Саl07, под контролем синтетического промотора AnSES, вместе с фиктивным вектором-партнером pMYT1141, и трансформанты анализировали в культурах 24-луночных планшетов (Фиг. 15) и очищали посевом единичной колонии таким же образом, как описано выше для pMYT1242. После подтверждения методом ПЦР один клон-трансформант С1, продуцирующий αМНСII-Саl07, хранили при -80°С, и ему был присвоен номер штамма М4543.C1 DNL155 strains were further co-transformed with the Mssl-digested pMYT1243 expression vector carrying the αMHCII-Cal07 construct under the control of the synthetic AnSES promoter, together with the mock partner vector pMYT1141, and transformants were assayed in 24-well plate cultures (Fig. 15) and purified by single colony plating in the same manner as described above for pMYT1242. After PCR confirmation, one C1 transformant clone producing αMHCII-Cal07 was stored at -80°C and assigned the strain number M4543.

Кроме того, штамм C1 М4621 с четырнадцатью делециями генов протеаз и делециею гена alg3, кодирующего долихол-Р-Маn-зависимую альфа-(1-3)маннозилтрансферазу, был котрансформирован экспрессионным вектором pMYT1243, расщепленным Mssl, и фиктивным вектором pMYTl 141, аналогично приведенному выше описанию для DNL155. Делеция гена alg3 вызывает изменение структуры N-гликанов, связанных с гликопротеинами, что приводит к сдвигу в сторону меньших по размеру видов N-гликанов с меньшим количеством остатков маннозы. Трансформанты, полученные после такой трансформации, культивировали в жидкой среде в 24-луночных планшетах при 35°С со встряхиванием при 800 об/мин в течение четырех дней. Супернатанты культур собирали и анализировали методом вестерн-блоттинга стандартными способами с использованием первичных агентов детекции конъюгата Capture Select Biotin Anti-C-tag (ThermoFisher) и мышиного моноклонального антитела 29Е3, индуцированного против НА-антигена штамма гриппа A/California/07/2009 (Manicassamy et al., 2010; PLoS Pathog 6(1): el000745. doi: 10.1371/journal.ppat. 1000745), и вторичных агентов IRDye 680RD Streptavidin (Li-Cor) и IRDye 800CW козье вторичное антитело против мышиного IgG (Li-Соr). Вестерн-анализ показал наличие сигнала ожидаемого размера (87 кДа) для ряда трансформантов, что подтверждает продуцирование белка в трансформантах, полученных из М4621 (данные не показаны).In addition, strain C1 M4621 with fourteen deletions of protease genes and deletion of the alg3 gene encoding dolichol-β-Man-dependent alpha-(1-3)mannosyltransferase was cotransformed with the Mss I-digested pMYT1243 expression vector and the mock pMYT1 141 vector, similar to the description given above for DNL155. Deletion of the alg3 gene causes a change in the structure of N-glycans associated with glycoproteins, which leads to a shift towards smaller N-glycan species with fewer mannose residues. Transformants obtained after such transformation were cultured in liquid medium in 24-well plates at 35°C with shaking at 800 rpm for four days. Culture supernatants were collected and analyzed by Western blotting by standard methods using the primary detection agents Capture Select Biotin Anti-C-tag conjugate (ThermoFisher) and mouse monoclonal antibody 29E3 raised against the HA antigen of influenza A/California/07/2009 strain (Manicassamy et al., 2010; PLoS Pathog 6(1): el000745. doi: 10.1371/journal.ppat. 1000745), and the secondary agents IRDye 680RD Streptavidin (Li-Cor) and IRDye 800CW goat anti-mouse IgG secondary antibody (Li-Cor). Western analysis revealed the presence of a signal of the expected size (87 kDa) for a number of transformants, confirming protein production in transformants derived from M4621 (data not shown).

Штамм C1 М4540, продуцирующий рекомбинантный белок αМНСII-Саl07, культивировали в биореакторе объемом 0,25 л методом периодического процесса с подпиткой в среде с дрожжевым экстрактом в качестве источника органического азота и глюкозой в качестве источника углерода. Культивирование проводили при 38°С в течение семи дней. После окончания культивирования ферментационный бульон хранили при -80°С. Для очистки αМНСII-Саl07 методом аффинной хроматографии с С-меткой, 50 мл жидкой культуры оттаивали на льду, и после оттаивания образец очищали центрифугированием 3×20 мин при 20000 × g при +4°С с последующей фильтрацией через фильтр 0,45 мкм. 33 мл прозрачного супернатанта разбавляли 1×ФСБ/0,5 М NaCl (12 мМ Na2HPO4⋅2H2O, 3 мМ NaH2PO4⋅H2O, 650 мМ NaCl, рН 7,3) до конечного объема 100 мл.The C1 M4540 strain producing the recombinant αMHCII-Cal07 protein was cultured in a 0.25 L bioreactor using a fed-batch process in a medium containing yeast extract as an organic nitrogen source and glucose as a carbon source. Cultivation was carried out at 38°C for seven days. After completion of cultivation, the fermentation broth was stored at -80°C. For purification of αMHCII-Cal07 by C-labeled affinity chromatography, 50 mL of the liquid culture was thawed on ice, and after thawing, the sample was purified by centrifugation for 3×20 min at 20,000 × g at +4°C, followed by filtration through a 0.45 μm filter. 33 ml of the clear supernatant was diluted with 1×PBS/0.5 M NaCl (12 mM Na 2 HPO 4 ⋅2H 2 O, 3 mM NaH 2 PO 4 ⋅H 2 O, 650 mM NaCl, pH 7.3) to a final volume of 100 ml.

Аффинную очистку с С-меткой проводили с помощью колонки CaptureSelect C-tag XL объемом 1 мл (Thermo Fisher), присоединенной к системе очистки белка АКТА Start (Cytiva), при работе со скоростью потока 1 мл/мин. Колонку сначала уравновешивали 5 объемами колонки (CV) 1×ФСБ/0,5 М NaCl перед загрузкой образца. После загрузки образца колонку промывали 15 объемами колонки 1×ФСБ/0,5М NaCl, а затем элюировали одноступенчатым градиентом 10 объемами колонки 20 мМ Трис-HCl, 2 М MgCb, 1 мМ ЭДТА, рН 7,5, с объемом фракции 1 мл. Количество элюированного αМНСII-Саl07 определяли количественно путем интегрирования УФ-кривой пика элюирования с помощью программы Unicorn 1.0, входящей в состав системы АКТА Start. При расчете количества αМНСII-Саl07 использовали коэффициент экстинкции 1,7. После элюции колонку регенерировали 5 объемами колонки 0,1М глицина, рН 2,3, и промывали 1×ФСБ до достижения рН 7,3. Фракции элюции, содержащие белок, объединяли для стадии диализа, чтобы заменить буфер для элюции на буфер 1×ФСБ. Объединенные фракции помещали в диализную кассету на 12 мл и диализовали диализную кассету в 1,5 л 1×ФСБ в течение 1 ч при +4°С с перемешиванием на магнитной мешалке. 1×ФСБ заменяли свежим буфером через 1 ч и продолжали диализ в течение 2 ч в тех же условиях. Наконец, заменяли 1×ФСБ и продолжали диализ в течение ночи. Концентрацию диализированного αМНСII-Саl07 определяли с помощью спектрофотометра Nanodrop, измеряя оптическую плотность при 280 нм и используя коэффициент экстинкции 1,7. Аликвоты препаратов RBD хранили при -80°С. Аффинная очистка αМНСII-Саl07 из супернатанта ферментации М4540 показана в качестве примера на Фиг. 16А-16С. Для обнаружения в вестерн-блоттинге использовали первичные агенты конъюгат CaptureSelect Biotin Anti-C-tag (ThermoFisher) и мышиное моноклональное антитело 29Е3, индуцированное против антигена НА гриппа, и вторичные агенты IRDye 680RD Streptavidin (Li-Cor) и IRDye 800CW вторичного антитела козьего антимышиного IgG (Li-Cor).C-tag affinity purification was performed using a 1 mL CaptureSelect C-tag XL column (Thermo Fisher) attached to the AKTA Start Protein Purification System (Cytiva) running at a flow rate of 1 mL/min. The column was first equilibrated with 5 column volumes (CV) of 1×PBS/0.5 M NaCl before sample loading. After sample loading, the column was washed with 15 CVs of 1×PBS/0.5 M NaCl and then eluted with a one-step gradient of 10 CVs of 20 mM Tris-HCl, 2 M MgCl, 1 mM EDTA, pH 7.5, in 1 mL fractions. The amount of eluted αMHCII-Cal07 was quantified by integration of the UV peak elution curve using the Unicorn 1.0 software included in the AKTA Start system. An extinction coefficient of 1.7 was used to calculate the amount of αMHCII-Cal07. After elution, the column was regenerated with 5 column volumes of 0.1 M glycine, pH 2.3, and washed with 1×PBS until pH 7.3 was achieved. The elution fractions containing protein were pooled for a dialysis step to replace the elution buffer with 1×PBS buffer. The pooled fractions were placed in a 12 mL dialysis cassette, and the dialysis cassette was dialyzed in 1.5 L of 1×PBS for 1 h at +4°C with magnetic stirring. 1×PBS was replaced with fresh buffer after 1 h, and dialysis was continued for 2 h under the same conditions. Finally, 1×PBS was replaced and dialysis was continued overnight. The concentration of dialyzed αMHCII-Cal07 was determined using a Nanodrop spectrophotometer by measuring the optical density at 280 nm and using an extinction coefficient of 1.7. Aliquots of the RBD preparations were stored at -80°C. Affinity purification of αMHCII-Cal07 from the M4540 fermentation supernatant is shown as an example in Figs. 16A-16C. For Western blot detection, the primary agents used were CaptureSelect Biotin Anti-C-tag conjugate (ThermoFisher) and mouse monoclonal antibody 29E3 raised against influenza HA antigen, and the secondary agents were IRDye 680RD Streptavidin (Li-Cor) and IRDye 800CW goat anti-mouse IgG secondary antibody (Li-Cor).

Пример 11: Экспрессия вариантов RBD SARS-CoV-2 в штамме О с 14-кратным дефицитом протеазExample 11: Expression of SARS-CoV-2 RBD variants in the 14-fold protease-deficient O strain

Три варианта рецептор-связывающего домена (RBD) спайкового белка SARS-CoV-2 были экспрессированы в дефицитном по протеазам штамме C1 DNL155. Три варианта: 1) RBD_B.1.1.7-UK с мутацией N501Y, 2) RBD_B.1.351-SA с мутациями K417N, Е484K и N501Y, и 3) RBD_1.1.28.1(P.1)-BR с мутациями K417Т, Е484К и N501Y. Фрагмент каждого варианта был синтезирован фирмой GenScript (США), а оптимизированная последовательность Wuhan RBD (в pMYT1142 Примера 4) была использована в качестве основы, в которой мутируемые аминокислоты были заменены кодоном, наиболее часто встречающимся в С1. Конструкция синтезированного фрагмента была аналогична Wuhan RBD с С-меткой (используемой в pMYT1142 Примера 4), за исключением того, что линкер Gly/Ser между вариантом RBD и С-меткой имел в длину три аминокислоты, тогда как в Wuhan RBD-C -tag длина линкера составляла пять аминокислот. Вариантные RBD экспрессировали в виде двух копий гена в С1, а для экспрессии двойной копии в одном и том же геномном локусе для каждого варианта были созданы два плазмидных конструкта (5'-область и 3'-область), содержащие оба по одной копии гена. В клетках С1 рекомбинация между фрагментами селектируемого маркера в плазмидах с 5'- и 3'-областями делает маркерный ген функциональным и позволяет трансформантам расти в условиях селекции. Для плазмид с 5'-областями синтезированные фрагменты амплифицировали с помощью ПЦР из плазмид GenScript и клонировали методом сборки по Гибсону (набор NEBuilder® HiFi DNA Assembly, New England Biolabs) в сайт Pad экспрессионного вектора CI pMYT1055 под эндогенным промотором C1 bgl8 и терминатором C1 chil. Правильность последовательностей конструктов подтверждали секвенированием фрагментов, встроенных в плазмиды. Плазмидам с правильными последовательностями были присвоены номера плазмид pMYT1572 для RBD B.1.1.7-UK, pMYT1574 для RBDB.1.351-SA и pMYT1576 для RBD1.1.28.1(Р. 1)-BR, соответственно. Для плазмид с З'-областями синтезированные фрагменты в плазмидах GenScript вырезали с помощью рестрикционного фермента Mssl и клонировали методом сборки по Гибсону (набор NEBuilder® HiFi DNA Assembly Cloning, New England Biolabs) в сайт Pad экспрессионного вектора CI pMYT1056 под эндогенным промотором CI bgl8 и терминатором CI bgl8. Плазмидам с правильными последовательностями были присвоены номера плазмид pMYT1573 для RBD_B.1.1.7-UK, pMYT1575 для RBD_B.1.351-SA и pMYT1577 для RBD_1.1.28.1 (P. 1)-BR соответственно.Three variants of the receptor-binding domain (RBD) of the SARS-CoV-2 spike protein were expressed in the protease-deficient C1 DNL155 strain. The three variants were: 1) RBD_B.1.1.7-UK with the N501Y mutation, 2) RBD_B.1.351-SA with the K417N, E484K, and N501Y mutations, and 3) RBD_1.1.28.1(P.1)-BR with the K417T, E484K, and N501Y mutations. A fragment of each variant was synthesized by GenScript (USA), and the optimized Wuhan RBD sequence (in pMYT1142 of Example 4) was used as a backbone in which the mutated amino acids were replaced with the codon most frequently occurring in C1. The design of the synthesized fragment was similar to the Wuhan C-tag RBD (used in pMYT1142 of Example 4), except that the Gly/Ser linker between the variant RBD and the C-tag was three amino acids long, whereas in the Wuhan RBD-C -tag the linker was five amino acids long. The variant RBDs were expressed as two copies of the gene in C1, and to express a double copy at the same genomic locus, two plasmid constructs (5' region and 3' region) containing both one copy of the gene were constructed for each variant. In C1 cells, recombination between the selectable marker fragments in the plasmids with the 5' and 3' regions renders the marker gene functional and allows transformants to grow under selection conditions. For plasmids with 5' regions, the synthesized fragments were PCR amplified from GenScript plasmids and cloned using the Gibson assembly method (NEBuilder® HiFi DNA Assembly kit, New England Biolabs) into the Pad site of the CI expression vector pMYT1055 under the endogenous C1 bgl8 promoter and C1 chil terminator. The correctness of the construct sequences was confirmed by sequencing the fragments inserted into the plasmids. Plasmids with the correct sequences were assigned the plasmid numbers pMYT1572 for RBD B.1.1.7-UK, pMYT1574 for RBDB.1.351-SA, and pMYT1576 for RBD1.1.28.1(P. 1)-BR, respectively. For plasmids with 3' regions, the synthesized fragments in GenScript plasmids were cut with the restriction enzyme Mssl and cloned using the Gibson assembly method (NEBuilder® HiFi DNA Assembly Cloning Kit, New England Biolabs) into the Pad site of the CI expression vector pMYT1056 under the endogenous CI bgl8 promoter and CI bgl8 terminator. Plasmids with the correct sequences were assigned the plasmid numbers pMYT1573 for RBD_B.1.1.7-UK, pMYT1575 for RBD_B.1.351-SA, and pMYT1577 for RBD_1.1.28.1 (P. 1) -BR, respectively.

Для экспрессии двойной копии плазмиды как с 5'-областью, так и с 3'-областью расщепляли Mssl, а плазмиды, несущие один и тот же вариант гена, котрансформировали в штамм DNL155, из которого были делетированы четырнадцать генов протеаз. DNL155 был выбран в качестве штамма-хозяина, поскольку выработка Wuhan RBD была протестирована в нескольких штаммах с делецией протеазы С1 (Пример 4), и самая высокая выработка наблюдалась в штаммах DNL155 и DNL159, которые оба являются штаммами с 14-кратной делецией протеаз с делецией kех2. Трансформацию и скрининг трансформантов путем культивирования в 24-луночных планшетах проводили так же, как и для Wuhan RBD (Пример 4), за исключением того, что супернатанты культур анализировали методом вестерн-блоттинга с двумя первичными агентами детекции одновременно: антитело к RBD спайкового белка SARS-CoV-2 (2019-nCoV), поликлональная антисыворотка кролика (SinoBiologicals, №кат. 40592-Т62) и конъюгат Capture Select Biotin Anti-C-tag (ThermoFisher). Агентами вторичной детекции были козье антикроличье антитело IRDye 680RD (Li-Cor) и IRDye 800CW Stretavidin (Li-Cor). На Фиг. 17 показан пример результатов вестерн-блоттинга с по меньшей мере одним положительным трансформантом для каждого варианта RBD. Обнаружены сильные сигналы ожидаемого размера с обоими первичными антителами, и уровни продукции вариантных белков RBD-C-метки, по-видимому, равны наблюдающимся для контрольного штамма М4169, продуцирующего Wuhan RBD-C-tag.For expression, a double copy of the plasmid with both the 5' and 3' region was digested with Mssl, and plasmids carrying the same gene variant were co-transformed into strain DNL155, from which fourteen protease genes were deleted. DNL155 was chosen as the host strain because the production of the Wuhan RBD was tested in several C1 protease deletion strains (Example 4), and the highest production was observed in strains DNL155 and DNL159, which are both 14-fold protease deletion strains with kex2 deletion. Transformation and screening of transformants by culturing in 24-well plates were performed as for Wuhan RBD (Example 4), except that the culture supernatants were analyzed by Western blotting with two primary detection agents simultaneously: SARS-CoV-2 (2019-nCoV) spike protein RBD antibody, rabbit polyclonal antiserum (SinoBiologicals, Cat. No. 40592-T62), and Capture Select Biotin Anti-C-tag conjugate (ThermoFisher). The secondary detection agents were IRDye 680RD goat anti-rabbit antibody (Li-Cor) and IRDye 800CW Stretavidin (Li-Cor). Figure 17 shows an example of Western blot results with at least one positive transformant for each RBD variant. Strong signals of the expected size were detected with both primary antibodies, and the levels of production of variant RBD-C-tag proteins appeared to be equal to those observed for the Wuhan RBD-C-tag-producing control strain M4169.

Аминокислотная последовательность RBD_B.1.1.7-UK представлена в SEQ ID NO: 53, а последовательность ДНК - в SEQ ID NO: 54. Последовательность включает сигнальную последовательность, линкер Gly/Ser и С-метку.The amino acid sequence of RBD_B.1.1.7-UK is shown in SEQ ID NO: 53 and the DNA sequence is shown in SEQ ID NO: 54. The sequence includes a signal sequence, a Gly/Ser linker and a C-tag.

Аминокислотная последовательность RBD_B.1.351-SA представлена в SEQ ID NO: 55, а последовательность ДНК - в SEQ ID NO: 56. Последовательность включает сигнальную последовательность, линкер Gly/Ser и С-метку.The amino acid sequence of RBD_B.1.351-SA is shown in SEQ ID NO: 55 and the DNA sequence is shown in SEQ ID NO: 56. The sequence includes a signal sequence, a Gly/Ser linker and a C-tag.

Аминокислотная последовательность RBD_1.1.28.1(P.1)-BR представлена в SEQ ID NO: 57, а последовательность ДНК - в SEQ ID NO: 58. Последовательность включает сигнальную последовательность, линкер Gly/Ser и С-метку.The amino acid sequence of RBD_1.1.28.1(P.1)-BR is shown in SEQ ID NO: 57 and the DNA sequence is shown in SEQ ID NO: 58. The sequence includes a signal sequence, a Gly/Ser linker and a C-tag.

Приведенное выше описание конкретных вариантов осуществления будет настолько полно раскрывать общий характер изобретения, что другие могут, применяя современные знания, легко изменять и/или адаптировать такие конкретные варианты осуществления для различных применений без излишнего экспериментирования и без отклонений от общей концепции и, следовательно, такие адаптации и модификации следует рассматривать как предусматриваемые в пределах сущности и диапазона эквивалентов раскрытых вариантов осуществления. Следует понимать, что формулировки или терминология, используемые в данном документе, предназначены для описания, а не ограничения. Средства, материалы и стадии для выполнения различных раскрытых функций могут принимать множество альтернативных форм, не выходя за рамки данного изобретения.The foregoing description of specific embodiments will so fully disclose the general nature of the invention that others, using current knowledge, can easily modify and/or adapt such specific embodiments to various applications without undue experimentation and without departing from the general concept, and therefore such adaptations and modifications should be considered as being within the spirit and range of equivalents of the disclosed embodiments. It should be understood that the language or terminology used herein is intended to be descriptive and not limiting. The means, materials, and steps for performing the various functions disclosed may take many alternative forms without departing from the scope of the invention.

--->--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE LIST

<110> DYADIC INTERNATIONAL (USA), INC.<110> DYADIC INTERNATIONAL (USA), INC.

<120> МОДИФИЦИРОВАННЫЕ МИЦЕЛИАЛЬНЫЕ ГРИБЫ ДЛЯ ПРОИЗВОДСТВА ЭКЗОГЕННЫХ<120> MODIFIED MYCELIAL FUNGI FOR THE PRODUCTION OF EXOGENOUS

БЕЛКОВ BELKOV

<130> DYD/005 PCT<130> DYD/005 PCT

<150> US 62/024550<150> US 62/024550

<151> 2020-05-14<151> 2020-05-14

<160> 58 <160> 58

<170> PatentIn version 3.5<170> PatentIn version 3.5

<210> 1<210> 1

<211> 392<211> 392

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 1<400> 1

Met His Phe Ser Thr Ala Leu Leu Ala Phe Leu Pro Ala Ala Leu Ala Met His Phe Ser Thr Ala Leu Leu Ala Phe Leu Pro Ala Ala Leu Ala

1 5 10 15 1 5 10 15

Ala Pro Thr Ala Glu Thr Leu Asp Lys Arg Ala Pro Ile Leu Thr Ala Ala Pro Thr Ala Glu Thr Leu Asp Lys Arg Ala Pro Ile Leu Thr Ala

20 25 30 20 25 30

Arg Ala Gly Gln Val Val Pro Gly Lys Tyr Ile Ile Lys Leu Arg Asp Arg Ala Gly Gln Val Val Pro Gly Lys Tyr Ile Ile Lys Leu Arg Asp

35 40 45 35 40 45

Gly Ala Ser Asp Asp Val Leu Glu Ala Ala Ile Gly Lys Leu Arg Ser Gly Ala Ser Asp Asp Val Leu Glu Ala Ala Ile Gly Lys Leu Arg Ser

50 55 60 50 55 60

Lys Ala Asp His Val Tyr Arg Gly Lys Phe Arg Gly Phe Ala Gly Lys Lys Ala Asp His Val Tyr Arg Gly Lys Phe Arg Gly Phe Ala Gly Lys

65 70 75 80 65 70 75 80

Leu Glu Asp Asp Val Leu Asp Ala Ile Arg Leu Leu Pro Glu Val Glu Leu Glu Asp Asp Val Leu Asp Ala Ile Arg Leu Leu Pro Glu Val Glu

85 90 95 85 90 95

Tyr Val Glu Glu Glu Ala Ile Phe Thr Ile Asn Ala Tyr Thr Ser Gln Tyr Val Glu Glu Glu Ala Ile Phe Thr Ile Asn Ala Tyr Thr Ser Gln

100 105 110 100 105 110

Ser Asn Ala Pro Trp Gly Leu Ala Arg Leu Ser Ser Lys Thr Ala Gly Ser Asn Ala Pro Trp Gly Leu Ala Arg Leu Ser Ser Lys Thr Ala Gly

115 120 125 115 120 125

Ser Thr Thr Tyr Thr Tyr Asp Thr Ser Ala Gly Glu Gly Thr Cys Ala Ser Thr Thr Tyr Thr Tyr Asp Thr Ser Ala Gly Glu Gly Thr Cys Ala

130 135 140 130 135 140

Tyr Val Ile Asp Thr Gly Ile Tyr Thr Ser His Ser Asp Phe Gly Gly Tyr Val Ile Asp Thr Gly Ile Tyr Thr Ser His Ser Asp Phe Gly Gly

145 150 155 160 145 150 155 160

Arg Ala Thr Phe Ala Ala Asn Phe Val Asp Ser Ser Asn Thr Asp Gly Arg Ala Thr Phe Ala Ala Asn Phe Val Asp Ser Ser Asn Thr Asp Gly

165 170 175 165 170 175

Asn Gly His Gly Thr His Val Ala Gly Thr Ile Gly Gly Thr Thr Tyr Asn Gly His Gly Thr His Val Ala Gly Thr Ile Gly Gly Thr Thr Tyr

180 185 190 180 185 190

Gly Val Ala Lys Lys Thr Lys Leu Tyr Ala Val Lys Val Leu Gly Ser Gly Val Ala Lys Lys Thr Lys Leu Tyr Ala Val Lys Val Leu Gly Ser

195 200 205 195 200 205

Asp Gly Ser Gly Thr Thr Ser Gly Val Ile Ala Gly Ile Asn Phe Val Asp Gly Ser Gly Thr Thr Ser Gly Val Ile Ala Gly Ile Asn Phe Val

210 215 220 210 215 220

Ala Asp Asp Ala Pro Lys Arg Ser Cys Pro Lys Gly Val Val Ala Asn Ala Asp Asp Ala Pro Lys Arg Ser Cys Pro Lys Gly Val Val Ala Asn

225 230 235 240 225 230 235 240

Met Ser Leu Gly Gly Ser Tyr Ser Ala Ser Ile Asn Asn Ala Ala Ala Met Ser Leu Gly Gly Ser Tyr Ser Ala Ser Ile Asn Asn Ala Ala Ala

245 250 255 245 250 255

Ala Leu Val Arg Ser Gly Val Phe Leu Ala Val Ala Ala Gly Asn Glu Ala Leu Val Arg Ser Gly Val Phe Leu Ala Val Ala Ala Gly Asn Glu

260 265 270 260 265 270

Asn Gln Asn Ala Ala Asn Ser Ser Pro Ala Ser Glu Ala Ser Ala Cys Asn Gln Asn Ala Ala Asn Ser Ser Pro Ala Ser Glu Ala Ser Ala Cys

275 280 285 275 280 285

Thr Val Gly Ala Thr Asp Arg Asn Asp Ala Lys Ala Ser Tyr Ser Asn Thr Val Gly Ala Thr Asp Arg Asn Asp Ala Lys Ala Ser Tyr Ser Asn

290 295 300 290 295 300

Tyr Gly Ser Val Val Asp Ile Gln Ala Pro Gly Ser Asn Ile Leu Ser Tyr Gly Ser Val Val Asp Ile Gln Ala Pro Gly Ser Asn Ile Leu Ser

305 310 315 320 305 310 315 320

Thr Trp Ile Gly Ser Thr Ser Ala Thr Asn Thr Ile Ser Gly Thr Ser Thr Trp Ile Gly Ser Thr Ser Ala Thr Asn Thr Ile Ser Gly Thr Ser

325 330 335 325 330 335

Met Ala Ser Pro His Ile Ala Gly Leu Gly Ala Tyr Leu Leu Ala Leu Met Ala Ser Pro His Ile Ala Gly Leu Gly Ala Tyr Leu Leu Ala Leu

340 345 350 340 345 350

Glu Gly Ser Lys Thr Pro Ala Glu Leu Cys Asn Tyr Ile Lys Ser Thr Glu Gly Ser Lys Thr Pro Ala Glu Leu Cys Asn Tyr Ile Lys Ser Thr

355 360 365 355 360 365

Gly Asn Ala Ala Ile Thr Gly Val Pro Ser Gly Thr Thr Asn Arg Ile Gly Asn Ala Ala Ile Thr Gly Val Pro Ser Gly Thr Thr Asn Arg Ile

370 375 380 370 375 380

Ala Phe Asn Gly Asn Pro Ser Ala Ala Phe Asn Gly Asn Pro Ser Ala

385 390 385 390

<210> 2<210> 2

<211> 397<211> 397

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 2<400> 2

Met Lys Asp Ala Phe Leu Leu Thr Ala Ala Val Leu Leu Gly Ser Ala Met Lys Asp Ala Phe Leu Leu Thr Ala Ala Val Leu Leu Gly Ser Ala

1 5 10 15 1 5 10 15

Gln Gly Ala Val His Lys Met Lys Leu Gln Lys Ile Pro Leu Ser Glu Gln Gly Ala Val His Lys Met Lys Leu Gln Lys Ile Pro Leu Ser Glu

20 25 30 20 25 30

Gln Leu Glu Ala Val Pro Ile Asn Thr Gln Leu Glu His Leu Gly Gln Gln Leu Glu Ala Val Pro Ile Asn Thr Gln Leu Glu His Leu Gly Gln

35 40 45 35 40 45

Lys Tyr Met Gly Leu Arg Pro Arg Glu Ser Gln Ala Asp Ala Ile Phe Lys Tyr Met Gly Leu Arg Pro Arg Glu Ser Gln Ala Asp Ala Ile Phe

50 55 60 50 55 60

Lys Gly Met Val Ala Asp Val Lys Gly Asn His Pro Ile Pro Ile Ser Lys Gly Met Val Ala Asp Val Lys Gly Asn His Pro Ile Pro Ile Ser

65 70 75 80 65 70 75 80

Asn Phe Met Asn Ala Gln Tyr Phe Ser Glu Ile Thr Ile Gly Thr Pro Asn Phe Met Asn Ala Gln Tyr Phe Ser Glu Ile Thr Ile Gly Thr Pro

85 90 95 85 90 95

Pro Gln Ser Phe Lys Val Val Leu Asp Thr Gly Ser Ser Asn Leu Trp Pro Gln Ser Phe Lys Val Val Leu Asp Thr Gly Ser Ser Asn Leu Trp

100 105 110 100 105 110

Val Pro Ser Val Glu Cys Gly Ser Ile Ala Cys Tyr Leu His Ser Lys Val Pro Ser Val Glu Cys Gly Ser Ile Ala Cys Tyr Leu His Ser Lys

115 120 125 115 120 125

Tyr Asp Ser Ser Ala Ser Ser Thr Tyr Lys Lys Asn Gly Thr Ser Phe Tyr Asp Ser Ser Ala Ser Ser Thr Tyr Lys Lys Asn Gly Thr Ser Phe

130 135 140 130 135 140

Glu Ile Arg Tyr Gly Ser Gly Ser Leu Ser Gly Phe Val Ser Gln Asp Glu Ile Arg Tyr Gly Ser Gly Ser Leu Ser Gly Phe Val Ser Gln Asp

145 150 155 160 145 150 155 160

Thr Val Ser Ile Gly Asp Ile Thr Ile Gln Gly Gln Asp Phe Ala Glu Thr Val Ser Ile Gly Asp Ile Thr Ile Gln Gly Gln Asp Phe Ala Glu

165 170 175 165 170 175

Ala Thr Ser Glu Pro Gly Leu Ala Phe Ala Phe Gly Arg Phe Asp Gly Ala Thr Ser Glu Pro Gly Leu Ala Phe Ala Phe Gly Arg Phe Asp Gly

180 185 190 180 185 190

Ile Leu Gly Leu Gly Tyr Asp Arg Ile Ser Val Asn Gly Ile Val Pro Ile Leu Gly Leu Gly Tyr Asp Arg Ile Ser Val Asn Gly Ile Val Pro

195 200 205 195 200 205

Pro Phe Tyr Lys Met Val Glu Gln Lys Leu Ile Asp Glu Pro Val Phe Pro Phe Tyr Lys Met Val Glu Gln Lys Leu Ile Asp Glu Pro Val Phe

210 215 220 210 215 220

Ala Phe Tyr Leu Ala Asp Thr Asn Gly Gln Ser Glu Val Val Phe Gly Ala Phe Tyr Leu Ala Asp Thr Asn Gly Gln Ser Glu Val Val Phe Gly

225 230 235 240 225 230 235 240

Gly Val Asp His Asp Lys Tyr Lys Gly Lys Ile Thr Thr Ile Pro Leu Gly Val Asp His Asp Lys Tyr Lys Gly Lys Ile Thr Thr Ile Pro Leu

245 250 255 245 250 255

Arg Arg Lys Ala Tyr Trp Glu Val Asp Phe Asp Ala Ile Ser Tyr Gly Arg Arg Lys Ala Tyr Trp Glu Val Asp Phe Asp Ala Ile Ser Tyr Gly

260 265 270 260 265 270

Asp Asp Thr Ala Glu Leu Glu Asn Thr Gly Ile Ile Leu Asp Thr Gly Asp Asp Thr Ala Glu Leu Glu Asn Thr Gly Ile Ile Leu Asp Thr Gly

275 280 285 275 280 285

Thr Ser Leu Ile Ala Leu Pro Ser Gln Leu Ala Glu Met Leu Asn Ala Thr Ser Leu Ile Ala Leu Pro Ser Gln Leu Ala Glu Met Leu Asn Ala

290 295 300 290 295 300

Gln Ile Gly Ala Lys Lys Ser Tyr Thr Gly Gln Tyr Thr Ile Asp Cys Gln Ile Gly Ala Lys Lys Ser Tyr Thr Gly Gln Tyr Thr Ile Asp Cys

305 310 315 320 305 310 315 320

Asn Lys Arg Asp Ser Leu Lys Asp Val Thr Phe Asn Leu Ala Gly Tyr Asn Lys Arg Asp Ser Leu Lys Asp Val Thr Phe Asn Leu Ala Gly Tyr

325 330 335 325 330 335

Asn Phe Thr Leu Gly Pro Tyr Asp Tyr Val Leu Glu Val Gln Gly Ser Asn Phe Thr Leu Gly Pro Tyr Asp Tyr Val Leu Glu Val Gln Gly Ser

340 345 350 340 345 350

Cys Ile Ser Thr Phe Met Gly Met Asp Phe Pro Ala Pro Thr Gly Pro Cys Ile Ser Thr Phe Met Gly Met Asp Phe Pro Ala Pro Thr Gly Pro

355 360 365 355 360 365

Leu Ala Ile Leu Gly Asp Ala Phe Leu Arg Arg Tyr Tyr Ser Ile Tyr Leu Ala Ile Leu Gly Asp Ala Phe Leu Arg Arg Tyr Tyr Ser Ile Tyr

370 375 380 370 375 380

Asp Leu Gly Ala Asp Thr Val Gly Leu Ala Glu Ala Lys Asp Leu Gly Ala Asp Thr Val Gly Leu Ala Glu Ala Lys

385 390 395 385 390 395

<210> 3<210> 3

<211> 534<211> 534

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 3<400> 3

Met Arg Gly Leu Val Ala Phe Ser Leu Ala Ala Cys Val Ser Ala Ala Met Arg Gly Leu Val Ala Phe Ser Leu Ala Ala Cys Val Ser Ala Ala

1 5 10 15 1 5 10 15

Pro Ser Phe Lys Thr Glu Thr Ile Asn Gly Glu His Ala Pro Ile Leu Pro Ser Phe Lys Thr Glu Thr Ile Asn Gly Glu His Ala Pro Ile Leu

20 25 30 20 25 30

Ser Ser Ser Asn Ala Glu Val Val Pro Asn Ser Tyr Ile Ile Lys Phe Ser Ser Ser Asn Ala Glu Val Val Pro Asn Ser Tyr Ile Ile Lys Phe

35 40 45 35 40 45

Lys Lys His Val Asp Glu Ser Ser Ala Ser Ala His His Ala Trp Ile Lys Lys His Val Asp Glu Ser Ser Ala Ser Ala His His Ala Trp Ile

50 55 60 50 55 60

Gln Asp Ile His Thr Ser Arg Glu Lys Val Arg Gln Asp Leu Lys Lys Gln Asp Ile His Thr Ser Arg Glu Lys Val Arg Gln Asp Leu Lys Lys

65 70 75 80 65 70 75 80

Arg Gly Gln Val Pro Leu Leu Asp Asp Val Phe His Gly Leu Lys His Arg Gly Gln Val Pro Leu Leu Asp Asp Val Phe His Gly Leu Lys His

85 90 95 85 90 95

Thr Tyr Lys Ile Gly Gln Glu Phe Leu Gly Tyr Ser Gly His Phe Asp Thr Tyr Lys Ile Gly Gln Glu Phe Leu Gly Tyr Ser Gly His Phe Asp

100 105 110 100 105 110

Asp Glu Thr Ile Glu Gln Val Arg Arg His Pro Asp Val Glu Tyr Ile Asp Glu Thr Ile Glu Gln Val Arg Arg His Pro Asp Val Glu Tyr Ile

115 120 125 115 120 125

Glu Arg Asp Ser Ile Val His Thr Met Arg Val Thr Glu Glu Thr Cys Glu Arg Asp Ser Ile Val His Thr Met Arg Val Thr Glu Glu Thr Cys

130 135 140 130 135 140

Asp Gly Glu Leu Glu Lys Ala Ala Pro Trp Gly Leu Ala Arg Ile Ser Asp Gly Glu Leu Glu Lys Ala Ala Pro Trp Gly Leu Ala Arg Ile Ser

145 150 155 160 145 150 155 160

His Arg Asp Thr Leu Gly Phe Ser Thr Phe Asn Lys Tyr Leu Tyr Ala His Arg Asp Thr Leu Gly Phe Ser Thr Phe Asn Lys Tyr Leu Tyr Ala

165 170 175 165 170 175

Ala Glu Gly Gly Glu Gly Val Asp Ala Tyr Val Ile Asp Thr Gly Thr Ala Glu Gly Gly Glu Gly Val Asp Ala Tyr Val Ile Asp Thr Gly Thr

180 185 190 180 185 190

Asn Ile Glu His Val Asp Phe Glu Gly Arg Ala Lys Trp Gly Lys Thr Asn Ile Glu His Val Asp Phe Glu Gly Arg Ala Lys Trp Gly Lys Thr

195 200 205 195 200 205

Ile Pro Ala Gly Asp Ala Asp Val Asp Gly Asn Gly His Gly Thr His Ile Pro Ala Gly Asp Ala Asp Val Asp Gly Asn Gly His Gly Thr His

210 215 220 210 215 220

Cys Ser Gly Thr Ile Ala Gly Lys Lys Tyr Gly Val Ala Lys Lys Ala Cys Ser Gly Thr Ile Ala Gly Lys Lys Tyr Gly Val Ala Lys Lys Ala

225 230 235 240 225 230 235 240

Asn Val Tyr Ala Val Lys Val Leu Arg Ser Asn Gly Ser Gly Thr Met Asn Val Tyr Ala Val Lys Val Leu Arg Ser Asn Gly Ser Gly Thr Met

245 250 255 245 250 255

Ala Asp Val Val Ala Gly Val Glu Trp Ala Ala Lys Ser His Leu Glu Ala Asp Val Val Ala Gly Val Glu Trp Ala Ala Lys Ser His Leu Glu

260 265 270 260 265 270

Gln Val Gln Ala Ala Lys Asp Gly Lys Arg Lys Gly Phe Lys Gly Ser Gln Val Gln Ala Ala Lys Asp Gly Lys Arg Lys Gly Phe Lys Gly Ser

275 280 285 275 280 285

Val Ala Asn Met Ser Leu Gly Gly Gly Lys Thr Arg Ala Leu Asp Asp Val Ala Asn Met Ser Leu Gly Gly Gly Lys Thr Arg Ala Leu Asp Asp

290 295 300 290 295 300

Thr Val Asn Ala Ala Val Ser Val Gly Ile His Phe Ala Val Ala Ala Thr Val Asn Ala Ala Val Ser Val Gly Ile His Phe Ala Val Ala Ala

305 310 315 320 305 310 315 320

Gly Asn Asp Asn Ala Asp Ala Cys Asn Tyr Ser Pro Ala Ala Ala Glu Gly Asn Asp Asn Ala Asp Ala Cys Asn Tyr Ser Pro Ala Ala Ala Glu

325 330 335 325 330 335

Lys Ala Val Thr Val Gly Ala Ser Ala Ile Asp Asp Ser Arg Ala Tyr Lys Ala Val Thr Val Gly Ala Ser Ala Ile Asp Asp Ser Arg Ala Tyr

340 345 350 340 345 350

Phe Ser Asn Tyr Gly Lys Cys Thr Asp Ile Phe Ala Pro Gly Leu Ser Phe Ser Asn Tyr Gly Lys Cys Thr Asp Ile Phe Ala Pro Gly Leu Ser

355 360 365 355 360 365

Ile Leu Ser Thr Trp Ile Gly Ser Lys Tyr Ala Thr Asn Thr Ile Ser Ile Leu Ser Thr Trp Ile Gly Ser Lys Tyr Ala Thr Asn Thr Ile Ser

370 375 380 370 375 380

Gly Thr Ser Met Ala Ser Pro His Ile Ala Gly Leu Leu Ala Tyr Tyr Gly Thr Ser Met Ala Ser Pro His Ile Ala Gly Leu Leu Ala Tyr Tyr

385 390 395 400 385 390 395 400

Leu Ser Leu Gln Pro Ala Thr Asp Ser Glu Tyr Ser Val Ala Pro Ile Leu Ser Leu Gln Pro Ala Thr Asp Ser Glu Tyr Ser Val Ala Pro Ile

405 410 415 405 410 415

Thr Pro Glu Lys Met Lys Ser Asn Leu Leu Lys Ile Ala Thr Gln Asp Thr Pro Glu Lys Met Lys Ser Asn Leu Leu Lys Ile Ala Thr Gln Asp

420 425 430 420 425 430

Ala Leu Thr Asp Ile Pro Asp Glu Thr Pro Asn Leu Leu Ala Trp Asn Ala Leu Thr Asp Ile Pro Asp Glu Thr Pro Asn Leu Leu Ala Trp Asn

435 440 445 435 440 445

Gly Gly Gly Cys Asn Asn Tyr Thr Ala Ile Val Glu Ala Gly Gly Tyr Gly Gly Gly Cys Asn Asn Tyr Thr Ala Ile Val Glu Ala Gly Gly Tyr

450 455 460 450 455 460

Lys Ala Lys Lys Lys Thr Thr Thr Asp Lys Val Asp Ile Gly Ala Ser Lys Ala Lys Lys Lys Thr Thr Thr Asp Lys Val Asp Ile Gly Ala Ser

465 470 475 480 465 470 475 480

Val Ser Glu Leu Glu Lys Leu Ile Glu His Asp Phe Glu Val Ile Ser Val Ser Glu Leu Glu Lys Leu Ile Glu His Asp Phe Glu Val Ile Ser

485 490 495 485 490 495

Gly Lys Val Val Lys Gly Val Ser Ser Phe Ala Asp Lys Ala Glu Lys Gly Lys Val Val Lys Gly Val Ser Ser Phe Ala Asp Lys Ala Glu Lys

500 505 510 500 505 510

Phe Ser Glu Lys Ile His Glu Leu Val Asp Glu Glu Leu Lys Glu Phe Phe Ser Glu Lys Ile His Glu Leu Val Asp Glu Glu Leu Lys Glu Phe

515 520 525 515 520 525

Leu Glu Asp Ile Ala Ala Leu Glu Asp Ile Ala Ala

530 530

<210> 4<210> 4

<211> 307<211> 307

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 4<400> 4

Met Lys Pro Thr Val Leu Phe Thr Leu Leu Ala Ser Gly Ala Tyr Ala Met Lys Pro Thr Val Leu Phe Thr Leu Leu Ala Ser Gly Ala Tyr Ala

1 5 10 15 1 5 10 15

Ala Ala Thr Pro Ala Ile Pro Gly Tyr Ser Pro Arg Thr Arg Gly Met Ala Ala Thr Pro Ala Ile Pro Gly Tyr Ser Pro Arg Thr Arg Gly Met

20 25 30 20 25 30

Asn Pro His His His Ala Pro Leu Arg Leu Leu His Thr Phe Thr Pro Asn Pro His His His Ala Pro Leu Arg Leu Leu His Thr Phe Thr Pro

35 40 45 35 40 45

Ile Ser Thr Ser Gly Lys Ser Phe Arg Leu Leu Ala Ser Ser Thr Glu Ile Ser Thr Ser Gly Lys Ser Phe Arg Leu Leu Ala Ser Ser Thr Glu

50 55 60 50 55 60

Ser Thr Lys Gly Gly Ala Ile Leu Gly Leu Pro Asp Asn Asp Leu Ser Ser Thr Lys Gly Gly Ala Ile Leu Gly Leu Pro Asp Asn Asp Leu Ser

65 70 75 80 65 70 75 80

Thr Val Arg Thr Thr Ile Arg Ile Pro Ala Ala Lys Met Pro Thr Ala Thr Val Arg Thr Thr Ile Arg Ile Pro Ala Ala Lys Met Pro Thr Ala

85 90 95 85 90 95

Gly Pro Thr Ala Asn Asn Thr Val Gly Glu Tyr Ala Ala Ser Phe Trp Gly Pro Thr Ala Asn Asn Thr Val Gly Glu Tyr Ala Ala Ser Phe Trp

100 105 110 100 105 110

Val Gly Ile Asp Ser Ala Thr Asp Ala Cys Gly Ala Gly Gly Ser Leu Val Gly Ile Asp Ser Ala Thr Asp Ala Cys Gly Ala Gly Gly Ser Leu

115 120 125 115 120 125

Arg Ala Gly Val Asp Ile Phe Trp Asp Gly Thr Leu Gly Gly Gln Gln Arg Ala Gly Val Asp Ile Phe Trp Asp Gly Thr Leu Gly Gly Gln Gln

130 135 140 130 135 140

Thr Pro Phe Ala Trp Tyr Gln Gly Pro Gly Gln Ala Asp Val Val Gly Thr Pro Phe Ala Trp Tyr Gln Gly Pro Gly Gln Ala Asp Val Val Gly

145 150 155 160 145 150 155 160

Phe Gly Gly Gly Phe Pro Val Gly Glu Gly Asp Leu Val Arg Leu Thr Phe Gly Gly Gly Phe Pro Val Gly Glu Gly Asp Leu Val Arg Leu Thr

165 170 175 165 170 175

Leu Glu Ala Gly Pro Ala Gly Gly Glu Glu Ile Ala Val Val Ala Glu Leu Glu Ala Gly Pro Ala Gly Gly Glu Glu Ile Ala Val Val Ala Glu

180 185 190 180 185 190

Asn Phe Gly Arg Asn Val Thr Arg Ala Asp Glu Gly Ala Val Pro Val Asn Phe Gly Arg Asn Val Thr Arg Ala Asp Glu Gly Ala Val Pro Val

195 200 205 195 200 205

Arg Lys Val Arg Lys Val Leu Pro Ala Glu Ala Gly Gly Gln Lys Leu Arg Lys Val Arg Lys Val Leu Pro Ala Glu Ala Gly Gly Gln Lys Leu

210 215 220 210 215 220

Cys Arg Gly Glu Ala Ala Trp Met Val Glu Asp Phe Pro Leu Gln Gly Cys Arg Gly Glu Ala Ala Trp Met Val Glu Asp Phe Pro Leu Gln Gly

225 230 235 240 225 230 235 240

Arg Pro Glu Phe Pro Thr Ala Leu Ala Asn Phe Thr Ser Val Thr Phe Arg Pro Glu Phe Pro Thr Ala Leu Ala Asn Phe Thr Ser Val Thr Phe

245 250 255 245 250 255

Asn Thr Gly Ile Thr Leu Asp Asp Gly Thr Glu Lys Asp Leu Thr Gly Asn Thr Gly Ile Thr Leu Asp Asp Gly Thr Glu Lys Asp Leu Thr Gly

260 265 270 260 265 270

Ala Glu Val Leu Asp Ile Gln Leu Glu Ala Gln Gly Gly Arg Leu Thr Ala Glu Val Leu Asp Ile Gln Leu Glu Ala Gln Gly Gly Arg Leu Thr

275 280 285 275 280 285

Ser Cys Glu Val Val Asp Asp Arg Asn Val Lys Cys Ala Arg Val Val Ser Cys Glu Val Val Asp Asp Arg Asn Val Lys Cys Ala Arg Val Val

290 295 300 290 295 300

Gly Asp Asn Gly Asp Asn

305 305

<210> 5<210> 5

<211> 554<211> 554

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 5<400> 5

Met Arg Ile Ala Ala Ser Thr Val Leu Leu Gly Ala Ala Ser Ala Ala Met Arg Ile Ala Ala Ser Thr Val Leu Leu Gly Ala Ala Ser Ala Ala

1 5 10 15 1 5 10 15

Ser Phe Gln Gln Gln Ala Gln His Val Leu Ser Asp Gly Phe Gly Lys Ser Phe Gln Gln Gln Ala Gln His Val Leu Ser Asp Gly Phe Gly Lys

20 25 30 20 25 30

Ala Gln Glu Ala Met Lys Pro Leu Ser Asp Ala Leu Ala Asp Ala Ala Ala Gln Glu Ala Met Lys Pro Leu Ser Asp Ala Leu Ala Asp Ala Ala

35 40 45 35 40 45

Gly Arg Pro Ile Glu Asn Phe Glu Glu Ala Phe Ser Gly Met Thr Ala Gly Arg Pro Ile Glu Asn Phe Glu Glu Ala Phe Ser Gly Met Thr Ala

50 55 60 50 55 60

Glu Ala Lys Ala Leu Trp Glu Glu Ile Lys Leu Leu Val Pro Asp Ser Glu Ala Lys Ala Leu Trp Glu Glu Ile Lys Leu Leu Val Pro Asp Ser

65 70 75 80 65 70 75 80

Ala Phe Lys Asn Pro Ser Trp Phe Ser Lys Pro Lys Pro His Arg Arg Ala Phe Lys Asn Pro Ser Trp Phe Ser Lys Pro Lys Pro His Arg Arg

85 90 95 85 90 95

Arg Asp Asp Trp Asp His Val Val Lys Gly Ala Asp Val Gln Lys Ile Arg Asp Asp Trp Asp His Val Val Lys Gly Ala Asp Val Gln Lys Ile

100 105 110 100 105 110

Trp Val Gln Asp Ala Asn Gly Glu Ser His Arg Gln Val Gly Gly Arg Trp Val Gln Asp Ala Asn Gly Glu Ser His Arg Gln Val Gly Gly Arg

115 120 125 115 120 125

Ile Glu Asp Tyr Asn Leu Arg Val Lys Thr Val Asp Pro Ser Lys Leu Ile Glu Asp Tyr Asn Leu Arg Val Lys Thr Val Asp Pro Ser Lys Leu

130 135 140 130 135 140

Gly Val Asp Ser Val Lys Gln Phe Ser Gly Tyr Leu Asp Asp Glu Ala Gly Val Asp Ser Val Lys Gln Phe Ser Gly Tyr Leu Asp Asp Glu Ala

145 150 155 160 145 150 155 160

Asn Asp Lys His Leu Phe Tyr Trp Phe Phe Glu Ser Arg Asn Asp Pro Asn Asp Lys His Leu Phe Tyr Trp Phe Phe Glu Ser Arg Asn Asp Pro

165 170 175 165 170 175

Lys Asn Asp Pro Val Val Leu Trp Leu Asn Gly Gly Pro Gly Cys Ser Lys Asn Asp Pro Val Val Leu Trp Leu Asn Gly Gly Pro Gly Cys Ser

180 185 190 180 185 190

Ser Leu Thr Gly Leu Phe Leu Glu Leu Gly Pro Ser Ser Ile Asp Lys Ser Leu Thr Gly Leu Phe Leu Glu Leu Gly Pro Ser Ser Ile Asp Lys

195 200 205 195 200 205

Asn Leu Lys Val Val Asn Asn Glu Phe Ser Trp Asn Asn Asn Ala Ser Asn Leu Lys Val Val Asn Asn Glu Phe Ser Trp Asn Asn Asn Ala Ser

210 215 220 210 215 220

Val Ile Phe Leu Asp Gln Pro Val Asn Val Gly Tyr Ser Tyr Ser Gly Val Ile Phe Leu Asp Gln Pro Val Asn Val Gly Tyr Ser Tyr Ser Gly

225 230 235 240 225 230 235 240

Ser Ser Val Ser Asn Thr Ile Ala Ala Gly Lys Asp Val Tyr Ala Leu Ser Ser Val Ser Asn Thr Ile Ala Ala Gly Lys Asp Val Tyr Ala Leu

245 250 255 245 250 255

Leu Thr Leu Phe Phe His Gln Phe Pro Glu Tyr Ala Lys Gln Asp Phe Leu Thr Leu Phe Phe His Gln Phe Pro Glu Tyr Ala Lys Gln Asp Phe

260 265 270 260 265 270

His Ile Ala Gly Glu Ser Tyr Ala Gly His Tyr Ile Pro Val Phe Ala His Ile Ala Gly Glu Ser Tyr Ala Gly His Tyr Ile Pro Val Phe Ala

275 280 285 275 280 285

Ser Glu Ile Leu Ser His Lys Asn Arg Asn Ile Asn Leu Lys Ser Ile Ser Glu Ile Leu Ser His Lys Asn Arg Asn Ile Asn Leu Lys Ser Ile

290 295 300 290 295 300

Leu Ile Gly Asn Gly Leu Thr Asp Gly Leu Thr Gln Tyr Glu Tyr Tyr Leu Ile Gly Asn Gly Leu Thr Asp Gly Leu Thr Gln Tyr Glu Tyr Tyr

305 310 315 320 305 310 315 320

Arg Pro Met Ala Cys Gly Glu Gly Gly Tyr Pro Ala Val Leu Ser Glu Arg Pro Met Ala Cys Gly Glu Gly Gly Tyr Pro Ala Val Leu Ser Glu

325 330 335 325 330 335

Ser Glu Cys Arg Ser Met Asp Asn Ala Leu Pro Arg Cys Gln Ser Leu Ser Glu Cys Arg Ser Met Asp Asn Ala Leu Pro Arg Cys Gln Ser Leu

340 345 350 340 345 350

Ile Arg Asn Cys Tyr Asp Ser Gly Ser Val Trp Ser Cys Val Pro Ala Ile Arg Asn Cys Tyr Asp Ser Gly Ser Val Trp Ser Cys Val Pro Ala

355 360 365 355 360 365

Ser Ile Tyr Cys Asn Asn Ala Leu Ile Gly Pro Tyr Gln Arg Thr Gly Ser Ile Tyr Cys Asn Asn Ala Leu Ile Gly Pro Tyr Gln Arg Thr Gly

370 375 380 370 375 380

Gln Asn Val Tyr Asp Ile Arg Gly Lys Cys Glu Asp Ser Ser Asn Leu Gln Asn Val Tyr Asp Ile Arg Gly Lys Cys Glu Asp Ser Ser Asn Leu

385 390 395 400 385 390 395 400

Cys Tyr Ser Ala Leu Gly Tyr Ile Ser Asp Tyr Leu Asn Gln Gln Ser Cys Tyr Ser Ala Leu Gly Tyr Ile Ser Asp Tyr Leu Asn Gln Gln Ser

405 410 415 405 410 415

Val Met Asp Ala Leu Gly Val Glu Val Ser Ser Tyr Glu Ser Cys Asn Val Met Asp Ala Leu Gly Val Glu Val Ser Ser Tyr Glu Ser Cys Asn

420 425 430 420 425 430

Phe Asp Ile Asn Arg Asn Phe Leu Phe Gln Gly Asp Trp Met Gln Pro Phe Asp Ile Asn Arg Asn Phe Leu Phe Gln Gly Asp Trp Met Gln Pro

435 440 445 435 440 445

Phe His Arg Leu Val Pro Asn Ile Leu Lys Glu Ile Pro Val Leu Ile Phe His Arg Leu Val Pro Asn Ile Leu Lys Glu Ile Pro Val Leu Ile

450 455 460 450 455 460

Tyr Ala Gly Asp Ala Asp Tyr Ile Cys Asn Trp Leu Gly Asn Arg Ala Tyr Ala Gly Asp Ala Asp Tyr Ile Cys Asn Trp Leu Gly Asn Arg Ala

465 470 475 480 465 470 475 480

Trp Thr Glu Lys Leu Glu Trp Pro Gly Gln Lys Ala Phe Asn Gln Ala Trp Thr Glu Lys Leu Glu Trp Pro Gly Gln Lys Ala Phe Asn Gln Ala

485 490 495 485 490 495

Lys Val His Asp Leu Lys Leu Ala Gly Ala Asp Glu Glu Tyr Gly Lys Lys Val His Asp Leu Lys Leu Ala Gly Ala Asp Glu Glu Tyr Gly Lys

500 505 510 500 505 510

Val Lys Ala Ser Gly Asn Phe Thr Phe Met Gln Ile Tyr Gln Ala Gly Val Lys Ala Ser Gly Asn Phe Thr Phe Met Gln Ile Tyr Gln Ala Gly

515 520 525 515 520 525

His Met Val Pro Met Asp Gln Pro Glu Asn Ser Leu Asp Phe Leu Asn His Met Val Pro Met Asp Gln Pro Glu Asn Ser Leu Asp Phe Leu Asn

530 535 540 530 535 540

Arg Trp Leu Ser Gly Glu Trp Phe Ala Lys Arg Trp Leu Ser Gly Glu Trp Phe Ala Lys

545 550 545 550

<210> 6<210> 6

<211> 897<211> 897

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 6<400> 6

Met Val Arg Leu Asp Trp Ala Ala Val Leu Leu Ala Ala Thr Ala Val Met Val Arg Leu Asp Trp Ala Ala Val Leu Leu Ala Ala Thr Ala Val

1 5 10 15 1 5 10 15

Ala Lys Ala Val Thr Pro His Thr Pro Ser Phe Val Pro Gly Ala Tyr Ala Lys Ala Val Thr Pro His Thr Pro Ser Phe Val Pro Gly Ala Tyr

20 25 30 20 25 30

Ile Val Glu Tyr Glu Glu Asp Gln Asp Ser His Ala Phe Val Asn Lys Ile Val Glu Tyr Glu Glu Asp Gln Asp Ser His Ala Phe Val Asn Lys

35 40 45 35 40 45

Leu Gly Gly Lys Ala Ser Leu Arg Lys Asp Leu Arg Phe Lys Leu Phe Leu Gly Gly Lys Ala Ser Leu Arg Lys Asp Leu Arg Phe Lys Leu Phe

50 55 60 50 55 60

Lys Gly Ala Ser Ile Gln Phe Lys Asp Thr Glu Thr Ala Asp Gln Met Lys Gly Ala Ser Ile Gln Phe Lys Asp Thr Glu Thr Ala Asp Gln Met

65 70 75 80 65 70 75 80

Val Ala Lys Val Ala Glu Met Pro Lys Val Lys Ala Val Tyr Pro Val Val Ala Lys Val Ala Glu Met Pro Lys Val Lys Ala Val Tyr Pro Val

85 90 95 85 90 95

Arg Arg Tyr Pro Val Pro Asn His Val Val His Ser Thr Gly Asn Val Arg Arg Tyr Pro Val Pro Asn His Val Val His Ser Thr Gly Asn Val

100 105 110 100 105 110

Ala Asp Glu Val Leu Val Lys Arg Gln Ala Ala Gly Asn Asp Thr Phe Ala Asp Glu Val Leu Val Lys Arg Gln Ala Ala Gly Asn Asp Thr Phe

115 120 125 115 120 125

Ser Thr His Leu Met Thr Gln Val Asn Lys Phe Arg Asp Ala Gly Ile Ser Thr His Leu Met Thr Gln Val Asn Lys Phe Arg Asp Ala Gly Ile

130 135 140 130 135 140

Thr Gly Lys Gly Ile Lys Ile Ala Val Ile Asp Thr Gly Ile Asp Tyr Thr Gly Lys Gly Ile Lys Ile Ala Val Ile Asp Thr Gly Ile Asp Tyr

145 150 155 160 145 150 155 160

Leu His Glu Ala Leu Gly Gly Cys Phe Gly Pro Asp Cys Leu Val Ser Leu His Glu Ala Leu Gly Gly Cys Phe Gly Pro Asp Cys Leu Val Ser

165 170 175 165 170 175

Tyr Gly Thr Asp Leu Val Gly Asp Asp Phe Asn Gly Ser Asn Thr Pro Tyr Gly Thr Asp Leu Val Gly Asp Asp Phe Asn Gly Ser Asn Thr Pro

180 185 190 180 185 190

Lys Pro Asp Pro Asp Pro Ile Asp Asn Cys Gln Gly His Gly Thr His Lys Pro Asp Pro Asp Pro Ile Asp Asn Cys Gln Gly His Gly Thr His

195 200 205 195 200 205

Val Ala Gly Ile Ile Ala Ala Gln Thr Asn Asn Pro Phe Gly Ile Ile Val Ala Gly Ile Ile Ala Ala Gln Thr Asn Asn Pro Phe Gly Ile Ile

210 215 220 210 215 220

Gly Ala Ala Thr Asp Val Thr Leu Gly Ala Tyr Arg Val Phe Gly Cys Gly Ala Ala Thr Asp Val Thr Leu Gly Ala Tyr Arg Val Phe Gly Cys

225 230 235 240 225 230 235 240

Asn Gly Asp Thr Pro Asn Asp Val Leu Ile Ala Ala Tyr Asn Met Ala Asn Gly Asp Thr Pro Asn Asp Val Leu Ile Ala Ala Tyr Asn Met Ala

245 250 255 245 250 255

Tyr Glu Ala Gly Ser Asp Ile Ile Thr Ala Ser Ile Gly Gly Pro Ser Tyr Glu Ala Gly Ser Asp Ile Ile Thr Ala Ser Ile Gly Gly Pro Ser

260 265 270 260 265 270

Gly Trp Ser Glu Asp Pro Trp Ala Ala Val Val Thr Arg Ile Val Glu Gly Trp Ser Glu Asp Pro Trp Ala Ala Val Val Thr Arg Ile Val Glu

275 280 285 275 280 285

Asn Gly Val Pro Cys Val Val Ser Ala Gly Asn Asp Gly Asp Ala Gly Asn Gly Val Pro Cys Val Val Ser Ala Gly Asn Asp Gly Asp Ala Gly

290 295 300 290 295 300

Ile Phe Tyr Ala Ser Thr Ala Ala Asn Gly Lys Lys Val Thr Ala Ile Ile Phe Tyr Ala Ser Thr Ala Ala Asn Gly Lys Lys Val Thr Ala Ile

305 310 315 320 305 310 315 320

Ala Ser Val Asp Asn Ile Val Thr Pro Ala Leu Leu Ser Asn Ala Ser Ala Ser Val Asp Asn Ile Val Thr Pro Ala Leu Leu Ser Asn Ala Ser

325 330 335 325 330 335

Tyr Thr Leu Asn Gly Thr Asp Asp Phe Phe Gly Phe Thr Ala Gly Asp Tyr Thr Leu Asn Gly Thr Asp Asp Phe Phe Gly Phe Thr Ala Gly Asp

340 345 350 340 345 350

Pro Gly Ser Trp Asp Asp Val Asn Leu Pro Leu Trp Ala Val Ser Phe Pro Gly Ser Trp Asp Asp Val Asn Leu Pro Leu Trp Ala Val Ser Phe

355 360 365 355 360 365

Asp Thr Thr Asp Pro Ala Asn Gly Cys Asn Pro Tyr Pro Asp Ser Thr Asp Thr Thr Asp Pro Ala Asn Gly Cys Asn Pro Tyr Pro Asp Ser Thr

370 375 380 370 375 380

Pro Asp Leu Ser Gly Tyr Ile Val Leu Ile Arg Arg Gly Thr Cys Thr Pro Asp Leu Ser Gly Tyr Ile Val Leu Ile Arg Arg Gly Thr Cys Thr

385 390 395 400 385 390 395 400

Phe Val Glu Lys Ala Ser Tyr Ala Ala Ala Lys Gly Ala Lys Tyr Val Phe Val Glu Lys Ala Ser Tyr Ala Ala Ala Lys Gly Ala Lys Tyr Val

405 410 415 405 410 415

Met Phe Tyr Asn Asn Val Gln Gln Gly Thr Val Thr Val Ser Ala Ala Met Phe Tyr Asn Asn Val Gln Gln Gly Thr Val Thr Val Ser Ala Ala

420 425 430 420 425 430

Glu Ala Lys Gly Ile Glu Gly Val Ala Met Val Thr Ala Gln Gln Gly Glu Ala Lys Gly Ile Glu Gly Val Ala Met Val Thr Ala Gln Gln Gly

435 440 445 435 440 445

Glu Ala Trp Val Arg Ala Leu Glu Ala Gly Ser Glu Val Val Leu His Glu Ala Trp Val Arg Ala Leu Glu Ala Gly Ser Glu Val Val Leu His

450 455 460 450 455 460

Met Lys Asp Pro Leu Lys Ala Gly Lys Phe Leu Thr Thr Thr Pro Asn Met Lys Asp Pro Leu Lys Ala Gly Lys Phe Leu Thr Thr Thr Pro Asn

465 470 475 480 465 470 475 480

Thr Ala Thr Gly Gly Phe Met Ser Asp Tyr Thr Ser Trp Gly Pro Thr Thr Ala Thr Gly Gly Phe Met Ser Asp Tyr Thr Ser Trp Gly Pro Thr

485 490 495 485 490 495

Trp Glu Val Glu Val Lys Pro Gln Phe Gly Thr Pro Gly Gly Ser Ile Trp Glu Val Glu Val Lys Pro Gln Phe Gly Thr Pro Gly Gly Ser Ile

500 505 510 500 505 510

Leu Ser Thr Tyr Pro Arg Ala Leu Gly Ser Tyr Ala Val Leu Ser Gly Leu Ser Thr Tyr Pro Arg Ala Leu Gly Ser Tyr Ala Val Leu Ser Gly

515 520 525 515 520 525

Thr Ser Met Ala Cys Pro Leu Ala Ala Ala Ile Tyr Ala Leu Leu Ile Thr Ser Met Ala Cys Pro Leu Ala Ala Ala Ile Tyr Ala Leu Leu Ile

530 535 540 530 535 540

Asn Thr Arg Gly Thr Lys Asp Pro Lys Thr Leu Glu Asn Leu Ile Ser Asn Thr Arg Gly Thr Lys Asp Pro Lys Thr Leu Glu Asn Leu Ile Ser

545 550 555 560 545 550 555 560

Ser Thr Ala Arg Pro Asn Leu Phe Arg Leu Asn Gly Glu Ser Leu Pro Ser Thr Ala Arg Pro Asn Leu Phe Arg Leu Asn Gly Glu Ser Leu Pro

565 570 575 565 570 575

Leu Leu Ala Pro Val Pro Gln Gln Gly Gly Gly Ile Val Gln Ala Trp Leu Leu Ala Pro Val Pro Gln Gln Gly Gly Gly Ile Val Gln Ala Trp

580 585 590 580 585 590

Asp Ala Ala Gln Ala Thr Thr Leu Leu Ser Val Ser Ser Leu Ser Phe Asp Ala Ala Gln Ala Thr Thr Leu Leu Ser Val Ser Ser Leu Ser Phe

595 600 605 595 600 605

Asn Asp Thr Asp His Phe Lys Pro Val Gln Thr Phe Thr Ile Thr Asn Asn Asp Thr Asp His Phe Lys Pro Val Gln Thr Phe Thr Ile Thr Asn

610 615 620 610 615 620

Thr Gly Lys Lys Ala Val Thr Tyr Ser Leu Ser Asn Val Gly Ala Ala Thr Gly Lys Lys Ala Val Thr Tyr Ser Leu Ser Asn Val Gly Ala Ala

625 630 635 640 625 630 635 640

Thr Ala Tyr Thr Phe Ala Asp Ala Lys Ser Ile Glu Pro Ala Pro Phe Thr Ala Tyr Thr Phe Ala Asp Ala Lys Ser Ile Glu Pro Ala Pro Phe

645 650 655 645 650 655

Pro Asn Glu Leu Thr Ala Asp Phe Ala Ser Leu Thr Phe Val Pro Lys Pro Asn Glu Leu Thr Ala Asp Phe Ala Ser Leu Thr Phe Val Pro Lys

660 665 670 660 665 670

Arg Leu Thr Ile Pro Ala Gly Lys Arg Gln Thr Val Thr Val Ile Ala Arg Leu Thr Ile Pro Ala Gly Lys Arg Gln Thr Val Thr Val Ile Ala

675 680 685 675 680 685

Lys Pro Ser Glu Gly Val Asp Ala Lys Arg Leu Pro Val Tyr Ser Gly Lys Pro Ser Glu Gly Val Asp Ala Lys Arg Leu Pro Val Tyr Ser Gly

690 695 700 690 695 700

Tyr Ile Ala Ile Asn Gly Ser Asp Ser Ser Ala Leu Ser Leu Pro Tyr Tyr Ile Ala Ile Asn Gly Ser Asp Ser Ser Ala Leu Ser Leu Pro Tyr

705 710 715 720 705 710 715 720

Leu Gly Val Val Gly Ser Leu His Ser Ala Val Val Leu Asp Ser Asn Leu Gly Val Val Gly Ser Leu His Ser Ala Val Val Leu Asp Ser Asn

725 730 735 725 730 735

Gly Ala Arg Ile Ser Leu Ala Ser Asp Asp Thr Asn Lys Pro Leu Pro Gly Ala Arg Ile Ser Leu Ala Ser Asp Asp Thr Asn Lys Pro Leu Pro

740 745 750 740 745 750

Ala Asn Thr Ser Phe Val Leu Pro Pro Ala Gly Phe Pro Asn Asp Thr Ala Asn Thr Ser Phe Val Leu Pro Pro Ala Gly Phe Pro Asn Asp Thr

755 760 765 755 760 765

Ser Tyr Ala Asn Ser Thr Asp Leu Pro Lys Leu Val Val Asp Leu Ala Ser Tyr Ala Asn Ser Thr Asp Leu Pro Lys Leu Val Val Asp Leu Ala

770 775 780 770 775 780

Met Gly Ser Ala Leu Leu Arg Ala Asp Val Val Pro Leu Ser Gly Gly Met Gly Ser Ala Leu Leu Arg Ala Asp Val Val Pro Leu Ser Gly Gly

785 790 795 800 785 790 795 800

Ala Ala Thr Ala Thr Ala Arg Leu Thr Arg Thr Val Phe Gly Thr Arg Ala Ala Thr Ala Thr Ala Arg Leu Thr Arg Thr Val Phe Gly Thr Arg

805 810 815 805 810 815

Thr Ile Gly Gln Pro Tyr Gly Leu Pro Ala Arg Tyr Asn Pro Arg Gly Thr Ile Gly Gln Pro Tyr Gly Leu Pro Ala Arg Tyr Asn Pro Arg Gly

820 825 830 820 825 830

Thr Phe Glu Tyr Ala Trp Asp Gly Arg Leu Asp Asp Gly Ser Tyr Ala Thr Phe Glu Tyr Ala Trp Asp Gly Arg Leu Asp Asp Gly Ser Tyr Ala

835 840 845 835 840 845

Pro Ala Gly Arg Tyr Arg Phe Ala Val Lys Ala Leu Arg Ile Phe Gly Pro Ala Gly Arg Tyr Arg Phe Ala Val Lys Ala Leu Arg Ile Phe Gly

850 855 860 850 855 860

Asp Ala Lys Arg Ala Arg Glu Tyr Asp Ala Ala Glu Thr Val Glu Phe Asp Ala Lys Arg Ala Arg Glu Tyr Asp Ala Ala Glu Thr Val Glu Phe

865 870 875 880 865 870 875 880

Asn Ile Glu Tyr Leu Pro Gly Pro Ser Ala Lys Phe Arg Arg Arg Leu Asn Ile Glu Tyr Leu Pro Gly Pro Ser Ala Lys Phe Arg Arg Arg Leu

885 890 895 885 890 895

Phe Phe

<210> 7<210> 7

<211> 566<211> 566

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 7<400> 7

Met Lys Pro Ser Ser Ala Ile Leu Leu Ala Leu Ala Pro Gly Ser Ser Met Lys Pro Ser Ser Ala Ile Leu Leu Ala Leu Ala Pro Gly Ser Ser

1 5 10 15 1 5 10 15

Ser Lys Asn Val Val Glu Phe Ser Val Ser Arg Gly Leu Pro Gly Asn Ser Lys Asn Val Val Glu Phe Ser Val Ser Arg Gly Leu Pro Gly Asn

20 25 30 20 25 30

Arg Thr Pro Leu Ser Phe Pro Pro Leu Thr Arg Arg Glu Thr Tyr Ser Arg Thr Pro Leu Ser Phe Pro Pro Leu Thr Arg Arg Glu Thr Tyr Ser

35 40 45 35 40 45

Glu Arg Leu Ile Asn Asn Ile Ala Gly Gly Gly Tyr Tyr Val Gln Val Glu Arg Leu Ile Asn Asn Ile Ala Gly Gly Gly Tyr Tyr Val Gln Val

50 55 60 50 55 60

Gln Val Gly Thr Pro Pro Gln Asn Leu Thr Met Leu Leu Asp Thr Gly Gln Val Gly Thr Pro Pro Gln Asn Leu Thr Met Leu Leu Asp Thr Gly

65 70 75 80 65 70 75 80

Ser Ser Asp Ala Trp Val Leu Ser His Glu Ala Asp Leu Cys Ile Ser Ser Ser Asp Ala Trp Val Leu Ser His Glu Ala Asp Leu Cys Ile Ser

85 90 95 85 90 95

Pro Ala Leu Gln Asp Phe Tyr Gly Met Pro Cys Thr Asp Thr Tyr Asp Pro Ala Leu Gln Asp Phe Tyr Gly Met Pro Cys Thr Asp Thr Tyr Asp

100 105 110 100 105 110

Pro Ser Lys Ser Ser Ser Lys Lys Met Val Glu Glu Gly Gly Phe Lys Pro Ser Lys Ser Ser Ser Lys Lys Met Val Glu Glu Gly Gly Phe Lys

115 120 125 115 120 125

Ile Thr Tyr Leu Asp Gly Gly Thr Ala Ser Gly Asp Tyr Ile Thr Asp Ile Thr Tyr Leu Asp Gly Gly Thr Ala Ser Gly Asp Tyr Ile Thr Asp

130 135 140 130 135 140

His Phe Thr Ile Gly Gly Val Thr Val Gln Ser Leu Gln Met Ala Cys His Phe Thr Ile Gly Gly Val Thr Val Gln Ser Leu Gln Met Ala Cys

145 150 155 160 145 150 155 160

Val Thr Lys Ala Val Arg Gly Thr Gly Ile Leu Gly Leu Gly Phe Ser Val Thr Lys Ala Val Arg Gly Thr Gly Ile Leu Gly Leu Gly Phe Ser

165 170 175 165 170 175

Ile Ser Glu Arg Ala Ser Thr Lys Tyr Pro Asn Ile Ile Asp Glu Met Ile Ser Glu Arg Ala Ser Thr Lys Tyr Pro Asn Ile Ile Asp Glu Met

180 185 190 180 185 190

Tyr Ser Gln Gly Leu Ile Lys Ser Lys Ala Phe Ser Leu Tyr Leu Asn Tyr Ser Gln Gly Leu Ile Lys Ser Lys Ala Phe Ser Leu Tyr Leu Asn

195 200 205 195 200 205

Asp Arg Arg Ala Asp Ser Gly Thr Leu Leu Phe Gly Gly Ile Asp Thr Asp Arg Arg Ala Asp Ser Gly Thr Leu Leu Phe Gly Gly Ile Asp Thr

210 215 220 210 215 220

Asp Lys Phe Ile Gly Pro Leu Gly Val Leu Pro Leu His Lys Pro Pro Asp Lys Phe Ile Gly Pro Leu Gly Val Leu Pro Leu His Lys Pro Pro

225 230 235 240 225 230 235 240

Gly Asp Arg Asp Tyr Ser Ser Phe Glu Val Asn Phe Thr Ser Val Ser Gly Asp Arg Asp Tyr Ser Ser Phe Glu Val Asn Phe Thr Ser Val Ser

245 250 255 245 250 255

Leu Thr Tyr Thr Asn Gly Ser Arg His Thr Ile Pro Thr Ala Ile Leu Leu Thr Tyr Thr Asn Gly Ser Arg His Thr Ile Pro Thr Ala Ile Leu

260 265 270 260 265 270

Asn His Pro Ala Pro Ala Val Leu Asp Ser Gly Thr Thr Leu Ser Tyr Asn His Pro Ala Pro Ala Val Leu Asp Ser Gly Thr Thr Leu Ser Tyr

275 280 285 275 280 285

Leu Pro Asp Glu Leu Ala Asp Pro Ile Asn Thr Ala Leu Asp Thr Phe Leu Pro Asp Glu Leu Ala Asp Pro Ile Asn Thr Ala Leu Asp Thr Phe

290 295 300 290 295 300

Tyr Asp Asp Arg Leu Gln Met Thr Leu Ile Asp Cys Ser His Pro Leu Tyr Asp Asp Arg Leu Gln Met Thr Leu Ile Asp Cys Ser His Pro Leu

305 310 315 320 305 310 315 320

Leu Arg Thr Asp Pro Asp Phe His Leu Ala Phe Thr Phe Thr Pro Thr Leu Arg Thr Asp Pro Asp Phe His Leu Ala Phe Thr Phe Thr Pro Thr

325 330 335 325 330 335

Thr Ser Ile Thr Val Pro Leu Gly Asp Leu Val Leu Asp Ile Leu Pro Thr Ser Ile Thr Val Pro Leu Gly Asp Leu Val Leu Asp Ile Leu Pro

340 345 350 340 345 350

Pro Thr Tyr Pro Gln Ser Asn Ser Asn Asn Asn Asn Glu Val Glu Asp Pro Thr Tyr Pro Gln Ser Asn Ser Asn Asn Asn Asn Glu Val Glu Asp

355 360 365 355 360 365

Asp Asp Asp Asp Asp Asp Asp Asp Asp Asp Asp Asp Lys Val Pro Pro Asp Asp Asp Asp Asp Asp Asp Asp Asp Asp Asp Asp Lys Val Pro Pro

370 375 380 370 375 380

Ala Thr Glu Arg Arg Trp Cys Val Phe Gly Ile Gln Ser Thr Thr Arg Ala Thr Glu Arg Arg Trp Cys Val Phe Gly Ile Gln Ser Thr Thr Arg

385 390 395 400 385 390 395 400

Phe Ala Ala Ser Ser Gly Gln Ser Glu Ala Asn Phe Thr Leu Leu Gly Phe Ala Ala Ser Ser Gly Gln Ser Glu Ala Asn Phe Thr Leu Leu Gly

405 410 415 405 410 415

Asp Thr Phe Leu Arg Ser Ala Tyr Val Val Tyr Asp Leu Ser His Tyr Asp Thr Phe Leu Arg Ser Ala Tyr Val Val Tyr Asp Leu Ser His Tyr

420 425 430 420 425 430

Gln Ile Gly Leu Ala Gln Ala Asn Leu Asn Ser Ser Ser Ser Ser Thr Gln Ile Gly Leu Ala Gln Ala Asn Leu Asn Ser Ser Ser Ser Ser Thr

435 440 445 435 440 445

Asn Thr Asn Thr Ile Val Glu Leu Thr Ala Asp Asn His Asp Asp Gly Asn Thr Asn Thr Ile Val Glu Leu Thr Ala Asp Asn His Asp Asp Gly

450 455 460 450 455 460

Ala Ser Glu Arg Gly Glu Gly Ala Gly Ala Gly Ala Asp Ala Gly Thr Ala Ser Glu Arg Gly Glu Gly Ala Gly Ala Gly Ala Asp Ala Gly Thr

465 470 475 480 465 470 475 480

Arg Thr Val Ile Ala Gly Gly Leu Pro Ser Gly Leu Met Gly Val Glu Arg Thr Val Ile Ala Gly Gly Leu Pro Ser Gly Leu Met Gly Val Glu

485 490 495 485 490 495

Ala Gln Gln Thr Thr Phe Thr Pro Thr Ala Thr Ala Asn Gly His Pro Ala Gln Gln Thr Thr Phe Thr Pro Thr Ala Thr Ala Asn Gly His Pro

500 505 510 500 505 510

Gly Tyr Gly Gly Gly Pro Gly Gly Ser Thr Arg Pro Gly Ser Glu Arg Gly Tyr Gly Gly Gly Pro Gly Gly Ser Thr Arg Pro Gly Ser Glu Arg

515 520 525 515 520 525

Asn Ala Ala Ala Gly Gly Phe Thr Ala Val Arg Thr Gly Leu Leu Gly Asn Ala Ala Ala Gly Gly Phe Thr Ala Val Arg Thr Gly Leu Leu Gly

530 535 540 530 535 540

Glu Leu Val Gly Val Ala Ala Val Thr Ala Leu Phe Ile Leu Leu Gly Glu Leu Val Gly Val Ala Ala Val Thr Ala Leu Phe Ile Leu Leu Gly

545 550 555 560 545 550 555 560

Gly Ala Leu Ile Ala Val Gly Ala Leu Ile Ala Val

565 565

<210> 8<210> 8

<211> 874<211> 874

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 8<400> 8

Met Ala Gly Gly Val Asn Val Gln Ala Arg Glu Leu Leu Pro Thr Asn Met Ala Gly Gly Val Asn Val Gln Ala Arg Glu Leu Leu Pro Thr Asn

1 5 10 15 1 5 10 15

Val Ile Pro Arg His Tyr Asn Ile Thr Leu Glu Pro Asp Phe Lys Lys Val Ile Pro Arg His Tyr Asn Ile Thr Leu Glu Pro Asp Phe Lys Lys

20 25 30 20 25 30

Leu Thr Phe Asp Gly Thr Val Val Ile Asp Leu Asp Val Val Glu Asp Leu Thr Phe Asp Gly Thr Val Val Ile Asp Leu Asp Val Val Glu Asp

35 40 45 35 40 45

Ser Lys Ser Ile Ser Leu His Thr Leu Glu Leu Asp Ile His Asp Ala Ser Lys Ser Ile Ser Leu His Thr Leu Glu Leu Asp Ile His Asp Ala

50 55 60 50 55 60

Lys Ile Thr Ser Gly Gly Gln Thr Val Ser Ser Ser Pro Thr Val Ser Lys Ile Thr Ser Gly Gly Gln Thr Val Ser Ser Ser Pro Thr Val Ser

65 70 75 80 65 70 75 80

Tyr Asn Glu Asp Thr Gln Val Ser Thr Phe Glu Phe Gly Asn Ala Val Tyr Asn Glu Asp Thr Gln Val Ser Thr Phe Glu Phe Gly Asn Ala Val

85 90 95 85 90 95

Thr Lys Gly Ser Lys Ala Gln Leu Glu Ile Lys Phe Thr Gly Gln Leu Thr Lys Gly Ser Lys Ala Gln Leu Glu Ile Lys Phe Thr Gly Gln Leu

100 105 110 100 105 110

Asn Asp Lys Met Ala Gly Phe Tyr Arg Ser Thr Tyr Lys Asn Pro Asp Asn Asp Lys Met Ala Gly Phe Tyr Arg Ser Thr Tyr Lys Asn Pro Asp

115 120 125 115 120 125

Gly Ser Glu Gly Ile Met Ala Val Thr Gln Met Glu Pro Thr Asp Ala Gly Ser Glu Gly Ile Met Ala Val Thr Gln Met Glu Pro Thr Asp Ala

130 135 140 130 135 140

Arg Arg Ser Phe Pro Cys Phe Asp Glu Pro Ser Leu Lys Ala Glu Phe Arg Arg Ser Phe Pro Cys Phe Asp Glu Pro Ser Leu Lys Ala Glu Phe

145 150 155 160 145 150 155 160

Thr Val Thr Leu Val Ala Asp Lys Lys Leu Thr Cys Leu Ser Asn Met Thr Val Thr Leu Val Ala Asp Lys Lys Leu Thr Cys Leu Ser Asn Met

165 170 175 165 170 175

Asp Val Ala Tyr Glu Lys Glu Val Lys Ser Glu Gln Thr Gly Gly Ile Asp Val Ala Tyr Glu Lys Glu Val Lys Ser Glu Gln Thr Gly Gly Ile

180 185 190 180 185 190

Lys Lys Ala Val Thr Phe Asn Lys Ser Pro Leu Met Ser Thr Tyr Leu Lys Lys Ala Val Thr Phe Asn Lys Ser Pro Leu Met Ser Thr Tyr Leu

195 200 205 195 200 205

Val Ala Phe Val Val Gly Glu Leu Asn Tyr Ile Glu Thr Asn Glu Phe Val Ala Phe Val Val Gly Glu Leu Asn Tyr Ile Glu Thr Asn Glu Phe

210 215 220 210 215 220

Arg Val Pro Val Arg Val Tyr Ala Pro Pro Gly Gln Asp Ile Glu His Arg Val Pro Val Arg Val Tyr Ala Pro Pro Gly Gln Asp Ile Glu His

225 230 235 240 225 230 235 240

Gly Arg Phe Ser Leu Asn Leu Ala Ala Lys Thr Leu Ala Phe Tyr Glu Gly Arg Phe Ser Leu Asn Leu Ala Ala Lys Thr Leu Ala Phe Tyr Glu

245 250 255 245 250 255

Lys Val Phe Gly Ile Glu Phe Pro Leu Pro Lys Met Asp Gln Ile Ala Lys Val Phe Gly Ile Glu Phe Pro Leu Pro Lys Met Asp Gln Ile Ala

260 265 270 260 265 270

Ile Pro Asp Phe Ala Gln Gly Ala Met Glu Asn Trp Gly Leu Val Thr Ile Pro Asp Phe Ala Gln Gly Ala Met Glu Asn Trp Gly Leu Val Thr

275 280 285 275 280 285

Tyr Arg Val Val Asp Leu Leu Leu Asp Glu Lys Ala Ser Gly Ala Ala Tyr Arg Val Val Asp Leu Leu Leu Asp Glu Lys Ala Ser Gly Ala Ala

290 295 300 290 295 300

Thr Lys Glu Arg Val Ala Glu Val Val Gln His Glu Leu Ala His Gln Thr Lys Glu Arg Val Ala Glu Val Val Gln His Glu Leu Ala His Gln

305 310 315 320 305 310 315 320

Trp Phe Gly Asn Leu Val Thr Met Asp Trp Trp Asp Gly Leu Trp Leu Trp Phe Gly Asn Leu Val Thr Met Asp Trp Trp Asp Gly Leu Trp Leu

325 330 335 325 330 335

Asn Glu Gly Phe Ala Thr Trp Ala Ser Trp Tyr Ser Cys Asn Ile Phe Asn Glu Gly Phe Ala Thr Trp Ala Ser Trp Tyr Ser Cys Asn Ile Phe

340 345 350 340 345 350

Tyr Pro Glu Trp Lys Val Trp Glu Ser Tyr Val Val Asp Asn Leu Gln Tyr Pro Glu Trp Lys Val Trp Glu Ser Tyr Val Val Asp Asn Leu Gln

355 360 365 355 360 365

Arg Ala Leu Ser Leu Asp Ser Leu Arg Ser Ser His Pro Ile Glu Val Arg Ala Leu Ser Leu Asp Ser Leu Arg Ser Ser His Pro Ile Glu Val

370 375 380 370 375 380

Pro Val Lys Arg Ala Asp Glu Ile Asn Gln Ile Phe Asp Ala Ile Ser Pro Val Lys Arg Ala Asp Glu Ile Asn Gln Ile Phe Asp Ala Ile Ser

385 390 395 400 385 390 395 400

Tyr Ser Lys Gly Ser Cys Val Leu Arg Met Ile Ser Thr Tyr Leu Gly Tyr Ser Lys Gly Ser Cys Val Leu Arg Met Ile Ser Thr Tyr Leu Gly

405 410 415 405 410 415

Glu Glu Thr Phe Leu Glu Gly Val Arg Arg Tyr Leu Lys Lys His Ala Glu Glu Thr Phe Leu Glu Gly Val Arg Arg Tyr Leu Lys Lys His Ala

420 425 430 420 425 430

Tyr Gly Asn Thr Gln Thr Gly Asp Leu Trp Ala Ser Leu Ala Glu Ala Tyr Gly Asn Thr Gln Thr Gly Asp Leu Trp Ala Ser Leu Ala Glu Ala

435 440 445 435 440 445

Ser Gly Lys Lys Val Glu Glu Val Met Gln Val Trp Thr Lys Asn Ile Ser Gly Lys Lys Val Glu Glu Val Met Gln Val Trp Thr Lys Asn Ile

450 455 460 450 455 460

Gly Phe Pro Val Val Thr Val Thr Glu Lys Asp Asp Lys Thr Ile His Gly Phe Pro Val Val Thr Val Thr Glu Lys Asp Asp Lys Thr Ile His

465 470 475 480 465 470 475 480

Leu Lys Gln Asn Arg Phe Leu Arg Thr Gly Asp Thr Lys Pro Glu Glu Leu Lys Gln Asn Arg Phe Leu Arg Thr Gly Asp Thr Lys Pro Glu Glu

485 490 495 485 490 495

Asp Gln Val Ile Tyr Pro Val Phe Leu Gly Leu Arg Thr Lys Asp Gly Asp Gln Val Ile Tyr Pro Val Phe Leu Gly Leu Arg Thr Lys Asp Gly

500 505 510 500 505 510

Ile Asp Glu Ser Gln Thr Leu Thr Lys Arg Glu Asp Thr Phe Thr Val Ile Asp Glu Ser Gln Thr Leu Thr Lys Arg Glu Asp Thr Phe Thr Val

515 520 525 515 520 525

Pro Ser Thr Asp Phe Phe Lys Leu Asn Ala Asn His Thr Gly Leu Tyr Pro Ser Thr Asp Phe Phe Lys Leu Asn Ala Asn His Thr Gly Leu Tyr

530 535 540 530 535 540

Arg Thr Ala Tyr Ser Pro Glu Arg Leu Lys Lys Leu Gly Asp Ala Ala Arg Thr Ala Tyr Ser Pro Glu Arg Leu Lys Lys Leu Gly Asp Ala Ala

545 550 555 560 545 550 555 560

Lys Glu Gly Leu Leu Ser Val Glu Asp Arg Ala Gly Met Ile Ala Asp Lys Glu Gly Leu Leu Ser Val Glu Asp Arg Ala Gly Met Ile Ala Asp

565 570 575 565 570 575

Ala Gly Ala Leu Ala Thr Ser Gly Tyr Gln Arg Thr Ser Gly Val Leu Ala Gly Ala Leu Ala Thr Ser Gly Tyr Gln Arg Thr Ser Gly Val Leu

580 585 590 580 585 590

Ser Leu Leu Lys Gly Phe Asn Ser Glu Pro Glu Phe Val Val Trp Asn Ser Leu Leu Lys Gly Phe Asn Ser Glu Pro Glu Phe Val Val Trp Asn

595 600 605 595 600 605

Glu Ile Ile Ala Arg Val Ser Ser Val Gln Ser Ala Trp Ile Phe Glu Glu Ile Ile Ala Arg Val Ser Ser Val Gln Ser Ala Trp Ile Phe Glu

610 615 620 610 615 620

Asp Gln Ala Asp Arg Asp Ala Leu Asp Ala Phe Leu Arg Asp Leu Ala Asp Gln Ala Asp Arg Asp Ala Leu Asp Ala Phe Leu Arg Asp Leu Ala

625 630 635 640 625 630 635 640

Ser Pro Lys Ala His Glu Leu Gly Trp Gln Phe Ser Glu Lys Asp Gly Ser Pro Lys Ala His Glu Leu Gly Trp Gln Phe Ser Glu Lys Asp Gly

645 650 655 645 650 655

His Ile Leu Gln Gln Phe Lys Ala Met Met Phe Gly Thr Ala Gly Leu His Ile Leu Gln Gln Phe Lys Ala Met Met Phe Gly Thr Ala Gly Leu

660 665 670 660 665 670

Ser Gly Asp Glu Thr Ile Ile Lys Ala Ala Lys Asp Met Phe Lys Lys Ser Gly Asp Glu Thr Ile Ile Lys Ala Ala Lys Asp Met Phe Lys Lys

675 680 685 675 680 685

Phe Met Ala Gly Asp Arg Thr Ala Ile His Pro Asn Ile Arg Gly Ser Phe Met Ala Gly Asp Arg Thr Ala Ile His Pro Asn Ile Arg Gly Ser

690 695 700 690 695 700

Val Phe Ser Met Ala Leu Lys Tyr Gly Gly Thr Glu Glu Tyr Asp Ala Val Phe Ser Met Ala Leu Lys Tyr Gly Gly Thr Glu Glu Tyr Asp Ala

705 710 715 720 705 710 715 720

Val Ile Asn Phe Tyr Arg Thr Ser Thr Asn Ser Asp Glu Arg Asn Thr Val Ile Asn Phe Tyr Arg Thr Ser Thr Asn Ser Asp Glu Arg Asn Thr

725 730 735 725 730 735

Ala Leu Arg Cys Leu Gly Arg Ala Lys Ser Pro Glu Leu Ile Lys Arg Ala Leu Arg Cys Leu Gly Arg Ala Lys Ser Pro Glu Leu Ile Lys Arg

740 745 750 740 745 750

Thr Leu Asp Leu Leu Phe Ser Gly Glu Val Lys Asp Gln Asp Ile Tyr Thr Leu Asp Leu Leu Phe Ser Gly Glu Val Lys Asp Gln Asp Ile Tyr

755 760 765 755 760 765

Met Pro Ala Ser Gly Leu Arg Ser His Pro Glu Gly Ile Glu Ala Leu Met Pro Ala Ser Gly Leu Arg Ser His Pro Glu Gly Ile Glu Ala Leu

770 775 780 770 775 780

Phe Thr Trp Met Thr Glu Asn Trp Asn Glu Leu Ile Lys Lys Leu Pro Phe Thr Trp Met Thr Glu Asn Trp Asn Glu Leu Ile Lys Lys Leu Pro

785 790 795 800 785 790 795 800

Pro Ala Leu Ser Met Leu Gly Thr Met Val Thr Ile Phe Thr Ser Ser Pro Ala Leu Ser Met Leu Gly Thr Met Val Thr Ile Phe Thr Ser Ser

805 810 815 805 810 815

Phe Thr Lys Lys Glu Gln Leu Glu Arg Val Glu Lys Phe Phe Glu Gly Phe Thr Lys Lys Glu Gln Leu Glu Arg Val Glu Lys Phe Phe Glu Gly

820 825 830 820 825 830

Lys Asn Thr Asn Gly Phe Asp Gln Ser Leu Ala Gln Ser Leu Asp Ala Lys Asn Thr Asn Gly Phe Asp Gln Ser Leu Ala Gln Ser Leu Asp Ala

835 840 845 835 840 845

Ile Arg Ser Lys Ile Ser Trp Ile Glu Arg Asp Arg Ala Asp Val Thr Ile Arg Ser Lys Ile Ser Trp Ile Glu Arg Asp Arg Ala Asp Val Thr

850 855 860 850 855 860

Ala Trp Leu Lys Glu Asn Gly Tyr Arg Ser Ala Trp Leu Lys Glu Asn Gly Tyr Arg Ser

865 870 865 870

<210> 9<210> 9

<211> 454<211> 454

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 9<400> 9

Met Lys Phe Ala Ala Leu Ala Leu Ala Ala Ser Leu Val Ala Ala Ala Met Lys Phe Ala Ala Leu Ala Leu Ala Ala Ser Leu Val Ala Ala Ala

1 5 10 15 1 5 10 15

Pro Arg Val Val Lys Val Asp Pro Ser Asp Ile Lys Pro Arg Arg Leu Pro Arg Val Val Lys Val Asp Pro Ser Asp Ile Lys Pro Arg Arg Leu

20 25 30 20 25 30

Gly Gly Thr Lys Phe Lys Leu Gly Gln Ile His Asn Asp Leu Phe Arg Gly Gly Thr Lys Phe Lys Leu Gly Gln Ile His Asn Asp Leu Phe Arg

35 40 45 35 40 45

Gln His Gly Arg Gly Pro Arg Ala Leu Ala Lys Ala Tyr Glu Lys Tyr Gln His Gly Arg Gly Pro Arg Ala Leu Ala Lys Ala Tyr Glu Lys Tyr

50 55 60 50 55 60

Asn Ile Glu Leu Pro Pro Asn Leu Leu Glu Val Val Gln Arg Ile Leu Asn Ile Glu Leu Pro Pro Asn Leu Leu Glu Val Val Gln Arg Ile Leu

65 70 75 80 65 70 75 80

Lys Asp Leu Gly Ile Glu Pro His Ser Lys Lys Ile Pro Gly Ser Lys Lys Asp Leu Gly Ile Glu Pro His Ser Lys Lys Ile Pro Gly Ser Lys

85 90 95 85 90 95

Ser Ser Tyr Gly Asn Gly Ala Pro Tyr Thr Asn Glu Thr Asp Asp Ser Ser Ser Tyr Gly Asn Gly Ala Pro Tyr Thr Asn Glu Thr Asp Asp Ser

100 105 110 100 105 110

Gly Glu Val Ser Ala Ile Pro Gln Leu Phe Asp Val Glu Tyr Leu Ala Gly Glu Val Ser Ala Ile Pro Gln Leu Phe Asp Val Glu Tyr Leu Ala

115 120 125 115 120 125

Pro Val Gln Ile Gly Thr Pro Pro Gln Thr Leu Met Leu Asn Phe Asp Pro Val Gln Ile Gly Thr Pro Pro Gln Thr Leu Met Leu Asn Phe Asp

130 135 140 130 135 140

Thr Gly Ser Ser Asp Leu Trp Val Phe Ser Ser Glu Thr Pro Ser Arg Thr Gly Ser Ser Asp Leu Trp Val Phe Ser Ser Glu Thr Pro Ser Arg

145 150 155 160 145 150 155 160

Gln Gln Asn Gly Gln Lys Ile Tyr Lys Ile Glu Glu Ser Ser Thr Ala Gln Gln Asn Gly Gln Lys Ile Tyr Lys Ile Glu Glu Ser Ser Thr Ala

165 170 175 165 170 175

Arg Arg Leu Ser Asn His Thr Trp Ser Ile Gln Tyr Gly Asp Gly Ser Arg Arg Leu Ser Asn His Thr Trp Ser Ile Gln Tyr Gly Asp Gly Ser

180 185 190 180 185 190

Arg Ser Ala Gly Asn Val Tyr Leu Asp Thr Val Ser Val Gly Gly Val Arg Ser Ala Gly Asn Val Tyr Leu Asp Thr Val Ser Val Gly Gly Val

195 200 205 195 200 205

Asn Val Phe Asn Gln Ala Val Glu Ser Ala Thr Phe Val Ser Ser Ser Asn Val Phe Asn Gln Ala Val Glu Ser Ala Thr Phe Val Ser Ser Ser

210 215 220 210 215 220

Phe Val Thr Asp Ala Ala Ser Ser Gly Leu Leu Gly Leu Gly Phe Asp Phe Val Thr Asp Ala Ala Ser Ser Gly Leu Leu Gly Leu Gly Phe Asp

225 230 235 240 225 230 235 240

Ser Ile Asn Thr Val Lys Pro Thr Lys Gln Lys Thr Phe Ile Ser Asn Ser Ile Asn Thr Val Lys Pro Thr Lys Gln Lys Thr Phe Ile Ser Asn

245 250 255 245 250 255

Ala Leu Glu Ser Leu Glu Met Gly Leu Phe Thr Ala Asn Leu Lys Lys Ala Leu Glu Ser Leu Glu Met Gly Leu Phe Thr Ala Asn Leu Lys Lys

260 265 270 260 265 270

Ala Glu Pro Gly Asn Tyr Asn Phe Gly Phe Ile Asp Glu Thr Glu Phe Ala Glu Pro Gly Asn Tyr Asn Phe Gly Phe Ile Asp Glu Thr Glu Phe

275 280 285 275 280 285

Val Gly Pro Leu Ser Phe Ile Asp Val Asp Ser Thr Asp Gly Phe Trp Val Gly Pro Leu Ser Phe Ile Asp Val Asp Ser Thr Asp Gly Phe Trp

290 295 300 290 295 300

Gln Phe Asp Ala Thr Gly Tyr Ser Ile Gln Leu Pro Glu Pro Ser Gly Gln Phe Asp Ala Thr Gly Tyr Ser Ile Gln Leu Pro Glu Pro Ser Gly

305 310 315 320 305 310 315 320

Asn Ile Thr Gly Thr Pro Phe Arg Ala Val Ala His Thr Ala Ile Ala Asn Ile Thr Gly Thr Pro Phe Arg Ala Val Ala His Thr Ala Ile Ala

325 330 335 325 330 335

Asp Thr Gly Thr Thr Leu Leu Leu Leu Pro Pro Gly Ile Ala Gln Ala Asp Thr Gly Thr Thr Leu Leu Leu Leu Pro Pro Gly Ile Ala Gln Ala

340 345 350 340 345 350

Tyr Tyr Trp Gln Val Gln Gly Ala Arg Gln Ala Pro Glu Val Gly Gly Tyr Tyr Trp Gln Val Gln Gly Ala Arg Gln Ala Pro Glu Val Gly Gly

355 360 365 355 360 365

Trp Val Met Pro Cys Asn Ala Ser Met Pro Asp Leu Thr Leu His Ile Trp Val Met Pro Cys Asn Ala Ser Met Pro Asp Leu Thr Leu His Ile

370 375 380 370 375 380

Gly Thr Tyr Lys Ala Val Ile Pro Gly Glu Leu Ile Pro Tyr Ala Pro Gly Thr Tyr Lys Ala Val Ile Pro Gly Glu Leu Ile Pro Tyr Ala Pro

385 390 395 400 385 390 395 400

Val Asp Thr Asp Asp Met Asp Thr Ala Thr Val Cys Tyr Gly Gly Ile Val Asp Thr Asp Asp Met Asp Thr Ala Thr Val Cys Tyr Gly Gly Ile

405 410 415 405 410 415

Gln Ser Ala Ser Gly Met Pro Phe Ala Ile Tyr Gly Asp Ile Phe Phe Gln Ser Ala Ser Gly Met Pro Phe Ala Ile Tyr Gly Asp Ile Phe Phe

420 425 430 420 425 430

Lys Ala Gln Phe Thr Val Phe Asp Val Glu Asn Leu Lys Leu Gly Phe Lys Ala Gln Phe Thr Val Phe Asp Val Glu Asn Leu Lys Leu Gly Phe

435 440 445 435 440 445

Ala Pro Lys Pro Glu Leu Ala Pro Lys Pro Glu Leu

450 450

<210> 10<210> 10

<211> 428<211> 428

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 10<400> 10

Met Arg Val Ser Phe Gln Ser Leu Leu Leu Leu Gly Ala Leu Ser Ala Met Arg Val Ser Phe Gln Ser Leu Leu Leu Leu Gly Ala Leu Ser Ala

1 5 10 15 1 5 10 15

Gln Ala Ser Ala Tyr Ala Ser Leu Glu Tyr Gln Gln Gln Thr Phe Pro Gln Ala Ser Ala Tyr Ala Ser Leu Glu Tyr Gln Gln Gln Thr Phe Pro

20 25 30 20 25 30

Glu Asp Asn Ala Pro Pro Tyr Arg Val Pro Leu Leu Thr Leu His Arg Glu Asp Asn Ala Pro Pro Tyr Arg Val Pro Leu Leu Thr Leu His Arg

35 40 45 35 40 45

Ala Leu Val Asn Val Ser Ser Ile Ser Asp Ser Glu Gly Glu Val Gly Ala Leu Val Asn Val Ser Ser Ile Ser Asp Ser Glu Gly Glu Val Gly

50 55 60 50 55 60

Leu Leu Leu Lys Arg Leu Leu Lys Asp Leu Asn Tyr Thr Val Glu Leu Leu Leu Leu Lys Arg Leu Leu Lys Asp Leu Asn Tyr Thr Val Glu Leu

65 70 75 80 65 70 75 80

Gln Pro Val Pro Pro Ser Glu Ala Gly Gln Gly Pro Asp Asp Arg Pro Gln Pro Val Pro Pro Ser Glu Ala Gly Gln Gly Pro Asp Asp Arg Pro

85 90 95 85 90 95

Thr Arg Tyr Asn Val Leu Ala Trp Pro Gly Arg Asn Ala Ser Arg Ala Thr Arg Tyr Asn Val Leu Ala Trp Pro Gly Arg Asn Ala Ser Arg Ala

100 105 110 100 105 110

Leu Asp Lys Arg Thr Ile Ile Thr Ser His Ile Asp Val Val Pro Pro Leu Asp Lys Arg Thr Ile Ile Thr Ser His Ile Asp Val Val Pro Pro

115 120 125 115 120 125

Tyr Ile Pro Tyr Ala Ile Asp Asn Glu Thr Val Pro Pro Ser Glu Val Tyr Ile Pro Tyr Ala Ile Asp Asn Glu Thr Val Pro Pro Ser Glu Val

130 135 140 130 135 140

Val Asp Phe Ala Ala Leu Pro Pro Thr Thr Leu Ile Ser Gly Arg Gly Val Asp Phe Ala Ala Leu Pro Pro Thr Thr Leu Ile Ser Gly Arg Gly

145 150 155 160 145 150 155 160

Ser Val Asp Ala Lys Ala Ser Val Ala Ala Gln Ile Thr Ala Thr Asn Ser Val Asp Ala Lys Ala Ser Val Ala Ala Gln Ile Thr Ala Thr Asn

165 170 175 165 170 175

Ala Leu Leu Ser Glu Gly Ala Ile Ser Pro Asp Ser Val Val Leu Leu Ala Leu Leu Ser Glu Gly Ala Ile Ser Pro Asp Ser Val Val Leu Leu

180 185 190 180 185 190

Tyr Val Val Gly Glu Glu Asn Ser Gly Ser Gly Met Lys His Phe Ser Tyr Val Val Gly Glu Glu Asn Ser Gly Ser Gly Met Lys His Phe Ser

195 200 205 195 200 205

Asp Ser Leu Ser Asn Ser Ser Ala Tyr Pro Val Arg Pro Gln Phe Arg Asp Ser Leu Ser Asn Ser Ser Ala Tyr Pro Val Arg Pro Gln Phe Arg

210 215 220 210 215 220

Ala Ala Ile Phe Gly Glu Pro Thr Glu Asn Lys Leu Ala Cys Gly His Ala Ala Ile Phe Gly Glu Pro Thr Glu Asn Lys Leu Ala Cys Gly His

225 230 235 240 225 230 235 240

Lys Gly Val Thr Gly Gly Thr Val Ser Ala Val Gly Lys Ala Gly His Lys Gly Val Thr Gly Gly Thr Val Ser Ala Val Gly Lys Ala Gly His

245 250 255 245 250 255

Ser Gly Tyr Pro Trp Leu Gly Lys Ser Ala Ile His Val Leu Ile Arg Ser Gly Tyr Pro Trp Leu Gly Lys Ser Ala Ile His Val Leu Ile Arg

260 265 270 260 265 270

Ala Leu Asp Arg Leu Leu Glu Glu Asp Leu Gly Ser Ser Glu Arg Tyr Ala Leu Asp Arg Leu Leu Glu Glu Asp Leu Gly Ser Ser Glu Arg Tyr

275 280 285 275 280 285

Gly Asn Thr Thr Val Asn Val Gly Leu Ile Glu Gly Gly Val Ala Ala Gly Asn Thr Thr Val Asn Val Gly Leu Ile Glu Gly Gly Val Ala Ala

290 295 300 290 295 300

Asn Val Ile Ala Pro Ala Ala Ser Ala Arg Val Ser Ala Arg Val Ala Asn Val Ile Ala Pro Ala Ala Ser Ala Arg Val Ser Ala Arg Val Ala

305 310 315 320 305 310 315 320

Val Gly Asn Gln Thr Thr Gly Gly Gln Ile Val Ala Glu Arg Ile Lys Val Gly Asn Gln Thr Thr Gly Gly Gln Ile Val Ala Glu Arg Ile Lys

325 330 335 325 330 335

Lys Leu Ile Lys Asp Val Asp Ser Glu Ala Leu Gln Val Asn Ile Thr Lys Leu Ile Lys Asp Val Asp Ser Glu Ala Leu Gln Val Asn Ile Thr

340 345 350 340 345 350

Ser Gly Val Gly Pro Val Glu Cys Glu Cys Glu Val Asp Gly Phe Glu Ser Gly Val Gly Pro Val Glu Cys Glu Cys Glu Val Asp Gly Phe Glu

355 360 365 355 360 365

Thr Val Val Ala Asn Tyr Gly Thr Asp Ile Pro Asn Leu Lys Gly Asn Thr Val Val Ala Asn Tyr Gly Thr Asp Ile Pro Asn Leu Lys Gly Asn

370 375 380 370 375 380

His Val Lys Tyr Leu Tyr Gly Pro Gly Ser Ile Leu Val Ala His Gly His Val Lys Tyr Leu Tyr Gly Pro Gly Ser Ile Leu Val Ala His Gly

385 390 395 400 385 390 395 400

Asp Asn Glu Gly Leu Gln Ile Lys Asp Leu Glu Asp Ser Val Glu Gly Asp Asn Glu Gly Leu Gln Ile Lys Asp Leu Glu Asp Ser Val Glu Gly

405 410 415 405 410 415

Tyr Lys Arg Leu Ile Lys His Ala Val Gly Ser Ser Tyr Lys Arg Leu Ile Lys His Ala Val Gly Ser Ser

420 425 420 425

<210> 11<210> 11

<211> 444<211> 444

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 11<400> 11

Met Glu Ile Glu Ile Gly Thr Pro Pro Gln Lys Val Met Leu Ile Val Met Glu Ile Glu Ile Gly Thr Pro Pro Gln Lys Val Met Leu Ile Val

1 5 10 15 1 5 10 15

Asp Thr Gly Ser Pro Asn Thr Trp Val Asn Pro Gln Cys Glu Thr Ser Asp Thr Gly Ser Pro Asn Thr Trp Val Asn Pro Gln Cys Glu Thr Ser

20 25 30 20 25 30

Asn Thr Pro Ser Asp Cys Ala Lys Tyr Pro Gln Phe Asp Tyr Thr Glu Asn Thr Pro Ser Asp Cys Ala Lys Tyr Pro Gln Phe Asp Tyr Thr Glu

35 40 45 35 40 45

Ser Ser Ser Ile Asn Ile Thr Asp Tyr Val Asp Val Leu Arg Tyr Gly Ser Ser Ser Ile Asn Ile Thr Asp Tyr Val Asp Val Leu Arg Tyr Gly

50 55 60 50 55 60

Ser Gly Ser Ala Thr Val Gln Tyr Val Tyr Glu Thr Val Ser Ile Gly Ser Gly Ser Ala Thr Val Gln Tyr Val Tyr Glu Thr Val Ser Ile Gly

65 70 75 80 65 70 75 80

Ser Ala Thr Leu Lys Asp Gln Ile Ile Gly Ile Ala Leu Glu Ser Glu Ser Ala Thr Leu Lys Asp Gln Ile Ile Gly Ile Ala Leu Glu Ser Glu

85 90 95 85 90 95

Asp Ile Pro Leu Gly Ile Leu Gly Leu Ser Pro Pro Val Arg Gly Val Asp Ile Pro Leu Gly Ile Leu Gly Leu Ser Pro Pro Val Arg Gly Val

100 105 110 100 105 110

Asn Gln Tyr Pro Tyr Ile Leu Asp Thr Met Val Asp Gln Gly Leu Ile Asn Gln Tyr Pro Tyr Ile Leu Asp Thr Met Val Asp Gln Gly Leu Ile

115 120 125 115 120 125

Lys Ser Arg Ala Phe Ser Leu Asp Leu Arg Gly Val Asp Asn Pro Thr Lys Ser Arg Ala Phe Ser Leu Asp Leu Arg Gly Val Asp Asn Pro Thr

130 135 140 130 135 140

Gly Ala Val Ile Phe Gly Gly Ile Asp Thr Gly Lys Tyr Ile Gly Thr Gly Ala Val Ile Phe Gly Gly Ile Asp Thr Gly Lys Tyr Ile Gly Thr

145 150 155 160 145 150 155 160

Leu Ala Lys Leu Pro Ile Ile Ala Pro Ser Ser Ala Pro Gly Gly Ala Leu Ala Lys Leu Pro Ile Ile Ala Pro Ser Ser Ala Pro Gly Gly Ala

165 170 175 165 170 175

Asp Arg Tyr Tyr Ile Thr Met Thr Gly Val Gly Leu Thr Leu Pro Asp Asp Arg Tyr Tyr Ile Thr Met Thr Gly Val Gly Leu Thr Leu Pro Asp

180 185 190 180 185 190

Gly Thr Met Val Arg Ser Glu Glu Leu Asp Val Pro Val Phe Leu Asp Gly Thr Met Val Arg Ser Glu Glu Leu Asp Val Pro Val Phe Leu Asp

195 200 205 195 200 205

Ser Gly Ser Thr Leu Ser Arg Leu Pro Thr Val Ile His Gln Ala Leu Ser Gly Ser Thr Leu Ser Arg Leu Pro Thr Val Ile His Gln Ala Leu

210 215 220 210 215 220

Ala Ala Ser Phe Thr Glu Ala Met Leu Asp Gln Glu Ser Gly Leu Phe Ala Ala Ser Phe Thr Glu Ala Met Leu Asp Gln Glu Ser Gly Leu Phe

225 230 235 240 225 230 235 240

Ile Leu Pro Cys Glu Tyr Thr Asp Met Ala Gly Ser Ile Asp Phe Tyr Ile Leu Pro Cys Glu Tyr Thr Asp Met Ala Gly Ser Ile Asp Phe Tyr

245 250 255 245 250 255

Phe Ala Gly Lys Thr Ile Arg Val Pro Leu Arg Glu Phe Ile Trp Arg Phe Ala Gly Lys Thr Ile Arg Val Pro Leu Arg Glu Phe Ile Trp Arg

260 265 270 260 265 270

Ser Gly Asp Tyr Cys Ile Leu Gly Val Ala Pro Glu Asp Asp Glu Pro Ser Gly Asp Tyr Cys Ile Leu Gly Val Ala Pro Glu Asp Asp Glu Pro

275 280 285 275 280 285

Ile Leu Gly Asp Thr Phe Leu Arg Ala Ala Tyr Val Val Tyr Asp Gln Ile Leu Gly Asp Thr Phe Leu Arg Ala Ala Tyr Val Val Tyr Asp Gln

290 295 300 290 295 300

Asp Asn Arg Asn Val His Leu Ala Gln Ala Ala Asp Cys Gly Thr Asn Asp Asn Arg Asn Val His Leu Ala Gln Ala Ala Asp Cys Gly Thr Asn

305 310 315 320 305 310 315 320

Leu Val Ala Ile Gly Ser Gly Glu Asp Ala Val Pro Ser Ser Thr Gly Leu Val Ala Ile Gly Ser Gly Glu Asp Ala Val Pro Ser Ser Thr Gly

325 330 335 325 330 335

Arg Cys Thr Glu Leu Pro Thr Pro Thr Gly Asp Pro Thr Arg Thr Arg Arg Cys Thr Glu Leu Pro Thr Pro Thr Gly Asp Pro Thr Arg Thr Arg

340 345 350 340 345 350

Ala Gly Ser Ser Asn Leu Asp Met Thr Ala Thr Arg Pro Pro Ala Asn Ala Gly Ser Ser Asn Leu Asp Met Thr Ala Thr Arg Pro Pro Ala Asn

355 360 365 355 360 365

Thr Phe Thr Gly Arg Leu Pro Thr Gly Ile Ala Gly Gly Pro Gly Pro Thr Phe Thr Gly Arg Leu Pro Thr Gly Ile Ala Gly Gly Pro Gly Pro

370 375 380 370 375 380

Ala Arg Asp Gly Ser Thr Thr Thr Val Thr Gly Gly Gly Leu Gln Pro Ala Arg Asp Gly Ser Thr Thr Thr Val Thr Gly Gly Gly Leu Gln Pro

385 390 395 400 385 390 395 400

Met Leu Pro Thr Gly Ser Pro Lys Gly Ser Glu Gly Thr Glu Gln Asn Met Leu Pro Thr Gly Ser Pro Lys Gly Ser Glu Gly Thr Glu Gln Asn

405 410 415 405 410 415

Ala Ala Gly Arg Gly Val Asp Ser Gly Leu Gly Ala Ala Val Ala Ala Ala Ala Gly Arg Gly Val Asp Ser Gly Leu Gly Ala Ala Val Ala Ala

420 425 430 420 425 430

Val Leu Gly Val Val Ser Leu Leu Val Leu Met Leu Val Leu Gly Val Val Ser Leu Leu Val Leu Met Leu

435 440 435 440

<210> 12<210> 12

<211> 621<211> 621

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 12<400> 12

Met Leu Arg Asn Ile Phe Leu Thr Ala Ala Leu Ala Ala Phe Gly Gln Met Leu Arg Asn Ile Phe Leu Thr Ala Ala Leu Ala Ala Phe Gly Gln

1 5 10 15 1 5 10 15

Cys Gly Ser Thr Val Phe Glu Ser Val Pro Ala Lys Pro Arg Gly Trp Cys Gly Ser Thr Val Phe Glu Ser Val Pro Ala Lys Pro Arg Gly Trp

20 25 30 20 25 30

Thr Arg Leu Gly Asp Ala Ser Ala Asp Gln Pro Leu Arg Leu Arg Ile Thr Arg Leu Gly Asp Ala Ser Ala Asp Gln Pro Leu Arg Leu Arg Ile

35 40 45 35 40 45

Ala Leu Gln Gln Pro Asn Glu Asp Leu Phe Glu Arg Thr Leu Tyr Glu Ala Leu Gln Gln Pro Asn Glu Asp Leu Phe Glu Arg Thr Leu Tyr Glu

50 55 60 50 55 60

Val Ser Asp Pro Ser His Ala Arg Tyr Gly Gln His Leu Ser Arg Asp Val Ser Asp Pro Ser His Ala Arg Tyr Gly Gln His Leu Ser Arg Asp

65 70 75 80 65 70 75 80

Glu Leu Ser Ala Leu Leu Ala Pro Arg Ala Glu Ser Thr Ala Ala Val Glu Leu Ser Ala Leu Leu Ala Pro Arg Ala Glu Ser Thr Ala Ala Val

85 90 95 85 90 95

Leu Asn Trp Leu Arg Asp Ala Gly Ile Pro Ser Asp Lys Ile Glu Glu Leu Asn Trp Leu Arg Asp Ala Gly Ile Pro Ser Asp Lys Ile Glu Glu

100 105 110 100 105 110

Asp Gly Glu Trp Ile Asn Leu Arg Val Thr Val Arg Glu Ala Ser Glu Asp Gly Glu Trp Ile Asn Leu Arg Val Thr Val Arg Glu Ala Ser Glu

115 120 125 115 120 125

Leu Leu Asp Ala Asp Phe Gly Val Trp Ala Tyr Glu Gly Thr Asn Val Leu Leu Asp Ala Asp Phe Gly Val Trp Ala Tyr Glu Gly Thr Asn Val

130 135 140 130 135 140

Lys Arg Val Arg Ala Leu Gln Tyr Ser Val Pro Glu Glu Ile Ala Pro Lys Arg Val Arg Ala Leu Gln Tyr Ser Val Pro Glu Glu Ile Ala Pro

145 150 155 160 145 150 155 160

His Ile Arg Met Val Ala Pro Val Val Arg Phe Gly Gln Ile Arg Pro His Ile Arg Met Val Ala Pro Val Val Arg Phe Gly Gln Ile Arg Pro

165 170 175 165 170 175

Glu Arg Ser Gln Val Phe Glu Val Val Glu Thr Ala Pro Ser Gln Val Glu Arg Ser Gln Val Phe Glu Val Val Glu Thr Ala Pro Ser Gln Val

180 185 190 180 185 190

Lys Val Ala Ala Ala Ile Pro Pro Gln Asp Leu Asp Val Lys Ala Cys Lys Val Ala Ala Ala Ile Pro Pro Gln Asp Leu Asp Val Lys Ala Cys

195 200 205 195 200 205

Asn Thr Ser Ile Thr Pro Glu Cys Leu Arg Ala Leu Tyr Lys Val Gly Asn Thr Ser Ile Thr Pro Glu Cys Leu Arg Ala Leu Tyr Lys Val Gly

210 215 220 210 215 220

Ser Tyr Gln Ala Glu Pro Ser Lys Lys Ser Leu Phe Gly Val Ala Gly Ser Tyr Gln Ala Glu Pro Ser Lys Lys Ser Leu Phe Gly Val Ala Gly

225 230 235 240 225 230 235 240

Tyr Leu Glu Gln Trp Ala Lys Tyr Asp Gln Leu Glu Leu Phe Ala Ser Tyr Leu Glu Gln Trp Ala Lys Tyr Asp Gln Leu Glu Leu Phe Ala Ser

245 250 255 245 250 255

Thr Tyr Ala Pro Tyr Ala Ala Asp Ala Asn Phe Thr Ser Val Gly Val Thr Tyr Ala Pro Tyr Ala Ala Asp Ala Asn Phe Thr Ser Val Gly Val

260 265 270 260 265 270

Asn Gly Gly Glu Asn Asn Gln Gly Pro Ser Asp Gln Gly Asp Ile Glu Asn Gly Gly Glu Asn Asn Gln Gly Pro Ser Asp Gln Gly Asp Ile Glu

275 280 285 275 280 285

Ala Asn Leu Asp Ile Gln Tyr Ala Val Ala Leu Ser Tyr Lys Thr Pro Ala Asn Leu Asp Ile Gln Tyr Ala Val Ala Leu Ser Tyr Lys Thr Pro

290 295 300 290 295 300

Ile Thr Tyr Tyr Ile Thr Gly Gly Arg Gly Pro Leu Val Pro Asp Leu Ile Thr Tyr Tyr Ile Thr Gly Gly Arg Gly Pro Leu Val Pro Asp Leu

305 310 315 320 305 310 315 320

Asp Gln Pro Asp Pro Asn Asp Val Ser Asn Glu Pro Tyr Leu Glu Phe Asp Gln Pro Asp Pro Asn Asp Val Ser Asn Glu Pro Tyr Leu Glu Phe

325 330 335 325 330 335

Phe Ser Tyr Leu Leu Lys Leu Pro Asp Ser Glu Leu Pro Gln Thr Leu Phe Ser Tyr Leu Leu Lys Leu Pro Asp Ser Glu Leu Pro Gln Thr Leu

340 345 350 340 345 350

Thr Thr Ser Tyr Gly Glu Asp Glu Gln Ser Val Pro Arg Pro Tyr Ala Thr Thr Ser Tyr Gly Glu Asp Glu Gln Ser Val Pro Arg Pro Tyr Ala

355 360 365 355 360 365

Glu Lys Val Cys Gln Met Ile Gly Gln Leu Gly Ala Arg Gly Val Ser Glu Lys Val Cys Gln Met Ile Gly Gln Leu Gly Ala Arg Gly Val Ser

370 375 380 370 375 380

Val Ile Phe Ser Ser Gly Asp Thr Gly Val Gly Ser Ala Cys Gln Thr Val Ile Phe Ser Ser Gly Asp Thr Gly Val Gly Ser Ala Cys Gln Thr

385 390 395 400 385 390 395 400

Asn Asp Gly Lys Asn Thr Thr Arg Phe Leu Pro Ile Phe Pro Gly Ala Asn Asp Gly Lys Asn Thr Thr Arg Phe Leu Pro Ile Phe Pro Gly Ala

405 410 415 405 410 415

Cys Pro Tyr Val Thr Ser Ile Gly Ala Thr Arg Tyr Val Glu Pro Glu Cys Pro Tyr Val Thr Ser Ile Gly Ala Thr Arg Tyr Val Glu Pro Glu

420 425 430 420 425 430

Gln Ala Ala Ala Phe Ser Ser Gly Gly Phe Ser Asp Ile Phe Lys Arg Gln Ala Ala Ala Phe Ser Ser Gly Gly Phe Ser Asp Ile Phe Lys Arg

435 440 445 435 440 445

Pro Ala Tyr Gln Glu Ala Ala Val Ser Thr Tyr Leu His Lys His Leu Pro Ala Tyr Gln Glu Ala Ala Val Ser Thr Tyr Leu His Lys His Leu

450 455 460 450 455 460

Gly Ser Arg Trp Lys Gly Leu Tyr Asn Pro Gln Gly Arg Gly Phe Pro Gly Ser Arg Trp Lys Gly Leu Tyr Asn Pro Gln Gly Arg Gly Phe Pro

465 470 475 480 465 470 475 480

Asp Val Ser Ala Gln Gly Val Ala Tyr His Val Phe Ser Gln Asp Lys Asp Val Ser Ala Gln Gly Val Ala Tyr His Val Phe Ser Gln Asp Lys

485 490 495 485 490 495

Asp Ile Lys Val Ser Gly Thr Ser Ala Ser Ala Pro Leu Phe Ala Ala Asp Ile Lys Val Ser Gly Thr Ser Ala Ser Ala Pro Leu Phe Ala Ala

500 505 510 500 505 510

Leu Val Ser Leu Leu Asn Asn Ala Arg Leu Ala Gln Gly Arg Pro Pro Leu Val Ser Leu Leu Asn Asn Ala Arg Leu Ala Gln Gly Arg Pro Pro

515 520 525 515 520 525

Leu Gly Phe Leu Asn Pro Trp Leu Tyr Ser Glu Lys Val Gln Lys Ala Leu Gly Phe Leu Asn Pro Trp Leu Tyr Ser Glu Lys Val Gln Lys Ala

530 535 540 530 535 540

Gly Ala Leu Thr Asp Ile Val His Gly Gly Ser Ser Gly Cys Thr Gly Gly Ala Leu Thr Asp Ile Val His Gly Gly Ser Ser Gly Cys Thr Gly

545 550 555 560 545 550 555 560

Lys Asp Met Tyr Ser Gly Leu Pro Thr Pro Tyr Val Pro Tyr Ala Ser Lys Asp Met Tyr Ser Gly Leu Pro Thr Pro Tyr Val Pro Tyr Ala Ser

565 570 575 565 570 575

Trp Asn Ala Thr Pro Gly Trp Asp Pro Val Thr Gly Leu Gly Thr Pro Trp Asn Ala Thr Pro Gly Trp Asp Pro Val Thr Gly Leu Gly Thr Pro

580 585 590 580 585 590

Val Phe Asp Lys Leu Leu Glu Leu Ser Ser Pro Gly Lys Lys Leu Pro Val Phe Asp Lys Leu Leu Glu Leu Ser Ser Pro Gly Lys Lys Leu Pro

595 600 605 595 600 605

His Ile Gly Gly Gly His Gly His Gly Ala Gly Gly His His Ile Gly Gly Gly His Gly His Gly Ala Gly Gly His

610 615 620 610 615 620

<210> 13<210> 13

<211> 420<211> 420

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 13<400> 13

Met Ala Gly Arg Leu Leu Leu Cys Leu Thr Ala Ala Leu Ser Ala Leu Met Ala Gly Arg Leu Leu Leu Cys Leu Thr Ala Ala Leu Ser Ala Leu

1 5 10 15 1 5 10 15

Gly Val Ser Ala Ala Pro Ala Pro Asp Ala Ser Gly Arg Pro Phe Ile Gly Val Ser Ala Ala Pro Ala Pro Asp Ala Ser Gly Arg Pro Phe Ile

20 25 30 20 25 30

Gly Val Pro Val Ser Asn Pro Gly Ile Ala Asn Ala Ile Pro Asn Arg Gly Val Pro Val Ser Asn Pro Gly Ile Ala Asn Ala Ile Pro Asn Arg

35 40 45 35 40 45

Tyr Ile Val Val Tyr Asn Asn Thr Phe Asn Asp Glu Asp Ile Asp Leu Tyr Ile Val Val Tyr Asn Asn Thr Phe Asn Asp Glu Asp Ile Asp Leu

50 55 60 50 55 60

His Gln Ser Asn Val Ile Lys Thr Ile Ala Lys Arg Asn Ile Ala Lys His Gln Ser Asn Val Ile Lys Thr Ile Ala Lys Arg Asn Ile Ala Lys

65 70 75 80 65 70 75 80

Arg Ser Leu Thr Gly Lys Leu Leu Ser Thr Thr Val Asn Thr Tyr Lys Arg Ser Leu Thr Gly Lys Leu Leu Ser Thr Thr Val Asn Thr Tyr Lys

85 90 95 85 90 95

Ile Asn Asn Trp Arg Ala Met Ala Leu Glu Ala Asp Asp Ala Thr Ile Ile Asn Asn Trp Arg Ala Met Ala Leu Glu Ala Asp Asp Ala Thr Ile

100 105 110 100 105 110

Asn Glu Ile Phe Ala Ala Lys Glu Val Ser Tyr Ile Glu Gln Asp Ala Asn Glu Ile Phe Ala Ala Lys Glu Val Ser Tyr Ile Glu Gln Asp Ala

115 120 125 115 120 125

Val Ile Ser Leu Asn Val Arg Gln Met Gln Ser Gln Ala Thr Thr Gly Val Ile Ser Leu Asn Val Arg Gln Met Gln Ser Gln Ala Thr Thr Gly

130 135 140 130 135 140

Leu Ala Arg Ile Ser His Ala Gln Pro Gly Ala Arg Thr Tyr Ile Phe Leu Ala Arg Ile Ser His Ala Gln Pro Gly Ala Arg Thr Tyr Ile Phe

145 150 155 160 145 150 155 160

Asp Ser Ser Ala Gly Glu Gly Ile Thr Ala Tyr Val Val Asp Thr Gly Asp Ser Ser Ala Gly Glu Gly Ile Thr Ala Tyr Val Val Asp Thr Gly

165 170 175 165 170 175

Ile Arg Val Thr His Glu Glu Phe Glu Gly Arg Ala Thr Phe Ala Ala Ile Arg Val Thr His Glu Glu Phe Glu Gly Arg Ala Thr Phe Ala Ala

180 185 190 180 185 190

Asn Phe Ile Asp Asp Val Asp Thr Asp Glu Gln Gly His Gly Ser His Asn Phe Ile Asp Asp Val Asp Thr Asp Glu Gln Gly His Gly Ser His

195 200 205 195 200 205

Val Ala Gly Thr Ile Gly Gly Lys Thr Phe Gly Val Ala Lys Lys Val Val Ala Gly Thr Ile Gly Gly Lys Thr Phe Gly Val Ala Lys Lys Val

210 215 220 210 215 220

Asn Leu Val Ala Val Lys Val Leu Gly Ala Asp Gly Ser Gly Ser Asn Asn Leu Val Ala Val Lys Val Leu Gly Ala Asp Gly Ser Gly Ser Asn

225 230 235 240 225 230 235 240

Ser Gly Val Ile Ala Gly Met Gln Phe Val Ala Ser Asn Ala Thr Ala Ser Gly Val Ile Ala Gly Met Gln Phe Val Ala Ser Asn Ala Thr Ala

245 250 255 245 250 255

Met Gly Leu Lys Gly Arg Ala Val Met Asn Met Ser Leu Gly Gly Pro Met Gly Leu Lys Gly Arg Ala Val Met Asn Met Ser Leu Gly Gly Pro

260 265 270 260 265 270

Ala Ser Arg Ala Val Asn Ser Ala Ile Asn Gln Val Glu Ala Ala Gly Ala Ser Arg Ala Val Asn Ser Ala Ile Asn Gln Val Glu Ala Ala Gly

275 280 285 275 280 285

Val Val Pro Val Val Ala Ala Gly Asn Glu Ser Gln Asp Thr Ala Asn Val Val Pro Val Val Ala Ala Gly Asn Glu Ser Gln Asp Thr Ala Asn

290 295 300 290 295 300

Thr Ser Pro Gly Ser Ala Glu Ala Ala Ile Thr Val Gly Ala Ile Asp Thr Ser Pro Gly Ser Ala Glu Ala Ala Ile Thr Val Gly Ala Ile Asp

305 310 315 320 305 310 315 320

Gln Thr Asn Asp Arg Met Ala Ser Phe Ser Asn Phe Gly Glu Leu Val Gln Thr Asn Asp Arg Met Ala Ser Phe Ser Asn Phe Gly Glu Leu Val

325 330 335 325 330 335

Asp Ile Phe Ala Pro Gly Val Asn Val Gln Ser Val Gly Ile Arg Ser Asp Ile Phe Ala Pro Gly Val Asn Val Gln Ser Val Gly Ile Arg Ser

340 345 350 340 345 350

Asp Thr Ser Thr Asn Thr Leu Ser Gly Thr Ser Met Ala Ser Pro His Asp Thr Ser Thr Asn Thr Leu Ser Gly Thr Ser Met Ala Ser Pro His

355 360 365 355 360 365

Val Ala Gly Leu Ala Ala Tyr Ile Met Ser Leu Glu Asn Ile Thr Gly Val Ala Gly Leu Ala Ala Tyr Ile Met Ser Leu Glu Asn Ile Thr Gly

370 375 380 370 375 380

Val Gln Ala Val Ser Asp Arg Leu Lys Glu Leu Ala Gln Ala Thr Gly Val Gln Ala Val Ser Asp Arg Leu Lys Glu Leu Ala Gln Ala Thr Gly

385 390 395 400 385 390 395 400

Ala Arg Ala Arg Gly Val Pro Arg Gly Thr Thr Thr Leu Ile Ala Asn Ala Arg Ala Arg Gly Val Pro Arg Gly Thr Thr Thr Leu Ile Ala Asn

405 410 415 405 410 415

Asn Gly Phe Ala Asn Gly Phe Ala

420 420

<210> 14<210> 14

<211> 892<211> 892

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 14<400> 14

Met Lys Ile Trp Ser Gly Ala Ala Leu Leu Gly Leu Ala Ala Leu Ala Met Lys Ile Trp Ser Gly Ala Ala Leu Leu Gly Leu Ala Ala Leu Ala

1 5 10 15 1 5 10 15

Thr Ala Ser His Ile Leu Pro Arg Asp Trp Glu Ala Asn Asp Tyr Tyr Thr Ala Ser His Ile Leu Pro Arg Asp Trp Glu Ala Asn Asp Tyr Tyr

20 25 30 20 25 30

Val Leu His Leu Asp Ala Asp Thr Ser Pro Gln Glu Val Ala Arg Ser Val Leu His Leu Asp Ala Asp Thr Ser Pro Gln Glu Val Ala Arg Ser

35 40 45 35 40 45

Leu Gly Leu Ser His Glu Gly Pro Leu Gly Glu Leu Arg Asp His His Leu Gly Leu Ser His Glu Gly Pro Leu Gly Glu Leu Arg Asp His His

50 55 60 50 55 60

Val Phe Val Ala Lys Arg Ala Glu His Asp Val Val Lys Arg Glu Leu Val Phe Val Ala Lys Arg Ala Glu His Asp Val Val Lys Arg Glu Leu

65 70 75 80 65 70 75 80

Ala Arg Arg Arg Lys Lys Arg Ser Leu Gly Leu Gly Gly Arg Asp Val Ala Arg Arg Arg Lys Lys Arg Ser Leu Gly Leu Gly Gly Arg Asp Val

85 90 95 85 90 95

Leu Asp Gly Val Leu Phe Ser Gln Lys Gln Arg Leu Arg Lys Pro Trp Leu Asp Gly Val Leu Phe Ser Gln Lys Gln Arg Leu Arg Lys Pro Trp

100 105 110 100 105 110

Glu Lys Arg Val Val Pro Arg Leu Phe Gly Pro Leu Pro Arg Arg Ser Glu Lys Arg Val Val Pro Arg Leu Phe Gly Pro Leu Pro Arg Arg Ser

115 120 125 115 120 125

Val Asp Glu Pro Val Glu Ser Leu Val Gln Arg Gln Thr Glu Val Ala Val Asp Glu Pro Val Glu Ser Leu Val Gln Arg Gln Thr Glu Val Ala

130 135 140 130 135 140

Arg Lys Leu Asp Ile Lys Asp Pro Ile Phe His Glu Gln Trp His Leu Arg Lys Leu Asp Ile Lys Asp Pro Ile Phe His Glu Gln Trp His Leu

145 150 155 160 145 150 155 160

Phe Asn Thr Val Gln Ala Gly His Asp Val Asn Val Thr Asp Val Trp Phe Asn Thr Val Gln Ala Gly His Asp Val Asn Val Thr Asp Val Trp

165 170 175 165 170 175

Leu Gln Gly Val Thr Gly Lys Asn Ala Thr Val Ala Ile Val Asp Asp Leu Gln Gly Val Thr Gly Lys Asn Ala Thr Val Ala Ile Val Asp Asp

180 185 190 180 185 190

Gly Leu Asp Met Tyr Ser Asp Asp Leu Arg Asp Asn Tyr Tyr Ala Leu Gly Leu Asp Met Tyr Ser Asp Asp Leu Arg Asp Asn Tyr Tyr Ala Leu

195 200 205 195 200 205

Gly Ser Tyr Asp Phe Asn Asp Lys Ala Asp Glu Pro Arg Pro Arg Leu Gly Ser Tyr Asp Phe Asn Asp Lys Ala Asp Glu Pro Arg Pro Arg Leu

210 215 220 210 215 220

Ala Asn Asp Asn His Gly Thr Arg Cys Ala Gly Glu Val Ala Ala Gly Ala Asn Asp Asn His Gly Thr Arg Cys Ala Gly Glu Val Ala Ala Gly

225 230 235 240 225 230 235 240

Arg Asn Asn Ala Cys Gly Val Gly Val Ala Tyr Asp Ser Asn Ile Ala Arg Asn Asn Ala Cys Gly Val Gly Val Ala Tyr Asp Ser Asn Ile Ala

245 250 255 245 250 255

Gly Leu Arg Ile Leu Ser Lys Leu Ile Ser Asp Ala Asp Glu Ala Val Gly Leu Arg Ile Leu Ser Lys Leu Ile Ser Asp Ala Asp Glu Ala Val

260 265 270 260 265 270

Ala Leu Asn Tyr Asp Phe Gln His Asn Gln Ile Tyr Ser Cys Ser Trp Ala Leu Asn Tyr Asp Phe Gln His Asn Gln Ile Tyr Ser Cys Ser Trp

275 280 285 275 280 285

Gly Pro Pro Asp Asp Gly Lys Ser Met Asp Ala Pro Gly Ile Leu Ile Gly Pro Pro Asp Asp Gly Lys Ser Met Asp Ala Pro Gly Ile Leu Ile

290 295 300 290 295 300

Arg Arg Ala Met Leu Asn Ala Val Gln Asn Gly Arg Gly Gly Leu Gly Arg Arg Ala Met Leu Asn Ala Val Gln Asn Gly Arg Gly Gly Leu Gly

305 310 315 320 305 310 315 320

Ser Ile Tyr Val Phe Ala Ser Gly Asn Gly Ala His Asn Glu Asp Asn Ser Ile Tyr Val Phe Ala Ser Gly Asn Gly Ala His Asn Glu Asp Asn

325 330 335 325 330 335

Cys Asn Phe Asp Gly Tyr Thr Asn Ser Ile Tyr Ser Ile Thr Val Gly Cys Asn Phe Asp Gly Tyr Thr Asn Ser Ile Tyr Ser Ile Thr Val Gly

340 345 350 340 345 350

Ala Leu Asp Arg Lys Gly Gln His Pro Tyr Tyr Ser Glu Ser Cys Ser Ala Leu Asp Arg Lys Gly Gln His Pro Tyr Tyr Ser Glu Ser Cys Ser

355 360 365 355 360 365

Ala Gly Leu Val Val Thr Tyr Ser Ser Gly Ser Gly Asp Ala Ile His Ala Gly Leu Val Val Thr Tyr Ser Ser Gly Ser Gly Asp Ala Ile His

370 375 380 370 375 380

Thr Thr Asp Val Gly Gln Asn Thr Cys Thr Ser Ser His Gly Gly Thr Thr Thr Asp Val Gly Gln Asn Thr Cys Thr Ser Ser His Gly Gly Thr

385 390 395 400 385 390 395 400

Ser Ala Ala Ala Pro Leu Ala Ala Gly Ile Phe Ala Leu Val Leu Gln Ser Ala Ala Ala Pro Leu Ala Ala Gly Ile Phe Ala Leu Val Leu Gln

405 410 415 405 410 415

Val Arg Pro Asp Leu Ser Trp Arg Asp Met Gln Tyr Leu Ala Met Asp Val Arg Pro Asp Leu Ser Trp Arg Asp Met Gln Tyr Leu Ala Met Asp

420 425 430 420 425 430

Thr Ala Val Pro Val Asn Val Asp Thr Gly Asp Tyr Gln Asp Thr Thr Thr Ala Val Pro Val Asn Val Asp Thr Gly Asp Tyr Gln Asp Thr Thr

435 440 445 435 440 445

Ile Gly Lys Lys Phe Ser His Thr Tyr Gly Tyr Gly Lys Leu Asp Ser Ile Gly Lys Lys Phe Ser His Thr Tyr Gly Tyr Gly Lys Leu Asp Ser

450 455 460 450 455 460

Tyr Ala Ile Val Glu Ala Ala Lys Lys Trp Lys Lys Val Lys Pro Gln Tyr Ala Ile Val Glu Ala Ala Lys Lys Trp Lys Lys Val Lys Pro Gln

465 470 475 480 465 470 475 480

Ala Trp Phe Tyr Ser Pro Trp Ile His Val Asn Gln Pro Ile Pro Gln Ala Trp Phe Tyr Ser Pro Trp Ile His Val Asn Gln Pro Ile Pro Gln

485 490 495 485 490 495

Gly Asp Lys Gly Val Val Val Glu Phe Glu Val Thr Lys Glu Met Leu Gly Asp Lys Gly Val Val Val Glu Phe Glu Val Thr Lys Glu Met Leu

500 505 510 500 505 510

Glu Glu Ala Asn Leu Asp Arg Leu Glu His Val Thr Val Thr Met Asn Glu Glu Ala Asn Leu Asp Arg Leu Glu His Val Thr Val Thr Met Asn

515 520 525 515 520 525

Val Glu His Gly Arg Arg Gly Asp Leu Ser Val Asp Leu Ile Ser Pro Val Glu His Gly Arg Arg Gly Asp Leu Ser Val Asp Leu Ile Ser Pro

530 535 540 530 535 540

Asn Lys Ile Val Ser His Leu Ser Val Thr Arg Lys Asn Asp Asp Ser Asn Lys Ile Val Ser His Leu Ser Val Thr Arg Lys Asn Asp Asp Ser

545 550 555 560 545 550 555 560

Asp Lys Gly Tyr Asn Asp Trp Thr Phe Met Ser Val Ala His Trp Gly Asp Lys Gly Tyr Asn Asp Trp Thr Phe Met Ser Val Ala His Trp Gly

565 570 575 565 570 575

Glu Ser Gly Val Gly Thr Trp Thr Ile Val Val Lys Asp Thr Glu Ile Glu Ser Gly Val Gly Thr Trp Thr Ile Val Val Lys Asp Thr Glu Ile

580 585 590 580 585 590

Asn Gln Tyr Thr Gly Lys Phe Ile Asp Trp His Leu Lys Leu Trp Gly Asn Gln Tyr Thr Gly Lys Phe Ile Asp Trp His Leu Lys Leu Trp Gly

595 600 605 595 600 605

Glu Thr Arg Asp Ala Ser Lys Ala Gln Leu Leu Pro Met Pro Thr Glu Glu Thr Arg Asp Ala Ser Lys Ala Gln Leu Leu Pro Met Pro Thr Glu

610 615 620 610 615 620

Glu Asp Asp Asp Asp His Asp Val Ile Ala Thr Thr Thr Ala Thr Ala Glu Asp Asp Asp Asp His Asp Val Ile Ala Thr Thr Thr Ala Thr Ala

625 630 635 640 625 630 635 640

Ala Thr Thr Thr Val Ser Lys Pro Glu Ala Thr Gly Ser Val Pro Ala Ala Thr Thr Thr Val Ser Lys Pro Glu Ala Thr Gly Ser Val Pro Ala

645 650 655 645 650 655

Asp Ala Thr Asp Gln Pro Asn Arg Pro Val Asn Ser Lys Pro Thr Asp Asp Ala Thr Asp Gln Pro Asn Arg Pro Val Asn Ser Lys Pro Thr Asp

660 665 670 660 665 670

Thr Ser Pro Ala Glu Thr Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Thr Ser Pro Ala Glu Thr Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser

675 680 685 675 680 685

Ala Glu Thr Asp Lys Thr Asn Thr Trp Leu Pro Ser Phe Leu Pro Thr Ala Glu Thr Asp Lys Thr Asn Thr Trp Leu Pro Ser Phe Leu Pro Thr

690 695 700 690 695 700

Phe Gly Val Ser Ala Ala Thr Gln Ala Trp Ile Tyr Gly Ser Leu Val Phe Gly Val Ser Ala Ala Thr Gln Ala Trp Ile Tyr Gly Ser Leu Val

705 710 715 720 705 710 715 720

Leu Ile Val Leu Phe Cys Ala Gly Leu Gly Ile Tyr Leu Tyr Leu Ala Leu Ile Val Leu Phe Cys Ala Gly Leu Gly Ile Tyr Leu Tyr Leu Ala

725 730 735 725 730 735

Arg Arg Lys Arg Leu Arg Asn Lys Thr Arg Thr Asp Tyr Glu Phe Glu Arg Arg Lys Arg Leu Arg Asn Lys Thr Arg Thr Asp Tyr Glu Phe Glu

740 745 750 740 745 750

Leu Leu Asp Asp Asp Asp Asp Asp Asp Glu Glu Ala Ala Ala Leu Thr Leu Leu Asp Asp Asp Asp Asp Asp Asp Glu Glu Ala Ala Ala Leu Thr

755 760 765 755 760 765

Arg Gly Gly Gly Gly Gly Glu Lys Gly Val Val Gly Gly Gly Gly Gly Arg Gly Gly Gly Gly Gly Glu Lys Gly Val Val Gly Gly Gly Gly Gly

770 775 780 770 775 780

Gly Gly Gly Lys Arg Gly Arg Arg Thr Arg Gly Gly Glu Leu Tyr Asp Gly Gly Gly Lys Arg Gly Arg Arg Thr Arg Gly Gly Glu Leu Tyr Asp

785 790 795 800 785 790 795 800

Ala Phe Ala Gly Glu Ser Asp Glu Asp Ser Asp Asp Asn Asp Phe Ala Ala Phe Ala Gly Glu Ser Asp Glu Asp Ser Asp Asp Asn Asp Phe Ala

805 810 815 805 810 815

Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Tyr Arg Asp Arg Ser Asp Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Tyr Arg Asp Arg Ser Asp

820 825 830 820 825 830

Ser Arg Ser Arg Ser Arg Ser Asp Gly Ser Gly Ser Pro Ile Gly Ile Ser Arg Ser Arg Ser Arg Ser Asp Gly Ser Gly Ser Pro Ile Gly Ile

835 840 845 835 840 845

Ser Glu Lys Leu Pro Gly Arg Arg Asp Ser Leu Ser Gly Glu Glu Glu Ser Glu Lys Leu Pro Gly Arg Arg Asp Ser Leu Ser Gly Glu Glu Glu

850 855 860 850 855 860

His His Val Val Gly Asp Asp Asp Asp Asp Asp Glu Asp Gly Thr Gly His His Val Val Gly Asp Asp Asp Asp Asp Asp Glu Asp Gly Thr Gly

865 870 875 880 865 870 875 880

Asn Asp Gln Ala Arg Pro Leu Gln Gly Gly Ala Arg Asn Asp Gln Ala Arg Pro Leu Gln Gly Gly Ala Arg

885 890 885 890

<210> 15<210> 15

<211> 387<211> 387

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 15<400> 15

Met Gln Leu Leu Ser Leu Ala Ala Leu Leu Pro Leu Ala Leu Ala Ala Met Gln Leu Leu Ser Leu Ala Ala Leu Leu Pro Leu Ala Leu Ala Ala

1 5 10 15 1 5 10 15

Pro Val Ile Lys Pro Gln Gly Leu Gln Leu Ile Pro Gly Asp Tyr Ile Pro Val Ile Lys Pro Gln Gly Leu Gln Leu Ile Pro Gly Asp Tyr Ile

20 25 30 20 25 30

Val Lys Leu Lys Asp Gly Ala Ser Glu Ser Thr Leu Gln Asp Thr Ile Val Lys Leu Lys Asp Gly Ala Ser Glu Ser Thr Leu Gln Asp Thr Ile

35 40 45 35 40 45

Arg His Leu Gln Ala Gly Glu Ala Lys His Val Tyr Arg Ala Arg Arg Arg His Leu Gln Ala Gly Glu Ala Lys His Val Tyr Arg Ala Arg Arg

50 55 60 50 55 60

Phe Lys Gly Phe Ala Ala Lys Leu Ser Pro Gln Val Val Asp Thr Leu Phe Lys Gly Phe Ala Ala Lys Leu Ser Pro Gln Val Val Asp Thr Leu

65 70 75 80 65 70 75 80

Ser Lys Leu Pro Glu Val Glu Tyr Ile Glu Gln Asp Ala Val Val Thr Ser Lys Leu Pro Glu Val Glu Tyr Ile Glu Gln Asp Ala Val Val Thr

85 90 95 85 90 95

Ile Gln Ala Leu Val Thr Gln Glu Asp Val Pro Trp Gly Leu Ala Arg Ile Gln Ala Leu Val Thr Gln Glu Asp Val Pro Trp Gly Leu Ala Arg

100 105 110 100 105 110

Ile Ser His His Glu Leu Gly Pro Thr Ser Tyr Val Tyr Asp Asp Ser Ile Ser His His Glu Leu Gly Pro Thr Ser Tyr Val Tyr Asp Asp Ser

115 120 125 115 120 125

Ala Gly Glu Gly Thr Cys Ala Tyr Val Ile Asp Thr Gly Ile Tyr Val Ala Gly Glu Gly Thr Cys Ala Tyr Val Ile Asp Thr Gly Ile Tyr Val

130 135 140 130 135 140

Ala His Ser Gln Phe Glu Gly Arg Ala Thr Trp Leu Ala Asn Phe Ile Ala His Ser Gln Phe Glu Gly Arg Ala Thr Trp Leu Ala Asn Phe Ile

145 150 155 160 145 150 155 160

Asp Ser Ser Asp Ser Asp Gly Ala Gly His Gly Thr His Val Ser Gly Asp Ser Ser Asp Ser Asp Gly Ala Gly His Gly Thr His Val Ser Gly

165 170 175 165 170 175

Thr Ile Gly Gly Val Thr Tyr Gly Val Ala Lys Lys Thr Lys Leu Phe Thr Ile Gly Gly Val Thr Tyr Gly Val Ala Lys Lys Thr Lys Leu Phe

180 185 190 180 185 190

Ala Val Lys Val Leu Asn Ala Ser Gly Ser Gly Thr Val Ser Ser Val Ala Val Lys Val Leu Asn Ala Ser Gly Ser Gly Thr Val Ser Ser Val

195 200 205 195 200 205

Leu Ala Gly Leu Glu Phe Val Ala Ser Asp Ala Pro Ala Arg Val Ala Leu Ala Gly Leu Glu Phe Val Ala Ser Asp Ala Pro Ala Arg Val Ala

210 215 220 210 215 220

Ser Gly Glu Cys Ala Asn Gly Ala Val Ala Asn Leu Ser Leu Gly Gly Ser Gly Glu Cys Ala Asn Gly Ala Val Ala Asn Leu Ser Leu Gly Gly

225 230 235 240 225 230 235 240

Gly Arg Ser Thr Ala Ile Asn Ala Ala Ala Ala Ala Ala Val Asp Ala Gly Arg Ser Thr Ala Ile Asn Ala Ala Ala Ala Ala Ala Val Asp Ala

245 250 255 245 250 255

Gly Val Phe Val Ala Val Ala Ala Gly Asn Ser Asn Thr Asp Ala Gln Gly Val Phe Val Ala Val Ala Ala Gly Asn Ser Asn Thr Asp Ala Gln

260 265 270 260 265 270

Ser Thr Ser Pro Ala Ser Glu Pro Ser Val Cys Thr Val Gly Ala Thr Ser Thr Ser Pro Ala Ser Glu Pro Ser Val Cys Thr Val Gly Ala Thr

275 280 285 275 280 285

Asp Asp Ser Asp Ala Arg Ala Tyr Phe Ser Asn Tyr Gly Ser Val Val Asp Asp Ser Asp Ala Arg Ala Tyr Phe Ser Asn Tyr Gly Ser Val Val

290 295 300 290 295 300

Asp Val Phe Ala Pro Gly Val Asp Val Leu Ser Ser Trp Ile Gly Gly Asp Val Phe Ala Pro Gly Val Asp Val Leu Ser Ser Trp Ile Gly Gly

305 310 315 320 305 310 315 320

Val Asp Ala Thr Asn Thr Ile Ser Gly Thr Ser Met Ala Thr Pro His Val Asp Ala Thr Asn Thr Ile Ser Gly Thr Ser Met Ala Thr Pro His

325 330 335 325 330 335

Ile Ala Gly Leu Gly Ala Tyr Leu Leu Ala Leu Leu Gly Pro Arg Ser Ile Ala Gly Leu Gly Ala Tyr Leu Leu Ala Leu Leu Gly Pro Arg Ser

340 345 350 340 345 350

Pro Glu Glu Leu Cys Glu Tyr Ile Lys Gln Thr Ala Thr Ile Gly Thr Pro Glu Glu Leu Cys Glu Tyr Ile Lys Gln Thr Ala Thr Ile Gly Thr

355 360 365 355 360 365

Ile Thr Ser Leu Pro Ser Gly Thr Ile Asn Ala Ile Ala Tyr Asn Gly Ile Thr Ser Leu Pro Ser Gly Thr Ile Asn Ala Ile Ala Tyr Asn Gly

370 375 380 370 375 380

Ala Thr Ala Ala Thr Ala

385 385

<210> 16<210> 16

<211> 1468<211> 1468

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 16<400> 16

Met Val Ala Ser Ser Trp Phe Thr Ala Pro Leu Val Ala Val Ala Leu Met Val Ala Ser Ser Trp Phe Thr Ala Pro Leu Val Ala Val Ala Leu

1 5 10 15 1 5 10 15

Leu Leu Ser Leu Asp Gly Ala Val Ala Lys Lys Pro Thr Phe Arg Pro Leu Leu Ser Leu Asp Gly Ala Val Ala Lys Lys Pro Thr Phe Arg Pro

20 25 30 20 25 30

Pro Ser Leu Pro Thr Tyr Asp Asp Asp Ala Ala Cys Pro Glu Arg Cys Pro Ser Leu Pro Thr Tyr Asp Asp Asp Ala Ala Cys Pro Glu Arg Cys

35 40 45 35 40 45

Ser Val Ser Gly Pro Ser Thr Gly Asn Trp Ser Val Tyr Pro Asn Phe Ser Val Ser Gly Pro Ser Thr Gly Asn Trp Ser Val Tyr Pro Asn Phe

50 55 60 50 55 60

Glu Pro Ile Arg Lys Cys Thr Gln Thr Met Phe Tyr Asp Phe Ser Leu Glu Pro Ile Arg Lys Cys Thr Gln Thr Met Phe Tyr Asp Phe Ser Leu

65 70 75 80 65 70 75 80

Tyr Asp Ser Val Asp Asp Pro Thr Val Asn His Arg Ile His Ala Cys Tyr Asp Ser Val Asp Asp Pro Thr Val Asn His Arg Ile His Ala Cys

85 90 95 85 90 95

Ser Ser Phe Gly Pro Asp Phe Ser Ile Ile Pro Gly Ser Ile Thr Lys Ser Ser Phe Gly Pro Asp Phe Ser Ile Ile Pro Gly Ser Ile Thr Lys

100 105 110 100 105 110

Thr Ala Tyr Ala Ser Pro Ala Pro Ala Lys Ile Arg Phe Glu Leu Gly Thr Ala Tyr Ala Ser Pro Ala Pro Ala Lys Ile Arg Phe Glu Leu Gly

115 120 125 115 120 125

Trp Trp Asn Arg Gly Tyr Gly Leu Ala Ala Pro Gly Leu Arg Ser Leu Trp Trp Asn Arg Gly Tyr Gly Leu Ala Ala Pro Gly Leu Arg Ser Leu

130 135 140 130 135 140

Val Lys Gln Leu Arg Ala Tyr Ile Asp His Gly His Gly Asp Gly Ala Val Lys Gln Leu Arg Ala Tyr Ile Asp His Gly His Gly Asp Gly Ala

145 150 155 160 145 150 155 160

Ala Asp Arg Pro Phe Ile Ile Tyr Gly Gln Ser Gly Gln Ala Thr Ile Ala Asp Arg Pro Phe Ile Ile Tyr Gly Gln Ser Gly Gln Ala Thr Ile

165 170 175 165 170 175

Gly Leu Tyr Ile Gly Gln Gly Leu Leu Ser Gln Gly Leu Ser Lys Ser Gly Leu Tyr Ile Gly Gln Gly Leu Leu Ser Gln Gly Leu Ser Lys Ser

180 185 190 180 185 190

Ala Leu Lys Ile Leu Gln Asp Asn Leu Ala Asn Ser Asp Val Ser Ala Ala Leu Lys Ile Leu Gln Asp Asn Leu Ala Asn Ser Asp Val Ser Ala

195 200 205 195 200 205

Pro Ser Leu Ala Ile Gln Leu Cys Gly Gln Gly Tyr Gly Ser Ser His Pro Ser Leu Ala Ile Gln Leu Cys Gly Gln Gly Tyr Gly Ser Ser His

210 215 220 210 215 220

Ile Phe Gly Ala Met Val Thr Ser Asn Gly Thr Phe Ala Pro Ile Gln Ile Phe Gly Ala Met Val Thr Ser Asn Gly Thr Phe Ala Pro Ile Gln

225 230 235 240 225 230 235 240

Glu Ala Ile Arg Thr Trp Ala Asn Ala Thr Cys Leu Ser Phe Ala Gly Glu Ala Ile Arg Thr Trp Ala Asn Ala Thr Cys Leu Ser Phe Ala Gly

245 250 255 245 250 255

Ser Lys Glu Phe Pro Gly Glu Val Met Phe Thr Thr Pro Leu Leu Leu Ser Lys Glu Phe Pro Gly Glu Val Met Phe Thr Thr Pro Leu Leu Leu

260 265 270 260 265 270

Ala Asn Gly Thr Ala Asn Ser Thr Val Arg Ala Arg Ser Leu Arg Pro Ala Asn Gly Thr Ala Asn Ser Thr Val Arg Ala Arg Ser Leu Arg Pro

275 280 285 275 280 285

Tyr Ala Ala Glu Cys Arg Thr Val Gln Val Glu Ala Gly Asp Ser Cys Tyr Ala Ala Glu Cys Arg Thr Val Gln Val Glu Ala Gly Asp Ser Cys

290 295 300 290 295 300

Gly Thr Leu Ala Lys Lys Cys Gly Ile Ser Gly Ala Asp Phe Thr Asn Gly Thr Leu Ala Lys Lys Cys Gly Ile Ser Gly Ala Asp Phe Thr Asn

305 310 315 320 305 310 315 320

Tyr Asn Pro Gly Ala Ser Phe Cys Ser Thr Leu Lys Pro Lys Gln His Tyr Asn Pro Gly Ala Ser Phe Cys Ser Thr Leu Lys Pro Lys Gln His

325 330 335 325 330 335

Val Cys Cys Ser Ser Gly Thr Leu Pro Asp Phe Arg Pro Val Thr Asn Val Cys Cys Ser Ser Gly Thr Leu Pro Asp Phe Arg Pro Val Thr Asn

340 345 350 340 345 350

Pro Asp Gly Ser Cys Tyr Ser Tyr Lys Val Lys Ser Asn Asp Asn Cys Pro Asp Gly Ser Cys Tyr Ser Tyr Lys Val Lys Ser Asn Asp Asn Cys

355 360 365 355 360 365

Ala Asp Leu Ala Ala Glu Tyr Gly Leu Thr Val Asp Glu Ile Glu Ser Ala Asp Leu Ala Ala Glu Tyr Gly Leu Thr Val Asp Glu Ile Glu Ser

370 375 380 370 375 380

Phe Asn Lys Asn Thr Trp Gly Trp Gly Gly Cys Lys Val Leu Phe Leu Phe Asn Lys Asn Thr Trp Gly Trp Gly Gly Cys Lys Val Leu Phe Leu

385 390 395 400 385 390 395 400

Asp Thr Ile Met Cys Leu Ser Lys Gly Ala Pro Pro Phe Pro Ala Pro Asp Thr Ile Met Cys Leu Ser Lys Gly Ala Pro Pro Phe Pro Ala Pro

405 410 415 405 410 415

Ile Ser Asn Ala Ile Cys Gly Pro Gln Lys Leu Gly Thr Ile Pro Pro Ile Ser Asn Ala Ile Cys Gly Pro Gln Lys Leu Gly Thr Ile Pro Pro

420 425 430 420 425 430

Thr Asp Gly Ser Asn Ile Ala Asp Leu Asn Pro Cys Pro Ile Asn Ala Thr Asp Gly Ser Asn Ile Ala Asp Leu Asn Pro Cys Pro Ile Asn Ala

435 440 445 435 440 445

Cys Cys Asn Ile Trp Gly Gln Cys Gly Ile Ser Lys Asp Phe Cys Ile Cys Cys Asn Ile Trp Gly Gln Cys Gly Ile Ser Lys Asp Phe Cys Ile

450 455 460 450 455 460

Asp Thr Asn Thr Gly Pro Pro Gly Thr Ala Ala Pro Gly Thr Tyr Gly Asp Thr Asn Thr Gly Pro Pro Gly Thr Ala Ala Pro Gly Thr Tyr Gly

465 470 475 480 465 470 475 480

Cys Ile Ser Asn Cys Gly Leu Asp Ile Val Lys Gly Lys Gly Thr Gly Cys Ile Ser Asn Cys Gly Leu Asp Ile Val Lys Gly Lys Gly Thr Gly

485 490 495 485 490 495

Ser Ile Lys Ile Ala Tyr Phe Glu Gly Phe Gly Leu Glu Arg Glu Cys Ser Ile Lys Ile Ala Tyr Phe Glu Gly Phe Gly Leu Glu Arg Glu Cys

500 505 510 500 505 510

Leu Phe Arg Asp Ala Ser Gln Ile Asp Arg Ser Lys Tyr Thr His Val Leu Phe Arg Asp Ala Ser Gln Ile Asp Arg Ser Lys Tyr Thr His Val

515 520 525 515 520 525

His Phe Ala Phe Gly Thr Leu Thr Pro Thr Tyr Glu Val Asn Val Gly His Phe Ala Phe Gly Thr Leu Thr Pro Thr Tyr Glu Val Asn Val Gly

530 535 540 530 535 540

Asp Ile Leu Ser Ser Tyr Gln Phe Thr Gln Phe Lys Leu Ile Ser Gly Asp Ile Leu Ser Ser Tyr Gln Phe Thr Gln Phe Lys Leu Ile Ser Gly

545 550 555 560 545 550 555 560

Pro Lys Lys Ile Leu Ser Phe Gly Gly Trp Asp Phe Ser Thr Ser Lys Pro Lys Lys Ile Leu Ser Phe Gly Gly Trp Asp Phe Ser Thr Ser Lys

565 570 575 565 570 575

Ala Thr Tyr Ser Ile Phe Arg Asn Gly Val Lys Ala Glu Asn Arg Leu Ala Thr Tyr Ser Ile Phe Arg Asn Gly Val Lys Ala Glu Asn Arg Leu

580 585 590 580 585 590

Thr Met Ala Lys Ser Ile Ala Asn Phe Ile Lys Glu His Asp Leu Asp Thr Met Ala Lys Ser Ile Ala Asn Phe Ile Lys Glu His Asp Leu Asp

595 600 605 595 600 605

Gly Val Asp Ile Asp Trp Glu Tyr Pro Gly Ala Pro Asp Ile Pro Asp Gly Val Asp Ile Asp Trp Glu Tyr Pro Gly Ala Pro Asp Ile Pro Asp

610 615 620 610 615 620

Ile Pro Ala Gly Glu Glu Asp Glu Gly Thr Asn Tyr Leu Ala Phe Leu Ile Pro Ala Gly Glu Glu Asp Glu Gly Thr Asn Tyr Leu Ala Phe Leu

625 630 635 640 625 630 635 640

Val Val Leu Lys Asn Leu Leu Pro Gly Lys Ser Ile Ser Ile Ala Ala Val Val Leu Lys Asn Leu Leu Pro Gly Lys Ser Ile Ser Ile Ala Ala

645 650 655 645 650 655

Pro Ser Ser Tyr Trp Tyr Leu Lys Gln Phe Pro Ile Lys Ala Ile Ser Pro Ser Ser Tyr Trp Tyr Leu Lys Gln Phe Pro Ile Lys Ala Ile Ser

660 665 670 660 665 670

Arg Ile Val Asp Tyr Ile Val Phe Met Ser Tyr Asp Ile His Gly Gln Arg Ile Val Asp Tyr Ile Val Phe Met Ser Tyr Asp Ile His Gly Gln

675 680 685 675 680 685

Trp Asp Ala His Asn Met Trp Ser Gln Asp Gly Cys Val Thr Gly Asn Trp Asp Ala His Asn Met Trp Ser Gln Asp Gly Cys Val Thr Gly Asn

690 695 700 690 695 700

Cys Leu Arg Ser His Val Asn Leu Thr Glu Thr Arg Leu Ala Leu Val Cys Leu Arg Ser His Val Asn Leu Thr Glu Thr Arg Leu Ala Leu Val

705 710 715 720 705 710 715 720

Met Ile Thr Lys Ala Gly Val Pro Gly Glu Lys Val Ile Val Gly Val Met Ile Thr Lys Ala Gly Val Pro Gly Glu Lys Val Ile Val Gly Val

725 730 735 725 730 735

Thr Ser Tyr Gly Arg Ser Phe Asp Met Ala Gln Pro Gly Cys Trp Ser Thr Ser Tyr Gly Arg Ser Phe Asp Met Ala Gln Pro Gly Cys Trp Ser

740 745 750 740 745 750

Pro Asp Cys Gln Phe Thr Gly Asp Arg Leu Asn Ser Asn Ala Lys Pro Pro Asp Cys Gln Phe Thr Gly Asp Arg Leu Asn Ser Asn Ala Lys Pro

755 760 765 755 760 765

Gly Arg Cys Thr Gly Thr Ala Gly Tyr Ile Ser Asn Ala Glu Ile Asp Gly Arg Cys Thr Gly Thr Ala Gly Tyr Ile Ser Asn Ala Glu Ile Asp

770 775 780 770 775 780

Glu Ile Leu Ala Gly Gly Gly Ser Ser Gly Gly Ser Ser Gln Ala Arg Glu Ile Leu Ala Gly Gly Gly Ser Ser Gly Gly Ser Ser Gln Ala Arg

785 790 795 800 785 790 795 800

Ala Gly Arg Val Val Ala Ser Phe Val Asp Thr Ser Ser Asn Thr Asp Ala Gly Arg Val Val Ala Ser Phe Val Asp Thr Ser Ser Asn Thr Asp

805 810 815 805 810 815

Val Leu Val Tyr Asp Asn Asn Gln Trp Val Gly Tyr Met Ser Glu Lys Val Leu Val Tyr Asp Asn Asn Gln Trp Val Gly Tyr Met Ser Glu Lys

820 825 830 820 825 830

Thr Lys Lys Thr Arg Thr Thr Leu Tyr Thr Gly Trp Gly Leu Gly Gly Thr Lys Lys Thr Arg Thr Thr Leu Tyr Thr Gly Trp Gly Leu Gly Gly

835 840 845 835 840 845

Thr Thr Asp Trp Ala Ser Asp Leu Gln Gln Tyr His Asp Val Pro Gly Thr Thr Asp Trp Ala Ser Asp Leu Gln Gln Tyr His Asp Val Pro Gly

850 855 860 850 855 860

Pro Ala Lys Asp Trp Thr Glu Phe Lys Gln Leu Ile Arg Ala Gly Glu Pro Ala Lys Asp Trp Thr Glu Phe Lys Gln Leu Ile Arg Ala Gly Glu

865 870 875 880 865 870 875 880

Asp Pro Lys Ser Asp His Ser Arg Glu Gly Asp Trp Thr Lys Phe Asp Asp Pro Lys Ser Asp His Ser Arg Glu Gly Asp Trp Thr Lys Phe Asp

885 890 895 885 890 895

Cys Thr Asn Pro Tyr Leu Val Asp Lys Thr Phe Tyr Thr Pro Thr Gln Cys Thr Asn Pro Tyr Leu Val Asp Lys Thr Phe Tyr Thr Pro Thr Gln

900 905 910 900 905 910

Arg Trp Lys Asn Leu Asp Thr Asp Ala Ala Trp Arg Asp Val Val Arg Arg Trp Lys Asn Leu Asp Thr Asp Ala Ala Trp Arg Asp Val Val Arg

915 920 925 915 920 925

Ile Trp Lys Glu Thr Asp Lys Pro Arg Asn Ile Met Phe Thr Ala Ser Ile Trp Lys Glu Thr Asp Lys Pro Arg Asn Ile Met Phe Thr Ala Ser

930 935 940 930 935 940

Val Ser Thr Thr Leu Tyr Ile Ser Ala Asp Val Asp Cys Arg Asn Leu Val Ser Thr Thr Leu Tyr Ile Ser Ala Asp Val Asp Cys Arg Asn Leu

945 950 955 960 945 950 955 960

Glu Asp Cys Asn Thr Thr Glu Glu Cys Ser Ala Gly Leu Asn Gly Pro Glu Asp Cys Asn Thr Thr Glu Glu Cys Ser Ala Gly Leu Asn Gly Pro

965 970 975 965 970 975

Tyr Ser Gly Pro Ala Ala Gln Phe Ile Trp Asn Ser Met Val Lys Ile Tyr Ser Gly Pro Ala Ala Gln Phe Ile Trp Asn Ser Met Val Lys Ile

980 985 990 980 985 990

His Ala Met Tyr His Asn Tyr Val Leu Met Leu Glu Arg Ala Thr Ser His Ala Met Tyr His Asn Tyr Val Leu Met Leu Glu Arg Ala Thr Ser

995 1000 1005 995 1000 1005

Leu Val Ser Met Ala Leu Asp Asp Met Gln Lys Thr Phe Ala Pro Leu Val Ser Met Ala Leu Asp Asp Met Gln Lys Thr Phe Ala Pro

1010 1015 1020 1010 1015 1020

Val Pro Val Glu Glu Asp Lys Ala Trp Leu Tyr Leu Leu Ile Asp Val Pro Val Glu Glu Asp Lys Ala Trp Leu Tyr Leu Leu Ile Asp

1025 1030 1035 1025 1030 1035

Leu Ile Thr Leu Gly Thr Leu Thr Val Ala Gly Pro Leu Tyr Asn Leu Ile Thr Leu Gly Thr Leu Thr Val Ala Gly Pro Leu Tyr Asn

1040 1045 1050 1040 1045 1050

Arg Gln Leu Gly Met Tyr Val Tyr Phe Ser Asp Lys Ser Val Asp Arg Gln Leu Gly Met Tyr Val Tyr Phe Ser Asp Lys Ser Val Asp

1055 1060 1065 1055 1060 1065

Asp Ile Lys Asp Thr Thr Met Thr Leu Ile Gly Gln Ser Thr Thr Asp Ile Lys Asp Thr Thr Met Thr Leu Ile Gly Gln Ser Thr Thr

1070 1075 1080 1070 1075 1080

Ile Ala Lys Asp Val Leu Ser Thr Lys Gln Glu Ala Trp Thr Glu Ile Ala Lys Asp Val Leu Ser Thr Lys Gln Glu Ala Trp Thr Glu

1085 1090 1095 1085 1090 1095

Asn Leu Gln Ala Ser Phe Asn Asn Met Leu Ser Arg Val Ile Glu Asn Leu Gln Ala Ser Phe Asn Asn Met Leu Ser Arg Val Ile Glu

1100 1105 1110 1100 1105 1110

Gly Trp Gln Asn Ala Thr Ser Leu Ala Val Asn Lys Ile Phe Ser Gly Trp Gln Asn Ala Thr Ser Leu Ala Val Asn Lys Ile Phe Ser

1115 1120 1125 1115 1120 1125

Gly Ser Glu Thr Ser Leu Asn Ile Leu Trp Asp Val Met Ser Asp Gly Ser Glu Thr Ser Leu Asn Ile Leu Trp Asp Val Met Ser Asp

1130 1135 1140 1130 1135 1140

Gly Lys Leu Ile Glu Gly Met Pro Pro Pro Gly Ser Gly Pro Pro Gly Lys Leu Ile Glu Gly Met Pro Pro Pro Gly Ser Gly Pro Pro

1145 1150 1155 1145 1150 1155

Pro Asp Pro Gly Asn Ile His Asn Glu Leu Gln Ala Asn Val Lys Pro Asp Pro Gly Asn Ile His Asn Glu Leu Gln Ala Asn Val Lys

1160 1165 1170 1160 1165 1170

Lys Ser Ile Tyr Ala Phe Ala Ile Pro Asn Leu Trp Arg Val Ser Lys Ser Ile Tyr Ala Phe Ala Ile Pro Asn Leu Trp Arg Val Ser

1175 1180 1185 1175 1180 1185

Gln Thr Phe Ala Phe Ile Leu Asp Ser Gly Phe Gly Cys Asp Val Gln Thr Phe Ala Phe Ile Leu Asp Ser Gly Phe Gly Cys Asp Val

1190 1195 1200 1190 1195 1200

Glu Lys Pro Leu Gln Asp Tyr Leu Glu Asp Glu Thr Met Glu Ala Glu Lys Pro Leu Gln Asp Tyr Leu Glu Asp Glu Thr Met Glu Ala

1205 1210 1215 1205 1210 1215

Thr Gly Ala Cys Val Asp Gly Lys Arg Tyr Tyr Leu Val Ala Pro Thr Gly Ala Cys Val Asp Gly Lys Arg Tyr Tyr Leu Val Ala Pro

1220 1225 1230 1220 1225 1230

Ile Gly Glu Ser Arg Thr Cys Asp Trp Val Asn Gly Met Trp Asp Ile Gly Glu Ser Arg Thr Cys Asp Trp Val Asn Gly Met Trp Asp

1235 1240 1245 1235 1240 1245

Cys Thr Leu Ser Asn Lys Phe Ser Ala Pro Pro Gly Leu Asp Arg Cys Thr Leu Ser Asn Lys Phe Ser Ala Pro Pro Gly Leu Asp Arg

1250 1255 1260 1250 1255 1260

Leu Gly Ala Asp Phe Gly Tyr Leu Thr Lys Glu Asp Phe Ile Lys Leu Gly Ala Asp Phe Gly Tyr Leu Thr Lys Glu Asp Phe Ile Lys

1265 1270 1275 1265 1270 1275

Gly Ser Ile Arg Thr Trp Leu Lys Asn Gly Lys Arg Asn Ala Gly Gly Ser Ile Arg Thr Trp Leu Lys Asn Gly Lys Arg Asn Ala Gly

1280 1285 1290 1280 1285 1290

Gly Gly Met Pro Asp Val Thr Asp Ile Asp Thr Ile Asn Ser Leu Gly Gly Met Pro Asp Val Thr Asp Ile Asp Thr Ile Asn Ser Leu

1295 1300 1305 1295 1300 1305

Ile Asp Leu Asp Phe Thr Thr Pro Gly Phe Ile His Leu Pro Val Ile Asp Leu Asp Phe Thr Thr Pro Gly Phe Ile His Leu Pro Val

1310 1315 1320 1310 1315 1320

Cys Ser Pro Glu Arg Ala Tyr Gln Thr Trp Asp Thr Ser Ser Ser Cys Ser Pro Glu Arg Ala Tyr Gln Thr Trp Asp Thr Ser Ser Ser

1325 1330 1335 1325 1330 1335

Gly Tyr Gly Ala Asn Tyr Pro Cys Asp Pro Pro Pro Gly Ile Asn Gly Tyr Gly Ala Asn Tyr Pro Cys Asp Pro Pro Pro Gly Ile Asn

1340 1345 1350 1340 1345 1350

Asn Cys Gly Asp Ser Thr Phe Glu Asp Gln Thr Ser Ala Ala Ser Asn Cys Gly Asp Ser Thr Phe Glu Asp Gln Thr Ser Ala Ala Ser

1355 1360 1365 1355 1360 1365

Pro Lys Val Glu Asp Cys Leu Gln Ile Ile Lys Asn Ile Gln Asp Pro Lys Val Glu Asp Cys Leu Gln Ile Ile Lys Asn Ile Gln Asp

1370 1375 1380 1370 1375 1380

Asp Gly Lys Thr Glu Trp Thr Ile Gln Val Leu Gly Lys Asn Gln Asp Gly Lys Thr Glu Trp Thr Ile Gln Val Leu Gly Lys Asn Gln

1385 1390 1395 1385 1390 1395

Arg Glu Ile Ala Lys Phe Gly Glu Cys Arg Phe Gly Val Glu Ala Arg Glu Ile Ala Lys Phe Gly Glu Cys Arg Phe Gly Val Glu Ala

1400 1405 1410 1400 1405 1410

Thr Glu Gln Thr Gly Asn Ala Asp Phe Lys Val Gly Gly Gln Asp Thr Glu Gln Thr Gly Asn Ala Asp Phe Lys Val Gly Gly Gln Asp

1415 1420 1425 1415 1420 1425

Val Ile Asp Ile Ile Asn Asp Ala Val Glu Lys Phe Gly Gly Ser Val Ile Asp Ile Ile Asn Asp Ala Val Glu Lys Phe Gly Gly Ser

1430 1435 1440 1430 1435 1440

Gly Arg Val Gly Ala Lys Gly Asp Met Ser Cys Asn Gly Asn Ile Gly Arg Val Gly Ala Lys Gly Asp Met Ser Cys Asn Gly Asn Ile

1445 1450 1455 1445 1450 1455

Lys Gly Gln Ala Val Lys Trp Gly Ile Tyr Lys Gly Gln Ala Val Lys Trp Gly Ile Tyr

1460 1465 1460 1465

<210> 17<210> 17

<211> 561<211> 561

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 17<400> 17

Met Leu Arg Gly Thr Ile Ala Val Gly Val Ala Cys Leu Ala Gln Leu Met Leu Arg Gly Thr Ile Ala Val Gly Val Ala Cys Leu Ala Gln Leu

1 5 10 15 1 5 10 15

Val Ala Gly Leu Asp Gly Pro Leu Phe Arg Thr Ser Leu Thr Leu Arg Val Ala Gly Leu Asp Gly Pro Leu Phe Arg Thr Ser Leu Thr Leu Arg

20 25 30 20 25 30

Asp Phe Arg Glu Gln Leu Glu Arg Arg Gln Ala Arg Asp Gly Ala Ala Asp Phe Arg Glu Gln Leu Glu Arg Arg Gln Ala Arg Asp Gly Ala Ala

35 40 45 35 40 45

Leu Glu Ala Arg Ser Ser Asp Leu Gln Asp Leu Tyr Pro Ala His Thr Leu Glu Ala Arg Ser Ser Asp Leu Gln Asp Leu Tyr Pro Ala His Thr

50 55 60 50 55 60

Leu Gln Val Pro Val Asp His Phe His Asn Asp Ser Leu Tyr Glu Pro Leu Gln Val Pro Val Asp His Phe His Asn Asp Ser Leu Tyr Glu Pro

65 70 75 80 65 70 75 80

His Ser Ser Glu Thr Phe Pro Leu Arg Tyr Trp Phe Asp Ala Ser His His Ser Ser Glu Thr Phe Pro Leu Arg Tyr Trp Phe Asp Ala Ser His

85 90 95 85 90 95

Tyr Lys Lys Gly Gly Pro Ile Ile Val Leu Gln Ser Gly Glu Thr Asp Tyr Lys Lys Gly Gly Pro Ile Ile Val Leu Gln Ser Gly Glu Thr Asp

100 105 110 100 105 110

Gly Val Gly Arg Leu Pro Phe Leu Gln Lys Gly Ile Val Ala Gln Leu Gly Val Gly Arg Leu Pro Phe Leu Gln Lys Gly Ile Val Ala Gln Leu

115 120 125 115 120 125

Ala Arg Ala Thr Asn Gly Leu Gly Val Ile Leu Glu His Arg Tyr Tyr Ala Arg Ala Thr Asn Gly Leu Gly Val Ile Leu Glu His Arg Tyr Tyr

130 135 140 130 135 140

Gly Glu Ser Ile Pro Thr Pro Asp Phe Ser Thr Glu Lys Leu Arg Phe Gly Glu Ser Ile Pro Thr Pro Asp Phe Ser Thr Glu Lys Leu Arg Phe

145 150 155 160 145 150 155 160

Leu Thr Thr Asp Gln Ala Leu Ala Asp Met Ala Tyr Phe Ala Arg His Leu Thr Thr Asp Gln Ala Leu Ala Asp Met Ala Tyr Phe Ala Arg His

165 170 175 165 170 175

Val Val Phe Lys Gly Leu Glu His Leu Asp Leu Thr Ser Ala Lys Asn Val Val Phe Lys Gly Leu Glu His Leu Asp Leu Thr Ser Ala Lys Asn

180 185 190 180 185 190

Pro Tyr Ile Ala Tyr Gly Gly Ser Tyr Ala Gly Ala Phe Val Ala Phe Pro Tyr Ile Ala Tyr Gly Gly Ser Tyr Ala Gly Ala Phe Val Ala Phe

195 200 205 195 200 205

Leu Arg Lys Leu Tyr Pro Asp Val Tyr Trp Gly Ala Ile Ser Ser Ser Leu Arg Lys Leu Tyr Pro Asp Val Tyr Trp Gly Ala Ile Ser Ser Ser

210 215 220 210 215 220

Gly Val Pro Glu Ala Ile Tyr Asp Tyr Trp Gln Tyr Tyr Glu Ala Ala Gly Val Pro Glu Ala Ile Tyr Asp Tyr Trp Gln Tyr Tyr Glu Ala Ala

225 230 235 240 225 230 235 240

Arg Ile Tyr Ala Pro His Asp Cys Val Val Ala Thr Gln Lys Leu Thr Arg Ile Tyr Ala Pro His Asp Cys Val Val Ala Thr Gln Lys Leu Thr

245 250 255 245 250 255

His Ile Val Asp Asn Ile Leu Leu Asp Lys Ala Asp Thr Asp Tyr Val His Ile Val Asp Asn Ile Leu Leu Asp Lys Ala Asp Thr Asp Tyr Val

260 265 270 260 265 270

Arg Arg Leu Lys Thr Gly Phe Gly Leu Gly Gly Val Thr Arg Asn Asp Arg Arg Leu Lys Thr Gly Phe Gly Leu Gly Gly Val Thr Arg Asn Asp

275 280 285 275 280 285

Asp Phe Ala Asn Ala Ile Ser Trp Gly Ile Gly Gly Leu Gln Gly Leu Asp Phe Ala Asn Ala Ile Ser Trp Gly Ile Gly Gly Leu Gln Gly Leu

290 295 300 290 295 300

Asn Trp Asp Pro Ala Leu Asn Asp Thr Gly Phe Gly Glu Tyr Cys Asn Asn Trp Asp Pro Ala Leu Asn Asp Thr Gly Phe Gly Glu Tyr Cys Asn

305 310 315 320 305 310 315 320

Asn Leu Thr Ala Thr Lys Pro Leu Tyr Pro Thr Ser Pro Ala Leu Glu Asn Leu Thr Ala Thr Lys Pro Leu Tyr Pro Thr Ser Pro Ala Leu Glu

325 330 335 325 330 335

Gln Glu Ala Arg Glu Leu Val Lys Ala Gly Gly Tyr Gly Lys Glu Ala Gln Glu Ala Arg Glu Leu Val Lys Ala Gly Gly Tyr Gly Lys Glu Ala

340 345 350 340 345 350

Asp Thr Leu Thr Thr Gln Leu Leu Asn Tyr Met Gly Tyr Val Asn Ala Asp Thr Leu Thr Thr Gln Leu Leu Asn Tyr Met Gly Tyr Val Asn Ala

355 360 365 355 360 365

Thr Thr Val Gln Thr Cys His Lys Asp Ser Gln Asp Glu Cys Phe Thr Thr Thr Val Gln Thr Cys His Lys Asp Ser Gln Asp Glu Cys Phe Thr

370 375 380 370 375 380

Asn Tyr Asn Ser Thr Phe Tyr Gln Gln Asp Asp Lys Thr Gln Asp Trp Asn Tyr Asn Ser Thr Phe Tyr Gln Gln Asp Asp Lys Thr Gln Asp Trp

385 390 395 400 385 390 395 400

Arg Leu Trp Pro Tyr Gln Tyr Cys Phe Glu Trp Gly Tyr Leu Gln Thr Arg Leu Trp Pro Tyr Gln Tyr Cys Phe Glu Trp Gly Tyr Leu Gln Thr

405 410 415 405 410 415

Gly Ser Gly Val Pro Ala Asn Gln Leu Pro Leu Ile Ser Arg Leu Ile Gly Ser Gly Val Pro Ala Asn Gln Leu Pro Leu Ile Ser Arg Leu Ile

420 425 430 420 425 430

Asp Leu Asn Phe Thr Ser Val Val Cys Arg Glu Ala Phe Asn Ile Thr Asp Leu Asn Phe Thr Ser Val Val Cys Arg Glu Ala Phe Asn Ile Thr

435 440 445 435 440 445

Thr Pro Ser Gln Val Glu Arg Ile Asn Lys Leu Gly Gly Val Asn Ile Thr Pro Ser Gln Val Glu Arg Ile Asn Lys Leu Gly Gly Val Asn Ile

450 455 460 450 455 460

Ser Tyr Pro Arg Leu Ala Phe Val Asp Gly Glu Arg Asp Pro Trp Arg Ser Tyr Pro Arg Leu Ala Phe Val Asp Gly Glu Arg Asp Pro Trp Arg

465 470 475 480 465 470 475 480

Tyr Ala Ser Pro His Arg Ile Gly Leu Pro Glu Arg Lys Asn Thr Ile Tyr Ala Ser Pro His Arg Ile Gly Leu Pro Glu Arg Lys Asn Thr Ile

485 490 495 485 490 495

Ser Glu Pro Phe Ile Leu Ile Lys Asp Gly Val His His Trp Asp Glu Ser Glu Pro Phe Ile Leu Ile Lys Asp Gly Val His His Trp Asp Glu

500 505 510 500 505 510

Asn Gly Leu Phe Pro Asn Glu Thr Arg Pro Gly Leu Pro Pro Lys Pro Asn Gly Leu Phe Pro Asn Glu Thr Arg Pro Gly Leu Pro Pro Lys Pro

515 520 525 515 520 525

Val Ala Asp Ala Gln Arg Ala Glu Val Lys Phe Val Lys Ala Trp Leu Val Ala Asp Ala Gln Arg Ala Glu Val Lys Phe Val Lys Ala Trp Leu

530 535 540 530 535 540

Lys Glu Trp Lys Glu Lys Glu Lys Cys Arg Gly Arg Lys Phe Cys Trp Lys Glu Trp Lys Glu Lys Glu Lys Cys Arg Gly Arg Lys Phe Cys Trp

545 550 555 560 545 550 555 560

Pro Pro

<210> 18<210> 18

<211> 640<211> 640

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 18<400> 18

Met Thr Met Lys Gly Ser Thr Leu Leu Ala Leu Ala Leu Gly Phe Gly Met Thr Met Lys Gly Ser Thr Leu Leu Ala Leu Ala Leu Gly Phe Gly

1 5 10 15 1 5 10 15

Ala His Ala Gln Phe Pro Pro Lys Arg Glu Gly Ile Thr Val Ile Glu Ala His Ala Gln Phe Pro Pro Lys Arg Glu Gly Ile Thr Val Ile Glu

20 25 30 20 25 30

Ser Lys Phe Tyr Lys Asn Val Ser Ile Ser Phe Lys Glu Pro Gly Ile Ser Lys Phe Tyr Lys Asn Val Ser Ile Ser Phe Lys Glu Pro Gly Ile

35 40 45 35 40 45

Cys Glu Thr Thr Pro Gly Val Lys Ser Tyr Ser Gly Tyr Val His Leu Cys Glu Thr Thr Pro Gly Val Lys Ser Tyr Ser Gly Tyr Val His Leu

50 55 60 50 55 60

Pro Pro Asn Leu Ile Glu Gly Ala Asp Gln Asp Tyr Pro Ile Asn Thr Pro Pro Asn Leu Ile Glu Gly Ala Asp Gln Asp Tyr Pro Ile Asn Thr

65 70 75 80 65 70 75 80

Phe Phe Trp Phe Phe Glu Ala Arg Lys Asp Pro Ala Asn Ala Pro Leu Phe Phe Trp Phe Phe Glu Ala Arg Lys Asp Pro Ala Asn Ala Pro Leu

85 90 95 85 90 95

Ala Ile Trp Leu Asn Gly Gly Pro Gly Gly Ser Ser Met Met Gly Leu Ala Ile Trp Leu Asn Gly Gly Pro Gly Gly Ser Ser Met Met Gly Leu

100 105 110 100 105 110

Leu Glu Glu Asn Gly Pro Cys Phe Val Gly Pro Asp Ser Lys Thr Thr Leu Glu Glu Asn Gly Pro Cys Phe Val Gly Pro Asp Ser Lys Thr Thr

115 120 125 115 120 125

Tyr Leu Asn Arg Trp Ser Trp Asn Asn Glu Ala Asn Met Leu Tyr Ile Tyr Leu Asn Arg Trp Ser Trp Asn Asn Glu Ala Asn Met Leu Tyr Ile

130 135 140 130 135 140

Asp Gln Pro Val Gln Thr Gly Phe Ser Tyr Asp Val Leu Thr Asn Val Asp Gln Pro Val Gln Thr Gly Phe Ser Tyr Asp Val Leu Thr Asn Val

145 150 155 160 145 150 155 160

Thr Val Gln Leu Asp Val Asp Asp Pro Ser Glu Pro Ile Ile Thr Pro Thr Val Gln Leu Asp Val Asp Asp Pro Ser Glu Pro Ile Ile Thr Pro

165 170 175 165 170 175

Thr Asn Phe Thr Asp Gly His Ile Pro Arg Thr Asn Asn Thr Phe Arg Thr Asn Phe Thr Asp Gly His Ile Pro Arg Thr Asn Asn Thr Phe Arg

180 185 190 180 185 190

Ile Gly Thr Val Gly Ser Gln Lys Ala Ser Gln Val Thr Asn Ser Thr Ile Gly Thr Val Gly Ser Gln Lys Ala Ser Gln Val Thr Asn Ser Thr

195 200 205 195 200 205

Glu Leu Ser Ala His Ala Met Trp His Phe Leu Gln Thr Trp Leu Phe Glu Leu Ser Ala His Ala Met Trp His Phe Leu Gln Thr Trp Leu Phe

210 215 220 210 215 220

Glu Phe Pro His Tyr Arg Ser Asp Asp Gly Arg Ile Ser Leu Trp Ala Glu Phe Pro His Tyr Arg Ser Asp Asp Gly Arg Ile Ser Leu Trp Ala

225 230 235 240 225 230 235 240

Glu Ser Tyr Gly Gly Thr Tyr Gly Pro Ala Phe Phe Arg Phe Phe Gln Glu Ser Tyr Gly Gly Thr Tyr Gly Pro Ala Phe Phe Arg Phe Phe Gln

245 250 255 245 250 255

Gln Gln Asn Glu Arg Ile Ala Asp Gly Gln Leu Glu Gly Arg Tyr Leu Gln Gln Asn Glu Arg Ile Ala Asp Gly Gln Leu Glu Gly Arg Tyr Leu

260 265 270 260 265 270

His Leu Asp Thr Leu Gly Ile Ile Asn Gly Ala Val Asp Trp Pro Ile His Leu Asp Thr Leu Gly Ile Ile Asn Gly Ala Val Asp Trp Pro Ile

275 280 285 275 280 285

Leu Ala Glu Ser Leu Ile Asp Tyr Pro Tyr Asn Asn Ser Tyr Gly Ile Leu Ala Glu Ser Leu Ile Asp Tyr Pro Tyr Asn Asn Ser Tyr Gly Ile

290 295 300 290 295 300

Gln Phe Tyr Asn Asp Thr Phe His Ala Ala Leu Lys His Asn Trp Thr Gln Phe Tyr Asn Asp Thr Phe His Ala Ala Leu Lys His Asn Trp Thr

305 310 315 320 305 310 315 320

Arg Pro Ser Gly Trp Arg Glu Gln Met Gln Ala Cys Thr Glu Ser Leu Arg Pro Ser Gly Trp Arg Glu Gln Met Gln Ala Cys Thr Glu Ser Leu

325 330 335 325 330 335

Ala Ser Ser Ser Ser Ser Ser Ser Pro Pro Ala Ala Gly Cys Glu Ala Ala Ser Ser Ser Ser Ser Ser Pro Pro Ala Ala Gly Cys Glu Ala

340 345 350 340 345 350

Val Arg Ser Val Leu Asp Asp Val Leu Ala Ala Ala Phe Pro Arg Gln Val Arg Ser Val Leu Asp Asp Val Leu Ala Ala Ala Phe Pro Arg Gln

355 360 365 355 360 365

Ser Gly Arg Ala Pro Phe Asp Leu Ala His Pro Arg Ala Asp Pro Phe Ser Gly Arg Ala Pro Phe Asp Leu Ala His Pro Arg Ala Asp Pro Phe

370 375 380 370 375 380

Pro Pro Pro His Pro His Gly Phe Leu Ala Arg Ala Asp Val Gln Ala Pro Pro Pro His Pro His Gly Phe Leu Ala Arg Ala Asp Val Gln Ala

385 390 395 400 385 390 395 400

Ala Leu Gly Val Pro Val Asn His Thr Ala Val Ser Leu Pro Val Asn Ala Leu Gly Val Pro Val Asn His Thr Ala Val Ser Leu Pro Val Asn

405 410 415 405 410 415

Arg Ala Phe Asp Ala Thr Phe Asp Pro Leu Arg Gly Gly Gln Leu Asp Arg Ala Phe Asp Ala Thr Phe Asp Pro Leu Arg Gly Gly Gln Leu Asp

420 425 430 420 425 430

Ala Leu Ala Gly Leu Leu Asp Arg Arg Ala Gly Gly Gly Val Lys Val Ala Leu Ala Gly Leu Leu Asp Arg Arg Ala Gly Gly Gly Val Lys Val

435 440 445 435 440 445

His Leu Val Tyr Gly Asp Arg Asp Pro Ser Cys Asn Trp Ala Gly Gly His Leu Val Tyr Gly Asp Arg Asp Pro Ser Cys Asn Trp Ala Gly Gly

450 455 460 450 455 460

Glu Lys Val Ser Leu Ala Val Pro Trp Ser Arg Arg Asp Val Phe Ala Glu Lys Val Ser Leu Ala Val Pro Trp Ser Arg Arg Asp Val Phe Ala

465 470 475 480 465 470 475 480

Ala Ala Gly Tyr Ala Pro Leu Val Val Val Ser Gly Lys Gly Gly Gly Ala Ala Gly Tyr Ala Pro Leu Val Val Val Ser Gly Lys Gly Gly Gly

485 490 495 485 490 495

Asp Gly Gly Asn Thr Gly Gly Gly Asn Thr Gly Gly Gly Glu Glu Glu Asp Gly Gly Asn Thr Gly Gly Gly Asn Thr Gly Gly Gly Glu Glu Glu

500 505 510 500 505 510

Val Val Val Val Arg Gly Leu Thr Arg Gln Val Gly Arg Phe Ser Phe Val Val Val Val Arg Gly Leu Thr Arg Gln Val Gly Arg Phe Ser Phe

515 520 525 515 520 525

Thr Arg Val Phe Gln Ala Gly His Glu Val Pro Ser Tyr Gln Pro Gln Thr Arg Val Phe Gln Ala Gly His Glu Val Pro Ser Tyr Gln Pro Gln

530 535 540 530 535 540

Ala Gly Tyr Glu Ile Phe Arg Arg Ala Met Ala Gly Leu Asp Leu Pro Ala Gly Tyr Glu Ile Phe Arg Arg Ala Met Ala Gly Leu Asp Leu Pro

545 550 555 560 545 550 555 560

Thr Gly Arg Val Arg Ala Gly Asp Asp Phe Val Thr Ala Gly Leu Arg Thr Gly Arg Val Arg Ala Gly Asp Asp Phe Val Thr Ala Gly Leu Arg

565 570 575 565 570 575

Asp Ala Trp Ala Val Lys Asn Ala Ala Pro Asp Met Val Glu Pro Arg Asp Ala Trp Ala Val Lys Asn Ala Ala Pro Asp Met Val Glu Pro Arg

580 585 590 580 585 590

Cys Tyr Val Leu Lys Pro Glu Ser Cys Glu Pro Glu Val Trp Lys Thr Cys Tyr Val Leu Lys Pro Glu Ser Cys Glu Pro Glu Val Trp Lys Thr

595 600 605 595 600 605

Val Val Asp Gly Thr Ala Ile Val Lys Asp Trp Phe Val Val Gly Ser Val Val Asp Gly Thr Ala Ile Val Lys Asp Trp Phe Val Val Gly Ser

610 615 620 610 615 620

Thr Gly Gly Glu Gly Arg Gly Val Glu Gly Gly Ile Asp Gly Asp Glu Thr Gly Gly Glu Gly Arg Gly Val Glu Gly Gly Ile Asp Gly Asp Glu

625 630 635 640 625 630 635 640

<210> 19<210> 19

<211> 571<211> 571

<212> PRT<212> PRT

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 19<400> 19

Met Leu Trp Thr Thr Leu Leu Ser Ala Leu Leu Leu Thr Gly Thr Ala Met Leu Trp Thr Thr Leu Leu Ser Ala Leu Leu Leu Thr Gly Thr Ala

1 5 10 15 1 5 10 15

Glu Ala Ala Gly Arg Ser Ile Ala His Ala Gly Lys Arg His Val Glu Glu Ala Ala Gly Arg Ser Ile Ala His Ala Gly Lys Arg His Val Glu

20 25 30 20 25 30

His Ala Ala Lys Arg Ala Lys Pro Ile Met Pro Ala Gly Pro Tyr His His Ala Ala Lys Arg Ala Lys Pro Ile Met Pro Ala Gly Pro Tyr His

35 40 45 35 40 45

Pro Val Ile Glu Arg Glu Glu Lys Ala Pro Lys Phe Leu Thr Pro Lys Pro Val Ile Glu Arg Glu Glu Lys Ala Pro Lys Phe Leu Thr Pro Lys

50 55 60 50 55 60

Thr Glu Lys Phe Ala Val Asp Gly Lys Gly Ile Pro Asp Val Asp Phe Thr Glu Lys Phe Ala Val Asp Gly Lys Gly Ile Pro Asp Val Asp Phe

65 70 75 80 65 70 75 80

Asp Val Gly Glu Ser Tyr Ala Gly Leu Leu Pro Leu Ser Ser Asp Pro Asp Val Gly Glu Ser Tyr Ala Gly Leu Leu Pro Leu Ser Ser Asp Pro

85 90 95 85 90 95

Asn Asp Asp Lys Asn Leu Phe Phe Trp Phe Phe Pro Ser Thr Asn Pro Asn Asp Asp Lys Asn Leu Phe Phe Trp Phe Phe Pro Ser Thr Asn Pro

100 105 110 100 105 110

Ala Ala Glu Lys Glu Ile Leu Ile Trp Leu Asn Gly Gly Pro Gly Cys Ala Ala Glu Lys Glu Ile Leu Ile Trp Leu Asn Gly Gly Pro Gly Cys

115 120 125 115 120 125

Ser Ser Phe Glu Gly Leu Leu Gln Glu Asn Gly Pro Phe Leu Trp Gln Ser Ser Phe Glu Gly Leu Leu Gln Glu Asn Gly Pro Phe Leu Trp Gln

130 135 140 130 135 140

Tyr Gly Thr Tyr Lys Pro Val Gln Asn Pro Trp Ser Trp His Thr Leu Tyr Gly Thr Tyr Lys Pro Val Gln Asn Pro Trp Ser Trp His Thr Leu

145 150 155 160 145 150 155 160

Thr Asn Ile Val Tyr Val Glu Gln Pro Val Gly Thr Gly Phe Thr Thr Thr Asn Ile Val Tyr Val Glu Gln Pro Val Gly Thr Gly Phe Thr Thr

165 170 175 165 170 175

Gly Thr Pro Thr Ile Thr Asn Glu Glu Glu Leu Ala Ala Glu Phe Met Gly Thr Pro Thr Ile Thr Asn Glu Glu Glu Leu Ala Ala Glu Phe Met

180 185 190 180 185 190

Gly Phe Trp Lys Asn Phe Val Asp Thr Phe Gly Leu His Gly Tyr Lys Gly Phe Trp Lys Asn Phe Val Asp Thr Phe Gly Leu His Gly Tyr Lys

195 200 205 195 200 205

Val Tyr Ile Ala Gly Glu Ser Tyr Ala Gly Tyr Tyr Cys Pro Tyr Ile Val Tyr Ile Ala Gly Glu Ser Tyr Ala Gly Tyr Tyr Cys Pro Tyr Ile

210 215 220 210 215 220

Ala Ala Ala Phe Leu Asp Glu Glu Asp Lys Thr Tyr Tyr Asp Met Ser Ala Ala Ala Phe Leu Asp Glu Glu Asp Lys Thr Tyr Tyr Asp Met Ser

225 230 235 240 225 230 235 240

Gly Met Thr Ile Tyr Asn Pro Ser Leu Ala Pro Asp Glu Ile Gln Glu Gly Met Thr Ile Tyr Asn Pro Ser Leu Ala Pro Asp Glu Ile Gln Glu

245 250 255 245 250 255

Pro Ile Pro Val Val Ala Phe Thr Glu Tyr Trp Ser Gly Leu Phe Pro Pro Ile Pro Val Val Ala Phe Thr Glu Tyr Trp Ser Gly Leu Phe Pro

260 265 270 260 265 270

Phe Asn Asp Thr Phe Arg Ala Asp Ile Lys Arg Arg Glu Lys Glu Cys Phe Asn Asp Thr Phe Arg Ala Asp Ile Lys Arg Arg Glu Lys Glu Cys

275 280 285 275 280 285

Gly Tyr Ala Asp Phe Leu Ala Glu Tyr Leu Val Tyr Pro Pro Lys Gly Gly Tyr Ala Asp Phe Leu Ala Glu Tyr Leu Val Tyr Pro Pro Lys Gly

290 295 300 290 295 300

Pro Leu Pro Ser Arg Leu Pro Gly Thr His Arg Asp Gly Thr Thr Arg Pro Leu Pro Ser Arg Leu Pro Gly Thr His Arg Asp Gly Thr Thr Arg

305 310 315 320 305 310 315 320

Glu Glu Cys Trp Asn Ile Tyr Trp Asp Ile Phe Asp Ala Ile Ser Val Glu Glu Cys Trp Asn Ile Tyr Trp Asp Ile Phe Asp Ala Ile Ser Val

325 330 335 325 330 335

Leu Asn Pro Cys Phe Asp Ile Tyr Gln Val Ala Thr Thr Cys Pro Leu Leu Asn Pro Cys Phe Asp Ile Tyr Gln Val Ala Thr Thr Cys Pro Leu

340 345 350 340 345 350

Leu Trp Asp Val Leu Gly Phe Pro Gly Ser Met Pro Tyr Leu Pro Glu Leu Trp Asp Val Leu Gly Phe Pro Gly Ser Met Pro Tyr Leu Pro Glu

355 360 365 355 360 365

Gly Thr Lys Val Tyr Phe Asp Arg Glu Asp Val Lys Arg Ala Ile His Gly Thr Lys Val Tyr Phe Asp Arg Glu Asp Val Lys Arg Ala Ile His

370 375 380 370 375 380

Ala Pro Val Asn Ala Thr Trp Glu Glu Cys Ser Ser Arg Asp Val Phe Ala Pro Val Asn Ala Thr Trp Glu Glu Cys Ser Ser Arg Asp Val Phe

385 390 395 400 385 390 395 400

Val Asn Gly Thr Asp His Ser Val Pro Ser Thr Val Arg Ala Leu Pro Val Asn Gly Thr Asp His Ser Val Pro Ser Thr Val Arg Ala Leu Pro

405 410 415 405 410 415

Arg Val Ile Asp Gly Thr Lys Asn Val Ile Ile Gly His Ser Ala Leu Arg Val Ile Asp Gly Thr Lys Asn Val Ile Ile Gly His Ser Ala Leu

420 425 430 420 425 430

Asp Met Ile Leu Leu Ala Asn Gly Thr Leu Leu Ala Leu Gln Asn Met Asp Met Ile Leu Leu Ala Asn Gly Thr Leu Leu Ala Leu Gln Asn Met

435 440 445 435 440 445

Thr Trp Gly Gly Lys Arg Gly Phe Gln Ser Arg Pro Asp Gln Pro Phe Thr Trp Gly Gly Lys Arg Gly Phe Gln Ser Arg Pro Asp Gln Pro Phe

450 455 460 450 455 460

Tyr Val Pro Leu Asn Asn Ile Thr Thr Leu Ser Thr Leu Ala Ala Ala Tyr Val Pro Leu Asn Asn Ile Thr Thr Leu Ser Thr Leu Ala Ala Ala

465 470 475 480 465 470 475 480

Gly Val Phe Gly Ser Leu Val Ser Glu Arg Gly Leu Thr Tyr Val Gly Gly Val Phe Gly Ser Leu Val Ser Glu Arg Gly Leu Thr Tyr Val Gly

485 490 495 485 490 495

Val Asp Leu Ala Gly His Met Val Pro Gln Tyr Ala Pro Ser Ala Ala Val Asp Leu Ala Gly His Met Val Pro Gln Tyr Ala Pro Ser Ala Ala

500 505 510 500 505 510

Tyr Arg His Val Glu Tyr Met Leu Gly Arg Val Asp Cys Met Asn Cys Tyr Arg His Val Glu Tyr Met Leu Gly Arg Val Asp Cys Met Asn Cys

515 520 525 515 520 525

Thr Lys Pro Phe Thr Thr Asp Pro Phe Thr Pro Gln Ser Lys Gly Lys Thr Lys Pro Phe Thr Thr Asp Pro Phe Thr Pro Gln Ser Lys Gly Lys

530 535 540 530 535 540

Leu Gly Lys Gly Thr Ala Pro Gln Gly Trp Ser Asn Ala Ser Gly His Leu Gly Lys Gly Thr Ala Pro Gln Gly Trp Ser Asn Ala Ser Gly His

545 550 555 560 545 550 555 560

Gly Lys Gly Asn Gly Pro Arg Arg Ile Arg Ala Gly Lys Gly Asn Gly Pro Arg Arg Ile Arg Ala

565 570 565 570

<210> 20<210> 20

<211> 8017<211> 8017

<212> ДНК<212> DNA

<213> Thermothelomyces thermophilus<213> Thermothelomyces thermophilus

<400> 20<400> 20

agggtaggtg ggatgggcgg ggtgtagggt aggtcggtgt agggtaggtc ggctgggcgg 60agggtaggtg ggatgggcgg ggtgtagggt aggtcggtgt agggtaggtc ggctgggcgg 60

ggtgtagggt aggtcggttg ggcggggtgt agggtaggtc ggttgggatg ggtgtagggt 120ggtgtagggt aggtcggttg ggcggggtgt agggtaggtc ggttgggatg ggtgtagggt 120

aggtcggccg ggtgtagggt aggtcggctg ggcggggtgt agggtaggtc ggtgtagggt 180aggtcggccg ggtgtagggt aggtcggctg ggcggggtgt agggtaggtc ggtgtagggt 180

aggtgggatg gggcgctatg tgcggccgcg agctcgcgag cccattttta gcgaaggcca 240aggtgggatg gggcgctatg tgcggccgcg agctcgcgag cccattttta gcgaaggcca 240

tacaaacgag ttttgcggaa cccgggattc cacccccgaa gccgccggcg cgtgcgcccc 300tacaaacgag ttttgcggaa cccgggattc cacccccgaa gccgccggcg cgtgcgcccc 300

gctgcgcatc ggtcggtggg tatatgagaa gggggcgggc aagccggaag ccagaggcaa 360gctgcgcatc ggtcggtggg tatatgagaa gggggcgggc aagccggaag ccagaggcaa 360

ctgctactgt tagctgccgc tggcctccgc ggcccagggc gcggcacggc tgcgttgaag 420ctgctactgt tagctgccgc tggcctccgc ggcccagggc gcggcacggc tgcgttgaag 420

tctcccagtc tcccacccgt tggctgcgcg gatccgcccg tcttggtggt tgcgagctcg 480tctcccagtc tcccacccgt tggctgcgcg gatccgcccg tcttggtggt tgcgagctcg 480

cgagcccatt tttagcgaag gccatacaaa cgagttttgc ggggcccggg attccacccc 540cgagcccatt tttagcgaag gccatacaaa cgagttttgc ggggcccggg attccacccc 540

ggaacccgcc ggcgcgtgcg ccccgctgcg catcggtcgg tgggtatgtg agggaggaag 600ggaacccgcc ggcgcgtgcg ccccgctgcg catcggtcgg tgggtatgtg agggaggaag 600

aagaaaaaaa aaaaaagctc ctgcgggggg gctgtcgggc acgcctactt tcgggcgacc 660aagaaaaaaa aaaaaagctc ctgcgggggg gctgtcgggc acgcctactt tcgggcgacc 660

cggcacctct ccgcggcagc cttcgcaggc cgctgttggt cccatttcat acgtcgccgc 720cggcacctct ccgcggcagc cttcgcaggc cgctgttggt cccatttcat acgtcgccgc 720

cttcgcgtgg tgccctacgg tctgccgggg taccgacgat tgcggcgagc accgcctcag 780cttcgcgtgg tgccctacgg tctgccgggg taccgacgat tgcggcgagc accgcctcag 780

caccgctgct gccaccggcg cgacctcgcc cgggggtgcg cgcggcatct gggaagactc 840caccgctgct gccaccggcg cgacctcgcc cggggggtgcg cgcggcatct gggaagactc 840

tgcaggcgta agggaatacc ccatgtgcgc cgaggggtgg gctatgtggg tgcttggcgg 900tgcaggcgta agggaatacc ccatgtgcgc cgaggggtgg gctatgtggg tgcttggcgg 900

ttcgccagac ctttctaaag ccaccggggg tacctaccgg ttggggacgc ctacagggct 960ttcgccagac ctttctaaag ccaccggggg tacctaccgg ttggggacgc ctacagggct 960

gaacctcccg gtcgggcctc ctcttggggc gcttaggcgg cgacttcggg gcgcgatcgc 1020gaacctcccg gtcgggcctc ctcttggggc gcttaggcgg cgacttcggg gcgcgatcgc 1020

tccccgctct cgcccgccga cggcgctctg gggaattcag gaggggaaag cagatgtgac 1080tccccgctct cgcccgccga cggcgctctg gggaattcag gaggggaaag cagatgtgac 1080

ccgcggctcg accggcgcat tgccggacga gctgcgcggc cacgcgggcc cccgcgcccg 1140ccgcggctcg accggcgcat tgccggacga gctgcgcggc cacgcgggcc cccgcgcccg 1140

ccgacccagt aacttagtga actcttccgc cctgaaacac gggcggttgg ccctaaccgg 1200ccgacccagt aacttagtga actcttccgc cctgaaacac gggcggttgg ccctaaccgg 1200

ctcacgatag ttacctggtt gattctgcca gtagtcatat gcttgtctca aagattaagc 1260ctcacgatag ttacctggtt gattctgcca gtagtcatat gcttgtctca aagattaagc 1260

catgcatgtc taagtataag caattataca gcgaaactgc gaatggctca ttaaatcagt 1320catgcatgtc taagtataag caattataca gcgaaactgc gaatggctca ttaaatcagt 1320

tatcgtttat ttgatagtac cttactacat ggataaccgt ggtaattcta gagctaatac 1380tatcgtttat ttgatagtac cttactacat ggataaccgt ggtaattcta gagctaatac 1380

atgctaaaaa tcccgacttc ggaagggatg tatttattag attaaaaacc aatgccctcc 1440atgctaaaaa tcccgacttc ggaagggatg tatttattag attaaaaacc aatgccctcc 1440

ggggctctct ggtgattcat gataacttct cgaatcgcac ggccttgcgc cggcgatggt 1500ggggctctct ggtgattcat gataacttct cgaatcgcac ggccttgcgc cggcgatggt 1500

tcattcaaat ttctgcccta tcaactttcg acggctgggt cttggccagc cgtggtgaca 1560tcattcaaat ttctgcccta tcaactttcg acggctgggt cttggccagc cgtggtgaca 1560

acgggtaacg gagggttagg gctcgacccc ggagaaggag cctgagaaac ggctactaca 1620acgggtaacg gagggttagg gctcgacccc ggagaaggag cctgagaaac ggctactaca 1620

tccaaggaag gcagcaggcg cgcaaattac ccaatcccga cacggggagg tagtgacaat 1680tccaaggaag gcagcaggcg cgcaaattac ccaatcccga cacggggagg tagtgacaat 1680

aaatactgat acagggctct tttgggtctt gtaattggaa tgagtacaat ttaaatccct 1740aaatactgat acagggctct tttggggtctt gtaattggaa tgagtacaat ttaaatccct 1740

taacgaggaa caattggagg gcaagtctgg tgccagcagc cgcggtaatt ccagctccaa 1800taacgaggaa caattggagg gcaagtctgg tgccagcagc cgcggtaatt ccagctccaa 1800

tagcgtatat taaagttgtt gaggttaaaa agctcgtagt tgaaccttgg gcctagccgg 1860tagcgtatat taaagttgtt gaggttaaaa agctcgtagt tgaaccttgg gcctagccgg 1860

ccggtccgcc tcaccgcgtg cactggctcg gctgggtctt tccttctgga gaaccgcatg 1920ccggtccgcc tcaccgcgtg cactggctcg gctgggtctt tccttctgga gaaccgcatg 1920

cccttcactg ggtgtgccgg ggaaccagga cttttactct gaacaaatta gatcgcttaa 1980cccttcactg ggtgtgccgg ggaaccagga cttttactct gaacaaatta gatcgcttaa 1980

agaaggccta tgctcgaata cattagcatg gaataataga ataggacgtg tggttctatt 2040agaaggccta tgctcgaata cattagcatg gaataataga ataggacgtg tggttctatt 2040

ttgttggttt ctaggaccgc cgtaatgatt aatagggaca gtcgggggca tcagtattca 2100ttgttggttt ctaggaccgc cgtaatgatt aatagggaca gtcggggggca tcagtattca 2100

attgtcagag gtgaaattct tggatttatt gaagactaac tactgcgaaa gcatttgcca 2160attgtcagag gtgaaattct tggatttatt gaagactaac tactgcgaaa gcatttgcca 2160

aggatgtttt cattaatcag gaacgaaagt taggggatcg aagacgatca gataccgtcg 2220aggatgtttt cattaatcag gaacgaaagt taggggatcg aagacgatca gataccgtcg 2220

tagtcttaac cataaactat gccgattagg gatcggacgg cgttattttt tgacccgttc 2280tagtcttaac cataaactat gccgattagg gatcggacgg cgttattttt tgacccgttc 2280

ggcaccttac gataaatcaa aatgtttggg ctcctggggg agtatggtcg caaggctgaa 2340ggcaccttac gataaatcaa aatgtttggg ctcctggggg agtatggtcg caaggctgaa 2340

acttaaagaa attgacggaa gggcaccacc aggggtggag cctgcggctt aatttgactc 2400acttaaagaa attgacggaa gggcaccacc aggggtggag cctgcggctt aatttgactc 2400

aacacgggga aactcaccag gtccagacac gatgaggatt gacagattga gagctctttc 2460aacacgggga aactcaccag gtccagacac gatgaggatt gacagattga gagctctttc 2460

ttgatttcgt gggtggtggt gcatggccgt tcttagttgg tggagtgatt tgtctgctta 2520ttgatttcgt gggtggtggt gcatggccgt tcttagttgg tggagtgatt tgtctgctta 2520

attgcgataa cgaacgagac cttaacctgc taaatagccc gtattgcttt ggcagtacgc 2580attgcgataa cgaacgagac cttaacctgc taaatagccc gtattgcttt ggcagtacgc 2580

cggcttctta gagggactat cggctcaagc cgatggaagt ttgaggcaat aacaggtctg 2640cggcttctta gagggactat cggctcaagc cgatggaagt ttgaggcaat aacaggtctg 2640

tgatgccctt agatgttctg ggccgcacgc gcgctacact gacagagcca gcgagtactc 2700tgatgccctt agatgttctg ggccgcacgc gcgctacact gacagagcca gcgagtactc 2700

ccttggccgg aaggcccggg taatcttgtt aaactctgtc gtgctgggga tagagcattg 2760ccttggccgg aaggcccggg taatcttgtt aaactctgtc gtgctgggga tagagcattg 2760

caattattgc tcttcaacga ggaatcccta gtaagcgcaa gtcatcagct tgcgttgatt 2820caattattgc tcttcaacga ggaatcccta gtaagcgcaa gtcatcagct tgcgttgatt 2820

acgtccctgc cctttgtaca caccgcccgt cgctactacc gattgaatgg ctcagtgagg 2880acgtccctgc cctttgtaca caccgcccgt cgctactacc gattgaatgg ctcagtgagg 2880

ctttcggact ggcccagaga ggtcggcaac gaccactcag ggccggaaag ttatccaaac 2940ctttcggact ggcccagaga ggtcggcaac gaccactcag ggccggaaag ttatccaaac 2940

tcggtcattt agaggaagta aaagtcgtaa caaggtctcc gttggtgaac cagcggaggg 3000tcggtcattt agaggaagta aaagtcgtaa caaggtctcc gttggtgaac cagcggaggg 3000

atcattacag agctgcaaaa ctccctaaac catcgtgaac gctacctaga ccgttgcttc 3060atcattacag agctgcaaaa ctccctaaac catcgtgaac gctacctaga ccgttgcttc 3060

ggcgggcggc gccctcgcgc gccccccctg gggcccgcac cgcgggcgcc cgccggaggt 3120ggcgggcggc gccctcgcgc gccccccctg gggcccgcac cgcgggcgcc cgccggaggt 3120

acaccaaact cttgatatgt tatggccact ctgagtctcc tgtactgaat aagtcaaaac 3180acaccaaact cttgatatgt tatggccact ctgagtctcc tgtactgaat aagtcaaaac 3180

tttcaacaac ggatctcttg gttctggcat cgatgaagaa cgcagcgaaa tgcgataagt 3240tttcaacaac ggatctcttg gttctggcat cgatgaagaa cgcagcgaaa tgcgataagt 3240

aatgtgaatt gcagaattca gtgaatcatc gaatctttga acgcacattg cgcccgccag 3300aatgtgaatt gcagaattca gtgaatcatc gaatctttga acgcacattg cgcccgccag 3300

catcctggcg ggcatgcctg ttcgagcgtc atttcaaccc atcaagccca cggcttgtgt 3360catcctggcg ggcatgcctg ttcgagcgtc atttcaaccc atcaagccca cggcttgtgt 3360

tggggacctg cggctgcccg caggccctga aaaccagtgg cgggctcgct agtcacaccg 3420tggggacctg cggctgcccg caggccctga aaaccagtgg cgggctcgct agtcacaccg 3420

ggcgtagtag catacgacct cgctcagggc gtgctgcggg ttccagccgt aaaacgacct 3480ggcgtagtag catacgacct cgctcagggc gtgctgcggg ttccagccgt aaaacgacct 3480

tcacaaccca aggttgacct cggatcaggt aggaggaccc gctgaactta agcatatcaa 3540tcacaaccca aggttgacct cggatcaggt aggaggaccc gctgaactta agcatatcaa 3540

taagcggagg aaaagaaacc aacagggatt gccctagtaa cggcgagtga agcggcaaca 3600taagcggagg aaaagaaacc aacagggatt gccctagtaa cggcgagtga agcggcaaca 3600

gctcaaattt gaaatctggc ttcggcccga gttgtaattt gcagaggaag ctttaggcgc 3660gctcaaattt gaaatctggc ttcggcccga gttgtaattt gcagaggaag ctttaggcgc 3660

ggcaccttct gagtcccctg gaacggggcg ccatagaggg tgagagcccc gtatagttgg 3720ggcaccttct gagtcccctg gaacggggcg ccatagaggg tgagagcccc gtatagttgg 3720

atgcctagcc tgtgtaaagc tccttcgacg agtcgagtag tttgggaatg ctgctcaaaa 3780atgcctagcc tgtgtaaagc tccttcgacg agtcgagtag tttgggaatg ctgctcaaaa 3780

tgggaggtaa atttcttcta aagctaaata ccggccagag accgatagcg cacaagtaga 3840tgggaggtaa atttcttcta aagctaaata ccggccagag accgatagcg cacaagtaga 3840

gtgatcgaaa gatgaaaagc actttgaaaa gagggttaaa tagcacgtga aattgttgaa 3900gtgatcgaaa gatgaaaagc actttgaaaa gagggttaaa tagcacgtga aattgttgaa 3900

agggaagcgc ttgtgaccag acttgcgccg ggctgatcat ccggtgttct caccggtgca 3960agggaagcgc ttgtgaccag acttgcgccg ggctgatcat ccggtgttct caccggtgca 3960

ctctgcccgg ctcaggccag catcggttct cgcgggggga taaaggcccg gggaatgtag 4020ctctgcccgg ctcaggccag catcggttct cgcgggggga taaaggcccg gggaatgtag 4020

ctcctccggg agtgttatag ccccgggtgt aataccctcg cggggaccga ggttcgcgca 4080ctcctccggg agtgttatag ccccgggtgt aataccctcg cggggaccga ggttcgcgca 4080

tctgcaagga tgctggcgta atggtcatca gcgacccgtc ttgaaacacg gaccaaggag 4140tctgcaagga tgctggcgta atggtcatca gcgacccgtc ttgaaacacg gaccaaggag 4140

tcaaggtttt gcgcgagtgt ttgggtgtaa aacccgcacg cgtaatgaaa gtgaacgtag 4200tcaaggtttt gcgcgagtgt ttgggtgtaa aacccgcacg cgtaatgaaa gtgaacgtag 4200

gtgagagctt cggcgcatca tcgaccgatc ctgatgtttt cggatggatt tgagtaggag 4260gtgagagctt cggcgcatca tcgaccgatc ctgatgtttt cggatggatt tgagtaggag 4260

cgttaagcct tggacccgaa agatggtgaa ctatgcttgg atagggtgaa gccagaggaa 4320cgttaagcct tggacccgaa agatggtgaa ctatgcttgg atagggtgaa gccagaggaa 4320

actctggtgg aggctcgcag cggttctgac gtgcaaatcg atcgtcaaat ctgagcatgg 4380actctggtgg aggctcgcag cggttctgac gtgcaaatcg atcgtcaaat ctgagcatgg 4380

gggcgaaaga ctaatcgaac catctagtag ctggttaccg ccgaagtttc cctcaggata 4440gggcgaaaga ctaatcgaac catctagtag ctggttaccg ccgaagtttc cctcaggata 4440

gcagtgttgt cttcagtttt atgaggtaaa gcgaatgatt agggactcgg gggcgctttt 4500gcagtgttgt cttcagtttt atgaggtaaa gcgaatgatt agggactcgg gggcgctttt 4500

tagccttcat ccattctcaa actttaaata tgtaagaagc ccttgttact tagttgaacg 4560tagccttcat ccattctcaa actttaaata tgtaagaagc ccttgttact tagttgaacg 4560

tgggccttcg aatgtatcaa cactagtggg ccatttttgg taagcagaac tggcgatgcg 4620tgggccttcg aatgtatcaa cactagtggg ccatttttgg taagcagaac tggcgatgcg 4620

ggatgaaccg aacgcggggt taaggtgccg gagtggacgc tcatcagaca ccacaaaagg 4680ggatgaaccg aacgcggggt taaggtgccg gagtggacgc tcatcagaca ccacaaaagg 4680

cgttagtaca tcttgacagc aggacggtgg ccatggaagt cggaatccgc taaggactgt 4740cgttagtaca tcttgacagc aggacggtgg ccatggaagt cggaatccgc taaggactgt 4740

gtaacaactc acctgccgaa tgtactagcc ctgaaaatgg atggcgctca agcgtcccac 4800gtaacaactc acctgccgaa tgtactagcc ctgaaaatgg atggcgctca agcgtcccac 4800

ccataccccg ccctcagggt agaaacgacg ccctgaggag taggcggccg tggaggtcag 4860ccataccccg ccctcagggt agaaacgacg ccctgaggag taggcggccg tggaggtcag 4860

tgacgaagcc tagggcgtga gcccgggtcg aacggcctct agtgcagatc ttggtggtag 4920tgacgaagcc tagggcgtga gcccgggtcg aacggcctct agtgcagatc ttggtggtag 4920

tagcaaatac ttcaatgaga acttgaagga ccgaagtggg gaaaggttcc atgtgaacag 4980tagcaaatac ttcaatgaga acttgaagga ccgaagtggg gaaaggttcc atgtgaacag 4980

cggttggaca tgggttagtc gatcctaagc catagggaag ttccgtttca aaggggcact 5040cggttggaca tgggttagtc gatcctaagc catagggaag ttccgtttca aaggggcact 5040

cgtgccccgt gtggcgaaag ggaagccggt taacattccg gcacctggat gtgggttttg 5100cgtgccccgt gtggcgaaag ggaagccggt taacattccg gcacctggat gtgggttttg 5100

cgcggtaacg caactgaacg cggagacgac ggcgggggcc ccgggcagag ttctcttttc 5160cgcggtaacg caactgaacg cggagacgac ggcggggggcc ccgggcagag ttctcttttc 5160

ttcttaacgg tctatcaccc tggaaacagt ttgtctggag atagggttta acggccggaa 5220ttcttaacgg tctatcaccc tggaaacagt ttgtctggag atagggttta acggccggaa 5220

gagcccgaca cttctgtcgg gtccggtgcg ctctcgacgt cccttgaaaa tccgcgggag 5280gagcccgaca cttctgtcgg gtccggtgcg ctctcgacgt cccttgaaaa tccgcggggag 5280

ggaataattc tcacgccagg tcgtactcat aaccgcagca ggtccccaag gtgaacagcc 5340ggaataattc tcacgccagg tcgtactcat aaccgcagca ggtccccaag gtgaacagcc 5340

tctggttgat agaacaatgt agataaggga agtcggcaaa atagatccgt aacttcggga 5400tctggttgat agaacaatgt agataaggga agtcggcaaa atagatccgt aacttcggga 5400

taaggattgg ctctaagggt tgggcacgtt gggctttggg cggacgccct gggagcaggt 5460taaggattgg ctctaagggt tgggcacgtt gggctttggg cggacgccct gggagcaggt 5460

cgcctctagc cgggcaaccg gcggggggct tccagcatcc gggtgcagat gcccttagca 5520cgcctctagc cgggcaaccg gcggggggct tccagcatcc gggtgcagat gcccttagca 5520

ggcttcggcc gtccggcgcg cggttaacaa ccaacttaga actggtacgg acagggggaa 5580ggcttcggcc gtccggcgcg cggttaacaa ccaacttaga actggtacgg acagggggaa 5580

tctgactgtc taattaaaac atagcattgc gatggccaga aagtggtgtt gacgcaatgt 5640tctgactgtc taattaaaac atagcattgc gatggccaga aagtggtgtt gacgcaatgt 5640

gatttctgcc cagtgctctg aatgtcaaag tgaagaaatt caaccaagcg cgggtaaacg 5700gatttctgcc cagtgctctg aatgtcaaag tgaagaaatt caaccaagcg cgggtaaacg 5700

gcgggagtaa ctatgactct cttaaggtag ccaaatgcct cgtcatctaa ttagtgacgc 5760gcgggagtaa ctatgactct cttaaggtag ccaaatgcct cgtcatctaa ttagtgacgc 5760

gcatgaatgg attaacgaga ttcccactgt ccctatctac tatctagcga aaccacagcc 5820gcatgaatgg attaacgaga ttcccactgt ccctatctac tatctagcga aaccacagcc 5820

aagggaacgg gcttggcaga atcagcgggg aaagaagacc ctgttgagct tgactctagt 5880aagggaacgg gcttggcaga atcagcgggg aaagaagacc ctgttgagct tgactctagt 5880

ttgacattgt gaaaagacat aggaggtgta gaataggtgg gagcttcggc gccggtgaaa 5940ttgacattgt gaaaagacat aggaggtgta gaataggtgg gagcttcggc gccggtgaaa 5940

taccactact cctattgttt ttttacttat tcaatgaagc ggggctggat tttcgtccaa 6000taccactact cctattgttt ttttacttat tcaatgaagc ggggctggat tttcgtccaa 6000

cttctggttt taaggtcctt cgcgggccga cccgggttga agacattgtc aggtggggag 6060cttctggttt taaggtcctt cgcggggccga cccgggttga agacattgtc aggtggggag 6060

tttggctggg gcggcacatc tgttaaacca taacgcaggt gtcctaaggg gggctcatgg 6120tttggctggg gcggcacatc tgttaaacca taacgcaggt gtcctaaggg gggctcatgg 6120

agaacagaaa tctccagtag aacaaaaggg taaaagtccc cttgattttg attttcagtg 6180agaacagaaa tctccagtag aacaaaaggg taaaagtccc cttgattttg attttcagtg 6180

tgaatacaaa ccatgaaagt gtggcctatc gatcctttag tccctcgaaa tttgaggcta 6240tgaatacaaa ccatgaaagt gtggcctatc gatcctttag tccctcgaaa tttgaggcta 6240

gaggtgccag aaaagttacc acagggataa ctggcttgtg gcggccaagc gttcatagcg 6300gaggtgccag aaaagttacc acagggataa ctggcttgtg gcggccaagc gttcatagcg 6300

acgtcgcttt ttgatccttc gatgtcggct cttcctatca taccgaagca gaattcggta 6360acgtcgcttt ttgatccttc gatgtcggct cttcctatca taccgaagca gaattcggta 6360

agcgttggat tgttcaccca ctaataggga acgtgagctg ggtttagacc gtcgtgagac 6420agcgttggat tgttcaccca ctaataggga acgtgagctg ggtttagacc gtcgtgagac 6420

aggttagttt taccctactg atgaactcat cgcaatggta attcagctta gtacgagagg 6480aggttagttt taccctactg atgaactcat cgcaatggta attcagctta gtacgagagg 6480

aaccgctgat tcagataatt ggtttttgcg gttgtccgac cgggcagtgc cgcgaagcta 6540aaccgctgat tcagataatt ggtttttgcg gttgtccgac cgggcagtgc cgcgaagcta 6540

ccatctgctg gataatggct gaacgcctct aagtcagaat ccatgccaga acgcgatgat 6600ccatctgctg gataatggct gaacgcctct aagtcagaat ccatgccaga acgcgatgat 6600

actacccgca cgttgtagac gtataagaat aggctccggc ctcgtatcct agcaggcgat 6660actacccgca cgttgtagac gtataagaat aggctccggc ctcgtatcct agcaggcgat 6660

tcctccgccg gcctcgaagt tggccggcgg taattcgcgt attgcaattt cgacacgcgc 6720tcctccgccg gcctcgaagt tggccggcgg taattcgcgt attgcaattt cgacacgcgc 6720

gggatcaaat cctttgcaga cgacttagat gtgcgaaagg gtcctgtaag cagtagagta 6780gggatcaaat cctttgcaga cgacttagat gtgcgaaagg gtcctgtaag cagtagagta 6780

gccttgttgt tacgatctgc tgagggtaag ccctccttcg cctagatttc ccagcgagag 6840gccttgttgt tacgatctgc tgagggtaag ccctccttcg cctagatttc ccagcgagag 6840

cccgccggcg gaacagccgg gcgagcctta cgggggaagc cttaagggga ttgagaagtg 6900cccgccggcg gaacagccgg gcgagcctta cgggggaagc cttaagggga ttgagaagtg 6900

gtgccgtgcg ttcgcgcgcc cctaggtcct ttagccggcc gcaggtgtag ggtaggtcgg 6960gtgccgtgcg ttcgcgcgcc cctaggtcct ttagccggcc gcaggtgtag ggtaggtcgg 6960

ttgggaggat ggggtgtagg gtaggtcggt gtagggtagg ttggttggga ggatggggtg 7020ttgggaggat ggggtgtagg gtaggtcggt gtagggtagg ttggttggga ggatggggtg 7020

tagggtaggt cggccgggtg tagggtaggt cggtgtaggg taggtgggat ggggcgctat 7080tagggtaggt cggccggggtg tagggtaggt cggtgtaggg taggtgggat ggggcgctat 7080

atgcggccgc gagctcgcga gcctattttt agtgaaggct atataaataa gctttacgtt 7140atgcggccgc gagctcgcga gcctattttt agtgaaggct atataaataa gctttacgtt 7140

accgggcctt gctaccctcg agtggcgtgg gccgtgctgc ctactgggca ttgctcgccg 7200accgggcctt gctaccctcg agtggcgtgg gccgtgctgc ctactgggca ttgctcgccg 7200

ggctgtataa gggaggggtc ggggtcgcgg tctagggtag gtcgggtggg atggggtgta 7260ggctgtataa gggaggggtc ggggtcgcgg tctagggtag gtcgggtggg atggggtgta 7260

gggtaggaga agcgctctag tcgtgtgtct ttttctctag gtctattatt agtactggct 7320gggtaggaga agcgctctag tcgtgtgtct ttttctctag gtctattatt agtactggct 7320

gtagggcgac gtgccctgcc ttgttataat attatattgt atgtttaggc ctatactagc 7380gtagggcgac gtgccctgcc ttgttataat attatattgt atgtttaggc ctaactagc 7380

ttgtaatcta tttgtatctg gcttattagg tacggcttcc tttgtatata actagagagg 7440ttgtaatcta tttgtatctg gcttattagg tacggcttcc tttgtatata actagagagg 7440

ctctggtatg cttcttagta tagcggtata ggattcataa tcatagtaat gataatcata 7500ctctggtatg cttcttagta tagcggtata ggattcataa tcatagtaat gataatcata 7500

atagtaataa taataataat agtaatgata ataataataa tctatttata tcttatttaa 7560atagtaataa taataataat agtaatgata ataataataa tctatttata tcttatttaa 7560

aatgcttgta cggctgcctg ctcttaagga gtagctagat atgagatggt agggtagcta 7620aatgcttgta cggctgcctg ctcttaagga gtagctagat atgagatggt agggtagcta 7620

gctaacctag gctagacgtt ctcgtccctt agctatataa gtgctatata ttatagttag 7680gctaacctag gctagacgtt ctcgtccctt agctatataa gtgctatata ttatagttag 7680

ttatctaacc taccttctta cttgagcaga agaggtaggg ttctagtata gctagtaggg 7740ttatctaacc taccttctta cttgagcaga agaggtaggg ttctagtata gctagtaggg 7740

cttctaggcc taagggcctg ttattcgagt tattataggt tagtatttaa tatagttata 7800cttctaggcc taagggcctg ttattcgagt tattataggt tagtatttaa tatagttata 7800

gggataggcc tcgattacgg gtataggata ggtaggatag gtatagggta ggtcggttag 7860gggataggcc tcgattacgg gtataggata ggtaggatag gtatagggta ggtcggttag 7860

gaggataggg tgtaaggtag gtcggccggg tatagggtag gtagtaggtt aggcggggtg 7920gaggataggg tgtaaggtag gtcggccggg tatagggtag gtagtaggtt aggcggggtg 7920

tagggtaggt cggtgtaggg taggtgggat gggcggggtg tagggtaggt cggttgggag 7980tagggtaggt cggtgtaggg taggtgggat gggcggggtg tagggtaggt cggttgggag 7980

gatggggtgt agggtaggtc ggtgtagggt aggtcgg 8017gatggggtgt agggtaggtc ggtgtaggt aggtcgg 8017

<210> 21<210> 21

<211> 8334<211> 8334

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<400> 21<400> 21

gtttaaacga aaggatctct cgcccaggtg gacaacccgc ataatggagg cgccgtggtg 60gtttaaacga aaggatctct cgcccaggtg gacaacccgc ataatggagg cgccgtggtg 60

gattttgcca tgcaggagcc aaccgccagc ggccatgaac ccgcccagca cgatcactct 120gattttgcca tgcaggagcc aaccgccagc ggccatgaac ccgcccagca cgatcactct 120

accaagtaac gttaaagagg cgatccctca tgcgccggag taactaacgg agtaccttct 180accaagtaac gttaaagagg cgatccctca tgcgccggag taactaacgg agtaccttct 180

cattgatctt actgacttgt tagtccgcgc tgacggccaa cagttcaacc agcccggtga 240cattgatctt actgacttgt tagtccgcgc tgacggccaa cagttcaacc agcccggtga 240

tcagcagctc gagggcttgc actggccatc cgccgggcgc ttggctgagc gagcatccgc 300tcagcagctc gagggcttgc actggccatc cgccgggcgc ttggctgagc gagcatccgc 300

gggtcagcca cagccgccgg tctgatgtgg ccgtggcatg acctcagctt gtttatgggt 360gggtcagcca cagccgccgg tctgatgtgg ccgtggcatg acctcagctt gtttatgggt 360

tattagatct ggcttagatc cggcttattt agatatctat ctagtcgagg cagggggttc 420tattagatct ggcttagatc cggcttattt agatatctat ctagtcgagg caggggggttc 420

gagagaccgt ttggtttggt tcatccgacg tttgcctctc tgagctcggt gagtgagagc 480gagagaccgt ttggtttggt tcatccgacg tttgcctctc tgagctcggt gagtgagagc 480

ttcggttgcg acggccaagc atcgcggggc cgcactcgca ggctgcttcg caccacggaa 540ttcggttgcg acggccaagc atcgcggggc cgcactcgca ggctgcttcg caccacggaa 540

ctcatccgag ctacggagtc cctccgtacg ctactcgagt acgtccgtcc tctgtaggca 600ctcatccgag ctacggagtc cctccgtacg ctactcgagt acgtccgtcc tctgtaggca 600

tctcgagccg tcgccagcat ttgagaccaa tggaaggggg tttcctcccg tgcaactttg 660tctcgagccg tcgccagcat ttgagaccaa tggaaggggg tttcctcccg tgcaactttg 660

gttgaaacct tcaaagcgtc ccccgactgg ggcaaccgtt tgacttggat ccacacttca 720gttgaaacct tcaaagcgtc ccccgactgg ggcaaccgtt tgacttggat ccacacttca 720

ggggtagaga ggctcctctc gacaaccccc tgtatttctg taacccccct tgaacgccgt 780ggggtagaga ggctcctctc gacaaccccc tgtatttctg taacccccct tgaacgccgt 780

acatggcacc acaacaccaa acaagccatg ctgcttggaa tcttcgctcc gaaaagagcc 840acatggcacc acaacaccaa acaagccatg ctgcttggaa tcttcgctcc gaaaagagcc 840

ccccccgggc cctccaactt catgcgctcc ctcctcagtt aaatagcggc cgctctgctc 900ccccccgggc cctccaactt catgcgctcc ctcctcagtt aaatagcggc cgctctgctc 900

catggagtat tgctctcttc attaggctgt tgtgatttgc ttgcttgttt tcctttcctt 960catggagtat tgctctcttc attaggctgt tgtgatttgc ttgcttgttt tcctttcctt 960

ttccgcacac ccattccctc ttttcactgg gtcgaggctc tctccaccga taaccttcga 1020ttccgcacac ccattccctc ttttcactgg gtcgaggctc tctccaccga taaccttcga 1020

tccgcggcgc gccgttggcg gtaacagcag gtgccgttcg ctgctgctcg gtccttttcc 1080tccgcggcgc gccgttggcg gtaacagcag gtgccgttcg ctgctgctcg gtccttttcc 1080

cgaaagtacc ctgccttcct ggcctcgacc tccgcctgcg gggctctggg cactgtcaaa 1140cgaaagtacc ctgccttcct ggcctcgacc tccgcctgcg gggctctggg cactgtcaaa 1140

ctttcgcagt tttgcacccg cagcgattcg agcgggaccc gcttcgccaa cgcggatcag 1200ctttcgcagt tttgcacccg cagcgattcg agcgggaccc gcttcgccaa cgcggatcag 1200

gagaggtaaa agtctcccct gtcctttctg ccggagcatc ctccgtccgt cgttcgctgg 1260gagaggtaaa agtctcccct gtcctttctg ccggagcatc ctccgtccgt cgttcgctgg 1260

ttgttgtgtg tgtgtgtgtg tacagtactg taggtacata gtgctcaccc cagggcattt 1320ttgttgtgtg tgtgtgtgtg tacagtactg taggtacata gtgctcaccc cagggcattt 1320

ccccaatccg cgattgcgca taccataggc gtcatctgaa tctgcgttac gtccggataa 1380ccccaatccg cgattgcgca taccataggc gtcatctgaa tctgcgttac gtccggataa 1380

cactacgcag tacgaaggag tcggtgctac tacgcccgca agttcaagtc tacggtgtgg 1440cactacgcag tacgaaggag tcggtgctac tacgcccgca agttcaagtc tacggtgtgg 1440

ctaaggtgct caagggcata gttacacgca ccccgggcga gcttctcgca cctcgaccct 1500ctaaggtgct caagggcata gttacacgca ccccgggcga gcttctcgca cctcgaccct 1500

ttgccggggc gtcactggtc cgacaactca taatccacca tcgcttgggc aggcctgcat 1560ttgccggggc gtcactggtc cgacaactca taatccacca tcgcttgggc aggcctgcat 1560

cccccgtggg tcgcatccaa gccgccggta aataccggcc gacacacaca cacacacacg 1620cccccgtggg tcgcatccaa gccgccggta aataccggcc gacacacaca cacacacacg 1620

caccctgtct agcgcgacgc tacaaaagag accggcaggc actccccgcg accgcttgtt 1680caccctgtct agcgcgacgc tacaaaagag accggcaggc actccccgcg accgcttgtt 1680

ctggccatcc cgtctctcgc ctctgcagtt atcgcctgcc tcatctctgc gtcctgataa 1740ctggccatcc cgtctctcgc ctctgcagtt atcgcctgcc tcatctctgc gtcctgataa 1740

cttttgtcac ctctgatccc cccccgacga gacggtctcg ccgaccagga cccgagatgg 1800cttttgtcac ctctgatccc cccccgacga gacggtctcg ccgaccagga cccgagatgg 1800

cggaccgcca tcctactctg tcccagtcct tcgccgagcg ggcgaagacg gctagccacc 1860cggaccgcca tcctactctg tcccagtcct tcgccgagcg ggcgaagacg gctagccacc 1860

cgctcacccg ctacctcttt cggctcatgg acctcaaggc ctcgaacctg tgcctgagcg 1920cgctcacccg ctacctcttt cggctcatgg acctcaaggc ctcgaacctg tgcctgagcg 1920

ccgacgtgtc caccgcgcgc gagcttctga cgctggccga ccgggtcggc ccctcgatcg 1980ccgacgtgtc caccgcgcgc gagcttctga cgctggccga ccgggtcggc ccctcgatcg 1980

tcgtgctcaa gacgcactac gacctgatct cgggctggga ctacaacccg caaaccggca 2040tcgtgctcaa gacgcactac gacctgatct cgggctggga ctacaacccg caaaccggca 2040

ccggcgcgaa gctggccgcc ctggcgagga agcatggctt cctcatcttt gaggaccgca 2100ccggcgcgaa gctggccgcc ctggcgagga agcatggctt cctcatcttt gaggaccgca 2100

agtttgtcga cattggtaag acggtgcaga tgcagtacac ggctggcact gcgcgcataa 2160agtttgtcga cattggtaag acggtgcaga tgcagtacac ggctggcact gcgcgcataa 2160

tagagtgggc gcacatcacc aacgccaaca tcgacgccgg caaggacatg gtgcgcgcca 2220tagagtgggc gcacatcacc aacgccaaca tcgacgccgg caaggacatg gtgcgcgcca 2220

tggccgaggc ggccgccaag tggaaggaac gcatcaacta cgaggtcaag acctccgtca 2280tggccgaggc ggccgccaag tggaaggaac gcatcaacta cgaggtcaag acctccgtca 2280

cggtgggcac gcccgtctcg gaccagttcg acgatgcgga agagcaagcg cagtggccgc 2340cggtgggcac gcccgtctcg gaccagttcg acgatgcgga agagcaagcg cagtggccgc 2340

agcaccagca gcaccagcac cagcaccagc accagcaaca gcgagatgaa aaaggtgggc 2400agcaccagca gcaccagcac cagcaccagc accagcaaca gcgagatgaa aaaggtgggc 2400

cccgcaggct cggcactcgg gaggagcagc accaacagga caacggagac ggtgacggcc 2460cccgcaggct cggcactcgg gagggagcagc accaacagga caacggagac ggtgacggcc 2460

ggaaagggag cattgtctcg atcactacgg tgacgcagtc atttgagccc gctcactccc 2520ggaaagggag cattgtctcg atcactacgg tgacgcagtc atttgagccc gctcactccc 2520

cacgcctgtc caagagcaac gagctgggcg acgacgccgt cttccccggc atcgaggagg 2580cacgcctgtc caagagcaac gagctgggcg acgacgccgt cttccccggc atcgaggagg 2580

cccccgtcga ccgcggcctg cttctgctcg cccagatgtc gtccaagggc tgcctcatga 2640cccccgtcga ccgcggcctg cttctgctcg cccagatgtc gtccaagggc tgcctcatga 2640

ccaaggagta cacccaggcc tgcgtcgagg ccgcgcgcga gcataaggat tttgtcatgg 2700ccaaggagta cacccaggcc tgcgtcgagg ccgcgcgcga gcataaggat tttgtcatgg 2700

gcttcgtctc acaggagtcg ctcaactcgg ccccggacga cactttcatc cacatgaccc 2760gcttcgtctc acaggagtcg ctcaactcgg ccccggacga cactttcatc cacatgaccc 2760

ccggatgcaa gcttccgccg ccaggcgagg acgaagagag cggccagatc gagtttaaac 2820ccggatgcaa gcttccgccg ccaggcgagg acgaagagag cggccagatc gagtttaaac 2820

ggcgcgccgc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatagga 2880ggcgcgccgc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatagga 2880

gccggaagca taaagtgtaa agcctggggt gcctaatgag tgaggtaact cacattaatt 2940gccggaagca taaagtgtaa agcctggggt gcctaatgag tgaggtaact cacattaatt 2940

gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 3000gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 3000

atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 3060atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 3060

actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 3120actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 3120

gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 3180gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 3180

cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 3240cagcaaaagg cccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 3240

ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 3300ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 3300

ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 3360ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 3360

ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 3420ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 3420

agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 3480agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 3480

cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 3540cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 3540

aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 3600aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 3600

gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 3660gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 3660

agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 3720agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 3720

ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 3780ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 3780

cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 3840cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 3840

tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 3900tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 3900

aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 3960aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 3960

tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 4020tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 4020

atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 4080atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 4080

cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 4140cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 4140

gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 4200gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 4200

gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 4260gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 4260

tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 4320tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 4320

tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 4380tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 4380

tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 4440tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 4440

aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 4500aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 4500

atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 4560atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 4560

tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 4620tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 4620

catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 4680catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 4680

aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 4740aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 4740

tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 4800tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 4800

gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 4860gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 4860

tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 4920tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 4920

tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgaacga 4980tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgaacga 4980

agcatctgtg cttcattttg tagaacaaaa atgcaacgcg agagcgctaa tttttcaaac 5040agcatctgtg cttcattttg tagaacaaaa atgcaacgcg agagcgctaa tttttcaaac 5040

aaagaatctg agctgcattt ttacagaaca gaaatgcaac gcgaaagcgc tattttacca 5100aaagaatctg agctgcattt ttacagaaca gaaatgcaac gcgaaagcgc tattttacca 5100

acgaagaatc tgtgcttcat ttttgtaaaa caaaaatgca acgcgagagc gctaattttt 5160acgaagaatc tgtgcttcat ttttgtaaaa caaaaatgca acgcgagagc gctaattttt 5160

caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgag agcgctattt 5220caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgag agcgctattt 5220

taccaacaaa gaatctatac ttcttttttg ttctacaaaa atgcatcccg agagcgctat 5280taccaacaaa gaatctatac ttcttttttg ttctacaaaa atgcatcccg agagcgctat 5280

ttttctaaca aagcatctta gattactttt tttctccttt gtgcgctcta taatgcagtc 5340ttttctaaca aagcatctta gattactttt tttctccttt gtgcgctcta taatgcagtc 5340

tcttgataac tttttgcact gtaggtccgt taaggttaga agaaggctac tttggtgtct 5400tcttgataac tttttgcact gtaggtccgt taaggttaga agaaggctac tttggtgtct 5400

attttctctt ccataaaaaa agcctgactc cacttcccgc gtttactgat tactagcgaa 5460attttctctt ccataaaaaa agcctgactc cacttcccgc gtttactgat tactagcgaa 5460

gctgcgggtg cattttttca agataaaggc atccccgatt atattctata ccgatgtgga 5520gctgcgggtg cattttttca agataaaggc atccccgatt atattctata ccgatgtgga 5520

ttgcgcatac tttgtgaaca gaaagtgata gcgttgatga ttcttcattg gtcagaaaat 5580ttgcgcatac tttgtgaaca gaaagtgata gcgttgatga ttcttcattg gtcagaaaat 5580

tatgaacggt ttcttctatt ttgtctctat atactacgta taggaaatgt ttacattttc 5640tatgaacggt ttcttctatt ttgtctctat atactacgta taggaaatgt ttacattttc 5640

gtattgtttt cgattcactc tatgaatagt tcttactaca atttttttgt ctaaagagta 5700gtattgtttt cgattcactc tatgaatagt tcttactaca atttttttgt ctaaagagta 5700

atactagaga taaacataaa aaatgtagag gtcgagttta gatgcaagtt caaggagcga 5760atactagaga taaacataaa aaatgtagag gtcgagttta gatgcaagtt caaggagcga 5760

aaggtggatg ggtaggttat atagggatat agcacagaga tatatagcaa agagatactt 5820aaggtggatg ggtaggttat atagggatat agcacagaga tatatagcaa agagatactt 5820

ttgagcaatg tttgtggaag cggtattcgc aatattttag tagctcgtta cagtccggtg 5880ttgagcaatg tttgtggaag cggtattcgc aatattttag tagctcgtta cagtccggtg 5880

cgtttttggt tttttgaaag tgcgtcttca gagcgctttt ggttttcaaa agcgctctga 5940cgtttttggt tttttgaaag tgcgtcttca gagcgctttt ggttttcaaa agcgctctga 5940

agttcctata ctttctagag aataggaact tcggaatagg aacttcaaag cgtttccgaa 6000agttcctata ctttctagag aataggaact tcggaatagg aacttcaaag cgtttccgaa 6000

aacgagcgct tccgaaaatg caacgcgagc tgcgcacata cagctcactg ttcacgtcgc 6060aacgagcgct tccgaaaatg caacgcgagc tgcgcacata cagctcactg ttcacgtcgc 6060

acctatatct gcgtgttgcc tgtatatata tatacatgag aagaacggca tagtgcgtgt 6120acctatatct gcgtgttgcc tgtatatata tatacatgag aagaacggca tagtgcgtgt 6120

ttatgcttaa atgcgtactt atatgcgtct atttatgtag gatgaaaggt agtctagtac 6180ttatgcttaa atgcgtactt atatgcgtct atttatgtag gatgaaaggt agtctagtac 6180

ctcctgtgat attatcccat tccatgcggg gtatcgtatg cttccttcag cactaccctt 6240ctcctgtgat attatcccat tccatgcggg gtatcgtatg cttccttcag cactaccctt 6240

tagctgttct atatgctgcc actcctcaat tggattagtc tcatccttca atgctatcat 6300tagctgttct atatgctgcc actcctcaat tggattagtc tcatccttca atgctatcat 6300

ttcctttgat attggatcat actaagaaac cattattatc atgacattaa cctataaaaa 6360ttcctttgat attggatcat actaagaaac cattattatc atgacattaa cctataaaaa 6360

taggcgtatc acgaggccct ttcgtctcgc gcgtttcggt gatgacggtg aaaacctctg 6420taggcgtatc acgaggccct ttcgtctcgc gcgtttcggt gatgacggtg aaaacctctg 6420

acacatgcag ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca 6480acacatgcag ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca 6480

agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggctggctta actatgcggc 6540agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggctggctta actatgcggc 6540

atcagagcag attgtactga gagtgcacca taccacagct tttcaattca attcatcatt 6600atcagagcag attgtactga gagtgcacca taccacagct tttcaattca attcatcatt 6600

ttttttttat tctttttttt gatttcggtt tctttgaaat ttttttgatt cggtaatctc 6660ttttttttat tctttttttt gatttcggtt tctttgaaat ttttttgatt cggtaatctc 6660

cgaacagaag gaagaacgaa ggaaggagca cagacttaga ttggtatata tacgcatatg 6720cgaacagaag gaagaacgaa ggaaggagca cagacttaga ttggtatata tacgcatatg 6720

tagtgttgaa gaaacatgaa attgcccagt attcttaacc caactgcaca gaacaaaaac 6780tagtgttgaa gaaacatgaa attgcccagt attcttaacc caactgcaca gaacaaaaac 6780

ctgcaggaaa cgaagataaa tcatgtcgaa agctacatat aaggaacgtg ctgctactca 6840ctgcaggaaa cgaagataaa tcatgtcgaa agctacatat aaggaacgtg ctgctactca 6840

tcctagtcct gttgctgcca agctatttaa tatcatgcac gaaaagcaaa caaacttgtg 6900tcctagtcct gttgctgcca agctatttaa tatcatgcac gaaaagcaaa caaacttgtg 6900

tgcttcattg gatgttcgta ccaccaagga attactggag ttagttgaag cattaggtcc 6960tgcttcattg gatgttcgta ccaccaagga attactggag ttagttgaag cattaggtcc 6960

caaaatttgt ttactaaaaa cacatgtgga tatcttgact gatttttcca tggagggcac 7020caaaatttgt ttactaaaaa cacatgtgga tatcttgact gatttttcca tggagggcac 7020

agttaagccg ctaaaggcat tatccgccaa gtacaatttt ttactcttcg aagacagaaa 7080agttaagccg ctaaaggcat tatccgccaa gtacaatttt ttactcttcg aagacagaaa 7080

atttgctgac attggtaata cagtcaaatt gcagtactct gcgggtgtat acagaatagc 7140atttgctgac attggtaata cagtcaaatt gcagtactct gcgggtgtat acagaatagc 7140

agaatgggca gacattacga atgcacacgg tgtggtgggc ccaggtattg ttagcggttt 7200agaatgggca gacattacga atgcacacgg tgtggtgggc ccaggtattg ttagcggttt 7200

gaagcaggcg gcagaagaag taacaaagga acctagaggc cttttgatgt tagcagaatt 7260gaagcaggcg gcagaagaag taacaaagga acctagaggc cttttgatgt tagcagaatt 7260

gtcatgcaag ggctccctat ctactggaga atatactaag ggtactgttg acattgcgaa 7320gtcatgcaag ggctccctat ctactggaga atatactaag ggtactgttg acattgcgaa 7320

gagcgacaaa gattttgtta tcggctttat tgctcaaaga gacatgggtg gaagagatga 7380gagcgacaaa gattttgtta tcggctttat tgctcaaaga gacatgggtg gaagagatga 7380

aggttacgat tggttgatta tgacacccgg tgtgggttta gatgacaagg gagacgcatt 7440aggttacgat tggttgatta tgacacccgg tgtgggttta gatgacaagg gagacgcatt 7440

gggtcaacag tatagaaccg tggatgatgt ggtctctaca ggatctgaca ttattattgt 7500gggtcaacag tatagaaccg tggatgatgt ggtctctaca ggatctgaca ttattattgt 7500

tggaagagga ctatttgcaa agggaaggga tgctaaggta gagggtgaac gttacagaaa 7560tggaagagga ctatttgcaa agggaaggga tgctaaggta gagggtgaac gttacagaaa 7560

agcaggctgg gaagcatatt tgagaagatg cggccagcaa aactaaaaaa ctgtattata 7620agcaggctgg gaagcatatt tgagaagatg cggccagcaa aactaaaaaa ctgtattata 7620

agtaaatgca tgtatactaa actcacaaat tagagcttca atttaattat atcagttatt 7680agtaaatgca tgtatactaa actcacaaat tagagcttca atttaattat atcagttatt 7680

accctatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggaaat 7740accctatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggaaat 7740

tgtaaacgtt aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt 7800tgtaaacgtt aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt 7800

taaccaatag gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg 7860taaccaatag gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg 7860

gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt 7920gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt 7920

caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc 7980caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc 7980

aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg 8040aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg 8040

atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa 8100atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa 8100

aggagcgggc gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc 8160aggagcgggc gctaggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc 8160

cgccgcgctt aatgcgccgc tacagggcgc gtcgcgccat tcgccattca ggctgcgcaa 8220cgccgcgctt aatgcgccgc tacagggcgc gtcgcgccat tcgccattca ggctgcgcaa 8220

ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta cgccagctgg cgaaaggggg 8280ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta cgccagctgg cgaaaggggg 8280

atgtgctgca aggcgattaa gttgggtaac gccagggttt tcccagtcac gacg 8334atgtgctgca aggcgattaa gttgggtaac gccagggttt tcccagtcac gacg 8334

<210> 22<210> 22

<211> 8273<211> 8273

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Последовательность ДНК<223> DNA Sequence

<400> 22<400> 22

ggcgcgccgt ttaaacgaac ctgtgcctga gcgccgacgt gtccaccgcg cgcgagcttc 60ggcgcgccgt ttaaacgaac ctgtgcctga gcgccgacgt gtccaccgcg cgcgagcttc 60

tgacgctggc cgaccgggtc ggcccctcga tcgtcgtgct caagacgcac tacgacctga 120tgacgctggc cgaccgggtc ggcccctcga tcgtcgtgct caagacgcac tacgacctga 120

tctcgggctg ggactacaac ccgcaaaccg gcaccggcgc gaagctggcc gccctggcga 180tctcgggctg ggactacaac ccgcaaaccg gcaccggcgc gaagctggcc gccctggcga 180

ggaagcatgg cttcctcatc tttgaggacc gcaagtttgt cgacattggt aagacggtgc 240ggaagcatgg cttcctcatc tttgaggacc gcaagtttgt cgacattggt aagacggtgc 240

agatgcagta cacggctggc actgcgcgca taatagagtg ggcgcacatc accaacgcca 300agatgcagta cacggctggc actgcgcgca taatagagtg ggcgcacatc accaacgcca 300

acatcgacgc cggcaaggac atggtgcgcg ccatggccga ggcggccgcc aagtggaagg 360acatcgacgc cggcaaggac atggtgcgcg ccatggccga ggcggccgcc aagtggaagg 360

aacgcatcaa ctacgaggtc aagacctccg tcacggtggg cacgcccgtc tcggaccagt 420aacgcatcaa ctacgaggtc aagacctccg tcacggtggg cacgcccgtc tcggaccagt 420

tcgacgatgc ggaagagcaa gcgcagtggc cgcagcacca gcagcaccag caccagcacc 480tcgacgatgc ggaagagcaa gcgcagtggc cgcagcacca gcagcaccag caccagcacc 480

agcaccagca acagcgagat gaaaaaggtg ggccccgcag gctcggcact cgggaggagc 540agcaccagca acagcgagat gaaaaaggtg ggccccgcag gctcggcact cgggaggagc 540

agcaccaaca ggacaacgga gacggtgacg gccggaaagg gagcattgtc tcgatcacta 600agcaccaaca ggacaacgga gacggtgacg gccggaaagg gagcattgtc tcgatcacta 600

cggtgacgca gtcatttgag cccgctcact ccccacgcct gtccaagagc aacgagctgg 660cggtgacgca gtcatttgag cccgctcact ccccacgcct gtccaagagc aacgagctgg 660

gcgacgacgc cgtcttcccc ggcatcgagg aggcccccgt cgaccgcggc ctgcttctgc 720gcgacgacgc cgtcttcccc ggcatcgagg aggcccccgt cgaccgcggc ctgcttctgc 720

tcgcccagat gtcgtccaag ggctgcctca tgaccaagga gtacacccag gcctgcgtcg 780tcgcccagat gtcgtccaag ggctgcctca tgaccaagga gtacacccag gcctgcgtcg 780

aggccgcgcg cgagcataag gattttgtca tgggcttcgt ctcacaggag tcgctcaact 840aggccgcgcg cgagcataag gattttgtca tgggcttcgt ctcacaggag tcgctcaact 840

cggccccgga cgacactttc atccacatga cccccggatg caagcttccg ccgccaggcg 900cggccccgga cgacactttc atccacatga cccccggatg caagcttccg ccgccaggcg 900

aggacgaaga gagcggccag atcgagggcg acggcctcgg ccagcagtac aactcgccca 960aggacgaaga gagcggccag atcgagggcg acggcctcgg ccagcagtac aactcgccca 960

gcaagttgat caacatttgc ggcaccgaca ttgtcatcgt agggcgtggc atcaccgccg 1020gcaagttgat caacatttgc ggcaccgaca ttgtcatcgt agggcgtggc atcaccgccg 1020

ccggcgaccc gccctccgag gctgagaggt acaggagaaa agcctggaag gcctatctgg 1080ccggcgaccc gccctccgag gctgagaggt acaggagaaa agcctggaag gcctatctgg 1080

cgcgtctggc gtgatttggg gggaggggga gaggagatgg gggacgggag gggtcgcctt 1140cgcgtctggc gtgatttggg gggaggggga gaggagatgg gggacgggag gggtcgcctt 1140

ggtcagtctt gtgcgtgtcc tgcagcggat tcgtcaccgg ggcagcaccc aaaagaggga 1200ggtcagtctt gtgcgtgtcc tgcagcggat tcgtcaccgg ggcagcaccc aaaagaggga 1200

gaaaaagggg aaaaaaaata aataaataaa aagggttaag ttgttgaaaa aagtgttgtg 1260gaaaaagggg aaaaaaaata aataaataaa aagggttaag ttgttgaaaa aagtgttgtg 1260

agctctctgg caaggcgcgc cttcgcacca cggaactcat ccgagctacg gagtccctcc 1320agctctctgg caaggcgcgc cttcgcacca cggaactcat ccgagctacg gagtccctcc 1320

gtacgctact cgagtacgtc cgtcctctgt aggcatctcg agccgtcgcc agcatttgag 1380gtacgctact cgagtacgtc cgtcctctgt aggcatctcg agccgtcgcc agcatttgag 1380

accaatggaa gggggtttcc tcccgtgcaa ctttggttga aaccttcaaa gcgtcccccg 1440accaatggaa gggggtttcc tcccgtgcaa ctttggttga aaccttcaaa gcgtcccccg 1440

actggggcaa ccgtttgact tggatccaca cttcaggggt agagaggctc ctctcgacaa 1500actggggcaa ccgtttgact tggatccaca cttcaggggt agagaggctc ctctcgacaa 1500

ccccctgtat ttctgtaacc ccccttgaac gccgtacatg gcaccacaac accaaacaag 1560ccccctgtat ttctgtaacc ccccttgaac gccgtacatg gcaccacaac accaaacaag 1560

ccatgctgct tggaatcttc gctccgaaaa gagccccccc cgggccctcc aacttcatgc 1620ccatgctgct tggaatcttc gctccgaaaa gagccccccc cgggccctcc aacttcatgc 1620

gctccctcct cagttaaata gcggccgctc tgctccatgg agtattgctc tcttcattag 1680gctccctcct cagttaaata gcggccgctc tgctccatgg agtattgctc tcttcattag 1680

gctgttgtga tttgcttgct tgttttcctt tccttttccg cacacccatt ccctcttttc 1740gctgttgtga tttgcttgct tgttttcctt tccttttccg cacacccatt ccctcttttc 1740

actgggtcga ggctctctcc accgataacc ttcgatccgc aggcgcgccc cccatgtttc 1800actgggtcga ggctctctcc accgataacc ttcgatccgc aggcgcgccc cccatgtttc 1800

ccaaagggtc ctgtttgttt gttttttctt cctcttcttt aagggctcgg gtgacagctg 1860ccaaagggtc ctgtttgttt gttttttctt cctcttcttt aagggctcgg gtgacagctg 1860

gagagccgag caagcagcac ataaaatggc ttgcgaattc aggatacatt gattatgtca 1920gagagccgag caagcagcac ataaaatggc ttgcgaattc aggatacatt gattatgtca 1920

tggacccaag gaaacaccct cttcctgcgc cgtccactgc accaacttct cctcaaacac 1980tggacccaag gaaacaccct cttcctgcgc cgtccactgc accaacttct cctcaaacac 1980

gatcaaccac gtaggaacag cagacgaaaa cgtcacctgg ccgcgattga catacccaaa 2040gatcaaccac gtaggaacag cagacgaaaa cgtcacctgg ccgcgattga catacccaaa 2040

gtgagacgtg gaggagacgg gggttgcgtg cttcggccgg atgaggtttt cagaccgact 2100gtgagacgtg gaggacgg gggttgcgtg cttcggccgg atgaggtttt cagaccgact 2100

acggtactgg atcttagcag cacaaagatc acctacccag agtaagtagt tggacaagcg 2160acggtactgg atcttagcag cacaaagatc acctacccag agtaagtagt tggacaagcg 2160

ctttcactcg gaactcagag ccaacggaaa tcggatgagg catcaagatt tttcgagggg 2220ctttcactcg gaactcagag ccaacggaaa tcggatgagg catcaagatt tttcgagggg 2220

caactactcc gtcggacaac cgagtcctgt gtgcaagcgc cgcatttcgt cattgtagat 2280caactactcc gtcggacaac cgagtcctgt gtgcaagcgc cgcatttcgt cattgtagat 2280

gttggagaca tgtttgcagt ccgccctaag caggccattc cgtcggagaa gagggaaaga 2340gttggagaca tgtttgcagt ccgccctaag caggccattc cgtcggagaa gagggaaaga 2340

cccggccgag ggcgtgcccg ggttccaggc tacttgccac gagggtttca tatcagcaca 2400cccggccgag ggcgtgcccg ggttccaggc tacttgccac gagggtttca tatcagcaca 2400

tcttcggcac aaccacagcc attgagcccg attgccccga gaggggaaag ggcggctgaa 2460tcttcggcac aaccacagcc attgagcccg attgccccga gaggggaaag ggcggctgaa 2460

ttgcaatttg acatccgtgc ttgttgttac ccttgtttag caaagccagt gggggtcatc 2520ttgcaatttg acatccgtgc ttgttgttac ccttgtttag caaagccagt gggggtcatc 2520

aataccacct ccaaggcgcg catatcacgg caacacctgg cccgataaaa cagaagccaa 2580aataccacct ccaaggcgcg catatcacgg caacacctgg cccgataaaa cagaagccaa 2580

acacgtgtgt attatgttgg tattagatgt tcgcttctcc caaccggagc tgatgcccgc 2640acacgtgtgt attatgttgg tattagatgt tcgcttctcc caaccggagc tgatgcccgc 2640

gccagatccc gcgcccaaca gttcactcgt aatcgttgta tacatgaccg cctgtatcga 2700gccagatccc gcgcccaaca gttcactcgt aatcgttgta tacatgaccg cctgtatcga 2700

agggtatgtg tcattagcaa ggtatataga aacgtgaacc gaaaatgctc atctcgccgg 2760agggtatgtg tcattagcaa ggtatataga aacgtgaacc gaaaatgctc atctcgccgg 2760

tttaaacgct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacataggag 2820tttaaacgct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacataggag 2820

ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gaggtaactc acattaattg 2880ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gaggtaactc acattaattg 2880

cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 2940cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 2940

tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 3000tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 3000

ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 3060ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 3060

taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 3120taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 3120

agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 3180agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 3180

cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 3240cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 3240

tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 3300tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 3300

tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 3360tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 3360

gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 3420gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 3420

acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 3480acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 3480

acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 3540acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 3540

cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 3600cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 3600

gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 3660gaagggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 3660

gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 3720gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 3720

agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 3780agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 3780

ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 3840ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 3840

ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 3900ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 3900

atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 3960atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 3960

tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 4020tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 4020

gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 4080gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 4080

ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 4140ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 4140

caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 4200caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 4200

cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 4260cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 4260

cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 4320cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 4320

cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 4380cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 4380

agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 4440agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 4440

tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 4500tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 4500

agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 4560agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 4560

atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 4620atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 4620

ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 4680ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 4680

cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 4740cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 4740

caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 4800caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 4800

attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 4860attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 4860

agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgaacgaa 4920agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgaacgaa 4920

gcatctgtgc ttcattttgt agaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca 4980gcatctgtgc ttcattttgt agaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca 4980

aagaatctga gctgcatttt tacagaacag aaatgcaacg cgaaagcgct attttaccaa 5040aagaatctga gctgcatttt tacagaacag aaatgcaacg cgaaagcgct attttaccaa 5040

cgaagaatct gtgcttcatt tttgtaaaac aaaaatgcaa cgcgagagcg ctaatttttc 5100cgaagaatct gtgcttcatt tttgtaaaac aaaaatgcaa cgcgagagcg ctaatttttc 5100

aaacaaagaa tctgagctgc atttttacag aacagaaatg caacgcgaga gcgctatttt 5160aaacaaagaa tctgagctgc atttttacag aacagaaatg caacgcgaga gcgctatttt 5160

accaacaaag aatctatact tcttttttgt tctacaaaaa tgcatcccga gagcgctatt 5220accaacaaag aatctatact tcttttttgt tctacaaaaa tgcatcccga gagcgctatt 5220

tttctaacaa agcatcttag attacttttt ttctcctttg tgcgctctat aatgcagtct 5280tttctaacaa agcatcttag attacttttt ttctcctttg tgcgctctat aatgcagtct 5280

cttgataact ttttgcactg taggtccgtt aaggttagaa gaaggctact ttggtgtcta 5340cttgataact ttttgcactg taggtccgtt aaggttagaa gaaggctact ttggtgtcta 5340

ttttctcttc cataaaaaaa gcctgactcc acttcccgcg tttactgatt actagcgaag 5400ttttctcttc cataaaaaaa gcctgactcc acttcccgcg tttactgatt actagcgaag 5400

ctgcgggtgc attttttcaa gataaaggca tccccgatta tattctatac cgatgtggat 5460ctgcgggtgc attttttcaa gataaaggca tccccgatta tattctatac cgatgtggat 5460

tgcgcatact ttgtgaacag aaagtgatag cgttgatgat tcttcattgg tcagaaaatt 5520tgcgcatact ttgtgaacag aaagtgatag cgttgatgat tcttcattgg tcagaaaatt 5520

atgaacggtt tcttctattt tgtctctata tactacgtat aggaaatgtt tacattttcg 5580atgaacggtt tcttctattt tgtctctata tactacgtat aggaaatgtt tacattttcg 5580

tattgttttc gattcactct atgaatagtt cttactacaa tttttttgtc taaagagtaa 5640tattgttttc gattcactct atgaatagtt cttactacaa tttttttgtc taaagagtaa 5640

tactagagat aaacataaaa aatgtagagg tcgagtttag atgcaagttc aaggagcgaa 5700tactagagat aaacataaaa aatgtagagg tcgagtttag atgcaagttc aaggagcgaa 5700

aggtggatgg gtaggttata tagggatata gcacagagat atatagcaaa gagatacttt 5760aggtggatgg gtaggttata tagggatata gcacagagat atatagcaaa gagatacttt 5760

tgagcaatgt ttgtggaagc ggtattcgca atattttagt agctcgttac agtccggtgc 5820tgagcaatgt ttgtggaagc ggtattcgca atattttagt agctcgttac agtccggtgc 5820

gtttttggtt ttttgaaagt gcgtcttcag agcgcttttg gttttcaaaa gcgctctgaa 5880gtttttggtt ttttgaaagt gcgtcttcag agcgcttttg gttttcaaaa gcgctctgaa 5880

gttcctatac tttctagaga ataggaactt cggaatagga acttcaaagc gtttccgaaa 5940gttcctatac tttctagaga ataggaactt cggaatagga acttcaaagc gtttccgaaa 5940

acgagcgctt ccgaaaatgc aacgcgagct gcgcacatac agctcactgt tcacgtcgca 6000acgagcgctt ccgaaaatgc aacgcgagct gcgcacatac agctcactgt tcacgtcgca 6000

cctatatctg cgtgttgcct gtatatatat atacatgaga agaacggcat agtgcgtgtt 6060cctatatctg cgtgttgcct gtatatatat atacatgaga agaacggcat agtgcgtgtt 6060

tatgcttaaa tgcgtactta tatgcgtcta tttatgtagg atgaaaggta gtctagtacc 6120tatgcttaaa tgcgtactta tatgcgtcta tttatgtagg atgaaaggta gtctagtacc 6120

tcctgtgata ttatcccatt ccatgcgggg tatcgtatgc ttccttcagc actacccttt 6180tcctgtgata ttatcccatt ccatgcgggg tatcgtatgc ttccttcagc actacccttt 6180

agctgttcta tatgctgcca ctcctcaatt ggattagtct catccttcaa tgctatcatt 6240agctgttcta tatgctgcca ctcctcaatt ggattagtct catccttcaa tgctatcatt 6240

tcctttgata ttggatcata ctaagaaacc attattatca tgacattaac ctataaaaat 6300tcctttgata ttggatcata ctaagaaacc attattatca tgacattaac ctataaaaat 6300

aggcgtatca cgaggccctt tcgtctcgcg cgtttcggtg atgacggtga aaacctctga 6360aggcgtatca cgaggccctt tcgtctcgcg cgtttcggtg atgacggtga aaacctctga 6360

cacatgcagc tcccggagac ggtcacagct tgtctgtaag cggatgccgg gagcagacaa 6420cacatgcagc tcccggagac ggtcacagct tgtctgtaag cggatgccgg gagcagacaa 6420

gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg gctggcttaa ctatgcggca 6480gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg gctggcttaa ctatgcggca 6480

tcagagcaga ttgtactgag agtgcaccat accacagctt ttcaattcaa ttcatcattt 6540tcagagcaga ttgtactgag agtgcaccat accacagctt ttcaattcaa ttcatcattt 6540

tttttttatt cttttttttg atttcggttt ctttgaaatt tttttgattc ggtaatctcc 6600tttttttatt cttttttttg atttcggttt ctttgaaatt tttttgattc ggtaatctcc 6600

gaacagaagg aagaacgaag gaaggagcac agacttagat tggtatatat acgcatatgt 6660gaacagaagg aagaacgaag gaaggagcac agacttagat tggtatatat acgcatatgt 6660

agtgttgaag aaacatgaaa ttgcccagta ttcttaaccc aactgcacag aacaaaaacc 6720agtgttgaag aaacatgaaa ttgcccagta ttcttaaccc aactgcacag aacaaaaacc 6720

tgcaggaaac gaagataaat catgtcgaaa gctacatata aggaacgtgc tgctactcat 6780tgcaggaaac gaagataaat catgtcgaaa gctacatata aggaacgtgc tgctactcat 6780

cctagtcctg ttgctgccaa gctatttaat atcatgcacg aaaagcaaac aaacttgtgt 6840cctagtcctg ttgctgccaa gctatttaat atcatgcacg aaaagcaaac aaacttgtgt 6840

gcttcattgg atgttcgtac caccaaggaa ttactggagt tagttgaagc attaggtccc 6900gcttcattgg atgttcgtac caccaaggaa ttactggagt tagttgaagc attaggtccc 6900

aaaatttgtt tactaaaaac acatgtggat atcttgactg atttttccat ggagggcaca 6960aaaatttgtt tactaaaaac acatgtggat atcttgactg atttttccat ggagggcaca 6960

gttaagccgc taaaggcatt atccgccaag tacaattttt tactcttcga agacagaaaa 7020gttaagccgc taaaggcatt atccgccaag tacaattttt tactcttcga agacagaaaa 7020

tttgctgaca ttggtaatac agtcaaattg cagtactctg cgggtgtata cagaatagca 7080tttgctgaca ttggtaatac agtcaaattg cagtactctg cgggtgtata cagaatagca 7080

gaatgggcag acattacgaa tgcacacggt gtggtgggcc caggtattgt tagcggtttg 7140gaatgggcag acattacgaa tgcacacggt gtggtgggcc caggtattgt tagcggtttg 7140

aagcaggcgg cagaagaagt aacaaaggaa cctagaggcc ttttgatgtt agcagaattg 7200aagcaggcgg cagaagaagt aacaaaggaa cctagaggcc ttttgatgtt agcagaattg 7200

tcatgcaagg gctccctatc tactggagaa tatactaagg gtactgttga cattgcgaag 7260tcatgcaagg gctccctatc tactggagaa tatactaagg gtactgttga cattgcgaag 7260

agcgacaaag attttgttat cggctttatt gctcaaagag acatgggtgg aagagatgaa 7320agcgacaaag attttgttat cggctttatt gctcaaagag acatgggtgg aagagatgaa 7320

ggttacgatt ggttgattat gacacccggt gtgggtttag atgacaaggg agacgcattg 7380ggttacgatt ggttgattat gacacccggt gtgggtttag atgacaaggg agacgcattg 7380

ggtcaacagt atagaaccgt ggatgatgtg gtctctacag gatctgacat tattattgtt 7440ggtcaacagt atagaaccgt ggatgatgtg gtctctacag gatctgacat tattattgtt 7440

ggaagaggac tatttgcaaa gggaagggat gctaaggtag agggtgaacg ttacagaaaa 7500ggaagaggac tatttgcaaa gggaagggat gctaaggtag agggtgaacg ttacagaaaa 7500

gcaggctggg aagcatattt gagaagatgc ggccagcaaa actaaaaaac tgtattataa 7560gcaggctggg aagcatattt gagaagatgc ggccagcaaa actaaaaaac tgtattataa 7560

gtaaatgcat gtatactaaa ctcacaaatt agagcttcaa tttaattata tcagttatta 7620gtaaatgcat gtatactaaa ctcacaaatt agagcttcaa tttaattata tcagttatta 7620

ccctatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca tcaggaaatt 7680ccctatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca tcaggaaatt 7680

gtaaacgtta atattttgtt aaaattcgcg ttaaattttt gttaaatcag ctcatttttt 7740gtaaacgtta atattttgtt aaaattcgcg ttaaattttt gttaaatcag ctcatttttt 7740

aaccaatagg ccgaaatcgg caaaatccct tataaatcaa aagaatagac cgagataggg 7800aaccaatagg ccgaaatcgg caaaatccct tataaatcaa aagaatagac cgagataggg 7800

ttgagtgttg ttccagtttg gaacaagagt ccactattaa agaacgtgga ctccaacgtc 7860ttgagtgttg ttccagtttg gaacaagagt ccactattaa agaacgtgga ctccaacgtc 7860

aaagggcgaa aaaccgtcta tcagggcgat ggcccactac gtgaaccatc accctaatca 7920aaagggcgaa aaaccgtcta tcagggcgat ggcccactac gtgaaccatc accctaatca 7920

agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg gagcccccga 7980agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg gagcccccga 7980

tttagagctt gacggggaaa gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa 8040tttagagctt gacggggaaa gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa 8040

ggagcgggcg ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc 8100ggagcgggcg ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc 8100

gccgcgctta atgcgccgct acagggcgcg tcgcgccatt cgccattcag gctgcgcaac 8160gccgcgctta atgcgccgct acagggcgcg tcgcgccatt cgccattcag gctgcgcaac 8160

tgttgggaag ggcgatcggt gcgggcctct tcgctattac gccagctggc gaaaggggga 8220tgttgggaag ggcgatcggt gcggggcctct tcgctattac gccagctggc gaaaggggga 8220

tgtgctgcaa ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acg 8273tgtgctgcaa ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acg 8273

<210> 23<210> 23

<211> 8375<211> 8375

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Последовательность ДНК<223> DNA Sequence

<400> 23<400> 23

gtttaaacgt ttaaacggtg gacacaaaca gttgccaatt agatctcctg aacttaataa 60gtttaaacgt ttaaacggtg gacacaaaca gttgccaatt agatctcctg aacttaataa 60

agcgccattc tgttgaaaga cgagatcgcc gagcgtacca agtcttgttc gggctctgaa 120agcgccattc tgttgaaaga cgagatcgcc gagcgtacca agtcttgttc gggctctgaa 120

caaaactgga accaccactc caaaacggta gttgatgcga atacctatat cctccagatc 180caaaactgga accaccactc caaaacggta gttgatgcga atacctatat cctccagatc 180

gagtctgcag tgcagcgtgg atatgggtat cggcacttgc gtgcacagta gtgtagctcc 240gagtctgcag tgcagcgtgg atatgggtat cggcacttgc gtgcacagta gtgtagctcc 240

gtagtacgga gtgctgcagg atatcaactt ctaagccaca gccgttccga gcggaacatt 300gtagtacgga gtgctgcagg atatcaactt ctaagccaca gccgttccga gcggaacatt 300

tcttcattgg ctccctcgcg catggggcag gtcgtgcagt gttcgtggct atttgcggat 360tcttcattgg ctccctcgcg catggggcag gtcgtgcagt gttcgtggct atttgcggat 360

catacagaca ccttttgggg tccgcttcgg gaaactgccg cccccctaca ctacggagta 420catacagaca ccttttgggg tccgcttcgg gaaactgccg cccccctaca ctacggagta 420

gtgcgacgcc gcattcccgt tcggcgcttg gcagccaatt ctaccactcg gggccgtctg 480gtgcgacgcc gcattcccgt tcggcgcttg gcagccaatt ctaccactcg gggccgtctg 480

caaggccacc tctgcatttt caagtcgaat agtcaatagt cacaaaaact ggtcaaactg 540caaggccacc tctgcatttt caagtcgaat agtcaatagt cacaaaaact ggtcaaactg 540

gccaaactgg tcaacccggt tgccaccttt tggaaagagc accgcttctt tttcgttcct 600gccaaactgg tcaacccggt tgccaccttt tggaaagagc accgcttctt tttcgttcct 600

cggcctgagc cgtcgaatgc gaacgtcaaa aggcgaacta gaaattctga aacatagtac 660cggcctgagc cgtcgaatgc gaacgtcaaa aggcgaacta gaaattctga aacatagtac 660

ggattactcc gtacccggtt gttttgcacc gggattttgc ttcaatcgcc accgagttcc 720ggattactcc gtacccggtt gttttgcacc gggattttgc ttcaatcgcc accgagttcc 720

acccactttc gccaaggtac ggattacagt aatccgtaca tacctacgga cgtactccgt 780acccactttc gccaaggtac ggattacagt aatccgtaca tacctacgga cgtactccgt 780

cgtgtatcta ggtgttcccc cttggcacgc tttccacctg cgacaacgcg gcctcagatc 840cgtgtatcta ggtgttcccc cttggcacgc tttccacctg cgacaacgcg gcctcagatc 840

ccgacctcga accccccccc cccccccccc aaacaacaac ccagctcttc ggctgtgcgc 900ccgacctcga accccccccc cccccccccc aaacaacaac ccagctcttc ggctgtgcgc 900

ccgccaactc gacaaacaac aacatccaac aagtgcgaat ttgaattcga ctcgacagcc 960ccgccaactc gacaaacaac aacatccaac aagtgcgaat ttgaattcga ctcgacagcc 960

catcgattcg tctctcttca tgcgcatcaa tccgatccgg aaccgccgac tttaacaaca 1020catcgattcg tctctcttca tgcgcatcaa tccgatccgg aaccgccgac tttaacaaca 1020

cccgtgccgg gctcgaccac ggggctcccg tagtccgcca aatacaggcg cgccgttggc 1080cccgtgccgg gctcgaccac ggggctcccg tagtccgcca aatacaggcg cgccgttggc 1080

ggtaacagca ggtgccgttc gctgctgctc ggtccttttc ccgaaagtac cctgccttcc 1140ggtaacagca ggtgccgttc gctgctgctc ggtccttttc ccgaaagtac cctgccttcc 1140

tggcctcgac ctccgcctgc ggggctctgg gcactgtcaa actttcgcag ttttgcaccc 1200tggcctcgac ctccgcctgc ggggctctgg gcactgtcaa actttcgcag ttttgcaccc 1200

gcagcgattc gagcgggacc cgcttcgcca acgcggatca ggagaggtaa aagtctcccc 1260gcagcgattc gagcgggacc cgcttcgcca acgcggatca ggagaggtaa aagtctcccc 1260

tgtcctttct gccggagcat cctccgtccg tcgttcgctg gttgttgtgt gtgtgtgtgt 1320tgtcctttct gccggagcat cctccgtccg tcgttcgctg gttgttgtgt gtgtgtgtgt 1320

gtacagtact gtaggtacat agtgctcacc ccagggcatt tccccaatcc gcgattgcgc 1380gtacagtact gtaggtacat agtgctcacc ccagggcatt tccccaatcc gcgattgcgc 1380

ataccatagg cgtcatctga atctgcgtta cgtccggata acactacgca gtacgaagga 1440ataccatagg cgtcatctga atctgcgtta cgtccggata acactacgca gtacgaagga 1440

gtcggtgcta ctacgcccgc aagttcaagt ctacggtgtg gctaaggtgc tcaagggcat 1500gtcggtgcta ctacgcccgc aagttcaagt ctacggtgtg gctaaggtgc tcaagggcat 1500

agttacacgc accccgggcg agcttctcgc acctcgaccc tttgccgggg cgtcactggt 1560agttacacgc accccggggcg agcttctcgc acctcgaccc tttgccgggg cgtcactggt 1560

ccgacaactc ataatccacc atcgcttggg caggcctgca tcccccgtgg gtcgcatcca 1620ccgacaactc ataatccacc atcgcttggg caggcctgca tcccccgtgg gtcgcatcca 1620

agccgccggt aaataccggc cgacacacac acacacacac gcaccctgtc tagcgcgacg 1680agccgccggt aaataccggc cgacacacac acacacac gcaccctgtc tagcgcgacg 1680

ctacaaaaga gaccggcagg cactccccgc gaccgcttgt tctggccatc ccgtctctcg 1740ctacaaaaga gaccggcagg cactccccgc gaccgcttgt tctggccatc ccgtctctcg 1740

cctctgcagt tatcgcctgc ctcatctctg cgtcctgata acttttgtca cctctgatcc 1800cctctgcagt tatcgcctgc ctcatctctg cgtcctgata acttttgtca cctctgatcc 1800

ccccccgacg agacggtctc gccgaccagg acccgagatg gcggaccgcc atcctactct 1860ccccccgacg agacggtctc gccgaccagg acccgagatg gcggaccgcc atcctactct 1860

gtcccagtcc ttcgccgagc gggcgaagac ggctagccac ccgctcaccc gctacctctt 1920gtcccagtcc ttcgccgagc gggcgaagac ggctagccac ccgctcaccc gctacctctt 1920

tcggctcatg gacctcaagg cctcgaacct gtgcctgagc gccgacgtgt ccaccgcgcg 1980tcggctcatg gacctcaagg cctcgaacct gtgcctgagc gccgacgtgt ccaccgcgcg 1980

cgagcttctg acgctggccg accgggtcgg cccctcgatc gtcgtgctca agacgcacta 2040cgagcttctg acgctggccg accgggtcgg cccctcgatc gtcgtgctca agacgcacta 2040

cgacctgatc tcgggctggg actacaaccc gcaaaccggc accggcgcga agctggccgc 2100cgacctgatc tcgggctggg actacaaccc gcaaaccggc accggcgcga agctggccgc 2100

cctggcgagg aagcatggct tcctcatctt tgaggaccgc aagtttgtcg acattggtaa 2160cctggcgagg aagcatggct tcctcatctt tgaggaccgc aagtttgtcg acattggtaa 2160

gacggtgcag atgcagtaca cggctggcac tgcgcgcata atagagtggg cgcacatcac 2220gacggtgcag atgcagtaca cggctggcac tgcgcgcata atagagtggg cgcacatcac 2220

caacgccaac atcgacgccg gcaaggacat ggtgcgcgcc atggccgagg cggccgccaa 2280caacgccaac atcgacgccg gcaaggacat ggtgcgcgcc atggccgagg cggccgccaa 2280

gtggaaggaa cgcatcaact acgaggtcaa gacctccgtc acggtgggca cgcccgtctc 2340gtggaaggaa cgcatcaact acgaggtcaa gacctccgtc acggtgggca cgcccgtctc 2340

ggaccagttc gacgatgcgg aagagcaagc gcagtggccg cagcaccagc agcaccagca 2400ggaccagttc gacgatgcgg aagagcaagc gcagtggccg cagcaccagc agcaccagca 2400

ccagcaccag caccagcaac agcgagatga aaaaggtggg ccccgcaggc tcggcactcg 2460ccagcaccag caccagcaac agcgagatga aaaaggtggg ccccgcaggc tcggcactcg 2460

ggaggagcag caccaacagg acaacggaga cggtgacggc cggaaaggga gcattgtctc 2520ggagaggagcag caccaacagg acaacggaga cggtgacggc cggaaaggga gcattgtctc 2520

gatcactacg gtgacgcagt catttgagcc cgctcactcc ccacgcctgt ccaagagcaa 2580gatcactacg gtgacgcagt catttgagcc cgctcactcc ccacgcctgt ccaagagcaa 2580

cgagctgggc gacgacgccg tcttccccgg catcgaggag gcccccgtcg accgcggcct 2640cgagctgggc gacgacgccg tcttccccgg catcgaggag gcccccgtcg accgcggcct 2640

gcttctgctc gcccagatgt cgtccaaggg ctgcctcatg accaaggagt acacccaggc 2700gcttctgctc gccgatgt cgtccaaggg ctgcctcatg accaaggagt acacccaggc 2700

ctgcgtcgag gccgcgcgcg agcataagga ttttgtcatg ggcttcgtct cacaggagtc 2760ctgcgtcgag gccgcgcgcg agcataagga ttttgtcatg ggcttcgtct cacaggagtc 2760

gctcaactcg gccccggacg acactttcat ccacatgacc cccggatgca agcttccgcc 2820gctcaactcg gccccggacg acactttcat ccacatgacc cccggatgca agcttccgcc 2820

gccaggcgag gacgaagaga gcggccagat cgagtttaaa cggcgcgccg ctgtttcctg 2880gccaggcgag gacgaagaga gcggccagat cgagtttaaa cggcgcgccg ctgtttcctg 2880

tgtgaaattg ttatccgctc acaattccac acaacatagg agccggaagc ataaagtgta 2940tgtgaaattg ttatccgctc acaattccac acaacatagg agccggaagc ataaagtgta 2940

aagcctgggg tgcctaatga gtgaggtaac tcacattaat tgcgttgcgc tcactgcccg 3000aagcctgggg tgcctaatga gtgaggtaac tcacattaat tgcgttgcgc tcactgcccg 3000

ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 3060ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 3060

gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 3120gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 3120

tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 3180tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 3180

aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 3240aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 3240

gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 3300gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 3300

aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 3360aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 3360

ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 3420ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 3420

tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 3480tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 3480

tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 3540tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 3540

ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 3600ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 3600

tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 3660tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 3660

ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 3720ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 3720

tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 3780tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 3780

aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 3840aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 3840

aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 3900aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 3900

aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 3960aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 3960

ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 4020ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 4020

acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 4080acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 4080

ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 4140ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 4140

gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 4200gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 4200

taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 4260taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 4260

tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 4320tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 4320

gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 4380gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 4380

cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 4440cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 4440

aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 4500aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 4500

cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 4560cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 4560

tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 4620tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 4620

gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 4680gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 4680

tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 4740tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 4740

gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 4800gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 4800

ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 4860ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 4860

cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 4920cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 4920

agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 4980agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 4980

gggttccgcg cacatttccc cgaaaagtgc cacctgaacg aagcatctgt gcttcatttt 5040gggttccgcg cacatttccc cgaaaagtgc cacctgaacg aagcatctgt gcttcatttt 5040

gtagaacaaa aatgcaacgc gagagcgcta atttttcaaa caaagaatct gagctgcatt 5100gtagaacaaa aatgcaacgc gagagcgcta atttttcaaa caaagaatct gagctgcatt 5100

tttacagaac agaaatgcaa cgcgaaagcg ctattttacc aacgaagaat ctgtgcttca 5160tttacagaac agaaatgcaa cgcgaaagcg ctattttacc aacgaagaat ctgtgcttca 5160

tttttgtaaa acaaaaatgc aacgcgagag cgctaatttt tcaaacaaag aatctgagct 5220tttttgtaaa acaaaaatgc aacgcgagag cgctaatttt tcaaacaaag aatctgagct 5220

gcatttttac agaacagaaa tgcaacgcga gagcgctatt ttaccaacaa agaatctata 5280gcatttttac agaacagaaa tgcaacgcga gagcgctatt ttaccaacaa agaatctata 5280

cttctttttt gttctacaaa aatgcatccc gagagcgcta tttttctaac aaagcatctt 5340cttctttttt gttctacaaa aatgcatccc gagagcgcta tttttctaac aaagcatctt 5340

agattacttt ttttctcctt tgtgcgctct ataatgcagt ctcttgataa ctttttgcac 5400agattacttt ttttctcctt tgtgcgctct ataatgcagt ctcttgataa ctttttgcac 5400

tgtaggtccg ttaaggttag aagaaggcta ctttggtgtc tattttctct tccataaaaa 5460tgtaggtccg ttaaggttag aagaaggcta ctttggtgtc tattttctct tccataaaaa 5460

aagcctgact ccacttcccg cgtttactga ttactagcga agctgcgggt gcattttttc 5520aagcctgact ccacttcccg cgtttactga ttactagcga agctgcgggt gcattttttc 5520

aagataaagg catccccgat tatattctat accgatgtgg attgcgcata ctttgtgaac 5580aagataaagg catccccgat tatattctat accgatgtgg attgcgcata ctttgtgaac 5580

agaaagtgat agcgttgatg attcttcatt ggtcagaaaa ttatgaacgg tttcttctat 5640agaaagtgat agcgttgatg attcttcatt ggtcagaaaa ttatgaacgg tttcttctat 5640

tttgtctcta tatactacgt ataggaaatg tttacatttt cgtattgttt tcgattcact 5700tttgtctcta tatactacgt ataggaaatg tttacatttt cgtattgttt tcgattcact 5700

ctatgaatag ttcttactac aatttttttg tctaaagagt aatactagag ataaacataa 5760ctatgaatag ttcttactac aatttttttg tctaaagagt aatactagag ataaacataa 5760

aaaatgtaga ggtcgagttt agatgcaagt tcaaggagcg aaaggtggat gggtaggtta 5820aaaatgtaga ggtcgagttt agatgcaagt tcaaggagcg aaaggtggat gggtaggtta 5820

tatagggata tagcacagag atatatagca aagagatact tttgagcaat gtttgtggaa 5880tatagggata tagcacagag atatatagca aagagatact tttgagcaat gtttgtggaa 5880

gcggtattcg caatatttta gtagctcgtt acagtccggt gcgtttttgg ttttttgaaa 5940gcggtattcg caatatttta gtagctcgtt acagtccggt gcgtttttgg ttttttgaaa 5940

gtgcgtcttc agagcgcttt tggttttcaa aagcgctctg aagttcctat actttctaga 6000gtgcgtcttc agagcgcttt tggttttcaa aagcgctctg aagttcctat actttctaga 6000

gaataggaac ttcggaatag gaacttcaaa gcgtttccga aaacgagcgc ttccgaaaat 6060gaataggaac ttcggaatag gaacttcaaa gcgtttccga aaacgagcgc ttccgaaaat 6060

gcaacgcgag ctgcgcacat acagctcact gttcacgtcg cacctatatc tgcgtgttgc 6120gcaacgcgag ctgcgcacat acagctcact gttcacgtcg cacctatatc tgcgtgttgc 6120

ctgtatatat atatacatga gaagaacggc atagtgcgtg tttatgctta aatgcgtact 6180ctgtatatat atatacatga gaagaacggc atagtgcgtg tttatgctta aatgcgtact 6180

tatatgcgtc tatttatgta ggatgaaagg tagtctagta cctcctgtga tattatccca 6240tatatgcgtc tatttatgta ggatgaaagg tagtctagta cctcctgtga tattatccca 6240

ttccatgcgg ggtatcgtat gcttccttca gcactaccct ttagctgttc tatatgctgc 6300ttccatgcgg ggtatcgtat gcttccttca gcactaccct ttagctgttc tatatgctgc 6300

cactcctcaa ttggattagt ctcatccttc aatgctatca tttcctttga tattggatca 6360cactcctcaa ttggattagt ctcatccttc aatgctatca tttcctttga tattggatca 6360

tactaagaaa ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc 6420tactaagaaa ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc 6420

tttcgtctcg cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag 6480tttcgtctcg cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag 6480

acggtcacag cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca 6540acggtcacag cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca 6540

gcgggtgttg gcgggtgtcg gggctggctt aactatgcgg catcagagca gattgtactg 6600gcgggtgttg gcgggtgtcg gggctggctt aactatgcgg catcagagca gattgtactg 6600

agagtgcacc ataccacagc ttttcaattc aattcatcat ttttttttta ttcttttttt 6660agagtgcacc ataccacagc ttttcaattc aattcatcat ttttttttta ttcttttttt 6660

tgatttcggt ttctttgaaa tttttttgat tcggtaatct ccgaacagaa ggaagaacga 6720tgatttcggt ttctttgaaa tttttttgat tcggtaatct ccgaacagaa ggaagaacga 6720

aggaaggagc acagacttag attggtatat atacgcatat gtagtgttga agaaacatga 6780aggaaggagc acagacttag attggtatat atacgcatat gtagtgttga agaaacatga 6780

aattgcccag tattcttaac ccaactgcac agaacaaaaa cctgcaggaa acgaagataa 6840aattgcccag tattcttaac ccaactgcac agaacaaaaa cctgcaggaa acgaagataa 6840

atcatgtcga aagctacata taaggaacgt gctgctactc atcctagtcc tgttgctgcc 6900atcatgtcga aagctacata taaggaacgt gctgctactc atcctagtcc tgttgctgcc 6900

aagctattta atatcatgca cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt 6960aagctattta atatcatgca cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt 6960

accaccaagg aattactgga gttagttgaa gcattaggtc ccaaaatttg tttactaaaa 7020accaccaagg aattactgga gttagttgaa gcattaggtc ccaaaatttg tttactaaaa 7020

acacatgtgg atatcttgac tgatttttcc atggagggca cagttaagcc gctaaaggca 7080acacatgtgg atatcttgac tgatttttcc atggagggca cagttaagcc gctaaaggca 7080

ttatccgcca agtacaattt tttactcttc gaagacagaa aatttgctga cattggtaat 7140ttatccgcca agtacaattt tttactcttc gaagacagaa aatttgctga cattggtaat 7140

acagtcaaat tgcagtactc tgcgggtgta tacagaatag cagaatgggc agacattacg 7200acagtcaaat tgcagtactc tgcgggtgta tacagaatag cagaatgggc agacattacg 7200

aatgcacacg gtgtggtggg cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa 7260aatgcacacg gtgtggtggg cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa 7260

gtaacaaagg aacctagagg ccttttgatg ttagcagaat tgtcatgcaa gggctcccta 7320gtaacaaagg aacctagagg ccttttgatg ttagcagaat tgtcatgcaa gggctcccta 7320

tctactggag aatatactaa gggtactgtt gacattgcga agagcgacaa agattttgtt 7380tctactggag aatatactaa gggtactgtt gacattgcga agagcgacaa agattttgtt 7380

atcggcttta ttgctcaaag agacatgggt ggaagagatg aaggttacga ttggttgatt 7440atcggcttta ttgctcaaag agacatgggt ggaagagatg aaggttacga ttggttgatt 7440

atgacacccg gtgtgggttt agatgacaag ggagacgcat tgggtcaaca gtatagaacc 7500atgacacccg gtgtgggttt agatgacaag ggagacgcat tgggtcaaca gtatagaacc 7500

gtggatgatg tggtctctac aggatctgac attattattg ttggaagagg actatttgca 7560gtggatgatg tggtctctac aggatctgac attattattg ttggaagagg actatttgca 7560

aagggaaggg atgctaaggt agagggtgaa cgttacagaa aagcaggctg ggaagcatat 7620aagggaaggg atgctaaggt agaggtgaa cgttacagaa aagcaggctg ggaagcatat 7620

ttgagaagat gcggccagca aaactaaaaa actgtattat aagtaaatgc atgtatacta 7680ttgagaagat gcggccagca aaactaaaaa actgtattat aagtaaatgc atgtatacta 7680

aactcacaaa ttagagcttc aatttaatta tatcagttat taccctatgc ggtgtgaaat 7740aactcacaaa ttagagcttc aatttaatta tatcagttat taccctatgc ggtgtgaaat 7740

accgcacaga tgcgtaagga gaaaataccg catcaggaaa ttgtaaacgt taatattttg 7800accgcacaga tgcgtaagga gaaaataccg catcaggaaa ttgtaaacgt taatattttg 7800

ttaaaattcg cgttaaattt ttgttaaatc agctcatttt ttaaccaata ggccgaaatc 7860ttaaaattcg cgttaaattt ttgttaaatc agctcatttt ttaaccaata ggccgaaatc 7860

ggcaaaatcc cttataaatc aaaagaatag accgagatag ggttgagtgt tgttccagtt 7920ggcaaaatcc cttataaatc aaaagaatag accgagatag ggttgagtgt tgttccagtt 7920

tggaacaaga gtccactatt aaagaacgtg gactccaacg tcaaagggcg aaaaaccgtc 7980tggaacaaga gtccactatt aaagaacgtg gactccaacg tcaaagggcg aaaaaccgtc 7980

tatcagggcg atggcccact acgtgaacca tcaccctaat caagtttttt ggggtcgagg 8040tatcagggcg atggcccact acgtgaacca tcaccctaat caagtttttt ggggtcgagg 8040

tgccgtaaag cactaaatcg gaaccctaaa gggagccccc gatttagagc ttgacgggga 8100tgccgtaaag cactaaatcg gaaccctaaa gggagccccc gatttagagc ttgacgggga 8100

aagccggcga acgtggcgag aaaggaaggg aagaaagcga aaggagcggg cgctagggcg 8160aagccggcga acgtggcgag aaaggaaggg aagaaagcga aaggagcggg cgctagggcg 8160

ctggcaagtg tagcggtcac gctgcgcgta accaccacac ccgccgcgct taatgcgccg 8220ctggcaagtg tagcggtcac gctgcgcgta accaccacac ccgccgcgct taatgcgccg 8220

ctacagggcg cgtcgcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg 8280ctacagggcg cgtcgcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg 8280

gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta 8340gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta 8340

agttgggtaa cgccagggtt ttcccagtca cgacg 8375agttgggtaa cgccagggtt ttcccagtca cgacg 8375

<210> 24<210> 24

<211> 8196<211> 8196

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Последовательность ДНК<223> DNA Sequence

<400> 24<400> 24

ggcgcgccgt ttaaacgaac ctgtgcctga gcgccgacgt gtccaccgcg cgcgagcttc 60ggcgcgccgt ttaaacgaac ctgtgcctga gcgccgacgt gtccaccgcg cgcgagcttc 60

tgacgctggc cgaccgggtc ggcccctcga tcgtcgtgct caagacgcac tacgacctga 120tgacgctggc cgaccgggtc ggcccctcga tcgtcgtgct caagacgcac tacgacctga 120

tctcgggctg ggactacaac ccgcaaaccg gcaccggcgc gaagctggcc gccctggcga 180tctcgggctg ggactacaac ccgcaaaccg gcaccggcgc gaagctggcc gccctggcga 180

ggaagcatgg cttcctcatc tttgaggacc gcaagtttgt cgacattggt aagacggtgc 240ggaagcatgg cttcctcatc tttgaggacc gcaagtttgt cgacattggt aagacggtgc 240

agatgcagta cacggctggc actgcgcgca taatagagtg ggcgcacatc accaacgcca 300agatgcagta cacggctggc actgcgcgca taatagagtg ggcgcacatc accaacgcca 300

acatcgacgc cggcaaggac atggtgcgcg ccatggccga ggcggccgcc aagtggaagg 360acatcgacgc cggcaaggac atggtgcgcg ccatggccga ggcggccgcc aagtggaagg 360

aacgcatcaa ctacgaggtc aagacctccg tcacggtggg cacgcccgtc tcggaccagt 420aacgcatcaa ctacgaggtc aagacctccg tcacggtggg cacgcccgtc tcggaccagt 420

tcgacgatgc ggaagagcaa gcgcagtggc cgcagcacca gcagcaccag caccagcacc 480tcgacgatgc ggaagagcaa gcgcagtggc cgcagcacca gcagcaccag caccagcacc 480

agcaccagca acagcgagat gaaaaaggtg ggccccgcag gctcggcact cgggaggagc 540agcaccagca acagcgagat gaaaaaggtg ggccccgcag gctcggcact cgggaggagc 540

agcaccaaca ggacaacgga gacggtgacg gccggaaagg gagcattgtc tcgatcacta 600agcaccaaca ggacaacgga gacggtgacg gccggaaagg gagcattgtc tcgatcacta 600

cggtgacgca gtcatttgag cccgctcact ccccacgcct gtccaagagc aacgagctgg 660cggtgacgca gtcatttgag cccgctcact ccccacgcct gtccaagagc aacgagctgg 660

gcgacgacgc cgtcttcccc ggcatcgagg aggcccccgt cgaccgcggc ctgcttctgc 720gcgacgacgc cgtcttcccc ggcatcgagg aggcccccgt cgaccgcggc ctgcttctgc 720

tcgcccagat gtcgtccaag ggctgcctca tgaccaagga gtacacccag gcctgcgtcg 780tcgcccagat gtcgtccaag ggctgcctca tgaccaagga gtacacccag gcctgcgtcg 780

aggccgcgcg cgagcataag gattttgtca tgggcttcgt ctcacaggag tcgctcaact 840aggccgcgcg cgagcataag gattttgtca tgggcttcgt ctcacaggag tcgctcaact 840

cggccccgga cgacactttc atccacatga cccccggatg caagcttccg ccgccaggcg 900cggccccgga cgacactttc atccacatga cccccggatg caagcttccg ccgccaggcg 900

aggacgaaga gagcggccag atcgagggcg acggcctcgg ccagcagtac aactcgccca 960aggacgaaga gagcggccag atcgagggcg acggcctcgg ccagcagtac aactcgccca 960

gcaagttgat caacatttgc ggcaccgaca ttgtcatcgt agggcgtggc atcaccgccg 1020gcaagttgat caacatttgc ggcaccgaca ttgtcatcgt agggcgtggc atcaccgccg 1020

ccggcgaccc gccctccgag gctgagaggt acaggagaaa agcctggaag gcctatctgg 1080ccggcgaccc gccctccgag gctgagaggt acaggagaaa agcctggaag gcctatctgg 1080

cgcgtctggc gtgatttggg gggaggggga gaggagatgg gggacgggag gggtcgcctt 1140cgcgtctggc gtgatttggg gggaggggga gaggagatgg gggacgggag gggtcgcctt 1140

ggtcagtctt gtgcgtgtcc tgcagcggat tcgtcaccgg ggcagcaccc aaaagaggga 1200ggtcagtctt gtgcgtgtcc tgcagcggat tcgtcaccgg ggcagcaccc aaaagaggga 1200

gaaaaagggg aaaaaaaata aataaataaa aagggttaag ttgttgaaaa aagtgttgtg 1260gaaaaagggg aaaaaaaata aataaataaa aagggttaag ttgttgaaaa aagtgttgtg 1260

agctctctgg caaggcgcgc cccttttgga aagagcaccg cttctttttc gttcctcggc 1320agctctctgg caaggcgcgc cccttttgga aagagcaccg cttctttttc gttcctcggc 1320

ctgagccgtc gaatgcgaac gtcaaaaggc gaactagaaa ttctgaaaca tagtacggat 1380ctgagccgtc gaatgcgaac gtcaaaaggc gaactagaaa ttctgaaaca tagtacggat 1380

tactccgtac ccggttgttt tgcaccggga ttttgcttca atcgccaccg agttccaccc 1440tactccgtac ccggttgttt tgcaccggga ttttgcttca atcgccaccg agttccaccc 1440

actttcgcca aggtacggat tacagtaatc cgtacatacc tacggacgta ctccgtcgtg 1500actttcgcca aggtacggat tacagtaatc cgtacatacc tacggacgta ctccgtcgtg 1500

tatctaggtg ttcccccttg gcacgctttc cacctgcgac aacgcggcct cagatcccga 1560tatctaggtg ttcccccttg gcacgctttc cacctgcgac aacgcggcct cagatcccga 1560

cctcgaaccc cccccccccc ccccccaaac aacaacccag ctcttcggct gtgcgcccgc 1620cctcgaaccc cccccccccc ccccccaaac aacaacccag ctcttcggct gtgcgcccgc 1620

caactcgaca aacaacaaca tccaacaagt gcgaatttga attcgactcg acagcccatc 1680caactcgaca aacaacaaca tccaacaagt gcgaatttga attcgactcg acagccatc 1680

gattcgtctc tcttcatgcg catcaatccg atccggaacc gccgacttta acaacacccg 1740gattcgtctc tcttcatgcg catcaatccg atccggaacc gccgacttta acaacacccg 1740

tgccgggctc gaccacgggg ctcccgtagt ccgccaaata catcgggtct gggatgtctt 1800tgccgggctc gaccacgggg ctcccgtagt ccgccaaata catcgggtct gggatgtctt 1800

ttttttattt tattttttta tttttgtcgc ggtgtgagtg tgtttgtcgg gtccggttcg 1860ttttttattt tattttttta tttttgtcgc ggtgtgagtg tgtttgtcgg gtccggttcg 1860

gcagttcatg atcattcctc tataaataag gtatggatcg tatatattat atattacata 1920gcagttcatg atcattcctc tataaataag gtatggatcg tatatattat atattacata 1920

cagttgaagc cttagcacag tatgaatctc catataaatc tcttttttct tttcttttct 1980cagttgaagc cttagcacag tatgaatctc catataaatc tcttttttct tttcttttct 1980

tctttttttt ttttttttgc accccaccca cgtgctttcc ttatattcat catgcccttc 2040tctttttttt ttttttttgc accccaccca cgtgctttcc ttatattcat catgcccttc 2040

atggctaggt gagttgatac caggactacg agatgtatat atatctcttg aacgattctc 2100atggctaggt gagttgatac caggactacg agatgtatat atatctcttg aacgattctc 2100

ctagagtttg tttagacgtg cactgtcctc tgataataat aaatcagctg ctgcattcat 2160ctagagtttg tttagacgtg cactgtcctc tgataataat aaatcagctg ctgcattcat 2160

ccacgtgcga aaccagcttt gttaggttcg aatgtagacc gttttggtat ttcaaacggc 2220ccacgtgcga aaccagcttt gttaggttcg aatgtagacc gttttggtat ttcaaacggc 2220

agccattgcc tccgccttta gaatctgtcc aagctattgt tcagcaacta atgtcaaaaa 2280agccattgcc tccgccttta gaatctgtcc aagctattgt tcagcaacta atgtcaaaaa 2280

aaaaaaaaaa aaaacgccta agcccccaac gtccggatag ataagaatac agcagggtga 2340aaaaaaaaaa aaaacgccta agcccccaac gtccggatag ataagaatac agcagggtga 2340

cgggttgggg ggacggggag gttgtcttcc gctgagcatg ccaccacatc acatgaatgc 2400cgggttgggg ggacggggag gttgtcttcc gctgagcatg ccaccacatc acatgaatgc 2400

tttttcttcg ctgcctggac ctgaaccacc cccggagggg ctttcctccc cccgcttgac 2460tttttcttcg ctgcctggac ctgaaccacc cccggagggg ctttcctccc cccgcttgac 2460

tactgcgctg acctccagac ctcggacgga tcctcaatgg cggctaacca ggggtaagtt 2520tactgcgctg acctccagac ctcggacgga tcctcaatgg cggctaacca ggggtaagtt 2520

cccatcaggc taccaccacc accagaaggg ccggaactcg cgctccccgc gtccgaaact 2580cccatcaggc taccaccacc accagaaggg ccggaactcg cgctccccgc gtccgaaact 2580

tcgccgtctc tctcggtctc ggcctcggtc tcggtctcgg cagaagcacc gtggccgccc 2640tcgccgtctc tctcggtctc ggcctcggtc tcggtctcgg cagaagcacc gtggccgccc 2640

ccaatcacca tccacccgtc cctcgtctcg cgaggatcgg ccgtttaaac gctgtttcct 2700ccaatcacca tccacccgtc cctcgtctcg cgaggatcgg ccgtttaaac gctgtttcct 2700

gtgtgaaatt gttatccgct cacaattcca cacaacatag gagccggaag cataaagtgt 2760gtgtgaaatt gttatccgct cacaattcca cacaacatag gagccggaag cataaagtgt 2760

aaagcctggg gtgcctaatg agtgaggtaa ctcacattaa ttgcgttgcg ctcactgccc 2820aaagcctggg gtgcctaatg agtgaggtaa ctcacattaa ttgcgttgcg ctcactgccc 2820

gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg 2880gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg 2880

agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 2940agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 2940

gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 3000gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 3000

gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 3060gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 3060

cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 3120cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 3120

aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 3180aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 3180

tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 3240tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 3240

ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 3300ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 3300

ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 3360ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 3360

cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 3420cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 3420

ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 3480ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 3480

gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 3540gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 3540

atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 3600atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 3600

aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 3660aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 3660

aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 3720aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 3720

gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 3780gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 3780

cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 3840cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 3840

gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 3900gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 3900

tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 3960tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 3960

ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 4020ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 4020

ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 4080ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 4080

atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 4140atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 4140

cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 4200cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 4200

tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 4260tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 4260

aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 4320aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 4320

tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 4380tcactcatgg ttatggcagc actngcataat tctcttactg tcatgccatc cgtaagatgc 4380

ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 4440ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 4440

agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 4500agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 4500

gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 4560gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 4560

agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 4620agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 4620

accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 4680accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 4680

gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 4740gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 4740

cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 4800cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 4800

ggggttccgc gcacatttcc ccgaaaagtg ccacctgaac gaagcatctg tgcttcattt 4860ggggttccgc gcacatttcc ccgaaaagtg ccacctgaac gaagcatctg tgcttcattt 4860

tgtagaacaa aaatgcaacg cgagagcgct aatttttcaa acaaagaatc tgagctgcat 4920tgtagaacaa aaatgcaacg cgagagcgct aatttttcaa acaaagaatc tgagctgcat 4920

ttttacagaa cagaaatgca acgcgaaagc gctattttac caacgaagaa tctgtgcttc 4980ttttacagaa cagaaatgca acgcgaaagc gctattttac caacgaagaa tctgtgcttc 4980

atttttgtaa aacaaaaatg caacgcgaga gcgctaattt ttcaaacaaa gaatctgagc 5040atttttgtaa aacaaaaatg caacgcgaga gcgctaattt ttcaaacaaa gaatctgagc 5040

tgcattttta cagaacagaa atgcaacgcg agagcgctat tttaccaaca aagaatctat 5100tgcattttta cagaacagaa atgcaacgcg agagcgctat tttaccaaca aagaatctat 5100

acttcttttt tgttctacaa aaatgcatcc cgagagcgct atttttctaa caaagcatct 5160acttcttttt tgttctacaa aaatgcatcc cgagagcgct atttttctaa caaagcatct 5160

tagattactt tttttctcct ttgtgcgctc tataatgcag tctcttgata actttttgca 5220tagattactt tttttctcct ttgtgcgctc tataatgcag tctcttgata actttttgca 5220

ctgtaggtcc gttaaggtta gaagaaggct actttggtgt ctattttctc ttccataaaa 5280ctgtaggtcc gttaaggtta gaagaaggct actttggtgt ctattttctc ttccataaaa 5280

aaagcctgac tccacttccc gcgtttactg attactagcg aagctgcggg tgcatttttt 5340aaagcctgac tccacttccc gcgtttactg attactagcg aagctgcggg tgcatttttt 5340

caagataaag gcatccccga ttatattcta taccgatgtg gattgcgcat actttgtgaa 5400caagataaag gcatccccga ttatattcta taccgatgtg gattgcgcat actttgtgaa 5400

cagaaagtga tagcgttgat gattcttcat tggtcagaaa attatgaacg gtttcttcta 5460cagaaagtga tagcgttgat gattcttcat tggtcagaaa attatgaacg gtttcttcta 5460

ttttgtctct atatactacg tataggaaat gtttacattt tcgtattgtt ttcgattcac 5520ttttgtctct atatactacg tataggaaat gtttacattt tcgtattgtt ttcgattcac 5520

tctatgaata gttcttacta caattttttt gtctaaagag taatactaga gataaacata 5580tctatgaata gttcttacta caattttttt gtctaaagag taatactaga gataaacata 5580

aaaaatgtag aggtcgagtt tagatgcaag ttcaaggagc gaaaggtgga tgggtaggtt 5640aaaaatgtag aggtcgagtt tagatgcaag ttcaaggagc gaaaggtgga tgggtaggtt 5640

atatagggat atagcacaga gatatatagc aaagagatac ttttgagcaa tgtttgtgga 5700atatagggat atagcacaga gatatatagc aaagagatac ttttgagcaa tgtttgtgga 5700

agcggtattc gcaatatttt agtagctcgt tacagtccgg tgcgtttttg gttttttgaa 5760agcggtattc gcaatatttt agtagctcgt tacagtccgg tgcgtttttg gttttttgaa 5760

agtgcgtctt cagagcgctt ttggttttca aaagcgctct gaagttccta tactttctag 5820agtgcgtctt cagagcgctt ttggttttca aaagcgctct gaagttccta tactttctag 5820

agaataggaa cttcggaata ggaacttcaa agcgtttccg aaaacgagcg cttccgaaaa 5880agaataggaa cttcggaata ggaacttcaa agcgtttccg aaaacgagcg cttccgaaaa 5880

tgcaacgcga gctgcgcaca tacagctcac tgttcacgtc gcacctatat ctgcgtgttg 5940tgcaacgcga gctgcgcaca tacagctcac tgttcacgtc gcacctatat ctgcgtgttg 5940

cctgtatata tatatacatg agaagaacgg catagtgcgt gtttatgctt aaatgcgtac 6000cctgtatata tatatacatg agaagaacgg catagtgcgt gtttatgctt aaatgcgtac 6000

ttatatgcgt ctatttatgt aggatgaaag gtagtctagt acctcctgtg atattatccc 6060ttatatgcgt ctatttatgt aggatgaaag gtagtctagt acctcctgtg atattatccc 6060

attccatgcg gggtatcgta tgcttccttc agcactaccc tttagctgtt ctatatgctg 6120attccatgcg gggtatcgta tgcttccttc agcactaccc tttagctgtt ctatatgctg 6120

ccactcctca attggattag tctcatcctt caatgctatc atttcctttg atattggatc 6180ccactcctca attggattag tctcatcctt caatgctatc atttcctttg atattggatc 6180

atactaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 6240atactaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 6240

ctttcgtctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga 6300ctttcgtctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga 6300

gacggtcaca gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc 6360gacggtcaca gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc 6360

agcgggtgtt ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact 6420agcgggtgtt ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact 6420

gagagtgcac cataccacag cttttcaatt caattcatca tttttttttt attctttttt 6480gagagtgcac cataccacag cttttcaatt caattcatca tttttttttt attctttttt 6480

ttgatttcgg tttctttgaa atttttttga ttcggtaatc tccgaacaga aggaagaacg 6540ttgatttcgg tttctttgaa atttttttga ttcggtaatc tccgaacaga aggaagaacg 6540

aaggaaggag cacagactta gattggtata tatacgcata tgtagtgttg aagaaacatg 6600aaggaaggag cacagactta gattggtata tatacgcata tgtagtgttg aagaaacatg 6600

aaattgccca gtattcttaa cccaactgca cagaacaaaa acctgcagga aacgaagata 6660aaattgccca gtattcttaa cccaactgca cagaacaaaa acctgcagga aacgaagata 6660

aatcatgtcg aaagctacat ataaggaacg tgctgctact catcctagtc ctgttgctgc 6720aatcatgtcg aaagctacat ataaggaacg tgctgctact catcctagtc ctgttgctgc 6720

caagctattt aatatcatgc acgaaaagca aacaaacttg tgtgcttcat tggatgttcg 6780caagctattt aatatcatgc acgaaaagca aacaaacttg tgtgcttcat tggatgttcg 6780

taccaccaag gaattactgg agttagttga agcattaggt cccaaaattt gtttactaaa 6840taccaccaag gaattactgg agttagttga agcattaggt cccaaaattt gtttactaaa 6840

aacacatgtg gatatcttga ctgatttttc catggagggc acagttaagc cgctaaaggc 6900aacacatgtg gatatcttga ctgatttttc catggagggc acagttaagc cgctaaaggc 6900

attatccgcc aagtacaatt ttttactctt cgaagacaga aaatttgctg acattggtaa 6960attatccgcc aagtacaatt ttttactctt cgaagacaga aaatttgctg acattggtaa 6960

tacagtcaaa ttgcagtact ctgcgggtgt atacagaata gcagaatggg cagacattac 7020tacagtcaaa ttgcagtact ctgcgggtgt atacagaata gcagaatggg cagacattac 7020

gaatgcacac ggtgtggtgg gcccaggtat tgttagcggt ttgaagcagg cggcagaaga 7080gaatgcacac ggtgtggtgg gcccaggtat tgttagcggt ttgaagcagg cggcagaaga 7080

agtaacaaag gaacctagag gccttttgat gttagcagaa ttgtcatgca agggctccct 7140agtaacaaag gaacctagag gccttttgat gttagcagaa ttgtcatgca agggctccct 7140

atctactgga gaatatacta agggtactgt tgacattgcg aagagcgaca aagattttgt 7200atctactgga gaatatacta agggtactgt tgacattgcg aagagcgaca aagattttgt 7200

tatcggcttt attgctcaaa gagacatggg tggaagagat gaaggttacg attggttgat 7260tatcggcttt attgctcaaa gagacatggg tggaagagat gaaggttacg attggttgat 7260

tatgacaccc ggtgtgggtt tagatgacaa gggagacgca ttgggtcaac agtatagaac 7320tatgacaccc ggtgtgggtt tagatgacaa ggggacgca ttgggtcaac agtatagaac 7320

cgtggatgat gtggtctcta caggatctga cattattatt gttggaagag gactatttgc 7380cgtggatgat gtggtctcta caggatctga cattattatt gttggaagag gactatttgc 7380

aaagggaagg gatgctaagg tagagggtga acgttacaga aaagcaggct gggaagcata 7440aaagggaagg gatgctaagg tagagggtga acgttacaga aaagcaggct gggaagcata 7440

tttgagaaga tgcggccagc aaaactaaaa aactgtatta taagtaaatg catgtatact 7500tttgagaaga tgcggccagc aaaactaaaa aactgtatta taagtaaatg catgtatact 7500

aaactcacaa attagagctt caatttaatt atatcagtta ttaccctatg cggtgtgaaa 7560aaactcacaa attagagctt caatttaatt atatcagtta ttaccctatg cggtgtgaaa 7560

taccgcacag atgcgtaagg agaaaatacc gcatcaggaa attgtaaacg ttaatatttt 7620taccgcacag atgcgtaagg agaaaatacc gcatcaggaa attgtaaacg ttaatatttt 7620

gttaaaattc gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat 7680gttaaaattc gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat 7680

cggcaaaatc ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt 7740cggcaaaatc ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt 7740

ttggaacaag agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt 7800ttggaacaag agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt 7800

ctatcagggc gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag 7860ctatcagggc gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag 7860

gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg 7920gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg 7920

aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc 7980aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc 7980

gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc 8040gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc 8040

gctacagggc gcgtcgcgcc attcgccatt caggctgcgc aactgttggg aagggcgatc 8100gctacagggc gcgtcgcgcc attcgccatt caggctgcgc aactgttggg aagggcgatc 8100

ggtgcgggcc tcttcgctat tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt 8160ggtgcgggcc tcttcgctat tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt 8160

aagttgggta acgccagggt tttcccagtc acgacg 8196aagttgggta acgccagggt tttcccagtc acgacg 8196

<210> 25<210> 25

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 25<400> 25

cctgcattgc aagttcccac 20cctgcattgc aagttcccac 20

<210> 26<210> 26

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 26<400> 26

agtttgacag tgcccagagc 20agtttgacag tgccccagagc 20

<210> 27<210> 27

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 27<400> 27

agcctggaag gcctatctgg 20agcctggaag gcctatctgg 20

<210> 28<210> 28

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 28<400> 28

ggtcggattg gcttggtaca 20ggtcggattg gcttggtaca 20

<210> 29<210> 29

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 29<400> 29

accaccgtca acacgtacaa 20accaccgtca acacgtacaa 20

<210> 30<210> 30

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 30<400> 30

caaaggtctt gccaccgatg 20caaaggtctt gccaccgatg 20

<210> 31<210> 31

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 31<400> 31

ttcgttgcta acactccccc 20ttcgttgcta acactccccc 20

<210> 32<210> 32

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 32<400> 32

ctggttgatg gccgagttga 20ctggttgatg gccgagttga 20

<210> 33<210> 33

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 33<400> 33

ggcagattat tccggaccgt 20ggcagattat tccggaccgt 20

<210> 34<210> 34

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 34<400> 34

agtttgacag tgcccagagc 20agtttgacag tgccccagagc 20

<210> 35<210> 35

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 35<400> 35

agcctggaag gcctatctgg 20agcctggaag gcctatctgg 20

<210> 36<210> 36

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 36<400> 36

tcaacgtgtg ggagcagtac 20tcaacgtgtg ggagcagtac 20

<210> 37<210> 37

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 37<400> 37

gggctccatc tacgtcttcg 20gggctccatc tacgtcttcg 20

<210> 38<210> 38

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 38<400> 38

tggatccagg gcgagtagaa 20tggatccagg gcgagtagaa 20

<210> 39<210> 39

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 39<400> 39

tgggctcgta cgacttcaac 20tgggctcgta cgacttcaac 20

<210> 40<210> 40

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 40<400> 40

cggcgatgtt ggagtcgtat 20cggcgatgtt ggagtcgtat 20

<210> 41<210> 41

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 41<400> 41

cgagaccgac aagaccaaca 20cgagaccgac aagaccaaca 20

<210> 42<210> 42

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 42<400> 42

gaagagcacg atgagcacga 20gaagagcacg atgagcacga 20

<210> 43<210> 43

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 43<400> 43

ttggtaagac ggtgcagatg 20ttggtaagac ggtgcagatg 20

<210> 44<210> 44

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Праймер<213> Primer

<400> 44<400> 44

gtagttgatg cgttccttcc a 21gtagttgatg cgttccttcc a 21

<210> 45<210> 45

<211> 221<211> 221

<212> PRT<212> PRT

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Аминокислоты<223> Amino acids

<400> 45<400> 45

Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala

1 5 10 15 1 5 10 15

Ala Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe

20 25 30 20 25 30

Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala

35 40 45 35 40 45

Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys

50 55 60 50 55 60

Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val

65 70 75 80 65 70 75 80

Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala

85 90 95 85 90 95

Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp

100 105 110 100 105 110

Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser

115 120 125 115 120 125

Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser

130 135 140 130 135 140

Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala

145 150 155 160 145 150 155 160

Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro

165 170 175 165 170 175

Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro

180 185 190 180 185 190

Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr

195 200 205 195 200 205

Val Cys Gly Pro Gly Gly Gly Gly Ser Glu Pro Glu Ala Val Cys Gly Pro Gly Gly Gly Gly Ser Glu Pro Glu Ala

210 215 220 210 215 220

<210> 46<210> 46

<211> 666<211> 666

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Последовательность ДНК<223> DNA Sequence

<400> 46<400> 46

atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc taccaacctc 60atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc taccaacctc 60

tgcccgttcg gcgaggtctt caacgccacc cgcttcgcct ccgtctacgc ctggaaccgc 120tgcccgttcg gcgaggtctt caacgccacc cgcttcgcct ccgtctacgc ctggaaccgc 120

aagcgcatct ccaactgcgt cgccgactac agcgtcctgt acaacagcgc ctcgttctcc 180aagcgcatct ccaactgcgt cgccgactac agcgtcctgt acaacagcgc ctcgttctcc 180

accttcaagt gctacggcgt cagccccacc aagctcaacg acctgtgctt caccaacgtc 240accttcaagt gctacggcgt cagccccacc aagctcaacg acctgtgctt caccaacgtc 240

tacgccgact ccttcgtcat ccgcggcgac gaggtccgcc agatcgcccc cggccagacc 300tacgccgact ccttcgtcat ccgcggcgac gaggtccgcc agatcgcccc cggccagacc 300

ggcaagatcg ccgactacaa ctacaagctc cccgacgact tcaccggctg cgtcatcgcc 360ggcaagatcg ccgactacaa ctacaagctc cccgacgact tcaccggctg cgtcatcgcc 360

tggaacagca acaacctgga ctcgaaggtc ggcggcaact acaactacct ctaccgcctg 420tggaacagca acaacctgga ctcgaaggtc ggcggcaact acaactacct ctaccgcctg 420

ttccgcaagt cgaacctcaa gccgttcgag cgcgacatct cgaccgagat ctaccaggcc 480ttccgcaagt cgaacctcaa gccgttcgag cgcgacatct cgaccgagat ctaccaggcc 480

ggctccaccc cctgcaacgg cgtcgagggc ttcaactgct acttccccct ccagtcctac 540ggctccaccc cctgcaacgg cgtcgagggc ttcaactgct acttccccct ccagtcctac 540

ggcttccagc ccaccaacgg cgtcggctac cagccctacc gcgtcgtcgt cctctccttc 600ggcttccagc ccaccaacgg cgtcggctac cagccctacc gcgtcgtcgt cctctccttc 600

gagctcctgc acgcccccgc caccgtctgc ggccctggcg gcggcggcag cgagccggag 660gagctcctgc acgcccccgc caccgtctgc ggccctggcg gcggcggcag cgagccggag 660

gcctaa 666gcctaa 666

<210> 47<210> 47

<211> 239<211> 239

<212> PRT<212> PRT

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Аминокислоты<223> Amino acids

<400> 47<400> 47

Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala

1 5 10 15 1 5 10 15

Ala Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe

20 25 30 20 25 30

Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala

35 40 45 35 40 45

Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys

50 55 60 50 55 60

Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val

65 70 75 80 65 70 75 80

Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala

85 90 95 85 90 95

Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp

100 105 110 100 105 110

Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser

115 120 125 115 120 125

Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser

130 135 140 130 135 140

Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala

145 150 155 160 145 150 155 160

Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro

165 170 175 165 170 175

Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro

180 185 190 180 185 190

Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr

195 200 205 195 200 205

Val Cys Gly Pro Gly Gly Gly Gly Ser Ala His Ile Val Met Val Asp Val Cys Gly Pro Gly Gly Gly Gly Ser Ala His Ile Val Met Val Asp

210 215 220 210 215 220

Ala Tyr Lys Pro Thr Lys Gly Gly Gly Gly Ser Glu Pro Glu Ala Ala Tyr Lys Pro Thr Lys Gly Gly Gly Gly Ser Glu Pro Glu Ala

225 230 235 225 230 235

<210> 48<210> 48

<211> 720<211> 720

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Последовательность ДНК<223> DNA Sequence

<400> 48<400> 48

atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc taccaacctc 60atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc taccaacctc 60

tgcccgttcg gcgaggtctt caacgccacc cgcttcgcct ccgtctacgc ctggaaccgc 120tgcccgttcg gcgaggtctt caacgccacc cgcttcgcct ccgtctacgc ctggaaccgc 120

aagcgcatct ccaactgcgt cgccgactac agcgtcctgt acaacagcgc ctcgttctcc 180aagcgcatct ccaactgcgt cgccgactac agcgtcctgt acaacagcgc ctcgttctcc 180

accttcaagt gctacggcgt cagccccacc aagctcaacg acctgtgctt caccaacgtc 240accttcaagt gctacggcgt cagccccacc aagctcaacg acctgtgctt caccaacgtc 240

tacgccgact ccttcgtcat ccgcggcgac gaggtccgcc agatcgcccc cggccagacc 300tacgccgact ccttcgtcat ccgcggcgac gaggtccgcc agatcgcccc cggccagacc 300

ggcaagatcg ccgactacaa ctacaagctc cccgacgact tcaccggctg cgtcatcgcc 360ggcaagatcg ccgactacaa ctacaagctc cccgacgact tcaccggctg cgtcatcgcc 360

tggaacagca acaacctgga ctcgaaggtc ggcggcaact acaactacct ctaccgcctg 420tggaacagca acaacctgga ctcgaaggtc ggcggcaact acaactacct ctaccgcctg 420

ttccgcaagt ccaacctcaa gccgttcgag cgcgacatct cgaccgagat ctaccaggcc 480ttccgcaagt ccaacctcaa gccgttcgag cgcgacatct cgaccgagat ctaccaggcc 480

ggctccaccc cctgcaacgg cgtcgagggc ttcaactgct acttccccct ccagagctac 540ggctccaccc cctgcaacgg cgtcgagggc ttcaactgct acttccccct ccagagctac 540

ggcttccagc ccaccaacgg cgtcggctac cagccctacc gcgtcgtcgt cctctccttc 600ggcttccagc ccaccaacgg cgtcggctac cagccctacc gcgtcgtcgt cctctccttc 600

gagctcctgc acgccccggc caccgtctgc ggccctggcg gcggcggcag cgcccacatc 660gagctcctgc acgccccggc caccgtctgc ggccctggcg gcggcggcag cgcccacatc 660

gtcatggtcg acgcctacaa gccgaccaag ggcggcggcg gctcggagcc cgaggcctaa 720gtcatggtcg acgcctacaa gccgaccaag ggcggcggcg gctcggagcc cgaggcctaa 720

<210> 49<210> 49

<211> 448<211> 448

<212> PRT<212> PRT

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Аминокислоты<223> Amino acids

<400> 49<400> 49

Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala

1 5 10 15 1 5 10 15

Ala Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe

20 25 30 20 25 30

Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala

35 40 45 35 40 45

Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys

50 55 60 50 55 60

Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val

65 70 75 80 65 70 75 80

Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala

85 90 95 85 90 95

Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp

100 105 110 100 105 110

Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser

115 120 125 115 120 125

Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser

130 135 140 130 135 140

Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala

145 150 155 160 145 150 155 160

Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro

165 170 175 165 170 175

Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro

180 185 190 180 185 190

Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr

195 200 205 195 200 205

Val Cys Gly Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Lys Val Cys Gly Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Lys

210 215 220 210 215 220

Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro

225 230 235 240 225 230 235 240

Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser

245 250 255 245 250 255

Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp

260 265 270 260 265 270

Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn

275 280 285 275 280 285

Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val

290 295 300 290 295 300

Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu

305 310 315 320 305 310 315 320

Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys

325 330 335 325 330 335

Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr

340 345 350 340 345 350

Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr

355 360 365 355 360 365

Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu

370 375 380 370 375 380

Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu

385 390 395 400 385 390 395 400

Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys

405 410 415 405 410 415

Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu

420 425 430 420 425 430

Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly

435 440 445 435 440 445

<210> 50<210> 50

<211> 1347<211> 1347

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Последовательность ДНК<223> DNA Sequence

<400> 50<400> 50

atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc taccaacctc 60atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc taccaacctc 60

tgcccgttcg gcgaggtctt caacgccacc cgcttcgcct ccgtctacgc ctggaaccgc 120tgcccgttcg gcgaggtctt caacgccacc cgcttcgcct ccgtctacgc ctggaaccgc 120

aagcgcatct ccaactgcgt cgccgactac agcgtcctgt acaacagcgc ctcgttctcc 180aagcgcatct ccaactgcgt cgccgactac agcgtcctgt acaacagcgc ctcgttctcc 180

accttcaagt gctacggcgt cagccccacc aagctcaacg acctgtgctt caccaacgtc 240accttcaagt gctacggcgt cagccccacc aagctcaacg acctgtgctt caccaacgtc 240

tacgccgact ccttcgtcat ccgcggcgac gaggtccgcc agatcgcccc cggccagacc 300tacgccgact ccttcgtcat ccgcggcgac gaggtccgcc agatcgcccc cggccagacc 300

ggcaagatcg ccgactacaa ctacaagctc cccgacgact tcaccggctg cgtcatcgcc 360ggcaagatcg ccgactacaa ctacaagctc cccgacgact tcaccggctg cgtcatcgcc 360

tggaacagca acaacctgga ctcgaaggtc ggcggcaact acaactacct ctaccgcctg 420tggaacagca acaacctgga ctcgaaggtc ggcggcaact acaactacct ctaccgcctg 420

ttccgcaagt cgaacctcaa gccgttcgag cgcgacatct cgaccgagat ctaccaggcc 480ttccgcaagt cgaacctcaa gccgttcgag cgcgacatct cgaccgagat ctaccaggcc 480

ggctccaccc cctgcaacgg cgtcgagggc ttcaactgct acttccccct ccagtcctac 540ggctccaccc cctgcaacgg cgtcgagggc ttcaactgct acttccccct ccagtcctac 540

ggcttccagc ccaccaacgg cgtcggctac cagccctacc gcgtcgtcgt cctctccttc 600ggcttccagc ccaccaacgg cgtcggctac cagccctacc gcgtcgtcgt cctctccttc 600

gagctcctgc acgcccccgc caccgtctgc ggccctggcg gcggcggcag cggcggcggc 660gagctcctgc acgcccccgc caccgtctgc ggccctggcg gcggcggcag cggcggcggc 660

ggcagcgaca agacccacac ctgcccgccc tgccccgccc cggaggccgc tggcggcccc 720ggcagcgaca agacccacac ctgcccgccc tgccccgccc cggaggccgc tggcggcccc 720

agcgtcttcc tcttcccgcc caagccgaag gacaccctga tgatctcgcg caccccggag 780agcgtcttcc tcttcccgcc caagccgaag gacaccctga tgatctcgcg caccccggag 780

gtcacctgcg tcgtcgtcga cgtcagccac gaggacccgg aggtcaagtt caactggtac 840gtcacctgcg tcgtcgtcga cgtcagccac gaggacccgg aggtcaagtt caactggtac 840

gtcgacggcg tcgaggtcca caacgccaag accaagccgc gcgaggagca gtacaactcg 900gtcgacggcg tcgaggtcca caacgccaag accaagccgc gcgaggagca gtacaactcg 900

acctaccgcg tcgtctccgt cctcaccgtc ctgcaccagg actggctcaa cggcaaggag 960acctaccgcg tcgtctccgt cctcaccgtc ctgcaccagg actggctcaa cggcaaggag 960

tacaagtgca aggtctcgaa caaggccctg cccgccccga tcgagaagac catctcgaag 1020tacaagtgca aggtctcgaa caaggccctg cccgccccga tcgagaagac catctcgaag 1020

gccaagggcc agccccgcga gccccaggtc tacaccctcc cgcccagccg cgacgagctg 1080gccaagggcc agccccgcga gccccaggtc tacaccctcc cgcccagccg cgacgagctg 1080

accaagaacc aggtctcgct cacctgcctg gtcaagggct tctacccctc cgacatcgcc 1140accaagaacc aggtctcgct cacctgcctg gtcaagggct tctacccctc cgacatcgcc 1140

gtcgagtggg agagcaacgg ccagccggag aacaactaca agaccacccc gcccgtcctg 1200gtcgagtggg agagcaacgg ccagccggag aacaactaca agaccacccc gcccgtcctg 1200

gactccgacg gctccttctt cctctacagc aagctgaccg tcgacaagtc gcgctggcag 1260gactccgacg gctccttctt cctctacagc aagctgaccg tcgacaagtc gcgctggcag 1260

cagggcaacg tcttcagctg ctcggtcatg cacgaggccc tgcacaacca ctacacccag 1320cagggcaacg tcttcagctg ctcggtcatg cacgaggccc tgcacaacca ctacacccag 1320

aagtccctca gcctgtcgcc cggctaa 1347aagtccctca gcctgtcgcc cggctaa 1347

<210> 51<210> 51

<211> 448<211> 448

<212> PRT<212> PRT

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Аминокислоты<223> Amino acids

<400> 51<400> 51

Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala

1 5 10 15 1 5 10 15

Ala Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Ala Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala

20 25 30 20 25 30

Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu

35 40 45 35 40 45

Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser

50 55 60 50 55 60

His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu

65 70 75 80 65 70 75 80

Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr

85 90 95 85 90 95

Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn

100 105 110 100 105 110

Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro

115 120 125 115 120 125

Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln

130 135 140 130 135 140

Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val

145 150 155 160 145 150 155 160

Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val

165 170 175 165 170 175

Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro

180 185 190 180 185 190

Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr

195 200 205 195 200 205

Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val

210 215 220 210 215 220

Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu

225 230 235 240 225 230 235 240

Ser Pro Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Thr Asn Leu Ser Pro Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Thr Asn Leu

245 250 255 245 250 255

Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr

260 265 270 260 265 270

Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val

275 280 285 275 280 285

Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser

290 295 300 290 295 300

Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser

305 310 315 320 305 310 315 320

Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr

325 330 335 325 330 335

Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly

340 345 350 340 345 350

Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly

355 360 365 355 360 365

Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro

370 375 380 370 375 380

Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro

385 390 395 400 385 390 395 400

Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr

405 410 415 405 410 415

Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val

420 425 430 420 425 430

Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro

435 440 445 435 440 445

<210> 52<210> 52

<211> 1347<211> 1347

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Последовательность ДНК<223> DNA Sequence

<400> 52<400> 52

atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc tgacaagacc 60atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc tgacaagacc 60

cacacctgcc cgccctgccc cgccccggag gccgctggcg gccccagcgt cttcctcttc 120cacacctgcc cgccctgccc cgccccggag gccgctggcg gccccagcgt cttcctcttc 120

ccgcccaagc cgaaggacac cctgatgatc tcgcgcaccc cggaggtcac ctgcgtcgtc 180ccgcccaagc cgaaggacac cctgatgatc tcgcgcaccc cggaggtcac ctgcgtcgtc 180

gtcgacgtca gccacgagga cccggaggtc aagttcaact ggtacgtcga cggcgtcgag 240gtcgacgtca gccacgagga cccggaggtc aagttcaact ggtacgtcga cggcgtcgag 240

gtccacaacg ccaagaccaa gccgcgcgag gagcagtaca actcgaccta ccgcgtcgtc 300gtccacaacg ccaagaccaa gccgcgcgag gagcagtaca actcgaccta ccgcgtcgtc 300

tccgtcctca ccgtcctgca ccaggactgg ctcaacggca aggagtacaa gtgcaaggtc 360tccgtcctca ccgtcctgca ccaggactgg ctcaacggca aggagtacaa gtgcaaggtc 360

tcgaacaagg ccctgcccgc cccgatcgag aagaccatct cgaaggccaa gggccagccc 420tcgaacaagg ccctgcccgc cccgatcgag aagaccatct cgaaggccaa gggccagccc 420

cgcgagcccc aggtctacac cctcccgccc agccgcgacg agctgaccaa gaaccaggtc 480cgcgagcccc aggtctacac cctcccgccc agccgcgacg agctgaccaa gaaccaggtc 480

tcgctcacct gcctggtcaa gggcttctac ccctccgaca tcgccgtcga gtgggagagc 540tcgctcacct gcctggtcaa gggcttctac ccctccgaca tcgccgtcga gtggggagagc 540

aacggccagc cggagaacaa ctacaagacc accccgcccg tcctggactc cgacggctcc 600aacggccagc cggagaacaa ctacaagacc accccgcccg tcctggactc cgacggctcc 600

ttcttcctct acagcaagct gaccgtcgac aagtcgcgct ggcagcaggg caacgtcttc 660ttcttcctct acagcaagct gaccgtcgac aagtcgcgct ggcagcaggg caacgtcttc 660

agctgctcgg tcatgcacga ggccctgcac aaccactaca cccagaagtc cctcagcctg 720agctgctcgg tcatgcacga ggccctgcac aaccactaca cccagaagtc cctcagcctg 720

tcgcccggcg gcggcggcgg cagcggcggc ggcggcagca ccaacctctg cccgttcggc 780tcgcccggcg gcggcggcgg cagcggcggc ggcggcagca ccaacctctg cccgttcggc 780

gaggtcttca acgccacccg cttcgcctcc gtctacgcct ggaaccgcaa gcgcatctcc 840gaggtcttca acgccacccg cttcgcctcc gtctacgcct ggaaccgcaa gcgcatctcc 840

aactgcgtcg ccgactacag cgtcctgtac aacagcgcct cgttctccac cttcaagtgc 900aactgcgtcg ccgactacag cgtcctgtac aacagcgcct cgttctccac cttcaagtgc 900

tacggcgtca gccccaccaa gctcaacgac ctgtgcttca ccaacgtcta cgccgactcc 960tacggcgtca gccccaccaa gctcaacgac ctgtgcttca ccaacgtcta cgccgactcc 960

ttcgtcatcc gcggcgacga ggtccgccag atcgcccccg gccagaccgg caagatcgcc 1020ttcgtcatcc gcggcgacga ggtccgccag atcgcccccg gccagaccgg caagatcgcc 1020

gactacaact acaagctccc cgacgacttc accggctgcg tcatcgcctg gaacagcaac 1080gactacaact acaagctccc cgacgacttc accggctgcg tcatcgcctg gaacagcaac 1080

aacctggact cgaaggtcgg cggcaactac aactacctct accgcctgtt ccgcaagtcg 1140aacctggact cgaaggtcgg cggcaactac aactacctct accgcctgtt ccgcaagtcg 1140

aacctcaagc cgttcgagcg cgacatctcg accgagatct accaggccgg ctccaccccc 1200aacctcaagc cgttcgagcg cgacatctcg accgagatct accaggccgg ctccaccccc 1200

tgcaacggcg tcgagggctt caactgctac ttccccctcc agtcctacgg cttccagccc 1260tgcaacggcg tcgagggctt caactgctac ttccccctcc agtcctacgg cttccagccc 1260

accaacggcg tcggctacca gccctaccgc gtcgtcgtcc tctccttcga gctcctgcac 1320accaacggcg tcggctacca gccctaccgc gtcgtcgtcc tctccttcga gctcctgcac 1320

gcccccgcca ccgtctgcgg cccttaa 1347gcccccgcca ccgtctgcgg cccttaa 1347

<210> 53<210> 53

<211> 219<211> 219

<212> PRT<212> PRT

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Аминокислоты<223> Amino acids

<400> 53<400> 53

Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala

1 5 10 15 1 5 10 15

Ala Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe

20 25 30 20 25 30

Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala

35 40 45 35 40 45

Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys

50 55 60 50 55 60

Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val

65 70 75 80 65 70 75 80

Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala

85 90 95 85 90 95

Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp

100 105 110 100 105 110

Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser

115 120 125 115 120 125

Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser

130 135 140 130 135 140

Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala

145 150 155 160 145 150 155 160

Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro

165 170 175 165 170 175

Leu Gln Ser Tyr Gly Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro

180 185 190 180 185 190

Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr

195 200 205 195 200 205

Val Cys Gly Pro Gly Ser Gly Glu Pro Glu Ala Val Cys Gly Pro Gly Ser Gly Glu Pro Glu Ala

210 215 210 215

<210> 54<210> 54

<211> 660<211> 660

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Последовательность ДНК<223> DNA Sequence

<400> 54<400> 54

atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc taccaacctc 60atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc taccaacctc 60

tgcccgttcg gcgaggtctt caacgccacc cgcttcgcct ccgtctacgc ctggaaccgc 120tgcccgttcg gcgaggtctt caacgccacc cgcttcgcct ccgtctacgc ctggaaccgc 120

aagcgcatct ccaactgcgt cgccgactac agcgtcctgt acaacagcgc ctcgttctcc 180aagcgcatct ccaactgcgt cgccgactac agcgtcctgt acaacagcgc ctcgttctcc 180

accttcaagt gctacggcgt cagccccacc aagctcaacg acctgtgctt caccaacgtc 240accttcaagt gctacggcgt cagccccacc aagctcaacg acctgtgctt caccaacgtc 240

tacgccgact ccttcgtcat ccgcggcgac gaggtccgcc agatcgcccc cggccagacc 300tacgccgact ccttcgtcat ccgcggcgac gaggtccgcc agatcgcccc cggccagacc 300

ggcaagatcg ccgactacaa ctacaagctc cccgacgact tcaccggctg cgtcatcgcc 360ggcaagatcg ccgactacaa ctacaagctc cccgacgact tcaccggctg cgtcatcgcc 360

tggaacagca acaacctgga ctcgaaggtc ggcggcaact acaactacct ctaccgcctg 420tggaacagca acaacctgga ctcgaaggtc ggcggcaact acaactacct ctaccgcctg 420

ttccgcaagt cgaacctcaa gccgttcgag cgcgacatct cgaccgagat ctaccaggcc 480ttccgcaagt cgaacctcaa gccgttcgag cgcgacatct cgaccgagat ctaccaggcc 480

ggctccaccc cctgcaacgg cgtcgagggc ttcaactgct acttccccct ccagtcctac 540ggctccaccc cctgcaacgg cgtcgagggc ttcaactgct acttccccct ccagtcctac 540

ggcttccagc ccacctacgg cgtcggctac cagccctacc gcgtcgtcgt cctctccttc 600ggcttccagc ccacctacgg cgtcggctac cagccctacc gcgtcgtcgt cctctccttc 600

gagctcctgc acgcccccgc caccgtctgc ggccctggca gcggcgagcc ggaggcctaa 660gagctcctgc acgcccccgc caccgtctgc ggccctggca gcggcgagcc ggaggcctaa 660

<210> 55<210> 55

<211> 219<211> 219

<212> PRT<212> PRT

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Аминокислоты<223> Amino acids

<400> 55<400> 55

Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala

1 5 10 15 1 5 10 15

Ala Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe

20 25 30 20 25 30

Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala

35 40 45 35 40 45

Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys

50 55 60 50 55 60

Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val

65 70 75 80 65 70 75 80

Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala

85 90 95 85 90 95

Pro Gly Gln Thr Gly Asn Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Pro Gly Gln Thr Gly Asn Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp

100 105 110 100 105 110

Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser

115 120 125 115 120 125

Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser

130 135 140 130 135 140

Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala

145 150 155 160 145 150 155 160

Gly Ser Thr Pro Cys Asn Gly Val Lys Gly Phe Asn Cys Tyr Phe Pro Gly Ser Thr Pro Cys Asn Gly Val Lys Gly Phe Asn Cys Tyr Phe Pro

165 170 175 165 170 175

Leu Gln Ser Tyr Gly Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro

180 185 190 180 185 190

Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr

195 200 205 195 200 205

Val Cys Gly Pro Gly Ser Gly Glu Pro Glu Ala Val Cys Gly Pro Gly Ser Gly Glu Pro Glu Ala

210 215 210 215

<210> 56<210> 56

<211> 660<211> 660

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Последовательность ДНК<223> DNA Sequence

<400> 56<400> 56

atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc taccaacctc 60atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc taccaacctc 60

tgcccgttcg gcgaggtctt caacgccacc cgcttcgcct ccgtctacgc ctggaaccgc 120tgcccgttcg gcgaggtctt caacgccacc cgcttcgcct ccgtctacgc ctggaaccgc 120

aagcgcatct ccaactgcgt cgccgactac agcgtcctgt acaacagcgc ctcgttctcc 180aagcgcatct ccaactgcgt cgccgactac agcgtcctgt acaacagcgc ctcgttctcc 180

accttcaagt gctacggcgt cagccccacc aagctcaacg acctgtgctt caccaacgtc 240accttcaagt gctacggcgt cagccccacc aagctcaacg acctgtgctt caccaacgtc 240

tacgccgact ccttcgtcat ccgcggcgac gaggtccgcc agatcgcccc cggccagacc 300tacgccgact ccttcgtcat ccgcggcgac gaggtccgcc agatcgcccc cggccagacc 300

ggcaacatcg ccgactacaa ctacaagctc cccgacgact tcaccggctg cgtcatcgcc 360ggcaacatcg ccgactacaa ctacaagctc cccgacgact tcaccggctg cgtcatcgcc 360

tggaacagca acaacctgga ctcgaaggtc ggcggcaact acaactacct ctaccgcctg 420tggaacagca acaacctgga ctcgaaggtc ggcggcaact acaactacct ctaccgcctg 420

ttccgcaagt cgaacctcaa gccgttcgag cgcgacatct cgaccgagat ctaccaggcc 480ttccgcaagt cgaacctcaa gccgttcgag cgcgacatct cgaccgagat ctaccaggcc 480

ggctccaccc cctgcaacgg cgtcaagggc ttcaactgct acttccccct ccagtcctac 540ggctccaccc cctgcaacgg cgtcaagggc ttcaactgct acttccccct ccagtcctac 540

ggcttccagc ccacctacgg cgtcggctac cagccctacc gcgtcgtcgt cctctccttc 600ggcttccagc ccacctacgg cgtcggctac cagccctacc gcgtcgtcgt cctctccttc 600

gagctcctgc acgcccccgc caccgtctgc ggccctggca gcggcgagcc ggaggcctaa 660gagctcctgc acgcccccgc caccgtctgc ggccctggca gcggcgagcc ggaggcctaa 660

<210> 57<210> 57

<211> 219<211> 219

<212> PRT<212> PRT

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Аминокислоты<223> Amino acids

<400> 57<400> 57

Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala

1 5 10 15 1 5 10 15

Ala Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe

20 25 30 20 25 30

Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala

35 40 45 35 40 45

Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys

50 55 60 50 55 60

Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val

65 70 75 80 65 70 75 80

Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala

85 90 95 85 90 95

Pro Gly Gln Thr Gly Thr Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Pro Gly Gln Thr Gly Thr Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp

100 105 110 100 105 110

Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser

115 120 125 115 120 125

Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser

130 135 140 130 135 140

Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala

145 150 155 160 145 150 155 160

Gly Ser Thr Pro Cys Asn Gly Val Lys Gly Phe Asn Cys Tyr Phe Pro Gly Ser Thr Pro Cys Asn Gly Val Lys Gly Phe Asn Cys Tyr Phe Pro

165 170 175 165 170 175

Leu Gln Ser Tyr Gly Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro

180 185 190 180 185 190

Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr

195 200 205 195 200 205

Val Cys Gly Pro Gly Ser Gly Glu Pro Glu Ala Val Cys Gly Pro Gly Ser Gly Glu Pro Glu Ala

210 215 210 215

<210> 58<210> 58

<211> 660<211> 660

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Последовательность ДНК<223> DNA Sequence

<400> 58<400> 58

atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc taccaacctc 60atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc taccaacctc 60

tgcccgttcg gcgaggtctt caacgccacc cgcttcgcct ccgtctacgc ctggaaccgc 120tgcccgttcg gcgaggtctt caacgccacc cgcttcgcct ccgtctacgc ctggaaccgc 120

aagcgcatct ccaactgcgt cgccgactac agcgtcctgt acaacagcgc ctcgttctcc 180aagcgcatct ccaactgcgt cgccgactac agcgtcctgt acaacagcgc ctcgttctcc 180

accttcaagt gctacggcgt cagccccacc aagctcaacg acctgtgctt caccaacgtc 240accttcaagt gctacggcgt cagccccacc aagctcaacg acctgtgctt caccaacgtc 240

tacgccgact ccttcgtcat ccgcggcgac gaggtccgcc agatcgcccc cggccagacc 300tacgccgact ccttcgtcat ccgcggcgac gaggtccgcc agatcgcccc cggccagacc 300

ggcaccatcg ccgactacaa ctacaagctc cccgacgact tcaccggctg cgtcatcgcc 360ggcaccatcg ccgactacaa ctacaagctc cccgacgact tcaccggctg cgtcatcgcc 360

tggaacagca acaacctgga ctcgaaggtc ggcggcaact acaactacct ctaccgcctg 420tggaacagca acaacctgga ctcgaaggtc ggcggcaact acaactacct ctaccgcctg 420

ttccgcaagt cgaacctcaa gccgttcgag cgcgacatct cgaccgagat ctaccaggcc 480ttccgcaagt cgaacctcaa gccgttcgag cgcgacatct cgaccgagat ctaccaggcc 480

ggctccaccc cctgcaacgg cgtcaagggc ttcaactgct acttccccct ccagtcctac 540ggctccaccc cctgcaacgg cgtcaagggc ttcaactgct acttccccct ccagtcctac 540

ggcttccagc ccacctacgg cgtcggctac cagccctacc gcgtcgtcgt cctctccttc 600ggcttccagc ccacctacgg cgtcggctac cagccctacc gcgtcgtcgt cctctccttc 600

gagctcctgc acgcccccgc caccgtctgc ggccctggca gcggcgagcc ggaggcctaa 660gagctcctgc acgcccccgc caccgtctgc ggccctggca gcggcgagcc ggaggcctaa 660

<---<---

Claims (42)

1. Генетически модифицированный аскомицетный мицелиальный гриб для продуцирования представляющего интерес экзогенного белка, причем указанный генетически модифицированный мицелиальный гриб содержит по меньшей мере одну клетку, имеющую пониженную экспрессию и/или активность KEX2 протеазы, а также пониженную экспрессию и/или активность по крайней мере 12 дополнительных протеаз, при этом по меньшей мере одна клетка содержит экзогенный полинуклеотид, кодирующий представляющий интерес белок.1. A genetically modified ascomycete filamentous fungus for producing an exogenous protein of interest, wherein said genetically modified filamentous fungus comprises at least one cell having reduced expression and/or activity of KEX2 protease, as well as reduced expression and/or activity of at least 12 additional proteases, wherein at least one cell comprises an exogenous polynucleotide encoding the protein of interest. 2. Генетически модифицированный аскомицетный мицелиальный гриб по п. 1, имеющий пониженную экспрессию и/или активность KEX2 и ALP7.2. A genetically modified ascomycete mycelial fungus according to claim 1, having reduced expression and/or activity of KEX2 and ALP7. 3. Генетически модифицированный аскомицетный мицелиальный гриб по любому из пп. 1 или 2, отличающийся тем, что KEX2 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, или по меньшей мере 80%, или по меньшей мере 85%, или по меньшей мере 90%, или по меньшей мере 95%, или по меньшей мере 99%, или 100% идентичности аминокислотной последовательности KEX2 Thermothelomyces heterothallica.3. A genetically modified ascomycete filamentous fungus according to any one of claims 1 or 2, characterized in that KEX2 comprises an amino acid sequence having at least 75%, or at least 80%, or at least 85%, or at least 90%, or at least 95%, or at least 99%, or 100% identity to the amino acid sequence of KEX2 of Thermothelomyces heterothallica . 4. Генетически модифицированный аскомицетный мицелиальный гриб по п. 3, отличающийся тем, что KEX2 Thermothelomyces heterothallica содержит аминокислоты SEQ ID NO: 14.4. A genetically modified ascomycete mycelial fungus according to claim 3, characterized in that KEX2 Thermothelomyces heterothallica contains the amino acids of SEQ ID NO: 14. 5. Генетически модифицированный аскомицетный мицелиальный гриб по любому из пп. 2-4, отличающийся тем, что ALP7 содержит аминокислотную последовательность, имеющую по меньшей мере 75%, или по меньшей мере 80%, или по меньшей мере 85%, или по меньшей мере 90%, или по меньшей мере 95%, или по меньшей мере 99%, или 100% идентичности аминокислотной последовательности ALP7 Thermothelomyces heterothallica.5. A genetically modified ascomycete filamentous fungus according to any one of claims 2 to 4, characterized in that ALP7 comprises an amino acid sequence having at least 75%, or at least 80%, or at least 85%, or at least 90%, or at least 95%, or at least 99%, or 100% identity to the amino acid sequence of ALP7 of Thermothelomyces heterothallica . 6. Генетически модифицированный аскомицетный мицелиальный гриб по п. 5, отличающийся тем, что ALP7 Thermothelomyces heterothallica содержит аминокислоты SEQ ID NO: 13.6. A genetically modified ascomycete mycelial fungus according to claim 5, characterized in that ALP7 Thermothelomyces heterothallica contains the amino acids of SEQ ID NO: 13. 7. Генетически модифицированный аскомицетный мицелиальный гриб по п. 1, имеющий сниженную экспрессию и/или активность протеазы, выбраной из группы, состоящей из ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6 и ALP4.7. A genetically modified ascomycete mycelial fungus according to claim 1, having reduced expression and/or activity of a protease selected from the group consisting of ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6 and ALP4. 8. Генетически модифицированный аскомицетный мицелиальный гриб по п. 7, отличающийся тем, что указанный аскомицет имеет пониженную экспрессию и/или активность множества протеаз, выбранных из группы, состоящей из ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6 и ALP4.8. A genetically modified ascomycete mycelial fungus according to claim 7, characterized in that said ascomycete has reduced expression and/or activity of a plurality of proteases selected from the group consisting of ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6, and ALP4. 9. Генетически модифицированный аскомицетный мицелиальный гриб по любому из пп. 1-8, имеющий пониженную экспрессию и/или активность ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6, ALP4 и KEX2.9. A genetically modified ascomycete filamentous fungus according to any one of claims 1-8, having reduced expression and/or activity of ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6, ALP4 and KEX2. 10. Генетически модифицированный аскомицетный мицелиальный гриб по любому из пп. 1-9, имеющий пониженную экспрессию и/или активность ALP1, РЕР4, ALP2, PRT1, SRP1, ALP3, РЕР1, МТР2, РЕР5, МТР4, РЕР6, ALP4, ALP7 и KEX2.10. A genetically modified ascomycete filamentous fungus according to any one of claims 1 to 9, having reduced expression and/or activity of ALP1, PEP4, ALP2, PRT1, SRP1, ALP3, PEP1, MTP2, PEP5, MTP4, PEP6, ALP4, ALP7 and KEX2. 11. Генетически модифицированный аскомицетный мицелиальный гриб по любому из пп. 1-10, имеющий пониженную экспрессию и/или активность по меньшей мере одной дополнительной протеазы, выбранной из группы, состоящей из ALP5, ALP6, SRP3, SRP5 и SRP8.11. A genetically modified ascomycete filamentous fungus according to any one of claims 1-10, having reduced expression and/or activity of at least one additional protease selected from the group consisting of ALP5, ALP6, SRP3, SRP5 and SRP8. 12. Генетически модифицированный аскомицетный мицелиальный гриб по любому из пп. 1-11, отличающийся тем, что указанный генетически модифицированный аскомицетный мицелиальный гриб продуцирует представляющий интерес белок в повышенном количестве по сравнению с количеством, продуцируемым его негенетически модифицированным исходным штаммом указанного аскомицета, культивируемым в аналогичных условиях.12. A genetically modified ascomycetous mycelial fungus according to any one of claims 1-11, characterized in that said genetically modified ascomycetous mycelial fungus produces a protein of interest in an increased amount compared to the amount produced by its non-genetically modified original strain of said ascomycete, cultivated under similar conditions. 13. Генетически модифицированный аскомицетный мицелиальный гриб по любому из пп. 1-12, отличающийся тем, что белок, продуцируемый указанным генетически модифицированным аскомицетным мицелиальным грибом, обладает повышенной стабильностью по сравнению с указанным белком, продуцируемым негенетически модифицированным исходным штаммом указанного аскомицетного мицелиального гриба, культивируемым в аналогичных условиях.13. A genetically modified ascomycetous mycelial fungus according to any one of claims 1-12, characterized in that the protein produced by said genetically modified ascomycetous mycelial fungus has increased stability compared to said protein produced by a non-genetically modified original strain of said ascomycetous mycelial fungus, cultivated under similar conditions. 14. Генетически модифицированный аскомицетный мицелиальный гриб по любому из пп. 1-13, отличающийся тем, что указанный аскомицетный мицелиальный гриб относится к роду, принадлежащему к Pezizomycotina.14. A genetically modified ascomycetous mycelial fungus according to any one of claims 1-13, characterized in that said ascomycetous mycelial fungus belongs to a genus belonging to Pezizomycotina . 15. Генетически модифицированный аскомицетный мицелиальный гриб по п. 14, отличающийся тем, что указанный аскомицетный мицелиальный гриб относится к роду, выбранному из группы, состоящей из Thermothelomyces, Myceliophthora, Trichoderma, Aspergillus, Penicillium, Rasamsonia, Chrysosporium, Corynascus, Fusarium, Neurospora и Talaromyces.15. A genetically modified ascomycetous mycelial fungus according to claim 14, characterized in that said ascomycetous mycelial fungus belongs to a genus selected from the group consisting of Thermothelomyces, Myceliophthora, Trichoderma, Aspergillus, Penicillium, Rasamsonia, Chrysosporium, Corynascus, Fusarium, Neurospora and Talaromyces . 16. Генетически модифицированный аскомицетный мицелиальный гриб по п. 15, отличающийся тем, что указанный аскомицетный мицелиальный гриб относится к виду, выбранному из группы, состоящей из Thermothelomyces heterothallica, Myceliophthora lutea, Aspergillus nidulans, Aspergillus funiculosus, Aspergillus niger, Aspergillus oryzae, Trichoderma reesei, Trichoderma harzianum, Trichoderma longibrachiatum, Trichoderma viride, Rasamsonia emersonii, Penicillium chrysogenum, Penicillium verrucosum, Sporotrichum thermophile, Corynascus fumimontanus, Corynascus thermophilus, Chrysosporium lucknowense, Fusarium graminearum, Fusarium venenatum, Neurospora crassa и Talaromyces piniphilus.16. The genetically modified ascomycetous mycelial fungus of claim 15, wherein said ascomycetous mycelial fungus is a species selected from the group consisting of Thermothelomyces heterothallica, Myceliophthora lutea, Aspergillus nidulans, Aspergillus funiculosus, Aspergillus niger, Aspergillus oryzae, Trichoderma reesei, Trichoderma harzianum, Trichoderma longibrachiatum, Trichoderma viride, Rasamsonia emersonii, Penicillium chrysogenum, Penicillium verrucosum, Sporotrichum thermophile, Corynascus fumimontanus, Corynascus thermophilus, Chrysosporium lucknowense, Fusarium graminearum, Fusarium venenatum, Neurospora crassa and Talaromyces piniphilus . 17. Генетически модифицированный аскомицетный мицелиальный гриб по п. 16, отличающийся тем, что указанный аскомицетный мицелиальный гриб представляет собой штамм Thermothelomyces heterothallica, содержащий последовательность рДНК, имеющую по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или 100% идентичности последовательности нуклеиновой кислоты, приведенной в SEQ ID NO: 20.17. A genetically modified ascomycetous filamentous fungus according to claim 16, characterized in that said ascomycetous filamentous fungus is a strain of Thermothelomyces heterothallica containing an rDNA sequence having at least 95%, or at least 96%, or at least 97%, or at least 98%, or at least 99%, or 100% identity to the nucleic acid sequence set forth in SEQ ID NO: 20. 18. Генетически модифицированный аскомицетный мицелиальный гриб по п. 17, отличающийся тем, что указанный аскомицетный мицелиальный гриб представляет собой Thermothelomyces heterothallica C1.18. A genetically modified ascomycetous mycelial fungus according to claim 17, characterized in that said ascomycetous mycelial fungus is Thermothelomyces heterothallica C1. 19. Генетически модифицированный аскомицетный мицелиальный гриб по любому из пп. 1-18, отличающийся тем, что по меньшей мере один экзогенный полинуклеотид представляет собой ДНК-конструкт или вектор экспрессии, дополнительно содержащий по меньшей мере один регуляторный элемент, функциональный в указанном аскомицетном мицелиальном грибе.19. A genetically modified ascomycetous filamentous fungus according to any one of claims 1-18, characterized in that at least one exogenous polynucleotide is a DNA construct or expression vector, additionally containing at least one regulatory element functional in said ascomycetous filamentous fungus. 20. Генетически модифицированный аскомицетный мицелиальный гриб по любому из пп. 1-19, отличающийся тем, что представляющий интерес белок выбран из группы, состоящей из антигена, антитела, фермента, вакцины и структурного белка.20. A genetically modified ascomycete mycelial fungus according to any one of claims 1-19, characterized in that the protein of interest is selected from the group consisting of an antigen, an antibody, an enzyme, a vaccine, and a structural protein. 21. Генетически модифицированный аскомицетный мицелиальный гриб по п. 20, отличающийся тем, что представляющий интерес белок представляет собой антитело.21. A genetically modified ascomycete mycelial fungus according to claim 20, characterized in that the protein of interest is an antibody. 22. Генетически модифицированный аскомицетный мицелиальный гриб по любому из пп. 1-20, отличающийся тем, что представляющий интерес белок слит с меткой.22. A genetically modified ascomycete mycelial fungus according to any one of claims 1-20, characterized in that the protein of interest is fused to a label. 23. Генетически модифицированный аскомицетный мицелиальный гриб по п. 22, отличающийся тем, что метка выбрана из группы, состоящей из Spytag, НА-метки, хитин-связывающего белка (СВР), мальтозо-связывающего белка (МВР), стреп-тега (Strep-tag), глутатион-8-трансферазы (ГСТ), метки FLAG, С-метки, метки ALFA, метки V5, метки Мус, метки Spot, метки Т7, метки NE и полигистидиновой (поли(His)) метки.23. A genetically modified ascomycete mycelial fungus according to claim 22, characterized in that the label is selected from the group consisting of Spytag, HA-label, chitin-binding protein (CBP), maltose-binding protein (MBP), Strep-tag, glutathione-8-transferase (GST), FLAG-label, C-label, ALFA-label, V5-label, Myc-label, Spot-label, T7-label, NE-label, and polyhistidine (poly(His))-label. 24. Генетически модифицированный аскомицетный мицелиальный гриб по п. 20, отличающийся тем, что представляющий интерес белок представляет собой вирусный компонент.24. A genetically modified ascomycete mycelial fungus according to claim 20, characterized in that the protein of interest is a viral component. 25. Генетически модифицированный аскомицетный мицелиальный гриб по п. 24, отличающийся тем, что вирусный компонент представляет собой рецептор-связывающий домен (RBD) спайкового домена SARS-CoV2 или его фрагмент.25. A genetically modified ascomycete mycelial fungus according to claim 24, characterized in that the viral component is the receptor-binding domain (RBD) of the SARS-CoV2 spike domain or a fragment thereof. 26. Генетически модифицированный аскомицетный мицелиальный гриб по любому из пп. 22-25, отличающийся тем, что представляющий интерес белок содержит аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55 и SEQ ID NO: 57.26. A genetically modified ascomycete filamentous fungus according to any one of claims 22-25, characterized in that the protein of interest comprises an amino acid sequence selected from the group consisting of SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55 and SEQ ID NO: 57. 27. Генетически модифицированный аскомицетный мицелиальный гриб по п. 24, отличающийся тем, что вирусный компонент представляет собой антигенный белок вируса лихорадки долины Рифт (RVFV).27. A genetically modified ascomycete mycelial fungus according to claim 24, characterized in that the viral component is an antigenic protein of the Rift Valley fever virus (RVFV). 28. Генетически модифицированный аскомицетный мицелиальный гриб по п. 24, отличающийся тем, что вирусный компонент представляет собой белок вируса гриппа.28. A genetically modified ascomycete mycelial fungus according to claim 24, characterized in that the viral component is an influenza virus protein. 29. Генетически модифицированный аскомицетный мицелиальный гриб по п. 20, отличающийся тем, что представляющий интерес белок представляет собой фибриноген.29. A genetically modified ascomycete mycelial fungus according to claim 20, characterized in that the protein of interest is fibrinogen. 30. Способ получения генетически модифицированного аскомицетного мицелиального гриба, способного продуцировать представляющий интерес белок, включающий трансформацию по меньшей мере одной клетки гриба по меньшей мере одним экзогенным полинуклеотидом, кодирующим представляющий интерес белок; при этом указанная по меньшей мере одна клетка гриба имеет пониженную экспрессию и/или протеазную активность KEX2 протеазы и не менее 12 дополнительных протеаз.30. A method for producing a genetically modified ascomycete filamentous fungus capable of producing a protein of interest, comprising transforming at least one fungal cell with at least one exogenous polynucleotide encoding the protein of interest; wherein said at least one fungal cell has reduced expression and/or protease activity of KEX2 protease and at least 12 additional proteases. 31. Способ по п. 30, дополнительно включающий конструирование указанного гриба с ингибированной экспрессией и/или протеазной активностью ALP7.31. The method of claim 30, further comprising engineering said fungus with inhibited expression and/or protease activity of ALP7. 32. Способ по любому из пп. 30, 31, отличающийся тем, что указанный генетически модифицированный аскомицетный мицелиальный гриб продуцирует представляющий интерес белок в повышенном количестве по сравнению с количеством, продуцируемым соответствующим исходным нетрансформированным штаммом гриба, культивируемым в аналогичных условиях.32. The method according to any one of claims 30, 31, characterized in that said genetically modified ascomycete mycelial fungus produces the protein of interest in an increased amount compared to the amount produced by the corresponding original non-transformed strain of the fungus, cultivated under similar conditions. 33. Способ по любому из пп. 30-32, отличающийся тем, что указанный аскомицетный мицелиальный гриб относится к роду, принадлежащему к Pezizomycotina.33. The method according to any one of paragraphs 30-32, characterized in that the said ascomycete mycelial fungus belongs to a genus belonging to Pezizomycotina . 34. Способ по п. 33, отличающийся тем, что указанный аскомицетный мицелиальный гриб относится к роду, выбранному из группы, состоящей из Thermothelomyces, Myceliophthora, Trichoderma, Aspergillus, Penicillium, Rasamsonia, Chrysosporium, Corynascus, Fusarium, Neurospora и Talaromyces.34. The method according to claim 33, characterized in that said ascomycete mycelial fungus belongs to a genus selected from the group consisting of Thermothelomyces, Myceliophthora, Trichoderma, Aspergillus, Penicillium, Rasamsonia, Chrysosporium, Corynascus, Fusarium, Neurospora and Talaromyces . 35. Способ по n. 34, отличающийся тем, что указанный аскомицетный мицелиальный гриб принадлежит к виду, выбранному из группы, состоящей из Thermothelomyces heterothallica, Myceliophthora lutea, Aspergillus nidulans, Aspergillus funiculosus, Aspergillus niger, Aspergillus oryzae, Trichoderma reesei, Trichoderma harzianum, Trichoderma longibrachiatum, Trichoderma viride, Rasamsonia emersonii, Penicillium chrysogenum, Penicillium verrucosum, Sporotrichum thermophile, Corynascus fumimontanus, Corynascus thermophilus, Chrysosporium lucknowense, Fusarium graminearum, Fusarium venenatum, Neurospora crassa и Talaromyces piniphilus.35. The method according to No. 34, characterized in that the said ascomycete mycelial fungus belongs to a species selected from the group consisting of Thermothelomyces heterothallica, Myceliophthora lutea, Aspergillus nidulans, Aspergillus funiculosus, Aspergillus niger, Aspergillus oryzae, Trichoderma reesei, Trichoderma harzianum, Trichoderma longibrachiatum, Trichoderma viride, Rasamsonia emersonii, Penicillium chrysogenum, Penicillium verrucosum, Sporotrichum thermophile, Corynascus fumimontanus, Corynascus thermophilus, Chrysosporium lucknowense, Fusarium graminearum, Fusarium venenatum, Neurospora crassa and Talaromyces piniphilus . 36. Способ по n. 35, отличающийся тем, что указанный аскомицетный мицелиальный гриб представляет собой штамм Thermothelomyces heterothallica, содержащий последовательность рДНК, имеющую по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или 100% идентичности последовательности нуклеиновой кислоты, представленной в SEQ ID NO: 20.36. The method according to item 35, characterized in that said ascomycetous filamentous fungus is a strain of Thermothelomyces heterothallica containing an rDNA sequence having at least 95%, or at least 96%, or at least 97%, or at least 98%, or at least 99%, or 100% identity to the nucleic acid sequence presented in SEQ ID NO: 20. 37. Способ по п. 36, отличающийся тем, что указанный аскомицетный мицелиальный гриб представляет собой Thermothelomyces heterothallica C1.37. The method according to claim 36, characterized in that said ascomycete mycelial fungus is Thermothelomyces heterothallica C1. 38. Способ получения по меньшей мере одного представляющего интерес белка, включающий культивирование генетически модифицированного аскомицетного мицелиального гриба по любому из пп. 1-29 в подходящей среде и выделение продуцируемого представляющего интерес белка.38. A method for producing at least one protein of interest, comprising culturing a genetically modified ascomycete filamentous fungus according to any one of claims 1-29 in a suitable medium and isolating the produced protein of interest. 39. Способ по п. 38, отличающийся тем, что среда содержит источник углерода, выбранный из группы, состоящей из глюкозы, сахарозы, ксилозы, арабинозы, галактозы, фруктозы, лактозы, целлобиозы, глицерина и любой их комбинации.39. The method according to claim 38, characterized in that the medium contains a carbon source selected from the group consisting of glucose, sucrose, xylose, arabinose, galactose, fructose, lactose, cellobiose, glycerol and any combination thereof. 40. Способ по любому из пп. 30-39, отличающийся тем, что по меньшей мере один представляющий интерес белок представляет собой вирусный компонент.40. The method according to any one of claims 30-39, characterized in that at least one protein of interest is a viral component. 41. Способ по п. 40, отличающийся тем, что вирусный компонент относится к коронавирусу.41. The method according to claim 40, characterized in that the viral component relates to a coronavirus. 42. Способ по п. 41, отличающийся тем, что коронавирус представляет собой SARS-CoV-2.42. The method according to paragraph 41, characterized in that the coronavirus is SARS-CoV-2.
RU2022131841A 2020-05-14 2021-05-13 Modified filamentous fungi for production of exogenous proteins RU2845387C1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US63/024,550 2020-05-14

Publications (1)

Publication Number Publication Date
RU2845387C1 true RU2845387C1 (en) 2025-08-18

Family

ID=

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013102674A2 (en) * 2012-01-05 2013-07-11 Novartis International Pharmaceutical Ltd. Protease deficient filamentous fungal cells and methods of use thereof
WO2015004241A2 (en) * 2013-07-10 2015-01-15 Novartis Ag Multiple proteases deficient filamentous fungal cells and methods of use thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013102674A2 (en) * 2012-01-05 2013-07-11 Novartis International Pharmaceutical Ltd. Protease deficient filamentous fungal cells and methods of use thereof
WO2015004241A2 (en) * 2013-07-10 2015-01-15 Novartis Ag Multiple proteases deficient filamentous fungal cells and methods of use thereof

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LI, D. et al., Methods for genetic transformation of filamentous fungi, Microbial Cell Factories, 2017, 16, 168. В. В. КУЗНЕЦОВ и др., Генетически модифицированные организмы и полученные из них продукты: реальные и потенциальные риски, Российский химический журнал, 2005, т. 49, no.4, стр. 70-83. *
LI, X. et al., Improving cellulases production by Myceliophthora thermophila through disruption of protease genes, Biotechnology letters, February 2020, 42, pp. 219-229. *

Similar Documents

Publication Publication Date Title
AU2018280116B2 (en) Enhanced modified viral capsid proteins
KR102274445B1 (en) Methods for genomic integration
CN102002105B (en) Gene, expression vector, expression method, expression cell and application of human papilloma virus (HPV) 16 E7E6 fusion protein
AU2016363696B2 (en) Single variable domain T-cell receptors
US20040013648A1 (en) Vector system
US20030167538A1 (en) Use of the maize x112 mutant ahas 2 gene and imidazolinone herbicides for selection of transgenic monocots, maize, rice and wheat plants resistant to the imidazolinone herbicides
CN101842479A (en) Signal sequences and co-expressed chaperones for improving protein production in a host cell
CN112204147A (en) Plant transcriptional regulation system based on Cpf1
CA3109035A1 (en) Microorganisms engineered to use unconventional sources of nitrogen
KR102287880B1 (en) A method for modifying a target site of double-stranded DNA in a cell
US6130070A (en) Induction promoter gene and secretory signal gene usable in Schizosaccharomyces pombe, expression vectors having the same, and use thereof
KR102898438B1 (en) Use of lentivector-transduced T-RAPA cells to alleviate lysosomal storage diseases
US20040132133A1 (en) Methods and compositions for the production, identification and purification of fusion proteins
CN102286512A (en) Multi-fragment deoxyribose nucleic acid (DNA) series connection recombination assembly method based on site-specific recombination
KR20230011965A (en) Modified Filamentous Fungi for Production of Exogenous Proteins
CN100577807C (en) Promoters for epidermal-specific transgene expression in plants
RU2845387C1 (en) Modified filamentous fungi for production of exogenous proteins
KR20140004744A (en) Gene cluster for biosynthesis of cycloclavine
CN110423736B (en) Base editing tool, application thereof and method for editing wide-window and non-sequence preference bases in eukaryotic cells
CN111518838A (en) Primer and kit for editing single-base gene of eukaryotic cell, use method and application
TW202228728A (en) Compositions and methods for simultaneously modulating expression of genes
KR20220116173A (en) Precise introduction of DNA or mutations into the genome of wheat
KR20220116485A (en) Improved genome editing using paired nickases
CN111378626B (en) CHO cell line, construction method, recombinant protein expression system and application
US20040077573A1 (en) Method for regulating the activity of an expression product of a gene transferred into living body