[go: up one dir, main page]

EA046157B1 - COMPOSITIONS AND METHODS FOR SELECTIVE REGULATION OF GENE EXPRESSION - Google Patents

COMPOSITIONS AND METHODS FOR SELECTIVE REGULATION OF GENE EXPRESSION Download PDF

Info

Publication number
EA046157B1
EA046157B1 EA202193162 EA046157B1 EA 046157 B1 EA046157 B1 EA 046157B1 EA 202193162 EA202193162 EA 202193162 EA 046157 B1 EA046157 B1 EA 046157B1
Authority
EA
Eurasian Patent Office
Prior art keywords
certain embodiments
seq
scn1a
dbd
etf
Prior art date
Application number
EA202193162
Other languages
Russian (ru)
Inventor
Стефани Тальятела
Энн Таненхаус
Картик Рамамуртхи
Эндрю Янг
Дэвид Оберкофлер
Original Assignee
Инкоудид Терапьютикс, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Инкоудид Терапьютикс, Инк. filed Critical Инкоудид Терапьютикс, Инк.
Publication of EA046157B1 publication Critical patent/EA046157B1/en

Links

Abstract

) В настоящем изобретении представлены сконструированные факторы транскрипции для селективной активации SCNla и их применение для лечения заболеваний и нарушений, таких как синдром Драве. Также представлены сайты связывания микроРНК и их применение для селективной экспрессии в парвальбумин-содержащих нейронах.) The present invention provides engineered transcription factors for selective activation of SCN1a and their use in the treatment of diseases and disorders such as Dravet syndrome. Also provided are microRNA binding sites and their use for selective expression in parvalbumin-containing neurons.

Description

СсылкаLink

По заявке на настоящий патент испрашивается приоритет в соответствии с предварительной заявкой на патент США № 62/854238, поданной 29 мая 2019 г.; предварительной заявкой на патент США № 62/857727, поданной 5 июня 2019 г.; и предварительной заявкой на патент США № 63/008569, поданной 10 апреля 2020 г., каждая из которых полностью включена в настоящий документ посредством ссылки.This patent application claims priority to U.S. Provisional Patent Application No. 62/854,238, filed May 29, 2019; US Provisional Patent Application No. 62/857727, filed June 5, 2019; and U.S. Provisional Patent Application No. 63/008569, filed April 10, 2020, each of which is incorporated herein by reference in its entirety.

Перечень последовательностейList of sequences

Настоящая заявка содержит Перечень последовательностей, который был представлен в электронном виде в формате ASCII и полностью включен в настоящий документ посредством ссылки. Указанная копия ASCII, созданная 28 мая 2020 г., называется 46482-724_601_SL.txt и имеет размер 418483 байта.This application contains a Sequence Listing that has been submitted electronically in ASCII format and is incorporated herein by reference in its entirety. The ASCII copy in question, created on May 28, 2020, is called 46482-724_601_SL.txt and is 418483 bytes in size.

Предшествующий уровень техники настоящего изобретенияBACKGROUND OF THE INVENTION

Широкий спектр заболеваний человека связан с аномальной экспрессией генов. В некоторых случаях генетическая мутация в гене вызывает нарушение его регуляции, подавление или отсутствие экспрессии вообще, что приводит к гаплонедостаточности. В некоторых случаях генетическая мутация в гене вызывает его активацию, что приводит к сверхэкспрессии гена. При лечении генетических нарушений или заболеваний существует множество проблем. Один из подходов - генная терапия, которая включает в себя терапевтическую доставку нуклеиновой кислоты в клетки пациента. Тем не менее, различные проблемы, связанные с генной терапией, остаются нерешенными, такие как нежелательный иммунный ответ, вызванный генной терапией, нецелевые эффекты, ограничения клонирующей способности носителей генной терапии (например, вирусов), поддержание терапевтического эффекта в течение более длительного периода времени и т.д. Центральная нервная система (ЦНС) ставит множество уникальных задач для разработки терапии, направленной на устранение основного нарушения экспрессии гена и/или белка. Хотя существуют лекарственные средства, которые помогают управлять симптомами заболеваний/нарушений ЦНС, многие заболевания/нарушения ЦНС, например, синдром Драве, не имеют специальных способов лечения или устранения. Таким образом, существует потребность в новых композициях и способах, способных модулировать экспрессию любого эндогенного гена, чтобы помочь обратить вспять эффекты заболевания или нарушения, в частности, в терапии со сниженной иммуногенностью, уменьшенными нецелевыми эффектами, повышенной специфичностью для целевого гена и/или повышенной терапевтической эффективностью.A wide range of human diseases are associated with abnormal gene expression. In some cases, a genetic mutation in a gene causes its dysregulation, suppression, or lack of expression at all, resulting in haploinsufficiency. In some cases, a genetic mutation in a gene causes it to become activated, resulting in overexpression of the gene. There are many challenges when treating genetic disorders or diseases. One approach is gene therapy, which involves the therapeutic delivery of a nucleic acid into a patient's cells. However, various problems associated with gene therapy remain unresolved, such as unwanted immune response caused by gene therapy, off-target effects, limitations in the cloning ability of gene therapy carriers (such as viruses), maintenance of therapeutic effect over a longer period of time, and etc. The central nervous system (CNS) poses many unique challenges to the development of therapies that address the underlying disorder of gene and/or protein expression. Although there are medications that help manage the symptoms of CNS diseases/disorders, many CNS diseases/disorders, such as Dravet syndrome, have no specific treatment or cure. Thus, there is a need for new compositions and methods capable of modulating the expression of any endogenous gene to help reverse the effects of a disease or disorder, in particular, therapies with reduced immunogenicity, reduced off-target effects, increased specificity for the target gene and/or increased therapeutic efficiency.

Сущность настоящего изобретенияSummary of the present invention

Согласно одному аспекту в настоящей заявке представлена кассета экспрессии, содержащая последовательность, кодирующую не встречающийся в природе фактор транскрипции, который увеличивает экспрессию гена SCN1A в клетке, причем не встречающийся в природе фактор транскрипции содержит ДНК-связывающий домен (DBD), функционально связанный по меньшей мере с двумя активирующими транскрипцию доменами (TAD) следующим образом: TAD1-TAD2-DBD, DBD-TAD3-TAD4 или TAD1TAD2-DBD-TAD3-TAD4. Согласно определенным вариантам осуществления TAD1, TAD2, TAD3 и TAD4 независимо выбраны из следующего: VP16, VP64, Viper, CITED2, CITED4, CREB3 или их функциональных фрагментов. Согласно определенным вариантам осуществления TAD1 и TAD2 представляют собой один и тот же TAD. Согласно определенным вариантам осуществления TAD1 и TAD2 представляют собой CITED2 или его функциональный фрагмент. Согласно определенным вариантам осуществления TAD1 и TAD2 представляют собой CITED4 или его функциональный фрагмент. Согласно определенным вариантам осуществления TAD3 и TAD4 представляют собой один и тот же TAD. Согласно определенным вариантам осуществления TAD3 и TAD4 представляют собой CITED2 или его функциональный фрагмент. Согласно определенным вариантам осуществления TAD3 и TAD4 представляют собой CITED4 или его функциональный фрагмент. Согласно определенным вариантам осуществления TAD1, TAD2, TAD3 и TAD4 представляют собой один и тот же TAD. Согласно определенным вариантам осуществления TAD1, TAD2, TAD3 и TAD4 представляют собой CITED2 или его функциональный фрагмент. Согласно определенным вариантам осуществления TAD1, TAD2, TAD3 и TAD4 представляют собой CITED4 или его функциональный фрагмент. Согласно определенным вариантам осуществления линкер отсутствует по меньшей мере между двумя доменами TAD.In one aspect, the present application provides an expression cassette comprising a sequence encoding a non-naturally occurring transcription factor that increases expression of the SCN1A gene in a cell, wherein the non-naturally occurring transcription factor contains a DNA binding domain (DBD) operably linked to at least with two transcription-activating domains (TADs) as follows: TAD1-TAD2-DBD, DBD-TAD3-TAD4, or TAD1TAD2-DBD-TAD3-TAD4. In certain embodiments, TAD1, TAD2, TAD3, and TAD4 are independently selected from the following: VP16, VP64, Viper, CITED2, CITED4, CREB3, or functional fragments thereof. In certain embodiments, TAD1 and TAD2 are the same TAD. In certain embodiments, TAD1 and TAD2 are CITED2 or a functional fragment thereof. In certain embodiments, TAD1 and TAD2 are CITED4 or a functional fragment thereof. In certain embodiments, TAD3 and TAD4 are the same TAD. In certain embodiments, TAD3 and TAD4 are CITED2 or a functional fragment thereof. In certain embodiments, TAD3 and TAD4 are CITED4 or a functional fragment thereof. In certain embodiments, TAD1, TAD2, TAD3, and TAD4 are the same TAD. In certain embodiments, TAD1, TAD2, TAD3, and TAD4 are CITED2 or a functional fragment thereof. In certain embodiments, TAD1, TAD2, TAD3, and TAD4 are CITED4 or a functional fragment thereof. In certain embodiments, there is no linker between at least two TAD domains.

Согласно определенным вариантам осуществления существует линкер по меньшей мере между двумя доменами TAD. Согласно определенным вариантам осуществления линкер содержит или состоит из GGSGGGSG (SEQ ID NO: 177) или GGSGGGSGGGSGGGSG (SEQ ID NO: 178).In certain embodiments, there is a linker between at least two TAD domains. In certain embodiments, the linker comprises or consists of GGSGGGSG (SEQ ID NO: 177) or GGSGGGSGGGSGGGSG (SEQ ID NO: 178).

Согласно определенным вариантам осуществления DBD связывается с областью генома, содержащей 18-27 нуклеотидов.In certain embodiments, the DBD binds to a region of the genome containing 18-27 nucleotides.

Согласно определенным вариантам осуществления DBD характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления DBD характеризуется идентичностью последовательности, составляющей по меньшей мере 90%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления каждый из DBD и по меньшей мере двух TAD характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к их ближайшим человеческим аналогам. Согласно определенным вариантам осуществления каждый из DBD и по меньшей мере двух TAD характеризуется идентичностью последовательности, составIn certain embodiments, the DBD has at least 80% sequence identity to its closest human counterpart. In certain embodiments, the DBD has at least 90% sequence identity to its closest human counterpart. In certain embodiments, each of the DBDs and at least two TADs has at least 80% sequence identity to their closest human counterparts. In certain embodiments, each of the DBDs and at least two TADs is characterized by sequence identity, composition

- 1 046157 ляющей по меньшей мере 90%, по отношению к их ближайшим человеческим аналогам.- 1 046157 lying at least 90% in relation to their closest human analogues.

Согласно определенным вариантам осуществления DBD содержит направляющую РНК и инактивированный нуклеазами белок Cas. Согласно определенным вариантам осуществления инактивированный нуклеазой белок Cas представляет собой инактивированный нуклеазой белок Cas9.In certain embodiments, the DBD comprises a guide RNA and a nuclease-inactivated Cas protein. In certain embodiments, the nuclease-inactivated Cas protein is a nuclease-inactivated Cas9 protein.

Согласно определенным вариантам осуществления DBD содержит домен типа цинковые пальцы. Согласно определенным вариантам осуществления DBD содержит от шести до девяти доменов типа цинковые пальцы. Согласно определенным вариантам осуществления DBD содержит шесть цинковых пальцев. Согласно определенным вариантам осуществления DBD связывается с областью генома, содержащей 18 нуклеотидов. Согласно определенным вариантам осуществления DBD содержит девять цинковых пальцев. Согласно определенным вариантам осуществления DBD связывается с областью генома, содержащей 27 нуклеотидов.In certain embodiments, the DBD comprises a zinc finger domain. In certain embodiments, the DBD contains six to nine zinc finger domains. In certain embodiments, the DBD contains six zinc fingers. In certain embodiments, the DBD binds to a region of the genome containing 18 nucleotides. In certain embodiments, the DBD contains nine zinc fingers. In certain embodiments, the DBD binds to a 27 nucleotide region of the genome.

Согласно определенным вариантам осуществления DBD содержит последовательность, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 95%, по отношению к любой из SEQ ID NO: 148-151. Согласно определенным вариантам осуществления DBD содержит последовательность, содержащую любую из SEQ ID NO: 148-151.In certain embodiments, the DBD contains a sequence having at least 95% sequence identity to any of SEQ ID NOs: 148-151. In certain embodiments, the DBD comprises a sequence comprising any of SEQ ID NOs: 148-151.

Согласно определенным вариантам осуществления DBD получен из EGR1 человека или EGR3 человека.In certain embodiments, the DBD is derived from human EGR1 or human EGR3.

Согласно определенным вариантам осуществления DBD содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 77-98. Согласно определенным вариантам осуществления DBD содержит SEQ ID NO: 77-98.In certain embodiments, the DBD contains a sequence having at least 90% identity to any of SEQ ID NOs: 77-98. In certain embodiments, the DBD contains SEQ ID NO: 77-98.

Согласно определенным вариантам осуществления DBD содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к SEQ ID NO: 92. Согласно определенным вариантам осуществления DBD содержит SEQ ID NO: 92.In certain embodiments, the DBD comprises a sequence having at least 90% identity to SEQ ID NO: 92. In certain embodiments, the DBD comprises SEQ ID NO: 92.

Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к SEQ ID NO: 130 или 131. Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит SEQ ID NO: 130 или 131.In certain embodiments, the non-naturally occurring transcription factor comprises a sequence having at least 90% identity to SEQ ID NO: 130 or 131. In certain embodiments, the non-naturally occurring transcription factor comprises SEQ ID NO: 130 or 131.

Согласно определенным вариантам осуществления кассета экспрессии содержит нуклеотидную последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 72 или 73. Согласно определенным вариантам осуществления кассета экспрессии содержит нуклеотидную последовательность любой из SEQ ID NO: 72 или 73.In certain embodiments, the expression cassette comprises a nucleotide sequence having at least 90% identity to either SEQ ID NO: 72 or 73. In certain embodiments, the expression cassette comprises a nucleotide sequence in either SEQ ID NO: 72 or 73.

Согласно определенным вариантам осуществления кассета экспрессии дополнительно содержит регуляторный элемент, который управляет экспрессией фактора транскрипции на более высоком уровне в PV-содержащих нейронах, чем в других типах клеток. Согласно определенным вариантам осуществления регуляторный элемент содержит любую из SEQ ID NO: 1-4. Согласно определенным вариантам осуществления регуляторный элемент содержит SEQ ID NO: 2 или 3.In certain embodiments, the expression cassette further comprises a regulatory element that directs expression of the transcription factor at a higher level in PV-containing neurons than in other cell types. In certain embodiments, the regulatory element comprises any of SEQ ID NOs: 1-4. In certain embodiments, the regulatory element comprises SEQ ID NO: 2 or 3.

Согласно определенным вариантам осуществления кассета экспрессии дополнительно содержит селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК характеризуется идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 7, 14 или 15. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК содержит любую из SEQ ID NO: 7, 14 или 15.In certain embodiments, the expression cassette further comprises a PV-selective microRNA binding site. In certain embodiments, the PV-selective miRNA binding site has at least 90% identity to any of SEQ ID NO: 7, 14, or 15. In certain embodiments, the PV-selective miRNA binding site comprises any of SEQ ID NO: 7, 14 or 15.

Согласно определенным вариантам осуществления кассета экспрессии представляет собой часть вирусного вектора. Согласно определенным вариантам осуществления вирусный вектор представляет собой вирус AAV. Согласно определенным вариантам осуществления вирус AAV представляет собой вирус AAV9 или вирус scAAV9. Согласно определенным вариантам осуществления вирусный вектор представляет собой лентивирус.In certain embodiments, the expression cassette is part of a viral vector. In certain embodiments, the viral vector is an AAV virus. In certain embodiments, the AAV virus is an AAV9 virus or a scAAV9 virus. In certain embodiments, the viral vector is a lentivirus.

Согласно другому аспекту в заявке представлена кассета экспрессии, содержащая последовательность, кодирующую не встречающийся в природе фактор транскрипции, который увеличивает экспрессию гена SCN1A в клетке, причем не встречающийся в природе фактор транскрипции содержит ДНКсвязывающий домен, функционально связанный с активирующим транскрипцию доменом, причем ДНКсвязывающий домен представляет собой белок типа цинковые пальцы, содержащий последовательность LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (SEQ ID NO: 147), и причем тег HA отсутствует (SEQ ID NO: 303) между ДНК-связывающим доменом и активирующим транскрипцию доменом. Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит последовательность VP16, VPR или VP64 или их функциональный фрагмент. Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит VP64.In another aspect, the application provides an expression cassette comprising a sequence encoding a non-naturally occurring transcription factor that increases expression of the SCN1A gene in a cell, wherein the non-naturally occurring transcription factor comprises a DNA binding domain operably linked to a transcription activating domain, wherein the DNA binding domain represents is a zinc finger protein containing the sequence LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (SEQ ID NO: 147), and where there is no HA tag (SEQ ID NO: 303) between the DNA binding domain and the activating domain transcription domain. In certain embodiments, the transcription activating domain comprises a VP16, VPR, or VP64 sequence or a functional fragment thereof. In certain embodiments, the transcription activating domain comprises VP64.

Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с геномной областью, содержащей 18-27 нуклеотидов. Согласно определенным вариантам осуществления ДНКсвязывающий домен представляет собой домен типа цинковые пальцы, содержащий SEQ ID NO: 147, где n=6-9. Согласно определенным вариантам осуществления ДНК-связывающий домен представляетIn certain embodiments, the DNA binding domain binds to a genomic region containing 18-27 nucleotides. In certain embodiments, the DNA binding domain is a zinc finger domain comprising SEQ ID NO: 147, where n=6-9. In certain embodiments, the DNA binding domain is

- 2 046157 собой домен типа цинковые пальцы, содержащий SEQ ID NO: 147, где n=6. Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с областью генома, содержащей 18 нуклеотидов. Согласно определенным вариантам осуществления ДНК-связывающий домен представляет собой домен типа цинковые пальцы, содержащий SEQ ID NO: 147, где n=9. Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с геномной областью, содержащей 27 нуклеотидов.- 2 046157 is a zinc finger domain containing SEQ ID NO: 147, where n=6. In certain embodiments, the DNA binding domain binds to a region of the genome containing 18 nucleotides. In certain embodiments, the DNA binding domain is a zinc finger domain comprising SEQ ID NO: 147, where n=9. In certain embodiments, the DNA binding domain binds to a genomic region containing 27 nucleotides.

Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 95%, по отношению к любой из SEQ ID NO: 148-151. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, содержащую любую из SEQ ID NO: 148-151.In certain embodiments, the DNA binding domain comprises a sequence having at least 95% sequence identity to any of SEQ ID NOs: 148-151. In certain embodiments, the DNA binding domain comprises a sequence comprising any of SEQ ID NOs: 148-151.

Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 77-91. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит любую из SEQ ID NO: 77-91.In certain embodiments, the DNA binding domain comprises a sequence having at least 90% identity to any of SEQ ID NOs: 77-91. In certain embodiments, the DNA binding domain comprises any of SEQ ID NOs: 77-91.

Согласно определенным вариантам осуществления кассета экспрессии дополнительно содержит регуляторный элемент, который управляет экспрессией фактора транскрипции на более высоком уровне в PV-содержащих нейронах, чем в других типах клеток. Согласно определенным вариантам осуществления регуляторный элемент содержит любую из SEQ ID NO: 1-4. Согласно определенным вариантам осуществления регуляторный элемент содержит SEQ ID NO: 2 или 3.In certain embodiments, the expression cassette further comprises a regulatory element that directs expression of the transcription factor at a higher level in PV-containing neurons than in other cell types. In certain embodiments, the regulatory element comprises any of SEQ ID NOs: 1-4. In certain embodiments, the regulatory element comprises SEQ ID NO: 2 or 3.

Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к SEQ ID NO: 127. Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит SEQ ID NO: 127.In certain embodiments, the non-naturally occurring transcription factor comprises a sequence having at least 90% identity to SEQ ID NO: 127. In certain embodiments, the non-naturally occurring transcription factor comprises SEQ ID NO: 127.

Согласно определенным вариантам осуществления кассета экспрессии содержит нуклеотидную последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 93 или 71. Согласно определенным вариантам осуществления кассета экспрессии содержит нуклеотидную последовательность любой из SEQ ID NO: 93 или 71.In certain embodiments, the expression cassette comprises a nucleotide sequence having at least 90% identity to either SEQ ID NO: 93 or 71. In certain embodiments, the expression cassette comprises a nucleotide sequence in either SEQ ID NO: 93 or 71.

Согласно определенным вариантам осуществления кассета экспрессии дополнительно содержит селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК характеризуется идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 7, 14 или 15. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК содержит любую из SEQ ID NO: 7, 14 или 15.In certain embodiments, the expression cassette further comprises a PV-selective microRNA binding site. In certain embodiments, the PV-selective miRNA binding site has at least 90% identity to any of SEQ ID NO: 7, 14, or 15. In certain embodiments, the PV-selective miRNA binding site comprises any of SEQ ID NO: 7, 14 or 15.

Согласно определенным вариантам осуществления кассета экспрессии представляет собой часть вирусного вектора. Согласно определенным вариантам осуществления вирусный вектор представляет собой вирус AAV. Согласно определенным вариантам осуществления вирус AAV представляет собой вирус AAV9 или вирус scAAV9. Согласно определенным вариантам осуществления вирусный вектор представляет собой лентивирус. Согласно другому аспекту в заявке представлен полинуклеотид, содержащий селективный в отношении PV сайт связывания микроРНК, содержащий последовательность, характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к SEQ ID NO: 14 или 15, причем сайт связывания микроРНК снижает экспрессию трансгена в возбуждающих нейронах. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК содержит SEQ ID NO: 14. Согласно определенным вариантам осуществления селективный в отношении PV сайт связывания микроРНК содержит SEQ ID NO: 15. Согласно другому аспекту в заявке представлена кассета экспрессии, содержащая селективный в отношении PV сайт связывания микроРНК и промотор и/или энхансер. Согласно определенным вариантам осуществления промотор и/или энхансер представляет собой селективный в отношении PV регуляторный элемент, который управляет экспрессией трансгена на более высоком уровне в парвальбумин-содержащих нейронах (PV), чем в других типах клеток. Согласно определенным вариантам осуществления селективный в отношении PV регуляторный элемент функционально связан с трансгеном. Согласно другому аспекту в настоящей заявке представлена кассета экспрессии, содержащая регуляторный элемент, функционально связанный с трансгеном, и по меньшей мере один сайт связывания микроРНК, причем регуляторный элемент управляет экспрессией трансгена на более высоком уровне в парвальбумин-содержащих (PV) нейронах, чем в других типах клеток, и причем сайт связывания микроРНК снижает экспрессию трансгена в возбуждающих нейронах. Согласно определенным вариантам осуществления кассета экспрессии не содержит SEQ ID NO: 67. Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR221 (SEQ ID NO: 11). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR222 (SEQ ID NO: 13). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9) и по меньшей мере один сайт связывания для MIR221 (SEQ ID NO:In certain embodiments, the expression cassette is part of a viral vector. In certain embodiments, the viral vector is an AAV virus. In certain embodiments, the AAV virus is an AAV9 virus or a scAAV9 virus. In certain embodiments, the viral vector is a lentivirus. In another aspect, the application provides a polynucleotide comprising a PV-selective miRNA binding site comprising a sequence having at least 80% sequence identity to SEQ ID NO: 14 or 15, wherein the miRNA binding site reduces transgene expression in excitatory neurons. In certain embodiments, the PV-selective miRNA binding site comprises SEQ ID NO: 14. In certain embodiments, the PV-selective miRNA binding site comprises SEQ ID NO: 15. In another aspect, the application provides an expression cassette comprising a PV-selective microRNA binding site and promoter and/or enhancer. In certain embodiments, the promoter and/or enhancer is a PV-selective regulatory element that drives expression of the transgene at a higher level in parvalbumin-containing neurons (PVs) than in other cell types. In certain embodiments, the PV-selective regulatory element is operably linked to the transgene. In another aspect, the present application provides an expression cassette comprising a regulatory element operably linked to a transgene and at least one microRNA binding site, wherein the regulatory element controls expression of the transgene at a higher level in parvalbumin-containing (PV) neurons than in other neurons. cell types, and where the microRNA binding site reduces transgene expression in excitatory neurons. In certain embodiments, the expression cassette does not contain SEQ ID NO: 67. In certain embodiments, the microRNA binding site contains at least one binding site for MIR128 (SEQ ID NO: 9). In certain embodiments, the microRNA binding site comprises at least one binding site for MIR221 (SEQ ID NO: 11). In certain embodiments, the microRNA binding site comprises at least one binding site for MIR222 (SEQ ID NO: 13). In certain embodiments, the microRNA binding site comprises at least one binding site for MIR128 (SEQ ID NO: 9) and at least one binding site for MIR221 (SEQ ID NO:

- 3 046157- 3 046157

11). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9), по меньшей мере один сайт связывания для MIR221 (SEQ ID NO: 11) и по меньшей мере один сайт связывания для MIR222 (SEQ ID NO: 13). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 7, 14 или 15. Согласно определенным вариантам осуществления сайт связывания микроРНК содержит SEQ ID NO: 7, 14 или 15.eleven). In certain embodiments, the microRNA binding site comprises at least one binding site for MIR128 (SEQ ID NO: 9), at least one binding site for MIR221 (SEQ ID NO: 11), and at least one binding site for MIR222 (SEQ ID NO: 13). In certain embodiments, the miRNA binding site comprises a sequence having at least 90% identity to any of SEQ ID NO: 7, 14, or 15. In certain embodiments, the miRNA binding site comprises SEQ ID NO: 7, 14 or 15.

Согласно определенным вариантам осуществления трансген кодирует полипептид, содержащий не встречающийся в природе фактор транскрипции, который увеличивает экспрессию гена SCN1A в клетке. Согласно определенным вариантам осуществления фактор транскрипции связывается с областью генома, содержащей 18-27 нуклеотидов. Согласно определенным вариантам осуществления фактор транскрипции содержит ДНК-связывающий домен. Согласно определенным вариантам осуществления фактор транскрипции содержит ДНК-связывающий домен и активирующий транскрипцию домен. Согласно определенным вариантам осуществления ДНК-связывающий домен характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления ДНК-связывающий домен характеризуется идентичностью последовательности, составляющей по меньшей мере 90%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления как ДНКсвязывающий домен, так и активирующий транскрипцию домен характеризуются идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к их ближайшим человеческим аналогам. Согласно определенным вариантам осуществления как ДНК-связывающий домен, так и активирующий транскрипцию домен характеризуется идентичностью последовательности, составляющей по меньшей мере 90%, по отношению к их ближайшим человеческим аналогам.In certain embodiments, the transgene encodes a polypeptide containing a non-naturally occurring transcription factor that increases expression of the SCN1A gene in a cell. In certain embodiments, the transcription factor binds to a region of the genome containing 18-27 nucleotides. In certain embodiments, the transcription factor comprises a DNA binding domain. In certain embodiments, the transcription factor comprises a DNA binding domain and a transcription activating domain. In certain embodiments, the DNA binding domain has at least 80% sequence identity to its closest human counterpart. In certain embodiments, the DNA binding domain has at least 90% sequence identity to its closest human counterpart. In certain embodiments, both the DNA binding domain and the transcription activating domain have at least 80% sequence identity to their closest human counterparts. In certain embodiments, both the DNA binding domain and the transcription activating domain have at least 90% sequence identity to their closest human counterparts.

Согласно определенным вариантам осуществления ДНК-связывающий домен содержит направляющую РНК и инактивированный нуклеазой белок Cas. Согласно определенным вариантам осуществления инактивированный нуклеазой белок Cas представляет собой инактивированный нуклеазой белок Cas9.In certain embodiments, the DNA binding domain comprises a guide RNA and a nuclease-inactivated Cas protein. In certain embodiments, the nuclease-inactivated Cas protein is a nuclease-inactivated Cas9 protein.

Согласно определенным вариантам осуществления ДНК-связывающий домен содержит домен типа цинковые пальцы. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит от шести до девяти доменов типа цинковые пальцы. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит шесть цинковых пальцев. Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с областью генома, содержащей 18 нуклеотидов. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит девять цинковых пальцев. Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с геномной областью, содержащей 27 нуклеотидов.In certain embodiments, the DNA binding domain comprises a zinc finger domain. In certain embodiments, the DNA binding domain comprises six to nine zinc finger domains. In certain embodiments, the DNA binding domain contains six zinc fingers. In certain embodiments, the DNA binding domain binds to a region of the genome containing 18 nucleotides. In certain embodiments, the DNA binding domain contains nine zinc fingers. In certain embodiments, the DNA binding domain binds to a genomic region containing 27 nucleotides.

Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 95%, по отношению к любой из SEQ ID NO: 148-151. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, содержащую любую из SEQ ID NO: 148-151. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 92-98. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит любую из SEQ ID NO: 92-98.In certain embodiments, the DNA binding domain comprises a sequence having at least 95% sequence identity to any of SEQ ID NOs: 148-151. In certain embodiments, the DNA binding domain comprises a sequence comprising any of SEQ ID NOs: 148-151. In certain embodiments, the DNA binding domain comprises a sequence having at least 90% identity to any of SEQ ID NOs: 92-98. In certain embodiments, the DNA binding domain comprises any of SEQ ID NOs: 92-98.

Согласно определенным вариантам осуществления ДНК-связывающий домен представляет собой белок типа цинковые пальцы, содержащий последовательность LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (SEQ ID NO: 147).In certain embodiments, the DNA binding domain is a zinc finger protein containing the sequence LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (SEQ ID NO: 147).

Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 77-91. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит любую из SEQ ID NO: 77-91.In certain embodiments, the DNA binding domain comprises a sequence having at least 90% identity to any of SEQ ID NOs: 77-91. In certain embodiments, the DNA binding domain comprises any of SEQ ID NOs: 77-91.

Согласно определенным вариантам осуществления ДНК-связывающий домен происходит от EGR1 человека или EGR3 человека.In certain embodiments, the DNA binding domain is derived from human EGR1 or human EGR3.

Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит последовательность VP16, VPR, VP64, CITED2, CITED4 или CREB3 или их функциональный фрагмент. Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит последовательность CITED2, CITED4 или CREB3 человека или их функциональный фрагмент.In certain embodiments, the transcription activating domain comprises a VP16, VPR, VP64, CITED2, CITED4, or CREB3 sequence or a functional fragment thereof. In certain embodiments, the transcription activating domain comprises a human CITED2, CITED4, or CREB3 sequence or a functional fragment thereof.

Согласно определенным вариантам осуществления регуляторный элемент содержит последовательность, содержащую любую из SEQ ID NO: 1-4. Согласно определенным вариантам осуществления регуляторный элемент содержит последовательность, содержащую SEQ ID NO: 2 или 3.In certain embodiments, the regulatory element comprises a sequence comprising any of SEQ ID NOs: 1-4. In certain embodiments, the regulatory element comprises a sequence comprising SEQ ID NO: 2 or 3.

Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 105, 106 и 127-129. Согласно определенным вариантамIn certain embodiments, the non-naturally occurring transcription factor comprises a sequence having at least 90% identity to any of SEQ ID NOs: 105, 106, and 127-129. According to certain options

- 4 046157 осуществления не встречающийся в природе фактор транскрипции содержит любую из SEQ ID NO: 105, 106 и 127-129.- 4 046157 implementation of a non-naturally occurring transcription factor contains any of SEQ ID NOs: 105, 106 and 127-129.

Согласно определенным вариантам осуществления трансген содержит нуклеотидную последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 71, 74, 75, 76 или 184. Согласно определенным вариантам осуществления трансген содержит любую из SEQ ID NO: 71, 74, 75, 76 или 184.In certain embodiments, the transgene comprises a nucleotide sequence having at least 90% identity to any of SEQ ID NO: 71, 74, 75, 76, or 184. In certain embodiments, the transgene comprises any of SEQ ID NO: 71, 74, 75, 76 or 184.

Согласно определенным вариантам осуществления кассета экспрессии представляет собой часть вирусного вектора. Согласно определенным вариантам осуществления вирусный вектор представляет собой вирус AAV. Согласно определенным вариантам осуществления вирус AAV представляет собой вирус AAV9 или вирус scAAV9. Согласно определенным вариантам осуществления вирусный вектор представляет собой лентивирус.In certain embodiments, the expression cassette is part of a viral vector. In certain embodiments, the viral vector is an AAV virus. In certain embodiments, the AAV virus is an AAV9 virus or a scAAV9 virus. In certain embodiments, the viral vector is a lentivirus.

Согласно другому аспекту в настоящей заявке представлен способ селективной экспрессии трансгена в парвальбумин-содержащих нейронах (PV) приматов, предусматривающий введение примату вирусного вектора, содержащего трансген и по меньшей мере один сайт связывания микроРНК, причем сайт связывания микроРНК снижает экспрессию трансгена в возбуждающих нейронах.In another aspect, the present application provides a method for selectively expressing a transgene in parvalbumin-containing neurons (PVs) of primates, comprising administering to the primate a viral vector containing the transgene and at least one miRNA binding site, wherein the miRNA binding site reduces expression of the transgene in excitatory neurons.

Согласно определенным вариантам осуществления вирусный вектор дополнительно содержит регуляторный элемент, функционально связанный с трансгеном, причем регуляторный элемент управляет экспрессией трансгена на более высоком уровне в парвальбумин-содержащих нейронах (PV), чем в других типах клеток. Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR221 (SEQ ID NO: 11). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR222 (SEQ ID NO: 13). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9) и по меньшей мере один сайт связывания для MIR221 (SEQ ID NO: 11). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит по меньшей мере один сайт связывания для MIR128 (SEQ ID NO: 9), по меньшей мере один сайт связывания для MIR221 (SEQ ID NO: 11) и по меньшей мере один сайт связывания для MIR222 (SEQ ID NO: 13). Согласно определенным вариантам осуществления сайт связывания микроРНК содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 7, 14 или 15. Согласно определенным вариантам осуществления сайт связывания микроРНК содержит SEQ ID NO: 7, 14 или 15.In certain embodiments, the viral vector further comprises a regulatory element operably linked to the transgene, wherein the regulatory element controls expression of the transgene at a higher level in parvalbumin-containing neurons (PVs) than in other cell types. In certain embodiments, the microRNA binding site comprises at least one binding site for MIR128 (SEQ ID NO: 9). In certain embodiments, the microRNA binding site comprises at least one binding site for MIR221 (SEQ ID NO: 11). In certain embodiments, the microRNA binding site comprises at least one binding site for MIR222 (SEQ ID NO: 13). In certain embodiments, the microRNA binding site comprises at least one binding site for MIR128 (SEQ ID NO: 9) and at least one binding site for MIR221 (SEQ ID NO: 11). In certain embodiments, the microRNA binding site comprises at least one binding site for MIR128 (SEQ ID NO: 9), at least one binding site for MIR221 (SEQ ID NO: 11), and at least one binding site for MIR222 (SEQ ID NO: 13). In certain embodiments, the miRNA binding site comprises a sequence having at least 90% identity to any of SEQ ID NO: 7, 14, or 15. In certain embodiments, the miRNA binding site comprises SEQ ID NO: 7, 14 or 15.

Согласно определенным вариантам осуществления трансген содержит последовательность, кодирующую не встречающийся в природе фактор транскрипции, который увеличивает экспрессию гена SCNIA в клетке.In certain embodiments, the transgene comprises a sequence encoding a non-naturally occurring transcription factor that increases expression of the SCNIA gene in a cell.

Согласно определенным вариантам осуществления фактор транскрипции связывается с областью генома, содержащей 18-27 нуклеотидов.In certain embodiments, the transcription factor binds to a region of the genome containing 18-27 nucleotides.

Согласно определенным вариантам осуществления фактор транскрипции содержит ДНКсвязывающий домен.In certain embodiments, the transcription factor comprises a DNA binding domain.

Согласно определенным вариантам осуществления фактор транскрипции содержит ДНКсвязывающий домен и активирующий транскрипцию домен.In certain embodiments, the transcription factor comprises a DNA binding domain and a transcription activating domain.

Согласно определенным вариантам осуществления ДНК-связывающий домен характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления ДНК-связывающий домен характеризуется идентичностью последовательности, составляющей по меньшей мере 90%, по отношению к его ближайшему человеческому аналогу. Согласно определенным вариантам осуществления как ДНК-связывающий домен, так и активирующий транскрипцию домен характеризуются идентичностью последовательности, составляющей по меньшей мере 80%, по отношению к их ближайшим человеческим аналогам. Согласно определенным вариантам осуществления как ДНК-связывающий домен, так и активирующий транскрипцию домен характеризуются идентичностью последовательности, составляющей по меньшей мере 90%, по отношению к их ближайшим человеческим аналогам.In certain embodiments, the DNA binding domain has at least 80% sequence identity to its closest human counterpart. In certain embodiments, the DNA binding domain has at least 90% sequence identity to its closest human counterpart. In certain embodiments, both the DNA binding domain and the transcription activating domain have at least 80% sequence identity to their closest human counterparts. In certain embodiments, both the DNA binding domain and the transcription activating domain have at least 90% sequence identity to their closest human counterparts.

Согласно определенным вариантам осуществления ДНК-связывающий домен содержит направляющую РНК и инактивированный нуклеазой белок Cas. Согласно определенным вариантам осуществления инактивированный нуклеазой белок Cas представляет собой инактивированный нуклеазой белок Cas9.In certain embodiments, the DNA binding domain comprises a guide RNA and a nuclease-inactivated Cas protein. In certain embodiments, the nuclease-inactivated Cas protein is a nuclease-inactivated Cas9 protein.

Согласно определенным вариантам осуществления ДНК-связывающий домен содержит домен типа цинковые пальцы. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит от шести до девяти доменов типа цинковые пальцы. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит шесть цинковых пальцев. Согласно определенным вариантам осуществления ДНК-связывающий домен связывается с областью генома, содержащей 18 нуклеотидов. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит девять цинковых пальцев. Согласно определенным вариантам осуществления ДНК-связывающий домен свяIn certain embodiments, the DNA binding domain comprises a zinc finger domain. In certain embodiments, the DNA binding domain comprises six to nine zinc finger domains. In certain embodiments, the DNA binding domain contains six zinc fingers. In certain embodiments, the DNA binding domain binds to a region of the genome containing 18 nucleotides. In certain embodiments, the DNA binding domain contains nine zinc fingers. In certain embodiments, the DNA binding domain

- 5 046157 зывается с геномной областью, содержащей 27 нуклеотидов.- 5 046157 is called with a genomic region containing 27 nucleotides.

Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 95%, по отношению к любой из SEQ ID NO: 148-151. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, имеющую любую из SEQ ID NO: 148-151.In certain embodiments, the DNA binding domain comprises a sequence having at least 95% sequence identity to any of SEQ ID NOs: 148-151. In certain embodiments, the DNA binding domain comprises a sequence having any of SEQ ID NOs: 148-151.

Согласно определенным вариантам осуществления ДНК-связывающий домен происходит из EGR1 человека или EGR3 человека.In certain embodiments, the DNA binding domain is derived from human EGR1 or human EGR3.

Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 92-98. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит любую из SEQ ID NO: 92-98.In certain embodiments, the DNA binding domain comprises a sequence having at least 90% identity to any of SEQ ID NOs: 92-98. In certain embodiments, the DNA binding domain comprises any of SEQ ID NOs: 92-98.

Согласно определенным вариантам осуществления ДНК-связывающий домен представляет собой белок типа цинковые пальцы, содержащий последовательность LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (SEQ ID NO: 147).In certain embodiments, the DNA binding domain is a zinc finger protein containing the sequence LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (SEQ ID NO: 147).

Согласно определенным вариантам осуществления ДНК-связывающий домен содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 77-91. Согласно определенным вариантам осуществления ДНК-связывающий домен содержит любую из SEQ ID NO: 77-91.In certain embodiments, the DNA binding domain comprises a sequence having at least 90% identity to any of SEQ ID NOs: 77-91. In certain embodiments, the DNA binding domain comprises any of SEQ ID NOs: 77-91.

Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит последовательность VP16, VPR, VP64, CITED2, CITED4 или CREB3 или их функциональный фрагмент. Согласно определенным вариантам осуществления активирующий транскрипцию домен содержит последовательность CITED2, CITED4 или CREB3 человека или их функциональный фрагмент.In certain embodiments, the transcription activating domain comprises a VP16, VPR, VP64, CITED2, CITED4, or CREB3 sequence or a functional fragment thereof. In certain embodiments, the transcription activating domain comprises a human CITED2, CITED4, or CREB3 sequence or a functional fragment thereof.

Согласно определенным вариантам осуществления регуляторный элемент содержит последовательность, содержащую любую из SEQ ID NO: 1-4. Согласно определенным вариантам осуществления регуляторный элемент содержит последовательность, содержащую SEQ ID NO: 2 или 3.In certain embodiments, the regulatory element comprises a sequence comprising any of SEQ ID NOs: 1-4. In certain embodiments, the regulatory element comprises a sequence comprising SEQ ID NO: 2 or 3.

Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 105, 106 и 127-129. Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит любую из SEQ ID NO: 105, 106 и 127-129.In certain embodiments, the non-naturally occurring transcription factor comprises a sequence having at least 90% identity to any of SEQ ID NOs: 105, 106, and 127-129. In certain embodiments, the non-naturally occurring transcription factor comprises any of SEQ ID NOs: 105, 106, and 127-129.

Согласно определенным вариантам осуществления трансген содержит нуклеотидную последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к любой из SEQ ID NO: 71, 74, 75, 76 или 184. Согласно определенным вариантам осуществления трансген содержит любую из SEQ ID NO: 71, 74, 75, 76 или 184.In certain embodiments, the transgene comprises a nucleotide sequence having at least 90% identity to any of SEQ ID NO: 71, 74, 75, 76, or 184. In certain embodiments, the transgene comprises any of SEQ ID NO: 71, 74, 75, 76 or 184.

Согласно определенным вариантам осуществления вирусный вектор представляет собой вирус AAV. Согласно определенным вариантам осуществления вирус AAV представляет собой вирус AAV9 или вирус scAAV9. Согласно определенным вариантам осуществления вирусный вектор представляет собой лентивирус.In certain embodiments, the viral vector is an AAV virus. In certain embodiments, the AAV virus is an AAV9 virus or a scAAV9 virus. In certain embodiments, the viral vector is a lentivirus.

Согласно определенным вариантам осуществления притма представляет собой человека. Согласно определенным вариантам осуществления примат представляет собой отличного от человека примата. Согласно определенным вариантам осуществления отличный от человека примат представляет собой обезьяну старого мира, орангутана, гориллу, шимпанзе, мартышку, яванского макака, макака-резус или свинохвостого макака.In certain embodiments, the primo is a human. In certain embodiments, the primate is a non-human primate. In certain embodiments, the non-human primate is an old world monkey, an orangutan, a gorilla, a chimpanzee, a marmoset, a cynomolgus monkey, a rhesus monkey, or a pig-tailed monkey.

Согласно другому аспекту в настоящей заявке представлена кассета экспрессии, содержащая последовательность, кодирующую не встречающийся в природе фактор транскрипции, который увеличивает экспрессию гена SCN1A в клетке, причем не встречающийся в природе фактор транскрипции содержит последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 90%, по отношению к SEQ ID NO: 128 или 129. Согласно определенным вариантам осуществления не встречающийся в природе фактор транскрипции содержит SEQ ID NO: 128 или 129.In another aspect, the present application provides an expression cassette comprising a sequence encoding a non-naturally occurring transcription factor that increases expression of the SCN1A gene in a cell, wherein the non-naturally occurring transcription factor contains a sequence having at least 90% identity to with respect to SEQ ID NO: 128 or 129. In certain embodiments, the non-naturally occurring transcription factor comprises SEQ ID NO: 128 or 129.

Согласно другому аспекту в настоящей заявке представлен способ увеличения экспрессии SCNIA в клетке путем введения любой из кассет экспрессии, представленных в настоящем документе. Согласно определенным вариантам осуществления клетка представляет собой нервную клетку. Согласно определенным вариантам осуществления нервная клетка выбрана из группы, состоящей из униполярных, биполярных, мультиполярных или псевдоуниполярных нейронов. Согласно определенным вариантам осуществления клетка представляет собой ГАМКергический нейрон. Согласно определенным вариантам осуществления клетка представляет собой PV-содержащий нейрон. Согласно определенным вариантам осуществления клетка не представляет собой нервную клетку. Согласно определенным вариантам осуществления клетка представляет собой глиальную клетку. Согласно определенным вариантам осуществления глиальная клетка выбрана из группы, состоящей из астроцитов, олигодендроцитов, эпендимных клеток, шванновских клеток и сателлитных клеток. Согласно определенным вариантам осуществления клетка находится внутри субъекта. Согласно определенным вариантам осуществления субъект представляет собой млекопитающее. Согласно определенным вариантам осуществления субъект представляетIn another aspect, the present application provides a method of increasing the expression of SCNIA in a cell by introducing any of the expression cassettes provided herein. In certain embodiments, the cell is a nerve cell. In certain embodiments, the nerve cell is selected from the group consisting of unipolar, bipolar, multipolar, or pseudounipolar neurons. In certain embodiments, the cell is a GABAergic neuron. In certain embodiments, the cell is a PV-containing neuron. In certain embodiments, the cell is not a nerve cell. In certain embodiments, the cell is a glial cell. In certain embodiments, the glial cell is selected from the group consisting of astrocytes, oligodendrocytes, ependymal cells, Schwann cells, and satellite cells. In certain embodiments, the cell is located within a subject. In certain embodiments, the subject is a mammal. In certain embodiments, the subject represents

- 6 046157 собой человека. Согласно определенным вариантам осуществления увеличение экспрессии SCN1A лечит заболевание, нарушение или симптом. Согласно определенным вариантам осуществления нарушение представляет собой нарушение центральной нервной системы. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную с гаплонедостаточностью SCN1A. Согласно определенным вариантам осуществления гаплонедостаточность является результатом того, что субъект является гетерозиготным по мутации потери функции гена SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную со вставкой, делецией или заменой в гене SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную с точечной мутацией в гене SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой синдром Драве. Согласно определенным вариантам осуществления симптом нарушение центральной нервной системы представляет собой гиперактивность нейронов. Согласно определенным вариантам осуществления лечение нарушения центральной нервной системы предусматривает снижение гиперактивности нейронов. Согласно определенным вариантам осуществления симптомом нарушения центральной нервной системы являются припадки. Согласно определенным вариантам осуществления лечение нарушения центральной нервной системы предусматривает снижение частоты припадков. Согласно определенным вариантам осуществления лечение нарушения центральной нервной системы предусматривает уменьшение тяжести припадков.- 6 046157 a person. In certain embodiments, increasing the expression of SCN1A treats a disease, disorder, or symptom. In certain embodiments, the disorder is a disorder of the central nervous system. In certain embodiments, the disorder is epilepsy associated with SCN1A haploinsufficiency. In certain embodiments, the haploinsufficiency results from the subject being heterozygous for a loss of function mutation in the SCN1A gene. In certain embodiments, the disorder is epilepsy associated with an insertion, deletion, or substitution in the SCN1A gene. In certain embodiments, the disorder is epilepsy associated with a point mutation in the SCN1A gene. In certain embodiments, the disorder is Dravet syndrome. In certain embodiments, the symptom of a central nervous system disorder is neuronal hyperactivity. In certain embodiments, treatment of a central nervous system disorder involves reducing neuronal hyperactivity. In certain embodiments, the symptom of the central nervous system disorder is seizures. In certain embodiments, treatment of a central nervous system disorder involves reducing the frequency of seizures. In certain embodiments, treatment of a central nervous system disorder involves reducing the severity of seizures.

Согласно другому аспекту в настоящей заявке представлен способ увеличения экспрессии SCNIA в ЦНС путем введения любой из кассет экспрессии, представленных в настоящем документе. Согласно определенным вариантам осуществления кассету экспрессии вводят посредством одностороннего интрацеребровентрикулярного (ICV) введения. Согласно определенным вариантам осуществления кассету экспрессии вводят посредством двустороннего интрацеребровентрикулярного (ICV) введения. Согласно определенным вариантам осуществления повышенная экспрессия SCN1A происходит в головном мозге. Согласно определенным вариантам осуществления повышенная экспрессия SCN1A происходит во фронтальной коре, теменной коре, височной коре, гиппокампе, продолговатом мозге и/или затылочной коре. Согласно определенным вариантам осуществления повышенная экспрессия SCN1A происходит в позвоночнике. Согласно определенным вариантам осуществления повышенная экспрессия SCN1A происходит в спинном мозге и/или межпозвонковом узле.In another aspect, the present application provides a method of increasing the expression of SCNIA in the CNS by introducing any of the expression cassettes provided herein. In certain embodiments, the expression cassette is administered via unilateral intracerebroventricular (ICV) administration. In certain embodiments, the expression cassette is administered via bilateral intracerebroventricular (ICV) administration. In certain embodiments, increased expression of SCN1A occurs in the brain. In certain embodiments, increased expression of SCN1A occurs in the frontal cortex, parietal cortex, temporal cortex, hippocampus, medulla oblongata, and/or occipital cortex. In certain embodiments, increased expression of SCN1A occurs in the spine. In certain embodiments, increased expression of SCN1A occurs in the spinal cord and/or intervertebral ganglion.

Включение по ссылкеInclusion by link

Все публикации, патенты и заявки на патенты, упомянутые в настоящем описании, включены в настоящий документ посредством ссылки в той же степени, как если бы каждая отдельная публикация, патент или заявка на патент были специально и индивидуально указаны для включения посредством ссылки.All publications, patents and patent applications referenced herein are incorporated herein by reference to the same extent as if each individual publication, patent or patent application had been specifically and individually designated for inclusion by reference.

Краткое описание графических материаловBrief description of graphic materials

Новые особенности настоящего изобретения подробно изложены в прилагаемой формуле изобретения. Лучшее понимание особенностей и преимуществ настоящего изобретения будет получено при обращении к нижеследующему подробному описанию, в котором излагаются иллюстративные случаи, в которых используются принципы настоящего изобретения, и прилагаемым графическим материалам, на которых показано следующее.The novel features of the present invention are set forth in detail in the accompanying claims. A better understanding of the features and advantages of the present invention will be obtained by reference to the following detailed description, which sets forth illustrative cases in which the principles of the present invention are used, and the accompanying drawings, which show the following.

На фиг. 1 показана активация эндогенного SCN1A с использованием сконструированных факторов транскрипции, которые связываются с различными областями на хромосоме 2 (со ссылкой на GRCh38.p12). Данные представлены в виде кратного изменения экспрессии SCN1A по сравнению с контрольным (EGFP-KASH) состоянием.In fig. Figure 1 shows activation of endogenous SCN1A using engineered transcription factors that bind to different regions on chromosome 2 (referring to GRCh38.p12). Data are presented as fold change in SCN1A expression compared to the control (EGFP-KASH) condition.

На фиг. 2A, фиг. 2B и фиг. 2C показана относительная экспрессия эндогенного SCN1A в клетках HEK293 с использованием SCN1A-специфических активаторов транскрипции (смотрите табл. 1). Данные представлены в виде кратного изменения относительно контрольных условий и показаны на шкале Logi0.In fig. 2A, FIG. 2B and FIG. Figure 2C shows the relative expression of endogenous SCN1A in HEK293 cells using SCN1A-specific transcriptional activators (see Table 1). Data are presented as fold change relative to control conditions and shown on a Logi 0 scale.

На фиг. 3A показана относительная экспрессия эндогенного SCN1A в нейронах ГАМК с использованием SCN1A-специфического активатора транскрипции (конструкция 30). Данные представлены в виде кратного изменения относительно контрольных условий (CBA-EGFP).In fig. Figure 3A shows the relative expression of endogenous SCN1A in GABA neurons using an SCN1A-specific transcriptional activator (construct 30). Data are presented as fold change relative to control conditions (CBA-EGFP).

На фиг. 3B показана относительная экспрессия эндогенного SCN1A в нейронах ГАМК с использованием SCN1A-специфических активаторов транскрипции (конструкции 25 и 16). Данные представлены в виде кратного изменения относительно контрольных условий (CBA-EGFP) в Log10.In fig. Figure 3B shows the relative expression of endogenous SCN1A in GABA neurons using SCN1A-specific transcriptional activators (constructs 25 and 16). Data are presented as fold change relative to control conditions (CBA-EGFP) in Log 10 .

На фиг. 4 показана относительная экспрессия эндогенного SCN1A и 40 ближайших соседних генов, управляемых специфическим фактором транскрипции SCN1A (конструкция 30). Данные представлены в виде кратного изменения относительно контрольных условий (CBA-EGFP-KASH) в Log10.In fig. Figure 4 shows the relative expression of endogenous SCN1A and 40 immediate neighboring genes driven by the specific transcription factor SCN1A (construct 30). Data are presented as fold change relative to control conditions (CBA-EGFP-KASH) in Log 10 .

На фиг. 5A и фиг. 5B показана экспрессия SCN1A-специфического активатора транскрипции in vivo по сравнению с контрольной кассетой экспрессии, которая экспрессировала eGFP. На фиг. 5A показана относительная экспрессию гена SCN1A у мышей, которым инъецировали либо контрольный eGFP, либо конструкцию 4, содержащую активатор транскрипции SCN1A. На фиг. 5B показано изменение экспрессии SCN1A с точки зрения среднего процента eGFP. Эти эксперименты показывают, что активация транскрипции с помощью конструкции 4 привела к усилению экспрессии SCN1A приблизительно на 20-30%.In fig. 5A and FIG. 5B shows expression of the SCN1A-specific transcriptional activator in vivo compared to a control expression cassette that expressed eGFP. In fig. 5A shows the relative expression of the SCN1A gene in mice injected with either control eGFP or construct 4 containing the SCN1A transcriptional activator. In fig. Figure 5B shows the change in SCN1A expression in terms of the average percentage of eGFP. These experiments indicate that transcriptional activation by construct 4 resulted in an approximately 20-30% increase in SCN1A expression.

На фиг. 6A, фиг. 6B, фиг. 6C, фиг. 6D, фиг. 6E, фиг. 6F и фиг. 6G показано влияние на гипертерми- 7 046157 ческие припадки на мышиной модели синдрома Драве с нокаутом Scn1atm1Kea с использованием различных факторов транскрипции, специфических для SCN1A, по сравнению с контролем. Мышам P1 Scn1a +/- (гетерозиготные; HET) вводили либо AAV9-EGFP, либо вектор AAV9, экспрессирующий фактор транскрипции, специфический для SCN1A (одна из конструкций 31-34, 42 и 43). Мышей P26-P28, подвергнутых инфузии, подвергали тесту на припадки, вызванные гипертермией, и регистрировали внутреннюю температуру, при которой они испытывали тонико-клонический припадок. На фиг. 6D показано прямое сравнение между конструкцией 32, которая содержит тег HA, расположенным между DBD и TAD, и конструкцией 34, которая не содержит тега HA. На фиг. 6E показано прямое сравнение между конструкцией 31, которая содержит сайт связывания микроРНК m1, расположенный между кодирующей областью и хвостом полиА, и конструкцией 32, которая не содержит сайт связывания микроРНК m1. На фиг. 6H проиллюстрировано влияние на гипертермические припадки в модели синдрома Драве у мышей с мутантным Scn1aRX использованием конструкции 31 (по сравнению с контролем в виде введенного PBS).In fig. 6A, FIG. 6B, FIG. 6C, FIG. 6D, FIG. 6E, FIG. 6F and FIG. Figure 6G shows the effect on hyperthermic seizures in the Scn1a tm1Kea knockout mouse model of Dravet syndrome using different SCN1A-specific transcription factors compared to controls. P1 Scn1a +/− (heterozygous; HET) mice were injected with either AAV9-EGFP or an AAV9 vector expressing a SCN1A-specific transcription factor (one of constructs 31–34, 42, and 43). Infused P26-P28 mice were subjected to a hyperthermia-induced seizure test and the core temperature at which they experienced a tonic-clonic seizure was recorded. In fig. 6D shows a direct comparison between design 32, which contains an HA tag located between the DBD and TAD, and design 34, which does not contain an HA tag. In fig. 6E shows a direct comparison between construct 31, which contains the miRNA m1 binding site located between the coding region and the polyA tail, and construct 32, which does not contain the miRNA m1 binding site. In fig. 6H illustrates the effect on hyperthermic seizures in the Scn1a RX mutant mouse model of Dravet syndrome using construct 31 (compared to PBS-infused control).

На фиг. 7A, фиг. 7B, фиг. 7C и фиг. 7D показана выживаемость в модели синдрома Драве у мышей с нокаутом Scn1atm1Kea в различных условиях. На фиг. 7A показано сравнение мышей дикого типа (PBS WT) и Scn1a +/- (PBS HET) в анализе выживаемости. Мышам P1 Scn1a +/- (N=53) и Scn1a +/+ (N=54) вливали PBS. Мышей наблюдали в их домашней клетке ежедневно, и в случае какой-либо смертности регистрировали дату. Наблюдалась значительная разница в выживаемости между животными Scn1a +/- и Scn1a +/+ (P<0,0001). На фиг. 7B-D показано влияние на выживаемость в мышиной модели синдрома Драве для мышей, обработанных различными факторами транскрипции, специфическими для SCN1A, по сравнению с контролем. Мышам P1 Scn1a +/- вливали либо PBS, либо вектор AAV9, экспрессирующий фактор транскрипции, специфический для SCN1A (конструкции 31 или 33). Мышей наблюдали в их домашней клетке ежедневно, и в случае какой-либо смертности регистрировали дату. На фиг. 7D показано прямое сравнение между конструкцией 31, которая содержит сайт связывания микроРНК m1, расположенным между кодирующей областью и хвостом полиА, и конструкцией 33, которая не содержит сайт связывания микроРНК m1. На фиг. 7E показана выживаемость в модели синдрома Драве у мышей с мутантным Scn1aRX с использованием конструкции 31 (по сравнению с контролем, инъецированным PBS).In fig. 7A, FIG. 7B, FIG. 7C and FIG. Figure 7D shows survival in the Scn1a tm1Kea knockout mouse model of Dravet syndrome under various conditions. In fig. 7A shows a comparison of wild type (PBS WT) and Scn1a +/- (PBS HET) mice in a survival assay. P1 Scn1a +/− (N=53) and Scn1a +/+ (N=54) mice were infused with PBS. Mice were observed in their home cage daily and the date of any mortality was recorded. There was a significant difference in survival between Scn1a +/- and Scn1a +/+ animals (P<0.0001). In fig. 7B-D shows the effect on survival in a mouse model of Dravet syndrome for mice treated with various SCN1A-specific transcription factors compared to controls. P1 Scn1a +/− mice were infused with either PBS or an AAV9 vector expressing a transcription factor specific for SCN1A (constructs 31 or 33). Mice were observed in their home cage daily and the date of any mortality was recorded. In fig. 7D shows a direct comparison between construct 31, which contains the miRNA m1 binding site located between the coding region and the polyA tail, and construct 33, which does not contain the miRNA m1 binding site. In fig. 7E shows survival in the Scn1a RX mutant mouse model of Dravet syndrome using construct 31 (compared to PBS-injected control).

На фиг. 8 показана относительная экспрессия мРНК Scn1A в различных тканях головного мозга после интрапаренхимальной доставки вектора AAV9, кодирующего SCN1A-специфический фактор транскрипции (конструкция 33), введенного двум яванским макакам в дозе 1,2х1012 копий генома/животное, нормализованных по двум необработанным контрольным животным. Всех животных умерщвляли через 28 дней после инъекции и количественно определяли мРНК Scn1A в образцах тканей с помощью Taqman PCR. Данные представлены как нормализованная экспрессия целевой мРНК в различных срезах ткани головного мозга. Аналогичные результаты были зарегистрированы с другим набором праймеров/зонда, полученных из гена Scn1a.In fig. 8 shows the relative expression of Scn1A mRNA in various brain tissues following intraparenchymal delivery of an AAV9 vector encoding a SCN1A-specific transcription factor (construct 33) administered to two cynomolgus monkeys at a dose of 1.2 x 10 12 genome copies/animal, normalized to two untreated control animals. All animals were sacrificed 28 days postinjection, and Scn1A mRNA was quantified in tissue samples using Taqman PCR. Data are presented as normalized target mRNA expression in different brain tissue sections. Similar results were reported with a different primer/probe set derived from the Scn1a gene.

На фиг. 9A-F показан характер экспрессии EGFP в области зубчатой извилины гиппокампа мартышки после обработки векторами AAV9, содержащими трансген EGFP под контролем промотора EF1a, промотора RE 2 (SEQ ID NO: 2) или промотора RE 2 (SEQ ID NO: 2) с сайтом связывания микроРНК m1 (SEQ ID NO: 7), расположенным между кодирующей областью EGFP и сайтом polyA. Типичная область зубчатой извилины гиппокампа показана для каждого вектора обработки. В верхнем ряду показаны ядра клеток, окрашенные DAPI, а в нижнем ряду показаны GFP-положительные области, окрашенные антителом к GFP. На фиг. 9A (обработка EF1a) область hylus CA4 гиппокампа обведена, а стрелки указывают на слой тела гранулярных клеток зубчатых клеток (DG). Фиг. 9B и фиг. 9C сосредоточены в той же области. Область CA4, которая представляет собой смесь возбуждающих и тормозных интернейронов, выделена, поскольку это была единственная область со значительной экспрессией в условии RE 2 + m1. При управляемой EF1a и RE 2 экспрессии трансгена экспрессия GFP была более распространенной и включала в себя другие области гиппокампа. Считается, что слой клеток DG содержит в основном возбуждающие нейроны. Экспрессия GFP, управляемая EF1a и RE 2, видна в слое клеток DG (фиг. 9D и фиг. 9E), но не присутствует у животных, обработанных RE 2 + m1 (фиг. 9F) (белые стрелки).In fig. 9A-F show the expression pattern of EGFP in the dentate gyrus region of the marmoset hippocampus following treatment with AAV9 vectors containing the EGFP transgene under the control of the EF1a promoter, the RE 2 promoter (SEQ ID NO: 2), or the RE 2 promoter (SEQ ID NO: 2) with a binding site. microRNA m1 (SEQ ID NO: 7), located between the EGFP coding region and the polyA site. A representative region of the hippocampal dentate gyrus is shown for each processing vector. The top row shows cell nuclei stained with DAPI, and the bottom row shows GFP-positive areas stained with anti-GFP antibody. In fig. 9A (EF1a treatment), the hylus CA4 region of the hippocampus is circled and the arrows point to the dentate cell granule cell body (DG) layer. Fig. 9B and FIG. 9C are concentrated in the same area. Region CA4, which is a mixture of excitatory and inhibitory interneurons, is highlighted because it was the only region with significant expression in the RE 2 + m1 condition. During EF1a and RE 2 driven transgene expression, GFP expression was more widespread and included other areas of the hippocampus. The DG cell layer is thought to contain mainly excitatory neurons. GFP expression driven by EF1a and RE 2 is visible in the DG cell layer (Fig. 9D and Fig. 9E) but is not present in RE 2 + m1-treated animals (Fig. 9F) (white arrows).

На фиг. 10A-L показано, что характер экспрессии EGFP в области зубчатой извилины гиппокампа мартышки после обработки векторами AAV9, содержащими трансген EGFP под контролем промотора EF1a, промотора RE 2 (SEQ ID NO: 2) или промотора RE 2 (SEQ ID NO: 2) с сайтом связывания микроРНК m1 (SEQ ID NO: 7), расположенным между кодирующей областью EGFP и сайтом polyA, в первую очередь локализован на парвальбумин-положительных (PV) клетках у животных, получавших RE 2 и RE 2 + m1. Типичная область зубчатой извилины гиппокампа показана для каждого вектора обработки. В верхнем ряду показаны GFP-положительные области, а в следующем нижнем ряду показаны те же области, окрашенные ингибирующим маркером интернейронов для PV. Область в рамке на фиг. 10A-F показана при большем увеличении на фиг. 10G-L. Экспрессия GFP, управляемая RE 2 и RE 2 + m1, в основном совмещена с ингибирующим маркером PV-содержащих интернейронов (белые стрелки на фиг. 10H и 10K, 10I и 10L), тогда как в EG-EF1a экспрессия GFP не так легко локализуется в PVположительных клетках (белые стрелки на фиг. 10G и 10J). Кроме того, GFP-положительные клетки характеризуются отчетливо выраженной морфологией интернейронов высокоразветвленных клеток с пиIn fig. 10A-L show the expression pattern of EGFP in the dentate gyrus region of the marmoset hippocampus after treatment with AAV9 vectors containing the EGFP transgene under the control of the EF1a promoter, the RE 2 promoter (SEQ ID NO: 2) or the RE 2 promoter (SEQ ID NO: 2) with The microRNA m1 binding site (SEQ ID NO: 7), located between the EGFP coding region and the polyA site, is primarily localized to parvalbumin-positive (PV) cells in RE 2 and RE 2 + m1-treated animals. A representative region of the hippocampal dentate gyrus is shown for each processing vector. The top row shows GFP-positive areas, and the next bottom row shows the same areas stained with the inhibitory interneuron marker for PV. The boxed area in FIG. 10A-F is shown at higher magnification in FIG. 10G-L. GFP expression driven by RE 2 and RE 2 + m1 is mainly colocalized with the inhibitory marker of PV-containing interneurons (white arrows in Figs. 10H and 10K, 10I and 10L), whereas in EG-EF1a GFP expression is not as readily localized to PV-positive cells (white arrows in Fig. 10G and 10J). In addition, GFP-positive cells are characterized by a distinct interneuron morphology of highly branched cells with pi

- 8 046157 рамидным клеточным телом у животных, получавших RE 2 и RE 2 + ml (стрелки на фиг. 10H и 10I), по сравнению с менее отчетливой морфологией клеточного тела у животных, получавших EF1a (стрелки на фиг. 10G).- 8 046157 ramid cell body in animals treated with RE 2 and RE 2 + ml (arrows in Fig. 10H and 10I), compared with less distinct cell body morphology in animals treated with EF1a (arrows in Fig. 10G).

На фиг. 11 показан VG/диплоидный геном в образцах тканей фронтальной коры (FC), ростральной теменной коры (Rostral PC), височной коры (TC), каудальной теменной коры (Caudal PC), гиппокампа (Hip), продолговатого мозга (Med) и затылочной коры (OC) животных, получавших AAV9-REgabaeTFSCNiA, вводимые в дозе 4,8E+13 или 8E+13 мкг/животное посредством одностороннего интрацеребровентрикулярного (ICV) введения (пример 10 и пример 11). Каждая точка данных представляет VG/диплоидный геном для образца ткани, а горизонтальные полосы представляют средний VG/диплоидный геном для всех образцов ткани для каждого животного.In fig. 11 shows the VG/diploid genome in tissue samples from the frontal cortex (FC), rostral parietal cortex (Rostral PC), temporal cortex (TC), caudal parietal cortex (Caudal PC), hippocampus (Hip), medulla oblongata (Med), and occipital cortex. (OC) animals treated with AAV9-RE gaba eTF SC NiA administered at a dose of 4.8E+13 or 8E+13 μg/animal via unilateral intracerebroventricular (ICV) administration (Example 10 and Example 11). Each data point represents the VG/diploid genome for a tissue sample, and the horizontal bars represent the average VG/diploid genome across all tissue samples for each animal.

На фиг. 12 показаны транскрипты/мкг РНК в образцах тканей фронтальной коры (FC), ростральной теменной коры (Rostral PC), височной коры (TC), каудальной теменной коры (Caudal PC), гиппокампа (Hip), продолговатого мозга (Med) и затылочной коры (OC) животных, получавших AAV9-REgabaeTFSCN1A, вводимые в дозе 4,8E+13 или 8E+13 геномов вектора/животное посредством одностороннего интрацеребровентрикулярного (ICV) введения (пример 10 и пример 11). Каждая точка данных представляет геномы вектора/диплоидный геном для образца ткани, а горизонтальные полосы представляют собой среднее отношение геномы вектора/диплоидный геном для всех образцов ткани для каждого животного. Средние транскрипты для ARFGAP2 составляли 1,85Е+6/мкг РНК и обозначены пунктирной верхней граничной линией. Предел обнаружения обозначен пунктирной нижней граничной линией.In fig. Figure 12 shows transcripts/μg RNA in tissue samples from the frontal cortex (FC), rostral parietal cortex (Rostral PC), temporal cortex (TC), caudal parietal cortex (Caudal PC), hippocampus (Hip), medulla oblongata (Med), and occipital cortex. (OC) animals treated with AAV9-RE gaba eTF SC N 1A administered at a dose of 4.8E+13 or 8E+13 vector genomes/animal via unilateral intracerebroventricular (ICV) administration (Example 10 and Example 11). Each data point represents the vector genomes/diploid genome for a tissue sample, and the horizontal bars represent the average vector genomes/diploid genome ratio across all tissue samples for each animal. Average transcripts for ARFGAP2 were 1.85E+6/μg RNA and are indicated by the dashed upper limit line. The detection limit is indicated by the dashed lower limit line.

На фиг. 13 показано биораспределение вектора (геномы вектора/диплоидный геном) и экспрессия трансгена (транскрипты/мкг РНК) в образцах периферической ткани вне головного мозга. Показанные образцы периферической ткани представляют собой спинной мозг C2/L4 (SC C2/L4), межпозвонковый узел C2/L4 (DRG C2/L4), печень, селезенка, сердце, почки, легкие, поджелудочная железа и семенники/яичники. Среднее значение VCN (векторное биораспределение) и транскрипта (экспрессия трансгена) в головном мозге приматов показано пунктирной линией.In fig. Figure 13 shows vector biodistribution (vector genomes/diploid genome) and transgene expression (transcripts/μg RNA) in peripheral tissue samples outside the brain. Peripheral tissue samples shown are spinal cord C2/L4 (SC C2/L4), intervertebral ganglion C2/L4 (DRG C2/L4), liver, spleen, heart, kidney, lung, pancreas, and testes/ovaries. The average VCN (vector biodistribution) and transcript (transgene expression) values in the primate brain are shown by the dotted line.

Подробное описание настоящего изобретенияDetailed Description of the Present Invention

В настоящем документе представлены сконструированные факторы транскрипции или eTF, которые не встречаются в природе и были разработаны для связывания с целевым сайтом генома и модуляции экспрессии представляющего интерес эндогенного гена. Такие eTF могут быть созданы для усиления или подавления экспрессии (экспрессии РНК и/или белка) представляющего интерес гена. В настоящем документе также представлены сайты связывания микроРНК, которые могут быть включены в вирусный вектор и обеспечивать селективную экспрессию трансгена в парвальбумин-содержащих нейронах (PV).Presented herein are engineered transcription factors or eTFs that are not naturally occurring and have been designed to bind to a target site in the genome and modulate the expression of an endogenous gene of interest. Such eTFs can be designed to enhance or suppress the expression (RNA and/or protein expression) of a gene of interest. This document also provides microRNA binding sites that can be incorporated into a viral vector and allow selective expression of the transgene in parvalbumin-containing neurons (PVs).

Согласно одному аспекту в настоящей заявке представлены eTF, которые способны повышать экспрессию гена альфа-субъединицы 1 натриевого потенциалзависимого канала (SCN1A) и повышать экспрессию его соответствующего белкового продукта Nav1.1, a также способы их применения для лечения заболеваний или нарушений, связанных с дефицитом Nav1.1, такие как, например, синдром Драве.In one aspect, the present application provides eTFs that are capable of increasing the expression of the sodium voltage channel alpha subunit 1 (SCN1A) gene and increasing the expression of its corresponding protein product Nav1.1, as well as methods of using them to treat diseases or disorders associated with Nav1 deficiency .1, such as Dravet syndrome.

Согласно другому аспекту в настоящей заявке предусмотрены сайты связывания микроРНК, которые снижают экспрессию мРНК, содержащей сайт связывания микроРНК, в возбуждающих нейронах, тем самым приводя к селективной экспрессии гена в ГАМКергических нейронах или парвальбуминсодержащих нейронах (PV), и способы их применения для селективной экспрессии представляющего интерес гена в нейронах PV.In another aspect, the present application provides microRNA binding sites that reduce the expression of miRNA binding site-containing mRNA in excitatory neurons, thereby leading to selective gene expression in GABAergic neurons or parvalbumin containing neurons (PV), and methods of using them to selectively express a representative gene. gene of interest in PV neurons.

Определения.Definitions.

Используемые в настоящем документе формы единственного числа предназначены для включения и форм множественного числа, если контекст явно не указывает на иное. Кроме того, в той степени, в которой термины включая в себя, включает в себя, имеющий, имеет, с или их варианты используются либо в подробном описании, либо в формуле изобретения, такие термины предназначены для включения аналогично термину содержащий.The singular forms used herein are intended to include the plural unless the context clearly indicates otherwise. Moreover, to the extent that the terms including, includes, having, has, with, or variants thereof are used either in the detailed description or in the claims, such terms are intended to be included in the same manner as the term containing.

Термин приблизительно или примерно означает в пределах допустимого диапазона ошибок для конкретного значения, определенного специалистом в настоящей области техники, который будет частично зависеть от того, как значение измеряется или определяется, т.е. ограничения системы измерения. Например, приблизительно может означать в пределах одного или более чем одного стандартного отклонения в соответствии с практикой в настоящей области техники. В качестве альтернативы приблизительно может означать диапазон до 20%, до 15%, до 10%, до 5% или до 1% от заданного значения.The term approximately or roughly means within the acceptable range of error for a particular value as determined by one skilled in the art, which will depend in part on how the value is measured or determined, i.e. limitations of the measurement system. For example, approximately may mean within one or more than one standard deviation in accordance with practice in the art. Alternatively, approximately may mean a range of up to 20%, up to 15%, up to 10%, up to 5%, or up to 1% of the target value.

Термины определение, измерение, оценка, оценивание, анализ и их грамматические эквиваленты могут использоваться в настоящем документе взаимозаменяемо для обозначения любой формы измерения и включают в себя определение того, присутствует элемент или нет (например, обнаружение). Эти термины могут включать в себя как количественные, так и/или качественные определения. Оценка может быть относительной или абсолютной.The terms definition, measurement, assessment, evaluation, analysis, and their grammatical equivalents may be used interchangeably herein to refer to any form of measurement and include determining whether an item is present or not (eg, detection). These terms may include both quantitative and/or qualitative definitions. The rating can be relative or absolute.

Термин экспрессия относится к процессу, с помощью которого последовательность нуклеиновой кислоты или полинуклеотид транскрибируется с матрицы ДНК (например, в мРНК или другой транскрипт РНК), и/или процессу, посредством которого транскрибированная мРНК впоследствии транслируется в пептиды, полипептиды или белки. Транскрипты и кодируемые полипептиды можно вместе назыThe term expression refers to the process by which a nucleic acid sequence or polynucleotide is transcribed from a DNA template (eg, into mRNA or other RNA transcript), and/or the process by which the transcribed mRNA is subsequently translated into peptides, polypeptides or proteins. Transcripts and encoded polypeptides can be called together

- 9 046157 вать генным продуктом. Если полинуклеотид происходит из геномной ДНК, экспрессия может включать в себя сплайсинг мРНК в эукариотической клетке.- 9 046157 to produce a gene product. If the polynucleotide is derived from genomic DNA, expression may involve splicing of the mRNA in the eukaryotic cell.

Используемые в настоящем документе термины функционально связанный, функциональная связь или их грамматические эквиваленты относятся к сопоставлению генетических элементов, например, промотора, энхансера, последовательности полиаденилирования и т.д., причем элементы находятся во взаимосвязи, позволяющей им работать ожидаемым образом. Например, регуляторный элемент, который может включать в себя промоторные и/или энхансерные последовательности, функционально связан с кодирующей областью, если регуляторный элемент помогает инициировать транскрипцию кодирующей последовательности. Между регуляторным элементом и кодирующей областью могут быть промежуточные остатки, пока сохраняется эта функциональная связь. Используемый в настоящем документе термин вектор относится к макромолекуле или ассоциации макромолекул, которая содержит полинуклеотид или ассоциируется с ним и которая может использоваться для опосредования доставки полинуклеотида в клетку. Примеры векторов включают в себя плазмиды, вирусные векторы, липосомы и другие носители для доставки генов. Вектор, как правило, содержит генетические элементы, например, регуляторные элементы, функционально связанные с геном для облегчения экспрессии гена в мишени.As used herein, the terms operably linked, functionally linked, or their grammatical equivalents refer to the juxtaposition of genetic elements, eg, promoter, enhancer, polyadenylation sequence, etc., where the elements are in a relationship that allows them to function in the expected manner. For example, a regulatory element, which may include promoter and/or enhancer sequences, is operably linked to a coding region if the regulatory element helps initiate transcription of the coding sequence. There may be intermediate residues between the regulatory element and the coding region as long as this functional relationship is maintained. As used herein, the term vector refers to a macromolecule or association of macromolecules that contains or is associated with a polynucleotide and that can be used to mediate delivery of the polynucleotide into a cell. Examples of vectors include plasmids, viral vectors, liposomes and other gene delivery vehicles. The vector typically contains genetic elements, for example, regulatory elements, operably linked to the gene to facilitate expression of the gene in the target.

Используемые в настоящем документе термины кассета экспрессии и кассета нуклеиновой кислоты взаимозаменяемо относятся к комбинации последовательностей нуклеиновых кислот или элементов, которые экспрессируются вместе или функционально связаны для экспрессии. В некоторых случаях кассета экспрессии относится к комбинации регуляторных элементов и гена или генов, с которыми они функционально связаны для экспрессии.As used herein, the terms expression cassette and nucleic acid cassette interchangeably refer to a combination of nucleic acid sequences or elements that are expressed together or operably linked for expression. In some cases, an expression cassette refers to a combination of regulatory elements and the gene or genes to which they are operably linked for expression.

Термин AAV представляет собой сокращение от аденоассоциированного вируса и может использоваться для обозначения самого вируса или его производного. Термин охватывает все серотипы, подтипы, а также встречающиеся в природе и рекомбинантные формы, если не требуется иное. Сокращение rAAV относится к рекомбинантному аденоассоциированному вирусу, также называемому рекомбинантным вектором AAV (или вектором rAAV). Термин AAV включает в себя AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, rh10 и их гибриды, AAV птиц, AAV крупного рогатого скота, AAV собак, AAV лошадей, AAV приматов, AAV не приматов и AAV овец. Геномные последовательности различных серотипов AAV, а также последовательности нативных концевых повторов (TR), белков Rep и субъединиц капсида известны в настоящей области техники. Такие последовательности можно найти в литературе или в общедоступных базах данных, таких как GenBank. Используемый в настоящем документе термин вектор rAAV относится к вектору AAV, содержащему полинуклеотидную последовательность, не имеющую происхождения AAV (т.е. полинуклеотид, гетерологичный AAV), как правило, последовательность, представляющую интерес для генетической трансформации клетки. В общем, гетерологичный полинуклеотид фланкирован по меньшей мере одной, а обычно двумя последовательностями инвертированных концевых повторов AAV (ITR). Вектор rAAV может быть одноцепочечным (ssAAV) или самокомплементарным (scAAV). Вирус AAV или вирусная частица AAV относится к вирусной частице, состоящей по меньшей мере из одного капсидного белка AAV и инкапсидированного полинуклеотидного вектора rAAV. Если частица содержит гетерологичный полинуклеотид (т.е. полинуклеотид, отличный от генома AAV дикого типа, такой как трансген, который должен быть доставлен в клетку млекопитающего), ее обычно называют векторной частицей rAAV или просто частицей rAAV. Таким образом, получение частицы rAAV обязательно включает в себя производство вектора rAAV, поскольку такой вектор содержится в частице rAAV.The term AAV is an abbreviation for adeno-associated virus and can be used to refer to the virus itself or a derivative of it. The term covers all serotypes, subtypes, and naturally occurring and recombinant forms, unless otherwise stated. The abbreviation rAAV refers to recombinant adeno-associated virus, also called recombinant AAV vector (or rAAV vector). The term AAV includes AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, rh10 and their hybrids, avian AAV, bovine AAV, canine AAV, equine AAV, primate AAV , non-primate AAV and sheep AAV. The genomic sequences of various AAV serotypes, as well as the sequences of native terminal repeats (TRs), Rep proteins and capsid subunits are known in the art. Such sequences can be found in the literature or in public databases such as GenBank. As used herein, the term rAAV vector refers to an AAV vector containing a polynucleotide sequence not of AAV origin (ie, a polynucleotide heterologous to AAV), typically a sequence of interest for the genetic transformation of a cell. In general, a heterologous polynucleotide is flanked by at least one, and usually two, AAV inverted terminal repeat (ITR) sequences. The rAAV vector can be single-stranded (ssAAV) or self-complementary (scAAV). An AAV virus or AAV viral particle refers to a viral particle consisting of at least one AAV capsid protein and an encapsidated rAAV polynucleotide vector. If the particle contains a heterologous polynucleotide (ie, a polynucleotide different from the wild-type AAV genome, such as a transgene to be delivered into a mammalian cell), it is commonly referred to as an rAAV vector particle or simply an rAAV particle. Thus, production of an rAAV particle necessarily involves production of an rAAV vector, since such a vector is contained within the rAAV particle.

Используемые в настоящем документе термины лечить, лечение, терапия и т.п. относятся к облегчению, задержке или замедлению прогрессирования, профилактике, ослаблению, уменьшению эффектов или симптомов, предотвращению возникновения, ингибированию или облегчению начало заболеваний или нарушений. Способы настоящего раскрытия можно использовать с любым млекопитающим. Примеры млекопитающих включают в себя, без ограничения, крыс, кошек, собак, лошадей, коров, овец, свиней и, более предпочтительно, людей. Терапевтический эффект включает в себя искоренение или улучшение основного подлежащего лечению заболевания. Кроме того, терапевтический эффект достигается за счет устранения или облегчения одного или нескольких физиологических симптомов, связанных с основным заболеванием, так что улучшение наблюдается у субъекта, несмотря на то, что субъект все еще может страдать от основного нарушения. В некоторых случаях с профилактической целью терапевтическое средство можно вводить субъекту с риском развития определенного заболевания или субъекту, сообщающему об одном или нескольких физиологических симптомах заболевания, даже если диагноз этого заболевания не был поставлен. Способы настоящего раскрытия можно использовать с любым млекопитающим. В некоторых случаях лечение может привести к уменьшению или прекращению симптомов (например, снижению частоты, продолжительности и/или тяжести припадков). Профилактический эффект включает в себя отсрочку или устранение появления заболевания или состояния, отсрочку или устранение появления симптомов заболевания или состояния, замедление, остановку или обращение вспять прогрессирования заболевания или состояния или любую их комбинацию.As used herein, the terms treat, treatment, therapy, etc. refer to alleviating, delaying or delaying the progression of, preventing, mitigating, reducing the effects or symptoms of, preventing the occurrence of, inhibiting or alleviating the onset of diseases or disorders. The methods of the present disclosure can be used with any mammal. Examples of mammals include, but are not limited to, rats, cats, dogs, horses, cows, sheep, pigs, and, more preferably, humans. The therapeutic effect includes eradication or improvement of the underlying disease being treated. In addition, a therapeutic effect is achieved by eliminating or alleviating one or more physiological symptoms associated with the underlying disorder, such that improvement is observed in the subject although the subject may still be suffering from the underlying disorder. In some cases, for prophylactic purposes, a therapeutic agent can be administered to a subject at risk of developing a particular disease or to a subject reporting one or more physiological symptoms of a disease, even if the diagnosis of that disease has not been made. The methods of the present disclosure can be used with any mammal. In some cases, treatment may result in a reduction or cessation of symptoms (eg, reduction in the frequency, duration, and/or severity of seizures). A prophylactic effect includes delaying or eliminating the onset of a disease or condition, delaying or eliminating the onset of symptoms of a disease or condition, slowing, stopping or reversing the progression of a disease or condition, or any combination thereof.

Термин эффективное количество или терапевтически эффективное количество относится к тому количеству описанной в настоящем документе композиции, которого достаточно для воздействия наThe term effective amount or therapeutically effective amount refers to that amount of a composition described herein that is sufficient to affect

- 10 046157 предполагаемое применение, включая в себя, без ограничения, лечение заболевания, как определено ниже. Терапевтически эффективное количество может варьироваться в зависимости от предполагаемого лечебного применения (in vivo) или субъекта и подвергаемого лечению патологического состояния, например, массы и возраста субъекта, тяжести патологического состояния, способа введения и т.п., что может легко определить специалист в настоящей области техники. Этот термин также применяется к дозе, которая вызовет конкретный ответ в целевой клетке. Конкретная доза будет варьироваться в зависимости от конкретной выбранной композиции, схемы дозированного введения, которую необходимо соблюдать, вводится ли она в комбинации с другими соединениями, времени введения, ткани, в которую ее вводят, и физической системы доставки, в которой она вводится.- 10 046157 intended use, including, without limitation, the treatment of a disease as defined below. The therapeutically effective amount may vary depending on the intended therapeutic use (in vivo) or the subject and the pathological condition being treated, for example, the weight and age of the subject, the severity of the pathological condition, the route of administration, etc., as can be readily determined by one skilled in the art. technology. The term also applies to the dose that will produce a specific response in the target cell. The specific dosage will vary depending on the particular composition chosen, the dosage schedule to be followed, whether it is administered in combination with other compounds, the time of administration, the tissue into which it is administered, and the physical delivery system in which it is administered.

Фрагмент нуклеотидной или пептидной последовательности относится к последовательности, которая короче эталонной или полноразмерной последовательности.A nucleotide or peptide sequence fragment refers to a sequence that is shorter than the reference or full-length sequence.

Вариант молекулы относится к аллельным вариациям таких последовательностей, т.е. к последовательности, по существу сходной по структуре и биологической активности либо со всей молекулой, либо с ее фрагментом.Molecule variant refers to allelic variations of such sequences, i.e. to a sequence substantially similar in structure and biological activity to either the entire molecule or a fragment thereof.

Функциональный фрагмент последовательности ДНК или белка относится к фрагменту, который сохраняет биологическую активность (функциональную или структурную), которая по существу аналогична биологической активности полноразмерной последовательности ДНК или белка. Биологическая активность последовательности ДНК может заключаться в ее способности влиять на экспрессию способом, который, как известно, приписывается полноразмерной последовательности.A functional fragment of a DNA or protein sequence refers to a fragment that retains biological activity (functional or structural) that is substantially similar to the biological activity of the full-length DNA or protein sequence. The biological activity of a DNA sequence may lie in its ability to influence expression in a manner known to be attributable to the full-length sequence.

Термины субъект и индивидуум используются в настоящем документе взаимозаменяемо для обозначения позвоночного животного, предпочтительно, млекопитающего, более предпочтительно, человека. Описанные в настоящем документе способы могут быть применимы в терапевтических целях для человека, в ветеринарии и/или в доклинических исследованиях на животных моделях заболевания или состояния.The terms subject and individual are used interchangeably herein to refer to a vertebrate animal, preferably a mammal, more preferably a human. The methods described herein may be useful for human therapeutic purposes, veterinary medicine, and/or preclinical studies in animal models of a disease or condition.

Термин in vivo относится к событию, которое происходит в организме субъекта.The term in vivo refers to an event that occurs in the body of a subject.

Термин in vitro относится к событию, которое происходит вне тела субъекта. Например, анализ in vitro включает в себя любой анализ, проводимый вне субъекта. Анализы in vitro включают в себя анализы на основе клеток, в которых используются живые или мертвые клетки. Анализы in vitro также включают в себя бесклеточный анализ, в котором не используются интактные клетки.The term in vitro refers to an event that occurs outside the subject's body. For example, an in vitro assay includes any assay performed outside the subject. In vitro assays include cell-based assays that use live or dead cells. In vitro assays also include cell-free assays, which do not use intact cells.

В общем, идентичность последовательностей или гомология последовательностей, которые могут использоваться взаимозаменяемо, относятся к точному соответствию нуклеотид-нуклеотид или аминокислота-аминокислота двух полинуклеотидных или полипептидных последовательностей, соответственно. Как правило, способы определения идентичности последовательностей включают в себя сравнение двух нуклеотидных или аминокислотных последовательностей и определение их процентной идентичности. Сравнение последовательностей, например, с целью оценки идентичности, может быть выполнено с помощью любого подходящего алгоритма выравнивания, включая в себя, без ограничения, алгоритм Нидлмана-Вунша (см., например, выравниватель EMBOSS Needle, доступный на www.ebi.ac.uk/Tools/psa/emboss_needle/, необязательно с настройками по умолчанию), алгоритм BLAST (см., например, инструмент выравнивания BLAST, доступный на blast.ncbi.nlm.nih.gov/Blast.cgi, необязательно с настройками по умолчанию) и алгоритм Смита-Уотермана (см., например, выравниватель EMBOSS Water, доступный на www.ebi.ac.uk/Tools/psa/emboss_water/, необязательно с настройками по умолчанию). Оптимальное выравнивание можно оценить с использованием любых подходящих параметров выбранного алгоритма, включая в себя параметры по умолчанию. Процент идентичности, также называемый процент гомологии, между двумя последовательностями может быть рассчитан как количество точных совпадений между двумя оптимально выровненными последовательностями, деленное на длину эталонной последовательности и умноженное на 100. Процент идентичности также может быть определен, например, путем сравнения информации о последовательностях с использованием усовершенствованной компьютерной программы BLAST, включая в себя версию 2.2.9, доступную в Национальных институтах здравоохранения. Программа BLAST основана на способе совмещения Karlin and Altschul, Proc. Natl. Acad. Sci. USA 87:2264-2268 (1990) и как описано в Altschul, et al., J. Mol. Biol. 215:403-410 (1990); Karlin and Altschul, Proc. Natl. Acad. Sci. USA 90:5873-5877 (1993) и Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997). Вкратце, программа BLAST определяет идентичность как количество идентичных выровненных символов (т.е. нуклеотидов или аминокислот), деленное на общее количество символов в более короткой из двух последовательностей. Программа может использоваться для определения процента идентичности по всей длине сравниваемых последовательностей. Параметры по умолчанию предоставляются для оптимизации поиска с помощью коротких последовательностей запросов, например, с помощью программы blastp. Программа также позволяет использовать фильтр SEG для маскировки сегментов последовательностей запросов, как это определено программой SEG Wootton and Federhen, Computers and Chemistry 17: 149-163 (1993). Высокая идентичность последовательностей, как правило, включает в себя диапазоны идентичности последовательностей от приблизительно 80% до 100% и целые числа между ними. Используемый в настоящем документе термин сконструированный применительно к белку относится к не встречающемуся в природе белку, включая в себя, без ограничеIn general, sequence identity or sequence homology, which can be used interchangeably, refers to the exact nucleotide-nucleotide or amino acid-amino acid match of two polynucleotide or polypeptide sequences, respectively. Typically, methods for determining sequence identity involve comparing two nucleotide or amino acid sequences and determining their percentage identity. Comparison of sequences, for example for the purpose of identity assessment, can be performed using any suitable alignment algorithm, including, without limitation, the Needleman-Wunsch algorithm (see, for example, the EMBOSS Needle aligner, available at www.ebi.ac.uk /Tools/psa/emboss_needle/, optional with default settings), the BLAST algorithm (see, for example, the BLAST alignment tool available at blast.ncbi.nlm.nih.gov/Blast.cgi, optional with default settings), and Smith-Waterman algorithm (see, for example, the EMBOSS Water equalizer, available at www.ebi.ac.uk/Tools/psa/emboss_water/, optionally with default settings). Optimal alignment can be assessed using any appropriate parameters of the selected algorithm, including default parameters. Percent identity, also called percent homology, between two sequences can be calculated as the number of exact matches between two optimally aligned sequences divided by the length of the reference sequence and multiplied by 100. Percent identity can also be determined, for example, by comparing sequence information using improved BLAST computer program, including version 2.2.9, available from the National Institutes of Health. The BLAST program is based on the alignment method of Karlin and Altschul, Proc. Natl. Acad. Sci. USA 87:2264-2268 (1990) and as described in Altschul, et al., J. Mol. Biol. 215:403-410 (1990); Karlin and Altschul, Proc. Natl. Acad. Sci. USA 90:5873-5877 (1993) and Altschul et al., Nucleic Acids Res. 25:3389–3402 (1997). Briefly, the BLAST program defines identity as the number of identical aligned characters (i.e., nucleotides or amino acids) divided by the total number of characters in the shorter of the two sequences. The program can be used to determine the percentage of identity over the entire length of the sequences being compared. Default parameters are provided to optimize searches using short sequences of queries, such as using the blastp program. The program also allows the SEG filter to be used to mask segments of query sequences, as defined by the SEG program Wootton and Federhen, Computers and Chemistry 17: 149-163 (1993). High sequence identity generally includes sequence identity ranges from approximately 80% to 100% and integers in between. As used herein, the term engineered protein refers to a non-naturally occurring protein, including, but not limited to

- 11 046157 ния, белок, полученный из встречающегося в природе белка, или когда встречающийся в природе белок модифицирован или перепрограммирован, чтобы иметь определенное свойство.- 11 046157 nia, a protein derived from a naturally occurring protein, or when a naturally occurring protein is modified or reprogrammed to have a specific property.

Используемые в настоящем документе термины синтетический и искусственный используются взаимозаменяемо для обозначения белка или его домена, который характеризуется низкой идентичностью последовательности (например, идентичность последовательности составляет менее чем 50%) по отношению к встречающемуся в природе белку человека. Например, домены VPR и VP64 представляют собой синтетические домены трансактивации.As used herein, the terms synthetic and artificial are used interchangeably to refer to a protein or domain thereof that has low sequence identity (eg, less than 50% sequence identity) to a naturally occurring human protein. For example, the VPR and VP64 domains are synthetic transactivation domains.

Используемый в настоящем документе термин сконструированный фактор транскрипции или eTF относится к не встречающемуся в природе ДНК-связывающему белку или не встречающемуся в природе модулятору транскрипции, который был модифицирован или перепрограммирован для связывания со специфическим целевым сайтом связывания и/или включения модифицированного или замененного эффекторного домена транскрипции.As used herein, the term engineered transcription factor or eTF refers to a non-naturally occurring DNA-binding protein or non-naturally occurring transcription modulator that has been modified or reprogrammed to bind to a specific target binding site and/or to include a modified or replaced transcription effector domain. .

Используемый в настоящем документе термин ДНК-связывающий домен может использоваться для обозначения одного или нескольких ДНК-связывающих мотивов, таких как цинковый палец или основной мотив спираль-петля-спираль (bHLH), индивидуально или вместе как часть ДНКсвязывающего белка.As used herein, the term DNA binding domain can be used to refer to one or more DNA binding motifs, such as a zinc finger or a basic helix-loop-helix (bHLH) motif, individually or together as part of a DNA-binding protein.

Термины активирующий транскрипцию домен, домен активации транскрипции, домен трансактивации, транс-активирующий домен и TAD используются в настоящем документе взаимозаменяемо и относятся к домену белка, который вместе с ДНК-связывающим доменом может активировать транскрипцию с промотора, контактируя с транскрипционным аппаратом (например, с общими факторами транскрипции и/или РНК-полимеразой) либо напрямую, либо через другие белки, известные как коактиваторы.The terms transcription activation domain, transcription activation domain, transactivation domain, trans-activation domain, and TAD are used interchangeably herein and refer to a protein domain that, together with a DNA binding domain, can activate transcription from a promoter by contacting the transcription machinery (e.g. general transcription factors and/or RNA polymerase) either directly or through other proteins known as coactivators.

Термины домен репрессора транскрипции и TRD используются в настоящем документе взаимозаменяемо и относятся к домену белка, который в сочетании с ДНК-связывающим доменом может репрессировать транскрипцию с промотора, контактируя с транскрипционным механизмом (например, общие факторы транскрипции и/или РНК-полимераза) либо напрямую, либо через другие белки, известные как корепрессоры.The terms transcriptional repressor domain and TRD are used interchangeably herein and refer to a protein domain that, in combination with a DNA-binding domain, can repress transcription from a promoter by contact with transcription machinery (e.g., general transcription factors and/or RNA polymerase) or directly , or through other proteins known as corepressors.

Термин GRCh38.p12 относится к заплаточному релизу 12 Консорциума эталонных геномов Human Build 38 (GRCh38.p12), имеющему регистрационный номер сборки GenBank GCA_000001405.27 и датированному 21 декабря 2017 года.The term GRCh38.p12 refers to Human Genome Reference Consortium Build 38 patch release 12 (GRCh38.p12), having GenBank build accession number GCA_000001405.27 and dated December 21, 2017.

Если не указано иное, все термины, использованные в настоящем документе, характеризуются тем же значением, что и для специалиста в настоящей области техники, и в практике настоящего изобретения будут использоваться традиционные способы молекулярной биологии, микробиологии и технологии рекомбинантных ДНК, которые находятся в пределах знания специалистов в настоящей области техники.Unless otherwise specified, all terms used herein have the same meaning as those of ordinary skill in the art, and the practice of the present invention will utilize conventional techniques of molecular biology, microbiology, and recombinant DNA technology that are within the scope of knowledge specialists in the present field of technology.

Сконструированные факторы транскрипции (eTF), которые активируют SCN1AEngineered transcription factors (eTFs) that activate SCN1A

Согласно одному аспекту в настоящей заявке представлены eTF, которые способны повышать экспрессию гена альфа-субъединицы 1 натриевого канала с регулируемым напряжением (SCN1A) и увеличивать экспрессию его соответствующего белкового продукта Nav1.1. Ген SCN1A принадлежит к семейству генов, кодирующих субъединицы, используемые для сборки натриевых каналов. Эти каналы, которые транспортируют положительно заряженные ионы натрия в клетки, играют ключевую роль в способности клетки генерировать и передавать электрические сигналы. Ген SCN1A кодирует одну часть (альфасубъединицу) натриевого канала, называемого Nav1.1. Эти каналы в основном находятся в головном мозге, где они контролируют поток ионов натрия в клетки. Каналы Nav1.1 участвуют в передаче сигналов от одной нервной клетки (или нейрона) к другой. Было обнаружено, что несколько мутаций в гене SCN1A вызывают генетическую эпилепсию с фебрильными припадками плюс (GEFS+), которая представляет собой спектр припадочных расстройств различной степени тяжести. Эти состояния включают в себя простые фебрильные (связанные с лихорадкой) припадки, которые начинаются в младенчестве и обычно прекращаются к 5 годам, и фебрильные припадки плюс (FS+). FS+ включает в себя фебрильные и другие типы припадков, в том числе не связанные с лихорадкой (афебрильные припадки), которые продолжаются во взрослом возрасте. Спектр GEFS+ также включает в себя другие состояния, такие как синдром Драве (также известный как тяжелая миоклоническая эпилепсия младенчества или SMEI), которые вызывают более серьезные припадки, которые длятся дольше и которые трудно контролировать. Эти повторяющиеся припадки (эпилепсия) могут со временем обостряться и часто сопровождаются снижением функции головного мозга. Многие другие мутации были связаны с семейной гемиплегической мигренью, формой мигренозной головной боли, которая передается в семье, и по меньшей мере одна мутация была связана с эффективностью некоторых противосудорожных лекарственных средств. Таким образом, представленный в настоящем документе eTF, который увеличивает экспрессию SCN1A, можно использовать для лечения множества заболеваний или нарушений, связанных с мутациями в канале Nav1.1.In one aspect, the present application provides eTFs that are capable of increasing the expression of the voltage-regulated sodium channel alpha subunit 1 (SCN1A) gene and increasing the expression of its corresponding protein product Nav1.1. The SCN1A gene belongs to a family of genes that encode subunits used to assemble sodium channels. These channels, which transport positively charged sodium ions into cells, play a key role in the cell's ability to generate and transmit electrical signals. The SCN1A gene encodes one part (alpha subunit) of a sodium channel called Nav1.1. These channels are primarily found in the brain, where they control the flow of sodium ions into cells. Nav1.1 channels are involved in transmitting signals from one nerve cell (or neuron) to another. Several mutations in the SCN1A gene have been found to cause genetic epilepsy with febrile seizures plus (GEFS+), which is a spectrum of seizure disorders of varying severity. These conditions include simple febrile (fever-associated) seizures, which begin in infancy and usually resolve by age 5, and febrile seizures plus (FS+). FS+ includes febrile and other types of seizures, including those not associated with fever (afebrile seizures) that continue into adulthood. The GEFS+ spectrum also includes other conditions, such as Dravet syndrome (also known as severe myoclonic epilepsy of infancy, or SMEI), which cause more severe seizures that last longer and are difficult to control. These recurring seizures (epilepsy) can get worse over time and are often accompanied by decreased brain function. Many other mutations have been linked to familial hemiplegic migraine, a form of migraine headache that runs in families, and at least one mutation has been linked to the effectiveness of some anticonvulsant drugs. Thus, the eTF presented herein, which increases SCN1A expression, can be used to treat a variety of diseases or disorders associated with mutations in the Nav1.1 channel.

Факторы транскрипции (TF) представляют собой белки, которые связываются с определенными последовательностями в геноме и контролируют экспрессию генов. Сконструированные факторы транскрипции или eTF, представленные в настоящем документе, которые активируют SCN1A, представляют собой не встречающиеся в природе белки, которые содержат ДНК-связывающий домен (DBD) и поTranscription factors (TFs) are proteins that bind to specific sequences in the genome and control gene expression. The engineered transcription factors or eTFs provided herein that activate SCN1A are non-naturally occurring proteins that contain a DNA binding domain (DBD) and

- 12 046157 меньшей мере один домен, который является модулятором транскрипции, например, либо домен активации транскрипции (TAD), либо транскрипционный репрессорный домен (TRD). Согласно одному варианту осуществления eTF, который активирует SCN1A, может содержать DBD и TAD (например, TADDBD или DBD-TAD), причем DBD и TAD могут происходить из одного и того же белка или из разных белков. Согласно другому варианту осуществления eTF, который активирует SCN1A, может содержать DBD и два TAD, причем DBD и TAD происходят из одного и того же белка, DBD происходит из первого белка, и оба TAD происходят из второго белка, DBD и один TAD происходит из первого белка, а второй TAD происходит из второго белка, или DBD происходит из первого белка, один TAD происходит из второго белка, а второй TAD происходит из третьего белка (например, TAD1-DBD-TAD1, TAD1-DBDTAD2, TAD1-TAD1-DBD, TAD1-TAD2-DBD, DBD-TAD1-TAD1 или DBD-TAD1-TAD2). Согласно другому варианту осуществления eTF, который активирует SCN1A, может содержать DBD и три TAD, причем DBD и TAD происходят из одного и того же белка, DBD происходит из первого белка, a TAD происходят из одного или нескольких разных белков, или причем DBD и все TAD происходят из разных белков, например, TADX-TADX-TADX-DBD, TADX-TADX-DBD-TADX, TADX-DBD-TADX-TADX или DBDTADX-TADX-TADX, где каждый X выбран независимо и может быть таким же или отличным от одного или всех других TAD. Примеры включают в себя, например, TAD1-TAD1-DBD-TAD1, TAD1-TAD1DBD-TAD2, TAD1-TAD2-DBD-TAD1, TAD1-TAD2-DBD-TAD2, TAD1-TAD2-DBD-TAD3, TAD1-DBDTAD1-TAD1, TAD1- DBD-TAD2-TAD2, TAD1-DBD-TAD1-TAD2, TAD2-DBD-TAD1-TAD2, TAD1DBD-TAD2-TAD3, TAD1-TAD1-TAD1-DBD, TAD1-TAD2-TAD2-DBD, TAD1-TAD2-TAD2-DBD, TAD1TAD2-TAD3-DBD, DBD-TAD1-TAD1-TAD1, DBD-TAD1-TAD1-TAD2, DBD-TAD1-TAD2-TAD2 или- 12 046157 at least one domain that is a transcription modulator, for example, either a transcription activation domain (TAD) or a transcription repressor domain (TRD). In one embodiment, the eTF that activates SCN1A may comprise a DBD and a TAD (eg, TADDBD or DBD-TAD), wherein the DBD and TAD may be derived from the same protein or from different proteins. In another embodiment, an eTF that activates SCN1A may comprise a DBD and two TADs, wherein the DBD and one TAD are derived from the same protein, the DBD is derived from the first protein and both TADs are derived from the second protein, the DBD and one TAD are derived from the first protein and a second TAD is derived from a second protein, or a DBD is derived from a first protein, one TAD is derived from a second protein, and a second TAD is derived from a third protein (e.g., TAD1-DBD-TAD1, TAD1-DBDTAD2, TAD1-TAD1-DBD, TAD1-TAD2-DBD, DBD-TAD1-TAD1 or DBD-TAD1-TAD2). In another embodiment, an eTF that activates SCN1A may comprise a DBD and three TADs, wherein the DBD and TAD are derived from the same protein, the DBD is derived from the first protein, and the TADs are derived from one or more different proteins, or the DBD and all TADs come from different proteins, for example TAD X -TAD X -TAD X -DBD, TAD X -TAD X -DBD-TAD X , TAD X -DBD-TAD X -TAD X or DBDTAD X -TAD X -TAD X. where each X is independently selected and may be the same or different from one or all other TADs. Examples include, for example, TAD1-TAD1-DBD-TAD1, TAD1-TAD1DBD-TAD2, TAD1-TAD2-DBD-TAD1, TAD1-TAD2-DBD-TAD2, TAD1-TAD2-DBD-TAD3, TAD1-DBDTAD1-TAD1 , TAD1-DBD-TAD2-TAD2, TAD1-DBD-TAD1-TAD2, TAD2-DBD-TAD1-TAD2, TAD1DBD-TAD2-TAD3, TAD1-TAD1-TAD1-DBD, TAD1-TAD2-TAD2-DBD, TAD1-TAD2 -TAD2-DBD, TAD1TAD2-TAD3-DBD, DBD-TAD1-TAD1-TAD1, DBD-TAD1-TAD1-TAD2, DBD-TAD1-TAD2-TAD2 or

DBD-TAD1-TAD2-TAD3 и т.д. Согласно другому варианту осуществления eTF, который активирует SCN1A, может содержать DBD и четыре TAD, причем DBD и TAD происходят из одного и того же белка, DBD происходит из первого белка, a TAD происходят из одного или нескольких разных белки, или причем DBD и все TAD происходят из разных белков, например, TADX-TADX-TADX-TADX-DBD, TADXTADX-TADX-DBD-TADX, TADX-TADX-DBD-TADX-TADX, TADX- DBD-TADX-TADX-TADX или DBDTADX-TADX-TADX-TADX, где каждый X выбирается независимо и может быть таким же или отличаться от одного или всех других TAD. Примеры включают в себя, например, TAD1-TAD1-DBD-TAD1-TAD1,DBD-TAD1-TAD2-TAD3, etc. In another embodiment, an eTF that activates SCN1A may comprise a DBD and four TADs, wherein the DBD and TAD are derived from the same protein, the DBD is derived from the first protein, and the TADs are derived from one or more different proteins, or wherein the DBD and all TADs come from different proteins, for example TADX-TADX-TADX-TADX-DBD, TADXTADX-TADX-DBD-TADX, TADX-TADX-DBD-TADX-TADX, TADX-DBD-TADX-TADX-TADX or DBDTAD X -TAD X -TAD X -TAD X , where each X is independently selected and may be the same or different from one or all other TADs. Examples include, for example, TAD1-TAD1-DBD-TAD1-TAD1,

TAD 1 -TAD 1-DBD-TAD2-TAD2, TAD1-TAD2-DBD-TAD1-TAD3, TAD 1 -TAD 1 -TAD 1-DBD-TAD2, TAD 1-DBD-TAD2-TAD3-TAD4, TAD 1-DBD-TAD2-TAD3-TAD4,TAD 1 -TAD 1-DBD-TAD2-TAD2, TAD1-TAD2-DBD-TAD1-TAD3, TAD 1 -TAD 1 -TAD 1-DBD-TAD2, TAD 1-DBD-TAD2-TAD3-TAD4, TAD 1-DBD -TAD2-TAD3-TAD4,

TAD 1-TAD2-DBD-TAD1-TAD2, TAD 1-TAD3-DBD-TAD1-TAD2, TAD 1-TAD2-TAD3-DBD-TAD4, TAD 1 -DBD-TAD 1-TAD2-TAD3, TAD 1 -TAD 1 -TAD 1 -TAD 1 -DBD,TAD 1-TAD2-DBD-TAD1-TAD2, TAD 1-TAD3-DBD-TAD1-TAD2, TAD 1-TAD2-TAD3-DBD-TAD4, TAD 1 -DBD-TAD 1-TAD2-TAD3, TAD 1 -TAD 1 -TAD 1 -TAD 1 -DBD,

TAD 1-TAD2-DBD-TAD2-TAD1, TAD 1-TAD2-DBD-TAD3-TAD4, TAD 1 -DBD-TAD 1 -TAD 1-TAD2, TAD2-DBD-TAD1-TAD2-TAD3, TAD 1-TAD2-TAD2-TAD3-DBD,TAD 1-TAD2-DBD-TAD2-TAD1, TAD 1-TAD2-DBD-TAD3-TAD4, TAD 1 -DBD-TAD 1 -TAD 1-TAD2, TAD2-DBD-TAD1-TAD2-TAD3, TAD 1-TAD2- TAD2-TAD3-DBD,

TAD1-TAD2-TAD3-TAD4-DBD, DBD-TAD1-TAD1-TAD1-TAD1, DBD-TAD1-TAD1-TAD2-TAD2, DBDTAD1-TAD2-TAD3-TAD4 или DBD-TAD1-TAD2-TAD3-TAD3 и т.д. Согласно одному варианту осуществления eTF, который активирует SCN1A, содержит DBD и два TAD, которые расположены на одном конце DBD (например, N-конце или C-конце), причем DBD происходит из первого белка, и оба TAD происходят из второго белка, или DBD происходит из первого белка, один TAD происходит из второго белка, а второй TAD происходит из третьего белка (например, TAD1-TAD1-DBD, TAD1-TAD2-DBD, DBD-TAD1-TAD1 или DBD-TAD1-TAD2). Согласно определенным вариантам осуществления DBD может представлять собой синтетическую конструкцию, содержащую домены из нескольких белков.TAD1-TAD2-TAD3-TAD4-DBD, DBD-TAD1-TAD1-TAD1-TAD1, DBD-TAD1-TAD1-TAD2-TAD2, DBDTAD1-TAD2-TAD3-TAD4 or DBD-TAD1-TAD2-TAD3-TAD3, etc. d. In one embodiment, the eTF that activates SCN1A comprises a DBD and two TADs that are located at one end of the DBD (e.g., the N-terminus or the C-terminus), wherein the DBD is derived from a first protein and both TADs are derived from a second protein, or A DBD is derived from a first protein, one TAD is derived from a second protein, and a second TAD is derived from a third protein (e.g., TAD1-TAD1-DBD, TAD1-TAD2-DBD, DBD-TAD1-TAD1, or DBD-TAD1-TAD2). In certain embodiments, the DBD may be a synthetic construct comprising domains from multiple proteins.

Согласно определенным вариантам осуществления DBD и TAD и/или два TAD могут быть напрямую конъюгированы, например, без промежуточной аминокислотной последовательности, DBD и TAD и/или два TAD могут быть конъюгированы с использованием пептидного линкера или их комбинаций. Согласно определенным вариантам осуществления DBD конъюгирован с TAD и/или один TAD конъюгирован со вторым TAD через линкер, содержащий 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 50, 60, 70, 75, 80, 90 или 100 аминокислот или 1-5, 1-10, 1-20, 1-30, 1-40, 1-50, 1-75,In certain embodiments, the DBD and the TAD and/or the two TADs can be directly conjugated, eg, without an intervening amino acid sequence, the DBD and the TAD and/or the two TADs can be conjugated using a peptide linker or combinations thereof. In certain embodiments, the DBD is conjugated to a TAD and/or one TAD is conjugated to a second TAD via a linker containing 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 , 16, 17, 18, 19, 20, 25, 30, 35, 40, 50, 60, 70, 75, 80, 90 or 100 amino acids or 1-5, 1-10, 1-20, 1-30, 1-40, 1-50, 1-75,

1-100, 5-10, 5-20, 5-30, 5-40, 5-50, 5-75, 5-100, 10-20, 10-30, 10-40, 10-50, 10-75, 10-100, 20-30, 20-40, 2050, 20-75 или 20-100 аминокислот. В некоторых случаях DBD и TAD и/или два TAD конъюгированы через встречающиеся в природе промежуточные остатки, обнаруженные во встречающихся в природе белках, из которых происходят домены. Согласно другим вариантам осуществления DBD и TAD и/или два TAD конъюгированы через синтетическую или экзогенную линкерную последовательность. Подходящие линкеры могут быть гибкими, расщепляемыми, нерасщепляемыми, гидрофильными и/или гидрофобными. Согласно определенным вариантам осуществления DBD и TAD и/или два TAD могут быть слиты вместе через линкер, содержащий множество остатков глицина и/или серина. Примеры пептидных линкеров глицина/серина включают в себя [GS]n, [GGGS]n (SEQ ID NO: 179), [GGGGS]n (SEQ ID NO: 180), [GGSG]n (SEQ ID NO: 181), где n представляет собой целое число, равное или больше 1. Согласно определенным вариантам осуществления линкер, используемый для конъюгирования DBD и TAD и/или двух TAD, представляет собой GGSGGGSG (SEQ ID NO: 177). Согласно определенным вариантам осуществления линкер, используемый для конъюгирования DBD и TAD и/или двух TAD, представляет собой GGSGGGSGGGSGGGSG (SEQ ID NO: 178). Согласно определенным вариантам осуществления, когда DBD конъюгирован с двумя TAD, первый и второй TAD могут быть конъюгированы с DBD с одинаковыми или разными линкерами, или один TAD может быть конъюгирован с DBD с помощью линкера, а1-100, 5-10, 5-20, 5-30, 5-40, 5-50, 5-75, 5-100, 10-20, 10-30, 10-40, 10-50, 10- 75, 10-100, 20-30, 20-40, 2050, 20-75 or 20-100 amino acids. In some cases, a DBD and a TAD and/or two TADs are conjugated through naturally occurring intermediate residues found in the naturally occurring proteins from which the domains are derived. In other embodiments, the DBD and the TAD and/or two TADs are conjugated through a synthetic or exogenous linker sequence. Suitable linkers can be flexible, cleavable, non-cleavable, hydrophilic and/or hydrophobic. In certain embodiments, a DBD and a TAD and/or two TADs can be fused together through a linker containing multiple glycine and/or serine residues. Examples of glycine/serine peptide linkers include [GS]n, [GGGS]n (SEQ ID NO: 179), [GGGGS]n (SEQ ID NO: 180), [GGSG]n (SEQ ID NO: 181), where n is an integer equal to or greater than 1. In certain embodiments, the linker used to conjugate a DBD and a TAD and/or two TADs is GGSGGGSG (SEQ ID NO: 177). In certain embodiments, the linker used to conjugate a DBD and a TAD and/or two TADs is GGSGGGSGGGSGGGSG (SEQ ID NO: 178). In certain embodiments, when a DBD is conjugated to two TADs, the first and second TAD may be conjugated to the DBD with the same or different linkers, or one TAD may be conjugated to the DBD by a linker and

- 13 046157 другой TAD может быть конъюгирован напрямую с DBD (например, без промежуточной линкерной последовательности), или оба TAD могут быть непосредственно конъюгированы с DBD (например, без промежуточных линкерных последовательностей). Согласно определенным вариантам осуществления, когда DBD конъюгирован с двумя TAD на одном и том же конце (например, N-конце или C-конце), линкер, соединяющий два TAD, может быть таким же или отличаться от линкера, соединяющего TAD с DBD, или TAD могут быть конъюгированы друг с другом с помощью линкера, но TAD напрямую конъюгированы с DBD (например, без промежуточной линкерной последовательности), или TAD могут быть напрямую конъюгированы друг с другом (например, без промежуточных линкерных последовательностей), но TAD конъюгированы с DBD с помощью линкера. Согласно определенным вариантам осуществления представленные в настоящем документе eTF, которые активируют SCN1A, не содержат один или несколько тегов HA (например, SEQ ID NO: 171), расположенных между DBD и одним или несколькими TAD.- 13 046157 the other TAD may be conjugated directly to the DBD (eg, without intervening linker sequences), or both TADs may be directly conjugated to the DBD (eg, without intervening linker sequences). In certain embodiments, when a DBD is conjugated to two TADs at the same end (e.g., N-terminus or C-terminus), the linker connecting the two TADs may be the same or different from the linker connecting the TAD to the DBD, or TADs can be conjugated to each other by a linker, but TADs are directly conjugated to a DBD (e.g., without an intervening linker sequence), or TADs can be directly conjugated to each other (e.g., without intervening linker sequences), but TADs are conjugated to a DBD with using a linker. In certain embodiments, eTFs provided herein that activate SCN1A do not contain one or more HA tags (eg, SEQ ID NO: 171) located between the DBD and one or more TADs.

Представленные в настоящем документе eTF, которые активируют SCN1A, обладают свойствами, отличными от природных факторов транскрипции. Согласно определенным вариантам осуществления eTF, который активирует SCN1A, содержит DBD, полученный из встречающегося в природе белка, который был модифицирован таким образом, что DBD связывается с другим целевым сайтом по сравнению с встречающимся в природе белком, из которого он получен, и eTF, содержащий такой модифицированный DBD модулирует экспрессию другого гена (например, SCN1A) по сравнению с природным белком, из которого получен DBD (например, геном, отличным от SCN1A). Согласно другим вариантам осуществления eTF, представленный в настоящем документе, который активирует SCN1A, содержит TAD, полученный из встречающегося в природе белка, который был модифицирован таким образом, что eTF, содержащий такой модифицированный TAD, модулирует экспрессию другого гена (например, SCN1A) по сравнению с встречающимся в природе белком, из которого получен TAD (например, ген, отличный от SCN1A), и/или eTF, содержащий такой модифицированный TAD, по-разному модулирует экспрессию SCN1A (например, активирует или подавляет) по сравнению с встречающимся в природе белком, из которого получен TAD. Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD, полученный из встречающегося в природе белка, и TAD, полученный из встречающегося в природе белка (одного и того же или разных белков), причем как DBD, так и TAD были модифицированы. Согласно таким вариантам осуществления DBD может связываться с другим целевым сайтом по сравнению с встречающимся в природе белком, из которого он был получен, eTF, содержащий такой модифицированный DBD и TAD, модулирует экспрессию другого гена (например, SCN1A) по сравнению с встречающимся в природе белком, из которых получены домены (например, ген(-ы), отличный от SCN1A), и/или eTF, содержащий такие модифицированные DBD и TAD, по-разному модулирует экспрессию SCN1A (например, активирует или подавляет) по сравнению с встречающимися в природе белками, из которых получены домены DBD и TAD.The eTFs presented herein that activate SCN1A have properties distinct from natural transcription factors. In certain embodiments, an eTF that activates SCN1A comprises a DBD derived from a naturally occurring protein that has been modified such that the DBD binds to a different target site than the naturally occurring protein from which it is derived, and an eTF comprising such a modified DBD modulates the expression of a different gene (eg, SCN1A) compared to the native protein from which the DBD is derived (eg, a non-SCN1A gene). In other embodiments, an eTF provided herein that activates SCN1A contains a TAD derived from a naturally occurring protein that has been modified such that the eTF containing such modified TAD modulates the expression of another gene (e.g., SCN1A) relative to with the naturally occurring protein from which the TAD is derived (e.g., a non-SCN1A gene), and/or the eTF containing such a modified TAD modulates SCN1A expression differently (e.g., upregulates or represses) compared to the naturally occurring protein , from which the TAD is derived. In certain embodiments, an eTF provided herein that activates SCN1A comprises a DBD derived from a naturally occurring protein and a TAD derived from a naturally occurring protein (the same or different proteins), wherein both the DBD and the TAD have been modified. In such embodiments, the DBD may bind to a different target site compared to the naturally occurring protein from which it was derived, the eTF containing such a modified DBD and TAD modulates the expression of a different gene (eg, SCN1A) compared to the naturally occurring protein , from which the domains are derived (e.g., gene(s) other than SCN1A), and/or eTF containing such modified DBDs and TADs, modulate SCN1A expression differently (e.g., activate or repress) compared to naturally occurring proteins from which the DBD and TAD domains are derived.

ДНК-связывающие домены (DBD).DNA binding domains (DBDs).

Приведенные в настоящем документе eTF, которые активируют SCN1A, могут содержать любой подходящий DBD, который связывается с представляющим интерес целевым сайтом (например, целевой сайт, который приводит к положительной регуляции SCN1A при связывании с помощью eTF, представленного в настоящем документе). Согласно определенным вариантам осуществления DBD может представлять собой синтетически разработанный DBD. Согласно другим вариантам осуществления DBD может быть получен из встречающегося в природе белка. Семейства DBD включают в себя основную спираль-петлю-спираль (bHLH) (например, c-Myc), основную лейциновую молнию (например, C/EBP), спираль-поворот-спираль (например, Oct-1) и цинковые пальцы (например, EGR1 или EGR3). Эти семейства демонстрируют широкий спектр специфичностей связывания ДНК и генных мишеней. Как предполагается в настоящем документе, любой из известных белков фактора транскрипции человека может служить в качестве белковой платформы для конструирования и/или перепрограммирования DBD для распознавания конкретного целевого сайта, что приводит к модуляции экспрессии эндогенного гена SCN1A. Согласно иллюстративным вариантам осуществления DBD, представленный в настоящем документе, содержит домен типа цинковые пальцы, связывающий домен TALEN или комплекс gRNA/Cas.eTFs provided herein that activate SCN1A may comprise any suitable DBD that binds to a target site of interest (eg, a target site that results in up-regulation of SCN1A when bound by an eTF provided herein). In certain embodiments, the DBD may be a synthetically engineered DBD. In other embodiments, the DBD may be derived from a naturally occurring protein. DBD families include basic helix-loop-helix (bHLH) (e.g., c-Myc), basic leucine zipper (e.g., C/EBP), helix-turn-helix (e.g., Oct-1), and zinc fingers (e.g. , EGR1 or EGR3). These families exhibit a wide range of DNA binding and gene target specificities. As contemplated herein, any of the known human transcription factor proteins can serve as a protein platform to engineer and/or reprogram the DBD to recognize a specific target site, resulting in modulation of endogenous SCN1A gene expression. In exemplary embodiments, the DBD provided herein comprises a zinc finger domain binding a TALEN domain or a gRNA/Cas complex.

Представленный в настоящем документе DBD может быть разработан для распознавания любого целевого сайта, который приводит к активации SCN1A. Согласно иллюстративным вариантам осуществления DBD разработан для распознавания местоположения в геноме и повышения экспрессии эндогенного гена SCN1A, связанного с eTF. Сайты связывания, способные модулировать экспрессию эндогенного гена SCNIA при связывании с помощью представленного в настоящем документе eTF, могут быть расположены в любом месте генома, что приводит к модуляции экспрессии гена SCN1A. Согласно различным вариантам осуществления сайт связывания может быть расположен на хромосоме, отличной от SCN1A, на той же хромосоме, что и SCN1A, выше против хода транскрипции от сайта начала транскрипции (TSS) гена SCN1A, ниже по ходу транскрипции от TSS гена SCN1A, проксимальнее от TSS гена SCN1A, дистальнее от TSS гена SCN1A, в кодирующей области гена SCN1A, в интроне гена SCN1A, ниже по ходу транскрипции от полиА-хвоста гена SCN1A, в промоторной последовательности, которая регулирует ген SCN1A, или в последовательности энхансера, которая регулирует ген SCN1A.The DBD presented herein can be designed to recognize any target site that leads to activation of SCN1A. In exemplary embodiments, the DBD is designed to recognize a genomic location and enhance expression of an endogenous SCN1A gene associated with an eTF. Binding sites capable of modulating the expression of the endogenous SCNIA gene when bound by the eTF provided herein can be located anywhere in the genome, resulting in modulation of SCN1A gene expression. In various embodiments, the binding site may be located on a chromosome other than SCN1A, on the same chromosome as SCN1A, upstream of the transcription start site (TSS) of the SCN1A gene, downstream of the TSS of the SCN1A gene, proximal to TSS of the SCN1A gene, distal to the TSS of the SCN1A gene, in the coding region of the SCN1A gene, in the intron of the SCN1A gene, downstream of the polyA tail of the SCN1A gene, in the promoter sequence that regulates the SCN1A gene, or in the enhancer sequence that regulates the SCN1A gene .

- 14 046157- 14 046157

DBD может быть разработан для связывания с целевым сайтом связывания любой длины при условии, что он обеспечивает специфическое распознавание последовательности целевого сайта связывания посредством DBD, например, с минимальным или нулевым связыванием вне мишени. Согласно определенным вариантам осуществления целевой сайт связывания может модулировать экспрессию SCN1A при связывании с eTF на уровне, который является по меньшей мере 2-кратным, 5-кратным, 10-кратным, 20-кратным, 50-кратным, 75-кратным, 100-кратным, 150-кратным, 200-кратным, 250-кратным, 500кратным или более по сравнению со всеми другими генами. Согласно определенным вариантам осуществления целевой сайт связывания может модулировать экспрессию SCNIA при связывании с eTF на уровне, который является по меньшей мере 2-кратным, 5-кратным, 10-кратным, 20-кратным, 50-кратным, 75-кратным, 100-кратным, 150-кратным, 200-кратным, 250-кратным, 500-кратным или более по сравнению с 40 ближайшими соседними генами (например, 40 генов, расположенных ближе всего к хромосоме, выше против хода транскрипции или ниже по ходу транскрипции от кодирующей последовательности SCN1A). Согласно определенным вариантам осуществления целевой сайт связывания может составлять по меньшей мере 5 п.н., 10 п.н., 15 п.н., 20 п.н., 25 п.н., 30 п.н., 35 п.н., 40 п.н., 45 п.н. или 50 п.н. или более. Конкретная длина сайта связывания определяется типом DBD в eTF. В общем, чем больше длина сайта связывания, тем выше специфичность связывания и модуляции экспрессии гена (например, более длинные сайты связывания характеризуются меньшим количеством нецелевых эффектов). Согласно определенным вариантам осуществления, eTF, содержащий DBD, распознающий более длинный целевой сайт связывания, имеет меньше нецелевых эффектов, связанных с неспецифическим связыванием (таких как, например, модуляция экспрессии нецелевого гена или отличного от SCN1A гена) относительно нецелевых эффектов, наблюдаемых с eTF, имеющим DBD, который связывается с более коротким целевым сайтом. В некоторых случаях снижение нецелевого связывания по меньшей мере в 1,2, 1,3, 1,4, 1,5, 2, 3, 4, 5, 6, 7, 8, 9 или 10 раз ниже по сравнению с сопоставимым eTF, имеющим DBD, который распознает более короткий целевой сайт связывания.A DBD can be designed to bind to a target binding site of any length, as long as it provides specific sequence recognition of the target binding site by the DBD, for example, with minimal or no off-target binding. In certain embodiments, the target binding site may modulate SCN1A expression upon binding to eTF at a level that is at least 2-fold, 5-fold, 10-fold, 20-fold, 50-fold, 75-fold, 100-fold , 150-fold, 200-fold, 250-fold, 500-fold or more compared to all other genes. In certain embodiments, the target binding site may modulate SCNIA expression upon binding to eTF at a level that is at least 2-fold, 5-fold, 10-fold, 20-fold, 50-fold, 75-fold, 100-fold , 150-fold, 200-fold, 250-fold, 500-fold, or more than the 40 nearest neighboring genes (e.g., the 40 genes closest to the chromosome, upstream or downstream of the SCN1A coding sequence ). In certain embodiments, the target binding site may be at least 5 bp, 10 bp, 15 bp, 20 bp, 25 bp, 30 bp, 35 bp .n., 40 bp, 45 bp. or 50 bp or more. The specific length of the binding site is determined by the type of DBD in the eTF. In general, the longer the binding site, the greater the specificity of binding and modulation of gene expression (e.g., longer binding sites have fewer off-target effects). In certain embodiments, an eTF comprising a DBD recognizing a longer target binding site has fewer off-target effects associated with non-specific binding (such as, for example, modulation of off-target or non-SCN1A gene expression) relative to the off-target effects observed with the eTF. having a DBD that binds to a shorter target site. In some cases, the reduction in off-target binding is at least 1.2, 1.3, 1.4, 1.5, 2, 3, 4, 5, 6, 7, 8, 9 or 10 times lower compared to comparable eTF , having a DBD that recognizes a shorter target binding site.

Согласно определенным вариантам осуществления представленный в настоящем документе DBD может быть модифицирован, чтобы иметь повышенную аффинность связывания, так что он связывается с целевым сайтом связывания в течение более длительного периода времени, так что TAD, конъюгированный с DBD, может рекрутировать больше факторов транскрипции и/или рекрутировать такой фактор транскрипции на более длительный период времени, чтобы оказывать большее влияние на уровень экспрессии эндогенного гена SCN1A. Согласно определенным вариантам осуществления DBD может быть модифицирован для увеличения его специфического связывания (или целевого связывания) с желаемым целевым сайтом и/или модифицирован для уменьшения его неспецифического или нецелевого связывания.In certain embodiments, the DBD provided herein can be modified to have increased binding affinity such that it binds to the target binding site for a longer period of time so that the TAD conjugated to the DBD can recruit more transcription factors and/or recruit such a transcription factor for a longer period of time to have a greater impact on the expression level of the endogenous SCN1A gene. In certain embodiments, the DBD may be modified to increase its specific binding (or on-target binding) to a desired target site and/or modified to reduce its non-specific or off-target binding.

Согласно различным вариантам осуществления связывание между DBD или eTF и целевым сайтом связывания может быть определено с использованием различных способов. Согласно определенным вариантам осуществления специфическое связывание между DBD или eTF и целевым сайтом связывания может быть определено с использованием анализа определения изменения подвижности, анализа защиты от ДНКазы или любого другого способа in vitro, известного в настоящей области техники для анализа связывания белок-ДНК. Согласно другим вариантам осуществления специфическое связывание между eTF и целевым сайтом связывания можно определить с помощью функционального анализа, например, путем измерения экспрессии (РНК или белка) гена (например, SCN1A), когда целевой сайт связывания связан с eTF. Например, целевой сайт связывания может быть расположен выше против хода транскрипции от репортерного гена (такого как, например, eGFP) или гена SCN1A в векторе, содержащемся в клетке или интегрированном в геном клетки, причем клетка экспрессирует eTF. Альтернативно, экспрессирующий eTF вектор может быть введен в тип клеток, который в природе содержит ген SCN1A. Более высокие уровни экспрессии репортерного гена (или SCN1A) в присутствии eTF по сравнению с контролем (например, без eTF или eTF, который распознает другой целевой сайт) указывают на то, что DBD eTF связывается с целевым сайтом. Подходящие in vitro (например, неклеточные) системы транскрипции и трансляции также могут быть использованы аналогичным образом. Согласно определенным вариантам осуществления eTF, который связывается с целевым сайтом, может характеризоваться по меньшей мере 2-кратной, 3-кратной, 5-кратной, 10-кратной, 15-кратной, 20-кратной, 30-кратной, 50-кратной, 75кратной, 100-кратной, 150-кратной или большей экспрессией репортерного гена или SCN1A по сравнению с контролем (например, без eTF или с eTF, который распознает другой целевой сайт).In various embodiments, the binding between the DBD or eTF and the target binding site can be determined using various methods. In certain embodiments, specific binding between a DBD or eTF and a target binding site can be determined using a mobility shift assay, a DNase protection assay, or any other in vitro method known in the art for protein-DNA binding assays. In other embodiments, the specific binding between the eTF and the target binding site can be determined using a functional assay, for example, by measuring the expression (RNA or protein) of a gene (eg, SCN1A) when the target binding site is bound to the eTF. For example, the target binding site may be located upstream of a reporter gene (such as eGFP) or the SCN1A gene in a vector contained in a cell or integrated into the genome of a cell where the cell expresses the eTF. Alternatively, the eTF expression vector can be introduced into a cell type that naturally contains the SCN1A gene. Higher levels of reporter gene (or SCN1A) expression in the presence of eTF compared to a control (e.g., no eTF or an eTF that recognizes a different target site) indicates that the DBD of the eTF binds to the target site. Suitable in vitro (eg, non-cellular) transcription and translation systems can also be used in a similar manner. In certain embodiments, the eTF that binds to the target site may have at least a 2-fold, 3-fold, 5-fold, 10-fold, 15-fold, 20-fold, 30-fold, 50-fold, 75-fold , 100-fold, 150-fold, or greater expression of a reporter gene or SCN1A compared to a control (eg, without eTF or with an eTF that recognizes a different target site).

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, размер которого составляет по меньшей мере 9 п.н., 12 п.н., 15 п.н., 18 п.н., 21 п.н., 24 п.н., 27 п.н., 30 п.н., 33 п.н. или 36 п.н.; более чем 9 п.н., 12 п.н., 15 п.н., 18 п.н., 21 п.н., 24 п.н., 27 п.н. или 30 п.н.; или 9-33 п.н., 9-30 п.н., 9-27 п.н., 9-24 п.н., 9-21 п.н., 9-18 п.н., 9-15 п.н., 9-12 п.н., 12-33 п.н., 12-30 п.н., 12-27 п.н., 12-24 п.н., 12-21 п.н., 12-18 п.н., 12-15 п.н., 15-33 п.н., 15-30 п.н., 15-27 п.н., 15-24 п.н., 15-21 п.н., 15-18 п.н., 18-33 п.н., 18-30 п.н., 18-27 п.н., 1824 п.н., 18-21 п.н., 21-33 п.н., 21-30 п.н., 21-27 п.н., 21-24 п.н., 24-33 п.н., 24-30 п.н., 24-27 п.н., 27-33 п.н., 27-30 п.н. или 30-33 п.н.. Согласно иллюстративным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который составляетIn certain embodiments, an eTF disclosed herein that activates SCN1A recognizes a target binding site that is at least 9 bp, 12 bp, 15 bp, 18 bp, 21 bp, 24 bp, 27 bp, 30 bp, 33 bp. or 36 bp; more than 9 bp, 12 bp, 15 bp, 18 bp, 21 bp, 24 bp, 27 bp or 30 bp; or 9-33 bp, 9-30 bp, 9-27 bp, 9-24 bp, 9-21 bp, 9-18 bp, 9 -15 bp, 9-12 bp, 12-33 bp, 12-30 bp, 12-27 bp, 12-24 bp, 12-21 bp, 12-18 bp, 12-15 bp, 15-33 bp, 15-30 bp, 15-27 bp, 15-24 bp. n., 15-21 bp., 15-18 bp., 18-33 bp., 18-30 bp., 18-27 bp., 1824 bp., 18 -21 bp, 21-33 bp, 21-30 bp, 21-27 bp, 21-24 bp, 24-33 bp, 24-30 bp, 24-27 bp, 27-33 bp, 27-30 bp. or 30-33 bp. In exemplary embodiments, the eTF disclosed herein that activates SCN1A recognizes a target binding site that constitutes

- 15 046157- 15 046157

18-27 п.н., 18 п.н. или 27 п.н.18-27 bp, 18 bp or 27 bp

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, расположенный на хромосоме 2. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, расположенный на хромосоме 2 в пределах 110 т.п.н., 100 т.п.н., 90 т.п.н., 80 т.п.н., 70 т.п.н., 60 т.п.н., 50 т.п.н., 40 т.п.н., 30 т.п.н., 20 т.п.н., 10 т.п.н., 5 т.п.н., 4 т.п.н., 3 т.п.н., 2 т.п.н. или 1 т.п.н. выше против хода транскрипции или ниже по ходу транскрипции от ТСС SCN1A. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который расположен на хромосоме 2 в пределах 110 т.п.н. выше против хода транскрипции от TSS SCN1A. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который расположен на хромосоме 2 в пределах 110 т.п.н. ниже по ходу транскрипции от TSS SCN1A. Согласно иллюстративным вариантам осуществления такие целевые сайты связывания составляют 18-27 п.н., 18 п.н. или 27 п.н.In certain embodiments, an eTF disclosed herein that activates SCN1A recognizes a target binding site located on chromosome 2. In certain embodiments, an eTF disclosed herein that activates SCN1A recognizes a target binding site located on chromosome 2 within 110 kb, 100 kb, 90 kb, 80 kb, 70 kb, 60 kb, 50 k. bp, 40 kb, 30 kb, 20 kb, 10 kb, 5 kb, 4 kb. b., 3 kb., 2 kb. or 1 kb. upstream or downstream of TCC SCN1A. In certain embodiments, the eTF disclosed herein that activates SCN1A recognizes a target binding site that is located within 110 kb on chromosome 2. upstream of the TSS of SCN1A. In certain embodiments, the eTF disclosed herein that activates SCN1A recognizes a target binding site that is located within 110 kb on chromosome 2. downstream of the TSS SCN1A. In exemplary embodiments, such target binding sites are 18-27 bp, 18 bp. or 27 bp

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который расположен на хромосоме 2 в пределах положений 166179652-165989571, в пределах положений 166128050-166127958, в пределах положений 166155414-166140590, в пределах положений 166179652-1661777272 или в пределах положений 1659990246-165989592 (все со ссылкой на GRCh38.p12). Согласно иллюстративным вариантам осуществления такие целевые сайты связывания составляют 18-27 п.н., 18 п.н. или 27 п.н.In certain embodiments, the eTF disclosed herein that activates SCN1A recognizes a target binding site that is located on chromosome 2 within positions 166179652-165989571, within positions 166128050-166127958, within positions 166155414-166140590, within positions 166179652- 1661777272 or within the provisions of 1659990246-165989592 (all with reference to GRCh38.p12). In exemplary embodiments, such target binding sites are 18-27 bp, 18 bp. or 27 bp

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., (ii) перекрывается с положением на хромосоме 2, выбранным из 166178880, 166177369, 166177362, 166177299, 166177299, 166155393, 166155264, 166149373, 166149176, 166149165, 166149118, 166148953, 166148565, 166142396, 166142391, 166142344, 166142239, 166141162, 166140928, 166140590, 165990076, 165989684, 165989571, 166155255, 166155099, 166148843, 166148361, 166142219, 166141090, 165990246, 165990193, 166149168, 166127991, 166128002, 166128037 или 166128025 (все со ссылкой на GRCh38.p12) и (iii) способен вызывать по меньшей мере 1,2-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.In certain embodiments, an eTF disclosed herein that activates SCN1A recognizes a target binding site that is (i) 18-27 bp, 18 bp. or 27 bp, (ii) overlaps with a position on chromosome 2 selected from 166178880, 166177369, 166177362, 166177299, 166177299, 166155393, 166155264, 166149373, 166149176 , 166149165, 166149118, 166148953, 166148565, 166142396, 166142391, 166142344 , 166142239, 166141162, 166140928, 166140590, 165990076, 165989684, 165989571, 166155255, 166155099, 166148843, 166148361, 166142219, 166141090, 165990246, 165990193, 166149168, 166127991, 166128002, 166128037 or 166128025 (all referencing GRCh38.p12) and (iii) is capable of causing at least a 1.2-fold increase in SCN1A expression upon binding to an eTF disclosed herein.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим любую из SEQ ID NO: 18, 25, 30, 31 или 35-66 или состоящим из нее, и (ii) способен вызывать по меньшей мере 1,2-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.In certain embodiments, an eTF disclosed herein that activates SCN1A (i) binds to a target site containing or consisting of any of SEQ ID NOs: 18, 25, 30, 31, or 35-66, and (ii) is capable of cause at least a 1.2-fold increase in SCN1A expression upon binding to an eTF disclosed herein.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., (ii) перекрывается с положением на хромосоме 2, выбранным из 166155255, 166155099, 166148843, 166148361, 166142219, 166141090, 165990246, 165990193, 166149168, 166127991, 166128002, 166128037 или 166128025 (все со ссылкой на GRCh38.p12), и (iii) способен вызывать как минимум 2кратное увеличение экспрессии SCNIA при связывании раскрытым в настоящем документе eTF.In certain embodiments, an eTF disclosed herein that activates SCN1A recognizes a target binding site that is (i) 18-27 bp, 18 bp. or 27 bp, (ii) overlaps with a position on chromosome 2 selected from 166155255, 166155099, 166148843, 166148361, 166142219, 166141090, 165990246, 165990193, 166149168 , 166127991, 166128002, 166128037 or 166128025 (all referring to GRCh38 .p12), and (iii) is capable of causing at least a 2-fold increase in SCNIA expression upon binding to the eTF disclosed herein.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим любую из SEQ ID NO: 18, 30, 31, 37, 38, 45, 47, 48, 49, 55, 61, 62 или 64 или состоящим из нее, и (ii) способен вызывать по меньшей мере 2-кратное увеличение экспрессии SCNIA при связывании раскрытым в настоящем документе eTF.In certain embodiments, an eTF disclosed herein that activates SCN1A (i) binds to a target site comprising any of SEQ ID NO: 18, 30, 31, 37, 38, 45, 47, 48, 49, 55, 61 , 62 or 64 or consisting of it, and (ii) is capable of causing at least a 2-fold increase in SCNIA expression upon binding to an eTF disclosed herein.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., и (ii) перекрывается с положением на хромосоме 2, выбранным из 166149168, 166127991, 166128002, 166128037 или 166128025 (все со ссылкой на GRCh38.p12), и (iii) способен вызывать по меньшей мере 5-кратное увеличение экспрессии SCNIA при связывании раскрытым в настоящем документе eTF.In certain embodiments, an eTF disclosed herein that activates SCN1A recognizes a target binding site that is (i) 18-27 bp, 18 bp. or 27 bp, and (ii) overlaps with a position on chromosome 2 selected from 166149168, 166127991, 166128002, 166128037 or 166128025 (all referring to GRCh38.p12), and (iii) is capable of causing at least 5- fold increase in SCNIA expression upon binding of the eTF disclosed herein.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим любую из SEQ ID NO: 18, 30, 31, 37 или 38 или состоящим из нее, и (ii) способен вызывать по меньшей мере 5-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.In certain embodiments, an eTF disclosed herein that activates SCN1A (i) binds to a target site containing or consisting of any of SEQ ID NOs: 18, 30, 31, 37, or 38, and (ii) is capable of inducing at least a 5-fold increase in SCN1A expression upon binding to the eTF disclosed herein.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., (ii) перекрывается с положением на хромосоме 2, выбранным из 166128002, 166128037, или 166128025 (все со ссылкой на GRCh38.p12), и (iii) способен вызывать по меньшей мере 15-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.In certain embodiments, an eTF disclosed herein that activates SCN1A recognizes a target binding site that is (i) 18-27 bp, 18 bp. or 27 bp, (ii) overlaps with a position on chromosome 2 selected from 166128002, 166128037, or 166128025 (all referring to GRCh38.p12), and (iii) is capable of causing at least a 15-fold increase in SCN1A expression when linked to the eTF disclosed herein.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим любую из SEQ ID NO: 30, 37 или 38 или состоящим из нее, и (ii) способен вызывать по меньшей мере 15-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.In certain embodiments, an eTF disclosed herein that activates SCN1A (i) binds to a target site containing or consisting of any of SEQ ID NO: 30, 37, or 38, and (ii) is capable of inducing at least 15- fold increase in SCN1A expression upon binding of the eTF disclosed herein.

- 16 046157- 16 046157

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., (ii) перекрывается с положением на хромосоме 2, выбранным из 166128037 или 166128025 (все со ссылкой на GRCh38.p12), и (iii) способен вызывать по меньшей мере 20-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.In certain embodiments, an eTF disclosed herein that activates SCN1A recognizes a target binding site that is (i) 18-27 bp, 18 bp. or 27 bp, (ii) overlaps with a position on chromosome 2 selected from 166128037 or 166128025 (all referring to GRCh38.p12), and (iii) is capable of causing at least a 20-fold increase in SCN1A expression when bound open in this eTF document.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим любую из SEQ ID NO: 30 или 38 или состоящим из нее, и (ii) способен вызывать по меньшей мере 20-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.In certain embodiments, an eTF disclosed herein that activates SCN1A (i) binds to a target site containing or consisting of any of SEQ ID NO: 30 or 38, and (ii) is capable of causing at least a 20-fold increase in expression of SCN1A upon binding of an eTF disclosed herein.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н., (ii) перекрывается с положением на хромосоме 2 в положении 166128025 и (iii) способен вызывать по меньшей мере 25-кратное увеличение экспрессии SCNIA при связывании раскрытым в настоящем документе eTF.In certain embodiments, an eTF disclosed herein that activates SCN1A recognizes a target binding site that is (i) 18-27 bp, 18 bp. or 27 bp, (ii) overlaps with a position on chromosome 2 at position 166128025 and (iii) is capable of causing at least a 25-fold increase in SCNIA expression when bound by an eTF disclosed herein.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, (i) связывается с целевым сайтом, содержащим или состоящим из SEQ ID NO: 30, и (ii) способен вызывать по меньшей мере 25-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.In certain embodiments, an eTF disclosed herein that activates SCN1A (i) binds to a target site containing or consisting of SEQ ID NO: 30, and (ii) is capable of causing at least a 25-fold increase in SCN1A expression when bound by the disclosed in this eTF document.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н. и (ii) связывается с геномной областью, которая находится в пределах по меньшей мере 1 т.п.н., 750 п.н., 500 п.н., 400 п.н., 300 п.н., 200 п.н., 100 п.н. или 50 п.н. геномного местоположения, имеющего последовательность любой из SEQ ID NO: 18, 25, 30, 31 или 35-66. Согласно определенным вариантам осуществления целевой сайт связывания способен вызывать по меньшей мере 1,2-кратное, 2кратное, 5-кратное, 15-кратное, 20-кратное или 25-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.In certain embodiments, an eTF disclosed herein that activates SCN1A recognizes a target binding site that is (i) 18-27 bp, 18 bp. or 27 bp and (ii) binds to a genomic region that is within at least 1 kb, 750 bp, 500 bp, 400 bp, 300 bp, 200 bp .b., 100 bp. or 50 bp genomic location having the sequence of any of SEQ ID NO: 18, 25, 30, 31 or 35-66. In certain embodiments, the target binding site is capable of causing at least a 1.2-fold, 2-fold, 5-fold, 15-fold, 20-fold, or 25-fold increase in SCN1A expression upon binding to an eTF disclosed herein.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, который (i) составляет 18-27 п.н., 18 п.н. или 27 п.н. и (ii) связывается с областью генома, которая по меньшей мере частично перекрывается с геномным местоположением, имеющим последовательность любой из SEQ ID NO: 18, 25, 30, 31 или 35-66. Согласно определенным вариантам осуществления целевой сайт связывания способен вызывать по меньшей мере 1,2-кратное, 2-кратное, 5-кратное, 15-кратное, 20-кратное или 25-кратное увеличение экспрессии SCNIA при связывании раскрытым в настоящем документе eTF.In certain embodiments, an eTF disclosed herein that activates SCN1A recognizes a target binding site that is (i) 18-27 bp, 18 bp. or 27 bp and (ii) binds to a genomic region that at least partially overlaps with a genomic location having the sequence of any of SEQ ID NOs: 18, 25, 30, 31, or 35-66. In certain embodiments, the target binding site is capable of causing at least a 1.2-fold, 2-fold, 5-fold, 15-fold, 20-fold, or 25-fold increase in SCNIA expression upon binding to an eTF disclosed herein.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, распознает целевой сайт связывания, имеющий любую из следующих последовательностей: SEQ ID NO: 18, 25, 30, 31 или 35-66. Согласно определенным вариантам осуществления целевой сайт связывания способен вызывать по меньшей мере 1,2-кратное, 2-кратное, 5-кратное, 15кратное, 20-кратное или 25-кратное увеличение экспрессии SCN1A при связывании раскрытым в настоящем документе eTF.In certain embodiments, an eTF disclosed herein that activates SCN1A recognizes a target binding site having any of the following sequences: SEQ ID NO: 18, 25, 30, 31, or 35-66. In certain embodiments, the target binding site is capable of causing at least a 1.2-fold, 2-fold, 5-fold, 15-fold, 20-fold, or 25-fold increase in SCN1A expression upon binding to an eTF disclosed herein.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, приводит по меньшей мере к 1,5-кратному, 2-кратному, 3-кратному, 4-кратному, 5-кратному, 6-кратному, 7-кратному, 8-кратному, 9-кратному, 10-кратному, 15-кратному, 20-кратному, 25-кратному, 50-кратному, 100-кратному или более или по меньшей мере 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более активации экспрессии SCN1A (РНК SCN1A и/или белок Nav1.1) в клетке или in vivo по сравнению с контролем (например, без eTF или с eTF, который не распознает целевой сайт). Согласно различным вариантам осуществления активация экспрессии SCNIA может быть обнаружена с помощью способов ПЦР, вестерн-блоттинга или иммуноанализов.In certain embodiments, an eTF disclosed herein that activates SCN1A results in at least 1.5-fold, 2-fold, 3-fold, 4-fold, 5-fold, 6-fold, 7-fold, 8 -x, 9x, 10x, 15x, 20x, 25x, 50x, 100x or more or at least 50%, 60%, 70%, 75%, 80% , 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400%, or 500% or more activation of SCN1A expression (SCN1A RNA and/or Nav1.1 protein) in cell or in vivo vs. with control (eg, without eTF or with eTF that does not recognize the target site). In various embodiments, activation of SCNIA expression can be detected using PCR, Western blotting, or immunoassay methods.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, связывается с целевым сайтом, который способен увеличивать экспрессию SCNIA по меньшей мере в 1,2 раза, 1,3 раза, 1,4 раза, 1,5 раз, 1,6 раз, 1,7 раз, 1,8 раз, 1,9 раз, 2 раза, 3 раза, 4 раза, 5 раз, 8 раз, 10 раз, 12 раз, 15 раз, 18 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз, 75 раз, 100 раз или больше или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более относительно контроля в анализе активации транскрипции. Иллюстративный анализ активации транскрипции SCN1A представлен в настоящем документе в примере 3. Вкратце, HEK293 трансфицируют плазмидой, несущей eTF или контрольную репортерную конструкцию eGFP. Через 48 часов после трансфекции клетки собирают, выделяют РНК и подвергают обратной транскрипции, а полученные образцы кДНК анализируют с помощью кПЦР (например, с использованием праймеров, имеющих SEQ ID NO: 185 и 186) для количественного определения содержания эндогенного транскрипта SCN1A. GAPDH можно использовать в качестве эталонного гена для определения относительных уровней экспрессии SCN1A.In certain embodiments, an eTF disclosed herein that activates SCN1A binds to a target site that is capable of increasing SCNIA expression by at least 1.2-fold, 1.3-fold, 1.4-fold, 1.5-fold, 1. 6 times, 1.7 times, 1.8 times, 1.9 times, 2 times, 3 times, 4 times, 5 times, 8 times, 10 times, 12 times, 15 times, 18 times, 20 times, 25 times , 30 times, 40 times, 50 times, 75 times, 100 times or more or at least 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100 %, 125%, 150%, 200%, 250%, 300%, 400%, or 500% or more relative to the control in the transcription activation assay. An exemplary SCN1A transcriptional activation assay is presented herein in Example 3. Briefly, HEK293 was transfected with a plasmid carrying eTF or an eGFP control reporter construct. 48 hours after transfection, cells are harvested, RNA is isolated and reverse transcribed, and the resulting cDNA samples are analyzed by qPCR (eg, using primers having SEQ ID NOs: 185 and 186) to quantify endogenous SCN1A transcript content. GAPDH can be used as a reference gene to determine the relative expression levels of SCN1A.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, котоIn certain embodiments, an eTF disclosed herein that

- 17 046157 рый активирует SCN1A, характеризуется минимальными нецелевыми эффектами, например, нецелевыми эффектами, связанными с неспецифическим связыванием, такими как, например, модуляция экспрессии нецелевого гена или отличного от SCN1A гена. Согласно одному варианту осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, специфически активирует SCN1A по сравнению с контролем, по меньшей мере в 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз или 50 раз больше, чем экспрессия, произведенная eTF для одного или нескольких нецелевых генов по сравнению с контролем. Согласно иллюстративному варианту осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, специфически активирует транскрипцию гена SCN1A по сравнению с контролем, по меньшей мере, в 15 раз больше, чем транскрипция 40 ближайших соседних генов (например, 40 ближайших генов, расположенных к кодирующей последовательности SCN1A на хромосоме 2), производимая eTF относительно контроля, например, PLA2R1, ITGB6, RBMS1, TANK, PSMD14, TBR1, SLC4A10, DPP4, FAP, IFIH1, GCA, FIGN, GRB14, COBLL1, SLC38A11, SCN3A, SCN2A, CSRNP3, GALNT3, TTC21B, SCN9A, SCN7A, B3GALT1, STK39, CERS6, NOSTRIN, SPC25, ABCB11, DHRS9, BBS5, KLHL41, FASTKD1, PPIG, CCDC173, PHOSPHO2, KLHL23, SSB, METTL5, UBR3 и MYO3B (смотрите табл. 14). Согласно различным вариантам осуществления активация транскрипции гена SCN1A может быть обнаружена с помощью способов ПЦР.- 17 046157 activates SCN1A, is characterized by minimal off-target effects, for example, off-target effects associated with non-specific binding, such as, for example, modulation of the expression of a non-target gene or a gene other than SCN1A. In one embodiment, an eTF disclosed herein that activates SCN1A specifically activates SCN1A relative to control by at least 5-fold, 10-fold, 15-fold, 20-fold, 25-fold, 30-fold, 40-fold, or 50-fold more than the expression produced by eTF for one or more non-target genes compared to the control. In an exemplary embodiment, an eTF disclosed herein that activates SCN1A specifically activates transcription of the SCN1A gene relative to control to at least 15 times greater than transcription of the 40 nearest neighboring genes (e.g., the 40 closest genes located to the coding sequence SCN1A on chromosome 2) produced by eTF relative to control, e.g. PLA2R1, ITGB6, RBMS1, TANK, PSMD14, TBR1, SLC4A10, DPP4, FAP, IFIH1, GCA, FIGN, GRB14, COBLL1, SLC38A11, SCN3A, SCN2A, CSRNP3, GALNT3 , TTC21B, SCN9A, SCN7A, B3GALT1, STK39, CERS6, NOSTRIN, SPC25, ABCB11, DHRS9, BBS5, KLHL41, FASTKD1, PPIG, CCDC173, PHOSPHO2, KLHL23, SSB, METTL5, UBR3 and MYO3B (see Table 14). In various embodiments, transcriptional activation of the SCN1A gene can be detected using PCR methods.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, способен снижать частоту припадков в анализе гипертермических припадков (HTS) в модели синдрома Драве на мышах Scn1atm1kea. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF способен снижать частоту припадков при температуре 42,6°C в анализе HTS по меньшей мере в 1,2 раза, 1,3 раза, 1,4 раза, 1,5 раз, 1,6 раз, 1,7 раз, 1,8 раз, 1,9 раз, 2,0 раза или более или по меньшей мере на 20%, 30%, 40%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% или более по сравнению с контролем (например, обработанный PBS или воздействие вектором AAV, содержащим последовательность, кодирующую eGFP). Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF способен снижать частоту припадков при температуре 42,6°C в анализе HTS, так что по меньшей мере у 60%, 62%, 65%, 70%, 75%, 76%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% мышей, участвовавших в анализе, не наблюдалось припадков при температуре 42,6°C. Иллюстративный анализ HTS описан в настоящем документе в примере 6. Вкратце, пометам детенышей, полученным от самцов мышей Scn1a +/-, скрещенных с самками мышей C57Bl/6J, может быть введен вектор AAV9, кодирующий eTF, который активирует SCN1A, как предусмотрено в настоящем документе, или контрольный вектор, кодирующий eGFP, посредством двустороннего ICV в P1. Мышам можно вводить дозу ~1,0E10-5,0E12 копий геномов/мышь. Анализ HTS проводят на гетерозиготных мышах P26-P28 SCNIA и SCNIA дикого типа на смешанном фоне 129Stac X C57BL/6 путем повышения температуры тела мышей (в контролируемых условиях и с контролем температуры тела) на ~0,5°C каждые 2 минуты до начала первого тоникоклонического припадка, сопровождающегося потерей положения тела, или до достижения температуры тела 43°C. Считается, что у мыши не было припадка, если не было обнаружено припадка с потерей положения тела в течение всего периода эксперимента.In certain embodiments, an eTF disclosed herein that activates SCN1A is capable of reducing seizure frequency in a hyperthermic seizure (HTS) assay in the Scn1a tm1kea mouse model of Dravet syndrome. In certain embodiments, an eTF disclosed herein is capable of reducing seizure frequency at 42.6°C in the HTS assay by at least 1.2-fold, 1.3-fold, 1.4-fold, 1.5-fold, 1.6-fold times, 1.7 times, 1.8 times, 1.9 times, 2.0 times or more or by at least 20%, 30%, 40%, 50%, 55%, 60%, 65%, 70 %, 75%, 80%, 85%, 90%, 95%, 100% or more compared to control (eg, treated with PBS or exposed to an AAV vector containing an eGFP coding sequence). In certain embodiments, an eTF disclosed herein is capable of reducing seizure frequency at 42.6°C in an HTS assay such that at least 60%, 62%, 65%, 70%, 75%, 76%, 80% , 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% of mice analyzed , no seizures were observed at a temperature of 42.6°C. An exemplary HTS assay is described herein in Example 6. Briefly, litters of pups generated from male Scn1a +/- mice crossed with female C57Bl/6J mice can be injected with an AAV9 vector encoding an eTF that activates SCN1A as provided herein document, or a control vector encoding eGFP via bilateral ICV in P1. Mice can be dosed with ~1.0E10-5.0E12 genome copies/mouse. The HTS assay is performed on heterozygous P26-P28 SCNIA and wild-type SCNIA mice on a mixed 129Stac X C57BL/6 background by increasing the body temperature of the mice (under controlled conditions and with body temperature controlled) by ~0.5°C every 2 minutes until the first a tonic-clonic seizure accompanied by loss of body position, or until the body temperature reaches 43°C. A mouse was considered to be seizure-free if no seizure with loss of body position was detected during the entire experimental period.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, способен увеличивать выживаемость мыши, гетерозиготной по SCN1A, например, линии мышей Scn1atm1kea. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF способен увеличивать выживаемость гетерозиготных мышей SCN1A при P100 по меньшей мере в 1,2 раза, 1,3 раза, 1,4 раза, 1,5 раз, 1,6 раз, 1,7 раз, 1,8 раз, 1,9 раз, 2,0 раза или более, или по меньшей мере на 20%, 30%, 40%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% или более, как по сравнению с контролем (например, обработанным PBS или обработанным вектором AAV, содержащим последовательность, кодирующую eGFP). Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF способен увеличивать выживаемость гетерозиготных мышей SCN1A при P100, так что по меньшей мере 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% мышей, задействованных в анализе, все еще живы при P100. Иллюстративный анализ выживаемости описан в настоящем документе в примере 7. Вкратце, пометам детенышей, полученным от самцов мышей Scn1a +/-, скрещенных с самками мышей C57Bl/6J, может быть введен вектор AAV9 посредством двустороннего ICV в точке P1. Мышам можно вводить дозу ~1,0E10-5,0E12 копий геномов/мышь. Определяют количество мышей, доживших до P100.In certain embodiments, an eTF disclosed herein that activates SCN1A is capable of increasing the survival of a mouse heterozygous for SCN1A, for example, the Scn1a tm1kea mouse strain. In certain embodiments, an eTF disclosed herein is capable of increasing survival of heterozygous SCN1A mice at P100 by at least 1.2-fold, 1.3-fold, 1.4-fold, 1.5-fold, 1.6-fold, 1.7-fold , 1.8 times, 1.9 times, 2.0 times or more, or by at least 20%, 30%, 40%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% or more, as compared to a control (eg, treated with PBS or treated with an AAV vector containing an eGFP coding sequence). In certain embodiments, an eTF disclosed herein is capable of increasing the survival of SCN1A heterozygous mice at P100 such that at least 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% of mice in the assay are still alive at P100. An exemplary survival assay is described herein in Example 7. Briefly, litters of pups generated from male Scn1a +/- mice crossed with female C57Bl/6J mice can be administered the AAV9 vector via bilateral ICV at P1. Mice can be dosed with ~1.0E10-5.0E12 genome copies/mouse. The number of mice surviving to P100 is determined.

Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, может содержать DBD из белка типа цинковые пальцы, полученного из белка типа цинковые пальцы, или нуклеаза представляет собой инактивированный белок типа цинковые пальцы. Цинковый палец представляет собой небольшой структурный мотив белка, который характеризуется координацией одного или нескольких ионов цинка (Zn2+) для стабилизации складки. Домены типа цинковые пальцы (Znf) представляют собой относительно небольшие белковые мотивы, которые содержат несколько пальцевидных выступов, которые создают тандемные контакты с целевым участком ДНК. Модульная природа мотива цинкового пальца позволяет связывать большое количество комбинаций последовательностей ДНК с высокой степенью аффинности и специфичности, и поэтомуIn certain embodiments, an eTF provided herein that activates SCN1A may comprise a DBD of a zinc finger protein derived from a zinc finger protein, or the nuclease is an inactivated zinc finger protein. The zinc finger is a small protein structural motif that is characterized by the coordination of one or more zinc ions (Zn 2+ ) to stabilize the fold. Zinc finger (Znf) domains are relatively small protein motifs that contain multiple finger-like protrusions that make tandem contacts with a target region of DNA. The modular nature of the zinc finger motif allows it to bind a large number of DNA sequence combinations with high affinity and specificity, and therefore

- 18 046157 идеально подходит для создания белка, который может быть нацелен на определенные последовательности ДНК и связывать их. Многие сконструированные наборы цинковых пальцев основаны на домене типа цинковые пальцы мышиного фактора транскрипции Zif268. Zif268 содержит три отдельных мотива цинковые пальцы, которые вместе связывают последовательность из 9 п.н. с высокой аффинностью. Было идентифицировано большое количество белков типа цинковые пальцы, и они были охарактеризованы на различные типы на основе структуры, которая дополнительно описана в настоящем документе. Любой такой белок типа цинковые пальцы применим в связи с описанными в настоящем документе DBD.- 18 046157 is ideal for creating a protein that can target and bind specific DNA sequences. Many engineered zinc finger arrays are based on the zinc finger domain of the mouse transcription factor Zif268. Zif268 contains three distinct zinc finger motifs that together bind a 9-bp sequence. with high affinity. A large number of zinc finger proteins have been identified and have been characterized into different types based on structure, which are further described herein. Any such zinc finger protein is useful in connection with the DBDs described herein.

Доступны различные способы конструирования белков типа цинковые пальцы. Например, описаны способы создания белков типа цинковые пальцы для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, Liu Q, et al., Design of polydactyl zinc-finger proteins for unique addressing within complex genomes, Proc Natl Acad Sci USA. 94 (11): 5525-30 (1997); Wright DA et al., Standardized reagents and protocols for engineering zinc finger nucleases by modular assembly, Nat Protoc. Nat Protoc. 2006; 1(3): 1637-52 и CA Gersbach and T Gaj, Synthetic Zinc Finger Proteins: The Advent of Targeted Gene Regulation and Genome Modification Technologies, Am Chem Soc 47: 2309-2318 (2014). Кроме того, общедоступны различные веб-инструменты для создания белков типа цинковые пальцы для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, программные инструменты для разработки нуклеаз типа цинковые пальцы и веб-сайт анализа сконструированных данных генома от OmicX, доступный в Интернете по адресу omictools.com/zfns-category; и вебсайт дизайна Zinc Finger Tools от Scripps, доступный в Интернете по адресу scripps.edu/barbas/zfdesign/zfdesignhome.php. Кроме того, доступны различные коммерчески доступные услуги по разработке белков типа цинковые пальцы для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, коммерчески доступные услуги или наборы, предлагаемые Creative Biolabs (в Интернете по адресу creative-biolabs.com/Design-and-Synthesis-of-ArtificialZinc-Finger-Proteins.html), Modular Assembly Kit Zinc Finger Consortium, доступный от Addgene (в Интернете по адресу addgene.org/kits/zfc-modular-assembly/), или the CompoZr Custom ZFN Service от Sigma Aldrich (в Интернете по адресу sigmaaldrich.com/life-science/zinc-finger-nuclease-technology/customzfn.html).Various methods are available to construct zinc finger proteins. For example, methods for designing zinc finger proteins to bind to a target DNA sequence of interest have been described, see, for example, Liu Q, et al., Design of polydactyl zinc-finger proteins for uniquely addressing within complex genomes, Proc Natl Acad Sci USA. 94 (11): 5525-30 (1997); Wright D. A. et al., Standardized reagents and protocols for engineering zinc finger nucleases by modular assembly, Nat Protoc. Nat Protoc. 2006; 1(3): 1637-52 and C. A. Gersbach and T Gaj, Synthetic Zinc Finger Proteins: The Advent of Targeted Gene Regulation and Genome Modification Technologies, Am Chem Soc 47: 2309-2318 (2014). In addition, various web-based tools for designing zinc finger proteins to bind to a target DNA sequence of interest are publicly available, see, for example, software tools for designing zinc finger nucleases and OmicX's engineered genome data analysis website, available online at omictools.com/zfns-category; and Scripps' Zinc Finger Tools design website, available online at scripps.edu/barbas/zfdesign/zfdesignhome.php. In addition, various commercially available services are available to design zinc finger proteins to bind to a target DNA sequence of interest, see for example the commercially available services or kits offered by Creative Biolabs (online at creative-biolabs.com/Design-and -Synthesis-of-ArtificialZinc-Finger-Proteins.html), the Zinc Finger Consortium Modular Assembly Kit available from Addgene (online at addgene.org/kits/zfc-modular-assembly/), or the CompoZr Custom ZFN Service from Sigma Aldrich (Online at sigmaaldrich.com/life-science/zinc-finger-nuclease-technology/customzfn.html).

Согласно определенным вариантам осуществления представленные в настоящем документе eTF, которые активируют SCN1A, содержат DBD, содержащий один или несколько цинковых пальцев, или получены из DBD белка типа цинковые пальцы. В некоторых случаях DBD содержит несколько цинковых пальцев, причем каждый цинковый палец связан с другим цинковым пальцем или другим доменом либо на своем N-конце, либо на C-конце, или на обоих через аминокислотный линкер. В некоторых случаях представленный в настоящем документе DBD содержит один или несколько цинковых пальцев из одного или нескольких типов цинковых пальцев, описанных в табл. 9. В некоторых случаях представленный в настоящем документе DBD содержит множество структур или мотивов цинковых пальцев или множество цинковых пальцев, имеющих одну или несколько из SEQ ID NO: 152-167 или любую их комбинацию. Согласно определенным вариантам осуществления DBD содержит X-[ZF-X]n и/или [X-ZF]n-X, причем ZF представляет собой домен типа цинковые пальцы, содержащий любой из мотивов, перечисленных в табл. 9 (например, любой из SEQ ID NO: 136-146), X представляет собой аминокислотный линкер, содержащий 1-50 аминокислот, и n представляет собой целое число от 1 до 15, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15, причем каждый ZF может независимо иметь ту же последовательность или последовательность, отличную от других последовательностей ZF в DBD, и причем каждый линкер X может независимо иметь такую же последовательность или последовательность, отличную от других последовательностей X в DBD. Каждый цинковый палец может быть связан с другой последовательностью, цинковым пальцем или доменом на своем C-конце, N-конце или с обоими. В DBD каждый линкер X может быть идентичным по последовательности, длине и/или свойству (например, гибкости или заряду) или отличаться по последовательности, длине и/или свойству. В некоторых случаях два или более линкера могут быть идентичными, в то время как другие линкеры различны. Согласно иллюстративным вариантам осуществления линкер может быть получен или быть производным от последовательностей, соединяющих цинковые пальцы, обнаруженных в одном или нескольких встречающихся в природе белках типа цинковые пальцы, представленных в табл. 9. Согласно другим вариантам осуществления подходящие линкерные последовательности включают в себя, например, линкеры из 5 или более аминокислот в длину. См. также патент США № 6479626; 6903185 и 7153949 для иллюстративных линкерных последовательностей из 6 или более аминокислот в длину, каждая из которых полностью включена в настоящий документ. Предлагаемые в настоящем документе белки DBD могут включать в себя любую комбинацию подходящих линкеров между отдельными цинковыми пальцами белка. Описанные в настоящем документе белки DBD могут включать в себя любую комбинацию подходящих линкеров между отдельными цинковыми пальцами белка.In certain embodiments, eTFs provided herein that activate SCN1A contain a DBD containing one or more zinc fingers, or are derived from a zinc finger protein DBD. In some cases, the DBD contains multiple zinc fingers, with each zinc finger linked to another zinc finger or other domain at either its N-terminus, C-terminus, or both via an amino acid linker. In some cases, the DBD provided herein contains one or more zinc fingers from one or more of the types of zinc fingers described in table. 9. In some cases, the DBD provided herein contains a plurality of zinc finger structures or motifs or a plurality of zinc fingers having one or more of SEQ ID NOs: 152-167 or any combination thereof. In certain embodiments, the DBD comprises X-[ZF-X]n and/or [X-ZF]n-X, wherein the ZF is a zinc finger domain containing any of the motifs listed in Table 1. 9 (for example, any of SEQ ID NO: 136-146), X is an amino acid linker containing 1-50 amino acids, and n is an integer from 1 to 15, for example, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 or 15, wherein each ZF may independently have the same sequence or a different sequence from other ZF sequences in the DBD, and wherein each linker X may independently have the same sequence or sequence different from other X sequences in the DBD. Each zinc finger may be linked to another sequence, a zinc finger, or a domain at its C-terminus, N-terminus, or both. In a DBD, each linker X may be identical in sequence, length and/or property (eg, flexibility or charge) or different in sequence, length and/or property. In some cases, two or more linkers may be identical while other linkers are different. In exemplary embodiments, the linker may be derived from or derived from zinc finger linking sequences found in one or more of the naturally occurring zinc finger proteins presented in Table 1. 9. In other embodiments, suitable linker sequences include, for example, linkers of 5 or more amino acids in length. See also US Patent No. 6479626; 6903185 and 7153949 for exemplary linker sequences of 6 or more amino acids in length, each of which is incorporated herein in its entirety. DBD proteins provided herein may include any combination of suitable linkers between individual zinc fingers of the protein. The DBD proteins described herein may include any combination of suitable linkers between individual zinc fingers of the protein.

Согласно определенным вариантам осуществления представленные в настоящем документе eTF, которые активируют SCN1A, содержат DBD, содержащий один или несколько классических цинковых пальцев. Классический цинковый палец C2H2 содержит два цистеина в одной цепи и два остатка гисIn certain embodiments, eTFs provided herein that activate SCN1A comprise a DBD containing one or more classical zinc fingers. The classical zinc finger C2H2 contains two cysteines in one chain and two his residues

- 19 046157 тидина в другой цепи, координируемых ионом цинка. Классический домен типа цинковый палец содержит два β-листа и одну α-спираль, причем а-спираль взаимодействует с молекулой ДНК и формирует основу связывания DBD с целевым сайтом и может называться спиралью распознавания. Согласно иллюстративным вариантам осуществления спираль распознавания цинковых пальцев содержит по меньшей мере одну аминокислотную замену в положении -1, 2, 3 или 6, тем самым изменяя специфичность связывания домена типа цинковые пальцы. Согласно другим вариантам осуществления представленный в настоящем документе DBD содержит один или несколько неклассических цинковых пальцев, например, C2-H2, C2-CH и C2-C2.- 19 046157 tidine in another chain, coordinated by a zinc ion. The classical zinc finger domain contains two β-sheets and one α-helix, with the α-helix interacting with the DNA molecule and forming the basis for DBD binding to the target site and can be called the recognition helix. In exemplary embodiments, the zinc finger recognition helix contains at least one amino acid substitution at position -1, 2, 3, or 6, thereby altering the binding specificity of the zinc finger domain. In other embodiments, the DBD provided herein contains one or more non-classical zinc fingers, such as C2-H2, C2-CH, and C2-C2.

Согласно другому варианту осуществления представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD, содержащий мотив типа цинковые пальцы, имеющий следующую структуру: LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (SEQ ID NO: 147), где n представляет собой целое число от 1 до 15, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15, и каждый X независимо представляет собой последовательность распознавания (например, спираль распознавания), способную связываться с 3 п.н. целевой последовательности. Согласно иллюстративным вариантам осуществления n равно 3, 6 или 9. Согласно особенно предпочтительному варианту осуществления n равно 6. Согласно различным вариантам осуществления каждый X может независимо иметь одинаковую аминокислотную последовательность или отличную аминокислотную последовательность по сравнению с другими последовательностями X в DBD. Согласно иллюстративному варианту осуществления каждый X представляет собой последовательность, содержащую 7 аминокислот, которая была разработана для взаимодействия с 3 п.н. представляющего интерес целевого сайта связывания с использованием Zinger Finger Design Tool от Scripps, расположенного в Интернете по адресу scripps.edu/barbas/ zfdesign/zfdesignhome.php.In another embodiment, an eTF provided herein that activates SCN1A contains a DBD containing a zinc finger motif having the following structure: LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n - YKCPECGKSFS X HQRTH - TGKKTS (SEQ ID NO: 147), where n is an integer from 1 to 15, such as 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, or 15, and each X is independently a sequence recognition helix (e.g., recognition helix) capable of binding to 3 bp. target sequence. In exemplary embodiments, n is 3, 6, or 9. In a particularly preferred embodiment, n is 6. In various embodiments, each X may independently have the same amino acid sequence or a different amino acid sequence compared to other X sequences in the DBD. In an exemplary embodiment, each X is a sequence containing 7 amino acids that was designed to interact with 3 bp. target binding site of interest using Scripps' Zinger Finger Design Tool located on the Internet at scripps.edu/barbas/zfdesign/zfdesignhome.php.

Поскольку каждый цинковый палец в DBD распознает 3 п.н., количество цинковых пальцев, включенных в DBD, сообщает длину сайта связывания, распознаваемого DBD, например, DBD с 1 цинковым пальцем распознает целевой сайт связывания, имеющий 3 п.н., DBD с 2 цинковыми пальцами распознает целевой сайт связывания, имеющий 6 п.н., DBD с 3 цинковыми пальцами распознает целевой сайт связывания, имеющий 9 п.н., DBD с 4 цинковыми пальцами распознает целевой сайт связывания, имеющий 12 п.н., DBD с 5 цинковыми пальцами распознает целевой сайт связывания, имеющий 15 п.н., DBD с 6 цинковыми пальцами распознает целевой сайт связывания, имеющий 18 п.н., DBD с 9 цинковыми пальцами распознает целевой сайт связывания, имеющий 27 п.н., и т. д. В общем, DBD, которые распознают более длинные целевые сайты связывания, будут проявлять большую специфичность связывания (например, меньшее нецелевое связывание или неспецифическое связывание).Since each zinc finger in a DBD recognizes 3 bp, the number of zinc fingers included in the DBD informs the length of the binding site recognized by the DBD, e.g., a DBD with 1 zinc finger recognizes a target binding site that is 3 bp, a DBD with 2 zinc finger DBD recognizes a 6 bp target binding site, 3 zinc finger DBD recognizes a 9 bp target binding site, 4 zinc finger DBD recognizes a 12 bp target binding site, DBD 5 zinc finger DBD recognizes a 15 bp target binding site, 6 zinc finger DBD recognizes a 18 bp target binding site, 9 zinc finger DBD recognizes a 27 bp target binding site, etc. In general, DBDs that recognize longer target binding sites will exhibit greater binding specificity (e.g., less off-target binding or nonspecific binding).

Согласно другим вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD, который происходит из встречающегося в природе белка типа цинковые пальцы путем выполнения одной или нескольких аминокислотных замен в одной или нескольких спиралях распознавания доменов типа цинковые пальцы для изменения специфичности связывания DBD (например, изменение целевого сайта, распознаваемого DBD). Представленный в настоящем документе DBD может быть получен из любого встречающегося в природе белка типа цинковые пальцы. Согласно различным вариантам осуществления такой DBD может быть получен из белка типа цинковые пальцы любого вида, например, мыши, крысы, человека и т.д. Согласно иллюстративному варианту осуществления представленный в настоящем документе DBD получен из белка типа цинковые пальцы человека. Согласно определенным вариантам осуществления представленный в настоящем документе DBD получен из встречающегося в природе белка, перечисленного в табл. 9. Согласно иллюстративному варианту осуществления представленный в настоящем документе белок DBD получен из белка типа цинковые пальцы EGR человека, например, EGR1, EGR2, EGR3 или EGR4.In other embodiments, an eTF provided herein that activates SCN1A comprises a DBD that is derived from a naturally occurring zinc finger protein by making one or more amino acid substitutions in one or more zinc finger domain recognition helices to alter the binding specificity of the DBD ( for example, changing the target site recognized by the DBD). The DBD presented herein can be derived from any naturally occurring zinc finger protein. In various embodiments, such a DBD may be derived from any species of zinc finger protein, such as mouse, rat, human, etc. In an exemplary embodiment, the DBD provided herein is derived from human zinc finger protein. In certain embodiments, the DBD provided herein is derived from a naturally occurring protein listed in Table. 9. In an exemplary embodiment, the DBD protein provided herein is derived from a human EGR zinc finger protein, such as EGR1, EGR2, EGR3, or EGR4.

Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD, который происходит из встречающегося в природе белка, путем модификации DBD для увеличения количества доменов типа цинковые пальцы в белке DBD путем повторения одного или нескольких цинковые пальцев в пределах DBD встречающегося в природе белка. Согласно определенным вариантам осуществления такие модификации включают в себя дупликацию, утроение, учетверение или дальнейшее умножение цинковых пальцев в пределах DBD встречающегося в природе белка. В некоторых случаях умножается один цинковый палец из DBD человеческого белка, например, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 или более копий одного и того же мотива цинкового пальца повторяется в DBD eTF. В некоторых случаях набор цинковых пальцев из DBD встречающегося в природе белка умножается, например, набор из 3 цинковых пальцев из DBD встречающегося в природе белка дублируется, чтобы получить eTF, имеющий DBD с 6 цинковыми пальцами, троекратно повторяется для получения DBD eTF с 9 цинковыми пальцами или повторяется четыре раза для получения DBD eTF с 12 цинковыми пальцами и т.д. В некоторых случаях набор цинковых пальцев из DBD встречающегося в природе белка частично реплицируется для формирования DBD eTF, имеющего большее количество цинковых пальцев, например, DBD eTF содержит четыре цинковых пальца, причем цинковые пальцы представляют собой одну копию первого цинкового пальца, одну копию второго цинкового пальца и две копии третьего цинкового пальца из встречающегося в природе белка,In certain embodiments, an eTF provided herein that activates SCN1A contains a DBD that is derived from a naturally occurring protein by modifying the DBD to increase the number of zinc finger domains in the DBD protein by repeating one or more zinc fingers within the DBD found in nature of protein. In certain embodiments, such modifications include duplication, tripling, quadrupling, or further multiplication of zinc fingers within the DBD of a naturally occurring protein. In some cases, one zinc finger is multiplied from the DBD of a human protein, for example, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 or more copies of the same zinc finger motif are repeated in the DBD of eTF. In some cases, a set of zinc fingers from the DBD of a naturally occurring protein is multiplied, for example, a set of 3 zinc fingers from the DBD of a naturally occurring protein is duplicated to produce an eTF having a DBD with 6 zinc fingers, repeated three times to produce a DBD of an eTF with 9 zinc fingers or repeated four times to obtain DBD eTF with 12 zinc fingers, etc. In some cases, a set of zinc fingers from the DBD of a naturally occurring protein is partially replicated to form a DBD eTF having more zinc fingers, e.g., a DBD eTF contains four zinc fingers, with the zinc fingers being one copy of the first zinc finger, one copy of the second zinc finger and two copies of the third zinc finger from a naturally occurring protein,

- 20 046157 всего четыре цинковых пальца в DBD eTF. Затем такие DBD дополнительно модифицируют, производя одну или несколько аминокислотных замен в одной или нескольких спиралях распознавания доменов типа цинковые пальцы, чтобы изменить специфичность связывания DBD (например, изменяя целевой сайт, распознаваемый DBD). Согласно иллюстративным вариантам осуществления DBD получают из встречающегося в природе человеческого белка, такого как белок типа цинковые пальцы EGR человека, например, EGR1, EGR2, EGR3 или EGR4.- 20 046157 only four zinc fingers in DBD eTF. Such DBDs are then further modified by making one or more amino acid substitutions in one or more zinc finger domain recognition helices to change the binding specificity of the DBD (eg, changing the target site recognized by the DBD). In exemplary embodiments, the DBD is derived from a naturally occurring human protein, such as a human EGR zinc finger protein, such as EGR1, EGR2, EGR3, or EGR4.

EGR1 и EGR3 человека характеризуются трехпальцевым DBD типа цинковые пальцы C2H2. Общие правила связывания для цинковых пальцев предусматривают, что все три пальца взаимодействуют со своей родственной последовательностью ДНК с аналогичной геометрией, используя одни и те же аминокислоты в альфа-спирали каждого цинкового пальца для определения специфичности или распознавания последовательности целевого сайта связывания. Такие правила связывания позволяют изменять DBD EGR1 или EGR3 для создания DBD, который распознает желаемый целевой сайт связывания. В некоторых случаях спираль распознавания ДНК из 7 аминокислот в мотиве цинкового пальца EGR1 или EGR3 модифицируется в соответствии с опубликованными правилами разработки цинковых пальцев. Согласно определенным вариантам осуществления каждый цинковый палец в DBD с тремя пальцами EGR1 или EGR3 модифицируется, например, путем изменения последовательности одной или нескольких спиралей распознавания и/или путем увеличения количества цинковых пальцев в DBD. Согласно определенным вариантам осуществления EGR1 или EGR3 перепрограммированы для распознавания целевого сайта связывания по меньшей мере из 9, 12, 15, 18, 21, 24, 27, 30, 33, 36 или более пар оснований в желаемом целевом сайте. Согласно определенным вариантам осуществления такой DBD, полученный из ERG1 или EGR3, содержит по меньшей мере 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 или более цинковых пальцев. Согласно иллюстративному варианту осуществления один или несколько цинковых пальцев в DBD содержат по меньшей мере одну аминокислотную замену в положении -1, 2, 3 или 6 спирали распознавания.Human EGR1 and EGR3 are characterized by a three-fingered C2H2 zinc finger DBD. The general binding rules for zinc fingers stipulate that all three fingers interact with their cognate DNA sequence of similar geometry, using the same amino acids in the alpha helix of each zinc finger to determine the specificity or sequence recognition of the target binding site. Such binding rules allow the DBD of EGR1 or EGR3 to be modified to create a DBD that recognizes the desired target binding site. In some cases, the 7 amino acid DNA recognition helix in the EGR1 or EGR3 zinc finger motif is modified according to published zinc finger design rules. In certain embodiments, each zinc finger in a three-finger EGR1 or EGR3 DBD is modified, for example, by changing the sequence of one or more recognition helices and/or by increasing the number of zinc fingers in the DBD. In certain embodiments, EGR1 or EGR3 is reprogrammed to recognize a target binding site of at least 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, or more base pairs in the desired target site. In certain embodiments, such a DBD derived from ERG1 or EGR3 contains at least 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 or more zinc fingers. In an exemplary embodiment, the one or more zinc fingers in the DBD contain at least one amino acid substitution at position -1, 2, 3, or 6 of the recognition helix.

Согласно различным вариантам осуществления eTF, который активирует SCN1A, содержащий DBD, полученный из EGR1 или EGR3, характеризуется специфичностью связывания ДНК, которая отличается от специфичности связывания встречающихся в природе EGR1 или EGR3, например, DBD распознает целевой сайт связывания, имеющий последовательность, отличную от последовательности сайта связывания, распознаваемой Лмодифицированными EGR1 или EGR3: (GCG(T/G)GGGCG) (SEQ ID NO: 182).In various embodiments, an eTF that activates SCN1A containing a DBD derived from EGR1 or EGR3 has a DNA binding specificity that is different from the binding specificity of naturally occurring EGR1 or EGR3, e.g., the DBD recognizes a target binding site having a sequence different from the sequence binding site recognized by L modified EGR1 or EGR3: (GCG(T/G)GGGCG) (SEQ ID NO: 182).

Согласно другим вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD, который представляет собой комплекс gRNA/Cas. CRISPR (кластеризованные регулярные промежуточные короткие палиндромные повторы)/Cas9 представляет собой инструмент для редактирования генома, который позволяет направленно воздействовать на сайтспецифический геном. Система CRISPR/Cas типа II представляет собой прокариотическую систему адаптивного иммунного ответа, которая использует некодирующие РНК, чтобы направлять нуклеазу Cas9 для индукции сайт-специфического расщепления ДНК. Система CRISPR/Cas9 была использована для создания простого, программируемого с помощью РНК способа, обеспечивающего редактирование генома в клетках млекопитающих. Одна направляющая РНК (sgRNA) может быть создана для направления нуклеазы Cas9 в конкретное место генома, которое затем связывается комплексом gRNA/Cas9. gRNA может быть сконструирована для связывания с представляющим интерес целевым сайтом с использованием различных способов и инструментов. Например, способы создания gRNA для связывания с представляющей интерес целевой последовательностью ДНК описаны в Aach, et al. Flexible algorithm for identifying specific Cas9 targets in genomes. BioRxiv, Cold Spring Harbor Labs, doi: http://dx.doi.org/10.1101/005074 (2014); Bae, et al. Cas-OFFinder: a fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics. 30(10): 1473-1475 (2014); Doench, J. G. et al. Optimized sgRNA design to maximize activity and minimize off-target effects of CRISPRCas9. Nat Biotech 34, 184-191 (2016); Gratz, et al. Highly specific and efficient CRISPR/Cas9-catalyzed homology-directed repair in Drosophila. Genetics. 196(4):961-971 (2014); Heigwer, et al. E-CRISP: fast CRISPR target site identification. Nat Methods. 11(2):122-123 (2014); Ma, et al. A guide RNA sequence design platform for the CRISPR/Cas9 system for model organism genomes. Biomed Res Int. doi:http://doi.org/10.1155/2013/270805 (2013); Montague, et al. CHOPCHOP: a CRISPR/Cas9 and TALEN web tool for genome editing. Nucleic Acids Res. 42(W1):W401-W407 (2014); Liu, et al. CRISPR-ERA: a comprehensive design tool for CRISPR-mediated gene editing, repression and activation. Bioinformatics. 31(22):3676-3678 (2015); Ran, et al. In vivo genome editing using Staphylococcus aureus Cas9. Nature. 520(7546):186-191 (2015); Wu, et al. Target specificity of the CRISPR-Cas9 system. Quant Biol. 2(2):59-70 (2015); Xiao, et al. CasOT: a genome-wide Cas9/gRNA off-target searching tool. Bioinformatics. 30(8):11801182 (2014); Zetsche, et al. Cpf1 is a single RNA-guided endonuclease of a Class 2 CRISPR-Cas System. Cell. 163(3):759-771 (2105). Кроме того, общедоступны различные веб-инструменты для создания gRNA для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, инструмент разработки CRISPR gRNA, доступный от AUTM в Интернете по адресу atum.bio/eCommerce/cas9/input?multipleContacts=false; инструмент разработки CRISPRa/i gRNA, доступIn other embodiments, an eTF provided herein that activates SCN1A contains a DBD, which is a gRNA/Cas complex. CRISPR (Clustered Regular Intermediate Short Palindromic Repeats)/Cas9 is a genome editing tool that allows site-specific targeting of the genome. The CRISPR/Cas type II system is a prokaryotic adaptive immune response system that uses non-coding RNAs to direct the Cas9 nuclease to induce site-specific DNA cleavage. The CRISPR/Cas9 system has been used to create a simple, RNA-programmable method for genome editing in mammalian cells. A single guide RNA (sgRNA) can be designed to direct Cas9 nuclease to a specific location in the genome, which is then bound by the gRNA/Cas9 complex. gRNA can be designed to bind to a target site of interest using a variety of methods and tools. For example, methods for creating a gRNA to bind to a target DNA sequence of interest are described in Aach, et al. Flexible algorithm for identifying specific Cas9 targets in genomes. BioRxiv, Cold Spring Harbor Labs, doi: http://dx.doi.org/10.1101/005074 (2014); Bae, et al. Cas-OFFinder: a fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics. 30(10): 1473-1475 (2014); Doench, J. G. et al. Optimized sgRNA design to maximize activity and minimize off-target effects of CRISPRCas9. Nat Biotech 34, 184-191 (2016); Gratz, et al. Highly specific and efficient CRISPR/Cas9-catalyzed homology-directed repair in Drosophila. Genetics. 196(4):961-971 (2014); Heigwer, et al. E-CRISP: fast CRISPR target site identification. Nat Methods. 11(2):122-123 (2014); Ma, et al. A guide RNA sequence design platform for the CRISPR/Cas9 system for model organism genomes. Biomed Res Int. doi:http://doi.org/10.1155/2013/270805 (2013); Montague, et al. CHOPCHOP: a CRISPR/Cas9 and TALEN web tool for genome editing. Nucleic Acids Res. 42(W1):W401-W407 (2014); Liu, et al. CRISPR-ERA: a comprehensive design tool for CRISPR-mediated gene editing, repression and activation. Bioinformatics. 31(22):3676-3678 (2015); Ran, et al. In vivo genome editing using Staphylococcus aureus Cas9. Nature. 520(7546):186-191 (2015); Wu, et al. Target specificity of the CRISPR-Cas9 system. Quant Biol. 2(2):59-70 (2015); Xiao et al. CasOT: a genome-wide Cas9/gRNA off-target searching tool. Bioinformatics. 30(8):11801182 (2014); Zetsche, et al. Cpf1 is a single RNA-guided endonuclease of a Class 2 CRISPR-Cas System. Cell. 163(3):759–771 (2105). In addition, various web-based tools are publicly available to design gRNAs to bind to a target DNA sequence of interest, see for example the CRISPR gRNA design tool available from AUTM online at atum.bio/eCommerce/cas9/input?multipleContacts=false; CRISPRa/i gRNA design tool, access

- 21 046157 ный от Broad Institute в Интернете по адресу portals.broadinstitute.org/gpp/public/analysis-tools/sgrnadesign-crisprai; инструмент разработки E-CRISP, доступный в Немецком онкологическом исследовательском центре DKFZ, доступный в Интернете по адресу e-crisp.org/E-CRISP/; и инструмент Knockout Guide Design, доступный от Synthego в Интернете по адресу design.synthego.com/#/. Кроме того, доступны различные коммерчески доступные сервисы для создания gRNA для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, коммерчески доступные услуги, предлагаемые IDT (в Интернете по адресу idtdna.com/site/order/designtool/index/CRISPR_SEQUENCE), ThermoFisher (в Интернете по адресу thermofisher.com/order/custom-oligo/crispr) и GenScript (в Интернете по адресу genscript. com/gRNA-design-tool. html).- 21 046157 ny from the Broad Institute on the Internet at portals.broadinstitute.org/gpp/public/analysis-tools/sgrnadesign-crisprai; the E-CRISP development tool available from the German Cancer Research Center DKFZ, accessible online at e-crisp.org/E-CRISP/; and the Knockout Guide Design tool, available from Synthego online at design.synthego.com/#/. In addition, various commercially available services are available to design a gRNA to bind to a target DNA sequence of interest, see for example the commercially available services offered by IDT (online at idtdna.com/site/order/designtool/index/CRISPR_SEQUENCE). ThermoFisher (online at thermofisher.com/order/custom-oligo/crispr) and GenScript (online at genscript.com/gRNA-design-tool.html).

Согласно иллюстративным вариантам осуществления DBD, который представляет собой комплекс gRNA/Cas, содержит дезактивированный нуклеазой белок Cas или dCas, такой как, например, dCas9, такой как дезактивированный нуклеазой Staphylococcus aureus (dSaCas9) или дезактивированный нуклеазой Streptococcus pyogenes Cas9 (dSpCas9). gRNA представлена в виде последовательности, содержащей нацеливающую область, которая нацеливает комплекс gRNA/Cas на желаемый целевой сайт, и каркасную область, которая облегчает взаимодействие с белком Cas. Любой подходящий каркас gRNA может использоваться в связи с представленными в настоящем документе gRNA. Согласно иллюстративному варианту осуществления gRNA представляет собой одиночную gRNA или sgRNA и содержит следующую каркасную последовательность: 5'-GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCA AAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAGA-3' (SEQ ID NO: 183). Нацеливающая область направляющей РНК присоединяется к 5'-концу каркасной последовательности с образованием полной sgRNA. Согласно определенным вариантам осуществления gRNA и белок dCas могут экспрессироваться из одной и той же кассеты экспрессии. Согласно определенным вариантам осуществления промотор U6 используется для экспрессии gRNA. Согласно другим вариантам осуществления gRNA может быть экспрессирована в клетке, которая была сконструирована для стабильной экспрессии белка dCas-TAD, например, либо путем стабильной интеграции dCas в геном, либо на плазмиде, которая стабильно поддерживается вне хромосом.In exemplary embodiments, a DBD that is a gRNA/Cas complex comprises a nuclease-deactivated Cas or dCas protein, such as, for example, dCas9, such as Staphylococcus aureus nuclease-deactivated (dSaCas9) or Streptococcus pyogenes nuclease-deactivated Cas9 (dSpCas9). The gRNA is presented as a sequence containing a targeting region that targets the gRNA/Cas complex to the desired target site and a scaffold region that facilitates interaction with the Cas protein. Any suitable gRNA framework may be used in connection with the gRNAs provided herein. In an exemplary embodiment, the gRNA is a single gRNA or sgRNA and contains the following framework sequence: 5'-GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCA AAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAGA-3' (SEQ ID NO: 183). The targeting region of the guide RNA is added to the 5' end of the scaffold sequence to form the complete sgRNA. In certain embodiments, the gRNA and the dCas protein may be expressed from the same expression cassette. In certain embodiments, the U6 promoter is used for gRNA expression. In other embodiments, the gRNA can be expressed in a cell that has been engineered to stably express the dCas-TAD protein, for example, either by stably integrating dCas into the genome or on a plasmid that is stably maintained off chromosomes.

Согласно другим вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, может содержать DBD из TALEN, полученный из TALEN, или который представляет собой инактивированную нуклеазой TALEN. Подобные активатору транскрипции эффекторные нуклеазы (TALEN) представляют собой рестрикционные ферменты, которые содержат DBD и домен нуклеазы, которые могут быть сконструированы для разрезания определенных последовательностей ДНК. TALEN создаются путем конъюгирования эффекторного ДНК-связывающего домена TAL с доменом расщепления ДНК (например, нуклеазой). Эффекторы, подобные активатору транскрипции (TALE), могут быть сконструированы так, чтобы связываться с желаемой целевой последовательностью ДНК, тем самым направляя домен нуклеазы в определенное место.In other embodiments, an eTF provided herein that activates SCN1A may comprise a DBD from TALEN, derived from TALEN, or which is a nuclease-inactivated TALEN. Transcription activator-like effector nucleases (TALENs) are restriction enzymes that contain a DBD and a nuclease domain that can be engineered to cut specific DNA sequences. TALENs are created by conjugating a TAL effector DNA-binding domain to a DNA cleavage domain (e.g., nuclease). Transcription activator-like effectors (TALEs) can be designed to bind to a desired target DNA sequence, thereby targeting the nuclease domain to a specific location.

Эффекторы TAL представляют собой бактериальные белки из бактерий Xanthomonas. ДНКсвязывающий домен содержит повторяющуюся высококонсервативную последовательность из 33-34 аминокислот с расходящимися 12-ой и 13-ой аминокислотами. Эти два положения, называемые Repeat Variable Diresidue (RVD), сильно изменчивы и показывают сильную корреляцию со специфическим распознаванием нуклеотидов. Эта прямая взаимосвязь между аминокислотной последовательностью и распознаванием ДНК позволяет конструировать DBD, которые специфически нацелены на желаемую последовательность, путем выбора комбинации повторяющихся сегментов, содержащих соответствующие RVD.TAL effectors are bacterial proteins from Xanthomonas bacteria. The DNA binding domain contains a highly conserved repeat sequence of 33-34 amino acids with diverging amino acids 12 and 13. These two positions, called Repeat Variable Diresidue (RVD), are highly variable and show a strong correlation with specific nucleotide recognition. This direct relationship between amino acid sequence and DNA recognition allows the design of DBDs that specifically target the desired sequence by selecting a combination of repeat segments containing the corresponding RVDs.

Существуют разные способы разработки TALE. Например, способы разработки TALE для связывания с представляющей интерес целевой последовательностью ДНК описаны в T. Cermak et al., Nucleic Acids Research. 39 (12):e82 (2011); F. Zhang F et al., Nature Biotechnology. 29 (2):149-53 (2011); R. Morbitzer et al., Nucleic Acids Research. 39 (13):5790-9 (2011); T. Li et al., Nucleic Acids Research. 39 (14):631525 (2011); R. Geissler et al., PLOS One. 6(5): e19509 (2011) и E. Weber et al., PLOS One. 6(5): e19722 (2011). Кроме того, общедоступны различные веб-инструменты для разработки TALE для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, E-Talen, доступный в Интернете по адресу e-talen.org/E-TALEN/TAL и инструмент Effector Nucleotide Targeter 2.0, доступный в Интернете по адресу tall-nt.cac.cornell.edu/node/add/single-tale. Кроме того, доступны различные коммерчески доступные сервисы для создания TALE для связывания с представляющей интерес целевой последовательностью ДНК, смотрите, например, коммерчески доступные услуги, предлагаемые OmicX (в Интернете по адресу omictools.com/), Addgene (в Интернете по адресу addgene.org/talen/guide/ или ThermoFisher (в Интернете: thermofisher.com/us/en/home/life-science/genome-editing/geneart-tals/tal-designtool.html). Кроме того, общедоступная программа (DNAWorks) может использоваться для создания олигонуклеотидов, подходящих для сборки TALE, смотрите, например, D. Hoover D Methods in Molecular Biology. 852: 215-23 (2012).There are different ways to develop TALE. For example, methods for designing a TALE to bind to a target DNA sequence of interest are described in T. Cermak et al., Nucleic Acids Research. 39 (12):e82 (2011); F. Zhang F et al., Nature Biotechnology. 29 (2):149-53 (2011); R. Morbitzer et al., Nucleic Acids Research. 39 (13):5790-9 (2011); T. Li et al., Nucleic Acids Research. 39 (14):631525 (2011); R. Geissler et al., PLOS One. 6(5): e19509 (2011) and E. Weber et al., PLOS One. 6(5): e19722 (2011). In addition, various web-based tools are publicly available for designing TALEs to bind to a target DNA sequence of interest, see for example E-Talen, available online at e-talen.org/E-TALEN/TAL and the Effector Nucleotide Targeter 2.0 tool. , available online at tall-nt.cac.cornell.edu/node/add/single-tale. In addition, various commercially available services are available for generating TALEs to bind to a target DNA sequence of interest, see for example commercially available services offered by OmicX (online at omictools.com/), Addgene (online at addgene.org /talen/guide/ or ThermoFisher (online: thermofisher.com/us/en/home/life-science/genome-editing/geneart-tals/tal-designtool.html) Alternatively, a publicly available program (DNAWorks) can be used for designing oligonucleotides suitable for TALE assembly, see, for example, D. Hoover D Methods in Molecular Biology.852:215-23 (2012).

Домены модуляции транскрипции.Transcription modulation domains.

Приведенные в настоящем документе eTF, которые активируют SCN1A, могут содержать любой подходящий домен, который способен рекрутировать один или несколько белковых факторов, которыеeTFs provided herein that activate SCN1A may contain any suitable domain that is capable of recruiting one or more protein factors that

- 22 046157 могут модулировать транскрипцию (например, РНК-полимеразу II, CBP/p300, CREB или KRAB) или уровень экспрессии гена от представляющего интерес гена, когда eTF связан с целевым сайтом через DBD (например, DBD с цинковыми пальцами, gRNA/Cas DBD или TALE DBD). Согласно определенным вариантам осуществления такой домен рекрутирует белковые факторы, которые увеличивают уровень транскрипции или экспрессии представляющего интерес гена, и представляет собой домен активации транскрипции (TAD). Согласно другим вариантам осуществления такой домен рекрутирует белковые факторы, которые снижают уровень транскрипции или экспрессии представляющего интерес гена, и представляет собой домен репрессора транскрипции (TRD). Согласно определенным вариантам осуществления домен модуляции транскрипции (TAD или TRD) может представлять собой синтетически сконструированный домен. Согласно другим вариантам осуществления домен модуляции транскрипции (TAD или TRD) может происходить из встречающегося в природе белка, например, фактора транскрипции, коактиватора транскрипции, корепрессора транскрипции или белка-сайленсера. Согласно различным вариантам осуществления домен модуляции транскрипции (TAD или TRD) может происходить из белка любого вида, например, мыши, крысы, обезьяны, вируса или человека.- 22 046157 can modulate transcription (eg, RNA polymerase II, CBP/p300, CREB or KRAB) or gene expression level from a gene of interest when the eTF is bound to a target site via a DBD (eg, zinc finger DBD, gRNA/Cas DBD or TALE DBD). In certain embodiments, such a domain recruits protein factors that increase the level of transcription or expression of a gene of interest, and is a transcription activation domain (TAD). In other embodiments, such a domain recruits protein factors that reduce the level of transcription or expression of a gene of interest, and is a transcriptional repressor domain (TRD). In certain embodiments, the transcription modulation domain (TAD or TRD) may be a synthetically engineered domain. In other embodiments, the transcription modulation domain (TAD or TRD) may be derived from a naturally occurring protein, such as a transcription factor, transcription coactivator, transcription corepressor, or silencer protein. In various embodiments, the transcription modulation domain (TAD or TRD) can be derived from any type of protein, such as mouse, rat, monkey, virus, or human.

Согласно одному иллюстративному варианту осуществления TAD, подходящий для применения в представленных в настоящем документе eTF, которые активируют SNC1A, происходит из вирусного белка. Иллюстративные TAD, полученные из вирусных белков, включают в себя, например, TAD-домен VP64 (SEQ ID NO: 133), VPR (SEQ ID NO: 132), VP16, VP128, p65, p300 или любой его функциональный фрагмент или вариант, или последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к ней.In one exemplary embodiment, a TAD suitable for use in eTFs provided herein that activate SNC1A is derived from a viral protein. Exemplary TADs derived from viral proteins include, for example, the TAD domain of VP64 (SEQ ID NO: 133), VPR (SEQ ID NO: 132), VP16, VP128, p65, p300, or any functional fragment or variant thereof, or a sequence having at least 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% identity to it .

Согласно другому иллюстративному варианту осуществления TAD, подходящий для применения в представленных в настоящем документе eTF, которые активируют SCN1A, происходит из белка человека. Иллюстративные TAD, полученные из белков человека, включают в себя, например, TAD-домен взаимодействующего с CBP/p300 трансактиватора 2 (CITED2) (SEQ ID NO: 134), взаимодействующего с CBP/p300 трансактиватора 4 (CITED4) (SEQ ID NO: 135), EGR1 (SEQ ID NO: 176), CREB3 (SEQ ID NO: 224) или EGR3 (SEQ ID NO: 175), или любой их функциональный фрагмент или вариант, или последовательность, характеризующуюся идентичностью, составляющей по меньшей мере 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к ней.In another exemplary embodiment, a TAD suitable for use in eTFs provided herein that activate SCN1A is derived from a human protein. Exemplary TADs derived from human proteins include, for example, CBP/p300-interacting transactivator 2 (CITED2) TAD domain (SEQ ID NO: 134), CBP/p300-interacting transactivator 4 (CITED4) TAD (SEQ ID NO: 135), EGR1 (SEQ ID NO: 176), CREB3 (SEQ ID NO: 224) or EGR3 (SEQ ID NO: 175), or any functional fragment or variant thereof, or a sequence having at least 80% identity , 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to it.

Согласно определенным вариантам осуществления eTF, который активирует SCN1A, содержит DBD типа цинковые пальцы, который конъюгирован с доменом активации транскрипции или TAD. Согласно различным вариантам осуществления DBD типа цинковые пальцы может быть конъюгирован с TAD из вирусного белка, такого как VP64 или VPR, или с TAD из человеческого белка, такого как CITED2, CITED4 или CREB3. Согласно определенным вариантам осуществления DBD типа цинковые пальцы, полученный из человеческого белка, например, EGR1 или EGR3, конъюгирован с TAD, полученным из человеческого белка, например, CITED2, CITED4 или CREB3. Согласно определенным вариантам осуществления DBD типа цинковые пальцы, полученный из человеческого белка, например, EGR1 или EGR3, конъюгирован с VP64 или VPR TAD. Согласно определенным вариантам осуществления синтетический DBD типа цинковые пальцы или DBD типа цинковые пальцы, характеризующийся идентичностью последовательности, составляющей менее чем 75%, по отношению к человеческому белку, например, EGR1 или EGR3, конъюгирован с TAD, полученным из человеческого белка, например, CITED2, CITED4 или CREB3. Согласно определенным вариантам осуществления синтетический DBD типа цинковые пальцы или DBD типа цинковые пальцы, характеризующийся идентичностью последовательности, составляющей менее чем 75%, по отношению к человеческому белку, например, EGR1 или EGR3, конъюгирован с VP64 или VPR TAD.In certain embodiments, the eTF that activates SCN1A contains a zinc finger DBD that is conjugated to a transcription activation domain or TAD. In various embodiments, the zinc finger DBD may be conjugated to a TAD from a viral protein, such as VP64 or VPR, or to a TAD from a human protein, such as CITED2, CITED4, or CREB3. In certain embodiments, a zinc finger DBD derived from a human protein, such as EGR1 or EGR3, is conjugated to a TAD derived from a human protein, such as CITED2, CITED4, or CREB3. In certain embodiments, a zinc finger DBD derived from a human protein, such as EGR1 or EGR3, is conjugated to a VP64 or VPR TAD. In certain embodiments, a synthetic zinc finger DBD or zinc finger DBD having less than 75% sequence identity to a human protein, e.g., EGR1 or EGR3, is conjugated to a TAD derived from a human protein, e.g., CITED2, CITED4 or CREB3. In certain embodiments, a synthetic zinc finger DBD or zinc finger DBD having less than 75% sequence identity to a human protein, such as EGR1 or EGR3, is conjugated to a VP64 or VPR TAD.

Согласно определенным вариантам осуществления белок dCas конъюгирован с TAD. Согласно различным вариантам осуществления dCas9 может быть конъюгирован с TAD из вирусного белка, такого как VP64 или VPR, или с TAD из человеческого белка, такого как CITED2, CITED4 или CREB3. Согласно иллюстративным вариантам осуществления dCas9 конъюгирован с VP64 или VPR TAD.In certain embodiments, the dCas protein is conjugated to a TAD. In various embodiments, dCas9 may be conjugated to a TAD from a viral protein, such as VP64 or VPR, or to a TAD from a human protein, such as CITED2, CITED4, or CREB3. In exemplary embodiments, dCas9 is conjugated to a VP64 or VPR TAD.

Согласно определенным вариантам осуществления белок TALE конъюгирован с TAD. Согласно различным вариантам осуществления TALE может быть конъюгирован с TAD из вирусного белка, такого как VP64 или VPR, или с TAD из человеческого белка, такого как CITED2, CITED4 или CREB3. Согласно иллюстративным вариантам осуществления TALE конъюгирован с VP64 или VPR TAD.In certain embodiments, the TALE protein is conjugated to a TAD. In various embodiments, the TALE may be conjugated to a TAD from a viral protein, such as VP64 or VPR, or to a TAD from a human protein, such as CITED2, CITED4, or CREB3. In exemplary embodiments, TALE is conjugated to VP64 or VPR TAD.

eTF, которые активируют SCN1A и высокогомологичны человеческим белкам.eTFs that activate SCN1A and are highly homologous to human proteins.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, характеризуется высоким процентом идентичности по отношению к одному или нескольким белкам человека (как дополнительно описано ниже). Согласно определенным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, имеющим более низкий общий процент идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно изIn certain embodiments, an eTF disclosed herein that activates SCN1A has a high percentage of identity to one or more human proteins (as further described below). In certain embodiments, such eTFs have an overall sequence identity of at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% , 95%, 96%, 97%, 98%, or 99%, relative to one or more human proteins. In certain embodiments, such eTFs exhibit reduced immunogenicity compared to eTFs having a lower overall percentage of sequence identity to one or more human proteins. In various embodiments, the reduction in immunogenicity can be achieved by

- 23 046157 мерить с использованием анализа elispot, иммуноанализа или способа in silico. Согласно определенным вариантам осуществления такие eTF могут содержать DBD, полученный из EGR1 или EGR3 человека, и TAD, полученный из EGR1, EGR3, CITED2, CITED4 или CREB3 человека. Такие eTF практически не обладают иммуногенностью при введении субъекту или обладают пониженной иммуногенностью по сравнению с eTF, характеризующимися более низким процентом идентичности по отношению к последовательностям белков человека.- 23 046157 measure using elispot assay, immunoassay or in silico method. In certain embodiments, such eTFs may comprise a DBD derived from human EGR1 or EGR3 and a TAD derived from human EGR1, EGR3, CITED2, CITED4 or CREB3. Such eTFs have little or no immunogenicity when administered to a subject compared to eTFs that have a lower percentage of identity to human protein sequences.

Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SNC1A, характеризуется идентичностью последовательности, составляющей по меньшей мере 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Когда представленный в настоящем документе eTF, который активирует SCN1A, содержит DBD и TAD, происходящие из одного и того же белка, процент идентичности с человеческим белком может быть определен путем расчета общего количества аминокислотных остатков в eTF, которые соответствуют человеческому белку, из которого он был получен (например, EGR1 или EGR3), разделенного на общее количество аминокислотных остатков в eTF. Когда eTF, обеспечивающий активную регуляцию SCN1A, содержит DBD из одного человеческого белка и TAD, полученный из другого человеческого белка, процент идентичности с человеком может быть определен путем отдельного расчета процента идентичности с человеческим для каждого домена и суммирования этих двух показателей вместе, например, (i) вычисление общего количества аминокислотных остатков в DBD, которые соответствуют человеческому белку, из которого он был получен (например, EGR1 или EGR3), деленного на общее количество аминокислотных остатков в eTF; (ii) вычисление общего количества аминокислотных остатков в TAD, которые соответствуют человеческому белку, из которого он был получен (например, CITED2, CITED4 или CREB3), деленного на общее количество аминокислотных остатков в eTF; и (iii) суммирование суммы (i) и (ii). Согласно такому варианту осуществления домены делятся следующим образом: первый домен проходит от N-конца eTF до начала кодирующей последовательности для второго домена, а второй домен проходит от начала кодирующей последовательности для второго домена через C-конец eTF (например, для eTF, имеющего конфигурацию NLS-DBD-линкер-NLS-TAD, первый домен будет NLS-DBD-линкер, а второй домен будет NLS-TAD). Когда представленный в настоящем документе eTF, который активирует SNC1A, содержит DBD из одного человеческого белка и двух TAD, полученных из одного или нескольких различных человеческих белков, процент идентичности с человеком может быть определен путем отдельного расчета процента идентичности с человеческим для каждого домена и суммирования всех троих вместе, например, (i) вычисление общего количества аминокислотных остатков в DBD, которые соответствуют белку человека, из которого он был получен (например, EGR1 или EGR3), деленного на общее количество аминокислотных остатков в eTF; (ii) вычисление общего количества аминокислотных остатков в первом TAD, которые соответствуют человеческому белку, из которого он был получен (например, CITED2, CITED4 или CREB3), деленного на общее количество аминокислотных остатков в eTF; (iii) вычисление общего количества аминокислотных остатков во втором TAD, которые соответствуют человеческому белку, из которого он был получен (например, CITED2, CITED4 или CREB3), деленного на общее количество аминокислотных остатков в eTF; и (iv) суммирование суммы (i), (ii) и (iii). Согласно такому варианту осуществления домены делятся следующим образом: первый домен проходит от N-конца eTF до начала кодирующей последовательности для второго домена, второй домен проходит от начала кодирующей последовательности для второго домена через начало кодирующей последовательности для третьего домена, а третий домен проходит от начала кодирующей последовательности для третьего домена через C-конец eTF (например, для eTF, имеющего конфигурацию NLSTAD1-линкер-NLS-DBD-линкер-NLS-TAD2, первый домен будет ^S-TADI^uh^p, второй домен будет NLS-DBD-линкер, а третий домен будет NLS-TAD2). Процент идентичности по отношению к одному или нескольким человеческим белкам, как описано в этом разделе, может быть определен с использованием выходного процента идентичности, полученного с помощью стандартного инструмента BLAST для белков, доступного в NCBI (например, инструмента выравнивания набора blastp, используя алгоритм blastp (белок -> белок) с параметрами по умолчанию) доступен в Интернете на веб-сайте NCBI по адресу blast. ncbi. nlm. nih. gov/.In certain embodiments, an eTF provided herein that activates SNC1A has a sequence identity of at least 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84 %, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, relative to one or more human proteins. When an eTF provided herein that activates SCN1A contains a DBD and a TAD derived from the same protein, the percentage identity with the human protein can be determined by calculating the total number of amino acid residues in the eTF that correspond to the human protein from which it was derived obtained (eg EGR1 or EGR3) divided by the total number of amino acid residues in the eTF. When the eTF conferring active regulation of SCN1A contains a DBD from one human protein and a TAD derived from another human protein, the percent human identity can be determined by separately calculating the percent human identity for each domain and summing the two together, e.g. i) calculating the total number of amino acid residues in the DBD that correspond to the human protein from which it was derived (eg, EGR1 or EGR3) divided by the total number of amino acid residues in the eTF; (ii) calculating the total number of amino acid residues in the TAD that correspond to the human protein from which it was derived (eg, CITED2, CITED4, or CREB3) divided by the total number of amino acid residues in the eTF; and (iii) summing the sum of (i) and (ii). In such an embodiment, the domains are divided as follows: a first domain extends from the N-terminus of the eTF to the beginning of the coding sequence for the second domain, and a second domain extends from the beginning of the coding sequence for the second domain through the C-terminus of the eTF (for example, for an eTF having an NLS configuration -DBD-linker-NLS-TAD, the first domain will be NLS-DBD-linker and the second domain will be NLS-TAD). When the eTF provided herein that activates SNC1A contains a DBD from one human protein and two TADs derived from one or more different human proteins, the percent identity to human can be determined by separately calculating the percent identity to human for each domain and summing all three together, for example, (i) calculating the total number of amino acid residues in the DBD that correspond to the human protein from which it was derived (eg, EGR1 or EGR3) divided by the total number of amino acid residues in the eTF; (ii) calculating the total number of amino acid residues in the first TAD that correspond to the human protein from which it was derived (eg, CITED2, CITED4, or CREB3) divided by the total number of amino acid residues in the eTF; (iii) calculating the total number of amino acid residues in the second TAD that correspond to the human protein from which it was derived (eg, CITED2, CITED4, or CREB3) divided by the total number of amino acid residues in the eTF; and (iv) summing the sum of (i), (ii) and (iii). In such an embodiment, the domains are divided as follows: a first domain extends from the N-terminus of the eTF to the start of the coding sequence for the second domain, a second domain extends from the start of the coding sequence for the second domain through the start of the coding sequence for the third domain, and a third domain extends from the start of the coding sequence sequences for the third domain through the C-terminus of the eTF (for example, for an eTF having the configuration NLSTAD1-linker-NLS-DBD-linker-NLS-TAD2, the first domain would be ^S-TADI^uh^p, the second domain would be NLS-DBD- linker, and the third domain will be NLS-TAD2). Percent identity to one or more human proteins, as described in this section, can be determined using the percent identity output obtained from the standard protein BLAST tool available from NCBI (e.g., the blastp set alignment tool using the blastp algorithm ( protein -> protein) with default parameters) is available online at the NCBI website at blast. ncbi. nlm. nih. gov/.

Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, имеет преимущество в том, что вызывает слабый, минимальный или нулевой неблагоприятный иммунный ответ у человека из-за высокой степени идентичности последовательностей с природными белками человека. Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A, вызывает пониженную иммуногенность, например, снижение иммуногенности по меньшей мере в 0,5, 1, 1,5, 2, 2,5, 3, 3,5, 4, 4,5, 5, 10, 15, 20, 25, 30, 35, 40, 45 или 50 или более раз по сравнению с иммуногенностью, наблюдаемой с eTF, имеющим более низкий процент идентичности по отношению к одному или нескольким белкам человека, например, eTF, характеризующимся идентичностью последовательности, составляющей менее чем 50%, 55%, 65% или 70%, по отношению к одному или нескольким белкам человека. В некоторых случаях снижение иммуногенности можно измерить с помощью анализа elispot, иммуноанализа или способа inIn certain embodiments, an eTF provided herein that activates SCN1A has the advantage of eliciting little, minimal, or no adverse immune response in humans due to high sequence identity to naturally occurring human proteins. In certain embodiments, an eTF provided herein that activates SCN1A causes decreased immunogenicity, e.g., a decrease in immunogenicity of at least 0.5, 1, 1.5, 2, 2.5, 3, 3.5, 4. 4.5, 5, 10, 15, 20, 25, 30, 35, 40, 45 or 50 times or more the immunogenicity observed with an eTF having a lower percentage identity to one or more human proteins, e.g. , an eTF having less than 50%, 55%, 65%, or 70% sequence identity to one or more human proteins. In some cases, reduction in immunogenicity can be measured using an elispot assay, an immunoassay, or an in

- 24 046157 silico. Генная терапия, обладающая низкой или минимальной иммуногенностью, имеет несколько преимуществ, включая в себя улучшенную переносимость пациентом, уменьшенную дозу, необходимую для достижения терапевтического эффекта, пролонгированные терапевтические эффекты после одного введения, возможность вводить несколько раз или в нескольких дозах, если необходимо, устойчивую терапевтическую эффективность в течение более длительного периода времени на одно введение, повышенную безопасность и/или повышенную эффективность генной терапии.- 24 046157 silico. Gene therapy that is low or minimally immunogenic has several advantages, including improved patient tolerability, reduced dosage required to achieve therapeutic effect, prolonged therapeutic effects after a single administration, ability to be administered multiple times or in multiple doses if necessary, sustained therapeutic benefit. efficacy over a longer period of time per administration, increased safety and/or increased efficacy of gene therapy.

Согласно определенным вариантам осуществления представленные в настоящем документе eTF, которые активируют SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включают в себя DBD и TAD, полученные из одного или нескольких встречающихся в природе белков человека. Согласно определенным вариантам осуществления такие eTF могут содержать DBD, полученный из любого встречающегося в природе белка человека, содержащего DBD. Согласно иллюстративным вариантам осуществления, представленный в настоящем документе eTF, который активирует SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя DBD, полученный из встречающегося в природе белка типа цинковые пальцы, такого как, например, любая из конструкций 5-27, 36-41 или 44-53, перечисленные в табл. 1. Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя DBD, полученный из белка EGR человека, такого как EGR1, EGR2, EGR3 или EGR4. Согласно иллюстративным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя DBD, полученный из EGR1 или EGR3 человека. Согласно различным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя DBD, полученный из белка типа цинковые пальцы человека, в котором минимальные аминокислотные изменения (например, 1, 2, 3, 4, 5, 6, 7 или 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 2-3, 2-4, 2-5, 2-6, 27, 3-4, 3-5, 36 или 3-7 аминокислотных замен) были сделаны в одном или нескольких доменах типа цинковые пальцы DBD, чтобы изменить специфичность связывания DBD для распознавания представляющего интерес целевого сайта связывания. Такие модификации последовательности предпочтительно выполняются в спиралях распознавания доменов типа цинковые пальцы DBD, в то время как остальная часть DBD или белка типа цинковые пальцы человека (включая в себя TAD) остается немодифицированной, чтобы сохранить как можно больше идентичности последовательности с природным человеческим белок по возможности.In certain embodiments, eTFs provided herein that activate SCN1A and have a high percentage of sequence identity to one or more human proteins include DBDs and TADs derived from one or more naturally occurring human proteins. In certain embodiments, such eTFs may comprise a DBD derived from any naturally occurring human protein containing a DBD. In illustrative embodiments, an eTF provided herein that activates SCN1A and has a high percentage of sequence identity to one or more human proteins includes a DBD derived from a naturally occurring zinc finger protein, such as, for example, any from designs 5-27, 36-41 or 44-53, listed in table. 1. In certain embodiments, an eTF provided herein that activates SCN1A and has a high percentage of sequence identity to one or more human proteins includes a DBD derived from a human EGR protein, such as EGR1, EGR2, EGR3, or EGR4 . In illustrative embodiments, an eTF provided herein that activates SCN1A and has a high percentage of sequence identity to one or more human proteins includes a DBD derived from human EGR1 or EGR3. In various embodiments, an eTF provided herein that activates SCN1A and has a high percentage of sequence identity to one or more human proteins includes a DBD derived from a human zinc finger protein in which there are minimal amino acid changes (e.g., 1 , 2, 3, 4, 5, 6, 7 or 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 2-3, 2-4, 2-5, 2 -6, 27, 3-4, 3-5, 36, or 3-7 amino acid substitutions) were made in one or more zinc finger domains of the DBD to alter the binding specificity of the DBD to recognize the target binding site of interest. Such sequence modifications are preferably made in the recognition helices of the DBD zinc finger domains, while the rest of the DBD or human zinc finger protein (including the TADs) remains unmodified to maintain as much sequence identity with the native human protein as possible.

Согласно определенным вариантам осуществления представленные в настоящем документе eTF, которые активируют SCN1A и характеризуются высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, содержат один или несколько доменов модуляции транскрипции (например, TAD), полученных из человеческого белка, конъюгированного с DBD, полученным из белка человека. Согласно различным вариантам осуществления домен модуляции транскрипции может происходить из любого встречающегося в природе человеческого белка, имеющего домен, способный рекрутировать один или несколько белковых факторов, которые могут модулировать транскрипцию (например, РНК-полимераза II, коактиваторный белок или ко-репрессорный белок) или уровень экспрессии гена из представляющего интерес гена, когда eTF связывается с целевым сайтом через DBD. Согласно иллюстративным вариантам осуществления TAD получен из белка EGR человека, такого как, например, EGR1, EGR2, EGR3 или EGR4 человека, или из указанного белка человека, такого как, например, белок CITED2 или CITED4 человека. Согласно иллюстративному варианту осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуется высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя TAD из белка EGR1 или EGR3 человека. Согласно другому иллюстративному варианту осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуется высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, включает в себя TAD из белка CITED2 или CITED4 человека.In certain embodiments, eTFs provided herein that activate SCN1A and have a high percentage of sequence identity to one or more human proteins contain one or more transcriptional modulation domains (e.g., TADs) derived from a human protein conjugated to a DBD, derived from human protein. In various embodiments, the transcription modulation domain may be derived from any naturally occurring human protein having a domain capable of recruiting one or more protein factors that can modulate transcription (e.g., RNA polymerase II, coactivator protein, or co-repressor protein) or level gene expression from the gene of interest when the eTF binds to the target site through the DBD. In exemplary embodiments, the TAD is derived from a human EGR protein, such as, for example, human EGR1, EGR2, EGR3, or EGR4, or from a human protein, such as, for example, human CITED2 or CITED4 protein. In an exemplary embodiment, an eTF provided herein that activates SCN1A and has a high percentage of sequence identity to one or more human proteins includes a TAD from a human EGR1 or EGR3 protein. In another exemplary embodiment, an eTF provided herein that activates SCN1A and has a high percentage of sequence identity to one or more human proteins includes a TAD from a human CITED2 or CITED4 protein.

Согласно одному варианту осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуется высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, может содержать DBD человека (hDBD) и TAD человека (hTAD) (например, hTAD-hDBD или hDBD-hTAD), причем hDBD и hTAD могут происходить из одного и того же человеческого белка или из разных человеческих белков. Согласно другому варианту осуществления представленный в настоящем документе eTF, характеризующийся высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, может содержать hDBD и два hTAD, причем hDBD и hTAD происходят из одного и того же человеческого белка, hDBD происходит из первого человеческого белка и оба hTAD происходят из второго человеческого белка, hDBD и один hTAD происходят из первого человеческого белка, а второй hTAD происходит изIn one embodiment, an eTF provided herein that activates SCN1A and has a high percentage of sequence identity to one or more human proteins may comprise a human DBD (hDBD) and a human TAD (hTAD) (e.g., hTAD-hDBD or hDBD- hTAD), and hDBD and hTAD can be derived from the same human protein or from different human proteins. In another embodiment, an eTF provided herein having a high percentage of sequence identity to one or more human proteins may comprise an hDBD and two hTADs, wherein the hDBD and hTAD are derived from the same human protein, the hDBD being derived from the first human protein and both hTADs are derived from a second human protein, hDBD and one hTAD are derived from the first human protein, and the second hTAD is derived from

- 25 046157 второго человеческого белка, или hDBD происходит из первого человеческого белка, один hTAD происходит из второго человеческого белка, а второй hTAD происходит из третьего человеческого белка (например, hTAD1-hDBD-hTAD1, hTAD1-hDBD-hTAD2, hTAD1-hTAD1-hDBD, hTAD1-hTAD2-hDBD, hDBD-hTAD1-hTAD1 или hDBD-hTAD1-hTAD2).- 25 046157 a second human protein, or hDBD is derived from a first human protein, one hTAD is derived from a second human protein, and a second hTAD is derived from a third human protein (for example, hTAD1-hDBD-hTAD1, hTAD1-hDBD-hTAD2, hTAD1-hTAD1- hDBD, hTAD1-hTAD2-hDBD, hDBD-hTAD1-hTAD1 or hDBD-hTAD1-hTAD2).

Согласно иллюстративным вариантам осуществления представленный в настоящем документе eTF, характеризующийся высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, содержит любую из следующих конфигураций: (i) hDBD и hTAD, оба получены из EGR1 человека; (ii) hDBD и hTAD, оба получены из EGR3 человека; (iii) hDBD, полученный из EGR1 человека, и hTAD, полученный из CITED2 (например, hEGR1 DBD-hCITED2 TAD или hCITED2 TAD-hEGR1 DBD); (iv) hDBD, полученный из EGR1 человека, и hTAD, полученный из CITED4 человека (например, hEGR1 DBD-hCITED4 TAD или hCITED4 TAD-hEGR1 DBD); (v) hDBD, полученный из EGR3 человека, и hTAD, полученный из CITED2 (например, hEGR3 DBD-hCITED2 TAD или hCITED2 TAD-hEGR3 DBD); (vi) hDBD, полученный из EGR3 человека, и hTAD, полученный из CITED4 человека (например, hEGR3 DBD-hCITED4 TAD или hCITED4 TAD-hEGR3 DBD); (vii) hDBD, полученный из EGR1 человека, и два hTAD, полученные из CITED2 (например, hCITED2 TAD-hEGR1 DBDhCITED2 TAD, hCITED2 TAD-hCITED2 TAD-hEGR1 DBD или hEGR1 DBD-hCITED2 TAD-hCITED2 TAD); (viii) hDBD, полученный из EGR1 человека, и два hTAD, полученные из CITED4 человека (например, hCITED4 TAD-hEGR1 DBD-hCITED4 TAD, hCITED4 TAD-hCITED4 TAD-hEGR1 DBD или hEGR1 DBD-hCITED4 TAD-hCITED4 TAD); (ix) hDBD, полученный из EGR3 человека, и два hTAD, полученные из CITED2 человека (например, hCITED2 TAD-hEGR3 DBD-hCITED2 TAD, hCITED2 TADhCITED2 TAD-hEGR3 DBD или hEGR3 DBD-hCITED2 TAD-hCITED2 TAD); (x) hDBD, полученный из EGR3 человека, и два hTAD, полученные из CITED4 человека (например, hCITED4 TAD-hEGR3 DBDhCITED4 TAD, hCITED4 TAD-hCITED4 TAD-hEGR3 DBD или hEGR3 DBD-hCITED4 TAD-hCITED4 TAD); (xi) hDBD, полученный из EGR1 человека, первый hTAD, полученный из CITED2 человека, второй hTAD, полученный из CITED4 человека (например, hCITED2 TAD-hEGR1 DBD-hCITED4 TAD, hCITED4 TAD-hEGR1 DBD-hCITED2 TAD, hCITED2 TAD-hCITED4 TAD-hEGR1 DBD, hCITED4 TADhCITED2 TAD-hEGR1 DBD, hEGR1 DBD-hCITED4 TAD-hCITED2 TAD или hEGR1 DBD-hCITED2 TADhCITED4 TAD); или (xii) hDBD, полученный из EGR3 человека, первый hTAD, полученный из CITED2 человека, второй hTAD, полученный из CITED4 человека (например, hCITED2 TAD-hEGR3 DBDhCITED4 TAD, hCITED4 TAD-hEGR3 DBD-hCITED2 TAD, hCITED2 TAD-hCITED4 TAD-hEGR3 DBD, hCITED4 TAD-hCITED2 TAD-hEGR3 DBD, hEGR3 DBD-hCITED4 TAD-hCITED2 TAD или hEGR3 DBDhCITED2 TAD-hCITED4 TAD).In exemplary embodiments, an eTF provided herein having a high percentage of sequence identity to one or more human proteins comprises any of the following configurations: (i) hDBD and hTAD, both derived from human EGR1; (ii) hDBD and hTAD, both derived from human EGR3; (iii) hDBD derived from human EGR1 and hTAD derived from CITED2 (eg, hEGR1 DBD-hCITED2 TAD or hCITED2 TAD-hEGR1 DBD); (iv) hDBD derived from human EGR1 and hTAD derived from human CITED4 (eg, hEGR1 DBD-hCITED4 TAD or hCITED4 TAD-hEGR1 DBD); (v) hDBD derived from human EGR3 and hTAD derived from CITED2 (eg, hEGR3 DBD-hCITED2 TAD or hCITED2 TAD-hEGR3 DBD); (vi) hDBD derived from human EGR3 and hTAD derived from human CITED4 (eg, hEGR3 DBD-hCITED4 TAD or hCITED4 TAD-hEGR3 DBD); (vii) hDBD derived from human EGR1 and two hTADs derived from CITED2 (e.g., hCITED2 TAD-hEGR1 DBDhCITED2 TAD, hCITED2 TAD-hCITED2 TAD-hEGR1 DBD, or hEGR1 DBD-hCITED2 TAD-hCITED2 TAD); (viii) hDBD derived from human EGR1 and two hTADs derived from human CITED4 (eg, hCITED4 TAD-hEGR1 DBD-hCITED4 TAD, hCITED4 TAD-hCITED4 TAD-hEGR1 DBD, or hEGR1 DBD-hCITED4 TAD-hCITED4 TAD); (ix) hDBD derived from human EGR3 and two hTADs derived from human CITED2 (eg, hCITED2 TAD-hEGR3 DBD-hCITED2 TAD, hCITED2 TADhCITED2 TAD-hEGR3 DBD, or hEGR3 DBD-hCITED2 TAD-hCITED2 TAD); (x) hDBD derived from human EGR3 and two hTADs derived from human CITED4 (eg, hCITED4 TAD-hEGR3 DBDhCITED4 TAD, hCITED4 TAD-hCITED4 TAD-hEGR3 DBD, or hEGR3 DBD-hCITED4 TAD-hCITED4 TAD); (xi) hDBD derived from human EGR1, first hTAD derived from human CITED2, second hTAD derived from human CITED4 (e.g. hCITED2 TAD-hEGR1 DBD-hCITED4 TAD, hCITED4 TAD-hEGR1 DBD-hCITED2 TAD, hCITED2 TAD-hCITED4 TAD-hEGR1 DBD, hCITED4 TADhCITED2 TAD-hEGR1 DBD, hEGR1 DBD-hCITED4 TAD-hCITED2 TAD or hEGR1 DBD-hCITED2 TADhCITED4 TAD); or (xii) an hDBD derived from human EGR3, a first hTAD derived from human CITED2, a second hTAD derived from human CITED4 (e.g., hCITED2 TAD-hEGR3 DBDhCITED4 TAD, hCITED4 TAD-hEGR3 DBD-hCITED2 TAD, hCITED2 TAD-hCITED4 TAD -hEGR3 DBD, hCITED4 TAD-hCITED2 TAD-hEGR3 DBD, hEGR3 DBD-hCITED4 TAD-hCITED2 TAD or hEGR3 DBDhCITED2 TAD-hCITED4 TAD).

Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуется высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, содержит любое из следующего: (i) последовательность, содержащая любую из SEQ ID NO: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 или 223; (ii) последовательность, содержащая любую из SEQ ID NO: 92-98; (iii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любой из последовательностей (i) или (ii); или (iv) функциональный фрагмент или вариант любой из последовательностей (i), (ii) или (iii). Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или больше по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или больше по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.In certain embodiments, an eTF provided herein that activates SCN1A and has a high percentage of sequence identity to one or more human proteins comprises any of the following: (i) a sequence comprising any of SEQ ID NOs: 103-124, 128 -131, 205, 207, 209, 213, 217, 219, 221 or 223; (ii) a sequence comprising any of SEQ ID NOs: 92-98; (iii) a sequence having a sequence identity of at least 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96 %, 97%, 98% or 99%, relative to any of the sequences (i) or (ii); or (iv) a functional fragment or variant of any of sequences (i), (ii) or (iii). In exemplary embodiments, such eTFs are capable of increasing SCN1A expression by at least 2-fold, 5-fold, 10-fold, 15-fold, 20-fold, 25-fold, 30-fold, 40-fold, 50-fold, or greater than control, or at least at least 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% or 500% or more compared to control. In exemplary embodiments, such eTFs have an overall sequence identity of at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% , 95%, 96%, 97%, 98% or 99% relative to one or more human proteins. In certain embodiments, such eTFs exhibit reduced immunogenicity compared to eTFs having a lower overall percentage of sequence identity to one or more human proteins. In various embodiments, the reduction in immunogenicity can be measured using an elispot assay, an immunoassay, or an in silico method.

Согласно определенным вариантам осуществления представленный в настоящем документе eTF, который активирует SCN1A и характеризуется высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, может дополнительно содержать одну или несколько аминокислотных последовательностей или доменов в дополнение к доменам DBD и TAD, например, сигнал ядерной локализации или линкер и т.д. Кроме того, полинуклеотид, кодирующий представленный в настоящем документе eTF, характеризующийся высоким процентом идентичности последовательности по отношению к одному или нескольким белкам человека, может дополнительно содержать одну или несколько последовательностей нуклеиновых кислот в дополнение к кодирующей последовательности для eTF, например, промотор, энхансер, полиА-хвост и т.д. Согласно таким вариантам осуществления одна или несколько дополнительных аминокислотных последовательностей и/или послеIn certain embodiments, an eTF provided herein that activates SCN1A and has a high percentage of sequence identity to one or more human proteins may further comprise one or more amino acid sequences or domains in addition to the DBD and TAD domains, e.g., a nuclear signal localization or linker, etc. In addition, a polynucleotide encoding an eTF provided herein that has a high percentage of sequence identity to one or more human proteins may further comprise one or more nucleic acid sequences in addition to the coding sequence for the eTF, e.g., a promoter, an enhancer, a polyA -tail, etc. In such embodiments, one or more additional amino acid sequences and/or following

- 26 046157 довательностей нуклеиновых кислот предпочтительно представляют собой человеческие последовательности, происходящие из человеческих последовательностей, или характеризуются идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% по отношению к белку человека.- 26 046157 nucleic acid sequences are preferably human sequences derived from human sequences, or have a sequence identity of at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% relative to human protein.

Иллюстративные eTF SCN1A.Exemplary SCN1A eTFs.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий один или несколько доменов типа цинковые пальцы, содержащих спираль распознавания, содержащую любую из SEQ ID NO: 152167. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий по меньшей мере один, два, три, четыре, пять, шесть, семь, восемь, девять, десять, одиннадцать или двенадцать доменов типа цинковые пальцы, причем каждый домен типа цинковые пальцы независимо содержит спираль распознавания, содержащую любую из SEQ ID NO: 152-167. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий шесть доменов типа цинковые пальцы, причем каждый домен типа цинковые пальцы независимо содержит спираль распознавания, содержащую любую из SEQ ID NO: 152-167. Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий девять доменов типа цинковые пальцы, причем каждый домен типа цинковые пальцы независимо содержит спираль распознавания, содержащую любую из SEQ ID NO: 152-167. Согласно иллюстративным вариантам осуществления такие eTF содержат ДНК-связывающий домен, содержащий SEQ ID NO: 147, где каждый X независимо выбран из любой из SEQ ID NO: 152-167, а n равно 6 или 9.In certain embodiments, an eTF disclosed herein that activates SCN1A comprises a DNA binding domain comprising one or more zinc finger domains containing a recognition helix comprising any of SEQ ID NO: 152167. In certain embodiments, disclosed herein The eTF that activates SCN1A contains a DNA binding domain containing at least one, two, three, four, five, six, seven, eight, nine, ten, eleven, or twelve zinc finger domains, each zinc finger domain independently contains a recognition helix containing any of SEQ ID NOs: 152-167. In certain embodiments, an eTF disclosed herein that activates SCN1A comprises a DNA binding domain comprising six zinc finger domains, with each zinc finger domain independently comprising a recognition helix comprising any of SEQ ID NOs: 152-167. In certain embodiments, an eTF disclosed herein that activates SCN1A comprises a DNA binding domain comprising nine zinc finger domains, with each zinc finger domain independently comprising a recognition helix comprising any of SEQ ID NOs: 152-167. In exemplary embodiments, such eTFs comprise a DNA binding domain comprising SEQ ID NO: 147, wherein each X is independently selected from any of SEQ ID NOs: 152-167, and n is 6 or 9.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий любое из следующего: (i) последовательность, содержащая RSDNLVR x REDNLHT x RSDELVR x QSGNLTE x TSGHLVR x QNSTLTE (SEQ ID NO: 148), где x может представлять собой линкер из 1-50 аминокислот, (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 90%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 148, или (ii) функциональный фрагмент из (i) или (ii). Согласно определенным вариантам осуществления такой eTF дополнительно содержит один или несколько TAD, выбранных из VP64, VPR, CITED2, CITED4 или CREB3. Согласно одному варианту осуществления такой eTF содержит домен TAD VPR, конъюгированный с C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит CITED2 TAD, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит TAD CITED4, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит два TAD CITED4, конъюгированных с N-концом или C-концом DBD. Согласно определенным вариантам осуществления такой eTF способен связываться с целевым сайтом, содержащим SEQ ID NO: 18, и повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более раз по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.In certain embodiments, an eTF disclosed herein that activates SCN1A comprises a DNA binding domain comprising any of the following: (i) a sequence comprising RSDNLVR x REDNLHT x RSDELVR x QSGNLTE x TSGHLVR x QNSTLTE (SEQ ID NO: 148), where x may be a linker of 1-50 amino acids, (ii) a sequence having at least 80%, 85%, 90%, 95%, 96%, 97%, 98% or 99% sequence identity, according to with respect to SEQ ID NO: 148, or (ii) a functional fragment from (i) or (ii). In certain embodiments, such an eTF further comprises one or more TADs selected from VP64, VPR, CITED2, CITED4, or CREB3. In one embodiment, such an eTF comprises a VPR TAD domain conjugated to the C-terminus of a DBD. In certain embodiments, such an eTF comprises a CITED2 TAD conjugated to the N-terminus, the C-terminus, or the N-terminus and the C-terminus of a DBD. In certain embodiments, such an eTF comprises a CITED4 TAD conjugated to the N-terminus, the C-terminus, or the N-terminus and the C-terminus of a DBD. In certain embodiments, such an eTF comprises two CITED4 TADs conjugated to the N-terminus or C-terminus of a DBD. In certain embodiments, such eTF is capable of binding to the target site comprising SEQ ID NO: 18 and increasing SCN1A expression by at least 2-fold, 5-fold, 10-fold, 15-fold, 20-fold, 25-fold, 30-fold, 40-fold , 50 times or more times compared to the control, or at least 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150 %, 200%, 250%, 300%, 400% or 500% or more compared to control.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий любое из следующего: (i) последовательность, содержащая RSDNLVR x HRTTLTN x REDNLHT x TSHSLTE x QSSSLVR x REDNLHT (SEQ ID NO: 149), где x может представлять собой линкер из 1-50 аминокислот, (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 90%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 149, или (ii) функциональный фрагмент из (i) или (ii). Согласно определенным вариантам осуществления такой eTF дополнительно содержит один или несколько TAD, выбранных из VP64, VPR, CITED2, CITED4 или CREB3. Согласно одному варианту осуществления такой eTF содержит домен TAD VPR, конъюгированный с C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит CITED2 TAD, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит TAD CITED4, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит два TAD CITED4, конъюгированных с N-концом или C-концом DBD. Согласно определенным вариантам осуществления такой eTF способен связываться с целевым сайтом, содержащим SEQ ID NO: 30, и повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более раз по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.In certain embodiments, an eTF disclosed herein that activates SCN1A comprises a DNA binding domain comprising any of the following: (i) a sequence comprising RSDNLVR x HRTTLTN x REDNLHT x TSHSLTE x QSSSLVR x REDNLHT (SEQ ID NO: 149), where x may be a linker of 1-50 amino acids, (ii) a sequence having at least 80%, 85%, 90%, 95%, 96%, 97%, 98% or 99% sequence identity, according to with respect to SEQ ID NO: 149, or (ii) a functional fragment from (i) or (ii). In certain embodiments, such an eTF further comprises one or more TADs selected from VP64, VPR, CITED2, CITED4, or CREB3. In one embodiment, such an eTF comprises a VPR TAD domain conjugated to the C-terminus of a DBD. In certain embodiments, such an eTF comprises a CITED2 TAD conjugated to the N-terminus, the C-terminus, or the N-terminus and the C-terminus of a DBD. In certain embodiments, such an eTF comprises a CITED4 TAD conjugated to the N-terminus, the C-terminus, or the N-terminus and the C-terminus of a DBD. In certain embodiments, such an eTF comprises two CITED4 TADs conjugated to the N-terminus or C-terminus of a DBD. In certain embodiments, such eTF is capable of binding to the target site comprising SEQ ID NO: 30 and increasing SCN1A expression by at least 2-fold, 5-fold, 10-fold, 15-fold, 20-fold, 25-fold, 30-fold, 40-fold , 50 times or more times compared to the control, or at least 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150 %, 200%, 250%, 300%, 400% or 500% or more compared to control.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий любое из следующего: (i) последовательность, содержащая RRDELNV x RSDHLTN x RSDDLVR x RSDNLVR x HRTTLTN x REDNLHT x TSHSLTE x QSSSLVR x REDNLHT (SEQ ID NO: 151), (ii) последовательность, характеризуюIn certain embodiments, an eTF disclosed herein that activates SCN1A comprises a DNA binding domain comprising any of the following: (i) a sequence comprising RRDELNV x RSDHLTN x RSDDLVR x RSDNLVR x HRTTLTN x REDNLHT x TSHSLTE x QSSSLVR x REDNLHT (SEQ ID NO: 151), (ii) sequence, characterize

- 27 046157 щаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 90%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 151, или (ii) функциональный фрагмент (i) или (ii). Согласно определенным вариантам осуществления такой eTF дополнительно содержит один или несколько TAD, выбранных из VP64, VPR, CITED2, CITED4 или CREB3. Согласно одному варианту осуществления такой eTF содержит домен TAD VPR, конъюгированный с C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит CITED2 TAD, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит TAD CITED4, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит два TAD CITED4, конъюгированных с Nконцом или C-концом DBD. Согласно определенным вариантам осуществления такой eTF способен связываться с целевым сайтом, содержащим SEQ ID NO: 32, и повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.- 27 046157 having at least 80%, 85%, 90%, 95%, 96%, 97%, 98% or 99% sequence identity to SEQ ID NO: 151, or (ii) a functional fragment (i) or (ii). In certain embodiments, such an eTF further comprises one or more TADs selected from VP64, VPR, CITED2, CITED4, or CREB3. In one embodiment, such an eTF comprises a VPR TAD domain conjugated to the C terminus of a DBD. In certain embodiments, such an eTF comprises a CITED2 TAD conjugated to the N-terminus, the C-terminus, or the N-terminus and the C-terminus of a DBD. In certain embodiments, such an eTF comprises a CITED4 TAD conjugated to the N-terminus, the C-terminus, or the N-terminus and the C-terminus of a DBD. In certain embodiments, such an eTF comprises two CITED4 TADs conjugated to the N-terminus or C-terminus of a DBD. In certain embodiments, such eTF is capable of binding to the target site comprising SEQ ID NO: 32 and increasing SCN1A expression by at least 2-fold, 5-fold, 10-fold, 15-fold, 20-fold, 25-fold, 30-fold, 40-fold , 50 times or more compared to control, or at least 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150% , 200%, 250%, 300%, 400% or 500% or more compared to control.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит ДНК-связывающий домен, содержащий любое из следующего: (i) последовательность, содержащая DPGALVR x RSDNLVR x QSGDLRR x THLDLIR x TSGNLVR x RSDNLVR (SEQ ID NO: 150), (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 89%, 85%, 90%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 150, или (ii) функциональный фрагмент (i) или (ii). Согласно определенным вариантам осуществления такой eTF дополнительно содержит один или несколько TAD, выбранных из VP64, VPR, CITED2, CITED4 или CREB3. Согласно одному варианту осуществления такой eTF содержит домен TAD VPR, конъюгированный с C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит CITED2 TAD, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит TAD CITED4, конъюгированный с N-концом, C-концом или N-концом и C-концом DBD. Согласно определенным вариантам осуществления такой eTF содержит два TAD CITED4, конъюгированных с N-концом или C-концом DBD. Согласно определенным вариантам осуществления такой eTF способен связываться с целевым сайтом, содержащим SEQ ID NO: 31, и повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.In certain embodiments, an eTF disclosed herein that activates SCN1A comprises a DNA binding domain comprising any of the following: (i) a sequence comprising DPGALVR x RSDNLVR x QSGDLRR x THLDLIR x TSGNLVR x RSDNLVR (SEQ ID NO: 150), (ii) a sequence having at least 89%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO: 150, or (ii) functional fragment (i) or (ii). In certain embodiments, such an eTF further comprises one or more TADs selected from VP64, VPR, CITED2, CITED4, or CREB3. In one embodiment, such an eTF comprises a VPR TAD domain conjugated to the C-terminus of a DBD. In certain embodiments, such an eTF comprises a CITED2 TAD conjugated to the N-terminus, the C-terminus, or the N-terminus and the C-terminus of a DBD. In certain embodiments, such an eTF comprises a CITED4 TAD conjugated to the N-terminus, the C-terminus, or the N-terminus and the C-terminus of a DBD. In certain embodiments, such an eTF comprises two CITED4 TADs conjugated to the N-terminus or C-terminus of a DBD. In certain embodiments, such eTF is capable of binding to the target site comprising SEQ ID NO: 31 and increasing SCN1A expression by at least 2-fold, 5-fold, 10-fold, 15-fold, 20-fold, 25-fold, 30-fold, 40-fold , 50 times or more compared to the control, or at least 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150% , 200%, 250%, 300%, 400% or 500% or more compared to control.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая любую из SEQ ID NO: 99-131, 205, 207, 209, 213, 217, 219, 221 или 223; (ii) последовательность, содержащая любую из SEQ ID NO: 77-98; (iii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любой из последовательностей (i) или (ii); или (iv) функциональный фрагмент или вариант любой из последовательностей (i), (ii) или (iii). Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.In certain embodiments, an eTF disclosed herein that activates SCN1A comprises any of the following: (i) a sequence comprising any of SEQ ID NOs: 99-131, 205, 207, 209, 213, 217, 219, 221, or 223 ; (ii) a sequence comprising any of SEQ ID NOs: 77-98; (iii) a sequence having a sequence identity of at least 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96 %, 97%, 98% or 99%, with respect to any of the sequences (i) or (ii); or (iv) a functional fragment or variant of any of sequences (i), (ii) or (iii). In exemplary embodiments, such eTFs are capable of increasing SCN1A expression by at least 2-fold, 5-fold, 10-fold, 15-fold, 20-fold, 25-fold, 30-fold, 40-fold, 50-fold or more relative to control or at least by 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% or 500 % or more compared to control.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая любую из SEQ ID NO: 99-102 или 125-127; (ii) последовательность, содержащая любую из SEQ ID NO: 77-91; (iii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любой из последовательностей (i) или (ii); или (iv) функциональный фрагмент или вариант любой из последовательностей (i), (ii) или (iii). Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.In certain embodiments, an eTF disclosed herein that activates SCN1A comprises any of the following: (i) a sequence comprising any of SEQ ID NOs: 99-102 or 125-127; (ii) a sequence comprising any of SEQ ID NOs: 77-91; (iii) a sequence having a sequence identity of at least 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96 %, 97%, 98% or 99%, with respect to any of the sequences (i) or (ii); or (iv) a functional fragment or variant of any of sequences (i), (ii) or (iii). In exemplary embodiments, such eTFs are capable of increasing SCN1A expression by at least 2-fold, 5-fold, 10-fold, 15-fold, 20-fold, 25-fold, 30-fold, 40-fold, 50-fold or more compared to control, or at least at least 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% or 500% or more compared to control.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая любую из SEQ ID NO: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 или 223; (ii) последовательность, содержащая любую из SEQ ID NO: 92-98; (iii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любой из последовательностей (i) или (ii); или (iv) функциональный фрагмент или вариант любой из последовательностей (i), (ii) или (iii). Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCN1A по меньшейIn certain embodiments, an eTF disclosed herein that activates SCN1A comprises any of the following: (i) a sequence comprising any of SEQ ID NOs: 103-124, 128-131, 205, 207, 209, 213, 217, 219 , 221 or 223; (ii) a sequence containing any of SEQ ID NO: 92-98; (iii) a sequence having a sequence identity of at least 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96 %, 97%, 98% or 99%, relative to any of the sequences (i) or (ii); or (iv) a functional fragment or variant of any of sequences (i), (ii) or (iii). In exemplary embodiments, such eTFs are capable of increasing SCN1A expression by at least

- 28 046157 мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.- 28 046157 at least 2 times, 5 times, 10 times, 15 times, 20 times, 25 times, 30 times, 40 times, 50 times or more compared to the control, or at least 20%, 30%, 40 %, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% or 500% or more compared to control. In exemplary embodiments, such eTFs have an overall sequence identity of at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% , 95%, 96%, 97%, 98%, or 99%, relative to one or more human proteins. In certain embodiments, such eTFs exhibit reduced immunogenicity compared to eTFs having a lower overall percentage of sequence identity to one or more human proteins. In various embodiments, the reduction in immunogenicity can be measured using an elispot assay, an immunoassay, or an in silico method.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая SEQ ID NO: 127; (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 127; или (iii) функциональный фрагмент или вариант любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие eTF содержат SEQ ID NO: 77 и связываются с целевым сайтом, содержащим SEQ ID NO: 18. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCNIA по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем.In certain embodiments, an eTF disclosed herein that activates SCN1A comprises any of the following: (i) a sequence comprising SEQ ID NO: 127; (ii) a sequence having a sequence identity of at least 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96 %, 97%, 98% or 99%, relative to SEQ ID NO: 127; or (iii) a functional fragment or variant of any of sequences (i) or (ii). In exemplary embodiments, such eTFs contain SEQ ID NO: 77 and bind to a target site containing SEQ ID NO: 18. In exemplary embodiments, such eTFs are capable of increasing SCNIA expression by at least 2-fold, 5-fold, 10-fold, 15-fold , 20 times, 25 times, 30 times, 40 times, 50 times or more compared to the control, or at least 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80% , 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% or 500% or more compared to control.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая SEQ ID NO: 128; (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% по отношению к SEQ ID NO: 128; или (iii) функциональный фрагмент или вариант любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие eTF содержат SEQ ID NO: 92 и связываются с целевым сайтом, содержащим SEQ ID NO: 18. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCNIA по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.In certain embodiments, an eTF disclosed herein that activates SCN1A comprises any of the following: (i) a sequence comprising SEQ ID NO: 128; (ii) a sequence having a sequence identity of at least 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96 %, 97%, 98% or 99% relative to SEQ ID NO: 128; or (iii) a functional fragment or variant of any of sequences (i) or (ii). In exemplary embodiments, such eTFs contain SEQ ID NO: 92 and bind to a target site containing SEQ ID NO: 18. In exemplary embodiments, such eTFs are capable of increasing SCNIA expression by at least 2-fold, 5-fold, 10-fold, 15-fold , 20 times, 25 times, 30 times, 40 times, 50 times or more compared to the control, or at least 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80% , 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% or 500% or more compared to control. In exemplary embodiments, such eTFs have an overall sequence identity of at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% , 95%, 96%, 97%, 98%, or 99%, relative to one or more human proteins. In certain embodiments, such eTFs exhibit reduced immunogenicity compared to eTFs having a lower overall percentage of sequence identity to one or more human proteins. In various embodiments, the reduction in immunogenicity can be measured using an elispot assay, an immunoassay, or an in silico method.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая SEQ ID NO: 129; (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 129; или (iii) функциональный фрагмент или вариант любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие eTF содержат SEQ ID NO: 92 и связываются с целевым сайтом, содержащим SEQ ID NO: 18. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCNIA по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.In certain embodiments, an eTF disclosed herein that activates SCN1A comprises any of the following: (i) a sequence comprising SEQ ID NO: 129; (ii) a sequence having a sequence identity of at least 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96 %, 97%, 98% or 99%, relative to SEQ ID NO: 129; or (iii) a functional fragment or variant of any of sequences (i) or (ii). In exemplary embodiments, such eTFs contain SEQ ID NO: 92 and bind to a target site containing SEQ ID NO: 18. In exemplary embodiments, such eTFs are capable of increasing SCNIA expression by at least 2-fold, 5-fold, 10-fold, 15-fold , 20 times, 25 times, 30 times, 40 times, 50 times or more compared to the control, or at least 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80% , 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% or 500% or more compared to control. In exemplary embodiments, such eTFs have an overall sequence identity of at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% , 95%, 96%, 97%, 98%, or 99%, relative to one or more human proteins. In certain embodiments, such eTFs exhibit reduced immunogenicity compared to eTFs having a lower overall percentage of sequence identity to one or more human proteins. In various embodiments, the reduction in immunogenicity can be measured using an elispot assay, an immunoassay, or an in silico method.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая SEQ ID NO: 130; (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 130; или (iii) функциональный фрагмент или вариант любой изIn certain embodiments, an eTF disclosed herein that activates SCN1A comprises any of the following: (i) a sequence comprising SEQ ID NO: 130; (ii) a sequence having a sequence identity of at least 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96 %, 97%, 98% or 99%, relative to SEQ ID NO: 130; or (iii) a functional fragment or variant of any of

- 29 046157 последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие eTF содержат SEQ ID NO: 92 и связываются с целевым сайтом, содержащим SEQ ID NO: 18. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCNIA по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.- 29 046157 sequences (i) or (ii). In exemplary embodiments, such eTFs contain SEQ ID NO: 92 and bind to a target site containing SEQ ID NO: 18. In exemplary embodiments, such eTFs are capable of increasing SCNIA expression by at least 2-fold, 5-fold, 10-fold, 15-fold , 20 times, 25 times, 30 times, 40 times, 50 times or more compared to the control, or at least 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80% , 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% or 500% or more compared to control. In exemplary embodiments, such eTFs have an overall sequence identity of at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% , 95%, 96%, 97%, 98%, or 99%, relative to one or more human proteins. In certain embodiments, such eTFs exhibit reduced immunogenicity compared to eTFs having a lower overall percentage of sequence identity to one or more human proteins. In various embodiments, the reduction in immunogenicity can be measured using an elispot assay, an immunoassay, or an in silico method.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит любое из следующего: (i) последовательность, содержащая SEQ ID NO: 131; (ii) последовательность, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к SEQ ID NO: 131; или (iii) функциональный фрагмент или вариант любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие eTF содержат SEQ ID NO: 92 и связываются с целевым сайтом, содержащим SEQ ID NO: 18. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCNIA по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или более по сравнению с контролем, или по меньшей мере на 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% или 500% или более по сравнению с контролем. Согласно иллюстративным вариантам осуществления такие eTF характеризуются общей идентичностью последовательности, составляющей по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к одному или нескольким белкам человека. Согласно определенным вариантам осуществления такие eTF проявляют пониженную иммуногенность по сравнению с eTF, характеризующимся более низким общим процентом идентичности последовательностей по отношению к одному или нескольким белкам человека. Согласно различным вариантам осуществления снижение иммуногенности можно измерить с использованием анализа elispot, иммуноанализа или способа in silico.In certain embodiments, an eTF disclosed herein that activates SCN1A comprises any of the following: (i) a sequence comprising SEQ ID NO: 131; (ii) a sequence having a sequence identity of at least 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96 %, 97%, 98% or 99%, relative to SEQ ID NO: 131; or (iii) a functional fragment or variant of any of sequences (i) or (ii). In exemplary embodiments, such eTFs contain SEQ ID NO: 92 and bind to a target site containing SEQ ID NO: 18. In exemplary embodiments, such eTFs are capable of increasing SCNIA expression by at least 2-fold, 5-fold, 10-fold, 15-fold , 20 times, 25 times, 30 times, 40 times, 50 times or more compared to the control, or at least 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80% , 90%, 100%, 125%, 150%, 200%, 250%, 300%, 400% or 500% or more compared to control. In exemplary embodiments, such eTFs have an overall sequence identity of at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% , 95%, 96%, 97%, 98%, or 99%, relative to one or more human proteins. In certain embodiments, such eTFs exhibit reduced immunogenicity compared to eTFs having a lower overall percentage of sequence identity to one or more human proteins. In various embodiments, the reduction in immunogenicity can be measured using an elispot assay, an immunoassay, or an in silico method.

Согласно определенным вариантам осуществления раскрытый в настоящем документе eTF, который активирует SCN1A, содержит DBD, содержащий комплекс gRNA/Cas, причем gRNA содержит нацеливающую последовательность, содержащую любую из SEQ ID NO: 35-66. Целевая последовательность gRNA прикреплена к 5'-концу последовательности каркаса, содержащей последовательность: 5'GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCAAAATGCCGTGTTTATCTCGTCAACT TGTTGGCGAGA-3' (SEQ ID NO: 183). Согласно иллюстративным вариантам осуществления белок Cas представляет собой дезактивированный нуклеазой белок Cas9. Согласно определенным вариантам осуществления такой eTF дополнительно содержит один или несколько TAD, конъюгированных с белком Cas, причем TAD выбран из VP64, VPR, CITED2, CITED4 или CREB3. Согласно одному варианту осуществления такой eTF содержит домен VPR TAD, конъюгированный с C-концом белка Cas. Согласно определенным вариантам осуществления такой eTF содержит CITED2 TAD, конъюгированный с Nконцом, C-концом или N-концом и C-концом белка Cas. Согласно определенным вариантам осуществления такой eTF содержит TAD CITED4, конъюгированный с N-концом, C-концом или N-концом и Cконцом белка Cas. Согласно иллюстративным вариантам осуществления такие eTF способны повышать экспрессию SCN1A по меньшей мере в 2 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз или больше по сравнению с контролем.In certain embodiments, an eTF disclosed herein that activates SCN1A comprises a DBD containing a gRNA/Cas complex, wherein the gRNA comprises a targeting sequence comprising any of SEQ ID NOs: 35-66. The gRNA target sequence is attached to the 5' end of the scaffold sequence containing the sequence: 5'GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCAAAATGCCGTGTTTATCTCGTCAACT TGTTGGCGAGA-3' (SEQ ID NO: 183). In exemplary embodiments, the Cas protein is a nuclease-deactivated Cas9 protein. In certain embodiments, such eTF further comprises one or more TADs conjugated to a Cas protein, wherein the TAD is selected from VP64, VPR, CITED2, CITED4, or CREB3. In one embodiment, such an eTF comprises a VPR TAD domain conjugated to the C terminus of the Cas protein. In certain embodiments, such an eTF comprises a CITED2 TAD conjugated to the N terminus, C terminus, or N terminus and C terminus of the Cas protein. In certain embodiments, such an eTF comprises a CITED4 TAD conjugated to the N-terminus, C-terminus, or N-terminus and C-terminus of a Cas protein. In exemplary embodiments, such eTFs are capable of increasing SCN1A expression by at least 2-fold, 5-fold, 10-fold, 15-fold, 20-fold, 25-fold, 30-fold, 40-fold, 50-fold, or more compared to a control.

Полинуклеотиды.Polynucleotides.

Согласно другому аспекту в настоящей заявке представлены полинуклеотиды, кодирующие любой из eTF, которые активируют SNC1A, раскрытые в настоящем документе. Согласно другому аспекту в настоящей заявке представлены полинуклеотиды, содержащие селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в настоящей заявке представлены полинуклеотиды, содержащие селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, и селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в настоящей заявке представлены полинуклеотиды, содержащие последовательность, кодирующую eTF, которая активирует SCN1A, как раскрыто в настоящем документе, и селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в настоящей заявке представлен селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, кодирующим eTF, который активирует SCN1A, и селективный в отношении PV регуляторный элемент.In another aspect, provided herein are polynucleotides encoding any of the eTFs that activate SNC1A disclosed herein. In another aspect, the present application provides polynucleotides comprising a PV-selective miRNA binding site. In certain embodiments, the present application provides polynucleotides comprising a PV-selective regulatory element operably linked to a transgene and a PV-selective microRNA binding site. In certain embodiments, the present application provides polynucleotides comprising a sequence encoding an eTF that activates SCN1A as disclosed herein and a PV-selective miRNA binding site. In certain embodiments, the present application provides a PV-selective regulatory element operably linked to a transgene encoding an eTF that activates SCN1A and a PV-selective regulatory element.

Полинуклеотиды, кодирующие eTF, которые активируют SCN1A.Polynucleotides encoding eTFs that activate SCN1A.

Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид,In certain embodiments, the present application provides a polynucleotide

- 30 046157 содержащий любое из следующего: (i) последовательность нуклеиновой кислоты, кодирующая eTF, который активирует SCN1A, содержащий любую из SEQ ID NO: 77-131, 205, 207, 209, 213, 217, 219, 221 или 223, или их вариант или функциональный фрагмент; (ii) нуклеиновая кислота, кодирующая функциональный фрагмент eTF, который активирует SCN1A, содержащий любую из SEQ ID NO: 77-131, 205, 207, 209, 213, 217, 219, 221 или 223; или (iii) нуклеиновая кислота, кодирующая eTF, который активирует SCN1A, характеризующийся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к eTF, который активирует SCN1A, содержащий любую из SEQ ID NO: 77-131, 205, 207, 209, 213, 217, 219, 221 или 223, или их вариант или функциональный фрагмент.- 30 046157 containing any of the following: (i) a nucleic acid sequence encoding an eTF that activates SCN1A containing any of SEQ ID NO: 77-131, 205, 207, 209, 213, 217, 219, 221 or 223, or their variant or functional fragment; (ii) a nucleic acid encoding a functional eTF fragment that activates SCN1A containing any of SEQ ID NO: 77-131, 205, 207, 209, 213, 217, 219, 221 or 223; or (iii) a nucleic acid encoding an eTF that activates SCN1A having a sequence identity of at least 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91 %, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more, relative to an eTF that activates SCN1A containing any of SEQ ID NO: 77-131, 205, 207, 209, 213, 217, 219, 221 or 223, or a variant or functional fragment thereof.

Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, содержащий любое из следующего: (i) последовательность нуклеиновой кислоты, кодирующая DBD, содержащий любую из SEQ ID NO: 92-98, или ее вариант или функциональный фрагмент; (ii) нуклеиновая кислота, кодирующая функциональный фрагмент DBD, содержащий любую из SEQ ID NO: 92-98; или (iii) нуклеиновая кислота, кодирующая DBD, характеризующийся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к DBD, содержащему любую из SEQ ID NO: 92-98, или ее вариант или функциональный фрагмент, причем DBD способен связываться с целевым сайтом, связанным любой из SEQ ID NO: 92-98.In certain embodiments, the present application provides a polynucleotide comprising any of the following: (i) a nucleic acid sequence encoding a DBD containing any of SEQ ID NOs: 92-98, or a variant or functional fragment thereof; (ii) a nucleic acid encoding a functional DBD fragment containing any of SEQ ID NOs: 92-98; or (iii) a nucleic acid encoding a DBD having a sequence identity of at least 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92% , 93%, 94%, 95%, 96%, 97%, 98%, 99% or more, with respect to a DBD containing any of SEQ ID NOs: 92-98, or a variant or functional fragment thereof, wherein the DBD is capable of contact the target site associated with any of SEQ ID NO: 92-98.

Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, который активирует эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, кодирующая eTF, содержащий любую из SEQ ID NO: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 или 223; (ii) нуклеиновая кислота, кодирующая функциональный фрагмент eTF, содержащий любую из SEQ ID NO: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 или 223; или (iii) нуклеиновая кислота, кодирующая eTF, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к eTF, содержащему любую из SEQ ID NO: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 или 223, причем eTF способен активировать SCN1A.In certain embodiments, the present application provides a polynucleotide encoding an eTF that activates endogenous SCN1A, wherein the polynucleotide comprises any of the following: (i) a nucleic acid sequence encoding an eTF comprising any of SEQ ID NOs: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 or 223; (ii) a nucleic acid encoding a functional eTF fragment containing any of SEQ ID NOs: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 or 223; or (iii) a nucleic acid encoding an eTF having a sequence identity of at least 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92% , 93%, 94%, 95%, 96%, 97%, 98%, 99% or more, with respect to eTF containing any of SEQ ID NO: 103-124, 128-131, 205, 207, 209, 213, 217, 219, 221 or 223, with eTF being able to activate SCN1A.

Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий DBD, который связывается с целевым сайтом генома, способным повышать регуляцию эндогенного SCN1A при связывании с помощью раскрытого в настоящем документе eTF, причем полинуклеотид содержит любой из следующих элементов: (i) последовательность нуклеиновой кислоты, кодирующая DBD, содержащий любую из SEQ ID NO: 77-98; (ii) нуклеиновая кислота, кодирующая функциональный фрагмент DBD, содержащий любую из SEQ ID NO: 77-98; или (iii) нуклеиновая кислота, кодирующая eTF, характеризующийся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к DBD, содержащему любую из SEQ ID NO: 77-98, причем DBD способен связываться с целевым сайтом, связанным любой из SEQ ID NO: 77-98.In certain embodiments, provided herein is a polynucleotide encoding a DBD that binds to a genomic target site capable of upregulating endogenous SCN1A when bound by an eTF disclosed herein, wherein the polynucleotide comprises any of the following: (i) a nucleic acid sequence, encoding a DBD containing any of SEQ ID NO: 77-98; (ii) a nucleic acid encoding a functional DBD fragment containing any of SEQ ID NOs: 77-98; or (iii) a nucleic acid encoding an eTF having a sequence identity of at least 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92% , 93%, 94%, 95%, 96%, 97%, 98%, 99% or more, with respect to a DBD containing any of SEQ ID NOs: 77-98, wherein the DBD is capable of binding to a target site bound by any from SEQ ID NO: 77-98.

Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий DBD, который связывается с целевым сайтом генома, способным активировать эндогенный SCN1A при связывании раскрытым в настоящем документе eTF, причем полинуклеотид содержит любой из следующих элементов: (i) последовательность нуклеиновой кислоты, кодирующая DBD, содержащий любую из SEQ ID NO: 148-151; (ii) нуклеиновая кислота, кодирующая функциональный фрагмент DBD, содержащий любую из SEQ ID NO: 148-151; или (iii) нуклеиновая кислота, кодирующая eTF, характеризующийся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к DBD, содержащему любую из SEQ ID NO: 148-151, причем DBD способен связываться с целевым сайтом, связанным любой из SEQ ID NO: 92-98.In certain embodiments, provided herein is a polynucleotide encoding a DBD that binds to a genomic target site capable of activating endogenous SCN1A upon binding by an eTF disclosed herein, wherein the polynucleotide comprises any of the following: (i) a nucleic acid sequence encoding the DBD, containing any of SEQ ID NO: 148-151; (ii) a nucleic acid encoding a functional DBD fragment containing any of SEQ ID NOs: 148-151; or (iii) a nucleic acid encoding an eTF having a sequence identity of at least 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92% , 93%, 94%, 95%, 96%, 97%, 98%, 99% or more, with respect to a DBD containing any of SEQ ID NOs: 148-151, wherein the DBD is capable of binding to a target site bound by any from SEQ ID NO: 92-98.

Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая любую из SEQ ID NO: 70-76 или 184; (ii) нуклеиновая кислота, содержащая функциональный фрагмент любой из последовательностей (i); или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii), причем полинуклеотид кодирует eTF, который способен активировать SCN1A.In certain embodiments, the present application provides a polynucleotide encoding an eTF capable of regulating endogenous SCN1A, the polynucleotide comprising any of the following: (i) a nucleic acid sequence comprising any of SEQ ID NOs: 70-76 or 184; (ii) a nucleic acid containing a functional fragment of any of the sequences (i); or (iii) a nucleic acid having a sequence identity of at least 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93% , 94%, 95%, 96%, 97%, 98%, 99% or more, with respect to any of sequences (i) or (ii), wherein the polynucleotide encodes an eTF that is capable of activating SCN1A.

Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 70; (ii) нуклеиновая кислота, содержащая функциональный фрагмент SEQ ID NO: 70; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношеIn certain embodiments, the present application provides a polynucleotide encoding an eTF capable of regulating endogenous SCN1A, the polynucleotide comprising any of the following: (i) a nucleic acid sequence comprising SEQ ID NO: 70; (ii) a nucleic acid containing a functional fragment of SEQ ID NO: 70; or (iii) a nucleic acid having a sequence identity of at least 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93% , 94%, 95%, 96%, 97%, 98%, 99% or more, relative to

- 31 046157 нию к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 127, или его функциональный фрагмент или вариант, который способен активировать SCN1A.- 31 046157 connection to any of the sequences (i) or (ii). In exemplary embodiments, such polynucleotides encode an eTF comprising SEQ ID NO: 127, or a functional fragment or variant thereof, that is capable of activating SCN1A.

Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 71; (ii) нуклеиновая кислота, содержащая функциональный фрагмент SEQ ID NO: 71; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 127, или его функциональный фрагмент или вариант, который способен активировать SCN1A.In certain embodiments, the present application provides a polynucleotide encoding an eTF capable of regulating endogenous SCN1A, the polynucleotide comprising any of the following: (i) a nucleic acid sequence comprising SEQ ID NO: 71; (ii) a nucleic acid containing a functional fragment of SEQ ID NO: 71; or (iii) a nucleic acid having a sequence identity of at least 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93% , 94%, 95%, 96%, 97%, 98%, 99% or more, with respect to any of the sequences (i) or (ii). In exemplary embodiments, such polynucleotides encode an eTF comprising SEQ ID NO: 127, or a functional fragment or variant thereof, that is capable of activating SCN1A.

Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 72; (ii) нуклеиновая кислота, содержащая функциональный фрагмент SEQ ID NO: 72; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 130, или его функциональный фрагмент или вариант, который способен активировать SCN1A.In certain embodiments, the present application provides a polynucleotide encoding an eTF capable of regulating endogenous SCN1A, the polynucleotide comprising any of the following: (i) a nucleic acid sequence comprising SEQ ID NO: 72; (ii) a nucleic acid containing a functional fragment of SEQ ID NO: 72; or (iii) a nucleic acid having a sequence identity of at least 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93% , 94%, 95%, 96%, 97%, 98%, 99% or more, with respect to any of the sequences (i) or (ii). In exemplary embodiments, such polynucleotides encode an eTF comprising SEQ ID NO: 130, or a functional fragment or variant thereof, that is capable of activating SCN1A.

Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 73; (ii) последовательность нуклеиновой кислоты, содержащая функциональный фрагмент SEQ ID NO: 73; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 131, или его функциональный фрагмент или вариант, который способен активировать SCN1A.In certain embodiments, the present application provides a polynucleotide encoding an eTF capable of regulating endogenous SCN1A, the polynucleotide comprising any of the following: (i) a nucleic acid sequence comprising SEQ ID NO: 73; (ii) a nucleic acid sequence containing the functional fragment of SEQ ID NO: 73; or (iii) a nucleic acid having a sequence identity of at least 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93% , 94%, 95%, 96%, 97%, 98%, 99% or more, with respect to any of the sequences (i) or (ii). In exemplary embodiments, such polynucleotides encode an eTF comprising SEQ ID NO: 131, or a functional fragment or variant thereof, that is capable of activating SCN1A.

Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 74; (ii) последовательность нуклеиновой кислоты, содержащая функциональный фрагмент SEQ ID NO: 74; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 127, или его функциональный фрагмент или вариант, который способен активировать SCN1A.In certain embodiments, the present application provides a polynucleotide encoding an eTF capable of regulating endogenous SCN1A, the polynucleotide comprising any of the following: (i) a nucleic acid sequence comprising SEQ ID NO: 74; (ii) a nucleic acid sequence containing the functional fragment of SEQ ID NO: 74; or (iii) a nucleic acid having a sequence identity of at least 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93% , 94%, 95%, 96%, 97%, 98%, 99% or more, with respect to any of the sequences (i) or (ii). In exemplary embodiments, such polynucleotides encode an eTF comprising SEQ ID NO: 127, or a functional fragment or variant thereof, that is capable of activating SCN1A.

Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 75; (ii) последовательность нуклеиновой кислоты, содержащая функциональный фрагмент SEQ ID NO: 75; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 127, или его функциональный фрагмент или вариант, который способен активировать SCN1A.In certain embodiments, the present application provides a polynucleotide encoding an eTF capable of regulating endogenous SCN1A, the polynucleotide comprising any of the following: (i) a nucleic acid sequence comprising SEQ ID NO: 75; (ii) a nucleic acid sequence containing the functional fragment of SEQ ID NO: 75; or (iii) a nucleic acid having a sequence identity of at least 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93% , 94%, 95%, 96%, 97%, 98%, 99% or more, with respect to any of the sequences (i) or (ii). In exemplary embodiments, such polynucleotides encode an eTF comprising SEQ ID NO: 127, or a functional fragment or variant thereof, that is capable of activating SCN1A.

Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 76; (ii) последовательность нуклеиновой кислоты, содержащая функциональный фрагмент SEQ ID NO: 76; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 106, или его функциональный фрагмент или вариант, который способен активировать SCN1A.In certain embodiments, the present application provides a polynucleotide encoding an eTF capable of regulating endogenous SCN1A, the polynucleotide comprising any of the following: (i) a nucleic acid sequence comprising SEQ ID NO: 76; (ii) a nucleic acid sequence containing the functional fragment of SEQ ID NO: 76; or (iii) a nucleic acid having a sequence identity of at least 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93% , 94%, 95%, 96%, 97%, 98%, 99% or more, with respect to any of the sequences (i) or (ii). In exemplary embodiments, such polynucleotides encode an eTF comprising SEQ ID NO: 106, or a functional fragment or variant thereof, that is capable of activating SCN1A.

Согласно определенным вариантам осуществления в настоящей заявке представлен полинуклеотид, кодирующий eTF, способный регулировать эндогенный SCN1A, причем полинуклеотид содержит любое из следующего: (i) последовательность нуклеиновой кислоты, содержащая SEQ ID NO: 184; (ii) последовательность нуклеиновой кислоты, содержащая функциональный фрагмент SEQ ID NO: 184; или (iii) нуклеиновая кислота, характеризующаяся идентичностью последовательности, составляющей по меньIn certain embodiments, the present application provides a polynucleotide encoding an eTF capable of regulating endogenous SCN1A, the polynucleotide comprising any of the following: (i) a nucleic acid sequence comprising SEQ ID NO: 184; (ii) a nucleic acid sequence containing the functional fragment of SEQ ID NO: 184; or (iii) a nucleic acid having sequence identity equal to or less than

- 32 046157 шей мере 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более, по отношению к любой из последовательностей (i) или (ii). Согласно иллюстративным вариантам осуществления такие полинуклеотиды кодируют eTF, содержащий SEQ ID NO: 106, или его функциональный фрагмент или вариант, который способен активировать SCN1A.- 32 046157 at least 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more, with respect to any of the sequences (i) or (ii). In exemplary embodiments, such polynucleotides encode an eTF comprising SEQ ID NO: 106, or a functional fragment or variant thereof, that is capable of activating SCN1A.

Полинуклеотиды, содержащие сайты связывания микроРНК для селективной экспрессии в PVсодержащих нейронах.Polynucleotides containing microRNA binding sites for selective expression in PV-containing neurons.

Согласно другому аспекту в настоящей заявке представлены полинуклеотиды, содержащие сайты связывания микроРНК, которые приводят к селективной экспрессии представляющего интерес гена в парвальбумин-содержащих нейронах (PV). МикроРНК или миРНК представляют собой небольшие некодирующие РНК (~20 нуклеотидов), которые регулируют экспрессию генов посттранскрипционно путем гибридизации с комплементарными сайтами узнавания в молекуле мРНК и приводят к ингибированию экспрессии генов, способствуя деградации транскрипта мРНК или подавляя трансляцию белка, кодируемого мРНК. Предусмотренные в настоящем документе сайты связывания микроРНК ингибируют экспрессию представляющего интерес гена в возбуждающих нейронах, тем самым способствуя селективной экспрессии представляющего интерес гена в PV-содержащих нейронах (например, селективные к PV сайты связывания микроРНК). Согласно определенным вариантам осуществления возбуждающие нейроны представляют собой нейроны, которые экспрессируют один или несколько из STAC, Slc17a7, Car12, Syt17, ITPKA, Col6a1, CamKII, Sv2b, INHBA и/или DKK3. Согласно иллюстративному варианту осуществления возбуждающие нейроны представляют собой нейроны, экспрессирующие CamKII.In another aspect, the present application provides polynucleotides containing microRNA binding sites that lead to selective expression of a gene of interest in parvalbumin-containing neurons (PV). MicroRNAs or miRNAs are small non-coding RNAs (~20 nucleotides) that regulate gene expression post-transcriptionally by hybridizing to complementary recognition sites in the mRNA molecule and lead to inhibition of gene expression by promoting the degradation of the mRNA transcript or inhibiting the translation of the protein encoded by the mRNA. MicroRNA binding sites provided herein inhibit expression of a gene of interest in excitatory neurons, thereby promoting selective expression of the gene of interest in PV-containing neurons (eg, PV-selective miRNA binding sites). In certain embodiments, excitatory neurons are neurons that express one or more of STAC, Slc17a7, Car12, Syt17, ITPKA, Col6a1, CamKII, Sv2b, INHBA, and/or DKK3. In an exemplary embodiment, the excitatory neurons are CamKII-expressing neurons.

Согласно определенным вариантам осуществления в настоящей заявке представлены полинуклеотиды, содержащие один или несколько сайтов связывания микроРНК для одной или нескольких микроРНК, которые способствуют селективной экспрессии PV, например, способствуют деградации мРНК, содержащей сайт связывания микроРНК, в возбуждающих нейронах. Примеры микроРНК, которые способствуют селективной экспрессии PV, включают в себя, например, miR-128, miR-221 и miR-222. Согласно определенным вариантам осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более селективных в отношении PV сайтов связывания микроРНК. Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более сайтов связывания miR-128 (SEQ ID NO: 9). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более сайтов связывания miR-221 (SEQ ID NO: 11). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более сайтов связывания miR-222 (SEQ ID NO: 13). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 1 сайт связывания miR-128, по меньшей мере один сайт связывания miR-221 и по меньшей мере один сайт связывания miR-222. Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере один сайт связывания miR-128 и по меньшей мере один сайт связывания miR-222. Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере один сайт связывания miR-221 и по меньшей мере один сайт связывания miR-222. Согласно иллюстративному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере один сайт связывания miR-128 (SEQ ID NO: 9) и по меньшей мере один сайт связывания miR-221 (SEQ ID NO: 11). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 2 сайта связывания miR-128 (SEQ ID NO: 9) и по меньшей мере 2 сайта связывания miR-221 (SEQ ID NO: 11). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 3 сайта связывания miR-128 (SEQ ID NO: 9) и по меньшей мере 3 сайта связывания miR-221 (SEQ ID NO: 11). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 4 сайта связывания miR-128 (SEQ ID NO: 9) и по меньшей мере 4 сайта связывания miR-221 (SEQ ID NO: 11). Согласно одному варианту осуществления в настоящей заявке представлены полинуклеотиды, содержащие по меньшей мере 5 сайтов связывания miR-128 (SEQ ID NO: 9) и по меньшей мере 5 сайтов связывания miR-221 (SEQ ID NO: 11). Согласно таким вариантам осуществления сайты связывания могут быть расположены в любом порядке. Например, для конструкции, содержащей 2 сайта связывания miR-128 и 2 сайта связывания miR-221, сайты связывания могут быть расположены в любой из следующих конфигураций: miR-128 - miR-128 - miR-221 - miR221, miR-128 - miR-221 - miR-128 - miR-221, miR-128 - miR221 - miR221 - miR-128, miR-221 - miR128 - miR221 - miR128, miR-221 - miR128 - miR128 - miR221 или miR221 - miR221 - miR128 - miR128. Согласно иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат последовательность, содержащую 4 сайта связывания miR-128 (SEQ ID NO: 9), за которыми следуют четыре сайта связывания miR-221 (SEQ ID NO: 11), например, miR-128 - miR-128 - miR128 - miR-128 - miR221 - miR221 - miR-221 - miR221. Согласно другому иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат последовательность, содержащую 1 последовательность miR-221 (SEQ ID NO: 11), 1 последовательность miR-222 (SEQ ID NO: 13) и 1 сайт связывания miR-128 (SEQ ID NO: 9), например, miRIn certain embodiments, the present application provides polynucleotides comprising one or more miRNA binding sites for one or more miRNAs that promote selective PV expression, for example, promoting the degradation of miRNA binding site-containing mRNA in excitatory neurons. Examples of miRNAs that promote selective PV expression include, for example, miR-128, miR-221 and miR-222. In certain embodiments, the present application provides polynucleotides containing at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more PV-selective miRNA binding sites. In one embodiment, the present application provides polynucleotides containing at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more miR-128 binding sites (SEQ ID NO: 9). In one embodiment, the present application provides polynucleotides containing at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more miR-221 binding sites (SEQ ID NO: 11). In one embodiment, the present application provides polynucleotides containing at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more miR-222 binding sites (SEQ ID NO: 13). In one embodiment, the present application provides polynucleotides comprising at least 1 miR-128 binding site, at least one miR-221 binding site, and at least one miR-222 binding site. In one embodiment, the present application provides polynucleotides comprising at least one miR-128 binding site and at least one miR-222 binding site. In one embodiment, the present application provides polynucleotides comprising at least one miR-221 binding site and at least one miR-222 binding site. In an exemplary embodiment, the present application provides polynucleotides comprising at least one miR-128 binding site (SEQ ID NO: 9) and at least one miR-221 binding site (SEQ ID NO: 11). In one embodiment, the present application provides polynucleotides containing at least 2 miR-128 binding sites (SEQ ID NO: 9) and at least 2 miR-221 binding sites (SEQ ID NO: 11). In one embodiment, the present application provides polynucleotides containing at least 3 miR-128 binding sites (SEQ ID NO: 9) and at least 3 miR-221 binding sites (SEQ ID NO: 11). In one embodiment, the present application provides polynucleotides containing at least 4 miR-128 binding sites (SEQ ID NO: 9) and at least 4 miR-221 binding sites (SEQ ID NO: 11). In one embodiment, the present application provides polynucleotides containing at least 5 miR-128 binding sites (SEQ ID NO: 9) and at least 5 miR-221 binding sites (SEQ ID NO: 11). In such embodiments, the binding sites may be arranged in any order. For example, for a construct containing 2 miR-128 binding sites and 2 miR-221 binding sites, the binding sites can be located in any of the following configurations: miR-128 - miR-128 - miR-221 - miR221, miR-128 - miR -221 - miR-128 - miR-221, miR-128 - miR221 - miR221 - miR-128, miR-221 - miR128 - miR221 - miR128, miR-221 - miR128 - miR128 - miR221 or miR221 - miR221 - miR128 - miR128 . In an exemplary embodiment, the polynucleotides provided herein comprise a sequence comprising 4 miR-128 binding sites (SEQ ID NO: 9) followed by four miR-221 binding sites (SEQ ID NO: 11), for example, miR-128 - miR-128 - miR128 - miR-128 - miR221 - miR221 - miR-221 - miR221. In another exemplary embodiment, the polynucleotides provided herein comprise a sequence comprising 1 miR-221 sequence (SEQ ID NO: 11), 1 miR-222 sequence (SEQ ID NO: 13), and 1 miR-128 binding site (SEQ ID NO : 9), for example miR

- 33 046157- 33 046157

221 - miR222 - miR128. Согласно другому иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат последовательность, содержащую 2 последовательности miR-221 (SEQ ID NO: 11), 2 последовательности miR-222 (SEQ ID NO: 13) и 2 сайта связывания miR128 (SEQ ID NO: 9) расположены в следующем порядке: miR-221 - miR222 - miR128 - miR-221 - miR222 miR128.221 - miR222 - miR128. In another exemplary embodiment, the polynucleotides provided herein comprise a sequence comprising 2 miR-221 sequences (SEQ ID NO: 11), 2 miR-222 sequences (SEQ ID NO: 13), and 2 miR128 binding sites (SEQ ID NO: 9 ) are arranged in the following order: miR-221 - miR222 - miR128 - miR-221 - miR222 miR128.

В полинуклеотидах, содержащих более одного сайта связывания микроРНК, сайты связывания могут быть непосредственно примыкающими друг к другу в полинуклеотидной последовательности (например, без линкера или промежуточной последовательности между сайтами связывания) или могут быть отделены друг от друга по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или более нуклеотидами или 1-20, 1-15, 1-10, 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3 или 1-2 нуклеотидами. Согласно иллюстративным вариантам осуществления сайты связывания микроРНК разделены приблизительно 5 нуклеотидами или 5 нуклеотидами. Согласно иллюстративным вариантам осуществления последовательности, разделяющие сайты связывания микроРНК (а также соединения, образованные между сайтами связывания микроРНК, или соединения, образованные между сайтами связывания микроРНК и последовательностями, разделяющими сайты связывания микроРНК), не комплементарны никаким другим микроРНК или любым другим нейрональным микроРНК.In polynucleotides containing more than one miRNA binding site, the binding sites may be immediately adjacent to each other in the polynucleotide sequence (e.g., without a linker or intervening sequence between the binding sites) or may be separated from each other by at least 1, 2, 3. 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 or more nucleotides or 1-20, 1-15, 1-10, 1 -9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3 or 1-2 nucleotides. In exemplary embodiments, miRNA binding sites are separated by approximately 5 nucleotides or 5 nucleotides. In exemplary embodiments, the sequences separating miRNA binding sites (as well as junctions formed between miRNA binding sites, or junctions formed between miRNA binding sites and sequences separating miRNA binding sites) are not complementary to any other miRNA or any other neuronal miRNA.

Согласно определенным вариантам осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, характеризующийся идентичностью, составляющей по меньшей мере 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100%, по отношению к SEQ ID NO: 7. Согласно иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, содержащий SEQ ID NO: 7.In certain embodiments, polynucleotides provided herein comprise a microRNA binding site having an identity of at least 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95% , 96%, 97%, 98%, 99%, or 100%, relative to SEQ ID NO: 7. In an exemplary embodiment, the polynucleotides provided herein comprise a microRNA binding site comprising SEQ ID NO: 7.

Согласно определенным вариантам осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, характеризующийся идентичностью, составляющей по меньшей мере 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100%, по отношению к SEQ ID NO: 14. Согласно иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, содержащий SEQ ID NO: 14.In certain embodiments, polynucleotides provided herein comprise a miRNA binding site having an identity of at least 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95% , 96%, 97%, 98%, 99%, or 100%, relative to SEQ ID NO: 14. In an exemplary embodiment, the polynucleotides provided herein comprise a microRNA binding site comprising SEQ ID NO: 14.

Согласно определенным вариантам осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, характеризующийся идентичностью, составляющей по меньшей мере 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100%, по отношению к SEQ ID NO: 15. Согласно иллюстративному варианту осуществления представленные в настоящем документе полинуклеотиды содержат сайт связывания микроРНК, содержащий SEQ ID NO: 15.In certain embodiments, polynucleotides provided herein comprise a miRNA binding site having an identity of at least 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95% , 96%, 97%, 98%, 99%, or 100%, relative to SEQ ID NO: 15. In an exemplary embodiment, the polynucleotides provided herein comprise a microRNA binding site comprising SEQ ID NO: 15.

Согласно определенным вариантам осуществления указанные в настоящем документе сайты связывания микроРНК расположены в 3'-нетранслируемой области транскрипта мРНК, например, после кодона терминации трансляции (т.е. TAA, TGA или TAG) и перед полиА-хвостом. Сайт связывания микроРНК может быть расположен непосредственно рядом с кодоном терминации трансляции или может быть отделен от кодона терминации трансляции по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или более нуклеотидами или 1-20, 1-15, 1-10, 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3 или 1-2 нуклеотидами, и/или может быть расположен рядом с полиА-хвостом или может быть отделен от полиАхвоста по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или более нуклеотидами или 1-20, 1-15, 1-10, 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3 или 1-2 нуклеотидами.In certain embodiments, microRNA binding sites as defined herein are located in the 3' untranslated region of the mRNA transcript, for example, after a translation termination codon (i.e., TAA, TGA, or TAG) and before the polyA tail. The miRNA binding site may be located directly adjacent to the translation termination codon or may be separated from the translation termination codon by at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 , 15, 16, 17, 18, 19, 20 or more nucleotides or 1-20, 1-15, 1-10, 1-9, 1-8, 1-7, 1-6, 1-5, 1- 4, 1-3 or 1-2 nucleotides, and/or may be located adjacent to the polyA tail or may be separated from the polyA tail by at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 , 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 or more nucleotides or 1-20, 1-15, 1-10, 1-9, 1-8, 1-7, 1- 6, 1-5, 1-4, 1-3 or 1-2 nucleotides.

Согласно определенным вариантам осуществления представленный в настоящем документе сайт связывания микроРНК приводит к селективной экспрессии гена в PV-содержащей клетке по сравнению с нецелевыми типами клеток. В некоторых случаях нецелевые типы клеток включают в себя, без ограничения, возбуждающие нейроны, не содержащие PV типы клеток ЦНС и ненейрональные типы клеток ЦНС. Согласно определенным вариантам осуществления селективные в отношении PV сайты связывания микроРНК приводят к селективной экспрессии генов в PV-содержащих нейронах по меньшей мере для одного, двух, трех, четырех, пяти или более не-PV типов клеток ЦНС. В некоторых случаях не-PV клетка ЦНС представляет собой возбуждающий нейрон, дофаминергический нейрон, астроцит, микроглию, мотонейрон, сосудистую клетку или не-ГАМКергический нейрон (например, клетку, которая не экспрессирует один или более GAD2, GAD1, NKX2.1, DLX1, DLX5, SST и VIP), не-PV нейрон (например, ГАМКергический нейрон, который не экспрессирует парвальбумин) или другие клетки ЦНС (например, типы клеток ЦНС, которые никогда не экспрессируют любой из PV, GAD2, GAD1, NKX2.1, DLX1, DLX5, SST и VIP). Согласно иллюстративному варианту осуществления представленный в настоящем документе селективный в отношении PV сайт связывания микроРНК приводит к повышенной селективности экспрессии генов в PV-содержащих нейронах по сравнению с возбуждающими нейронами (например, нейронами, которые экспрессируют один или несколько из STAC, Slc17a7, Car12, Syt17, ITPKA, Col6a1, CamKII, Sv2b, INHBA и/или DKK3) за счет уменьшения экспрессии в возбуждающих нейронах. В некоторых случаях типы клеток различают по разным клеточным маркерам, морфологии, фенотипу, генотипу, функции и/или любым другим средствам классификации типов клеток.In certain embodiments, a microRNA binding site provided herein results in selective gene expression in a PV-containing cell compared to non-target cell types. In some cases, non-target cell types include, but are not limited to, excitatory neurons, non-PV CNS cell types, and non-neuronal CNS cell types. In certain embodiments, PV-selective miRNA binding sites result in selective gene expression in PV-containing neurons for at least one, two, three, four, five, or more non-PV CNS cell types. In some cases, the non-PV CNS cell is an excitatory neuron, dopaminergic neuron, astrocyte, microglia, motor neuron, vascular cell, or non-GABAergic neuron (e.g., a cell that does not express one or more of GAD2, GAD1, NKX2.1, DLX1, DLX5, SST, and VIP), non-PV neuron (eg, a GABAergic neuron that does not express parvalbumin), or other CNS cells (eg, CNS cell types that never express any of PV, GAD2, GAD1, NKX2.1, DLX1 , DLX5, SST and VIP). In an exemplary embodiment, the PV-selective miRNA binding site provided herein results in increased selectivity of gene expression in PV-containing neurons compared to excitatory neurons (e.g., neurons that express one or more of STAC, Slc17a7, Car12, Syt17, ITPKA, Col6a1, CamKII, Sv2b, INHBA and/or DKK3) by decreasing expression in excitatory neurons. In some cases, cell types are distinguished by different cellular markers, morphology, phenotype, genotype, function, and/or any other means of classifying cell types.

Селективность экспрессии, управляемая селективным в отношении PV сайтом связывания микроРНК, может быть измерена несколькими способами. Согласно одному варианту осуществления селективность экспрессии гена в PV-клетке по сравнению с не содержащими PV клетками может быть измеExpression selectivity driven by the PV-selective miRNA binding site can be measured in several ways. In one embodiment, the selectivity of gene expression in a PV cell compared to non-PV cells can be varied

- 34 046157 рена путем сравнения количества PV-клеток, которые экспрессируют обнаруживаемый уровень транскрипта из гена, который содержит селективный в отношении PV сайт связывания микроРНК, с общим количеством клеток, которые экспрессируют ген (например, отношение PV-содержащих к общему количеству клеток (PV + не-PV клеток), экспрессирующих ген). Например, селективность в отношении PVсодержащих нейронов может быть определена с использованием анализа колокализации на основе иммуногистохимии с использованием кассеты экспрессии, содержащей ген, кодирующий флуоресцентный белок (например, eGFP), и селективный в отношении PV сайт связывания микроРНК для измерения экспрессии гена и антитела, которое идентифицирует PV-содержащие клетки (например, антитело к PV, которое специфически взаимодействует с PV-содержащими нейронами), связанное со второй флуоресцентной меткой (например, красным флуоресцентным белком). Селективность экспрессии в PVсодержащих клетках можно рассчитать путем деления количества клеток, которые экспрессируют как PV, так и eGFP (например, PV-содержащие клетки), на общее количество клеток, экспрессирующих eGFP (например, PV-содержащие клетки и не содержащие PV клетки), и умножения на 100, чтобы преобразовать в проценты. В другом примере селективность в отношении PV-содержащих нейронов может быть определена с использованием анализа колокализации на основе иммуногистохимии с использованием кассеты экспрессии, содержащей ген, кодирующий флуоресцентный белок (например, eGFP), и селективный в отношении PV сайт связывания микроРНК для измерения экспрессии гена, и первое антитело, которое идентифицирует PV-содержащие клетки (например, антитело к PV, которое специфически взаимодействует с PV-содержащими нейронами), связанное со второй флуоресцентной меткой (например, красным флуоресцентным белком) и вторым антителом, которое идентифицирует возбуждающие клетки (например, антитело к CamKII, которое специфически взаимодействует с возбуждающими нейронами). Селективность экспрессии в PV-содержащих клетках можно рассчитать путем деления количества клеток, экспрессирующих как PV, так и eGFP (например, PV-клетки), на количество клеток, экспрессирующих eGFP + PV и eGFP + CamKII (например, PV-содержащие клетки и возбуждающие клетки), и умножения на 100 для преобразования в процент. Чем выше процент PV-содержащих клеток, экспрессирующих трансген, тем более селективным является сайт связывания микроРНК в отношении PVсодержащих клеток. Согласно определенным вариантам осуществления представленный в настоящем документе селективный в отношении PV сайт связывания микроРНК может быть высокоселективным для экспрессии в PV-содержащих клетках. Например, представленный в настоящем документе селективный в отношении PV сайт связывания микроРНК может характеризоваться селективностью, составляющей приблизительно 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более чем приблизительно 99%, для PV-содержащих нейронов (например, PVсодержащие нейроны/все клетки х 100 или PV-содержащие нейроны/PV + возбуждающие нейроны х 100).- 34 046157 rena by comparing the number of PV cells that express a detectable level of transcript from a gene that contains a PV-selective miRNA binding site with the total number of cells that express the gene (for example, the ratio of PV-containing to total cells (PV + non-PV cells) expressing the gene). For example, selectivity for PV-containing neurons can be determined using an immunohistochemistry-based colocalization assay using an expression cassette containing a gene encoding a fluorescent protein (e.g., eGFP) and a PV-selective microRNA binding site to measure expression of the gene and antibody that identifies PV-containing cells (eg, an anti-PV antibody that specifically interacts with PV-containing neurons) coupled to a second fluorescent tag (eg, red fluorescent protein). Expression selectivity in PV-containing cells can be calculated by dividing the number of cells that express both PV and eGFP (eg, PV-containing cells) by the total number of cells expressing eGFP (eg, PV-containing cells and non-PV-containing cells). and multiplying by 100 to convert to a percentage. In another example, selectivity for PV-containing neurons can be determined using an immunohistochemistry-based colocalization assay using an expression cassette containing a gene encoding a fluorescent protein (e.g., eGFP) and a PV-selective microRNA binding site to measure gene expression. and a first antibody that identifies PV-containing cells (e.g., an anti-PV antibody that specifically interacts with PV-containing neurons) coupled to a second fluorescent tag (e.g., red fluorescent protein) and a second antibody that identifies excitatory cells (e.g., antibody to CamKII, which specifically interacts with excitatory neurons). Expression selectivity in PV-containing cells can be calculated by dividing the number of cells expressing both PV and eGFP (e.g., PV cells) by the number of cells expressing eGFP + PV and eGFP + CamKII (e.g., PV-containing cells and excitatory cells), and multiplying by 100 to convert to a percentage. The higher the percentage of PV-containing cells expressing the transgene, the more selective the microRNA binding site is for PV-containing cells. In certain embodiments, a PV-selective miRNA binding site provided herein can be highly selective for expression in PV-containing cells. For example, a PV-selective miRNA binding site provided herein may have a selectivity of approximately 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92 %, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or greater than about 99%, for PV-containing neurons (e.g., PV-containing neurons/all cells x 100 or PV-containing neurons/ PV + excitatory neurons x 100).

В некоторых случаях представленный в настоящем документе селективный в отношении PV сайт связывания микроРНК является коротким. В некоторых случаях размер селективного в отношении PV сайта связывания микроРНК совместим с клонирующей способностью вектора, например, вирусного вектора или rAAV, так что комбинированный размер трансгена, промотора (и необязательного энхансера) и сайта связывания микроРНК не превышает клонирующую способность вектора. В некоторых случаях селективный в отношении PV сайт связывания микроРНК составляет в длину до приблизительно 500 п.н., 400 п.н., 300 п.н., 250 п.н., 225 п.н., 215 п.н., 210 п.н., 200 п.н., 150 п.н., 140 п.н., 135 п.н., 130 п.н., 125 п.н., 120 п.н., 115 п.н., 110 п.н., 100 п.н., 90 п.н., 80 п.н., 75 п.н., 70 п.н., 65 п.н., 60 п.н. или 50 п.н.. В некоторых случаях селективный в отношении PV сайт связывания микроРНК составляет приблизительно 50-500 п.н., 50-400 п.н., 50-300 п.н., 50-250 п.н., 50-200 п.н., 50-100 п.н., 50-75 п.н., 50-70 п.н., 100-500 п.н., 100-400 п.н., 100-300 п.н., 100-250 п.н., 100-200 п.н., 100-150 п.н., 100-140 п.н., 100-135 п.н., 200-500 п.н., 200-400 п.н., 200-300 п.н. или 200-250 п.н..In some cases, the PV-selective miRNA binding site presented herein is short. In some cases, the size of the PV-selective miRNA binding site is compatible with the cloning ability of a vector, such as a viral vector or rAAV, such that the combined size of the transgene, promoter (and optional enhancer), and miRNA binding site does not exceed the cloning ability of the vector. In some cases, the PV-selective miRNA binding site is up to approximately 500 bp, 400 bp, 300 bp, 250 bp, 225 bp, 215 bp in length. , 210 bp, 200 bp, 150 bp, 140 bp, 135 bp, 130 bp, 125 bp, 120 bp, 115 bp, 110 bp, 100 bp, 90 bp, 80 bp, 75 bp, 70 bp, 65 bp, 60 bp. n. or 50 bp. In some cases, the PV selective miRNA binding site is approximately 50-500 bp, 50-400 bp, 50-300 bp, 50-250 bp. , 50-200 bp, 50-100 bp, 50-75 bp, 50-70 bp, 100-500 bp, 100-400 bp, 100 -300 bp, 100-250 bp, 100-200 bp, 100-150 bp, 100-140 bp, 100-135 bp, 200-500 bp, 200-400 bp, 200-300 bp. or 200-250 bp.

Согласно иллюстративным вариантам осуществления представленный в настоящем документе полинуклеотид, который содержит один или несколько селективных в отношении PV сайтов связывания микроРНК не содержит SEQ ID NO: 67.In exemplary embodiments, a polynucleotide provided herein that contains one or more PV-selective miRNA binding sites does not contain SEQ ID NO: 67.

Кассеты экспрессии.Expression cassettes.

Согласно другому аспекту в настоящей заявке представлены кассеты экспрессии, содержащие представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, которая активирует SCNIA и/или содержит селективный в отношении PV сайт связывания микроРНК) и один или несколько регуляторных элементов. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, которая активирует SCN1A и/или содержит селективный в отношении PV сайт связывания микроРНК) и селективный в отношении PV промотор.In another aspect, the present application provides expression cassettes comprising a polynucleotide provided herein (e.g., a polynucleotide containing a sequence encoding an eTF that activates SCNIA and/or contains a PV-selective miRNA binding site) and one or more regulatory elements. In certain embodiments, provided herein are expression cassettes comprising a polynucleotide provided herein (e.g., a polynucleotide containing a sequence encoding an eTF that activates SCN1A and/or contains a PV-selective microRNA binding site) and a PV-selective promoter.

Согласно определенным вариантам осуществления представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, который активирует SCN1A и/или содержит селективный в отношении PV сайт связывания микроРНК) представляет собой часть кассеты экспрессии, содержащей один или несколько регуляторных элементов в добавок кIn certain embodiments, a polynucleotide provided herein (e.g., a polynucleotide containing a sequence encoding an eTF that activates SCN1A and/or contains a PV-selective miRNA binding site) is part of an expression cassette containing one or more regulatory elements in addition to

- 35 046157 последовательности, кодирующей eTF. Согласно иллюстративным вариантам осуществления представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, который активирует SCN1A и/или содержит селективный в отношении PV сайт связывания микроРНК), представляет собой часть кассеты экспрессии, содержащей промотор, расположенный выше против хода транскрипции от трансгенной последовательности, чтобы быть способным управлять экспрессией трансгена (например, eTF, который избирательно активирует SCN1A) в клетке.- 35 046157 eTF coding sequence. In exemplary embodiments, a polynucleotide provided herein (e.g., a polynucleotide containing a coding sequence for an eTF that activates SCN1A and/or contains a PV-selective miRNA binding site) is part of an expression cassette comprising an upstream promoter from a transgene sequence to be capable of driving the expression of a transgene (eg, an eTF that selectively activates SCN1A) in a cell.

Согласно определенным вариантам осуществления раскрытая в настоящем документе кассета экспрессии содержит представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, которая активирует регуляцию SCNIA и/или содержит селективный в отношении PV сайт связывания микроРНК) и конститутивный промотор, расположенный выше против хода транскрипции от последовательности, кодирующей трансген, чтобы быть способным управлять экспрессией трансгена (например, eTF, который избирательно активирует SCN1A) в клетке. Примеры конститутивных промоторов включают в себя промотор GAD2, промотор синапсина человека, промотор CBA, промотор CMV, промотор minCMV, TATA-бокс, супер основной промотор или промотор EF1a, или их комбинацию. Согласно определенным вариантам осуществления раскрытая в настоящем документе кассета экспрессии содержит представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, которая активирует SCN1A и/или содержит селективный в отношении PV сайт связывания микроРНК) и короткий промотор, способный управлять экспрессией, трансгена (например, eTF, который избирательно активирует SCN1A) в клетке. Согласно определенным вариантам осуществления короткий промотор, подходящий для применения в соответствии с описанными в настоящем документе молекулами нуклеиновой кислоты, содержит менее чем 500 п.н., 450 п.н., 400 п.н., 350 п.н., 300 п.н., 250 п.н., 225 п.н., 200 п.н., 175 п.н., 150 п.н., 145 п.н., 140 п.н., 135 п.н., 130 п.н., 125 п.н., 120 п.н., 115 п.н., 110 п.н., 105 п.н., 100 п.н., 95 п.н., 90 п.н., 85 п.н., 80 п.н. или 75 п.н. или приблизительно 80-300 п.н., 80-275 п.н., 80-250 п.н., 80-200 п.н., 80-150 п.н., 80-125 п.н., 80-120 п.н., 80-115 п.н., 80-110 п.н., 80-105 п.н., 80-100 п.н., 85-300 п.н., 85-275 п.н., 85-250 п.н., 85-200 п.н., 85-150 п.н., 85-125 п.н., 85-120 п.н., 85-115 п.н., 85-110 п.н., 85-105 п.н., 85100 п.н., 90-300 п.н., 90-275 п.н., 90-250 п.н., 90-200 п.н., 90-150 п.н., 90-125 п.н., 90-120 п.н., 90-115 п.н., 90-110 п.н., 90-105 п.н., 90-100 п.н., 95-300 п.н., 95-275 п.н., 95-250 п.н., 95-200 п.н., 95-150 п.н., 95-125 п.н., 95-120 п.н., 95-115 п.н., 95-110 п.н., 95-105 п.н., 95-100 п.н., 100-300 п.н., 100-275 п.н., 100-250 п.н., 100-200 п.н., 100-150 п.н., 100-125 п.н., 100-120 п.н., 100-115 п.н., 100-110 п.н. или 100-105 п.н. Согласно иллюстративным вариантам осуществления короткий промотор, подходящий для применения в соответствии с описанными в настоящем документе кассетами экспрессии, содержит приблизительно 100-120 п.н., приблизительно 117 п.н. или приблизительно 100 п.н.In certain embodiments, an expression cassette disclosed herein comprises a polynucleotide provided herein (e.g., a polynucleotide containing a sequence encoding an eTF that activates SCNIA regulation and/or contains a PV-selective miRNA binding site) and a constitutive promoter located upstream of transcriptional sequence from the transgene coding sequence to be able to direct the expression of the transgene (eg, eTF that selectively activates SCN1A) in the cell. Examples of constitutive promoters include the GAD2 promoter, the human synapsin promoter, the CBA promoter, the CMV promoter, the minCMV promoter, the TATA box, the super basic promoter or the EF1a promoter, or a combination thereof. In certain embodiments, an expression cassette disclosed herein comprises a polynucleotide provided herein (e.g., a polynucleotide containing a sequence encoding an eTF that activates SCN1A and/or contains a PV-selective miRNA binding site) and a short promoter capable of driving expression, transgene (for example, an eTF that selectively activates SCN1A) in a cell. In certain embodiments, a short promoter suitable for use with the nucleic acid molecules described herein comprises less than 500 bp, 450 bp, 400 bp, 350 bp, 300 bp .b., 250 bp., 225 bp., 200 bp., 175 bp., 150 bp., 145 bp., 140 bp., 135 bp. ., 130 bp, 125 bp, 120 bp, 115 bp, 110 bp, 105 bp, 100 bp, 95 bp, 90 bp, 85 bp, 80 bp or 75 bp or approximately 80-300 bp, 80-275 bp, 80-250 bp, 80-200 bp, 80-150 bp, 80-125 bp, 80-120 bp, 80-115 bp, 80-110 bp, 80-105 bp, 80-100 bp, 85-300 bp, 85- 275 bp, 85-250 bp, 85-200 bp, 85-150 bp, 85-125 bp, 85-120 bp, 85-115 p .n., 85-110 bp, 85-105 bp, 85100 bp, 90-300 bp, 90-275 bp, 90-250 bp, 90-200 bp, 90-150 bp, 90-125 bp, 90-120 bp, 90-115 bp, 90-110 bp, 90- 105 bp, 90-100 bp, 95-300 bp, 95-275 bp, 95-250 bp, 95-200 bp, 95-150 p .n., 95-125 bp, 95-120 bp, 95-115 bp, 95-110 bp, 95-105 bp, 95-100 bp ., 100-300 bp, 100-275 bp, 100-250 bp, 100-200 bp, 100-150 bp, 100-125 bp, 100-120 bp, 100-115 bp, 100-110 bp. or 100-105 bp. In exemplary embodiments, a short promoter suitable for use in accordance with the expression cassettes described herein comprises approximately 100-120 bp, approximately 117 bp. or approximately 100 bp.

Согласно определенным вариантам осуществления раскрытая в настоящем документе кассета экспрессии содержит короткий промотор, содержащий или состоящий из следующего: (i) SEQ ID NO: 1; (ii) его вариант или функциональный фрагмент или (iii) последовательность нуклеиновой кислоты, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), функционально связанная с полинуклеотидом, кодирующим любой из eTF, который избирательно активирует раскрытый в настоящем документе SCN1A и необязательно содержащая раскрытый в настоящем документе сайт связывания микроРНК. Другие примеры короткой промоторной последовательности можно найти в публикации PCT №WO 2018/213786.In certain embodiments, an expression cassette disclosed herein comprises a short promoter comprising or consisting of the following: (i) SEQ ID NO: 1; (ii) a variant or functional fragment thereof; or (iii) a nucleic acid sequence having sequence identity of at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88% , 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, with respect to any of (i) or (ii), functionally related to a polynucleotide encoding any of the eTFs that selectively activate SCN1A disclosed herein and optionally comprising a miRNA binding site disclosed herein. Other examples of short promoter sequences can be found in PCT Publication No. WO 2018/213786.

Согласно определенным вариантам осуществления раскрытая в настоящем документе кассета экспрессии содержит представленный в настоящем документе полинуклеотид (например, полинуклеотид, содержащий последовательность, кодирующую eTF, которая активирует SCN1A и/или содержит селективный в отношении PV сайт связывания микроРНК) и селективный промотор клеточного типа, расположенный выше против хода транскрипции от последовательности, кодирующей трансген (например, eTF, который избирательно активирует SCN1A), чтобы иметь возможность избирательно управлять экспрессией трансгена в представляющей интерес клетке. Согласно определенным вариантам осуществления селективный промотор клеточного типа может быть селективным (например, избирательно управлять экспрессией) в отношении любого представляющего интерес типа клеток, такого как, например, клетка сердца, клетка печени, мышечная клетка, костная клетка, нейрон или их субпопуляции. Согласно иллюстративному варианту осуществления раскрытая в настоящем документе кассета экспрессии содержит полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, и селективный в отношении PV регуляторный элемент (например, промотор, энхансер и/или промотор и энхансер), расположенный выше против хода транскрипции от последовательности, кодирующей eTF, так чтобы быть способным избирательно управлять экспрессией eTF в PV-клетке, и, необязательно, селективный в отношении PV сайт связывания микроРНК. Селективный в отношении PV регуляторный элемент относится к регуляторному элементу, который специфически модулирует экспрессию гена в PV-содержащем нейроне. Согласно определенным вариантам осуществления селективные в отношении PV регуляторные элементы усиливают экспрессию в PV-содержащем нейроне по сравнению с одним или несколькими другими типами клеток ЦНС. Согласно определенным вариантам осуществления селективный в отноше- 36 046157 нии PV регуляторный элемент подавляет процессы транскрипции и/или трансляции в нецелевых типах клеток.In certain embodiments, an expression cassette disclosed herein comprises a polynucleotide provided herein (e.g., a polynucleotide containing a sequence encoding an eTF that activates SCN1A and/or contains a PV-selective microRNA binding site) and a cell type-selective promoter located upstream upstream of the sequence encoding the transgene (eg, an eTF that selectively activates SCN1A) to be able to selectively control the expression of the transgene in the cell of interest. In certain embodiments, a cell type selective promoter may be selective (eg, selectively drive expression) for any cell type of interest, such as, for example, a heart cell, a liver cell, a muscle cell, a bone cell, a neuron, or subpopulations thereof. In an exemplary embodiment, an expression cassette disclosed herein comprises a polynucleotide encoding an eTF that selectively activates SCN1A, and a PV-selective regulatory element (e.g., a promoter, enhancer, and/or promoter and enhancer) located upstream of the sequence encoding eTF so as to be capable of selectively driving eTF expression in a PV cell, and optionally a PV-selective miRNA binding site. A PV-selective regulatory element refers to a regulatory element that specifically modulates gene expression in a PV-containing neuron. In certain embodiments, the PV-selective regulatory elements enhance expression in a PV-containing neuron relative to one or more other CNS cell types. In certain embodiments, the PV-selective regulatory element inhibits transcription and/or translation processes in non-target cell types.

Согласно определенным вариантам осуществления представленный в настоящем документе селективный в отношении PV регуляторный элемент приводит к селективной экспрессии гена в PV-клетке по сравнению с нецелевыми типами клеток. В некоторых случаях нецелевые типы клеток включают в себя, без ограничения, возбуждающие нейроны, не-PV типы клеток ЦНС и ненейрональные типы клеток ЦНС. Согласно определенным вариантам осуществления селективные в отношении PV регуляторные элементы приводят к селективной экспрессии генов в PV-содержащих нейронах по меньшей мере одного, двух, трех, четырех, пяти или более не содержащих PV типов клеток ЦНС. В некоторых случаях не содержащая PV клетка ЦНС представляет собой возбуждающий нейрон, дофаминергический нейрон, астроцит, микроглию, мотонейрон, сосудистую клетку или не-ГАМКергический нейрон, (например, клетка, которая не экспрессирует один или несколько из GAD2, GAD1, NKX2.1, DLX1, DLX5, SST и VIP), не содержащий PV нейрон (например, ГАМКергический нейрон, который не экспрессирует парвальбумин) или другие клетки ЦНС (например, типы клеток ЦНС, которые никогда не экспрессируют любой из PV, GAD2, GAD1, NKX2.1, DLX1, DLX5, SST и VIP). В некоторых случаях представленный в настоящем документе селективный в отношении PV регуляторный элемент приводит к повышенной селективности экспрессии генов в PV-содержащих нейронах по сравнению с не содержащими PV ГАМКергическими клетками. В некоторых случаях типы клеток различают по разным клеточным маркерам, морфологии, фенотипу, генотипу, функции и/или любым другим средствам классификации типов клеток.In certain embodiments, a PV-selective regulatory element provided herein results in selective gene expression in a PV cell over non-target cell types. In some cases, non-target cell types include, but are not limited to, excitatory neurons, non-PV CNS cell types, and non-neuronal CNS cell types. In certain embodiments, the PV-selective regulatory elements result in selective gene expression in PV-containing neurons of at least one, two, three, four, five, or more non-PV cell types of the CNS. In some cases, the non-PV CNS cell is an excitatory neuron, dopaminergic neuron, astrocyte, microglia, motoneuron, vascular cell, or non-GABAergic neuron (e.g., a cell that does not express one or more of GAD2, GAD1, NKX2.1, DLX1, DLX5, SST, and VIP), a non-PV neuron (eg, a GABAergic neuron that does not express parvalbumin) or other CNS cells (eg, CNS cell types that never express any of PV, GAD2, GAD1, NKX2.1 , DLX1, DLX5, SST and VIP). In some cases, the PV-selective regulatory element presented herein results in increased selectivity of gene expression in PV-containing neurons compared to non-PV GABAergic cells. In some cases, cell types are distinguished by different cellular markers, morphology, phenotype, genotype, function, and/or any other means of classifying cell types.

Селективность экспрессии, управляемую селективным в отношении PV регуляторным элементом, можно измерить несколькими способами. Согласно одному варианту осуществления селективность экспрессии гена в PV-содержащей клетке по сравнению с не содержащими PV клетками может быть измерена путем сравнения количества PV-содержащих клеток, которые экспрессируют обнаруживаемый уровень транскрипта от гена, который функционально связан с селективным в отношении PV регуляторным элементом, с общим количеством клеток, которые экспрессируют ген (например, отношение PV к общему количеству клеток (PV + не-PV клеток), экспрессирующих ген). Например, селективность в отношении PV-содержащих нейронов может быть определена с использованием анализа колокализации на основе иммуногистохимии с использованием гена, кодирующего флуоресцентный белок (например, eGFP), функционально связанный с селективным в отношении PV регуляторным элементом для измерения экспрессии гена и антитела, которое идентифицирует PV-содержащие клетки (например, антитело к PV, которое специфически взаимодействует с PV-содержащими нейронами), связанное со второй флуоресцентной меткой (например, красным флуоресцентным белком). Селективность экспрессии в PVсодержащих клетках можно рассчитать путем деления количества клеток, которые экспрессируют как PV, так и eGFP (например, PV-содержащие клетки), на общее количество клеток, экспрессирующих eGFP (например, PV-содержащие клетки и не содержащие PV клетки), и умножения на 100, чтобы преобразовать в проценты. Чем выше процент PV-содержащих клеток, экспрессирующих трансген, тем более селективным является регуляторный элемент для PV-содержащих клеток. Согласно определенным вариантам осуществления представленный в настоящем документе селективный в отношении PV регуляторный элемент может быть высокоселективным в отношении экспрессии в PV-содержащих клетках. Например, представленный в настоящем документе селективный в отношении PV регуляторный элемент может характеризоваться селективностью, составляющей приблизительно 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более чем приблизительно 99%, в отношении PV-содержащих нейронов (например, PV-содержащие нейроны/все клетки х 100).Expression selectivity controlled by a PV-selective regulatory element can be measured in several ways. In one embodiment, the selectivity of gene expression in a PV-containing cell compared to non-PV cells can be measured by comparing the number of PV-containing cells that express a detectable level of transcript from a gene that is operably linked to the PV-selective regulatory element with the total number of cells that express the gene (eg, the ratio of PV to the total number of cells (PV + non-PV cells) expressing the gene). For example, selectivity for PV-containing neurons can be determined using an immunohistochemistry-based colocalization assay using a gene encoding a fluorescent protein (e.g., eGFP) operably linked to a PV-selective regulatory element to measure gene expression and an antibody that identifies PV-containing cells (eg, an anti-PV antibody that specifically interacts with PV-containing neurons) bound to a second fluorescent tag (eg, red fluorescent protein). Expression selectivity in PV-containing cells can be calculated by dividing the number of cells that express both PV and eGFP (eg, PV-containing cells) by the total number of cells expressing eGFP (eg, PV-containing cells and non-PV-containing cells). and multiplying by 100 to convert to a percentage. The higher the percentage of PV-containing cells expressing the transgene, the more selective the regulatory element is for PV-containing cells. In certain embodiments, a PV-selective regulatory element provided herein may be highly selective for expression in PV-containing cells. For example, a PV selective regulatory element provided herein may have selectivity of approximately 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92% , 93%, 94%, 95%, 96%, 97%, 98%, 99%, or greater than about 99%, with respect to PV-containing neurons (eg, PV-containing neurons/total cells x 100).

В некоторых случаях представленный в настоящем документе селективный в отношении PV регуляторный элемент является коротким. В некоторых случаях размер селективного в отношении PV регуляторного элемента совместим с клонирующей способностью вектора, например, вирусного вектора или rAAV, так что комбинированный размер трансгена и одного или нескольких селективных в отношении PV регуляторных элементов не превышает клонирующую способность вектора. В некоторых случаях селективный в отношении PV регуляторный элемент составляет в длину приблизительно до 2050 п.н., 2000 п.н., 1900 п.н., 1800 п.н., 1700 п.н., 1600 п.н., 1500 п.н., 1400 п.н., 1300 п.н., 1200 п.н., 1100 п.н., 1000 п.н., 900 п.н., 800 п.н., 700 п.н., 600 п.н., 500 п.н., 400 п.н., 300 п.н., 200 п.н. или 100 п.н. В некоторых случаях селективный в отношении PV регуляторный элемент составляет приблизительно 500-600 п.н., 500-700 п.н., 500-800 п.н., 500-900 п.н., 500-1000 п.н., 500-1500 п.н., 500-2000 п.н. или 500-2050 п.н.In some cases, the PV-selective regulatory element presented herein is short. In some cases, the size of the PV-selective regulatory element is compatible with the cloning ability of the vector, such as a viral vector or rAAV, such that the combined size of the transgene and one or more PV-selective regulatory elements does not exceed the cloning ability of the vector. In some cases, the PV selective regulatory element is up to approximately 2050 bp, 2000 bp, 1900 bp, 1800 bp, 1700 bp, 1600 bp in length. 1500 bp, 1400 bp, 1300 bp, 1200 bp, 1100 bp, 1000 bp, 900 bp, 800 bp, 700 bp .b., 600 bp, 500 bp, 400 bp, 300 bp, 200 bp. or 100 bp In some cases, the PV selective regulatory element is approximately 500-600 bp, 500-700 bp, 500-800 bp, 500-900 bp, 500-1000 bp. , 500-1500 bp, 500-2000 bp or 500-2050 bp.

Согласно определенным вариантам осуществления представленный в настоящем документе селективный в отношении PV регуляторный элемент содержит или состоит из любого из следующего: (i) SEQ ID NO: 2-4; (ii) вариант, функциональный фрагмент или их комбинация или (iii) последовательность нуклеиновой кислоты, характеризующаяся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% по отношению к любому из (i) или (ii). В некоторых случаях регуляторный элемент включает в себя любую из SEQ ID NO: 2-4. Другие примеры селективных в отношении PV регуляторных элементов можно найти в публикации PCT № WO 2018/187363.In certain embodiments, a PV selective regulatory element provided herein comprises or consists of any of the following: (i) SEQ ID NO: 2-4; (ii) a variant, functional fragment, or combination thereof, or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% sequence identity, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% in relation to any of (i) or (ii). In some cases, the regulatory element includes any of SEQ ID NO: 2-4. Further examples of PV-selective regulatory elements can be found in PCT Publication No. WO 2018/187363.

Согласно иллюстративным вариантам осуществления в настоящей заявке представлены кассетыAccording to illustrative embodiments, this application provides cassettes

- 37 046157 экспрессии, содержащие последовательность нуклеиновой кислоты, кодирующую eTF, который избирательно активирует SCN1A под контролем селективного в отношении PV регуляторного элемента. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, кодирующую eTF, который избирательно активирует SCN1A, содержащий DBD, содержащий любую из следующих последовательностей: SEQ ID NO: 77-98 под контролем селективного в отношении PV регуляторного элемента, содержащего любую одна из SEQ ID NO: 2-4. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, кодирующую eTF, который избирательно активирует SCN1A, содержащий любую из следующих последовательностей: SEQ ID NO: 99-131, 205, 207, 209, 213, 217, 219, 221 или 223 под контролем селективного в отношении PV регуляторного элемента, содержащего любую из SEQ ID NO: 2-4. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, содержащую любую из следующих последовательностей: SEQ ID NO: 67-73 под контролем селективного в отношении PV регуляторного элемента, содержащего любую из SEQ ID NO: 2-4. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, кодирующую eTF, который избирательно активирует SCN1A, содержащий DBD, содержащий любую из следующих последовательностей: SEQ ID NO: 148-151 под контролем селективного в отношении PV регуляторного элемента, содержащего любую из SEQ ID NO: 2. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, кодирующую eTF, который избирательно активирует SCN1A, содержащий любую из следующих последовательностей: SEQ ID NO: 99-131, 205, 207, 209, 213, 217, 219, 221 или 223 под контролем селективного в отношении PV регуляторного элемента, содержащего любую из SEQ ID NO: 2. Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие последовательность нуклеиновой кислоты, содержащую любую из следующих последовательностей: SEQ ID NO: 67-76 или 316 под контролем селективного в отношении PV регуляторного элемента, содержащего любую из SEQ ID NO: 2.- 37 046157 expressions containing a nucleic acid sequence encoding an eTF that selectively activates SCN1A under the control of a PV-selective regulatory element. In certain embodiments, provided herein are expression cassettes comprising a nucleic acid sequence encoding an eTF that selectively activates SCN1A containing a DBD containing any of the following sequences: SEQ ID NO: 77-98 under the control of a PV-selective regulatory element comprising any one of SEQ ID NO: 2-4. In certain embodiments, provided herein are expression cassettes containing a nucleic acid sequence encoding an eTF that selectively activates SCN1A, comprising any of the following sequences: SEQ ID NO: 99-131, 205, 207, 209, 213, 217, 219, 221 or 223 under the control of a PV-selective regulatory element comprising any of SEQ ID NOs: 2-4. In certain embodiments, provided herein are expression cassettes comprising a nucleic acid sequence comprising any of the following sequences: SEQ ID NO: 67-73 under the control of a PV selective regulatory element comprising any of SEQ ID NO: 2-4. In certain embodiments, provided herein are expression cassettes comprising a nucleic acid sequence encoding an eTF that selectively activates SCN1A containing a DBD comprising any of the following sequences: SEQ ID NO: 148-151 under the control of a PV-selective regulatory element comprising any of SEQ ID NO: 2. In certain embodiments, provided herein are expression cassettes containing a nucleic acid sequence encoding an eTF that selectively activates SCN1A, comprising any of the following sequences: SEQ ID NO: 99-131, 205, 207, 209, 213, 217, 219, 221, or 223 under the control of a PV-selective regulatory element comprising any of SEQ ID NO: 2. In certain embodiments, provided herein are expression cassettes comprising a nucleic acid sequence comprising any of the following sequences : SEQ ID NO: 67-76 or 316 under the control of a PV-selective regulatory element containing any of SEQ ID NO: 2.

Согласно определенным вариантам осуществления в настоящей заявке представлены кассеты экспрессии, содержащие селективный в отношении PV сайт связывания микроРНК и последовательность промотора и/или энхансера. Любой из описанных в настоящем документе промоторов может быть включен в кассету экспрессии. Согласно иллюстративному варианту осуществления представленная в настоящем документе кассета экспрессии содержит селективный в отношении PV сайт связывания микроРНК и селективный в отношении PV регуляторный элемент. Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии содержит селективный в отношении PV сайт связывания микроРНК и селективный в отношении PV регуляторный элемент, содержащий (i) любую из SEQ ID NO: 2-4; (ii) вариант, функциональный фрагмент или их комбинацию или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии содержит (1) селективный в отношении PV сайт связывания микроРНК, содержащий (i) любую из SEQ ID NO: 7, 14 или 15; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), и (2) селективный в отношении PV регуляторный элемент, содержащий (i) любую из SEQ ID NO: 2-4; (ii) вариант, функциональный фрагмент или их комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии содержит (1) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 7; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), и (2) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно одному варианту осуществления представленная в настоящем документе кассета экспрессии содержит сайт связывания микроРНК, содержащий SEQ ID NO: 7, и селективный в отношении PV регуляторный элемент, содержащий SEQ ID NO: 2. Согласно определенным вариантам осуществления представленный в настоящем документе полинуклеотид, содержит (1) селективный в отношении PV сайт связывания микроРНК,In certain embodiments, the present application provides expression cassettes comprising a PV-selective miRNA binding site and a promoter and/or enhancer sequence. Any of the promoters described herein may be included in an expression cassette. In an exemplary embodiment, an expression cassette provided herein comprises a PV-selective miRNA binding site and a PV-selective regulatory element. In certain embodiments, an expression cassette provided herein comprises a PV-selective miRNA binding site and a PV-selective regulatory element comprising (i) any of SEQ ID NO: 2-4; (ii) a variant, functional fragment, or combination thereof, or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% sequence identity, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii). In certain embodiments, an expression cassette provided herein comprises (1) a PV-selective miRNA binding site comprising (i) any of SEQ ID NO: 7, 14, or 15; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) , and (2) a PV-selective regulatory element comprising (i) any of SEQ ID NOs: 2-4; (ii) a variant, functional fragment, or combination thereof; (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86% sequence identity, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii ). In certain embodiments, an expression cassette provided herein comprises (1) a PV-selective miRNA binding site comprising (i) SEQ ID NO: 7; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) , and (2) a PV-selective regulatory element comprising (i) SEQ ID NO: 2; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) . In one embodiment, an expression cassette provided herein comprises a microRNA binding site comprising SEQ ID NO: 7 and a PV selective regulatory element comprising SEQ ID NO: 2. In certain embodiments, a polynucleotide provided herein comprises (1 ) PV-selective miRNA binding site,

- 38 046157 содержащий (i) SEQ ID NO: 14; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (2) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно одному варианту осуществления представленная в настоящем документе кассета экспрессии содержит сайт связывания микроРНК, содержащий SEQ ID NO: 15, и селективный в отношении PV регуляторный элемент, содержащий SEQ ID NO: 2. Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии содержит (1) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 15; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (2) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно одному варианту осуществления представленная в настоящем документе кассета экспрессии содержит сайт связывания микроРНК, содержащий SEQ ID NO: 15, и селективный в отношении PV регуляторный элемент, содержащий SEQ ID NO: 2.- 38 046157 containing (i) SEQ ID NO: 14; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) , and (2) a PV-selective regulatory element comprising (i) SEQ ID NO: 2; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) . In one embodiment, an expression cassette provided herein comprises a microRNA binding site comprising SEQ ID NO: 15 and a PV selective regulatory element comprising SEQ ID NO: 2. In certain embodiments, an expression cassette provided herein comprises (1 ) a PV-selective miRNA binding site containing (i) SEQ ID NO: 15; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) , and (2) a PV-selective regulatory element comprising (i) SEQ ID NO: 2; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) . In one embodiment, an expression cassette provided herein comprises a miRNA binding site comprising SEQ ID NO: 15 and a PV selective regulatory element comprising SEQ ID NO: 2.

Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии содержит селективный в отношении PV сайт связывания микроРНК и последовательность, кодирующую eTF, который стимулирует экспрессию SCN1A, как предусмотрено в настоящем документе. Согласно иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая селективный в отношении PV регуляторный элемент, eTF, который активирует экспрессию SCN1A, как предусмотрено в настоящем документе, и селективный в отношении PV сайт связывания микроРНК. Согласно иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) любую из SEQ ID NO: 2-4; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 77-131, 205, 207, 209, 213, 217, 219, 221 или 223; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) любую из SEQ ID NO: 7, 14 или 15; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 77 или 127; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 7; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, хаIn certain embodiments, an expression cassette provided herein comprises a PV-selective miRNA binding site and a sequence encoding an eTF that promotes expression of SCN1A as provided herein. In an exemplary embodiment, the present application provides an expression cassette comprising a PV-selective regulatory element, an eTF, that activates the expression of SCN1A as provided herein, and a PV-selective microRNA binding site. According to an illustrative embodiment, the present application provides an expression cassette comprising (1) a PV selective regulatory element comprising (i) any of SEQ ID NO: 2-4; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) (2) a sequence encoding an eTF that activates SCN1A, comprising (i) any of SEQ ID NO: 77-131, 205, 207, 209, 213, 217, 219, 221, or 223; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) , and (3) a PV-selective miRNA binding site comprising (i) any of SEQ ID NO: 7, 14 or 15; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) . According to another illustrative embodiment, provided herein is an expression cassette comprising (1) a PV selective regulatory element comprising (i) SEQ ID NO: 2; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) , (2) a sequence encoding an eTF that activates SCN1A, containing (i) any of SEQ ID NO: 77 or 127; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) , and (3) a PV-selective miRNA binding site comprising (i) SEQ ID NO: 7; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) . According to another illustrative embodiment, provided herein is an expression cassette comprising (1) a PV selective regulatory element comprising (i) SEQ ID NO: 2; (ii) variant, functional fragment or combination of (i) or (iii) nucleic acid sequence, ha

- 39 046157 растеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 77 или 127; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 14; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 77 или 127; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 15; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 92 или 106; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 7; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 92 или 106; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 14; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii). Согласно другому иллюстративному варианту осуществления в настоящей заявке представлена кассета экспрессии, содержащая (1) селективный в отношении PV регуляторный элемент, содержащий (i) SEQ ID NO: 2; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любой из (i) или (ii), (2) последовательность, кодирующую eTF, который активирует SCN1A, содержащий (i) любую из SEQ ID NO: 92 или 106; (ii) вариант, функциональный фрагмент или комбина- 39 046157 rasterizable sequence identity of at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, relative to any of (i) or (ii), (2) a sequence encoding an eTF that activates SCN1A containing (i) any of SEQ ID NO: 77 or 127; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) , and (3) a PV-selective miRNA binding site comprising (i) SEQ ID NO: 14; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) . According to another illustrative embodiment, provided herein is an expression cassette comprising (1) a PV selective regulatory element comprising (i) SEQ ID NO: 2; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) , (2) a sequence encoding an eTF that activates SCN1A, containing (i) any of SEQ ID NO: 77 or 127; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) , and (3) a PV-selective miRNA binding site comprising (i) SEQ ID NO: 15; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) . According to another illustrative embodiment, provided herein is an expression cassette comprising (1) a PV selective regulatory element comprising (i) SEQ ID NO: 2; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) , (2) a sequence encoding an eTF that activates SCN1A, containing (i) any of SEQ ID NO: 92 or 106; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) , and (3) a PV-selective miRNA binding site comprising (i) SEQ ID NO: 7; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) . According to another illustrative embodiment, provided herein is an expression cassette comprising (1) a PV selective regulatory element comprising (i) SEQ ID NO: 2; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) , (2) a sequence encoding an eTF that activates SCN1A, containing (i) any of SEQ ID NO: 92 or 106; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) , and (3) a PV-selective miRNA binding site comprising (i) SEQ ID NO: 14; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) . According to another illustrative embodiment, provided herein is an expression cassette comprising (1) a PV selective regulatory element comprising (i) SEQ ID NO: 2; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) , (2) a sequence encoding an eTF that activates SCN1A, containing (i) any of SEQ ID NO: 92 or 106; (ii) variant, functional fragment or combination

- 40 046157 цию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любым из (i) или (ii), и (3) селективный в отношении PV сайт связывания микроРНК, содержащий (i) SEQ ID NO: 15; (ii) вариант, функциональный фрагмент или комбинацию (i) или (iii) последовательность нуклеиновой кислоты, характеризующуюся идентичностью последовательности, составляющей по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99%, по отношению к любому из (i) или (ii).- 40 046157 tion (i) or (iii) a nucleic acid sequence characterized by a sequence identity of at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii), and (3) a PV-selective miRNA binding site comprising (i) SEQ ID NO: 15; (ii) a variant, functional fragment or combination of (i) or (iii) a nucleic acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 sequence identity %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99%, in relation to any of (i) or (ii) .

Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии, содержащая селективный в отношении PV регуляторный элемент и селективный в отношении PV сайт связывания микроРНК, характеризующийся размером менее чем 5 т.п.н., 4,9 т.п.н., 4,8 т.п.н., 4,7 т.п.н., 4,6 т.п.н., 4,5 т.п.н., 4,4 т.п.н., 4,3 т.п.н., 4,2 т.п.н., 4,1 т.п.н., 4,0 т.п.н., 3,9 т.п.н., 3,8 т.п.н., 3,7 т.п.н., 3,6 т.п.н., 3,5 т.п.н., 3,4 т.п.н., 3,3 т.п.н., 3,2 т.п.н., 3,1 т.п.н., 3,0 т.п.н., 2,9 т.п.н., 2,8 т.п.н., 2,7 т.п.н., 2,6 т.п.н., 2,5 т.п.н., 2,4 т.п.н., 2,3 т.п.н., 2,2 т.п.н., 2,1 т.п.н., 2,0 т.п.н., 1,9 т.п.н., 1,8 т.п.н., 1,7 т.п.н., 1,6 т.п.н. или 1,5 т.п.н. или менее, или приблизительно 1,5-5 т.п.н., 1,5-4,7 т.п.н., 1,5-4,5 т.п.н., 1,5-4,0 т.п.н., 1,5-3,5 т.п.н., 1,5-3,0 т.п.н., 1,5-2,5 т.п.н., 1,5-2,0 т.п.н.In certain embodiments, an expression cassette provided herein comprising a PV-selective regulatory element and a PV-selective miRNA binding site characterized by a size of less than 5 kb, 4.9 kb, 4 ,8 kb, 4.7 kb, 4.6 kb, 4.5 kb, 4.4 kb, 4 ,3 kb, 4.2 kb, 4.1 kb, 4.0 kb, 3.9 kb, 3 ,8 kb, 3.7 kb, 3.6 kb, 3.5 kb, 3.4 kb, 3 ,3 kb, 3.2 kb, 3.1 kb, 3.0 kb, 2.9 kb, 2 ,8 kb, 2.7 kb, 2.6 kb, 2.5 kb, 2.4 kb, 2 ,3 kb, 2.2 kb, 2.1 kb, 2.0 kb, 1.9 kb, 1 ,8 kb, 1.7 kb, 1.6 kb. or 1.5 kb. or less, or about 1.5-5 kb, 1.5-4.7 kb, 1.5-4.5 kb, 1.5-4 ,0 kb, 1.5-3.5 kb, 1.5-3.0 kb, 1.5-2.5 kb. , 1.5-2.0 kb.

Согласно определенным вариантам осуществления представленная в настоящем документе кассета экспрессии может содержать еще один дополнительный регуляторный элемент в дополнение к промотору, такой как, например, последовательности, связанные с инициацией или окончанием транскрипции, энхансерные последовательности и эффективные сигналы процессинга РНК. Иллюстративные регуляторные элементы включают в себя, например, интрон, энхансер, UTR, элемент стабильности, последовательность WPRE, консенсусную последовательность Kozak, посттрансляционный элемент ответа, сайт связывания микроРНК или последовательность полиаденилирования (полиА) или их комбинацию. Регуляторные элементы могут функционировать, чтобы модулировать экспрессию генов на фазе транскрипции, посттранскрипционной фазе или на фазе трансляции экспрессии генов. На уровне РНК регуляция может происходить на уровне трансляции (например, элементы стабильности, которые стабилизируют мРНК для трансляции), расщепления РНК, сплайсинга РНК и/или терминации транскрипции. Согласно различным вариантам осуществления регуляторные элементы могут рекрутировать факторы транскрипции в кодирующую область, которые повышают избирательность экспрессии генов в представляющем интерес типе клеток, увеличивают скорость, с которой производятся транскрипты РНК, повышают стабильность производимой РНК и/или увеличивают скорость образования синтеза белка из транскриптов РНК. Согласно иллюстративному варианту осуществления представленная в настоящем документе кассета экспрессии содержит по меньшей мере один селективный в отношении PV сайт связывания микроРНК, как предусмотрено в настоящем документе.In certain embodiments, an expression cassette provided herein may contain further additional regulatory elements in addition to a promoter, such as, for example, sequences associated with transcription initiation or termination, enhancer sequences, and effective RNA processing signals. Exemplary regulatory elements include, for example, an intron, an enhancer, a UTR, a stability element, a WPRE sequence, a Kozak consensus sequence, a post-translational response element, a microRNA binding site, or a polyadenylation (polyA) sequence, or a combination thereof. Regulatory elements can function to modulate gene expression during the transcriptional phase, posttranscriptional phase, or translational phase of gene expression. At the RNA level, regulation can occur at the level of translation (eg, stability elements that stabilize mRNA for translation), RNA cleavage, RNA splicing, and/or transcription termination. In various embodiments, regulatory elements may recruit transcription factors to the coding region that increase the selectivity of gene expression in the cell type of interest, increase the rate at which RNA transcripts are produced, increase the stability of the RNA produced, and/or increase the rate of production of protein synthesis from RNA transcripts. In an exemplary embodiment, an expression cassette provided herein comprises at least one PV-selective miRNA binding site as provided herein.

Согласно определенным вариантам осуществления описанные в настоящем документе кассеты экспрессии дополнительно содержат последовательность полиА. Подходящие последовательности полиА включают в себя, например, искусственный полиА длиной приблизительно 75 п.н. (PA75) (см., например, WO 2018/126116), полиА бычьего гормона роста, ранний сигнал полиА SV40, поздний сигнал полиА SV40, полиА бета-глобина кролика, полиА тимидинкиназы HSV, полиА гена протамина, полиА аденовируса 5 EIb, полиА гормона роста или полиА PBGD. Согласно иллюстративным вариантам осуществления последовательность полиА, подходящая для применения в представленных в настоящем документе кассетах экспрессии, представляет собой полиА hGH (SEQ ID NO: 17) или синтетический полиА (SEQ ID NO: 16). Как правило, последовательность полиА расположена ниже по ходу транскрипции от полинуклеотида, кодирующего eTF, в описанных в настоящем документе кассетах экспрессии.In certain embodiments, the expression cassettes described herein further comprise a polyA sequence. Suitable polyA sequences include, for example, an artificial polyA of approximately 75 bp in length. (PA75) (see e.g. WO 2018/126116), bovine growth hormone polyA, SV40 polyA early signal, SV40 late polyA signal, rabbit beta-globin polyA, HSV thymidine kinase polyA, protamine gene polyA, adenovirus 5 EIb polyA, polyA growth hormone or polyA PBGD. In exemplary embodiments, a polyA sequence suitable for use in the expression cassettes provided herein is hGH polyA (SEQ ID NO: 17) or synthetic polyA (SEQ ID NO: 16). Typically, the polyA sequence is located downstream of the polynucleotide encoding the eTF in the expression cassettes described herein.

Согласно определенным вариантам осуществления представленные в настоящем документе кассеты экспрессии дополнительно содержат одну или несколько последовательностей нуклеиновых кислот, кодирующих один или несколько сигналов ядерной локализации (NLS). Может быть использован любой пептид NLS, который облегчает импорт белка, к которому прикреплен, в ядро клетки. Примеры NLS включают в себя, например, NLS большого T-антигена SV40, NLS нуклеоплазмина, NLS EGL-13, NLS cMyc и NLS TUS-белка. Смотрите, например, C. Dingwall et al., J. Cell Biol. 107: 841-9 (1988); J.P. Makkerh et al., Curr Biol. 6: 1025-7 (1996) и M. Ray et al., Bioconjug. Chem. 26: 1004-7 (2015). NLS может быть расположен в любом месте последовательности белка eTF, но согласно предпочтительным вариантам осуществления он конъюгирован с N-концом eTF или доменом eTF. Согласно иллюстративным вариантам осуществления представленные в настоящем документе кассеты нуклеиновых кислот кодируют eTF с NLS, слитым с N-концом eTF. Согласно другим вариантам осуществления представленные в настоящем документе кассеты нуклеиновых кислот кодируют eTF с первым NLS, слитым с N-концом eTF, и вторым NLS, расположенным между DBD и доменом TAD eTF.In certain embodiments, expression cassettes provided herein further comprise one or more nucleic acid sequences encoding one or more nuclear localization signals (NLS). Any NLS peptide that facilitates the import of the protein to which it is attached into the cell nucleus can be used. Examples of NLSs include, for example, SV40 large T antigen NLS, nucleoplasmin NLS, EGL-13 NLS, cMyc NLS, and TUS protein NLS. See, for example, C. Dingwall et al., J. Cell Biol. 107: 841-9 (1988); J.P. Makkerh et al., Curr Biol. 6: 1025-7 (1996) and M. Ray et al., Bioconjug. Chem. 26: 1004-7 (2015). The NLS can be located anywhere in the eTF protein sequence, but in preferred embodiments it is conjugated to the N-terminus of the eTF or an eTF domain. In exemplary embodiments, the nucleic acid cassettes provided herein encode an eTF with an NLS fused to the N-terminus of the eTF. In other embodiments, the nucleic acid cassettes provided herein encode an eTF with a first NLS fused to the N-terminus of the eTF and a second NLS located between the DBD and the TAD domain of the eTF.

Векторы экспрессии.Expression vectors.

Согласно определенным вариантам осуществления описанные в настоящем документе кассеты экспрессии могут быть включены в вектор экспрессии. Векторы экспрессии можно использовать для доставки кассеты экспрессии в целевую клетку посредством трансфекции или трансдукции. Вектор может представлять собой интегрирующий или неинтегрирующий вектор, что относится к способности вектораIn certain embodiments, expression cassettes described herein may be included in an expression vector. Expression vectors can be used to deliver an expression cassette to a target cell through transfection or transduction. A vector may be an integrating or non-integrating vector, which refers to the vector's ability

- 41 046157 интегрировать кассету экспрессии или трансген в геном клетки-хозяина. Примеры векторов экспрессии включают в себя, без ограничения, (a) невирусные векторы, такие как векторы нуклеиновых кислот, включая в себя линейные олигонуклеотиды и кольцевые плазмиды; искусственные хромосомы, такие как искусственные хромосомы человека (HAC), искусственные хромосомы дрожжей (YAC) и бактериальные искусственные хромосомы (BAC или PAC)); эписомальные векторы; транспозоны (например, PiggyBac); и (b) вирусные векторы, такие как ретровирусные векторы, лентивирусные векторы, аденовирусные векторы и аденоассоциированные вирусные векторы.- 41 046157 integrate an expression cassette or transgene into the genome of the host cell. Examples of expression vectors include, but are not limited to, (a) non-viral vectors such as nucleic acid vectors, including linear oligonucleotides and circular plasmids; artificial chromosomes such as human artificial chromosomes (HAC), yeast artificial chromosomes (YAC) and bacterial artificial chromosomes (BAC or PAC)); episomal vectors; transposons (eg PiggyBac); and (b) viral vectors, such as retroviral vectors, lentiviral vectors, adenoviral vectors and adeno-associated viral vectors.

Векторы экспрессии могут представлять собой линейные олигонуклеотиды или кольцевые плазмиды и могут быть доставлены в клетку с помощью различных способов трансфекции, включая в себя физические и химические способы. Физические способы, как правило, относятся к способам доставки, использующим физическую силу для противодействия барьеру клеточной мембраны для облегчения внутриклеточной доставки генетического материала. Примеры физических способов включают в себя использование иглы, баллистической ДНК, электропорацию, сонопорацию, фотопорацию, магнитофекцию и гидропорацию. Химические способы, как правило, относятся к способам, при которых химические носители доставляют молекулу нуклеиновой кислоты в клетку, и могут включать в себя неорганические частицы, векторы на основе липидов, векторы на основе полимеров и векторы на основе пептидов.Expression vectors can be linear oligonucleotides or circular plasmids and can be delivered into cells using a variety of transfection methods, including physical and chemical methods. Physical methods generally refer to delivery methods that use physical force to counteract a cell membrane barrier to facilitate intracellular delivery of genetic material. Examples of physical methods include the use of a needle, ballistic DNA, electroporation, sonoporation, photoporation, magnetofection and hydroporation. Chemical methods generally refer to methods in which chemical vehicles deliver a nucleic acid molecule into a cell, and may include inorganic particles, lipid-based vectors, polymer-based vectors and peptide-based vectors.

Согласно определенным вариантам осуществления вектор экспрессии вводят в целевую клетку с использованием катионного липида (например, катионной липосомы). Для доставки генов были исследованы различные типы липидов, такие как, например, липидная наноэмульсия (например, которая представляет собой дисперсию одной несмешивающейся жидкости в другой, стабилизированной эмульгирующим средством) или твердые липидные наночастицы.In certain embodiments, the expression vector is introduced into the target cell using a cationic lipid (eg, a cationic liposome). Various types of lipids have been explored for gene delivery, such as lipid nanoemulsion (eg, which is a dispersion of one immiscible liquid in another, stabilized by an emulsifying agent) or solid lipid nanoparticles.

Согласно определенным вариантам осуществления вектор экспрессии вводят в целевую клетку с использованием носителя для доставки на основе пептидов. Носители на основе пептидов могут иметь преимущества, заключающиеся в защите доставляемого генетического материала, нацеливании на специфические клеточные рецепторы, разрушении эндосомных мембран и доставке генетического материала в ядро. Согласно определенным вариантам осуществления вектор экспрессии вводят в целевую клетку с использованием носителя для доставки на основе полимера. Носители на основе полимеров могут содержать природные белки, пептиды и/или полисахариды или синтетические полимеры. Согласно одному варианту осуществления средство доставки на основе полимера содержит полиэтиленимин (PEI). PEI может конденсировать ДНК в положительно заряженные частицы, которые связываются с остатками анионной поверхности клетки и попадают в клетку посредством эндоцитоза. Согласно другим вариантам осуществления носитель для доставки на основе полимера может содержать поли-Ь-лизин (PLL), поли(DL-молочную кислоту) (PLA), поли^Ь-лактид-ко-гликозид) (PLGA), полиорнитин, полиаргинин, гистоны, протамины, дендримеры, хитозаны, синтетические аминопроизводные декстрана и/или катионные акриловые полимеры. Согласно определенным вариантам осуществления носители для доставки на основе полимеров могут включать в себя смесь полимеров, такую как, например, PEG и PLL.In certain embodiments, the expression vector is introduced into a target cell using a peptide-based delivery vehicle. Peptide-based carriers may have the advantages of protecting the delivered genetic material, targeting specific cellular receptors, disrupting endosomal membranes, and delivering genetic material to the nucleus. In certain embodiments, the expression vector is introduced into the target cell using a polymer-based delivery vehicle. Polymer-based carriers may contain natural proteins, peptides and/or polysaccharides or synthetic polymers. In one embodiment, the polymer-based delivery vehicle comprises polyethylenimine (PEI). PEI can condense DNA into positively charged particles that bind to anionic cell surface remnants and enter the cell through endocytosis. In other embodiments, the polymer-based delivery vehicle may comprise poly-L-lysine (PLL), poly(DL-lactic acid) (PLA), poly-L-lactide-co-glycoside (PLGA), polyornithine, polyarginine, histones, protamines, dendrimers, chitosans, synthetic amine derivatives of dextran and/or cationic acrylic polymers. In certain embodiments, polymer-based delivery vehicles may include a mixture of polymers, such as, for example, PEG and PLL.

Согласно определенным вариантам осуществления вектор экспрессии может представлять собой вирусный вектор, подходящий для генной терапии. Предпочтительные характеристики векторов вирусной генной терапии или векторов доставки генов могут включать в себя способность воспроизводимо и стабильно размножаться и очищаться до высоких титров; для опосредования направленной доставки (например, для доставки трансгена конкретно в представляющую интерес ткань или орган без широкого распространения вектора в другом месте); и опосредовать доставку гена и экспрессию трансгена, не вызывая вредных побочных эффектов.In certain embodiments, the expression vector may be a viral vector suitable for gene therapy. Preferred characteristics of viral gene therapy vectors or gene delivery vectors may include the ability to be reproducibly and stably propagated and purified to high titers; to mediate targeted delivery (eg, to deliver a transgene specifically to a tissue or organ of interest without widespread distribution of the vector elsewhere); and mediate gene delivery and transgene expression without causing harmful side effects.

Несколько типов вирусов, например, непатогенный парвовирус, называемый аденоассоциированным вирусом, были сконструированы для целей генной терапии, используя путь вирусной инфекции, но избегая последующей экспрессии вирусных генов, которая может привести к репликация и токсичности. Такие вирусные векторы можно получить путем удаления всех или некоторых кодирующих областей из вирусного генома, но оставив нетронутыми те последовательности (например, концевые повторяющиеся последовательности), которые могут быть необходимы для таких функций, как упаковка векторного генома в вирусный капсид или интеграция векторной нуклеиновой кислоты (например, ДНК) в хроматин хозяина.Several types of viruses, such as a non-pathogenic parvovirus called adeno-associated virus, have been engineered for gene therapy purposes, exploiting the viral infection pathway but avoiding subsequent viral gene expression, which can lead to replication and toxicity. Such viral vectors can be produced by removing all or some of the coding regions from the viral genome but leaving intact those sequences (e.g., terminal repeat sequences) that may be required for functions such as packaging the vector genome into the viral capsid or integrating the vector nucleic acid ( e.g. DNA) into host chromatin.

Согласно различным вариантам осуществления подходящие вирусные векторы включают в себя ретровирусы (например, вирусы A-типа, B-типа, C-типа и D-типа), аденовирус, парвовирус (например, аденоассоциированные вирусы или AAV), коронавирус, вирусы с отрицательно-полярной нитью РНК, такие как ортомиксовирус (например, вирус гриппа), рабдовирус (например, вирус бешенства и везикулярного стоматита), парамиксовирус (например, корь и Сендай), вирусы с положительно-полярной нитью РНК, такие как пикорнавирус и альфавирус, и двухцепочечные ДНК-вирусы, включая в себя аденовирус, вирус герпеса (например, вирус простого герпеса типов 1 и 2, вирус Эпштейна-Барра, цитомегаловирус) и поксвирус (например, коровьей оспы, оспы птиц и оспы канареек). Примеры ретровирусов включают в себя вирус лейкемии-саркомы птиц, человеческий T-лимфотрофный вирус типа 1 (HTLV-1), вирус лейкемии крупного рогатого скота (BLV), лентивирус и спумавирус. Другие вирусы включают в себя, например, вирус Норуолк, тогавирус, флавивирус, реовирусы, паповавирус, гепаднавирус и вирусIn various embodiments, suitable viral vectors include retroviruses (eg, A-type, B-type, C-type, and D-type viruses), adenovirus, parvovirus (eg, adeno-associated viruses or AAV), coronavirus, negative-infective viruses polar strand RNA such as orthomyxovirus (eg, influenza virus), rhabdovirus (eg, rabies and vesicular stomatitis virus), paramyxovirus (eg, measles and Sendai), positive strand RNA viruses such as picornavirus and alphavirus, and double-stranded DNA viruses, including adenovirus, herpes virus (eg, herpes simplex virus types 1 and 2, Epstein-Barr virus, cytomegalovirus), and poxvirus (eg, cowpox, fowlpox, and canarypox). Examples of retroviruses include avian leukemia-sarcoma virus, human T-lymphotrophic virus type 1 (HTLV-1), bovine leukemia virus (BLV), lentivirus, and spumavirus. Other viruses include, for example, Norwalk virus, togavirus, flavivirus, reoviruses, papovavirus, hepadnavirus, and

- 42 046157 гепатита. Вирусные векторы можно разделить на две группы в зависимости от их способности интегрироваться в геном хозяина - интегрирующиеся и неинтегрирующиеся. Онкоретровирусы и лентивирусы могут интегрироваться в хроматин клетки-хозяина, в то время как аденовирусы, аденоассоциированные вирусы и вирусы герпеса преимущественно сохраняются в ядре клетки в виде внехромосомных эписом.- 42 046157 hepatitis. Viral vectors can be divided into two groups depending on their ability to integrate into the host genome - integrating and non-integrating. Oncoretroviruses and lentiviruses can integrate into the chromatin of the host cell, while adenoviruses, adeno-associated viruses, and herpes viruses are predominantly retained in the cell nucleus as extrachromosomal episomes.

Согласно определенным вариантам осуществления подходящий вирусный вектор представляет собой ретровирусный вектор. Ретровирусы относятся к вирусам семейства Retroviridae. Примеры ретровирусов включают в себя онкоретровирусы, такие как вирус лейкемии мышей (MLV), и лентивирусы, такие как вирус иммунодефицита человека 1 (HIV-1). Ретровирусные геномы представляют собой одноцепочечные (оц) РНК и содержат различные гены, которые могут быть в цис- или транс-форме. Например, ретровирусный геном может содержать цис-действующие последовательности, такие как два длинных концевых повтора (LTR), с элементами для экспрессии генов, обратной транскрипции и интеграции в хромосомы хозяина. Другие компоненты включают в себя сигнал упаковки (psi или Ψ) для специфической упаковки РНК во вновь образованные вирионы и полипуриновый тракт (PPT), место инициации синтеза положительно-полярной нити ДНК во время обратной транскрипции. Кроме того, ретровирусный геном может содержать гены gag, pol и env. Ген gag кодирует структурные белки, ген pol кодирует ферменты, которые сопровождают оцРНК и осуществляют обратную транскрипцию вирусной РНК в ДНК, а ген env кодирует вирусную оболочку. Как правило, gag, pol и env предоставляются в транс для вирусной репликации и упаковки.In certain embodiments, a suitable viral vector is a retroviral vector. Retroviruses belong to the viruses of the Retroviridae family. Examples of retroviruses include oncoretroviruses such as murine leukemia virus (MLV) and lentiviruses such as human immunodeficiency virus 1 (HIV-1). Retroviral genomes are single-stranded (ss) RNAs and contain various genes that can be in cis or trans form. For example, a retroviral genome may contain cis-acting sequences, such as two long terminal repeats (LTRs), with elements for gene expression, reverse transcription, and integration into host chromosomes. Other components include the packaging signal (psi or Ψ) for the specific packaging of RNA into newly formed virions and the polypurine tract (PPT), the site of initiation of positive-strand DNA synthesis during reverse transcription. In addition, the retroviral genome may contain gag, pol and env genes. The gag gene encodes structural proteins, the pol gene encodes enzymes that accompany ssRNA and reverse transcription of viral RNA into DNA, and the env gene encodes the viral envelope. Typically, gag, pol, and env are provided in trans for viral replication and packaging.

Согласно определенным вариантам осуществления представленный в настоящем документе ретровирусный вектор может представлять собой лентивирусный вектор. Распознаются по меньшей мере пять серогрупп или серотипов лентивирусов. Вирусы разных серотипов могут по-разному инфицировать определенные типы клеток и/или хозяев. Лентивирусы, например, включают в себя ретровирусы приматов и ретровирусы неприматов. Ретровирусы приматов включают в себя HIV и вирус иммунодефицита обезьян (SIV). Ретровирусы неприматов включают в себя вирус иммунодефицита кошек (FIV), вирус иммунодефицита крупного рогатого скота (BIV), вирус артрита-энцефалита коз (CAEV), вирус инфекционной анемии лошадей (EIAV) и виснавирус. Лентивирусы или лентивекторы могут быть способны трансдуцировать покоящиеся клетки. Как и в случае онкоретровирусных векторов, конструкция лентивекторов может быть основана на разделении цис- и транс-действующих последовательностей.In certain embodiments, a retroviral vector provided herein may be a lentiviral vector. At least five serogroups or serotypes of lentiviruses are recognized. Viruses of different serotypes may infect certain types of cells and/or hosts differently. Lentiviruses, for example, include primate retroviruses and non-primate retroviruses. Primate retroviruses include HIV and simian immunodeficiency virus (SIV). Non-primate retroviruses include feline immunodeficiency virus (FIV), bovine immunodeficiency virus (BIV), caprine arthritis-encephalitis virus (CAEV), equine infectious anemia virus (EIAV), and visnavirus. Lentiviruses or lentivectors may be capable of transducing resting cells. As with oncoretroviral vectors, the design of lentivectors can be based on the separation of cis- and trans-acting sequences.

Согласно определенным вариантам осуществления в настоящей заявке представлены векторы экспрессии, которые были разработаны для доставки с помощью оптимизированного терапевтического ретровирусного вектора. Ретровирусный вектор может представлять собой лентивирус, содержащий левый (5') LTR; последовательности, которые способствуют упаковке и/или ядерному импорту вируса; промотор; необязательно, один или несколько дополнительных регуляторных элементов (таких как, например, энхансер или последовательность полиА); необязательно лентивирусный элемент обратного ответа (RRE); конструкция, содержащая селективный регуляторный элемент PV, функционально связанный с последовательностью, кодирующей eTF; необязательно инсулятор и правый (3') ретровирусный LTR.In certain embodiments, the present application provides expression vectors that have been designed for delivery using an optimized therapeutic retroviral vector. The retroviral vector may be a lentivirus containing a left-handed (5') LTR; sequences that promote packaging and/or nuclear import of the virus; promoter; optionally, one or more additional regulatory elements (such as, for example, an enhancer or polyA sequence); optionally a lentiviral reverse response element (RRE); a construct containing a PV selective regulatory element operably linked to an eTF coding sequence; optionally an insulator and a right (3') retroviral LTR.

Согласно иллюстративным вариантам осуществления представленный в настоящем документе вирусный вектор представляет собой аденоассоциированный вирус (AAV). AAV представляет собой небольшой вирус животных без оболочки, дефектной репликации, который поражает людей и некоторые другие виды приматов. Известно, что AAV вызывает заболевание человека и вызывает умеренный иммунный ответ. Векторы AAV могут также инфицировать как делящиеся, так и покоящиеся клетки, не встраиваясь в геном клетки-хозяина.In exemplary embodiments, the viral vector provided herein is an adeno-associated virus (AAV). AAV is a small, non-enveloped, replication-defective animal virus that infects humans and several other primate species. AAV is known to cause human disease and induce a mild immune response. AAV vectors can also infect both dividing and quiescent cells without integrating into the host cell genome.

Геном AAV состоит из линейной одноцепочечной ДНК длиной ~4,7 т.п.н. Геном состоит из двух открытых рамок считывания (ORF), фланкированных последовательностью инвертированного концевого повтора (ITR) длиной приблизительно 145 п.н. ITR состоит из нуклеотидной последовательности на 5'конце (5' ITR) и нуклеотидной последовательности, расположенной на 3'-конце (3' ITR), которые содержат палиндромные последовательности. ITR функционируют в цис-системе путем сворачивания с образованием T-образных шпилечных структур за счет комплементарного спаривания оснований, которые действуют как праймеры во время инициации репликации ДНК для синтеза второй цепи. Две открытые рамки считывания кодируют гены rep и cap, которые участвуют в репликации и упаковке вириона. Согласно иллюстративному варианту осуществления представленный в настоящем документе вектор AAV не содержит генов rep или cap. Такие гены могут быть представлены в транс для производства вирионов, как описано ниже.The AAV genome consists of linear single-stranded DNA ∼4.7 kb in length. The genome consists of two open reading frames (ORFs) flanked by an approximately 145-bp inverted terminal repeat (ITR) sequence. The ITR consists of a nucleotide sequence at the 5' end (5' ITR) and a nucleotide sequence located at the 3' end (3' ITR), which contain palindromic sequences. ITRs function in cis by folding to form T-shaped hairpin structures through complementary base pairing, which act as primers during the initiation of DNA replication for second-strand synthesis. Two open reading frames encode the rep and cap genes, which are involved in virion replication and packaging. In an exemplary embodiment, the AAV vector provided herein does not contain rep or cap genes. Such genes can be presented in trans to produce virions, as described below.

Согласно определенным вариантам осуществления вектор AAV может включать в себя лишнюю нуклеиновую кислоту. Согласно определенным вариантам осуществления лишняя нуклеиновая кислота может кодировать зеленый флуоресцентный белок или ген устойчивости к антибиотикам, таким как канамицин или ампициллин. Согласно определенным вариантам осуществления лишняя нуклеиновая кислота может быть расположена вне последовательностей ITR (например, по сравнению с последовательностью трансгена eTF и регуляторными последовательностями, которые расположены между 5' и 3' ITR-последовательностями).In certain embodiments, the AAV vector may include excess nucleic acid. In certain embodiments, the excess nucleic acid may encode a green fluorescent protein or an antibiotic resistance gene such as kanamycin or ampicillin. In certain embodiments, the excess nucleic acid may be located outside of the ITR sequences (eg, compared to the eTF transgene sequence and regulatory sequences that are located between the 5' and 3' ITR sequences).

Существуют различные серотипы AAV, включая в себя AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12 и AAV13. Эти серотипы различаются по своему тропизмуThere are different serotypes of AAV, including AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, and AAV13. These serotypes differ in their tropism

- 43 046157 или по типам клеток, которые они заражают. AAV могут содержать геном и капсиды из множества серотипов (например, псевдотипов). Например, AAV может содержать геном серотипа 2 (например, ITR), упакованный в капсид серотипа 5 или серотипа 9. Псевдотипы могут повышать эффективность трансдукции, а также изменять тропизм.- 43 046157 or by the types of cells they infect. AAVs may contain genomes and capsids from multiple serotypes (eg, pseudotypes). For example, AAV may contain a serotype 2 genome (eg, ITR) packaged within a serotype 5 or serotype 9 capsid. Pseudotypes may increase transduction efficiency as well as alter tropism.

В некоторых случаях предпочтителен серотип AAV, который может пересекать гематоэнцефалический барьер или инфицировать клетки ЦНС. В некоторых случаях AAV9 или его вариант используется для доставки кассеты экспрессии согласно настоящему раскрытию, содержащей селективный регуляторный элемент PV, функционально связанный с трансгеном, кодирующим eTF, который избирательно активирует SCN1A. В некоторых случаях AAV9 или его вариант используется для доставки кассеты экспрессии согласно настоящему раскрытию, содержащей селективный в отношении PV сайт связывания микроРНК. В некоторых случаях AAV9 или его вариант используется для доставки кассеты экспрессии согласно настоящему раскрытию, содержащей селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, кодирующим eTF, который селективно активирует SCN1A, и селективный в отношении PV сайт связывания микроРНК.In some cases, the AAV serotype is favored and can cross the blood-brain barrier or infect CNS cells. In some cases, AAV9 or a variant thereof is used to deliver an expression cassette of the present disclosure containing a PV selective regulatory element operably linked to a transgene encoding an eTF that selectively activates SCN1A. In some cases, AAV9 or a variant thereof is used to deliver an expression cassette of the present disclosure containing a PV-selective miRNA binding site. In some cases, AAV9 or a variant thereof is used to deliver an expression cassette of the present disclosure comprising a PV-selective regulatory element operably linked to a transgene encoding an eTF that selectively activates SCN1A and a PV-selective miRNA binding site.

Согласно иллюстративным вариантам осуществления в настоящей заявке представлены векторы экспрессии, которые были разработаны для доставки с помощью AAV. AAV может быть любого серотипа, например, AAV1, AAV2, AAV3, AAV3b, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV-DJ, или химерным, гибридным или вариантом AAV. AAV также может представлять собой самокомплементарный AAV (scAAV). Согласно определенным вариантам осуществления вектор экспрессии, разработанный для доставки с помощью AAV, содержит 5' ITR и 3' ITR. Согласно определенным вариантам осуществления вектор экспрессии, разработанный для доставки с помощью AAV, содержит 5' ITR, промотор, трансген, кодирующий eTF, и 3' ITR. Согласно определенным вариантам осуществления вектор экспрессии, разработанный для доставки с помощью AAV, содержит 5' ITR, энхансер, промотор, трансген, кодирующий eTF, последовательность полиА и 3' ITR.In exemplary embodiments, the present application provides expression vectors that have been designed for delivery by AAV. AAV can be of any serotype, for example, AAV1, AAV2, AAV3, AAV3b, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV-DJ, or a chimeric, hybrid, or variant AAV. AAV may also be a self-complementary AAV (scAAV). In certain embodiments, an expression vector designed for delivery by AAV contains a 5' ITR and a 3' ITR. In certain embodiments, an expression vector designed for delivery by AAV comprises a 5' ITR, a promoter, a transgene encoding an eTF, and a 3' ITR. In certain embodiments, an expression vector designed for delivery by AAV comprises a 5' ITR, an enhancer, a promoter, a transgene encoding an eTF, a polyA sequence, and a 3' ITR.

Клетки-хозяева.Host cells.

Согласно другому аспекту настоящее изобретение относится к клетке-хозяину, содержащей кассету экспрессии или вектор экспрессии, как раскрыто в настоящем документе. Клетки-хозяева могут представлять собой бактериальную клетку, дрожжевую клетку, клетку насекомого или клетку млекопитающего. Согласно иллюстративному варианту осуществления под клеткой-хозяином понимается любая линия клеток, которая восприимчива к заражению представляющим интерес вирусом и поддается культивированию in vitro.In another aspect, the present invention relates to a host cell containing an expression cassette or expression vector as disclosed herein. The host cell may be a bacterial cell, a yeast cell, an insect cell, or a mammalian cell. In an exemplary embodiment, a host cell is any cell line that is susceptible to infection by the virus of interest and can be cultured in vitro.

Согласно определенным вариантам осуществления предложенная в настоящем документе клеткахозяин может использоваться для целей генной терапии ex vivo. Согласно таким вариантам осуществления клетки трансфицируют молекулой нуклеиновой кислоты или вектором экспрессии, содержащим селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, которая избирательно активирует SCN1A, как описано в настоящем документе, и затем трансплантируют пациенту или субъекту. Трансплантированные клетки могут иметь аутологичное, аллогенное или гетерологичное происхождение. Для клинического применения выделение клеток, как правило, проводят в условиях надлежащей производственной практики (GMP). Перед трансплантацией, как правило, проверяется качество клеток и отсутствие микробов или других загрязнителей, и может проводиться предварительное кондиционирование, такое как облучение и/или иммуносупрессивное лечение. Кроме того, клетки-хозяева можно трансплантировать вместе с факторами роста для стимуляции пролиферации и/или дифференцировки клеток.In certain embodiments, a host cell provided herein can be used for ex vivo gene therapy purposes. In such embodiments, cells are transfected with a nucleic acid molecule or expression vector containing a PV-selective miRNA binding site and/or an eTF coding sequence that selectively activates SCN1A, as described herein, and then transplanted into a patient or subject. The transplanted cells can be of autologous, allogeneic or heterologous origin. For clinical applications, cell isolation is typically performed under good manufacturing practice (GMP) conditions. Before transplantation, cell quality and absence of microbes or other contaminants are typically checked, and preconditioning such as radiation and/or immunosuppressive treatment may be performed. In addition, host cells can be transplanted along with growth factors to stimulate cell proliferation and/or differentiation.

Согласно определенным вариантам осуществления клетка-хозяин может использоваться для генной терапии ex vivo. Предпочтительно указанные клетки представляют собой эукариотические клетки, такие как клетки млекопитающих, они включают в себя, без ограничения, людей, отличных от людей приматов, таких как обезьяны; шимпанзе; мартышки и орангутаны, домашних животных, включая в себя собак и кошек, а также домашний скот, такой как лошади, крупный рогатый скот, свиньи, овцы и козы, или другие виды млекопитающих, включая в себя, без ограничения, мышей, крыс, морских свинок, кроликов, хомяков и т.п. Специалист в настоящей области техники выберет более подходящие клетки в соответствии с пациентом или объектом трансплантации.In certain embodiments, the host cell can be used for ex vivo gene therapy. Preferably, said cells are eukaryotic cells, such as mammalian cells, these include, without limitation, humans other than human primates such as monkeys; chimpanzee; monkeys and orangutans, domestic animals, including dogs and cats, and livestock such as horses, cattle, pigs, sheep and goats, or other species of mammals, including, but not limited to, mice, rats, sea pigs, rabbits, hamsters, etc. One skilled in the art will select more appropriate cells according to the patient or transplant recipient.

Согласно определенным вариантам осуществления представленная в настоящем документе клеткахозяин может представлять собой клетку со свойствами самообновления и плюрипотентности, например, стволовые клетки или индуцированные плюрипотентные стволовые клетки. Стволовые клетки предпочтительно представляют собой мезенхимальные стволовые клетки. Мезенхимальные стволовые клетки (MSC) способны дифференцироваться по меньшей мере в один из остеобластов, хондроцитов, адипоцитов или миоцитов и могут быть выделены из любого типа ткани. Как правило, MSC выделяют из костного мозга, жировой ткани, пуповины или периферической крови. Способы их получения хорошо известны специалисту в настоящей области техники. Индуцированные плюрипотентные стволовые клетки (также известные как iPS-клетки или iPSC) представляют собой тип плюрипотентных стволовых клеток, которые могут быть получены непосредственно из взрослых клеток. Yamanaka с соавт. индуцировали iPSклетки путем переноса генов Oct3/4, Sox2, Klf4 и c-Myc в фибробласты мыши и человека и вынуждаяIn certain embodiments, a host cell provided herein may be a cell with self-renewal and pluripotency properties, such as stem cells or induced pluripotent stem cells. The stem cells are preferably mesenchymal stem cells. Mesenchymal stem cells (MSCs) are capable of differentiating into at least one of osteoblasts, chondrocytes, adipocytes or myocytes and can be isolated from any tissue type. Typically, MSCs are isolated from bone marrow, adipose tissue, umbilical cord or peripheral blood. Methods for their preparation are well known to one skilled in the art. Induced pluripotent stem cells (also known as iPS cells or iPSCs) are a type of pluripotent stem cells that can be derived directly from adult cells. Yamanaka et al. induced iPS cells by transferring the Oct3/4, Sox2, Klf4 and c-Myc genes into mouse and human fibroblasts and forcing

- 44 046157 клетки экспрессировать гены (WO 2007/069666). Thomson с соавт. впоследствии производили iPS-клетки человека с использованием Nanog и Lin28 вместо Klf4 и c-Myc (WO 2008/118820).- 44 046157 cells to express genes (WO 2007/069666). Thomson et al. subsequently generated human iPS cells using Nanog and Lin28 instead of Klf4 and c-Myc (WO 2008/118820).

Согласно иллюстративному варианту осуществления представленная в настоящем документе клетка-хозяин представляет собой упаковывающую клетку. Указанные клетки могут представлять собой прикрепленные или суспензионные клетки. Упаковывающая клетка и вспомогательный вектор или вирус, или конструкция(и) ДНК обеспечивают вместе в транс все недостающие функции, которые требуются для полной репликации и упаковки вирусного вектора.In an exemplary embodiment, the host cell provided herein is a packaging cell. These cells may be adherent or suspension cells. The packaging cell and the helper vector or virus or DNA construct(s) provide together in trans all the missing functions that are required for complete replication and packaging of the viral vector.

Предпочтительно указанные упаковывающие клетки представляют собой эукариотические клетки, такие как клетки млекопитающих, включая в себя клетки обезьян, человека, собак и грызунов. Примерами клеток человека являются клетки PER.C6 (WO01/38362), MRC-5 (ATCC CCL-171), WI-38 (ATCC CCL-75), клетки HEK-293 (ATCC CRL-1573), клетки HeLa (ATCC CCL2) и фетальные клетки легких резус (ATCC CL-160). Примерами клеток отличных от людей приматов являются клетки Vero (ATCC CCL81), клетки COS-1 (ATCC CRL-1650) или клетки COS-7 (ATCC CRL-1651). Примерами клеток собаки являются клетки MDCK (ATCC CCL-34). Примерами клеток грызунов являются клетки хомяка, такие как BHK21-F, клетки HKCC или клетки CHO.Preferably, said packaging cells are eukaryotic cells, such as mammalian cells, including monkey, human, canine and rodent cells. Examples of human cells are PER.C6 cells (WO01/38362), MRC-5 (ATCC CCL-171), WI-38 (ATCC CCL-75), HEK-293 cells (ATCC CRL-1573), HeLa cells (ATCC CCL2 ) and fetal rhesus lung cells (ATCC CL-160). Examples of non-human primate cells are Vero cells (ATCC CCL81), COS-1 cells (ATCC CRL-1650) or COS-7 cells (ATCC CRL-1651). Examples of canine cells are MDCK cells (ATCC CCL-34). Examples of rodent cells are hamster cells such as BHK21-F cells, HKCC cells or CHO cells.

В качестве альтернативы источникам млекопитающих клеточные линии для применения в настоящем изобретении могут быть получены из источников птиц, таких как курица, утка, гусь, перепел или фазан. Примеры птичьих клеточных линий включают в себя птичьи эмбриональные стволовые клетки (WO01/85938 и WO03/076601), иммортализованные клетки сетчатки утки (WO2005/042728) и клетки, полученные из птичьих эмбриональных стволовых клеток, включая в себя клетки курицы (WO2006/108846) или клетки утки, такие как клеточная линия EB66 (WO2008/129058 и WO2008/142124).As an alternative to mammalian sources, cell lines for use in the present invention can be obtained from avian sources, such as chicken, duck, goose, quail or pheasant. Examples of avian cell lines include avian embryonic stem cells (WO01/85938 and WO03/076601), immortalized duck retinal cells (WO2005/042728) and cells derived from avian embryonic stem cells, including chicken cells (WO2006/108846) or duck cells such as the EB66 cell line (WO2008/129058 and WO2008/142124).

Согласно другому варианту осуществления указанные клетки-хозяева представляют собой клетки насекомых, такие как клетки SF9 (ATCC CRL-1711), клетки Sf21 (IPLB-Sf21), клетки MG1 (BTI-TNMG1) или клетки High Five™ (BTI-TN-5B1-4).In another embodiment, said host cells are insect cells, such as SF9 cells (ATCC CRL-1711), Sf21 cells (IPLB-Sf21), MG1 cells (BTI-TNMG1) or High Five™ cells (BTI-TN-5B1 -4).

Согласно определенным вариантам осуществления представленные в настоящем документе клеткихозяева, содержащие рекомбинантный вектор/геном AAV по настоящему изобретению (например, содержащие селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, который избирательно активирует SCN1A), могут дополнительно содержать одну или несколько конструкций нуклеиновых кислот, такие как, например, (i) конструкция нуклеиновой кислоты (например, плазмида-помощник AAV), которая кодирует гены rep и cap, но не несет последовательностей ITR; и/или (ii) конструкция нуклеиновой кислоты (например, плазмида), обеспечивающая аденовирусные функции, необходимые для репликации AAV. Согласно иллюстративному варианту осуществления представленная в настоящем документе клетка-хозяин содержит: i) вектор экспрессии, содержащий селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, который избирательно активирует SCN1A, как предусмотрено в настоящем документе (т.е. рекомбинантный геном AAV); ii) конструкцию нуклеиновой кислоты, кодирующую гены rep и cap AAV, которая не несет последовательности ITR; и iii) конструкцию нуклеиновой кислоты, содержащую аденовирусные гены-помощники (как описано ниже).In certain embodiments, host cells provided herein containing a recombinant AAV vector/genome of the present invention (e.g., containing a PV-selective miRNA binding site and/or a sequence encoding an eTF that selectively activates SCN1A) may further comprise one or more nucleic acid constructs, such as, for example, (i) a nucleic acid construct (eg, an AAV helper plasmid) that encodes the rep and cap genes but does not carry ITR sequences; and/or (ii) a nucleic acid construct (eg, a plasmid) providing the adenoviral functions required for AAV replication. In an exemplary embodiment, a host cell provided herein comprises: i) an expression vector comprising a PV-selective miRNA binding site and/or a sequence encoding an eTF that selectively activates SCN1A as provided herein (i.e., recombinant AAV genome); ii) a nucleic acid construct encoding the AAV rep and cap genes that does not carry an ITR sequence; and iii) a nucleic acid construct containing adenoviral helper genes (as described below).

Согласно определенным вариантам осуществления гены-помощники rep, cap и аденовируса могут быть объединены в одной плазмиде (Blouin V et al. J Gene Med. 2004; 6(suppl): S223-S228; Grimm D. et al. Hum. Gene Ther. 2003; 7: 839-850). Таким образом, согласно другому иллюстративному варианту осуществления представленная в настоящем документе клетка-хозяин содержит: i) вектор экспрессии, содержащий селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, которая избирательно активирует SCN1A, как раскрыто в настоящем документе (т.е. рекомбинантный геном AAV); и ii) плазмиду, кодирующую гены rep и cap AAV, которая не несет последовательности ITR и дополнительно содержит гены-помощники аденовирусов.In certain embodiments, rep, cap, and adenovirus helper genes can be combined in a single plasmid (Blouin V et al. J Gene Med. 2004; 6(suppl): S223-S228; Grimm D. et al. Hum. Gene Ther. 2003;7:839-850). Thus, in another exemplary embodiment, a host cell provided herein comprises: i) an expression vector comprising a PV-selective miRNA binding site and/or an eTF coding sequence that selectively activates SCN1A as disclosed herein (i.e. i.e. recombinant AAV genome); and ii) a plasmid encoding the rep and cap genes of AAV, which does not carry the ITR sequence and additionally contains adenovirus helper genes.

Согласно другому варианту осуществления представленная в настоящем документе клетка-хозяин содержит: a) вектор экспрессии, содержащий селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, которая избирательно активирует SCN1A, как описано в настоящем документе (т.е. геном рекомбинантного AAV); b) плазмиду, кодирующую гены rep и cap AAV, которая не несет последовательности ITR; и c) плазмиду, содержащую аденовирусные РНК геновпомощников E2a, E4 и VA; причем котрансфекция выполняется в клетках, предпочтительно в клетках млекопитающих, которые конститутивно экспрессируют и характеризуются транскомплементацией к аденовирусному гену E1, как клетки HEK-293 (ATCC CRL-1573).In another embodiment, a host cell provided herein comprises: a) an expression vector containing a PV-selective miRNA binding site and/or a sequence encoding an eTF that selectively activates SCN1A as described herein (i.e., a genome recombinant AAV); b) a plasmid encoding the rep and cap genes of AAV, which does not carry the ITR sequence; and c) a plasmid containing adenoviral RNA helper genes E2a, E4 and VA; wherein the cotransfection is performed in cells, preferably mammalian cells, that constitutively express and are transcomplemented to the adenoviral E1 gene, such as HEK-293 cells (ATCC CRL-1573).

Согласно определенным вариантам осуществления клетка-хозяин, подходящая для крупномасштабного производства векторов AAV, представляет собой клетки насекомых, которые можно инфицировать комбинацией рекомбинантных бакуловирусов (Urabe et al. Hum. Gene Ther. 2002; 13: 1935-1943). Например, клетки SF9 могут быть совместно инфицированы тремя бакуловирусными векторами, соответственно экспрессирующими rep AAV, cap AAV и упаковываемый вектор AAV. Рекомбинантные бакуловирусные векторы будут обеспечивать функции вирусного гена-помощника, необходимые для репликации и/или упаковки вируса.In certain embodiments, a host cell suitable for large-scale production of AAV vectors is insect cells that can be infected with a combination of recombinant baculoviruses (Urabe et al. Hum. Gene Ther. 2002; 13: 1935-1943). For example, SF9 cells can be co-infected with three baculovirus vectors, respectively expressing AAV rep, AAV cap and AAV packaging vector. Recombinant baculovirus vectors will provide viral helper gene functions necessary for viral replication and/or packaging.

Дополнительное руководство по конструированию и производству вирионов для генной терапииAdditional guidance on the design and production of virions for gene therapy

- 45 046157 согласно настоящему изобретению можно найти в: Viral Vectors for Gene Therapy, Methods and Protocols. Series: Methods in Molecular Biology, Vol. 737. Merten and Al-Rubeai (Eds.); 2011 Humana Press (Springer); Gene Therapy. M. Giacca. 2010 Springer-Verlag; Heilbronn R. and Weger S. Viral Vectors for Gene Transfer: Current Status of Gene Therapeutics. In: Drug Delivery, Handbook of Experimental Pharmacology 197; M. Schafer-Korting (Ed.). 2010 Springer-Verlag; pp. 143-170; Adeno-Associated Virus: Methods and Protocols. R. O. Snyder and P. Moulllier (Eds). 2011 Humana Press (Springer); Bunning H. et al. Recent developments in adeno-associated virus technology. J. Gene Med. 2008; 10:717-733 и Adenovirus: Methods and Protocols. M. Chillon and A. Bosch (Eds.); Third. Edition. 2014 Humana Press (Springer).- 45 046157 according to the present invention can be found in: Viral Vectors for Gene Therapy, Methods and Protocols. Series: Methods in Molecular Biology, Vol. 737. Merten and Al-Rubeai (Eds.); 2011 Humana Press (Springer); Gene Therapy. M. Giacca. 2010 Springer-Verlag; Heilbronn R. and Weger S. Viral Vectors for Gene Transfer: Current Status of Gene Therapeutics. In: Drug Delivery, Handbook of Experimental Pharmacology 197; M. Schafer-Korting (Ed.). 2010 Springer-Verlag; pp. 143-170; Adeno-Associated Virus: Methods and Protocols. R. O. Snyder and P. Moullier (Eds). 2011 Humana Press (Springer); Bunning H. et al. Recent developments in adeno-associated virus technology. J. Gene Med. 2008; 10:717-733 and Adenovirus: Methods and Protocols. M. Chillon and A. Bosch (Eds.); Third. Edition. 2014 Humana Press (Springer).

Вирионы и способы получения вирионов.Virions and methods for obtaining virions.

Согласно определенным вариантам осуществления в настоящей заявке представлены вирусные частицы, содержащие вирусный вектор, содержащий селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе. Термины вирусная частица и вирион используются в настоящем документе взаимозаменяемо и относятся к инфекционной и, как правило, дефектной по репликации вирусной частице, содержащей вирусный геном (например, вектор вирусной экспрессии), упакованный внутри капсида, и, в зависимости от случая, например, для ретровирусов - липидную оболочку, окружающую капсид. Капсид относится к структуре, в которую упакован вирусный геном. Капсид состоит из нескольких олигомерных структурных субъединиц, состоящих из белков. Например, у AAV есть икосаэдрический капсид, образованный взаимодействием трех капсидных белков: VP1, VP2 и VP3. Согласно одному варианту осуществления представленный в настоящем документе вирион представляет собой рекомбинантный вирион AAV или вирион rAAV, полученный путем упаковки вектора AAV, содержащего селективный в отношении PV регуляторный элемент и селективный в отношении PV сайт связывания микроРНК. Согласно другому варианту осуществления представленный в настоящем документе вирион представляет собой рекомбинантный вирион AAV или вирион rAAV, полученный путем упаковки вектора AAV, содержащего селективный в отношении PV регуляторный элемент, функционально связанный с последовательностью, кодирующей eTF, которая избирательно активирует SCN1A, как описано в настоящем документе, в белковой оболочке. Согласно другому варианту осуществления представленный в настоящем документе вирион представляет собой рекомбинантный вирион AAV или вирион rAAV, полученный путем упаковки вектора AAV, содержащего селективный в отношении PV регуляторный элемент, функционально связанный с последовательностью, кодирующей eTF, которая избирательно активирует SCN1A, как описано в настоящем документе, и селективный в отношении PV сайт связывания микроРНК в белковой оболочке.In certain embodiments, the present application provides viral particles comprising a viral vector comprising a PV-selective miRNA binding site and/or a sequence encoding an eTF that selectively activates SCN1A, as disclosed herein. The terms viral particle and virion are used interchangeably herein and refer to an infectious and typically replication-defective viral particle containing a viral genome (e.g., a viral expression vector) packaged within a capsid and, as appropriate, e.g. retroviruses - a lipid membrane surrounding the capsid. Capsid refers to the structure in which the viral genome is packaged. The capsid consists of several oligomeric structural subunits consisting of proteins. For example, AAV has an icosahedral capsid formed by the interaction of three capsid proteins: VP1, VP2, and VP3. In one embodiment, the virion provided herein is a recombinant AAV virion or rAAV virion produced by packaging an AAV vector containing a PV-selective regulatory element and a PV-selective miRNA binding site. In another embodiment, the virion provided herein is a recombinant AAV virion or rAAV virion produced by packaging an AAV vector containing a PV-selective regulatory element operably linked to an eTF coding sequence that selectively activates SCN1A, as described herein , in a protein shell. In another embodiment, the virion provided herein is a recombinant AAV virion or rAAV virion produced by packaging an AAV vector containing a PV-selective regulatory element operably linked to an eTF coding sequence that selectively activates SCN1A, as described herein , and a PV-selective miRNA binding site in the protein shell.

Согласно определенным вариантам осуществления представленный в настоящем документе рекомбинантный вирион AAV может быть получен путем инкапсидации генома AAV, полученного из определенного серотипа AAV, в вирусную частицу, образованную природными белками Cap, соответствующими AAV того же конкретного серотипа. Согласно другим вариантам осуществления представленная в настоящем документе вирусная частица AAV содержит вирусный вектор, содержащий ITR данного серотипа AAV, упакованный в белки из другого серотипа. Смотрите, например, Bunning H et al. J Gene Med 2008; 10: 717-733. Например, вирусный вектор, имеющий ITR из данного серотипа AAV, может быть упакован в: a) вирусную частицу, состоящую из капсидных белков, полученных из того же или другого серотипа AAV (например, ITR AAV2 и капсидных белков AAV9; ITR AAV2 и капсидных белков AAV8 и т.п.); b) мозаичную вирусную частицу, состоящую из смеси капсидных белков из различных серотипов или мутантов AAV (например, ITR AAV2 с капсидными белками AAV1 и AAV9); c) химерную вирусную частицу, состоящую из капсидных белков, которые были усечены перестановкой доменов между различными серотипами или вариантами AAV (например, ITR AAV2 с белками капсида AAV8 с доменами AAV9); или d) нацеленную вирусную частицу, сконструированную для отображения селективных связывающих доменов, обеспечивающих строгое взаимодействие со специфическими рецепторами целевой клетки (например, ITR AAV5 с капсидными белками AAV9, генетически усеченными путем вставки пептидного лиганда; или капсидные белки AAV9, не модифицированные генетически путем связывания пептидного лиганда на поверхности капсида).In certain embodiments, a recombinant AAV virion provided herein can be produced by encapsidating an AAV genome derived from a specific AAV serotype into a viral particle formed by naturally occurring Cap proteins corresponding to AAVs of the same specific serotype. In other embodiments, an AAV viral particle provided herein comprises a viral vector containing the ITR of a given AAV serotype packaged into proteins from a different serotype. See for example Bunning H et al. J Gene Med 2008; 10: 717-733. For example, a viral vector having an ITR from a given AAV serotype can be packaged into: a) a viral particle consisting of capsid proteins derived from the same or a different AAV serotype (e.g., AAV2 ITR and AAV9 capsid proteins; AAV2 ITR and capsid proteins AAV8, etc.); b) a mosaic viral particle consisting of a mixture of capsid proteins from different AAV serotypes or mutants (eg, ITR AAV2 with capsid proteins AAV1 and AAV9); c) a chimeric viral particle consisting of capsid proteins that have been truncated by domain shuffling between different AAV serotypes or variants (eg, AAV2 ITR with AAV8 capsid proteins with AAV9 domains); or d) a targeted viral particle designed to display selective binding domains that ensure strict interaction with specific target cell receptors (e.g., AAV5 ITR with AAV9 capsid proteins genetically truncated by insertion of a peptide ligand; or AAV9 capsid proteins not genetically modified by binding a peptide ligand on the surface of the capsid).

Квалифицированному специалисту будет понятно, что представленный в настоящем документе вирион AAV может содержать капсидные белки любого серотипа AAV. Согласно одному варианту осуществления вирусная частица содержит капсидные белки из серотипа AAV, выбранного из группы, состоящей из AAV1, AAV2, AAV5, AAV8 и AAV9, которые более подходят для доставки в ЦНС (M. Hocquemiller et al., Hum Gene Ther 27(7): 478-496 (2016)). Согласно конкретному варианту осуществления вирусная частица содержит кассету экспрессии по настоящему изобретению, в которой последовательности 5'ITR и 3'ITR кассеты экспрессии относятся к серотипу AAV2, а белки капсида относятся к серотипу AAV9.One of ordinary skill in the art will appreciate that the AAV virion provided herein may contain capsid proteins of any AAV serotype. In one embodiment, the viral particle contains capsid proteins from an AAV serotype selected from the group consisting of AAV1, AAV2, AAV5, AAV8 and AAV9, which are more suitable for delivery to the CNS (M. Hocquemiller et al., Hum Gene Ther 27(7 ): 478-496 (2016)). In a specific embodiment, the viral particle comprises an expression cassette of the present invention, wherein the 5'ITR and 3'ITR sequences of the expression cassette are serotype AAV2 and the capsid proteins are serotype AAV9.

В настоящей области техники известны многочисленные способы получения вирионов rAAV, включая в себя трансфекцию, получение стабильных клеточных линий и системы производства инфекционных гибридных вирусов, которые включают в себя гибриды аденовирус-AAV, гибриды герпесвирус-AAV (Conway, J E et al., (1997) J. Virology 71(11):8780-8789) и гибриды бакуловирус-AAV. Все кульNumerous methods for producing rAAV virions are known in the art, including transfection, production of stable cell lines, and infectious hybrid virus production systems that include adenovirus-AAV hybrids, herpesvirus-AAV hybrids (Conway, J E et al., (1997) ) J. Virology 71(11):8780–8789) and baculovirus-AAV hybrids. Everything is cool

- 46 046157 туры производства rAAV для производства вирусных частиц rAAV требуют: 1) подходящие клеткихозяева, включая в себя, например, клеточные линии человеческого происхождения, такие как клетки HeLa, A549 или 293, или клеточные линии, полученные из насекомых, такие как SF-9, в случае систем производства бакуловирусов; 2) подходящей функции вируса-помощника, обеспечиваемой аденовирусом дикого типа или мутантным аденовирусом (таким как чувствительный к температуре аденовирус), вирусом герпеса, бакуловирусом или плазмидной конструкцией, обеспечивающей вспомогательные функции; 3) гены rep и cap AAV и генные продукты; 4) трансген (например, содержащий один или несколько из: селективный в отношении PV сайт связывания микроРНК, последовательность, кодирующую eTF, которая избирательно активирует SCN1A, как описано в настоящем документе, и/или селективный в отношении PV промотор), фланкированный последовательностями ITR AAV; и 5) подходящие носители и компоненты среды для поддержки производства rAAV.- 46 046157 rAAV production rounds for the production of rAAV viral particles require: 1) suitable host cells, including, for example, cell lines of human origin, such as HeLa, A549 or 293 cells, or cell lines derived from insects, such as SF- 9, in the case of baculovirus production systems; 2) a suitable helper virus function provided by a wild-type or mutant adenovirus (such as a temperature-sensitive adenovirus), a herpes virus, a baculovirus, or a plasmid construct providing helper functions; 3) AAV rep and cap genes and gene products; 4) a transgene (eg, containing one or more of: a PV-selective microRNA binding site, a sequence encoding an eTF that selectively activates SCN1A as described herein, and/or a PV-selective promoter) flanked by AAV ITR sequences ; and 5) suitable media and media components to support rAAV production.

Согласно различным вариантам осуществления описанные в настоящем документе клетки-хозяева содержат следующие три компонента: (1) ген rep и ген cap, (2) гены, обеспечивающие вспомогательные функции, и (3) трансген (например, содержащий один или несколько из: селективного в отношении PV сайта связывания микроРНК, последовательности, кодирующей eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективного в отношении PV промотора), фланкированных ITR. Ген rep AAV, ген cap AAV и гены, обеспечивающие вспомогательные функции, могут быть введены в клетку путем включения указанных генов в вектор, такой как, например, плазмида, и введения указанного вектора в клетку-хозяина. Гены rep, cap и гены, обеспечивающие вспомогательные функции, могут быть включены в одну и ту же плазмиду или в разные плазмиды. Согласно предпочтительному варианту осуществления гены rep и cap AAV включены в одну плазмиду, а гены, обеспечивающие вспомогательные функции, включены в другую плазмиду. Различные плазмиды для создания клетки-хозяина для производства вирионов (например, содержащие гены rep и cap AAV, вспомогательных функций или трансген) могут быть введены в клетку с использованием любого подходящего способа, хорошо известного в настоящей области техники. Примеры способов трансфекции включают в себя, без ограничения, соосаждение с фосфатом кальция, DEAE-декстраном, полибреном, электропорацию, микроинъекцию, опосредованное липосомами слияние, липофекцию, ретровирусную инфекцию и биолистическую трансфекцию. Согласно определенным вариантам осуществления плазмиды, обеспечивающие гены rep и cap, вспомогательные функции и трансген, фланкированный ITR, могут быть введены в клетку одновременно. Согласно другому варианту осуществления плазмиды, обеспечивающие гены rep и cap и вспомогательные функции, могут быть введены в клетку до или после введения плазмиды, содержащей трансген. Согласно иллюстративному варианту осуществления клетки трансфицируют одновременно тремя плазмидами (например, способом тройной трансфекции): (1) плазмидой, содержащей трансген (например, содержащей один или несколько из: селективного в отношении PV сайта связывания микроРНК, последовательности, кодирующей eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективного в отношении PV промотора), фланкированного ITR, (2) плазмидой, содержащей гены rep и cap AAV, и (3) плазмидой, содержащей гены, обеспечивающие вспомогательные функции. Иллюстративные клетки-хозяева могут представлять собой клетки 293, A549 или HeLa.In various embodiments, the host cells described herein contain the following three components: (1) a rep gene and a cap gene, (2) genes providing accessory functions, and (3) a transgene (for example, containing one or more of: a selective regarding a PV miRNA binding site, a sequence encoding an eTF that selectively activates SCN1A as described herein, and/or a PV-selective promoter) flanked by the ITR. The AAV rep gene, the AAV cap gene, and genes providing accessory functions can be introduced into a cell by incorporating the genes into a vector, such as a plasmid, and introducing the vector into a host cell. The rep, cap, and accessory function genes may be included in the same plasmid or in different plasmids. In a preferred embodiment, the AAV rep and cap genes are included on one plasmid, and the genes providing accessory functions are included on another plasmid. Various plasmids to create a host cell for virion production (eg, containing AAV rep and cap genes, accessory functions, or a transgene) can be introduced into the cell using any suitable method well known in the art. Examples of transfection methods include, but are not limited to, coprecipitation with calcium phosphate, DEAE-dextran, polybrene, electroporation, microinjection, liposome-mediated fusion, lipofection, retroviral infection, and biolistic transfection. In certain embodiments, plasmids providing rep and cap genes, accessory functions, and an ITR-flanked transgene can be introduced into a cell simultaneously. In another embodiment, plasmids providing rep and cap genes and accessory functions can be introduced into the cell before or after introduction of the plasmid containing the transgene. In an exemplary embodiment, cells are simultaneously transfected with three plasmids (e.g., in a triple transfection manner): (1) a plasmid containing a transgene (e.g., containing one or more of: a PV-selective microRNA binding site, a sequence encoding an eTF that selectively activates SCN1A , as described herein, and/or a PV-selective promoter) flanked by an ITR, (2) a plasmid containing the AAV rep and cap genes, and (3) a plasmid containing genes providing accessory functions. Exemplary host cells may be 293, A549, or HeLa cells.

Согласно другим вариантам осуществления один или несколько из (1) генов rep и cap AAV, (2) генов, обеспечивающих вспомогательные функции, и (3) трансгена (например, содержащего один или несколько из: селективного в отношении PV сайта связывания микроРНК, последовательности, кодирующей eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективного в отношении PV промотора), фланкированного ITR, может переноситься упаковывающей клеткой либо эписомально, либо интегрироваться в геном упаковывающей клетки. Согласно одному варианту осуществления клетки-хозяева могут представлять собой упаковывающие клетки, в которых гены rep и cap AAV и гены, обеспечивающие вспомогательные функции, стабильно поддерживаются в клеткехозяине, и клетка-хозяин временно трансфицируется плазмидой, содержащей трансген (например, содержащей один или несколько из: селективного в отношении PV сайта связывания микроРНК, последовательности, кодирующей eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективного в отношении PV промотора), фланкированный ITR. Согласно другому варианту осуществления клетки-хозяева представляют собой упаковывающие клетки, в которых гены rep и cap AAV стабильно поддерживаются в клетке-хозяине, и клетка-хозяин временно трансфицируется плазмидой, содержащей трансген (например, содержащей один или несколько из следующего: селективный в отношении PV сайт связывания микроРНК, последовательность, кодирующая eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективный в отношении PV промотор), фланкированный ITR и плазмидой, содержащей вспомогательные функции. Согласно другому варианту осуществления клетки-хозяева могут представлять собой упаковывающие клетки, в которых вспомогательные функции стабильно поддерживаются в клетке-хозяине, и клетка-хозяин временно трансфицируется плазмидой, содержащей трансген (например, содержащий один или несколько из следующего: селективный в отношении PV сайт связывания микроРНК, последовательность, кодирующая eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективныйIn other embodiments, one or more of (1) the AAV rep and cap genes, (2) genes providing accessory functions, and (3) a transgene (e.g., comprising one or more of: a PV-selective miRNA binding site, a sequence, encoding an eTF that selectively activates SCN1A as described herein and/or a PV-selective promoter) flanked by an ITR can be carried by the packaging cell either episomally or integrated into the genome of the packaging cell. In one embodiment, the host cells may be packaging cells in which the AAV rep and cap genes and genes providing accessory functions are stably maintained in the host cell, and the host cell is transiently transfected with a plasmid containing the transgene (e.g., containing one or more of : a PV-selective miRNA binding site, a sequence encoding an eTF that selectively activates SCN1A as described herein, and/or a PV-selective promoter) flanked by an ITR. In another embodiment, the host cells are packaging cells in which the AAV rep and cap genes are stably maintained in the host cell, and the host cell is transiently transfected with a plasmid containing the transgene (e.g., containing one or more of the following: PV-selective a microRNA binding site, a sequence encoding an eTF that selectively activates SCN1A as described herein, and/or a PV-selective promoter) flanked by an ITR and a plasmid containing accessory functions. In another embodiment, the host cells may be packaging cells in which accessory functions are stably maintained in the host cell, and the host cell is transiently transfected with a plasmid containing a transgene (e.g., containing one or more of the following: a PV-selective binding site miRNA, sequence encoding an eTF that selectively activates SCN1A, as described herein, and/or selective

- 47 046157 в отношении PV промотор), фланкированный ITR, и плазмидой, содержащей гены rep и cap. Согласно другому варианту осуществления клетки-хозяева могут представлять собой клеточные линиипродуценты, которые стабильно трансфицируются генами rep и cap, генами, обеспечивающими вспомогательные функции, и последовательностью трансгена (например, содержащего одно или несколько из следующего: селективный в отношении PV сайт связывания микроРНК, последовательность, кодирующая eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективный в отношении PV промотор), фланкированного ITR. Иллюстративные упаковывающие клетки и клетки-продуценты могут происходить из клеток 293, A549 или HeLa.- 47 046157 in relation to the PV promoter), flanked by ITR, and a plasmid containing the rep and cap genes. In another embodiment, the host cells may be producer cell lines that are stably transfected with rep and cap genes, genes providing accessory functions, and a transgene sequence (e.g., containing one or more of the following: a PV-selective miRNA binding site, a sequence encoding an eTF that selectively activates SCN1A, as described herein, and/or a PV-selective promoter) flanked by an ITR. Exemplary packaging and production cells may be derived from 293, A549, or HeLa cells.

Согласно другому варианту осуществления линия клеток-продуцентов представляет собой линию клеток насекомых (как правило, клетки Sf9), которые инфицированы векторами экспрессии бакуловируса, которые обеспечивают белки Rep и Cap. Для этой системы не требуются гены-помощники аденовируса (Ayuso E, et al., Curr. Gene Ther. 2010, 10:423-436).In another embodiment, the producer cell line is an insect cell line (typically Sf9 cells) that is infected with baculovirus expression vectors that provide Rep and Cap proteins. This system does not require adenovirus helper genes (Ayuso E, et al., Curr. Gene Ther. 2010, 10:423-436).

Используемый в настоящем документе термин белок cap относится к полипептиду, обладающему по меньшей мере одной функциональной активностью нативного белка cap AAV (например, VP1, VP2, VP3). Примеры функциональной активности белков cap включают в себя способность индуцировать образование капсида, способствовать накоплению одноцепочечной ДНК, облегчать упаковку ДНК AAV в капсиды (т.е. инкапсидацию), связываться с клеточными рецепторами и облегчать проникновение вириона в клетки-хозяева. В принципе, в контексте настоящего изобретения можно использовать любой белок Cap.As used herein, the term cap protein refers to a polypeptide having at least one functional activity of the native AAV cap protein (eg, VP1, VP2, VP3). Examples of the functional activities of cap proteins include the ability to induce capsid formation, promote the accumulation of single-stranded DNA, facilitate packaging of AAV DNA into capsids (ie, encapsidation), bind to cellular receptors, and facilitate virion entry into host cells. In principle, any Cap protein can be used in the context of the present invention.

Сообщалось, что белки cap влияют на тропизм хозяина, специфичность клеток, тканей или органов, использование рецепторов, эффективность заражения и иммуногенность вирусов AAV. Соответственно, cap AAV для применения в rAAV может быть выбран с учетом, например, вида субъекта (например, человека или не человека), иммунологического состояния субъекта, его пригодности для длительного или краткосрочного лечения или конкретного терапевтического применения (например, лечение конкретного заболевания или нарушения или доставка в определенные клетки, ткани или органы). Согласно определенным вариантам осуществления белок cap происходит из группы AAV, состоящей из серотипов AAV1, AAV2, AAV5, AAV8 и AAV9. Согласно иллюстративному варианту осуществления белок cap происходит из AAV9.Cap proteins have been reported to influence host tropism, cell, tissue, or organ specificity, receptor utilization, infection efficiency, and immunogenicity of AAVs. Accordingly, the AAV cap for use in rAAV may be selected based on, for example, the species of the subject (eg, human or non-human), the immunological condition of the subject, its suitability for long-term or short-term treatment, or the particular therapeutic use (eg, treatment of a particular disease or disorder or delivery to specific cells, tissues or organs). In certain embodiments, the cap protein is from the AAV group consisting of serotypes AAV1, AAV2, AAV5, AAV8, and AAV9. In an exemplary embodiment, the cap protein is derived from AAV9.

Согласно некоторым вариантам осуществления cap AAV для применения в способе по настоящему изобретению может быть получен путем мутагенеза (т.е. путем вставок, делеций или замен) одного из вышеупомянутых cap AAV или кодирующей его нуклеиновой кислоты. Согласно определенным вариантам осуществления cap AAV по меньшей мере на 70%, 75%, 80%, 85%, 90%, 95%, 98% или 99% или более аналогичен одному или нескольким из вышеупомянутых cap AAV.In some embodiments, a cap AAV for use in a method of the present invention can be produced by mutagenesis (ie, insertions, deletions, or substitutions) of one of the above cap AAVs or the nucleic acid encoding it. In certain embodiments, the cap AAV is at least 70%, 75%, 80%, 85%, 90%, 95%, 98%, or 99% or more similar to one or more of the aforementioned cap AAV.

Согласно некоторым вариантам осуществления cap AAV является химерным и содержит домены из двух, трех, четырех или более из вышеупомянутых cap AAV. Согласно определенным вариантам осуществления cap AAV представляет собой мозаику мономеров VP1, VP2 и VP3, происходящих из двух или трех различных AAV или рекомбинантного AAV. Согласно определенным вариантам осуществления композиция rAAV содержит более одного из вышеупомянутых cap.In some embodiments, cap AAV is chimeric and contains domains from two, three, four, or more of the above cap AAVs. In certain embodiments, cap AAV is a mosaic of VP1, VP2, and VP3 monomers derived from two or three different AAVs or recombinant AAV. In certain embodiments, the rAAV composition contains more than one of the above-mentioned caps.

Согласно некоторым вариантам осуществления cap AAV для применения в вирионе rAAV сконструирован таким образом, чтобы он содержал гетерологичную последовательность или другую модификацию. Например, последовательность пептида или белка, обеспечивающая избирательное нацеливание или уклонение от иммунитета, может быть преобразована в белок cap. В качестве альтернативы или в дополнение, cap может быть химически модифицирован так, чтобы поверхность rAAV была полиэтиленгликолированной (т.е. пегилированной), что может способствовать уклонению от иммунитета. Белок cap также может быть мутагенизирован (например, для удаления его естественного связывания с рецептором или для маскировки иммуногенного эпитопа).In some embodiments, the AAV cap for use in an rAAV virion is designed to contain a heterologous sequence or other modification. For example, a peptide or protein sequence that provides selective targeting or immune evasion can be converted into a cap protein. Alternatively or in addition, cap can be chemically modified so that the surface of rAAV is polyethylene glycolated (i.e., PEGylated), which may facilitate immune evasion. The cap protein can also be mutagenized (eg, to remove its natural receptor binding or to mask an immunogenic epitope).

Используемый в настоящем документе термин белок rep относится к полипептиду, обладающему по меньшей мере одной функциональной активностью нативного белка rep AAV (например, rep 40, 52, 68, 78). Примеры функциональной активности белка rep включают в себя любую активность, связанную с физиологической функцией белка, включая в себя облегчение репликации ДНК посредством распознавания, связывания и отсечения ориджина AAV репликации ДНК, а также активности ДНК-геликазы. Дополнительные функции включают в себя модуляцию транскрипции с промоторов AAV (или других гетерологичных) и сайт-специфическую интеграцию ДНК AAV в хромосому хозяина. Согласно конкретному варианту осуществления гены rep AAV могут происходить из серотипов AAV1, AAV2, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 или AAVrh10; более предпочтительно из серотипа AAV, выбранного из группы, состоящей из AAV1, AAV2, AAV5, AAV8 и AAV9.As used herein, the term rep protein refers to a polypeptide having at least one of the functional activities of the native AAV rep protein (eg, rep 40, 52, 68, 78). Examples of the functional activity of rep protein include any activity associated with the physiological function of the protein, including facilitating DNA replication by recognizing, binding and terminating the AAV origin of DNA replication, as well as DNA helicase activity. Additional functions include modulation of transcription from AAV (or other heterologous) promoters and site-specific integration of AAV DNA into the host chromosome. In a specific embodiment, the AAV rep genes may be from serotypes AAV1, AAV2, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, or AAVrh10; more preferably from an AAV serotype selected from the group consisting of AAV1, AAV2, AAV5, AAV8 and AAV9.

Согласно определенным вариантам осуществления белок rep AAV для применения в способе по настоящему изобретению может быть получен путем мутагенеза (т.е. путем вставок, делеций или замен) одного из вышеупомянутых rep AAV или его кодирующей нуклеиновой кислоты. Согласно определенным вариантам осуществления rep AAV по меньшей мере на 70%, 75%, 80%, 85%, 90%, 95%, 98% или 99% или более аналогичен одному или нескольким из вышеупомянутых rep AAV.In certain embodiments, the rep AAV protein for use in the method of the present invention can be obtained by mutagenesis (ie, insertions, deletions, or substitutions) of one of the above rep AAVs or its encoding nucleic acid. In certain embodiments, the rep AAV is at least 70%, 75%, 80%, 85%, 90%, 95%, 98%, or 99% or more similar to one or more of the above rep AAVs.

Использованные в настоящем документе выражения вспомогательные функции или геныThe expressions used herein for auxiliary functions or genes

- 48 046157 помощники относятся к вирусным белкам, репликация которых зависит от AAV. Вспомогательные функции включают в себя те белки, которые необходимы для репликации AAV, включая в себя, без ограничения, те белки, которые участвуют в активации транскрипции гена AAV, стадиеспецифическом сплайсинге мРНК AAV, репликации ДНК AAV, синтезе продуктов экспрессии cap и сборке капсида AAV. Вспомогательные функции на основе вирусов могут быть получены из любого из известных вспомогательных вирусов, таких как аденовирус, вирус герпеса (кроме вируса простого герпеса типа 1) и вирус осповакцины. Вспомогательные функции включают в себя, без ограничения, аденовирус E1, E2a, VA и E4 или герпесвирус UL5, ULB, UL52 и UL29 и герпесвирусную полимеразу. Согласно предпочтительному варианту осуществления белки, от которых зависит репликация AAV, происходят от аденовируса.- 48 046157 helpers refer to viral proteins whose replication depends on AAV. Accessory functions include those proteins that are required for AAV replication, including, but not limited to, those proteins that are involved in AAV gene transcription activation, stage-specific AAV mRNA splicing, AAV DNA replication, synthesis of cap expression products, and AAV capsid assembly. Virus-based helper functions can be derived from any of the known helper viruses, such as adenovirus, herpes virus (other than herpes simplex virus type 1), and vaccinia virus. Accessory functions include, but are not limited to, adenovirus E1, E2a, VA and E4 or herpesvirus UL5, ULB, UL52 and UL29 and herpesvirus polymerase. In a preferred embodiment, the proteins on which AAV replication depends are derived from the adenovirus.

Согласно определенным вариантам осуществления вирусный белок, репликация которого зависит от AAV, для применения в способе по настоящему изобретению может быть получен путем мутагенеза (т.е. путем вставок, делеций или замен) одного из вышеупомянутых вирусных белков или кодирующей его нуклеиновой кислоты. Согласно определенным вариантам осуществления вирусный белок по меньшей мере на 70%, 75%, 80%, 85%, 90%, 95%, 98% или 99% или более аналогичен одному или нескольким из вышеупомянутых вирусных белков.In certain embodiments, a viral protein dependent on AAV for replication for use in a method of the present invention may be produced by mutagenesis (ie, insertions, deletions, or substitutions) of one of the aforementioned viral proteins or the nucleic acid encoding the same. In certain embodiments, the viral protein is at least 70%, 75%, 80%, 85%, 90%, 95%, 98%, or 99% or more similar to one or more of the aforementioned viral proteins.

Способы анализа функций белков cap, белков rep и вирусных белков, от которых зависит репликация AAV, хорошо известны в настоящей области техники.Methods for analyzing the functions of cap proteins, rep proteins, and viral proteins on which AAV replication depends are well known in the art.

Клетки-хозяева для экспрессии представляющего интерес трансгена (например, содержащие одно или несколько из следующего: селективный в отношении PV сайт связывания микроРНК, последовательность, кодирующая eTF, который избирательно активирует SCN1A, как описано в настоящем документе, и/или селективный в отношении PV промотор) могут быть выращены в условиях, подходящих для сборки вирионов AAV. Согласно определенным вариантам осуществления клетки-хозяева выращивают в течение подходящего периода времени, чтобы способствовать сборке вирионов AAV и высвобождению вирионов в среду. Как правило, клетки можно выращивать в течение приблизительно 24 часов, приблизительно 36 часов, приблизительно 48 часов, приблизительно 72 часов, приблизительно 4 дней, приблизительно 5 дней, приблизительно 6 дней, приблизительно 7 дней, приблизительно 8 дней, приблизительно 9 дней или до приблизительно 10 дней. Приблизительно через 10 дней (или раньше, в зависимости от условий культивирования и конкретной используемой клетки-хозяина) уровень продукции, как правило, значительно снижается. Как правило, время культивирования измеряется с момента образования вируса. Например, в случае AAV производство вируса, как правило, начинается после обеспечения функции вируса-помощника в соответствующей клетке-хозяине, как описано в настоящем документе. Как правило, клетки собирают от приблизительно 48 до приблизительно 100, предпочтительно от приблизительно 48 до приблизительно 96, предпочтительно от приблизительно 72 до приблизительно 96, предпочтительно от приблизительно 68 до приблизительно 72 часов после заражения вирусом-помощником (или после начала производства вируса).Host cells for expression of the transgene of interest (e.g., containing one or more of the following: a PV-selective microRNA binding site, a sequence encoding an eTF that selectively activates SCN1A as described herein, and/or a PV-selective promoter ) can be grown under conditions suitable for the assembly of AAV virions. In certain embodiments, host cells are grown for a suitable period of time to facilitate the assembly of AAV virions and the release of virions into the medium. Typically, cells can be grown for about 24 hours, about 36 hours, about 48 hours, about 72 hours, about 4 days, about 5 days, about 6 days, about 7 days, about 8 days, about 9 days, or up to about 10 days. After approximately 10 days (or sooner, depending on culture conditions and the specific host cell used), production levels typically decrease significantly. Typically, culture time is measured from the time the virus is produced. For example, in the case of AAV, virus production typically begins after the viral helper function has been established in the appropriate host cell, as described herein. Typically, cells are harvested from about 48 to about 100, preferably from about 48 to about 96, preferably from about 72 to about 96, preferably from about 68 to about 72 hours after infection with the helper virus (or after the start of virus production).

Культуры-продуценты rAAV можно выращивать в различных условиях (в широком диапазоне температур, в течение различных периодов времени и т.п.), подходящих для конкретной используемой клетки-хозяина. Культуры производства rAAV включают в себя культуры, зависящие от прикрепления, которые можно культивировать в подходящих емкостях, зависящих от прикрепления, таких как, например, вращающиеся флаконы, фильтры из полого волокна, микроносители и биореакторы с уплотненным слоем или с псевдоожиженным слоем. Культуры производства вектора rAAV могут также включать в себя адаптированные к суспензии клетки-хозяева, такие как клетки HeLa, 293 и SF-9, которые можно культивировать различными способами, включая в себя, например, вращающиеся колбы, биореакторы с мешалкой и одноразовые системы, такие как система одноразовых реакторов фирмы Wave.rAAV-producing cultures can be grown under a variety of conditions (a wide range of temperatures, for varying periods of time, etc.) suitable for the particular host cell used. rAAV production cultures include attachment-dependent cultures that can be cultured in suitable attachment-dependent containers, such as, for example, spinner flasks, hollow fiber filters, microcarriers, and packed-bed or fluidized-bed bioreactors. rAAV vector production cultures may also include suspension-adapted host cells, such as HeLa, 293, and SF-9 cells, which can be cultured in a variety of ways, including, for example, spinner flasks, stirred tank bioreactors, and single-use systems such as as a system of disposable reactors from Wave.

Подходящие среды, известные в настоящей области техники, могут использоваться для производства вирионов rAAV. Эти среды включают в себя, без ограничения, среды, производимые Hyclone Laboratories и JRH, включая в себя модифицированную среду Игла (MEM), модифицированную Дульбекко среду Игла (DMEM), каждая из которых полностью включена в настоящий документ посредством ссылки. Согласно определенным вариантам осуществления культуральная среда для производства rAAV может быть дополнена сывороткой или полученными из сыворотки рекомбинантными белками на уровне 0,5-20% (в объемном отношении или массово-объемном отношении). Альтернативно, векторы rAAV могут быть получены в бессывороточных условиях, которые также могут называться средами без продуктов животного происхождения.Suitable media known in the art can be used to produce rAAV virions. These media include, without limitation, media manufactured by Hyclone Laboratories and JRH, including modified Eagle's medium (MEM), Dulbecco's modified Eagle's medium (DMEM), each of which is incorporated herein by reference in its entirety. In certain embodiments, the rAAV production culture medium may be supplemented with serum or serum-derived recombinant proteins at a level of 0.5-20% (vol/vol or w/v). Alternatively, rAAV vectors can be produced under serum-free conditions, which may also be referred to as animal product-free environments.

После культивирования клеток-хозяев, чтобы обеспечить производство вирионов AAV, полученные вирионы могут быть собраны и очищены. Согласно определенным вариантам осуществления вирионы AAV могут быть получены из (1) клеток-хозяев производственной культуры путем лизиса клеток-хозяев и/или (2) культуральной среды указанных клеток через период времени после трансфекции, предпочтительно 72 часа. Вирионы rAAV могут быть собраны из отработанной среды из производственной культуры при условии, что клетки культивируются в условиях, которые вызывают высвобождение вирионов rAAV в среду из интактных клеток (см., например, патент США № 6566118). Подходящие способы лизирования клеток также известны в настоящей области техники и включают в себя, например, несколько циклов замораживания/оттаивания, обработку ультразвуком, микрофлюидизацию и обработку химичеAfter culturing the host cells to allow production of AAV virions, the resulting virions can be collected and purified. In certain embodiments, AAV virions can be obtained from (1) production culture host cells by lysis of the host cells and/or (2) the culture medium of said cells over a period of time after transfection, preferably 72 hours. rAAV virions can be collected from waste medium from a production culture, provided that the cells are cultured under conditions that cause rAAV virions to be released into the medium from intact cells (see, for example, US Pat. No. 6,566,118). Suitable methods for lysing cells are also known in the art and include, for example, multiple freeze/thaw cycles, sonication, microfluidization, and chemical treatment.

- 49 046157 скими веществами, такими как детергенты и/или протеазы.- 49 046157 chemical substances such as detergents and/or proteases.

После сбора вирионы rAAV могут быть очищены. Используемый в настоящем документе термин очищенный включает в себя препарат вирионов rAAV, лишенный по меньшей мере некоторых других компонентов, которые также могут присутствовать там, где вирионы rAAV встречаются в природе или из которых изначально получены. Таким образом, например, очищенные вирионы rAAV могут быть получены с использованием способа выделения для обогащения их из исходной смеси, такой как лизат культуры или супернатант производственной культуры. Обогащение можно измерить множеством способов, например, по доле устойчивых к ДНКазам частиц (DRP) или копий генома (gc), присутствующих в растворе, или по инфекционности, или его можно измерить по отношению к второму, потенциально мешающему веществу, присутствующему в исходной смеси, такому как загрязняющие вещества, включая в себя загрязняющие вещества производственной культуры или технологические загрязняющие вещества, включая в себя вирус-помощник, компоненты среды и т.п.Once harvested, rAAV virions can be purified. As used herein, the term purified includes a preparation of rAAV virions that is devoid of at least some other components that may also be present where rAAV virions occur naturally or from which they are originally derived. Thus, for example, purified rAAV virions can be obtained using an isolation method to enrich them from a starting mixture such as a culture lysate or production culture supernatant. Enrichment can be measured in a variety of ways, for example by the proportion of DNase-resistant particles (DRPs) or genome copies (gc) present in a solution, or by infectivity, or it can be measured relative to a second, potentially interfering substance present in the original mixture. such as pollutants, including industrial culture pollutants or technological pollutants, including a helper virus, environmental components, etc.

Согласно определенным вариантам осуществления выход культуры производства rAAV можно осветлить для удаления остатков клеток-хозяев. Согласно некоторым вариантам осуществления выход культуры производства можно осветлить с использованием множества стандартных технологий, таких как центрифугирование или фильтрация через фильтр с размером пор 0,2 мкм или более (например, фильтр из ацетата целлюлозы или серия глубинных фильтров).In certain embodiments, the rAAV production culture yield can be clarified to remove host cell debris. In some embodiments, the production culture yield can be clarified using a variety of standard technologies, such as centrifugation or filtration through a filter with a pore size of 0.2 μm or larger (eg, a cellulose acetate filter or a series of depth filters).

Согласно определенным вариантам осуществления выход культуры для производства rAAV дополнительно обрабатывают бензоназой™ для расщепления любой высокомолекулярной ДНК, присутствующей в производственной культуре. Согласно некоторым вариантам осуществления расщепление бензоназой™ проводят в стандартных условиях, например, при конечной концентрации 1-2,5 единиц/мл бензоназы™ при температуре от температуры окружающей среды до 37°C в течение периода от 30 минут до нескольких часов.In certain embodiments, the rAAV production culture yield is further treated with Benzonase™ to digest any high molecular weight DNA present in the production culture. In some embodiments, the benzonase™ digestion is performed under standard conditions, for example, at a final concentration of 1-2.5 units/ml benzonase™ at a temperature between ambient temperature and 37°C for a period of 30 minutes to several hours.

Согласно определенным вариантам осуществления вирионы rAAV могут быть выделены или очищены с использованием одной или нескольких из следующих стадий очистки: равновесное центрифугирование; проточная анионообменная фильтрация; тангенциальная проточная фильтрация (TFF) для концентрирования частиц rAAV; захват rAAV с помощью апатитовой хроматографии; тепловая инактивация вируса-помощника; захват rAAV с помощью хроматографии гидрофобного взаимодействия; замена буфера с помощью эксклюзионной хроматографии (SEC); нанофильтрация и захват rAAV с помощью анионообменной хроматографии, катионообменной хроматографии или аффинной хроматографии. Эти стадии можно использовать по отдельности, в различных комбинациях или в разном порядке. Способы очистки частиц rAAV можно найти, например, в Xiao et al., (1998) Journal of Virology 72:2224-2232; патентах США № 6989264 и 8137948 и WO 2010/148143.In certain embodiments, rAAV virions can be isolated or purified using one or more of the following purification steps: equilibrium centrifugation; flow anion exchange filtration; tangential flow filtration (TFF) to concentrate rAAV particles; rAAV capture by apatite chromatography; heat inactivation of the helper virus; capture of rAAV by hydrophobic interaction chromatography; buffer exchange using size exclusion chromatography (SEC); nanofiltration and capture of rAAV using anion exchange chromatography, cation exchange chromatography or affinity chromatography. These steps can be used individually, in different combinations, or in different orders. Methods for purifying rAAV particles can be found, for example, in Xiao et al., (1998) Journal of Virology 72:2224-2232; US patents No. 6989264 and 8137948 and WO 2010/148143.

Согласно определенным вариантам осуществления очищенные вирионы AAV можно подвергнуть диализу против PBS, отфильтровать и хранить при температуре -80°C. Титры вирусных геномов можно определить с помощью количественной ПЦР с использованием линеаризованной плазмидной ДНК в качестве стандартной кривой (см., например, Lock M, et al., Hum. Gene Ther. 2010; 21:1273-1285).In certain embodiments, purified AAV virions can be dialyzed against PBS, filtered, and stored at -80°C. Viral genome titers can be determined by quantitative PCR using linearized plasmid DNA as a standard curve (see, for example, Lock M, et al., Hum. Gene Ther. 2010; 21:1273-1285).

Фармацевтические композиции.Pharmaceutical compositions.

Согласно определенным вариантам осуществления в настоящей заявке представлены композиции, содержащие селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, который избирательно активирует SCN1A, и фармацевтически приемлемый носитель. Согласно другим вариантам осуществления в настоящей заявке представлены вирионы, содержащие селективный в отношении PV сайт связывания микроРНК и/или последовательность, кодирующую eTF, который избирательно активирует SCN1A, и фармацевтически приемлемый носитель. Согласно иллюстративным вариантам осуществления такие композиции подходят для применения в генной терапии. Фармацевтические композиции предпочтительно стерильны и стабильны в условиях производства и хранения. Стерильные растворы могут быть получены, например, путем фильтрации через стерильные фильтрующие мембраны.In certain embodiments, the present application provides compositions comprising a PV-selective miRNA binding site and/or a sequence encoding an eTF that selectively activates SCN1A, and a pharmaceutically acceptable carrier. In other embodiments, the present application provides virions comprising a PV-selective miRNA binding site and/or a sequence encoding an eTF that selectively activates SCN1A, and a pharmaceutically acceptable carrier. In exemplary embodiments, such compositions are suitable for use in gene therapy. The pharmaceutical compositions are preferably sterile and stable under conditions of manufacture and storage. Sterile solutions can be prepared, for example, by filtration through sterile filter membranes.

Приемлемые носители и вспомогательные вещества в фармацевтических композициях предпочтительно нетоксичны для реципиентов в используемых дозировках и концентрациях. Приемлемые носители и вспомогательные вещества могут включать в себя такие буферы, как фосфатный, цитратный, HEPES и TAE, такие антиоксиданты, как аскорбиновая кислота и метионин, такие консерванты, как гексаметоний хлорид, октадецилдиметилбензиламмонийхлорид, резорцин и хлорид бензалкония, такие белки, как сывороточный альбумин человека, желатин, декстран и иммуноглобулины, такие гидрофильные полимеры, как поливинилпирролидон, такие аминокислоты, как глицин, глутамин, гистидин и лизин, и такие углеводы, как глюкоза, манноза, сахароза и сорбитол. Фармацевтические композиции по настоящему раскрытию можно вводить парентерально в форме инъекционной композиции. Фармацевтические композиции для инъекций могут быть составлены с использованием стерильного раствора или любой фармацевтически приемлемой жидкости в качестве носителя. Фармацевтически приемлемые носители включают в себя, без ограничения, стерильную воду и физиологический раствор.Acceptable carriers and excipients in pharmaceutical compositions are preferably non-toxic to recipients at the dosages and concentrations used. Acceptable carriers and excipients may include buffers such as phosphate, citrate, HEPES and TAE, antioxidants such as ascorbic acid and methionine, preservatives such as hexamethonium chloride, octadecyldimethylbenzylammonium chloride, resorcinol and benzalkonium chloride, proteins such as serum albumin human, gelatin, dextran and immunoglobulins, hydrophilic polymers such as polyvinylpyrrolidone, amino acids such as glycine, glutamine, histidine and lysine, and carbohydrates such as glucose, mannose, sucrose and sorbitol. The pharmaceutical compositions of the present disclosure can be administered parenterally in the form of an injectable composition. Pharmaceutical compositions for injection can be formulated using a sterile solution or any pharmaceutically acceptable liquid as a carrier. Pharmaceutically acceptable carriers include, but are not limited to, sterile water and saline.

Фармацевтические композиции по настоящему раскрытию могут быть приготовлены в микрокапThe pharmaceutical compositions of the present disclosure can be formulated in microcaps

- 50 046157 сулах, таких как гидроксилметилцеллюлозные или желатиновые микрокапсулы и микрокапсулы из полиметилметакрилата. Фармацевтические композиции по настоящему раскрытию также могут быть приготовлены в других системах доставки лекарственных средств, таких как липосомы, микросферы альбумина, микроэмульсии, наночастицы и нанокапсулы. Фармацевтическая композиция для генной терапии может быть в приемлемом разбавителе или может содержать матрицу с медленным высвобождением, в которую встроен носитель для доставки гена.- 50 046157 sulakh, such as hydroxyl methylcellulose or gelatin microcapsules and polymethyl methacrylate microcapsules. The pharmaceutical compositions of the present disclosure can also be formulated in other drug delivery systems such as liposomes, albumin microspheres, microemulsions, nanoparticles and nanocapsules. The pharmaceutical composition for gene therapy may be in a suitable diluent or may comprise a slow release matrix into which a gene delivery vehicle is embedded.

Представленные в настоящем документе фармацевтические композиции могут быть составлены для парентерального введения, подкожного введения, внутривенного введения, внутримышечного введения, внутриартериального введения, интрапаренхимального введения, интратекального введения, введения в мостомозжечковую цистерну, интрацеребровентрикулярного введения или внутрибрюшинного введения. Фармацевтическая композиция также может быть приготовлена или вводиться путем назального введения, посредством спрея, перорального, аэрозольного, ректального или вагинального введения. Согласно одному варианту осуществления представленная в настоящем документе фармацевтическая композиция вводится в ЦНС или спинномозговую жидкость (CSF), т.е. путем интрапаренхимальной инъекции, интратекальной инъекции, инъекции в мостомозжечковую цистерну или интрацеребровентрикулярной инъекции. Тканевая мишень может быть специфической, например, ЦНС, или может представлять собой комбинацию нескольких тканей, например, мышечных тканей и тканей ЦНС. Иллюстративная ткань или другие мишени могут включать в себя печень, скелетные мышцы, сердечную мышцу, жировые отложения, почки, легкие, эндотелий сосудов, эпителиальные клетки, кроветворные клетки, ЦНС и/или CSF. Согласно предпочтительному варианту осуществления представленная в настоящем документе фармацевтическая композиция, содержащая селективный в отношении PV сайт связывания микроРНК и/или eTF, который избирательно активирует SCN1A, вводится инъекцией в ЦНС или спинномозговую жидкость, т.е. путем интрапаренхимальной инъекции, интратекальной инъекции, инъекции в мостомозжечковую цистерну или интрацеребровентрикулярной инъекции. Один или несколько из этих способов можно использовать для введения фармацевтической композиции по настоящему раскрытию.The pharmaceutical compositions provided herein may be formulated for parenteral administration, subcutaneous administration, intravenous administration, intramuscular administration, intraarterial administration, intraparenchymal administration, intrathecal administration, intracerebellopontine administration, intracerebroventricular administration, or intraperitoneal administration. The pharmaceutical composition may also be prepared or administered by nasal, spray, oral, aerosol, rectal or vaginal administration. In one embodiment, a pharmaceutical composition provided herein is administered into the CNS or cerebrospinal fluid (CSF), i.e. by intraparenchymal injection, intrathecal injection, injection into the cerebellopontine cistern, or intracerebroventricular injection. The tissue target may be specific, such as the CNS, or may be a combination of several tissues, such as muscle and CNS tissues. Exemplary tissue or other targets may include liver, skeletal muscle, cardiac muscle, fat, kidney, lung, vascular endothelium, epithelial cells, hematopoietic cells, CNS and/or CSF. In a preferred embodiment, a pharmaceutical composition provided herein comprising a PV-selective miRNA and/or eTF binding site that selectively activates SCN1A is injected into the CNS or cerebrospinal fluid, i.e. by intraparenchymal injection, intrathecal injection, injection into the cerebellopontine cistern, or intracerebroventricular injection. One or more of these methods can be used to administer the pharmaceutical composition of the present disclosure.

Согласно определенным вариантам осуществления представленная в настоящем документе фармацевтическая композиция содержит эффективное количество или терапевтически эффективное количество. В контексте настоящего описания такие количества относятся к количеству, эффективному в дозировках и в течение периодов времени, необходимых для достижения желаемого терапевтического результата, такого как повышение уровня экспрессии SCN1A и/или уменьшение частоты и/или продолжительности припадков.In certain embodiments, a pharmaceutical composition provided herein comprises an effective amount or a therapeutically effective amount. As used herein, such amounts refer to an amount effective in dosages and for periods of time necessary to achieve the desired therapeutic effect, such as increasing the level of SCN1A expression and/or reducing the frequency and/or duration of seizures.

Дозировка фармацевтических композиций по настоящему раскрытию зависит от факторов, включающих в себя путь введения, заболевание, которое необходимо лечить, и физические характеристики (например, возраст, массу, общее состояние здоровья) субъекта. Дозировка может быть скорректирована для обеспечения оптимального терапевтического ответа. Как правило, дозировка может представлять собой количество, которое эффективно лечит заболевание, не вызывая значительной токсичности. Согласно одному варианту осуществления представленный в настоящем документе вектор AAV можно вводить пациенту для лечения дефицита SCNIA (включая в себя, например, синдром Драве) в количестве или дозе в диапазоне от 5х 1011 до 1 х 1014 гк/кг (количество геномных копий на килограмм массы тела пациента (гк/кг)). Согласно более конкретному варианту осуществления вектор AAV вводят в количестве, которое находится в диапазоне от приблизительно 5х 1011 гк/кг до приблизительно 3х1013 гк/кг или от приблизительно 1х1012до приблизительно 1 х 1014 гк/кг, или от приблизительно 1 х 1012 до приблизительно 1х1013 гк/кг, или приблизительно 5х1011 гк/кг, 1х1012 гк/кг, 1,5х1012 гк/кг, 2,0х1012 гк/кг, 2,5х1012 гк/кг, 3х1012 гк/кг, 3,5х1012 гк/кг, 4х1012 гк/кг, 4,5х1012 гк/кг, 5х1012 гк/кг, 5,5х1012 гк/кг, 6х1012 гк/кг, 6,5х1012 гк/кг, 7х1012 гк/кг, 7,5х1012 гк/кг, 8х1012 гк/кг, 8,5х1012 гк/кг, 9х1012 гк/кг или 9,5х1012 гк/кг. гк/кг можно определить, например, с помощью кПЦР или цифровой капельной ПЦР (ddPCR) (см., например, M. Lock et al, Hum Gene Ther Methods. 2014 Apr;25(2): 115-25). Согласно другому варианту осуществления представленный в настоящем документе вектор AAV можно вводить пациенту для лечения дефицита SCNIA (включая в себя, например, синдром Драве) в количестве или дозе в диапазоне от 1х 109 до 1х 1011 iu/кг (инфекционные единицы вектора (ш)/масса тела субъекта или пациента (кг)). Согласно определенным вариантам осуществления фармацевтическая композиция может быть приготовлена в виде стандартной дозы по мере необходимости. Такие единичные дозированные единицы могут содержать от приблизительно 1х109 gc до приблизительно 1 х 1015 gc.The dosage of the pharmaceutical compositions of the present disclosure depends on factors including the route of administration, the disease to be treated, and the physical characteristics (eg, age, weight, general health) of the subject. Dosage may be adjusted to ensure optimal therapeutic response. Typically, the dosage may be an amount that effectively treats the disease without causing significant toxicity. In one embodiment, the AAV vector provided herein can be administered to a patient for the treatment of SCNIA deficiency (including, for example, Dravet syndrome) in an amount or dose ranging from 5 x 10 11 to 1 x 10 14 gc/kg (number of genomic copies per kilogram of patient's body weight (gk/kg)). In a more specific embodiment, the AAV vector is administered in an amount that ranges from about 5 x 10 11 gc/kg to about 3 x 10 13 gc/kg, or from about 1 x 10 12 to about 1 x 10 14 gc/kg, or from about 1 x 10 12 to approximately 1x10 13 gk/kg, or approximately 5x10 11 gk/kg, 1x10 12 gk/kg, 1.5x10 12 gk/kg, 2.0x10 12 gk/kg, 2.5x10 12 gk/kg, 3x10 12 gk/kg, 3.5x10 12 gk/kg, 4x10 12 gk/kg, 4.5x10 12 gk/kg, 5x10 12 gk/kg, 5.5x10 12 gk/kg, 6x10 12 gk/kg, 6.5x10 12 gk/kg, 7x10 12 gk/kg, 7.5x10 12 gk/kg, 8x10 12 gk/kg, 8.5x10 12 gk/kg, 9x10 12 gk/kg or 9.5x10 12 gk/kg. gc/kg can be determined, for example, using qPCR or digital droplet PCR (ddPCR) (see, for example, M. Lock et al, Hum Gene Ther Methods. 2014 Apr;25(2): 115-25). In another embodiment, the AAV vector provided herein can be administered to a patient for the treatment of SCNIA deficiency (including, for example, Dravet syndrome) in an amount or dose ranging from 1x 109 to 1x 10 11 iu/kg (infectious vector units (v) /body weight of the subject or patient (kg)). In certain embodiments, the pharmaceutical composition can be formulated as a unit dose as needed. Such unit dosage units may contain from about 1 x 10 9 gc to about 1 x 10 15 gc.

Фармацевтические композиции по настоящему раскрытию можно вводить нуждающемуся в этом субъекту, например, один или несколько раз (например, 1-10 раз или более) ежедневно, еженедельно, ежемесячно, два раза в год, ежегодно или по медицинским показаниям. Согласно иллюстративному варианту осуществления достаточно однократного введения. Согласно одному варианту осуществления фармацевтическая композиция, содержащая кассету экспрессии, кодирующую селективный в отношении PV сайт связывания микроРНК и/или eTF, который избирательно активирует SCN1A, подходит для применения у людей и вводится путем интрапаренхимальной инъекции, интратекальной инъекции, инъекции в мостомозжечковую цистерну или интрацеребровентрикулярной инъекции. Согласно одному вари- 51 046157 анту осуществления фармацевтическая композиция доставляется через периферическую вену путем болюсной инъекции. Согласно другим вариантам осуществления фармацевтическая композиция доставляется через периферическую вену путем инфузии в течение приблизительно 10 минут (±5 минут), в течение приблизительно 20 минут (±5 минут), в течение приблизительно 30 минут (±5 минут), в течение приблизительно 60 минут (±5 минут) или в течение более чем 90 минут (±10 минут).The pharmaceutical compositions of the present disclosure can be administered to a subject in need thereof, for example, one or more times (eg, 1-10 times or more) daily, weekly, monthly, biannually, annually, or as medically indicated. In an exemplary embodiment, a single administration is sufficient. In one embodiment, a pharmaceutical composition comprising an expression cassette encoding a PV-selective miRNA and/or eTF binding site that selectively activates SCN1A is suitable for use in humans and is administered by intraparenchymal injection, intrathecal injection, pontocerebellar cistern injection, or intracerebroventricular injection. . In one embodiment, the pharmaceutical composition is delivered via a peripheral vein by bolus injection. In other embodiments, the pharmaceutical composition is delivered via a peripheral vein by infusion over about 10 minutes (±5 minutes), over about 20 minutes (±5 minutes), over about 30 minutes (±5 minutes), over about 60 minutes (±5 minutes) or for more than 90 minutes (±10 minutes).

Согласно другому аспекту в настоящей заявке дополнительно представлен набор, содержащий молекулу нуклеиновой кислоты, вектор, клетку-хозяина, вирион или фармацевтическую композицию, как описано в настоящем документе, в одном или нескольких контейнерах. Набор может содержать инструкции или упаковочные материалы, которые описывают, как вводить пациенту молекулу нуклеиновой кислоты, вектор, клетку-хозяина или вирион, содержащиеся в наборе. Контейнеры набора могут быть из любого подходящего материала, например, стекла, пластика, металла и т.д., и быть любого подходящего размера, формы или конфигурации. Согласно определенным вариантам осуществления наборы могут содержать одну или несколько ампул или шприцев, которые содержат молекулу нуклеиновой кислоты, вектор, клетку-хозяина, вирион или фармацевтическую композицию в подходящей жидкости или форме раствора.In another aspect, the present application further provides a kit comprising a nucleic acid molecule, vector, host cell, virion, or pharmaceutical composition as described herein in one or more containers. The kit may contain instructions or packaging materials that describe how to administer to a patient the nucleic acid molecule, vector, host cell, or virion contained in the kit. The kit containers may be of any suitable material, such as glass, plastic, metal, etc., and be of any suitable size, shape or configuration. In certain embodiments, kits may contain one or more vials or syringes that contain a nucleic acid molecule, vector, host cell, virion, or pharmaceutical composition in a suitable liquid or solution form.

Способы лечения.Methods of treatment.

Согласно одному аспекту в настоящей заявке представлены способы применения eTF, которые избирательно активируют SCN1A, как раскрыто в настоящем документе. Согласно определенным вариантам осуществления в настоящей заявке представлены способы введения кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе, для усиления экспрессии SCNIA в клетке. Согласно различным вариантам осуществления eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе, можно использовать для модуляции экспрессии SCNIA в клетке in vitro, in vivo или ex vivo.In one aspect, the present application provides methods of using eTFs that selectively activate SCN1A, as disclosed herein. In certain embodiments, provided herein are methods of introducing an expression cassette, expression vector, or viral particle containing a polynucleotide encoding an eTF that selectively activates SCN1A, as disclosed herein, to enhance expression of SCNIA in a cell. In various embodiments, an eTF that selectively activates SCN1A, as disclosed herein, can be used to modulate SCNIA expression in a cell in vitro, in vivo, or ex vivo.

Согласно определенным вариантам осуществления в настоящей заявке представлены способы лечения заболевания или нарушения, связанного с SCN1A, путем введения субъекту кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе, при необходимости. Согласно определенным вариантам осуществления нарушение представляет собой нарушение центральной нервной системы. Согласно иллюстративным вариантам осуществления заболевание или нарушение связано с гаплонедостаточностью SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную с гаплонедостаточностью SCN1A. Согласно определенным вариантам осуществления гаплонедостаточность является результатом того, что субъект является гетерозиготным по мутации потери функции гена SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную со вставкой, делецией или заменой в гене SCN1A. Согласно определенным вариантам осуществления нарушение представляет собой эпилепсию, связанную с точечной мутацией в гене SCN1A. Согласно определенным вариантам осуществления способ лечения заболевания или нарушения предусматривает введение кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе, так что недостаточная экспрессия SCN1A корректируется, доводится до пределов уровня здорового человека или доводится до нормального диапазона, определенного стандартом медицинской помощи. Согласно определенным вариантам осуществления раскрытые в настоящем документе способы применяются для лечения заболевания или нарушения, связанного с эндогенным SCN1A, содержащим одну или несколько мутаций, которые приводят к аномальной экспрессии SCN1A.In certain embodiments, provided herein are methods of treating a disease or disorder associated with SCN1A by administering to a subject an expression cassette, expression vector, or viral particle containing a polynucleotide encoding an eTF that selectively activates SCN1A, as disclosed herein, as appropriate. In certain embodiments, the disorder is a disorder of the central nervous system. In exemplary embodiments, the disease or disorder is associated with SCN1A haploinsufficiency. In certain embodiments, the disorder is epilepsy associated with SCN1A haploinsufficiency. In certain embodiments, the haploinsufficiency results from the subject being heterozygous for a loss of function mutation in the SCN1A gene. In certain embodiments, the disorder is epilepsy associated with an insertion, deletion, or substitution in the SCN1A gene. In certain embodiments, the disorder is epilepsy associated with a point mutation in the SCN1A gene. In certain embodiments, a method of treating a disease or disorder comprises administering an expression cassette, expression vector, or viral particle comprising a polynucleotide encoding an eTF that selectively activates SCN1A, as disclosed herein, such that underexpression of SCN1A is corrected to normal levels. or brought within the normal range as defined by the standard of care. In certain embodiments, the methods disclosed herein are used to treat a disease or disorder associated with endogenous SCN1A containing one or more mutations that result in abnormal expression of SCN1A.

Согласно определенным вариантам осуществления в настоящей заявке представлены способы облегчения симптома, связанного с заболеванием или нарушением, путем введения кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе, нуждающемуся в этом субъекту.In certain embodiments, this application provides methods for alleviating a symptom associated with a disease or disorder by administering an expression cassette, expression vector, or viral particle containing a polynucleotide encoding an eTF that selectively activates SCN1A, as disclosed herein, to a subject in need thereof. .

Согласно иллюстративному варианту осуществления в настоящей заявке представлены способы лечения заболевания, нарушения или симптома, связанного с мутацией в SCN1A (например, точечной мутацией, заменой, делецией, инверсией и т.д.), дефицитом в Nav1.1 и/или снижением активности Nav1.1 путем введения нуждающемуся в этом субъекту кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно усиливает экспрессию гена SCN1A или его белкового продукта Nav1.1. Управляемые напряжением ионные натриевые каналы важны для генерации и распространения потенциалов действия в поперечнополосатых мышцах и нервных тканях. Управляемые напряжением ионные натриевые каналы представляют собой гетеромерные комплексы, состоящие из большой центральной порообразующей гликозилированной альфасубъединицы и двух меньших вспомогательных бета-субъединиц. Большая альфа-субъединица субъединица Nav1.1, кодируемая геном SCN1A, актуальна для различных заболеваний или нарушений, таких как синдром Драве. Nav1.1 экспрессируется в нейронах и может быть собрана с различными бета- 52 046157 субъединицами, включая в себя Νανβΐ, экспрессируемую геном SCN1B.In an exemplary embodiment, the present application provides methods for treating a disease, disorder, or symptom associated with a mutation in SCN1A (e.g., point mutation, substitution, deletion, inversion, etc.), deficiency in Nav1.1, and/or reduced Nav1 activity .1 by administering to a subject in need thereof an expression cassette, expression vector or viral particle containing a polynucleotide encoding an eTF that selectively enhances the expression of the SCN1A gene or its protein product Nav1.1. Voltage-gated sodium ion channels are important for the generation and propagation of action potentials in striated muscle and neural tissues. Voltage-gated sodium ion channels are heteromeric complexes consisting of a large central pore-forming glycosylated alpha subunit and two smaller accessory beta subunits. The large alpha subunit Nav1.1 subunit, encoded by the SCN1A gene, is relevant for various diseases or disorders such as Dravet syndrome. Nav1.1 is expressed in neurons and can be assembled with various beta 52 046157 subunits, including the Νανβΐ expressed by the SCN1B gene.

Согласно определенным вариантам осуществления в настоящей заявке представлены способы лечения заболеваний, связанных с мутацией в SCN1A (например, делецией, вставкой, инверсией, точечной мутацией (например, нонсенс-мутацией, миссенс-мутацией) и т.д.) или сниженной активностью Nav1.1 с использованием eTF, который избирательно повышает экспрессию эндогенного гена SCN1A. Заболевания и нарушения, связанные с мутациями SCN1A, включают в себя, без ограничения: синдром Драве, синдром Охтахара, эпилепсию, раннюю детскую эпилептическую энцефалопатию 6 (EIEE6), семейные фебрильные припадки 3A (FEB3A), трудноизлечимую детскую эпилепсию с генерализованными тоникоклоническими припадками (ICEGTC), мигрень, семейную гемиплегию 3 (FHM3), синдром Панайотопулоса, семейную фибрилляцию предсердий 13 (ATFB13), генерализованную эпилепсию с фебрильными судорогами плюс типа 1 (gefs + тип 1), синдром Бругада, неспецифический дефект сердечной проводимости, генерализованную эпилепсию плюс, доброкачественный ранний младенческий эпилептический синдром, раннюю детскую эпилептическую энцефалопатию (EIEE11), доброкачественную семейную детскую эпилепсию, нейродегенерацию, таупатии и болезнь Альцгеймера. В некоторых случаях неврологическим заболеванием является синдром Драве. Мутации или аномалии в SCN1A также были связаны с судорожными расстройствами, эпилепсией, аутизмом, семейной гемиплегической мигренью 3 типа (FHM3), генетической эпилепсией с фебрильными припадками плюс (GEFS+) и эффективностью некоторых противосудорожных лекарственных средств. Например, мутация ICS5N+5G>A в SCN1A связана с максимально безопасным количеством (дозой) противосудорожных лекарственных средств фенитоина и карбамазепина.In certain embodiments, provided herein are methods of treating diseases associated with a mutation in SCN1A (eg, deletion, insertion, inversion, point mutation (eg, nonsense mutation, missense mutation), etc.) or reduced Nav1 activity. 1 using an eTF that selectively increases the expression of the endogenous SCN1A gene. Diseases and disorders associated with SCN1A mutations include, but are not limited to: Dravet syndrome, Ohtahara syndrome, epilepsy, early childhood epileptic encephalopathy 6 (EIEE6), familial febrile seizures 3A (FEB3A), intractable childhood epilepsy with generalized tonic-clonic seizures (ICEGTC ), migraine, familial hemiplegia 3 (FHM3), Panagiotopoulos syndrome, familial atrial fibrillation 13 (ATFB13), generalized epilepsy with febrile seizures plus type 1 (gefs + type 1), Brugada syndrome, nonspecific cardiac conduction defect, generalized epilepsy plus, benign early infantile epileptic syndrome, early childhood epileptic encephalopathy (EIEE11), benign familial childhood epilepsy, neurodegeneration, tauopathies and Alzheimer's disease. In some cases, the neurological disorder is Dravet syndrome. Mutations or abnormalities in SCN1A have also been associated with seizure disorders, epilepsy, autism, familial hemiplegic migraine type 3 (FHM3), genetic epilepsy with febrile seizures plus (GEFS+), and the effectiveness of certain anticonvulsant drugs. For example, the ICS5N+5G>A mutation in SCN1A is associated with the maximum safe amount (dose) of the anticonvulsant drugs phenytoin and carbamazepine.

Согласно определенным вариантам осуществления в настоящей заявке представлен способ лечения субъекта с синдромом Драве или с риском его развития путем введения кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A. Синдром Драве характеризуется продолжительными фебрильными и нефебрильными припадками в течение первого года жизни ребенка. Это заболевание прогрессирует до других типов припадков, таких как миоклонические и парциальные припадки, задержка психомоторного развития и атаксия. Оно характеризуется когнитивными нарушениями, поведенческими нарушениями и двигательными нарушениями. Поведенческие нарушения часто включают в себя гиперактивность и импульсивность, а в более редких случаях - аутистическое поведение. Синдром Драве также связан с нарушениями сна, включая в себя сонливость и бессонницу. У многих пациентов синдром Драве вызван генетическими мутациями, которые приводят к выработке нефункциональных белков. При лечении заболеваний, связанных с генетическими причинами, существует множество проблем. Таким образом, большинство существующих способов лечения было направлено на профилактическое лечение припадков и других симптомов.In certain embodiments, the present application provides a method of treating a subject with or at risk of developing Dravet syndrome by administering an expression cassette, expression vector, or viral particle containing a polynucleotide encoding an eTF that selectively activates SCN1A. Dravet syndrome is characterized by prolonged febrile and nonfebrile seizures during the first year of a child's life. This disease progresses to other types of seizures such as myoclonic and partial seizures, psychomotor retardation, and ataxia. It is characterized by cognitive impairment, behavioral disturbances and movement disorders. Behavioral disorders often include hyperactivity and impulsivity, and in rarer cases, autistic behavior. Dravet syndrome is also associated with sleep disturbances, including drowsiness and insomnia. In many patients, Dravet syndrome is caused by genetic mutations that lead to the production of nonfunctional proteins. There are many challenges in treating diseases associated with genetic causes. Thus, most existing treatments have been aimed at preventing seizures and other symptoms.

У 70-90% пациентов синдром Драве вызывается нонсенс-мутациями в гене SCN1A, что приводит к преждевременному стоп-кодону и, следовательно, к нефункциональному белку. Как правило, миссенсмутация в сегменте S5 или S6 поры натриевого канала приводит к потере функции канала и развитию синдрома Драве. Гетерозиготное наследование мутации SCN1A, например, нонсенс-мутация, миссенсмутация, делеция, вставка, инверсия и т.д. - это все, что необходимо для развития дефектного натриевого канала; у пациентов с синдромом Драве останется одна нормальная копия гена. Таким образом, заболевание характеризуется как гаплонедостаточность, и, таким образом, увеличение экспрессии функционирующей копии SCN1A может восстанавливать нормальные уровни продукции Nav1.1.In 70-90% of patients, Dravet syndrome is caused by nonsense mutations in the SCN1A gene, which results in a premature stop codon and therefore a nonfunctional protein. Typically, a missense mutation in the S5 or S6 segment of the sodium channel pore results in loss of channel function and the development of Dravet syndrome. Heterozygous inheritance of SCN1A mutation, such as nonsense mutation, missense mutation, deletion, insertion, inversion, etc. - this is all that is necessary for the development of a defective sodium channel; Patients with Dravet syndrome will have one normal copy of the gene. Thus, the disease is characterized as haploinsufficiency, and thus increasing the expression of a functional copy of SCN1A may restore normal levels of Nav1.1 production.

Симптомы, связанные с синдромом Драве, включают в себя судороги, дефекты памяти, задержку развития, низкий мышечный тонус и/или когнитивные проблемы. Лечение кассетой экспрессии, вектором экспрессии или вириальной частицей, описанными в настоящем документе, может привести к улучшению одного или нескольких симптомов, таких как уменьшение количества, продолжительности и/или интенсивности припадков. Введение генной терапии, как описано в настоящем документе, субъекту с риском развития синдрома Драве может предотвратить развитие или замедлить прогрессирование одного или нескольких симптомов Драве.Symptoms associated with Dravet syndrome include seizures, memory defects, developmental delays, low muscle tone and/or cognitive problems. Treatment with an expression cassette, expression vector, or virial particle described herein may result in improvement in one or more symptoms, such as a reduction in the number, duration, and/or intensity of seizures. Administration of gene therapy, as described herein, to a subject at risk of developing Dravet syndrome may prevent the development or slow the progression of one or more Dravet symptoms.

Согласно определенным вариантам осуществления лечение кассетой экспрессии, вектором экспрессии или вириальной частицей, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как описано в настоящем документе, снижает продолжительность и/или частоту припадков, например, припадков, связанных с синдромом Драве, по меньшей мере на 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 95% или более по сравнению с не подвергнутым лечению контролем или по сравнению с уровнем до лечения.In certain embodiments, treatment with an expression cassette, expression vector, or virial particle containing a polynucleotide encoding an eTF that selectively activates SCN1A, as described herein, reduces the duration and/or frequency of seizures, such as seizures associated with Dravet syndrome, by at least at least 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33% , 34%, 35%, 36%, 37%, 38%, 39%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90 % 95% or more compared to untreated controls or compared to pre-treatment levels.

У некоторых пациентов с болезнью Альцгеймера выработка амилоида β (Ae) с участием многих пептидов и протеаз может влиять на возбудимость нейронов, вызывая припадки и подавляя регуляцию натриевого канала Nav1.1 в нейронах PV. Согласно другому варианту осуществления в настоящей заявке представлены способы лечения субъекта, страдающего болезнью Альцгеймера, путем введения описанIn some patients with Alzheimer's disease, amyloid β (Ae) production involving many peptides and proteases can influence neuronal excitability, causing seizures and downregulating the Nav1.1 sodium channel in PV neurons. In another embodiment, the present application provides methods for treating a subject suffering from Alzheimer's disease by administering the described

- 53 046157 ной в настоящем документе кассеты экспрессии, вектора экспрессии или вирусной частицы, которая содержит полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A. Симптомы, связанные с болезнью Альцгеймера, включают в себя кратковременную потерю памяти, когнитивные трудности, припадки и трудности с речью, исполнительными функциями, восприятием (агнозия) и выполнением движений (апраксия). Лечение кассетой экспрессии, вектором экспрессии или вирусной частицей, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, может привести к улучшению одного или нескольких симптомов болезни Альцгеймера, таких как снижение прогрессирования потери памяти или предотвращение одного или нескольких симптомов. В некоторых случаях лечение может привести к коррекции активности головного мозга с высокой мощностью гаммаизлучения. Лечение может привести к снижению частоты припадков и/или тяжести припадков или снижению активности высокой мощности гамма-излучения по меньшей мере на 10%, 20%, 30%, 40%, 50%, 60%, 70% или более, как по сравнению с отсутствием лечения. В некоторых случаях лечение может привести к улучшению когнитивных функций. Обучение и/или память могут быть улучшены по меньшей мере на 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100% или более чем на 100% по сравнению с отсутствием лечения или перед лечением полинуклеотидом, кодирующим eTF, который избирательно активирует SCN1A, как раскрыто в настоящем документе.- 53 046157 herein an expression cassette, expression vector or viral particle that contains a polynucleotide encoding an eTF that selectively activates SCN1A. Symptoms associated with Alzheimer's disease include short-term memory loss, cognitive difficulties, seizures, and difficulties with speech, executive function, perception (agnosia), and motor performance (apraxia). Treatment with an expression cassette, expression vector, or viral particle containing a polynucleotide encoding an eTF that selectively activates SCN1A may result in improvement of one or more symptoms of Alzheimer's disease, such as reducing the progression of memory loss or preventing one or more symptoms. In some cases, treatment can lead to correction of brain activity with high gamma radiation output. Treatment may result in a reduction in seizure frequency and/or severity of seizures or a reduction in high-power gamma radiation activity by at least 10%, 20%, 30%, 40%, 50%, 60%, 70% or more, as compared with no treatment. In some cases, treatment may lead to improvements in cognitive function. Learning and/or memory may be improved by at least 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, or greater than 100% compared to without treatment or before treatment with a polynucleotide encoding an eTF that selectively activates SCN1A, as disclosed herein.

В некоторых случаях лечение кассетой экспрессии, вектором экспрессии или вирусной частицей, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, снижает активность высокой мощности гамма-излучения (например, активность высокой мощности гаммаизлучения, связанную с болезнью Альцгеймера) по меньшей мере на 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% или 95% по сравнению с не подвергнутым лечению контролем или по сравнению с уровнем до лечения.In some cases, treatment with an expression cassette, expression vector, or viral particle containing a polynucleotide encoding an eTF that selectively activates SCN1A reduces high-gamma activity (eg, high-gamma activity associated with Alzheimer's disease) by at least 1% , 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18 %, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% or 95% compared to untreated controls or compared to pre-treatment levels.

Паркинсонизм относится к совокупности признаков и симптомов, обнаруживаемых при болезни Паркинсона (PD), включая в себя медлительность (брадикинезию), тугоподвижность (ригидность), тремор и дисбаланс (постуральную нестабильность). В некоторых случаях введение кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует SCN1A, как описано в настоящем документе, субъекту с риском развития или страдающим болезнью Паркинсона может предотвратить развитие одного или нескольких симптомов или замедлить прогрессирование болезни Паркинсона по меньшей мере на 10%, по меньшей мере на 20%, по меньшей мере на 30%, по меньшей мере на 40%, по меньшей мере на 50%, по меньшей мере на 60%, по меньшей мере на 70%, по меньшей мере на 80% или по меньшей мере на 90% по сравнению с отсутствием лечения.Parkinsonism refers to the collection of signs and symptoms found in Parkinson's disease (PD), including slowness (bradykinesia), stiffness (rigidity), tremors, and imbalance (postural instability). In some cases, administration of an expression cassette, expression vector, or viral particle containing a polynucleotide encoding an eTF that selectively activates SCN1A, as described herein, to a subject at risk for or suffering from Parkinson's disease may prevent the development of one or more symptoms or slow the progression of Parkinson's disease. by at least 10%, by at least 20%, by at least 30%, by at least 40%, by at least 50%, by at least 60%, by at least 70%, according to at least 80% or at least 90% compared to no treatment.

Согласно определенным вариантам осуществления в настоящей заявке представлены способы, которые можно применять для лечения субъекта, который находится в группе риска развития заболевания. Может быть известно, что субъект предрасположен к заболеванию, например, неврологическому заболеванию или заболеванию, связанному с эпилепсией, припадками и/или энцефалопатией. Субъект может быть предрасположен к заболеванию из-за генетического события или из-за известных факторов риска. Например, субъект может нести мутацию в SCN1A, которая связана с эпилепсией (такой как, например, синдром Драве). Любая мутация в гене SCN1A, которая снижает его активность (за счет снижения уровней экспрессии, нарушения функции белка или комбинации обоих), может предрасполагать субъекта к заболеванию, включая в себя любое одно или несколько из вставок, делеций, инверсий, транслокаций или замен (например, точечные мутации, включая в себя нонсенс-мутации и/или миссенс-мутации) в гене SCN1A. В некоторых случаях субъект может быть предрасположен к такому заболеванию, как болезнь Альцгеймера, из-за возраста субъекта. В некоторых случаях у субъекта может быть недостаточное количество белка SCN1A, и лечение заболевания, связанного с SCN1A, предусматривает введение кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует эндогенный SCN1A, как описано в настоящем документе.In certain embodiments, this application provides methods that can be used to treat a subject who is at risk of developing a disease. The subject may be known to be predisposed to a disease, such as a neurological disease or a disease associated with epilepsy, seizures and/or encephalopathy. A subject may be predisposed to a disease due to a genetic event or known risk factors. For example, a subject may carry a mutation in SCN1A that is associated with epilepsy (such as Dravet syndrome). Any mutation in the SCN1A gene that reduces its activity (by reducing expression levels, disrupting protein function, or a combination of both) may predispose a subject to the disease, including any one or more of insertions, deletions, inversions, translocations, or substitutions (eg , point mutations, including nonsense mutations and/or missense mutations) in the SCN1A gene. In some cases, a subject may be predisposed to a disease such as Alzheimer's disease due to the age of the subject. In some cases, a subject may have insufficient amounts of SCN1A protein, and treatment of the SCN1A-associated disease involves administration of an expression cassette, expression vector, or viral particle containing a polynucleotide encoding an eTF that selectively activates endogenous SCN1A, as described herein.

Согласно определенным вариантам осуществления лечение с использованием кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей полинуклеотид, кодирующий eTF, который избирательно активирует эндогенный SCN1A, представленный в настоящем документе, может привести к уменьшению или прекращению симптомов, связанных с синдромом Драве или другим заболеванием, связанным с SCN1A, или нарушением, например, эпилепсией, связанной с гаплонедостаточностью SCN1A. Например, лечение может улучшить обучение, память, когнитивные и/или двигательные функции; уменьшить частоту и/или продолжительность припадков; и/или снизить температурную чувствительность (или увеличить температурный порог для запуска припадка).In certain embodiments, treatment using an expression cassette, expression vector, or viral particle containing a polynucleotide encoding an eTF that selectively activates endogenous SCN1A as provided herein may result in a reduction or resolution of symptoms associated with Dravet syndrome or other disease associated with with SCN1A, or a disorder such as epilepsy associated with SCN1A haploinsufficiency. For example, treatment may improve learning, memory, cognitive and/or motor function; reduce the frequency and/or duration of seizures; and/or reduce temperature sensitivity (or increase the temperature threshold for triggering a seizure).

Согласно другому аспекту в настоящей заявке представлены способы селективной экспрессии трансгена в PV-содержащих нейронах путем введения кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в настоящей заявке представлены способы селективной экспрессии трансгена в PV-содержащих нейронах приматов путем введения кассеты эксIn another aspect, the present application provides methods for selectively expressing a transgene in PV-containing neurons by introducing an expression cassette, expression vector, or viral particle containing at least one PV-selective miRNA binding site. In certain embodiments, the present application provides methods for selectively expressing a transgene in primate PV-containing neurons by introducing an ex cassette.

- 54 046157 прессии, вектора экспрессии или вирусной частицы, содержащей трансген и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в настоящей заявке представлены способы селективной экспрессии трансгена в PV-содержащих нейронах путем введения кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно иллюстративным вариантам осуществления трансген содержит последовательность, кодирующую любой из eTF, который избирательно активирует SCN1A, как описано в настоящем документе.- 54 046157 press, expression vector or viral particle containing a transgene and at least one PV-selective microRNA binding site. In certain embodiments, the present application provides methods for selectively expressing a transgene in PV-containing neurons by introducing an expression cassette, expression vector, or viral particle containing a PV-selective regulatory element operably linked to the transgene and at least one PV-selective regulatory element. microRNA binding site. In exemplary embodiments, the transgene comprises a sequence encoding any of the eTFs that selectively activate SCN1A as described herein.

Согласно определенным вариантам осуществления в настоящей заявке представлен способ генной терапии, предусматривающий введение субъекту кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей трансген и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в заявке представлены способы генной терапии, предусматривающие введение субъекту кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно иллюстративным вариантам осуществления трансген содержит последовательность, кодирующую любой из eTF, который избирательно активирует SCN1A, как описано в настоящем документе.In certain embodiments, the present application provides a method of gene therapy comprising administering to a subject an expression cassette, expression vector, or viral particle containing a transgene and at least one PV-selective miRNA binding site. In certain embodiments, the application provides gene therapy methods comprising administering to a subject an expression cassette, expression vector, or viral particle containing a PV-selective regulatory element operably linked to a transgene and at least one PV-selective miRNA binding site. In exemplary embodiments, the transgene comprises a sequence encoding any of the eTFs that selectively activate SCN1A as described herein.

Согласно определенным вариантам осуществления в настоящей заявке представлен способ лечения заболевания или нарушения, предусматривающий введение кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей трансген и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно определенным вариантам осуществления в заявке представлены способы лечения заболевания или нарушения, предусматривающие введение субъекту кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей селективный в отношении PV регуляторный элемент, функционально связанный с трансгеном, и по меньшей мере один селективный в отношении PV сайт связывания микроРНК. Согласно иллюстративным вариантам осуществления трансген содержит последовательность, кодирующую любой из eTF, который избирательно активирует SCN1A, как описано в настоящем документе. Согласно определенным вариантам осуществления кассета экспрессии, вектор экспрессии или вирусная частица, содержащая трансген и селективный в отношении PV сайт связывания микроРНК, и, необязательно, селективный в отношении PV регуляторный элемент, могут быть использованы для лечения заболевания или нарушения, в которое вовлечены PV-содержащие нейроны. Согласно определенным вариантам осуществления кассета экспрессии, вектор экспрессии или вирусная частица, содержащая трансген и селективный в отношении PV сайт связывания микроРНК и, возможно, селективный в отношении PV регуляторный элемент, используются для лечения состояния нейронов. Нейрональные заболевания или нарушения, подходящие для лечения, включают в себя, без ограничения, синдром Драве, болезнь Альцгеймера, болезнь Паркинсона, болезнь Хантингтона, боковой амиотрофический склероз (ALS), спинальную мышечную атрофию (SMA), эпилепсию, нейродегенеративные нарушения, двигательные нарушения, нарушения настроения, болезни двигательных нейронов, прогрессирующую мышечную атрофию (PMA), прогрессирующий бульбарный паралич, псевдобульбарный паралич, первичный боковой склероз, неврологические последствия СПИДа, нарушения развития, рассеянный склероз, нейрогенетические нарушения, инсульт, травму спинного мозга, черепно-мозговую травму, таупатию, гиповозбудимость нейронов и/или припадки. Согласно некоторым вариантам осуществления вирусный вектор, вирусная частица или фармацевтическая композиция, содержащая трансген и селективный в отношении PV сайт связывания микроРНК и необязательно селективный в отношении PV регуляторный элемент, используются для лечения психического расстройства (например, шизофрении, обсессивно-компульсивного расстройства, наркомании, депрессии, тревоги, психоза); расстройства аутистического спектра (например, синдрома ломкой X-хромосомы, синдрома Ретта); эпилепсии (например, синдрома Драве, хронической травматической энцефалопатии, генерализованной эпилепсии с фебрильными припадками плюс (GEFS+), эпилептической энцефалопатии, височной эпилепсии, фокальной эпилепсии, туберозного склероза, эпилепсии, связанной с гаплонедостаточностью SCN1A); и/или нейродегенерации (например, болезни Альцгеймера, болезни Паркинсона). Заболевания, связанные с дисфункциональными нейронами PV, например, вызванные мутациями потери функции в SCN1A или Nav1.1, включают в себя: синдром Драве, синдром Охтахара, эпилепсию, раннюю детскую эпилептическую энцефалопатию 6 (EIEE6), семейные фебрильные припадки 3A (FEB3A), трудноизлечимую детскую эпилепсию с генерализованными тонико-клоническими припадками (ICEGTC), мигрень, семейную гемиплегию 3 (FHM3), синдром Панайотопулоса, семейную фибрилляцию предсердий 13 (ATFB13), генерализованную эпилепсию с фебрильными припадками плюс типа 1 (gefs + тип 1), неспецифический кардиальный синдром, неспецифический синдром Бругада дефект проводимости, генерализованную эпилепсию с фебрильными припадками плюс, доброкачественный ранний младенческий эпилептический синдром, раннюю детскую эпилептическую энцефалопатию 11 (EIEE11), доброкачественную семейную детскую эпилепсию, нейродегенерацию, таупатии и болезнь Альцгеймера.In certain embodiments, the present application provides a method of treating a disease or disorder comprising administering an expression cassette, expression vector, or viral particle containing a transgene and at least one PV-selective miRNA binding site. In certain embodiments, the application provides methods of treating a disease or disorder comprising administering to a subject an expression cassette, expression vector, or viral particle comprising a PV-selective regulatory element operably linked to a transgene and at least one PV-selective microRNA binding site . In exemplary embodiments, the transgene comprises a sequence encoding any of the eTFs that selectively activate SCN1A as described herein. In certain embodiments, an expression cassette, expression vector, or viral particle containing a transgene and a PV-selective miRNA binding site, and optionally a PV-selective regulatory element, can be used to treat a disease or disorder that involves PV-containing neurons. In certain embodiments, an expression cassette, expression vector, or viral particle containing a transgene and a PV-selective miRNA binding site and optionally a PV-selective regulatory element is used to treat a neuronal condition. Neuronal diseases or disorders suitable for treatment include, but are not limited to, Dravet syndrome, Alzheimer's disease, Parkinson's disease, Huntington's disease, amyotrophic lateral sclerosis (ALS), spinal muscular atrophy (SMA), epilepsy, neurodegenerative disorders, movement disorders, mood disorders, motor neuron diseases, progressive muscular atrophy (PMA), progressive bulbar palsy, pseudobulbar palsy, primary lateral sclerosis, neurological effects of AIDS, developmental disorders, multiple sclerosis, neurogenetic disorders, stroke, spinal cord injury, traumatic brain injury, tauopathy , neuronal hypoexcitability and/or seizures. In some embodiments, a viral vector, viral particle, or pharmaceutical composition comprising a transgene and a PV-selective microRNA binding site and optionally a PV-selective regulatory element is used to treat a mental disorder (e.g., schizophrenia, obsessive-compulsive disorder, drug addiction, depression , anxiety, psychosis); autism spectrum disorders (eg, fragile X syndrome, Rett syndrome); epilepsy (eg, Dravet syndrome, chronic traumatic encephalopathy, generalized epilepsy with febrile seizures plus (GEFS+), epileptic encephalopathy, temporal lobe epilepsy, focal epilepsy, tuberous sclerosis, epilepsy associated with SCN1A haploinsufficiency); and/or neurodegeneration (eg, Alzheimer's disease, Parkinson's disease). Diseases associated with dysfunctional PV neurons, such as those caused by loss-of-function mutations in SCN1A or Nav1.1, include: Dravet syndrome, Ohtahara syndrome, epilepsy, early childhood epileptic encephalopathy 6 (EIEE6), familial febrile seizures 3A (FEB3A), intractable childhood epilepsy with generalized tonic-clonic seizures (ICEGTC), migraine, familial hemiplegia 3 (FHM3), Panagiotopoulos syndrome, familial atrial fibrillation 13 (ATFB13), generalized epilepsy with febrile seizures plus type 1 (gefs + type 1), nonspecific cardiac syndrome, nonspecific Brugada syndrome conduction defect, generalized epilepsy with febrile seizures plus, benign early infantile epileptic syndrome, early childhood epileptic encephalopathy 11 (EIEE11), benign familial childhood epilepsy, neurodegeneration, tauopathies and Alzheimer's disease.

Согласно определенным вариантам осуществления лечение с использованием кассеты экспрессии, вектора экспрессии или вирусной частицы, содержащей трансген и селективный в отношении PV сайтIn certain embodiments, treatment using an expression cassette, expression vector, or viral particle containing a transgene and a PV selective site

- 55 046157 связывания микроРНК, и, возможно, селективный в отношении PV регуляторный элемент, описанный в настоящем документе, приводит к улучшению симптомов, связанных с заболеванием или нарушением нейронов. Например, за пациентом с болезнью Паркинсона можно наблюдать симптоматически на предмет улучшения двигательных функций, что указывает на положительный ответ на лечение. Введение терапии с использованием описанного в настоящем документе способа субъекту с риском развития нейронального нарушения может предотвратить развитие или замедлить прогрессирование одного или нескольких симптомов.- 55 046157 microRNA binding, and possibly the PV-selective regulatory element described herein, leads to improvement of symptoms associated with a neuronal disease or disorder. For example, a patient with Parkinson's disease may be monitored symptomatically for improvement in motor function, indicating a positive response to treatment. Administration of therapy using the method described herein to a subject at risk of developing a neuronal disorder may prevent the development or slow the progression of one or more symptoms.

Согласно определенным вариантам осуществления кассета экспрессии, вектор экспрессии или вирусная частица, содержащая трансген и селективный в отношении PV сайт связывания микроРНК, и, необязательно, селективный в отношении PV регуляторный элемент, представленные в настоящем документе, могут быть использованы для лечения субъекта, у которого было диагностировано заболевание нейронов, например, эпилепсия, связанная с гаплонедостаточностью SCN1A, такая как, например, синдром Драве. Согласно различным вариантам осуществления любое из нейрональных заболеваний или нарушений, описанных в настоящем документе, вызвано известным генетическим событием (например, любой из мутаций SCN1A, известных в настоящей области техники) или имеет неизвестную причину.In certain embodiments, an expression cassette, expression vector, or viral particle comprising a transgene and a PV-selective miRNA binding site, and optionally a PV-selective regulatory element, provided herein can be used to treat a subject who has A neuronal disease has been diagnosed, such as epilepsy associated with SCN1A haploinsufficiency, such as Dravet syndrome. In various embodiments, any of the neuronal diseases or disorders described herein are caused by a known genetic event (eg, any of the SCN1A mutations known in the art) or have an unknown cause.

Согласно определенным вариантам осуществления кассета экспрессии, вектор экспрессии или вирусная частица, содержащая трансген и селективный в отношении PV сайт связывания микроРНК, и, возможно, селективный в отношении PV регуляторный элемент, представленные в настоящем документе, могут быть использованы для лечения субъекта, который находится в группе риска развития заболевания или нарушения. Согласно определенным вариантам осуществления может быть известно, что субъект предрасположен к заболеванию, например, нейрональному заболеванию (например, эпилепсии, связанной с гаплонедостаточностью SCN1A, такой как, например, синдром Драве). Согласно определенным вариантам осуществления субъект может быть предрасположен к заболеванию из-за генетического события или из-за известных факторов риска. Например, субъект может нести мутацию в SCN1A, которая связана с эпилепсией или синдромом Драве, например, вставку, делецию, инверсию, транслокацию или замену (например, точечную мутацию, включая в себя нонсенс-мутацию и/или миссенс-мутацию).In certain embodiments, an expression cassette, expression vector, or viral particle containing a transgene and a PV-selective miRNA binding site, and optionally a PV-selective regulatory element provided herein, can be used to treat a subject who is in group at risk of developing a disease or disorder. In certain embodiments, it may be known that the subject is predisposed to a disease, such as a neuronal disease (eg, epilepsy associated with SCN1A haploinsufficiency, such as, for example, Dravet syndrome). In certain embodiments, the subject may be predisposed to a disease due to a genetic event or due to known risk factors. For example, a subject may carry a mutation in SCN1A that is associated with epilepsy or Dravet syndrome, such as an insertion, deletion, inversion, translocation or substitution (eg, a point mutation, including a nonsense mutation and/or a missense mutation).

Согласно определенным вариантам осуществления кассета экспрессии, вектор экспрессии или вирусная частица, содержащая трансген и селективный в отношении PV сайт связывания микроРНК, и, возможно, селективный регуляторный элемент PV, представленные в настоящем документе, могут быть использованы для уменьшения одного или нескольких симптомов, связанных с заболеванием или нарушением. Например, симптомы, связанные с синдромом Драве, включают в себя судороги, дефекты памяти, задержку развития, плохой мышечный тонус и/или когнитивные проблемы. Лечение вирусным вектором, вирусной частицей или фармацевтической композицией, содержащей трансген и селективный в отношении PV сайт связывания микроРНК и, необязательно, селективный в отношении PV регуляторный элемент, представленные в настоящем документе, может привести к улучшению одного или нескольких симптомов, таких как уменьшение количества, продолжительности и/или интенсивность припадков.In certain embodiments, an expression cassette, expression vector, or viral particle containing a transgene and a PV-selective miRNA binding site, and optionally a PV selective regulatory element, provided herein can be used to reduce one or more symptoms associated with disease or disorder. For example, symptoms associated with Dravet syndrome include seizures, memory defects, developmental delays, poor muscle tone, and/or cognitive problems. Treatment with a viral vector, viral particle, or pharmaceutical composition comprising a transgene and a PV-selective miRNA binding site and, optionally, a PV-selective regulatory element provided herein may result in improvement of one or more symptoms, such as a decrease in the number, duration and/or intensity of seizures.

Согласно определенным вариантам осуществления описанные в настоящем документе способы используются для увеличения экспрессии трансгена в нейроне PV, генной терапии или лечения заболевания или нарушения у приматов. Согласно определенным вариантам осуществления примат представляет собой человека. Согласно определенным вариантам осуществления примат представляет собой отличного от человека примата. Согласно определенным вариантам осуществления отличный от человека примат представляет собой обезьяну старого мира, орангутана, гориллу, шимпанзе, яванского макака, макака-резус или свинохвостого макака.In certain embodiments, the methods described herein are used to increase transgene expression in a PV neuron, gene therapy, or treat a disease or disorder in primates. In certain embodiments, the primate is a human. In certain embodiments, the primate is a non-human primate. In certain embodiments, the non-human primate is an old world monkey, an orangutan, a gorilla, a chimpanzee, a cynomolgus monkey, a rhesus monkey, or a pig-tailed monkey.

Термины субъект и индивидуум используются в настоящем документе взаимозаменяемо для обозначения позвоночного животного, предпочтительно млекопитающего, более предпочтительно человека. Описанные в настоящем документе способы могут быть применимы в терапевтических целях для человека, в ветеринарии и/или в доклинических исследованиях на животных моделях заболевания или состояния. Согласно различным вариантам осуществления субъект, которого можно лечить в соответствии с описанными в настоящем документе способами, представляет собой млекопитающее, такое как, например, мышь, крыса, хомяк, морская свинка, песчанка, корова, овца, свинья, коза, осел, лошадь, собака, кошка, лама, обезьяна (например, обезьяна старого мира, мартышка или макак, такой как макак-резус, свинохвостый макак или яванский макак (например, макак-крабоед)), обезьяна (например, орангутан, горилла или шимпанзе) или человек. Согласно иллюстративному варианту осуществления субъект представляет собой человека.The terms subject and individual are used interchangeably herein to refer to a vertebrate animal, preferably a mammal, more preferably a human. The methods described herein may be useful for human therapeutic purposes, veterinary medicine, and/or preclinical studies in animal models of a disease or condition. In various embodiments, the subject that can be treated in accordance with the methods described herein is a mammal, such as, for example, a mouse, rat, hamster, guinea pig, gerbil, cow, sheep, pig, goat, donkey, horse, dog, cat, llama, monkey (such as an old world monkey, a marmoset, or a macaque such as a rhesus macaque, pig-tailed macaque, or cynomolgus macaque (such as a cynomolgus macaque)), an ape (such as an orangutan, a gorilla, or a chimpanzee), or a human . In an exemplary embodiment, the subject is a human.

В следующих таблицах представлены раскрытые в настоящем документе последовательности.The following tables present the sequences disclosed herein.

Таблица 1. Раскрытые в настоящем документе иллюстративные сконструированные факторы транскрипции. Последовательности регуляторных элементов (RE) раскрыты ниже в табл. 2 и 8. Для RE, когда указан m1, это означает, что сайт связывания микроРНК m1 (SEQ ID NO: 7, табл. 8) включен между кодирующей областью и полиА-хвостом. Последовательности ДНК-связывающих доменов (DBD) раскрыты ниже в табл. 3. Для DBD сконструированный цинковый палец (eZF) указывает на то, что конструкция имеет формулу, изложенную в SEQ ID NO: 147 (табл. 10); EGR1 указывает на то, что DBD происхоTable 1. Exemplary engineered transcription factors disclosed herein. The sequences of regulatory elements (RE) are disclosed below in table. 2 and 8. For RE, when m1 is specified, this means that the miRNA binding site m1 (SEQ ID NO: 7, Table 8) is included between the coding region and the polyA tail. The DNA binding domain (DBD) sequences are disclosed in Table 1 below. 3. For DBD, the engineered zinc finger (eZF) indicates that the design has the formula set forth in SEQ ID NO: 147 (Table 10); EGR1 indicates that DBD is occurring

- 56 046157 дит от человеческого EGR1 дикого типа (SEQ ID NO: 176; табл. 12); и EGR3 указывает на то, что DBD происходит от человеческого EGR3 дикого типа (SEQ ID NO: 175, табл. 12). Последовательности для целевых сайтов (например, последовательности, связанные с DBD) представлены в табл. 4 ниже. Последовательности для доменов активации транскрипции (TAD) раскрыты ниже в табл. 5. Для TAD (c) указывает на то, что TAD расположен на c-конце DBD, (n) указывает на то, что TAD расположен на n-конце DBD, (n/c) означает, что существует TAD, расположенный как на n-конце, так и на c-конце DBD, a 2x CITED4 (n) указывает на то, что есть 2 копии TAD CITED4, расположенные на n-конце DBD. Последовательности сконструированных факторов транскрипции полной длины (DBD + TAD) представлены в табл. 6 ниже.- 56046157 dit from wild type human EGR1 (SEQ ID NO: 176; Table 12); and EGR3 indicates that the DBD is derived from wild-type human EGR3 (SEQ ID NO: 175, Table 12). Sequences for target sites (eg, sequences associated with the DBD) are presented in Table. 4 below. The sequences for transcription activation domains (TADs) are disclosed below in table. 5. For TAD (c) indicates that the TAD is located at the c-terminus of the DBD, (n) indicates that the TAD is located at the n-terminus of the DBD, (n/c) indicates that there is a TAD located both at the n-terminus and the c-terminus of the DBD, and 2x CITED4 (n) indicates that there are 2 copies of the CITED4 TAD located at the n-terminus of the DBD. The sequences of the designed full-length transcription factors (DBD + TAD) are presented in Table. 6 below.

Таблица 1Table 1

Конструкция Design RE RE DBD DBD Целевой сайт Target site TAD (положение) TAD (position) SEQ ID NO (DBD) SEQ ID NO (DBD) SEQ ID NO (DBD + TAD) SEQ ID NO (DBD+TAD) 1 1 RE 1 RE 1 eZF eZF Z13 Z13 VPR (c) VPR (c) 89 89 99 99 2 2 RE 1 RE 1 eZF eZF Z1 Z1 VPR (c) VPR (c) 77 77 100 100 3 3 RE 1 RE 1 eZF eZF Z13 Z13 VP64 (c) VP64(c) 89 89 101 101 4 4 RE 1 RE 1 eZF eZF Z1 Z1 VP64 (c) VP64(c) 77 77 102 102 5 5 RE 1 RE 1 EGR1 EGR1 Z13 Z13 CITED4 (n/c) CITED4 (n/c) 93 93 103 103 6 6 RE 1 RE 1 EGR1 EGR1 Z13 Z13 CITED4 (n) CITED4(n) 93 93 104 104 7 7 RE 1 RE 1 EGR1 EGR1 Z1 Z1 CITED4 (n/c) CITED4 (n/c) 92 92 105 105 8 8 RE 1 RE 1 EGR1 EGR1 Z1 Z1 CITED4 (n) CITED4(n) 92 92 106 106 9 9 RE 1 RE 1 EGR1 EGR1 Z1 Z1 CITED4 (c) CITED4 (c) 92 92 107 107 10 10 RE 1 RE 1 EGR1 EGR1 Z1 Z1 CITED2 (c) CITED2 (c) 92 92 108 108 И AND RE 1 RE 1 EGR1 EGR1 Z1 Z1 CITED2 (n) CITED2(n) 92 92 109 109 12 12 RE 1 RE 1 EGR3 EGR3 Z1 Z1 CITED4 (n/c) CITED4 (n/c) 96 96 110 110 13 13 RE 1 RE 1 EGR3 EGR3 Z1 Z1 CITED4 (c) CITED4 (c) 96 96 111 111 14 14 RE 1 RE 1 EGR3 EGR3 Z1 Z1 CITED2 (c) CITED2 (c) 96 96 112 112 15 15 RE 1 RE 1 EGR3 EGR3 Z1 Z1 CITED2 (n) CITED2(n) 96 96 113 113 16 16 СВА NVA EGR3 EGR3 Z15 Z15 N/A N/A 98 98 114 114 17 17 RE 1 RE 1 EGR1 EGR1 Z13 Z13 N/A N/A 93 93 115 115 18 18 RE 1 RE 1 EGR1 EGR1 Z15 Z15 N/A N/A 94 94 116 116 19 19 RE 1 RE 1 EGR1 EGR1 Z13 Z13 N/A N/A 93 93 117 117 20 20 RE 1 RE 1 EGR1 EGR1 Z13 Z13 N/A N/A 93 93 115 115 21 21 RE 1 RE 1 EGR1 EGR1 Z1 Z1 N/A N/A 92 92 118 118 22 22 СВА NVA EGR3 EGR3 Z13 Z13 N/A N/A 97 97 119 119 23 23 RE 1 RE 1 EGR1 EGR1 Z17 Z17 N/A N/A 95 95 120 120 24 24 RE 1 RE 1 EGR1 EGR1 Z13 Z13 N/A N/A 93 93 121 121 25 25 СВА NVA EGR3 EGR3 Z1 Z1 N/A N/A 96 96 122 122 26 26 RE 1 RE 1 EGR1 EGR1 Z1 Z1 N/A N/A 92 92 123 123 27 27 RE 1 RE 1 EGR1 EGR1 Z1 Z1 N/A N/A 92 92 124 124 28 28 RE 1 RE 1 eZF eZF Z8 Z8 VP64 (c) VP64(c) 84 84 125 125 29 29 RE 1 RE 1 eZF eZF Z14 Z14 VP64 (c) VP64(c) 90 90 126 126 30 thirty СВА NVA eZF eZF Z13 Z13 VPR (c) VPR (c) 89 89 99 99 31 31 RE2(ml) RE2(ml) eZF eZF Z1 Z1 VP64 (c) VP64(c) 77 77 102 102 32 32 RE2 RE2 eZF eZF Z1 Z1 VP64 (c) VP64(c) 77 77 102 102 33 33 RE2 RE2 eZF eZF Z1 Z1 VPR (c) VPR (c) 77 77 100 100 34 34 RE2 RE2 eZF eZF Z1 Z1 VP64 (c) VP64(c) 77 77 127 127 35 35 RE 2 (ml) RE 2 (ml) eZF eZF Z1 Z1 VP64 (c) VP64(c) 77 77 127 127 36 36 RE2 RE2 EGR1 EGR1 Z1 Z1 CITED4 (n) CITED4(n) 92 92 128 128 37 37 RE 2 (ml) RE 2 (ml) EGR1 EGR1 Z1 Z1 CITED4 (n) CITED4(n) 92 92 106 106 38 38 RE 2 (ml) RE 2 (ml) EGR1 EGR1 Z1 Z1 CITED4 (n) CITED4(n) 92 92 129 129 39 39 RE 2 (ml) RE 2 (ml) EGR1 EGR1 Z1 Z1 CITED4 (n/c) CITED4 (n/c) 92 92 105 105 40 40 RE 2 (ml) RE 2 (ml) EGR1 EGR1 Z1 Z1 2x CITED4 (n) 2x CITED4 (n) 92 92 130 130

- 57 046157- 57 046157

41 41 RE2(ml) RE2(ml) EGR1 EGR1 Z1 Z1 2x CITED4 (n) 2x CITED4 (n) 92 92 131 131 42 42 RE 2 (m2) RE 2 (m2) eZF eZF Z1 Z1 VP64 (c) VP64(c) 77 77 102 102 43 43 RE 2 (m3) RE 2 (m3) eZF eZF Z1 Z1 VP64 (c) VP64(c) 77 77 102 102 44 44 RE 2 (m2) RE 2 (m2) EGR1 EGR1 Z1 Z1 CITED4 (n) CITED4(n) 92 92 106 106 45 45 RE 2 (m3) RE 2 (m3) EGR1 EGR1 Z1 Z1 CITED4 (n) CITED4(n) 92 92 106 106 46 46 RE 1 RE 1 EGR1 EGR1 Z1 Z1 CITED4 (n) CITED4(n) 92 92 205 205 47 47 RE 1 RE 1 EGR1 EGR1 Z1 Z1 2x CITED4 (n) 2x CITED4 (n) 92 92 207 207 48 48 RE 1 RE 1 EGR1 EGR1 Z1 Z1 2x CITED4 (n) 2x CITED4 (n) 92 92 209 209 49 49 CBA C.B.A. eZF eZF Z1 Z1 CREB3 (n) CREB3(n) 77 77 213 213 50 50 CBA C.B.A. EGR1 EGR1 Z1 Z1 CREB3 (n) CREB3(n) 92 (без Сконц. Lys) 92 (without Conc. Lys) 217 217 51 51 CBA C.B.A. EGR1 EGR1 Z13 Z13 CREB3 (n) CREB3(n) 93 (без Сконц. Lys) 93 (without Conc. Lys) 219 219 52 52 CBA C.B.A. eZF eZF Z1 Z1 CREB3 (n); без домена TM на (с) CREB3(n); without TM domain on (c) 77 77 221 221 53 53 CBA C.B.A. EGR1 EGR1 Z1 Z1 CREB3 (п); без домена ТМ на (с) CREB3(n); without TM domain on (c) 92 (без Сконц. Lys) 92 (without Conc. Lys) 223 223

Таблица 2 Последовательности нуклеиновых кислот для различных регуляторных элементов (RE), ____________________раскрытых в настоящем документе____________________Table 2 Nucleic acid sequences for various regulatory elements (RE) ____________________disclosed herein____________________

RE RE Последовательность Subsequence SEQ ID NO SEQ ID NO RE 1 RE 1 GTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAG CGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATT GACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGG GACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACG CAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATA AGCAGAGCTGGTACCGTGTGTATGCTCAGGGGCTGGGAA AGGAGGGGAGGGAGCTCCGGCTCAG GTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAG CGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATT GACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGG GACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACG CAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATA AGCAGAGCTGGTACCGTGTGTATGCTCAGGGGCTGGGAA A GGAGGGGAGGGAGCTCCGGCTCAG 1 1 RE2 RE2 ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggtaacatatttt gaagttctgttgacataaagaatcatgatattaatgcccatggaaatgaaagggcgatcaacac tatggtttgaaaagggggaaattgtagagcacagatgtgttcgtgtggcagtgtgctgtctctag caatactcagagaagagagagaacaatgaaattctgattggccccagtgtgagcccagatga ggttcagctgccaactttctctttcacatcttatgaaagtcatttaagcacaactaactttttttttttttt tttttttttgagacagagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggct cactgcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagctgga attacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacgggggtttcaccat atcacccaggctggtctcgaactcctggcctcaagtgatccacctgcctcggcctcccaaagt gctgggattataggcgtcagccactatgcccaacccgaccaaccttttttaaaataaatatttaaa aaattggtatttcacatatatactagtatttacatttatccacacaaaacggacgggcctccgctg aaccagtgaggccccagacgtgcgcataaataacccctgcgtgctgcaccacctggggaga gggggaggaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttctc tgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccagggctggagc ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggtaacatatttt gaagttctgttgacataaagaatcatgattaatgcccatggaaatgaaagggcgatcaacac tatggtttgaaaagggggaaattgtagagcacagatgtgttcgtgtggcagtgtgctgtctctag caatactcagaga agagagagaacaatgaaattctgattggccccagtgtgagcccagatga ggttcagctgccaactttctctttcacatcttatgaaagtcatttaagcacaactaactttttttttttttt tttttttttgagacagagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggct cactgcagcct ccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagctgga attacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacgggggtttcaccat atcacccaggctggtctcgaactcctggcctcaagtgatccacctgcctcggcctcccaaagt gctgggattataggcgtcagccactatgcccaacc cgaccaaccttttttaaaataaatatttaaa aaattggtatttcacatatatactagtatttacatttatccacacaaaacggacgggcctccgctg aaccagtgaggccccagacgtgcgcataaataacccctgcgtgctgcaccacctggggaga gggggaggaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtcctt ttctc tgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccagggctggagc 2 2

- 58 046157- 58 046157

tcaaggaagcgtcgcagggtcacagatctgggggaaccccggggaaaagcactgaggcaa aaccgccgctcgtctcctacaatatatgggagggggaggttgagtacgttctggattactcata agaccttttttttttccttccgggcgcaaaaccgtgagctggatttataatcgccctataaagctcc agaggcggtcaggcacctgcagaggagccccgccgctccgccgactagctgcccccgcga gcaacggcctcgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacc ccggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcgagaggga actagcgagaacgaggaagcagctggaggtgacgccgggcagattacgcctgtcagggcc gagccgagcggatcgctgggcgctgtgcagaggaaaggcgggagtgcccggctcgctgtc gcagagccgaggtgggtaagctagcgaccacctggacttcccagcgcccaaccgtggctttt cagccaggtcctctcctcccgcggcttctcaaccaaccccatcccagcgccggccacccaac ctcccgaaatgagtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgtta cttttccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcggggct agagtgcaaggtgactgtggttcttctctggccaagtccgagggagaacgtaaagatatgggc ctttttccccctctcaccttgtctcaccaaagtccctagtccccggagcagttagcctctttctttcc agggaattagccagacacaacaacgggaaccagacaccgaaccagacatgcccgccccgt gcgccctccccgctcgctgcctttcctccctcttgtctctccagagccggatcttcaaggggag cctccgtgcccccggctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcac agctctcgcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtagag gccccgggacgaccgagctg tcaaggaagcgtcgcagggtcacagatctgggggaaccccggggaaaagcactgaggcaa aaccgccgctcgtctcctacaatatatgggagggggaggttgagtacgttctggattactcata agacctttttttttccttccgggcgcaaaaccgtgagctggatttataatcgccctataaagctcc agaggcggtca ggcacctgcagaggagccccgccgctccgccgactagctgcccccgcga gcaacggcctcgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacc ccggagccgtgcagccgcctctccgaatctctcttctcctggcgctcgcgtgcgagaggga actagcgagaacgaggaagcagctggaggt gacgccgggcagattacgcctgtcagggcc gagccgagcggatcgctgggcgctgtgcagaggaaaggcgggagtgcccggctcgctgtc gcagagccgaggtgggtaagctagcgaccacctggacttcccagcgcccaaccgtggctttt cagccaggtcctctcctcccgcggcttctcaaccaaccccatcccag cgccggccacccaac ctcccgaaatgagtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgtta cttttccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcggggct agagtgcaaggtgactgtggttcttctctggccaagtccgagggagaacgtaaaga tatgggc ctttttccccctctcaccttgtctcaccaaagtccctagtccccggagcagttagcctctttctttcc agggaattagccagacacaacaacgggaaccagacaccgaaccagacatgcccgccccgt gcgccctccccgctcgctgcctttcctccctcttgtctctccagagccggatcttcaaggggag cctccgtgc ccccggctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcac agctctcgcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtagag gccccgggacgaccgagctg RE 3 RE 3 TCAACAGGGGGACACTTGGGAAAGAAGGATGGGGACAG AGCCGAGAGGACTGTTACACATTAGAGAAACATCAGTG ACTGTGCCAGCTTTGGGGTAGACTGCACAAAAGCCCTGA GGCAGCACAGGCAGGATCCAGTCTGCTGGTCCCAGGAA GCTAACCGTCTCAGACAGAGCACAAAGCACCGAGACAT GTGCCACAAGGCTTGTGTAGAGAGGTCAGAGGACAGCG TACAGGTCCCAGAGATCAAACTCAACCTCACCAGGCTTG GCAGCAAGCCTTTACCAACCCACCCCCACCCCACCCACC CTGCACGCGCCCCTCTCCCCTCCCCATGGTCTCCCATGGC TATCTCACTTGGCCCTAAAATGTTTAAGGATGACACTGG CTGCTGAGTGGAAATGAGACAGCAGAAGTCAACAGTAG ATTTTAGGAAAGCCAGAGAAAAAGGCTTGTGCTGTTTTT AGAAAGCCAAGGGACAAGCTAAGATAGGGCCCAAGTAA TGCTAGTATTTACATTTATCCACACAAAACGGACGGGCC TCCGCTGAACCAGTGAGGCCCCAGACGTGCGCATAAATA ACCCCTGCGTGCTGCACCACCTGGGGAGAGGGGGAGGA CCACGGTAAATGGAGCGAGCGCATAGCAAAAGGGACGC GGGGTCCTTTTCTCTGCCGGTGGCACTGGGTAGCTGTGG CCAGGTGTGGTACTTTGATGGGGCCCAGGGCTGGAGCTC AAGGAAGCGTCGCAGGGTCACAGATCTGGGGGAACCCC GGGGAAAAGCACTGAGGCAAAACCGCCGCTCGTCTCCT ACAATATATGGGAGGGGGAGGTTGAGTACGTTCTGGATT ACTCATAAGACCTTTTTTTTTTCCTTCCGGGCGCAAAACC GTGAGCTGGATTTATAATCGCCCTATAAAGCTCCAGAGG CGGTCAGGCACCTGCAGAGGAGCCCCGCCGCTCCGCCGA CTAGCTGCCCCCGCGAGCAACGGCCTCGTGATTTCCCCG CCGATCCGGTCCCCGCCTCCCCACTCTGCCCCCGCCTACC CCGGAGCCGTGCAGCCGCCTCTCCGAATCTCTCTCTTCTC CTGGCGCTCGCGTGCGAGAGGGAACTAGCGAGAACGAG GAAGCAGCTGGAGGTGACGCCGGGCAGATTACGCCTGT TCAACAGGGGGACACTTGGGAAAGAAGGATGGGGACAG AGCCGAGAGGACTGTTACACATTAGAGAAACATCAGTG ACTGTGCCAGCTTTGGGGTAGACTGCACAAAAGCCCTGA GGCAGCACAGGCAGGATCCAGTCTGCTGGTCCCAGGAA GCTAACCGTCTCAGACAGAGCACAAAGCACCGAGACAT GTGCCACAAGGCTTGTGTAGAGAGGTCAGAGGACAGCG TACAGGTCC CAGAGATCAAACTCAACCTCACCAGGCTTG GCAGCAAGCCTTTACCAACCCACCCCCACCCCACCCACC CTGCACGCGCCCCTCTCCCCTCCCCATGGTCTCCCATGGC TATCTCACTTGGCCCTAAAATGTTTAAGGATGACACTGG CTGCTGAGTGGAAATGAGACAGCAGAAGTCAACAGTAG ATTTTAGGAAAGCCAGAGAAAAAGGCTTGTGCTGTTTTTT AGAAAGCCAAGGGACAA GCTAAGATAGGGCCCAAGTAA TGCTAGTATTTACATTTATCCACACAAAACGGACGGGCC TCCGCTGAACCAGTGAGGCCCCAGACGTGCGCATAAATA ACCCCTGCGTGCTGCACCACCTGGGGAGAGGGGGAGGA CCACGGTAAATGGAGCGAGCGCATAGCAAAAGGGACGC GGGGTCCTTTTCTCTGCCGGTGGCACTGGGTAGCTGTGG CCAGGTGTGGTACTTTGATGGGGCCCAGGGCT GGAGCTC AAGGAAGCGTCGCAGGGTCACAGATCTGGGGGAACCCC GGGGAAAAGCACTGAGGCAAAACCGCCGCTCGTCTCCT ACAATATATGGGAGGGGGAGGTTGAGTACGTTCTGGATT ACTCATAAGACCTTTTTTTTTTCCTTCCGGGCGCAAAACC GTGAGCTGGATTTATAATCGCCCTATAAAGCTCCAGAGG CGGTCAGGCACCTGCAGAGGAGCCCCGCCGCTCCGCCGA CTAGCT GCCCCCGCGAGCAACGGCCTCGTGATTTCCCCG CCGATCCGGTCCCCGCCTCCCCACTCTGCCCCCGCCTACC CCGGAGCCGTGCAGCCGCCTCTCCGAATCTCTCTCTTCTC CTGGCGCTCGCGTGCGAGAGGGAACTAGCGAGAACGAG GAAGCAGCTGGAGGTGACGCCGGGCAGATTACGCCTGT 3 3

- 59 046157- 59 046157

CAGGGCCGAGCCGAGCGGATCGCTGGGCGCTGTGCAGA GGAAAGGCGGGAGTGCCCGGCTCGCTGTCGCAGAGCCG AGGTGGGTAAGCTAGCGACCACCTGGACTTCCCAGCGCC CAACCGTGGCTTTTCAGCCAGGTCCTCTCCTCCCGCGGCT TCTCAACCAACCCCATCCCAGCGCCGGCCACCCAACCTC CCGAAATGAGTGCTTCCTGCCCCAGCAGCCGAAGGCGCT ACTAGGAACGGTAACCTGTTACTTTTCCAGGGGCCGTAG TCGACCCGCTGCCCGAGTTGCTGTGCGACTGCGCGCGCG GGGCTAGAGTGCAAGGTGACTGTGGTTCTTCTCTGGCCA AGTCCGAGGGAGAACGTAAAGATATGGGCCTTTTTCCCC CTCTCACCTTGTCTCACCAAAGTCCCTAGTCCCCGGAGC AGTTAGCCTCTTTCTTTCCAGGGAATTAGCCAGACACAA CAACGGGAACCAGACACCGAACCAGACATGCCCGCCCC GTGCGCCCTCCCCGCTCGCTGCCTTTCCTCCCTCTTGTCT CTCCAGAGCCGGATCTTCAAGGGGAGCCTCCGTGCCCCC GGCTGCTCAGTCCCTCCGGTGTGCAGGACCCCGGAAGTC CTCCCCGCACAGCTCTCGCTTCTCTTTGCAGCCTGTTTCT GCGCCGGACCAGTCGAGGACTCTGGACAGTAGAGGCCC CGGGACGACCGAGCTG CAGGGCCGAGCCGAGCGGATCGCTGGGCGCTGTGCAGA GGAAAGGCGGGAGTGCCCGGCTCGCTGTCGCAGAGCCG AGGTGGGTAAGCTAGGCGACCACCTGGACTTCCCAGCGCC CAACCGTGGCTTTTCAGCCAGGTCCTCTCCTCCCGCGGCT TCTCAACCAACCCCATCCCAGCGCCGGCCACCCAACCTC CCGAAATGAGTGCTTCCTGCCCCAGCAGCCGAAGGCGCT ACTAGGAAC GGTAACCTGTTACTTTTCCAGGGGCCGTAG TCGACCCGCTGCCCGAGTTGCTGTGCGACTGCGCGCGCG GGGCTAGAGTGCAAGGTGACTGTGGTTCTTCTCTGGCCA AGTCCGAGGGAGAACGTAAAGATATGGGCCTTTTTCCCC CTCTCACCTTGTCTCACCAAAGTCCCTAGTCCCCGGAGC AGTTAGCCTCTTTCTTTCCAGGGAATTAGCCAGACACAA CAACGGGAAC CAGACACCGAACCAGACATGCCCGCCCC GTGCGCCTCCCCGCTCGCTGCCTTTCCTCCCTCTTGTCT CTCCAGAGCCGGATCTTCAAGGGGAGCCTCCGTGCCCCC GGCTGCTCAGTCCCTCCGGTGTGCAGGACCCCGGAAGTC CTCCCCGCACAGCTCTCGCTTCTCTTTGCAGCCTGTTTCT GGCGCCGGACCAGTCGAGGACTCTGGACAGTAGAGGCCC CGGGACGACCGA GCTG RE 4 RE 4 GCCCTCTAGGCCACCTGACCAGGTCCCCTCAGTCCCCCC CTTCCCACACTCCCACACTCAGCCCCCCTCCCCCCCCCCC GACCCCTGCAGGATTATCCTGTCTGTGTTCCTGACTCAGC CTGGGAGCCACCTGGGCAGCAGGGGCCAAGGGTGTCCT AGAAGGGACCTGGAGTCCACGCTGGGCCAAGCCTGCCCT TTCTCCCTCTGTCTTCCGTCCCTGCTTGCGGTTCTGCTGA ATGTGGTTATTTCTCTGGCTCCTTTTACAGAGAATGCTGC TGCTAATTTTATGTGGAGCTCTGAGGCAGTGTAATTGGA AGCCAGACACCCTGTCAGCAGTGGGCTCCCGTCCTGAGC TGCCATGCTTCCTGCTCTCCTCCCGTCCCGGCTCCTCATT TCATGCAGCCACCTGTCCCAGGGAGAGAGGAGTCACCCA GGCCCCTCAGTCCGCCCCTTAAATAAGAAAGCCTCCGTT GCTCGGCACACATACCAAGCAGCCGCTGGTGCAATCT GCCCTCTAGGCCACCTGACCAGGTCCCCTCAGTCCCCCCC CTTCCCACACTCCCACACTCAGCCCCCCTCCCCCCCCCCC GACCCCTGCAGGATTATCCTGTCTGTGTTCCTGACTCAGC CTGGGAGCCACCTGGGCAGCAGGGGCCAAGGGTGTCCT AGAAGGGACCTGGAGTCCACGCTGGGCCAAGCCTGCCCT TTCTCCCTCTGTCTTCCGTCCCTGCTTGCGGTTCTGCTGA ATGTGGTTATTTCTCTGGCTCCTTTTACAGAGAATGCTGC TGCTAATTTTATGTGGAGCTCTGAGGCAGTGTAATTGGA AGCCAGACACCCTGTCAGCAGTGGGCTCCCGTCCTGAGC TGCCATGCTTCCTGCTCTCCTCCCGTCCCGGCTCCTCATT TCATGCAGCCACCTGTCCCAGGGAGAGAGGAGTCACCCA GGCCCCTCAGTCCGCCCCTTAAATAAGAAAGCCTCCGTT GCTCGGCACACATACCAAGCAGCCGCTGGTGCAATCT 4 4 СВА (энхансер CMV + промотор бетаактина кур) CBA (CMV enhancer + chicken betaactin promoter) CGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACC GCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTA TGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACG TCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGC AGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTAT TGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGC CCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTA CATCTACGTATTAGTCATCGCTATTACCATGggtcgaggtgagc cccacgttctgcttcactctccccatctcccccccctccccacccccaattttgtatttatttatttttt aattattttgtgcagcgatgggggcggggggggggggggcgcgcgccaggcggggcggg gcggggcgaggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagag cggcgcgctccgaaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagc gaagcgcgcggcgggcgggagtcgctgcgttgccttcgccccgtgccccgctccgcgccg cctcgcgccgcccgccccggctctgactgaccgcgttactcccacaggtgagcgggcggga cggcccttctcctccgggctgtaattagcgcttggtttaatgacggctcgtttcttttctgtggctg cgtgaaagccttaaagggctccgggagggccctttgtgcgggggggagcggctcgggggg tgcgtgcgtgtgtgtgtgcgtggggagcgccgcgtgcggcccgcgctgcccggcggctgtg agcgctgcgggcgcggcgcggggctttgtgcgctccgcgtgtgcgcgaggggagcgcgg CGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACC GCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTA TGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACG TCAATGGTGGAGTATTTACGGTAAACTGCCCACTTGGC AGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTAT TGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGC CCAGTA CATGACCTTATGGGACTTTCCTACTTGGCAGTA CATCTACGTATTAGTCATCGCTATTACCATGggtcgaggtgagc cccacgttctgcttcactctccccatctcccccccctccccacccccaattttgtatttatttatttttt aattattttgtgcagcgatggggggcggggggggggggcgcgcgccaggcggggcggg gcggggc gaggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagag cggcgcgctccgaaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagc gaagcgcgcggcgggcgggagtcgctgcgttgccttcgccccgtgccccgctccgcgccg cctcgcgccg cccgccccggctctgactgaccgcgttactcccacaggtgagcgggcggga cggcccttctcctccgggctgtaattagcgcttggtttaatgacggctcgtttcttttctgtggctg cgtgaaagccttaaagggctccgggagggccctttgtgcgggggggagcggctcgggggg tgcgtgcgtgtg tgtgtgcgtggggagcgccgcgtgcggcccgcgctgcccggcggctgtg agcgctgcgggcgcggcgcggggctttgtgcgctccgcgtgtgcgcgaggggagcgcgg 5 5

- 60 046157- 60 046157

ccgggggcggtgccccgcggtgcgggggggctgcgaggggaacaaaggctgcgtgcgg ggtgtgtgcgtgggggggtgagcagggggtgtgggcgcggcggtcgggctgtaacccccc cctgcacccccctccccgagttgctgagcacggcccggcttcgggtgcggggctccgtgcg gggcgtggcgcggggctcgccgtgccgggcggggggtggcggcaggtgggggtgccgg gcggggcggggccgcctcgggccggggagggctcgggggaggggcgcggcggccccg gagcgccggcggctgtcgaggcgcggcgagccgcagccattgccttttatggtaatcgtgcg agagggcgcagggacttcctttgtcccaaatctggcggagccgaaatctgggaggcgccgc cgcaccccctctagcgggcgcgggcgaagcggtgcggcgccggcaggaaggaaatggg cggggagggccttcgtgcgtcgccgcgccgccgtccccttctccatctccagcctcggggct gccgcagggggacggctgccttcgggggggacggggcagggcggggttcggcttctggc gtgtgaccggcggctctagagcctctgctaaccatgttcatgccttcttctttttcctacagctcct gggcaacgtgctggttgttgtgctgtctcatcattttggcaaagaatt ccggggggcggtgccccgcggtgcggggggggctgcgaggggaacaaaggctgcgtgcgg ggtgtgtgcgtgggggggtgagcagggggtgtgggcgcggcggtcgggctgtaacccccc cctgcacccccctccccgagttgctgagcacggcccggcttcgggtgcggggctccgtgc g gggcgtggcgcggggctcgccgtgccggggcggggggtggcggcaggtgggggtgccgg gcggggcggggccgcctcgggccggggagggctcgggggaggggcgcggcggccccg gagcgccggcggctgtcgaggcgcggcgagccgcagccattgccttttatggtaatcgtgcg agagggcgca gggacttcctttgtcccaaatctggcggagccgaaatctgggaggcgccgc cgcaccccctctagcgggcgcgggcgaagcggtgcggcgccggcaggaaggaaatggg cggggagggccttcgtgcgtcgccgcgccgccgtccccttctccatctccagcctcggggct gccgcaggggacggctgcct tcgggggggacggggcagggcggggttcggcttctggc gtgtgaccggcggctctagagcctctgctaaccatgttcatgccttcttctttttcctacagctcct gggcaacgtgctggttgttgtgctgtctcatcattttggcaaagaatt EF1альфа EF1alpha GAGTAATTCATACAAAAGGACTCGCCCCTGCCTTGGGGA ATCCCAGGGACCGTCGTTAAACTCCCACTAACGTAGAAC CCAGAGATCGCTGCGTTCCCGCCCCCTCACCCGCCCGCT CTCGTCATCACTGAGGTGGAGAAGAGCATGCGTGAGGCT CCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAG TCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACC GGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAG TGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGG GGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTT CTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGT GCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTT ATGGCCCTTGCGTGCCTTGAATTACTTCCACGCCCCTGGC TGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAA GTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCC CTTCGCCTCGTGCTTGAGTTGAGGCCTGGCTTGGGCGCT GGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCT GTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTT TTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGT CTTGTAAATGCGGGCCAAGATCTGCACACTGGTATTTCG GTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCC CAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCG GCCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCC GGCCTGCTCTGGTGCCTGGCCTCGCGCCGCCGTGTATCG CCCCGCCCTGGGCGGCAAGGCTGGCCCGGTCGGCACCAG TTGCGTGAGCGGAAAGATGGCCGCTTCCCGGCCCTGCTG CAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAG CGGGCGGGTGAGTCACCCACACAAAGGAAAAGGGCCTT TCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTA CCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGAGCTT TTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTA TGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGA AGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGA ATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAG CCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGG TGTCGTGA GAGTAATTCATACAAAAGGACTCGCCCCTGCCTTGGGGA ATCCCAGGGACCGTCGTTAAACTCCCACTAACGTAGAAC CCAGAGATCGCTGCGTTCCCGCCCCCTCACCCGCCCGCT CTCGTCATCACTGAGGTGGAGAAGAGCATGCGTGAGGCT CCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAG TCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACC GGTGCC TAGAGAAGGTGGCGCGGGGTAAACTGGGAAAG TGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGG GGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTT CTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGT GCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTT ATGGCCCTTGCGTGCCTTGAATTACTTCCACGCCCCTGGC TGCAG TACGTGATTCTTGATCCCGAGCTTCGGGTTGGAA GTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCC CTTCGCCTCGTGCTTGAGTTGAGGCCTGGCTTGGGCGCT GGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCT GTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTT TTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGT CTTGTAAAT GCGGGCCAAGATCTGCACACTGGTATTTCG GTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCC CAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCG GCCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCC GGCCTGCTCTGGTGCCTGGCCTCGCCGCCGTGTATCG CCCCGCCCTGGGCGGCAAGGCTGGCCCGGTCGGCACCAG TTGCGTGAGCGGAAA GATGGCCGCTTCCCGGCCCTGCTG CAGGGAGCTCAAAATGGAGGACGCGGCTCGGGAGAG CGGGCGGGTGAGTCACCCACACAAAGGAAAAGGGCCTT TCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTA CCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGAGCTT TTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTA TGCGATGGAGTTTCCCCACACTGA GTGGGTGGAGACTGA AGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGA ATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAG CCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGG TGTCGTGA 6 6

Таблица 3. Аминокислотные последовательности для иллюстративных ДНК-связывающих доменов (DBD), представленных в настоящем документе. Для DBD сконструированный цинковый палец (eZF) указывает на то, что конструкция имеет формулу, изложенную в SEQ ID NO: 147 (табл. 10); EGR1 указывает на то, что DBD происходит от человеческого EGR1 дикого типа (SEQ ID NO: 176; табл. 12); и EGR3 указывает на то, что DBD происходит от человеческого EGR3 дикого типа (SEQ ID NO: 175, табл. 12). Целевые сайты представляют собой последовательности, связанные с DBD, и представлены в табл. 4 ниже.Table 3. Amino acid sequences for exemplary DNA binding domains (DBDs) presented herein. For DBD, the engineered zinc finger (eZF) indicates that the design has the formula set forth in SEQ ID NO: 147 (Table 10); EGR1 indicates that the DBD is derived from wild-type human EGR1 (SEQ ID NO: 176; Table 12); and EGR3 indicates that the DBD is derived from wild-type human EGR3 (SEQ ID NO: 175, Table 12). The target sites are sequences associated with the DBD and are presented in Table. 4 below.

- 61 046157- 61 046157

Таблица 3Table 3

DBD/целев ой сайт DBD/target site Последовательность Subsequence SEQ ID NO SEQ ID NO eZF/zl eZF/zl LEPGEKPYKCPECGKSFSRSDNLVRHQRTHTGEKPYKCPE CGKSFSREDNLHTHQRTHTGEKPYKCPECGKSFSRSDELV RHQRTHTGEKPYKCPECGKSFSQSGNLTEHQRTHTGEKPY KCPECGKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQN STLTEHQRTHTGKKTS LEPGEKPYKCPECGKSFSRSDNLVRHQRTHTGEKPYKCPE CGKSFSREDNLHTHQRTHTGEKPYKCPECGKSFSRSDELV RHQRTHTGEKPYKCPECGKSFSQSGNLTEHQRTHTGEKPY KCPECGKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQN STLTEHQRTHTTGKKTS 77 77 eZF/z2 eZF/z2 LEPGEKPYKCPECGKSFSTKNSLTEHQRTHTGEKP YKCPEC GKSF SRADNLTEHQRTHTGEKP YKCPEC GKSF SQL AHLR A HQRTHTGEKPYKCPECGKSFSTKNSLTEHQRTHTGEKPYK CPECGKSFSQAGHLASHQRTHTGEKPYKCPECGKSFSTHL DLIRHQRTHTGKKTS LEPGEKPYKCPECGKSFSTKNSLTEHQRTHTGEKP YKCPEC GKSF SRADNLTEHQRTHTGEKP YKCPEC GKSF SQL AHLR A HQRTHTGEKPYKCPECGKSFSTKNSLTEHQRTHTGEKPYK CPECGKSFSQAGHLASHQRTHTGEKPYKCPECGKSFSTHL DLIRHQRTHTGKKTS 78 78 eZF/z3 eZF/z3 LEPGEKPYKCPECGKSFSQAGHLASHQRTHTGEKPYKCPE CGKSFSREDNLHTHQRTHTGEKPYKCPECGKSFSTSGNLTE HQRTHTGEKPYKCPECGKSFSTHLDLIRHQRTHTGEKPYK CPECGKSFSQKSSLIAHQRTHTGEKPYKCPECGKSFSQAGH LASHQRTHTGKKTS LEPGEKPYKCPECGKSFSQAGHLASHQRTHTGEKPYKCPE CGKSFSREDNLHTHQRTHTGEKPYKCPECGKSFSTSGNLTE HQRTHTGEKPYKCPECGKSFSTHLDLIRHQRTHTGEKPYK CPECGKSFSQKSSLIAHQRTHTGEKPYKCPECGKSFSQAGH LASHQRTHTTGKKTS 79 79 eZF/z4 eZF/z4 LEPGEKPYKCPECGKSFSTTGNLTVHQRTHTGEKPYKCPE CGKSFSTSGELVRHQRTHTGEKPYKCPECGKSFSREDNLH THQRTHTGEKPYKCPECGKSFSTSGNLTEHQRTHTGEKPY KCPECGKSFSQS S SLVRHQRTHTGEKPYKCPECGKSF SQRA NLRAHQRTHTGKKT S LEPGEKPYKCPECGKSFSTTGNLTVHQRTHTGEKPYKCPE CGKSFSTSGELVRHQRTHTGEKPYKCPECGKSFSREDNLH THQRTHTGEKPYKCPECGKSFSTSGNLTEHQRTHTGEKPY KCPECGKSFSQS S SLVRHQRTHTGEKPYKCPECGKSF SQRA NLRAHQRTHTGKKT S 80 80 eZF/z5 eZF/z5 LEPGEKPYKCPECGKSF S SRRTCRAHQRTHTGEKP YKCPEC GKSFSTTGALTEHQRTHTGEKPYKCPECGKSFSRSDELVRH QRTHTGEKP YKCPEC GKSFSRNDALTEHQRTHTGEKPYKC PECGKSFSQSGDLRRHQRTHTGEKPYKCPECGKSFSTSHSL TEHQRTHTGKKTS LEPGEKPYKCPECGKSF S SRRTCRAHQRTHTGEKP YKCPEC GKSFSTTGALTEHQRTHTGEKPYKCPECGKSFSRSDELVRH QRTHTGEKP YKCPEC GKSFSRNDALTEHQRTHTGEKPYKC PECGKSFSQSGDLRRHQRTHTGEKPYKCPECGKSFSTSHSL TEHQRTHTGKKTS 81 81 eZF/z6 eZF/z6 LEPGEKPYKCPECGKSFSRKDNLKNHQRTHTGEKPYKCPE CGKSFSDPGALVRHQRTHTGEKPYKCPECGKSFSREDNLH THQRTHTGEKPYKCPECGKSFSDPGALVRHQRTHTGEKPY KCPECGKSFSTSGELVRHQRTHTGEKPYKCPECGKSFSRK DNLKNHQRTHTGKKTS LEPGEKPYKCPECGKSFSRKDNLKNHQRTHTGEKPYKCPE CGKSFSDPGALVRHQRTHTGEKPYKCPECGKSFSREDNLH THQRTHTGEKPYKCPECGKSFSDPGALVRHQRTHTGEKPY KCPECGKSFSTSGELVRHQRTHTGEKPYKCPECGKSFSRK DNLKNHQRTHTGKKTS 82 82 eZF/z7 eZF/z7 LEPGEKPYKCPECGKSF S SKKALTEHQRTHTGEKP YKCPEC GKSF S SP ADLTRHQRTHTGEKP YKCPEC GKSF SRSDNLVR HQRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGEKPYK CPECGKSFSRSDELVRHQRTHTGEKPYKCPECGKSFSQSGN LTEHQRTHTGEKPYKCPECGKSFSTSGHLVRHQRTHTGEK PYKCPECGKSFSQNSTLTEHQRTHTGKKTS LEPGEKPYKCPECGKSF S SKKALTEHQRTHTGEKP YKCPEC GKSF S SP ADLTRHQRTHTGEKP YKCPEC GKSF SRSDNLVR HQRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGEKPYK CPECGKSFSRSDELVRHQRTHTGEKPYKCPECGKSFSQSGN LTEHQRTHTGEKPYKCPECGKSF STSGHLVRHQRTHTGEK PYKCPECGKSFSQNSTLTEHQRTHTTGKKTS 83 83

- 62 046157- 62 046157

eZF/z8 eZF/z8 LEPGEKPYKCPECGKSF S SPADLTRHQRTHTGEKPYKCPEC GKSF SRSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGEKPYK CPECGKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSTSGH LVRHQRTHTGKKTS LEPGEKPYKCPECGKSF S SPADLTRHQRTHTGEKPYKCPEC GKSF SRSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGEKPYK CPECGKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSTSGH LVRHQRTHTTGKKTS 84 84 eZF/z9 eZF/z9 LEPGEKPYKCPECGKSF S SKKALTEHQRTHTGEKPYKCPEC GKSF S SPADLTRHQRTHTGEKPYKCPEC GKSF SRSDNLVR HQRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGEKPYK CPECGKSFSRSDELVRHQRTHTGEKPYKCPECGKSFSQSGN LTEHQRTHTGKKTS LEPGEKPYKCPECGKSF S SKKALTEHQRTHTGEKPYKCPEC GKSF S SPADLTRHQRTHTGEKPYKCPEC GKSF SRSDNLVR HQRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGEKPYK CPECGKSFSRSDELVRHQRTHTGEKPYKCPECGKSFSQSGN LTEHQRTHTGKKTS 85 85 eZF/zlO eZF/zlO LEPGEKPYKCPECGKSFSDCRDLARHQRTHTGEKPYKCPE CGKSFSRNDALTEHQRTHTGEKPYKCPECGKSFSRNDALT EHQRTHTGEKPYKCPECGKSFSSPADLTRHQRTHTGEKPY KCPECGKSFSDPGNLVRHQRTHTGEKPYKCPECGKSFSQR AHLERHQRTHTGEKPYKCPECGKSFSQSSSLVRHQRTHTG EKPYKCPECGKSFSHRTTLTNHQRTHTGKKTS LEPGEKPYKCPECGKSFSDCRDLARHQRTHTGEKPYKCPE CGKSFSRNDALTEHQRTHTGEKPYKCPECGKSFSRNDALT EHQRTHTGEKPYKCPECGKSFSSPADLTRHQRTHTGEKPY KCPECGKSFSDPGNLVRHQRTHTGEKPYKCPECGKSFSQR AHLERHQRTHTGEKPYKCPECGKSFSQSS SLVRHQRTHTG EKPYKCPECGKSFSHRTTLTNHQRTHTGKKTS 86 86 eZF/zll eZF/zll LEPGEKPYKCPECGKSFSRNDALTEHQRTHTGEKPYKCPE CGKSFSSPADLTRHQRTHTGEKPYKCPECGKSFSDPGNLV RHQRTHTGEKPYKCPECGKSFSQRAHLERHQRTHTGEKPY KCPECGKSFSQS S SLVRHQRTHTGEKPYKCPECGKSF SHRT TLTNHQRTHTGKKTS LEPGEKPYKCPECGKSFSRNDALTEHQRTHTGEKPYKCPE CGKSFSSPADLTRHQRTHTGEKPYKCPECGKSFSDPGNLV RHQRTHTGEKPYKCPECGKSFSQRAHLERHQRTHTGEKPY KCPECGKSFSQS S SLVRHQRTHTGEKPYKCPECGKSF SHRT TLTNHQRTHTGKKTS 87 87 eZF/zl2 eZF/zl2 LEPGEKPYKCPECGKSFSRNDALTEHQRTHTGEKPYKCPE CGKSFSDPGHLVRHQRTHTGEKPYKCPECGKSFSTSGELV RHQRTHTGEKPYKCPECGKSFSTHLDLIRHQRTHTGEKPY KCPECGKSFS SKKALTEHQRTHTGEKPYKCPEC GKSF SQL AHLRAHQRTHTGEKPYKCPECGKSFSRSDHLTNHQRTHTG KKTS LEPGEKPYKCPECGKSFSRNDALTEHQRTHTGEKPYKCPE CGKSFSDPGHLVRHQRTHTGEKPYKCPECGKSFSTSGELV RHQRTHTGEKPYKCPECGKSFSTHLDLIRHQRTHTGEKPY KCPECGKSFS SKKALTEHQRTHTGEKPYKCPEC GKSF SQL AHLRAHQRTHTGEKPYKCPECGKSFSR SDHLTNHQRTHTG KKTS 88 88 eZF/zl3 eZF/zl3 LEPGEKPYKCPECGKSFSRSDNLVRHQRTHTGEKPYKCPE CGKSFSHRTTLTNHQRTHTGEKPYKCPECGKSFSREDNLH THQRTHTGEKPYKCPECGKSFSTSHSLTEHQRTHTGEKPY KCPECGKSFSQS S SLVRHQRTHTGEKPYKCPECGKSF SRED NLHTHQRTHTGKKTS LEPGEKPYKCPECGKSFSRSDNLVRHQRTHTGEKPYKCPE CGKSFSHRTTLTNHQRTHTGEKPYKCPECGKSFSREDNLH THQRTHTGEKPYKCPECGKSFSTSHSLTEHQRTHTGEKPY KCPECGKSFSQS S SLVRHQRTHTGEKPYKCPECGKSF SRED NLHTHQRTHTGKKTS 89 89 eZF/zl4 eZF/zl4 LEPGEKPYKCPECGKSFSDPGALVRHQRTHTGEKPYKCPE CGKSFSRSDNLVRHQRTHTGEKPYKCPECGKSFSQSGDLR RHQRTHTGEKPYKCPECGKSFSTHLDLIRHQRTHTGEKPY KCPECGKSFSTSGNLVRHQRTHTGEKPYKCPECGKSFSRSD NLVRHQRTHTGKKTS LEPGEKPYKCPECGKSFSDPGALVRHQRTHTGEKPYKCPE CGKSFSRSDNLVRHQRTHTGEKPYKCPECGKSFSQSGDLR RHQRTHTGEKPYKCPECGKSFSTHLDLIRHQRTHTGEKPY KCPECGKSFSTSGNLVRHQRTHTGEKPYKCPECGKSFSRSD NLVRHQRTHTGKKTS 90 90 eZF/zl5 eZF/zl5 LEPGEKPYKCPECGKSFSRRDELNVHQRTHTGEKPYKCPE CGKSFSRSDHLTNHQRTHTGEKPYKCPECGKSFSRSDDLV RHQRTHTGEKPYKCPECGKSFSRSDNLVRHQRTHTGEKPY KCPECGKSFSHRTTLTNHQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTGEKPYKCPECGKSFSTSHSLTEHQRTHTGE KPYKCPECGKSFSQSSSLVRHQRTHTGEKPYKCPECGKSFS REDNLHTHQRTHTGKKTS LEPGEKPYKCPECGKSFSRRDELNVHQRTHTGEKPYKCPE CGKSFSRSDHLTNHQRTHTGEKPYKCPECGKSFSRSDDLV RHQRTHTGEKPYKCPECGKSFSRSDNLVRHQRTHTGEKPY KCPECGKSFSHRTTLTNHQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTGEKPYKCPECGKSFSTSHSL TEHQRTHTGE KPYKCPECGKSFSQSSSLVRHQRTHTGEKPYKCPECGKSFS REDNLHTHQRTHTGKKTS 91 91 EGRl/zl EGRl/zl RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRICMRN FSREDNLHTHIRTHTGEKPFACDICGRKFARSDELVRHTKI HLRQKDRPYACPVESCDRRFSQSGNLTEHIRIHTGQKPFQC RICMRNFSTSGHLVRHIRTHTGEKPFACDICGRKFAQNSTL TEHTKIHLRQKDK RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRICMRN FSREDNLHTHIRTHTGEKPFACDICGRKFARSDELVRHTKI HLRQKDRPYACPVESCDRRFSQSGNLTEHIRIHTGQKPFQC RICMRNFSTSGHLVRHIRTHTGEKPFACDICGRKFAQNSTL TEHTKIHLRQKDK 92 92

- 63 046157- 63 046157

EGR1/Z13 EGR1/Z13 RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRICMRN FSHRTTLTNHIRTHTGEKPFACDICGRKFAREDNLHTHTKI HLRQKDRPYACPVESCDRRFSTSHSLTEHIRIHTGQKPFQC RICMRNFSQSSSLVRHIRTHTGEKPFACDICGRKFAREDNL HTHTKIHLRQKDK RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRICMRN FSHRTTLTNHIRTHTGEKPFACDICGRKFAREDNLHTHTKI HLRQKDRPYACPVESCDRRFSTSHSLTEHIRIHTGQKPFQC RICMRNFSQSSSLVRHIRTHTGEKPFACDICGRKFAREDNL HTHTKIHLRQKDK 93 93 EGR1/Z15 EGR1/Z15 RPYACPVESCDRRFSRRDELNVHIRIHTGQKPFQCRICMRN FSRSDHLTNHIRTHTGEKPFACDICGRKFARSDDLVRHTKI HLRQKDRP YACPVESCDRRF SRSDNLVRHIRIHTGQKPFQC RICMRNFSHRTTLTNHIRTHTGEKPFACDICGRKFAREDNL HTHTKIHLRQKDRPYACPVESCDRRFSTSHSLTEHIRIHTGQ KPFQCRICMRNFSQSSSLVRHIRTHTGEKPFACDICGRKFA REDNLHTHTKIHLRQKD RPYACPVESCDRRFSRRDELNVHIRIHTGQKPFQCRICMRN FSRSDHLTNHIRTHTGEKPFACDICGRKFARSDDLVRHTKI HLRQKDRP YACPVESCDRRF SRSDNLVRHIRIHTGQKPFQC RICMRNFSHRTTLTNHIRTHTGEKPFACDICGRKFAREDNL HTHTKIHLRQKDRPYACPVESCDRRFSTSHSLTEHIRIHTG Q KPFQCRICMRNFSQSSSLVRHIRTHTGEKPFACDICGRKFA REDNLHTHTKIHLRQKD 94 94 EGrl/zl7 EGrl/zl7 RPYACPVESCDRRFSDPGALVRHIRIHTGQKPFQCRICMRN FSRSDNLVRHIRTHTGEKPFACDICGRKFAQSGDLRRHTKI HLRQKDRPYACPVESCDRRFSTHLDLIRHIRIHTGQKPFQC RICMRNFSTSGNLVRHIRTHTGEKPFACDICGRKFARSDNL VRHTKIHLRQKDRPYACPVESCDRRFSQSGHLTEHIRIHTG QKPFQCRICMRNFSERSHLREHIRTHTGEKPFACDICGRKF AQAGHLASHTKIHLRQKD RPYACPVESCDRRFSDPGALVRHIRIHTGQKPFQCRICMRN FSRSDNLVRHIRTHTGEKPFACDICGRKFAQSGDLRRHTKI HLRQKDRPYACPVESCDRRFSTHLDLIRHIRIHTGQKPFQC RICMRNFSTSGNLVRHIRTHTGEKPFACDICGRKFARSDNL VRHTKIHLRQKDRPYACPVESCDRRFSQSGHLTEHIRIHTG QKPFQCRICMRNFSERSHLREHIRTHTGEKPFACDICGRKF AQAGHLASHTKIHLRQKD 95 95 EGR3/zl EGR3/zl RPHACPAEGCDRRFSRSDNLVRHLRIHTGHKPFQCRICMRS FSREDNLHTHIRTHTGEKPFACEFCGRKFARSDELVRHAKI HLKQKEHACPAEGCDRRFSQSGNLTEHLRIHTGHKPFQCRI CMRSFSTSGHLVRHIRTHTGEKPFACEFCGRKFAQNSTLTE HAKIHLKQKEK RPHACPAEGCDRRFSRSDNLVRHLRIHTGHKPFQCRICMRS FSREDNLHTHIRTHTGEKPFACEFCGRKFARSDELVRHAKI HLKQKEHACPAEGCDRRFSQSGNLTEHLRIHTGHKPFQCRI CMRSFSTSGHLVRHIRTHTGEKPFACEFCGRKFAQNSTLTE HAKIHLKQKEK 96 96 EGR3/zl3 EGR3/zl3 RPHACPAEGCDRRFSRSDNLVRHLRIHTGHKPFQCRICMRS FSHRTTLTNHIRTHTGEKPFACEFCGRKFAREDNLHTHAKI HLKQKEHACPAEGCDRRFSTSHSLTEHLRIHTGHKPFQCRI CMRSFSQSSSLVRHIRTHTGEKPFACEFCGRKFAREDNLHT HAKIHLKQKEK RPHACPAEGCDRRFSRSDNLVRHLRIHTGHKPFQCRICMRS FSHRTTLTNHIRTHTGEKPFACEFCGRKFAREDNLHTHAKI HLKQKEHACPAEGCDRRFSTSHSLTEHLRIHTGHKPFQCRI CMRSFSQSSSLVRHIRTHTGEKPFACEFCGRKFAREDNLHT HAKIHLKQKEK 97 97 EGR3/zl5 EGR3/zl5 RPHACPAEGCDRRFSRRDELNVHLRIHTGHKPFQCRICMRS FSRSDHLTNHIRTHTGEKPFACEFCGRKFARSDDLVRHAKI HLKQKEHACPAEGCDRRF SRSDNLVRHLRIHTGHKPFQCR ICMRSFSHRTTLTNHIRTHTGEKPFACEFCGRKFAREDNLH THAKIHLKQKEHACPAEGCDRRFSTSHSLTEHLRIHTGHKP FQCRICMRSF SQS S SLVRHIRTHTGEKPF ACEFCGRKFARE DNLHTHAKIHLKQKEK RPHACPAEGCDRRFSRRDELNVHLRIHTGHKPFQCRICMRS FSRSDHLTNHIRTHTGEKPFACEFCGRKFARSDDLVRHAKI HLKQKEHACPAEGCDRRF SRSDNLVRHLRIHTGHKPFQCR ICMRSFSHRTTLTNHIRTHTGEKPFACEFCGRKFAREDNLH THAKIHLKQKEHACPAEGCDRRFSTSHSLTEHLRIHTGHKP FQCRIC MRSF SQS S SLVRHIRTHTGEKPF ACEFCGRKFARE DNLHTHAKIHLKQKEK 98 98

Таблица 4 Последовательности целевых сайтов и хромосомная локализация иллюстративных целевых сайтов, связанных с раскрытыми в настоящем документе ДНК-связывающими доменамиTable 4 Target site sequences and chromosomal locations of exemplary target sites associated with DNA binding domains disclosed herein

Начальн. положени e хром. 2 Initial position e chrome. 2 Последовательность целевого сайта Target Site Sequence Целевой сайт Target site SEQ ID NO для последовательное ти целевого сайта SEQ ID NO for sequential target site 166149168 166149168 CTAGGTCAAGTGTAGGAG CTAGGTCAAGTGTAGGAG zl zl 18 18 166149158 166149158 ACTTGACCTAGACAGCCT ACTTGACCTAGACAGCCT z2 z2 19 19 166073978 166073978 TGAATAACTCATTAGTGA TGAATAACTCATTAGTGA z3 z3 20 20

- 64 046157- 64 046157

166073933 166073933 AAAGTACATTAGGCTAAT AAAGTACATTAGGCTAAT z4 z4 21 21 166149199 166149199 CCAGCACTGGTGCTTCGT CCAGCACTGGTGCTTCGT z5 z5 22 22 166149176 166149176 AAGGCTGTCTAGGTCAAG AAGGCTGTCTAGGTCAAG z6 z6 23 23 166149168 166149168 CTAGGTCAAGTGTAGGAGACACAC CTAGGTCAAGTGTAGGAGACACAC z7 z7 24 24 166149165 166149165 GGTCAAGTGTAGGAGACA GGTCAAGTGTAGGAGACA z8 z8 25 25 166149162 166149162 CAAGTGTAGGAGACACAC CAAGTGTAGGAGACACAC z9 z9 26 26 166149160 166149160 AGTGTAGGAGACACACTGCTGGCC AGTGTAGGAGACACACTGCTGGCC zlO zlO 27 27 166149160 166149160 AGTGTAGGAGACACACTG AGTGTAGGAGACACACTG zll zll 28 28 166149155 166149155 AGGAGACACACTGCTGGCCTG AGGAGACACACTGCTGGCCTG zl2 zl2 29 29 166128025 166128025 TAGGTACCATAGAGTGAG TAGGTACCATAGAGTGAG zl3 zl3 30 thirty 166127991 166127991 GAGGATACTGCAGAGGTC GAGGATACTGCAGAGGTC zl4 zl4 31 31 166127999 166127999 TAGGTACCATAGAGTGAGGCGAGGA TG TAGGTACCATAGAGTGAGGCGAGGA TG zl5 zl5 32 32 166127991 166127991 ATAGAGTGAGGCGAGGATGAAGCCG AG ATAGAGTGAGGCGAGGATGAAGCCG AG zl6 zl6 33 33 166127974 166127974 TGAAGCCGAGAGGATACTGCAGAGG ТС TGAAGCCGAGAGGATACTGCAGAGG TS zl7 zl7 34 34

Таблица 5 Аминокислотные последовательности для раскрытых в настоящем документе иллюстративных доменов ______________________активации транскрипции (TAD)______________________Table 5 Amino acid sequences for exemplary transcription activation domains (TADs) disclosed herein______________________________

TAD TAD Последовательность Subsequence SEQ ID NO SEQ ID NO VPR VPR DALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDA LDDFDLDMLINSRSSGSPKKKRKVGSQYLPDTDDRHRIEEKRK RTYETFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPAPQPY PFTSSLSTINYDEFPTMVFPSGQISQASALAPAPPQVLPQAPAPA PAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLS EALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQ GIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLP NGLLSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPKPEAGS AISDVFEGREVCQPKRIRPFHPPGSPWANRPLPASLAPTPTGPVH EPVGSLTPAPVPQPLDPAPAVTPEASHLLEDPDEETSQAVKALR EMADTVIPQKEEAAICGQMDLSHPPPRGHLDELTTTLESMTEDL NLDSPLTPELNEILDTFLNDECLLHAMHISTGLSIFDTSLF DALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDA LDDFDLDMLINSRSSGSPKKKRKVGSQYLPDTDDRHRIEEKRK RTYETFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPAPQPY PFTSSLSTINYDEFPTMVFPSGQISQASALAPAPPQVLPQAPAPA PAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPK PTQAGEGTLS EALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQ GIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLP NGLLSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPKPEAGS AISDVFEGREVCQPKRIRPFHPPGSPWANRPLPASLAPTPTGPVH EPVGSLTPAPVPQPLDPAPAVTPEASHLLEDPD EETSQAVKALR EMADTVIPQKEEAAICGQMDLSHPPPRGHLDELTTTLESMTEDL NLDSPLTPELNEILDTFLNDECLLHAMHISTGLSIFDTSLF 132 132 VP64 VP64 DALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDA LDDFDLDML DALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDA LDDFDLDML 133 133 CITED 2 CITED 2 MSGLEMADHMMAMNHGRFPDGTNGLHHHPAHRMGMGQFP S PHHHQQQQPQHAFNALMGEHIHYGAGNMNATSGIRHAMGPG TVNGGHPPSALAPAARFNNSQFMGPPVASQGGSLPASMQLQKL NNQYFNHHPYPHNHYMPDLHPAAGHQMNGTNQHFRDCNPKH SGGSSTPGGSGGSSTPGGSGSSSGGGAGSSNSGGGSGSGNMPAS VAHVPAAMLPPNVIDTDFIDEEVLMSLVIEMGLDRIKELPELWL GQNEFDFMTDFVCKQQPSRVSC MSGLEMADHMMAMNHGRFPDGTNGLHHHPAHRMGMGQFP S PHHHQQQQPQHAFNALMGEHIHYGAGNMNATSGIRHAMGPG TVNGGHPPSALAPAARFNNSQFMGPPVASQGGSLPASMQLQKL NNQYFNHHPYPHNHYMPDLHPAAGHQMNGTNQHFRDCNPKH SGGSSTPGGSGGSSTPGGSGSSSGGGAGSSNSG GGSGSGNMPAS VAHVPAAMLPPNVIDTDFIDEEVLMSLVIEMGLDRIKELPELWL GQNEFDFMTDFVCKQQPSRVSC 134 134 CITED 4 CITED 4 ADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPPYAGPGLDSG LRPRGAPLGPPPPRQPGALAYGAFGPPSSFQPFPAVPPPAAGIAH LQPVATPYPGRAAAPPNAPGGPPGPQPAPSAAAPPPPAHALGG MDAELIDEEALTSLELELGLHRVRELPELFLGQSEFDCFSDLGS APPAGSVSC ADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPPYAGPGLDSG LRPRGAPLGPPPPRQPGALAYGAFGPPSSFQPFPAVPPPAAGIAH LQPVATPYPGRAAAAPPNAPGGPPGPQPAPSAAAPPPPAHALGG MDAELIDEEALTSLELELGLHRVRELPELFLGQSEFDDCFSDLGS APPAGSVSC 135 135 CREB3 CREB3 MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPLDWALPLSE VPSDWEVDDLLCSLLSPPASLNILSSSNPCLVHHDHTYSLPRET VSMDLESESCRKEGTQMTPQHMEELAEQEIARLVLTDEEKSLL EKEGLILPETLPLTKTEEQILKRVR MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPLDWALPLSE VPSDWEVDDLLCSLLSPPASLNILSSSNPCLVHHDHTYSLPRET VSMDLESESCRKEGTQMTPQHMEELAEQEIARLVLTDEEKSLL EKEGLILPETLPLTKTEEQILKRVR 224 224

- 65 046157- 65 046157

Таблица 6Table 6

Аминокислотные последовательности для раскрытых в настоящем документе иллюстративных сконст____________руированных факторов транскрипции (DBD + TAD) __________Amino acid sequences for exemplary designed transcription factors (DBD + TAD) disclosed herein __________

Конструкция Design Последовательность Subsequence SEQ ID NO SEQ ID NO 1 1 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SHRTTLTNH QRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGE KPYKCPECGKSFSTSHSLTEHQRTHTGEKPYKCPEC GKSFSQSSSLVRHQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTGKKTSKRPAATKKAGQAKKKKGSY PYDVPDYALEEASGSGRADALDDFDLDMLGSDALD DFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLIN SRS SGSPKKKRKVGSQ YLPDTDDRHRIEEKRKRTYE TFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPA PQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAP PQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQ AVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLG NSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEP MLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGL LSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPK PEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPL PASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPE ASHLLEDPDEETSQAVKALREMADTVIPQKEEAAIC GQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTP ELNEILDTFLNDECLLHAMHISTGLSIFDTSLF MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SHRTTLTNH QRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGE KPYKCPECGKSFSTSHSLTEHQRTHTGEKPYKCPEC GKSFSQSSSLVRHQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTTGK KTSKRPAATKKAGQAKKKKGSY PYDVPDYALEEASGSGRADALDDFDLDMLGSDALD DFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLIN SRS SGSPKKKRKVGSQ YLPDTDDRHRIEEKRKRTYE TFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPA PQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAP AP PQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQ AVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLG NSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEP MLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGL LSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPK PEAGSAISDVFEGREVCQPKRIRPFHPPGSPWA NRPL PASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPE ASHLLEDPDEETSQAVKALREMADTVIPQKEEAAIC GQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTP ELNEILDTFLNDECLLHAMHISTGLSIFDTSLF 99 99 2 2 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEEASGSGRADALDDFDLDMLGSDALD DFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLIN SRS SGSPKKKRKVGSQ YLPDTDDRHRIEEKRKRTYE TFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPA PQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAP PQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQ AVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLG MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTH TGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEEASGSGRADALDDFDLDMLGSDALD DFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLIN SRS SGSPKKKRKVGSQ YLPDTDDRHRIEEKRKRTYE TFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPA PQPYPFTSSLSTINYDEFPTMVFPSGQISQAS ALAPAP PQVLPQAPAPAPAPAMVSALAQAPAPPVVLAPGPPQ AVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLG 100 100

- 66 046157- 66 046157

NSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEP MLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGL LSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPK PEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPL PASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPE ASHLLEDPDEETSQAVKALREMADTVIPQKEEAAIC GQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTP ELNEILDTFLNDECLLHAMHISTGLSIFDTSLF NSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEP MLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGL LSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPK PEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPL PASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPE ASHLLEDPDEETSQAVKALREMADTVIPQKEEAAIC GQ MDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTP ELNEILDTFLNDECLLHAMHISTGLSIFDTSLF 3 3 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SHRTTLTNH QRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGE KPYKCPECGKSFSTSHSLTEHQRTHTGEKPYKCPEC GKSFSQSSSLVRHQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTGKKTSKRPAATKKAGQAKKKKGSY PYDVPDYALEDALDDFDLDMLGSDALDDFDLDML GSDALDDFDLDMLGSDALDDFDLDML MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SHRTTLTNH QRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGE KPYKCPECGKSFSTSHSLTEHQRTHTGEKPYKCPEC GKSFSQSSSLVRHQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTTGK KTSKRPAATKKAGQAKKKKGSY PYDVPDYALEDALDDFDLDMLGSDALDDFDLDML GSDALDDFDLDMLGSDALDDFDLDML 101 101 4 4 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTH TGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML 102 102 5 5 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSHRTTLTNHIRTHTGEKPFACDICGRKFARE DNLHTHTKIHLRQKDRPYACPVESCDRRFSTSHSLT EHIRIHTGQKPFQCRICMRNFSQSSSLVRHIRTHTGE KPFACDICGRKFAREDNLHTHTKIHLRQKDKLEMA DHLMLAEGYRLVQRPPSAAAAHGPHALRTLPPYAG PGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPPSSFQ PFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAPGGP PGPQPAPSAAAPPPPAHALGGMDAELIDEEALTSLE LELGLHRVRELPELFLGQSEFDCFSDLGSAPPAGSVS C MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPP HE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSHRTTLTNHIRTHTGEKPFACDICGRKFARE DNLHTHTKIHLRQKDRPYACPVESCDRRFSTSHSLT EHIRIHTGQKPFQCRICMRNFSQSSSLVRHIRTHTGE KPFACDICGRKFAREDNLHTHTKIHLRQKDKLEMA DHLMLAEGYRLVQRPPSAAAAHGPHA C 103 103 6 6 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSHRTTLTNHIRTHTGEKPFACDICGRKFARE DNLHTHTKIHLRQKDRPYACPVESCDRRFSTSHSLT MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPP HE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSHRTTLTNHIRTHTGEKPFACDICGRKFARE DNLHTHTKIHLRQKDRPYACPVESCDRRFSTSHSLT 104 104

- 67 046157- 67 046157

EHIRIHTGQKPFQCRICMRNFSQSSSLVRHIRTHTGE KPF ACDICGRKF AREDNLHTHTKIHLRQKDK EHIRIHTGQKPFQCRICMRNFSQSSSLVRHIRTHTGE KPF ACDICGRKF AREDNLHTHTKIHLRQKDK 7 7 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPF ACDICGRKF ARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPF ACDICGRKF AQNSTLTEHTKIHLRQKDKLEMAD HLMLAEGYRLVQRPPSAAAAHGPHALRTLPPYAGP GLDSGLRPRGAPLGPPPPRQPGALAYGAFGPPSSFQP FPAVPPPAAGIAHLQPVATPYPGRAAAPPNAPGGPP GPQPAPSAAAPPPPAHALGGMDAELIDEEALTSLEL ELGLHRVRELPELFLGQSEFDCFSDLGSAPPAGSVSC MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPP HE RPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPF ACDICGRKF AQNSTLTEHTKIHLRQKDKLEMAD HLMLAEGYRLVQRPPSAAA AHGPHALRTLPPYAGP GLDSGLRPRGAPLGPPPPRQPGALAYGAFGPPSSFQP FPAVPPPAAGIAHLQPVATPYPGRAAAAPPNAPGGPP GPQPAPSAAAPPPPAHALGGMDAELIDEEALTSLEL ELGLHRVRELPELFLGQSEFDCFSDDLGSAPPAGSVSC 105 105 8 8 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDK MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPP HE RPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDK 106 106 9 9 MQSQLIKPSRMRKYPNRPSKTPPHERPYACPVESCD RRFSRSDNLVRHIRIHTGQKPFQCRICMRNFSREDNL HTHIRTHTGEKPFACDICGRKFARSDELVRHTKIHLR QKDRPYACPVESCDRRFSQSGNLTEHIRIHTGQKPF QCRICMRNF STSGHLVRHIRTHTGEKPF ACDICGRKF AQNSTLTEHTKIHLRQKDKLEMADHLMLAEGYRLV QRPPSAAAAHGPHALRTLPPYAGPGLDSGLRPRGAP LGPPPPRQPGALAYGAFGPPSSFQPFPAVPPPAAGIA HLQPVATPYPGRAAAPPNAPGGPPGPQPAPSAAAPP PPAHALGGMDAELIDEEALTSLELELGLHRVRELPE LFLGQSEFDCFSDLGSAPPAGSVSC MQSQLIKPSRMRKYPNRPSKTPPHERPYACPVESCD RRFSRSDNLVRHIRIHTGQKPFQCRICMRNFSREDNL HTHIRTHTGEKPFACDICGRKFARSDELVRHTKIHLR QKDRPYACPVESCDRRFSQSGNLTEHIRIHTGQKPF QCRICMRNF STSGHLVRHIRTHTGEKPF ACDICGRKF AQNSTLTEHTKIHLRQKDK LEMADHLMLAEGYRLV QRPPSAAAAHGPHALRTLPPYAGPGLDSGLRPRGAP LGPPPPRQPGALAYGAFGPPSSFQPPFAVPPPAAGIA HLQPVATPYPGRAAAAPPNAPGGPPGPQPAPSAAAPP PPAHALGGMDAELIDEEALTSLELELGLHRVRELPE LFLGQSEFDDCFSDLGSAPPAGSVSC 107 107 10 10 MQSQLIKPSRMRKYPNRPSKTPPHERPYACPVESCD RRFSRSDNLVRHIRIHTGQKPFQCRICMRNFSREDNL HTHIRTHTGEKPF ACDICGRKF ARSDELVRHTKIHLR QKDRPYACPVESCDRRFSQSGNLTEHIRIHTGQKPF QCRICMRNF STSGHLVRHIRTHTGEKPF ACDICGRKF AQNSTLTEHTKIHLRQKDKLEMSGLEMADHMMAM NHGRFPDGTNGLHHHPAHRMGMGQFPSPHHHQQQ QPQHAFNALMGEHIHYGAGNMNATSGIRHAMGPG TVNGGHPPSALAPAARFNNSQFMGPPVASQGGSLP ASMQLQKLNNQYFNHHPYPHNHYMPDLHPAAGHQ MNGTNQHFRDCNPKHSGGS STPGGSGGS STPGGSG MQSQLIKPSRMRKYPNRPSKTPPHERPYACPVESCD RRFSRSDNLVRHIRIHTGQKPFQCRICMRNFSREDNL HTHIRTHTGEKPF ACDICGRKF ARSDELVRHTKIHLR QKDRPYACPVESCDRRFSQSGNLTEHIRIHTGQKPF QCRICMRNF STSGHLVRHIRTHTGEKPF ACDICGRKF AQNSTLTEHTKIHLRQKDK LEMSGLEMADHMMAM NHGRFPDGTNGLHHHPAHRMGMGQFPSPHHHQQQ QPQHAFNALMGEHIHYGAGNMNATSGIRHAMGPG TVNGGHPPSALAPAARFNNSQFMGPPVASQGGSLP ASMQLQKLNNQYFNHHPYPHNHYMPDLHPAAGHQ MNGTNQHFRDCNPKHSGGS STPGGSGGS STPGGSG 108 108

- 68 046157- 68 046157

S S SGGGAGS SNSGGGSGSGNMP AS VAHVP AAMLPP NVIDTDFIDEEVLMSLVIEMGLDRIKELPELWLGQN EFDFMTDFVCKQQPSRVSC S S SGGGAGS SNSGGGSGSGNMP AS VAHVP AAMLPP NVIDTDFIDEEVLMSLVIEMGLDRIKELPELWLGQN EFDFMTDFVCKQQPSRVSC И AND MSGLEMADHMMAMNHGRFPDGTNGLHHHPAHRM GMGQFPSPHHHQQQQPQHAFNALMGEHIHYGAGN MNATSGVRHAMGPGTVNGGHPPSALAPAARFNNS QFMGPPVASQGGSLPASMQLQKLNNQYFNHHPYPH NHYMPDLHP AAGHQMNGTNQHFRDCNPKHSGGS S TPGGSGGSSTPGGSGSSSGGGAGSSNSGGGSGSGNM PASVAHVPAAMLPPNVIDTDFIDEEVLMSLVIEMGL DRIKELPELWLGQNEFDFMTDFVCKQQPSRVSCQSQ LII<PSRMRI<YPNRPSI<TPPHERPYACPVESCDRRFSR SDNLVRHIRIHTGQKPFQCRICMRNFSREDNLHTHIR THTGEKPFACDICGRKFARSDELVRHTKIHLRQKDR PYACPVESCDRRFSQSGNLTEHIRIHTGQKPFQCRIC MRNFSTSGHLVRHIRTHTGEKPFACDICGRKFAQNS TLTEHTKIHLRQKDK MSGLEMADHMMAMNHGRFPDGTNGLHHHPAHRM GMGQFPSPHHHQQQPQHAFNALMGEHIHYGAGN MNATSGVRHAMGPGTVNGGHPPSALAPAARFNNS QFMGPPVASQGGSLPASMQLQKLNNQYFNHHPYPH NHYMPDLHP AAGHQMNGTNQHFRDCNPKHSGGS S TPGGSGGSSTPGGSSSGGGAGSSN SGGGSGSGNM PASVAHVPAAMLPPNVIDTDFIDEEVLMSLVIEMGL DRIKELPELWLGQNEFDFMTDFVCKQQPSRVSCQSQ LII<PSRMRI<YPNRPSI<TPPHERPYACPVESCDRRFSR SDNLVRHIRIHTGQKPFQCRICMRNFSREDNLHTHIR THTGEKPFACDICGRKFARSDELVRHTKIHLRQKDR PYACPVESCDRRFSQ SGNLTEHIRIHTGQKPFQCRIC MRNFSTSGHLVRHIRTHTGEKPFACDICGRKFAQNS TLTEHTKIHLRQKDK 109 109 12 12 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGRPHACPAEGCDRRFSRSDNLVRH LRIHTGHKPFQCRICMRSFSREDNLHTHIRTHTGEKP FACEFCGRKFARSDELVRHAKIHLKQKEHACPAEG CDRRFSQSGNLTEHLRIHTGHKPFQCRICMRSFSTSG HLVRHIRTHTGEKPFACEFCGRKFAQNSTLTEHAKI HLKQKEKLEMADHLMLAEGYRLVQRPPSAAAAHG PHALRTLPPYAGPGLDSGLRPRGAPLGPPPPRQPGA LAYGAFGPPSSFQPFPAVPPPAAGIAHLQPVATPYPG RAAAPPNAPGGPPGPQPAPSAAAPPPPAHALGGMD AELIDEEALTSLELELGLHRVRELPELFLGQSEFDCF SDLGSAPPAGSVSC MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPPFAVPPPAAGIAHLQPVATPYPGRAAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDDCFSDLGSAPPAG SVSCGGSGGGSGRPHACPAEGCDRRFSRSDNLVRH LRI HTGHKPFQCRICMRFSREDNLHTHIRTHTGEKP FACEFCGRKFARSDELVRHAKIHLKQKEHACPAEG CDRRFSQSGNLTEHLRIHTGHKPFQCRICMRSFSTSG HLVRHIRTHTGEKPFACEFCGRKFAQNSTLTEHAKI HLKQKEKLEMADHLMLAEGYRLVQRPPSAAAAHG PHALRTLPPYAGPGLDSGLRPRGAPLGPPPPRQPGA L AYGAFGPPSSFQPPFAVPPPAAGIAHLQPVATPYPG RAAAPPNAPGGPPGPQPAPSAAAPPPPAHALGGMD AELIDEEALTSLELELGLHRVRELPELFLGQSEFDCF SDLGSAPPAGSVSC 110 110 13 13 MRPHACP AEGCDRRF SRSDNLVRHLRIHTGHKPFQC RICMRSFSREDNLHTHIRTHTGEKPFACEFCGRKFAR SDELVRHAKIHLKQKEHACPAEGCDRRFSQSGNLTE HLRIHTGHKPFQCRICMRSFSTSGHLVRHIRTHTGEK PFACEFCGRKFAQNSTLTEHAKIHLKQKEKLEMAD HLMLAEGYRLVQRPPSAAAAHGPHALRTLPPYAGP GLDSGLRPRGAPLGPPPPRQPGALAYGAFGPPSSFQP FPAVPPPAAGIAHLQPVATPYPGRAAAPPNAPGGPP GPQPAPSAAAPPPPAHALGGMDAELIDEEALTSLEL ELGLHRVRELPELFLGQSEFDCFSDLGSAPPAGSVSC MRPHACP AEGCDRRF SRSDNLVRHLRIHTGHKPFQC RICMRSFSREDNLHTHIRTHTGEKPFACEFCGRKFAR SDELVRHAKIHLKQKEHACPAEGCDRRFSQSGNLTE HLRIHTGHKPFQCRICMRSFSTSGHLVRHIRTHTGEK PFACEFCGRKFAQNSTLTEHAKIHLKQKEKLEMAD HLMLAEGYRLVQRPPSAAAAHGPHALRTL PPYAGP GLDSGLRPRGAPLGPPPPRQPGALAYGAFGPPSSFQP FPAVPPPAAGIAHLQPVATPYPGRAAAAPPNAPGGPP GPQPAPSAAAPPPPAHALGGMDAELIDEEALTSLEL ELGLHRVRELPELFLGQSEFDCFDSDLGSAPPAGSVSC 111 111 14 14 MRPHACP AEGCDRRF SRSDNLVRHLRIHTGHKPFQC RICMRSFSREDNLHTHIRTHTGEKPFACEFCGRKFAR SDELVRHAKIHLKQKEHACPAEGCDRRFSQSGNLTE HLRIHTGHKPFQCRICMRSFSTSGHLVRHIRTHTGEK PFACEFCGRKFAQNSTLTEHAKIHLKQKEKKAEKG GAPSASSAPPVSLAPVVTTCALEMSGLEMADHMMA MNHGRFPDGTNGLHHHPAHRMGMGQFPSPHHHQQ QQPQHAFNALMGEHIHYGAGNMNATSGIRHAMGP MRPHACP AEGCDRRF SRSDNLVRHLRIHTGHKPFQC RICMRSFSREDNLHTHIRTHTGEKPFACEFCGRKFAR SDELVRHAKIHLKQKEHACPAEGCDRRFSQSGNLTE HLRIHTGHKPFQCRICMRSFSTSGHLVRHIRTHTGEK PFACEFCGRKFAQNSTLTEHAKIHLKQKEKKAEKG GAPSASSAPPVSLAPVVTTCALEMSGL EMADHMMA MNHGRFPDGTNGLHHHPAHRMGMGQFPSPHHHQQ QQPQHAFNALMGEHIHYGAGNMNATSGIRHAMGP 112 112

- 69 046157- 69 046157

GTVNGGHPPSALAPAARFNNSQFMGPPVASQGGSL PASMQLQKLNNQYFNHHPYPHNHYMPDLHPAAGH QMNGTNQHFRDCNPKHSGGS STPGGSGGS STPGGS GS S SGGGAGS SNSGGGSGSGNMP AS VAHVP AAMLP PNVIDTDFIDEEVLMSLVIEMGLDRIKELPELWLGQN EFDFMTDFVCKQQPSRVSC GTVNGGHPPSALAPAARFNNSQFMGPPVASQGGSL PASMQLQKLNNQYFNHHPYPHNHYMPDLHPAAGH QMNGTNQHFRDCNPKHSGGS STPGGSGGS STPGGS GS S SGGGAGS SNSGGGSGSGNMP AS VAHVP AAMLP PNVIDTDFIDEEVLMSLVIEMGLDRIKELPELWLGQN EFDFMTDFVCKQQPSRVSC 15 15 MSGLEMADHMMAMNHGRFPDGTNGLHHHPAHRM GMGQFPSPHHHQQQQPQHAFNALMGEHIHYGAGN MNATSGVRHAMGPGTVNGGHPPSALAPAARFNNS QFMGPPVASQGGSLPASMQLQKLNNQYFNHHPYPH NHYMPDLHP AAGHQMNGTNQHFRDCNPKHSGGS S TPGGSGGSSTPGGSGSSSGGGAGSSNSGGGSGSGNM PASVAHVPAAMLPPNVIDTDFIDEEVLMSLVIEMGL DRIKELPELWLGQNEFDFMTDFVCKQQPSRVSCRPH ACP AEGCDRRF SRSDNLVRHLRIHTGHKPFQCRICM RSFSREDNLHTHIRTHTGEKPFACEFCGRKFARSDEL VRHAKIHLKQKEHACPAEGCDRRFSQSGNLTEHLRI HTGHKPFQCRICMRSFSTSGHLVRHIRTHTGEKPFA CEFCGRKFAQNSTLTEHAKIHLKQKEKKAEKGGAP SAS S APP VSL AP VVTTC A MSGLEMADHMMAMNHGRFPDGTNGLHHHPAHRM GMGQFPSPHHHQQQPQHAFNALMGEHIHYGAGN MNATSGVRHAMGPGTVNGGHPPSALAPAARFNNS QFMGPPVASQGGSLPASMQLQKLNNQYFNHHPYPH NHYMPDLHP AAGHQMNGTNQHFRDCNPKHSGGS S TPGGSGGSSTPGGSSSGGGAGSSN SGGGSGSGNM PASVAHVPAAMLPPNVIDTDFIDEEVLMSLVIEMGL DRIKELPELWLGQNEFDFMTDFVCKQQPSRVSCRPH ACP AEGCDRRF SRSDNLVRHLRIHTGHKPFQCRICM RSFSREDNLHTHIRTHTGEKPFACEFCGRKFARSDEL VRHAKIHLKQKEHACPAEGCDRRFSQSGNLTEHLRI HTGHKPFQCRICMRSFSTSGHL VRHIRTHTGEKPFA CEFCGRKFAQNSTLTEHAKIHLKQKEKKAEKGGAP SAS S APP VSL AP VVTTC A 113 113 16 16 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLF SGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYS GSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMS AGILGVPPASGALSTQTSTASMVQPPQGDVEAMYP ALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQS AKPALDSNLFPMIPDYNLYHHPNDMGSIPEHKPFQG MDPIRVNPPPITPLETIKAFKDKQIHPGFGSLPQPPLT LI<PIRPRI<YPNRPSI<TPLHERPHACPAEGCDRRFSRR DELNVHLRIHTGHKPFQCRICMRSFSRSDHLTNHIRT HTGEKPFACEFCGRKFARSDDLVRHAKIHLKQKEH ACP AEGCDRRF SRSDNLVRHLRIHTGHKPFQCRICM RSF SHRTTLTNHIRTHTGEKPF ACEFCGRKF AREDNL HTHAKIHLKQKEHACP AEGCDRRF STSHSLTEHLRI HTGHKPFQCRICMRSFSQSSSLVRHIRTHTGEKPFAC EFCGRKFAREDNLHTHAKIHLKQKEKKAEKGGAPS AS SAPP VSLAP VVTTC A MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLF SGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYS GSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMS AGILGVPPASGALSTQTSTASMVQPPQGDVEAMYP ALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQS AKPALDSNLFPMIPDYNLYH HPNDMGSIPEHKPFQG MDPIRVNPPPPITPLETIKAFKDKQIHPGFGSLPQPPLT LI<PIRPRI<YPNRPSI<TPLHERPHACPAEGCDRRFSRR DELNVHLRIHTGHKPFQCRICMRSFSRSDHLTNHIRT HTGEKPFACEFCGRKFARSDDLVRHAKIHLKQKEH ACP AEGCDRRF SRSDNLVRHLRIHTGHKPFQCRICM RSF SH RTTLTNHIRTHTGEKPF ACEFCGRKF AREDNL HTHAKIHLKQKEHACP AEGCDRRF STSHSLTEHLRI HTGHKPFQCRICMRFSQSSSLVRHIRTHTGEKPFAC EFCGRKFAREDNLHTHAKIHLKQKEKKAEKGGAPS AS SAPP VSLAP VVTTC A 114 114 17 17 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S S SGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SHRTTLTNHIRTHTGEKPF ACDICGRK FAREDNLHTHTKIHLRQKDRP YACPVESCDRRF STS HSLTEHIRIHTGQKPFQCRICMRNF SQS S SLVRHIRTH TGEKPFACDICGRKFAREDNLHTHTKIHLRQKDKKA DKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATT MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S S SGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIY SAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SHRTTLTNHIRTHTGEKPF ACDIC GRK FAREDNLHTHTKIHLRQKDRP YACPVESCDRRF STS HSLTEHIRIHTGQKPFQCRICMRNF SQS S SLVRHIRTH TGEKPFACDICGRKFAREDNLHTHTKIHLRQKDKKA DKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATT 115 115

- 70 046157- 70 046157

SYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSV PP AFP AQ VS SFP S S AVTNSF S ASTGLSDMT ATF SPRTI EIC SYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSV PP AFP AQ VS SFP S S AVTNSF S ASTGLSDMT ATF SPRTI EIC 18 18 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRRDELN VH IRIHTGQKP FQCRICMRNF SRSDHLTNHIRTHTGEKPF ACDICGRK FARSDDLVRHTKIHLRQKDRPYACPVESCDRRFSRS DNLVRHIRIHTGQKPFQCRICMRNFSHRTTLTNHIRT HTGEKPF ACDICGRKF AREDNLHTHTKIHLRQKDRP YACPVESCDRRFSTSHSLTEHIRIHTGQKPFQCRICM RNF SQ S S SL VRHIRTHTGEKPF ACDICGRKF AREDNL HTHTKIHLRQKDKK ADKS WAS SATS SLS S YP SP VA TSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSSTYPSPV HSGFP SP S VATT YS S VPP AFP AQ VS SFP S S AVTNSF SA STGLSDMTATFSPRTIEIC MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIY SAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRRDELN VH IRIHTGQKP FQCRICMRNF SRSDHLTNHIRTHTGEKPF ACDICGRK FARSDDLVRHTKIHLRQKDRPYACPVESCDRRFSRS DNLVRHIRIHTGQKPFQCRICMRNFSHRTTLTNHIRT HTGEKPF ACDICGRKF AREDNLHTHTKIHLRQKDRP YACPVESCDRRFSTSHSLTEHIRIHTGQKPFQCRICM RNF SQ S S SL VRHIRTHTGEKPF ACDICGRKF AREDNL HTKIHL RQKDKK ADKS WAS SATS SLS S YP SP VA TSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSSTYPSPV HSGFP SP S VATT YS S VPP AFP AQ VS SFP S S AVTNSF SA STGLSDMTATFSPRTIEIC 116 116 19 19 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SHRTTLTNHIRTHTGEKPF ACDICGRK FAREDNLHTHIRTHTGEKPFACDICGRKFSTSHSLTE HIRIHTGQKPFQCRICMRNFSQSSSLVRHIRTHTGEK PF ACDICGRKF AREDNLHTHTKIHLRQKDKKADKS VVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYP SPVPTSF S SPGS STYPSPVHSGFPSPS VATTYS S VPP A FP AQ VS SFP S S AVTNSF S ASTGLSDMT ATF SPRTIEIC MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIY SAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SHRTTLTNHIRTHTGEKPF ACDIC GRK FAREDNLHTHIRTHTGEKPFACDICGRKFSTSHSLTE HIRIHTGQKPFQCRICMRNFSQSSSLVRHIRTHTGEK PF ACDICGRKF AREDNLHTHTKIHLRQKDKKADKS VVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYP SPVPTSF S SPGS STYPSPVHSGFPSPS VATTYS S VPP A FP AQ VS SFP S S AVTN SF S ASTGLSDMT ATF SPRTIEIC 117 117 20 20 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SHRTTLTNHIRTHTGEKPF ACDICGRK MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIY SAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SHRTTLTNHIRTHTGEKPF ACDIC GRK 115 115

- 71 046157- 71 046157

FAREDNLHTHTKIHLRQKDRP YACPVESCDRRF STS HSLTEHIRIHTGQKPFQCRICMRNF SQS S SLVRHIRTH TGEKPFACDICGRKFAREDNLHTHTKIHLRQKDKKA DKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATT SYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSV PP AFP AQ VS SFP S S AVTNSF S ASTGLSDMT ATF SPRTI EIC FAREDNLHTHTKIHLRQKDRP YACPVESCDRRF STS HSLTEHIRIHTGQKPFQCRICMRNF SQS S SLVRHIRTH TGEKPFACDICGRKFAREDNLHTHTKIHLRQKDKKA DKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATT SYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSV PP AFP AQ VS SFP S S AV TNSF S ASTGLSDMT ATF SPRTI EIC 21 21 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SREDNLHTHIRTHTGEKPF ACDICGR KFARSDELVRHTKIHLRQKDRPYACPVESCDRRFSQ SGNLTEHIRIHTGQKPFQCRICMRNF STSGHLVRHIR THTGEKPFACDICGRKFAQNSTLTEHTKIHLRQKDK KADKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSP ATTSYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTY SSVPPAFPAQVSSFPSSAVTNSFSASTGLSDMTATFS PRTIEIC MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIY SAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SREDNLHTHIRTHTGEKPF ACDIC GR KFARSDELVRHTKIHLRQKDRPYACPVESCDRRFSQ SGNLTEHIRIHTGQKPFQCRICMRNF STSGHLVRHIR THTGEKPFACDICGRKFAQNSTLTEHTKIHLRQKDK KADKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSP ATTSYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTY SSVPPAFPAQVSSFPSSAVTNSFSASTGL SDMTATFS PRTIIEIC 118 118 22 22 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLF SGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYS GSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMS AGILGVPPASGALSTQTSTASMVQPPQGDVEAMYP ALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQS AKPALDSNLFPMIPDYNLYHHPNDMGSIPEHKPFQG MDPIRVNPPPITPLETIKAFKDKQIHPGFGSLPQPPLT LI<PIRPRI<YPNRPSI<TPLHERPHACPAEGCDRRFSRS DNLVRHLRIHTGHKPFQCRICMRSF SHRTTLTNHIRT HTGEKPFACEFCGRKFAREDNLHTHAKIHLKQKEH ACPAEGCDRRFSTSHSLTEHLRIHTGHKPFQCRICMR SFSQSSSLVRHIRTHTGEKPFACEFCGRKFAREDNLH THAKIHLKQKEKKAEKGGAPSASSAPPVSLAPVVTT CA MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLF SGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYS GSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMS AGILGVPPASGALSTQTSTASMVQPPQGDVEAMYP ALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQS AKPALDSNLFPMIPDYNLYH HPNDMGSIPEHKPFQG MDPIRVNPPPPITPLETIKAFKDKQIHPGFGSLPQPPLT LI<PIRPRI<YPNRPSI<TPLHERPHACPAEGCDRRFSRS DNLVRHLRIHTGHKPFQCRICMRSF SHRTTLTNHIRT HTGEKPFACEFCGRKFAREDNLHTHAKIHLKQKEH ACPAEGCDRRFSTSHSLTEHLRIHTGHKPFQCRICMR SFSQSSSLVR HIRTHTGEKPFACEFCGRKFAREDNLH THAKIHLKQKEKKAEKGGAPSASSAPPVSLAPVVTT CA 119 119 23 23 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SDPG ALVRHIRIHTGQKP FQCRICMRNF SRSDNLVRHIRTHTGEKPF ACDICGR MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIY SAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SDPG ALVRHIRIHTGQKP FQCRICMRNF SRSDNLVRHIRTHTGEKPF ACDIC GR 120 120

- 72 046157- 72 046157

KF AQSGDLRRHTKIHLRQKDRP YACPVESCDRRF ST HLDLIRHIRIHTGQKPFQC RIC MRNF STSGNLVRHIR THTGEKPFACDICGRKFARSDNLVRHTKIHLRQKDR PYACPVESCDRRFSQSGHLTEHIRIHTGQKPFQCRIC MRNFSERSHLREHIRTHTGEKPFACDICGRKFAQAG HL ASHTKH4LRQKDKK ADKS WAS S AT S SLS S YP SP VATSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSSTYP SPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVTNS FSASTGLSDMTATFSPRTIEIC KF AQSGDLRRHTKIHLRQKDRP YACPVESCDRRF ST HLDLIRHIRIHTGQKPFQC RIC MRNF STSGNLVRHIR THTGEKPFACDICGRKFARSDNLVRHTKIHLRQKDR PYACPVESCDRRFSQSGHLTEHIRIHTGQKPFQCRIC MRNFSERSHLREHIRTHTGEKPFACDICGRKFAQAG HL ASHTKH4LRQKD KK ADKS WAS S AT S SLS S YP SP VATSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSSTYP SPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVTNS FSASTGLSDMTATFSPRTIEIC 24 24 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLTRHIRIHTGQKP FQCRICMRNFSHSTTLTNHIRTHTGEKPFACDICGRK FARSDNRKTHIRTHTGEKPFACDICGRKFSTSHSLTE HIRIHTGQKPFQCRICMRNFSQSSSLTRHIRTHTGEKP FACDICGRKFARSDNRKTHTKIHLRQKDKKADKSV VASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPS PVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAF PAQVSSFPSSAVTNSFSASTGLSDMTATFSPRTIEIC MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIY SAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLTRHIRIHTGQKP FQCRICMRNFSHSTTLTNHIRTHTGEKPFACDIC GRK FARSDNRKTHIRTHTGEKPFACDICGRKFSTSHSLTE HIRIHTGQKPFQCRICMRNFSQSSSLTRHIRTHTGEKP FACDICGRKFARSDNRKTHTKIHLRQKDKKADKSV VASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPS PVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAF PAQVSSFPSSAVTNSFSASTGLSDM TATFSPRTIEIC 121 121 25 25 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLF SGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYS GSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMS AGILGVPPASGALSTQTSTASMVQPPQGDVEAMYP ALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQS AKPALDSNLFPMIPDYNLYHHPNDMGSIPEHKPFQG MDPIRVNPPPITPLETIKAFKDKQIHPGFGSLPQPPLT LI<PIRPRI<YPNRPSI<TPLHERPHACPAEGCDRRFSRS DNLVRHLRIHTGHKPFQCRICMRSF SREDNLHTHIRT HTGEKPFACEFCGRKFARSDELVRHAKIHLKQKEH ACPAEGCDRRFSQSGNLTEHLRIHTGHKPFQCRICM RSFSTSGHLVRHIRTHTGEKPFACEFCGRKFAQNSTL TEHAKIHLKQKEKKAEKGGAPSASSAPPVSLAPWT TCA MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLF SGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYS GSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMS AGILGVPPASGALSTQTSTASMVQPPQGDVEAMYP ALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQS AKPALDSNLFPMIPDYNLYH HPNDMGSIPEHKPFQG MDPIRVNPPPPITPLETIKAFKDKQIHPGFGSLPQPPLT LI<PIRPRI<YPNRPSI<TPLHERPHACPAEGCDRRFSRS DNLVRHLRIHTGHKPFQCRICMRSF SREDNLHTHIRT HTGEKPFACEFCGRKFARSDELVRHAKIHLKQKEH ACPAEGCDRRFSQSGNLTEHLRIHTGHKPFQCRICM RSFSTSGHL VRHIRTHTGEKPFACEFCGRKFAQNSTL TEHAKIHLKQKEKKAEKGGAPSASSAPPVSLAPWT TCA 122 122 26 26 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLTRHIRIHTGQKP FQCRICMRNFSRSDNLTTHIRTHTGEKPFACDICGRK MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIY SAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLTRHIRIHTGQKP FQCRICMRNFSRSDNLTTHIRTHTGEKPFACDIC GRK 123 123

- 73 046157- 73 046157

FARSDERKRHIRTHTGEKPFACDICGRKFSQSGNLTE HIRIHTGQKPFQCRICMRNFSTSGHLTRHIRTHTGEK PFACDICGRKFAQSSTRKEHTKIHLRQKDKKADKSV VASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPS PVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAF PAQVSSFPSSAVTNSFSASTGLSDMTATFSPRTIEIC FARSDERKRHIRTHTGEKPFACDICGRKFSQSGNLTE HIRIHTGQKPFQCRICMRNFSTSGHLTRHIRTHTGEK PFACDICGRKFAQSSTRKEHTKIHLRQKDKKADKSV VASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPS PVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAF PAQVSSFPSSAVTNSFSASTGLSDMTATFSP RTIEIC 27 27 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SREDNLHTHIRTHTGEKPF ACDICGR KFARSDELVRHIRTHTGEKPFACDICGRKFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDKKADKS VVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYP SPVPTSF S SPGS STYPSPVHSGFPSPS VATTYS S VPP A FP AQ VS SFP S S AVTNSF S ASTGLSDMT ATF SPRTIEIC MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKL EEMMLLSNGAPQFLGAAGAPEGSGSNS S S S SSGGGG GGGGGSNS S S S S STFNPQ ADTGEQPYEHLTAESFPDI SLNNEKVLVETSYPSQTTRLPPITYTGRFSLEPAPNS GNTLWPEPLF SL VSGL VSMTNPP AS S S SAP SPAAS SA SASQSPPLSCAVPSNDSSPIY SAAPTFPTPNTDIFPEPQ SQAFPGSAGTALQYPPPAYPAAKGGFQVPMIPDYLF PQQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKA FATQSGSQDLKALNTSYQSQLIKPSRMRKYPNRPSK TPPHERP YACPVESCDRRF SRSDNLVRHIRIHTGQKP FQCRICMRNF SREDNLHTHIRTHTGEKPF ACDIC GR KFARSDELVRHIRTHTGEKPFACDICGRKFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDKKADKS VVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYP SPVPTSF S SPGS STYPSPVHSGFPSPS VATTYS S VPP A FP AQ VS SFP S S AVTNSF S ASTGLSDMT ATF SPRTIEIC 124 124 28 28 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFSS P ADLTRHQRTHTGEKPYKCPECGKSF SRSDNLVRH QRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGE KPYKCPECGKSFSRSDELVRHQRTHTGEKPYKCPEC GKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSTSG HLVRHQRTHTGKKTSKRPAATKKAGQAKKKKGSY PYDVPDYALEDALDDFDLDMLGSDALDDFDLDML GSDALDDFDLDMLGSDALDDFDLDML MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFSS P ADLTRHQRTHTGEKPYKCPECGKSF SRSDNLVRH QRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGE KPYKCPECGKSFSRSDELVRHQRTHTGEKPYKCPEC GKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSTSG HLVRHQR THTGKKTSKRPAATKKAGQAKKKKGSY PYDVPDYALEDALDDFDLDMLGSDALDDFDLDML GSDALDDFDLDMLGSDALDDFDLDML 125 125 29 29 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS DPGALVRHQRTHTGEKPYKCPECGKSFSRSDNLVR HQRTHTGEKPYKCPECGKSFSQSGDLRRHQRTHTG EKPYKCPECGKSFSTHLDLIRHQRTHTGEKPYKCPE CGKSF STSGNLVRHQRTHTGEKPYKCPECGKSF SRS DNLVRHQRTHTGKKTSKRPAATKKAGQAKKKKGS YPYDVPDYALEDALDDFDLDMLGSDALDDFDLDM LGSDALDDFDLDMLGSDALDDFDLDML MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS DPGALVRHQRTHTGEKPYKCPECGKSFSRSDNLVR HQRTHTGEKPYKCPECGKSFSQSGDLRRHQRTHTG EKPYKCPECGKSFSTHLDLIRHQRTHTGEKPYKCPE CGKSF STSGNLVRHQRTHTGEKPYKCPECGKSF SRS DNLVRHQ RTHTGKKTSKRPAATKKAGQAKKKKGS YPYDVPDYALEDALDDFDLDMLGSDALDDFDLDM LGSDALDDFDLDMLGSDALDDFDLDML 126 126 30 thirty MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SHRTTLTNH QRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGE KPYKCPECGKSFSTSHSLTEHQRTHTGEKPYKCPEC GKSFSQSSSLVRHQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTGKKTSKRPAATKKAGQAKKKKGSY PYDVPDYALEEASGSGRADALDDFDLDMLGSDALD DFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLIN SRS SGSPKKKRKVGSQ YLPDTDDRHRIEEKRKRTYE TFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPA PQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAP PQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQ MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SHRTTLTNH QRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTGE KPYKCPECGKSFSTSHSLTEHQRTHTGEKPYKCPEC GKSFSQSSSLVRHQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTTGK KTSKRPAATKKAGQAKKKKGSY PYDVPDYALEEASGSGRADALDDFDLDMLGSDALD DFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLIN SRS SGSPKKKRKVGSQ YLPDTDDRHRIEEKRKRTYE TFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPA PQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAP AP PQVLPQAPAPAPAPAMVSALAQAPAPPVVLAPGPPQ 99 99

- 74 046157- 74 046157

AVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLG NSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEP MLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGL LSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPK PEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPL PASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPE ASHLLEDPDEETSQAVKALREMADTVIPQKEEAAIC GQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTP ELNEILDTFLNDECLLHAMHISTGLSIFDTSLF AVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLG NSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEP MLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGL LSGDEDFFSSIADMDFSALLGSGSGSRDSREGMFLPK PEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPL PASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPE ASHLLEDPDEETSQAVKALREMADTVIPQKEEAAIC GQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTP ELNEILDTFLNDECLLHAMHISTGLSIFDTSLF 31 31 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTH TGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML 102 102 32 32 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTH TGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML 102 102 33 33 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEEASGSGRADALDDFDLDMLGSDALD DFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLIN SRS SGSPKKKRKVGSQ YLPDTDDRHRIEEKRKRTYE TFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPA PQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAP PQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQ AVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLG NSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEP MLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGL LSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPK PEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPL PASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPE ASHLLEDPDEETSQAVKALREMADTVIPQKEEAAIC GQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTP ELNEILDTFLNDECLLHAMHISTGLSIFDTSLF MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTH TGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEEASGSGRADALDDFDLDMLGSDALD DFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLIN SRS SGSPKKKRKVGSQ YLPDTDDRHRIEEKRKRTYE TFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPA PQPYPFTSSLSTINYDEFPTMVFPSGQISQAS ALAPAP PQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQ AVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLG NSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEP MLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGL LSGDEDFSIADMDFSALLGSGSGSRDSREGMFLPK PEAGSAISDVFEGREVCQPKRIRPFHPPG SPWANRPL PASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPE ASHLLEDPDEETSQAVKALREMADTVIPQKEEAAIC GQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTP ELNEILDTFLNDECLLHAMHISTGLSIFDTSLF 100 100 34 34 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS 127 127

- 75 046157- 75 046157

TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSD ALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLD MLGSDALDDFDLDML TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSD ALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLD MLGSDALDDFDLDML 35 35 MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSD ALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLD MLGSDALDDFDLDML MAPKKKRKVGIHGVPAALEPGEKPYKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTH TGKKTSKRPAATKKAGQAKKKKGSD ALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLD MLGSDALDDFDLDML 127 127 36 36 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCQSQLIKPSRMRKYPNRPSKTPPHERPYACPVES CDRRF SRSDNL VRHIRIHTGQK P FQC R IC MRNF SRED NLHTHIRTHTGEKPFACDICGRKFARSDELVRHTKIH LRQKDRPYACPVESCDRRFSQSGNLTEHIRIHTGQK PFQCRICMRNFSTSGHLVRHIRTHTGEKPFACDICGR KFAQNSTLTEHTKIHLRQKDK MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPPFAVPPPAAGIAHLQPVATPYPGRAAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDDCFSDLGSAPPAG SVSCQSQLIKPSRMRKYPNRPSKTPPHERPYAC PVES CDRRF SRSDNL VRHIRIHTGQK P FQC R IC MRNF SRED NLHTHIRTHTGEKPFACDICGRKFARSDELVRHTKIH LRQKDRPYACPVESCDRRFSQSGNLTEHIRIHTGQK PFQCRICMRNFSTSGHLVRHIRTHTGEKPFACDICGR KFAQNSTLTEHTKIHLRQKDK 128 128 37 37 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRF SRSDNL VRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDK MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPP HE RPYACPVESCDRRF SRSDNL VRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDK 106 106 38 38 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGGGSGGGSGQSQLIKPSRMRKYPN RPSKTPPHERPYACPVESCDRRFSRSDNLVRHIRIHT GQKPFQCRICMRNFSREDNLHTHIRTHTGEKPFACDI CGRKFARSDELVRHTKIHLRQKDRPYACPVESCDRR FSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGHLVR HIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHLRQK DK MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPPFAVPPPAAGIAHLQPVATPYPGRAAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDDCFSDLGSAPPAG SVSCGGSGGGSGGGSGGGSGQSQLIKPSRMRKYPN R PSKTPPHERPYACPVESCDRRFSRSDNLVRHIRIHT GQKPFQCRICMRNFSREDNLHTHIRTHTGEKPFACDI CGRKFARSDELVRHTKIHLRQKDRPYACPVESCDRR FSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGHLVR HIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHLRQK DK 129 129 39 39 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPP HE 105 105

- 76 046157- 76 046157

RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDKLEMAD HLMLAEGYRLVQRPPSAAAAHGPHALRTLPPYAGP GLDSGLRPRGAPLGPPPPRQPGALAYGAFGPPSSFQP FPAVPPPAAGIAHLQPVATPYPGRAAAPPNAPGGPP GPQPAPSAAAPPPPAHALGGMDAELIDEEALTSLEL ELGLHRVRELPELFLGQSEFDCFSDLGSAPPAGSVSC RPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDKLEMAD HLMLAEGYRLVQRPPSAAAAHGP HALRTLPYAGP GLDSGLRPRGAPLGPPPPRQPGALAYGAFGPPSSFQP FPAVPPPAAGIAHLQPVATPYPGRAAAAPPNAPGGPP GPQPAPSAAAPPPPAHALGGMDAELIDEEALTSLEL ELGLHRVRELPELFLGQSEFDDCFSDLGSAPPAGSVSC 40 40 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCADHLMLAEGYRLVQRPPSAAAAHGPHALRTL PPYAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFG PPSSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPN APGGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEA LTSLELELGLHRVRELPELFLGQSEFDCFSDLGSAPP AGSVSCQSQLIKPSRMRKYPNRPSKTPPHERPYACP VESCDRRFSRSDNLVRHIRIHTGQKPFQCRICMRNFS REDNLHTHIRTHTGEKPFACDICGRKFARSDELVRH TKIHLRQKDRPYACPVESCDRRFSQSGNLTEHIRIHT GQKPFQCRICMRNFSTSGHLVRHIRTHTGEKPFACDI CGRKFAQNSTLTEHTKIHLRQKDK MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDDCFSDLGSAPPAG SVSCADHLMLAEGYRLVQRPPSAAAAHGPHALRTL PP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFG PPSSFQPPFAVPPPAAGIAHLQPVATPYPGRAAAAPPN APGGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEA LTSLELELGLHRVRELPELFLGQSEFDDCFSDLGSAPP AGSVSCQSQLIKPSRMRKYPNRPSKTPPHERPYACP VESCDRRFSRSDNLVRHIRIHTGQKPFQCRICMR NFS REDNLHTHIRTHTGEKPFACDICGRKFARSDELVRH TKIHLRQKDRPYACPVESCDRRFSQSGNLTEHIRIHT GQKPFQCRICMRNFSTSGHLVRHIRTHTGEKPFACDI CGRKFAQNSTLTEHTKIHLRQKDK 130 130 41 41 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGADHLMLAEGYRLVQRPPSAAAAH GPHALRTLPPYAGPGLDSGLRPRGAPLGPPPPRQPG ALAYGAFGPPSSFQPFPAVPPPAAGIAHLQPVATPYP GRAAAPPNAPGGPPGPQPAPSAAAPPPPAHALGGM DAELIDEEALTSLELELGLHRVRELPELFLGQSEFDC FSDLGSAPPAGSVSCGGSGGGSGQSQLIKPSRMRKY PNRPSKTPPHERPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQCRICMRNF SREDNLHTHIRTHTGEKPF A CDICGRKFARSDELVRHTKIHLRQKDRPYACPVESC DRRFSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGH LVRHIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHL RQKDK MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDDCFSDLGSAPPAG SVSCGGSGGGSGADHLMLAEGYRLVQRPPSAAAAH GP HALRTLPPYAGPGLDSGLRPRGAPLGPPPPRQPG ALAYGAFGPPSSFQPPFAVPPPAAGIAHLQPVATPYP GRAAAPPNAPGGPPGPQPAPSAAAPPPPAHALGGM DAELIDEEALTSLELELGLHRVRELPELFLGQSEFDC FSDLGSAPPAGSVSCGGSGGGSGQSQLIKPSRMRKY PNRPSKTPPHERPYACPVESCDRRFSRSDNLVRHIRI HTG QKPFQCRICMRNF SREDNLHTHIRTHTGEKPF A CDICGRKFARSDELVRHTKIHLRQKDRPYACPVESC DRRFSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGH LVRHIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHL RQKDK 131 131 42 42 MAPI<I<I<RI<VGIHGVPAALEPGEI<P YKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML MAPI<I<I<RI<VGIHGVPAALEPGEI<P YKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEH QRTHTTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML 102 102

- 77 046157- 77 046157

43 43 MAPKKKRKVGIHGVPAALEPGEKP YKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTHTGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML MAPKKKRKVGIHGVPAALEPGEKP YKCPECGKSFS RSDNLVRHQRTHTGEKPYKCPECGKSF SREDNLHT HQRTHTGEKPYKCPECGKSFSRSDELVRHQRTHTGE KPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPEC GKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSQNS TLTEHQRTH TGKKTSKRPAATKKAGQAKKKKGSYP YDVPDYALEDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDMLGSDALDDFDLDML 102 102 44 44 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQP AP S AAAPPPP AHALGGMD A ELID EE A LT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDK MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPPFAVPPPAAGIAHLQPVATPYPGRAAAAPPNAP GGPPGPQP AP S AAAPPPP AHALGGMD A ELID EE A LT SLELELGLHRVRELPELFLGQSEFDCFSDDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRK YPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDK 106 106 45 45 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQP AP S AAAPPPP AHALGGMD A ELID EE A LT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRKYPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDK MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPPFAVPPPAAGIAHLQPVATPYPGRAAAAPPNAP GGPPGPQP AP S AAAPPPP AHALGGMD A ELID EE A LT SLELELGLHRVRELPELFLGQSEFDCFSDDLGSAPPAG SVSCGGSGGGSGQSQLIKPSRMRK YPNRPSKTPPHE RPYACPVESCDRRFSRSDNLVRHIRIHTGQKPFQCRI CMRNFSREDNLHTHIRTHTGEKPFACDICGRKFARS DELVRHTKIHLRQKDRPYACPVESCDRRFSQSGNLT EHIRIHTGQKPFQCRICMRNFSTSGHLVRHIRTHTGE KPFACDICGRKFAQNSTLTEHTKIHLRQKDK 106 106 46 46 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQP AP S AAAPPPP AHALGGMD A ELID EE A LT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGGGSGGGSGQSQLIKPSRMRKYPN RPSKTPPHERPYACPVESCDRRFSRSDNLVRHIRIHT GQKPFQCRICMRNFSREDNLHTHIRTHTGEKPFACDI CGRKFARSDELVRHTKIHLRQKDRPYACPVESCDRR FSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGHLVR HIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHLRQK DK MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPPFAVPPPAAGIAHLQPVATPYPGRAAAAPPNAP GGPPGPQP AP S AAAPPPP AHALGGMD A ELID EE A LT SLELELGLHRVRELPELFLGQSEFDDCFSDLGSAPPAG SVSCGGSGGGSGGGSGGGSGQSQLIK PSRMRKYPN RPSKTPPHERPYACPVESCDRRFSRSDNLVRHIRIHT GQKPFQCRICMRNFSREDNLHTHIRTHTGEKPFACDI CGRKFARSDELVRHTKIHLRQKDRPYACPVESCDRR FSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGHLVR HIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHLRQK DK 205 205 47 47 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQP AP S AAAPPPP AHALGGMD A ELID EE A LT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCADHLMLAEGYRLVQRPPSAAAAHGPHALRTL PPYAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFG PPSSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPN APGGPPGPQPAPSAAAPPPP AHALGGMD AELIDEEA MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAAPPNAP GGPPGPQP AP S AAAPPPP AHALGGMD A ELID EE A LT SLELELGLHRVRELPELFLGQSEFDCFSDDLGSAPPAG SVSCADHLMLAEGYRLVQRPPSAAA AHGPHALRTL PPYAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFG PPSSFQPPFAVPPPAAGIAHLQPVATPYPGRAAAAPPN APGGPPGPQPAPSAAAPPPP AHALGGMD AELIDEEA 207 207

- 78 046157- 78 046157

LTSLELELGLHRVRELPELFLGQSEFDCFSDLGSAPP AGSVSCQSQLIKPSRMRKYPNRPSKTPPHERPYACP VESCDRRFSRSDNLVRHIRIHTGQKPFQCRICMRNFS REDNLHTHIRTHTGEKPFACDICGRKFARSDELVRH TKIHLRQKDRPYACPVESCDRRFSQSGNLTEHIRIHT GQKPFQCRICMRNFSTSGHLVRHIRTHTGEKPFACDI CGRKFAQNSTLTEHTKIHLRQKDK LTSLELELGLHRVRELPELFLGQSEFDDCFSDLGSAPP AGSVSCQSQLIKPSRMRKYPNRPSKTPPHERPYACP VESCDRRFSRSDNLVRHIRIHTGQKPFQCRICMRNFS REDNLHTHIRTHTGEKPFACDICGRKFARSDELVRH TKIHLRQKDRPYACPVESCDRRFSQSGNLTEHIRIHT GQKPFQCRICMRNFSTSGHL VRHIRTHTGEKPFACDI CGRKFAQNSTLTEHTKIHLRQKDK 48 48 MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDCFSDLGSAPPAG SVSCGGSGGGSGADHLMLAEGYRLVQRPPSAAAAH GPHALRTLPPYAGPGLDSGLRPRGAPLGPPPPRQPG ALAYGAFGPPSSFQPFPAVPPPAAGIAHLQPVATPYP GRAAAPPNAPGGPPGPQPAPSAAAPPPPAHALGGM DAELIDEEALTSLELELGLHRVRELPELFLGQSEFDC FSDLGSAPPAGSVSCGGSGGGSGQSQLIKPSRMRKY PNRPSKTPPHERPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQCRICMRNF SREDNLHTHIRTHTGEKPF A CDICGRKFARSDELVRHTKIHLRQKDRPYACPVESC DRRFSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGH LVRHIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHL RQKDK MAADHLMLAEGYRLVQRPPSAAAAHGPHALRTLPP YAGPGLDSGLRPRGAPLGPPPPRQPGALAYGAFGPP SSFQPFPAVPPPAAGIAHLQPVATPYPGRAAAAPPNAP GGPPGPQPAPSAAAPPPPAHALGGMDAELIDEEALT SLELELGLHRVRELPELFLGQSEFDDCFSDLGSAPPAG SVSCGGSGGGSGADHLMLAEGYRLVQRPPSAAAAH GP HALRTLPPYAGPGLDSGLRPRGAPLGPPPPRQPG ALAYGAFGPPSSFQPPFAVPPPAAGIAHLQPVATPYP GRAAAPPNAPGGPPGPQPAPSAAAPPPPAHALGGM DAELIDEEALTSLELELGLHRVRELPELFLGQSEFDC FSDLGSAPPAGSVSCGGSGGGSGQSQLIKPSRMRKY PNRPSKTPPHERPYACPVESCDRRFSRSDNLVRHIRI HTG QKPFQCRICMRNF SREDNLHTHIRTHTGEKPF A CDICGRKFARSDELVRHTKIHLRQKDRPYACPVESC DRRFSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGH LVRHIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHL RQKDK 209 209 49 49 MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRLEPGEKPYKCPECGKSFSRSDNLVR HQRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTG EKPYKCPECGKSFSRSDELVRHQRTHTGEKPYKCPE CGKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSTS GHLVRHQRTHTGEKPYKCPECGKSFSQNSTLTEHQ RTHTGKKTSVYVGGLESRVLKYTAQNMELQNKVQ LLEEQNLSLLDQLRKLQAMVIEISNKTS S S STCILVLL VSFCLLLVPAMYSSDTRGSLPAEHGVLSRQLRALPS EDPYQLELPALQSEVPKDSTHQWLDGSDCVLQAPG NT SCLLHYMPQ AP S AEPPLEWPFPDLF SEPLCRGPIL PLQANLTRKGGWLPTGSPSVILQDRYSG MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRLEPGEKPYKCPECGKSFSRSDNLVR HQRTHTGEKPYKCPECGKSFSRED S S STCILV LL VSFCLLLVPAMYSSDTRGSLPAEHGVLSRQLRALPS EDPYQLELPALQSEVPKDSTHQWLDGSDCVLQAPG NT SCLLHYMPQ AP S AEPPLEWPFPDLF SEPLCRGPIL PLQANLTRKGGWLPTGSPSVILQDRYSG 213 213 50 50 MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRRPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQCRICMRNF SREDNLHTHIRTHTGEKPF A CDICGRKFARSDELVRHTKIHLRQKDRPYACPVESC DRRFSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGH LVRHIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHL RQKDVYVGGLESRVLKYTAQNMELQNKVQLLEEQ NLSLLDQLRKLQ AMVIEISNKT S S S STCILVLL VSFCL LLVP AM YS SDTRGSLP AEHGVLSRQLRALP SEDP YQ MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRRPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQHTCRICMRNF SREDNLHIRTHT GEKPF A CDICGRKFARSDELVRHTKIHLRQKDRPYACPVESC DRRFSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGH LVRHIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHL RQKDVYVGGLESRVLKYTAQNMELQNKVQLLEEQ NLSLLDQLRKLQ AMVIEISNKT S S S STCILVLL VSFCL LLVP AM Y S SDTRGSLP AEHGVLSRQLRALP SEDP YQ 217 217

- 79 046157- 79 046157

LELPALQSEVPKDSTHQWLDGSDCVLQAPGNTSCL LHYMPQAPSAEPPLEWPFPDLFSEPLCRGPILPLQAN LTRKGGWLPTGSPSVILQDRYSG LELPALQSEVPKDSTHQWLDGSDCVLQAPGNTSCL LHYMPQAPSAEPPLEWPFPDLFSEPLCRGPILPLQAN LTRKGGWLPTGSPSVILQDRYSG 51 51 MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRRPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQCRICMRNF SHRTTLTNHIRTHTGEKPF A CDICGRKFAREDNLHTHTKIHLRQKDRPYACPVESC DRRFSTSHSLTEHIRIHTGQKPFQCRICMRNFSQSSSL VRHIRTHTGEKPFACDICGRKFAREDNLHTHTKIHL RQKDVYVGGLESRVLKYTAQNMELQNKVQLLEEQ NLSLLDQLRKLQ AMVIEISNKT S S S STCIL VLL VSFCL LLVP AM YS SDTRGSLP AEHGVLSRQLRALP SEDP YQ LELPALQSEVPKDSTHQWLDGSDCVLQAPGNTSCL LHYMPQAPSAEPPLEWPFPDLFSEPLCRGPILPLQAN LTRKGGWLPTGSPSVILQDRYSG MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRRPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQCRICMRNF SHRTTLTNHIRTHT GEKPF A CDICGRKFAREDNLHTHTKIHLRQKDRPYACPVESC DRRFSTSHSLTEHIRIHTGQKPFQCRICMRNFSQSSSL VRHIRTHTGEKPFACDICGRKFAREDNLHTHTKIHL RQKDVYVGGLESRVLKYTAQNMELQNKVQLLEEQ NLSLLDQLRKLQ AMVIEISNKT S S S STCIL VLL VSFCL LLVP AM Y S SDTRGSLP AEHGVLSRQLRALP SEDP YQ LELPALQSEVPKDSTHQWLDGSDCVLQAPGNTSCL LHYMPQAPSAEPPLEWPFPDLFSEPLCRGPILPLQAN LTRKGGWLPTGSPSVILQDRYSG 219 219 52 52 MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRLEPGEKPYKCPECGKSFSRSDNLVR HQRTHTGEKPYKCPECGKSFSREDNLHTHQRTHTG EKPYKCPECGKSFSRSDELVRHQRTHTGEKPYKCPE CGKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSTS GHLVRHQRTHTGEKPYKCPECGKSFSQNSTLTEHQ RTHTGKKTSVYVGGLESRVLKYTAQNMELQNKVQ LLEEQNLSLLDQLRKLQAMVIEIS MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRLEPGEKPYKCPECGKSFSRSDNLVR HQRTHTGEKPYKCPECGKSFSRED NLHTHQRTHTG EKPYKCPECGKSFSRSDELVRHQRTHTGEKPYKCPE CGKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSTS GHLVRHQRTHTGEKPYKCPECGKSFSQNSTLTEHQ RTHTGKKTSVYVGGLESRVLKYTAQNMELQNKVQ LLEEQNLSLLDQLRKLQAMVIEIS 221 221 53 53 MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRRPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQCRICMRNF SREDNLHTHIRTHTGEKPF A CDICGRKFARSDELVRHTKIHLRQKDRPYACPVESC DRRFSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGH LVRHIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHL RQKDVYVGGLESRVLKYTAQNMELQNKVQLLEEQ NLSLLDQLRKLQ AMVIEIS MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPL DWALPLSEVPSDWEVDDLLCSLLSPPASLNILSSSNP CLVHHDHTYSLPRETVSMDLESESCRKEGTQMTPQ HMEELAEQEIARLVLTDEEKSLLEKEGLILPETLPLT KTEEQILKRVRRPYACPVESCDRRFSRSDNLVRHIRI HTGQKPFQHTCRICMRNF SREDNLHIRTHT GEKPF A CDICGRKFARSDELVRHTKIHLRQKDRPYACPVESC DRRFSQSGNLTEHIRIHTGQKPFQCRICMRNFSTSGH LVRHIRTHTGEKPFACDICGRKFAQNSTLTEHTKIHL RQKDVYVGGLESRVLKYTAQNMELQNKVQLLEEQ NLSLLDQLRKLQ AMVIEIS 223 223

- 80 046157- 80 046157

Таблица 7Table 7

Последовательности нуклеиновой кислоты, кодирующие раскрытые в настоящем документе иллюстративные сконструированные факторы транскрипцииNucleic acid sequences encoding exemplary engineered transcription factors disclosed herein

Конструкция Design Последовательность Subsequence SEQ ID NO SEQ ID NO 31 (RE + кодирующая) 31 (RE + encoding) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt 67 67 gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttttgagaca gagtcttgctctgtt gcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctg cctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagaggggga g gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcaggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgg gagggg gaggttgagtacgttctggattactcataagacctttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcc tccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgc ccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tcca ggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttcttccagggaattag gacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgttt ctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAACCTTATAAATGTCCAGA ATGT GGAAAGTCCTTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACA AGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA

- 81 046157- 81 046157

ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGACGCGC TGGACGATTTCGATCTCGACATGCTGGGTTCTGA TGCCCTCGATGACTTTGACCTGGATATGTTGGGA AGCGACGCATTGGATGACTTTGATCTGGACATGC TCGGCTCCGATGCTCTGGACGATTTCGATCTCGA T AT GTT AT A A AC T AGT aaagagaccggttcactgtgacagtaaaa gagaccggttcactgtgagaatgaaagagaccggttcactgtgatcggaaaaga gaccggttcactgtgagcggccttgaaacccagcagacaatgtagctcagtaga aacccagcagacaatgtagctgaatggaaacccagcagacaatgtagcttcgg agaaacccagcagacaatgtagctAAGCTTGGGTGGCATCCC TGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGG AAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCT AATAAAATTAAGTTGCATCATTTTGTCTGACTAG GTGTCCTTCTATAATATTATGGGGTGGAGGGGGG TGGTATGGAGCAAGGGGCAAGTTGGGAAGACAA CCTGTAGGGCCTGCGGGGTCTATTGGGAACCAA GCTGGAGTGCAGTGGCACAATCTTGGCTCACTGC AATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTG CCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCAT GCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGG TAGAGACGGGGTTTCACCATATTGGCCAGGCTGG TCTCCAACTCCTAATCTCAGGTGATCTACCCACC TTGGCCTCCCAAATTGCTGGGATTACAGGCGTGA ACCACTGCTCCCTTCCCTGTCCTT ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGACGCGC TGGACGATTTCGATCTCGACATGCTGGGTTCTGA TGCCCTCGATGACTTTGACCTGGATATGTTGGGA AGCGACGCATTGGA TGACTTTGATCTGGACATGC TCGGCTCCGATGCTCTGGACGATTTCGATCTCGA T AT GTT AT A A AC T AGT aaagagaccggttcactgtgacagtaaaa gagaccggttcactgtgagaatgaaagagaccggttcactgtgatcggaaaaga gaccggttcactgtgagcggccttgaaacccagcagacaatgtagctcagtaga aacc cagcagacaatgtagctgaatggaaacccagcagacaatgtagcttcgg agaaacccagcagacaatgtagctAAGCTTGGGTGGCATCCC TGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGG AAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCT AATAAAATTAAGTTGCATCATTTTGTCTGACTAG GTGTCCTTCTATAATATTATGGGGTGGAGGGGGG TGGTATGGAGC AAGGGGCAAGTTGGGAAGACAA CCTGTAGGGCCTGCGGGGTCTATTGGGAACCAA GCTGGAGTGCAGTGGCACAATCTTGGCTCACTGC AATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTG CCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCAT GCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGG TAGAGACGGGGTTTCACCATATTGGCCAGGCTGG TCTCCAACTCCTAAT CTCAGGTGATCTACCCACC TTGGCCTCCCAAATTGCTGGGATTACAGGCGTGA ACCACTGCTCCCTTCCCTGTCCTT 32 (RE + кодирующая) 32 (RE + encoding) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagaga agagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcct ccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgc ccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggt ccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagacctttttt tttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc 68 68

- 82 046157- 82 046157

ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGACGCGC TGGACGATTTCGATCTCGACATGCTGGGTTCTGA TGCCCTCGATGACTTTGACCTGGATATGTTGGGA AGCGACGCATTGGATGACTTTGATCTGGACATGC TCGGCTCCGATGCTCTGGACGATTTCGATCTCGA TATGTTATAAACTAGTAAGCTTGGGTGGCATCCC TGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGG AAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCT AATAAAATTAAGTTGCATCATTTTGTCTGACTAG GTGTCCTTCTATAATATTATGGGGTGGAGGGGGG TGGTATGGAGCAAGGGGCAAGTTGGGAAGACAA CCTGTAGGGCCTGCGGGGTCTATTGGGAACCAA GCTGGAGTGCAGTGGCACAATCTTGGCTCACTGC AATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTG CCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCAT ggagccgtgcagccgcctctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagag ccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctg cccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacacc gaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggact ctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGA GAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCT TTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGACGCGC TGGACGATTTCGATC TCGACATGCTGGGTTCTGA TGCCCTCGATGACTTTGACCTGGATATGTTGGGA AGCGACGCATTGGATGACTTTGATCTGGACATGC TCGGCTCCGATGCTCTGGACGATTTCGATCTCGA TATGTTATAAACTAGTAAGCTTGGGTGGCATCCC TGTGACCCCTCCCAGTGCCTCTCCTGGCCCTGG AAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCT AATAAAATTAAGTTGCATCATTT TGTCTGACTAG GTGTCCTTCTATAATATTATGGGGTGGAGGGGGG TGGTATGGAGCAAGGGGCAAGTTGGGAAGACAA CCTGTAGGGCCTGCGGGGTCTATTGGGAACCAA GCTGGAGTGCAGTGGCACAATCTTGGCTCACTGC AATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTG CCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCAT

- 83 046157- 83 046157

GCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGG TAGAGACGGGGTTTCACCATATTGGCCAGGCTGG TCTCCAACTCCTAATCTCAGGTGATCTACCCACC TTGGCCTCCCAAATTGCTGGGATTACAGGCGTGA ACCACTGCTCCCTTCCCTGTCCTT GCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGG TAGAGACGGGGTTTCACCATATTGGCCAGGCTGG TCTCCAACTCCTAATCTCAGGTGATCTACCCACC TTGGCCTCCCAAATTGCTGGGATTACAGGCGTGA ACCACTGCTCCCTTCCCTGTCCTT 33 (RE + кодирующая) 33 (RE + encoding) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagaga agagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcct ccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgc ccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggt ccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttt tttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctct ccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacc tggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactg cgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcg ccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgacc gagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACA CATACTGGTGAAAAACCA 69 69

- 84 046157- 84 046157

TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGAGGCC AGCGGTTCCGGACGGGCTGACGCATTGGACGAT TTTGATCTGGATATGCTGGGAAGTGACGCCCTCG ATGATTTTGACCTTGACATGCTTGGTTCGGATGC CCTTGATGACTTTGACCTCGACATGCTCGGCAGT GACGCCCTTGATGATTTCGACCTGGACATGCTGA TTAACTCTAGAAGTTCCGGATCTCCGAAAAAGAA ACGCAAAGTTGGTAGCCAGTACCTGCCCGACAC CGACGACCGGCACCGGATCGAGGAAAAGCGGAA GCGGACCTACGAGACATTCAAGAGCATCATGAA GAAGTCCCCCTTCAGCGGCCCCACCGACCCTAGA CCTCCACCTAGAAGAATCGCCGTGCCCAGCAGAT CCAGCGCCAGCGTGCCAAAACCTGCCCCCCAGC CTTACCCCTTCACCAGCAGCCTGAGCACCATCAA CTACGACGAGTTCCCTACCATGGTGTTCCCCAGC GGCCAGATCTCTCAGGCCTCTGCTCTGGCTCCAG CCCCTCCTCAGGTGCTGCCTCAGGCTCCTGCTCC TGCACCAGCTCCAGCCATGGTGTCTGCACTGGCT CAGGCACCAGCACCCGTGCCTGTGCTGGCTCCTG GACCTCCACAGGCTGTGGCTCCACCAGCCCCTAA ACCTACACAGGCCGGCGAGGGCACACTGTCTGA AGCTCTGCTGCAGCTGCAGTTCGACGACGAGGAT CTGGGAGCCCTGCTGGGAAACAGCACCGATCCT GCCGTGTTCACCGACCTGGCCAGCGTGGACAAC AGCGAGTTCCAGCAGCTGCTGAACCAGGGCATC CCTGTGGCCCCTCACACCACCGAGCCCATGCTGA TGGAATACCCCGAGGCCATCACCCGGCTCGTGAC AGGCGCTCAGAGGCCTCCTGATCCAGCTCCTGCC CCTCTGGGAGCACCAGGCCTGCCTAATGGACTGC TGTCTGGCGACGAGGACTTCAGCTCTATCGCCGA TATGGATTTCTCAGCCTTGCTGGGCTCTGGCAGC GGCAGCCGGGATTCCAGGGAAGGGATGTTTTTG CCGAAGCCTGAGGCCGGCTCCGCTATTAGTGACG TGTTTGAGGGCCGCGAGGTGTGCCAGCCAAAAC GAATCCGGCCATTTCATCCTCCAGGAAGTCCATG GGCCAACCGCCCACTCCCCGCCAGCCTCGCACCA ACACCAACCGGTCCAGTACATGAGCCAGTCGGG TCACTGACCCCGGCACCAGTCCCTCAGCCACTGG TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAG GGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGAGGCC AGCGGTTCCGGACGGGCTGACGCATTGGACGAT TTTGATCTGGATATGCTGGGAAGTGAC GCCCTCG ATGATTTTGACCTTGACATGCTTGGTTCGGATGC CCTTGATGACTTTGACCTCGACATGCTCGGCAGT GACGCCCTTGATGATTTCGACCTGGACATGCTGA TTAACTCTAGAAGTTCCGGATCTCCGAAAAAGAA ACGCAAAGTTGGTAGCCAGTACCTGCCCGACAC CGACGACCGGCACCGGATCGAGGAAAAGCGGAA GCGGACCTACGAGACATTCAAGAGCATCATGAA GAAGTCCCCCTTCAGCGGCCCCACCGACCCTAGA CCTCCACCTAGAAGAATCGCCGTGCCCAGCAGAT CCAGCGCCAGCGTGCCAAAACCTGCCCCCCAGC CTTACCCCTTCACCAGCAGCCTGAGCACCATCAA CTACGACGAGTTCCCTACCATGGTGTTCCCCAGC GGCCAGATCTCTCAGGCCTCTGCTCTGGCTCCAG CCCCTCCTCAGGTGCTGCCTCAGGCTCCTGCTCC TGCACCA GCTCCAGCCATGGTGTCTGCACTGGCT CAGGCACCAGCACCCGTGCCTGTGCTGGCTCCTG GACCTCCACAGGCTGTGGCTCCACCAGCCCCTAA ACCTACACAGGCCGGCGAGGGCACACTGTCTGA AGCTCTGCTGCAGCTGCAGTTCGACGACGAGGAT CTGGGAGCCCTGCTGGGAAACAGCACCGATCCT GCCGTGTTCACCGACCTGGCCAGCTGGACAAC AGCGAGTTCCAG CAGCTGCTGAACCAGGGCATC CCTGTGGCCCCTCACACCACCGAGCCCATGCTGA TGGAATACCCCGAGGCCATCACCCGGCTCGTGAC AGGCGCTCAGAGGCCTCCTGATCCAGCTCCTGCC CCTCTGGGAGCACCAGGCCTGCCTAATGGACTGC TGTCTGGCGACGAGGACTTCAGCTCTATCGCCGA TATGGATTTCTCAGCCTTGCTGGGCTCTGGCAGC GGCAGCCGGGATTCC AGGGAAGGGATGTTTTTG CCGAAGGCCTGAGGCCGGCTCCGCTATTAGTGACG TGTTTGAGGGCCGCGAGGTGTGCCAGCCAAAAC GAATCCGGCCATTTCATCCTCCAGGAAGTCCATG GGCCAACCGCCCACTCCCCGCCAGCCTCGCACCA ACACCAACGGTCCAGTACATGAGCCAGTCGGG TCACTGACCCCGGCACCAGTCCCTCAGCCACTGG

- 85 046157- 85 046157

ATCCAGCGCCCGCAGTGACTCCCGAGGCCAGTC ACCTGTTGGAGGATCCCGATGAAGAGACGAGCC AGGCTGTCAAAGCCCTTCGGGAGATGGCCGATA CTGTGATTCCCCAGAAGGAAGAGGCTGCAATCT GTGGCCAAATGGACCTTTCCCATCCGCCCCCAAG GGGCCATCTGGATGAGCTGACAACCACACTTGA GTCCATGACCGAGGATCTGAACCTGGACTCACCC CTGACCCCGGAATTGAACGAGATTCTGGATACCT TCCTGAACGACGAGTGCCTCTTGCATGCCATGCA TATCAGCACAGGACTGTCCATCTTCGACACATCT CTGTTTTAAACTAGTaataaaagatctttattttcattagatctgtgtgt tggttttttgtgtg ATCCAGCGCCCGCAGTGACTCCCGAGGCCAGTC ACCTGTTGGAGGATCCCGATGAAGAGACGAGCC AGGCTGTCAAAGCCCTTCGGGAGATGGCCGATA CTGTGATTCCCCAGAAGGAAGAGGCTGCAATCT GTGGCCAAATGGACCTTTCCCATCCGCCCCCAAG GGGCCATCTGGATGAGCTGACAACCACACTTGA GTCCATGACCGAGGATCTGAACCTGGACTCACCC CTGACCCCGG AATTGAACGAGATTCTGGATACCT TCCTGAACGACGAGTGCCTCTTGCATGCCATGCA TATCAGCACAGGACTGTCCATCTTCGACACATCT CTGTTTTAAACTAGTaataaaagatctttattttcattagatctgtgtgt tggttttttgtgtg 34 (RE + кодирующая) 34 (RE + encoding) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagaga agagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcct ccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgc ccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggt ccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagacctttttt tttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctct ccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacc tggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactg cgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcg ccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgacc gagctgGAATTCGCCACCATGGCCCC 70 70

- 86 046157- 86 046157

AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCGACGC GCTGGACGATTTCGATCTCGACATGCTGGGTTCT GATGCCCTCGATGACTTTGACCTGGATATGTTGG GAAGCGACGCATTGGATGACTTTGATCTGGACAT GCTCGGCTCCGATGCTCTGGACGATTTCGATCTC GATATGTTATAAAAGCTTGGGTGGCATCCCTGTG ACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGT TGCCACTCCAGTGCCCACCAGCCTTGTCCTAATA AAATTAAGTTGCATCATTTTGTCTGACTAGGTGT CCTTCTATAATATTATGGGGTGGAGGGGGGTGGT ATGGAGCAAGGGGCAAGTTGGGAAGACAACCTG TAGGGCCTGCGGGGTCTATTGGGAACCAAGCTG GAGTGCAGTGGCACAATCTTGGCTCACTGCAATC TCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTC AGCCTCCCGAGTTGTTGGGATTCCAGGCATGCAT GACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAG AGACGGGGTTTCACCATATTGGCCAGGCTGGTCT CCAACTCCTAATCTCAGGTGATCTACCCACCTTG GCCTCCCAAATTGCTGGGATTACAGGCGTGAACC ACTGCTCCCTTCCCTGTCCTT AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAAAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTG TCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCT ACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCGACGC GCTGGACGATTTCGATCTCGACATGCTGGGTTCT GATGCCCTCGATGACTTTGACCTGGATATGTTGG GAAGCGACGCATTGGATGACTTTGATCTGGACAT GCTCGG CTCCGATGCTCTGGACGATTTCGATCTC GATATGTTATAAAAGCTTGGGTGGCATCCCTGTG ACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGT TGCCACTCCAGTGCCCACCAGCCTTGTCCTAATA AAATTAAGTTGCATCATTTTGTCTGACTAGGTGT CCTTCTATAATATTATGGGGTGGAGGGGGGTGGT ATGGAGCAAGGGGCAAGTTGGGAAGACAACCTG TAGGGCCTGC GGGGTCTATTGGGAACCAAGCTG GAGTGCAGTGGCACAATCTTGGCTCACTGCAATC TCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTC AGCCTCCCGAGTTGTTGGGATTCCAGGCATGCAT GACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAG AGACGGGGTTTCACCATATTGGCCAGGCTGGTCT CCAACTCCTAATCTCAGGTGATCTACCCACCTTG GCCTCCCAAA TTGCTGGGATTACAGGCGTGAACC ACTGCTCCCTTCCCTGTCCTT 26 (RE + кодирующая) 26 (RE + encoding) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagaga agagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcct ccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgc ccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta 71 71

- 87 046157- 87 046157

tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCGACGC GCTGGACGATTTCGATCTCGACATGCTGGGTTCT GATGCCCTCGATGACTTTGACCTGGATATGTTGG GAAGCGACGCATTGGATGACTTTGATCTGGACAT GCTCGGCTCCGATGCTCTGGACGATTTCGATCTC GATATGTTATAAaaagagaccggttcactgtgacagtaaaagagac tttacattttccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatgg ggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagacctttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaag ctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgagg aagcagctggaggtgacgccggggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggct tctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtcc gagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaagg ggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAG CAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTG TCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACC CTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCGACGC GCTGGACGATTTCGATCTCGACATGCTGGGTTCT GATGCCCTCGATGACTTTGACCTGGATATGTTGG GAAGCGACGCATTGGATGACTTTGATCTGGACAT GCTCGGCTCCGATGCTCTGGACGATTTCGATCTC GATATGTTATAAaa agagaccggttcactgtgacagtaaaagac

- 88 046157- 88 046157

cggttcactgtgagaatgaaagagaccggttcactgtgatcggaaaagagaccg gttcactgtgagcggccttgaaacccagcagacaatgtagctcagtagaaaccc agcagacaatgtagctgaatggaaacccagcagacaatgtagcttcggagaaa cccagcagacaatgtagctAAGCTTGGGTGGCATCCCTGTG ACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGT TGCCACTCCAGTGCCCACCAGCCTTGTCCTAATA AAATTAAGTTGCATCATTTTGTCTGACTAGGTGT CCTTCTATAATATTATGGGGTGGAGGGGGGTGGT ATGGAGCAAGGGGCAAGTTGGGAAGACAACCTG TAGGGCCTGCGGGGTCTATTGGGAACCAAGCTG GAGTGCAGTGGCACAATCTTGGCTCACTGCAATC TCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTC AGCCTCCCGAGTTGTTGGGATTCCAGGCATGCAT GACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAG AGACGGGGTTTCACCATATTGGCCAGGCTGGTCT CCAACTCCTAATCTCAGGTGATCTACCCACCTTG GCCTCCCAAATTGCTGGGATTACAGGCGTGAACC ACTGCTCCCTTCCCTGTCCTT cggttcactgtgagaatgaaagagaccggttcactgtgatcggaaaagagaccg gttcactgtgagcggccttgaaacccagcagacaatgtagctcagtagaaaccc agcagacaatgtagctgaatggaaacccagcagacaatgtagcttcggagaaa cccagcagacaatgtagctAAGCTTGGTGGCATCCCTGTG ACCCCTCCCCA GTGCCTCTCCTGGCCCTGGAAGT TGCCACTCCAGTGCCCACCAGCCTTGTCCTAATA AAATTAAGTTGCATCATTTTGTCTGACTAGGTGT CCTTCTATAATATTATGGGGTGGAGGGGGGTGGT ATGGAGCAAGGGGCAAGTTGGGAAGACAACCTG TAGGGCCTGCGGGGTCTATTGGGAACCAAGCTG GAGTGCAGTGGCACAATCTTGGCTCACTGCAATC TCCGCCTCCTG GGTTCAAGCGATTCTCCTGCCTC AGCCTCCCGAGTTGTTGGGATTCCAGGCATGCAT GACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAG AGACGGGGTTTCACCATATTGGCCAGGCTGGTCT CCAACTCCTAATCTCAGGTGATCTACCCACCTTG GCCTCCCAAATTGCTGGGATTACAGGCGTGAACC ACTGCTCCCTTCCCTGTCCTT 40 (кодирующая) 40 (encoding) ATGGCCGCAGATCACCTGATGCTGGCTGAAGGCT ACAGACTGGTGCAGCGGCCTCCATCTGCCGCTGC CGCCCACGGCCCCCACGCCCTGAGAACACTGCCC CCCTACGCCGGCCCTGGTCTTGATAGCGGACTCA GACCTAGAGGCGCCCCTCTGGGCCCTCCACCTCC AAGACAGCCTGGAGCCCTGGCCTACGGCGCCTTC GGCCCTCCTTCTAGCTTCCAGCCCTTCCCCGCCGT GCCTCCTCCAGCcGCTGGCATCGCCCACCTGCAG CCTGTGGCCACCCCTTACCCCGGAAGAGCCGCCG CCCCTCCAAACGCCCCTGGCGGACCTCCTGGCCC CCAGCCTGCTCCAAGCGCCGCTGCCCCTCCACCT CCTGCTCATGCCCTGGGCGGCATGGACGCCGAGC TGATCGACGAGGAAGCCCTGACCAGCCTGGAAC TGGAACTGGGCCTGCACAGAGTGCGGGAACTGC CTGAGCTGTTCCTGGGACAGAGCGAGTTCGACTG CTTCAGCGACCTGGGCAGCGCCCCTCCTGCCGGC TCTGTGTCCTGCgccgaccacctgatgctcgccgagggctaccgcct ggtgcagaggccgccgtccgccgccgccgcccatggccctcatgcgctccgg actctgccgccgtacgcgggcccgggcctggacagtgggctgaggccgcgg ggggctccgctggggccgccgccgccccgccaacccggggccctggcgtac ggggccttcgggccgccgtcctccttccagccctttccggccgtgcctccgccg gccgcgggcatcgcgcacctgcagcctgtggcgacgccgtaccccggccgc gcCgccgcgccccccaacgctccgggaggccccccgggcccgcagccggc cccaagcgccgcagccccgccgccgcccgcgcacgccctgggcggcatgga cgccgaactcatcgacgaggaggcgctgacgtcgctggagctggagctgggg ctgcaccgcgtgcgcgagctgcccgagctgttcctgggccagagcgagttcga ctgcttctcggacttggggtccgcgccgcccgccggctccgtgagctgccagtc ccagctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagcaag acgcccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgccgc ttctccCGCAGCGACAACCTGGTGAGAcacatccgcatccac acaggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcCG AGAGGAT AACTT GC AC ACTcacatccgcacccacacaggcg ATGGCCGCAGATCACCTGATGCTGGCTGAAGGCT ACAGACTGGTGCAGCGGCCTCCATCTGCCGCTGC CGCCCACGGCCCCCACGCCCTGAGAACACTGCCC CCCTACGCCGGCCCTGGTCTTGATAGCGGACTCA GACCTAGAGGCGCCCCTCTGGGCCCTCCACCTCC AAGACAGCCTGGAGCCCTGGCCTACGGCGCCTTC GGCCCTCCTTCTAGCTTCCAGCCCTTCCCCGCCGT GC CTCCTCCAGCcGCTGGCATCGCCCACCTGCAG CCTGTGGCCACCCCTTACCCCGGAAGAGCCGCCG CCCCTCCAAACGCCCCTGGCGGACCTCCTGGCCC CCAGCCTGCTCCAAGCGCCGCTGCCCCTCCACCT CCTGCTCATGCCCTGGGCGGCATGGACGCCGAGC TGATCGACGAGGAAGCCCTGACCAGCCTGGAAC TGGAACTGGGCCTGCACAGAGTGCGGGAACTGC CTGAGCTGTT CCTGGGACAGAGCGAGTTCGACTG CTTCAGCGACCTGGGCAGCGCCCCTCCTGCCGGC TCTGTGTCCTGCgccgaccacctgatgctcgccgagggctaccgcct ggtgcagaggccgccgtccgccgccgccgcccatggccctcatgcgctccgg actctgccgccgtacgcgggcccgggcctggacagtgggctgaggccgcgg gggg ctccgctggggccgccgccgccccgccaacccggggccctggcgtac ggggccttcgggccgccgtcctccttccagccctttccggccgtgcctccgccg gccgcgggcatcgcgcacctgcagcctgtggcgacgccgtaccccggccgc gcCgccgcgccccccaacgctccgggaggccccggggcccg cagccggc cccaagcgccgcagccccgccgccgcccgcgcacgccctgggcggcatgga cgccgaactcatcgacgaggaggcgctgacgtcgctggagctggagctgggg ctgcaccgcgtgcgcgagctgcccgagctgttcctgggccagagcgagttcga ctgcttctcggacttggggtccgcg ccgcccgccggctccgtgagctgccagtc ccagctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagcaag acgcccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgccgc ttctccCGCAGCGACAACCTGGTGAGAcacatccgcatccac acaggccagaagcccttccagtgccgcatctgcatg AGAaacttcagcCG AGAGGAT AACTT GC AC ACTcacatccgcacccacacaggcg 72 72

- 89 046157- 89 046157

aaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCGA TGAACTTGTCCGAcataccaagatccacttgcggcagaaggaccgc ccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAGG GAATCTGACTGAGcacatccgcatccacacaggccagaagcccttc cagtgccgcatctgcatgAGAaacttcagcACAAGTGGACATCT GGTACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcgac atctgtggaagaaagtttgccC AGA AT AGT AC CC T GAC CGA A cataccaagatccacttgcggcagaaggacaag aaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCGA TGAACTTGTCCGAcataccaagatccacttgcggcagaaggaccgc ccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAGG GAATCTGACTGAGcacatccgcatccacacaggccagaagcccttc cagtgccgcatctgcatgA GAaacttcagcACAAGTGGACATCT GGTACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcgac atctgtggaagaaagtttgccC AGA AT AGT AC CC T GAC CGA A cataccaagatccacttgcggcagaaggacaag 41 (кодирующая) 41 (encoding) ATGGCCGCAGATCACCTGATGCTGGCTGAAGGCT ACAGACTGGTGCAGCGGCCTCCATCTGCCGCTGC CGCCCACGGCCCCCACGCCCTGAGAACACTGCCC CCCTACGCCGGCCCTGGTCTTGATAGCGGACTCA GACCTAGAGGCGCCCCTCTGGGCCCTCCACCTCC AAGACAGCCTGGAGCCCTGGCCTACGGCGCCTTC GGCCCTCCTTCTAGCTTCCAGCCCTTCCCCGCCGT GCCTCCTCCAGCTGCTGGCATCGCCCACCTGCAG CCTGTGGCCACCCCTTACCCCGGAAGAGCCGCCG CCCCTCCAAACGCCCCTGGCGGACCTCCTGGCCC CCAGCCTGCTCCAAGCGCCGCTGCCCCTCCACCT CCTGCTCATGCCCTGGGCGGCATGGACGCCGAGC TGATCGACGAGGAAGCCCTGACCAGCCTGGAAC TGGAACTGGGCCTGCACAGAGTGCGGGAACTGC CTGAGCTGTTCCTGGGACAGAGCGAGTTCGACTG CTTCAGCGACCTGGGCAGCGCCCCTCCTGCCGGC TCTGTGTCCTGCGGCGGCAGCGGCGGCGGAAGC GGCgccgaccacctgatgctcgccgagggctaccgcctggtgcagaggcc gccgtccgccgccgccgcccatggccctcatgcgctccggactctgccgccgt acgcgggcccgggcctggacagtgggctgaggccgcggggggctccgctgg ggccgccgccgccccgccaacccggggccctggcgtacggggccttcgggc cgccgtcctccttccagccctttccggccgtgcctccgccggccgcgggcatcg cgcacctgcagcctgtggcgacgccgtaccccggccgcgcggccgcgcccc ccaacgctccgggaggccccccgggcccgcagccggccccaagcgccgca gccccgccgccgcccgcgcacgccctgggcggcatggacgccgaactcatc gacgaggaggcgctgacgtcgctggagctggagctggggctgcaccgcgtgc gcgagctgcccgagctgttcctgggccagagcgagttcgactgcttctcggactt ggggtccgcgccgcccgccggctccgtgagctgcggtggttctggtggtggtt ctggtcagtcccagctcatcaaacccagccgcatgcgcaagtaccccaaccgg cccagcaagacgcccccccacgaacgcccttacgcttgcccagtggagtcctgt gatcgccgcttctccCGCAGCGACAACCTGGTGAGAcacatc cgcatccacacaggccagaagcccttccagtgccgcatctgcatgAGAaact tcagcCGAGAGGATAACTTGCACACTcacatccgcacccac acaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGG AGCGATGAACTTGTCCGAcataccaagatccacttgcggcaga aggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAA TCAGGGAATCTGACTGAGcacatccgcatccacacaggccag aagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGTGG ACATCTGGTACGCcacatccgcacccacacaggcgaaaagcccttc gcctgcgacatctgtggaagaaagtttgccC AGA AT AGT ACC C TG ACCGAAcataccaagatccacttgcggcagaaggacaag ATGGCCGCAGATCACCTGATGCTGGCTGAAGGCT ACAGACTGGTGCAGCGGCCTCCATCTGCCGCTGC CGCCCACGGCCCCCACGCCCTGAGAACACTGCCC CCCTACGCCGGCCCTGGTCTTGATAGCGGACTCA GACCTAGAGGCGCCCCTCTGGGCCCTCCACCTCC AAGACAGCCTGGAGCCCTGGCCTACGGCGCCTTC GGCCCTCCTTCTAGCTTCCAGCCCTTCCCCGCCGT GCC TCCTCCAGCTGCTGGCATCGCCCACCTGCAG CCTGTGGCCACCCCTTACCCCGGAAGAGCCGCCG CCCCTCCAAACGCCCCTGGCGGACCTCCTGGCCC CCAGCCTGCTCCAAGCGCCGCTGCCCCTCCACCT CCTGCTCATGCCCTGGGCGGCATGGACGCCGAGC TGATCGACGAGGAAGCCCTGACCAGCCTGGAAC TGGAACTGGGCCTGCACAGAGTGCGGGAACTGC CTGAGCTGTTCC TGGGACAGAGCGAGTTCGACTG CTTCAGCGACCTGGGCAGCGCCCCTCCTGCCGGC TCTGTGTCCTGCGGCGGCAGCGGCGGCGGAAGC GGCgccgaccacctgatgctcgccgagggctaccgcctggtgcagaggcc gccgtccgccgccgccgcccatggccctcatgcgctccggactctgccgccgt acgcgggcccgggcctggacagtg ggctgaggccgcggggggctccgctgg ggccgccgccgccccgccaacccggggccctggcgtacggggccttcgggc cgccgtcctccttccagccctttccggccgtgcctccgccggccgcgggcatcg cgcacctgcagcctgtggcgacgcctaccccggccgcgcggccgcgcccc ccaacgctccgg gaggccccccgggcccgcagccggccccaagcgccgca gccccgccgccgcccgcgcacgccctgggcggcatggacgccgaactcatc gacgaggaggcgctgacgtcgctggagctggagctggggctgcaccgcgtgc gcgagctgcccgagctgttcctgggccagagcgagttcgactgcttctcggactt c gcatccacacaggccagaagcccttccagtgccgcatctgcatgAGAaact tcagcCGAGAGGATAACTTGCACACTcacatccgcacccac acaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGG AGCGATGAACTTGTCCGAcataccaagatccacttgcggcaga aggaccgcccttacgcttgcccagtggagtcc tgtgatcgccgcttctccCAA TCAGGGAATCTGACTGAGcacatccgcatccacacaggccag aagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGTGG ACATCTGGTACGCcacatccgcacccacacaggcgaaaagcccttc gcctgcgacatctgtggaagaaagtttgccC AGA AT AGT ACC C TG ACCGAAc ataccaagatccacttgcggcagaaggacaag 73 73

- 90 046157 (RE + кодирующая) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC- 90 046157 (RE + encoding) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaaagggggaaattgtagagcacagatgt gttcgtgtggca gtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaacttttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcag tagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagt gctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagc gagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatggagagggg gaggttgagt acgttctggattactcataagacctttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcc tacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgc agagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccg ctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctcttttctttccagggaattagccagacacaacaacgggaac caga caccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcga ggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCAT CAACGAACTCATACCGGGGAAAAAC

- 91 046157- 91 046157

CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGACGCGC TGGACGATTTCGATCTCGACATGCTGGGTTCTGA TGCCCTCGATGACTTTGACCTGGATATGTTGGGA AGCGACGCATTGGATGACTTTGATCTGGACATGC TCGGCTCCGATGCTCTGGACGATTTCGATCTCGA TATGTTATAAACTAGTGAAACCCAGCAGACAAT GTAGCTAGACCCAGTAGCCAGATGTAGCTAAAG AGACCGGTTCACTGTGAAAGCTTGGGTGGCATCC CTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTG GAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCC TAATAAAATTAAGTTGCATCATTTTGTCTGACTA GGTGTCCTTCTATAATATTATGGGGTGGAGGGGG GTGGTATGGAGCAAGGGGCAAGTTGGGAAGACA ACCTGTAGGGCCTGCGGGGTCTATTGGGAACCA AGCTGGAGTGCAGTGGCACAATCTTGGCTCACTG CAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCT GCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCA TGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTG GTAGAGACGGGGTTTCACCATATTGGCCAGGCTG GTCTCCAACTCCTAATCTCAGGTGATCTACCCAC CTTGGCCTCCCAAATTGCTGGGATTACAGGCGTG AACCACTGCTCCCTTCCCTGTCCTT CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAGGATCCTACCCA TACGACGTACCAGAT TACGCTCTCGAGGACGCGC TGGACGATTTCGATCTCGACATGCTGGGTTCTGA TGCCCTCGATGACTTTGACCTGGATATGTTGGGA AGCGACGCATTGGATGACTTTGATCTGGACATGC TCGGCTCCGATGCTCTGGACGATTTCGATCTCGA TATGTTATAAACTAGTGAAACCCAGCAGACAAT GTAGCTAGACCCAGTAGCCAGATGTAGCTAAAG AGACCGGTTCACTGTGAAAGCTTG GGTGGCATCC CTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTG GAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCC TAATAAAATTAAGTTGCATCATTTTGTCTGACTA GGTGTCCTTCTATAATATTATGGGGTGGAGGGGG GTGGTATGGAGCAAGGGGCAAGTTGGGAAGACA ACCTGTAGGGCCTGCGGGGTCTATTGGGAACCA AGCTGGAGTGCAGTGGCACAATCTTG GCTCACTG CAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCT GCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCA TGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTG GTAGAGACGGGGTTTCACCATATTGGCCAGGCTG GTCTCCAACTCCTAATCTCAGGTGATCTACCCAC CTTGGCCTCCCAAATTGCTGGGATTACAGGCGTG AACCACTGCTCCCTTCCCTGTCCTT 43 (RE + кодирующая) 43 (RE + encoding) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagaga agagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcct ccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgc ccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggt ccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagacctttttt tttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct 75 75

- 92 046157- 92 046157

cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACATCAACGCACCCAT ACAGGAGAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCACAATCAGGGAATCTGA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGAAAAAGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGACGCGC TGGACGATTTCGATCTCGACATGCTGGGTTCTGA TGCCCTCGATGACTTTGACCTGGATATGTTGGGA AGCGACGCATTGGATGACTTTGATCTGGACATGC TCGGCTCCGATGCTCTGGACGATTTCGATCTCGA TATGTTATAAACTAGTGAAACCCAGCAGACAAT GTAGCTAGACCCAGTAGCCAGATGTAGCTAAAG AGACCGGTTCACTGTGAGAAACCCAGCAGACAA TGTAGCTAGACCCAGTAGCCAGATGTAGCTAAA GAGACCGGTTCACTGTGAAAGCTTGGGTGGCATC CCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCT GGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTC CTAATAAAATTAAGTTGCATCATTTTGTCTGACT AGGTGTCCTTCTATAATATTATGGGGTGGAGGGG cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctggggc gctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggcacccaacctcccgaaatga gtgcttcctgccccagcagccgaa c ggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcaca gctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCCC AAAGAAGAAGCGGAAGGTCGGTATCCACGGAGT CCCAGCAGCCCTCGAACCAGGTGAAAAACCTTA CAAATGTCCTGAATGTGGGAAATCATTCAGTCGC AGCGACAACCTGGTGAGACAT CAACGCACCCAT ACAGGAAAAAACCTTATAAATGTCCAGAATGT GGAAAGTCCTTCTCACGAGAGGATAACTTGCAC ACTCATCAACGAACACATACTGGTGAAAAACCA TACAAGTGTCCCGAATGTGGTAAAAGTTTTAGCC GGAGCGATGAACTTGTCCGACACCAACGAACCC ATACAGGCGAGAAGCCTTACAAATGTCCCGAGT GTGGCAAGAGCTTCTCAATCAGGGAATCT GA CTGAGCATCAACGAACTCATACCGGGGAAAAAC CTTACAAGTGTCCAGAGTGTGGGAAGAGCTTTTC CACAAGTGGACATCTGGTACGCCACCAGAGGAC ACATACAGGGGAGAAGCCCTACAAATGCCCCGA ATGCGGTAAAAGTTTCTCTCAGAATAGTACCCTG ACCGAACACCAGCGAACACACACTGGGAAAAAA ACGAGTAAAAGGCCGGCGGCCACGAAAAAGGCC GGCCAGGCAAAAAAGA AGGGATCCTACCCA TACGACGTACCAGATTACGCTCTCGAGGACGCGC TGGACGATTTCGATCTCGACATGCTGGGTTCTGA TGCCCTCGATGACTTTGACCTGGATATGTTGGGA AGCGACGCATTGGATGACTTTGATCTGGACATGC TCGGCTCCGATGCTCTGGACGATTTCGATCTCGA TATGTTATAAACTAGTGAAACCCAGCAGACAAT GTAGCTAGACCCAGTAGCCAGATGTAGCT AAAG AGACCGGTTCACTGTGAGAAACCCAGCAGACAA TGTAGCTAGACCCAGTAGCCAGATGTAGCTAAA GAGACCGGTTCACTGTGAAAGCTTGGGTGGCATC CCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCT GGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTC CTAATAAAATTAAGTTGCATCATTTTGTCTGACT AGGTGTCCTTCTATAATATTATGGGGTGGAGG

- 93 046157- 93 046157

GGTGGTATGGAGCAAGGGGCAAGTTGGGAAGAC AACCTGTAGGGCCTGCGGGGTCTATTGGGAACC AAGCTGGAGTGCAGTGGCACAATCTTGGCTCACT GCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCC TGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGC ATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTT GGTAGAGACGGGGTTTCACCATATTGGCCAGGCT GGTCTCCAACTCCTAATCTCAGGTGATCTACCCA CCTTGGCCTCCCAAATTGCTGGGATTACAGGCGT GAACCACTGCTCCCTTCCCTGTCCTT GGTGGTATGGAGCAAGGGGCAAGTTGGGAAGAC AACCTGTAGGGCCTGCGGGGTCTATTGGGAACC AAGCTGGAGTGCAGTGGCACAATCTTGGCTCACT GCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCC TGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGC ATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTT GGTAGAGACGGGTTTCACCATATTGGCCA GGCT GGTCTCCAACTCCTAATCTCAGGTGATCTACCCA CCTTGGCCTCCCAAATTGCTGGGATTACAGGCGT GAACCACTGCTCCCTTCCCTGTCCTT 44 (RE + кодирующая) 44 (RE + encoding) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCgc cgaccacctgatgctcgccgagggctaccgcctggtgcagaggccgccgtcc gccgccgccgcccatggccctcatgcgctccggactctgccgccgtacgcggg ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagaga agagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcct ccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgc ccaac ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggt ccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagacctttttt tttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctct ccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacc tggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactg cgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcg ccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgacc gagctgGAATTCGCCACCATGGCCgc cgaccacctgatgctcgccgagggctaccgcctggtgcagaggccgccgtcc gccgccgccgcccatggccctcatgcgctccggactctgccgccgtacgcggg 76 76

- 94 046157- 94 046157

cccgggcctggacagtgggctgaggccgcggggggctccgctggggccgcc gccgccccgccaacccggggccctggcgtacggggccttcgggccgccgtc ctccttccagccctttccggccgtgcctccgccggccgcgggcatcgcgcacct gcagcctgtggcgacgccgtaccccggccgcgcggccgcgccccccaacgc tccgggaggccccccgggcccgcagccggccccaagcgccgcagccccgc cgccgcccgcgcacgccctgggcggcatggacgccgaactcatcgacgagg aggcgctgacgtcgctggagctggagctggggctgcaccgcgtgcgcgagct gcccgagctgttcctgggccagagcgagttcgactgcttctcggacttggggtc cgcgccgcccgccggctccgtgagctgcggtggttctggtggtggttctggtca gtcccagctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagca agacgcccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgcc gcttctccCGCAGCGACAACCTGGTGAGAcacatccgcatcc acacaggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcC GAGAGGATAACTTGCACACTcacatccgcacccacacaggc gaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCG ATGAACTTGTCCGAcataccaagatccacttgcggcagaaggacc gcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAG GGAATCTGACTGAGcacatccgcatccacacaggccagaagccct tccagtgccgcatctgcatgAGAaacttcagcACAAGTGGACATC TGGTACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcg acatctgtggaagaaagtttgccCAGAATAGTACCCTGACCG AAcataccaagatccacttgcggcagaaggacaagtaaCTCGAGGA AACCCAGCAGACAATGTAGCTAGACCCAGTAGC CAGATGTAGCTAAAGAGACCGGTTCACTGTGAA AGCTTGGGTGGCATCCCTGTGACCCCTCCCCAGT GCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTG CCCACCAGCCTTGTCCTAATAAAATTAAGTTGCA TCATTTTGTCTGACTAGGTGTCCTTCTATAATATT ATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGG CAAGTTGGGAAGACAACCTGTAGGGCCTGCGGG GTCTATTGGGAACCAAGCTGGAGTGCAGTGGCA CAATCTTGGCTCACTGCAATCTCCGCCTCCTGGG TTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTT GTTGGGATTCCAGGCATGCATGACCAGGCTCAGC TAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCAC CATATTGGCCAGGCTGGTCTCCAACTCCTAATCT CAGGTGATCTACCCACCTTGGCCTCCCAAATTGC TGGGATTACAGGCGTGAACCACTGCTCCCTTCCC TGTCCTT cccggggcctggacagtgggctgaggccgcggggggctccgctggggccgcc gccgccccgccaacccggggccctggcgtacggggccttcgggccgccgtc ctccttccagccctttccggccgtgcctccgccggccgcgggcatcgcgcacct gcagcctgtggcgacgccgtaccccggccgcgcggccg cgccccccaacgc tccgggaggccccccgggcccgcagccggccccaagcgccgcagccccgc cgccgcccgcgcacgccctgggcggcatggacgccgaactcatcgacgagg aggcgctgacgtcgctggagctggagctggggctgcaccgcgtgcgcgagct gcccgagctgttcctgggccagagcgagtt cgactgcttctcggacttggggtc cgcgccgcccgccggctccgtgagctgcggtggttctggtggtggttctggtca gtcccagctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagca agacgcccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgcc gcttctccCGCAGC GACAACCTGGTGAGAcacatccgcatcc acacaggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcC GAGAGGATAACTTGCACACTcacatccgcacccacacaggc gaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCG ATGAACTTGTCCGAcataccaagatccacttgcggcagaaggacc gcccttac gcttgcccagtggagtcctgtgatcgccgcttctccCAATCAG GGAATCTGACTGAGcacatccgcatccacacaggccagaagccct tccagtgccgcatctgcatgAGAaacttcagcACAAGTGGACATC TGGTACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcg acatctgtggaagaaagtttgccCAGA ATAGTACCCTGACCG AAcataccaagatccacttgcggcagaaggacaagtaaCTCGAGGA AACCCAGCAGACAATGTAGCTAGACCCAGTAGC CAGATGTAGCTAAAGAGACCGGTTCACTGTGAA AGCTTGGGTGGCATCCCTGTGACCCCTCCCCAGT GCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTG CCCACCAGCCTTGTCCTAATAAAATTAAGTTGCA TCATTT TGTCTGACTAGGTGTCCTTCTATAATATT ATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGG CAAGTTGGGAAGACAACCTGTAGGGCCTGCGGG GTCTATTGGGAACCAAGCTGGAGTGCAGTGGCA CAATCTTGGCTCACTGCAATCTCCGCCTCCTGGG TTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTT GTTGGGATTCCAGGCATGCATGACCAGGCTCAGC TAATTTTTGTTTT TTTGGTAGAGACGGGGTTTCAC CATATTGGCCAGGCTGGTCTCCAACTCCTAATCT CAGGTGATCTACCCACCTTGGCCTCCCAAATTGC TGGGATTACAGGCGTGAACCACTGCTCCCTTCCC TGTCCTT 45 (RE + кодирующая) 45 (RE + encoding) ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgatattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagagaagagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaactttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcctccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgcccaac ggaggaagccatcaactaaactacaatgactgtaagatacaaaattgggaatggt aacatattttgaagttctgttgacataaagaatcatgattaatgcccatggaaatg aaagggcgatcaacactatggtttgaaaagggggaaattgtagagcacagatgt gttcgtgtggcagtgtgctgtctctagcaatactcagaga agagagagaacaatg aaattctgattggccccagtgtgagcccagatgaggttcagctgccaactttctctt tcacatcttatgaaagtcatttaagcacaactaacttttttttttttttttttttttttgagaca gagtcttgctctgttgcccaggacagagtgcagtagtgactcaatctcggctcact gcagcct ccacctcctaggctcaaacggtcctcctgcatcagcctcccaagtagc tggaattacaggagtggcccaccatgcccagctaatttttgtatttttaatagatacg ggggtttcaccatatcacccaggctggtctcgaactcctggcctcaagtgatcca cctgcctcggcctcccaaagtgctgggattataggcgtcagccactatgc ccaac 184 184

- 95 046157- 95 046157

ccgaccaaccttttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtccttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctccgaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgctgtgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacctggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgcgcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggagaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgccctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccccgggacgaccgagctgGAATTCGCCACCATGGCCgc cgaccacctgatgctcgccgagggctaccgcctggtgcagaggccgccgtcc gccgccgccgcccatggccctcatgcgctccggactctgccgccgtacgcggg cccgggcctggacagtgggctgaggccgcggggggctccgctggggccgcc gccgccccgccaacccggggccctggcgtacggggccttcgggccgccgtc ctccttccagccctttccggccgtgcctccgccggccgcgggcatcgcgcacct gcagcctgtggcgacgccgtaccccggccgcgcggccgcgccccccaacgc tccgggaggccccccgggcccgcagccggccccaagcgccgcagccccgc cgccgcccgcgcacgccctgggcggcatggacgccgaactcatcgacgagg aggcgctgacgtcgctggagctggagctggggctgcaccgcgtgcgcgagct gcccgagctgttcctgggccagagcgagttcgactgcttctcggacttggggtc cgcgccgcccgccggctccgtgagctgcggtggttctggtggtggttctggtca gtcccagctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagca agacgcccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgcc gcttctccCGCAGCGACAACCTGGTGAGAcacatccgcatcc acacaggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcC GAGAGGATAACTTGCACACTcacatccgcacccacacaggc gaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCG ATGAACTTGTCCGAcataccaagatccacttgcggcagaaggacc gcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAG GGAATCTGACTGAGcacatccgcatccacacaggccagaagccct tccagtgccgcatctgcatgAGAaacttcagcACAAGTGGACATC TGGTACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcg acatctgtggaagaaagtttgccCAGAATAGTACCCTGACCG ccgaccaacctttttaaaataaatatttaaaaaattggtatttcacatatatactagta tttacatttatccacacaaaacggacgggcctccgctgaaccagtgaggcccca gacgtgcgcataaataacccctgcgtgctgcaccacctggggagagggggag gaccacggtaaatggagcgagcgcatagcaaaagggacgcggggtcc ttttct ctgccggtggcactgggtagctgtggccaggtgtggtactttgatggggcccag ggctggagctcaaggaagcgtcgcagggtcacagatctgggggaaccccgg ggaaaagcactgaggcaaaaccgccgctcgtctcctacaatatatgggagggg gaggttgagtacgttctggattactcataagaccttttttt ttttccttccgggcgcaaa accgtgagctggatttataatcgccctataaagctccagaggcggtcaggcacct gcagaggagccccgccgctccgccgactagctgcccccgcgagcaacggcct cgtgatttccccgccgatccggtccccgcctccccactctgcccccgcctacccc ggagccgtgcagccgcctctcc gaatctctctcttctcctggcgctcgcgtgcga gagggaactagcgagaacgaggaagcagctggaggtgacgccgggcagatt acgcctgtcagggccgagccgagcggatcgctgggcgcttgcagaggaaa ggcgggagtgcccggctcgctgtcgcagagccgaggtgggtaagctagcgac cacct ggacttcccagcgcccaaccgtggcttttcagccaggtcctctcctcccg cggcttctcaaccaaccccatcccagcgccggccacccaacctcccgaaatga gtgcttcctgccccagcagccgaaggcgctactaggaacggtaacctgttacttt tccaggggccgtagtcgacccgctgcccgagttgctgtgcgactgc gcgcgcg gggctagagtgcaaggtgactgtggttcttctctggccaagtccgagggaac gtaaagatatgggcctttttccccctctcaccttgtctcaccaaagtccctagtccc cggagcagttagcctctttctttccagggaattagccagacacaacaacgggaac cagacaccgaaccagacatgcccgccccgtgcgcc ctccccgctcgctgccttt cctccctcttgtctctccagagccggatcttcaaggggagcctccgtgcccccgg ctgctcagtccctccggtgtgcaggaccccggaagtcctccccgcacagctctc gcttctctttgcagcctgtttctgcgccggaccagtcgaggactctggacagtaga ggccgggacgaccga gctgGAATTCGCCACCATGGCCgc cgaccacctgatgctcgccgagggctaccgcctggtgcagaggccgccgtcc gccgccgccgcccatggccctcatgcgctccggactctgccgccgtacgcggg cccgggcctggacagtgggctgaggccgcggggggctccgctggggccgcc gccgccccgccaacccggggccctggcgt acggggccttcgggccgccgtc ctccttccagccctttccggccgtgcctccgccggccgcgggcatcgcgcacct gcagcctgtggcgacgccgtaccccggccgcgcggccgcgccccccaacgc tccgggaggccccccgggcccgcagccggccccaagcgccgcagccccgc cgccgcccgcgca cgccctgggcggcatggacgccgaactcatcgacgagg aggcgctgacgtcgctggagctggagctggggctgcaccgcgtgcgcgagct gcccgagctgttcctgggccagagcgagttcgactgcttctcggacttggggtc cgcgccgcccgccggctccgtgagctgcggtggttctggtggtggtt ctggtca gtcccagctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagca agacgcccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgcc gcttctccCGCAGCGACAACCTGGTGAGAcacatccgcatcc acacaggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcC GAGAGG ATAACTTGCACACTcacatccgcacccacacaggc gaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCG ATGAACTTGTCCGAcataccaagatccacttgcggcagaaggacc gcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAG GGAATCTGACTGAGcacatccgcatccacacaggccaga agccct tccagtgccgcatctgcatgAGAaacttcagcACAAGTGGACATC TGGTACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcg acatctgtggaagaaagtttgccCAGAATAGTACCCTGACCG

- 96 046157- 96 046157

AAcataccaagatccacttgcggcagaaggacaagtaaCTCGAGGA AACCCAGCAGACAATGTAGCTAGACCCAGTAGC CAGATGTAGCTAAAGAGACCGGTTCACTGTGAG AAACCCAGCAGACAATGTAGCTAGACCCAGTAG CCAGATGTAGCTAAAGAGACCGGTTCACTGTGA AAGCTTGGGTGGCATCCCTGTGACCCCTCCCCAG TGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGT GCCCACCAGCCTTGTCCTAATAAAATTAAGTTGC ATCATTTTGTCTGACTAGGTGTCCTTCTATAATAT TATGGGGTGGAGGGGGGTGGTATGGAGCAAGGG GCAAGTTGGGAAGACAACCTGTAGGGCCTGCGG GGTCTATTGGGAACCAAGCTGGAGTGCAGTGGC ACAATCTTGGCTCACTGCAATCTCCGCCTCCTGG GTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGT TGTTGGGATTCCAGGCATGCATGACCAGGCTCAG CTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCA CCATATTGGCCAGGCTGGTCTCCAACTCCTAATC TCAGGTGATCTACCCACCTTGGCCTCCCAAATTG CTGGGATTACAGGCGTGAACCACTGCTCCCTTCC CTGTCCTT AAcataccaagatccacttgcggcagaaggacaagtaaCTCGAGGA AACCCAGCAGACAATGTAGCTAGACCCAGTAGC CAGATGTAGCTAAAGAGACCGGTTCACTGTGAG AAACCCAGCAGACAATGTAGCTAGACCCAAGTAG CCAGATGTAGCTAAAGAGACCGGTTCACTGTGA AAGCTTGGGTGGCATCCCTGTGACCCCTCCCCAG TGCCTCTCCTGGCCCTGGAAG TTGCCACTCCAGT GCCCACCAGCCTTGTCCTAATAAAATTAAGTTGC ATCATTTTGTCTGACTAGGTGTCCTTCTATAATAT TATGGGGTGGAGGGGGGTGGTATGGAGCAAGGG GCAAGTTGGGAAGACAACCTGTAGGGCCTGCGG GGTCTATTGGGAACCAAGCTGGAGTGCAGTGGC ACAATCTTGGCTCACTGCAATCTCCGCCTCCTGG GTTCAAGCGATTCTCCTGCCTCAGCC TCCCGAGT TGTTGGATTCCAGGCATGCATGACCAGGCTCAG CTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCA CCATATTGGCCAGGCTGGTCTCCAACTCCTAATC TCAGGTGATCTACCCACCTTGGCCTCCCAAATTG CTGGGATTACAGGCGTGAACCACTGCTCCCTTCC CTGTCCTT 8 (кодирующая) 8 (encoding) ATGGCCgccgaccacctgatgctcgccgagggctaccgcctggtgcaga ggccgccgtccgccgccgccgcccatggccctcatgcgctccggactctgccg ccgtacgcgggcccgggcctggacagtgggctgaggccgcggggggctccg ctggggccgccgccgccccgccaacccggggccctggcgtacggggccttc gggccgccgtcctccttccagccctttccggccgtgcctccgccggccgcggg catcgcgcacctgcagcctgtggcgacgccgtaccccggccgcgcggccgcg ccccccaacgctccgggaggccccccgggcccgcagccggccccaagcgcc gcagccccgccgccgcccgcgcacgccctgggcggcatggacgccgaactc atcgacgaggaggcgctgacgtcgctggagctggagctggggctgcaccgcg tgcgcgagctgcccgagctgttcctgggccagagcgagttcgactgcttctcgg acttggggtccgcgccgcccgccggctccgtgagctgcggtggttctggtggtg gttctggtcagtcccagctcatcaaacccagccgcatgcgcaagtaccccaacc ggcccagcaagacgcccccccacgaacgcccttacgcttgcccagtggagtcc tgtgatcgccgcttctccCGCAGCGACAACCTGGTGAGAcac atccgcatccacacaggccagaagcccttccagtgccgcatctgcatgAGAa acttcagcCGAGAGGATAACTTGCACACTcacatccgcacc cacacaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCG GAGCGATGAACTTGTCCGAcataccaagatccacttgcggca gaaggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCA AT C AGGGA ATCTGACTGAGcacatccgcatccacacaggcca gaagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGTG GACATCTGGTACGCcacatccgcacccacacaggcgaaaagccct tcgcctgcgacatctgtggaagaaagtttgccCAGAATAGTACCCT GACCGAAcataccaagatccacttgcggcagaaggacaag ATGGCCgccgaccacctgatgctcgccgagggctaccgcctggtgcaga ggccgccgtccgccgccgccgcccatggccctcatgcgctccggactctctgccg ccgtacgcgggcccgggcctggacagtgggctgaggccgcggggggctccg ctggggccgccgccgccccgccaacccggggccctggcgtacggggcctt c gggccgccgtcctccttccagccctttccggccgtgcctccgccggccgcggg catcgcgcacctgcagcctgtggcgacgccgtaccccggccgcgcggccgcg ccccccaacgctccgggaggccccccgggcccgcagccggccccaagcgcc gcagccccgccgccgcccgcgcacgccctgggcgg catggacgccgaactc atcgacgaggaggcgctgacgtcgctggagctggagctggggctgcaccgcg tgcgcgagctgcccgagctgttcctgggccagagcgagttcgactgcttctcgg acttggggtccgcgccgcccgccggctccgtgagctgcggtggttctggtggtg gttctggtcagtc ccagctcatcaaacccagccgcatgcgcaagtaccccaacc ggcccagcaagacgcccccccacgaacgcccttacgcttgcccagtggagtcc tgtgatcgccgcttctccCGCAGCGACAACCTGGTGAGAcac atccgcatccacacaggccaagcccttccagtgccgcatctgcatgAGAa acttcagcCGAGAGGATAACTTGCACACTcacatcc gcacc cacacaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCG GAGCGATGAACTTGTCCGAcataccaagatccacttgcggca gaaggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCA AT C AGGGA ATCTGACTGAGcacatccgcatccacacaggcca gaagcccttccagtg ccgcatctgcatgAGAaacttcagcACAAGTG GACATCTGGTACGCcacatccgcacccacacaggcgaaaagccct tcgcctgcgacatctgtggaagaaagtttgccCAGAATAGTACCCT GACCGAAcataccaagatccacttgcggcagaaggacaag 203 203 46 (кодирующая) 46 (encoding) ATGGCCgccgaccacctgatgctcgccgagggctaccgcctggtgcaga ggccgccgtccgccgccgccgcccatggccctcatgcgctccggactctgccg ccgtacgcgggcccgggcctggacagtgggctgaggccgcggggggctccg ctggggccgccgccgccccgccaacccggggccctggcgtacggggccttc gggccgccgtcctccttccagccctttccggccgtgcctccgccggccgcggg catcgcgcacctgcagcctgtggcgacgccgtaccccggccgcgcggccgcg ATGGCCgccgaccacctgatgctcgccgagggctaccgcctggtgcaga ggccgccgtccgccgccgccgcccatggccctcatgcgctccggactctctgccg ccgtacgcgggcccgggcctggacagtgggctgaggccgcggggggctccg ctggggccgccgccgccccgccaacccggggccctggcgtacggggcctt c gggccgccgtcctccttccagccctttccggccgtgcctccgccggccgcggg catcgcgcacctgcagcctgtggcgacgccgtaccccggccgcgcggccgcg 204 204

- 97 046157- 97 046157

ccccccaacgctccgggaggccccccgggcccgcagccggccccaagcgcc gcagccccgccgccgcccgcgcacgccctgggcggcatggacgccgaactc atcgacgaggaggcgctgacgtcgctggagctggagctggggctgcaccgcg tgcgcgagctgcccgagctgttcctgggccagagcgagttcgactgcttctcgg acttggggtccgcgccgcccgccggctccgtgagctgcggtggttctggtggtg gttctggtGGTGGCAGCGGGGGAGGTTCTGGTcagtccca gctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagcaagacg cccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgccgcttct ccCGCAGCGACAACCTGGTGAGAcacatccgcatccacaca ggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcCGAG AGGAT AACTTGC AC ACT cacatccgcacccacacaggcgaaaa gcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCGATGA ACTTGTCCGAcataccaagatccacttgcggcagaaggaccgccctta cgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAGGGAA TCTGACTGAGcacatccgcatccacacaggccagaagcccttccagtg ccgcatctgcatg AGAaacttcagc AC A AGT GGAC AT С T GGT ACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcgacatctg tggaagaaagtttgccC AGAAT AGT ACCCTGACCGAAcatac caagatccacttgcggcagaaggacaag ccccccaacgctccgggaggccccccgggcccgcagccggccccaagcgcc gcagccccgccgccgcccgcgcacgccctgggcggcatggacgccgaactc atcgacgaggaggcgctgacgtcgctggagctggagctggggctgcaccgcg tgcgcgagctgcccgagctgttcctgggccagagcgagttc gactgcttctcgg acttggggtccgcgccgcccgccggctccgtgagctgcggtggttctggtggtg gttctggtGGTGGCAGCGGGGGAGGTTCTGGTcagtccca gctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagcaagacg cccccccacgaacgcccttacgcttgcccagtggagtcctgtgat cgccgcttct ccCGCAGCGACAACCTGGTGAGAcacatccgcatccacaca ggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcCGAG AGGAT AACTTGC AC ACT cacatccgcacccacacaggcgaaaa gcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCGATGA ACTTGTCCGAcataccaagatccact tgcggcagaaggaccgccctta cgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAGGGAA TCTGACTGAGcacatccgcatccacacaggccagaagcccttccagtg ccgcatctgcatg AGAaacttcagc AC A AGT GGAC AT C T GGT ACGCcacatccgcacccacacaggcgaaaagcccttcgcctg cgacatctg tggaagaaagtttgccC AGAAT AGT ACCCTGACCGAAcatac caagatccacttgcggcagaaggacaag 47 (кодирующая) 47 (encoding) ATGGCCGCAGATCACCTGATGCTGGCTGAAGGCT ACAGACTGGTGCAGCGGCCTCCATCTGCCGCTGC CGCCCACGGCCCCCACGCCCTGAGAACACTGCCC CCCTACGCCGGCCCTGGTCTTGATAGCGGACTCA GACCTAGAGGCGCCCCTCTGGGCCCTCCACCTCC AAGACAGCCTGGAGCCCTGGCCTACGGCGCCTTC GGCCCTCCTTCTAGCTTCCAGCCCTTCCCCGCCGT GCCTCCTCCAGCcGCTGGCATCGCCCACCTGCAG CCTGTGGCCACCCCTTACCCCGGAAGAGCCGCCG CCCCTCCAAACGCCCCTGGCGGACCTCCTGGCCC CCAGCCTGCTCCAAGCGCCGCTGCCCCTCCACCT CCTGCTCATGCCCTGGGCGGCATGGACGCCGAGC TGATCGACGAGGAAGCCCTGACCAGCCTGGAAC TGGAACTGGGCCTGCACAGAGTGCGGGAACTGC CTGAGCTGTTCCTGGGACAGAGCGAGTTCGACTG CTTCAGCGACCTGGGCAGCGCCCCTCCTGCCGGC TCTGTGTCCTGCgccgaccacctgatgctcgccgagggctaccgcct ggtgcagaggccgccgtccgccgccgccgcccatggccctcatgcgctccgg actctgccgccgtacgcgggcccgggcctggacagtgggctgaggccgcgg ggggctccgctggggccgccgccgccccgccaacccggggccctggcgtac ggggccttcgggccgccgtcctccttccagccctttccggccgtgcctccgccg gccgcgggcatcgcgcacctgcagcctgtggcgacgccgtaccccggccgc gcCgccgcgccccccaacgctccgggaggccccccgggcccgcagccggc cccaagcgccgcagccccgccgccgcccgcgcacgccctgggcggcatgga cgccgaactcatcgacgaggaggcgctgacgtcgctggagctggagctgggg ctgcaccgcgtgcgcgagctgcccgagctgttcctgggccagagcgagttcga ctgcttctcggacttggggtccgcgccgcccgccggctccgtgagctgccagtc ccagctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagcaag acgcccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgccgc ttctccCGCAGCGACAACCTGGTGAGAcacatccgcatccac acaggccagaagcccttccagtgccgcatctgcatgAGAaacttcagcCG ATGGCCGCAGATCACCTGATGCTGGCTGAAGGCT ACAGACTGGTGCAGCGGCCTCCATCTGCCGCTGC CGCCCACGGCCCCCACGCCCTGAGAACACTGCCC CCCTACGCCGGCCCTGGTCTTGATAGCGGACTCA GACCTAGAGGCGCCCCTCTGGGCCCTCCACCTCC AAGACAGCCTGGAGCCCTGGCCTACGGCGCCTTC GGCCCTCCTTCTAGCTTCCAGCCCTTCCCCGCCGT GC CTCCTCCAGCcGCTGGCATCGCCCACCTGCAG CCTGTGGCCACCCCTTACCCCGGAAGAGCCGCCG CCCCTCCAAACGCCCCTGGCGGACCTCCTGGCCC CCAGCCTGCTCCAAGCGCCGCTGCCCCTCCACCT CCTGCTCATGCCCTGGGCGGCATGGACGCCGAGC TGATCGACGAGGAAGCCCTGACCAGCCTGGAAC TGGAACTGGGCCTGCACAGAGTGCGGGAACTGC CTGAGCTGTT CCTGGGACAGAGCGAGTTCGACTG CTTCAGCGACCTGGGCAGCGCCCCTCCTGCCGGC TCTGTGTCCTGCgccgaccacctgatgctcgccgagggctaccgcct ggtgcagaggccgccgtccgccgccgccgcccatggccctcatgcgctccgg actctgccgccgtacgcgggcccgggcctggacagtgggctgaggccgcgg gggg ctccgctggggccgccgccgccccgccaacccggggccctggcgtac ggggccttcgggccgccgtcctccttccagccctttccggccgtgcctccgccg gccgcgggcatcgcgcacctgcagcctgtggcgacgccgtaccccggccgc gcCgccgcgccccccaacgctccgggaggccccggggcccg cagccggc cccaagcgccgcagccccgccgccgcccgcgcacgccctgggcggcatgga cgccgaactcatcgacgaggaggcgctgacgtcgctggagctggagctgggg ctgcaccgcgtgcgcgagctgcccgagctgttcctgggccagagcgagttcga ctgcttctcggacttggggtccgcg ccgcccgccggctccgtgagctgccagtc ccagctcatcaaacccagccgcatgcgcaagtaccccaaccggcccagcaag acgcccccccacgaacgcccttacgcttgcccagtggagtcctgtgatcgccgc ttctccCGCAGCGACAACCTGGTGAGAcacatccgcatccac acaggccagaagcccttccagtgccgcatctgcatg AGAaacttcagcCG 206 206

- 98 046157- 98 046157

AGAGGAT AACTT GC AC ACTcacatccgcacccacacaggcg aaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCGA TGAACTTGTCCGAcataccaagatccacttgcggcagaaggaccgc ccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAGG GAATCTGACTGAGcacatccgcatccacacaggccagaagcccttc cagtgccgcatctgcatgAGAaacttcagcACAAGTGGACATCT GGTACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcgac atctgtggaagaaagtttgccC AGA AT AGT AC CC T GAC CGA A cataccaagatccacttgcggcagaaggacaag AGAGGAT AACTT GC AC ACTcacatccgcacccacacaggcg aaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGGAGCGA TGAACTTGTCCGAcataccaagatccacttgcggcagaaggaccgc ccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAATCAGG GAATCTGACTGAGcacatccg catccacacaggccagaagcccttc cagtgccgcatctgcatgAGAaacttcagcACAAGTGGACATCT GGTACGCcacatccgcacccacacaggcgaaaagcccttcgcctgcgac atctgtggaagaaagtttgccC AGA AT AGT AC CC T GAC CGA A cataccaagatccacttgcggcagaaggacaag 48 (кодирующая) 48 (encoding) ATGGCCGCAGATCACCTGATGCTGGCTGAAGGCT ACAGACTGGTGCAGCGGCCTCCATCTGCCGCTGC CGCCCACGGCCCCCACGCCCTGAGAACACTGCCC CCCTACGCCGGCCCTGGTCTTGATAGCGGACTCA GACCTAGAGGCGCCCCTCTGGGCCCTCCACCTCC AAGACAGCCTGGAGCCCTGGCCTACGGCGCCTTC GGCCCTCCTTCTAGCTTCCAGCCCTTCCCCGCCGT GCCTCCTCCAGCTGCTGGCATCGCCCACCTGCAG CCTGTGGCCACCCCTTACCCCGGAAGAGCCGCCG CCCCTCCAAACGCCCCTGGCGGACCTCCTGGCCC CCAGCCTGCTCCAAGCGCCGCTGCCCCTCCACCT CCTGCTCATGCCCTGGGCGGCATGGACGCCGAGC TGATCGACGAGGAAGCCCTGACCAGCCTGGAAC TGGAACTGGGCCTGCACAGAGTGCGGGAACTGC CTGAGCTGTTCCTGGGACAGAGCGAGTTCGACTG CTTCAGCGACCTGGGCAGCGCCCCTCCTGCCGGC TCTGTGTCCTGCGGCGGCAGCGGCGGCGGAAGC GGCgccgaccacctgatgctcgccgagggctaccgcctggtgcagaggcc gccgtccgccgccgccgcccatggccctcatgcgctccggactctgccgccgt acgcgggcccgggcctggacagtgggctgaggccgcggggggctccgctgg ggccgccgccgccccgccaacccggggccctggcgtacggggccttcgggc cgccgtcctccttccagccctttccggccgtgcctccgccggccgcgggcatcg cgcacctgcagcctgtggcgacgccgtaccccggccgcgcggccgcgcccc ccaacgctccgggaggccccccgggcccgcagccggccccaagcgccgca gccccgccgccgcccgcgcacgccctgggcggcatggacgccgaactcatc gacgaggaggcgctgacgtcgctggagctggagctggggctgcaccgcgtgc gcgagctgcccgagctgttcctgggccagagcgagttcgactgcttctcggactt ggggtccgcgccgcccgccggctccgtgagctgcggtggttctggtggtggtt ctggtcagtcccagctcatcaaacccagccgcatgcgcaagtaccccaaccgg cccagcaagacgcccccccacgaacgcccttacgcttgcccagtggagtcctgt gatcgccgcttctccCGCAGCGACAACCTGGTGAGAcacatc cgcatccacacaggccagaagcccttccagtgccgcatctgcatgAGAaact tcagcCGAGAGGATAACTTGCACACTcacatccgcacccac acaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGG AGCGATGAACTTGTCCGAcataccaagatccacttgcggcaga aggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctccCAA TCAGGGAATCTGACTGAGcacatccgcatccacacaggccag aagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGTGG ACATCTGGTACGCcacatccgcacccacacaggcgaaaagcccttc gcctgcgacatctgtggaagaaagtttgccC AGA AT AGT ACC C TG ACCGAAcataccaagatccacttgcggcagaaggacaag ATGGCCGCAGATCACCTGATGCTGGCTGAAGGCT ACAGACTGGTGCAGCGGCCTCCATCTGCCGCTGC CGCCCACGGCCCCCACGCCCTGAGAACACTGCCC CCCTACGCCGGCCCTGGTCTTGATAGCGGACTCA GACCTAGAGGCGCCCCTCTGGGCCCTCCACCTCC AAGACAGCCTGGAGCCCTGGCCTACGGCGCCTTC GGCCCTCCTTCTAGCTTCCAGCCCTTCCCCGCCGT GCC TCCTCCAGCTGCTGGCATCGCCCACCTGCAG CCTGTGGCCACCCCTTACCCCGGAAGAGCCGCCG CCCCTCCAAACGCCCCTGGCGGACCTCCTGGCCC CCAGCCTGCTCCAAGCGCCGCTGCCCCTCCACCT CCTGCTCATGCCCTGGGCGGCATGGACGCCGAGC TGATCGACGAGGAAGCCCTGACCAGCCTGGAAC TGGAACTGGGCCTGCACAGAGTGCGGGAACTGC CTGAGCTGTTCC TGGGACAGAGCGAGTTCGACTG CTTCAGCGACCTGGGCAGCGCCCCTCCTGCCGGC TCTGTGTCCTGCGGCGGCAGCGGCGGCGGAAGC GGCgccgaccacctgatgctcgccgagggctaccgcctggtgcagaggcc gccgtccgccgccgccgcccatggccctcatgcgctccggactctgccgccgt acgcgggcccgggcctggacagtg ggctgaggccgcggggggctccgctgg ggccgccgccgccccgccaacccggggccctggcgtacggggccttcgggc cgccgtcctccttccagccctttccggccgtgcctccgccggccgcgggcatcg cgcacctgcagcctgtggcgacgcctaccccggccgcgcggccgcgcccc ccaacgctccgg gaggccccccgggcccgcagccggccccaagcgccgca gccccgccgccgcccgcgcacgccctgggcggcatggacgccgaactcatc gacgaggaggcgctgacgtcgctggagctggagctggggctgcaccgcgtgc gcgagctgcccgagctgttcctgggccagagcgagttcgactgcttctcggactt c gcatccacacaggccagaagcccttccagtgccgcatctgcatgAGAaact tcagcCGAGAGGATAACTTGCACACTcacatccgcacccac acaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgccCGG AGCGATGAACTTGTCCGAcataccaagatccacttgcggcaga aggaccgcccttacgcttgcccagtggagtcc tgtgatcgccgcttctccCAA TCAGGGAATCTGACTGAGcacatccgcatccacacaggccag aagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGTGG ACATCTGGTACGCcacatccgcacccacacaggcgaaaagcccttc gcctgcgacatctgtggaagaaagtttgccC AGA AT AGT ACC C TG ACCGAAc ataccaagatccacttgcggcagaaggacaag 208 208

- 99 046157- 99 046157

49 (кодирующая) 49 (encoding) atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcctccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggaggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggCTCGAACCAGGTGA AAAACCTTACAAATGTCCTGAATGTGGGAAATC ATTCAGTCGCAGCGACAACCTGGTGAGACATCA ACGCACCCATACAGGAGAAAAACCTTATAAATG TCCAGAATGTGGAAAGTCCTTCTCACGAGAGGAT AACTTGCACACTCATCAACGAACACATACTGGTG AAAAACCATACAAGTGTCCCGAATGTGGTAAAA GTTTTAGCCGGAGCGATGAACTTGTCCGACACCA ACGAACCCATACAGGCGAGAAGCCTTACAAATG TCCCGAGTGTGGCAAGAGCTTCTCACAATCAGGG AATCTGACTGAGCATCAACGAACTCATACCGGG GAAAAACCTTACAAGTGTCCAGAGTGTGGGAAG AGCTTTTCCACAAGTGGACATCTGGTACGCCACC AGAGGACACATACAGGGGAGAAGCCCTACAAAT GCCCCGAATGCGGTAAAAGTTTCTCTCAGAATAG TACCCTGACCGAACACCAGCGAACACACACTGG GAAAAAAACGAGTgtgtaCgttgggggtttagagagcCgggtctt gaaatacacagcccagaatatggagcttcagaacaaagtacagcttctggagga acagaatttgtcccttctagatcaactgaggaaactccaggccatggtgattgaga tCtcaaacaaaaccagcagcagcagcacctgcatcttggtcctGctagtctcctt ctgcctcctccttgtacctgctatgtactcctctgacacaagggggagcctgccag ctgagcatggagtgttgtcccgccagcttcgtgccctccccagtgaggaccctta ccagctggagctgcctgccctgcagtcagaagtgccgaaagacagcacacacc agtggttggacggctcagactgtgtactccaggcccctggcaacacttcctgcct gctgcattacatgcctcaggctcccagtgcagagcctcccctggagtggccCtt ccctgacctcttctcagagcctctctgccgaggtcccatcctccccctgcaggca aatctcacaaggaagggaggatggcttcctactggtagcccctctgtcattttgca ggacagatactcaggc atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcc tccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggagggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggCTCGAACCAGGTGA AAAACCTTACAAATGTCCTGAATGTGGGAAATC ATTCAGTCGCAGCGACAACCTGGTGAGACATCA ACGCACCCATACAGGAGAAAAACCTTATAAATG TCCAGAATGTGGAAAGTCCTTCTCACGAGAGGAT AACTTGCACACTCATCAACGAACACATACTGGTG AAAACCATACAAGTGTCCCGAATGTGG TAAAA GTTTTAGCCGGAGCGATGAACTTGTCCGACACCA ACGAACCCATACAGGCGAGAAGCCTTACAAATG TCCCGAGTGTGGCAAGAGCTTCTCACAATCAGGG AATCTGACTGAGCATCAACGAACTCATACCGGG GAAAAACCTTACAAGTGTCCAGAGTGTGGGAAG AGCTTTTCCACAAGTGGACATCTGGTACGCCACC AGAGGACACATACAGGGGAGAAGCCCTACAAAT GCCCC GAATGCGGTAAAAGTTTCTCTCAGAATAG TACCCTGACCGAACACCAGCGAACACACACTGG GAAAAAAACGAGTgtgtaCgttgggggtttagagagcCgggtctt gaaatacacagcccagaatatggagcttcagaacaaagtacagcttctggagga acagaatttgtcccttctagatcaactgaggaaactccaggccatggtgattgaga tCt caaacaaaaccagcagcagcagcacctgcatcttggtcctGctagtctcctt ctgcctcctccttgtacctgctatgtactcctctgacacaagggggagcctgccag ctgagcatggagtgttgtcccgccagcttcgtgccctccccagtgaggaccctta ccagctggagctgcctgccctgcagtcagaagtg ccgaaagacagcacacacc agtggttggacggctcagactgtgtactccaggcccctggcaacacttcctgcct gctgcattacatgcctcaggctcccagtgcagagcctcccctggagtggccCtt ccctgacctcttctcagagcctctctgccgaggtcccatcctccccctgcaggca aatctcacaaggaagggaggatggcttcct actggtagcccctctgtcattttgca ggacagatactcaggc 212 212 50 (кодирующая) 50 (encoding) atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcctccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggaggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggcgcccttacgcttgcccagtgga gtcctgtgatcgccgcttctccCGCAGCGACAACCTGGTGAG AcacatccgcatccacacaggccagaagcccttccagtgccgcatctgcatgA GAaacttcagcCGAGAGGATAACTTGCACACTcacatccg cacccacacaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgc cCGGAGCGATGAACTTGTCCGAcataccaagatccacttgcg atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcc tccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggagggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggcgcccttacgcttgcccagtgga gtcctgtgatcgccgcttctccCGCAGCGACAACCTGGTGAG AcacatccgcatccacacaggccagaagcccttccagtgccgcatctgcatgA GAaacttcagcCGAGAGGATAACTTGCACACTcacatccg cacccacacaggcgaaaagccct tcgcctgcgacatctgtggaagaaagtttgc cCGGAGCGATGAACTTGTCCGAcataccaagatccacttgcg 216 216

- 100 046157- 100 046157

gcagaaggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctcc С А АТ С AGGGA АТ С Т GACTGAGcacatccgcatccacacagg ccagaagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGT GGACATCTGGTACGCcacatccgcacccacacaggcgaaaagcc cttcgcctgcgacatctgtggaagaaagtttgccCAGAATAGTACCC TGACCGAAcataccaagatccacttgcggcagaaggacgtgtaCgttg ggggtttagagagcCgggtcttgaaatacacagcccagaatatggagcttcag aacaaagtacagcttctggaggaacagaatttgtcccttctagatcaactgagga aactccaggccatggtgattgagatCtcaaacaaaaccagcagcagcagcacc tgcatcttggtcctGctagtctccttctgcctcctccttgtacctgctatgtactcctc tgacacaagggggagcctgccagctgagcatggagtgttgtcccgccagcttc gtgccctccccagtgaggacccttaccagctggagctgcctgccctgcagtcag aagtgccgaaagacagcacacaccagtggttggacggctcagactgtgtactcc aggcccctggcaacacttcctgcctgctgcattacatgcctcaggctcccagtgc agagcctcccctggagtggccCttccctgacctcttctcagagcctctctgccga ggtcccatcctccccctgcaggcaaatctcacaaggaagggaggatggcttcct actggtagcccctctgtcattttgcaggacagatactcaggc gcagaaggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctcc S A AT C AGGGA AT C T GACTGAGcacatccgcatccacacagg ccagaagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGT GGACATCTGGTACGCcacatccgcacccacacaggcgaaaagcc cttcgcctgc gacatctgtggaagaaagtttgccCAGAATAGTACCC TGACCGAAcataccaagatccacttgcggcagaaggacgtgtaCgttg ggggtttagagagcCgggtcttgaaatacacagcccagaatatggagcttcag aacaaagtacagcttctggaggaacagaatttgtcccttctagatcaactgagga aactccaggccatggtgattg agatCtcaaacaaaaccagcagcagcagcacc tgcatcttggtcctGctagtctccttctgcctcctccttgtacctgctatgtactcctc tgacacaagggggagcctgccagctgagcatggagtgttgtcccgccagcttc gtgccctccccagtgaggacccttaccagctggagctgcctgccctgcagtcag a agtgccgaaagacagcacacaccagtggttggacggctcagactgtgtactcc aggcccctggcaacacttcctgcctgctgcattacatgcctcaggctcccagtgc agagcctcccctggagtggccCttccctgacctcttctcagagcctctctgccga ggtcccatcctccccctgcaggcaaatctcacaaggaagggaggatgg cttcct actggtagcccctctgtcattttgcaggacagatactcaggc 51 (кодирующая) 51 (encoding) atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcctccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggaggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggcgcccttacgcttgcccagtgga gtcctgtgatcgccgcttctccCGCTCAGACAACCTCGTTCGA cacatccgcatccacacaggccagaagcccttccagtgccgcatctgcatgAG AaacttcagcCACCGGACTACACTCACGAACcacatccgca cccacacaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgcc AGAGAAGAC AATCTCC AT ACT cataccaagatccacttgcg gcagaaggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctcc AC C AGC С АТТС ТС T С AC T GA Acacatccgcatccacacagg ccagaagcccttccagtgccgcatctgcatgAGAaacttcagcCAGTCT AGC T C ACTGGT GAGGcacatccgcacccacacaggcgaaaagc ccttcgcctgcgacatctgtggaagaaagtttgccAGGGAGGATAAC CTGCATACGcataccaagatccacttgcggcagaaggacgtgtaCgtt gggggtttagagagcCgggtcttgaaatacacagcccagaatatggagcttca gaacaaagtacagcttctggaggaacagaatttgtcccttctagatcaactgagg aaactccaggccatggtgattgagatCtcaaacaaaaccagcagcagcagcac ctgcatcttggtcctGctagtctccttctgcctcctccttgtacctgctatgtactcct ctgacacaagggggagcctgccagctgagcatggagtgttgtcccgccagctt cgtgccctccccagtgaggacccttaccagctggagctgcctgccctgcagtca gaagtgccgaaagacagcacacaccagtggttggacggctcagactgtgtact ccaggcccctggcaacacttcctgcctgctgcattacatgcctcaggctcccagt gcagagcctcccctggagtggccCttccctgacctcttctcagagcctctctgcc gaggtcccatcctccccctgcaggcaaatctcacaaggaagggaggatggcttc ctactggtagcccctctgtcattttgcaggacagatactcaggc atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcc tccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggagggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggcgcccttacgcttgcccagtgga gtcctgtgatcgccgcttctccCGCTCAGACAACCTCGTTCGA cacatccgcatccacacaggccagaagcccttccagtgccgcatctgcatgAG AaacttcagcCACCGGACTACACTCACGAACcacatccgca cccacacaggcgaaaagccctt cgcctgcgacatctgtggaagaaagtttgcc AGAGAAGAC AATCTCC AT ACT cataccaagatccacttgcg gcagaaggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctcc AC C AGC C ATTS TC T C AC T GA Acacatccgcatccacacagg ccagaagcccttccagtgccgcatctgcatgA GAaacttcagcCAGTCT AGC T C ACTGGT GAGGcacatccgcacccacacaggcgaaaagc ccttcgcctgcgacatctgtggaagaaagtttgccAGGGAGGATAAC CTGCATACGcataccaagatccacttgcggcagaaggacgtgtaCgtt gggggtttagagagcCgggtcttgaaatacacagcccagaatatggag cttca gaacaaagtacagcttctggaggaacagaatttgtcccttctagatcaactgagg aaactccaggccatggtgattgagatCtcaaacaaaaccagcagcagcagcac ctgcatcttggtcctGctagtctccttctgcctcctccttgtacctgctatgtactcct ctgacacaagggggagcctgccagctgagcatggag tgttgtcccgccagctt cgtgccctccccagtgaggacccttaccagctggagctgcctgccctgcagtca gaagtgccgaaagacagcacacaccagtggttggacggctcagactgtgtact ccaggcccctggcaacacttcctgcctgctgcattacatgcctcaggctcccagt gcagagcctcccctggagtggccCt tccctgacctcttctcagagcctctctgcc gaggtcccatcctccccctgcaggcaaatctcacaaggaagggaggatggcttc ctactggtagcccctctgtcattttgcaggacagatactcaggc 218 218 52 (кодирующая) 52 (encoding) atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagattggggacggcacccgatgaggccgtgagggccccactgg 220 220

- 101 046157- 101 046157

actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcctccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggaggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggCTCGAACCAGGTGA AAAACCTTACAAATGTCCTGAATGTGGGAAATC ATTCAGTCGCAGCGACAACCTGGTGAGACATCA ACGCACCCATACAGGAGAAAAACCTTATAAATG TCCAGAATGTGGAAAGTCCTTCTCACGAGAGGAT AACTTGCACACTCATCAACGAACACATACTGGTG AAAAACCATACAAGTGTCCCGAATGTGGTAAAA GTTTTAGCCGGAGCGATGAACTTGTCCGACACCA ACGAACCCATACAGGCGAGAAGCCTTACAAATG TCCCGAGTGTGGCAAGAGCTTCTCACAATCAGGG AATCTGACTGAGCATCAACGAACTCATACCGGG GAAAAACCTTACAAGTGTCCAGAGTGTGGGAAG AGCTTTTCCACAAGTGGACATCTGGTACGCCACC AGAGGACACATACAGGGGAGAAGCCCTACAAAT GCCCCGAATGCGGTAAAAGTTTCTCTCAGAATAG TACCCTGACCGAACACCAGCGAACACACACTGG GAAAAAAACGAGTgtgtaCgttgggggtttagagagcCgggtctt gaaatacacagcccagaatatggagcttcagaacaaagtacagcttctggagga acagaatttgtcccttctagatcaactgaggaaactccaggccatggtgattgaga tatca actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcctccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgact ccacagcata tggaggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggCTCGAACCAGGTGA AAAACCTTACAAATGTCCTGAATGTGGGAAATC ATTCAGTCGCAGCGACAACCTGGTGAGACAT CA ACGCACCCATACAGGAGAAAAACCTTATAAATG TCCAGAATGTGGAAAGTCCTTCACGAGAGGAT AACTTGCACACTCATCAACGAACACATACTGGTG AAAAACCATACAAGTGTCCCGAATGTGGTAAAA GTTTTAGCCGGAGCGATGAACTTGTCCGACACCA ACGAACCCATACAGGCGAGAAGCCTTACAAATG TCCCGAGTGTGGCAAGAGCTTCTCACAATCAGGG AATCTGACTGAG CATCAACGAACTCATACCGGG GAAAAACCTTACAAGTGTCCAGAGTGTGGGAAG AGCTTTTCCACAAGTGGACATCTGGTACGCCACC AGAGGACACATACAGGGGAGAAGCCCTACAAAT GCCCCGAATGCGGTAAAAGTTTCTCTCAGAATAG TACCCTGACCGAACACCAGCGAACACACACTGG GAAAAAAACGAGTgtgtaCgttgggggtttagagagcCgggt ctt gaaatacacagcccagaatatggagcttcagaacaaagtacagcttctggagga acagaatttgtcccttctagatcaactgaggaaactccaggccatggtgattgaga tatca 53 (кодирующая) 53 (encoding) atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcctccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggaggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggcgcccttacgcttgcccagtgga gtcctgtgatcgccgcttctccCGCAGCGACAACCTGGTGAG AcacatccgcatccacacaggccagaagcccttccagtgccgcatctgcatgA GAaacttcagcCGAGAGGATAACTTGCACACTcacatccg cacccacacaggcgaaaagcccttcgcctgcgacatctgtggaagaaagtttgc cCGGAGCGATGAACTTGTCCGAcataccaagatccacttgcg gcagaaggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctcc C A AT C AGGGA AT С T GACTGAGcacatccgcatccacacagg ccagaagcccttccagtgccgcatctgcatgAGAaacttcagcACAAGT GGACATCTGGTACGCcacatccgcacccacacaggcgaaaagcc cttcgcctgcgacatctgtggaagaaagtttgccCAGAATAGTACCC TGACCGAAcataccaagatccacttgcggcagaaggacgtgtaCgttg ggggtttagagagcCgggtcttgaaatacacagcccagaatatggagcttcag aacaaagtacagcttctggaggaacagaatttgtcccttctagatcaactgagga aactccaggccatggtgattgagatCtca atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagag gaaagtggagatttggggacggcacccgatgaggccgtgagggccccactgg actgggcgctgccgctttctgaggtGccgagcgactgggaagtagatgatttgc tgtgctccctgctgagtcccccagcgtcgttgaacattctcagctcc tccaacccc tgccttgtccaccatgaccacacctactccctcccacgggaaactgtctctatgga tctagagagtgagagctgtagaaaagaggggacccagatgactccacagcata tggagggagctggcagagcaggagattgctaggctagtactgacagatgaggag aagagtctattggagaaggaggggcttattctgcctgagacacttcctctcactaa gacagaggaacaaattctgaaacgtgtgcggcgcccttacgcttgcccagtgga gtcctgtgatcgccgcttctccCGCAGCGACAACCTGGTGAG AcacatccgcatccacacaggccagaagcccttccagtgccgcatctgcatgA GAaacttcagcCGAGAGGATAACTTGCACACTcacatccg cacccacacaggcgaaaagccct tcgcctgcgacatctgtggaagaaagtttgc cCGGAGCGATGAACTTGTCCGAcataccaagatccacttgcg gcagaaggaccgcccttacgcttgcccagtggagtcctgtgatcgccgcttctcc C A AT C AGGGA AT C T GACTGAGcacatccgcatccacacagg ccagaagcccttccagtgccgcatctgcatgAGAaact tcagcACAAGT GGACATCTGGTACGCcacatccgcacccacacaggcgaaaagcc cttcgcctgcgacatctgtggaagaaagtttgccCAGAATAGTACCC TGACCGAAcataccaagatccacttgcggcagaaggacgtgtaCgttg ggggtttagagagcCgggtcttgaaatacacagcccagaatatggagcttcag a acaaagtacagcttctggaggaacagaatttgtcccttctagatcaactgagga aactccaggccatggtgattgagatCtca 222 222

- 102 046157- 102 046157

Таблица 8Table 8

Последовательности нуклеиновых кислот для иллюстративных сайтов связывания микроРНК и микроРНКNucleic acid sequences for exemplary miRNA and miRNA binding sites

Описание Description Последовательность Subsequence SEQ ID NO SEQ ID NO Сайт связывания Ml Ml binding site aaagagaccggttcactgtgacagtaaaagagaccggttcactgtgagaatgaaagag accggttcactgtgatcggaaaagagaccggttcactgtgagcggccttgaaacccagc agacaatgtagctcagtagaaacccagcagacaatgtagctgaatggaaacccagcag acaatgtagcttcggagaaacccagcagacaatgtagct aaagagaccggttcactgtgacagtaaaagagaccggttcactgtgagaatgaaagag accggttcactgtgatcggaaaagagaccggttcactgtgagcggccttgaaacccagc agacaatgtagctcagtagaaacccagcagacaatgtagctgaatggaaacccagcag acaatgtagcttcggagaaacccagcagacaat gtagct 7 7 Последователь ность miR128 miR128 sequence UCACAGUGAACCGGUCUCUUU UCACAGUGAACCGGUCUCUUU 8 8 Сайт связывания miR128 miR128 binding site AAAGAGACCGGTTCACTGTGA AAAGAGACCGGTTCACTGTGA 9 9 Последователь ность miR221 miR221 sequence AGCUACAUUGUCUGCUGGGUUUC AGCUACAUUGUCUGCUGGGUUUC 10 10 Сайт связывания miR221 miR221 binding site GAAACCCAGCAGACAATGTAGCT GAAACCCAGCAGACAATGTAGCT 11 eleven Последователь ность miR222 miR222 sequence AGCUACAUCUGGCUACUGGGUCU AGCUACAUCUGGCUACUGGGUCU 12 12 Сайт связывания miR222 miR222 binding site AGACCCAGTAGCCAGATGTAGCT AGACCCAGTAGCCAGATGTAGCT 13 13 Сайт связывания М2 M2 binding site GAAACCCAGCAGACAATGTAGCTAGACCCAGTAGCC AGATGTAGCTAAAGAGACCGGTTCACTGTGA GAAACCCAGCAGACAATGTAGCTAGACCCAGTAGCC AGATGTAGCTAAAGAGACCGGTTCACTGTGA 14 14 Сайт связывания М3 M3 binding site GAAACCCAGCAGACAATGTAGCTAGACCCAGTAGCC AGATGTAGCTAAAGAGACCGGTTCACTGTGAGAAAC CCAGCAGACAATGTAGCTAGACCCAGTAGCCAGATG TAGCTAAAGAGACCGGTTCACTGTGA GAAACCCAGCAGACAATGTAGCTAGACCCAGTAGCC AGATGTAGCTAAAGAGACCGGTTCACTGTGAGAAAC CCAGCAGACAATGTAGCTAGACCCAGTAGCCAGATG TAGCTAAAGAGACCGGTTCACTGTGA 15 15

Таблица 9Table 9

Различные типы структур с цинковыми пальцами и иллюстративные белки типа цинковые пальцы для производства eTFVarious types of zinc finger structures and illustrative zinc finger proteins for eTF production

Название типа ZF Type name ZF SEQ ID NO SEQ ID NO Структура ZF (причем каждый х может независимо быть любым остатком) ZF structure (each x can independently be any residue) Иллюстративные белки, которые могут служить в качестве белковой платформы для eTF или ДНК-связывающего домена eTF, раскрытых в настоящем документе Exemplary proteins that can serve as a protein platform for an eTF or DNA binding domain of an eTF disclosed herein «Цинковые пальцы» C2H2типа (ZNF) Zinc fingers C2H2type (ZNF) 136 136 С-х-С-х-Н-х-Н S-x-S-x-N-x-N KLF4, KLF5, EGR3, ZFP637, SLUG, ZNF750, ZNF281, ΖΠ.Η.89, GLIS1, GLIS3 KLF4, KLF5, EGR3, ZFP637, SLUG, ZNF750, ZNF281, ΖΠ.Η.89, GLIS1, GLIS3 Белки типа «пальцы Ring» (RNF) Proteins type Ring fingers (RNF) 137 137 С-х-С-х-С-х-Н-ххх-С-хС-х-С-х-С S-x-S-x-S-x-N-xxx-S-xS-x-S-x-S MDM2, BRCA1, ZNF 179 MDM2, BRCA1, ZNF 179 Белки типа «пальцы PHD» (PHF) Proteins type "PHD fingers" (PHF) 138 138 С-х-С-х-С-х-С-ххх-Н-хС-х-С-х-С S-x-S-x-S-x-S-xxx-N-xS-x-S-x-S KDM2A, PHF1, ING1 KDM2A, PHF1, ING1

- 103 046157- 103 046157

Содержащие домен LIM Containing the LIM domain 139 139 С-х-С-х-Н-х-С-х-С-х-С-х- C-x-(C,H,D) S-x-S-x-N-x-S-x-S-x-S-x- C-x-(C,H,D) ZNF185, LIMK1, PXN ZNF185, LIMK1, PXN Ядерные гормональные рецепторы (NR) Nuclear hormone receptors (NR) 140 140 С-х-С-х-С-х-С-ххх-С-х-Сх-С-х-С S-x-S-x-S-x-S-xxx-S-x-Sx-S-x-S VDR, ESRI, NR4A1 VDR, ESRI, NR4A1 «Цинковые пальцы» СССНтипа (ZC3H) "Zinc fingers" CCSN type (ZC3H) 141 141 С-х-С-х-С-х-Н S-x-S-x-S-x-N RC3H1, HELZ, MBNL1, ZFP36, ZFP36L1 RC3H1, HELZ, MBNL1, ZFP36, ZFP36L1 «Цинковые пальцы» FYVEтипа (ZFYVE) Zinc fingers FYVE type (ZFYVE) 140 140 С-х-С-х-С-х-С-ххх-С-х-Сх-С-х-С S-x-S-x-S-x-S-xxx-S-x-Sx-S-x-S ЕЕА1, HGS, PIKFYVE EEA1, HGS, PIKFYVE «Цинковые пальцы» ССНСтипа (ZCCHC) "Zinc fingers" CCHC type (ZCCHC) 142 142 С-х-С-х-Н-х-С S-x-S-x-N-x-S CNH.H., SF1,LIN28A CNH.H.,SF1,LIN28A «Цинковые пальцы» DHHCтипа (ZDHHC) Zinc fingers DHHC type (ZDHHC) 143 143 С-х-С-х-Н-х-С-ххх-С-хС-х-Н-х-С S-x-S-x-N-x-S-xxx-S-xS-x-N-x-S ZDHHC2, ZDHHC8, ZDHHC9 ZDHHC2, ZDHHC8, ZDHHC9 «Цинковые пальцы» MYNDTHna(ZMYND) “Zinc fingers” MYNDTHna(ZMYND) 144 144 С-х-С-х-С-х-С-ххх-С-х-Сх-Н-х-С S-x-S-x-S-x-S-xxx-S-x-Sx-N-x-S PDCD2, RUNX1T1, SMYD2, SMYD1 PDCD2, RUNX1T1, SMYD2, SMYD1 «Цинковые пальцы» RANBP2THna(ZRANB) “Zinc fingers” RANBP2THna(ZRANB) 145 145 С-х-С-х-С-х-С S-x-S-x-S-x-S YAF2, SHARPIN, EWSR1 YAF2, SHARPIN, EWSR1 «Цинковые пальцы» ZZтипа (ZZZ) "Zinc fingers" ZZ type (ZZZ) 145 145 С-х-С-х-С-х-С S-x-S-x-S-x-S HERC2, NBR1, CREBH.H. HERC2, NBR1, CREBH.H. «Цинковые пальцы» С2НСтипа (ZC2HC) “Zinc fingers” C2HC type (ZC2HC) 142 142 С-х-С-х-Н-х-С S-x-S-x-N-x-S IKBKG, L3MBTL1, ZNF746 IKBKG, L3MBTL1, ZNF746 Содержащ. домен «цинковые пальцы» GATA (GATAD) Containing GATA zinc finger domain (GATAD) 145 145 С-х-С-х-С-х-С S-x-S-x-S-x-S GATA4, GATA6, MT Al GATA4, GATA6, MT Al ZF класс гомеобоксы и псевдогены ZF class homeoboxes and pseudogenes 136 136 С-х-С-х-Н-х-Н S-x-S-x-N-x-N ADNP, ZEB1, ZHX1 ADNP, ZEB1, ZHX1 Содержащ. домен ТНАР (ТНАР) Containing domain TNAR (TNAR) 141 141 С-х-С-х-С-х-Н S-x-S-x-S-x-N THAP1, THAP4, THAP11 THAP1, THAP4, THAP11

- 104 046157- 104 046157

«Цинковые пальцы» СХХСтипа (СХХС) "Zinc fingers" CХХСtype (СХХС) 140 140 С-х-С-х-С-х-С-ххх-С-х-Сх-С-х-С S-x-S-x-S-x-S-xxx-S-x-Sx-S-x-S СХХС1, СХХС5, MBD1, DNMT1 СХХС1, СХХС5, MBD1, DNMT1 «Цинковые пальцы» SWIMтипа (ZSWIM) Zinc fingers SWIM type (ZSWIM) 141 141 С-х-С-х-С-х-Н S-x-S-x-S-x-N МАРЗК1, ZSWIM5, ZSWIM6 MARZK1, ZSWIM5, ZSWIM6 «Цинковые пальцы» AN1типа (ZFAND) "Zinc fingers" AN1 type (ZFAND) 146 146 С-х-С-х-С-х-С-ххх-С-хН-х-Н-х-С S-x-S-x-S-x-S-xxx-S-xN-x-N-x-S ZFAND3, ZFAND6, IGHMH.H.2 ZFAND3, ZFAND6, IGHMH.H.2 «Цинковые пальцы» ЗСххСтипа (Z3CXXC) “Zinc fingers” ZСххType (Z3CXXC) 142 142 С-х-С-х-Н-х-С S-x-S-x-N-x-S ZAR1, RTP1, RTP4 ZAR1, RTP1, RTP4 «Цинковые пальцы» CWтипа (ZCW) Zinc fingers CW type (ZCW) 145 145 С-х-С-х-С-х-С S-x-S-x-S-x-S MORC1, ZCWPW1, KDM1B MORC1, ZCWPW1, KDM1B «Цинковые пальцы» GRFтипа (ZGRF) Zinc fingers GRF type (ZGRF) 145 145 С-х-С-х-С-х-С S-x-S-x-S-x-S TTF2, NEIL3, ТОРЗ А TTF2, NEIL3, TORZ A «Цинковые пальцы» MIZтипа (ZMIZ) "Zinc fingers" MIZ type (ZMIZ) 142 142 С-х-С-х-Н-х-С S-x-S-x-N-x-S PIAS1, PIAS3, PIAS4 PIAS1, PIAS3, PIAS4 «Цинковые пальцы» BEDтипа (ZBED) Zinc pins BED type (ZBED) 136 136 С-х-С-х-Н-х-Н S-x-S-x-N-x-N ZBED1, ZBED4, ZBED6 ZBED1, ZBED4, ZBED6 «Цинковые пальцы» HITтипа (ZNHIT) Zinc fingers HIT type (ZNHIT) 144 144 С-х-С-х-С-х-С-ххх-С-х-Сх-Н-х-С S-x-S-x-S-x-S-xxx-S-x-Sx-N-x-S ZNHIT3, DDX59, INO80B ZNHIT3, DDX59, INO80B «Цинковые пальцы» MYMтипа (ZMYM) Zinc fingers MYM type (ZMYM) 145 145 С-х-С-х-С-х-С S-x-S-x-S-x-S ZMYM2, ZMYM3, ZMYM4 ZMYM2, ZMYM3, ZMYM4 «Цинковые пальцы» matrinтипа (ZMAT) "Zinc fingers" matrin type (ZMAT) 136 136 С-х-С-х-Н-х-Н S-x-S-x-N-x-N ZNF638, ZMAT1, ZMAT3, ZMAT5 ZNF638, ZMAT1, ZMAT3, ZMAT5 «Цинковые пальцы» С2Н2С-типа “Zinc fingers” C2H2C type 136 136 С-х-С-х-Н-х-Н S-x-S-x-N-x-N MYT1,MYT1L, ST18 MYT1,MYT1L, ST18 «Цинковые пальцы» DBFтипа (ZDBF) Zinc fingers DBF type (ZDBF) 136 136 С-х-С-х-Н-х-Н S-x-S-x-N-x-N DBF4, DBF4B, ZDBF2 DBF4, DBF4B, ZDBF2 «Цинковые пальцы» PARPтипа PARP-type zinc fingers 142 142 С-х-С-х-Н-х-С S-x-S-x-N-x-S LIG3, PARP1 LIG3, PARP1

- 105 046157- 105 046157

Таблица 10 Аминокислотные последовательности иллюстративных ДНК-связывающих доменов типа цинковые пальцыTable 10 Amino acid sequences of exemplary zinc finger DNA binding domains

DBD/целево й сайт DBD/target site Последовательность Subsequence SEQID NO SEQID NO eZF eZF LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n YKCPECGKSFS X HQRTH - TGKKTS, где η - целое число от 1 до 15 и каждый X - это последовательность распознавания, способная связываться с 3 п.н. целевой последовательности LEPGEKP - [YKCPECGKSFS X HQRTH TGEKP]n YKCPECGKSFS X HQRTH - TGKKTS where η is an integer from 1 to 15 and each X is a recognition sequence capable of binding to 3 bp. target sequence 147 147 Целевой сайт Z1 Target site Z1 RSDNLVR х REDNLHT х RSDELVR х QSGNLTE х TSGHLVR х QNSTLTE, где каждый х представляет собой линкер, содержащий 1-50 аминокислотных остатков RSDNLVR x REDNLHT x RSDELVR x QSGNLTE x TSGHLVR x QNSTLTE, where each x is a linker containing 1-50 amino acid residues 148 148 Целевой сайт Z13 Target site Z13 RSDNLVR х HRTTLTN х REDNLHT х TSHSLTE х QSSSLVR х REDNLHT, где каждый х представляет собой линкер, содержащий 1-50 аминокислотных остатков RSDNLVR x HRTTLTN x REDNLHT x TSHSLTE x QSSSLVR x REDNLHT, where each x is a linker containing 1-50 amino acid residues 149 149 Целевой сайт Z14 Target site Z14 DPGALVR х RSDNLVR х QSGDLRR х THLDLIR х TSGNLVR х RSDNLVR, где каждый х представляет собой линкер, содержащий 1-50 аминокислотных остатков DPGALVR x RSDNLVR x QSGDLRR x THLDLIR x TSGNLVR x RSDNLVR, where each x is a linker containing 1-50 amino acid residues 150 150 Целевой сайт Z15 Target site Z15 RRDELNV х RSDHLTN х RSDDLVR х RSDNLVR х HRTTLTN х REDNLHT х TSHSLTE х QSSSLVR х REDNLHT, где каждый х представляет собой линкер, содержащий 1-50 аминокислотных остатков RRDELNV x RSDHLTN x RSDDLVR x RSDNLVR x HRTTLTN x REDNLHT x TSHSLTE x QSSSLVR x REDNLHT, where each x is a linker containing 1-50 amino acid residues 151 151

Таблица 11Table 11

Аминокислотные последовательности для раскрытых в настоящем документе иллюстративных последовательностей распознавания типа цинковые пальцыAmino acid sequences for exemplary zinc finger recognition sequences disclosed herein

Последовательность Subsequence SEQ ID NO SEQ ID NO RSDNLVR RSDNLVR 152 152 REDNLHT REDNLHT 153 153 RSDELVR RSDELVR 154 154 QSGNLTE QSGNLTE 155 155 TSGHLVR TSGHLVR 156 156 QNSTLTE QNSTLTE 157 157 DPGALVR DPGALVR 158 158 HRTTLTN HRTTLTN 159 159 QSGDLRR QSGDLRR 160 160 TSHSLTE TSHSLTE 161 161 THLDLIR THLDLIR 162 162 QSSSLVR QSSSLVR 163 163 TSGNLVR TSGNLVR 164 164 RRDELNV RRDELNV 165 165 RSDDLVR RSDDLVR 166 166 RSDHLTN RSDHLTN 167 167

- 106 046157- 106 046157

Таблица 12Table 12

Другие раскрытые в настоящем документе нуклеотидные и аминокислотные последовательностиOther nucleotide and amino acid sequences disclosed herein

Описание Description Последовательность Subsequence SEQ ID NO SEQ ID NO Домен EGR1 NLS EGR1 NLS domain LH<PSRMRI<YPNRPSI< LH<PSRMRI<YPNRPSI< 168 168 SV40 NLS SV40 NLS PKKKRKV PKKKRKV 169 169 Нуклеоплазми hNLS Nucleoplasma hNLS KRPAATKKAGQAKKKK KRPAATKKAGQAKKKK 170 170 Тэг НА Tag ON YPYDVPDYA YPYDVPDYA 171 171 spA (синтетич. полиА) spA (synthetic polyA) AATAAAAGATCTTTATTTTCATTAGATCTGTGTGTTGG TTTTTTGTGTGCGGACCGCACGTG AATAAAAGATCTTTATTTTCATTAGATCTGTGTGTTGG TTTTTTGTGTGCGGACCGCACGTG 16 16 hGH (полиА гормона роста человека) hGH (polyA human growth hormone) GGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCT GGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTT GTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTA GGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTG GTATGGAGCAAGGGGCAAGTTGGGAAGACAACCTGT AGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTG CAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCC TGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTT GTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAA TTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATT GGCCAGGCTGGTCTCCAACTCCTAATCTCAGGTGATCT ACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGC GTGAACCACTGCTCCCTTCCCTGTCCTT GGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCT GGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTT GTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTA GGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTG GTATGGAGCAAGGGGCAAGTTGGGAAGACAACCTGT AGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTG CAGTGGCACAATCTTGGC TCACTGCAATCTCCGCCTCC TGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTT GTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAA TTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATT GGCCAGGCTGGTCTCCAACTCCTAATCTCAGGTGATCT ACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGC GTGAACCACTGCTCCCTTCCCTGTCCTT 17 17 Белок SCN1A SCN1A protein MEQTVLVPPGPDSFNFFTRESLAAIERRIAEEKAKNPKPD I<I<DDDENGPKPNSDLEAGI<NLPFIYGDIPPEMVSEPLED LDPYYINKKTFIVLNKGKAIFRFSATSALYILTPFNPLRKI AIKILVHSLFSMLIMCTILTNCVFMTMSNPPDWTKNVEY TFTGIYTFESLIKIIARGFCLEDFTFLRDPWNWLDFTVITF AYVTEFVDLGNVSALRTFRVLRALKTISVIPGLKTIVGAL IQSVKKLSDVMILTVFCLSVFALIGLQLFMGNLRNKCIQ WPPTNASLEEHSIEKNITVNYNGTLINETVFEFDWKSYIQ DSRYHYFLEGFLDALLCGNSSDAGQCPEGYMCVKAGRN PNYGYTSFDTFSWAFLSLFRLMTQDFWENLYQLTLRAA GKTYMIFFVLVIFLGSFYLINLILAVVAMAYEEQNQATLE EAEQKEAEFQQMIEQLKKQQEAAQQAATATASEHSREP S AAGRLSDS S SEASKLS SKS AKERRNRRKKRKQKEQSGG EEKDEDEFQKSESEDSIRRKGFRF SIEGNRLTYEKRYS SP HQSLLSIRGSLFSPRRNSRTSLFSFRGRAKDVGSENDFAD DEHSTFEDNESRRDSLFVPRRHGERRNSNLSQTSRSSRM LAVFPANGKMHSTVDCNGVVSLVGGPSVPTSPVGQLLP EVIIDKPATDDNGTTTETEMRKRRSSSFHVSMDFLEDPSQ RQRAMSIASILTNTVEELEESRQKCPPCWYKFSNIFLIWD CSPYWLKVKHVVNLVVMDPFVDLAITICIVLNTLFMAM EHYPMTDHFNNVLTVGNLVFTGIFTAEMFLKIIAMDPYY YFQEGWNIFDGFIVTLSLVELGLANVEGLSVLRSFRLLRV FKLAKSWPTLNMLIKIIGNSVGALGNLTLVLAIIVFIFAVV GMQLFGKSYKDCVCKIASDCQLPRWHMNDFFHSFLIVF RVLCGEWIETMWDCMEVAGQAMCLTVFMMVMVIGNL VVLNLFLALLLSSFSADNLAATDDDNEMNNLQIAVDRM HKGVAYVKRKIYEFIQQSFIRKQKILDEIKPLDDLNNKKD SCMSNHTAEIGKDLDYLKDVNGTTSGIGTGSSVEKYIIDE SDYMSFINNPSLTVTVPIAVGESDFENLNTEDFSSESDLEE MEQTVLVPPGPDSFNFFTRESLAAIERRIAEEKAKNPKPD I<I<DDDENGPKPNSDLEAGI<NLPFIYGDIPPEMVSEPLED LDPYYINKKTFIVLNKGKAIFRFSATSALYILTPFNPLRKI AIKILVHSLFSMLIMCTILTNCVFMTMSNPPDWTKNVEY TFTGIYTFESLIKIIARGFCLEDFTFLRDPWNWLDFTVITF AYVT EFVDLGNVSALRTFRVLRALKTISVIPGLKTIVGAL IQSVKKLSDVMILTVFCLSVFALIGLQLFMGNLRNKCIQ WPPTNASLEEHSIEKNITVNYNGTLINETVFEFDWKSYIQ DSRYHYFLEGFLDALLCGNSSDAGQCPEGYMCVKAGRN PNYGYTSFDTFSWAFLSLFRLMTQDFWENLYQLTLRAA GKTYMIFFVLVIFLGSF YLINLILAVVAMAYEEQNQATLE EAEQKEAEFQQMIEQLKKQQEAAQQAATATASEHSREP S AAGRLSDS S SEASKLS SKS AKERRNRRKKRKQKEQSGG EEKDEDEFQKSESEDSIRRKGFRF SIEGNRLTYEKRYS SP HQSLLSIRGSLFSPRRNSRTSLFSFRGRAKDVGSENDFAD DEHSTFEDNESRR DSLFVPRRHGERRNSNLSQTSRSSRM LAVFPANGKMHSTVDCNGVVSLVGGPSVPTSPVGQLLP EVIIDKPATDDNGTTTETEMRKRRSSSFHVSMDFLEDPSQ RQRAMSIASILTNTVEELEESRQKCPPCWYKFSNIFLIWD CSPYWLKVKHVVNLVVMDPFVDLAITICIVLNTLFMAM EHYPMTDHFNNVLTVGN LVFTGIFTAEMFLKIIAMDPYY YFQEGWNIFDGFIVTLSLVELGLANVEGLSVLRSFRLLRV FKLAKSWPTLNMLIKIIGNSVGALGNLTLVLAIIVFIFAVV GMQLFGKSYKDCVCKIASDCQLPRWHMNDFFHSFLIVF RVLCGEWIETMWDCMEVAGQAMCLTVFMMVMVIGNL VVLNLFLALLLSSFSADNLAATDDDNEMNNLQIAV DRM HKGVAYVKRKIYEFIQQSFIRKQKILDEIKPLDDLNNKKD SCMSNHTAEIGKDLDYLKDVNGTTSGIGTGSSVEKYIIDE SDYMSFINNPSLTVTVPIAVGESDFENLNTEDFSSESDLEE 172 172

- 107 046157- 107 046157

SKEKLNES S S S SEGSTVDIGAPVEEQP VVEPEETLEPEACF TEGCVQRFKCCQINVEEGRGKQWWNLRRTCFRIVEHNW FETFIVFMILLSSGALAFEDIYIDQRI<TH<TMLEYADI<VFT YIFILEMLLKWVAYGYQTYFTNAWCWLDFLIVDVSLVS LTANALGYSELGAIKSLRTLRALRPLRALSRFEGMRVVV NALLGAIPSIMNVLLVCLIFWLIFSIMGVNLFAGKFYHCI NTTTGDRFDIEDVNNHTDCLI<LIERNETARWI<NVI<VNF DNVGFGYLSLLQVATFKGWMDIMYAAVDSRNVELQPK YEESLYMYLYFVIFIIFGSFFTLNLFIGVIIDNFNQQKKKFG GQDIFMTEEQKKYYNAMKKLGSKKPQKPIPRPGNKFQG MVFDFVTRQVFDISIMILICLNMVTMMVETDDQSEYVTT ILSRINLVFIVLFTGECVLKLISLRHYYFTIGWNIFDFVVVI LSIVGMFLAELIEKYFVSPTLFRVIRLARIGRILRLIKGAK GIRTLLFALMMSLPALFNIGLLLFLVMFIYAIFGMSNFAY VKREVGIDDMFNFETFGNSMICLFQITTSAGWDGLLAPIL NSKPPDCDPNKVNPGSSVKGDCGNPSVGIFFFVSYIIISFL VVVNMYIAVILENF S VATEES AEPLSEDDFEMF YEVWEK FDPDATQFMEFEKLSQFAAALEPPLNLPQPNKLQLIAMD LPMVSGDRIHCLDILFAFTKRVLGESGEMDALRIQMEER FMASNPSKVSYQPITTTLKRKQEEVSAVIIQRAYRRHLLK RTVKQASFTYNKNKIKGGANLLIKEDMIIDRINENSITEK TDLTMSTAACPPSYDRVTKPIVEKHEQEGKDEKAKGK SKEKLNES S S S SEGSTVDIGAPVEEQP VVEPEETLEPEACF TEGCVQRFKCCQINVEEGRGKQWWNLRRTCFRIVEHNW FETFIVFMILLSSGALAFEDIYIDQRI<TH<TMLEYADI<VFT YIFILEMLLKWVAYGYQTYFTNAWCWLDFLIVDVSLVS LTANALGYSELGAIKSLRTLRALRPLRALSRFEGMRVV V NALLGAIPSIMNVLLVCLIFWLIFSIMGVNLFAGKFYHCI NTTTGDRFDIEDVNNHTDCLI<LIERNETARWI<NVI<VNF DNVGFGYLSLLQVATFKGWMDIMYAAVDSRNVELQPK YEESLYMYLYFVIFIIFGSFFTLNLFIGVIIDNFNQQKKKFG GQDIFMTEEQKKYYNAMKKLGSKKPQKPIPR PGNKFQG MVFDFVTRQVFDISIMILICLNMVTMMVETDDQSEYVTT ILSRINLVFIVLFTGECVLKLISLRHYYFTIGWNIFDFVVVI LSIVGMFLAELIEKYFVSPTLFRVIRLARIGRILRLIKGAK GIRTLLFALMMSLPALFNIGLLLFLVMFIYAIFGMSNFAY VKREVGIDDMFNFETFGNSMICLFQITTSAGWDG LLAPIL NSKPPDCDPNKVNPGSSVKGDCGNPSVGIFFFVSYIIISFL VVVNMYIAVILENF S VATEES AEPLSEDDFEMF YEVWEK FDPDATQFMEFEKLSQFAAALEPPLNLPQPNKLQLIAMD LPMVSGDRIHCLDILFAFTKRVLGESGEMDALRIQMEER FMASNPSKVSYQPITTTLKRKQEEVSAVIIQRA YRRHLLK RTVKQASFTYNKNKIKGGANLLIKEDMIIDRINENSITEK TTDLTMSTAACPPSYDRVTKPIVEKHEQEGKDEKAKGK Белок dCAS dCAS protein KRNYILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANV ENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTD HSELSGINPYEARVKGLSQKLSEEEF S A ALLHLAKRRG V HNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLER LKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQ SFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLM GHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDEN EKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKG YRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIA KILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTH NLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQ KEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIE LAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKEN AKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEV DHIIPRS VSFDNSFNNK VLVKQEE ASKKGNRTPFQ YLS S S DSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRF SVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKV KSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANAD FIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEY KEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYS TRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLL MYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYL TKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNK VVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYE VNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRV IGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIAS KTQSIKKYSTDILGNLYEVKSKKHPQIIKKG KRNYILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANV ENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLTTD HSELSGINPYEARVKGLSQKLSEEEF S A ALLHLAKRRG V HNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLER LKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAY HQLDQ SFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLM GHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDEN EKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKG YRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIA KILTIYQSSEDIQEELTNLNSELTQEE IEQISNLKGYTGTH NLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQ KEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIE LAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKEN AKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEV DHIIPRS VSFDNSFNNK VLVK QEE ASKKGNRTPFQ YLS S S DSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRF SVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKV KSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANAD FIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEY KEIFITPHQIKHIK DFKDYKYSHRVDKKPNRELINDTLYS TRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLL MYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYL TKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNK VVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKEN YYE VNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRV IGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIAS KTQSIKKYSTDILGNLYEVKSKKHPQIIKKG 173 173

- 108 046157- 108 046157

Конструкция dCAS9-VP64 Design dCAS9-VP64 MAPKKKRKVGIHGVPAAKRNYILGLAIGITSVGYGIIDYE TRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRH RIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSE EEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRN SKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEA KQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGS PFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLY NALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPT LKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDI TARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQ EEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIF NRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIK VINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNR QTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLE AIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEE ASKKGNRTPFQ YLS S SD SKIS YETFKKHILNL AKGKGRIS I<TI<I<EYLLEERDINRF S VQKDFINRNLVDTRYATRGLMN LLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNK GYKHHAEDALIIANADFIFKEWKKLDKAKK VMENQMFE EKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHR VDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKD NDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDE KNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLN AHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFV TVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIAS FYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYL ENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKK HPQIIKKGKRPAATKKAGQAKKKKGSYPYDVPDYALED ALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLG SDALDDFDLDML MAPKKKRKVGIHGVPAAKRNYILGLAIGITSVGYGIIDYE TRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRH RIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSE EEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRN SKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYV KEA KQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGS PFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLY NALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPT LKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDI TARKEIIENAELLDQIAKILTIYQSSED IQEELTNLNSELTQ EEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIF NRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIK VINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNR QTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLE AIPLEDLLNNPFNYEVDHIIPR SVSFDNSFNNKVLVKQEE ASKKGNRTPFQ YLS S SD SKIS YETFKKHILNL AKGKGRIS I<TI<I<EYLLEERDINRF S VQKDFINRNLVDTRYATRGLMN LLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNK GYKHHAEDALIIANADFIFKEWKKLDKAKK VMENQMFE EKQAESMPEIETE QEYKEIFITPHQIKHIKDFKDYKYSHR VDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKD NDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDE KNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLN AHLDITTDDYPNSRNKVVKLSLKPYRFDVYLDNGV YKFV TVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIAS FYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYL ENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKK HPQIIKKGKRPAATKKAGQAKKKKGSYPYDVPDYALED ALDDFDLDMLGSDALDDFDLDML GSDALDDFDLDMLG SDALDDFDLDML 174 174 Белок WT EGR3 (человека) WT protein EGR3 (human) MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSGSS DSVVHYNQMATENVMDIGLTNEKPNPELSYSGSFQPAP GNKTVTYLGKFAFDSPSNWCQDNIISLMSAGILGVPPAS GALSTQTSTASMVQPPQGDVEAMYPALPPYSNCGDLYS EPVSFHDPQGNPGLAYSPQDYQSAKPALDSNLFPMIPDY NLYHHPNDMGSIPEHKPFQGMDPIRVNPPPITPLETIKAF KDKQIHPGFGSLPQPPLTLKPIRPRKYPNRPSKTPLHERPH ACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFS RSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKI HLKQKEKKAEKGGAPSASSAPPVSLAPVVTTCA MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSGSS DSVVHYNQMATENVMDIGLTNEKPNPELSYSGSFQPAP GNKTVTYLGKFAFDSPSNWCQDNIISLMSAGILGVPPAS GALSTQTSTASMVQPPQGDVEAMYPALPPYSNCGDLYS EPVSFHDPQGNPGLAYSPQDYQSAKPALDSNLFPMIPDY NLYH HPNDMGSIPEHKPFQGMDPIRVNPPPITPLETIKAF KDKQIHPGFGSLPQPPLTLKPIRPRKYPNRPSKTPLHERPH ACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFS RSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKI HLKQKEKKAEKGGAPSASSAPVSLAPVVTTCA 175 175 Белок WT EGR1 (человека) WT protein EGR1 (human) maaakaemqlmsplqisdpfgsfphsptmdnypkleemmllsngapqflgaagap egsgsnssssssgggggggggsnsssssstfnpqadtgeqpyehltaesfpdislnnek vlvetsypsqttrlppitytgrfslepapnsgntlwpeplfslvsglvsmtnppassssap spaassasasqspplscavpsndsspiysaaptfptpntdifpepqsqafpgsagtalqy pppaypaakggfqvpmipdylfpqqqgdlglgtpdqkpfqglesrtqqpsltplstik afatqsgsqdlkalntsyqsqlikpsrmrkypnrpsktppherpyacpvescdrrfsrs deltrhirihtgqkpfqcricmrnfsrsdhltthirthtgekpfacdicgrkfarsderkrht kihlrqkdkkadksvvas sats si s syp spvatsyp spvttsyp sp attsyp spvptsfs spgsstypspvhsgfpspsvattyssvppafpaqvssfpssavtnsfsastglsdmtatf sprtieic maaakaemqlmsplqisdpfgsfphsptmdnypkleemmllsngapqflgaagap egsnssssssgggggggggsnsssssstfnpqadtgeqpyehltaesfpdislnnek vlvetsypsqttrlppitytgrfslepapnsgntlwpeplfslvsglvsmtnppassssap spaassasqspplscavps ndsspiysaaptfptpntdifpepqsqafpgsagtalqy pppaypaakggfqvpmipdylfpqqqgdlglgtpdqkpfqglesrtqqpsltplstik afatqsgsqdlkalntsyqsqlikpsrmrkypnrpsktppherpyacpvescdrrfsrs deltrhirihtgqkpfqcricmrnfsrsdh ltthirthtgekpfacdicgrkfarsderkrht kihlrqkdkkadksvvas sats si s syp spvatsyp spvttsyp sp attsyp spvptsfs spgsstypspvhsgfpspsvattyssvppafpaqvssfpssavtnsfsastglsdmtatf sprtieic 176 176

- 109 046157- 109 046157

Линкер Linker GGSGGGSG GGSGGGSG 177 177 Линкер Linker GGSGGGSGGGSGGGSG GGSGGGSGGGSGGGGSG 178 178 Линкер Linker [GGGS]n [GGGS]n 179 179 Линкер Linker [GGGGS]n [GGGGS]n 180 180 Линкер Linker [GGSG]n [GGSG]n 181 181 Сайт распознавания для WT EGR1 или EGR3 Recognition site for WT EGR1 or EGR3 GCG(T/G)GGGCG GCG(T/G)GGGCG 182 182 Каркас sgRNA sgRNA scaffold GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAG GCAAAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAG A GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAG GCAAAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAG A 183 183 Кодирующая последователь ность CREB3 человека Coding sequence of human CREB3 atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagaggaaagt ggagatttggggacggcacccgatgaggccgtgagggccccactggactgggcgctg ccgctttctgaggtGccgagcgactgggaagtagatgatttgctgtgctccctgctgagtc ccccagcgtcgttgaacattctcagctcctccaacccctgccttgtccaccatgaccacac ctactccctcccacgggaaactgtctctatggatctagagagtgagagctgtagaaaaga ggggacccagatgactccacagcatatggaggagctggcagagcaggagattgctagg ctagtactgacagatgaggagaagagtctattggagaaggaggggcttattctgcctgag acacttcctctcactaagacagaggaacaaattctgaaacgtgtgcggaggaagattcga aataaaagatctgctcaagagagccgcaggaaaaagaaggtgtaCgttgggggtttaga gagcCgggtcttgaaatacacagcccagaatatggagcttcagaacaaagtacagcttct ggaggaacagaatttgtcccttctagatcaactgaggaaactccaggccatggtgattgag atCtcaaacaaaaccagcagcagcagcacctgcatcttggtcctGctagtctccttctgc ctcctccttgtacctgctatgtactcctctgacacaagggggagcctgccagctgagcatg gagtgttgtcccgccagcttcgtgccctccccagtgaggacccttaccagctggagctgc ctgccctgcagtcagaagtgccgaaagacagcacacaccagtggttggacggctcaga ctgtgtactccaggcccctggcaacacttcctgcctgctgcattacatgcctcaggctccca gtgcagagcctcccctggagtggccCttccctgacctcttctcagagcctctctgccgag gtcccatcctccccctgcaggcaaatctcacaaggaagggaggatggcttcctactggta gcccctctgtcattttgcaggacagatactcaggc atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagaggaaagt ggagatttggggacggcacccgatgaggccgtgagggccccactggactgggcgctg ccgctttctgaggtGccgagcgactgggaagtagatgatttgctgtgctccctgctgagtc ccccagcgtcgttgaacattctcagct cctccaacccctgccttgtccaccatgaccacac ctactccctcccacgggaaactgtctctatggatctagagagtgagagctgtagaaaaga ggggacccagatgactccacagcatatggaggagctggcagagcaggagattgctagg ctagtactgacagatgaggagaagagtctattggagaaggaggggcttattctgcctgag acacttcctctcactaaga cagaggaacaaattctgaaacgtgtgcggaggaagattcga aataaaagatctgctcaagagagccgcaggaaaaagaaggtgtaCgttgggggtttaga gagcCgggtcttgaaatacacagcccagaatatggagcttcagaacaaagtacagcttct ggaggaacagaatttgtcccttctagatcaactgaggaaactccaggcca tggtgattgag atCtcaaacaaaaccagcagcagcagcacctgcatcttggtcctGctagtctccttctgc ctcctccttgtacctgctatgtactcctctgacacaagggggagcctgccagctgagcatg gagtgttgtcccgccagcttcgtgccctccccagtgaggacccttaccagctggagctgc ctgcc ctgcagtcagaagtgccgaaagacagcacacaccagtggttggacggctcaga ctgtgtactccaggcccctggcaacacttcctgcctgctgcattacatgcctcaggctccca gtgcagagcctcccctggagtggccCttccctgacctcttctcagagcctctctgccgag gtcccatcctccccctgcaggcaaatctcacaagga agggaggatggcttcctactggta gcccctctgtcattttgcaggacagatactcaggc 210 210 Последователь ность АА CREB3 человека Sequence AA CREB3 person MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPLDWA LPLSEVP SDWE VDDLLC SLLSPP ASLNILS S SNPCLVHHD HTYSLPRETVSMDLESESCRKEGTQMTPQHMEELAEQEI ARLVLTDEEKSLLEKEGLILPETLPLTKTEEQILKRVRRKI RNKRSAQESRRKKKVYVGGLESRVLKYTAQNMELQNK VQLLEEQNLSLLDQLRKLQAMVIEISNKTS S S STCILVLL VSFCLLLVPAMYSSDTRGSLPAEHGVLSRQLRALPSEDP YQLELPALQSEVPKDSTHQWLDGSDCVLQAPGNTSCLL HYMPQAPSAEPPLEWPFPDLFSEPLCRGPILPLQANLTRK GGWLPTGSPSVILQDRYSG MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPLDWA LPLSEVP SDWE VDDLLC SLLSPP ASLNILS S SNPCLVHHD HTYSLPRETVSMDLESESCRKEGTQMTPQHMEELAEQEI ARLVLTDEEKSLLEKEGLILPETLPLTKTEEQILKRVRRKI RNKRSAQESRRKKKVYVGGLESRVLKYTAQNMELQNK VQLLEEQNLSLLDQLRKLQAMVIEISNKTS S S STCILVLL VSFCLLLVPAMYSSDTRGSLPAEHGVLSRQLRALPSEDP YQLELPALQSEVPKDSTHQWLDGSDCVLQAPGNTSCLL HYMPQAPSAEPPLEWPFPDLFSEPLCRGPILPLQANLTRK GGWLPTGSPSVILQDRYSG 211 211 Человеческий С-концевой домен CREB3 с трансмембран ной областью Human C-terminal domain of CREB3 with transmembrane region VYVGGLESRVLKYTAQNMELQNKVQLLEEQNLSLLDQL RKLQAMVIEISNKTS S S STCILVLLVSFCLLLVP AMYS SD TRGSLPAEHGVLSRQLRALPSEDPYQLELPALQSEVPKD STHQWLDGSDCVLQAPGNTSCLLHYMPQAPSAEPPLEW PFPDLFSEPLCRGPILPLQANLTRKGGWLPTGSPSVILQD RYSG VYVGGLESRVLKYTAQNMELQNKVQLLEEQNLSLLDQL RKLQAMVIEISNKTS S S STCILVLLVSFCLLLVP AMYS SD TRGSLPAEHGVLSRQLRALPSEDPYQLELPALQSEVPKD STHQWLDGSDCVLQAPGNTSCLLHYMPQAPSAEPPLEW PFPDLFSEPLCRGPILPLQANLTRKGGWLPTGSPSVILQ D RYSG 225 225 Человеческий С-концевой Human C-terminal VYVGGLESRVLKYTAQNMELQNKVQLLEEQNLSLLDQL RKLQAMVIEIS VYVGGLESRVLKYTAQNMELQNKVQLLEEQNLSLLDQL RKLQAMVIEIS 226 226

- 110 046157- 110 046157

домен CREB3 без трансмембран ной области CREB3 domain without transmembrane region Кодирующая последователь ность CREB3TRE Coding sequence CREB3TRE atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagaggaaagt ggagatttggggacggcacccgatgaggccgtgagggccccactggactgggcgctg ccgctttctgaggtGccgagcgactgggaagtagatgatttgctgtgctccctgctgagtc ccccagcgtcgttgaacattctcagctcctccaacccctgccttgtccaccatgaccacac ctactccctcccacgggaaactgtctctatggatctagagagtgagagctgtagaaaaga ggggacccagatgactccacagcatatggaggagctggcagagcaggagattgctagg ctagtactgacagatgaggagaagagtctattggagaaggaggggcttattctgcctgag acacttcctctcactaagacagaggaacaaattctgaaacgtgtgcggCTTGAGCC CGGAGAGAAGCCGTACAAGTGCCCTGAGTGCGGCAA GTCTTTTAGCAGAAGAGACGAACTTAATGTCCACCAG CGAACGCATACTGGTGAAAAGCCCTATAAATGTCCTG AATGTGGGAAATCATTCTCCAGCCGCAGAACCTGTAG GGCTCACCAGCGAACACACACCGGCGAAAAACCATA CAAATGTCCAGAATGCGGGAAATCCTTTTCTCAGTCAT CCAACTTGGTGAGACATCAACGCACGCACACTGGAGA AAAGCCTTACAAATGCCCGGAATGTGGAAAGTCTTTT TCCCAATTGGCCCATTTGCGAGCCCATCAGAGGACTC ACACGGGCGAGAAACCTTACAAATGCCCGGAATGCGG GAAATCTTTTTCAACGAGTGGCAACCTCGTAAGACAC CAAAGAACGCATACAGGCGAAAAGCCATATAAGTGTC CTGAGTGTGGTAAATCATTCTCACACAGGACCACCCT GACAAATCACCAGCGCACGCACACCGGCAAGAAGAC AAGCgtgtaCgttgggggtttagagagcCgggtcttgaaatacacagcccagaatat ggagcttcagaacaaagtacagcttctggaggaacagaatttgtcccttctagatcaactg aggaaactccaggccatggtgattgagatCtcaaacaaaaccagcagcagcagcacct gcatcttggtcctGctagtctccttctgcctcctccttgtacctgctatgtactcctctgacac aagggggagcctgccagctgagcatggagtgttgtcccgccagcttcgtgccctcccca gtgaggacccttaccagctggagctgcctgccctgcagtcagaagtgccgaaagacagc acacaccagtggttggacggctcagactgtgtactccaggcccctggcaacacttcctgc ctgctgcattacatgcctcaggctcccagtgcagagcctcccctggagtggccCttccct gacctcttctcagagcctctctgccgaggtcccatcctccccctgcaggcaaatctcacaa ggaagggaggatggcttcctactggtagcccctctgtcattttgcaggacagatactcagg c atggagctggaattggatgctggtgaccaagacctgctggccttcctgctagaggaaagt ggagatttggggacggcacccgatgaggccgtgagggccccactggactgggcgctg ccgctttctgaggtGccgagcgactgggaagtagatgatttgctgtgctccctgctgagtc ccccagcgtcgttgaacattctcagct cctccaacccctgccttgtccaccatgaccacac ctactccctcccacgggaaactgtctctatggatctagagagtgagagctgtagaaaaga ggggacccagatgactccacagcatatggaggagctggcagagcaggagattgctagg ctagtactgacagatgaggagaagagtctattggagaaggaggggcttattctgcctgag acacttcctctcactaaga cagaggaacaaattctgaaacgtgtgcggCTTGAGCC CGGAGAGAAGCCGTACAAGTGCCCTGAGTGCGGCAA GTCTTTTAGCAGAAGAGACGAACTTAATGTCCACCAG CGAACGCATACTGGTGAAAAGCCCTATAAATGTCCTG AATGTGGGAAATCATTCTCCAGCCGCAGAACCTGTAG GGCTCACCAGCGAACACACCGGCGAAAACCATA CAAATGTCCAGAATGC GGGAAATCCTTTTCTCAGTCAT CCAACTTGGTGAGACATCAACGCACGCACACTGGAGA AAAGCCTTACAAATGCCCGGAATGTGGAAAGTCTTTT TCCCAATTGGCCCATTTGCGAGCCCATCAGAGGACTC ACACGGGCGAGAAACCTTACAAATGCCCGGAATGCGG GAAATCTTTTTCAACGAGTGGCAACCTCGTAAGACAC CAAAGAACGCATACAGGCGAAAAGCCATATAAGTGTC CTG AGTGTGGTAAATCATTCTCACACAGGACCACCCT GACAAATCACCAGCGCACGCACACCGGCAAGAAGAC AAGCgtgtaCgttgggggtttagagagcCgggtcttgaaatacacagcccagaatat ggagcttcagaacaaagtacagcttctggaggaacagaatttgtcccttctagatcaactg aggaaactccaggccatggtgattgagatC tcaaacaaaaccagcagcagcagcacct gcatcttggtcctGctagtctccttctgcctcctccttgtacctgctatgtactcctctgacac aagggggagcctgccagctgagcatggagtgttgtcccgccagcttcgtgccctcccca gtgaggacccttaccagctggagctgcctgccctgcagtcagaagtgcc gaaagacagc acacaccagtggttggacggctcagactgtgtactccaggcccctggcaacacttcctgc ctgctgcattacatgcctcaggctcccagtgcagagcctcccctggagtggccCttccct gacctcttctcagagcctctctgccgaggtcccatcctccccctgcaggcaaatctcacaa ggaagggaggatggcttcctact ggtagcccctctgtcattttgcaggacagatactcagg c 214 214 CREB3-TRE CREB3-TRE MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPLDWA LPLSEVP SDWEVDDLLC SLLSPP ASLNILS S SNPCLVHHD HTYSLPRETVSMDLESESCRKEGTQMTPQHMEELAEQEI ARLVLTDEEKSLLEKEGLILPETLPLTKTEEQILKRVRLEP GEKPYKCPECGKSFSRRDELNVHQRTHTGEKPYKCPEC GKSFS SRRTCRAHQRTHTGEKPYKCPECGKSF SQS SNLV RHQRTHTGEKPYKCPECGKSFSQLAHLRAHQRTHTGEK PYKCPECGKSFSTSGNLVRHQRTHTGEKPYKCPECGKSF SHRTTLTNHQRTHTGKKTSVYVGGLESRVLKYTAQNME LQNK VQLLEEQNLSLLDQLRKLQ AM VIEISNKT S S S STCI LVLLVSFCLLLVPAMYSSDTRGSLPAEHGVLSRQLRALP SEDPYQLELPALQSEVPKDSTHQWLDGSDCVLQAPGNTS MELELDAGDQDLLAFLLEESGDLGTAPDEAVRAPLDWA LPLSEVP SDWEVDDLLC SLLSPP ASLNILS S SNPCLVHHD HTYSLPRETVSMDLESESCRKEGTQMTPQHMEELAEQEI ARLVLTDEEKSLLEKEGLILPETLPLTKTEEQILKRVRLEP GEKPYKCPECGKSFSRRDELNVHQRTHTGEKPYKCPEC GKS FS SRRTCRAHQRTHTGEKPYKCPECGKSF SQS SNLV RHQRTHTGEKPYKCPECGKSFSQLAHLRAHQRTHTGEK PYKCPECGKSFSTSGNLVRHQRTHTGEKPYKCPECGKSF SHRTTLTNHQRTHTTGKKTSVYVGGLESRVLKYTAQNME LQNK VQLLEEQNLSLLDQLRKLQ AM VIEISNKT S S S STCI LVLLVSFCLLLVPAMYSSDTRGSLPAEHGVLSRQLRALP SEDPYQLELPALQSEVPKDSTHQWLDGSDCVLQAPGNTS 215 215 CLLHYMPQAPSAEPPLEWPFPDLFSEPLCRGPILPLQANL TRKGGWLPTGSPSVILQDRYSG CLLHYMPQAPSAEPPLEWPFPDLFSEPLCRGPILPLQANL TRKGGWLPTGSPSVILQDRYSG

ПримерыExamples

Следующие ниже примеры включены для дальнейшего описания некоторых аспектов настоящего раскрытия и не должны использоваться для ограничения объема настоящего изобретения.The following examples are included to further describe certain aspects of the present disclosure and should not be used to limit the scope of the present invention.

Пример 1.Example 1.

Идентификация целевых областей, способных активировать SCN1A, с использованием SCN1Aспецифических активаторов транскрипции.Identification of target regions capable of activating SCN1A using SCN1A-specific transcriptional activators.

Чтобы идентифицировать области генома, способные повышать экспрессию эндогенного SCN1A, разрабатывали различные сконструированные факторы транскрипции (либо нуклеазы типа цинковые пальцы, либо конструкции gRNA/daCas9), которые нацелены на различные области генома, как указано в табл. 4 и 13 выше. Для конструкций gRNA/daCas9 эта gRNA имела ту же последовательность, что и целевая область, потому что gRNA разрабатывали для нацеливания на комплементарную геномную цепь. Белок dCas9 представлял собой конструкцию dCAS9-VP64 (SEQ ID NO: 174). Клетки HEK293 культивиTo identify regions of the genome capable of upregulating the expression of endogenous SCN1A, various engineered transcription factors (either zinc finger nucleases or gRNA/daCas9 constructs) have been developed that target different regions of the genome, as listed in Table 1. 4 and 13 above. For gRNA/daCas9 constructs, this gRNA had the same sequence as the target region because the gRNA was designed to target the complementary genomic strand. The dCas9 protein was the construct dCAS9-VP64 (SEQ ID NO: 174). HEK293 cell culture

- 111 046157 ровали стандартными способами и трансфицировали (FugeneHD, Promega) 3 мкг плазмиды, несущей сконструированный фактор транскрипции или контрольную конструкцию, на лунку 6-луночного планшета. Клетки трансфицировали плазмидами, экспрессирующими конструкции, указанные в табл. 13 ниже. Через 48 часов после трансфекции клетки собирали, выделяли РНК (набор Qiagen RNeasy Mini) и обрабатывали ДНКазой. РНК (3 мкг) подвергали обратной транскрипции с использованием праймеров OligoDT (Superscript IV, Invitrogen). Образцы кДНК анализировали с помощью кПЦР с использованием Phusion Polymerase (New England Biolabs) и SYBR Green I: (30 секунд при температуре 98°C, 40-кратно [10 секунд при температуре 98°C, 15 секунд при температуре 66°C, 15 секунд при температуре 72°C]). Праймеры против SCN1A (5'-TGTCTCGGCATTGAGAACATTC-3' (SEQ ID NO: 185); 5'ATTGGTGGGAGGCCATTGTAT-3' (SEQ ID NO: 186)) использовали для количественной оценки уровней эндогенного транскрипта SCN1A, а относительные уровни экспрессии SCN1A определяли способом дельта-дельта Ct с GAPDH в качестве эталонного гена (5'-ACCACAGTCCATGCCATCAC'-3' (SEQ ID NO: 187); 5'-TCCACCACCCTGTTGCTGTA-3' (SEQ ID NO: 188)). Данные представлены в виде кратных изменений относительно контрольного условия.- 111 046157 were prepared using standard methods and transfected (FugeneHD, Promega) with 3 μg of plasmid carrying the engineered transcription factor or control construct per well of a 6-well plate. Cells were transfected with plasmids expressing the constructs indicated in the table. 13 below. 48 hours after transfection, cells were harvested, RNA was isolated (Qiagen RNeasy Mini kit) and treated with DNase. RNA (3 μg) was reverse transcribed using OligoDT primers (Superscript IV, Invitrogen). cDNA samples were analyzed by qPCR using Phusion Polymerase (New England Biolabs) and SYBR Green I: (30 seconds at 98°C, 40 times [10 seconds at 98°C, 15 seconds at 66°C, 15 seconds at 72°C]). Primers against SCN1A (5'-TGTCTCGGCATTGAGAACATTC-3' (SEQ ID NO: 185); 5'ATTGGTGGGAGGCCATTGTAT-3' (SEQ ID NO: 186)) were used to quantify endogenous SCN1A transcript levels, and relative SCN1A expression levels were determined by the delta method -delta Ct with GAPDH as the reference gene (5'-ACCACAGTCCATGCCATCAC'-3' (SEQ ID NO: 187); 5'-TCCACCACCCTGTTGCTGTA-3' (SEQ ID NO: 188)). Data are presented as fold changes relative to the control condition.

Результаты показаны на фиг. 1 и в табл. 13 ниже в виде кратного изменения транскрипции SCN1A относительно контрольных условий (например, репортерная конструкция EGFP-KASH). В табл. 13 приведены значения для конструкций, которые привели по меньшей мере к 1,5-кратному увеличению транскрипции по сравнению с контрольными условиями.The results are shown in Fig. 1 and in table. 13 below as the fold change in SCN1A transcription relative to control conditions (eg, EGFP-KASH reporter construct). In table Figure 13 shows values for constructs that resulted in at least a 1.5-fold increase in transcription compared to control conditions.

Таблица 13. Влияние различных целевых сайтов генома и соответствующих eTF на транскрипцию. CON указывает на конструкцию типа цинковые пальцы, которая использовалась в эксперименте (смотрите табл. 1). Для конструкций gRNA целевой сайт и последовательность gRNA являются одинаковыми, поскольку gRNA разрабатывали для нацеливания на комплементарную цепь ДНК.Table 13. Effect of different genomic target sites and corresponding eTFs on transcription. CON indicates the zinc finger design that was used in the experiment (see Table 1). For gRNA constructs, the target site and gRNA sequence are the same because the gRNA was designed to target the complementary strand of DNA.

Таблица13Table13

СО N CO N Начальн. положени е в хромосоме 2 Initial position on chromosome 2 Целевая последовательность Target sequence Целево й сайт с фиг. 1 Target site from Fig. 1 SEQ ID NO для целевое о сайта SEQ ID NO for the target site Среднее Average тзначение meaning 4 4 166149168 166149168 ctaggtcaagtgtaggag ctaggtcaagtgtaggag zl zl 18 18 5,12090848 5.12090848 0,0096628 0.0096628 28 28 166149165 166149165 GGTCAAGTGTAGGAGACA GGTCAAGTGTAGGAGACA z8 z8 25 25 1,52068773 1.52068773 0,62403349 0.62403349 3 3 166128025 166128025 taggtaccatagagtgag taggtaccatagtgag zl3 zl3 30 thirty 25,4730028 25.4730028 0,14942042 0.14942042 29 29 166127991 166127991 gaggatactgcagaggtc gaggatactgcagaggtc zl4 zl4 31 31 8,6766618 8.6766618 0,16432794 0.16432794 166149176 166149176 aaggctgtctaggtcaagtgt aaggctgtctaggtcaagtgt g9 g9 35 35 1,36378425 1.36378425 0,18753821 0.18753821 166149118 166149118 tgttcctccagattaacactt tgttcctccagattaacactt gio gio 36 36 1,63040825 1.63040825 0,46710683 0.46710683 166128002 166128002 gatgaagccgagaggatactg gatgaagccgagaggatactg gH gH 37 37 18,7579211 18.7579211 0,13148732 0.13148732 166128037 166128037 gctgatttgtattaggtacca gctgatttgtattaggtacca gl2 gl2 38 38 22,4892633 22.4892633 0,09291316 0.09291316 166177299 166177299 AGAAAGCTGATACAGATACA A AGAAAGCTGATACAGATACA A gl5 gl5 39 39 1,7542842 1.7542842 0,34519408 0.34519408 166178880 166178880 ggtacgggcaaagatttcttg ggtacgggcaaagatttcttg gl7 gl7 40 40 1,36801947 1.36801947 0,48762102 0.48762102 166177299 166177299 AGAAAGCTGATACAGATACA A AGAAAGCTGATACAGATACA A gl9 gl9 41 41 1,45636874 1.45636874 0,44464045 0.44464045 166177369 166177369 ACACAATGAGCCACCTACAAG ACACAATGAGCCACCTACAAG g20 g20 42 42 1,31187425 1.31187425 0,42605224 0.42605224 166177362 166177362 GTGGCTCATTGTGTGTGTGCC GTGGCTCATTGTGTGTGTGCC g22 g22 43 43 1,25217773 1.25217773 0,26572657 0.26572657 166155264 166155264 CATATCCCTGCAGGTTCAGAA CATATCCCTGCAGGTTCAGAA g24 g24 44 44 1,75688991 1.75688991 0,28984533 0.28984533 166155099 166155099 agagagagagagagagagaga agagagagagagagagagaga g25 g25 45 45 2,05701745 2.05701745 0,42409102 0.42409102 166155393 166155393 TTCTCAGTTTTGAAATTAAAA TTCTCAGTTTTGAAAATTAAAA g26 g26 46 46 1,64498972 1.64498972 0,21705582 0.21705582 166155255 166155255 TGGATTCTCTTCTGAACCTGC TGGATTCTCTTCTGAACCTGC g27 g27 47 47 2,27026665 2.27026665 0,43195546 0.43195546 166148361 166148361 TGCTGAGGCAGGACACAGTGT TGCTGAGGCAGGACACAGTGT g29 g29 48 48 2,4290169 2.4290169 0,30364553 0.30364553 166148843 166148843 ATCATCTGTAACCATCAAGGA ATCATCTGTAACCATCAAGGA g30 g30 49 49 2,58328006 2.58328006 0,0748197 0.0748197 166148565 166148565 TCCTGCCTACTTAGTTTCAAG TCCTGCCTACTTAGTTTCAAG g31 g31 50 50 1,97097781 1.97097781 0,25980859 0.25980859 166148953 166148953 ATTACAGTTCTGTCAGCATGC ATTACAGTTCTGTCAGCATGC g32 g32 51 51 1,34500323 1.34500323 0,32186367 0.32186367 166149373 166149373 TGGTCTCATTCTTTTTGTGGG TGGTCTCATTCTTTTTGTGGG g33 g33 52 52 1,71471378 1.71471378 0,32104302 0.32104302 166142239 166142239 CGATATTTTCATGGATTCCTT CGATATTTTCATGGATTCCCTT g34 g34 53 53 1,7735976 1.7735976 0,21954265 0.21954265

- 112 046157- 112 046157

166142391 166142391 CTGACACTTACTTTGTCTAAA CTGACACTTACTTTGTCTAAA g35 g35 54 54 1,95513108 1.95513108 0,02069095 0.02069095 166142219 166142219 AAAACTGGAACCGCATTCCCA AAAACTGGAACCGCATTCCCA g36 g36 55 55 2,08698135 2.08698135 0,0454403 0.0454403 166142396 166142396 ACAAAGTAAGTGTCAGTGTGG ACAAAGTAAGTGTCAGTGTGG g37 g37 56 56 1,30739959 1.30739959 0,72725347 0.72725347 166142344 166142344 ATAATAGTTGTGTCTTTATAA ATAATAGTTGTGTCTTTATAA g38 g38 57 57 1,55783618 1.55783618 0,29846459 0.29846459 166141162 166141162 TGTACAAGCAGGGCTGCAAA G TGTACAAGCAGGGCTGCAAA G g39 g39 58 58 1,4663605 1.4663605 0,02946062 0.02946062 166140590 166140590 GTTAACAAATACACTAAACAC GTTAACAAATACACTAAACAC g40 g40 59 59 1,37399196 1.37399196 0,33638238 0.33638238 166140928 166140928 ttcaacaagctcccaagaagt ttcaacaagctcccaagaagt g42 g42 60 60 1,46929899 1.46929899 0,24465271 0.24465271 166141090 166141090 ATGTTCAAGGTGCAGAAGGA A ATGTTCAAGGTGCAGAAGGA A g43 g43 61 61 2,04547409 2.04547409 0,09880194 0.09880194 165990246 165990246 TGTTTGCTCAAACGTGCACCA TGTTTTGCTCAAACGTGCACCA g44 g44 62 62 2,13402102 2.13402102 0,25583999 0.25583999 165989684 165989684 AAATAAGACATGAAAACAAG A AAATAAGACATGAAAACAAG A g45 g45 63 63 1,27016182 1.27016182 0,32368695 0.32368695 165990193 165990193 AAATATGTACCACAAGAAATG AAATATGTACCACAAGAAATG g46 g46 64 64 2,29522738 2.29522738 0,41829497 0.41829497 165990076 165990076 TATCTGGTTTCTCTCACTGCT TATCTGGTTTCTCTCACTGCT g47 g47 65 65 1,44542116 1.44542116 0,0947106 0.0947106 165989571 165989571 ATTGCAAAGCATAATTTGGAT ATTGCAAAGCATAATTTGGAT g48 g48 66 66 1,42246971 1.42246971 0,18117243 0.18117243

Пример 2.Example 2.

Активация эндогенного SCN1A в клетках HEK293 с использованием специфических для SCN1A факторов транскрипции.Activation of endogenous SCN1A in HEK293 cells using SCN1A-specific transcription factors.

Клетки HEK293 культивировали стандартными способами и высевали в 6-луночные планшеты. Клетки в каждой лунке трансфицировали (FugeneHD, Promega) 3 мкг плазмиды, несущей либо единственную сконструированную конструкцию фактора транскрипции, CREB3 WT человека (SEQ ID NO: 211), либо контрольную конструкцию EGFP. Исследуемые сконструированные конструкции фактора транскрипции включали в себя: конструкции 1-27 и 46-53 (табл. 1) и плазмиду, экспрессирующую CREB3-TRE (SEQ ID NO: 215; CREB3 с ДНК-связывающим доменом bZIP, замененным синтетическим доменом ZF, нацеленным на промотор TET) (каждый исследовали отдельно). Через 48 часов после трансфекции клетки собирали и выделяли РНК (набор Qiagen RNeasy Mini) и обрабатывали ДНКазой. РНК (3 мкг) подвергали обратной транскрипции с использованием праймеров OligoDT (Superscript IV, Invitrogen). Образцы кДНК анализировали с помощью кПЦР с использованием Phusion Polymerase (New England Biolabs) и SYBR Green I: (30 секунд при температуре 98°C, 40-кратно [10 секунд при температуре 98°C, 15 секунд при температуре 66°C, 15 секунд при температуре 72°C]). Праймеры против SCN1A (5'-TGTCTCGGCATTGAGAACATTC-3' (SEQ ID NO: 185); 5'-ATTGGTGGGAGGCCATTGTAT-3' (SEQ ID NO: 186)) использовали для количественной оценки уровней эндогенного транскрипта SCN1A, и относительные уровни экспрессии SCN1A определяли способом дельта-дельта Ct с GAPDH в качестве эталонного гена (5'-ACCACAGTCCATGCCATCAC'3' (SEQ ID NO: 187); 5'-TCCACCACCCTGTTGCTGTA3' (SEQ ID NO: 188)). Данные представлены в виде кратных изменений относительно контрольного условия (смотрите фиг. 2A, фиг. 2B и фиг. 2C). Контрольная конструкция состояла из EGFP, экспрессированного под контролем RE 1 (SEQ ID NO: 1). Доставка сконструированных факторов транскрипции индуцировала различную степень активации эндогенного транскрипта SCNIA по отношению к состоянию EGFP.HEK293 cells were cultured using standard methods and seeded in 6-well plates. Cells in each well were transfected (FugeneHD, Promega) with 3 μg of plasmid carrying either a single engineered transcription factor construct, human CREB3 WT (SEQ ID NO: 211), or a control EGFP construct. The engineered transcription factor constructs studied included: constructs 1-27 and 46-53 (Table 1) and a plasmid expressing CREB3-TRE (SEQ ID NO: 215; CREB3 with the bZIP DNA binding domain replaced by a synthetic ZF targeting domain on the TET promoter) (each was studied separately). 48 hours after transfection, cells were harvested and RNA was isolated (Qiagen RNeasy Mini kit) and treated with DNase. RNA (3 μg) was reverse transcribed using OligoDT primers (Superscript IV, Invitrogen). cDNA samples were analyzed by qPCR using Phusion Polymerase (New England Biolabs) and SYBR Green I: (30 seconds at 98°C, 40 times [10 seconds at 98°C, 15 seconds at 66°C, 15 seconds at 72°C]). Primers against SCN1A (5'-TGTCTCGGCATTGAGAACATTC-3' (SEQ ID NO: 185); 5'-ATTGGTGGGAGGCCATTGTAT-3' (SEQ ID NO: 186)) were used to quantify endogenous SCN1A transcript levels, and relative SCN1A expression levels were determined by the method delta-delta Ct with GAPDH as the reference gene (5'-ACCACAGTCCATGCCATCAC'3' (SEQ ID NO: 187); 5'-TCCACCACCCTGTTGCTGTA3' (SEQ ID NO: 188)). Data are presented as fold changes relative to the control condition (see Fig. 2A, Fig. 2B and Fig. 2C). The control construct consisted of EGFP expressed under the control of RE 1 (SEQ ID NO: 1). Delivery of engineered transcription factors induced varying degrees of activation of the endogenous SCNIA transcript relative to the EGFP state.

Пример 3.Example 3.

Активация эндогенного SCN1A в ГАМК-нейронах с использованием специфических для SCN1A факторов транскрипции.Activation of endogenous SCN1A in GABA neurons using SCN1A-specific transcription factors.

ГАМК-нейроны iCell (Cellular Dynamics) помещали в 6-луночный планшет (~1E6 клеток/лунку) и поддерживали в соответствии с протоколом, рекомендованным производителем. Через 72 часа после посева рекомбинантный AAV (серотип AAV-DJ), экспрессирующий EGFP, или конструкцию активатора 30 на фиг. 3A, или конструкцию 25, или конструкцию 16 на фиг. 3B под контролем универсального промотора (промотор CBA) добавляли в культуральную среду приблизительно в количестве 2E11 копий генома на лунку. Через одну неделю (фиг. 3A) или две недели (фиг. 3B) после инфицирования РНК выделяли из культивированных клеток (набор Qiagen RNeasy Mini) и обрабатывали ДЦКазой. Восстановленную РНК подвергали обратной транскрипции с использованием праймеров OligoDT (Superscript IV, Invitrogen). Образцы кДНК анализировали с помощью кПЦР с использованием Phusion Polymerase (New England Biolabs) и SYBR Green I: (30 секунд при температуре 98°C, 40-кратно [10 секунд при температуре 98°C, 15 секунд при температуре 66°C, 15 секунд при температуре 72°C]). Праймеры против SCN1A (5'-TGTCTCGGCATTGAGAACATTC-3' (SEQ ID NO: 185); 5'-ATTGGTGGGAGGCCATTGTAT-3' (SEQ ID NO: 186)) использовали для количественной оценки уровней эндогенного транскрипта SCN1A, а относительные уровни экспрессии SCN1A определяли способом дельта-дельта Ct с GAPDH в качестве контрольного гена (5'-ACCACAGTCCATGCCATCAC'3' (SEQ ID NO: 187); 5'TCCACCACCCTGTTGCTGTA-3' (SEQ ID NO: 188)). Данные представлены в виде кратных измененийiCell GABA neurons (Cellular Dynamics) were plated in a 6-well plate (~1E6 cells/well) and maintained according to the protocol recommended by the manufacturer. 72 hours after seeding, recombinant AAV (serotype AAV-DJ) expressing EGFP or activator construct 30 in FIG. 3A, or structure 25, or structure 16 in FIG. 3B under the control of a universal promoter (CBA promoter) was added to the culture medium at approximately 2E11 genome copies per well. One week (Fig. 3A) or two weeks (Fig. 3B) postinfection, RNA was isolated from cultured cells (Qiagen RNeasy Mini kit) and treated with DCCase. The recovered RNA was reverse transcribed using OligoDT primers (Superscript IV, Invitrogen). cDNA samples were analyzed by qPCR using Phusion Polymerase (New England Biolabs) and SYBR Green I: (30 seconds at 98°C, 40 times [10 seconds at 98°C, 15 seconds at 66°C, 15 seconds at 72°C]). Primers against SCN1A (5'-TGTCTCGGCATTGAGAACATTC-3' (SEQ ID NO: 185); 5'-ATTGGTGGGAGGCCATTGTAT-3' (SEQ ID NO: 186)) were used to quantify endogenous SCN1A transcript levels, and relative SCN1A expression levels were determined by the method delta-delta Ct with GAPDH as the reference gene (5'-ACCACAGTCCATGCCATCAC'3' (SEQ ID NO: 187); 5'TCCACCACCCTGTTGCTGTA-3' (SEQ ID NO: 188)). Data are presented as fold changes

- 113 046157 относительно контрольного условия (смотрите фиг. 3A и 3B). Управляемая AAV экспрессия сконструированных факторов транскрипции вызывала значительную активацию эндогенного транскрипта SCNIA в культивируемых полученных из iPS ГАМК-нейронах.- 113 046157 relative to the control condition (see Fig. 3A and 3B). AAV-driven expression of engineered transcription factors caused significant activation of the endogenous SCNIA transcript in cultured iPS-derived GABA neurons.

Пример 4.Example 4.

Специфическая активация эндогенного SCN1A в ГАМК-нейронах с использованием специфического для SCN1A фактора транскрипции.Specific activation of endogenous SCN1A in GABA neurons using a SCN1A-specific transcription factor.

ГАМК-нейроны iCell (Cellular Dynamics) помещали в 6-луночный планшет (~1E6 клеток/лунку) и поддерживали в соответствии с протоколом, рекомендованным производителем. Через 72 часа после посева в культуральную среду добавляли рекомбинантный AAV (серотип AAV-DJ), экспрессирующий EGFP или активатор (конструкция 30), который содержит DBD типа цинковые пальцы, слитый с VPR TAD, управляемый промотором CBA под контролем промотора CBA приблизительно в количестве 2E11 копиях генома на лунку.iCell GABA neurons (Cellular Dynamics) were plated in a 6-well plate (~1E6 cells/well) and maintained according to the protocol recommended by the manufacturer. At 72 hours post-plating, recombinant AAV (serotype AAV-DJ) expressing EGFP or an activator (construct 30) that contains a zinc finger DBD fused to a VPR TAD driven by approximately 2E11 CBA promoter was added to the culture medium. copies of the genome per well.

Через неделю после инфицирования РНК выделяли из культивированных клеток (набор Qiagen RNeasy Mini) и обрабатывали ДНКазой. Библиотеки RNAseq получали из восстановленной РНК с использованием набора библиотек TruSeq Stranded mRNA (Illumina) и секвенировали на Illumina NextSeq (секвенирование парных концов 2x75 циклов). Считанные данные секвенирования сопоставляли с геномом человека (RNASTAR), и анализ дифференциальной экспрессии выполняли с помощью DESeq2. Данные представлены в виде кратного изменения относительно контрольных (AAVDJ-CBA-EGFP) образцов (смотрите фиг. 4). Результаты показаны в табл. 14, а на фиг. 4 показана относительная экспрессия эндогенного SCN1A и транскриптов 40 ближайших соседних генов, представленная в виде кратных изменений относительно контрольного условия. Конструкция 30, как описано в табл. 1, была способна специфически увеличивать экспрессию гена SCN1A или белка Nav1.1 по сравнению с другими исследованными генами. Это указывает на то, что целевой сайт, распознаваемый активатором транскрипции конструкции 30, специфичен для гена SCN1A, что приводит к увеличению экспрессии гена SCNIA в нейронах ГАМК.One week after infection, RNA was isolated from cultured cells (Qiagen RNeasy Mini kit) and treated with DNase. RNAseq libraries were prepared from recovered RNA using the TruSeq Stranded mRNA Library Kit (Illumina) and sequenced on Illumina NextSeq (2x75 cycle paired-end sequencing). Sequencing reads were mapped to the human genome (RNASTAR) and differential expression analysis was performed using DESeq2. Data are presented as fold change relative to control (AAVDJ-CBA-EGFP) samples (see Fig. 4). The results are shown in table. 14, and in FIG. Figure 4 shows the relative expression of endogenous SCN1A and transcripts of the 40 nearest neighboring genes, presented as fold changes relative to the control condition. Design 30, as described in table. 1 was able to specifically increase the expression of the SCN1A gene or Nav1.1 protein compared to other genes tested. This indicates that the target site recognized by transcription activator construct 30 is specific to the SCN1A gene, resulting in increased expression of the SCNIA gene in GABA neurons.

Таблица 14Table 14

Влияние на транскрипцию эндогенного SCN1A и 40 ближайших соседних генов в ГАМК-нейронах, обработанных специфическим для SCN1A фактором транскрипции (конструкция 30)Effects on transcription of endogenous SCN1A and 40 immediate neighboring genes in GABA neurons treated with a SCN1A-specific transcription factor (construct 30)

Название гена Gene name Начало хром. 2 Start chrome. 2 Конец хром. 2 The end is chrome. 2 Нить хромое. The thread is lame. Кратность изменения против контроля Fold change vs control PLA2R1 PLA2R1 160788518 160788518 160919121 160919121 - - 0,16367458 0.16367458 ITGB6 ITGB6 160956176 160956176 161128399 161128399 - - 0,20679884 0.20679884 RBMS1 RBMS1 161128661 161128661 161350305 161350305 - - 1,63514667 1.63514667 TANK TANK 161993418 161993418 162092732 162092732 + + 0,90946407 0.90946407 PSMD14 PSMD14 162164548 162164548 162268228 162268228 + + 0,92699237 0.92699237 TBR1 TBR1 162272604 162272604 162282381 162282381 + + 0,53199642 0.53199642 SLC4A10 SLC4A10 162280842 162280842 162841792 162841792 + + 1,89407328 1.89407328 DPP4 DPP4 162848750 162848750 162931052 162931052 - - 2,82345284 2.82345284 FAP FAP 163027193 163027193 163101661 163101661 - - 2,26977379 2.26977379 IFIHI IFIHI 163123588 163123588 163175213 163175213 - - 1,46146481 1.46146481 GCA G.C.A. 163175349 163175349 163228105 163228105 + + 2,58702426 2.58702426 FIGN FIGN 164449905 164449905 164592522 164592522 - - 0,46785861 0.46785861 GRB14 GRB14 165349321 165349321 165478358 165478358 - - 0,5631965 0.5631965 COBLL1 COBLL1 165510133 165510133 165700189 165700189 - - 0,43199257 0.43199257 SLC38A11 SLC38A11 165752695 165752695 165812035 165812035 - - 4,06730119 4.06730119 SCN3A SCN3A 165944031 165944031 166060577 166060577 - - 1,0807866 1.0807866 SCN2A SCN2A 166095911 166095911 166248818 166248818 + + 1,24475196 1.24475196 CSRNP3 CSRNP3 166326156 166326156 166545917 166545917 + + 0,82971233 0.82971233 GALNT3 GALNT3 166604100 166604100 166651192 166651192 - - 0,33804418 0.33804418

- 114 046157- 114 046157

ТТС21В TTS21V 166713984 166713984 166810353 166810353 - - 1,58661143 1.58661143 SCN1A SCN1A 166845669 166845669 166984523 166984523 - - 62,9552975 62.9552975 SCN9A SCN9A 167051694 167051694 167232503 167232503 - - 1,71659087 1.71659087 SCN7A SCN7A 167260082 167260082 167350757 167350757 - - 0,29331967 0.29331967 B3GALT1 B3GALT1 168675181 168675181 168730551 168730551 + + 0,64436013 0.64436013 STK39 STK39 168810529 168810529 169104651 169104651 - - 1,19821739 1.19821739 CERS6 CERS6 169312371 169312371 169631644 169631644 + + 0,86828378 0.86828378 NOSTRIN NOSTRIN 169643048 169643048 169722024 169722024 + + 1,82142718 1.82142718 SPC25 SPC25 169690641 169690641 169769881 169769881 - - 0,86880697 0.86880697 АВСВ11 ABCB11 169779447 169779447 169887832 169887832 - - 3,1441368 3.1441368 DHRS9 DHRS9 169921298 169921298 169952677 169952677 + + 1,10381777 1.10381777 BBS5 BBS5 170335687 170335687 170382432 170382432 + + 0,65476347 0.65476347 KLHL41 KLHL41 170366211 170366211 170382772 170382772 + + 0,87373377 0.87373377 FASTKD1 FASTKD1 170386258 170386258 170430385 170430385 - - 1,02786927 1.02786927 PPIG P.P.I.G. 170440849 170440849 170497916 170497916 + + 1,09866236 1.09866236 CCDC173 CCDC173 170501934 170501934 170550943 170550943 - - 0,67290779 0.67290779 PHOSPHO2 PHOSPHO2 170550974 170550974 170558218 170558218 + + 0,91339152 0.91339152 KLHL23 KLHL23 170550997 170550997 170633499 170633499 + + 0,73926347 0.73926347 SSB SSB 170648442 170648442 170668574 170668574 + + 1,00631994 1.00631994 METTL5 METTL5 170666590 170666590 170681441 170681441 - - 1,21271497 1.21271497 UBR3 UBR3 170683967 170683967 170940641 170940641 + + 1,21350908 1.21350908 MYO3B MYO3B 171034654 171034654 171511681 171511681 + + 0,52839217 0.52839217

Пример 5.Example 5.

Экспрессия SCN1A из кассеты экспрессии in vivo.Expression of SCN1A from an expression cassette in vivo.

Чтобы проверить экспрессию активаторов транскрипции SCN1A in vivo, создавали рекомбинантные векторы AAV9 компанией VectorBiolabs (Malvern, PA). Самцам мышей C57Bl/6 (N=5 на группу, возраст 7-8 недель) проводили двустороннюю инфузию 1,5 мкл очищенного вектора AAV в дорсальный гиппокамп (AP -2,0 мм, латерально ±1,5, DV -1,4 мм от твердой мозговой оболочки) и вентральный гиппокамп (AP -3,1 мм, латерально ± 2,8, DV -3,8 мм от твердой мозговой оболочки), всего 4 места инъекции. AAV доставляли со скоростью 0,3 мкл/мин с периодом отдыха 4 мин после каждой инъекции. Через четыре недели после воздействия мышей умерщвляли и иссекали ткань гиппокампа. Для каждой группы ткань левого и правого гиппокампа собирали вместе для гомогенизации у большинства животных (N=4), за исключением одного животного, у которого собирали и гомогенизировали только левый гиппокамп. РНК выделяли из гомогената (набор Qiagen RNeasy Mini) и обрабатывали ДНКазой. РНК (3 мкг) подвергали обратной транскрипции с использованием праймеров OligoDT (Superscript IV, Invitrogen). Образцы кДНК анализировали с помощью кПЦР на экспрессию мышиного SCN1A с использованием Phusion Polymerase (New England Biolabs) и SYBR Green I: 30 секунд при температуре 98°C, 40-кратно [10 секунд при температуре 98°C, 15 секунд при температуре 64°C, 15 секунд при температуре 72°C]. Праймеры против SCN1A мыши (5'-CAAAAAAGCCACAAAAGCCT-3' (SEQ ID NO: 189); 5'TTAGCTCCGCAAGAAACATC-3' (SEQ ID NO: 190)) использовали для количественной оценки уровней эндогенного транскрипта SCN1A, а относительные уровни экспрессии SCN1A in vivo определяли способом дельта-дельта Ct с GAPDH в качестве эталонного гена (5'-ACCACAGTCCATGCCATCAC'3' (SEQ ID NO: 187); 5'-TCCACCACCCTGTTGCTGTA-3' (SEQ ID NO: 188)).To test the expression of SCN1A transcriptional activators in vivo, recombinant AAV9 vectors were generated by VectorBiolabs (Malvern, PA). Male C57Bl/6 mice (N=5 per group, 7-8 weeks old) received a bilateral infusion of 1.5 μl of purified AAV vector into the dorsal hippocampus (AP -2.0 mm, lateral ±1.5, DV -1.4 mm from the dura mater) and ventral hippocampus (AP -3.1 mm, lateral ± 2.8, DV -3.8 mm from the dura mater), a total of 4 injection sites. AAV was delivered at a rate of 0.3 μl/min with a rest period of 4 min after each injection. Four weeks after exposure, mice were sacrificed and hippocampal tissue was excised. For each group, tissue from the left and right hippocampus was collected together for homogenization in most animals (N=4), with the exception of one animal in which only the left hippocampus was collected and homogenized. RNA was isolated from the homogenate (Qiagen RNeasy Mini kit) and treated with DNase. RNA (3 μg) was reverse transcribed using OligoDT primers (Superscript IV, Invitrogen). cDNA samples were analyzed by qPCR for mouse SCN1A expression using Phusion Polymerase (New England Biolabs) and SYBR Green I: 30 seconds at 98°C, 40 times [10 seconds at 98°C, 15 seconds at 64°C C, 15 seconds at 72°C]. Primers against mouse SCN1A (5'-CAAAAAAGCCACAAAAGCCT-3' (SEQ ID NO: 189); 5'TTAGCTCCGCAAGAAACATC-3' (SEQ ID NO: 190)) were used to quantify endogenous SCN1A transcript levels, and relative SCN1A expression levels in vivo determined by the delta-delta Ct method with GAPDH as the reference gene (5'-ACCACAGTCCATGCCATCAC'3' (SEQ ID NO: 187); 5'-TCCACCACCCTGTTGCTGTA-3' (SEQ ID NO: 188)).

На фиг. 5A и фиг. 5B показаны средние результаты для пяти животных, каждому из которых вводили конструкцию AAV9. Контрольная конструкция eGFP содержала репортерный трансген eGFP. Конструкция 4 (смотрите табл. 1) содержала активатор транскрипции, который распознавал целевую последовательность, содержащую SEQ ID NO: 18, как описано в табл. 1 выше. На фиг. 5A показана относительная экспрессия SCN1A in vivo. На фиг. 5B показано изменение экспрессии SCN1A in vivo в процентах от средней экспрессии eGFP. Эти результаты показали, что активатор транскрипции SCN1A экспрессионной кассеты A приводил к усилению экспрессии SCNIA приблизительно на 20-30% in vivo.In fig. 5A and FIG. 5B shows the average results for five animals each treated with the AAV9 construct. The eGFP control construct contained the eGFP reporter transgene. Construct 4 (see Table 1) contained a transcription activator that recognized the target sequence containing SEQ ID NO: 18, as described in Table. 1 above. In fig. 5A shows the relative expression of SCN1A in vivo. In fig. Figure 5B shows the change in SCN1A expression in vivo as a percentage of average eGFP expression. These results indicated that transcriptional activator of SCN1A expression cassette A resulted in an approximately 20-30% increase in SCNIA expression in vivo.

Такие кассеты экспрессии могут быть адаптированы для применения на людях для лечения синдрома Драве, эпилепсии, судорог, болезни Альцгеймера, болезни Паркинсона и/или любых других заболеваний или состояний, связанных с дефицитом и/или нарушением активности SCN1A.Such expression cassettes may be adapted for use in humans to treat Dravet syndrome, epilepsy, seizures, Alzheimer's disease, Parkinson's disease and/or any other diseases or conditions associated with deficiency and/or impairment of SCN1A activity.

- 115 046157- 115 046157

Пример 6.Example 6.

Анализ гипертермических припадков (HTS) на мышах с синдромом Драве.Analysis of hyperthermic seizures (HTS) in mice with Dravet syndrome.

A. Гетерозиготная модель мыши с нокаутом Scn1a.A. Heterozygous Scn1a knockout mouse model.

Лечение синдрома Драве и/или его симптомов с использованием кассет экспрессии исследовали на линии мышей Scn1atm1Kea Эта линия мышей представляет собой признанную мышиную модель для синдрома Драве. Линии мыши Scn1atm1Kea не требуют рекомбиназы CRE. Мышь Scn1atm1Kea (доступная из лаборатории the Jackson Laboratory; описанная в Hawkins et al., Scientific Reports, vol. 7: 15327 (2017)) содержит делецию первого кодирующего экзона SCN1A. Мыши, гомозиготные по аллелю нокаута SCN1A, характеризуются тремором, атаксией, припадками и умирают к 16-му дню после рождения. У гетерозиготных мышей на фоне C57BL/6 развиваются спонтанные припадки, и большая часть их умирает в течение нескольких недель. Такая линия мышей может быть использована для изучения безопасности и эффективности лечения эпилепсии и синдрома Драве. См. Miller et al., Genes Brain Behav. 2014 Feb;13(2):163-72 для дополнительной информации.Treatment of Dravet syndrome and/or its symptoms using expression cassettes was investigated in the Scn1a tm1Kea mouse line. This mouse line is an established mouse model for Dravet syndrome. Scn1a tm1Kea mouse lines do not require CRE recombinase. The Scn1a tm1Kea mouse (available from the Jackson Laboratory; described in Hawkins et al., Scientific Reports, vol. 7: 15327 (2017)) contains a deletion of the first coding exon of SCN1A. Mice homozygous for the SCN1A knockout allele are characterized by tremors, ataxia, seizures, and die by 16 days after birth. Heterozygous mice on a C57BL/6 background develop spontaneous seizures and most die within a few weeks. This mouse line can be used to study the safety and effectiveness of treatment for epilepsy and Dravet syndrome. See Miller et al., Genes Brain Behav. 2014 Feb;13(2):163-72 for more information.

Чтобы исследовать эффективность активаторов транскрипции в линии мышей Scn1atm1Kea, в пометы детенышей, полученных от самцов Scn1a +/-, скрещенных с самками C57Bl/6J, вводили вектор AAV посредством двусторонней ICV в точке P1. Мышам вводили дозы конструкций 31-34 (табл. 1). Мышей оставляли без воздействий вместе с их матерью до отлучения в P18, а затем снова не трогали до P26-P28, когда начинали анализ гипертермического припадка (HTS). Отдельные пометы мышей, которым вводили дозу в P1, отсеивали на P18 и ежедневно наблюдали за смертностью. Индукцию гипертермического припадка проводили у гетерозиготных (HET) мышей и мышей WT Scn1a на смешанном фоне 129Stac X C57BL/6 в P26-P28. Перед исследованием мышам вставляли смазанный ректальный датчик температуры (Ret-4) и подсоединяли к модулю контроля температуры (TCAT 2DF, Physitemp), который был последовательно соединен с нагревательной лампой (HL-1). Затем мышей помещали в большой стеклянный стакан и на короткое время давали уравновеситься с окружающей средой. После этого температура тела повышалась на ~0,5°C каждые 2 минуты до начала первого тонико-клонического припадка, сопровождающегося потерей положения стоя или до достижения температуры 43°C. Если у мыши случался припадок с потерей положения тела, эксперимент заканчивали и регистрировали внутреннюю температуру тела мыши. Если в течение всего эксперимента не было обнаружено приступов с потерей положения тела, эта мышь считалась без припадков, и анализ завершали. Образцы тканей получали от мышей в точке P1, a генотипирование мышей выполняли в ходе эксперимента с использованием ПЦР в реальном времени. После завершения анализа генотипирование было не слепым, и статус мышей как HET или WT коррелировал с полученными данными. Данные наносили на кривую выживаемости Каплана-Мейера, а значимость определяли с помощью теста Мантеля-Кокса. Результаты показаны в табл. 15 и 16 и на фиг. 6A-E.To examine the efficacy of transcriptional activators in the Scn1a tm1Kea mouse line, litters of pups derived from Scn1a +/− males crossed with C57Bl/6J females were injected with the AAV vector via bilateral ICV at P1. Mice were administered doses of constructs 31–34 (Table 1). Mice were left undisturbed with their mother until weaning at P18 and then left undisturbed again until P26–P28, when the hyperthermic seizure (HTS) assay began. Individual litters of mice dosed at P1 were screened out at P18 and monitored for mortality daily. Hyperthermic seizure induction was performed in heterozygous (HET) mice and WT Scn1a mice on a mixed 129Stac X C57BL/6 background at P26-P28. Before the study, mice were inserted with a lubricated rectal temperature probe (Ret-4) and connected to a temperature control module (TCAT 2DF, Physitemp), which was connected in series with a heat lamp (HL-1). The mice were then placed in a large glass beaker and allowed to equilibrate with the environment for a short time. Thereafter, body temperature increased by ~0.5°C every 2 minutes until the onset of the first tonic-clonic seizure accompanied by loss of standing position or until the temperature reached 43°C. If a mouse experienced a seizure with loss of body position, the experiment was terminated and the mouse's core body temperature was recorded. If no postural seizures were detected throughout the experiment, that mouse was considered seizure-free and the analysis was completed. Tissue samples were obtained from mice at P1, and genotyping of mice was performed during the experiment using real-time PCR. Once the analysis was completed, genotyping was not blinded, and the status of the mice as HET or WT was correlated with the data obtained. Data were plotted on a Kaplan-Meier survival curve, and significance was determined using the Mantel-Cox test. The results are shown in table. 15 and 16 and in fig. 6A-E.

Таблица 15Table 15

Обобщение условий, использованных в примере 6Summary of conditions used in Example 6

Конструкция Design Дозировка (копии генов/мышь) Dosage (gene copies/mouse) Конструкция 31 (фиг. 6А и 6Е)) Design 31 (Fig. 6A and 6E)) 6,0Е+10 6.0E+10 Конструкция 32 (фиг. 6В, 6D, 6Е) Design 32 (Fig. 6B, 6D, 6E) 3,1Е+11 3.1E+11 Конструкция 33 (фиг. 6С) Design 33 (Fig. 6C) 5,8Е+10 5.8E+10 Конструкция 34 (фиг. 6D) Design 34 (Fig. 6D) 4,9Е+13 4.9E+13

Таблица 16Table 16

Обобщение результатов анализа на гипертермические припадкиSummary of test results for hyperthermic seizures

Конструкция eTF (FIG.) eTF design (FIG.) Кол-во контрольных животных (обработ. PBS) Number of control animals (PBS treatment) Кол-во обработанных животных Number of animals treated % без припадков при темп. 42,6°С % without seizures at temp. 42.6°C Рзначение Rvalue Репортер EGFP EGFP reporter 16 16 N/A N/A 44% 44% Конструкция 31 (фиг. 6А и 6Е)) Design 31 (Fig. 6A and 6E)) 16 16 18 18 95 95 Р<0,0001 P<0.0001 Конструкция 32 (фиг. 6В, 6D, 6Е) Design 32 (Fig. 6B, 6D, 6E) 16 16 21 21 76 76 Р<0,05 P<0.05 Конструкция 33 (фиг. 6С) Design 33 (Fig. 6C) 16 16 14 14 93 93 Р<0,001 P<0.001 Конструкция 34 (фиг. 6D) Design 34 (Fig. 6D) 16 16 12 12 83 83 Р<0,05 P<0.05

Дополнительные эксперименты проводили на мышах Scn1atm1Kea, как описано выше, чтобы проверить влияние конструкций 42 и 43 на припадки в анализе HTS. В этих экспериментах конструкцию 42 вводили в дозе 9x1010 копий генома/мышь посредством двусторонней ICV в P1, а конструкцию 43 вводили в дозе 6x1010 копий генома/мышь посредством двусторонней ICV в P1 или P5. Результаты показаны на фиг. 6F (конструкция 42) и фиг. 6G (конструкция 43). Обе конструкции показали значительное снижение припадков по сравнению с контрольными EGFP (P<0,0001 как для конструкции 42, так и для конструкции 43).Additional experiments were performed in Scn1a tm1Kea mice as described above to test the effects of constructs 42 and 43 on seizures in the HTS assay. In these experiments, construct 42 was administered at a dose of 9x1010 genome copies/mouse via bilateral ICV in P1, and construct 43 was administered at a dose of 6x1010 genome copies/mouse via bilateral ICV in P1 or P5. The results are shown in Fig. 6F (structure 42) and FIG. 6G (design 43). Both constructs showed a significant reduction in seizures compared to EGFP controls (P<0.0001 for both construct 42 and construct 43).

- 116 046157- 116 046157

B. Гетерозиготная мутантная модель мыши ScnlaRX.B. ScnlaRX heterozygous mutant mouse model.

Лечение синдрома Драве и/или его симптомов с использованием кассеты экспрессии по настоящему раскрытию исследовали на линии мышей Scn1aRX. Эта линия мышей представляет собой признанную модель мышей для синдрома Драве. Линии мыши Scn1aRX не требуют рекомбиназы CRE. Мышь Scn1aRX (доступная из лаборатории Jackson Laboratory; описанная в Ogiwara et al., J. Neuroscience, vol. 27: 59035914 (2007)), содержит нонсенс-мутацию с потерей функции в экзоне 21 гена SCN1A (CgG на TgA; R1407X). У гетерозиготных мышей на фоне C57BL/6 развиваются спонтанные припадки, и большой процент мышей умирает в течение нескольких недель.Treatment of Dravet syndrome and/or its symptoms using the expression cassette of the present disclosure was studied in the Scn1a RX mouse line. This mouse strain is an established mouse model for Dravet syndrome. Scn1aRX mouse lines do not require CRE recombinase. The Scn1aRX mouse (available from the Jackson Laboratory; described in Ogiwara et al., J. Neuroscience, vol. 27: 59035914 (2007)) contains a loss-of-function nonsense mutation in exon 21 of the SCN1A gene (CgG to TgA; R1407X). Heterozygous mice on a C57BL/6 background develop spontaneous seizures, and a large percentage of mice die within a few weeks.

Для проверки эффективности активаторов транскрипции в линии мышей Scn1aRX в пометы детенышей, полученных от скрещивания посредством ЭКО сперматозоидов самцов Scn1aRX/+ с яйцеклеткой C57Bl/6J с эмбрионами, имплантированными самкам CD-1, вводили вектор AAV (конструкция 31) в дозе 5,1х1010 копий генома ^сУмышь или контроль PBS посредством двусторонней ICV в P1. Мышей оставляли без воздействий вместе с их матерью до отлучения в P18, а затем снова оставляли без воздействий до P26-P28, когда начинали анализ HTS. Отдельные пометы мышей, которым вводили дозу в P1, осматривали в P18 и ежедневно наблюдали за смертностью. Индукцию гипертермического припадка проводили у гетерозиготных (HET) мышей P26-P28 и мышей WT Scn1a на фоне C57BL/6. Перед исследованием мышам вставляли смазанный ректальный датчик температуры (Ret-4) и подсоединяли к модулю контроля температуры (TCAT 2DF, Physitemp), который был последовательно соединен с нагревательной лампой (HL-1). Затем мышей помещали в большой стеклянный стакан и на короткое время давали уравновеситься с окружающей средой. После этого температура тела повышалась на ~0,5°C каждые 2 минуты до начала первого тонико-клонического припадка, сопровождающегося потерей положения тела, или до достижения температуры 43°C. Если у мыши случался припадок с потерей положения тела, эксперимент заканчивали и регистрировали внутреннюю температуру тела мыши. Если в течение всего эксперимента не было обнаружено припадков с потерей положения тела, эта мышь считалась без припадков, и анализ завершался. Образцы тканей получали от мышей в точке P1, и генотипирование мышей выполняли в ходе эксперимента с использованием ПЦР в реальном времени. После завершения анализа генотипирование было не слепым, и статус мышей как HET или WT коррелировал с полученными данными. Ни у одной из исследованных мышей WT Scna1 не было припадка. Данные для мышей HET, обработанных конструкцией 31 (n=13) и обработанных PBS контролем (n=14), наносили на кривую выживаемости Каплана-Мейера, и значимость определяли с помощью критерия Кокса-Мантеля. Как показано на фиг. 6H, мыши HET, обработанные конструкцией 31, показывают значительное снижение индукции гипертермического припадка по сравнению с мышами HET, получавшими контрольный PBS (P<0,01).To test the effectiveness of transcription activators in the Scn1aRX mouse line, the AAV vector (design 31) was introduced into litters of pups obtained through IVF crossing of Scn1a RX/+ male sperm with C57Bl/6J eggs with embryos implanted into CD-1 females at a dose of 5.1x10 10 copies of the mouse genome or PBS control via bilateral ICV in P1. Mice were left unexposed with their mother until weaning at P18 and then left unexposed again until P26–P28, when the HTS assay began. Individual litters of mice dosed at P1 were examined at P18 and monitored daily for mortality. Hyperthermic seizure induction was performed in heterozygous (HET) P26-P28 mice and WT Scn1a mice on a C57BL/6 background. Before the study, mice were inserted with a lubricated rectal temperature probe (Ret-4) and connected to a temperature control module (TCAT 2DF, Physitemp), which was connected in series with a heat lamp (HL-1). The mice were then placed in a large glass beaker and allowed to equilibrate with the environment for a short time. Thereafter, body temperature increased by ~0.5°C every 2 minutes until the onset of the first tonic-clonic seizure, accompanied by loss of body position, or until the temperature reached 43°C. If a mouse experienced a seizure with loss of body position, the experiment was terminated and the mouse's core body temperature was recorded. If no postural seizures were detected throughout the experiment, that mouse was considered seizure-free and the analysis was completed. Tissue samples were obtained from mice at P1, and genotyping of mice was performed during the experiment using real-time PCR. Once the analysis was completed, genotyping was not blinded, and the status of the mice as HET or WT was correlated with the data obtained. None of the WT Scna1 mice studied had a seizure. Data for HET mice treated with construct 31 (n=13) and PBS control (n=14) were plotted on a Kaplan-Meier survival curve and significance was determined using the Cox-Mantel test. As shown in FIG. 6H, HET mice treated with construct 31 show a significant reduction in hyperthermic seizure induction compared to HET mice treated with control PBS (P<0.01).

Пример 7.Example 7.

Анализ выживаемости на мышиной модели синдрома Драве.Survival analysis in a mouse model of Dravet syndrome.

A. Гетерозиготная модель мыши с нокаутом Scn1a.A. Heterozygous Scn1a knockout mouse model.

Для проверки эффективности активаторов транскрипции в линии мышей Scn1atmlKea в пометы детенышей, полученных от самцов Scn1a +/-, скрещенных с самками C57Bl/6J, вводили вектор AAV посредством двусторонней ICV в точке P1. Мышей не оставляли без воздействия с их матерью до отлучения. Наблюдение за состоянием здоровья мышей Scn1a +/- проводили ежедневно после отлучения в P18. Мышам, которые были найдены мертвыми в своей домашней клетке по любой причине, была записана дата. Данные наносили на кривую выживаемости Каплана-Мейера, а значимость определяли с помощью критерия Кокса-Мантеля.To test the efficacy of transcriptional activators in the Scn1a tmlKea mouse line, litters of pups derived from Scn1a +/− males crossed with C57Bl/6J females were injected with the AAV vector via bilateral ICV at P1. Mice were left unexposed with their mother until weaning. Health monitoring of Scn1a +/− mice was performed daily after weaning at P18. Mice that were found dead in their home cage for any reason were dated. Data were plotted on a Kaplan-Meier survival curve and significance was determined using the Cox-Mantel test.

Результаты показаны в табл. 17 и на фиг. 7A-D.The results are shown in table. 17 and FIG. 7A-D.

Таблица 17Table 17

Обобщение условий и результатов анализа выживаемостиSummary of conditions and results of survival analysis

SEQ ID SEQ ID Дозировка (gc/мышь) Dosage (gc/mouse) Кол-во контрольных животных (обработ. PBS) Number of control animals (PBS treatment) Кол-во обработанных животных Number of animals treated % выживших в Р100 (*в Р83) % of survivors in P100 (*in P83) Рзначение Rvalue PBS PBS N/A N/A 53 53 N/A N/A 49% 49% Конструкция 33 (фиг. 7С и 7D) Design 33 (Figs. 7C and 7D) 5,8Е+10 5.8E+10 53 53 29 29 76% 76% Р<0,05 P<0.05 Конструкция 31 (фиг. 7В и 7D) Design 31 (Figs. 7B and 7D) 6,0Е+10 6.0E+10 53 53 34 34 97% 97% Р<0,0001 P<0.0001

_~ .RX_~.RX

B. Гетерозиготная модель мутантной мыши Scn1a .B. Heterozygous Scn1a mutant mouse model.

Чтобы проверить эффективность активаторов транскрипции в линии мышей Scn1aRX, в пометы детенышей, полученных от самцов и скрещивания ЭКО сперматозоидов Scn1aRX/+ с яйцеклетками C57Bl/6J, в эмбрионы, имплантированных самками CD-1, вводили вектор AAV (конструкция 31) при 5,1х1010 копий генома ^сУмышь или контроль PBS посредством двусторонней ICV в P1. Мышей оставляли без воздействия с их матерью до отлучения. Наблюдение за состоянием здоровья мышей Scn1aTo test the effectiveness of transcriptional activators in the Scn1a RX mouse line, litters of pups generated from males and IVF crosses of Scn1aRX/+ sperm with C57Bl/6J eggs were injected into embryos implanted with CD-1 females with the AAV vector (construct 31) at 5. 1x10 10 copies of the genome ^cMouse or PBS control via bilateral ICV in P1. Mice were left unexposed with their mother until weaning. Health Monitoring of Scn1a Mice

- 117 046157- 117 046157

RX/+ проводили ежедневно после отлучения в P18. Мышам, которые были найдены мертвыми в своей домашней клетке по любой причине, была записана дата. Данные для обработанных конструкцией 31 (n=27) и обработанных контролем (n=18) наносили на кривую выживаемости Каплана-Мейера, а значимость определяли с помощью критерия Кокса-Мантеля.RX/+ was performed daily after weaning at P18. Mice that were found dead in their home cage for any reason were dated. Data for construct 31 treated (n=27) and control treated (n=18) were plotted on a Kaplan-Meier survival curve and significance was determined using the Cox-Mantel test.

Как показано на фиг. 7E, мыши Scn1aRX/+, получившие конструкцию 31, характеризовались повышенной выживаемостью по сравнению с мышами Scn1aRX/+, получавшими контрольный PBS (P<0,0001).As shown in FIG. 7E, Scn1aRX /+ mice receiving construct 31 had increased survival compared to Scn1aRX /+ mice receiving control PBS (P<0.0001).

Пример 8.Example 8.

Уровни транскрипции SCN1A у отличных от человека приматов после лечения AAV, кодирующим специфический фактор транскрипции SCN1A.Transcription levels of SCN1A in non-human primates following treatment with AAV encoding the specific transcription factor SCN1A.

В исследовании использовали самцов яванского макака (macaca fascicularis) в возрасте от 2 до 3 лет. Животных перед включением в исследование предварительно проверяли на наличие перекрестнореактивных антител к AAV9 с помощью клеточного анализа нейтрализующих антител. AAV9, экспрессирующий фактор транскрипции, специфический для SCN1A (конструкция 33), или контроль разводили в PBS и вводили интрапаренхимально в концентрации 1,2E12 gc/животное. Для инъекций определяли три различных стереотаксических координаты в каждом полушарии, шесть участков инъекции на животное. В каждую точку вводили объем 10 мкл. Инъекции в правое полушарие были симметричны левым. Два необработанных животных использовали в качестве контроля.The study used male cynomolgus monkeys (macaca fascicularis) aged 2 to 3 years. Animals were prescreened for the presence of cross-reactive antibodies to AAV9 using a cellular neutralizing antibody assay before inclusion in the study. AAV9 expressing a transcription factor specific for SCN1A (construct 33) or control was diluted in PBS and injected intraparenchyally at a concentration of 1.2E12 gc/animal. For injections, three different stereotaxic coordinates were determined in each hemisphere, six injection sites per animal. A volume of 10 μl was injected into each point. Injections into the right hemisphere were symmetrical to the left. Two untreated animals were used as controls.

Для оценки экспрессии мРНК Scn1A проводили обратную транскрипцию с последующим способом кПЦР. При вскрытии трупа через 28 дней после введения дозы срезы тканей из различных областей головного мозга (лобная кора, теменная кора, височная кора, затылочная кора, гиппокамп, продолговатый мозг, мозжечок; по 200 мг каждого) от контрольных и обработанных животных собирали в RNAlater, а затем замораживали. Вкратце, иссекали 30 мг ткани, экстрагировали РНК (с помощью мини-набора для ткани Qiagen Rneasy Lipid, номер по каталогу 1023539), преобразовывали в кДНК путем обратной транскрипции (с использованием набора для обратной транскрипции кДНК высокой емкости Applied Biosystems, номер по каталогу 4368814) и проводили кПЦР с использованием набора праймеров/зондов для Scn1A и гена домашнего хозяйства GAPDH (Applied Biosystems, номер по каталогу Rh02621745-gI FAM).To evaluate Scn1A mRNA expression, reverse transcription followed by qPCR was performed. At necropsy 28 days after dosing, tissue sections from various brain regions (frontal cortex, parietal cortex, temporal cortex, occipital cortex, hippocampus, medulla oblongata, cerebellum; 200 mg each) from control and treated animals were collected in RNAlater. and then frozen. Briefly, 30 mg of tissue was dissected, RNA extracted (using Qiagen Rneasy Lipid Mini Tissue Kit, part number 1023539), converted to cDNA by reverse transcription (using Applied Biosystems High Capacity cDNA Reverse Transcription Kit, part number 4368814 ) and qPCR was performed using a primer/probe set for Scn1A and the housekeeping gene GAPDH (Applied Biosystems, catalog number Rh02621745-gI FAM).

Наборы праймеров/зондов для SCNIA приведены ниже.Primer/probe sets for SCNIA are given below.

Таблица 18Table 18

Последовательности праймеров, использованные в примере 8Primer sequences used in example 8

Ген Gene SEQ ID NO SEQ ID NO Последовательность (5’-3’) Sequence (5’-3’) Примечание Note ScnlA ScnlA 191 191 CCATGGAACTGGCTCGATTTCAC CCATGGAACTGGCTCGATTTCAC F-праймер F primer 192 192 ATTGGTGGGAGGCCACTGTAT ATTGGTGGGAGGCCACTGTAT R-праймер R primer 193 193 AGGCCTGAAAACCATTGTGGGAGCCCT AGGCCTGAAAACCATTGTGGGAGCCCT Зонд (FAM) Probe (FAM)

Экспрессию гена Scn1A в каждом исследуемом образце определяли относительным количественным анализом (RQ) с использованием способа сравнительного Ct (ΔΟ). Этот способ измеряет разность Ct (ΔΟ0 между целевым геном и геном домашнего хозяйства, а затем сравнивает значения ΔΟ образцов для лечения с контрольными образцами.Scn1A gene expression in each test sample was determined by relative quantitation (RQ) using the comparative Ct (ΔΟ) method. This method measures the difference in Ct(ΔΟ0) between a target gene and a housekeeping gene, and then compares the ΔΟ values of treatment samples with control samples.

ACt = среднее Ct целевого гена - среднее Ct гена домашнего хозяйства.ACt = average Ct of target gene - average Ct of housekeeping gene.

ΔΔ(ΐ = Δ(ΐ образца лечения - Δ(ΐ контрольного образца.ΔΔ(ΐ = Δ(ΐ treatment sample - Δ(ΐ control sample.

Относительная экспрессия (образец лечения) = 2 - ΔΔ(ΐRelative expression (treatment sample) = 2 - ΔΔ(ΐ

Данные представлены в виде нормализованной экспрессии целевой мРНК в различных тканях головного мозга (см. фиг. 8). Как показано на фиг. 8, участки головного мозга, проксимальные к участкам интрапаренхиматозных инъекций, показали самые высокие уровни экспрессии транскрипта SCN1A.Data are presented as normalized target mRNA expression in different brain tissues (see Fig. 8). As shown in FIG. 8, brain regions proximal to intraparenchymal injection sites showed the highest levels of SCN1A transcript expression.

Пример 9.Example 9.

Селективная экспрессия трансгена в PV-содержащих нейронах у отличных от человека приматов после лечения AAV, имеющего селективный в отношении PV промотор и сайт связывания микроРНК.Selective transgene expression in PV-containing neurons in non-human primates following treatment with AAV having a PV-selective promoter and microRNA binding site.

В исследовании использовали шесть мартышек (Callithrix jacchus), которых предварительно проверяли на перекрестно-реактивные антитела к AAV9 перед включением в исследование. Двум обезьянам вводили AAV9, содержащий трансген EGFP под контролем промотора EF1alpha, двум обезьянам вводили AAV9, содержащий трансген EGFP, под контролем RE 2 (SEQ ID NO: 2), и двум обезьянам вводили AAV9, содержащий трансген EGFP под контролем RE 2 (SEQ ID NO: 2), а также содержащий сайт связывания микроРНК (SEQ ID NO: 7), расположенный между кодирующей областью EGFP и полиАхвостом. Векторы AAV9 разводили в PBS и животным вводили три внутримозговые инъекции (2 мкл каждая) в гиппокамп/энторинальную кору каждого полушария, всего 6 участков инъекции на животное. Два животных получали вектор AAV9, содержащий EF1alpha-EGFP, каждое получило общую дозу 5,8E+11 копий генома/животное, два животных получали вектор AAV9, содержащий RE 2-EGFP, каждое получило общую дозу 3,0E+11 копий генома/животное, и два животных получали вектор AAV9, содержащий RE 2 + m1-EGFP, каждое получило общую дозу 2,3E+11 копий генома/животное.The study used six marmosets (Callithrix jacchus), which were pretested for cross-reactive antibodies to AAV9 before inclusion in the study. Two monkeys were administered AAV9 containing the EGFP transgene under the control of the EF1alpha promoter, two monkeys were administered AAV9 containing the EGFP transgene under the control of RE 2 (SEQ ID NO: 2), and two monkeys were administered AAV9 containing the EGFP transgene under the control of RE 2 (SEQ ID NO: 2), and also containing a microRNA binding site (SEQ ID NO: 7), located between the EGFP coding region and the polyTail. AAV9 vectors were diluted in PBS and animals received three intracerebral injections (2 μl each) into the hippocampus/entorhinal cortex of each hemisphere, for a total of 6 injection sites per animal. Two animals received an AAV9 vector containing EF1alpha-EGFP, each receiving a total dose of 5.8E+11 genome copies/animal, two animals received an AAV9 vector containing RE 2-EGFP, each receiving a total dose of 3.0E+11 genome copies/animal , and two animals received the AAV9 vector containing RE 2 + m1-EGFP, each receiving a total dose of 2.3E+11 genome copies/animal.

- 118 046157- 118 046157

Иммуногистохимию использовали для оценки селективной экспрессии парвальбумина (PV). При вскрытии трупа, через 28 дней после введения дозы, собирали срезы тканей из различных областей головного мозга. Плавающие срезы головного мозга мартышек (35 мкм) фиксировали в 4% параформальдегиде, блокировали буфером (PBS, 3% BSA, 3% ослиная сыворотка, 0,3% Triton-X 100, 0,2% Tween-20), а затем окрашивали анти-GFP (Abcam ab290) ,а затем вторичным антителом, конъюгированным с Alexa488 (Thermo A21206). За этим последовали антитело к PV (Swant) и вторичное антитело, конъюгированное с Alexa-647 (Thermo A31571) и 4',6-диамидино-2-фенилиндолом (DAPI). Срезы монтировали и визуализировали с помощью PerkinElmer Vectra3.Immunohistochemistry was used to evaluate the selective expression of parvalbumin (PV). At autopsy, 28 days after dosing, tissue sections were collected from various areas of the brain. Floating sections of marmoset brains (35 μm) were fixed in 4% paraformaldehyde, blocked with buffer (PBS, 3% BSA, 3% donkey serum, 0.3% Triton-X 100, 0.2% Tween-20), and then stained anti-GFP (Abcam ab290) followed by a secondary antibody conjugated to Alexa488 (Thermo A21206). This was followed by an anti-PV antibody (Swant) and a secondary antibody conjugated to Alexa-647 (Thermo A31571) and 4′,6-diamidino-2-phenylindole (DAPI). Sections were mounted and imaged using a PerkinElmer Vectra3.

Результаты показаны на фиг. 9A-F и 10A-L.The results are shown in Fig. 9A-F and 10A-L.

Пример 10.Example 10.

Биораспространение eTFSCN1A Biodistribution of eTF SCN1A

Целью этого исследования было сравнить биораспределение eTFSCN1A в центральной нервной системе (ЦНС) молодых обезьян яванского макака при введении в дозе 4,8E+13 посредством односторонней интрацеребровентрикулярной (ICV) инъекции. Каждому животному инъецировали AAV9, содержащий кассету экспрессии, кодирующую eTFSCN1A, под контролем селективного регуляторного элемента ГАМК (GABA) (REGABA-eTFSCN1A). Частицы AAV9 составляли в PBS + 0,001% плюроновой кислоты и вводили в дозе 4,8E+13 или 8E+13 vg/животное. Каждому животному вводили 2 мл приготовленных вирусных частиц. Дизайн исследования представлен в табл. 19.The aim of this study was to compare the biodistribution of eTF SCN1A in the central nervous system (CNS) of juvenile cynomolgus monkeys when administered at a dose of 4.8E+13 via unilateral intracerebroventricular (ICV) injection. Each animal was injected with AAV9 containing an expression cassette encoding eTF SCN1A under the control of a GABA selective regulatory element (RE GABA -eTF SCN1A ). AAV9 particles were formulated in PBS + 0.001% pluronic acid and administered at a dose of 4.8E+13 or 8E+13 vg/animal. Each animal was injected with 2 ml of prepared viral particles. The study design is presented in Table. 19.

Яванских макаков в возрасте двадцать четыре месяца группировали, как указано в табл. 19. Перед началом исследования образцы крови животных исследовали на уровни титра нейтрализующих антител к AAV9 с использованием анализа титра NAb, описанного выше. Для исследования выбирали животных с низкими или отрицательными результатами на антитела. Образцы вводили посредством инъекции ICV с использованием стандартных хирургических процедур. Размороженный дозируемый материал ненадолго хранили на влажном льду и нагревали до комнатной температуры непосредственно перед дозированием. Животных анестезировали, готовили к операции и помещали в стереотаксическую рамку, совместимую с MPT (Kopf). Для определения координат цели выполняли базовую МРТ. Делали разрез и просверливали одно отверстие в черепе над целевым участком. Шприц BD объемом 3 мл, прикрепленный к набору удлинителей с микроканальным отверстием длиной 36 дюймов, подготавливали с образцом и помещали в инфузионный насос. Линию экстензии примировали. Твердую мозговую оболочку открывали, и дозирующую иглу продвигали на глубину от 13,0 до 18,1 мм от мягкой мозговой оболочки. Инъекцию контрастного вещества и рентгеноскопию использовали для подтверждения введения спинномозговой иглы в правый боковой желудочек. В иглу Quinke BD размером 3,0 дюйма 22 г для спинномозговой хирургии добавляли контраст, чтобы определить ее расположение, перед тем, как прикрепить заправленную линию экстензии и шприц. Настройки насоса составляли 0,1 мл/мин в течение 19-20 минут. Буфер вводили вручную после введения дозы, чтобы очистить линию экстензии. Иглу оставляли на месте в течение 1-2 минут после завершения инфузии, а затем иглу извлекали. Носитель и исследуемое вещество вводили один раз в день 1, и субъектов поддерживали в течение 27- или 29-дневного периода восстановления.Cynomolgus macaques at twenty-four months of age were grouped as indicated in Table. 19. Before the start of the study, animal blood samples were tested for levels of neutralizing antibody titre to AAV9 using the NAb titer assay described above. Animals with low or negative antibody results were selected for the study. Samples were administered via ICV injection using standard surgical procedures. Thawed dispense material was briefly stored on wet ice and warmed to room temperature immediately before dispensing. Animals were anesthetized, prepared for surgery, and placed in an MPT-compatible stereotactic frame (Kopf). Baseline MRI was performed to determine target coordinates. An incision was made and one hole was drilled into the skull above the target area. A 3 mL BD syringe attached to a 36-inch microchannel extension set was prepared with the sample and placed into the infusion pump. The extension line was primed. The dura mater was opened and the dosing needle was advanced to a depth of 13.0 to 18.1 mm from the pia mater. Contrast injection and fluoroscopy were used to confirm insertion of the spinal needle into the right lateral ventricle. Contrast was added to the Quinke BD 3.0 inch 22 g spinal surgery needle to determine its location before attaching the primed extension line and syringe. Pump settings were 0.1 ml/min for 19-20 minutes. Buffer was manually injected after dosing to clear the extension line. The needle was left in place for 1-2 minutes after completion of the infusion, and then the needle was removed. Vehicle and test substance were administered once on day 1, and subjects were maintained during a 27- or 29-day recovery period.

Таблица 19Table 19

Дизайн исследования биораспределенияBiodistribution Study Design

Группа Group Пол Floor ID ID Доза (VG/животное) Dose (VG/animal) Группа 1 (контроль-буфер) Group 1 (control buffer) М M 21001 21001 Ж AND 11501 11501 Группа 2 (REGABA-eTFSCN1A) Group 2 (RE GABA -eTF SCN1A ) м m 2001 2001 4,8Е+13 4.8E+13 ж and 2501 2501 4,8Е+13 4.8E+13 м m 3001 3001 4,8Е+13 4.8E+13 м m 3002 3002 8Е+13 8E+13

После введения дозы за животными регулярно наблюдали на протяжении всего исследования, и периодически отбирали образцы крови. Введение eTFSCN1A не было связано с неожиданной смертностью, клиническими данными или макроскопическими наблюдениями. Животные, получившие AAV9-REgabaeTFSCN1A, выживали до запланированного вскрытия трупа на 28 ± 2 дня. Никаких клинических или поведенческих признаков, повышения температуры тела или снижения массы тела во время ежедневных или еженедельных медицинских осмотров не наблюдалось. Временное повышение печеночных трансаминаз (АЛТ и ACT) у животных, получавших AAV9-REGABA-eTFSCN1A, наблюдалось, но полностью исчезало к концу исследования без иммуномодуляции, и не было отмечено сопутствующего повышения сывороточного билирубина или щелочной фосфатазы. Ни один из других измеренных результатов клинической химии не был выдающимся. В гистопатологических исследованиях печени не сообщалось о микроскопических наблюдениях. Лейкоциты CSF были повышены при окончательном сборе по сравнению со значениями до воздействия, но сравнимы между контрольными животными и животными, получившими AAV9-REGABA-eTFSCN1A Плеоцитоза, связанного с AAV9-REGABA-eTFSCN1A, не наблюдалось. Макрообследование и подробное микрогистопатологическое исследование ненейрональных тканей у всех животных не было примечательным. Ткани включали в себя основные периферические органы (например,Following dosing, animals were monitored regularly throughout the study and blood samples were collected periodically. Administration of eTF SCN1A was not associated with unexpected mortality, clinical findings, or macroscopic observations. Animals receiving AAV9-RE gaba eTFS CN1A survived until scheduled necropsy for 28 ± 2 days. No clinical or behavioral signs, fever, or weight loss were observed during daily or weekly medical examinations. A transient increase in hepatic transaminases (ALT and AST) was observed in animals treated with AAV9-RE GABA -eTF SCN1A , but completely resolved by the end of the study without immunomodulation, and no concomitant increase in serum bilirubin or alkaline phosphatase was noted. None of the other clinical chemistry results measured were outstanding. No microscopic observations were reported in histopathological studies of the liver. CSF leukocytes were elevated at final collection compared to pre-exposure values, but comparable between control and AAV9-RE GABA -eTF SCN1A -treated animals. No AAV9-RE GABA -eTF SCN1A- associated pleocytosis was observed. Gross examination and detailed microhistopathological examination of non-neuronal tissues in all animals were unremarkable. Tissues included major peripheral organs (e.g.

- 119 046157 сердце, легкие, селезенку, печень и гонады). Макрообследования и подробная микрогистопатология нейрональных тканей не показали каких-либо заметных результатов. Ткани включали в себя головной, спинной мозг и связанные с ним межпозвонковые узлы (из шейного, грудного и поясничного отделов).- 119 046157 heart, lungs, spleen, liver and gonads). Macroexamination and detailed microhistopathology of neuronal tissues did not show any significant findings. Tissues included the brain, spinal cord, and associated intervertebral nodes (from the cervical, thoracic, and lumbar regions).

Исследования проводились тремя независимыми патологами, в том числе одним в специализированном центре невропатологии.The studies were performed by three independent pathologists, including one at a specialized neuropathology center.

ICV введение AAV9 не предотвращало постдозовый иммунный ответ в сыворотке, поскольку через четыре недели после введения дозы наблюдались нейтрализующие антитела к капсиду AAV9. Однако уровни нейтрализующих антител к AAV9 в CSF оставались неизменными и сравнимыми с уровнями до введения дозы (табл. 20).ICV administration of AAV9 did not prevent the post-dose immune response in serum, as neutralizing antibodies to the AAV9 capsid were observed four weeks post-dose. However, CSF levels of neutralizing antibodies to AAV9 remained unchanged and comparable to predose levels (Table 20).

Таблица 20Table 20

Титр сывороточных NAb к AAV9Serum NAb titer to AAV9

Номер субъекта Subject number Титр сывороточных NAb к AAV9 Serum NAb titer to AAV9 Титр NAb CSF к AAV9 CSF NAb titer to AAV9 До скрининга Before screening При инъециров. When injected Через 4 недели после инъециров. 4 weeks after injections. При инъециров. When injected Через 4 недели после инъециров. 4 weeks after injections. 21001 21001 1:5 1:5 < 1:5 <1:5 < 1:5 <1:5 < 1:5 <1:5 < 1:5 <1:5 11501 11501 < 1:5 <1:5 < 1:5 <1:5 < 1:5 <1:5 < 1:5 <1:5 < 1:5 <1:5 2001 2001 < 1:5 <1:5 < 1:5 <1:5 1:405 1:405 < 1:5 <1:5 1:5 1:5 2501 2501 < 1:5 <1:5 < 1:5 <1:5 1:135 1:135 < 1:5 <1:5 1:5 1:5 3001 3001 < 1:5 <1:5 < 1:5 <1:5 1:1215 1:1215 < 1:5 <1:5 < 1:5 <1:5 3002 3002 < 1:5 <1:5 < 1:5 <1:5 1:135 1:135 < 1:5 <1:5 < 1:5 <1:5

Образцы собирали через 27-29 дней после введения дозы из основных органов (желудочков сердца, долей печени, долей сердца легких, почек, селезенки, поджелудочной железы и шейных лимфатических узлов) во время плановой некроскопии. Прицельную биопсию собирали с помощью восьмимиллиметровых биопсийных щипцов и обрабатывали, как описано ниже.Specimens were collected 27 to 29 days after dosing from major organs (cardiac ventricles, liver lobes, cardiac lobes, lungs, kidneys, spleen, pancreas, and cervical lymph nodes) during routine necroscopy. Targeted biopsies were collected using eight-mm biopsy forceps and processed as described below.

Пример 11.Example 11.

Биораспределение eTFSCN1A в головном мозге.Biodistribution of eTF SCN1A in the brain.

ddPCR использовали для измерения биораспределения eTFSCN1A в головном мозге. Образцы из различных областей ткани головного мозга яванского макака (FC: лобная кора; PC: теменная кора; TC: височная кора; Hip: гиппокамп; Med: продолговатый мозг; OC: затылочная кора) измеряли на количество копий вектора для оценки биораспределения eTFSCN1A под контролем селективного регуляторного элемента ГАМК (REGABA-eTFSCN1A) при введении AAV9 посредством односторонней ICV. Тканевую ДНК выделяли с помощью наборов DNeasy Blood & Tissues (Qiagen). Количество ДНК определяли и нормализовали с помощью УФ-спектрофотометра. 20 нанограмм тканевой ДНК добавляли к реакционной смеси объемом 20 микролитров вместе с ddPCR Super Mix for Probes (без dUTP) (Bio-Rad) и праймерами TaqMan и зондами, направленными против областей последовательности eTFSCN1A. Создавали капли и амплифицировали шаблоны с использованием автоматического генератора капель и термоциклера (BioRad). После этапа ПЦР планшет загружали и считывали с помощью QX2000 Droplet Reader для определения числа копий вектора в тканях. Ген обезьяньего альбумина (MfAlb) служил внутренним контролем для нормализации содержания геномной ДНК и был амплифицирован в той же реакции. Праймеры и зонды для eTFSCN1A и MfAlb представлены в табл. 21.ddPCR was used to measure the biodistribution of eTF SCN1A in the brain. Samples from different regions of cynomolgus brain tissue (FC: frontal cortex; PC: parietal cortex; TC: temporal cortex; Hip: hippocampus; Med: medulla; OC: occipital cortex) were measured for vector copy number to assess the biodistribution of eTF SCN1A under control of the selective regulatory element GABA (RE GABA -eTF SCN1A ) upon administration of AAV9 via unilateral ICV. Tissue DNA was isolated using DNeasy Blood & Tissues kits (Qiagen). The amount of DNA was determined and normalized using a UV spectrophotometer. 20 nanograms of tissue DNA were added to a 20 microliter reaction mixture along with ddPCR Super Mix for Probes (no dUTP) (Bio-Rad) and TaqMan primers and probes directed against eTF sequence regions of SCN1A . Droplets were generated and templates were amplified using an automated droplet generator and thermal cycler (BioRad). After the PCR step, the plate was loaded and read using a QX2000 Droplet Reader to determine the vector copy number in tissues. The simian albumin gene (MfAlb) served as an internal control to normalize genomic DNA content and was amplified in the same reaction. Primers and probes for eTF SCN1A and MfAlb are presented in Table. 21.

Таблица 21Table 21

Праймеры и зонды для eTFSCN1A и MfAlbPrimers and probes for eTF SCN1A and MfAlb

Название праймеров/зонда gTpSCNIA MfAlbumin Name of primers/probe gTpSCNIA MfAlbumin Прямой праймер eypSCNlA Обратный праймер eTFSCNlA Зонд eTFSCN1A Прямой праймер MfAlb Обратный праймер MfAlb Зонд MfAlb Forward primer e ypSCNlA Reverse primer eTF SCNlA eTF probe SCN1A Forward primer MfAlb Reverse primer MfAlb MfAlb probe Последовательность (5’-3') GAATGTGGGAAATCATTCAGTCGC (SEQ ID NO: 194) GC AAGTTATCCTCTCGTGAGAAGG (SEQ ID NO: 195) GCGACAACCTGGTGAGACATCAACGCACC (SEQ ID NO: 196) GCTGTTATCTCTTGTGGGCTGT (SEQ ID NO: 197) AAACTCATGGGAGCTGCCGGTT (SEQ ID NO: 198) CCACACAAATCTCTCCCTGGCATTG (SEQ ID NO: 199) Sequence (5’-3’) GAATGTGGGAAATCATTCAGTCGC (SEQ ID NO: 194) GC AAGTTATCCTCTCGTGAGAAGG (SEQ ID NO: 195) GCGACAACCTGGTGAGACATCAACGCACC (SEQ ID NO: 196) GCTGTTATCTCTTGTGGGCTGT (SEQ ID NO: 197) AAACTCATGGGAGCTGCCGGTT (SEQ ID NO: 198) CCACACAAATCTCTCCTGGCATTG (SEQ ID NO: 199)

eTFSCN1A широко распределялся по всему головному мозгу при дозировке 4,8E+13 вирусных геномов на животное со средним значением 1,3-3,5 вирусных геномов/диплоидный геном (фиг. 11). Кроме того, при сравнении переноса гена по всему головному мозгу REGABA-eTFSCN1A, после дозированного вве- 120 046157 дения 4,8E+13 вирусных геномов на животное, с переносом гена через головной мозг eGFP, веденного посредством ICV в различных дозах, увеличение вирусного генома/диплоидного генома наблюдалось с увеличением дозы. Это указывает на то, что перенос гена в головном мозге происходит дозозависимым образом при введении в AAV9 через ICV.The SCN1A eTF was widely distributed throughout the brain at a dose of 4.8E+13 viral genomes per animal with an average of 1.3-3.5 viral genomes/diploid genome (Fig. 11). In addition, when comparing brain-wide gene transfer RE GABA -eTF SCN1A , following dosing of 120 046157 4.8E+13 viral genomes per animal, with brain-wide gene transfer eGFP induced by ICV at various doses, the increase viral genome/diploid genome was observed with increasing dose. This indicates that gene transfer in the brain occurs in a dose-dependent manner when administered to AAV9 via the ICV.

Пример 12.Example 12.

Транскрипция eTFSCN1A в головном мозге.Transcription of the SCN1A eTF in the brain.

Транскрипцию eTFSCN1A под контролем селективного регуляторного элемента ГАМК, REGABA (REGABA-eTFSCN1A), оценивали путем измерения мРНК eTFSCN1A с использованием анализа экспрессии генов на основе ddPCR. Тканевую РНК выделяли с помощью наборов RNeasy Plus Mini (Qiagen) или RNeasy Lipid Tissue Mini (Qiagen) для тканей головного мозга. Количество РНК определяли и нормализовали с помощью УФ-спектрофотометра, а качество РНК (RIN) проверяли с помощью Bioanalyzer RNA Chip. Один микрограмм тканевой РНК использовали для обработки ДНКазой и синтеза кДНК с помощью набора для синтеза кДНК SuperScript VILO с наборами ферментов ezDNase™ (Thermo Fisher). 50 микрограммов РНК преобразовывали в кДНК. кДНК добавляли в реакционную смесь объемом 20 микролитров вместе с ddPCR Super Mix for Probes (без dUTP) (Bio-Rad) и праймерами и зондами TaqMan, направленными против областей последовательности eTFSCN1A (табл. 22). Создавали капли и амплифицировали шаблоны с использованием автоматического генератора капель и термоциклера (Bio-Rad). После ПЦР-амплификации планшет загружали и считывали с помощью QX2000 Droplet Reader, чтобы получить уровни экспрессии генов в тканях. Ген обезьяны ARFGAP2 (MfARFGAP2) (Thermo Fisher Scientific) служил эндогенным контролем для нормализации уровней экспрессии гена и был амплифицирован в той же реакции. Среднее количество транскриптов для ARFGAP2 составляло 1,85E+6 мкг РНК (фиг. 12, верхняя граница). Предел обнаружения обозначен нижней границей.Transcription of the SCN1A eTF under the control of a selective GABA regulatory element, RE GABA (RE GABA -eTF SCN1A ), was assessed by measuring eTF SCN1A mRNA using ddPCR-based gene expression analysis. Tissue RNA was isolated using the RNeasy Plus Mini (Qiagen) or RNeasy Lipid Tissue Mini (Qiagen) brain tissue kits. RNA quantity was determined and normalized using a UV spectrophotometer, and RNA quality (RIN) was checked using a Bioanalyzer RNA Chip. One microgram of tissue RNA was used for DNase treatment and cDNA synthesis using the SuperScript VILO cDNA Synthesis Kit with ezDNase™ Enzyme Kits (Thermo Fisher). 50 micrograms of RNA was converted to cDNA. The cDNA was added to a 20 microliter reaction mixture along with ddPCR Super Mix for Probes (no dUTP) (Bio-Rad) and TaqMan primers and probes directed against the SCN1A eTF sequence regions (Table 22). Droplets were generated and templates were amplified using an automated droplet generator and thermal cycler (Bio-Rad). After PCR amplification, the plate was loaded and read using a QX2000 Droplet Reader to obtain tissue gene expression levels. The monkey ARFGAP2 (MfARFGAP2) gene (Thermo Fisher Scientific) served as an endogenous control to normalize gene expression levels and was amplified in the same reaction. The average transcript abundance for ARFGAP2 was 1.85E+6 μg RNA (Fig. 12, upper limit). The detection limit is indicated by the lower limit.

мРНК eTFSCN1A наблюдалась по всему головному мозгу у всех животных, что указывает на то, что ГАМК-селективный промотор, REGABA, был транскрипционно активен в ткани головного мозга для всех макак, получивших AAV9-REGABA-eTFSCN1A (фиг. 12). FC: лобная кора; PC: теменная кора; TC: височная кора; Hip: гиппокамп; Med: продолговатый мозг; OC: затылочная кора.eTF SCN1A mRNA was observed throughout the brain in all animals, indicating that the GABA-selective promoter, RE GABA , was transcriptionally active in brain tissue for all macaques that received AAV9-RE GABA -eTF SCN1A (Figure 12) . FC: frontal cortex; PC: parietal cortex; TC: temporal cortex; Hip: hippocampus; Med: medulla oblongata; OC: occipital cortex.

Таблица 22 и зонды областей последовательности eTFSCN1A Table 22 and SCN1A eTF sequence region probes

Название праймеров/зонда Name of primers/probe Описание Description Последовательность (5'-3') Sequence (5'-3') eypSCNlA e ypSCNlA Прямой праймер eTFSCNlA Forward primer eTF SCNlA GAATGTGGGAAATCATTCAGTCGC (SEQ Ш NO: 200) GAATGTGGGAAATCATTCAGTCGC (SEQ Ш NO: 200) Обратный праймер eTFSCNlA Reverse primer eTF SCNlA GCAAGTTATCCTCTCGTGAGAAGG (SEQ Ш NO: 201) GCAAGTTATCCTCTCGTGAGAAGG (SEQ Ш NO: 201) Зонд eTFSCN1A Probe e TF SCN1A GCGACAACCTGGTGAGACATCAACGCACC (SEQIDNO: 202) GCGACAACCTGGTGAGACATCAACGCACC (SEQIDNO: 202) MSARFGAP2 MSARFGAP2 Прямой, обратный праймеры, зонд Direct, reverse primers, probe Thermo Fisher (номер в каталоге: 4448491) Thermo Fisher (catalog number: 4448491)

Пример 13.Example 13.

Биораспределение и транскрипция eTFSCN1A в периферических тканях.Biodistribution and transcription of the SCN1A eTF in peripheral tissues.

Число копий вектора дополнительно измеряли в различных органах для оценки трансдукции REGABA-eTFSCN1A в тканях по всему организму при введении AAV9 посредством односторонней ICV. Уровни транскрипции eTFSCN1A также измеряли с помощью ddPCR для оценки транскрипционной активности eTFSCN1A под контролем GABA-селективного регуляторного элемента REGABA в тканях по всему организму при введении в AAV9 посредством односторонней ICV. Оба способа выполняли, как в общем описано выше. Трансдукция REGABA-eTFSCN1A и транскрипция eTFSCN1A в спинном мозге (SC) и межпозвонковом узле (DRG) были сопоставимы с уровнями, наблюдаемыми в головном мозге. За исключением печени, трансдукция REGABA-eTFSCN1A была ниже в периферических тканях за пределами головного мозга (фиг. 13). Трансдукция REGABA-eTFSCN1A в печени была выше, чем в головном мозге. Транскрипция eTFSCN1A не была обнаружена в периферических тканях, включая в себя сердце, легкие и гонады. Однако уровни транскрипта eTFSCN1A в печени были сопоставимы с уровнями eTFSCN1A, измеренными в головном мозге. Кроме того, транскрипция eTFSCN1A в печени является чрезвычайно низкой, если ее нормализовать по количеству присутствующих копий вектора (приблизительно в 1000 раз ниже по сравнению с транскрипцией eTFSCN1A в головном мозге). В целом это продемонстрировало, что транскрипция eTFSCN1A под контролем ГАМК-селективного регуляторного элемента REGABA ограничена ЦНС.Vector copy number was further measured in various organs to assess RE GABA -eTF SCN1A transduction in tissues throughout the body upon administration of AAV9 via unilateral ICV. Transcription levels of the SCN1A eTF were also measured by ddPCR to assess the transcriptional activity of the SCN1A eTF under the control of the GABA-selective regulatory element RE GABA in tissues throughout the body when introduced into AAV9 via unilateral ICV. Both methods were performed as generally described above. RE GABA -eTF SCN1A transduction and SCN1A eTF transcription in the spinal cord (SC) and intervertebral ganglion (DRG) were comparable to the levels observed in the brain. With the exception of the liver, RE GABA -eTF SCN1A transduction was lower in peripheral tissues outside the brain (Fig. 13). RE GABA -eTF SCN1A transduction was higher in liver than in brain. Transcription of the eTF SCN1A was not detected in peripheral tissues, including the heart, lungs, and gonads. However, eTF SCN1A transcript levels in the liver were comparable to eTF SCN1A levels measured in the brain. In addition, eTFSCN1A transcription in the liver is extremely low when normalized to the number of vector copies present (approximately 1000-fold lower compared to eTF SCN1A transcription in the brain). Overall, this demonstrated that transcription of the eTF SCN1A under the control of the GABA-selective regulatory element RE GABA is restricted to the CNS.

- 121 046157- 121 046157

Перечень последовательностей <110> ИНКОУДИД ТЕРАПЬЮТИКС, ИНК.Sequence Listing <110> INCOUDID THERAPEUTICS, INC.

<120> КОМПОЗИЦИИ И СПОСОБЫ СЕЛЕКТИВНОЙ РЕГУЛЯЦИИ ЭКСПРЕССИИ ГЕНОВ <130> 46482-724.601 <140><120> COMPOSITIONS AND METHODS FOR SELECTIVE REGULATION OF GENE EXPRESSION <130> 46482-724.601 <140>

<141><141>

<150> 63/008,569 <151> 2020-04-10 <150> 62/857,727 <151> 2019-06-05 <150> 62/854,238 <151> 2019-05-29 <160> 226 <170> PatentIn version 3.5 <210> 1 <211> 259 <212> ДНК <213> Искусственная последовательность <220><150> 63/008,569 <151> 2020-04-10 <150> 62/857,727 <151> 2019-06-05 <150> 62/854,238 <151> 2019-05-29 <160> 226 <170> PatentIn version 3.5 <210> 1 <211> 259 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 1 gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt60 ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac120 tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg180 tgggaggtct atataagcag agctggtacc gtgtgtatgc tcaggggctg ggaaaggagg240 ggagggagct ccggctcag259 <210> 2 <211> 2051 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic polynucleotide <400> 1 gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt60 ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac120 tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg180 tgggaggtct atataagcag agctggtacc gtgtgtatgc tcaggggctg ggaaggagg240 ggagggagct ccggctcag259 <210> 2 <211> 2051 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 2 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat60 attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc120 gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag180 tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca240<223> Description of the artificial sequence: Synthetic polynucleotide <400> 2 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat60 attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc120 gatcaacact atggtttgaa aagggggaaa ttgtag agca cagatgtgtt cgtgtggcag180 tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca240

- 122 046157- 122 046157

gtgtgagccc gtgtgagccc agatgaggtt agatgaggtt cagctgccaa cagctgccaa ctttctcttt ctttctcttt cacatcttat cacatcttat gaaagtcatt gaaagtcatt 300 300 taagcacaac taagcacaac taactttttt taactttttt tttttttttt tttttttttt tttttttgag tttttttgag acagagtctt acagagtctt gctctgttgc gctctgttgc 360 360 ccaggacaga ccaggacaga gtgcagtagt gtgcagtagt gactcaatct gactcaatct cggctcactg cggctcactg cagcctccac cagcctccac ctcctaggct ctcctaggct 420 420 caaacggtcc caaacggtcc tcctgcatca tcctgcatca gcctcccaag gcctcccaag tagctggaat tagctggaat tacaggagtg tacaggagtg gcccaccatg gccccacatg 480 480 cccagctaat cccagctaat ttttgtattt ttttgtattt ttaatagata ttaatagata cgggggtttc cggggggtttc accatatcac accatatcac ccaggctggt ccaggctggt 540 540 ctcgaactcc ctcgaactcc tggcctcaag tggcctcaag tgatccacct tgatccacct gcctcggcct gcctcggcct cccaaagtgc cccaaagtgc tgggattata tggggattata 600 600 ggcgtcagcc ggcgtcagcc actatgccca actatgccca acccgaccaa acccgaccaa ccttttttaa ccttttttaa aataaatatt aataaatatt taaaaaattg taaaaaattg 660 660 gtatttcaca gtatttcaca tatatactag tatatactag tatttacatt tatttacatt tatccacaca tatccacaca aaacggacgg aaacggacgg gcctccgctg gcctccgctg 720 720 aaccagtgag aaccagtgag gccccagacg gccccagacg tgcgcataaa tgcgcataaa taacccctgc taacccctgc gtgctgcacc gtgctgcacc acctggggag acctggggag 780 780 agggggagga agggggga ccacggtaaa ccacggtaaa tggagcgagc tggagcgagc gcatagcaaa gcatagcaaa agggacgcgg agggacgcgg ggtccttttc ggtccttttc 840 840 tctgccggtg tctgccggtg gcactgggta gcactgggta gctgtggcca gctgtggcca ggtgtggtac ggtgtggtac tttgatgggg tttgatgggg cccagggctg cccagggctg 900 900 gagctcaagg gagctcaagg aagcgtcgca aagcgtcgca gggtcacaga gggtcacaga tctgggggaa tctgggggaa ccccggggaa ccccggggaa aagcactgag aagcactgag 960 960 gcaaaaccgc gcaaaaccgc cgctcgtctc cgctcgtctc ctacaatata ctacaatata tgggaggggg tgggggggg aggttgagta aggttgagta cgttctggat cgttctggat 1020 1020 tactcataag tactcataag accttttttt accttttttt tttccttccg tttccttccg ggcgcaaaac ggcgcaaaac cgtgagctgg cgtgagctgg atttataatc atttataatc 1080 1080 gccctataaa gccctataaa gctccagagg gctccagagg cggtcaggca cggtcaggca cctgcagagg cctgcagagg agccccgccg agccccgccg ctccgccgac ctccgccgac 1140 1140 tagctgcccc tagctgcccc cgcgagcaac cgcgagcaac ggcctcgtga ggcctcgtga tttccccgcc tttccccgcc gatccggtcc gatccggtcc ccgcctcccc ccgcctcccc 1200 1200 actctgcccc actctgcccc cgcctacccc cgcctacccc ggagccgtgc ggagccgtgc agccgcctct agccgcctct ccgaatctct ccgaatctct ctcttctcct ctcttctcct 1260 1260 ggcgctcgcg ggcgctcgcg tgcgagaggg tgcgagagg aactagcgag aactagcgag aacgaggaag aacgaggaag cagctggagg cagctggagg tgacgccggg tgacgccggg 1320 1320 cagattacgc cagattacgc ctgtcagggc ctgtcagggc cgagccgagc cgagccgagc ggatcgctgg ggatcgctgg gcgctgtgca gcgctgtgca gaggaaaggc gaggaaaggc 1380 1380 gggagtgccc ggggagtgccc ggctcgctgt ggctcgctgt cgcagagccg cgcagagccg aggtgggtaa aggtgggtaa gctagcgacc gctagcgacc acctggactt acctggactt 1440 1440 cccagcgccc cccagcgccc aaccgtggct aaccgtggct tttcagccag tttcagccag gtcctctcct gtcctctcct cccgcggctt cccgcggctt ctcaaccaac ctcaaccaac 1500 1500 cccatcccag cccaccag cgccggccac cgccggccac ccaacctccc ccaacctccc gaaatgagtg gaaatgagtg cttcctgccc cttcctgccc cagcagccga cagcagccga 1560 1560 aggcgctact aggcgctact aggaacggta aggaacggta acctgttact acctgttact tttccagggg tttccagggg ccgtagtcga ccgtagtcga cccgctgccc cccgctgccc 1620 1620 gagttgctgt gagttgctgt gcgactgcgc gcgactgcgc gcgcggggct gcgcggggct agagtgcaag agagtgcaag gtgactgtgg gtgactgtgg ttcttctctg ttcttctctg 1680 1680 gccaagtccg gccaagtccg agggagaacg aggggagaacg taaagatatg taaagatatg ggcctttttc ggcctttttc cccctctcac cccctctcac cttgtctcac cttgtctcac 1740 1740 caaagtccct caaagtccct agtccccgga agtccccgga gcagttagcc gcagttagcc tctttctttc tctttctttc cagggaatta cagggaatta gccagacaca gccagacaca 1800 1800 acaacgggaa acaacgggaa ccagacaccg ccagacaccg aaccagacat aaccagacat gcccgccccg gcccgccccg tgcgccctcc tgcgccctcc ccgctcgctg ccgctcgctg 1860 1860 cctttcctcc cctttcctcc ctcttgtctc ctcttgtctc tccagagccg tccagagccg gatcttcaag gatcttcaag gggagcctcc gggagcctcc gtgcccccgg gtgcccccgg 1920 1920 ctgctcagtc ctgctcagtc cctccggtgt cctccggtgt gcaggacccc gcaggacccc ggaagtcctc ggaagtcctc cccgcacagc cccgcacagc tctcgcttct tctcgcttct 1980 1980 ctttgcagcc ctttgcagcc tgtttctgcg tgtttctgcg ccggaccagt ccggaccagt cgaggactct cgaggactct ggacagtaga ggacagtaga ggccccggga ggccccggga 2040 2040

cgaccgagct g 2051cgaccgagct g 2051

- 123 046157 <210> 3 <211> 1878 <212> ДНК <213> Искусственная последовательность <220>- 123 046157 <210> 3 <211> 1878 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид<223> Description of artificial sequence: Synthetic polynucleotide

<400> 3 tcaacagggg <400> 3 tcaacagggg gacacttggg gacacttgggg aaagaaggat aaagaaggat ggggacagag ggggacagag ccgagaggac ccgagaggac tgttacacat tgttacacat 60 60 tagagaaaca tagagaaaca tcagtgactg tcagtgactg tgccagcttt tgccagcttt ggggtagact ggggtagact gcacaaaagc gcacaaaagc cctgaggcag cctgaggcag 120 120 cacaggcagg cacaggcagg atccagtctg atccagtctg ctggtcccag ctggtcccag gaagctaacc gaagctaacc gtctcagaca gtctcagaca gagcacaaag gagcacaaag 180 180 caccgagaca caccgagaca tgtgccacaa tgtgccacaa ggcttgtgta ggcttgtgta gagaggtcag gagaggtcag aggacagcgt aggacagcgt acaggtccca acaggtccca 240 240 gagatcaaac gagatcaaac tcaacctcac tcaacctcac caggcttggc caggcttggc agcaagcctt agcaagcctt taccaaccca taccaaccca cccccacccc cccccacccc 300 300 acccaccctg acccaccctg cacgcgcccc cacgcgcccc tctcccctcc tctcccctcc ccatggtctc ccatggtctc ccatggctat ccatggctat ctcacttggc ctcacttggc 360 360 cctaaaatgt cctaaaatgt ttaaggatga ttaaggatga cactggctgc cactggctgc tgagtggaaa tgagtggaaa tgagacagca tgagacagca gaagtcaaca gaagtcaaca 420 420 gtagatttta gtagattta ggaaagccag ggaaagccag agaaaaaggc agaaaaaggc ttgtgctgtt ttgtgctgtt tttagaaagc tttagaagc caagggacaa caagggacaa 480 480 gctaagatag gctaagatag ggcccaagta ggcccaagta atgctagtat atgctagtat ttacatttat ttacatttat ccacacaaaa ccacacaaaa cggacgggcc cggacggggcc 540 540 tccgctgaac tccgctgaac cagtgaggcc cagtgaggcc ccagacgtgc ccagacgtgc gcataaataa gcataaataa cccctgcgtg cccctgcgtg ctgcaccacc ctgcaccacc 600 600 tggggagagg tggggagagg gggaggacca ggggagacca cggtaaatgg cggtaaatgg agcgagcgca agcgagcgca tagcaaaagg tagcaaaagg gacgcggggt gacgcggggt 660 660 ccttttctct ccttttctct gccggtggca gccggtggca ctgggtagct ctggggtagct gtggccaggt gtggccaggt gtggtacttt gtggtacttt gatggggccc gatggggccc 720 720 agggctggag aggggctggag ctcaaggaag ctcaaggaag cgtcgcaggg cgtcgcaggg tcacagatct tcacagatct gggggaaccc gggggaaccc cggggaaaag cggggaaaag 780 780 cactgaggca cactgaggca aaaccgccgc aaaccgccgc tcgtctccta tcgtctccta caatatatgg caatatatgg gagggggagg gagggggagg ttgagtacgt ttgagtacgt 840 840 tctggattac tctggattac tcataagacc tcataagacc tttttttttt tttttttttt ccttccgggc ccttccggggc gcaaaaccgt gcaaaaccgt gagctggatt gagctggatt 900 900 tataatcgcc tataatcgcc ctataaagct ctataaagct ccagaggcgg ccagaggcgg tcaggcacct tcaggcacct gcagaggagc gcagaggagc cccgccgctc cccgccgctc 960 960 cgccgactag cgccgactag ctgcccccgc ctgcccccgc gagcaacggc gagcaacggc ctcgtgattt ctcgtgattt ccccgccgat ccccgccgat ccggtccccg ccggtccccg 1020 1020 cctccccact cctccccact ctgcccccgc ctgcccccgc ctaccccgga ctaccccgga gccgtgcagc gccgtgcagc cgcctctccg cgcctctccg aatctctctc aatctctctc 1080 1080 ttctcctggc ttctcctggc gctcgcgtgc gctcgcgtgc gagagggaac gagagggaac tagcgagaac tagcgagaac gaggaagcag gaggaagcag ctggaggtga ctggaggtga 1140 1140 cgccgggcag cgccggggcag attacgcctg attacgcctg tcagggccga tcaggggccga gccgagcgga gccgagcgga tcgctgggcg tcgctgggcg ctgtgcagag ctgtgcagag 1200 1200 gaaaggcggg gaaaggcggg agtgcccggc agtgcccggc tcgctgtcgc tcgctgtcgc agagccgagg agagccgagg tgggtaagct tgggtaagct agcgaccacc agcgaccacc 1260 1260 tggacttccc tggacttccc agcgcccaac agcgcccaac cgtggctttt cgtggctttt cagccaggtc cagccaggtc ctctcctccc ctctcctccc gcggcttctc gcggcttctc 1320 1320 aaccaacccc aaccaacccc atcccagcgc atcccagcgc cggccaccca cggccaccca acctcccgaa acctcccgaa atgagtgctt atgagtgctt cctgccccag cctgccccag 1380 1380 cagccgaagg cagccgaagg cgctactagg cgctactagg aacggtaacc aacggtaacc tgttactttt tgttactttt ccaggggccg ccaggggccg tagtcgaccc tagtcgaccc 1440 1440 gctgcccgag gctgcccgag ttgctgtgcg ttgctgtgcg actgcgcgcg actgcgcgcg cggggctaga cggggctaga gtgcaaggtg gtgcaaggtg actgtggttc actgtggttc 1500 1500 ttctctggcc ttctctggcc aagtccgagg aagtccgagg gagaacgtaa gagaacgtaa agatatgggc agatatggggc ctttttcccc ctttttcccc ctctcacctt ctctcacctt 1560 1560 gtctcaccaa gtctcaccaa agtccctagt agtccctagt ccccggagca ccccggagca gttagcctct gttagcctct ttctttccag ttctttccag ggaattagcc ggaattagcc 1620 1620

- 124 046157- 124 046157

agacacaaca agacacaaca acgggaacca acgggaacca gacaccgaac gacaccgaac cagacatgcc cagacatgcc cgccccgtgc cgccccgtgc gccctccccg gccctccccg 1680 1680 ctcgctgcct ctcgctgcct ttcctccctc ttcctccctc ttgtctctcc ttgtctctcc agagccggat agagccggat cttcaagggg cttcaagggg agcctccgtg agcctccgtg 1740 1740 cccccggctg cccccggctg ctcagtccct ctcagtccct ccggtgtgca ccggtgtgca ggaccccgga ggaccccgga agtcctcccc agtcctcccc gcacagctct gcacagctct 1800 1800 cgcttctctt cgcttctctt tgcagcctgt tgcagcctgt ttctgcgccg ttctgcgccg gaccagtcga gaccagtcga ggactctgga ggactctgga cagtagaggc cagtagaggc 1860 1860 cccgggacga cccggggacga ccgagctg ccgagctg 1878 1878

<210> 4 <211> 509 <212> ДНК <213> Искусственная последовательность <220><210> 4 <211> 509 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 4 gccctctagg ccacctgacc aggtcccctc agtccccccc ttcccacact cccacactca60 gcccccctcc cccccccccg acccctgcag gattatcctg tctgtgttcc tgactcagcc120 tgggagccac ctgggcagca ggggccaagg gtgtcctaga agggacctgg agtccacgct180 gggccaagcc tgccctttct ccctctgtct tccgtccctg cttgcggttc tgctgaatgt240 ggttatttct ctggctcctt ttacagagaa tgctgctgct aattttatgt ggagctctga300 ggcagtgtaa ttggaagcca gacaccctgt cagcagtggg ctcccgtcct gagctgccat360 gcttcctgct ctcctcccgt cccggctcct catttcatgc agccacctgt cccagggaga420 gaggagtcac ccaggcccct cagtccgccc cttaaataag aaagcctccg ttgctcggca480 cacataccaa gcagccgctg gtgcaatct509 <210> 5 <211> 1644 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic polynucleotide <400> 4 gccctctagg ccacctgacc aggtcccctc agtccccccc ttcccacact cccacactca60 gcccccctcc cccccccccg acccctgcag gattatcctg tctgtgttcc tgactcagcc120 tgggagccac ctgggcagca ggggccaagg g tgtcctaga agggacctgg agtccacgct180 gggccaagcc tgccctttct ccctctgtct tccgtccctg cttgcggttc tgctgaatgt240 ggttatttct ctggctcctt ttacagagaa tgctgctgct aattttatgt ggagctctga300 ggcagtgtaa ttggaagcca g acaccctgt cagcagtggg ctcccgtcct gagctgccat360 gcttcctgct ctcctcccgt cccggctcct catttcatgc agccacctgt cccagggaga420 gaggagtcac ccaggcccct cagtccgccc cttaaataag aaagcctccg ttgctcggca480 cacataccaa gcagccgctg gtgcaatct509 <210> 5 <211> 1644 <212> DNA <2 13> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 5 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt60 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca120 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc180 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta240 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac300 catgggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac360<223> Description of the artificial sequence: Synthetic polynucleotide <400> 5 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt60 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca120 atgggtggag tatttacggt aaactgccca cttgg cagta catcaagtgt atcatatgcc180 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta240 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac300 catgggtcga ggtgagcccc acgttctgct tcactctccc catctcc cccccctccccac360

- 125 046157- 125 046157

ccccaatttt ccccaatttt gtatttattt gtatttattt attttttaat attttttaat tattttgtgc tattttgtgc agcgatgggg agcgatgggg gcgggggggg gcgggggggg 420 420 ggggggcgcg ggggggcgcg cgccaggcgg cgccaggcgg ggcggggcgg ggcggggcgg ggcgaggggc ggcgaggggc ggggcggggc ggggcggggc gaggcggaga gagggggaga 480 480 ggtgcggcgg ggtgcggcgg cagccaatca cagccaatca gagcggcgcg gagcggcgcg ctccgaaagt ctccgaaagt ttccttttat ttccttttat ggcgaggcgg ggcgaggcgg 540 540 cggcggcggc cggcggcggc ggccctataa ggccctataa aaagcgaagc aaagcgaagc gcgcggcggg gcgcggcggg cgggagtcgc cggggagtcgc tgcgttgcct tgcgttgcct 600 600 tcgccccgtg tcgccccgtg ccccgctccg ccccgctccg cgccgcctcg cgccgcctcg cgccgcccgc cgccgcccgc cccggctctg cccggctctg actgaccgcg actgaccgcg 660 660 ttactcccac ttactcccac aggtgagcgg aggtgagcgg gcgggacggc gcgggacggc ccttctcctc ccttctcctc cgggctgtaa cggggctgtaa ttagcgcttg ttagcgcttg 720 720 gtttaatgac gtttaatgac ggctcgtttc ggctcgtttc ttttctgtgg ttttctgtgg ctgcgtgaaa ctgcgtgaaa gccttaaagg gccttaaagg gctccgggag gctccggggag 780 780 ggccctttgt ggccctttgt gcggggggga gcggggggga gcggctcggg gcggctcggg gggtgcgtgc gggtgcgtgc gtgtgtgtgt gtgtgtgtgt gcgtggggag gcgtggggag 840 840 cgccgcgtgc cgccgcgtgc ggcccgcgct ggcccgcgct gcccggcggc gccccggcggc tgtgagcgct tgtgagcgct gcgggcgcgg gcgggcgcgg cgcggggctt cgcggggctt 900 900 tgtgcgctcc tgtgcgctcc gcgtgtgcgc gcgtgtgcgc gaggggagcg gagggagcg cggccggggg cggccggggg cggtgccccg cggtgccccg cggtgcgggg cggtgcgggg 960 960 gggctgcgag gggctgcgag gggaacaaag gggaacaaag gctgcgtgcg gctgcgtgcg gggtgtgtgc gggtgtgtgc gtgggggggt gtggggggggt gagcaggggg gagcagggggg 1020 1020 tgtgggcgcg tgtgggcgcg gcggtcgggc gcggtcgggc tgtaaccccc tgtaacccc ccctgcaccc ccctgcaccc ccctccccga ccctccccga gttgctgagc gttgctgagc 1080 1080 acggcccggc acggcccggc ttcgggtgcg ttcgggtgcg gggctccgtg gggctccgtg cggggcgtgg cggggcgtgg cgcggggctc cgcggggctc gccgtgccgg gccgtgccgg 1140 1140 gcggggggtg gcggggggtg gcggcaggtg gcggcaggtg ggggtgccgg ggggtgccgg gcggggcggg gcggggcggg gccgcctcgg gccgcctcgg gccggggagg gccggggagg 1200 1200 gctcggggga gctcggggga ggggcgcggc ggggcgcggc ggccccggag ggccccggag cgccggcggc cgccggcggc tgtcgaggcg tgtcgaggcg cggcgagccg cggcgagccg 1260 1260 cagccattgc cagccattgc cttttatggt cttttatggt aatcgtgcga aatcgtgcga gagggcgcag gagggcgcag ggacttcctt ggacttcctt tgtcccaaat tgtcccaaat 1320 1320 ctggcggagc ctggcggagc cgaaatctgg cgaaatctgg gaggcgccgc gagggcgccgc cgcaccccct cgcaccccct ctagcgggcg ctagcggggcg cgggcgaagc cggggcgaagc 1380 1380 ggtgcggcgc ggtgcggcgc cggcaggaag cggcaggaag gaaatgggcg gaaatggggcg gggagggcct ggggagggcct tcgtgcgtcg tcgtgcgtcg ccgcgccgcc ccgcgccgcc 1440 1440 gtccccttct gtccccttct ccatctccag ccatctccag cctcggggct cctcggggct gccgcagggg gccgcagggg gacggctgcc gacggctgcc ttcggggggg ttcgggggggg 1500 1500 acggggcagg acggggcagg gcggggttcg gcggggttcg gcttctggcg gcttctggcg tgtgaccggc tgtgaccggc ggctctagag ggctctagag cctctgctaa cctctgctaa 1560 1560 ccatgttcat ccatgttcat gccttcttct gccttcttct ttttcctaca ttttcctaca gctcctgggc gctcctggggc aacgtgctgg aacgtgctgg ttgttgtgct ttgttgtgct 1620 1620 gtctcatcat gtctcatcat tttggcaaag tttggcaaag aatt aatt 1644 1644

<210> 6 <211> 1335 <212> ДНК <213> Искусственная последовательность <220><210> 6 <211> 1335 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 6<223> Description of artificial sequence: Synthetic polynucleotide <400> 6

gagtaattca gagtaattca tacaaaagga tacaaaagga ctcgcccctg ctcgcccctg ccttggggaa ccttggggaa tcccagggac tccaggac cgtcgttaaa cgtcgttaaa 60 60 ctcccactaa ctccacctaa cgtagaaccc cgtagaaccc agagatcgct agagatcgct gcgttcccgc gcgttcccgc cccctcaccc cccctcaccc gcccgctctc gcccgctctc 120 120 gtcatcactg gtcatcactg aggtggagaa aggtggagaa gagcatgcgt gagcatgcgt gaggctccgg gaggctccgg tgcccgtcag tgcccgtcag tgggcagagc tgggcagagc 180 180 gcacatcgcc gcacatcgcc cacagtcccc cacagtcccc gagaagttgg gagaagttgg ggggaggggt ggggaggggt cggcaattga cggcaattga accggtgcct accggtgcct 240 240

- 126 046157- 126 046157

agagaaggtg agagaaggtg gcgcggggta gcgcggggta aactgggaaa aactgggaaa gtgatgtcgt gtgatgtcgt gtactggctc gtactggctc cgcctttttc cgcctttttc 300 300 ccgagggtgg ccgaggtgg gggagaaccg gggagaaccg tatataagtg tatataagtg cagtagtcgc cagtagtcgc cgtgaacgtt cgtgaacgtt ctttttcgca ctttttcgca 360 360 acgggtttgc acgggtttgc cgccagaaca cgccagaaca caggtaagtg caggtaagtg ccgtgtgtgg ccgtgtgtgg ttcccgcggg ttcccgcggg cctggcctct cctggcctct 420 420 ttacgggtta ttacggggtta tggcccttgc tggcccttgc gtgccttgaa gtgccttgaa ttacttccac ttacttccac gcccctggct gcccctggct gcagtacgtg gcagtacgtg 480 480 attcttgatc attcttgatc ccgagcttcg ccgagcttcg ggttggaagt ggttggaagt gggtgggaga gggtggggaga gttcgaggcc gttcgaggcc ttgcgcttaa ttgcgcttaa 540 540 ggagcccctt ggagcccctt cgcctcgtgc cgcctcgtgc ttgagttgag ttgagttgag gcctggcttg gcctggcttg ggcgctgggg ggcgctgggg ccgccgcgtg ccgccgcgtg 600 600 cgaatctggt cgaatctggt ggcaccttcg ggcaccttcg cgcctgtctc cgcctgtctc gctgctttcg gctgctttcg ataagtctct ataagtctct agccatttaa agccattaa 660 660 aatttttgat aatttttgat gacctgctgc gacctgctgc gacgcttttt gacgcttttt ttctggcaag ttctggcaag atagtcttgt atagtcttgt aaatgcgggc aaatgcgggc 720 720 caagatctgc caagatctgc acactggtat acactggtat ttcggttttt ttcggttttt ggggccgcgg ggggccgcgg gcggcgacgg gcggcgacgg ggcccgtgcg ggcccgtgcg 780 780 tcccagcgca tccagcgca catgttcggc catgttcggc gaggcggggc gagggggggc ctgcgagcgc ctgcgagcgc ggccaccgag ggccaccgag aatcggacgg aatcggacgg 840 840 gggtagtctc gggtagtctc aagctggccg aagctggccg gcctgctctg gcctgctctg gtgcctggcc gtgcctggcc tcgcgccgcc tcgcgccgcc gtgtatcgcc gtgtatcgcc 900 900 ccgccctggg ccgccctggg cggcaaggct cggcaaggct ggcccggtcg ggcccggtcg gcaccagttg gcaccagttg cgtgagcgga cgtgagcgga aagatggccg aagatggccg 960 960 cttcccggcc cttcccggcc ctgctgcagg ctgctgcagg gagctcaaaa gagctcaaaa tggaggacgc tggagaggacgc ggcgctcggg ggcgctcggg agagcgggcg agagcggggcg 1020 1020 ggtgagtcac ggtgagtcac ccacacaaag ccacacaaag gaaaagggcc gaaaagggcc tttccgtcct tttccgtcct cagccgtcgc cagccgtcgc ttcatgtgac ttcatgtgac 1080 1080 tccacggagt tccacggagt accgggcgcc accggggcgcc gtccaggcac gtccaggcac ctcgattagt ctcgattagt tctcgagctt tctcgagctt ttggagtacg ttggagtacg 1140 1140 tcgtctttag tcgtctttag gttgggggga gttgggggga ggggttttat ggggttttat gcgatggagt gcgatggagt ttccccacac ttccccacac tgagtgggtg tgagtgggtg 1200 1200 gagactgaag gagactgaag ttaggccagc ttaggccagc ttggcacttg ttggcacttg atgtaattct atgtaattct ccttggaatt ccttggaatt tgcccttttt tgcccttttt 1260 1260 gagtttggat tttcaggtgt gagtttggat tttcaggtgt cttggttcat cgtga cttggttcat cgtga tctcaagcct tctcaagcct cagacagtgg cagacagtgg ttcaaagttt ttcaaagttt ttttcttcca ttttcttcca 1320 1335 1320 1335

<210> 7 <211> 214 <212> ДНК <213> Искусственная последовательность <220><210> 7 <211> 214 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 7 aaagagaccg gttcactgtg acagtaaaag agaccggttc actgtgagaa tgaaagagac60 cggttcactg tgatcggaaa agagaccggt tcactgtgag cggccttgaa acccagcaga120 caatgtagct cagtagaaac ccagcagaca atgtagctga atggaaaccc agcagacaat180 gtagcttcgg agaaacccag cagacaatgt agct214 <210> 8 <211> 21 <212> РНК <213> Homo sapiens<223> Description of the artificial sequence: Synthetic polynucleotide <400> 7 aaagagaccg gttcactgtg acagtaaaag agaccggttc actgtgagaa tgaaagagac60 cggttcactg tgatcggaaa agagaccggt tcactgtgag cggccttgaa acccagcaga120 caatgtagct cagtagaaac ccagcagaca atgtagctga atggaaaccc agcagacaat180 gtagcttcgg agaaacccag cagacaatgt agct214 <210> 8 <211> 21 <212> RNA <213> Homo sapiens

- 127 046157 <400> 8 ucacagugaa ccggucucuu u <210> 9 <211> 21 <212> ДНК <213> Искусственная последовательность <220>- 127 046157 <400> 8 ucacagugaa ccggucucuu u <210> 9 <211> 21 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 9 aaagagaccg gttcactgtg a 21 <210> 10 <211> 23 <212> РНК <213> Homo sapiens <400> 10 agcuacauug ucugcugggu uuc 23 <210> 11 <211> 23 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic oligonucleotide <400> 9 aaagagaccg gttcactgtg a 21 <210> 10 <211> 23 <212> RNA <213> Homo sapiens <400> 10 agcuacauug ucugcugggu uuc 23 <210> 11 <211> 23 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 11 gaaacccagc agacaatgta gct 23 <210> 12 <211> 23 <212> РНК <213> Homo sapiens <400> 12 agcuacaucu ggcuacuggg ucu <210> 13 <211> 23 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic oligonucleotide <400> 11 gaaacccagc agacaatgta gct 23 <210> 12 <211> 23 <212> RNA <213> Homo sapiens <400> 12 agcuacaucu ggcuacuggg ucu <210> 13 <211> 23 < 212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 13 agacccagta gccagatgta gct 23 <210> 14 <211> 67<223> Description of the artificial sequence: Synthetic oligonucleotide <400> 13 agaccagta gccagatgta gct 23 <210> 14 <211> 67

- 128 046157 <212> ДНК <213> Искусственная последовательность <220>- 128 046157 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 14 gaaacccagc agacaatgta gctagaccca gtagccagat gtagctaaag agaccggttc 60 actgtga 67 <210> 15 <211> 134 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic oligonucleotide <400> 14 gaaacccagc agacaatgta gctagaccca gtagccagat gtagctaaag agaccggttc 60 actgtga 67 <210> 15 <211> 134 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 15 gaaacccagc agacaatgta gctagaccca gtagccagat gtagctaaag agaccggttc60 actgtgagaa acccagcaga caatgtagct agacccagta gccagatgta gctaaagaga120 ccggttcact gtga134 <210> 16 <211> 62 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic polynucleotide <400> 15 gaaacccagc agacaatgta gctagaccca gtagccagat gtagctaaag agaccggttc60 actgtgagaa acccagcaga caatgtagct agacccagta gccagatgta gctaaagaga120 ccggttcact gtga134 <210> 16 <211 > 62 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 16 aataaaagat ctttattttc attagatctg tgtgttggtt ttttgtgtgc ggaccgcacg 60 tg 62 <210> 17 <211> 477 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic oligonucleotide <400> 16 aataaaagat ctttattttc attagatctg tgtgttggtt ttttgtgtgc ggaccgcacg 60 tg 62 <210> 17 <211> 477 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 17 gggtggcatc cctgtgaccc ctccccagtg cctctcctgg ccctggaagt tgccactcca60 gtgcccacca gccttgtcct aataaaatta agttgcatca ttttgtctga ctaggtgtcc120 ttctataata ttatggggtg gaggggggtg gtatggagca aggggcaagt tgggaagaca180 acctgtaggg cctgcggggt ctattgggaa ccaagctgga gtgcagtggc acaatcttgg240<223> Description of the artificial sequence: Synthetic polynucleotide <400> 17 gggtggcatc cctgtgaccc ctccccagtg cctctcctgg ccctggaagt tgccactcca60 gtgcccacca gccttgtcct aataaaatta agttgcatca ttttgtctga ctaggtgtcc120 ttctataata ttatggggtg gagg ggggtg gtatggagca aggggcaagt tgggaagaca180 acctgtaggg cctgcggggt ctattgggaa ccaagctgga gtgcagtggc acaatcttgg240

- 129 046157- 129 046157

ctcactgcaa ctcactgcaa tctccgcctc tctccgcctc ctgggttcaa ctggggttcaa gcgattctcc gcgattctcc tgcctcagcc tgcctcagcc tcccgagttg tcccgagttg 300 300 ttgggattcc ttggggattcc aggcatgcat aggcatgcat gaccaggctc gaccaggctc agctaatttt agctaatttt tgtttttttg tgtttttttg gtagagacgg gtagagacgg 360 360 ggtttcacca ggtttcacca tattggccag tattggccag gctggtctcc gctggtctcc aactcctaat aactcctaat ctcaggtgat ctcaggtgat ctacccacct ctaccacct 420 420 tggcctccca tggcctccca aattgctggg aattgctggg attacaggcg attacaggcg tgaaccactg tgaaccactg ctcccttccc ctcccttccc tgtcctt tgtcctt 477 477

<210> 18 <211> 18 <212> ДНК <213> Homo sapiens <400> 18 ctaggtcaag tgtaggag <210> 19 <211> 18 <212> ДНК <213> Homo sapiens <400> 19 acttgaccta gacagcct <210> 20 <211> 18 <212> ДНК <213> Homo sapiens <400> 20 tgaataactc attagtga <210> 21 <211> 18 <212> ДНК <213> Homo sapiens <400> 21 aaagtacatt aggctaat <210> 22 <211> 18 <212> ДНК <213> Homo sapiens <400> 22 ccagcactgg tgcttcgt <210> 23 <211> 18 <212> ДНК <213> Homo sapiens <400> 23 aaggctgtct aggtcaag<210> 18 <211> 18 <212> DNA <213> Homo sapiens <400> 18 ctaggtcaag tgtaggag <210> 19 <211> 18 <212> DNA <213> Homo sapiens <400> 19 acttgaccta gacagcct <210> 20 <211> 18 <212> DNA <213> Homo sapiens <400> 20 tgaataactc attagtga <210> 21 <211> 18 <212> DNA <213> Homo sapiens <400> 21 aaagtacatt aggctaat <210> 22 <211> 18 <212> DNA <213> Homo sapiens <400> 22 ccagcactgg tgcttcgt <210> 23 <211> 18 <212> DNA <213> Homo sapiens <400> 23 aaggctgtct aggtcaag

- 130 046157 <210> 24 <211> 24 <212> ДНК <213> Homo sapiens <400> 24 ctaggtcaag tgtaggagac acac <210> 25 <211> 18 <212> ДНК <213> Homo sapiens <400> 25 ggtcaagtgt aggagaca <210> 26 <211> 18 <212> ДНК <213> Homo sapiens <400> 26 caagtgtagg agacacac <210> 27 <211> 24 <212> ДНК <213> Homo sapiens <400> 27 agtgtaggag acacactgct ggcc <210> 28 <211> 18 <212> ДНК <213> Homo sapiens <400> 28 agtgtaggag acacactg <210> 29 <211> 21 <212> ДНК <213> Homo sapiens <400> 29 aggagacaca ctgctggcct g- 130 046157 <210> 24 <211> 24 <212> DNA <213> Homo sapiens <400> 24 ctaggtcaag tgtaggagac acac <210> 25 <211> 18 <212> DNA <213> Homo sapiens <400> 25 ggtcaagtgt aggagaca <210> 26 <211> 18 <212> DNA <213> Homo sapiens <400> 26 caagtgtagg agacacac <210> 27 <211> 24 <212> DNA <213> Homo sapiens <400> 27 agtgtaggag acacactgct ggcc <210> 28 <211> 18 <212> DNA <213> Homo sapiens <400> 28 agtgtaggag acacactg <210> 29 <211> 21 <212> DNA <213> Homo sapiens <400> 29 aggagacaca ctgctggcct g

<210> <210> 30 thirty <211> <211> 18 18 <212> <212> ДНК DNA <213> <213> Homo Homo

sapiens <400> 30 taggtaccat agagtgagsapiens <400> 30 taggtaccat agagtgag

- 131 046157- 131 046157

<210> <210> 31 31 <211> <211> 18 18 <212> <212> ДНК DNA <213> <213> Homo sapiens Homo sapiens <400> <400> 31 31

gaggatactg cagaggtc <210> 32 <211> 27 <212> ДНК <213> Homo sapiens <400> 32 taggtaccat agagtgaggc gaggatg <210> 33 <211> 27 <212> ДНК <213> Homo sapiens <400> 33 atagagtgag gcgaggatga agccgag <210> 34 <211> 27 <212> ДНК <213> Homo sapiens <400> 34 tgaagccgag aggatactgc agaggtc <210> 35 <211> 21 <212> ДНК <213> Homo sapiens <400> 35 aaggctgtct aggtcaagtg t <210> 36 <211> 21 <212> ДНК <213> Homo sapiens <400> 36 tgttcctcca gattaacact t <210> 37 <211> 21 <212> ДНК <213> Homo sapiens <400> 37 gatgaagccg agaggatact ggaggatactg cagaggtc <210> 32 <211> 27 <212> DNA <213> Homo sapiens <400> 32 taggtaccat agagtgaggc gaggatg <210> 33 <211> 27 <212> DNA <213> Homo sapiens <400> 33 atagagtgag gcgaggatga agccga g <210> 34 <211> 27 <212> DNA <213> Homo sapiens <400> 34 tgaagccgag aggatactgc agaggtc <210> 35 <211> 21 <212> DNA <213> Homo sapiens <400> 35 aaggctgtct aggtcaagtg t <210 > 36 <211> 21 <212> DNA <213> Homo sapiens <400> 36 tgttcctcca gattaacact t <210> 37 <211> 21 <212> DNA <213> Homo sapiens <400> 37 gatgaagccg agaggatact g

- 132 046157 <210> 38 <211> 21 <212> ДНК <213> Homo sapiens <400> 38 gctgatttgt attaggtacc a <210> 39 <211> 21 <212> ДНК <213> Homo sapiens <400> 39 agaaagctga tacagataca a <210> 40 <211> 21 <212> ДНК <213> Homo sapiens <400> 40 ggtacgggca aagatttctt g <210> 41 <211> 21 <212> ДНК <213> Homo sapiens <400> 41 agaaagctga tacagataca a <210> 42 <211> 21 <212> ДНК <213> Homo sapiens <400> 42 acacaatgag ccacctacaa g <210> 43 <211> 21 <212> ДНК <213> Homo sapiens <400> 43 gtggctcatt gtgtgtgtgc c <210> 44 <211> 21 <212> ДНК <213> Homo sapiens <400> 44 catatccctg caggttcaga a- 132 046157 <210> 38 <211> 21 <212> DNA <213> Homo sapiens <400> 38 gctgatttgt attaggtacc a <210> 39 <211> 21 <212> DNA <213> Homo sapiens <400> 39 agaaagctga tacagataca a <210> 40 <211> 21 <212> DNA <213> Homo sapiens <400> 40 ggtacgggca aagatttctt g <210> 41 <211> 21 <212> DNA <213> Homo sapiens <400> 41 agaaagctga tacagataca a < 210> 42 <211> 21 <212> DNA <213> Homo sapiens <400> 42 acacaatgag ccacctacaa g <210> 43 <211> 21 <212> DNA <213> Homo sapiens <400> 43 gtggctcatt gtgtgtgtgc c <210> 44 <211> 21 <212> DNA <213> Homo sapiens <400> 44 catatccctg caggttcaga a

- 133 046157 <210> 45 <211> 21 <212> ДНК <213> Homo sapiens <400> 45 agagagagag agagagagag a <210> 46 <211> 21 <212> ДНК <213> Homo sapiens <400> 46 ttctcagttt tgaaattaaa a <210> 47 <211> 21 <212> ДНК <213> Homo sapiens <400> 47 tggattctct tctgaacctg c <210> 48 <211> 21 <212> ДНК <213> Homo sapiens <400> 48 tgctgaggca ggacacagtg t <210> 49 <211> 21 <212> ДНК <213> Homo sapiens <400> 49 atcatctgta accatcaagg a <210> 50 <211> 21 <212> ДНК <213> Homo sapiens <400> 50 tcctgcctac ttagtttcaa g <210> 51 <211> 21 <212> ДНК <213> Homo sapiens <400> 51 attacagttc tgtcagcatg c- 133 046157 <210> 45 <211> 21 <212> DNA <213> Homo sapiens <400> 45 agagagagag agagagagag a <210> 46 <211> 21 <212> DNA <213> Homo sapiens <400> 46 ttctcagttt tgaaattaaa a <210> 47 <211> 21 <212> DNA <213> Homo sapiens <400> 47 tggattctct tctgaacctg c <210> 48 <211> 21 <212> DNA <213> Homo sapiens <400> 48 tgctgaggca ggacacagtg t < 210> 49 <211> 21 <212> DNA <213> Homo sapiens <400> 49 atcatctgta accatcaagg a <210> 50 <211> 21 <212> DNA <213> Homo sapiens <400> 50 tcctgcctac ttagtttcaa g <210> 51 <211> 21 <212> DNA <213> Homo sapiens <400> 51 attacagttc tgtcagcatg c

- 134 046157 <210> 52 <211> 21 <212> ДНК <213> Homo sapiens <400> 52 tggtctcatt ctttttgtgg g <210> 53 <211> 21 <212> ДНК <213> Homo sapiens <400> 53 cgatattttc atggattcct t <210> 54 <211> 21 <212> ДНК <213> Homo sapiens <400> 54 ctgacactta ctttgtctaa a <210> 55 <211> 21 <212> ДНК <213> Homo sapiens <400> 55 aaaactggaa ccgcattccc a <210> 56 <211> 21 <212> ДНК <213> Homo sapiens <400> 56 acaaagtaag tgtcagtgtg g <210> 57 <211> 21 <212> ДНК <213> Homo sapiens <400> 57 ataatagttg tgtctttata a <210> 58 <211> 21 <212> ДНК <213> Homo sapiens <400> 58 tgtacaagca gggctgcaaa g- 134 046157 <210> 52 <211> 21 <212> DNA <213> Homo sapiens <400> 52 tggtctcatt ctttttgtgg g <210> 53 <211> 21 <212> DNA <213> Homo sapiens <400> 53 cgatattttc atggattcct t <210> 54 <211> 21 <212> DNA <213> Homo sapiens <400> 54 ctgacactta ctttgtctaa a <210> 55 <211> 21 <212> DNA <213> Homo sapiens <400> 55 aaaactggaa ccgcattccc a < 210> 56 <211> 21 <212> DNA <213> Homo sapiens <400> 56 acaaagtaag tgtcagtgtg g <210> 57 <211> 21 <212> DNA <213> Homo sapiens <400> 57 aatagttg tgtcttttata a <210> 58 <211> 21 <212> DNA <213> Homo sapiens <400> 58 tgtacaagca gggctgcaaa g

- 135 046157 <210> 59 <211> 21 <212> ДНК <213> Homo sapiens <400> 59 gttaacaaat acactaaaca c <210> 60 <211> 21 <212> ДНК <213> Homo sapiens <400> 60 ttcaacaagc tcccaagaag t <210> 61 <211> 21 <212> ДНК <213> Homo sapiens <400> 61 atgttcaagg tgcagaagga a <210> 62 <211> 21 <212> ДНК <213> Homo sapiens <400> 62 tgtttgctca aacgtgcacc a <210> 63 <211> 21 <212> ДНК <213> Homo sapiens <400> 63 aaataagaca tgaaaacaag a <210> 64 <211> 21 <212> ДНК <213> Homo sapiens <400> 64 aaatatgtac cacaagaaat g <210> 65 <211> 21 <212> ДНК <213> Homo sapiens <400> 65 tatctggttt ctctcactgc t- 135 046157 <210> 59 <211> 21 <212> DNA <213> Homo sapiens <400> 59 gttaacaaat acactaaaca c <210> 60 <211> 21 <212> DNA <213> Homo sapiens <400> 60 ttcaacaagc tcccaagaag t <210> 61 <211> 21 <212> DNA <213> Homo sapiens <400> 61 atgttcaagg tgcagaagga a <210> 62 <211> 21 <212> DNA <213> Homo sapiens <400> 62 tgtttgctca aacgtgcacc a < 210> 63 <211> 21 <212> DNA <213> Homo sapiens <400> 63 aaataagaca tgaaaacaag a <210> 64 <211> 21 <212> DNA <213> Homo sapiens <400> 64 aaatatgtac cacaagaaat g <210> 65 <211> 21 <212> DNA <213> Homo sapiens <400> 65 tatctggttt ctctcactgc t

- 136 046157 <210> 66 <211> 21 <212> ДНК <213> Homo sapiens <400> 66 attgcaaagc ataatttgga t <210> 67 <211> 3585 <212> ДНК <213> Искусственная последовательность <220>- 136 046157 <210> 66 <211> 21 <212> DNA <213> Homo sapiens <400> 66 attgcaaagc aatttgga t <210> 67 <211> 3585 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид<223> Description of artificial sequence: Synthetic polynucleotide

<400> 67 ggaggaagcc <400> 67 ggaggaagcc atcaactaaa atcaactaaa ctacaatgac ctacaatgac tgtaagatac tgtaagatac aaaattggga aaaattggga atggtaacat atggtaacat 60 60 attttgaagt attttgaagt tctgttgaca tctgttgaca taaagaatca taaagaatca tgatattaat tgatattaat gcccatggaa gcccatggaa atgaaagggc atgaaagggc 120 120 gatcaacact gatcaacact atggtttgaa atggtttgaa aagggggaaa aagggggaaa ttgtagagca ttgtagagca cagatgtgtt cagatgtgtt cgtgtggcag cgtgtggcag 180 180 tgtgctgtct tgtgctgtct ctagcaatac ctagcaatac tcagagaaga tcagagaaga gagagaacaa gagagaacaa tgaaattctg tgaaattctg attggcccca attggcccca 240 240 gtgtgagccc gtgtgagccc agatgaggtt agatgaggtt cagctgccaa cagctgccaa ctttctcttt ctttctcttt cacatcttat cacatcttat gaaagtcatt gaaagtcatt 300 300 taagcacaac taagcacaac taactttttt taactttttt tttttttttt tttttttttt tttttttgag tttttttgag acagagtctt acagagtctt gctctgttgc gctctgttgc 360 360 ccaggacaga ccaggacaga gtgcagtagt gtgcagtagt gactcaatct gactcaatct cggctcactg cggctcactg cagcctccac cagcctccac ctcctaggct ctcctaggct 420 420 caaacggtcc caaacggtcc tcctgcatca tcctgcatca gcctcccaag gcctcccaag tagctggaat tagctggaat tacaggagtg tacaggagtg gcccaccatg gccccacatg 480 480 cccagctaat cccagctaat ttttgtattt ttttgtattt ttaatagata ttaatagata cgggggtttc cggggggtttc accatatcac accatatcac ccaggctggt ccaggctggt 540 540 ctcgaactcc ctcgaactcc tggcctcaag tggcctcaag tgatccacct tgatccacct gcctcggcct gcctcggcct cccaaagtgc cccaaagtgc tgggattata tggggattata 600 600 ggcgtcagcc ggcgtcagcc actatgccca actatgccca acccgaccaa acccgaccaa ccttttttaa ccttttttaa aataaatatt aataaatatt taaaaaattg taaaaaattg 660 660 gtatttcaca gtatttcaca tatatactag tatatactag tatttacatt tatttacatt tatccacaca tatccacaca aaacggacgg aaacggacgg gcctccgctg gcctccgctg 720 720 aaccagtgag aaccagtgag gccccagacg gccccagacg tgcgcataaa tgcgcataaa taacccctgc taacccctgc gtgctgcacc gtgctgcacc acctggggag acctggggag 780 780 agggggagga agggggga ccacggtaaa ccacggtaaa tggagcgagc tggagcgagc gcatagcaaa gcatagcaaa agggacgcgg agggacgcgg ggtccttttc ggtccttttc 840 840 tctgccggtg tctgccggtg gcactgggta gcactgggta gctgtggcca gctgtggcca ggtgtggtac ggtgtggtac tttgatgggg tttgatgggg cccagggctg cccagggctg 900 900 gagctcaagg gagctcaagg aagcgtcgca aagcgtcgca gggtcacaga gggtcacaga tctgggggaa tctgggggaa ccccggggaa ccccggggaa aagcactgag aagcactgag 960 960 gcaaaaccgc gcaaaaccgc cgctcgtctc cgctcgtctc ctacaatata ctacaatata tgggaggggg tgggggggg aggttgagta aggttgagta cgttctggat cgttctggat 1020 1020 tactcataag tactcataag accttttttt accttttttt tttccttccg tttccttccg ggcgcaaaac ggcgcaaaac cgtgagctgg cgtgagctgg atttataatc atttataatc 1080 1080 gccctataaa gccctataaa gctccagagg gctccagagg cggtcaggca cggtcaggca cctgcagagg cctgcagagg agccccgccg agccccgccg ctccgccgac ctccgccgac 1140 1140 tagctgcccc tagctgcccc cgcgagcaac cgcgagcaac ggcctcgtga ggcctcgtga tttccccgcc tttccccgcc gatccggtcc gatccggtcc ccgcctcccc ccgcctcccc 1200 1200 actctgcccc actctgcccc cgcctacccc cgcctacccc ggagccgtgc ggagccgtgc agccgcctct agccgcctct ccgaatctct ccgaatctct ctcttctcct ctcttctcct 1260 1260 ggcgctcgcg ggcgctcgcg tgcgagaggg tgcgagagg aactagcgag aactagcgag aacgaggaag aacgaggaag cagctggagg cagctggagg tgacgccggg tgacgccggg 1320 1320

- 137 046157- 137 046157

cagattacgc cagattacgc ctgtcagggc ctgtcagggc cgagccgagc cgagccgagc ggatcgctgg ggatcgctgg gcgctgtgca gcgctgtgca gaggaaaggc gaggaaaggc 1380 1380 gggagtgccc ggggagtgccc ggctcgctgt ggctcgctgt cgcagagccg cgcagagccg aggtgggtaa aggtgggtaa gctagcgacc gctagcgacc acctggactt acctggactt 1440 1440 cccagcgccc cccagcgccc aaccgtggct aaccgtggct tttcagccag tttcagccag gtcctctcct gtcctctcct cccgcggctt cccgcggctt ctcaaccaac ctcaaccaac 1500 1500 cccatcccag cccaccag cgccggccac cgccggccac ccaacctccc ccaacctccc gaaatgagtg gaaatgagtg cttcctgccc cttcctgccc cagcagccga cagcagccga 1560 1560 aggcgctact aggcgctact aggaacggta aggaacggta acctgttact acctgttact tttccagggg tttccagggg ccgtagtcga ccgtagtcga cccgctgccc cccgctgccc 1620 1620 gagttgctgt gagttgctgt gcgactgcgc gcgactgcgc gcgcggggct gcgcggggct agagtgcaag agagtgcaag gtgactgtgg gtgactgtgg ttcttctctg ttcttctctg 1680 1680 gccaagtccg gccaagtccg agggagaacg aggggagaacg taaagatatg taaagatatg ggcctttttc ggcctttttc cccctctcac cccctctcac cttgtctcac cttgtctcac 1740 1740 caaagtccct caaagtccct agtccccgga agtccccgga gcagttagcc gcagttagcc tctttctttc tctttctttc cagggaatta cagggaatta gccagacaca gccagacaca 1800 1800 acaacgggaa acaacgggaa ccagacaccg ccagacaccg aaccagacat aaccagacat gcccgccccg gcccgccccg tgcgccctcc tgcgccctcc ccgctcgctg ccgctcgctg 1860 1860 cctttcctcc cctttcctcc ctcttgtctc ctcttgtctc tccagagccg tccagagccg gatcttcaag gatcttcaag gggagcctcc gggagcctcc gtgcccccgg gtgcccccgg 1920 1920 ctgctcagtc ctgctcagtc cctccggtgt cctccggtgt gcaggacccc gcaggacccc ggaagtcctc ggaagtcctc cccgcacagc cccgcacagc tctcgcttct tctcgcttct 1980 1980 ctttgcagcc ctttgcagcc tgtttctgcg tgtttctgcg ccggaccagt ccggaccagt cgaggactct cgaggactct ggacagtaga ggacagtaga ggccccggga ggccccggga 2040 2040 cgaccgagct cgaccgagct ggaattcgcc ggaattcgcc accatggccc accatggccc caaagaagaa caaagaagaa gcggaaggtc gcggaaggtc ggtatccacg ggtatccacg 2100 2100 gagtcccagc gagtcccagc agccctcgaa agccctcgaa ccaggtgaaa ccaggtgaaa aaccttacaa aaccttacaa atgtcctgaa atgtcctgaa tgtgggaaat tgtgggaaat 2160 2160 cattcagtcg cattcagtcg cagcgacaac cagcgacaac ctggtgagac ctggtgagac atcaacgcac atcaacgcac ccatacagga ccacagga gaaaaacctt gaaaaacctt 2220 2220 ataaatgtcc aaaatgtcc agaatgtgga agaatgtgga aagtccttct aagtccttct cacgagagga cacgagga taacttgcac taacttgcac actcatcaac actcatcaac 2280 2280 gaacacatac gaacacatac tggtgaaaaa tggtgaaaaa ccatacaagt catacaagt gtcccgaatg gtcccgaatg tggtaaaagt tggtaaaagt tttagccgga tttagccgga 2340 2340 gcgatgaact gcgatgaact tgtccgacac tgtccgacac caacgaaccc caacgaaccc atacaggcga atacaggcga gaagccttac gaagccttac aaatgtcccg aaatgtcccg 2400 2400 agtgtggcaa agtgtggcaa gagcttctca gagcttctca caatcaggga caatcaggga atctgactga atctgactga gcatcaacga gcatcaacga actcataccg actcataccg 2460 2460 gggaaaaacc gggaaaaacc ttacaagtgt ttacaagtgt ccagagtgtg ccagagtgtg ggaagagctt ggaagagctt ttccacaagt ttccacaagt ggacatctgg ggacatctgg 2520 2520 tacgccacca tacgccacca gaggacacat gaggacacat acaggggaga acaggggaga agccctacaa agccctacaa atgccccgaa atgccccgaa tgcggtaaaa tgcggtaaaa 2580 2580 gtttctctca gtttctctca gaatagtacc gaatagtacc ctgaccgaac ctgaccgaac accagcgaac accagcgaac acacactggg acacactggg aaaaaaacga aaaaaaacga 2640 2640 gtaaaaggcc gtaaaaggcc ggcggccacg ggcggccacg aaaaaggccg aaaaaggccg gccaggcaaa gccaggcaaa aaagaaaaag aaagaaaaag ggatcctacc ggatcctacc 2700 2700 catacgacgt catacgacgt accagattac accagattac gctctcgagg gctctcgagg acgcgctgga acgcgctgga cgatttcgat cgatttcgat ctcgacatgc ctcgacatgc 2760 2760 tgggttctga tggggttctga tgccctcgat tgccctcgat gactttgacc gactttgacc tggatatgtt tggatatgtt gggaagcgac gggaagcgac gcattggatg gcattggatg 2820 2820 actttgatct actttgatct ggacatgctc ggacatgctc ggctccgatg ggctccgatg ctctggacga ctctggacga tttcgatctc tttcgatctc gatatgttat gatatgttat 2880 2880 aaactagtaa aaactagtaa agagaccggt agagaccggt tcactgtgac tcactgtgac agtaaaagag agtaaaagag accggttcac accggttcac tgtgagaatg tgtgagaatg 2940 2940 aaagagaccg aaagagaccg gttcactgtg gttcactgtg atcggaaaag atcggaaaag agaccggttc agaccggttc actgtgagcg actgtgagcg gccttgaaac gccttgaaac 3000 3000 ccagcagaca ccagcagaca atgtagctca atgtagctca gtagaaaccc gtagaaaccc agcagacaat agcagacaat gtagctgaat gtagctgaat ggaaacccag ggaaacccag 3060 3060 cagacaatgt cagacaatgt agcttcggag agcttcggag aaacccagca aaacccagca gacaatgtag gacaatgtag ctaagcttgg ctaagcttgg gtggcatccc gtggcatccc 3120 3120 tgtgacccct tgtgacccct ccccagtgcc ccccagtgcc tctcctggcc tctcctggcc ctggaagttg ctggaagttg ccactccagt ccactccagt gcccaccagc gccccaccagc 3180 3180 cttgtcctaa cttgtcctaa taaaattaag taaaattaag ttgcatcatt ttgcatcatt ttgtctgact ttgtctgact aggtgtcctt aggtgtcctt ctataatatt ctataattatt 3240 3240

- 138 046157- 138 046157

atggggtgga atggggtgga ggggggtggt ggggggtggt atggagcaag atggagcaag gggcaagttg gggcaagttg ggaagacaac ggaagacaac ctgtagggcc ctgtagggcc 3300 3300 tgcggggtct tgcggggtct attgggaacc attgggaacc aagctggagt aagctggagt gcagtggcac gcagtggcac aatcttggct aatcttggct cactgcaatc cactgcaatc 3360 3360 tccgcctcct tccgcctcct gggttcaagc gggttcaagc gattctcctg gattctcctg cctcagcctc cctcagcctc ccgagttgtt ccgagttgtt gggattccag gggattccag 3420 3420 gcatgcatga gcatgcatga ccaggctcag ccaggctcag ctaatttttg ctaatttttg tttttttggt tttttttggt agagacgggg agagacgggg tttcaccata tttcaccata 3480 3480 ttggccaggc ttggccaggc tggtctccaa tggtctccaa ctcctaatct ctcctaatct caggtgatct caggtgatct acccaccttg acccaccttg gcctcccaaa gcctcccaaa 3540 3540 ttgctgggat ttgctgggat tacaggcgtg tacaggcgtg aaccactgct aaccactgct cccttccctg cccttccctg tcctt tcctt 3585 3585

<210> 68 <211> 3371 <212> ДНК <213> Искусственная последовательность <220><210> 68 <211> 3371 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид<223> Description of artificial sequence: Synthetic polynucleotide

<400> 68 ggaggaagcc <400> 68 ggaggaagcc atcaactaaa atcaactaaa ctacaatgac ctacaatgac tgtaagatac tgtaagatac aaaattggga aaaattggga atggtaacat atggtaacat 60 60 attttgaagt attttgaagt tctgttgaca tctgttgaca taaagaatca taaagaatca tgatattaat tgatattaat gcccatggaa gcccatggaa atgaaagggc atgaaagggc 120 120 gatcaacact gatcaacact atggtttgaa atggtttgaa aagggggaaa aagggggaaa ttgtagagca ttgtagagca cagatgtgtt cagatgtgtt cgtgtggcag cgtgtggcag 180 180 tgtgctgtct tgtgctgtct ctagcaatac ctagcaatac tcagagaaga tcagagaaga gagagaacaa gagagaacaa tgaaattctg tgaaattctg attggcccca attggcccca 240 240 gtgtgagccc gtgtgagccc agatgaggtt agatgaggtt cagctgccaa cagctgccaa ctttctcttt ctttctcttt cacatcttat cacatcttat gaaagtcatt gaaagtcatt 300 300 taagcacaac taagcacaac taactttttt taactttttt tttttttttt tttttttttt tttttttgag tttttttgag acagagtctt acagagtctt gctctgttgc gctctgttgc 360 360 ccaggacaga ccaggacaga gtgcagtagt gtgcagtagt gactcaatct gactcaatct cggctcactg cggctcactg cagcctccac cagcctccac ctcctaggct ctcctaggct 420 420 caaacggtcc caaacggtcc tcctgcatca tcctgcatca gcctcccaag gcctcccaag tagctggaat tagctggaat tacaggagtg tacaggagtg gcccaccatg gccccacatg 480 480 cccagctaat cccagctaat ttttgtattt ttttgtattt ttaatagata ttaatagata cgggggtttc cggggggtttc accatatcac accatatcac ccaggctggt ccaggctggt 540 540 ctcgaactcc ctcgaactcc tggcctcaag tggcctcaag tgatccacct tgatccacct gcctcggcct gcctcggcct cccaaagtgc cccaaagtgc tgggattata tggggattata 600 600 ggcgtcagcc ggcgtcagcc actatgccca actatgccca acccgaccaa acccgaccaa ccttttttaa ccttttttaa aataaatatt aataaatatt taaaaaattg taaaaaattg 660 660 gtatttcaca gtatttcaca tatatactag tatatactag tatttacatt tatttacatt tatccacaca tatccacaca aaacggacgg aaacggacgg gcctccgctg gcctccgctg 720 720 aaccagtgag aaccagtgag gccccagacg gccccagacg tgcgcataaa tgcgcataaa taacccctgc taacccctgc gtgctgcacc gtgctgcacc acctggggag acctggggag 780 780 agggggagga agggggga ccacggtaaa ccacggtaaa tggagcgagc tggagcgagc gcatagcaaa gcatagcaaa agggacgcgg agggacgcgg ggtccttttc ggtccttttc 840 840 tctgccggtg tctgccggtg gcactgggta gcactgggta gctgtggcca gctgtggcca ggtgtggtac ggtgtggtac tttgatgggg tttgatgggg cccagggctg cccagggctg 900 900 gagctcaagg gagctcaagg aagcgtcgca aagcgtcgca gggtcacaga gggtcacaga tctgggggaa tctgggggaa ccccggggaa ccccggggaa aagcactgag aagcactgag 960 960 gcaaaaccgc gcaaaaccgc cgctcgtctc cgctcgtctc ctacaatata ctacaatata tgggaggggg tgggggggg aggttgagta aggttgagta cgttctggat cgttctggat 1020 1020 tactcataag tactcataag accttttttt accttttttt tttccttccg tttccttccg ggcgcaaaac ggcgcaaaac cgtgagctgg cgtgagctgg atttataatc atttataatc 1080 1080 gccctataaa gccctataaa gctccagagg gctccagagg cggtcaggca cggtcaggca cctgcagagg cctgcagagg agccccgccg agccccgccg ctccgccgac ctccgccgac 1140 1140 tagctgcccc tagctgcccc cgcgagcaac cgcgagcaac ggcctcgtga ggcctcgtga tttccccgcc tttccccgcc gatccggtcc gatccggtcc ccgcctcccc ccgcctcccc 1200 1200

- 139 046157 actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260 ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg1320 cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc1380 gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt1440 cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac1500 cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga1560 aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc1620 gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg1680 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg2100 gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat2160 cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt2220 ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac2280 gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga2340 gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg2400 agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg2460 gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg2520 tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa2580 gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga2640 gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc2700 catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc2760 tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcattggatg2820 actttgatct ggacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat2880 aaactagtaa gcttgggtgg catccctgtg acccctcccc agtgcctctc ctggccctgg2940 aagttgccac tccagtgccc accagccttg tcctaataaa attaagttgc atcattttgt3000 ctgactaggt gtccttctat aatattatgg ggtggagggg ggtggtatgg agcaaggggc3060- 139 046157 actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct 1260 ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacccggg1320 cagattacgc ctgtcagggc cgagccgagc gg atcgctgg gcgctgtgca gaggaaaggc1380 gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt1440 cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac1500 cccacccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga1560 aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc1620 gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg1680 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa cgacacaccg aaccagacat gccc gccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgttt ctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg2100 gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat2160 cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt2220 ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac2280 gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgg a2340 gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg2400 agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg2460 gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg2 520 tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa2580 gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga2640 gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc2700 catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc2760 tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcattggatg2820 actttgatct g gacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat2880 aaactagtaa gcttgggtgg catccctgtg acccctcccc agtgcctctc ctggccctgg2940 aagttgccac tccagtgccc accagccttg tcctaataaa attaagttgc atcattttgt3000 ctgactaggt gtccttctat aatattatgg ggtggagggg ggtggtatgg agcaaggggc3060

- 140 046157- 140 046157

aagttgggaa aagttgggaa gacaacctgt gacaacctgt agggcctgcg agggcctgcg gggtctattg gggtctattg ggaaccaagc ggaaccaagc tggagtgcag tggagtgcag 3120 3120 tggcacaatc tggcacaatc ttggctcact ttggctcact gcaatctccg gcaatctccg cctcctgggt cctcctgggt tcaagcgatt tcaagcgatt ctcctgcctc ctcctgcctc 3180 3180 agcctcccga agcctcccga gttgttggga gttgttggga ttccaggcat ttccaggcat gcatgaccag gcatgaccag gctcagctaa gctcagctaa tttttgtttt tttttgtttt 3240 3240 tttggtagag tttggtagag acggggtttc acggggtttc accatattgg accatattgg ccaggctggt ccaggctggt ctccaactcc ctccaactcc taatctcagg taatctcagg 3300 3300 tgatctaccc tgatctacc accttggcct accttggcct cccaaattgc cccaaattgc tgggattaca tgggattaca ggcgtgaacc ggcgtgaacc actgctccct actngctccct 3360 3360 tccctgtcct tccctgtcct t t 3371 3371

<210> 69 <211> 4380 <212> ДНК <213> Искусственная последовательность <220><210> 69 <211> 4380 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид<223> Description of artificial sequence: Synthetic polynucleotide

<400> 69 ggaggaagcc <400> 69 ggaggaagcc atcaactaaa atcaactaaa ctacaatgac ctacaatgac tgtaagatac tgtaagatac aaaattggga aaaattggga atggtaacat atggtaacat 60 60 attttgaagt attttgaagt tctgttgaca tctgttgaca taaagaatca taaagaatca tgatattaat tgatattaat gcccatggaa gcccatggaa atgaaagggc atgaaagggc 120 120 gatcaacact gatcaacact atggtttgaa atggtttgaa aagggggaaa aagggggaaa ttgtagagca ttgtagagca cagatgtgtt cagatgtgtt cgtgtggcag cgtgtggcag 180 180 tgtgctgtct tgtgctgtct ctagcaatac ctagcaatac tcagagaaga tcagagaaga gagagaacaa gagagaacaa tgaaattctg tgaaattctg attggcccca attggcccca 240 240 gtgtgagccc gtgtgagccc agatgaggtt agatgaggtt cagctgccaa cagctgccaa ctttctcttt ctttctcttt cacatcttat cacatcttat gaaagtcatt gaaagtcatt 300 300 taagcacaac taagcacaac taactttttt taactttttt tttttttttt tttttttttt tttttttgag tttttttgag acagagtctt acagagtctt gctctgttgc gctctgttgc 360 360 ccaggacaga ccaggacaga gtgcagtagt gtgcagtagt gactcaatct gactcaatct cggctcactg cggctcactg cagcctccac cagcctccac ctcctaggct ctcctaggct 420 420 caaacggtcc caaacggtcc tcctgcatca tcctgcatca gcctcccaag gcctcccaag tagctggaat tagctggaat tacaggagtg tacaggagtg gcccaccatg gccccacatg 480 480 cccagctaat cccagctaat ttttgtattt ttttgtattt ttaatagata ttaatagata cgggggtttc cggggggtttc accatatcac accatatcac ccaggctggt ccaggctggt 540 540 ctcgaactcc ctcgaactcc tggcctcaag tggcctcaag tgatccacct tgatccacct gcctcggcct gcctcggcct cccaaagtgc cccaaagtgc tgggattata tggggattata 600 600 ggcgtcagcc ggcgtcagcc actatgccca actatgccca acccgaccaa acccgaccaa ccttttttaa ccttttttaa aataaatatt aataaatatt taaaaaattg taaaaaattg 660 660 gtatttcaca gtatttcaca tatatactag tatatactag tatttacatt tatttacatt tatccacaca tatccacaca aaacggacgg aaacggacgg gcctccgctg gcctccgctg 720 720 aaccagtgag aaccagtgag gccccagacg gccccagacg tgcgcataaa tgcgcataaa taacccctgc taacccctgc gtgctgcacc gtgctgcacc acctggggag acctggggag 780 780 agggggagga agggggga ccacggtaaa ccacggtaaa tggagcgagc tggagcgagc gcatagcaaa gcatagcaaa agggacgcgg agggacgcgg ggtccttttc ggtccttttc 840 840 tctgccggtg tctgccggtg gcactgggta gcactgggta gctgtggcca gctgtggcca ggtgtggtac ggtgtggtac tttgatgggg tttgatgggg cccagggctg cccagggctg 900 900 gagctcaagg gagctcaagg aagcgtcgca aagcgtcgca gggtcacaga gggtcacaga tctgggggaa tctgggggaa ccccggggaa ccccggggaa aagcactgag aagcactgag 960 960 gcaaaaccgc gcaaaaccgc cgctcgtctc cgctcgtctc ctacaatata ctacaatata tgggaggggg tgggggggg aggttgagta aggttgagta cgttctggat cgttctggat 1020 1020 tactcataag tactcataag accttttttt accttttttt tttccttccg tttccttccg ggcgcaaaac ggcgcaaaac cgtgagctgg cgtgagctgg atttataatc atttataatc 1080 1080 gccctataaa gccctataaa gctccagagg gctccagagg cggtcaggca cggtcaggca cctgcagagg cctgcagagg agccccgccg agccccgccg ctccgccgac ctccgccgac 1140 1140 tagctgcccc tagctgcccc cgcgagcaac cgcgagcaac ggcctcgtga ggcctcgtga tttccccgcc tttccccgcc gatccggtcc gatccggtcc ccgcctcccc ccgcctcccc 1200 1200

- 141 046157- 141 046157

actctgcccc actctgcccc cgcctacccc cgcctacccc ggagccgtgc ggagccgtgc agccgcctct agccgcctct ccgaatctct ccgaatctct ctcttctcct ctcttctcct 1260 1260 ggcgctcgcg ggcgctcgcg tgcgagaggg tgcgagagg aactagcgag aactagcgag aacgaggaag aacgaggaag cagctggagg cagctggagg tgacgccggg tgacgccggg 1320 1320 cagattacgc cagattacgc ctgtcagggc ctgtcagggc cgagccgagc cgagccgagc ggatcgctgg ggatcgctgg gcgctgtgca gcgctgtgca gaggaaaggc gaggaaaggc 1380 1380 gggagtgccc ggggagtgccc ggctcgctgt ggctcgctgt cgcagagccg cgcagagccg aggtgggtaa aggtgggtaa gctagcgacc gctagcgacc acctggactt acctggactt 1440 1440 cccagcgccc cccagcgccc aaccgtggct aaccgtggct tttcagccag tttcagccag gtcctctcct gtcctctcct cccgcggctt cccgcggctt ctcaaccaac ctcaaccaac 1500 1500 cccatcccag cccaccag cgccggccac cgccggccac ccaacctccc ccaacctccc gaaatgagtg gaaatgagtg cttcctgccc cttcctgccc cagcagccga cagcagccga 1560 1560 aggcgctact aggcgctact aggaacggta aggaacggta acctgttact acctgttact tttccagggg tttccagggg ccgtagtcga ccgtagtcga cccgctgccc cccgctgccc 1620 1620 gagttgctgt gagttgctgt gcgactgcgc gcgactgcgc gcgcggggct gcgcggggct agagtgcaag agagtgcaag gtgactgtgg gtgactgtgg ttcttctctg ttcttctctg 1680 1680 gccaagtccg gccaagtccg agggagaacg aggggagaacg taaagatatg taaagatatg ggcctttttc ggcctttttc cccctctcac cccctctcac cttgtctcac cttgtctcac 1740 1740 caaagtccct caaagtccct agtccccgga agtccccgga gcagttagcc gcagttagcc tctttctttc tctttctttc cagggaatta cagggaatta gccagacaca gccagacaca 1800 1800 acaacgggaa acaacgggaa ccagacaccg ccagacaccg aaccagacat aaccagacat gcccgccccg gcccgccccg tgcgccctcc tgcgccctcc ccgctcgctg ccgctcgctg 1860 1860 cctttcctcc cctttcctcc ctcttgtctc ctcttgtctc tccagagccg tccagagccg gatcttcaag gatcttcaag gggagcctcc gggagcctcc gtgcccccgg gtgcccccgg 1920 1920 ctgctcagtc ctgctcagtc cctccggtgt cctccggtgt gcaggacccc gcaggacccc ggaagtcctc ggaagtcctc cccgcacagc cccgcacagc tctcgcttct tctcgcttct 1980 1980 ctttgcagcc ctttgcagcc tgtttctgcg tgtttctgcg ccggaccagt ccggaccagt cgaggactct cgaggactct ggacagtaga ggacagtaga ggccccggga ggccccggga 2040 2040 cgaccgagct cgaccgagct ggaattcgcc ggaattcgcc accatggccc accatggccc caaagaagaa caaagaagaa gcggaaggtc gcggaaggtc ggtatccacg ggtatccacg 2100 2100 gagtcccagc gagtcccagc agccctcgaa agccctcgaa ccaggtgaaa ccaggtgaaa aaccttacaa aaccttacaa atgtcctgaa atgtcctgaa tgtgggaaat tgtgggaaat 2160 2160 cattcagtcg cattcagtcg cagcgacaac cagcgacaac ctggtgagac ctggtgagac atcaacgcac atcaacgcac ccatacagga ccacagga gaaaaacctt gaaaaacctt 2220 2220 ataaatgtcc aaaatgtcc agaatgtgga agaatgtgga aagtccttct aagtccttct cacgagagga cacgagga taacttgcac taacttgcac actcatcaac actcatcaac 2280 2280 gaacacatac gaacacatac tggtgaaaaa tggtgaaaaa ccatacaagt catacaagt gtcccgaatg gtcccgaatg tggtaaaagt tggtaaaagt tttagccgga tttagccgga 2340 2340 gcgatgaact gcgatgaact tgtccgacac tgtccgacac caacgaaccc caacgaaccc atacaggcga atacaggcga gaagccttac gaagccttac aaatgtcccg aaatgtcccg 2400 2400 agtgtggcaa agtgtggcaa gagcttctca gagcttctca caatcaggga caatcaggga atctgactga atctgactga gcatcaacga gcatcaacga actcataccg actcataccg 2460 2460 gggaaaaacc gggaaaaacc ttacaagtgt ttacaagtgt ccagagtgtg ccagagtgtg ggaagagctt ggaagagctt ttccacaagt ttccacaagt ggacatctgg ggacatctgg 2520 2520 tacgccacca tacgccacca gaggacacat gaggacacat acaggggaga acaggggaga agccctacaa agccctacaa atgccccgaa atgccccgaa tgcggtaaaa tgcggtaaaa 2580 2580 gtttctctca gtttctctca gaatagtacc gaatagtacc ctgaccgaac ctgaccgaac accagcgaac accagcgaac acacactggg acacactggg aaaaaaacga aaaaaaacga 2640 2640 gtaaaaggcc gtaaaaggcc ggcggccacg ggcggccacg aaaaaggccg aaaaaggccg gccaggcaaa gccaggcaaa aaagaaaaag aaagaaaaag ggatcctacc ggatcctacc 2700 2700 catacgacgt catacgacgt accagattac accagattac gctctcgagg gctctcgagg aggccagcgg aggccagcgg ttccggacgg ttccggacgg gctgacgcat gctgacgcat 2760 2760 tggacgattt tggacgattt tgatctggat tgatctggat atgctgggaa atgctgggaa gtgacgccct gtgacgccct cgatgatttt cgatgatttt gaccttgaca gaccttgaca 2820 2820 tgcttggttc tgcttggttc ggatgccctt ggatgccctt gatgactttg gatgactttg acctcgacat acctcgacat gctcggcagt gctcggcagt gacgcccttg gacgcccttg 2880 2880 atgatttcga atgatttcga cctggacatg cctggacatg ctgattaact ctgattaact ctagaagttc ctagaagttc cggatctccg cggatctccg aaaaagaaac aaaaagaaac 2940 2940 gcaaagttgg gcaaagttgg tagccagtac tagccagtac ctgcccgaca ctgcccgaca ccgacgaccg ccgacgaccg gcaccggatc gcaccggatc gaggaaaagc gaggaaaagc 3000 3000 ggaagcggac ggaagcggac ctacgagaca ctacgagaca ttcaagagca ttcaagagca tcatgaagaa tcatgaagaa gtcccccttc gtcccccttc agcggcccca agcggcccca 3060 3060 ccgaccctag ccgacctag acctccacct acctccacct agaagaatcg agaagaatcg ccgtgcccag ccgtgcccag cagatccagc cagatccagc gccagcgtgc gccagcgtgc 3120 3120

- 142 046157- 142 046157

caaaacctgc caaaacctgc cccccagcct cccccagcct taccccttca taccccttca ccagcagcct ccagcagcct gagcaccatc gagcaccatc aactacgacg aactacgacg 3180 3180 agttccctac agttccctac catggtgttc catggtgttc cccagcggcc cccagcggcc agatctctca agatctctca ggcctctgct ggcctctgct ctggctccag ctggctccag 3240 3240 cccctcctca cccctcctca ggtgctgcct ggtgctgcct caggctcctg caggctcctg ctcctgcacc ctcctgcacc agctccagcc agctccagcc atggtgtctg atggtgtctg 3300 3300 cactggctca cactggctca ggcaccagca ggcaccagca cccgtgcctg cccgtgcctg tgctggctcc tgctggctcc tggacctcca tggacctcca caggctgtgg caggctgtgg 3360 3360 ctccaccagc ctccaccagc ccctaaacct ccctaaacct acacaggccg acacaggccg gcgagggcac gcgaggggcac actgtctgaa actgtctgaa gctctgctgc gctctgctgc 3420 3420 agctgcagtt agctgcagtt cgacgacgag cgacgacgag gatctgggag gatctggggag ccctgctggg ccctgctggg aaacagcacc aaacagcacc gatcctgccg gatcctgccg 3480 3480 tgttcaccga tgttcaccga cctggccagc cctggccagc gtggacaaca gtggacaaca gcgagttcca gcgagttcca gcagctgctg gcagctgctg aaccagggca aaccagggca 3540 3540 tccctgtggc tccctgtggc ccctcacacc ccctcaccacc accgagccca accgagccca tgctgatgga tgctgatgga ataccccgag ataccccgag gccatcaccc gccatcaccc 3600 3600 ggctcgtgac ggctcgtgac aggcgctcag aggcgctcag aggcctcctg aggcctcctg atccagctcc atccagctcc tgcccctctg tgcccctctg ggagcaccag ggagcaccag 3660 3660 gcctgcctaa gcctgcctaa tggactgctg tggactgctg tctggcgacg tctggcgacg aggacttcag aggacttcag ctctatcgcc ctctatcgcc gatatggatt gatatggatt 3720 3720 tctcagcctt tctcagcctt gctgggctct gctgggctct ggcagcggca ggcagcggca gccgggattc gccggggattc cagggaaggg cagggaaggg atgtttttgc atgtttttgc 3780 3780 cgaagcctga cgaagcctga ggccggctcc ggccggctcc gctattagtg gctattagtg acgtgtttga acgtgtttga gggccgcgag gggccgcgag gtgtgccagc gtgtgccagc 3840 3840 caaaacgaat caaaacgaat ccggccattt ccggccattt catcctccag catcctccag gaagtccatg gaagtccatg ggccaaccgc ggccaaccgc ccactccccg ccactccccg 3900 3900 ccagcctcgc ccagcctcgc accaacacca accaacacca accggtccag accggtccag tacatgagcc tacatgagcc agtcgggtca agtcgggtca ctgaccccgg ctgaccccgg 3960 3960 caccagtccc caccagtccc tcagccactg tcagccactg gatccagcgc gatccagcgc ccgcagtgac ccgcagtgac tcccgaggcc tcccgaggcc agtcacctgt agtcacctgt 4020 4020 tggaggatcc tggaggatcc cgatgaagag cgatgaagag acgagccagg acgagccagg ctgtcaaagc ctgtcaaagc ccttcgggag ccttcggggag atggccgata atggccgata 4080 4080 ctgtgattcc ctgtgattcc ccagaaggaa ccagaaggaa gaggctgcaa gaggctgcaa tctgtggcca tctgtggcca aatggacctt aatggacctt tcccatccgc tcccatccgc 4140 4140 ccccaagggg ccccaagggg ccatctggat ccatctggat gagctgacaa gagctgacaa ccacacttga cccacacttga gtccatgacc gtccatgacc gaggatctga gaggatctga 4200 4200 acctggactc acctggactc acccctgacc acccctgacc ccggaattga ccggaattga acgagattct acgagattct ggataccttc ggataccttc ctgaacgacg ctgaacgacg 4260 4260 agtgcctctt agtgcctctt gcatgccatg gcatgccatg catatcagca catatcagca caggactgtc caggactgtc catcttcgac catcttcgac acatctctgt acatctctgt 4320 4320 tttaaactag tttaaactag taataaaaga taataaaaga tctttatttt tctttatttt cattagatct cattagatct gtgtgttggt gtgtgttggt tttttgtgtg tttttgtgtg 4380 4380

<210> 70 <211> 3332 <212> ДНК <213> Искусственная последовательность <220><210> 70 <211> 3332 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 70 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat60 attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc120 gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag180 tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca240 gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt300<223> Description of the artificial sequence: Synthetic polynucleotide <400> 70 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat60 attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc120 gatcaacact atggtttgaa aagggggaaa ttg tagagca cagatgtgtt cgtgtggcag180 tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca240 gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt300

- 143 046157- 143 046157

taagcacaac taagcacaac taactttttt taactttttt tttttttttt tttttttttt tttttttgag tttttttgag acagagtctt acagagtctt gctctgttgc gctctgttgc 360 360 ccaggacaga ccaggacaga gtgcagtagt gtgcagtagt gactcaatct gactcaatct cggctcactg cggctcactg cagcctccac cagcctccac ctcctaggct ctcctaggct 420 420 caaacggtcc caaacggtcc tcctgcatca tcctgcatca gcctcccaag gcctcccaag tagctggaat tagctggaat tacaggagtg tacaggagtg gcccaccatg gccccacatg 480 480 cccagctaat cccagctaat ttttgtattt ttttgtattt ttaatagata ttaatagata cgggggtttc cggggggtttc accatatcac accatatcac ccaggctggt ccaggctggt 540 540 ctcgaactcc ctcgaactcc tggcctcaag tggcctcaag tgatccacct tgatccacct gcctcggcct gcctcggcct cccaaagtgc cccaaagtgc tgggattata tggggattata 600 600 ggcgtcagcc ggcgtcagcc actatgccca actatgccca acccgaccaa acccgaccaa ccttttttaa ccttttttaa aataaatatt aataaatatt taaaaaattg taaaaaattg 660 660 gtatttcaca gtatttcaca tatatactag tatatactag tatttacatt tatttacatt tatccacaca tatccacaca aaacggacgg aaacggacgg gcctccgctg gcctccgctg 720 720 aaccagtgag aaccagtgag gccccagacg gccccagacg tgcgcataaa tgcgcataaa taacccctgc taacccctgc gtgctgcacc gtgctgcacc acctggggag acctggggag 780 780 agggggagga agggggga ccacggtaaa ccacggtaaa tggagcgagc tggagcgagc gcatagcaaa gcatagcaaa agggacgcgg agggacgcgg ggtccttttc ggtccttttc 840 840 tctgccggtg tctgccggtg gcactgggta gcactgggta gctgtggcca gctgtggcca ggtgtggtac ggtgtggtac tttgatgggg tttgatgggg cccagggctg cccagggctg 900 900 gagctcaagg gagctcaagg aagcgtcgca aagcgtcgca gggtcacaga gggtcacaga tctgggggaa tctgggggaa ccccggggaa ccccggggaa aagcactgag aagcactgag 960 960 gcaaaaccgc gcaaaaccgc cgctcgtctc cgctcgtctc ctacaatata ctacaatata tgggaggggg tgggggggg aggttgagta aggttgagta cgttctggat cgttctggat 1020 1020 tactcataag tactcataag accttttttt accttttttt tttccttccg tttccttccg ggcgcaaaac ggcgcaaaac cgtgagctgg cgtgagctgg atttataatc atttataatc 1080 1080 gccctataaa gccctataaa gctccagagg gctccagagg cggtcaggca cggtcaggca cctgcagagg cctgcagagg agccccgccg agccccgccg ctccgccgac ctccgccgac 1140 1140 tagctgcccc tagctgcccc cgcgagcaac cgcgagcaac ggcctcgtga ggcctcgtga tttccccgcc tttccccgcc gatccggtcc gatccggtcc ccgcctcccc ccgcctcccc 1200 1200 actctgcccc actctgcccc cgcctacccc cgcctacccc ggagccgtgc ggagccgtgc agccgcctct agccgcctct ccgaatctct ccgaatctct ctcttctcct ctcttctcct 1260 1260 ggcgctcgcg ggcgctcgcg tgcgagaggg tgcgagagg aactagcgag aactagcgag aacgaggaag aacgaggaag cagctggagg cagctggagg tgacgccggg tgacgccggg 1320 1320 cagattacgc cagattacgc ctgtcagggc ctgtcagggc cgagccgagc cgagccgagc ggatcgctgg ggatcgctgg gcgctgtgca gcgctgtgca gaggaaaggc gaggaaaggc 1380 1380 gggagtgccc ggggagtgccc ggctcgctgt ggctcgctgt cgcagagccg cgcagagccg aggtgggtaa aggtgggtaa gctagcgacc gctagcgacc acctggactt acctggactt 1440 1440 cccagcgccc cccagcgccc aaccgtggct aaccgtggct tttcagccag tttcagccag gtcctctcct gtcctctcct cccgcggctt cccgcggctt ctcaaccaac ctcaaccaac 1500 1500 cccatcccag cccaccag cgccggccac cgccggccac ccaacctccc ccaacctccc gaaatgagtg gaaatgagtg cttcctgccc cttcctgccc cagcagccga cagcagccga 1560 1560 aggcgctact aggcgctact aggaacggta aggaacggta acctgttact acctgttact tttccagggg tttccagggg ccgtagtcga ccgtagtcga cccgctgccc cccgctgccc 1620 1620 gagttgctgt gagttgctgt gcgactgcgc gcgactgcgc gcgcggggct gcgcggggct agagtgcaag agagtgcaag gtgactgtgg gtgactgtgg ttcttctctg ttcttctctg 1680 1680 gccaagtccg gccaagtccg agggagaacg aggggagaacg taaagatatg taaagatatg ggcctttttc ggcctttttc cccctctcac cccctctcac cttgtctcac cttgtctcac 1740 1740 caaagtccct caaagtccct agtccccgga agtccccgga gcagttagcc gcagttagcc tctttctttc tctttctttc cagggaatta cagggaatta gccagacaca gccagacaca 1800 1800 acaacgggaa acaacgggaa ccagacaccg ccagacaccg aaccagacat aaccagacat gcccgccccg gcccgccccg tgcgccctcc tgcgccctcc ccgctcgctg ccgctcgctg 1860 1860 cctttcctcc cctttcctcc ctcttgtctc ctcttgtctc tccagagccg tccagagccg gatcttcaag gatcttcaag gggagcctcc gggagcctcc gtgcccccgg gtgcccccgg 1920 1920 ctgctcagtc ctgctcagtc cctccggtgt cctccggtgt gcaggacccc gcaggacccc ggaagtcctc ggaagtcctc cccgcacagc cccgcacagc tctcgcttct tctcgcttct 1980 1980 ctttgcagcc ctttgcagcc tgtttctgcg tgtttctgcg ccggaccagt ccggaccagt cgaggactct cgaggactct ggacagtaga ggacagtaga ggccccggga ggccccggga 2040 2040 cgaccgagct cgaccgagct ggaattcgcc ggaattcgcc accatggccc accatggccc caaagaagaa caaagaagaa gcggaaggtc gcggaaggtc ggtatccacg ggtatccacg 2100 2100 gagtcccagc gagtcccagc agccctcgaa agccctcgaa ccaggtgaaa ccaggtgaaa aaccttacaa aaccttacaa atgtcctgaa atgtcctgaa tgtgggaaat tgtgggaaat 2160 2160

- 144 046157- 144 046157

cattcagtcg cattcagtcg cagcgacaac cagcgacaac ctggtgagac ctggtgagac atcaacgcac atcaacgcac ccatacagga ccacagga gaaaaacctt gaaaaacctt 2220 2220 ataaatgtcc aaaatgtcc agaatgtgga agaatgtgga aagtccttct aagtccttct cacgagagga cacgagga taacttgcac taacttgcac actcatcaac actcatcaac 2280 2280 gaacacatac gaacacatac tggtgaaaaa tggtgaaaaa ccatacaagt catacaagt gtcccgaatg gtcccgaatg tggtaaaagt tggtaaaagt tttagccgga tttagccgga 2340 2340 gcgatgaact gcgatgaact tgtccgacac tgtccgacac caacgaaccc caacgaaccc atacaggcga atacaggcga gaagccttac gaagccttac aaatgtcccg aaatgtcccg 2400 2400 agtgtggcaa agtgtggcaa gagcttctca gagcttctca caatcaggga caatcaggga atctgactga atctgactga gcatcaacga gcatcaacga actcataccg actcataccg 2460 2460 gggaaaaacc gggaaaaacc ttacaagtgt ttacaagtgt ccagagtgtg ccagagtgtg ggaagagctt ggaagagctt ttccacaagt ttccacaagt ggacatctgg ggacatctgg 2520 2520 tacgccacca tacgccacca gaggacacat gaggacacat acaggggaga acaggggaga agccctacaa agccctacaa atgccccgaa atgccccgaa tgcggtaaaa tgcggtaaaa 2580 2580 gtttctctca gtttctctca gaatagtacc gaatagtacc ctgaccgaac ctgaccgaac accagcgaac accagcgaac acacactggg acacactggg aaaaaaacga aaaaaaacga 2640 2640 gtaaaaggcc gtaaaaggcc ggcggccacg ggcggccacg aaaaaggccg aaaaaggccg gccaggcaaa gccaggcaaa aaagaaaaag aaagaaaaag ggatccgacg ggatccgacg 2700 2700 cgctggacga cgctggacga tttcgatctc tttcgatctc gacatgctgg gacatgctgg gttctgatgc gttctgatgc cctcgatgac cctcgatgac tttgacctgg tttgacctgg 2760 2760 atatgttggg atatgttggg aagcgacgca aagcgacgca ttggatgact ttggatgact ttgatctgga ttgatctgga catgctcggc catgctcggc tccgatgctc tccgatgctc 2820 2820 tggacgattt tggacgattt cgatctcgat cgatctcgat atgttataaa atgttataaa agcttgggtg agcttgggtg gcatccctgt gcatccctgt gacccctccc gacccctccc 2880 2880 cagtgcctct cagtgcctct cctggccctg cctggccctg gaagttgcca gaagttgcca ctccagtgcc ctccagtgcc caccagcctt caccagcctt gtcctaataa gtcctaataa 2940 2940 aattaagttg aattaagttg catcattttg catcattttg tctgactagg tctgactagg tgtccttcta tgtccttcta taatattatg taatattatg gggtggaggg gggtggaggg 3000 3000 gggtggtatg gggtggtatg gagcaagggg gagcaagggg caagttggga caagttggga agacaacctg agacaacctg tagggcctgc tagggcctgc ggggtctatt ggggtctatt 3060 3060 gggaaccaag gggaaccaag ctggagtgca ctggagtgca gtggcacaat gtggcacaat cttggctcac cttggctcac tgcaatctcc tgcaatctcc gcctcctggg gcctcctggg 3120 3120 ttcaagcgat ttcaagcgat tctcctgcct tctcctgcct cagcctcccg cagcctcccg agttgttggg agttgttggg attccaggca attccaggca tgcatgacca tgcatgacca 3180 3180 ggctcagcta ggctcagcta atttttgttt atttttgttt ttttggtaga ttttggtaga gacggggttt gacggggttt caccatattg caccatattg gccaggctgg gccaggctgg 3240 3240 tctccaactc tctccaactc ctaatctcag ctaatctcag gtgatctacc gtgatctacc caccttggcc caccttggcc tcccaaattg tccaaattg ctgggattac ctggggattac 3300 3300 aggcgtgaac aggcgtgaac cactgctccc cactgctccc ttccctgtcc ttccctgtcc tt tt 3332 3332

<210> 71 <211> 3546 <212> ДНК <213> Искусственная последовательность <220><210> 71 <211> 3546 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 71 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat60 attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc120 gatcaacact atggtttgaa aagggggaaa ttgtagagca cagatgtgtt cgtgtggcag180 tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca240 gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt300 taagcacaac taactttttt tttttttttt tttttttgag acagagtctt gctctgttgc360<223> Description of the artificial sequence: Synthetic polynucleotide <400> 71 ggaggaagcc atcaactaaa ctacaatgac tgtaagatac aaaattggga atggtaacat60 attttgaagt tctgttgaca taaagaatca tgatattaat gcccatggaa atgaaagggc120 gatcaacact atggtttgaa aagggggaaa ttg tagagca cagatgtgtt cgtgtggcag180 tgtgctgtct ctagcaatac tcagagaaga gagagaacaa tgaaattctg attggcccca240 gtgtgagccc agatgaggtt cagctgccaa ctttctcttt cacatcttat gaaagtcatt300 taagcacaac taactttttt tttttttt ttt tttttttgag acaagtctt gctctgttgc360

- 145 046157 ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420 caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg480 cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt540 ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata600 ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg660 gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg720 aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag780 agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc840 tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg900 gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag960 gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat1020 tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc1080 gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac1140 tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc1200 actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct1260 ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg1320 cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc1380 gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt1440 cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac1500 cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga1560 aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc1620 gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg1680 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg2100 gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat2160 cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt2220 ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac2280- 145 046157 ccaggacaga gtgcagtagt gactcaatct cggctcactg cagcctccac ctcctaggct 420 caaacggtcc tcctgcatca gcctcccaag tagctggaat tacaggagtg gcccaccatg480 cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac cca ggctggt540 ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata600 ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg660 gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg72 0 aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag780 agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc840 tctgccggtg gcactggggta gctgtggcca ggtgtggtac tttgatgggg cccaggctg900 gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag960 gcaaaaccgc cgctcgtctc ctacaatata tgggagggg aggttgagta cgttctggat1020 tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc1080 gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac1140 tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc1200 actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct1260 ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg1320 cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc1380 gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt1440 cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcgg ctt ctcaaccaac1500 cccacccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga1560 aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc1620 gagttgctgt gcgactgcgc gcgcggggct agag tgcaag gtgactgtgg ttcttctctg1680 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa cgacacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttg cagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg2100 gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat2160 cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt2220 ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac2280

- 146 046157- 146 046157

gaacacatac gaacacatac tggtgaaaaa tggtgaaaaa ccatacaagt catacaagt gtcccgaatg gtcccgaatg tggtaaaagt tggtaaaagt tttagccgga tttagccgga 2340 2340 gcgatgaact gcgatgaact tgtccgacac tgtccgacac caacgaaccc caacgaaccc atacaggcga atacaggcga gaagccttac gaagccttac aaatgtcccg aaatgtcccg 2400 2400 agtgtggcaa agtgtggcaa gagcttctca gagcttctca caatcaggga caatcaggga atctgactga atctgactga gcatcaacga gcatcaacga actcataccg actcataccg 2460 2460 gggaaaaacc gggaaaaacc ttacaagtgt ttacaagtgt ccagagtgtg ccagagtgtg ggaagagctt ggaagagctt ttccacaagt ttccacaagt ggacatctgg ggacatctgg 2520 2520 tacgccacca tacgccacca gaggacacat gaggacacat acaggggaga acaggggaga agccctacaa agccctacaa atgccccgaa atgccccgaa tgcggtaaaa tgcggtaaaa 2580 2580 gtttctctca gtttctctca gaatagtacc gaatagtacc ctgaccgaac ctgaccgaac accagcgaac accagcgaac acacactggg acacactggg aaaaaaacga aaaaaaacga 2640 2640 gtaaaaggcc gtaaaaggcc ggcggccacg ggcggccacg aaaaaggccg aaaaaggccg gccaggcaaa gccaggcaaa aaagaaaaag aaagaaaaag ggatccgacg ggatccgacg 2700 2700 cgctggacga cgctggacga tttcgatctc tttcgatctc gacatgctgg gacatgctgg gttctgatgc gttctgatgc cctcgatgac cctcgatgac tttgacctgg tttgacctgg 2760 2760 atatgttggg atatgttggg aagcgacgca aagcgacgca ttggatgact ttggatgact ttgatctgga ttgatctgga catgctcggc catgctcggc tccgatgctc tccgatgctc 2820 2820 tggacgattt tggacgattt cgatctcgat cgatctcgat atgttataaa atgttataaa aagagaccgg aagagaccgg ttcactgtga ttcactgtga cagtaaaaga cagtaaaaga 2880 2880 gaccggttca gaccggttca ctgtgagaat ctgtgagaat gaaagagacc gaaagagacc ggttcactgt ggttcactgt gatcggaaaa gatcggaaaa gagaccggtt gagaccggtt 2940 2940 cactgtgagc cactgtgagc ggccttgaaa ggccttgaaa cccagcagac cccagcagac aatgtagctc aatgtagctc agtagaaacc agtagaaacc cagcagacaa cagcagacaa 3000 3000 tgtagctgaa tgtagctgaa tggaaaccca tggaaaccca gcagacaatg gcagacaatg tagcttcgga tagcttcgga gaaacccagc gaaacccagc agacaatgta agacaatgta 3060 3060 gctaagcttg gctaagcttg ggtggcatcc ggtggcatcc ctgtgacccc ctgtgacccc tccccagtgc tccccagtgc ctctcctggc ctctcctggc cctggaagtt cctggaagtt 3120 3120 gccactccag gccactccag tgcccaccag tgccccaccag ccttgtccta ccttgtccta ataaaattaa aaaaattaa gttgcatcat gttgcatcat tttgtctgac tttgtctgac 3180 3180 taggtgtcct taggtgtcct tctataatat tctataatat tatggggtgg tatggggtgg aggggggtgg aggggggtgg tatggagcaa tatggagcaa ggggcaagtt ggggcaagtt 3240 3240 gggaagacaa gggaagacaa cctgtagggc cctgtagggc ctgcggggtc ctgcggggtc tattgggaac tattgggaac caagctggag caagctggag tgcagtggca tgcagtggca 3300 3300 caatcttggc caatcttggc tcactgcaat tcactgcaat ctccgcctcc ctccgcctcc tgggttcaag tggggttcaag cgattctcct cgattctcct gcctcagcct gcctcagcct 3360 3360 cccgagttgt cccgagttgt tgggattcca tggggattcca ggcatgcatg ggcatgcatg accaggctca accaggctca gctaattttt gctaattttt gtttttttgg gtttttttgg 3420 3420 tagagacggg tagagacgggg gtttcaccat gtttcaccat attggccagg attggccagg ctggtctcca ctggtctcca actcctaatc actcctaatc tcaggtgatc tcaggtgatc 3480 3480 tacccacctt taccacctt ggcctcccaa ggcctcccaa attgctggga attgctggga ttacaggcgt ttacaggcgt gaaccactgc gaaccactgc tcccttccct tcccttccct 3540 3540 gtcctt gtcctt 3546 3546

<210> 72 <211> 1707 <212> ДНК <213> Искусственная последовательность <220><210> 72 <211> 1707 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 72 atggccgcag atcacctgat gctggctgaa ggctacagac tggtgcagcg gcctccatct60 gccgctgccg cccacggccc ccacgccctg agaacactgc ccccctacgc cggccctggt120 cttgatagcg gactcagacc tagaggcgcc cctctgggcc ctccacctcc aagacagcct180 ggagccctgg cctacggcgc cttcggccct ccttctagct tccagccctt ccccgccgtg240<223> Description of the artificial sequence: Synthetic polynucleotide <400> 72 atggccgcag atcacctgat gctggctgaa ggctacagac tggtgcagcg gcctccatct60 gccgctgccg cccacggccc ccacgccctg agaacactgc ccccctacgc cggccctggt120 cttgatagcg gactcagacc tagaggcgcc cctctgggcc ctccacctcc aagacagcct180 ggagccctgg cctacggcgc cttcggccct ccttctagct tccagccctt ccccgccgtg240

- 147 046157- 147 046157

cctcctccag cctcctccag ccgctggcat ccgctggcat cgcccacctg cgccacctg cagcctgtgg cagcctgtgg ccacccctta ccacccctta ccccggaaga ccccggagaaga 300 300 gccgccgccc gccgccgccc ctccaaacgc ctccaaacgc ccctggcgga ccctggcgga cctcctggcc cctcctggcc cccagcctgc cccagcctgc tccaagcgcc tccaagcgcc 360 360 gctgcccctc gctgcccctc cacctcctgc cacctcctgc tcatgccctg tcatgccctg ggcggcatgg ggcggcatgg acgccgagct acgccgagct gatcgacgag gatcgacgag 420 420 gaagccctga gaagccctga ccagcctgga ccagcctgga actggaactg actggaactg ggcctgcaca ggcctgcaca gagtgcggga gagtgcggga actgcctgag actgcctgag 480 480 ctgttcctgg ctgttcctgg gacagagcga gacagagcga gttcgactgc gttcgactgc ttcagcgacc ttcagcgacc tgggcagcgc tggggcagcgc ccctcctgcc ccctcctgcc 540 540 ggctctgtgt ggctctgtgt cctgcgccga cctgcgccga ccacctgatg ccacctgatg ctcgccgagg ctcgccgagg gctaccgcct gctaccgcct ggtgcagagg ggtgcagagg 600 600 ccgccgtccg ccgccgtccg ccgccgccgc ccgccgccgc ccatggccct ccatggccct catgcgctcc catgcgctcc ggactctgcc ggactctgcc gccgtacgcg gccgtacgcg 660 660 ggcccgggcc ggcccgggcc tggacagtgg tggacagtgg gctgaggccg gctgaggccg cggggggctc cggggggctc cgctggggcc cgctggggcc gccgccgccc gccgccgccc 720 720 cgccaacccg cgccaacccg gggccctggc gggccctggc gtacggggcc gtacggggcc ttcgggccgc ttcggggccgc cgtcctcctt cgtcctcctt ccagcccttt ccagcccttt 780 780 ccggccgtgc ccggccgtgc ctccgccggc ctccgccggc cgcgggcatc cgcgggcatc gcgcacctgc gcgcacctgc agcctgtggc agcctgtggc gacgccgtac gacgccgtac 840 840 cccggccgcg cccggccgcg ccgccgcgcc ccgccgcgcc ccccaacgct ccccaacgct ccgggaggcc ccgggaggcc ccccgggccc ccccggggccc gcagccggcc gcagccggcc 900 900 ccaagcgccg ccaagcgccg cagccccgcc cagccccgcc gccgcccgcg gccgcccgcg cacgccctgg cacgccctgg gcggcatgga gcggcatgga cgccgaactc cgccgaactc 960 960 atcgacgagg atcgacgagg aggcgctgac aggcgctgac gtcgctggag gtcgctggag ctggagctgg ctggagctgg ggctgcaccg ggctgcaccg cgtgcgcgag cgtgcgcgag 1020 1020 ctgcccgagc ctgcccgagc tgttcctggg tgttcctggg ccagagcgag ccagagcgag ttcgactgct ttcgactgct tctcggactt tctcggactt ggggtccgcg ggggtccgcg 1080 1080 ccgcccgccg ccgcccgccg gctccgtgag gctccgtgag ctgccagtcc ctgccagtcc cagctcatca cagctcatca aacccagccg aacccagccg catgcgcaag catgcgcaag 1140 1140 taccccaacc taccccaacc ggcccagcaa ggcccagcaa gacgcccccc gacgcccccc cacgaacgcc cacgaacgcc cttacgcttg cttacgcttg cccagtggag cccagtggag 1200 1200 tcctgtgatc tcctgtgatc gccgcttctc gccgcttctc ccgcagcgac ccgcagcgac aacctggtga aacctggtga gacacatccg gacacatccg catccacaca catccacaca 1260 1260 ggccagaagc ggccagaagc ccttccagtg ccttccagtg ccgcatctgc ccgcatctgc atgagaaact atgagaaact tcagccgaga tcagccgaga ggataacttg ggataacttg 1320 1320 cacactcaca cacactcaca tccgcaccca tccgcaccca cacaggcgaa cacaggcgaa aagcccttcg aagcccttcg cctgcgacat cctgcgacat ctgtggaaga ctgtggaaga 1380 1380 aagtttgccc aagtttgccc ggagcgatga ggagcgatga acttgtccga acttgtccga cataccaaga cataccaaga tccacttgcg tccacttgcg gcagaaggac gcagaaggac 1440 1440 cgcccttacg cgcccttacg cttgcccagt cttgcccagt ggagtcctgt ggagtcctgt gatcgccgct gatcgccgct tctcccaatc tctcccaatc agggaatctg agggaatctg 1500 1500 actgagcaca actgagcaca tccgcatcca tccgcatcca cacaggccag cacaggccag aagcccttcc aagcccttcc agtgccgcat agtgccgcat ctgcatgaga ctgcatgaga 1560 1560 aacttcagca aacttcagca caagtggaca caagtggaca tctggtacgc tctggtacgc cacatccgca cacatccgca cccacacagg cccacacagg cgaaaagccc cgaaaagccc 1620 1620 ttcgcctgcg ttcgcctgcg acatctgtgg acatctgtgg aagaaagttt aagaaagttt gcccagaata gccagaata gtaccctgac gtaccctgac cgaacatacc cgaacatacc 1680 1680 aagatccact aagatccact tgcggcagaa tgcggcagaa ggacaag ggacaag 1707 1707

<210> 73 <211> 1755 <212> ДНК <213> Искусственная последовательность <220><210> 73 <211> 1755 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 73 atggccgcag atcacctgat gctggctgaa ggctacagac tggtgcagcg gcctccatct 60<223> Description of the artificial sequence: Synthetic polynucleotide <400> 73 atggccgcag atcacctgat gctggctgaa ggctacagac tggtgcagcg gcctccatct 60

- 148 046157 gccgctgccg cccacggccc ccacgccctg agaacactgc ccccctacgc cggccctggt 120 cttgatagcg gactcagacc tagaggcgcc cctctgggcc ctccacctcc aagacagcct 180 ggagccctgg cctacggcgc cttcggccct ccttctagct tccagccctt ccccgccgtg 240 cctcctccag ctgctggcat cgcccacctg cagcctgtgg ccacccctta ccccggaaga 300 gccgccgccc ctccaaacgc ccctggcgga cctcctggcc cccagcctgc tccaagcgcc 360 gctgcccctc cacctcctgc tcatgccctg ggcggcatgg acgccgagct gatcgacgag 420 gaagccctga ccagcctgga actggaactg ggcctgcaca gagtgcggga actgcctgag 480 ctgttcctgg gacagagcga gttcgactgc ttcagcgacc tgggcagcgc ccctcctgcc 540 ggctctgtgt cctgcggcgg cagcggcggc ggaagcggcg ccgaccacct gatgctcgcc 600 gagggctacc gcctggtgca gaggccgccg tccgccgccg ccgcccatgg ccctcatgcg 660 ctccggactc tgccgccgta cgcgggcccg ggcctggaca gtgggctgag gccgcggggg 720 gctccgctgg ggccgccgcc gccccgccaa cccggggccc tggcgtacgg ggccttcggg 780 ccgccgtcct ccttccagcc ctttccggcc gtgcctccgc cggccgcggg catcgcgcac 840 ctgcagcctg tggcgacgcc gtaccccggc cgcgcggccg cgccccccaa cgctccggga 900 ggccccccgg gcccgcagcc ggccccaagc gccgcagccc cgccgccgcc cgcgcacgcc 960 ctgggcggca tggacgccga actcatcgac gaggaggcgc tgacgtcgct ggagctggag 1020 ctggggctgc accgcgtgcg cgagctgccc gagctgttcc tgggccagag cgagttcgac 1080 tgcttctcgg acttggggtc cgcgccgccc gccggctccg tgagctgcgg tggttctggt 1140 ggtggttctg gtcagtccca gctcatcaaa cccagccgca tgcgcaagta ccccaaccgg 1200 cccagcaaga cgccccccca cgaacgccct tacgcttgcc cagtggagtc ctgtgatcgc 1260 cgcttctccc gcagcgacaa cctggtgaga cacatccgca tccacacagg ccagaagccc 1320 ttccagtgcc gcatctgcat gagaaacttc agccgagagg ataacttgca cactcacatc 1380 cgcacccaca caggcgaaaa gcccttcgcc tgcgacatct gtggaagaaa gtttgcccgg 1440 agcgatgaac ttgtccgaca taccaagatc cacttgcggc agaaggaccg cccttacgct 1500 tgcccagtgg agtcctgtga tcgccgcttc tcccaatcag ggaatctgac tgagcacatc 1560 cgcatccaca caggccagaa gcccttccag tgccgcatct gcatgagaaa cttcagcaca 1620 agtggacatc tggtacgcca catccgcacc cacacaggcg aaaagccctt cgcctgcgac 1680 atctgtggaa gaaagtttgc ccagaatagt accctgaccg aacataccaa gatccacttg 1740 cggcagaagg acaag 1755 <210> 74 <211> 3438 <212> ДНК- 148 046157 gccgctgccg cccacggccc ccacgccctg agaacactgc ccccctacgc cggccctggt 120 cttgatagcg gactcagacc tagaggcgcc cctctgggcc ctccacctcc aagacagcct 180 ggagccctgg cctacggcgc cttcggccct ccttctagct tccag ccctt ccccgccgtg 240 cctcctccag ctgctggcat cgcccacctg cagcctgtgg ccacccctta ccccggaaga 300 gccgccgccc ctccaaacgc ccctggcgga cctcctggcc cccagcctgc tccaagcgcc 360 gctgcccctc cacctcctgc tcatgccctg ggcgg catgg acgccgagct gatcgacgag 420 gaagccctga ccagcctgga actggaactg ggcctgcaca gagtgcggga actgcctgag 480 ctgttcctgg gacagagcga gttcgactgc ttcagcgacc tgggcagcgc ccctcctgcc 540 ggctctgtgt cctgcggcgg cagcggcggc ggaagcggcg ccgaccacct gatgctcgcc 600 gagggctacc gcctggtgca gagccgccg t ccgccgccg ccgcccatgg ccctcatgcg 660 ctccggactc tgccgccgta cgcgggcccg ggcctggaca gtgggctgag gccgcggggg 720 gctccgctgg ggccgccgcc gccccgccaa cccggggccc tggcgtacgg ggccttcggg 780 ccgccgtcct ccttcca gcc ctttccggcc gtgcctccgc cggccgcggg catcgcgcac 840 ctgcagcctg tggcgacgcc gtaccccggc cgcgcggccg cgccccccaa cgctccggga 900 ggccccccgg gcccgcagcc ggccccaagc gccgcagccc cgccgccgcc cgcgcacgcc 960 ctgggcggca tggacgccga actcatcgac gaggaggcgc tgacgtcgct ggagctggag 1020 ctggggctgc accgcgtgcg cgagctgccc gagctgttcc t gggccagag cgagttcgac 1080 tgcttctcgg acttggggtc cgcgccgccc gccggctccg tgagctgcgg tggttctggt 1140 ggtggttctg gtcagtccca gctcatcaaa cccagccgca tgcgcaagta ccccaaccgg 1200 cccagcaaga cgccccccca cgaacgccct tacgcttgcc cagtggagtc ctgtgatcgc 1260 cgcttctccc gcagcgacaa cctggtgaga cacatccgca tccacacagg ccagaagccc 1320 ttccagtgcc gcatctgcat gagaaacttc agccgagagg ataacttgca cactcacatc 1380 cgcacccaca caggcgaaaa gcccttcgcc tgcgacatct gtggaagaaa gtttgcccgg 1440 agcgatgaac ttgtccgaca taccaagatc cacttgcggc agaaggaccg cccttac gct 1500 tgcccagtgg agtcctgtga tcgccgcttc tcccaatcag ggaatctgac tgagcacatc 1560 cgcatccaca caggccagaa gcccttccag tgccgcatct gcatgagaaa cttcagcaca 1620 agtggacatc tggtacgcca catccgcacc cacacaggcg aaaagccctt c gcctgcgac 1680 atctgtggaa gaaagtttgc ccagaatagt accctgaccg aacataccaa gatccacttg 1740 cggcagaagg acaag 1755 <210> 74 <211> 3438 <212> DNA

- 149 046157 <213> Искусственная последовательность <220>- 149 046157 <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид<223> Description of artificial sequence: Synthetic polynucleotide

<400> 74 ggaggaagcc <400> 74 ggaggaagcc atcaactaaa atcaactaaa ctacaatgac ctacaatgac tgtaagatac tgtaagatac aaaattggga aaaattggga atggtaacat atggtaacat 60 60 attttgaagt attttgaagt tctgttgaca tctgttgaca taaagaatca taaagaatca tgatattaat tgatattaat gcccatggaa gcccatggaa atgaaagggc atgaaagggc 120 120 gatcaacact gatcaacact atggtttgaa atggtttgaa aagggggaaa aagggggaaa ttgtagagca ttgtagagca cagatgtgtt cagatgtgtt cgtgtggcag cgtgtggcag 180 180 tgtgctgtct tgtgctgtct ctagcaatac ctagcaatac tcagagaaga tcagagaaga gagagaacaa gagagaacaa tgaaattctg tgaaattctg attggcccca attggcccca 240 240 gtgtgagccc gtgtgagccc agatgaggtt agatgaggtt cagctgccaa cagctgccaa ctttctcttt ctttctcttt cacatcttat cacatcttat gaaagtcatt gaaagtcatt 300 300 taagcacaac taagcacaac taactttttt taactttttt tttttttttt tttttttttt tttttttgag tttttttgag acagagtctt acagagtctt gctctgttgc gctctgttgc 360 360 ccaggacaga ccaggacaga gtgcagtagt gtgcagtagt gactcaatct gactcaatct cggctcactg cggctcactg cagcctccac cagcctccac ctcctaggct ctcctaggct 420 420 caaacggtcc caaacggtcc tcctgcatca tcctgcatca gcctcccaag gcctcccaag tagctggaat tagctggaat tacaggagtg tacaggagtg gcccaccatg gccccacatg 480 480 cccagctaat cccagctaat ttttgtattt ttttgtattt ttaatagata ttaatagata cgggggtttc cggggggtttc accatatcac accatatcac ccaggctggt ccaggctggt 540 540 ctcgaactcc ctcgaactcc tggcctcaag tggcctcaag tgatccacct tgatccacct gcctcggcct gcctcggcct cccaaagtgc cccaaagtgc tgggattata tggggattata 600 600 ggcgtcagcc ggcgtcagcc actatgccca actatgccca acccgaccaa acccgaccaa ccttttttaa ccttttttaa aataaatatt aataaatatt taaaaaattg taaaaaattg 660 660 gtatttcaca gtatttcaca tatatactag tatatactag tatttacatt tatttacatt tatccacaca tatccacaca aaacggacgg aaacggacgg gcctccgctg gcctccgctg 720 720 aaccagtgag aaccagtgag gccccagacg gccccagacg tgcgcataaa tgcgcataaa taacccctgc taacccctgc gtgctgcacc gtgctgcacc acctggggag acctggggag 780 780 agggggagga agggggga ccacggtaaa ccacggtaaa tggagcgagc tggagcgagc gcatagcaaa gcatagcaaa agggacgcgg agggacgcgg ggtccttttc ggtccttttc 840 840 tctgccggtg tctgccggtg gcactgggta gcactgggta gctgtggcca gctgtggcca ggtgtggtac ggtgtggtac tttgatgggg tttgatgggg cccagggctg cccagggctg 900 900 gagctcaagg gagctcaagg aagcgtcgca aagcgtcgca gggtcacaga gggtcacaga tctgggggaa tctgggggaa ccccggggaa ccccggggaa aagcactgag aagcactgag 960 960 gcaaaaccgc gcaaaaccgc cgctcgtctc cgctcgtctc ctacaatata ctacaatata tgggaggggg tgggggggg aggttgagta aggttgagta cgttctggat cgttctggat 1020 1020 tactcataag tactcataag accttttttt accttttttt tttccttccg tttccttccg ggcgcaaaac ggcgcaaaac cgtgagctgg cgtgagctgg atttataatc atttataatc 1080 1080 gccctataaa gccctataaa gctccagagg gctccagagg cggtcaggca cggtcaggca cctgcagagg cctgcagagg agccccgccg agccccgccg ctccgccgac ctccgccgac 1140 1140 tagctgcccc tagctgcccc cgcgagcaac cgcgagcaac ggcctcgtga ggcctcgtga tttccccgcc tttccccgcc gatccggtcc gatccggtcc ccgcctcccc ccgcctcccc 1200 1200 actctgcccc actctgcccc cgcctacccc cgcctacccc ggagccgtgc ggagccgtgc agccgcctct agccgcctct ccgaatctct ccgaatctct ctcttctcct ctcttctcct 1260 1260 ggcgctcgcg ggcgctcgcg tgcgagaggg tgcgagagg aactagcgag aactagcgag aacgaggaag aacgaggaag cagctggagg cagctggagg tgacgccggg tgacgccggg 1320 1320 cagattacgc cagattacgc ctgtcagggc ctgtcagggc cgagccgagc cgagccgagc ggatcgctgg ggatcgctgg gcgctgtgca gcgctgtgca gaggaaaggc gaggaaaggc 1380 1380 gggagtgccc ggggagtgccc ggctcgctgt ggctcgctgt cgcagagccg cgcagagccg aggtgggtaa aggtgggtaa gctagcgacc gctagcgacc acctggactt acctggactt 1440 1440 cccagcgccc cccagcgccc aaccgtggct aaccgtggct tttcagccag tttcagccag gtcctctcct gtcctctcct cccgcggctt cccgcggctt ctcaaccaac ctcaaccaac 1500 1500 cccatcccag cccaccag cgccggccac cgccggccac ccaacctccc ccaacctccc gaaatgagtg gaaatgagtg cttcctgccc cttcctgccc cagcagccga cagcagccga 1560 1560 aggcgctact aggcgctact aggaacggta aggaacggta acctgttact acctgttact tttccagggg tttccagggg ccgtagtcga ccgtagtcga cccgctgccc cccgctgccc 1620 1620 gagttgctgt gagttgctgt gcgactgcgc gcgactgcgc gcgcggggct gcgcggggct agagtgcaag agagtgcaag gtgactgtgg gtgactgtgg ttcttctctg ttcttctctg 1680 1680

- 150 046157 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg2100 gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat2160 cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt2220 ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac2280 gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga2340 gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg2400 agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg2460 gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg2520 tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa2580 gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga2640 gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc2700 catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc2760 tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcattggatg2820 actttgatct ggacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat2880 aaactagtga aacccagcag acaatgtagc tagacccagt agccagatgt agctaaagag2940 accggttcac tgtgaaagct tgggtggcat ccctgtgacc cctccccagt gcctctcctg3000 gccctggaag ttgccactcc agtgcccacc agccttgtcc taataaaatt aagttgcatc3060 attttgtctg actaggtgtc cttctataat attatggggt ggaggggggt ggtatggagc3120 aaggggcaag ttgggaagac aacctgtagg gcctgcgggg tctattggga accaagctgg3180 agtgcagtgg cacaatcttg gctcactgca atctccgcct cctgggttca agcgattctc3240 ctgcctcagc ctcccgagtt gttgggattc caggcatgca tgaccaggct cagctaattt3300 ttgttttttt ggtagagacg gggtttcacc atattggcca ggctggtctc caactcctaa3360 tctcaggtga tctacccacc ttggcctccc aaattgctgg gattacaggc gtgaaccact 3420 gctcccttcc ctgtcctt3438 <210> 75 <211> 3505- 150 046157 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa cgagacaccg aaccagacat gcccgccccg t gcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg2100 gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat2160 cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt2220 ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac2280 gaacacatac tggtgaaaaa ccatacaagt g tcccgaatg tggtaaaagt tttagccgga2340 gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg2400 agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg2460 gggaaaaacc ttacaagtgt cccagtgtg ggaagagctt ttccacaagt ggacatctgg2520 tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa2580 gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga2640 gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc2700 catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc2760 tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcatt ggatg2820 actttgatct ggacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat2880 aaactagtga aacccagcag acaatgtagc tagacccagt agccagatgt agctaaagag2940 accggttcac tgtgaaagct tgggtggcat ccctgtgacc cctccccagt gcctctcctg3000 gccctggaag ttgccactcc agtgcccacc agccttgtcc taataaaatt aagttgcatc3060 attttgtctg actaggtgtc cttctataat attatggggt ggaggggggt ggtatggagc3120 aaggggcaag ttgggaagac aacctgtagg gcctgcgggg tctattggga accaagctgg3180 agtgcagtgg cacaatcttg gctcactgca atctccgcct cctgggttca agcgattctc3240 ctgcctcagc ctcccgagtt gttgggattc caggcatgca tgaccaggct cagctaattt3300 ttgttttttt ggtagagacg gggtttcacc atattggcca ggctggtctc caactcctaa3360 tctcaggtga tctacccacc ttggcctccc aaattgctgg gattacaggc gtgaaccact 3420 gctcccttcc ctgtcctt3438 <210> 75 <211> 3505

- 151 046157 <212> ДНК <213> Искусственная последовательность <220>- 151 046157 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид<223> Description of artificial sequence: Synthetic polynucleotide

<400> 75 ggaggaagcc <400> 75 ggaggaagcc atcaactaaa atcaactaaa ctacaatgac ctacaatgac tgtaagatac tgtaagatac aaaattggga aaaattggga atggtaacat atggtaacat 60 60 attttgaagt attttgaagt tctgttgaca tctgttgaca taaagaatca taaagaatca tgatattaat tgatattaat gcccatggaa gcccatggaa atgaaagggc atgaaagggc 120 120 gatcaacact gatcaacact atggtttgaa atggtttgaa aagggggaaa aagggggaaa ttgtagagca ttgtagagca cagatgtgtt cagatgtgtt cgtgtggcag cgtgtggcag 180 180 tgtgctgtct tgtgctgtct ctagcaatac ctagcaatac tcagagaaga tcagagaaga gagagaacaa gagagaacaa tgaaattctg tgaaattctg attggcccca attggcccca 240 240 gtgtgagccc gtgtgagccc agatgaggtt agatgaggtt cagctgccaa cagctgccaa ctttctcttt ctttctcttt cacatcttat cacatcttat gaaagtcatt gaaagtcatt 300 300 taagcacaac taagcacaac taactttttt taactttttt tttttttttt tttttttttt tttttttgag tttttttgag acagagtctt acagagtctt gctctgttgc gctctgttgc 360 360 ccaggacaga ccaggacaga gtgcagtagt gtgcagtagt gactcaatct gactcaatct cggctcactg cggctcactg cagcctccac cagcctccac ctcctaggct ctcctaggct 420 420 caaacggtcc caaacggtcc tcctgcatca tcctgcatca gcctcccaag gcctcccaag tagctggaat tagctggaat tacaggagtg tacaggagtg gcccaccatg gccccacatg 480 480 cccagctaat cccagctaat ttttgtattt ttttgtattt ttaatagata ttaatagata cgggggtttc cggggggtttc accatatcac accatatcac ccaggctggt ccaggctggt 540 540 ctcgaactcc ctcgaactcc tggcctcaag tggcctcaag tgatccacct tgatccacct gcctcggcct gcctcggcct cccaaagtgc cccaaagtgc tgggattata tggggattata 600 600 ggcgtcagcc ggcgtcagcc actatgccca actatgccca acccgaccaa acccgaccaa ccttttttaa ccttttttaa aataaatatt aataaatatt taaaaaattg taaaaaattg 660 660 gtatttcaca gtatttcaca tatatactag tatatactag tatttacatt tatttacatt tatccacaca tatccacaca aaacggacgg aaacggacgg gcctccgctg gcctccgctg 720 720 aaccagtgag aaccagtgag gccccagacg gccccagacg tgcgcataaa tgcgcataaa taacccctgc taacccctgc gtgctgcacc gtgctgcacc acctggggag acctggggag 780 780 agggggagga agggggga ccacggtaaa ccacggtaaa tggagcgagc tggagcgagc gcatagcaaa gcatagcaaa agggacgcgg agggacgcgg ggtccttttc ggtccttttc 840 840 tctgccggtg tctgccggtg gcactgggta gcactgggta gctgtggcca gctgtggcca ggtgtggtac ggtgtggtac tttgatgggg tttgatgggg cccagggctg cccagggctg 900 900 gagctcaagg gagctcaagg aagcgtcgca aagcgtcgca gggtcacaga gggtcacaga tctgggggaa tctgggggaa ccccggggaa ccccggggaa aagcactgag aagcactgag 960 960 gcaaaaccgc gcaaaaccgc cgctcgtctc cgctcgtctc ctacaatata ctacaatata tgggaggggg tgggggggg aggttgagta aggttgagta cgttctggat cgttctggat 1020 1020 tactcataag tactcataag accttttttt accttttttt tttccttccg tttccttccg ggcgcaaaac ggcgcaaaac cgtgagctgg cgtgagctgg atttataatc atttataatc 1080 1080 gccctataaa gccctataaa gctccagagg gctccagagg cggtcaggca cggtcaggca cctgcagagg cctgcagagg agccccgccg agccccgccg ctccgccgac ctccgccgac 1140 1140 tagctgcccc tagctgcccc cgcgagcaac cgcgagcaac ggcctcgtga ggcctcgtga tttccccgcc tttccccgcc gatccggtcc gatccggtcc ccgcctcccc ccgcctcccc 1200 1200 actctgcccc actctgcccc cgcctacccc cgcctacccc ggagccgtgc ggagccgtgc agccgcctct agccgcctct ccgaatctct ccgaatctct ctcttctcct ctcttctcct 1260 1260 ggcgctcgcg ggcgctcgcg tgcgagaggg tgcgagagg aactagcgag aactagcgag aacgaggaag aacgaggaag cagctggagg cagctggagg tgacgccggg tgacgccggg 1320 1320 cagattacgc cagattacgc ctgtcagggc ctgtcagggc cgagccgagc cgagccgagc ggatcgctgg ggatcgctgg gcgctgtgca gcgctgtgca gaggaaaggc gaggaaaggc 1380 1380 gggagtgccc ggggagtgccc ggctcgctgt ggctcgctgt cgcagagccg cgcagagccg aggtgggtaa aggtgggtaa gctagcgacc gctagcgacc acctggactt acctggactt 1440 1440 cccagcgccc cccagcgccc aaccgtggct aaccgtggct tttcagccag tttcagccag gtcctctcct gtcctctcct cccgcggctt cccgcggctt ctcaaccaac ctcaaccaac 1500 1500 cccatcccag cccaccag cgccggccac cgccggccac ccaacctccc ccaacctccc gaaatgagtg gaaatgagtg cttcctgccc cttcctgccc cagcagccga cagcagccga 1560 1560 aggcgctact aggcgctact aggaacggta aggaacggta acctgttact acctgttact tttccagggg tttccagggg ccgtagtcga ccgtagtcga cccgctgccc cccgctgccc 1620 1620 gagttgctgt gagttgctgt gcgactgcgc gcgactgcgc gcgcggggct gcgcggggct agagtgcaag agagtgcaag gtgactgtgg gtgactgtgg ttcttctctg ttcttctctg 1680 1680

- 152 046157 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg2100 gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat2160 cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt2220 ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac2280 gaacacatac tggtgaaaaa ccatacaagt gtcccgaatg tggtaaaagt tttagccgga2340 gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg2400 agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg2460 gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg2520 tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa2580 gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga2640 gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc2700 catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc2760 tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcattggatg2820 actttgatct ggacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat2880 aaactagtga aacccagcag acaatgtagc tagacccagt agccagatgt agctaaagag2940 accggttcac tgtgagaaac ccagcagaca atgtagctag acccagtagc cagatgtagc3000 taaagagacc ggttcactgt gaaagcttgg gtggcatccc tgtgacccct ccccagtgcc3060 tctcctggcc ctggaagttg ccactccagt gcccaccagc cttgtcctaa taaaattaag3120 ttgcatcatt ttgtctgact aggtgtcctt ctataatatt atggggtgga ggggggtggt3180 atggagcaag gggcaagttg ggaagacaac ctgtagggcc tgcggggtct attgggaacc3240 aagctggagt gcagtggcac aatcttggct cactgcaatc tccgcctcct gggttcaagc3300 gattctcctg cctcagcctc ccgagttgtt gggattccag gcatgcatga ccaggctcag3360 ctaatttttg tttttttggt agagacgggg tttcaccata ttggccaggc tggtctccaa3420 ctcctaatct caggtgatct acccaccttg gcctcccaaa ttgctgggat tacaggcgtg3480 aaccactgct cccttccctg tcctt3505- 152 046157 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac 1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa cgagacaccg aaccagacat gcccgccccg t gcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccc caaagaagaa gcggaaggtc ggtatccacg2100 gagtcccagc agccctcgaa ccaggtgaaa aaccttacaa atgtcctgaa tgtgggaaat2160 cattcagtcg cagcgacaac ctggtgagac atcaacgcac ccatacagga gaaaaacctt2220 ataaatgtcc agaatgtgga aagtccttct cacgagagga taacttgcac actcatcaac2280 gaacacatac tggtgaaaaa ccatacaagt g tcccgaatg tggtaaaagt tttagccgga2340 gcgatgaact tgtccgacac caacgaaccc atacaggcga gaagccttac aaatgtcccg2400 agtgtggcaa gagcttctca caatcaggga atctgactga gcatcaacga actcataccg2460 gggaaaaacc ttacaagtgt ccagagtgtg ggaagagctt ttccacaagt ggacatctgg2520 tacgccacca gaggacacat acaggggaga agccctacaa atgccccgaa tgcggtaaaa2580 gtttctctca gaatagtacc ctgaccgaac accagcgaac acacactggg aaaaaaacga2640 gtaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc2700 catacgacgt accagattac gctctcgagg acgcgctgga cgatttcgat ctcgacatgc2760 tgggttctga tgccctcgat gactttgacc tggatatgtt gggaagcgac gcatt ggatg2820 actttgatct ggacatgctc ggctccgatg ctctggacga tttcgatctc gatatgttat2880 aaactagtga aacccagcag acaatgtagc tagacccagt agccagatgt agctaaagag2940 accggttcac tgtgagaaac ccagcagaca atgtagctag acccagtagc cagat gtagc3000 taaagagacc ggttcactgt gaaagcttgg gtggcatccc tgtgacccct ccccagtgcc3060 tctcctggcc ctggaagttg ccactccagt gcccaccagc cttgtcctaa taaaattaag3120 ttgcatcatt ttgtctgact aggtgtcctt ctataatatt atggggtgga ggggggtggt3180 atggagcaag gggcaagttg ggaagacaac ctgtagggcc tgcggggtct attgggaacc3240 aagctggagt gcagtggcac aatcttggct cactgcaatc tccgcctcct gggttcaagc3300 gattctcctg cctcagcct c ccgagttgtt gggattccag gcatgcatga ccaggctcag3360 ctaatttttg tttttttggt agagacgggg tttcaccata ttggccaggc tggtctccaa3420 ctcctaatct caggtgatct acccaccttg gcctcccaaa ttgctgggat tacaggcgtg3480 aaccactgct cc cttccctg tcctt3505

- 153 046157 <210> 76 <211> 3804 <212> ДНК <213> Искусственная последовательность <220>- 153 046157 <210> 76 <211> 3804 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид<223> Description of artificial sequence: Synthetic polynucleotide

<400> 76 ggaggaagcc <400> 76 ggaggaagcc atcaactaaa atcaactaaa ctacaatgac ctacaatgac tgtaagatac tgtaagatac aaaattggga aaaattggga atggtaacat atggtaacat 60 60 attttgaagt attttgaagt tctgttgaca tctgttgaca taaagaatca taaagaatca tgatattaat tgatattaat gcccatggaa gcccatggaa atgaaagggc atgaaagggc 120 120 gatcaacact gatcaacact atggtttgaa atggtttgaa aagggggaaa aagggggaaa ttgtagagca ttgtagagca cagatgtgtt cagatgtgtt cgtgtggcag cgtgtggcag 180 180 tgtgctgtct tgtgctgtct ctagcaatac ctagcaatac tcagagaaga tcagagaaga gagagaacaa gagagaacaa tgaaattctg tgaaattctg attggcccca attggcccca 240 240 gtgtgagccc gtgtgagccc agatgaggtt agatgaggtt cagctgccaa cagctgccaa ctttctcttt ctttctcttt cacatcttat cacatcttat gaaagtcatt gaaagtcatt 300 300 taagcacaac taagcacaac taactttttt taactttttt tttttttttt tttttttttt tttttttgag tttttttgag acagagtctt acagagtctt gctctgttgc gctctgttgc 360 360 ccaggacaga ccaggacaga gtgcagtagt gtgcagtagt gactcaatct gactcaatct cggctcactg cggctcactg cagcctccac cagcctccac ctcctaggct ctcctaggct 420 420 caaacggtcc caaacggtcc tcctgcatca tcctgcatca gcctcccaag gcctcccaag tagctggaat tagctggaat tacaggagtg tacaggagtg gcccaccatg gccccacatg 480 480 cccagctaat cccagctaat ttttgtattt ttttgtattt ttaatagata ttaatagata cgggggtttc cggggggtttc accatatcac accatatcac ccaggctggt ccaggctggt 540 540 ctcgaactcc ctcgaactcc tggcctcaag tggcctcaag tgatccacct tgatccacct gcctcggcct gcctcggcct cccaaagtgc cccaaagtgc tgggattata tggggattata 600 600 ggcgtcagcc ggcgtcagcc actatgccca actatgccca acccgaccaa acccgaccaa ccttttttaa ccttttttaa aataaatatt aataaatatt taaaaaattg taaaaaattg 660 660 gtatttcaca gtatttcaca tatatactag tatatactag tatttacatt tatttacatt tatccacaca tatccacaca aaacggacgg aaacggacgg gcctccgctg gcctccgctg 720 720 aaccagtgag aaccagtgag gccccagacg gccccagacg tgcgcataaa tgcgcataaa taacccctgc taacccctgc gtgctgcacc gtgctgcacc acctggggag acctggggag 780 780 agggggagga agggggga ccacggtaaa ccacggtaaa tggagcgagc tggagcgagc gcatagcaaa gcatagcaaa agggacgcgg agggacgcgg ggtccttttc ggtccttttc 840 840 tctgccggtg tctgccggtg gcactgggta gcactgggta gctgtggcca gctgtggcca ggtgtggtac ggtgtggtac tttgatgggg tttgatgggg cccagggctg cccagggctg 900 900 gagctcaagg gagctcaagg aagcgtcgca aagcgtcgca gggtcacaga gggtcacaga tctgggggaa tctgggggaa ccccggggaa ccccggggaa aagcactgag aagcactgag 960 960 gcaaaaccgc gcaaaaccgc cgctcgtctc cgctcgtctc ctacaatata ctacaatata tgggaggggg tgggggggg aggttgagta aggttgagta cgttctggat cgttctggat 1020 1020 tactcataag tactcataag accttttttt accttttttt tttccttccg tttccttccg ggcgcaaaac ggcgcaaaac cgtgagctgg cgtgagctgg atttataatc atttataatc 1080 1080 gccctataaa gccctataaa gctccagagg gctccagagg cggtcaggca cggtcaggca cctgcagagg cctgcagagg agccccgccg agccccgccg ctccgccgac ctccgccgac 1140 1140 tagctgcccc tagctgcccc cgcgagcaac cgcgagcaac ggcctcgtga ggcctcgtga tttccccgcc tttccccgcc gatccggtcc gatccggtcc ccgcctcccc ccgcctcccc 1200 1200 actctgcccc actctgcccc cgcctacccc cgcctacccc ggagccgtgc ggagccgtgc agccgcctct agccgcctct ccgaatctct ccgaatctct ctcttctcct ctcttctcct 1260 1260 ggcgctcgcg ggcgctcgcg tgcgagaggg tgcgagagg aactagcgag aactagcgag aacgaggaag aacgaggaag cagctggagg cagctggagg tgacgccggg tgacgccggg 1320 1320 cagattacgc cagattacgc ctgtcagggc ctgtcagggc cgagccgagc cgagccgagc ggatcgctgg ggatcgctgg gcgctgtgca gcgctgtgca gaggaaaggc gaggaaaggc 1380 1380 gggagtgccc ggggagtgccc ggctcgctgt ggctcgctgt cgcagagccg cgcagagccg aggtgggtaa aggtgggtaa gctagcgacc gctagcgacc acctggactt acctggactt 1440 1440 cccagcgccc cccagcgccc aaccgtggct aaccgtggct tttcagccag tttcagccag gtcctctcct gtcctctcct cccgcggctt cccgcggctt ctcaaccaac ctcaaccaac 1500 1500 cccatcccag cccaccag cgccggccac cgccggccac ccaacctccc ccaacctccc gaaatgagtg gaaatgagtg cttcctgccc cttcctgccc cagcagccga cagcagccga 1560 1560

- 154 046157- 154 046157

aggcgctact aggcgctact aggaacggta aggaacggta acctgttact acctgttact tttccagggg tttccagggg ccgtagtcga ccgtagtcga cccgctgccc cccgctgccc 1620 1620 gagttgctgt gagttgctgt gcgactgcgc gcgactgcgc gcgcggggct gcgcggggct agagtgcaag agagtgcaag gtgactgtgg gtgactgtgg ttcttctctg ttcttctctg 1680 1680 gccaagtccg gccaagtccg agggagaacg aggggagaacg taaagatatg taaagatatg ggcctttttc ggcctttttc cccctctcac cccctctcac cttgtctcac cttgtctcac 1740 1740 caaagtccct caaagtccct agtccccgga agtccccgga gcagttagcc gcagttagcc tctttctttc tctttctttc cagggaatta cagggaatta gccagacaca gccagacaca 1800 1800 acaacgggaa acaacgggaa ccagacaccg ccagacaccg aaccagacat aaccagacat gcccgccccg gcccgccccg tgcgccctcc tgcgccctcc ccgctcgctg ccgctcgctg 1860 1860 cctttcctcc cctttcctcc ctcttgtctc ctcttgtctc tccagagccg tccagagccg gatcttcaag gatcttcaag gggagcctcc gggagcctcc gtgcccccgg gtgcccccgg 1920 1920 ctgctcagtc ctgctcagtc cctccggtgt cctccggtgt gcaggacccc gcaggacccc ggaagtcctc ggaagtcctc cccgcacagc cccgcacagc tctcgcttct tctcgcttct 1980 1980 ctttgcagcc ctttgcagcc tgtttctgcg tgtttctgcg ccggaccagt ccggaccagt cgaggactct cgaggactct ggacagtaga ggacagtaga ggccccggga ggccccggga 2040 2040 cgaccgagct cgaccgagct ggaattcgcc ggaattcgcc accatggccg accatggccg ccgaccacct ccgaccacct gatgctcgcc gatgctcgcc gagggctacc gagggctacc 2100 2100 gcctggtgca gcctggtgca gaggccgccg gaggccgccg tccgccgccg tccgccgccg ccgcccatgg ccgcccatgg ccctcatgcg ccctcatgcg ctccggactc ctccggactc 2160 2160 tgccgccgta tgccgccgta cgcgggcccg cgcgggcccg ggcctggaca ggcctggac gtgggctgag gtggggctgag gccgcggggg gccgcgggggg gctccgctgg gctccgctgg 2220 2220 ggccgccgcc ggccgccgcc gccccgccaa gccccgccaa cccggggccc cccggggccc tggcgtacgg tggcgtacgg ggccttcggg ggccttcggg ccgccgtcct ccgccgtcct 2280 2280 ccttccagcc ccttccagcc ctttccggcc ctttccggcc gtgcctccgc gtgcctccgc cggccgcggg cggccgcggg catcgcgcac catcgcgcac ctgcagcctg ctgcagcctg 2340 2340 tggcgacgcc tggcgacgcc gtaccccggc gtaccccggc cgcgcggccg cgcgcggccg cgccccccaa cgccccccaa cgctccggga cgctccggga ggccccccgg ggccccccgg 2400 2400 gcccgcagcc gcccgcagcc ggccccaagc ggccccaagc gccgcagccc gccgcagccc cgccgccgcc cgccgccgcc cgcgcacgcc cgcgcacgcc ctgggcggca ctggggcggca 2460 2460 tggacgccga tggacgccga actcatcgac actcatcgac gaggaggcgc gaggaggcgc tgacgtcgct tgacgtcgct ggagctggag ggagctggag ctggggctgc ctggggctgc 2520 2520 accgcgtgcg accgcgtgcg cgagctgccc cgagctgccc gagctgttcc gagctgttcc tgggccagag tggggccagag cgagttcgac cgagttcgac tgcttctcgg tgcttctcgg 2580 2580 acttggggtc acttggggtc cgcgccgccc cgcgccgccc gccggctccg gccggctccg tgagctgcgg tgagctgcgg tggttctggt tggttctggt ggtggttctg ggtggttctg 2640 2640 gtcagtccca gtcagtccca gctcatcaaa gctcatcaaa cccagccgca cccagccgca tgcgcaagta tgcgcaagta ccccaaccgg ccccaaccgg cccagcaaga cccagcaaga 2700 2700 cgccccccca cgcccccccca cgaacgccct cgaacgccct tacgcttgcc tacgcttgcc cagtggagtc cagtggagtc ctgtgatcgc ctgtgatcgc cgcttctccc cgcttctccc 2760 2760 gcagcgacaa gcagcgacaa cctggtgaga cctggtgaga cacatccgca cacatccgca tccacacagg tccacacagg ccagaagccc ccagaagccc ttccagtgcc ttccagtgcc 2820 2820 gcatctgcat gcatctgcat gagaaacttc gagaaacttc agccgagagg agccgagagg ataacttgca ataacttgca cactcacatc cactcacatc cgcacccaca cgcaccaca 2880 2880 caggcgaaaa caggcgaaaa gcccttcgcc gcccttcgcc tgcgacatct tgcgacatct gtggaagaaa gtggaagaaa gtttgcccgg gtttgcccgg agcgatgaac agcgatgaac 2940 2940 ttgtccgaca ttgtccgaca taccaagatc taccaagatc cacttgcggc cacttgcggc agaaggaccg agaaggaccg cccttacgct cccttacgct tgcccagtgg tgccagtgg 3000 3000 agtcctgtga agtcctgtga tcgccgcttc tcgccgcttc tcccaatcag tccaatcag ggaatctgac ggaatctgac tgagcacatc tgagcacatc cgcatccaca cgcatccaca 3060 3060 caggccagaa caggccagaa gcccttccag gcccttccag tgccgcatct tgccgcatct gcatgagaaa gcatgagaaa cttcagcaca cttcagcaca agtggacatc agtggacatc 3120 3120 tggtacgcca tggtacgcca catccgcacc catccgcacc cacacaggcg cacacaggcg aaaagccctt aaaagccctt cgcctgcgac cgcctgcgac atctgtggaa atctgtggaa 3180 3180 gaaagtttgc gaaagtttgc ccagaatagt ccagaatagt accctgaccg accctgaccg aacataccaa aacataccaa gatccacttg gatccacttg cggcagaagg cggcagaagg 3240 3240 acaagtaact acaagtaact cgaggaaacc cgaggaaacc cagcagacaa cagcagacaa tgtagctaga tgtagctaga cccagtagcc cccagtagcc agatgtagct agatgtagct 3300 3300 aaagagaccg aaagagaccg gttcactgtg gttcactgtg aaagcttggg aaagcttgggg tggcatccct tggcatccct gtgacccctc gtgacccctc cccagtgcct cccagtgcct 3360 3360 ctcctggccc ctcctggccc tggaagttgc tggaagttgc cactccagtg cactccagtg cccaccagcc cccaccagcc ttgtcctaat ttgtcctaat aaaattaagt aaaattaagt 3420 3420 tgcatcattt tgcatcattt tgtctgacta tgtctgacta ggtgtccttc ggtgtccttc tataatatta tataatatta tggggtggag tggggtggag gggggtggta gggggtggta 3480 3480

- 155 046157- 155 046157

tggagcaagg tggagcaagg ggcaagttgg ggcaagttgg gaagacaacc gaagacaacc tgtagggcct tgtagggcct gcggggtcta gcggggtcta ttgggaacca ttgggaacca 3540 3540 agctggagtg agctggagtg cagtggcaca cagtggcaca atcttggctc atcttggctc actgcaatct actgcaatct ccgcctcctg ccgcctcctg ggttcaagcg ggttcaagcg 3600 3600 attctcctgc attctcctgc ctcagcctcc ctcagcctcc cgagttgttg cgagttgttg ggattccagg ggattccagg catgcatgac catgcatgac caggctcagc caggctcagc 3660 3660 taatttttgt taatttttgt ttttttggta ttttttggta gagacggggt gagacggggt ttcaccatat ttcaccatat tggccaggct tggccaggct ggtctccaac ggtctccaac 3720 3720 tcctaatctc tcctaatctc aggtgatcta aggtgatcta cccaccttgg cccaccttgg cctcccaaat cctcccaaat tgctgggatt tgctggggatt acaggcgtga acaggcgtga 3780 3780 accactgctc accactgctc ccttccctgt ccttccctgt cctt cctt 3804 3804

<210> 77 <211> 176 <212> Белок <213> Искусственная последовательность <220><210> 77 <211> 176 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 77<223> Description of artificial sequence: Synthetic polypeptide <400> 77

Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 1015Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 1015

Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly 20 2530Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly 20 2530

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu 35 4045Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu 35 4045

Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 5560Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 5560

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu Val 65 70 7580Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu Val 65 70 7580

Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 9095Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 9095

Cys Gly Lys Ser Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln ArgCys Gly Lys Ser Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln Arg

100 105110100 105110

Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys SerThr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser

115 120125115 120125

Phe Ser Thr Ser Gly His Leu Val Arg His Gln Arg Thr His Thr GlyPhe Ser Thr Ser Gly His Leu Val Arg His Gln Arg Thr His Thr Gly

130 135140130 135140

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln AsnGlu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Asn

145 150 155160145 150 155160

- 156 046157- 156 046157

Ser Thr Leu Thr Glu His Gln Arg Thr His Thr Gly Lys Lys Thr SerSer Thr Leu Thr Glu His Gln Arg Thr His Thr Gly Lys Lys Thr Ser

165 170 175 <210> 78 <211> 176 <212> Белок <213> Искусственная последовательность <220>165 170 175 <210> 78 <211> 176 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 78<223> Description of artificial sequence: Synthetic polypeptide <400> 78

Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys SerLeu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser

5 10155 1015

Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg Thr His ThrGlyPhe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg Thr His ThrGly

25302530

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala 35 4045Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala 35 4045

Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 5560Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 5560

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His LeuArgLys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His LeuArg

70 758070 7580

Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys ProGluAla His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys ProGlu

90959095

Cys Gly Lys Ser Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg 100 105110Cys Gly Lys Ser Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg 100 105110

Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120125Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120125

Phe Ser Gln Ala Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly 130 135140Phe Ser Gln Ala Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly 130 135140

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser ThrHisGlu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser ThrHis

145 150 155160145 150 155160

Leu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Lys Lys ThrSerLeu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Lys Lys ThrSer

165 170175 <210> 79 <211> 176 <212> Белок <213> Искусственная последовательность165 170175 <210> 79 <211> 176 <212> Protein <213> Artificial sequence

- 157 046157 <220>- 157 046157 <220>

<223> Описание искусственной последовательности полипептид <400> 79<223> Description of the artificial sequence polypeptide <400> 79

Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro GluLeu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu

5 105 10

СинтетическийSynthetic

Cys Gly Lys Ser 15Cys Gly Lys Ser 15

Phe Ser Gln Ala Gly His Leu Ala Ser His Gln Arg 20 25Phe Ser Gln Ala Gly His Leu Ala Ser His Gln Arg 20 25

Thr His Thr Gly 30Thr His Thr Gly 30

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40

Phe Ser Arg Glu 45Phe Ser Arg Glu 45

Asp Asn Leu His Thr His Gln Arg Thr His Thr GlyAsp Asn Leu His Thr His Gln Arg Thr His Thr Gly

55 6055 60

Glu Lys Pro TyrGlu Lys Pro Tyr

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser 65 70 75Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser 65 70 75

Gly Asn Leu ThrGly Asn Leu Thr

Glu His Gln Arg Thr His Thr Gly Glu Lys Pro TyrGlu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr

9090

Lys Cys Pro GluLys Cys Pro Glu

Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu IleCys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile

100 105100 105

Arg His Gln Arg 110Arg His Gln Arg 110

Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro GluThr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu

115 120115 120

Cys Gly Lys Ser 125Cys Gly Lys Ser 125

Phe Ser Gln Lys Ser Ser Leu Ile Ala His Gln ArgPhe Ser Gln Lys Ser Ser Leu Ile Ala His Gln Arg

130 135 140130 135 140

Thr His Thr GlyThr His Thr Gly

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys SerGlu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser

145 150 155145 150 155

Phe Ser Gln AlaPhe Ser Gln Ala

160160

Gly His Leu Ala Ser His Gln Arg Thr His Thr GlyGly His Leu Ala Ser His Gln Arg Thr His Thr Gly

165 170165 170

Lys Lys Thr Ser 175 <210> 80 <211> 176 <212> Белок <213> Искусственная последовательность <220>Lys Lys Thr Ser 175 <210> 80 <211> 176 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 80<223> Description of the artificial sequence polypeptide <400> 80

Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro GluLeu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu

5 105 10

СинтетическийSynthetic

Cys Gly Lys Ser 15Cys Gly Lys Ser 15

- 158 046157- 158 046157

Phe Ser Thr Thr Gly Asn Leu ThrPhe Ser Thr Thr Gly Asn Leu Thr

Val His Gln ArgVal His Gln Arg

Thr His Thr Gly 30Thr His Thr Gly 30

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40

Phe Ser Thr Ser 45Phe Ser Thr Ser 45

Gly Glu Leu Val Arg His Gln Arg Thr His Thr GlyGly Glu Leu Val Arg His Gln Arg Thr His Thr Gly

55 6055 60

Glu Lys Pro TyrGlu Lys Pro Tyr

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu 65 70 75Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu 65 70 75

Asp Asn Leu His 80Asp Asn Leu His 80

Thr His Gln Arg Thr His Thr Gly Glu Lys Pro TyrThr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr

9090

Lys Cys Pro GluLys Cys Pro Glu

Cys Gly Lys Ser Phe Ser Thr Ser Gly Asn Leu ThrCys Gly Lys Ser Phe Ser Thr Ser Gly Asn Leu Thr

100 105100 105

Glu His Gln Arg 110Glu His Gln Arg 110

Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro GluThr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu

115 120115 120

Cys Gly Lys Ser 125Cys Gly Lys Ser 125

Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln ArgPhe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg

130 135 140130 135 140

Thr His Thr GlyThr His Thr Gly

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys SerGlu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser

145 150 155145 150 155

Phe Ser Gln ArgPhe Ser Gln Arg

160160

Ala Asn Leu Arg Ala His Gln Arg Thr His Thr GlyAla Asn Leu Arg Ala His Gln Arg Thr His Thr Gly

165 170165 170

Lys Lys Thr SerLys Lys Thr Ser

175 <210> 81 <211> 176 <212> Белок <213> Искусственная последовательность <220>175 <210> 81 <211> 176 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности<223> Description of the artificial sequence

Синтетический полипептид <400> 81Synthetic polypeptide <400> 81

Leu Glu Pro Gly Glu LysLeu Glu Pro Gly Glu Lys

55

Phe Ser Ser Arg Arg ThrPhe Ser Ser Arg Arg Thr

Glu Lys Pro Tyr Lys Cys 35Glu Lys Pro Tyr Lys Cys 35

Pro Tyr Lys Cys Pro Glu 10Pro Tyr Lys Cys Pro Glu 10

Cys Arg Ala His Gln Arg 25Cys Arg Ala His Gln Arg 25

Pro Glu Cys Gly Lys Ser 40Pro Glu Cys Gly Lys Ser 40

Cys Gly Lys Ser 15Cys Gly Lys Ser 15

Thr His Thr Gly 30Thr His Thr Gly 30

Phe Ser Thr Thr 45Phe Ser Thr Thr 45

- 159 046157- 159 046157

Gly Ala Leu Thr Glu His Gln ArgGly Ala Leu Thr Glu His Gln Arg

5555

Thr His Thr GlyThr His Thr Gly

Glu Lys Pro TyrGlu Lys Pro Tyr

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 65 70 75Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 65 70 75

Asp Glu Leu Val 80Asp Glu Leu Val 80

Arg His Gln Arg Thr His 85Arg His Gln Arg Thr His 85

Thr Gly Glu Lys Pro TyrThr Gly Glu Lys Pro Tyr

Lys Cys Pro GluLys Cys Pro Glu

Cys Gly LysCys Gly Lys

Ser PheSer Phe

100100

Ser Arg Asn Asp Ala Leu ThrSer Arg Asn Asp Ala Leu Thr

105105

Glu His Gln Arg 110Glu His Gln Arg 110

Thr HisThr His

Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 115 120Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 115 120

Cys Gly Lys Ser 125Cys Gly Lys Ser 125

Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln ArgPhe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg

130 135 140130 135 140

Thr His Thr GlyThr His Thr Gly

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys SerGlu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser

145 150 155145 150 155

Phe Ser Thr SerPhe Ser Thr Ser

160160

His Ser Leu Thr Glu His Gln Arg Thr His Thr GlyHis Ser Leu Thr Glu His Gln Arg Thr His Thr Gly

165 170165 170

Lys Lys Thr Ser 175 <210> 82 <211> 176 <212> Белок <213> Искусственная последовательность <220>Lys Lys Thr Ser 175 <210> 82 <211> 176 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности<223> Description of the artificial sequence

Синтетический полипептид <400> 82Synthetic polypeptide <400> 82

Leu Glu Pro Gly 1Leu Glu Pro Gly 1

Glu Lys Pro Tyr 5Glu Lys Pro Tyr 5

Lys Cys Pro Glu 10Lys Cys Pro Glu 10

Cys Gly Lys Ser 15Cys Gly Lys Ser 15

Phe Ser Arg LysPhe Ser Arg Lys

Asp Asn Leu LysAsp Asn Leu Lys

Asn His Gln Arg 25Asn His Gln Arg 25

Thr His Thr Gly 30Thr His Thr Gly 30

Glu Lys Pro Tyr 35Glu Lys Pro Tyr 35

Lys Cys Pro Glu 40Lys Cys Pro Glu 40

Cys Gly Lys SerCys Gly Lys Ser

Phe Ser Asp Pro 45Phe Ser Asp Pro 45

Gly Ala Leu Val 50Gly Ala Leu Val 50

Arg His Gln Arg 55Arg His Gln Arg 55

Thr His Thr GlyThr His Thr Gly

Glu Lys Pro TyrGlu Lys Pro Tyr

Lys Cys Pro Glu 65Lys Cys Pro Glu 65

Cys Gly Lys Ser 70Cys Gly Lys Ser 70

Phe Ser Arg Glu 75Phe Ser Arg Glu 75

Asp Asn Leu His 80Asp Asn Leu His 80

Thr His Gln ArgThr His Gln Arg

Thr His Thr GlyThr His Thr Gly

Glu Lys Pro TyrGlu Lys Pro Tyr

Lys Cys Pro GluLys Cys Pro Glu

- 160 046157- 160 046157

9090

Cys Gly Lys Ser Phe Ser Asp Pro Gly Ala Leu ValCys Gly Lys Ser Phe Ser Asp Pro Gly Ala Leu Val

100 105100 105

Arg His Gln Arg 110Arg His Gln Arg 110

Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro GluThr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu

115 120115 120

Cys Gly Lys Ser 125Cys Gly Lys Ser 125

Phe Ser Thr Ser Gly Glu Leu Val Arg His Gln ArgPhe Ser Thr Ser Gly Glu Leu Val Arg His Gln Arg

130 135 140130 135 140

Thr His Thr GlyThr His Thr Gly

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys SerGlu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser

145 150 155145 150 155

Phe Ser Arg LysPhe Ser Arg Lys

160160

Asp Asn Leu Lys Asn His Gln Arg Thr His Thr GlyAsp Asn Leu Lys Asn His Gln Arg Thr His Thr Gly

165 170165 170

Lys Lys Thr SerLys Lys Thr Ser

175 <210> 83 <211> 232 <212> Белок <213> Искусственная последовательность <220>175 <210> 83 <211> 232 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности<223> Description of the artificial sequence

Синтетический полипептид <400> 83Synthetic polypeptide <400> 83

Leu Glu Pro Gly 1Leu Glu Pro Gly 1

Glu Lys Pro Tyr 5Glu Lys Pro Tyr 5

Lys Cys Pro Glu 10Lys Cys Pro Glu 10

Cys Gly Lys Ser 15Cys Gly Lys Ser 15

Phe Ser Ser Lys 20Phe Ser Ser Lys 20

Lys Ala Leu ThrLys Ala Leu Thr

Glu His Gln Arg 25Glu His Gln Arg 25

Thr His Thr Gly 30Thr His Thr Gly 30

Glu Lys Pro Tyr 35Glu Lys Pro Tyr 35

Lys Cys Pro Glu 40Lys Cys Pro Glu 40

Cys Gly Lys SerCys Gly Lys Ser

Phe Ser Ser Pro 45Phe Ser Ser Pro 45

Ala Asp Leu Thr 50Ala Asp Leu Thr 50

Arg His Gln Arg 55Arg His Gln Arg 55

Thr His Thr GlyThr His Thr Gly

Glu Lys Pro TyrGlu Lys Pro Tyr

Lys Cys Pro Glu 65Lys Cys Pro Glu 65

Cys Gly Lys Ser 70Cys Gly Lys Ser 70

Phe Ser Arg Ser 75Phe Ser Arg Ser 75

Asp Asn Leu Val 80Asp Asn Leu Val 80

Arg His Gln ArgArg His Gln Arg

Thr His Thr Gly 85Thr His Thr Gly 85

Glu Lys Pro Tyr 90Glu Lys Pro Tyr 90

Lys Cys Pro GluLys Cys Pro Glu

Cys Gly Lys SerCys Gly Lys Ser

100100

Phe Ser Arg GluPhe Ser Arg Glu

Asp Asn Leu His 105Asp Asn Leu His 105

Thr His Gln ArgThr His Gln Arg

110110

Thr His Thr Gly 115Thr His Thr Gly 115

Glu Lys Pro TyrGlu Lys Pro Tyr

120120

Lys Cys Pro GluLys Cys Pro Glu

Cys Gly Lys SerCys Gly Lys Ser

125125

- 161 046157- 161 046157

Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg Thr His Thr GlyPhe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg Thr His Thr Gly

130 135140130 135140

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln SerGlu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser

145 150 155160145 150 155160

Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro TyrGly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr

165 170175165 170175

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly His Leu ValLys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly His Leu Val

180 185190180 185190

Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro GluArg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu

195 200205195 200205

Cys Gly Lys Ser Phe Ser Gln Asn Ser Thr Leu Thr Glu His Gln ArgCys Gly Lys Ser Phe Ser Gln Asn Ser Thr Leu Thr Glu His Gln Arg

210 215220210 215220

Thr His Thr Gly Lys Lys Thr SerThr His Thr Gly Lys Lys Thr Ser

225230 <210> 84 <211> 176 <212> Белок <213> Искусственная последовательность <220>225230 <210> 84 <211> 176 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 84<223> Description of artificial sequence: Synthetic polypeptide <400> 84

Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys SerLeu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser

5 10155 1015

Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His ThrGlyPhe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His ThrGly

25302530

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 35 4045Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 35 4045

Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 5560Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 5560

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn LeuHisLys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn LeuHis

70 758070 7580

Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys ProGluThr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys ProGlu

90959095

- 162 046157- 162 046157

Cys Gly Lys Ser Phe Ser Arg SerCys Gly Lys Ser Phe Ser Arg Ser

100100

Asp Glu Leu ValAsp Glu Leu Val

105105

Arg His Gln Arg 110Arg His Gln Arg 110

Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro GluThr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu

115 120115 120

Cys Gly Lys Ser 125Cys Gly Lys Ser 125

Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln ArgPhe Ser Gln Ser Gly Asn Leu Thr Glu His Gln Arg

130 135 140130 135 140

Thr His Thr GlyThr His Thr Gly

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys SerGlu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser

145 150 155145 150 155

Phe Ser Thr SerPhe Ser Thr Ser

160160

Gly His Leu Val Arg His Gln Arg Thr His Thr GlyGly His Leu Val Arg His Gln Arg Thr His Thr Gly

165 170165 170

Lys Lys Thr SerLys Lys Thr Ser

175 <210> 85 <211> 176 <212> Белок <213> Искусственная последовательность <220>175 <210> 85 <211> 176 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 85<223> Description of the artificial sequence polypeptide <400> 85

Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro GluLeu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu

5 105 10

СинтетическийSynthetic

Cys Gly Lys Ser 15Cys Gly Lys Ser 15

Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg 20 25Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg 20 25

Thr His Thr Gly 30Thr His Thr Gly 30

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40

Phe Ser Ser Pro 45Phe Ser Ser Pro 45

Ala Asp Leu Thr Arg His Gln Arg Thr His Thr GlyAla Asp Leu Thr Arg His Gln Arg Thr His Thr Gly

55 6055 60

Glu Lys Pro TyrGlu Lys Pro Tyr

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 65 70 75Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 65 70 75

Asp Asn Leu Val 80Asp Asn Leu Val 80

Arg His Gln Arg Thr His Thr Gly Glu Lys Pro TyrArg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr

9090

Lys Cys Pro GluLys Cys Pro Glu

Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu HisCys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His

100 105100 105

Thr His Gln Arg 110Thr His Gln Arg 110

Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro GluThr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu

115 120115 120

Cys Gly Lys SerCys Gly Lys Ser

125125

- 163 046157- 163 046157

Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln ArgPhe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg

130 135 140130 135 140

Thr His Thr GlyThr His Thr Gly

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys SerGlu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser

145 150 155145 150 155

Phe Ser Gln SerPhe Ser Gln Ser

160160

Gly Asn Leu Thr Glu His Gln Arg Thr His Thr GlyGly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly

165 170165 170

Lys Lys Thr SerLys Lys Thr Ser

175 <210> 86 <211> 232 <212> Белок <213> Искусственная последовательность <220>175 <210> 86 <211> 232 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 86<223> Description of the artificial sequence polypeptide <400> 86

Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro GluLeu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu

5 105 10

СинтетическийSynthetic

Cys Gly Lys Ser 15Cys Gly Lys Ser 15

Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg 20 25Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg 20 25

Thr His Thr Gly 30Thr His Thr Gly 30

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40

Phe Ser Arg Asn 45Phe Ser Arg Asn 45

Asp Ala Leu Thr Glu His Gln Arg Thr His Thr GlyAsp Ala Leu Thr Glu His Gln Arg Thr His Thr Gly

55 6055 60

Glu Lys Pro TyrGlu Lys Pro Tyr

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn 65 70 75Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn 65 70 75

Asp Ala Leu ThrAsp Ala Leu Thr

Glu His Gln Arg Thr His Thr Gly Glu Lys Pro TyrGlu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr

9090

Lys Cys Pro GluLys Cys Pro Glu

Cys Gly Lys Ser Phe Ser Ser Pro Ala Asp Leu ThrCys Gly Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr

100 105100 105

Arg His Gln Arg 110Arg His Gln Arg 110

Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro GluThr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu

115 120115 120

Cys Gly Lys Ser 125Cys Gly Lys Ser 125

Phe Ser Asp Pro Gly Asn Leu Val Arg His Gln ArgPhe Ser Asp Pro Gly Asn Leu Val Arg His Gln Arg

130 135 140130 135 140

Thr His Thr GlyThr His Thr Gly

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys SerGlu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser

145 150 155145 150 155

Phe Ser Gln ArgPhe Ser Gln Arg

160160

Ala His Leu Glu Arg His Gln Arg Thr His Thr GlyAla His Leu Glu Arg His Gln Arg Thr His Thr Gly

Glu Lys Pro TyrGlu Lys Pro Tyr

- 164 046157- 164 046157

165165

170170

175175

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln SerLys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser

180 185180 185

Ser Ser Leu ValSer Ser Leu Val

190190

Arg His Gln Arg Thr His Thr Gly Glu Lys Pro TyrArg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr

195 200195 200

Lys Cys Pro Glu 205Lys Cys Pro Glu 205

Cys Gly Lys Ser Phe Ser His Arg Thr Thr Leu ThrCys Gly Lys Ser Phe Ser His Arg Thr Thr Leu Thr

210 215 220210 215 220

Asn His Gln ArgAsn His Gln Arg

Thr His Thr Gly Lys Lys Thr SerThr His Thr Gly Lys Lys Thr Ser

225 230 <210> 87 <211> 176 <212> Белок <213> Искусственная последовательность <220>225 230 <210> 87 <211> 176 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 87<223> Description of the artificial sequence polypeptide <400> 87

Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro GluLeu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu

5 105 10

СинтетическийSynthetic

Cys Gly Lys Ser 15Cys Gly Lys Ser 15

Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg 20 25Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg 20 25

Thr His Thr Gly 30Thr His Thr Gly 30

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40

Phe Ser Ser Pro 45Phe Ser Ser Pro 45

Ala Asp Leu Thr Arg His Gln Arg Thr His Thr GlyAla Asp Leu Thr Arg His Gln Arg Thr His Thr Gly

55 6055 60

Glu Lys Pro TyrGlu Lys Pro Tyr

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro 65 70 75Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro 65 70 75

Gly Asn Leu ValGly Asn Leu Val

Arg His Gln Arg Thr His Thr Gly Glu Lys Pro TyrArg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr

9090

Lys Cys Pro GluLys Cys Pro Glu

Cys Gly Lys Ser Phe Ser Gln Arg Ala His Leu GluCys Gly Lys Ser Phe Ser Gln Arg Ala His Leu Glu

100 105100 105

Arg His Gln Arg 110Arg His Gln Arg 110

Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro GluThr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu

115 120115 120

Cys Gly Lys Ser 125Cys Gly Lys Ser 125

Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln ArgPhe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg

130 135 140130 135 140

Thr His Thr GlyThr His Thr Gly

- 165 046157- 165 046157

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His ArgGlu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His Arg

145 150 155 160145 150 155 160

Thr Thr Leu Thr Asn His Gln Arg Thr HisThr Thr Leu Thr Asn His Gln Arg Thr His

165 170165 170

Thr Gly Lys Lys Thr SerThr Gly Lys Lys Thr Ser

175 <210> 88 <211> 204 <212> Белок <213> Искусственная последовательность <220>175 <210> 88 <211> 204 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 88<223> Description of artificial sequence: Synthetic polypeptide <400> 88

Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys SerLeu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser

5 10155 1015

Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His ThrGlyPhe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His ThrGly

25302530

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro 35 4045Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro 35 4045

Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 5560Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 5560

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu LeuValLys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu LeuVal

70 758070 7580

Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys ProGluArg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys ProGlu

90959095

Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile Arg His Gln Arg 100 105110Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile Arg His Gln Arg 100 105110

Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120125Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120125

Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg Thr His Thr Gly 130 135140Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg Thr His Thr Gly 130 135140

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser GlnLeuGlu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser GlnLeu

145 150 155160145 150 155160

Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys ProTyrAla His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys ProTyr

165 170175165 170175

- 166 046157- 166 046157

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg SerLys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser

180 185180 185

Asp His Leu Thr 190Asp His Leu Thr 190

Asn His Gln Arg Thr His Thr Gly Lys Lys Thr SerAsn His Gln Arg Thr His Thr Gly Lys Lys Thr Ser

195 200 <210> 89 <211> 176 <212> Белок <213> Искусственная последовательность <220>195 200 <210> 89 <211> 176 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 89<223> Description of the artificial sequence polypeptide <400> 89

Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro GluLeu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu

5 105 10

СинтетическийSynthetic

Cys Gly Lys Ser 15Cys Gly Lys Ser 15

Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg 20 25Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg 20 25

Thr His Thr Gly 30Thr His Thr Gly 30

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40

Phe Ser His Arg 45Phe Ser His Arg 45

Thr Thr Leu Thr Asn His Gln Arg Thr His Thr GlyThr Thr Leu Thr Asn His Gln Arg Thr His Thr Gly

55 6055 60

Glu Lys Pro TyrGlu Lys Pro Tyr

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu 65 70 75Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu 65 70 75

Asp Asn Leu His 80Asp Asn Leu His 80

Thr His Gln Arg Thr His Thr Gly Glu Lys Pro TyrThr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr

9090

Lys Cys Pro GluLys Cys Pro Glu

Cys Gly Lys Ser Phe Ser Thr Ser His Ser Leu ThrCys Gly Lys Ser Phe Ser Thr Ser His Ser Leu Thr

100 105100 105

Glu His Gln Arg 110Glu His Gln Arg 110

Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro GluThr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu

115 120115 120

Cys Gly Lys Ser 125Cys Gly Lys Ser 125

Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln ArgPhe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg

130 135 140130 135 140

Thr His Thr GlyThr His Thr Gly

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys SerGlu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser

145 150 155145 150 155

Phe Ser Arg GluPhe Ser Arg Glu

160160

Asp Asn Leu His Thr His Gln Arg Thr His Thr GlyAsp Asn Leu His Thr His Gln Arg Thr His Thr Gly

165 170165 170

Lys Lys Thr SerLys Lys Thr Ser

175175

- 167 046157 <210> 90 <211> 176 <212> Белок <213> Искусственная последовательность <220>- 167 046157 <210> 90 <211> 176 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 90<223> Description of the artificial sequence polypeptide <400> 90

Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro GluLeu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu

5 105 10

Phe Ser Asp Pro Gly Ala Leu Val Arg His Gln ArgPhe Ser Asp Pro Gly Ala Leu Val Arg His Gln Arg

2525

СинтетическийSynthetic

Cys Gly Lys Ser 15Cys Gly Lys Ser 15

Thr His Thr Gly 30Thr His Thr Gly 30

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 35 40

Phe Ser Arg Ser 45Phe Ser Arg Ser 45

Asp Asn Leu Val Arg His Gln Arg Thr His Thr GlyAsp Asn Leu Val Arg His Gln Arg Thr His Thr Gly

55 6055 60

Glu Lys Pro TyrGlu Lys Pro Tyr

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser 65 70 75Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser 65 70 75

Gly Asp Leu Arg 80Gly Asp Leu Arg 80

Arg His Gln Arg Thr His Thr Gly Glu Lys Pro TyrArg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr

9090

Lys Cys Pro GluLys Cys Pro Glu

Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu IleCys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile

100 105100 105

Arg His Gln Arg 110Arg His Gln Arg 110

Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro GluThr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu

115 120115 120

Cys Gly Lys Ser 125Cys Gly Lys Ser 125

Phe Ser Thr Ser Gly Asn Leu Val Arg His Gln ArgPhe Ser Thr Ser Gly Asn Leu Val Arg His Gln Arg

130 135 140130 135 140

Thr His Thr GlyThr His Thr Gly

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys SerGlu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser

145 150 155145 150 155

Phe Ser Arg SerPhe Ser Arg Ser

160160

Asp Asn Leu Val Arg His Gln Arg Thr His Thr GlyAsp Asn Leu Val Arg His Gln Arg Thr His Thr Gly

165 170165 170

Lys Lys Thr Ser 175 <210> 91 <211> 260 <212> Белок <213> Искусственная последовательность <220>Lys Lys Thr Ser 175 <210> 91 <211> 260 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид<223> Description of the artificial polypeptide sequence

СинтетическийSynthetic

- 168 046157 <400> 91- 168 046157 <400> 91

Leu Glu Pro Gly Glu Lys Pro Tyr LysLeu Glu Pro Gly Glu Lys Pro Tyr Lys

55

Phe Ser Arg Arg Asp Glu Leu Asn ValPhe Ser Arg Arg Asp Glu Leu Asn Val

2525

Glu Lys Pro Tyr Lys Cys Pro Glu CysGlu Lys Pro Tyr Lys Cys Pro Glu Cys

4040

Asp His Leu Thr Asn His Gln Arg ThrAsp His Leu Thr Asn His Gln Arg Thr

5555

Lys Cys Pro Glu Cys Gly Lys Ser Phe 65 70Lys Cys Pro Glu Cys Gly Lys Ser Phe 65 70

Arg His Gln Arg Thr His Thr Gly Glu 85Arg His Gln Arg Thr His Thr Gly Glu 85

Cys Gly Lys Ser Phe Ser Arg Ser AspCys Gly Lys Ser Phe Ser Arg Ser Asp

100 105100 105

Thr His Thr Gly Glu Lys Pro Tyr LysThr His Thr Gly Glu Lys Pro Tyr Lys

115 120115 120

Phe Ser His Arg Thr Thr Leu Thr AsnPhe Ser His Arg Thr Thr Leu Thr Asn

130 135130 135

Glu Lys Pro Tyr Lys Cys Pro Glu Cys 145 150Glu Lys Pro Tyr Lys Cys Pro Glu Cys 145 150

Asp Asn Leu His Thr His Gln Arg ThrAsp Asn Leu His Thr His Gln Arg Thr

165165

Lys Cys Pro Glu Cys Gly Lys Ser PheLys Cys Pro Glu Cys Gly Lys Ser Phe

180 185180 185

Glu His Gln Arg Thr His Thr Gly GluGlu His Gln Arg Thr His Thr Gly Glu

195 200195 200

Cys Gly Lys Ser Phe Ser Gln Ser SerCys Gly Lys Ser Phe Ser Gln Ser Ser

210 215210 215

Thr His Thr Gly Glu Lys Pro Tyr LysThr His Thr Gly Glu Lys Pro Tyr Lys

225 230225 230

Phe Ser Arg Glu Asp Asn Leu His ThrPhe Ser Arg Glu Asp Asn Leu His Thr

245245

Pro Glu Cys Gly Lys Ser 15Pro Glu Cys Gly Lys Ser 15

Gln Arg Thr His Thr Gly 30Gln Arg Thr His Thr Gly 30

Lys Ser Phe Ser Arg Ser 45Lys Ser Phe Ser Arg Ser 45

Thr Gly Glu Lys Pro Tyr 60Thr Gly Glu Lys Pro Tyr 60

Arg Ser Asp Asp Leu Val 75 80Arg Ser Asp Asp Leu Val 75 80

Pro Tyr Lys Cys Pro Glu 95Pro Tyr Lys Cys Pro Glu 95

Leu Val Arg His Gln ArgLeu Val Arg His Gln Arg

110110

Pro Glu Cys Gly Lys SerPro Glu Cys Gly Lys Ser

125125

Gln Arg Thr His Thr Gly 140Gln Arg Thr His Thr Gly 140

Lys Ser Phe Ser Arg GluLys Ser Phe Ser Arg Glu

155 160155 160

Thr Gly Glu Lys Pro TyrThr Gly Glu Lys Pro Tyr

175175

Thr Ser His Ser Leu ThrThr Ser His Ser Leu Thr

190190

Pro Tyr Lys Cys Pro GluPro Tyr Lys Cys Pro Glu

205205

Leu Val Arg His Gln ArgLeu Val Arg His Gln Arg

220220

Pro Glu Cys Gly Lys SerPro Glu Cys Gly Lys Ser

235 240235 240

Gln Arg Thr His Thr GlyGln Arg Thr His Thr Gly

255255

- 169 046157- 169 046157

Lys Lys Thr SerLys Lys Thr Ser

260 <210> 92 <211> 177 <212> Белок <213> Искусственная последовательность <220>260 <210> 92 <211> 177 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 92<223> Description of the artificial sequence polypeptide <400> 92

Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp ArgArg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg

5 105 10

СинтетическийSynthetic

Arg Phe Ser Arg 15Arg Phe Ser Arg 15

Ser Asp Asn Leu Val Arg His Ile Arg Ile His Thr 20 25Ser Asp Asn Leu Val Arg His Ile Arg Ile His Thr 20 25

Gly Gln Lys Pro 30Gly Gln Lys Pro 30

Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg 35 40Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg 35 40

Glu Asp Asn Leu 45Glu Asp Asn Leu 45

His Thr His Ile Arg Thr His Thr Gly Glu Lys ProHis Thr His Ile Arg Thr His Thr Gly Glu Lys Pro

55 6055 60

Phe Ala Cys AspPhe Ala Cys Asp

Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu LeuIle Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu

70 7570 75

Val Arg His ThrVal Arg His Thr

Lys Ile His Leu Arg Gln Lys Asp Arg Pro Tyr AlaLys Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala

9090

Cys Pro Val GluCys Pro Val Glu

Ser Cys Asp Arg Arg Phe Ser Gln Ser Gly Asn LeuSer Cys Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu

100 105100 105

Thr Glu His IleThr Glu His Ile

110110

Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys ArgArg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg

115 120115 120

Ile Cys Met Arg 125Ile Cys Met Arg 125

Asn Phe Ser Thr Ser Gly His Leu Val Arg His IleAsn Phe Ser Thr Ser Gly His Leu Val Arg His Ile

130 135 140130 135 140

Arg Thr His ThrArg Thr His Thr

Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly ArgGly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg

145 150 155145 150 155

Lys Phe Ala GlnLys Phe Ala Gln

160160

Asn Ser Thr Leu Thr Glu His Thr Lys Ile His LeuAsn Ser Thr Leu Thr Glu His Thr Lys Ile His Leu

165 170165 170

Arg Gln Lys AspArg Gln Lys Asp

175175

LysLys

- 170 046157 <210> 93 <211> 177 <212> Белок <213> Искусственная последовательность <220>- 170 046157 <210> 93 <211> 177 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 93<223> Description of the artificial sequence polypeptide <400> 93

Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp ArgArg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg

5 105 10

СинтетическийSynthetic

Arg Phe Ser Arg 15Arg Phe Ser Arg 15

Ser Asp Asn Leu Val Arg His Ile Arg Ile His Thr 20 25Ser Asp Asn Leu Val Arg His Ile Arg Ile His Thr 20 25

Gly Gln Lys Pro 30Gly Gln Lys Pro 30

Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser His 35 40Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser His 35 40

Arg Thr Thr Leu 45Arg Thr Thr Leu 45

Thr Asn His Ile Arg Thr His Thr Gly Glu Lys ProThr Asn His Ile Arg Thr His Thr Gly Glu Lys Pro

55 6055 60

Phe Ala Cys AspPhe Ala Cys Asp

Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu 65 70 75Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu 65 70 75

His Thr His ThrHis Thr His Thr

Lys Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala 85 90Lys Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala 85 90

Cys Pro Val GluCys Pro Val Glu

Ser Cys Asp Arg Arg Phe Ser Thr Ser His Ser LeuSer Cys Asp Arg Arg Phe Ser Thr Ser His Ser Leu

100 105100 105

Thr Glu His IleThr Glu His Ile

110110

Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys ArgArg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg

115 120115 120

Ile Cys Met Arg 125Ile Cys Met Arg 125

Asn Phe Ser Gln Ser Ser Ser Leu Val Arg His IleAsn Phe Ser Gln Ser Ser Ser Leu Val Arg His Ile

130 135 140130 135 140

Arg Thr His ThrArg Thr His Thr

Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly ArgGly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg

145 150 155145 150 155

Lys Phe Ala ArgLys Phe Ala Arg

160160

Glu Asp Asn Leu His Thr His Thr Lys Ile His LeuGlu Asp Asn Leu His Thr His Thr Lys Ile His Leu

165 170165 170

Arg Gln Lys AspArg Gln Lys Asp

175175

Lys <210> 94 <211> 264 <212> Белок <213> Искусственная последовательностьLys <210> 94 <211> 264 <212> Protein <213> Artificial sequence

- 171 046157 <220>- 171 046157 <220>

<223> Описание искусственной последовательности<223> Description of the artificial sequence

Синтетический полипептид <400> 94Synthetic polypeptide <400> 94

Arg Pro Tyr Ala 1Arg Pro Tyr Ala 1

Cys Pro Val Glu Ser 5Cys Pro Val Glu Ser 5

Arg Asp Glu LeuArg Asp Glu Leu

Asn Val His Ile ArgAsn Val His Ile Arg

Phe Gln Cys ArgPhe Gln Cys Arg

Ile Cys Met Arg AsnIle Cys Met Arg Asn

Thr Asn His IleThr Asn His Ile

Arg Thr His Thr Gly 55Arg Thr His Thr Gly 55

Cys Asp Arg 10Cys Asp Arg 10

Ile His ThrIle His Thr

Phe Ser ArgPhe Ser Arg

Glu Lys Pro 60Glu Lys Pro 60

Arg Phe Ser Arg 15Arg Phe Ser Arg 15

Gly Gln Lys Pro 30Gly Gln Lys Pro 30

Ser Asp His Leu 45Ser Asp His Leu 45

Phe Ala Cys AspPhe Ala Cys Asp

Ile Cys 65Ile Cys 65

Lys IleLys Ile

Ser CysSer Cys

Arg IleArg Ile

Asn PheAsn Phe

130130

Gly Glu 145Gly Glu 145

Glu AspGlu Asp

Arg ProArg Pro

Ser HisSer His

Phe GlnPhe Gln

210210

Val ArgVal Arg

Gly ArgGly Arg

His LeuHis Leu

Asp ArgAsp Arg

100100

His Thr 115His Thr 115

Ser HisSer His

Lys ProLys Pro

Asn LeuAsn Leu

Tyr AlaTyr Ala

180180

Ser LeuSer Leu

195195

Cys ArgCysArg

His IleHis Ile

Lys PheLys Phe

Arg Gln 85Arg Gln 85

Arg PheArg Phe

Gly GlnGly Gln

Arg ThrArg Thr

Phe AlaPhe Ala

150150

His Thr 165His Thr 165

Cys ProCys Pro

Thr GluThr Glu

Ile CysIle Cys

Arg ThrArg Thr

Ala ArgAla Arg

Lys AspLys Asp

Ser ArgSer Arg

Lys ProLys Pro

120120

Thr Leu 135Thr Leu 135

Cys AspCys Asp

His ThrHis Thr

Val GluVal Glu

His IleHis Ile

200200

Met Arg 215Met Arg 215

His ThrHis Thr

Ser AspSer Asp

Arg ProArg Pro

Ser Asp 105Ser Asp 105

Phe GlnPhe Gln

Thr AsnThr Asn

Ile CysIle Cys

Lys IleLys Ile

170170

Ser Cys 185Ser Cys 185

Arg IleArg Ile

Asn PheAsn Phe

Gly GluGly Glu

Asp Leu 75Asp Leu 75

Tyr AlaTyr Ala

Asn LeuAsn Leu

Cys ArgCysArg

His IleHis Ile

140140

Gly Arg 155Gly Arg 155

His LeuHis Leu

Asp ArgAsp Arg

His ThrHis Thr

Ser GlnSer Gln

220220

Lys ProLys Pro

Val Arg His ThrVal Arg His Thr

Cys Pro Val GluCys Pro Val Glu

Val Arg His IleVal Arg His Ile

110110

Ile Cys Met Arg 125Ile Cys Met Arg 125

Arg Thr His ThrArg Thr His Thr

Lys Phe Ala ArgLys Phe Ala Arg

160160

Arg Gln Lys AspArg Gln Lys Asp

175175

Arg Phe Ser Thr 190Arg Phe Ser Thr 190

Gly Gln Lys Pro 205Gly Gln Lys Pro 205

Ser Ser Ser LeuSer Ser Ser Leu

Phe Ala Cys AspPhe Ala Cys Asp

- 172 046157- 172 046157

225 230 235225 230 235

240240

Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn LeuIle Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu

245 250245 250

His Thr His ThrHis Thr His Thr

255255

Lys Ile His Leu Arg Gln Lys AspLys Ile His Leu Arg Gln Lys Asp

260 <210> 95 <211> 264 <212> Белок <213> Искусственная последовательность <220>260 <210> 95 <211> 264 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 95<223> Description of the artificial sequence polypeptide <400> 95

Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp ArgArg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg

5 105 10

СинтетическийSynthetic

Arg Phe Ser AspArg Phe Ser Asp

Pro Gly Ala Leu Val ArgPro Gly Ala Leu Val Arg

His Ile Arg Ile His Thr 25His Ile Arg Ile His Thr 25

Gly Gln Lys Pro 30Gly Gln Lys Pro 30

Phe Gln Cys Arg Ile Cys 35Phe Gln Cys Arg Ile Cys 35

Met Arg Asn Phe Ser Arg 40Met Arg Asn Phe Ser Arg 40

Ser Asp Asn Leu 45Ser Asp Asn Leu 45

Val Arg His Ile Arg Thr 50Val Arg His Ile Arg Thr 50

His Thr Gly Glu Lys Pro 55 60His Thr Gly Glu Lys Pro 55 60

Phe Ala Cys AspPhe Ala Cys Asp

Ile Cys Gly Arg Lys Phe 65 70Ile Cys Gly Arg Lys Phe 65 70

Ala Gln Ser Gly Asp Leu 75Ala Gln Ser Gly Asp Leu 75

Arg Arg His ThrArg Arg His Thr

Lys Ile His Leu Arg Gln 85Lys Ile His Leu Arg Gln 85

Lys Asp Arg Pro Tyr Ala 90Lys Asp Arg Pro Tyr Ala 90

Cys Pro Val GluCys Pro Val Glu

Ser Cys Asp Arg Arg PheSer Cys Asp Arg Arg Phe

100100

Ser Thr His Leu Asp LeuSer Thr His Leu Asp Leu

105105

Ile Arg His Ile 110Ile Arg His Ile 110

Arg Ile His Thr Gly Gln 115Arg Ile His Thr Gly Gln 115

Lys Pro Phe Gln Cys ArgLys Pro Phe Gln Cys Arg

120120

Ile Cys Met Arg 125Ile Cys Met Arg 125

Asn Phe Ser Thr Ser GlyAsn Phe Ser Thr Ser Gly

130130

Asn Leu Val Arg His IleAsn Leu Val Arg His Ile

135 140135 140

Arg Thr His ThrArg Thr His Thr

Gly Glu Lys Pro Phe AlaGly Glu Lys Pro Phe Ala

145 150145 150

Cys Asp Ile Cys Gly ArgCys Asp Ile Cys Gly Arg

155155

Lys Phe Ala ArgLys Phe Ala Arg

160160

Ser Asp Asn Leu Val ArgSer Asp Asn Leu Val Arg

165165

His Thr Lys Ile His Leu 170His Thr Lys Ile His Leu 170

Arg Gln Lys AspArg Gln Lys Asp

175175

- 173 046157- 173 046157

Arg Pro Tyr Ala Cys ProArg Pro Tyr Ala Cys Pro

180180

Val Glu Ser Cys Asp ArgVal Glu Ser Cys Asp Arg

185185

Arg Phe Ser GlnArg Phe Ser Gln

190190

Ser Gly His Leu Thr GluSer Gly His Leu Thr Glu

195195

His Ile Arg Ile His ThrHis Ile Arg Ile His Thr

200200

Gly Gln Lys Pro 205Gly Gln Lys Pro 205

Phe Gln Cys Arg Ile CysPhe Gln Cys Arg Ile Cys

210210

Met Arg Asn Phe Ser GluMet Arg Asn Phe Ser Glu

215 220215 220

Arg Ser His LeuArg Ser His Leu

Arg Glu His Ile Arg ThrArg Glu His Ile Arg Thr

225 230225 230

His Thr Gly Glu Lys ProHis Thr Gly Glu Lys Pro

235235

Phe Ala Cys AspPhe Ala Cys Asp

240240

Ile Cys Gly Arg Lys PheIle Cys Gly Arg Lys Phe

245245

Ala Gln Ala Gly His LeuAla Gln Ala Gly His Leu

250250

Ala Ser His ThrAla Ser His Thr

255255

Lys Ile His Leu Arg GlnLys Ile His Leu Arg Gln

260260

Lys Asp <210> 96 <211> 175 <212> Белок <213> Искусственная последовательность <220>Lys Asp <210> 96 <211> 175 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 96<223> Description of the artificial sequence polypeptide <400> 96

Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp ArgArg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg

5 105 10

СинтетическийSynthetic

Arg Phe Ser Arg 15Arg Phe Ser Arg 15

Ser Asp Asn Leu Val Arg His Leu Arg Ile His Thr 20 25Ser Asp Asn Leu Val Arg His Leu Arg Ile His Thr 20 25

Gly His Lys Pro 30Gly His Lys Pro 30

Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg 35 40Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg 35 40

Glu Asp Asn Leu 45Glu Asp Asn Leu 45

His Thr His Ile Arg Thr His Thr Gly Glu Lys ProHis Thr His Ile Arg Thr His Thr Gly Glu Lys Pro

55 6055 60

Phe Ala Cys GluPhe Ala Cys Glu

Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu 65 70 75Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu 65 70 75

Val Arg His AlaVal Arg His Ala

Lys Ile His Leu Lys Gln Lys Glu His Ala Cys ProLys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro

9090

Ala Glu Gly CysAla Glu Gly Cys

Asp Arg Arg Phe Ser Gln Ser Gly Asn Leu Thr GluAsp Arg Arg Phe Ser Gln Ser Gly Asn Leu Thr Glu

100 105100 105

His Leu Arg Ile 110His Leu Arg Ile 110

- 174 046157- 174 046157

His Thr Gly His Lys Pro 115His Thr Gly His Lys Pro 115

Phe Gln Cys Arg Ile CysPhe Gln Cys Arg Ile Cys

120120

Met Arg Ser Phe 125Met Arg Ser Phe 125

Ser Thr Ser Gly His LeuSer Thr Ser Gly His Leu

130130

Val Arg His Ile Arg ThrVal Arg His Ile Arg Thr

135 140135 140

His Thr Gly GluHis Thr Gly Glu

Lys Pro Phe Ala Cys GluLys Pro Phe Ala Cys Glu

145 150145 150

Phe Cys Gly Arg Lys PhePhe Cys Gly Arg Lys Phe

155155

Ala Gln Asn SerAla Gln Asn Ser

160160

Thr Leu Thr Glu His AlaThr Leu Thr Glu His Ala

165165

Lys Ile His Leu Lys GlnLys Ile His Leu Lys Gln

170170

Lys Glu LysLys Glu Lys

175 <210> 97 <211> 175 <212> Белок <213> Искусственная последовательность <220>175 <210> 97 <211> 175 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 97<223> Description of the artificial sequence polypeptide <400> 97

Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp ArgArg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg

5 105 10

СинтетическийSynthetic

Arg Phe Ser Arg 15Arg Phe Ser Arg 15

Ser Asp Asn Leu Val Arg His Leu Arg Ile His Thr 20 25Ser Asp Asn Leu Val Arg His Leu Arg Ile His Thr 20 25

Gly His Lys Pro 30Gly His Lys Pro 30

Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser His 35 40Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser His 35 40

Arg Thr Thr Leu 45Arg Thr Thr Leu 45

Thr Asn His Ile Arg Thr His Thr Gly Glu Lys ProThr Asn His Ile Arg Thr His Thr Gly Glu Lys Pro

55 6055 60

Phe Ala Cys GluPhe Ala Cys Glu

Phe Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu 65 70 75Phe Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu 65 70 75

His Thr His AlaHis Thr His Ala

Lys Ile His Leu Lys Gln Lys Glu His Ala Cys ProLys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro

9090

Ala Glu Gly CysAla Glu Gly Cys

Asp Arg Arg Phe Ser Thr Ser His Ser Leu Thr GluAsp Arg Arg Phe Ser Thr Ser His Ser Leu Thr Glu

100 105100 105

His Leu Arg Ile 110His Leu Arg Ile 110

His Thr Gly His Lys Pro Phe Gln Cys Arg Ile CysHis Thr Gly His Lys Pro Phe Gln Cys Arg Ile Cys

115 120115 120

Met Arg Ser Phe 125Met Arg Ser Phe 125

Ser Gln Ser Ser Ser Leu Val Arg His Ile Arg ThrSer Gln Ser Ser Ser Leu Val Arg His Ile Arg Thr

130 135 140130 135 140

His Thr Gly GluHis Thr Gly Glu

- 175 046157- 175 046157

Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys PheLys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys Phe

145 150 155145 150 155

Ala Arg Glu AspAla Arg Glu Asp

160160

Asn Leu His Thr His Ala Lys Ile His Leu Lys GlnAsn Leu His Thr His Ala Lys Ile His Leu Lys Gln

165 170165 170

Lys Glu LysLys Glu Lys

175 <210> 98 <211> 261 <212> Белок <213> Искусственная последовательность <220>175 <210> 98 <211> 261 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 98<223> Description of the artificial sequence polypeptide <400> 98

Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp ArgArg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg

5 105 10

СинтетическийSynthetic

Arg Phe Ser Arg 15Arg Phe Ser Arg 15

Arg Asp Glu Leu Asn Val His Leu Arg Ile His Thr 20 25Arg Asp Glu Leu Asn Val His Leu Arg Ile His Thr 20 25

Gly His Lys Pro 30Gly His Lys Pro 30

Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg 35 40Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg 35 40

Ser Asp His Leu 45Ser Asp His Leu 45

Thr Asn His Ile Arg Thr His Thr Gly Glu Lys ProThr Asn His Ile Arg Thr His Thr Gly Glu Lys Pro

55 6055 60

Phe Ala Cys GluPhe Ala Cys Glu

Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Asp Leu 65 70 75Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Asp Leu 65 70 75

Val Arg His AlaVal Arg His Ala

Lys Ile His Leu Lys Gln Lys Glu His Ala Cys ProLys Ile His Leu Lys Gln Lys Glu His Ala Cys Pro

9090

Ala Glu Gly CysAla Glu Gly Cys

Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val ArgAsp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg

100 105100 105

His Leu Arg Ile 110His Leu Arg Ile 110

His Thr Gly His Lys Pro Phe Gln Cys Arg Ile CysHis Thr Gly His Lys Pro Phe Gln Cys Arg Ile Cys

115 120115 120

Met Arg Ser Phe 125Met Arg Ser Phe 125

Ser His Arg Thr Thr Leu Thr Asn His Ile Arg ThrSer His Arg Thr Thr Leu Thr Asn His Ile Arg Thr

130 135 140130 135 140

His Thr Gly GluHis Thr Gly Glu

Lys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys PheLys Pro Phe Ala Cys Glu Phe Cys Gly Arg Lys Phe

145 150 155145 150 155

Ala Arg Glu AspAla Arg Glu Asp

160160

Asn Leu His Thr His Ala Lys Ile His Leu Lys GlnAsn Leu His Thr His Ala Lys Ile His Leu Lys Gln

165 170165 170

Lys Glu His Ala 175Lys Glu His Ala 175

Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser ThrCys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser Thr

Ser His Ser LeuSer His Ser Leu

- 176 046157- 176 046157

180 185180 185

190190

Thr Glu His Leu Arg Ile His Thr Gly His Lys ProThr Glu His Leu Arg Ile His Thr Gly His Lys Pro

195 200195 200

Phe Gln Cys Arg 205Phe Gln Cys Arg 205

Ile Cys Met Arg Ser Phe Ser Gln Ser Ser Ser LeuIle Cys Met Arg Ser Phe Ser Gln Ser Ser Ser Leu

210 215 220210 215 220

Val Arg His IleVal Arg His Ile

Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys GluArg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Glu

225 230 235225 230 235

Phe Cys Gly ArgPhe Cys Gly Arg

240240

Lys Phe Ala Arg Glu Asp Asn Leu His Thr His AlaLys Phe Ala Arg Glu Asp Asn Leu His Thr His Ala

245 250245 250

Lys Ile His LeuLys Ile His Leu

255255

Lys Gln Lys Glu LysLys Gln Lys Glu Lys

260 <210> 99 <211> 753 <212> Белок <213> Искусственная последовательность <220>260 <210> 99 <211> 753 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности<223> Description of the artificial sequence

Синтетический полипептид <400> 99Synthetic polypeptide <400> 99

Met Ala Pro Lys 1Met Ala Pro Lys 1

Lys Lys Arg Lys 5Lys Lys Arg Lys 5

Val Gly Ile His 10Val Gly Ile His 10

Gly Val Pro Ala 15Gly Val Pro Ala 15

Ala Leu Glu ProAla Leu Glu Pro

Gly Glu Lys ProGly Glu Lys Pro

Tyr Lys Cys Pro 25Tyr Lys Cys Pro 25

Glu Cys Gly Lys 30Glu Cys Gly Lys 30

Ser Phe Ser ArgSer Phe Ser Arg

Ser Asp Asn Leu 40Ser Asp Asn Leu 40

Val Arg His GlnVal Arg His Gln

Arg Thr His Thr 45Arg Thr His Thr 45

Gly Glu Lys Pro 50Gly Glu Lys Pro 50

Tyr Lys Cys Pro 55Tyr Lys Cys Pro 55

Glu Cys Gly Lys 60Glu Cys Gly Lys 60

Ser Phe Ser HisSer Phe Ser His

Arg Thr Thr Leu 65Arg Thr Thr Leu 65

Thr Asn His GlnThr Asn His Gln

Arg Thr His Thr 75Arg Thr His Thr 75

Gly Glu Lys Pro 80Gly Glu Lys Pro 80

Tyr Lys Cys ProTyr Lys Cys Pro

Glu Cys Gly Lys 85Glu Cys Gly Lys 85

Ser Phe Ser Arg 90Ser Phe Ser Arg 90

Glu Asp Asn LeuGlu Asp Asn Leu

His Thr His GlnHis Thr His Gln

100100

Arg Thr His ThrArg Thr His Thr

Gly Glu Lys Pro 105Gly Glu Lys Pro 105

Tyr Lys Cys Pro 110Tyr Lys Cys Pro 110

Glu Cys Gly LysGlu Cys Gly Lys

115115

Ser Phe Ser ThrSer Phe Ser Thr

120120

Ser His Ser LeuSer His Ser Leu

Thr Glu His Gln 125Thr Glu His Gln 125

- 177 046157- 177 046157

Arg Thr His Thr Gly Glu Lys ProArg Thr His Thr Gly Glu Lys Pro

130 135130 135

Tyr Lys Cys Pro Glu Cys GlyTyr Lys Cys Pro Glu Cys Gly

140140

Ser Phe Ser GlnSer Phe Ser Gln

145145

Ser Ser Ser Leu Val Arg His Gln Arg Thr HisSer Ser Ser Leu Val Arg His Gln Arg Thr His

150 155150 155

Gly Glu Lys ProGly Glu Lys Pro

Tyr Lys Cys Pro Glu Cys Gly LysTyr Lys Cys Pro Glu Cys Gly Lys

165 170165 170

Ser Phe SerSer Phe Ser

175175

Glu Asp Asn Leu HisGlu Asp Asn Leu His

180180

Thr His Gln Arg Thr His Thr Gly Lys LysThr His Gln Arg Thr His Thr Gly Lys Lys

185 190185 190

Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys LysSer Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys

195 200 205195 200 205

Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Leu Glu GluLys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Leu Glu Glu

210 215 220210 215 220

Ser Gly Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu AspSer Gly Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp

225 230 235225 230 235

Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu GlyLeu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly

245 250 255245 250 255

Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp AlaAsp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala

260 265 270260 265 270

Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser GlyAsp Asp Phe Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser Gly

275 280 285275 280 285

Pro Lys Lys Lys Arg Lys Val Gly Ser Gln Tyr Leu Pro Asp ThrPro Lys Lys Lys Arg Lys Val Gly Ser Gln Tyr Leu Pro Asp Thr

290 295 300290 295 300

Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr Glu ThrAsp Arg His Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr Glu Thr

305 310 315305 310 315

Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly Pro Thr Asp ProLys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly Pro Thr Asp Pro

325 330 335325 330 335

Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg Ser Ser Ala SerPro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg Ser Ser Ala Ser

340 345 350340 345 350

Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu SerPro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser

355 360 365355 360 365

Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly GlnIle Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln

LysLys

Thr 160Thr 160

ArgArg

ThrThr

LysLys

AlaAla

Met 240Met 240

SerSer

LeuLeu

SerSer

AspAsp

Phe 320Phe 320

ArgArg

ValVal

ThrThr

IleIle

- 178 046157- 178 046157

370370

375375

380380

Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu ProSer Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro

385 390 395385 390 395

Ala Pro Ala Pro AlaAla Pro Ala Pro Ala

405405

Pro Ala Pro Ala MetPro Ala Pro Ala Met

410410

Val Ser Ala Leu AlaVal Ser Ala Leu Ala

415415

Ala Pro Ala Pro ValAla Pro Ala Pro Val

420420

Pro Val Leu Ala ProPro Val Leu Ala Pro

425425

Gly Pro Pro Gln AlaGly Pro Pro Gln Ala

430430

Ala Pro Pro Ala ProAla Pro Pro Ala Pro

435435

Lys Pro Thr Gln AlaLys Pro Thr Gln Ala

440440

Gly Glu Gly Thr Leu 445Gly Glu Gly Thr Leu 445

Glu Ala Leu Leu GlnGlu Ala Leu Leu Gln

450450

Leu Gln Phe Asp AspLeu Gln Phe Asp Asp

455455

Glu Asp Leu Gly AlaGlu Asp Leu Gly Ala

460460

Leu Gly Asn Ser Thr 465Leu Gly Asn Ser Thr 465

Asp Pro Ala Val Phe 470Asp Pro Ala Val Phe 470

Thr Asp Leu Ala Ser 475Thr Asp Leu Ala Ser 475

Asp Asn Ser Glu PheAsp Asn Ser Glu Phe

485485

Gln Gln Leu Leu AsnGln Gln Leu Leu Asn

490490

Gln Gly Ile Pro ValGln Gly Ile Pro Val

495495

Pro His Thr Thr GluPro His Thr Thr Glu

500500

Pro Met Leu Met GluPro Met Leu Met Glu

505505

Tyr Pro Glu Ala IleTyr Pro Glu Ala Ile

510510

Arg Leu Val Thr Gly 515Arg Leu Val Thr Gly 515

Ala Gln Arg Pro Pro 520Ala Gln Arg Pro Pro 520

Asp Pro Ala Pro Ala 525Asp Pro Ala Pro Ala 525

Leu Gly Ala Pro GlyLeu Gly Ala Pro Gly

530530

Leu Pro Asn Gly LeuLeu Pro Asn Gly Leu

535535

Leu Ser Gly Asp GluLeu Ser Gly Asp Glu

540540

Phe Ser Ser Ile Ala 545Phe Ser Ser Ile Ala 545

Asp Met Asp Phe Ser 550Asp Met Asp Phe Ser 550

Ala Leu Leu Gly Ser 555Ala Leu Leu Gly Ser 555

Ser Gly Ser Arg AspSer Gly Ser Arg Asp

565565

Ser Arg Glu Gly MetSer Arg Glu Gly Met

570570

Phe Leu Pro Lys ProPhe Leu Pro Lys Pro

575575

Ala Gly Ser Ala IleAla Gly Ser Ala Ile

580580

Ser Asp Val Phe GluSer Asp Val Phe Glu

585585

Gly Arg Glu Val CysGly Arg Glu Val Cys

590590

Pro Lys Arg Ile Arg 595Pro Lys Arg Ile Arg 595

Pro Phe His Pro ProPro Phe His Pro Pro

600600

Gly Ser Pro Trp Ala 605Gly Ser Pro Trp Ala 605

Arg Pro Leu Pro AlaArg Pro Leu Pro Ala

610610

Ser Leu Ala Pro ThrSer Leu Ala Pro Thr

615615

Pro Thr Gly Pro ValPro Thr Gly Pro Val

620620

Gln 400Gln 400

GlnGln

ValVal

SerSer

LeuLeu

Val 480Val 480

AlaAla

ThrThr

ProPro

AspAsp

Gly 560Gly 560

GluGlu

GlnGln

AsnAsn

HisHis

- 179 046157- 179 046157

Glu Pro Val 625Glu Pro Val 625

Pro Ala ProPro Ala Pro

Asp Glu GluAsp Glu Glu

Thr Val Ile 675Thr Val Ile 675

Leu Ser His 690Leu Ser His 690

Leu Glu Ser 705Leu Glu Ser 705

Glu Leu AsnGlu Leu Asn

His Ala MetHis Ala Met

PhePhe

Gly Ser LeuGly Ser Leu

630630

Ala Val ThrAla Val Thr

645645

Thr Ser Gln 660Thr Ser Gln 660

Pro Gln LysPro Gln Lys

Pro Pro ProPro Pro Pro

Met Thr GluMet Thr Glu

710710

Glu Ile LeuGlu Ile Leu

725725

His Ile Ser 740His Ile Ser 740

Thr Pro AlaThr Pro Ala

Pro Glu AlaPro Glu Ala

Ala Val Lys 665Ala Val Lys 665

Glu Glu Ala 680Glu Glu Ala 680

Arg Gly His 695Arg Gly His 695

Asp Leu AsnAsp Leu Asn

Asp Thr PheAsp Thr Phe

Thr Gly LeuThr Gly Leu

745745

Pro Val ProPro Val Pro

635635

Ser His Leu 650Ser His Leu 650

Ala Leu ArgAla Leu Arg

Ala Ile CysAla Ile Cys

Leu Asp GluLeu Asp Glu

700700

Leu Asp SerLeu Asp Ser

715715

Leu Asn Asp 730Leu Asn Asp 730

Ser Ile PheSer Ile Phe

Gln Pro Leu AspGln Pro Leu Asp

640640

Leu Glu Asp ProLeu Glu Asp Pro

655655

Glu Met Ala AspGlu Met Ala Asp

670670

Gly Gln Met Asp 685Gly Gln Met Asp 685

Leu Thr Thr ThrLeu Thr Thr Thr

Pro Leu Thr ProPro Leu Thr Pro

720720

Glu Cys Leu LeuGlu Cys Leu Leu

735735

Asp Thr Ser Leu 750 <210> 100 <211> 753 <212> Белок <213> Искусственная последовательность <220>Asp Thr Ser Leu 750 <210> 100 <211> 753 <212> Protein <213> Artificial Sequence <220>

<223> Описание искусственной последовательности полипептид <400> 100<223> Description of the artificial sequence polypeptide <400> 100

Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile HisMet Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His

510510

Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro 2025Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro 2025

Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln 3540Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln 3540

Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys 50 5560Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys 50 5560

Glu Asp Asn Leu His Thr His Gln Arg Thr His ThrGlu Asp Asn Leu His Thr His Gln Arg Thr His Thr

СинтетическийSynthetic

Gly Val Pro Ala 15Gly Val Pro Ala 15

Glu Cys Gly Lys 30Glu Cys Gly Lys 30

Arg Thr His Thr 45Arg Thr His Thr 45

Ser Phe Ser ArgSer Phe Ser Arg

Gly Glu Lys ProGly Glu Lys Pro

- 180 046157- 180 046157

70 7570 75

Tyr Lys Cys Pro Glu 85Tyr Lys Cys Pro Glu 85

Cys Gly Lys Ser PheCys Gly Lys Ser Phe

Ser Arg Ser Asp GluSer Arg Ser Asp Glu

Val Arg His Gln ArgVal Arg His Gln Arg

100100

Thr His Thr Gly GluThr His Thr Gly Glu

105105

Lys Pro Tyr Lys CysLys Pro Tyr Lys Cys

110110

Glu Cys Gly Lys Ser 115Glu Cys Gly Lys Ser 115

Phe Ser Gln Ser Gly 120Phe Ser Gln Ser Gly 120

Asn Leu Thr Glu HisAsn Leu Thr Glu His

125125

Arg Thr His Thr Gly 130Arg Thr His Thr Gly 130

Glu Lys Pro Tyr Lys 135Glu Lys Pro Tyr Lys 135

Cys Pro Glu Cys GlyCys Pro Glu Cys Gly

140140

Ser Phe Ser Thr Ser 145Ser Phe Ser Thr Ser 145

Gly His Leu Val Arg 150Gly His Leu Val Arg 150

His Gln Arg Thr His 155His Gln Arg Thr His 155

Gly Glu Lys Pro TyrGly Glu Lys Pro Tyr

165165

Lys Cys Pro Glu CysLys Cys Pro Glu Cys

170170

Gly Lys Ser Phe SerGly Lys Ser Phe Ser

175175

Asn Ser Thr Leu ThrAsn Ser Thr Leu Thr

180180

Glu His Gln Arg ThrGlu His Gln Arg Thr

185185

His Thr Gly Lys LysHis Thr Gly Lys Lys

190190

Ser Lys Arg Pro AlaSer Lys Arg Pro Ala

195195

Ala Thr Lys Lys Ala 200Ala Thr Lys Lys Ala 200

Gly Gln Ala Lys Lys 205Gly Gln Ala Lys Lys 205

Lys Gly Ser Tyr ProLys Gly Ser Tyr Pro

210210

Tyr Asp Val Pro AspTyr Asp Val Pro Asp

215215

Tyr Ala Leu Glu GluTyr Ala Leu Glu Glu

220220

Ser Gly Ser Gly Arg 225Ser Gly Ser Gly Arg 225

Ala Asp Ala Leu Asp 230Ala Asp Ala Leu Asp 230

Asp Phe Asp Leu Asp 235Asp Phe Asp Leu Asp 235

Leu Gly Ser Asp AlaLeu Gly Ser Asp Ala

245245

Leu Asp Asp Phe AspLeu Asp Asp Phe Asp

250250

Leu Asp Met Leu GlyLeu Asp Met Leu Gly

255255

Asp Ala Leu Asp AspAsp Ala Leu Asp Asp

260260

Phe Asp Leu Asp MetPhe Asp Leu Asp Met

265265

Leu Gly Ser Asp AlaLeu Gly Ser Asp Ala

270270

Asp Asp Phe Asp Leu 275Asp Asp Phe Asp Leu 275

Asp Met Leu Ile Asn 280Asp Met Leu Ile Asn 280

Ser Arg Ser Ser GlySer Arg Ser Ser Gly

285285

Pro Lys Lys Lys Arg 290Pro Lys Lys Lys Arg 290

Lys Val Gly Ser GlnLys Val Gly Ser Gln

295295

Tyr Leu Pro Asp ThrTyr Leu Pro Asp Thr

300300

Asp Arg His Arg Ile 305Asp Arg His Arg Ile 305

Glu Glu Lys Arg Lys 310Glu Glu Lys Arg Lys 310

Arg Thr Tyr Glu Thr 315Arg Thr Tyr Glu Thr 315

LeuLeu

ProPro

GlnGln

LysLys

Thr 160Thr 160

GlnGln

ThrThr

LysLys

AlaAla

Met 240Met 240

SerSer

LeuLeu

SerSer

AspAsp

Phe 320Phe 320

- 181 046157- 181 046157

LysLys

Ser Ile Met Lys Lys Ser ProSer Ile Met Lys Lys Ser Pro

325325

Phe Ser Gly Pro Thr Asp ProPhe Ser Gly Pro Thr Asp Pro

330 335330 335

Pro Pro Pro Arg Arg Ile Ala Val ProPro Pro Pro Arg Arg Ile Ala Val Pro

340 345340 345

Ser Arg SerSer Arg Ser

Ser Ala SerSer Ala Ser

350350

Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu SerPro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser

355 360 365355 360 365

Ile Asn Tyr Asp GluIle Asn Tyr Asp Glu

370370

Phe Pro Thr Met ValPhe Pro Thr Met Val

375375

Phe Pro Ser Gly Gln 380Phe Pro Ser Gly Gln 380

Ser Gln Ala Ser Ala 385Ser Gln Ala Ser Ala 385

Leu Ala Pro Ala Pro 390Leu Ala Pro Ala Pro 390

Pro Gln Val Leu Pro 395Pro Gln Val Leu Pro 395

Ala Pro Ala Pro AlaAla Pro Ala Pro Ala

405405

Pro Ala Pro Ala MetPro Ala Pro Ala Met

410410

Val Ser Ala Leu AlaVal Ser Ala Leu Ala

415415

Ala Pro Ala Pro ValAla Pro Ala Pro Val

420420

Pro Val Leu Ala ProPro Val Leu Ala Pro

425425

Gly Pro Pro Gln AlaGly Pro Pro Gln Ala

430430

Ala Pro Pro Ala ProAla Pro Pro Ala Pro

435435

Lys Pro Thr Gln AlaLys Pro Thr Gln Ala

440440

Gly Glu Gly Thr Leu 445Gly Glu Gly Thr Leu 445

Glu Ala Leu Leu GlnGlu Ala Leu Leu Gln

450450

Leu Gln Phe Asp Asp 455Leu Gln Phe Asp Asp 455

Glu Asp Leu Gly AlaGlu Asp Leu Gly Ala

460460

Leu Gly Asn Ser Thr 465Leu Gly Asn Ser Thr 465

Asp Pro Ala Val Phe 470Asp Pro Ala Val Phe 470

Thr Asp Leu Ala Ser 475Thr Asp Leu Ala Ser 475

Asp Asn Ser Glu PheAsp Asn Ser Glu Phe

485485

Gln Gln Leu Leu AsnGln Gln Leu Leu Asn

490490

Gln Gly Ile Pro ValGln Gly Ile Pro Val

495495

Pro His Thr Thr GluPro His Thr Thr Glu

500500

Pro Met Leu Met GluPro Met Leu Met Glu

505505

Tyr Pro Glu Ala IleTyr Pro Glu Ala Ile

510510

Arg Leu Val Thr Gly 515Arg Leu Val Thr Gly 515

Ala Gln Arg Pro Pro 520Ala Gln Arg Pro Pro 520

Asp Pro Ala Pro Ala 525Asp Pro Ala Pro Ala 525

Leu Gly Ala Pro GlyLeu Gly Ala Pro Gly

530530

Leu Pro Asn Gly LeuLeu Pro Asn Gly Leu

535535

Leu Ser Gly Asp Glu 540Leu Ser Gly Asp Glu 540

Phe Ser Ser Ile Ala 545Phe Ser Ser Ile Ala 545

Asp Met Asp Phe Ser 550Asp Met Asp Phe Ser 550

Ala Leu Leu Gly Ser 555Ala Leu Leu Gly Ser 555

Ser Gly Ser Arg AspSer Gly Ser Arg Asp

565565

Ser Arg Glu Gly MetSer Arg Glu Gly Met

570570

Phe Leu Pro Lys ProPhe Leu Pro Lys Pro

575575

ArgArg

ValVal

ThrThr

IleIle

Gln 400Gln 400

GlnGln

ValVal

SerSer

LeuLeu

Val 480Val 480

AlaAla

ThrThr

ProPro

AspAsp

Gly 560Gly 560

GluGlu

- 182 046157- 182 046157

Ala Gly SerAla Gly Ser

Ala Ile Ser 580Ala Ile Ser 580

Asp Val PheAsp Val Phe

585585

Glu Gly ArgGlu Gly Arg

Glu Val Cys Gln 590Glu Val Cys Gln 590

Pro Lys Arg 595Pro Lys Arg 595

Arg Pro Leu 610Arg Pro Leu 610

Ile Arg ProIle Arg Pro

Phe His ProPhe His Pro

600600

Pro Gly SerPro Gly Ser

Pro Trp Ala Asn 605Pro Trp Ala Asn 605

Pro Ala SerPro Ala Ser

Leu Ala Pro 615Leu Ala Pro 615

Thr Pro ThrThr Pro Thr

620620

Gly Pro Val HisGly Pro Val His

Glu Pro Val 625Glu Pro Val 625

Gly Ser LeuGly Ser Leu

630630

Thr Pro AlaThr Pro Ala

Pro Val ProPro Val Pro

635635

Gln Pro Leu AspGln Pro Leu Asp

640640

Pro Ala ProPro Ala Pro

Asp Glu GluAsp Glu Glu

Thr Val Ile 675Thr Val Ile 675

Leu Ser His 690Leu Ser His 690

Leu Glu Ser 705Leu Glu Ser 705

Glu Leu AsnGlu Leu Asn

Ala Val ThrAla Val Thr

645645

Pro Glu AlaPro Glu Ala

Ser His Leu 650Ser His Leu 650

Leu Glu Asp ProLeu Glu Asp Pro

655655

His Ala MetHis Ala Met

PhePhe

Thr Ser Gln 660Thr Ser Gln 660

Pro Gln LysPro Gln Lys

Pro Pro ProPro Pro Pro

Met Thr GluMet Thr Glu

710710

Glu Ile LeuGlu Ile Leu

725725

His Ile Ser 740His Ile Ser 740

Ala Val LysAla Val Lys

665665

Ala Leu ArgAla Leu Arg

Glu Met Ala AspGlu Met Ala Asp

670670

Glu Glu AlaGlu Glu Ala

680680

Ala Ile CysAla Ile Cys

Gly Gln Met Asp 685Gly Gln Met Asp 685

Arg Gly His 695Arg Gly His 695

Asp Leu AsnAsp Leu Asn

Asp Thr PheAsp Thr Phe

Thr Gly LeuThr Gly Leu

745745

Leu Asp GluLeu Asp Glu

700700

Leu Asp SerLeu Asp Ser

715715

Leu Asn Asp 730Leu Asn Asp 730

Ser Ile Phe <210> 101 <211> 272 <212> Белок <213> Искусственная последовательность <220>Ser Ile Phe <210> 101 <211> 272 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 101<223> Description of the artificial sequence polypeptide <400> 101

Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile HisMet Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His

5 105 10

Leu Thr Thr ThrLeu Thr Thr Thr

Pro Leu Thr ProPro Leu Thr Pro

720720

Glu Cys Leu LeuGlu Cys Leu Leu

735735

Asp Thr Ser Leu 750Asp Thr Ser Leu 750

СинтетическийSynthetic

Gly Val Pro Ala 15Gly Val Pro Ala 15

- 183 046157- 183 046157

Ala Leu Glu Pro GlyAla Leu Glu Pro Gly

Glu Lys Pro Tyr Lys 25Glu Lys Pro Tyr Lys 25

Cys Pro Glu Cys Gly 30Cys Pro Glu Cys Gly 30

Ser Phe Ser Arg Ser 35Ser Phe Ser Arg Ser 35

Asp Asn Leu Val Arg 40Asp Asn Leu Val Arg 40

His Gln Arg Thr His 45His Gln Arg Thr His 45

Gly Glu Lys Pro Tyr 50Gly Glu Lys Pro Tyr 50

Lys Cys Pro Glu Cys 55Lys Cys Pro Glu Cys 55

Gly Lys Ser Phe Ser 60Gly Lys Ser Phe Ser 60

Arg Thr Thr Leu Thr 65Arg Thr Thr Leu Thr 65

Asn His Gln Arg Thr 70Asn His Gln Arg Thr 70

His Thr Gly Glu Lys 75His Thr Gly Glu Lys 75

Tyr Lys Cys Pro Glu 85Tyr Lys Cys Pro Glu 85

Cys Gly Lys Ser PheCys Gly Lys Ser Phe

Ser Arg Glu Asp AsnSer Arg Glu Asp Asn

His Thr His Gln ArgHis Thr His Gln Arg

100100

Thr His Thr Gly GluThr His Thr Gly Glu

105105

Lys Pro Tyr Lys CysLys Pro Tyr Lys Cys

110110

Glu Cys Gly Lys Ser 115Glu Cys Gly Lys Ser 115

Phe Ser Thr Ser HisPhe Ser Thr Ser His

120120

Ser Leu Thr Glu HisSer Leu Thr Glu His

125125

Arg Thr His Thr Gly 130Arg Thr His Thr Gly 130

Glu Lys Pro Tyr Lys 135Glu Lys Pro Tyr Lys 135

Cys Pro Glu Cys GlyCys Pro Glu Cys Gly

140140

Ser Phe Ser Gln Ser 145Ser Phe Ser Gln Ser 145

Ser Ser Leu Val Arg 150Ser Ser Leu Val Arg 150

His Gln Arg Thr His 155His Gln Arg Thr His 155

Gly Glu Lys Pro TyrGly Glu Lys Pro Tyr

165165

Lys Cys Pro Glu CysLys Cys Pro Glu Cys

170170

Gly Lys Ser Phe SerGly Lys Ser Phe Ser

175175

Glu Asp Asn Leu HisGlu Asp Asn Leu His

180180

Thr His Gln Arg ThrThr His Gln Arg Thr

185185

His Thr Gly Lys LysHis Thr Gly Lys Lys

190190

Ser Lys Arg Pro AlaSer Lys Arg Pro Ala

195195

Ala Thr Lys Lys AlaAla Thr Lys Lys Ala

200200

Gly Gln Ala Lys Lys 205Gly Gln Ala Lys Lys 205

Lys Gly Ser Tyr ProLys Gly Ser Tyr Pro

210210

Tyr Asp Val Pro AspTyr Asp Val Pro Asp

215215

Tyr Ala Leu Glu AspTyr Ala Leu Glu Asp

220220

Leu Asp Asp Phe Asp 225Leu Asp Asp Phe Asp 225

Leu Asp Met Leu Gly 230Leu Asp Met Leu Gly 230

Ser Asp Ala Leu Asp 235Ser Asp Ala Leu Asp 235

Phe Asp Leu Asp MetPhe Asp Leu Asp Met

245245

Leu Gly Ser Asp AlaLeu Gly Ser Asp Ala

250250

Leu Asp Asp Phe AspLeu Asp Asp Phe Asp

255255

Asp Met Leu Gly SerAsp Met Leu Gly Ser

260260

Asp Ala Leu Asp AspAsp Ala Leu Asp Asp

265265

Phe Asp Leu Asp MetPhe Asp Leu Asp Met

270270

LysLys

ThrThr

HisHis

Pro 80Pro 80

LeuLeu

ProPro

GlnGln

LysLys

Thr 160Thr 160

ArgArg

ThrThr

LysLys

AlaAla

Asp 240Asp 240

LeuLeu

LeuLeu

- 184 046157 <210> 102 <211> 272 <212> Белок <213> Искусственная последовательность <220>- 184 046157 <210> 102 <211> 272 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 102<223> Description of artificial sequence: Synthetic polypeptide <400> 102

Met Ala Pro Lys Lys Lys Arg Lys 1 5Met Ala Pro Lys Lys Lys Arg Lys 1 5

Val Gly Ile His Gly Val Pro AlaVal Gly Ile His Gly Val Pro Ala

1515

Ala Leu Glu Pro Gly Glu Lys Pro 20Ala Leu Glu Pro Gly Glu Lys Pro 20

Tyr Lys Cys Pro Glu Cys Gly Lys 25 30Tyr Lys Cys Pro Glu Cys Gly Lys 25 30

Ser Phe Ser Arg Ser Asp Asn LeuSer Phe Ser Arg Ser Asp Asn Leu

4040

Val Arg His Gln Arg Thr His Thr 45Val Arg His Gln Arg Thr His Thr 45

Gly Glu Lys Pro Tyr Lys Cys ProGly Glu Lys Pro Tyr Lys Cys Pro

5555

Glu Cys Gly Lys Ser Phe Ser Arg 60Glu Cys Gly Lys Ser Phe Ser Arg 60

Glu Asp Asn Leu His Thr His Gln 65 70Glu Asp Asn Leu His Thr His Gln 65 70

Arg Thr His Thr Gly Glu Lys ProArg Thr His Thr Gly Glu Lys Pro

8080

Tyr Lys Cys Pro Glu Cys Gly Lys 85Tyr Lys Cys Pro Glu Cys Gly Lys 85

Ser Phe Ser Arg Ser Asp Glu LeuSer Phe Ser Arg Ser Asp Glu Leu

9595

Val Arg His Gln Arg Thr His ThrVal Arg His Gln Arg Thr His Thr

100100

Gly Glu Lys Pro Tyr Lys Cys ProGly Glu Lys Pro Tyr Lys Cys Pro

105 110105 110

Glu Cys Gly Lys Ser Phe Ser GlnGlu Cys Gly Lys Ser Phe Ser Gln

115 120115 120

Ser Gly Asn Leu Thr Glu His GlnSer Gly Asn Leu Thr Glu His Gln

125125

Arg Thr His Thr Gly Glu Lys ProArg Thr His Thr Gly Glu Lys Pro

130 135130 135

Tyr Lys Cys Pro Glu Cys Gly LysTyr Lys Cys Pro Glu Cys Gly Lys

140140

Ser Phe Ser Thr Ser Gly His LeuSer Phe Ser Thr Ser Gly His Leu

145 150145 150

Val Arg His Gln Arg Thr His ThrVal Arg His Gln Arg Thr His Thr

155 160155 160

Gly Glu Lys Pro Tyr Lys Cys ProGly Glu Lys Pro Tyr Lys Cys Pro

165165

Glu Cys Gly Lys Ser Phe Ser GlnGlu Cys Gly Lys Ser Phe Ser Gln

170 175170 175

Asn Ser Thr Leu Thr Glu His GlnAsn Ser Thr Leu Thr Glu His Gln

180180

Arg Thr His Thr Gly Lys Lys Thr 185 190Arg Thr His Thr Gly Lys Lys Thr 185 190

Ser Lys Arg Pro Ala Ala Thr LysSer Lys Arg Pro Ala Ala Thr Lys

195 200195 200

Lys Ala Gly Gln Ala Lys Lys LysLys Ala Gly Gln Ala Lys Lys Lys

205205

- 185 046157- 185 046157

Lys Gly Ser Tyr Pro TyrLys Gly Ser Tyr Pro Tyr

210210

Asp Val Pro Asp Tyr AlaAsp Val Pro Asp Tyr Ala

215 220215 220

Leu Glu Asp AlaLeu Glu Asp Ala

Leu Asp Asp Phe Asp LeuLeu Asp Asp Phe Asp Leu

225 230225 230

Asp Met Leu Gly Ser AspAsp Met Leu Gly Ser Asp

235235

Ala Leu Asp AspAla Leu Asp Asp

240240

Phe Asp Leu Asp Met LeuPhe Asp Leu Asp Met Leu

245245

Gly Ser Asp Ala Leu AspGly Ser Asp Ala Leu Asp

250250

Asp Phe Asp LeuAsp Phe Asp Leu

255255

Asp Met Leu Gly Ser AspAsp Met Leu Gly Ser Asp

260260

Ala Leu Asp Asp Phe AspAla Leu Asp Asp Phe Asp

265265

Leu Asp Met Leu 270 <210>Leu Asp Met Leu 270 <210>

<211><211>

<212><212>

103103

580 Белок <213> Искусственная последовательность <220>580 Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 103<223> Description of the artificial sequence polypeptide <400> 103

СинтетическийSynthetic

Met Ala Ala 1Met Ala Ala 1

Arg Pro ProArg Pro Pro

Leu Pro ProLeu Pro Pro

Gly Ala Pro 50Gly Ala Pro 50

Tyr Gly Ala 65Tyr Gly Ala 65

Pro Pro ProPro Pro Pro

Tyr Pro GlyTyr Pro Gly

Gly Pro GlnGly Pro Gln

115115

Ala Leu GlyAla Leu Gly

130130

Ser Leu GluSer Leu Glu

Asp His Leu 5Asp His Leu 5

Ser Ala Ala 20Ser Ala Ala 20

Tyr Ala GlyTyr Ala Gly

Leu Gly ProLeu Gly Pro

Phe Gly Pro 70Phe Gly Pro 70

Ala Ala Gly 85Ala Ala Gly 85

Arg Ala Ala 100Arg Ala Ala 100

Pro Ala ProPro Ala Pro

Gly Met AspGly Met Asp

Leu Glu LeuLeu Glu Leu

Met Leu AlaMet Leu Ala

Ala Ala HisAla Ala His

Pro Gly Leu 40Pro Gly Leu 40

Pro Pro Pro 55Pro Pro Pro 55

Pro Ser SerPro Ser Ser

Ile Ala HisIle Ala His

Ala Pro ProAla Pro Pro

105105

Ser Ala AlaSer Ala Ala

120120

Ala Glu Leu 135Ala Glu Leu 135

Gly Leu HisGly Leu His

Glu Gly Tyr 10Glu Gly Tyr 10

Gly Pro HisGly Pro His

Asp Ser GlyAsp Ser Gly

Arg Gln Pro 60Arg Gln Pro 60

Phe Gln Pro 75Phe Gln Pro 75

Leu Gln Pro 90Leu Gln Pro 90

Asn Ala ProAsn Ala Pro

Ala Pro ProAla Pro Pro

Ile Asp GluIle Asp Glu

140140

Arg Val ArgArg Val Arg

Arg Leu Val Gln 15Arg Leu Val Gln 15

Ala Leu Arg Thr 30Ala Leu Arg Thr 30

Leu Arg Pro Arg 45Leu Arg Pro Arg 45

Gly Ala Leu AlaGly Ala Leu Ala

Phe Pro Ala ValPhe Pro Ala Val

Val Ala Thr ProVal Ala Thr Pro

Gly Gly Pro Pro 110Gly Gly Pro Pro 110

Pro Pro Ala His 125Pro Pro Ala His 125

Glu Ala Leu ThrGlu Ala Leu Thr

Glu Leu Pro GluGlu Leu Pro Glu

- 186 046157- 186 046157

145145

150150

155155

Leu Phe Leu Gly GlnLeu Phe Leu Gly Gln

165165

Ser Glu Phe Asp CysSer Glu Phe Asp Cys

170170

Phe Ser Asp Leu GlyPhe Ser Asp Leu Gly

175175

Ala Pro Pro Ala GlyAla Pro Pro Ala Gly

180180

Ser Val Ser Cys GlySer Val Ser Cys Gly

185185

Gly Ser Gly Gly GlyGly Ser Gly Gly Gly

190190

Gly Gln Ser Gln LeuGly Gln Ser Gln Leu

195195

Ile Lys Pro Ser Arg 200Ile Lys Pro Ser Arg 200

Met Arg Lys Tyr Pro 205Met Arg Lys Tyr Pro 205

Arg Pro Ser Lys Thr 210Arg Pro Ser Lys Thr 210

Pro Pro His Glu Arg 215Pro Pro His Glu Arg 215

Pro Tyr Ala Cys Pro 220Pro Tyr Ala Cys Pro 220

Glu Ser Cys Asp Arg 225Glu Ser Cys Asp Arg 225

Arg Phe Ser Arg Ser 230Arg Phe Ser Arg Ser 230

Asp Asn Leu Val Arg 235Asp Asn Leu Val Arg 235

Ile Arg Ile His ThrIle Arg Ile His Thr

245245

Gly Gln Lys Pro PheGly Gln Lys Pro Phe

250250

Gln Cys Arg Ile CysGln Cys Arg Ile Cys

255255

Arg Asn Phe Ser HisArg Asn Phe Ser His

260260

Arg Thr Thr Leu ThrArg Thr Thr Leu Thr

265265

Asn His Ile Arg ThrAsn His Ile Arg Thr

270270

Thr Gly Glu Lys ProThr Gly Glu Lys Pro

275275

Phe Ala Cys Asp Ile 280Phe Ala Cys Asp Ile 280

Cys Gly Arg Lys PheCys Gly Arg Lys Phe

285285

Arg Glu Asp Asn LeuArg Glu Asp Asn Leu

290290

His Thr His Thr LysHis Thr His Thr Lys

295295

Ile His Leu Arg GlnIle His Leu Arg Gln

300300

Asp Arg Pro Tyr Ala 305Asp Arg Pro Tyr Ala 305

Cys Pro Val Glu Ser 310Cys Pro Val Glu Ser 310

Cys Asp Arg Arg Phe 315Cys Asp Arg Arg Phe 315

Thr Ser His Ser LeuThr Ser His Ser Leu

325325

Thr Glu His Ile ArgThr Glu His Ile Arg

330330

Ile His Thr Gly GlnIle His Thr Gly Gln

335335

Pro Phe Gln Cys ArgPro Phe Gln Cys Arg

340340

Ile Cys Met Arg AsnIle Cys Met Arg Asn

345345

Phe Ser Gln Ser SerPhe Ser Gln Ser Ser

350350

Leu Val Arg His Ile 355Leu Val Arg His Ile 355

Arg Thr His Thr Gly 360Arg Thr His Thr Gly 360

Glu Lys Pro Phe Ala 365Glu Lys Pro Phe Ala 365

Asp Ile Cys Gly ArgAsp Ile Cys Gly Arg

370370

Lys Phe Ala Arg GluLys Phe Ala Arg Glu

375375

Asp Asn Leu His Thr 380Asp Asn Leu His Thr 380

Thr Lys Ile His Leu 385Thr Lys Ile His Leu 385

Arg Gln Lys Asp Lys 390Arg Gln Lys Asp Lys 390

Leu Glu Met Ala Asp 395Leu Glu Met Ala Asp 395

160160

SerSer

SerSer

AsnAsn

ValVal

His 240His 240

MetMet

HisHis

AlaAla

LysLys

Ser 320Ser 320

LysLys

SerSer

CysCys

HisHis

His 400His 400

- 187 046157- 187 046157

Leu Met LeuLeu Met Leu

Ala Glu GlyAla Glu Gly

405405

Tyr Arg LeuTyr Arg Leu

Val Gln Arg 410Val Gln Arg 410

Pro Pro Ser AlaPro Pro Ser Ala

415415

Ala Ala AlaAla Ala Ala

His Gly Pro 420His Gly Pro 420

His Ala LeuHis Ala Leu

425425

Arg Thr LeuArg Thr Leu

Pro Pro Tyr AlaPro Pro Tyr Ala

430430

Gly Pro GlyGly Pro Gly

435435

Leu Asp SerLeu Asp Ser

Gly Leu ArgGly Leu Arg

440440

Pro Arg GlyPro Arg Gly

Ala Pro Leu Gly 445Ala Pro Leu Gly 445

Pro Pro ProPro Pro Pro

450450

Pro Arg GlnPro Arg Gln

Pro Gly Ala 455Pro Gly Ala 455

Leu Ala TyrLeu Ala Tyr

460460

Gly Ala Phe GlyGly Ala Phe Gly

Pro Pro Ser 465Pro Pro Ser 465

Ser Phe GlnSer Phe Gln

470470

Pro Phe ProPro Phe Pro

Ala Val ProAla Val Pro

475475

Pro Pro Ala AlaPro Pro Ala Ala

480480

Gly Ile AlaGly Ile Ala

His Leu GlnHis Leu Gln

485485

Pro Val AlaPro Val Ala

Thr Pro Tyr 490Thr Pro Tyr 490

Pro Gly Arg AlaPro Gly Arg Ala

495495

Ala Ala ProAla Ala Pro

Pro Asn Ala 500Pro Asn Ala 500

Pro Gly GlyPro Gly Gly

505505

Pro Pro GlyPro Pro Gly

Pro Gln Pro AlaPro Gln Pro Ala

510510

Pro Ser AlaPro Ser Ala

515515

Ala Ala ProAla Ala Pro

Pro Pro ProPro Pro Pro

520520

Ala His AlaAla His Ala

Leu Gly Gly Met 525Leu Gly Gly Met 525

Asp Ala GluAsp Ala Glu

530530

Leu Ile AspLeu Ile Asp

Glu Glu Ala 535Glu Glu Ala 535

Leu Thr SerLeu Thr Ser

540540

Leu Glu Leu GluLeu Glu Leu Glu

Leu Gly Leu 545Leu Gly Leu 545

His Arg ValHis Arg Val

550550

Arg Glu LeuArg Glu Leu

Pro Glu LeuPro Glu Leu

555555

Phe Leu Gly GlnPhe Leu Gly Gln

560560

Ser Glu PheSer Glu Phe

Asp Cys PheAsp Cys Phe

565565

Ser Asp LeuSer Asp Leu

Gly Ser Ala 570Gly Ser Ala 570

Pro Pro Ala GlyPro Pro Ala Gly

575575

Ser Val Ser CysSer Val Ser Cys

580 <210> 104 <211> 394 <212> Белок <213> Искусственная последовательность <220>580 <210> 104 <211> 394 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид<223> Description of the artificial polypeptide sequence

Синтетический <400> 104Synthetic <400> 104

Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr 1 5 10Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr 1 5 10

Arg Leu Val Gln 15Arg Leu Val Gln 15

Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro HisArg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His

Ala Leu Arg ThrAla Leu Arg Thr

- 188 046157- 188 046157

Leu Pro Pro Tyr Ala 35Leu Pro Pro Tyr Ala 35

Gly Pro Gly Leu Asp 40Gly Pro Gly Leu Asp 40

Ser Gly Leu Arg Pro 45Ser Gly Leu Arg Pro 45

Gly Ala Pro Leu Gly 50Gly Ala Pro Leu Gly 50

Pro Pro Pro Pro Arg 55Pro Pro Pro Pro Arg 55

Gln Pro Gly Ala Leu 60Gln Pro Gly Ala Leu 60

Tyr Gly Ala Phe Gly 65Tyr Gly Ala Phe Gly 65

Pro Pro Ser Ser Phe 70Pro Pro Ser Ser Phe 70

Gln Pro Phe Pro Ala 75Gln Pro Phe Pro Ala 75

Pro Pro Pro Ala AlaPro Pro Pro Ala Ala

Gly Ile Ala His LeuGly Ile Ala His Leu

Gln Pro Val Ala ThrGln Pro Val Ala Thr

Tyr Pro Gly Arg AlaTyr Pro Gly Arg Ala

100100

Ala Ala Pro Pro AsnAla Ala Pro Pro Asn

105105

Ala Pro Gly Gly ProAla Pro Gly Gly Pro

110110

Gly Pro Gln Pro AlaGly Pro Gln Pro Ala

115115

Pro Ser Ala Ala AlaPro Ser Ala Ala Ala

120120

Pro Pro Pro Pro AlaPro Pro Pro Pro Ala

125125

Ala Leu Gly Gly MetAla Leu Gly Gly Met

130130

Asp Ala Glu Leu Ile 135Asp Ala Glu Leu Ile 135

Asp Glu Glu Ala Leu 140Asp Glu Glu Ala Leu 140

Ser Leu Glu Leu Glu 145Ser Leu Glu Leu Glu 145

Leu Gly Leu His Arg 150Leu Gly Leu His Arg 150

Val Arg Glu Leu Pro 155Val Arg Glu Leu Pro 155

Leu Phe Leu Gly GlnLeu Phe Leu Gly Gln

165165

Ser Glu Phe Asp CysSer Glu Phe Asp Cys

170170

Phe Ser Asp Leu GlyPhe Ser Asp Leu Gly

175175

Ala Pro Pro Ala GlyAla Pro Pro Ala Gly

180180

Ser Val Ser Cys GlySer Val Ser Cys Gly

185185

Gly Ser Gly Gly GlyGly Ser Gly Gly Gly

190190

Gly Gln Ser Gln Leu 195Gly Gln Ser Gln Leu 195

Ile Lys Pro Ser Arg 200Ile Lys Pro Ser Arg 200

Met Arg Lys Tyr Pro 205Met Arg Lys Tyr Pro 205

Arg Pro Ser Lys Thr 210Arg Pro Ser Lys Thr 210

Pro Pro His Glu Arg 215Pro Pro His Glu Arg 215

Pro Tyr Ala Cys Pro 220Pro Tyr Ala Cys Pro 220

Glu Ser Cys Asp Arg 225Glu Ser Cys Asp Arg 225

Arg Phe Ser Arg Ser 230Arg Phe Ser Arg Ser 230

Asp Asn Leu Val Arg 235Asp Asn Leu Val Arg 235

Ile Arg Ile His ThrIle Arg Ile His Thr

245245

Gly Gln Lys Pro PheGly Gln Lys Pro Phe

250250

Gln Cys Arg Ile CysGln Cys Arg Ile Cys

255255

Arg Asn Phe Ser HisArg Asn Phe Ser His

260260

Arg Thr Thr Leu ThrArg Thr Thr Leu Thr

265265

Asn His Ile Arg ThrAsn His Ile Arg Thr

270270

ArgArg

AlaAla

Val 80Val 80

ProPro

ProPro

HisHis

ThrThr

Glu 160Glu 160

SerSer

SerSer

AsnAsn

ValVal

His 240His 240

MetMet

HisHis

- 189 046157- 189 046157

Thr Gly GluThr Gly Glu

275275

Lys Pro PheLys Pro Phe

Ala Cys AspAla Cys Asp

280280

Arg Glu AspArg Glu Asp

290290

Asn Leu HisAsn Leu His

Thr His Thr 295Thr His Thr 295

Asp Arg Pro 305Asp Arg Pro 305

Thr Ser HisThr Ser His

Pro Phe GlnPro Phe Gln

Leu Val ArgLeu Val Arg

355355

Asp Ile CysAsp Ile Cys

370370

Thr Lys Ile 385Thr Lys Ile 385

Tyr Ala Cys 310Tyr Ala Cys 310

Ser Leu Thr 325Ser Leu Thr 325

Cys Arg Ile 340Cys Arg Ile 340

His Ile ArgHis Ile Arg

Gly Arg LysGly Arg Lys

His Leu Arg 390His Leu Arg 390

Pro Val GluPro Val Glu

Glu His IleGlu His Ile

Cys Met ArgCys Met Arg

345345

Thr His ThrThr His Thr

360360

Phe Ala Arg 375Phe Ala Arg 375

Gln Lys AspGln Lys Asp

Ile Cys GlyIle Cys Gly

Lys Ile His 300Lys Ile His 300

Ser Cys Asp 315Ser Cys Asp 315

Arg Ile His 330Arg Ile His 330

Asn Phe SerAsn Phe Ser

Gly Glu LysGly Glu Lys

Glu Asp AsnGlu Asp Asn

380380

LysLys

Arg Lys Phe Ala 285Arg Lys Phe Ala 285

Leu Arg Gln LysLeu Arg Gln Lys

Arg Arg Phe SerArg Arg Phe Ser

320320

Thr Gly Gln LysThr Gly Gln Lys

335335

Gln Ser Ser SerGln Ser Ser Ser

350350

Pro Phe Ala Cys 365Pro Phe Ala Cys 365

Leu His Thr His <210> 105 <211> 580 <212> Белок <213> Искусственная последовательность <220>Leu His Thr His <210> 105 <211> 580 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности<223> Description of the artificial sequence

Синтетический полипептид <400> 105Synthetic polypeptide <400> 105

Met Ala Ala Asp 1Met Ala Ala Asp 1

His Leu Met Leu 5His Leu Met Leu 5

Ala Glu Gly Tyr 10Ala Glu Gly Tyr 10

Arg Leu Val Gln 15Arg Leu Val Gln 15

Arg Pro Pro SerArg Pro Pro Ser

Ala Ala Ala AlaAla Ala Ala Ala

His Gly Pro His 25His Gly Pro His 25

Ala Leu Arg Thr 30Ala Leu Arg Thr 30

Leu Pro Pro Tyr 35Leu Pro Pro Tyr 35

Ala Gly Pro Gly 40Ala Gly Pro Gly 40

Leu Asp Ser GlyLeu Asp Ser Gly

Leu Arg Pro Arg 45Leu Arg Pro Arg 45

Gly Ala Pro Leu 50Gly Ala Pro Leu 50

Gly Pro Pro Pro 55Gly Pro Pro Pro 55

Pro Arg Gln ProPro Arg Gln Pro

Gly Ala Leu AlaGly Ala Leu Ala

Tyr Gly Ala Phe 65Tyr Gly Ala Phe 65

Gly Pro Pro Ser 70Gly Pro Pro Ser 70

Ser Phe Gln ProSer Phe Gln Pro

Phe Pro Ala ValPhe Pro Ala Val

Pro Pro Pro AlaPro Pro Pro Ala

Ala Gly Ile AlaAla Gly Ile Ala

His Leu Gln ProHis Leu Gln Pro

Val Ala Thr ProVal Ala Thr Pro

- 190 046157- 190 046157

Tyr Pro Gly Arg AlaTyr Pro Gly Arg Ala

100100

Ala Ala Pro Pro AsnAla Ala Pro Pro Asn

105105

Ala Pro Gly Gly ProAla Pro Gly Gly Pro

110110

Gly Pro Gln Pro AlaGly Pro Gln Pro Ala

115115

Pro Ser Ala Ala AlaPro Ser Ala Ala Ala

120120

Pro Pro Pro Pro AlaPro Pro Pro Pro Ala

125125

Ala Leu Gly Gly MetAla Leu Gly Gly Met

130130

Asp Ala Glu Leu Ile 135Asp Ala Glu Leu Ile 135

Asp Glu Glu Ala Leu 140Asp Glu Glu Ala Leu 140

Ser Leu Glu Leu Glu 145Ser Leu Glu Leu Glu 145

Leu Gly Leu His Arg 150Leu Gly Leu His Arg 150

Val Arg Glu Leu Pro 155Val Arg Glu Leu Pro 155

Leu Phe Leu Gly GlnLeu Phe Leu Gly Gln

165165

Ser Glu Phe Asp CysSer Glu Phe Asp Cys

170170

Phe Ser Asp Leu GlyPhe Ser Asp Leu Gly

175175

Ala Pro Pro Ala GlyAla Pro Pro Ala Gly

180180

Ser Val Ser Cys GlySer Val Ser Cys Gly

185185

Gly Ser Gly Gly GlyGly Ser Gly Gly Gly

190190

Gly Gln Ser Gln Leu 195Gly Gln Ser Gln Leu 195

Ile Lys Pro Ser Arg 200Ile Lys Pro Ser Arg 200

Met Arg Lys Tyr Pro 205Met Arg Lys Tyr Pro 205

Arg Pro Ser Lys ThrArg Pro Ser Lys Thr

210210

Pro Pro His Glu Arg 215Pro Pro His Glu Arg 215

Pro Tyr Ala Cys Pro 220Pro Tyr Ala Cys Pro 220

Glu Ser Cys Asp Arg 225Glu Ser Cys Asp Arg 225

Arg Phe Ser Arg Ser 230Arg Phe Ser Arg Ser 230

Asp Asn Leu Val Arg 235Asp Asn Leu Val Arg 235

Ile Arg Ile His ThrIle Arg Ile His Thr

245245

Gly Gln Lys Pro PheGly Gln Lys Pro Phe

250250

Gln Cys Arg Ile CysGln Cys Arg Ile Cys

255255

Arg Asn Phe Ser ArgArg Asn Phe Ser Arg

260260

Glu Asp Asn Leu HisGlu Asp Asn Leu His

265265

Thr His Ile Arg ThrThr His Ile Arg Thr

270270

Thr Gly Glu Lys ProThr Gly Glu Lys Pro

275275

Phe Ala Cys Asp Ile 280Phe Ala Cys Asp Ile 280

Cys Gly Arg Lys PheCys Gly Arg Lys Phe

285285

Arg Ser Asp Glu LeuArg Ser Asp Glu Leu

290290

Val Arg His Thr LysVal Arg His Thr Lys

295295

Ile His Leu Arg GlnIle His Leu Arg Gln

300300

Asp Arg Pro Tyr Ala 305Asp Arg Pro Tyr Ala 305

Cys Pro Val Glu Ser 310Cys Pro Val Glu Ser 310

Cys Asp Arg Arg Phe 315Cys Asp Arg Arg Phe 315

Gln Ser Gly Asn LeuGln Ser Gly Asn Leu

325325

Thr Glu His Ile ArgThr Glu His Ile Arg

330330

Ile His Thr Gly GlnIle His Thr Gly Gln

335335

ProPro

HisHis

ThrThr

Glu 160Glu 160

SerSer

SerSer

AsnAsn

ValVal

His 240His 240

MetMet

HisHis

AlaAla

LysLys

Ser 320Ser 320

LysLys

- 191 046157- 191 046157

Pro Phe Gln Cys Arg Ile Cys Met ArgPro Phe Gln Cys Arg Ile Cys Met Arg

340 345340 345

Leu Val Arg His Ile Arg Thr His ThrLeu Val Arg His Ile Arg Thr His Thr

355 360355 360

Asp Ile Cys Gly Arg Lys Phe Ala GlnAsp Ile Cys Gly Arg Lys Phe Ala Gln

370 375370 375

Thr Lys Ile His Leu Arg Gln Lys AspThr Lys Ile His Leu Arg Gln Lys Asp

385 390385 390

Leu Met Leu Ala Glu Gly Tyr Arg LeuLeu Met Leu Ala Glu Gly Tyr Arg Leu

405405

Ala Ala Ala His Gly Pro His Ala LeuAla Ala Ala His Gly Pro His Ala Leu

420 425420 425

Gly Pro Gly Leu Asp Ser Gly Leu ArgGly Pro Gly Leu Asp Ser Gly Leu Arg

435 440435 440

Pro Pro Pro Pro Arg Gln Pro Gly AlaPro Pro Pro Pro Arg Gln Pro Gly Ala

450 455450 455

Pro Pro Ser Ser Phe Gln Pro Phe ProPro Pro Ser Ser Phe Gln Pro Phe Pro

465 470465 470

Gly Ile Ala His Leu Gln Pro Val Ala 485Gly Ile Ala His Leu Gln Pro Val Ala 485

Ala Ala Pro Pro Asn Ala Pro Gly GlyAla Ala Pro Pro Asn Ala Pro Gly Gly

500 505500 505

Pro Ser Ala Ala Ala Pro Pro Pro ProPro Ser Ala Ala Ala Pro Pro Pro Pro

515 520515 520

Asp Ala Glu Leu Ile Asp Glu Glu AlaAsp Ala Glu Leu Ile Asp Glu Glu Ala

530 535530 535

Leu Gly Leu His Arg Val Arg Glu LeuLeu Gly Leu His Arg Val Arg Glu Leu

545 550545 550

Ser Glu Phe Asp Cys Phe Ser Asp LeuSer Glu Phe Asp Cys Phe Ser Asp Leu

565565

Phe Ser Thr Ser Gly HisPhe Ser Thr Ser Gly His

350350

Glu Lys Pro Phe Ala Cys 365Glu Lys Pro Phe Ala Cys 365

Ser Thr Leu Thr Glu HisSer Thr Leu Thr Glu His

380380

Leu Glu Met Ala Asp HisLeu Glu Met Ala Asp His

395 400395 400

Gln Arg Pro Pro Ser AlaGln Arg Pro Pro Ser Ala

415415

Thr Leu Pro Pro Tyr AlaThr Leu Pro Pro Tyr Ala

430430

Arg Gly Ala Pro Leu GlyArg Gly Ala Pro Leu Gly

445445

Ala Tyr Gly Ala Phe GlyAla Tyr Gly Ala Phe Gly

460460

Val Pro Pro Pro Ala AlaVal Pro Pro Pro Ala Ala

475 480475 480

Pro Tyr Pro Gly Arg AlaPro Tyr Pro Gly Arg Ala

495495

Pro Gly Pro Gln Pro AlaPro Gly Pro Gln Pro Ala

510510

His Ala Leu Gly Gly MetHis Ala Leu Gly Gly Met

525525

Thr Ser Leu Glu Leu GluThr Ser Leu Glu Leu Glu

540540

Glu Leu Phe Leu Gly GlnGlu Leu Phe Leu Gly Gln

555 560555 560

Ser Ala Pro Pro Ala GlySer Ala Pro Pro Ala Gly

575575

Ser Val Ser CysSer Val Ser Cys

580580

- 192 046157 <210> 106 <211> 394 <212> Белок <213> Искусственная последовательность <220>- 192 046157 <210> 106 <211> 394 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 106<223> Description of artificial sequence: Synthetic polypeptide <400> 106

Met Ala Ala Asp His Leu Met Leu 1 5Met Ala Ala Asp His Leu Met Leu 1 5

Ala Glu Gly Tyr Arg Leu Val GlnAla Glu Gly Tyr Arg Leu Val Gln

1515

Arg Pro Pro Ser Ala Ala Ala Ala 20Arg Pro Pro Ser Ala Ala Ala Ala 20

His Gly Pro His Ala Leu Arg Thr 25 30His Gly Pro His Ala Leu Arg Thr 25 30

Leu Pro Pro Tyr Ala Gly Pro GlyLeu Pro Pro Tyr Ala Gly Pro Gly

4040

Leu Asp Ser Gly Leu Arg Pro Arg 45Leu Asp Ser Gly Leu Arg Pro Arg 45

Gly Ala Pro Leu Gly Pro Pro ProGly Ala Pro Leu Gly Pro Pro Pro

5555

Pro Arg Gln Pro Gly Ala Leu Ala 60Pro Arg Gln Pro Gly Ala Leu Ala 60

Tyr Gly Ala Phe Gly Pro Pro Ser 65 70Tyr Gly Ala Phe Gly Pro Pro Ser 65 70

Ser Phe Gln Pro Phe Pro Ala ValSer Phe Gln Pro Phe Pro Ala Val

8080

Pro Pro Pro Ala Ala Gly Ile Ala 85Pro Pro Pro Ala Ala Gly Ile Ala 85

His Leu Gln Pro Val Ala Thr ProHis Leu Gln Pro Val Ala Thr Pro

9595

Tyr Pro Gly Arg Ala Ala Ala ProTyr Pro Gly Arg Ala Ala Ala Pro

100100

Pro Asn Ala Pro Gly Gly Pro ProPro Asn Ala Pro Gly Gly Pro Pro

105 110105 110

Gly Pro Gln Pro Ala Pro Ser AlaGly Pro Gln Pro Ala Pro Ser Ala

115 120115 120

Ala Ala Pro Pro Pro Pro Ala HisAla Ala Pro Pro Pro Pro Ala His

125125

Ala Leu Gly Gly Met Asp Ala GluAla Leu Gly Gly Met Asp Ala Glu

130 135130 135

Leu Ile Asp Glu Glu Ala Leu ThrLeu Ile Asp Glu Glu Ala Leu Thr

140140

Ser Leu Glu Leu Glu Leu Gly LeuSer Leu Glu Leu Glu Leu Gly Leu

145 150145 150

His Arg Val Arg Glu Leu Pro GluHis Arg Val Arg Glu Leu Pro Glu

155 160155 160

Leu Phe Leu Gly Gln Ser Glu PheLeu Phe Leu Gly Gln Ser Glu Phe

165165

Asp Cys Phe Ser Asp Leu Gly SerAsp Cys Phe Ser Asp Leu Gly Ser

170 175170 175

Ala Pro Pro Ala Gly Ser Val SerAla Pro Pro Ala Gly Ser Val Ser

180180

Cys Gly Gly Ser Gly Gly Gly SerCys Gly Gly Ser Gly Gly Gly Ser

185 190185 190

Gly Gln Ser Gln Leu Ile Lys ProGly Gln Ser Gln Leu Ile Lys Pro

195 200195 200

Ser Arg Met Arg Lys Tyr Pro AsnSer Arg Met Arg Lys Tyr Pro Asn

205205

- 193 046157- 193 046157

Arg ProArg Pro

210210

Ser LysSer Lys

Thr ProThr Pro

Glu Ser 225Glu Ser 225

Cys AspCys Asp

Arg ArgArg Arg

230230

Ile ArgIle Arg

Ile HisIle His

Thr Gly 245Thr Gly 245

Arg AsnArg Asn

Phe SerPhe Ser

260260

Arg GluArg Glu

Pro His 215Pro His 215

Phe SerPhe Ser

Gln LysGln Lys

Asp AsnAsp Asn

Glu ArgGlu Arg

Arg SerArg Ser

Pro PhePro Phe

250250

Leu His 265Leu His 265

Thr GlyThr Gly

Glu Lys 275Glu Lys 275

Pro PhePro Phe

Ala CysAla Cys

280280

Asp IleAsp Ile

Pro Tyr 220Pro Tyr 220

Asp Asn 235Asp Asn 235

Gln CysGln Cys

Thr HisThr His

Cys GlyCys Gly

Ala Cys Pro ValAla Cys Pro Val

Leu Val Arg HisLeu Val Arg His

240240

Arg Ile Cys MetArg Ile Cys Met

255255

Ile Arg Thr HisIle Arg Thr His

270270

Arg Lys Phe Ala 285Arg Lys Phe Ala 285

Arg SerArg Ser

290290

Asp GluAsp Glu

Leu ValLeu Val

Arg His 295Arg His 295

Thr LysThr Lys

Ile HisIle His

300300

Leu Arg Gln LysLeu Arg Gln Lys

Asp Arg 305Asp Arg 305

Pro TyrPro Tyr

Ala CysAla Cys

310310

Pro ValPro Val

Glu SerGlu Ser

Cys Asp 315Cys Asp 315

Arg Arg Phe SerArg Arg Phe Ser

320320

Gln SerGln Ser

Gly AsnGly Asn

Leu Thr 325Leu Thr 325

Glu HisGlu His

Ile ArgIle Arg

330330

Ile HisIle His

Thr Gly Gln LysThr Gly Gln Lys

335335

Pro PhePro Phe

Gln CysGln Cys

340340

Arg IleArg Ile

Cys MetCys Met

Arg Asn 345Arg Asn 345

Phe SerPhe Ser

Thr Ser Gly His 350Thr Ser Gly His 350

Leu ValLeu Val

Arg His 355Arg His 355

Ile ArgIle Arg

Thr HisThr His

360360

Thr GlyThr Gly

Glu LysGlu Lys

Pro Phe Ala Cys 365Pro Phe Ala Cys 365

Asp IleAsp Ile

370370

Cys GlyCys Gly

Arg LysArg Lys

Phe Ala 375Phe Ala 375

Gln AsnGln Asn

Ser ThrSer Thr

380380

Leu Thr Glu HisLeu Thr Glu His

Thr Lys 385Thr Lys 385

Ile HisIle His

Leu ArgLeu Arg

390390

Gln LysGln Lys

Asp Lys <210> 107 <211> 388 <212> Белок <213> Искусственная последовательность <220>Asp Lys <210> 107 <211> 388 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид<223> Description of the artificial polypeptide sequence

Синтетический <400> 107Synthetic <400> 107

Met Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg 1 5 10Met Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg 1 5 10

Lys Tyr Pro AsnLys Tyr Pro Asn

Arg Pro Ser Lys Thr Pro Pro His Glu Arg Pro TyrArg Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr

Ala Cys Pro ValAla Cys Pro Val

- 194 046157- 194 046157

Glu Ser Cys Asp Arg 35Glu Ser Cys Asp Arg 35

Arg Phe Ser Arg Ser 40Arg Phe Ser Arg Ser 40

Asp Asn Leu Val Arg 45Asp Asn Leu Val Arg 45

Ile Arg Ile His Thr 50Ile Arg Ile His Thr 50

Gly Gln Lys Pro Phe 55Gly Gln Lys Pro Phe 55

Gln Cys Arg Ile Cys 60Gln Cys Arg Ile Cys 60

Arg Asn Phe Ser Arg 65Arg Asn Phe Ser Arg 65

Glu Asp Asn Leu His 70Glu Asp Asn Leu His 70

Thr His Ile Arg Thr 75Thr His Ile Arg Thr 75

Thr Gly Glu Lys ProThr Gly Glu Lys Pro

Phe Ala Cys Asp IlePhe Ala Cys Asp Ile

Cys Gly Arg Lys PheCys Gly Arg Lys Phe

Arg Ser Asp Glu LeuArg Ser Asp Glu Leu

100100

Val Arg His Thr LysVal Arg His Thr Lys

105105

Ile His Leu Arg GlnIle His Leu Arg Gln

110110

Asp Arg Pro Tyr Ala 115Asp Arg Pro Tyr Ala 115

Cys Pro Val Glu Ser 120Cys Pro Val Glu Ser 120

Cys Asp Arg Arg Phe 125Cys Asp Arg Arg Phe 125

Gln Ser Gly Asn LeuGln Ser Gly Asn Leu

130130

Thr Glu His Ile ArgThr Glu His Ile Arg

135135

Ile His Thr Gly GlnIle His Thr Gly Gln

140140

Pro Phe Gln Cys Arg 145Pro Phe Gln Cys Arg 145

Ile Cys Met Arg Asn 150Ile Cys Met Arg Asn 150

Phe Ser Thr Ser Gly 155Phe Ser Thr Ser Gly 155

Leu Val Arg His IleLeu Val Arg His Ile

165165

Arg Thr His Thr GlyArg Thr His Thr Gly

170170

Glu Lys Pro Phe AlaGlu Lys Pro Phe Ala

175175

Asp Ile Cys Gly ArgAsp Ile Cys Gly Arg

180180

Lys Phe Ala Gln AsnLys Phe Ala Gln Asn

185185

Ser Thr Leu Thr GluSer Thr Leu Thr Glu

190190

Thr Lys Ile His Leu 195Thr Lys Ile His Leu 195

Arg Gln Lys Asp LysArg Gln Lys Asp Lys

200200

Leu Glu Met Ala AspLeu Glu Met Ala Asp

205205

Leu Met Leu Ala GluLeu Met Leu Ala Glu

210210

Gly Tyr Arg Leu ValGly Tyr Arg Leu Val

215215

Gln Arg Pro Pro SerGln Arg Pro Pro Ser

220220

Ala Ala Ala His Gly 225Ala Ala Ala His Gly 225

Pro His Ala Leu Arg 230Pro His Ala Leu Arg 230

Thr Leu Pro Pro Tyr 235Thr Leu Pro Pro Tyr 235

Gly Pro Gly Leu AspGly Pro Gly Leu Asp

245245

Ser Gly Leu Arg ProSer Gly Leu Arg Pro

250250

Arg Gly Ala Pro LeuArg Gly Ala Pro Leu

255255

Pro Pro Pro Pro ArgPro Pro Pro Pro Arg

260260

Gln Pro Gly Ala LeuGln Pro Gly Ala Leu

265265

Ala Tyr Gly Ala PheAla Tyr Gly Ala Phe

270270

HisHis

MetMet

His 80His 80

AlaAla

LysLys

SerSer

LysLys

His 160His 160

CysCys

HisHis

HisHis

AlaAla

Ala 240Ala 240

GlyGly

GlyGly

- 195 046157- 195 046157

Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val ProPro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val Pro

275 280275 280

Pro Pro Ala Ala 285Pro Pro Ala Ala 285

Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro TyrGly Ile Ala His Leu Gln Pro Val Ala Thr Pro Tyr

290 295 300290 295 300

Pro Gly Arg AlaPro Gly Arg Ala

Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro GlyAla Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro Gly

305 310 315305 310 315

Pro Gln Pro AlaPro Gln Pro Ala

320320

Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His AlaPro Ser Ala Ala Ala Pro Pro Pro Pro Ala His Ala

325 330325 330

Leu Gly Gly MetLeu Gly Gly Met

335335

Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr SerAsp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr Ser

340 345340 345

Leu Glu Leu GluLeu Glu Leu Glu

350350

Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu LeuLeu Gly Leu His Arg Val Arg Glu Leu Pro Glu Leu

355 360355 360

Phe Leu Gly Gln 365Phe Leu Gly Gln 365

Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser AlaSer Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser Ala

370 375 380370 375 380

Pro Pro Ala GlyPro Pro Ala Gly

Ser Val Ser Cys 385 <210> 108 <211> 479 <212> Белок <213> Искусственная последовательность <220>Ser Val Ser Cys 385 <210> 108 <211> 479 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности<223> Description of the artificial sequence

Синтетический полипептид <400> 108Synthetic polypeptide <400> 108

Met Gln Ser Gln 1Met Gln Ser Gln 1

Leu Ile Lys Pro 5Leu Ile Lys Pro 5

Ser Arg Met Arg 10Ser Arg Met Arg 10

Lys Tyr Pro Asn 15Lys Tyr Pro Asn 15

Arg Pro Ser LysArg Pro Ser Lys

Thr Pro Pro HisThr Pro Pro His

Glu Arg Pro Tyr 25Glu Arg Pro Tyr 25

Ala Cys Pro Val 30Ala Cys Pro Val 30

Glu Ser Cys Asp 35Glu Ser Cys Asp 35

Arg Arg Phe Ser 40Arg Arg Phe Ser 40

Arg Ser Asp AsnArg Ser Asp Asn

Leu Val Arg His 45Leu Val Arg His 45

Ile Arg Ile His 50Ile Arg Ile His 50

Thr Gly Gln Lys 55Thr Gly Gln Lys 55

Pro Phe Gln Cys 60Pro Phe Gln Cys 60

Arg Ile Cys MetArg Ile Cys Met

Arg Asn Phe Ser 65Arg Asn Phe Ser 65

Arg Glu Asp Asn 70Arg Glu Asp Asn 70

Leu His Thr HisLeu His Thr His

Ile Arg Thr HisIle Arg Thr His

Thr Gly Glu LysThr Gly Glu Lys

Pro Phe Ala CysPro Phe Ala Cys

Asp Ile Cys GlyAsp Ile Cys Gly

Arg Lys Phe AlaArg Lys Phe Ala

- 196 046157- 196 046157

90 9590 95

ArgArg

AspAsp

GlnGln

Pro 145Pro 145

LeuLeu

AspAsp

ThrThr

GluGlu

Gly 225Gly 225

GlnGln

PhePhe

AsnAsn

GlyGly

Ser 305Ser 305

AlaAla

Ser Asp Glu Leu ValSer Asp Glu Leu Val

100100

Arg His Thr Lys Ile 105Arg His Thr Lys Ile 105

His Leu Arg Gln Lys 110His Leu Arg Gln Lys 110

Arg Pro Tyr Ala Cys 115Arg Pro Tyr Ala Cys 115

Pro Val Glu Ser CysPro Val Glu Ser Cys

120120

Asp Arg Arg Phe Ser 125Asp Arg Arg Phe Ser 125

Ser Gly Asn Leu Thr 130Ser Gly Asn Leu Thr 130

Glu His Ile Arg Ile 135Glu His Ile Arg Ile 135

His Thr Gly Gln Lys 140His Thr Gly Gln Lys 140

Phe Gln Cys Arg IlePhe Gln Cys Arg Ile

150150

Cys Met Arg Asn PheCys Met Arg Asn Phe

155155

Ser Thr Ser Gly HisSer Thr Ser Gly His

160160

Val Arg His Ile ArgVal Arg His Ile Arg

165165

Thr His Thr Gly GluThr His Thr Gly Glu

170170

Lys Pro Phe Ala CysLys Pro Phe Ala Cys

175175

Ile Cys Gly Arg LysIle Cys Gly Arg Lys

180180

Phe Ala Gln Asn SerPhe Ala Gln Asn Ser

185185

Thr Leu Thr Glu HisThr Leu Thr Glu His

190190

Lys Ile His Leu ArgLys Ile His Leu Arg

195195

Gln Lys Asp Lys LeuGln Lys Asp Lys Leu

200200

Glu Met Ser Gly Leu 205Glu Met Ser Gly Leu 205

Met Ala Asp His Met 210Met Ala Asp His Met 210

Met Ala Met Asn His 215Met Ala Met Asn His 215

Gly Arg Phe Pro Asp 220Gly Arg Phe Pro Asp 220

Thr Asn Gly Leu HisThr Asn Gly Leu His

230230

His His Pro Ala HisHis His Pro Ala His

235235

Arg Met Gly Met GlyArg Met Gly Met Gly

240240

Phe Pro Ser Pro HisPhe Pro Ser Pro His

245245

His His Gln Gln GlnHis His Gln Gln Gln

250250

Gln Pro Gln His AlaGln Pro Gln His Ala

255255

Asn Ala Leu Met Gly 260Asn Ala Leu Met Gly 260

Ala Thr Ser Gly Ile 275Ala Thr Ser Gly Ile 275

Gly His Pro Pro Ser 290Gly His Pro Pro Ser 290

Gln Phe Met Gly ProGln Phe Met Gly Pro

310310

Ser Met Gln Leu GlnSer Met Gln Leu Gln

325325

Glu His Ile His Tyr 265Glu His Ile His Tyr 265

Gly Ala Gly Asn Met 270Gly Ala Gly Asn Met 270

Arg His Ala Met Gly 280Arg His Ala Met Gly 280

Ala Leu Ala Pro Ala 295Ala Leu Ala Pro Ala 295

Pro Val Ala Ser GlnPro Val Ala Ser Gln

315315

Lys Leu Asn Asn GlnLys Leu Asn Asn Gln

330330

Pro Gly Thr Val AsnPro Gly Thr Val Asn

285285

Ala Arg Phe Asn Asn 300Ala Arg Phe Asn Asn 300

Gly Gly Ser Leu ProGly Gly Ser Leu Pro

320320

Tyr Phe Asn His HisTyr Phe Asn His His

335335

- 197 046157- 197 046157

Pro Tyr Pro His Asn His Tyr Met Pro Asp Leu HisPro Tyr Pro His Asn His Tyr Met Pro Asp Leu His

340 345340 345

Pro Ala Ala GlyPro Ala Ala Gly

350350

His Gln Met Asn Gly Thr Asn Gln His Phe Arg AspHis Gln Met Asn Gly Thr Asn Gln His Phe Arg Asp

355 360355 360

Cys Asn Pro Lys 365Cys Asn Pro Lys 365

His Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser GlyHis Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser Gly

370 375 380370 375 380

Gly Ser Ser ThrGly Ser Ser Thr

Pro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly AlaPro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly Ala

385 390 395385 390 395

Gly Ser Ser AsnGly Ser Ser Asn

400400

Ser Gly Gly GlySer Gly Gly Gly

Ser Gly Ser Gly Asn Met Pro AlaSer Gly Ser Gly Asn Met Pro Ala

405 410405 410

Ser Val Ala HisSer Val Ala His

415415

Val Pro Ala Ala Met Leu Pro Pro Asn Val Ile AspVal Pro Ala Ala Met Leu Pro Pro Asn Val Ile Asp

420 425420 425

Thr Asp Phe Ile 430Thr Asp Phe Ile 430

Asp Glu Glu Val Leu Met Ser Leu Val Ile Glu MetAsp Glu Glu Val Leu Met Ser Leu Val Ile Glu Met

435 440435 440

Gly Leu Asp Arg 445Gly Leu Asp Arg 445

Ile Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln AsnIle Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln Asn

450 455 460450 455 460

Glu Phe Asp PheGlu Phe Asp Phe

Met Thr Asp Phe Val Cys Lys Gln Gln Pro Ser ArgMet Thr Asp Phe Val Cys Lys Gln Gln Pro Ser Arg

465 470 475465 470 475

Val Ser Cys <210> 109 <211> 476 <212> Белок <213> Искусственная последовательность <220>Val Ser Cys <210> 109 <211> 476 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности<223> Description of the artificial sequence

Синтетический полипептид <400> 109Synthetic polypeptide <400> 109

Met Ser Gly Leu 1Met Ser Gly Leu 1

Glu Met Ala Asp 5Glu Met Ala Asp 5

His Met Met AlaHis Met Met Ala

Met Asn His Gly 15Met Asn His Gly 15

Arg Phe Pro AspArg Phe Pro Asp

Gly Thr Asn GlyGly Thr Asn Gly

Leu His His His 25Leu His His His 25

Pro Ala His Arg 30Pro Ala His Arg 30

Met Gly Met Gly 35Met Gly Met Gly 35

Gln Phe Pro SerGln Phe Pro Ser

Pro His His HisPro His His His

Gln Gln Gln Gln 45Gln Gln Gln Gln 45

Pro Gln His Ala 50Pro Gln His Ala 50

Phe Asn Ala LeuPhe Asn Ala Leu

Met Gly Glu HisMet Gly Glu His

Ile His Tyr GlyIle His Tyr Gly

Ala Gly Asn MetAla Gly Asn Met

Asn Ala Thr SerAsn Ala Thr Ser

Gly Val Arg HisGly Val Arg His

Ala Met Gly ProAla Met Gly Pro

- 198 046157- 198 046157

GlyGly

ArgArg

GlyGly

PhePhe

Pro 145Pro 145

CysCys

GlyGly

GlyGly

SerSer

Thr 225Thr 225

GlyGly

GluGlu

ValVal

ProPro

Pro 305Pro 305

75 8075 80

Thr Val Asn Gly GlyThr Val Asn Gly Gly

Phe Asn Asn Ser GlnPhe Asn Asn Ser Gln

100100

Ser Leu Pro Ala SerSer Leu Pro Ala Ser

115115

Asn His His Pro Tyr 130Asn His His Pro Tyr 130

Ala Ala Gly His GlnAla Ala Gly His Gln

150150

Asn Pro Lys His SerAsn Pro Lys His Ser

165165

Ser Ser Thr Pro Gly 180Ser Ser Thr Pro Gly 180

Ser Ser Asn Ser GlySer Ser Asn Ser Gly

195195

Val Ala His Val Pro 210Val Ala His Val Pro 210

Asp Phe Ile Asp GluAsp Phe Ile Asp Glu

230230

Leu Asp Arg Ile LysLeu Asp Arg Ile Lys

245245

Phe Asp Phe Met Thr 260Phe Asp Phe Met Thr 260

Ser Cys Gln Ser GlnSer Cys Gln Ser Gln

275275

Asn Arg Pro Ser Lys 290Asn Arg Pro Ser Lys 290

Val Glu Ser Cys AspVal Glu Ser Cys Asp

310310

His Pro Pro Ser AlaHis Pro Pro Ser Ala

Phe Met Gly Pro Pro 105Phe Met Gly Pro Pro 105

Met Gln Leu Gln LysMet Gln Leu Gln Lys

120120

Pro His Asn His Tyr 135Pro His Asn His Tyr 135

Met Asn Gly Thr AsnMet Asn Gly Thr Asn

155155

Gly Gly Ser Ser ThrGly Gly Ser Ser Thr

170170

Gly Ser Gly Ser Ser 185Gly Ser Gly Ser Ser 185

Gly Gly Ser Gly Ser 200Gly Gly Ser Gly Ser 200

Ala Ala Met Leu Pro 215Ala Ala Met Leu Pro 215

Glu Val Leu Met SerGlu Val Leu Met Ser

235235

Glu Leu Pro Glu LeuGlu Leu Pro Glu Leu

250250

Asp Phe Val Cys Lys 265Asp Phe Val Cys Lys 265

Leu Ile Lys Pro Ser 280Leu Ile Lys Pro Ser 280

Thr Pro Pro His Glu 295Thr Pro Pro His Glu 295

Arg Arg Phe Ser ArgArg Arg Phe Ser Arg

315315

Leu Ala Pro Ala AlaLeu Ala Pro Ala Ala

Val Ala Ser Gln GlyVal Ala Ser Gln Gly

110110

Leu Asn Asn Gln TyrLeu Asn Asn Gln Tyr

125125

Met Pro Asp Leu His 140Met Pro Asp Leu His 140

Gln His Phe Arg AspGln His Phe Arg Asp

160160

Pro Gly Gly Ser GlyPro Gly Gly Ser Gly

175175

Ser Gly Gly Gly AlaSer Gly Gly Gly Ala

190190

Gly Asn Met Pro Ala 205Gly Asn Met Pro Ala 205

Pro Asn Val Ile Asp 220Pro Asn Val Ile Asp 220

Leu Val Ile Glu MetLeu Val Ile Glu Met

240240

Trp Leu Gly Gln AsnTrp Leu Gly Gln Asn

255255

Gln Gln Pro Ser Arg 270Gln Gln Pro Ser Arg 270

Arg Met Arg Lys TyrArg Met Arg Lys Tyr

285285

Arg Pro Tyr Ala Cys 300Arg Pro Tyr Ala Cys 300

Ser Asp Asn Leu ValSer Asp Asn Leu Val

320320

- 199 046157- 199 046157

Arg His Ile Arg Ile His Thr Gly Gln Lys ProArg His Ile Arg Ile His Thr Gly Gln Lys Pro

325 330325 330

PhePhe

Gln Cys Arg IleGln Cys Arg Ile

335335

Cys Met Arg Asn Phe Ser Arg Glu Asp Asn Leu HisCys Met Arg Asn Phe Ser Arg Glu Asp Asn Leu His

340 345340 345

Thr His Ile ArgThr His Ile Arg

350350

Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp IleThr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile

355 360355 360

Cys Gly Arg Lys 365Cys Gly Arg Lys 365

Phe Ala Arg Ser Asp Glu Leu Val Arg HisPhe Ala Arg Ser Asp Glu Leu Val Arg His

370 375370 375

Thr LysThr Lys

380380

Ile His Leu ArgIle His Leu Arg

Gln Lys Asp 385Gln Lys Asp 385

Arg Pro TyrArg Pro Tyr

390390

Phe Ser GlnPhe Ser Gln

Ser Gly AsnSer Gly Asn

405405

Gln Lys ProGln Lys Pro

Phe Gln Cys 420Phe Gln Cys 420

Gly His LeuGly His Leu

435435

Val Arg HisVal Arg His

Ala Cys AspAla Cys Asp

450450

Ile Cys GlyIle Cys Gly

Glu His Thr 465Glu His Thr 465

Lys Ile HisLys Ile His

470470

Ala Cys ProAla Cys Pro

Leu Thr GluLeu Thr Glu

Arg Ile Cys 425Arg Ile Cys 425

Ile Arg Thr 440Ile Arg Thr 440

Arg Lys Phe 455Arg Lys Phe 455

Leu Arg GlnLeu Arg Gln

Val Glu SerVal Glu Ser

395395

His Ile Arg 410His Ile Arg 410

Met Arg AsnMet Arg Asn

His Thr GlyHis Thr Gly

Ala Gln AsnAla Gln Asn

460460

Lys Asp LysLys Asp Lys

475 <210> 110 <211> 554 <212> Белок <213> Искусственная последовательность <220>475 <210> 110 <211> 554 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 110<223> Description of the artificial sequence polypeptide <400> 110

Met Ala Ala Asp His Leu Met Leu Ala Glu Gly TyrMet Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr

5 105 10

Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His 20 25Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His 20 25

Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly 35 40Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly 35 40

Cys Asp Arg ArgCys Asp Arg Arg

400400

Ile His Thr Gly 415Ile His Thr Gly 415

Phe Ser Thr SerPhe Ser Thr Ser

430430

Glu Lys Pro Phe 445Glu Lys Pro Phe 445

Ser Thr Leu ThrSer Thr Leu Thr

СинтетическийSynthetic

Arg Leu Val Gln 15Arg Leu Val Gln 15

Ala Leu Arg Thr 30Ala Leu Arg Thr 30

Leu Arg Pro Arg 45Leu Arg Pro Arg 45

Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln ProGly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro

Gly Ala Leu AlaGly Ala Leu Ala

- 200 046157- 200 046157

55 6055 60

Tyr 65Tyr 65

ProPro

TyrTyr

GlyGly

AlaAla

Ser 145Ser 145

LeuLeu

AlaAla

GlyGly

ArgArg

Pro 225Pro 225

LeuLeu

GluGlu

AlaAla

CysCys

Gly Ala Phe Gly Pro Pro 70Gly Ala Phe Gly Pro Pro 70

Ser Ser Phe Gln Pro Phe Pro Ala ValSer Ser Phe Gln Pro Phe Pro Ala Val

8080

Pro Pro Ala Ala Gly Ile Ala His 85Pro Pro Ala Ala Gly Ile Ala His 85

Leu Gln Pro Val Ala Thr ProLeu Gln Pro Val Ala Thr Pro

9595

Pro Gly Arg Ala AlaPro Gly Arg Ala Ala

100100

Pro Gln Pro Ala ProPro Gln Pro Ala Pro

115115

Leu Gly Gly Met Asp 130Leu Gly Gly Met Asp 130

Leu Glu Leu Glu LeuLeu Glu Leu Glu Leu

150150

Phe Leu Gly Gln SerPhe Leu Gly Gln Ser

165165

Pro Pro Ala Gly SerPro Pro Ala Gly Ser

180180

Arg Pro His Ala Cys 195Arg Pro His Ala Cys 195

Ser Asp Asn Leu Val 210Ser Asp Asn Leu Val 210

Phe Gln Cys Arg IlePhe Gln Cys Arg Ile

230230

His Thr His Ile ArgHis Thr His Ile Arg

245245

Phe Cys Gly Arg Lys 260Phe Cys Gly Arg Lys 260

Lys Ile His Leu Lys 275Lys Ile His Leu Lys 275

Asp Arg Arg Phe Ser 290Asp Arg Arg Phe Ser 290

Ala Pro Pro Asn AlaAla Pro Pro Asn Ala

105105

Pro Gly Gly Pro ProPro Gly Gly Pro Pro

110110

Ser Ala Ala Ala ProSer Ala Ala Ala Pro

120120

Pro Pro Pro Ala HisPro Pro Pro Ala His

125125

Ala Glu Leu Ile Asp 135Ala Glu Leu Ile Asp 135

Glu Glu Ala Leu Thr 140Glu Glu Ala Leu Thr 140

Gly Leu His Arg ValGly Leu His Arg Val

155155

Glu Phe Asp Cys PheGlu Phe Asp Cys Phe

170170

Val Ser Cys Gly GlyVal Ser Cys Gly Gly

185185

Pro Ala Glu Gly Cys 200Pro Ala Glu Gly Cys 200

Arg His Leu Arg Ile 215Arg His Leu Arg Ile 215

Cys Met Arg Ser PheCys Met Arg Ser Phe

235235

Thr His Thr Gly GluThr His Thr Gly Glu

250250

Phe Ala Arg Ser AspPhe Ala Arg Ser Asp

265265

Gln Lys Glu His AlaGln Lys Glu His Ala

280280

Gln Ser Gly Asn Leu 295Gln Ser Gly Asn Leu 295

Arg Glu Leu Pro GluArg Glu Leu Pro Glu

160160

Ser Asp Leu Gly SerSer Asp Leu Gly Ser

175175

Ser Gly Gly Gly SerSer Gly Gly Gly Ser

190190

Asp Arg Arg Phe Ser 205Asp Arg Arg Phe Ser 205

His Thr Gly His Lys 220His Thr Gly His Lys 220

Ser Arg Glu Asp AsnSer Arg Glu Asp Asn

240240

Lys Pro Phe Ala CysLys Pro Phe Ala Cys

255255

Glu Leu Val Arg His 270Glu Leu Val Arg His 270

Cys Pro Ala Glu GlyCys Pro Ala Glu Gly

285285

Thr Glu His Leu Arg 300Thr Glu His Leu Arg 300

- 201 046157- 201 046157

Ile His Thr Gly His 305Ile His Thr Gly His 305

Lys Pro Phe Gln Cys 310Lys Pro Phe Gln Cys 310

Arg Ile Cys Met Arg 315Arg Ile Cys Met Arg 315

Phe Ser Thr Ser GlyPhe Ser Thr Ser Gly

325325

His Leu Val Arg HisHis Leu Val Arg His

330330

Ile Arg Thr His ThrIle Arg Thr His Thr

335335

Glu Lys Pro Phe AlaGlu Lys Pro Phe Ala

340340

Cys Glu Phe Cys GlyCys Glu Phe Cys Gly

345345

Arg Lys Phe Ala GlnArg Lys Phe Ala Gln

350350

Ser Thr Leu Thr GluSer Thr Leu Thr Glu

355355

His Ala Lys Ile His 360His Ala Lys Ile His 360

Leu Lys Gln Lys Glu 365Leu Lys Gln Lys Glu 365

Leu Glu Met Ala AspLeu Glu Met Ala Asp

370370

His Leu Met Leu AlaHis Leu Met Leu Ala

375375

Glu Gly Tyr Arg Leu 380Glu Gly Tyr Arg Leu 380

Gln Arg Pro Pro Ser 385Gln Arg Pro Pro Ser 385

Ala Ala Ala Ala His 390Ala Ala Ala Ala His 390

Gly Pro His Ala Leu 395Gly Pro His Ala Leu 395

Thr Leu Pro Pro TyrThr Leu Pro Pro Tyr

405405

Ala Gly Pro Gly LeuAla Gly Pro Gly Leu

410410

Asp Ser Gly Leu ArgAsp Ser Gly Leu Arg

415415

Arg Gly Ala Pro LeuArg Gly Ala Pro Leu

420420

Gly Pro Pro Pro ProGly Pro Pro Pro Pro

425425

Arg Gln Pro Gly AlaArg Gln Pro Gly Ala

430430

Ala Tyr Gly Ala Phe 435Ala Tyr Gly Ala Phe 435

Gly Pro Pro Ser Ser 440Gly Pro Pro Ser Ser 440

Phe Gln Pro Phe ProPhe Gln Pro Phe Pro

445445

Val Pro Pro Pro AlaVal Pro Pro Pro Ala

450450

Ala Gly Ile Ala His 455Ala Gly Ile Ala His 455

Leu Gln Pro Val AlaLeu Gln Pro Val Ala

460460

Pro Tyr Pro Gly Arg 465Pro Tyr Pro Gly Arg 465

Ala Ala Ala Pro Pro 470Ala Ala Ala Pro Pro 470

Asn Ala Pro Gly Gly 475Asn Ala Pro Gly Gly 475

Pro Gly Pro Gln ProPro Gly Pro Gln Pro

485485

Ala Pro Ser Ala AlaAla Pro Ser Ala Ala

490490

Ala Pro Pro Pro ProAla Pro Pro Pro Pro

495495

His Ala Leu Gly GlyHis Ala Leu Gly Gly

500500

Met Asp Ala Glu LeuMet Asp Ala Glu Leu

505505

Ile Asp Glu Glu AlaIle Asp Glu Glu Ala

510510

Thr Ser Leu Glu LeuThr Ser Leu Glu Leu

515515

Glu Leu Gly Leu His 520Glu Leu Gly Leu His 520

Arg Val Arg Glu Leu 525Arg Val Arg Glu Leu 525

Glu Leu Phe Leu GlyGlu Leu Phe Leu Gly

530530

Gln Ser Glu Phe Asp 535Gln Ser Glu Phe Asp 535

Cys Phe Ser Asp LeuCys Phe Ser Asp Leu

540540

Ser 320Ser 320

GlyGly

AsnAsn

LysLys

ValVal

Arg 400Arg 400

ProPro

LeuLeu

AlaAla

ThrThr

Pro 480Pro 480

AlaAla

LeuLeu

ProPro

GlyGly

Ser Ala Pro Pro Ala 545Ser Ala Pro Pro Ala 545

Gly Ser Val Ser Cys 550Gly Ser Val Ser Cys 550

- 202 046157 <210> 111 <211> 362 <212> Белок <213> Искусственная последовательность <220>- 202 046157 <210> 111 <211> 362 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности<223> Description of the artificial sequence

Синтетический полипептид <400> 111Synthetic polypeptide <400> 111

Met Arg Pro His Ala Cys 1 5Met Arg Pro His Ala Cys 1 5

Pro Ala Glu Gly Cys Asp 10Pro Ala Glu Gly Cys Asp 10

Arg Arg Phe Ser 15Arg Arg Phe Ser 15

Arg Ser Asp Asn Leu Val 20Arg Ser Asp Asn Leu Val 20

Arg His Leu Arg Ile His 25Arg His Leu Arg Ile His 25

Thr Gly His Lys 30Thr Gly His Lys 30

Pro Phe Gln Cys Arg Ile 35Pro Phe Gln Cys Arg Ile 35

Cys Met Arg Ser Phe Ser 40Cys Met Arg Ser Phe Ser 40

Arg Glu Asp Asn 45Arg Glu Asp Asn 45

Leu His Thr His Ile Arg 50Leu His Thr His Ile Arg 50

Thr His Thr Gly Glu Lys 55 60Thr His Thr Gly Glu Lys 55 60

Pro Phe Ala CysPro Phe Ala Cys

Glu Phe Cys Gly Arg Lys 65 70Glu Phe Cys Gly Arg Lys 65 70

Phe Ala Arg Ser Asp Glu 75Phe Ala Arg Ser Asp Glu 75

Leu Val Arg HisLeu Val Arg His

Ala Lys Ile His Leu Lys 85Ala Lys Ile His Leu Lys 85

Gln Lys Glu His Ala Cys 90Gln Lys Glu His Ala Cys 90

Pro Ala Glu GlyPro Ala Glu Gly

Cys Asp Arg Arg Phe SerCys Asp Arg Arg Phe Ser

100100

Gln Ser Gly Asn Leu ThrGln Ser Gly Asn Leu Thr

105105

Glu His Leu Arg 110Glu His Leu Arg 110

Ile His Thr Gly His Lys 115Ile His Thr Gly His Lys 115

Pro Phe Gln Cys Arg IlePro Phe Gln Cys Arg Ile

120120

Cys Met Arg Ser 125Cys Met Arg Ser 125

Phe Ser Thr Ser Gly HisPhe Ser Thr Ser Gly His

130130

Leu Val Arg His Ile ArgLeu Val Arg His Ile Arg

135 140135 140

Thr His Thr GlyThr His Thr Gly

Glu Lys Pro Phe Ala CysGlu Lys Pro Phe Ala Cys

145 150145 150

Glu Phe Cys Gly Arg LysGlu Phe Cys Gly Arg Lys

155155

Phe Ala Gln AsnPhe Ala Gln Asn

160160

Ser Thr Leu Thr Glu HisSer Thr Leu Thr Glu His

165165

Ala Lys Ile His Leu LysAla Lys Ile His Leu Lys

170170

Gln Lys Glu Lys 175Gln Lys Glu Lys 175

Leu Glu Met Ala Asp HisLeu Glu Met Ala Asp His

180180

Leu Met Leu Ala Glu GlyLeu Met Leu Ala Glu Gly

185185

Tyr Arg Leu Val 190Tyr Arg Leu Val 190

Gln Arg Pro Pro Ser AlaGln Arg Pro Pro Ser Ala

195195

Ala Ala Ala His Gly Pro 200Ala Ala Ala His Gly Pro 200

His Ala Leu Arg 205His Ala Leu Arg 205

- 203 046157- 203 046157

Thr Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp SerThr Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser

210 215 220210 215 220

Gly Leu Arg ProGly Leu Arg Pro

Arg Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg GlnArg Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln

225 230 235225 230 235

Pro Gly Ala LeuPro Gly Ala Leu

240240

Ala Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe GlnAla Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln

245 250245 250

Pro Phe Pro AlaPro Phe Pro Ala

255255

Val Pro Pro Pro Ala Ala Gly Ile Ala His Leu GlnVal Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln

260 265260 265

Pro Val Ala ThrPro Val Ala Thr

270270

Pro Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn AlaPro Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala

275 280275 280

Pro Gly Gly Pro 285Pro Gly Gly Pro 285

Pro Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala ProPro Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro

290 295 300290 295 300

Pro Pro Pro AlaPro Pro Pro Ala

His Ala Leu Gly Gly Met Asp Ala Glu Leu Ile AspHis Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp

305 310 315305 310 315

Glu Glu Ala LeuGlu Glu Ala Leu

320320

Thr Ser Leu Glu Leu Glu Leu Gly Leu His Arg ValThr Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val

325 330325 330

Arg Glu Leu ProArg Glu Leu Pro

335335

Glu Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys PheGlu Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe

340 345340 345

Ser Asp Leu GlySer Asp Leu Gly

350350

Ser Ala Pro Pro Ala Gly Ser Val Ser CysSer Ala Pro Pro Ala Gly Ser Val Ser Cys

355 360 <210> 112 <211> 479 <212> Белок <213> Искусственная последовательность <220>355 360 <210> 112 <211> 479 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 112<223> Description of the artificial sequence polypeptide <400> 112

Met Arg Pro His Ala Cys Pro Ala Glu Gly Cys AspMet Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp

510510

Arg Ser Asp Asn Leu Val Arg His Leu Arg Ile His 2025Arg Ser Asp Asn Leu Val Arg His Leu Arg Ile His 2025

Pro Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser 3540Pro Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser 3540

Leu His Thr His Ile Arg Thr His Thr Gly Glu LysLeu His Thr His Ile Arg Thr His Thr Gly Glu Lys

СинтетическийSynthetic

Arg Arg Phe Ser 15Arg Arg Phe Ser 15

Thr Gly His Lys 30Thr Gly His Lys 30

Arg Glu Asp Asn 45Arg Glu Asp Asn 45

Pro Phe Ala CysPro Phe Ala Cys

- 204 046157- 204 046157

55 6055 60

Glu Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu Val Arg 65 70 75Glu Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Leu Val Arg 65 70 75

Ala Lys Ile His LeuAla Lys Ile His Leu

Lys Gln Lys Glu HisLys Gln Lys Glu His

Ala Cys Pro Ala GluAla Cys Pro Ala Glu

Cys Asp Arg Arg PheCys Asp Arg Arg Phe

100100

Ser Gln Ser Gly AsnSer Gln Ser Gly Asn

105105

Leu Thr Glu His LeuLeu Thr Glu His Leu

110110

Ile His Thr Gly His 115Ile His Thr Gly His 115

Lys Pro Phe Gln CysLys Pro Phe Gln Cys

120120

Arg Ile Cys Met Arg 125Arg Ile Cys Met Arg 125

Phe Ser Thr Ser GlyPhe Ser Thr Ser Gly

130130

His Leu Val Arg HisHis Leu Val Arg His

135135

Ile Arg Thr His Thr 140Ile Arg Thr His Thr 140

Glu Lys Pro Phe Ala 145Glu Lys Pro Phe Ala 145

Cys Glu Phe Cys Gly 150Cys Glu Phe Cys Gly 150

Arg Lys Phe Ala Gln 155Arg Lys Phe Ala Gln 155

Ser Thr Leu Thr GluSer Thr Leu Thr Glu

165165

His Ala Lys Ile HisHis Ala Lys Ile His

170170

Leu Lys Gln Lys GluLeu Lys Gln Lys Glu

175175

Lys Ala Glu Lys GlyLys Ala Glu Lys Gly

180180

Gly Ala Pro Ser AlaGly Ala Pro Ser Ala

185185

Ser Ser Ala Pro ProSer Ser Ala Pro Pro

190190

Ser Leu Ala Pro ValSer Leu Ala Pro Val

195195

Val Thr Thr Cys AlaVal Thr Thr Cys Ala

200200

Leu Glu Met Ser GlyLeu Glu Met Ser Gly

205205

Glu Met Ala Asp His 210Glu Met Ala Asp His 210

Met Met Ala Met AsnMet Met Ala Met Asn

215215

His Gly Arg Phe ProHis Gly Arg Phe Pro

220220

Gly Thr Asn Gly Leu 225Gly Thr Asn Gly Leu 225

His His His Pro Ala 230His His His Pro Ala 230

His Arg Met Gly Met 235His Arg Met Gly Met 235

Gln Phe Pro Ser ProGln Phe Pro Ser Pro

245245

His His His Gln GlnHis His His Gln Gln

250250

Gln Gln Pro Gln HisGln Gln Pro Gln His

255255

Phe Asn Ala Leu MetPhe Asn Ala Leu Met

260260

Gly Glu His Ile HisGly Glu His Ile His

265265

Tyr Gly Ala Gly AsnTyr Gly Ala Gly Asn

270270

Asn Ala Thr Ser GlyAsn Ala Thr Ser Gly

275275

Ile Arg His Ala Met 280Ile Arg His Ala Met 280

Gly Pro Gly Thr Val 285Gly Pro Gly Thr Val 285

Gly Gly His Pro ProGly Gly His Pro Pro

290290

Ser Ala Leu Ala ProSer Ala Leu Ala Pro

295295

Ala Ala Arg Phe AsnAla Ala Arg Phe Asn

300300

His 80His 80

GlyGly

ArgArg

SerSer

GlyGly

Asn 160Asn 160

LysLys

ValVal

LeuLeu

AspAsp

Gly 240Gly 240

AlaAla

MetMet

AsnAsn

AsnAsn

- 205 046157- 205 046157

Ser Gln Phe Met Gly Pro Pro Val Ala Ser Gln GlySer Gln Phe Met Gly Pro Pro Val Ala Ser Gln Gly

305 310 315305 310 315

Gly Ser Leu ProGly Ser Leu Pro

320320

Ala Ser Met Gln Leu Gln Lys Leu Asn Asn Gln TyrAla Ser Met Gln Leu Gln Lys Leu Asn Asn Gln Tyr

325 330325 330

Phe Asn His HisPhe Asn His His

335335

Pro Tyr Pro His Asn His Tyr Met Pro Asp Leu HisPro Tyr Pro His Asn His Tyr Met Pro Asp Leu His

340 345340 345

Pro Ala Ala GlyPro Ala Ala Gly

350350

His Gln Met Asn Gly Thr Asn Gln His Phe Arg AspHis Gln Met Asn Gly Thr Asn Gln His Phe Arg Asp

355 360355 360

Cys Asn Pro Lys 365Cys Asn Pro Lys 365

His Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser GlyHis Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser Gly

370 375 380370 375 380

Gly Ser Ser ThrGly Ser Ser Thr

Pro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly AlaPro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly Ala

385 390 395385 390 395

Gly Ser Ser AsnGly Ser Ser Asn

400400

Ser Gly Gly Gly Ser Gly Ser Gly Asn Met Pro AlaSer Gly Gly Gly Ser Gly Ser Gly Asn Met Pro Ala

405 410405 410

Ser Val Ala HisSer Val Ala His

415415

Val Pro Ala Ala Met Leu Pro Pro Asn Val Ile AspVal Pro Ala Ala Met Leu Pro Pro Asn Val Ile Asp

420 425420 425

Thr Asp Phe IleThr Asp Phe Ile

430430

Asp Glu Glu Val Leu Met Ser Leu Val Ile Glu MetAsp Glu Glu Val Leu Met Ser Leu Val Ile Glu Met

435 440435 440

Gly Leu Asp Arg 445Gly Leu Asp Arg 445

Ile Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln AsnIle Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln Asn

450 455 460450 455 460

Glu Phe Asp PheGlu Phe Asp Phe

Met Thr Asp Phe Val Cys Lys Gln Gln Pro Ser ArgMet Thr Asp Phe Val Cys Lys Gln Gln Pro Ser Arg

465 470 475465 470 475

Val Ser Cys <210> 113 <211> 476 <212> Белок <213>Val Ser Cys <210> 113 <211> 476 <212> Protein <213>

Искусственная последовательность <220>Artificial sequence <220>

<223> Описание искусственной последовательности<223> Description of the artificial sequence

Синтетический <400>Synthetic <400>

Met 1Met 1

Arg полипептидArg polypeptide

113113

SerSer

PhePhe

GlyGly

ProPro

LeuLeu

Glu 5Glu 5

MetMet

AlaAla

AspAsp

HisHis

Met 10Met 10

MetMet

AlaAla

Met Asn His Gly 15Met Asn His Gly 15

Asp 20Asp 20

GlyGly

ThrThr

AsnAsn

GlyGly

Leu 25Leu 25

HisHis

HisHis

HisHis

Pro Ala His Arg 30Pro Ala His Arg 30

MetMet

GlyGly

MetMet

GlyGly

GlnGln

PhePhe

ProPro

SerSer

ProPro

HisHis

HisHis

HisHis

Gln Gln Gln GlnGln Gln Gln Gln

- 206 046157- 206 046157

40 4540 45

ProPro

Ala 65Ala 65

GlyGly

ArgArg

GlyGly

PhePhe

Pro 145Pro 145

CysCys

GlyGly

GlyGly

SerSer

Thr 225Thr 225

GlyGly

GluGlu

ValVal

Gln His Ala Phe Asn 50Gln His Ala Phe Asn 50

Gly Asn Met Asn AlaGly Asn Met Asn Ala

Thr Val Asn Gly GlyThr Val Asn Gly Gly

Phe Asn Asn Ser GlnPhe Asn Asn Ser Gln

100100

Ser Leu Pro Ala SerSer Leu Pro Ala Ser

115115

Asn His His Pro Tyr 130Asn His His Pro Tyr 130

Ala Ala Gly His GlnAla Ala Gly His Gln

150150

Asn Pro Lys His SerAsn Pro Lys His Ser

165165

Ser Ser Thr Pro Gly 180Ser Ser Thr Pro Gly 180

Ser Ser Asn Ser GlySer Ser Asn Ser Gly

195195

Val Ala His Val Pro 210Val Ala His Val Pro 210

Asp Phe Ile Asp GluAsp Phe Ile Asp Glu

230230

Leu Asp Arg Ile LysLeu Asp Arg Ile Lys

245245

Phe Asp Phe Met Thr 260Phe Asp Phe Met Thr 260

Ser Cys Arg Pro HisSer Cys Arg Pro His

275275

Ala Leu Met Gly Glu 55Ala Leu Met Gly Glu 55

Thr Ser Gly Val Arg 75Thr Ser Gly Val Arg 75

His Pro Pro Ser AlaHis Pro Pro Ser Ala

Phe Met Gly Pro Pro 105Phe Met Gly Pro Pro 105

Met Gln Leu Gln LysMet Gln Leu Gln Lys

120120

Pro His Asn His Tyr 135Pro His Asn His Tyr 135

Met Asn Gly Thr AsnMet Asn Gly Thr Asn

155155

Gly Gly Ser Ser ThrGly Gly Ser Ser Thr

170170

Gly Ser Gly Ser Ser 185Gly Ser Gly Ser Ser 185

Gly Gly Ser Gly SerGly Gly Ser Gly Ser

200200

Ala Ala Met Leu Pro 215Ala Ala Met Leu Pro 215

Glu Val Leu Met SerGlu Val Leu Met Ser

235235

Glu Leu Pro Glu LeuGlu Leu Pro Glu Leu

250250

Asp Phe Val Cys Lys 265Asp Phe Val Cys Lys 265

Ala Cys Pro Ala GluAla Cys Pro Ala Glu

280280

His Ile His Tyr Gly 60His Ile His Tyr Gly 60

His Ala Met Gly ProHis Ala Met Gly Pro

Leu Ala Pro Ala AlaLeu Ala Pro Ala Ala

Val Ala Ser Gln GlyVal Ala Ser Gln Gly

110110

Leu Asn Asn Gln TyrLeu Asn Asn Gln Tyr

125125

Met Pro Asp Leu His 140Met Pro Asp Leu His 140

Gln His Phe Arg AspGln His Phe Arg Asp

160160

Pro Gly Gly Ser GlyPro Gly Gly Ser Gly

175175

Ser Gly Gly Gly AlaSer Gly Gly Gly Ala

190190

Gly Asn Met Pro AlaGly Asn Met Pro Ala

205205

Pro Asn Val Ile Asp 220Pro Asn Val Ile Asp 220

Leu Val Ile Glu MetLeu Val Ile Glu Met

240240

Trp Leu Gly Gln AsnTrp Leu Gly Gln Asn

255255

Gln Gln Pro Ser Arg 270Gln Gln Pro Ser Arg 270

Gly Cys Asp Arg ArgGly Cys Asp Arg Arg

285285

- 207 046157- 207 046157

Phe Ser ArgPhe Ser Arg

290290

Ser Asp AsnSer Asp Asn

Leu Val Arg 295Leu Val Arg 295

His Leu ArgHis Leu Arg

300300

Ile His Thr GlyIle His Thr Gly

His Lys Pro 305His Lys Pro 305

Phe Gln CysPhe Gln Cys

310310

Arg Ile CysArg Ile Cys

Met Arg SerMet Arg Ser

315315

Phe Ser Arg GluPhe Ser Arg Glu

320320

Asp Asn LeuAsp Asn Leu

His Thr HisHis Thr His

325325

Ile Arg ThrIle Arg Thr

His Thr Gly 330His Thr Gly 330

Glu Lys Pro PheGlu Lys Pro Phe

335335

Ala Cys GluAla Cys Glu

Phe Cys Gly 340Phe Cys Gly 340

Arg Lys PheArg Lys Phe

345345

Ala Arg SerAla Arg Ser

Asp Glu Leu ValAsp Glu Leu Val

350350

Arg His AlaArg His Ala

355355

Lys Ile HisLys Ile His

Leu Lys GlnLeu Lys Gln

360360

Lys Glu HisLys Glu His

Ala Cys Pro Ala 365Ala Cys Pro Ala 365

Glu Gly CysGlu Gly Cys

370370

Asp Arg ArgAsp Arg Arg

Phe Ser Gln 375Phe Ser Gln 375

Ser Gly AsnSer Gly Asn

380380

Leu Thr Glu HisLeu Thr Glu His

Leu Arg Ile 385Leu Arg Ile 385

His Thr GlyHis Thr Gly

390390

His Lys ProHis Lys Pro

Phe Gln CysPhe Gln Cys

395395

Arg Ile Cys MetArg Ile Cys Met

400400

Arg Ser PheArg Ser Phe

Ser Thr SerSer Thr Ser

405405

Gly His LeuGly His Leu

Val Arg His 410Val Arg His 410

Ile Arg Thr His 415Ile Arg Thr His 415

Thr Gly GluThr Gly Glu

Lys Pro Phe 420Lys Pro Phe 420

Ala Cys GluAla Cys Glu

425425

Phe Cys GlyPhe Cys Gly

Arg Lys Phe AlaArg Lys Phe Ala

430430

Gln Asn SerGln Asn Ser

435435

Thr Leu ThrThr Leu Thr

Glu His AlaGlu His Ala

440440

Lys Ile HisLys Ile His

Leu Lys Gln Lys 445Leu Lys Gln Lys 445

Glu Lys LysGlu Lys Lys

450450

Ala Glu LysAla Glu Lys

Gly Gly Ala 455Gly Gly Ala 455

Pro Ser AlaPro Ser Ala

460460

Ser Ser Ala ProSer Ser Ala Pro

Pro Val Ser 465Pro Val Ser 465

Leu Ala ProLeu Ala Pro

470470

Val Val ThrVal Val Thr

Thr Cys AlaThr Cys Ala

475 <210> 114 <211> 559 <212> Белок <213> Искусственная последовательность <220>475 <210> 114 <211> 559 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид<223> Description of the artificial polypeptide sequence

Синтетический <400> 114Synthetic <400> 114

Met Thr Gly Lys Leu Ala Glu Lys Leu Pro Val Thr 1 5 10Met Thr Gly Lys Leu Ala Glu Lys Leu Pro Val Thr 1 5 10

Met Ser Ser LeuMet Ser Ser Leu

Leu Asn Gln Leu Pro Asp Asn Leu Tyr Pro Glu GluLeu Asn Gln Leu Pro Asp Asn Leu Tyr Pro Glu Glu

Ile Pro Ser AlaIle Pro Ser Ala

- 208 046157- 208 046157

Leu Asn Leu Phe SerLeu Asn Leu Phe Ser

Gly Ser Ser Asp Ser 40Gly Ser Ser Asp Ser 40

Val Val His Tyr Asn 45Val Val His Tyr Asn 45

Met Ala Thr Glu AsnMet Ala Thr Glu Asn

Val Met Asp Ile Gly 55Val Met Asp Ile Gly 55

Leu Thr Asn Glu Lys 60Leu Thr Asn Glu Lys 60

Asn Pro Glu Leu Ser 65Asn Pro Glu Leu Ser 65

Tyr Ser Gly Ser Phe 70Tyr Ser Gly Ser Phe 70

Gln Pro Ala Pro Gly 75Gln Pro Ala Pro Gly 75

Lys Thr Val Thr TyrLys Thr Val Thr Tyr

Leu Gly Lys Phe AlaLeu Gly Lys Phe Ala

Phe Asp Ser Pro SerPhe Asp Ser Pro Ser

Trp Cys Gln Asp AsnTrp Cys Gln Asp Asn

100100

Ile Ile Ser Leu MetIle Ile Ser Leu Met

105105

Ser Ala Gly Ile LeuSer Ala Gly Ile Leu

110110

Val Pro Pro Ala SerVal Pro Pro Ala Ser

115115

Gly Ala Leu Ser Thr 120Gly Ala Leu Ser Thr 120

Gln Thr Ser Thr AlaGln Thr Ser Thr Ala

125125

Met Val Gln Pro ProMet Val Gln Pro

130130

Gln Gly Asp Val GluGln Gly Asp Val Glu

135135

Ala Met Tyr Pro Ala 140Ala Met Tyr Pro Ala 140

Pro Pro Tyr Ser Asn 145Pro Pro Tyr Ser Asn 145

Cys Gly Asp Leu Tyr 150Cys Gly Asp Leu Tyr 150

Ser Glu Pro Val Ser 155Ser Glu Pro Val Ser 155

His Asp Pro Gln GlyHis Asp Pro Gln Gly

165165

Asn Pro Gly Leu AlaAsn Pro Gly Leu Ala

170170

Tyr Ser Pro Gln AspTyr Ser Pro Gln Asp

175175

Gln Ser Ala Lys ProGln Ser Ala Lys Pro

180180

Ala Leu Asp Ser AsnAla Leu Asp Ser Asn

185185

Leu Phe Pro Met IleLeu Phe Pro Met Ile

190190

Asp Tyr Asn Leu Tyr 195Asp Tyr Asn Leu Tyr 195

His His Pro Asn AspHis His Pro Asn Asp

200200

Met Gly Ser Ile Pro 205Met Gly Ser Ile Pro 205

His Lys Pro Phe GlnHis Lys Pro Phe Gln

210210

Gly Met Asp Pro Ile 215Gly Met Asp Pro Ile 215

Arg Val Asn Pro Pro 220Arg Val Asn Pro Pro 220

Ile Thr Pro Leu Glu 225Ile Thr Pro Leu Glu 225

Thr Ile Lys Ala Phe 230Thr Ile Lys Ala Phe 230

Lys Asp Lys Gln Ile 235Lys Asp Lys Gln Ile 235

Pro Gly Phe Gly SerPro Gly Phe Gly Ser

245245

Leu Pro Gln Pro ProLeu Pro Gln Pro Pro

250250

Leu Thr Leu Lys ProLeu Thr Leu Lys Pro

255255

Arg Pro Arg Lys TyrArg Pro Arg Lys Tyr

260260

Pro Asn Arg Pro SerPro Asn Arg Pro Ser

265265

Lys Thr Pro Leu HisLys Thr Pro Leu His

270270

GlnGln

ProPro

Asn 80Asn 80

AsnAsn

GlyGly

SerSer

LeuLeu

Phe 160Phe 160

TyrTyr

ProPro

GluGlu

ProPro

His 240His 240

IleIle

GluGlu

- 209 046157- 209 046157

Arg Pro His Ala Cys 275Arg Pro His Ala Cys 275

Pro Ala Glu Gly Cys 280Pro Ala Glu Gly Cys 280

Asp Arg Arg Phe Ser 285Asp Arg Arg Phe Ser 285

Arg Asp Glu Leu AsnArg Asp Glu Leu Asn

290290

Val His Leu Arg IleVal His Leu Arg Ile

295295

His Thr Gly His Lys 300His Thr Gly His Lys 300

Phe Gln Cys Arg Ile 305Phe Gln Cys Arg Ile 305

Cys Met Arg Ser Phe 310Cys Met Arg Ser Phe 310

Ser Arg Ser Asp His 315Ser Arg Ser Asp His 315

Thr Asn His Ile ArgThr Asn His Ile Arg

325325

Thr His Thr Gly GluThr His Thr Gly Glu

330330

Lys Pro Phe Ala CysLys Pro Phe Ala Cys

335335

Phe Cys Gly Arg LysPhe Cys Gly Arg Lys

340340

Phe Ala Arg Ser AspPhe Ala Arg Ser Asp

345345

Asp Leu Val Arg HisAsp Leu Val Arg His

350350

Lys Ile His Leu Lys 355Lys Ile His Leu Lys 355

Gln Lys Glu His Ala 360Gln Lys Glu His Ala 360

Cys Pro Ala Glu GlyCys Pro Ala Glu Gly

365365

Asp Arg Arg Phe SerAsp Arg Arg Phe Ser

370370

Arg Ser Asp Asn LeuArg Ser Asp Asn Leu

375375

Val Arg His Leu ArgVal Arg His Leu Arg

380380

His Thr Gly His Lys 385His Thr Gly His Lys 385

Pro Phe Gln Cys Arg 390Pro Phe Gln Cys Arg 390

Ile Cys Met Arg Ser 395Ile Cys Met Arg Ser 395

Ser His Arg Thr ThrSer His Arg Thr Thr

405405

Leu Thr Asn His IleLeu Thr Asn His Ile

410410

Arg Thr His Thr GlyArg Thr His Thr Gly

415415

Lys Pro Phe Ala CysLys Pro Phe Ala Cys

420420

Glu Phe Cys Gly ArgGlu Phe Cys Gly Arg

425425

Lys Phe Ala Arg GluLys Phe Ala Arg Glu

430430

Asn Leu His Thr HisAsn Leu His Thr His

435435

Ala Lys Ile His Leu 440Ala Lys Ile His Leu 440

Lys Gln Lys Glu His 445Lys Gln Lys Glu His 445

Cys Pro Ala Glu GlyCys Pro Ala Glu Gly

450450

Cys Asp Arg Arg PheCys Asp Arg Arg Phe

455455

Ser Thr Ser His SerSer Thr Ser His Ser

460460

Thr Glu His Leu Arg 465Thr Glu His Leu Arg 465

Ile His Thr Gly His 470Ile His Thr Gly His 470

Lys Pro Phe Gln Cys 475Lys Pro Phe Gln Cys 475

Ile Cys Met Arg SerIle Cys Met Arg Ser

485485

Phe Ser Gln Ser SerPhe Ser Gln Ser Ser

490490

Ser Leu Val Arg HisSer Leu Val Arg His

495495

Arg Thr His Thr GlyArg Thr His Thr Gly

500500

Glu Lys Pro Phe AlaGlu Lys Pro Phe Ala

505505

Cys Glu Phe Cys GlyCys Glu Phe Cys Gly

510510

Lys Phe Ala Arg GluLys Phe Ala Arg Glu

515515

Asp Asn Leu His Thr 520Asp Asn Leu His Thr 520

His Ala Lys Ile His 525His Ala Lys Ile His 525

ArgArg

ProPro

Leu 320Leu 320

GluGlu

AlaAla

CysCys

IleIle

Phe 400Phe 400

GluGlu

AspAsp

AlaAla

LeuLeu

Arg 480Arg 480

IleIle

ArgArg

LeuLeu

- 210 046157- 210 046157

Lys Gln Lys Glu Lys Lys Ala GluLys Gln Lys Glu Lys Lys Ala Glu

Lys Gly Gly AlaLys Gly Gly Ala

Pro Ser Ala SerPro Ser Ala Ser

530530

535535

540540

Ser Ala Pro Pro ValSer Ala Pro Pro Val

Ser Leu Ala Pro Val Val ThrSer Leu Ala Pro Val Val Thr

Thr Cys AlaThr Cys Ala

545 550 555 <210> 115 <211> 631 <212> Белок <213> Искусственная последовательность <220>545 550 555 <210> 115 <211> 631 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 115<223> Description of the artificial sequence polypeptide <400> 115

Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met SerMet Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser

5 105 10

СинтетическийSynthetic

Pro Leu Gln IlePro Leu Gln Ile

Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr 20 25Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr 20 25

Met Asp Asn Tyr 30Met Asp Asn Tyr 30

Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly 35 40Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly 35 40

Ala Pro Gln Phe 45Ala Pro Gln Phe 45

Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly SerLeu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser

55 6055 60

Asn Ser Ser SerAsn Ser Ser Ser

Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly 65 70 75Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly 65 70 75

Ser Asn Ser SerSer Asn Ser Ser

Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp ThrSer Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr

9090

Gly Glu Gln ProGly Glu Gln Pro

Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp IleTyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile

100 105100 105

Ser Leu Asn AsnSer Leu Asn Asn

110110

Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser GlnGlu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln

115 120115 120

Thr Thr Arg Leu 125Thr Thr Arg Leu 125

Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu GluPro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu

130 135 140130 135 140

Pro Ala Pro AsnPro Ala Pro Asn

Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe SerSer Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser

145 150 155145 150 155

Leu Val Ser GlyLeu Val Ser Gly

160160

Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser SerLeu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser

165 170165 170

Ser Ala Pro SerSer Ala Pro Ser

175175

- 211 046157- 211 046157

Pro Ala Ala Ser Ser Ala Ser AlaPro Ala Ala Ser Ser Ala Ser Ala

Ser Gln Ser Pro Pro Leu SerSer Gln Ser Pro Pro Leu Ser

180 185 190180 185 190

Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala ProAla Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro

195 200 205195 200 205

Phe ProPhe Pro

210210

Thr Pro AsnThr Pro Asn

Thr Asp Ile Phe Pro Glu Pro Gln Ser GlnThr Asp Ile Phe Pro Glu Pro Gln Ser Gln

215 220215 220

Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro AlaPhe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala

225 230 235225 230 235

Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp TyrPro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr

245 250 255245 250 255

Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp GlnPhe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln

260 265 270260 265 270

Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu ThrPro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr

275 280 285275 280 285

Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln AspLeu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp

290 295 300290 295 300

Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro SerLys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser

305 310 315305 310 315

Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His GluMet Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu

325 330 335325 330 335

Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser ArgPro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg

340 345 350340 345 350

Asp Asn Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys ProAsp Asn Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys Pro

355 360 365355 360 365

Gln Cys Arg Ile Cys Met Arg Asn Phe Ser His Arg Thr Thr LeuGln Cys Arg Ile Cys Met Arg Asn Phe Ser His Arg Thr Thr Leu

370 375 380370 375 380

Asn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys AspAsn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp

385 390 395385 390 395

Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His Thr His ThrCys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His Thr His Thr

405 410 415405 410 415

Ile His Leu Arg Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val GluIle His Leu Arg Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu

420 425 430420 425 430

CysCys

ThrThr

AlaAla

Tyr 240Tyr 240

LeuLeu

LysLys

ProPro

LeuLeu

Arg 320Arg 320

ArgArg

SerSer

PhePhe

ThrThr

Ile 400Ile 400

LysLys

SerSer

- 212 046157- 212 046157

Cys AspCys Asp

Ile HisIle His

450450

Phe Ser 465Phe Ser 465

Glu LysGlu Lys

Arg Arg 435Arg Arg 435

Thr GlyThr Gly

Gln SerGln Ser

Pro PhePro Phe

Phe SerPhe Ser

Gln LysGln Lys

Ser SerSer Ser

470470

Ala Cys 485Ala Cys 485

Asp AsnAsp Asn

Leu HisLeu His

500500

Thr HisThr His

Thr Ser 440Thr Ser 440

Pro Phe 455Pro Phe 455

Leu ValLeu Val

Asp IleAsp Ile

Thr LysThr Lys

His SerHis Ser

Gln CysGln Cys

Arg HisArg His

Cys GlyCys Gly

490490

Ile HisIle His

505505

Leu ThrLeu Thr

Arg IleArg Ile

460460

Ile Arg 475Ile Arg 475

Arg LysArg Lys

Leu ArgLeu Arg

Lys AlaLys Ala

Asp Lys 515Asp Lys 515

Ser ValSer Val

Val AlaVal Ala

520520

Ser SerSer Ser

Ala ThrAla Thr

Glu His Ile Arg 445Glu His Ile Arg 445

Cys Met Arg AsnCys Met Arg Asn

Thr His Thr GlyThr His Thr Gly

480480

Phe Ala Arg GluPhe Ala Arg Glu

495495

Gln Lys Asp Lys 510Gln Lys Asp Lys 510

Ser Ser Leu Ser 525Ser Ser Leu Ser 525

Ser TyrSer Tyr

530530

Pro SerPro Ser

Pro ValPro Val

Ala Thr 535Ala Thr 535

Ser TyrSer Tyr

Pro SerPro Ser

540540

Pro Val Thr ThrPro Val Thr Thr

Ser Tyr 545Ser Tyr 545

Pro SerPro Ser

Pro AlaPro Ala

550550

Thr ThrThr Thr

Ser TyrSer Tyr

Pro Ser 555Pro Ser 555

Pro Val Pro ThrPro Val Pro Thr

560560

Ser PheSer Phe

Ser SerSer Ser

Pro Gly 565Pro Gly 565

Ser SerSer Ser

Thr TyrThr Tyr

570570

Pro SerPro Ser

Pro Val His SerPro Val His Ser

575575

Gly PheGly Phe

Pro SerPro Ser

580580

Pro SerPro Ser

Val AlaVal Ala

Thr ThrThr Thr

585585

Tyr SerTyr Ser

Ser Val Pro ProSer Val Pro Pro

590590

Ala PheAla Phe

Pro Ala 595Pro Ala 595

Gln ValGln Val

Ser SerSer Ser

600600

Phe ProPhe Pro

Ser SerSer Ser

Ala Val Thr Asn 605Ala Val Thr Asn 605

Ser PheSer Phe

610610

Ser AlaSer Ala

Ser ThrSer Thr

Gly Leu 615Gly Leu 615

Ser AspSer Asp

Met ThrMet Thr

620620

Ala Thr Phe SerAla Thr Phe Ser

Pro Arg 625Pro Arg 625

Thr IleThr Ile

Glu IleGlu Ile

630630

Cys <210> 116 <211> 719 <212> Белок <213> Искусственная последовательность <220>Cys <210> 116 <211> 719 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 116<223> Description of the artificial sequence polypeptide <400> 116

СинтетическийSynthetic

- 213 046157- 213 046157

Met Ala 1Met Ala 1

Ala AlaAla Ala

Lys Ala 5Lys Ala 5

Glu MetGluMet

Gln LeuGln Leu

Met SerMet Ser

Pro LeuProLeu

Ser AspSer Asp

Pro PhePro Phe

Gly SerGly Ser

Phe ProPhe Pro

His Ser 25His Ser 25

Pro ThrPro Thr

Met AspMet Asp

Pro LysPro Lys

Leu Glu 35Leu Glu 35

Glu MetGluMet

Met LeuMet Leu

Leu SerLeu Ser

Asn GlyAsn Gly

Ala Pro 45Ala Pro 45

Gln Ile 15Gln Ile 15

Asn TyrAsn Tyr

Gln PheGln Phe

Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser 50 5560Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser 50 5560

Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser Ser 65 70 7580Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser Ser 65 70 7580

Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln Pro 85 9095Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln Pro 85 9095

Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn AsnTyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn Asn

100 105110100 105110

Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg LeuGlu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg Leu

115 120125115 120125

Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro AsnPro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro Asn

130 135140130 135140

Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser GlySer Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser Gly

145 150 155160145 150 155160

Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro SerLeu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro Ser

165 170175165 170175

Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser CysPro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser Cys

180 185190180 185190

Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro ThrAla Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro Thr

195 200205195 200205

Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln AlaPhe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln Ala

210 215220210 215220

Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala TyrPhe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala Tyr

225 230 235240225 230 235240

Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr LeuPro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr Leu

245 250255245 250255

- 214 046157- 214 046157

PhePhe

ProPro

LeuLeu

Lys 305Lys 305

MetMet

ProPro

AspAsp

GlnGln

Asn 385Asn 385

CysCys

IleIle

CysCys

IleIle

Phe 465Phe 465

GluGlu

AspAsp

Pro Gln Gln Gln Gly 260Pro Gln Gln Gln Gly 260

Phe Gln Gly Leu GluPhe Gln Gly Leu Glu

275275

Ser Thr Ile Lys Ala 290Ser Thr Ile Lys Ala 290

Ala Leu Asn Thr SerAla Leu Asn Thr Ser

310310

Arg Lys Tyr Pro AsnArg Lys Tyr Pro Asn

325325

Tyr Ala Cys Pro ValTyr Ala Cys Pro Val

340340

Glu Leu Asn Val HisGlu Leu Asn Val His

355355

Cys Arg Ile Cys Met 370Cys Arg Ile Cys Met 370

His Ile Arg Thr HisHis Ile Arg Thr His

390390

Gly Arg Lys Phe AlaGly Arg Lys Phe Ala

405405

His Leu Arg Gln Lys 420His Leu Arg Gln Lys 420

Asp Arg Arg Phe SerAsp Arg Arg Phe Ser

435435

His Thr Gly Gln Lys 450His Thr Gly Gln Lys 450

Ser His Arg Thr ThrSer His Arg Thr Thr

470470

Lys Pro Phe Ala CysLys Pro Phe Ala Cys

485485

Asn Leu His Thr HisAsn Leu His Thr His

500500

Asp Leu Gly Leu Gly 265Asp Leu Gly Leu Gly 265

Ser Arg Thr Gln GlnSer Arg Thr Gln Gln

280280

Phe Ala Thr Gln Ser 295Phe Ala Thr Gln Ser 295

Tyr Gln Ser Gln LeuTyr Gln Ser Gln Leu

315315

Arg Pro Ser Lys ThrArg Pro Ser Lys Thr

330330

Glu Ser Cys Asp Arg 345Glu Ser Cys Asp Arg 345

Ile Arg Ile His ThrIle Arg Ile His Thr

360360

Arg Asn Phe Ser Arg 375Arg Asn Phe Ser Arg 375

Thr Gly Glu Lys ProThr Gly Glu Lys Pro

395395

Arg Ser Asp Asp LeuArg Ser Asp Asp Leu

410410

Asp Arg Pro Tyr Ala 425Asp Arg Pro Tyr Ala 425

Arg Ser Asp Asn LeuArg Ser Asp Asn Leu

440440

Pro Phe Gln Cys Arg 455Pro Phe Gln Cys Arg 455

Leu Thr Asn His IleLeu Thr Asn His Ile

475475

Asp Ile Cys Gly ArgAsp Ile Cys Gly Arg

490490

Thr Lys Ile His Leu 505Thr Lys Ile His Leu 505

Thr Pro Asp Gln LysThr Pro Asp Gln Lys

270270

Pro Ser Leu Thr ProPro Ser Leu Thr Pro

285285

Gly Ser Gln Asp Leu 300Gly Ser Gln Asp Leu 300

Ile Lys Pro Ser ArgIle Lys Pro Ser Arg

320320

Pro Pro His Glu ArgPro Pro His Glu Arg

335335

Arg Phe Ser Arg ArgArg Phe Ser Arg Arg

350350

Gly Gln Lys Pro PheGly Gln Lys Pro Phe

365365

Ser Asp His Leu Thr 380Ser Asp His Leu Thr 380

Phe Ala Cys Asp IlePhe Ala Cys Asp Ile

400400

Val Arg His Thr Lys 415Val Arg His Thr Lys 415

Cys Pro Val Glu SerCys Pro Val Glu Ser

430430

Val Arg His Ile Arg 445Val Arg His Ile Arg 445

Ile Cys Met Arg Asn 460Ile Cys Met Arg Asn 460

Arg Thr His Thr GlyArg Thr His Thr Gly

480480

Lys Phe Ala Arg GluLys Phe Ala Arg Glu

495495

Arg Gln Lys Asp Arg 510Arg Gln Lys Asp Arg 510

- 215 046157- 215 046157

Pro TyrPro Tyr

His SerHis Ser

530530

Gln Cys 545Gln Cys 545

Arg HisArg His

Ala Cys 515Ala Cys 515

Leu ThrLeu Thr

Arg IleArg Ile

Ile ArgIle Arg

Pro ValPro Val

Glu HisGlu His

Cys MetCys Met

550550

Thr His 565Thr His 565

Cys GlyCys Gly

Arg LysArg Lys

580580

Phe AlaPhe Ala

Ile HisIle His

Leu Arg 595Leu Arg 595

Gln LysGln Lys

Ser SerSer Ser

610610

Ala ThrAla Thr

Ser SerSer Ser

Ser Tyr 625Ser Tyr 625

Pro SerPro Ser

Pro ValPro Val

630630

Ser TyrSer Tyr

Pro SerPro Ser

Pro Val 645Pro Val 645

Thr TyrThr Tyr

Pro SerPro Ser

660660

Pro ValPro Val

Thr ThrThr Thr

Tyr Ser 675Tyr Ser 675

Ser ValSer Val

Glu SerGlu Ser

520520

Ile Arg 535Ile Arg 535

Arg AsnArg Asn

Thr GlyThr Gly

Arg GluArg Glu

Asp LysAsp Lys

600600

Leu Ser 615Leu Ser 615

Thr ThrThr Thr

Pro ThrPro Thr

His SerHis Ser

Pro ProPro Pro

680680

Cys AspCys Asp

Ile HisIle His

Phe SerPhe Ser

Glu LysGlu Lys

570570

Asp Asn 585Asp Asn 585

Lys AlaLys Ala

Ser TyrSer Tyr

Ser TyrSer Tyr

Ser PheSer Phe

650650

Gly Phe 665Gly Phe 665

Ala PheAla Phe

Arg ArgArg Arg

Thr GlyThr Gly

540540

Gln Ser 555Gln Ser 555

Pro PhePro Phe

Leu HisLeu His

Asp LysAsp Lys

Pro SerPro Ser

620620

Pro Ser 635Pro Ser 635

Ser SerSer Ser

Pro SerPro Ser

Pro AlaPro Ala

Phe Ser Thr Ser 525Phe Ser Thr Ser 525

Gln Lys Pro PheGln Lys Pro Phe

Ser Ser Leu ValSer Ser Leu Val

560560

Ala Cys Asp IleAla Cys Asp Ile

575575

Thr His Thr LysThr His Thr Lys

590590

Ser Val Val Ala 605Ser Val Val Ala 605

Pro Val Ala ThrPro Val Ala Thr

Pro Ala Thr ThrPro Ala Thr Thr

640640

Pro Gly Ser SerPro Gly Ser Ser

655655

Pro Ser Val AlaPro Ser Val Ala

670670

Gln Val Ser Ser 685Gln Val Ser Ser 685

Phe ProPhe Pro

690690

Ser SerSer Ser

Ala ValAla Val

Thr Asn 695Thr Asn 695

Ser PheSer Phe

Ser AlaSer Ala

700700

Ser Thr Gly LeuSer Thr Gly Leu

Ser Asp 705Ser Asp 705

Met ThrMet Thr

Ala ThrAla Thr

710710

Phe SerPhe Ser

Pro ArgPro Arg

Thr Ile 715Thr Ile 715

Glu Ile Cys <210> 117 <211> 627 <212> Белок <213> Искусственная последовательность <220>Glu Ile Cys <210> 117 <211> 627 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид<223> Description of the artificial polypeptide sequence

СинтетическийSynthetic

- 216 046157 <400> 117 Met Ala Ala 1- 216 046157 <400> 117 Met Ala Ala 1

Ala Lys Ala Glu Met Gln Leu Met Ser Pro Leu GlnAla Lys Ala Glu Met Gln Leu Met Ser Pro Leu Gln

10 1510 15

Ser Asp ProSer Asp Pro

Phe Gly Ser Phe Pro His Ser Pro Thr Met Asp AsnPhe Gly Ser Phe Pro His Ser Pro Thr Met Asp Asn

25 3025 30

Pro Lys Leu 35Pro Lys Leu 35

Glu Glu Met Met Leu Leu Ser Asn Gly Ala Pro GlnGlu Glu Met Met Leu Leu Ser Asn Gly Ala Pro Gln

4545

Leu Gly Ala 50Leu Gly Ala 50

Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser 55 60Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser 55 60

Ser Ser Ser 65Ser Ser Ser 65

Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser 70 75Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser 70 75

Ser Ser SerSer Ser Ser

Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu GlnSer Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln

90 9590 95

Tyr Glu HisTyr Glu His

Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu AsnLeu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn

100 105 110100 105 110

Glu Lys ValGlu Lys Val

115115

Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr ArgLeu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg

120 125120 125

Pro Pro IlePro Pro Ile

130130

Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala ProThr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro

135 140135 140

Ser Gly Asn 145Ser Gly Asn 145

Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val SerThr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser

150 155150 155

Leu Val SerLeu Val Ser

Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala ProMet Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro

165 170 175165 170 175

Pro Ala AlaPro Ala Ala

Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu SerSer Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser

180 185 190180 185 190

Ala Val ProAla Val Pro

195195

Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala ProSer Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro

200 205200 205

Phe Pro ThrPhe Pro Thr

210210

Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser GlnPro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln

215 220215 220

Phe Pro Gly 225Phe Pro Gly 225

Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro AlaSer Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala

230 235230 235

Pro Ala AlaPro Ala Ala

Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp TyrLys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr

245 250 255245 250 255

IleIle

TyrTyr

PhePhe

SerSer

Ser 80Ser 80

ProPro

AsnAsn

LeuLeu

AsnAsn

Gly 160Gly 160

SerSer

CysCys

ThrThr

AlaAla

Tyr 240Tyr 240

LeuLeu

- 217 046157- 217 046157

Phe Pro GlnPhe Pro Gln

Gln Gln Gly 260Gln Gln Gly 260

Asp Leu GlyAsp Leu Gly

265265

Leu Gly ThrLeu Gly Thr

Pro Asp GlnPro Asp Gln

270270

Pro Phe GlnPro Phe Gln

275275

Gly Leu GluGly Leu Glu

Ser Arg ThrSer Arg Thr

280280

Gln Gln ProGln Gln Pro

Ser Leu Thr 285Ser Leu Thr 285

Leu Ser ThrLeu Ser Thr

290290

Ile Lys AlaIle Lys Ala

Phe Ala Thr 295Phe Ala Thr 295

Gln Ser GlyGln Ser Gly

300300

Ser Gln AspSer Gln Asp

Lys Ala Leu 305Lys Ala Leu 305

Asn Thr SerAsn Thr Ser

310310

Tyr Gln SerTyr Gln Ser

Gln Leu IleGln Leu Ile

315315

Lys Pro SerLys Pro Ser

Met Arg LysMet Arg Lys

Tyr Pro AsnTyr Pro Asn

325325

Arg Pro SerArg Pro Ser

Lys Thr Pro 330Lys Thr Pro 330

Pro His GluPro His Glu

335335

Pro Tyr AlaPro Tyr Ala

Cys Pro Val 340Cys Pro Val 340

Glu Ser CysGlu Ser Cys

345345

Asp Arg ArgAsp Arg Arg

Phe Ser ArgPhe Ser Arg

350350

Asp Asn LeuAsp Asn Leu

355355

Val Arg HisVal Arg His

Ile Arg IleIle Arg Ile

360360

His Thr GlyHis Thr Gly

Gln Lys Pro 365Gln Lys Pro 365

Gln Cys ArgGln Cys Arg

370370

Ile Cys MetIle Cys Met

Arg Asn Phe 375Arg Asn Phe 375

Ser His ArgSer His Arg

380380

Thr Thr LeuThr Thr Leu

Asn His Ile 385Asn His Ile 385

Arg Thr HisArg Thr His

390390

Thr Gly GluThr Gly Glu

Lys Pro PheLys Pro Phe

395395

Ala Cys AspAla Cys Asp

Cys Gly ArgCys Gly Arg

Lys Phe AlaLys Phe Ala

405405

Arg Glu AspArg Glu Asp

Asn Leu His 410Asn Leu His 410

Thr His IleThr His Ile

415415

Thr His ThrThr His Thr

Gly Glu Lys 420Gly Glu Lys 420

Pro Phe AlaPro Phe Ala

425425

Cys Asp IleCys Asp Ile

Cys Gly ArgCys Gly Arg

430430

Phe Ser ThrPhe Ser Thr

435435

Ser His SerSer His Ser

Leu Thr GluLeu Thr Glu

440440

His Ile ArgHis Ile Arg

Ile His Thr 445Ile His Thr 445

Gln Lys ProGln Lys Pro

450450

Phe Gln CysPhe Gln Cys

Arg Ile Cys 455Arg Ile Cys 455

Met Arg AsnMet Arg Asn

460460

Phe Ser GlnPhe Ser Gln

Ser Ser Leu 465Ser Ser Leu 465

Val Arg HisVal Arg His

470470

Ile Arg ThrIle Arg Thr

His Thr Gly 475His Thr Gly 475

Glu Lys ProGlu Lys Pro

Ala Cys AspAla Cys Asp

Ile Cys GlyIle Cys Gly

485485

Arg Lys PheArg Lys Phe

Ala Arg Glu 490Ala Arg Glu 490

Asp Asn LeuAsp Asn Leu

495495

Thr His ThrThr His Thr

Lys Ile HisLys Ile His

Leu Arg GlnLeu Arg Gln

Lys Asp LysLys Asp Lys

Lys Ala AspLys Ala Asp

LysLys

ProPro

LeuLeu

Arg 320Arg 320

ArgArg

SerSer

PhePhe

ThrThr

Ile 400Ile 400

ArgArg

LysLys

GlyGly

SerSer

Phe 480Phe 480

HisHis

LysLys

- 218 046157- 218 046157

Ser ValSer Val

Pro ValPro Val

530530

Pro Ala 545Pro Ala 545

Pro GlyPro Gly

Pro SerPro Ser

Gln ValGln Val

Ser ThrSer Thr

610610

500500

Val Ala 515Val Ala 515

Ala ThrAla Thr

Thr ThrThr Thr

Ser SerSer Ser

Val AlaVal Ala

580580

Ser Ser 595Ser Ser 595

Gly LeuGly Leu

Ser SerSer Ser

Ser TyrSer Tyr

Ser TyrSer Tyr

550550

Thr Tyr 565Thr Tyr 565

Thr ThrThr Thr

Phe ProPhe Pro

Ser AspSer Asp

Ala ThrAla Thr

520520

Pro Ser 535Pro Ser 535

Pro SerPro Ser

Pro SerPro Ser

Tyr SerTyr Ser

Ser SerSer Ser

600600

Met Thr 615Met Thr 615

505505

Ser SerSer Ser

Pro ValPro Val

Pro ValPro Val

Pro ValPro Val

570570

Ser ValSer Val

585585

Ala ValAla Val

Ala ThrAla Thr

510510

Leu SerLeu Ser

Thr ThrThr Thr

540540

Pro Thr 555Pro Thr 555

His SerHis Ser

Pro ProPro Pro

Thr AsnThr Asn

Phe SerPhe Ser

620620

Ser Tyr Pro Ser 525Ser Tyr Pro Ser 525

Ser Tyr Pro SerSer Tyr Pro Ser

Ser Phe Ser SerSer Phe Ser Ser

560560

Gly Phe Pro SerGly Phe Pro Ser

575575

Ala Phe Pro AlaAla Phe Pro Ala

590590

Ser Phe Ser Ala 605Ser Phe Ser Ala 605

Pro Arg Thr IlePro Arg Thr Ile

Glu Ile Cys 625 <210> 118 <211> 631 <212> Белок <213> Искусственная последовательность <220>Glu Ile Cys 625 <210> 118 <211> 631 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности<223> Description of the artificial sequence

Синтетический полипептид <400> 118Synthetic polypeptide <400> 118

Met Ala Ala Ala 1Met Ala Ala Ala 1

Lys Ala Glu Met 5Lys Ala Glu Met 5

Gln Leu Met SerGln Leu Met Ser

Pro Leu Gln IlePro Leu Gln Ile

Ser Asp Pro PheSer Asp Pro Phe

Gly Ser Phe ProGly Ser Phe Pro

His Ser Pro Thr 25His Ser Pro Thr 25

Met Asp Asn Tyr 30Met Asp Asn Tyr 30

Pro Lys Leu Glu 35Pro Lys Leu Glu 35

Glu Met Met LeuGlu Met Met Leu

Leu Ser Asn GlyLeu Ser Asn Gly

Ala Pro Gln Phe 45Ala Pro Gln Phe 45

Leu Gly Ala Ala 50Leu Gly Ala Ala 50

Gly Ala Pro Glu 55Gly Ala Pro Glu 55

Gly Ser Gly Ser 60Gly Ser Gly Ser 60

Asn Ser Ser SerAsn Ser Ser Ser

Ser Ser Ser Gly 65Ser Ser Ser Gly 65

Gly Gly Gly Gly 70Gly Gly Gly Gly 70

Gly Gly Gly Gly 75Gly Gly Gly Gly 75

Ser Asn Ser SerSer Asn Ser Ser

- 219 046157- 219 046157

Ser Ser Ser Ser Thr Phe Asn ProSer Ser Ser Ser Thr Phe Asn Pro

Gln Ala Asp Thr Gly Glu GlnGln Ala Asp Thr Gly Glu Gln

9595

Tyr Glu HisTyr Glu His

Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu AsnLeu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn

100 105 110100 105 110

Glu Lys ValGlu Lys Val

115115

Leu Val Glu ThrLeu Val Glu Thr

Ser Tyr Pro Ser Gln Thr Thr ArgSer Tyr Pro Ser Gln Thr Thr Arg

120 125120 125

Pro ProPro Pro

130130

Ile ThrIle Thr

Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala ProTyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro

135 140135 140

Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val SerSer Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser

145 150 155145 150 155

Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala ProLeu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro

165 170 175165 170 175

Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu SerPro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser

180 185 190180 185 190

Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala ProAla Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro

195 200 205195 200 205

Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser GlnPhe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln

210 215 220210 215 220

Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro AlaPhe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala

225 230 235225 230 235

Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp TyrPro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr

245 250 255245 250 255

Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp GlnPhe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln

260 265 270260 265 270

Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu ThrPro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr

275 280 285275 280 285

Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln AspLeu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp

290 295 300290 295 300

Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro SerLys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser

305 310 315305 310 315

ProPro

AsnAsn

LeuLeu

AsnAsn

Gly 160Gly 160

SerSer

CysCys

ThrThr

AlaAla

Tyr 240Tyr 240

LeuLeu

LysLys

ProPro

LeuLeu

Arg 320Arg 320

ArgArg

Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His GluMet Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu

- 220 046157- 220 046157

325325

330 335330 335

ProPro

AspAsp

GlnGln

Thr 385Thr 385

CysCys

IleIle

CysCys

IleIle

Phe 465Phe 465

GluGlu

SerSer

LysLys

SerSer

Ser 545Ser 545

SerSer

Tyr Ala Cys Pro Val Glu Ser 340Tyr Ala Cys Pro Val Glu Ser 340

Cys Asp Arg Arg Phe Ser ArgCys Asp Arg Arg Phe Ser Arg

345 350345 350

Asn Leu Val Arg His Ile ArgAsn Leu Val Arg His Ile Arg

355 360355 360

Cys Arg Ile Cys Met Arg AsnCys Arg Ile Cys Met Arg Asn

370 375370 375

His Ile Arg Thr His Thr GlyHis Ile Arg Thr His Thr Gly

390390

Gly Arg Lys Phe Ala Arg Ser 405Gly Arg Lys Phe Ala Arg Ser 405

His Leu Arg Gln Lys Asp Arg 420His Leu Arg Gln Lys Asp Arg 420

Asp Arg Arg Phe Ser Gln SerAsp Arg Arg Phe Ser Gln Ser

435 440435 440

His Thr Gly Gln Lys Pro PheHis Thr Gly Gln Lys Pro Phe

450 455450 455

Ser Thr Ser Gly His Leu Val 470Ser Thr Ser Gly His Leu Val 470

Lys Pro Phe Ala Cys Asp IleLys Pro Phe Ala Cys Asp Ile

485485

Thr Leu Thr Glu His Thr LysThr Leu Thr Glu His Thr Lys

500500

Ala Asp Lys Ser Val Val AlaAla Asp Lys Ser Val Val Ala

515 520515 520

Tyr Pro Ser Pro Val Ala ThrTyr Pro Ser Pro Val Ala Thr

530 535530 535

Tyr Pro Ser Pro Ala Thr ThrTyr Pro Ser Pro Ala Thr Thr

550550

Phe Ser Ser Pro Gly Ser Ser 565Phe Ser Ser Pro Gly Ser Ser 565

Ile His Thr Gly Gln Lys ProIle His Thr Gly Gln Lys Pro

365365

Phe Ser Arg Glu Asp Asn LeuPhe Ser Arg Glu Asp Asn Leu

380380

Glu Lys Pro Phe Ala Cys Asp 395Glu Lys Pro Phe Ala Cys Asp 395

Asp Glu Leu Val Arg His ThrAsp Glu Leu Val Arg His Thr

410 415410 415

Pro Tyr Ala Cys Pro Val GluPro Tyr Ala Cys Pro Val Glu

425 430425 430

Gly Asn Leu Thr Glu His Ile 445Gly Asn Leu Thr Glu His Ile 445

Gln Cys Arg Ile Cys Met Arg 460Gln Cys Arg Ile Cys Met Arg 460

Arg His Ile Arg Thr His Thr 475Arg His Ile Arg Thr His Thr 475

Cys Gly Arg Lys Phe Ala GlnCys Gly Arg Lys Phe Ala Gln

490 495490 495

Ile His Leu Arg Gln Lys AspIle His Leu Arg Gln Lys Asp

505 510505 510

Ser Ser Ala Thr Ser Ser LeuSer Ser Ala Thr Ser Ser Leu

525525

Ser Tyr Pro Ser Pro Val Thr 540Ser Tyr Pro Ser Pro Val Thr 540

Ser Tyr Pro Ser Pro Val Pro 555Ser Tyr Pro Ser Pro Val Pro 555

Thr Tyr Pro Ser Pro Val HisThr Tyr Pro Ser Pro Val His

570 575570 575

SerSer

PhePhe

HisHis

Ile 400Ile 400

LysLys

SerSer

ArgArg

AsnAsn

Gly 480Gly 480

AsnAsn

LysLys

SerSer

ThrThr

Thr 560Thr 560

SerSer

- 221 046157- 221 046157

Gly PheGly Phe

Pro SerPro Ser

580580

Pro SerPro Ser

Val AlaVal Ala

Ala PheAla Phe

Pro Ala 595Pro Ala 595

Gln ValGln Val

Ser SerSer Ser

600600

Ser PheSer Phe

610610

Ser AlaSer Ala

Ser ThrSer Thr

Gly Leu 615Gly Leu 615

Thr Thr 585Thr Thr 585

Phe ProPhe Pro

Ser AspSer Asp

Tyr SerTyr Ser

Ser SerSer Ser

Met ThrMet Thr

620620

Ser Val Pro ProSer Val Pro Pro

590590

Ala Val Thr Asn 605Ala Val Thr Asn 605

Ala Thr Phe SerAla Thr Phe Ser

Pro Arg Thr Ile Glu Ile CysPro Arg Thr Ile Glu Ile Cys

625 630 <210> 119 <211> 473 <212> Белок <213> Искусственная последовательность <220>625 630 <210> 119 <211> 473 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 119<223> Description of the artificial sequence polypeptide <400> 119

СинтетическийSynthetic

Met Thr Gly 1Met Thr Gly 1

Leu Asn GlnLeu Asn Gln

Leu Asn LeuLeu Asn Leu

Met Ala ThrMet Ala Thr

Asn Pro Glu 65Asn Pro Glu 65

Lys Thr ValLys Thr Val

Trp Cys GlnTrp Cys Gln

Val Pro ProVal Pro Pro

115115

Met Val GlnMet Val Gln

130130

Pro Pro TyrPro Pro Tyr

Lys Leu Ala 5Lys Leu Ala 5

Leu Pro Asp 20Leu Pro Asp 20

Phe Ser GlyPhe Ser Gly

Glu Asn ValGlu Asn Val

Leu Ser Tyr 70Leu Ser Tyr 70

Thr Tyr Leu 85Thr Tyr Leu 85

Asp Asn Ile 100Asp Asn Ile 100

Ala Ser GlyAla Ser Gly

Pro Pro GlnPro Pro Gln

Ser Asn CysSer Asn Cys

Glu Lys LeuGlu Lys Leu

Asn Leu TyrAsn Leu Tyr

Ser Ser Asp 40Ser Ser Asp 40

Met Asp Ile 55Met Asp Ile 55

Ser Gly SerSer Gly Ser

Gly Lys PheGly Lys Phe

Ile Ser LeuIle Ser Leu

105105

Ala Leu SerAla Leu Ser

120120

Gly Asp Val 135Gly Asp Val 135

Gly Asp LeuGly Asp Leu

Pro Val Thr 10Pro Val Thr 10

Pro Glu GluPro Glu Glu

Ser Val ValSer Val Val

Gly Leu Thr 60Gly Leu Thr 60

Phe Gln Pro 75Phe Gln Pro 75

Ala Phe Asp 90Ala Phe Asp 90

Met Ser AlaMet Ser Ala

Thr Gln ThrThr Gln Thr

Glu Ala MetGlu Ala Met

140140

Tyr Ser GluTyr Ser Glu

Met Ser Ser LeuMet Ser Ser Leu

Ile Pro Ser AlaIle Pro Ser Ala

His Tyr Asn Gln 45His Tyr Asn Gln 45

Asn Glu Lys ProAsn Glu Lys Pro

Ala Pro Gly Asn 80Ala Pro Gly Asn 80

Ser Pro Ser AsnSer Pro Ser Asn

Gly Ile Leu Gly 110Gly Ile Leu Gly 110

Ser Thr Ala Ser 125Ser Thr Ala Ser 125

Tyr Pro Ala LeuTyr Pro Ala Leu

Pro Val Ser PhePro Val Ser Phe

- 222 046157- 222 046157

145145

150150

155155

His Asp Pro Gln GlyHis Asp Pro Gln Gly

165165

Asn Pro Gly Leu AlaAsn Pro Gly Leu Ala

170170

Tyr Ser Pro Gln AspTyr Ser Pro Gln Asp

175175

Gln Ser Ala Lys ProGln Ser Ala Lys Pro

180180

Ala Leu Asp Ser AsnAla Leu Asp Ser Asn

185185

Leu Phe Pro Met IleLeu Phe Pro Met Ile

190190

Asp Tyr Asn Leu Tyr 195Asp Tyr Asn Leu Tyr 195

His His Pro Asn AspHis His Pro Asn Asp

200200

Met Gly Ser Ile Pro 205Met Gly Ser Ile Pro 205

His Lys Pro Phe Gln 210His Lys Pro Phe Gln 210

Gly Met Asp Pro Ile 215Gly Met Asp Pro Ile 215

Arg Val Asn Pro Pro 220Arg Val Asn Pro Pro 220

Ile Thr Pro Leu Glu 225Ile Thr Pro Leu Glu 225

Thr Ile Lys Ala Phe 230Thr Ile Lys Ala Phe 230

Lys Asp Lys Gln Ile 235Lys Asp Lys Gln Ile 235

Pro Gly Phe Gly SerPro Gly Phe Gly Ser

245245

Leu Pro Gln Pro ProLeu Pro Gln Pro Pro

250250

Leu Thr Leu Lys ProLeu Thr Leu Lys Pro

255255

Arg Pro Arg Lys TyrArg Pro Arg Lys Tyr

260260

Pro Asn Arg Pro SerPro Asn Arg Pro Ser

265265

Lys Thr Pro Leu HisLys Thr Pro Leu His

270270

Arg Pro His Ala Cys 275Arg Pro His Ala Cys 275

Pro Ala Glu Gly Cys 280Pro Ala Glu Gly Cys 280

Asp Arg Arg Phe Ser 285Asp Arg Arg Phe Ser 285

Ser Asp Asn Leu ValSer Asp Asn Leu Val

290290

Arg His Leu Arg Ile 295Arg His Leu Arg Ile 295

His Thr Gly His LysHis Thr Gly His Lys

300300

Phe Gln Cys Arg Ile 305Phe Gln Cys Arg Ile 305

Cys Met Arg Ser Phe 310Cys Met Arg Ser Phe 310

Ser His Arg Thr Thr 315Ser His Arg Thr Thr 315

Thr Asn His Ile ArgThr Asn His Ile Arg

325325

Thr His Thr Gly GluThr His Thr Gly Glu

330330

Lys Pro Phe Ala CysLys Pro Phe Ala Cys

335335

Phe Cys Gly Arg LysPhe Cys Gly Arg Lys

340340

Phe Ala Arg Glu AspPhe Ala Arg Glu Asp

345345

Asn Leu His Thr HisAsn Leu His Thr His

350350

Lys Ile His Leu Lys 355Lys Ile His Leu Lys 355

Gln Lys Glu His Ala 360Gln Lys Glu His Ala 360

Cys Pro Ala Glu GlyCys Pro Ala Glu Gly

365365

Asp Arg Arg Phe SerAsp Arg Arg Phe Ser

370370

Thr Ser His Ser LeuThr Ser His Ser Leu

375375

Thr Glu His Leu ArgThr Glu His Leu Arg

380380

His Thr Gly His Lys 385His Thr Gly His Lys 385

Pro Phe Gln Cys Arg 390Pro Phe Gln Cys Arg 390

Ile Cys Met Arg Ser 395Ile Cys Met Arg Ser 395

160160

TyrTyr

ProPro

GluGlu

ProPro

His 240His 240

IleIle

GluGlu

ArgArg

ProPro

Leu 320Leu 320

GluGlu

AlaAla

CysCys

IleIle

Phe 400Phe 400

- 223 046157- 223 046157

Ser GlnSer Gln

Ser SerSer Ser

Lys ProLys Pro

Phe AlaPhe Ala

420420

Asn LeuAsn Leu

His Thr 435His Thr 435

Ala GluAla Glu

450450

Lys GlyLys Gly

Leu Ala 465Leu Ala 465

Pro ValPro Val

Ser Leu 405Ser Leu 405

Cys GluCys Glu

His AlaHis Ala

Gly AlaGly Ala

Val ThrVal Thr

470470

Val ArgVal Arg

Phe CysPhe Cys

Lys Ile 440Lys Ile 440

Pro Ser 455Pro Ser 455

Thr CysThr Cys

His IleHis Ile

410410

Gly Arg 425Gly Arg 425

His LeuHis Leu

Ala SerAla Ser

AlaAla

Arg ThrArg Thr

Lys PheLys Phe

Lys GlnLys Gln

Ser AlaSer Ala

460460

His Thr Gly Glu 415His Thr Gly Glu 415

Ala Arg Glu AspAla Arg Glu Asp

430430

Lys Glu Lys Lys 445Lys Glu Lys Lys 445

Pro Pro Val Ser <210> 120 <211> 719 <212> Белок <213> Искусственная последовательность <220>Pro Pro Val Ser <210> 120 <211> 719 <212> Protein <213> Artificial Sequence <220>

<223> Описание искусственной последовательности<223> Description of the artificial sequence

Синтетический <400>Synthetic <400>

MetMet

SerSer

ProPro

LeuLeu

Ser 65Ser 65

SerSer

TyrTyr

GluGlu

Pro полипептидPro polypeptide

120120

AlaAla

AspAsp

LysLys

Gly 50Gly 50

SerSer

SerSer

GluGlu

LysLys

ProPro

AlaAla

AlaAla

Lys 5Lys 5

AlaAla

GluGlu

MetMet

GlnGln

LeuLeu

MetMet

SerSer

Pro Leu Gln IlePro Leu Gln Ile

ProPro

Phe 20Phe 20

GlyGly

SerSer

PhePhe

ProPro

His 25His 25

SerSer

ProPro

ThrThr

Met Asp Asn Tyr 30Met Asp Asn Tyr 30

Leu 35Leu 35

GluGlu

GluGlu

MetMet

MetMet

Leu 40Leu 40

LeuLeu

SerSer

AsnAsn

GlyGly

Ala Pro Gln Phe 45Ala Pro Gln Phe 45

AlaAla

AlaAla

GlyGly

AlaAla

Pro 55Pro 55

GluGlu

GlyGly

SerSer

GlyGly

Ser 60Ser 60

Asn Ser Ser SerAsn Ser Ser Ser

SerSer

SerSer

HisHis

ValVal

115115

IleIle

GlyGly

GlyGly

Gly 70Gly 70

GlyGly

GlyGly

GlyGly

GlyGly

Gly 75Gly 75

GlyGly

Ser Asn Ser SerSer Asn Ser Ser

SerSer

Thr 85Thr 85

PhePhe

AsnAsn

ProPro

GlnGln

Ala 90Ala 90

AspAsp

ThrThr

Gly Glu Gln Pro 95Gly Glu Gln Pro 95

LeuLeu

100100

LeuLeu

ThrThr

ThrThr

ValVal

TyrTyr

AlaAla

GluGlu

ThrThr

GluGlu

ThrThr

GlyGly

SerSer

SerSer

120120

ArgArg

PhePhe

105105

ProPro

AspAsp

IleIle

Ser Leu Asn AsnSer Leu Asn Asn

110110

TyrTyr

PhePhe

ProPro

SerSer

SerSer

LeuLeu

GlnGln

GluGlu

Thr Thr Arg Leu 125Thr Thr Arg Leu 125

Pro Ala Pro AsnPro Ala Pro Asn

- 224 046157- 224 046157

130130

135135

140140

Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val SerSer Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser

145 150 155145 150 155

Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala ProLeu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro

165 170 175165 170 175

Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu SerPro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser

180 185 190180 185 190

Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala ProAla Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro

195 200 205195 200 205

Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser GlnPhe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln

210 215 220210 215 220

Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro AlaPhe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala

225 230 235225 230 235

Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp TyrPro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr

245 250 255245 250 255

Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp GlnPhe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln

260 265 270260 265 270

Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu ThrPro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr

275 280 285275 280 285

Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln AspLeu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp

290 295 300290 295 300

Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro SerLys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser

305 310 315305 310 315

Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His GluMet Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu

325 330 335325 330 335

Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser AspPro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Asp

340 345 350340 345 350

Gly Ala Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys ProGly Ala Leu Val Arg His Ile Arg Ile His Thr Gly Gln Lys Pro

355 360 365355 360 365

Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Asn LeuGln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Asn Leu

370 375 380370 375 380

Gly 160Gly 160

SerSer

CysCys

ThrThr

AlaAla

Tyr 240Tyr 240

LeuLeu

LysLys

ProPro

LeuLeu

Arg 320Arg 320

ArgArg

ProPro

PhePhe

ValVal

- 225 046157- 225 046157

Arg 385Arg 385

CysCys

IleIle

CysCys

IleIle

Phe 465Phe 465

GluGlu

AspAsp

ProPro

GlyGly

Gln 545Gln 545

GluGlu

CysCys

IleIle

SerSer

Ser 625Ser 625

His Ile Arg Thr HisHis Ile Arg Thr His

390390

Gly Arg Lys Phe AlaGly Arg Lys Phe Ala

405405

His Leu Arg Gln Lys 420His Leu Arg Gln Lys 420

Asp Arg Arg Phe SerAsp Arg Arg Phe Ser

435435

His Thr Gly Gln Lys 450His Thr Gly Gln Lys 450

Ser Thr Ser Gly AsnSer Thr Ser Gly Asn

470470

Lys Pro Phe Ala CysLys Pro Phe Ala Cys

485485

Asn Leu Val Arg His 500Asn Leu Val Arg His 500

Tyr Ala Cys Pro ValTyr Ala Cys Pro Val

515515

His Leu Thr Glu His 530His Leu Thr Glu His 530

Cys Arg Ile Cys MetCys Arg Ile Cys Met

550550

His Ile Arg Thr HisHis Ile Arg Thr His

565565

Gly Arg Lys Phe AlaGly Arg Lys Phe Ala

580580

His Leu Arg Gln LysHis Leu Arg Gln Lys

595595

Ser Ala Thr Ser Ser 610Ser Ala Thr Ser Ser 610

Tyr Pro Ser Pro ValTyr Pro Ser Pro Val

630630

Thr Gly Glu Lys ProThr Gly Glu Lys Pro

395395

Gln Ser Gly Asp LeuGln Ser Gly Asp Leu

410410

Asp Arg Pro Tyr Ala 425Asp Arg Pro Tyr Ala 425

Thr His Leu Asp LeuThr His Leu Asp Leu

440440

Pro Phe Gln Cys Arg 455Pro Phe Gln Cys Arg 455

Leu Val Arg His IleLeu Val Arg His Ile

475475

Asp Ile Cys Gly ArgAsp Ile Cys Gly Arg

490490

Thr Lys Ile His Leu 505Thr Lys Ile His Leu 505

Glu Ser Cys Asp Arg 520Glu Ser Cys Asp Arg 520

Ile Arg Ile His Thr 535Ile Arg Ile His Thr 535

Arg Asn Phe Ser GluArg Asn Phe Ser Glu

555555

Thr Gly Glu Lys ProThr Gly Glu Lys Pro

570570

Gln Ala Gly His Leu 585Gln Ala Gly His Leu 585

Asp Lys Lys Ala Asp 600Asp Lys Lys Ala Asp 600

Leu Ser Ser Tyr Pro 615Leu Ser Ser Tyr Pro 615

Thr Thr Ser Tyr ProThr Thr Ser Tyr Pro

635635

Phe Ala Cys Asp IlePhe Ala Cys Asp Ile

400400

Arg Arg His Thr Lys 415Arg Arg His Thr Lys 415

Cys Pro Val Glu SerCys Pro Val Glu Ser

430430

Ile Arg His Ile Arg 445Ile Arg His Ile Arg 445

Ile Cys Met Arg Asn 460Ile Cys Met Arg Asn 460

Arg Thr His Thr GlyArg Thr His Thr Gly

480480

Lys Phe Ala Arg SerLys Phe Ala Arg Ser

495495

Arg Gln Lys Asp Arg 510Arg Gln Lys Asp Arg 510

Arg Phe Ser Gln SerArg Phe Ser Gln Ser

525525

Gly Gln Lys Pro Phe 540Gly Gln Lys Pro Phe 540

Arg Ser His Leu ArgArg Ser His Leu Arg

560560

Phe Ala Cys Asp IlePhe Ala Cys Asp Ile

575575

Ala Ser His Thr Lys 590Ala Ser His Thr Lys 590

Lys Ser Val Val AlaLys Ser Val Val Ala

605605

Ser Pro Val Ala Thr 620Ser Pro Val Ala Thr 620

Ser Pro Ala Thr ThrSer Pro Ala Thr Thr

640640

- 226 046157- 226 046157

Ser TyrSer Tyr

Pro SerPro Ser

Thr TyrThr Tyr

Pro SerPro Ser

660660

Thr ThrThr Thr

Tyr Ser 675Tyr Ser 675

Phe ProPhe Pro

690690

Ser SerSer Ser

Pro Val 645Pro Val 645

Pro ValPro Val

Ser ValSer Val

Ala ValAla Val

Pro ThrPro Thr

His SerHis Ser

Pro ProPro Pro

680680

Thr Asn 695Thr Asn 695

Ser PheSer Phe

650650

Gly Phe 665Gly Phe 665

Ala PheAla Phe

Ser PheSer Phe

Ser Asp Met Thr Ala Thr Phe Ser Pro ArgSer Asp Met Thr Ala Thr Phe Ser Pro Arg

705 710 <210> 121 <211> 627 <212> Белок <213> Искусственная последовательность <220>705 710 <210> 121 <211> 627 <212> Protein <213> Artificial sequence <220>

Ser SerSer Ser

Pro SerPro Ser

Pro AlaPro Ala

Ser AlaSer Ala

700700

Thr Ile 715 <223> Описание искусственной последовательности полипептид <400> 121 Met Ala Ala 1Thr Ile 715 <223> Description of the artificial sequence polypeptide <400> 121 Met Ala Ala 1

Ser Asp ProSer Asp Pro

Pro Lys Leu 35Pro Lys Leu 35

Leu Gly Ala 50Leu Gly Ala 50

Ala Lys Ala 5Ala Lys Ala 5

Phe Gly Ser 20Phe Gly Ser 20

Glu Glu MetGlu Glu Met

Ala Gly AlaAla Gly Ala

Glu Met GlnGlu Met Gln

Phe Pro HisPhe Pro His

Met Leu LeuMet Leu Leu

Pro Glu Gly 55Pro Glu Gly 55

Leu Met Ser 10Leu Met Ser 10

Ser Pro ThrSer Pro Thr

Ser Asn GlySer Asn Gly

Ser Gly Ser 60Ser Gly Ser 60

Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly 65 70 75Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly 65 70 75

SerSer

Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp ThrSer Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr

9090

Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp IleTyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile

100 105100 105

Glu Lys Val Leu Val Glu Thr SerGlu Lys Val Leu Val Glu Thr Ser

115 120115 120

Tyr Pro Ser GlnTyr Pro Ser Gln

Pro Gly Ser SerPro Gly Ser Ser

655655

Pro Ser Val AlaPro Ser Val Ala

670670

Gln Val Ser Ser 685Gln Val Ser Ser 685

Ser Thr Gly LeuSer Thr Gly Leu

Glu Ile CysGlu Ile Cys

СинтетическийSynthetic

Pro Leu Gln IlePro Leu Gln Ile

Met Asp Asn Tyr 30Met Asp Asn Tyr 30

Ala Pro Gln Phe 45Ala Pro Gln Phe 45

Asn Ser Ser SerAsn Ser Ser Ser

Ser Asn Ser SerSer Asn Ser Ser

Gly Glu Gln ProGly Glu Gln Pro

Ser Leu Asn AsnSer Leu Asn Asn

110110

Thr Thr Arg Leu 125Thr Thr Arg Leu 125

- 227 046157- 227 046157

Pro Pro Ile Thr Tyr Thr Gly Arg PhePro Pro Ile Thr Tyr Thr Gly Arg Phe

130 135130 135

Ser Gly Asn Thr Leu Trp Pro Glu ProSer Gly Asn Thr Leu Trp Pro Glu Pro

145 150145 150

Leu Val Ser Met Thr Asn Pro Pro AlaLeu Val Ser Met Thr Asn Pro Pro Ala

165165

Pro Ala Ala Ser Ser Ala Ser Ala SerPro Ala Ala Ser Ser Ala Ser Ala Ser

180 185180 185

Ala Val Pro Ser Asn Asp Ser Ser ProAla Val Pro Ser Asn Asp Ser Ser Pro

195 200195 200

Phe Pro Thr Pro Asn Thr Asp Ile PhePhe Pro Thr Pro Asn Thr Asp Ile Phe

210 215210 215

Phe Pro Gly Ser Ala Gly Thr Ala Leu 225 230Phe Pro Gly Ser Ala Gly Thr Ala Leu 225 230

Pro Ala Ala Lys Gly Gly Phe Gln ValPro Ala Ala Lys Gly Gly Phe Gln Val

245245

Phe Pro Gln Gln Gln Gly Asp Leu GlyPhe Pro Gln Gln Gln Gly Asp Leu Gly

260 265260 265

Pro Phe Gln Gly Leu Glu Ser Arg ThrPro Phe Gln Gly Leu Glu Ser Arg Thr

275 280275 280

Leu Ser Thr Ile Lys Ala Phe Ala ThrLeu Ser Thr Ile Lys Ala Phe Ala Thr

290 295290 295

Lys Ala Leu Asn Thr Ser Tyr Gln SerLys Ala Leu Asn Thr Ser Tyr Gln Ser

305 310305 310

Met Arg Lys Tyr Pro Asn Arg Pro SerMet Arg Lys Tyr Pro Asn Arg Pro Ser

325325

Pro Tyr Ala Cys Pro Val Glu Ser CysPro Tyr Ala Cys Pro Val Glu Ser Cys

340 345340 345

Asp Asn Leu Thr Arg His Ile Arg IleAsp Asn Leu Thr Arg His Ile Arg Ile

355 360355 360

Gln Cys Arg Ile Cys Met Arg Asn PheGln Cys Arg Ile Cys Met Arg Asn Phe

370 375370 375

Leu Glu Pro Ala Pro AsnLeu Glu Pro Ala Pro Asn

140140

Phe Ser Leu Val Ser GlyPhe Ser Leu Val Ser Gly

155 160155 160

Ser Ser Ser Ala Pro SerSer Ser Ser Ala Pro Ser

175175

Ser Pro Pro Leu Ser CysSer Pro Pro Leu Ser Cys

190190

Tyr Ser Ala Ala Pro ThrTyr Ser Ala Ala Pro Thr

205205

Glu Pro Gln Ser Gln AlaGlu Pro Gln Ser Gln Ala

220220

Tyr Pro Pro Pro Ala TyrTyr Pro Pro Pro Ala Tyr

235 240235 240

Met Ile Pro Asp Tyr LeuMet Ile Pro Asp Tyr Leu

255255

Gly Thr Pro Asp Gln LysGly Thr Pro Asp Gln Lys

270270

Gln Pro Ser Leu Thr ProGln Pro Ser Leu Thr Pro

285285

Ser Gly Ser Gln Asp LeuSer Gly Ser Gln Asp Leu

300300

Leu Ile Lys Pro Ser ArgLeu Ile Lys Pro Ser Arg

315 320315 320

Thr Pro Pro His Glu ArgThr Pro Pro His Glu Arg

335335

Arg Arg Phe Ser Arg SerArg Arg Phe Ser Arg Ser

350350

Thr Gly Gln Lys Pro PheThr Gly Gln Lys Pro Phe

365365

His Ser Thr Thr Leu ThrHis Ser Thr Thr Leu Thr

380380

- 228 046157- 228 046157

Asn 385Asn 385

CysCys

ThrThr

PhePhe

GlnGln

Ser 465Ser 465

AlaAla

ThrThr

SerSer

ProPro

Pro 545Pro 545

ProPro

ProPro

GlnGln

SerSer

Glu 625Glu 625

His IleHis Ile

Gly ArgGly Arg

His ThrHis Thr

Ser ThrSer Thr

435435

Lys Pro 450Lys Pro 450

Ser LeuSer Leu

Cys AspCys Asp

His ThrHis Thr

Val ValVal Val

515515

Val Ala 530Val Ala 530

Ala ThrAla Thr

Gly SerGly Ser

Ser ValSer Val

Val SerVal Ser

595595

Thr Gly 610Thr Gly 610

Ile CysIle Cys

Arg ThrArg Thr

Lys PheLys Phe

405405

Gly Glu 420Gly Glu 420

Ser HisSer His

Phe GlnPhe Gln

Thr ArgThr Arg

Ile CysIle Cys

485485

Lys Ile 500Lys Ile 500

Ala SerAla Ser

Thr SerThr Ser

Thr SerThr Ser

Ser ThrSer Thr

565565

Ala Thr 580Ala Thr 580

Ser PheSer Phe

Leu SerLeu Ser

His Thr 390His Thr 390

Ala ArgAla Arg

Lys ProLys Pro

Ser LeuSer Leu

Cys ArgCysArg

455455

His Ile 470His Ile 470

Gly ArgGly Arg

His LeuHis Leu

Ser AlaSer Ala

Tyr ProTyr Pro

535535

Tyr Pro 550Tyr Pro 550

Tyr ProTyr Pro

Thr TyrThr Tyr

Pro SerPro Ser

Asp MetAsp Met

615615

Gly GluGly Glu

Ser AspSer Asp

Phe AlaPhe Ala

425425

Thr Glu 440Thr Glu 440

Ile CysIle Cys

Arg ThrArg Thr

Lys PheLys Phe

Arg GlnArg Gln

505505

Thr Ser 520Thr Ser 520

Ser ProSer Pro

Ser ProSer Pro

Ser ProSer Pro

Ser SerSer Ser

585585

Ser Ala 600Ser Ala 600

Thr AlaThr Ala

Lys ProLys Pro

395395

Phe AlaPhe Ala

Cys AspCys Asp

Asn Arg 410Asn Arg 410

Cys AspCys Asp

His IleHis Ile

Met ArgMet Arg

His ThrHis Thr

475475

Ala Arg 490Ala Arg 490

Lys AspLys Asp

Ser LeuSer Leu

Val ThrVal Thr

Val ProVal Pro

555555

Val His 570Val His 570

Val ProVal Pro

Val ThrVal Thr

Thr PheThr Phe

Lys ThrLys Thr

Ile CysIle Cys

Arg IleArg Ile

445445

Asn Phe 460Asn Phe 460

Gly GluGly Glu

Ser AspSer Asp

Lys LysLys Lys

Ser SerSer Ser

525525

Thr Ser 540Thr Ser 540

Thr SerThr Ser

Ser GlySer Gly

Pro AlaPro Ala

Asn SerAsn Ser

605605

Ser Pro 620Ser Pro 620

His IleHis Ile

415415

Gly Arg 430Gly Arg 430

His ThrHis Thr

Ser GlnSer Gln

Lys ProLys Pro

Asn ArgAsn Arg

495495

Ala Asp 510Ala Asp 510

Tyr ProTyr Pro

Tyr ProTyr Pro

Phe SerPhe Ser

Phe ProPhe Pro

575575

Phe Pro 590Phe Pro 590

Phe SerPhe Ser

Arg ThrArg Thr

Ile 400Ile 400

ArgArg

LysLys

GlyGly

SerSer

Phe 480Phe 480

LysLys

LysLys

SerSer

SerSer

Ser 560Ser 560

SerSer

AlaAla

AlaAla

IleIle

- 229 046157 <210> 122 <211> 473 <212> Белок <213> Искусственная последовательность <220>- 229 046157 <210> 122 <211> 473 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 122<223> Description of the artificial sequence polypeptide <400> 122

Met Thr Gly Lys Leu Ala Glu Lys Leu Pro Val ThrMet Thr Gly Lys Leu Ala Glu Lys Leu Pro Val Thr

5 105 10

СинтетическийSynthetic

Met Ser Ser LeuMet Ser Ser Leu

Leu Asn Gln Leu Pro Asp 20Leu Asn Gln Leu Pro Asp 20

Asn Leu Tyr Pro Glu Glu 25Asn Leu Tyr Pro Glu Glu 25

Ile Pro Ser AlaIle Pro Ser Ala

Leu Asn Leu Phe Ser Gly 35Leu Asn Leu Phe Ser Gly 35

Ser Ser Asp Ser Val Val 40Ser Ser Asp Ser Val Val 40

His Tyr Asn Gln 45His Tyr Asn Gln 45

Met Ala Thr Glu Asn ValMet Ala Thr Glu Asn Val

Met Asp Ile Gly Leu Thr 55 60Met Asp Ile Gly Leu Thr 55 60

Asn Glu Lys ProAsn Glu Lys Pro

Asn Pro Glu Leu Ser Tyr 65 70Asn Pro Glu Leu Ser Tyr 65 70

Ser Gly Ser Phe Gln Pro 75Ser Gly Ser Phe Gln Pro 75

Ala Pro Gly Asn 80Ala Pro Gly Asn 80

Lys Thr Val Thr Tyr Leu 85Lys Thr Val Thr Tyr Leu 85

Gly Lys Phe Ala Phe Asp 90Gly Lys Phe Ala Phe Asp 90

Ser Pro Ser AsnSer Pro Ser Asn

Trp Cys Gln Asp Asn IleTrp Cys Gln Asp Asn Ile

100100

Ile Ser Leu Met Ser AlaIle Ser Leu Met Ser Ala

105105

Gly Ile Leu Gly 110Gly Ile Leu Gly 110

Val Pro Pro Ala Ser GlyVal Pro Pro Ala Ser Gly

115115

Ala Leu Ser Thr Gln ThrAla Leu Ser Thr Gln Thr

120120

Ser Thr Ala Ser 125Ser Thr Ala Ser 125

Met Val Gln Pro Pro GlnMet Val Gln Pro Pro Gln

130130

Gly Asp Val Glu Ala MetGly Asp Val Glu Ala Met

135 140135 140

Tyr Pro Ala LeuTyr Pro Ala Leu

Pro Pro Tyr Ser Asn CysPro Pro Tyr Ser Asn Cys

145 150145 150

Gly Asp Leu Tyr Ser GluGly Asp Leu Tyr Ser Glu

155155

Pro Val Ser PhePro Val Ser Phe

160160

His Asp Pro Gln Gly AsnHis Asp Pro Gln Gly Asn

165165

Pro Gly Leu Ala Tyr SerPro Gly Leu Ala Tyr Ser

170170

Pro Gln Asp TyrPro Gln Asp Tyr

175175

Gln Ser Ala Lys Pro AlaGln Ser Ala Lys Pro Ala

180180

Leu Asp Ser Asn Leu PheLeu Asp Ser Asn Leu Phe

185185

Pro Met Ile ProPro Met Ile Pro

190190

Asp Tyr Asn Leu Tyr HisAsp Tyr Asn Leu Tyr His

195195

His Pro Asn Asp Met GlyHis Pro Asn Asp Met Gly

200200

Ser Ile Pro Glu 205Ser Ile Pro Glu 205

- 230 046157- 230 046157

His Lys Pro Phe Gln 210His Lys Pro Phe Gln 210

Gly Met Asp Pro Ile 215Gly Met Asp Pro Ile 215

Arg Val Asn Pro Pro 220Arg Val Asn Pro Pro 220

Ile Thr Pro Leu Glu 225Ile Thr Pro Leu Glu 225

Thr Ile Lys Ala Phe 230Thr Ile Lys Ala Phe 230

Lys Asp Lys Gln Ile 235Lys Asp Lys Gln Ile 235

Pro Gly Phe Gly SerPro Gly Phe Gly Ser

245245

Leu Pro Gln Pro ProLeu Pro Gln Pro Pro

250250

Leu Thr Leu Lys ProLeu Thr Leu Lys Pro

255255

Arg Pro Arg Lys TyrArg Pro Arg Lys Tyr

260260

Pro Asn Arg Pro SerPro Asn Arg Pro Ser

265265

Lys Thr Pro Leu HisLys Thr Pro Leu His

270270

Arg Pro His Ala Cys 275Arg Pro His Ala Cys 275

Pro Ala Glu Gly Cys 280Pro Ala Glu Gly Cys 280

Asp Arg Arg Phe Ser 285Asp Arg Arg Phe Ser 285

Ser Asp Asn Leu ValSer Asp Asn Leu Val

290290

Arg His Leu Arg Ile 295Arg His Leu Arg Ile 295

His Thr Gly His LysHis Thr Gly His Lys

300300

Phe Gln Cys Arg Ile 305Phe Gln Cys Arg Ile 305

Cys Met Arg Ser Phe 310Cys Met Arg Ser Phe 310

Ser Arg Glu Asp Asn 315Ser Arg Glu Asp Asn 315

His Thr His Ile ArgHis Thr His Ile Arg

325325

Thr His Thr Gly GluThr His Thr Gly Glu

330330

Lys Pro Phe Ala CysLys Pro Phe Ala Cys

335335

Phe Cys Gly Arg LysPhe Cys Gly Arg Lys

340340

Phe Ala Arg Ser AspPhe Ala Arg Ser Asp

345345

Glu Leu Val Arg HisGlu Leu Val Arg His

350350

Lys Ile His Leu Lys 355Lys Ile His Leu Lys 355

Gln Lys Glu His Ala 360Gln Lys Glu His Ala 360

Cys Pro Ala Glu Gly 365Cys Pro Ala Glu Gly 365

Asp Arg Arg Phe SerAsp Arg Arg Phe Ser

370370

Gln Ser Gly Asn Leu 375Gln Ser Gly Asn Leu 375

Thr Glu His Leu ArgThr Glu His Leu Arg

380380

His Thr Gly His Lys 385His Thr Gly His Lys 385

Pro Phe Gln Cys Arg 390Pro Phe Gln Cys Arg 390

Ile Cys Met Arg Ser 395Ile Cys Met Arg Ser 395

Ser Thr Ser Gly HisSer Thr Ser Gly His

405405

Leu Val Arg His IleLeu Val Arg His Ile

410410

Arg Thr His Thr Gly 415Arg Thr His Thr Gly 415

Lys Pro Phe Ala CysLys Pro Phe Ala Cys

420420

Glu Phe Cys Gly ArgGlu Phe Cys Gly Arg

425425

Lys Phe Ala Gln AsnLys Phe Ala Gln Asn

430430

Thr Leu Thr Glu HisThr Leu Thr Glu His

435435

Ala Lys Ile His Leu 440Ala Lys Ile His Leu 440

Lys Gln Lys Glu Lys 445Lys Gln Lys Glu Lys 445

Ala Glu Lys Gly Gly 450Ala Glu Lys Gly Gly 450

Ala Pro Ser Ala SerAla Pro Ser Ala Ser

455455

Ser Ala Pro Pro ValSer Ala Pro Pro Val

460460

ProPro

His 240His 240

IleIle

GluGlu

ArgArg

ProPro

Leu 320Leu 320

GluGlu

AlaAla

CysCys

IleIle

Phe 400Phe 400

GluGlu

SerSer

LysLys

SerSer

- 231 046157- 231 046157

Leu Ala Pro Val Val Thr Thr Cys AlaLeu Ala Pro Val Val Thr Thr Cys Ala

465465

470 <210> 123 <211> 627 <212> Белок <213> Искусственная последовательность <220>470 <210> 123 <211> 627 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 123<223> Description of artificial sequence: Synthetic polypeptide <400> 123

Met Ala Ala Ala Lys Ala Glu Met 1 5Met Ala Ala Ala Lys Ala Glu Met 1 5

Gln Leu Met Ser Pro Leu Gln IleGln Leu Met Ser Pro Leu Gln Ile

1515

Ser Asp Pro Phe Gly Ser Phe Pro 20Ser Asp Pro Phe Gly Ser Phe Pro 20

His Ser Pro Thr Met Asp Asn Tyr 25 30His Ser Pro Thr Met Asp Asn Tyr 25 30

Pro Lys Leu Glu Glu Met Met LeuPro Lys Leu Glu Glu Met Met Leu

4040

Leu Ser Asn Gly Ala Pro Gln Phe 45Leu Ser Asn Gly Ala Pro Gln Phe 45

Leu Gly Ala Ala Gly Ala Pro GluLeu Gly Ala Ala Gly Ala Pro Glu

5555

Gly Ser Gly Ser Asn Ser Ser Ser 60Gly Ser Gly Ser Asn Ser Ser Ser 60

Ser Ser Ser Gly Gly Gly Gly Gly 65 70Ser Ser Ser Gly Gly Gly Gly Gly 65 70

Gly Gly Gly Gly Ser Asn Ser SerGly Gly Gly Gly Ser Asn Ser Ser

8080

Ser Ser Ser Ser Thr Phe Asn ProSer Ser Ser Ser Thr Phe Asn Pro

Gln Ala Asp Thr Gly Glu Gln ProGln Ala Asp Thr Gly Glu Gln Pro

9595

Tyr Glu His Leu Thr Ala Glu SerTyr Glu His Leu Thr Ala Glu Ser

100100

Phe Pro Asp Ile Ser Leu Asn AsnPhe Pro Asp Ile Ser Leu Asn Asn

105 110105 110

Glu Lys Val Leu Val Glu Thr SerGlu Lys Val Leu Val Glu Thr Ser

115 120115 120

Tyr Pro Ser Gln Thr Thr Arg LeuTyr Pro Ser Gln Thr Thr Arg Leu

125125

Pro Pro Ile Thr Tyr Thr Gly ArgPro Pro Ile Thr Tyr Thr Gly Arg

130 135130 135

Phe Ser Leu Glu Pro Ala Pro AsnPhe Ser Leu Glu Pro Ala Pro Asn

140140

Ser Gly Asn Thr Leu Trp Pro GluSer Gly Asn Thr Leu Trp Pro Glu

145 150145 150

Pro Leu Phe Ser Leu Val Ser GlyPro Leu Phe Ser Leu Val Ser Gly

155 160155 160

Leu Val Ser Met Thr Asn Pro ProLeu Val Ser Met Thr Asn Pro Pro

165165

Ala Ser Ser Ser Ser Ala Pro SerAla Ser Ser Ser Ser Ala Pro Ser

170 175170 175

Pro Ala Ala Ser Ser Ala Ser AlaPro Ala Ala Ser Ser Ala Ser Ala

180180

Ser Gln Ser Pro Pro Leu Ser CysSer Gln Ser Pro Pro Leu Ser Cys

185 190185 190

- 232 046157- 232 046157

Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala ProAla Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro

195 200 205195 200 205

Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser GlnPhe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln

210 215 220210 215 220

Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala 225 230 235Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala 225 230 235

Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp TyrPro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr

245 250 255245 250 255

Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp GlnPhe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln

260 265 270260 265 270

Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu ThrPro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr

275 280 285275 280 285

Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln AspLeu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp

290 295 300290 295 300

Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro SerLys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser

305 310 315305 310 315

Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His GluMet Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu

325 330 335325 330 335

Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser ArgPro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg

340 345 350340 345 350

Asp Asn Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys ProAsp Asn Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys Pro

355 360 365355 360 365

Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Asn LeuGln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Asn Leu

370 375 380370 375 380

Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys AspThr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp

385 390 395385 390 395

Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His IleCys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His Ile

405 410 415405 410 415

Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly ArgThr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg

420 425 430420 425 430

Phe Ser Gln Ser Gly Asn Leu Thr Glu His Ile Arg Ile His ThrPhe Ser Gln Ser Gly Asn Leu Thr Glu His Ile Arg Ile His Thr

435 440 445435 440 445

ThrThr

AlaAla

Tyr 240Tyr 240

LeuLeu

LysLys

ProPro

LeuLeu

Arg 320Arg 320

ArgArg

SerSer

PhePhe

ThrThr

Ile 400Ile 400

ArgArg

LysLys

GlyGly

- 233 046157- 233 046157

Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg AsnGln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn

450 455 460450 455 460

Phe Ser Thr SerPhe Ser Thr Ser

Gly His Leu Thr Arg His Ile Arg Thr His Thr GlyGly His Leu Thr Arg His Ile Arg Thr His Thr Gly

465 470 475465 470 475

Glu Lys Pro PheGlu Lys Pro Phe

480480

Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln SerAla Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser

485 490485 490

Ser Thr Arg LysSer Thr Arg Lys

495495

Glu His Thr Lys Ile His Leu Arg Gln Lys Asp LysGlu His Thr Lys Ile His Leu Arg Gln Lys Asp Lys

500 505500 505

Lys Ala Asp LysLys Ala Asp Lys

510510

Ser Val Val Ala Ser Ser Ala Thr Ser Ser Leu SerSer Val Val Ala Ser Ser Ala Thr Ser Ser Leu Ser

515 520515 520

Ser Tyr Pro Ser 525Ser Tyr Pro Ser 525

Pro Val Ala Thr Ser Tyr Pro Ser Pro Val Thr ThrPro Val Ala Thr Ser Tyr Pro Ser Pro Val Thr Thr

530 535 540530 535 540

Ser Tyr Pro SerSer Tyr Pro Ser

Pro Ala Thr Thr Ser Tyr Pro Ser Pro Val Pro ThrPro Ala Thr Thr Ser Tyr Pro Ser Pro Val Pro Thr

545 550 555545 550 555

Ser Phe Ser SerSer Phe Ser Ser

560560

Pro Gly Ser Ser Thr Tyr Pro Ser Pro Val His SerPro Gly Ser Ser Thr Tyr Pro Ser Pro Val His Ser

565 570565 570

Gly Phe Pro SerGly Phe Pro Ser

575575

Pro Ser Val Ala Thr Thr Tyr Ser Ser Val Pro ProPro Ser Val Ala Thr Thr Tyr Ser Ser Val Pro Pro

580 585580 585

Ala Phe Pro AlaAla Phe Pro Ala

590590

Gln Val Ser Ser Phe Pro Ser Ser Ala Val Thr AsnGln Val Ser Ser Phe Pro Ser Ser Ala Val Thr Asn

595 600595 600

Ser Phe Ser Ala 605Ser Phe Ser Ala 605

Ser Thr Gly Leu Ser Asp Met Thr Ala Thr Phe SerSer Thr Gly Leu Ser Asp Met Thr Ala Thr Phe Ser

610 615 620610 615 620

Pro Arg Thr IlePro Arg Thr Ile

Glu Ile Cys 625 <210> 124 <211> 627 <212> Белок <213> Искусственная последовательность <220>Glu Ile Cys 625 <210> 124 <211> 627 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 124<223> Description of the artificial sequence polypeptide <400> 124

Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met SerMet Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser

5 105 10

СинтетическийSynthetic

Pro Leu Gln IlePro Leu Gln Ile

- 234 046157- 234 046157

Ser Asp Pro Phe Gly Ser Phe Pro His Ser ProSer Asp Pro Phe Gly Ser Phe Pro His Ser Pro

2525

Thr Met Asp AsnThr Met Asp Asn

Pro LysPro Lys

Leu Glu Glu Met Met 35Leu Glu Glu Met Met 35

Leu Leu Ser Asn Gly Ala Pro Gln 40 45Leu Leu Ser Asn Gly Ala Pro Gln 40 45

Leu Gly Ala AlaLeu Gly Ala Ala

Gly Ala Pro Glu GlyGly Ala Pro Glu Gly

Ser Gly Ser Asn SerSer Gly Ser Asn Ser

SerSer

Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser 65 70 75Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser 65 70 75

Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln 85 90 95Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln 85 90 95

Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu AsnTyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn

100 105 110100 105 110

Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr ArgGlu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg

115 120 125115 120 125

Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala ProPro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro

130 135 140130 135 140

Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val SerSer Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser

145 150 155145 150 155

Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala ProLeu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro

165 170 175165 170 175

Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu SerPro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser

180 185 190180 185 190

Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala ProAla Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro

195 200 205195 200 205

Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser GlnPhe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln

210 215 220210 215 220

Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro AlaPhe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala

225 230 235225 230 235

Pro Ala Ala LysPro Ala Ala Lys

Gly Gly Phe Gln ValGly Gly Phe Gln Val

245245

Pro Met 250Pro Met 250

Ile Pro Asp TyrIle Pro Asp Tyr

255255

Phe Pro Gln Gln Gln Gly Asp LeuPhe Pro Gln Gln Gln Gly Asp Leu

260260

Gly Leu Gly Thr Pro Asp GlnGly Leu Gly Thr Pro Asp Gln

265 270265 270

TyrTyr

PhePhe

SerSer

Ser 80Ser 80

ProPro

AsnAsn

LeuLeu

AsnAsn

Gly 160Gly 160

SerSer

CysCys

ThrThr

AlaAla

Tyr 240Tyr 240

LeuLeu

LysLys

- 235 046157- 235 046157

Pro Phe Gln Gly LeuPro Phe Gln Gly Leu

275275

Glu Ser Arg Thr Gln 280Glu Ser Arg Thr Gln 280

Gln Pro Ser Leu ThrGln Pro Ser Leu Thr

285285

Leu Ser Thr Ile Lys 290Leu Ser Thr Ile Lys 290

Ala Phe Ala Thr GlnAla Phe Ala Thr Gln

295295

Ser Gly Ser Gln AspSer Gly Ser Gln Asp

300300

Lys Ala Leu Asn Thr 305Lys Ala Leu Asn Thr 305

Ser Tyr Gln Ser Gln 310Ser Tyr Gln Ser Gln 310

Leu Ile Lys Pro Ser 315Leu Ile Lys Pro Ser 315

Met Arg Lys Tyr ProMet Arg Lys Tyr Pro

325325

Asn Arg Pro Ser LysAsn Arg Pro Ser Lys

330330

Thr Pro Pro His GluThr Pro Pro His Glu

335335

Pro Tyr Ala Cys ProPro Tyr Ala Cys Pro

340340

Val Glu Ser Cys AspVal Glu Ser Cys Asp

345345

Arg Arg Phe Ser ArgArg Arg Phe Ser Arg

350350

Asp Asn Leu Val Arg 355Asp Asn Leu Val Arg 355

His Ile Arg Ile His 360His Ile Arg Ile His 360

Thr Gly Gln Lys Pro 365Thr Gly Gln Lys Pro 365

Gln Cys Arg Ile CysGln Cys Arg Ile Cys

370370

Met Arg Asn Phe Ser 375Met Arg Asn Phe Ser 375

Arg Glu Asp Asn Leu 380Arg Glu Asp Asn Leu 380

Thr His Ile Arg Thr 385Thr His Ile Arg Thr 385

His Thr Gly Glu Lys 390His Thr Gly Glu Lys 390

Pro Phe Ala Cys Asp 395Pro Phe Ala Cys Asp 395

Cys Gly Arg Lys PheCys Gly Arg Lys Phe

405405

Ala Arg Ser Asp GluAla Arg Ser Asp Glu

410410

Leu Val Arg His IleLeu Val Arg His Ile

415415

Thr His Thr Gly GluThr His Thr Gly Glu

420420

Lys Pro Phe Ala CysLys Pro Phe Ala Cys

425425

Asp Ile Cys Gly ArgAsp Ile Cys Gly Arg

430430

Phe Ser Gln Ser GlyPhe Ser Gln Ser Gly

435435

Asn Leu Thr Glu HisAsn Leu Thr Glu His

440440

Ile Arg Ile His Thr 445Ile Arg Ile His Thr 445

Gln Lys Pro Phe Gln 450Gln Lys Pro Phe Gln 450

Cys Arg Ile Cys MetCys Arg Ile Cys Met

455455

Arg Asn Phe Ser ThrArg Asn Phe Ser Thr

460460

Gly His Leu Val Arg 465Gly His Leu Val Arg 465

His Ile Arg Thr His 470His Ile Arg Thr His 470

Thr Gly Glu Lys Pro 475Thr Gly Glu Lys Pro 475

Ala Cys Asp Ile CysAla Cys Asp Ile Cys

485485

Gly Arg Lys Phe AlaGly Arg Lys Phe Ala

490490

Gln Asn Ser Thr LeuGln Asn Ser Thr Leu

495495

Glu His Thr Lys IleGlu His Thr Lys Ile

500500

His Leu Arg Gln LysHis Leu Arg Gln Lys

505505

Asp Lys Lys Ala AspAsp Lys Lys Ala Asp

510510

Ser Val Val Ala SerSer Val Val Ala Ser

Ser Ala Thr Ser SerSer Ala Thr Ser Ser

Leu Ser Ser Tyr ProLeu Ser Ser Tyr Pro

ProPro

LeuLeu

Arg 320Arg 320

ArgArg

SerSer

PhePhe

HisHis

Ile 400Ile 400

ArgArg

LysLys

GlyGly

SerSer

Phe 480Phe 480

ThrThr

LysLys

SerSer

- 236 046157- 236 046157

Pro ValPro Val

530530

Pro Ala 545Pro Ala 545

Pro GlyPro Gly

Pro SerPro Ser

Gln ValGln Val

Ser ThrSer Thr

610610

515515

Ala ThrAla Thr

Thr ThrThr Thr

Ser SerSer Ser

Val AlaVal Ala

580580

Ser Ser 595Ser Ser 595

Gly LeuGly Leu

Ser TyrSer Tyr

Ser TyrSer Tyr

550550

Thr Tyr 565Thr Tyr 565

Thr ThrThr Thr

Phe ProPhe Pro

Ser AspSer Asp

520520

Pro Ser 535Pro Ser 535

Pro SerPro Ser

Pro SerPro Ser

Tyr SerTyr Ser

Ser SerSer Ser

600600

Met Thr 615Met Thr 615

525525

Pro ValPro Val

Pro ValPro Val

Pro ValPro Val

570570

Ser ValSer Val

585585

Ala ValAla Val

Ala ThrAla Thr

Glu Ile Cys 625Glu Ile Cys 625

Thr ThrThr Thr

540540

Pro Thr 555Pro Thr 555

His SerHis Ser

Pro ProPro Pro

Thr AsnThr Asn

Phe SerPhe Ser

620 <210> 125 <211> 272 <212> Белок <213> Искусственная последовательность <220>620 <210> 125 <211> 272 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 125<223> Description of the artificial sequence polypeptide <400> 125

Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile HisMet Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His

5 105 10

Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro 20 25Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro 20 25

Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His GlnSer Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln

4040

Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly LysGly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys

55 6055 60

Ser Asp Asn Leu Val Arg His Gln Arg Thr His ThrSer Asp Asn Leu Val Arg His Gln Arg Thr His Thr

70 7570 75

Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser ArgTyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg

9090

Ser Tyr Pro SerSer Tyr Pro Ser

Ser Phe Ser SerSer Phe Ser Ser

560560

Gly Phe Pro SerGly Phe Pro Ser

575575

Ala Phe Pro AlaAla Phe Pro Ala

590590

Ser Phe Ser Ala 605Ser Phe Ser Ala 605

Pro Arg Thr IlePro Arg Thr Ile

СинтетическийSynthetic

Gly Val Pro Ala 15Gly Val Pro Ala 15

Glu Cys Gly Lys 30Glu Cys Gly Lys 30

Arg Thr His Thr 45Arg Thr His Thr 45

Ser Phe Ser ArgSer Phe Ser Arg

Gly Glu Lys Pro 80Gly Glu Lys Pro 80

Glu Asp Asn LeuGlu Asp Asn Leu

- 237 046157- 237 046157

His Thr His Gln Arg Thr His Thr Gly Glu LysHis Thr His Gln Arg Thr His Thr Gly Glu Lys

100 105100 105

Pro Tyr Lys Cys ProPro Tyr Lys Cys Pro

110110

Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu Val Arg His GlnGlu Cys Gly Lys Ser Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln

115 120 125115 120 125

Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly LysArg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys

130 135 140130 135 140

Ser Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln Arg Thr His ThrSer Phe Ser Gln Ser Gly Asn Leu Thr Glu His Gln Arg Thr His Thr

145 150 155 160145 150 155 160

Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser ThrGly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr

165 170 175165 170 175

Ser Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Lys Lys ThrSer Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Lys Lys Thr

180 185 190180 185 190

Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys LysSer Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys

195 200 205195 200 205

Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Leu Glu Asp AlaLys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Leu Glu Asp Ala

210 215 220210 215 220

Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp AspLeu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp

225 230 235 240225 230 235 240

Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp LeuPhe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu

245 250 255245 250 255

Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met LeuAsp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu

260 265 270 <210> 126 <211> 272 <212> Белок <213> Искусственная последовательность <220>260 265 270 <210> 126 <211> 272 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 126<223> Description of artificial sequence: Synthetic polypeptide <400> 126

Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro AlaMet Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala

5 10 155 10 15

Ala Leu Glu Pro Gly Glu Lys Pro TyrAla Leu Glu Pro Gly Glu Lys Pro Tyr

2525

Lys Cys Pro Glu Cys Gly Lys 30Lys Cys Pro Glu Cys Gly Lys 30

- 238 046157- 238 046157

Ser Phe Ser Asp Pro 35Ser Phe Ser Asp Pro 35

Gly Ala Leu Val Arg 40Gly Ala Leu Val Arg 40

His Gln Arg Thr His 45His Gln Arg Thr His 45

Gly Glu Lys Pro Tyr 50Gly Glu Lys Pro Tyr 50

Lys Cys Pro Glu Cys 55Lys Cys Pro Glu Cys 55

Gly Lys Ser Phe Ser 60Gly Lys Ser Phe Ser 60

Ser Asp Asn Leu Val 65Ser Asp Asn Leu Val 65

Arg His Gln Arg Thr 70Arg His Gln Arg Thr 70

His Thr Gly Glu Lys 75His Thr Gly Glu Lys 75

Tyr Lys Cys Pro Glu 85Tyr Lys Cys Pro Glu 85

Cys Gly Lys Ser PheCys Gly Lys Ser Phe

Ser Gln Ser Gly AspSer Gln Ser Gly Asp

Arg Arg His Gln ArgArg Arg His Gln Arg

100100

Thr His Thr Gly GluThr His Thr Gly Glu

105105

Lys Pro Tyr Lys CysLys Pro Tyr Lys Cys

110110

Glu Cys Gly Lys Ser 115Glu Cys Gly Lys Ser 115

Phe Ser Thr His LeuPhe Ser Thr His Leu

120120

Asp Leu Ile Arg His 125Asp Leu Ile Arg His 125

Arg Thr His Thr Gly 130Arg Thr His Thr Gly 130

Glu Lys Pro Tyr Lys 135Glu Lys Pro Tyr Lys 135

Cys Pro Glu Cys GlyCys Pro Glu Cys Gly

140140

Ser Phe Ser Thr Ser 145Ser Phe Ser Thr Ser 145

Gly Asn Leu Val Arg 150Gly Asn Leu Val Arg 150

His Gln Arg Thr His 155His Gln Arg Thr His 155

Gly Glu Lys Pro TyrGly Glu Lys Pro Tyr

165165

Lys Cys Pro Glu CysLys Cys Pro Glu Cys

170170

Gly Lys Ser Phe SerGly Lys Ser Phe Ser

175175

Ser Asp Asn Leu ValSer Asp Asn Leu Val

180180

Arg His Gln Arg ThrArg His Gln Arg Thr

185185

His Thr Gly Lys LysHis Thr Gly Lys Lys

190190

Ser Lys Arg Pro AlaSer Lys Arg Pro Ala

195195

Ala Thr Lys Lys Ala 200Ala Thr Lys Lys Ala 200

Gly Gln Ala Lys Lys 205Gly Gln Ala Lys Lys 205

Lys Gly Ser Tyr ProLys Gly Ser Tyr Pro

210210

Tyr Asp Val Pro AspTyr Asp Val Pro Asp

215215

Tyr Ala Leu Glu AspTyr Ala Leu Glu Asp

220220

Leu Asp Asp Phe Asp 225Leu Asp Asp Phe Asp 225

Leu Asp Met Leu Gly 230Leu Asp Met Leu Gly 230

Ser Asp Ala Leu Asp 235Ser Asp Ala Leu Asp 235

Phe Asp Leu Asp MetPhe Asp Leu Asp Met

245245

Leu Gly Ser Asp AlaLeu Gly Ser Asp Ala

250250

Leu Asp Asp Phe AspLeu Asp Asp Phe Asp

255255

Asp Met Leu Gly SerAsp Met Leu Gly Ser

260260

Asp Ala Leu Asp AspAsp Ala Leu Asp Asp

265265

Phe Asp Leu Asp MetPhe Asp Leu Asp Met

270270

ThrThr

ArgArg

Pro 80Pro 80

LeuLeu

ProPro

GlnGln

LysLys

Thr 160Thr 160

ArgArg

ThrThr

LysLys

AlaAla

Asp 240Asp 240

LeuLeu

Leu <210> 127 <211> 261Leu <210> 127 <211> 261

- 239 046157 <212> Белок <213> Искусственная последовательность <220>- 239 046157 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 127<223> Description of the artificial sequence polypeptide <400> 127

Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile HisMet Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His

5 105 10

Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro 20 25Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro 20 25

СинтетическийSynthetic

Gly Val Pro Ala 15Gly Val Pro Ala 15

Glu Cys Gly Lys 30Glu Cys Gly Lys 30

Ser Phe Ser Arg Ser Asp 35Ser Phe Ser Arg Ser Asp 35

Asn Leu Val Arg His Gln 40Asn Leu Val Arg His Gln 40

Arg Thr His Thr 45Arg Thr His Thr 45

Gly Glu Lys Pro Tyr Lys 50Gly Glu Lys Pro Tyr Lys 50

Cys Pro Glu Cys Gly Lys 55 60Cys Pro Glu Cys Gly Lys 55 60

Ser Phe Ser ArgSer Phe Ser Arg

Glu Asp Asn Leu His Thr 65 70Glu Asp Asn Leu His Thr 65 70

His Gln Arg Thr His Thr 75His Gln Arg Thr His Thr 75

Gly Glu Lys Pro 80Gly Glu Lys Pro 80

Tyr Lys Cys Pro Glu Cys 85Tyr Lys Cys Pro Glu Cys 85

Gly Lys Ser Phe Ser Arg 90Gly Lys Ser Phe Ser Arg 90

Ser Asp Glu Leu 95Ser Asp Glu Leu 95

Val Arg His Gln Arg ThrVal Arg His Gln Arg Thr

100100

His Thr Gly Glu Lys ProHis Thr Gly Glu Lys Pro

105105

Tyr Lys Cys Pro 110Tyr Lys Cys Pro 110

Glu Cys Gly Lys Ser Phe 115Glu Cys Gly Lys Ser Phe 115

Ser Gln Ser Gly Asn LeuSer Gln Ser Gly Asn Leu

120120

Thr Glu His Gln 125Thr Glu His Gln 125

Arg Thr His Thr Gly Glu 130Arg Thr His Thr Gly Glu 130

Lys Pro Tyr Lys Cys ProLys Pro Tyr Lys Cys Pro

135 140135 140

Glu Cys Gly LysGlu Cys Gly Lys

Ser Phe Ser Thr Ser GlySer Phe Ser Thr Ser Gly

145 150145 150

His Leu Val Arg His Gln 155His Leu Val Arg His Gln 155

Arg Thr His ThrArg Thr His Thr

160160

Gly Glu Lys Pro Tyr LysGly Glu Lys Pro Tyr Lys

165165

Cys Pro Glu Cys Gly LysCys Pro Glu Cys Gly Lys

170170

Ser Phe Ser GlnSer Phe Ser Gln

175175

Asn Ser Thr Leu Thr GluAsn Ser Thr Leu Thr Glu

180180

His Gln Arg Thr His ThrHis Gln Arg Thr His Thr

185185

Gly Lys Lys Thr 190Gly Lys Lys Thr 190

Ser Lys Arg Pro Ala AlaSer Lys Arg Pro Ala Ala

195195

Thr Lys Lys Ala Gly GlnThr Lys Lys Ala Gly Gln

200200

Ala Lys Lys Lys 205Ala Lys Lys Lys 205

Lys Gly Ser Asp Ala LeuLys Gly Ser Asp Ala Leu

210210

Asp Asp Phe Asp Leu AspAsp Asp Phe Asp Leu Asp

215 220215 220

Met Leu Gly SerMet Leu Gly Ser

- 240 046157- 240 046157

Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu GlyAsp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly

225 230 235225 230 235

Ser Asp Ala LeuSer Asp Ala Leu

240240

Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp AlaAsp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala

245 250245 250

Leu Asp Asp PheLeu Asp Asp Phe

255255

Asp Leu Asp Met LeuAsp Leu Asp Met Leu

260 <210> 128 <211> 386 <212> Белок <213> Искусственная последовательность <220>260 <210> 128 <211> 386 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 128<223> Description of the artificial sequence polypeptide <400> 128

Met Ala Ala Asp His Leu Met Leu Ala Glu Gly TyrMet Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr

5 105 10

СинтетическийSynthetic

Arg Leu Val Gln 15Arg Leu Val Gln 15

Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His 20 25Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His 20 25

Ala Leu Arg Thr 30Ala Leu Arg Thr 30

Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser GlyLeu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly

4040

Leu Arg Pro Arg 45Leu Arg Pro Arg 45

Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln ProGly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro

55 6055 60

Gly Ala Leu AlaGly Ala Leu Ala

Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro 65 70 75Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro 65 70 75

Phe Pro Ala ValPhe Pro Ala Val

Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro 85 90Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro 85 90

Val Ala Thr ProVal Ala Thr Pro

Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala ProTyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro

100 105100 105

Gly Gly Pro Pro 110Gly Gly Pro Pro 110

Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro ProGly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro

115 120115 120

Pro Pro Ala His 125Pro Pro Ala His 125

Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp GluAla Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu

130 135 140130 135 140

Glu Ala Leu ThrGlu Ala Leu Thr

Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val ArgSer Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg

145 150 155145 150 155

Glu Leu Pro GluGlu Leu Pro Glu

160160

- 241 046157- 241 046157

Leu Phe Leu Gly GlnLeu Phe Leu Gly Gln

165165

Ser Glu Phe Asp CysSer Glu Phe Asp Cys

170170

Phe Ser Asp Leu GlyPhe Ser Asp Leu Gly

175175

Ala Pro Pro Ala GlyAla Pro Pro Ala Gly

180180

Ser Val Ser Cys GlnSer Val Ser Cys Gln

185185

Ser Gln Leu Ile LysSer Gln Leu Ile Lys

190190

Ser Arg Met Arg LysSer Arg Met Arg Lys

195195

Tyr Pro Asn Arg ProTyr Pro Asn Arg Pro

200200

Ser Lys Thr Pro ProSer Lys Thr Pro Pro

205205

Glu Arg Pro Tyr AlaGlu Arg Pro Tyr Ala

210210

Cys Pro Val Glu SerCys Pro Val Glu Ser

215215

Cys Asp Arg Arg Phe 220Cys Asp Arg Arg Phe 220

Arg Ser Asp Asn Leu 225Arg Ser Asp Asn Leu 225

Val Arg His Ile Arg 230Val Arg His Ile Arg 230

Ile His Thr Gly Gln 235Ile His Thr Gly Gln 235

Pro Phe Gln Cys ArgPro Phe Gln Cys Arg

245245

Ile Cys Met Arg AsnIle Cys Met Arg Asn

250250

Phe Ser Arg Glu AspPhe Ser Arg Glu Asp

255255

Leu His Thr His IleLeu His Thr His Ile

260260

Arg Thr His Thr GlyArg Thr His Thr Gly

265265

Glu Lys Pro Phe AlaGlu Lys Pro Phe Ala

270270

Asp Ile Cys Gly Arg 275Asp Ile Cys Gly Arg 275

Lys Phe Ala Arg Ser 280Lys Phe Ala Arg Ser 280

Asp Glu Leu Val Arg 285Asp Glu Leu Val Arg 285

Thr Lys Ile His Leu 290Thr Lys Ile His Leu 290

Arg Gln Lys Asp Arg 295Arg Gln Lys Asp Arg 295

Pro Tyr Ala Cys Pro 300Pro Tyr Ala Cys Pro 300

Glu Ser Cys Asp Arg 305Glu Ser Cys Asp Arg 305

Arg Phe Ser Gln Ser 310Arg Phe Ser Gln Ser 310

Gly Asn Leu Thr Glu 315Gly Asn Leu Thr Glu 315

Ile Arg Ile His ThrIle Arg Ile His Thr

325325

Gly Gln Lys Pro PheGly Gln Lys Pro Phe

330330

Gln Cys Arg Ile CysGln Cys Arg Ile Cys

335335

Arg Asn Phe Ser ThrArg Asn Phe Ser Thr

340340

Ser Gly His Leu ValSer Gly His Leu Val

345345

Arg His Ile Arg ThrArg His Ile Arg Thr

350350

Thr Gly Glu Lys ProThr Gly Glu Lys Pro

355355

Phe Ala Cys Asp Ile 360Phe Ala Cys Asp Ile 360

Cys Gly Arg Lys Phe 365Cys Gly Arg Lys Phe 365

Gln Asn Ser Thr LeuGln Asn Ser Thr Leu

370370

Thr Glu His Thr LysThr Glu His Thr Lys

375375

Ile His Leu Arg GlnIle His Leu Arg Gln

380380

SerSer

ProPro

HisHis

SerSer

Lys 240Lys 240

AsnAsn

CysCys

HisHis

ValVal

His 320His 320

MetMet

HisHis

AlaAla

LysLys

Asp Lys 385 <210> 129 <211> 402 <212> БелокAsp Lys 385 <210> 129 <211> 402 <212> Protein

- 242 046157 <213> Искусственная последовательность <220>- 242 046157 <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 129<223> Description of the artificial sequence polypeptide <400> 129

СинтетическийSynthetic

Met Ala Ala 1Met Ala Ala 1

Asp His Leu 5Asp His Leu 5

Met Leu AlaMet Leu Ala

Glu Gly Tyr 10Glu Gly Tyr 10

Arg Leu Val Gln 15Arg Leu Val Gln 15

Arg Pro ProArg Pro Pro

Ser Ala Ala 20Ser Ala Ala 20

Ala Ala HisAla Ala His

Gly Pro HisGly Pro His

Ala Leu Arg Thr 30Ala Leu Arg Thr 30

Leu Pro ProLeu Pro Pro

Tyr Ala GlyTyr Ala Gly

Pro Gly Leu 40Pro Gly Leu 40

Asp Ser GlyAsp Ser Gly

Leu Arg Pro Arg 45Leu Arg Pro Arg 45

Gly Ala Pro 50Gly Ala Pro 50

Leu Gly ProLeu Gly Pro

Pro Pro Pro 55Pro Pro Pro 55

Arg Gln ProArg Gln Pro

Gly Ala Leu AlaGly Ala Leu Ala

Tyr Gly Ala 65Tyr Gly Ala 65

Phe Gly ProPhe Gly Pro

Pro Ser SerPro Ser Ser

Phe Gln ProPhe Gln Pro

Phe Pro Ala ValPhe Pro Ala Val

Pro Pro ProPro Pro Pro

Ala Ala Gly 85Ala Ala Gly 85

Ile Ala HisIle Ala His

Leu Gln Pro 90Leu Gln Pro 90

Val Ala Thr ProVal Ala Thr Pro

Tyr Pro GlyTyr Pro Gly

Arg Ala Ala 100Arg Ala Ala 100

Ala Pro ProAla Pro Pro

105105

Asn Ala ProAsn Ala Pro

Gly Gly Pro Pro 110Gly Gly Pro Pro 110

Gly Pro GlnGly Pro Gln

115115

Pro Ala ProPro Ala Pro

Ser Ala AlaSer Ala Ala

120120

Ala Pro ProAla Pro Pro

Pro Pro Ala His 125Pro Pro Ala His 125

Ala Leu GlyAla Leu Gly

130130

Gly Met AspGly Met Asp

Ala Glu Leu 135Ala Glu Leu 135

Ile Asp GluIle Asp Glu

140140

Glu Ala Leu ThrGlu Ala Leu Thr

Ser Leu Glu 145Ser Leu Glu 145

Leu Glu LeuLeu Glu Leu

150150

Gly Leu HisGly Leu His

Arg Val ArgArg Val Arg

155155

Glu Leu Pro GluGlu Leu Pro Glu

160160

Leu Phe LeuLeu Phe Leu

Gly Gln SerGly Gln Ser

165165

Glu Phe AspGlu Phe Asp

Cys Phe Ser 170Cys Phe Ser 170

Asp Leu Gly SerAsp Leu Gly Ser

175175

Ala Pro ProAla Pro Pro

Ala Gly Ser 180Ala Gly Ser 180

Val Ser CysVal Ser Cys

185185

Gly Gly SerGly Gly Ser

Gly Gly Gly SerGly Gly Gly Ser

190190

Gly Gly GlyGly Gly Gly

195195

Ser Gly GlySer Gly Gly

Gly Ser GlyGly Ser Gly

200200

Gln Ser GlnGln Ser Gln

Leu Ile Lys Pro 205Leu Ile Lys Pro 205

Ser Arg MetSer Arg Met

210210

Arg Lys TyrArg Lys Tyr

Pro Asn Arg 215Pro Asn Arg 215

Pro Ser LysPro Ser Lys

220220

Thr Pro Pro HisThr Pro Pro His

- 243 046157- 243 046157

Glu Arg Pro 225Glu Arg Pro 225

Arg Ser AspArg Ser Asp

Pro Phe GlnPro Phe Gln

Leu His ThrLeu His Thr

275275

Tyr Ala CysTyr Ala Cys

230230

Pro Val GluPro Val Glu

Ser Cys AspSer Cys Asp

235235

Arg Arg Phe SerArg Arg Phe Ser

240240

Asp IleAsp Ile

290290

Thr Lys 305Thr Lys 305

Glu SerGlu Ser

Ile ArgIle Arg

Arg AsnArg Asn

Thr GlyThr Gly

370370

Gln Asn 385Gln Asn 385

Asp Lys <210>Asp Lys <210>

<211><211>

<212><212>

Asn Leu ValAsn Leu Val

245245

Arg His IleArg His Ile

Arg Ile His 250Arg Ile His 250

Thr Gly Gln LysThr Gly Gln Lys

255255

Cys Arg Ile 260Cys Arg Ile 260

His Ile ArgHis Ile Arg

Cys Met ArgCys Met Arg

265265

Thr His ThrThr His Thr

280280

Asn Phe SerAsn Phe Ser

Gly Glu LysGly Glu Lys

Cys GlyCys Gly

Arg LysArg Lys

Ile HisIle His

Leu ArgLeu Arg

310310

Cys AspCys Asp

Arg Arg 325Arg Arg 325

Ile HisIle His

340340

Thr GlyThr Gly

Phe Ser 355Phe Ser 355

Glu LysGlu Lys

Ser ThrSer Thr

130130

569 Белок569 Protein

Thr SerThr Ser

Pro PhePro Phe

Leu ThrLeu Thr

390390

Phe Ala 295Phe Ala 295

Gln LysGln Lys

Phe SerPhe Ser

Gln LysGln Lys

Gly His 360Gly His 360

Ala Cys 375Ala Cys 375

Glu HisGlu His

Arg SerArg Ser

Asp GluAsp Glu

300300

Asp ArgAsp Arg

Pro Tyr 315Pro Tyr 315

Arg Glu Asp Asn 270Arg Glu Asp Asn 270

Pro Phe Ala Cys 285Pro Phe Ala Cys 285

Leu Val Arg HisLeu Val Arg His

Ala Cys Pro ValAla Cys Pro Val

320320

Gln SerGln Ser

330330

Gly AsnGly Asn

Leu Thr Glu HisLeu Thr Glu His

335335

Pro Phe 345Pro Phe 345

Gln CysGln Cys

Arg Ile Cys MetArg Ile Cys Met

350350

Leu ValLeu Val

Arg HisArg His

Ile Arg Thr His 365Ile Arg Thr His 365

Asp IleAsp Ile

Cys GlyCys Gly

380380

Arg Lys Phe AlaArg Lys Phe Ala

Thr LysThr Lys

Ile HisIle His

395395

Leu Arg Gln LysLeu Arg Gln Lys

400 <213> Искусственная последовательность <220>400 <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид<223> Description of the artificial polypeptide sequence

Синтетический <400> 130Synthetic <400> 130

Met Ala Ala Asp His Leu Met Leu Ala Glu Gly TyrMet Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr

5 105 10

Arg Leu Val Gln 15Arg Leu Val Gln 15

Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro HisArg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His

Ala Leu Arg ThrAla Leu Arg Thr

- 244 046157- 244 046157

Leu Pro Pro Tyr Ala 35Leu Pro Pro Tyr Ala 35

Gly Pro Gly Leu Asp 40Gly Pro Gly Leu Asp 40

Ser Gly Leu Arg Pro 45Ser Gly Leu Arg Pro 45

Gly Ala Pro Leu Gly 50Gly Ala Pro Leu Gly 50

Pro Pro Pro Pro Arg 55Pro Pro Pro Pro Arg 55

Gln Pro Gly Ala Leu 60Gln Pro Gly Ala Leu 60

Tyr Gly Ala Phe Gly 65Tyr Gly Ala Phe Gly 65

Pro Pro Ser Ser Phe 70Pro Pro Ser Ser Phe 70

Gln Pro Phe Pro Ala 75Gln Pro Phe Pro Ala 75

Pro Pro Pro Ala AlaPro Pro Pro Ala Ala

Gly Ile Ala His LeuGly Ile Ala His Leu

Gln Pro Val Ala ThrGln Pro Val Ala Thr

Tyr Pro Gly Arg AlaTyr Pro Gly Arg Ala

100100

Ala Ala Pro Pro AsnAla Ala Pro Pro Asn

105105

Ala Pro Gly Gly ProAla Pro Gly Gly Pro

110110

Gly Pro Gln Pro AlaGly Pro Gln Pro Ala

115115

Pro Ser Ala Ala AlaPro Ser Ala Ala Ala

120120

Pro Pro Pro Pro AlaPro Pro Pro Pro Ala

125125

Ala Leu Gly Gly MetAla Leu Gly Gly Met

130130

Asp Ala Glu Leu Ile 135Asp Ala Glu Leu Ile 135

Asp Glu Glu Ala Leu 140Asp Glu Glu Ala Leu 140

Ser Leu Glu Leu Glu 145Ser Leu Glu Leu Glu 145

Leu Gly Leu His Arg 150Leu Gly Leu His Arg 150

Val Arg Glu Leu Pro 155Val Arg Glu Leu Pro 155

Leu Phe Leu Gly GlnLeu Phe Leu Gly Gln

165165

Ser Glu Phe Asp CysSer Glu Phe Asp Cys

170170

Phe Ser Asp Leu GlyPhe Ser Asp Leu Gly

175175

Ala Pro Pro Ala GlyAla Pro Pro Ala Gly

180180

Ser Val Ser Cys AlaSer Val Ser Cys Ala

185185

Asp His Leu Met LeuAsp His Leu Met Leu

190190

Glu Gly Tyr Arg Leu 195Glu Gly Tyr Arg Leu 195

Val Gln Arg Pro ProVal Gln Arg Pro Pro

200200

Ser Ala Ala Ala AlaSer Ala Ala Ala Ala

205205

Gly Pro His Ala LeuGly Pro His Ala Leu

210210

Arg Thr Leu Pro Pro 215Arg Thr Leu Pro Pro 215

Tyr Ala Gly Pro GlyTyr Ala Gly Pro Gly

220220

Asp Ser Gly Leu Arg 225Asp Ser Gly Leu Arg 225

Pro Arg Gly Ala Pro 230Pro Arg Gly Ala Pro 230

Leu Gly Pro Pro Pro 235Leu Gly Pro Pro Pro 235

Arg Gln Pro Gly AlaArg Gln Pro Gly Ala

245245

Leu Ala Tyr Gly AlaLeu Ala Tyr Gly Ala

250250

Phe Gly Pro Pro SerPhe Gly Pro Pro Ser

255255

Phe Gln Pro Phe ProPhe Gln Pro Phe Pro

260260

Ala Val Pro Pro ProAla Val Pro Pro Pro

265265

Ala Ala Gly Ile AlaAla Ala Gly Ile Ala

270270

ArgArg

AlaAla

Val 80Val 80

ProPro

ProPro

HisHis

ThrThr

Glu 160Glu 160

SerSer

AlaAla

HisHis

LeuLeu

Pro 240Pro 240

SerSer

HisHis

- 245 046157- 245 046157

Leu Gln Pro Val AlaLeu Gln Pro Val Ala

275275

Thr Pro Tyr Pro GlyThr Pro Tyr Pro Gly

280280

Arg Ala Ala Ala Pro 285Arg Ala Ala Ala Pro 285

Asn Ala Pro Gly GlyAsn Ala Pro Gly Gly

290290

Pro Pro Gly Pro GlnPro Pro Gly Pro Gln

295295

Pro Ala Pro Ser AlaPro Ala Pro Ser Ala

300300

Ala Pro Pro Pro Pro 305Ala Pro Pro Pro Pro 305

Ala His Ala Leu Gly 310Ala His Ala Leu Gly 310

Gly Met Asp Ala Glu 315Gly Met Asp Ala Glu 315

Ile Asp Glu Glu AlaIle Asp Glu Glu Ala

325325

Leu Thr Ser Leu GluLeu Thr Ser Leu Glu

330330

Leu Glu Leu Gly LeuLeu Glu Leu Gly Leu

335335

Arg Val Arg Glu LeuArg Val Arg Glu Leu

340340

Pro Glu Leu Phe LeuPro Glu Leu Phe Leu

345345

Gly Gln Ser Glu PheGly Gln Ser Glu Phe

350350

Cys Phe Ser Asp LeuCys Phe Ser Asp Leu

355355

Gly Ser Ala Pro Pro 360Gly Ser Ala Pro Pro 360

Ala Gly Ser Val Ser 365Ala Gly Ser Val Ser 365

Gln Ser Gln Leu IleGln Ser Gln Leu Ile

370370

Lys Pro Ser Arg MetLys Pro Ser Arg Met

375375

Arg Lys Tyr Pro AsnArg Lys Tyr Pro Asn

380380

Pro Ser Lys Thr Pro 385Pro Ser Lys Thr Pro 385

Pro His Glu Arg Pro 390Pro His Glu Arg Pro 390

Tyr Ala Cys Pro Val 395Tyr Ala Cys Pro Val 395

Ser Cys Asp Arg ArgSer Cys Asp Arg Arg

405405

Phe Ser Arg Ser AspPhe Ser Arg Ser Asp

410410

Asn Leu Val Arg HisAsn Leu Val Arg His

415415

Arg Ile His Thr GlyArg Ile His Thr Gly

420420

Gln Lys Pro Phe GlnGln Lys Pro Phe Gln

425425

Cys Arg Ile Cys MetCys Arg Ile Cys Met

430430

Asn Phe Ser Arg Glu 435Asn Phe Ser Arg Glu 435

Asp Asn Leu His Thr 440Asp Asn Leu His Thr 440

His Ile Arg Thr His 445His Ile Arg Thr His 445

Gly Glu Lys Pro PheGly Glu Lys Pro Phe

450450

Ala Cys Asp Ile Cys 455Ala Cys Asp Ile Cys 455

Gly Arg Lys Phe AlaGly Arg Lys Phe Ala

460460

Ser Asp Glu Leu Val 465Ser Asp Glu Leu Val 465

Arg His Thr Lys Ile 470Arg His Thr Lys Ile 470

His Leu Arg Gln Lys 475His Leu Arg Gln Lys 475

Arg Pro Tyr Ala CysArg Pro Tyr Ala Cys

485485

Pro Val Glu Ser CysPro Val Glu Ser Cys

490490

Asp Arg Arg Phe SerAsp Arg Arg Phe Ser

495495

Ser Gly Asn Leu ThrSer Gly Asn Leu Thr

500500

Glu His Ile Arg IleGlu His Ile Arg Ile

505505

His Thr Gly Gln LysHis Thr Gly Gln Lys

510510

Phe Gln Cys Arg Ile 515Phe Gln Cys Arg Ile 515

Cys Met Arg Asn PheCys Met Arg Asn Phe

520520

Ser Thr Ser Gly HisSer Thr Ser Gly His

525525

ProPro

AlaAla

Leu 320Leu 320

HisHis

AspAsp

CysCys

ArgArg

Glu 400Glu 400

IleIle

ArgArg

ThrThr

ArgArg

Asp 480Asp 480

GlnGln

ProPro

LeuLeu

- 246 046157- 246 046157

Val Arg His Ile Arg Thr His ThrVal Arg His Ile Arg Thr His Thr

530 535530 535

Gly Glu LysGly Glu Lys

Pro Phe Ala Cys Asp 540Pro Phe Ala Cys Asp 540

Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr Glu His ThrIle Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr Glu His Thr

545 550 555 560545 550 555 560

Lys Ile His Leu Arg Gln Lys Asp LysLys Ile His Leu Arg Gln Lys Asp Lys

565 <210> 131 <211> 585 <212> Белок <213> Искусственная последовательность <220>565 <210> 131 <211> 585 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 131<223> Description of artificial sequence: Synthetic polypeptide <400> 131

Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val GlnMet Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln

5 10155 1015

Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr 20 2530Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr 20 2530

Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg 35 4045Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg 35 4045

Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala 50 5560Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala 50 5560

Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val 65 70 7580Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val 65 70 7580

Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro 85 9095Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro 85 9095

Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro ProTyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro

100 105110100 105110

Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala HisGly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His

115 120125115 120125

Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu ThrAla Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr

130 135140130 135140

Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro GluSer Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu

145 150 155160145 150 155160

- 247 046157- 247 046157

Leu Phe Leu Gly GlnLeu Phe Leu Gly Gln

165165

Ser Glu Phe Asp CysSer Glu Phe Asp Cys

170170

Phe Ser Asp Leu GlyPhe Ser Asp Leu Gly

175175

Ala Pro Pro Ala GlyAla Pro Pro Ala Gly

180180

Ser Val Ser Cys GlySer Val Ser Cys Gly

185185

Gly Ser Gly Gly GlyGly Ser Gly Gly Gly

190190

Gly Ala Asp His LeuGly Ala Asp His Leu

195195

Met Leu Ala Glu Gly 200Met Leu Ala Glu Gly 200

Tyr Arg Leu Val Gln 205Tyr Arg Leu Val Gln 205

Pro Pro Ser Ala AlaPro Pro Ser Ala Ala

210210

Ala Ala His Gly Pro 215Ala Ala His Gly Pro 215

His Ala Leu Arg ThrHis Ala Leu Arg Thr

220220

Pro Pro Tyr Ala Gly 225Pro Pro Tyr Ala Gly 225

Pro Gly Leu Asp Ser 230Pro Gly Leu Asp Ser 230

Gly Leu Arg Pro Arg 235Gly Leu Arg Pro Arg 235

Ala Pro Leu Gly ProAla Pro Leu Gly Pro

245245

Pro Pro Pro Arg GlnPro Pro Pro Arg Gln

250250

Pro Gly Ala Leu AlaPro Gly Ala Leu Ala

255255

Gly Ala Phe Gly ProGly Ala Phe Gly Pro

260260

Pro Ser Ser Phe GlnPro Ser Ser Phe Gln

265265

Pro Phe Pro Ala ValPro Phe Pro Ala Val

270270

Pro Pro Ala Ala GlyPro Pro Ala Ala Gly

275275

Ile Ala His Leu GlnIle Ala His Leu Gln

280280

Pro Val Ala Thr ProPro Val Ala Thr Pro

285285

Pro Gly Arg Ala Ala 290Pro Gly Arg Ala Ala 290

Ala Pro Pro Asn AlaAla Pro Pro Asn Ala

295295

Pro Gly Gly Pro Pro 300Pro Gly Gly Pro Pro 300

Pro Gln Pro Ala Pro 305Pro Gln Pro Ala Pro 305

Ser Ala Ala Ala Pro 310Ser Ala Ala Ala Pro 310

Pro Pro Pro Ala His 315Pro Pro Pro Ala His 315

Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu ThrLeu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr

325 330 335325 330 335

Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro GluLeu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu

340 345 350340 345 350

Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly SerPhe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser

355 360 365355 360 365

Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly SerPro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser

370 375 380370 375 380

Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro AsnGln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn

385 390 395385 390 395

Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro ValPro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro Val

405 410 415405 410 415

SerSer

SerSer

ArgArg

LeuLeu

Gly 240Gly 240

TyrTyr

ProPro

TyrTyr

GlyGly

Ala 320Ala 320

SerSer

LeuLeu

AlaAla

GlyGly

Arg 400Arg 400

GluGlu

- 248 046157- 248 046157

Ser Cys AspSer Cys Asp

Arg Arg Phe 420Arg Arg Phe 420

Ser Arg SerSer Arg Ser

425425

Asp Asn LeuAsp Asn Leu

Val Arg His IleVal Arg His Ile

430430

Arg Ile HisArg Ile His

435435

Thr Gly GlnThr Gly Gln

Lys Pro PheLys Pro Phe

440440

Gln Cys ArgGln Cys Arg

Ile Cys Met Arg 445Ile Cys Met Arg 445

Asn Phe SerAsn Phe Ser

450450

Arg Glu AspArg Glu Asp

Asn Leu His 455Asn Leu His 455

Thr His IleThr His Ile

460460

Arg Thr His ThrArg Thr His Thr

Gly Glu Lys 465Gly Glu Lys 465

Pro Phe AlaPro Phe Ala

470470

Cys Asp IleCys Asp Ile

Cys Gly ArgCys Gly Arg

475475

Lys Phe Ala ArgLys Phe Ala Arg

480480

Ser Asp GluSer Asp Glu

Leu Val ArgLeu Val Arg

485485

His Thr LysHis Thr Lys

Ile His Leu 490Ile His Leu 490

Arg Gln Lys AspArg Gln Lys Asp

495495

Arg Pro TyrArg Pro Tyr

Ala Cys Pro 500Ala Cys Pro 500

Val Glu SerVal Glu Ser

505505

Cys Asp ArgCys Asp Arg

Arg Phe Ser GlnArg Phe Ser Gln

510510

Ser Gly AsnSer Gly Asn

515515

Leu Thr GluLeu Thr Glu

His Ile ArgHis Ile Arg

520520

Ile His ThrIle His Thr

Gly Gln Lys Pro 525Gly Gln Lys Pro 525

Phe Gln CysPhe Gln Cys

530530

Arg Ile CysArg Ile Cys

Met Arg Asn 535Met Arg Asn 535

Phe Ser ThrPhe Ser Thr

540540

Ser Gly His LeuSer Gly His Leu

Val Arg His 545Val Arg His 545

Ile Arg ThrIle Arg Thr

550550

His Thr GlyHis Thr Gly

Glu Lys Pro 555Glu Lys Pro 555

Phe Ala Cys AspPhe Ala Cys Asp

560560

Ile Cys GlyIle Cys Gly

Arg Lys PheArg Lys Phe

565565

Ala Gln AsnAla Gln Asn

Ser Thr Leu 570Ser Thr Leu 570

Thr Glu His ThrThr Glu His Thr

575575

Lys Ile HisLys Ile His

Leu Arg Gln 580Leu Arg Gln 580

Lys Asp LysLys Asp Lys

585 <210> 132 <211> 523 <212> Белок <213> Искусственная последовательность <220>585 <210> 132 <211> 523 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид<223> Description of the artificial polypeptide sequence

Синтетический <400> 132Synthetic <400> 132

Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu GlyAsp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly

5 105 10

Ser Asp Ala Leu 15Ser Asp Ala Leu 15

Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala 20 25Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala 20 25

Leu Asp Asp Phe 30Leu Asp Asp Phe 30

- 249 046157- 249 046157

AspAsp

MetMet

Val 65Val 65

GluGlu

SerSer

AlaAla

ProPro

Pro 145Pro 145

AlaAla

AlaAla

ValVal

ProPro

Gln 225Gln 225

ProPro

GlnGln

MetMet

Leu Asp MetLeu Asp Met

Leu Gly Ser AspLeu Gly Ser Asp

Ala Leu Asp Asp Phe Asp Leu Asp 45Ala Leu Asp Asp Phe Asp Leu Asp 45

Leu Ile Asn Ser Arg Ser Ser Gly Ser Pro Lys Lys Lys Arg Lys 50 55 60Leu Ile Asn Ser Arg Ser Ser Gly Ser Pro Lys Lys Lys Arg Lys 50 55 60

Gly Ser GlnGly Ser Gln

TyrTyr

Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu 70 75 80Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu 70 75 80

Lys Arg Lys Arg Thr 85Lys Arg Lys Arg Thr 85

Pro Phe Ser Gly ProPro Phe Ser Gly Pro

100100

Val Pro Ser Arg Ser 115Val Pro Ser Arg Ser 115

Tyr Pro Phe Thr Ser 130Tyr Pro Phe Thr Ser 130

Thr Met Val Phe ProThr Met Val Phe Pro

150150

Pro Ala Pro Pro GlnPro Ala Pro Pro Gln

165165

Pro Ala Met Val SerPro Ala Met Val Ser

180180

Leu Ala Pro Gly ProLeu Ala Pro Gly Pro

195195

Thr Gln Ala Gly Glu 210Thr Gln Ala Gly Glu 210

Phe Asp Asp Glu AspPhe Asp Asp Glu Asp

230230

Ala Val Phe Thr AspAla Val Phe Thr Asp

245245

Leu Leu Asn Gln Gly 260Leu Leu Asn Gln Gly 260

Leu Met Glu Tyr ProLeu Met Glu Tyr Pro

275275

Tyr Glu Thr Phe LysTyr Glu Thr Phe Lys

Thr Asp Pro Arg ProThr Asp Pro Arg Pro

105105

Ser Ala Ser Val ProSer Ala Ser Val Pro

120120

Ser Leu Ser Thr Ile 135Ser Leu Ser Thr Ile 135

Ser Gly Gln Ile SerSer Gly Gln Ile Ser

155155

Val Leu Pro Gln AlaVal Leu Pro Gln Ala

170170

Ala Leu Ala Gln AlaAla Leu Ala Gln Ala

185185

Pro Gln Ala Val AlaPro Gln Ala Val Ala

200200

Gly Thr Leu Ser Glu 215Gly Thr Leu Ser Glu 215

Leu Gly Ala Leu LeuLeu Gly Ala Leu Leu

235235

Leu Ala Ser Val AspLeu Ala Ser Val Asp

250250

Ile Pro Val Ala ProIle Pro Val Ala Pro

265265

Glu Ala Ile Thr ArgGlu Ala Ile Thr Arg

280280

Ser Ile Met Lys LysSer Ile Met Lys Lys

Pro Pro Arg Arg IlePro Pro Arg Arg Ile

110110

Lys Pro Ala Pro GlnLys Pro Ala Pro Gln

125125

Asn Tyr Asp Glu Phe 140Asn Tyr Asp Glu Phe 140

Gln Ala Ser Ala LeuGln Ala Ser Ala Leu

160160

Pro Ala Pro Ala ProPro Ala Pro Ala Pro

175175

Pro Ala Pro Val ProPro Ala Pro Val Pro

190190

Pro Pro Ala Pro Lys 205Pro Pro Ala Pro Lys 205

Ala Leu Leu Gln Leu 220Ala Leu Leu Gln Leu 220

Gly Asn Ser Thr AspGly Asn Ser Thr Asp

240240

Asn Ser Glu Phe GlnAsn Ser Glu Phe Gln

255255

His Thr Thr Glu ProHis Thr Thr Glu Pro

270270

Leu Val Thr Gly AlaLeu Val Thr Gly Ala

285285

- 250 046157- 250 046157

Gln Arg Pro Pro AspGln Arg Pro Pro Asp

290290

Pro Ala Pro Ala ProPro Ala Pro Ala Pro

295295

Leu Gly Ala Pro Gly 300Leu Gly Ala Pro Gly 300

Pro Asn Gly Leu Leu 305Pro Asn Gly Leu Leu 305

Ser Gly Asp Glu Asp 310Ser Gly Asp Glu Asp 310

Phe Ser Ser Ile Ala 315Phe Ser Ser Ile Ala 315

Met Asp Phe Ser AlaMet Asp Phe Ser Ala

325325

Leu Leu Gly Ser GlyLeu Leu Gly Ser Gly

330330

Ser Gly Ser Arg AspSer Gly Ser Arg Asp

335335

Arg Glu Gly Met PheArg Glu Gly Met Phe

340340

Leu Pro Lys Pro GluLeu Pro Lys Pro Glu

345345

Ala Gly Ser Ala IleAla Gly Ser Ala Ile

350350

Asp Val Phe Glu Gly 355Asp Val Phe Glu Gly 355

Arg Glu Val Cys Gln 360Arg Glu Val Cys Gln 360

Pro Lys Arg Ile Arg 365Pro Lys Arg Ile Arg 365

Phe His Pro Pro GlyPhe His Pro Pro Gly

370370

Ser Pro Trp Ala AsnSer Pro Trp Ala Asn

375375

Arg Pro Leu Pro Ala 380Arg Pro Leu Pro Ala 380

Leu Ala Pro Thr Pro 385Leu Ala Pro Thr Pro 385

Thr Gly Pro Val His 390Thr Gly Pro Val His 390

Glu Pro Val Gly Ser 395Glu Pro Val Gly Ser 395

Thr Pro Ala Pro ValThr Pro Ala Pro Val

405405

Pro Gln Pro Leu AspPro Gln Pro Leu Asp

410410

Pro Ala Pro Ala ValPro Ala Pro Ala Val

415415

Pro Glu Ala Ser HisPro Glu Ala Ser His

420420

Leu Leu Glu Asp ProLeu Leu Glu Asp Pro

425425

Asp Glu Glu Thr SerAsp Glu Glu Thr Ser

430430

Ala Val Lys Ala Leu 435Ala Val Lys Ala Leu 435

Arg Glu Met Ala Asp 440Arg Glu Met Ala Asp 440

Thr Val Ile Pro GlnThr Val Ile Pro Gln

445445

Glu Glu Ala Ala IleGlu Glu Ala Ala Ile

450450

Cys Gly Gln Met AspCys Gly Gln Met Asp

455455

Leu Ser His Pro ProLeu Ser His Pro Pro

460460

Arg Gly His Leu Asp 465Arg Gly His Leu Asp 465

Glu Leu Thr Thr Thr 470Glu Leu Thr Thr Thr 470

Leu Glu Ser Met Thr 475Leu Glu Ser Met Thr 475

Asp Leu Asn Leu AspAsp Leu Asn Leu Asp

485485

Ser Pro Leu Thr ProSer Pro Leu Thr Pro

490490

Glu Leu Asn Glu IleGlu Leu Asn Glu Ile

495495

Asp Thr Phe Leu AsnAsp Thr Phe Leu Asn

500500

Asp Glu Cys Leu LeuAsp Glu Cys Leu Leu

505505

His Ala Met His IleHis Ala Met His Ile

510510

LeuLeu

Asp 320Asp 320

SerSer

SerSer

ProPro

SerSer

Leu 400Leu 400

ThrThr

GlnGln

LysLys

ProPro

Glu 480Glu 480

LeuLeu

SerSer

Thr Gly Leu Ser Ile 515Thr Gly Leu Ser Ile 515

Phe Asp Thr Ser Leu 520Phe Asp Thr Ser Leu 520

Phe <210> 133 <211> 50Phe <210> 133 <211> 50

- 251 046157 <212> Белок <213> Искусственная последовательность <220>- 251 046157 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 133<223> Description of the artificial sequence polypeptide <400> 133

Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu GlyAsp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly

510510

Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala 2025Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala 2025

Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp 3540Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp 3540

СинтетическийSynthetic

Ser Asp Ala Leu 15Ser Asp Ala Leu 15

Leu Asp Asp Phe 30Leu Asp Asp Phe 30

Phe Asp Leu Asp 45Phe Asp Leu Asp 45

Met Leu <210> 134 <211> 275 <212> Белок <213> Искусственная последовательность <220>Met Leu <210> 134 <211> 275 <212> Protein <213> Artificial Sequence <220>

<223> Описание искусственной последовательности полипептид <400> 134<223> Description of the artificial sequence polypeptide <400> 134

СинтетическийSynthetic

Met Ser Gly 1Met Ser Gly 1

Arg Phe ProArg Phe Pro

Met Gly Met 35Met Gly Met 35

Pro Gln His 50Pro Gln His 50

Ala Gly Asn 65Ala Gly Asn 65

Gly Thr ValGly Thr Val

Leu Glu MetLeu Glu Met

Asp Gly Thr 20Asp Gly Thr 20

Gly Gln PheGly Gln Phe

Ala Phe AsnAla Phe Asn

Met Asn AlaMet Asn Ala

Asn Gly Gly 85Asn Gly Gly 85

Arg Phe AsnArg Phe Asn

Asn Ser Gln 100Asn Ser Gln 100

Gly Ser LeuGly Ser Leu

Pro Ala SerPro Ala Ser

Ala Asp HisAla Asp His

Asn Gly Leu 25Asn Gly Leu 25

Pro Ser Pro 40Pro Ser Pro 40

Ala Leu Met 55Ala Leu Met 55

Thr Ser GlyThr Ser Gly

His Pro ProHis Pro Pro

Phe Met GlyPhe Met Gly

105105

Met Gln LeuMet Gln Leu

Met Met Ala 10Met Met Ala 10

His His HisHis His His

His His HisHis His His

Gly Glu His 60Gly Glu His 60

Ile Arg His 75Ile Arg His 75

Ser Ala Leu 90Ser Ala Leu 90

Pro Pro ValPro Pro Val

Gln Lys LeuGln Lys Leu

Met Asn His Gly 15Met Asn His Gly 15

Pro Ala His Arg 30Pro Ala His Arg 30

Gln Gln Gln Gln 45Gln Gln Gln Gln 45

Ile His Tyr GlyIle His Tyr Gly

Ala Met Gly Pro 80Ala Met Gly Pro 80

Ala Pro Ala AlaAla Pro Ala Ala

Ala Ser Gln Gly 110Ala Ser Gln Gly 110

Asn Asn Gln TyrAsn Asn Gln Tyr

- 252 046157- 252 046157

115 120125115 120125

Phe Asn His His Pro Tyr Pro His Asn His Tyr Met Pro Asp Leu HisPhe Asn His Pro Tyr Pro His Asn His Tyr Met Pro Asp Leu His

130 135140130 135140

Pro Ala Ala Gly His Gln Met Asn Gly Thr Asn Gln His Phe Arg AspPro Ala Ala Gly His Gln Met Asn Gly Thr Asn Gln His Phe Arg Asp

145 150 155160145 150 155160

Cys Asn Pro Lys His Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser GlyCys Asn Pro Lys His Ser Gly Gly Ser Ser Thr Pro Gly Gly Ser Gly

165 170175165 170175

Gly Ser Ser Thr Pro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly AlaGly Ser Ser Thr Pro Gly Gly Ser Gly Ser Ser Ser Gly Gly Gly Ala

180 185190180 185190

Gly Ser Ser Asn Ser Gly Gly Gly Ser Gly Ser Gly Asn Met Pro AlaGly Ser Ser Asn Ser Gly Gly Gly Ser Gly Ser Gly Asn Met Pro Ala

195 200205195 200205

Ser Val Ala His Val Pro Ala Ala Met Leu Pro Pro Asn Val Ile AspSer Val Ala His Val Pro Ala Ala Met Leu Pro Pro Asn Val Ile Asp

210 215220210 215220

Thr Asp Phe Ile Asp Glu Glu Val Leu Met Ser Leu Val Ile Glu MetThr Asp Phe Ile Asp Glu Glu Val Leu Met Ser Leu Val Ile Glu Met

225 230 235240225 230 235240

Gly Leu Asp Arg Ile Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln AsnGly Leu Asp Arg Ile Lys Glu Leu Pro Glu Leu Trp Leu Gly Gln Asn

245 250255245 250255

Glu Phe Asp Phe Met Thr Asp Phe Val Cys Lys Gln Gln Pro Ser ArgGlu Phe Asp Phe Met Thr Asp Phe Val Cys Lys Gln Gln Pro Ser Arg

260 265270260 265270

Val Ser CysVal Ser Cys

275 <210> 135 <211> 183 <212> Белок <213>275 <210> 135 <211> 183 <212> Protein <213>

Искусственная последовательность <220>Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 135<223> Description of artificial sequence: Synthetic polypeptide <400> 135

Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln Arg ProAla Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln Arg Pro

5 10155 1015

Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr LeuProPro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr LeuPro

25302530

Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg Gly Ala 35 4045Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg Gly Ala 35 4045

- 253 046157- 253 046157

Pro LeuProLeu

Gly ProGly Pro

Pro ProPro Pro

Ala Phe 65Ala Phe 65

Gly ProGly Pro

Pro SerPro Ser

Pro AlaPro Ala

Ala GlyAla Gly

Ile Ala 85Ile Ala 85

Gly ArgGly Arg

Ala AlaAla Ala

100100

Ala ProAla Pro

Gln ProGlin Pro

Ala Pro 115Ala Pro 115

Ser AlaSer Ala

Gly GlyGly Gly

130130

Met AspMet Asp

Ala GluAla Glu

Glu Leu 145Glu Leu 145

Glu LeuGlu Leu

Gly LeuGly Leu

150150

Leu GlyLeu Gly

Gln SerGln Ser

Glu Phe 165Glu Phe 165

Pro AlaPro Ala

Gly SerGly Ser

180180

Val SerVal Ser

Pro Arg 55Pro Arg 55

Ser PheSer Phe

His LeuHis Leu

Pro AsnPro Asn

Ala AlaAla Ala

120120

Leu Ile 135Leu Ile 135

His ArgHis Arg

Asp CysAsp Cys

CysCys

Gln ProGlin Pro

Gln ProGlin Pro

Gln ProGlin Pro

Ala Pro 105Ala Pro 105

Pro ProPro Pro

Asp GluAsp Glu

Val ArgVal Arg

Phe SerPhe Ser

170170

Gly Ala 60Gly Ala 60

Phe Pro 75Phe Pro 75

Val AlaVal Ala

Gly GlyGly Gly

Pro ProPro Pro

Glu AlaGlu Ala

140140

Glu Leu 155Glu Leu 155

Asp LeuAsp Leu

Leu Ala Tyr GlyLeu Ala Tyr Gly

Ala Val Pro ProAla Val Pro Pro

Thr Pro Tyr Pro 95Thr Pro Tyr Pro 95

Pro Pro Gly ProPro Pro Gly Pro

110110

Ala His Ala Leu 125Ala His Ala Leu 125

Leu Thr Ser LeuLeu Thr Ser Leu

Pro Glu Leu PhePro Glu Leu Phe

160160

Gly Ser Ala ProGly Ser Ala Pro

175 <210> 136 <211> 7 <212> Белок <213> Искусственная последовательность <220>175 <210> 136 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности<223> Description of the artificial sequence

Синтетический пептид <220>Synthetic peptide <220>

<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220><221> MOD_RES <222> (2)..(2) <223> Any amino acid <220>

<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220><221> MOD_RES <222> (4)..(4) <223> Any amino acid <220>

<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота<221> MOD_RES <222> (6)..(6) <223> Any amino acid

- 254 046157 <400> 136- 254 046157 <400> 136

Cys Xaa Cys Xaa His Xaa His 1 5 <210> 137 <211> 17 <212> Белок <213> Искусственная последовательность <220>Cys Xaa Cys Xaa His Xaa His 1 5 <210> 137 <211> 17 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <220><223> Description of artificial sequence: Synthetic peptide <220>

<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220><221> MOD_RES <222> (2)..(2) <223> Any amino acid <220>

<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220><221> MOD_RES <222> (4)..(4) <223> Any amino acid <220>

<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220><221> MOD_RES <222> (6)..(6) <223> Any amino acid <220>

<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220><221> MOD_RES <222> (8)..(10) <223> Any amino acid <220>

<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220><221> MOD_RES <222> (12)..(12) <223> Any amino acid <220>

<221> MOD_RES <222> (14)..(14) <223> Любая аминокислота <220><221> MOD_RES <222> (14)..(14) <223> Any amino acid <220>

<221> MOD_RES <222> (16)..(16) <223> Любая аминокислота <400> 137<221> MOD_RES <222> (16)..(16) <223> Any amino acid <400> 137

Cys Xaa Cys Xaa Cys Xaa His Xaa Xaa Xaa Cys Xaa Cys Xaa Cys XaaCys Xaa Cys Xaa Cys Xaa His Xaa Xaa Xaa Cys Xaa Cys Xaa Cys Xaa

5 10 155 10 15

Cys <210> 138 <211> 17 <212> Белок <213> Искусственная последовательностьCys <210> 138 <211> 17 <212> Protein <213> Artificial sequence

- 255 046157 <220>- 255 046157 <220>

<223> Описание искусственной последовательности: Синтетический пептид <220><223> Description of artificial sequence: Synthetic peptide <220>

<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220><221> MOD_RES <222> (2)..(2) <223> Any amino acid <220>

<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220><221> MOD_RES <222> (4)..(4) <223> Any amino acid <220>

<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220><221> MOD_RES <222> (6)..(6) <223> Any amino acid <220>

<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220><221> MOD_RES <222> (8)..(10) <223> Any amino acid <220>

<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220><221> MOD_RES <222> (12)..(12) <223> Any amino acid <220>

<221> MOD_RES <222> (14)..(14) <223> Любая аминокислота <220><221> MOD_RES <222> (14)..(14) <223> Any amino acid <220>

<221> MOD_RES <222> (16)..(16) <223> Любая аминокислота <400> 138<221> MOD_RES <222> (16)..(16) <223> Any amino acid <400> 138

Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa His Xaa Cys Xaa Cys XaaCys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa His Xaa Cys Xaa Cys Xaa

5 10 155 10 15

Cys <210> 139 <211> 15 <212> Белок <213> Искусственная последовательность <220>Cys <210> 139 <211> 15 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <220><223> Description of artificial sequence: Synthetic peptide <220>

<221> MOD_RES <222> (2)..(2)<221> MOD_RES <222> (2)..(2)

- 256 046157 <223> Любая аминокислота <220>- 256 046157 <223> Any amino acid <220>

<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220><221> MOD_RES <222> (4)..(4) <223> Any amino acid <220>

<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220><221> MOD_RES <222> (6)..(6) <223> Any amino acid <220>

<221> MOD_RES <222> (8)..(8) <223> Любая аминокислота <220><221> MOD_RES <222> (8)..(8) <223> Any amino acid <220>

<221> MOD_RES <222> (10)..(10) <223> Любая аминокислота <220><221> MOD_RES <222> (10)..(10) <223> Any amino acid <220>

<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220><221> MOD_RES <222> (12)..(12) <223> Any amino acid <220>

<221> MOD_RES <222> (14)..(14) <223> Любая аминокислота <220><221> MOD_RES <222> (14)..(14) <223> Any amino acid <220>

<221> MOD_RES <222> (15) . . (15) <223> Cys, His, or Asp <400> 139<221> MOD_RES <222> (15) . . (15) <223> Cys, His, or Asp <400> 139

Cys Xaa Cys Xaa His Xaa Cys Xaa Cys Xaa Cys Xaa Cys Xaa XaaCys Xaa Cys Xaa His Xaa Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa

5 10 15 <210> 140 <211> 17 <212> Белок <213> Искусственная последовательность <220>5 10 15 <210> 140 <211> 17 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <220><223> Description of artificial sequence: Synthetic peptide <220>

<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220><221> MOD_RES <222> (2)..(2) <223> Any amino acid <220>

<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220><221> MOD_RES <222> (4)..(4) <223> Any amino acid <220>

- 257 046157 <221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220>- 257 046157 <221> MOD_RES <222> (6)..(6) <223> Any amino acid <220>

<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220><221> MOD_RES <222> (8)..(10) <223> Any amino acid <220>

<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220><221> MOD_RES <222> (12)..(12) <223> Any amino acid <220>

<221> MOD_RES <222> (14) .. (14) <223> Любая аминокислота <220><221> MOD_RES <222> (14) .. (14) <223> Any amino acid <220>

<221> MOD_RES <222> (16)..(16) <223> Любая аминокислота <400> 140<221> MOD_RES <222> (16)..(16) <223> Any amino acid <400> 140

Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa Cys Xaa Cys Xaa Cys XaaCys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa Cys Xaa Cys Xaa Cys Xaa

5 10 155 10 15

Cys <210> 141 <211> 7 <212> Белок <213> Искусственная последовательность <220>Cys <210> 141 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <220><223> Description of artificial sequence: Synthetic peptide <220>

<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220><221> MOD_RES <222> (2)..(2) <223> Any amino acid <220>

<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220><221> MOD_RES <222> (4)..(4) <223> Any amino acid <220>

<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <400> 141<221> MOD_RES <222> (6)..(6) <223> Any amino acid <400> 141

Cys Xaa Cys Xaa Cys Xaa His 1 5Cys Xaa Cys Xaa Cys Xaa His 1 5

- 258 046157 <210> 142 <211> 7 <212> Белок <213> Искусственная последовательность <220>- 258 046157 <210> 142 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <220><223> Description of artificial sequence: Synthetic peptide <220>

<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220><221> MOD_RES <222> (2)..(2) <223> Any amino acid <220>

<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220><221> MOD_RES <222> (4)..(4) <223> Any amino acid <220>

<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <400> 142<221> MOD_RES <222> (6)..(6) <223> Any amino acid <400> 142

Cys Xaa Cys Xaa His Xaa Cys 1 5 <210> 143 <211> 17 <212> Белок <213> Искусственная последовательность <220>Cys Xaa Cys Xaa His Xaa Cys 1 5 <210> 143 <211> 17 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <220><223> Description of artificial sequence: Synthetic peptide <220>

<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220><221> MOD_RES <222> (2)..(2) <223> Any amino acid <220>

<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220><221> MOD_RES <222> (4)..(4) <223> Any amino acid <220>

<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220><221> MOD_RES <222> (6)..(6) <223> Any amino acid <220>

<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220><221> MOD_RES <222> (8)..(10) <223> Any amino acid <220>

<221> MOD_RES <222> (12)..(12)<221> MOD_RES <222> (12)..(12)

- 259 046157 <223> Любая аминокислота <220>- 259 046157 <223> Any amino acid <220>

<221> MOD_RES <222> (14) .. (14) <223> Любая аминокислота <220><221> MOD_RES <222> (14) .. (14) <223> Any amino acid <220>

<221> MOD_RES <222> (16)..(16) <223> Любая аминокислота <400> 143<221> MOD_RES <222> (16)..(16) <223> Any amino acid <400> 143

Cys Xaa Cys Xaa His Xaa Cys Xaa Xaa Xaa Cys Xaa Cys Xaa His XaaCys Xaa Cys Xaa His Xaa Cys Xaa Xaa Xaa Cys Xaa Cys Xaa His Xaa

5 10 155 10 15

Cys <210> 144 <211> 17 <212> Белок <213> Искусственная последовательность <220>Cys <210> 144 <211> 17 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <220><223> Description of artificial sequence: Synthetic peptide <220>

<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220><221> MOD_RES <222> (2)..(2) <223> Any amino acid <220>

<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220><221> MOD_RES <222> (4)..(4) <223> Any amino acid <220>

<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220><221> MOD_RES <222> (6)..(6) <223> Any amino acid <220>

<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220><221> MOD_RES <222> (8)..(10) <223> Any amino acid <220>

<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220><221> MOD_RES <222> (12)..(12) <223> Any amino acid <220>

<221> MOD_RES <222> (14)..(14) <223> Любая аминокислота <220><221> MOD_RES <222> (14)..(14) <223> Any amino acid <220>

<221> MOD_RES<221> MOD_RES

- 260 046157 <222> (16)..(16) <223> Любая аминокислота <400> 144- 260 046157 <222> (16)..(16) <223> Any amino acid <400> 144

Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa Cys Xaa Cys Xaa His XaaCys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa Cys Xaa Cys Xaa His Xaa

5 10 155 10 15

Cys <210> 145 <211> 7 <212> Белок <213> Искусственная последовательность <220>Cys <210> 145 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <220><223> Description of artificial sequence: Synthetic peptide <220>

<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220><221> MOD_RES <222> (2)..(2) <223> Any amino acid <220>

<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220><221> MOD_RES <222> (4)..(4) <223> Any amino acid <220>

<221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <400> 145<221> MOD_RES <222> (6)..(6) <223> Any amino acid <400> 145

Cys Xaa Cys Xaa Cys Xaa Cys 1 5 <210> 146 <211> 17 <212> Белок <213> Искусственная последовательность <220>Cys Xaa Cys Xaa Cys Xaa Cys 1 5 <210> 146 <211> 17 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <220><223> Description of artificial sequence: Synthetic peptide <220>

<221> MOD_RES <222> (2)..(2) <223> Любая аминокислота <220><221> MOD_RES <222> (2)..(2) <223> Any amino acid <220>

<221> MOD_RES <222> (4)..(4) <223> Любая аминокислота <220><221> MOD_RES <222> (4)..(4) <223> Any amino acid <220>

- 261 046157 <221> MOD_RES <222> (6)..(6) <223> Любая аминокислота <220>- 261 046157 <221> MOD_RES <222> (6)..(6) <223> Any amino acid <220>

<221> MOD_RES <222> (8)..(10) <223> Любая аминокислота <220><221> MOD_RES <222> (8)..(10) <223> Any amino acid <220>

<221> MOD_RES <222> (12)..(12) <223> Любая аминокислота <220><221> MOD_RES <222> (12)..(12) <223> Any amino acid <220>

<221> MOD_RES <222> (14) .. (14) <223> Любая аминокислота <220><221> MOD_RES <222> (14) .. (14) <223> Any amino acid <220>

<221> MOD_RES <222> (16)..(16) <223> Любая аминокислота <400> 146<221> MOD_RES <222> (16)..(16) <223> Any amino acid <400> 146

Cys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa Cys Xaa His Xaa His XaaCys Xaa Cys Xaa Cys Xaa Cys Xaa Xaa Xaa Cys Xaa His Xaa His Xaa

5 10 155 10 15

Cys <210> 147 <211> 344 <212> Белок <213> Искусственная последовательность <220>Cys <210> 147 <211> 344 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <220><223> Description of artificial sequence: Synthetic polypeptide <220>

<221> MISC_FEATURE <222> (8)..(322) <223> Эта область может содержать 1-15 повторяющихся звеньев Tyr Lys Cys Pro Glu Cys<221> MISC_FEATURE <222> (8)..(322) <223> This region may contain 1-15 repeat units Tyr Lys Cys Pro Glu Cys

Gly Lys Ser Phe Ser His Gln Arg Thr His Thr Gly Glu Lys Pro <220>Gly Lys Ser Phe Ser His Gln Arg Thr His Thr Gly Glu Lys Pro <220>

<221> NON_CONS <222> (18)..(19) <220><221> NON_CONS <222> (18)..(19) <220>

<221> NON_CONS <222> (39)..(40) <220><221> NON_CONS <222> (39)..(40) <220>

<221> NON_CONS <222> (60)..(61)<221> NON_CONS <222> (60)..(61)

- 262 046157- 262 046157

NON_CONS (81) .. (82)NON_CONS (81) .. (82)

NON_CONS (102) .. (103)NON_CONS (102) .. (103)

NON_CONS (123)..(124)NON_CONS (123)..(124)

NON_CONS (144) .. (145)NON_CONS (144) .. (145)

NON_CONS (165)..(166)NON_CONS (165)..(166)

NON_CONS (186)..(187)NON_CONS (186)..(187)

NON_CONS (207)..(208)NON_CONS (207)..(208)

NON_CONS (228)..(229)NON_CONS (228)..(229)

NON_CONS (249)..(250)NON_CONS (249)..(250)

NON_CONS (270)..(271)NON_CONS (270)..(271)

NON_CONS (291)..(292)NON_CONS (291)..(292)

NON_CONS (312)..(313)NON_CONS (312)..(313)

NON_CONS (333)..(334)NON_CONS (333)..(334)

Смотри первоначальное описание заявки для подробного описания замен и предпочтительных вариантов осуществления <400>See the original application description for a detailed description of substitutions and preferred embodiments <400>

147147

Leu Glu Pro 1Leu Glu Pro 1

GlyGly

Glu Lys Pro Tyr Lys 5Glu Lys Pro Tyr Lys 5

Cys Pro Glu Cys Gly 10Cys Pro Glu Cys Gly 10

Lys Ser 15Lys Ser 15

Phe Ser HisPhe Ser His

Gln 20Gln 20

Arg Thr His Thr GlyArg Thr His Thr Gly

Glu Lys Pro Tyr LysGlu Lys Pro Tyr Lys

Cys ProCys Pro

- 263 046157- 263 046157

Glu Cys Gly Lys Ser 35Glu Cys Gly Lys Ser 35

Phe Ser His Gln Arg 40Phe Ser His Gln Arg 40

Thr His Thr Gly Glu Lys 45Thr His Thr Gly Glu Lys 45

Pro Tyr Lys Cys Pro 50Pro Tyr Lys Cys Pro 50

Glu Cys Gly Lys Ser 55Glu Cys Gly Lys Ser 55

Phe Ser His Gln Arg Thr 60Phe Ser His Gln Arg Thr 60

His Thr Gly Glu Lys 65His Thr Gly Glu Lys 65

Pro Tyr Lys Cys Pro 70Pro Tyr Lys Cys Pro 70

Glu Cys Gly Lys Ser Phe 75 80Glu Cys Gly Lys Ser Phe 75 80

Ser His Gln Arg ThrSer His Gln Arg Thr

His Thr Gly Glu LysHis Thr Gly Glu Lys

Pro Tyr Lys Cys Pro Glu 95Pro Tyr Lys Cys Pro Glu 95

Cys Gly Lys Ser PheCys Gly Lys Ser Phe

100100

Ser His Gln Arg ThrSer His Gln Arg Thr

105105

His Thr Gly Glu Lys ProHis Thr Gly Glu Lys Pro

110110

Tyr Lys Cys Pro Glu 115Tyr Lys Cys Pro Glu 115

Cys Gly Lys Ser Phe 120Cys Gly Lys Ser Phe 120

Ser His Gln Arg Thr HisSer His Gln Arg Thr His

125125

Thr Gly Glu Lys ProThr Gly Glu Lys Pro

130130

Tyr Lys Cys Pro GluTyr Lys Cys Pro Glu

135135

Cys Gly Lys Ser Phe Ser 140Cys Gly Lys Ser Phe Ser 140

His Gln Arg Thr His 145His Gln Arg Thr His 145

Thr Gly Glu Lys Pro 150Thr Gly Glu Lys Pro 150

Tyr Lys Cys Pro Glu CysTyr Lys Cys Pro Glu Cys

155 160155 160

Gly Lys Ser Phe SerGly Lys Ser Phe Ser

165165

His Gln Arg Thr HisHis Gln Arg Thr His

170170

Thr Gly Glu Lys Pro TyrThr Gly Glu Lys Pro Tyr

175175

Lys Cys Pro Glu CysLys Cys Pro Glu Cys

180180

Gly Lys Ser Phe SerGly Lys Ser Phe Ser

185185

His Gln Arg Thr His ThrHis Gln Arg Thr His Thr

190190

Gly Glu Lys Pro TyrGly Glu Lys Pro Tyr

195195

Lys Cys Pro Glu Cys 200Lys Cys Pro Glu Cys 200

Gly Lys Ser Phe Ser HisGly Lys Ser Phe Ser His

205205

Gln Arg Thr His ThrGln Arg Thr His Thr

210210

Gly Glu Lys Pro TyrGly Glu Lys Pro Tyr

215215

Lys Cys Pro Glu Cys GlyLys Cys Pro Glu Cys Gly

220220

Lys Ser Phe Ser His 225Lys Ser Phe Ser His 225

Gln Arg Thr His Thr 230Gln Arg Thr His Thr 230

Gly Glu Lys Pro Tyr LysGly Glu Lys Pro Tyr Lys

235 240235 240

Cys Pro Glu Cys GlyCys Pro Glu Cys Gly

245245

Lys Ser Phe Ser HisLys Ser Phe Ser His

250250

Gln Arg Thr His Thr GlyGln Arg Thr His Thr Gly

255255

Glu Lys Pro Tyr LysGlu Lys Pro Tyr Lys

260260

Cys Pro Glu Cys GlyCys Pro Glu Cys Gly

265265

Lys Ser Phe Ser His GlnLys Ser Phe Ser His Gln

270270

Arg Thr His Thr GlyArg Thr His Thr Gly

Glu Lys Pro Tyr LysGlu Lys Pro Tyr Lys

Cys Pro Glu Cys Gly LysCys Pro Glu Cys Gly Lys

- 264 046157- 264 046157

275275

280280

Ser Phe Ser His Gln Arg Thr His Thr Gly Glu LysSer Phe Ser His Gln Arg Thr His Thr Gly Glu Lys

290 295300290 295300

Pro Glu Cys Gly Lys Ser Phe Ser His Gln Arg ThrPro Glu Cys Gly Lys Ser Phe Ser His Gln Arg Thr

305 310315305 310315

Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser PheLys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe

325330325330

285285

Pro Tyr Lys CysPro Tyr Lys Cys

His Thr Gly GluHis Thr Gly Glu

320320

Ser His Gln ArgSer His Gln Arg

335335

Thr His Thr Gly Lys Lys Thr SerThr His Thr Gly Lys Lys Thr Ser

340 <210> 148 <211> 292 <212> Белок <213> Искусственная последовательность <220>340 <210> 148 <211> 292 <212> Protein <213> Artificial sequence <220>

< 223> Описание искусственной последовательности полипептид<223> Description of the artificial polypeptide sequence

Синтетический <220>Synthetic <220>

< 221> MOD_RES < 222> (8) .. (57) < 223> Любая аминокислота <220><221> MOD_RES <222> (8) .. (57) <223> Any amino acid <220>

< 221> MISC_FEATURE < 222> (8)..(57) < 223> Эта область может содержать 1-50 остатков <220>< 221> MISC_FEATURE < 222> (8)..(57) < 223> This region can contain 1-50 residues <220>

< 221> MOD_RES < 222> (65).. (114) < 223> Любая аминокислота <220>< 221> MOD_RES < 222> (65).. (114) < 223> Any amino acid <220>

< 221> MISC_FEATURE < 222> (65)..(114) < 223> Эта область может содержать 1-50 остатков <220>< 221> MISC_FEATURE < 222> (65)..(114) < 223> This region can contain 1-50 residues <220>

< 221> MOD_RES < 222> (122)..(171) < 223> Любая аминокислота <220>< 221> MOD_RES < 222> (122)..(171) < 223> Any amino acid <220>

< 221> MISC_FEATURE < 222> (122)..(171) < 223> Эта область может содержать 1-50 остатков <220>< 221> MISC_FEATURE < 222> (122)..(171) < 223> This region can contain 1-50 residues <220>

< 221> MOD_RES < 222> (179)..(228) < 223> Любая аминокислота< 221> MOD_RES < 222> (179)..(228) < 223> Any amino acid

- 265 046157 <220>- 265 046157 <220>

<221> MISC_FEATURE <222> (179)..(228) <223> Эта область может содержать 1<220><221> MISC_FEATURE <222> (179)..(228) <223> This area can contain 1<220>

<221> MOD_RES <222> (236)..(285) <223> Любая аминокислота <220><221> MOD_RES <222> (236)..(285) <223> Any amino acid <220>

<221> MISC_FEATURE <222> (236)..(285) <223> Эта область может содержать 1<400> 148<221> MISC_FEATURE <222> (236)..(285) <223> This area can contain 1<400> 148

Arg Ser Asp Asn Leu Val Arg Xaa Xaa 1 5Arg Ser Asp Asn Leu Val Arg Xaa Xaa 1 5

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

2525

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

4040

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

5555

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 65 70Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 65 70

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 85Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 85

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

100 105100 105

Xaa Xaa Arg Ser Asp Glu Leu Val ArgXaa Xaa Arg Ser Asp Glu Leu Val Arg

115 120115 120

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

130 135130 135

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

145 150145 150

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 165Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 165

Thr Glu Xaa Xaa Xaa Xaa Xaa Xaa XaaThr Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa

180 185 статков статков180 185 statok statok

Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa

Xaa Xaa Xaa Xaa Xaa Xaa 30Xaa Xaa Xaa Xaa Xaa Xaa 30

Xaa Xaa Xaa Xaa Xaa Xaa 45Xaa Xaa Xaa Xaa Xaa Xaa 45

Glu Asp Asn Leu His Thr 60Glu Asp Asn Leu His Thr 60

Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa

8080

Xaa Xaa Xaa Xaa Xaa Xaa 95Xaa Xaa Xaa Xaa Xaa Xaa 95

Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa

110110

Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa

125125

Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa

140140

Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa

155 160155 160

Xaa Gln Ser Gly Asn Leu 175Xaa Gln Ser Gly Asn Leu 175

Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa

190190

- 266 046157- 266 046157

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

210210

Xaa Xaa 225Xaa Xaa 225

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa Xaa 195Xaa Xaa 195

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa Xaa 260Xaa Xaa 260

Xaa Xaa 275Xaa Xaa 275

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Thr SerThr Ser

230230

Xaa Xaa 245Xaa Xaa 245

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

200200

Xaa Xaa 215Xaa Xaa 215

Gly HisGly His

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

280280

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

220220

Leu Val Arg XaaLeu Val Arg Xaa

235235

Xaa XaaXaa Xaa

250250

Xaa XaaXaa Xaa

Xaa Xaa 265Xaa Xaa 265

Xaa XaaXaa Xaa

Xaa Xaa 205Xaa Xaa 205

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

270270

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

240240

Xaa Xaa 255Xaa Xaa 255

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa Gln Asn SerXaa Gln Asn Ser

285285

Thr Leu Thr GluThr Leu Thr Glu

290 <210> 149 <211> 292 <212> Белок <213> Искусственная последовательность <220>290 <210> 149 <211> 292 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <220><223> Description of artificial sequence: Synthetic polypeptide <220>

< 221> MOD_RES < 222> (8) .. (57) < 223> Любая аминокислота <220><221> MOD_RES <222> (8) .. (57) <223> Any amino acid <220>

< 221> MISC_FEATURE < 222> (8)..(57) < 223> Эта область может содержать 1-50 остатков <220>< 221> MISC_FEATURE < 222> (8)..(57) < 223> This region can contain 1-50 residues <220>

< 221> MOD_RES < 222> (65)..(114) < 223> Любая аминокислота <220>< 221> MOD_RES < 222> (65)..(114) < 223> Any amino acid <220>

< 221> MISC_FEATURE < 222> (65)..(114) <223> Эта область может содержать 1-50 остатков <220>< 221> MISC_FEATURE < 222> (65)..(114) <223> This region can contain 1-50 residues <220>

<221> MOD_RES <222> (122)..(171)<221> MOD_RES <222> (122)..(171)

- 267 046157 <223> Любая аминокислота <220>- 267 046157 <223> Any amino acid <220>

<221> MISC_FEATURE <222> (122)..(171) <223> Эта область может содержать 1-50 остатков <220><221> MISC_FEATURE <222> (122)..(171) <223> This region can contain 1-50 residues <220>

<221> MOD_RES <222> (179)..(228) <223> Любая аминокислота <220><221> MOD_RES <222> (179)..(228) <223> Any amino acid <220>

<221> MISC_FEATURE <222> (179)..(228) <223> Эта область может содержать 1-50 остатков <220><221> MISC_FEATURE <222> (179)..(228) <223> This region can contain 1-50 residues <220>

<221> MOD_RES <222> (236)..(285) <223> Любая аминокислота <220><221> MOD_RES <222> (236)..(285) <223> Any amino acid <220>

<221> MISC_FEATURE <222> (236)..(285) <223> Эта область может содержать 1-50 остатков <400> 149 Arg Ser Asp 1<221> MISC_FEATURE <222> (236)..(285) <223> This region can contain 1-50 residues <400> 149 Arg Ser Asp 1

Asn Leu ValAsn Leu Val

Arg Xaa XaaArg Xaa Xaa

Xaa Xaa Xaa 10Xaa Xaa Xaa 10

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 20Xaa Xaa Xaa 20

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 45Xaa Xaa Xaa 45

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 55Xaa Xaa Xaa 55

His Arg ThrHis Arg Thr

Thr Leu ThrThr Leu Thr

Xaa Xaa Xaa 65Xaa Xaa Xaa 65

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 90Xaa Xaa Xaa 90

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 100Xaa Xaa Xaa 100

Xaa Xaa XaaXaa Xaa Xaa

105105

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

110110

Xaa Xaa ArgXaa Xaa Arg

115115

Glu Asp AsnGlu Asp Asn

Leu His ThrLeu His Thr

120120

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 125Xaa Xaa Xaa 125

Xaa Xaa XaaXaa Xaa Xaa

130130

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 135Xaa Xaa Xaa 135

Xaa Xaa XaaXaa Xaa Xaa

140140

Xaa Xaa XaaXaa Xaa Xaa

XaaXaa

XaaXaa

XaaXaa

AsnAsn

Xaa 80Xaa 80

XaaXaa

XaaXaa

XaaXaa

XaaXaa

- 268 046157- 268 046157

Xaa Xaa 145Xaa Xaa 145

Xaa XaaXaa Xaa

Thr GluThr Glu

Xaa XaaXaa Xaa

Xaa Xaa 210Xaa Xaa 210

Xaa Xaa 225Xaa Xaa 225

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

180180

Xaa Xaa 195Xaa Xaa 195

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

260260

Xaa Xaa 275Xaa Xaa 275

Asn Leu His ThrAsn Leu His Thr

290 <210> 150 <211> 292 <212> Белок290 <210> 150 <211> 292 <212> Protein

Xaa XaaXaa Xaa

150150

Xaa Xaa 165Xaa Xaa 165

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Gln SerGln Ser

230230

Xaa Xaa 245Xaa Xaa 245

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

200200

Xaa Xaa 215Xaa Xaa 215

Ser SerSer Ser

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

280280

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

170170

Xaa Xaa 185Xaa Xaa 185

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa Xaa 155Xaa Xaa 155

Xaa ThrXaa Thr

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa Xaa 220Xaa Xaa 220

Xaa XaaXaa Xaa

Ser HisSer His

Xaa XaaXaa Xaa

190190

Xaa Xaa 205Xaa Xaa 205

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

160160

Ser Leu 175Ser Leu 175

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Leu Val Arg XaaLeu Val Arg Xaa

235235

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

240240

Xaa XaaXaa Xaa

250250

Xaa Xaa 265Xaa Xaa 265

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

270 <213> Искусственная последовательность <220>270 <213> Artificial sequence <220>

Xaa Xaa 255Xaa Xaa 255

Xaa XaaXaa Xaa

Xaa Arg Glu Asp 285 <223> Описание искусственной последовательности: Синтетический полипептид <220>Xaa Arg Glu Asp 285 <223> Description of artificial sequence: Synthetic polypeptide <220>

<221> MOD_RES <222> (8) .. (57) <223> Любая аминокислота <220><221> MOD_RES <222> (8) .. (57) <223> Any amino acid <220>

<221> MISC_FEATURE <222> (8)..(57) <223> Эта область может содержать 1-50 остатков <221> MOD_RES <220><221> MISC_FEATURE <222> (8)..(57) <223> This region can contain 1-50 residues <221> MOD_RES <220>

- 269 046157 <222> (65) .. (114) <223> Любая аминокислота <220>- 269 046157 <222> (65) .. (114) <223> Any amino acid <220>

<221> MISC_FEATURE <222> (65)..(114) <223> Эта область может содержать 1-50 остатков <220><221> MISC_FEATURE <222> (65)..(114) <223> This region can contain 1-50 residues <220>

<221> MOD_RES <222> (122)..(171) <223> Любая аминокислота <220><221> MOD_RES <222> (122)..(171) <223> Any amino acid <220>

<221> MISC_FEATURE <222> (122)..(171) <223> Эта область может содержать 1-50 остатков <220><221> MISC_FEATURE <222> (122)..(171) <223> This region can contain 1-50 residues <220>

<221> MOD_RES <222> (179)..(228) <223> Любая аминокислота <220><221> MOD_RES <222> (179)..(228) <223> Any amino acid <220>

<221> MISC_FEATURE <222> (179)..(228) <223> Эта область может содержать 1-50 остатков <220><221> MISC_FEATURE <222> (179)..(228) <223> This region can contain 1-50 residues <220>

<221> MOD_RES <222> (236)..(285) <223> Любая аминокислота <220><221> MOD_RES <222> (236)..(285) <223> Any amino acid <220>

<221> MISC_FEATURE <222> (236)..(285) <223> Эта область может содержать 1-50 остатков <400> 150<221> MISC_FEATURE <222> (236)..(285) <223> This region can contain 1-50 residues <400> 150

Asp Pro Gly Ala Leu Val Arg Xaa 1 5Asp Pro Gly Ala Leu Val Arg Xaa 1 5

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa Xaa 25Xaa Xaa 25

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa Xaa 35Xaa Xaa 35

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa Xaa 45Xaa Xaa 45

Xaa Xaa 15Xaa Xaa 15

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa Xaa 55Xaa Xaa 55

Xaa Arg Ser Asp Asn Leu Val Arg 60Xaa Arg Ser Asp Asn Leu Val Arg 60

Xaa Xaa 65Xaa Xaa 65

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa Xaa 75Xaa Xaa 75

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa XaaXaa Xaa

Xaa Xaa 85Xaa Xaa 85

Xaa XaaXaa Xaa

XaaXaa

Xaa Xaa Xaa 90Xaa Xaa Xaa 90

Xaa XaaXaa Xaa

Xaa Xaa 80Xaa Xaa 80

Xaa Xaa 95Xaa Xaa 95

- 270 046157- 270 046157

XaaXaa

XaaXaa

XaaXaa

XaaXaa

100100

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

105105

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

110110

XaaXaa

XaaXaa

XaaXaa

XaaXaa

GlnGln

115115

SerSer

GlyGly

AspAsp

LeuLeu

Arg 120Arg 120

ArgArg

XaaXaa

XaaXaa

XaaXaa

XaaXaa

125125

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

130130

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

135135

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

140140

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

145145

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

150150

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

155155

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

160160

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

165165

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

170170

XaaXaa

ThrThr

HisHis

LeuLeu

Asp 175Asp 175

LeuLeu

IleIle

ArgArg

XaaXaa

XaaXaa

180180

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

185185

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

190190

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

195195

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

200200

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

205205

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

210210

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

215215

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

220220

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

225225

XaaXaa

XaaXaa

XaaXaa

ThrThr

SerSer

230230

GlyGly

AsnAsn

LeuLeu

ValVal

Arg 235Arg 235

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

240240

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

245245

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

250250

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

255255

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

260260

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

265265

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

270270

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

275275

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

280280

XaaXaa

XaaXaa

XaaXaa

XaaXaa

XaaXaa

285285

ArgArg

SerSer

AspAsp

Asn Leu Val ArgAsn Leu Val Arg

290 <210> 151 <211> 463 <212> Белок <213> Искусственная последовательность <220>290 <210> 151 <211> 463 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <220><223> Description of artificial sequence: Synthetic polypeptide <220>

- 271 046157 <221> MOD_RES <222> (8) .. (57) <223> Любая аминокислота <220>- 271 046157 <221> MOD_RES <222> (8) .. (57) <223> Any amino acid <220>

<221> MISC_FEATURE <222> (8)..(57) <223> Эта область может содержать 1-5 <220><221> MISC_FEATURE <222> (8)..(57) <223> This area can contain 1-5 <220>

<221> MOD_RES <222> (65).. (114) <223> Любая аминокислота <220><221> MOD_RES <222> (65).. (114) <223> Any amino acid <220>

<221> MISC_FEATURE <222> (65)..(114) <223> Эта область может содержать 1-5 <220><221> MISC_FEATURE <222> (65)..(114) <223> This area can contain 1-5 <220>

<221> MOD_RES <222> (122)..(171) <223> Любая аминокислота <220><221> MOD_RES <222> (122)..(171) <223> Any amino acid <220>

<221> MISC_FEATURE <222> (122)..(171) <223> Эта область может содержать 1-5 <220><221> MISC_FEATURE <222> (122)..(171) <223> This area can contain 1-5 <220>

<221> MOD_RES <222> (179)..(228) <223> Любая аминокислота <220><221> MOD_RES <222> (179)..(228) <223> Any amino acid <220>

<221> MISC_FEATURE <222> (179)..(228) <223> Эта область может содержать 1-5 <220><221> MISC_FEATURE <222> (179)..(228) <223> This area can contain 1-5 <220>

<221> MOD_RES <222> (236)..(285) <223> Любая аминокислота <220><221> MOD_RES <222> (236)..(285) <223> Any amino acid <220>

<221> MISC_FEATURE <222> (236)..(285) <223> Эта область может содержать 1-5 <220><221> MISC_FEATURE <222> (236)..(285) <223> This area can contain 1-5 <220>

<221> MOD_RES <222> (293)..(342) <223> Любая аминокислота <220><221> MOD_RES <222> (293)..(342) <223> Any amino acid <220>

<221> MISC_FEATURE <222> (293)..(342) <223> Эта область может содержать 1-5 <220><221> MISC_FEATURE <222> (293)..(342) <223> This area can contain 1-5 <220>

<221> MOD_RES <222> (350)..(399) <223> Любая аминокислота остатков остатков остатков остатков остатков остатков<221> MOD_RES <222> (350)..(399) <223> Any amino acid residues residues residues residues residues

- 272 046157 <220>- 272 046157 <220>

<221> MISC_FEATURE <222> (350)..(399) <223> Эта область может содержать 1<220><221> MISC_FEATURE <222> (350)..(399) <223> This area can contain 1<220>

<221> MOD_RES <222> (407)..(456) <223> Любая аминокислота <220><221> MOD_RES <222> (407)..(456) <223> Any amino acid <220>

<221> MISC_FEATURE <222> (407)..(456) <223> Эта область может содержать 1<400> 151<221> MISC_FEATURE <222> (407)..(456) <223> This area can contain 1<400> 151

Arg Arg Asp Glu Leu Asn Val Xaa Xaa 1 5Arg Arg Asp Glu Leu Asn Val Xaa Xaa 1 5

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

2525

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

4040

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

5555

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 65 70Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 65 70

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 85Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 85

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

100 105100 105

Xaa Xaa Arg Ser Asp Asp Leu Val ArgXaa Xaa Arg Ser Asp Asp Leu Val Arg

115 120115 120

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

130 135130 135

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

145 150145 150

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 165Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 165

Val Arg Xaa Xaa Xaa Xaa Xaa Xaa XaaVal Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa

180 185 статков статков180 185 statok statok

Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa

Xaa Xaa Xaa Xaa Xaa Xaa 30Xaa Xaa Xaa Xaa Xaa Xaa 30

Xaa Xaa Xaa Xaa Xaa Xaa 45Xaa Xaa Xaa Xaa Xaa Xaa 45

Ser Asp His Leu Thr Asn 60Ser Asp His Leu Thr Asn 60

Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa

8080

Xaa Xaa Xaa Xaa Xaa Xaa 95Xaa Xaa Xaa Xaa Xaa Xaa 95

Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa

110110

Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa

125125

Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa

140140

Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa

155 160155 160

Xaa Arg Ser Asp Asn Leu 175Xaa Arg Ser Asp Asn Leu 175

Xaa Xaa Xaa Xaa Xaa XaaXaa Xaa Xaa Xaa Xaa Xaa

190190

- 273 046157- 273 046157

Xaa Xaa XaaXaa Xaa Xaa

195195

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

200200

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 205Xaa Xaa Xaa 205

Xaa Xaa XaaXaa Xaa Xaa

210210

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 215Xaa Xaa Xaa 215

Xaa Xaa XaaXaa Xaa Xaa

220220

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 225Xaa Xaa Xaa 225

Xaa His ArgXaa His Arg

230230

Thr Thr LeuThr Thr Leu

Thr Asn XaaThr Asn Xaa

235235

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

245245

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 250Xaa Xaa Xaa 250

Xaa Xaa XaaXaa Xaa Xaa

255255

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 260Xaa Xaa Xaa 260

Xaa Xaa XaaXaa Xaa Xaa

265265

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

270270

Xaa Xaa XaaXaa Xaa Xaa

275275

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

280280

Xaa Xaa XaaXaa Xaa Xaa

Xaa Arg Glu 285Xaa Arg Glu 285

Asn Leu HisAsn Leu His

290290

Thr Xaa XaaThr Xaa Xaa

Xaa Xaa Xaa 295Xaa Xaa Xaa 295

Xaa Xaa XaaXaa Xaa Xaa

300300

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 305Xaa Xaa Xaa 305

Xaa Xaa XaaXaa Xaa Xaa

310310

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

315315

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

325325

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 330Xaa Xaa Xaa 330

Xaa Xaa XaaXaa Xaa Xaa

335335

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 340Xaa Xaa Xaa 340

Thr Ser HisThr Ser His

345345

Ser Leu ThrSer Leu Thr

Glu Xaa XaaGlu Xaa Xaa

350350

Xaa Xaa XaaXaa Xaa Xaa

355355

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

360360

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 365Xaa Xaa Xaa 365

Xaa Xaa XaaXaa Xaa Xaa

370370

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 375Xaa Xaa Xaa 375

Xaa Xaa XaaXaa Xaa Xaa

380380

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 385Xaa Xaa Xaa 385

Xaa Xaa XaaXaa Xaa Xaa

390390

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

395395

Xaa Xaa XaaXaa Xaa Xaa

Ser Ser SerSer Ser Ser

Leu Val ArgLeu Val Arg

405405

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 410Xaa Xaa Xaa 410

Xaa Xaa XaaXaa Xaa Xaa

415415

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa Xaa 420Xaa Xaa Xaa 420

Xaa Xaa XaaXaa Xaa Xaa

425425

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

430430

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

Xaa Xaa XaaXaa Xaa Xaa

XaaXaa

XaaXaa

Xaa 240Xaa 240

XaaXaa

XaaXaa

AspAsp

XaaXaa

Xaa 320XAA 320

XaaXaa

XaaXaa

XaaXaa

XaaXaa

Gln 400Gln 400

XaaXaa

XaaXaa

XaaXaa

- 274 046157- 274 046157

435435

440440

445445

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Glu Asp Asn Leu His ThrXaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Glu Asp Asn Leu His Thr

450 455 460 <210> 152 <211> 7 <212> Белок <213> Искусственная последовательность <220>450 455 460 <210> 152 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 152<223> Description of artificial sequence: Synthetic peptide <400> 152

Arg Ser Asp Asn Leu Val ArgArg Ser Asp Asn Leu Val Arg

5 <210> 153 <211> 7 <212> Белок <213> Искусственная последовательность <220>5 <210> 153 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 153<223> Description of artificial sequence: Synthetic peptide <400> 153

Arg Glu Asp Asn Leu His ThrArg Glu Asp Asn Leu His Thr

5 <210> 154 <211> 7 <212> Белок <213> Искусственная последовательность <220>5 <210> 154 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 154 Arg Ser Asp Glu Leu Val Arg 1 5 <210> 155 <211> 7 <212> Белок <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic peptide <400> 154 Arg Ser Asp Glu Leu Val Arg 1 5 <210> 155 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 155 Gln Ser Gly Asn Leu Thr Glu 1 5<223> Description of artificial sequence: Synthetic peptide <400> 155 Gln Ser Gly Asn Leu Thr Glu 1 5

- 275 046157 <210> 156 <211> 7 <212> Белок <213> Искусственная последовательность <220>- 275 046157 <210> 156 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 156<223> Description of artificial sequence: Synthetic peptide <400> 156

Thr Ser Gly His Leu Val ArgThr Ser Gly His Leu Val Arg

5 <210> 157 <211> 7 <212> Белок <213> Искусственная последовательность <220>5 <210> 157 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 157<223> Description of artificial sequence: Synthetic peptide <400> 157

Gln Asn Ser Thr Leu Thr GluGln Asn Ser Thr Leu Thr Glu

5 <210> 158 <211> 7 <212> Белок <213> Искусственная последовательность <220>5 <210> 158 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 158<223> Description of artificial sequence: Synthetic peptide <400> 158

Asp Pro Gly Ala Leu Val ArgAsp Pro Gly Ala Leu Val Arg

5 <210> 159 <211> 7 <212> Белок <213> Искусственная последовательность <220>5 <210> 159 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 159<223> Description of artificial sequence: Synthetic peptide <400> 159

His Arg Thr Thr Leu Thr AsnHis Arg Thr Thr Leu Thr Asn

5 <210> 160 <211> 7 <212> Белок <213> Искусственная последовательность <220>5 <210> 160 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический<223> Description of artificial sequence: Synthetic

- 276 046157 пептид <400> 160- 276 046157 peptide <400> 160

Gln Ser Gly Asp Leu Arg Arg <210> 161 <211> 7 <212> Белок <213> Искусственная последовательность <220>Gln Ser Gly Asp Leu Arg Arg <210> 161 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 161<223> Description of artificial sequence: Synthetic peptide <400> 161

Thr Ser His Ser Leu Thr GluThr Ser His Ser Leu Thr Glu

5 <210> 162 <211> 7 <212> Белок <213> Искусственная последовательность <220>5 <210> 162 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 162<223> Description of artificial sequence: Synthetic peptide <400> 162

Thr His Leu Asp Leu Ile ArgThr His Leu Asp Leu Ile Arg

5 <210> 163 <211> 7 <212> Белок <213> Искусственная последовательность <220>5 <210> 163 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 163<223> Description of artificial sequence: Synthetic peptide <400> 163

Gln Ser Ser Ser Leu Val ArgGln Ser Ser Ser Leu Val Arg

5 <210> 164 <211> 7 <212> Белок <213> Искусственная последовательность <220>5 <210> 164 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 164<223> Description of artificial sequence: Synthetic peptide <400> 164

Thr Ser Gly Asn Leu Val ArgThr Ser Gly Asn Leu Val Arg

55

- 277 046157 <210> 165 <211> 7 <212> Белок <213> Искусственная последовательность <220>- 277 046157 <210> 165 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 165<223> Description of artificial sequence: Synthetic peptide <400> 165

Arg Arg Asp Glu Leu Asn ValArg Arg Asp Glu Leu Asn Val

5 <210> 166 <211> 7 <212> Белок <213> Искусственная последовательность <220>5 <210> 166 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 166<223> Description of artificial sequence: Synthetic peptide <400> 166

Arg Ser Asp Asp Leu Val ArgArg Ser Asp Asp Leu Val Arg

5 <210> 167 <211> 7 <212> Белок <213> Искусственная последовательность <220>5 <210> 167 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 167<223> Description of artificial sequence: Synthetic peptide <400> 167

Arg Ser Asp His Leu Thr AsnArg Ser Asp His Leu Thr Asn

5 <210> 168 <211> 16 <212> Белок <213> Искусственная последовательность <220>5 <210> 168 <211> 16 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 168<223> Description of artificial sequence: Synthetic peptide <400> 168

Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys 1 5 10 15 <210> 169 <211> 7 <212> Белок <213> Искусственная последовательность <220>Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys 1 5 10 15 <210> 169 <211> 7 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический<223> Description of artificial sequence: Synthetic

- 278 046157 пептид <400> 169- 278 046157 peptide <400> 169

Pro Lys Lys Lys Arg Lys Val <210> 170 <211> 16 <212> Белок <213> Искусственная последовательность <220>Pro Lys Lys Lys Arg Lys Val <210> 170 <211> 16 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 170<223> Description of artificial sequence: Synthetic peptide <400> 170

Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 171 <211> 9 <212> Белок <213> Искусственная последовательность <220>Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 171 <211> 9 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 171<223> Description of artificial sequence: Synthetic peptide <400> 171

Tyr Pro Tyr Asp Val Pro Asp Tyr AlaTyr Pro Tyr Asp Val Pro Asp Tyr Ala

5 <210> 172 <211> 2009 <212> Белок <213> Homo sapiens <400> 1725 <210> 172 <211> 2009 <212> Protein <213> Homo sapiens <400> 172

Met Glu Gln Thr Val Leu Val Pro Pro Gly Pro Asp Ser Phe Asn PheMet Glu Gln Thr Val Leu Val Pro Pro Gly Pro Asp Ser Phe Asn Phe

5 10155 1015

Phe Thr Arg Glu Ser Leu Ala Ala Ile Glu Arg Arg Ile Ala Glu Glu 20 2530Phe Thr Arg Glu Ser Leu Ala Ala Ile Glu Arg Arg Ile Ala Glu Glu 20 2530

Lys Ala Lys Asn Pro Lys Pro Asp Lys Lys Asp Asp Asp Glu Asn Gly 35 4045Lys Ala Lys Asn Pro Lys Pro Asp Lys Lys Asp Asp Asp Glu Asn Gly 35 4045

Pro Lys Pro Asn Ser Asp Leu Glu Ala Gly Lys Asn Leu Pro Phe Ile 50 5560Pro Lys Pro Asn Ser Asp Leu Glu Ala Gly Lys Asn Leu Pro Phe Ile 50 5560

Tyr Gly Asp Ile Pro Pro Glu Met Val Ser Glu Pro Leu Glu Asp Leu 65 70 7580Tyr Gly Asp Ile Pro Pro Glu Met Val Ser Glu Pro Leu Glu Asp Leu 65 70 7580

Asp Pro Tyr Tyr Ile Asn Lys Lys Thr Phe Ile Val Leu Asn Lys Gly 85 9095Asp Pro Tyr Tyr Ile Asn Lys Lys Thr Phe Ile Val Leu Asn Lys Gly 85 9095

- 279 046157- 279 046157

Lys Ala Ile Phe ArgLys Ala Ile Phe Arg

100100

Phe Ser Ala Thr SerPhe Ser Ala Thr Ser

105105

Ala Leu Tyr Ile LeuAla Leu Tyr Ile Leu

110110

Pro Phe Asn Pro LeuPro Phe Asn Pro Leu

115115

Arg Lys Ile Ala Ile 120Arg Lys Ile Ala Ile 120

Lys Ile Leu Val His 125Lys Ile Leu Val His 125

Leu Phe Ser Met LeuLeu Phe Ser Met Leu

130130

Ile Met Cys Thr IleIle Met Cys Thr Ile

135135

Leu Thr Asn Cys Val 140Leu Thr Asn Cys Val 140

Met Thr Met Ser Asn 145Met Thr Met Ser Asn 145

Pro Pro Asp Trp Thr 150Pro Pro Asp Trp Thr 150

Lys Asn Val Glu Tyr 155Lys Asn Val Glu Tyr 155

Phe Thr Gly Ile TyrPhe Thr Gly Ile Tyr

165165

Thr Phe Glu Ser LeuThr Phe Glu Ser Leu

170170

Ile Lys Ile Ile AlaIle Lys Ile Ile Ala

175175

Gly Phe Cys Leu GluGly Phe Cys Leu Glu

180180

Asp Phe Thr Phe LeuAsp Phe Thr Phe Leu

185185

Arg Asp Pro Trp AsnArg Asp Pro Trp Asn

190190

Leu Asp Phe Thr Val 195Leu Asp Phe Thr Val 195

Ile Thr Phe Ala TyrIle Thr Phe Ala Tyr

200200

Val Thr Glu Phe ValVal Thr Glu Phe Val

205205

Leu Gly Asn Val SerLeu Gly Asn Val Ser

210210

Ala Leu Arg Thr Phe 215Ala Leu Arg Thr Phe 215

Arg Val Leu Arg AlaArg Val Leu Arg Ala

220220

Lys Thr Ile Ser Val 225Lys Thr Ile Ser Val 225

Ile Pro Gly Leu Lys 230Ile Pro Gly Leu Lys 230

Thr Ile Val Gly Ala 235Thr Ile Val Gly Ala 235

Ile Gln Ser Val LysIle Gln Ser Val Lys

245245

Lys Leu Ser Asp ValLys Leu Ser Asp Val

250250

Met Ile Leu Thr ValMet Ile Leu Thr Val

255255

Cys Leu Ser Val PheCys Leu Ser Val Phe

260260

Ala Leu Ile Gly LeuAla Leu Ile Gly Leu

265265

Gln Leu Phe Met GlyGln Leu Phe Met Gly

270270

Leu Arg Asn Lys CysLeu Arg Asn Lys Cys

275275

Ile Gln Trp Pro ProIle Gln Trp Pro Pro

280280

Thr Asn Ala Ser LeuThr Asn Ala Ser Leu

285285

Glu His Ser Ile GluGlu His Ser Ile Glu

290290

Lys Asn Ile Thr ValLys Asn Ile Thr Val

295295

Asn Tyr Asn Gly ThrAsn Tyr Asn Gly Thr

300300

Ile Asn Glu Thr Val 305Ile Asn Glu Thr Val 305

Phe Glu Phe Asp Trp 310Phe Glu Phe Asp Trp 310

Lys Ser Tyr Ile Gln 315Lys Ser Tyr Ile Gln 315

Ser Arg Tyr His TyrSer Arg Tyr His Tyr

325325

Phe Leu Glu Gly PhePhe Leu Glu Gly Phe

330330

Leu Asp Ala Leu LeuLeu Asp Ala Leu Leu

335335

Gly Asn Ser Ser AspGly Asn Ser Ser Asp

Ala Gly Gln Cys ProAla Gly Gln Cys Pro

Glu Gly Tyr Met CysGlu Gly Tyr Met Cys

ThrThr

SerSer

PhePhe

Thr 160Thr 160

ArgArg

TrpTrp

AspAsp

LeuLeu

Leu 240Leu 240

PhePhe

AsnAsn

GluGlu

LeuLeu

Asp 320Asp 320

CysCys

ValVal

- 280 046157- 280 046157

340340

345345

350350

Lys Ala Gly Arg AsnLys Ala Gly Arg Asn

355355

Pro Asn Tyr Gly Tyr 360Pro Asn Tyr Gly Tyr 360

Thr Ser Phe Asp Thr 365Thr Ser Phe Asp Thr 365

Ser Trp Ala Phe LeuSer Trp Ala Phe Leu

370370

Ser Leu Phe Arg LeuSer Leu Phe Arg Leu

375375

Met Thr Gln Asp Phe 380Met Thr Gln Asp Phe 380

Glu Asn Leu Tyr Gln 385Glu Asn Leu Tyr Gln 385

Leu Thr Leu Arg Ala 390Leu Thr Leu Arg Ala 390

Ala Gly Lys Thr Tyr 395Ala Gly Lys Thr Tyr 395

Ile Phe Phe Val LeuIle Phe Phe Val Leu

405405

Val Ile Phe Leu GlyVal Ile Phe Leu Gly

410410

Ser Phe Tyr Leu IleSer Phe Tyr Leu Ile

415415

Leu Ile Leu Ala ValLeu Ile Leu Ala Val

420420

Val Ala Met Ala TyrVal Ala Met Ala Tyr

425425

Glu Glu Gln Asn GlnGlu Glu Gln Asn Gln

430430

Thr Leu Glu Glu AlaThr Leu Glu Glu Ala

435435

Glu Gln Lys Glu Ala 440Glu Gln Lys Glu Ala 440

Glu Phe Gln Gln MetGlu Phe Gln Gln Met

445445

Glu Gln Leu Lys Lys 450Glu Gln Leu Lys Lys 450

Gln Gln Glu Ala AlaGln Gln Glu Ala Ala

455455

Gln Gln Ala Ala ThrGln Gln Ala Ala Thr

460460

Thr Ala Ser Glu His 465Thr Ala Ser Glu His 465

Ser Arg Glu Pro Ser 470Ser Arg Glu Pro Ser 470

Ala Ala Gly Arg Leu 475Ala Ala Gly Arg Leu 475

Asp Ser Ser Ser GluAsp Ser Ser Ser Glu

485485

Ala Ser Lys Leu SerAla Ser Lys Leu Ser

490490

Ser Lys Ser Ala LysSer Lys Ser Ala Lys

495495

Arg Arg Asn Arg ArgArg Arg Asn Arg Arg

500500

Lys Lys Arg Lys GlnLys Lys Arg Lys Gln

505505

Lys Glu Gln Ser GlyLys Glu Gln Ser Gly

510510

Glu Glu Lys Asp Glu 515Glu Glu Lys Asp Glu 515

Asp Glu Phe Gln Lys 520Asp Glu Phe Gln Lys 520

Ser Glu Ser Glu AspSer Glu Ser Glu Asp

525525

Ile Arg Arg Lys GlyIle Arg Arg Lys Gly

530530

Phe Arg Phe Ser Ile 535Phe Arg Phe Ser Ile 535

Glu Gly Asn Arg LeuGlu Gly Asn Arg Leu

540540

Tyr Glu Lys Arg Tyr 545Tyr Glu Lys Arg Tyr 545

Ser Ser Pro His Gln 550Ser Ser Pro His Gln 550

Ser Leu Leu Ser Ile 555Ser Leu Leu Ser Ile 555

Gly Ser Leu Phe SerGly Ser Leu Phe Ser

565565

Pro Arg Arg Asn SerPro Arg Arg Asn Ser

570570

Arg Thr Ser Leu PheArg Thr Ser Leu Phe

575575

Phe Arg Gly Arg AlaPhe Arg Gly Arg Ala

580580

Lys Asp Val Gly SerLys Asp Val Gly Ser

585585

Glu Asn Asp Phe AlaGlu Asn Asp Phe Ala

590590

PhePhe

TrpTrp

Met 400Met 400

AsnAsn

AlaAla

IleIle

AlaAla

Ser 480Ser 480

GluGlu

GlyGly

SerSer

ThrThr

Arg 560Arg 560

SerSer

AspAsp

- 281 046157- 281 046157

Asp Glu His Ser Thr Phe Glu Asp AsnAsp Glu His Ser Thr Phe Glu Asp Asn

595 600595 600

Phe Val Pro Arg Arg His Gly Glu ArgPhe Val Pro Arg Arg His Gly Glu Arg

610 615610 615

Thr Ser Arg Ser Ser Arg Met Leu AlaThr Ser Arg Ser Ser Arg Met Leu Ala

625 630625 630

Met His Ser Thr Val Asp Cys Asn Gly 645Met His Ser Thr Val Asp Cys Asn Gly 645

Pro Ser Val Pro Thr Ser Pro Val GlyPro Ser Val Pro Thr Ser Pro Val Gly

660 665660 665

Ile Asp Lys Pro Ala Thr Asp Asp AsnIle Asp Lys Pro Ala Thr Asp Asp Asn

675 680675 680

Met Arg Lys Arg Arg Ser Ser Ser PheMet Arg Lys Arg Arg Ser Ser Ser Phe

690 695690 695

Glu Asp Pro Ser Gln Arg Gln Arg AlaGlu Asp Pro Ser Gln Arg Gln Arg Ala

705 710705 710

Thr Asn Thr Val Glu Glu Leu Glu GluThr Asn Thr Val Glu Glu Leu Glu Glu

725725

Cys Trp Tyr Lys Phe Ser Asn Ile PheCys Trp Tyr Lys Phe Ser Asn Ile Phe

740 745740 745

Tyr Trp Leu Lys Val Lys His Val ValTyr Trp Leu Lys Val Lys His Val Val

755 760755 760

Phe Val Asp Leu Ala Ile Thr Ile CysPhe Val Asp Leu Ala Ile Thr Ile Cys

770 775770 775

Met Ala Met Glu His Tyr Pro Met Thr 785 790Met Ala Met Glu His Tyr Pro Met Thr 785 790

Thr Val Gly Asn Leu Val Phe Thr GlyThr Val Gly Asn Leu Val Phe Thr Gly

805805

Leu Lys Ile Ile Ala Met Asp Pro TyrLeu Lys Ile Ile Ala Met Asp Pro Tyr

820 825820 825

Asn Ile Phe Asp Gly Phe Ile Val ThrAsn Ile Phe Asp Gly Phe Ile Val Thr

835 840835 840

Ser Arg Arg Asp Ser LeuSer Arg Arg Asp Ser Leu

605605

Asn Ser Asn Leu Ser GlnAsn Ser Asn Leu Ser Gln

620620

Phe Pro Ala Asn Gly LysPhe Pro Ala Asn Gly Lys

635 640635 640

Val Ser Leu Val Gly GlyVal Ser Leu Val Gly Gly

655655

Leu Leu Pro Glu Val IleLeu Leu Pro Glu Val Ile

670670

Thr Thr Thr Glu Thr GluThr Thr Thr Glu Thr Glu

685685

Val Ser Met Asp Phe LeuVal Ser Met Asp Phe Leu

700700

Ser Ile Ala Ser Ile LeuSer Ile Ala Ser Ile Leu

715 720715 720

Arg Gln Lys Cys Pro ProArg Gln Lys Cys Pro Pro

735735

Ile Trp Asp Cys Ser ProIle Trp Asp Cys Ser Pro

750750

Leu Val Val Met Asp Pro 765Leu Val Val Met Asp Pro 765

Val Leu Asn Thr Leu PheVal Leu Asn Thr Leu Phe

780780

His Phe Asn Asn Val LeuHis Phe Asn Asn Val Leu

795 800795 800

Phe Thr Ala Glu Met PhePhe Thr Ala Glu Met Phe

815815

Tyr Phe Gln Glu Gly TrpTyr Phe Gln Glu Gly Trp

830830

Ser Leu Val Glu Leu Gly 845Ser Leu Val Glu Leu Gly 845

- 282 046157- 282 046157

LeuLeu

Arg 865Arg 865

LysLys

LeuLeu

GlyGly

LeuLeu

Phe 945Phe 945

GluGlu

ValVal

SerSer

MetMet

AlaAla

IleIle

LeuLeu

IleIle

SerSer

Ala Asn Val Glu Gly 850Ala Asn Val Glu Gly 850

Val Phe Lys Leu AlaVal Phe Lys Leu Ala

870870

Ile Ile Gly Asn SerIle Ile Gly Asn Ser

885885

Ala Ile Ile Val PheAla Ile Ile Val Phe

900900

Lys Ser Tyr Lys AspLys Ser Tyr Lys Asp

915915

Pro Arg Trp His Met 930Pro Arg Trp His Met 930

Arg Val Leu Cys GlyArg Val Leu Cys Gly

950950

Val Ala Gly Gln AlaVal Ala Gly Gln Ala

965965

Ile Gly Asn Leu Val 980Ile Gly Asn Leu Val 980

Leu Ser Val Leu Arg 855Leu Ser Val Leu Arg 855

Lys Ser Trp Pro ThrLys Ser Trp Pro Thr

875875

Val Gly Ala Leu GlyVal Gly Ala Leu Gly

890890

Ile Phe Ala Val ValIle Phe Ala Val Val

905905

Cys Val Cys Lys Ile 920Cys Val Cys Lys Ile 920

Asn Asp Phe Phe His 935Asn Asp Phe Phe His 935

Glu Trp Ile Glu ThrGlu Trp Ile Glu Thr

955955

Met Cys Leu Thr ValMet Cys Leu Thr Val

970970

Val Leu Asn Leu PheVal Leu Asn Leu Phe

985985

Ser Phe Ser Ala Asp AsnSer Phe Ser Ala Asp Asn

995995

Ser Phe Arg Leu Leu 860Ser Phe Arg Leu Leu 860

Leu Asn Met Leu IleLeu Asn Met Leu Ile

880880

Asn Leu Thr Leu ValAsn Leu Thr Leu Val

895895

Gly Met Gln Leu Phe 910Gly Met Gln Leu Phe 910

Ala Ser Asp Cys Gln 925Ala Ser Asp Cys Gln 925

Ser Phe Leu Ile Val 940Ser Phe Leu Ile Val 940

Met Trp Asp Cys MetMet Trp Asp Cys Met

960960

Phe Met Met Val MetPhe Met Met Val Met

975975

Leu Ala Leu Leu LeuLeu Ala Leu Leu Leu

990990

Leu Ala Ala Thr Asp Asp Asp Asn Glu 1000 1005Leu Ala Ala Thr Asp Asp Asp Asn Glu 1000 1005

Asn 1010 Asn 1010 Asn Asn Leu Leu Gln Gln Ile Ile Ala 1015 Ala 1015 Val Val Asp Asp Arg Arg Met Met His 1020 His 1020 Lys Lys Gly Gly Val Val Tyr 1025 Tyr 1025 Val Val Lys Lys Arg Arg Lys Lys Ile 1030 Ile 1030 Tyr Tyr Glu Glu Phe Phe Ile Ile Gln 1035 Gln 1035 Gln Gln Ser Ser Phe Phe Arg 1040 Arg 1040 Lys Lys Gln Gln Lys Lys Ile Ile Leu 1045 Leu 1045 Asp Asp Glu Glu Ile Ile Lys Lys Pro 1050 Pro 1050 Leu Leu Asp Asp Asp Asp Asn 1055 Asn 1055 Asn Asn Lys Lys Lys Lys Asp Asp Ser 1060 Ser 1060 Cys Cys Met Met Ser Ser Asn Asn His 1065 His 1065 Thr Thr Ala Ala Glu Glu Gly 1070 Gly 1070 Lys Lys Asp Asp Leu Leu Asp Asp Tyr 1075 Tyr 1075 Leu Leu Lys Lys Asp Asp Val Val Asn 1080 Asn 1080 Gly Gly Thr Thr Thr Thr Gly 1085 Gly 1085 Ile Ile Gly Gly Thr Thr Gly Gly Ser 1090 Ser 1090 Ser Ser Val Val Glu Glu Lys Lys Tyr 1095 Tyr 1095 Ile Ile Ile Ile Asp Asp

- 283 046157- 283 046157

Glu Glu Ser 1100 Ser 1100 Asp Asp Tyr Tyr Met Met Ser Ser Phe 1105 Phe 1105 Ile Ile Asn Asn Asn Asn Pro Pro Ser 1110 Ser 1110 Leu Leu Thr Thr Val Val Thr Thr Val 1115 Val 1115 Pro Pro Ile Ile Ala Ala Val Val Gly 1120 Gly 1120 Glu Glu Ser Ser Asp Asp Phe Phe Glu 1125 Glu 1125 Asn Asn Leu Leu Asn Asn Thr Thr Glu 1130 Glu 1130 Asp Asp Phe Phe Ser Ser Ser Ser Glu 1135 Glu 1135 Ser Ser Asp Asp Leu Leu Glu Glu Glu 1140 Glu 1140 Ser Ser Lys Lys Glu Glu Lys Lys Leu 1145 Leu 1145 Asn Asn Glu Glu Ser Ser Ser Ser Ser 1150 Ser 1150 Ser Ser Ser Ser Glu Glu Gly Gly Ser 1155 Ser 1155 Thr Thr Val Val Asp Asp Ile Ile Gly 1160 Gly 1160 Ala Ala Pro Pro Val Val Glu Glu Glu 1165 Glu 1165 Gln Gln Pro Pro Val Val Val Val Glu 1170 Glu 1170 Pro Pro Glu Glu Glu Glu Thr Thr Leu 1175 Leu 1175 Glu Glu Pro Pro Glu Glu Ala Ala Cys 1180 Cys 1180 Phe Phe Thr Thr Glu Glu Gly Gly Cys 1185 Cys 1185 Val Val Gln Gln Arg Arg Phe Phe Lys 1190 Lys 1190 Cys Cys Cys Cys Gln Gln Ile Ile Asn 1195 Asn 1195 Val Val Glu Glu Glu Glu Gly Gly Arg 1200 Arg 1200 Gly Gly Lys Lys Gln Gln Trp Trp Trp 1205 Trp 1205 Asn Asn Leu Leu Arg Arg Arg Arg Thr 1210 Thr 1210 Cys Cys Phe Phe Arg Arg Ile Ile Val 1215 Val 1215 Glu Glu His His Asn Asn Trp Trp Phe 1220 Phe 1220 Glu Glu Thr Thr Phe Phe Ile Ile Val 1225 Val 1225 Phe Phe Met Met Ile Ile Leu Leu Leu 1230 Leu 1230 Ser Ser Ser Ser Gly Gly Ala Ala Leu 1235 Leu 1235 Ala Ala Phe Phe Glu Glu Asp Asp Ile 1240 Ile 1240 Tyr Tyr Ile Ile Asp Asp Gln Gln Arg 1245 Arg 1245 Lys Lys Thr Thr Ile Ile Lys Lys Thr 1250 Thr 1250 Met Met Leu Leu Glu Glu Tyr Tyr Ala 1255 Ala 1255 Asp Asp Lys Lys Val Val Phe Phe Thr 1260 Thr 1260 Tyr Tyr Ile Ile Phe Phe Ile Ile Leu 1265 Leu 1265 Glu Glu Met Met Leu Leu Leu Leu Lys 1270 Lys 1270 Trp Trp Val Val Ala Ala Tyr Tyr Gly 1275 Gly 1275 Tyr Tyr Gln Gln Thr Thr Tyr Tyr Phe 1280 Phe 1280 Thr Thr Asn Asn Ala Ala Trp Trp Cys 1285 Cys 1285 Trp Trp Leu Leu Asp Asp Phe Phe Leu 1290 Leu 1290 Ile Ile Val Val Asp Asp Val Val Ser 1295 Ser 1295 Leu Leu Val Val Ser Ser Leu Leu Thr 1300 Thr 1300 Ala Ala Asn Asn Ala Ala Leu Leu Gly 1305 Gly 1305 Tyr Tyr Ser Ser Glu Glu Leu Leu Gly 1310 Gly 1310 Ala Ala Ile Ile Lys Lys Ser Ser Leu 1315 Leu 1315 Arg Arg Thr Thr Leu Leu Arg Arg Ala 1320 Ala 1320 Leu Leu Arg Arg Pro Pro Leu Leu Arg Arg Ala Ala Leu Leu Ser Ser Arg Arg Phe Phe Glu Glu Gly Gly Met Met Arg Arg Val Val Val Val Val Val Asn Asn

- 284 046157- 284 046157

1325 1330 13351325 1330 1335

Ala Ala Leu 1340 Leu 1340 Leu Leu Gly Gly Ala Ala Ile Ile Pro 1345 Pro 1345 Ser Ser Ile Ile Met Met Asn Asn Val 1350 Val 1350 Leu Leu Leu Leu Val Val Cys Cys Leu 1355 Leu 1355 Ile Ile Phe Phe Trp Trp Leu Leu Ile 1360 Ile 1360 Phe Phe Ser Ser Ile Ile Met Met Gly 1365 Gly 1365 Val Val Asn Asn Leu Leu Phe Phe Ala 1370 Ala 1370 Gly Gly Lys Lys Phe Phe Tyr Tyr His 1375 His 1375 Cys Cys Ile Ile Asn Asn Thr Thr Thr 1380 Thr 1380 Thr Thr Gly Gly Asp Asp Arg Arg Phe 1385 Phe 1385 Asp Asp Ile Ile Glu Glu Asp Asp Val 1390 Val 1390 Asn Asn Asn Asn His His Thr Thr Asp 1395 Asp 1395 Cys Cys Leu Leu Lys Lys Leu Leu Ile 1400 Ile 1400 Glu Glu Arg Arg Asn Asn Glu Glu Thr 1405 Thr 1405 Ala Ala Arg Arg Trp Trp Lys Lys Asn 1410 Asn 1410 Val Val Lys Lys Val Val Asn Asn Phe 1415 Phe 1415 Asp Asp Asn Asn Val Val Gly Gly Phe 1420 Phe 1420 Gly Gly Tyr Tyr Leu Leu Ser Ser Leu 1425 Leu 1425 Leu Leu Gln Gln Val Val Ala Ala Thr 1430 Thr 1430 Phe Phe Lys Lys Gly Gly Trp Trp Met 1435 Met 1435 Asp Asp Ile Ile Met Met Tyr Tyr Ala 1440 Ala 1440 Ala Ala Val Val Asp Asp Ser Ser Arg 1445 Arg 1445 Asn Asn Val Val Glu Glu Leu Leu Gln 1450 Gln 1450 Pro Pro Lys Lys Tyr Tyr Glu Glu Glu 1455 Glu 1455 Ser Ser Leu Leu Tyr Tyr Met Met Tyr 1460 Tyr 1460 Leu Leu Tyr Tyr Phe Phe Val Val Ile 1465 Ile 1465 Phe Phe Ile Ile Ile Ile Phe Phe Gly 1470 Gly 1470 Ser Ser Phe Phe Phe Phe Thr Thr Leu 1475 Leu 1475 Asn Asn Leu Leu Phe Phe Ile Ile Gly 1480 Gly 1480 Val Val Ile Ile Ile Ile Asp Asp Asn 1485 Asn 1485 Phe Phe Asn Asn Gln Gln Gln Gln Lys 1490 Lys 1490 Lys Lys Lys Lys Phe Phe Gly Gly Gly 1495 Gly 1495 Gln Gln Asp Asp Ile Ile Phe Phe Met 1500 Met 1500 Thr Thr Glu Glu Glu Glu Gln Gln Lys 1505 Lys 1505 Lys Lys Tyr Tyr Tyr Tyr Asn Asn Ala 1510 Ala 1510 Met Met Lys Lys Lys Lys Leu Leu Gly 1515 Gly 1515 Ser Ser Lys Lys Lys Lys Pro Pro Gln 1520 Gln 1520 Lys Lys Pro Pro Ile Ile Pro Pro Arg 1525 Arg 1525 Pro Pro Gly Gly Asn Asn Lys Lys Phe 1530 Phe 1530 Gln Gln Gly Gly Met Met Val Val Phe 1535 Phe 1535 Asp Asp Phe Phe Val Val Thr Thr Arg 1540 Arg 1540 Gln Gln Val Val Phe Phe Asp Asp Ile 1545 Ile 1545 Ser Ser Ile Ile Met Met Ile Ile Leu Leu Ile Ile Cys Cys Leu Leu Asn Asn Met Met Val Val Thr Thr Met Met Met Met Val Val Glu Glu Thr Thr Asp Asp

1550 1555 15601550 1555 1560

- 285 046157- 285 046157

Asp Asp Gln 1565 Gln 1565 Ser Ser Glu Glu Tyr Tyr Val Val Thr 1570 Thr 1570 Thr Thr Ile Ile Leu Leu Ser Ser Arg 1575 Arg 1575 Ile Ile Asn Asn Leu Leu Val Val Phe Phe Ile Ile Val Val Leu Leu Phe Phe Thr Thr Gly Gly Glu Glu Cys Cys Val Val Leu Leu Lys Lys Leu Leu Ile Ile 1580 1580 1585 1585 1590 1590 Ser Ser Leu Leu Arg Arg His His Tyr Tyr Tyr Tyr Phe Phe Thr Thr Ile Ile Gly Gly Trp Trp Asn Asn Ile Ile Phe Phe Asp Asp 1595 1595 1600 1600 1605 1605 Phe Phe Val Val Val Val Val Val Ile Ile Leu Leu Ser Ser Ile Ile Val Val Gly Gly Met Met Phe Phe Leu Leu Ala Ala Glu Glu 1610 1610 1615 1615 1620 1620 Leu Leu Ile Ile Glu Glu Lys Lys Tyr Tyr Phe Phe Val Val Ser Ser Pro Pro Thr Thr Leu Leu Phe Phe Arg Arg Val Val Ile Ile 1625 1625 1630 1630 1635 1635

Arg Arg Leu 1640 Leu 1640 Ala Ala Arg Arg Ile Ile Gly Gly Arg 1645 Arg 1645 Ile Ile Leu Leu Arg Arg Leu Leu Ile 1650 Ile 1650 Lys Lys Gly Gly Ala Ala Lys Lys Gly 1655 Gly 1655 Ile Ile Arg Arg Thr Thr Leu Leu Leu 1660 Leu 1660 Phe Phe Ala Ala Leu Leu Met Met Met 1665 Met 1665 Ser Ser Leu Leu Pro Pro Ala Ala Leu 1670 Leu 1670 Phe Phe Asn Asn Ile Ile Gly Gly Leu 1675 Leu 1675 Leu Leu Leu Leu Phe Phe Leu Leu Val 1680 Val 1680 Met Met Phe Phe Ile Ile Tyr Tyr Ala 1685 Ala 1685 Ile Ile Phe Phe Gly Gly Met Met Ser 1690 Ser 1690 Asn Asn Phe Phe Ala Ala Tyr Tyr Val 1695 Val 1695 Lys Lys Arg Arg Glu Glu Val Val Gly 1700 Gly 1700 Ile Ile Asp Asp Asp Asp Met Met Phe 1705 Phe 1705 Asn Asn Phe Phe Glu Glu Thr Thr Phe 1710 Phe 1710 Gly Gly Asn Asn Ser Ser Met Met Ile 1715 Ile 1715 Cys Cys Leu Leu Phe Phe Gln Gln Ile 1720 Ile 1720 Thr Thr Thr Thr Ser Ser Ala Ala Gly 1725 Gly 1725 Trp Trp Asp Asp Gly Gly Leu Leu Leu 1730 Leu 1730 Ala Ala Pro Pro Ile Ile Leu Leu Asn 1735 Asn 1735 Ser Ser Lys Lys Pro Pro Pro Pro Asp 1740 Asp 1740 Cys Cys Asp Asp Pro Pro Asn Asn Lys 1745 Lys 1745 Val Val Asn Asn Pro Pro Gly Gly Ser 1750 Ser 1750 Ser Ser Val Val Lys Lys Gly Gly Asp 1755 Asp 1755 Cys Cys Gly Gly Asn Asn Pro Pro Ser 1760 Ser 1760 Val Val Gly Gly Ile Ile Phe Phe Phe 1765 Phe 1765 Phe Phe Val Val Ser Ser Tyr Tyr Ile 1770 Ile 1770 Ile Ile Ile Ile Ser Ser Phe Phe Leu 1775 Leu 1775 Val Val Val Val Val Val Asn Asn Met 1780 Met 1780 Tyr Tyr Ile Ile Ala Ala Val Val Ile 1785 Ile 1785 Leu Leu Glu Glu Asn Asn Phe Phe Ser 1790 Ser 1790 Val Val Ala Ala Thr Thr Glu Glu Glu 1795 Glu 1795 Ser Ser Ala Ala Glu Glu Pro Pro Leu 1800 Leu 1800 Ser Ser Glu Glu Asp Asp

- 286 046157- 286 046157

Asp Asp Phe 1805 Phe 1805 Glu Glu Met Met Phe Phe Tyr Tyr Glu 1810 Glu 1810 Val Val Trp Trp Glu Glu Lys Lys Phe 1815 Phe 1815 Asp Asp Pro Pro Asp Asp Ala Ala Thr 1820 Thr 1820 Gln Gln Phe Phe Met Met Glu Glu Phe 1825 Phe 1825 Glu Glu Lys Lys Leu Leu Ser Ser Gln 1830 Gln 1830 Phe Phe Ala Ala Ala Ala Ala Ala Leu 1835 Leu 1835 Glu Glu Pro Pro Pro Pro Leu Leu Asn 1840 Asn 1840 Leu Leu Pro Pro Gln Gln Pro Pro Asn 1845 Asn 1845 Lys Lys Leu Leu Gln Gln Leu Leu Ile 1850 Ile 1850 Ala Ala Met Met Asp Asp Leu Leu Pro 1855 Pro 1855 Met Met Val Val Ser Ser Gly Gly Asp 1860 Asp 1860 Arg Arg Ile Ile His His Cys Cys Leu 1865 Leu 1865 Asp Asp Ile Ile Leu Leu Phe Phe Ala 1870 Ala 1870 Phe Phe Thr Thr Lys Lys Arg Arg Val 1875 Val 1875 Leu Leu Gly Gly Glu Glu Ser Ser Gly 1880 Gly 1880 Glu Glu Met Met Asp Asp Ala Ala Leu 1885 Leu 1885 Arg Arg Ile Ile Gln Gln Met Met Glu 1890 Glu 1890 Glu Glu Arg Arg Phe Phe Met Met Ala 1895 Ala 1895 Ser Ser Asn Asn Pro Pro Ser Ser Lys 1900 Lys 1900 Val Val Ser Ser Tyr Tyr Gln Gln Pro 1905 Pro 1905 Ile Ile Thr Thr Thr Thr Thr Thr Leu 1910 Leu 1910 Lys Lys Arg Arg Lys Lys Gln Gln Glu 1915 Glu 1915 Glu Glu Val Val Ser Ser Ala Ala Val 1920 Val 1920 Ile Ile Ile Ile Gln Gln Arg Arg Ala 1925 Ala 1925 Tyr Tyr Arg Arg Arg Arg His His Leu 1930 Leu 1930 Leu Leu Lys Lys Arg Arg Thr Thr Val 1935 Val 1935 Lys Lys Gln Gln Ala Ala Ser Ser Phe 1940 Phe 1940 Thr Thr Tyr Tyr Asn Asn Lys Lys Asn 1945 Asn 1945 Lys Lys Ile Ile Lys Lys Gly Gly Gly 1950 Gly 1950 Ala Ala Asn Asn Leu Leu Leu Leu Ile 1955 Ile 1955 Lys Lys Glu Glu Asp Asp Met Met Ile 1960 Ile 1960 Ile Ile Asp Asp Arg Arg Ile Ile Asn 1965 Asn 1965 Glu Glu Asn Asn Ser Ser Ile Ile Thr 1970 Thr 1970 Glu Glu Lys Lys Thr Thr Asp Asp Leu 1975 Leu 1975 Thr Thr Met Met Ser Ser Thr Thr Ala 1980 Ala 1980 Ala Ala Cys Cys Pro Pro Pro Pro Ser 1985 Ser 1985 Tyr Tyr Asp Asp Arg Arg Val Val Thr 1990 Thr 1990 Lys Lys Pro Pro Ile Ile Val Val Glu 1995 Glu 1995 Lys Lys His His Glu Glu Gln Gln Glu 2000 Glu 2000 Gly Gly Lys Lys Asp Asp Glu Glu Lys 2005 Lys 2005 Ala Ala Lys Lys Gly Gly Lys Lys

<210> <211> <212> <213> <210> <211> <212> <213> 173 1052 Белок Homo sapiens 173 1052 Protein Homo sapiens <400> <400> 173 173

- 287 046157- 287 046157

Lys Arg Asn Tyr Ile Leu Gly Leu Ala 1 5Lys Arg Asn Tyr Ile Leu Gly Leu Ala 1 5

Tyr Gly Ile Ile Asp Tyr Glu Thr ArgTyr Gly Ile Ile Asp Tyr Glu Thr Arg

2525

Arg Leu Phe Lys Glu Ala Asn Val GluArg Leu Phe Lys Glu Ala Asn Val Glu

4040

Lys Arg Gly Ala Arg Arg Leu Lys ArgLys Arg Gly Ala Arg Arg Leu Lys Arg

5555

Arg Val Lys Lys Leu Leu Phe Asp Tyr 65 70Arg Val Lys Lys Leu Leu Phe Asp Tyr 65 70

Glu Leu Ser Gly Ile Asn Pro Tyr Glu 85Glu Leu Ser Gly Ile Asn Pro Tyr Glu 85

Gln Lys Leu Ser Glu Glu Glu Phe SerGln Lys Leu Ser Glu Glu Glu Phe Ser

100 105100 105

Lys Arg Arg Gly Val His Asn Val AsnLys Arg Arg Gly Val His Asn Val Asn

115 120115 120

Asn Glu Leu Ser Thr Lys Glu Gln IleAsn Glu Leu Ser Thr Lys Glu Gln Ile

130 135130 135

Glu Glu Lys Tyr Val Ala Glu Leu GlnGlu Glu Lys Tyr Val Ala Glu Leu Gln

145 150145 150

Gly Glu Val Arg Gly Ser Ile Asn ArgGly Glu Val Arg Gly Ser Ile Asn Arg

165165

Lys Glu Ala Lys Gln Leu Leu Lys ValLys Glu Ala Lys Gln Leu Leu Lys Val

180 185180 185

Asp Gln Ser Phe Ile Asp Thr Tyr IleAsp Gln Ser Phe Ile Asp Thr Tyr Ile

195 200195 200

Thr Tyr Tyr Glu Gly Pro Gly Glu GlyThr Tyr Tyr Glu Gly Pro Gly Glu Gly

210 215210 215

Ile Lys Glu Trp Tyr Glu Met Leu MetIle Lys Glu Trp Tyr Glu Met Leu Met

225 230225 230

Glu Glu Leu Arg Ser Val Lys Tyr AlaGlu Glu Leu Arg Ser Val Lys Tyr Ala

245245

Gly Ile Thr Ser Val Gly 15Gly Ile Thr Ser Val Gly 15

Val Ile Asp Ala Gly ValVal Ile Asp Ala Gly Val

Asn Glu Gly Arg Arg Ser 45Asn Glu Gly Arg Arg Ser 45

Arg Arg His Arg Ile Gln 60Arg Arg His Arg Ile Gln 60

Leu Leu Thr Asp His Ser 75 80Leu Leu Thr Asp His Ser 75 80

Arg Val Lys Gly Leu Ser 95Arg Val Lys Gly Leu Ser 95

Ala Leu Leu His Leu AlaAla Leu Leu His Leu Ala

110110

Val Glu Glu Asp Thr GlyVal Glu Glu Asp Thr Gly

125125

Arg Asn Ser Lys Ala LeuArg Asn Ser Lys Ala Leu

140140

Glu Arg Leu Lys Lys AspGlu Arg Leu Lys Lys Asp

155 160155 160

Lys Thr Ser Asp Tyr ValLys Thr Ser Asp Tyr Val

175175

Lys Ala Tyr His Gln LeuLys Ala Tyr His Gln Leu

190190

Leu Leu Glu Thr Arg ArgLeu Leu Glu Thr Arg Arg

205205

Pro Phe Gly Trp Lys AspPro Phe Gly Trp Lys Asp

220220

His Cys Thr Tyr Phe ProHis Cys Thr Tyr Phe Pro

235 240235 240

Asn Ala Asp Leu Tyr AsnAsn Ala Asp Leu Tyr Asn

255255

- 288 046157- 288 046157

Ala Leu Asn Asp LeuAla Leu Asn Asp Leu

260260

Asn Asn Leu Val IleAsn Asn Leu Val Ile

265265

Thr Arg Asp Glu AsnThr Arg Asp Glu Asn

270270

Lys Leu Glu Tyr Tyr 275Lys Leu Glu Tyr Tyr 275

Glu Lys Phe Gln IleGlu Lys Phe Gln Ile

280280

Ile Glu Asn Val PheIle Glu Asn Val Phe

285285

Gln Lys Lys Lys Pro 290Gln Lys Lys Lys Pro 290

Thr Leu Lys Gln IleThr Leu Lys Gln Ile

295295

Ala Lys Glu Ile LeuAla Lys Glu Ile Leu

300300

Asn Glu Glu Asp Ile 305Asn Glu Glu Asp Ile 305

Lys Gly Tyr Arg Val 310Lys Gly Tyr Arg Val 310

Thr Ser Thr Gly Lys 315Thr Ser Thr Gly Lys 315

Glu Phe Thr Asn LeuGlu Phe Thr Asn Leu

325325

Lys Val Tyr His AspLys Val Tyr His Asp

330330

Ile Lys Asp Ile ThrIle Lys Asp Ile Thr

335335

Arg Lys Glu Ile IleArg Lys Glu Ile Ile

340340

Glu Asn Ala Glu LeuGlu Asn Ala Glu Leu

345345

Leu Asp Gln Ile AlaLeu Asp Gln Ile Ala

350350

Ile Leu Thr Ile TyrIle Leu Thr Ile Tyr

355355

Gln Ser Ser Glu Asp 360Gln Ser Ser Glu Asp 360

Ile Gln Glu Glu LeuIle Gln Glu Glu Leu

365365

Asn Leu Asn Ser GluAsn Leu Asn Ser Glu

370370

Leu Thr Gln Glu GluLeu Thr Gln Glu Glu

375375

Ile Glu Gln Ile SerIle Glu Gln Ile Ser

380380

Leu Lys Gly Tyr Thr 385Leu Lys Gly Tyr Thr 385

Gly Thr His Asn Leu 390Gly Thr His Asn Leu 390

Ser Leu Lys Ala Ile 395Ser Leu Lys Ala Ile 395

Leu Ile Leu Asp GluLeu Ile Leu Asp Glu

405405

Leu Trp His Thr AsnLeu Trp His Thr Asn

410410

Asp Asn Gln Ile AlaAsp Asn Gln Ile Ala

415415

Phe Asn Arg Leu LysPhe Asn Arg Leu Lys

420420

Leu Val Pro Lys LysLeu Val Pro Lys Lys

425425

Val Asp Leu Ser GlnVal Asp Leu Ser Gln

430430

Lys Glu Ile Pro ThrLys Glu Ile Pro Thr

435435

Thr Leu Val Asp AspThr Leu Val Asp Asp

440440

Phe Ile Leu Ser ProPhe Ile Leu Ser Pro

445445

Val Lys Arg Ser PheVal Lys Arg Ser Phe

450450

Ile Gln Ser Ile Lys 455Ile Gln Ser Ile Lys 455

Val Ile Asn Ala IleVal Ile Asn Ala Ile

460460

Lys Lys Tyr Gly Leu 465Lys Lys Tyr Gly Leu 465

Pro Asn Asp Ile Ile 470Pro Asn Asp Ile Ile 470

Ile Glu Leu Ala Arg 475Ile Glu Leu Ala Arg 475

Lys Asn Ser Lys AspLys Asn Ser Lys Asp

485485

Ala Gln Lys Met IleAla Gln Lys Met Ile

490490

Asn Glu Met Gln LysAsn Glu Met Gln Lys

495495

Asn Arg Gln Thr AsnAsn Arg Gln Thr Asn

500500

Glu Arg Ile Glu GluGlu Arg Ile Glu Glu

505505

Ile Ile Arg Thr ThrIle Ile Arg Thr Thr

510510

GluGlu

LysLys

ValVal

Pro 320Pro 320

AlaAla

LysLys

ThrThr

AsnAsn

Asn 400Asn 400

IleIle

GlnGln

ValVal

IleIle

Glu 480Glu 480

ArgArg

GlyGly

- 289 046157- 289 046157

LysLys

GlnGln

Leu 545Leu 545

SerSer

GluGlu

SerSer

AsnAsn

Leu 625Leu 625

IleIle

AsnAsn

LysLys

PhePhe

Leu 705Leu 705

AspAsp

AlaAla

PhePhe

Glu Asn Ala Lys Tyr 515Glu Asn Ala Lys Tyr 515

Glu Gly Lys Cys Leu 530Glu Gly Lys Cys Leu 530

Leu Asn Asn Pro PheLeu Asn Asn Pro Phe

550550

Val Ser Phe Asp AsnVal Ser Phe Asp Asn

565565

Glu Ala Ser Lys LysGlu Ala Ser Lys Lys

580580

Ser Asp Ser Lys IleSer Asp Ser Lys Ile

595595

Leu Ala Lys Gly Lys 610Leu Ala Lys Gly Lys 610

Leu Glu Glu Arg AspLeu Glu Glu Arg Asp

630630

Asn Arg Asn Leu ValAsn Arg Asn Leu Val

645645

Leu Leu Arg Ser Tyr 660Leu Leu Arg Ser Tyr 660

Ser Ile Asn Gly GlySer Ile Asn Gly Gly

675675

Lys Lys Glu Arg Asn 690Lys Lys Glu Arg Asn 690

Ile Ile Ala Asn AlaIle Ile Ala Asn Ala

710710

Lys Ala Lys Lys ValLys Ala Lys Lys Val

725725

Glu Ser Met Pro GluGlu Ser Met Pro Glu

740740

Ile Thr Pro His GlnIle Thr Pro His Gln

Leu Ile Glu Lys Ile 520Leu Ile Glu Lys Ile 520

Tyr Ser Leu Glu Ala 535Tyr Ser Leu Glu Ala 535

Asn Tyr Glu Val AspAsn Tyr Glu Val Asp

555555

Ser Phe Asn Asn LysSer Phe Asn Asn Lys

570570

Gly Asn Arg Thr Pro 585Gly Asn Arg Thr Pro 585

Ser Tyr Glu Thr PheSer Tyr Glu Thr Phe

600600

Gly Arg Ile Ser Lys 615Gly Arg Ile Ser Lys 615

Ile Asn Arg Phe SerIle Asn Arg Phe Ser

635635

Asp Thr Arg Tyr AlaAsp Thr Arg Tyr Ala

650650

Phe Arg Val Asn Asn 665Phe Arg Val Asn Asn 665

Phe Thr Ser Phe LeuPhe Thr Ser Phe Leu

680680

Lys Gly Tyr Lys His 695Lys Gly Tyr Lys His 695

Asp Phe Ile Phe LysAsp Phe Ile Phe Lys

715715

Met Glu Asn Gln MetMet Glu Asn Gln Met

730730

Ile Glu Thr Glu GlnIle Glu Thr Glu Gln

745745

Ile Lys His Ile LysIle Lys His Ile Lys

Lys Leu His Asp MetLys Leu His Asp Met

525525

Ile Pro Leu Glu Asp 540Ile Pro Leu Glu Asp 540

His Ile Ile Pro ArgHis Ile Ile Pro Arg

560560

Val Leu Val Lys GlnVal Leu Val Lys Gln

575575

Phe Gln Tyr Leu Ser 590Phe Gln Tyr Leu Ser 590

Lys Lys His Ile Leu 605Lys Lys His Ile Leu 605

Thr Lys Lys Glu Tyr 620Thr Lys Lys Glu Tyr 620

Val Gln Lys Asp PheVal Gln Lys Asp Phe

640640

Thr Arg Gly Leu MetThr Arg Gly Leu Met

655655

Leu Asp Val Lys ValLeu Asp Val Lys Val

670670

Arg Arg Lys Trp LysArg Arg Lys Trp Lys

685685

His Ala Glu Asp Ala 700His Ala Glu Asp Ala 700

Glu Trp Lys Lys LeuGlu Trp Lys Lys Leu

720720

Phe Glu Glu Lys GlnPhe Glu Glu Lys Gln

735735

Glu Tyr Lys Glu Ile 750Glu Tyr Lys Glu Ile 750

Asp Phe Lys Asp TyrAsp Phe Lys Asp Tyr

- 290 046157- 290 046157

755 760 765755 760 765

LysLys

Asp 785Asp 785

ValVal

LysLys

ProPro

GluGlu

Thr 865Thr 865

TyrTyr

ProPro

PhePhe

AsnAsn

Cys 945Cys 945

PhePhe

LeuLeu

ValVal

Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile AsnTyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn

770 775 780770 775 780

Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu IleThr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile

790 795 800790 795 800

Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu LysAsn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys

805 810 815805 810 815

Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His AspLeu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp

820 825 830820 825 830

Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly AspGln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp

835 840 845835 840 845

Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr LeuLys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu

850 855 860850 855 860

Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile LysLys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys

870 875 880870 875 880

Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp TyrTyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr

885 890 895885 890 895

Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr ArgAsn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg

900 905 910900 905 910

Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val LysAsp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys

915 920 925915 920 925

Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser LysLeu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys

930 935 940930 935 940

Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala GluTyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu

950 955 960950 955 960

Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly GluIle Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu

965 970 975965 970 975

Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile GluTyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu

980 985 990980 985 990

Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met AsnAsn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn

995 1000 1005995 1000 1005

- 291 046157- 291 046157

AspAsp

Lys 1010Lys 1010

ArgArg

ProPro

ProPro

ArgArg

Ile 1015Ile 1015

IleIle

LysLys

ThrThr

IleIle

AlaAla

10201020

SerSer

Lys ThrLys Thr

GlnGln

SerSer

10251025

IleIle

LysLys

LysLys

TyrTyr

SerSer

10301030

ThrThr

AspAsp

IleIle

LeuLeu

Gly 1035Gly 1035

AsnAsn

Leu TyrLeu Tyr

GluGlu

ValVal

10401040

LysLys

SerSer

LysLys

LysLys

HisHis

10451045

ProPro

GlnGln

IleIle

IleIle

Lys 1050Lys 1050

LysLys

Gly <210> 174 <211> 1148 <212> Белок <213> Искусственная последовательность <220>Gly <210> 174 <211> 1148 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 174<223> Description of artificial sequence: Synthetic polypeptide <400> 174

Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro AlaMet Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala

5 10155 1015

Ala Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val 20 2530Ala Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val 20 2530

Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 35 4045Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 35 4045

Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 50 5560Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 50 5560

Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 65 70 7580Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 65 70 7580

Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 85 9095Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 85 9095

Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly LeuSer Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu

100 105110100 105110

Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His LeuSer Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu

115 120125115 120125

Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp ThrAla Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr

130 135140130 135140

Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys AlaGly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala

145 150 155160145 150 155160

Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys LysLeu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys

- 292 046157- 292 046157

165165

170170

175175

Asp Gly Glu Val ArgAsp Gly Glu Val Arg

180180

Gly Ser Ile Asn ArgGly Ser Ile Asn Arg

185185

Phe Lys Thr Ser AspPhe Lys Thr Ser Asp

190190

Val Lys Glu Ala LysVal Lys Glu Ala Lys

195195

Gln Leu Leu Lys Val 200Gln Leu Leu Lys Val 200

Gln Lys Ala Tyr His 205Gln Lys Ala Tyr His 205

Leu Asp Gln Ser PheLeu Asp Gln Ser Phe

210210

Ile Asp Thr Tyr IleIle Asp Thr Tyr Ile

215215

Asp Leu Leu Glu ThrAsp Leu Leu Glu Thr

220220

Arg Thr Tyr Tyr Glu 225Arg Thr Tyr Tyr Glu 225

Gly Pro Gly Glu Gly 230Gly Pro Gly Glu Gly 230

Ser Pro Phe Gly Trp 235Ser Pro Phe Gly Trp 235

Asp Ile Lys Glu TrpAsp Ile Lys Glu Trp

245245

Tyr Glu Met Leu MetTyr Glu Met Leu Met

250250

Gly His Cys Thr TyrGly His Cys Thr Tyr

255255

Pro Glu Glu Leu ArgPro Glu Glu Leu Arg

260260

Ser Val Lys Tyr AlaSer Val Lys Tyr Ala

265265

Tyr Asn Ala Asp LeuTyr Asn Ala Asp Leu

270270

Asn Ala Leu Asn Asp 275Asn Ala Leu Asn Asp 275

Leu Asn Asn Leu ValLeu Asn Asn Leu Val

280280

Ile Thr Arg Asp GluIle Thr Arg Asp Glu

285285

Glu Lys Leu Glu TyrGlu Lys Leu Glu Tyr

290290

Tyr Glu Lys Phe Gln 295Tyr Glu Lys Phe Gln 295

Ile Ile Glu Asn ValIle Ile Glu Asn Val

300300

Lys Gln Lys Lys Lys 305Lys Gln Lys Lys Lys 305

Pro Thr Leu Lys Gln 310Pro Thr Leu Lys Gln 310

Ile Ala Lys Glu Ile 315Ile Ala Lys Glu Ile 315

Val Asn Glu Glu AspVal Asn Glu Glu Asp

325325

Ile Lys Gly Tyr ArgIle Lys Gly Tyr Arg

330330

Val Thr Ser Thr GlyVal Thr Ser Thr Gly

335335

Pro Glu Phe Thr AsnPro Glu Phe Thr Asn

340340

Leu Lys Val Tyr HisLeu Lys Val Tyr His

345345

Asp Ile Lys Asp IleAsp Ile Lys Asp Ile

350350

Ala Arg Lys Glu Ile 355Ala Arg Lys Glu Ile 355

Ile Glu Asn Ala GluIle Glu Asn Ala Glu

360360

Leu Leu Asp Gln Ile 365Leu Leu Asp Gln Ile 365

Lys Ile Leu Thr Ile 370Lys Ile Leu Thr Ile 370

Tyr Gln Ser Ser Glu 375Tyr Gln Ser Ser Glu 375

Asp Ile Gln Glu Glu 380Asp Ile Gln Glu Glu 380

Thr Asn Leu Asn Ser 385Thr Asn Leu Asn Ser 385

Glu Leu Thr Gln Glu 390Glu Leu Thr Gln Glu 390

Glu Ile Glu Gln Ile 395Glu Ile Glu Gln Ile 395

Asn Leu Lys Gly TyrAsn Leu Lys Gly Tyr

405405

Thr Gly Thr His AsnThr Gly Thr His Asn

410410

Leu Ser Leu Lys AlaLeu Ser Leu Lys Ala

415415

TyrTyr

GlnGln

ArgArg

Lys 240Lys 240

PhePhe

TyrTyr

AsnAsn

PhePhe

Leu 320Leu 320

LysLys

ThrThr

AlaAla

LeuLeu

Ser 400Ser 400

IleIle

- 293 046157- 293 046157

Asn Leu Ile Leu AspAsn Leu Ile Leu Asp

420420

Glu Leu Trp His ThrGlu Leu Trp His Thr

425425

Asn Asp Asn Gln IleAsn Asp Asn Gln Ile

430430

Ile Phe Asn Arg LeuIle Phe Asn Arg Leu

435435

Lys Leu Val Pro LysLys Leu Val Pro Lys

440440

Lys Val Asp Leu SerLys Val Asp Leu Ser

445445

Gln Lys Glu Ile Pro 450Gln Lys Glu Ile Pro 450

Thr Thr Leu Val AspThr Thr Leu Val Asp

455455

Asp Phe Ile Leu SerAsp Phe Ile Leu Ser

460460

Val Val Lys Arg Ser 465Val Val Lys Arg Ser 465

Phe Ile Gln Ser Ile 470Phe Ile Gln Ser Ile 470

Lys Val Ile Asn Ala 475Lys Val Ile Asn Ala 475

Ile Lys Lys Tyr GlyIle Lys Lys Tyr Gly

485485

Leu Pro Asn Asp IleLeu Pro Asn Asp Ile

490490

Ile Ile Glu Leu AlaIle Ile Glu Leu Ala

495495

Glu Lys Asn Ser LysGlu Lys Asn Ser Lys

500500

Asp Ala Gln Lys MetAsp Ala Gln Lys Met

505505

Ile Asn Glu Met GlnIle Asn Glu Met Gln

510510

Arg Asn Arg Gln Thr 515Arg Asn Arg Gln Thr 515

Asn Glu Arg Ile Glu 520Asn Glu Arg Ile Glu 520

Glu Ile Ile Arg Thr 525Glu Ile Ile Arg Thr 525

Gly Lys Glu Asn AlaGly Lys Glu Asn Ala

530530

Lys Tyr Leu Ile Glu 535Lys Tyr Leu Ile Glu 535

Lys Ile Lys Leu His 540Lys Ile Lys Leu His 540

Met Gln Glu Gly Lys 545Met Gln Glu Gly Lys 545

Cys Leu Tyr Ser Leu 550Cys Leu Tyr Ser Leu 550

Glu Ala Ile Pro Leu 555Glu Ala Ile Pro Leu 555

Asp Leu Leu Asn AsnAsp Leu Leu Asn Asn

565565

Pro Phe Asn Tyr GluPro Phe Asn Tyr Glu

570570

Val Asp His Ile IleVal Asp His Ile Ile

575575

Arg Ser Val Ser PheArg Ser Val Ser Phe

580580

Asp Asn Ser Phe AsnAsp Asn Ser Phe Asn

585585

Asn Lys Val Leu ValAsn Lys Val Leu Val

590590

Gln Glu Glu Ala SerGln Glu Glu Ala Ser

595595

Lys Lys Gly Asn ArgLys Lys Gly Asn Arg

600600

Thr Pro Phe Gln TyrThr Pro Phe Gln Tyr

605605

Ser Ser Ser Asp Ser 610Ser Ser Ser Asp Ser 610

Lys Ile Ser Tyr Glu 615Lys Ile Ser Tyr Glu 615

Thr Phe Lys Lys His 620Thr Phe Lys Lys His 620

Leu Asn Leu Ala Lys 625Leu Asn Leu Ala Lys 625

Gly Lys Gly Arg Ile 630Gly Lys Gly Arg Ile 630

Ser Lys Thr Lys Lys 635Ser Lys Thr Lys Lys 635

Tyr Leu Leu Glu GluTyr Leu Leu Glu Glu

645645

Arg Asp Ile Asn ArgArg Asp Ile Asn Arg

650650

Phe Ser Val Gln LysPhe Ser Val Gln Lys

655655

Phe Ile Asn Arg AsnPhe Ile Asn Arg Asn

660660

Leu Val Asp Thr ArgLeu Val Asp Thr Arg

665665

Tyr Ala Thr Arg GlyTyr Ala Thr Arg Gly

670670

AlaAla

GlnGln

ProPro

Ile 480Ile 480

ArgArg

LysLys

ThrThr

AspAsp

Glu 560Glu 560

ProPro

LysLys

LeuLeu

IleIle

Glu 640Glu 640

AspAsp

LeuLeu

- 294 046157- 294 046157

MetMet

ValVal

Lys 705Lys 705

AlaAla

LeuLeu

GlnGln

IleIle

Tyr 785Tyr 785

AsnAsn

IleIle

LysLys

AspAsp

Asp 865Asp 865

LeuLeu

LysLys

TyrTyr

Asn Leu Leu Arg Ser 675Asn Leu Leu Arg Ser 675

Lys Ser Ile Asn Gly 690Lys Ser Ile Asn Gly 690

Phe Lys Lys Glu ArgPhe Lys Lys Glu Arg

710710

Leu Ile Ile Ala AsnLeu Ile Ile Ala Asn

725725

Asp Lys Ala Lys Lys 740Asp Lys Ala Lys Lys 740

Ala Glu Ser Met ProAla Glu Ser Met Pro

755755

Phe Ile Thr Pro His 770Phe Ile Thr Pro His 770

Lys Tyr Ser His ArgLys Tyr Ser His Arg

790790

Asp Thr Leu Tyr SerAsp Thr Leu Tyr Ser

805805

Val Asn Asn Leu AsnVal Asn Asn Leu Asn

820820

Lys Leu Ile Asn LysLys Leu Ile Asn Lys

835835

Pro Gln Thr Tyr Gln 850Pro Gln Thr Tyr Gln 850

Glu Lys Asn Pro LeuGlu Lys Asn Pro Leu

870870

Thr Lys Tyr Ser LysThr Lys Tyr Ser Lys

885885

Tyr Tyr Gly Asn Lys 900Tyr Tyr Gly Asn Lys 900

Pro Asn Ser Arg Asn 915Pro Asn Ser Arg Asn 915

Tyr Phe Arg Val Asn 680Tyr Phe Arg Val Asn 680

Gly Phe Thr Ser Phe 695Gly Phe Thr Ser Phe 695

Asn Lys Gly Tyr LysAsn Lys Gly Tyr Lys

715715

Ala Asp Phe Ile PheAla Asp Phe Ile Phe

730730

Val Met Glu Asn GlnVal Met Glu Asn Gln

745745

Glu Ile Glu Thr GluGlu Ile Glu Thr Glu

760760

Gln Ile Lys His Ile 775Gln Ile Lys His Ile 775

Val Asp Lys Lys ProVal Asp Lys Lys Pro

795795

Thr Arg Lys Asp AspThr Arg Lys Asp Asp

810810

Gly Leu Tyr Asp Lys 825Gly Leu Tyr Asp Lys 825

Ser Pro Glu Lys LeuSer Pro Glu Lys Leu

840840

Lys Leu Lys Leu Ile 855Lys Leu Lys Leu Ile 855

Tyr Lys Tyr Tyr GluTyr Lys Tyr Tyr Glu

875875

Lys Asp Asn Gly ProLys Asp Asn Gly Pro

890890

Leu Asn Ala His LeuLeu Asn Ala His Leu

905905

Lys Val Val Lys Leu 920Lys Val Val Lys Leu 920

Asn Leu Asp Val LysAsn Leu Asp Val Lys

685685

Leu Arg Arg Lys Trp 700Leu Arg Arg Lys Trp 700

His His Ala Glu AspHis His Ala Glu Asp

720720

Lys Glu Trp Lys LysLys Glu Trp Lys Lys

735735

Met Phe Glu Glu Lys 750Met Phe Glu Glu Lys 750

Gln Glu Tyr Lys Glu 765Gln Glu Tyr Lys Glu 765

Lys Asp Phe Lys Asp 780Lys Asp Phe Lys Asp 780

Asn Arg Glu Leu IleAsn Arg Glu Leu Ile

800800

Lys Gly Asn Thr LeuLys Gly Asn Thr Leu

815815

Asp Asn Asp Lys Leu 830Asp Asn Asp Lys Leu 830

Leu Met Tyr His His 845Leu Met Tyr His His 845

Met Glu Gln Tyr Gly 860Met Glu Gln Tyr Gly 860

Glu Thr Gly Asn TyrGlu Thr Gly Asn Tyr

880880

Val Ile Lys Lys IleVal Ile Lys Lys Ile

895895

Asp Ile Thr Asp Asp 910Asp Ile Thr Asp Asp 910

Ser Leu Lys Pro TyrSer Leu Lys Pro Tyr

925925

- 295 046157- 295 046157

Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr ValArg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val

930 935940930 935940

Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn SerLys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser

945 950 955960945 950 955960

Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln AlaLys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala

965 970975965 970975

Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn GlyGlu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly

980 985990980 985990

Glu Leu Tyr Arg Val IleGlu Leu Tyr Arg Val Ile

995995

Gly Val Asn Asn Asp Leu Leu Asn Arg IleGly Val Asn Asn Asp Leu Leu Asn Arg Ile

1000100510001005

Glu Val Glu Val Asn Asn Met Met Ile Ile Asp Asp Ile 1015 Ile 1015 Thr Thr Tyr Tyr Arg Arg Glu Glu Tyr 1020 Tyr 1020 Leu Leu Glu Glu Asn Asn 1010 1010 Met Met Asn 1025 Asn 1025 Asp Asp Lys Lys Arg Arg Pro Pro Pro 1030 Pro 1030 Arg Arg Ile Ile Ile Ile Lys Lys Thr 1035 Thr 1035 Ile Ile Ala Ala Ser Ser Lys Lys Thr 1040 Thr 1040 Gln Gln Ser Ser Ile Ile Lys Lys Lys 1045 Lys 1045 Tyr Tyr Ser Ser Thr Thr Asp Asp Ile 1050 Ile 1050 Leu Leu Gly Gly Asn Asn Leu Leu Tyr 1055 Tyr 1055 Glu Glu Val Val Lys Lys Ser Ser Lys 1060 Lys 1060 Lys Lys His His Pro Pro Gln Gln Ile 1065 Ile 1065 Ile Ile Lys Lys Lys Lys Gly Gly Lys 1070 Lys 1070 Arg Arg Pro Pro Ala Ala Ala Ala Thr 1075 Thr 1075 Lys Lys Lys Lys Ala Ala Gly Gly Gln 1080 Gln 1080 Ala Ala Lys Lys Lys Lys Lys Lys Lys 1085 Lys 1085 Gly Gly Ser Ser Tyr Tyr Pro Pro Tyr 1090 Tyr 1090 Asp Asp Val Val Pro Pro Asp Asp Tyr 1095 Tyr 1095 Ala Ala Leu Leu Glu Glu Asp Asp Ala 1100 Ala 1100 Leu Leu Asp Asp Asp Asp Phe Phe Asp 1105 Asp 1105 Leu Leu Asp Asp Met Met Leu Leu Gly 1110 Gly 1110 Ser Ser Asp Asp Ala Ala Leu Leu Asp 1115 Asp 1115 Asp Asp Phe Phe Asp Asp Leu Leu Asp 1120 Asp 1120 Met Met Leu Leu Gly Gly Ser Ser Asp 1125 Asp 1125 Ala Ala Leu Leu Asp Asp Asp Asp Phe 1130 Phe 1130 Asp Asp Leu Leu Asp Asp Met Met Leu 1135 Leu 1135 Gly Gly Ser Ser Asp Asp Ala Ala Leu 1140 Leu 1140 Asp Asp Asp Asp Phe Phe

Asp Leu Asp Met LeuAsp Leu Asp Met Leu

1145 <210> 1751145 <210> 175

- 296 046157 <211> 387 <212> Белок <213> Homo sapiens <400> 175- 296 046157 <211> 387 <212> Protein <213> Homo sapiens <400> 175

Met Thr Gly Lys Leu 1 5Met Thr Gly Lys Leu 1 5

Ala Glu Lys Leu ProAla Glu Lys Leu Pro

Val Thr Met Ser SerVal Thr Met Ser Ser

Leu Asn Gln Leu ProLeu Asn Gln Leu Pro

Asp Asn Leu Tyr ProAsp Asn Leu Tyr Pro

Glu Glu Ile Pro SerGlu Glu Ile Pro Ser

Leu Asn Leu Phe SerLeu Asn Leu Phe Ser

Gly Ser Ser Asp Ser 40Gly Ser Ser Asp Ser 40

Val Val His Tyr Asn 45Val Val His Tyr Asn 45

Met Ala Thr Glu Asn 50Met Ala Thr Glu Asn 50

Val Met Asp Ile Gly 55Val Met Asp Ile Gly 55

Leu Thr Asn Glu Lys 60Leu Thr Asn Glu Lys 60

Asn Pro Glu Leu Ser 65Asn Pro Glu Leu Ser 65

Tyr Ser Gly Ser Phe 70Tyr Ser Gly Ser Phe 70

Gln Pro Ala Pro Gly 75Gln Pro Ala Pro Gly 75

Lys Thr Val Thr TyrLys Thr Val Thr Tyr

Leu Gly Lys Phe AlaLeu Gly Lys Phe Ala

Phe Asp Ser Pro SerPhe Asp Ser Pro Ser

Trp Cys Gln Asp AsnTrp Cys Gln Asp Asn

100100

Ile Ile Ser Leu MetIle Ile Ser Leu Met

105105

Ser Ala Gly Ile LeuSer Ala Gly Ile Leu

110110

Val Pro Pro Ala SerVal Pro Pro Ala Ser

115115

Gly Ala Leu Ser Thr 120Gly Ala Leu Ser Thr 120

Gln Thr Ser Thr AlaGln Thr Ser Thr Ala

125125

Met Val Gln Pro ProMet Val Gln Pro

130130

Gln Gly Asp Val Glu 135Gln Gly Asp Val Glu 135

Ala Met Tyr Pro Ala 140Ala Met Tyr Pro Ala 140

Pro Pro Tyr Ser Asn 145Pro Pro Tyr Ser Asn 145

Cys Gly Asp Leu Tyr 150Cys Gly Asp Leu Tyr 150

Ser Glu Pro Val Ser 155Ser Glu Pro Val Ser 155

His Asp Pro Gln GlyHis Asp Pro Gln Gly

165165

Asn Pro Gly Leu AlaAsn Pro Gly Leu Ala

170170

Tyr Ser Pro Gln AspTyr Ser Pro Gln Asp

175175

Gln Ser Ala Lys ProGln Ser Ala Lys Pro

180180

Ala Leu Asp Ser AsnAla Leu Asp Ser Asn

185185

Leu Phe Pro Met IleLeu Phe Pro Met Ile

190190

Asp Tyr Asn Leu Tyr 195Asp Tyr Asn Leu Tyr 195

His His Pro Asn AspHis His Pro Asn Asp

200200

Met Gly Ser Ile Pro 205Met Gly Ser Ile Pro 205

His Lys Pro Phe Gln 210His Lys Pro Phe Gln 210

Gly Met Asp Pro Ile 215Gly Met Asp Pro Ile 215

Arg Val Asn Pro Pro 220Arg Val Asn Pro Pro 220

Ile Thr Pro Leu Glu 225Ile Thr Pro Leu Glu 225

Thr Ile Lys Ala Phe 230Thr Ile Lys Ala Phe 230

Lys Asp Lys Gln Ile 235Lys Asp Lys Gln Ile 235

LeuLeu

AlaAla

GlnGln

ProPro

Asn 80Asn 80

AsnAsn

GlyGly

SerSer

LeuLeu

Phe 160Phe 160

TyrTyr

ProPro

GluGlu

ProPro

His 240His 240

- 297 046157- 297 046157

Pro Gly Phe Gly Ser Leu Pro Gln Pro Pro Leu Thr Leu Lys Pro IlePro Gly Phe Gly Ser Leu Pro Gln Pro Pro Leu Thr Leu Lys Pro Ile

245 250255245 250255

Arg Pro Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Leu His GluArg Pro Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Leu His Glu

260 265270260 265270

Arg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser ArgArg Pro His Ala Cys Pro Ala Glu Gly Cys Asp Arg Arg Phe Ser Arg

275 280285275 280285

Ser Asp Glu Leu Thr Arg His Leu Arg Ile His Thr Gly His Lys ProSer Asp Glu Leu Thr Arg His Leu Arg Ile His Thr Gly His Lys Pro

290 295300290 295300

Phe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg Ser Asp His LeuPhe Gln Cys Arg Ile Cys Met Arg Ser Phe Ser Arg Ser Asp His Leu

305 310 315320305 310 315320

Thr Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys GluThr Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Glu

325 330335325 330335

Phe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His AlaPhe Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His Ala

340 345350340 345350

Lys Ile His Leu Lys Gln Lys Glu Lys Lys Ala Glu Lys Gly Gly AlaLys Ile His Leu Lys Gln Lys Glu Lys Lys Ala Glu Lys Gly Gly Ala

355 360365355 360365

Pro Ser Ala Ser Ser Ala Pro Pro Val Ser Leu Ala Pro Val Val ThrPro Ser Ala Ser Ser Ala Pro Pro Val Ser Leu Ala Pro Val Val Thr

370 375380370 375380

Thr Cys Ala 385 <210> 176 <211> 543 <212> Белок <213> Homo sapiens <400> 176Thr Cys Ala 385 <210> 176 <211> 543 <212> Protein <213> Homo sapiens <400> 176

Met Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser Pro Leu Gln IleMet Ala Ala Ala Lys Ala Glu Met Gln Leu Met Ser Pro Leu Gln Ile

5 10155 1015

Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr Met Asp Asn Tyr 20 2530Ser Asp Pro Phe Gly Ser Phe Pro His Ser Pro Thr Met Asp Asn Tyr 20 2530

Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly Ala Pro Gln Phe 35 4045Pro Lys Leu Glu Glu Met Met Leu Leu Ser Asn Gly Ala Pro Gln Phe 35 4045

Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser 50 5560Leu Gly Ala Ala Gly Ala Pro Glu Gly Ser Gly Ser Asn Ser Ser Ser 50 5560

- 298 046157- 298 046157

Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser 65 70 75Ser Ser Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser 65 70 75

Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln 85 90 95Ser Ser Ser Ser Thr Phe Asn Pro Gln Ala Asp Thr Gly Glu Gln 85 90 95

Tyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu AsnTyr Glu His Leu Thr Ala Glu Ser Phe Pro Asp Ile Ser Leu Asn

100 105 110100 105 110

Glu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr ArgGlu Lys Val Leu Val Glu Thr Ser Tyr Pro Ser Gln Thr Thr Arg

115 120 125115 120 125

Pro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala ProPro Pro Ile Thr Tyr Thr Gly Arg Phe Ser Leu Glu Pro Ala Pro

130 135 140130 135 140

Ser Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val SerSer Gly Asn Thr Leu Trp Pro Glu Pro Leu Phe Ser Leu Val Ser

145 150 155145 150 155

Leu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala ProLeu Val Ser Met Thr Asn Pro Pro Ala Ser Ser Ser Ser Ala Pro

165 170 175165 170 175

Pro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu SerPro Ala Ala Ser Ser Ala Ser Ala Ser Gln Ser Pro Pro Leu Ser

180 185 190180 185 190

Ala Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala ProAla Val Pro Ser Asn Asp Ser Ser Pro Ile Tyr Ser Ala Ala Pro

195 200 205195 200 205

Phe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser GlnPhe Pro Thr Pro Asn Thr Asp Ile Phe Pro Glu Pro Gln Ser Gln

210 215 220210 215 220

Phe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro AlaPhe Pro Gly Ser Ala Gly Thr Ala Leu Gln Tyr Pro Pro Pro Ala

225 230 235225 230 235

Pro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp TyrPro Ala Ala Lys Gly Gly Phe Gln Val Pro Met Ile Pro Asp Tyr

245 250 255245 250 255

Phe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp GlnPhe Pro Gln Gln Gln Gly Asp Leu Gly Leu Gly Thr Pro Asp Gln

260 265 270260 265 270

Pro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu ThrPro Phe Gln Gly Leu Glu Ser Arg Thr Gln Gln Pro Ser Leu Thr

275 280 285275 280 285

Leu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln AspLeu Ser Thr Ile Lys Ala Phe Ala Thr Gln Ser Gly Ser Gln Asp

290 295 300290 295 300

Lys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro SerLys Ala Leu Asn Thr Ser Tyr Gln Ser Gln Leu Ile Lys Pro Ser

305 310 315305 310 315

Ser 80Ser 80

ProPro

AsnAsn

LeuLeu

AsnAsn

Gly 160Gly 160

SerSer

CysCys

ThrThr

AlaAla

Tyr 240Tyr 240

LeuLeu

LysLys

ProPro

LeuLeu

Arg 320Arg 320

- 299 046157- 299 046157

Met Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu ArgMet Arg Lys Tyr Pro Asn Arg Pro Ser Lys Thr Pro Pro His Glu Arg

325 330335325 330335

Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg SerPro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser

340 345350340 345350

Asp Glu Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys Pro PheAsp Glu Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe

355 360365355 360365

Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His Leu ThrGln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr

370 375380370 375380

Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp IleThr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile

385 390 395400385 390 395400

Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His Thr LysCys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His Thr Lys

405 410415405 410415

Ile His Leu Arg Gln Lys Asp Lys Lys Ala Asp Lys Ser Val Val AlaIle His Leu Arg Gln Lys Asp Lys Lys Ala Asp Lys Ser Val Val Ala

420 425430420 425430

Ser Ser Ala Thr Ser Ser Leu Ser Ser Tyr Pro Ser Pro Val Ala ThrSer Ser Ala Thr Ser Ser Leu Ser Ser Tyr Pro Ser Pro Val Ala Thr

435 440445435 440445

Ser Tyr Pro Ser Pro Val Thr Thr Ser Tyr Pro Ser Pro Ala Thr ThrSer Tyr Pro Ser Pro Val Thr Thr Ser Tyr Pro Ser Pro Ala Thr Thr

450 455460450 455460

Ser Tyr Pro Ser Pro Val Pro Thr Ser Phe Ser Ser Pro Gly Ser SerSer Tyr Pro Ser Pro Val Pro Thr Ser Phe Ser Ser Pro Gly Ser Ser

465 470 475480465 470 475480

Thr Tyr Pro Ser Pro Val His Ser Gly Phe Pro Ser Pro Ser Val AlaThr Tyr Pro Ser Pro Val His Ser Gly Phe Pro Ser Pro Ser Val Ala

485 490495485 490495

Thr Thr Tyr Ser Ser Val Pro Pro Ala Phe Pro Ala Gln Val Ser SerThr Thr Tyr Ser Ser Val Pro Pro Ala Phe Pro Ala Gln Val Ser Ser

500 505510500 505510

Phe Pro Ser Ser Ala Val Thr Asn Ser Phe Ser Ala Ser Thr Gly LeuPhe Pro Ser Ser Ala Val Thr Asn Ser Phe Ser Ala Ser Thr Gly Leu

515 520525515 520525

Ser Asp Met Thr Ala Thr Phe Ser Pro Arg Thr Ile Glu Ile CysSer Asp Met Thr Ala Thr Phe Ser Pro Arg Thr Ile Glu Ile Cys

530 535540 <210> 177 <211> 8 <212> Белок <213> Искусственная последовательность530 535540 <210> 177 <211> 8 <212> Protein <213> Artificial sequence

- 300 046157 <220>- 300 046157 <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 177<223> Description of artificial sequence: Synthetic peptide <400> 177

Gly Gly Ser Gly Gly Gly Ser GlyGly Gly Ser Gly Gly Gly Ser Gly

5 <210> 178 <211> 16 <212> Белок <213> Искусственная последовательность <220>5 <210> 178 <211> 16 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <400> 178<223> Description of artificial sequence: Synthetic peptide <400> 178

Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly 1 5 10 15 <210> 179 <211> 4 <212> Белок <213> Искусственная последовательность <220>Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly 1 5 10 15 <210> 179 <211> 4 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <220><223> Description of artificial sequence: Synthetic peptide <220>

<223> Смотри первоначальное описание заявки для подробного описания замен и предпочтительных вариантов осуществления <400> 179<223> See the original application description for a detailed description of substitutions and preferred embodiments <400> 179

Gly Gly Gly Ser <210> 180 <211> 5 <212> Белок <213> Искусственная последовательность <220>Gly Gly Gly Ser <210> 180 <211> 5 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический пептид <220><223> Description of artificial sequence: Synthetic peptide <220>

<223> Смотри первоначальное описание заявки для подробного описания замен и предпочтительных вариантов осуществления <400> 180<223> See original application description for detailed description of substitutions and preferred embodiments <400> 180

Gly Gly Gly Gly SerGly Gly Gly Gly Ser

5 <210> 181 <211> 4 <212> Белок <213> Искусственная последовательность5 <210> 181 <211> 4 <212> Protein <213> Artificial sequence

- 301 046157 <220>- 301 046157 <220>

<223> Описание искусственной последовательности: Синтетический пептид <220><223> Description of artificial sequence: Synthetic peptide <220>

<223> Смотри первоначальное описание заявки для подробного описания замен и предпочтительных вариантов осуществления <400> 181<223> See the original application description for a detailed description of substitutions and preferred embodiments <400> 181

Gly Gly Ser Gly <210> 182 <211> 9 <212> ДНК <213> Homo sapiens <400> 182 gcgkgggcg 9 <210> 183 <211> 76 <212> ДНК <213> Искусственная последовательность <220>Gly Gly Ser Gly <210> 182 <211> 9 <212> DNA <213> Homo sapiens <400> 182 gcgkgggcg 9 <210> 183 <211> 76 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 183 gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60 caacttgttg gcgaga 76 <210> 184 <211> 3871 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic oligonucleotide <400> 183 gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60 caacttgttg gcgaga 76 <210> 184 <211> 3871 <212> DNA <213> Artificial sequence <2 20>

<223> Описание искусственной последовательности: Синтетический полинуклеотид<223> Description of artificial sequence: Synthetic polynucleotide

<400> 184 ggaggaagcc <400> 184 ggaggaagcc atcaactaaa atcaactaaa ctacaatgac ctacaatgac tgtaagatac tgtaagatac aaaattggga aaaattggga atggtaacat atggtaacat 60 60 attttgaagt attttgaagt tctgttgaca tctgttgaca taaagaatca taaagaatca tgatattaat tgatattaat gcccatggaa gcccatggaa atgaaagggc atgaaagggc 120 120 gatcaacact gatcaacact atggtttgaa atggtttgaa aagggggaaa aagggggaaa ttgtagagca ttgtagagca cagatgtgtt cagatgtgtt cgtgtggcag cgtgtggcag 180 180 tgtgctgtct tgtgctgtct ctagcaatac ctagcaatac tcagagaaga tcagagaaga gagagaacaa gagagaacaa tgaaattctg tgaaattctg attggcccca attggcccca 240 240 gtgtgagccc gtgtgagccc agatgaggtt agatgaggtt cagctgccaa cagctgccaa ctttctcttt ctttctcttt cacatcttat cacatcttat gaaagtcatt gaaagtcatt 300 300 taagcacaac taagcacaac taactttttt taactttttt tttttttttt tttttttttt tttttttgag tttttttgag acagagtctt acagagtctt gctctgttgc gctctgttgc 360 360 ccaggacaga ccaggacaga gtgcagtagt gtgcagtagt gactcaatct gactcaatct cggctcactg cggctcactg cagcctccac cagcctccac ctcctaggct ctcctaggct 420 420 caaacggtcc caaacggtcc tcctgcatca tcctgcatca gcctcccaag gcctcccaag tagctggaat tagctggaat tacaggagtg tacaggagtg gcccaccatg gccccacatg 480 480

- 302 046157 cccagctaat ttttgtattt ttaatagata cgggggtttc accatatcac ccaggctggt 540 ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata600 ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaatatt taaaaaattg660 gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg720 aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag780 agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc840 tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg900 gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag960 gcaaaaccgc cgctcgtctc ctacaatata tgggaggggg aggttgagta cgttctggat1020 tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc1080 gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac1140 tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc1200 actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct1260 ggcgctcgcg tgcgagaggg aactagcgag aacgaggaag cagctggagg tgacgccggg1320 cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc1380 gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt1440 cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac1500 cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga1560 aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgctgccc1620 gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg1680 gccaagtccg agggagaacg taaagatatg ggcctttttc cccctctcac cttgtctcac1740 caaagtccct agtccccgga gcagttagcc tctttctttc cagggaatta gccagacaca1800 acaacgggaa ccagacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccg ccgaccacct gatgctcgcc gagggctacc2100 gcctggtgca gaggccgccg tccgccgccg ccgcccatgg ccctcatgcg ctccggactc2160 tgccgccgta cgcgggcccg ggcctggaca gtgggctgag gccgcggggg gctccgctgg2220 ggccgccgcc gccccgccaa cccggggccc tggcgtacgg ggccttcggg ccgccgtcct2280 ccttccagcc ctttccggcc gtgcctccgc cggccgcggg catcgcgcac ctgcagcctg2340- 302 046157 cccagctaat tttttattt ttaatagata cgggggtttc accatatcac ccaggctggt 540 ctcgaactcc tggcctcaag tgatccacct gcctcggcct cccaaagtgc tgggattata600 ggcgtcagcc actatgccca acccgaccaa ccttttttaa aataaat att taaaaaattg660 gtatttcaca tatatactag tatttacatt tatccacaca aaacggacgg gcctccgctg720 aaccagtgag gccccagacg tgcgcataaa taacccctgc gtgctgcacc acctggggag780 agggggagga ccacggtaaa tggagcgagc gcatagcaaa agggacgcgg ggtccttttc840 tctgccggtg gcactgggta gctgtggcca ggtgtggtac tttgatgggg cccagggctg900 gagctcaagg aagcgtcgca gggtcacaga tctgggggaa ccccggggaa aagcactgag960 gcaaaaccgc cgctcgtctc ctacaatata tgggagggggg aggttgagta cgttctggat1020 tactcataag accttttttt tttccttccg ggcgcaaaac cgtgagctgg atttataatc1080 gccctataaa gctccagagg cggtcaggca cctgcagagg agccccgccg ctccgccgac1140 tagctgcccc cgcgagcaac ggcctcgtga tttccccgcc gatccggtcc ccgcctcccc1200 actctgcccc cgcctacccc ggagccgtgc agccgcctct ccgaatctct ctcttctcct1260 ggcgctcgcg tgcgaga ggg aactagcgag aacgaggaag cagctggagg tgacgccggg1320 cagattacgc ctgtcagggc cgagccgagc ggatcgctgg gcgctgtgca gaggaaaggc1380 gggagtgccc ggctcgctgt cgcagagccg aggtgggtaa gctagcgacc acctggactt1440 cccagcgccc aaccgtggct tttcagccag gtcctctcct cccgcggctt ctcaaccaac1500 cccatcccag cgccggccac ccaacctccc gaaatgagtg cttcctgccc cagcagccga1560 aggcgctact aggaacggta acctgttact tttccagggg ccgtagtcga cccgct gccc1620 gagttgctgt gcgactgcgc gcgcggggct agagtgcaag gtgactgtgg ttcttctctg1680 gccaagtccg agggaacg taaagatatg ggcctttttc cccctctcac cttgtctcac1740 caaagtccct agtccccgga gcagttagcc tctttct ttc cagggaatta gccagacaca1800 acaacgggaa cgacacaccg aaccagacat gcccgccccg tgcgccctcc ccgctcgctg1860 cctttcctcc ctcttgtctc tccagagccg gatcttcaag gggagcctcc gtgcccccgg1920 ctgctcagtc cctccggtgt gcaggacccc ggaagtcctc cccgcacagc tctcgcttct1980 ctttgcagcc tgtttctgcg ccggaccagt cgaggactct ggacagtaga ggccccggga2040 cgaccgagct ggaattcgcc accatggccg ccgaccacct gatgctcgcc gagggctacc2100 gcctggtgca gaggcc gccg tccgccgccg ccgcccatgg ccctcatgcg ctccggactc2160 tgccgccgta cgcgggcccg ggcctggaca gtgggctgag gccgcggggg gctccgctgg2220 ggccgccgcc gccccgccaa cccggggccc tggcgtacgg ggccttcggg ccgccgtcct2280 ccttccagcc ctttccggcc gtgcctccgc cggccgcggg catcgcgcac ctgcagcctg2340

- 303 046157 tggcgacgcc gtaccccggc cgcgcggccg cgccccccaa cgctccggga ggccccccgg 2400 gcccgcagcc ggccccaagc gccgcagccc cgccgccgcc cgcgcacgcc ctgggcggca2460 tggacgccga actcatcgac gaggaggcgc tgacgtcgct ggagctggag ctggggctgc2520 accgcgtgcg cgagctgccc gagctgttcc tgggccagag cgagttcgac tgcttctcgg2580 acttggggtc cgcgccgccc gccggctccg tgagctgcgg tggttctggt ggtggttctg2640 gtcagtccca gctcatcaaa cccagccgca tgcgcaagta ccccaaccgg cccagcaaga2700 cgccccccca cgaacgccct tacgcttgcc cagtggagtc ctgtgatcgc cgcttctccc2760 gcagcgacaa cctggtgaga cacatccgca tccacacagg ccagaagccc ttccagtgcc2820 gcatctgcat gagaaacttc agccgagagg ataacttgca cactcacatc cgcacccaca2880 caggcgaaaa gcccttcgcc tgcgacatct gtggaagaaa gtttgcccgg agcgatgaac2940 ttgtccgaca taccaagatc cacttgcggc agaaggaccg cccttacgct tgcccagtgg3000 agtcctgtga tcgccgcttc tcccaatcag ggaatctgac tgagcacatc cgcatccaca3060 caggccagaa gcccttccag tgccgcatct gcatgagaaa cttcagcaca agtggacatc3120 tggtacgcca catccgcacc cacacaggcg aaaagccctt cgcctgcgac atctgtggaa3180 gaaagtttgc ccagaatagt accctgaccg aacataccaa gatccacttg cggcagaagg3240 acaagtaact cgaggaaacc cagcagacaa tgtagctaga cccagtagcc agatgtagct3300 aaagagaccg gttcactgtg agaaacccag cagacaatgt agctagaccc agtagccaga3360 tgtagctaaa gagaccggtt cactgtgaaa gcttgggtgg catccctgtg acccctcccc3420 agtgcctctc ctggccctgg aagttgccac tccagtgccc accagccttg tcctaataaa3480 attaagttgc atcattttgt ctgactaggt gtccttctat aatattatgg ggtggagggg3540 ggtggtatgg agcaaggggc aagttgggaa gacaacctgt agggcctgcg gggtctattg3600 ggaaccaagc tggagtgcag tggcacaatc ttggctcact gcaatctccg cctcctgggt3660 tcaagcgatt ctcctgcctc agcctcccga gttgttggga ttccaggcat gcatgaccag3720 gctcagctaa tttttgtttt tttggtagag acggggtttc accatattgg ccaggctggt3780 ctccaactcc taatctcagg tgatctaccc accttggcct cccaaattgc tgggattaca3840 ggcgtgaacc actgctccct tccctgtcct t3871 <210> 185 <211> 22 <212> ДНК <213> Искусственная последовательность <220>- 303 046157 tggcgacgcc gtaccccggc cgcgcggccg cgccccccaa cgctccggga ggccccccgg 2400 gcccgcagcc ggccccaagc gccgcagccc cgccgccgcc cgcgcacgcc ctgggcggca2460 tggacgccga actcatcgac gaggaggcgc tgacg tcgct ggagctggag ctggggctgc2520 accgcgtgcg cgagctgccc gagctgttcc tgggccagag cgagttcgac tgcttctcgg2580 acttggggtc cgcgccgccc gccggctccg tgagctgcgg tggttctggt ggtggttctg2640 gtcagtccca gctcat caaa cccagccgca tgcgcaagta ccccaaccgg cccagcaaga2700 cgccccccca cgaacgccct tacgcttgcc cagtggagtc ctgtgatcgc cgcttctccc2760 gcagcgacaa cctggtgaga cacatccgca tccacacagg ccagaagccc ttccagtgcc2820 gcatctgcat gagaaacttc agccgagagg ataacttgca cactcacatc cgcacccaca2880 caggcgaaaa gcccttcgcc tgcgacatct gtggaagaaa gtttgcccgg agcgatgaac2940 ttgtccgaca taccaagatc cacttgcggc agaa ggaccg cccttacgct tgcccagtgg3000 agtcctgtga tcgccgcttc tcccaatcag ggaatctgac tgagcacatc cgcatccaca3060 caggccagaa gcccttccag tgccgcatct gcatgagaaa cttcagcaca agtggacatc3120 tggtacgcca catccgcacc cacacaggcg aaa agccctt cgcctgcgac atctgtggaa3180 gaaagtttgc ccagaatagt accctgaccg aacataccaa gatccacttg cggcagaagg3240 acaagtaact cgaggaaacc cagcagacaa tgtagctaga cccagtagcc agatgtagct3300 aaagagaccg gttcactgtg agaaacccag cagacaatgt agctagaccc agtagccaga3360 tgtagctaaa gagaccggtt cactgtgaaa gcttgggtgg catccctgtg acccctcccc3420 agtgcctctc ctggccctgg aagttgccac tccagtgccc accagccttg tcctaataa a3480 attaagttgc atcattttgt ctgactaggt gtccttctat aatattatgg ggtggagggg3540 ggtggtatgg agcaaggggc aagttgggaa gacaacctgt agggcctgcg gggtctattg3600 ggaaccaagc tggagtgcag tggcacaatc ttggctcact gcaatctcc g cctcctgggt3660 tcaagcgatt ctcctgcctc agcctcccga gttgttggga ttccaggcat gcatgaccag3720 gctcagctaa tttttgtttt tttggtagag acggggtttc accatattgg ccaggctggt3780 ctccaactcc taatctcagg tgatctaccc accttggcct cccaaattgc tgggattaca3840 ggcgtgaacc actgctccct tccctgtcct t3871 <210> 185 <211> 22 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический праймер <400> 185<223> Description of artificial sequence: Synthetic primer <400> 185

- 304 046157 tgtctcggca ttgagaacat tc <210> 186 <211> 21 <212> ДНК <213> Искусственная последовательность <220>- 304 046157 tgtctcggca ttgagaacat tc <210> 186 <211> 21 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический праймер <400> 186 attggtggga ggccattgta t 21 <210> 187 <211> 20 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic primer <400> 186 attggtggga ggccattgta t 21 <210> 187 <211> 20 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический праймер <400> 187 accacagtcc atgccatcac 20 <210> 188 <211> 20 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic primer <400> 187 accaccagtcc atgccatcac 20 <210> 188 <211> 20 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический праймер <400> 188 tccaccaccc tgttgctgta 20 <210> 189 <211> 20 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic primer <400> 188 tccaccaccc tgttgctgta 20 <210> 189 <211> 20 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический праймер <400> 189 caaaaaagcc acaaaagcct 20 <210> 190 <211> 20 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic primer <400> 189 caaaaaagcc acaaaagcct 20 <210> 190 <211> 20 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический праймер<223> Description of artificial sequence: Synthetic primer

- 305 046157 <400> 190 ttagctccgc aagaaacatc <210> 191 <211> 23 <212> ДНК <213> Искусственная последовательность <220>- 305 046157 <400> 190 ttagctccgc aagaaacatc <210> 191 <211> 23 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический праймер <400> 191 ccatggaact ggctcgattt cac 23 <210> 192 <211> 21 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic primer <400> 191 ccatggaact ggctcgattt cac 23 <210> 192 <211> 21 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический праймер <400> 192 attggtggga ggccactgta t 21 <210> 193 <211> 27 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic primer <400> 192 attggtggga ggccactgta t 21 <210> 193 <211> 27 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический probe <400> 193 aggcctgaaa accattgtgg gagccct 27 <210> 194 <211> 24 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic probe <400> 193 aggcctgaaa accattgtgg gagccct 27 <210> 194 <211> 24 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический праймер <400> 194 gaatgtggga aatcattcag tcgc 24 <210> 195 <211> 24 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic primer <400> 194 gaatgtggga aatcattcag tcgc 24 <210> 195 <211> 24 <212> DNA <213> Artificial sequence <220>

- 306 046157 <223> Описание искусственной последовательности: Синтетический праймер <400> 195 gcaagttatc ctctcgtgag aagg <210> 196 <211> 29 <212> ДНК <213> Искусственная последовательность <220>- 306 046157 <223> Description of the artificial sequence: Synthetic primer <400> 195 gcaagttatc ctctcgtgag aagg <210> 196 <211> 29 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический probe <400> 196 gcgacaacct ggtgagacat caacgcacc 29 <210> 197 <211> 22 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic probe <400> 196 gcgacaacct ggtgagacat caacgcacc 29 <210> 197 <211> 22 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический праймер <400> 197 gctgttatct cttgtgggct gt 22 <210> 198 <211> 22 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic primer <400> 197 gctgttatct cttgtgggct gt 22 <210> 198 <211> 22 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический праймер <400> 198 aaactcatgg gagctgccgg tt 22 <210> 199 <211> 25 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic primer <400> 198 aaactcatgg gagctgccgg tt 22 <210> 199 <211> 25 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический probe <400> 199 ccacacaaat ctctccctgg cattg 25 <210> 200 <211> 24 <212> ДНК <213> Искусственная последовательность<223> Description of the artificial sequence: Synthetic probe <400> 199 ccacacaaat ctctccctgg cattg 25 <210> 200 <211> 24 <212> DNA <213> Artificial sequence

- 307 046157 <220>- 307 046157 <220>

<223> Описание искусственной последовательности: Синтетический праймер <400> 200 gaatgtggga aatcattcag tcgc 24 <210> 201 <211> 24 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic primer <400> 200 gaatgtggga aatcattcag tcgc 24 <210> 201 <211> 24 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический праймер <400> 201 gcaagttatc ctctcgtgag aagg 24 <210> 202 <211> 29 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic primer <400> 201 gcaagttatc ctctcgtgag aagg 24 <210> 202 <211> 29 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический probe <400> 202 gcgacaacct ggtgagacat caacgcacc 29 <210> 203 <211> 1182 <212> ДНК <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic probe <400> 202 gcgacaacct ggtgagacat caacgcacc 29 <210> 203 <211> 1182 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 203<223> Description of artificial sequence: Synthetic polynucleotide <400> 203

atggccgccg atggccgccg accacctgat accacctgat gctcgccgag gctcgccgag ggctaccgcc ggctaccgcc tggtgcagag tggtgcagag gccgccgtcc gccgccgtcc 60 60 gccgccgccg gccgccgccg cccatggccc cccatggccc tcatgcgctc tcatgcgctc cggactctgc cggactctgc cgccgtacgc cgccgtacgc gggcccgggc gggcccggggc 120 120 ctggacagtg ctggacagtg ggctgaggcc ggctgaggcc gcggggggct gcggggggct ccgctggggc ccgctggggc cgccgccgcc cgccgccgcc ccgccaaccc ccgccaaccc 180 180 ggggccctgg ggggccctgg cgtacggggc cgtacggggc cttcgggccg cttcggggccg ccgtcctcct ccgtcctcct tccagccctt tccagccctt tccggccgtg tccggccgtg 240 240 cctccgccgg cctccgccgg ccgcgggcat ccgcgggcat cgcgcacctg cgcgcacctg cagcctgtgg cagcctgtgg cgacgccgta cgacgccgta ccccggccgc ccccggccgc 300 300 gcggccgcgc gcggccgcgc cccccaacgc cccccaacgc tccgggaggc tccggggggc cccccgggcc cccccggggcc cgcagccggc cgcagccggc cccaagcgcc cccaagcgcc 360 360 gcagccccgc gcagccccgc cgccgcccgc cgccgcccgc gcacgccctg gcacgccctg ggcggcatgg ggcggcatgg acgccgaact acgccgaact catcgacgag catcgacgag 420 420 gaggcgctga gaggcgctga cgtcgctgga cgtcgctgga gctggagctg gctggagctg gggctgcacc gggctgcacc gcgtgcgcga gcgtgcgcga gctgcccgag gctgcccgag 480 480 ctgttcctgg ctgttcctgg gccagagcga gccagagcga gttcgactgc gttcgactgc ttctcggact ttctcggact tggggtccgc tggggtccgc gccgcccgcc gccgcccgcc 540 540

- 308 046157- 308 046157

ggctccgtga ggctccgtga gctgcggtgg gctgcggtgg ttctggtggt ttctggtggt ggttctggtc ggttctggtc agtcccagct agtccagct catcaaaccc catcaaaccc 600 600 agccgcatgc agccgcatgc gcaagtaccc gcaagtaccc caaccggccc caaccggccc agcaagacgc agcaagacgc ccccccacga ccccccacga acgcccttac acgcccttac 660 660 gcttgcccag gcttgcccag tggagtcctg tggagtcctg tgatcgccgc tgatcgccgc ttctcccgca ttctcccgca gcgacaacct gcgacaacct ggtgagacac ggtgagacac 720 720 atccgcatcc atccgcatcc acacaggcca acacaggcca gaagcccttc gaagcccttc cagtgccgca cagtgccgca tctgcatgag tctgcatgag aaacttcagc aaacttcagc 780 780 cgagaggata cgagaggata acttgcacac acttgcacac tcacatccgc tcacatccgc acccacacag acccacacag gcgaaaagcc gcgaaaagcc cttcgcctgc cttcgcctgc 840 840 gacatctgtg gacatctgtg gaagaaagtt gaagaaagtt tgcccggagc tgccggggagc gatgaacttg gatgaacttg tccgacatac tccgacatac caagatccac caagatccac 900 900 ttgcggcaga ttgcggcaga aggaccgccc aggaccgccc ttacgcttgc ttacgcttgc ccagtggagt ccagtggagt cctgtgatcg cctgtgatcg ccgcttctcc ccgcttctcc 960 960 caatcaggga caatcaggga atctgactga atctgactga gcacatccgc gcacatccgc atccacacag atccacacag gccagaagcc gccagaagcc cttccagtgc cttccagtgc 1020 1020 cgcatctgca cgcatctgca tgagaaactt tgagaaactt cagcacaagt cagcacaagt ggacatctgg ggacatctgg tacgccacat tacgccacat ccgcacccac ccgcaccac 1080 1080 acaggcgaaa acaggcgaaa agcccttcgc agcccttcgc ctgcgacatc ctgcgacatc tgtggaagaa tgtggaagaa agtttgccca agtttgccca gaatagtacc gaatagtacc 1140 1140 ctgaccgaac ctgaccgaac ataccaagat ataccaagat ccacttgcgg ccacttgcgg cagaaggaca cagaaggaca ag ag 1182 1182

<210> 204 <211> 1206 <212> ДНК <213> Искусственная последовательность <220><210> 204 <211> 1206 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 204 atggccgccg accacctgat gctcgccgag ggctaccgcc tggtgcagag gccgccgtcc60 gccgccgccg cccatggccc tcatgcgctc cggactctgc cgccgtacgc gggcccgggc120 ctggacagtg ggctgaggcc gcggggggct ccgctggggc cgccgccgcc ccgccaaccc180 ggggccctgg cgtacggggc cttcgggccg ccgtcctcct tccagccctt tccggccgtg240 cctccgccgg ccgcgggcat cgcgcacctg cagcctgtgg cgacgccgta ccccggccgc300 gcggccgcgc cccccaacgc tccgggaggc cccccgggcc cgcagccggc cccaagcgcc360 gcagccccgc cgccgcccgc gcacgccctg ggcggcatgg acgccgaact catcgacgag420 gaggcgctga cgtcgctgga gctggagctg gggctgcacc gcgtgcgcga gctgcccgag480 ctgttcctgg gccagagcga gttcgactgc ttctcggact tggggtccgc gccgcccgcc540 ggctccgtga gctgcggtgg ttctggtggt ggttctggtg gtggcagcgg gggaggttct600 ggtcagtccc agctcatcaa acccagccgc atgcgcaagt accccaaccg gcccagcaag660 acgccccccc acgaacgccc ttacgcttgc ccagtggagt cctgtgatcg ccgcttctcc720 cgcagcgaca acctggtgag acacatccgc atccacacag gccagaagcc cttccagtgc780 cgcatctgca tgagaaactt cagccgagag gataacttgc acactcacat ccgcacccac840 acaggcgaaa agcccttcgc ctgcgacatc tgtggaagaa agtttgcccg gagcgatgaa900<223> Description of the artificial sequence: Synthetic polynucleotide <400> 204 atggccgccg accacctgat gctcgccgag ggctaccgcc tggtgcagag gccgccgtcc60 gccgccgccg cccatggccc tcatgcgctc cggactctgc cgccgtacgc gggcccgggc120 ctggacagtg ggctgaggcc g cggggggct ccgctggggc cgccgccgcc ccgccaaccc180 ggggccctgg cgtacggggc cttcgggccg ccgtcctcct tccagccctt tccggccgtg240 cctccgccgg ccgcgggcat cgcgcacctg cagcctgtgg cgacgccgta ccccggccgc300 gcggccgcg c cccccaacgc tccgggaggc cccccggggcc cgcagccggc cccaagcgcc360 gcagccccgc cgccgcccgc gcacgccctg ggcggcatgg acgccgaact catcgacgag420 gaggcgctga cgtcgctgga gctggagctg gggctgcacc gcgtgcgcga gctgcccgag480 ctgttcctgg gccagagcga gttcgactgc ttctcggact tggggtccgc gccgcccgcc5 40 ggctccgtga gctgcggtgg ttctggtggt ggttctggtg gtggcagcgg gggaggttct600 ggtcagtccc agctcatcaa acccagccgc atgcgcaagt accccaaccg gcccagcaag660 acgccccccc acgaacgccc ttacgcttgc ccagtggagt cctgtgatcg ccgcttctcc720 cgcagcgaca acctggtgag acacatccgc atccacacag gccagaagcc cttccagtgc780 cgcatctgca tgagaaactt cagccgagag gataacttgc acactcacat ccgcacccac840 acaggcgaaa agcccttcgc ctgcgacatc tgtggaagaa agtttgcccg gagcgatgaa900

- 309 046157- 309 046157

cttgtccgac cttgtccgac ataccaagat ataccaagat ccacttgcgg ccacttgcgg cagaaggacc cagaaggacc gcccttacgc gcccttacgc ttgcccagtg ttgcccagtg 960 960 gagtcctgtg gagtcctgtg atcgccgctt atcgccgctt ctcccaatca ctcccaatca gggaatctga gggaatctga ctgagcacat ctgagcacat ccgcatccac ccgcatccac 1020 1020 acaggccaga acaggccaga agcccttcca agcccttcca gtgccgcatc gtgccgcatc tgcatgagaa tgcatgagaa acttcagcac acttcagcac aagtggacat aagtggacat 1080 1080 ctggtacgcc ctggtacgcc acatccgcac acatccgcac ccacacaggc ccacacaggc gaaaagccct gaaaagccct tcgcctgcga tcgcctgcga catctgtgga catctgtgga 1140 1140 agaaagtttg agaaagtttg cccagaatag cccagaatag taccctgacc taccctgacc gaacatacca gaacatacca agatccactt agatccactt gcggcagaag gcggcagaag 1200 1200 gacaag gacaag 1206 1206

<210> 205 <211> 402 <212> Белок <213> Искусственная последовательность <220><210> 205 <211> 402 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 205<223> Description of artificial sequence: Synthetic polypeptide <400> 205

Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val GlnMet Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln

5 10155 1015

Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr 20 2530Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr 20 2530

Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg 35 4045Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg 35 4045

Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala 50 5560Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala 50 5560

Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val 65 70 7580Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val 65 70 7580

Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro 85 9095Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro 85 9095

Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro ProTyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro

100 105110100 105110

Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala HisGly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His

115 120125115 120125

Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu ThrAla Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr

130 135140130 135140

Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro GluSer Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu

145 150 155160145 150 155160

- 310 046157- 310 046157

Leu Phe Leu Gly GlnLeu Phe Leu Gly Gln

165165

Ser Glu Phe Asp CysSer Glu Phe Asp Cys

170170

Phe Ser Asp Leu GlyPhe Ser Asp Leu Gly

175175

Ala Pro Pro Ala GlyAla Pro Pro Ala Gly

180180

Ser Val Ser Cys GlySer Val Ser Cys Gly

185185

Gly Ser Gly Gly GlyGly Ser Gly Gly Gly

190190

Gly Gly Gly Ser Gly 195Gly Gly Gly Ser Gly 195

Gly Gly Ser Gly Gln 200Gly Gly Ser Gly Gln 200

Ser Gln Leu Ile LysSer Gln Leu Ile Lys

205205

Ser Arg Met Arg LysSer Arg Met Arg Lys

210210

Tyr Pro Asn Arg ProTyr Pro Asn Arg Pro

215215

Ser Lys Thr Pro ProSer Lys Thr Pro Pro

220220

Glu Arg Pro Tyr Ala 225Glu Arg Pro Tyr Ala 225

Cys Pro Val Glu Ser 230Cys Pro Val Glu Ser 230

Cys Asp Arg Arg Phe 235Cys Asp Arg Arg Phe 235

Arg Ser Asp Asn LeuArg Ser Asp Asn Leu

245245

Val Arg His Ile ArgVal Arg His Ile Arg

250250

Ile His Thr Gly GlnIle His Thr Gly Gln

255255

Pro Phe Gln Cys ArgPro Phe Gln Cys Arg

260260

Ile Cys Met Arg AsnIle Cys Met Arg Asn

265265

Phe Ser Arg Glu AspPhe Ser Arg Glu Asp

270270

Leu His Thr His IleLeu His Thr His Ile

275275

Arg Thr His Thr GlyArg Thr His Thr Gly

280280

Glu Lys Pro Phe Ala 285Glu Lys Pro Phe Ala 285

Asp Ile Cys Gly Arg 290Asp Ile Cys Gly Arg 290

Lys Phe Ala Arg SerLys Phe Ala Arg Ser

295295

Asp Glu Leu Val Arg 300Asp Glu Leu Val Arg 300

Thr Lys Ile His Leu 305Thr Lys Ile His Leu 305

Arg Gln Lys Asp Arg 310Arg Gln Lys Asp Arg 310

Pro Tyr Ala Cys Pro 315Pro Tyr Ala Cys Pro 315

Glu Ser Cys Asp ArgGlu Ser Cys Asp Arg

325325

Arg Phe Ser Gln SerArg Phe Ser Gln Ser

330330

Gly Asn Leu Thr GluGly Asn Leu Thr Glu

335335

Ile Arg Ile His ThrIle Arg Ile His Thr

340340

Gly Gln Lys Pro PheGly Gln Lys Pro Phe

345345

Gln Cys Arg Ile CysGln Cys Arg Ile Cys

350350

Arg Asn Phe Ser Thr 355Arg Asn Phe Ser Thr 355

Ser Gly His Leu Val 360Ser Gly His Leu Val 360

Arg His Ile Arg Thr 365Arg His Ile Arg Thr 365

Thr Gly Glu Lys ProThr Gly Glu Lys Pro

370370

Phe Ala Cys Asp Ile 375Phe Ala Cys Asp Ile 375

Cys Gly Arg Lys Phe 380Cys Gly Arg Lys Phe 380

Gln Asn Ser Thr Leu 385Gln Asn Ser Thr Leu 385

Thr Glu His Thr Lys 390Thr Glu His Thr Lys 390

Ile His Leu Arg Gln 395Ile His Leu Arg Gln 395

SerSer

SerSer

ProPro

HisHis

Ser 240Ser 240

LysLys

AsnAsn

CysCys

HisHis

Val 320Val 320

HisHis

MetMet

HisHis

AlaAla

Lys 400Lys 400

Asp LysAsp Lys

- 311 046157 <210> 206 <211> 1707 <212> ДНК <213> Искусственная последовательность <220>- 311 046157 <210> 206 <211> 1707 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид<223> Description of artificial sequence: Synthetic polynucleotide

<400> 206 atggccgcag <400> 206 atggccgcag atcacctgat atcacctgat gctggctgaa gctggctgaa ggctacagac ggctacagac tggtgcagcg tggtgcagcg gcctccatct gcctccactct 60 60 gccgctgccg gccgctgccg cccacggccc cccacggccc ccacgccctg ccacgccctg agaacactgc agaacactgc ccccctacgc ccccctacgc cggccctggt cggccctggt 120 120 cttgatagcg cttgatagcg gactcagacc gactcagacc tagaggcgcc tagaggcgcc cctctgggcc cctctggggcc ctccacctcc ctccacctcc aagacagcct aagacagcct 180 180 ggagccctgg ggagccctgg cctacggcgc cctacggcgc cttcggccct cttcggccct ccttctagct ccttctagct tccagccctt tccagccctt ccccgccgtg ccccgccgtg 240 240 cctcctccag cctcctccag ccgctggcat ccgctggcat cgcccacctg cgccacctg cagcctgtgg cagcctgtgg ccacccctta ccacccctta ccccggaaga ccccggagaaga 300 300 gccgccgccc gccgccgccc ctccaaacgc ctccaaacgc ccctggcgga ccctggcgga cctcctggcc cctcctggcc cccagcctgc cccagcctgc tccaagcgcc tccaagcgcc 360 360 gctgcccctc gctgcccctc cacctcctgc cacctcctgc tcatgccctg tcatgccctg ggcggcatgg ggcggcatgg acgccgagct acgccgagct gatcgacgag gatcgacgag 420 420 gaagccctga gaagccctga ccagcctgga ccagcctgga actggaactg actggaactg ggcctgcaca ggcctgcaca gagtgcggga gagtgcggga actgcctgag actgcctgag 480 480 ctgttcctgg ctgttcctgg gacagagcga gacagagcga gttcgactgc gttcgactgc ttcagcgacc ttcagcgacc tgggcagcgc tggggcagcgc ccctcctgcc ccctcctgcc 540 540 ggctctgtgt ggctctgtgt cctgcgccga cctgcgccga ccacctgatg ccacctgatg ctcgccgagg ctcgccgagg gctaccgcct gctaccgcct ggtgcagagg ggtgcagagg 600 600 ccgccgtccg ccgccgtccg ccgccgccgc ccgccgccgc ccatggccct ccatggccct catgcgctcc catgcgctcc ggactctgcc ggactctgcc gccgtacgcg gccgtacgcg 660 660 ggcccgggcc ggcccgggcc tggacagtgg tggacagtgg gctgaggccg gctgaggccg cggggggctc cggggggctc cgctggggcc cgctggggcc gccgccgccc gccgccgccc 720 720 cgccaacccg cgccaacccg gggccctggc gggccctggc gtacggggcc gtacggggcc ttcgggccgc ttcggggccgc cgtcctcctt cgtcctcctt ccagcccttt ccagcccttt 780 780 ccggccgtgc ccggccgtgc ctccgccggc ctccgccggc cgcgggcatc cgcgggcatc gcgcacctgc gcgcacctgc agcctgtggc agcctgtggc gacgccgtac gacgccgtac 840 840 cccggccgcg cccggccgcg ccgccgcgcc ccgccgcgcc ccccaacgct ccccaacgct ccgggaggcc ccgggaggcc ccccgggccc ccccggggccc gcagccggcc gcagccggcc 900 900 ccaagcgccg ccaagcgccg cagccccgcc cagccccgcc gccgcccgcg gccgcccgcg cacgccctgg cacgccctgg gcggcatgga gcggcatgga cgccgaactc cgccgaactc 960 960 atcgacgagg atcgacgagg aggcgctgac aggcgctgac gtcgctggag gtcgctggag ctggagctgg ctggagctgg ggctgcaccg ggctgcaccg cgtgcgcgag cgtgcgcgag 1020 1020 ctgcccgagc ctgcccgagc tgttcctggg tgttcctggg ccagagcgag ccagagcgag ttcgactgct ttcgactgct tctcggactt tctcggactt ggggtccgcg ggggtccgcg 1080 1080 ccgcccgccg ccgcccgccg gctccgtgag gctccgtgag ctgccagtcc ctgccagtcc cagctcatca cagctcatca aacccagccg aacccagccg catgcgcaag catgcgcaag 1140 1140 taccccaacc taccccaacc ggcccagcaa ggcccagcaa gacgcccccc gacgcccccc cacgaacgcc cacgaacgcc cttacgcttg cttacgcttg cccagtggag cccagtggag 1200 1200 tcctgtgatc tcctgtgatc gccgcttctc gccgcttctc ccgcagcgac ccgcagcgac aacctggtga aacctggtga gacacatccg gacacatccg catccacaca catccacaca 1260 1260 ggccagaagc ggccagaagc ccttccagtg ccttccagtg ccgcatctgc ccgcatctgc atgagaaact atgagaaact tcagccgaga tcagccgaga ggataacttg ggataacttg 1320 1320 cacactcaca cacactcaca tccgcaccca tccgcaccca cacaggcgaa cacaggcgaa aagcccttcg aagcccttcg cctgcgacat cctgcgacat ctgtggaaga ctgtggaaga 1380 1380 aagtttgccc aagtttgccc ggagcgatga ggagcgatga acttgtccga acttgtccga cataccaaga cataccaaga tccacttgcg tccacttgcg gcagaaggac gcagaaggac 1440 1440 cgcccttacg cgcccttacg cttgcccagt cttgcccagt ggagtcctgt ggagtcctgt gatcgccgct gatcgccgct tctcccaatc tctcccaatc agggaatctg agggaatctg 1500 1500 actgagcaca actgagcaca tccgcatcca tccgcatcca cacaggccag cacaggccag aagcccttcc aagcccttcc agtgccgcat agtgccgcat ctgcatgaga ctgcatgaga 1560 1560

- 312 046157- 312 046157

aacttcagca aacttcagca caagtggaca caagtggaca tctggtacgc tctggtacgc cacatccgca cacatccgca cccacacagg cccacacagg cgaaaagccc cgaaaagccc 1620 1620 ttcgcctgcg ttcgcctgcg acatctgtgg acatctgtgg aagaaagttt aagaaagttt gcccagaata gccagaata gtaccctgac gtaccctgac cgaacatacc cgaacatacc 1680 1680 aagatccact aagatccact tgcggcagaa tgcggcagaa ggacaag ggacaag 1707 1707

<210> 207 <211> 569 <212> Белок <213> Искусственная последовательность <220><210> 207 <211> 569 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 207<223> Description of artificial sequence: Synthetic polypeptide <400> 207

Met Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val GlnMet Ala Ala Asp His Leu Met Leu Ala Glu Gly Tyr Arg Leu Val Gln

5 10155 1015

Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr 20 2530Arg Pro Pro Ser Ala Ala Ala Ala His Gly Pro His Ala Leu Arg Thr 20 2530

Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg 35 4045Leu Pro Pro Tyr Ala Gly Pro Gly Leu Asp Ser Gly Leu Arg Pro Arg 35 4045

Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala 50 5560Gly Ala Pro Leu Gly Pro Pro Pro Pro Arg Gln Pro Gly Ala Leu Ala 50 5560

Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val 65 70 7580Tyr Gly Ala Phe Gly Pro Pro Ser Ser Phe Gln Pro Phe Pro Ala Val 65 70 7580

Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro 85 9095Pro Pro Pro Ala Ala Gly Ile Ala His Leu Gln Pro Val Ala Thr Pro 85 9095

Tyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro ProTyr Pro Gly Arg Ala Ala Ala Pro Pro Asn Ala Pro Gly Gly Pro Pro

100 105110100 105110

Gly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala HisGly Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His

115 120125115 120125

Ala Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu ThrAla Leu Gly Gly Met Asp Ala Glu Leu Ile Asp Glu Glu Ala Leu Thr

130 135140130 135140

Ser Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro GluSer Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu

145 150 155160145 150 155160

Leu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly SerLeu Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser

165 170175165 170175

Ala Pro Pro Ala Gly Ser Val Ser Cys Ala Asp His Leu Met Leu AlaAla Pro Pro Ala Gly Ser Val Ser Cys Ala Asp His Leu Met Leu Ala

180 185190180 185190

- 313 046157- 313 046157

Glu Gly Tyr Arg LeuGlu Gly Tyr Arg Leu

195195

Val Gln Arg Pro ProVal Gln Arg Pro Pro

200200

Ser Ala Ala Ala AlaSer Ala Ala Ala Ala

205205

Gly Pro His Ala LeuGly Pro His Ala Leu

210210

Arg Thr Leu Pro Pro 215Arg Thr Leu Pro Pro 215

Tyr Ala Gly Pro GlyTyr Ala Gly Pro Gly

220220

Asp Ser Gly Leu Arg 225Asp Ser Gly Leu Arg 225

Pro Arg Gly Ala Pro 230Pro Arg Gly Ala Pro 230

Leu Gly Pro Pro Pro 235Leu Gly Pro Pro Pro 235

Arg Gln Pro Gly AlaArg Gln Pro Gly Ala

245245

Leu Ala Tyr Gly AlaLeu Ala Tyr Gly Ala

250250

Phe Gly Pro Pro SerPhe Gly Pro Pro Ser

255255

Phe Gln Pro Phe ProPhe Gln Pro Phe Pro

260260

Ala Val Pro Pro ProAla Val Pro Pro Pro

265265

Ala Ala Gly Ile AlaAla Ala Gly Ile Ala

270270

Leu Gln Pro Val AlaLeu Gln Pro Val Ala

275275

Thr Pro Tyr Pro GlyThr Pro Tyr Pro Gly

280280

Arg Ala Ala Ala Pro 285Arg Ala Ala Ala Pro 285

Asn Ala Pro Gly Gly 290Asn Ala Pro Gly Gly 290

Pro Pro Gly Pro Gln 295Pro Pro Gly Pro Gln 295

Pro Ala Pro Ser AlaPro Ala Pro Ser Ala

300300

Ala Pro Pro Pro Pro 305Ala Pro Pro Pro Pro 305

Ala His Ala Leu Gly 310Ala His Ala Leu Gly 310

Gly Met Asp Ala Glu 315Gly Met Asp Ala Glu 315

Ile Asp Glu Glu AlaIle Asp Glu Glu Ala

325325

Leu Thr Ser Leu GluLeu Thr Ser Leu Glu

330330

Leu Glu Leu Gly LeuLeu Glu Leu Gly Leu

335335

Arg Val Arg Glu LeuArg Val Arg Glu Leu

340340

Pro Glu Leu Phe LeuPro Glu Leu Phe Leu

345345

Gly Gln Ser Glu PheGly Gln Ser Glu Phe

350350

Cys Phe Ser Asp LeuCys Phe Ser Asp Leu

355355

Gly Ser Ala Pro Pro 360Gly Ser Ala Pro Pro 360

Ala Gly Ser Val Ser 365Ala Gly Ser Val Ser 365

Gln Ser Gln Leu IleGln Ser Gln Leu Ile

370370

Lys Pro Ser Arg MetLys Pro Ser Arg Met

375375

Arg Lys Tyr Pro Asn 380Arg Lys Tyr Pro Asn 380

Pro Ser Lys Thr Pro 385Pro Ser Lys Thr Pro 385

Pro His Glu Arg Pro 390Pro His Glu Arg Pro 390

Tyr Ala Cys Pro Val 395Tyr Ala Cys Pro Val 395

Ser Cys Asp Arg ArgSer Cys Asp Arg Arg

405405

Phe Ser Arg Ser AspPhe Ser Arg Ser Asp

410410

Asn Leu Val Arg HisAsn Leu Val Arg His

415415

Arg Ile His Thr GlyArg Ile His Thr Gly

420420

Gln Lys Pro Phe GlnGln Lys Pro Phe Gln

425425

Cys Arg Ile Cys MetCys Arg Ile Cys Met

430430

Asn Phe Ser Arg GluAsn Phe Ser Arg Glu

Asp Asn Leu His ThrAsp Asn Leu His Thr

His Ile Arg Thr HisHis Ile Arg Thr His

HisHis

LeuLeu

Pro 240Pro 240

SerSer

HisHis

ProPro

AlaAla

Leu 320Leu 320

HisHis

AspAsp

CysCys

ArgArg

Glu 400Glu 400

IleIle

ArgArg

ThrThr

- 314 046157- 314 046157

Gly GluGly Glu

450450

Ser Asp 465Ser Asp 465

Arg ProArg Pro

435435

Lys ProLys Pro

Glu LeuGlu Leu

Tyr AlaTyr Ala

Phe AlaPhe Ala

Val ArgVal Arg

470470

Cys Pro 485Cys Pro 485

Ser GlySer Gly

Asn LeuAsn Leu

500500

Thr GluThr Glu

440440

Cys Asp 455Cys Asp 455

His ThrHis Thr

Val GluVal Glu

His IleHis Ile

Ile CysIle Cys

Lys IleLys Ile

Ser CysSer Cys

490490

Arg Ile 505Arg Ile 505

Phe GlnPhe Gln

Cys Arg 515Cys Arg 515

Ile CysIle Cys

Met ArgMet Arg

520520

Asn PheAsn Phe

Gly ArgGly Arg

460460

His Leu 475His Leu 475

Asp ArgAsp Arg

His ThrHis Thr

Ser ThrSer Thr

Val ArgVal Arg

530530

His IleHis Ile

Arg ThrArg Thr

His Thr 535His Thr 535

Gly GluGly Glu

Lys ProLys Pro

540540

Ile Cys 545Ile Cys 545

Gly ArgGly Arg

Lys PheLys Phe

550550

Ala GlnAla Gln

Asn SerAsn Ser

Thr Leu 555Thr Leu 555

445445

Lys PheLys Phe

Arg GlnArg Gln

Arg PheArg Phe

Gly GlnGly Gln

510510

Ser Gly 525Ser Gly 525

Phe AlaPhe Ala

Thr GluThr Glu

Ala ArgAla Arg

Lys AspLys Asp

480480

Ser GlnSer Gln

495495

Lys ProLys Pro

His LeuHis Leu

Cys AspCys Asp

His ThrHis Thr

560560

Lys Ile His Leu Arg Gln Lys Asp LysLys Ile His Leu Arg Gln Lys Asp Lys

565 <210> 208 <211> 1755 <212> ДНК <213> Искусственная последовательность <220>565 <210> 208 <211> 1755 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид<223> Description of artificial sequence: Synthetic polynucleotide

<400> 208 atggccgcag <400> 208 atggccgcag atcacctgat atcacctgat gctggctgaa gctggctgaa ggctacagac ggctacagac tggtgcagcg tggtgcagcg gcctccatct gcctccactct gccgctgccg gccgctgccg cccacggccc cccacggccc ccacgccctg ccacgccctg agaacactgc agaacactgc ccccctacgc ccccctacgc cggccctggt cggccctggt cttgatagcg cttgatagcg gactcagacc gactcagacc tagaggcgcc tagaggcgcc cctctgggcc cctctggggcc ctccacctcc ctccacctcc aagacagcct aagacagcct ggagccctgg ggagccctgg cctacggcgc cctacggcgc cttcggccct cttcggccct ccttctagct ccttctagct tccagccctt tccagccctt ccccgccgtg ccccgccgtg cctcctccag cctcctccag ctgctggcat ctgctggcat cgcccacctg cgccacctg cagcctgtgg cagcctgtgg ccacccctta ccacccctta ccccggaaga ccccggagaaga gccgccgccc gccgccgccc ctccaaacgc ctccaaacgc ccctggcgga ccctggcgga cctcctggcc cctcctggcc cccagcctgc cccagcctgc tccaagcgcc tccaagcgcc gctgcccctc gctgcccctc cacctcctgc cacctcctgc tcatgccctg tcatgccctg ggcggcatgg ggcggcatgg acgccgagct acgccgagct gatcgacgag gatcgacgag gaagccctga gaagccctga ccagcctgga ccagcctgga actggaactg actggaactg ggcctgcaca ggcctgcaca gagtgcggga gagtgcggga actgcctgag actgcctgag ctgttcctgg ctgttcctgg gacagagcga gacagagcga gttcgactgc gttcgactgc ttcagcgacc ttcagcgacc tgggcagcgc tggggcagcgc ccctcctgcc ccctcctgcc

120120

180180

240240

300300

360360

420420

480480

540540

- 315 046157- 315 046157

ggctctgtgt ggctctgtgt cctgcggcgg cctgcggcgg cagcggcggc cagcggcggc ggaagcggcg ggaagcggcg ccgaccacct ccgaccacct gatgctcgcc gatgctcgcc 600 600 gagggctacc gagggctacc gcctggtgca gcctggtgca gaggccgccg gaggccgccg tccgccgccg tccgccgccg ccgcccatgg ccgcccatgg ccctcatgcg ccctcatgcg 660 660 ctccggactc ctccggactc tgccgccgta tgccgccgta cgcgggcccg cgcgggcccg ggcctggaca ggcctggac gtgggctgag gtggggctgag gccgcggggg gccgcgggggg 720 720 gctccgctgg gctccgctgg ggccgccgcc ggccgccgcc gccccgccaa gccccgccaa cccggggccc cccggggccc tggcgtacgg tggcgtacgg ggccttcggg ggccttcggg 780 780 ccgccgtcct ccgccgtcct ccttccagcc ccttccagcc ctttccggcc ctttccggcc gtgcctccgc gtgcctccgc cggccgcggg cggccgcggg catcgcgcac catcgcgcac 840 840 ctgcagcctg ctgcagcctg tggcgacgcc tggcgacgcc gtaccccggc gtaccccggc cgcgcggccg cgcgcggccg cgccccccaa cgccccccaa cgctccggga cgctccggga 900 900 ggccccccgg ggccccccgg gcccgcagcc gcccgcagcc ggccccaagc ggccccaagc gccgcagccc gccgcagccc cgccgccgcc cgccgccgcc cgcgcacgcc cgcgcacgcc 960 960 ctgggcggca ctggggcggca tggacgccga tggacgccga actcatcgac actcatcgac gaggaggcgc gaggaggcgc tgacgtcgct tgacgtcgct ggagctggag ggagctggag 1020 1020 ctggggctgc ctggggctgc accgcgtgcg accgcgtgcg cgagctgccc cgagctgccc gagctgttcc gagctgttcc tgggccagag tggggccagag cgagttcgac cgagttcgac 1080 1080 tgcttctcgg tgcttctcgg acttggggtc acttggggtc cgcgccgccc cgcgccgccc gccggctccg gccggctccg tgagctgcgg tgagctgcgg tggttctggt tggttctggt 1140 1140 ggtggttctg ggtggttctg gtcagtccca gtcagtccca gctcatcaaa gctcatcaaa cccagccgca cccagccgca tgcgcaagta tgcgcaagta ccccaaccgg ccccaaccgg 1200 1200 cccagcaaga cccagcaaga cgccccccca cgcccccccca cgaacgccct cgaacgccct tacgcttgcc tacgcttgcc cagtggagtc cagtggagtc ctgtgatcgc ctgtgatcgc 1260 1260 cgcttctccc cgcttctccc gcagcgacaa gcagcgacaa cctggtgaga cctggtgaga cacatccgca cacatccgca tccacacagg tccacacagg ccagaagccc ccagaagccc 1320 1320 ttccagtgcc ttccagtgcc gcatctgcat gcatctgcat gagaaacttc gagaaacttc agccgagagg agccgagagg ataacttgca ataacttgca cactcacatc cactcacatc 1380 1380 cgcacccaca cgcaccaca caggcgaaaa caggcgaaaa gcccttcgcc gcccttcgcc tgcgacatct tgcgacatct gtggaagaaa gtggaagaaa gtttgcccgg gtttgcccgg 1440 1440 agcgatgaac agcgatgaac ttgtccgaca ttgtccgaca taccaagatc taccaagatc cacttgcggc cacttgcggc agaaggaccg agaaggaccg cccttacgct cccttacgct 1500 1500 tgcccagtgg tgccagtgg agtcctgtga agtcctgtga tcgccgcttc tcgccgcttc tcccaatcag tccaatcag ggaatctgac ggaatctgac tgagcacatc tgagcacatc 1560 1560 cgcatccaca cgcatccaca caggccagaa caggccagaa gcccttccag gcccttccag tgccgcatct tgccgcatct gcatgagaaa gcatgagaaa cttcagcaca cttcagcaca 1620 1620 agtggacatc agtggacatc tggtacgcca tggtacgcca catccgcacc catccgcacc cacacaggcg cacacaggcg aaaagccctt aaaagccctt cgcctgcgac cgcctgcgac 1680 1680 atctgtggaa atctgtggaa gaaagtttgc gaaagtttgc ccagaatagt ccagaatagt accctgaccg accctgaccg aacataccaa aacataccaa gatccacttg gatccacttg 1740 1740 cggcagaagg cggcagaagg acaag acaag 1755 1755

<210> 209 <211> 585 <212> Белок <213> Искусственная последовательность <220><210> 209 <211> 585 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 209<223> Description of artificial sequence: Synthetic polypeptide <400> 209

Met Ala Ala Asp His Leu Met Leu 1 5Met Ala Ala Asp His Leu Met Leu 1 5

Ala Glu Gly Tyr Arg Leu Val GlnAla Glu Gly Tyr Arg Leu Val Gln

1515

Arg Pro Pro Ser Ala Ala Ala Ala 20Arg Pro Pro Ser Ala Ala Ala Ala 20

His Gly Pro His Ala Leu Arg Thr 25 30His Gly Pro His Ala Leu Arg Thr 25 30

Leu Pro Pro Tyr Ala Gly Pro GlyLeu Pro Pro Tyr Ala Gly Pro Gly

4040

Leu Asp Ser Gly Leu Arg Pro Arg 45Leu Asp Ser Gly Leu Arg Pro Arg 45

- 316 046157- 316 046157

Gly Ala Pro Leu Gly 50Gly Ala Pro Leu Gly 50

Pro Pro Pro Pro Arg 55Pro Pro Pro Pro Arg 55

Gln Pro Gly Ala Leu 60Gln Pro Gly Ala Leu 60

Tyr Gly Ala Phe Gly 65Tyr Gly Ala Phe Gly 65

Pro Pro Ser Ser Phe 70Pro Pro Ser Ser Phe 70

Gln Pro Phe Pro Ala 75Gln Pro Phe Pro Ala 75

Pro Pro Pro Ala AlaPro Pro Pro Ala Ala

Gly Ile Ala His LeuGly Ile Ala His Leu

Gln Pro Val Ala ThrGln Pro Val Ala Thr

Tyr Pro Gly Arg AlaTyr Pro Gly Arg Ala

100100

Ala Ala Pro Pro AsnAla Ala Pro Pro Asn

105105

Ala Pro Gly Gly ProAla Pro Gly Gly Pro

110110

Gly Pro Gln Pro AlaGly Pro Gln Pro Ala

115115

Pro Ser Ala Ala AlaPro Ser Ala Ala Ala

120120

Pro Pro Pro Pro AlaPro Pro Pro Pro Ala

125125

Ala Leu Gly Gly MetAla Leu Gly Gly Met

130130

Asp Ala Glu Leu Ile 135Asp Ala Glu Leu Ile 135

Asp Glu Glu Ala Leu 140Asp Glu Glu Ala Leu 140

Ser Leu Glu Leu Glu 145Ser Leu Glu Leu Glu 145

Leu Gly Leu His Arg 150Leu Gly Leu His Arg 150

Val Arg Glu Leu Pro 155Val Arg Glu Leu Pro 155

Leu Phe Leu Gly GlnLeu Phe Leu Gly Gln

165165

Ser Glu Phe Asp CysSer Glu Phe Asp Cys

170170

Phe Ser Asp Leu GlyPhe Ser Asp Leu Gly

175175

Ala Pro Pro Ala GlyAla Pro Pro Ala Gly

180180

Ser Val Ser Cys GlySer Val Ser Cys Gly

185185

Gly Ser Gly Gly GlyGly Ser Gly Gly Gly

190190

Gly Ala Asp His LeuGly Ala Asp His Leu

195195

Met Leu Ala Glu GlyMet Leu Ala Glu Gly

200200

Tyr Arg Leu Val Gln 205Tyr Arg Leu Val Gln 205

Pro Pro Ser Ala AlaPro Pro Ser Ala Ala

210210

Ala Ala His Gly Pro 215Ala Ala His Gly Pro 215

His Ala Leu Arg ThrHis Ala Leu Arg Thr

220220

Pro Pro Tyr Ala Gly 225Pro Pro Tyr Ala Gly 225

Pro Gly Leu Asp Ser 230Pro Gly Leu Asp Ser 230

Gly Leu Arg Pro Arg 235Gly Leu Arg Pro Arg 235

Ala Pro Leu Gly ProAla Pro Leu Gly Pro

245245

Pro Pro Pro Arg GlnPro Pro Pro Arg Gln

250250

Pro Gly Ala Leu AlaPro Gly Ala Leu Ala

255255

Gly Ala Phe Gly ProGly Ala Phe Gly Pro

260260

Pro Ser Ser Phe GlnPro Ser Ser Phe Gln

265265

Pro Phe Pro Ala ValPro Phe Pro Ala Val

270270

Pro Pro Ala Ala GlyPro Pro Ala Ala Gly

275275

Ile Ala His Leu GlnIle Ala His Leu Gln

280280

Pro Val Ala Thr ProPro Val Ala Thr Pro

285285

Pro Gly Arg Ala AlaPro Gly Arg Ala Ala

Ala Pro Pro Asn AlaAla Pro Pro Asn Ala

Pro Gly Gly Pro ProPro Gly Gly Pro Pro

AlaAla

Val 80Val 80

ProPro

ProPro

HisHis

ThrThr

Glu 160Glu 160

SerSer

SerSer

ArgArg

LeuLeu

Gly 240Gly 240

TyrTyr

ProPro

TyrTyr

GlyGly

- 317 046157- 317 046157

290290

295295

300300

Pro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala HisPro Gln Pro Ala Pro Ser Ala Ala Ala Pro Pro Pro Pro Ala His

305 310 315305 310 315

Leu Gly Gly Met Asp Ala Glu LeuLeu Gly Gly Met Asp Ala Glu Leu

325325

Ile Asp Glu Glu Ala Leu ThrIle Asp Glu Glu Ala Leu Thr

330 335330 335

Leu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro GluLeu Glu Leu Glu Leu Gly Leu His Arg Val Arg Glu Leu Pro Glu

340 345 350340 345 350

Phe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly SerPhe Leu Gly Gln Ser Glu Phe Asp Cys Phe Ser Asp Leu Gly Ser

355 360 365355 360 365

Pro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly SerPro Pro Ala Gly Ser Val Ser Cys Gly Gly Ser Gly Gly Gly Ser

370 375 380370 375 380

Gln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro AsnGln Ser Gln Leu Ile Lys Pro Ser Arg Met Arg Lys Tyr Pro Asn

385 390 395385 390 395

Pro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro ValPro Ser Lys Thr Pro Pro His Glu Arg Pro Tyr Ala Cys Pro Val

405 410 415405 410 415

Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg HisSer Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val Arg His

420 425 430420 425 430

Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys MetArg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys Met

435 440 445435 440 445

Asn Phe Ser Arg Glu Asp Asn Leu His Thr His Ile Arg Thr HisAsn Phe Ser Arg Glu Asp Asn Leu His Thr His Ile Arg Thr His

450 455 460450 455 460

Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe AlaGly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala

465 470 475465 470 475

Ser Asp Glu Leu Val Arg His Thr Lys Ile His Leu Arg Gln LysSer Asp Glu Leu Val Arg His Thr Lys Ile His Leu Arg Gln Lys

485 490 495485 490 495

Arg Pro Tyr Ala Cys Pro Val GluArg Pro Tyr Ala Cys Pro Val Glu

500500

Ser Cys Asp Arg Arg Phe SerSer Cys Asp Arg Arg Phe Ser

505 510505 510

Ser Gly Asn Leu Thr Glu His 515Ser Gly Asn Leu Thr Glu His 515

Ile Arg Ile His Thr Gly Gln LysIle Arg Ile His Thr Gly Gln Lys

520 525520 525

Phe Gln Cys Arg Ile Cys Met Arg Asn Phe SerPhe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser

530 535530 535

Thr Ser Gly His 540Thr Ser Gly His 540

Ala 320Ala 320

SerSer

LeuLeu

AlaAla

GlyGly

Arg 400Arg 400

GluGlu

IleIle

ArgArg

ThrThr

Arg 480Arg 480

AspAsp

GlnGln

ProPro

LeuLeu

- 318 046157- 318 046157

Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys AspVal Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp

545545

550550

555555

560560

Ile Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr Glu His ThrIle Cys Gly Arg Lys Phe Ala Gln Asn Ser Thr Leu Thr Glu His Thr

565565

570570

575575

Lys Ile His Leu Arg Gln Lys Asp LysLys Ile His Leu Arg Gln Lys Asp Lys

580580

585 <210> 210 <211> 1113 <212> ДНК <213> Homo sapiens <400> 210 atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt60 ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg120 ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc180 ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc240 tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag300 gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta360 gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca420 cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggaggaa gattcgaaat480 aaaagatctg ctcaagagag ccgcaggaaa aagaaggtgt acgttggggg tttagagagc540 cgggtcttga aatacacagc ccagaatatg gagcttcaga acaaagtaca gcttctggag600 gaacagaatt tgtcccttct agatcaactg aggaaactcc aggccatggt gattgagatc660 tcaaacaaaa ccagcagcag cagcacctgc atcttggtcc tgctagtctc cttctgcctc720 ctccttgtac ctgctatgta ctcctctgac acaaggggga gcctgccagc tgagcatgga780 gtgttgtccc gccagcttcg tgccctcccc agtgaggacc cttaccagct ggagctgcct840 gccctgcagt cagaagtgcc gaaagacagc acacaccagt ggttggacgg ctcagactgt900 gtactccagg cccctggcaa cacttcctgc ctgctgcatt acatgcctca ggctcccagt960 gcagagcctc ccctggagtg gcccttccct gacctcttct cagagcctct ctgccgaggt1020 cccatcctcc ccctgcaggc aaatctcaca aggaagggag gatggcttcc tactggtagc1080 ccctctgtca ttttgcagga cagatactca ggc1113 <210> 211 <211> 371 <212> Белок <213> Homo sapiens <400> 211585 <210> 210 <211> 1113 <212> DNA <213> Homo sapiens <400> 210 atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt60 ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgcc g120 ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc180 ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc240 tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag300 gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta360 gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca420 cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggaggaa g attcgaaat480 aaaagatctg ctcaagagag ccgcaggaaa aagaaggtgt acgttggggg tttagagagc540 cgggtcttga aatacacagc ccagaatatg gagcttcaga acaaagtaca gcttctggag600 gaacagaatt tgtcccttct agatcaactg aggaaactcc aggccatggt gattg agatc660 tcaaacaaaa ccagcagcag cagcacctgc atcttggtcc tgctagtctc cttctgcctc720 ctccttgtac ctgctatgta ctcctctgac acaaggggga gcctgccagc tgagcatgga780 gtgttgtccc gccagcttcg tgccctcccc agtgaggacc cttaccagct ggagctgcct840 gccctgcagt cagaagtgcc gaaagacagc acacaccagt ggttggacgg ctcagactgt900 gtactccagg cccctggcaa cacttcctgc ctgctgcatt acatgcctca ggctcccagt 960 gcagagcctc ccctggagtg gcccttccct gacctcttct cagagcctct ctgccgaggt1020 cccatcctcc ccctgcaggc aaatctcaca aggaagggag gatggcttcc tactggtagc1080 ccctctgtca ttttgcagga cagatactca ggc1113 <210> 211 <21 1> 371 <212> Protein <213> Homo sapiens <400> 211

- 319 046157- 319 046157

Met 1Met 1

LeuLeu

AlaAla

GluGlu

Asn 65Asn 65

TyrTyr

CysCys

AlaAla

LeuLeu

Lys 145Lys 145

LysLys

GlyGly

GlnGln

GlnGln

Ser 225Ser 225

LeuLeu

Glu Leu Glu Leu Asp 5Glu Leu Glu Leu Asp 5

Glu Glu Ser Gly Asp 20Glu Glu Ser Gly Asp 20

Pro Leu Asp Trp Ala 35Pro Leu Asp Trp Ala 35

Val Asp Asp Leu Leu 50Val Asp Asp Leu Leu 50

Ile Leu Ser Ser SerIle Leu Ser Ser Ser

Ser Leu Pro Arg Glu 85Ser Leu Pro Arg Glu 85

Arg Lys Glu Gly Thr 100Arg Lys Glu Gly Thr 100

Glu Gln Glu Ile AlaGlu Gln Glu Ile Ala

115115

Leu Glu Lys Glu Gly 130Leu Glu Lys Glu Gly 130

Thr Glu Glu Gln IleThr Glu Glu Gln Ile

150150

Arg Ser Ala Gln GluArg Ser Ala Gln Glu

165165

Leu Glu Ser Arg ValLeu Glu Ser Arg Val

180180

Asn Lys Val Gln Leu 195Asn Lys Val Gln Leu 195

Leu Arg Lys Leu Gln 210Leu Arg Lys Leu Gln 210

Ser Ser Ser Thr CysSer Ser Ser Thr Cys

230230

Leu Val Pro Ala MetLeu Val Pro Ala Met

245245

Ala Gly Asp Gln AspAla Gly Asp Gln Asp

Leu Gly Thr Ala Pro 25Leu Gly Thr Ala Pro 25

Leu Pro Leu Ser Glu 40Leu Pro Leu Ser Glu 40

Cys Ser Leu Leu Ser 55Cys Ser Leu Leu Ser 55

Asn Pro Cys Leu Val 75Asn Pro Cys Leu Val 75

Thr Val Ser Met AspThr Val Ser Met Asp

Gln Met Thr Pro GlnGln Met Thr Pro Gln

105105

Arg Leu Val Leu Thr 120Arg Leu Val Leu Thr 120

Leu Ile Leu Pro Glu 135Leu Ile Leu Pro Glu 135

Leu Lys Arg Val ArgLeu Lys Arg Val Arg

155155

Ser Arg Arg Lys LysSer Arg Arg Lys Lys

170170

Leu Lys Tyr Thr AlaLeu Lys Tyr Thr Ala

185185

Leu Glu Glu Gln AsnLeu Glu Glu Gln Asn

200200

Ala Met Val Ile Glu 215Ala Met Val Ile Glu 215

Ile Leu Val Leu LeuIle Leu Val Leu Leu

235235

Tyr Ser Ser Asp ThrTyr Ser Ser Asp Thr

250250

Leu Leu Ala Phe LeuLeu Leu Ala Phe Leu

Asp Glu Ala Val Arg 30Asp Glu Ala Val Arg 30

Val Pro Ser Asp Trp 45Val Pro Ser Asp Trp 45

Pro Pro Ala Ser Leu 60Pro Pro Ala Ser Leu 60

His His Asp His ThrHis His Asp His Thr

Leu Glu Ser Glu SerLeu Glu Ser Glu Ser

His Met Glu Glu LeuHis Met Glu Glu Leu

110110

Asp Glu Glu Lys Ser 125Asp Glu Glu Lys Ser 125

Thr Leu Pro Leu Thr 140Thr Leu Pro Leu Thr 140

Arg Lys Ile Arg AsnArg Lys Ile Arg Asn

160160

Lys Val Tyr Val GlyLys Val Tyr Val Gly

175175

Gln Asn Met Glu LeuGln Asn Met Glu Leu

190190

Leu Ser Leu Leu AspLeu Ser Leu Leu Asp

205205

Ile Ser Asn Lys Thr 220Ile Ser Asn Lys Thr 220

Val Ser Phe Cys LeuVal Ser Phe Cys Leu

240240

Arg Gly Ser Leu ProArg Gly Ser Leu Pro

255255

- 320 046157- 320 046157

Ala Glu His Gly Val Leu Ser ArgAla Glu His Gly Val Leu Ser Arg

260260

Gln Leu Arg Ala Leu Pro Ser GluGln Leu Arg Ala Leu Pro Ser Glu

265 270265 270

Asp Pro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser Glu Val Pro LysAsp Pro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser Glu Val Pro Lys

275 280285275 280285

Asp Ser Thr His Gln Trp Leu Asp Gly Ser Asp Cys Val Leu Gln AlaAsp Ser Thr His Gln Trp Leu Asp Gly Ser Asp Cys Val Leu Gln Ala

290 295300290 295300

Pro Gly Asn Thr Ser Cys Leu Leu His Tyr Met Pro Gln Ala Pro SerPro Gly Asn Thr Ser Cys Leu Leu His Tyr Met Pro Gln Ala Pro Ser

305 310 315320305 310 315320

Ala Glu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu Phe Ser Glu ProAla Glu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu Phe Ser Glu Pro

325 330335325 330335

Leu Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg LysLeu Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg Lys

340 345350340 345350

Gly Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp ArgGly Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp Arg

355 360365355 360365

Tyr Ser GlyTyr Ser Gly

370 <210> 212 <211> 1590 <212> ДНК <213> Искусственная последовательность <220>370 <210> 212 <211> 1590 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 212<223> Description of artificial sequence: Synthetic polynucleotide <400> 212

atggagctgg atggagctgg aattggatgc aattggatgc tggtgaccaa tggtgaccaa gacctgctgg gacctgctgg ccttcctgct ccttcctgct agaggaaagt aggaaagt 60 60 ggagatttgg ggagattgg ggacggcacc ggacggcacc cgatgaggcc cgatgaggcc gtgagggccc gtgagggccc cactggactg cactggactg ggcgctgccg ggcgctgccg 120 120 ctttctgagg ctttctgagg tgccgagcga tgccgagcga ctgggaagta ctgggaagta gatgatttgc gatgatttgc tgtgctccct tgtgctccct gctgagtccc gctgagtccc 180 180 ccagcgtcgt ccagcgtcgt tgaacattct tgaacattct cagctcctcc cagctcctcc aacccctgcc aacccctgcc ttgtccacca ttgtccacca tgaccacacc tgaccacacc 240 240 tactccctcc tactccctcc cacgggaaac cacgggaaac tgtctctatg tgtctctatg gatctagaga gatctagaga gtgagagctg gtgagagctg tagaaaagag tagaaaagag 300 300 gggacccaga gggacccaga tgactccaca tgactccaca gcatatggag gcatatggag gagctggcag gagctggcag agcaggagat agcaggagat tgctaggcta tgctaggcta 360 360 gtactgacag gtactgacag atgaggagaa atgaggagaa gagtctattg gagtctattg gagaaggagg gagaaggagg ggcttattct ggcttattct gcctgagaca gcctgagaca 420 420 cttcctctca cttcctctca ctaagacaga ctaagacaga ggaacaaatt ggaacaaatt ctgaaacgtg ctgaaacgtg tgcggctcga tgcggctcga accaggtgaa accaggtgaa 480 480 aaaccttaca aaaccttaca aatgtcctga aatgtcctga atgtgggaaa atgtgggaaa tcattcagtc tcattcagtc gcagcgacaa gcagcgacaa cctggtgaga cctggtgaga 540 540 catcaacgca catcaacgca cccatacagg cccatacagg agaaaaacct agaaaaacct tataaatgtc tataaatgtc cagaatgtgg cagaatgtgg aaagtccttc aaagtccttc 600 600

- 321 046157- 321 046157

tcacgagagg tcacgagagg ataacttgca ataacttgca cactcatcaa cactcatcaa cgaacacata cgaacacata ctggtgaaaa ctggtgaaaa accatacaag accataag 660 660 tgtcccgaat tgtcccgaat gtggtaaaag gtggtaaaag ttttagccgg ttttagccgg agcgatgaac agcgatgaac ttgtccgaca ttgtccgaca ccaacgaacc ccaacgaacc 720 720 catacaggcg catacaggcg agaagcctta agaagcctta caaatgtccc caaatgtccc gagtgtggca gagtgtggca agagcttctc agagcttctc acaatcaggg acaatcaggg 780 780 aatctgactg aatctgactg agcatcaacg agcatcaacg aactcatacc aactcatacc ggggaaaaac ggggaaaaac cttacaagtg cttacaagtg tccagagtgt tccagagtgt 840 840 gggaagagct gggaagagct tttccacaag tttccacaag tggacatctg tggacatctg gtacgccacc gtacgccacc agaggacaca aggagacaca tacaggggag tacaggggag 900 900 aagccctaca aagccctaca aatgccccga aatgccccga atgcggtaaa atgcggtaaa agtttctctc agtttctctc agaatagtac agaatagtac cctgaccgaa cctgaccgaa 960 960 caccagcgaa caccagcgaa cacacactgg cacacactgg gaaaaaaacg gaaaaaaacg agtgtgtacg agtgtgtacg ttgggggttt ttggggggttt agagagccgg agagagccgg 1020 1020 gtcttgaaat gtcttgaaat acacagccca acacagccca gaatatggag gaatatggag cttcagaaca cttcagaaca aagtacagct aagtacagct tctggaggaa tctggaggaa 1080 1080 cagaatttgt cagaatttgt cccttctaga cccttctaga tcaactgagg tcaactgagg aaactccagg aaactccagg ccatggtgat ccatggtgat tgagatctca tgagatctca 1140 1140 aacaaaacca aacaaaacca gcagcagcag gcagcagcag cacctgcatc cacctgcatc ttggtcctgc ttggtcctgc tagtctcctt tagtctcctt ctgcctcctc ctgcctcctc 1200 1200 cttgtacctg cttgtacctg ctatgtactc ctatgtactc ctctgacaca ctctgacaca agggggagcc aggggggagcc tgccagctga tgccagctga gcatggagtg gcatggagtg 1260 1260 ttgtcccgcc ttgtcccgcc agcttcgtgc agcttcgtgc cctccccagt cctccccagt gaggaccctt gaggaccctt accagctgga accagctgga gctgcctgcc gctgcctgcc 1320 1320 ctgcagtcag ctgcagtcag aagtgccgaa aagtgccgaa agacagcaca agacagcaca caccagtggt caccagtggt tggacggctc tggacggctc agactgtgta agactgtgta 1380 1380 ctccaggccc ctccaggccc ctggcaacac ctggcaacac ttcctgcctg ttcctgcctg ctgcattaca ctgcattaca tgcctcaggc tgcctcaggc tcccagtgca tccagtgca 1440 1440 gagcctcccc gagcctcccc tggagtggcc tggagtggcc cttccctgac cttccctgac ctcttctcag ctcttctcag agcctctctg agcctctctg ccgaggtccc ccgaggtccc 1500 1500 atcctccccc atcctccccc tgcaggcaaa tgcaggcaaa tctcacaagg tctcacaagg aagggaggat aagggaggat ggcttcctac ggcttcctac tggtagcccc tggtagcccc 1560 1560 tctgtcattt tctgtcattt tgcaggacag tgcaggacag atactcaggc atactcaggc 1590 1590

<210> 213 <211> 530 <212> Белок <213> Искусственная последовательность <220><210> 213 <211> 530 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 213<223> Description of artificial sequence: Synthetic polypeptide <400> 213

Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe LeuMet Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu

5 10155 1015

Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala ValArgLeu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala ValArg

25302530

Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp 35 4045Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp 35 4045

Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu 50 5560Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu 50 5560

Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr 65 70 7580Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr 65 70 7580

- 322 046157- 322 046157

TyrTyr

CysCys

AlaAla

LeuLeu

Lys 145Lys 145

LysLys

AsnAsn

CysCys

HisHis

Gly 225Gly 225

HisHis

SerSer

LysLys

HisHis

Cys 305Cys 305

HisHis

Ser Leu Pro Arg GluSer Leu Pro Arg Glu

Thr Val Ser Met AspThr Val Ser Met Asp

Leu Glu Ser Glu SerLeu Glu Ser Glu Ser

Arg Lys Glu Gly Thr 100Arg Lys Glu Gly Thr 100

Glu Gln Glu Ile AlaGlu Gln Glu Ile Ala

115115

Leu Glu Lys Glu Gly 130Leu Glu Lys Glu Gly 130

Thr Glu Glu Gln IleThr Glu Glu Gln Ile

150150

Pro Tyr Lys Cys ProPro Tyr Lys Cys Pro

165165

Leu Val Arg His Gln 180Leu Val Arg His Gln 180

Pro Glu Cys Gly Lys 195Pro Glu Cys Gly Lys 195

Gln Arg Thr His Thr 210Gln Arg Thr His Thr 210

Lys Ser Phe Ser ArgLys Ser Phe Ser Arg

230230

Thr Gly Glu Lys ProThr Gly Glu Lys Pro

245245

Gln Ser Gly Asn LeuGln Ser Gly Asn Leu

260260

Pro Tyr Lys Cys ProPro Tyr Lys Cys Pro

275275

Leu Val Arg His Gln 290Leu Val Arg His Gln 290

Pro Glu Cys Gly LysPro Glu Cys Gly Lys

310310

Gln Arg Thr His ThrGln Arg Thr His Thr

Gln Met Thr Pro GlnGln Met Thr Pro Gln

105105

His Met Glu Glu LeuHis Met Glu Glu Leu

110110

Arg Leu Val Leu Thr 120Arg Leu Val Leu Thr 120

Asp Glu Glu Lys Ser 125Asp Glu Glu Lys Ser 125

Leu Ile Leu Pro Glu 135Leu Ile Leu Pro Glu 135

Thr Leu Pro Leu Thr 140Thr Leu Pro Leu Thr 140

Leu Lys Arg Val ArgLeu Lys Arg Val Arg

155155

Glu Cys Gly Lys SerGlu Cys Gly Lys Ser

170170

Arg Thr His Thr Gly 185Arg Thr His Thr Gly 185

Ser Phe Ser Arg GluSer Phe Ser Arg Glu

200200

Gly Glu Lys Pro Tyr 215Gly Glu Lys Pro Tyr 215

Ser Asp Glu Leu ValSer Asp Glu Leu Val

235235

Tyr Lys Cys Pro GluTyr Lys Cys Pro Glu

250250

Thr Glu His Gln ArgThr Glu His Gln Arg

265265

Glu Cys Gly Lys Ser 280Glu Cys Gly Lys Ser 280

Arg Thr His Thr Gly 295Arg Thr His Thr Gly 295

Ser Phe Ser Gln AsnSer Phe Ser Gln Asn

315315

Gly Lys Lys Thr SerGly Lys Lys Thr Ser

Leu Glu Pro Gly GluLeu Glu Pro Gly Glu

160160

Phe Ser Arg Ser AspPhe Ser Arg Ser Asp

175175

Glu Lys Pro Tyr LysGlu Lys Pro Tyr Lys

190190

Asp Asn Leu His Thr 205Asp Asn Leu His Thr 205

Lys Cys Pro Glu Cys 220Lys Cys Pro Glu Cys 220

Arg His Gln Arg ThrArg His Gln Arg Thr

240240

Cys Gly Lys Ser PheCys Gly Lys Ser Phe

255255

Thr His Thr Gly GluThr His Thr Gly Glu

270270

Phe Ser Thr Ser Gly 285Phe Ser Thr Ser Gly 285

Glu Lys Pro Tyr Lys 300Glu Lys Pro Tyr Lys 300

Ser Thr Leu Thr GluSer Thr Leu Thr Glu

320320

Val Tyr Val Gly GlyVal Tyr Val Gly Gly

- 323 046157- 323 046157

325 330325 330

335335

Leu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln AsnLeu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln Asn

340 345340 345

Met Glu Leu GlnMet Glu Leu Gln

350350

Asn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu SerAsn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu Ser

355 360355 360

Leu Leu Asp Gln 365Leu Leu Asp Gln 365

Leu Arg Lys Leu Gln Ala Met Val Ile Glu Ile SerLeu Arg Lys Leu Gln Ala Met Val Ile Glu Ile Ser

370 375 380370 375 380

Asn Lys Thr SerAsn Lys Thr Ser

Ser Ser Ser Thr Cys Ile Leu Val Leu Leu Val SerSer Ser Ser Thr Cys Ile Leu Val Leu Leu Val Ser

385 390 395385 390 395

Phe Cys Leu LeuPhe Cys Leu Leu

400400

Leu Val Pro Ala Met Tyr Ser Ser Asp Thr Arg GlyLeu Val Pro Ala Met Tyr Ser Ser Asp Thr Arg Gly

405 410405 410

Ser Leu Pro AlaSer Leu Pro Ala

415415

Glu His Gly Val Leu Ser Arg Gln Leu Arg Ala LeuGlu His Gly Val Leu Ser Arg Gln Leu Arg Ala Leu

420 425420 425

Pro Ser Glu AspPro Ser Glu Asp

430430

Pro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser GluPro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser Glu

435 440435 440

Val Pro Lys Asp 445Val Pro Lys Asp 445

Ser Thr His Gln Trp Leu Asp Gly Ser Asp Cys ValSer Thr His Gln Trp Leu Asp Gly Ser Asp Cys Val

450 455 460450 455 460

Leu Gln Ala ProLeu Gln Ala Pro

Gly Asn Thr Ser Cys Leu Leu His Tyr Met Pro GlnGly Asn Thr Ser Cys Leu Leu His Tyr Met Pro Gln

465 470 475465 470 475

Ala Pro Ser AlaAla Pro Ser Ala

480480

Glu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu PheGlu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu Phe

485 490485 490

Ser Glu Pro LeuSer Glu Pro Leu

495495

Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn LeuCys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu

500 505500 505

Thr Arg Lys GlyThr Arg Lys Gly

510510

Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile LeuGly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu

515 520515 520

Gln Asp Arg Tyr 525Gln Asp Arg Tyr 525

Ser GlySer Gly

530 <210> 214 <211> 1590 <212> ДНК <213> Искусственная последовательность <220>530 <210> 214 <211> 1590 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности полинуклеотид<223> Description of the artificial polynucleotide sequence

СинтетическийSynthetic

- 324 046157 <400> 214 atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt 60 ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg120 ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc180 ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc240 tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag300 gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta360 gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca420 cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggcttga gcccggagag480 aagccgtaca agtgccctga gtgcggcaag tcttttagca gaagagacga acttaatgtc540 caccagcgaa cgcatactgg tgaaaagccc tataaatgtc ctgaatgtgg gaaatcattc600 tccagccgca gaacctgtag ggctcaccag cgaacacaca ccggcgaaaa accatacaaa660 tgtccagaat gcgggaaatc cttttctcag tcatccaact tggtgagaca tcaacgcacg720 cacactggag aaaagcctta caaatgcccg gaatgtggaa agtctttttc ccaattggcc780 catttgcgag cccatcagag gactcacacg ggcgagaaac cttacaaatg cccggaatgc840 gggaaatctt tttcaacgag tggcaacctc gtaagacacc aaagaacgca tacaggcgaa900 aagccatata agtgtcctga gtgtggtaaa tcattctcac acaggaccac cctgacaaat960 caccagcgca cgcacaccgg caagaagaca agcgtgtacg ttgggggttt agagagccgg1020 gtcttgaaat acacagccca gaatatggag cttcagaaca aagtacagct tctggaggaa1080 cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatctca1140 aacaaaacca gcagcagcag cacctgcatc ttggtcctgc tagtctcctt ctgcctcctc1200 cttgtacctg ctatgtactc ctctgacaca agggggagcc tgccagctga gcatggagtg1260 ttgtcccgcc agcttcgtgc cctccccagt gaggaccctt accagctgga gctgcctgcc1320 ctgcagtcag aagtgccgaa agacagcaca caccagtggt tggacggctc agactgtgta1380 ctccaggccc ctggcaacac ttcctgcctg ctgcattaca tgcctcaggc tcccagtgca1440 gagcctcccc tggagtggcc cttccctgac ctcttctcag agcctctctg ccgaggtccc1500 atcctccccc tgcaggcaaa tctcacaagg aagggaggat ggcttcctac tggtagcccc1560 tctgtcattt tgcaggacag atactcaggc1590 <210> 215 <211> 530 <212> Белок <213> Искусственная последовательность <220>- 324 046157 <400> 214 atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt 60 ggagatttgg ggacggcacc cgatgaggcc gtgaggccc cactggactg ggcgctgccg120 ctttctgagg tgccgagcga ctgggaagta gat gatttgc tgtgctccct gctgagtccc180 ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc240 tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag300 gggacccaga tgactccaca gcatatggag gagctggcag agca ggagat tgctaggcta360 gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca420 cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggcttga gcccggagag480 aagccgtaca agtgccctga gtgcggcaag tcttttagca gaagagacga acttaatgtc540 caccagcgaa cgcatactgg tgaaaagccc tataaatgtc ctgaatgtgg gaaatcattc60 0 tccagccgca gaacctgtag ggctcaccag cgaacacaca ccggcgaaaa accatacaaa660 tgtccagaat gcgggaaatc cttttctcag tcatccaact tggtgagaca tcaacgcacg720 cacactggag aaaagcctta caaatgcccg gaatgtggaa agtctcttttc ccaattggcc7 80 catttgcgag cccatcagag gactcacacg ggcgagaaac cttacaaatg cccggaatgc840 gggaaatctt tttcaacgag tggcaacctc gtaagacacc aaagaacgca tacaggcgaa900 aagccatata agtgtcctga gtgtggtaaa tcattctcac acaggaccac cctgacaaat960 caccagcgca cgcacaccgg caagaagaca agcgtgtacg ttgggggttt agagagccgg1020 gtcttgaaat acacagccca gaatatggag cttcagaaca aagtacagct tctggaggaa1080 cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatctca1140 aacaaaacca gcagcagcag cacctgcatc ttggtcctgc tagtctcctt ctgcctcctc1200 cttgtacctg ctatgtactc ctctgacaca agggggagcc tgccagctga gcatggagtg1260 ttgtcccgcc ag cttcgtgc cctccccagt gaggaccctt accagctgga gctgcctgcc1320 ctgcagtcag aagtgccgaa agacagcaca caccagtggt tggacggctc agactgtgta1380 ctccaggccc ctggcaacac ttcctgcctg ctgcattaca tgcctcaggc tcccagtgca1440 gagcctcccc tggagtggcc cttccctgac ctcttctcag agcctctctg ccgaggtccc1500 atcctccccc tgcaggcaaa tctcacaagg aagggaggat ggcttcctac tggtagcccc1560 tctgtcattt tgcaggacag atactcaggc159 0 <210> 215 <211> 530 <212> Protein <213> Artificial sequence <220>

- 325 046157 <223> Описание искусственной последовательности полипептид <400> 215- 325 046157 <223> Description of the artificial sequence polypeptide <400> 215

Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu 1 5 10Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu 1 5 10

СинтетическийSynthetic

Leu Ala Phe LeuLeu Ala Phe Leu

Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp 20 25Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp 20 25

Glu Ala Val Arg 30Glu Ala Val Arg 30

Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu ValAla Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val

4040

Pro Ser Asp Trp 45Pro Ser Asp Trp 45

Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser ProGlu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro

55 6055 60

Pro Ala Ser LeuPro Ala Ser Leu

Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His 65 70 75Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His 65 70 75

His Asp His ThrHis Asp His Thr

Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp LeuTyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu

9090

Glu Ser Glu SerGlu Ser Glu Ser

Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln HisCys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His

100 105100 105

Met Glu Glu LeuMet Glu Glu Leu

110110

Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr AspAla Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp

115 120115 120

Glu Glu Lys Ser 125Glu Glu Lys Ser 125

Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu ThrLeu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr

130 135 140130 135 140

Leu Pro Leu ThrLeu Pro Leu Thr

Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg LeuLys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Leu

145 150 155145 150 155

Glu Pro Gly GluGlu Pro Gly Glu

160160

Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser PheLys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe

165 170165 170

Ser Arg Arg AspSer Arg Arg Asp

175175

Glu Leu Asn Val His Gln Arg Thr His Thr Gly GluGlu Leu Asn Val His Gln Arg Thr His Thr Gly Glu

180 185180 185

Lys Pro Tyr LysLys Pro Tyr Lys

190190

Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Arg ArgCys Pro Glu Cys Gly Lys Ser Phe Ser Ser Arg Arg

195 200195 200

Thr Cys Arg Ala 205Thr Cys Arg Ala 205

His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr LysHis Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys

210 215 220210 215 220

Cys Pro Glu CysCys Pro Glu Cys

Gly Lys Ser Phe Ser Gln Ser Ser Asn Leu Val ArgGly Lys Ser Phe Ser Gln Ser Ser Asn Leu Val Arg

225 230 235225 230 235

His Gln Arg ThrHis Gln Arg Thr

240240

- 326 046157- 326 046157

HisHis

SerSer

LysLys

AsnAsn

Cys 305Cys 305

HisHis

LeuLeu

AsnAsn

LeuLeu

Ser 385Ser 385

LeuLeu

GluGlu

ProPro

SerSer

Gly 465Gly 465

GluGlu

Thr Gly Glu Lys ProThr Gly Glu Lys Pro

245245

Gln Leu Ala His LeuGln Leu Ala His Leu

260260

Pro Tyr Lys Cys ProPro Tyr Lys Cys Pro

275275

Leu Val Arg His Gln 290Leu Val Arg His Gln 290

Pro Glu Cys Gly LysPro Glu Cys Gly Lys

310310

Gln Arg Thr His ThrGln Arg Thr His Thr

325325

Glu Ser Arg Val LeuGlu Ser Arg Val Leu

340340

Lys Val Gln Leu LeuLys Val Gln Leu Leu

355355

Arg Lys Leu Gln Ala 370Arg Lys Leu Gln Ala 370

Ser Ser Thr Cys IleSer Ser Thr Cys Ile

390390

Val Pro Ala Met TyrVal Pro Ala Met Tyr

405405

His Gly Val Leu SerHis Gly Val Leu Ser

420420

Tyr Gln Leu Glu LeuTyr Gln Leu Glu Leu

435435

Thr His Gln Trp Leu 450Thr His Gln Trp Leu 450

Asn Thr Ser Cys LeuAsn Thr Ser Cys Leu

470470

Pro Pro Leu Glu TrpPro Pro Leu Glu Trp

485485

Tyr Lys Cys Pro GluTyr Lys Cys Pro Glu

250250

Cys Gly Lys Ser PheCys Gly Lys Ser Phe

255255

Arg Ala His Gln Arg 265Arg Ala His Gln Arg 265

Glu Cys Gly Lys SerGlu Cys Gly Lys Ser

280280

Arg Thr His Thr Gly 295Arg Thr His Thr Gly 295

Ser Phe Ser His ArgSer Phe Ser His Arg

315315

Gly Lys Lys Thr SerGly Lys Lys Thr Ser

330330

Lys Tyr Thr Ala GlnLys Tyr Thr Ala Gln

345345

Glu Glu Gln Asn LeuGlu Glu Gln Asn Leu

360360

Met Val Ile Glu Ile 375Met Val Ile Glu Ile 375

Leu Val Leu Leu ValLeu Val Leu Leu Val

395395

Ser Ser Asp Thr ArgSer Ser Asp Thr Arg

410410

Arg Gln Leu Arg Ala 425Arg Gln Leu Arg Ala 425

Pro Ala Leu Gln SerPro Ala Leu Gln Ser

440440

Asp Gly Ser Asp Cys 455Asp Gly Ser Asp Cys 455

Leu His Tyr Met ProLeu His Tyr Met Pro

475475

Pro Phe Pro Asp LeuPro Phe Pro Asp Leu

490490

Thr His Thr Gly GluThr His Thr Gly Glu

270270

Phe Ser Thr Ser Gly 285Phe Ser Thr Ser Gly 285

Glu Lys Pro Tyr Lys 300Glu Lys Pro Tyr Lys 300

Thr Thr Leu Thr AsnThr Thr Leu Thr Asn

320320

Val Tyr Val Gly GlyVal Tyr Val Gly Gly

335335

Asn Met Glu Leu GlnAsn Met Glu Leu Gln

350350

Ser Leu Leu Asp GlnSer Leu Leu Asp Gln

365365

Ser Asn Lys Thr Ser 380Ser Asn Lys Thr Ser 380

Ser Phe Cys Leu LeuSer Phe Cys Leu Leu

400400

Gly Ser Leu Pro AlaGly Ser Leu Pro Ala

415415

Leu Pro Ser Glu Asp 430Leu Pro Ser Glu Asp 430

Glu Val Pro Lys Asp 445Glu Val Pro Lys Asp 445

Val Leu Gln Ala Pro 460Val Leu Gln Ala Pro 460

Gln Ala Pro Ser AlaGln Ala Pro Ser Ala

480480

Phe Ser Glu Pro LeuPhe Ser Glu Pro Leu

495495

- 327 046157- 327 046157

Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg Lys Gly 500 505 510Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg Lys Gly 500 505 510

Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp Arg Tyr 515 520 525Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp Arg Tyr 515 520 525

Ser Gly 530 <210> 216 <211> 1590 <212> ДНК <213> Искусственная последовательность <220>Ser Gly 530 <210> 216 <211> 1590 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид<223> Description of artificial sequence: Synthetic polynucleotide

<400> 216 atggagctgg <400> 216 atggagctgg aattggatgc aattggatgc tggtgaccaa tggtgaccaa gacctgctgg gacctgctgg ccttcctgct ccttcctgct agaggaaagt aggaaagt 60 60 ggagatttgg ggagattgg ggacggcacc ggacggcacc cgatgaggcc cgatgaggcc gtgagggccc gtgagggccc cactggactg cactggactg ggcgctgccg ggcgctgccg 120 120 ctttctgagg ctttctgagg tgccgagcga tgccgagcga ctgggaagta ctgggaagta gatgatttgc gatgatttgc tgtgctccct tgtgctccct gctgagtccc gctgagtccc 180 180 ccagcgtcgt ccagcgtcgt tgaacattct tgaacattct cagctcctcc cagctcctcc aacccctgcc aacccctgcc ttgtccacca ttgtccacca tgaccacacc tgaccacacc 240 240 tactccctcc tactccctcc cacgggaaac cacgggaaac tgtctctatg tgtctctatg gatctagaga gatctagaga gtgagagctg gtgagagctg tagaaaagag tagaaaagag 300 300 gggacccaga gggacccaga tgactccaca tgactccaca gcatatggag gcatatggag gagctggcag gagctggcag agcaggagat agcaggagat tgctaggcta tgctaggcta 360 360 gtactgacag gtactgacag atgaggagaa atgaggagaa gagtctattg gagtctattg gagaaggagg gagaaggagg ggcttattct ggcttattct gcctgagaca gcctgagaca 420 420 cttcctctca cttcctctca ctaagacaga ctaagacaga ggaacaaatt ggaacaaatt ctgaaacgtg ctgaaacgtg tgcggcgccc tgcggcgccc ttacgcttgc ttacgcttgc 480 480 ccagtggagt ccagtggagt cctgtgatcg cctgtgatcg ccgcttctcc ccgcttctcc cgcagcgaca cgcagcgaca acctggtgag acctggtgag acacatccgc acacatccgc 540 540 atccacacag atccacacag gccagaagcc gccagaagcc cttccagtgc cttccagtgc cgcatctgca cgcatctgca tgagaaactt tgagaaactt cagccgagag cagccgagag 600 600 gataacttgc gataacttgc acactcacat acactcacat ccgcacccac ccgcaccac acaggcgaaa acaggcgaaa agcccttcgc agcccttcgc ctgcgacatc ctgcgacatc 660 660 tgtggaagaa tgtggaagaa agtttgcccg agtttgcccg gagcgatgaa gagcgatgaa cttgtccgac cttgtccgac ataccaagat ataccaagat ccacttgcgg ccacttgcgg 720 720 cagaaggacc cagaaggacc gcccttacgc gcccttacgc ttgcccagtg ttgcccagtg gagtcctgtg gagtcctgtg atcgccgctt atcgccgctt ctcccaatca ctcccaatca 780 780 gggaatctga gggaatctga ctgagcacat ctgagcacat ccgcatccac ccgcatccac acaggccaga acaggccaga agcccttcca agcccttcca gtgccgcatc gtgccgcatc 840 840 tgcatgagaa tgcatgagaa acttcagcac acttcagcac aagtggacat aagtggacat ctggtacgcc ctggtacgcc acatccgcac acatccgcac ccacacaggc ccacacaggc 900 900 gaaaagccct gaaaagccct tcgcctgcga tcgcctgcga catctgtgga catctgtgga agaaagtttg agaaagtttg cccagaatag cccagaatag taccctgacc taccctgacc 960 960 gaacatacca gaacatacca agatccactt agatccactt gcggcagaag gcggcagaag gacgtgtacg gacgtgtacg ttgggggttt ttggggggttt agagagccgg agagagccgg 1020 1020 gtcttgaaat gtcttgaaat acacagccca acacagccca gaatatggag gaatatggag cttcagaaca cttcagaaca aagtacagct aagtacagct tctggaggaa tctggaggaa 1080 1080 cagaatttgt cagaatttgt cccttctaga cccttctaga tcaactgagg tcaactgagg aaactccagg aaactccagg ccatggtgat ccatggtgat tgagatctca tgagatctca 1140 1140 aacaaaacca aacaaaacca gcagcagcag gcagcagcag cacctgcatc cacctgcatc ttggtcctgc ttggtcctgc tagtctcctt tagtctcctt ctgcctcctc ctgcctcctc 1200 1200

- 328 046157- 328 046157

cttgtacctg cttgtacctg ctatgtactc ctatgtactc ctctgacaca ctctgacaca agggggagcc aggggggagcc tgccagctga tgccagctga gcatggagtg gcatggagtg 1260 1260 ttgtcccgcc ttgtcccgcc agcttcgtgc agcttcgtgc cctccccagt cctccccagt gaggaccctt gaggaccctt accagctgga accagctgga gctgcctgcc gctgcctgcc 1320 1320 ctgcagtcag ctgcagtcag aagtgccgaa aagtgccgaa agacagcaca agacagcaca caccagtggt caccagtggt tggacggctc tggacggctc agactgtgta agactgtgta 1380 1380 ctccaggccc ctccaggccc ctggcaacac ctggcaacac ttcctgcctg ttcctgcctg ctgcattaca ctgcattaca tgcctcaggc tgcctcaggc tcccagtgca tccagtgca 1440 1440 gagcctcccc gagcctcccc tggagtggcc tggagtggcc cttccctgac cttccctgac ctcttctcag ctcttctcag agcctctctg agcctctctg ccgaggtccc ccgaggtccc 1500 1500 atcctccccc atcctccccc tgcaggcaaa tgcaggcaaa tctcacaagg tctcacaagg aagggaggat aagggaggat ggcttcctac ggcttcctac tggtagcccc tggtagcccc 1560 1560 tctgtcattt tctgtcattt tgcaggacag tgcaggacag atactcaggc atactcaggc 1590 1590

<210> 217 <211> 530 <212> Белок <213> Искусственная последовательность <220><210> 217 <211> 530 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 217<223> Description of artificial sequence: Synthetic polypeptide <400> 217

Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu 1 5 1015Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu 1 5 1015

Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg 20 2530Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg 20 2530

Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp 35 4045Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp 35 4045

Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu 50 5560Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu 50 5560

Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr 65 70 7580Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr 65 70 7580

Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu Ser 85 9095Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu Ser 85 9095

Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu LeuCys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu Leu

100 105110100 105110

Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys SerAla Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys Ser

115 120125115 120125

Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu ThrLeu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu Thr

130 135140130 135140

Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Arg Pro Tyr Ala CysLys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Arg Pro Tyr Ala Cys

- 329 046157- 329 046157

145145

ProPro

ArgArg

CysCys

ThrThr

Phe 225Phe 225

GlnGln

PhePhe

GlnGln

GlyGly

Ala 305Ala 305

GluGlu

LeuLeu

AsnAsn

LeuLeu

Ser 385Ser 385

150150

155155

160160

Val Glu Ser Cys AspVal Glu Ser Cys Asp

165165

Arg Arg Phe Ser ArgArg Arg Phe Ser Arg

170170

Ser Asp Asn Leu ValSer Asp Asn Leu Val

175175

His Ile Arg Ile HisHis Ile Arg Ile His

180180

Met Arg Asn Phe Ser 195Met Arg Asn Phe Ser 195

His Thr Gly Glu Lys 210His Thr Gly Glu Lys 210

Ala Arg Ser Asp GluAla Arg Ser Asp Glu

230230

Lys Asp Arg Pro TyrLys Asp Arg Pro Tyr

245245

Ser Gln Ser Gly Asn 260Ser Gln Ser Gly Asn 260

Lys Pro Phe Gln CysLys Pro Phe Gln Cys

275275

His Leu Val Arg His 290His Leu Val Arg His 290

Cys Asp Ile Cys GlyCys Asp Ile Cys Gly

310310

His Thr Lys Ile HisHis Thr Lys Ile His

325325

Glu Ser Arg Val LeuGlu Ser Arg Val Leu

340340

Lys Val Gln Leu LeuLys Val Gln Leu Leu

355355

Arg Lys Leu Gln Ala 370Arg Lys Leu Gln Ala 370

Ser Ser Thr Cys IleSer Ser Thr Cys Ile

390390

Thr Gly Gln Lys Pro 185Thr Gly Gln Lys Pro 185

Phe Gln Cys Arg IlePhe Gln Cys Arg Ile

190190

Arg Glu Asp Asn LeuArg Glu Asp Asn Leu

200200

Pro Phe Ala Cys Asp 215Pro Phe Ala Cys Asp 215

Leu Val Arg His ThrLeu Val Arg His Thr

235235

Ala Cys Pro Val GluAla Cys Pro Val Glu

250250

Leu Thr Glu His IleLeu Thr Glu His Ile

265265

Arg Ile Cys Met Arg 280Arg Ile Cys Met Arg 280

Ile Arg Thr His Thr 295Ile Arg Thr His Thr 295

Arg Lys Phe Ala GlnArg Lys Phe Ala Gln

315315

Leu Arg Gln Lys AspLeu Arg Gln Lys Asp

330330

Lys Tyr Thr Ala GlnLys Tyr Thr Ala Gln

345345

Glu Glu Gln Asn LeuGlu Glu Gln Asn Leu

360360

Met Val Ile Glu Ile 375Met Val Ile Glu Ile 375

Leu Val Leu Leu ValLeu Val Leu Leu Val

395395

His Thr His Ile ArgHis Thr His Ile Arg

205205

Ile Cys Gly Arg Lys 220Ile Cys Gly Arg Lys 220

Lys Ile His Leu ArgLys Ile His Leu Arg

240240

Ser Cys Asp Arg ArgSer Cys Asp Arg Arg

255255

Arg Ile His Thr Gly 270Arg Ile His Thr Gly 270

Asn Phe Ser Thr SerAsn Phe Ser Thr Ser

285285

Gly Glu Lys Pro Phe 300Gly Glu Lys Pro Phe 300

Asn Ser Thr Leu ThrAsn Ser Thr Leu Thr

320320

Val Tyr Val Gly GlyVal Tyr Val Gly Gly

335335

Asn Met Glu Leu GlnAsn Met Glu Leu Gln

350350

Ser Leu Leu Asp GlnSer Leu Leu Asp Gln

365365

Ser Asn Lys Thr Ser 380Ser Asn Lys Thr Ser 380

Ser Phe Cys Leu LeuSer Phe Cys Leu Leu

400400

- 330 046157- 330 046157

Leu ValLeu Val

Pro AlaPro Ala

Glu HisGlu His

Gly ValGly Val

420420

Pro TyrPro Tyr

Gln Leu 435Gln Leu 435

Ser ThrSer Thr

450450

His GlnHis Gln

Met Tyr 405Met Tyr 405

Leu SerLeu Ser

Glu LeuGlu Leu

Trp LeuTrp Leu

Gly Asn 465Gly Asn 465

Thr SerThr Ser

Cys LeuCys Leu

470470

Glu ProGlu Pro

Pro LeuProLeu

Glu Trp 485Glu Trp 485

Cys ArgCysArg

Gly ProGly Pro

500500

Ile LeuIle Leu

Gly TrpGly Trp

Leu Pro 515Leu Pro 515

Thr GlyThr Gly

Ser SerSer Ser

Arg GlnArg Gln

Pro Ala 440Pro Ala 440

Asp Gly 455Asp Gly 455

Leu HisLeu His

Pro PhePro Phe

Pro LeuProLeu

Ser ProSer Pro

520520

Asp ThrAsp Thr

410410

Leu Arg 425Leu Arg 425

Leu GlnLeu Gln

Ser AspSer Asp

Tyr MetTyr Met

Pro AspPro Asp

490490

Gln Ala 505Gln Ala 505

Ser ValSer Val

Arg GlyArg Gly

Ala LeuAla Leu

Ser GluSer Glu

Cys ValCys Val

460460

Pro Gln 475Pro Gln 475

Leu PheLeu Phe

Asn LeuAsn Leu

Ile LeuIle Leu

Ser LeuSer Leu

Pro SerPro Ser

430430

Val Pro 445Val Pro 445

Leu GlnLeu Gln

Ala ProAla Pro

Ser GluSer Glu

Thr ArgThr Arg

510510

Gln Asp 525Gln Asp 525

Pro Ala 415Pro Ala 415

Glu AspGlu Asp

Lys AspLys Asp

Ala ProAla Pro

Ser AlaSer Ala

480480

Pro Leu 495Pro Leu 495

Lys GlyLys Gly

Arg TyrArg Tyr

Ser GlySer Gly

530 <210> 218 <211> 1590 <212> ДНК <213> Искусственная последовательность <220>530 <210> 218 <211> 1590 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид<223> Description of artificial sequence: Synthetic polynucleotide

<400> 218 atggagctgg <400> 218 atggagctgg aattggatgc aattggatgc tggtgaccaa tggtgaccaa gacctgctgg gacctgctgg ccttcctgct ccttcctgct agaggaaagt aggaaagt ggagatttgg ggagattgg ggacggcacc ggacggcacc cgatgaggcc cgatgaggcc gtgagggccc gtgagggccc cactggactg cactggactg ggcgctgccg ggcgctgccg ctttctgagg ctttctgagg tgccgagcga tgccgagcga ctgggaagta ctgggaagta gatgatttgc gatgatttgc tgtgctccct tgtgctccct gctgagtccc gctgagtccc ccagcgtcgt ccagcgtcgt tgaacattct tgaacattct cagctcctcc cagctcctcc aacccctgcc aacccctgcc ttgtccacca ttgtccacca tgaccacacc tgaccacacc tactccctcc tactccctcc cacgggaaac cacgggaaac tgtctctatg tgtctctatg gatctagaga gatctagaga gtgagagctg gtgagagctg tagaaaagag tagaaaagag gggacccaga gggacccaga tgactccaca tgactccaca gcatatggag gcatatggag gagctggcag gagctggcag agcaggagat agcaggagat tgctaggcta tgctaggcta gtactgacag gtactgacag atgaggagaa atgaggagaa gagtctattg gagtctattg gagaaggagg gagaaggagg ggcttattct ggcttattct gcctgagaca gcctgagaca cttcctctca cttcctctca ctaagacaga ctaagacaga ggaacaaatt ggaacaaatt ctgaaacgtg ctgaaacgtg tgcggcgccc tgcggcgccc ttacgcttgc ttacgcttgc ccagtggagt ccagtggagt cctgtgatcg cctgtgatcg ccgcttctcc ccgcttctcc cgctcagaca cgctcagaca acctcgttcg acctcgttcg acacatccgc acacatccgc

120120

180180

240240

300300

360360

420420

480480

540540

- 331 046157- 331 046157

atccacacag atccacacag gccagaagcc gccagaagcc cttccagtgc cttccagtgc cgcatctgca cgcatctgca tgagaaactt tgagaaactt cagccaccgg cagccaccgg 600 600 actacactca actacactca cgaaccacat cgaaccacat ccgcacccac ccgcaccac acaggcgaaa acaggcgaaa agcccttcgc agcccttcgc ctgcgacatc ctgcgacatc 660 660 tgtggaagaa tgtggaagaa agtttgccag agtttgccag agaagacaat agaagacaat ctccatactc ctccatactc ataccaagat ataccaagat ccacttgcgg ccacttgcgg 720 720 cagaaggacc cagaaggacc gcccttacgc gcccttacgc ttgcccagtg ttgcccagtg gagtcctgtg gagtcctgtg atcgccgctt atcgccgctt ctccaccagc ctccaccagc 780 780 cattctctca cattctctca ctgaacacat ctgaacacat ccgcatccac ccgcatccac acaggccaga acaggccaga agcccttcca agcccttcca gtgccgcatc gtgccgcatc 840 840 tgcatgagaa tgcatgagaa acttcagcca acttcagcca gtctagctca gtctagctca ctggtgaggc ctggtgaggc acatccgcac acatccgcac ccacacaggc ccacacaggc 900 900 gaaaagccct gaaaagccct tcgcctgcga tcgcctgcga catctgtgga catctgtgga agaaagtttg agaaagtttg ccagggagga ccaggagaga taacctgcat taacctgcat 960 960 acgcatacca acgcatacca agatccactt agatccactt gcggcagaag gcggcagaag gacgtgtacg gacgtgtacg ttgggggttt ttggggggttt agagagccgg agagagccgg 1020 1020 gtcttgaaat gtcttgaaat acacagccca acacagccca gaatatggag gaatatggag cttcagaaca cttcagaaca aagtacagct aagtacagct tctggaggaa tctggaggaa 1080 1080 cagaatttgt cagaatttgt cccttctaga cccttctaga tcaactgagg tcaactgagg aaactccagg aaactccagg ccatggtgat ccatggtgat tgagatctca tgagatctca 1140 1140 aacaaaacca aacaaaacca gcagcagcag gcagcagcag cacctgcatc cacctgcatc ttggtcctgc ttggtcctgc tagtctcctt tagtctcctt ctgcctcctc ctgcctcctc 1200 1200 cttgtacctg cttgtacctg ctatgtactc ctatgtactc ctctgacaca ctctgacaca agggggagcc aggggggagcc tgccagctga tgccagctga gcatggagtg gcatggagtg 1260 1260 ttgtcccgcc ttgtcccgcc agcttcgtgc agcttcgtgc cctccccagt cctccccagt gaggaccctt gaggaccctt accagctgga accagctgga gctgcctgcc gctgcctgcc 1320 1320 ctgcagtcag ctgcagtcag aagtgccgaa aagtgccgaa agacagcaca agacagcaca caccagtggt caccagtggt tggacggctc tggacggctc agactgtgta agactgtgta 1380 1380 ctccaggccc ctccaggccc ctggcaacac ctggcaacac ttcctgcctg ttcctgcctg ctgcattaca ctgcattaca tgcctcaggc tgcctcaggc tcccagtgca tccagtgca 1440 1440 gagcctcccc gagcctcccc tggagtggcc tggagtggcc cttccctgac cttccctgac ctcttctcag ctcttctcag agcctctctg agcctctctg ccgaggtccc ccgaggtccc 1500 1500 atcctccccc atcctccccc tgcaggcaaa tgcaggcaaa tctcacaagg tctcacaagg aagggaggat aagggaggat ggcttcctac ggcttcctac tggtagcccc tggtagcccc 1560 1560 tctgtcattt tctgtcattt tgcaggacag tgcaggacag atactcaggc atactcaggc 1590 1590

<210> 219 <211> 530 <212> Белок <213> Искусственная последовательность <220><210> 219 <211> 530 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 219<223> Description of artificial sequence: Synthetic polypeptide <400> 219

Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu 1 5 1015Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu 1 5 1015

Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg 20 2530Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg 20 2530

Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp 35 4045Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp 35 4045

Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu 50 5560Glu Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser Leu 50 5560

- 332 046157- 332 046157

Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val 65 7075Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val 65 7075

His His Asp His ThrHis His Asp His Thr

Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu Ser 85 9095Tyr Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu Ser 85 9095

Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu Leu 100 105110Cys Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu Leu 100 105110

Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys Ser 115 120125Ala Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys Ser 115 120125

Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu Thr 130 135140Leu Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu Thr 130 135140

Lys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Arg Pro Tyr Ala CysLys Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Arg Pro Tyr Ala Cys

145 150 155160145 150 155160

Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu ValPro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Asn Leu Val

165 170175165 170175

Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg IleArg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile

180 185190180 185190

Cys Met Arg Asn Phe Ser His Arg Thr Thr Leu Thr Asn His Ile ArgCys Met Arg Asn Phe Ser His Arg Thr Thr Leu Thr Asn His Ile Arg

195 200205195 200205

Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg LysThr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys

210 215220210 215220

Phe Ala Arg Glu Asp Asn Leu His Thr His Thr Lys Ile His Leu ArgPhe Ala Arg Glu Asp Asn Leu His Thr His Thr Lys Ile His Leu Arg

225 230 235240225 230 235240

Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg ArgGln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg

245 250255245 250255

Phe Ser Thr Ser His Ser Leu Thr Glu His Ile Arg Ile His Thr GlyPhe Ser Thr Ser His Ser Leu Thr Glu His Ile Arg Ile His Thr Gly

260 265270260 265270

Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln SerGln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser

275 280285275 280285

Ser Ser Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro PheSer Ser Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe

290 295300290 295300

Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu HisAla Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Glu Asp Asn Leu His

305 310 315320305 310 315320

- 333 046157- 333 046157

Thr His Thr Lys Ile His Leu ArgThr His Thr Lys Ile His Leu Arg

325325

Gln Lys Asp Val Tyr Val Gly GlyGln Lys Asp Val Tyr Val Gly Gly

330 335330 335

Leu GluLeu Glu

Ser Arg ValSer Arg Val

340340

Leu Lys Tyr Thr Ala Gln Asn Met Glu Leu GlnLeu Lys Tyr Thr Ala Gln Asn Met Glu Leu Gln

345 350345 350

Asn Lys Val GlnAsn Lys Val Gln

355355

Leu Leu Glu Glu Gln Asn Leu Ser Leu Leu Asp GlnLeu Leu Glu Glu Gln Asn Leu Ser Leu Leu Asp Gln

360 365360 365

Leu Arg Lys Leu Gln Ala Met ValLeu Arg Lys Leu Gln Ala Met Val

370 375370 375

Ile Glu Ile Ser Asn Lys Thr SerIle Glu Ile Ser Asn Lys Thr Ser

380380

Ser Ser Ser Thr CysSer Ser Ser Thr Cys

385385

Ile Leu Val Leu Leu Val Ser Phe Cys Leu LeuIle Leu Val Leu Leu Val Ser Phe Cys Leu Leu

390 395400390 395400

Leu Val Pro Ala Met Tyr Ser Ser Asp Thr Arg Gly Ser Leu Pro AlaLeu Val Pro Ala Met Tyr Ser Ser Asp Thr Arg Gly Ser Leu Pro Ala

405 410415405 410415

Glu His Gly Val Leu Ser Arg Gln Leu Arg Ala Leu Pro Ser Glu AspGlu His Gly Val Leu Ser Arg Gln Leu Arg Ala Leu Pro Ser Glu Asp

420 425430420 425430

Pro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser Glu Val Pro Lys AspPro Tyr Gln Leu Glu Leu Pro Ala Leu Gln Ser Glu Val Pro Lys Asp

435 440445435 440445

Ser Thr His Gln Trp Leu Asp Gly Ser Asp Cys Val Leu Gln Ala ProSer Thr His Gln Trp Leu Asp Gly Ser Asp Cys Val Leu Gln Ala Pro

450 455460450 455460

Gly Asn Thr Ser Cys Leu Leu His Tyr Met Pro Gln Ala Pro Ser AlaGly Asn Thr Ser Cys Leu Leu His Tyr Met Pro Gln Ala Pro Ser Ala

465 470 475480465 470 475480

Glu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu Phe Ser Glu Pro LeuGlu Pro Pro Leu Glu Trp Pro Phe Pro Asp Leu Phe Ser Glu Pro Leu

485 490495485 490495

Cys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg Lys GlyCys Arg Gly Pro Ile Leu Pro Leu Gln Ala Asn Leu Thr Arg Lys Gly

500 505510500 505510

Gly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp Arg TyrGly Trp Leu Pro Thr Gly Ser Pro Ser Val Ile Leu Gln Asp Arg Tyr

515 520525515 520525

Ser GlySer Gly

530 <210> 220 <211> 1140 <212> ДНК <213> Искусственная последовательность530 <210> 220 <211> 1140 <212> DNA <213> Artificial sequence

- 334 046157 <220>- 334 046157 <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид <400> 220 atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt60 ggagatttgg ggacggcacc cgatgaggcc gtgagggccc cactggactg ggcgctgccg120 ctttctgagg tgccgagcga ctgggaagta gatgatttgc tgtgctccct gctgagtccc180 ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc240 tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag300 gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta360 gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca420 cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggctcga accaggtgaa480 aaaccttaca aatgtcctga atgtgggaaa tcattcagtc gcagcgacaa cctggtgaga540 catcaacgca cccatacagg agaaaaacct tataaatgtc cagaatgtgg aaagtccttc600 tcacgagagg ataacttgca cactcatcaa cgaacacata ctggtgaaaa accatacaag660 tgtcccgaat gtggtaaaag ttttagccgg agcgatgaac ttgtccgaca ccaacgaacc720 catacaggcg agaagcctta caaatgtccc gagtgtggca agagcttctc acaatcaggg780 aatctgactg agcatcaacg aactcatacc ggggaaaaac cttacaagtg tccagagtgt840 gggaagagct tttccacaag tggacatctg gtacgccacc agaggacaca tacaggggag900 aagccctaca aatgccccga atgcggtaaa agtttctctc agaatagtac cctgaccgaa960 caccagcgaa cacacactgg gaaaaaaacg agtgtgtacg ttgggggttt agagagccgg1020 gtcttgaaat acacagccca gaatatggag cttcagaaca aagtacagct tctggaggaa1080 cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatatca1140 <210> 221 <211> 380 <212> Белок <213> Искусственная последовательность <220><223> Description of the artificial sequence: Synthetic polynucleotide <400> 220 atggagctgg aattggatgc tggtgaccaa gacctgctgg ccttcctgct agaggaaagt60 ggagatttgg ggacggcacc cgatgaggcc gtgaggccc cactggactg ggcgctgccg120 ctttctgagg tgccgagcga ctgggaag ta gatgatttgc tgtgctccct gctgagtccc180 ccagcgtcgt tgaacattct cagctcctcc aacccctgcc ttgtccacca tgaccacacc240 tactccctcc cacgggaaac tgtctctatg gatctagaga gtgagagctg tagaaaagag300 gggacccaga tgactccaca gcatatggag gagctggcag agcaggagat tgctaggcta360 gtactgacag atgaggagaa gagtctattg gagaaggagg ggcttattct gcctgagaca420 cttcctctca ctaagacaga ggaacaaatt ctgaaacgtg tgcggctcga accaggtgaa480 aaaccttaca aatgtcctga atgtgggaaa tcattcagtc gcagcgacaa cctggtgaga540 catcaacgca cccata cagg agaaaaacct tataaatgtc cagaatgtgg aaagtccttc600 tcacgagagg ataacttgca cactcatcaa cgaacacata ctggtgaaaa accatacaag660 tgtcccgaat gtggtaaaag ttttagccgg agcgatgaac ttgtccgaca ccaacgaacc720 catacaggcg agaagcctta caaatgtccc gagtgtggca agagcttctc acaatcaggg780 aatctgactg agcatcaacg aactcatacc ggggaaaaac cttacaagtg tccagagtgt840 gggaagagct tttccacaag tggacatctg gtacgccacc agaggacaca tacaggggag900 aagccctaca aatgccccga atgcggtaaa agtttctctc agaatagtac cctgaccgaa960 caccagcgaa cacacactgg gaaaaaaacg agtgtgtacg ttggggggttt agagagccgg1020 gtcttgaaat acacagccca ga atatggag cttcagaaca aagtacagct tctggaggaa1080 cagaatttgt cccttctaga tcaactgagg aaactccagg ccatggtgat tgagatatca1140 <210> 221 <211> 380 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 221<223> Description of artificial sequence: Synthetic polypeptide <400> 221

Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe LeuMet Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu

5 10 155 10 15

Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg 20 25 30Leu Glu Glu Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg 20 25 30

Ala Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp TrpAla Pro Leu Asp Trp Ala Leu Pro Leu Ser Glu Val Pro Ser Asp Trp

- 335 046157- 335 046157

40 4540 45

GluGlu

Asn 65Asn 65

TyrTyr

CysCys

AlaAla

LeuLeu

Lys 145Lys 145

LysLys

AsnAsn

CysCys

HisHis

Gly 225Gly 225

HisHis

SerSer

LysLys

Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser 50 55 60Val Asp Asp Leu Leu Cys Ser Leu Leu Ser Pro Pro Ala Ser 50 55 60

Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His 70 75Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His 70 75

Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu 85 90 95Ser Leu Pro Arg Glu Thr Val Ser Met Asp Leu Glu Ser Glu 85 90 95

Arg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu GluArg Lys Glu Gly Thr Gln Met Thr Pro Gln His Met Glu Glu

100 105 110100 105 110

Glu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu LysGlu Gln Glu Ile Ala Arg Leu Val Leu Thr Asp Glu Glu Lys

115 120 125115 120 125

Leu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro LeuLeu Glu Lys Glu Gly Leu Ile Leu Pro Glu Thr Leu Pro Leu

130 135 140130 135 140

Thr Glu Glu Gln Ile Leu Lys Arg Val Arg Leu Glu Pro GlyThr Glu Glu Gln Ile Leu Lys Arg Val Arg Leu Glu Pro Gly

150 155150 155

Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg SerPro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser

165 170 175165 170 175

Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro TyrLeu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr

180 185 190180 185 190

Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu HisPro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His

195 200 205195 200 205

Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro GluGln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu

210 215 220210 215 220

Lys Ser Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln ArgLys Ser Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg

230 235230 235

Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys SerThr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser

245 250 255245 250 255

Gln Ser Gly Asn Leu Thr Glu His Gln Arg Thr His Thr GlyGln Ser Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly

260 265 270260 265 270

Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr SerPro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser

275 280 285275 280 285

LeuLeu

Thr 80Thr 80

SerSer

LeuLeu

SerSer

ThrThr

Glu 160Glu 160

AspAsp

LysLys

ThrThr

CysCys

Thr 240Thr 240

PhePhe

GluGlu

GlyGly

- 336 046157- 336 046157

His Leu Val Arg His Gln Arg ThrHis Leu Val Arg His Gln Arg Thr

290 295290 295

His Thr Gly Glu Lys Pro Tyr LysHis Thr Gly Glu Lys Pro Tyr Lys

300300

Cys Pro Glu Cys Gly Lys Ser PheCys Pro Glu Cys Gly Lys Ser Phe

305 310305 310

Ser Gln Asn Ser Thr Leu Thr GluSer Gln Asn Ser Thr Leu Thr Glu

315 320315 320

His Gln Arg Thr His Thr Gly LysHis Gln Arg Thr His Thr Gly Lys

325325

Lys Thr Ser Val Tyr Val Gly GlyLys Thr Ser Val Tyr Val Gly Gly

330 335330 335

Leu Glu Ser Arg Val Leu Lys TyrLeu Glu Ser Arg Val Leu Lys Tyr

340340

Thr Ala Gln Asn Met Glu Leu GlnThr Ala Gln Asn Met Glu Leu Gln

345 350345 350

Asn Lys Val Gln Leu Leu Glu GluAsn Lys Val Gln Leu Leu Glu Glu

355 360355 360

Gln Asn Leu Ser Leu Leu Asp GlnGln Asn Leu Ser Leu Leu Asp Gln

365365

Leu Arg Lys Leu Gln Ala Met ValLeu Arg Lys Leu Gln Ala Met Val

370 375370 375

Ile Glu Ile SerIle Glu Ile Ser

380 <210> 222 <211> 1140 <212> ДНК <213> Искусственная последовательность <220>380 <210> 222 <211> 1140 <212> DNA <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид<223> Description of artificial sequence: Synthetic polynucleotide

<400> 222 atggagctgg <400> 222 atggagctgg aattggatgc aattggatgc tggtgaccaa tggtgaccaa gacctgctgg gacctgctgg ccttcctgct ccttcctgct agaggaaagt aggaaagt 60 60 ggagatttgg ggagattgg ggacggcacc ggacggcacc cgatgaggcc cgatgaggcc gtgagggccc gtgagggccc cactggactg cactggactg ggcgctgccg ggcgctgccg 120 120 ctttctgagg ctttctgagg tgccgagcga tgccgagcga ctgggaagta ctgggaagta gatgatttgc gatgatttgc tgtgctccct tgtgctccct gctgagtccc gctgagtccc 180 180 ccagcgtcgt ccagcgtcgt tgaacattct tgaacattct cagctcctcc cagctcctcc aacccctgcc aacccctgcc ttgtccacca ttgtccacca tgaccacacc tgaccacacc 240 240 tactccctcc tactccctcc cacgggaaac cacgggaaac tgtctctatg tgtctctatg gatctagaga gatctagaga gtgagagctg gtgagagctg tagaaaagag tagaaaagag 300 300 gggacccaga gggacccaga tgactccaca tgactccaca gcatatggag gcatatggag gagctggcag gagctggcag agcaggagat agcaggagat tgctaggcta tgctaggcta 360 360 gtactgacag gtactgacag atgaggagaa atgaggagaa gagtctattg gagtctattg gagaaggagg gagaaggagg ggcttattct ggcttattct gcctgagaca gcctgagaca 420 420 cttcctctca cttcctctca ctaagacaga ctaagacaga ggaacaaatt ggaacaaatt ctgaaacgtg ctgaaacgtg tgcggcgccc tgcggcgccc ttacgcttgc ttacgcttgc 480 480 ccagtggagt ccagtggagt cctgtgatcg cctgtgatcg ccgcttctcc ccgcttctcc cgcagcgaca cgcagcgaca acctggtgag acctggtgag acacatccgc acacatccgc 540 540 atccacacag atccacacag gccagaagcc gccagaagcc cttccagtgc cttccagtgc cgcatctgca cgcatctgca tgagaaactt tgagaaactt cagccgagag cagccgagag 600 600 gataacttgc gataacttgc acactcacat acactcacat ccgcacccac ccgcaccac acaggcgaaa acaggcgaaa agcccttcgc agcccttcgc ctgcgacatc ctgcgacatc 660 660 tgtggaagaa tgtggaagaa agtttgcccg agtttgcccg gagcgatgaa gagcgatgaa cttgtccgac cttgtccgac ataccaagat ataccaagat ccacttgcgg ccacttgcgg 720 720 cagaaggacc cagaaggacc gcccttacgc gcccttacgc ttgcccagtg ttgcccagtg gagtcctgtg gagtcctgtg atcgccgctt atcgccgctt ctcccaatca ctcccaatca 780 780 gggaatctga gggaatctga ctgagcacat ctgagcacat ccgcatccac ccgcatccac acaggccaga acaggccaga agcccttcca agcccttcca gtgccgcatc gtgccgcatc 840 840 tgcatgagaa tgcatgagaa acttcagcac acttcagcac aagtggacat aagtggacat ctggtacgcc ctggtacgcc acatccgcac acatccgcac ccacacaggc ccacacaggc 900 900

- 337 046157 gaaaagccct gaacatacca gtcttgaaat cagaatttgt tcgcctgcga agatccactt acacagccca cccttctaga catctgtgga gcggcagaag gaatatggag tcaactgagg agaaagtttg gacgtgtacg cttcagaaca aaactccagg cccagaatag ttgggggttt aagtacagct ccatggtgat taccctgacc agagagccgg tctggaggaa tgagatctca- 337 046157 gaaaagccct gaacatacca gtcttgaaat cagaatttgt tcgcctgcga agatccactt acacagccca cccttctaga catctgtgga gcggcagaag gaatatggag tcaactgagg agaaagtttg gacgtgtacg cttcagaaca aaactccagg cccagaatag ttggggggt tt aagtacagct ccatggtgat taccctgacc agagagccgg tctggaggaa tgagatctca

960960

10201020

10801080

1140 <210> 223 <211> 380 <212> Белок <213> Искусственная последовательность <220>1140 <210> 223 <211> 380 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности: Синтетический полипептид <400> 223<223> Description of artificial sequence: Synthetic polypeptide <400> 223

Met Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe LeuMet Glu Leu Glu Leu Asp Ala Gly Asp Gln Asp Leu Leu Ala Phe Leu

5 10 155 10 15

Leu Glu GluLeu Glu Glu

Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg 20 25 30Ser Gly Asp Leu Gly Thr Ala Pro Asp Glu Ala Val Arg 20 25 30

Ala Pro Leu Asp Trp Ala Leu Pro LeuAla Pro Leu Asp Trp Ala Leu Pro Leu

4040

Ser Glu Val Pro Ser Asp Trp 45Ser Glu Val Pro Ser Asp Trp 45

Glu Val Asp Asp Leu Leu CysGlu Val Asp Asp Leu Leu Cys

5555

Ser Leu Leu Ser Pro Pro Ala Ser LeuSer Leu Leu Ser Pro Pro Ala Ser Leu

Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr 65 70 75 80Asn Ile Leu Ser Ser Ser Asn Pro Cys Leu Val His His Asp His Thr 65 70 75 80

Tyr SerTyr Ser

Leu ProLeu Pro

Cys ArgCysArg

Lys GluLys Glu

100100

Ala GluAla Glu

Gln Glu 115Gln Glu 115

Leu LeuLeu Leu

130130

Glu LysGlu Lys

Lys Thr 145Lys Thr 145

Glu GluGlu Glu

Pro ValPro Val

Glu SerGlu Ser

Arg Glu 85Arg Glu 85

Gly ThrGly Thr

Ile AlaIle Ala

Glu GlyGlu Gly

Gln IleGln Ile

150150

Cys Asp 165Cys Asp 165

Thr ValThr Val

Ser MetSerMet

Asp LeuAsp Leu

Glu SerGlu Ser

Gln MetGln Met

Thr Pro 105Thr Pro 105

Gln HisGln His

Met GluMet Glu

110110

Arg LeuArg Leu

120120

Val LeuVal Leu

Thr AspThr Asp

Glu Glu 125Glu Glu 125

Leu Ile 135Leu Ile 135

Leu ProLeu Pro

Glu ThrGlu Thr

140140

Leu ProLeu Pro

Leu LysLeu Lys

Arg ValArg Val

Arg Arg 155Arg Arg 155

Pro TyrPro Tyr

Arg ArgArg Arg

Phe SerPhe Ser

170170

Arg SerArg Ser

Asp AsnAsp Asn

Glu Ser 95Glu Ser 95

Glu LeuGlu Leu

Lys SerLys Ser

Leu ThrLeu Thr

Ala Cys 160Ala Cys 160

Leu Val 175Leu Val 175

- 338 046157- 338 046157

Arg His Ile Arg Ile His Thr Gly Gln Lys Pro PheArg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe

180 185180 185

Gln Cys Arg IleGln Cys Arg Ile

190190

Cys Met Arg Asn Phe Ser Arg Glu Asp Asn Leu HisCys Met Arg Asn Phe Ser Arg Glu Asp Asn Leu His

195 200195 200

Thr His Ile Arg 205Thr His Ile Arg 205

Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp IleThr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile

210 215 220210 215 220

Cys Gly Arg LysCys Gly Arg Lys

Phe Ala Arg Ser Asp Glu Leu Val Arg His 225 230Phe Ala Arg Ser Asp Glu Leu Val Arg His 225 230

Thr Lys 235Thr Lys 235

Ile His Leu ArgIle His Leu Arg

240240

Gln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu SerGln Lys Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser

245 250245 250

Cys Asp Arg ArgCys Asp Arg Arg

255255

Phe Ser Gln Ser Gly Asn Leu Thr Glu His Ile ArgPhe Ser Gln Ser Gly Asn Leu Thr Glu His Ile Arg

260 265260 265

Ile His Thr Gly 270Ile His Thr Gly 270

Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg AsnGln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn

275 280275 280

Phe Ser Thr Ser 285Phe Ser Thr Ser 285

Gly His Leu Val Arg His Ile Arg Thr His Thr GlyGly His Leu Val Arg His Ile Arg Thr His Thr Gly

290 295 300290 295 300

Glu Lys Pro PheGlu Lys Pro Phe

Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln AsnAla Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Asn

305 310 315305 310 315

Ser Thr Leu ThrSer Thr Leu Thr

320320

Glu His Thr Lys Ile His Leu Arg Gln Lys Asp ValGlu His Thr Lys Ile His Leu Arg Gln Lys Asp Val

325 330325 330

Tyr Val Gly GlyTyr Val Gly Gly

335335

Leu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln AsnLeu Glu Ser Arg Val Leu Lys Tyr Thr Ala Gln Asn

340 345340 345

Met Glu Leu GlnMet Glu Leu Gln

350350

Asn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu SerAsn Lys Val Gln Leu Leu Glu Glu Gln Asn Leu Ser

355 360355 360

Leu Leu Asp Gln 365Leu Leu Asp Gln 365

Leu Arg Lys Leu Gln Ala Met Val Ile Glu Ile SerLeu Arg Lys Leu Gln Ala Met Val Ile Glu Ile Ser

370 375 380 <210> 224 <211> 155 <212> Белок <213> Искусственная последовательность <220>370 375 380 <210> 224 <211> 155 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 224<223> Description of the artificial sequence polypeptide <400> 224

СинтетическийSynthetic

- 339 046157- 339 046157

Met Glu 1Met Glu 1

Leu GluLeu Glu

Leu Asp 5Leu Asp 5

Ala GlyAla Gly

Asp GlnAsp Gln

Asp LeuAsp Leu

Leu Ala Phe LeuLeu Ala Phe Leu

Leu GluLeu Glu

Glu SerGlu Ser

Gly AspGly Asp

Leu GlyLeu Gly

Thr Ala 25Thr Ala 25

Pro AspPro Asp

Glu Ala Val Arg 30Glu Ala Val Arg 30

Ala ProAla Pro

Leu Asp 35Leu Asp 35

Trp AlaTrp Ala

Leu ProLeu Pro

Leu SerLeu Ser

Glu ValGlu Val

Pro Ser Asp Trp 45Pro Ser Asp Trp 45

Glu ValGlu Val

Asp AspAsp Asp

Leu LeuLeu Leu

Cys Ser 55Cys Ser 55

Leu LeuLeu Leu

Ser ProSer Pro

Pro Ala Ser LeuPro Ala Ser Leu

Asn Ile 65Asn Ile 65

Leu SerLeu Ser

Ser SerSer Ser

Asn ProAsn Pro

Cys LeuCys Leu

Val His 75Val His 75

His Asp His ThrHis Asp His Thr

Tyr SerTyr Ser

Leu ProLeu Pro

Arg Glu 85Arg Glu 85

Thr ValThr Val

Ser MetSerMet

Asp LeuAsp Leu

Glu Ser Glu SerGlu Ser Glu Ser

Cys ArgCysArg

Lys GluLys Glu

100100

Gly ThrGly Thr

Gln MetGln Met

Thr Pro 105Thr Pro 105

Gln HisGln His

Met Glu Glu LeuMet Glu Glu Leu

110110

Ala GluAla Glu

Gln Glu 115Gln Glu 115

Ile AlaIle Ala

Arg LeuArg Leu

120120

Val LeuVal Leu

Thr AspThr Asp

Glu Glu Lys Ser 125Glu Glu Lys Ser 125

Leu LeuLeu Leu

130130

Glu LysGlu Lys

Glu GlyGlu Gly

Leu Ile 135Leu Ile 135

Leu ProLeu Pro

Glu ThrGlu Thr

140140

Leu Pro Leu ThrLeu Pro Leu Thr

Lys Thr 145Lys Thr 145

Glu GluGlu Glu

Gln IleGln Ile

150150

Leu LysLeu Lys

Arg ValArg Val

Arg 155 <210> 225 <211> 199 <212> Белок <213> Искусственная последовательность <220>Arg 155 <210> 225 <211> 199 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 225<223> Description of the artificial sequence polypeptide <400> 225

СинтетическийSynthetic

Val Tyr Val Gly Gly Leu 1 5Val Tyr Val Gly Gly Leu 1 5

Glu Ser Arg Val Leu Lys 10Glu Ser Arg Val Leu Lys 10

Tyr Thr Ala Gln 15Tyr Thr Ala Gln 15

Asn Met Glu Leu Gln AsnAsn Met Glu Leu Gln Asn

Lys Val Gln Leu Leu Glu 25Lys Val Gln Leu Leu Glu 25

Glu Gln Asn LeuGlu Gln Asn Leu

Ser Leu Leu Asp Gln Leu 35Ser Leu Leu Asp Gln Leu 35

Arg Lys Leu Gln Ala Met 40Arg Lys Leu Gln Ala Met 40

Val Ile Glu Ile 45Val Ile Glu Ile 45

Ser Asn Lys Thr Ser SerSer Asn Lys Thr Ser Ser

Ser Ser Thr Cys Ile LeuSer Ser Thr Cys Ile Leu

Val Leu Leu ValVal Leu Leu Val

- 340 046157- 340 046157

55 6055 60

Ser Phe 65Ser Phe 65

Gly SerGly Ser

Leu ProLeu Pro

Glu ValGlu Val

Cys LeuCys Leu

Leu ProLeu Pro

Ser GluSer Glu

100100

Pro Lys 115Pro Lys 115

Leu LeuLeu Leu

Val ProVal Pro

Ala MetAla Met

Ala Glu 85Ala Glu 85

Asp ProAsp Pro

Asp SerAsp Ser

His GlyHis Gly

Val LeuVal Leu

Tyr GlnTyr Gln

Leu Glu 105Leu Glu 105

Thr HisThr His

120120

Gln TrpGln Trp

Val LeuVal Leu

130130

Gln AlaGln Ala

Pro GlyPro Gly

Asn Thr 135Asn Thr 135

Ser CysSer Cys

Gln Ala 145Gln Ala 145

Pro SerPro Ser

Ala GluAla Glu

150150

Pro ProPro Pro

Leu GluLeu Glu

Phe SerPhe Ser

Glu ProGlu Pro

Leu Cys 165Leu Cys 165

Arg GlyArg Gly

Pro IlePro Ile

170170

Leu ThrLeu Thr

Arg LysArg Lys

180180

Gly GlyGly Gly

Trp LeuTrp Leu

Pro Thr 185Pro Thr 185

Tyr Ser 75Tyr Ser 75

Ser ArgSer Arg

Leu ProLeu Pro

Leu AspLeu Asp

Leu LeuLeu Leu

140140

Trp Pro 155Trp Pro 155

Leu ProLeu Pro

Gly SerGly Ser

Ser Asp Thr Arg 80Ser Asp Thr Arg 80

Gln Leu Arg Ala 95Gln Leu Arg Ala 95

Ala Leu Gln SerAla Leu Gln Ser

110110

Gly Ser Asp Cys 125Gly Ser Asp Cys 125

His Tyr Met ProHis Tyr Met Pro

Phe Pro Asp LeuPhe Pro Asp Leu

160160

Leu Gln Ala AsnLeu Gln Ala Asn

175175

Pro Ser Val IlePro Ser Val Ile

190190

Leu GlnLeu Gln

Asp Arg 195Asp Arg 195

Tyr SerTyr Ser

Gly <210> 226 <211> 49 <212> Белок <213> Искусственная последовательность <220>Gly <210> 226 <211> 49 <212> Protein <213> Artificial sequence <220>

<223> Описание искусственной последовательности полипептид <400> 226<223> Description of the artificial sequence polypeptide <400> 226

СинтетическийSynthetic

Val Tyr Val Gly Gly Leu 1 5Val Tyr Val Gly Gly Leu 1 5

Asn Met Glu Leu Gln AsnAsn Met Glu Leu Gln Asn

Ser Leu Leu Asp Gln Leu 35Ser Leu Leu Asp Gln Leu 35

Glu Ser Arg Val Leu Lys 10Glu Ser Arg Val Leu Lys 10

Lys Val Gln Leu Leu Glu 25Lys Val Gln Leu Leu Glu 25

Arg Lys Leu Gln Ala Met 40Arg Lys Leu Gln Ala Met 40

Tyr Thr Ala Gln 15Tyr Thr Ala Gln 15

Glu Gln Asn LeuGlu Gln Asn Leu

Val Ile Glu Ile 45Val Ile Glu Ile 45

SerSer

Claims (24)

1. Полинуклеотид, содержащий последовательность нуклеиновой кислоты, кодирующую не встречающийся в природе фактор транскрипции, причем не встречающийся в природе фактор транскрипции содержит аминокислотную последовательность, имеющую по меньшей мере 97% идентичность последовательности SEQ ID NO: 127.1. A polynucleotide comprising a nucleic acid sequence encoding a non-naturally occurring transcription factor, wherein the non-naturally occurring transcription factor comprises an amino acid sequence having at least 97% identity to the sequence of SEQ ID NO: 127. 2. Полинуклеотид по п.1, в котором не встречающийся в природе фактор транскрипции содержит аминокислотную последовательность SEQ ID NO: 127.2. The polynucleotide according to claim 1, wherein the non-naturally occurring transcription factor contains the amino acid sequence of SEQ ID NO: 127. 3. Полинуклеотид по п.1 или 2, где полинуклеотид дополнительно содержит регуляторный элемент, который управляет экспрессией фактора транскрипции на более высоком уровне в парвальбумин (PV)содержащих нейронах, чем в других типах клеток, и где регуляторный элемент содержит SEQ ID NO: 1, 2, 3 или 4.3. The polynucleotide of claim 1 or 2, wherein the polynucleotide further comprises a regulatory element that controls expression of the transcription factor at a higher level in parvalbumin (PV)-containing neurons than in other cell types, and wherein the regulatory element comprises SEQ ID NO: 1 , 2, 3 or 4. 4. Полинуклеотид по п.3, в котором регуляторный элемент содержит SEQ ID NO: 2.4. The polynucleotide according to claim 3, wherein the regulatory element contains SEQ ID NO: 2. 5. Полинуклеотид по любому из пп.1-4, дополнительно содержащий микроРНК связывающий сайт.5. Polynucleotide according to any one of claims 1-4, additionally containing a microRNA binding site. 6. Полинуклеотид по п.5, в котором микроРНК связывающий сайт содержит SEQ ID NO: 9, 11 или 13.6. The polynucleotide according to claim 5, in which the microRNA binding site contains SEQ ID NO: 9, 11 or 13. 7. Полинуклеотид по п.5, в котором микроРНК связывающий сайт содержит SEQ ID NO: 7, 14 или 15.7. The polynucleotide according to claim 5, wherein the microRNA binding site contains SEQ ID NO: 7, 14 or 15. 8. Полинуклеотид по п.5, где полинуклеотид содержит последовательность нуклеиновой кислоты, характеризующуюся идентичностью, составляющей по меньшей мере 95% по отношению к SEQ ID NO: 71.8. The polynucleotide of claim 5, wherein the polynucleotide comprises a nucleic acid sequence having at least 95% identity to SEQ ID NO: 71. 9. Полинуклеотид по п.5, где полинуклеотид содержит SEQ ID NO: 71.9. The polynucleotide according to claim 5, where the polynucleotide contains SEQ ID NO: 71. 10. Полинуклеотид по любому из пп.1-9, где не встречающийся в природе фактор транскрипции увеличивает экспрессию гена SCNIA в клетке.10. The polynucleotide according to any one of claims 1 to 9, wherein the non-naturally occurring transcription factor increases expression of the SCNIA gene in the cell. 11. Экспрессионный вектор, содержащий полинуклеотид по любому из пп.1-10.11. An expression vector containing a polynucleotide according to any one of claims 1 to 10. 12. Экспрессионный вектор по п.11, где экспрессионный вектор представляет собой вирусный вектор.12. The expression vector of claim 11, wherein the expression vector is a viral vector. 13. Экспрессионный вектор по п.11, где вирусный вектор представляет собой аденоассоциированный вирусный (AAV) вектор.13. The expression vector of claim 11, wherein the viral vector is an adeno-associated virus (AAV) vector. 14. Экспрессионный вектор по п.13, где AAV вектор имеет серотип AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, rh10, AAV птиц, AAV крупного рогатого скота, AAV собак, AAV лошадей, AAV приматов, AAV не приматов, AAV овец, scAAV, scAAV1, scAAV2, scAAV5, scAAV8 или scAAV9, или их гибриды.14. The expression vector according to claim 13, where the AAV vector has a serotype of AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, rh10, avian AAV, cattle AAV, canine AAV , equine AAV, primate AAV, non-primate AAV, ovine AAV, scAAV, scAAV1, scAAV2, scAAV5, scAAV8 or scAAV9, or hybrids thereof. 15. Экспрессионный вектор по п.14, где полинуклеотид дополнительно содержит последовательность 5' AAV инвертированного концевого повтора (ITR) и последовательность 3' AAV ITR.15. The expression vector of claim 14, wherein the polynucleotide further comprises a 5' AAV inverted terminal repeat (ITR) sequence and a 3' AAV ITR sequence. 16. Экспрессионный вектор по п.15, где каждая из последовательностей 5' AAV ITR и 3' AAV ITR независимо представляет собой AAV1, AAV2, AAV5, AAV8 или AAV9.16. The expression vector of claim 15, wherein each of the 5' AAV ITR and 3' AAV ITR sequences is independently AAV1, AAV2, AAV5, AAV8 or AAV9. 17. Фармацевтическая композиция, содержащая полинуклеотид по любому из пп.1-10 или экспрессионный вектор по любому из пп.11-16.17. A pharmaceutical composition containing a polynucleotide according to any of claims 1-10 or an expression vector according to any of claims 11-16. 18. Клетка, содержащая полинуклеотид по любому из пп.1-10 или экспресионный вектор по любому из пп.11-16.18. A cell containing a polynucleotide according to any of claims 1-10 or an expression vector according to any of claims 11-16. 19. Применение полинуклеотида по любому из пп.1-10 в производстве лекарственного средства для лечения эпилепсии у нуждающегося в этом субъекта.19. Use of a polynucleotide according to any one of claims 1 to 10 in the manufacture of a medicament for the treatment of epilepsy in a subject in need thereof. 20. Применение полинуклеотида по любому из пп.1-10 в производстве лекарственного средства для лечения синдрома Драве у нуждающегося в этом субъекта.20. Use of a polynucleotide according to any one of claims 1 to 10 in the manufacture of a medicament for the treatment of Dravet syndrome in a subject in need thereof. 21. Применение полинуклеотида по любому из пп.1-10 в производстве лекарственного средства для снижения частоты или продолжительности припадков.21. Use of a polynucleotide according to any one of claims 1 to 10 in the production of a medicinal product for reducing the frequency or duration of seizures. 22. Применение экспрессионного вектора по любому из пп.11-16 в производстве лекарственного средства для лечения эпилепсии у нуждающегося в этом субъекта.22. Use of the expression vector according to any one of claims 11 to 16 in the production of a medicament for the treatment of epilepsy in a subject in need thereof. 23. Применение экспрессионного вектора по любому из пп.11-16 в производстве лекарственного средства для лечения синдрома Драве у нуждающегося в этом субъекта.23. Use of the expression vector according to any one of claims 11 to 16 in the production of a medicament for the treatment of Dravet syndrome in a subject in need thereof. 24. Применение экспрессионного вектора по любому из пп.11-16 в производстве лекарственного средства для снижения частоты или продолжительности припадков.24. Use of the expression vector according to any one of claims 11 to 16 in the production of a medicinal product for reducing the frequency or duration of seizures.
EA202193162 2019-05-29 2020-05-29 COMPOSITIONS AND METHODS FOR SELECTIVE REGULATION OF GENE EXPRESSION EA046157B1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US62/854,238 2019-05-29
US62/857,727 2019-06-05
US63/008,569 2020-04-10

Publications (1)

Publication Number Publication Date
EA046157B1 true EA046157B1 (en) 2024-02-12

Family

ID=

Similar Documents

Publication Publication Date Title
AU2020282352B2 (en) Compositions and methods for selective gene regulation
AU2018375192B2 (en) Engineered DNA binding proteins
KR102604159B1 (en) Tissue-selective transgene expression
US20230365963A1 (en) Methods for treating neurological disease
JP2022522196A (en) Compositions and Methods for Treating Laminopathy
CN112639108A (en) Method of treating non-syndromic sensorineural hearing loss
EA046157B1 (en) COMPOSITIONS AND METHODS FOR SELECTIVE REGULATION OF GENE EXPRESSION
TW202545971A (en) Capsid polypeptides and methods of use thereof